- Name
- Irene Gerau
- Job-Titel
- Mail an Irene Gerau
Datenqualität transparent gemacht
Als eines der ersten Open-Data-Portale weist GovData nun die Datenqualität der dort bereitgestellten Metadaten nach europäischem Standard tagesaktuell für Datenbereitsteller aus. Die Qualität der Daten ist entscheidend für den Wert der Informationen, die daraus gewonnen werden.
Das von SEITENBAU entwickelte Open-Data-Portal für Deutschland GovData stellt eine Vielzahl an Verwaltungsdaten offen und transparent für jedermann zur Verfügung. Nun können Datenbereitsteller auch die Qualität ihrer bereitgestellten Metadaten anhand festgelegter Parameter aktuell einsehen. Dafür nutzt GovData den Interoperability Test Bed Validator der Europäischen Kommission entsprechend dem Metadatenmodell DCAT-AP.de. Dies ist eine standardkonforme deutsche Ableitung von DCAT-AP, dem Standard für den Datenaustausch auf europäischer Ebene.
Die Anbindung der Validierung erfolgte nach dem MVP Ansatz zunächst für ein paar wenige Kriterien, die künftig kontinuierlich erweitert werden können. Die Qualitätskontrolle läuft automatisiert nach jedem Import neuer Metadaten (Harvesting) ab. Die Ergebnisse werden in übersichtlichen Grafiken als Online-Report dargestellt – praktisch live und in Farbe.
Kurz und bündig:
- Wir konnten für GovData als eines der ersten Open-Data-Portale die Anbindung an den Interoperability Test Bed Validator der Europäischen Kommission realisieren.
- Mit der grafisch ansprechenden Darstellung der Reports und Kennzahlen haben wir die Transparenz der Datenqualität erhöht.
- Die Bedeutung von GovData als Quelle für qualitativ hochwertige Information konnte auf diese Weise gesteigert werden.
Hintergrund:
GovData, das Datenportal für Deutschland, bietet Open-Data für eGovernment Daten.
Eine Vielzahl an Behörden und Institutionen stellen auf GovData regelmäßig Verwaltungsdaten als angereicherte Metadaten in unterschiedlichen Formaten bereit. Die Metadaten ermöglichen es, die Daten zu katalogisieren und durchsuchbar auf govdata.de anzubieten.
Als „Open Data“ werden Daten bezeichnet, die von jedermann zu jedem Zweck genutzt, weiterverbreitet und weiterverwendet werden dürfen.
Für alle, die gerne tiefer in die Technik der Validierung von RDF-Daten mittels SHACL-Shapes abtauchen wollen, empfehlen wir diesen Blog-Beitrag des Interoperability Test Bed‘s: