Europäisches Datenportal

Open-Data-Strategien oft nicht abgestimmt

| Autor: Manfred Klein

(Bild: duncanandison – Fotolia.com)

Das Open-Data-Portal der EU hat die ersten Bewährungsproben erfolgreich hinter sich gebracht. Die Kernkomponenten des Portals wurden in Deutschland bei Fraunhofer Fokus entwickelt. Wie geht es nun weiter? eGovernment Computing hat sich erkundigt.

Wir haben dazu mit Dr. Matthias Flügge, Leiter Digital Public Services, Fraunhofer Institut für Offene Kommunikationssysteme (Fokus) gesprochen.

Vor kurzem ist das „Europäische Datenportal“ online gegangen. An wen richtet sich das Angebot, und welche Daten stellt es bereit?

Flügge: Das Europäische Datenportal ist der zentrale Einstiegspunkt für die Suche nach Daten des öffentlichen Sektors in der EU. Dabei handelt es sich überwiegend um offene Daten, die in maschinenlesbarer Form und unter freien Lizenzen bereitgestellt werden. Perspektivisch sollen auf dem Europäischen Datenportal nicht nur Offene Daten der EU 28, sondern von bis zu 39 Ländern verzeichnet werden, also auch von Ländern des Europäischen Wirtschaftsraums und von Beitrittskandidaten.

Die Zielgruppe ist breit: Von interessierten Bürgern über Datenjournalisten bis hin zu Software-Entwicklern, die neue Apps mit den offenen Daten realisieren möchten. Das Portal selber beherbergt ausschließlich Metadaten – es ist ein Katalog, mit dem sich offene Daten europaweit nach einheitlichen Kriterien finden lassen. Die Daten selber liegen dann in der Regel beim Datenbereitsteller. Aktuell sind mehr als eine Viertelmillion Datensätze auf dem Portal verzeichnet. Dabei sind noch längst nicht alle Quellen „angezapft“.

Reichen nicht die vorhandenen nationalen Datenportale?

Flügge: Im rein nationalen Kontext sicherlich. Das Vorhaben ist jedoch ein Baustein der EU-Initiative für den sogenannten „digital single market“, mit dem 28 nationale Märkte mittels digitaler Technologien zu einem einzigen Markt zusammengeführt werden sollen.

Ein Beispiel: Wenn Sie offene Umweltdaten verschiedener EU-Länder vergleichen wollen, dann möchten Sie nicht 28 verschiedene Datenportale abklappern, sondern die Infos möglichst an einer Stelle erhalten.

Lässt sich das politische und wirtschaftliche Potenzial eines solchen Projekts irgendwie bemessen?

Flügge: Schwierig. Nach einer Schätzung der EU können die Mitgliedsstaaten mit öffentlichen ­Daten jährlich positive Effekte in Höhe von 40 Milliarden Euro realisieren, sei es durch neue Geschäftsfelder, die dank mehr Informationen erschlossen werden, durch bessere Bildungsangebote oder einer schlankeren Verwaltung. Im Rahmen des Gesamtprojekts, das von Cap Gemini Consulting in den Niederlanden geleitet wird, wurde jüngst eine Studie veröffentlicht, die für Europa das Marktvolumen für Open Data bis 2020 auf 300 Milliarden Euro schätzt. McKinsey spricht von einem Potenzial von weltweit drei Billionen US-Dollar jährlicher Wertschöpfung.

Ich bin kein Freund solch großer Hausnummern. Dadurch werden Erwartungen geweckt, die eventuell nicht erfüllt werden können. Aktuell ist die wirtschaftliche Nutzung offener Daten tatsächlich weit hinter den ersten euphorischen Prognosen zurück. Das liegt aber auch daran, dass öffentliche Stellen noch sehr zurückhaltend sind mit der Datenveröffentlichung.

Man kann nicht erwarten, dass Unmengen von Anwendungsentwicklern aus der vergleichsweise kleinen Menge offener Daten, die ihnen derzeit vorgesetzt werden, grandiose Geschäftsmodelle zaubern. Es muss doch eher andersherum laufen: Zu neuen innovativen Ideen müssen schnell die passenden Daten gefunden werden.

Wie weit sind die EU-Mitgliedsstaaten bei der Open Data Umsetzung? Und welche Rolle spielt Deutschland hier?

Flügge: Hier hat sich in den letzten Jahren viel getan. Die meisten EU-Länder haben heute nicht nur ein nationales Open-Data-Portal, sondern auch einen gesetzlichen Rahmen für die Bereitstellung von offenen Daten. Zu den Vorreitern gehören etwa Spanien und England. In kleineren Ländern, wie Malta und Luxemburg, gibt es bislang noch kein nationales Portal.

Dort, wo ein gesetzlicher Rahmen zur Veröffentlichung offener Verwaltungsdaten vorliegt, findet man noch zu viele „Soll“-Regelungen. Ebenso sieht es mit der Förderung weitergehender Open-Data-Initiativen und -Organisationen aus. Das ist eher noch dünn. Leuchttürme, wie das „Open Data Institute“ in England stehen recht einsam da. Deutschland befindet sich in Sachen Open Data im oberen Mittelfeld. Beim Bund ist das Thema personell dünn besetzt, und einzelne Ressorts fahren ihre eigenen, nicht immer abgestimmten, Open-Data-Strategien.

Positiv zu erwähnen ist sicherlich der nationale Aktionsplan Open Data. Dieser beinhaltet konkrete Maßnahmen zur Förderung von Open Data, auch wenn diese bisher nicht ambitioniert genug sind. Auch die föderalen Strukturen machen die Umsetzung nicht gerade leichter. Viele Bundesländer haben ein Open-Data-Portal und zum Teil auch eine Open-Data-Strategie. Auf kommunaler Ebene wird es dann – bis auf wenige Ausnahmen – aber schon recht dünn, was die Bereitstellung offener Daten anbelangt.

Die aktuelle Version des Europäischen Datenportals ist eine Beta-Version. Was waren die größten Herausforderungen bei der Realisierung?

Flügge: Die größte Herausforderung bei der Umsetzung war die Vielzahl an heterogenen Quellen in den europäischen Ländern, die angezapft werden mussten. Diese Datenquellen haben teilweise sehr unterschiedliche Datenmodelle, die wir intern auf ein einheitliches Modell abbilden. Eine weitere Herausforderung ist die Mehrsprachigkeit der Metadaten. Eine manuelle Übersetzung ist bei einer derart hohen Zahl an Datensätzen nicht möglich.

Wir nutzen daher den „Machine Translation Service“ der EU-Kommission für eine automatisierte Übersetzung der Metadaten in Deutsch, Englisch und Französisch. Sowohl die Geschwindigkeit als auch die Qualität der Ergebnisse sind aber noch – sagen wir mal – verbesserungswürdig. Insbesondere, da es Ziel ist, in weiteren Versionen des Portals in alle 24 offiziellen EU-Sprachen zu übersetzen.

Bietet das Portal technologische Innovationen gegenüber bereits etablierten Portalen oder handelt es sich letzt- endlich um „Yet-another“- Open-Data-Portal?

Flügge: Vom grundsätzlichen Aufbau orientiert sich das Portal an bereits erprobten Portalen. Wir haben aber eine ganze Reihe von innovativen Features entwickelt: Für das „Harvesting“, also das „Ernten“ von Metadaten aus anderen nationalen Portalen und Datentöpfen, haben wir eine komfortable Lösung entwickelt, die sich ohne große Programmierkenntnisse erweitern und an neue Datenquellen anpassen lässt.

Dann haben wir einen „Lizenz-Assistenten“ entwickelt, der sowohl Datennutzer als auch Datenbereitsteller bei der Interpretation und Auswahl geeigneter Datenlizenzen unterstützt. Ziel ist es, diesen Assistenten mit mehr „Intelligenz“ auszustatten, damit prinzipiell beliebige Lizenzen und deren Kombinierbarkeit automatisiert analysiert werden können.

Eine weitere nützliche Funktion: Die Metadaten des Portals werden als Linked Data bereitgestellt und sind damit gut auswertbar und integrierbar. Das ist zugegebenermaßen eher etwas für Profis – aber auch hier haben wir Assistenz-Funktionen entwickelt. Ebenfalls interessant: Die Qualität der Metadaten auf dem Portal wird kontinuierlich überprüft, und die öffentlichen Stellen in den europäischen Ländern erhalten regelmäßig automatisiert visuelle Feedback-Reports.

Als Problem bei Open Data wird häufig die mangelnde Qualität der Daten genannt. Wie wichtig ist dieser Punkt, und welche Daten wären eigentlich besonders spannend?

Flügge: Als Nutzer wünscht man sich natürlich eine hohe Datenqualität, das heißt, möglichst vollständige und aktuelle Daten in einer hohen Granularität mit wenigen Fehlern und umfangreichen Metadaten. Besser ist es allerdings, wenn auch Daten veröffentlicht werden, die in puncto Datenqualität nicht den höchsten Ansprüchen genügen, als dass diese wegen vermeintlicher Qualitätsmängel zurückgehalten werden. Zudem kann die Community von Datennutzern durchaus auch bei der Aufwertung, Korrektur, Strukturierung und Annotation von Daten behilflich sein.

Welche Daten besonders spannend sind, das hängt natürlich stark von der Nutzersicht ab. Man kann aber sagen, dass grundsätzlich georeferenzierte Daten besonders schnell in innovative Anwendungen aufgenommen werden. Außerdem gibt es noch vergleichsweise wenige Echtzeitdaten.

Die digitale Vernetzung schreitet rasch voran, und das Internet der Dinge wächst rasant. Mit Echtzeitdaten – zum Beispiel von Infrastruktur-Sensoren in Straßen, Parkplätze, Luftmessstationen, Energienetzen – lassen sich ex­trem spannende Anwendungen realisieren. Bei Fokus entwickeln wir gerade Erweiterungen für die bessere Einbindung und Nutzung von Echtzeitdaten in unsere Open-Data-Plattform.

Das Vorhaben läuft bis Anfang 2018. Was ist da noch geplant? Und was kommt eigentlich nach dem Europäischen Datenportal? Das weltweite Open-Data-Portal?

Flügge: Das Gesamtprojekt zum Europäischen Datenportal hat sowohl technische als auch organisatorische Aktivitätsstränge. 2016 und 2017 sollen jeweils im Frühjahr die Version 1.0 beziehungsweise 2.0 des Portals fertiggestellt sein. Technisch wird es vor allem um die bessere Vernetzung von Daten, also um den Ausbau der Linked-Data-Mechanismen gehen. Damit die Datenqualität langfristig steigen kann, werden wir das Datenmonitoring um weitere Funktionen zur Qualitätsanalyse erweitern. Parallel dazu laufen weitere Aktivitäten – sogenannte Services – sowohl für die Unterstützung von Datenbereitstellern und Datennutzern.

Das reicht von der Erstellung von Trainingsunterlagen und der Durchführung von Workshops bis hin zu High-Level-Veranstaltungen bei denen fortgeschrittene EU-Länder die „Anfänger“ in Sachen Open Data an Ihren Erfahrungen und Erfolgsrezepte teilhaben lassen. Hier bringt auch das Open Data Institute als Partner des Gesamtkonsortiums seinen Erfahrungsschatz ein.

Ein weltweites Open-Data-Portal? Ich frage mich, wer sich dafür verantwortlich zeigen könnte beziehungsweise das Vorhaben in die Hand nehmen würde. Wir unterstützen jedenfalls gerne!

Kommentar zu diesem Artikel abgeben
Dass die Open Data Strategien nicht abgestimmt sind, ist leider Realität. Aber nicht nur im...  lesen
posted am 16.01.2016 um 07:52 von Unregistriert

Das Europäische Datenportal sieht sich als Aggregator von Metadaten der öffentlichen Hand im...  lesen
posted am 15.01.2016 um 20:58 von Unregistriert

The version 1.0 of the portal will be released as Open Source  lesen
posted am 15.01.2016 um 11:13 von Unregistriert

In der Gruppe Open Data in Facebook wurde Unmut geäußert, dass die abgelegten Daten nur schwierig...  lesen
posted am 14.01.2016 um 13:38 von woksoll

Open data, so why havent you released the code as open source?  lesen
posted am 12.01.2016 um 18:52 von Unregistriert


Mitdiskutieren

 

Copyright © 2017 - Vogel Business Media