Smarte Daten im Knowledge Graph, die Grundlage einer zukunftssicheren Bereitstellung offener Daten

FOSSGIS-Konferenz 2019

Offene Daten sind einer der wichtigsten Rohstoffe der digitalen Welt, mit wachsender wirtschaftlicher und gesellschaftlicher Bedeutung. Trotz zahlreicher Bemühungen konnten prognostizierte Mehrwerte noch nicht erreicht werden, was unter anderem auf eine unvollständige Vernetzung der Daten zurückzuführen ist. In diesem Vortrag werden Technologien und Prozesse vorgestellt, um Daten zu einem öffentlichen verfügbaren Knowledge Graph hinzuzufügen und dort mit Daten anderer Quellen zu verknüpfen.

Offene Daten sind einer der wichtigsten Rohstoffe der digitalen Welt, mit wachsender wirtschaftlicher und gesellschaftlicher Bedeutung. So wurde der direkte und indirekte Mehrwert offener Daten bereits 2014 von McKinsey auf 900 Milliarden Euro pro Jahr geschätzt – und das alleine in Europa. In der Folge führten eine Reihe von Open Data Initiativen dazu, dass neue Datenquellen erschlossen wurden und bis heute durch Open Data Portale bereitgestellt werden. Dennoch wird das Potential offener Daten noch immer nicht erreicht, wofür unter anderem 3 Gründe anzuführen sind: 1.) bereitgestellte Daten werden häufig nicht durch Suchmaschinen indiziert, was auf fehlende oder unvollständige Metainformationen zurückzuführen ist, 2.) die Verarbeitung einzelner Datensätze erfordert ein gutes Domänenwissen, sowie die Nutzung von Expertensystemen – dies gilt insbesondere für Geodaten, die so Anwendern anderer Domänen häufig verschlossen bleiben, sowie 3.) die Kombination heterogener Datensätze von unterschiedlichen Datenquellen ist nur durch aufwändige Anpassung möglich, um Inkonsistenzen und unterschiedliche Ausprägungen auszugleichen. Semantische Technologien bieten die Möglichkeit einer einfachen Verknüpfung verteilter heterogener Datensätze innerhalb eines Knowledge Graphs, ein zukunftsweisendes Konzept, das im World Wide Web Consortium (W3C) standardisiert wurde und den aktuellen Stand der Technik widerspiegelt. Dies ermöglicht eine nachhaltige Wertsteigerung und Auffindbarkeit der Datensätze und eine Vernetzung von Daten beliebiger Herkunft und Fachgebiete. In diesem Vortrag werden aktuelle Open Source Werkzeuge und Prozesse vorgestellt, um eine Bereitstellung und Verknüpfung von Daten unterschiedlicher Quellen zu gewährleisten und um diese frei im Knowledge Graph zur Verfügung zu stellen. Zudem werden in dem Vortrag neue Ontologien vorgestellt, die im Rahmen des mFUND-geförderten Projektes LIMBO definiert wurden und der Open Source Gemeinschaft zur freien Verwendung zur Verfügung gestellt wurden. Hierunter fallen insbesondere Klimadaten des Deutschen Wetterdienstes, welche – nicht zuletzt aufgrund des Klimawandels – von allgemeinem Interesse sind und sich auf diese Weise in vielfältigen Anwendungsszenarien nutzen lassen.

Speakers: Dr. Richard Figura Dr. Alexander Willner Michael Martin