OPAL: Portal zur Nutzung offener Daten (Open Data Portal Germany)

Project Period: 2017-07-01 – 2020-12-31
Externally Funded
Principal Investigator
Adrian Wilke
Member
Melissa Das, Caglar Demir, Axel-Cyrille Ngonga Ngomo, Svetlana Pestryakova, Afshin Amini, Arwa Bannoura, Abdelmoneim Amer Desouki, Zafar Syed, Matthias Wauer, Geraldo de Souza
Department(s)
Data Science
Description

Mit mCLOUD stellt das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) auf einer zentralen Plattform offene Daten aus seinem Geschäftsbereich zur Verfügung. Von dem damit verfolgten Open-Data-Ansatz hat bereits eine Vielfalt neuer innovativer Projekte und Unternehmen profitiert. Dieser Ausprägung des Open Data Ansatzes hat jedoch Schwächen. Dazu zählt, dass Datensätze oft als monolithisch sowie voneinander unabhängig bereitgestellt und betrachtet werden. Dies erschwert nicht nur die Suche nach Datensätzen sondern auch die Nutzung der Datensätze in innovativen, datengetriebenen Anwendungen. Das möchte OPAL ändern.


Vorhaben OPAL


Ziele des Projekts Open Data Portal Germany (OPAL) sind die Konzeption und Entwicklung eines ganzheitlichen Portals für offene Daten. Hierbei werden insbesondere offene Daten aus mCLOUD und MDM integriert. Anders als die Mehrzahl der existierenden Open-Data-Portale wird OPAL Metadaten veredeln und in 5-Star Linked Open Data transformieren. Damit wird das Portal das einfache Auffinden von Datensätzen und den einfachen Zugriff auf diese Datensätze sowohl für Menschen als auch für Software-Agenten (z.B. andere Datenportale, datengetriebene Anwendungen, etc.) sicherstellen. Zusätzlich wird OPAL die Suche auch über inhaltliche (anstatt nur Metadaten-) Facetten (wie z.B. automatisch generierte Themen, Ortsangaben und zeitliche Einschränkungen) ermöglichen.


Alleinstellungsmerkmale von OPAL sind die 1) technische Basis in Form von Linked-Open-Data-Technologien, die es ermöglicht, einzelne derzeit unabhängige Datensätze miteinander in Verbindung zu bringen. 2) Die dafür erforderliche automatische Extraktion von Metadaten mittels maschinellem Lernen und fokussiertes Crawling ermöglichen eine umfangreichere Suche auf Inhalten und Metadaten. 3) Dies stellt auch eine Grundlage für innovative Suchfunktionalität wie z.B. Question Answering (das Beantworten natürlichsprachlicher Anfragen) dar.


Suche und weitere Anwendungsfälle


Beispielsweise lässt sich damit ermitteln, welche Datensätze Informationen zu Pollenbelastung oder Funknetzabdeckung an einem bestimmten Ort bereithalten. Diese Informationen liegen derzeit nur implizit in den Datensätzen vor. Für den Anwendungsfall der Suche nach z.B. “Leipzig” bzw. “Welche Pollenart fliegt derzeit in Leipzig” liefert mCLOUD daher noch keine Ergebnisse. Neben der im Portal integrierten Suchfunktion sollen als weitere Anwendungsfälle eine mobile App und ein Social Bot, die auf geeignete Datensätze hinweisen, umgesetzt werden. Eine enge Zusammenarbeit mit dem LIMBO-Projekt ist vorgesehen, um weitere Metadaten zu Inhalten der Datensätze, z.B. Themen und Schema-Eigenschaften, zu ermitteln.

Grant Number
Funding Organisation
Bundesministerium für Digitales und Verkehr (BMDV)