Visualize The Right Thing

Indexes

Das Open Data Barometer (ODB) und das Global Open Data Index (GODI) sind Indexe, die anhand von einigen Kriterien die Leistung eines Landes im Umgang mit Open Government Data bewerten. Beide Indexe unterscheiden sich anhand ihrer Methodik und ihrem Kernziel der Auswertung, aber gleichen sich bei den Kategorien, die sie bewerten.

In den unteren Tabellen "Index Definition" und " High Value Daten Schweiz"sind die Kategorien der G8 Open Data Charter, der OGD und der GODI verglichen worden. Sie beschreiben, welche Anforderungen die Datensätze erfüllen müssen, um in einer der definierten Bereiche kategorisiert werden zu können. Die "High Value Daten Schweiz"-Tabelle zeigt, wo die Datensätze/-sammlungen zu finden sind, sei es auf opendata.swiss, im Dateninventar oder auch auf der Webseite der jeweiligen Datenproduzenten/-verantortlichen.

Das ODB orientier sich sehr stark am G8 Open Data Charter. Was man hierbei berücksichtigen muss ist, dass hier ein Bottom-Up-Prinzip herrscht. Die Datensätze, welche nach GODI definiert sind, erfüllen die Ansprüche der Definition der jeweiligen G8 und ODB Kategorien. Umgekehrt ist es aber möglicherweise nicht der Fall. Zum Beispiel wäre es möglich, dass ein Datensatz die Ansprüche der G8 Kategorie "Geospital" erfüllt, aber sich in den GODI-Kategorien nicht wiederfindet. Das GODI ist präziser bezüglich Erfüllung der jeweiligen Datenkategorie. Die «Ansprüche» sind höher und es wird exakt erklärt, was verlangt wird.

Weitere Definitionen und Requirements sind in der Methodik der jeweiligen Indexe auffindbar:

Tabellen über die OGD Schweiz. Die Tabellen erheben keinen Anspruch auf Vollständigkeit. Mithilfe des Dateninventars und opendata.swiss wurden die Datenätze der Schweiz den jeweiligen Kategorien zugeordnet. Stand 10.2.2020.

Dateninventar und opendata.swiss

Obwohl GODI und das ODB bereits die Schweiz «bewertet» haben (leider ist der aktuellste Stand von 2016 bei beiden Indexen, somit nicht mehr aktuell) bietet der Bericht «Dateninventarisierung Bund», welcher auf egovernment.ch zu finden ist, eine Einordnung der Daten im Dateninventar auf die jeweiligen Kategorien an.

Der Bundesrat will mit seiner Open-Government-Data-Strategie Schweiz 2014–2018 den Zugang zu Behördendaten erleichtern. Eine der Massnahmen aus der Strategie ist die Inventarisierung der Datenbestände des Bundes. Das Ziel dieser Inventarisierung ist es, eine möglichst umfassende Übersicht über jene Datensammlungen zu erhalten, die in der Verwaltung bereits vorhanden sind. Nur ein Teil der Datensätze im Inventar sind bereits auf opendata.swiss publiziert. (siehe Dateninventar Bund auf opendata.swiss)

Die untere Bar-Chart-Visualisierung zeigt auf, wieviel Datensätze bereits offen auf opendata.swiss zu finden sind. Dadurch, dass das Dateninventar von 2017 ist und dementsprechend auch «veraltet», zeigt es dennoch auf ob die relevanten inventarisierten Datensammlungen bereits auf opendata.swiss vorhanden sind oder nicht. Nicht alle Datensätze/-sammlungen erfüllen die "high value" Kriterien der Indexe, aber da es sich um Daten vom Bund handelt, sind diese dennoch für die Schweiz relevant.

Schwierig wird es Daten zu visualisieren, wenn die Daten schwer auffindbar sind oder im schlimmsten Fall nicht öffentlich zur Verfügung stehen. Die Bar-Chart-Visualisierung zeigt auf welche Departemente wieviel Datensätze/-sammlungen zum Inventar beigetragen haben und welche davon bereits auf opendata.swiss offen zur Verfügung stehen.

Bar-Chart-Visualisierung des Dateninventars Bund. Beschreibt welches Bundesamt wieviele Datensätze inventarisiert hat und wieviele davon auf opendata.swiss vorhanden sind. Die Visualisierung erheben keinen Anspruch auf Vollständigkeit. Stand 10.2.2020.

Open "high value" Dateninventar

Die untere Tabelle zeigt das gesamte Inventar, das auch hier auf opendata.swiss aufzufinden ist (Dateninventar Bund). Das Dateninventar soll eine Übersicht über sämtliche Datenbestände des Bundes ermöglichen und anschliessend der Identifizierung besonders relevanter und möglichst rasch zu publizierender Daten dienen (Bericht "Dateninventarisierung Bund", 2017). Im Bericht wurden die Datensammlungen/-sätze grob in den G8 und GODI Kategorien eingeteilt, aber es fehlte eine klare Einteilung, welche der Daten auf opendata.swiss verfügbar sind. Hier kommt die untere Tabelle ins Spiel. Alle Daten aus dem Dateninventar Bund (Stand 2017) wurden dank Python und Excel mit allen verfügbaren Daten auf opendata.swiss anhand dem Attribut "Titel (DE)" verglichen. Somit konnte identifiziert werden, welche Daten bereits auf opendata.swiss vorhanden sind.

Der Filter "linked to opendata.swiss" zeigt auf ob die Daten auf opendata.swiss auffindbar sind und im welchem Themenbereich sie zugeordnet wurden. Wenn das Feld leer ist, dann ist es nicht auf opendata.swiss auffindbar. Falls doch, dann ist es mit der jeweiligen Kategorie gelabelt. Ebenfalls zeigen die Filter "G8", "Barometer" und "GODI" in welcher Kategorien der Indexe die Datensätze einzuordnen sind.

Dateninventar Bund - Tabelle. Die Tabelle erheben keinen Anspruch auf Vollständigkeit. Stand 10.2.2020.

Conclusion

Die Tabellen "Index Definition" und "High Value Daten Schweiz" zeigen, dass verschiedene Indexe die gleichen/ähnlichen Datenkategorien verlangen. Selbstverständlich unterscheiden sie sich in der Methodik und in der Bewertung, aber im Kern sind es die selben Daten, die analysiert werden.

e ganze Gesellschaft generiert wird.

Nur anhand von einfachen Visualisierungen ist ein Monitoring von Behörden/Departementen möglich um weitere Analysen durchführen zu können und zu hinterfragen, weshalb einige Datensätze publiziert worden sind und andere wiederum nicht. Auch ermöglichen einfache Visualisierungen das Tracken von «high value» Data. Der Fokus sollte darauf gelegt werden, dass wichtige, komplexe Datensätze visualisiert werden, damit sie auch der «einfache» Bürger versteht und sich über bestimmte Themen informieren kann und dass durch die Visualisierung von «high value» Data ein Mehrwert für di

Data Sources

Unten verlinkt sind die Source Codes aufzufinden, die ich für diese Projekt verwendet habe. Ebenfalls ist alles auf GitHub aufzufinden, sogar die Excel-Dateien mit den Rohdaten.

Visualisierungen und Daten
Bar Chart	Link
Open "high value" Dateninventar	Link
sämtlicher Source Code sowie Analysen (Excel, Python, JavaScript, HTMl) auf GitHub	Link

Boris Djakovic

M.Sc. Business Administration University Bern

M.Sc. Minor Sports Science University Bern

Explore Swiss "high value" OGD