Offene Daten

Offene Daten im Kontext: Der Kriminalitätsatlas als Best Practice

Victoria Dykes (@toridykes) | 12/12/2018
Ein Screenshot von dem Kriminalitätsatlas

Der neue Kriminalitätsatlas von der Berliner Polizei

„Wir würden diese Daten gerne veröffentlichen, machen uns aber Sorgen, dass sie für Laien nicht verständlich sind. Was machen wir, wenn Daten falsch interpretiert werden oder Menschen sie nutzen, um uns in ein schlechtes Licht zu rücken?“

Im Rahmen unserer Arbeit bei der Open Data Informationsstelle (ODIS) hören wir solche Bedenken häufig. Viele Verwaltungsangestellte haben Angst, dass mögliche Datennutzer*innen nicht die nötige Expertise haben, um veröffentlichte Daten „korrekt“ zu analysieren. Auch bestehen oft Sorgen, dass Daten in erster Linie benutzt werden, um negative Aspekte hervorzuheben. Aus der Sicht dieser Verwaltungsbeschäftigten, gibt es bei der Veröffentlichung solcher Daten wenig zu gewinnen, aber viel zu verlieren – und deshalb bleiben gerade sensiblere Datenbestände oft unveröffentlicht.

Eine mögliche Lösung für dieses Dilemma liegt darin, zusätzliche Kontextinformationen und Interpretationshilfen bereitzustellen. Wie aber sieht so eine Strategie in der Praxis aus? Der kürzlich veröffentlichte Kriminalitätsatlas der Berliner Polizei zeigt das beispielhaft. Auf einer interaktiven Webseite lässt sich nachvollziehen, wo und wie oft in der Stadt bestimmte Straftaten (Diebstahl, Raub, Wohnraumeinbruch, usw.) passieren. Die Daten können in verschiedenen Visualisierungen (als Karte, Balkendiagramm, Liniendiagramm, usw.) erkundet oder als Excel-Datei heruntergeladen werden (hier kann man die Daten direkt aus dem Berliner Datenportal herunterladen). Das ist das erste Mal, dass diese Daten aus Berlin in einer maschinenlesbaren Form veröffentlicht wurden.

Höchstwahrscheinlich bestanden auch bei der Berliner Polizei im Vorfeld Bedenken – Daten über Straftaten sind sensibel und es besteht ein gewisses Risiko der Fehlinterpretation. Um diesen Sorgen zu begegnen, hat die Berliner Polizei zusätzlich im Bereich „Hinweise/Erläuterungen“ kontextbezogene Informationen veröffentlicht, sodass sich besser nachvollziehen lässt, was die Daten wirklich zeigen – und was nicht. Diese Veröffentlichungspraxis ist vorbildlich und die Polizei gibt damit ein gutes Beispiel, wie sich auch sensiblere oder komplexere Datensätze öffentlich zugänglich machen lassen.

1. Der Atlas erklärt, welche Variablen die Daten beinhalten und wie diese ausgewählt wurden.

Der Kriminalitätsatlas zeigt nur Daten zu einer bestimmten Auswahl an Straftaten, etwa Straßenraub, Fahrraddiebstahl, und Rauschgiftdelikte. Nicht zu finden sind gravierendere Straftaten wie Mord oder Vergewaltigung. Statt es den Nutzer*innen zu überlassen, über Gründe für die Auswahl zu spekulieren, erläutert der Atlas vier explizite Kriterien, anhand derer die Auswahl erfolgt ist: die Möglichkeit für eine exakte Standorterfassung der Straftat, die Verfügbarkeit einer ausreichenden Datenbasis, die öffentliche Wahrnehmbarkeit der Straftat, und die Frage, inwieweit die Straftat vermeidbar gewesen wäre.

Natürlich ließe sich nach wie vor kritisieren, dass nur ein Teil der vorhandenen Daten der Öffentlichkeit zugänglich gemacht wird. Aber immerhin lassen sich die Selektionskriterien für transparent nachvollziehen und es entsteht nicht der Eindruck, die Auswahl sei einfach willkürlich erfolgt.

A screenshot of the data on bike thefts for the Bezirksregion Temeplhofer Vorstadt

Visualisierungen von Fahrraddiebstahl in Bezirksregion Tempelhofer Vorstadt.

2. Der Atlas erklärt statistische Begriffe und wie man sie verstehen sollte.

Der Kriminalitätsatlas verwendet an einigen Stellen statistische Konzepte, die das breite Publikum eventuell nicht kennt. So werden zum Beispiel Straftaten als Anzahl absoluter Fälle sowie als Häufigkeitszahl dargestellt. Die Häufigkeitszahl zeigt, wie die Häufigkeit einer Straftat pro 100,000 Einwohner in einer Region (bei dem Kriminalitätsatlas ist die Region entweder ein Bezirk oder eine Bezirksregion). Weil das nicht selbsterklärend ist, erläutert der Atlas, was der Begriff bedeutet und wie die Zahl errechnet wird.

Weiterhin erklärt der Atlas, welche Faktoren einen Einfluss auf die Höhe der Häufigkeitszahl haben – zum Beispiel haben bei Touristen beliebte Orten (wie die Gebiete in der Stadtmitte) oder Orte, an denen regelmäßig große Veranstaltungen stattfinden (wie die Gebiete um den Tiergarten), oft höhere Häufigkeitszahlen für Kriminalität. Dieser Zusammenhang ist vielleicht nicht für jede*n offensichtlich. Um eine korrekte Interpretation zu ermöglichen, ist es sinnvoll, dass die Berechnungsgrundlage ebenso wie kontextuelle Faktoren explizit erklärt werden.

3. Der Atlas liefert zusätzlichen Kontext für die sechs „stark belasteten“ Bezirksregionen.

Viele Polizeibehörden lehnen die Veröffentlichung von Kriminalitätsdaten ab, weil sie Angst haben, ihre Stadt (oder einzige Stadtteile) könnten in einem schlechten Licht erscheinen. Schließlich könnte man beim Betrachten der Daten den Eindruck bekommen (ob zurecht oder nicht), dass die Zahlen zu hoch seien und die Polizei die Situation folglich nicht unter Kontrolle habe.

Reine Zahlen erzählen aber nicht immer die ganze Geschichte. Wie oben erwähnt, gibt es manchmal Umstände, die Kriminalität in einem bestimmten Gebiet begünstigen können. Das heißt aber nicht unbedingt, dass diese Regionen gefährlicher sind. Hier kann man nochmal an Touristengebiete denken: Touristen sind oft einfache Ziele für Straftäter. Eine höhere Kriminalitätsrate an zentralen Orten mit viel Tourismusverkehr musst aber nicht zwangsläufig heißen, dass es gefährlich ist, sich dort aufzuhalten.

Im Kriminalitätsatlas hat die Polizei kurze Analysen der 6 stark belasteten Bezirksregionen aufbereitet. Durch diese Zusatzinformationen lässt sich besser einordnen, was die Daten wirklich aussagen. Tiergarten Süd ist zum Beispiel einer dieser Orte. Hier muss man bedenken, dass diese Region die Straße des 17. Juni und den Großen Stern umfasst, wo viele Großveranstaltungen (wie die große Sylvesterfeier) stattfinden – dass bei solchen großen Veranstaltung mehr Straftaten passieren, ist keine Überraschung. Auch der viel von Touristen frequentierte Potsdamer Platz ist Teil der Region. Wenn man diese Faktoren berücksichtigt, lässt sich die höhere Kriminalitätsrate leichter nachzuvollziehen und man versteht, dass die Zahlen nicht unbedingt zeigen, dass das Gebiet übermäßig gefährlich ist. Ähnliches gilt für die Bezirksregion Moabit-Ost, da der Hauptbahnhof in dieser Region verortet ist. Der Kriminalitätsatlas erläutert, dass Moabit-Ost ohne die im Hauptbahnhof registrierten Straftaten lediglich auf Platz 35 (statt auf Platz 6) der Häufigkeitszahlen stehen würde.

Damit soll natürlich nicht bestritten werden, dass Kriminalität in Berlin (wie in nahezu jeder Großstadt) ein Problem ist. Ein Problem, dass sich auch nicht einfach durch ein bisschen Kontext wegerklären lässt. Eben deshalb ist es wichtig, dass neben aufbereiteten Berichten oder Visualisierungen auch die zugrundeliegenden Rohdaten transparent zur Verfügung gestellt werden. Die Interpretation solcher Daten aber wird durch zusätzliche Erklärungen deutlich erleichtert. Der Kriminalitätsatlas zeigt, dass ein solches Vorgehen sowohl für die Öffentlichkeit als auch für die veröffentlichenden Behörden gewinnbringend ist.

Hier geht es weiter zum Kriminalitätsatlas.

Victoria Dykes

Über den Autor

Victoria Dykes

Victoria Dykes ist wissenschaftliche Mitarbeiterin im Bereich Open Data bei der Technologiestiftung Berlin. Sie studierte Public Policy an der Hertie School of Governance in Berlin. Der Fokus ihrer Arbeit liegt auf der Frage, wie Open Data Städte verändern kann und wie auch Verwaltungen Technologie und Daten nutzen können, um Prozesse und Services zu verbessern.