Pentaho ist Grundlage der Polizeilichen Eingangsstatistik Die Datenwaschmaschine der Bundespolizei
„Bis dahin hatten wir ein Tool für Business Intelligence (BI)“, sagt Michael Becker, Erster Polizeihauptkommissar der Bundespolizei, „und das hieß Excel“. Der Aufwand, die 70 verschiedenen Tabellen mit zig diversen Blättern zu füllen und auszuwerten war dementsprechend hoch, „wahnsinnig hoch“ für alle Beamte, die damit zu tun hatten. Und die Datenqualität? Miserabel, im Vergleich zu jetzt.
Anbieter zum Thema

Seit zwei Jahren nun setzt die Bundespolizei eine „Datenwaschmaschine“ ein; so nennt Becker und sein Kollege, Polizeihauptmeister Henry Liebrenz, die Anwendung zum Extrahieren, Transformieren und Laden von Daten, die sie erstellt haben. Das ETL-Tool basiert wie auch ihre neue „Business-Intelligence-Maschine“ auf der Open-Source-Software „Pentaho“.
Gab es solche Anwendungen nicht als Standardapplikationen zum Kauf? „Nein“, lautet die klare Antwort der beiden Polizeibeamten. Und als Erklärung schieben sie mit Schalk hinterher: „Wir beiden werden quasi in der Schmuddelecke unserer IT aktiv, dort wo es keine großen Lösungen gibt und die Anschaffung nicht wirklich etwas kosten darf.“
Tatsächlich laufen Data Warehouse und Waschmaschine in der Community-Version von Pentaho, wenngleich sich das jetzt ändert: „Wir haben die notwendigen Lizenzen nun von der IT-Novum GmbH gekauft.“
Und warum programmieren und konfigurieren Polizisten anstelle von IT-Experten? „Weil wir das können“, lautet die selbstbewusste Antwort. „Wir sind zwar noch auf der Piste, aber erstellen bereits seit mehr als 20 Jahren auch Anwendungen.“ Becker fügt hinzu: „Ich persönlich misstraue gar den Fähigkeiten der so genannten IT-Fachleute, beziehungsweise Informatikern ein Stück weit. Mit denen lässt sich sehr gut und akademisch über aktuelle IT-Trends diskutieren, doch von den Basics hätten sie oftmals keine Ahnung.“
Skepsis gegenüber fachfremden IT-Spezialisten
Auch das Urteil über ´regalfertige`BI- und ETL-Systeme und deren Anbieter, fällt nicht schmeichelhaft aus. Es habe gar einen gegeben, der behauptet habe, eine externe Qualitätssicherung der Daten sei hinfällig. Denn die Bereinigung übernehme das Datenbank-Management-System. Doch eine Entscheidung, was den Tatsachen entspräche, könne letztlich nur ein Mensch vornehmen, so Becker: „Nur ein Mensch kann entscheiden: Ja, so war es.“
Um zu verstehen, worüber der Polizeihauptkommissar hier spricht, ist es notwendig tiefer in die Anwendung einzusteigen. Das Data Warehouse und die Datenanalysen werden für die Polizeiliche Eingangsstatistik und Einsatzplanung der Bundespolizei benötigt. Mit Pentaho erstellt die Bundespolizei somit Auswertungen im Rahmen ihrer Meldepflichten unter anderem gegenüber dem Bundesministerium des Inneren. „Wir bekommen pro Tag drei bis vier parlamentarische Anfragen herein“, berichtet Becker.
Die Daten entstammen hauptsächlich aus dem Vorgangsbearbeitungssystem der Bundespolizei. Diese ist gegenwärtig in rund 160 Revieren, 80 Inspektionen, 10 Direktionen und einem Präsidium eingeteilt(siehe: Bundespolizei-Organigramm). Auf jeder Ebene werden Daten erfasst und bereinigt.
Die Vorgangsbearbeitung
Zum Beispiel nehmen Wachtmeister Straftaten auf. Oftmals werden dabei nur die Grunddaten gerichtsverwertbar erfasst – Örtlichkeiten, Art des Einsatzes, Zeit und Personen - und eine Vorgangsnummer vergeben. Denn anderes als an den meisten Arbeitsplätzen, müssen die Beamten sofort zum nächsten Einsatz und oftmals vergehen Tage, bis der Vorgang um weitere Angaben ergänzt werden kann.
Personalmangel beschleunigt die Komplettierung nicht unbedingt. Darüber hinaus gibt es Daten, die vorgangsunabhängig sind, etwa das Verkehrsaufkommen an den Schengen-Grenzen. Oder eine Leitstelle legt einen Vorgang an und die Beamten wissen noch gar nicht, was sie am Einsatzort erwartet.
Beim Durchlaufen der Polizeihierarchiestufen wurden immer wieder Interpretationsspielräume sichtbar, erläutert Becker. Denn jeder, der die Excel-Tabellen bearbeiten musste, wollte das Beste. Doch letztlich seien die Eintragungen „verschlimmbessert“ worden.
Das Identifizieren von Handlungsfeldern
Als das Problem angegangen wurde, ging der Einführung der Datenwaschmaschine und des Data Warehouse zunächst eine Konsolidierung der Tabellen von 70 auf 40 voraus. Daraus sind letztlich 20 „Handlungsfelder“ geworden, die sich in der Polizeilichen Eingangsstatistik wiederfinden, zum Beispiel Einreisezahlen an den Grenzen, Asylfälle, Luftsicherheitskontrollen, Straftaten und Fahndungstreffer.
„Als wir die Schnittstellen für die Datenintegration schließlich gebaut hatten, erinnert sich Becker, waren die meisten Felder der SQL-Datenbank leer.“ Das lag zum einen an der Art Vorgänge anzulegen und zu bearbeiten, zum anderen an der fehlenden Standardisierung.
Heute steht den Beamten für die Kurzerfassung und Bewertungen ein Textfeld, sowie einige Pflichtfelder zur Verfügung. Die fehlenden Attribute, die notwendig sind, um einen Vorgang zu komplettieren, etwa die Reisetätigkeit eines Asylbewerbers, lassen sich nachträglich und zwar katalogbasiert füllen. „Die Datenqualität hat sich dramatisch verbessert“, bestätigen Becker und Liebrenz unisono und immer wieder. „Sie sind einheitlich und belastbar.“
Die Datenqualität legt drastisch zu
Doch das ist bei weitem nicht der einzige Vorteil der Anwendung. Rund 600 Beamte arbeiten direkt damit; in jeder Dienststelle gibt es einen Hauptverantwortlichen. Die Bedienbarkeit und auch die Aktualität der Daten stoßen auf große Gegenliebe – bei den Systembenutzern aber auch bei der Kundschaft. „Wir können jetzt jederzeit Anfragen von Parlamentariern beantworten“, klingt bei Becker der Stolz durch.
Mit Requests wie „Wie viele Menschen welcher Nationalität haben in den Kalenderwochen 32 und 33 die deutsch-österreichische Grenze überquert? oder „Welche Altersklasse und welches Geschlecht hatten die Migranten, die im Zeitraum xy Asyl beantragt haben? oder „Wo wurden die meisten unregistrierten Flüchtlinge aufgegriffen?“ wären vor der Einführung der Pentaho-Anwendungen vier bis fünf Beamte beschäftigt gewesen, unter Umständen über viele Tage.
Heute sind die Zahlen aktuell. Das hilft. Die Behörde kann dadurch schneller ihren Berichtspflichten gegenüber nationalen und europäischen Institutionen wie Frontex nachkommen.
Historische Daten für aktuelle Pläne
Zum Beispiel berechnet die Bundespolizei anhand der Eingangsstatistik, die übrigens nur anonymisierte Daten enthält, den Bedarf an Einsatzkräften im Bereich großer Flughäfen sowie deren Dienstpläne. Dafür lädt die Behörde zum Beispiel täglich die bundesweit gültigen Flugpläne vom Flughafenkoordinator des Bundes in das System. Angereichert mit weiteren Informationen stellt das die Grundlage für die Berechnung des Einsatzkräftebedarfs am jeweiligen Flughafen dar.
So fließen auch die Buchungsdaten aller Zeiterfassungsterminals der Behörde in das System, wo sie aufbereitet und anschließend an die interne Dienstplanungssoftware übergeben werden. Die Bundespolizei kann dadurch flexibler selbst auf akuten Handlungsbedarf reagieren, wie im vergangenen Jahr bei der personellen Verstärkung bestimmter Grenzübergänge im Zusammenhang mit den Flüchtlingsströmen.
Da ist es für die Datenintegration hilfreich, dass Pentaho quelloffen ist, über offene Schnittstellen verfügt und die gefragten ETL-Funktionen im Data Warehouse aufweist. Mittlerweile haben wir, erläutert Polizeihauptmeister Liebrenz, nahezu alle Schnittstellen realisiert.
So ist auch ein Datenaustausch mit anderen Behörden oder Ländern möglich. Über die Schnittstellen können wir anderen Institutionen oder Ländern im Rahmen der gesetzlichen Grundlagen etwa Informationen über Einreisezahlen an den Grenzen zur Verfügung stellen.
Ein wertvoller Kessel
Der Austausch von Informationen zwischen Behörden scheitert meistens an technischen Hürden, da Datenformate oder Schnittstellen nicht miteinander kompatibel sind. „Das Tool Pentaho Data Integration (PDI), auch genannt Kettle (zu deutsch Kessel), ist wie ein Schweizer Taschenmesser“, erläutert Becker. „Man kann fast alles damit machen.“ Zudem sei die Einarbeitung vergleichsweise einfach: „Ein paar Grundkenntnisse hat man sofort“, sagt der Hauptkommissar, der wie Kollege Liebrenz „in Open Source zuhause“ ist.
Allerdings hatten zumindest die beiden Starthilfe; denn Projektpartner ist das IT-Beratungsunternehmen IT-Novum, von dem die Bundespolizei jetzt Beratungs-, Implementierungs- und Support-Leistungen sowie die Pentaho-Lizenzen bezieht. „Wir hatten Schulungen vorab“, sagt Becker.
Basierend auf dem integrierten Datenbestand kann die Behörde nicht nur ein Großlagebild anhand von Reports erstellen, sondern verschiedenen Benutzergruppen auch einen Zugang zu Datenauswertungen über Web-Frontends ermöglichen. Für die Zukunft ist geplant, Analysen auch in Dashboards zu visualisieren.
No reports!
Für die Auswertung stehen den Beamten so genannte „Cubes“ zur Verfügung, mehrere Dimensionen beziehungsweise Sichten auf die Handlungsfelder. „Das Framework haben wir erstellt“, sagt Becker und berichtet, dass die Cubes nicht von vorneherein akzeptiert waren. Vor der Umsetzung seien viele Kollegen der Ansicht gewesen, dass uneingeschränkter Zugriff auf alle Daten der Eingangsstatistik und freies Surfen notwendig seien. Der Grund: Es lasse sich nicht voraussehen und entscheiden, welche Reports in Zukunft eventuell einmal nachgefragt werden könnten.
Becker und Liebrenz hielten und halten das Cubes-Konzept dennoch für flexibel genug, um bislang Unbedachtes, beziehungsweise neue Anforderungen einbringen zu können, und entschieden sich gegen das Konzept mit Berichten. „Doch wissen Sie wie viele Reports heute angefordert werden“, fragt Becker spitzbübisch und liefert auch sofort die Antwort: „Null. “
Artikelfiles und Artikellinks
Link: Website Bundespolizei
(ID:44527593)