Skip to main content

Studienprotokoll
Predictive Policing als Instrument zur Prävention von Wohnungseinbruchdiebstahl. Evaluationsergebnisse zum Baden-Württembergischen Pilotprojekt P4.

Titel der Studie:

Predictive Policing als Instrument zur Prävention von Wohnungseinbruchdiebstahl. Evaluationsergebnisse zum Baden-Württembergischen Pilotprojekt P4.

Autor oder Herausgeber:

Gerstner, D.

Erscheinungsjahr:

2017

Sprache:

Deutsch

Publikationsart:

Report/Bericht

Vor dem Hintergrund eines deutlichen Anstiegs der Wohnungseinbrüche wurde von der Polizei Baden-Württemberg unter Leitung des Stuttgarter Landeskriminalamts das Pilotprojekt Predictive Policing P4 durchgeführt. Dabei kam die Computersoftware PRECOBS des Instituts für musterbasierte Prognosetechnik aus Oberhausen zum Einsatz, die nach einem alarmauslösenden Einbruch für bestimmte Gebiete erhöhte Wahrscheinlichkeiten von zukünftigen Einbrüchen vorhersagt.
Das Projekt beinhaltete eine externe wissenschaftliche Evaluation durch das Freiburger Max-Planck-Institut für ausländisches und internationales Strafrecht. Neben der Analyse prozessgenerierter Daten mit Fokus auf die Wirksamkeit der Prognosesoftware wurden eine Online-Befragung mit ca. 700 Teilnehmern sowie Experteninterviews durchgeführt.
Der vorliegende Bericht bezieht sich auf den Evaluationszeitraum vom 30.10.2015 bis zum 30.04.2016. Inwieweit Predictive Policing zur Verhinderung von Wohnungseinbrüchen und zu einer Trendwende in der Fallentwicklung beitragen kann, ist auch nach der Evaluation trotz einiger positiver Hinweise schwer zu beurteilen. Aus der Vielzahl der Einzelergebnisse in diesem Bericht lassen sich dennoch einige relevante Schlussfolgerungen ziehen.

Name der in der Studie evaluierten Maßnahme(n)

Pre Crime Observation System (PRECOBS)

Name der in der Studie evaluierten Präventionsansätze(n)

Predictive Policing

Träger der Maßnahme

Polizeipräsidien Karlsruhe und Stuttgart unter Leitung einer Projektgruppe des Landeskriminalamts Baden-Württemberg

Durchführende Einrichtung

Max-Planck-Institut für ausländisches und internationales Strafrecht

Auftraggeber der Evaluation

Landeskriminalamt Baden-Württemberg

Untersuchungszeitraum:

von 2015/10 bis 2016/04

Land

Deutschland

Bundesland

Baden-Württemberg

Stadt oder Gemeinde

Stadtkreis Stuttgart und Stadt-/Landkreis Karl

Kurzbeschreibung der Evaluation

Im Zeitraum vom 30.10.2015 bis 30.04.2016 setzte das Landeskriminalamt Baden-Württemberg in den zugehörigen Gebieten der Polizeipräsidien Karlsruhe und Stuttgart die Prognosesoftware PRECOBS (Pre Crime Observation System) ein. Die Software fußt auf dem Ansatz des Predictive Policings, sodass „mit Hilfe von Daten zu vergangenen und gegenwärtigen Ereignissen raumzeitliche Vorhersagen von Straftaten“ (S.2) generiert werden. Dabei ermittelt PRECOBS geographisch eingrenzbare Gebiete (Near Repeat Areas), in denen Folgedelikte (Near Repeats) wahrscheinlich sind. Sobald ein Einbruch in einem solchen Gebiet eintrat, schlug das System Alarm; Einbrüche in angrenzenden Gebieten konnten vom zuständigen Operator (Polizeibeamter, der das System bedient) ebenfalls als Alarm freigeschaltet werden. Um das Areal des Einbruchs herum erfolgten gezielte Polizeimaßnahmen zur Verhinderung weiterer Wohnungseinbrüche in diesem bedrohten Gebiet.

Da die kriminalpräventiven Effekte von PRECOBS nicht allein auf den Einsatz der Software zurückzuführen sind, wird die Wirkung der Maßnahme hauptsächlich anhand des Einflusses von polizeilichen Folgemaßnahmen untersucht. Die daraus resultierende Reduktion von Wohnungseinbruchsdiebstahl ist der zentrale Maßstab für die Wirkung von PRECOBS. Diese Reduktion lässt sich anhand der Anzahl der Folgedelikte bzw. Near Repeats näher veranschaulichen. Ob PRECOBS und die einhergehenden Polizeimaßnahmen zu einer tatsächlichen Erhöhung der Festnahmen von Einbrechern führten, ist nicht Gegenstand der Untersuchung.

Auf Basis prozessproduzierter Daten untersuchte eine Simulation die Legitimation des Near-Repeat-Ansatzes. Darüber hinaus wurde bivariat und regressionsanalytisch überprüft, in welchem Maß bestimmte Rahmenbedingungen Near Repeats begünstigen und wie Polizeimaßnahmen die Anzahl von Folgedelikten senken konnten. Die Experteninterviews mit sechs Operatoren, die PRECOBS bedienten, geben einen Einblick in die Praktikabilität der Prognosesoftware. Schließlich ermöglichte die vom 10.05.2016 bis 05.06.2016 durchgeführte Onlinebefragung (n=730) die Abbildung eines breiten Meinungsbildes vor allem derjenigen Polizeibeamten, deren Arbeit mit Prognosen von PRECOBS im Zusammenhang stand.

Seit dem 01.08.2017 läuft PRECOBS erneut testweise in den Polizeipräsidien Karlsruhe und Stuttgart. Auch diese Phase wird vom MPICC wissenschaftlich begleitet.

Evaluationstyp i
  • Formative oder Prozessevaluation
  • Wirkungsevaluation oder Summative Evaluation
Empirische Methode i
  • Mixed
Was wird gemessen? (Effektmaße) i

Direkte Effektmaße

  • Folgedelikte in räumlich-zeitlicher Nähe zur Ersttat (Near Repeats)
Wie wird gemessen? (Empirische Daten) i

Primär und Sekundärdaten

  • Quantitativ : Online Befragung
  • Experteninterviews
  • Quantitativ: Prozessproduzierte Daten
Wie wird gemessen? (Operationalisierung der Effektmaße) i

Die Zählvariable „Anzahl der Folgedelikte“ erfasste Einbrüche, die nach ausgelösten und akzeptierten Alarmen in einem „operativen Kreis“ um den Ort des Auslösedelikts (Trigger-Delikt) stattfanden. Der Mittelpunkt des Kreises schloss mindestens fünf Haushalte ein; der Radius betrug 500 Meter. Die hier berücksichtigten Alarmphasen dauerten 168 Stunden bzw. sieben Tage an. Für Einbrüche, die in dieser Zeitspanne im operativen Kreis stattfanden, musste sich der Tatzeitraum auf maximal einen Tag eingrenzen lassen. Terminologisch werden diese Folgedelikte als echte Near Repeats aufgefasst.

Alternativ zu den echten Near Repeats wurden Folgedelikte untersucht, die sich in der gleichen Zeitspanne im operativen Kreis und zusätzlich in einer Randzone ereigneten. Diese Randzone deckte denjenigen Bereich ab, der im Abstand von 500 Metern um die Near Repeat Area lag. Mittels dieser „Folgedelikte“ konnte die Tragweite der von den Polizeibeamten durchgeführten Maßnahmen über die Grenzen des operativen Areals hinweg berücksichtigt werden.

Womit wird verglichen? i

Bezugsgröße / Maßstab für den Effekt der Maßnahme

Mit anderen statistischen Werten (bspw. durchschnittliche Rückfallrate).

Erläuterungen

Verglichen wird die Anzahl von Near-Repeats im Pilotphasenzeitraum der Winterkonfiguration von 2015 bis 2016 mit Near-Repeats der Winterkonfigurationszeiträume von 2012 bis 2015, 2012 bis 2013, 2013 bis 2014 und von 2014 bis 2015.

Wie wird die Stichprobe gezogen? i

Nicht repräsentative und qualitative Auswahlverfahren

  • Natürlich vorkommende Gruppe (z.B. Schulklasse; Therapiegruppe)
  • ad hoc Auswahl (Teilnehmer werden gezielt auf Grund einer bestimmten Eigenschaft ausgewählt, z. B. Experten)

Wie groß ist die Stichprobe? i

206

Wie groß ist die Teilnehmerrate oder Rücklaufquote? i

Keine Angabe

Wie groß ist die Abbrecherquote der Teilnehmer? i

Anzahl der Personen:

0

Rate:

0%

Erläuterungen zum Samplingverfahren i

Die Datengrundlage für PRECOBS war die Datenbank des Vorgangsverarbeitungssystems ComVor der Polizei Baden-Württemberg. Die Überführung der Daten aus ComVor nach PRECOBS fand dreimal täglich statt. ComVor enthielt ebenfalls Informationen zu den polizeilichen Maßnahmen, die in ihrer Art und Dauer variierten und mit einem gesonderten Formular erfasst wurden. Dieses wurde von den jeweils im operativen Kreis tätigen Polizeibeamten ausgefüllt.

Die in PRECOBS ermittelten Vorhersagen basierten auf Tathergängen und der Tatbegehungsweise bei Wohnungseinbruchsdelikten: „Dabei werden sogenannte Trigger (Auslöser), die für erwartbare Near Repeats sprechen, sowie Anti-Trigger, die gegen Near Repeats sprechen, identifiziert. Diese sind in Triggerkatalogen in PRECOBS hinterlegt, die die Bereiche Tatörtlichkeit (Haustyp, Lage etc.), Beute und Modus Operandi abdecken. Das Programm gleicht diese im laufenden Betrieb mit den Informationen aus den von der Polizei aktuell erfassten Datensätzen ab. Des Weiteren werden aus Daten der Vergangenheit räumliche Gebiete identifiziert, in denen vermehrt mit Near Repeats zu rechnen ist. Im Vorfeld des Echtzeitbetriebs wird anhand einer retrospektiven Simulation überprüft, inwieweit zutreffende Prognosen möglich sind, und erfolgsversprechende Near Repeat Areas (NR-Areas) freigeschaltet“ (S. 19). Wohnungseinbruchdiebstähle, die in den freigeschalteten NR-Areas stattfanden, lösten Alarmmeldungen aus, die der zuständige Operator von PRECOBS akzeptieren oder ablehnen konnte. Darüber hinaus konnten Operatoren eigene Alarme schalten, wenn ein Auslösedelikt in die Randzone um die NR-Area fiel. Akzeptierte und vom Operator initiierte Alarme leiteten den operativen Kreis ein, in dem die polizeilichen Maßnahmen verstärkt durchgeführt wurden.

Skalenniveau der abhängigen Variable(n) (Effektgröße) i

Metrisch/Intervall-Ratio

Zusammenhangsmaß i

Für ordinal abhängige Variablen

Spearman Rangkorrelation

Verteilung i

negativ binomial

Welche weiteren Einflussfaktoren wurden kontrolliert i
  • Einsatzstunden insgesamt
  • Anzahl der Personenkontrollen
  • Anzahl der Fahrzeugkontrollen
  • Anzahl der Bürger- und Beratungsgespräche
  • Anteil der Fußstreife
  • Anteil Beamte in Zivil
  • Maßnahmenintensität
  • Anzahl der vorangegangenen Delikte
  • Polizeidichte
  • Zeit vom Auslösedelikt bis zur Steuerung
Ergebnis

Der Autor konstatiert, dass „kriminalitätsmindernde Effekte von Predictive Policing im Pilotprojekt P4 wahrscheinlich nur in einem moderaten Bereich liegen und allein durch dieses Instrument die Fallzahlen nicht deutlich reduziert werden können.“ (S. 85)

Eine eindeutige Schlussfolgerung bezüglich der kriminalpräventiven Wirksamkeit der Maßnahme ist somit nicht möglich.

Welche Ergebnisse erzielt die evaluierte Maßnahme oder der Ansatz? i

Monte-Carlo-Simulation :

Im Vergleich zu 999 zufälligen Verteilungen sind die Near-Repeat-Quoten (Odds Ratios) über alle Winterkonfigurationszeiträume hinweg in den Near-Repeat-Gebieten Stuttgarts und des Polizeipräsidiums Karlsruhe generell höher als im Gesamtgebiet. Dieses Ergebnis deutet auf das tatsächlich verstärkte Auftreten von Delikten hin, die innerhalb von 7 Tagen und im Umkreis von 500 Metern von mindestens einem umliegenden Delikt in Near Repeat Areas geschehen sind.

Im Winterzeitraum des Pilotprojekts von 2015 bis 2016 sind die Odds-Ratios der genannten Polizeipräsidien im Vergleich zum vorherigen Winterzeitraum von 2014 bis 15 nicht mehr signifikant: die Chance, dass ein Folgedelikt in einer Near Repeat Area stattfindet, liegt keinem Muster mehr zugrunde. Dies spricht dafür, dass mithilfe von PRECOBS möglicherweise systematische Folgedelikte in Near Repeat Areas unterbunden wurden.

Die gesonderte Betrachtung der Stadtkreise Karlsruhe und Pforzheim zeigt dagegen, dass vor dem Pilotprojekt, also bereits während der Winterkonfiguration 14/15, die vorhergesagten Near-Repeat-Muster in den jeweiligen Prognosegebieten nicht mehr signifikant und somit zufällig sind. Somit haben in diesen Stadtkreisen wahrscheinlich andere Maßnahmen, die vor dem Einsatz von PRECOBS umgesetzt wurden, gewirkt.

 

Die Analysen auf S. 45 ff. legen die Einflüsse von Rahmenbedingungen auf echt Near Repeats und Folgedelikte in den Polizeipräsidien Karlsruhe und Stuttgart dar. Die folgenden Ergebnisse beziehen sich ausschließlich auf das Polizeipräsidium Stuttgart (n = 111), da für das Polizeipräsidium Karlsruhe keine signifikanten Zusammenhänge vorliegen.

 

„Folgedelikte“ (NR-Area + operativer Kreis + Randzone um NR-Area):

Hinsichtlich der polizeilichen Maßnahmen wird deutlich, dass die Anzahl der Personenkontrollen (r = -0.25, p < 0.05), die Anzahl der Fahrzeugkontrollen (r = -0.32, p < 0.001), die Anzahl der Bürger-/Beratungsgespräche (r = -0.16, p < 0.1) und der Anteil der Fußstreifen (r = -0.26, p < 0.01) bivariat (Rangkorrelation Spearman) fortlaufende Delikte in geringer Weise reduzieren. Diese Variablen wurden faktoranalytisch zur Dimension „Maßnahmenintensität“ zusammengefasst (KMO-Wert = 0,64 / Eigenwert = 2,14 / erklärte Varianz = 0,53); die Implementierung dieses Faktors in ein multivariates negativ binomiales Modell zeigt, dass unter Kontrolle der restlichen unabhängigen Variablen die Erhöhung der polizeilichen Maßnahmenintensität um eine Standardabweichung zu einer durchschnittlichen Verringerung der Folgedelikte um 0,33 (Average Marginal Effect (AME), coef. =-0.41, p < 0.05) führt.

 

„Echte“ Near Repeats:

Spearmans Rangkorrelationskoeffizienten signalisieren, dass die insgesamt aufgebrachten Einsatzstunden während der jeweiligen Alarmphase (r = -0.20, p < 0.05) und der Anteil der Fußstreife (r = -0.23, p < 0.05) mit einem Rückgang der Near Repeats assoziiert sind. Auch hier wurden im negativ binomialen Regressionsmodell Faktorwerte, jedoch unter Einschluss der Einsatzstunden, zur Erfassung der Maßnahmenintensität berücksichtigt (KMO-Wert = 0,65 / Eigenwert = 2,40 / erklärte Varianz = 0,51). Mit Erhöhung der Maßnahmenintensität um eine Standardabweichung sinkt die Anzahl der Folgedelikte durchschnittlich um 0,18 Delikte (AME, coef. = -0.46, p < 0.01). Im gleichen Modell wurde gleichzeitig für den Anteil der Beamten in Zivil, die Zeit vom Delikt bis zur Steuerung und für Zahl der vorangegangenen Delikte kontrolliert; nur Letzteres führt mit jedem weiteren Delikt vor dem Alarm zu einer statistisch signifikanten Verringerung von durchschnittlich 0.35 Folgeeinbrüchen (AME, coef. = -0.89, p < 0.1).

Einflussfaktoren und Kontexteffekte? i

In Ballungsräumen ist die Software effektiver, da dort die Fallzahlen der Wohnungseinbruchsdelikte höher waren und für Prognosen somit mehr Informationen zur Verfügung standen.

Auflistung aller relevanten Indikatoren, Faktoren und Zusammenhangsmaße
Wie kann die Maßnahme erfolgreich umgesetzt und implementiert werden? i

Die Maßnahme sollte hauptsächlich in Ballungsgebieten eingesetzt werden, da in ländlichen Regionen Alarme rarer sind und ebendort keine maßgeblichen Erfolge mit PRECOBS erzielt wurden. Hohe Fallzahlen steigern wiederum die Effizienz der Analyse von Wohnungseinbruchsdiebstahl, was mit Zeitersparnissen vonseiten der Polizeibeamten einhergeht. Für zeitnahe Prognosen bietet sich an, Polizeibeamte z.B. mit mobilfunktauglichen Tablets auszurüsten, um einbruchsspezifische Informationen im Vorgangsverarbeitungssystem wie ComVor zügig auf dem neuesten Stand zu halten.
Weiterhin ist es ratsam, eine Einweisung der Operatoren in das Programm zu arrangieren und zu Beginn des Softwareeinsatzes die Beurteilung von Prognosen mit Zweitmeinungen von Operatorkollegen abzugleichen.

Fazit Wirksamkeit

Ansatz/Maßnahme reduziert Kriminalität in ihrem Wirkungsbereich im geringen Umfang [+]

Handlungsempfehlungen

Um die statistische Power der Analysen zu erhöhen, sind mehr Test- und Vergleichsgebiete notwendig.

Sonstige Anmerkungen zu den Ergebnissen der Studie

Es kann zwar von einer positiven Wirkung durch PRECOBS ausgegangen werden; dieses Ergebnis ist aufgrund der methodischen Einschränkungen jedoch mit äußerster Vorsicht zu interpretieren. Denn aufgrund des kurzen Evaluationszeitraums (sechs Monate) und der kleinen Zahl an Pilotgebieten konnte nur eine geringe Fallzahl an Folgedelikten berücksichtigt werden, was eine Reduzierung der statistischen Power und der Robustheit der Analyseergebnisse nach sich zog. Die räumlich-zeitlichen Einschränkungen der Studie machen es schwierig, PRECOBS‘ Effekte klar von anderen Polizeimaßnahmen oder zeitlichen Schwankungen der Fallzahlen zu differenzieren. Zudem sind angesichts des gewählten Forschungsdesigns keine Aussagen über Kausaleffekte möglich.
Hinzu kommt, dass je nachdem wie der gewählte Zeitraum der Alarmphase festgelegt wird - für die Analysen wurden sieben Tage nach dem Trigger-Delikt bestimmt -, sich die Ergebnisse verändern können; längere Zeiträume gehen dagegen mit höheren Messfehlern einher. Letztlich ist anzumerken, dass sich die Datenqualität der Fallerfassung auf Basis der ComVor-Erfassungen über den Zeitverlauf verbessert hat. Dies geht auf das genauere Ausfüllen der Formulare seitens der Polizeibeamten zurück.

Ziele der Studie i

Stufe 2: Die Studie benennt ein klares überprüfbares Untersuchungsziel und beschreibt die Methode.

Eignung des methodischen Zugangs i

Stufe 2: Der methodische Zugang ist geeignet für das Untersuchungsziel der Studie. Es gibt keine (oder kaum) evaluationspraktische Hindernisse bei der Evaluation.

Theoretische Grundlage i

Stufe 2: Die Studie benennt theoretische Annahmen über die Wirkungsweise der Präventionsmaßnahme und stellt einen ausreichenden Bezug zu deren empirischen Überprüfung her.

Interne Validität i
Stufe 1 Ein Erhebungszeitpunkt, mind. eine (nicht äquivalente) Vergleichsgruppe, bei der relevante Einflussfaktoren mit geeigneten multivariaten statistischen Methoden kontrolliert wurden. Z.B. cross-sectional studies mit Auswertung durch multivariate Verfahren (multiple Regressionsmodelle, Mehrebenenanalyse, SEM)
Externe Validität i

Stufe 0: Die Stichprobe ist nicht repräsentativ: Die Ergebnisse sind nur für die Teilnehmer der Studie gültig

Messvalidität (Konstruktvalidität) der Effektgröße (abhängigen Variablen) i

Stufe 3: Augenscheinliche Validität und Reliabilität - Die Studie verwendet augenscheinlich gute Indikatoren zur Messung der Effektgröße und kann deren Reliabilität empirisch nachweisen (bspw. Faktorenanalyse, Reliabilitätstest, Intercoder- Reliabilität etc.).

Qualität der Datenauswertung i

Stufe 5: Wie Stufe 4 + multimodale Auswertung bzw. Triangulation.

Ergebnisinterpretation i

Stufe 2: Angemessene, reflektierte und sachliche Interpretation der Ergebnisse; selbstkritische Reflexion möglicher Grenzen und Einschränkungen der Ergebnisse

Interessenkonflikte i

Stufe 2: Unabhängige Evaluation durch externe Einrichtung/Person ohne erkennbaren Interessenkonflikt.

Offene Kritik i

Die Evaluationsstudie zeichnet sich dadurch aus, dass sie mit den Grenzen des Forschungsthemas, -designs und der Daten arbeitet als sich methodisch über diese Grenzen hinwegzusetzen. Gerade durch den ausführlichen deskriptiven Teil der Studie ist es möglich, wichtige Nuancen in den Verteilungen der Variablen zu begreifen. Aufgrund der hohen Transparenz der Studie eröffnet der Autor dem Leser, seine sehr kritische Auseinandersetzung mit den Studieninhalten und seine methodischen Abwägungen in jeglicher Hinsicht nachzuvollziehen. Somit wurden sämtliche (potentielle) Komplikationen vorweggenommen und diesen mit adäquaten Analysemethoden begegnet. Dies alles unterstreicht die ergebnisoffene Vorgehensweise dieser Arbeit.

Angesichts der größtenteils aus der Beschaffenheit der Daten resultierenden Limitationen ist der analysemethodische Spielraum dieser Studie im hohen Maß eingeschränkt. Dennoch bleiben wichtige Fragen offen: Variiert die Erfolgsquote der einzelnen Polizeimaßnahmen mit der Beschaffenheit der Near Repeat Areas (Voraussetzung: Typologisieren oder Clustern der Near-Repeat-Gebiete)? Inwieweit konkurrieren andere mögliche Polizeistrategien mit dem Effekt von durch PRECOBS gezielt gesteuerten Polizeimaßnahmen (falls möglich: anonymisierte Berücksichtigung der im Bericht nicht einbezogenen polizeilichen Maßnahmen in den Regressionsmodellen)? Die Regressionsmodelle hätten darüber hinaus die Zeit z.B. in Monaten als Kovariate beinhalten können, um den Effekt von einbruchsintensiveren Monaten herausrechnen zu können. Sonst hätte die qualitative Expertenbefragung gezielt dafür genutzt werden können, Ungereimtheiten der quantitativen Analyse der prozessproduzierten Daten zu durchleuchten. Zum Beispiel hätte geklärt werden können, was der tatsächliche Grund der Stuttgarter Operatoren war und welche Entscheidungsprozesse zugrunde lagen, relativ viele eigene Prognosen zu schalten; zu klären wäre auch gewesen, warum ein Fünftel der von PRECOBS geschalteten Alarme von den Operatoren aus Karlsruhe abgelehnt wurden.

Evidenzindex i

63