De sidste stykke tid har jeg researchet ”Big Data”, en af de allerhotteste teknologi-trends lige nu. Jeg har ledt efter virksomheds-cases, hvor “Big”‘et i ”Big Data” har været mere end blot et tillægsord. Hvor “Big Data” har skabt kvalitativt nye løsninger, som ikke var muligt i det små. Blandt de mange jeg har været igennem er der særligt syv der har gjort indtryk. Dem deler jeg de disse dage her på bloggen. Første case var Target – supermarkedet der ved når du venter dig. Opdateret: nye cases lagt på: 23andme.com løser medicinske gåder med banebrydende Big Data-approach. Bedste Big Data case #3 samt “Google – alle Store Data’s moder. Bedste Big Data case nummer fire“).
I denne uge går turen til LA, hvor politiet med Big Data har fået nedsat antallet af indbrud med 16 %.
”The right place at the right time”
For små to uger siden, den 13. februar, oplevede Foothill-distriktet i Los Angeles de formentligt første 24 timer helt uden (registreret) kriminalitet blandt området 250.000 indbyggere.
Captain Steven Carmona, LAPD, Foothill discrict Billede: NBC
Årsagen skal blandt andet findes i Big Data, fortæller LAPD på deres officielle blog. ” The use of advanced data analytics allows Foothill Area to place officers in the right place at the right time to prevent crime” som det hedder. De sidste tre år har Foothill distriktet nemlig været en af frontløberne i en ny ”predictive policing” trend, der netop handler om at forudse hvor forbrydelserne finder sted, før de gør det.
500*500 feet
Hvor politiet i Foothill-distriktet før i tiden patruljerede ved at køre rundt sådan lidt på må og få, er der i dag anderledes systematik bag ruteplanlægningen.
Et computergenereret heat map, hvor farvetone varierer med forudsagt risiko for indbrud og det tilhørende Google Maps. Billede via Technology Review
Og her i en close-up, der viser detaljer med procenter for risikoen for hhv bil-tyverier og indbrud samt mest udsatte tidspunkt på dagen. Taget fra en officiel præsentation af initiativet.
Patruljeringen guides i dag af skærme i politibilerne (eller på bærbare computere, tablets eller smartphones) der viser betjentene Foothill-distriktet opdelt i kasser på 500*500 feet. Og for hver kasse kan betjentene se, hvor mange procents risiko der er for biltyverier og indbrud – og på klokkeslet hvornår den er størst.
Jordskælvs-altgoritmer bag
Det nye ved disse forbrydelseskort er ikke at LAPD nu har et Google-agtigt kort på mobilen at køre rundt efter. Det er heller ikke i sig selv særligt banebrydende, at fortiden hjælper betjentene til at forudse fremtiden. Det er måden der sker på.
Forbrydelseskortene viser nemlig ikke bare gentagelser af simple mønstre fra fortiden. Dem er der alt for få af til, at de kan forudsige noget særligt. Derimod viser de avancerede variationer af fortidens komplekse mønstre. Faktisk er forbrydelseskortene – bogstaveligt talt – bygget på algoritmer, lavet til at forudsige jordskælv.
Eller rettere: algoritmer, lavet til at forudsige efterskælvene efter et jordskælv. For hvor jordskælvet selv er næsten umuligt at forudse, følger efterskælvene et komplekst mønster, viste det sig, da forskere undersøgte fænomenet. Og efter succesfuldt at have lavet modeller, der faktisk kunne hjælpe med at slå fast hvor skælv nummer to, tre og fire ville ramme, blev metoden overført til kriminalitet. Også her viste det sig nemlig at en lovovertrædelse typisk trak en hale af flere andre efter sig. En af årsagerne – hvad angår indbrud – bundede simpelt hen i den gamle sandhed om, at forbryderen vender tilbage til sit åsted. Når først en indbrudstyv havde lært et sted at kende, var det simpelthen meget lettere at slå til igen.
Bandehævn
Men også vold viste sig at følge samme mønster. Ved bandeopgør f.eks. følger et angreb fra den ene side ofte fører nye gengældelser med sig som figuren herunder viser.
Locke-Lowell inter-gang violence 1999-2002
Figuren er fra præsentationen ”Hollenbeck, Los Angeles. Source: Santa Cruz and Los Angeles Predictive Policing 6 month trial” af LAPD og forskerne bag forsøget. Og de fremhæver, hvordan denne fordeling temmelig præcist viser sig at passe med efter-skælv sandsynlighedsgraferne.
Figuren er fra præsentationen ”Hollenbeck, Los Angeles. Source: Santa Cruz and Los Angeles Predictive Policing 6 month trial” af LAPD og forskerne bag forsøget. Og de fremhæver, hvordan denne fordeling temmelig præcist viser sig at passe med efter-skælv sandsynlighedsgraferne.
13 % færre forbrydelser
Det var ikke kun den 13. februar i år Foothill mærkede effekten af deres Big Data politiarbejde. Faktisk viste en opgørelse at kriminaliteten i det hele taget faldt med imponerende 13 % i de første fire måneder efter at systemet i 2011 var blevet taget i anvendelse, fortæller det Big Data-firma, predpol, som systemet i dag markedsføres af.
Kriminaliteten falder med 13% efter indførelsen af Big Data hos Foothill. Kilde: Predpol
Og ifølge LAPDs egen Sean Malinowksi var reduktionen i indbrud langt større. De første seks måneder havde de 25% færre indbrud sammenlignet med de samme seks måneder året før, som han her fortæller til NBC.
Derfor er Foothill-casen god
Der er to ting jeg særligt godt kan lide ved Foothill-casen:
1. Det er rigtig Big Data tankegang
Kriminalitetsmodellen bag er begavet tryllestavstænkning. Det er mønstergenkendelsen der er i fokus og er grunden til at modellen virker. Forklaringerne, som jeg også har gengivet her – at forbryderen vender tilbage til sit gerningssted og at bander slår igen – er bare efterrationaliseringer. Måske er der hundrede andre sammenhænge, der forklarer systematikken. Og det er modellen sådan set ligeglad med. Alt hvad den gør er at afsløre sammenhænge der rent faktisk giver mening.
Læg i den sammenhæng mærke til at modellen fungerer i real-time. I det øjeblik banderne måtte blive mere tilgivende eller tyvene mindre vaneprægede, og andre sammenhænge tilgengæld måtte vinde frem, vil modellen automatisk rette til. Og gøre det med det samme.
2. Det virker
Casen her er også god, fordi den er så veldokumenteret. Og fordi tallene taler et tilsyneladende meget tydeligt sprog. Hvor mange andre cases er mere eksempel-agtige i det, er Foothill enormt godt belyst.
Pingback: Jon Lund » Blog Archive » De syv bedste cases jeg er stødt på i min Big Data research: 1. supermarkedet der ved når du venter dig
Pingback: Jon Lund » Blog Archive » 23andme.com løser medicinske gåder med banebrydende Big Data-approach. Bedste Big Data case #3
Pingback: Jon Lund » Blog Archive » Google – alle Store Data’s moder. Bedste Big Data case nummer fire
Pingback: Jon Lund » Blog Archive » Larger than Life – sådan virker Facebooks algoritmer. Bedste Big Data case #5.
Der er lukket for kommentarer.