¿Cuál es el potencial uso de Twitter para predecir el crimen?
Las redes sociales como Twitter y Facebook han servido como herramientas para predecir revoluciones políticas, elecciones y hasta brotes pandémicos. Pero Twitter, ¿sirve para incorporarlo a los modelos predictivos de crimen?
Twitter es una de las redes sociales más utilizadas en el mundo. A enero del 2016, existen alrededor de 332 millones de usuarios activos en Twitter. Como es sabido, un tweet es un texto de 140 caracteres para comunicarnos de manera breve y directa. Es una de las herramientas más usadas para obtener información y noticias al instante. Muchos tweets cuentan con identificadores georreferenciados que permiten conocer la posición exacta de donde se mandó el tweet. Esta última es la pieza clave para los modelos predictivos.
Usando software de identificación de texto y la ubicación geográfico de tweets, investigadores de la Universidad de Virginia diseñaron un modelo predictivo de crimen. La simulación se llevó a cabo incorporando tweets y datos de la policía en la ciudad de Chicago durante una ventana de 3 meses. Este ejercicio comparó dos modelos predictivo para 25 tipos de delitos. El primero utilizó datos de la policía (modelo tradicional) y el segundo utilizó el modelo tradicional de predicción incorporando tweets. El algoritmo que incorpora tweets busca palabras específicas indicativas de que pueda ocurrir un crimen. El tipo de palabras que busca el modelo están asociadas con actividades del día a día que normalmente tienen una alta relación con actividad criminal, como por ejemplo ir a bares o discotecas. Los resultados, gracias a su característica geográfica, son puestos en un mapa interactivo de Chicago para identificar “puntos calientes” de incidencia delictiva.
¿Funciona este modelo?
Evidencia descriptiva parece sugerir que esto podría tener potencial. Para 19 de los 25 crímenes analizados se encontraron mejoras en la exactitud de la predicción delictiva al incorporar tweets. Los crímenes donde se vieron mejoras fueron acecho (“stalking”, en inglés), vandalismo y apuestas ilegales. Por otro lado, los delitos donde no se exhibieron mejoras fueron para incendio malicioso, secuestros y amenazas.
Este modelo no está prediciendo el futuro como en la película “Minority Report”. Más bien, los tweets están iluminando áreas con concentración criminal gracias a las tendencias exhibidas en base a lo que está escribiendo la gente y a crímenes pasados. Esta herramienta tiene fines de mejor orientar la acción policial geográficamente para prevenir delitos.
De acuerdo a una entrevista con el autor de la investigación el Dr. Matthew Gerber, no se cuenta con una explicación concreta del porqué algunos delitos fueron más difíciles de predecir usando Twitter que otros. El estudio sugiere que una limitación puede ser el lenguaje utilizado en Tweets, que se caracteriza por ser informal y abreviado.
Sin embargo, aún no se han realizado evaluaciones rigurosas de estos métodos que permitan establecer la relación causal entre estas herramientas que complementan las predicciones de la policía y las tasas de crimen.
En nuestra región, existen más de 30 millones de usuarios de Twitter, siendo Brasil y México los países de más uso. Dado que poco más del 50% de la población es menor de 24 años, el rol de las redes sociales no sólo aumentará, sino que será un pilar importante de la vida cotidiana de nuestros jóvenes en los próximos años.
En una región donde estadísticas sobre crimen y violencia son difíciles de obtener o recopilar, los datos generados de redes sociales o de dispositivos móviles pueden dar a luz comportamientos de nuestra sociedad que complementarían la información con la que ya se cuenta. Estos elementos producen información en un gran volumen cada segundo, ayudándonos a pronosticar y entender el comportamiento humano de maneras inimaginables.
Mientras, los dejamos con un pequeño ejercicio que hicimos en el la unidad de seguridad ciudadana del BID. Bajamos 3.000 tweets con la palabra “crimen” con fecha del 9 de marzo. Luego identificamos las palabras más comunes dentro de estos tweets, que presentamos en una nube de palabras. Estas son las palabras más frecuentes que nos dejan saber de qué está hablando la gente en Twitter cuando habla sobre crimen:
Fuente: Elaboración propia a partir de datos recopilados de la Interfaz de Programación de Aplicaciones (API) de Twitter
Las palabras más frecuentes en los tweets que contienen la palabra crimen fueron Honduras, alcalde, relación, arrestan y organizado. Esto más que nada se debe a que el 9 de marzo la Agencia Técnica de Investigación Criminal (ATIC) de Honduras arrestó al alcalde del municipio de San Fernando en el departamento de Ocotepeque por tener presuntos nexos con el crimen organizado.
En el BID, continuaremos impulsando nuestra rigurosa agenda de conocimiento para acortar las brechas de conocimiento que existen en la región. Uno de los próximos pasos a seguir será estudiar la viabilidad de incorporar Twitter y otras fuentes alternativas de información para poder entender con más profundidad la incidencia delictiva y victimización en la región. Sobre todo, desde un punto de vista del comportamiento humano. En una segunda parte de este blog hablaremos de datos recopilados de dispositivos móviles.
Esta columna fue originalmente publicada en el Blog Sin Miedos del Banco Interamericano de Desarrollo (BID)