Analítica, en serio
En todos los años que llevo metido en esto de “lo digital” he tenido la suerte de conocer a profesionales de primer nivel. Gente muy capaz que hace, día a día, cosas realmente disruptivas e innovadoras. Una de estas personas es Andrea Villanes.
Andrea trabaja como Research Associate en el Institute for Advanced Analytics en la North Carolina State University. Andrea es co-fundadora de Women in Technology Perú, y en sus tiempos libres (aunque no lo crean, los tiene), se dedica a hacer mentoría a chicos que estén interesados en postular a estudios en EE.UU. a través de su emprendimiento MentorMe.
Se me ocurrió entrevistar a Andrea desde la primera vez que escribí sobre el engagement, muchos hablan sobre la importancia de conocer a tu público, lo que ocurre en tu sitio, dominar temas de analítica, etc. para trabajar eficientemente el engagement (entre otras cosas). Por eso conocer gente como Andrea es clave.
José Kusunoki: Andrea, iré directo al grano: ¿qué es la analítica?
Andrea Villanes: Es una combinación de cosas que se han venido haciendo hace mucho tiempo: estadística, programación y visualización.
JK: ¿Pero cómo se materializa esto en tu día a día en el Institute for Advanced Analytics de la North Carolina State University?
AV: Mis responsabilidades incluyen enseñar cursos de text mining, data mining y programación para la minería de datos. Además, tenemos proyectos con instituciones del gobierno y empresas que deseen encontrar información en la data que han venido recolectando a través de los años.
Las industrias con las que trabajamos son súper diversas. Por ejemplo: instituciones deportivas como los Ravens (equipo de fútbol americano ganador del torneo NFL en el 2012), bancos, empresas de retail, compañías de tecnología, instituciones del gobierno, entre otras.
Muchas empresas e instituciones han recolectado datos durante muchos años, pero no los han explorado.
JK: Sobre esto último, el primer ejemplo que se me viene a la cabeza (creo que a más de uno) es el Estado…
AV: Claro, es aquí donde la analítica puede ayudar. El hacer analítica se trata de encontrar información a partir de datos. La información ayuda a la toma de decisiones para los equipos de trabajo. Nuestra misión es encontrar y presentar la información de una manera clara y sencilla, que pueda ser entendida por alguien sin mucho conocimiento estadístico.
JK: ¿Tienes algún ejemplo de una institución en particular que haya sido beneficiada con la analítica?
AV: Por ejemplo, la C.I.A. lanzó el año pasado un proyecto público para que cualquier universidad lo analizara. El objetivo era, dada una gran cantidad de datos de pacientes de un hospital, encontrar a una persona que había desaparecido de la sala de espera en un hospital. Esta persona, se creía, era quien llevaba una enfermedad sumamente contagiosa y que había puesto en peligro a todos a su alrededor. Dados diferentes sets de datos, teníamos que encontrar a esta persona, y a todas las que habían estado a su alrededor ese día.
Nuestro equipo de trabajo en el Instituto pudo encontrar a esta persona antes que cualquier otra universidad que competía en este proyecto, y no solo lo encontraron, sino que también le dieron sugerencias a la C.I.A. en como hubiesen podido hacer más difícil hacerlo.
JK: Suena a un episodio de C.S.I.
AV: Pero esto no es solo de utilidad para el gobierno ni para investigaciones estatales. Por ejemplo, hace un par de años (cuando estaba estudiando), hice una pasantía para Walmart, el retailer más grande de EE.UU. Mi misión fue explorar el uso de text-mining en el área de Insights. La empresa llevaba muchos años recolectando datos textuales, y sabían que text-mining podía ser útil para ellos. Incorporé text-mining en varios proyectos que ayudarían al área de Marketing, Farmacia, Planeamiento, entre otras. Mi proyecto fue seleccionado para ser presentado a los ejecutivos de Walmart, y presenté mis resultados incluso al ahora, CEO de la empresa.
JK: ¿Qué herramientas usas en tu día a día?
AV: Para encontrar información, utilizamos algoritmos estadísticos y programas informáticos como SAS, Python y R. Así mismo, utilizamos herramientas de visualización, programas geo-espaciales, información pública en redes sociales. La analítica es una combinación de estadística, programación, visualización y presentación de información. Ésta es la diferencia con una carrera tradicional en Estadística. Analytics es una mezcla de varias áreas. Es muy importante que la información se presente de una manera clara y sencilla, que permita la toma de decisiones.
Muchas de las empresas con las cuales trabajamos saben cuál es la pregunta que quieren responder, pero muchas veces no saben cómo analizar los datos, o no cuentan con los recursos in-house para hacerlo.
JK: Creo que ahí tocas el quid del asunto ¿cómo puede aplicar analítica una organización o empresa que no tiene el tamaño de Walmart o la C.I.A.?
AV: Claro, hay quienes creen que se debe comenzar con una gran cantidad de datos o hay que ser una empresa grande para poder comenzar el análisis. Eso es mentira. Cualquier empresa que colecte datos, puede empezar con proyectos pequeños, sencillos y herramientas que son gratuitas, como Python. Por ejemplo: imagina que eres una bodega en Lima que recientemente comenzó a vender productos orgánicos. Empezaste recolectando data de tus clientes que compraron y que no compraron estos productos. Luego estás interesado en saber el perfil de cliente de los que compran productos orgánicos para poder mandar publicidad y así elevar tus ventas. Entonces, puedes correr un árbol de decisión (decision tree) para determinar cuál es la diferencia entre los clientes que compraron productos orgánicos, y los que no lo hicieron. Tus resultados tal vez indiquen que clientes entre 27 y 32 años, mujeres, que usan transporte público (en lugar de carro propio) compran más productos orgánicos que cualquier otro perfil de cliente.
¿Qué haces con esta información? Vas donde tu jefe y le dices que le mande cupones de descuento de productos orgánicos a toda tu base de datos de clientes que cumplan con este perfil. Algo simple y sencillo de explicar, como un árbol de decisión (decision tree), puede dar a descubrir información que no se sabía en la data. Si es presentado al gerente, te aseguro que él regresara interesado en qué otras cosas se pueden hacer para analizar la información.
JK: Pero siendo objetivo, lo que cuentas cubre la mitad de la situación (el cómo hacerlo) pero la mitad restante es la escasez de profesionales en este campo ¿cierto? ¿por qué ocurre esto?
AV: El mayor reto para aplicar Analytics es el de limpiar los datos con los cuales estamos trabajando. En un proyecto, aproxidamente el 50% del tiempo lo dedicamos a limpiar y re-organizar los datos que recibimos. Una vez que la data esta lista, dedicamos un 35% a analizar la data y generar información a partir de ella, y el 15% restante, a presentar la información de una manera sencilla y efectiva. Por ejemplo, los alumnos en nuestra maestría, tienen que completar un proyecto de curso antes de graduarse. Los alumnos tienen 8 meses en total para extraer información a partir de los datos. La data le pertenece a una compañía del país que está interesada en un proyecto específico. En promedio, cada grupo de alumnos pasa 4 meses entendiendo la data, comunicándose con su sponsor, y limpiando y explorando la data. Es en esta fase que se requiere mucha comunicación con los stakeholders del proyecto, ya que surgen muchas preguntas acerca de la data.
Es difícil conseguir talento que pueda analizar la información en forma acertada. Las universidades se han basado, por lo general, más en lo teórico que en lo práctico. Necesitamos profesionales que puedan trabajar en equipo, que puedan comunicarse de forma efectiva con diversas áreas, y que puedan presentar resultados de forma sencilla a los ejecutivos.
El potencial de Analytics en los próximos años irá en aumento. En este momento, ser un Data Scientist está considerada la carrera más sexy del siglo XXI. El 100% de nuestros estudiantes en la maestría de Analytics encuentra trabajo antes de graduarse, y los salarios son incluso más competitivos a tener un MBA.