Por Cathy O’Neil
La pandemia de coronavirus ha llevado a los modelos matemáticos a un rol principal en los asuntos humanos. Sus predicciones son literalmente una cuestión de vida o muerte, lo que impulsa las decisiones sobre el equipamiento de los hospitales, el cierre de negocios y la restricción de los movimientos de millones de personas.
Sin embargo, pocos entienden el funcionamiento interno de los modelos. Así que aquí está mi opinión como científica de datos al respecto, con el objetivo de ofrecer una idea de cuáles merecen confianza.
Comencemos definiendo lo que significa que un modelo predictivo funcione. A veces es solo una cuestión de precisión: un buen modelo de astronomía, por ejemplo, predecirá el regreso del cometa Haley con gran precisión. Otras veces es más complicado: los modelos epidemiológicos que aparecen en la crisis de COVID-19 tienen un doble objetivo de predicción y persuasión.
Un buen modelo debe dar a las personas un sentido realista de lo que sucederá si no cambian su comportamiento, y también una imagen persuasiva de los resultados que pueden lograr si lo hacen.
Existen, en términos generales, cuatro tipos de modelos que han desempeñado diferentes roles en la crisis hasta ahora. Primero viene el SIR, cuyas versiones se han utilizado en Washington y Pensilvania. Proyecta el arco de una pandemia al centrarse en tres poblaciones: la susceptible (que tiene la oportunidad de propagarse), la infecciosa (que informa la tasa de propagación) y la recuperada (que, si es inmune, disminuye la propagación).
El parámetro crucial aquí es R(t), que es el número promedio de personas que cada persona contagiosa infectará (y no tiene nada que ver con la R en SIR). Si un virus es altamente contagioso y no enfrenta obstáculos, R(t) será mucho mayor que uno y la población infectada crecerá exponencialmente, lo que conducirá, en el caso del coronavirus, a un sistema hospitalario abrumado.
Si las personas logran superarlo, se quedan en casa, usan máscaras y mantienen la distancia, los casos disminuirán (como ha sucedido en la ciudad de Nueva York). Además, R(t) cambia inevitablemente con el tiempo: a medida que más personas están infectadas o son inmunes, gradualmente desaparece.
El concepto de R(t) hace que los modelos SIR sean muy persuasivos. Se puede estimar a partir de los datos, y las personas pueden ver cómo los esfuerzos para reducirlo también aplanarán las curvas de casos, hospitalizaciones y muertes. Es algo que los humanos pueden controlar y rastrear.
Sin embargo, en lo que respecta a las predicciones, los modelos SIR no son tan buenos. Esto se debe a que pequeños cambios en R(t) generan grandes cambios en la trayectoria de una enfermedad. Tal es la naturaleza del crecimiento exponencial. Esto ayuda a explicar, por ejemplo, por qué el Estado de Nueva York pensó que necesitaría decenas de miles de ventiladores, pero terminó con un excedente.
A continuación, está el modelo basado en la propagación por agentes o individual. Puede poblarse con millones de personas virtuales, a cada una de las cuales se les asigna R(t) separadas para infectar a la familia, los colegas y las personas con las que coinciden en público, así como otros atributos como la propensión a moverse.
Es ideal para modelar cómo las infecciones se propagan rápidamente por grandes áreas si las personas viajan por todas partes. También es muy persuasivo, porque demuestra cómo las personas pueden frenar la propagación cambiando su comportamiento. Uno de esos modelos, el modelo del 15 de marzo en Imperial College de Londres, que originalmente predijo 2.2 millones de muertes en EE.UU., desempeñó un rol importante al convencer a las autoridades de EE.UU. y el Reino Unido de tomar medidas más agresivas para contener la pandemia.
En términos de precisión, tiene los mismos problemas que los modelos SIR. Claramente, es poco probable que EE.UU. tenga cerca de 2,2 millones de muertes, al menos en esta primera ronda. ¿Pero quién sabe? Tales predicciones podrían haber sido precisas si no hubiera cambiado nada, y pueden suceder si las personas se niegan a quedarse en casa en el futuro.
Luego está el modelo de red, que trata a los individuos como nodos en una vasta red, como amigos en una red social como Facebook. La idea es que ciertas personas tienden a ser súper propagadoras, porque interactúan con muchas personas (o muchas personas súper vulnerables), porque hacen cosas particularmente riesgosas, o todo lo anterior. Piense en enfermeras y otros trabajadores de primera línea, o políticos cuyo trabajo es reunirse con personas.
Los modelos de red pueden ser valiosos para fines específicos, como decidir a quién vacunar en primer lugar, si una vacuna es escasa. Inocular a las personas altamente conectadas hará más para reducir la R(t), porque son la parte de la población con la mayor propensión a infectar a otros. El grupo GLEAM de Northeastern University utiliza modelos de red para comprender cómo se propagan los efectos de los viajes en avión. Al igual que SIR y los modelos basados en agentes, el método es altamente persuasivo pero marginalmente preciso.
Finalmente, está el modelo de ajuste de curva. Básicamente, toma la tendencia histórica y la proyecta hacia el futuro. Si, por ejemplo, las infecciones se han duplicado cada cinco días, el modelo podría pronosticar que seguirán haciéndolo. Esto rara vez es útil, como lo demuestra una mirada superficial a las curvas pandémicas de diferentes países. Todos comienzan con un crecimiento exponencial, luego toman sus propios caminos idiosincrásicos dependiendo de las medidas de contención adoptadas. No hay otro patrón que la imprecisión completamente predecible.
Los modelos de ajuste de curvas han generado algunas proyecciones espectacularmente estúpidas. Considere, por ejemplo, el que, según informes, usó el asesor de la Casa Blanca Kevin Hassett para predecir que las muertes por COVID-19 disminuirían a cero en 10 días.
También son muy poco persuasivos, porque carecen de parámetros para proyectar escenarios alternativos, es decir, no pueden decir cómo las personas pueden cambiar el futuro. Por construcción, simplemente suponen que el futuro será como el pasado.
Es posible que haya notado que los modelos útiles tienen un elemento común: R(t). Soy fanática del concepto, así que creo que escribiré más sobre él.