La inteligencia artificial cada vez está más presente en la biología. AlphaFold ha logrado el “google maps” de casi todas las proteínas conocidas por la ciencia, un avance gigante que servirá para abordar retos presentes y futuros y que traerá “descubrimientos que aún no podemos prever”.
Así lo señaló Marco Marcia, jefe de grupo en el Laboratorio Europeo de Biología Molecular (EMBL) en su sede de Grenoble, Francia. Esta institución -que también tiene sede en Barcelona- junto a la empresa DeepMind de Alphabet/Google, ha logrado, gracias a la inteligencia artificial (IA), predecir la estructura tridimensional de más de 200 millones de proteínas.
Este mapa, volcado en una base de datos gratuita y de libre acceso -llamada también AlphaFold- se ha ido ampliando desde su creación en el 2021 unas 200 veces, pasando de casi un millón de estructuras a más de 200 millones en su última versión publicada a finales de julio.
“AlphaFold no es una base de datos cerrada. Se han incluido aquellas estructuras proteicas de organismos de los que se ha secuenciado su genoma -también de plantas, bacterias o animales-”, explicó Marcia, por lo que a medida que se escudriñen otros se podría ir ampliando.
“La ciencia funciona así, es una evolución de conocimiento siempre activa”, recalcó el científico italiano.
Por qué importa la estructura 3D
Las proteínas realizan una gran parte de las actividades que permiten la supervivencia de las células y son necesarias para la función y regulación de tejidos y órganos. Son cadenas de cientos de aminoácidos y la secuencia de estos determina la estructura tridimensional única de cada una de ellas.
Es esta estructura la que las lleva a encajar unas en otras y la que define lo que hacen y cómo lo hacen. Conocer la estructura de estas piezas fundamentales de la vida es en definitiva entender el funcionamiento de la célula y del organismo humano, detalló Marcia.
Pero no sólo. Conocer cómo funcionan también sirve para comprender por qué no funcionan y poder, así, intervenir farmacológicamente.
Para explicar su importancia el investigador del EMBL usa google maps como símil: esta aplicación permite saber cómo está organizada una ciudad, dónde están los edificios importantes, como estaciones u hospitales, los restaurantes, las farmacias, y te permite orientarte.
“La misma información es la que tenemos nosotros con AlphaFold. Lo que ha hecho esta IA es predecir la estructura de casi todas las proteínas catalogadas, lo que equivale a divulgar los mapas de todas las ciudades del mundo. Si se descubriera una nueva isla en el Pacífico se mapearía, si se identificara un organismo nuevo y se secuenciara su genoma, se incluiría en nuestra base de datos”.
Marcia subrayó que lo que hace AlphaFold es predecir, no determinar, aunque los experimentos han demostrado que lo hace con una gran precisión, sin precedentes. El margen de error es ínfimo.
Sus predicciones sirven a los científicos para plantear hipótesis experimentales sobre una proteína concreta que interesa y que resultan luego más certeras, y para lograr determinar en el laboratorio su estructura a una velocidad que antes era inimaginable.
Cómo se trabajaba antes de la IA
Antes de la aparición de la IA y AlphaFold, la estructura de las proteínas solo se podía conseguir en el laboratorio, de forma experimental, a través de técnicas avanzadas como la cristalografía, la microscopía electrónica o la resonancia magnética nuclear.
Estas se usan, pero la IA ha logrado hacer un mapa de predicciones que acorta los tiempos y afina las búsquedas.
AlphaFold aprendió de lo que había. Hasta su aparición la ciencia solo conocía la estructura de 200,000 proteínas y es en estas y en sus detalles en lo que se basó la IA de DeepMind para lograr su base de datos. “Sin el conocimiento previo de décadas no hubiéramos tenido el mismo éxito”.
Logros científicos
El primer millón de estructuras proteicas ha provocado, en el último año, la publicación de más de mil artículos científicos sobre una amplia gama de temas; su ampliación a 200 millones provocará una multiplicación.
El laboratorio de Marcia estudia complejos de proteínas y ARN implicados en la regulación de la expresión génica -proceso que permite obtener proteínas a partir de genes- en el desarrollo embrionario y en el cáncer. Gracias a la IA ha logrado conocer la estructura de sus proteínas de manera individual y ahora podrá dedicarse a caracterizar los complejos más rápidamente.
Marcia dijo que cuando piensa en el futuro de la IA y la biología recuerda primero lo que astrónomos y sociedad en general sintieron al observar las primeras imágenes del telescopio James Webb: emoción.
“Somos la primera generación de seres humanos que entendemos cómo las proteínas se forman y la primera en comprender cómo se organizan las galaxias lejanas. ¿Hemos descubierto vida en otros mundos gracias al Webb? Aún no, queda mucho por descubrir y quién sabe lo que nos deparará el futuro”.
Lo mismo pasa en su campo. “Tenemos ahora el “google maps”de casi todas las proteínas conocidas, pero no hemos curado todas las enfermedades. Es una herramienta más para proceder más rápido en la medicina; habrá descubrimientos que aún no podemos prever”.