Inteligencia Artificial
AlphaGenome: Google no solo quiere predecir tus búsquedas, también tus genes
El gigante de internet ha presentado un modelo de inteligencia artificial que predice cómo las mutaciones individuales del ADN pueden provocar enfermedades o mutaciones.
Ya lo había hecho con Alpha Fold, una inteligencia artificial que predice cómo se plegará una estructura (una característica que determina sus capacidades) y que se hizo con el Nobel de Química en 2024. Y ahora Google busca algo similar con AlphaGenome.
Se trata, según el propio comunicado de Google, de “una nueva herramienta de inteligencia artificial (IA) que predice de manera más completa y precisa cómo las variantes o mutaciones individuales en las secuencias de ADN humano impactan una amplia gama de procesos biológicos que regulan los genes”.
AlphaGenome, abarca tanto las regiones codificantes como las no codificantes del genoma y ofrece una visión unificada de los efectos de las variantes como nunca antes. Aporta información con resolución de bases al análisis genómico de largo alcance, decodificando el impacto de las mutaciones con velocidad, escala y profundidad sin precedentes.
El modelo procesa hasta un millón de pares de bases en una sola pasada y predice miles de propiedades moleculares, incluyendo la expresión génica, los patrones de unión, los sitios de unión a proteínas y la accesibilidad de la cromatina (la sustancia que compone los cromosomas) en diversos tipos de células. Es la primera vez que se puede modelar conjuntamente una gama tan amplia de características reguladoras utilizando un solo sistema de IA.
La arquitectura de AlphaGenome utiliza primero capas convolucionales (“redes neuronales digitales” que detectan patrones) para detectar similitudes en la secuencia de ADN y, a continuación, aplica transformadores para compartir información a lo largo de todo el código genético. Un conjunto final de capas convierte estos patrones aprendidos en predicciones para diversas características genómicas.
Durante el entrenamiento, todos los cálculos de una sola secuencia se distribuyen entre múltiples Unidades de Procesamiento Tensorial (TPU) interconectadas, lo que permite un procesamiento eficiente a gran escala. Lo sorprendente es que todo el modelo se entrenó en tan solo cuatro horas (utilizando datos públicos) y con la mitad del presupuesto computacional requerido por su predecesor, Enformer.
Actualmente, AlphaGenome es el único modelo capaz de predecir conjuntamente todas las modalidades moleculares evaluadas, superando o igualando a los modelos especializados en 24 de las 26 pruebas de referencia.
A diferencia de los modelos anteriores que priorizaban la longitud de la secuencia en favor de la resolución, AlphaGenome gestiona ambas con precisión. Captura el contexto genómico a largo plazo y ofrece predicciones de base, lo que revela información sobre biología de enfermedades, investigación de variantes raras, diseño de ADN sintético y más.
Una característica destacada del nuevo modelo es su sistema de puntuación de variantes, que compara eficazmente el ADN mutado y no mutado para evaluar el impacto en las distintas modalidades. Pero su impacto también se podrá ver en otros sectores: en biología sintética, por ejemplo, AlphaGenome podría ayudar a diseñar secuencias reguladoras que activen genes selectivamente, por ejemplo, en células nerviosas, pero no en células musculares.
En un caso de prueba, AlphaGenome predijo con precisión cómo una mutación ligada a la leucemia introduce un motivo de unión al ADN MYB que activa el gen TAL1, imitando los mecanismos conocidos en la leucemia linfoblástica aguda de células T y demostrando su capacidad para conectar variantes no codificantes con genes de la enfermedad.
Si bien AlphaGenome representa un avance importante, no está diseñado ni validado para la interpretación genómica personal ni para su uso clínico. También enfrenta desafíos a la hora de modelar interacciones reguladoras muy distantes, especialmente aquellas a más de 100.000 letras de ADN, y a la hora de capturar completamente los patrones específicos de células y tejidos.
Aun así, sus responsables afirman que sienta una base sólida para una futura expansión, con potencial para adaptarse a otras especies, modalidades y conjuntos de datos específicos de laboratorio.
AlphaGenome ya está disponible en versión preliminar para uso no comercial a través de la API de AlphaGenome. Google invita a investigadores de todo el mundo a explorar casos de uso, hacer preguntas y compartir comentarios. Las predicciones de la herramienta basada en IA están destinadas exclusivamente a fines de investigación.
“Esperamos que AlphaGenome nos ayude a comprender mejor los complejos procesos celulares codificados en el ADN e impulse nuevos descubrimientos en genómica y atención médica”, concluye el comunicado.