
Salud
Una inteligencia artificial catalana descifra el lenguaje oculto de las proteínas implicadas en el alzhéimer
CANYA, desarrollada por el CRG y el IBEC, permite predecir cuándo las proteínas se agregan de forma dañina, un proceso clave en más de 50 enfermedades.

Un equipo de investigadores catalanes ha desarrollado una herramienta de inteligencia artificial (IA) que da un paso decisivo en la comprensión del alzhéimer y otras patologías relacionadas con la agregación de proteínas. La herramienta, bautizada como CANYA, ha sido presentada en un estudio publicado en la revista Science Advances, fruto de la colaboración entre el Centro de Regulación Genómica (CRG) y el Instituto de Bioingeniería de Cataluña (IBEC).
La IA ha conseguido descifrar el lenguaje secreto que emplean las proteínas para decidir si se pliegan correctamente o forman agregados "pegajosos", una condición patológica que altera el funcionamiento celular y está relacionada con más de 50 enfermedades, incluida la enfermedad de Alzheimer, que afectan a unos 500 millones de personas en todo el mundo.
A diferencia de otras IA de tipo "caja negra", cuyos procesos son opacos, CANYA fue diseñada con un enfoque de “IA explicable”, lo que permite a los científicos comprender cómo llega a sus predicciones. Esta transparencia ha permitido identificar los patrones químicos que impulsan la agregación nociva, un avance clave tanto para la investigación biomédica como para la industria farmacéutica.
Un lenguaje biológico difícil de traducir
Las proteínas están compuestas por 20 tipos de aminoácidos, cuyo orden determina su forma y función. Entender qué combinaciones causan agregaciones patológicas ha sido un reto científico durante décadas. Las herramientas anteriores se enfrentaban a una gran limitación: la escasez de datos fiables sobre este proceso.
Para entrenar a CANYA, el equipo generó más de 100.000 fragmentos de proteínas sintéticas, cada uno con 20 aminoácidos, y estudió su comportamiento en células de levadura. Si un fragmento causaba agregación, las células reaccionaban de forma medible, lo que permitió establecer relaciones causa-efecto.
“El lenguaje de las proteínas es como una galaxia inexplorada”, explica el doctor Mike Thompson, del CRG. “Hasta ahora solo se había cartografiado una pequeña fracción. Nuestro enfoque nos permite ampliar ese mapa con miles de combinaciones nunca vistas en la naturaleza”.
Implicaciones para la salud y la industria
Además de su relevancia para enfermedades neurodegenerativas, el impacto más inmediato de CANYA podría darse en el ámbito biotecnológico y farmacéutico. Muchos medicamentos modernos están basados en proteínas terapéuticas que, si se agregan, pierden su efectividad y generan problemas de fabricación.
“La agregación de proteínas es un gran quebradero de cabeza para las farmacéuticas”, señala la doctora Benedetta Bolognesi, del IBEC. “CANYA puede ayudar a diseñar anticuerpos y enzimas más estables, reduciendo fallos en la producción y costes económicos”.
Pese a haber renunciado a parte de la capacidad predictiva que ofrecen las IA más opacas, CANYA ha superado en un 15 % la precisión de los modelos anteriores, demostrando que la transparencia y la eficacia no tienen por qué estar reñidas.
Este avance posiciona a la ciencia catalana a la vanguardia de la inteligencia artificial aplicada a la biología molecular, y abre una nueva etapa en la lucha contra enfermedades que, hasta ahora, parecían imposibles de prevenir o tratar desde su origen molecular.
✕
Accede a tu cuenta para comentar