Los proteomas están formados por un compendio de proteínas expresadas en una célula particular
Los proteomas están formados por un compendio de proteínas expresadas en una célula particularemblEmbl

Nueva era en la ciencia: la Inteligencia Artificial crea la mayor base de datos de proteínas humanas

La inteligencia artificial de google descubre la mayor base de datos sobre las formas de las proteínas

De esta manera describía Demis Hassabis, director de DeepMind, el logro de este ordenador: la imagen más completa del proteoma humano: «Es la contribución más importante de la IA a la ciencia». Hablar de la imagen más completa del proteoma humano, un hito conseguido por el sistema de inteligencia artificial Deep Mind, dice muy poco, pero… Cuando la ciencia logró descifrar el genoma humano, es decir ubicar y nombrar a los 20.000 genes que componen nuestra anatomía, se consideró un avance similar a la llegada a la Luna, uno de los «ochomiles» de la ciencia por decirlo de algún modo. Pero llegar a la Luna es un paso, el verdadero desafío sería establecer una base permanente allí. Y eso equivale a descifrar el proteoma humano. Los 20.000 genes de los humanos regulan la actividad (secuencia y plegamiento) de cada una de las entre 80.000 y 400.000 proteínas. Y estas son las que determinan lo que ocurre en nuestro cuerpo: desde el color de ojos hasta la posibilidad de tumores. Comprender su actividad es fundamental.

Estructura tridimensional de la defensina-6 humana, vista de perfil (izquierda) y desde arriba (derecha). La línea azul es la cadena de 32 aminoácidos que forma la proteína, y las tres flechas son “hilos beta”, las estructuras responsables de que las defensinas-6 se enreden entre sí como si fueran velcro. En gris aparecen tres iones de cloro, que marcan dónde se acumulan las cargas positivas en la proteína.
Estructura tridimensional de la defensina-6 humana, vista de perfil (izquierda) y desde arriba (derecha). La línea azul es la cadena de 32 aminoácidos que forma la proteína, y las tres flechas son “hilos beta”, las estructuras responsables de que las defensinas-6 se enreden entre sí como si fueran velcro. En gris aparecen tres iones de cloro, que marcan dónde se acumulan las cargas positivas en la proteína.EMBL-EBI Protein Data Bank

El problema es que no se trata de un catálogo de genes: las proteínas son como diminutas esculturas de origami cuyos pliegues y volumen determinan lo que hacen. Hasta ahora una de las herramientas más eficaces para conseguir esto era la cristalografía de rayos X, un proceso largo y complejo que puede llevar meses por cada proteína. O llevaba, porque llegó la inteligencia artificial o mejor dicho el proyecto AlphaFold, la niña mimada de DeepMind, la IA creada por Google. Hasta la fecha los científicos conocían la estructura de unas 170.000 proteínas, de las más de 200 millones presentes en todos los seres vivos.

Avance del conocimiento

Esas 170.000 fueron las que alimentaron los algoritmos de IA de AlphaFold. El sistema las analizó todas y comenzó a comparar, a crear y a descartar modelos tridimensionales de proteínas basándose en los aminoácidos de estas. Cada nuevo modelo era sometido a otras pruebas. Y así, mediante el sistema de aprendizaje profundo o «deep learning», fue creando una base de datos del proteoma humano. Y ahora contamos con una imagen del 98,5% de las proteínas de nuestro cuerpo. El resultado, publicado en la prestigiosa revista «Nature», es «la imagen más completa y precisa del proteoma humano –según declaraba ayer Demis Hassabis, director de DeepMind–. Creemos que esta es la contribución más significativa que ha hecho la inteligencia artificial al avance del conocimiento científico hasta la fecha, y es un gran ejemplo de los tipos de beneficios que la inteligencia artificial puede aportar a la sociedad».

Esta capacidad para predecir la forma de una proteína cambia a semanas o meses lo que antes necesitaba años. La pregunta lógica es, si son predicciones de las proteínas…¿podemos confiar en ellas? las estructuras creadas por AlphaFold coinciden en todos los aspectos con las conocidas, es como si hubiera empezado de cero en muchos aspectos y los resultados han mostrado esta coincidencia y demostrado confianza. Lo interesante del avance se puede dividir en dos áreas fundamentales para el futuro. El primero de ellos es que todos estos conocimientos se han puesto a disposición de los científicos, para que sigan avanzando. Y lo segundo es que AlphaFold no solo se dedicó al proteoma humano, sino también al de otros 20 organismos, como la levadura o el E. coli (muy frecuentes en investigación) lo que equivale a unas 350.000 estructuras de proteínas en total.

Esto sí es el equivalente a una base en la Luna. Y quizás también en Marte. De hecho, AlphaFold ya forma parte de procesos de investigación en, por ejemplo, la Iniciativa de Medicamentos para Enfermedades Desatendidas (DNDi, por sus siglas en inglés). Comprender qué ha salido mal en el pliegue de ciertas proteínas permite comprender mucho mejor la enfermedad, desde su raíz y así atacarla. También forma parte del Centro de Innovación Enzimática (CEI) que gracias a AlphaFold permitirá desarrollar enzimas más eficientes reciclar plásticos, tratar derrames de sustancias contaminantes o mejorar el rendimiento de cosechas.