Sociedad

¿Inteligencia Artificial contra la COVID-19? No tan deprisa

Un estudio demuestra que los modelos de Inteligencia Artificial para diagnosticar la Covid19 no son prácticos en medicina

En los últimos años se han creado herramientas de Inteligencia Artificial para su uso en medicina, pero no todas son igual de prácticas.
En los últimos años se han creado herramientas de Inteligencia Artificial para su uso en medicina, pero no todas son igual de prácticas.DREAMSTIMELA RAZON

La buena intención solo es útil si se sigue la metodología correcta. Cuando empezó la primera ola de COVID-19 hace un año, muchos investigadores dedicaron sus recursos a pensar cómo ayudar en una pandemia que iba encerrando el mundo poco a poco. Biólogos, químicos y matemáticos se centraron en investigaciones alternativas, comprobando si sus enfermedades de estudio empeoraban con el coronavirus, o si era posible fabricar mascarillas más duraderas.

Entre el sinfín de estudios surgidos a partir de la COVID-19, uno de los campos más prometedores ha sido el de la inteligencia artificial. Teóricamente, los algoritmos de aprendizaje profundo deberían ser capaces de reconocer patrones en las radiografías de pacientes y poder diagnosticar la enfermedad, ayudando a los médicos poco entrenados en el proceso.

Con esta idea en mente, durante 2020 se crearon más de trescientos modelos de inteligencia artificial diferentes. Estos modelos han llenado las noticias en diferentes ocasiones, pero hoy en día no hay ningún hospital que aplique inteligencia artificial en sus diagnósticos de coronavirus. Los modelos siguen guardados en una carpeta del ordenador mientras dependemos de la vista. ¿Por qué?

Hambre de datos

En vez de generar un nuevo modelo para predecir el COVID-19, un equipo de investigadores de la Universidad de Cambridge decidió dar la vuelta al problema, y comprobar por qué no se usaban los modelos anteriores. Analizaron más de dos mil estudios sobre inteligencia artificial y COVID-19, todos realizados durante 2020. De todos ellos, descartaron aquellos estudios con mala calidad e imposibles de aplicar, dejando solo 62 estudios útiles para investigar.

El principal problema de los cientos de estudios descartados residía en la calidad de los datos que se usaban. Para que un modelo de aprendizaje funcione, necesita ser entrenado a partir de una base de datos previa. Es posible entrenar un modelo para que reconozca las manchas negras de las radiografías de los pulmones en pacientes con COVID-19, pero para hacerlo necesitan ser entrenados con miles de radiografías de pacientes con y sin COVID-19.

En la mayoría de estudios descartados, las bases de datos estaban incompletas y no eran realmente útiles. Por ejemplo, en uno de los estudios se usaban radiografías de niños como ejemplos de pacientes sin COVID-19, y radiografías de adultos enfermos como casos positivos. Un modelo entrenado con estas imágenes puede llegar a detectar la enfermedad, pero también acabará aprendiendo a distinguir entre adultos y niños.

Estas bases de datos incompletos pueden parecer chapuceras, pero era un mal necesario al comienzo de la pandemia. No había tantas imágenes de personas enfermas que pudieran usar, por lo que los investigadores aprovecharon lo que tenían delante. Además, esas bases de datos eran en muchos casos exclusivas del hospital, adaptadas para funcionar con una máquina de rayos X en concreto, y para un tipo exclusivo de paciente. No son modelos que puedan reconocer la enfermedad en diferentes hospitales del mundo, en pacientes de diferentes edades y géneros.

Resultados de segmentación automática de los pulmones e identificación de regiones de interés en paciente con covid-19.
Resultados de segmentación automática de los pulmones e identificación de regiones de interés en paciente con covid-19.UPM UPM

Tras esta primera criba, los investigadores solo se quedaron con 62 estudios suficientemente buenos como para darles una oportunidad y probarlos. Para comprobar si eran precisos en el diagnóstico de la enfermedad, usaron radiografías exclusivas de pacientes enfermos de un hospital cercano, que actuarían como simulacro del uso real. Lamentablemente, ningún modelo funcionó suficientemente bien.

Una esperanza a medio plazo

Un modelo capaz de predecir la COVID-19 solo es útil bajo una condición: ser capaz de superar al ojo humano. Salvo contadas excepciones, la vista humana sigue siendo más hábil a la hora de reconocer y distinguir imágenes que un modelo informático. Estos modelos pueden destacar si se necesitan reconocer muchas imágenes de golpe, pero en un hospital cada paciente cuenta. Reconocer una mancha en una radiografía y decidir un diagnóstico es suficientemente importante como para buscar la máxima precisión, y por ahora eso implica el ojo humano.

Por eso, este tipo de modelos dentro del ámbito médico tienen una función orientadora para el médico. Como si fuera un estudiante de primer año, los modelos pueden decir lo que ellos creen ver en la radiografía, y los médicos tienen la última palabra. Ninguno de los modelos analizados en el estudio tenían una precisión suficientemente alta para cumplir con esta labor, y en todos los casos el médico estaría corrigiendo al modelo más que siguiendo su consejo.

Además, los investigadores alertan de fallos en reconocer otras enfermedades parecidas. Las radiografías con manchas en los pulmones no siempre significan COVID-19, y como los modelos están entrenados para detectar de manera exclusiva esta enfermedad, pueden dar como positivo casos de neumonía no relacionados.

Puede que el año pasado no haya servido para crear una inteligencia artificial para diagnosticar la COVID-19, pero no tenemos motivo para ser pesimistas. Puede que los primeros estudios fueran falsos comienzos, pero está claro que los estudios de más calidad surgen a medida que avanza el tiempo. El objetivo de los investigadores no era atacar la investigación previa, sino indicar sus puntos débiles. Ahora la comunidad científica tiene los recursos para arreglarlos, y lograr ayudar a la sociedad.

QUE NO TE LA CUELEN:

  • Hay otras aplicaciones de Inteligencia Artificial que sí están triunfando dentro de la medicina, como el reconocimiento de células tumorales a partir de imágenes de microscópio. En este caso, la velocidad para poder comprobar muchas células al mismo tiempo merece tanto la pena que se puede sacrificar un poco la precisión. También la interpretación de señales cardíacas está siendo muy útil en las pulseras deportivas y en el diagnóstico de hospitales.

REFERENCIAS: