Inteligencia artificial

La IA que usa la ESA para estudiar el planeta ahora es accesible para todos

Se trata de TerraMind, el modelo más eficaz para la observación de la Tierra

Cartografia/Inteligencia artificial
TerraMind ha sido entrenada con medio billón de datosIBM/ESAIBM/ESA

¿Qué información necesitaría un modelo de IA para comprender realmente nuestro planeta? Esa es la pregunta a la que se han propuesto responder este año investigadores de IBM, ESA, KP Labs, Julich Supercomputing Center (JSC) y la Agencia Espacial Alemana (DLR) en el marco de una iniciativa liderada por la ESA para mejorar el acceso a los modelos fundacionales dentro de la comunidad de observación de la Tierra.

Por eso, IBM y la ESA han presentado hoy TerraMind, un nuevo modelo de observación de la Tierra que el grupo ha publicado en código abierto en HuggingFace. Se trata del conjunto de datos geoespaciales más grande hasta la fecha.

A pesar de haber sido entrenado con 500.000 millones de tokens (unidad básica de texto que un modelo de IA utiliza para comprender y procesar información.), TerraMind es un modelo pequeño y ligero, que utiliza 10 veces menos recursos informáticos que el uso de modelos estándar para cada modalidad. Esto significa que los usuarios pueden implementarlo a escala con un coste menor, al tiempo que reducen el consumo total de energía en la etapa de inferencia.

“Para mí, lo que realmente distingue a TerraMind es su capacidad para ir más allá del procesamiento de imágenes satelitales con algoritmos de visión artificial. Tiene una comprensión intuitiva de los datos geoespaciales y de nuestro planeta - confirma Juan Bernabé-Moreno, director de IBM Research en Reino Unido e Irlanda -. En la actualidad, TerraMind es el modelo fundacional de IA con mejor rendimiento para la observación de la Tierra según los puntos de referencia que establece la comunidad”.

En una evaluación de la ESA, TerraMind se comparó con 12 modelos populares de observación de la Tierra. La evaluación mostró que TerraMind superaba a otros modelos en estas tareas en un 8% o más.

TerraMind combina información de varias modalidades de datos de entrenamiento para aumentar la precisión de sus resultados – afirma Simonetta Cheli, directora de Programas de Observación de la Tierra de la ESA y responsable de ESRIN -. Su capacidad para integrar de forma intiutiva información contextual y generar escenarios nunca antes vistos es un paso fundamental para desbloquear el valor de los datos de la ESA”.

En la práctica, para predecir el riesgo de escasez de agua, por ejemplo, los científicos deben tener en cuenta muchos factores diferentes, como el uso del suelo, el clima, la vegetación, las actividades agrícolas y la ubicación. Antes de TerraMind, todos estos datos estaban dispersos y almacenados por separado. Reunir esta información permite a los usuarios hacer predicciones más precisas sobre el riesgo potencial de escasez de agua basándose en una visión más amplia de las condiciones en la Tierra.

El conjunto de datos que maneja TerraMind incluye 9 millones de muestras de datos distribuidas globalmente, alineadas espacio-temporalmente en nueve modalidades principales: observaciones realizadas por sensores en satélites, la geomorfología de la superficie de la Tierra, las características de la superficie que son importantes para la vida en la Tierra (vegetación y uso del suelo) y descripciones básicas de ubicaciones y sus características (latitud, longitud y descripciones de texto sencillas).

“Con la ciencia y la tecnología de observación de la Tierra y la colaboración internacional, estamos liberando todo el potencial de los datos espaciales para proteger nuestro planeta – señala Nicolas Longepe, científico de datos de Observación de la Tierra de la ESA -. Este proyecto es un ejemplo perfecto en el que la comunidad científica, las grandes empresas tecnológicas y los expertos han colaborado para aprovechar esta tecnología en beneficio de las ciencias de la Tierra. La magia ocurre cuando se unen expertos en datos de observación de la Tierra, expertos en aprendizaje automático, científicos de datos e ingenieros de HPC”.