Australia

Pregunte a su ordenador si cabe una jirafa en un coche

Jirafas en Sudáfrica
Jirafas en Sudáfricalarazon

¿Cabría una jirafa en un coche? Cualquier persona podría contestar sin necesidad de pensar demasiado o estudiarlo con antelación. Atendiendo al sentido común la respuesta sería negativa, dada la voluminosa masa corporal del animal.

Los humanos toman decisiones como esta constantemente usando supuestos tácitos, algo para lo que los ordenadores no están capacitados. De hecho, las personas pueden responder rápidamente a preguntas que una máquina tardaría años en averiguar. Es lo que podría definirse como el Santo Grial de la computación, conseguir una máquina capaz de pensar por sí misma utilizando en cierta forma el sentido común.

Un equipo de investigadores de la Universidad Carnegie Mellon, en Estados Unidos, ha dado un paso importante en este campo de la Inteligencia Artificial (IA), al permitir que un sistema de computación masiva navegue por millones de imágenes y sea capaz de decidir por sí mismo qué significan, informa Tendencias 21.

Esto es posible gracias a NEIL, siglas en inglés de Never Ending Image Learner, que se podría traducir como el Eterno aprendiz de imágenes. Según explica la Universidad en un comunicado, el sistema informático comenzó a mediados de julio la búsqueda de imágenes en Internet, tarea a la que dedica las 24 horas del día, los siete días de la semana.

A través de pequeños pasos, el programa debe decidir cómo se relacionan entre sí los tres millones de imágenes que ha analizado desde sus inicios. El objetivo es recrear ese sentido común inherente al ser humano, la capacidad de aprender sin necesidad de una enseñanza específica.

Los resultados del proyecto, que cuenta con la financiación del Departamento de Defensa e Investigación Naval de Estados Unidos y Google, se darán a conocer la próxima semana en la Conferencia Internacional IEEE de Visión Artificial en Sydney, Australia.

Visión artificial

NEIL aprovecha los últimos avances en visión artificial, subcampo de la IA que permite a los programas de ordenador identificar y etiquetar objetos en las imágenes. En este caso se usa para caracterizar escenas y reconocer atributos como los colores, las formas, la iluminación o los materiales; todo ello con un mínimo de supervisión humana. Los datos generados aumentan aún más la capacidad de las computadoras para comprender el mundo visual.

Al mismo tiempo, el programa descubre poco a poco asociaciones y conexiones entre los objetos, como que los coches suelen estar en la carretera, que los edificios tienden a ser verticales o que los patos son similares a los gansos. Así, mientras por referencias textuales podría parecer que el color asociado con las ovejas es el negro, la gente -y NEIL- saben que por lo general son de color blanco.

"Las imágenes son la mejor herramienta para aprender propiedades visuales", destaca Abhinav Gupta, profesor en el Instituto de Robótica de Carnegie Mellon. "Estas incluyen mucha información de sentido común que la gente aprende por sí misma, pero con NEIL esperamos que los ordenadores hagan lo mismo", augura.

El proyecto se lleva a cabo en dos equipos de computadoras que incluyen hasta 200 núcleos de procesamiento. En poco más de cuatro meses los resultados no podían ser mejores, pues la red ha logrado identificar 1.500 objetos y 1.200 escenas, creando además 2.500 asociaciones. El sistema es incluso capaz de desarrollar subcategorías de objetos, ordenando por ejemplo los coches en función de una variedad de marcas y modelos.

De esta forma se cumple una de las principales motivaciones de los investigadores, crear la mayor base de datos visual estructurada del mundo, con objetos, escenas, acciones, atributos y relaciones contextuales etiquetadas y catalogadas, de la forma más autónoma posible.

Bajo supervisión

Sin embargo, la revisión humana siempre es conveniente. De hecho, se han registrado asociaciones erróneas, como cuando el sistema relacionó al rinoceronte con una especie de antílope, y otras un tanto extrañas como "un actor puede encontrarse en la celda de una cárcel"o "un presentador de noticias puede ser similar a Barack Obama".

"Las personas no siempre saben cómo o qué enseñar a las computadoras", observó Abhinav Shrivastava, estudiante de robótica miembro del equipo. "Pero sí son buenas para decirles cuándo se equivocan".

En un artículo publicado en la web Phys.org, Gupta asegura que entrenar un ordenador para crear sus propias asociaciones es un tipo de desafío totalmente diferente a programar un superordenador para hacer una cosa muy bien, o de forma rápida. Por ejemplo, en 1985, los investigadores de Carnegie Mellon programaron un ordenador para jugar al ajedrez; 12 años más tarde, el equipo venció al campeón mundial de ajedrez Garry Kasparov en una partida.

Pero si algo tienen claro en esta investigación, según Gupta, es que "cuanto más datos se tenga, mejores resultados", aseveración fruto de 10 años de trabajo en visión artificial. De momento la red de computación masiva sigue trabajando día y noche con imágenes, pero en el futuro NEIL dará el salto a Youtube, analizando vídeos para buscar conexiones entre objetos.

"Cuando empezamos el estudio no estábamos seguros de que pudiera funcionar", recuerda el profesor. "Esto es sólo el principio". De hecho, el lema de NEIL es "avanzo lentamente, veo y aprendo", algo que los investigadores esperan poder mantener por mucho tiempo.

Más información en la web Tendencias 21