Aprendizaje

Sam, el niño que le enseñó a hablar a una IA

Entre los 6 y los 25 meses, se montó un casco en la cabeza del niño con el propósito de que la IA aprendiera igual que lo hace un bebe.

Inteligencia artificial
Sam, el protagonista de la historia, llevó este casco durante más de un año y medio.Wai Keen VongWai Keen Vong

Una de las bases de los sistemas de inteligencia artificial es el uso de grandes modelos de lenguaje o LLM por sus siglas en inglés. Bard o ChatGPT se basan en ellos para responder nuestras preguntas. La clave es cómo aprende una LLM a “hablar” como humano. Y la respuesta más lógica sería como lo hacemos nosotros, desde niños, de forma natural. Precisamente eso es lo que ha hecho un equipo de científicos: enseñarle a una IA a través de los ojos de un niño. Literalmente.

Entre el sexto y el noveno mes de vida, los bebes comienzan a adquirir los rudimentos del lenguaje oral y lo hacen vinculando las palabras con objetos y conceptos del mundo real. Para cuando tienen una edad de entre 1,5 y 2 años, la mayoría pueden comprender un promedio de 300 palabras. Sin embargo, el modo en que los niños adquirieron sus primeras palabras, pero se sabe muy poco del proceso de relación entre la palabra y el objeto que nombra. Comprender mejor este proceso facilitaría la evolución de los sistemas de IA.

Con este objetivo un equipo de científicos liderados por Wai Keen Vong, de la Universidad de Nueva York, fueron directamente a la fuente: colocaron una cámara en un casco y este último en la cabeza de un niño durante 1,5 años, entre los 6 y los 25 meses. El equipo de Vong entrenó entrenaron su modelo de IA (CVCL, siglas de Modelo de Visión del Niño para el Aprendizaje Contrastivo) con fotogramas de vídeo que representaban lo que el niño veía coincidiendo con expresiones lingüísticas dirigidas a él, es decir, lo que el niño escuchaba.

A partir de los datos recogidos, los autores señalan, en un estudio publicado en Science, que el modelo es capaz de aprender asociaciones basándose en la experiencia cotidiana del niño. Los resultados sugieren que la IA puede ayudarnos a comprender cómo aprendemos los humanos, al contrario de los modelos habituales que se entrenan con miles de millones de puntos de datos, “lo que no es comparable a las experiencias del mundo real de un bebé - explica Vong en un comunicado -. No nos dan Internet cuando nacemos".

El equipo de Vong utilizó en total 61 horas de grabaciones de la cámara montada en un pequeño llamado Sam quien llevó puesto el casco durante aproximadamente una hora dos veces por semana (el 1% de las horas que pasaba despierto). En total el modelo estuvo expuesto a 250.000 palabras y las imágenes correspondientes, capturadas durante actividades como jugar, leer y comer. El modelo utilizó una técnica llamada aprendizaje contrastivo para aprender qué imágenes y texto tienden a ir juntos y cuáles no, para generar información que pueda usarse para predecir a qué imágenes se refieren ciertas palabras.

Los resultados mostraron que la IA CVCL clasificó exitosamente el objeto el 62% de las veces, mucho mejor que el 25% esperado por casualidad, y comparable a un modelo de IA similar que fue entrenado en 400 millones de pares de imágenes y texto fuera de este conjunto de datos.

Por ejemplo, en casos como "manzana" o "perro", el modelo pudo identificar correctamente ejemplos nunca antes vistos, algo que a los humanos generalmente les resulta relativamente fácil. Eso sí, no todos fueron éxitos. La IA tuvo dificultades para aprender la palabra “mano”, por ejemplo, que normalmente se aprende temprano en la vida de un bebé, según los autores.

"Demostramos, por primera vez, que una red neuronal entrenada con esta información puede aprender a vincular palabras con sus contrapartes visuales – añade Vong -. Nuestros resultados demuestran cómo los avances algorítmicos recientes, combinados con la experiencia naturalista de un niño, tienen el potencial de remodelar nuestra comprensión del lenguaje temprano y la adquisición de conceptos".

Un elemento importante a tener en cuenta es que el estudio se basa en datos de un solo niño y que habla en inglés. Se necesitan más pruebas y con diferentes idiomas para confirmar y ampliar los resultados.