Inteligencia Artificial

China ha desarrollado un modelo de IA más avanzado que ChatGPT

Bilingüe y más avanzado que ChatGPT en algunos aspectos

Un chip semiconductor
En apenas un año China ha lanzado 100 modelos de IALIM HUEY TENGREUTERS

ChatGPT se ha convertido rápidamente en la referencia en lo que a modelos de IA respecta, Al menos en Occidente. Pero a medida que se intensifica la competencia entre los grandes modelos de lenguaje (LLM por sus siglas en inglés), comenzamos a descubrir que el modelo de Open AI podría tener una seria competencia en China, en particular un programa conocido como ChatGLM, un chatbot que se acerca a ChatGPT en algunas capacidades y lo supera en chino, según sus desarrolladores.

“Básicamente, ChatGLM es una alternativa a ChatGPT”, explica Jie Tang, científico informático de la Universidad Tsinghua en Beijing, durante una charla en la que presentó las capacidades de ChatGLM en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR 2024). ChatGPT, al igual que la mayoría de los modelos similares, puede responder en una variedad de idiomas, pero están creados por empresas estadounidenses y utilizan el inglés como idioma principal. Por el contrario, ChatGLM es bilingüe y está diseñado para funcionar en chino e inglés.

La Universidad de Tsinghua y su empresa derivada Zhipu AI, valorada en más de 2 mil millones de dólares, según Tang, desarrollaron ChatGLM y el modelo subyacente GLM, que significa Modelo de Lenguaje General. Más de 700 investigadores e ingenieros de Zhipu AI y alrededor de 100 estudiantes de la Universidad de Tsinghua están trabajando en modelos de lenguaje de IA.

Un motivo para centrarse en el avance de China es que ChatGPT no está disponible en este país. Pero esa no es la única razón para construir alternativas locales. Los LLM orientados a China producen resultados que reflejan mejor las necesidades y preferencias de los habitantes del país, afirma Tang, incluida, por ejemplo, información financiera o educativa específica de cada país.

Este experto compara su programa con entrenar un modelo de lenguaje en una aplicación de redes sociales china en lugar de una occidental. "Básicamente, WeChat sabe más sobre la gente de China que Snapchat – añade Tang -. Los modelos que se adaptan a diferentes idiomas evitan simplificar demasiado o descuidar las características específicas de ciertos idiomas y culturas”.

En ICLR 2024, los responsables de Chat GLM compartieron datos que afirman que la versión de mayor rendimiento del modelo subyacente de ChatGLM, GLM-4, se encuentra dentro del 90% de las puntuaciones logradas por GPT-4 de OpenAI en varios puntos de referencia. Entre ellos se incluyen pruebas de conocimientos generales, sentido común y matemáticas. ChatGLM también supera a GPT-4 en un punto de referencia de optimización de LLM en chino.

A esto hay que sumarle que en China se están desarrollando decenas de otros LLM: solo en 2023 se hicieron públicos más de 100 modelos de lenguaje de IA. Gigantes tecnológicos como Baidu o Alibaba tienen sus propios chatbots de inteligencia artificial, por ejemplo.

Para dotar a los sistemas de IA de capacidades a nivel humano cuando se trata de una amplia gama de tareas (un hito conocido como inteligencia artificial general o AGI) será necesario que estén incorporados en el mundo. ¿Podría ChatGLM ser el primer sistema de inteligencia artificial en lograr AGI? “No tengo idea – concluye Tang-. Espero que seamos los primeros, pero estamos compitiendo con todos los demás”.

La siguiente pregunta obvia entonces es cuan cerca están los científicos informáticos del desarrollo de un modelo AGI y si conseguir este avance es algo deseable. Ese es uno de los mayores dilemas a los que nos enfrentamos.