Inteligencia artificial

ChatGPT ha quedado en segunda posición en un campeonato de pilotaje de naves especiales

Los retos para los equipos de trabajo detrás de modelos de lenguaje se pueden presentar incluso en forma de concurso de un ámbito que, a priori, no es su foco de investigación

El futuro de ChatGPT podría apuntar también al espacio
El futuro de ChatGPT podría apuntar también al espacioBlue Origin EFE

Las capacidades que pueden alcanzar los modelos de lenguaje son todavía una incógnita, pero lo cierto es que su evolución continúa marcando una tendencia notable hacia resolver todo tipo de cuestiones. Bien es cierto que existen de vez en cuando reportan comportamientos erráticos de modelos conversacionales como ChatGPT, pero su fiabilidad sigue al alza.

Tan importantes son los pasos dados por modelos como ChatGPT que incluso se atreve a participar en concursos de disciplinas tan específicas como el pilotaje de naves espaciales. Y no solo eso, sino que ha logrado quedar subcampeón.

Un segundo puesto con sabor a triunfo

Esto sucedió en el desafío Kerbal Space Program Differential Games tal como recoge la publicación Science Direct, una competición pública de diseño de software en la que los equipos participantes deben generar agentes autónomos para maniobrar satélites que participan en operaciones espaciales no cooperativas, ejecutándose en el motor de juego Kerbal Space Program (KSP).

No sabemos si el objetivo de OpenAI ha sido nunca la conducción de naves autónomas o si vieron el concurso más como un reto y para ver hasta dónde podían llegar con su modelo de lenguaje, pero la prueba no parece haber ido nada mal. El equipo seleccionado de la estructura de ChatGPT decidió “formar” al modelo de lenguaje en una tarea tan específica como la que requería el concurso para saber cuál podía ser su desempeño.

Entre las bases del concurso, KSP había señalado una especie de guía sobre la que los participantes podían basar su preparación: "Se anima a los participantes a utilizar diversas tecnologías (aprendizaje por refuerzo, control óptimo, técnicas de teoría de juegos, etc.) para desarrollar algoritmos de control autónomo de naves espaciales".

Aun con esa recomendación, el equipo detrás de ChatGPT valoró que el aprendizaje por refuerzo no sería una opción para este tipo de prueba y abogó por un sistema para traducir los datos de telemetría del juego a un lenguaje que los modelos de lenguaje como ChatGPT pueden descifrar y utilizar para tomar decisiones.

En este caso, las limitaciones aritméticas del modelo de lenguaje jugaron ligeramente en su contra y obligaron al equipo de trabajo a recalcular su estrategia sobre la marcha para obtener esa segunda posición.

La prueba, no obstante, sirvió al entorno de trabajo de ChatGPT para tomar nota de las necesidades de su modelo de lenguaje para interpretar situaciones similares y ser conscientes de que, tal vez, de no haber descartado el aprendizaje de refuerzo y haberlo integrado en su estrategia, su posición habría sido otra. Habrá que estar atentos al siguiente concurso al que destinen al chatbot de OpenAI para ver si se hace con la medalla de oro.