Inteligencia artificial

Strawberry, el proyecto secreto de OpenAI que alcanza el nivel 2 de inteligencia artificial

Strawberry tiene capacidades de razonamiento significativamente más avanzadas que los chatbots disponibles actualmente, según desvela Reuters

Strawberry, el proyecto secreto que OpenAI está desarrollando y alcanza el nivel 2 de inteligencia artificial.
Strawberry, el proyecto secreto que OpenAI está desarrollando y alcanza el nivel 2 de inteligencia artificial.Alfredo Biurrun / DALL-E.

La semana pasada, OpenAI explicó los cinco niveles de IA que considera hay en el camino hacia una inteligencia artificial general. El nivel 1, el más bajo, son los chatbots que actualmente conocemos y de los que ChatGPT es el mejor ejemplo. El nivel 2, son los llamados 'razonadores' que pueden resolver problemas a nivel humano y esto es lo que parece que la compañía está a punto de alcanzar. Según publicó entonces Bloomberg, OpenAI ya ha realizado presentaciones internas en las que ha mostrado una IA con habilidades de razonamiento similares a las humanas. Por otro lado, Reuters ha publicado este lunes que la compañía cuenta con un proyecto secreto llamado Strawberry, aún en desarrollo, con capacidades de razonamiento significativamente más avanzadas.

La información sobre el proyecto es bastante vaga y no necesariamente ambas informaciones corresponden al mismo modelo de IA, sino que podrían ser desarrollos diferentes. De hecho, Strawberry, fresa en inglés, no sería tanto una IA en sí misma, tal y como entendemos a ChatGPT o a Gemini, sino una tecnología de razonamiento que mejora otros modelos.

Según documentos y una variedad de fuentes internas consultadas por Reuters, Strawberry quiere ir más allá de la IA que simplemente genera respuestas a consultas y puede planificar con anticipación y navegar por Internet de forma autónoma, sin intervención humana, para realizar lo que la compañía denomina 'investigación profunda'.

'Queremos que nuestros modelos de IA vean y comprendan el mundo más como nosotros. La investigación continua en nuevas capacidades de IA es una práctica común en la industria, con la creencia compartida de que estos sistemas mejorarán en razonamiento con el tiempo', ha señalado un portavoz de OpenAI al medio.

El funcionamiento de Strawberry es un secreto muy bien guardado incluso dentro de OpenAI. Es el proyecto anteriormente conocido como Q*, que fue desvelado el pasado noviembre y que se barajó como una de las causas de las diferencias entre la junta directiva de la compañía y su CEO, Sam Altman, quien fue brevemente despedido entonces.

Hace 9 meses Q* ya era capaz de responder preguntas complicadas de ciencia y matemáticas que los modelos disponibles comercialmente no pueden alcanzar. Más recientemente, OpenAI ha probado internamente una IA que logrado un resultado del 90% en las pruebas MATH. Estas son un conjunto de problemas matemáticos que se utiliza como referencia para evaluar las capacidades de los modelos de inteligencia artificial en la resolución de problemas de matemáticas de nivel avanzado. Reuters no ha podido precisar si se trata de Strawberry o un proyecto diferente.

OpenAI espera que Strawberry mejore drásticamente las capacidades de razonamiento de sus modelos de inteligencia artificial e implica una forma especializada de procesar un modelo de IA después de que haya sido entrenado con conjuntos de datos. Se trata de un 'entrenamiento posterior' que tiene similitudes con el método STaR, siglas de Self-Taught Reasoner o Razonador autodidacta, desarrollado en la Universidad de Stanford en 2022.

STaR permite a los modelos de IA 'auto-instruirse' para alcanzar niveles de inteligencia superiores mediante la creación iterativa de sus propios datos de entrenamiento y en teoría podría ser utilizado para que los modelos de lenguaje trasciendan la inteligencia a nivel humano, según el profesor Noah Goodman, uno de los creadores de este método.

Otra de las capacidades de Strawberry es que puede realizar lo que la compañía llama tareas de horizonte largo, LHT por sus siglas en inglés. Es decir, tareas complejas que requieren que un modelo planifique con anticipación y realice una serie de acciones durante un período prolongado de tiempo. Para conseguirlo, OpenAI lo está entrenando con un conjunto de datos de 'investigación profunda', según la documentación interna.