Mark Chen, jefe de investigación de OpenAI, devuelve la esperanza a los defensores de ChatGPT: "Tenemos modelos internamente que rinden al nivel de Gemini 3"

Con resultados de benchmarks internos en la mano, Chen afirma que las pruebas efectuadas sobre evoluciones de ChatGPT 5 sitúan sus modelos al mismo nivel que el más reciente de Google

La carrera por la IA se acelera: el último movimiento de Altman sacude a Google, Anthropic y al resto del sector
ChatGPT continúa su evolución y OpenAI presenta su versión GPT-5.1: más conversacional y con mayor personalidad

Mark Chen, jefe de investigación de OpenAI, durante su entrevista para Core MemoryYouTube

Roberto Ugarte
Roberto Ugarte

Creada: 05.12.2025 16:00

Última actualización: 05.12.2025 16:00

Hace poco más de dos semanas que Google hizo pública la nueva y evolucionada versión de su modelo de inteligencia artificial, Gemini 3. Los resultados de los bancos de pruebas a los que se someten a este tipo de modelos para evaluar su rendimiento situaron a la compañía que preside Sundar Pichai por encima de la competencia, rompiendo el estatus que tenía a OpenAI y ChatGPT en la cima de la inteligencia artificial.

Bien es cierto que los últimos meses no han sido sencillos para la empresa tecnológica que lidera Sam Altman. A las críticas recibidas tras el lanzamiento de GPT-5 y el revuelo que ha levantado recientemente la idea de incluir anuncios en la aplicación de su agente de inteligencia artificial ha tenido que sumar los comentarios, cada vez más crecientes, acerca de una burbuja en torno a la IA.

Pese a todo ello, OpenAI no cesa en su empeño en comandar un sector en el que la competencia es feroz y trabaja en la línea de perfeccionar la versión más reciente de su modelo, que viera la luz en agosto. Y en esa dirección, el jefe de investigación de OpenAI, Mark Chen, ha dejado caer que el trabajo detrás de la siguiente versión de ChatGPT les permite ser optimistas.

ChatGPT no se rinde y tiene en su punto de mira a Gemini 3

Chen acudió al pódcast Core Memory que dirige y presenta el periodista Ashlee Vance. Con una experiencia destacada en medios como The New York Times y The Economist, Vance ha centrado buena parte de su carrera en informar sobre actualidad tecnológica. Durante la conversación, el jefe de investigación de OpenAI ensalzó lo logrado por Google con Gemini 3, si bien destacó que ChatGPT puede estar cerca de ir un paso más allá que dicho modelo:

“Tenemos modelos internamente que rinden al nivel de Gemini 3 y estamos bastante seguros de que los lanzaremos pronto y podemos lanzar modelos sucesores que son incluso mejores”
Mark Chen, investigador jefe de OpenAI, en el pódcast Core Memory de Ashlee Vance

Antes de sus lanzamientos, los distintos modelos pasan el examen de los bancos de prueba o benchmarks. De sus resultados, se puede extraer una idea de la mejoría de capacidades del asistente en cuestión, aunque Mark Chen quiso relativizar en parte ese tipo de resultados: “Creo que una de las cosas que hacemos es tratar de crear consenso; los puntos de referencia por sí solos revelan una parte de la información y creo que cada uno prueba los modelos a su manera”, señaló apuntando a cierta limitación en la información que trasladan.

Para Chen, hay una prueba en forma de problema matemático que resulta todavía más determinante que los resultados de los benchmarks, si bien y como él mismo reconoció, todavía ningún modelo, ni en su modo de razonamiento más ampliado, ha sido capaz de solucionarlo: “Existe ese problema matemático que me gusta plantear a los modelos, y creo que hasta ahora ninguno lo ha resuelto del todo, ni siquiera los modelos de pensamiento.”

Por tanto, a tenor de las palabras del jefe de investigación de OpenAI, la compañía detrás de ChatGPT continúa enfocada en devolver a su agente a esa posición de referencia que ha mantenido en los últimos tiempos en el universo de la inteligencia artificial y que Google, con Gemini 3, ha logrado amenazar.

Accede a tu cuenta para comentar

Client Challenge

JavaScript is disabled in your browser.

Please enable JavaScript to proceed.

A required part of this site couldn’t load. This may be due to a browser extension, network issues, or browser settings. Please check your connection, disable any ad blockers, or try using a different browser.