Inteligencia artificial

OpenAI anuncia GPT-4, el sucesor de ChatGPT que ya puedes usar en Bing

Microsoft ha revelado que una versión preliminar de GPT-4 ha estado detrás del nuevo Bing con IA desde su lanzamiento el mes pasado

GPT-4 es multimodal y admite datos de entrada en forma de texto e imagen.
GPT-4 es multimodal y admite datos de entrada en forma de texto e imagen. OpenAI.

OpenAI, la compañía que ha desarrollado la inteligencia artificial generativa ChatGPT, ha anunciado el lanzamiento de su nuevo modelo de lenguaje. GPT-4 sucede a GPT-3.5 y, sorprendentemente, mientras que los usuarios de pago de ChatGPT podrán acceder de forma progresiva a las nuevas características de la IA, los del buscador Bing ya lo han estado haciendo desde que Microsoft incorporó las funciones de la inteligencia artificial el mes pasado.

GPT o Generative Pre-trained Transformer es un modelo de lenguaje cuya primera versión fue lanzada en 2018. Le siguió GPT-2 en 2019 y GPT-3 en 2020. Estos modelos de lenguaje se entrenan con enormes bases de datos de texto provenientes de Internet, en busca de patrones estadísticos que después emplean para generar respuestas escritas prediciendo qué palabra sigue a otra.

El nuevo GPT-4 ha sido entrenado con un conjunto de datos mucho mayor que su predecesor y es, por primera vez, multimodal. Es decir, ahora admite como información de entrada no solo texto escrito sino también imágenes, pero sus respuestas siguen siendo exclusivamente en texto.

Por ejemplo, puede entender y explicar el sentido de un meme u otro tipo de imagen. Este entrenamiento se ha llevado a cabo usando la infraestructura en la nube Azure de Microsoft y una red de computadoras con miles de chips A100 de Nvidia.

Open AI ha explicado en una publicación en su blog que las diferencias con GPT-3.5 pueden ser “sutiles” en una conversación casual, pero su rendimiento es significativamente mejor en los test realizados. En comparación con la versión anterior, GPT-4 ha reducido en un 82% la probabilidad de responder con contenido no permitido y ha aumentado en un 40% la de hacerlo con respuestas verídicas.

El desarrollador también ha anunciado que ya está colaborando con una serie de socios para integrar GPT-4 en sus productos (entre ellos, Duolingo, Stripe y Khan Academy) y también ha abierto una lista de espera para acceder a la API de GPT-4 que permite la integración de la inteligencia artificial de OpenAI con otros servicios.

Con el lanzamiento de ChatGPT con GPT-3.5 el pasado noviembre, OpenAI marcó un hito con una IA capaz de generar una amplia variedad de contenidos en texto de forma solvente, a pesar de los errores y de la tendencia a lo que se conoce como “alucinar” generando respuestas que pueden llegar a ser desvaríos en ocasiones.

El buscador Bing con GPT-4.
El buscador Bing con GPT-4.Microsoft.

Desde entonces, ChatGPT se ha convertido en la app de consumo que más rápido ha alcanzado los 100 millones de usuarios, Microsoft ha reforzado su inversión en Open AI y ha incorporado las funciones de Chat GPT a su buscador Bing, lo que ha permitido alcanzar los cien millones de usuarios diarios por primera vez en sus 13 años de historia.

Microsoft explicó que empleaba una versión de GPT más avanzada que la de ChatGPT denominada Prometheus y cuya principal diferencia era la capacidad de consultar la información en Internet en tiempo real, algo que no podía hacer ChatGPT cuyo entrenamiento se limita a datos anteriores a 2022. Lo que hoy se ha sabido con el anuncio de OpenAI es que Prometheus era GPT-4 y los usuarios han estado utilizándolo desde entonces, aunque no con todas sus características como ahora se ha sabido.

OpenAI ha querido calmar las expectativas sobre la nueva versión de ChatGPT. En una reciente entrevista con el medio The Verge, el CEO de OpenAI Sam Altman comentaba que “la gente está suplicando ser decepcionada y lo estará. La expectación es como… no tenemos un inteligencia artificial general real y eso es, más o menos, lo que se espera de nosotros”.

Aunque el nuevo GPT es capaz de interpretar datos de entrada más complejos, generar mejores respuestas escritas, traducciones o código, es más creativa y alucina “significativamente menos”, continúa teniendo “fallos y limitaciones”, ha explicado Altman.