Inteligencia artificial

OpenAI anuncia DALL-E 3 y su integración con ChatGPT Plus y Enterprise

La nueva versión de esta inteligencia artificial generativa de texto a imagen estará disponible en octubre

OpenAI anuncia DALL-3 y su integración con ChatGPT Plus y Enterprise.
OpenAI anuncia DALL-3 y su integración con ChatGPT Plus y Enterprise.OpenAI.

ChatGPT es la IA generativa más conocida de OpenAI, pero no la única. Antes de la llegada del popular chatbot el pasado noviembre, la compañía de Sam Altman ya estaba en boca de todos con DALL-E, su herramienta para generar imágenes a partir de texto. La primera versión llegó en enero de 2021 y DALL-E 2, ya muy mejorada frente a la anterior, lo hizo en abril del año pasado. Desde entonces se ha visto superada por sus dos principales competidores, Stable Diffusion y Midjourney y parecía que OpenAI se estaba quedando atrás en el campo de los modelos de texto a imagen. Tras el anuncio de DALL-E 3, la situación se ha invertido.

Imagen generada con DALL-E 3.
Imagen generada con DALL-E 3.OpenAI.

Según la compañía, el nuevo DALL-E “entiende muchos más matices y detalles que nuestros sistemas anteriores” y permite “traducir fácilmente sus ideas en imágenes excepcionalmente precisas”. En las imágenes de ejemplo facilitadas por la compañía se pueden apreciar resultados equiparables a los que ofrecen otras IA, pero el mayor avance no es la clara mejora en los resultados sino en el cómo conseguirlos.

DALL-E 3 no será un modelo de lenguaje al que se puede acceder de forma independiente como su predecesor, sino que está construido de forma nativa en ChatGPT. Es a través del chatbot como se podrá usar y esta integración le permite a OpenAI simplificar una de las principales barreras que enfrentan los usuarios con este tipo de herramientas: la ingeniería de prompts.

Un prompt es la descripción en texto que se entrega a la IA de la imagen que se quiere conseguir. Dominar la forma de comunicarse con estas herramientas y obtener los mejores resultados, que a menudo requiere de un lenguaje técnico, es la mencionada ingeniería de prompts, un perfil profesional que este año se ha convertido en demandado por el auge de las herramientas de inteligencia artificial. Sin embargo, con DALL-E 3 un usuario podrá entenderse con la herramienta en un lenguaje completamente natural gracias a ChatGPT y convertir a éste en su ingeniero de prompts personal.

El mismo prompt en DALL-E 2 (izq.) y DALL-E3 (der.).
El mismo prompt en DALL-E 2 (izq.) y DALL-E3 (der.).OpenAI.

Bastará con que proponga una idea para que ChatGPT le facilite prompts “personalizados y detallados” que pueda utilizar y genere las imágenes inmediatamente. Definirlos más o añadir matices y cambios no requerirán instrucciones complicadas sino que ChatGPT se encargará de transformar las ideas del usuario en los prompts más adecuados para conseguir un determinado resultado. Si DALL-E 3 reduce significativamente la complejidad de uso de estas herramientas, se habrá situado varios pasos por delante de sus rivales.

Imagen generada con DALL-E 3.
Imagen generada con DALL-E 3.OpenAI.

Entre las salvaguardas del sistema para evitar la generación de imágenes que puedan ser problemáticas se encuentra la imposibilidad de generar imágenes de personalidades públicas introduciendo el nombre en la IA. Tampoco admitirá peticiones para crear imágenes en el estilo de un determinado artista si está vivo. Además, los creadores ya pueden pedir a OpenAI que no utilice sus imágenes para el entrenamiento de “futuros modelos de generación de imágenes”.

Al contrario que DALL-E 2, la nueva versión será de pago, al menos inicialmente. Sólo se podrá usar si eres suscriptor de ChatGPT Plus, la modalidad de pago del chatbot, o de ChatGPT Enterprise, la versión de esta IA diseñada para empresas, desde el próximo mes de octubre.