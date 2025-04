Los usuarios están encontrando usos sorprendentes de las nuevas capacidades de generación de imágenes de ChatGPT muy rápido. La semana pasada, OpenAI actualizó el modelo de lenguaje GPT-4o incluyendo la capacidad de crear imágenes de forma nativa, en lugar de recurrir a un segundo LLM para esta tarea como venía haciendo hasta ahora con DALL-E 3. Resulta que el nuevo generador de imágenes supera al anterior en varios aspectos y, si la primera tendencia que ha propiciado ha sido la ‘ghiblilizar’ imágenes, ahora tenemos otra con implicaciones mucho más serias: crear reproducciones realistas de recibos y tickets de compra que contengan la información que el usuario decida.

Las capacidades de imagen de GPT-4o destacan por poder reproducir correctamente texto, algo que ha sido un problema para las inteligencias artificiales generativas de texto a imagen hasta ahora, tanto como lo fueron las manos hasta 2024. Veamos un ejemplo.

I think in the original image the letters are too perfect and they don’t bend with the paper. They look like hovering above the paper. Here is my attempt to make it more realistic. Let me know what you think. pic.twitter.com/EixRSHubeY