Tecnología

ChatGPT en WhatsApp ya es multimodal: qué significa esta nueva capacidad

La IA de OpenAI acerca la experiencia de usuario en WhatsApp a la que se obtiene en su propia app o vía web

Este es el importante cambio que llega a los estados de WhatsApp.
ChatGPT en WhatsApp ya es multimodal: qué significa esta nueva capacidad.LoboStudioHamburg.Pixabay.

ChatGPT en WhatsApp va dando pasos para equipararse a otras formas de interactuar con la IA de OpenAI. El popular chatbot llegó a la aplicación de mensajería más popular del mundo el pasado diciembre, poniéndolo al alcance de sus más de 2.000 millones de usuarios de la forma más cómoda posible. OpenAI ha actualizado la versión de ChatGPT en WhatsApp, convirtiéndolo en multimodal, una característica que ya estaba disponible para los usuarios que acceden a esta IA a través de su app, web o servicios de terceros como Copilot, que emplean los modelos de lenguaje de OpenAI, de Microsoft.

¿Qué es una IA multimodal?

Cuando se dice que una inteligencia artificial es multimodal significa que es capaz de entender distintos tipos de entrada de información y también generarla. Es decir, cuando la forma que tiene el usuario de interactuar con ella no es solo a través de texto y sus respuestas no son solamente escritas. No tienen que darse ambas funcionalidades, basta con una de ellas para considerarla multimodal, como es el caso de ChatGPT en WhatsApp.

El chatbot de OpenAI en la app de Meta es multimodal con la información de entrada del usuario. Ahora, además de escribirle, puedes enviarle notas de voz y también imágenes. En el primer caso, te responderá por escrito a lo que hayas planteado en la nota de voz, de forma que puedes comunicarte hablando con ChatGPT, aunque las respuestas seguirán siendo escritas, por el momento.

En el segundo, puedes subir imágenes al chat con ChatGPT, que la IA es capaz de analizar, identificar su contenido y conversar sobre el mismo. Por ejemplo, si necesitas saber qué objeto o lugar aparece en una imagen, la IA te lo dirá con preguntarla y podrás obtener más información.

Con esta actualización, ChatGPT en WhatsApp gana en versatilidad y se acerca más a la experiencia que obtienen los usuarios de cuentas gratuitas a través de la app y la web.

Ventajas y limitaciones de ChatGPT en WhatsApp

ChatGPT en WhatsApp utiliza el modelo de lenguaje GPT-4o mini de OpenAI, que llegó a la app y la web del chatbot en julio de 2024, primero para los usuarios de pago. Actualmente, es el GPT predeterminado para los usuarios de cuentas gratuitas de OpenAI, junto con o3-mini para la función Razona. Sin embargo, GPT-4o mini no exhibe las mismas capacidades que cuando se usa directamente en los productos de OpenAI.

Ventajas de usar ChatGPT en WhatsApp

  • Acceso directo desde WhatsApp sin necesidad de instalar una aplicación adicional.
  • Emplea un modelo de lenguaje reciente de OpenAI, GPT-4o mini.
  • Multitud de idiomas.
  • Capacidad para procesar notas de voz y convertirlas en texto.
  • Análisis e interpretación de imágenes enviadas.
  • Puedes llamar por teléfono y hablar con la IA, en español.

Desventajas de ChatGPT en WhatsApp

  • No puede buscar información en internet en tiempo real.
  • No puede resumir audios largos, de más de un minuto.
  • Responde solo con texto, sin capacidad de conversación por voz.
  • Información limitada hasta septiembre de 2021.
  • No puede procesar otros tipos de archivos multimedia además de imágenes y notas de voz.
  • No puede generar imágenes.
  • Límites de uso de mensajes por día, pero estos son variables y dependen de la demanda del servicio.
  • Las llamadas a ChatGPT están limitadas a 15 minutos por mes y para Estados Unidos, pero admite llamadas desde otros países a través de Skype.

Cómo tener ChatGPT en WhatsApp

Para tener ChatGPT en tu WhatsApp, solo tienes que añadir su número a tu agenda de WhatsApp, como otro contacto más. Es el +1 (800) 242-8478, que sirve tanto para los mensajes como para las llamadas.