Tecnología
El nuevo Agente ChatGPT de OpenAI deja atrás a Google, Meta y Microsoft: busca, compra y automatiza tareas por ti
OpenAI ha lanzado un nuevo modelo, integrado con ChatGPT, que usa un ordenador virtual con su navegador para realizar tareas de varios pasos en lugar del usuario
Con el mundo ya acostumbrado a los chatbots y otras herramientas de IA generativas, el siguiente paso es la IA agéntica. Esto es, sistemas capaces de ejecutar acciones de forma autónoma y en cadena, en nombre del usuario. Este jueves, OpenAI se ha desmarcado de sus principales competidores con el lanzamiento de su nueva IA agéntica que responde al nombre de ChatGPT Agent o Agente ChatGPT y se está desplegando de forma gradual para todos sus usuarios de pago en Estados Unidos; sin fecha aún en Europa, donde las restricciones legales complican el funcionamiento de este tipo de IA.
El concepto de IA agéntica ha cobrado fuerza en el último año en el sector de la IA. Donde los chatbots actuales solo producen determinados tipos de contenido, Agente ChatGPT utiliza su propio ordenador virtual para ejecutar tareas que hasta ahora debía realizar una persona, paso a paso. Una referencia cinematográfica sería el JARVIS que sirve a Iron Man, pero aquí dedicado a cosas mucho más mundanas.
Qué puede hacer Agente ChatGPT
Estos son algunos ejemplos facilitados por OpenAI de lo que puede hacer Agente ChatGPT:
- Seleccionar y comprar ropa para una ocasión concreta.
- Planificar una comida familiar y comprar los ingredientes.
- Realizar los preparativos de una cita conectándose a Google Calendar y buscando disponibilidad en restaurantes mediante OpenTable.
- Automatizar pequeñas tareas del día a día, como reservar una plaza de aparcamiento.
- Crear una presentación tipo PowerPoint tras analizar a empresas competidoras.
- Actualizar hojas de cálculo financieras con nuevos datos.
Agente ChatGPT ha sido entrenado mediante aprendizaje por refuerzo para realizar tareas complejas que requieren el uso de varias herramientas, como un navegador de texto, un navegador visual, una terminal donde se puede importar información del usuario y conexiones API para completarlas, incluyendo los llamados ChatGPT Connectors que permiten integrar apps como Gmail y GitHub.
Mientras se utiliza Agente ChatGPT, el usuario ve una ventana dentro de la interfaz de ChatGPT que muestra todas las acciones de la IA en su propia sandbox privada. Esta cuenta con su propio sistema operativo virtual y navegador con acceso a Internet real; no controla tu dispositivo personal.
‘ChatGPT lleva a cabo estas tareas usando su propio ordenador virtual, alternando fluidamente entre razonamiento y acción para gestionar flujos de trabajo complejos de principio a fin, siempre en función de tus instrucciones’, ha explicado OpenAI.
Respecto a la privacidad, Agente ChatGPT se ejecuta en una máquina virtual en los servidores de OpenAI y no tiene acceso a los datos locales del dispositivo del usuario. La compañía afirma que se pueden borrar todos los datos de navegación y cerrar la sesión activa con un solo clic. OpenAI no recopila ni guarda los datos introducidos, incluidas contraseñas.
Un modelo de lenguaje sin nombre
Agente ChatGPT es una combinación de dos herramientas anteriores de OpenAI -Operator, que solo ha estado disponible unos meses para los usuarios de la carísima suscripción Pro y pronto dejará de estarlo, y Deep Research- funcionando bajo un nuevo modelo de lenguaje al que no se le ha dado ningún nombre en particular. Según detalló un ingeniero de OpenAI en la presentación, Agente ChatGPT consiste en varios modelos que trabajan de forma conjunta y algunos de ellos vigilan constantemente el comportamiento del resto, con capacidad para detener el proceso si detectan una situación peligrosa.
Al igual que sucedía con Operator, la función de agente requiere la confirmación del usuario antes de realizar acciones con consecuencias reales, como compras online. El usuario puede interrumpir las tareas en cualquier momento, tomar el control del navegador o detener por completo la operación. Y operaciones de alto riesgo, como transacciones financieras, están directamente prohibidas.
Una IA agéntica algo lenta
Según señalan desde The Verge, el funcionamiento de la herramienta puede ser algo lento. ‘Aunque tarde 15 o 30 minutos, sigue siendo mucho más rápido que hacerlo tú mismo’, ha señalado Isa Fulford, responsable de investigación en OpenAI, al medio, indicando que el agente está pensado para lanzarse en segundo plano y volver más tarde a revisar los resultados.
ChatGPT se pone por delante de Meta AI, Gemini y Copilot
Habrá que ver el desempeño de Agente ChatGPT con la práctica. Ya ha habido lanzamientos similares, pero no con el alcance de ChatGPT que es la IA más usada del mundo. En octubre del año pasado, Anthropic (creadores de Claude) lanzó Computer Use, una herramienta que emula el uso humano de un ordenador. Y Perplexity acaba de lanzar un navegador, Comet, que también automatiza tareas del usuario.
Por su parte, los grandes competidores de OpenAI también trabajan en este tipo de IA agéntica, pero ni Microsoft, ni Google ni Meta han lanzado aún nada en este sentido. Por el momento, OpenAI ha vuelto a tomar la delantera.
Límites de uso del Agente ChatGPT
Agente ChatGPT está disponible desde ayer en Estados Unidos para usuarios de ChatGPT Pro, con 400 mensajes al mes. Los suscriptores de los planes Plus y Team tendrán acceso en los próximos días, con 40 mensajes mensuales. Los usuarios de los planes Enterprise y Education lo recibirán en las próximas semanas.