Tecnología
Google lanza Gemini 2.0 y prepara el terreno para los agentes de inteligencia artificial
Gemini 2.0 Flash, ya disponible para todos los usuarios, supera al modelo 1.5 Pro de la suscripción de pago Gemini Advanced y tiene más capacidades
Esta iba a ser una semana importante para OpenAI, con el grueso de los anuncios previstos durante 12 días de tirón, que arrancaron la pasada semana, acaparando el protagonismo en los medios tecnológicos. Pero, entre lo deslucido de sus primeros anuncios —una suscripción de 200 dólares al mes o el lanzamiento de una Sora que no parece haber mejorado en el casi un año transcurrido desde su presentación— y los que está realizando la competencia, está quedando en un segundo plano.
Ayer, X, la antigua Twitter, puso a disposición de todos sus usuarios de cuentas gratuitas a la IA Grok, provista de un nuevo y estupendo generador de imágenes que está causando sensación. Y hoy, Google ha anunciado el lanzamiento del primer modelo de su nueva familia de LLMs —siglas en inglés de Grandes Modelos de Lenguaje—, Gemini 2.0, en su versión Flash.
Gemini 2.0 Flash ya está disponible para todos los usuarios, como una opción más entre los modelos de lenguaje que ofrece la compañía —los otros son 1.5 Flash y, para los suscriptores de Gemini Advanced, 1.5 Pro— en la versión web de Gemini. En enero de 2025 llegará a las apps móviles.
¿Y qué mejoras trae Gemini 2.0 Flash?
Según ha explicado Demis Hassabis, CEO de Google DeepMind, Gemini 2.0 Flash ‘es tan bueno como el modelo Pro [1.5] actual. Así que pueden considerarlo como un nivel completo superior, con la misma eficiencia en costo y rendimiento, y con mayor velocidad. Estamos muy contentos con eso’. Esto significa que los usuarios de cuentas gratuitas ya pueden acceder a un modelo tan bueno como el que usan los suscriptores de pago, 10 meses después de su lanzamiento, y que estos, a no mucho tardar, contarán con un Gemini 2.0 Pro que justifique la cuota mensual de Gemini Advanced.
Según Google, Gemini 2.0 Flash, que aún se considera experimental, ofrece mejores resultados que 1.5 Flash y 1.5 Pro en una serie de pruebas de rendimiento de propósito general y en áreas como codificación, matemáticas o razonamiento.
Pero, más allá de superar a Gemini 1.5 Pro, hay nuevas funciones. Además de su mejor rendimiento —2 veces más rápido que 1.5 Pro— y baja latencia, Gemini 2.0 Flash incluye soporte nativo para salida multimodal. Esto permite generar imágenes nativas mezcladas con texto y audio multilingüe ajustable de texto a voz, además de admitir entradas multimodales como imágenes, videos y audio. Este nuevo modelo también puede realizar llamadas nativas a herramientas, incluidas Google Search, ejecución de código y otras funciones.
La era de los agentes IA
Según Hassabis, las capacidades multimodales de Gemini 2.0 preparan el terreno para lo que será la siguiente tendencia con la inteligencia artificial: los agentes inteligentes. Los agentes IA son bots que pueden realizar tareas en nombre del usuario. Ahora, con Gemini 2, estos agentes, que fueron anunciados en el pasado Google I/O, la conferencia anual de desarrolladores de Google, están siendo probados por ‘grupos de testadores de confianza’. Entre estos agentes inteligentes están:
- Project Astra es un sistema de reconocimiento visual que puede identificar objetos, ayudarte a navegar por el mundo e incluso decirte dónde dejaste tus gafas. Puede conversar en múltiples idiomas, usar Google Search, Lens y Maps y tiene hasta 10 minutos de memoria en sesión.
- Project Mariner es un agente de IA en forma de extensión para Chrome que comprende y razona sobre la información en la pantalla y puede usar el navegador por ti.
- Jules es un agente IA diseñado para ayudar a los desarrolladores a encontrar y corregir errores en el código.
Otros ejemplos, en otros ámbitos, son agentes que ayudan al usuario a navegar por mundos virtuales en videojuegos o también en el mundo real.
‘Realmente vemos 2025 como el verdadero comienzo de la era de los agentes y Gemini 2.0 es la base de eso’, ha afirmado Hassabis.
Gemini 2.0 también se incorporará a los resultados generados por IA en el Buscador de Google, que aún no han llegado a España, y en muchas de las aplicaciones de Google, como las de Workspace, Notebook o Pinpoint.
✕
Accede a tu cuenta para comentar