Actualidad

Así es Gemini, la nueva inteligencia artificial de Google

Su objetivo es imitar la forma en la que los humanos procesamos la información. Y a juzgar por sus cualidades, da miedo.

Gemini Google
Desde reconocer imágenes hasta sugerir juegos de mesa, algunas de las capacidades de Gemini.GoogleGoogle

Conocidos como los Dioscuri (hijos de Zeus) Castor y Polux representan a los gemelos más conocidos de la mitología, la astrología (Géminis), la astronomía (constelación ídem) y, ahora, de la inteligencia artificial gracias al nuevo modelo de inteligencia artificial desarrollado por Google. Al igual que los dos hemisferios de nuestro cerebro, Gemini hace referencia a los gemelos para describir la capacidad de esta IA multimodal de imitar la forma de procesar de nuestro cerebro.

Una IA multimodal, básicamente, analiza la información a través de diferentes sentidos: el sonido, la vista, el tacto, el olfato… Gracias a la combinación de información de diferentes fuentes sensoriales es capaz de percibir y comunicar la información con mucha más precisión y riqueza. ¿Ejemplos? Hay, y muy interesantes.

En un vídeo publicado por Google es posible ver cómo a Gemini se le muestran dos ovillos de lana de color rosa y verde y se le pide que haga una sugerencia sobre posibles usos. Y su respuesta va desde una fruta (con imagen del producto finalizado incluida) hasta un pulpo… cuando se le pide que la sugerencia sea un animal.

En otro momento se muestra la evolución de un dibujo, desde unas líneas curvas, que Gemini describe como fluidas, hasta adquirir la forma de un pato. Lo interesante es que, a medida que el dibujo progresa, la IA señala que se trata de un ave primero y luego, por su pico y por estar en el agua, ya lo identifica como pato. A partir de ese momento comienza a dar nombres en otros idiomas, su forma de pronunciarlo en ellos y destaca que el color azul con el que se ha pintado no es el habitual.

Su procesamiento de lo que ve y cómo interactúa con las modificaciones es muy interesante y rápido. De acuerdo con Google, se trata de su modelo de IA “más flexible hasta la fecha, capaz de ejecutarse de manera eficiente en todo, desde dispositivos móviles hasta centros de datos”.

Una de las diferencias respecto a otros modelos multimodales es que “hasta ahora, el enfoque para crearlos implicaba entrenar componentes separados para diferentes modalidades y luego unirlos para imitar parte de dichas funcionalidades. A veces, estos modelos pueden ser buenos para realizar determinadas tareas, como describir imágenes, pero tienen dificultades con un razonamiento más conceptual y complejo”, señalan desde Google.

Google ha diseñado tres “potencias o tamaños” diferentes de Gemini: el Ultra, el Pro y el Nano. El primero estaría destinado a grandes empresas y centros de datos. El segundo cubriría las necesidades de quienes trabajan con un ordenador en diferentes tipos de proyectos individuales y el último es el que se utilizaría en, por ejemplo, teléfonos móviles. Un ejemplo de uso en este último escenario es la Grabadora: con Gemini será posible hacer un resumen de una entrevista que hemos grabado.

Todas las versiones estarán disponibles la próxima semana (inicialmente solo en inglés) aunque se puede probar ya mismo la opción de Gemini Pro en Bard, que incluye mejoras en el resumen, brainstorming, escritura y planificación. Y ya para el año que viene será posible verlo en acción directamente en Chrome.

Todo esto suena muy interesante y a medida que avancen las semanas, veremos más cualidades en Gemini, pero es importante destacar que se trata de un modelo de procesamiento de información y si bien es muy útil para ciertas tareas, en otros casos puede carecer de la “creatividad” que caracteriza a otros sistemas como ChatGPT para crear piezas musicales o ilustraciones a partir de instrucciones básicas o modelos a seguir.

Obviamente, Google busca diferenciarse de OpenAi, al tiempo que pretende dar más herramientas a sus clientes para rentabilizar las búsquedas en sus webs y la publicación de anuncios. Así, Gemini, en primera instancia y sobre todo sus modelos Pro y Ultra, buscan un mercado muy específico que tiene más que ver con la rentabilidad en internet que con la creación.