Google I/O 2023

Google toma impulso y apuesta fuerte por la IA: PaLM-2, nuevo Bard e integración con el buscador y aplicaciones

La compañía ha hecho los deberes y ha presentado una amplia batería de novedades

Google toma impulso y apuesta fuerte por la IA: PaLM-2, nuevo Bard e integración con el buscador y aplicaciones.
Google toma impulso y apuesta fuerte por la IA: PaLM-2, nuevo Bard e integración con el buscador y aplicaciones.Google.

Google, por primera vez en meses, ya no da la impresión de ir a rebufo de Microsoft y OpenAI en el desarrollo e integración de herramientas de inteligencia artificial con sus productos. Esa es la primera conclusión tras la batería de novedades relacionadas con la inteligencia artificial que la compañía ha presentado este miércoles en el marco de su conferencia anual de desarrolladores, Google I/O.

Además de la ampliación de la familia de dispositivos Pixel con tres nuevos productos (Pixel 7A, Pixel Tablet y Pixel Fold), la compañía presentó su nuevo modelo de lenguaje de próxima generación, PaLM-2 que se encuentra detrás de 25 nuevos productos y que también da una nueva vida a Bard, el chatbot basado en PaLM lanzado en febrero de forma limitada y que encontró una muy poco entusiasta recepción.

Algo que repitió en varias ocasiones Sundar Pichai, CEO de Google, durante la retransmisión del evento celebrado ayer en el anfiteatro Shoreline en Mountain View, California, es que la compañía no llega ahora a la inteligencia artificial, sino que lleva una década trabajando en ella y usándola para mejorar aspectos como la comprensión de las búsquedas que realizan los usuarios o las respuestas que propone Gmail para responder un correo, entre otros ejemplos. Ahora es cuando, siguiendo el camino abierto por OpenAI, la pone a disposición del usuario final en una amplia variedad de servicios. Repasamos las principales novedades anunciadas ayer por Google.

PaLM-2

Sundar Pichai presenta el nuevo modelo de lenguaje PaLM-2.
Sundar Pichai presenta el nuevo modelo de lenguaje PaLM-2.Google.

El nuevo modelo de lenguaje de Google sucede al primer PaLM presentado el año pasado. Está entrenado con un conjunto de datos “significativamente mayor” y en un “entorno multilingüe” que incluye más de 100 idiomas, lo que mejora su capacidad de comprender, generar y traducir textos. También ha mejorado su capacidad de razonamiento incluyendo en su entrenamiento investigaciones científicas y webs con fórmulas y expresiones matemáticas para manejar mejor aspectos como lógica, razonamiento con sentido común y matemáticas. Es capaz de trabajar y generar código con 20 lenguajes de programación diferentes, desde Phyton y JavaScript hasta Prolog, Fortran y Verlog.

La base de datos con la que ha sido entrenada PaLM-2 incluye “documentos web, libros, código, matemáticas y datos conversacionales” y estará disponible a través de su API para su uso por terceros en aplicaciones y servicios. Estos podrán elegir entre cuatro versiones del modelo de lenguaje, según su tamaño. Pichai puso como ejemplo Gecko, el más pequeño, “tan ligero que puede funcionar en dispositivos móviles y lo suficientemente rápido para ofrecer aplicaciones interactivas en el propio dispositivo incluso estando offline”.

El CEO de Google también anunció el próximo LLM (Largue Language Model o Modelo grande de lenguaje) de la compañía que se llamará Gemini y se encuentra actualmente en fase de entrenamiento.

Nuevo Bard

Bard puede trabajar y generar código en 20 lenguajes de programación.
Bard puede trabajar y generar código en 20 lenguajes de programación.Google.

El chatbot que Google lanzó para competir con ChatGPT se actualiza en varios sentidos. Pasa de PaLM a PaLM-2, se abre al uso de plug-ins que Google denomina Tools y abandona su fase de prueba limitada para estar disponible para todos los usuarios en 180 países, pero ninguno de ellos en la Unión Europea, presumiblemente para evitar problemas con el Reglamento General de Protección de Datos como los que llevaron a la suspensión temporal de ChatGPT en Italia.

Seguirá funcionando como una aplicación independiente, aunque la tecnología sea la misma que se encuentra detrás de la integración de la IA con el Buscador de la que hablamos más adelante. Por ahora solo trabaja en inglés, japonés y surcoreano, pero estos idiomas se ampliarán próximamente a más de 40. Además de texto, también admite imágenes como información de entrada que facilita el usuario, pero son sobre todo las Tools las que van a dar mayor versatilidad, algunas de la propia Google y otras de terceros. Por ejemplo, con la correspondiente a Adobe Firefly, la IA generadora de imágenes a partir de texto de Adobe, los usuarios podrán crearlas en Bard y con la de Sheets, las hojas de cálculo de Google Workspace, podrán pedir a Bard que muestre la información en tablas al estilo Excel.

IA en el buscador de Google: SGI o Search Generative Experiencie

Nuevo bloque de información generado por IA en los resultados de búsqueda.
Nuevo bloque de información generado por IA en los resultados de búsqueda. Google.

Microsoft integró el pasado febrero el modelo de lenguaje GPT-4 con su buscador y la respuesta a este movimiento por parte de Google era una de las novedades más esperadas en este Google I/O. La compañía ha llamado SGI (Search Generative Experience) a la integración de PaLM-2 con el suyo e inicialmente estará disponible a través de Google Search Labs, una nueva versión de Google Labs que permite probar, tras registrarse, algunas de las novedades anunciadas ayer.

Cuando el usuario realice una búsqueda se le presentará un nuevo bloque de información, antes del tradicional listado de enlaces a resultados, que incluirá las respuestas generadas por la IA en lenguaje natural. Este contenido creado con PaLM-2 incluirá imágenes además de texto y también, atención, recomendaciones de compra de un producto cuando la respuesta lo requiera. Para este último apartado Google se basa en la gigantesca base de referencias que Google ya usa para el apartado Shopping de sus resultados de búsquedas.

Duet AI para Workspace

Help me write, el asistente IA para Gmail, permite generar textos completos a partir de un prompt del usuario. En esta caso, una oferta de trabajo a partir del nombre de la posición ofertada.
Help me write, el asistente IA para Gmail, permite generar textos completos a partir de un prompt del usuario. En esta caso, una oferta de trabajo a partir del nombre de la posición ofertada. Google.

La integración de PaLM-2 en las aplicaciones ofimáticas de Google recibe el nombre de Duet AI y permite diversas tareas según el programa que se esté usando. En Gmail se podrá usar para componer todo tipo de textos y resumir información de los correos con los que se trabajan. En Google Sheets u Hojas de cálculo ayudará a extraer información de las tablas y crearlas preguntando al asistente usando lenguaje natural y en Google Slides o Presentaciones de Google crearlas indicándole que es lo que queremos y con la IA generando las imágenes que el usuario demande, entre otros ejemplos.