Inteligencia artificial

Google anuncia Genie, una IA que crea videojuegos a partir de una imagen o texto

Solo necesita una única imagen que puede ser sintética, real o un simple boceto a mano

Google anuncia Genie, una IA que crea videojuegos a partir de una imagen o texto.
Google anuncia Genie, una IA que crea videojuegos a partir de una imagen o texto.Google.

DeepMind, la división de Google centrada en inteligencia artificial, ha anunciado Genie, “un nuevo paradigma” dentro de las IAs generativas. Y no es una exageración. En los últimos meses hemos visto inteligencias artificiales que crean imágenes, música, vídeo y voces a partir de diferentes tipos de entradas de datos y de forma extraordinariamente sencilla. Ahora le toca el turno a los videojuegos.

Genie permite crear un entorno interactivo jugable a partir de una única imagen de referencia que puede ser sintética, real o incluso un boceto. Y también mediante prompts, como es habitual en estas herramientas.

Este nuevo modelo base para mundos jugables, como lo denomina DeepMind, se ha entrenado a partir de más de 200.000 horas de vídeos disponibles públicamente en Internet . Pero no está limitado por ellos, sino que puede trabajar a partir de nuevas imágenes que no hayan formado parte del entrenamiento. Por ejemplo, una fotografía de su entorno que saque el usuario.

“Lo que hace que Genie sea único es su capacidad para aprender controles precisos exclusivamente a partir de vídeos de Internet”, señalan desde la compañía. Genie determina cual es el personaje principal y aprende cómo controlarlo y cómo interactúa con el mundo virtual que le rodea en el espacio y el tiempo; y también es capaz de simular la deformación de objetos.

DeepMind destaca que durante el entrenamiento no se han utilizado etiquetas de acción que indiquen qué acción se está realizando en un vídeo, algo de lo que no suelen disponer los vídeos en Internet. Aún así, la IA no solo aprende qué partes de la imagen que analiza son controlables sino que también infiere acciones que son consistentes con el entorno generado.

La división de Google ha abierto una web en la que muestran numerosos ejemplos de lo que puede hacer Genie. En ellos se puede ver como basta una sola imagen, que puede ser creada con una IA de texto a imagen como puede verse en algunos de ellos, para que la IA genere un entorno interactivo jugable. En este caso han utilizado Imagen2, otra IA generativa de Google. Otros ejemplos están realizados a partir de fotografías del mundo real y de bocetos. Genie admite instrucciones escritas, pero es algo que DeepMind menciona solo de pasada.

Ejemplos de creación de entornos interactivos a partir de una imagen realizados con Genie.
Ejemplos de creación de entornos interactivos a partir de una imagen realizados con Genie. Google.

El entrenamiento de Genie se ha enfocado en los juegos de plataformas y la robótica, pero DeepMind asegura que “nuestro método es general, debería funcionar para cualquier tipo de dominio y es escalable a conjuntos de datos de Internet cada vez más grandes”.

Según la compañía, los videojuegos son un banco de pruebas efectivo para las inteligencias artificiales, pero se encuentran limitados por los juegos disponibles. Con Genie es posible crear cualquier mundo que sea necesario, algo que DeepMind cree que puede ser “un catalizador para entrenar a los agentes generalistas de IA del futuro”.

Google no desvela qué otros usos dará a esta inteligencia artificial o si estará disponible para los usuarios en el futuro, bien como parte de Gemini o de forma independiente. Pese a lo cautivador del concepto, es obvio que la herramienta está en una fase inicial. Pero visto cómo han avanzado las IA generativas en el último año, podemos esperar cualquier cosa en los próximos meses.