Apps

10 aplicaciones de inteligencia artificial generativa que ya puedes usar

Es fácil verse un poco perdido ante la avalancha de novedades basadas en inteligencia artificial que están llegando a diferentes aplicaciones y servicios

Integración de un personaje animado por ordenador en un vídeo con Wonder Studio.
Integración de un personaje animado por ordenador en un vídeo con Wonder Studio.Wonder Dynamics.

Si hay un área de la tecnología que se está moviendo a velocidad de vértigo, esa es la inteligencia artificial generativa. Sólo en la última semana, Microsoft ha anunciado la integración del modelo de lenguaje GPT-4 en Office, Google hará lo propio con sus modelos de lenguaje en Workspacey Midjourney ha lanzado una nueva versión que acerca las capacidades de este modelo de texto a imagen al fotorealismo.

El sector tecnológico nunca ha sido tímido a la hora de hablar de revoluciones, un término que se suele usar más con el ánimo de promocionar que con el de describir, pero éste no parece ser el caso. Las novedades que están llegando a los usuarios implican cambios profundos en la forma de trabajar, crear y comunicarse, son constantes y entre la proliferación de apps de consumo que hacen uso de diferentes modelos de lenguaje para todo tipo de tareas es fácil perderse. Enumeramos diez aplicaciones de IA generativa que ya puedes utilizar para una amplia variedad de fines.

ChatGPT

Interfaz de ChatGPT.
Interfaz de ChatGPT.Alfredo Biurrun.

Uno de los principales responsables de que se hable tanto sobre inteligencia artificial generativa. Este modelo de lenguaje elabora respuestas en texto sobre prácticamente cualquier tema. Así, sirve tanto para buscar información (anterior a 2022, dado que el conjunto de datos con el que ha sido entrenada abarca hasta 2021) como para que cree todo tipo de contenido escrito, desde un chiste a programar código. Está disponible en abierto desde el pasado mes de noviembre, pero si quieres usar la versión más avanzada con el modelo de lenguaje GPT-4, deberás suscribirte a ChatGPT Plus que tiene un coste de 20 dólares al mes o quedarte con GPT 3.5.

Wonder Studio

Aunque aún no está disponible en abierto, sí es posible apuntarse a la beta que Wonder Dynamics está llevando a cabo. Wonder Studio se presenta como un estudio de efectos visuales accesible a través del navegador y que permite introducir personajes y animaciones CGI, Computer Generated Images, en cualquier vídeo. La IA se encarga de integrarlos ajustando automáticamente la iluminación, composición y las animaciones con resultados, por lo que ha enseñado Wonder Dynamics, tan notables como fáciles de obtener.

Wonder Studio from Wonder Dynamics on Vimeo.

Deep Agency

Se trata de un estudio fotográfico virtual en el que no hay modelos ni cámaras ni estudio porque todo el contenido se crea por inteligencia artificial. Así, el usuario no tiene más que seleccionar un modelo de entre los disponibles en la galería y proporcionar una descripción de la imagen que quiere para que Deep Agency la cree en alta resolución con modelos fotorrealistas generados por IA. También es posible crear un modelo virtual de uno mismo, aunque está opción solo está disponible en la suscripción de pago por 29 dólares al mes. Deep Agency se encuentra actualmente en fase de beta abierta.

Fliki

Esta herramienta permite crear voces realistas por inteligencia artificial a partir de un texto para su empleo en podcasts y vídeos. El usuario solo tiene que introducir el texto o la URL donde se encuentra para que Fliki resuma el contenido, encuentre las imágenes o vídeo adecuado de entre los disponibles en su biblioteca y cree un video con una voz en off humana (hay más de 900, en 75 lenguas) y subtítulos personalizados. Puede usarse con una cuenta gratuita, limitada, o mediante suscripción de pago de la que hay tres modalidades. La superior, por 66 euros al mes si el pago es anual, también permite la clonación de voces.

Midjourney

El más popular entre los modelos detexto a imagen se acaba de actualizar a su quinta versión con unos resultados, nuevamente, sorprendentes. Más cerca que nunca del fotorealismo, aunque aún con ese aspecto de imagen fuertemente procesada que la traiciona, la IA de Midjourney está disponible de forma gratuita, con un límite de 25 imágenes, en el servidor de Discord de la compañía. Las modalidades de pago son tres: Basic por 8 dólares al mes, Estándar por 24 y Pro por 48, todas con opción a expandirse comprando tiempo de GPU a razón de 4 dólares la hora.

Runway

Runway es un completo editor de vídeo cuyas capacidades por IA le permiten generar vídeos a partir de instrucciones de texto, de imágenes o combinando ambos inputs. También puede estilizar imágenes y vídeos a partir de otra imagen que se introduzca, reelaborar imágenes y expandirlas, entre otras herramientas de edición basadas en IA. Tiene un plan gratuito limitado y dos de pago: Estándar por 12 dólares al mes y Pro por 28 que dan acceso a calidad 1080p y superior, entre otras ventajas.

Postwise

Interfaz de Postwise.
Interfaz de Postwise.Postwise.

Hacerte viral es lo que proponen los responsables de esta IA generativa de texto a la que puedes dejar al mando de tu cuenta en Twitter. Con Postwise el usuario solo tiene que introducir el tema del que quiere hablar para que la IA le genere una serie de tuits con diferentes aproximaciones y programar su publicación. Es una herramienta de pago, 29 dólares mensuales el plan Basic y 49 el Boss, pero ofrece una prueba gratuita de 7 días.

Whisper (Buzz)

Volvemos con Open AI, la compañía que ha desarrollado ChatGPT y DALL-E, para hablar de Whisper. Se trata de un sistema de reconocimiento automático de voz que emplea modelos de lenguaje para transcribir lo que dice el usuario, traducirlo al inglés o procesar archivos para transcribir el audio contenido en ellos. Lanzada en mayo pasado, la herramienta tiene un acceso ligeramente complicado a través de Google Colab, pero es más sencillo es usar una app como Buzz que usa Whisper y que puedes encontrar en Github.

Bing y Edge

Bing con GPT-4.
Bing con GPT-4.Microsoft.

Tras 13 años de indiferencia por parte de la mayoría de usuarios, Microsoft parece haber dado con la tecla para que su buscador crezca frente a Google. La integración del modelo de lenguaje de OpenAI, GPT-4, con el buscador y el navegador Edge ha pasado del canal beta a la versión estable en la que ya es posible tanto charlar con la IA visitando Bing como utilizarla como asistente de escritura en Edge. La próxima novedad disruptiva que ya ha llegado al canal beta es la integración con un segundo modelo de open AI, DALL-E, para la creación de imágenes a partir de texto que ya ha llegado al canal beta de Edge.