Inteligencia artificial

OpenAI ‘pausa’ una de las voces de ChatGPT por parecerse demasiado a la de Scarlett Johansson

Se trata de una de las 5 voces de las que dispone la IA desde el pasado septiembre, pero ha cobrado popularidad tras la presentación de las nuevas capacidades de voz de ChatGPT

Scarlett Johansson en Los Angeles.
Scarlett Johansson en Los Angeles.Jordan StraussGTRES

OpenAI presentó hace una semana su último modelo de lenguaje, GPT-4o, que ahora potencia ChatGPT. Durante el evento llamó la atención la mejora en las capacidades de voz de la inteligencia artificial, con unos tiempos de respuesta similares a los de una conversación entre humanos. Hubo varios ejemplos de su uso, interactuando con la IA desde un smartphone que, inevitablemente, recuerdan a la IA de la película Her de Spike Jonze, de la que el personaje de Joaquin Phoenix se enamoraba y a la que ponía voz la actriz Scarlett Johansson. La compañía ha anunciado hoy que ‘pausa’ Sky, una de las 5 voces que puede utilizar ChatGPT, tras la oleada de comentarios y críticas recibidas por su parecido con la de la actriz.

Sky no es algo nuevo en ChatGPT. La voz está integrada con la IA desde el pasado septiembre, pero ha sido el revuelo causado por las nuevas capacidades de ChatGPT para conversar en tiempo real lo que ha avivado el interés. También es más expresivo y puede interpretar las expresiones faciales del usuario a través de la cámara del móvil.

‘Hemos escuchado preguntas sobre cómo elegimos las voces en ChatGPT, especialmente Sky. Estamos trabajando para pausar el uso de Sky mientras los abordamos’, explica la compañía en X.

Antes de este mensaje, OpenAI ha publicado en su blog un comunicado explicando cómo se realiza el proceso de selección de voces para la IA, en el que comenta específicamente el caso de Sky y su parecido con la voz de Scarlett Johansson. ‘Creemos que las voces de IA no deben imitar deliberadamente la voz distintiva de una celebridad: la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que usa su propia voz natural. Para proteger su privacidad, no podemos compartir los nombres de nuestros locutores’, afirma la compañía. OpenAI no ha señalado si la posibilidad de una demanda por parte de la actriz tiene que ver con su decisión.

Los 5 perfiles de voz -Breeze, Cove, Ember, Juniper y Sky- provienen de actores de doblaje a los que se seleccionó en colaboración ‘con directores de casting y productores independientes’. OpenAI recibió más de 400 propuestas de actores de voz y cine entre los que buscaba ‘actores de diversos orígenes o que puedan hablar varios idiomas. Una voz que se sienta atemporal. Una voz accesible que inspire confianza. Una voz cálida, atractiva, carismática y que inspire confianza con un tono rico. Natural y fácil de escuchar’. El proceso se realizó a principios de 2023 y las 400 propuestas se redujeron primero a 14 y después a las finalmente elegidas. Las grabaciones de sus voces se llevaron a cabo el pasado verano.

El despliegue de las nuevas capacidades de ChatGPT es gradual y las nuevas capacidades del asistente de voz ChatGPT se lanzarán ‘en las próximas semanas’ como una versión ‘alfa’ -un software en un estado inicial de su desarrollo- para los suscriptores de ChatGPT Plus. OpenAI planea introducir más adelante voces adicionales para ‘adaptarse mejor a los diversos intereses y preferencias de los usuarios’.