Así suena la voz de Franco “resucitada” gracias a la Inteligencia Artificial

La empresa radicada en el País Vasco Vicomtech consigue clonarla para que forme parte de un capítulo del podcast de Spotify Xrey

Las mejores grabaciones con la voz de Franco, carentes de ruidos, eran las de sus discursos navideñosFototeca Patrimonio Histórico

Aunque pueda parecer increíble no es una invención ni tampoco una “fake”. Franco, lo sabemos, es un personaje que aparece y desaparece. Y ha vuelto a la vida. Aclaremos, su voz. Mediante un sistema de Inteligencia Artificial una empresa radicada en el País Vasco, Vicomtech, ha obrado el milagro de que volvamos a escuchar las palabras de quien fue anterior Jefe de Estado y de que por primera vez se pueda sintetizar la voz de un personaje histórico. La tarea ha sido ingente, pues no se conservan tantos fragmentos que contengan sus palabras y muchas de las grabaciones están llenas de ruido y apenas son perceptibles.

De ahí que haya tenido que rastrear en profundidad para conseguir abarcar un arco amplio de su vida: es decir, que se notara y, sobre todo, se pudiera seguir una evolución en la voz. No es lo mismo la dicción de un hombre con 40 años que la de uno de 60 o que los titubeos de un octogenario. Timbre, intensidad, cadencia no son iguales. La manera de articular, las frases, etcétera, distan mucho de ser siquiera parecidas.

“Este ejemplo de clonación de voz constituye un gran reto científico-tecnológico que Vicomtech ha resuelto mediante tecnologías de inteligencia artificial aplicadas al procesamiento del habla. XRey es un podcast exclusivo de Spotify producido por The Story Lab que repasa las luces y las sombras sobre la figura del rey emérito. Se ha generado la voz clonada de Franco exclusivamente para dos momentos clave del guión y el bonus track, en el que se explica cómo ha sido su proceso de creación”, se puede leer en la web de la empresa. Efectivamente se registra la voz de Franco leyendo una carta que... jamás leyó en vida y que los algoritmos han devuelto a la vida.

Las mejores cintas eran, parece ser, las de los discursos navideños, precisamente por la ausencia de ruidos de fondo. Es increíble escuchar una grabación de la voz auténtica de Franco y después ese mismo fragmento clonado gracias a la inteligencia artificial porque es casi imposible distinguirlos. La tecnología desarrollada ha sido el resultado de semanas de trabajo y la implicación del Grupo de investigación de Tecnologías del Habla y del Lenguaje Natural de Vicomtech.