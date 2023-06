Una cosa es concluir una sinfonía o completar un cuadro pero cuando una IA crea algo desde cero lo mínimo es sorprenderse y lo siguiente es evaluar la calidad. A partir de ahora ya podremos comenzar a hacer esto (la evaluación al menos): Meta, el conglomerado de Mark Zuckerberg, anunció que ha desarrollado un procesador de música de inteligencia artificial que genera canciones basadas en descripciones de lenguaje natural.

Se trata de MusicGen de Meta y genera música basada en mensajes de texto o tarareos. Fue entrenada con 20.000 horas de música y su código fuente abierto está disponible en Github y el modelo se puede probar en línea en Hugging Face.

Los usuarios ingresan una breve descripción de la música que quieren escuchar, como "Una combinación de hip-hop y elementos orquestales, con instrumentos de cuerda y metales". O la descripción podría ser más simple: "canción de rock de los 90 con un riff de guitarra". Opcionalmente, se puede cargar una canción para ayudar a guiar la creación del contenido deseado. Con esta información MusicGen genera un clip de 12 segundos en un par de minutos.

Felix Kreuk, uno de los responsables de su desarrollo explicó su funcionamiento en un tweet.

Según sus evaluaciones del programa, Meta descubrió que MusicGen obtuvo mejores resultados tanto en medidas objetivas como subjetivas que otros programas comparables, como MusicLM, Diffusion y Noise2Music: "MusicGen produce muestras de alta calidad que están mejor alineadas melódicamente con una estructura armónica dada, mientras se adhieren a una descripción textual".

Hasta llegar a esta versión, Meta probó tres modelos distintos en los que fueron variando la cantidad de detalles musicales proporcionados: 300 millones, 1.500 millones y 3.300 millones de parámetros. Meta descubrió que los humanos preferían los resultados del modelo de rango medio (1500 millones de parámetros). Sin embargo, el modelo con la mayor cantidad de parámetros generó una salida que reflejó con mayor precisión la entrada de texto y audio.

Inevitablemente, como ocurre con gran parte de los proyectos de IA en otros campos, surgirán preocupaciones. Los más importantes son los problemas legales relacionados con el uso de material protegido por derechos de autor. Meta dice que todas las canciones utilizadas en el entrenamiento están aprobadas por acuerdos legales con los titulares de los derechos de autor.

Pero los usuarios que agregan una canción o el nombre de un artista a su descripción pueden abrir la puerta a una posible infracción de derechos de autor. MusicLM de Google prohíbe a los usuarios incluir nombres de artistas, pero Meta no lo hace. La herramienta es vista como una ayuda potencialmente invaluable para compositores e intérpretes.

Pero no todos están a favor de esta tecnología. Para el reconocido cantante y compositor australiano Nick Cave "las canciones surgen del sufrimiento... se basan en la compleja lucha humana interna de la creación. Hasta donde yo sé, los algoritmos no sienten. Los datos no sufren. ChatGPT no tiene un ser interior, no ha estado en ninguna parte, no ha soportado nada, no ha tenido la audacia de ir más allá de sus limitaciones, y por lo tanto no tiene la capacidad de una experiencia trascendente compartida, ya que no tiene límites desde los cuales trascender".

Pero el CEO de Spotify, Daniel Ek, tiene una perspectiva más optimista sobre la música generada por IA. En una reciente conferencia afirmó que "esto podría ser potencialmente enorme para la creatividad y podría llevarnos a escuchar más música que creemos que es genial culturalmente". Claro... como no paga derechos de autor...