Biblioteca Nacional

Una inteligencia artificial ayuda a descubrir una obra desconocida de Lope de Vega

La máquina procesó hasta 1.300 obras escritas durante el Siglo de Oro y las particularidades de 350 autores para poder llegar a una conclusión

MADRID, 31/01/2023.- Investigadores de las universidades de Valladolid (España) y Viena han descubierto en el fondo de manuscritos teatrales de la Biblioteca Nacional de España una nueva comedia de Lope de Vega titulada "La francesa Laura", una obra escrita cinco o seis años antes de su muerte. El hallazgo fue posible gracias a la colaboración de esta entidad con el proyecto "Estilometría aplicada al Teatro del Siglo de Oro", dirigido por Álvaro Cuéllar y Germán Vega, los investigadores responsables del descubrimiento. EFE/BNE/SOLO USO EDITORIAL/SOLO DISPONIBLE PARA ILUSTRAR LA NOTICIA QUE ACOMPAÑA (CRÉDITO OBLIGATORIO)
La inteligencia artificial descubre una obra de Lope de Vega Agencia EFE

Investigadores de las universidades de Valladolid y Viena han descubierto en el fondo de manuscritos teatrales de la Biblioteca Nacional (BNE) una nueva comedia de Lope de Vega titulada "La francesa Laura", escrita cinco o seis años antes de su muerte. La obra, que pertenecía anónima, ha podido ser atribuida finalmente gracias a un procesador de estilo mediante la inteligencia artificial, que ha determinado incluso que la obra pertenece a la etapa final de la producción del dramaturgo. Según sus conclusiones, publicadas hoy por la institución, la obra habría sido escrita al final de la Guerra de los Treinta Años, cuando se restablecieron las relaciones de amistad entre España y Francia, contra el enemigo común: Inglaterra.

La trama transcurre en Francia y gira en torno a Laura, hija del Duque de Bretaña y casada con el conde Arnaldo. El Delfín, heredero al trono de Francia, se encapricha de ella y se dispone a cortejarla a cualquier coste. La protagonista se resiste a los envites del príncipe y a las sospechas de su marido quien, en un ataque de celos y por el temor a la pública deshonra, intenta incluso acabar con la vida de su mujer mediante un potente veneno. Finalmente, queda probada la integridad de Laura y se restituye la felicidad en la pareja.

La obra, aunque fruto de su tiempo, presenta en su arranque una decidida defensa de la mujer. Tal y como ha señalado la institución, para su detección en los fondos de la BNE ha sido esencial la utilización de herramientas informáticas, cuyos resultados se han visto respaldados por los análisis filológicos. El hallazgo ha sido posible gracias a la colaboración de la BNE con el proyecto ETSO: Estilometría aplicada al Teatro del Siglo de Oro, dirigido por Álvaro Cuéllar y Germán Vega, los investigadores responsables del hallazgo, y que cuenta con hasta 150 colaboradores dedicados a la aplicación de análisis informáticos a la literatura teatral del Siglo de Oro para desentrañar sus problemas de autoría.

También ha participado el grupo PROLOPE, de la Universitat Autònoma de Barcelona (UAB), con su labor de edición y estudio de la obra de Lope y la herramienta Transkribus, que ha facilitado la preparación de los materiales necesarios para los experimentos; así como las Universidades de Valladolid y Viena, a las que pertenecen los autores de la investigación.

El papel de la inteligencia artificial

El empleo de la IA ha sido crucial en el descubrimiento de la relación con Lope de Vega de esta obra conservada anónima en un manuscrito de fines del siglo XVII, muchos años después de muerto el escritor, que se conserva en la BNE, junto con muchos otros aún por atribuir. En primer lugar, la obra fue transcrita automáticamente empleando técnicas de Inteligencia Artificial a través de la herramienta Transkribus. Gracias a ella, se pueden transcribir de forma certera manuscritos antiguos con un alto grado de precisión, cosa imposible hasta hace unos pocos años.

Para ello, tiene que ser "entrenada" mediante el suministro de manuscritos y su correspondiente transcripción (en este caso, fueron necesarios unos tres millones de palabras correctamente identificadas) hasta que llega a un punto en el que la máquina ha aprendido lo suficiente para reconocer las letras y las palabras de forma autónoma.

A partir de este momento, se puede aplicar a los documentos manuscritos que se quieran transcribir. En esta ocasión, fueron procesadas unas 1.300 obras teatrales del Siglo de Oro (tanto impresas como manuscritas) que quedaron transcritas en unas horas. El resultado de estas transcripciones no es perfecto, pero sirve para el siguiente paso en el que la IA se vuelca en la atribución autoral de este texto a su legítimo autor. En esta fase, se intenta clasificarlas por su autor correspondiente. En los últimos años se han desarrollado en gran medida los análisis para conseguirlo en función del uso de las palabras que hacen. Cada escritor utiliza las palabras (amor, tiempo, rosa, cuándo, que...) en distintas proporciones.

Aprendizaje de 350 autores

Los procesos de 'machine learning' (una de las principales ramas de la IA) son capaces de clasificar obras como escritas o no por Lope de Vega con aciertos superiores al 99%, como demuestran recientes estudios. Pues bien, entre las 1.300 comedias transcritas automáticamente, 'La francesa Laura' se clasificó como escrita por Lope de Vega, tanto completa como cada una de sus jornadas. Es decir, los usos léxicos de la obra se alineaban con los suyos estrechamente, y no lo hacían con los otros 350 dramaturgos de la época con los que se contaba en el experimento. Posteriormente, este resultado fue contrastado con recursos tradicionales de la investigación filológica.

Entre estas pruebas, destaca el estudio de la versificación (cómo Lope usaba habitualmente la métrica en sus obras), la ortología (cómo pronunciaba las palabras y empleaba diptongos, hiatos o sinalefas), y muy especialmente el estudio de ecos lopescos, es decir, la coincidencia tanto en ideas, asuntos y motivos como en estructuras léxicas concretas entre esta obra y otros textos del dramaturgo cercanos al tiempo de su escritura