Ciencia y Tecnología

Un nuevo sistema transcribe manuscritos automáticamente

La Razón
La RazónLa Razón

La Universidad Politécnica de Valencia (UPV) lidera un proyecto europeo que desarrolla un sistema para el reconocimiento automático de imágenes de documentos antiguos manuscritos, para poder transcribirlos de la forma más rápida posible.

El proyecto Trascriptorium, que arrancó a principios de este año, forma parte del Séptimo Programa Marco de la Unión Europea y, además de la UPV, también participan en él dos socios británicos, uno austríaco, uno griego y uno holandés.

El coordinador del proyecto, Joan Andreu Sánchez, explicó que este busca un prototipo para probar «cómo se podrían utilizar en un entorno real técnicas automáticas e interactivas que ya se están desarrollando» para poder transcribir documentos manuscritos antiguos, con técnicas que aprenden automáticamente y que, por tanto, se aplican a cualquier lengua y aceleran el trabajo.

«El proceso de transcripción actualmente se hace de forma manual y la idea es incorporar técnicas automáticas de reconocimiento del habla en este tipo de entorno de transcripción», apuntó, e indicó que estas técnicas «no están lo suficientemente exploradas y difundidas en el reconocimiento de la escritura».

Sánchez incidió en que las técnicas que utilizan «no tienen que ver» con las técnicas de reconocimiento óptico de caracteres (OCR). Para las técnicas de OCR se utilizan técnicas de segmentación, es decir, se aislan los caracteres y luego se reconocen; pero la escritura manuscrita es ligada y no hay técnicas que lo separen automáticamente, por lo que el proceso de reconocimiento no se puede abordar carácter a carácter sino como un todo de caracteres, palabras y líneas.

Una de las principales ventajas de este proyecto es que las técnicas que utilizan «aprenden automáticamente a partir de ejemplos y por tanto, no son específicas para una determinada lengua sino que se pueden aplicar a cualquiera».