Lengua española

La Inteligencia Artificial hablará y decidirá en español como motor: 81 millones y un PERTE

El proyecto del Valle de la Lengua se asegura inversiones de 81 millones y la categoría de PERTE para desarrollar la IA y la lingüística computacional en castellano

Monasterio de Yuso
La Inteligencia Artificial hablará y decidirá en español como motor: 81 millones y un PERTELa Rioja

El español como motor de la inteligencia artificial y del desarrollo económico. Como puente que conecta España con América. El proyecto Valle de la Lengua tiene 81 millones de euros de inversiones comprometidas hasta 2025 y se espera, tras alcanzar la consideración de PERTE (Proyecto Estratégico para la Recuperación y Transformación Económica), que genere muchas más, tanto públicas como privadas, a lo largo de varios años.

Aunque este proyecto tiene cinco bloques (Aprendizaje, Turismo, Cultura, Ciencia y Economía de la Lengua), el primero y los dos últimos son los que más innovación suponen. Con ellos se pretende que el español y su estudio y aplicación a nuevas tecnologías como el Big Data sean el motor económico tanto de La Rioja como de otras regiones. De hecho, Economía de la Lengua es el apartado que mayor dotación económica tiene: los 41 millones de euros suponen casi la mitad de todo el montante comprometido.

Cabe señalar, igualmente, que casi la mitad de las inversiones provienen del gobierno central (42 millones) a través de diferentes ministerios. Según explica la presidenta del gobierno de La Rioja, Concha Andreu, «es un proyecto a largo plazo, con tres años de inversión y otros tantos de ejecución», defendiendo que la inversión pública inicial permitirá impulsar la privada con el objetivo de «desarrollar la economía del valle en el que están registradas las primeras anotaciones del español como lengua». El reto último es que la zona de San Millán de la Cogolla, con sus monasterios de Yuso y Suso a la cabeza, siga «siendo un entorno natural privilegiado, pero lleno de vida».

IA en español

Así pues, uno de los puntos más importantes de este proyecto es el que afecta a la Nueva Economía de la Lengua, convertido incluso en PERTE.

Dentro de este paraguas se inscribe la creación del Centro de Inteligencia Artificial, que se encargará, entre otras cosas, de ser un espacio abierto de datos y un observatorio global del español como lengua, desarrollando su corpus oral. El reto es que este centro sirva de palanca para que haya más iniciativas de emprendimiento para el uso del español en todos los sectores. Además, se trabajará para que la Inteligencia Artificial «funcione tan bien en español como en inglés». Algo que, según el director general de la Oficina del Comisionado para la Nueva Economía de la Lengua, Manuel González Bedia, persigue «no que las máquinas sustituyan a las personas, sino que podamos tratar a cada persona con sus particularidades, porque la IA también sabrá distinguir acentos, niveles socioeconómicos y culturales y discapacidades, entre otras».

Según se defendió en la presentación del proyecto, «la nueva economía se basa en datos, que se tienen que transformar en conocimiento. En lo relativo al lenguaje, todo esto se hará en La Rioja, también por motivos poéticos» al ser la cuna del español.

Glosas Emilianenses
Glosas EmilianensesLa Rioja

Concha Andreu destaca que «La Rioja es ya centro y motor del nuevo sector económico que surge para desarrollar la inteligencia artificial en español». Y subraya que «el español de la inteligencia artificial será una herramienta de competitividad indispensable para todos los sectores y todos los ámbitos y tendrá aplicaciones que ahora apenas acertamos a imaginar». «El ecosistema tecnológico e innovador que va a surgir alrededor de este sector tiene un potencial enorme», añade.

El núcleo del Centro será el espacio de datos del sector de la nueva economía de la lengua, situado en un edificio emblemático de Logroño conocido como Corazonistas (y que será rehabilitado en breve), que cubrirá de manera integral y coordinada todos los ámbitos relacionados de manera directa o indirecta con la nueva economía de la lengua.

El análisis y aprovechamiento de esos datos gracias a los algoritmos de la inteligencia artificial permitirá aplicaciones en todos los ámbitos y sectores, que contarán con indicadores y soluciones útiles para desarrollar su trabajo de manera mucho más eficaz y para tomar decisiones estratégicas basadas en datos.

El Centro establecerá además sinergias directas con el Observatorio Global del Español y generará un ecosistema de emprendimiento basado en las nuevas oportunidades vinculadas a la economía del conocimiento. Y de esta forma se construirá el corpus oral del español, como el mayor corpus oral de un idioma existente en el mundo, lo que resulta esencial para el desarrollo del procesamiento del lenguaje natural y la inteligencia artificial en nuestro idioma.

Nuevos estudios

Otra de las áreas importantes de este proyecto tiene que ver con la universidad. La de La Rioja será la primera en tener un título propio de Lingüística Computacional y Tecnología del Lenguaje, grado con 25 plazas que se empezará a impartir a partir del próximo curso. Los alumnos realizan 18 meses con contrato remunerado en las empresas tecnológicas Hiberus, Bosonit y Gnoss. Se espera que esta titulación, dual y bilingüe, tenga un impacto importante al ser «pionero» en nuestro país. Además de crearse el Campus Valle de la Lengua, la inversión de ocho millones de euros contempla asimismo el impartir cursos especializados y másteres (también para estudiantes sobre el español como lengua extranjera) como el de Procesamiento del Lenguaje Natural e inteligencia artificial (con 25 alumnos), así como distintos talleres de escritura, de contenido audiovisual y de nueva economía de la lengua o de procesamiento computacional.

Muchas de estas propuestas formativas conllevan estancias presenciales en la zona de San MIllán de la Cogolla. De hecho, el máster es online, pero incluye un seminario previo intensivo y presencial. Con la asistencia de todos estos estudiantes y profesionales también se espera dinamizar la zona. Está prevista la participación de escritores, guionistas, traductores y editores de prestigio.

Una biblioteca de literatura científica

Con el objetivo de aumentar la presencia del español en los artículos científicos y crear el mayor lago de datos en español, el Valle de la Lengua va a dar un nuevo impulso a Dialnet, una base de datos de documentos e investigaciones científicas en español.

Intentando plantar cara a ResearchGate (una de las principales bibliotecas de consulta científica), Dialnet Global quiere llegar a ser el mayor recurso de conocimiento español. Para ello, se han comprometido ya seis millones de euros de inversión, que permitirán a este recurso evolucionar y pasar a ser el portal de ciencia abierta en español. De momento, ya hay 8,5 millones de documentos de 2,5 millones de investigadores que se pueden consultar en abierto. A este repositorio se le añadirán algoritmos para mejorar el conocimiento del español. También quiere facilitar la financiación y realización de proyectos empresariales.