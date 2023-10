Para muchos, la inteligencia artificial ha venido para destruir grandes cantidades de empleo. Y puede que sea así, pero lo que sí que podemos dar por hecho es que ya está transformando miles de ellos.

Sin embargo, la apertura a nuevos usos de esta tecnología gracias a la IA generativa también están dando pie a que antiguas profesiones encuentren nuevos nichos de mercado. Sin ir más lejos, algunas de las grandes empresas del sector están contratando creativos, novelistas y hasta poetas para nutrir el datset de sus modelos de lenguaje.

Echando un vistazo se pueden encontrar una serie de ofertas de trabajo de destacadas empresas de datos de entrenamiento, como Scale AI y Appen, dedicadas a contribuir a los resultados de una IA y mejorar sus respuestas.

Estas compañías están reclutando poetas, novelistas, dramaturgos o escritores con un doctorado o que ejercen la formación. Muchas buscan profesionales generales con títulos en humanidades o años de experiencia laboral en campos literarios en distintos idiomas.

La respuesta es alimentarla con mejor contenido en un momento en el que mucho de lo generado por la IA empieza a ser cuestionado.

Las empresas afirman que los escritores contratados escribirán cuentos cortos sobre un tema dado para alimentar modelos de IA. También utilizan a estos trabajadores para obtener opiniones y mejoras sobre la calidad literaria de su texto generado por IA actual.

Esta oferta revela cómo funciona el sistema de refinamiento de estas tecnologías que aún tiene una capa humana importante. Cuando ChatGPT se lanzó en noviembre de 2022, mucha gente se quedó sorprendida por su capacidad para generar pequeñas historias de ficción y hasta poemas. Sin embargo, esta habilidad le era sobre todo dada en el idioma inglés, debido a que su base de datos carecía de tantas referencias en otros lenguajes.

Los clientes de Scale AI y Appen, las empresa de mejoras de datos que ofrecen los puestos, incluyen algunos de los nombres más grandes en el desarrollo de IA, como OpenAI, Meta, Google y Microsoft.

En una declaración al portal Rest of World, un portavoz de Appen dijo que la demanda de contratistas de escritura ha aumentado significativamente desde finales de 2022, incluyendo en idiomas distintos al inglés. "Cuando contratamos para roles como estos, identificamos los tipos de habilidades requeridas para desarrollar datos de entrenamiento de alta calidad para un caso de uso y cliente específico", dijo el portavoz. "En este caso, los escritores creativos tienen una experiencia única que nos permite desarrollar datos de entrenamiento de alta calidad para la generación creativa de IA, como poesía, letras de canciones y escritura narrativa", añadió.

Entrenar una herramienta de IA para generar escritura literaria de alta calidad, como la poesía, no es un desafío pequeño. Muchos modelos de lenguaje grandes (LLMs) no están diseñados para ser creativos. Uno de los criterios utilizados por los investigadores de IA para juzgar la creatividad es la novedad, es decir, cuán diferente es la escritura generada por un modelo de lo que ya existe en el mundo. Pero las herramientas como ChatGPT fueron construidas para imitar la escritura humana, no para innovar en ella.

Están entrenados para reproducir. No están diseñados para ser creativas por sí mismas. ChatGPT, por ejemplo, tiene dificultades para imitar la estructura y el ritmo de poetas clásicos inglés.

Un estudio reciente encontró que ChatGPT falla en gran medida en producir poemas en inglés en el estilo de Walt Whitman, uno de los poetas más referenciados y por lo tanto arquetípicos de Estados Unidos. El estilo de Whitman presenta versos fluidos y no estructurados, pero ChatGPT a menudo se adhiere erróneamente a la norma rígida de estrofas de cuatro líneas. El estudio demostró que continuaba haciendo esto incluso cuando se le pedía que no lo hiciera.

Estos problemas a menudo se agravan cuando se le pide a ChatGPT que produzca escritura poética en idiomas distintos al inglés. Los mismos investigadores tuvieron dificultades para imitar los estilos de poesía de otras lenguas y marcos propios como los haiku japoneses.

De ahí que el alimentar estas máquinas con cada vez más poesía pero también corregir sus resultados con profesionales que lo pulan es vital para ir mejorándolo.

Los principales desarrolladores de IA han estado utilizando bases de datos fácilmente rastreables para entrenar sus modelos de escritura literaria, como Project Gutenberg, una base de datos de código abierto con decenas de miles de obras literarias en el dominio público. Algunos investigadores también especulan que los desarrolladores han estado extrayendo datos de Archive of Our Own, comúnmente conocido como AO3, una plataforma que alberga más de 5 millones de obras de fan fiction.

Según informó recientemente también el medio The Atlantic, las obras con derechos de autor de famosos autores como Stephen King, Jane Austen, pero también autores españoles como Miguel Delibes forman parte del popular conjunto de datos Books3, que usa ChatGPT.