Inteligencia artificial

El truco inesperado que consigue engañar a la inteligencia artificial

Un grupo de investigadores ha descubierto que la poesía puede confundir a la inteligencia artificial y hacer que responda con contenido que normalmente bloquearía

Una IA de Anthropic pone en alerta a investigadores al decirle a un usuario que “la gente bebe lejía todo el tiempo”
El director James Cameron y su aversión a la IA y los "actores" creados con ella, como Tilly Norwood

Día de la poesía 2022agapea

Lara Tarrío
Lara Tarrío

Creada: 01.12.2025 18:30

Última actualización: 01.12.2025 18:30

La inteligencia artificial puede ser brillante resolviendo cálculos o escribiendo textos, pero hay algo que aún no sabe descifrar: la poesía. Un equipo de investigadores del Icaro Lab, en Italia, ha descubierto que los versos pueden engañar incluso a los sistemas más avanzados y hacerles generar contenido que normalmente bloquearían.

En su estudio, los expertos escribieron 20 poemas en inglés e italiano que terminaban con peticiones explícitas para crear materiales peligrosos o promover discursos de odio. Al probarlos con 25 modelos de lenguaje de nueve compañías, entre ellas Google, OpenAI, Meta, Anthropic o xAI, el resultado sorprendió: el 62 % de los sistemas terminó cayendo en la trampa.

Cuando los versos logran confundir a las máquinas

El fenómeno, bautizado como poesía adversarial, aprovecha el carácter impredecible del lenguaje poético. “Los modelos de IA intentan anticipar la siguiente palabra más probable”, explica el fundador de DexAI, Piercosma Bisconti. “Pero los poemas rompen esa lógica, y eso confunde a los filtros de seguridad”.

Algunos modelos resistieron mejor que otros. GPT-5 Nano, de OpenAI, no generó ningún contenido peligroso, mientras que Gemini 2.5 Pro, de Google, falló en todos los casos. Desde DeepMind, la filial de Alphabet, aseguraron que están “reforzando los filtros de seguridad para detectar intenciones dañinas incluso en contextos artísticos”.

Los textos que lograron eludir las protecciones incluían instrucciones sobre cómo fabricar armas, promover la violencia o el autodaño. Los investigadores no publicaron los poemas exactos, ya que, según Bisconti, “la mayoría de las respuestas violarían la Convención de Ginebra”.

El estudio pone de manifiesto una vulnerabilidad importante: no hace falta ser hacker para burlar a la IA, basta con creatividad. Los autores planean ahora abrir un “reto poético” para invitar aescritores y poetas reales a probar hasta dónde puede llegar este curioso “arte del engaño”.

Al final, el hallazgo deja una idea inquietante: la inteligencia artificial puede procesar millones de datos por segundo, pero sigue sin entender del todo los matices del lenguaje humano. Y quizá ahí, en la poesía, aún guardemos nuestra ventaja.

Accede a tu cuenta para comentar

El truco inesperado que consigue engañar a la inteligencia artificial

Un grupo de investigadores ha descubierto que la poesía puede confundir a la inteligencia artificial y hacer que responda con contenido que normalmente bloquearía

Cuando los versos logran confundir a las máquinas

Noticias destacadas

Pronóstico del tiempo en España para esta semana: la AEMET anuncia un tren de frentes con fuertes lluvias y nieve

Diciembre arranca con un frente frío que desplomará las temperaturas y traerá nuevas lluvias

El partido más difícil: grandes deportistas que lucharon contra el Sida y tal vez no lo sepas

La Fiscalía, en contra de imputar a Armengol: "Un mero olvido"