
Inteligencia artificial
El truco inesperado que consigue engañar a la inteligencia artificial
Un grupo de investigadores ha descubierto que la poesía puede confundir a la inteligencia artificial y hacer que responda con contenido que normalmente bloquearía

La inteligencia artificial puede ser brillante resolviendo cálculos o escribiendo textos, pero hay algo que aún no sabe descifrar: la poesía. Un equipo de investigadores del Icaro Lab, en Italia, ha descubierto que los versos pueden engañar incluso a los sistemas más avanzados y hacerles generar contenido que normalmente bloquearían.
En su estudio, los expertos escribieron 20 poemas en inglés e italiano que terminaban con peticiones explícitas para crear materiales peligrosos o promover discursos de odio. Al probarlos con 25 modelos de lenguaje de nueve compañías, entre ellas Google, OpenAI, Meta, Anthropic o xAI, el resultado sorprendió: el 62 % de los sistemas terminó cayendo en la trampa.
Cuando los versos logran confundir a las máquinas
El fenómeno, bautizado como poesía adversarial, aprovecha el carácter impredecible del lenguaje poético. “Los modelos de IA intentan anticipar la siguiente palabra más probable”, explica el fundador de DexAI, Piercosma Bisconti. “Pero los poemas rompen esa lógica, y eso confunde a los filtros de seguridad”.
Algunos modelos resistieron mejor que otros. GPT-5 Nano, de OpenAI, no generó ningún contenido peligroso, mientras que Gemini 2.5 Pro, de Google, falló en todos los casos. Desde DeepMind, la filial de Alphabet, aseguraron que están “reforzando los filtros de seguridad para detectar intenciones dañinas incluso en contextos artísticos”.
Los textos que lograron eludir las protecciones incluían instrucciones sobre cómo fabricar armas, promover la violencia o el autodaño. Los investigadores no publicaron los poemas exactos, ya que, según Bisconti, “la mayoría de las respuestas violarían la Convención de Ginebra”.
El estudio pone de manifiesto una vulnerabilidad importante: no hace falta ser hacker para burlar a la IA, basta con creatividad. Los autores planean ahora abrir un “reto poético” para invitar aescritores y poetas reales a probar hasta dónde puede llegar este curioso “arte del engaño”.
Al final, el hallazgo deja una idea inquietante: la inteligencia artificial puede procesar millones de datos por segundo, pero sigue sin entender del todo los matices del lenguaje humano. Y quizá ahí, en la poesía, aún guardemos nuestra ventaja.
✕
Accede a tu cuenta para comentar


