Lingüística

“Jajajajaja”, “perdóooooooon”, “gooooooooooooollllllllllllll”: 100.000 millones de tuits revelan por qué estiramos las palabras

Repetir letras en las palabras cambia su significado, pero ni los diccionarios ni los filtros de spam saben lidiar con ellas.

Dos chicas jóvenes, de pie con las cabezas juntas mirando el móvil de una de ellas y riéndose
Estas chicas probablemente contestarían con “jajajaja” a lo que están leyendoDominio público

Si me escribes un WhatsApp y respondo solo “ja”, probablemente entiendas que no me ha hecho gracia, pero si te contesto con un “jajajajajajajajajaja” sabrás que tu chiste habrá tenido más éxito que si te respondo “jajaja”. A lo mejor no estoy siendo sincera si te pido “perdóooooooon”. Eso sí, cuando quiera celebrar contigo un tanto de mi equipo de fútbol te escribiré “gooooooooooooollllllllllllll”, porque si escribo solo “gol” sonará muy frío.

Está claro que repetir determinadas letras de algunas palabras añade matices a su significado. Aunque estas “palabras estiradas” apenas se usan en el lenguaje escrito formal y en la literatura aparecen solo a veces, en las redes sociales están a la orden del día. De hecho, algunas voces expertas defienden que se han convertido en una parte fundamental de nuestro lenguaje. Sin embargo, todavía no aparecen en los diccionarios, y los correctores ortográficos las siguen resaltando como erróneas (como compruebo mientras escribo este artículo).

Ni siquiera es fácil estudiarlas. Para analizar los patrones que se dan en el lenguaje hay que procesar grandes cantidades de datos, a veces con inteligencia artificial. Sin embargo, las herramientas actuales no siempre dan buenos resultados al analizar el lenguaje no estándar típico de las redes sociales. A veces se saltan las palabras estiradas, y los buscadores de internet no siempre asocian las palabras que buscamos con sus versiones estiradas.

Equilibrio y estiramiento

Pero, por suerte, cada vez son más las personas que desarrollan nuevas técnicas estadísticas para analizar el lenguaje. En 2020, un equipo de la Universidad de Vermont, en Estados Unidos, revolucionó el estudio de las palabras estiradas con un análisis de 100 000 millones de tuits de entre 2008 y 2016. Publicaron sus resultados en PLoS ONE.

Para lograrlo, desarrollaron una manera de clasificar automáticamente las palabras según qué letras estuvieran repetidas y cuántas veces. Así, comprobaron que no todas las palabras están igual de equilibradas: en algunas, como “jajaja”, todas las letras se repiten por igual, mientras que en otras como “perdóooooon” solo se repite una letra. También cuantificaron el grado de estiramiento de las palabras, y observaron que las palabras cortas como “ja” tienden a estirarse más que las largas como “aprendizaje” o “aprendiendo” (“learning”, en el original, ya que el estudio se centraba en tuits en inglés o sin marca de idioma).

Vida propia

Pero, además, el análisis de las palabras estiradas desveló una característica sorprendente. Cuando se empezaron a usar en el lenguaje escrito, eran un mero reflejo del lenguaje oral. Por eso, la repetición de letras correspondía a los sonidos que se alargaban dentro de cada palabra. Por eso, las pocas veces que aparecían en la literatura, se encontraban durante los diálogos. Incluso cuando se han vuelto más comunes, se concentran en ámbitos informales donde el lenguaje escrito se asemeja más al oral.

Sin embargo, recientemente las palabras estiradas han cobrado vida propia: es cada vez más frecuente que se repitan letras que no se pueden o suelen articular, como “por favorrrrrrr” (“pleaseeeeee”) o “aaaayyyyuuuuddddaaaa” (“hhhheeeeeeeeelllllpppppp”). Según los investigadores, esta disociación puede deberse a que las palabras estiradas destacan visualmente en las redes. Piensan que las palabras estiradas, independientemente de cómo se pronunciarían, contribuyen a llamar la atención sobre todo en entornos como Twitter donde el límite de caracteres impide a veces transmitir sutilezas de significado.

Tan comunes son las palabras estiradas hoy en día que cada vez son más las voces que reclaman su entrada en el diccionario. La versión inglesa del diccionario colaborativo Wiktionary contempla la repetición de letras entre sus criterios de inclusión para las palabras, pero los más tradicionales no lo hacen. Para las voces críticas, los diccionarios que no incluyen estas palabras no reflejan los usos del lenguaje que se dan realmente en este sentido.

Del spam a la genética

Pero la repercusión de las palabras estiradas va mucho más allá de su estudio académico. En la actualidad, algunos filtros de spam en Twitter no detectan estas palabras con tanta facilidad como sus versiones regulares. Incluso hay quien se aprovecha de nuestras erratas (como letras repetidas) al escribir una dirección web en el navegador. Estas direcciones erróneas pueden dirigir a páginas web de competidores, a webs que imitan la original pero roban los datos que se introducen o a sitios que descargan virus en el ordenador de quien comete la errata.

Según los autores del estudio de PLoS ONE, tener mejores herramientas para analizarlas permitiría detectar pequeñas variaciones en los tuits o en las direcciones web y así mejorar los filtros de spam o prevenir el aprovechamiento malicioso de las erratas. Las técnicas desarrolladas en el estudio, sostienen, constituyen un primer paso para lograrlo.

De hecho, el estudio de las palabras estiradas podría incluso trascender las propias palabras. Al fin y al cabo, estas son series de letras, algunas de ellas repetidas: al igual que las secuencias de ADN. Para estudiar estas secuencias se necesitan herramientas informáticas, ya que las series son tan largas que son inabarcables para una persona. Y, si en las palabras estiradas la repetición de letras modifica el significado, la repetición en las secuencias genéticas también acarrea consecuencias sobre el genoma. Por eso se podrían aprovechar las técnicas de análisis de palabras estiradas para estudiar los patrones de repetición en estas secuencias.

Así que ya sabes: la próxima vez que quieras transmitir tu risa en un mensaje de WhatsApp, piensa bien en cuántos “ja” escribes.

QUE NO TE LA CUELEN:

  • 100 000 millones de tuits pueden parecer muchos, pero solo constituyen el 10 % de todos los tuits publicados entre 2008 y 2016. En 2020 enviamos unos 500 millones de tuits al día, que corresponden a unos 180 000 millones de tuits en todo el año.

REFERENCIAS (MLA):