Sociedad

Ciencia

La genética de las palabras

Las lenguas, como los seres vivos, están en continuo cambio. Nuevas lenguas aparecen al igual que aparecen nuevas especies, y existen lenguas “madres”, “hermanas” y “primas”. Todas juntas forman las familias lingüísticas que recorren la geografía humana de nuestro planeta.

Las principales familias lingüísticas del mundo y su distribución geográfica aproximada. Cada color representa una familia, salvo para las familias australianas, papúes y joisán, que son en realidad grupos de familias que se han agrupado tradicionalmente bajo un mismo paraguas.
Las principales familias lingüísticas del mundo y su distribución geográfica aproximada. Cada color representa una familia, salvo para las familias australianas, papúes y joisán, que son en realidad grupos de familias que se han agrupado tradicionalmente bajo un mismo paraguas.Alberto Aparici / PiMaster3 (Wikimedia)

El lenguaje es uno de los rasgos más humanos que conocemos: todas las sociedades saben convertir en palabras una emoción, una historia del pasado, incluso una idea abstracta. Pero no todos lo hacemos igual: un japonés elegirá sus palabras según cuál sea su relación conmigo, y un ruso habrá de pensar si la acción dura un instante o si dura un día entero. Cada lengua tiene sus matices, y a primera vista este tapiz de sutilezas verbales puede parecer, nunca mejor dicho, una torre de Babel.

Pero esos detalles pueden esconder información valiosa: en los sonidos que utiliza una lengua, o en cómo construye el sujeto de las frases, puede estar codificada la historia de sus hablantes, quiénes fueron sus antepasados y qué pueblos los han dominado a lo largo de la historia. Por ejemplo: el francés tiene los mismos tiempos verbales que el español, y para construir los tiempos compuestos también usa el verbo “haber”. ¿Es casualidad? Sabemos que no: se debe a que ambas lenguas descienden del latín. Y al igual que estas dos también vienen del latín el italiano, el catalán o el rumano.

Las lenguas evolucionan. Es una idea que se toma prestada de la biología, y no es la única, porque en lingüística reencontramos, con algunas diferencias, muchos conceptos de las ciencias biológicas. Por ejemplo, las lenguas tienen una especie de “ADN”: son sus características lingüísticas, que, como el ADN, se hereda de padres a hijos. Este ADN también “muta”, porque las lenguas continuamente incorporan elementos de lenguas vecinas, abandonan expresiones antiguas e inventan otras nuevas. Incluso reencontramos el concepto de especie, porque dos grupos que inicialmente hablaban la misma lengua, si pasan varios siglos separados, pueden terminar hablando versiones tan diferentes que ya no puedan entenderse. En biología diríamos que “ahora son especies diferentes”; en lingüística tenemos lenguas diferentes. Este proceso es el que atravesó el latín durante la Edad Media.

El latín es un caso de verdadera buena fortuna, porque conocemos la lengua original, conocemos las lenguas en las que se ha convertido y, a menudo, sabemos cosas sobre las etapas intermedias. ¡Qué no daría un biólogo por conocer tantos detalles de la evolución de una especie! Pero esto, lamentablemente, es la excepción. Para la mayor parte de lenguas sólo conocemos las versiones más modernas y no sabemos cómo era su lengua “madre”. Por fortuna, lo que sí podemos hacer es analizar estas lenguas modernas y ver si tienen rasgos en común, tratando de deducir cuáles descienden de la misma lengua ancestral.

El resultado de este análisis son las familias lingüísticas, grupos de lenguas que creemos que tienen un antepasado común. Conocemos alrededor de 150 familias diferentes, pero las cinco más grandes comprenden a más del 80% de la población. Hoy vamos a darnos un paseo por algunas de ellas.

Familia indoeuropea

Ésta es la familia a la que pertenece el español, y es también la familia con más hablantes, con casi un 50% de la población mundial. El secreto de su éxito es que incluye a las lenguas coloniales europeas (además del español, el inglés, el portugués, el francés y el holandés), así que tiene hablantes en los cinco continentes. Son indoeuropeas todas las lenguas romances, germánicas y eslavas, el griego, las lenguas iranias de Oriente Medio y muchas de las lenguas habladas en India y Pakistán.

Las migraciones indoeuropeas, tal y como las hemos reconstruido en base a evidencias arqueológicas, genéticas y lingüísticas. La patria ancestral de los indoeuropeos estaría en las estepas al norte del Cáucaso y coincidiría con la cultura yamna, alrededor del 3500 a.C. En naranja oscuro están marcadas las zonas que los indoeuropeos habrían colonizado en el año 2500 a.C., y en naranja claro las regiones a las que habrían llegado alrededor del 1000 a.C.
Las migraciones indoeuropeas, tal y como las hemos reconstruido en base a evidencias arqueológicas, genéticas y lingüísticas. La patria ancestral de los indoeuropeos estaría en las estepas al norte del Cáucaso y coincidiría con la cultura yamna, alrededor del 3500 a.C. En naranja oscuro están marcadas las zonas que los indoeuropeos habrían colonizado en el año 2500 a.C., y en naranja claro las regiones a las que habrían llegado alrededor del 1000 a.C.Dbachmann (Wikimedia)

Las lenguas indoeuropeas suelen tener una morfología compleja: los nombres distinguen entre singular y plural, a menudo tienen género y a veces también tienen casos. Los verbos suelen tener conjugaciones elaboradas. Para desplegar todo este abanico de significados las lenguas indoeuropeas usan sufijos, como el -s del castellano para indicar el plural. Es común que un solo sufijo contenga mucha información, como en la terminación verbal -mos del español, que indica “primera persona del plural del presente”. Otra forma de modificar el significado de las palabras, propia de las lenguas de esta familia, es el ablaut indoeuropeo, que consiste en cambiar una vocal en la raíz de la palabra. Ejemplos de este ablaut son el verbo inglés sing (presente), sang (pasado), sung (participio), o el español soy - eres - es - somos.

Familia afroasiática

Es quizá la familia con más solera, ya que incluye dos de las primeras lenguas que fueron puestas por escrito: el acadio, que fue una lengua franca en la antigua Mesopotamia durante milenios, y el egipcio. La familia incluye todas las lenguas semíticas y también otras ramas más pequeñas, como las lenguas bereberes.

En la imagen vemos un fragmento de escritura jeroglífica proveniente de la tumba de Seti I (Dinastía XIX, siglo XIII a.C.)
En la imagen vemos un fragmento de escritura jeroglífica proveniente de la tumba de Seti I (Dinastía XIX, siglo XIII a.C.)Jon Bodsworth (Egypt Archive)

Una de las características definitorias de la familia son los pronombres personales, que pueden aparecer como palabras independientes, pero también como prefijos o sufijos. Un pronombre adosado a un sustantivo se entiende que representa posesión, como en español “mi, tu, su”. Adosado a un verbo, en cambio, suele indicar el objeto de la acción, como en español “a mí, a ti”. Otro rasgo habitual en las lenguas afroasiáticas es que las palabras cambian su significado mediante prefijos o sufijos, pero también mediante mutaciones internas: por ejemplo, cambiando algunas de las vocales internas de la palabra, o duplicando una consonante.

Familia chino-tibetana

Esta familia, la segunda con más hablantes después de la indoeuropea, está dominada por los más de 1200 millones de hablantes de las lenguas chinas, pero su historia sólo se entiende si incluimos también las lenguas tibetanas y birmanas, que se separaron de las chinas alrededor del 4000 a.C. La influencia de esta familia en la cultura y las lenguas de Extremo Oriente ha sido inmensa, sobre todo a través del chino.

Las palabras de las lenguas chino-tibetanas tienen tendencia a ser monosilábicas, y casi en todos los casos incluyen tonos. Esto quiere decir que la misma palabra pronunciada agudo o grave tiene significados diferentes. No se sabe si la presencia de tonos es ancestral en esta familia, pero en los últimos años la comunidad parece decantarse por que es un carácter adquirido. Otras familias lingüísticas del sudeste asiático, en principio sin relación con la chino-tibetana, también poseen tonos. Otro debate muy activo es si la forma ancestral de la lengua chino-tibetana era flexiva, como algunas lenguas del Himalaya que tienen conjugaciones verbales muy complejas, o aislante, como las lenguas chinas, que casi nunca modifican las palabras y es el orden dentro de la oración el que establece su papel en la frase. A día de hoy esta cuestión sigue estando en el aire.

Familia nigercongolesa

La nigercongolesa es la familia con mayor número de lenguas individuales del mundo, y la más hablada de África. Se extiende por todo el continente al sur del Sáhara e incluye alrededor de 1500 lenguas. Las más notables son el yoruba de Nigeria y las lenguas bantúes, entre las que está el suajili, una lengua franca empleada por decenas de millones de personas en todo el este y sudeste de África.

Un rasgo característico de las lenguas nigercongolesas es que los sustantivos tienen una propiedad gramatical llamada clase. La clase se indica mediante un prefijo o un sufijo, e indica algún atributo del sustantivo. Podemos imaginarlo observando cómo indicamos el género en español: la terminación -o a menudo indica “género masculino” y -a, “género femenino”. Las clases siguen esta misma lógica, pero los prefijos o sufijos pueden indicar todo tipo de cosas: si el sustantivo se refiere a un lugar, si se refiere a un concepto abstracto, o si se refiere a un grupo de personas. Por ejemplo, el nombre de la lengua suajili es kiswahili, pero el nombre de la etnia suajili es waswahili. Los prefijos ki- y wa- son dos de los más de veinte marcadores de clase de la lengua suajili.

Familia austronesia

La austronesia es la familia lingüística de Oceanía por antonomasia. Se extiende por todas las islas del Pacífico, desde Nueva Zelanda a Hawái y desde Pascua a las Filipinas, e incluye el malayo, hablado por 300 millones de personas. La pericia de los navegantes austronesios era tal que varios grupos procedentes de Indonesia colonizaron Madagascar hace 2000 años, atravesando todo el Océano Índico, y hoy en Madagascar se habla una lengua austronesia.

La fonética de las lenguas austronesias es pobre en comparación con otras familias: la mayoría tienen sólo cuatro o cinco vocales, y muchas tienen menos de quince consonantes. Las raíces de las palabras tienen una estructura muy sencilla, a menudo de la forma consonante-vocal-consonante-vocal. A esta raíz se le añaden luego gran cantidad de prefijos y sufijos para completar el significado. Es común el uso de la reduplicación, la repetición de todo o parte de una palabra, con gran variedad de significados: desde construir el plural a añadir énfasis, o también indicar si una acción es breve o prolongada.

Familia túrquica

Esta familia ha sido extraordinariamente influyente en el centro de Asia durante los últimos 2000 años, gracias al poderío militar de los pueblos túrquicos y a la riqueza generada por el comercio a lo largo de la Ruta de la Seda. En la actualidad se extiende desde Yakutia, en el nordeste de Siberia, hasta Turquía y algunas zonas del este de Europa, y presenta una inteligibilidad mayor que otras familias: los hablantes de una región a menudo pueden comunicarse, con más o menos dificultades, con los de las regiones circundantes.

En este cartel podemos ver inscripciones en cinco idiomas diferentes de cuatro familias lingüísticas: de izquierda a derecha, mongol (familia mongólica), chagatai (familia túrquica), chino y tibetano (familia chino-tibetana) y manchú (familia tungús). La escritura chagatai, como podemos ver, está basada en la árabe (a través del persa), mientras que la escritura manchú proviene de la mongólica. El cartel está instalado en la residencia de verano de Chengde, construida por los emperadores chinos de la dinastía Qing en el siglo XVIII, y simplemente indica el nombre de una puerta: la Puerta de la Belleza y la Virtud.
En este cartel podemos ver inscripciones en cinco idiomas diferentes de cuatro familias lingüísticas: de izquierda a derecha, mongol (familia mongólica), chagatai (familia túrquica), chino y tibetano (familia chino-tibetana) y manchú (familia tungús). La escritura chagatai, como podemos ver, está basada en la árabe (a través del persa), mientras que la escritura manchú proviene de la mongólica. El cartel está instalado en la residencia de verano de Chengde, construida por los emperadores chinos de la dinastía Qing en el siglo XVIII, y simplemente indica el nombre de una puerta: la Puerta de la Belleza y la Virtud.Vberger (Wikimedia)

Lingüísticamente las lenguas túrquicas son aglutinantes: modifican el significado de las palabras añadiéndoles prefijos o sufijos, que pueden concatenarse para formar palabras muy largas. Cada uno de estos modificadores transporta un único significado: por ejemplo, uno de ellos podría representar “plural”, otro “posesión por nosotros” y un tercero “dirección de movimiento”, con lo que una palabra que aglutinara todos esos modificadores la traduciríamos como “hacia nuestros Xs”. Esto contrasta con la lógica de las lenguas fusionantes, como las indoeuropeas, que tienden a fusionar todos esos modificadores en una única desinencia más breve. En las lenguas túrquicas los modificadores son casi siempre sufijos.

Otra característica fundamental de esta familia es la armonía vocálica: las vocales de la palabra controlan qué tipo de vocal habrá en el sufijo, de forma que todas estén “en armonía”. La mayoría de las lenguas túrquicas distinguen dos “dimensiones” en las vocales: anteriores (e, i, ö, ü) contra posteriores (a, o, u), y redondeadas (o, u, ö, ü) contra no redondeadas (e, i, a). Los sufijos suelen tener, al menos, una versión anterior y una posterior, para poder armonizarse con las palabras a las que modifican, y a veces también tienen versiones redondeadas y no redondeadas. La armonía vocálica aparece en muchas otras familias lingüísticas, pero en las lenguas túrquicas es un rasgo ancestral, heredado de la lengua madre.

El euskera

El euskera es una lengua hablada en una pequeña región del norte de España y el sur de Francia, y es el único representante vivo de su familia lingüística. Sus características son muy diferentes a las de las lenguas indoeuropeas de las regiones limítrofes, y, en realidad, a las de cualquier otra lengua conocida. Se ha intentado relacionarla con el íbero (cuyas inscripciones están todavía por descifrar), con las lenguas bereberes y con las lenguas caucásicas, pero ninguno de esos intentos ha resultado convincente. La idea, más plausible, de que forme parte de una familia que se extendía por Europa antes de la llegada de los indoeuropeos se apoya en una evidencia más bien escasa. A día de hoy la cuestión sigue abierta.

Los nombres en euskera pueden modificar su significado mediante una serie de sufijos que a primera vista parecen similares a los casos de las lenguas indoeuropeas. Sin embargo, una inspección más cercana revela que la lógica de estos “casos” se acerca a la de las lenguas aglutinantes, porque los sufijos gozan de cierto grado de independencia. Por ejemplo, “hombre” se escribe gizon, y “con el hombre” gizonarekin, con los sufijos -a, que hace las veces de artículo determinado, y -(r)ekin, que indica “junto con”. Pero si el nombre va seguido de un adjetivo los sufijos pasan a ir detrás del adjetivo, como en gizon gaztearekin, “con el hombre joven”, de forma que están menos ligados al sustantivo que los casos “canónicos” indoeuropeos.

Los verbos contienen algunas de las mayores peculiaridades del euskera: para empezar, sólo alrededor de una decena de verbos tienen conjugación propia; los demás se conjugan con la ayuda de un auxiliar, que es el que transporta la información de tiempo, número y objeto. Esta información es bastante detallada: la conjugación incluye información sobre el sujeto, el objeto directo, el objeto indirecto y, a veces, sobre la persona con la que se habla. De esta forma el verbo auxiliar constituye una pequeña recapitulación de todo lo que se ha dicho en la frase.

Familia Na-Dené

Es una familia de lenguas nativas norteamericanas extendida por el noroeste de Canadá y con representantes aislados en la costa pacífica y en el sur de Estados Unidos. La mayoría de sus lenguas son habladas sólo por unos pocos miles de personas y están fuertemente amenazadas. Sólo el navajo, hablado en los estados de Arizona, Nuevo México y Utah, goza de una relativa buena salud.

El rasgo más característico de las lenguas na-dené es un complejo sistema de prefijos usado en la conjugación verbal. Estos prefijos permiten que el verbo incluya información, entre otras cosas, sobre el sujeto, el objeto directo, los adverbios presentes en la frase, el grado de sorpresa del hablante o si la información proporcionada es de primera o de segunda mano. Especialmente propios de la familia son un grupo de prefijos verbales que permiten cambiar la transitividad del verbo: uno de ellos transformaría el verbo “cazar (algo)” en el verbo “ser cazado”, con lo que en español lo traduciríamos como una voz pasiva. Otro de ellos convertiría el verbo “cazar (algo)” en “hacer (a alguien) cazar (algo)”. El verbo “hacer cazar” es más transitivo que “cazar” a secas, porque hay dos objetos: la persona que es obligada a cazar y el animal que es cazado; en cambio, “ser cazado” es menos transitivo, ya que no tiene objeto.

Esta compleja plétora de prefijos verbales ha permitido a algunos investigadores señalar un paralelismo fascinante: entre las lenguas na-dené y las lenguas yeniseicas, habladas en la región del río Yenisei, en el corazón de Siberia. Esta relación es todavía tentativa, pero los paralelismos en un sistema de prefijos que no es en absoluto común resultan intrigantes. De confirmarse sería la única relación conocida entre una familia del Nuevo Mundo y del Viejo Mundo, y podría ayudar a arrojar luz sobre las migraciones que poblaron América y el norte de Asia después del último periodo glacial.

Familia maya

Esta familia es la heredera de las lenguas habladas por las sucesivas civilizaciones mayas en Centroamérica, y hoy permanece viva en Guatemala, Belice y el sur de México. Son las únicas lenguas nativas americanas que desarrollaron un sistema de escritura propio, los glifos mayas. Como el japonés moderno, ese sistema incluía glifos que representaban palabras completas y otros que representaban sonidos silábicos.

Dos formas diferentes de escribir la palabra “jaguar” (b’alam) usando glifos mayas. A la izquierda, un logograma que representa directamente toda la palabra (y que de hecho se parece a la cabeza de un jaguar). A la derecha, la palabra escrita mediante tres signos silábicos: b’a, la y ma.
Dos formas diferentes de escribir la palabra “jaguar” (b’alam) usando glifos mayas. A la izquierda, un logograma que representa directamente toda la palabra (y que de hecho se parece a la cabeza de un jaguar). A la derecha, la palabra escrita mediante tres signos silábicos: b’a, la y ma.Goran tek-en (Wikimedia)

Lingüísticamente son idiomas fuertemente aglutinantes y una de sus características es que carecen casi por completo de preposiciones. Para indicar las cosas que nosotros expresaríamos con una preposición, como la posición o la dirección del movimiento, utilizan sustantivos relacionales, nombres cuyo significado sugiere esas nociones de “situación” o “movimiento”. A menudo estos sustantivos representan partes del cuerpo. Por ejemplo, para expresar “el plato está sobre la mesa” muchas lenguas mayas dirían algo del tipo “el plato es la cabeza de la mesa”.

Familia quechua

Las lenguas quechuas son las herederas de los idiomas utilizados en el imperio inca, y en la actualidad se hablan sobre todo en Perú, Bolivia y Ecuador. Durante la época colonial se utilizaron como lengua franca entre los diversos pueblos del altiplano, y eso ha contribuido a que hayan llegado hasta nosotros con cierta vitalidad. Lamentablemente su uso escrito sigue siendo escaso aun en la actualidad.

Se trata de lenguas aglutinantes y extremadamente regulares, hasta el punto de que la mayoría no tiene verbos irregulares, y el número de excepciones a las reglas gramaticales es muy escaso. Todas poseen un trío de sufijos que permite marcar la “credibilidad” de la información que se está transmitiendo. El primero de esos sufijos indica “es información de primera mano, yo lo vi”; el segundo indica que se trata de una deducción o una conjetura; el tercero marca explícitamente que se trata de información que otra persona nos ha dado. Estos sufijos pueden agregarse a un sustantivo, un verbo, un adjetivo o un adverbio, según qué información queramos matizar.

QUE NO TE LA CUELEN

  • Aunque dos lenguas parezcan muy diferentes a primera vista, es posible que un análisis más en detalle revele que tienen puntos en común: por ejemplo, los verbos en la mayoría de las lenguas indoeuropeas distinguen entre una acción finalizada (voló) y una acción que dura un tiempo indeterminado (volaba).
  • Algunas lenguas no parecen tener rasgos en común con ninguna otra lengua conocida y no pueden ser clasificadas dentro de ninguna familia. Se llaman lenguas aisladas, y el ejemplo paradigmático es el euskera.

REFERENCIAS