Matemáticas

¿Tienes el mismo ADN que un asesino?

Las pruebas de ADN no son tan fiables como pensamos, y las matemáticas te muestran por qué.

Tarta redonda con cobertura blanca y una calavera encima, con rallas verdes, rojas y amarillas a los lados
Tarta del Día de los MuertosRochelle HartmanCreative Commons

20 años después de la invención del análisis de ADN para la investigación forense, su creador alertó de que podía dar lugar a identificaciones erróneas. El problema del que alertaba el genetista Alec Jeffreys en el año 2004 no se debía a la técnica en sí, sino a la cantidad de información sobre cada persona que había en las bases de datos policiales. Según Jeffreys, la información genética no era suficiente, por tanto era relativamente probable que una muestra de ADN se atribuyera a la persona que no era. Es decir, nos habíamos creído que el análisis de ADN era la prueba definitiva para resolver cualquier delito, pero en realidad no era tan fiable.

La solución que proponía Jeffreys consistía en aumentar la cantidad de información genética sobre cada persona que se almacena en las bases de datos policiales. El genetista sostenía que había una probabilidad demasiado elevada de que dos personas tuvieran la misma información genética en los diez marcadores que habitualmente se registraban. Esto querría decir que habría demasiados falsos positivos: casos donde el análisis de las muestras recogidas en la escena del delito se correspondieran con una persona de la base de datos, pero esa persona no tuviera nada que ver con el delito.

Sin embargo, cuantos más marcadores se compararan, menor sería la probabilidad de tener un falso positivo. Aunque la grandísima mayoría de nuestros genes (el 99,9 %) son exactamente iguales a los de cualquier otra persona en el mundo, las bases de datos policiales almacenan solo una pequeña parte del 0,1 % restante. Guardar absolutamente todo el ADN que nos distingue del resto de personas y, sobre todo, analizarlo en cada muestra sería muy poco práctico, por eso se eligen unos cuantos marcadores para comparar.

La paradoja del cumpleaños

Se estima que la probabilidad de que dos personas sin relación de parentesco compartan la información de diez marcadores es de 1 entre mil millones, o el 0.0000001 %. Sin embargo, esta cifra tan pequeña se traduce en una probabilidad bastante más elevada de que, si una muestra de ADN coincide con una persona de la base de datos, se trate de un falso positivo. ¿Por qué? La clave está en la llamada “paradoja del cumpleaños”.

Cambiemos la escena del delito por un escenario más festivo e imaginemos un grupo de 23 personas en una celebración. ¿Qué es más probable, que al menos dos compartan cumpleaños, o que cada una cumpla un día distinto del año? Sin considerar años bisiestos, en principio la probabilidad de que dos personas cumplan años el mismo día es de 1 entre 365, o el 0,27 %. Sin embargo, en un grupo de 23 personas, la probabilidad de encontrar a dos con el mismo cumpleaños es del 50,05 %. Es decir, es más probable que dos personas cumplan el mismo día que lo contrario.

No estamos hablando de la probabilidad de que una persona concreta de la sala cumpla años el mismo día que tú: esa probabilidad es mucho menor. Lo que queremos calcular es la probabilidad de que haya dos personas en el grupo que cumplan años el mismo día, sin importar quiénes sean ni de qué día se trate. Para eso tenemos que fijarnos en cuántas posibles parejas hay en un grupo de 23 personas. La primera persona (cualquiera que sea) puede estar emparejada con otras 22. La segunda puede estar emparejada con otras 21, además de con la primera que ya hemos contado. La tercera, con otras 20, y así sucesivamente.

Si sumamos todas estas cifras, obtenemos 253 posibles parejas en el grupo. Para cualquiera de estas parejas, la probabilidad de que cumplan años el mismo día es de 1/365, por tanto la probabilidad de que tengan cumpleaños distintos es de 364/365. Para saber qué probabilidad hay de que ninguna de las 253 parejas cumpla años el mismo día, calculamos (364/365)^253 = 49,95 %. Por tanto, la probabilidad de que haya al menos dos personas con el mismo cumpleaños es del 50,05 %.

Colisiones en el espacio

Que las probabilidades se amplifiquen de esta manera también tiene implicaciones para la basura espacial. Si elegimos dos objetos concretos en el espacio, la probabilidad de que choquen es ínfima. Pero, a lo largo de las décadas, se han ido acumulando cientos de miles de objetos en nuestros cielos, y las colisiones son mucho más frecuentes de lo que nuestra intuición esperaría. Las colisiones, a su vez, parten los objetos en trozos más pequeños y el número de objetos en el espacio aumenta, en un círculo vicioso cada vez más difícil de romper. Cuanta más basura permanezca en el espacio, más difícil será ubicarla y prevenir, o al menos predecir, los choques, y más complicado será encontrar órbitas limpias para los satélites que enviamos al espacio.

Además, la paradoja del cumpleaños se puede emplear para falsificar firmas digitales. Cuando firmamos un documento con nuestro certificado electrónico, realmente estamos transformando el documento en un número muy grande (conocido como hash) que se combina con el certificado, de forma que cualquier persona puede verificar a quién pertenece el certificado en ese documento. Pero cabe la posibilidad de que dos documentos (uno legítimo y uno falso) se conviertan en el mismo hash. Si firmamos el documento legítimo con nuestro certificado, alguien podría intervenir para que nuestra firma se pudiera verificar también en el documento falso. Por la paradoja del cumpleaños, la probabilidad de que dos documentos tengan el mismo hash es más elevada de lo que pueda parecer.

De la misma manera, aunque la probabilidad de que dos personas concretas compartan los diez marcadores de ADN que almacena la policía sea muy reducida, esta se traduce en una probabilidad mucho más palpable de falsos positivos. Solo en España (con una población de unos 47 millones de habitantes), la probabilidad de que tus diez marcadores coincidan con los de otra persona es del 4,6 %. En nuestro país se cometen unos 300 asesinatos al año, y las pruebas de ADN darían 13 falsos positivos. 13 personas acusadas erróneamente cada año sería, sin duda, demasiado.

Más pruebas

Por eso Jeffreys proponía, ya en el año 2004, que las bases de datos almacenaran la información de 15 o 16 marcadores de ADN. Desde 2009, España obliga a guardar la información de 12 marcadores y el informe del Ministerio de Justicia indica que la mayoría de instituciones que registran perfiles de ADN incluyen hasta 21. Así, la probabilidad de que el análisis de ADN dé un falso positivo es mucho menor.

Pero, sobre todo, el análisis de ADN por sí solo no debería ser suficiente para acusar a una persona de un delito. Los casos más fiables son aquellos en los que la prueba de ADN se utiliza para confirmar otras pruebas, como materiales que se encuentren en la escena del delito o testigos que acrediten si la persona sospechosa podía o no estar cerca del lugar donde se cometió. O, incluso cuando la persona sospechosa lo es solo por un análisis de ADN, se deberían buscar otras pruebas que confirmen su implicación. La probabilidad a veces es resbaladiza, pero hay maneras de negociar con ella.

QUE NO TE LA CUELEN:

  • La paradoja del cumpleaños no es el único motivo por el que puede haber falsos positivos en las pruebas de ADN. Las muestras pueden estar contaminadas y el ADN puede viajar a lugares donde la persona a quien pertenece no ha estado, y estos factores pueden afectar al resultado del propio análisis. Actualmente se pone cuidado para no contaminar las muestras y se investiga para averiguar qué distancia puede recorrer el ADN y cuánto tiempo puede permanecer.

REFERENCIAS (MLA):