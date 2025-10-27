Parece ciencia ficción, pero es una recomendación cada vez más extendida entre expertos en ciberseguridad: pactar una palabra clave secreta con familiares y amigos. La implantación de estas medidas de seguridad olvidadas se perfila como una de las defensas más eficaces para hacer frente a una amenaza que ataca uno de los rasgos más íntimos y, hasta ahora, fiables de una persona: su propia voz.

Todo ello porque la suplantación de identidad ha alcanzado un nuevo nivel de sofisticación. El peligro ya no reside en imitadores talentosos, sino en la inteligencia artificial. Los delincuentes pueden usar fragmentos de audio de una persona, incluso de baja calidad extraídos de redes sociales por ejemplo, para entrenar un sistema capaz de replicar su voz con una precisión asombrosa y que ya ha tenido sus primeras consecuencias.

El eslabón más débil de la seguridad: la propia voz

En este contexto, la tecnología que permite estas falsificaciones, conocidas como "deepfakes" de audio, se ha democratizado de una manera alarmante. Lejos de requerir superordenadores, estos sistemas pueden funcionar con programas de código abierto y en equipos informáticos modestos, lo que supone que cualquiera con unos conocimientos básicos pueda emplearlos de manera delictiva.

Para ello, tal como indican los expertos de la compañía de ciberseguridad NCC Group, basta una tarjeta gráfica de gama media para generar una voz clonada en tiempo real, con un retardo tan ínfimo, de apenas medio segundo, que la conversación fluye con total naturalidad.

En el ámbito profesional, tal y como informa el medio Techspot, estos fraudes ya se están materializando para infiltrarse en empresas. Se han registrado casos de delincuentes que utilizan voces clonadas para superar procesos de contratación por teléfono o videollamada, haciéndose pasar por candidatos altamente cualificados para conseguir un puesto. Esta realidad obliga a replantear los protocolos de verificación en el mundo corporativo.

Además, la clonación de voz ha demostrado ser una herramienta de ataque mucho más inmediata y peligrosa que los intentos efectuados a través de IA con generación de vídeo.

Mientras que los "deepfakes" visuales en tiempo real todavía presentan fallos, como inconsistencias en las expresiones faciales o una sincronización labial imperfecta que un ojo entrenado puede detectar, el audio ha alcanzado un grado de realismo casi perfecto.

Por todo ello, los expertos lanzan una advertencia contundente: ni las llamadas de voz ni las de vídeo pueden considerarse ya métodos de autenticación fiables por sí solos. La facilidad con la que se pueden obtener fragmentos de audio de baja fidelidad para alimentar estos sistemas convierte a la voz en el eslabón más vulnerable de la identidad digital, cuestión que obliga a recuperar la desconfianza como primera línea de defensa.