Criptografía puntera para realizar estudios médicos a gran escala sin compartir datos sensibles

Realizar análisis estadísticos sobre datos procedentes de diferentes hospitales es esencial para desarrollar la medicina más fiable. El nuevo sistema FAMHE permite hacerlo sin poner en riesgo la privacidad.

Técnicas avanzadas en cirugía
Técnicas avanzadas en cirugíaDominio público

La medicina basada en la evidencia es la más fiable a día de hoy. Pero podemos ir más allá y apostar por una medicina predictiva, preventiva, personalizada y participativa: es la que se conoce como P4, y que guiará la atención sanitaria del futuro. Un nuevo estudio ha dado un paso decisivo para hacerla realidad.

Más datos, más fiabilidad

Las predicciones de la nueva medicina serían imposibles sin estudios clínicos. Y cuantos más pacientes se analicen, más fiables serán las estadísticas que se puedan generar. Aunque muchos hospitales ya hacen investigación de este tipo, en muchos casos no bastan los datos de un solo centro. Sobre todo en el caso de las enfermedades raras, donde el número de pacientes en cada hospital suele ser escaso, es esencial compartir información entre varios hospitales. En estos casos, centralizar los datos no es una opción por motivos de seguridad y privacidad. De hecho, la privacidad es una de las principales barreras que obstaculizan el progreso de la medicina P4.

La nueva propuesta se ha publicado en Nature Communications y es un sistema de analítica federada. Con este nuevo sistema, los hospitales pueden desarrollar análisis estadísticos o modelos de aprendizaje automático en colaboración, pero sin necesidad de compartir los datos de pacientes. La propuesta, bautizada como “FAMHE”, ha encontrado el equilibrio perfecto entre protección de datos, exactitud de resultados y conveniencia en el tiempo de computación.

Hasta ahora, hay varias ideas sobre la mesa para llevar a cabo la analítica federada. Pero padecen de dos problemas principales. Algunas propuestas requieren que las instituciones de donde proceden los datos compartan resultados intermedios de sus análisis. En algunos casos, esto puede resultar en una filtración de datos de pacientes, ya que a veces los resultados intermedios son suficientes para hacer identificaciones sobre los datos originales. Para evitar esta posibilidad, otras propuestas añaden datos inventados (lo que se conoce como ruido, en estadística), pero esto compromete la exactitud del resultado final.

Cifrado de ida y vuelta

FAMHE supera estas dos dificultades. La clave para conseguirlo está en el cifrado homomórfico multi-parte. Para compartir datos secretos, la estrategia habitual es cifrarlos. Es decir, se someten los datos a una operación matemática que solo conoce el hospital de donde proceden, y que solo puede deshacer el receptor de los datos cifrados. El cifrado homomórfico asegura que se pueda hacer el análisis estadístico sobre los datos ya cifrados, de forma que, cuando se descifre el resultado, se obtenga lo mismo que si se hubiera realizado este análisis sobre los datos sin cifrar.

Para poder utilizar este sistema entre muchos hospitales, debe ser multi-parte. Normalmente, hacer computaciones distribuidas entre muchas instituciones acarrearía tiempos de computación elevados, pero la nueva propuesta utiliza protocolos interactivos que simplifican (y, sobre todo, abrevian) la tarea.

En FAMHE, cada hospital utiliza el cifrado homomórfico multi-parte para hacer cálculos sobre sus datos y cifrar los resultados intermedios. Los resultados cifrados de todos los hospitales se unen y se distribuyen de nuevo para que cada hospital siga analizando su parte de los datos. Este proceso se repite las veces necesarias hasta que se complete el análisis.

Según el equipo investigador, hay una buena predisposición entre pacientes de compartir sus datos médicos para avanzar en el conocimiento científico y médico, pero es esencial asegurar la confidencialidad de esta información. Con el sistema FAMHE, se puede hacer investigación colaborativa y segura sobre datos de pacientes a gran escala. La privacidad está matemáticamente demostrada, y los datos de pacientes son inviolables incluso aunque todos los hospitales menos uno colaboren para tratar de obtener la información que tiene el hospital restante.

Así es como este sistema puede convivir con el estricto Reglamento General de Protección de Datos, que entró en vigor en toda Europa en mayo de 2018. Hasta ahora, se podían compartir datos de pacientes entre hospitales si se firmaba un convenio bilateral de transferencia y uso de datos. Pero no hay un convenio estándar y se suele tardar meses en llegar a un acuerdo entre dos hospitales. Cuanto mayor sea el grupo de instituciones, más complicada se vuelve la tarea. Pero FAMHE pretende servir de referencia y eliminar la necesidad, y con ella el coste, de elaborar todos estos convenios.

La prueba del algodón

La nueva propuesta ya ha demostrado su valía. Para comprobar que el sistema funciona, el equipo investigador lo ha puesto a prueba con dos estudios médicos ya publicados. Ambos utilizaron datos procedentes de varios hospitales, que se compartieron gracias a numerosos acuerdos legales redactados al efecto. El nuevo sistema ha conseguido reproducir los mismos resultados sin necesidad de centralizar los datos. Este es un hito que demuestra la eficacia de la analítica federada a gran escala, y es la primera vez que se logra.

Por eso el equipo defiende que FAMHE permite avanzar en el conocimiento biomédico de manera mucho más profunda que hasta ahora. Apenas han publicado el nuevo estudio, ya están pensando en cómo implementarlo. Ya han mantenido conversaciones avanzadas con instituciones de Texas, los Países Bajos e Italia, y su objetivo es integrar FAMHE en el sistema rutinario de investigación médica.

Pero su impacto podría ir incluso más allá del terreno sanitario. Los datos sensibles, por supuesto, no son exclusivos de la medicina, y también afectan a terrenos tan dispares como seguros, finanzas y ciberseguridad. Esta nueva propuesta pretende sentar las bases para realizar análisis sobre datos procedentes de varias instituciones, sobre las que establecer un sistema adecuado a cada ámbito. La investigación colaborativa sobre datos sensibles no ha hecho más que empezar.

QUE NO TE LA CUELEN:

  • Aunque la seguridad de un sistema criptográfico se haya demostrado matemáticamente, pueden caber ataques que la comprometan. En las demostraciones de seguridad, siempre se hacen ciertas suposiciones sobre el hipotético adversario. Cuantas menos suposiciones haya o más realistas sean, mayor será la seguridad del sistema. Pero si las suposiciones no se cumplen, el sistema no tiene por qué ser seguro. Además, tener en cuenta las suposiciones es imprescindible a la hora de implementar un sistema criptográfico. No hacerlo podría volverlo susceptible a ataques de canal lateral, que se aprovechan de los puntos débiles del sistema físico que realiza el sistema criptográfico.

REFERENCIAS (MLA):