Cargando...

Sociedad

Más de 100 expertos reclaman que los datos de simulación molecular sean accesibles y reutilizables

Defienden un ecosistema "abierto y sostenible" para multiplicar el impacto de los datos

Biología DREAMSTIMELA RAZÓN

Más de 100 expertos, coordinados desde el Instituto de Investigación Biomédica de Barcelona (IRB), han reclamado que los datos en simulación molecular se ajusten a los principios 'Fair', es decir, que sean accesibles, interoperables, fáciles de encontrar y reutilizables.

En un artículo publicado en la revista 'Nature Methods', han abogado por un ecosistema "abierto y sostenible" que multiplique el impacto de estos datos y evite duplicidades innecesarias, informa el IRB en un comunicado de este miércoles.

A diferencia de la biología estructural o la genómica, donde guardar y compartir datos bajo estándares comunes es práctica habitual, en el campo de la simulación molecular estos datos siguen fragmentados y a menudo acaban olvidados en ordenadores personales, lo que dificulta la reproducibilidad de los cálculos e imposibilita su aprovechamiento posterior.

Esto genera un problema formidable para la integración de estos datos en los flujos de trabajo de la biología estructural y de la biofísica, y frena el desarrollo de métodos de inteligencia artificial, cuyo entrenamiento es "extremadamente dependiente" del acceso de ingentes cantidades de datos dinámicos.

Reutilizar para no repetir

El coordinador del proyecto europeo Mddb --que busca una base de datos centralizada y accesible-- y jefe del laboratorio de Modelización Molecular y Bioinformática del IRB Barcelona, Modesto Orozco, ha explicado que la comunidad ha asumido durante años que repetir una simulación era más fácil y barato que archivarla, pero eso "ya no es cierto".

Por su parte, el también líder del proyecto Mddb, Adam Hospital, ha apuntado que el conocimiento que se puede extraer al reutilizar datos es "enorme", ya que permite identificar nuevas dianas, entrenar algoritmos de inteligencia artificial y diseñar nuevos experimentos.

Aprender de otros campos

La propuesta se inspira en el éxito de otras áreas que han apostado por la ciencia abierta, como el Protein Data Bank, que desde los años 70 recoge estructuras tridimensionales de biomacromoléculas y que ha sido "fundamental" para el desarrollo de fármacos, vacunas y nuevas terapias, así como para la 'revolución ómica' y para ganar una visión holística de la célula.

Según los autores del artículo, la comunidad de simulación molecular debería adoptar prácticas similares a las de las comunidades estructurales y 'ómicas', no solo conservando los datos sino estandarizando los formatos de archivo, los metadatos y los criterios de calidad.

El texto describe cómo una infraestructura federada, con nodos distribuidos y herramientas de acceso común, podría hacer "viable" este archivo a escala planetaria.