Ley Antipiratería

Un «detective web» permite recuperar el 81% de los enlaces rotos

Investigadores de la Universidad Nacional a Distancia han desarrollado un sistema para acabar con el problema de los links erróneos -recupera hasta el 81% de enlaces obsoletos-, basado en seguir la pista que este contenido deja en la web.

 Algunos estudios calculan que el 67% de las direcciones de Internet se convierten en erróneas tras un período de cuatro años de vida, ha informado hoy la UNED en una nota de prensa.

En algunas ocasiones, el enlace es incorrecto porque la página ha desaparecido y, en otros casos, porque la información ha sido movida de sitio.

Dichas "pistas consisten en referencias y enlaces obsoletos en motores de búsqueda, librerías digitales, servicios web y redes sociales", explica Juan Martínez-Romo, investigador del grupo de Procesamiento de Lenguaje Natural y Recuperación de Información de la UNED y autor principal del proyecto.

Recabadas las pistas, el sistema "Detective Brooklynk"elabora dinámicamente una estrategia para encontrar la página desaparecida o una equivalente de la forma más eficiente, es decir, consumiendo los mínimos recursos y el menor tiempo.

De este modo, insertando el link erróneo, el programa devuelve al usuario una lista de enlaces en los que puede estar la información que busca, ya sea de la misma página o bien de otras que lo hayan recogido.

Para comprobar la efectividad de la herramienta, cuyo desarrollo se ha publicado en la revista Information Processing and Management, los científicos seleccionaron aleatoriamente un conjunto de páginas con enlaces rotos e intentaron recuperar su contenido.

 "Con el sistema que hemos desarrollado, conseguimos recuperar el 81% de los links erróneos", asegura Martínez-Romo.

El problema de los enlaces obsoletos es una de las asignaturas pendientes de la red, y perjudica tanto a usuarios como a creadores.

"Es evidente que, de cara a un internauta, encontrar este tipo de problemas dificulta y entorpece sus búsquedas, pero, además, esto repercute en una perdida de fiabilidad y prestigio para el dueño de la página", comenta el investigador.

A estas molestias se suma el hecho de que los motores de búsqueda penalizan a las páginas a la hora de mostrarlas en la lista de resultados.

En los últimos años, han aparecido algoritmos que proponen la modificación del PageRank (algoritmo de ranking utilizado por los motores de búsqueda) para que tenga en cuenta esa clase de errores.

Con este sistema, aseguran los investigadores, se evitaría esta penalización.

A la espera de su versión definitiva, "Detective Brooklynk"puede consultarse en el siguiente enlace http://alderamin.lsi.uned.es:8080/brooklynk.