domingo, 24 de junio de 2012

Crean un detective web que recupera los enlaces rotos


A todos los internautas les sucede con gran frecuencia, el toparse con esta frase mientras navegan por la web: “La pagina que busca ya no existe”. Esto ocurre porque 67% de las direcciones de Internet se convierten en erróneas tras cuatro años de vida. A veces, esto sucede porque la página ha desaparecido; en otras ocasiones, la información ha sido movida de sitio, reseñó el portal web Hoy.es.
Para acabar con el molesto problema de los links erróneos, investigadores de la Universidad Nacional de Educación a Distancia (UNED), han desarrollado un sistema que hace la función de un ‘detective privado’ para encontrar las pistas de ese contenido y seguir así su rastro. La nueva herramienta permite recuperar hasta 81% de los enlaces obsoletos.
Juan Martinez Romo, investigador del grupo de procesamiento de Procesamiento de Lenguaje Natural y Recuperación de Información de la UNED y autor principal del proyecto, explicó que estas pistas consisten en referencias y enlaces obsoletos en motores de búsqueda, librerías digitales, servicios web y redes sociales.
Recabadas las pistas, el sistema llamado “Detective Brooklynk” elabora dinámicamente una estrategia para encontrar la página desaparecida o una equivalente de la forma más eficiente, es decir, consumiendo los mínimos recursos y el menor tiempo. De este modo, insertando el link erróneo, el programa devuelve al usuario una lista de enlaces en los que puede estar la información que busca, ya sea de la misma página o bien de otras que lo hayan recogido.
Martinez Romo aseguró que para comprobar la efectividad de la herramienta, cuyo desarrollo se ha publicado en la revista Information Processing and Management, los investigadores seleccionaron aleatoriamente un conjunto de páginas con enlaces rotos e intentaron recuperar su contenido. “Con el sistema que hemos desarrollado, conseguimos recuperar 81% de los links erróneos”.
El investigador comentó que el problema de los enlaces obsoletos es una de las asignaturas pendientes de Internet, y perjudica tanto a usuarios como a creadores. “Es evidente que, de cara a un internauta, encontrar este tipo de problemas dificulta y entorpece sus búsquedas, pero, además, esto repercute en una pérdida de fiabilidad y prestigio para el dueño de la página”.
A estas molestias se suma el hecho de que los motores de búsqueda penalizan a las páginas a la hora de mostrarlas en la lista de resultados. En los últimos años, han aparecido algoritmos que proponen la modificación del PageRank (algoritmo de ranking utilizado por los motores de búsqueda) para que tenga en cuenta esa clase de errores. El sistema desarrollado por la UNED evitaría esta penalización.

0 comentarios:

Publicar un comentario