Explorando la web invisible con DeepPeep

DeepPeepLa llamada «Web invisible» o «Web oculta» es un concepto del que se viene hablando desde hace ya algunos años, refiriéndose a toda aquella información, que por una serie de motivos que dejaremos para otro día, no es indexable por los motores de búsqueda habituales y que, según estimaciones, es aproximadamente unas 500 veces más grande que la «web superficial».

Realmente es una cifra impactante, sobretodo si tenemos en cuenta que en 2008 Google cifraba en 1 trillon la cantidad de URL’s únicas indexadas.

En este sentido, DeepPeep es un servicio en desarrollo que está dando pasos para acercar y hacer más accesible toda esta información oculta para los motores de búsqueda habituales y que resulta de gran valor sobretodo a la hora de buscar información científico/técnica. Su propuesta es la de localizar e indexar formularios de búsqueda que generan toda esta información dinámica no indexable, agruparlos mediante clústers y ejecutar una serie de búsquedas sencillas. Los resultados de estas búsquedas crean una idea del contenido de las bases de datos y hacen posible una selección de términos de búsqueda con los que extraer contenido relevante para el usuario.

De este modo, las opciones de búsqueda de DeepPeep son mediante una búsqueda sencilla, una mediante dominios (Auto, airfare, biology,book, hotel, job y rental) y una búsqueda «visual» mediante los clústers.

Ejecutando una búsqueda de prueba comprobaremos que los resultados nos remiten a fuentes de información típicos de la «Web oculta«: Catálogos de bibliotecas, bases de datos científicas, formularios de búsqueda de sitios académicos e institucionales, agencias, etc.

DeepPeep es un servicio en desarrollo, se hace evidente a la hora de explotarlo, y serían recomendables opciones como la de filtrado tras la búsqueda, un número mayor de dominios de conocimiento, o una orientación temática más específica de los mismos, sobretodo si se quiere utilizar como fuente de información científico/técnica.

Aún así, siempre resultan recomendables este tipo de iniciativas que nos amplían la visión y que nos hacen ver que «hay vida más allá de Google».

DeepPeep es un proyecto de la University of Utah. Más información del proyecto aquí.

Para ampliar información:

5 comentarios sobre “Explorando la web invisible con DeepPeep

Deja un comentario