goshme, la web invisible
y la veracidad de la información
La guerra de los buscadores parece no haber hecho más que comenzar. Y es que, como sabemos, se trata de un mercado que mueve inmensas sumas de dinero. No es raro entonces que todos los dÃas surja alguna novedad en este terreno (ver lo escrito por Phil Bradley en New Search Engines). La última, lo supimos vÃa Outils de veille, se llama Goshme, un asistente de búsquedas que sabe cómo adentrarse en la deep web o web invisible, es decir en la parte de web que es inaccesible a los buscadores generalistas, tipo Google o Yahoo. Baste aquà con recordar que la web oculta es gigantesca y formada por unos 200.000 sitios que en su conjunto son unas 500 veces más grandes que lo que normalmente llamamos WWW.
Para entender de lo que estamos hablando conviene saber cómo procede un buscador genérico. Lo que equivale a preguntarse cómo se enteran los buscadores de que hay en la red nuevas páginas. Lo que hace Google es comenzar por una página y seguir todos los links que encuentra copiando (y luego indexando) en sus servidores toda la información que contienen. De forma que la tecnologÃa que se utiliza hace invisible cualquier página que no esté enlazada (pues no hay forma de llegar a ella) o cualquier sitio, como las bases de datos, que sólo son consultables desde una página de inicio mediante un protocolo búsqueda ad hoc. El asunto es que hay millones de web que son inaccesibles salvo que se emplee su buscador especÃfico.
Por otra parte, los buscadores, además de otras muchas cosas, se han convertido en herramientas orientadas a la producción de autoridad. Google, por ejemplo, organiza la respuesta a cada búsqueda poniendo en primer lugar las páginas más populares (la más citada por otras páginas, las que tienen más alto el coeficiente page rank). Quien busca información mediante Google tenderá a leer lo mismo que leen los otros usuarios, es decir aquellas web que suscitan mayor consenso.
A veces, sin embargo, uno quisiera fiarse menos de los que piensa la mayorÃa y confiar más en lo que piensan las corporaciones profesionales u organizaciones gubernamentales o cÃvicas. Por ejemplo, si interrogamos la web sobre una enfermedad, es posible que queramos saber la literatura que recomiendan las organizaciones médicas y que no nos conformemos con las páginas más populares. Pues es obvio que la calidad de la información, al menos en principio, tiene mucho que ver con la institución que la proporciona. En fin que hay dos formas de autoridad que no necesariamente tienen que coincidir: la autoridad corporativa y la autoridad intersubjetiva.
Goshme llega para dar respuesta a los dos problemas aquà esbozados: escudriñar la web profunda y mostrar la autoridad que subyace tras cada buscador. Su modo de proceder es muy original y consiste en ofrecer para cada consulta la respuesta especÃfica que darÃa individualmente cada uno de los buscadores existentes. Goshme ha identificado miles de buscadores especializados en rastrear información en bases de datos o fondos documentales invisibles para las buscadores generales y, cuando se introduce un término de búsqueda, pone a funcionar simultáneamente todos los motores de búsqueda (cada uno con sus propios algoritmos, es decir con sus propias virtudes y también defectos).
En definitiva que Goshme no filtra la información. Sólo es una interface que ordena sin mezclarla la que ofrecen los buscadores que parasita, dando por hecho dos hipótesis razonables: la primera, que en la web profunda puede estar ocultándose una gran parte de la mejor información disponible y, dos, que los usuarios querremos algo más que la popularidad para elegir la fiabilidad de la información.
Si te gustó esta entrada anÃmate a escribir un comentario o suscribirte al feed y obtener los artÃculos futuros en tu lector de feeds.

A web invisível começa a aparecer