Buscadores de la deep web
Contenidos
Buscadores de la deep web
Enlaces a la web oscura 2020
Para los profanos en la materia, sólo existe un tipo de Internet: el que utilizamos para la navegación normal todos los días. Pero, en realidad, hay 3 tipos principales de Internet que es crucial entender para tener una imagen precisa de cómo funciona:
La web oscura consiste en todos aquellos sitios web a los que no se puede acceder con un navegador normal y que requieren un tipo especial de red conocido como The Onion Routing (TOR). Todos los sitios web de esta red utilizan un .onion al final en lugar de dominios de primer nivel como “.com”.
Aunque la gran mayoría de los usuarios no saben conscientemente que los dos primeros son tipos distintos, los utilizan a diario. Sin embargo, el verdadero misterio reside en el tercero, la web oscura, que sólo constituye una proporción muy pequeña de Internet y que contiene algo más de 65.000 URL.
También conocido como TorSearch, afirma ser el motor de búsqueda más antiguo que reside en la web oscura, además de indexar más de mil millones de páginas, lo que le da muchos puntos. Los usuarios no son rastreados ni hay ninguna censura, lo que permite hacer un uso completo de la información enterrada en la web oscura.
Searx
Este Libro Blanco es una versión del que aparece en el sitio de BrightPlanet. Aunque está concebido como una herramienta de marketing para un programa “destinado a los portales web existentes que necesitan proporcionar información específica y completa a los visitantes de su sitio”, su visión de la estructura de la web hace que merezca la pena su lectura para todos los que participan en la publicación electrónica. -J.A.T.
Buscar en Internet hoy en día puede compararse a arrastrar una red por la superficie del océano. Aunque muchas cosas pueden quedar atrapadas en la red, todavía hay una gran cantidad de información que se encuentra en las profundidades y, por lo tanto, se pierde. La razón es sencilla: La mayor parte de la información de la Web está enterrada muy abajo, en sitios generados dinámicamente, y los motores de búsqueda estándar nunca la encuentran.
Los motores de búsqueda tradicionales crean sus índices mediante el rastreo de las páginas web. Para ser descubierta, la página debe ser estática y estar vinculada a otras páginas. Los motores de búsqueda tradicionales no pueden “ver” o recuperar contenidos en la Web profunda: esas páginas no existen hasta que se crean dinámicamente como resultado de una búsqueda específica. Dado que los rastreadores tradicionales de los motores de búsqueda no pueden indagar bajo la superficie, la Web profunda ha estado oculta hasta ahora.
Página de inicio
Dado que la mayoría de los perfiles personales, registros públicos y otros documentos relacionados con las personas se almacenan en bases de datos y no en páginas web estáticas, la mayor parte de la información de mayor calidad sobre las personas es simplemente “invisible” para un motor de búsqueda normal.
Cuando se accede a la web oscura, no se navega por los servidores interconectados con los que se interactúa habitualmente; en su lugar, todo permanece interno en la red Tor, que proporciona seguridad y privacidad a todos por igual.
De ahí el nombre de “archivos de exclusión de robots”. Si se configura este registro, se impedirá que ciertas páginas aparezcan en la lista, lo que será imperceptible para los buscadores. Las etapas de los blogs suelen ofrecer este componente.
Los robots Pipl están configurados para interactuar con las bases de datos de búsqueda y extraer datos, detalles de contacto y otra información relevante de perfiles personales, directorios de miembros, publicaciones científicas, registros judiciales y otras numerosas fuentes de la web profunda.
Enlaces a buscadores de la web profunda
La web profunda,[1] la web invisible,[2] o la web oculta[3] son partes de la World Wide Web cuyo contenido no está indexado por los motores de búsqueda estándar. Esto contrasta con la “web de superficie”, a la que puede acceder cualquier usuario de Internet[4]. Se atribuye al informático Michael K. Bergman la acuñación del término en 2001 como término de indexación de búsquedas[5].
El contenido de la deep web se oculta tras formularios HTTP[6][7] e incluye usos como el correo web, la banca online, páginas y perfiles de redes sociales privados o de acceso restringido, algunos foros web que requieren registrarse para ver el contenido y servicios por los que los usuarios deben pagar y que están protegidos por muros de pago, como el vídeo bajo demanda y algunas revistas y periódicos online.
Desde entonces, tras su uso en la información de los medios de comunicación sobre la Ruta de la Seda, los medios de comunicación han empezado a utilizar “deep web” como sinónimo de dark web o darknet, una comparación que algunos rechazan por inexacta[10] y que, en consecuencia, se ha convertido en una fuente continua de confusión[11] Los periodistas de Wired Kim Zetter[12] y Andy Greenberg[13] recomiendan que los términos se utilicen de forma diferenciada. Mientras que la deep web hace referencia a cualquier sitio al que no se puede acceder a través de un motor de búsqueda tradicional, la dark web es una parte de la deep web que se ha ocultado intencionadamente y es inaccesible a través de los navegadores y métodos estándar[14][15][16][17][18].
Relacionados
