La Web superficial o visible
Las características principales de los sitios de la Web visible son:
-su información no está contenida en bases de datos
-es de libre acceso
-no requiere la realización de un proceso de registro para acceder
La Web invisible
La Web invisible es el término utilizado para describir toda la información disponible en Internet que no es recuperada interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos. En conclusión, lo que realmente sigue siendo invisible en la web son:
-las páginas desconectadas;
-las páginas no clasificadas que contienen principalmente imágenes, audio o vídeo;
-las páginas no clasificadas que contienen principalmente archivos PDF,
-PostScript, Flash, Shockwave, ejecutables y comprimidos;
-el contenido de las bases de datos relacionales;
-el contenido que se genera en tiempo real;
-el contenido que se genera dinámicamente.
Pero:
-algunos buscadores recuperan archivos PDF y páginas con imágenes, aunque de forma limitada;
-es relativamente sencillo llegar hasta la “puerta” de las bases de datos con contenido importante;
-existen ya motores avanzados capaces de realizar búsquedas directas simultáneas en varias bases de datos a la vez; y aunque la mayoría requieren de pago, también ofrecen versiones gratuitas;
-el contenido que se genera en tiempo real pierde validez con mucha velocidad, salvo para análisis históricos; es relativamente sencillo llegar hasta la “puerta” de los servicios que ofrecen información en tiempo real;
-el contenido que se genera dinámicamente interesa únicamente a ciertos usuarios con características específicas;
-es relativamente sencillo llegar hasta la “puerta” de los servicios que ofrecen contenido generado dinámicamente.
