Los buscadores tradicionales nos devolverán aquella información que se encuentra en lo que se ha venido llamando WEB SUPERFICIAL O VISIBLE, sitios cuya información puede ser indexada por los robots y que puede ser recuperada casi en su totalidad. Estos sitios web se caracterizan por:
- son de libre acceso
- no necesitan de un registro
- su información no está contenida en una base de datos
- son webs estáticas
Por otra parte contamos con la información qeu podríamos obtener de la WEB PROFUNDA O INVISIBLE, con información generalmente almacenada en bases de datos. Son páginas que no tienen una dirección fija, son dinámicas, se construyen en el momento en el que se realiza la consulta y se destruyen una vez que finalizan.
Sherman y Price hablan de cuatro tipos de contenidos invisibles:
- Web opaca: no indiza todas las páginas, las que se indizan no siempre lo hacen con la frecuencia que permita a los robots recuperarlas puesto que se crean muy deprisa, tienen limite en los documentos a mostrar y no tienen link que lleven hacia ellos.
- Web privada: podrían estar indizadas, pero se excluyen a proposito por medio de contraseñas, de archivos robots.txt o el campo noindex para que no sean indizadas.
- Web propietaria: requiere de un registro previo para poder acceder a la información
- Web invisible: no pueden ser indizadas por limitaciones tecnicas, son bases de datos relacionales y las páginas se generan a partir de los datos que introduce el ususario



1 comentarios:
Precioso blog felicidades, la información muy bien estructurada y fácil de leer.
Publicar un comentario