Un papier, un peu ancien, sur le "web profond".
Le "deep Web" aussi appelé "web invisible" est l'ensemble des documents accessibles, mais difficilement trouvables car ils ne sont pas indexés par les moteurs de recherche classiques.
Moteurs, qui n'indexent "que", les contenus sur lesquels pointent une url, provenant d'une page elle même indexée. Ce qui exclut, les bases qu'il faut interroger dynamiquement ( à la liste de sites US que l'on trouve dans l'article, on pourrait ajouter ce, malheureusement, célèbre exemple bien de chez nous qu'est Gallica).
Un papier interessant donc ci apres:
BrightPlanet? ? Deep Web White Paper
vendredi, juillet 01, 2005
Inscription à :
Publier les commentaires (Atom)
Aucun commentaire:
Enregistrer un commentaire