Les bases de données du deep web

Le deep web est accessible en ligne, néanmoins, il est non indexé par les moteurs de recherche classiques (Google, Mozilla Firefox, Internet Explorer…). Différents outils spécialisés existent pour pouvoir accéder au web invisible.

searchengines

Les bases de données

Les bases de données permettent de stocker des informations, qui seront ensuite publier sous forme de pages web dynamiques. L’internaute doit donc interroger ces bases de données par des requêtes pour pouvoir accéder à l’information qu’il recherche.
Il existe des bases de données gratuites et d’autres payantes :

Les bases de données gratuites :

- Les URFIST (Unités Régionales de Formation et de Promotion pour l’Information Scientifique et Technique) des universités de Lyon I et de Nice-Sophia Antipolis proposent une sélection de bases de données gratuites.
Par exemple l’université de Lyon I, propose plus de 800 bases de données gratuites avec différentes catégories comme : l’agriculture, la chimie, l’environnement, l’économie, la génétique, l’histoire, l’informatique, la linguistique, les mathématiques, la médecine, les sciences et puis le cinéma, l’art, la photographie…

- The Internet Archive est une bibliothèque digitale destinée à conserver tous les documents numériques issus de l’internet pour les préserver d’une disparition complète. Les archives électroniques sont constituées de pages d’Internet, de logiciels, de livres et d’enregistrement audio.
La bibliothèque digitale a créé the Internet Wayback Machine pour permettre à l’internaute de trouver des sites web archivées avec uniquement l’URL et la date.

Page d'ouverture du site de Internet Archive

- Google News Archives est une extension de Google News, il permet lui aussi d’accéder à des archives des actualités issues des sources de presse (Time, New York Times, BBC, le Guardian…)

Quelques bases de données payantes :

- One source, qui est l’une des plus grandes bases de données payantes en ligne sur les entreprises et les secteurs d’activité.

- Questel-Orbit est un service français payant qui ressource plus de 80 bases données sur la propriété industrielle en Europe et à l’internationale. Les requêtes peuvent concerner des brevets, des marques et modèles, des informations scientifiques et techniques…

- Lexis Nexis, qui permet d’obtenir des informations personnalisées à partir de 35.000 sources sur les Sciences Sociales et les informations juridiques.

- STN qui est un réseau de bases de données dédiées à la science, la technologie, les brevets et le business.