Aides

Recherche d'informations sur la toile


Sommaire :

Initiation
Présentation succincte des moteurs et autres outils
Intérêt des différents outils
Documentation


Sur la toile, on peut trouver tout ce qui concerne la toile, et en particulier les outils et les méthodes pour y chercher de l'information. Il n'est donc pas utile de reproduire ici ce que l'on trouve facilement ailleurs. Nous nous contenterons ici d'un survol rapide donnant les indications les plus importantes.

Initiation

Pour s'initier, directement sur la toile, à la recherche d'information sur la toile,
consulter le cours en ligne RISI de Jean-Pierre Lardy (Urfist de Lyon), très bien écrit, et tenu à jour, vivement recommandé.  

Présentation succincte des moteurs et autres outils de recherche

Indexation de la toile

On distingue traditionnellement deux types principaux d'indexation des pages de la toile :

Ces bases de sites (appelées annuaires ou répertoires ) et ces bases de pages (appelées moteurs) sont généralement accessibles via des serveurs sur la toile.

Pour avoir un accès rapide aux principaux annuaires et moteurs classés par catégorie, consulter :
Tous les outils en une page de Jean-Pierre Lardy (très pratique).

Portails

Certains serveurs donnent accès à la fois à un moteur et à un annuaire et à bien d'autres choses encore : la météo, la bourse, les nouvelles, .... qui ne sont pas toujorus utiles pour la recherche d'informations. On les appelle des portails.
Un bon exemple de portail francophone : Voila (France Telecom)
Noter que Yahoo (annauire de sites) appelle le serveur de Google (moteur) quand il ne trouve pas de sites correspondant dans son propre annuaire.

Métamoteurs

Les métamoteurs sont des outils qui appellent plusieurs moteurs avec la même requête et présentent une synthèse de leurs résultats. On améliore ainsi le taux de couverture de la requête et on évite la dispersion dans la recherche. Et au besoin on peut conserver ses résultats.
On distingue :

Intérêt des différents outils pour la recherche d'information scientifique

Annuaires et répertoires

Les annauires ou répertoires (bases de sites) généraux sont très utiles pour obtenir des informations générales sur un thème. Ainsi on peut y obtenir rapidement les adresses des sites d'institutions "classiques" (EDF ou le CEA par exemple si l'on s'intéresse à l'énergie) . Ils sont souvent peu renseignés dès que la recherche se spécialise.
Les annuaires spécialisés sont plus développés et référencent des sites "incontournables" ou plus simplement "riches" ;
voir par exemple Infomine (anglophone), annuaire de ressources pour étudiants répertoriées par l'Université de Californie ; il contient environ 1600 références en sciences et techniques.

Moteurs

Les moteurs (bases de pages) sont plus efficaces pour une recherche d'informations précises.
Mais ils souffrent de défauts à ne pas négliger :

Altavista et Voila utilisent un classement par pertinence qui prend en compte de nombreux cirtères faisant intervenir la présence des mots dans un des composantes du document.
Google
utilise un classement par popularité en mettant en avant les pages qui sont le plus référencées par d'autres pages. Cette technique est intéressante pour l'utlisateur mais elle risque de réduire la consultation des sites moins référencés (et qui ne sont pas toujours les moins intéressants).

La toile invisible

C'est ainsi que l'on qualifie tous les documents de la toile qui ne sont pas indexés par les annuaires et les moteurs.
Ces documents sont le plus souvent conservés dans des bases de données que l'on peut interroger via un serveur, comme les catalogues de bibliothèques, les données astronomiques, les bases de gènes, les textes numérisés en mode image, etc.
Jean-Pierre Lardy a recensé bon nombre de bases de données gratuites sur la toile.

Du bon usage des moteurs quand on sait ce que l'on cherche

Un métamoteur pour la pratique régulière

Copernic s'avère être un très bon outil :

Mode d'emploi détaillé de Copernic en une page

Il existe d'autres outils que nous avons testés et qui ne donnent pas satisfaction (les annuaires qui sont trop généraux, les moteurs qui ne sont utiles que pour des recherches assez fines, quand les pages en question ont pu être indexées et quand on maîtrise la syntaxe).
Il existe d'autres outils que nous n'avons pas testés car ils sont payants (trop chers) en particulier certains métamoteurs clients
... mais il est probable que le meilleur outil (du jour) nous ait échappé !

Documentation

Pour avoir une vue d'ensemble de l'internet, incluant les moteurs de recherche :

Pour chercher à en savoir (plus) :

Pour suivre l'actualité en recherche d'information sur internet :


INRP - TECNE

CARIST -  François-Marie Blondel - 16 janvier, 2003