Initiation
Présentation succincte des moteurs et autres outils
Intérêt des différents outils
Documentation
Sur la toile, on peut trouver tout ce qui concerne la toile, et en particulier les outils et les méthodes pour y chercher de l'information. Il n'est donc pas utile de reproduire ici ce que l'on trouve facilement ailleurs. Nous nous contenterons ici d'un survol rapide donnant les indications les plus importantes.
Pour s'initier, directement sur la toile, à la recherche d'information
sur la toile,
consulter le cours en ligne
RISI de Jean-Pierre Lardy (Urfist de Lyon), très bien écrit,
et tenu à jour, vivement recommandé.
On distingue traditionnellement deux types principaux d'indexation des pages de la toile :
Ces bases de sites (appelées annuaires ou répertoires ) et ces bases de pages (appelées moteurs) sont généralement accessibles via des serveurs sur la toile.
Yahoo ! : www.yahoo.com (anglophone)
www.yahoo.fr (francophone), le plus
connu dans sa catégorie,
Nomade : www.nomade.fr (francophone)
Google : http://www.google.fr/ une
interface très dépouillée, le plus rapide, l'indexation
la plus large dans sa catégorie,
Voila : www.voila.fr (francophone), une
bonne indexation de la toile francophone,
Altavista : www.altavista.fr (on
choisit sa langue de recherche), un des plus anciens dans sa catégorie,
aux fonctionnalités nombreuses
Pour avoir un accès rapide aux principaux annuaires et moteurs classés
par catégorie, consulter :
Tous les outils en une
page de Jean-Pierre Lardy (très pratique).
Certains serveurs donnent accès à la fois à un moteur
et à un annuaire et à bien d'autres choses encore : la météo,
la bourse, les nouvelles, .... qui ne sont pas toujorus utiles pour la recherche
d'informations. On les appelle des portails.
Un bon exemple de portail francophone : Voila
(France Telecom)
Noter que Yahoo (annauire de sites) appelle
le serveur de Google (moteur) quand
il ne trouve pas de sites correspondant dans son propre annuaire.
Les métamoteurs sont des outils
qui appellent plusieurs moteurs avec la même requête et présentent
une synthèse de leurs résultats. On améliore ainsi le taux
de couverture de la requête et on évite la dispersion dans la recherche.
Et au besoin on peut conserver ses résultats.
On distingue :
Les annauires ou répertoires (bases de sites) généraux
sont très utiles pour obtenir des informations générales
sur un thème. Ainsi on peut y obtenir rapidement les adresses des sites
d'institutions "classiques" (EDF ou le CEA par exemple si l'on s'intéresse
à l'énergie) . Ils sont souvent peu renseignés dès
que la recherche se spécialise.
Les annuaires spécialisés sont plus développés et
référencent des sites "incontournables" ou plus simplement "riches"
;
voir par exemple Infomine (anglophone),
annuaire de ressources pour étudiants répertoriées par
l'Université de Californie ; il contient environ 1600 références
en sciences et techniques.
Les moteurs (bases de pages) sont plus efficaces pour une recherche d'informations
précises.
Mais ils souffrent de défauts à ne pas négliger :
Altavista et Voila
utilisent un classement par pertinence qui prend en compte de nombreux cirtères
faisant intervenir la présence des mots dans un des composantes du document.
Google utilise un classement par popularité en mettant en avant les
pages qui sont le plus référencées par d'autres pages.
Cette technique est intéressante pour l'utlisateur mais elle risque de
réduire la consultation des sites moins référencés
(et qui ne sont pas toujours les moins intéressants).
C'est ainsi que l'on qualifie tous les documents de la toile qui ne sont pas
indexés par les annuaires et les moteurs.
Ces documents sont le plus souvent conservés dans des bases de données
que l'on peut interroger via un serveur, comme les catalogues de bibliothèques,
les données astronomiques, les bases de gènes, les textes numérisés
en mode image, etc.
Jean-Pierre Lardy a recensé bon nombre de bases
de données gratuites sur la toile.
Copernic s'avère être un très bon outil :
Mode d'emploi détaillé de Copernic en une page
Il existe d'autres outils que nous avons testés et qui ne donnent pas
satisfaction (les annuaires qui sont trop généraux, les moteurs
qui ne sont utiles que pour des recherches assez fines, quand les pages en question
ont pu être indexées et quand on maîtrise la syntaxe).
Il existe d'autres outils que nous n'avons pas testés car ils sont payants
(trop chers) en particulier certains métamoteurs clients
... mais il est probable que le meilleur outil (du jour) nous ait échappé
!
Pour avoir une vue d'ensemble de l'internet, incluant les moteurs de recherche :
Pour chercher à en savoir (plus) :
Pour suivre l'actualité en recherche d'information sur internet :
INRP - TECNE |
CARIST - François-Marie Blondel - 16 janvier, 2003