![]() La 6ème Biennale |
Titre : | Bases de données et veille scientifique : le cas de TECNEDOC |
Auteurs : | BARON, Georges-Louis / DUARTE-CHOLAT, Céline |
Texte : |
---|
L'explosion de l'information et notamment de l'information scientifique et
technique (IST) dans le milieu de la recherche a nécessité de
développer des systèmes documentaires de plus en plus complexes
pour répondre aux besoins des chercheurs. Depuis des années, la veille scientifique s'appuie sur des bases de données, dont l'interrogation permet de produire une information finalisée. La conception et la production de telles bases sont donc des activités clés pour les chercheurs souhaitant diffuser des ressources articulées à la recherche. Cependant, cette activité ne suit pas toujours des normes bien définies et pose de nombreux problèmes. Comment, au préalable, choisir un modèle conceptuel et des principes d'indexation ? Comment définir un système technique de gestion et de diffusion des informations qui soit adapté aux ambitions initiales ? Comment alimenter et gérer la base, diffuser des produits et des services fondés sur son exploitation ? Comment s'adapter à l'incessante évolution technologique et aux besoins du public visé ? Cette contribution vise à présenter la mise en place et le développement de la base de données spécialisée TECNEDOC et à discuter certains des enjeux liés à l'interopérabilité entre systèmes techniques. 1/ Présentation TECNEDOC est une base de données bibliographique. L'intention initiale, en 1993, a été de créer un système documentaire permettant de répertorier la bibliographie courante dans un domaine spécialisé, essentiellement pluridisciplinaire et où existent des liens étroits avec les praticiens, celui de la recherche sur les usages éducatifs des technologies de l'information et de la communication (TIC). Il ne s'agit pas de collecter de grandes quantités d'informations mais d'extraire de la masse l'information utile à un public cible, à savoir essentiellement des chercheurs, enseignants et étudiants de troisième cycle. TECNEDOC recense des documents liés à la recherche dans le domaine des TIC et de l'éducation sous des formes documentaires diverses : ouvrages, périodiques, actes de colloques, thèses, rapports, littérature grise, bibliographies, logiciels, etc. Chaque notice, outre sa référence bibliographique, comporte la mention de la langue, des informations complémentaires sur la présentation physique et intellectuelle du document, un résumé et une indexation à l'aide du Thésaurus européen de l'éducation (TEE). La base compte actuellement plus de 2300 notices de documents publiés depuis 1985. Elle est consultable à la fois en ligne et au département TECNE de l'INRP. Selon l'accès, le mode de consultation de la BDD n'est pas le même. Sur Internet, l'interface est la même que celle des autres BDD en ligne de l'INRP. Deux modes de recherche sont offerts : simple ou avancé. D'autre part, une recherche multibase est possible. Un tel type d'interrogation permet, en une seule étape, de faire une recherche documentaire sur l'ensemble des banques de données de l'INRP : Biblimath, Daf, Dif-act, Emile1, Emile2, Nova, Prof, Tecnedoc (d'autres banques seront accessibles par la suite). En local, TECNEDOC est aussi interrogeable depuis le logiciel File Maker Pro, pour lequel une interface spécifique a été développée. La recherche peut s'effectuer à partir de tous les champs de saisie. 2/ Phases de développement L'histoire de la base de données TECNEDOC connaît plusieurs phases. Tout d'abord, en 1993, elle naît comme projet INRP à partir d'une base initiale constituée à la fin des années quatre vingt pour les besoins d'une recherche comparative à l'aide du logiciel Quatrième Dimension. Une structure conforme aux normes documentaires en vigueur est alors définie et File Maker Pro est choisi comme support technique en raison de sa souplesse d'utilisation et de son coût relativement réduit. La récupération des fiches de la première base n'a pas suscité de difficultés particulières. Pour l'indexation, le choix du TEE a été très tôt effectué dans un souci d'harmonisation par rapport aux autres banques de données. Cependant, étant donné la nature du domaine, ce thésaurus a dû être complété par un lexique spécialisé géré de manière coordonnée avec le thésaurus. Le principal problème a en fait été la définition et la mise en place d'une procédure de saisie coopérative mobilisant des chercheurs et des documentalistes, la saisie n'incombant a priori pas uniquement aux seconds. L'expérience montre qu'il n'est pas évident d'intéresser les chercheurs à une telle entreprise, ce qui est pourtant désirable : plus l'accès à l'information est organisé en amont (contrôle du vocabulaire, précision de l'analyse, etc.) plus sa valorisation est facile en aval. Cependant, le processus de sélection des documents, puis, éventuellement, de saisie d'une information pertinente, est rarement considérée comme intéressante par les chercheurs. La pérennité d'une procédure coopérative de saisie dépend, tout à la fois, de l'expression nette de priorités politiques, de l'engagement continu d'au moins un chercheur ayant la responsabilité et l'autorité nécessaires pour convaincre un nombre suffisant de ses collègues et enfin de la disponibilité de spécialistes de la documentation connaissant bien le domaine, pouvant dialoguer avec les chercheurs et veiller aux normes de saisie. Une deuxième phase a débuté en 2001. Pour des raisons d'harmonisation entre les bases de l'INRP, il a été nécessaire d'effectuer une migration vers le logiciel DORIS (avec lequel s'effectue désormais la saisie), ce qui est toujours une opération assez délicate. Dans le cas présent, nous avons aussi souhaité assurer une forme d'interopérabilité entre les deux systèmes, les données devant également pouvoir être exportées depuis DORIS vers File Maker Pro sans perte d'information. L'harmonisation des noms et des types de champs entre les différents systèmes techniques n'a guère été problématique bien qu'elle ait nécessité une modification de la structure initiale et donc une bonne interlocution avec les responsables des autres bases de données. Par contre, certains paramétrages implicites des logiciels ont posé des problèmes pratiques. Il en va par exemple ainsi du choix des caractères séparant les descripteurs dans des champs à valeurs multiples, ou encore des règles tacites permettant à un système de rendre accessibles, par des liens hypertextes, des documents primaires. De ce fait, il a fallu concevoir des logiciels de conversion ad hoc (programmés en PERL et en visual Basic). De manière classique, on a aussi rencontré certains " effets annexes ". Ainsi, du fait des changements apportés à la structure, certains affichages " calculés ", ne s'effectuaient plus correctement et une partie des scripts initiaux ont dû être modifiés. A cette occasion, on mesure de manière très concrète l'importance que peuvent revêtir des choix d'implémentations apparemment mineurs faits plusieurs années auparavant, en fonction de règles ou des normes qui ont légèrement changé depuis. Par ailleurs, la vérification systématique de l'import effectué depuis le nouveau système (DORIS) a révélé un nombre non négligeable d'erreurs de saisie, inévitables, peu visibles en régime de croisière. Cette vérification incite évidemment à revoir certains principes d'indexation et de synthèses des documents, jugés avec le recul peu adaptés. Mais une révision systématique obligerait à un investissement dont il n'est pas certain qu'il soit à la mesure du service rendu. 3/ Perspectives Le système, tel qu'il existe, permet à toute personne intéressée de rechercher des informations en fonction de ses intérêts. L'équipe chargée de la base produit également périodiquement des extractions thématiques destinées à être publiées sous forme de ressources. Cette production est d'ailleurs un moyen efficace de tester la pertinence des informations conservées et ainsi de procéder à un désherbage et d'identifier de nouvelles références à saisir. Le rôle de l'équipe chargée de TECNEDOC est de traiter l'information utile contenue dans un document afin de permettre sa récupération quand besoin est. Pour l'avenir, il est donc prévu de développer l'accès à des documents primaires (en particulier de la littérature grise) ainsi qu'à des services interactifs, notamment par l'intermédiaire de liens hypertextes. De nombreuses questions se posent cependant. Selon quels principes étendre la base et sélectionner les documents à retenir ? Quelles (nouvelles) modalités d'indexation adopter et quels nouveaux services offrir aux usagers, en particulier en termes d'interrogation ? Comment déterminer les moyens humains à y consacrer ? Les enjeux sont multiples. Le premier est de fournir aux usagers une information correspondant à leurs intérêts. Pour cela, il est nécessaire de saisir en continu des documents " pertinents ", d'offrir des critères de recherche adaptés aux questions posées et, enfin, de donner accès à une information de synthèse ou, chaque fois que c'est possible, au texte lui-même. A cet égard, des chercheurs intéressés au repérage de leur champ de spécialité et des documentalistes doivent pouvoir travailler de manière coopérative. Références BARON Georges-Louis, BRUILLARD Eric (1996). - L'informatique et ses usagers dans l'éducation. - Paris : PUF. - 312 p. - (L'Educateur). - ISBN : 2-13-047492-6. CROS Françoise (1996). - L'innovation en éducation et en formation Banques de données NOVA : cadre conceptuel et guide d'utilisation. - Paris : INRP. - 181 p. - (Documents et travaux de recherche en éducation). - ISBN : 2-7342-0515-7. SALAME Naoum (1992). - Les banques de données dans l'enseignement de la biologie-géologie. - In : BARON Georges-Louis, BAUDE Jacques. L'intégration de l'informatique dans l'enseignement et la formation des enseignants. - Paris : INRP. - p. 163-170. - ISBN : 2-7342-0330-8. |