Nikolay GEORGIEV
Extraction de données à partir de pages
Web pour la mesure du comportement des internautes
Thèse en Informatique de l'Université
Université de Paris 6, le 21 décembre 2006 à
Paris
(Recherche et développement - Nielsen//NetRatings)
Mots-clés : Extraction de Données,
Extraction Web, Générateur de Patrons, HTML, XPath.
Si l’information disponible sur Internet augmente
de manière exponentielle, elle reste aujourd'hui largement
inexploitable par les moyens informatiques en raison de
sa nature textuelle. Certes, à moyen terme, la migration
vers le format XML devrait permettre un accès plus facile,
en particulier grâce aux recherches portant sur le web sémantique.
Cependant, aujourd’hui la problématique "Comment accéder
à l’information disponible sous forme de pages HTML/XHTML
?" garde toute sa pertinence, et représente un enjeu très
important pour les années à venir. La conception et le développement
de systèmes d’extraction de données reste donc une nécessité
forte, en particulier pour des entreprises telles que Nielsen//NetRatings
dont l'objet est d'évaluer finement le comportement des
internautes à partir de panels de centaines de milliers
de personnes, ce qui représente des dizaines de millions
de pages visitées à analyser. Plus précisément, la société
Nielsen//NetRatings souhaite pouvoir effectuer des analyses
quantitatives portant sur les transactions électroniques
passées sur des sites de services en ligne (/sites e-commerce,
banques en ligne, réservation en ligne, enchères en ligne,
etc/.). Nous nous intéressons donc au problème de l’identification
de ce type de pages et de la récupération de données pertinentes,
afin de les agréger et d’élaborer des statistiques concernant,
par exemple, les montants dépensés par les internautes en
ligne, les produits achetés, les services utilisés.
Les solutions existantes basées sur des technologies de
TAL (Traitement Automatique du Langage) ou d’apprentissage
automatique restent souvent inadaptées, car elles ne sont
ni assez performantes ni assez précises pour satisfaire
les besoins et les contraintes des entreprises. Récemment
des nouveaux systèmes d’extraction ont essayé de remédier
à cela en s’appuyant sur la structure HTML des pages Web.
Cependant, il reste très difficile de trouver une solution
qui offre un bon compromis entre la robustesse, la performance,
la précision et la simplicité d’utilisation.
Notre recherche a consisté à concevoir des outils robustes,
fiables et faciles d’utilisation permettant d’accéder aux
contenus textuels des pages Web. La nouveauté apportée par
notre approche réside dans la méthodologie d’extraction
qui est basée sur la reconnaissance progressive de sous-structures
nommées « structures locales » et sur le concept de « couple
d’information ». Le « couple d’information » représente
une règle d’extraction liant (/à travers une structure HTML
atomique/) des repères visuels flottants avec une donnée
recherchée (/définie par son format et sa cardinalité/).
Nous procédons en associant les pages web analysées à des
domaines d’extraction thématiques. Une fois la page reconnue
comme appartenant à un domaine thématique, l’extraction
est conditionnée par les connaissances basiques prédéfinies
(/le format de données, les dépendances entre les données,
leur cardinalité, etc./).
Toutes les variables nécessaires à la reconnaissance d’une
page et à l’extraction des données sont regroupées dans
un patron pour une application à grande échelle. Les expressions
d’extraction composant le patron sont générées d’une manière
semi-automatique à travers une interface graphique dans
une syntaxe XPath améliorée par l’utilisation d’expressions
régulières. Pour aider l’opérateur à construire ces patrons,
nous avons mis en œuvre un module de génération de propositions
basé sur des techniques de classification automatique qui
facilite son travail en l’assistant dans son choix. Cette
aide est induite à partir des choix antérieurs de l’utilisateur,
de telle sorte que le travail de l’opérateur se limite seulement
à des manipulations visuelles.
Afin de valider notre démarche d’extraction, nous avons
défini une méthodologie de comparaison avec laquelle nous
avons évalué notre système par rapport au système utilisé
jusque là par Nielsen//NetRatings (Acquire, qui nous a servi
de référence). Les résultats ont démontré que notre système
est en moyenne plus performant que Acquire. Cela a permis
sa mise en service.
Cette mise en production a été précédée par une modélisation
et implémentation d’un moteur d’extraction distribué, menées
en collaboration avec une équipe de 5 ingénieurs situés
aux Etats-Unis. Une architecture multi- machine a été définie.
Elle comporte un système de gestion de tâches, basé sur
PL/SQL et Oracle, ainsi que plusieurs « processeurs » déployés
sur des machines différentes faisant appel à notre API Java
pour l’extraction elle-même. En aval, un traitement a été
mis en place pour assurer l’interprétation, la reconstitution
et la validation des données extraites. La plateforme de
production est dotée d’une interface utilisateur dans laquelle
l’opérateur peut gérer les patrons existants, les modifier,
mais également sélectionner des pages pour en créer de nouveaux.
mél
Mathieu HIBOU
Réseaux bayésiens pour la modélisation de
l'apprenant : une approche basée sur les multi-réseaux
Thèse en Informatique de l'Université
Université René Descartes (Paris 5), le 13 décembre
2006 à Paris
Mots-clés : Réseaux Bayésiens, Modèle
de l'Apprenant, Diagnostic cognitif.
Si l'on veut concevoir un système d'enseignement
assisté par ordinateur (ce que l'on appelle aujourd'hui
un environnement informatique d'apprentissage humain ou
EIAH) qui soit capable de s'adapter aux besoins de ses utilisateurs
(les apprenants), il faut que ce système ait une représentation
de leurs connaisances. Cette représentation des connaissances,
le modèle de l'apprenant, peut prendre des formes très variées,
tant du point de vue des connaissances qui y sont modélisées
(le modèle conceptuel) que de celui de la manière dont elles
sont informatiquement modélisées (le modèle computationnel).
Du point de vue computationnel, dans la mesure où cette
modélisation doit se faire en tenant compte de l'incertitude
qui lie connaissances épistémiques et comportementales,
les réseaux bayésiens sont de plus en plus utilisés en modélisation
de l'apprenant. Ils permettent une adaptation dynamique
aux actions des apprenants à l'aide d'algorithmes d'inférence
mathématiquement bien fondés et relativement performants.
Dans la plupart des modèles de l'apprenant qui ont été construits
jusqu'à présent les connaissances de l'expert et celles
du novice ont une organisation commune. Il est certes envisagé
que l'expert ait davantage de connaissances que le novice
sur tel ou tel sujet, ou que le novice ait des connaissances
erronées, mais on ne tient pas compte des différences de
structuration des connaissances entre novice et expert.
Dans la mesure où ces différences sont mises en évidence
par la psychologie cognitive et sont considérées comme révélatrices
du niveau d'expertise, il nous semble important d'être capable
de les prendre en compte. Nous élaborons un modèle conceptuel
basé sur les réseaux bayésiens permettant de prendre en
compte et de diagnostiquer ces différences structurelles.
Il s'agit de passer d'un diagnostic quantitatif à un diagnostic
qualitatif : l'expert ne se contente pas d'en savoir plus
que le novice, son savoir est aussi organisé différemment.
Ce modèle conceptuel repose sur l'utilisation des multi-réseaux
: le modèle de l'apprenant n'est plus formé d'un mais de
plusieurs réseaux, chacun d'entre eux correspondant à un
niveau d'expertise. Le diagnostic prend alors en compte
l'ensemble de ces réseaux pondérés en fonction des réponses
de l'apprenant. Les multi-réseaux sont tout à fait compatibles
avec les techniques d'apprentissage machine, et nous décrivons
comment en apprendre les paramètres dans le cadre qui est
le notre, c'est-à-dire en présence de nombreuses variables
inobservables. Notre travail d'analyse nous conduit également
à formuler des solutions pour l'ingénierie des réseaux bayésiens
en modélisation de l'apprenant, sujet qui n'a pour l'instant
été que peu abordé dans la littérature.
Nous présentons les résultats expérimentaux que nous avons
obtenus en utilisant notre modèle conceptuel pour analyser
les réponses d'apprenants utilisant le système Pépite et
valider ainsi notre démarche.
mél
Issam REBAÏ
Conception et développement d'une plate-forme
permettant la capitalisation de composants logiciels
pour les environnements d'apprentissage humain
Thèse en Informatique de l'Université
Université René Descartes (Paris 5), le 11 décembre
2006 à Paris
Mots-clés : EIAH, Composant logiciel,
Métadonnée, Profil d'application augmenté,
Générateur de formulaires, Indexation, Entrepôt de composants.
Constatant le manque d’échange des artefacts
développés par la communauté EIAH, l’objectif de ce travail
de recherche est d’apporter des solutions au problème de
la capitalisation et de la réutilisation des composants
logiciels à des fins éducatives. Ce travail se situe aux
confins de quatre thématiques : les composants logiciels,
les métadonnées, les environnements interactifs d’apprentissage
humain (EIAH) et l’Indexation et Recherche d’Information
(IRI). Lors de l’analyse des besoins, nous avons dressé
un état de l’art sur les propriétés des composants logiciels,
les schémas de métadonnées pour les objets pédagogiques
et composants logiciels, les viviers de connaissance et
les outils de renseignement des métadonnées.
L’étude des différents schémas de métadonnées disponibles
nous a amené à proposer un schéma nommé LSCM (Learning Software
Component Metadata) pour mieux décrire les aspects spécifiques
des composants logiciels éducatifs. L’analyse des fonctionnalités
des plates-formes de formation nous a, quant à elle, amené
à proposer une classification des composants d’EIAH en quatre
catégories : CLP (Composant Logiciel Pédagogique), CLS (Composant
Logiciel de Service), CLT (Composant Logiciel Technique)
et CLF (Composant Logiciel de Fabrication – outil auteur).
Le schéma LSCM comporte deux sections : une section commune
aux quatre catégories qui décrit les CL sur le plan technique
et une spécifique à chaque catégorie qui décrit les aspects
métiers du composant. Le schéma LSCM a été implémenté en
XSD.
La thèse traite ensuite des profils d’application associés
aux schémas de métadonnées dont l’objectif est de pouvoir
adapter l’usage des métadonnées à des contextes spécifiques.
Le cas des multiples profils du LOM est évoqué pour montrer
le besoin d’harmonisation de leur implémentation. C’est
pourquoi nous proposons un patron nommé «profil d’application
augmenté» permettant d’implémenter ces profils et d’apporter
un supplément d’information sur la présentation des métadonnées
aux utilisateurs et sur l’interaction qu’ils peuvent avoir
avec ces métadonnées. L’objectif de ce patron est de fournir
un moyen de personnaliser et d’exprimer les spécificités
du contexte pour lequel sont conçus ces profils. Nous proposons
de plus un système semi-automatique d’instanciation des
fichiers du profil d’application augmenté.
Concernant le renseignement des métadonnées, nous montrons
que les divers outils existants pour renseigner les métadonnées
ne sont pas satisfaisants. En particulier, compte tenu de
l’évolutivité des profils d’application (y compris de notre
proposition LSCM), nous proposons un générateur dynamique
de formulaires de saisie à partir de l’analyse des schémas
XSD et des données du profil d’application augmenté. Ce
générateur est réutilisable et intégrable dans différents
projets. Pour stocker les composants développés dans la
communauté EIAH, nous avons aussi conçu un entrepôt de composants
logiciels appelé ECR (Educational Component Repository).
Tout composant logiciel y est déposé sous forme d’une archive
contenant les métadonnées, le fichier de déploiement et
facultativement le code source. Nous présentons enfin des
scénarii d’usage de l’entrepôt ECR et une vue macroscopique
du système.
mél
- web
Christelle LAPERROUSAZ
Le suivi individuel d'apprenants engagés
dans une activité collective à distance
TACSI un environnement informatique support aux activités
du tuteur
Thèse en Informatique de l'Université
du Maine, le 8 décembre 2006 au Mans
Mots-clés : EIAH, FEL, tutorat, suivi,
perception, activité collective, traces d’activité, visualisation.
Nos travaux s’inscrivent dans le domaine des
Environnements Informatiques pour l’Apprentissage Humain
(EIAH) et plus particulièrement dans le domaine de la Formation
en Ligne (FEL). Lors de la mise en place d’une FEL, une
dimension importante à prendre en compte est le suivi pédagogique
par un tuteur, un des points essentiels pour diminuer la
proportion d’abandon des apprenants. Dans ce contexte, le
tuteur a besoin d’outils informatiques pour le soutenir
dans ses tâches de suivi. Nos travaux s’inscrivent dans
une démarche d’instrumentation des activités du tuteur,
pour le suivi d’activité collective à distance, en s’intéressant
à la double dimension de ce type de suivi : le suivi de
l'activité collective en elle-même, c'est-à-dire faire en
sorte d'atteindre les objectifs prévus et le suivi individuel
de chaque apprenant engagé dans l'activité collective. Notre
problématique de recherche générale porte sur la question
du soutien informatique à fournir au tuteur pour lui permettre
d'assurer le suivi individuel d’une activité collective.
Nous adoptons une méthode de conception itérative et participative,
s’appuyant sur trois axes de description : modèles théoriques,
observations issues du terrain et artefact informatique,
impliquant les tuteurs d’activité collective à différents
moments du processus de conception. Nous étudions les rôles
et tâches du tuteur lorsqu’il suit une activité collective
afin d’élaborer un modèle de suivi individuel d’apprenants
engagés dans une activité collective, le modèle SIAC, qui
permet d’appréhender et d’organiser les tâches du tuteur
nécessaires pour assurer un tel suivi. Ce modèle a été confronté
aux besoins réels des tuteurs. C’est un modèle générique
qui sert de fondement au développement d’environnements
informatiques de suivi d’activité collective individualisé.
Une problématique plus spécifique travaillée dans nos travaux
porte sur la question de l'instrumentation des activités
du tuteur pour lui permettre de percevoir l'activité individuelle
des apprenants. Dans ce cadre, nous étudions les traces
d’activité sur lesquelles le tuteur peut fonder sa perception
et nous proposons des solutions informatiques pour les présenter
au tuteur de manière à lui fournir une visualisation précise
de l’activité individuelle dans l’activité de groupe.
Nos travaux ont également conduit à la conception et à la
réalisation de l’environnement TACSI, un environnement qui
permet à un Tuteur d’Activité Collective d’assurer un Suivi
Individualisé des apprenants, dans le cadre d’activités
d’écriture collective. Cet environnement permet au tuteur
d’assurer trois types d’activité : la perception des activités
individuelles et collectives, la gestion de sa propre activité
de suivi ainsi que l’animation de l’activité collective.
TACSI offre au tuteur les moyens de visualiser les traces
d’activité des apprenants et la dynamique de groupe selon
différents points de vue complémentaires et croisés. Les
vues sont construites en fonction de l’étape du scénario
d’apprentissage, de l’apprenant considéré et des différentes
contributions, individuelles et collectives, des apprenants.
Une campagne de mise à l’essai de TACSI a été organisée
dans différents contextes d’apprentissage. Nous avons procédé
à une analyse croisée de l’utilisation de TACSI par les
différents tuteurs, de manière à identifier les limites
actuelles de l’environnement, et à faire émerger des points
de convergence et de divergence vis-à-vis de l’utilisation
de TACSI, en fonction de la situation. Les retours des tuteurs
nous permettent de valider l’organisation générale de l’environnement
et les modalités de manipulation par le tuteur. Ils mettent
également en évidence la nécessité de rendre plus explicites
les différentes fonctionnalités offertes et de proposer
aux tuteurs un environnement paramétrable en fonction de
la situation de suivi.
mél
- web
Nicolas GUIBERT
Validation d’une approche "Programmation
sur Exemple" pour l’apprentissage de la programmation
Thèse en Informatique de l'Université de
Poitiers, soutenue le 7 décembre 2006 à Poitiers
Mots-clés : Programmation sur Exemple,
Interaction Homme-Machine (IHM), Environnements Informatisés
pour l’Apprentissage Humain (EIAH), Psychologie de la Programmation,
Etudes Expérimentales.
Alors qu’ordinateurs et programmes informatiques
se sont implantés dans nombre de disciplines scientifiques
en tant qu'outils d'analyse ou instruments de mesure, l'acquisition
des compétences requises pour la conception de programmes
ne se fait pas aisément. De nombreuses études ont caractérisé
les erreurs et difficultés rencontrées par les programmeurs
novices. Les environnements actuellement utilisés pour l’apprentissage
de la programmation se composent d’outils conçus dans une
unique optique de développement, et non pas dans un cadre
explicitement pédagogique. A cette approche « industrielle
» s'oppose une approche explicitement pédagogique, où le
but premier est la découverte et la construction de connaissances,
et non pas la réalisation de tâches techniques. Cette Thèse
étudie l’usage d'un paradigme de programmation alternatif,
la programmation graphique sur exemple, comme support à
la construction active d’un savoir viable par l'étudiant,
en s’appuyant sur des expérimentations en situation réelle
avec un environnement adapté, conçu explicitement pour l’apprentissage.
mél
- web
Magali OLLAGNIER-BELDAME
Traces d'interactions et processus cognitifs
en activité conjointe :
Le cas d'une co-rédaction médiée par un artefact numérique
Thèse en Sciences Cognitives de l'Université
Claude Bernard (Lyon 1), le 6 décembre 2006 à
Lyon
Mots-clés : Apprentissage humain,
activité conjointe, appropriation, artefact, cognition située
et distribuée, développement, ethnométhodologie, expérience,
histoire interactionnelle, instrument, interactions, mise
en situation, objet intermédiaire, réflexivité, système
informatique, traces, utilisateur.
Lorsque l’on s’intéresse à l’activité humaine
selon une approche interactionniste de la cognition, la
question de l’appropriation des dispositifs techniques par
les utilisateurs est centrale. Selon cette posture, la cognition
humaine est /située/ dans la matérialité de l’environnement
et /distribuée/ entre les /actants/ de la situation.
En situation d’apprentissage, la question de l’appropriation
des artefacts est majeure et renvoie en particulier aux
situations où les apprenants mobilisent un environnement
informatique pour l’apprentissage humain. Cependant, peu
de recherches étudient les éléments de la situation qui
favorisent l’appropriation du dispositif numérique et participer
au développement de l’activité et au développement du sujet
agissant.
Dans cette recherche, nous faisons l’hypothèse que la visualisation
des traces informatiques des interactions entre sujet et
système peut réduire l’écart qui existe entre l’utilisation
du dispositif « prescrite » par le concepteur et l’utilisation
« réelle » par l’utilisateur. Cet écart, gênant la genèse
instrumentale de l’artefact, est souvent à l’origine de
problèmes d’appropriation du dispositif. Cette recherche
interroge le rôle de l’expérience en activité médiée et
conjointe, et mobilise quatre domaines de recherche : l’interaction
homme-machine, la psychologie de la cognition, l’activité
médiée et la théorie de l’apprentissage.
Nous proposons une mise en situation de co-rédaction instrumentalisée
/via/ un dispositif numérique composé de différents espaces
communicationnels et rédactionnels, présentant une certaine
validité ecologique. Nous réalisons une étude ethnométhodologique
des interactions ayant lieu, entre sujets /et/ entre sujets
et espaces numériques, et du rôle des traces dans les interactions.
mél
Isabelle AUDRAS
Médiation informatique pour l'apprentissage
du Français Langue Etrangère écrit : Etudes auprès d'un
public lettré et en formation d'alphabétisation
Thèse en Sciences Cognitives
de l'université de Paris 6, le 4 décembre
2006 à Paris
Ce travail de thèse rassemble les domaines
de la psychologie cognitive, des sciences du langage,
de la didactique du Français Langue Etrangère (Fle) et
du Traitement Automatique des Langues, autour d'une problématique
articulant acquisition de l'écrit et aide informatisée.
Nous y postulons que l'outil informatique, objet du quotidien
et/ou logiciel sophistiqué d'analyse textuelle, joue un
rôle de médiateur dans ce contexte, en complémentarité
avec celui du formateur.
Nous analysons ici l'apport de trois outils informatiques
dans l'aide à l'apprentissage de l'écrit en langue étrangère,
en distinguant un public d'apprenants lettrés et un en
formation d'alphabétisation. Pour les apprenants lettrés,
nous considérons l'interlangue, ni langue-cible ni langue
maternelle, comme preuve et témoin de l'apprentissage.
Et nous faisons l'hypothèse que l'utilisation des outils
d'extraction automatique du langage aide à l'analyse des
productions d'apprenants en proposant : 1) une interprétation
automatique du diagnostic cognitif, ou 2) une visualisation
du processus rédactionnel en cours. Nous interrogeons
ces outils dans une perspective d'aide logicielle à la
partie du processus rédactionnel correspondant à la correction.
Pour le second public, selon une approche socio-constructiviste
de l'apprentissage, nous appuyant sur l'environnement
social et familial dans lequel l'objet ordinateur est
présent, nous proposons une progression d'activités avec
le traitement de texte qui aide à la prise de distance
lors du passage à l'écrit.
Pour chaque situation d'apprentissage, nous évaluons l'outil
informatique utilisé et en proposons une méthodologie
appropriée.
L'intérêt de cette approche concerne trois domaines :
1) la formation d'adultes pour l'acquisition de l'écrit
en langue étrangère ; 2) la linguistique computationnelle
; 3) l'enseignement assisté par ordinateur.
mél
Bernard ANDRÉ
Utilisation des progiciels : identification
d’obstacles et stratégies de formation
Thèse en Sciences de l'Éducation
de l'ENS Cachan, le 4 décembre 2006 à Cachan
Mots-clés : lecteur, progiciels,
système de traitement de texte, système éditorial aprofessionnel,
système lectorial, typographie, mise en page, lisibilité,
visibilité, structure du document, mise en forme matérielle,
TIC.
La finalité du système constitué d’un utilisateur
et d’un système de traitement de texte est de produire des
documents visibles et lisibles pour un lecteur humain. L'analyse
de l'évolution des progiciels de traitement de texte révèle
une complexité fortement croissante. Contrairement à l’idée
répandue de leur facilité d’usage, nous constatons qu’ils
posent des problèmes récurrents aux utilisateurs (éditeurs
ou lecteurs) attestés par une étude informatisée des traces
laissées dans un ensemble contrasté de fichiers : les objets
abstraits sont peu utilisés et le plus souvent indépendamment
de leur fonction de structuration hiérarchique ou sémantique.
La mise en perspective des facteurs métier, économique et
technique dans la genèse de ce système montre la nécessité
de passer de l’étude du « traitement DE texte » à celle
du « traitement DU texte ». Cette approche nouvelle conduit
à proposer d’autres orientations de recherche dans l’élaboration
de curriculums.
mél
François-Xavier BERNARD
L’impact cognitif des dispositifs médiatiques
sur les enfants d’âge préscolaire en situation d’apprentissage
avec un adulte. Etude d’un cas de simulateur informatique
dans le contexte d’une exposition scientifique.
Thèse en Sciences de l'Éducation
de l'Université René Descartes (Paris 5), le 20 novembre
2006 à Paris
Mots-clés : logiciel de simulation,
synthèse des couleurs, enfant d'âge préscolaire,
exposition scientifique, apprentissage, interaction parent/enfant,
carré médiatique.
La recherche s'intéresse à l'apport au plan
cognitif des dispositifs médiatiques présentés dans les
expositions scientifiques interactives pour jeunes enfants,
dans différents contextes d'accompagnement. Deux études
ont été réalisées successivement dans l'exposition des 3/5
ans de la Cité des enfants à la Cité des sciences et de
l'industrie (Paris), à propos d'un simulateur informatique
proposant de réaliser des mélanges de peintures. Quarante-cinq
enfants âgés de moins de six ans, ont été observés : vingt
sous la conduite d'un tuteur expert, puis vingt-cinq sous
la conduite d'un de leur parent. Afin de caractériser les
interactions dyadiques en cours d'activité, nous avons eu
recours à un modèle : le carré médiatique. Il ressort de
l'analyse des interactions adulte-enfant que la tutelle
exercée n'a d'impact qu'à partir d'un certain âge relatif
au domaine de connaissances considéré, et apparaît essentiellement
liée au contenu informationnel des échanges. Par ailleurs,
l'activité de simulation semble avoir principalement fonction
d'exercice formel pour l'enfant. L'impact de l'utilisation
des dispositifs de type simulation, présentés dans les expositions
scientifiques, serait donc subordonné à l'expérience préalable
de l'enfant, mais aussi à la qualité de la tutelle déployée
par l'adulte accompagnateur. Ce dernier point pose la question
de l'aide à la conceptualisation, sur le plan du discours,
mais aussi à l'utilisation, sur le plan manipulatoire.
mél
Federico TAJARIOL
Les effets des indices non-verbaux sur les
activités de communication à distance -
Deux études expérimentales sur le dialogue tutoriel.
Thèse en Sciences Cognitives de l'Université
Joseph Fourier, le 30 octobre 2006 à Grenoble
Mots-clés : Communication médiatisée,
vidéo-présence, vidéo-activité,
dialogue tutoriel.
Notre travail s'insère dans le domaine de
la communication audio-vidéo médiatisée. Dans la communication
à distance, l'interface n'est plus un simple objet d'adressage
et de traduction pratique des commandes de l'opérateur,
mais devient plutôt un espace de communication interpersonnelle.
L'action de communiquer avec autrui est une activité coopérative,
qui demande que les interlocuteurs co-construisent mutuellement
leurs référentiels, s'appuyant sur les indices verbaux et
non-verbaux. Nous distinguons les indices non-verbaux kinésiques
(e.g., les expressions faciales, les regards, les gestes
du corps, etc.) et les indices non-verbaux ostensifs-inférentiels
(e.g. les gestes déictiques, les actions physiques). Nous
avançons deux hypothèses de travail principales : A) les
indices non-verbaux kinésiques facilitent surtout le processus
de communication et favorisent un sentiment de proximité
sociale entre les partenaires distants ; B) les indices
non-verbaux ostensif-inférentiels facilitent surtout l'intercompréhension
et la réalisation de la tâche commune. Pour vérifier ces
hypothèses, nous avons construit une tâche expérimentale
dans laquelle un tuteur se doit d'assister deux apprenants
distants impliqués à réaliser un travail pratique. Dans
la première expérimentation (n tutor=12, N étudiants = 48),
nous étudions les effets des indices non-verbaux kinésiques,
véhiculés par l'image-vidéo montrant les partenaires distants.
Dans une deuxième expérimentation (n tutors = 12, étudiants
= 72), nous nous intéressons aux indices non-verbaux ostensifs-inférentiels,
véhiculés par l'image-vidéo relative aux actions effectuées
par les partenaires distants sur les objets appartenants
à leur espace de travail.
mél
Guillaume DURAND
La scénarisation de l'évaluation des activités
pédagogiques utilisant les Environnements Informatiques
d'Apprentissage Humain.
Thèse en Informatique de l'Université
de Savoie, le 24 octobre 2006 à Chambéry
Mots-clés : Espace numérique de travail,
ingénierie des EIAH, scénarios pédagogiques,
activités d'évaluation, opérationnalisation.
L'évaluation est indissociable des activités
d'apprentissage conduites par les enseignants ou menées
par les élèves. Depuis longtemps et dans différentes disciplines
(didactique, sciences de l'éducation, psychologie, docimologie),
elle fait l'objet de travaux et de réflexions qui contribuent
à en délimiter le champ et à préciser la nature des activités
supports qui permettent de la mettre en œuvre. D'une manière
générale, l'évaluation a pour objectifs la régulation et
la vérification des apprentissages.
Mais elle joue aussi un rôle important dans la sélection
des élèves et leur insertion sociale lors de la mise en
place des examens et des concours. Le choix des méthodes,
des outils et des techniques dépend donc en grande partie
des objectifs assignés par l'enseignement.
Historiquement, les Environnements Informatiques pour l'Apprentissage
Humain (EIAH) utilisés dans le cadre scolaire ou dans celui
de la formation continue ont toujours intégré sous des formes
variées des moyens d'évaluer les utilisateurs en s'appuyant
sur les méthodes, les outils et les techniques traditionnels
de l'évaluation. Mais leur façon d'exprimer les résultats
demeure spécifique à chaque EIAH, ce qui peut paraître naturel
si on admet qu'un EIAH concerne généralement une discipline
particulière et n'est utilisé la plupart du temps qu'individuellement,
par l'élève ou par l'enseignant.
Cependant, l'apparition des Espaces Numériques de Travail
(ENT) remet cette situation en cause dans la mesure où les
évaluations produites peuvent intéresser d'autres acteurs
que l'enseignant ou l'élève et peuvent être utilisées par
d'autres services présents au sein de l'ENT, en particulier
les services de scolarité. Une des questions importantes
que soulève l'intégration des EIAH au sein des ENT est donc
celle de leur interopérabilité à travers les résultats qu'ils
produisent. Cette question se pose dans des termes d'autant
plus difficiles que l'intégration des EIAH dans les ENT
se traduit généralement par la scénarisation de leur usage,
en particulier à l'aide des langages de modélisation pédagogique.
L'étude comparée des propositions faites récemment par les
principales équipes travaillant sur ces questions au niveau
international illustre clairement ces difficultés.
Les recherches menées dans le cadre de cette thèse ont donc
pour objet la définition d'un modèle de résultats produits
par les EIAH qui puisse être utilisable dans le contexte
des ENT. A partir d'un inventaire et d'une analyse approfondie
des situations typiques d'évaluation reconnues par les différents
spécialistes, ce modèle a été conçu en tenant compte des
langages de modélisation pédagogique et en proposant de
doter ces langages de propriétés utiles à la scénarisation
et l'opérationnalisation des activités d'évaluation. Le
langage cible sur lequel ces propriétés ont été proposées
et implantées est LDL (Learning Design Language), langage
utilisé principalement pour modéliser des activités pédagogiques
coopératives.
Enfin, une architecture a été conçue pour l'agrégation des
résultats et leur archivage dans une base de traces favorisant
leur réutilisation en vue d'une éventuelle adaptation des
scénarios. Des exemples de scénarios d'évaluation réellement
exécutables sur quelques ENT cibles servent de démonstrateurs
aux travaux.
mél
- web
Faiçal AZOUAOU
Modèles et outils d'annotations pour une
mémoire personnelle de l’enseignant.
Thèse en Informatique de l'Université
Joseph Fourier, le 19 octobre 2006 à Grenoble
Dans le cadre des recherches sur les Environnements
Informatiques pour l’Apprentissage Humain, cette thèse vise
à définir et proposer à l’enseignant une mémoire informatisée
comme outil de gestion de connaissances personnelles. Cette
mémoire est construite à partir des annotations de l’enseignant
sur les documents pédagogiques. La mémoire résultante étend
les capacités cognitives de l’enseignant en l’assistant
dans la gestion de ses connaissances personnelles, nécessaires
à la réalisation de ses activités de manière non intrusive.
La prise en compte des particularités de l’activité d’enseignement
(connaissances impliquées, contexte de l’activité…) dans
les modèles de la mémoire permet d’obtenir une mémoire qui
est en même temps dédiée à l’activité d’enseignement et
s’adapte au contexte de cette activité. Deux versions de
l’outil sont développées : une version mobile et une version
web (implémentée par l’entreprise Pentila) intégrable dans
un ENT.
mél
- web
Emmanuel DUPLÀA
La relation pédagogique en ligne
Étude, conception, mise en place et expérimentations de
nouveaux dispositifs de formation utilisant les technologies
de l’information et de la communication dans différents
contextes institutionnels.
Thèse en Sciences de l'éducation
de l'Université du Maine, le 7 octobre
2006 à Bagneux
La présente thèse porte sur la relation pédagogique
en ligne, via Internet. L’objet relation est défini comme
relevant essentiellement d’une praxis abordée à partir d’une
approche transdisciplinaire : elle convoque les sciences
de l’éducation, la psychanalyse et les technologies de l’information
et de la communication en tant qu’usage social et support
à la formation en ligne. Les terrains de la thèse sont deux
écoles d’ingénieurs d’idéologies différentes et ils fournissent
un cadre comparatif pour des interventions en formation
de formateurs. Il s’agit de mesurer la pénétration de ces
institutions par un outil de communication textuel non connu
des formateurs en exercice.
Les relations pédagogiques en ligne se construisent à distance
par les symboles langagiers numériques sur lesquels nous
centrons notre étude. Les recherches en psychologie du développement
de l’enfant de la première moitié du XXe siècle, notamment
celles de Vygotski et de Piaget, ont fourni à la pédagogie
un cadre de pensée encore utilisé aujourd’hui. Les travaux
de ces auteurs se sont centrés pour l’essentiel sur les
aspects cognitifs et socio-cognitifs de la genèse de l’intelligence
en ignorant, sans les nier, les composantes relationnelles
et affectives, conscientes et inconscientes, de ce développement,
en particulier dans l’accès à la fonction symbolique.
Au contraire, l’approche psychanalytique propose une conception
essentiellement relationnelle et affective de la genèse
des symboles. À la suite de Freud, les travaux de psychanalystes
non freudiens, tel que C. G. Jung sur la symbolique de l’inconscient
collectif et Sami-Ali sur les fondements corporels psychosomatiques
de l’inconscient, proposent une approche de la fonction
symbolique sinon contradictoire, du moins différente, de
l’approche cognitive. C’est en référence à ces approches
qu’il est possible de saisir les difficultés inhérentes
aux pratiques pédagogiques en ligne, en particulier non-directives.
Dans ce cadre, nous montrons, en empruntant le concept à
Jung, que la pédagogie en ligne doit prendre en considération
les problèmes liés à ce que nous avons appellé le « quatrième
élément », par rapport aux définitions traditionnellement
triadiques ou triptiques du symbole. Ce quatrième élément
est défini en lien avec la mise en application par les sujets
de leurs activités symboliques dans la praxis, avec leurs
expériences éprouvées de l’Autre au cours de cette activité
en relation et, finalement, avec l’affirmation d’une nouvelle
place du corps physique dans le discours intellectuel.
Le travail méthodologique réalisé est praxéologique et transdisciplinaire.
Sur la base d’un processus symbolique quaternaire, nous
développons une définition à posteriori de la relation pédagogique
en ligne comme objet de recherche à partir de l’engagement
du chercheur dans la pratique. Cet engagement du chercheur
demande un positionnement à l’interstice des acteurs, sur
la relation en tant que telle. Ceci l’entraine à se considérer
lui-même comme partie prenante de la relation tant dans
sa dimension individuelle qu’institutionnelle. Comme dans
toute praxis, son intervention est déterminante dans le
développement de la méthode subjectiviste appliquée retenue
et pour l’intégration symbolique du quatrième élément dans
une forme réflexive d’ingénierie pédagogique des formations
en ligne. Le cadre appliqué de la recherche demande également
une méthodologie de recherche-action par la formation de
formateurs en entreprise et en université. La conception
et la diffusion de formations à caractère innovant, d’un
point de vue des symboles langagiers, a permis de réaliser
des entretiens cliniques ouverts et semi-directifs sur des
aspects susceptibles de faire progresser nos hypothèses
et par là même notre compréhension de l’objet qu’est la
relation pédagogique en ligne, qui ne se définit qu’en fin
de recherche.
À la lumière de ces expériences et des cas d’étude générés,
une définition de la relation pédagogique en ligne est donnée
à partir de deux déterminants symboliques : d’une part un
déterminant d’origine biographique et psychosomatique, et
d’autre part un déterminant d’origine institutionnelle.
C’est au croisement de ces deux déterminants que se réalise
l’apprentissage en ligne et l’évolution de l’identité, par
les échanges en ligne de ce que nous appelons des corps
symboliques. À partir de ces résultats, nous développons
une réflexion sur l’ingénierie de formation en ligne, en
déduisant des spécifications sur la formation de formateurs
à la relation pédagogique en ligne, sur l’ingénierie pédagogique
de formation en ligne et sur une application de communication
qui supporterait la relation en tant que telle. Enfin, à
la lumière des résultats obtenus, l’expérience permet d’établir
les limites et les perspectives de la thèse. Ces dernières,
au vue de l’importance grandissante des symboles numériques
dans nos sociétés, peuvent toucher jusqu’à la cohabitation
de cultures différentes.
mél
- web
Alain CORBIÈRE
Analyses des apports du méta-standard, ODP-RM
à la communauté EIAH, Instances sur un système de formation.
Thèse en Informatique de l'Université
du Maine, le 27 juin 2006 au Mans
Ce travail de thèse propose un cadre méthodologique
pour l'ingénierie et la réingénierie de la formation à distance
qui s'appuie sur les récents efforts de normalisation des
technologies éducatives. Ce cadre s’adresse aux concepteurs,
afin de les accompagner dans leur travail, et de favoriser
l’acquisition de nouvelles connaissances et compétences,
notamment d’ordre conceptuel, organisationnel et méthodologique.
En amenant les concepteurs à spécifier de manière explicite
leurs intentions de conception d’un système de formation
dans des modèles, et en confrontant ces modèles de spécification
avec les usages observés durant les sessions d’apprentissage,
nous accompagnons la nécessaire démarche réflexive de l’équipe
de conception sur ses méthodes, et favorisons le développement
et la capitalisation des savoir-faire et des démarches pédagogiques
au sein d’une communauté de concepteurs.
Nous avons proposé le cadre de référence du
processus distribué ouvert de l’ISO (International Organization
for Standardization) et de l’IEC (International Electrotechnical
Commission) comme le méta-standard à adresser aux concepteurs
de la communauté EIAH. La vision globale d’un système est
explicitée par des mécanismes de transformations de différents
points de vue.
Un tel cadre a pour intérêt d’adresser un
ensemble de termes à la communauté de concepteurs soucieux
de partager les pratiques. Ce vocabulaire permet d’expliciter
les invariants et les principes généraux, structuraux et
fonctionnels d’un système de formation. Le travail présenté
dans cette thèse vise à définir différentes instances d’un
tel méta-standard et à illustrer ainsi les différents apports
de ce modèle à la communauté des concepteurs des EIAH. La
présentation du travail se structure autour de trois analyses
instrumentées par le cadre ODP-RM (Object Distributed Processsing
- Reference Model), trois réflexions sur la conception d’un
EIAH portant sur l’utilisation des technologies éducatives
normées, sur la réingénierie dans les EIAH et sur le processus
de développement dirigé par les modèles. Les illustrations
présentées dans le mémoire montrent le potentiel du cadre
choisi à formaliser ces différents constats et à créer un
ensemble d’instances décrivant de nouveaux éléments méthodologiques
à adresser à la communauté de concepteurs d’un système de
formation.
mél
- web
Johan MICHEL
Modèles d'activités pédagogiques et de support
à l'interaction pour l'apprentissage d'une langue - Le système
Sampras.
Thèse en Informatique de l'Université
du Maine, le 26 juin 2006 au Mans
Nos recherches s'inscrivent dans le domaine
des EIAH et plus particulièrement dans les recherches menées
sur la conception d'environnements d'apprentissage des langues
étrangères. Nous nous intéressons à la conception et au
support d'activités interactives au sein d'un micromonde
dédié à l'apprentissage du français langue étrangère. L'idée
sur laquelle repose la thèse est que l'apprentissage de
la langue peut prendre place dans l'interaction entre un
apprenant et un agent conversationnel. L'usage de la langue
étrangère est mis en jeu au travers de la simulation d'une
tâche applicative à accomplir dans un monde virtuel, réalisation
impliquant la communication entre un apprenant et son partenaire
virtuel. Nous élaborons des modèles qui décrivent les activités
pédagogiques mises en place et le support aux interactions
qu'elles génèrent. Ces modèles se décrivent selon trois
dimensions qui permettent de caractériser la conception
: tâche, interaction et langue. La description de la dimension
tâche recouvre la description des tâches pédagogiques proposées
aux apprenants, des tâches interactives créées à partir
des spécifications des tâches pédagogiques et de la tâche
applicative dont la résolution sert de prétexte à l'interaction.
La description de la dimension interaction présente les
types d'interaction attendus entre l'apprenant et son partenaire
au cours des activités pédagogiques et le modèle d'interaction
qui articule ces types d'interaction. La présentation de
la dimension langue décrit le modèle du lexique, les mécanismes
d'analyse des énoncés de l'apprenant et de génération des
réactions du partenaire. Ces modèles ont été mis en œuvre
lors de l'implémentation d'un prototype. Ce prototype a
été expérimenté auprès de débutants en français langue étrangère.
mél
- web
Gérard PUIMATTO
Les réseaux numériques éducatifs, régulateurs,
acteurs et vecteurs de l'évolution des pratiques et de l'organisation
des établissements et de l'institution scolaires.
Thèse en Sciences de l'Information
et de la Communication de l'Université Paris XIII,
le 7 juin 2006 à Paris
mots clés : Réseau – numérique –
école – éducation – télématique – Internet – Intranet –
ENT – usages – communication – organisation – collectivité
– territoire – sociotechnique – acteurs – technico-économique
– innovation – industrialisation
Cette thèse décrit comment divers réseaux,
regroupés plus ou moins artificiellement sous le terme générique
de réseau numérique éducatif, se sont développés dans le
système scolaire français de 1987 à 2005. Son premier objet
est de montrer comment les contributions de la télématique,
des réseaux locaux, d'Internet, des Intranet et des espaces
numériques se sont ajoutées les unes aux autres pour former
un ensemble stratifié. Le second est d'examiner comment
ces réseaux se sont installés comme une composante du développement
d'une communication scolaire médiatisée. Ce processus est
appréhendé sous les éclairages de la technique, des usages
et de l'organisation, selon des niveaux de développement
qui se déplacent progressivement de l'individu et de l'établissement
vers d'autres échelles : l'académie, le territoire, la collectivité,
le système éducatif.
La démarche de recherche s'inspire de la théorie de l'acteur-réseau
appliquée dans une perspective visant à examiner les modalités
d'innovations sociotechniques. La globalité de l'approche
« du » réseau considéré comme un processus d'innovation
conduit à cerner son cadre fonctionnel dans sa construction
et son évolution. Les modalités de réalisation de l'alliage
sociotechnique montrent la diversité et l'importance des
enjeux et des acteurs. Les processus itératif de controverses
et d'alignements stratégiques qui les animent révèlent de
quelle manière le réseau numérique éducatif devient un facteur
d'unité technique, éducative et stratégique.
Les travaux conduits mettent en évidence cinq tendances
lourdes : l'organisation progressive d'une architecture
globale d'information, l'affirmation de l'importance d'une
démarche stratégique, des dynamiques d'usage qui passent
au second, une logique d'industrialisation et une extension
progressive du domaine scolaire vers le domicile. Leur caractère
concomitant est déterminant dans un processus général de
globalisation et de banalisation des fonctions communicationnelles
scolaires.
mél
Julien BROISIN
Un EIAH au service de la virtualisation et de la gestion des objets pédagogiques
Thèse en informatique de l'Université Paul Sabatier, Toulouse III
soutenue le 29 mai 2006 à Toulouse
Aujourd’hui, la Formation Ouverte et A Distance (FOAD) est de plus en plus répandue aussi bien dans les institutions publiques que privées, mais elle est loin de représenter une méthode d’apprentissage utilisée par tous. Un moyen de faciliter et d’encourager la conception de cursus pédagogiques par les éducateurs est de mettre à leur disposition une masse importante d’objets pédagogiques de natures variées tant au niveau des domaines d’apprentissage visés que du type de supports numériques utilisés, ainsi que de la langue dans laquelle ils sont produits.
Nos travaux exposent les capacités d’un Environnement Informatique pour l’Apprentissage Humain (EIAH) à fournir deux services complémentaires qui conduisent à la virtualisation des ressources pédagogiques : une vue unique d’un ensemble de ressources pédagogiques renfermées dans des viviers de connaissance distincts, et un accès facilité à celles-ci à travers les plates-formes d’apprentissage. Nous présentons une architecture ouverte basée sur des standards de l’e-formation établis ou en cours d’élaboration, et qui assure l’intégration des services énoncés ci-dessus au sein d’un EIAH. Nous présentons deux expérimentations déployées au sein de contextes différents qui valident notre approche et qui favorisent ainsi le partage et la réutilisation des objets pédagogiques.
La seconde partie de nos travaux porte sur la supervision des ressources, systèmes informatiques et utilisateurs impliqués dans le processus de virtualisation afin de faciliter aux éducateurs la recherche de matériel pédagogique pertinent pour leur contexte parmi le nombre considérable de ressources offertes par la fédération des viviers de connaissance. Nous présentons un modèle d’information décrivant les entités précitées et qui constitue une extension de CIM (Common Information Model) pour l’EIAH, ainsi qu’une infrastructure de supervision composée d’agents de gestion, d’un fournisseur de données, d’un gestionnaire centralisé et d’une application graphique de gestion. Nous appliquons ensuite cette infrastructure au sein de notre EIAH et de l’outil de recherche et d’indexation d’objets pédagogiques de la fondation ARIADNE. Enfin, nous exposons comment les informations statistiques recueillies peuvent être exploitées pour présenter aux concepteurs de cursus pédagogiques des ressources de qualité.
mél- web
Katerina ZOUROU
Apprentissages collectifs médiatisés et
didactique des langues : instrumentation, dispositifs et
accompagnement pédagogique.
Thèse en Sciences du Langage de l'Université
Stendhal Grenoble III, le 22 février 2006 à
Grenoble
mots clés : Formation des enseignants
aux TICE, didactique des langues, FOAD, CSCL, outils technologiques.
Cette thèse s’inscrit dans le domaine des
sciences du langage et plus particulièrement de la didactique
des langues. Elle contribue à l’étude d’une double situation
de formation et d’enseignement/apprentissage en français
langue étrangère, dans ses dimensions à la fois sociales
et technologiques. Le terrain d’analyse est un dispositif
hybride de formation aux TICE à destination de futurs enseignants
de FLE (projet « le français en « première » ligne »). Ainsi,
cette étude a-t-elle une double visée : d’une part une visée
herméneutique, analysant des usages et des processus interindividuels
comme étant situés dans l’environnement technologique et
distribués entre acteurs ; d’autre part, une visée praxéologique,
dont l’objectif est la conception de dispositifs et l’amélioration
des pratiques de formation.
La problématique part du constat que les processus
cognitifs se forgent dans le rapport à l’autre et dans le
rapport aux artefacts qui médiatisent la cognition humaine.
La théorie socioculturelle fournit alors un bon cadre de
référence conceptuel. Selon une approche délibérément interdisciplinaire,
cette thèse puise dans quatre approches souvent associées
à la théorie socioculturelle : la théorie de l’activité,
le paradigme de la cognition distribuée, le paradigme de
la cognition située et le paradigme de la cognition socialement
partagée. Le champ interdisciplinaire des Apprentissages
Collectifs Assistés par Ordinateur (CSCL dans la terminologie
anglo-saxonne) est également convoqué.
mél