LA PERCEPTION VISUELLE

Approche psychologique

• Retour au sommaire, approche psychologique

Perception visuelle, traitement descendant

• Reconnaissance et identification des objets
•   Reconnaissance et identification des visages
•   Reconnaissance des mots
•   Traitement cognitif de scènes complexes

• Définitions

Le chapitre précédent porte sur les théories concernant le traitement neuro-sensoriel et le traitement perceptif (ascendant) du stimulus. Ce qui suit est consacré à la présentation du traitement cognitif (descendant). Certaines pathologies cérébrales provoquent une dissociation des deux niveaux de fonctionnement habituellement intégrés, et l'observation clinique des patients qui en sont atteints est pour beaucoup dans l'élaboration d'un modèle de fonctionnement modulaire. Autre exemple de dissociation, temporaire mais non pathologique : l'expérience perceptive dans l'acte pictural. Cézanne cité par H.Maldiney 1994, pp.226-227 affirme qu’ « Il ne faut jamais avoir une idée, une pensée ou un mot à sa portée lorsqu'on a besoin d'une sensation ». Lors de cette quête de la « petite sensation » le peintre qui parvenant à un état psychique où il ne sait rien par avance d'une image du monde qu'il y aurait à transcrire, serait ainsi capable de se déconnecter du traitement descendant. Plus près de nous, Ehrenzweig 1974, p. 69, plasticien et psychanalyste éclaire cette position de l'artiste en présentant comme une loi psychologique que « toute recherche créatrice suppose que l'œil interne fixe une multitude de choix possibles, qui mettraient en échec total la compréhension consciente », moment de disruption, passage à vide oublié lorsque « l'esprit créateur remonte à la surface avec une pénétration fraîchement acquise ». Mais si l'isolation, sur le plan conceptuel, des différents modules de traitement perceptif est possible et opératoire, elle ne correspond pas à l'expérience phénoménologique habituelle : dans la vie courante la stimulation visuelle mobilise le fonctionnement du système visuo-spatial dans sa globalité.

Le niveau perceptif concerne les formes, au niveau cognitif, nous avons affaire principalement à des objets. Les organisations structurales que sont les formes, existent par elles-mêmes, qu'elles correspondent ou non à l'apparence d'un objet, le référent physique que l'on nomme « objet » est plus que cette apparence : conceptuel, il peut être nommé, il a une fonction, il entretient avec son environnement des relations qui obéissent aux lois de la physique. Reconnaissance, identification des objets, des visages, traitement cognitif de scènes visuelles complexes, telles sont les opérations mises en œuvre à ce niveau.

Reconnaissance et identification des objets

Reconnaître un objet c'est comparer son apparence avec la représentation en mémoire de ce même objet, représentation dont la nature et la formation soulèvent de nombreuses interrogations : elle doit en effet se prêter à un appariement avec des apparences diverses et multiples de l'objet ( variations de la taille, d'orientation, d'éclairage, etc.). Une des conceptions retenues est celle de prototype. « Par prototype, on entend une représentation abstraite en mémoire d'une forme ou d'un objet résultant d'une synthèse statistique de tous les patrons individuels des formes d'une catégorie donnée. » Bonnet, 1989, p. 17 En ce qui concerne les objets tridimensionnels, le prototype stocké en mémoire correspondrait à un point de vue « typique » le plus familier ou fournissant le plus d'informations discriminantes ; l'appariement entre la forme perçue et la forme prototypique se ferait par rotation mentale. La représentation structurale ainsi stockée en mémoire est liée à deux autres types de représentations. C'est, en effet, à partir des représentations sémantiques, c'est à dire de la représentation en mémoire des caractéristiques fonctionnelles de l'objet que se constituent les catégories perceptives, les représentations phonologiques correspondant à leur dénomination.

L'étude des agnosies visuelles, a largement contribué à la validation des trois niveaux de représentation impliqués . Ainsi, l'agnosie des objets, qui a pour conséquence une incapacité à reconnaître les objets les plus usuels, est mise en évidence à partir du protocole suivant : des objets réel ou leurs images sont présentés visuellement. On demande au sujet d'accomplir des tâches correspondant à chacune des étapes de la reconnaissance des objets :

- décrire les objets, porter un jugement sur leur taille,…, les apparier selon la forme,
- donner leur fonction, les apparier des objets selon leur catégorie sémantique,
- dénommer oralement les objets, reconnaître leur nom écrit parmi des noms distracteurs.

Cette approche clinique permet de différencier

- l'agnosie perceptive : le sujet éprouve des difficulté à différencier la figure et le fond, à reconnaître des objets familiers présentés sous un angle inhabituel, sous forme de silhouette
- les agnosies associatives — le sujet perçoit les objets mais il ne peut ni les nommer, ni démontrer leur usage. Cf. F. Eustache, S. Faure 1996, p. 101 et sq.

Parallèlement à la théorie fondée sur l'élaboration d'un prototype, plusieurs autres modèles peuvent rendre compte de la reconnaissance des objets. Biederman (1987) développe la théorie de la « reconnaissance par composants » selon laquelle « la reconnaissance des objets repose sur la perception d'éléments géométriques de base à partir desquels on peut construire un objet ». Ces éléments sont nommés « géons » (contraction de géométric ion), leur perception permettrait l'appariement avec la représentation prototypique de l'objet. Pour Marr (1982) , il n'y a mobilisation des représentations sémantiques et phonologiques que lorsque la représentation perceptive de l'objet a atteint le stade d'une véritable représentation en trois dimensions (3D) indépendante du point d'observation, donc toujours la même quel que soit le point de vue. Enfin les théories écologiques , rejetant les notions de représentations mentales et de traitement, accordent une place primordiale aux informations contenues dans le flux optique. J. J. Gibson (1979), le fondateur de cette approche, adopte une position radicale : pour lui, toutes les informations nécessaires à la perception sont disponibles dans l'environnement et sont perçues directement. Certaines positions relevant de cette école sont moins tranchées et maintiennent des processus de détection.

Ces modèles permettent de rendre compte de la reconnaissance de catégorie d'objets mise en jeu dans l'accomplissement des gestes de la vie quotidienne, mais ils sont inadéquats lorsque le nombre d'exemplaires à identifier est élevé. Ainsi la reconnaissance des visages et celle des mots appellent-elles des modèles alternatifs.

Reconnaissance et identification des visages

L'importance que représente l'identification des visages dans les relations sociales n'a d'égale que la remarquable expertise dont fait preuve le sujet humain dans ce domaine mais également la gravité des conséquences, sur le plan psychique de l'atteinte de cette fonction (prosopagnosie). Lorsqu'un visage apparaît dans le champ visuel du sujet, il doit être classé dans la catégorie « visage humain », mais une identification précise de l'exemplaire particulier doit également avoir lieu. Bruce et young proposent un modèle dont le concept central est celui « des unités de reconnaissance, un stock à long terme des représentations de chacun des visages connus du sujet. Une unité sera activée à chaque fois que l'imput visuel génère une représentation structurale — c'est l'objectif des processus perceptifs — qui ressemble suffisamment à cette unité : le reste du système cognitif prend alors la décision de reconnaissance. » cf. Bruyer,2000, p. 66 et sq.

Reconnaissance des mots

Comme pour les visages, la reconnaissance des lettres et des mots met en jeu un processus d'identification d'exemplaires. Il faut souligner que ce processus diffère selon que les unités sémantiques du système d'écriture considéré présentent ou non une relation d'analogie perceptive avec ce qu'elles représentent.

Le stimulus correspondant à l'écriture syllabique se caractérise par un certain nombre de traits qui s'avèrent déterminants dans la reconnaissance des mots :

- il est arbitraire,
- il est bidimensionnel (la troisième dimension ou relief quand elle est présente n'apporte aucune information pertinente pour la reconnaissance du mot),
- ses constituants (les lettres) sont organisés en séquences unilinéaires dans une direction conventionnelle qui varie en fonction des langues ( de gauche à droite, de droite à gauche, de haut en bas…).

Le processus de lecture des mots peut se décomposer en une séquence d'opérations activant successivement cinq types de représentations :

a - Le stimulus doit d'abord faire l'objet d'une analyse visuelle de nature perceptive.
b - L'output de l'information perceptive va activer des représentations constituant le lexique visuel d'entrée : appariement, comparaison, détection d'une ressemblance suffisante entre une de ces unités du lexique et la représentation dérivée de l'analyse visuelle.
c - Les unités lexicales reconnues sont connectées à des représentations sémantiques qu'elles activent (une même information sémantique pouvant être activée par différents mots).
d - L'activation de ces représentations sémantiques génère celle de la représentation du mot dans le lexique de sortie.
e - La représentation de mot active celle des phonèmes correspondant.

Cf. R. Bruyer, 2000, p. 104-105

Traitement cognitif de scènes complexes

Percevoir notre environnement immédiat, la photographie d'un lieu, une œuvre picturale ou la page écran d'un document multimédia implique des processus perceptifs d'une autre nature que ceux qui sont mobilisés lors de la reconnaissance successive des objets, des visages, ou des mots isolés de l'ensemble perceptif dont ils font partie .

Se référant aux travaux de Biederman, C. Bonnet ,1989, p. 69 différencie le niveau syntaxique et le niveau sémantique des scènes visuelles, le premier niveau renvoie principalement aux relations spatiales qui existent entre les différentes entités qui constituent la scène, le second concerne la signification de l'ensemble. L'un et l'autre niveaux sont dépendants de nos connaissances du monde, connaissances qui expliquent en partie la rapidité du traitement de l'ensemble, et l'inférence de la présence d'entités non perçues.

- Sur le plan syntaxique,notre perception est en partie déterminée par le fait que nous savons que la plupart des objets ont un support physique, qu'ils sont opaques et masquent partiellement ceux qui sont situés derrière (par rapport à l'observateur), que leur taille perçue diminue en fonction de leur éloignement.
- Sur le plan sémantique, la perception est influencée par la probabilité de rencontrer tel ou tel objet dans un contexte scénique donné.

Plusieurs expériences conduisent à émettre l'hypothèse que le système visuel disposerait de filtres, chacun permettant un traitement à divers niveaux de résolution : analyses grossières pour un traitement global, analyses fines pour le traitement des détails. Des canaux différents seraient sélectionnés en fonction du niveau d'analyse impliqué par la tâche à réaliser. J.-D. Bagot, 1999, p. 174