À PROPOS DU TRAITEMENT STATISTIQUE
DES INCERTITUDES
Estimateur, taux de confiance,
: c'est-à-dire ?
Généralités
Un estimateur statistique est une grandeur
mathématique calculée sur un ensemble de données et dont la valeur converge vers la
valeur cherchée quand le nombre de données augmente.
Ceci sous-entend naturellement certaines propriétés des
données...
Ainsi, la moyenne est un estimateur de la
valeur cherchée si les mesures sont indépendantes et appartiennent à une même
population statistique.
Toute détermination par une méthode
statistique portant sur un échantillon n'est qu'une estimation. Cela sous-entend que le
résultat ne peut être donné qu'avec une "fourchette", un intervalle, et que
la valeur cherchée appartient à cet intervalle avec un certaine probabilité.
Le taux de confiance que l'on s'accorde est évidemment
lié à la largeur de l'intervalle.
S'il existe des fluctuations ou erreurs
aléatoires, une mesure ne peut fournir qu'une estimation de la valeur cherchée : la
seule chose que l'on puisse dire est que la valeur cherchée se trouve probablement dans
un intervalle autour de la valeur trouvée.
Le modèle de Gauss
La question est alors de savoir comment
choisir l'intervalle et de savoir quelle confiance on peut s'accorder. Pour répondre à
cela, il faut modéliser les incertitudes issues de fluctuations aléatoires.
Le modèle utilisé en physique est la répartition gaussienne : on
suppose que si l'on réitère N fois un même mesurage, pour lequel il existe une
incertitude aléatoire (c'est-à-dire que les N résultats sont statistiquement
indépendants), les mesures se répartissent, lorsque N
croît, selon une courbe de Gauss.
Celle-ci est caractérisée par sa valeur
centrale qui est la moyenne m et son étalement quantifié par une grandeur sigma nommée
écart-type :
|
|
En termes de probabilité, cette répartition
signifie que si l'on fait une mesure, il existe une probabilité précise qu'elle figure
dans un intervalle donné. En particulier :
|
|
On fait donc l'hypothèse que l'ensemble des
mesures possibles peut être modélisé par une répartition gaussienne. De cet ensemble
inconnu, la réalité expérimentale ne fournit donc qu'un échantillon à partir duquel
il s'agit donc d'estimer la moyenne et l'écart-type.
Si les mesures sont bien des éléments de la
même population, alors la moyenne de l'échantillon est le meilleur estimateur de la
moyenne de la population et le meilleur estimateur de l'écart-type est :
On notera que la relation n'est évidemment pas applicable
lorsque N = 1...
Si le nombre de mesures est faible, l'estimation est
évidemment moins bonne. En d'autres termes, puisqu'on n'utilise pas la moyenne et
l'écart-type mais leurs estimations, l'intervalle de confiance doit en tenir compte : il
est augmenté d'autant plus que le nombre de mesures est faible. On utilise pour cela un
coefficient correctif : le coefficient de Student noté tn%. Ce
symbole désigne le coefficient de Student à l'indice n, correspondant au taux de
confiance % :
Que dire lorsqu'on a N mesures ?
On ne peut réaliser qu'un nombre fini de
mesurages. Il s'agit alors d'exploiter ces N mesures de façon à déterminer
l'incertitude attachée à un type de mesurage.
Il faut bien distinguer le cas où l'on cherche à estimer l'incertitude
sur un mesurage de la détermination d'une grandeur (et de son incertitude) par une moyenne sur plusieurs résultats de mesures.
N mesures pour déterminer l'incertitude associée à un mesurage
Ceci est particulièrement important :
c'est le cas général où l'on effectue une estimation de l'incertitude par une série
préalable de mesures. Le résultat est ensuite affectée à chaque mesure ultérieure.
L'incertitude sur chaque mesure prise
individuellement est alors caractérisée par l'intervalle de confiance suivant :
Valeur cherchée = valeur de la mesure ± tN,95.sN
à 95%
avec :
N mesures pour déterminer la valeur d'une grandeur
C'est la moyenne de l'ensemble qui est ici à
considérer. Son incertitude est évidemment plus faible que celle de n'importe quelle
mesure. Elle se déduit de la valeur de l'incertitude sur une mesure en divisant
l'intervalle par racine de N :