- Un des grands classiques de la statistique est la courbe de Gauss, ou "courbe en cloche". Son image est présente dans nos esprits et elle symbolise
à elle seule l'idée de la moyenne, de la dispersion, des variations aléatoires : les "valeurs" se répartissent "harmonieusement"
de part et d'autre de la moyenne, la distribution est équilibrée...
- C'est oublier un peu facilement que la courbe de Gauss n'est qu'une représentation graphique d'une distribution théorique idéale, d'une population
pour laquelle tous les individus présentent la même valeur pour un paramètre (la moyenne), avec simplement des petites variations aléatoires
(c'est à dire absolument imprévisibles, et se compensant les unes les autres. Si ce n'était pas le cas, on parlerait d'écart systématique).
- Ce modèle théorique est excellent, il est tiré non pas des statistiques, mais des lois de probabilité :
c'est la représentation graphique de la loi d'une variable X continue, variant de - l'infini à + l'infini, dont la densité de probabilité s'exprime sous la forme:
- L'intérêt d'une distribution "normale", c'est qu'elle est totalement définie par sa moyenne et son écart-type.
La taille de la population n'influe pas. Cette propriété va rendre possible un certain nombre de calculs sur des populations dont la distribution est supposée "normale" au vu de
la répartition d'échantillons pris au hasard dans cette population.
- Il est donc indispensable de vérifier que l'échantillon sur lequel on travaille, et à partir duquel on va tirer des conclusions, suit bien une loi normale. Pour cela, il existe plusieurs solutions :
Traçer une droite de Henry (appelé encore "graphique de Henry"), en utilisant un papier spécial, dit "gausso-arithmétique", dont l'abscisse est graduée en F(x), la répartition
de la Loi Normale réduite (on remplace x par l'expression u = (x - moyenne)/écart-type, ce qui donne une loi U de moyenne nulle, et d'écart-type égal à 1). Si les points sont alignés sur
le graphique, alors on peut supposer que la distribution est normale. De plus, le graphique permet de déterminer visuellement la valeur de l'écart-type et de la moyenne.
Utiliser le test de normalité de Shapiro et Wilk, qui fonctionne pour des échantillons de petite taille (à partir de 5 éléments). Assez lourd à mettre en oeuvre, il se prête bien au
calcul informatisé, avec un tableur.
Plus classiquement, utiliser le test du Khi-deux pour comparer la distribution constatée sur l'échantillon à une distribution théorique, "empruntée" à la loi normale. Un petit calcul donne
la valeur du Khi-deux, que l'on compare à la valeur-seuil trouvée dans la Table du Khi-deux, et le tour est joué!
(On ne peut pas "faire l'hypothèse" de la normalité. Seul le prof de maths qui donne un exercice à ses élèves peut, pour simplifier leur travail, donner cette indication...)
- Il va sans dire (mais il va encore mieux en le disant...) que l'échantillon doit être représentatif de la population, qu'il doit avoir été prélevé au hasard, sans biais, etc, etc.
|