Test de normalité


Test de normalité

En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d'adéquation (ou tests d'ajustement, tests permettant de comparer des distributions), appliqués à une loi normale.

Ces tests prennent une place importante en statistiques. En effet, de nombreux tests supposent la normalité des distributions pour être applicables. En toute rigueur, il est indispensable de vérifier la normalité avant d'utiliser les tests. Cependant, de nombreux tests sont suffisamment robustes pour être utilisables même si les distributions s'écartent de la loi normale.

Sommaire

Approches empiriques et graphiques

Histogramme de la distribution

Il est possible de visualiser la forme de la distribution des données à analyser en les représentant sous forme d'histogramme puis de comparer la forme de cet histogramme avec une courbe représentant une loi normale (les paramètres de cette loi étant calculés à partir des données à analyser). Ceci ne permet pas de conclure à la normalité des données mais peut donner un idée du type de loi sous-jacente : loi normale, loi de Cauchy ou loi de Student si la distribution semble symétrique, loi log-normale, loi gamma, loi de Weibull, loi exponentielle ou loi bêta si la distribution est asymétrique.

Normality histogram.png

Histogramme des résidus

Il est également possible de représenter l'histogramme des résidus(c'est-à-dire la différence entre la distribution observée et la loi normale). Les résidus doivent suivre également un loi normale.

Boîte à moustaches (box-plot)

Une boîte à moustaches permet de visualiser rapidement la symétrie de la distribution des données réelles et la présence de valeurs atypiques.

Normality box-plot.png

Graphe quantile-quantile (qq-plot)

Article détaillé : Diagramme Quantile-Quantile.

Coefficients d'asymétrie et d'aplatissement

Les Coefficients d'asymétrie et d'aplatissement sont également utiles pour définir une loi normale.

Pour l'aplatissement : ~ G_2 = \frac{(n+1)\,n}{(n-1)\,(n-2)\,(n-3)} \; \sum_{i=1}^n \left( \frac {x_i - \bar{x}} \sigma \right) ^4 - 3\,\frac{(n-1)^2}{(n-2) (n-3)}

et pour l'asymétrie : G_1 = \frac n {(n-1)\,(n-2)} \; \sum_{i=1}^n \left( \frac {x_i - \bar{x}} \sigma \right) ^3

avec σ est la racine d'un estimateur non biaisé de la variance.

On sait effectivement que le coefficient d'asymétrie vaut zéro pour toute loi normale, tandis que le coefficient d'aplatissement vaut 3 (0 si normalisé)

Approche probabiliste

Il existe également un grand nombre de tests de normalité:

Généralités

Les tests de normalité sont des tests d'hypothèse. En notant F(x) la fonction de répartition basée sur les données à analyser et F0(x) la fonction de répartition théorique, les hypothèses nulle et alternative peuvent s'écrire :

\begin{cases} {H_0~:~F(x) = F_0(x)} \\ {H_1~:~F(x) \neq F_0(x)} \end{cases}.

Les tests sur les moments ont une hypothèse moins forte, ils ne testent pas si la fonction de répartition est normale, mais si les moments (coefficients d'asymétrie et d'aplatissement) de la distribution inconnue sont identiques à ceux d'une loi normale:  H_{0}: G_1=0 \mbox{ et } G_2=3 \,

 H_{1}: G_1\ne 0 \mbox{ ou } G_2\ne 3 \,

On remarquera que ce n'est pas suffisant pour caractériser une loi normale (Problème des moments).

Test d'adéquation du χ²

Article détaillé : Test du χ².

Son utilisation n'est pas recommandée du fait de son manque de puissance et de la nécessité de diviser les distributions en classes.

[1].

Tests bayesien

Applications

Une application des tests de normalité concerne les résidus d’un modèle de régression linéaire. S’il ne sont pas distribués de façon normale, les résidus ne peuvent pas être utilisés dans des tests Z ou dans quelqu’autre test que ce soit, à partir du moment où il fait intervenir des hypothèses de normalité (par exemple, le test t, le test de Fisher ou le test du χ²). Si les résidus ne sont pas normalement distribués, cela signifie que la variable dépendante, ou tout au moins une variable explicative, pourrait avoir une fonction de répartition erronée ; des variables importantes peuvent également être manquantes. Une ou plusieurs correction de ces erreurs classiques peuvent engendrer des résidus qui suivent une distribution normale.

Voir aussi

  • (fr) Gilbert Saporta, Probabilités, Analyse des données et Statistique, 2006 [détail des éditions] (p. 359 à 370).
  • Judge et al., Introduction to the Theory and Practice of Econometrics, Second Édition, 1988; 890–892.
  • Gujarati, Damodar N., Basic Econometrics, Fourth Édition, 2003; 147–148

Références

  1. Judge et al. (1988) and Gujarati (2003) recommandent le test de Jarque–Bera.

Liens externes


  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Test de normalité de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Test de Jarque-Bera — Le test de Jarque Bera cherche à déterminer si des données suivent une loi normale. Sommaire 1 Présentation 2 Approche plus formelle 3 Références 4 …   Wikipédia en Français

  • Test de jarque bera — Le test de Jarque Bera cherche à déterminer si des données suivent une loi normale. Sommaire 1 Présentation 2 Approche plus formelle 3 Références 4 …   Wikipédia en Français

  • Test de Jarque Bera — Le test de Jarque Bera cherche à déterminer si des données suivent une loi normale. Sommaire 1 Présentation 2 Approche plus formelle 3 Références 4 Log …   Wikipédia en Français

  • Test de kolmogorov-smirnov — En statistiques, le test de Kolmogorov Smirnov est un test d hypothèse utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition continue, ou bien si deux échantillons suivent la même loi. Sommaire 1 …   Wikipédia en Français

  • Test (statistique) — Pour les articles homonymes, voir Test. En statistiques, un test d hypothèse est une démarche consistant à rejeter ou à ne pas rejeter (rarement accepter) une hypothèse statistique, appelée hypothèse nulle, en fonction d un jeu de données… …   Wikipédia en Français

  • Test de Kolmogorov-Smirnov — En statistiques, le test de Kolmogorov Smirnov est un test d hypothèse utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition continue, ou bien si deux échantillons suivent la même loi. Sommaire 1 …   Wikipédia en Français

  • Tests de normalité — Test de normalité En statistiques, les tests de normalité permettent de vérifier que des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d adéquation (ou tests d ajustement, tests… …   Wikipédia en Français

  • Maitrise statistique des procedes — Maîtrise statistique des procédés La maîtrise statistique des procédés (MSP) (Statistical Process Control ou SPC en anglais), est le contrôle statistiques des processus. Au travers de représentations graphiques montrant les écarts (en + ou en ) à …   Wikipédia en Français

  • Maîtrise Statistique Des Procédés — La maîtrise statistique des procédés (MSP) (Statistical Process Control ou SPC en anglais), est le contrôle statistiques des processus. Au travers de représentations graphiques montrant les écarts (en + ou en ) à une valeur donnée de référence,… …   Wikipédia en Français

  • Maîtrise Statistique des Procédés — La maîtrise statistique des procédés (MSP) (Statistical Process Control ou SPC en anglais), est le contrôle statistiques des processus. Au travers de représentations graphiques montrant les écarts (en + ou en ) à une valeur donnée de référence,… …   Wikipédia en Français


Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.