Degré de liberté (statistiques)

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Degré de liberté.

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

En statistiques le degré de liberté (ddl) désigne le nombre de variables aléatoires qui ne peuvent être déterminées ou fixées par une équation (notamment les équations des tests statistiques).

Une autre définition est : le degré de liberté est égal au nombre d'observations moins le nombre de relations entre ces observations[1]. On pourrait remplacer l'expression « nombre de relations » par « nombre de paramètres à estimer ».

Exemple : vecteur aléatoire

Supposons un ensemble de n variables aléatoires, toutes de même loi et indépendantes X1,...,Xn.

Le vecteur aléatoire X dont chaque coordonnée est une de ces variables est défini dans un espace à n dimensions, donc naturellement, il a n degrés de libertés.

On note X ¯ {\displaystyle {\bar {X}}} la moyenne de ce vecteur. On peut alors réécrire le vecteur de cette façon :

( X 1 X n ) = X ¯ ( 1 1 ) + ( X 1 X ¯ X n X ¯ ) . {\displaystyle {\begin{pmatrix}X_{1}\\\vdots \\X_{n}\end{pmatrix}}={\bar {X}}{\begin{pmatrix}1\\\vdots \\1\end{pmatrix}}+{\begin{pmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\end{pmatrix}}.}

Le premier vecteur étant entièrement déterminé par la valeur X ¯ {\displaystyle {\bar {X}}} , il n'a qu'un degré de liberté. Le deuxième vecteur doit satisfaire la condition i = 1 n ( X i X ¯ ) = 0 {\displaystyle \sum _{i=1}^{n}(X_{i}-{\bar {X}})=0} . Ainsi, en connaissant n − 1 coordonnées du vecteur, on peut en déduire la ne : ce vecteur a n − 1 degrés de liberté.

Mathématiquement, cette décomposition traduit la projection orthogonale du vecteur aléatoire sur le sous-espace défini par le vecteur constant à 1, qui est de dimension 1, et donc son complémentaire de dimension n − 1.

Dans les tests statistiques, on s'intéresse plus à l'écart quadratique des composantes du vecteur :

i = 1 n ( X i X ¯ ) 2 = X 1 X ¯ X n X ¯ 2 . {\displaystyle \sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}={\begin{Vmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\end{Vmatrix}}^{2}.}

Pour le cas où les Xi suivent une loi normale centrée et de variance σ2, alors la somme définie plus haut suit une loi du χ² à n − 1 degrés de liberté, comme vu précédemment.

De même, la statistique de test du test de Student

n ( X ¯ μ 0 ) i = 1 n ( X i X ¯ ) 2 / ( n 1 ) {\displaystyle {\frac {{\sqrt {n}}({\bar {X}}-\mu _{0})}{\sqrt {\sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})^{2}/(n-1)}}}}

suit une loi de Student à n − 1 degrés de liberté si la moyenne μ0 est connue.


Références

  1. Walker, H. M., « Degrees of freedom », Journal of Educational Psychology, vol. 31, no 4,‎ , p. 253-269 (DOI 10.1037/h0054588).
v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail des probabilités et de la statistique