Tests du Khi-deux
- Test du Khi-deux d’ajustement d’une distribution expérimentale à une distribution théorique (1 population, 1 caractère)
On considère une distribution expérimentale (observée) d’effectif N. On souhaite savoir si la distribution expérimentale est conforme à une distribution théorique.
On suppose que le caractère étudié possède n modalités.
On note Oi l’effectif observé pour la classe de modalité i.
D’après la distribution théorique, il y a une probabilité Pi pour qu’un individu présente le caractère correspondant à la modalité i.
On appelle Ti=N×Pi l’effectif théorique pour chaque modalité i.
Remarques :
- Un effectif théorique n’est pas toujours un nombre entier mais on n’arrondit pas le résultat afin que les calculs soient le plus précis possible.
On doit retrouver n∑i=1Ti=N. Il faut donc dans certains cas rajouter des classes supplémentaires pour les calculs d’effectifs théoriques correspondant à des classes pour lesquelles aucune valeur n’avait été observée dans l’échantillon.
Principe du test du χ2 de Pearson (ici test d’ajustement = test de conformité = test d’adéquation) :
Pour effectuer un test du χ2, il faut vérifier des conditions d’utilisation : N≥30, ni≥5 pour tout i où ni représente les effectifs de classe.
Si ni<5, il faut regrouper des classes.
ν=n′−1 indique le nombre de degrés de liberté du test avec n′ le nombre de classes après regroupement éventuel.
- H0 : « Il y a conformité entre la distribution expérimentale et la distribution théorique »
- χ2=n∑i=1(Oi−Ti)2Ti
- On conclut au risque α en lisant χ20 dans la table du χ2 de Pearson (avec comme paramètres ν et α).
- Si χ2<χ20 on ne rejette pas H0
- Sinon on rejette H0.
Remarque : Pour α=5% et ddl=1, χ20=3,84.
Equivalence avec le test « z » :
En notant p la proportion observée sur un échantillon de taille n et πth la proportion théorique, il y a équivalence entre un test « z » de comparaison proportion observée/proportion théorique et un test du Khi-deux de conformité à 1 ddl avec :
O1=n×p, O2=n×(1−p)
T1=n×πth, T2=n×(1−πth)
- Test du Khi-deux d’association entre caractères qualitatifs (1 population, 2 caractères)
On considère une population qui possède 2 caractères qualitatifs A et B qui peuvent posséder plusieurs modalités : Aj et Bi.
On obtient le tableau de contingence suivant avec Oij les effectifs observés :
Les effectifs théoriques (indiqués ici entre parenthèses) se calculent de la façon suivante: Tij=ni×n′jN
ν=(k−1)(l−1) représente le nombre de degrés de liberté du test.
Principe du test du χ2 de Pearson (ici test d’indépendance) :
Pour effectuer le test, il faut vérifier des conditions d’utilisation : N≥30, n≥5 où n représente les effectifs de classe.
χ2=l∑i=1k∑j=1(Oij−Tij)2Tij
Si 30≤N<50 et n<5 on utilise la formule avec la correction de Yates (elle n’est valable que pour les tableaux 2×2) : χ2=2∑i=12∑j=1(|Oij−Tij|−0,5)2Tij
- H0 : « Il y a indépendance entre les caractères A et B »
- On conclut au risque α en lisant χ20 dans la table du χ2 de Pearson (avec comme paramètres ν et α).
- Si χ2<χ20 on ne rejette pas H0
- Sinon on rejette H0.