On considère X et Y deux variables quantitatives. On dispose de n couples (xi,yi) d’observations de (X,Y) qui forment un nuage de points.
Corrélation
- Pour exprimer la corrélation, on utilise la notion de covariance : cov(X,Y)=∑xiyin−mXmY
Avec mX=∑ixin et mY=∑iyin.
L’unité de la covariance est le produit des unités des variables.
Si la covariance est positive, le nuage de points est croissant : les variables X et Y évoluent dans le même sens. - Le coefficient de corrélation de Pearson permet d’étudier la liaison linéaire entre deux variables X et Y.
Il peut être estimé par r=cov(X,Y)√Var(X)Var(Y) avec Var(X)=s2X et Var(Y)=s2Y
Un coefficient de corrélation est un nombre toujours compris entre -1 et 1.
Un coefficient de corrélation nul entre X et Y signifie qu’il n’y a aucune liaison linéaire entre les deux variables.
Test du coefficient de corrélation à 0 :
Ce test permet de mettre en évidence une éventuelle relation significative entre X et Y.
- H0 : les variables X et Y sont indépendantes.
- Calcul du paramètre : t=|r|√n−2√1−r2
- On obtient la valeur seuil tseuil dans la table de Student avec n−2 degrés de liberté.
- Si t<tseuil, on ne rejette pas H0.
- Sinon on rejette H0.