Retour

Statistiques, mode d'emploi

🎲 Quiz GRATUIT

📝 Mini-cours GRATUIT

La loi normale

Pour chaque variable chiffrée (ordinale ou d'intervalle), il est possible de vérifier que les données suivent une loi normale. Pour cela, les données doivent être distribuées selon la courbe de Gauss. En effet, les données peuvent être représentées sous forme de graphique. Mais elles peuvent  également être obtenues à partir de tests statistiques. Les plus connus sont le test du Shapiro-Wilk ou le test du Kolmogorov-Smirnov.

Les tests statistiques qui permettent de vérifier la normalité des données sont plus précis que les graphiques puisque les probabilités réelles sont calculées. Les tests de normalité calculent la probabilité que l'échantillon soit tiré d'une population normale.

Les hypothèses utilisées sont :

  • Ho : les données de l'échantillon ne diffèrent pas significativement de celles d'une population normale.
  • Ha : les données de l'échantillon sont significativement différentes de celles d'une population normale.

En statistiques, on cherche à trouver une différence entre les groupes. Lorsqu'on teste la normalité de données, nous ne cherchons pas à trouver une différence. En effet, nous voulons que nos données soient non différentes. Pour cela, il faut accepter l'hypothèse nulle.

Donc, lorsque vous testez la normalité :

  • Si p > .05 : les données sont normales.
  • Si p < .05 : les données ne sont pas normales.

Pour faire des tests paramétriques, il faut donc que les données suivent une loi normale, avec un p > .05 aux tests de normalité.

Les différents tests statistiques

Il existe deux grandes catégories de tests statistiques. 

  • Il y a les tests dits paramétriques. Ces derniers sont réalisés à la condition que les données numériques suivent une loi normale (exemple : le Test T).
  • Il y a les tests dits non-paramétriques. A l'inverse des tests paramétriques, les données numériques ne suivent pas une loi normale.
  • Il existe également des tests semi-paramétriques. Le meilleur exemple est le Khi Deux

Chaque test a une fonction différente. Pour cela, voici un tableau synthétique des différents tests les plus connus :

Présentation des normes APA

Présenter des résultats statistiques ne se fait pas au hasard. En psychologie, les résultats se rédigent au format APA. Voici quelques exemples de rédaction de résultats de la dernière version APA v6.

Khi Deux

Le Khi Deux consiste à vérifier si un lien existe entre deux variables nominales. Par exemple, si l'on veut vérifier le lien entre le genre (H / F) et la possession d'un smartphone (oui / non), on peut obtenir ceci :

Nous observons que les filles n'ont significativement pas tendance à être davantage en possession d'un smartphone que les garçons (χ2 (1,N= 99)=9.99; p=.07).

Corrélation

Pour décrire les résultats d'un test de corrélation, il suffit de reporter la valeur du r et du p.
Exemple : nous pouvons conclure qu'il existe un lien entre le temps passé à étudier et les notes scolaires (r=.67; p=.001).

Test T

Le Test T repose sur une comparaison de moyennes. Avant d'écrire les résultats du test, il faut rapporter les données de statistiques descriptives. Pour cela, rien de plus simple. Il suffit de présenter les résultats de la moyenne et de l'écart type de chaque groupe.
Exemple : "les hommes ont un score de stress (M = 6.74 ; ET = 2.87) plus élevé que celui des femmes (M = 3.92 ; ET = 4.27)". C'est à la suite de cela que l'on va pouvoir dire si oui ou non il existe une différence significative entre les groupes. Voici la formule : t(ddl)=n.nn, p=xxx

Exemple : Nous observons qu'il existe une différence significative entre les hommes et les femmes concernant leur niveau de stress (t(1)=3.64, p=.02).

ANOVA

L'ANOVA se décrit de la même façon que le T Test puisque tous les deux sont des comparaisons de moyennes. La différence repose dans la description du résultat statistique (F(ddl1, ddl2)=n.nn; p=xxx). Si nous reprenons l'exemple plus haut, mais en ne prenant pas le genre, mais plutôt le niveau scolaire, entre les L1, L2 et L3, on aura ceci :

Nous observons qu'il n'existe pas de différence significative de stress entre les L1, L2 et L3 (F(2,13) = 2,88; p=.091).

Statistiques

Statistiques descriptives et inférentielles

Lors de l'analyse des données, il est possible d'utiliser à la fois des statistiques descriptives et inférentielles. Généralement, les deux vont de pair.

Statistiques descriptives

Il s'agit de l'ensemble des données qui aide à décrire ou à résumer les données de façon significative. Par exemple, donner le nombre de participants à l'étude, décrire le nombre d'hommes et le nombre de femmes, etc. Les statistiques descriptives ne permettent pas de tirer des conclusions concernant des hypothèses de recherche.
Ces statistiques descriptives sont très importantes car elles permettent de bien visualiser ce que montrent les données. Elles permettront aussi une interprétation plus simple des données. 

Parmi les statistiques descriptives les plus communes, on retrouve le nombre de participants ainsi que les caractéristiques plus fines telles que la moyenne, l'écart-type et parfois la médiane et les quartiles. 

Statistiques inférentielles

Les statistiques inférentielles reposent sur les différents tests statistiques existants. Il faut se rappeler que des statistiques inférentielles ne permettent pas de tirer de conclusions fermes et définitives. En effet, ces dernières reposent sur un échantillon de population. Ces statistiques permettent de comparer, de lier ou de prédire des phénomènes. Elles reposent principalement sur des probabilités.

Nomad+, Le pass illimité vers la réussite 🔥

NOMAD EDUCATION

L’app unique pour réussir !