Les statistiques inférentielles consistent à déterminer des paramètres d'une population complète à partir de ceux d'un échantillon. 

Construction d'un test de validité d'hypothèse :

  1. Détermination de la variable aléatoire de décision et de ses paramètres.
  2. Choix des deux hypothèses: l'hypothèse nulle H0 et l'hypothèse alternative H1.
  3. Détermination de la zone critique selon le risque α donné.
  4. Rédaction d'une règle de décision

Utilisation du test d'hypothèse : calcul des caractéristiques d'un échantillon particulier puis application de la règle de décision.

Exemple d'un test bilatéral relatif à une moyenne :

Une machine produit des rondelles dont l'épaisseur est une variable aléatoire X d'écart type 0,3 mm. La machine a été réglée pour obtenir des épaisseurs de 5 mm. Un contrôle portant sur un échantillon de 100 rondelles a donnée 5,07 mm comme moyenne des épaisseurs de ces 100 rondelles. Peut-on affirmer que la machine est bien réglée au seuil de risque de 5% ?

  1.  On appelle m l'espérance de X. On note M la variable aléatoire qui à chaque échantillon de taille 100 associe sa moyenne. Comme la taille des échantillons est suffisamment grand, on peut considérer que M suit la loi normale N(m;0,3100)=N(m;0,03). M sera la variable aléatoire de décision.
  2. On estime que la machine est bien réglée, si la moyenne de toutes les rondelles produites par la machine est 5 mm. C'est l'hypothèse H0. L'hypothèse alternative est H1: m5.
  3. Cherchons la zone critique. Dans le cas où l'hypothèse H0 est vraie la variable M suit la loi N(5;0,03). On cherche alors le réel d tel que P(5dM5+d)=0,95.
    En posant T=M50,03 qui suit la loi normale centrée réduite N(0,1), cela revient à chercher d tel que P(d0,03Td0,03)=0,952Φ(d0,03)1=0,95Φ(d0,03)=0,975
    Φ désigne  la fonction de répartition de la loi normale centrée réduite. Les tables (ou la calculatrice) donnent alors d0,03=1,96 soit d0,06.  L'intervalle de confiance est donc [50,06;5+0,06]=[4,94;5,06].
    La probabilité qu'un échantillon ait une moyenne située hors de cet intervalle étant de 0,05, on peut considérer que cet événement est rare. Ainsi, la moyenne de notre échantillon me=5,07 nous amène à douter de l'hypothèse H0.
  4. On décide alors de la règle de décision suivante: si la moyenne de l'échantillon n'est pas située dans la zone critique (c'est-à-dire si la moyenne est dans  l'intervalle de confiance), on accepte H0 sinon on refuse H0 et on accepte H1.
  5. Ici, puisque 5,07 appartient à la zone critique, on décide de rejeter l'hypothèse H0 et d'accepter l'hypothèse alternative H1: m5 (la machine n'est pas bien réglée).