Estimation ponctuelle
Soit θ un paramètre inconnu que l’on cherche à estimer à partir d’un échantillon de données x1,…,xn.
On suppose que cet échantillon est la réalisation de n variables aléatoires X1,…,Xn indépendantes et de même loi.
Un estimateur de θ est une variable aléatoire de la forme Tn=φ(X1,…,Xn).
La réalisation φ(X1,…,Xn) de l’estimateur Tn est l’estimation de θ.
Si pour tout θ, Tn admet une espérance, on appelle biais de Tn le réel bθ(Tn)=Eθ(Tn)−θ.
L’estimateur Tn de θ est sans biais (ou non biaisé) si Eθ(Tn)=θ pour tout θ. Dans le cas contraire, l’estimateur est dit biaisé.
Si pour tout θ, T2n admet une espérance, on appelle risque quadratique de Tn le réel rθ(Tn)=Eθ((Tn−θ)2).
Propriété :
rθ(Tn)=bθ(Tn)2+Vθ(Tn).
Exemple : Soit (X1,…,Xn) variables aléatoires indépendantes de loi B(p). Alors ¯Xn=X1+…+Xnn est un estimateur de p.
En pratique, on utilise les estimateurs suivants :
Estimation par intervalle de confiance
Au lieu de chercher une estimation ponctuelle de θ, on peut déterminer un intervalle aléatoire, appelé intervalle de confiance, qui contiendra θ avec une probabilité fixée.
Définition :
Soient Un et Vn deux estimateurs. [Un ;Vn] est un intervalle de confiance de θ au niveau de confiance 1−α (avec le risque α∈[0 ;1]) si pour tout θ, Pθ(Un≤θ≤Vn)≥1−α.
Les réalisations de Un et Vn sont calculables à partir de l’échantillon x1,…,xn.
Exemple : Soit X variable aléatoire de loi B(p) : X prend la valeur 1 si un individu possède une propriété A et 0 sinon. On cherche à estimer la proportion p d’individus possédant la propriété A.
Un intervalle de confiance de p au niveau de confiance 1−α (c’est-à-dire au risque α) est donné par :
[p0−tα2√n ;p0+tα2√n]
Où p0 est la proportion observée d’individus possédant la caractéristique A dans l’échantillon de taille n.
Remarque : Pour α=0,05, tα=1,96.
Exemple 2 : Un intervalle de confiance d’une moyenne μ d’une population pour la variable X au niveau de confiance 1−α (c’est-à-dire au risque α) est donné par :
ic1−α=[m−tασ√n;m+tασ√n]
Où σ est l’écart-type de la variable X et n la taille de l’échantillon sur lequel est calculé la moyenne m.
Cet intervalle de confiance est valable pour un grand échantillon (en général n≥30) ou si la variable X suit une loi normale (si l’échantillon est plus petit).
Remarque : La précision d’un intervalle de confiance correspond à la demi-largeur de cet intervalle.