Estimation ponctuelle

Soit θ un paramètre inconnu que l’on cherche à estimer à partir d’un échantillon de données x1,,xn.

On suppose que cet échantillon est la réalisation de n variables aléatoires X1,,Xn indépendantes et de même loi.

Un estimateur de θ est une variable aléatoire de la forme Tn=φ(X1,,Xn).

La réalisation φ(X1,,Xn) de l’estimateur Tn est l’estimation de θ.

Si pour tout θ, Tn admet une espérance, on appelle biais de Tn le réel bθ(Tn)=Eθ(Tn)θ.

L’estimateur Tn de θ est sans biais (ou non biaisé) si Eθ(Tn)=θ pour tout θ. Dans le cas contraire, l’estimateur est dit biaisé.

Si pour tout θ, T2n admet une espérance, on appelle risque quadratique de Tn le réel rθ(Tn)=Eθ((Tnθ)2).

Propriété :

rθ(Tn)=bθ(Tn)2+Vθ(Tn).

Exemple : Soit (X1,,Xn) variables aléatoires indépendantes de loi B(p). Alors ¯Xn=X1++Xnn est un estimateur de p.

En pratique, on utilise les estimateurs suivants :

Estimation par intervalle de confiance

Au lieu de chercher une estimation ponctuelle de θ, on peut déterminer un intervalle aléatoire, appelé intervalle de confiance, qui contiendra θ avec une probabilité fixée.

Définition :

Soient Un et Vn deux estimateurs. [Un ;Vn] est un intervalle de confiance de θ au niveau de confiance 1α (avec le risque α[0 ;1]) si pour tout θ, Pθ(UnθVn)1α.
Les réalisations de Un et Vn sont calculables à partir de l’échantillon x1,,xn.

Exemple : Soit X variable aléatoire de loi B(p) : X prend la valeur 1 si un individu possède une propriété A et 0 sinon. On cherche à estimer la proportion p d’individus possédant la propriété A.

Un intervalle de confiance de p au niveau de confiance 1α (c’est-à-dire au risque α) est donné par :

[p0tα2n ;p0+tα2n]

p0 est la proportion observée d’individus possédant la caractéristique A dans l’échantillon de taille n.

Remarque : Pour α=0,05, tα=1,96.

Exemple 2 : Un intervalle de confiance d’une moyenne μ d’une population pour la variable X au niveau de confiance 1α (c’est-à-dire au risque α) est donné par :

ic1α=[mtασn;m+tασn]

σ est l’écart-type de la variable X et n la taille de l’échantillon sur lequel est calculé la moyenne m.

Cet intervalle de confiance est valable pour un grand échantillon (en général n30) ou si la variable X suit une loi normale (si l’échantillon est plus petit).

Remarque : La précision d’un intervalle de confiance correspond à la demi-largeur de cet intervalle.