1) Convergence et approximation
Inégalité de Markov
Soit X une variable aléatoire réelle à valeurs positives admettant une espérance.
Alors ∀a>0, P(X≥a)≤E(X)a
Inégalité de Bienaymé-Tchebychev
Soit X une variable aléatoire admettant une espérance et une variance.
Alors ∀ϵ>0, P(|X−E(X)|≥ϵ)≤V(X)ϵ2
Loi faible des grands nombres
Soit (Xn) une suite de variables aléatoires deux à deux indépendantes admettant la même espérance m et un même écart-type σ.
On pose : ¯Xn=X1+…+Xnn.
Alors ∀ϵ>0, limn→+∞P(|¯Xn−m|≥ϵ)=0
Convergence en probabilité :
La suite (Xn)n∈N∗ converge en probabilité vers X si : pour tout ϵ>0, limn→+∞P(|Xn−X|≥ϵ)=0
Théorème :
Si (Xn)n∈N∗ converge en probabilité vers X, et si f est continue sur R à valeurs réelles, alors (f(Xn))n∈N∗ converge en probabilité vers f(X).
Convergence en loi :
La suite (Xn)n∈N∗ converge en loi vers X si si et seulement si en tout point de continuité x de FX:limn→+∞FXn(x)=FX(x)
Théorème :
Si (Xn)n∈N∗ converge en loi vers X, et si f est continue sur R à valeurs réelles, alors (f(Xn))n∈N∗ converge en probabilité vers f(X).
Théorème limite central :
Si (Xn)n∈N∗ est une suite de variables aléatoires indépendantes et de même loi, admettant une espérance m et une variance σ2 non nulle, si on note : ¯Xn=X1+…+Xnn, alors la suite de variables aléatoires centrées réduites ¯Xn∗=√n(¯Xn−mσ) converge en loi vers une variable aléatoire suivant la loi normale centrée réduite.
2) Estimation
Estimation ponctuelle
Soit θ un paramètre inconnu que l’on cherche à estimer à partir d’un échantillon de données x1,…,xn.
On suppose que cet échantillon est la réalisation de n variables aléatoires X1,…,Xn indépendantes et de même loi.
Un estimateur de θ est une variable aléatoire de la forme Tn=φ(X1,…,Xn).
La réalisation φ(X1,…,Xn) de l’estimateur Tn est l’estimation de θ.
Si pour tout θ, Tn admet une espérance, on appelle biais de Tn le réel bθ(Tn)=Eθ(Tn)−θ.
L’estimateur Tn de θ est sans biais (ou non biaisé) si Eθ(Tn)=θ pour tout θ. Dans le cas contraire, l’estimateur est dit biaisé.
Si pour tout θ, T2n admet une espérance, on appelle risque quadratique de Tn le réel rθ(Tn)=Eθ((Tn−θ)2).
Propriété : rθ(Tn)=bθ(Tn)2+Vθ(Tn).
Exemple : Soit (X1,…,Xn) variables aléatoires indépendantes de loi B(p). Alors ¯Xn=X1+…+Xnn est un estimateur de p.
Estimation par intervalle de confiance
Au lieu de chercher une estimation ponctuelle de θ, on peut déterminer un intervalle aléatoire, appelé intervalle de confiance, qui contiendra θ avec une probabilité fixée.
Définition :
Soient Un et Vn deux estimateurs. [Un ;Vn] est un intervalle de confiance de θ au niveau de confiance 1−α (avec le risque α∈[0 ;1]) si pour tout θ, Pθ(Un≤θ≤Vn)≥1−α.
Les réalisations de Un et Vn sont calculables à partir de l’échantillon x1,…,xn.
Exemple : Soit X variable aléatoire de loi B(p) : X prend la valeur 1 si un individu possède une propriété A et 0 sinon. On cherche à estimer la proportion p d’individus possédant la propriété A.
Un intervalle de confiance de p au niveau de confiance 1−α (c’est-à-dire au risque α) est donné par :
[p0−tα2√n ;p0+tα2√n]
Où p0 est la proportion observée d’individus possédant la caractéristique A dans l’échantillon de taille n.
Remarque : Pour α=0,05, tα=1,96.