Retour

Statistique descriptive

📝 Mini-cours GRATUIT

Série statistique à une variable

Médiane

La médiane d'une série statistique est la valeur qui partage la série en deux ensembles de même effectif : $50\%$ des valeurs sont inférieures à cette valeur et $50\%$ des valeurs sont supérieures à cette valeur.

Quand l’effectif $n = 2p +1$ est impair, il s’agit de la $p^{ième}$ des valeurs classées dans l’ordre croissant.

Quand l’effectif $n = 2p$ est pair, on prend la moyenne de la $p^{ième}$ et de la $p+1$-ième des valeurs classées dans l’ordre croissant.

Premier et troisième quartile, écart interquartile

Le premier (resp. troisième) quartile, noté $Q_1$ (resp. $Q_3$), est la valeur minimale pour laquelle $25\%$ (resp. $75\%$) des valeurs sont inférieures ou égales à $Q_1$ (resp $Q_3$). 

L’écart interquartile est la différence entre le troisième et le premier quartile d’une série : $Q_3 - Q_1$.

Espérance, Variance et écart-type

On considère une série statistique X de taille $n$ composée des valeurs suivantes :

$x_1$ d’effectif $n_1$, $x_2$ d’effectif $n_2$, $x_3$ d’effectif $n_3$, ... et $x_k$ d’effectif $n_k$ ($n_1$ + $n_2$ + ... + $n_k$ = $n$).

L’espérance de X est E(X) = $\displaystyle \frac{n_1 \times x_1 + n_2 \times x_2 + ... + n_k \times x_k}{n}$

La variance de X est V(X) = $\displaystyle \frac{1}{n} \sum_{i=1}^{k} n_i {(x_i - \mathrm{E(X))}}^2$

L’écart type de X est $\displaystyle \sigma$(X) = $\sqrt{\mathrm{V(X)}}$

Statistique descriptive

Statistiques à deux variables

Une série statistique est dite à deux variables lorsque l’on étudie deux grandeurs pour lesquelles les relevés statistiques donnent n valeurs $x_1$, $x_2$, ... et $x_n$
pour la première, n valeurs $y_1$, $y_2$, ... et $y_n$ pour la seconde, et que chaque valeur $y_i$ ($1 \leq i \leq n$) est fonction de la valeur $x_i$.

On peut représenter une série statistique à deux variables dans un tableau à deux lignes, puis graphiquement par un nuage de points composé des points de coordonnées ($x_i$ ; $y_i$) avec $1 \leq i \leq n$.

Point moyen 

Pour une série statistique à deux variables ($x_i$ ; $y_i$) avec $1 \leq i \leq n$, on appelle point moyen le point G ($\bar{x}$ ; $\bar{y}$) où $\bar{x}$ est la moyenne des valeurs $x_i$ et $\bar{y}$ la moyenne des valeurs $y_i$.

Droites d'ajustement

Dans certains cas, le nuage de points associé à une série statistique à deux variables a une forme allongée et il semble possible de tracer des droites autour desquelles sont situés les points du nuage : ce sont des droites d’ajustement.

Nomad+, Le pass illimité vers la réussite 🔥

NOMAD EDUCATION

L’app unique pour réussir !