Inégalité de concentration

 

Propriété :

 

Soit $(X_1, X_2, ..., X_n)$ un échantillon de variables aléatoires d'espérance $\mu$ et de variance $V$, et $M_n = \dfrac{X_1 + X_2 + ... + X_n}{n}$ la variable moyenne de cet échantillon,

Pour tout réel $\delta$ tel que $\delta > 0$,

$P(|M_n - \mu | \geq \delta) \leq \dfrac{V}{n\delta^2}$

 

Or, $|M_n - \mu | \geq \delta \iff \left \{ \begin{array}{l} M_n \geq \mu + \delta  \\ M_n \leq \mu- \delta \end{array} \right. \iff M_n \notin [\mu - \delta; \mu + \delta ]$

Ainsi, $P(M_n \notin [\mu - \delta; \mu + \delta ]) \leq \dfrac{V}{n\delta^2}$

Concrètement, plus $n$ est grand et donc plus la taille de l'échantillon est importante, plus l'écart de la moyenne à l'espérance va être petit.

La moyenne se concentre donc autour de l'espérance.

 

Exemple : 

 

100 personnes jouent indépendamment à un même jeu dont la variable aléatoire associée au gain en euros a pour espérance $11$ et variance $2$.

Donner une minoration de la probabilité que la moyenne des gains de ces 100 personnes soit comprise entre 9 et 13 euros.

On appelle $X_i$ pour $i$ entier entre $1$ et $100$ le gain du $i$-ème joueur.

Ainsi, $(X_1, ... X_{100})$ est un échantillon associé à une loi d'espérance $11$ et de variance $2$.

On note $M = \dfrac{X_1 + ... + X_{100}}{100}$ sa moyenne.

On cherche donc $P(M\in[9; 13])$.

Ce n'est pas exactement l'inégalité du cours, il faut donc transformer l'écriture en utilisant l'évènement contraire.

$P(M\in[9; 13]) = 1 - P(M\notin[9; 13]) $

$P(M\in[9; 13]) = 1 - P(|M - 11| \geq 2)$.

Or $P(|M - 11| \geq 2) \leq \dfrac{2}{100 \times 2^2}$

Finalement,

$P(M\in[9; 13]) \geq 1 - \dfrac{2}{100 \times 2^2} = 0,995$

© lesbonsprofs – Tous droits réservés

Linéarité de l'espérance
Linéarité de l'espérance
Calculs de limites de fonctions trigonométriques
Calculs de limites de fonctions trigonométriques
Équations, inéquations et logarithme népérien
Équations, inéquations et logarithme népérien