Inégalité de concentration

Propriété :

Soit $(X_1, X_2, ..., X_n)$ un échantillon de variables aléatoires d'espérance $\mu$ et de variance $V$, et $M_n = \dfrac{X_1 + X_2 + ... + X_n}{n}$ la variable moyenne de cet échantillon,

Pour tout réel $\delta$ tel que $\delta > 0$,

$P(|M_n - \mu | \geq \delta) \leq \dfrac{V}{n\delta^2}$

Or, $|M_n - \mu | \geq \delta \iff \left \{ \begin{array}{l} M_n \geq \mu + \delta \\ M_n \leq \mu- \delta \end{array} \right. \iff M_n \notin [\mu - \delta; \mu + \delta ]$

Ainsi, $P(M_n \notin [\mu - \delta; \mu + \delta ]) \leq \dfrac{V}{n\delta^2}$

Concrètement, plus $n$ est grand et donc plus la taille de l'échantillon est importante, plus l'écart de la moyenne à l'espérance va être petit.

La moyenne se concentre donc autour de l'espérance.

Exemple :

100 personnes jouent indépendamment à un même jeu dont la variable aléatoire associée au gain en euros a pour espérance $11$ et variance $2$.

Donner une minoration de la probabilité que la moyenne des gains de ces 100 personnes soit comprise entre 9 et 13 euros.

On appelle $X_i$ pour $i$ entier entre $1$ et $100$ le gain du $i$-ème joueur.

Ainsi, $(X_1, ... X_{100})$ est un échantillon associé à une loi d'espérance $11$ et de variance $2$.

On note $M = \dfrac{X_1 + ... + X_{100}}{100}$ sa moyenne.

On cherche donc $P(M\in[9; 13])$.

Ce n'est pas exactement l'inégalité du cours, il faut donc transformer l'écriture en utilisant l'évènement contraire.

$P(M\in[9; 13]) = 1 - P(M\notin[9; 13]) $

$P(M\in[9; 13]) = 1 - P(|M - 11| \geq 2)$.

Or $P(|M - 11| \geq 2) \leq \dfrac{2}{100 \times 2^2}$

Finalement,

$P(M\in[9; 13]) \geq 1 - \dfrac{2}{100 \times 2^2} = 0,995$

Indépendance des événements en probabilité - Les Bons Profs

Distance d’un point à un plan ou une droite - Les Bons Profs

Inégalité de concentration - Cours de maths - Les Bons Profs