Sia $X$ una variabile aleatoria che fornisce il numero di successi in $n$ prove bernulliane e $p$ la probabilità di successo per ciascuna prova; quando il numero $n$ delle prove è grande, il calcolo con la distribuzione binomiale è molto lungo. Per facilitare il calcolo, possiamo approssimarla con la distribuzione normale.
Infatti, si dimostra che, per $n$ grande e $p$ prossimo a 0.5, la distribuzione binomiale della variabile aleatoria $X$ può essere approssimata da una distribuzione normale standard $$Z=\frac{X-np}{\sqrt{np(1-p)}}$$ la quale, rappresenta la formula di standardizzazione della variabile $X$, che essendo una binomiale, ha media $\mu=np$ e varianza $\sigma^2=np(1-p)$.
Di conseguenza, al crescere di $n$, la variabile binomiale $X$ di parametri $n$ e $p$ ($X\sim B(n,p)$), viene approssimata con la distribuzione normale di parametri $np$ e $np(1-p)$ ($X\sim N(np,np(1-p))$).
La regola pratica da seguire per capire se si può approssimare con la normale consiste nel verificare se valgono entrambe le seguenti condizioni:
$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{np\ge 5,\quad np(1-p)\ge 5}$$
Tale regola è soddisfatta se $n$ è abbastanza grande e $p$ è più vicino a 0.5.
Ricordiamo che se $n$ è grande e $p$ è piccolo, la distribuzione binomiale può essere approssimata dalla distribuzione di Poisson con parametro $\lambda=np$; se invece $p$ si avvicina a 1, si può contare il numero di insuccessi anzichè quello dei successi in modo tale che la probabilità di insuccesso $1-p$ è piccola e si può ancora usare la distribuzione di Poisson.
Nelle figure sottostanti vengono riportati i grafici della distribuzione binomiale e normale per diversi valori di $n$ e $p$. Notiamo che nei casi in cui $n$ e $p$ non soddisfano le regole suddette, l'approssimazione con la normale non è buona (figura 1 e 2).
Qui di seguito invece due casi in cui l'approssimazione della binomiale con la normale migliora notevolmente:
Correzione di continuità
Poichè la distribuzione normale è una distribuzione continua, per poter approssimare la distribuzione binomiale (che è discreta) con la normale, bisogna effettuare una correzione di continuità: se $X$ è una variabile aleatoria discreta con distribuzione binomiale di parametri $n$ e $p$, la probabilità $P(a\le X\le b)$ che $X$ assuma valori compresi tra $a$ e $b$, viene approssimata con il valore della probabilità che la variabile aleatoria normale $N$ di parametri $\mu=np$ e $\sigma^2=np(1-p)$ assuma valori compresi tra $a-\frac{1}{2}$ e $b+\frac{1}{2}$, in simboli: $$P(a\le X\le b)\simeq P\left(a-\frac{1}{2}\le N\le b+\frac{1}{2}\right)$$
Esempio di variabile binomiale approssimata con una normale
Trovare la probabilità che in 100 lanci di una moneta, test di presenta 40 volte.
Svolgimento
Indicando con $X$ il numero di volte che esce testa, si ha che $X$ ha distribuzione binomiale con parametri $n=100$ e $p=\frac{1}{2}$
Osserviamo che essendo $np=50$ e $np(1-p)=25$, possiamo $X$ con una normale $N$ di parametri $\mu=50$ e $\sigma^2=25$. Inoltre, applicando la correzione di continuità, la probabilità da calcolare sarà: $$P(X=40)=P\left(40-\frac{1}{2} \le X \le 40+\frac{1}{2}\right)=P(39.5 \le N \le 40.5)=$$
Standardizzando la variabile $N$ si ottiene: $$\begin{eqnarray} N = 39.5\quad &\Rightarrow &\quad Z=\frac{39.5-50}{\sqrt{25}}=-2.1\\ N = 40.5\quad &\Rightarrow &\quad Z=\frac{40.5-50}{\sqrt{25}}=-1.9\end{eqnarray}$$
Usando le tavole della distribuzione normale (vedi qui) si trova: $$\begin{eqnarray} =P(-2.1 < Z < -1.9) &=& P(1.9 < Z < 2.1) =\\ &=& P(Z < 2.1)-P(Z < 1.9)=\\ &=& 0.9821-0.9713=0.0108\end{eqnarray}$$
Questa approssimazione è molto buona perchè il valore di $n$ è sufficientemente grande e il valore di $p$ è 0.5.