Intervalli di confidenza per la varianza o lo scarto quadratico medio

Caso piccoli e grandi campioni

Si consideri una popolazione avente distribuzione normale e si estraggono da questa popolazione campioni di ampiezza $n$. Come osservato in questo articolo, si può affermare che la statistica $$\chi^2=\frac{(n-1)S^2}{\sigma^2}$$ ha la distribuzione $\chi^2$ con $\nu=n-1$ gradi di libertà.

Dato che la distribuzione $\chi^2$ non è simmetrica, usando code ciascuna di area $\frac{\alpha}{2}$ si ha che $$P\left(\chi^2_{1-\frac{\alpha}{2}} < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\frac{\alpha}{2}}\right)=1-\alpha$$

Area delle code di una distribuzione chi quadrato

In altre parole, si può affermare con probabilità $1-\alpha$, o equivalentemente con grado di fiducia $(1-\alpha)\cdot 100\%$, che vale la disuguaglianza $$\chi^2_{1-\frac{\alpha}{2}} < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\frac{\alpha}{2}}$$

Pertando, indicando con $s^2$ la varianza di un campione di ampiezza $n$ estratto da una popolazione normale, e risolvendo quest'ultima disuguaglianza rispetto a $\sigma^2$, si ottiene l'intervallo di confidenza per la varianza $\sigma^2$ con grado di fiducia $(1-\alpha)\cdot 100\%$

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{\frac{(n-1)\cdot s^2}{\chi_\frac{\alpha}{2}^2} < \sigma^2 < \frac{(n-1)\cdot s^2}{\chi_{1-\frac{\alpha}{2}}^2}}$$

Osserviamo che il metodo descritto per trovare gli intervalli di confidenza per la varianza si applica solo nel caso di campioni provenienti da popolazioni normali. Inoltre, essendo la distribuzione chi quadro asimmetrica, anche l'intervallo di confidenza ottenuto è asimmetrico.

Esempio

In una scuola è stato scelto a caso un campione di 16 studenti dell'ultimo anno e si è misurata l'altezza di ciascuno di essi. La varianza campionaria della misura delle altezze è $s^2=37.09cm^2$. Trovare l'intervallo di confidenza al 95% per la varianza della popolazione costituita da tutti gli studenti dell'ultimo anno della scuola.

Svolgimento

Poichè si tratta di misure, si può ragionevolmente ipotizzare che la popolazione da cui proviene il campione abbia distribuzione normale.

Calcoliamo i valori critici della distribuzione chi quadro con grado di fiducia del 95% e $\nu=15$ gradi di libertà (vedi qui): $$\chi_{1-\frac{\alpha}{2}}^2=\chi_{0.975}^2=6.262\quad\chi_\frac{\alpha}{2}^2=\chi_{0.025}^2=27.488$$

Applicando la formula su esposta si ottiene l'intervallo di confidenza richiesto: $$\begin{eqnarray} \frac{15\cdot 37.09}{27.488} < &\sigma^2& < \frac{15\cdot 37.09}{6.262}\\ 20.23 < &\sigma^2& < 88.84\end{eqnarray}$$

Caso grandi campioni ($n\ge 30$)

La formula usata per trovare l'intervallo di confidenza per la varianza, pur essendo valida sia per piccoli che per grandi campioni, viene di solito utilizzata solo per piccoli campioni e, come già visto, nel caso in cui la popolazione da cui viene estratto il campione sia normale.

Per grandi campioni estratti da una popolazione normale avente deviazione standard $\sigma$, si può dimostrare che la distribuzione della della deviazione standard campionaria può essere approssimata con una distribuzione normale avente media $\sigma$ e deviazione standard $\frac{\sigma}{\sqrt{2n}}$, ovvero, $$Z=\frac{S-\sigma}{\frac{\sigma}{\sqrt{2n}}}\sim N(0,1)$$ per $n$ sufficientemente grande ($n\ge 30$).

Si può pertanto asserire che la disuguaglianza $$-z_\frac{\alpha}{2} < \frac{S-\sigma}{\frac{\sigma}{\sqrt{2n}}} < z_\frac{\alpha}{2}$$ vale con probabilità $1-\alpha$.

Risolvendo la disuguaglianza rispetto a $\sigma$, e indicando con $s$ lo scarto quadratico medio di un campione di ampiezza $n$, si trova l'intervallo di confidenza per lo scarto quadratico medio $\sigma$ per grandi campioni, con grado di fiducia $(1-\alpha)\cdot 100%$

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{\frac{s}{1+\frac{z_\frac{\alpha}{2}}{\sqrt{2n}}} < \sigma < \frac{s}{1-\frac{z_\frac{\alpha}{2}}{\sqrt{2n}}}}$$

Calcolo intervallo di confidenza per la deviazione standard nel caso di grandi campioni ($n\ge 30$)

Lo scarto quadratico medio della durata di un campione di 200 lampadine è $s=100$ ore. Trovare l'intervallo di confidenza al 95% per lo scarto quadratico medio dell'intera popolazione.

Svolgimento

Poichè l'ampiezza del campione è $n=200$, si tratta di un grande campione; per il grado di fiducia del 95% si ha $z_\frac{\alpha}{2}=1.96$ (vedi qui un esempio su come calcolarlo) e con la formula appena esposta si trova l'intervallo di confidenza richiesto: $$\begin{eqnarray} \frac{100}{1+\frac{1.96}{\sqrt{400}}} < &\sigma& < \frac{100}{1-\frac{1.96}{\sqrt{400}}}\\ 91 < &\sigma& < 111\end{eqnarray}$$

Vai alla sezione con gli esercizi svolti sul calcolo degli intervalli di confidenza

Questo sito usa i cookies per fornirti una migliore esperienza di navigazione. Prendi visione della privacy policy e clicca su "Accetta" per proseguire.