Come già detto nella precedente lezione, non è possibile stabilire con certezza quale delle due ipotesi (nulla o alternativa) sia vera. Tuttavia, è possibile fare un calcolo probabilistico che permette di testare la plausibilità delle due ipotesi in relazione al campione esaminato.
Questo richiede il calcolo del cosiddetto p-value associato ad una statistica test calcolata $s_n$.
Il p-value, anche detto livello di probabilità, indica quanto probabile è che una statistica test $S_n$ sia almeno pari al valore $s_n$ supposta vera l'ipotesi nulla. In simboli scriveremo:
$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{\mbox{p-value}=P(S_n\ge s_n|H_0\mbox{ vera})}$$
La statistica test è un valore che calcoliamo dai dati a nostra disposizione e può essere una t di Student, una normale, ecc.
Essendo un valore di probabilità, il p-value è un numero compreso tra 0 e 1. In particolare, diremo che:
- se $\mbox{p-value }\ge 0,05\quad\Rightarrow\quad$ si dice che il test non è statisticamente significativo (cioè può trattarsi di un effetto casuale del campionamento) e $H_0$ viene accettata;
- se $\mbox{p-value }< 0,05\quad\Rightarrow\quad H_0$ viene, in generale, rifiutata e il test viene detto:
- statisticamente significativo se $0,01\le\mbox{ p-value }< 0,05$
- molto significativo se $0,001\le\mbox{ p-value }< 0,01$
- estremamente significativo se $\mbox{p-value }< 0,001$
Un altro ragionamento che possiamo adottare per capire se accettare o rifiutare l'ipotesi nulla è quello di confrontare il p-value con il livello di significatività $\alpha$ ipotizzato inizialmente. Infatti si ha che:
- se $\mbox{p-value }<\alpha\quad\Rightarrow\quad$ rifiutiamo $H_0$;
- se $\mbox{p-value }\ge\alpha\quad\Rightarrow\quad$ non rifiutiamo $H_0$;
Per questo motivo, il p-value viene spesso denotato come il minimo livello di significatività per il quale l'ipotesi nulla viene rifiutata
In alternativa al calcolo del p-value, esiste un altro modo per verificare la veridicità dell'ipotesi nulla utilizzando le tavole statistiche (vedi esempio).
Come si calcola il p-value
Il p-value si calcola utilizzando la normale standard:
Forniamo un esempio che rende più chiaro il procedimento per il calcolo del p-value e quindi per ottenere il risultato di un test statistico.
Si vuole verificare l'ipotesi nulla $H_0: \mu=175$ contro l'ipotesi alternativa $H_1: \mu>175$. $\sigma$ è ignoto. Si estrae un campione di 10 elementi la cui media campionaria è $\mu_0=181,5$ e la cui varianza campionaria corretta $S^2 = 95,5067$. Il test è condotto ad un livello di significatività $\alpha=0,05$.
Costruiamo la statistica test a partire dallo stimatore naturale del valore atteso, ovvero la media campionaria $\overline{X}=\mu_0$. Standardizzandola otteniamo la statistica test:
$$Z=\frac{\overline{X}-175}{\frac{\sigma}{\sqrt{n}}}\sim (0,1)$$
Ma poichè $\sigma$ è sconosciuta, utilizziamo la varianza campionaria fornita ottenendo la statistica test definitiva:
$$T=\frac{\overline{X}-175}{\frac{S}{\sqrt{n}}}\sim t_9$$
Calcoliamo il valore osservato dalla statistica:
$$t_{oss}=\frac{181,5-175}{\frac{\sqrt{95,5067}}{\sqrt{10}}}=2,103$$
Per un livello di significatività $\alpha=0,05$, dalle tavole statistiche, troviamo il valore critico
$$t_{\frac{\alpha}{2},n-1}=t_{\frac{0,05}{2},10-1}=t_{0,025,9}=2,262$$
Osserviamo dalle tavole che $1,833 < t_{oss}=2,103 < 2,262$, dove $1,833$ è il valore di $t$ corrispondente ad $\alpha=0,05$ e $2,262$ è il valore di $t$ corrispondente ad $\alpha=0,025$. Ne segue che
$$0,025 < \mbox{p-value} < 0,05$$
Ricordando la definizione di p-value, abbiamo che
$$\mbox{p-value }=P(T>t_{oss})=P(T>2,103)$$
Si ha inoltre che:
- la distanza tra 1,833 e 2,262 è pari alla loro differenza in valore assoluto, ossia 0,429;
- la distanza tra 2,103 e 1,833 è invece 0,27 che equivale al 63% di 0,429.
Dunque, possiamo approssimare il p-value calcolando il valore che sta al 63% della distanza tra 0,025 e 0,05: la distanza tra 0,025 e 0,05 è pari alla loro differenza in valore assoluto, ossia 0,025; il 63% di tale distanza è 0,01575. Però, mentre nel primo caso i valori aumentano(da 1.833 a 2.262), ora diminuiscono (da 0.05 a 0.025), quindi, per trovare il punto la cui distanza da 0,05 è il 63% della distanza da 0,025, devo sottrarre a 0,05 il valore 0,01575:
$$\mbox{p-value }=0,05-0,01575=0,03425$$
Dal p-value ottenuto possiamo dire che poichè è inferiore al livello di significatività $\alpha=0,05$, l'ipotesi nulla può essere rifiutata. Il test, inoltre, risulta statisticamente significativo.
Osservazione sul calcolo del p-value
Se il test fosse stato bilaterale, il p-value si sarebbe calcolato moltiplicando il risultato ottenuto per 2:
$$\mbox{p-value }=2\cdot P(T>t_{oss})$$