P-value

Come già detto nella precedente lezione, non è possibile stabilire con certezza quale delle due ipotesi (nulla o alternativa) sia vera. Tuttavia, è possibile fare un calcolo probabilistico che permette di testare la plausibilità delle due ipotesi in relazione al campione esaminato.

Questo richiede il calcolo del cosiddetto p-value associato ad una statistica test calcolata $s_n$.

Il p-value, anche detto livello di probabilità, indica quanto probabile è che una statistica test $S_n$ sia almeno pari al valore $s_n$ supposta vera l'ipotesi nulla. In simboli scriveremo:

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{\mbox{p-value}=P(S_n\ge s_n|H_0\mbox{ vera})}$$

La statistica test è un valore che calcoliamo dai dati a nostra disposizione e può essere una t di Student, una normale, ecc.

Essendo un valore di probabilità, il p-value è un numero compreso tra 0 e 1. In particolare, diremo che:

  1. se $\mbox{p-value }\ge 0,05\quad\Rightarrow\quad$ si dice che il test non è statisticamente significativo (cioè può trattarsi di un effetto casuale del campionamento) e $H_0$ viene accettata;
  2. se $\mbox{p-value }< 0,05\quad\Rightarrow\quad H_0$ viene, in generale, rifiutata e il test viene detto:
    1. statisticamente significativo se $0,01\le\mbox{ p-value }< 0,05$
    2. molto significativo se $0,001\le\mbox{ p-value }< 0,01$
    3. estremamente significativo se $\mbox{p-value }< 0,001$

Un altro ragionamento che possiamo adottare per capire se accettare o rifiutare l'ipotesi nulla è quello di confrontare il p-value con il livello di significatività $\alpha$ ipotizzato inizialmente. Infatti si ha che:

  1. se $\mbox{p-value }<\alpha\quad\Rightarrow\quad$ rifiutiamo $H_0$;
  2. se $\mbox{p-value }\ge\alpha\quad\Rightarrow\quad$ non rifiutiamo $H_0$;

Per questo motivo, il p-value viene spesso denotato come il minimo livello di significatività per il quale l'ipotesi nulla viene rifiutata

In alternativa al calcolo del p-value, esiste un altro modo per verificare la veridicità dell'ipotesi nulla utilizzando le tavole statistiche (vedi esempio).

Come si calcola il p-value

Il p-value si calcola utilizzando la normale standard:

PvalueSchema

Forniamo un esempio che rende più chiaro il procedimento per il calcolo del p-value e quindi per ottenere il risultato di un test statistico.

Si vuole verificare l'ipotesi nulla $H_0: \mu=175$ contro l'ipotesi alternativa $H_1: \mu>175$. $\sigma$ è ignoto. Si estrae un campione di 10 elementi la cui media campionaria è $\mu_0=181,5$ e la cui varianza campionaria corretta $S^2 = 95,5067$. Il test è condotto ad un livello di significatività $\alpha=0,05$.

Costruiamo la statistica test a partire dallo stimatore naturale del valore atteso, ovvero la media campionaria $\overline{X}=\mu_0$. Standardizzandola otteniamo la statistica test:

$$Z=\frac{\overline{X}-175}{\frac{\sigma}{\sqrt{n}}}\sim (0,1)$$

Ma poichè $\sigma$ è sconosciuta, utilizziamo la varianza campionaria fornita ottenendo la statistica test definitiva:

$$T=\frac{\overline{X}-175}{\frac{S}{\sqrt{n}}}\sim t_9$$

Calcoliamo il valore osservato dalla statistica:

$$t_{oss}=\frac{181,5-175}{\frac{\sqrt{95,5067}}{\sqrt{10}}}=2,103$$

Per un livello di significatività $\alpha=0,05$, dalle tavole statistiche, troviamo il valore critico

$$t_{\frac{\alpha}{2},n-1}=t_{\frac{0,05}{2},10-1}=t_{0,025,9}=2,262$$

Osserviamo dalle tavole che $1,833 < t_{oss}=2,103 < 2,262$, dove $1,833$ è il valore di $t$ corrispondente ad $\alpha=0,05$ e $2,262$ è il valore di $t$ corrispondente ad $\alpha=0,025$. Ne segue che

$$0,025 < \mbox{p-value} < 0,05$$

Ricordando la definizione di p-value, abbiamo che

$$\mbox{p-value }=P(T>t_{oss})=P(T>2,103)$$

Si ha inoltre che:

  1. la distanza tra 1,833 e 2,262 è pari alla loro differenza in valore assoluto, ossia 0,429;
  2. la distanza tra 2,103 e 1,833 è invece 0,27 che equivale al 63% di 0,429.

Dunque, possiamo approssimare il p-value calcolando il valore che sta al 63% della distanza tra 0,025 e 0,05: la distanza tra 0,025 e 0,05 è pari alla loro differenza in valore assoluto, ossia 0,025; il 63% di tale distanza è 0,01575. Però, mentre nel primo caso i valori aumentano(da 1.833 a 2.262), ora diminuiscono (da 0.05 a 0.025), quindi, per trovare il punto la cui distanza da 0,05 è il 63% della distanza da 0,025, devo sottrarre a 0,05 il valore 0,01575:

$$\mbox{p-value }=0,05-0,01575=0,03425$$

Dal p-value ottenuto possiamo dire che poichè è inferiore al livello di significatività $\alpha=0,05$, l'ipotesi nulla può essere rifiutata. Il test, inoltre, risulta statisticamente significativo.

Osservazione sul calcolo del p-value

Se il test fosse stato bilaterale, il p-value si sarebbe calcolato moltiplicando il risultato ottenuto per 2:

$$\mbox{p-value }=2\cdot P(T>t_{oss})$$

Vai agli esercizi

Questo sito usa i cookies per fornirti una migliore esperienza di navigazione. Prendi visione della privacy policy e clicca su "Accetta" per proseguire.