Mediana

La mediana $M$ di un insieme di $n$ dati ordinati in modo crescente, è il valore centrale dei dati se il numero di dati è dispari, o la media aritmetica dei due valori centrali se il numero dei dati è pari

Ad esempio, considerando i seguenti dati $$15,\quad 14,\quad 2,\quad 27,\quad 13$$ e disponendoli in ordine crescente $$2,\quad 13,\quad 14,\quad 15,\quad 27$$ la mediana è $Me=14$

Mentre, invece, se consideriamo un numero di dati pari come il seguente $$11,\quad 9,\quad 17,\quad 19,\quad 4,\quad 15$$ e li ordiniamo in maniera crescente $$4,\quad 9,\quad 11,\quad 15,\quad 17,\quad 19$$ la mediana si calcola facendo la media aritmentica dei due valori centrali $11$ e $15$: $$Me=\frac{11+15}{2}=13$$

Mediana per dati raggruppati

In questo caso, data la distribuzione delle frequenze, bisogna seguire i seguenti step:

  1. calcolare le frequenze relative;
  2. calcolare le frequenze cumulate;
  3. determinare la classe in corrispondenza della quale la frequenza cumulata sia maggiore di $0.5$.

Indicata con $[x_{i-1},x_i]$ tale classe (detta classe mediana) e con $f_c^{i-1}$ e $f_c^i$ i valori delle frequenze cumulate corrispondenti, per trovare il valore mediano si applica la seguente formula: $$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{Me = x_{i-1}+(x_i-x_{i-1})\frac{0.5-f_c^{i-1}}{f_c^i-f_c^{i-1}}}\quad\bigstar$$

Per determinare i quartili e i percentili si adatta tale formula (vedi qui).

Esempio

Si considerino le distribuzioni per le classi di età della popolazione residente (espressa in migliaia) in Piemonte nel 1979:

Calcolo della mediana per dati raggruppati in classi

Sulla base di un'ipotesi che i più longevi siano stati novantenni, calcolare l'età mediana nella regione Piemonte.

Qui in basso, la tabella con le frequenze relative e cumulate.

Calcolo frequenze relative e cumulate per la determinazione della classe mediana

Notiamo subito che il valore della prima frequenza cumulata maggiore di 0.5 è $0.6105$ e si trova in corrispondenza della classe $25-|45$. Quest'ultima è la classe mediana. Per trovare il valore mediano, utilizziamo la formula esposta sopra: $$Me = 25+(45-25)\frac{0.5-0.3316}{0.6105-0.3316}=37.0760$$

Mediana di una distribuzione marginale o condizionata

Esempio

Consideriamo la tabella doppia dell'esercizio visto qui (clicca per vedere come calcolare la media condizionata).

Media condizionata distribuzione doppia di frequenza

Calcolare la mediana del numero di sigarette fumate dagli astemi e dai bevitori.

Continuiamo a indicare con S la variabile "numero di sigarette fumate" e con A e B rispettivamente i gruppi di persone astemie e bevitori. Ricordiamo che lo studio di una tabella a doppia entrata si effettua lavorando separatamente su ciascuna categoria mostrate nella figura qui sotto

Suddivisione distribuzione doppia in base al carattere condizionante

Ricaviamoci le frequenze relative e cumulate del numero di sigarette fumate dagli astemi inglobando il valore 0 nella classe [0,10]:

Distribuzione di frequenza della variabile discreta fumatori

Osservando che la classe mediana è [0,10], la mediana della distribuzione condizionata del numero di sigarette fumate dagli astemi é data dalla formula $\bigstar$: $$Me(S|A)=0+(10-0)\cdot\frac{0.5-0}{0.9-0}=5.56\ (\mbox{fumatori})$$

Ricaviamoci adesso le frequenze relative e cumulate del numero di sigarette fumate dai bevitori inglobando al solito il valore 0 nella classe [0,10]:

Distribuzione di frequenza condizionata della variabile discreta fumatori

Applicando nuovamente la $\bigstar$, otteniamo la mediana del numero di sigarette fumate dai bevitori: $$Me(S|B)=0+(10-0)\cdot\frac{0.5-0}{0.6875-0}=7.27\ (\mbox{fumatori})$$

Questo sito usa i cookies per fornirti una migliore esperienza di navigazione. Prendi visione della privacy policy e clicca su "Accetta" per proseguire.