Una variabile aleatoria è una variabile che può assumere diversi valori a seconda del verificarsi o meno di un certo fenomeno casuale. Più rigorosamente diremo che:
Una variabile aleatoria o variabile casuale è una funzione reale X definita sullo spazio campione S
$$\bbox[#ffffff,5px,border:2px solid #ff6600]{X:S\rightarrow R}$$
Essa associa a ogni possibile risultato di un esperimento (elemento dello spazio campione S), un numero reale.
Esempio
Si effettua un lancio di una moneta. Lo spazio campione, ossia l'insieme dei valori che la variabile può assumere è: $$S={T,C}$$ Si definisce variabile aleatoria X la seguente: $$X(C)=m\quad\quad X(T)=n\quad\quad\quad m,n\in\mathbb R\quad m\neq n$$
Esempio
Si effettuano due lanci di una moneta. Lo spazio campione è: $$S={TT,CC,TC,CT}$$ A ogni elemento dello spazio campione possiamo associare un numero reale che indica il numero delle volte che esce T: $$X(TT)=2\quad\quad X(CC)=0\quad\quad X(TC)=1\quad\quad X(CT)=1$$
X così definita è una variabile aleatoria. Osserviamo che tale definizione non è unica, infatti possiamo definire X come il quadrato del numero delle teste, anziché il numero delle teste ecc.
Tipi di variabili aleatorie
In statistica le variabili aleatorie si possono racchiudere in due grandi categorie:
- Qualitative o categoriche
- Quantitative o numeriche
Le variabili qualitative, come dice la stessa parola, sono quelle che descrivono delle "qualità", in termini più formali le loro modalità sono categorie.
La variabile PROFESSIONE che ha come modalità (valori che assume) IMPIEGATO, CALCIATORE, CASALINGA, CASSIERE, AGRICOLTORE è una variabile categoriale.
Le variabili quantitative invece sono quelle che esprimono "quantità", quindi assumono valori numerici. Queste si distinguono a sua volta in discrete e continue.
Variabili aleatorie discrete e continue
Le variabili discrete assumono solo un numero di valori finito.
La variabile NUMERO DI COMPONENTI FAMIGLIARI è una variabile numerica discreta perché i valori che può assumere, ossia il numero dei componenti di una famiglia può essere ad esempio 1,2,3,4,5,6,7,8,9, quindi un numero finito di valori.
Le variabili continue assumono tutti i valori all'interno di un intervallo.
La variabile ALTEZZA PERSONA è una variabile numerica continua perché assume valori compresi tra 0 e 250cm circa.
Ti faccio osservare che una variabile numerica può essere convertita in variabile qualitativa. Ad esempio, le altezza delle persone possono essere suddivise nelle seguenti classi: [0, 50[, [50,100[, [100,150[, [150,200[, [200,250[. Così facendo ciascuna classe rappresenta una modalità o categoria della variabile in questione.
Scale di misura per variabili aleatorie
Quando si ha a che fare con le variabili aleatorie è necessario conoscere non solo la loro natura ma anche la loro SCALA DI MISURAZIONE. La scala di misura è uno strumento logico attraverso cui possiamo misurare qualsiasi variabile aleatoria e quindi essere capaci di contestualizzarla in un esercizio o in un'analisi statistica.
Variabili nominali e ordinali
Le variabili qualitative possono essere misurate mediante una scala nominale oppure ordinale. La scala nominale prevede che le modalità della variabile o del carattere non rispettino un ordine logico (vedi esempio della variabile PROFESSIONE). Le variabili che si misurano usando questa scale vengono chiamate variabili qualitative nominali. Al contrario, una variabile le cui modalità o categorie sono ordinate secondo una certa logica vengono chiamate variabili qualitative ordinali. Ad esempio, pensa alla variabile TITOLO DI STUDIO. Le categorie possono essere: LICENZA ELEMENTARE, LICENZA MEDIA, DIPLOMA, LAUREA, DOTTORATO. È chiaro che tale variabile sia ordinale dato che i vari titoli di studio presentano un ordine.
Scala a intervalli e a rapporti
Per misurare le variabili quantitative discrete e continue abbiamo bisogno di due differenti scale dette a intervalli e a rapporti.
Un carattere su scala a intervallo (o carattere intervallare) è una variabile che assume valori numerici che consentono confronti solo per differenza tra le modalità che le unità assumono. Ne deriva che è possibile ordinare le unità statistiche sulla base delle risposte e inoltre misurare la differenza esistente tra i valori assunti da ognuna di esse. Le scale a intervallo sono quelle che assumono uno zero arbitrario che rappresenta una convenzione e non l’assoluta assenza del fenomeno.
La misura della temperatura in gradi può avvenire con la scala Celsius oppure con quella Fahrenheit. Lo zero della prima scala è solo una convenzione che equivale nella seconda a 32 gradi. Ciò perché la gradazione F=(9/5)C+32.
In questo caso si possono confrontare le differenze tra temperature ma non i rapporti:
- Milano 10°C equivalenti a 50°F
- Palermo 20°C equivalenti a 68°F
Un carattere su scala a rapporto (o carattere proporzionale) è una variabile che assume valori numerici che consentono confronti sia per differenza che per rapporto tra le modalità che le unità assumono. Ne deriva che oltre a ordinare e confrontare le differenze, è possibile rapportare in termini proporzionali i valori assunti dalle diverse unità. Le scale di rapporto sono quelle che assumono un zero assoluto che indica l’assoluta assenza del fenomeno.
La misurazione del peso può avvenire con diverse unità di misura (kg, g, quintali, tonnellate) ma comunque se tra due individui il primo pesa il doppio del secondo ciò sarà vero per ognuna delle unità di misura utilizzate (g, tonnellate, ecc).
- Tizio pesa 80kg equivalente a 0,8 quintali
- Caio pesa 60kg equivalente a 0,6 quintali
La seguente immagine riassume la classificazione delle variabili aleatorie e le scale di misura.