Variabile statistice (clasificare, indicatori)
Definiţii caracteristică sau variabilă statistică proprietate în functie de care se cerceteaza o populatie statistica şi care, în general, poate fi măsurată, căpătând valori diferite de la un individ la altul; valoare (stare, realizare) forma concretă de manifestare a unei variabile statistice pentru un individ; scală totalitatea valorilor diferite ale unei caracteristici sau intervalul în care se conţin acestea (domeniu de valori al variabilei); măsurare procesul prin care se obţin valorile variabilelor sau atribuirea de valori caracteristicilor indivizilor potrivit unor reguli; cercetare studiul variabilelor şi a relaţiilor dintre ele.
Clasificarea variabilelor după modul de exprimare variabile calitative variabile, valorile cărora sunt exprimate prin cuvinte care desemnează apartenenţa individului la una din categoriile scalei (exemple: sexul, calificativul, profesia, starea civilă etc.). Variabilele calitative sunt de 2 tipuri: nominale şi ordinare. variabile cantitative variabile, valorile cărora se exprimă numeric (exemple: vârsta, salariul, inaltimea etc.). Variabilele cantitative sunt de 2 tipuri: de interval şi de raport.
Clasificarea variabilelor după numărul de valori (sau a variantelor de răspuns) dihotomice (binare, alternative) variabile calitative scala cărora e compusă din 2 valori antonime (da nu, prezent absent, aprins stins etc.). Noţiunea de variabilă binară provine de la codificarea valorilor acestora cu 0 şi 1. Codificarea prin 0/1 permite utilizarea acestor variabile în proceduri dedicate nivelurilor mai înalte de măsurare (ordinal, interval). nealternative (categoriale) celelalte variabile calitative, ce nu posedă proprietăţi ale variabilelor dihotomice.
Clasificarea variabilelor după modul de obţinere primare variabile obţinute în etapa de culegere a datelor (exemplu: vârsta înregistrată în ani, notele primite la examenele din sesiune etc.); derivate (auxiliare) variabile obţinute în urma procesului de prelucrare a variabilelor primare (exemplu: vârsta calculată pe grupe de vârstă, nota medie la sesiune etc.).
Clasificarea variabilelor după natura variaţiei caracteristicii numerice continue, care pot lua orice valoare din scala lor de variaţie (exemple: înălţime, greutate, cifră de afaceri etc.); discrete, care nu pot lua decât anumite valori pe scala lor de variaţie, de regulă numere întregi (exemple: numărul de copii dintr-o familie, numărul de sate dintr-un raion etc.).
Variabile nominale - variabile calitative care pot lua un număr finit de valori neordonate sau variabile, ce permit doar clasificarea observaţiilor. Observaţie: în vederea prelucrării, valorile variabilelor nominale se codifică, de regulă, cu numere întregi. În acest caz nivelul de măsurare (tipul variabilei) nu se modifică prin utilizarea unei astfel de codificări.
Variabile ordinare - variabile calitative ale căror valori sunt ordonate dar nu este definită (nu se poate defini) distanţa dintre oricare două valori. Observaţie: la codificarea valorilor (ordonate) ale variabilelor ordinare se folosesc şiruri ordonate de numere întregi.
Variabile de interval - variabile cantitative (numerice), utilizând o valoare 0 convenţională. La compararea valorilor găsim răspuns la întrebări de tipul: Cu cât e mai mare? sau Cu cât e mai mică? Observaţie: valorile variabilelor numerice nu se codifică: în calitate de cod se ia chiar valoarea variabilei.
Variabile de raport - variabile cantitative (numerice), utilizând o valoare 0 naturală. La compararea valorilor găsim răspuns şi la întrebări de tipul: De câte ori e mai mare? sau De câte ori e mai mică? Observaţie: valoarea 0 indică inexistenţa variabilei.
Notări n numărul indivizilor cercetaţi; X o caracteristică studiată; x 1, x 2,,x m valorile caracteristicii X; n 1, n 2,...,n m numărul de indivizi corespunzător valorilor caracteristicii (sau care posedă valoarea respectivă a caracteristicii).
Frecvenţe definiţii şi calculare (I) Se numeşte frecvenţă absolută a unei valori x i a caracteristicii, numărul de unităţi ale populaţiei n i corespunzătoare acestei valori. Se numeşte frecvenţă relativă a unei valori x i a caracteristicii raportul dintre frecventa absolută n i a valorii x i şi numărul total al indivizilor n. Frecvenţele relative exprimate în procente se mai numesc frecvenţe procentuale. Ele se calculează după formula: f i = n n i 100%
Frecvenţe definiţii şi calculare (II) Se numeşte frecvenţă cumulată procentul de indivizi ce se găsesc până la sau sub o treaptă (valoare) a scalei. Ea se calculează după formula: = n + n + n n +... + n 100% 1 2 3 i F i = 1 + 2 + 3 + + f f f... f i Observaţie: frecvenţele cumulate au sens pentru variabilele ordinare şi cele cantitative.
Distribuţii de frecvenţe Un tabel de forma: X x 1 x 2 x 3... x m F f 1 f 2 f 3... f m poartă denumirea de distribuţie de frecvenţe.
Exerciţiu: de construit distribuţia de frecvenţe a culorilor bilelor observate
Distribuţia de frecvenţe a culorilor bilelor Culoare Frecvenţe absolute 8 4 6 2 Frecvenţe relative (procentuale) 40% 20% 30% 10%
Reprezentarea grafică a distribuţiilor de frecvenţe (I) 9 8 7 6 5 4 3 2 1 0 Albastră Roşie Galbenă Neagră
Reprezentarea grafică a distribuţiilor de frecvenţe (II) Neagră 10% Albastră 40% Galbenă 30% Roşie 20%
Indicatori ai variabilelor nominale În calitate de indicator al tendinţei centrale se utilizează modulul sau moda (Mo) categoria cu cea mai mare frecvenţă. În calitate de indicator al împrăştierii se utilizează Indicele variaţiei calitative (IVC) raportul dintre variaţia distribuţiei observate şi variaţia distribuţiei uniforme.
Determinarea indicatorilor pentru exemplul analizat Modulul categoria A (bila albastră) Pentru determinarea IVC se iau distribuţiile: - observată: { 8, 4, 6, 2 } şi - uniformă: { 5, 5, 5, 5 }. Atunci: 8 (4 + 6 + 2) + 4 (6 + 2) + 6 2 IVC = 5 (5 + 5 + 5) + 5 (5 + 5) + 5 5 100% 93.3%
Indicatori ai variabilelor ordinare Tendinţa centrală: modulul (Mo); mediana (Me) valoarea din mijloc a şirului ordonat (în creştere sau descreştere) de valori ale caracteristicii. Indicator al împrăştierii: indicele variaţiei calitative (IVC). Forma distribuţiei de frecvenţe: simetrică (Mo=Me) sau asimetrică (Mo Me).
Exemplul 1 (În ce măsură sunteţi mulţumit de...?) 1 foarte nemulţumit (3) 2 nemulţumit (7) 3 indiferent (10) 10 8 4 mulţumit (7) 6 5 foarte mulţumit (3) 4 2 Mo = indiferent Me = indiferent IVC = 63,3% Distribuţia - simetrică 0 f. nemult. nemult. indiferent mult. f. mult.
Exemplul 2 (În ce măsură sunteţi mulţumit de...?) 1 foarte nemulţumit (3) 2 nemulţumit (5) 3 indiferent (8) 10 8 4 mulţumit (10) 6 5 foarte mulţumit (4) 4 2 Mo = mulţumit Me = indiferent IVC = 63,3% Distribuţia - asimetrică 0 f. nemult. nemult. indiferent mult. f. mult.
Indicatori ai tendinţei centrale pentru variabile cantitative modulul (Mo) se calculează numai după ce variabila se transformă în una ordinară cu scală de intervale; mediana (Me) valoarea din mijloc a şirului ordonat (numărul de valori impar) sau media aritmetică a celor două valori din mijlocul şirului ordonat (numărul de valori par); media (M) media aritmetică a şirului de valori ale caracteristicii, calculată după formula: M = x + x + x n +... + = 1 2 3 n 1 x n n i= 1 x i
Indicatori ai împrăştierii pentru variabile cantitative Amplitudinea: A = x max x min Dispersia (abaterea standard): σ n i= 1 = ( x i n M 2 )
Calcularea indicatorilor în Excel Modulul Mediana Media Amplitudinea Dispersia Frecvenţa =MODE(domeniu) =MEDIAN(domeniu) =AVERAGE(domeniu) =MAX(domeniu)-MIN(domeniu) =STDEV(domeniu) =FREQUENCY(domeniu,limite) Notări: domeniu domeniul de celule în care se gasesc datele analizate; limite domeniu ce conţine capetele intervalelor, în care se calculează frecvenţele
Calcularea indicatorilor în SPSS (1)
Calcularea indicatorilor în SPSS (2) Lista variabilelor transferate spre a fi prelucrate Lista tuturor variabilelor din baza de date
Calcularea indicatorilor în SPSS (rezultate)
Exerciţiu Notele la examen a unei grupe de studenţi sunt următoarele: 7, 5, 7, 8, 4, 6, 8, 2, 7, 1, 8, 10, 9, 7, 9, 6, 4, 2, 3, 7 Să se determine frecvenţele şi indicatorii statistici ai acestei variabile.
Răspuns Se aranjează şirul în creştere: 1, 2, 2, 3, 4, 4, 5, 6, 6, 7 7, 7, 7, 7, 8, 8, 8, 9, 9, 10 Distribuţia de frecvenţe: Nota 1 2 3 4 5 6 7 8 9 10 n i 1 2 1 2 1 2 5 3 2 1 Mo=7; Me=7; M=6 σ= 63 8
Indicatori ai variabilelor statistice (recapitulare) Indicatori ai tendinţei centrale Indicatori de dispersie Modul Mediană Medie IVC Amplitudine Dispersie Nominale X X Ordinare X X X Numerice X X X X X