ESTIMAREA PARAMETRILOR STATISTICI Călinici Tudor 1
Obiective educaţionale Înţelegerea procesului de estimare Însuşirea limbajului specific pentru inferenţa statistică Enumerarea estimatorilor fără bias Determinarea intervalului de încredere de o precizie dată Calculul taliei unui eşantion reprezentativ în diferite condiţii 2
Probabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii: Reflectă ce ar trebui să se întâmple şi nu ce o să se întâmple efectiv Pentru un pacient supus unei operaţii cu o rată de succes de 75% rezultatul nu poate fi 75% succes Probabilitatea poate fi privită ca o măsură a capacităţii eşantionului analizat de a estima caracteristica unei populaţii 3
Exemplu: distribuţia greutăţii Media = 69, s = 3 68,26% = 66-72 p=0,68 Mai mare de 78 P=0,0013 4
Principii generale În studiul într-o populaţie P a parametrilor a unei caracteristici oarecare (cantitative sau calitative) adesea este necesar să se urmeze procedeul: 1. Se extrage un eşantion reprezentativ al acestei populaţii. 2. Prin mijloacele statisticii descriptive se descrie distribuţia caracteristicii pe eşantionul extras la etapa 1, fiindcă talia acestuia permite o investigare exhaustivă a sa. Astfel se poate determina frecvenţa observată, dacă este vorba de o caracteristică calitativă, sau se calculează media şi variaţia, în cazul unei caracteristici cantitative. 3. Prin mijloacele statisticii inferenţiale sau inductive se extind la întreaga populaţie rezultatele observate pe eşantion. Adica, pornind de la parametrii observaţi (frecvenţa, media, variaţia, etc) pe eşantion se încearcă să se estimeze parametrii teoretici ai întregii populaţii. 5
Principii generale Eşantionare Calculul caracteristicii Inferenţă 6
Principii generale Cazul unei variabile X calitative Frecvenţa teoretică p a variabilei X în populaţia P este necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o frecvenţă f. Se încearcă să se estimeze valoarea necunoscută a lui p cu ajutorul lui f observat. 7
8
Principii generale Cazul unei variabile X cantitative Media teoretică a variabilei X ca şi variaţia sa teoretică 2 în populaţia P sunt necunoscute. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi o variaţie s 2. Se încearcă să se estimeze valorile necunoscute ale lui şi 2 cu ajutorul lui m şi s 2 observate. 9
10
Principii generale Eşantionare Variabile calitative FRECVENŢA Calculul caracteristicii Variabile cantitative MEDIA MEDIANA MODULUL Inferenţă 11
Definiţia unui estimator Estimatorul unui parametru este o funcţie depinzând de observaţiile efectuate pe un eşantion extras la întâmplare care furnizează o valoare aleatoare numită estimarea punctuală a parametrului. Exemplu: Dacă eşantionul E are valorile x 1,...,x n pentru caracteristica studiată, estimatorul mediei aritmetice a unei populaţii P este m = (x 1 +x 2 +...+x n )/n 12
Principii generale Eşantionare Variabile calitative FRECVENŢA Calculul caracteristicii Variabile cantitative ESTIMATOR MEDIA MEDIANA MODULUL Inferenţă 13
ESTIMAREA PUNCTUALĂ Calităţile unui estimator: corectitudinea estimării obţinute, precizia acesteia. 14
Estimator fără bias Fie T estimarea punctuală a unui parametru teoretic al unei populaţii. T este o variabila aleatoare, valorile fiind tributare eşantionului pe baza căruia se calculează. Estimatorul T se spune că este fără bias dacă speranţa matematică a lui T este egală cu valoarea adevărată (teoretică) a parametrului estimat adică M(T) =. Se spune în acest caz că estimarea dată de T este corectă. 15
ESTIMAREA PUNCTUALĂ Proprietăţi ale estimatorilor medie si frecventa: P1. Speranţa matematică a mediilor observate, m, pe eşantioane extrase aleator este egală cu media teoretică a populaţiei din care sau extras eşantioanele, medie considerată pentru valorile unei variabile cantitative luată în studiu: M(m) =. P2. Speranţa matematică a frecvenţelor observate, f, pe eşantioane extrase aleator este egală cu frecvenţa teoretică p a populaţiei din care sau extras eşantioanele, frecvenţă considerată pentru valorile unei variabile calitative luată în studiu: M(f) = p. Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că 16 estimările realizate cu ajutorul lor sunt corecte.
ESTIMAREA PUNCTUALĂ P3. Speranţa matematică a variaţiilor descriptive observate s 2 pe eşantioane de talie n, extrase aleator este diferită de variaţia teoretică 2 a populaţiei din care sau extras eşantioanele, variaţie considerată pentru valorile unei variabile cantitative luată în studiu: M( s 2 ) n 1 2 n P4. Variaţia punctuală de eşantionare este un estimator fără bias pentru 2 : S 2 n n 1 s 2 17
18
Concluzie Media, frecvenţa şi variaţia de eşantionare observate pe eşantioane corect extrase (reprezentative) dintr-o populaţie P sunt estimatori fără bias ale mediei, frecvenţei şi respectiv variaţiei teoretice ale populaţiei P 19
ESTIMAREA CU INTERVALE DE INCREDERE Un estimator că este cu atât mai eficace cu cât variaţia sa este mai mică, sau precizia sa depinde de mărimea variaţiei sale. Estimarea punctuală a unui parametru teoretic furnizează o valoare pentru parametrul teoretic estimat. Valoarea sa este tributară fluctuaţiilor de eşantionare şi poate fi la o mare distanţă de valoarea reală a parametrului estimat. Este recomandabil să se estimeze un parametru teoretic nu printr-o singură valoare ci printr-un interval, numit interval de încredere, în care să se poată afirma că parametrul estimat se găseşte cu o 20 probabilitate ridicată.
ESTIMAREA CU AJUTORUL INTERVALULUI DE INCREDERE Intervalul de încredere este un interval mărginit de valori (limitele poartă numele de limite de încredere) care include media caracteristicii studiate. Cu cât intervalul este mai larg cu atât suntem mai siguri că media caracteristicii studiate se va regăsi în acel interval. Mărimea încrederii, confidenţa, este dată de probabilitatea ca valoarea (valorile) studiate să se găsească în acel interval. 21
ESTIMAREA UNEI MEDII Fie P o populaţie în care variabila X are o media teoretică necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi se calculează o variaţie punctuală estimată Se încearcă să se determine pentru valoarea necunoscută a mediei teoretice un interval de încredere cu pragul, (cu ajutorul lui m şi S 2 observate), adică să se determine un interval [a,b] în care probabilitatea ca media teoretică să se afle este 1-: Pr(a b) = 1 -. n ( xi m) 2 n S s2 i1 n1 n1 2 22
ESTIMAREA UNEI MEDII: EŞANTIOANE MARI N>=30 Intervalul de încredere pentru media cu pragul de semnificaţie este m Z, m Z n n Atunci când nu se cunoaşte, ea poate fi estimata corect prin s şi în acest caz intervalul de încredere cu pragul de semnificaţie pentru media este s, s m Z m Z n1 n1 25
ESTIMAREA UNEI MEDII: EŞANTIOANE MARI Cel mai frecvent se utilizează un prag de semnificaţie = 0.05. Atunci Z=1.96 şi deci intervalul de încredere cel mai utilizat în cazul eşantioanelor mari este m 1,96 s, m 1,96 s n1 n1 26
Întrebare Într-un eşantion de 101 de nou născuţi, cunoaştem media greutăţii la naştere: 3400g şi abaterea standard: 142 Se ştie din literatură faptul că greutatea medie la naştere la nou născuţi este de 3300g. Este eşantionul din acest exemplu caracteristic pentru o populaţia la care se face referirea din literatură? 3400 +/-1,96*142/10= 3400+/-27.83 27
Eroarea de eşantionare a mediei Sx= diferenţa dintre media valorilor eşantionului şi media caracteristici populaţiei din care a fost extras eşantionul Creşterea erorii de eşantionare => Scăderea acurateţii mediei eşantionului de a estima caracteristica unei populaţii Scăderea erorii de eşantionare => Creşterea acurateţii mediei eşantionului de a estima caracteristica unei populaţii 28
Intervale de încredere cu eşantioane mici n<30 Cu cât eşantioanele sunt mai mici cu atât distribuţia de eşantionare este mai dispersată faţă de distribuţia normală Se foloseşte o altă distribuţie: distribuţia t sau Student Diferenţa majoră dintre distribuţia t şi cea normală constă în faptul că prima îşi schimbă forma odată cu schimbarea dimensiunii eşantionului 30
df Grade de libertate Direcţiile disponibile pentru mişcare într-un spaţiu dat Numărul de componente care pot varia într-un set de date n-1 s, s m t m t n1 n1 31
Calculul intervalului de încredere s, s m t m t n1 n1 n=6 df = 5 II95% t= ±2,571 n=10 df = 9 II95% t= ±2,262 n=30 II95% t= ±2,042 Creşterea lui n determină ca valoarea lui t să se apropie de 1,96 curba tinde spre distribuţia normală 32
ESTIMAREA UNEI FRECVENTE Esantioane mari np, nq>=10 f(1-f) f Z, f Z n f(1-f) n f este frecventa observata 33
Talia eşantionului reprezentativ Prevalenţa maladiei în populaţie este cunoscută f (exprimată în procente) Se stabileşte marja de eroare k în procente Se stabileşte riscul asumat Talia esantionului este N = z α 2 f (1 f) k 2 34
Exemplu Se cunoaşte din literatură faptul că o maladie are în populaţie o prevalenţă de 25% Să se calculeze talia unui eşantion reprezentativ legat de respectiva maladie, cu o marjă de eroare de 3%, asumându-se un risc de 5% N = 1,962 0,25 0,75 0,03 2 800 35
Talia eşantionului reprezentativ Se doreşte evaluarea unei variabile cantitative, cu o anumită precizie E cu asumarea unui risc 1-α. Se cunoaşte din studii anterioare varianţa respectivului parametru ca având valoarea σ. Talia eşantionului reprezentativ va fi N = Z α σ E 2 36
Exemplu Se doreşte estimarea timpului mediu de consultaţie pentru medicii de familie. Ştiindu-se din studii anterioare că durata unei consultaţii poate varia cu aproximativ 5 minute de la caz la caz şi că studiul doreşte estimarea cu precizia de 1 minut, asumându-şi un risc de 5% de eroare, să se calculeze talia eşantionului necesar în acest caz N = 1,96 5 1 2 96 37
SAU http://www.gpower.hhu.de/en.html 38
Vă mulţumesc pentru atenţie 39