NOTIUNI DE BAZA IN STATISTICA INTRODUCERE SI DEFINITII A. PARAMETRI SI STATISTICI Parametru valoare sau caracteristica asociata unei populatii constante fixe notatie - litere grecesti: media populatiei μ dev. std. pt. pop. σ Statistica valoare sau caracteristica calculata pe baza unui esantion o statistica calculata dintr-un singur esantion - o constanta fixa o statistica bazata pe o esantionare repetata - o variabila aleatoare notatie - litere latine Y m s B. DISTRIBUTII DE FRECVENTA Distributie de frecventa: reprezentare (tabelara sau grafica) a frecventei cu care apar valorile dintr-o multime de valori posibile pentru o variabila statistica 1. Distributii de frecventa empirice - determinate pe baza datelor unor esantioane extrase din populatia studiata Cholinesteraza (μmol/min/ml) Frecventa Frecventa relativa 5.95-7.95 1.029 7.95-9.95 8.229 9.95-11.95 14.400 11.95-13.95 9.257 13.95-15.95 2.057 15.95-17.95 1.029 Total 35 1.001 A
2. Distributii de frecventa teoretice - distributia de frecventa care ar putea fi construita daca ar fi colectate date asupra tuturor elementelor posibile ale (unei) populatiei studiate f(x i )=p(x=x i ) Forma de curba continua - variabila aleatoare continua (pe o scara interval/prop.) Functia densitate de probabilitate - formula matematica ce descrie forma unei anumite distributii de frecventa teoretice Valorile cholinesterazei - 35000 persoane: DISTRIBUTIA NORMALA (GAUSS) A. CARACTERISTICI ALE DISTRIBUTIEI NORMALE 1. Forma - curba continua, forma de clopot ("clopotul lui Gauss"), simetrica fata de media populatiei μ B
1 f( x) = p( x) = e σ 2π ( x μ) 2σ 2 2 Locatia centrului (μ) pe axa orizontala Gradul de imprastiere a valorilor (σ) 2. Aria cuprinsa sub grafic pxdx= ( ) 1 Frecventele relative (probabilitati) ale valorilor: C
p ( μ σ x μ σ) 196. + 196. = 0. 95 B. DETERMINAREA PROBABILITATILOR PE BAZA DISTRIBUTIEI NORMALE Distributia Gauss normalizata - distributia normala standard scorurile Z: observatie z = dev. std. media pop. Y μ σ z = i i f( z) = 1 e 2π 2 z 2 D
DISTRIBUTIA ESANTIOANELOR A. POPULATIA MEDIILOR ESANTIOANELOR Populatia mediilor esantioanelor multimea mediilor calculate (Ym) pentru toate esantioanele de o anumita marime (n), selectate la intamplare din populatia studiata media populatiei mediilor esantioanelor = media populatiei studiate μ Ym = μ Y deviatia std. pt. populatia mediilor esantioanelor = eroarea standard a mediei σ Ym = σ n relatia dintre estimatori si parametrii populatiei studiate esantion populatie media Ym μ deviatia standard s σ eroarea standard s n σ n a mediei Teorema limita centrala Avand data o populatie cu media μ si deviatia std. σ, cu cat marimea esantionului (n) extras din populatie creste, cu atat mai mult media esantionului (Ym) se apropie de o distributie normala cu media μ si deviatia std. σ n E
ESTIMAREA STATISTICA INTERVALE DE INCREDERE - metoda pentru estimarea valorilor populatiei A. CONCEPTUL DE INTERVAL DE INCREDERE Studiu - nivelul de colesterol in sange: 100 barbati - pop. cu infarct miocardic acut in antecedente media = 260 mg/dl distrib norm cu σ=20 mg/dl Care este nivelul mediu de colesterol? ( )( ) Ym ± 196. σ = 260 ± 196. 20 221 la 299 mg / dl Ym ± 196. σ = 260 ± 196. 20 100 256. 08 la 263. 92 Ym ( )( ) mg / dl B. FORMA GENERALA A ESTIMARII CU INTERVALE DE INCREDERE Interval de incredere - Confidence Interval (CI) margini interval = estimator punctual ± (coef. incredere er.std. estimator) CI μ = Ym ± (1.96 σ Ym ) pentru (1-α)=0.95 F
C. FACTORII CE INFLUENTEAZA MARIMEA INTERVALULUI DE INCREDERE 1. Coeficientul de incredere grad de incredere coef. de incredere marime interval 2. Eroarea standard a estimatorului n σ APLICATII ALE METODEI INTERVALULUI DE INCREDERE estimarea mediei unei populatii (μ) atunci cand dev. std. a populatiei (σ) este cunoscuta estimarea mediei unei populatii (μ) atunci cand dev. std. a populatiei (σ) este necunoscuta estimarea diferentei dintre mediile a 2 populatii, cand dev. standard sunt necunoscute Studiu - det. efectul (daca el exista) expunerii la pesticide asupra presiunii arteriale 100 barbati - mc. agricoli (expusi la pesticide) 100 barbati - mc. care NU sunt expusi Ym E =145 mmhg s E =20 mmhg Ym NE =120 mmhg s NE =15 mmhg (1-α) = 0.90 μ E - μ NE Ym E - Ym NE =145-120 = 25 mmhg estimarea mediei diferentelor intr-un studiu pereche μ d d i = Y1 i - Y2 i Studiu - efectul unui tip de contraceptive asupra cresterii in greutate se masoara greutate inainte si la 3 luni de la inceperea medicatiei (1-α) = 0.95 G
estimarea proportiei unei populatii P variabile nominale starea civila.. regim chimioterapeutic. var. ordinale sau interval/prop prop. subiecti cu pres. art. > 160 mmhg Studiu - eval. utiliz. unor subst. med. ilegale printre stud. medicina la o anum. univ. chestionare anonime - 50 subiecti 15 din 50 au admis ca au luat cel putin o data (1-α)=0.95 Care este proportia de studenti care au.? P p =15/50 = 0.3 σ p s = p (1-α)=0.95 z = 1.96 p ( 1 p) 03. ( 1 03. ) n ( )( p) = 50 = 0. 065 CI = p ± z s = 0. 3 ± 196. 0. 065 = 0. 17 la 0. 43 p Interpretare:. estimarea diferentei dintre doua proportii P1-P2 H