8.03.011 STATISTICA -distributia normala -distributii de esantionare lectia 7 30 martie 011 al.isaic-maniu www.amaniu.ase.ro http://www.ase.ro/ase/studenti/index.asp?item=fisiere&id=88 DistributiiContinue de Probabilitate Distributia Normala 1
8.03.011 Distributia Normala Cea mai importanta distributie continua: Numeroase variabile aleatoare pot fi adecvat modelate daca sunt normal distribuite. Multe distributii pot fi aproximate printr-o distributie normala. Distributia normala este piatra de temelie a inferentei statistice. 3 Legea normală (Gauss-Laplace) Una din ipotezele fundamentale in sondajul statistic este normalitatea (apartenenţa la legea Gauss-Laplace) a caracterizării investigate este necesar să discutăm despre această lege statistică. Modelul Gauss-Laplace uzual, din punct de vedere matematic reprezintă o repartiţie statistică definită de funcţia de repartitie unde x 1 ( ) ( x µ ) ; µσ ; = exp F x σ π µ R, σ > 0, x R σ dx
8.03.011 Respectiv functia de frecventa f ( x) 1 exp σ π ( x µ ) = σ sau funcţia de densitatearepartitiei variabilei aleatoare X X mărimea fizică măsurată şi care reprezentată grafic are binecunoscuta formă de clopot (aşa-zisul clopot al lui Gauss ) Se ştie că o funcţie de densitatetrebuie să îndeplinească următoarele cerinţe: (i) f( x) 0, x D şi (ii) f( x) dx 1 = unde D este domeniul de definiţie al variabilei X, în D cazul nostru dreapta reală, R. Scurt istoric legea normala (1) Originea acestui model o găsim în lucrarea Dialog despre cele două sisteme fundamentale ale lumii a lui Galileo GALILEI (1564-164), în care el îşi expune părerile referitoare la măsurarea distanţelor dintre diferite corpuri cereşti: Galilei considera că: erorile întâmplătoare sunt inevitabile în observaţiile obţinute cu diverse mijloace de măsurare erorile mici au şanse mai mari de apariţie decât cele mari sau foarte mari măsurările tind să se distribuie aproximativ egal la stânga şi la dreapta unei valori de referinţă majoritatea valorilor observate tind să se grupeze ( să se aciuiască ) în jurul acestei valori de referinţă 3
8.03.011 ( ) Repartiţia normală apare de fapt pentru prima oară în 1733 într-o lucrare a lui Abraham de MOIVRE (1667-1754), matematician cunoscut mai curând prin formula Moivre referitoare la numerele complexe Abia odată cu lucrările lui Carl Friedrich GAUSS (1777-1855) şi cele ale lui Pierre Simon, Marquis de LAPLACE (1749-187) se pun în lumină proprietăţile şi importanţa deosebită a acestei legi statistice ca descriptor iniţial al comportării erorilor de observaţie (Gauss, 1809 în Theoria Motus Corpum Caelestium Laplace (1810/1811 în Theorie analitique des Probabilites din 181) arată rolul teoretic (şi practic) excepţional jucat de legea normală prin aşa-numita TEOREMĂ LIMITĂ CENTRALĂ. Cateva proprietati ale legii normale graficul funcţiei are un singur maximumpentru x=µ si două inflexiuni de abscise µ x=µ±σ parametrii descriptori şi au semnificaţia mediei şi dispersia teoretice: M x = ; var( x) = σ intervalul [ µ 3 σ, µ + 3σ] conţine aproximativ 99,73% din valorile mărimii X. σ ( ) µ 4
8.03.011 Variabila U= ( x µ/ )σse numeste variabila normală standard(sau standardizată) şi are funcţia de densitate respectiv de repartiţie F 0 f 1 ( u) = exp( / ) 0 u π 1 t / ( u) = e dt π u variabila U are media Oşi dispersia 1. Aceste funcţii au fost tabelate iniţial de către Laplace. Grafice ale legii normale 5
8.03.011 Erori in verificarea ipotezelor statistice (Hypothesis testing errors) Erori în procesul de verificare a ipotezelor statistice: H0 / H1 Eroare de genul întâi: ipoteza H0 se respinge, când ea este adevărată. Eroare de genul al doilea: ipoteza H1 se admite, când ea este falsă. Probabilităţile de a fi comise cele două tipuri de erori sunt: probabilitatea erorii de genul întâi risc de genul I şi respectiv probabilitatea erorii de genul al doilea-risc de genul II. 6
8.03.011 Nivel de încredere (Confidence level) Valoarea P = ( 1 α) a probabilităţii asociate unui interval de încredere. Prob = ( 1 α) poate fi exprimat în procente [ ( 1 α) 100]. Nivel (prag) de încredere (α) (Confidence level or significance level) Termen folosit pentru a indica probabilitatea erorii de genul întâi (α ). Sinonim: nivel de semnificaţie. Nivel de semnificaţie (Signifiance level) Valoarea dată a limitei superioare a probabilităţii de eroare de tipul I. Nivelul de semnificaţie se notează cu α. Test statistic (Statistical test) Procedura statistică prin care se decide dacă ipoteza nulă poate fi respinsă în favoarea ipotezei alternative sau nu În general, un test preia apriori o anumită ipoteză, care trebuie verificată (de exemplu, ipoteza de independenţă a observaţiilor, ipoteza de normalitate etc.). Testele pot fi construite cu ajutorul mediei aritmetice şi cu ajutorul altor variabile aleatoare de sondaj, acestea numindu-se de regulă statistici decizionale ale testului statistic 7
8.03.011 Testarea normalităţii Verificarea faptului că datele experimentale obţinute sunt repartizate după legea Gauss-Laplace se poate face în mai multe moduri, şi anume: algebric(utilizând indicatorii de eşantionaj cu proprietăţile lor specifice în cazul legii normale); grafic (folosind aşa-numitele hârtii sau reţele de tip probabilist) analitic(utilizând procedee statistice speciale aşa numitele teste de concordanţă ). Testul hi-pătrat - testul χ (Chi-squared test) Testul statistic în care, pentru validarea ipotezei nule, statistica utilizată presupune existenţa repartiţiei χ. Testul este aplicat, de exemplu, la următoarele probleme: a. testul de egalitate între varianta unei populaţii normale şi o valoare specificată, statistica testului având la bază varianta eşantionului; b. comparaţia între efectivele teoretice şi cele observate; c. în validarea unei legi de repartiţie, ca de pildă cea normală. O formă clasică de construire a regiunii critice a testului χ este următoarea: Fie X o variabilă care poate lua valorile x 1, x,, x m, cu probabilităţile p 1, p,, p m. Fie n 1, n,,n m frecvenţele de apariţie a valorilor x 1, x,, x m, într-un eşantion de volum n. Regiunea critică a testului χ pentru verificarea ipotezei p 1 = p = = p m se construieşte pe baza indicatorului statistic de forma: n (n i np i ) care pentru i= 1 np n are repartiţia χ cu n 1 grade de libertate. i 8
8.03.011 Distributii de esantionare 1.Introducere Inpractica, parametrii unei populatii nu se calculeaza deoarece populatiile sunt foarte mari Decat sa se investigheze intreaga populatie, se ia un esantion, se calculeaza o statisticalegata de un parameterude interes, si se realizeaza o inferenta. Distributia de esantionare astatisticiieste un instrument care ne arata cat de apropiata este statistica de parametru 17. Distributia de esantionare a mediei Un exemplu: Un zar este aruncat de foarte multe ori. Fie X numarul oricarei aruncari. Probabilitatea de distributie a lui X este: x 1 3 4 5 6 p(x) 1/6 1/6 1/6 1/6 1/6 1/6 M(X) = 1(1/6) + (1/6) + 3(1/6)+ = 3.5 V(X) = (1-3.5) + (-3.5) +. =.9 18 9
8.03.011 Presupunem ca dorim sa estimam µdin x media unui esantion de dimensiune n =. Care este distributia pe care o urmeaza x? Esantion Medie Esantion Mean Esantion Medie 1 1,1 1 13 3,1 5 5,1 3 1, 1,5 14 3,,5 6 5, 3,5 3 1,3 15 3,3 3 7 5,3 4 4 1,4,5 16 3,4 3,5 8 5,4 4,5 5 1,5 3 17 3,5 4 9 5,5 5 6 1,6 3,5 18 3,6 4,5 30 5,6 5,5 7,1 1,5 19 4,1,5 31 6,1 3,5 8, 0 4, 3 3 6, 4 9,3,5 1 4,3 3,5 33 6,3 4,5 10,4 3 4,4 4 34 6,4 5 11,5 3,5 3 4,5 4,5 35 6,5 5,5 1,6 4 4 4,6 5 36 6,6 6 19 6/36 5/36 4/36 3/36 /36 1/36 Esantion Medie Esantion Medie Esantion Medie 1 1,1 1 13 3,1 5 5,1 3 1, 1,5 14 3,,5 6 5, 3,5 3 1,3 15 3,3 3 7 5,3 4 4 1,4,5 16 3,4 3,5 8 5,4 4,5 5 1,5 3 17 3,5 4 9 5,5 5 6 1,6 3,5 18 3,6 4,5 σ 30 5,6 x 5,5 7,1 Notam1,5 : µ 19 x = 4,1 µ x,5 si σ x31 = 6,1 3,5 8, 0 4, 3 3 6, 4 9,3,5 1 4,3 3,5 33 6,3 4,5 10,4 3 4,4 4 34 6,4 5 11,5 3,5 3 4,5 4,5 35 6,5 5,5 1,6 4 4 4,6 5 36 6,6 6 E( ) =1.0(1/36)+ 1.5(/36)+.=3.5 V(X) = (1.0-3.5) (1/36)+ (1.5-3.5) (/36)... = 1.46 1 1.5.0.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 x x 0 10
8.03.011 Varianta mediei esantionului este mai mica decat varianta populatiei. Medie = 1.5 Medie =. Medie =.5 Populatie 1 1.5 1.5.5.5 3 1.5.5 1.5.5 Compara 1.5 1.5 imprastierea din.5.5 populatie cu Sa luam esantioane imprastierea 1.5.5 1.5 mediei esantionului. din cele doua.5 1.5.5 observatii 1.5.5 1.5.5 1.5.5 1.5.5 De asemenea, Valoarea asteptata a populatiei = (1 + + 3)/3 = Valoarea asteptata a mediei esantionului = (1.5 + +.5)/3 = 1 Distributia de esantionare a mediei esantionului 1. µ x = µ x. σ x = σ x n 3. Daca x este normala, x este normala. Daca x nu este normala x este aproximati v normal distribuit a pentru o dimensiune a esantionul ui suficient de mare. 11