PRELEGEREA IX STATISTICĂ MATEMATICĂ I. Eşatioarea şi ditribuţii de eşatioare Metodele tatitice, furizate de tatitica ifereţială, permit formularea uor cocluzii depre o populaţie pri ivetigarea uui eşatio aleator fiit, extra di populaţia repectivă. Cuvîtul ifereţă, după dicţioarul explicativ al limbii româe, exprimă operaţia la ivelul itelectual pri care e trece de la u euţ la altul, ultimul euţ fiid acceptat pe baza legăturilor logice meţiute cu euţurile aterioare, preupue ca adevărate. Deci, ifereţa tatitică ete u proce iductiv, pri care cercetătorul trece de la cuocut la ecuocut, de la particular la geeral, pri itermediul uor cocepte proprii. Puctual, de la cocluziile referitoare la u eşatio la cele depre populaţia di care provie eşatioul. Noţiuea de ditribuţie de eşatioare ete o măură a apropierii celor două tipuri de cocluzii privitoare la eşatio şi repectiv populaţie. Termeul aleator u trebuie cofudat cu termeul îtîmplător, aşa cum ete utilizat aceta î limbajul comu. U eşatio aleator u ete alcătuit, chiar, la îtîmplare, ci îtr-u proce bie determiat şi preci de electare. Exită metode tatitice care determiă probabilitatea erorilor de reprezetivitate a uui eşatio, dacă e cuoc iformaţii depre populaţia de referiţă. U eşatio reprezită cu acurateţe populaţia părite, dacă tatitica eşatioului ete egală cu parametrul populaţiei. U eşatio ereprezetativ e umeşte eşatio deformat (au deplaat - biai). Î geeral, deformarea ete itematică, eîtîmplătoare. Reamitim că, erorile de odaj pot fi itematice (itemice) au îtîmplătoare. Primele ît geerate, de cele mai multe ori, de gradul de precizie a itrumetelor de măură utilizate. Ele pot fi îlăturate. Nu acelaşi lucru e îtîmplă cu cele îtîmplătoare, care ît ecotrolabile. Repartiţia ormală a apărut ca urmare a tudiului erorilor îtîmplătoare efectuat de Gau. De aemeea, e ştie că u eşatio ete compu di uităţi de odaj, adică elemete, obiecte au cazuri di populaţia de itere. Volumul (au dimeiuea) uui eşatio ete egal cu umărul de uităţi compoete. Operaţia de formare a uui eşatio e umeşte odaj au eşatioaj. După volum, eşatioaele e împart î: eşatioae mici au eşatioae mari, umărul 30 fiid acceptat drept graiţă ître cele două tipuri de eşatioae. A trata u eşatio mic ca uul mare poate coduce la erori. Situaţia iveră u ete ua gravă. După modul de electare al elemetelor, eşatioaele pot fi idepedete au depedete (perechi). Defiiţia 9.1.1. Două eşatioae e umec idepedete dacă electarea uui elemet îtr-u eşatio u depide de elemetele celuilalt eşatio. De exemplu, două eşatioae de fire obţiute di materii prime diferite (lîă şi bumbac). Defiiţia9.1.. Două eşatioae e umec depedete dacă ît formate di aceleaşi uităţi au di grupuri diferite de uităţi care au fot egalizate aterior î priviţa uei aumite caracteritici:
1) î ituaţia cercetărilor logitudiale (adică, pe o perioadă mai lugă de timp); ) î tudiile î care diferite etape de măurare ît legate ître ele; 3) î cercetările î care e doreşte cotrolarea iflueţei factorilor comui eşatioaelor. După tipul metodelor de formare, eşatioaele pot fi empirice au probabilite. Primele e bazează pe cuoaşterea tructurii populaţiei de itere, iar cele probabilite pe electarea aleatoare. De exemplu, ditr-o tară e extrag aleator u umăr de oraşe, apoi e extrag eşatioae de trăzi ditr-o localitate electată, apoi e extrag eşatioae de peroae. Ca procedee de eşatioare aleatoare e eumeră: a) eşatioare aleatoare implă, ude fiecare elemet al populaţiei tudiată are o probabilitate egală de a fi iclu î eşatio, iar alegerea fiecărui elemet ete idepedetă de alegerea tuturor celorlalte elemete. De exemplu, petru formarea uui eşatio e pot utiliza tabele de umere aleatoare furizate de către calculator, atfel: - e umerotează cazurile di populaţia de referiţă; - e fixează la îtîmplare o liie, o coloaă î tabel şi o direcţie de parcurgere (liie au coloaă); - ultimele cifre di umerele ituate pe direcţia de parcurgere fixează cazurile eşatioului. Î mod aalog, e poate face repartizarea î clae a cazurilor uui eşatio: - e codifică cazurile şi e atribuie cîte u umăr, ca mai u, fiecărui caz î parte; - e ortează crecător umerele; - e grupează cazurile (cîte 4, 5, etc.). b) eşatioare itemică (elecţie mecaică au elecţie cvaialeatoare), î ituaţia uei populaţii cu o dimeiue foarte mare: - e tabileşte u pa de umărare (o fracţie de elecţie au o fracţie de eşatioare), k = N/, ude N ete dimeiuea populaţiei, iar volumul eşatioului. Fiecare al k-lea caz e iclude î eşatio. c) eşatioare tratificată preupue: - claificarea populaţiei de referiţă î traturi, clae. De exemplu, îtr-u tudiu privitor la puterea de cumpărare a uor obiecte de îmbrăcămite, e defiec diferite traturi avîd drept criteriu ivelul de veituri al cumpărătorului. - aplicarea eşatioării aleatoare implă. d) eşatioare cu mai multe trepte. După ce e defieşte populaţia pe baza uui criteriu, e extrage u eşatio. Apoi, e defieşte u al doilea criteriu î iteriorul acetui eşatio şi e cotruieşte u al doilea eşatio. Procedeul poate cotiua pe mai multe trepte. Procedeul b) ete cel mai performat şi coduce la creşterea iformaţiilor depre populaţia avută î vedere. Noţiuea de ditribuţie de eşatioare (ditribuţia de odaj) ete ua teoretică care permite trecerea de la ditribuţia uui eşatio la ditribuţia uei populaţii. Uei caracteritici, pri ifereţă tatitică, i e pot aocia trei ditribuţii: 1. Ditribuţia populaţiei.. Ditribuţia eşatioului. 3. Ditribuţia de odaj.
Prima şi ultima fiid empirice şi ecuocute. Numai a doua poate fi aflată exact, îtrucît datele eceare ît dipoibile pri măurare. Ultima coţie mai multe valori decît populaţia de bază. De exemplu, ditr-o populaţie cu 50 de elemete e pot cotrui: 3 C 50 = 19600 eşatioae de volum 3. Pe baza legilor de probabilitate pot fi dedue forma, tediţa cetrală şi diperia ditribuţiei de odaj, atfel îcît proprietăţile ale pot fi cuocute exact. Legătura ditre ditribuţia populaţiei şi cea de odaj ete fixată pri teorema de limită cetrală. Statiticile calculate petru mai multe eşatioae cu acelaşi volum au, î geeral, valori diferite. Deci, e poate dicuta depre o ditribuţie a valorilor tatiticii î mulţimea eşatioaelor cu volum egal ce provi di aceeaşi populaţie de itere. De exemplu, ditribuţia de eşatioare a mediilor e defieşte ca ditribuţia mediilor tuturor eşatioaelor aleatoare de dimeiue cotată di populaţia de referiţă. Practic, ar trebui ă e procedeze atfel: - petru tudierea mediei vîrtei uei populaţii comparabilă cu cea a Româiei e electează u eşatio de 50 de peroae; - e calculează media petru acet eşatio; - ă preupuem că am electat toate eşatioaele poibile de dimeiue 50 di populaţia repectivă şi petru fiecare am calculat media. Ditr-u igur eşatio u e pot extrage iformaţii riguroae şi adevărate aupra îtregii populaţii. Î geeral, tatiticile lor diferă uele de celelalte î proporţii care depid de eterogeitatea lotului de populaţie tudiat. - -a obţiut ditribuţia (repartiţia) mediilor petru toate eşatioaele poibile de dimeiue 50 di populaţia de referiţă. Aceată ditribuţie poartă deumirea de ditribuţie de eşatioare a mediilor. La rîdul ei, ea are o formă, o medie ( X ) şi o abatere tadard ( X ). Cercetări imilare e pot face şi î ituaţia celorlalte mărimi tatitice (quatila, coeficiet de corelaţie, etc.) Teorema limitei cetrale precizează cei trei parametrii ai ditribuţiei de eşatioare a mediilor uei populaţii tatitice. Se coideră că o populaţie oarecare de volum N are media şi abaterea medie tadard. Dacă e alcătuiec toate eşatioaele poibile de volum, ditribuţia de eşatioare a mediilor are următoarele proprietăţi: - media a X ete egală cu media populaţiei ; - abaterea a tadard X ete egală cu ; - cu cît ete mai mare ( > 30), cu atît forma a aproximează mai bie ormalitatea, idiferet de forma ditribuţiei populaţiei (altfel, petru 10 < < 30, forma a devie ormală la limită). Se obervă că, teorema u cotrîge ca populaţia de referiţă ă aibă o ditribuţie ormală. Î chimb, petru uficiet de mare precizează că ditribuţia de eşatioare a mediilor poate fi aproximată ormal. Cu atît mai mult, dacă ditribuţia populaţiei ete ormală au riguro ormală, atuci ditribuţia de eşatioare a mediilor va fi ormală, idiferet de dimeiuea eşatioului.
Se ştie că, o valoare ete cu atît mai aproape de medie, cu cît abaterea tadard ( ) ete mai mică, deci cu cît volumul eşatioului ete mai mare, abaterea tadard fiid iver proporţioală cu volumul eşatioului). Cu alte cuvite, petru populaţiile cu o variabilitate mare e impue ă e facă cercetări pe eşatioae mai mari, decît petru populaţiile cu o variabilitate mică. Aplicaţie. Teorema limită cetrală e utilizează, î pecial, petru a afla probabilitatea de a electa o medie a uui eşatio, de u volum dat, cupriă îtr-o plajă de valori. Se coideră o populaţie cu media a uei caracteritici aproximativ ormale = 10 şi = 15. Ne itereează probabilitatea ca u eşatio, electat di aceată populaţie, de volum = 49, ă aibă media cupriă ître 117 şi 15. Coform teoremei limitei cetrale, ditribuţia de eşatioare x ete aproximativ ormală, variabila caracteritică fiid aproximativ ormală şi uficiet de mare, avem: 15 X = 10 şi X = = =.14. 49 Pri traformarea de variabilă z = x X X e poate determia probabilitatea de elecţie a uei valori cupriă îtr-o plajă de valori ale uei ditribuţii aproximativ ormale tadard. Î ituaţia oatră, avem: z 117 = (117-10)/.14 = -1.40 şi z 15 = (15-10)/.14 =.34. Di tabel rezultă că probabilităţile corepuzătoare valorilor z 117 şi z 15 ît 0.419 şi repectiv 0.4904. Cu alte cuvite, probabilitatea de a electa o medie a uui eşatio, de volum = 49, cupriă ître valorile 117 şi 15 ete: 0.419 + 0.4904 = 0.9096. Î plu, e poate determia probabilitatea de a electa o medie a uui eşatio, de volum = 49, pete valoarea 15, 0.5-0.4904 = 0.0096 au probabilitatea de a electa o medie a uui eşatio, de volum = 49, ub valoarea 117, 0.5-0.419 = 0.0808 (au 8.08%). Caracteritici Param ob. Volum eşat. () Medie x mare O. Legea de ditrib. a pop. x O. cu cuocut x O. cu ec. Valoarea param. ditrib. de eşat. X = X = X = X = X = X = 1 Variab. reduă z = x / 1 z = x / t = x / 1 Legea de ditrib. a variab. red. Aprox Studet (ν= 1)
Diperie mare O. = 4 = O. - O. 1 1 S mare O. = z = χ = Aprox. Pearo (ν= 1) - Fiher- Sedecor ν 1= 1 1 ν = 1 = cv mare O. cv = CV CV cv = z = = Aprox. - Aprox. 1 1 Legedă: N ormală, O oarecare, - F = ( )/( ) 1 1 1 Tabelul 9.1. 1. Valorile parametrilor ditribuţiei de eşatioare Obervaţii. 1. O chemă grafică a trategiei ifereţiale (figura.1), precum şi etapele geerale care itervi î acet proce -au prezetat î capitolul ii.. Euţul teoremei limită cetrală cupride apecte legate de ditribuţia de eşatioare a mediilor. Iformaţii privitoare la ditribuţia de eşatioare a altor mărimi tatitice (diperie, abaterea tadard au coeficietul de variaţie) e prezită uccit, î tabelul 9.1.1. II. Etimaţii. Proceduri de etimare tatitică Aşa cum -a văzut î ecţiuile aterioare, tatitica uui eşatio aleator ete utilizată î aproximarea valorii uui parametru şi că valorile mediei, x, şi a abaterii tadard,, ale uui eşatio de volum uficiet de mare cotituie valorile adevărate ale parametrilor corepuzători petru populaţia di care -a extra eşatioul. Teoria etimaţiei e răapude la îtrebarea Cît de adevărate ît acete aproximări şi ître ce limite e ituează valorile căutate? Teoria etimaţiei e bazează pe două cocepte, etimator şi etimaţie. Orice etitate a cărei valoare ete utilizată drept valoare aproximativă petru o altă etitate poartă deumirea de etimator. Valoarea etimatorului e umeşte etimaţie. Am văzut deja că valorile tipice de odaj cotituie etimaţii petru parametrii populaţiei di care provie eşatioul petru care -a calculat acele valori. Fie θ u parametru oarecare şi etimatorul ău, θ, care depide de volumul de odaj,, şi de tructura eşatioului. Petru implitate, vom foloi otaţia θ. Defiiţia 9.1. Etimatorul θ e umeşte edeplaat (au editorioat) dacă media repartiţiei de odaj a etimatorului ete egală cu parametrul etimat, M( θ ) = θ.
Se pue că etimaţia ete deplaată pozitiv (ditorioată pozitiv) au deplaată egativ (ditorioată egativ) atuci cîd M( θ ) = θ + b au repectiv M( θ ) = θ - b, ude b 0 petru. Adică, petru eşatioae mici, î pecial, are loc o upraevaluare (upraetimare) au repectiv o ubevaluare (ubetimare) a valorii parametrului. Defiiţia 9..1. U etimator ete abolut corect dacă M( θ ) = θ şi lim D ( θ )= 0 petru. Deci, u etimator ete abolut corect, dacă are loc micşorarea diperiei etimatorului atuci cîd volumul de odaj creşte. Defiiţia 9... U etimator ete coitet, dacă petru u ε arbitrar, uficiet de mic şi ε > 0, P( θ - θ < ε) -> 1 î ituaţia uei elecţii de volum detul de mare. Defiiţia 9..3. O etimaţie e umeşte eficietă dacă etimatorul edeplaat are diperia miimă petru u volum dat. Miimul ete electat ditre toţi etimatorii poibili petru parametrul avut î vedere. Pri urmare, u etimator ete cu atît mai eficiet cu cît ditribuţia de eşatioare ete mai grupată î jurul mediei ale au cu cît ete mai mică abaterea tadard a ditribuţiei de eşatioare. Îă, X =, deci X ete iver proporţioală cu. Cu alte cuvite, eficieţa etimatorului poate fi îmbuătăţită pri creşterea volumului de odaj. Cu otaţiile obişuite, e demotrează că: - valoarea mediei de odaj, x, ete o etimaţie abolut corectă, coitetă şi eficietă petru (chiar şi ub forma proporţiilor): - (calculat cu -1) ete o etimaţie abolut corectă petru ; - (calculat cu ) u ete edeplaată. De regulă, diperia uui eşatio ete mai mică decît cea a populaţiei repective, adică tide ă ubetimeze (ubevalueze) pe ; - abaterea tadard u ete edeplaată; - petru repartiţia biomială, Bi(; p), o etimaţie eficietă a parametrului parametrului p ete frecveţa relativă a cazurilor ucce. Aplicaţie. U etimator edeplaat poate fi foloit î calculul probabilităţii ca o mărime tatitică de odaj ă e afle la o aumită ditaţă de parametrul corepuzător pe care vrem ă-l etimăm. Atfel, e coideră caracteritica veitul mediu al uei populaţii, care are o ditribuţie aimetrică egativă. Se extrage u eşatio avîd = 500, petru care -a determiat x = 500 RO Coform teoremei limitei cetrale, ditribuţia de eşatioare x ete aproximativ ormală petru uficiet de mare ( 100), avîd X egală cu media populaţiei,. De aemeea, e ştie că toate curbele repartiţiei ormale tadard coţi aproximativ 68% ditre cazuri ître ±1 (au, ±1Z), 95% ditre cazuri ître ±
şi 98% ditre cazuri ître ±3 (cazurile fiid mediile de eşatioare). Ca atare, exită o probabilitate mare (68 de cazuri di 100) ca media eşatioului coiderat, 500 RON, ă e afle ître ±1, o probabilitate foarte mare (95 de cazuri di 100) ca media eşatioului tudiat, ă e afle ître ± şi o probabilitate extrem de mare (99 de cazuri di 100) ca media eşatioului, ă e afle ître ±3 faţă de media ditribuţiei de eşatioare X, care ete egală cu media populaţiei,. Se obervă că, mai puţi de 1% di cazuri e află la mai mult de ±3 faţă de media ditribuţiei de eşatioare X. Practic, e poate pue că valoarea 500 RON u e află î aceată ituaţie.