9. SONDAJUL STATISTIC

Σχετικά έγγραφα
Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

7. ECUAŢII ŞI SISTEME DE ECUAŢII DIFERENŢIALE

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

Laborator 4 Interpolare numerica. Polinoame ortogonale

Curs 12. Intervale de încredere Intervale de încredere pentru medie în cazul σ cunoscut

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

a) (3p) Sa se calculeze XY A. b) (4p) Sa se calculeze determinantul si rangul matricei A. c) (3p) Sa se calculeze A.

COMBINATORICĂ. Mulţimile ordonate care se formează cu n elemente din n elemente date se numesc permutări. Pn Proprietăţi

4. Ecuaţii diferenţiale de ordin superior

Analiza bivariata a datelor

Capitole fundamentale de algebra si analiza matematica 2012 Analiza matematica

8 Intervale de încredere

Inegalitati. I. Monotonia functiilor

ŞIRURI DE VARIABILE ALEATOARE. PROBLEME ASIMPTOTICE

Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

CURS III, IV. Capitolul II: Serii de numere reale. a n sau cu a n. Deci lungimea segmentului este suma lungimilor sub-segmentelor obţinute, adică

Formula lui Taylor. 25 februarie 2017

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Olimpiada Naţională de Matematică Etapa locală Clasa a IX-a M 1

6.1. DERIVATE ŞI DIFERENŢIALE PENTRU FUNCŢII REALE DE O VARIABILĂ REALĂ. APLICAŢII

Analiza matematica Specializarea Matematica vara 2010/ iarna 2011

3.1. DEFINIŢII. PROPRIETĂŢI

5.1. ŞIRURI DE FUNCŢII

TEMA 10 TESTE DE CONCORDANŢĂ

PRELEGEREA VI STATISTICĂ MATEMATICĂ

Curs 4 Serii de numere reale

1. ŞIRURI ŞI SERII DE NUMERE REALE

Aplicatii ale marimilor medii in practica

Metode iterative pentru probleme neliniare - contractii

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Sunt variabile aleatoare care iau o infinitate numărabilă de valori. Diagrama unei variabile aleatoare discrete are forma... f. ,... pn.

9 Testarea ipotezelor statistice

CURSUL AL VII-LEA. 1. Eşantion. 2. Eşantionare

CAPITOLUL IV CALCULUL DIFERENŢIAL PENTRU FUNCŢII REALE DE O VARIABILA REALĂ

CURS I ELEMENTE DE BAZĂ

sistemelor de algebrice liniarel

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

PROBLEME CU PARTEA ÎNTREAGĂ ŞI

CAP VII ELEMENTE DE TEORIA PROBABILITĂŢILOR ŞI STATISTICĂ MATEMATICĂ

PENTRU CERCURILE DE ELEVI

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

SUBGRUPURI CLASICE. 1. SUBGRUPURI recapitulare

3. Serii de puteri. Serii Taylor. Aplicaţii.

BAREM DE CORECTARE CLASA A IX A

5. PROBABILITĂŢI Evenimente

ŞIRURI ŞI SERII DE FUNCŢII

CAPITOLUL III FUNCŢII CONTINUE

CLASA a V-a CONCURSUL INTERJUDEŢEAN DE MATEMATICĂ ŞI INFORMATICĂ MARIAN ŢARINĂ EDIŢIA A IV-A MAI I. Să se determine abcd cu proprietatea

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Concursul Naţional Al. Myller Ediţia a VI - a Iaşi, 2008

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

lim = dacă se aplică teorema lui 3. Derivate de ordin superior. Aplicaţii.

Sala: 2103 Decembrie 2014 CURS 10: ALGEBRĂ

Asupra unei inegalităţi date la barajul OBMJ 2006

Clasa a IX-a. 1. Rezolvaţi în R ecuaţiile: (3p) b) x x x Se consideră mulţimile A = { }, (2p) a) Determinaţi elementele mulţimii A

Partea întreagă, partea fracţionară a unui număr real

DistributiiContinue de Probabilitate Distributia Normala

REZOLVAREA NUMERICĂ A ECUAŢIILOR ŞI SISTEMELOR DE ECUAŢII ALGEBRICE NELINIARE

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

în care suma termenilor din fiecare grup este 0, poate conduce la ideea că valoarea acestei sume este 0. De asemenea, gruparea în modul

CANALE DISCRETE DE TRANSMISIUNI

Examenul de bacalaureat nańional 2013 Proba E. c) Matematică M_mate-info. log 2 = log x. 6 j. DeterminaŃi lungimea segmentului [ AC ].

Metode de interpolare bazate pe diferenţe divizate

REZOLVAREA NUMERICĂ A ECUAŢIILOR ŞI SISTEMELOR DE ECUAŢII DIFERENŢIALE ORDINARE

Cursul 7. Spaţii euclidiene. Produs scalar. Procedeul de ortogonalizare Gram-Schmidt. Baze ortonormate

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Polinoame Fibonacci, polinoame ciclotomice

Seminar 3. Serii. Probleme rezolvate. 1 n . 7. Problema 3.2. Să se studieze natura seriei n 1. Soluţie 3.1. Avem inegalitatea. u n = 1 n 7. = v n.

Sondajul statistic- II

CAPITOLUL 4 SPAŢII VECTORIALE EUCLIDIENE/UNITARE Produs scalar. Spaţii euclidiene şi spaţii unitare-definiţie

2.1. DEFINIŢIE. EXEMPLE

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

1. Operaţii cu numere reale Funcţii Ecuaţii şi inecuaţii de gradul întâi Numere complexe Progresii...

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

Sisteme diferenţiale liniare de ordinul 1

Laborator biofizică. Noţiuni introductive

CURSUL AL II-LEA. 2. Indicatori statistici

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

DETERMINAREA PUTERILOR MATRICELOR

Student: Specializarea: STATISTICĂ ECONOMICĂ PRELUCRAREA BAZELOR DE DATE

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

7 Distribuţia normală

Tema: şiruri de funcţii

Modelare si simulare _Seminar 1 SEMINAR 1

T R A I A N. Numere complexe în formă algebrică z a. Fie z, z a bi, Se numeşte partea reală a numărului complex z :

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

NOTIUNI DE BAZA IN STATISTICA

OLIMPIADA DE MATEMATICĂ FAZA LOCALĂ CLASA a V-a

Varianta 1 - rezolvari mate MT1

EXAMENE ŞI CONCURSURI

Aplicaţii ale principiului I al termodinamicii la gazul ideal

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

CALCULUL SI ANALIZA INDICATORII PE TERMEN SCURT

PENTRU CERCURILE DE ELEVI

Transcript:

9. SODAJUL STATISTIC 9.. Cosideraţii geerale Creşterea ecesarului de iformaţii ce trebuie obţiute cu maximă operativitate a codus la extiderea utilizării sodajului statistic. Această expasiue a sodajului statistic se explică pri operativitatea şi ecoomicitatea obţierii datelor statistice. Mai mult sodajul statistic este caracteristic dezvoltării libere, ecoomiei de piaţă, aşa cum rapoartele statistice sut caracteristice ecoomiilor cetralizate. De asemeea î uele situaţii practice di tehică, ecoomie, societate, sodajul statistic este sigura metodă de obţiere a iformaţiilor statistice. Pri sodaj statistic îţelegem procedeul pri care se caracterizează o populaţie statistică, pe baza cercetării uei părţi a acesteia, umită eşatio, mostră sau ueori selecţie, prelevată di populaţia geerală cercetată. Trebuie subliiat că toate afirmaţiile, cocluziile statistice stabilite pe baza datelor proveite ditr-u sodaj, u pot fi cosiderate de tip determiist, ele avâd u caracter statistic, există u risc ca ele să fie eroate, fiid efectuate î codiţiile uei aumite probabilităţi, deci cu u aumit ivel de îcredere. Metodele sodajului statistic u-şi propu să elimie acest risc de eroare, ci să-l preevalueze, să determie probabilităţile cocluziilor exacte sau aproximative. Sursa pricipală a erorilor de sodaj o costitue erorile de reprezetativitate a eşatioului î raport cu populaţia de asamblu. Pri reprezetativitate se îţelege că, îtr-u umăr mic de uităţi care formează u eşatio, să se găsească aceleaşi trăsături eseţiale ca î îtreaga populaţie supusă cercetării. U sodaj care coduce la erori de maximum ± 5% faţă de populaţia de bază se cosideră suficiet de reprezetativ. Teoretic, eroarea de reprezetativitate poate fi redusă oricât de mult, odată cu creşterea volumului eşatioului pâă la a îgloba îtreaga populaţie. Î acest caz dispar avatajele cercetării pri sodaj (de cost, timp etc.). Să cosiderăm o populaţie statistică P de volum fiit şi E P u eşatio de volum. Parametrii populaţiei corespuzători uei caracteristici X, ca valoarea medie m, dispersia, pot lua o sigură valoare, pe câd parametrii corespuzători asociaţi uui eşatio, pe care-i otăm de obicei cu x, respectiv s pot lua valori diferite de la eşatio la eşatio (de acelaşi volum sau de volume diferite) ceea ce e

94 Sodajul statistic - 9 dă posibilitatea să-i iterpretăm ca pe işte variabile aleatoare cu valori şi frecveţe de apariţie diferite. Caracteristica X poate fi asimilată cu o variabilă aleatoare pe populaţia cercetată statistic, ea u este determiată probabilistic apriori şi se mai umeşte variabilă aleatoare teoretică. Dacă variabila aleatoare X ia valori discrete, atuci legea ei de repartiţie poate fi dată pri fucţia frecveţelor relative cumulate. Dacă variabila teoretică este cotiuă, atuci legea ei de repartiţie poate fi dată pri fucţia de repartiţie sau pri desitatea de repartiţie. Am văzut că cele mai îtâlite legi de repartiţie depid de aumiţi parametri, care au iterpretări semificative ca medie,dispersie etc. Câd o populaţie statistică poate fi cosiderată di puct de vedere practic ifiită, sigura metodă de cercetare a populaţiei după caracteristica X este cea a sodajului. Dacă efectuăm măsurători asupra a uităţi statistice alese îtâmplător cu o aceiaşi probabilitate, atuci valorile îregistrate {x,x,,x } formează o valoare de observaţie a variabilei -dimesioale ( X,X,,X ), ude variabilele compoete sut idepedete, idetic repartizate cu variabila teoretică asociată caracteristicii X. Variabilele X,X,,X fiid idetic repartizate cu variabila teoretică X ( caracteristica populaţiei ) au aceiaşi valoare medie şi momete cu aceasta, umite şi caracteristici umerice teoretice ale populaţiei. Să cosiderăm sodajul ( selecţia ) aleator { X,X,,X }, atuci orice fucţii de aceste variabile aleatoare S(X,X,,X ), umită fucţie de selecţie sau statistică, este la râdul ei o variabilă aleatoare a cărei fucţie de selecţie este uic determiată de fucţia de repartiţie a variabilei aleatoare X care a geerat această selecţie aleatoare. Petru o realizare a sodajului (x,x,,x ), S(x,x,,x ) este u umăr ce reprezită o realizare pri sodaj (selecţie) a statisticii S(X,X,,X ). Cuoaşterea legii de repartiţie a statisticii S(X,X,,X ) este foarte importată deoarece ea permite să se tragă cocluzii referitoare la caracteristica X a populaţiei statistice di care a proveit selecţia. Se umeşte repartiţie exactă a statisticii S = S repartiţia determiată petru orice volum de sodaj, iar pri repartiţie asimptotică ( limită ) se îţelege repartiţia către care tide repartiţia exactă câd volumul tide către ifiit. Repartiţia exactă a statisticii S este deosebit de utilă î cazurile î care se impue folosirea uor eşatioae de volum redus ( < 30 ). Dacă volumul eşatioului este mai mare decât 30, atuci folosirea repartiţiei asimptotice coduce de asemeea la rezultate suficiet de precise. Î geeral, este dificil de stabilit repartiţia exactă sau asimptotică a uei statistici. Aceasta este strâs legată şi uic

9.. Cosideraţii geerale 95 determiată de legea de repartiţie teoretică a variabilei X cercetate pri sodaj X. U caz importat, pri faptul că este frecvet îtâlit i practica statistică, î care se pot determia repartiţiile exacte petru diferite statistici de sodaj, este cel î care repartiţia teoretică a caracteristicii care a geerat selecţia este ormală. Î practică se îtâlesc de asemeea destul de multe situaţii câd populaţia statistică are petru o caracteristică o repartiţie diferită de ua ormală şi î acest caz determiarea repartiţiilor exacte ale variabilelor de selecţie este sau imposibilă sau prezită dificultăţi practice deosebite. Dacă volumul de selecţie este foarte mare repartiţiile limită ale variabilelor de selecţie oferă avataje practice foarte mari. Î cotiuare prezetăm repartiţiile uor statistici de sodaj foarte importate petru aplicaţiile lor. Teorema. Dacă (x,x,,x ) este o selecţie de volum di o populaţie statistică a cărei caracteristică studiată este repartizată ormal de parametrii m şi, atuci media de selecţie x + x + + x x = are o repartiţie ormală de valoare medie m şi dispersie. Teorema. Dacă (x,x,,x k ) şi (y,y,,y ) sut două selecţii idepedete de volum k şi respectiv di două populaţii ale căror caracteristici studiate au repartiţii teoretice ormale de parametrii m şi şi respectiv m şi, atuci variabila aleatoare difereţă a mediilor de selecţie x - y are o repartiţie ormală de valoare medie m - m şi abatere medie pătratică. k Teorema 3. Dacă (x,x,,x k ) şi (y,y,,y ) sut două selecţii idepedete de volum k şi respectiv di două populaţii ale căror caracteristici studiate au repartiţii teoretice ormale de parametrii m şi şi respectiv m şi, iar x, y sut mediile de selecţie corespuzătoare şi s k = ( x i x), s k (yi y) sut dispersiile de selecţie corespuzătoare, atuci variabila aleatoare ( statistica) de sodaj t = x y (m m (k )s + ( )s k + ) k k +

96 Sodajul statistic - 9 are o repartiţie Studet cu k+- grade de libertate. Ca o coseciţă a teoremelor referitoare la repartiţiile limită se obţi teoreme care stabilesc repartiţiile asimptotice ale uor variabile aleatoare de sodaj obţiute pri selecţii ditr-o populaţie oarecare. O astfel de teoremă cu o importaţă deosebită î statistică este următoarea. Teorema 4. Dacă (x,x,,x ) este o selecţie de volum ce costă di observaţii idepedete ditr-o populaţie statistică a cărei caracteristică studiată are o repartiţie teoretică oarecare cu valoarea medie m şi abaterea medie pătratică fiite, atuci media de selecţie x + x + + x x = are petru tizâd la, o repartiţie ormală de valoare medie m şi dispersie. Ditre idicatorii care defiesc statistic o aumită colectivitate, media are cel mai îalt grad de sitetizare a tuturor valorilor luate de o caracteristică. Di acest motiv se cosideră, ca pricipal măsurător al erorii de sodaj, difereţa ditre media de selecţie şi media geerală a populaţiei. Astfel eroarea de reprezetativitate datorată sodajului se poate măsura î mod absolut pri : (9..) e = x m Astfel defiită, eroarea absolută de sodaj măsoară deplasarea absolută a idicatorului de sodaj x, faţă de idicatorul real m al îtregii populaţii. Poderea erorii absolute î raport cu valoarea reală a parametrului populaţiei este dată pri : x m (9..) ε % = 00 m Deci media eşatioului x este reprezetativă petru media îtregii populaţii m dacă : x m (9..3) 00 5% m Se distig pri coţiutul lor, două tipuri de erori de reprezetativitate şi aume : a) erori de reprezetativitate sistematice, care provi di îcălcarea pricipiilor corecte de alcătuire a eşatioaelor (fiecare uitate statistică trebuie să aibe aceeaşi şasă de a face parte di eşatio). b) erori îtâmplătoare, care u pot fi evitate, ele reflectâd atura procedeului de sodaj, ca cercetare parţială a uui îtreg. Să presupuem că ditr-o cercetare aterioară se cuoaşte media geerală a populaţiei. Calculâd media uui eşatio şi comparâd cele două medii spuem că

9.. Cosideraţii geerale 97 am calculat eroarea efectivă. Dacă aceasta se îcadrează î itervalul de variaţie de ± 5% spuem că eşatioul este suficiet de reprezetativ. Î foarte multe cazuri u se dispue de o observare totală, atuci se pot utiliza mai multe sodaje de probă pri care se verifică stabilitatea mediei şi dispersiei. Î cazul î care la formarea eşatioului se utilizează o schemă probabilistă sau u procedeu derivat di acesta este posibilă calcularea mărimii erorii şi stabilirea prealabilă a acestei mărimi. umai sodajul probabilist permite calcularea erorilor de selecţie şi iterpretarea lor pe baza proprietăţilor diferitelor fucţii de probabilitate. Î practica sodajului statistic s-au dezvoltat diferite tehici şi procedee de prelevare a uităţilor ce formează eşatioaele astfel îcât să se asigure caracterul aleator al selecţiei şi reprezetativitatea eşatioului. Astfel distigem următoarele tipuri de sodaj : a) sodaj simplu aleator repetat sau erepetat ; b) sodaj stratificat ; c) sodaj de serii ; d) sodaj î mai multe trepte ; e) sodaj secveţial ; f) sodaj dirijat ; g) sodaj sistematic sau sodaj mecaic ; Spuem că se efectuează u sodaj repetat, dacă fiecare uitate extrasă di populaţia cercetată statistic este itrodusă di ou î colectivitatea de bază, deci fiecare di uităţile populaţiei poate fi extrasă de mai multe ori. Î acest caz variatele de sodaj sut idepedete ître ele şi variabila de sodaj urmează o repartiţie de probabilitate după modelul Shemei bilei reveite a lui Beroulli. Pritr-u sodaj repetat ditr-o colectivitate P de volum card P = se pot extrage o ifiitate de eşatioae de volum <, dar umai u umăr fiit de eşatioae pot fi disticte. Această abordare a metodei de selecţie permite stabilirea de relaţii verificabile ître idicatorii de variaţie ai populaţiei de bază şi ai eşatioaelor posibile. Sodajul erepetat, ca model, corespude Schemei bilei ereveite ce se caracterizează pri faptul că bila extrasă u mai este pusă la loc î ură. Î acest caz o uitate statistică u poate să apară decât o sigură dată î şirul extragerilor, variatele de sodaj sut depedete ître ele iar umărul eşatioaelor este fiit şi depide de volumul populaţiei şi al eşatioului. Di cele de mai sus rezultă că î ambele tipuri de sodaj se pot obţie mai multe eşatioae de acelaşi volum. Mediile acestora pot estima media populaţiei geerale, dar putâd diferi ître ele, pot fi cosiderate ca valori diferite ale uei variabile aleatoare. Fie S şi S două sodaje de acelaşi volum î baza cărora se estimează media m a populaţiei geerale P, petru o variabilă X, pri mediile x s, x s. Spuem că sodajul S este mai eficiet decât sodajul S dacă au loc relaţiile :

98 Sodajul statistic - 9 M ( x s ) = m M ( x s ) = m şi ( x s ) < ( x s ) x s şi Aplicâd iegalitatea lui Cebîşev variabilelor, avâd aceeaşi valoare medie m, rezultă că petru aceeaşi probabilitate media m se găseşte î λ itervalele x x, x + λ x s s s s xs λ x s, x s + λ x s ditre care primul este mai mic, deci, putem spue că sodajul S este mai eficiet decât S. Sodajul aleator simplu, costă î prelevarea di populaţie a uităţilor la îtâmplare, fiecare uitate a populaţiei avâd aceeaşi şasă de a face parte di eşatio. Sodajul simplu aleator poate fi cu reveire sau fără reveire şi cu aceste particularităţi este o realizare practică a schemei cu bile a lui Beroulli şi a modelului teoretic descris de repartiţiile biomială şi hipergeometrică. Alcătuirea eşatioaelor (sodajelor aleatoare) cuoaşte mai multe procedee. a) Procedeul bilei reveite şi ereveite, costă î idetificarea uităţilor statistice, pri umerotarea, cu bileţele, care sut itroduse îtr-o ură, amestecate, după care se procedează î coformitate cu schema bilei reveite, respectiv ereveite î alcătuirea eşatioului. b) Procedeul tabelelor cu umere aleatoare, se aplică î geeral, populaţiilor de dimesiui mari. Procedeul costă î utilizarea tabelelor cu umere aleatoare, adică sut prelevate uităţile populaţiei ale căror umere de ordie stabilite pritr-o umărătoare aterioară au fost citite după o aumită ordie di tabelul umerelor aleatoare. Tabelele de umere aleatoare oferă serii de umere, rezultate î urma aplicării uui procedeu de tip loterie sau pri aplicarea calculatorului electroic pri programe specifice petru geerarea de umere aleatoare. c) Procedeul loteriei este procedeul aleator î care uităţile sut perfect idetificabile şi sut prelevate după corespodetul îregistrat pe bileţele amestecate şi extrase aleator ditr-o ură. d) Procedeul mecaic, costă î prelevarea uităţilor la itervale de timp sau umerice precise, adică se utilizează u aumit pas de umărare, ca bază a desfăşurării sodajului. Procedeul de prelevare a uităţilor se va pori cu o uitate oarecare aleasă aleator. Dacă ditr-o populaţie de uităţi se formează u eşatio E de uităţi atuci se va utiliza u pas K = /. x s λ, respectiv, [ ( ) ( )]

9.. Sodajul aleator simplu 99 9.. Sodajul aleator simplu Acest tip de sodaj reprezită variata aleatoare elemetară de sodaj. Celelalte tipuri de sodaj pot fi cosiderate ca particularizări ale acestui tip de sodaj. Î ua di cele două variate repetat, respectiv erepetat el este şi cel mai des utilizat. Avâd î vedere importaţa şi frecveţa cu care apar î descrierea uei populaţii statistice valoarea mediei m, dispersia şi abaterea medie pătratică, vom cosidera ca puct cetral al acestui paragraf estimarea mediei şi dispersiei uei populaţii statistice folosid sodajul statistic. Amitim că pri estimator al uui parametru al populaţiei statistice îţelegem o regulă care e spue cum să calculăm o valoare aproximativă a acestuia folosid iformaţiile di eşatio. El este î geeral exprimat pritr-o formulă care exprimă exact cum valoarea reală a estimaţiei poate fi obţiută atuci câd se cuosc datele di eşatio. U estimator de tip iterval foloseşte datele di eşatio petru a calcula două valori reale disticte β, astfel ca itervalul [, β ] să coţiă valoarea parametrului estimat petru îtreaga populaţie. Putem spue că u estimator de tip iterval este, de fapt, o regulă de a calcula două umere. 9... Sodajul aleator simplu repetat Caracteristic acestui sodaj este faptul că uitatea observată revie î populaţia cercetată, ceea ce asigură stabilitatea repartiţiei caracteristicii catitative (măsurabile sau umerice) cercetate. Faptul că u idicator statistic al populaţiei calculat pri sodaj diferă de la eşatio la eşatio face ca acesta să poată fi iterpretat ca o variabilă aleatoare şi astfel putem aplica metodele elaborate de statistica matematică. Dacă extragerea eşatioului s-a făcut după o schemă probabilistă, atuci media de selecţie este o variabilă statistică ce urmează o lege de probabilitate. Fucţia de probabilitate asociată depide de volumul eşatioului şi stă la baza calcului erorii de reprezetativitate. Să cosiderăm o populaţie statistică P de volum (card P = ) petru care otăm m şi valoarea medie, respectiv dispersia petru caracteristica cercetată X. Prelevâd u eşatio E de volum ( = card E) şi îregistrâd valorile caracteristicii X cercetate otăm cu x şi s valoarea medie şi dispersia corespuzătoare populaţiei de selecţie (di eşatio). Idicatorul de sodaj

00 Sodajul statistic - 9 x i i (9..) x = =, reprezită u estimator al mediei populaţiei. xi (9..) m = i=, Am otat cu ( ) i, x i = valorile caracteristicii X petru îtreaga populaţie, iar cu ( x i ) i =, valorile caracteristicii X, îregistrate petru u eşatio E. U idicator de sodaj ( x ) petru a fi bu estimator al valorii corespuzătoare a populaţiei trebuie să îdepliească aumite codiţii : a) Să fie edeplasat, adică valoarea medie a idicatorului de sodaj petru orice volum fiit al selecţiei să fie egal cu parametrul respectiv al populaţiei (î cazul ostru petru x iterpretat ca variabilă aleatoare de sodaj trebuie să avem M ( x) = m ) ; b) Să realizeze estimaţii cosistete, adică idicatorul de sodaj să coveargă î probabilitate, câd volumul eşatioului creşte, către parametrul populaţiei ; c) Să realizeze estimaţii eficiete, adică estimatorul privit ca o variabilă aleatoare să fie de dispersie miimă. Pritr-u estimator se realizează estimaţii (valori aproximative) valorilor reale ale parametrilor geerali (teoretici) ai populaţiei statistice. Rezultatele obţiute pritr-u sodaj sut afectate de erori. Pri sodaj u se poate obţie valoarea reală a uui parametru aalizat petru o caracteristică a uei populaţii statistice ci u iterval umit de îcredere, care cu o probabilitate acoperă valoarea ecuoscută a parametrului di populaţia statistică. Limitele itervalului de îcredere, miimă θ şi maximă θ se calculează ca fucţii depizâd de datele de selecţie x, x,..., x astfel îcât să fie îdepliită o relaţie de forma : P( θ < θ < θ) = ude θ este parametrul estimat. Itervalul de îcredere ( θθ, ) defieşte precizia estimaţiei. Probabilitatea umită probabilitate de îcredere caracterizează siguraţa cu care se afirmă că itervalul de îcredere cupride valoarea teoretică estimată. Probabilitatea ( ) se mai umeşte ivel de îcredere iar se umeşte

9.. Sodajul aleator simplu 0 prag (ivel) de semificaţie. Cu cât θ θ este mai mic şi este mai mare, cu atât estimaţia este mai precisă şi îcrederea î ea este mai mare. Observaţiile X,X,..., X î urma cărora se formează eşatioul { x, x,..., x }, îţelegâd pri eşatio măsurătorile efectuate, pot fi cosiderate variabile aleatoare, fiid calculate pe baza acestor măsurători. Ître lugimea itervalului de îcredere θ θ şi coeficietul de îcredere există o relaţie bie determiată. Î practică se folosesc drept coeficieţi de îcredere ( )% valorile 95%, 98%, 99%. Jumătatea itervalului de îcredere ( θ θ) se umeşte eroare limită admisă sau admisibilă. Î cazul sodajului aleator simplu repetat probabilităţile P ( X i = x i ) sut egale şi aume avem : (9..3) P ( Xi = xi ) = petru orice i =, Folosid idepedeţa variabilelor X i, i =, şi valorile lor di eşatioae x, x,..., x, se arată că media de sodaj x + x +... + x (9..4) x = = x i i= este u estimator edeplasat al mediei m a populaţiei cercetate, deoarece se îdeplieşte codiţia ca media mediilor de sodaj (selecţie) să fie egală cu media geerală a populaţiei, adică să avem : (9..5) M ( x) = m Relaţia (9..5) exprimă faptul că media de sodaj x este u estimator edeplasat (edistorsioat) al mediei populaţiei m, î cazul selecţiei simple aleatoare repetate. Îtr-adevăr variabilele X i, i =, iau valorile x, x,..., x. Fie { x k) ; s, } ( s =, k =, valorile îregistrate petru u eşatio (k ) E, şi (k) x (k) (k) media valorilor îregistrate petru eşatioul E. Valorile x pot fi cosiderate ca fiid valorile variabilei x, ce a fost cosiderată ca u estimator al mediei populaţiei m. Petru acest estimator parametrii tediţei cetrale (media) şi ai împrăştierii (dispersia) se obţi pri : M x = ( ) M x = M s s= s= i= ( x ) = m m s =

0 Sodajul statistic - 9 D ( x) = D k= x k = k= D ( x ) = ( x) =. Deducem că abaterea medie pătratică a mediei de sodaj x este : s (9..6) x =, adică dispersia mediei de sodaj îtr-u sodaj aleator simplu repetat de volum este de ori mai mică decât dispersia a îtregii colectivităţi. Cosiderâd şirul de variabile de sodaj { x } de dispersie (x), şi aplicâd iegalitatea lui Cebîşev variabilelor { x } obţiem : P ( x m L) >, petru orice, ceea ce arată că media de sodaj x L petru u volum mare al eşatioului coverge î probabilitate către media m a populaţiei. Aceasta arată că x este u estimator cosistet al mediei m a populaţiei. k s= 9... Sodajul aleator simplu erepetat Să presupuem că petru o populaţie statistică P de volum card (P) = studiem o caracteristică X. Sodajul simplu presupue că eşatioul se alege la îtâmplare di îtreaga colectivitate. Faptul că este erepetat îseamă că o uitate statistică odată ce a fost extrasă u mai este restituită populaţiei cercetate, deci u mai are şase să reitre î eşatio. Eficieţa uui astfel de sodaj depide atât de variaţia caracteristicii studiate cât şi de volumul al eşatioului (card E = < ). O variaţie mare a caracteristicii studiate impue u volum mare al eşatioului petru a asigura u grad sporit de reprezetativitate al eşatioului. P( X = x) = reprezită probabilitatea ca la prima extragere să obţiem valoarea x a caracteristicii X. Ţiâd seama că uitatea statistică cercetată u mai revie î populaţie, probabilitatea obţierii măsurătorii x la a doua extragere este X x P = = X x respectiv la a k + -a extragere vom avea : = P ( X x X x i k) k + = k + =, =, = i i k

9.. Sodajul aleator simplu 03 Să cosiderăm ca estimator al mediei populaţiei date m, media de sodaj x. Î acest caz al sodajului aleator simplu erepetat se poate arăta că dispersia mediei de selecţie (sodaj) este dată de relaţia : s (9..7) x = D (x) = Di (9..7) obţiem că abaterea medie pătratică a mediei de selecţie este dată pri: s s (9..8) x =. Î cazul câd < 0,, de regulă, factorul se aproximează pri, ceea ce face ca erorile sodajelor ce cuprid o parte a populaţiei să depidă umai de umărul absolut de observaţii şi de mărimea abaterii medii pătratice a îtregii populaţii cercetate. Relaţiile (9..7.) arată că precizia estimaţiei lui m pri x depide foarte puţi de volumul al îtregii populaţii cercetate şi depide mult mai mult de volumul al eşatioului. Câd creşte, precizia estimaţiei creşte de aproximativ ori, raport cu care se micşorează abaterea medie pătratică x. O astfel de depedeţă a estimaţiei de volumul eşatioului de selecţie justifică utilizarea î practică de sodaje de volum, relativ mic, deoarece petru a ridica precizia î mod simţitor trebuie mărit cosiderabil volumul eşatioului. Dacă volumul eşatioului este comparativ mic î raport cu volumul populaţiei, atuci raportul este suficiet de mic ca să cosiderăm factorul subuitar, (9..9) K = =, pri care diferă, î cazul sodajului erepetat, de valoarea corespuzătoare î x cazul sodajului repetat, aproximativ egal cu, şi deci cele două valori pot fi cosiderate aproximativ egale.cum K este subuitar, îtotdeaua eroarea sodajului fără reveire este mai mică decât eroarea corespuzătoare sodajului repetat. Îtradevăr reveirea uităţilor eşatio î populaţie, micşorează reprezetativitatea acestuia, pri posibilitatea apariţiei repetate a aceleeaşi uităţi î eşatio. Avâd î vedere aspectul meţioat cât şi faptul că î mod practic mai uşor se realizează u sodaj fără reveire, obţiem o justificare a utilizării, de obicei, a sodajului fără reveire.

04 Sodajul statistic - 9 Cum î aplicaţiile practice este mult mai mare decât putem eglija rapoartele şi şi cocluzioa că eroarea medie (precizia de sodaj) î cazul sodajului simplu aleator depide de volumul al eşatioului, fiid o costată. Î cosideraţiile de mai sus, asupra estimării mediei m a populaţiei geerale, s-a presupus cuoscută dispersia acesteia. Câd aceasta u se cuoaşte se recurge la u estimator al acesteia, pe baza observaţiilor de sodaj : x, x,..., x, şi aume se recurge la dispersia de sodaj : (9..0) s = ( xi x) i= Petru u sodaj repetat, dispersia de sodaj s este u estimator deplasat al dispersiei populaţiei, adică M ( s ). Mai exact, ţiâd seama de idetitatea : (9..) s = ( xi m) vom avea: ( ) = M ( x m) M s = i= i M xi i= i= (x m) = (x m) ( m) M(x m) = =. U estimator edeplasat al dispersiei a populaţiei geerale, î cazul sodajului de volum redus, se obţie dacă adoptăm petru dispersia de sodaj formula: (9..) = ( xi x) i= ŝ = x s, ude se umeşte corecţia lui Bessel. Îtr-adevăr avem : M( ŝ ) = M ( xi x) = M s = i = = =, =

9.3. Precizia şi siguraţa estimaţiei. Iterval de îcredere. Determiarea volumului de sodaj. ceea ce arată că ŝ este u estimator edeplasat al dispersiei populaţiei geerale. Petru luâd valori relativ mici este diferit de, dar petru mai mare decât 50 putem cosidera aproximativ egal cu şi î această situaţie s poate fi cosiderat u estimator edeplasat al dispersiei populaţiei. Utilizâd cei doi estimatori ai lui, s şi ŝ, rezultă că î cazul sodajului s repetat dispersia mediei de sodaj poate fi estimată pri x, respectiv ŝ x, iar abaterea medie pătratică a mediei de sodaj poate fi exprimată pri s x, respectiv ŝ x. 9.3. Precizia şi siguraţa estimaţiei. Iterval de îcredere. Determiarea volumului de sodaj Fie x estimatorul mediei m a uei populaţii statistice, calculat pe baza x, x, K, ale uui eşatio de volum şi δ > 0 astfel îcât datelor { } x x m < δ. umărul pozitiv δ cu această proprietate caracterizează precizia estimaţiei obţiute pe baza eşatioului extras. Metodele utilizate de statistică u permit o afirmaţie categorică asupra erorii estimaţiei. Se poate stabili umai probabilitatea ca iegalitatea de mai sus să fie satisfăcută. Evidet că, cu cât δ este mai mic, cu atât difereţa absolută x m este mai mică şi estimaţia este mai exactă, dar această precizie a estimaţiei trebuie corelată cu siguraţa sau mai exact cu probabilitatea de îcredere î estimarea făcută, care este de fapt probabilitatea cu care este îdepliită iegalitatea x m < δ. Această probabilitate este dată diaite şi este foarte apropiată de. Î cele mai multe cazuri se ia egală cu 0.95, 0.99, 0.999. Probabilitatea de îcredere se poate exprima pri: (9.3.) P ( x m < δ) = sau î formulare echivaletă pri: (9.3.) P ( x δ < m < x + δ) = 05

06 Sodajul statistic - 9 Itervalul ( δ, x + δ) x,care acoperă media m cu o probabilitate P =, se umeşte iterval de îcredere petru media m. Î vederea stabilirii itervalului de îcredere petru media m a populaţiei geerale e bazăm pe următorul rezultat. Dacă pritr-u sodaj simplu aleator sut efectuate observaţii (măsurători asupra uei caracteristici a uităţi, asupra uei populaţii statistice de medie m şi abatere medie pătratică fiite, atuci câd este relativ mare, distribuţia mediei de sodaj x este aproximativ ormal distribuită, de medie ( x) m M = şi dispersie =. & x && Aproximarea pri repartiţia ormală este cu atât mai buă cu cât este mai mare. Rezultatul euţat mai sus este o exprimare a cuoscutei Teoreme limită cetrală. Î vederea stabilirii expresiei itervalului de îcredere vom utiliza faptul că repartiţia variabilei x m (9.3.3) y = şi eşatioul de volum este extras ditr-o populaţie: a) ormal distribuită de medie m şi dispersie, b) oarecare, dar volumul al sodajului este mare, iar dispersia este fie cuoscută, fie ecuoscută şi estimată pri dispersia de sodaj s. Î aceste codiţii avem este aproximată pri ua ormală ( 0,) P (9.3.4) ( ) ( ) = x δ x m δ x m < δ = P δ < x m < δ = P < < x x x Utilizâd ormalitatea variabilei y defiită de (9.3.3) şi relaţia (9.3.4), obţiem că: δ x m δ δ (9.3.5) P < < = Φ =, x x x x de ude rezultă că putem cosidera

(9.3.6) 9.3. Precizia şi siguraţa estimaţiei. Iterval de îcredere. Determiarea volumului de sodaj. δ y =, şi astfel avem (9.3.7) δ = x y. De aici rezultă că itervalul de îcredere petru medie este (9.3.8) x y x < m < x + yx, x 07 ude y este valoarea reală petru care este satisfăcută relaţia = şi care poate fi luată di tabelul cu valorile fucţiei lui Gauss-Laplace Φ. Lugimea itervalului de îcredere corespuzător probabilităţii volumului al eşatioului este (9.3.0) x y x + y = δ. (9.3.9) Φ( y ) + x x P = şi Dacă trebuie estimată, porid de la datele sodajului, valoarea caracteristicii agregată pe îtreaga populaţie xi = m, atuci di (9.3.8) obţiem următorul i= iterval de îcredere: (9.3.) ( x y ) x ( x + y ) x i= Î practica sodajului se operează cu eşatioae de volum mare şi eşatioae de volum redus, î fucţie de gradul de omogeitate al colectivităţii statistice. Î cele două situaţii, iterpretarea erorii de reprezetativitate se face î mod diferit: petru eşatioaele de volum mare se foloseşte distribuţia ormală a lui Laplace, iar petru cele de volum redus se foloseşte distribuţia studet. Î virtutea legii umerelor mari, mărirea volumului eşatioului sporeşte precizia rezultatelor şi reduce eroarea medie probabilă, dar î acelaşi timp criteriile de ecoomicitate cer ca acelaşi volum de sodaj să fie cât mai mic. Aceste cosiderete impu î orgaizarea uei cercetări pri sodaj o dimesioare raţioală a volumului de sodaj, ceea ce îseamă determiarea umărului miim de uităţi ce urmează a fi observate astfel ca exigeţele de precizie şi siguraţă formulate î raport cu cercetarea respectivă să fie satisfăcute. Cosiderăm mai îtâi cazul sodajului repetat. Di (9.3.7) se obţie i x.

08 Sodajul statistic - 9 (9.3.) δ = y, de ude rezultă y (9.3.3) =, δ î care y se citeşte î tabelele fucţiei Gauss-Laplace, astfel ca Φ( y ) =. Dacă dispersia a caracteristicii X a populaţiei geerale, presupusă ormală, u este cuoscută, atuci aceasta se estimează î urma uui sodaj cu ajutorul dispersiei de sodaj s. Î cazul sodajului erepetat îlocuid î (9.3.7) abaterea medie pătratică de sodaj cu expresia corespuzătoare cazului uei caracteristici biomiale obţiem x (9.3.4) δ = y. Dacă îlocuim abaterea medie pătratică a populaţiei geerale pri estimaţia de sodaj vom avea: s (9.3.5) δ = y. Petru determiarea volumului al eşatioului, di (4.3.4) obţiem succesiv relaţiile: (9.3.6) δ = y, ( ) δ = y y, y (9.3.7) = y ( ) δ + y =. δ + y Să presupuem că volumul colectivităţii geerale este foarte mare, adică y putem cosidera. Dacă avem î vedere că atuci şi 0 deducem că (9.3.7) şi (9.3.3) furizează practic acelaşi volum de sodaj idiferet dacă uităţile sut reitroduse sau u î cadrul populaţiei după îregistrarea caracteristicilor. Di cele de mai sus observăm că petru a dimesioa raţioal volumul al eşatioului sut ecesare următoarele date stabilite aterior:

9.4. Proporţia şi precizia estimării î cazul caracteristicii biare (alterative) 09 a) eroarea limită admisibilă δ care se stabileşte î fucţie de ceriţele solicitate practic î rezolvarea problemei, de precizia ce trebuie asigurată; b) probabilitatea de îcredere suficiet de apropiată de, ceea ce practic asigură apropierea de certitudie î estimarea făcută; c) dispersia caracteristicii a populaţiei geerale sau a estimaţiei acesteia s. Aceste iformaţii se pot obţie: di cercetări aterioare, î cazul î care se presupue că variabilitatea caracteristicii u s-a schimbat semificativ, ditr-o cercetare prealabilă orgaizată petru estimarea dispersiei, petru validarea legii de repartiţie sau petru estimarea valorii maxime a dispersiei şi deci petru luarea î cosideraţie a cazului cel mai efavorabil. Exemplul : Petru determiarea timpului mediu de ardere a uor lămpi cu icadesceţă se cercetează pri sodaj u lot de 7500 lămpi. Di cercetări aterioare se cuoaşte că abaterea medie pătratică a duratei de fucţioare este = 50 ore, iar caracterul distructiv al cotrolului impue u sodaj erepetat. Petru o probabilitate de îcredere P = = 0, 99 căreia îi corespude y =,33 să se determie volumul eşatioului, atuci câd se admite o eroare probabilă de ± 5% di durata medie de fucţioare prezetată î stadard x = 000 ore. Vom aplica, petru determiarea volumului de sodaj formula (9.3.7), ude 5 000 δ = = ± 50 ore. 00 = Vom obţie: y δ + y ( ) 7500,33 50 = 7499 50 +,33 50 = 48,55 49 lămpi 9.4. Proporţia şi precizia estimării î cazul caracteristicii biare (alterative) Dacă o aumită caracteristică X a uei populaţii statistice posedă doar două modalităţi de exprimare (o piesă poate fi buă sau defectă, u mucitor poate avea o calificare corespuzătoare sau u etc.), spuem că este o caracteristică alterativă sau biară. Dacă caracteristica X arată o aumită îsuşire pe care o posedă uele di elemetele colectivităţii, atuci uităţile statistice ale colectivităţii se pot aşeza î două grupe, ua avâd K elemete posedâd caracteristica X şi ua avâd -k uităţi care u posedă îsuşirea (caracteristica) X.

0 Sodajul statistic - 9 Dacă î urma extragerii uui sodaj E de volum s-au obţiut măsurătorile { x, x, K, x } şi dacă k posedă caracteristica X, iar -k u, putem idetifica măsurătorile efectuate pri x = x = L = x k =, x k+ = x k+ = L = x = 0.% Proporţia di eşatioul E a elemetelor care posedă caracteristica X este dată de media k (9.4.) x = xi = [ k + 0 ( k) ] = i= şi este tocmai frecveţa relativă a caracteristicii cercetate X petru eşatioul E, pe care o vom ota cu f sau f. Frecveţa relativă f a caracteristicii X î eşatio este u estimator edeplasat al probabilităţii p = K, a caracteristicii X î populaţia geerală, deoarece di relaţia geerală M ( x) = m rezultă pe baza cosideraţiilor de mai sus că M ( f ) = p. Îtr-adevăr, M ( x) = M xi = M( xi ) = xi = i= i= i= k= K = [ K + 0( K) ] = = p = p i= i= Aplicâd teorema lui Beroulli care exprimă covergeţa î probabilitate a frecveţei relative f către probabilitatea p obţiem că (9.4.) lim P( f p < ε). ceea ce stabileşte că f este u estimator cosistet petru probabilitatea p. Dispersia a caracteristicii alterative X, î colectivitatea geerală, se obţie astfel: (9.4.3) = = ( xi m) i= K + = i= K K + 0 K xi = K K ( K) = = p( p). Î cele de mai sus realizările măsurătorilor di eşatio au fost cosiderate, î acelaşi timp,valori ale variabilelor aleatoare de sodaj, idetic repartizate cu caracteristica populaţiei X.

9.4. Proporţia şi precizia estimării î cazul caracteristicii biliiare (alterative) Ţiâd seama de expresia abaterii medii pătratice de sodaj, rezultă că precizia cu care se estimează probabilitatea p pri frecveţa relativă, î cazul sodajului repetat, respectiv erepetat, se obţie ţiâd seama că: ( p) (9.4.4) f = p, respectiv (9.4.5) p( p) f =. Î cazul sodajului repetat, itervalul de îcredere petru probabilitatea p este (9.4.6) p( p) p( p) f y < p < f + y. Dacă umărul al uităţilor populaţiei geerale este mare iar volumul eşatioului este relativ mic î raport cu, dar suficiet de mare ( 30), atuci itervalul de îcredere petru probabilitatea p î cazul sodajului erepetat este dat pri: (9.4.7.) f y ( p) p( p) p < p < f + y. Î cazul sodajului repetat, volumul al eşatioului de sodaj î fucţie de probabilitatea de îcredere şi eroarea admisă este dat pri: ( p) y y p (9.4.8) = f =, δ δ k ude p se îlocuieşte pri frecveţa relativă f =. Î cazul sodajului erepetat, î vederea obţierii volumului al eşatioului de sodaj, î aceleaşi codiţii date, se poreşte de la relaţia: p( p) (9.4.9) δ = y f = y, de ude se obţie (9.4.0) = yp( p) ( ) δ + y p( p),

Sodajul statistic - 9 k ude p se estimează cu ajutorul frecveţei relative f = de volum. Exemplul : Ditr-u lot de volum = 3000 de produse s-a prelevat aleator şi erepetat u eşatio de 300 produse. Î urma cotrolului acestora, 9 produse au fost găsite cu defecte de fabricaţie şi cosiderate rebuturi. Să se estimeze procetul de rebuturi pe îtregul lot petru o probabilitate de îcredere P = 0,975 căreia îi corespude pri tabelul fucţiei Laplace valoarea y =, 96. 9 Avem f = pˆ = = 0, 33, cu această valoare se estimează o abatere 900 pˆ ( pˆ ) pătratică de sodaj f = = 0,00935. Scriid iegalităţile (9.4.7) cu datele corespuzătoare problemei se obţie p 0,03,96 0,00935;0,03 +,96 0,00935 p 0,0;0,046. ( ) sau ( ) 9.5. Sodajul tipic (stratificat) Sodajul tipic (stratificat) se recomadă atuci câd populaţia cercetată este separată î grupe disticte, bie delimitate, care u au elemete comue. Î această situaţie di fiecare grupă se extrage u umăr fixat de uităţi după schema sodajului aleator repetat sau erepetat, cu ajutorul tabelelor cu umere aleatoare, mecaic etc. Î fucţie de scopul urmărit se poate face o grupare corespuzătoare a populaţiei geerale. De exemplu, î aalizarea uui produs al mai multor ateliere de producţie, sodajul se desfăşoară pe grupe de produse veid de la atelierele corespuzătoare. Dacă se cercetează agajaţii uei îtreprideri, aceştia pot fi împărţiţi î grupe după profesie şi vechimea î producţie. Sodajul stratificat trebuie să asigure reprezetativitatea fiecărei grupe î eşatio, ceea ce îseamă că este ecesar să se găsească astfel de criterii de grupare, care să coducă la u grad cât mai mare de omogeitate î fiecare grupă. O stratificare bie făcută trebuie să coducă la erori mai mici decât dacă aceeaşi colectivitate ar fi fost studiată pe baza uui sodaj aleator simplu. Să cosiderăm populaţia geerală P avâd card ( P) = împărţită î k subpopulaţii umite grupe sau straturi. Fie acestea G,G, K, G k cu card( Gi ) = i, i =, k şi să presupuem că petru caracteristica X, cercetată pri sodajul stratificat, modalităţile de exprimare împărţite pe grupe sut:

(9.5.) G : x, x, K, x G : x, x, K, x L G k : xk, x k, K, x k. k Se observă că trebuie să avem (9.5.) + + L + k =. 9.5. Sodajul tipic (stratificat) 3 Dacă volumul eşatioului E extras este ( ( E) ) ( G E) =, i, k, atuci card = şi card i i = (9.5.3) + + L + k =. Putem cosidera că di fiecare grupă (strat) s-a efectuat câte u sodaj şi s-au obţiut k eşatioae E k = E G k, petru care, corespuzător caracteristicii X, s-au îregistrat valorile: (9.5.4) E E E L k : x : x : x k, x, x, x k, K, x, K, x, K, x Variabilele de sodaj x i,j, j =, k, i =, j, pot fi cosiderate ca işte variabile aleatoare (statistice). Cu otaţiile de mai sus avem: (9.5.5.) m = k j xi, j, j= j= j m j = xi, j j i= kk ude m este media geerală a populaţiei petru caracteristica X, iar corespuzătoare grupei (stratului) j. Ître acestea există relaţia: k (9.5.6) m = j m j, j=, m j este media

4 Sodajul statistic - 9 adică media valorilor caracteristicii X petru îtreaga populaţie P este media poderată a mediilor de grup G j cu poderile j, j, k =. Corespuzător eşatioului de sodaj stratificat putem scrie relaţiile următoare: (9.5.7) k j x = xij j= i = j x j = xij j i= k x = jx j. j= Ultima relaţie di (9.5.7) arată că media valorilor caracteristicii X di k eşatioul de volum = j este egală cu media poderată a mediilor grupelor, ale j= valorilor caracteristicii di fiecare sodaj di grupă, poderile fiid egale cu j, j=, k. Petru estimarea mediei geerale corespuzătoare populaţiei cercetate P,după caracteristica X se cosideră k (9.5.8) x = j x j, care este media poderată a mediilor x j obţiute î grupe. Se demostrează că M ( x) = m şi deci, x este u estimator edeplasat al mediei geerale m. Se arată de asemeea că x este u estimator cosistet al mediei geerale m. Mai exact avem = j= k j (9.5.9) D ( x) ( f ) j= j j ude ˆ j = ( xij m), f j =. j i= j Relaţia (9.5.9) arată că dispersia variabilei x este cu atât mai mică cu cât volumele j sut mai mari şi dispersiile ˆ j sut mai mici. Rezultă deci că sodajul j ˆ j j,

9.5. Sodajul tipic (stratificat) 5 tipic dă rezultate acceptabile, dacă umărul uităţilor extrase di fiecare grupă este mare. Să cosiderăm cazul sodajului repetat, atuci eroarea limită δ î fucţie de dispersia di populaţia de bază şi volumul de sodaj, va fi: ˆ (9.5.0) δ = y, de ude rezultă că petru δ fixat volumul de sodaj se obţie pri: y ˆ (9.5.) =. δ Petru sodajul erepetat se obţie: ˆ (9.5.) δ = y, de ude rezultă yˆ (9.5.3) =. yˆ δ + Î cazul câd se îlocuieşte pri estimatorul s se procedează î mod aalog. Volumul eşatioului depide îsă, î cazul sodajului tipic, şi de felul sodajului tipic utilizat. e vom referi î cotiuare la două tipuri frecvet utilizate de sodaj tipic şi aume: sodajul tipic proporţioal şi sodajul tipic optim. Defiiţia. Spuem despre u sodaj tipic că este proporţioal dacă di fiecare grupă tipică î care a fost împărţită populaţia geerală se extrage u umăr de uităţi, astfel ca raportul ditre umărul lor şi volumul grupei di care s-au extras să fie egal cu raportul ditre volumul geeral al eşatioului şi volumul populaţiei geerale, adică j (9.5.4) f j = = = f, j =, k j Deci, sodajul tipic proporţioal este u sodaj simplu, grupat, petru care are loc relaţia (9.5.4). Di această relaţie deducem: (9.5.5) j = j = f j, j =, k.

6 Sodajul statistic - 9 j î relaţia (9.5.9) şi ţiâd seama că Itroducâd această valoare a lui f j = f, rezultă că dispersia fucţiei de estimaţie statistică x este dată pri k f j (9.5.6) D ( x) = ˆ j. Defiiţia. Spuem despre u sodaj tipic că este optim, dacă volumul sodajului de grupă j este astfel dimesioat îcât eficieţa să fie maximă. Acest fapt revie la determiarea umerelor j care să satisfacă codiţia: (9.5.7) + + L + k = şi petru care (9.5.8) k ˆ j j D ( x) = ( f j ) j= j să fie miimă. Utilizâd metoda multiplicatorilor lui Lagrage se obţie jˆ j (9.5.9) j =, j =,, K, k. k jˆ j j= umerele j E j card E j = j, petru care eficieţa sodajului este maximă. Relaţia (9.5.9) arată că umărul uităţilor ditr-o grupă oarecare este proporţioal cu umărul uităţilor di această grupă şi cu abaterea medie pătratică a grupei respective. Îlocuid umerele j, cu valorile date de (9.5.9) di (9.5.9) se obţie dispersia fucţiei de estimaţie statistică x, dată pri relaţia: (9.5.0) ( x) j= exprimă volumele eşatioaelor ( ( ) ) k jˆ j k j= D = jˆ j, j= ce pue î evideţă eficieţa sodajului tipic optim.

9.6. Testarea ipotezelor statistice. Fudametarea deciziilor bazate pe date de sodaj 7 9.6. Testarea ipotezelor statistice. Fudametarea deciziilor bazate pe date de sodaj Cercetarea selectivă (pri sodaj) are ca scop extiderea (extrapolarea) rezultatelor obţiute pe baza eşatioului la îtreaga populaţie supusă ivestigaţiei (cercetării statistice). Î urma prelevării uui eşatio ditr-o populaţie statistică, pri prelucrarea datelor îregistrate la uităţile eşatioului, se obţie u estimator al uui parametru urmărit î populaţia cercetată pri sodaj. Problema care se pue î legătură cu u estimator este î ce măsură el asigură, pe baza sodajului, credibilitatea estimaţiilor parametrilor referitoari la îtreaga populaţie. Rezultatul obţiut pe baza sodajului, pritr-u estimator, este o propuere a ivelului uui idicator al populaţiei geerale, este o ipoteză statistică, petru care, evidet, se impue o testare a îcrederii care poate să i se atribuie. Putem spue că, pri ipoteză statistică îţelegem o supoziţie asupra valorii uui parametru sau asupra uei repartiţii, aleasă ca model de distribuţie a valorilor caracteristicii studiate petru o populaţie statistică. Valoarea reală, dar ecuoscută a parametrului di îtreaga populaţie statistică u poate fi estimată decât probabilist, pri stabilirea uei zoe probabile a parametrului studiat.. Petru diferiţi parametri ai uei populaţii statistice, studiate pri sodaj (selecţie), statistica oferă diferite metode de plasare a parametrului real ître aumite limite cu o aumită credibilitate. Metoda itervalului de îcredere petru medie oferă posibilitatea calculării a două limite, ua iferioară şi alta superioară, î iteriorul cărora media populaţiei să fie cuprisă cu o probabilitate P = -. Itervalul determiat de cele două limite costituie itervalul de îcredere. Di statistica matematică se cuoaşte că, dacă ditr-o populaţie ormal repartizată cu media m şi dispersia se extrage u eşatio de mărime {x, x,..., x }, atuci media sodajului x + x3 + K + x (9.6.) x =, cosiderată ca variabilă aleatoare de sodaj, se repartizează ormal cu media m şi dispersia. Aceasta coduce la faptul că variabila aleatoare

8 Sodajul statistic - 9 x m (9.6.) z = se repartizează ormal, cu media 0 şi dispersia. Fie dată o probabilitate de îcredere P = -. Atuci se poate determia o valoare z astfel ca : z (9.6.3) < < = z P( z z z ) e dz = φ(z ) = P =, π z ude φ este fucţia lui Gauss-Laplace.Iegalitatea (9.6.4) -z < z < z devie, ţiîd seama de repartiţia variabilei statistice z, x m (9.6.5) z < < z, de ude se deduce că: (9.6.6) x z cu z soluţie a ecuaţiei φ(z ) = -. < m < x + z, Dacă se cuoaşte dispersia a populaţiei statistice cercetate, ormal distribuite, pe baza datelor de sodaj, aceasta poate fi estimată pri formula : ( xi x) i= (5.6.7) s =. Cosiderâd estimatorul de mai sus ca o variabilă aleatoare de sodaj se poate costrui variabila aleatoare ( mărimea ) de sodaj x m (9.6.8) t =, s

9.6. Testarea ipotezelor statistice. Fudametarea deciziilor bazate pe date de sodaj 9 care se repartizează după legea studet (legea t, cum se mai otează o variabilă aleatoare de repartiţie studet) [3] cu - grade de libertate. Fie S - (x) fucţia de repartiţie asociată uei variabile aleatoare de repartiţie studet cu - grade de libertate, şi t soluţia ecuaţiei: (9.6.9) S( t ) =, atuci se obţie petru media m a populaţiei geerale itervalul de îcredere de forma: s s (5.6.0) x t < m < x + t. Exemplul. Î procesul de recepţie ce urmăreşte caracteristica de calitate a uui produs fiit se extrage u eşatio format di trei produse. S-au obţiut măsurătorile: x =,, x =,4, x 3 =,3. Di cercetări aterioare se cuoaşte că dispersia caracteristicii de calitate la acest produs este =0,056. Să se costruiască itervalul de îcredere petru medie utilizâd o probabilitate de îcredere P = - = 0,95 (u ivel de semificaţie = 0,05) [6]. Rezolvare. Utilizâd tabelele cu fucţia lui Laplace, obţiem petru ecuaţia φ(z) = 0,95 soluţia z 0,05 =,96. Pri relaţiile (9.6.3) - (9.6.6) obţiem că: 0,6 0,6 P x,96 m x +,96 = 0,95 3 3, +,3 +,4 Media de sodaj petru eşatioul extras este x = =, 3. 3 Î geeral, itervalul 0,6 0,6 x,96, x +,96 = + 3 3 ( x 0,8, x 0,8) este u iterval aleator, deoarece media de sodaj este o variabilă aleatoare (variază de la u sodaj la altul). Ceea ce putem afirma, î urma datelor obţiute pri eşatioul extras, este că, î itervalul (,9,,48) se va găsi valoarea medie reală a parametrului m cu probabilitatea 0,95. Petru a cotrola aumite feomee statistice este ecesar să se verifice aumite ipoteze statistice referitoare la dispersia a uei populaţii statistice. Î costruirea uui iterval de îcredere petru dispersia a uei populaţii ormale se

0 Sodajul statistic - 9 utilizează repartiţia χ s şi faptul că variabila aleatoare X = se repartizează după o lege χ cu - grade de libertate [4],[0]. O variabilă aleatoare cotiuă are o repartiţie χ de parametrii şi dacă desitatea sa de repartiţie este dată pri relaţia (9.6.). O proprietate eseţială a acestei repartiţii de probabilitate, care o face utilă î statistică este aceea că, fiid date variabile aleatoare idepedete de repartiţie ormală redusă, atuci suma pătratelor lor este o variabilă aleatoare de repartiţie χ, de parametri şi =. x x e Petru x 0, > 0, (9.6.) d(x) = Γ 0 Petru x < 0 Fiid dată probabilitatea de îcredere P = - se pot determia două valori χ şi χ.astfel îcât să avem: (9.6.) s P χ < < χ = sau, î mod echivalet, s s (9.6.3) P = < <. χ χ Se obţie itervalul de îcredere petru dispersia, sub forma: s (9.6.4) s < <, χ χ ude χ = χ satisface ecuaţia P χ > χ =, iar χ = χ satisface relaţia P χ > χ =. Î cotiuare e vom referi la testarea ipotezelor statistice petru uele caracteristici referitoare la calitatea produselor.

9.6. Testarea ipotezelor statistice. Fudametarea deciziilor bazate pe date de sodaj Efectuâd o cercetare statistică asupra proceselor de fabricaţie, se formează o aumită ipoteză cu privire la legea de repartiţie pe care o urmează caracteristicile de calitate şi la parametrii legii de repartiţie formulate. Problema care trebuie testată este aceea dacă, fiid presupusă o repartiţie (lege) teoretică, îtr-adevăr î urma uui experimet de sodaj valorile îregistrate respectă legea presupusă şi dacă valorile parametrilor de sodaj estimează parametrii populaţiei geerale cercetate. Pri ipoteză statistică îţelegem presupuerea care se face la legea de repartiţie pe care o urmează o variabilă statistică şi cu privire la parametrii uei legi de repartiţie. Petru o ipoteză statistică ce urmează să fie verificată se foloseşte termeul de ipoteză ulă H 0. Verificarea ipotezei H îseamă, de fapt, verificarea a cel puţi ipoteze, H şi o H. Pot apare diverse situaţii ditre care meţioăm: - Dacă ipoteza H costă î faptul că parametrul al uei repartiţii ormale este = 0 şi alterativa ei o H costă î faptul că =, atuci spuem că se verifică o ipoteză simplă cu alterativă simplă. - Dacă îsă ipoteza H costă î = 0 şi ipoteza o H î {,,..., k } se spue că se verifică o ipoteză simplă cu alterativă compusă. Verificarea ipotezelor statistice costă î stabilirea uor reguli care precizează codiţiile î care se cosideră că ipoteza u cocordă cu realitatea şi trebuie respisă. Procedeul pri care se verifică o ipoteză statistică se umeşte test sau criteriu. Petru a accepta sau respige o ipoteză statistică H, se efectuează u experimet pri care s-au realizat, de exemplu, observaţii, î urma cărora s-au îregistrat măsurătorile x, x,..., x. Relativ la u sodaj de volum fixat şi o ipoteză statistică H, corespude o partiţie a spaţiului euclidia R,de forma: (9.6.5) R = W W*, W W* = φ, astfel îcît dacă x = (x, x,..., x ) W* ipoteza se acceptă, iar dacă x W ipoteza se respige. Să cosiderăm, ca exemplu, u lot de produse di care orice produs poate fi corespuzător calitativ sau rebut. Lotul este admis de beeficiar dacă procetul produselor rebutate este mai mic decât u umăr P 0. Procetul de rebut cupris î îtregul lot, ecuoscut de altfel, poate fi estimat pe baza uui sodaj extras di lot. Fiecărui sodaj îi asociem u puct x = (x, x,..., x ) R cu x i = dacă produsul de rag i este rebut, şi x i = 0, dacă produsul de rag i este corespuzător, i =,. Î acest caz mulţimea W, umită şi mulţime critică, este defiită pri: W = K : xi 00 > P0. i= (9.6.6) x = ( x, x, x )

Sodajul statistic - 9 La admiterea sau respigerea uei ipoteze statistice se pot face două tipuri de erori, umite de geul îtâi şi respectiv de geul doi. Se comite o eroare de geul îtâi, atuci câd ipoteza H se respige î timp ce ea este justă şi se comite o eroare de geul al doilea, atuci câd se acceptă ipoteza H î timp ce ea este falsă. Î practică, determiarea regiuii critice W a uui test se face pe baza uei statistici S(x, x,..., x ). Dacă este fixată probabilitatea a erorii de geul îtâi şi regiuea critică este defiită de mulţimea W, atuci avem : (9.6.7) P[{(x, x,..., x ) W H adevărată}]=. Probabilitatea erorii de geul doi β se exprimă pri: (9.6.8) P[{(x, x,..., x ) W* o H}] = β, ude o H este ipoteza alterativă a ipotezei H. Î practică, probabilităţile şi β de a comite erori trebuie să fie cât mai mici, ceea ce îseamă că putem să e aşteptăm ca aceste erori să u se producă. Importat este de a găsi cea mai buă regiue critică W petru care probabilităţile, β iau cele mai mici valori. Î practica verificării ipotezelor statistice referitoare la cotrolul statistic al calităţii loturilor de produse, probabilitatea de comitere a erorii de geul îtâi se umeşte riscul furizorului (sau producătorului), iar probabilitatea β de comitere a erorii de geul al doilea se umeşte riscul beeficiarului sau riscul cumpărătorului. Probabilitatea Π de respigere a uei ipoteze statistice pe baza uui test de verificare se umeşte puterea testului. Aceasta se exprimă pri relaţia: (9.6.0) = P[ ( x, x, K x ) W oh ] = β. Dacă ipoteza H este justă, atuci puterea testului trebuie să fie cât mai mică. Dacă ipoteza H este falsă, atuci puterea testului trebuie să fie cât mai mare. Verificarea ipotezelor costă, de fapt, î stabilirea regulii după care ipoteza se respige pe baza testului. Aceasta impue cuoaşterea repartiţiei statisticii alese drept test de verificare şi stabilirea probabilităţii de comitere a uei erori de gradul îtâi, umită prag de semificaţie care, de obicei, are ca valori practice 0,05, 0,0, 0,0. Petru gradul de semificaţie ales se defieşte regiuea critică. Dacă valoarea statisticii cade î această regiue, ipoteza trebuie respisă, îsemâd că s-a produs u feome atât de puţi probabil îcât poate fi cosiderat practic imposibil. Complemetara regiuii critice este regiuea valorii admise. Dacă valoarea statisticii cade î această regiue ipoteza trebuie respisă, îsemâd că s-a produs u feome atât de puţi probabil îcât poate fi cosiderat practic imposibil. Complemetara regiuii critice este regiuea valorilor admise. Dacă valoarea statisticii cade î această regiue îseamă că valoarea statisticii u cotrazice ipoteza şi aceasta poate fi