Statisticǎ - curs 4. 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2

Σχετικά έγγραφα
Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

8 Intervale de încredere

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

9 Testarea ipotezelor statistice

Metode iterative pentru probleme neliniare - contractii

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

Curs 4 Serii de numere reale

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

Asupra unei inegalităţi date la barajul OBMJ 2006

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Subiecte Clasa a VIII-a

Sisteme diferenţiale liniare de ordinul 1

Integrala nedefinită (primitive)

Subiecte Clasa a VII-a

MARCAREA REZISTOARELOR

Metode de interpolare bazate pe diferenţe divizate

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Curs 1 Şiruri de numere reale

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

7 Distribuţia normală

TESTAREA IPOTEZELOR STATISTICE

Scoruri standard Curba normală (Gauss) M. Popa

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Curs 2 Şiruri de numere reale

NOTIUNI DE BAZA IN STATISTICA

riptografie şi Securitate

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Principiul Inductiei Matematice.

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

DistributiiContinue de Probabilitate Distributia Normala

Problema a II - a (10 puncte) Diferite circuite electrice

Câmp de probabilitate II

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,


Cursul Măsuri reale. D.Rusu, Teoria măsurii şi integrala Lebesgue 15

a. 11 % b. 12 % c. 13 % d. 14 %

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2016 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Examen AG. Student:... Grupa:... ianuarie 2011

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Recapitulare - Tipuri de date

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Cum folosim cazuri particulare în rezolvarea unor probleme

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Criptosisteme cu cheie publică III

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

Ecuatii exponentiale. Ecuatia ce contine variabila necunoscuta la exponentul puterii se numeste ecuatie exponentiala. a x = b, (1)

CONCURS DE ADMITERE, 17 iulie 2017 Proba scrisă la MATEMATICĂ

Seminar 5 Analiza stabilității sistemelor liniare

Lp 8 Rezumat. Capitolul 6. PROBLEMA TESTĂRII IPOTEZELOR Ipoteză ştiinţifică - Ipoteză statistică Ipoteză ştiinţifică

Tranzistoare bipolare şi cu efect de câmp

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

Statisticǎ - notiţe de curs

Exemple de probleme rezolvate pentru cursurile DEEA Tranzistoare bipolare cu joncţiuni

V O. = v I v stabilizator

Laborator 11. Mulţimi Julia. Temă

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

5.4. MULTIPLEXOARE A 0 A 1 A 2

Distribuţia binomială Teste statistice neparametrice nominale. M. Popa

Ecuatii trigonometrice

Concurs MATE-INFO UBB, 1 aprilie 2017 Proba scrisă la MATEMATICĂ

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB


POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

Examen AG. Student:... Grupa: ianuarie 2016

Functii Breviar teoretic 8 ianuarie ianuarie 2011

Conice - Câteva proprietǎţi elementare

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

4. Măsurarea tensiunilor şi a curenţilor electrici. Voltmetre electronice analogice

Capitolul 2 - HIDROCARBURI 2.4.ALCADIENE

1. PROPRIETĂȚILE FLUIDELOR

z a + c 0 + c 1 (z a)

Lucrare. Varianta aprilie I 1 Definiţi noţiunile de număr prim şi număr ireductibil. Soluţie. Vezi Curs 6 Definiţiile 1 şi 2. sau p b.

Criterii de comutativitate a grupurilor

Esalonul Redus pe Linii (ERL). Subspatii.

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

CURS XI XII SINTEZĂ. 1 Algebra vectorială a vectorilor liberi

1.3 Baza a unui spaţiu vectorial. Dimensiune

I3: PROBABILITǍŢI - notiţe de curs

GEOMETRIE PLANĂ TEOREME IMPORTANTE ARII. bh lh 2. abc. abc. formula înălţimii

PRELEGEREA XII STATISTICĂ MATEMATICĂ

I3: PROBABILITǍŢI - notiţe de curs

CURS VII-IX. Capitolul IV: Funcţii derivabile. Derivate şi diferenţiale. 1 Derivata unei funcţii. Interpretarea geometrică.

Seminar Algebra. det(a λi 3 ) = 0

prin egalizarea histogramei

Transcript:

Statisticǎ - curs 4 Cuprins 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2 2 Inferenţǎ statisticǎ privind media populaţiei dacǎ se cunoaşte abaterea standard a populaţiei 5 3 Inferenţǎ statisticǎ privind media populaţiei dacǎ nu se cunoaşte abaterea standard a populaţiei 10 4 Inferenţǎ relativǎ la varianţǎ şi estimarea varianţei 17 1

1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice Candidatul la admitere Popescu Nicolae trebuie sǎ completeze un formular test cu zece întrebǎri. Fiecare întrebare are cinci rǎspunsuri dintre care doar unul este corect. Popescu Nicolae a completat formularul şi din cele zece întrebǎri el a rǎspuns corect la şapte. El susţine cǎ a completat formularul fǎrǎ sǎ citeascǎ întrebǎrile şi rǎspunsurile la ele şi a marcat rǎspunsurile aleator. Întrebarea este în ce mǎsurǎ putem da crezare spuselor cǎ el a marcat rǎspunsurile aleator? O asemenea întrebare ne determinǎ sǎ analizǎm şi sǎ hotǎrâm: este sau nu este rezonabil ca Popescu Nicolae sǎ obţinǎ şapte rǎspunsuri corecte alegând aleator rǎspunsurile la întrebǎri? Verificarea ipotezelor statistice, în general, este un procedeu care are 5 etape. Etapa 1. Formularea ipotezei nule H 0 Prin ipotezǎ înţelegem o afirmaţie care susţine cǎ ceva este adevǎrat. În general, ipoteza nulǎ este o afirmaţie relativǎ la un parametru al unei populaţii şi afirmǎ cǎ parametrul are o valoare datǎ. Adesea expresia nu diferǎ este folositǎ în formularea ei, de aici vine numele de ipotezǎ nulǎ. (diferenţa este nulǎ) Etapa 2. Formularea ipotezei alternative H a Ipoteza alternativǎ H a este o afirmaţie relativǎ la acelaşi parametru al populaţiei care apare în ipoteza nulǎ H 0. În ipoteza H a se afirmǎ cǎ parametrul are o valoare diferitǎ de cea susţinutǎ în H 0. În cazul exemplului considerat, aserţiunea care trebuie analizatǎ este: Popescu a completat formularul aleator. Populaţia este o mulţime de 5 10 elemente (distincte). Un element este un sistem ordonat de 10 rǎspunsuri (R i 1, R i 2,..., R i 10 ), i 1, i 1,..., i 10 {1, 2, 3, 4, 5}; R i 1 este unul din cele cinci rǎspunsuri posibile la prima întrebare,..., R i 10 este unul din cele cinci rǎspunsuri posibile la cea de-a zecea întrebare. Pentru o persoanǎ care marcheazǎ rǎspunsurile aleator (fǎrǎ sǎ le citeascǎ), toate rǎspunsurile sunt egal posibile. Altfel spus fiecare din cele cinci rǎspunsuri la o întrebare are aceeaşi şansǎ ca sǎ fie corect. Din afirmaţia lui Popescu Nicolae rezultǎ cǎ el a marcat rǎspunsurile aleator, deci a admis cǎ probabilitatea (parametrul p) este 1 element al populaţiei. Ipoteza nulǎ este: H 0 : p(x) = 1 = p pentru orice Popescu Nicolae a completat 510 element X al populaţiei formularul aleator. Ipoteza alternativǎ este: pentru fiecare 510 H a : existǎ douǎ elemente X 1, X 2 în populaţie Popescu Nicolae nu a completat pentru care p(x 1 ) p(x 2 ) formularul aleator 2

Se admite cǎ ipoteza nulǎ este adevǎratǎ, iar în etapa a 5-a a verificǎrii ipotezelor, vom lua una din cele douǎ decizii posibile: vom decide în concordanţǎ cu ipoteza nulǎ H 0 şi spunem cǎ acceptǎm H 0 sau decidem în concordanţǎ cu H a şi spunem cǎ respingem ipoteza H 0. Situaţia poate fi comparatǎ cu un proces la judecǎtorie, în care acuzatul este presupus nevinovat pânǎ când se dovedeşte contrariul. Doar Deciziile care se iau sunt prezentate în tabelul urmǎtor: Decizia Ipoteza H 0 este Adevǎratǎ Falsǎ Nu respingem H 0 decizie eroare (acceptǎm) corectǎ Tip A Tip II Respingem H 0 eroare decizie corectǎ Tip I Tip B Ar fi foarte frumos ca de fiecare datǎ când luǎm decizii sǎ luǎm decizii corecte, dar aceasta este statistic imposibil pentru cǎ ne bazǎm pe informaţii furnizate de eşantioane. Cel mai bun lucru la ce putem spera este sǎ controlǎm riscul sau probabilitatea de a comite o eroare: Eroarea Tipul de eroare Probabilitate Respingerea unei ipoteze adevǎrate I α Acceptarea unei ipoteze false II β Etapa 3 Metodologia de verificare a ipotezelor: aceasta constǎ din (1) identificarea unui test statistic; (2) specificarea nivelului de semnificaţie; (3) determinarea regiunii critice. (1) Un test statistic este o variabilǎ aleatoare folositǎ pentru a respinge sau nu ipoteza H 0. Testul statistic este o statisticǎ de eşantioane sau alte valori rezultate dintr-un eşantion. Probabilitǎţile care apar în acest test statistic sunt determinate presupunând cǎ H 0 este adevǎratǎ. În cazul exemplului considerat, variabila aleatoare X= numǎrul de rǎspunsuri corecte este folosit ca test statistic. Probabilitǎţile pentru fiecare valoare x ale variabilei X în ipoteza cǎ H 0 este adevǎratǎ sunt date în tabelul urmǎtor: X 0 1 2 3 4 5 P(X) 0.1074 0.2684 0.302 0.20133 0.0881 0.0264 X 6 7 8 9 10 P(X) 0.0055 7.92 10 4 7.38 10 5 4.098 10 6 1.02 10 7 Aceastǎ repartiţie aratǎ cǎ probabilitatea sǎ ghiceşti rǎspunsul corect la 5 sau mai multe întrebǎri este 0.0327, iar la 4 sau mai puţin decât 4 întrebǎri este 0.9673. Putem spune cǎ apariţia valorilor 5, 6, 7, 8, 9, 10 nu susţine ipoteza H 0. 3

(2) Nivelul de semnificaţie este probabilitatea α de a face o eroare de tip I, adicǎ de a respinge H 0 adevǎrat. În mod curent α se dǎ la început şi acesta determinǎ regiunea criticǎ. (3) Regiunea criticǎ: este mulţimea de valori (W ) pentru care P (X W ) α şi care ne determinǎ sǎ respingem ipoteza H 0. (nu susţin ipoteza H 0 ) În cazul exemplului, dacǎ α = 0.033, atunci din P (x 5) = 0.0327 rezultǎ regiunea criticǎ x = 5, 6, 7, 8, 9, 10. Valoarea criticǎ: este prima valoare din regiunea criticǎ. Dacǎ pentru un eşantion valoarea testului statistic X depǎşeşte valoarea criticǎ ipoteza H 0 este respinsǎ. Etapa 4. Determinarea valorii testului statistic Dupǎ ce am parcurs etapele 1,2,3 observǎm sau calculǎm valoarea x a testului statistic. În cazul exemplului x = 7 (numǎrul de rǎspunsuri corecte) este valoarea testului statistic şi este dat. Uzual valoarea testului statistic se calculeazǎ pe baza informaţiilor oferite de eşantion. Etapa 5. Luarea unei decizii şi interpretarea ei Decizia se ia comparând valoarea testului statistic determinatǎ la Etapa 4 cu regiunea criticǎ gǎsitǎ la Etapa 3. Regula de decizie: Dacǎ valoarea testului statistic este în regiunea criticǎ respingem ipoteza H 0, dacǎ nu, atunci acceptǎm ipoteza H 0. Ansamblul de valori ale testului statistic care nu sunt în regiunea criticǎ formeazǎ regiunea de acceptabilitate. Testul este terminat prin luarea şi justificarea deciziei luate. În cazul exemplului: x = 7 este în regiunea criticǎ şi respingem ipoteza H 0. Cu aceasta nu am demonstrat cǎ Popescu Nicolae nu a ghicit cele 7 rǎspunsuri. Am arǎtat doar cǎ dacǎ el le-a ghicit este foarte norocos pentru cǎ acesta este un eveniment rar şi are probabilitatea cel mult 0.033. 4

2 Inferenţǎ statisticǎ privind media populaţiei dacǎ se cunoaşte abaterea standard a populaţiei Urmǎtoarele trei exemple se referǎ la diferite formulǎri ale ipotezei H 0 şi a ipotezei H a. Exemplul 1: Un ecologist susţine cǎ oraşul Timişoara are o problemǎ privind poluarea aerului. Concret, el susţine ca nivelul mediu al monoxidului de carbon în aer în centrul oraşului depǎşeşte valoarea 4, 9/10 6 = valoarea medie normalǎ. Pentru a formula în acest caz, ipotezele H 0 şi H a, trebuie sǎ identificǎm: populaţia: mulţimea locurilor din centrul oraşului Timişoara; parametrul populaţiei în cauzǎ şi valoarea cu care aceasta urmeazǎ sǎ fie comparatǎ: variabila X este concentraţia monoxidului de carbon ale cǎrei valori x variazǎ în funcţie de loc, iar parametrul populaţiei este valoarea medie µ a acestei variabile. Valoarea specificǎ cu care aceastǎ medie trebuie comparatǎ este 4, 9/10 6 egalǎ cu valoarea (medie) normalǎ. Ecologistul susţine cǎ µ > 4, 9/10 6. Pentru a formula ipoteza H 0 şi ipoteza H a reamintim cǎ: 1) În general, ipoteza H 0 susţine cǎ media µ (parametrul în chestiune) are o valoare specificǎ anume. 2) Inferenţa privind media µ a populaţiei se bazeazǎ pe media unui eşantion şi mediile eşantioanelor au o distribuţie aproximativ normalǎ. (conform teoremei limitǎ centralǎ). 3) O distribuţie normalǎ este complet determinatǎ dacǎ valoarea medie şi deviaţia standard a distribuţiei sunt cunoscute. Cele de mai sus sugereazǎ cǎ afirmaţia µ = 4, 9/10 6 ar trebui sǎ fie ipoteza nulǎ şi afirmaţia µ > 4, 9/10 6 ar trebui sǎ fie ipoteza alternativǎ: H 0 : µ = 4, 9/10 6 H a : µ > 4, 9/10 6 Exemplul 2. Camera de Comerţ susţine cǎ nivelul mediu al monoxidului de carbon în centrul oraşului Timişoara este mai mic decât 4, 9/10 6 (valoare normalǎ). Aceasta este o reclamǎ bunǎ pentru turism. Parametrul este media µ a repartiţiei monoxidului de carbon, iar ipotezele H 0, H a pot fi: H 0 : µ = 4, 9/10 6 H a : µ < 4, 9/10 6 Exemplul 3. O a treia aserţiune (mai neutrǎ) susţine doar cǎ nivelul mediu µ al monoxidului de carbon în aerul din centrul oraşului Timişoara este diferit de 4, 9/10 6 (valoarea normalǎ diferitǎ de µ). În acest caz: H 0 : µ = 4.9/10 6 şi H a : µ 4, 9/10 6 5

Cele trei exemple aratǎ cǎ aserţiunea care trebuie analizatǎ determinǎ într-un anumit sens formularea ipotezelor H 0, H a. Mai exact: în aceste cazuri aserţiunea susţine cǎ valoarea parametrului µ este diferitǎ de cea normalǎ, iar ipoteza nulǎ susţine cǎ este aceeaşi (nu diferǎ). În cazul acestor exemple, cei care îşi formuleazǎ aserţiunea se aşteaptǎ la respingerea ipotezei nule H 0 şi la acceptarea ipotezei alternative H a care este o afirmaţie conformǎ cu aserţiunea lor. Situaţiile de la procesele juridice prezintǎ o oarecare asemǎnare cu cele relatate. Dacǎ procurorul nu crede în vinovǎţia inculpatului nu intenteazǎ proces (ipoteza H 0 prezumţia de nevinovǎţie este presupusǎ adevǎratǎ). Procesul se declanşeazǎ doar dacǎ procurorul are suficiente probe pentru a face proces. Şi în statisticǎ dacǎ experimentatorul crede în ipoteza H 0 nu face test pentru investigarea lui H 0. El testeazǎ ipoteza nulǎ doar dacǎ doreşte sǎ arate cǎ H a este corectǎ. Exemplul care urmeazǎ ilustreazǎ toate cele cinci etape de verificare a ipotezelor statistice în cazul unei aserţiuni care se referǎ la media unei populaţii. Exemplul 4. Un profesor a înregistrat pe mai mulţi ani rezultatul elevilor şi media µ a acestor rezultate este 72 şi abaterea standard este σ = 12. Clasa de 36 de elevi pe care-i învaţǎ la momentul actual are o medie x = 75, 2 (mai ridicatǎ decât media µ = 72) şi profesorul afirmǎ cǎ aceastǎ clasǎ este superioarǎ celor de pânǎ acum. Întrebarea este dacǎ media clasei x = 75, 2 este un argument suficient pentru a susţine afirmaţia profesorului la nivelul de semnificaţie α = 0, 05. Etapa 1. H 0 : µ x = µ = 72 clasa nu este superioarǎ Etapa 2. H a : µ x = µ > 72 clasa este superioarǎ Etapa 3. - Atunci când în ipoteza nulǎ H 0 media populaţiei şi deviaţia standard sunt cunoscute scorul standard z este folosit ca şi test statistic. - Nivelul de semnificaţie α = 0, 05 este dat; - Reamintim cǎ în baza teoremei limitǎ centralǎ distribuţia mediilor eşantioanelor este aproape normalǎ. Prin urmare, distribuţia normalǎ va fi folositǎ pentru determinarea regiunii critice. Regiunea criticǎ este egalǎ cu mulţimea valorilor scorului standard z care determinǎ respingerea ipotezei H 0 şi este situatǎ la extremitatea dreaptǎ a distribuţiei normale. Regiunea criticǎ este la dreapta deoarece valori mari ale mediei eşantionului susţin ipoteza H 0 în timp ce valori apropiate ori sub 72 susţin ipoteza nulǎ. Valoarea criticǎ ce desparte zona valorilor nu este superior de zona valorilor este superior este determinatǎ de probabilitatea α de a comite o eroare de tip I. α = 0, 05 a fost datǎ. Astfel regiunea criticǎ haşuratǎ pe Figura 2. are aria 0, 05 şi valoarea criticǎ t 2 1 1, 65 este soluţia ecuaţiei: e 2 dt = 0, 05. 2 π z 6

Figura 1: Figura 2: Etapa 4. Valoarea testului statistic este dat de: z = x µ σ n = 75, 2 72 12/6 = 1, 6 Etapa 5. Comparǎm valoarea gǎsitǎ 1, 6 cu valoarea criticǎ 1, 65 şi gǎsim 1, 6 < 1, 65. Decizia este cǎ nu putem respinge ipoteza H 0. Testul se încheie cu formularea concluziei. Concluzie: Probele nu sunt suficiente pentru a susţine cǎ actuala clasǎ este superioarǎ claselor anterioare. Pare aceastǎ concluzie realistǎ în condiţiile în care în mod evident, 75, 2 este mai mare ca 72. Nu trebuie sǎ uitǎm x = 75, 2 este media unui eşantion de 36 de indivizi extras dintr-o populaţie cu media µ = 72 şi deviaţia standard σ = 12 şi analiza aratǎ cǎ probabilitatea ca media eşantionului sǎ fie mai mare decât mediile tuturor eşantioanelor este mai mare decât riscul α cu care noi acceptǎm o eroare de tip I. Exemplul 5. La un colegiu s-a stabilit cǎ greutatea medie a studentelor este µ = 54, 4 kg, iar abaterea standard σ = 5, 4 kg. Profesorul de sport nu crede aceastǎ afirmaţie. Pentru a face un test selecţioneazǎ un eşantion aleator de 100 de studente şi gǎseşte cǎ media x = 53, 75 kg. Este aceasta suficient pentru a respinge afirmaţia la nivelul de semnificaţie α = 0, 05? Etapa 1. H 0 : µ = 54, 4 kg Etapa 2. H a : µ 54, 4 kg 7

Etapa 3. - deoarece folosim o distribuţie de medii de eşantioane testul statistic va fi scorul standard. - nivelul α = 0, 05 este dat; - media eşantionului este o estimare a mediei populaţiei. Ipoteza alternativǎ nu este egal este susţinutǎ de medii de eşantioane considerabil mai mari sau considerabil mai mici ca 54, 4. ipoteza nulǎ este susţinutǎ de medii de eşantioane în jurul valorii 54, 4. Regiunea criticǎ este formatǎ din douǎ pǎrţi egale situate la cele douǎ extremitǎţi ale distribuţiei normale. Aria corespunzǎtoare fiecǎrei porţiuni este α şi probabilitatea fiecǎrei pǎrţi a regiunii critice este 0, 025. Rezultǎ 2 ( α ) ( α ) t 2 1 z = 1, 96 z este soluţia ecuaţiei: e 2 dt = α. 2 2 2 π 2 z Figura 3: Etapa 4. Se determinǎ valoarea testului statistic: z = x µ σ n = 1, 204 a cǎrei locaţie este datǎ pe figura urmǎtoare: 8

Figura 4: Reamintim: Dacǎ valoarea testului statistic este în regiunea criticǎ respingem ipoteza H 0 dacǎ nu, nu putem respinge ipoteza H 0. Etapa 5. Valoarea testului statistic nu este în regiunea criticǎ. Decizia: Nu respingem ipoteza H 0. Justificarea deciziei: Valoarea testului nu este în dezacord cu H 0 la nivel de risc α = 0, 05. Aceasta nu înseamnǎ cǎ H 0 este adevǎratǎ. Concluzie: Media x gǎsitǎ de profesor nu contravine ipotezei cǎ media µ este 54,4 kg, când dispersia σ este 5, 4 kg. O decizie de respingere a lui H 0 înseamnǎ cǎ valoarea testului implicǎ cǎ H 0 este falsǎ şi indicǎ H a. 9

3 Inferenţǎ statisticǎ privind media populaţiei dacǎ nu se cunoaşte abaterea standard a populaţiei Pânǎ acum am prezentat douǎ tipuri de inferenţǎ statisticǎ privind media populaţiei: evaluarea intervalului de încredere şi verificarea ipotezelor statistice. În cele douǎ tipuri de inferenţe statistice abaterea standard σ este consideratǎ cunoscutǎ. În general însǎ abaterea standard σ nu este cunoscutǎ. Subiectul acestei secţiuni este inferenţa statisticǎ privind media µ dacǎ abaterea standard σ nu este cunoscutǎ. Dacǎ dimensiunea eşantionului este suficient de mare (în general vorbind, eşantioane a cǎror mǎrimi este mai mare decât n = 30 de date sunt considerate suficient de mari), deviaţia standard s a eşantionului este o estimare bunǎ a deviaţiei standard a populaţiei şi putem susbstitui σ cu s în procedura discutatǎ deja. Dacǎ populaţia pe care o investigǎm este aproape normalǎ şi n 30, atunci procedeul se bazeazǎ pe distribuţia Student t. Distribuţia Student t (sau simplu t distribuţia) este distribuţia statisticii t, definitǎ prin: t = x µ s n În anul 1908 W.S. Gosset un funcţionar la o fabricǎ de bere în Irlanda a publicat o lucrare relativǎ la aceastǎ distribuţie sub pseudonimul Student. În lucrarea lui Gosset se presupune cǎ populaţia este normalǎ. Aceastǎ restricţie s-a dovedit ulterior restrictivǎ, întrucât se obţin rezultate satisfǎcǎtoare şi pentru multe populaţii care nu sunt normale. Ecuaţia care defineşte distribuţia t nu o dǎm aici, doar dǎm câteva proprietǎţi ale lui t: 1) distribuţia t are media 0; 2) distribuţia t este simetricǎ faţǎ de medie; 3) distribuţia t are varianţa supraunitarǎ, dar dacǎ dimensiunea eşantionului creşte, varianţa tinde la 1; 4) distribuţia t în jurul mediei este sub şi departe de medie este deasupra distribuţiei normale; 5) fiecǎrei mǎrimi de eşantion îi corespunde o distribuţie t separatǎ care depinde de mǎrimea eşantionului. Dacǎ mǎrimea eşantionului creşte atunci t- distribuţia tinde la distribuţia normalǎ. 10

Figura 5: Cu toate cǎ pentru fiecare mǎrime de eşantion (n=2,3,4,...) avem o distribuţie t separatǎ completǎ, în practicǎ doar anumite valori critice ale lui t sunt folosite. Aceste valori critice aflate în dreapta mediei sunt redate în tabelul urmǎtor: α 0,40 0,30 0.25 0,20 0,10 0,05 0,025 0,010 0,005 0,001 0,0005 df 1 0,325 0,727 1,000 1,376 3,078 6,314 12,71 31,82 63,66 318,3 636,6 2 0,289 0,617 0,816 1,061 1,886 2,920 4,303 6,965 9,925 22,33 31,60 3 0,277 0,584 0,765 0,978 1,638 2,353 3,182 4,541 5,841 10,22 12,94 4 0,271 0,569 0,741 0,941 1,533 2,132 2,776 3,747 4,604 7,173 8,610 5 0,267 0,559 0,727 0,920 1,476 2,015 2,571 3,365 4,032 5,893 6,859 6 0,265 0,553 0,718 0,906 1,440 1,943 2,447 3,143 3,707 5,208 5,959 7 0,263 0,549 0,711 0,896 1,415 1,895 2,365 2,998 3,499 4,785 5,405 8 0,262 0,546 0,706 0,889 1,397 1,860 2,306 2,896 3,355 4,501 5,041 9 0,261 0,543 0,703 0,883 1,383 1,833 2,262 2,821 3,250 4,297 4,781 10 0,260 0,542 0,700 0,879 1,372 1,812 2,228 2,764 3,169 4,144 4,587 11 0,260 0,540 0,697 0,876 1,363 1,796 2,201 2,718 3,106 4,025 4,437 12 0,259 0,539 0,695 0,873 1,356 1,782 2,179 2,681 3,055 3,930 4,318 13 0,259 0,538 0,694 0,870 1,350 1,771 2,160 2,650 3,012 3,852 4,221 14 0,258 0,537 0,692 0,868 1,345 1,761 2,145 2,624 2,977 3,787 4,140 15 0,258 0,536 0,691 0,866 1,341 1,753 2,131 2,602 2,947 3,733 4,073 16 0,258 0,535 0,690 0,865 l,337 1,746 2,120 2,583 2,921 3,686 4,015 11

α 0,40 0,30 0,25 0,20 0,10 0,05 0,025 0,010 0,005 0,001 0,0005 df 17 0,257 0,534 0,689 0,863 1,333 1,740 2,110 2,567 2,898 3,646 3,965 18 0,257 0,534 0,688 0,862 1,330 1,734 2,101 2,552 2,878 3,611 3,922 19 0,257 0,533 0,688 0,861 1,328 1,729 2,093 2,539 2,861 3,579 3,883 20 0,257 0,533 0,687 0,860 1,325 1,725 2,086 2,528 2,845 3,552 3,850 21 0,257 0,532 0,686 0,859 1,323 1,721 2,080 2,518 2,831 3,527 3,819 22 0,256 0,532 0,686 0,858 1,321 1,717 2,074 2,508 2,819 3,505 3,792 23 0,256 0,532 0,685 0,858 1,319 1,714 2,069 2,500 2,807 3,485 3,767 24 0,256 0,531 0,685 0,857 1,318 1,711 2,064 2,492 2,797 3,467 3,745 25 0,256 0,531 0,684 0,856 1,316 1,708 2,060 2,485 2,787 3,450 3,725 26 0,256 0,531 0,684 0,856 1,315 1,706 2,056 2,479 2,779 3,435 3,707 27 0,256 0,531 0,684 0,855 1,314 1,703 2,052 2,473 2,771 3,421 3,690 28 0,256 0,530 0,683 0,855 1,313 1,701 2,048 2,467 2,763 3,408 3,674 29 0,256 0,530 0,683 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,659 z 0,256 0,530 0,674 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646 Figura 6: În acest tabel df are valorile de la 1 la 29 şi este numǎrul gradelor de libertate. Apropierea valorilor din liniile corespunzǎtoare lui df = 29 şi z se datoreazǎ faptului cǎ dacǎ n 30 distribuţia t este cea normalǎ (teorema limitǎ centralǎ). Gradul de libertate df este un parametru statistic care este greu de definit. El este un indice care se foloseşte pentru a identifica distribuţia care trebuie folositǎ. În consideraţiile noastre df = n 1, unde n este mǎrimea eşantionului. Valoarea criticǎ a testului t care trebuie folositǎ în estimarea intervalului de încredere precum şi în verificarea ipotezelor statistice se obţine din tabelul prezentat. Pentru a obţine aceastǎ valoare este nevoie de a cunoaşte: 1) df - numǎrul gradelor de libertate; 2) α aria determinatǎ de curba de repartiţie aflatǎ în dreapta valorii critice. Aceastǎ valoare este notatǎ t(df, α). 12

Exemplul 3.1. Determinaţi t(10, 0.05) din tabel. Avem df = 10 şi α = 0.05, deci t(10, 0.05) = 1.81. Valorile critice ale testului statistic t aflate în stânga mediei se obţin cu formula: t(df, α), ţinând seama de simetria distribuţiei t. Figura 7: Se observǎ uşor cǎ t(df, α) = t(df, 1 α). Astfel: t(df; 0, 05) = t(df; 0, 95). Exemplul 3.2. Determinaţi t(15; 0, 95). Avem: t(15; 0, 95) = t(15; 0, 05) = 1, 75. Figura 8: Statistica t este folositǎ în verificarea ipotezelor statistice privind aserţiuni relative la media µ de aceeaşi manierǎ ca şi statistica z. Exemplul 6. Revenim la exemplul relativ la poluarea aerului; punctul de vedere al ecologistului este: nivelul monoxidului de carbon în aer este mai mare decât 4, 9/10 6. Un eşantion de 25 de determinǎri cu media x = 5, 1/10 6 şi s = 2, 1/10 6 este un argument suficient pentru a susţine afirmaţia? Se foloseşte nivelul de semnificaţie α = 0, 05. Etapa 1. H 0 : µ = 4, 9/10 6 Etapa 2. H a : µ > 4, 9/10 6 Etapa 3. α = 0, 05; df = 25 1 = 24 şi t(24; 0, 05) = 1, 71 din tabel. 13

Etapa 4. Etapa 5. t = x µ s n = 5, 1 4, 9 2, 1/ 25 = 0, 20 0, 42 = 0, 476 0, 48 Decizia: Nu putem respinge H 0 (t nu este în regiunea criticǎ). Concluzie: Nu avem suficiente argumente pentru ca sǎ respingem ipoteza cǎ nivelul monoxidului de carbon este 4, 96/10 6. Figura 9: Dacǎ valoarea df (df = n 1) este mai mare ca 29, atunci valoarea criticǎ a lui t(df, α) este foarte apropiatǎ de z(α) (scorul z este listat la capǎtul tabelului) şi prin urmare în loc de t(df, α) se foloseşte z(α). Deoarece tabelul considerat conţine doar valorile critice ale distribuţiei t, p-valoarea nu poate fi gǎsitǎ din tabel în cazul verificǎrii ipotezei statistice pentru cǎ aceasta necesitǎ distribuţia t completǎ. P-valoarea poate fi însǎ estimatǎ folosind tabelul. Sǎ revenim la unul din exemplele precedente. Reţinem t = 0, 48, df = 24 şi H a : µ > 49. Astfel pentru a rezolva problema folosind varianta probabilistǎ pentru Etapa 5 cu p- valoarea avem: p = P (t > 0, 48, ştiind df = 24) Figura 10: 14

Rândul df = 24 din tabel aratǎ cǎ p-valoarea este mai mare ca 0, 25. Valoarea 0, 685 din tabel aratǎ cǎ P (t > 0, 685) = 0, 25 aşa cum aratǎ figura urmǎtoare: Figura 11: Comparând t = 0, 48, vedem cǎ p valoarea este mai mare ca 0, 25. Figura 12: Exemplul 3.3. Sǎ se determine p valoarea pentru urmǎtoarea ipotezǎ statisticǎ: în condiţiile în care df = 15 şi t = 1, 84. H 0 : µ = 55 H a : µ 55 Soluţie: p = P (t < 1, 84) + P (t > 1, 84) = 2 P (t > 1, 84). Rândul df = 15 din tabel aratǎ cǎ P (t > 1, 84) este între 0, 025 şi 0, 05. Prin urmare avem: 0, 05 < p < 0, 10. 15

Media populaţiei poate fi estimatǎ dacǎ σ este necunoscut de o manierǎ similarǎ cu cazul σ cunoscut. Diferenţa este cǎ se foloseşte distribuţia t în loc de distribuţia z şi deviaţia standard s ca estimare a lui σ. Formula pentru intervalul de încredere 1 α este: unde df = n 1. ( x t(df, α 2 ) s n, x + t(df, α 2 ) ) s n Exemplul 7. În cazul unui eşantion aleator de 20 de noi nǎscuţi, media greutǎţii lor este 3, 4 kg şi deviaţia standard este 0, 9 kg. Sǎ se estimeze cu o încredere de 95% media greutǎţii noilor nǎscuţi. Soluţie: x = 3, 4 kg, s = 0, 9 kg şi n = 20, iar 1 α = 0, 95, implicǎ: α = 0, 05; df = 19, iar din tabel gǎsim: t(19; 0, 025) = 2, 09. Capetele intervalului sunt: x ± t(19; 0, 025) 3, 4 ± 2, 09 Intervalul de încredere de 95% este (2, 94; 3, 86). s = 3, 4 ± 2, 09 0, 9 n 20 0, 9 = 3, 4 ± 0, 46 4, 472 16

4 Inferenţǎ relativǎ la varianţǎ şi estimarea varianţei Adesea se pun probleme care cer sǎ facem inferenţǎ asupra varianţei. De exemplu, o companie de produse rǎcoritoare are o maşinǎ de îmbuteliat, care umple cu rǎcoritoare butelii de 0, 32 l= 32 cl. Cantitatea medie pusǎ în fiecare butelie este importantǎ, dar cantitatea medie corectǎ nu asigurǎ cǎ maşina lucreazǎ corect. Dacǎ varianţa este mare, vor fi multe butelii care sunt prea umplute şi multe butelii care nu sunt bine umplute. De aceea, compania doreşte sǎ controleze varianţa σ 2 a cantitǎţii x de rǎcoritoare pusǎ în fiecare butelie şi sǎ menţinǎ varianţa la un nivel cât mai scǎzut posibil. Vom prezenta în aceastǎ secţiune o inferenţǎ privind varianţa unei populaţii. Adesea în cazul acestei inferenţe se vorbeşte despre deviaţia standard în loc de varianţǎ. Trebuie sǎ subliniem cǎ deviaţia standard este rǎdǎcinǎ pǎtratǎ a varianţei; aşadar a vorbi despre varianţǎ este comparabil cu a vorbi despre deviaţie standard. Sǎ revenim la exemplul companiei de produse rǎcoritoare. Sǎ ne imaginǎm cǎ aceastǎ companie doreşte sǎ detecteze când variabilitatea cantitǎţii de rǎcoritoare pusǎ în fiecare butelie scapǎ de sub control. O varianţǎ de 0, 0004 este consideratǎ acceptabilǎ şi compania va regla maşina de îmbuteliat dacǎ varianţa devine mai mare decât aceastǎ valoare. Decizia va fi luatǎ folosind verificarea ipotezelor statistice. Ipoteza H 0 este cǎ varianţa are valoarea 0, 0004, iar ipoteza H a este cǎ varianţa depǎşeşte valoarea 0, 0004: H 0 : σ 2 = 0, 0004 (varianţa este controlatǎ) H a : σ 2 > 0, 0004 (varianţa nu este controlatǎ) Testul statistic care va fi folosit pentru a lua o decizie asupra ipotezei H 0 este testul χ 2. Valoarea calculatǎ a lui χ 2 se va obţine folosind formula: χ 2 = n s2 σ 2 unde s 2 este varianţa eşantionului, n este mǎrimea eşantionului, iar σ 2 este valoarea specificatǎ în ipoteza nulǎ. Dacǎ se ia un eşantioane de mǎrime n dintr-o populaţie normalǎ, având variantǎ σ 2, atunci cantitatea n s 2 /σ 2 are o distribuţie care se numeşte distribuţia χ 2. Formula care defineşte distribuţia χ 2 nu o vom da aici, dar pentru a folosi distribuţia χ 2, prezentǎm urmǎtoarele proprietǎţi ale acesteia: 1. distribuţia χ 2 are valori nenegative, este zero sau este pozitivǎ; 2. distribuţia χ 2 nu este simetricǎ, este asimetricǎ la dreapta; 3. existǎ mai multe repartiţii χ 2. Ca şi pentru distribuţiile t existǎ o distribuţie χ 2 pentru fiecare grad de libertate. Inferenţa pe care o discutǎm aici se referǎ la cazul df = n 1. Valorile critice ale lui χ 2 sunt date în tabelul urmǎtor: 17

df 0.995 0.990 0.975 0.950 0.900 0.10 0.05 0.025 0.01 0.005 2 0.01 0.020 0.050 0.103 0.211 4.61 6.0 7.38 9.21 10.6 3 0.071 0.115 0.216 0.352 0.584 6.25 7.82 9.35 11.4 12.9 4 0.207 0.297 0.484 0.711 1.06 7.78 9.50 11.1 13.3 14.9 5 0.412 0.554 0.831 1.15 1.61 9.24 11.1 12.8 15.1 16.8 6 0.676 0.872 1.24 1.64 2.20 10.6 12.6 14.5 16.8 18.6 7 0.990 1.24 1.69 2.17 2.83 12.0 14.1 16.0 18.5 20.3 8 1.34 1.65 2.18 2.73 3.49 13.4 15.5 17.5 20.1 22.0 9 1.73 2.09 2.70 3.33 4.17 14.7 17.0 19.0 21.7 23.6 10 2.16 2.56 3.25 3.94 4.87 16.0 18.3 20.5 23.2 25.2 11 2.60 3.05 3.82 4.58 5.58 17.2 19.7 21.9 24.7 26.8 12 3.07 3.57 4.40 5.23 6.30 18.6 21.0 23.3 26.2 28.3 13 3.57 4.11 5.01 5.90 7.04 19.8 22.4 24.7 27.7 29.8 14 4.07 4.66 5.63 6.57 7.79 21.1 23.7 26.1 29.1 31.3 15 4.60 5.23 6.26 7.26 8.55 22.3 25.0 27.5 30.6 32.8 16 5.14 5.81 6.91 7.96 9.31 23.5 26.3 28.9 32.0 34.3 17 5.70 6.41 7.56 8.67 10.1 24.8 27.6 30.2 33.4 35.7 18 6.26 7.01 8.23 9.39 10.9 26.0 28.9 31.5 34.8 37.2 19 6.84 7.63 8.91 10.1 11.7 27.2 30.1 32.9 36.2 38.6 20 7.43 8.26 9.59 10.9 12.4 28.4 31.41 34.2 37.6 40.0 21 8.03 8.90 10.3 11.6 13.2 29.6 32.7 35.5 39.0 41.4 22 8.64 9.54 11.0 12.3 14.0 30.8 33.9 36.8 40.3 42.8 23 9.26 10.2 11.0 13.1 14.9 32.0 35.2 38.1 41.6 44.2 24 9.89 10.9 12.4 13.9 15.7 33.2 36.4 39.4 43.0 45.6 25 10.5 11.5 13.1 14.6 16.5 34.4 37.7 40.7 44.3 46.9 26 11.2 12.2 13.8 15.4 17.3 35.6 38.9 41.9 45.6 48.3 27 11.8 12.9 14.6 16.2 18.1 36.7 40.1 43.2 47.0 49.7 28 12.5 13.6 15.3 16.9 18.9 37.9 41.3 44.5 48.3 51.0 29 13.1 14.3 16.1 17.7 19.8 39.1 42.6 45.7 49.6 52.3 30 13.8 15.0 16.8 18.5 20.6 40.3 43.8 47.0 50.9 53.7 40 20.7 22.2 24.4 26.5 29.1 51.8 55.8 59.3 63.7 66.8 50 28.0 29.7 32.4 34.8 37.7 63.2 67.5 71.4 76.2 79.5 60 5.5 37.5 40.5 43.2 46.5 74.4 79.1 83.3 88.4 92.0 70 43.3 45.4 48.8 51.8 55.3 85.5 90.5 95.0 100.0 104.0 80 51.2 53.5 57.2 60.4 64.3 96.6 102.0 107.0 112.0 116.0 90 59.2 61.8 65.7 69.1 73.3 108.0 113.0 118.0 124.0 128.0 100 67.3 70.1 74.2 77.9 82.4 114.0 124.0 130.0 136.0 140.0 18

Figura 13: Valorile critice vor fi identificate prin douǎ valori: grade de libertate şi aria situatǎ sub curbǎ în dreapta valorii critice. Astfel χ 2 (df, α) este simbolul folosit pentru identificarea valorii critice χ 2 cu df grade de libertate şi cu aria α sub grafic şi în dreapta, aşa cum este prezentat pe figura urmǎtoare: Figura 14: Exemplul 4.1. Folosind tabelul determinaţi χ 2 (20; 0, 05) şi χ 2 (14; 0, 90). Din tabel se obţine: χ 2 (20; 0, 05) = 31, 4 şi χ 2 (14; 0, 90) = 7, 79. Remarca 4.1. Dacǎ df > 2 valoarea medie a lui χ 2 este df. Valoarea medie este localizatǎ în dreapta modului (locul în care curba atinge valoarea maximǎ). 19

Figura 15: Exemplul 4.2. Reluǎm cazul companiei de produse rǎcoritoare care doresc sǎ controleze varianţa ca sǎ nu depǎşeascǎ 0, 0004. Un eşantion de mǎrime 28 cu o varianţǎ de 0, 0010 indicǎ oare la nivelul de semnificaţie 0, 05 cǎ procesul de îmbuteliere nu este sub control (referitor la varianţǎ)? Soluţie: Etapa 1. Etapa 2. Etapa 3. H 0 : σ 2 = 0, 0004 (procesul este sub control) H 0 : σ 2 > 0, 0004 (procesul nu este sub control) α = 0, 05, n = 28, df = 27 şi obţinem din tabel: Etapa 4. Etapa 5. Luarea deciziei. χ 2 (27; 0, 005) = 40, 1. χ 2 = n s2 σ 2 = 28 0, 0010 0, 0004 = 70 Figura 16: 20

Concluzia: Procesul de îmbuteliere este sub control în ceea ce priveşte varianţa. Exemplul 4.3. Specificaţiile unui anumit medicament indicǎ cǎ fiecare comprimat trebuie sǎ conţinǎ 2,5 g de substanţǎ activǎ. 100 de comprimate alese la întâmplare din producţie sunt analizate. Ele conţin în media 2,6 g de substanţǎ activǎ cu o deviaţia standard de s = 0, 4g. Se poate spune cǎ medicamentul respectǎ specificaţiile (α = 0, 05)? Etapa 1. Etapa 2. Ipoteza H 0 este ca medicamentul respectǎ specificaţiile: H 0 : µ = 2, 5 Ipoteza H a este ca medicamentul nu respectǎ specificaţiile: H 0 : µ 2, 5 Etapa 3. Statistica folositǎ este media x, iar nivelul de semnificaţie este α = 0, 05. Regiunea criticǎ este: Etapa 4. Testul statistic este: z = x µ s = n 2, 6 2, 5 0,4 10 = 0, 1 0, 04 = 2, 5 Valoarea lui z în tabel este: z 0,975 = 1, 96 < 2, 5. Etapa 5. Ipoteza H 0 este respinsǎ, aşadar nu putem spune cǎ medicamentul respectǎ specificaţiile. Abordarea probabilistǎ a inferenţei statistice asupra varianţei, p-valoarea poate fi estimatǎ pentru verificarea ipotezelor statistice folosind tabelul statistic χ 2 de aceeaşi manierǎ ca şi în cazul testului Student. Exemplul 4.4. Sǎ se determine p-valoarea în cazul urmǎtoarelor ipoteze statistice: Se cunosc: df = 18 şi χ 2 = 32, 7. H 0 : σ 2 = 150 H a : σ 2 > 150 Soluţie: p = P (χ 2 > 32, 7) (0, 010; 0, 025) (date citite din tabel). Exemplul 4.5. Un parametru folosit în determinarea utilitǎţii unui examen ca mǎsurǎ a abilitǎţii studenţilor este împrǎştierea rezultatelor. Un set de rezultate al unui test are valoare micǎ dacǎ plaja notelor este micǎ. Din contrǎ dacǎ plaja notelor este mare, este o diferenţǎ mare între rezultatul cel mai bun şi rezultatul cel mai slab atunci testul are valoare mai mare. La un test la care nota maximǎ este de 100 de puncte s-a pretins cǎ o deviaţie standard de 12 puncte este de dorit. Pentru a vedea dacǎ un anume test de o orǎ a fost sau nu un test bun din acest punct de vedere un profesor verificǎ aceastǎ ipotezǎ statisticǎ la nivelul de semnificaţie α = 0, 05 folosind rezultatele obţinute de clasǎ. Au fost 28 de rezultate şi deviaţia standard gǎsitǎ a fost 10, 5. Constituie aceasta o probǎ la nivelul de semnificaţie α = 0, 05 cǎ examenul nu are deviaţia standard specificatǎ? Soluţie: n = 28, s = 10, 5 şi α = 0, 05 Etapa 1. H 0 : σ = 12 21

Etapa 2. H 0 : σ 12 Etapa 3. α = 0, 05, df = 27 şi obţinem valorile critice din tabel: Etapa 4. χ 2 1(27; 0, 975) = 14, 6 şi χ 2 2(27; 0, 025) = 43, 2. χ 2 = n s2 σ 2 = 28 (10, 5)2 = 3087 = 21, 43 (12) 2 144 Etapa 5. Nu se poate respinge H 0. Concluzie: Nu avem probe suficiente pentru a respinge ipoteza H 0 22