TESTAREA IPOTEZELOR STATISTICE

Σχετικά έγγραφα
9 Testarea ipotezelor statistice

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

8 Intervale de încredere

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Curs 4 Serii de numere reale

Asupra unei inegalităţi date la barajul OBMJ 2006

Metode iterative pentru probleme neliniare - contractii

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Scoruri standard Curba normală (Gauss) M. Popa

Statisticǎ - curs 4. 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2

MARCAREA REZISTOARELOR

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Metode de interpolare bazate pe diferenţe divizate

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Subiecte Clasa a VIII-a

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

NOTIUNI DE BAZA IN STATISTICA

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

Integrala nedefinită (primitive)

Curs 1 Şiruri de numere reale

DistributiiContinue de Probabilitate Distributia Normala

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Subiecte Clasa a VII-a

5.4. MULTIPLEXOARE A 0 A 1 A 2

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

riptografie şi Securitate

7 Distribuţia normală

Seminar 5 Analiza stabilității sistemelor liniare

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

CURS: METODE EXPERIMENTALE ÎN FCS

sunt comparate grupuri formate din subiecńi diferińi, evaluańi în condińii diferite testul t pentru eşantioane independente ANOVA


a. 11 % b. 12 % c. 13 % d. 14 %

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Lp 8 Rezumat. Capitolul 6. PROBLEMA TESTĂRII IPOTEZELOR Ipoteză ştiinţifică - Ipoteză statistică Ipoteză ştiinţifică

Problema a II - a (10 puncte) Diferite circuite electrice

Curs 2 Şiruri de numere reale

Ovidiu Gabriel Avădănei, Florin Mihai Tufescu,


Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

Tranzistoare bipolare şi cu efect de câmp

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

Sisteme diferenţiale liniare de ordinul 1

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

Esalonul Redus pe Linii (ERL). Subspatii.

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Εμπορική αλληλογραφία Ηλεκτρονική Αλληλογραφία

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Criptosisteme cu cheie publică III

Recapitulare - Tipuri de date

1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

Exemple de probleme rezolvate pentru cursurile DEEA Tranzistoare bipolare cu joncţiuni

Laborator 11. Mulţimi Julia. Temă

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

prin egalizarea histogramei

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

INTRODUCERE ÎN STATISTICA MEDICALĂ

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

2. Sisteme de forţe concurente...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

3. Momentul forţei în raport cu un punct...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...4

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

riptografie şi Securitate

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

Functii Breviar teoretic 8 ianuarie ianuarie 2011

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Al cincilea baraj de selecţie pentru OBMJ Bucureşti, 28 mai 2015

1. PROPRIETĂȚILE FLUIDELOR

13. Grinzi cu zăbrele Metoda izolării nodurilor...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...

Foarte formal, destinatarul ocupă o funcţie care trebuie folosită în locul numelui

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Erori statistice Puterea testului statistic Mărimea efectului. Marian Popa

Coeficientul de corelaţie Pearson(r) M. Popa

5 Statistica matematică

Cursul 6. Tabele de incidenţă Sensibilitate, specificitate Riscul relativ Odds Ratio Testul CHI PĂTRAT

14. Grinzi cu zăbrele Metoda secţiunilor...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

a. Caracteristicile mecanice a motorului de c.c. cu excitaţie independentă (sau derivaţie)

Cursul Măsuri reale. D.Rusu, Teoria măsurii şi integrala Lebesgue 15

Ακαδημαϊκός Λόγος Κύριο Μέρος

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

PROIECT ECONOMETRIE. Profesori coordinatori: Liviu-Stelian Begu și Smaranda Cimpoeru

VII.2. PROBLEME REZOLVATE

Transcript:

Capitolul 9 TESTAREA IPOTEZELOR STATISTICE D acă în capitolul anterior au fost epuse principalele aspecte ale teoriei selecţiei, în acest capitol vom trata modalitatea de aplicare a teoriei în testarea ipotezelor statistice. Este foarte important felul în care se formulează o problemă de testare a ipotezelor. Prezentăm în continuare un eemplu. În ţara noastră, învăţământul la distanţă a devenit învăţământ de masă. Studiind situaţiile rezultatelor la eamenul de licenţă ne-am putea întreba dacă ar trebui ceva schimbat în politica acestui tip de învăţământ. În măsura în care rezultatele obţinute la eamenul de licenţă de către studenţii de la ID nu diferă semnificativ de cele obţinute de studenţii care urmează cursurile în mod regulat, acest fapt ar putea fi de natură să acrediteze ideea că eigenţele la cele două tipuri de învăţământ nu diferă şi prin urmare ne putem aştepta la aceeaşi reuşită a absolvenţilor celor două forme de învăţământ pe piaţa muncii. Dacă da, atunci raţionamentul imediat ne-ar putea duce la concluzia că scopul învăţământului la distanţă nu este unul de a oferi şanse egale în reuşita pe piaţa muncii, urmărindu-se cu totul alte finalităţi. Să presupunem că media naţională de absolvire la eamenul de licenţă este de 7,5. Emitem ipoteza că şi media absolvenţilor învăţământului la distanţă (ID) este de 7,5. Pot rezulta două situaţii posibile: acceptarea ipotezei lansate sau respingerea ei. 9.1 Ipotezele statistice Ipoteza nulă notată cu H 0 susţine că toate măsurătorile pe care dorim să le comparăm sunt egale, iar eventualele diferenţe se datorează eclusiv întâmplării. Este ipoteza care se testează statistic. În funcţie de rezultatul testării se ia decizia de acceptare sau respingere a ei. Pentru eemplul de mai sus, ipoteza nulă se scrie: H 0 : μ = 7,5. Ipoteza alternativă notată cu H 1. În situaţia în care ipoteza este acceptată, decizia susţine faptul că variaţia fenomenului studiat nu se datorează doar întâmplării, ci şi unor factori manipulaţi. Cu alte cuvinte, diferenţele 93

94 Statistică şi aplicaţii în ştiinţele sociale constatate sunt atât de mari încât nu pot fi eplicate integral doar prin efectul întâmplării. Pentru eemplul dat, ipoteza alternativă se scrie: H 1 : μ 7,5. Eistă o anumită legătură între acceptarea sau respingerea ipotezei nule şi riscul de eroare (pragul de semnificaţie) asumat de cercetător în luarea deciziei. În statistică riscul de eroare se fiează de obicei la 5 %. Aşa cum se poate constata, ambele ipoteze se referă la populaţie şi parametru, şi nu la eşantioane şi statistică. Să presupunem că am selectat aleator un eşantion de 100 studenţi care urmează cursurile ID. Parametrii rezultatelor naţionale la eamenul de licenţă sunt: μ = 7,5 şi σ = 1,7. Media rezultatelor pentru cei 100 studenţi investigaţi este de 6,3. Cât de probabilă este media acestui eşantion dacă în realitate media populaţiei este de 7,5? Altfel spus, dacă eşantioane repetate de 100 studenţi sunt selectate aleator din populaţia naţională în care media absolvirii este de 7,5, ne întrebăm care sunt proporţiile mediilor care se abat de la media naţională? Pentru a răspunde la această întrebare avem nevoie să determinăm poziţia relativă a mediei eşantionului între toate mediile eşantioanelor posibile dacă ipoteza H 0 este adevărată. Cum σ = 1,7, putem determina uşor eroarea standard a mediei. Pentru distribuţia de selecţie se găseşte: 1,7 1,7 0,17 n 100 10 În continuare, convertim media eşantionului de 6,3 în scor z. 0 6,3 7,5 1,2 z 7,059 0,17 0,17 Numărătorul fracţiei ne arată că media eşantionului de 6,3 se situează la 1,2 puncte sub media aşteptată a tuturor mediilor eşantioanelor posibile, iar aceste 1,2 puncte sunt echivalente cu 7,059 erori standard. Având determinată cota z, putem localiza poziţia mediei eşantionului în distribuţia de selecţie şi mai mult, putem evalua probabilitatea asociată valorii z calculate. Cunoscând probabilitatea asociată mediei de 6,3, se pune întrebarea dacă aceasta are vreun efect în ceea ce priveşte ipoteza H 0. O medie de eşantion care se abate la fel de mult ca media eşantionului de 6,3 este etrem de puţin probabilă. Într-adevăr, având un număr infinit de mare de eşantioane obţinute din populaţia pentru care media naţională este de 7,5, un procent etrem de mic din mediile eşantioanelor se vor abate mai mult sau la fel de mult ca media de 6,3. Poate fi aceasta o sugestie că H 0 este falsă? Pentru a da un răspuns la

această întrebare avem nevoie, în sensul celor enunţate mai sus, de o cotă de risc cu care vom lua decizia. În esenţă, cota α arată cât de rare trebuie să fie rezultatele eşantioanelor pentru a susţine respingerea ipotezei nule. Să presupunem că se alege o cotă de risc de 5 %. Fig. nr. 9.1 Regiunile de respingere pentru testul bilateral la valoarea critică α = 0,05 Media eşantionului de 6,3 se plasează în afara regiunii de acceptare (7,5 ± 0,17 1,96). Decizia statistică se formulează în termenii respingerii ipotezei nule. Concluzia este că rezultatele obţinute de absolvenţii formei de învăţământ ID diferă semnificativ de media naţională, concluzie susţinută la o cotă de risc de 5 %. 9.2 Nivelul de semnificaţie şi eroarea deciziei Decizia de acceptare sau respingere a ipotezei nule depinde de criteriul de raritate a apariţiei şi de faptul că nivelurile de semnificaţie de 0,05 şi 0,01 sunt valori comune în această privinţă. Într-un anumit sens aceste valori sunt arbitrare. Nivelul de semnificaţie α este de fapt riscul cercetătorului de a-şi asuma luarea unei decizii în privinţa ipotezei nule. În figura de mai jos se prezintă comportarea unui test bilateral în condiţiile unei cote de risc de 5 %. Dacă H 0 este adevărată, acest lucru înseamnă că 5 % din mediile eşantioanelor posibile vor conduce la concluzia că H 0 este falsă! 95

Fig. nr. 9.2 Test bilateral pentru α = 0,05. 5% din rezultate stabilesc ca eronată decizia de respingere a ipotezei H 0 când de fapt H 0 este adevărată! Când stabilim α = 0,05, ne asumăm de fapt riscul ca 5 % din rezultate să cadă în zona de respingere a ipotezei nule. Respingerea unei ipoteze nule adevărate este o eroare de decizie şi, eceptând revelaţia divină, nu avem nicio idee când o asemenea eroare se produce. Toate aceste aspecte ne conduc la următoarea concluzie: Nivelul de semnificaţie α dă probabilitatea de respingere a lui H 0 când în realitate aceasta este adevărată. Pentru a reduce riscul luării unei decizii eronate, cercetătorul poate stabili α la un nivel mai scăzut, de pildă α = 0,01 sau 0,0001. Să presupunem că am obţinut un rezultat care se abate atât de mult de la medie încât probabilitatea de producere (apariţie) este doar de p = 0,002. În baza acestui criteriu putem spune că valoarea obţinută nu este suficient de rară încât să ne conducă la respingerea lui H 0 (0,002 > 0,0001). De cele mai multe ori însă, admitem ipoteza nulă chiar dacă intuim că decizia este falsă. Deci coborârea lui α creşte probabilitatea de a face un alt gen de eroare; acceptarea ipotezei nule când de fapt aceasta este falsă. Nu este surprinzător faptul că acest comportament decizional este cunoscut ca un alt tip de eroare. Putem rezuma formularea acestei erori astfel: Reţinerea unei ipoteze H 0 false. Pentru a concretiza cele spuse într-un eemplu, să presupunem că ipoteza nulă (H 0 : μ = 150) este testată bilateral la un nivel de semnificaţie α = 0,05. Media eşantionului etras este de 152. Este însă posibil ca media reală a populaţiei să fie de 154. În figura de mai jos, repartiţia trasată prin linia continuă este repartiţia de selecţie corespunzătoare mediei de 150. 96

Repartiţia de selecţie H 0 : μ = 150 H 1 : μ 150 α = 0,05 Repartiţia de selecţie adevărată Fig. nr. 9.3 Ipoteza nulă este falsă, dar conduce la acceptarea ipotezei nule! Repartiţia corectă este cea reprezentată punctat, având media de 154. În testarea ipotezei nule pentru care μ = 150, reprezentăm media eşantionului de 152 în repartiţia desenată cu linie îngroşată. Relativ la această distribuţie, valoarea 152 nu se abate atât de mult încât să se plaseze în zona de respingere a ipotezei H 0. Vom fi deci în situaţia acceptării ipotezei nule. Dar acceptarea este o decizie eronată. Putem constata că nivelurile (pragurile) de semnificaţie α = 0,05 şi α = 0,001 sunt într-un anumit sens, valori compromise. Aceste valori tind să ne dea asigurarea că H 0 nu va fi respinsă, când în realitate se respinge (primul tip de eroare) sau că ele nu sunt suficient de mici să ridice probabilitatea de acceptare a ipotezei nule (al doilea tip de eroare). Trebuie să fim conştienţi de faptul că în orice testare de ipoteză nulă nu putem şti dacă a fost făcută o eroare de decizie. Probleme propuse: 1. Stabiliţi valorile critice pentru testarea ipotezei nule H 0 : μ = 450 şi a ipotezei alternative H 1 : μ < 450: a) α = 0,01 b) α = 0,05 c) α = 0,1 97

2. Stabiliţi valorile critice pentru testarea ipotezei nule H 0 : μ = 350 şi a ipotezei alternative H 1 : μ 350: a) α = 0,01 b) α = 0,05 c) α = 0,1 3. Eplicaţi în termeni generali rolul lui H 0 şi H 1 în testarea ipotezelor. 4. Se cunoaşte μ = 55 şi σ = 17. Pentru fiecare din următoarele scenarii evaluaţi z α, valoarea p şi decizia statistică. a) X 73, n=37, =0,05 b) X 73, n=100, =0,05 c) X 53, n=70, =0,01 d) X 83, n=150, =0,01 e) X 43, n=370, =0,01 98

Capitolul 10 ESTIMAREA STATISTICĂ 10.1 Testarea ipotezelor versus estimarea I nferenţa statistică este procesul de etrapolare a rezultatelor înregistrate, de la nivelul eşantioanelor selectate la nivelul întregii populaţii (din care au fost selectate eşantioanele). Pe lângă testarea ipotezelor statistice, inferenţa statistică are în vedere estimarea statistică. Am văzut în subcapitolul anterior modul în care am testat o medie de eşantion pe ipoteza nulă H 0 : μ = 7,5. Cum media eşantionului a fost de 6,3, am respins ipoteza nulă la pragul de semnificaţie α = 0,05. Însă întrebările nu sunt epuizate. Ne-am putea întreba cât de mult s-ar putea abate media eşantionului de la media populaţiei pentru a accepta ipoteza nulă? Sau ar putea fi valoarea de 7,6 o valoare plauzibilă pentru media populaţiei? Ce putem spune despre valorile 8; 8,5;...; ş.a.m.d.? Ce estimări rezonabile am putea da pentru media populaţiei? Cele mai multe din întrebările statisticii pentru care testările de ipoteze ar putea oferi soluţii mulţumitoare îşi găsesc răspuns şi prin tratarea estimării. Totuşi, eistă probleme pentru care testarea ipotezelor nu este indicată, iar singura abordare relevantă rămâne estimarea statistică. Să presupunem că directorul unei biblioteci universitare doreşte să afle cât de mulţi bani pe cap de student, în medie, sunt necesari pentru cumpărarea cursurilor. Procedurile de estimare sunt mult mai potrivite pentru a răspunde acestei întrebări. Să încercăm să ne gândim asupra înţelesului pe care l-ar putea avea formularea următoarelor ipoteze nule: H 0 : μ = 50 sau H 0 : μ = 100. De fapt interesul directorului de bibliotecă este mai mult unul de ordin eplorator. El doreşte să estimeze media veniturilor studenţilor, pornind de la rezultatele eşantionului, şi nu testarea unei valori specifice mediei veniturilor indicată de H 0. 99

10.2 Estimarea caracteristicii versus estimarea intervalului Am văzut anterior că o statistică este o estimare a unui parametru ( estimează μ; s estimează σ; s 2 estimează σ 2 şi r estimează ρ). Eistă numeroase eemple din viaţa cotidiană care solicită estimarea caracteristicilor. De eemplu, dacă în urma unui sondaj de opinie, vizând subiecţii care s-au drogat rezultă că 60 % dintre aceştia ar reveni la consumul de droguri, de fapt, dispunem de o estimare a caracteristicii preferinţa celor care au consumat droguri. O privire corectă asupra unei estimări trebuie să aibă în vedere şi alte aspecte, cum ar fi cele datorate variaţiei de selecţie. Este de acum un fapt bine cunoscut în statistică că eroarea de selecţie generează eroare în estimarea caracteristicii. Dar cât de mult afectează eroarea de selecţie estimarea caracteristicii? Am văzut că media de 6,3 nu este o estimare a mediei naţionale şi că, fără îndoială, aceasta se situează fie de o parte, fie de cealaltă parte a mediei populaţiei. În esenţă, un interval estimat este o plajă de valori în interiorul cărora pot fi stabilite cu încredere rezonabilă poziţiile parametrilor populaţiei. De eemplu, am putea spune că media absolvenţilor ID la eamenul de licenţă se situează între 5,8 şi 6,9. Eistă un raport de inversă proporţionalitate între mărimea intervalului estimat şi riscul cu care facem această estimare. Cu cât intervalul estimat este mai strâns, cu atât şi riscul pe care ni-l asumăm în a afirma că o caracteristică va lua valori în acest interval este mai mare. 10.3 Estimarea intervalului de încredere pentru medie În distribuţia normală a scorurilor individuale, 95 % din observaţii nu se situează la o distanţă mai mare de 1,96 deviaţii standard faţă de medie. Sau, cu alte cuvinte, media ±1,96 abateri standard cuprinde 95 % din toate scorurile. Eaminând figura de mai jos, se constată că media se poziţionează în interiorul intervalului X 1,96. 100

20 100 2,00 Fig. nr. 10.1 Distribuţia mediilor eşantioanelor de volum n = 100 etrase de la o populaţie pentru care μ = 100 şi σ = 20 În figura de mai jos sunt prezentate intervalele X 1,96 pentru fiecare din cele 10 posibile eşantioane aleatoare de volum n = 100, etrase din populaţia ale cărei caracteristici sunt menţionate în figura de mai sus. Fig. nr. 10.2 Intervalul X 1,96 pentru fiecare din cele 10 eşantioane aleatoare de volum n = 100 etrase dintr-o populaţia pentru care μ = 100 101

Revenind la eemplul cu media de absolvire a eamenului de licenţă, se pune întrebarea care ar fi plaja de valori în interiorul căreia se apreciază cu o probabilitate de 95 % că se găseşte media populaţiei? Procedura este cea indicată mai jos. Pasul I. Determinăm eroarea standard a mediei ( ):... n Pasul II. Evaluăm relaţia: 1,96... Pasul III. Specificăm limitele intervalului: L... L... i Pentru o cotă de risc de 1 %, intervalul de încredere corespunzător este X 2,58. În general, relaţia pentru calcularea intervalului de încredere al mediei, relaţie corespunzătoare unui nivel de semnificaţie α = α 0 este X z. 10.4 Estimarea intervalului de încredere şi testarea ipotezelor Estimarea intervalului de încredere pentru medie şi testarea ipotezelor statistice sunt două faţete ale aceleiaşi probleme. Să presupunem că pentru un set particular de date statistice am aplicat un test bilateral ipotezei nule H 0 : μ = μ 0 şi am construit un interval de încredere pentru medie cu o cotă de risc de 5 %. Două lucruri interesante rezultă din această practică: 1. Dacă media se situează în afara limitelor de încredere ale intervalului pentru valoarea specificată, atunci ipoteza nulă se respinge. 2. Dacă media se situează în interiorul intervalului de încredere pentru valoarea specificată, ipoteza nulă se acceptă. Să revenim încă o dată la eemplul cu media de licenţă a absolvenţilor învăţământului la distanţă. Ipoteza testată a fost H 0 : μ = 7,5. Media eşantionului studiat 6,3 corespunde unui z statistic de 7,059, ceea ce conduce la respingerea ipotezei nule. Să comparăm această decizie cu intervalul de încredere de 95 % pentru media absolvenţilor ID, respectiv 6,3 ± 1,96 0,17. Observăm că intervalul construit nu cuprinde media naţională ceea ce ne plasează în situaţia primei observaţii menţionate mai sus. s 102

6,3 z = 7,059 z 0,05 = 1,96 valoare critică z 0,05 = +1,96 Fig. nr. 10.3 Testarea ipotezelor statistice şi estimarea intervalului de încredere pentru valoarea specificată; ipoteza nulă H 0 : μ = 7,5 este respinsă Să presupunem acum că media naţională înregistrată la eamenul de licenţă este de 6,4. Ea se regăseşte în intervalul de încredere (5,96; 6,63) şi prin urmare putem concluziona că este o valoare rezonabilă pentru media absolvenţilor ID. Calculând din nou cota z, obţinem: 0 6,3 6,4 z 0,588 0,17 Cum 0,588 > 1,96 ipoteza nulă se acceptă, ceea ce încadrează acest caz în cea de a doua observaţie menţionată. 6,3 z = 0,588 Ipoteza H 0 se acceptă 6,4 0,17 Fig. nr. 10.4 Testarea ipotezei statistice şi estimarea intervalului de încredere pentru media absolvenţilor ID. Ipoteza nulă H 0 : μ = 6,4 este acceptată 103

Probleme propuse: Statistică şi aplicaţii în ştiinţele sociale 1. Se cunosc următoarele date: 29, =6, X=39, n=50. a) Calculaţi X b) Construiţi cu o verosimilitate de 95 % intervalul de încredere pentru media eşantionului c) Construiţi cu o verosimilitate de 99 % intervalul de încredere pentru media eşantionului 2. Se cunosc următoarele date: 29, =6, X=39, n=10, n=100 a) Calculaţi X b) Construiţi cu o verosimilitate de 95 % intervalul de încredere pentru media eşantionului c) Construiţi cu o verosimilitate de 99 % intervalul de încredere pentru media eşantionului d) Comparaţi rezultatele obţinute 3. Eplicaţi termenul de verosimilitate. 104

Capitolul 11 TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIE CÂND ABATEREA MEDIE PĂTRATICĂ ESTE NECUNOSCUTĂ 11.1 σ este rareori cunoscut Î n subcapitolele anterioare au fost prezentate principalele aspecte referitoare la testarea ipotezelor statistice şi la estimare, luând în considerare o situaţie ideală în care abaterea standard a populaţiei (σ) este cunoscută. Însă situaţia ideală este nerealistă pentru că în practică σ este necunoscut, mai ales în cazul aspectelor comportamentale eplorate de cercetători. În cazul în care σ este necunoscut, procedurile pentru verificarea ipotezelor statistice se schimbă, dar secvenţa de etape este similară situaţiei când σ este cunoscut, respectiv: precizarea ipotezei nule, a celei alternative şi stabilirea nivelului de semnificaţie; construirea eşantionului şi calcularea statisticilor necesare; stabilirea cotei de risc pentru analiza statisticii testului; luarea deciziei referitoare la ipoteza nulă. Să presupunem că în urma unei eaminări la scară naţională în care s-a urmărit motivaţia pentru studiu a studenţilor, s-a constatat că în medie, studentul român dedică zilnic 4 ore pregătirii. Rectorul unei anumite universităţi este interesat de a avea un punct de vedere argumentat cu privire la motivarea studenţilor din universitatea sa. În acest scop el găseşte că fiecare student alocă din timpul său 3,2 ore studiului şi pornind de la această constatare doreşte să afle dacă motivarea manifestată se abate sau nu de la motivarea naţională. 105

Student Număr de ore dedicate studiului X X 2 1 3 9 2 5 25 3 2 4 4 1 1 5 4 16 6 6 36 7 3 9 8 3 9 9 1 1 10 4 16 n = 10 Σ = 32; (Σ) 2 = 1024 Σ 2 = 126 Media eşantionului este de 3,2 ore 11.2 Estimarea erorii standard a mediei Dacă σ ar fi cunoscut, rectorul ar putea lua fără dificultate decizia cu privire la ipoteza nulă, folosind relaţia: z 0 Cum σ este necunoscut, rectorul nu poate calcula şi din n acest motiv nu poate determina cota z corespunzătoare. Însă o estimare a lui σ poate fi utilizată pentru estimarea lui. Relaţia: 2 s n SS n unde SS este suma pătratelor abaterilor de la medie este o bună estimare a abaterii standard a populaţiei. Însă în general, abaterea standard a populaţiei se calculează din relaţia: s n 1 2 106

Folosind datele eemplului prezentat mai sus, rezultă: 2 2 n 2 1024 SS 126 126102,4 23,6 10 SS 23,6 s 1,62 n 1 9 Estimarea erorii standard a mediei este în aceste condiţii: s 1,62 s 0,512 n 10 s ca eroare standard a mediei este abaterea standard estimată a tuturor mediilor eşantioanelor posibile de volum n = 10, etrase aleator din populaţie. 11.3 Testul statistic t Când σ nu este cunoscut, trebuie utilizat un alt test statistic iar acest test este testul t. Relaţia corespunzătoare statisticii t este: t 0 Folosind datele eemplului, obţinem pentru t calculat valoarea: s 0 3,2 4 t 1,563 0,512 s Aşa cum se poate constata, singura diferenţă în calcularea lui t şi z este substituirea lui prin s. Din acest punct de vedere, ambele formule (pentru z şi t) sunt aproape similare în sensul că fiecare reflectă diferenţa dintre media eşantionului ( ) şi valoarea mediei populaţiei în unităţi de eroare standard a mediei ( s sau ). Putem constata că t foloseşte două statistici ( şi s ), în timp ce z foloseşte o singură statistică ( ). Aceste aspecte ne arată că repartiţia de selecţie a lui t se abate semnificativ de la distribuţia normală în cazul eşantioanelor mici. Repartiţia t este cunoscută şi sub numele de repartiţia Student. Calculul prezentat anterior arată că diferenţa dintre media eşantionului de care dispune rectorul şi media populaţiei este de 1,563 erori standard. 107

11.3.1 Grade de libertate Înainte de a continua discuţia pe marginea distribuţiei Student este nevoie să clarificăm problema gradelor de libertate. Gradele de libertate (gdl) indică numărul de informaţii independente dintr-un eşantion. În calcularea statisticii t trebuie utilizate informaţiile provenite din eşantion pentru evaluarea estimărilor s şi s. Câte informaţii independente poate furniza eşantionul pentru acest scop? Răspunsul îl găsim în faptul că s şi deci s se bazează pe abaterile observaţiilor de la media eşantionului. Să presupunem că avem un eşantion constituit din trei observaţii 3; 3 şi 9. Media eşantionului este egală cu 5 iar deviaţiile de la medie sunt 2; 2 şi 4. Sunt aceste deviaţii independente între ele? Răspunsul este negativ pentru că suma lor trebuie să fie întotdeauna egală cu zero. Cu alte cuvinte, în măsura în care cunoaştem două dintre abaterile scorurilor ( 2 şi 2), a treia abatere trebuie să fie egală cu +4 pentru ca suma lor să fie nulă. Rezultă că ultima abatere este întotdeauna complet determinată de celelalte. În cazul nostru, din cele trei scoruri doar două sunt independente care sunt şi gradele de libertate pe care ne bazăm în estimarea lui s şi s. Generalizând, gradele de libertate disponibile într-un eşantion de volum n sunt în număr de n 1. 11.3.2 Repartiţia de selecţie student Când eşantioanele aleatoare sunt de volum mare, s este un bun estimator a lui, s estimează bine pe şi în consecinţă, t este apropiat de z. În acest caz, distribuţia t va avea o comportare foarte asemănătoare cu distribuţia normală. Pe de altă parte, când volumul eşantionului este mic, valoarea corespunzătoare s va diferi substanţial de, deci şi distribuţia lui t în raport cu distribuţia normală. Pe măsură ce numărul gradelor de libertate scade, aplatizarea distribuţiei t este mai pronunţată (a se urmări graficul de mai jos). 108

gdl = gdl = 11 gdl = 5 Fig. nr. 11.1 Trei distribuţii Student pentru 5, 11 şi grade de libertate Pentru volume de eşantion 200, distribuţia t nu se deosebeşte practic de distribuţia normală iar pentru un volum nelimitat, distribuţia t şi distribuţia normală sunt una şi aceeaşi. 11.3.2.1 Obţinerea valorilor critice pentru statistica t În anea B este prezentată tabelat repartiţia lui Student utilizată pentru obţinerea valorilor critice ale lui t. Tabelul cuprinde valorile critice dincolo de care se găsesc zonele de respingere atât în cazul unilateral, cât şi în cel bilateral. Prezentăm mai jos o secvenţă a acestui tabel, corespunzătoare unui număr de 8 grade de libertate. BILATERAL Grade de 0,50 0,20 0,10 0,05 0,02 0,01 libertate UNILATERAL 0,25 0,10 0,05 0,025 0,01 0,005 8 0,706 1,397 1,860 2,306 2,896 3,355 În figura de mai jos se poate constata că 2,5 % din aria plasată sub distribuţia lui Student se află dincolo de cota t = 2,306 în cazul unilateral şi 5 % în cazul bilateral. Similar şi pentru cota t = 3,355. 109

Fig. nr. 11.2 Zonele critice ale repartiţiei lui Student pentru un număr de 8 grade de libertate (gdl = 8). Eemplu: Presupunem că dorim să testăm ipoteza nulă H 0 : μ = 7,3 versus ipoteza alternativă H 1 : μ 7,3 în condiţiile în care media eşantionului este 7, 01, volumul eşantionului n = 10, eroarea standard estimată a mediei s 1, 04 iar t calculat = 0,278. Cota de risc pentru luarea deciziei o fiăm la α = 0,05. În anea B, valorile critice ale lui t pentru 9 grade de libertate sunt ±2,262. Aceste valori delimitează zonele de respingere de zona de acceptare. 110 Fig. nr. 11.3 Decizia asupra ipotezei nule H 0 bazată pe distribuţia Student cu nouă grade de libertate

Cum t calculat < t critic se acceptă ipoteza nulă, ceea ce înseamnă că media eşantionului ( 7, 01 ) nu diferă semnificativ de media populaţiei (μ = 7,3). 11.4 Nivelurile de semnificaţie versus valorile probabilităţii P Să admitem că ne aflăm într-un demers de testare a ipotezei nule H 0 : μ = 100, iar pentru un eşantion de 25 observaţii obţinem un t calculat de +2,00. Distribuţia t pentru 24 grade de libertate arată că un t de +2,00 este poziţionat între valorile 1,711 şi 2,064 (a se vedea figura de mai jos). Fig. nr. 11.4 Determinarea valorii P pentru un t calculat când gdl = 24 Prin urmare dacă adoptăm ipoteza alternativă H 1 : μ > 100, valoarea probabilităţii P se află undeva între 2,5 % şi 5 %. Pentru ipoteza H 1 : μ 100 valoarea P se situează între 5 % şi 10 %. Dacă un rezultat este semnificativ din punct de vedere statistic, valoarea P este plasată sub nivelul reperelor de semnificaţie (α = 0,05 sau 0,1) în timp ce dacă rezultatul este nesemnificativ, P-ul se plasează peste nivelul reperelor (a se vedea tabelul de mai jos). VALOAREA P Cercetătorul consideră că rezultatul este: Valoarea P Semnificativ statistic Nesemnificativ statistic 0,003 P < 0,05 sau P < 0,01 P > 0,001 0,02 P < 0,05 P > 0,01 0,08 P < 0,10 P > 0,05 0,15 P > 0,10 sau P > 0,05 111

Limbajul utilizat de anumiţi cercetători în descrierea rezultatelor poate fi confuz, tinzând să estompeze distincţia dintre valoarea P şi nivelul de semnificaţie. Spre eemplu, putem întâlni un cercetător care să afirme că primul set de rezultate a fost semnificativ la un nivel de 0,05, al doilea set a fost semnificativ la un nivel de 0,001 iar pentru al treilea set, datele nu au fost semnificative la un nivel de 0,10. Înseamnă oare acest lucru că α = 0,05 sau α = 0,10 au fost utilizate pentru evaluarea celor trei seturi de rezultate? Aproape sigur nu, mai degrabă aceasta este o modalitate de raportare a celor trei valori P: P < 0,05 sau P < 0,001 şi P > 0,10. 11.5 Construcţia unui interval de încredere pentru medie când σ nu este cunoscut Dacă σ este cunoscut, intervalul de încredere pentru medie se construieşte folosind formula X z. Această relaţie necesită două modificări când σ nu este cunoscut; respectiv s care substituie pe şi t care substituie pe z, aşa încât relaţia generală pentru construirea intervalului de încredere al mediei devine X t. s Eemplu: Se cunosc următoarele date statistice: X 7; s 1, 3; t 2, 262. Media populaţiei se va găsi în intervalul X t s 7 2,262 1,3 7 2, 94 la un prag de semnificaţie α = 0,05. Probleme propuse: 1. În ce condiţii S şi s sunt foarte apropiate? Dar foarte diferite? 2. Se selectează un eşantion aleator de 7 observaţii. Scorurile abatere ale primelor 6 observaţii sunt: 6, 2, 3, 4, 5, 1. a) Care este al şaptelea scor abatere? b) Calculaţi pentru eşantionul de 7 observaţii SS, sx. 3. Selectaţi aleator un eşantion de 20 de observaţii. Calculaţi s şi estimatorul lui σ. Chiar dacă eistă 20 de observaţii s, se calculează pe baza unui număr de 19 observaţii independente. Comentaţi. 112

4. Pentru fiecare din următoarele cazuri, localizaţi regiunile de respingere: a) H 0 : μ = 15, μ 15, α = 0,1, eşantion: 16, 17, 14, 16, 16, 16, 15. b) H 0 : μ = 19, μ > 15, α = 0,1, eşantion: 18, 19, 17, 11, 24, 19, 20. c) H 0 : μ = 15, μ < 15, α = 0,1, eşantion: 16, 17, 14, 16, 16, 16, 15. 5. Calculaţi cea mai bună estimare a lui şi X pentru fiecare din următoarele cazuri: a) 32, 34, 20, 36, 42, 34 b) 5, 6, 9, 11, 14, 12, 16, 17 6. Eprimaţi fiecare din următoarele afirmaţii în termeni de probabilitate, utilizând p: a) Rezultatele nu sunt semnificative la nivelul 0,05 b) Rezultatele au fost semnificativ sub 50 la un nivel de 0,01 c) Rezultatele au fost semnificative la nivelul 0,001 113