Josemari Sarasola Gizapedia Josemari Sarasola Proba parametrikoak 1 / 20
Zer den proba parametrikoa Proba parametrikoak hipotesi parametrikoak (hau da parametro batek hartzen duen balioari buruzkoak) frogatzen dituzten proba estatistikoak dira. Adibidez: H 0 : µ = 4 (hau da populazio batezbesteko bati buruzkoa) eta H 0 : p = 0.4 (populazio proportzio bati buruzkoa). Guztiz okerra da horrelako zerbait jartzea: H 0 : ˆµ = 4. Izan ere, zenbatesleen balioak ezagunak dira edo kalkula egin daitezke datuetatik, eta beraz ez da beharrezkoa (ez du zentzurik) haiei buruz hipotesi bat planteatu eta frogatzea. Ikus, gainera, hobeto ulertzeko, LTZ ikasgaiko azken ariketa. Josemari Sarasola Proba parametrikoak 2 / 20
Zenbatesleak, ebidentziaren oinarri gisa Zenbatesleak proba parametrikoak ebazteko erabiltzen dira. Adibidez, H 0 : µ = 4 izanik, ˆµ = x = 80 ateratzen denean, badirudi hipotesi nulua baztertzeko arrazoi handiak daudela, ziur asko oso arraroa izango baita populazio batezbestekoa 4 izanda, lagin batezbestekoa 80 (edo gehiago) suertatzea. Josemari Sarasola Proba parametrikoak 3 / 20
Erabaki-erregela: eremu kritikoa nondik Orokorrean, H 0 : θ < θ 0 baztertuko da bere zenbateslea handia denean (adibidez, H 0 : µ < µ 0 baztertuko dugu, x zenbateslea x 0 balio bat baino handiagoa denean. H 0 : θ > θ 0 baztertuko da bere zenbateslea txikia denean (adibidez, H 0 : µ > µ 0 baztertuko dugu, x zenbateslea x 0 balio bat baino txikiagoa denean. H 0 : θ = θ 0 baztertuko da bere zenbateslea handia nahiz txikia denean (adibidez, H 0 : µ = µ 0 baztertuko dugu, x zenbateslea x h balio bat baino handiagoa denean eta x t balio bat baino txikiagoa denean. Josemari Sarasola Proba parametrikoak 4 / 20
Zenbatesleen lagin banaketak Zenbatesle edo estimatzaile baten balioa zenbateraino den arraroa ebaluatzeko, horren probabilitate-banaketa behar da, zenbateslearen lagin banaketa deitzen dena. Izan ere, zenbatesleak zorizko aldagaiak dira, horien balioak zoriz jasotako datuetatik kalkulatzen direlako. Horrela, zenbatesle bakoitzak bere probabilitate banaketa du (edo ditu, ereduaren eta n lagin tamainaren arabera, zenbatesle batek bat baino gehiago izan ditzakeelako), zenbateslearen lagin banaketa (ingelesez, sampling distribution; gazteleraz, distribucion muestral). Horiekin hasi aurretik, gogoan eduki: µ populazio edo ereduko batezbestekoa da, eta σ populazio edo ereduko desbideratzea. Josemari Sarasola Proba parametrikoak 5 / 20
Zenbatesleen lagin banaketak Lagin batezbestekoa, eredu normala, σ ezaguna x N(µ, σ n ) Josemari Sarasola Proba parametrikoak 6 / 20
Zenbatesleen lagin banaketak Lagin batezbestekoa, eredu normala, σ ezezaguna t = x µ ŝ/ n t n 1 Gogoratu: ŝ = i (x i x) 2 n 1. Josemari Sarasola Proba parametrikoak 7 / 20
Froga parametrikoak Eranskina: Student-en t banaketa Honela idazten da labur: t t n. Askatasun-gradu kopurua deritzon n du parametro bakarra eta zenbaki naturala (1,2,...) izan behar da. n zenbat eta txikiagoa den, banaketa normal estandarrak baino mutur orduan eta astunagoak ditu. n > 30 denean, banaketa normal estandarraren ia berdina da. Hura bezalaxe, simetrikoa da x = 0 ardatzari buruz. t n n = 30 n = 2 n = 1 0 Josemari Sarasola Proba parametrikoak 8 / 20
Froga parametrikoak Eranskina: Student-en t banaketa Student-en t banaketaren balioak taularatuta daude n 30 balioetarako. Taulak azpitik probabilitate zehatzak uzten dituzten balioak ematen ditu. 0.5eko beherako probabilitateetarako simetriaren propietatea erabiltzen da. Adibidez: t t 4 ; P [t < t 0 ] = 0.99 t 0 = 3.75 t t 7 ; P [t < t 0 ] = 0.1 t 0 = 1.42 Askatasun-graduak 30 baino gehiago direnean, Student t banakuntza N(0,1) banaketa normal estandar bilakatzen da. William Sealy Gosset kimikariak aurkitu zuen lagin txikien azterketan, garagardoen propietateen ikerketan. Ikerketa horiek Student ezizenarekin argitaratu zituen 1908 urtean eta hortik datorkio izena. Josemari Sarasola Proba parametrikoak 9 / 20
Zenbatesleen lagin banaketak Lagin batezbestekoa, eredu ez normala, σ ezaguna Lagin-tamaina handia (n > 30) izan behar da: x N(µ, σ n ) Josemari Sarasola Proba parametrikoak 10 / 20
Zenbatesleen lagin banaketak Lagin batezbestekoa, eredu ez normala, σ ezezaguna Lagin-tamaina handiaren kasuan (n > 30): x N(µ, ŝ n ) Josemari Sarasola Proba parametrikoak 11 / 20
Zenbatesleen lagin banaketak Lagin batezbestekoa: laburpena Pop. normala Pop. ez-normala, n > 30 σ ezaguna ( ) σ x N µ, n ( ) σ x N µ, n σ ezezaguna t = x µ t ŝ n 1 n ( ) ŝ x N µ, n Josemari Sarasola Proba parametrikoak 12 / 20
Zenbatesleen lagin banaketak ˆp lagin proportzioa Adibidez, 20 pieza jasota lagin batean, 4 akastun badira, akastunen lagin proportzioa 4/20=0.2 da. p populazioko proportzioa zenbatesteko erabiltzen da. Horren lagin banaketa hau da, n > 30 lagin-tamainetarako: ˆp N ( p, pq n ) Josemari Sarasola Proba parametrikoak 13 / 20
Zenbatesleen lagin banaketak s 2 lagin bariantza, eredu normala Gogoratu: s = ŝ = ŝ 2 = ns 2 σ 2 i (x i x) 2 n = i (x i x) 2 n 1 n n 1 s2 s 2 = n 1 n ŝ2 χ2 n 1 i x2 i n x 2 Josemari Sarasola Proba parametrikoak 14 / 20
Parametroen balioak nola zehaztu Aurrekoetan ikusi dugunez, lagin banaketetan parametroaren balioa agertzen da. Parametroa ez da ezaguna, definizioz. Nola jarriko dugu orduan horren balioa lagin banaketan? Erantzuna: hipotesi nulupean hartzen den parametroaren balioa jartzen da lagin banaketan. Josemari Sarasola Proba parametrikoak 15 / 20
Probak ebazteko metodoak Funtsean bi dira: p-balioaren metodoan, gertatu denaren (edo are eta arraroagoa denaren) probabilitatea (p-balioa) kalkulatzen da, eta hura alfarekin alderatu; eremu kritikoaren metodoan, alfa probabilitateari dagokion zenbateslearen balio-tartea zehazten da, eremu kritikoa alegia, eta zenbatesleak emandako balioa horren barruan dago, hipotesi nulua baztertu egiten da. Eremu kritikoa mugatzen duten balioak balio kritikoak dira. Josemari Sarasola Proba parametrikoak 16 / 20
Alde bakarreko eta alde biko probak Alde bakarreko probetan arraroa edo eskualde kritikoa alde bakar batean dago. Alde biko probetan arraroa bi muturretan banatzen da. Beraz, aldebiko frogetan erreferentzia mutur bakoitzean α/2 da. Hartara,p-balioa α/2 balioarekin alderatu behar da. Froga alde bakarrekoa edo alde bikoa den hipotesi nuluari erreparatuz jakin dezakegu. Orokorrean: H 0 : θ = θ 0 alde biko froga H 0 : θ > θ 0 H 0 : θ < θ 0 } alde bakarreko froga Josemari Sarasola Proba parametrikoak 17 / 20
Hipotesi anitzak H 0 : µ > 4 eta H 0 : σ 2 < 1 gisako hipotesi nuluak anitzak dira, balio bat baino gehiago barnehartzen dituztelako (H 0 : µ > 4 kasuan, 4 baino handiagoak diren balio guztiak). Kasu horietan, zein parametro balio ezarri behar da froga garatzean? Erantzuna: muga balioa, zehatzak izateko; adibidez, H 0 : µ > 4 kasuan, µ = 4 baliatu behar da. Gero, hedaduraz, beste balioak onartu edo baztertu ahal izango dira. Josemari Sarasola Proba parametrikoak 18 / 20
Hipotesi nulurako irizpideak H 0 finkatzerakoan, lehentasun-ordena edo mailakatze hau jarraituko dugu froga parametrikoetan: 1: hipotesi nulu jakin bat probatzeko eskatzen bada enuntziatuan, horixe bera hartuko dugu hipotesi nulutzat; 2: aurrekoaren ezean, galdetu, probatu edo erabaki nahi denaren aurkakoa hartuko da, zuhurtasunez. Adibidez: Normalean batez besteko ekoizpena 100 da. Jaitsi al da? Kasu honetan, H 0 : µ > 100 hartuko da, gertatuaren aurkako irizpideak bestelakoa hartu behar dela adierazi arren. 3: aurrekoen ezean eta haiekin kontraesanik ez badago, gertatuaren aurkako hipotesia hartuko da. Adibidez: Normalean batez besteko ekoizpena 100 da. x = 110. Kasu honetan, H 0 : µ < 100 hartuko da, gertatuak adierazten duenaren aurkakoa. Josemari Sarasola Proba parametrikoak 19 / 20
Hipotesi nulurako irizpideak Ikastaroan zehar, bereziki gertatuari erreparatu diogu hipotesi nulua finkatzeko. Izan ere, gehienetan galdetu, frogatu edo erabaki nahi dena gertatuak erakusten duenak adierazten digu. Hau da, gertatuari buruzko informazioa eskura, gehienetan ez dago kontraesanik 2. eta 3. mailako irizpideen artean. Josemari Sarasola Proba parametrikoak 20 / 20