1 4. Hipotesiak eta kontraste probak. GAITASUNAK Gai hau bukatzerako ikaslea gai izango da ikerketa baten: - Helburua adierazteko. - Hipotesia adierazteko - Hipotesi nulua adierazteko - Hipotesi nulu estatistikoa adierazteko (bai matematikoki eta bai idatziaz) - Inferentzia eginaz bi aldagaien artean harremana dagoen edo ez frogatzeko. Ordenagailuak ez daki nik ze diseinu egin dudan: ze laginarekin, ze biztanlerian... hori dena ikerlariak daki. Ordenagailuari galdera matematikoak egiten zaizkio eta berak erantzun egiten du. Hipotesia harremanezkoa edo kausala izan, hipotesi estatistiko bera izango dute. Gero, diseinuaren arabera ikerlariak esango dut zer frogatu duen: harremana edo kausalitatea, eta zein biztanlerian, biztanleriaren arabera. Hipotesi kausala: A'k eragina du B'n (A-->B). Harremanezko hipotesia: A'ren eta B'ren artean harremana dago (A<-->B). Hipotesi kausala probatu nahi badugu, saiakuntza egin beharko dugu. Harremana frogatzeko nahikoa da ikerketa epidemiologikoa. Bi kasutan, ordenagailuari probatzea eskatzen dioguna harremana da. Diseinua saiakuntza bada, harremana kausala izango da, bestela ez. Hipotesi estatistikoa: harremana dago. Hipotesi estatistiko nulua: ez dago harremanik. Hipotesi estatistiko nulua, matematikoki ere idatzi daiteke. Proba estatistiko bakoitzak bere hipotesi nulua matematikoki idazteko era bat dauka. Aldagaiak nolakoak diren kontutan hartuta hiru aukera daude: 1 2 kualitatibo 2 kualitatibo-kuantitatibo 3 2 kuantitatibo
2 1: 2 aldagaiak kualitatiboak A eta B, bi aldagai kualitatibo, bakoitza bere kategoriekin (A1, A2, A3..B1, B2, B3...) B 1 B 2 B n A 1 A 2... A n Harremana badago A eta B aldagaien artean, B n en balioak ezberdinak izango dira Aren kategoria ezberdinetan. Adb: Harremana dago Sexua eta inpulsiboa izatearen artean? A: sexua B: inpulsiboa 0: emakumea 0: ez 1: gizona 1: bai Zein da inpulsiboen portzentaia gizonen artean? Eta emakumeen artean? emakumeengan gizonezkoengan Inpulsiboak p 1 p 2 Bi aldagai hauen artean harremana balego, inpulsiboen portzentaia ezberdina izango litzateke gizonengan eta emakumeengan (p1=p2). Bi ezaugarrien artean harremana dagoen edo ez ikusteko, inferitu egin behar dugu biztanleriara. Biztanlerian ere ez dute berdinak izan behar (π1=π2), bi ezaugarri horien artean harremana dagoela frogatzeko. Aldagaientzat eta laginarentzat ikusi duguna egia da. Inferitu dezakegu ezaugarrietara eta biztanleriara? Hipotesi estatistiko nulua (matematikoa) berdintasuna bezala planteatzen da: Biztanlerian inpulsiboen portzentaia berdina da emakumeen artean eta gizonen artean. (π1=π2) Orokorrean: (π1=π2=π3...) Horixe galdetzen diogu ordenagailuari. Galdetzen diogu zein den hipotesi nuluaren probabilitatea. Probabilitate hori %5 baino txikiagoa bada, baztertu egiten da hipotesi
3 nulua eta ordezkoa onartzen da: Biztanlerian ez dira berdinak proportzioak, beraz harremana dago ezaugarrien artean. Hipotesi nuluaren probabilitatea Hipotesi nulua (π1=π2) Harremana? >0,05 (π1=π2) > Ez da frogatu <0,05 (π1=π2)-- -------------- Harremana dago Kontuz! Ez da berdin: (π1=π2=π3...) (π1#π2#π3...) (Ez dira berdinak) (ezberdinak dira) Hipotesi nulua arbuiatzean ondorioztatzen dugu "ez dira berdinak" eta ez "ezberdinak dira". Aldagai kualitatiboak dikotomikoak badira: bi ez badira berdinak, ezberdinak dira. Politomikoak direnean, adibidez hiru, hiru berdinak ez izateak ez du esan nahi ezberdinak direnik, bi berdinak eta bat ezberdina izan daitezke eta. Erabili behar den proba estatistikoa kasu honetan hipotesi nuluaren probabilitatea kalkulatzeko? Txi karratuaren proba da.
4 2. aldagai bat kualitatiboa eta bestea kuantitatiboa Laginean ikusten duguna batezbestekoak dira. Adb: harremana dago sexua eta altueraren artean. Aldagaiak: Sexua Altura 0: emakumea m (emakumeen altueraren batezbestekoa) 1: gizona m (gizonen altueraren batezbestekoa) Bi batezbestekoak ezberdinak badira, horrek esan nahi du harremana dagoela bi aldagaien artean laginean. Eta biztanlerian ezaugarrien artean? µ eta µ ezberdinak badira, biztanlerian bi ezaugarrien artean harremana dagoela esan nahi du. Hipotesi estatistiko nulua (matematikoa): biztanlerian altueraren batezbestekoak berdinak dira gizonen artean eta emakumeen artean. µ =µ Eta orokorrean: µ1=µ2=µ3... Ordenagailuari galdetzen diogu hipotesi nuluaren probabilitatea: 0,05 baino txikiagoa bada, baztertu egingo dugu eta ondorioztatuko dugu harremana dago bi ezaugarrien artean. Hipotesi nuluaren probabilitatea Hipotsi nulua (µ1=µ2) Harremana? >0,05 (µ =µ ) > Ez da frogatu <0,05 (µ =µ )-- -------------- Harremana dago Kontuz! Ez da berdin: (µ1=µ2=µ3...) (µ1#µ2#µ3...) (Ez dira berdinak) (ezberdinak dira) Hipotesi nulua arbuiatzean ondorioztatzen dugu "ez dira berdinak" eta ez "ezberdinak dira", eta ondorioz harremana dago.
5 Horretarako proba estatistikoak: - Parametrikoak: Potenteagoak dira. - Ez parametrikoak Proba parametrikoak erabiltzeko baldintzak: Aldagai kuantitatiboaren banaketak: - Normala izan behar du aldagai kualitatiboaren kategoria guztietan. (normaltasunaren baldintza) - Kategoria ezberdinetako banaketen bariantzek berdintsuak izan behar dute (homozedastizitatearen baldintza). Aldagai kualitatiboak 2 kategoria Aldagai kualitatiboak bi kategoria baino gehiago Proba Parametrikoak Student-en t ANOVA (Bariantzaren analisia) Proba Mann Withney-n U Krusskall Wallis Ez parametrikoak
6 3: 2 aldagaiak kuantitatiboak. Hipotesi nulua: ez dago korrelazio linealik biztanlerian. Laginean korrelazio lineala dagoen ikusten da. Horrek esan nahi du nire hodei puntua ondo egokitzen den lerro batetara. Demagun altura eta pisuaren artean harremana dagoen ikusi nahi dugula. Donostiako lagin adierazgarria hartu eta altura eta pisua neurtzen diet. Ondoren grafiko batean altura eta pisua errepresentatzen ditut. Irudian argi ikusten da puntu hodeia lerro baten inguruan dagoela. Zenbat eta altura gehiago pisu gehiago. Bi aldagaien artean harremana dagoela ikusten da, eta lineala dela ere bai. Harreman lineala neurtzen du Pearson-en korrelazio linealaren koefizienteak(r). Bi aldagai kuantitatiboen artean ere korrelazioa egon daiteke eta lineala ez izan. Korrelazioa: - Lineala - Lerromakurra: esponentziala, logaritmikoa...
7 Guk korrelazio lineala bakarrik ikasiko dugu, hori baita erabiliena. r-en balioak ikusita korrelazio linealik badagoen edo ez esan genezake. Gutxienez 0,6 koa izan beharko du korrelazio lineala dagoela esateko. Eta guk laginean aldagaien artean ikusi dugun korrelazio lineal hori ematen da biztanlerian ezaugarrien artean? Hori ordenagailuari galdetzen diogu eta ordenagailuak asmatzeko probabilitatea emango digu. Hipotesi nulua: biztanlerian ez dago korrelazio linealik ezaugarrien artean. Hipotesi nuluaren probabilitatea Hipotesi nulua (r=0) Harremana? >0,05 (ρ=0) > Ez da frogatu <0,05 (ρ=0) -- -------------- Harremana dago
8 Ondorengo taulan erabiltzen ditugun froga estatistikoak daude. Erabilienak dira: - Bi portzentaien arteko berdintasuna: Txi karratu froga. - Bi batazbestekoen arteko berdintasuna: Student-en t - 3, 4... batazbestekoen arteko berdintasuna: ANOVA - 2 ezaugarri kuantitatiboen arteko harreman lineala. ALDAGAIAK PROBA PARAMETRIKOAK PROBA EZ PARAMETRIKOA 2 Aldagai kualitatibo Txi karratu proba Kualitatibo-Kuantitatibo Student-en t - Kualitatibo 2 maila ANOVA F - >2 maila 2 Aldagai kuantitatibo Korrelazio lineala χ Mann Witney'n U Krusskall Wallis χ2 Korrelazio ez parametrikoa r (Pearson)
9 Adibideak: Hipotesi guztiak, hipotesi nulu gisa planteatu behar ditugu: Ezberdindu beharrekoak: - Susmoa - Hipotesia - Hipotesi nulua - Hipotesi nulu estatistikoa -SUSMOA: Bularreko minbizia ugariagoa da 50 urtetik aurrera: - Hipotesia: harremana dago bularreko minbiziaren eta adinaren artean (adina-bularreko minbizia) - Hipotesi nulua: ez dago harremanik bularreko minbiziaren eta adinaren artean. - Hipotesi nulu estatistikoa (matematikoa): Ho: π1=π2 Bularreko minbizia dutenen portzentaia berdina da biztanlerian: - (<50) 50 urte baino gutxiago dutenen artean (π1) - (>50) 50 urte edo gehiago dutenen artean (π2) -SUSMOA: Mutilek neskek baino gehiago neurtzen dute: - Hipotesia: harremana dago sexuaren eta altueraren artean (sexua-altuera) - Hipotesi nulua: ez dago harremanik sexuaren eta altueraren artean. - Hipotesi nulu estatistikoa (matematikoa): Ho: µ =µ Altueraren batezbestekoa berdina da biztanlerian: - mutilena (µ ) - neskena (µ )
10 Ots!! Kontraste froga estatistikoek, Hipotesi nuluaren probabilitatea kalkulatzen dute. Probabilitate hori txikia denean, (p<0.05) BIZTANLERIAREN parametroak (portzentaiak edo batazbestekoak) berdinak izateko probabilitatea txikia dela esan nahi du. Horregatik hipotesi nulua baztertu eta ordezkoa onartzen dugu (ez dira berdinak). Ondorioa da biztanlerian ezaugarrien artean ere harremana dagoela. Probabilitate hori 0.05 baino handiagoa denean (p>0.05), ezin dugu esan parametro horiek berdinak ez direnik. s: hipotesi nuluaren probabilitatea (adierazgarritasun maila) p<0.05: estatistikoki adierazgarria dela esaten dugu. Mundu mailan, p<0.05 da onartzen den adierazgarritasun maila Ariketa - Ikerketa bat egiteko daukazun susmoa idatzi. - Idatzi hipotesia - Idatzi hipotesi nulua. - Idatzi hipotesi nulu estatistikoa