Tet záladých štattcých hpotéz Peter Kvača KJFB FMFI UK (Projet KEGA 003UK-4/0) Obah. Štatta a Webe, voľe dotupé materál a oftware. Úvod do tetovaa štattcých hpotéz 3. Hpotéz o tredých hodotách 4. Alteratíve áhodé premeé 5. Tet dobrej zhod a otgečé tabuľ 6. Aalýza rozptlu a vacáobé porovaa 7. Leára regrea
Tet záladých štattcých hpotéz. Zdroje a Webe a voľe dotupé materál Na Webe ájdete všet potrebé átroje pre záladú štattu - študjé materál, štattcé alulátor oftvér a tahute. V tomto prehľade om a útredl a vec, toré ú zadarmo a môžete ch vužť pr rešeí úloh. Materál o štatte, o-le učebce, člá a pod. Stattc.com (http://www.tattc.com) Veľé možtvo odazov a štattcé trá a oftvér a Webe. Nájdete tu väčšu aledujúcch odazov. Stattc at Square Oe (http://bmj.bmjjoural.com/collecto/tatb/de.html) O-le štattcá príruča pre medov, obahuje prehľad záladých štattcých tetov eáročým, ale celom dobrým výladom. Nájdete tu všet tet, o torých bude reč v tomto doumete, aj príladm a tabuľam rtcých hodôt. HperStat Ole Stattc Tetboo (http://davdmlae.com/hpertat/) O-le príruča, oretovaá a aalýzu rozptlu, porýva ale zálad štatt a záladé tet. Neechajte a zechutť trochu zmäteou úpravou; veľm odporúčam odaz a é tet pr jedotlvých čatach; ta ájdete aprílad t-tetu celý zozam rôzch tetov. Stačí vbrať. Ďalše užtočé odaz ájdete a úvodej tráe. VaarStat: Rchard Lowr (http://facult.vaar.edu/lowr/webtet.html) O-le ža, veľm odporúčam. Starše verze tetov a dajú tahuť v pdf (čať Prtg). Orem toho tu o-le ájdete možtvo užtočých pomôco, aprílad alulátor vatlových fucí pre štadardé ormále, t-, F- a χ rozdelee. Electroc Stattc Tetboo (http://www.tatoft.com/tetboo/tathome.html) To je o-le mauál programu Stattca, ale tojí za to aj ám oebe. NIST/Sematech Stattcal Tetboo (http://www.tl.t.gov/dv898/hadboo/de.htm) Ižer oretovaá štatta. Podrobá a dôladá. Neájdete tu bologc a medcí oretovaé vec, ao štattu dôb prežta. Ale to čo ájdete je aozaj dobré. Practce of Bue Stattc (http://bc.whfreema.com/pb/page/bcma.ap?0080&99000&9980.0&vcategor&o&0&ud0&rau0) Tu ájdete uážové aptol z ž pre eoómov. Veľm odporúčam, aj eď z vecí, toré potrebujete pre teto urz, je tam ba ANOVA a eparametrcé tet.
Tet záladých štattcých hpotéz 3 Dotupý štattcý oftvér Väčšu príladov v tomto tete om počítal v Ecel a otroloval v R. Z R pochádzajú aj rajše graf, te šaredše ú amozrejme z Ecelu. Mcrooft Ecel Ecel vám tačí a väčšu počítaa, a ájdete rtcé hodot pre etoré špecále tet (aprílad Tueho alebo eparametrcé tet) a Webe. Ecel je vbaveý možtvom štattcých fucí (Aaltcé átroje), toré ú vša. čato ešové (htogram), chbé (štadardé odchýl, čar tredu) alebo používajú etradčé ovece, toré orem Mcrooftu epoužíva to ý (porada). Prehľad vecí, toré v Ecel efugujú, píal v peom čláu Ha Pottel (Stattcal flaw Ecel, http://www.m.covetr.ac.u/~hut/pottel.pdf). Preto odporúčam počítať radšej všeto ruče. (Ja om a evhol použtu fue pre výberovú varacu, pretože človeu a echce zaaždým zraďovať tĺpec rozdelov). Na druhej trae, Ecel ao programovateľý tabuľový alulátor je deále protrede pre prácu dátam. A a ebudete polehať a jeho štattcé fuce, budete pracovať pohodle a rýchlo. Ešte upozorím a deaté čar: A budete preášať dáta z aglc hovoraceho programu do če alebo love hovoraceho Ecelu, arazíte a problém deatým čaram a bodam. Použte ao medztacu tetový edtor alebo Word a ahraďte bod čaram alebo aopa. Komerčý štattcý oftvér Sem patra program ao Stattca, SAS, SPSS a pod., toré ú poväčše rozprávovo drahé. A máte to šťate, že m máte prítup, vužte to. Štattcý oftvér zadarmo R R je otvoreý tém pre štattcé výpočt. Je podobý Matlabu, tvorí ho teratíva ozola možoťou púšťaa rptov. Protrede je oprot veľým omerčým programom trocha parťaé, ale vďaa dobrej doumetác a aučíte robť záladé vec rýchlo a efetíve. Vďaa programovateľot máte avše dpozíc možot, toré v omerčých programoch pravdla emáte, to a týa predovšetým rozahlch možotí mulácí a moderých výpočtovo áročých štattcých metód. Domová tráa je www.r-project.org, program môžete tahuť zadarmo aj doumetácou a rozšrujúcm balím z www.cra.r-project.org. OpeStat4 a PAST (http://www.tatpage.org/mller/opetat/) (http://fol.uo.o/ohammer/pat/) Toto ú pomere malé programí, roba väčšu vecí, toré budete potrebovať, le muíte príť a to, ao - ale ebude to áročé. Štattcý oftvér, torý môžete tahuť a vúšae lstat a StatTool (http://www.ltat.com/ a http://www.palade.com/tattool/) Toto ú dopl Ecelu, toré ho vbavujú rozahlm štattcým možoťam. lstat je overeý a veľm dobrý, ale aj veľm drahý. StatTool je romejší produt, ale tež vám bude tačť. A tahete tral verze, bude a vám pracovať pohodle a efetíve.
Tet záladých štattcých hpotéz 4 Štattcé alulátor a Webe StatPage.et (http://statpage.org) Tu ájdete odaz a veľý počet rôzch alulátorov, vrátae alulátorov pre štattcé tet a leáru regreu. Orem toho tu ájdete veľa ďalších odazov a materál o štatte a štattcý oftvér. WebStat (http://www.webtatoftware.com) Úple záladé štattcé tet, pohodlé ačítae dát, grafa. VaarStat: Rchard Lowr (http://facult.vaar.edu/lowr/webtet.html) Možtvo užtočých pomôco, aprílad alulátor vatlových fucí pre štadardé ormále, t-, F- a χ rozdelee. Tabuľ a alulátor rtcých hodôt Záladé tabuľ rtcých hodôt môžete tahuť aprílad zo tráo VaarStat v pdf formáte.
Tet záladých štattcých hpotéz 5. Úvod do tetovaa štattcých hpotéz Vzťah medz štattcým rozdeleam a tetm hpotéz Prpomeeme záladé fat o dôležtých štattcých rozdeleach. Teto vám čato môžu polúžť pr výbere vhodého štattcého tetu v daej tuác. T-tet Nech má áhodá premeá X ormále rozdelee ulovou tredou hodotou a varacou σ. Nech je ďalej pozorovaá hodota áhodej premeej a štadardá odchýla ν tupňam voľot. Potom velča t má t- (Studetovo) rozdelee ν tupňam voľot. S pravdepodoboťou -α bude pre t platť: t < t t < t ν, α / ν, α t > t ν, α de t ν,-α/ a t ν,-α ú prílušé rtcé hodot t-rozdelea daým počtom tupňov voľot. t má zmel podelu gál/šum. T-tet použjeme tam, de chceme ztť, č je hodota rozdeleím, e veľm odlšým od ormáleho, výzame odlšá od ul: pre tetovae hpotéz o tredých hodotách, oefcetoch leárej regree a pod. χ tet Nech ú X, X,... X ezávlé áhodé premeé ormálm rozdeleím (e evhute rovaým pre všet velč). Nech ξ,,,... ú odhad velčí X, <X >ξ, <(X ξ ) >σ. Potom velča χ ξ σ má rozdelee χ -p tupňam voľot, de p je počet parametrov, vpočítaých z hodôt. Taže pravdepodoboťou -α platí χ < χ α χ je účet štvorcov odchýlo od očaávaých hodôt. Taéto tet teda použjeme tam, de budeme chceť merať odchýl pozorovaých a očaávaých (úborov) hodôt (aprílad tet dobrej zhod a otgečé tabuľ). F tet Majme dva úbor ezávlých hodôt ormálm rozdeleím rovaou varacou:
Tet záladých štattcých hpotéz 6 [ ] [ ] ( ) ( ),,,,, ~,,,,, ~ Y N Y N X σ µ σ µ Potom pomer štadardých odchýlo F má rozdelee F - a - tupňam voľot. Taáto štatta a používa v celom rade tetov, pretože veľm čato veme za predpoladov ulovej hpotéz zíať dva ezávlé odhad štadardej odchýl (aalýza rozptlu -ANOVA, tet adevátot modelov).
Tet záladých štattcých hpotéz 7 3. Hpotéz o tredých hodotách Jedovýberový tet: µ µ 0 Nech X,,,..., ú..d. N[µ,σ ] (..d. ezávlé rovaým rozdeleím, z agl. depedet detcall dtrbuted). Predpoladajme, že máme dôvod očaávať, že tredá hodota X má špecfcú hodotu µµ 0. Nech je výberová tredá hodota a výberová varaca X ( X ) Pre tet hpotéz H0: µµ 0 prot (dvojtraej) alteratíve H: µ µ 0 alebo jedotraým alteratívam H-: µ<µ 0, rep. H+: µ>µ 0 použjeme tetovacu štattu t µ 0, torá má t- (Studetovo) rozdelee - tupňam voľot, a rtcé oblat W W W H H H + { t : t < t, α / } { t : t < t, α } { t : t < t }, α de t ν,-α/ a t ν,-α ú prílušé rtcé hodot t-rozdelea - tupňam voľot. Pozám jedovýberovému t-tetu Uvedeý tet predpoladá ormále rozdelee hodôt v tetovaom úbore dát. Našťate, t-tet je robutý vzhľadom merm odchýlam od ormalt, čo zameá, že etráca platoť, a a rozdelee dát mere odlšuje od ormáleho. Vo všeobecot možo povedať, že robutoť je žša pre tet prot jedotraým alteratívam leá hladou výzamot α rate objemom úboru.
Tet záladých štattcých hpotéz 8 Prílad Výrobca vrobl zaradee, toré má putť alarm, a ocetráca lčía uhoľatého vo vzduchu preahe 0 mg/m 3. Chceme overť, č zaradee utoče pracuje podľa špecfáce. Pre overee a uutočl aledujúc epermet: Do omor o zámom objeme apleej zo začatu vzduchom bez CO a potupe vpúšťal záme možtvá CO a ledovalo a, pr torej ocetrác a atvuje alarm. Potup a opaoval oemáťrát aledujúcm výledam: Kocetráce CO potrebé pre putee alarmu Tetovaca štatta je Merae cco, mg.m -3 0,5 0,37 3 0,66 4 0,47 5 0,56 6 0, 7 0,44 8 0,38 9 0,63 0 0,40 0,39 0,6 3 0,3 4 0,35 5 0,54 6 0,33 7 0,48 8 0,68 µ 0,43 0 t 0,039 0 3,07 freveca 0 3 4 5 6 7 Htogram cco 0.0 0. 0. 0.3 0.4 0.5 0.6 0.7 cco Pre uvedeé hodot máme: 8 0,49 mg / m 0,40 mg / m 0,09476( mg / m 0,00080 ( mg / m 0,039 mg / m 3 3 3 3 3 ) ) Pre ztee rtcých hodôt t7,0, 975 pre tet H0 prot H a t7,0, 95 pre tet H0 prot H+ môžeme použť Mcrooft Ecel a fucu TINV(*p, počet t. voľot), alebo štattcé tabuľ, alebo alulátor a Webe. Nájdeme t 7,0, 975, a t 7,0, 95,74. Pretože me ašl t3,07, zametame ulovú hpotézu pre dvoj- jedotraú alteratívu, prčom vdo, že aša hodota t je veľm voá. Alteratíve môžeme vpočítať pravdepodoboť zíaa rovaej alebo vššej hodot t za predpoladu ulovej hpotéz. Použjeme buď fucu TDIST(t, počet t. voľot, počet trá) z Ecelu, štattcé tabuľ alebo alulátor a Webe. Dozveme a, že pravdepodoboť je rádu 0-0, teda zaedbateľá. Sutoče, 95%-ý terval poľahlvot pre µ je (alebo a povedaé, pravdepodoboťou 95% platí): t 7;0,975 0,36 µ 0,50 µ t7;0,975 Záver: Tetovaé zaradee atvuje alarm pr hodote štattc výzame vššej ež 0 mg/m 3. Ao vdo z htogramu dát, taýto výledo je celom zrejmý. Pretože vaše oo je ajlepší štatt, používajte ho a ým začete počítať, ajôr dáta zobrazte.
Tet záladých štattcých hpotéz 9 Prílad Naledujúce dáta ú teleé teplot rabov prílvového páma po tom, ao a dotal a vzduch pr ooltej teplote 4,3 C. Úloha je ztť, č je teleá teplota rabov rová teplote oola alebo a od ej líš. Teleé teplot rabov prílvového páma pr voajšej tepolte 4,3 C Merae Teplota, C 5,80 4,60 3 6,0 4,90 5 5,0 6 7,30 7 4,00 8 4,50 9 3,90 0 6,0 4,30 4,60 3 3,30 4 5,50 5 8,0 6 4,80 7 3,50 8 6,30 9 5,40 0 5,50 3,90 7,00 3 4,80 4,90 5 5,40 Počet 0 3 4 5 6 Htogram teleých teplôt 3 4 5 6 7 8 9 Teleá teplota, C Pre uvedeé hodot máme: 5 5,08 C,800433( C),3480 C 0,0707 ( C) 0,6836 C Tetovaca štatta je µ 5,08 4,3 t 0,6836 0,7 a rtcá oblať pre tet prot dvojtraej alteratíve je t t 4;0, 975. Pre ztee rtcých hodôt t4,0, 975 pre tet H0 prot H môžeme použť Mcrooft Ecel a fucu TINV(*p, počet t. voľot), alebo štattcé tabuľ, alebo alulátor a Webe. Nájdeme t 4,0, 975,06. Pretože me ašl t,7, zametame ulovú hpotézu. Môžeme tež vpočítať pravdepodoboť zíaa rovaej alebo vššej hodot t za predpoladu ulovej hpotéz. Použjeme buď fucu TDIST(t, počet t. voľot, počet trá) z Ecelu, štattcé tabuľ alebo alulátor a Webe. Dozveme a, že pravdepodoboť je 0,0. 95%-ý terval poľahlvot pre µ je: t 4;0,975 4,47 µ 5,58 t µ 4;0,975 Záver: Teleá teplota rabov je štattc výzame všša ao teplota ooltého vzduchu. V tomto prípade me etetoval jedotraú alteratívu, pretože z oolotí jao evplývalo, torým merom b a mala teleá teplota rabov odchľovať od teplot oola.
Tet záladých štattcých hpotéz 0 Dvojvýberový tet: µ µ Nech X,,,..., ú..d. N[µ,σ ], Y,,,..., ú..d. N[µ,σ ]. Potrebujeme tetovať hpotézu µ µ prot dvojtraej alteratíve µ µ alebo jedotraým alteratívam µ <µ, rep. µ <µ. Ia povedaé, zaujíma á, aý veľý muí bť rozdel medz výberovým tredým hodotam (artmetcým premerm X a Y, ab me mohl pochbť predpolad µ µ. Nech ú výberové tredé hodot a výberové varace Y X X X ) ( ) ( Pre tet hpotéz H0: µ µ prot dvojtraej alteratíve H: µ µ alebo jedotraým alteratívam H-: µ <µ, rep. H+: µ >µ použjeme tetovacu štattu t + + Tato íce doážeme vpočítať, eveme ale určť jeho počet tupňov voľot. Ďalší potup záví od dodatočého predpoladu o varacách hodôt X a Y: () Rovaé varace: σ σ. Predpolad o rovot varací ám umožňuje vpočítať lepší odhad poločej výberovej varace 0 (účet štvorcov odchýlo od premeru pre X a Y, deleý počtom ezávlých štvorcov): ) ( ) ( 0 + + Teto odhad potom použjeme ameto prílušých výberových varací pr výpočte : + + 0 0 0 Prílušý počet tupňov voľot je + ν. () Rôze varace: σ σ. V tomto prípade eveme vlepšť odhad, a zo štattcého hľada je to zložtá tuáca. Táto úloha a azýva Behreov-Fherov problém a etuje ej rozahla lteratúra a vacero rešeí. De a štadarde používa jedoduché a dotatoče poľahlvé rešee, toré a azýva Welchovo prblžé t. Počet tupňov voľot pre, a teda pre tetovacu štattu t, a počíta ao vážeý harmocý premer:
Tet záladých štattcých hpotéz + ν + V oboch prípadoch, () aj (), má tetovaca štatta t Studetovo rozdelee ν tupňam voľot (de ν je odlšé podľa toho, č ú varace rovaé alebo e), a rtcé oblat ú W W W H H H+ { t : t < tν, α / } { t : t < tν, α } { t : t < t } ν, α de t ν,-α/ a t ν,-α ú prílušé rtcé hodot t-rozdelea - tupňam voľot. Rovao možo tetovať hpotéz o predpoladaom rozdele medz tredým hodotam. Koréte, pre tet hpotéz H0: µ -µ µ 0 prot dvojtraej alteratíve H: µ µ µ 0 alebo jedotraým alteratívam H-: µ µ <µ 0, rep. H+: µ µ >µ 0, de µ 0 je predpoladaý rozdel, použjeme tetovacu štattu t µ 0 a potupujeme rovao. Pozám dvojvýberovému t-tetu Narušee predpoladov o ormálom rozdeleí dát Aj dvojvýberový t-tet je robutý vzhľadom a začé odchýl od ormalt, a to ajmä: a ú veľot úborov rovaé alebo temer rovaé, a tetujeme dvojtraé hpotéz, a ú úbor veľé, a epoužívame prílš íze hlad výzamot (apr. α<0,0). σ, bude tet potovať právu hladu výzamot, a ú veľot úborov A σ rovaé, a bude mere ozervatív (teda utočá hlada výzamot bude žša ež predpoladaá), a väčší úbor pochádza z rozdelea väčšou varacou. Tet bude dávať chbé výled, a meší úbor pochádza z rozdelea väčšou varacou. Použte tetu pre σ a σ σ σ Teto tet ú detcé, a alebo. A a varace ú výraze odlšé (pomer väčší ao 3), je Welchov tet lepší. Naopa, a ú varace rovaé, je lepší tet pre rovaé varace. Netorí autor odporúčajú rozhodúť o použtí varat tetu a zálade štattcého tetu hpotéz o rovot varací (apr. F-tetu alebo Bartlettovho tetu). Teto tet ú vša omoho ctlvejše a odchýl dát od ormalt ež amotý t-tet, a teda ch výled v utočot čato ebudú relevaté. Etuje moho prác, uazujúcch, že eetuje prípad, ed b rozhodute a zálade tetu a rovoť varací dávalo lepše výled ež jedoduché rozhodute o použtí etorého tetu a zálade hrubého porovaa štadardých odchýlo.
Tet záladých štattcých hpotéz Prílad 3 Naledujúce dáta pochádzajú z práce Studeta (908). Supa 0 študetov bola áhode rozdeleá a dve rovaé up po 0, a študetom v aždej upe bol podaý preparát, predlžujúc páo. Dáta ú rozdel v dĺže páu pred podaím preparátu a po podaí. Pre zmeu uvádzame dáta lafujúcou premeou, čo je obvlý pôob pr omplovaejších pláoch epermetu (vac upí a vac lafácí). Zmea dĺž páu po podaí jedého z dvoch preparátov upa čílo zmea upa 0,70 -,60 3-0,0 4 -,0 5-0,0 6 3,40 7 3,70 8 0,80 9 0,00 0,00,90 0,80 3,0 4 0,0 5-0,0 6 4,40 7 5,50 8,60 9 4,60 0 3,40 počet 0.0.0 počet 0.0.0-0 4 6 zmea upa - 0 4 6 zmea Pre uvedeé hodot máme:,, X Y 0 0 0,75,33 3,0 4,009 0,30 0,4009 Z štrutážch dôvodov urobíme tet pre prípad rovaých rôzch varací. Tet σ σ σ σ 0 0,3605 ˆ 0,685 0,685 ν 8 7,776 t ˆ,8608,8608 t ν ;0,975,009,08 t ν ;0,95,734,735 Z uvedeých údajov vdo, že rozdel medz výledam oboch tetov je zaedbateľý. Je to pôobeé tým, že varace a líša ba málo (hraca medz málo a veľa je pomer väčšej varace mešej oolo ). Záver: V tomto prípade je výledo dvojtraého tetu evýzamý (P0,0799 pre obe varat), ým tet prot jedotraej alteratíve H-: µ <µ je štattc výzamý (P0,0397 pre (), P0,0396 pre ()). Prpomeem, že zo štattcého hľada je príputé formulovať hpotéz a zálade preúmaa dát, teto hpotéz ale emožo a tých tých dátach aj tetovať. Preto v prípade, že pred amotým pouom eetoval dôvod očaávať všší efet v druhej upe, je a mete brať do úvah výled dvojtraého tetu. Jedotraý tet tu je uvedeý ba z štrutážch dôvodov.
Tet záladých štattcých hpotéz 3 Tet tredej hodot rozdelu: párový t-tet Tet v tejto čat je tež tetom a rozdel tredých hodôt, vzťahuje a vša a ý plá epermetu: Predpoladajme, že pozorovaa v úboroch X a Y ú orelovaé, X, ú hodot pre ubjet za rozlčých oolotí,,,... V aprílad že { Y } taomto prípade je výhodé zohľadť vzťah medz párm hodôt { X, } Y, preto použjeme ý potup: ameto dvojvýberového tetu hpotéz µ µ budeme tetovať hpotézu µ µ µ d 0 Za štadardých predpoladov o ormálom rozdeleí rozdelov d X Y (d ú..d. N[µ d,σ d ]) môžeme pre tet hpotéz µ d 0 použť jedovýberový t-tet a potup, uvedeý všše. Pozám párovému t-tetu Narušee predpoladov o ormálom rozdeleí dát Teto tet predpoladá, že rozdel d ú..d. ormálm rozdeleím. Teto predpolad môže bť arušeý v dôledu povah dát, aprílad rozdel môžu bť úmeré hodotám (zmea dĺž môže bť úmerá dĺže a pod.). V taýchto prípadoch X možo ameto rozdelu X Y použť ú meru odchýl, aprílad podel, Y X Y relatívu odchýlu a podobe. Ceľom je odtráť závloť d od X a Y a zíať Y podľa možot hodot o metrcým a dobre loalzovaým rozdeleím. Tu veľm pomôže dáta arelť a vúšať rôze varat. Na párový t-tet a vzťahujú aj všet pozám o robutot, uvedeé u jedovýberového t-tetu. Ked používať párový tet Párový tet je vhodý tam, de etuje vzájomý vzťah medz hodotam X a Y. Pr e veľm malých objemoch úborov je párový tet lejší (má mešu pravdepodoboť chb. druhu) ao dvojvýberový t-tet už pr malých orelácách (malej mere leárej závlot X a Y). Naopa, a medz hodotam X a Y eetuje žada oreláca, je dvojvýberový t-tet lejší ao párový tet.
Tet záladých štattcých hpotéz 4 Prílad 4 8 elatcých páov bolo rozdeleých a dvojce ta, ab v aždej dvojc bol pár podobou pružoťou. Nálede bol jede pá z aždého páru a 4 mút pooreý do vod o teplote 65 C. Zotávajúce pá bol poechaé pr zbovej teplote. Po 0 mútach bolo zteé roztahute páov pod váhou,34 g. Má a ztť, č má horúc úpeľ vplv a elatctu materálu. Vplv zahrata a roztahute elatcých páov Pár Voá Izbová Rozdel 44 5 9,00 55 47 8,00 3 53 49 4,00 4 54 53,00 5 5 45 6,00 6 69 59 0,00 7 48 4 6,00 8 5 55-3,00 9 9 86 6,00 0 3 4 0 3 4 5 Izbová teplota 0 40 60 80 300 Zohrate 0 40 60 80 300 Htogram rozdelov Roztahute, zohr.,% 0 40 60 80 300 0 40 60 80 300 Počet 0 3 4 5 Roztahute, zb. t., % -5 0 5 0 5 0 Rozdel,% Použjeme jedovýberový t-tet H0: µ d 0 prot dvojtraej alteratíve H: µ d 0: Z uvedeých dát máme: d 6,33 9 d d d 9 ν 8 t t d 8,0,975 9 ( d d ) d 9 4,389 3,,3 37,5 ν 8 d d,0344 6,033
Tet záladých štattcých hpotéz 5 Záver: Na hlade výzamot α0,05 zametame ulovú hpotézu o ulovej tredej hodote rozdelu medz párm hodôt. Ia povedaé, tredý rozdel v rozťažot je Rozdel v rozťažot d tredé 6,33 je štattc výzamý (P0,04). Pre lutrácu ešte uvedeme výled dvojvýberového t-tetu pre teto dáta. Použjeme tet pre rovaé varace (máme rovaý počet dát), a dotaeme t 0,89 ν 8 ( P 0,857). Pr taejto malej hodote t a etreba pozerať do tabule (rtcé hodot pr α0,05 budú ede oolo t. Ao vdo, dvojvýberový t-tet je v tejto tuác veľm labý, pretože štatta t je ovplveá celovou varabltou medz dvojcam, torá je veľm veľá oprot rozdelom hodôt v jedotlvých dvojcach. Neparametrcé tet Neparametrcé tet ú určeé hlave pre dve tuáce:. Rozdelee dát je veľm vzdaleé od ormáleho. Dáta emajú vattatív charater, ale ú to číla z ejaej šál a možo ch porovávať - tpcým príladm ú šolé zám (ordále dáta) alebo é hodotea. Neparametrcé tet a vzačujú tým, že epracujeme pôvodým hodotam dát, ale poradam. Teda a máme úbor dát X, X,... X, uporadame ch podľa veľot, X Id() X Id()... X Id(),, de Id(j) je de, prlúchajúc j-tej ajmešej hodote pomedz X, X,... X, j,,...n. Hodot j()ra(x ) (agl. raporade) ú teda porada dát vo vzotupom uporadaí podľa veľot a použjeme ch ameto pôvodých dát. Prílad: X,3 4,7,8 3, 4,88 5,55 ra() 4 3 5 6 (oec príladu) Techcá ompláca vzá, eď ú etoré hodot X rovaé. Taáto tuáca a azýva väzba a ao porade a u rovaých hodôt použje artmetcý premer poradí taýchto rovaých hodôt. Prílad: X 5 5 3 3 3 porada 5 6 3 4 ra() 5,5 5,5 3 3 3 (oec príladu) Toto je veľm bohatá téma, torá doť ompluje teóru eparametrcých tetov. M a jej v tomto tete vheme pouazom a to, že ordále dáta e ú pre aše potreb prílš zaujímavé a u číelých dát môžeme rovaým hodotám prdať malčé áhodé čílo a taú a odlšým. Dva ajdôležtejše eparametrcé tet, toré ú aalógm epárového t-tetu a párového t-tetu, avrhl Wlcoo a ezávle a ňom Ma a Whte. Preto a ozačee tetov v lteratúre líš, ale pravdla a párový tet ozačuje ao Wlcooov a epárový Ma-Whteho U-tet. V tomto tete a obmedzíme a teto dva tet, pretože ú ajpoužívaejše a avše, čo je u eparametrcých tetov e čaté, a lou vrovajú prílušým parametrcým tetom.
Tet záladých štattcých hpotéz 6 Ma-Whteho (U) tet Teto tet môžete ájť aj pod ázvom Wlcooov-Ma-Whteho tet (alebo v aglčte Wlcoo ra um tet). Je to eparametrcý aalóg dvojvýberového t-tetu a je temer rovao lý: v prípadoch, eď ú použteľé oba tet, je la Ma-Whteho tetu a 95% v porovaí t-tetom; v prípade lého arušea ormalt ale môže bť Ma-Whteho tet podtate lejší ao t-tet. Alteratívou použtu Ma- Whteho tetu je použte t-tetu a porada dát. Taýto tet má rovaú lu ao Ma- Whteho tet. Majme dva úbor hodôt X,,,.., a Y,,,... Nameto vlatých údajov použjeme porada prílušých hodôt v úbore všetých N + hodôt. Môžeme prtom použť vzotupé zotupé porada. Z poradí vpočítame Ma-Whteho štattu U + ( + ) R, de a ú počt dát v úboroch X, rep. Y, a R je účet poradí v upe X. U- štattu možo terpretovať aj ao úhr účtov poradí zo úboru Y, meších ež daá hodota zo úboru X, pre všet hodot z X. Evvalete môžeme použť aj štattu U, založeú a R : U + Pre tet hpotéz ( + ) R, prčom platí U U. H0: Hodot X ú metrc rozdeleé oolo medáu Y, alebo, a povedaé, P(X > med(y))p(x < med(y)) 0,5 prot alteratíve H: Hodot X ú metrc rozdeleé oolo odlšej hodot (rep., oolo hodot väčšej alebo mešej ao medá), a povedaé, P(X > med(y)) > 0,5, rep. P(X < med(y)) > 0,5. alebo aalogcých hpotéz o rozdeleí hodôt Y oolo medáu X a hlade výzamot α použjeme rtcú hodotu U α();, z dtrbučej fuce štatt U. Krtcé hodot ájdete v štattcých tabuľách alebo a Webe, Ecel teto hodot eve počítať. Pr dvojtraej alteratíve zametame ulovú hpotézu, a je U alebo U väčše ao rtcá hodota, pr jedotraej alteratíve porovávame rtcou hodotou ba jedu z hodôt U, U tato: H0: P(X < med(y)) 0,5 H0: P(X > med(y)) 0,5 H: P(X > med(y)) > 0,5 H: P(X < med(y)) > 0,5 Vzotupé porada použť U použť U Zotupé porada použť U použť U Špecále vzťah a používajú v prípade väzeb (rovaých hodôt dát). Teto vzťah tu ebudeme uvádzať a ebudeme dutovať a é techcé otáz oolo ormálej apromáce pre veľé N, oprav a pojtoť a podobe. Radšej odporučíme eažť a počítať teto tet ruče a použť štattcý program (apr. R) alebo alulátor a Webe, aprílad VaarStat. Toto odporúčae platí tým ôr, že Ecel íce má fucu pre výpočet poradí (fuca RANK), tá ale pracuje väzbam v poradach veľm zvlášte a preto a počítae záladých štattí e je úple bezproblémové, ao vdo z príladov v Ecel.
Tet záladých štattcých hpotéz 7 Prílad 5 Použjeme dáta z predchádzajúceho príladu a dvojvýberový t-tet (Studetove dáta o páu) Zmea dĺž páu po podaí jedého z dvoch preparátov čílo zmea upa porade 0,70 8 -,60 3-0,0 3 4 -,0 5-0,0 4,5 6 3,40 5,5 7 3,70 7 8 0,80 9,5 9 0,00 6 0,00 4,90 3 0,80 9,5 3,0 4 0,0 7 5-0,0 4,5 6 4,40 8 7 5,50 0 8,60 9 4,60 9 0 3,40 5,5 Všmte zova výhodu uporadaa dát lafujúcou premeou. Červeo ozačeé hodot ú upraveé ruče, pretože fuca Ra v Ecel pracuje väzbam v poradach evhodým pôobom. Štatt pre U-tet ú aledujúce: upa upa Súčet R 80,50 9,50 Počet 0,00 0,00 U 74,50 5,50 Naledujúce výled ú vpočítaé v programe R (fuca wlco.tet), môžete použť aj applet z VaarStat: Krtcá oblať P H: P(>med())<>0,5 Výledo (α0,05) U > U rt 0,0637 Prjímame H0 H: P(>med())<0,5 U > U rt 0,0386 Zametame H0 Prílad 6 Ao me uvedl, alteratívou použtu Ma-Whteho tetu je použť t-tet a poradach. Tet lutrujeme a dátach z predchádzajúceho príladu. upa upa Súč et 80,50 9,50 Poč et 0 0 Premer 8,050,950 33,550 6,8583 prem 3,3550,68583 Výled tetu: Tet rôzm varacam (W elch) p-p 6,03833 p-p,4573 ν 7,783 t -,994 t ν ;0,975,0 t ν ;0,95,740 Alteratíva H: µ <>µ H-: µ <µ Krtcé hodot Krt. oblať Výledo (α0,05) P(t >t t rt t 7,783;0,975,098 ab(t) > t rt Prjímame H0 0,0644 t rt t 7,783;0,95,7396 -t > t rt Zametame H0 0,03 Všmte, že ta Wlcooov tet ao aj t-tet a poradach dal o ečo lejše výled ao občajý t-tet. Je to daé odchýlou rozdelea dát od ormalt. V prípadoch, ed etuje pochboť o rozdeleí dát a jeho vplve a výled t-tetu, je celom dobrý ápad urobť t-tet a poradach. A a výled výraze líša, treba použť radšej eparametrcý tet.
Tet záladých štattcých hpotéz 8 Wlcooov (párový) tet Wlcooov párový tet (Wlcoo ged ra tet) možo použť všade tam, de a dá použť párový t-tet. Jeho la (chopoť zametuť ulovú hpotézu, a eplatí) je 3/π (t.j. a 95%) v porovaí párovým t-tetom, teda je le o málo labší. Sú ale tuáce, de párový t-tet emožo použť, aprílad eď dáta evdete epochádzajú z ormáleho rozdelea alebo emajú vattatív charater; Wlcooov tet v taýchto prípadoch použť možo. Tet ale predpoladá metru rozdelea X-Y za predpoladu ulovej hpotéz. V prípade lej emetre možo použť jedoduchý zameový eparametrcý tet (g tet), torý je ale omoho labší. Wlcooov tet je tet hpotéz H0: Rozdelee hodôt X - Y je metrcé oolo µ0 (alebo µµ 0 ) prot alteratíve H: utočé µ je rôze od (prípade meše č väčše ež) 0 (rep. µ 0 ). Teto tet možo v prcípe použť aj ao jedovýberový, ulovou hpotézou že rozdelee X je metrcé oolo ul alebo zadaej hodot. Potup vdo a aledujúcom prílade. Podobe ao u párového t-tetu použjeme rozdel dát v dvojcach (alebo ejaú ú vhodú meru odlšot, aprílad podel, relatívu odchýlu a pod., tetoraz bez tarot, č a tým earuší ormále rozdelee). Rozdelom prradíme porada a u aždému poradu doplíme zameo prílušého rozdelu. Vtvoríme um ladých a záporých poradí T + a T. V prípade platot ulovej hpotéz b obe um mal bť prblže rovaé, áhodým odchýlam merom a jedu č druhú trau. Nulovú hpotézu zametame, a T + a T preročí rtcú hodotu. Prílušé hodot možo ájť v tabuľách, ale pre tetovae odporúčam použť štattcý program alebo alulátor a webe VaarStat. V lteratúre totž e je potup pr Wlcooovom tete utáleý, etorí autor (a etoré program) aprílad od tetovaej um poradí odpočítavajú prípevo od mamáleho rozdelu poradí a é e, ede a vechávajú ulové rozdel a de e, tato a rôze používajú ormále apromáce a oprav a pojtoť. A použjete štattcý program, máte dobrú záruu, že má potrebé detal práve zoúladeé, pr ručom výpočte te úteí ledovať pomere veľa detalov. Toto je bohužaľ tetá tráa mohých eparametrcých tetov: Zataľ čo ch prcíp je dobre pochopteľý, realzáca obahuje možtvo techalít. Výled v aledujúcom prílade pochádzajú z programu R, alulátor a VaarStat dáva mere odlšé výled.
Tet záladých štattcých hpotéz 9 Prílad 6 Použjeme dáta z predchádzajúceho príladu a párový t-tet (8 elatcých páov...) Vplv zahrata a roztahute elatcých páov Pár Voá Izbová Rozdel +/- porade 44 5 9 9 55 47 8 7 3 53 49 4 3 4 54 53 5 5 45 6 5 6 69 59 0 8 7 48 4 6 5 8 5 55-3 - 9 9 86 6 5 Použjeme Wlcooov párový tet H0: rozdelee X-Y je metrcé oolo µ d 0 prot dvojtraej alteratíve H: µ d 0. Z uvedeých dát máme: T T + 44 9 P 0,07 (Poledý výledo je prevzatý z programu R, fuca wlco.tet. Záver: Na hlade výzamot α0,05 zametame ulovú hpotézu o ulovom peudomedáe rozdelu medz párm hodôt (peudomedá rozdelea F je medá rozdelea (u+v)/, de u a v pochádzajú z rozdelea F, teda je to medá metrzovaého rozdelea). Ia povedaé, peudomedá rozdelu v rozťažotach je pm tredé 6 a je štattc výzamý (P0,04), prčom 95%-ý terval poľahlvot je (,5;,5).
Tet záladých štattcých hpotéz 0 4. Alteratíve áhodé premeé V tejto čat budeme pracovať áhodým premeým alteratívm rozdeleím, teda pravdepodoťou p X 0 pravdepodoťou-p. 0 p Naše úbor dát budú pozotávať z realzácí taýchto áhodých premeých, teda zo érí úl a jedote. Taéto dáta e je užtočé vpovať, ao me to robl v predchádzajúcch čatach, pretože ám úple tačí uveť počet jedote a celový počet hodôt. Preto budú dáta príladov vzerať a, ale etreba a tým echať pomýlť, robíme vlate tále to té. Veme, že účet taýchto premeých, S X má bomcé rozdelee: P( S p) p 0 S 0,,..., 0 p ( p), parametram p a. P je rozdeleím pravdepodobot počtu úpechov v pouoch, prčom pravdepodobot úpechu v jedotlvých pouoch ú ezávlé a rové p. Prpomeeme, že pre áhodú premeú S platí S p, σ p( p), σ S S p( p) Vďaa tomu veme ztť záladé výberové štatt pre pozorovaa áhodých premeých alteratívm rozdeleím a ch rozdelea pravdepodobot. Všmte, že aj eď ú výledé vzťah é, v podtate ba počítame premer, štadardú odchýlu a štadardú odchýlu premeru, rovao ao v predchádzajúcch čatach.
Tet záladých štattcých hpotéz Velča Stredá hodota X Štadardá odchýla X Štadardá odchýla tredej hodot Vjadree cez rozdelee pravdepodobot µ X. p + 0.( p) p σ ( X p) ( p). p + (0 p).( p) p( p) S σ pˆ ( p) p( p) σ S Odhad ˆ µ X ˆ σ ( X pˆ ) pˆ ( pˆ ) + ( ) pˆ pˆ ( pˆ ) ˆ σ p ˆ [ pˆ ( pˆ ) + ( pˆ ) pˆ ] pˆ p pˆ ( pˆ ) Náhodý výber z populáce Predtavte, že á zaujíma pomer pohlaví u pavúov. Na rôzch metach a v rôzch čaoch odchtíme 0 pavúov a ztíme, že 4 z ch ú amčeova a - 6 je amče. Predpoladáme prtom, že populáca je veľm veľá; a b me robl výber z obmedzeej populáce, muel b me aždého odchteého pavúa vrátť (v prípade výberu bez vracaa b bola štatta á - pomíate a hpergeometrcé rozdelee?) Aé záver môžeme z tohoto ztea urobť? Predovšetým, p ˆ 0% je etraý odhad zatúpea amčeov v populác. Odhad je ale áhodá premeá, a oed b me mohl ájť 5 amčeov a eed možo ba dvoch. Aá je teda preoť tohoto odhadu? Zo vzťahu pre štadardú odchýlu p vdíme, že to je pˆ( pˆ ) p 0,09. Teda preoť ášho odhadu je a 0% (v abolútom, e relatívom vjadreí). Vzá tu ale ompláca: pre p 0,5 je rozdelee odhadu p emetrcé, prčom ametra je zvlášť lá pre p blíze 0 a. Ab me zíal lepšu predtavu o oblat možých hodôt p, bude výhodé vpočítať terval poľahlvot. Pre určee jeho hraíc použjeme špecálu techu, torá a zaladá a podobot medz F- rozdeleím a rozdeleím p. Hrace (-α).00%-ého tervalu poľahlvot pre odhad p ú
Tet záladých štattcých hpotéz Ldo l é + ( + ) Fα / ν ( + ) ν, ν, ν L horé ν ( + ) ( + ) Fα /, ν + ( + ) F ν, ν α /, ν, ν ( ) V špecálch prípadoch 0, a môžu mať etoré program alebo alulátor problém výpočtom prílušých rtcých hodôt. A a to tae, možo použť modfovaé vzťah: pre 0: L α / pre : L α / pre : L Zo metre ombačých číel orem toho vplýva: (L pre ) ( L pre ) a (L pre ) (L pre ) Teto vzťah možo vzerajú zložto, a eď zaltujete v štattcých žách, ájdete možtvo prblžých vzťahov založeých a ormálom prblížeí. Žade z ch ale dobre efuguje pre p blíze 0 a. Všše uvedeé vzťah dávajú preé hrace a a ch výpočet tača dve rtcé hodot F-rozdelea. Prílad Náhodá vzora 00 ľudí obahuje 4 ľudí prrodzeou odoloťou prot hepattíde B. Aé je zatúpee taýchto ľudí v populác? Záladé dáta: V tomto prípade máme 00, 4; odtaľ pˆ 0, 0 o štadardou odchýlou ( pˆ ) pˆ 5 pˆ 9,849.0 p ˆ 0,00. 95%-ý terval poľahlvot (α0,05) určíme všše uvedeým potupom tato: Dolá hraca Horá hraca ν 394 ν 0 ν 8 ν 39 F α/,ν,ν 3,6879575 F α/,ν,ν,083 L dolé 0,005475556 L dolé 0,05044 Záver: Freveca výtu jedcov prrodzeou odoloťou prot víruu leží 95%-ou pravdepodoboťou v tervale 0,0055 p 0,0504, prčom etraý odhad tejto frevece a zálade uvedeých údajov je 0,00. Všmte, že zíaý terval poľahlvot je emetrcý oolo odhadu tredej hodot. Prílad Čo b me mohl povedať o frevec výtu jedcov prrodzeou odoloťou prot víruu, a b me medz 00 oobam eašl a jedého? Toto e je žad chtá. A b bola freveca výtu taýchto jedotlvcov íza, môže a aozaj tať, že medz 00 ľuďm taého eájdeme.
Tet záladých štattcých hpotéz 3 V tomto prípade máme 00, 0; odtaľ p 0 o štadardou odchýlou ( pˆ ) pˆ pˆ 0 pˆ 0. ˆ Odhad štadardej odchýl je tu eužtočý. Súme vpočítať hrace tervalu poľahlvot: Dolá hraca Horá hraca ν 40 ν ν 0 ν 400 F α/,ν,ν etreba poč ítať F α/,ν,ν 3,730 L dolé 0 L dolé 0,0875 Teda egatív výledo ám potuje horú hracu hľadaej frevece výtu, p 0,083 95%-ou pravdepodoboťou.
Tet záladých štattcých hpotéz 4 5. Tet dobrej zhod a otgečé tabuľ V tejto čat budeme pracovať áhodým premeým, adobúdajúcm hodot z oečej mož, teda áhodým premeým X { A, A,... A } P( X A ) p p 0 A prtom môžu bť číelé hodot, ale môžu tež ozačovať ečíelé ategóre, aprílad farbu očí alebo dagózu. Taéto premeé azývame fator, a prílušé hodot A úrove fatorov. Naše dáta budú úborm pozorovaí áhodej premeej X. Opäť, ta ao v predchádzajúcej čat, e je pratcé uvádzať všet zteé hodot ao u premeých o pojtým rozdeleím, ale tačí uveť počt výtov jedotlvých ategórí, aprílad vo forme tabuľ: A f A f...... A f S taýmto počtam výtov budeme pracovať, a budeme a ažť ečo dozvedeť o pravdepodobotach p. Preto á bude zaujímať rozdelee pravdepodobot pre počt výtov f. Tá je, v prípade výberu z eoečej populáce (čo v pra zameá, že je omoho meše ao objem populáce), daá multomcým rozdeleím: f f P( f, f,... f ) p p... p f f... f! f f... f f! f!... f! f p Metód, založeé a tomto rozdeleí, ú výpočtovo áročé. Aj eď to de, prajmešom pre apláce, o torých budeme hovorť v tomto tete, epredtavuje záadý problém, preé tet založeé a multomcom rozdeleí a používajú ba v zvláštch prípadoch. Nameto ch a používajú omoho jedoduchše tech, založeé a ormálom prblížeí, toré pre väčšu pratcých aplácí úple vhovujú. Ta ao v predchádzajúcej čat b me a mal ajôr veovať odhadom pravdepodobotí p a ch vlatotam. Predovšetým, etraé odhad pravdepodobotí ú pˆ f Ťažoť hodotam f počíva v tom, že e ú vzájome ezávlé: ch účet muí bť za aždých oolotí, a teda ám tačí pozať ba - z ch. V techách, toré budeme používať, á budú zaujímať oletíve vlatot hodôt f, a budeme používať amptotcý (t.j. platý tým lepše, čím ú f väčše) vzťah pre rozdelee f : f
Tet záladých štattcých hpotéz 5 f f f f f z ~ N(0,), de me použl tradčé ozačee pre tredú hodotu f. Uvedeý pomer teda má (amptotc) štadardé ormále rozdelee, a štatta χ ( f f ) f bude mať rozdelee χ - tupňam voľot. Ao vdo, táto štatta je merou vzdaleot pozorovaého a očaávaého rozdelea frevecí výtu, a teda pr jej zámom rozdeleí pravdepodobot doážeme počítať pravdepodobot zíaa pozorovaého rozdelea pr daom očaávaí, a teda tetovať hpotéz. Tet o rozdeleí pravdepodobot Začeme príladom: Prílad Podľa Medelových záoov dedčot očaávame aledujúce pomer v zatúpeí charatertí eme v populácí ratlí hrachu: žlté hladé : žlté vráavé : zeleé hladé : zeleé vráavé 9 :3 :3 : V utočot me pozoroval aledujúc výt: žlté vráavé zeleé vráavé žlté hladé f f zeleé hladé f 3 f 4 polu 5 35 53 6 50 Je pozorovaý výt v zhode teoretcým očaávaím? Taéto zadae môžeme rešť ao tet hpotéz H0: Uvedeé za a u ratlí vtujú v proporcách 9:3:3: prot alteratíve H: Uvedeé za a u ratlí vtujú v ej proporc. Vpočítajme ajôr očaávaé zatúpea jedotlvých zaov pr daom celovom počte ratlí: q 9 50. 9 + 3 + 3 + q 40,65 f atď., a odtaľ určíme χ : O čaávaý výt za predpoladov ulovej hpotéz: Za Žltý Žltý Zeleý Zeleý hladý vráavý hladý vráavý Spolu O čaávaý výt 40,65 46,875 46,875 5,65 50 Rozdel,375-7,875 6,5-9,65 0 Zíaú hodotu porováme rtcou hodotou pre α0,05 a ν4-3 (Ecel má fucu chv(alfa, tupe voľot), torá vrát požadovaú hodotu): χ 0,05;37,847. Môžeme tež vpočítať úroveň výzamot pre zteú hodotu χ (v Ecel je to fuca chdt(hodota, tupe voľot), dotaeme P0,097.
Tet záladých štattcých hpotéz 6 Použteľoť prblížea χ Techa, torú me použl, je prblžá, a môžeme a pýtať, ed je použteľá. V prípade, že ú pozorovaé počt v etorej ategór prílš malé, bude hodota χ adhodoteá a budeme ulovú hpotézu budeme zametať čatejše ež pravdepodoboťou α. To je ežadúce, a preto je potrebé mať pre tet dotatočý počet pozorovaí. Dotatočý počet pozorovaí zameá:. Pre rozdelea blíze rovomerému je príputé pozorovae v etorých ategórách pre tetovae a hlade α0,05, a ajmeej pozorovaa pr tetovaí a hlade α0,0. Pre rozdelea veľým rozdelm očaávaých hodôt je treba prílušé hodot zdvojáobť.. Tet pracuje prjateľe dobre, a účae platí 3, 0, a / 0. 3. A (a teda počet tupňov voľot je ν, je treba použť buď opravu a pojtoť (Yateovu orecu, pozr žše), alebo bomcý tet. V prípade, že máme malé počt dát (aprílad pr veľom počte ategórí, treba použť eaté metód, založeé a multomcom rozdeleí, alebo použť umercú mulácu. Koreca a pojtoť Krtcé hodot štatt χ určujeme z tabule rozdelea χ, čo je pojté rozdelee, Vzhľadom a to, že pracujeme celočíelým hodotam, rozdelee pravdepodobot štatt χ je v utočot dréte a rtcé hodot za určtých oolotí ebudú práve. Teto efet je dôležtý predovšetým pre ν, pr všších počtoch tupňov voľot je zaedbateľý. Pr ν a tuáca reš tzv. Yateovou orecou a pojtoť, torá počíva v zmešeí rozdelov o 0,5: χ ( f f 0, ) 5 YC f Táto úprava výraze zlepšuje parametre tetu. Pre špecále prípad etujú aj é, ešte lepše orece a pojtoť, používajú a ale zreda. Yateovu orecu je treba používať tematc vžd pr jedom tup voľot χ ( ategóre pr tetoch rozdeleí, otgečé tabuľ, pozr žše). Kotgečé tabuľ Opäť začeme príladom: Prílad Zaujíma á, č je zatúpee rôzch fareb vlaov rovaé u oboch pohlaví. Toto ú ztea a vzore 300 ľudí: Farba vlaov Čere Hedé Blod Ršavé Spolu Muž 3 43 6 9 00 oč aávae (9,00) (36,00) (6,67) (8,33) Že 55 65 64 6 00 oč aávae (58,00) (7,00) (53,33) (6,67) Spolu 87 08 80 5 300 Chceme tetovať hpotézu H0: Rôze farb vlaov a u mužov a že vtujú v rovaých proporcách prot alteratíve H: Rôze farb vlaov a u mužov a že vtujú v rôzch proporcách.
Tet záladých štattcých hpotéz 7 Za predpoladu ulovej hpotéz môžeme vpočítať očaávaé hodot pre jedotlvé pola tabuľ. Naprílad pre očaávaú hodotu počtu mužov hedým vlam môžeme píať Očaávaý počet mužov hedým vlam Ia povedaé, Pravdepodoboť, že člove je muž Pravdepodoboť, že člove má hedé vla) Celový počet ľudí vo vzore Očaávaý počet mužov hedým vlam a vo všeobecom vjadreí Počet mužov vo vzore Celový počet ľudí vo vzore Počet ľudí hedým vlam Celový počet ľudí vo vzore Celový počet ľudí vo vzore C R C c r R r j j,,..., fj, R fj, C j fj, j j,,..., c de R a C j ú radové, rep. tĺpcové účt. Potom už ľaho formujeme štattu χ : r c ( fj fj ) χ, f j prčom počet tupňov voľot je ν ( r )( c ). j Tým máme všet potrebé vzťah pohromade a mohl b me tetovať, ale ešte ám jeda vec chýba: zobrazee dát. Tu je, a je to formát, umožňujúc rýchlo a zoretovať v dátach tabuľ (Aglcé pop om v obrázu poechal, pretože dlhše loveé a echcel zmetť.). Har colour me ad wome male female red blode har brow blac e Podobé obráz doáže vtvorť aj Ecel, výmou proporcoálch šíro páov, čo ale poväčše e je dôležté - tačí použť prílušý preddefovaý tp tĺpcového grafu (a arýchlo odtráť apoň ajzúfalejše predvoľb dzajérov Mcrooftu).
Tet záladých štattcých hpotéz 8 Rozdel a prípev χ Farba vlaov Čere Hedé Blod Ršavé Spolu Muž - rozdel 3,00 7,00-0,67 0,67 0,00 χ 0,3,36 4,7 0,05 5,99 Že - rozdel -3,00-7,00 0,67-0,67 0,00 χ 0,6 0,68,3 0,03 3,00 Spolu -rozdel 0 0 0 -,8E-5-5,3E-5 χ 0,47,04 6,40 0,08 8,99 χ 8,99 Počet tupňov voľot: 3 P 0,0946 α 0,05 χ 0,05;3 7,8475 Pretože χ je väčše ao rtcá hodota, zametame ulovú hpotézu. Zatúpee rôzch fareb vlaov je teda u mužov a že odlšé. Môžeme vša položť otázu, č možo detfovať farbu alebo farb vlaov, toré ú zodpovedé za dproporce. Z tabuľ vdo, že ajväčší prípevo χ pochádza od tĺpca blod vlaov. Ab me toto ztee overl, použjeme aledujúc potup:. Vradíme z tabuľ oob blod vlam a χ tetom a výledej tabuľe 3 ztíme, č možo prjať hpotézu o rovaých proporcách u mužov a že.. V prípade ladého výledu ombujeme tr farb vlaov do jedého tĺpca tabuľ a vtvoríme tabuľu (muž, že) (čere+hedé+ršavé blod). Zova voáme χ tet a overíme, č a proporce výzame odlšujú.. ro: Vtvoríme tabuľu 3: Farba vlaov Čere Hedé Blod Ršavé Spolu Muž 3 43 6 9 84 oč aávae (33,) (4,4) (9,55) Že 55 65 64 6 36 oč aávae (53,78) (66,76) (5,45) Spolu 87 08 80 5 0 Tetujeme hpotézu H0: Čere, hedé a ršavé vla a u mužov a že vtujú v rovaých proporcách prot alteratíve H: Čere, hedé a ršavé vla a u mužov a že vtujú v rôzch proporcách. Rozdel a prípev χ Farba vlaov Čere Hedé Blod Ršavé Spolu Muž - rozdel -,,76-0,55 0,00 χ 0,04 0,08 0,03 0,5 Že - rozdel, -,76 0,55 0,00 χ 0,03 0,05 0,0 0,09 Spolu -rozdel 0 0 0 0 0 χ 0,07 0, 0,00 0,05 0,4 χ 0,4 Počet tupňov voľot: P 0,884837 α 0,05 χ 0,05; 5,99476 Uudzujeme, že v zatúpeí oôb čerm, hedým a ršavým vlam e je rozdel medz mužm a žeam - prjímame ulovú hpotézu.
Tet záladých štattcých hpotéz 9. ro: Pretože me v predchádzajúcom rou prjal ulovú hpotézu, môžeme vo východovej tabuľe 4 pojť dáta pre prílušé tr farb vlaov do poločého tĺpca a voať tet a vzutej tabuľe : Farba vlaov Čere+Hedé+Ršavé Blod Spolu Muž 84 6 00 oč aávae (73,33) (6,67) Že 36 64 00 oč aávae (46,67) (53,33) Spolu 0 80 300 Tetujeme hpotézu: H0: Blod vla a u mužov a že vtujú v rovaých proporcách prot alteratíve H: Blod vla a u mužov a že vtujú v rôzch proporcách. Roz del a prípev χ Farba vlaov Č ere+hedé+ršavé Blod Spolu Muž - rozdel 0,67-0,67 0,00 χ,4 3,88 5,9 Že - rozdel -0,67 0,67 0,00 χ 0,70,94,64 Spolu -rozdel 0,00 0 0 χ, 5,8 7,93 χ ( Yateovou orecou) 7,93 Počet tupňov voľot: P 0,004867 α 0,05 χ 0,05; 3,84455 Uudzujeme, že zatúpee blod vlaov a u mužov a že odlšuje od zatúpea ých fareb vlaov. Vvetlee je pravdaže treba hľadať mmo štatt a zrejme v ňom budú hrať úlohu falošé blodí. Prpomeňme, že a vtvoríme hpotéz a zálade zíaých dát, je potrebé taéto hpotéz tetovať a ových dátach. Teda uvedeý potup možo použť ba ao aaltcý protredo, umožňujúc lepše pochopť zíaé dáta. Párový tet pre ategorále dáta: McNemarov tet Ab me uázal, ao môžu vzúť párové ategorále dáta, začeme opäť príladom: Prílad 3 Treba porovať účoť dvoch roztoov a ošetree vrážo pôobeých šumpou jedovatou (Rhu tocodedro). Pouu a zúčatl oob, pothuté popáleím a oboch rameách a aždému účatíov bol aplovaý jede z prípravov a jedo rameo a druhý prípravo a druhé rameo. Taéto uporadae pouu je vhodé preto, že umožňuje vlúčť varabltu reací a lečvo v populác. Nemuíme aprílad oobte úmať ereagujúcch alebo eztívch pacetov a ch zatúpee v dvoch upách. Pouu a zúčatlo 5 pacetov a bol zíaé aledujúce výled: Prípravo Prípravo Zlepšee Žad efet Spolu Zlepšee 6 7 Žad efet 0 4 34 Spolu 30 5
Tet záladých štattcých hpotéz 30 Pre aalýzu taýchto dát potrebujeme tetovať hpotézu: H0: Oba príprav ú rovao účé prot alteratíve H: Účoť prípravov a líš. Ao obvle, uvažujme, ao budú vzerať dáta v prípade ulovej hpotéz. Predovšetým, o rozdeloch v účot á formujú edagoále pola tabuľ, dagoále pola eeú žadu formácu o rozdeloch. A ú príprav rovao účé, budú edagoále pola prblže rovaé. Ao tetovacu štattu použjeme χ ( f f ) f + f, rep., opravou a pojtoť, Pre dáta z ášho príladu o účot prípravov máme ( f f ) χ ( orecou a pojtoť) 0,56 ν P 0,45354709 χ 0,05; 3,84455338 a teda uudzujeme, že účoť prípravov a elíš. χ f + f, prčom ν.
Tet záladých štattcých hpotéz 3 6. Aalýza rozptlu a vacáobé porovaa V tejto čat a vrátme u vattatívm dátam a budeme a zaoberať tetovaím hpotéz v zložtejších tuácách - pree povedaé, v ajjedoduchších zo zložtejších tuácí. Naučíme a používať lú techu, torá a v pratcej štatte vužíva v šroej šále tuácí - (jedofatorovú) aalýzu rozptlu (ANOVA - ANal Of VArace). Jedofatorová aalýza rozptlu Na úvod prílad: Prílad 9 víň bolo áhode rozdeleých do 4 upí. Každá zo upí bola ŕmeá ým rmvom. Poúďte, č majú jedotlvé druh rmva výzamý vplv a váhu víň. Vplv dét a váhu víň Déta Déta Déta 3 Déta 4 60,8 68,7 0,6 87,9 57,0 67,7 0, 84, 65,0 74,0 00, 83, 58,6 66,3 96,5 85,7 60,7 69,8 90,3 Déta Déta Déta3 Déta4 Váh víň po jedotlvých détach 60 70 80 90 00 Váha (g) Ao prtúpť taejto úlohe? Predovšetým zavrheme mšleu použť t-tet. Dôvod je fláca hlad výzamot pr vacáobom tetovaí. Pree povedaé, pr tetovaí a hlade α t-tet 0,05 bude pravdepodoboť, že pr K porovaach urobíme apoň chbu. druhu, teda že odmeteme hpotézu o rovot etorých premerov, hoc je v utočot pravdvá, alebo ešte a, pravdepodoboť apoň epráveho ztea bude: pravdepodoboť pravdepodoboť apoň chb αcelové žadej chb ( α). druhu v K porovaach Pr tetovaí výzamot rozdelov medz upam muíme vo všeobecot urobť K(+)/ porovaí (výledo taéhoto tetovaa je zaveť čatočé uporadae v može premerov, a teda vo všeobecot b me mal tetovať aždý pár premerov; teto počet íce možo zmešť, ale edá a vopred povedať o oľo - vac v čat o vacáobých porovaach). Celová hlada výzamot (torú v tomto otete čato ozačujú ao FWE - Faml-we error, teda chba pre rodu porovaí) rýchlo rate počtom upí, ao uazuje tabuľa a aledujúcej trae. Teto problém a čato reš ta, že a jedotlvé porovaa voávajú a K-rát žšej hlade výzamot, čím a zabezpečí FWE a hodote pôvodej hlad výzamot. Taýto potup a azýva Boferroho oreca a hoc a používa doť čato, emožo ho odporúčať, pretože je veľm ozervatív - pr väčšom počte upí a jedotlvé tet voávajú a veľm malej hlade výzamot a rýchlo rate pravdepodoboť chýb. druhu, to jet pravdepodoboť prjata ulovej hpotéz apre tomu, že eplatí K
Tet záladých štattcých hpotéz 3 - trácame teda chopoť zťovať utočé rozdel. Teto efet je zvlášť dramatcý v moderej moleulárej bológ, de je pr mapovaí géov čato potrebé tetovať tíce hpotéz. Pravdepodoboť apoň chb. druhu pr vacáobých porovaach Počet upí Počet porovaí Hlada výzamot pre porovae K 0,05 0,0 0,05 0,0 3 3 0,4 0,03 4 6 0,6 0,06 5 0 0,40 0,0 6 5 0,54 0,4 Štattc oretý potup počíva v dvoch rooch. Prvým je aalýza rozptlu, a v prípade, že táto zamete ulovú hpotézu o rovot premerov vo všetých upách, použjeme v druhom rou špecále párové tet (čato z tohoto dôvodu ozačovaé ao pot-hoc tet), toré udržavajú FWE (hladu výzamot α) a požadovaej hodote pr vzájomých porovaach premerov vo všetých upách. Začeme aalýzou rozptlu: Defujme celovú varabltu dát ao účet štvorcov odchýlo všetých dát od ch poločého premeru: SS cel ( j ) j j j Zaradeím dát do upí vvetlíme čať varablt dát: hodota j je odlšá od premeru preto, že patrí do -tej up, a hodot v tejto upe ú v premere é ež v otatých upách. Ešte ám ale otae varablta vútr upí, pretože aj tam máme rozdele hodot, ale eveme vvetlť, a taéto odchýl budeme považovať za áhodé chb. Teda áš model bude vzerať tato: X j µ + µ + εj µ 0, j,,...,,,... taúto varabltu považujeme za chbu modelu. Elegaca aalýz rozptlu počíva v tom, že a vtvoríme účet štvorcov odchýlo modelu ( medz upam ) ao meru varáce dát, vvetleú modelom, SS medz ( ) j j a účet štvorcov chýb ao meru varáce, torú model edoázal vvetlť (varáca vútr upí, alebo rezduála varáca), SS vútr bude platť ( j ) j SS SS + SS. cel medz vútr j j Je zrejmé, že bodovaé hodot ú odhadm celového premeru µ a efetov upí µ : j
Tet záladých štattcých hpotéz 33 ˆ µ ˆ µ µ µ + µ,,..., Chceme tetovať hpotézu H0: µ µ...µ µ prot alteratíve H: Apoň dve zo tredých hodôt a líša. A prjmeme dodatočý predpolad o chbách, totž že ε ú..d. ~ N [ 0, σ ] j, potom za predpoladu ulovej hpotéz (teda v prípade, že áš model vôbec č evvetľuje a hodot v upách a líša ba v dôledu áhodých vplvov) budú tredé štvorce cel medz vútr SScel ( ) SSmedz ( ) SSvútr ( ) z odchýlo me počítal poločý premer, teda le z premerov me počítal poločý, teda upí po - ezávlých odchýlach, polu všet odhadm varace chýb σ, t.j. σ ˆ cel medz vútr V prípade, že ulová hpotéza eplatí, bude >, medz vútr - je ezávlých - ezávlých odchýlo ( ) pretože bude obahovať aj tematcé odchýl. Preto vužjeme fat, že za uvedeých predpoladov o chbách a za predpoladu platot ulovej hpotéz má štatta F medz vútr Fherovo (F-) rozdelee - a - tupňam voľot. Nulovú hpotézu o rovot všetých premerov zameteme, a bude hodota F všša ao rtcá hodota F- rozdelea pre požadovaú hladu výzamot. Pozameávame, že toto je vžd jedotraý tet, zaujímajú á ba veľé hodot F (a dotaete F<, potom už e je čo tetovať - ulová hpotéza určte platí.) Výled aalýz rozptlu a tradče zapujú do tabuľ tvaru Zdroj varáce Súčet štvorcov.v. Stredý štvorec F P Model SS medz - medz Chb SS vútr - medz F P(F>F rt ) vútr Spolu SS cel - vútr Ao dodatočý údaj a tradče uvádza oefcet determáce
Tet záladých štattcých hpotéz 34 SSmedz SSvútr R, SScel SScel čo je vlate podel varáce, vvetleej modelom, alebo de determáce vútr Rd ( R ), cel torý a rozdel od oefcetu determáce možo vužť a porovae odlšých modelov (čo uvádzam ôr preto, že môžete ede taúto velču uvdeť, ež ao odporúčae ju uvedeým pôobom používať). A tato vzbrojeí a už môžeme vrátť ášmu príladu. Začeme tým, že preorgazujeme dáta: Por. č. Váha Déta 60,8 57,0 3 65,0 4 58,6 5 60,7 6 68,7 7 67,7 8 74,0 9 66,3 0 69,8 0,6 3 0, 3 3 00, 3 4 96,5 3 5 87,9 4 6 84, 4 7 83, 4 8 85,7 4 9 90,3 4 Taéto uporadae vžaduje prevažá väčša štattcých programov, a je výhodé aj v Ecel, de môžete výhode vužť databázové fuce. Užtočoť taéhoto uporadaa ve zvlášť pr zložtejších modeloch, eď máme vac fatorov - ďalší fator prídáme jedoducho ao ový tĺpec. Začeme tým, že počítame dáta v upách, upové premer a celový premer. Ďalej počítame štvorce odchýlo od premeru v upách, účet štvorcov odchýlo všetých dát od celového premeru a účet štvorcov odchýlo upových premerov od celového premeru (áobeý počtom dát v upe). Tým máme všet potrebé dáta a môžeme vtvorť tabuľu aalýz rozptlu. Déta Déta Déta Déta Súhre 3 4 Poč et hodôt 5 5 4 5 9 Premer 60,40 69,300 00,350 86,40 77,958 Štvorce modelu 537,889 374,796 005,66 34,966 Štvorce chýb 36,08 34,60,970 33,55 4388,66 (Vvetlv: Štvorce modelu: (počet dát v upe) (upový premer - celový premer)^ Štvorce chýb: (účet štvorcov odchýlo dát v upe od upového premeru); pre úhr: účet štvorcov odchýlo všetých dát od poločého premeru. V Ecel používame a výpočet upových dát fucu pre výberovú varacu (DVAR.VÝBĚR) a ao rtérá používame záhlave tabuľ. Túto fucu je treba používať opatre, a pracujete veľým čílam, pretože môže dochádzať zaorúhľovacím chbám. Zdroj varáce Súčet Stredý.v. štvorcov štvorec F P Model 46,76 3 40,45 67,78 9,506E- Chb 6,99 5 8,466 (3,9) Spolu 4388,66 8 Pretože zteá hodota F je podtate väčša ao rtcá hodota F 0,95;3;5 3,9 (uvedeá v tabuľe v zátvorách pod zteou hodotou F), alebo, a povedaé, pravdepodoboť zíaa rovaej alebo väčšej hodot F ao tej, torú me ašl, je P9.0 -, zametame ulovú hpotézu
Tet záladých štattcých hpotéz 35 a uudzujeme, že etoré zo upových premerov ú rôze. Ešte a povedaé, uudzujeme, že zaradeím víň do upí me vvetll podtatú čať varáce (R 97%) v ch váhach. ANOVA použtím premerov a štadardých odchýlo Jedofatorovú aalýzu rozptlu možo uutočť aj eď emáte dpozíc ompleté dáta, ale ba počt dát, premer a štadardé odchýl (prípade štadardé chb štadardé odchýl premerov) v jedotlvých upách. Zo štadardých odchýlo možo totž zreoštruovať rezduál účet štvorcov: SS SS vútr medz ( j ) j ( j ) j,,..., ( ) ( ) SScel SSmedz + SSvútr a máme všet velč, potrebé pre výpočet F. Predpolad pre použte aalýz rozptlu Pr aalýze rozptlu me o dátach v upách predpoladal, že pochádzajú z ormálch rozdeleí rovaou varacou. Splee týchto predpoladov a tetuje pomere ťažo; pree povedaé, efuguje čato používaý avý prítup počívajúc v použtí tetu ormalt (aprílad Shapro-Wlov tet) a dáta v upách a porovae varací v upách (aprílad Bartlettovým tetom). Týmto tetom a tu ebudem veovať, a ch budete potrebovať, použte štattcý program alebo alulátor a Webe. Sú to dobré tet, ale:. V upách a väčšou achádza eveľý počet dát a tetovae malého počtu dát a rozdelee je avé. Navše ANOVA (a aprílad aj t-tet) fuguje dobre aj v tuácách, eď je tet ormalt egatív.. Bartlettov tet a é tet a rovoť varací ú ctlvejše a arušee ormalt dát ao amotá ANOVA alebo t-tet, a emožo a a e polehať; rozhode epotujú rtérum, ed ANOVu alebo t-tet možo použť a ed e. Preto použte týchto tetov e je užtočé. Nameto toho uvedem jede úbor fatov a dve odporúčaa:. A ú počt dát v upách rovaé, je ANOVA veľm robutá odchýlam od ormalt. Upozorňujem, že toto a týa predovšetým jedofatorovej aalýz rozptlu, torú me popíal všše. Vacfatorové aalýz a hlave tzv. repeated-meaure aalýz (čo ú vacupové aalóge párových porovaí) majú a dodržae ormalt a rovot varací všše požadav. Máme teda podobú tuácu ao u t-tetu a plata všet pozám, uvedeé v prílušej čat. Ta ao pre t-tet etuje dooca Welchova verza aalýz rozptlu určeá pre prípad rôzch varací v upách.. Tetujte zvš. Hoc použte tetu ormalt pre dáta v upách možo ozačť za ôr avý poč, prpomeňme, že všet chb majú rovaé rozdelee N[0,σ], a to je evvaletá požadava ao ormále rozdelea dát rovaou varacou v upách. Zvšov ale máme toľo, oľo máme dát, taže tu má zmel tetovať rozdelee. V štatte je ale vžd rozumejše vec arelť, a žše uážeme potup, torý je tradčý a uverzále použteľý (ele pre aalýzu rozptlu): vatlový graf (quatle-quatle plot).