PARAMETRŲ ĮVERČIAI IR STATISTINĖS HIPOTEZĖS DARBO TIKSLAS - išstudijuoti parametrų taškiių ir itervaliių įverčių radimo, parametriių ir eparametriių hipotezių tikriimo uždaviius ir jų taikymą Teorijos klausimai Suformuluokite parametrų taškiių ir itervaliių įverčių radimo uždaviius Paaiškikite dvi termio statistika prasmes 3 Kokie įverčiai vadiami taškiiais? 4 Apibrėžkite, kokį įvertį vadiame suderitu, epasliktu ir efektyviu? 5 Kokie taškiiai įverčiai laikomi gerais? 6 Taškiių įverčių sudarymo būdai (mometų ir didžiausio tikėtiumo metodai) Kokios yra jų teigiamos ir eigiamos pusės? 7 Ką vadiame pasikliautiuoju itervalu ir pasikliovimo lygmeiu? 8 Paaiškikite pasikliautiojo itervalo sudarymo žigsius 9 Kaip keičiasi pasikliautiojo itervalo ilgis: a) didiat imtį; b) mažiat pasikliovimo lygmeį? 0 Kokios statistikos audojamos sudarat ormaliojo skirstiio vidurkio pasikliautiąjį itervalą, kai dispersija žioma ir kai ji ežioma? Kaip sudaromas ormaliojo skirstiio dispersijos pasikliautiasis itervalas, kai vidurkis ir dispersija ežiomi? Kaip radamas įvykio tikimybės pasikliautiasis itervalas? 3 Paaiškikite statistiės hipotezės sąvoką ir pateikite pavyzdžių 4 Kokią hipotezę vadiame ulie, kokią - alteratyvia? 5 Kokią hipotezę vadiame parametrie, kokią - eparametrie? Pateikite pavyzdžių 6 Paaiškikite pirmosios ir atrosios rūšies klaidos bei reikšmigumo lygmes prasmes 7 Ką vadiame kritie reikšme ir kritie sritimi? Kaip parekama kritiė sritis? 8 Paaiškikite hipotezės tikriimo žigsius 9 Paaiškikite reikšmigumo lygmes ir p-reikšmės prasmes 0 Ką vadiame kriterijaus galia? Suformuluokite suderiamumo hipotezę Pateikite pavyzdžių Kokie kriterijai dažiausiai audojami suderiamumo hipotezių tikriimui? 3 Paaiškikite suderiamumo χ kriterijaus sudarymo schemą KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003
Tipiių uždaviių spredimas Normaliojo skirstiio parametrų įverčiai Užduotis Iš didelės elektros lempučių siutos atsitiktiai atriktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valadomis) Atsitiktiės imties realizacija įrašyta katalogo D:\duomeys faile elektros lemputesdat Reikia rasti elektros lempučių degimo laiko vidurkio ir dispersijos taškiius įverčius ir pasikliautiuosius itervalus Tarkime, kad stebime ormalųjį atsitiktiį dydį X~ N µ, σ, čia kitamasis X yra lemputės degimo laikas (valadomis) Parametrai µ ir σ ežiomi Spredimas Įvedame duomeis ORIGIN READPRN "D:\duomeys\elektros lemputesdat" Išvedame pirmuosius 0 imties elemetų 037 936 3 043 Apskaičiuojame imties didumą 4 099 = 5 043 legth() 6 05 = 55 7 958 8 08 9 034 0 93 Vidurkio pasikliautiojo itervalo radimo žigsiai: Radame ežiomų skirstiio parametrų taškiius įverčius Vidurkio taškiis įvertis: vid mea() vid = 070 Dispersijos taškiis įvertis: s Stdev() s = 006 s = 0405 KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003
Parekame pasikliovimo lygmeį -α = 095, tuomet 3 Pasikliautiojo itervalo sudarymui parekame statistiką α 005 4 T X vid µ S Radame Stjudeto skirstiio α/ ir -α/ lygmes kvatilius t α/ ; - ir t -α/ ; -, tekiačius lygtį P( tα/ ; - < X vid µ arba pertvarkytą lygtį P ( Xvid - S S, kuri turi Stjudeto skirstiį su - laisvės laipsių < t-α/ ; - ) = - α, t -α/ ; - < µ < Xvid - S t α/ ; - ) = - α [ ] qt t α/ ; - α, [ ] = 005 t α/ ; - α [ t -α/ ; - ] qt, 5 Apskaičiuojame populiacijos vidurkio pasikliautiąjį itervalą s s [ PI -α ( µ )] vid [ t -α/ ; - ] vid PI -α ( µ ) [ ] = ( 990 0444 ) Išvada, Su 95% garatija galime teigti, kad elektros lempučių vidutiis degimo laikas yra uo 990 iki 0444 valadų Dispersijos pasikliautiojo itervalo radimo žigsiai: [ t -α/ ; - ] = 005 ( α) = 095 [ t α/ ; - ] Radame parametro taškiį įvertį s Stdev() s = 04 Parekame pasikliovimo lygmeį -α = 095, tuomet α 005 KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 3
3 Pasikliautiojo itervalo sudarymui parekame statistiką χ S ( ) σ, kuri turi chi-kvadrato skirstiį su - laisvės laipsių 4 Radame chi-kvadrato skirstiio α/ ir -α/ lygmes kvatilius ( χ ) ir α/ ; - χ α/ ; - α/ ; - < S P( χ arba pertvarkytą lygtį P ( S ( ) < σ ( χ ) < -α/ ; -, tekiačius lygtį < χ σ -α/ ; - ) = - α, S ( ) ) = - α ( χ ) α/ ; - ( χ ) α/ ; - qchisq α, ( χ ) α/ ; - = 3559 ( χ ) α/ ; - α qchisq, ( χ ) α/ ; - = 769 5 Apskaičiuojame populiacijos dispersijos pasikliautiąjį itervalą PI -α σ s ( ) ( χ ) α/ ; - PI -α σ = ( 7753 5366) α = 095 s ( ) ( χ ) α/ ; - Išvada, Su 95% garatija galime teigti, kad elektros lempučių degimo laiko dispersija yra itervale uo 775,3 iki 536,6 KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 4
Įvykio tikimybės įverčiai Užduotis Apklausus 00 atsitiktiai atriktų įmoės darbuotojų, paaiškėjo, kad prieš įmoėje vykdomas reformas pasisakė 35 darbuotojai Raskite darbuotojų, epritariačių įmoėje vykdomoms reformoms, dalies 90% pasikliautiąjį itervalą Spredimas Tarkime, kad X yra darbuotojo atsakymas į klausimą Tegul X įgyja reikšmę (jeigu darbuotojas epritaria įmoėje vykdomoms reformoms) arba 0 (priešigu atveju) Tuomet X skirstiys yra biomiis X~B(; p), čia p - dalis įmoės darbuotojų epritariačių reformoms Pasilkliautiojo itervalo radimo žigsiai: Radame parametro p taškiį įvertį p 35 p p = 035 00 Parekame pasikliovimo lygmeį -α = 090 Z p p p ( p) kuri turi stadartiį ormalųjį skirstiį Z~N(0; ),, tuomet 3 Pasikliautiojo itervalo sudarymui parekame statistiką α 00 4 Radame stadartiio ormaliojo skirstiio α/ ir -α/ lygmes kvatilius z α/ ir z α/, tekiačius lygtį p p P( zα/ < < z α/ ) = - α, p ( p) arba pertvarkytą lygtį p ( p) < p ( p) p < p zα/ P ( p z α/ ) = - α [ ] qorm α, 0, z α/ [ ] = 64 z α/ α [ z α/ ] qorm, 0, [ z α/ ] = 64 KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 5
5 Apskaičiuojame tikimybės p α = 09 pasikliautiąjį itervalą p ( p) [ PI -α ( p) ] p [ z α/ ] p [ z α/ ] [ PI -α ( p) ] = ( 04 046 ) p ( p) Išvada Su 90% garatija galime teigti, kad įmoėje vykdomoms reformoms epritaria uo 4 iki 46 procetų dirbačiųjų 3 Hipotezės apie ormaliojo skirstiio vidurkio reikšmes Užduotis Iš didelės elektros lempučių siutos atsitiktiai atriktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valadomis) Imties duomeys įrašyti faile elektros lemputesdat Reikia patikriti hipotezę, kad vidutiis lempučių degimo laikas lygus 000 valadoms Tarkime, kad stebime ormalųjį atsitiktiį dydį X~ N µσ,, čia kitamasis X yra lemputės degimo laikas (valadomis) Parametrai µ ir σ ežiomi Spredimas Įvedame duomeis ORIGIN READPRN "D:\duomeys\elektros lemputesdat" Imties didumas Hipotezės tikriimo žigsiai: Suformuluojame statistię hipotezę µ 0 000 legth() = 55 H 0 : µ µ 0 H a : µ µ 0 Parekame reikšmigumo lygmeį α 005 KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 6
3 Hipotezės tikriimui parekame statistiką T ( X vid µ 0 ) S kuri turi Stjudeto skirstiį su - laisvės laipsių 4 Radame hipotezės H 0 kritię sritį W K ir eatmetimo sritį W 0 Kadagi šiuo atveju kritiė sritis yra dvipusė, radame du Stjudeto skirstiio kvatilius (dvi krities reikšmes) t α/ ; - ir t -α/ ; -, [ ] qt t α/ ; - α, α [ t -α/ ; - ] qt, [ ] = 005 t α/ ; - [ t -α/ ; - ] = 005 Kritię sritį sudaro aibė W K = (- ; t α/ ; - ) (t -α/ ; - ;+ ) = (- ; -005) (005;+ ), o eatmetimo sritį aibė W 0 =[ t α/ ; - ; t -α/ ; - ] = (-005; 005) 5 Pagal imties duomeis apskaičiuojame kriterijaus statistikos reikšmę t imt ir priimame spredimą Jeigu imt t W 0, tai hipotezė H 0 eatmetama, priešigu atveju ji atmetama ir priimama H a vid s mea() Stdev() vid µ 0 t imt s vid = 070 s = 006 t imt = 68 Išvada Hipotezė H 0 eatmetama, es t imt W 0 Teigiys, kad vidutiis elektros lempčių degimo laikas yra 000 valadų eprieštarauja imties duomeims Tačiau gali būti ir kitų teisigų uliių hipotezių Pavyzdžiui, vidutiis lemučių degimo laikas yra 995 arba 05 valadų Patikrikite tai savarakiškai KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 7
Grafiškai pavaizduosime kriterijaus statistikos takio fukciją (kai H 0 teisiga), hipotezės H 0 kritię sritį W K, eatmetimo sritį W 0 ir stebėtą statistikos reikšmę t imt t 4, 39 4 O 005 04 [ t α/ ; - ] [ t -α/ ; - ] 03 dt( t, ) O 0 0 0 4 0 t imt 4 t, t imt Kritiė sritis W K H 0 eatmetimo sritis W 0 Kritiė sritis W K Matome, kad stebėta kriterijaus statistikos reikšmė t imt pateka į sritį W 0, todėl uliė hipotezė H 0 eatmetama Paaudoję Mathcad programavimo galimybes, sudarysime fukciją, kuri patikria ar stebėtoji kriterijaus statistikos reikšmė t imt pateka į sritį W 0 ir išveda hipotezės tikriimo atsakymą Žemiau pateikta Mathcad fukcija Atsakymas patikria ar stebėta statistikos reikšmė t imt pateka į sritį W 0 Jeigu t imt pateka į sritį W 0, tai išvedamas tekstas "H 0 eatmesta", priešigu atveju - " H 0 atmesta" Po to, skaičiuojamas stebėtas statistikos reikšmigumo lygmuo (p-reikšmė), kuris apvaliamas 3 žeklų po kablelio tikslumu Fukcijos Atsakymas reikšmė yra vektorius, kurio pirmoji kompoetė yra tekstas "H 0 eatmesta" arba "H 0 atmesta", o atroji kompoetė - "p=p-reikšmė" Jeigu gauame, kad p-reikšmė yra mažesė už pasiriktą reikšmigumo lygmeį α, tai hipotezė H 0 atmetama KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 8
Atsakymas tekstas "Ho eatmesta" tekstas if [ t α/ ; - ] t imt [ t -α/ ; - ] tekstas "Ho atmesta" otherwise p mi pt t imt,,, Atsakymas ( pt( t imt ) ) p substr ( umstr( roud( p, 3) ), 0, 6) tekstas cocat ("p=", p) tekstas = "Ho eatmesta" "p=0" Viepusių alteratyvų atveju audojama ta pati statistika ir paašiai sudaromos kritiės sritys Kai alteratyva yra H a : µ < µ 0 apskaičiuojame vieą kritię reikšmę ( kritiėsritis viepusė kairė) [ t α ; - ] qt α, [ t α ; - ] = 674 Kritiė sritis yra aibė W K = (- ; t α ; - )= (- ; -675), o hipotezės H 0 eatmetimo sritis aibė W 0 =[ t α ; - ; + ) = [-674; + ) Išvada Hipotezė H 0 eatmetama, es t imt W 0 Teigiys,,vidutiis elektros lempčių degimo laikas yra 000 valadų'' eprieštarauja imties duomeims Su 95% garatija mes egalime teigti, kad jis mažesis už 000 valadų Pateiksime Mathcad fukciją AtsakymasK, kuri išveda hipotezės tikriimo rezultatą ir p-reikšmę, kai kritiė sritis yra viepusė kairė AtsakymasK tekstas "Ho eatmesta" if t imt [ t α ; - ] tekstas "Ho atmesta" otherwise p pt t imt, p substr ( umstr( roud( p, 3) ), 0, 6) tekstas cocat ("p=", p) tekstas KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 9
AtsakymasK = "Ho eatmesta" "p=0895" Grafiškai pavaizduosime kriterijaus statistikos takio fukciją ( kai H 0 teisiga), hipotezės H 0 kritię sritį W K, eatmetimo sritį W 0 ir stebėtą statistikos reikšmę t imt 04 t 4, 39 4 O 005 [ tα ; -] 03 dt( t, ) O 0 0 0 4 0 t imt 4 t, t imt Kritiė sritis W K H 0 eatmetimo sritis W 0 Matome, kad stebėta kriterijaus statistikos reikšmė t imt pateka į sritį W 0, todėl uliė hipotezė H 0 eatmetama 4 Hipotezė apie dviejų ormaliųjų skirstiių vidurkių lygybę Hipotezių apie dviejų vidurkių lygybę tikriimui audojamos statistikos turi Stjudeto skirstiius, todėl atitikami kriterijai vadiami Stjudeto t kriterijais Skirtigi t kriterijai taikomi priklausomoms ir epriklausomoms imtims Vertiat vidurkių skirtumus svarbi ir duomeų sklaida - stebimų dydžių dispersijos, todėl skirtigi Stjudeto t kriterijai taikomi, kai abiejų populiacijų dispersijos lygios ir tais atvejais kai populiacijų dispersijos skiriasi statistiškai reikšmigai Čia pateiksime hipotezės apie vidurkių lygybę tikriimo pavyzdį epriklausomoms imtims, kai populiacijų dispersijos yra lygios KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 0
Užduotis Gamykla dirba dviem pamaiomis Jos vadovai ori sužioti ar darbo ašumas dieiėje ir aktiėje pamaiose yra vieodas Atsitiktiai atrikta 00 darbiikų (60 dirbačių dieiėje, 40 - aktiėje pamaiose) ir užregistruota, kiek detalių jie pagamio per pamaią Gautų imčių duomeys įrašyti failuose dieie pamaiadat ir aktie pamaiadat Reikia patikriti hipotezę: ar abiejuose pamaiose vieas darbiikas pagamia vidutiiškai tiek pat detalių Tarkime, kad stebime ormaluosius atsitiktiius dydžius X~ N µ, σ ir Y~ N µ y σ, Spredimas Įvedame duomeis ORIGIN y READPRN "D:\duomeys\dieie pamaiadat" READPRN ("D:\duomeys\aktie pamaiadat" ), čia X yra dieiės pamaios darbiiko pagamitų detalių skaičius, o Y - aktiės pamaios darbiiko Parametrai µ, µ y ir σ ežiomi Imčių didumai: m legth() legth( y) = 60 m= 40 Hipotezės tikriimo žigsiai: Suformuluojame statistię hipotezę H 0 : µ µ y H a : µ > µ y Parekame reikšmigumo lygmeį α 005 3 Hipotezės tikriimui parekame statistiką T X vid Y vid, ( ) S + ( m ) S y m ( + m ) + m, kuri turi Stjudeto skirstiį su m+- laisvės laipsių KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003
4 Radame hipotezės H 0 kritię sritį W K ir eatmetimo sritį W 0 Kadagi šiuo atveju kritiė sritis yra viepusė, radame vieą Stjudeto skirstiio kvatilį (kritię reikšmę) t -α ; + m t -α ; + m [ ] qt α, + m [ ] = 66 t -α ; + m Kritię sritį sudaro aibė W K = (t -α ; + m ; + ) = (66; + ), o H 0 eatmetimo sritį aibė W 0 =( ; t -α ; + m ] = (- ; 66] 5 Pagal imties duomeis apskaičiuojame kriterijaus statistikos reikšmę t imt ir priimame spredimą Jeigu imt t W 0, tai hipotezė H 0 eatmetama, priešigu atveju ji atmetama ir priimama H a vid y vid s s y mea() mea( y) Stdev() Stdev( y) vid = 3003 y vid = 895 s = 486 s y = 539 t imt vid y vid ( ) s + ( m ) s y [ m ( + m ) ] + m t imt = 0695 Išvada Hipotezė H 0 atmetama, es t imt W K Statistiškai įrodyta, kad dieiės pamaios darbiikas pagamia vidutiiškai daugiau detalių lygiat su aktiės pamaios darbiiku 5 Hipotezė apie dviejų ormaliųjų skirstiių dispersijų lygybę KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003
Nuo to, ar dviejų populiacijų dispersijas galima laikyti lygiomis, priklauso Stjudeto kriterijaus statistika, kuri taikoma tikriat hipotezę apie vidurkių lygybę Hipotezė apie dispersijų lygybę svarbi spredžiat ir kitus uždaviius Pavyzdžiui, tiriat kaių stabilumą, dviejų testų rezultatų homegeiškumą ir paašiai Šiame skyrelyje pateiksime hipotezės apie dispersijų lygybę tikriimo pavyzdį dviems epriklausomoms imtims Imtys yra tos pačios kaip ir skyrelyje 344, ty stebime ormaliuosius atsitiktiius dydžius X~ N ( µ, σ ) ir Y~ N ( µ y, σ y ), čia X yra vieo dieiės pamaios darbiiko pagamitų detalių skaičius, o Y - aktiės pamaios darbiiko Parametrai µ, µ y, σ ir σ y ežiomi Reikia patikriti hipotezę apie dispersijų lygybę Spredimas ORIGIN y READPRN "D:\duomeys\dieie pamaiadat" READPRN ("D:\duomeys\aktie pamaiadat" ) Imčių didumai: m legth() legth( y) Hipotezės tikriimo žigsiai: Suformuluojame statistię hipotezę = 60 m= 40 H 0 : σ σ y H a : σ σ y Parekame reikšmigumo lygmeį 3 Hipotezės tikriimui parekame statistiką α 005 F S S y, kuri turi Fišerio skirstiį su - ir m- laisvės laipsių KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 3
4 Radame hipotezės H 0 kritię sritį W K ir eatmetimo sritį W 0 Kadagi šiuo atveju kritiė sritis yra dvipusė, radame du Fišerio skirstiio kvatilius (dvi krities reikšmes) F α/ ; -; m- ir F -α/ ; -; m- F α/ ; -; m- [ ] qf α,, m α [ F -α/ ; -; m- ] qf,, m [ F α/ ; -; m- ] = 057 [ F -α/ ; -; m- ] = 86 Kritię sritį sudaro aibė W K = ( 0; F α/ ; -; m- ) (F -α/ ; -; m- ; + ) = ( 0; 057 ) ( 86; + ), o eatmetimo sritį aibė W 0 =[ F α/ ; -; m- ; F -α/ ; -; m- ] = [ 057; 86 ] 5 Pagal imties duomeis apskaičiuojame kriterijaus statistikos reikšmę F imt ir priimame spredimą Jeigu F imt W 0, tai hipotezė H 0 eatmetama, priešigu atveju ji atmetama ir priimama H a s Stdev() s y Stdev( y) s = 486 s y = 539 s F imt s y F imt = 084 Išvada Hipotezė H 0 eatmetama, es F imt W 0 Teigiys, kad darbiikų pagamitų detalių skaičiaus dispersija lygios abiejuose pamaiose eprieštarauja imties duomeims Grafiškai pavaizduosime kriterijaus statistikos takio fukciją (kai H 0 teisiga), hipotezės H 0 kritię sritį W K, eatmetimo sritį W 0 ir stebėtą statistikos reikšmę F imt KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 4
F 0, 005 3 O 0 6 [ F α/ ; -; m- ] [ F -α/ ; -; m- ] df( F,, m ) O 08 04 0 0 05 F imt 5 5 3 F, F imt Kritiė sritis W K H 0 eatmetimo sritis W 0 Kritiė sritis W K Nagriėsime stebimo skirstiio ir aprioriškai pasirikto teoriio skirstiio atitikimo problemą, ty tikrisime ar turimas empiriis skirstiys suderiamas su teoriiu modeliu Formaliai statistię hipoteze apie tai, kad mūsų imtis gauta iš populiacijos, kurios skirstiys yra ormalusis užrašysime H 0 : 6 Suderiamumo hipotezės X~ N ( µ, σ ), H a : X~ / N µ, σ Suderiamumo hipotezių tikriimui yra siūlomi keli kriterijai Mes audosime χ kriterijų, kurį įvedė Pirsoas (K Pearso) Uždaviys Iš didelės elektros lempučių siutos atsitiktiai atriktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valadomis) Imties duomeys įrašyti faile elektros lemputesdat Reikia patikriti hipotezę, kad imtis gauta iš populiacijos, kurios skirstiys yra ormalusis, ty X~ N µ, σ, čia kitamasis X yra lemputės degimo laikas (valadomis), parametrai µ ir σ ežiomi KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 5
Spredimas ORIGIN READPRN ("D:\duomeys\elektros lemputesdat" ) Imties didumas: legth() = 55 Hipotezės tikriimo žigsiai: Užrašome statistię hipotezę H 0 : H a : X~ N vid s, X~ / N vid, s Parekame reikšmigumo lygmeį α 005 3 Hipotezės tikriimui parekame statistiką χ j k = ( ) O j E j E j, kuri turi χ skirstiį su k-r- laisvės laipsių Statistikos χ formulėje O j yra skirtigų imties reikšmių (kategorijų) dažiai, jei stebimas diskretusis kitamasis arba itervaliiai dažiai, jei stebimas tolydusis kitamasis, k - kategorijų arba itervalų skaičius, r - skirstiio parametrų, įvertiamų pagal imties duomeis skaičius, E j - tikėtiieji dažiai (teoriiai dažiai) Pastaba: Kai skirstiio parametrai žiomi, tai r=0 Kai skirstiio parametrai ežiomi, tai χ kriterijus taikomas korektiškiau (teisigiau), jei skirstiio parametrų taškiiai įverčiai radami maksimalaus tikėtiumo metodu, taikomu grupuotiems duomeims Kai tolydžiųjų skirstiių šeimų, priklausačių tik uo poslikio ir mąstelio parametrų (pvz ormaliojo skirstiio) ežiomų parametrų įverčiai radami maksimalaus tikėtiumo metodu, taikomu egrupuotiems duomeims siūloma taikyti tikslesį, modifikuotą χ kriterijų, kurį pasiūlė rusų statistikas L Bolševas KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 6
4 Pagal imties duomeis apskaičiuojame kriterijaus statistikos reikšmę ( χ ) imt Kai duomeų aibė simetriška, tai itervalų skaičių k patartia pasirikti artimą skaičiui + 33 log( ) = 678 Pasirekame itervalą (a ; a k+ ] su savybe a mi, a k+ ma, pasistegiat, kad itervalo a k+ a ilgis būtų kiek galima artimesis imties pločiui IP ma mi, o daliių itervalų ilgis h būtų "gražus" skaičius mi IP ma mi Jeigu parekame k 6 a 750 h i a k+ a k mi() mi = 79 k, tai ma ma = 87 IP = 496 a k+ 90 h = 90 ma() a i a + ( i ) h Nubrėšime empiriės takio fukcijos grafiką pasiaudodami fukcija : histograma( a, imtis) ν hist( a, imtis) for i b i b i a i a i c i 0 c i last( a) if i last( a) ν i c i 0 augmet( b, c) otherwise KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 7
histograma( a, ) h histograma( a, ) 0005 0004 0003 000 000 0 750 840 930 00 0 00 90 Normalusis atsitiktiis dydis įgyja reikšmes uo iki, todėl formaliai turime pakeisti pirmojo ir paskutiiojo itervalų kraštiius taškus b a b b k+ Skaičiuojame stebėtus itervaliius dažius o hist( b, ) Naudodamiesi teoriio skirstiio (hipotezės H 0 formuluotėje urodytas ormalusis skirstiys) savybėmis, apskaičiuojame, kiek kitamojo reikšmių turėtų patektų į kiekvieą itervalą, jeigu hipotezė apie kitamojo X skirstiį būtų teisiga j k KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 8
Apskaičiuokime imties vidurkį ir dispersiją grupuotiems duomeims: k a i + a i+ vid o i vid = 059 = i k a i + a i+ s vid o i s = 99 = e j porm b j+, vid, s i ( porm( b j, vid, s) ) 0 307 3 840 6 930 8 b = 00 o = e = 0 5 00 0 307 097 84 759 776 787 85 Taikat χ kriterijų reikalaujama, kad kiekvieame itrevale tikėtias dažis e i būtų e mažesis už 5 Itervalus, kuriuose tikėtias dažis yra mažiau kaip 5, reikia jugti su gretimais itervalais, es priešigu atveju išvados gali būti klaidigos Mūsų pavyzdyje yra du tokie itervalai (pirmas ir paskutiis), es e = 097 ir e 6 = 85 Sujugsime du pirmuosius ir du paskutiius itervalus ( iš vektoriaus b pašalisime du taškus 840 ir 00) Tam sudarysime fukciją pasaliti( V, c), kuri pašalia vektoriaus V koordiatę V c (vektoriaus V ilgis sumažėja vieetu) KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 9
pasaliti( V, c) i b pasaliti( b, ) b pasaliti( b, 5) for U j if ( j c) Naujai sudarytiems itervalams apskaičiuojame tikėtius dažius ir stebėtą kriterijaus statistikos reikšmę U i rows( V) V j i i + a pasaliti( a, ) a pasaliti( a, 5) o hist( b, ) k j rows( o) k e 0 k = 4 vid i k = a i + a i+ o i vid = 059 s i k = a i + a i+ vid o i s = 05 ( porm( b j, vid, s) ) e j porm b j+, vid, s b = 0 307 930 00 0 0 307 o = 9 8 7 e = 08 758 699 96 Pastaba Skaičius 0 307 yra "kompiuterio begalybė" KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003 0
8 04 o e = ( o e) = 40 6 39 08 607 685 ( χ ) imt ( o j e j ) χ j e j imt = 973 5 Radame hipotezės H 0 kritię sritį W K, eatmetimo sritį W 0 ir priimame spredimą Jeigu, χ imt W 0, tai hipotezė H 0 eatmetama, priešigu atveju ji atmetama ir priimama H a Kadagi šiuo atveju kritiė sritis yra viepusė dešiė, radame vieą χ skirstiio kvatilį χ -α ; k r čia k=4, r=, es du parametrai įvertiti, pagal imties duomeis ( χ ) α ; Kritię sritį sudaro aibė qchisq α, χ W K = ( χ o H 0 eatmetimo sritį aibė W 0 =[ 0; χ α ; -α ; ; + ) = (384; + ), -α ; ] = [ 0; 384] = 384, Grafiškai pavaizduosime kriterijaus statistikos takio fukciją (kai H 0 teisga), hipotezės H 0 kritię sritį W K, eatmetimo sritį W 0 ir stebėtą statistikos reikšmę χ imt : χ 0 00, 5 O 03 KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003
6 ( χ ) α ; 08 04 0 0 3 4 5 ( χ ) imt H 0 eatmetimo sritis W 0 Kritiė sritis W K Išvada Hipotezė H 0 eatmetama, es ( χ ) imt W 0 Teigiys, kad elektros lemputės degimo laikas turi ormalųjį skirstiį, eprieštarauja imties duomeims KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 003