Statstka, predavana, 70 Jaka Smrekar februar 0 Dskretna porazdeltev na končno mnogo točkah Matematčno ozade Dskretna slučana spremenlvka X: Na bo m X = {ξ 0, ξ,, ξ m } n p = P (X = ξ Parametrčn prostor: Smpleks { (p 0, p, p,, p m p > 0, } m =0 p = Porazdeltvena gostota enega ekspermenta: f(x; p 0,, p m = Porazdeltvena gostota enostavnega slučanega vzorca: g(x,, x n ; p 0,, p m = p T0 0 pt ptm m Tu e T (x,, x n = n = ξ (x m ξ (x p =0 Zanmve nčelne hpoteze Testrane čsto določene porazdeltve - prlagodtven test: H 0 = {(π 0,, π m } Na prmer: gralna kocka e poštena; p = ( 6, 6, 6, 6, 6, 6 p 0 = p, m = : p 0 = p, m = : Cenlka navečega vereta Nastopane nčelnh frekvenc: Prvzemmo, da e T 0 = 0 Teda e zraz g(x; p = p T ptm m očtno maksmzran pr ˆp 0 = 0 Prvzemmo : T 0: Kot občano, maksmzramo log g = T 0 log(p 0 + T m log(p m Ker gre za problem z vezo p =, nastavmo G = T 0 log(p 0 + + T m log(p m µ( p Ekstremala za G e ena sama: µ = n n ˆp = T n 4 Izkaže se, da gre za maksmum
4 Testrane čsto določene porazdeltve Razmere veret za H 0 = {(π 0,, π m }: π T 0 0 πt λ n (x = πtm m (T 0/n T 0 (T /n T (T = m m/n Tm =0 ( nπ T T log λ n (x = 0 m; T 0 T ( log(t log(nπ Velk vzorc: Če e deansk parameter enak (π 0,, π m, vela log λ n d χ m H 0 zavrnemo, če log λ n > χ m;α, ker P ( χ m > χ m;α = α H-kvadrat prlagodtven test H-kvadrat prlagodtven test: Če e deansk parameter enak (π 0,, π m, se lmtna porazdeltev testnh statstk log λ n uema z lmtno porazdeltvo statstk: m (T nπ =0 T n m (T nπ =0 nπ Tu e T opažena frekvenca, nπ pa (pr H 0 prčakovana frekvenca Dokaz: Vela log( + ξ = ξ ξ + o(ξ, ko ξ 0 Pr H 0 : m =0 T log ( nπ T = T log ( + nπ T = (nπ T + T ( nπ T + T o p ( ( nπ T Še: T o p ( ( nπ T = (nπ T T o p ( = n (T/n π T /n o p ( = ( n ( T/n π π o p ( = o p (, ko n π( π Testrane neodvsnost Uvod Spol n pte kave med študent na FMF: Študente FMF lahko po en stran razdelmo na dekleta n fante, po drug stran pa na študente, k peo kavo n na take, k e ne peo Al sta t deltv neodvsn? V vzorcu študentov zabeležmo:: dekleta fante pe kavo (0 6 (797 9 ne pe kave (697 7 (0 8 Ka b blo v prmeru neodvsnh razdeltev (neodvsnh lastnost : Skupna deklet b mela v skupnah kavopvc n nekavopvc deleža, k ustrezata deležu deklet v celotnem vzorcu Enako za fante
Parametrčn prostor Štre delež: pdk : delež deklet, k peo kavo, pdn : delež deklet, k ne peo kave, pf K : delež fantov, k peo kavo, pf N : delež fantov, k ne peo kave Vela pdk + pdn + pf K + pf N =, tore gre za -razsežn smpleks (tetraeder Predpostavka neodvsnost: Za delež deklet pd = pdk + pdn, delež fantov pf = pf K + pf N, delež kavopvcev pk = pdk + pf K, delež nekavopvcev pn = pdn + pf N vela: pdk = pd pk, pdn = pd pn, pf K = pf pk, pf N = pf pn Parametrčn prostor n nčelna hpoteza neodvsnost 4 Lastnost pe kavo b lahko še razčlenl: redno pe, pe do x dnevno, pe prložnostno, 4 ne pe Al e ta razdeltev neodvsna od razdeltve po spolu? V vzorcu študentov zabeležmo:: redno pe kavo pe do x dnevno pe prložnostno ne pe kave dekleta 6 8 (48 ( ( (697 fante 7 ( (77 (68 (0 6 9 4 Ka b blo v prmeru neodvsnh razdeltev (neodvsnh lastnost : Skupna deklet b v vsakem razredu (nekavopvcev zaemala delež, k ustreza deležu deklet v celotnem vzorcu Enako za fante Matematčna formulaca Problem n parametrčn prostor: Veretnostn prostor Ω razbemo na dsunktn un: Ω = A t A t t Ar n Ω = B t B t t Bs Prvzamemo, da n za vsa števla n vela p = P (A B o > 0 (Sled tud p = P (A > 0 n q = P (B > 0 X Vela tore Θ = [p ]66r,66s p > 0, p =, kar e smpleks razsežnost rs, k naravno lež v prostoru matrk Rr s,
Nčelna hpoteza neodvsnost: Neodvsnost:, : p = P (A B = P (A P (B = p q To pomen, da za vsak števl n vela p = ( ( p k p l k Ker e nčelna hpoteza očtno parametrzrana s kartezčnm produktom r s, e dmh 0 = r + s Vela dmθ dmh 0 = rs (r + s = rs r s + = (r (s l 6 Eksperment Ops ekspermenta ozroma vzorčena: Neodvsno n slučano zberemo n elementov z množce Ω n s T označmo števlo elementov, k prpadao preseku A B Rezultate predstavmo v kontngenčn tabel: s s T T T,s T s U T T T,s T s U r T r T r T r,s T rs U r V V V s V s n Gre seveda za dskretno slučano spremenlvko X s končno zalogo vrednost {(, r, s}, ker e X(ω = (,, če ω A B 7 Testrane neodvsnost: razmere veret Porazdeltvena gostota vzorca n cenlka navečega vereta: Kot pre: g(x,, x n ; p = p T,, ker e T števlo parov (, med vrednostm x,, x n CNV e ˆp = T n, zato: sup g(x; p = ( T T n p Θ Cenlka navečega vereta na H 0 : Upoštevamo, da vela p = p q n računamo: g(x; [p q ] = = ( p (p q T = ( q T T p T q T = ( Upoštevamo p = n q = n dobmo ˆp = U n, ˆq = V Tore: sup g(x; p = ( p H 0 ( U n U ( n ( V n = ( p U p T ( ( q V V = = q T ( UV n T 8 Testrane na podlag razmera veret Testna statstka: λ n (x = ( UV nt T, log λ n (x = T log ( U V nt Test : Zavrnemo hpotezo neodvsnost H 0 : p = p q, če log λ n (x > C Pr tem konstanto C določmo eksaktno z multnomsko porazdeltvo za mahne vzorce al vzamemo C = χ (r (s ;α za velke vzorce, ker upoštevamo log λ n d n χ (r (s 4
9 Zamenava z asmptotčno ekvvalentnm testom Standardna χ -testa: Kot pre se zkaže, da z uporabo Taylorevega polnoma stopne za logartem dobmo dve statstk, k ravno tako v porazdeltv konvergrata k porazdeltv χ (r (s To sta, (T U V /n T n, (T U V /n U V /n Občan zaps: Pšmo ˆT = U V /n Števla ˆT menuemo (glede na H 0 prčakovane frekvence, števla T pa opažene frekvence H 0 zavrnemo, če (T ˆT ˆT > χ (r (s ;α r, s Območa zaupana Interval zaupana Uvodna defnca: Denmo, da nas zanma matematčno upane E(X naše slučane spremenlvke (slučanega ekspermenta Prvzemmo model F (množca dopustnh porazdeltev n na bo α (0, (mahno poztvno števlo Defnca: Interval zaupana za E(X stopne zaupana α za vzorce velkost n sestavlata tak funkc vzorca za kater vela L: R n R, U : R n R, P ( {x R n L(x E(X U(x} α glede na vsako porazdeltev z modela F Pravmo tud, da e nterval zaupana prredtev x [L(x, U(x] Navn nterval zaupana za delež Model: Bernoulleva slučana spremenlvka X B(, p, ker p (0, Konstrukca za vzorec velkost 0: Na bo k števlo ugodnh zdov n na bo nterval zaupana [ k 0 0, k 0 + 0 ] Stopna zaupana?: k nterval p = 0 p = 0 p = 0 p = 07 p = 09 0 [, ] 049 006 0000 0000 0000 [0, ] 087 088 000 0000 0000 [, ] 094 08 0044 0000 0000 [, 4] 007 00 07 000 0000 4 [, ] 00 046 00 006 0000 [4, 6] 000 008 046 008 000 6 [, 7] 0000 006 00 046 00 7 [6, 8] 0000 000 07 00 007 8 [7, 9] 0000 0000 0044 08 094 9 [8, ] 0000 0000 000 088 087 0 [9, ] 0000 0000 0000 006 049 pokrtost 090 0 066 0 090
Graf pokrtost: 09 08 07 06 0 04 047 0 0 0 0 0 7 0 4 9 0 p 6