4. Bodový odhad Pricíp bodového odhadu spočíva v odhade ezámych parametrov (stredej hodoty, rozptylu, smerodajej odchýlky, atď.) prostredíctvom výberových charakteristík, ktoré sú reprezetovaé jedým číslom (bodom). POJMY Základý súbor Výberový súbor Výberové skúmaie Parametre základého súboru Výberové charakteristiky Estimátor Výberový priemer Výberový rozptyl Výberová smerodajá odchýlka Výberový podiel Vlastosti bodového odhadu VZORCE Odhad stredej hodoty pomocou výberového priemeru est μ = x x = j= x j kde: zaku x i hodota štatistického x - aritmetický priemer i absolúta početosť m počet tried hšt ti ti kéh Odhad rozptylu pomocou výberového rozptylu kde: x i hodota štatistického est σ = s zaku x - aritmetický priemer (x i x) i= i absolúta početosť s = m počet tried hšt ti ti kéh Odhad smerodajej odchýlky pomocou výberovej smerodajej odchýlky est σ = s s = ( xi x) i= kde: zaku x j hodota štatistického x - aritmetický priemer hšt ti ti kéh Odhad podielu pomocou výberového podielu est π = p p = kde: zaku x j hodota štatistického x - aritmetický priemer hšt ti ti kéh
FUNKCIE V EXCELI = RANDBETWEEN (dolá hraica, horá hraica) = AVERAGE (číslo, číslo,...) = VAR (číslo, číslo,...) = STDEV (číslo, číslo,...) RIEŠENÝ PRÍKLAD Úloha: Uskutočiť výberové skúmaie, pričom základým súborom ostáva súbor 9 doteraz aalyzovaých poľohospodárskych podikov. Z výberového súboru áslede vypočítať výberové charakteristiky, ktoré budú bodovým odhadom parametrov celého základé súboru. Zadaie: Vytvorte áhodým spôsobom výberový súbor s rozsahom 0 štatistických jedotiek, z ktorého vypočítajte výberové charakteristiky. Aalýzy realizujte a štatistickom zaku priemerý mesačý zárobok. Na základe výberového súboru urobte odhad podielu družstiev v skúmaom súbore. Riešeie: Prvým zadaím je vytvoriť výberový súbor. Budeme vychádzať z jedoduchého áhodého výberu, tz., že zo základého súboru 9 poľohospodárskych podikov áhode vyberieme 0 podikov, ktoré budú tvoriť výberový súbor. Pri vytváraí je možé využiť matematickú fukciu RANDBETWEEN (slide 4.), ktorá po zadaé miimálej () a maximálej (9) hodoty áhode ageeruje číslo. Po skopírovaí tejto hodoty do ďalších buiek (=0, t.j. musíme akopírovať ešte 9 ďalších hodôt) dostávame jedotky výberového súboru. Slide 4. Nageerovaé hodoty vo výberovom súbore predstavujú čísla podikov, u ktorých budeme skúmať priemeré mesačé zárobky.
TP Čísla, ktoré sme získali, predstavujú poradové čísla podikov, a základe ktorých vyberieme podiky do výberového súboru. Vytvoreý výberový súbor vyzerá potom asledove: Tabuľka : Výberový súbor priemerých mesačých zárobkov za rok 005 Po vytvoreí súboru môžeme pristúpiť k výpočtu výberových charakteristík. Vychádzame z malého rozsahu hodôt (0), t.j. údaje ie je potrebé triediť. Pri výpočte využijeme fukcie, ktoré ám Excel poúka. Výberový priemer Použijeme fukciu AVERAGE. Hodota výberového priemeru sa rová 544,6. Iterpretácie uvedieme opäť v závere po dopočítaí ostatých výberových charakteristík. Výberový rozptyl Pri výpočte by bolomožé vypočítať charakteristiky prostredíctvom vzorcov alebo využiť Data Aalysis/Summary Statistics (kapitola ).
Na výpočet tejto výberovej charakteristiky slúži fukcia VAR. Výsledá hodota je 68 695,6. Výberová smerodajá odchýlka Smerodajú odchýlku by bolo možé dopočítať prostredíctvom dvoch fukcií. Využitím fukcie SQRT, t.j. odmocili by sme výberový rozptyl alebo pomocou fukcie STDEV. Výberová smerodajá odchýlka sa rová 3 553,69. Výberový podiel Posledou úlohou v rámci bodových odhadov bolo a základe výberového súboru odhadúť podiel družstiev v celom základom súbore, ktorý určíme a základe relatívej početosti. V súbore máme 0 () podikov, z ich je 8 () družstiev. Bodový odhad vypočítame ako 8/0=0,4, t.j. 40%. Iterpretácia výsledkov: Pri iterpretácii vychádzame z výsledkov, ktoré sme vypočítali z výberového súboru s cieľom robiť závery a celý základý súbor. Čiže a základe výberového priemeru odhadujeme, že priemeré mesačé zárobky vo všetkých poľohospodárskych podikoch (základý súbor) v roku 005 boli 544,6 Sk. Odhaduje, že variabilita v základom súbore meraá
rozptylom bola 68 695,6 Sk, t.j. priemeré mesačé zárobky pracovíkov poľohospodárskych podikov kolísali v roku 005 ± 3 553,69 Sk od priemeru. Vychádzajúc z výberového podielu odhadujeme, že z celkového počtu 9 poľohospodárskych podikov tvorili v roku 005 družstvá 40% podikov. Výhodou bodového odhadu je, že výsledý odhad ezámeho parametra je tvoreý jedou hodotou. Keďže však bol výberový súbor vytváraý áhodým spôsobom, tak aj výberové charakteristiky sú vlaste áhodé premeé. Keby sme z toho istého základého súboru vytvorili ďalší výberový súbor áhodým spôsobom, je vysoko pravdepodobé, že v ovom výberovom súbore by sa achádzali ié štatistické jedotky, t.j. pri odhade by sme sa dopracovali k iým hodotám výberových charakteristík. Z uvedeého vyplýva, že bodový odhad je síce presý (výsledkom je jedo číslo), ale málo spoľahlivý. Z tohto dôvodu sa častejšie využívajú itervalové odhady. 4. Itervalový odhad Ako už bolo vyššie spomeuté výhodou itervalových odhadov je ich spoľahlivosť. Podstata itervalového odhadu spočíva v určeí hraíc itervalu spoľahlivosti pri zadaej pravdepodobosti. POJMY Parametre základého súboru Výberové charakteristiky Spoľahlivosť odhadu Koeficiet spoľahlivosti Riziko odhadu Iterval spoľahlivosti Prípustá chyba Normovaé ormále rozdeleie Studetovo t- rozdeleie chí kvadrát rozdeleie VZORCE
Iterval spoľahlivosti pre stredú hodotu: >30 Px ( Δ μ x+δ ) = α σ Δ= u α / Iterval spoľahlivosti pre stredú hodotu: 30 Px ( Δ μ x+δ ) = α Δ= t α s kde: ZS kde: x - výberový priemer Δ - prípustá chyba u α /- kvatil ormovaého ormáleho rozdeleia σ smerodajá odchýlka x - výberový priemer Δ - prípustá chyba t α - kvatil Studetovho t- rozdeleia s výberová smerodajá Iterval spoľahlivosti pre rozptyl ( ) s ( ) s P σ α = χα/ χα/ kde: χ α /- kvatil chí kvadrát rozdeleia χα /- kvatil chí kvadrát rozdeleia s výberový rozptyl Iterval spoľahlivosti pre smerodajú odchýlku P ( ) s ( ) s σ = α χα/ χ α/ Iterval spoľahlivosti pre podiel kde: χ α /- kvatil chí kvadrát rozdeleia χα /- kvatil chí kvadrát rozdeleia s výberový rozptyl 9 Pre veľké výbery ak platí vzťah: > kde: p - výberový podiel p.( p) u α /- kvatil ormovaého p( p) p( p) ormáleho rozdeleia P( p u α/. π p+ u α/. ) = α π odhadovaý podiel ZS rozsah výberového súboru 9 Pre malé výbery ak eplatí vzťah: > p.( p) kde: - rozsah výberového súboru Využitím Fischerovho F rozdeleia - početosť výskytu skúmaého p d /( [ + ).( pd) ] = F( α /,( zaku + ),) = pd - dolá hraica itervalu spoľahlivosti p h horá hraica itervalu spoľahlivosti F( α /,( + ), ) - kvatil Fischerovho rozdelaia s príslušými stupňami
[ + h ] = ) p/( ).( p) F α + h ( /,( ), Rozsah výberového súboru kde: rozsah výberového súboru σ = u α / u α /- kvatil ormovaého Δ ormáleho rozdeleia π ( π ) = u α / π odhad podielu pomocou Δ p FUNKCIE V EXCELI = AVERAGE (číslo, číslo,...) = VAR (číslo, číslo,...) = STDEV (číslo, číslo,...) = CONFIDENCE (alfa, smerodajá odchýlka, rozsah výberového súboru) = NORMSINV (pravdepodobosť) = TINV (pravdepodobosť, stupe voľosti) = CHIINV (pravdepodobosť, stupe voľosti) = FIINV (pravdepodobosť, stupe voľosti, stupe voľosti) RIEŠENÝ PRÍKLAD Úloha: Vychádzajúc z výberových charakteristík urobiť itervalový odhad, a základe ktorého odhademe ezáme parametrov celého základé súboru pri zadaej spoľahlivosti. Zadaie: Vypočítajte: a) 95% a 99% iterval spoľahlivosti pre stredú hodotu, rozptyl a smerodajú odchýlku priemerých mesačých zárobkov. b) Určite v akých hraiciach sa bude pohybovať podiel družstiev z celkového počtu podikov pri 95% a 99% pravdepodobosti. Riešeie: Pri určovaí itervalu spoľahlivosti je potrebé vypočítať hraice itervalu, v ktorých sa bude ezámy parameter pohybovať s vopred staoveou pravdepodobosťou. V ašom príklade chceme odhadúť hraice itervalov s 95%, resp. 99% spoľahlivosťou. Iterval spoľahlivosti pre stredú hodotu Iterval spoľahlivosti pre stredú hodotu sa určí, keď k bodovému odhadu stredej hodoty (výberovému priemeru) pričítame (výpočet horej hraice), resp. odčítame (výpočet dolej hraice) prípustú chybu (delta). Prípustá chyba teda predstavuje polovicu šírky itervalu u α / spoľahlivosti a jej veľkosť je závislá a zvoleej spoľahlivosti (, t α ), variabilite základého súboru (σ ) a rozsahu výberového súboru ( ). Opäť je možé vypočítať prípustú chybu buď mechaicky, prostredíctvom vzorca alebo pomocou fukcie.
a) výpočet pomocou vzorca Do vzorca pre výpočet prípustej chyby potrebuje pozať kritickú hodotu zámeho teoretického rozdeleia, ktorú určíme prostredíctvom fukcie. Keďže rozsah výberového súboru je meší ako 30 (=0), budeme pri výpočte vychádzať zo Studetovho t-rozdeleia (fukcie TINV). Prvý parameter fukcie predstavuje zvoleú pravdepodobosť (v prípade fukcie TINV sa pravdepodobosť rová α 3 ) a druhý parameter je parametrom Studetovho t-rozdeleia, ktorý sa určí ako. b) výpočet pomocou fukcie Na výpočet prípustej chyby slúži v Exceli fukcia CONFIDENCE. Túto fukcie je možé použiť le vtedy, ak je záma variabilita základého súboru, resp. ak je 30, t.j. ak vychádzame z ormovaého ormáleho rozdeleia. Vychádzajúc z údajov v príklade by použitie fukcie vyzeralo asledove: 3 Využitie fukcie prezetujeme pri 95% spoľahlivosti (alfa=0,05). Rovakým spôsobom by sme postupovali aj pri 99 % spoľahlivosti, čiže alfa by sa rovala 0,0.
Parametrami fukcie sú hodoty: α, σ = s,. Ďalej je do vzťahu potrebé pozať variabilitu základého súboru. Keďže vychádzame z predpokladu, že základý súbor epozáme, odhademe jeho variabilitu a základe bodového odhadu ( estσ = s = 3 553,69 ). Už máme určeé všetky hodoty potrebé do vzťahu, je teda možé dopočítať výsledú hodotu prípustej chyby ako aj hraice itervalu spoľahlivosti. Výsledé hodoty sú uvedeé vo výstupe 4... Výsledky budú iterpretovaé súhre po dopočítaí ostatých itervalov spoľahlivosti. Iterval spoľahlivosti pre rozptyl a smerodajú odchýlku Pri itervale spoľahlivosti pre rozptyl vychádzame z χ rozdeleia. Keďže daé rozdeleie je asymetrické, je potrebé vypočítať dva kvatily pre pravdepodobosť α / ako aj α /. Na výpočet použijeme fukciu CHIINV 4. 4 Fukcia CHIINV je prezetovaá le pre pravdepodobosť α /. Ekvivaletý postup by bol aj v prípade pravdepodobosti α /
Ako parametre zadávame hodoty pravdepodobosti ( α /, resp. α /) a podobe ako pri Studetovom t-rozdeleí druhým parametrom sú stupe voľosti ( ). Okrem ich je potrebé do vzťahu dopliť ešte hodotu výberového rozptylu a rozsahu výberového súboru a dopočítať horú a dolú hraicu itervalu spoľahlivosti. Keďže rozptyl ie je možé iterpretovať, hraice itervalu spoľahlivosti pre smerodajú odchýlku vypočítame odmoceím hraíc itervalu spoľahlivosti pre rozptyl. Iterval spoľahlivosti pre podiel Pri výpočte vychádzame z biomického rozdeleia, ktoré za určitých podmieok je možé aproximovať ormálym rozdeleím. Pri praktických výpočtoch je postačujúcou podmiekou spleie asledujúcej erovosti: > 9. V takomto prípade vychádzame p( p) z ormovaého ormáleho rozdeleia a výpočet hodoty fukcie NORMSINV(- /, µ, ). u α / realizujeme pomocou Pri overovaí ormality sme zistili, že ie je spleá potrebá podmieky aproximácie (0<37,5), preto pri výpočte budeme vychádzať z Fisherovho F rozdeleia. Kvatily Fischerovho rozdeleia určíme pomocou fukcie FINV.
Okrem pravdepodobosti ( α /, resp. α /), ďalšími parametrami fukcie sú stupe voľosti. Stupe voľosti sa vypočítajú ako *( + ) a stupe voľosti ako *. Itervaly spoľahlivosti ( p, p ) pre podiel dostaeme potom riešeím sústavy dvoch rovíc, ktoré sú uvedeé v časti VZORCE. d h Vypočítaé itervaly spoľahlivosti pre stredú hodotu, rozptyl, smerodajú odchýlku a podiel sú uvedeé v asledovom výstupe. Výstup 4.: Výpočet itervalov spoľahlivosti INTERVALOVÝ ODHAD: STREDNEJ HODNOTY ROZPTYLU -α 0,95 0,99 -α 0,95 0,99 α 0,05 0,0 α 0,05 0,0 t,09,86 χ α/ 8,9 6,84 delta 663,8 73,38 χ α/ 3,85 38,58 DH 9 88,44 9 7,4 DH 7 303 750,79 6 9 055,85 HH 3 07,80 3 88,00 HH 6 940 40,07 35 059 35,55 SMERODAJNEJ ODCHÝLKY PODIELU -α 0,95 0,99 -α 0,95 0,99 α 0,05 0,0 α 0,05 0,0 DH 70,55 493,80 aproximácia 37,50 ie je možá HH 5 90,4 5 9,09 odhad pomocou Fischerovho F rozdeleia 0 8 =N- F -α/ 0,40 0,9 F α/,36 3, DH *pd/((8+)*(-pd))=0,5 *pd/((8+)*(-pd))=0,50 pd 0,3 0,8 HH *ph/((8+)*(-ph))=,36 *ph/((8+)*(-ph))=3, ph 0,64 0,70
Iterpretácia výsledkov: Na základe itervalu spoľahlivosti pre stredú hodotu odhadujeme, že priemeré mesačé zárobky pracovíkov sa vo všetkých aalyzovaých podikoch (9) budú pohybovať v itervale od 9 88,44 Sk do 3 07,80 Sk pri 95% pravdepodobosti (spoľahlivosti), resp. v itervale od 9 7,4 Sk po 3 88 Sk pri 99% pravdepodobosti. Odhadujeme ďalej, že variabilita v celom súbore (9 podikov) meraá rozptylom bude v itervale od 7 303 750,79 Sk do 6 940 40,07 Sk pri 95% spoľahlivosti, resp. od 6 9 055,85Sk do 35 059 35,55 Sk pri 99% spoľahlivosti. Odhadujeme, že kolísaie priemerých mesačých zárobkov pracovíkov v celom súbore meraé smerodajou odchýlkou sa bude pohybovať v itervale od 70,55 Sk do 5 90,4 Sk (95% pravdepodobosť), resp. od 493,80 Sk do 5 9,09 Sk (99% pravdepodobosť). Vychádzajúc z výberového podielu odhadujeme, že podiel družstiev v celom súbore sa bude achádzať v itervale od 3% do 64% pri spoľahlivosti 95%, resp. v itervale od 8% do 70% pri spoľahlivosti 99%. Hoci je pri itervalových odhadoch zaručeá vyššia spoľahlivosť, ich evýhodou je to, že pozáme le iterval, v rámci ktorého sa bude odhadovaý parameter pohybovať, t.j. epozáme prese ktorá hodota v rámci eho to bude. Dokoca pri zvyšovaí spoľahlivosti (z 95% a 99%), ako je možé vidieť aj z výpočtov, sa itervaly spoľahlivosti rozširujú, čo je pochopiteľé, pretože plocha pod krivkou predstavuje už 99%, t.j. dolá hraica sa zíži a horá hraica zvýši. Na druhej strae sa však pri zvyšovaí spoľahlivosti zižuje presosť odhadov. Keďže itervalový odhad je závislý iele od zvoleej spoľahlivosti, ale aj od ďalších hodôt (rozsahu výberového súboru, variability základého súboru), je vhodé zvyšovať presosť itervalového odhadu práve cez tieto hodoty.