2.1 Charakteristiky polohy

Σχετικά έγγραφα
x j hodnota štatistického znaku x - aritmetický priemer ni absolútna početnosť m počet tried hšt ti ti kéh m počet tried hšt ti ti kéh

1 Koeficient kovariancie

ZÁKLADNÉ ŠTATISTICKÉ METÓDY

ZNAKY. Ordinálne znaky = možno usporiadať, ale nie je podstatná veľkosť rozdielu!

3. prednáška. Komplexné čísla

Základy metodológie vedy I. 9. prednáška

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

Regresná analýza x, x,..., x

Matematika Funkcia viac premenných, Parciálne derivácie

ARMA modely čast 2: moving average modely (MA)

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

Cvičenie č. 4,5 Limita funkcie

Reprezentácia dát. Ing. Martin Mariš, Katedra regionalistiky a rozvoja vidieka, SPU, NITRA

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

Ing. Andrej Trnka, PhD. Základné štatistické metódy marketingového výskumu

Obvod a obsah štvoruholníka

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

2.4 OPAKOVATEĽNOSŤ A REPRODUKOVATEĽNOSŤ NORMOVANÝCH SKÚŠOK A VYJADRENIE NEISTÔT MERANÍ

7. FUNKCIE POJEM FUNKCIE

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Úvod do lineárnej algebry. Monika Molnárová Prednášky

Komplexné čísla, Diskrétna Fourierova transformácia 1

ARMA modely čast 2: moving average modely (MA)

Pravdepodobnosť a štatistika

MIDTERM (A) riešenia a bodovanie

Pravdepodobnosť a štatistika

,Zohrievanie vody indukčným varičom bez pokrievky,

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

Príklady na precvičovanie číselné rady a kritériá ich konvergencie a divergencie

Matematika 2. časť: Analytická geometria

ODHAD HODNOTY BYTU NA PODKLADE PONUKOVÝCH CIEN

24. Základné spôsoby zobrazovania priestoru do roviny

PREHĽAD ÚDAJOV. 1. Početnosť

Integrovanie racionálnych funkcií

6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu

1. písomná práca z matematiky Skupina A

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

Matematická štatistika

7 Derivácia funkcie. 7.1 Motivácia k derivácii

Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Charakteristiky kvantilových rozdelení

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

CHÉMIA Ing. Iveta Bruončová

Ekvačná a kvantifikačná logika

RIEŠENIE WHEATSONOVHO MOSTÍKA

Chí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky

Určite vybrané antropometrické parametre vašej skupiny so základným (*úplným) štatistickým vyhodnotením.

PRIEMER DROTU d = 0,4-6,3 mm

x x x2 n

3. Striedavé prúdy. Sínusoida

2 Chyby a neistoty merania, zápis výsledku merania

Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Kvantilová deskriptívna analýza ako východisko ku kvantilovému modelovaniu

Rozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky

Zložené funkcie a substitúcia

Príklady na precvičovanie komplexné čísla, postupnosti a funkcie

1 Prevod miestneho stredného slnečného času LMT 1 na iný miestny stredný slnečný čas LMT 2

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Príklady na precvičovanie Fourierove rady

Odporníky. 1. Príklad1. TESLA TR

Limita postupnosti II.

ŠTATISTIKA. Obsah. Predmet štatistiky Popisná štatistika Štatistické charakteristiky jednorozmerných rozdelení.. 17

Prognózovanie OBSAH PREDNÁŠKY

Základy matematickej štatistiky

6. Mocniny a odmocniny

REZISTORY. Rezistory (súčiastky) sú pasívne prvky. Používajú sa vo všetkých elektrických

IIR filtrov. Metóda. Metódy návrhu. 2. pretransform. 4. transformáciat. diskrétny). frekvenciu =

Návrh vzduchotesnosti pre detaily napojení

Tomáš Madaras Prvočísla

Súčtové vzorce. cos (α + β) = cos α.cos β sin α.sin β cos (α β) = cos α.cos β + sin α.sin β. tg (α β) = cotg (α β) =.

Rozsah hodnotenia a spôsob výpočtu energetickej účinnosti rozvodu tepla

Analýza vlastností funkcií mierky a waveletov v ortogonálnom prípade. - funkcia mierky a wavelet spĺňajúca relácie zmeny rozlíšenia

Úvod do lineárnej algebry

Logaritmus operácie s logaritmami, dekadický a prirodzený logaritmus

Metodicko pedagogické centrum. Národný projekt VZDELÁVANÍM PEDAGOGICKÝCH ZAMESTNANCOV K INKLÚZII MARGINALIZOVANÝCH RÓMSKYCH KOMUNÍT

Michal Páleník. Fiškálna politika v kontexte regionalizácie a globalizácie:

2 ODHADY PARAMETROV ZÁKLADNÉHO SÚBORU

Algebraické štruktúry I algebraické štruktúry, grupa, základné vlastnosti grupy, morfizmy

UNIVERZITA KOMENSKÉHO V BRATISLAVE FAKULTA MATEMATIKY, FYZIKY A INFORMATIKY TEÓRIA FOURIEROVÝCH RADOV

ŠTATISTICKÉ METÓDY VPRAXI

Kompilátory. Cvičenie 6: LLVM. Peter Kostolányi. 21. novembra 2017

APLIKOVANÁ ŠTATISTIKA V POČÍTAČOVOM PROSTREDÍ MATLABU

Život vedca krajší od vysnívaného... s prírodou na hladine α R-P-R

18. kapitola. Ako navariť z vody

UČEBNÉ TEXTY. Pracovný zošit č.2. Moderné vzdelávanie pre vedomostnú spoločnosť Elektrotechnické merania. Ing. Alžbeta Kršňáková

Podnikateľ 90 Mobilný telefón Cena 95 % 50 % 25 %

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

Prechod z 2D do 3D. Martin Florek 3. marca 2009

Motivácia pojmu derivácia

LR(0) syntaktické analyzátory. doc. RNDr. Ľubomír Dedera

ÚLOHA Č.8 ODCHÝLKY TVARU A POLOHY MERANIE PRIAMOSTI A KOLMOSTI

C. Kontaktný fasádny zatepľovací systém

Χαρακτηριστικά της ανάλυσης διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (One-way analysis of variance)

Štatistické riadenie procesov Regulačné diagramy 3-1

Gramatická indukcia a jej využitie

Ako sa hravo naučiť počtu derivačnému

Katedra informatiky Fakulty matematiky, fyziky a informatiky Univerzity Komenského v Bratislave ÚVOD DO DISKRÉTNYCH ŠTRUKTÚR.

Vzorové riešenia 3. kola zimnej série 2014/2015

Polynómy, algebraické rovnice, korene a rozklad racionálnej funkcie. priesvitka 1

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

Základné vzťahy medzi hodnotami goniometrických funkcií

Deliteľnosť a znaky deliteľnosti

Transcript:

2 POPISNÉ CHARAKTERISTIKY Výsledkom prvého kroku spracovaia štatistických údajov je usporiadaie aalyzovaých hodôt do kotigečých alebo frekvečých tabuliek. Častokrát, predovšetkým pri porovávaí viacerých súborov, je vhodejšie vyjadriť určitú vlastosť štatistického súboru pomocou jedého čísla. Takýto postup je možé realizovať prostredíctvom popisých (deskriptívych) charakteristík, ktorých úlohou je, ako už ázov hovorí, popísať určitú charakteristickú vlastosť súboru. V druhej kapitole sa preto budeme veovať popisu štatistického súboru využitím deskriptívych charakteristík, ktoré ám a základe jedej hodoty poskytú ďalšie iformácie o skúmaom štatistickom súbore. 2. Charakteristiky polohy POJMY Stredé hodoty Aritmetický priemer Jedoduchá forma Vážeá forma Harmoický priemer Geometrický priemer Ostaté stredé hodoty Modus Mediá Kvatily Kvartily Stred itervalu Modály iterval Mediáový iterval VZORCE Stred itervalu DH + HH i 2 Aritmetický priemer jedoduchá forma DH dolá hraica itervalu HH horá hraica j j zaku j hodota štatistického

Aritmetický priemer vážeá forma m i. i hodota štatistického i i zaku i absolúta početosť č ti t l Harmoický priemer jedoduchá forma h j j zaku j hodota štatistického Geometrický priemer jedoduchá forma g 2... j j zaku j hodota štatistického Modus itervalové rozdeleie početosti d a mo dolá hraica modáleho itervalu 0 ˆ a mo + h d h rozpätie modáleho itervalu 0 + d d 0 rozdiel absolútej početosti modáleho a predchádzajúceho itervalu d rozdiel absolútej početosti modáleho ldjú h it l Mediá itervalové rozdeleie početosti r a + h me 2 + 0,5 r i i a me dolá hraica mediáového itervalu h rozpätie mediáového itervalu r2 poradie štatistickej jedotky, ktorej bude prislúchať mediá r i súčet absolútych početostí po mediáový iterval Dolý kvartil itervalové rozdeleie početosti - početosť mediáového itervalu Q a r + h ( 4) r 0,5 + Q i i a dolá hraica itervalu, v ktorom sa bude i a m achádzať e dolá hraica dolý mediáo kvartil vého itervalu h h rozpätie mediáového itervalu, v ktorom itervalu sa bude achádzať r 2 dolý poradie kvartil štatistickej jedotky, ktorej bude prir slúchať poradie mediá štatistickej jedotky, ktorej bude r prislúchať dolý kvartil r i súčet absolútych početostí po mediáový i i súčet absolútych početostí po iterval, itierv al v -ktorom početosť sa bude mediáového achádzať itervalu dolý kvartil - početosť itervalu, v ktorom sa bude Q 2

Horý kvartil itervalové rozdeleie početosti r r + 0,5 + i Q a h Q i a dolá hraica itervalu, v ktorom sa bude achádzať horý kvartil h rozpätie itervalu, v ktorom sa bude achádzať horý kvartil r poradie štatistickej jedotky, ktorej bude prislúchať horý kvartil r i súčet absolútych početostí po ite i v ktorom sa bude achádzať horý kvartil - početosť itervalu, v ktorom sa bude Q rval, FUNKCIE V EXCELI AVERAGE (číslo, číslo2,...) GEOMEAN (číslo, číslo2,...) HARMEAN (číslo, číslo2,...) MODE (číslo, číslo2,...) MEDIAN (číslo, číslo2,...) QUARTILE (oblasť, kvartil) PERCENTILE(oblasť, k) RIEŠENÝ PRÍKLAD Pri aalýze budeme vychádzať z predchádzajúcich výsledkov, t.j. z triedeých údajov. Popisé charakteristiky sú určeé predovšetkým pre aalyzovaie kvatitatívych štatistických zakov, preto budeme vychádzať zo spojitého štatistického zaku priemerý mesačý zárobok. Úloha: Charakteristiky polohy sa vyjadrujú k dosahovaej úrovi (polohe) zaku v súbore, preto prvou úlohou bude získať o priemerom mesačom zárobku pracovík aalyzovaých poľohospodárskych podikov ďalšie iformácie týkajúce sa jeho úrove. Zadaie: Vypočítajte a iterpretujte základé charakteristiky polohy: aritmetický priemer, modus, dolý kvartil, mediá, horý kvartil. Riešeie: Vychádzajúc z triedeých údajov pri výpočte zvolíme mauály postup výpočtu. Vytvoríme si tabuľku, ktorú budeme využívať a pomocé výpočty a výsledé hodoty charakteristík vypočítame pod touto tabuľkou (výstup 2.). Údaje, z ktorých vychádzame, sú roztriedeé do itervalového rozdeleia početosti, t.j. každá trieda je charakterizovaá dolou a horou hraicou itervalu s výimkou prvého a posledého itervalu, ktoré sú otvoreé. V prvom kroku je potrebé určiť jedu hodotu, ktorá by charakterizovala triedu. Aby sme sa vyhli podhodoteiu, resp. adhodoteiu výsledých charakteristík, budeme ako reprezetata itervalu brať hodotu, ktorá sa achádza v jeho strede a azýva sa stred

itervalu ( i ). Pri výpočte stredu itervalu pre prvý a posledý iterval, ktoré sú zľava, resp. sprava otvoreé, vychádzame z asledového, resp. z predchádzajúceho itervalu. Stred týchto itervalov určíme asledove: prvý iterval : 4 200 (2 000/2) 200 posledý iterval 2 : 22 200 + (2 000/2) 2 200 Stredy ostatých itervalov učíme podľa vzorca ako priemer dolej a horej hraice. Ak máme určeé stredy itervalov, môžeme prejsť k výpočtu popisých charakteristík. Aritmetický priemer: Vychádzame z triedeých údajov, t.j. pri výpočte použijeme vážeé formy vzťahov. Pri výpočte tejto charakteristiky potrebujeme vypočítať ajprv pomocý stĺpec i*i, ktorého suma je 556 800, čo predstavuje hodotu čitateľa, ktorú podelíme meovateľom (29) a dostávame aritmetický priemer. Modus: V prípade itervalového rozdeleia početosti vieme jedozače určiť le iterval, v ktorom sa modus bude achádzať. Vychádzajúc z defiície moduse, modály iterval je te, v ktorom sa achádza ajvyššia početosť. Určíme dolú hraicu modáleho itervalu (a mo 2 200), rozpätie modáleho itervalu (h 2 000), rozdiel početosti modáleho a predchádzajúceho itervalu (d 0 5 29 6) a rozdiel početosti modáleho a asledového itervalu (d 5 6 9). Hodoty dosadíme do príslušého vzťahu a dopočítame modus. Dolý kvartil: Podobe ako pri moduse aj v prípade kvartilov pri itervalovom rozdeleí početosti vieme určiť le iterval, v ktorom sa kvartily budú achádzať. Dolý kvartil rozdeľuje usporiadaý štatistický súbor a dve časti, pričom v prvej časti sa achádza 25% hodôt a v druhej časti zvyšých 75% hodôt. Na základe tejto iformácie určíme iterval, v ktorej sa bude achádzať dolý kvartil. Vychádzame z hodôt kumulatívych relatívych početostí (Fi). Hľadáme iterval, v ktorom je akumulovaých 25% hodôt. Je to 4. iterval v poradí, čiže dolý hraica itervalu sa rová hodote 8 200, rozpätie itervalu je 2000. Hodota r Vychádzame z druhého itervalu, v ktorom je rozpätie 2000. Polovice z toho (stred) predstavuje hodota 000. V prvom itervale máme daú le horú hraicu, od ktorej musíme hodotu 000 odčítať a tým dostávame stred prvého itervalu. 2 Postup pri výpočte stredu posledého itervalu je idetický ako pri prvom itervale, le vzhľadom a to, že v posledom itervale máme daú dolú hraicu, tak hodotu 000 (rovaká hodota ako v prvom itervale, pretože rozpätie predposledého itervalu je taktiež 2000) musíme pričítať. r : r ozačuje poradie hodôt; určuje, že sa jedá o dolý (prvý) kvartil a ozačuje, že sa jedá o kvartily hodoty, ktoré rozdeľujú súbor a 4 časti 4

udáva poradie hodoty, ktorej bude prislúchať dolý kvartil a vypočíta sa ako ¼*, r 2,25. Suma určuje kumulatívu absolútu početosť po iterval dolého kvartilu a rová sa 5. dk predstavuje početosť itervalu, v ktorom bude dolý kvartil a je 22. Dosadeím do vzorca získavame hodotu dolého kvartilu. Mediá: Táto charakteristika predstavuje prostredú hodotu usporiadaého štatistického súboru, teda hodotu, ktorá rozdeľuje súbor a 50% hodôt. Postup výpočtu je idetický ako pri dolom kvartile, čiže a me 0 200, h 2 000, r2 64,5, suma 7 a mediá 29. Mediá dopočítame podľa príslušého vzorca. Horý kvartil: Horý kvartil a rozdiel od dolého kvartilu rozdeľuje usporiadaý súbor a dve časti, pričom v prvej časti sa achádza 75% hodôt a v druhej časti 25% hodôt. Postup určeia hodôt do vzťahu je rovaký ako pri dolom kvartile (a hk 2 200, h 2 000, r 96,75, suma 66 a hk 5). Dopleím hodôt do vzorca dopočítame horý kvartil. Vypočítaé hodoty budú iterpretovaé súhre po dopočítaí všetkých charakteristík a koci kapitoly. 2.2 Charakteristiky variability Druhá skupia popisých charakteristík je tvoreá charakteristiky variability, ktoré ás iformujú o kolísaí hodôt v súbore. Čím je v súbore ižšia variabilita, tým je súbor homogéejší, hodoty sú viac kocetrovaé okolo stredej (priemerej) hodoty. POJMY Variabilita Variačé rozpätie Kvatilové rozpätie Kvartilové rozpätie Kvartilová odchýlka Priemerá odchýlka Rozptyl Smerodajá (štadardá) odchýlka Pomerá priemerá odchýlka Variačý koeficiet VZORCE Variačé rozpätie R ma mi ma - maimála hodota mi miimála hodota 5

Priemerá odchýlka - jedoduchá j j d j hodota štatistického zaku Priemerá odchýlka - vážeá m i i i d j hodota štatistického zaku i absolúta početosť Kvatilové rozpätie ( ) ( Q α α horý kvatil RQ Q (α) Q α) α dolý kvatil ( ) Q α Kvartilové rozpätie R Q Q 4 ( 4 Q Kvartilová odchýlka Q Q Q 2 Rozptyl jedoduchá forma s 2 2 ( j ) j Rozptyl vážeá forma s ( ). m 2 2 i i Smerodajá odchýlka s s 2 Variačý koeficiet v s.00 [%] Pomerá priemerá odchýlka δ d i zaku zaku Q Q Q Q horý kvartil dolý kvartil horý kvartil dolý kvartil j hodota štatistického i hodota štatistického b lút č t ť 2 s - rozptyl s smerodajá odchýlka d priemerá odchýlka FUNKCIE V EXCELI AVEDEV (číslo, číslo2,...) STDEV (číslo, číslo2,...) VAR (číslo, číslo2,...) 6

RIEŠENÝ PRÍKLAD Úloha: Pomocou charakteristík variability charakterizovať variabilitu v skúmaom štatistickom súbore. Zadaie: Vypočítajte a iterpretujte základé charakteristiky variability: variačé rozpätie, kvartilové rozpätie, kvartilovú odchýlku, rozptyl, smerodajú odchýlku a variačý koeficiet. Riešeie: Budeme pokračovať v mauálom postupe výpočtu. Prvú skupiu charakteristík variability tvoria charakteristiky, ktoré pri výpočte vychádzajú le z iektorých hodôt súboru. Výpočet je eáročý. Sú to: Variačé rozpätie: Predstavuje rozdiel maimálej a miimálej hodoty v súbore. Kvartilové rozpätie: Na rozdiel od variačého rozpätie sa do úvahy eberú už krajé hodoty, ktoré môžu byť vybočeé, ale hodoty horého a dolého kvartilu. Ich rozdiel dáva hodotu kvartilového rozpätia. Kvartilová odchýlka: Predstavuje polovicu kvartilového rozpätia. Druhé skupiu tvoria charakteristiky, ktoré ám dávajú presejší obraz o variabilite súboru, pretože pri ich výpočte vychádzame zo všetkých hodôt. Patria sem: Rozptyl: Je to základá miera variability, pri výpočte ktorej je potrebé ajprv vypočítať odchýlka od priemeru (čím sú odchýlky väčšie, tým bude variabilita vyššia). Aby sme sa vyhli vyulovaiu kladých a záporých odchýlok pri výpočte sumy, je preto potrebé odchýlky umociť a preásobiť váhou, ktorou sú absolúte početosti. Po sčítaí hodôt a vydeleí rozsahom štatistického súboru získame hodotu rozptylu. Smerodajá odchýlka: Predstavuje druhú odmociu rozptylu, pretože rozptyl vyjadruje variabilitu v štvorcoch merých jedotiek. Posledú, tretiu skupiu tvoria charakteristiky, ktoré vyjadrujú variabilitu relatíve. Za túto skupiu budeme počítať asledovú charakteristiku. Variačý koeficiet: Vypočítame ho ako podiel smerodajej odchýlky k aritmetickému priemeru. Po vyásobeí 00 dostávame hodotu v %. Aj iterpretácie charakteristík variability budú uvedeé a koci kapitoly. 7

2. Charakteristiky šikmosti a špicatosti Charakteristiky šikmosti a špicatosti ám poskytujú doplňujúce iformácie o štatistickom súbore týkajúce sa symetrie rozdeleia (šikmosť) a posúdeia tvaru rozdeleia (špicatosť). POJMY Šikmosť Pearsoova miera šikmosti Koeficiet šikmosti Symetrické rozdeleie Pravostrae asymetrické rozdeleie Ľavostrae asymetrické rozdeleie Špicatosť Koeficiet špicatosti Špicatejšie rozdeleie Plochšie rozdeleie VZORCE Pearsoova miera šikmosti Š P s ˆ Koeficiet šikmosti jedoduchá forma ˆ modus s smerodajá odchýlka j hodota štatistického ( j ) j zaku γ s. hšt ti ti kéh Koeficiet šikmosti vážeá forma m i hodota štatistického ( zaku i ). i i γ s. i absolúta početosť m počet tried hšt ti ti kéh Koeficiet špicatosti jedoduchá forma ( ) j j 2 4 γ s. 4 zaku j hodota štatistického hšt ti ti kéh Koeficiet špicatosti vážeá forma m 4 ( i ). i γ 2 4 i s. zaku i hodota štatistického i absolúta početosť m počet tried hšt ti ti kéh 8

FUNKCIE V EXCELI SKEW (číslo, číslo2,...) KURT (číslo, číslo2,...) 9

RIEŠENÝ PRÍKLAD Úloha: Charakterizujte šikmosť a špicatosť aalyzovaého štatistického súboru. Zadaie: Vypočítajte a iterpretujte koeficiet šikmosti a špicatosti. Riešeie: Pri charakterizovaí priemerého mesačého zárobku pracovíkov poľohospodárskych podikov pokračujeme v ašich mauálych výpočtoch. Opäť použijeme vážeé formy vzťahov, keďže vychádzame z triedeých údajov. Koeficiet šikmosti: Je potrebé ajprv vypočítať pre každý iterval hodoty (i- pr)^*i. Súčet týchto hodôt predstavuje hodotu čitateľa, ktorý vydelíme meovateľom určeím ako s^*. Výsledkom je bezrozmeré číslo, iterpretácii ktorého sa budeme veovať v rámci súhrých iterpretácií. Koeficiet špicatosti: Výpočet je podobý výpočtu koeficietu šikmosti s tým, že odchýlky od priemeru umocňujeme a štvrtú. Podobe aj v meovateli umocňujeme smerodajú odchýlku a štvrtú. Na koci je potrebé odpočítať od zlomku hodotu, aby sme mohli výsledok porovávať s ulovou hodotou. Výsledá hodota podobe ako koeficiet šikmosti predstavuje bezrozmeré číslo. Iterpretácia výsledkov: Vo výstupe 2. sú uvedeé pomocé výpočty ako aj výsledé hodoty popisých charakteristík, iterpretácii ktorých sa budeme veovať. Z vypočítaých hodôt môžeme vyčítať asledové iformácie o poľohospodárskych podikoch. Aritmetický priemer: 2 068,22. Priemerý mesačý zárobok v skúmaých poľohospodárskych podikoch bol 2 068,22 Sk., t.j. v priemere v každom podiku poľohospodárskom podiku dosahoval priemerý mesačý zárobok v roku 2005 takúto čiastku. Hoci sme získali základú iformáciu o výške platov v podikoch, je potrebé si uvedomiť, že táto hodota ás môže aj zavádzať. Stačí, že v súbore sa achádza jeda vybočeá hodota (maimála, resp. miimále) a vypočítaá hodota ezodpovedá realite. Na túto skutočosť etreba pri iterpretácii aritmetického priemeru zabúdať a pri robeí záverov je potrebé prihliadať aj a ďalšie charakteristiky ako je apr. modus, mediá, resp. charakteristiky variability. 0

Výstup 2.: Výpočet popisých charakteristík z itervalového rozdeleia početosti 29 m,6 ma 25 66,66 mi, h 984,85 2 000 i Fi fi Ni Číslo it. DH HH Bi Frequecy Cumulative % 4200 4200 2,55%,55% 2 2 4200 6200 6200 4 4,65%,0% 6 6200 8200 8200 9,6% 6,98% 5 d. kvartil 4 8200 0200 0200 22 28,68% 7,05% 7 mediá 5 0200 2200 2200 29 5,6% 22,48% 66 h. kvartil 6 2200 4200 4200 5 78,29% 27,% 0 7 4200 6200 6200 6 90,70% 2,40% 7 8 6200 8200 8200 5 94,57%,88% 22 9 8200 20200 20200 96,90% 2,% 25 0 20200 22200 22200 2 98,45%,55% 27 22200 More 2 00,00%,55% 29 29 00% Číslo it. i i*i (i-pr) (i-pr)*i (i-pr)^2*i (i-pr)^*i (i-pr)^4*i 200 6 400-8868,22-776,44,57E+08 -,9E+2,24E+6 2 5200 20 800-6868,22-27472,86822,89E+08 -,0E+2 8,90E+5 7200 64 800-4868,22-48,9549 2,E+08 -,04E+2 5,06E+5 4 9200 202 400-2868,22-600,7759,8E+08-5,9E+,49E+5 5 200 24 800-868,22-2578,29457 2,9E+07 -,90E+0,65E+ 6 200 462 000,78 962,40 4,48E+07 5,07E+0 5,74E+ 7 5200 24 200,78 5008,527,57E+08 4,9E+,54E+5 8 7200 86 000 5,78 25658,947,2E+08 6,76E+,47E+5 9 9200 57 600 7,78 295,4884,5E+08,09E+2 7,76E+5 0 2200 42 400 9,78 826,56589,67E+08,52E+2,9E+6 2200 46 400,78 2226,56589 2,48E+08 2,76E+2,07E+6 556 800 0,66E+09 2,2E+2 8,5E+6 aritmetický priemer 2 068,22 modus: mediá: modus 2 680,00 a mo 2 200 a me 0 200 dolý kvartil 9 8,64 h 2 000 h 2 000 mediá 2,0 d0 6 r 2 65 horý kvartil 985,7 d 9 suma 7 variačé rozpätie 2 8, mediá 29 kvartilové rozpätie 4 72,08 dolý kvartil: horý kvartil: kvartilová odchýlka 2 086,04 a dk 8 200 a hk 2 200 rozptyl 2 889 60 h 2 000 h 2 000 smerodajá odchýlka 590,2 r 2 r 97 variačý koeficiet 29,75% suma 5 suma 66 koeficiet šikmosti 0,9 dk 22 hk 5 koeficiet špicatosti 0,98 Modus: 2 680. Najčastejšie mali v roku 2005 pracovíci v podikoch mesačý zárobok 2 680 Sk. Dolý kvartil: 9 8,64. V 25% podikoch zarábali pracovíci mesače do 9 8,64 Sk a v 75% podikoch zarábali ad túto čiastku. Mediá: 2,0. V polovici podikoch dostávali pracovíci mesače čiastku do 2,0 Sk a v polovici ad 2,0 Sk.

Horý kvartil: 985,7. V 75% podikoch bol priemerý mesačý zárobok do 985,7 Sk a v 25% podikoch ad 985,7 Sk. Porovaím priemeru, modusu a mediáu vidíme, že medzi týmito hodotami je asledový vzťah priemer<mediá<modus. Z hľadiska zárobkov je možé daú situáciu hodotiť pozitíve, pretože vo väčšie podikoch bol dosiahutý vyšší priemerý mesačý zárobok ako bol priemer. Aj hodota mediáu je vyššia ako priemer, t.j. v polovici podikoch zarábali pracovíci viac ako bol priemerý zárobok. Hodotu priemeru pravdepodobe zižuje miimála hodota, resp. početosti v prvých itervaloch, ktoré sú o iečo vyššie oproti posledým itervalom. Medzi daými hodotami sú však veľmi malé rozdiely, hodota aritmetického priemeru a mediáu sa achádzajú v rovakom itervale. Tieto skutočosti svedčia o ie vysokej variabilite v súbore. Na základe porovaia kvartilov je zrejmé, že ajvyššia kocetrácia hodôt (priemerých mesačých zárobkov) je v ¾ štatistického súboru, čo vyplýva z rozdielu medzi mediáom a dolým kvartilom (2 7,40) a rozdielu medzi horým kvartilom a mediáom ( 854,68). Zameá to v itervale od 2,0 (mediá) po 985,7 (horý kvartil) sa achádza 25% všetkých hodôt súboru, t.j. v štvrtie podikov sa v roku 2005 pohybovali priemeré mesačé zárobky v rámci tohto itervalu. Na základe týchto porovaí je tiež možé odhadúť symetriu rozdeleia. Vzhľadom a to, že mediá je bližšie k horému kvartilu, očakávame, že vrchol rozdeleia bude miere posuutý vpravo. Pri iterpretácii charakteristík variability začeme prvou skupiou charakteristík. Variačé rozpätie (2 8,) ám hovorí, že rozdiel medzi ajižším a ajvyšším priemerým mesačým zárobkom v poľohospodárskych podikoch bol v roku 2005 2 8, Sk. Je to pomere vysoký rozdiel, ktorý môže byť ovplyveý krajými hodotami (maimom, resp. miimom). Presejšie iformácie dostaeme a základe kvartilového rozpätia, resp. kvartilovej odchýlky, pretože pri ich výpočte sa do úvahy ebrali krajé hodoty, ale horý a dolý kvartil. Je to zrejmé aj z porovaia týchto hodôt. Hodota kvartilového rozpätia (4 72,08 Sk) je oveľa ižšia ako variačé rozpätie. Kvartilové rozpätie ám hovorí, že 50% podikov dosahovalo mesačé zárobky od 9 8,64 Sk po 985,7 Sk, teda rozpätie ich zárobkov bolo 4 72,08 Sk. Rozdiel medzi mesačým zárobkov prvej štvrtiy podikov a posledej štvrtiy podikov bol 4 72,08 Sk. Kvartilová odchýlka je 2 086,04 Sk, t.j. rozdiel v priemerých mesačých zárobkoch 50% podikov epresiahol ± 2 086,04 Sk vzhľadom a mediá. Presejšie iformácie o variabilite dostávame a základe rozptylu, resp. smerodajej odchýlky. Hodota rozptylu sa rová 2 889 60 Sk 2. Keďže výpočet rozptylu je založeý a 2

druhých mociách odchýlok, edá sa iterpretovať, pretože aj výsledá hodota predstavuje druhú mociu merých jedotiek. Po odmoceí rozptylu dostávame smerodajú odchýlku, ktorá je 590,2 Sk. Na jej základe môžme tvrdiť, že priemerý mesačý zárobok v podikoch kolíše ± 590,2 Sk od priemeru, t.j. v itervale od 8 478,0 Sk po 5 658,4 Sk sa achádzajú priemeré mesačé zárobky väčšiy skúmaých podikov. Smerodajá odchýlka predstavuje absolúte vyjadreie variability. Na posúdeie veľkosti variability ako aj a porovaie variability medzi súbormi je vhodejšie použiť relatívu mieru variability. Hodota variačého koeficietu je 29,75%, tz., že priemerý mesačý zárobok v podikoch kolíše ± 29,75% z priemeru. Na základe variačého koeficietu získavame presejšiu predstavu o veľkosti variability. Takmer 0% variabilitu môžeme považovať za strede vysokú. Zaujímavé by bolo skúmať a komparovať mesačé zárobky podľa výrobých oblastí, resp. podľa formy podikaia. Je pravdepodobé, že by tieto čiastkové súbory vykazovali ižšiu variabilitu s rozdielymi stredými hodotami, a základe ktorých by bolo možé dospieť k ďalším zaujímavým iformáciám. Posledú skupiu charakteristík tvoria charakteristiky šikmosti a špicatosti. Šikmosť rozdeleia sme popisovali prostredíctvom koeficietu šikmosti, ktorý sa rová 0,9. Hodotu porovávame oproti ulovej hodote. V ašom prípade je koeficiet šikmosti kladé číslo, a základe ktorého predpokladáme, že rozdeleie priemerých mesačých zárobkov v poľohospodárskych podikoch je ľavostrae asymetrické, t.j. vrchol rozdeleia je posuutý smerom vľavo, čo by asvedčovalo tomu, že mesačé zárobky v podikoch sú kocetrovaé pri ižších hodotách a smerom k vyšším hodotám početosti v itervaloch klesajú. Na základe porovaia priemeru, mediáu a modusu sme však očakávali, že pôjde o miere pravostraú asymetriu. Potvrdzuje to aj Pearsoova miera šikmosti, ktorá sa rová -0,7. Teto rozdiel medzi koeficietom šikmosti a Pearsoovou mierou šikmosti možo odôvodiť tým, že medzi stredými hodotami sú malé rozdiely, priemer a mediá sa achádzajú v jedom itervale, modus je vo vedľajšom itervale. Niektorí autori uvádzajú iterval symetrie, a základe ktorého by rozdeleie mesačých zárobkov patrilo do vútra itervalu, t.j. rozdeleie by bolo možé považovať za symetrické. Koeficiet špicatosti porováva rozdeleie hodôt s tzv. ormálym rozdeleím, ktoré predstavuje jedo z ajčastejšie používaých rozdeleí v štatistike. Je to symetrické rozdeleie, ktoré má svoj typický tvar zvoa. Koeficiet špicatosti je 0,98, a základe ktorého môžeme tvrdiť, že rozdeleie priemerých mesačých príjmov je špicatejšie ako ormále rozdeleie, pretože hodota koeficietu je kladé číslo. Opäť sú staoveé hraice ormality,

ktoré uvádzajú autori od -2 po 2. Na ich základe je možé rozdeleie mesačých zárobkov pracovíkov v aalyzovaých podikoch považovať za ormále rozdeleie. Výpočet popisých charakteristík z radu rozdeleia početosti Pomocou radu rozdeleia početosti sme triedili štatistický zak počet stredísk poľohospodárskych podikov. Postup výpočtu popisých charakteristík je idetický ako pri priemerom mesačom zárobku pracovíkov poľohospodárskych podikov. Jedá sa o triedeé údaje, takže je potrebé použiť opäť vážeé formy vzťahov. Rozdiel je le pri určeí hodôt i, výpočte modusu a kvartilov. Triedu je určeá jedou hodotou, ie itervalom, t.j. i v tomto prípade ebude predstavovať stred itervalu, ale obmey skúmaého diskréteho zaku. Pri výpočte modusu je postačujúce ájsť ajvyššiu početosť v stĺpci absolútych početostí a zistiť, ktorej hodote aalyzovaé zaku prislúcha. Pri počte stredísk je ajvyššia početosť rová 57, čo prislúcha hodote. Modus sa teda rová. Podobý postup je aj pri výpočte kvartilov. Pri určovaí dolého kvartilu hľadáme v stĺpci kumulatívych relatívych početostí hodotu 25%. Táto hodota je akumulovaá v hodote 8,76%, ktorej prislúcha hodota 2. Pri mediáe hľadáme hodotu 50%, ktorá je akumulovaá v 82,95%, čo prislúcha. Keďže v hodote 82,95% je akumulovaých aj 75%, rová sa aj horý kvartil hodote. Ostaté charakteristiky boli dopočítaé rovakým spôsobom ako v prvom zadaí a achádzajú sa v asledovej výstupe 2.2. Iterpretácia výsledkov: V súbore prevládali podiky s strediskami, o čom svedčí hodota priemer, modusu, mediáu ako aj horého kvartilu. Štvrtia podikov v súbore má dve strediská. Rozdiel medzi ajvyšším a ajižším počtom sú 4 strediská. 50% podikov malo počet stredísk od 2 do. V 50% podikoch epresiahol rozdiel v počte stredísk ± 0,5 strediska vzhľadom a mediá. Počet stredísk v súbore kolíše ±,4 strediska od priemeru. V relatívom vyjadreí tvorí variabilita 45,20% z priemeru. Koeficiet šikmosti adobúda záporú hodotu, t.j. rozdeleie počtu stredísk je pravostrae asymetrické, hodoty v rozdeleí sú kumulovaé pri vyšších obmeách zaku (vyššie početosti sú sústredeé pri vyššom počte stredísk). Aj koeficiet špicatosti je záporý, z čoho vyplýva, že rozdeleie počtu stredísk je plochšie ako ormále rozdeleie. Zameá to, že hodoty sú viac rozptýleé okolo stredu o čom svedčí aj vyššia hodota variability. 4

Výstup 2.2: Výpočet popisých charakteristík z radu rozdeleia početosti Využitie Ecelu pri výpočte popisých charakteristík Ecel okrem základých možostí, ktoré poúka, je možé pri výpočte popisých charakteristík využiť asledove: použiť pri výpočte štatistické fukcie, ktoré sú uvedeé a začiatku každej podkapitoly. Prostredíctvom fukcií je možé počítať popisé charakteristiky le z etriedeých údajov. použiť procedúry Data Aalysis. Cez Tools/Data Aalysis vyberieme možosť Descriptive Statistics (slide ). Podobe ako pri fukciách aj pri tejto voľbe je ju možé využiť le pre etriedeé údaje. 5

Slide 2.: Po potvrdeí cez OK sa dostaeme do vstupého oka (Slide 2), v ktorom je potrebé vypliť Iput Rage (vstupá oblasť). Do tejto oblasti vkladáme údaje, pre ktoré chceme počítať popisé charakteristiky. Ďalej defiujeme, či sú vstupé údaje usporiadaé v stĺpci (Colums) alebo v riadku (Rows). Ak vo vysvieteej oblasti sa a prvej pozícii vyskytuje ozačeie (popisky), tak aktivuje voľbu Labels i first row. Skôr ako vyzačíme výstupú oblasť, aktivujeme voľbu Summary statistics, ktorá zabezpečí výpočet popisých charakteristík. V posledom kroku ozačíme výstupú oblasť. Pozámka: Výpočet popisých charakteristík prostredíctvom Data Aalysis prezetujeme a štatistickom zaku počet stredísk. Po porovaí výsledkov dospejeme k rovakým záverom. Slide 2.2: 6

Po potvrdeí cez OK dostávame asledový výstup (výstup 2.), ktorý sa achádza v ľavej časti. V pravej časti sú uvedeé štatistické ekvivalety aglických termíov. Výstup 2.: Výpočet popisých charakteristík prostredíctvom Data Aalysis Colum Popis Mea 2,5 aritmetický priemer Stadard Error 0,0 štadardá chyba priemeru Media mediá Mode modus Stadard Deviatio,4 výberová smerodajá odchýlka Sample Variace,0 výberový rozptyl Kurtosis -0,2 koeficiet špicatosti Skewess -0,72 koeficiet šikmosti Rage 4 variačé rozpätie Miimum 0 miimum Maimum 4 maimum Sum 24 súčet hodôt Cout 29 rozsah súboru Pozámka: Vo výstupe sú použité termíy ako štadardá chyba priemeru, výberová smerodajá odchýlka, výberový rozptyl, s ktorým sa detailejšie streteme v štvrtej kapitole pri výberovom skúmaí. Výpočet koeficietov šikmosti a špicatosti sa v Eceli realizuje prostredíctvom odlišých vzťahov, preto sa výsledé hodoty miere odlišujú od ami vypočítaých hodôt. 7