Deskrptvna statstčka analza Predavač: Dr Mrko Savć savcmrko@eccf.su.ac.yu www.eccf.su.ac.yu Deskrptvna statstčka analza predstavlja skup metoda kojma se vrš zračunavanje, prkazvanje opsvanje osnovnh karakterstka statstčkh serja. Deskrptvna statstčka analza ma sledeće zadatke: 1. Grupsanje sređvanje statstčkh podataka. 2. Prkazvanje statstčkh podataka. 3. Određvanje osnovnh pokazatelja statstčkh serja. 1
Grupsanje sređvanje statstčkh podataka Str. 51 104;29 56;19 Grupsanje podataka se vrš prema vrednostma l modaltetma posmatranh obeležja. Kao krajnj rezultat grupsanja javlja se statstčka serja. Statstčka serja predstavlja uređen skup varjacja obeležja posmatrane statstčke mase. Statstčka serja se prkazuje u oblku tabele, najmanje u dva reda dve kolone, gde je u prvoj kolon skazana kvaltatvna strana statstčke mase, a u drugoj kvanttatvna (brojčana) strana. 2
Prmer za statstčku serju sa prekdnm numerčkm obeležjem (ntervalna serja): Tabela broj 4: Raspored studenata prema broju položenh spta Broj spta (X) Broj studenata (f ) 1 2 0-2 10 3-5 20 6-8 15 Ukupno 45 Obeležje (X) kvaltatvna strana Frekvencja (f ) kvanttatvna strana DES-097 Z(06)1-1 Grupsanje, prekdna obeležja DES-098 Z(06)1-2 Grupsanje, neprekdna obeležja Str. 69;35;23 Prkazvanje statstčkh podataka Prkazvanje statstčkh serja se može vršt na dva načna: tabelarno, grafčk. 3
Statstčka tabela predstavlja uokvrenu površnu u koju se unos statstčka serja. Broj nazv tabele Nazv obeležja Nazv frekvencje Zaglavlje (X) (f ) 1 2 Redn broj kolone Vrednost l modaltet obeležja f 1 Vrednost l modaltet obeležja f 2...... Vrednost l modaltet obeležja f n Ukupno: Prmedba: Izvor: Predkolona n f = 1 Zbrn red Prema sadržaju, tabele mogu bt: proste, složene, kombnovane. 4
Grafčko prkazvanje Str. 73;38;25 Grafkon se najčešće dele na sledeć načn: tačkast (stgmogram), površnsk, prostorn, lnjsk, kartogram. Prmer za djagram rasturanja 5
Prmer za bar-djagram Prmer za hstogram frekvencja 6
14 12 10 8 Broj radnka 6 4 2 0 Broj radnka prema odeljenjma polu 12 10 9 8 5 4 Prvo Drugo Treće Odeljenje Mušk Žensk Prmer za bar djagram sa dva obeležja (urađeno u Excel-u) Prnos pšence u 2003. u ml. tona Izvor: Statstčk godšnjak SCG za 2003. godnu Južna Amerka, 24 Okeanja, 24 Severna Amerka, 78 Evropa, 200 Afrka, 18 Azja, 239 Prmer za kružn djagram pe-chart (urađeno u Excel-u) 7
Broj radnka prema odeljenjma polu 12 12 10 10 9 8 8 Broj radnka 6 4 5 4 2 0 Prvo Drugo Odeljenje Treće Žensk Mušk Pol Prmer za stereogram (urađeno u Excel-u) Prmer za polgon frekvencja (lnjsk djagram) 8
Pravljenje preseka na osama Poseta tursta u hljadama Novembar Oktobar Decembar Januar 100 80 60 40 20 0 Februar Mart Aprl Septembar Maj Avgust Jul Jun Prmer za polarn djagram (lnjsk djagram) 9
Prmer za kartogram Prmer za loše grupsanje grafčko prkazvanje: Imate l klma uređaj? Da, u autu 27.7% Da, u kuć 44.6% Ne 27.7% Izvor: Blc, 7. avgust 2006. Prmer za loše grafčko prkazvanje (Fresh&Co) 10
Kumulacja spod znad Tabela 1: Raspored domaćnstava u naselju prema broju automobla Broj automobla (x ) Broj domaćnstava (f ) Kumulacja spod Kumulacja znad 1 2 3 4 0 4 4 1 8 12 (4+8) 2 10 22 (4+8+10) 3 5 27 (4+8+10+5) Ukupno 27 - - Kumulacja spod znad Tabela 1: Raspored domaćnstava u naselju prema broju automobla Broj automobla (x ) Broj domaćnstava (f ) Kumulacja spod Kumulacja znad 1 2 3 4 0 4 4 27 (5+10+8+4) 1 8 12 (4+8) 23 (5+10+8) 2 10 22 (4+8+10) 15 (5+10) 3 5 27 (4+8+10+5) 5 Ukupno 27 - - 12 domaćnstava u naselju ma najvše 1 automobl 22 domaćnstava u naselju ma najvše 2 automobla 15 domaćnstava u naselju ma najmanje 2 automobla 11
DES-001 K(05)2-1 Grupsanje grafčko prkazvanje statstčkh podataka (prekdna numerčka obeležja) DES-002 K(05)2-2 Grupsanje grafčko prkazvanje statstčkh podataka (neprekdna num. obeležja) DES-013 K(05)2-3 Polgon kumul. frekvencja (nent. serja) DES-071 K(05)2-4 Polgon kumul. frekvencja (ntervalna serja) DES-008 K(05)z 2-1 Polgon hstogram - vrem. serja DES-054 K(05)z 2-2 Polgon hst. frekvencja - prekdna DES-060 K(05)z 2-3 Grupsanje sređvanje neprekdno ob. DES-058 K(05)z 2-4 Grupsanje sređvanje prekdno ob. DES-057 K(05)z 2-5 Polgon hstogram neprekdna ob. DES-059 K(05)z 2-6 Grupsanje sređvanje prekdno ob. DES-061 K(05)z 2-7 Grupsanje sređvanje neprekdno ob. DES-024; K(05)z 2-8 Srednje v., mere v., pol. hstogram DES-028; K(05)z 2-9 Mere varjacje negrupsan, prekdna DES-032; K(05)z 2-10 Srednje vred., Mere v. - grup. prekdna DES-063; K(05)z 2-11 Geometrjska sredna DES-068; K(05)z 2-12 Srednje v. mere v.-grups., prekdna DES-064; K(05)z 2-13 Geometrjska sredna DES-016; K(05)z 2-14 Srednje v. mere v., graf, neprekdno o. 12
I Q 2 U osnovne mere statstčkh serja spadaju (nema u udžbenku): Srednje vrednost (mere centralne tendencje). Mere varjacje (mere dsperzje, raspršenost). Mere oblka rasporeda. α 4 σ 2 µ M o V Str. 104;60;37 Osnovne mere statstčkh serja σ Q 1 α 3 M e Q 3 Str. 109;60;37 Srednje vrednost Srednje vrednost su vrednost obeležja koje na specfčan načn reprezentuju čtavu statstčku masu, odnosno zamenjuju sve vrednost u statstčkoj serj karakteršu statstčku masu u celn. 13
Srednje vrednost poseduju sledeće osobne: Ne mogu bt veće od najveće vrednost obeležja nt manje od najmanje vrednost obeležja u serj. Mogu mat vrednost koja uopšte ne postoj u numerčkoj serj. Mogu bt zražene decmalnm brojem bez obzra da l je u ptanju serja sa prekdnm l neprekdnm obeležjem. Srednje vrednost se dele u dve grupe: Izračunate srednje vrednost. Srednje vrednost po položaju. Izračunate srednje vrednost se mogu utvrdt samo računskm putem. Tu spadaju: ( ) x;µ artmetčka sredna* geometrjska sredna* (G), harmonjska sredna* (H), kvadratna sredna, kubna sredna, logartamska sredna. 14
Str. 143;69;37 Srednje vrednost po položaju To su srednje vrednost koje se mogu odredt na osnovu pozcje na kojoj se nalaze kada su vrednost obeležja poređane u rastuć nz. Tu spadaju: modus* (M o ), medjana* (M e ), medjala (M l ), kvartl* (Q), kvntal (Kv), decl (D), percentl* (P). Artmetčka sredna (prosek) Smbol koj se korste: Artmetčka sredna za uzorak: Artmetčka sredna za osnovn skup: Str. 110;61;37 x (''ks-bar'') µ (''m'') Prema tome da l su podac grupsan l ne, razlkuju se: prosta artmetčka sredna, pondersana (složena, vagana) artmetčka sredna. 15
Formule za artmetčku srednu: Prosta, za osnovn skup: Prosta, za uzorak: Pondersana, za osnovn skup: Pondersana, za uzorak: N x µ = =1 ; x n N x = =1 ; k n x f = 1 = k f µ ; = 1 k x f = 1 x = k f = 1 ; Prmer 16 (strana 111) Prosta artmetčka sredna za osnovn skup Prmer 17 (strana 111) (greškom pše prmer 15) Prosta artmetčka sredna za uzorak Prmer 18 (strana 112) Složena artmetčka sredna za osnovn skup Prmer 21 (strana 118) Složena artmetčka sredna za uzorak 16
Geometrjska sredna Str. 135;65;39 Smbol: G Geometrjska sredna spada u zračunate srednje vrednost koja se korst kada u numerčkoj serj obeležja pokazuju neke relatvne pokazatelje (ndekse) l karakterstke geometrjske progresje. Formule za geometrjsku srednu: Prosta geometrjska sredna: Pondersana geometrjska sredna: Geometrjska sredna: log x log G = =1 ; n k n f log x = 1 log G = ; k f = 1 G= log G Geometrjsku srednu nje moguće zračunat ako je neka vrednost obeležja jednaka nul! 17
Prmer za antlogartam logg=0,9542425 Antlogartam: G=10 logg =10 0,9542425 =9 Prmer 37 (strana 136) Prosta geometrjska sredna DES-062 K:2-5 Prosta geometrjska sredna Harmonjska sredna Str. 138;67;40 Smbol: H Harmonjska sredna je jedna od zračunath srednjh vrednost koja se zračunava z recpročnh vrednost obeležja. Harmonjsku srednu nje moguće zračunat ako je neka vrednost obeležja jednaka nul! 18
Formule za harmonjsku srednu: Prosta harmonjska sredna: n H = ; n 1 = 1 x f = 1 Pondersana harmonjska sredna: H = ; k f = 1 x Prmer 39 (strana 138) Prosta harmonjska sredna DES-067 K:2-6 Prosta harmonjska sredna k Modus Str. 143;69;41 Smbol: M o Modus je ona vrednost obeležja koja se najčešće javlja u statstčkoj serj, odnosno ona vrednost obeležja koja ma najveću frekvencju. Zašto je modus nekad bolj od artmetčke sredne? Velčna obuće l odeće. DES-081 Modus, negrupsan podac Prmer 46 (strana 144) Modus za nentervalnu numerčku serju 19
Formula za modus (ntervalna numerčka serja): M o = a M o + f f M o 1 M 0+ 1 + f M 0+ 1 b gde je: a Mo donja granca modalnog ntervala, f Mo-1 frekvencja pre modalnog ntervala, f Mo+1 frekvencja posle modalnog ntervala, b šrna ntervala, šrna klase. U serj može da postoj vše modusa! Modus se može utvrdt na osnovu grafčkog prkaza! Prmer 47 (strana 146) Modus za ntervalnu numerčku serju Medjana Str. 148;71;42 Smbol: M e Medjana je srednja vrednost po položaju koja del numerčku serju na dva jednaka dela. Jedna polovna vrednost obeležja je manja od nje, a druga polovna veća. 20
Formule za medjanu: Neparan broj podataka: Paran broj podataka: Intervalna numerčka serja sa neparnm brojem podataka: Intervalna numerčka serja sa parnm brojem podataka: M M M M e = x n+1 ; 2 x + x n n + 1 2 2 e = ; e e = a = a M e M e 2 k f = 1 F + 2 F k m m1 f + 1 = 1 F + 2 F m b ; m1 b ; gde je: a Me donja granca medjalnog ntervala, a Me+1 gornja granca medjalnog ntervala, F m1 kumulacja pre medjalnog ntervala, F m frekvencja medjalnog ntervala, b šrna ntervala, šrna klase. Medjana može da se odred grafčk uz pomoć kumulacja spod znad. Prmer 48 (strana 148) Medjana za negrupsane podatke neparan broj podataka Prmer 49 (strana 149) Medjana za negrupsane podatke paran broj podataka Prmer 50 (strana 149) Medjana za grupsane podatke nentervalna serja neparan broj podataka Prmer 51 (strana 150) Medjana za grupsane podatke nentervalna serja paran broj podataka Prmer 52 (strana 152) Medjana za grupsane podatke ntervalna serja neparan broj podataka Prmer 53 (strana 153) Medjana za grupsane podatke ntervalna serja paran broj podataka 21
Zašto je nekad bolje korstt medjanu nego artmetčku srednu? Prmer: U našem preduzeću prosečna plata je 400 evra! µ=400 Preduzeće ma 6 radnka sa platama: 100, 100, 150, 150, 400, 1500 M e =150 Kvartl Str. 160;;46 Smbol: Q 1, Q 2, Q 3 Kvartl su srednje vrednost po položaju koje dele statstčku serju na četr jednaka dela kada su vrednost obeležja poređane u rastuć nz. Postoj ukupno tr kvartla. 22
Prv kvartl (Q 1 ) del numerčku serju tako da je jedna četvrtna podataka manja od njega a tr četvrtne su veće. Drug kvartl (Q 2 ) je jednak sa medjanom (Me) del numerčku serju tako da je jedna polovna podataka manja od njega a druga polovna veća. Treć kvartl (Q 3 ) Prmer 57 (strana 160) Kvartl za negrupsane podatke neparan broj podataka Prmer 61 (strana 162) Kvartl za grupsane podatke nentervalna serja neparan broj podataka Percentl Str. 175;;47 Percentl su srednje vrednost po položaju koje dele statstčku serju na sto jednakh delova. Smbol: P Na prmer, zarada radnka: P 80 =15000 23
Prmer za srednje vrednost: DES-021 K:2-7 Artmetčka sredna, modus medjana, negrupsan podac DES-022 K:2-8 Artmetčka sredna, modus medjana, nentervalna serja Mere varjacja (mere dsperzje) Str. 182;76;47 Prmer 76 (strana 182) Tr serje sa stm srednjm vrednostma Mere varjacje su pokazatelj relatvnh apsolutnh odstupanja vrednost obeležja od neke srednje vrednost, občno od artmetčke sredne. 24
U statstčkoj praks postoj velk broj mera varjacje: nterval varjacje*, varjansa*, standardna devjacja*, koefcjent varjacje*, normalzovano (standardzovano) odstupanje (zskor)*, nterkvartlna varjacja, srednje apsolutno odstupanje, Interval varjacje Str. 185;;48 Smbol: I Interval varjacje predstavlja razlku zmeđu najveće najmanje vrednost obeležja. 25
Formule za nterval varjacje: Za negrupsane podatke l nentervalnu serju: Kod ntervalne serje: I = x max x I = a k a 0 mn gde je: x max najveća vrednost obeležja, x mn najmanja vrednost obeležja, a k gornja granca poslednjeg ntervala, a 0 donja granca prvog ntervala. Prmer 77 (strana 185) Interval varjacje negrupsan podac Prmer 78 (strana 186) Interval varjacje grupsan podac Prmer 79 (strana 187) Interval varjacje grupsan podac, ntervalna serja 26
Str. 189;;49 Interkvartlna varjacja (ne rad se) Interkvartlna varjacja je mera varjacje koja zanemaruje utcaj ekstremnh vrednost obeležja pokazuje razlku zmeđu prvog trećeg kvartla u numerčkoj serj. I Q = Q 3 Q 1 DES-072 K:2-12 Kvartl, percentl, nterkvartlna varjacja Varjansa Str. 196;79;49 Smbol: σ 2 (sgma na kvadrat) Prosek kvadrata odstupanja pojednačnh vrednost obeležja od neke srednje vrednost, najčešće od artmetčke sredne. Mera varjacje drugog stepena koja nema jedncu mere. Njena vrednost se nalaz u ntervalu [0, + ] 27
Formule za varjansu: Negrupsan podac - osnovn skup: Negrupsan podac - uzorak: Grupsan podac osnovn skup: Grupsan podac uzorak: N 2 x 2 = 1 2 ; σ = µ N n 2 x 1 = = n x n 1 2 σ u ; σ k 2 f x 2 = 1 2 = µ ; k f = 1 k k 2 2 x f x f 2 = 1 = 1 σ u = ; k 2 f 1 = 1 Prmer 87 (strana 197) Varjansa negrupsan podac, osnovn skup Prmer 90 (strana 204) Varjansa grupsan podac, uzorak 28
Standardna devjacja Str. 209;83;50 Smbol: σ (sgma) Prosečno odstupanje pojednačnh vrednost obeležja od određene srednje vrednost, zraženo u jedncama mere u kojma je zraženo obeležje koje se posmatra. Mera varjacje prvog stepena. Njena vrednost se nalaz u ntervalu [0, + ] Formule za standardnu devjacju: Za osnovn skup: Za uzorak: 2 σ = σ ; σ 2 u = σ u. 29
Koefcjent varjacje Str. 210;84;50 Smbol: V Relatvna mera varjacje koja pokazuje kolko procenata znos standardna devjacja od artmetčke sredne. Kada se korst? Formule za koefcjent varjacje: σ Za osnovn skup: V = 100 ; µ σ u Za uzorak: V u = 100 x ; 30
Normalzovano (standardzovano) odstupanje (z-skor) Str. 216;85;51 Mera varjacje koja pokazuje odstupanje jedne vrednost obeležja od srednje vrednost u standardnm devjacjama. Kada se korst? Formule za normalzovano odstupanje: Za osnovn skup: Za uzorak: µ U = X ; σ X x U =. u σ u Prmer 108 (strana 217) Normalzovano odstupanje DES-037 K:2-11 Normalzovano odstupanje dva uzorka 31
Prmer za mere varjacje: DES-023 K:2-9 Mere varjacje, negrupsan podac, uzorak DES-044 K:2-10 Srednje vrednost, mere varjacje, ntervalna serja, uzorak DES-069 Z(06)3-1 Srednje vrednost, mere varjacje, nentervalna, uzorak Podac o antropomerama građana SFRJ (16-55 godna starost) (udžbenk, strana 52) Muškarc Nazv obeležja Težna tela Vsna tela Dužna nosa Šrna ramena Šrna kukova Broj cpela Artmetčka sredna 72,8 174,64 5,01 48,80 39,78 42,91 Standardna devjacja 10,51 6,89 0,55 2,38 2,55 1,41 Žene Nazv obeležja Težna tela Vsna tela Dužna nosa Šrna ramena Šrna kukova Broj cpela Artmetčka sredna 70,07 166,59 5,05 40,78 38,70 37,68 Standardna devjacja 12,91 9,25 2,49 2,20 1,40 1,06 32
Mere oblka rasporeda Str. 218;86;57 Za zračunavanje asmetrje spljoštenost rasporeda korste se sledeće mere: mera asmetrje (α 3 ), mera spljoštenost (ekscesa) (α 4 ). Mere oblka rasporeda se zračunavaju preko pomoćnh centralnh momenata rasporeda. Koefcjent asmetrje Str. 229;92;58 Smbol: α 3 Numerčk pokazatelj koj zražava u kojoj mer je nek raspored asmetrčan u odnosu na normaln raspored. Ako je: α 3 = 0, raspored je smetrčan, α 3 > 0, raspored je asmetrčan u desno (poztvna asmetrja), α 3 < 0, raspored je asmetrčan u levo (negatvna asmetrja). 33
α 3 = 0 x = M e = M o f α 3 > 0 f α 3 < 0 X X M < M e o < x Raspored asmetrčan u desnu stranu (poztvna asmetrja) x < M e < M Raspored asmetrčan u levu stranu (negatvna asmetrja) o U zavsnost od velčne koefcjenta, određuje se jačna asmetrje. Gradacja je sledeća: α 3 0,25 mala asmetrja, 0,25 < α 3 0,50 srednja asmetrja, α 3 > 0,50 jaka asmetrja. Formula za koefcjent asmetrje: M 3 α 3 = 3 σ u 34
Koefcjent spljoštenost Str. 235;94;60 Smbol: α 4 Numerčk pokazatelj koj zražava u kojoj mer je nek raspored spljošten u odnosu na normaln raspored. Formula za koefcjent spljoštenost: M 4 α 4 = 4 σ u Na osnovu ove formule, koefcjent pruža sledeću nformacju: α 4 = 3, raspored je normalno spljošten (zaobljen), α 4 > 3, raspored je vše zdužen u odnosu na normaln raspored, α 4 < 3, raspored je vše spljošten u odnosu na normaln raspored. 35
α 4 = 3 α 4 < 3 α 4 > 3 Prmer 110, 113, 115 (strana 224, 232, 236) Koefcjent asmetrje spljoštenost nentervalna serja, uzorak DES-074 K:2-13 Skcranje mera oblka rasporeda 36