Deskrptvna statstčka analza Predavač: Dr Mrko Savć savcmrko@ef.uns.ac.rs www.ef.uns.ac.rs
Deskrptvna statstčka analza predstavlja skup metoda kojma se vrš zračunavanje, prkazvanje opsvanje osnovnh karakterstka statstčkh serja. Deskrptvna statstčka analza ma sledeće zadatke: 1. Grupsanje sređvanje statstčkh podataka. 2. Prkazvanje statstčkh podataka. 3. Određvanje osnovnh pokazatelja statstčkh serja.
Grupsanje sređvanje statstčkh podataka Str. 19 Grupsanje podataka se vrš prema vrednostma l modaltetma posmatranh obeležja. Kao krajnj rezultat grupsanja javlja se statstčka serja.
Statstčka serja predstavlja uređen skup varjacja obeležja posmatrane statstčke mase. Statstčka serja se prkazuje u oblku tabele, najmanje u dva reda dve kolone, gde je u prvoj kolon skazana kvaltatvna strana statstčke mase, a u drugoj kvanttatvna (brojčana) strana.
Prmer za statstčku serju sa prekdnm numerčkm obeležjem (ntervalna serja): Tabela broj 4: Raspored studenata prema broju položenh spta Broj spta (X) Broj studenata (f ) 1 2 0-2 10 3-5 20 6-8 15 Ukupno 45 Obeležje (X) kvaltatvna strana Frekvencja (f ) kvanttatvna strana Određvanje donje grance prvog ntervala DES-097 Z(06)1-1 Grupsanje, prekdna obeležja DES-098 Z(06)1-2 Grupsanje, neprekdna obeležja DES-127 Grupsanje, neprekdna, promena ntervala
Str. 23 Prkazvanje statstčkh podataka Prkazvanje statstčkh serja se može vršt na dva načna: tabelarno, grafčk.
Statstčka tabela predstavlja uokvrenu površnu u koju se unos statstčka serja. Broj nazv tabele Nazv obeležja Nazv frekvencje Zaglavlje (X) (f ) 1 2 Redn broj kolone Vrednost l modaltet obeležja f 1 Vrednost l modaltet obeležja f 2... Vrednost l modaltet obeležja f n Prmedba: Izvor: Ukupno: Predkolona n... = 1 f Zbrn red
Prema sadržaju, tabele mogu bt: proste, složene, kombnovane.
Grafčko prkazvanje Str. 25 Grafkon se najčešće dele na sledeć načn: tačkast (stgmogram), površnsk, prostorn, lnjsk, kartogram.
Prmer za djagram rasturanja
Prmer za bar-djagram
Prmer za hstogram frekvencja
Broj radnka prema odeljenjma polu Broj radnka 14 12 10 8 6 4 10 12 5 9 4 8 Mušk Žensk 2 0 Prvo Drugo Treće Odeljenje Prmer za bar djagram sa dva obeležja (urađeno u Excel-u)
Prnos pšence u 2003. u ml. tona Izvor: Statstčk godšnjak SCG za 2003. godnu Južna Amerka, 24 Okeanja, 24 Severna Amerka, 78 Evropa, 200 Afrka, 18 Azja, 239 Prmer za kružn djagram pe-chart (urađeno u Excel-u)
Broj radnka prema odeljenjma polu 12 12 10 10 9 8 8 Broj radnka 6 4 5 4 2 0 Prvo Drugo Odeljenje Treće Mušk Žensk Pol Prmer za stereogram (urađeno u Excel-u)
Prmer za polgon frekvencja (lnjsk djagram)
Pravljenje preseka na osama 90 80 70 60 10 0 2 10 12 14
Poseta tursta u hljadama Novembar Oktobar Decembar 100 Januar 80 60 40 20 0 Februar Mart Aprl Septembar Maj Avgust Jul Jun Prmer za polarn djagram (lnjsk djagram)
Prmer za kartogram
Prmer za loše grupsanje grafčko prkazvanje: Imate l klma uređaj? Da, u autu 27.7% Da, u kuć 44.6% Ne 27.7% Izvor: Blc, 7. avgust 2006. Prmer za loše grafčko prkazvanje (Fresh&Co)
Kumulacja spod znad Tabela 1: Raspored domaćnstava u naselju prema broju automobla Broj automobla (x ) Broj domaćnstava (f ) Kumulacja spod Kumulacja znad 1 2 3 4 0 4 4 1 8 12 (4+8) 2 10 22 (4+8+10) 3 5 27 (4+8+10+5) Ukupno 27 - -
Kumulacja spod znad Tabela 1: Raspored domaćnstava u naselju prema broju automobla Broj automobla (x ) Broj domaćnstava (f ) Kumulacja spod Kumulacja znad 1 2 3 4 0 4 4 27 (5+10+8+4) 1 8 12 (4+8) 23 (5+10+8) 2 10 22 (4+8+10) 15 (5+10) 3 5 27 (4+8+10+5) 5 Ukupno 27 - - 12 domaćnstava u naselju ma najvše 1 automobl 22 domaćnstava u naselju ma najvše 2 automobla 15 domaćnstava u naselju ma najmanje 2 automobla
DES-001 K(05)2-1 Grupsanje grafčko prkazvanje statstčkh podataka (prekdna numerčka obeležja) DES-002 K(05)2-2 Grupsanje grafčko prkazvanje statstčkh podataka (neprekdna num. obeležja) DES-013 K(05)2-3 Polgon kumul. frekvencja (nent. serja) DES-071 K(05)2-4 Polgon kumul. frekvencja (ntervalna serja) DES-008 K(05)z 2-1 Polgon hstogram - vrem. serja DES-054 K(05)z 2-2 Polgon hst. frekvencja - prekdna DES-060 K(05)z 2-3 Grupsanje sređvanje neprekdno ob.
DES-058 K(05)z 2-4 Grupsanje sređvanje prekdno ob. DES-057 K(05)z 2-5 Polgon hstogram neprekdna ob. DES-059 K(05)z 2-6 Grupsanje sređvanje prekdno ob. DES-061 K(05)z 2-7 Grupsanje sređvanje neprekdno ob. DES-024; K(05)z 2-8 Srednje v., mere v., pol. hstogram DES-028; K(05)z 2-9 Mere varjacje negrupsan, prekdna DES-032; K(05)z 2-10 Srednje vred., Mere v. - grup. prekdna DES-063; K(05)z 2-11 Geometrjska sredna DES-068; K(05)z 2-12 Srednje v. mere v.-grups., prekdna DES-064; K(05)z 2-13 Geometrjska sredna DES-016; K(05)z 2-14 Srednje v. mere v., graf, neprekdno o.
I Q 2 U osnovne mere statstčkh serja spadaju (nema u udžbenku): Srednje vrednost (mere centralne tendencje). Mere varjacje (mere dsperzje, raspršenost). Mere oblka rasporeda. α 4 σ 2 µ M o V Str. 37 Osnovne mere statstčkh serja σ Q 1 α 3 M e Q 3
Srednje vrednost Str. 37 Srednje vrednost su vrednost obeležja koje na specfčan načn reprezentuju čtavu statstčku masu, odnosno zamenjuju sve vrednost u statstčkoj serj karakteršu statstčku masu u celn.
Srednje vrednost poseduju sledeće osobne: Ne mogu bt veće od najveće vrednost obeležja nt manje od najmanje vrednost obeležja u serj. Mogu mat vrednost koja uopšte ne postoj u numerčkoj serj. Mogu bt zražene decmalnm brojem bez obzra da l je u ptanju serja sa prekdnm l neprekdnm obeležjem.
Srednje vrednost se dele u dve grupe: Izračunate srednje vrednost. Srednje vrednost po položaju. Izračunate srednje vrednost se mogu utvrdt samo računskm putem. Tu spadaju: ( ) x;µ artmetčka sredna* geometrjska sredna* (G), harmonjska sredna (H), kvadratna sredna, kubna sredna, logartamska sredna.
Str. 37 Srednje vrednost po položaju To su srednje vrednost koje se mogu odredt na osnovu pozcje na kojoj se nalaze kada su vrednost obeležja poređane u rastuć nz. Tu spadaju: modus* (M o ), medjana* (M e ), medjala (M l ), kvartl* (Q), kvntal (Kv), decl (D), percentl* (P).
Artmetčka sredna (prosek) Str. 37 Smbol koj se korste: Artmetčka sredna za uzorak: Artmetčka sredna za osnovn skup: x (''ks-bar'') µ (''m'') Prema tome da l su podac grupsan l ne, razlkuju se: prosta artmetčka sredna, pondersana (složena, vagana) artmetčka sredna.
Prosta, za osnovn skup: N x N = =1 µ ; Prosta, za uzorak: n x x n = =1 ; Pondersana, za osnovn skup: = = = k k f f x 1 1 µ ; Pondersana, za uzorak: = = = k k f f x x 1 1 ; Formule za artmetčku srednu:
Prmer 16 (strana 111) Prosta artmetčka sredna za osnovn skup Prmer 17 (strana 111) (greškom pše prmer 15) Prosta artmetčka sredna za uzorak Prmer 18 (strana 112) Složena artmetčka sredna za osnovn skup Prmer 21 (strana 118) Složena artmetčka sredna za uzorak
Geometrjska sredna Str. 39 Smbol: G Geometrjska sredna spada u zračunate srednje vrednost koja se korst kada u numerčkoj serj obeležja pokazuju neke relatvne pokazatelje (ndekse) l karakterstke geometrjske progresje.
Formule za geometrjsku srednu: Prosta geometrjska sredna: Pondersana geometrjska sredna: Geometrjska sredna: log G n log = =1 k n x f log x = 1 log G = ; k f = 1 G= log G ; Geometrjsku srednu nje moguće zračunat ako je neka vrednost obeležja jednaka nul!
Prmer za antlogartam logg=0,9542425 Antlogartam: G=10 logg =10 0,9542425 =9 Prmer 37 (strana 136) Prosta geometrjska sredna DES-062 K:2-5 Prosta geometrjska sredna
Modus Str. 41 Smbol: M o Modus je ona vrednost obeležja koja se najčešće javlja u statstčkoj serj, odnosno ona vrednost obeležja koja ma najveću frekvencju. Zašto je modus nekad bolj od artmetčke sredne? Velčna obuće l odeće. DES-081 Modus, negrupsan podac Prmer 46 (strana 144) Modus za nentervalnu numerčku serju
Formula za modus (ntervalna numerčka serja): M o = a M o + f f M o 1 M + 0+ 1 f M 0+ 1 b gde je: a Mo donja granca modalnog ntervala, f Mo-1 frekvencja pre modalnog ntervala, f Mo+1 frekvencja posle modalnog ntervala, b šrna ntervala, šrna klase. U serj može da postoj vše modusa! Modus se može utvrdt na osnovu grafčkog prkaza! Prmer 47 (strana 146) Modus za ntervalnu numerčku serju
Medjana Str. 42 Smbol: M e Medjana je srednja vrednost po položaju koja del numerčku serju na dva jednaka dela. Jedna polovna vrednost obeležja je manja od nje, a druga polovna veća.
Formule za medjanu: Neparan broj podataka: Paran broj podataka: Intervalna numerčka serja sa neparnm brojem podataka: Intervalna numerčka serja sa parnm brojem podataka: M M M M e e e e = x n+1 ; 2 x + x n n + 1 = 2 2 ; = a = a M e M e 2 + + k = 1 k 2 = 1 f F F m m1 f + 1 F 2 F m b ; m1 b ; gde je: a Me donja granca medjalnog ntervala, a Me+1 gornja granca medjalnog ntervala, F m1 kumulacja pre medjalnog ntervala, F m frekvencja medjalnog ntervala, b šrna ntervala, šrna klase.
Medjana može da se odred grafčk uz pomoć kumulacja spod znad. Prmer 48 (strana 148) Medjana za negrupsane podatke neparan broj podataka Prmer 49 (strana 149) Medjana za negrupsane podatke paran broj podataka Prmer 50 (strana 149) Medjana za grupsane podatke nentervalna serja neparan broj podataka Prmer 51 (strana 150) Medjana za grupsane podatke nentervalna serja paran broj podataka Prmer 52 (strana 152) Medjana za grupsane podatke ntervalna serja neparan broj podataka Prmer 53 (strana 153) Medjana za grupsane podatke ntervalna serja paran broj podataka
Zašto je nekad bolje korstt medjanu nego artmetčku srednu? Prmer: U našem preduzeću prosečna plata je 400 evra! µ=400 Preduzeće ma 6 radnka sa platama: 100, 100, 150, 150, 400, 1500 M e =150
Kvartl Str. 46 Smbol: Q 1, Q 2, Q 3 Kvartl su srednje vrednost po položaju koje dele statstčku serju na četr jednaka dela kada su vrednost obeležja poređane u rastuć nz. Postoj ukupno tr kvartla.
Prv kvartl (Q 1 ) del numerčku serju tako da je jedna četvrtna podataka manja od njega a tr četvrtne su veće. Drug kvartl (Q 2 ) je jednak sa medjanom (Me) del numerčku serju tako da je jedna polovna podataka manja od njega a druga polovna veća. Treć kvartl (Q 3 ) Prmer 57 (strana 160) Kvartl za negrupsane podatke neparan broj podataka Prmer 61 (strana 162) Kvartl za grupsane podatke nentervalna serja neparan broj podataka
Str. 47 Percentl Percentl su srednje vrednost po položaju koje dele statstčku serju na sto jednakh delova. Smbol: P Na prmer, zarada radnka: P 80 =15000
Prmer za srednje vrednost: DES-021 K:2-7 Artmetčka sredna, modus medjana, negrupsan podac DES-022 K:2-8 Artmetčka sredna, modus medjana, nentervalna serja
Str. 47 Mere varjacja (mere dsperzje) Prmer 76 (strana 182) Tr serje sa stm srednjm vrednostma Mere varjacje su pokazatelj relatvnh apsolutnh odstupanja vrednost obeležja od neke srednje vrednost, občno od artmetčke sredne.
U statstčkoj praks postoj velk broj mera varjacje: nterval varjacje*, varjansa*, standardna devjacja*, koefcjent varjacje*, normalzovano (standardzovano) odstupanje (zskor)*, nterkvartlna varjacja, srednje apsolutno odstupanje,
Interval varjacje Str. 48 Smbol: I Interval varjacje predstavlja razlku zmeđu najveće najmanje vrednost obeležja.
Formule za nterval varjacje: Za negrupsane podatke l nentervalnu serju: Kod ntervalne serje: I = x max x I = a k a 0 mn gde je: x max najveća vrednost obeležja, x mn najmanja vrednost obeležja, a k gornja granca poslednjeg ntervala, a 0 donja granca prvog ntervala.
Prmer 77 (strana 185) Interval varjacje negrupsan podac Prmer 78 (strana 186) Interval varjacje grupsan podac Prmer 79 (strana 187) Interval varjacje grupsan podac, ntervalna serja
Str. 49 Interkvartlna varjacja (ne rad se) Interkvartlna varjacja je mera varjacje koja zanemaruje utcaj ekstremnh vrednost obeležja pokazuje razlku zmeđu prvog trećeg kvartla u numerčkoj serj. I Q = Q 3 Q 1 DES-072 K:2-12 Kvartl, percentl, nterkvartlna varjacja
Varjansa Str. 49 Smbol: σ 2 (sgma na kvadrat) Prosek kvadrata odstupanja pojednačnh vrednost obeležja od neke srednje vrednost, najčešće od artmetčke sredne. Mera varjacje drugog stepena koja nema jedncu mere. Njena vrednost se nalaz u ntervalu [0, + ]
Negrupsan podac - osnovn skup: 2 2 1 2 ; N x N µ σ = = Negrupsan podac - uzorak: 1 1 2 2 2 = = n n x x n u σ ; Grupsan podac osnovn skup: 2 1 1 2 2 µ σ = = = k k f x f ; Grupsan podac uzorak: = = = = k k k u f f x f x 1 1 1 2 2 2 1 σ ; Formule za varjansu:
Prmer 87 (strana 197) Varjansa negrupsan podac, osnovn skup Prmer 90 (strana 204) Varjansa grupsan podac, uzorak
Standardna devjacja Str. 50 Smbol: σ (sgma) Prosečno odstupanje pojednačnh vrednost obeležja od određene srednje vrednost, zraženo u jedncama mere u kojma je zraženo obeležje koje se posmatra. Mera varjacje prvog stepena. Njena vrednost se nalaz u ntervalu [0, + ]
Formule za standardnu devjacju: Za osnovn skup: Za uzorak: σ 2 = σ ; 2 σ u = σ u.
Koefcjent varjacje Str. 50 Smbol: V Relatvna mera varjacje koja pokazuje kolko procenata znos standardna devjacja od artmetčke sredne. Kada se korst?
Formule za koefcjent varjacje: σ Za osnovn skup: V = 100 ; µ σ u Za uzorak: V u = 100 x ;
Normalzovano (standardzovano) odstupanje (z-skor) Str. 51 Mera varjacje koja pokazuje odstupanje jedne vrednost obeležja od srednje vrednost u standardnm devjacjama. Kada se korst?
Formule za normalzovano odstupanje: Za osnovn skup: Za uzorak: µ U = X ; U u σ X x =. σ u Prmer 108 (strana 217) Normalzovano odstupanje DES-037 K:2-11 Normalzovano odstupanje dva uzorka
Prmer za mere varjacje: DES-023 K:2-9 Mere varjacje, negrupsan podac, uzorak DES-044 K:2-10 Srednje vrednost, mere varjacje, ntervalna serja, uzorak DES-069 Z(06)3-1 Srednje vrednost, mere varjacje, nentervalna, uzorak
Podac o antropomerama građana SFRJ (16-55 godna starost) (udžbenk, strana 52) Muškarc Nazv obeležja Artmetčka sredna Standardna devjacja Težna tela 72,8 10,51 Vsna tela 174,64 6,89 Dužna nosa 5,01 0,55 Šrna ramena 48,80 2,38 Šrna kukova 39,78 2,55 Broj cpela 42,91 1,41 Žene Nazv obeležja Artmetčka sredna Standardna devjacja Težna tela 70,07 12,91 Vsna tela 166,59 9,25 Dužna nosa 5,05 2,49 Šrna ramena 40,78 2,20 Šrna kukova 38,70 1,40 Broj cpela 37,68 1,06
Mere oblka rasporeda Str. 57 Za zračunavanje asmetrje spljoštenost rasporeda korste se sledeće mere: mera asmetrje (α 3 ), mera spljoštenost (ekscesa) (α 4 ). Mere oblka rasporeda se zračunavaju preko pomoćnh centralnh momenata rasporeda.
Koefcjent asmetrje Str. 58 Smbol: α 3 Numerčk pokazatelj koj zražava u kojoj mer je nek raspored asmetrčan u odnosu na normaln raspored. Ako je: α 3 = 0, raspored je smetrčan, α 3 > 0, raspored je asmetrčan u desno (poztvna asmetrja), α 3 < 0, raspored je asmetrčan u levo (negatvna asmetrja).
α 3 = 0 x = M e = M o f α 3 > 0 f α 3 < 0 X X M < M o e < x Raspored asmetrčan u desnu stranu (poztvna asmetrja) x < M e < M Raspored asmetrčan u levu stranu (negatvna asmetrja) o
U zavsnost od velčne koefcjenta, određuje se jačna asmetrje. Gradacja je sledeća: α 3 0,25 mala asmetrja, 0,25 < α 3 0,50 srednja asmetrja, α 3 > 0,50 jaka asmetrja. Formula za koefcjent asmetrje: M α = 3 3 3 σ u
Koefcjent spljoštenost Str. 60 Smbol: α 4 Numerčk pokazatelj koj zražava u kojoj mer je nek raspored spljošten u odnosu na normaln raspored.
Formula za koefcjent spljoštenost: M α = 4 4 4 σ u Na osnovu ove formule, koefcjent pruža sledeću nformacju: α 4 = 3, raspored je normalno spljošten (zaobljen), α 4 > 3, raspored je vše zdužen u odnosu na normaln raspored, α 4 < 3, raspored je vše spljošten u odnosu na normaln raspored.
α 4 = 3 α 4 < 3 α 4 > 3
Prmer 110, 113, 115 (strana 224, 232, 236) Koefcjent asmetrje spljoštenost nentervalna serja, uzorak DES-074 K:2-13 Skcranje mera oblka rasporeda