DESKRIPTIVNA STATISTIKA
Numeričku seriju podataka opisujemo pomoću Numeričku seriju podataka opisujemo pomoću numeričkih deskriptivnih mera.
Pokazatelji centralne tendencije Aritmetička sredina, Medijana, Modus, Kvartili Pokazatelji varijacije Interval varijacije, Interkvartilna razlika, Varijansa, Standardna Devijacija, j Srednje apsolutno odstupanje, Koeficijent varijacije, Koeficijent interkvartilne varijacije, Standardizovano odstupanje Asimetričnost Ai tič t Oblik distribucije
Numerički pokazatelji karakteristika distribucije Centralna Tendencija (Lokacija) Varijacija (Disperzija) Simetričnost
Mera centralne tendencije (srednja vrednost) je vrednost oko koje se numeričke vrednosti obeležja grupišu. Iako mera centralne tendencije nije dovoljna da u potpunosti opiše jedan skup, ona je najva važniji pokazatelj od koga se polazi u određivanju drugih pokazatelja.
Prema načinu utvrđivanja srednje vrednosti se dele na: Matematičke (izračunate) Aritmetička ( geometrijska, harmonijska sredina) odsečena aritmetička sredina Pozicione modus medijana
Mere centralne tendencije za negrupisane podatke
3-2 Aritmetička sredina populacije ΣX μ = N Nb broj opservacija populacije X vrednosti obeležja x = x N = x 1 + x 2 + L + N x N
3-4 Aritmetička sredina uzorka X = X n gde X je aritmetička sredina n veličina uzorka
Aritmetička sredina (mean, average) x = n x i= 1 i n x + x = 1 2 + n + x n 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 x = 5 = 5 x = =66
Svojstva aritmetičke sredine Najčešće korišćena mera centralne tendencije Primenjuje se kod numeričkog obeležja Svi podaci učestvuju u izračunavanju aritmetičke sredine Skup podataka ima jedinstvenu aritmetičku sredinu Na aritmetičku sredinu utiču ekstremno velike i male vrednosti ( outliers ) Jedina mera za koju je ispunjeno da je zbir odstupanja od sredine jednaka nuli
3-7 PRIMER X: 3, 8, and 4. Aritmetička sredina: 5 (3-5) + (8-5) + (4-5) = -2 +3-1 = 0. Σ( ( X X ) = 0
Odsečena aritmetička sredina Izračunava se tako što iz skupa izbace ekstremne vrednosti sa oba kraja raspodele (najniže i najviše vrednosti Uobičajeno je da se odbaci 5-25% vrednosti i onda se izračunava srednja vrednost Eliminiše se uticaj ekstremnih vrednosti
Uticaj ekstremnih vrednosti na aritmetičku sredinu 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 srednja vrednost = 3 srednja vrednost = 4 1+ 2 + 3 + 5 4 + 5 = 15 5 = 3 1+ 2 + 3 + 5 4 + 10 = 20 5 = 4
Ponderisana aritmetička srednja vrednost izračunava se kada su podaci prikazani kao distribucija frekvencija: x = f i x f i i Ako su podaci grupisani u grupne intervale, ponderisana aritmetička sredina se izračunava primenom formule: x = f i (x s ) i f i
3-10 Medijana Medijana je središnji član statističke serije u slučaju č neparnog broja podataka. U slučaju parnog broja podataka medijana je jednaka aritmetičkoj sredini dva središnja člana statističke serije Ispod i iznad medijane je jednak broj članova serije
Medijana Važna mera centralne tendencije Na medijanu ne utiču ekstremne vrednosti 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Medijana = 5 Medijana = 5
Svojstva medijane Primenjuje se kod numeričkog obeležja i rangove Skup podataka ima jedinstvenu sredinu medijanu Na medijanu ne utiču ekstremno velike i male vrednosti
Modus Vrednost obeležja koja ima najveću frekvenciju Na N modus ne utiču ekstremne kt vrednosti Modus ne postoji ukoliko sve vredmosti obeležja imaju istu frekvenciju Modus nije jedinstven Modus može da se izračuna kod numeričkih i kategorijalnih podataka 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mo = 9 0 1 2 3 4 5 6 Nema modusa
Simetričnost distribucije Utvrđivanje simetričnosti distribucije na osnovu aritmetičke sredine,modusa i medijane Asimetrija ulevo Simetričnost Asimetrija udesno Sredina Medijana Modus Sredina = Medijana= Modus Modus Medjiana Sredina