PODATKI, FREKVENČNE PORAZDELITVE IN NJIHOV OPIS: MERE SREDNJE VREDNOSTI IN RAZPRŠENOSTI. KAKO NAREDIMO FREKVENČNO PORAZDELITEV Recimo, da so am a razpolago podatki (pr. število prijateljev, s katerimi se študetke i študetje videvejo vsak da):,,, 3,,,, 7,,, 6, 0, 6,,, 7,, 9,, 3, ali če jih uredimo: 0,,,,, 3, 3,,,,,,, 6, 6, 7, 7,, 9,. Razdelimo jih v razrede (predstavljajte si posode ali škatle): od 0 do, od 3 do, od 6 do i od 9 do. Skica: 0 3 6 9 MEJE RAZREDOV Med razredi so lukje (od do 3, od do 6 itd.), zato premakemo meje razredov tako, da te lukje pokrijemo. Natača meja med dvema razredoma je sredia med juima mejama: zgorjo mejo ižjega razreda prištejemo spodji meji višjega i seštevek delimo z. meja (x 0gorja x spodja ) / x 0max x mi Spodjo mejo ajižjega razreda i zgorjo mejo ajvišjega razreda izberemo tako, da so vsi razredi eako široki. Širia razrede je razlika med atačo zgorjo i atačo spodjo mejo razreda: širia x 0max - x 0mi, jegova sredia pa polovica seštevka atače zgorje i atače spodje meje razreda: sredia (x 0max x 0mi ) /. Skica: -0,,,,, MEJE RAZREDOV 7 0 SREDINE RAZREDOV V te razrede razvrstimo aše eote: Skica: -0,,,,, MEJE RAZREDOV 7 0 SREDINE RAZREDOV Za vsak razred ugotovimo rekveco (pogostost), eot v jem tako, da jih preprosto preštejemo i to zapišemo v tabelo. Izračuamo še odstotke, kumulative rekvece (potrebe pri ugotavljaju media
i kvartilov), ki jih dobimo tako, da rekveco daega razreda prištejemo kumulativi rekveci prejšjega razreda, i kumulative odstotke. Dobili smo Frekvečo porazdelitev: 0-6 - 90 9-0 0 00 Skupaj 0 00. MERE SREDNJE VREDNOSTI Za aše podatke:,,, 3,,,, 7,,, 6, 0, 6,,, 7,, 9,, 3 bomo določili mere sredje vredosti. Neurejei podatki: x x i i 0 x i i 0.. ARITMETIČNA SREDINA 37606793 0 x i je vsak podatek (i je zaporeda številka podatka i je od do, v ašem primeru 0, kot piše a zaku za sumacijo Σ), je število podatkov. Iz rekveče porazdelitve: 0-6 - 90 9-0 0 00 Skupaj 0 00 9 0,6 x r ( x ) k k k k ( x k 0 k ) ( ) ( ) (7 ) 0 (0 ) 3 3 0 0 9 0,6 x k so sredie razredov (k je zaporeda številka razreda od do r, v ašem primeru r kot piše a zaku za sumacijo Σ), je število podatkov.
.. MEDIANA Neurejei podatki: Iz eurejeih podatkov mediae e račuamo, temveč jo določamo. Podatke uredimo v ražiro vrsto (uredimo po velikosti ali učeo po ragu): 0,,,,, 3, 3,,,,,,, 6, 6, 7, 7,, 9, Nato določimo točko, ki razdeli podatke točo a polovico: tule 0,,,,, 3, 3,,,,,, 6, 6, 7, 7,, 9, Če imamo liho število podatkov, je to reali podatek, če je število podatkov sodo, pa izračuamo sredio med podatkoma, v ašem primeru ( ) /. Iz rekveče porazdelitve: 0-6 - 90 9-0 0 00 Skupaj 0 00 Najprej ajdemo razred, v katerem leži mediaa. To je razred, kjer kumulativi procet F% prvič preseže 0%. Temu razredu pravimo mediaski razred. V ašem primeru je to razred 3. Me F 0 x0,mi i, 3, 3, 0,6 3,,7,37 0, x 0,mi je atača spodja meja (spomimo se, da meje vpisae v tabeli iso zmeraj atače) mediaskega razreda, torej razreda, v katerem je mediaa (prvi razred, katerega kumulativi odstotek je večji od 0%), F - je kumulativa rekveca prejšjega razreda (kar ozači ideks - ), 0 je rekveca mediaskega razreda i i je širia razreda (razdalja med atačo spodjo i atačo zgorjo mejo razreda). Kot vidimo, se mediaa izračuaa a podlagi rekveče porazdelitve razlikuje od mediae iz eurejeih podatkov. Razlike lahko astaejo tudi pri aritmetiči sredii i modusu i so posledica izgube iormacije, ko e pozamo več pravih vredosti podatkov zotraj razredov.
.3. MODUS Modus je vredost, ki se ajpogosteje pojavlja ali vredost, okoli katere so vredosti ajgostejše. Neurejei podatki: Najpameteje je zova podatke urediti v ražiro vrsto ( po velikosti) i ajti ajpogostejši podatek. V ašem primeru je to. Iz rekveče porazdelitve: 0,,,,, 3, 3,,,,,,, 6, 6, 7, 7,, 9, 0-6 - 90 9-0 0 00 Skupaj 0 00 Najprej ajdemo razred, v katerem je ajveč eot. Nato določimo atači položaj modusa zotraj razreda po asledji ormuli: 0 3 Mo x0,mi 3, 3, 3,, ) ( ) ( ) ( ) 6 ( 0 0 x 0,mi je atača spodja meja (spomimo se zova, da meje vpisae v tabeli iso zmeraj atače) modalega razreda, torej razreda, v katerem je modus (v katerega je ajveč eot), 0 je rekveca tega razreda, - je rekveca prejšjega razreda, je rekveca asledjega razreda i i je širia razreda (že vemo: razdalja med atačo spodjo i atačo zgorjo mejo razreda). Naj e zavede: rekveca prejšjega razreda i rekveca asledjega razreda sta zgolj slučajo eaki. Drugače to i pravilo, potrebo je atačo vpisati rekvece razredov v ormulo. 3. MERE RAZPRŠENOSTI Za aše podatke:,,, 3,,,, 7,,, 6, 0, 6,,, 7,, 9,, 3, bomo določili še mere razpršeosti. 3.. KVARTILNI RAZMIK Da bi določili kvartili razmik, moramo ajprej določiti kvartile podatkov. Kvartile določamo tako kot mediao, le da so kvartili vredosti, ki podatke razdelijo a četrtie: Neurejei podatki: Za izraču kvartilov eurejee podatke ajprej uredimo v ražiro vrsto, ato pa določimo kvartile. 0,,,, Q 3, 3,,, Q,,, 6, 6 Q 3 7, 7,, 9, Q, Q Q 3 6, Nato preprosto odštejemo prvi kvartil od tretjega i dobimo kvartili razmik:
Q Q 3 - Q 6, -,. V skladu z utečeo prakso je lepo izračuati še poloviči razmik, Q Q 3 Q 6,, ki am pove, kako daleč od mediae avzdol i avzgor (±) se razteza polovica podatkov. Iz rekveče porazdelitve: 0-6 - 90 9-0 0 00 Skupaj 0 00 Iz podatkov urejeih v rekvečo porazdelitev izračuamo kvartile po podobi ormuli kot mediao, le da določimo kvartile razrede (za Q prvi razred s kumulativo rekveco ad eo četrtio, za Q 3 pa prvi razred s kumulativo rekveco ad tri četrtie) i v ormuli ustrezo spremeimo ulomek. Izračue za aš primer kažejo asledje ormule F 0 0 Q x 0,mi i - 0, 3-0, 3-0, 3, 0 0 F 0 Q Me x0mi i,, 3 0 3, 0,67 3,,7,37 3 0 3 F 3 3 Q3 x0mi i, 3, 3 0, 3, 0, 3,, 6,7 Nato zova odštejemo prvi kvartil od tretjega i dobimo kvartili razmik: Q Q 3 - Q 6,7 -,,. I zova je v skladu z utečeo prakso lepo izračuati še popoviči razmik, Q Q 3 Q 6,7,,,.
3.. POVPREČNI ABSOLUTNI ODKLON Neurejei podatki: Prvi ači je podlaga za izraču povprečega absolutega odkloa. Seštejemo samo absolute vredosti odkloov, ato pa jih delimo s številom podatkov (umerusom), ali s ormulo: AD xi x,6,6,6 3,6,6,6,6 7,6,6,6 6,6 0,6 6,6,6,6 7,6,6 9,6,6 3,6 0 3,6,6 6,,6 0,6 3, 0,6, 0,6 0, 0,,6, 3,6,6, 0,, 0,6,6,, 0 0 kjer pokoči črti pomeita, da upoštevamo le absoluto vredost izraza med jima. 0 Kot lahko opazimo, je x i vsak posameze podatek, i jegova zaporeda številka, število podatkov, x pa aritmetiča sredia aših podatkov. Za izraču se splača podatke urediti v tabelo: x x-m x-m -3,6 3,6 -,6,6 3 6, 6, 3 -,6,6-0,6 0,6 6 3, 3, 7-0,6 0,6 7,, 9-0,6 0,6 0 0, 0, 6,, 0 -,6,6 3 6,, -3,6 3,6 -,6,6 6 7,, 7 0, 0, 9,, 9-0,6 0,6 0 3 -,6,6 Skupaj 9 0, M9/0,6 AD,/0,6 0
Iz rekveče porazdelitve: F % F F% 0-6 - 90 9-0 0 00 Skupaj 0 00 Pri račuaju absolutega odkloa iz rekveče porazdelitve uporabljamo odkloe sredi razredov od aritmetiče sredie. Za izraču bomo uporabili aritmetičo sredio izračuao iz rekveče porazdelitve. r x x ) ( x x ( k k k k ) k k ( AD 0 0 ( 3,6 )( 0,6 )(, )(, ), 0,,6, 0 0 0 x k so sredie razredov (k je zaporeda številka razreda od do r, v ašem primeru r kot piše a zaku za sumacijo Σ), je število podatkov, pokoči črti pa zova pomeita, da zaemarimo predzak i vzamemo absoluto vredost odkloa.,6 )(,6 )( 7,6 )( 0,6 ) Neurejei podatki: 3.3. VARIANCA IN STANDARDNI ODKLON Drugi ači (kvadriraje) je sicer ekaj zamudejši, vedar se je izkazal kot bolj uporabe za primerjaje večih spremeljivk. Na podlagi kvadratov odkloov izračuamo variaco: s (xi x) (,6 ) (,6 ) (,6 ) ( 3,6 ) (,6 ) (,6 ) 0 (,6 ) ( 7,6 ) (,6 ) (,6 ) ( 6,6 ) ( 0,6 ) ( 6,6 ) (,6 ) 0 (,6 ) ( 7,6 ) (,6 ) ( 9,6 ) (,6 ) ( 3,6 ) 0 3,6,6 6,,6 0,6 3, 0,6, 0,6 0,,,6 0, 3,6,6, 0,, 0,6,6, 7,7 0 0 Pozor! Najprej kvadriramo odkloe, ato jih seštejemo i ato vsoto delimo s številom eot. Zova je x i vsak posameze podatek, i jegova zaporeda številka, število podatkov, x pa aritmetiča sredia aših podatkov. Za razliko od absolutega odkloa se predzakov zebimo s kvadrirajem. Variaca je sestavljea iz kvadratov odkloov, zato je jea eota kvadrat eote podatkov. Da dobimo zova iste eote, kot so v podatkih, jo koreimo. Dobimo stadardi odklo:
SD s ( xi x ) 7,7,7, ki je splošo sprejeta mera razpršeosti za zveze (itervale i razmeroste) podatke. Naj tu opozorimo, da so te mere razpršeosti le aritmetiče sredie asolutih odkloov ali jihovih kvadratov. Tudi tu je ureditev podatkov v tabelo pri izračuu veliko ugodejši ači od eposredega račua, kot je prikaza zgoraj. x x-m (x-m) -3,6,96 -,6 6,76 3 6, 0,96 3 -,6,6-0,6 0,36 6 3,,6 7-0,6 0,36 7,,76 9-0,6 0,36 0 0, 0,6 6,,96 0 -,6,6 3 6,,96-3,6,96 -,6 6,76 6 7,,76 7 0, 0,6 9, 9,36 9-0,6 0,36 0 3 -,6,6 Skupaj 9 0,0 M,6 Var 7,7 SD,7 Iz rekveče porazdelitve: 0-6 - 90 9-0 0 00 Skupaj 0 00 Tudi pri račuaju variace i stadardega odkloa iz rekveče porazdelitve uporabljamo odkloe sredi razredov od aritmetiče sredie. Za izraču bomo uporabili aritmetičo sredio izračuao iz rekveče porazdelitve.
r ((xk x) k ) ((xk x) k ) k k s 0 ((,6 ) )((,6 ) )(( 7,6 ) )(( 0,6 ) ) 0 ( 3,6 )( 0,6 )(, )(, ) (, 96 )( 0,36 )(,76 )( 96, ) 0 0 6,,,, 3, 7,7 0 0 x k so sredie razredov (k je zaporeda številka razreda od do r, v ašem primeru r kot piše a zaku za sumacijo Σ), je število podatkov. Tudi tu se predzakov zebimo s kvadrirajem. I stadardi odklo je seveda kore iz variace: SD s x k x k 7,7,7