1. OSNOVNI POJMI STATISTIKA. Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v določenem prostoru in času.

Σχετικά έγγραφα
1. OSNOVNI POJMI STATISTIKA. Definicija 2: Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v določenem prostoru in času.

Osnove statistike. Drago Bokal Oddelek za matematiko in računalništvo Fakulteta za naravoslovje in matematiko Univerza v Mariboru. 1.

Šolski center Novo mesto Srednja elektro šola in tehniška gimnazija VAJE IZ STATISTIKE

Funkcijske vrste. Matematika 2. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 2. april Gregor Dolinar Matematika 2

Statistična analiza. doc. dr. Mitja Kos, mag. farm. Katedra za socialno farmacijo Univerza v Ljubljani- Fakulteta za farmacijo

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 5. december Gregor Dolinar Matematika 1

Tretja vaja iz matematike 1

Kontrolne karte uporabljamo za sprotno spremljanje kakovosti izdelka, ki ga izdelujemo v proizvodnem procesu.

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 14. november Gregor Dolinar Matematika 1

OSNOVE STATISTIKE. FKKT-kemijski tehnologi 1.letnik Miran Černe

Diferencialna enačba, v kateri nastopata neznana funkcija in njen odvod v prvi potenci

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 22. oktober Gregor Dolinar Matematika 1

NEPARAMETRIČNI TESTI. pregledovanje tabel hi-kvadrat test. as. dr. Nino RODE

KODE ZA ODKRIVANJE IN ODPRAVLJANJE NAPAK

Cilji vaje. Osnovni pojmi. Načini grafičnega prikaza podatkov: Načini numeričnega prikaza podatkov: 2. vaja: OPISNA STATISTIKA OB UPORABI MS EXCEL

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 12. november Gregor Dolinar Matematika 1

Mojca Rožič, Nikolaj Lipič, Fani Ostrež Voh

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 10. december Gregor Dolinar Matematika 1

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 15. oktober Gregor Dolinar Matematika 1

IZPIT IZ ANALIZE II Maribor,

matrike A = [a ij ] m,n αa 11 αa 12 αa 1n αa 21 αa 22 αa 2n αa m1 αa m2 αa mn se števanje po komponentah (matriki morata biti enakih dimenzij):

Booleova algebra. Izjave in Booleove spremenljivke

PONOVITEV SNOVI ZA 4. TEST

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 21. november Gregor Dolinar Matematika 1

Kotne in krožne funkcije

PODATKI, FREKVENČNE PORAZDELITVE IN NJIHOV OPIS: MERE SREDNJE VREDNOSTI IN RAZPRŠENOSTI

Regresija in korelacija

Osnove matematične analize 2016/17

Na pregledni skici napišite/označite ustrezne točke in paraboli. A) 12 B) 8 C) 4 D) 4 E) 8 F) 12

1. Definicijsko območje, zaloga vrednosti. 2. Naraščanje in padanje, ekstremi. 3. Ukrivljenost. 4. Trend na robu definicijskega območja

cot x ni def. 3 1 KOTNE FUNKCIJE POLJUBNO VELIKEGA KOTA (A) Merske enote stopinja [ ] radian [rad] 1. Izrazi kot v radianih.

Osnove sklepne statistike

Funkcije več spremenljivk

SKUPNE PORAZDELITVE VEČ SLUČAJNIH SPREMENLJIVK

vezani ekstremi funkcij

DISKRIMINANTNA ANALIZA

*M * Osnovna in višja raven MATEMATIKA NAVODILA ZA OCENJEVANJE. Sobota, 4. junij 2011 SPOMLADANSKI IZPITNI ROK. Državni izpitni center

Splošno o interpolaciji

D f, Z f. Lastnosti. Linearna funkcija. Definicija Linearna funkcija f : je definirana s predpisom f(x) = kx+n; k,

V tem poglavju bomo vpeljali pojem determinante matrike, spoznali bomo njene lastnosti in nekaj metod za računanje determinant.

S programom SPSS se, glede na število ur, ne bomo ukvarjali. Na izpitu so zastavljena neka vprašanja, zraven pa dobimo računalniški izpis izračunov. T

Kotni funkciji sinus in kosinus

Osnove elektrotehnike uvod

Integralni račun. Nedoločeni integral in integracijske metrode. 1. Izračunaj naslednje nedoločene integrale: (a) dx. (b) x 3 +3+x 2 dx, (c) (d)

Podobnost matrik. Matematika II (FKKT Kemijsko inženirstvo) Diagonalizacija matrik

Numerično reševanje. diferencialnih enačb II

Statistika II z računalniško analizo podatkov. Bivariatna regresija, tipi povezanosti

Gimnazija Krˇsko. vektorji - naloge

1. Trikotniki hitrosti

Izpeljava Jensenove in Hölderjeve neenakosti ter neenakosti Minkowskega

REˇSITVE. Naloga a. b. c. d Skupaj. FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost 2. kolokvij 23.

POROČILO. št.: P 1100/ Preskus jeklenih profilov za spuščen strop po točki 5.2 standarda SIST EN 13964:2004

Definicija. definiramo skalarni produkt. x i y i. in razdaljo. d(x, y) = x y = < x y, x y > = n (x i y i ) 2. i=1. i=1

Delovna točka in napajalna vezja bipolarnih tranzistorjev

1.3 Vsota diskretnih slučajnih spremenljivk

,..., y T imenujemo časovna vrsta.

Univerza v Ljubljani Fakulteta za računalništvo in informatiko MATEMATIKA. Polona Oblak

Frekvenčna analiza neperiodičnih signalov. Analiza signalov prof. France Mihelič

Zbirka vaj iz STATISTIKE. Blejec Andrej

Matematika 1. Gregor Dolinar. 2. januar Fakulteta za elektrotehniko Univerza v Ljubljani. Gregor Dolinar Matematika 1

SEMINARSKA NALOGA Funkciji sin(x) in cos(x)

Kvadratne forme. Poglavje XI. 1 Definicija in osnovne lastnosti

Matematika. Funkcije in enačbe

diferencialne enačbe - nadaljevanje

Reševanje sistema linearnih

8. Diskretni LTI sistemi

KVANTITATIVNE METODE RAZISKOVANJA. Izr. prof. dr. Polona Selič, univ. dipl.psih.

Tabele termodinamskih lastnosti vode in vodne pare

1. Έντυπα αιτήσεων αποζημίωσης Αξίωση αποζημίωσης Έντυπο Πίνακας μεταφράσεων των όρων του εντύπου...

Statistika 2 z računalniško analizo podatkov. Multipla regresija in polinomski regresijski model

numeričkih deskriptivnih mera.

Enačba, v kateri poleg neznane funkcije neodvisnih spremenljivk ter konstant nastopajo tudi njeni odvodi, se imenuje diferencialna enačba.

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * NAVODILA ZA OCENJEVANJE. Sreda, 3. junij 2015 SPLOŠNA MATURA

13. Jacobijeva metoda za računanje singularnega razcepa

Vaje: Električni tokovi

Spoznajmo sedaj definicijo in nekaj osnovnih primerov zaporedij števil.

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

Statistika 2 z računalniško analizo podatkov. Statistično sklepanje

Uporabna matematika za naravoslovce

Matematika I (VS) Univerza v Ljubljani, FE. Melita Hajdinjak 2013/14. Pregled elementarnih funkcij. Potenčna funkcija. Korenska funkcija.

DISKRETNA FOURIERJEVA TRANSFORMACIJA

Fazni diagram binarne tekočine

II. LIMITA IN ZVEZNOST FUNKCIJ

Matrike. Poglavje II. Matrika je pravokotna tabela realnih števil. Na primer: , , , 0 1

- Geodetske točke in geodetske mreže

Linearna algebra. Bojan Orel Fakulteta za računalništvo in informatiko

Multivariatna analiza variance

Matematika. BF Lesarstvo. Zapiski ob predavanjih v šolskem letu 2010/2011

Funkcija je predpis, ki vsakemu elementu x iz definicijskega območja D R priredi neko število f (x) R.

Nekateri primeri sklopov izpitnih vprašanj pri predmetu Naključni pojavi

Vaje iz MATEMATIKE 2. Vektorji

1. UREJENE OBLIKE KVADRATNE FUNKCIJE

Kotne funkcije poljubnega kota. Osnovne zveze med funkcijamo istega kota. Uporaba kotnih funkcij v poljubnem trikotniku. Kosinusni in sinusni izrek.

Algebraične strukture

NEPARAMETRIČNI TESTI Doc.dr. Tadeja Kraner Šumenjak

1 Fibonaccijeva stevila

1. VAJA IZ TRDNOSTI. (linearna algebra - ponovitev, Kroneckerjev δ i j, permutacijski simbol e i jk )

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * FIZIKA NAVODILA ZA OCENJEVANJE. Petek, 10. junij 2016 SPLOŠNA MATURA

PRIMER UPORABE FUNKCIJ 2. FUNKCIJE ENE SPREMENLJIVKE DEFINICIJA IN LASTNOSTI FUNKCIJE. Upogibni moment. M(X )=F A x qx2 2

Poliedri Ines Pogačar 27. oktober 2009

Transcript:

1. OSNOVNI POJMI STATISTIKA Simona PUSTAVRH, ŠC Novo mesto Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v določenem prostoru in času. Množičen pojav: ocenjevanje dijakov merjenje višin dijakov branje knjig dijakov smučanje v Sloveniji merjenje krvnega tlaka promet skozi določeno križišče mesečne plače zaposlenih serijska proizvodnja določenega izdelka 1 Osnovne naloge statistike: zbiranje podatkov (anketiranje, opazovanje, merjenje, štetje) čiščenje, kodiranje in razvrščanje podatkov, urejanje in grafično prikazovanje podatkov, povzemanje in sprejemanje zaključkev (odkrivanje lastnosti in zakonitosti populacije in napovedovanje vrednosti). Definicija : Populacija je množica, ki jo želimo statistično proučiti. Statistična enota je en element populacije. Populacijo lahko sestavljajo živa bitja, predmeti, dogodki. Opredelitev populacije: stvarno (kdo ali kaj spada v populacijo in kdo ne) geografsko (kje je populacija opazovana) časovno (kdaj je zajeta) 3 4

Definicija 3: Vzorec je podmnožica (del) populacije. Vzorec je slučajen, če imajo vse enote populacije enako možnost (enako verjetnost) biti izbrane v vzorec. Slučajni vzorec predstavlja (reprezentira) celotno populacijo. Enostavno slučajno vzorčenje: žrebanje (loterijski način) vzorci s ponavljanjem (enota, ki je bila že izbrana v vzorec, je ponovno izbrana), vzorci brez ponavljanja (enota, ki je bila že izbrana v vzorec, ne more biti ponovno izbrana). Definicija 4: Preučevano lastnost (značilnost) enote imenujemo statistična spremenljivka. Vrednost statistične spremenljivke je lastnost ene opazovane enote in jo imenujemo podatek. PRIMER 1 Statistične spremenljivke: višina dijaka, ocena dijaka. Definicija 5: Parameter je statistična karakteristika populacije. PRIMER Parametri: povprečna višina dijakov, povprečna ocena dijakov. Število enot populacije označimo z N. 5 6 Glede na način izražanja podatke ločimo na: opisne (ali kvalitativne): vrednosti le opišemo z besedami in jih ne moremo ovrednotiti numerično (npr. spol, kraj bivanja, barva avtomobila), vrstne (ali ordinalne): vrednosti lahko uredimo le po velikosti, njihova razmerja pa nimajo pomena (npr. šolska ocena, doseženo mesto na tekmi, zadovoljstvo z malico), številske (ali kvantitativne): vrednosti izrazimo numerično oz. številsko. Ločimo diskretne in zvezne številske podatke. Nezvezne (ali diskretne): zaloga vrednosti končna ali neskončna množica realnih števil (npr. število prometnih nesreč, št. prebranih knjig, št. dijakov v razredu). Zvezne: zavzamejo lahko vsako vrednost iz nekega intervala (npr. višina ali teža dijaka, višina žepnine, cena knjig). PRIMER 3 V tabeli so zbrani nekateri podatki slučajnega vzorca dijakov Šolskega centra Novo mesto v šolskem letu 009/010: Zap.št. Spol Letnik Št. bratov/sester Višina (cm) 1. moški 1 1 174,3. ženski 3 169,7 3. ženski 1 0 164, 4. moški 18,9 5. moški 3 3 186, 6. moški 4 1 180,1 7. ženski 4 0 17,8 8. moški 1 177,7 7 8

Odgovorite na naslednja vprašanja: 1 Kaj je v tem primeru populacija? S katerimi pogoji je opredeljena (stvarno, časovno, krajevno)? Kaj je statistična enota? Kako velik je vzorec? 3 Katere statistične spremenljivke so predstavljene v tabeli? 4 Kakšna je posamezna spremenljivka glede na način izražanja? 5 Katere parametre populacije bi lahko določili? PRIMER 4 Izvedeti želimo, kakšno je mnenje dijakov na ŠC Novo mesto o malici v šol. letu 008/009. Ker je število dijakov okoli 3000, ne moremo vprašati vsakega, zato se odločimo, da bomo oblikovali vzorec velikosti 00 dijakov, ki bo dobro predstavljal celo populacijo. Ali bi bil v ta namen ustrezen vzorec, ki bi zajemal prvih 00 dijakov, ki pridejo v torek zjutraj v šolo? Kdo zbira podatke? 9. UREJANJE PODATKOV 10 šole bolnišnice podjetja. SURS (uradna (državna) statistika) EUROSTAT (evropska statistika) EPICENTER, NINAMEDIA (javnomnenjske raziskave) Spoznali bomo: ranžirno vrsto grupiranje podatkov. Programski paketi za obdelavo podatkov: Excel, SPSS, SAS, Minitab, Mathlab, S-Plus,... 11 1

RANŽIRNA VRSTA Ranžirno vrsto predstavljajo po velikosti urejeni številski podatki. Uporabljamo jo za urejanje majhnega števila številskih podatkov. Vsakemu podatku določimo zaporedno mesto v ranžirni vrsti, ki ga imenujemo rang. Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang. Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili različni med seboj. PRIMER 5 Pot do šole. 1 dijakov smo vprašali, koliko časa porabijo za pot do šole. Rezultati v minutah so 0, 38, 8, 35, 30, 40,, 3, 35, 3, 45, 35. Zapiši podatke v ranžirno vrsto in jim določi rang. Rešitev: Čas (min) 0 8 30 3 3 35 35 35 38 40 45 Rang 13 14 GRUPIRANJE PODATKOV PRIMER 6 Poraba mleka. 50 slovenskih družin v neki vasi smo vprašali, koliko mleka so porabili v prejšnjem tednu. Zbrani podatki v litrih so: 1,1 1,7 1 0,5 0,9,1,3,3,6 3,1 3,7 3,9 3,1,5 3,3 3,3 3,9 3,8 4,1 4 4,3 4,4 4,4 5,1 5,9 5,3 5, 5,7 4,7 4,3 4, 4,3 4,7 4, 7,1 7, 7,5 7,5 7,6 6,3 6, 6,1 6,9 8,1 8, 8,5 9,3 9, 9,1 9,8 Grupiranje: združevanje podatkov v skupine (razrede): najprej določimo skupne lastnosti enot v posameznih razredih (od 5 do 0 razredov), vsaka enota mora biti v natanko enem razredu (ne sme se zgoditi, da bi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšno enoto ne bi obstajal razred, v katerega bi jo uvrstili), enote porazdelimo po razredih. Ali so podatki dovolj pregledni, da lahko povemo kaj o porabi mleka? 15 16

I. Grupiranje številskih spremenljivk v r razredov: Najmanjša vrednost, ki še sodi v i-ti razred: x i,min Največja vrednost, ki še sodi v i-ti razred: x i,max (Absolutna) frekvenca razreda f i : število enot v i-tem razredu Frekvenčna tabela ali frekvenčna porazdelitev: predstavitev razredov in pripadajočih frekvenc: Razred Vrednost spr. f i 1. x 1,min x 1,max f 1. x,min x,max f.... r. x r,min x r,max f r Skupaj / N PRIMER 7 Poraba mleka. 50 slovenskih družin v neki vasi smo vprašali, koliko mleka so porabili v prejšnjem tednu. Zbrani podatki v litrih so: 1,1 1,7 1 0,5 0,9,1,3,3,6 3,1 3,7 3,9 3,1,5 3,3 3,3 3,9 3,8 4,1 4 4,3 4,4 4,4 5,1 5,9 5,3 5, 5,7 4,7 4,3 4, 4,3 4,7 4, 7,1 7, 7,5 7,5 7,6 6,3 6, 6,1 6,9 8,1 8, 8,5 9,3 9, 9,1 9,8 Zbrane podatke grupiraj v pet razredov in vsakemu razredu določi frekvenco. Frekvenčna porazdelitev številske spremenljivke 17 18 Rešitev: Razred Poraba mleka v l f i 1. 0 pod. pod 4 3. 4 pod 6 4. 6 pod 8 5. 8 pod 10 Skupaj / Kaj lahko izračunamo za grupirane podatke? Relativna frekvenca f i : delež enot v i-tem razredu glede na število vseh enot N, ki smo jih opazovali: f i = f i N Strukturni odstotek f i %: relativna frekvenca f i pomnožena s 100 %: f i %=f i 100 % 19 0

Kumulativna frekvenca F i : število enot, ki imajo manjše vrednosti od spodnje meje i-tega razreda: F 1 = 0inF i = F i 1 + f i 1 (za i > 1) Spodnja meja x i,s in zgornja meja x i,z razreda: zgornja meja razreda i-tega razreda enaka spodnji meji (i + 1)-vega razreda: x i,z = x i+1,s Relativna kumulativna frekvenca F i : delež vseh opazovanih enot, ki imajo manjše vrednosti od spodnje meje i-tega razreda: F i = F i N Zvezna spremenljivka: x i,s = x i,min in x i,z = x i,max Celoštevilska spremenljivka(dve zaporedni celi števili se razlikujeta za 1 - enotski razmik): x i,s = x i,min 0, 5 x i,z = x i,max + 0.5 1 Širina razreda d i : razlika med zgornjo in spodnjo mejo razreda d i = x i,z x i,s Sredina razreda x i : aritmetična sredina spodnje in zgornje meje razreda: x i = x i,s + x i,z Z grupiranjem enot v frekvenčne razrede dodelimo vsem enotam v i-tem razredu isto vrednost x i, s čimer izgubimo nekaj natančnosti pri obdelavi podatkov. PRIMER 8 Poraba mleka - nadaljevanje. Za grupirane podatke iz primera o porabi mleka izračunaj fi, f i %, F i, Fi, x i,s, x i,z, d i, x i. Rešitev: Raz. Poraba mleka (l) f i fi f i % F i Fi x i,s x i,z d i x i 1. 0 pod 5. pod 4 13 3. 4 pod 6 16 4. 6 pod 8 9 5. 8 pod 10 7 Skupaj / 50 Excel: grupiranje: FREQUENCY, nato CTRL-SHIFT-ENTER 3 4

PRIMER 9 Starost oseb. V okulistični ambulanti so včeraj pregledali 45 oseb. Njihove starosti v letih so: 33 3 34 37 18 1 36 38 4 7 7 8 9 1 4 5 7 3 15 3 4 16 13 154117198444567386547454831353533 Podatke grupiraj v razrede, kot so oblikovani v tabeli, nato pa za vsak razred izračunaj fi, f i %, F i, Fi, x i,s, x i,z, d i, x i. Rešitev: Raz. Starost f i fi f i % F i Fi x i,s x i,z d i x i 1. 1 10. 11 0 3. 1 30 4. 31 40 5. 41 50 Skupaj / II. Grupiranje opisnih podatkov 5 Za vsak razred lahko določimo le relativno frekvenco in strukturni odstotek vsakega razreda. Razred Lastnost spr. f i fi f i % 1. lastnost 1 f 1 f1 f 1 %. lastnost f f f %.... r. lastnost r f r fr f r % Skupaj / N 1 100 Frekvenčna porazdelitev opisne spremenljivke 7 PRIMER 10 Potniki na vlaku. Na vlaku so želeli ugotoviti strukturo potnikov. Razdelili so jih na dijake, študente, delavce, brezposelne in upokojence. Zbrani podatki so: 6 dijak dijak dijak delavec brezposelen brezposelen brezposelen upokojenec upokojenec dijak dijak dijak dijak dijak dijak dijak študent študent študent študent delavec delavec delavec delavec dijak dijak dijak dijak dijak dijak študent študent študent študent študent študent dijak dijak dijak dijak dijak študent študent študent delavec delavec dijak dijak dijak dijak delavec delavec delavec delavec delavec delavec brezposelen brezposelen brezposelen študent študent študent delavec delavec delavec upokojenec upokojenec brezposelen brezposelen študent študent študent upokojenec upokojenec delavec upokojenec upokojenec študent študent študent študent dijak dijak dijak dijak dijak upokojenec upokojenec upokojenec upokojenec Oblikuj frekvenčno porazdelitev podatkov, nato pa za vsak razred izračunaj fi in f i %. 8

3. GRAFIČNO PRIKAZOVANJE PODATKOV Rešitev: Razred Potniki f i fi f i % 1. dijak. študent 3. delavec 4. brezposelen 5. upokojenec Skupaj / Excel: COUNTIF (pogoj je posamezna kategorija) Histogram je prikaz grupiranih številskih podatkov v pravokotnem koordinatnem sistemu s stolpci, kjer vsak stolpec ustreza enemu razredu. Če so razredi enako široki, so višine stolpcev premosorazmerne s frekvencami razredov, sicer so s frekvencami premosorazmerne ploščine pravokotnikov. Št. družin 18 16 14 1 10 8 6 4 0 5 13 16 0 - - 4 4-6 6-8 8-10 Poraba mleka v l 9 7 9 Excel: Stolpični diagram (zmanjšamo presledke med stolpci, primeren za prikaz zveznih številskih podatkov) 30 Frekvenčni poligon je linijski poligon v pravokotnem koordinatnem sistemu, ki povezuje točke, katerih abscise so enake sredinam frekvenčnih razredov, ordinate pa frekvencam: (x i, f i ). Da grafikon povežemo z abscisno osjo, dodamo še točki (x 0, 0) in (x r+1, 0). Strukturni stolpec uporabljamo za prikaz strukturnih odstotkov. Narišemo stolpec poljubne širine in poljubne višine. Višino stolpca proglasimo za 100 %, nato pa jo razdelimo v razmerju strukturnih odstotkov. Posamezne dele stolpca ponavadi šrafiramo ali pobarvamo z različnimi barvami, zato za pojasnitev dodamo legendo. Št. družin 18 16 14 1 10 8 6 4 0 16 13 9 7 5 0 0 Odstotek 100% 80% 60% 40% upokojenci brezposelni delavci študenti dijaki -1 1 3 5 7 9 11 0% Poraba mleka v l 0% Excel: Črtni diagram (primeren za prikaz vrstnih in številskih podatkov) Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov) 31 3

Tudi strukturni krog uporabljamo za prikaz strukturnih odstotkov. Delež enot v posameznem razredu je prikazan s krožnim izsekom. Velikost središčnega kota za vsak razred izračunamo kot odstotek polnega kota: f i % 360. Tudi strukturni krog opremimo z legendo. Prikaz s stolpci je podoben histogramu, uporabljamo pa ga lahko za prikaz grupiranih opisnih ali številskih podatkov. Širina stolpca je poljubna, višina stolpca pa je premosorazmerna s frekvenco razreda. 35 13,3% 30 8,9% 33,3% dijaki študenti delavci brezposelni upokojenci Število oseb 5 0 15 10 18,9% 5 5,6% 0 dijaki študenti delavci brezposelni upokojenci Excel: Tortni diagram (primeren za prikaz vrstnih in opisnih podatkov) 33 Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov) 34 PRIMER 11 Spodnji grafikon prikazuje zaslužke dijaka preko študentskega servisa v enem letu. Primerjaj zaslužke dijaka po mesecih. PRIMER 1 Spodnji grafikon prikazuje iste zaslužke dijaka preko študentskega servisa v enem letu kot prejšnji grafikon. V čem je razlika? Kaj lahko zdaj povemo o višinah zaslužkov dijaka po mesecih? 35 36

4. SREDNJE VREDNOSTI MEDIANA Srednja vrednost je mera za osredinjenost podatkov. Pove, kje se nahajajo podatki. Obravanali bomo tri srednje vrednosti: mediana modus aritmetična sredina (povprečje) Definicija 6: Mediana (ali središčnica) je srednja vrednost, od katere ima polovica enot manjše ali enake vrednosti, polovica pa večje ali enake. Označili jo bomo z Me. Mediano za majhno število podatkov najhitreje določimo tako, da podatke najprej uredimo po velikosti v ranžirno vrsto, nato izračunamo mesto, na katerem se nahaja mediana: N+1. Če ta vrednost ni celo število, je mediana povprečje sosednjih dveh vrednosti. 37 38 PRIMER 13 Določi mediano zamud avtobusa v petih dneh:,, 6, 7, 10 min. Rezultat komentiraj. PRIMER 14 Določi mediano zamud avtobusa v šestih dneh:,, 6, 7, 10, 15 min. Rezultat komentiraj. Mediana je določena z mestom v ranžirni vrsti, zato ekstremno veliki (ali majhni) podatki ne vplivajo na njeno vrednost. Excel: MEDIAN MODUS Definicija 7: Modus (ali gostiščnica) je srednja vrednost, ki je enaka tisti vrednosti spremenljivke, ki se najpogosteje pojavlja. Označili ga bomo z Mo. PRIMER 15 Določi modus zamud avtobusa v petih dneh:,, 6, 7, 10 min. Rezultat komentiraj. Med podatki je lahko tudi več modusov (tiste vrednosti, ki se enakomnogokrat pojavljajo največkrat). Excel: MODE 39 40

ARITMETIČNA SREDINA Definicija 8: Aritmetična sredina (povprečje) je srednja vrednost, ki jo dobimo tako, da vsoto vseh vrednosti spremenljivke delimo s številom enot v populaciji N. Označili jo bomo z µ ali x: Excel: AVERAGE µ = x 1 + x + + x N N ali µ = ΣN i=1 x i N PRIMER 16 Izračunaj aritmetično sredino zamud avtobusa v petih dneh:,, 6, 7, 10 min. 1 Rezultat komentiraj. Kako bi se spremenila aritmetična sredina, če bi vsakemu podatku prišteli 5 min? 3 Kako bi se spremenila aritmetična sredina, če bi podatek pomnožili s 5? 4 Kolišna bi bila vsota podatkov, če bi vsakega nadomestili z aritmetično sredino? 5 Od vsakega podatka odštej aritmetično sredino. Kolikšna je vsota teh vrednosti? 41 4 Lastnosti aritmetične sredine: Če vsakemu podatku prištejemo isto vrednost a, a > 0, se tudi aritmetična sredina poveča za a. Če vsakemu podatku odštejemo a, se aritmetična sredina zmanjša za a. Če vsak podatek pomnožimo z a, se tudi aritmetična sredina pomnoži z a. Če vsak podatek nadmestimo z aritmetično sredino, ostane vsota podatkov nespremenjena. Če od vsakega podatka odštejemo aritmetično sredino (izračunamo odklon od aritmetične sredine), je vsota vseh odklonov enaka 0. PRIMER 18 V skupini je 5 dijakov. Njihova povprečna starost je 15 let. Kaj lahko sklepamo? 1 Da je največ dijakov starih 15 let. Da so vsi dijaki stari približno 15 let. 3 Da so vsi dijaki stari 15 let. 4 Da je polovica dijakov starih manj kot 15 let, polovica pa več kot 15 let. 5 Da je vsota starosti vseh otrok v skupini 75 let. PRIMER 17 Ali je smiselno izračunati aritmetično sredino spremenljivke spol ali pa spremenljivke kraj bivanja? Odgovor obrazloži. PRIMER 19 Povprečna ocena pisne naloge iz matematike petih dijakov je 3,. Kaj lahko poveš o ocenah pisne naloge posameznih dijakov? 43 44

5. RAZPRŠENOST PODATKOV Razpršenost (ali variabilnost) je lastnost podatkov, da lahko zavzamejo različne vrednosti. Podatki so lahko bolj ali manj razpršeni, kar je videti na sliki: VARIACIJSKI RAZMIK Definicija 9: Variacijski razmik je razlika med največjo in najmanjšo vrednostjo v populaciji. Označimo ga z VR. VR = x max x min Obravnavali bomo naslednje mere za razpršenost: variacijski razmik standardni odklon (standardna deviacija) medčetrtinski razmik PRIMER 0 Izračunaj variacijski razmik zamud avtobusa v petih dneh:,, 6, 7, 10 min. Rezultat komentiraj. Excel: VR = MAX - MIN (izračunamo, ker ni posebnega ukaza) 45 46 STANDARDNI ODKLON Definicija 10: Standardni odklon (ali standardna deviacija) je enaka korenu povprečja kvadratov odklonov vrednosti od aritmetične sredine. Označimo ga s σ: σ = Za uporabo je bolj preprosta formula: Dokaz. σ = Σ N i=1 (x i µ) N Σ N i=1 x i µ N PRIMER 1 Izračunaj standardni odklon zamud avtobusa v petih dneh:,, 6, 7, 10 min. 1 Rezultat komentiraj. Kaj bi se zgodilo s standardnim odklonom, če bi vsem vrednostim prišteli 5 min? 3 Kako bi se spremenil standardni odklon, če bi vsak podatek pomnožili s5? Če vsakemu podatku prištejemo a, se standardni odklon ne spremeni. Če vsak podatek pomnožimo z a, a > 0, se tudi standardni odlklon pomnoži z a. Excel: standardni odklon: STDEVP 47 48

Uporaba žepnega računala Vnos podatkov: vključimo statistiko (na ekranu se izpiše STAT ali S ali SD) vsak podatek posebej vnesemo tako, da ga vtipkamo, nato pa pritisnemo tipko DATA (ali D ali x) Kaj pove standardni odklon? Spoznajmo najprej normalno porazdelitev podatkov: Branje rezultatov: število podatkov: tipka n aritmetična sredina: tipka x standardni odklon: tipka σ n PRIMER S pomočjo žepnega računala izračunaj aritmetično sredino in standardni odklon zamud avtobusa v petih vožnjah:,,6,7,10 min. Rezultata primerjaj s prejšnjima rezultatoma. 49 50 Primeri normalno porazdeljenih podatkov: IQ ljudi teža odraslih ljudi čas, ki ga potrebuje avtobus od Novega mesta do Ljubljane dolžina žebljev pri serijski proizvodnji Splošno: Če je porazdelitev podatkov približno normalna (simetričen histogram), se približno 3 podatkov nahaja na intervalu [µ σ, µ + σ]. ARITMETIČNA SREDINA IN STANDARDNI ODKLON GRUPIRANIH PODATKOV PRIMER 3 Dijaki v T1A, T1B in T1C so pisali pisno nalogo iz matematike. Povprečna ocena dijakov iz T1A je 3,4, povprečna ocena v T1B je 3,, v T1C pa,9. Kolikšna je povprečna ocena dijakov vseh treh razredov? 51 5

Aritmetična sredina (povprečje) grupiranih podatkov (tudi tehtana aritmetična sredina): µ = f 1x 1 + f x + + f r x r N Standardni odklon grupiranih podatkov: σ = Σ r i=1 f ixi µ N ali µ = Σr i=1 f ix i N Pri izračunu si pomagamo z razširjeno frekvenčno porazdelitvijo: razred vrednost f i x i f i x i f i xi 1. x 1,min x 1,max f 1 x 1 f 1 x 1 f 1 x1. x,min x,max f x f x f x..... r. x r,min x r,max f r x r f r x r f r xr Skupaj / N / Σ r i=1 f ix i Σ r i=1 f ixi 53 54 Aritmetična sredina: PRIMER 4 Poraba mleka - nadaljevanje primera. Izračunaj aritmetično sredino in standardni odklon porabe mleka 50 slovenskih družin prejšnji teden v neki vasi. Rezultat obrazloži. Standardni odklon: Obrazložitev rezultata: Rešitev: Frekvenčno tabelo dopolnimo s stolpcema f i x i in f i x i : razred poraba mleka v l f i x i f i x i f i xi 1. 0 pod 5 1. pod 4 13 3 3. 4 pod 6 16 5 4. 6 pod 8 9 7 5. 8 pod 10 7 9 Skupaj / 50 / 55 56

Aritmetična sredina: PRIMER 5 Starost oseb - nadaljevanje primera Izračunaj aritmetično sredino in standardni odklon starosti oseb, ki so bile včeraj pregledane v okulistični ambulanti. Rezultat obrazloži. Standardni odklon: Rešitev: razred starost f i x i f i x i f i xi 1. 1 10 6 5,5. 11 0 8 15,5 3. 1 30 14 5,5 4. 31 40 11 35,5 5. 41 50 6 45,5 Skupaj / 45 / 57 6. KVARTILI IN ŠKATLA Z BRKI Definicija 11: Trije kvartili razdelijo številske podatke v ranžirni vrsti v štiri skupine: prvi kvartil Q 1 je tista vrednost, od katere je 5 % podatov manjših (ali enakih) in 75 % podatkov večjih (ali enakih) - nahaja se na -tem mestu N+1 4 drugi kvartil Q je tista vrednost, od katere je 50 % podatov manjših (ali enakih) in 50 % podatkov večjih (ali enakih) (tudi mediana) - nahaja se na (N+1) 4 -tem mestu tretji kvartil Q 3 je tista vrednost, od katere je 75 % podatov manjših (ali enakih) in 5 % podatkov večjih (ali enakih) - nahaja se na 3(N+1) 4 - tem mestu Če vrednosti N+1 povprečje sosednjih vrednosti. 4, (N+1) 4 in 3(N+1) 4 niso celoštevilske, vzamemo za kvartil 59 58 S pomočjo kvartilov lahko nazorno pokažemo razpršenost podatkov tako, da narišemo škatlo z brki, za katero potrebujemo poleg kvartilov še najmanjšo in največjo vrednost med podatki. Škatlo z brki imenujemo tudi okvir z ročaji ali grafikon kvartilov (ang. box-and-whiskers plot ali box-plot). Definicija 1: Medčertinski razmik Q je razlika med tretjim in prvim kvartilom. (Med Q 1 in Q 3 se nahaja 50 % podatkov.) 60

Rešitev: PRIMER 6 V T1A so dijaki zbrali podatke o številu ur, ki so jih prejšnji teden preživeli za računalnikom. Zbrani podatki so:,, 3, 4, 5, 6, 6, 7, 7, 8, 9, 10, 11, 11, 1, 1, 15, 15, 16, 17, 18, 1, 1, 1,, 4, 5, 8, 30, 30, 34 1 Izračunaj vse tri kvartile in jih obrazloži. Izračunaj medčetrtinski razmik. 3 Nariši škatlo z brki. 61 6 Rešitev: PRIMER 7 Na zdravniškem pregledu so stehtali 17 dijakov manjšega razreda. Njihove teže v kg so: 50, 5, 53, 55, 56, 56, 60, 61, 64, 64, 65, 67, 71, 7, 73, 73, 80 1 Izračunaj vse tri kvartile in jih obrazloži. Izračunaj medčetrtinski razmik. 3 Nariši škatlo z brki. 63 64

PRIMER 8 Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem grafikonu. Kaj lahko sklepaš iz slike? PRIMER 9 Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem grafikonu. Kaj lahko sklepaš iz slike? 65 66 7. POVEZANOST OPISNIH SPREMENLJIVK IN KONTINGENČNA TABELA Definicija 13: Kontingenčna ali dvorazsežna tabela prikazuje podatke po vrednostih dveh opisnih spremenljivk hkrati. PRIMER 30 Z anketo smo želeli raziskati zadovoljstvo srednješolcev s šolsko malico, zato smo anketirali 5 dijakov. Rezultati so zbrani v tabeli: Struktura anketiranih dijakov po zadovoljstvu s šolsko malico za vsak letnik: 1. l. %. l. % 3. l. % 4. l. % Sk. % Zadov. 35 45 35 0 135 Nezadov. 15 15 10 50 90 Skupaj 50 60 45 70 5 Zadovoljstvo/Letnik 1. letnik. letnik 3. letnik 4. letnik Zadovoljen 35 45 35 0 Nezadovoljen 15 15 10 50 Kaj lahko povemo o zadovoljstvu anketiranih dijakov z malico? Ali se mnenja razlikujejo po letnikih? 67 68

8. POVEZANOST ŠTEVILSKIH SPREMENLJIVK Grafični prikaz strukture PRIMER 31 Voznik beleži število kilometrov, ki jih prevozi s svojim avtomobilom, in porabo goriva pri vsaki vožnji. Ugotoviti želi, kako je poraba goriva povezana s številom prevoženih kilometrov. Kateri statistični spremenljivki nastopata v primeru? Ali bo pri različnih vožnjah, ko bo prevozil enako število kilometrov, vedno porabil enako količino goriva? Koliko goriva bo porabil za vožnje, pri katerih bo prevozil manj km, v primerjavi z vožnjami, pri katerih bo prevozil več km? Razmisli, kaj vpliva na porabo goriva. 69 70 Razsevni diagram: Spremenljivka X: število prevoženih kilometrov Spremenljivka Y : količina porabljenega goriva Povezanost med številskima spremenljivkama X in Y imenujemo korelacija. Povezanost spremenljivk lahko prikažemo v pravokotnem koordinatnem sistemu, če eno od spremenljivk proglasimo za neodvisno in drugo za odvisno. Tako dobljeni diagram imenujemo razsevni diagram. Razsevni diagram Excel: Raztreseni (XY) 71 7

Linearna povezanost Spremenljivki X in Y sta povezani linearno, če točke v razsevnem diagramu ležijo na isti premici ali pa se od nje bolj ali manj odklanjajo (ovalna oblika množice točk v razsevnem diagramu). Premico, ki se najbolj prilega točkam, imenujemo regresijska premica. Ločimo pozitivno in negativno linearno povezanost. Pozitivna linearna povezanost: večje vrednosti spremenljivke X so povezane z v povprečju večjimi vrednostmi spremenljivke Y. (regresijska premica je naraščajoča) 73 74 Negativna linearna povezanost: večje vrednosti spremenljivke X so povezane z v povprečju manjšimi vrednostmi spremenljivke Y. (regresijska premica je padajoča) Ni povezanosti 75 76

Rešitev: PRIMER 3 Voznik je za 1 voženj zabeležil število prevoženih kilometrov in porabo goriva v litrih. Rezultati so prikazani v tabeli: Pot (km) 0 35 60 35 65 50 40 5 5 45 10 15 Gorivo (l),5 3,8 6 4 5,5 4 3,5,5 3 4 1,8 a) Nariši razsevni diagram (v zvezek in z Excel ali z Graph). Ali je med spremenljivkama opaziti linearno povezanost? b) Določi enačbo regresijske premice (z Excel ali Graph). Premico vriši v razsevni diagram. c) Koliko goriva bo v povprečju porabil voznik za 4 km? 77 78 PRIMER 33 Poraba električne energije. Dijak je doma 7 tednov beležil tedensko porabo električne energije. Podatki v kwh so zbrani v tabeli: Zap. št. (k) teden kwh 1 1. teden 109. teden 98 3 3. teden 10 4 4. teden 103 5 5. teden 95 6 6. teden 90 7 7. teden 9 a) Nariši linijski diagram (v zvezek in z Excel ali Graph). Katera krivulja bi se prilegala porabi električne energije? b) Določi enačbo te krivulje (z Excel ali Graph). Vriši jo v diagram. c) Kolikšno porabo električne energije lahko pričakujemo 8. teden? 79 80

Rešitev: a) Nelinearna povezanost PRIMER 34 Ali spodnji grafikon prikazuje linearno povezanost spremenljivk? Excel: Črtni grafikon b) Enačba linearnega trenda je y =, 649x + 109. c) Napoved za 8. teden: y =, 649 8 + 109 = 87, 9 kwh. 81 8 PRIMER 35 Ali spodnji grafikon prikazuje linearno povezanost spremenljivk? PRIMER 36 Ali spodnji grafikon prikazuje linearno povezanost spremenljivk? 80 70 700 600 Višina kaktusa (mm) 60 50 40 30 0 10 0 0 1 3 4 5 6 7 8 9 10 Leto Vrednost delnice (EUR) 500 400 300 00 100 0 0 4 6 8 10 1 14 Mesec 83 84