1. OSNOVNI POJMI STATISTIKA. Definicija 2: Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v določenem prostoru in času.

Σχετικά έγγραφα
1. OSNOVNI POJMI STATISTIKA. Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v določenem prostoru in času.

Osnove statistike. Drago Bokal Oddelek za matematiko in računalništvo Fakulteta za naravoslovje in matematiko Univerza v Mariboru. 1.

Šolski center Novo mesto Srednja elektro šola in tehniška gimnazija VAJE IZ STATISTIKE

Kontrolne karte uporabljamo za sprotno spremljanje kakovosti izdelka, ki ga izdelujemo v proizvodnem procesu.

Tretja vaja iz matematike 1

Funkcijske vrste. Matematika 2. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 2. april Gregor Dolinar Matematika 2

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 5. december Gregor Dolinar Matematika 1

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 14. november Gregor Dolinar Matematika 1

Statistična analiza. doc. dr. Mitja Kos, mag. farm. Katedra za socialno farmacijo Univerza v Ljubljani- Fakulteta za farmacijo

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 22. oktober Gregor Dolinar Matematika 1

Diferencialna enačba, v kateri nastopata neznana funkcija in njen odvod v prvi potenci

OSNOVE STATISTIKE. FKKT-kemijski tehnologi 1.letnik Miran Černe

NEPARAMETRIČNI TESTI. pregledovanje tabel hi-kvadrat test. as. dr. Nino RODE

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 12. november Gregor Dolinar Matematika 1

KODE ZA ODKRIVANJE IN ODPRAVLJANJE NAPAK

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 15. oktober Gregor Dolinar Matematika 1

Cilji vaje. Osnovni pojmi. Načini grafičnega prikaza podatkov: Načini numeričnega prikaza podatkov: 2. vaja: OPISNA STATISTIKA OB UPORABI MS EXCEL

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 10. december Gregor Dolinar Matematika 1

Kotne in krožne funkcije

Mojca Rožič, Nikolaj Lipič, Fani Ostrež Voh

IZPIT IZ ANALIZE II Maribor,

PONOVITEV SNOVI ZA 4. TEST

Na pregledni skici napišite/označite ustrezne točke in paraboli. A) 12 B) 8 C) 4 D) 4 E) 8 F) 12

matrike A = [a ij ] m,n αa 11 αa 12 αa 1n αa 21 αa 22 αa 2n αa m1 αa m2 αa mn se števanje po komponentah (matriki morata biti enakih dimenzij):

Booleova algebra. Izjave in Booleove spremenljivke

,..., y T imenujemo časovna vrsta.

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 21. november Gregor Dolinar Matematika 1

PODATKI, FREKVENČNE PORAZDELITVE IN NJIHOV OPIS: MERE SREDNJE VREDNOSTI IN RAZPRŠENOSTI

Delovna točka in napajalna vezja bipolarnih tranzistorjev

Regresija in korelacija

1. Trikotniki hitrosti

D f, Z f. Lastnosti. Linearna funkcija. Definicija Linearna funkcija f : je definirana s predpisom f(x) = kx+n; k,

Splošno o interpolaciji

vezani ekstremi funkcij

Osnove matematične analize 2016/17

Osnove sklepne statistike

Funkcije več spremenljivk

cot x ni def. 3 1 KOTNE FUNKCIJE POLJUBNO VELIKEGA KOTA (A) Merske enote stopinja [ ] radian [rad] 1. Izrazi kot v radianih.

1. Definicijsko območje, zaloga vrednosti. 2. Naraščanje in padanje, ekstremi. 3. Ukrivljenost. 4. Trend na robu definicijskega območja

Statistika II z računalniško analizo podatkov. Bivariatna regresija, tipi povezanosti

DISKRIMINANTNA ANALIZA

Numerično reševanje. diferencialnih enačb II

diferencialne enačbe - nadaljevanje

SKUPNE PORAZDELITVE VEČ SLUČAJNIH SPREMENLJIVK

Kotni funkciji sinus in kosinus

8. Diskretni LTI sistemi

Zbirka vaj iz STATISTIKE. Blejec Andrej

*M * Osnovna in višja raven MATEMATIKA NAVODILA ZA OCENJEVANJE. Sobota, 4. junij 2011 SPOMLADANSKI IZPITNI ROK. Državni izpitni center

Gimnazija Krˇsko. vektorji - naloge

POROČILO. št.: P 1100/ Preskus jeklenih profilov za spuščen strop po točki 5.2 standarda SIST EN 13964:2004

Matematika I (VS) Univerza v Ljubljani, FE. Melita Hajdinjak 2013/14. Pregled elementarnih funkcij. Potenčna funkcija. Korenska funkcija.

Definicija. definiramo skalarni produkt. x i y i. in razdaljo. d(x, y) = x y = < x y, x y > = n (x i y i ) 2. i=1. i=1

Izpeljava Jensenove in Hölderjeve neenakosti ter neenakosti Minkowskega

Vaje: Električni tokovi

S programom SPSS se, glede na število ur, ne bomo ukvarjali. Na izpitu so zastavljena neka vprašanja, zraven pa dobimo računalniški izpis izračunov. T

SEMINARSKA NALOGA Funkciji sin(x) in cos(x)

REˇSITVE. Naloga a. b. c. d Skupaj. FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost 2. kolokvij 23.

Integralni račun. Nedoločeni integral in integracijske metrode. 1. Izračunaj naslednje nedoločene integrale: (a) dx. (b) x 3 +3+x 2 dx, (c) (d)

Frekvenčna analiza neperiodičnih signalov. Analiza signalov prof. France Mihelič

Enačba, v kateri poleg neznane funkcije neodvisnih spremenljivk ter konstant nastopajo tudi njeni odvodi, se imenuje diferencialna enačba.

Univerza v Ljubljani Fakulteta za računalništvo in informatiko MATEMATIKA. Polona Oblak

1.3 Vsota diskretnih slučajnih spremenljivk

V tem poglavju bomo vpeljali pojem determinante matrike, spoznali bomo njene lastnosti in nekaj metod za računanje determinant.

Podobnost matrik. Matematika II (FKKT Kemijsko inženirstvo) Diagonalizacija matrik

Osnove elektrotehnike uvod

Reševanje sistema linearnih

PRIMER UPORABE FUNKCIJ 2. FUNKCIJE ENE SPREMENLJIVKE DEFINICIJA IN LASTNOSTI FUNKCIJE. Upogibni moment. M(X )=F A x qx2 2

13. Jacobijeva metoda za računanje singularnega razcepa

1. Έντυπα αιτήσεων αποζημίωσης Αξίωση αποζημίωσης Έντυπο Πίνακας μεταφράσεων των όρων του εντύπου...

FAKULTETA ZA STROJNIŠTVO Matematika 4 Pisni izpit 22. junij Navodila

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

Kvadratne forme. Poglavje XI. 1 Definicija in osnovne lastnosti

Matematika. Funkcije in enačbe

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * FIZIKA NAVODILA ZA OCENJEVANJE. Petek, 10. junij 2016 SPLOŠNA MATURA

1 Fibonaccijeva stevila

Matematika 1. Gregor Dolinar. 2. januar Fakulteta za elektrotehniko Univerza v Ljubljani. Gregor Dolinar Matematika 1

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * NAVODILA ZA OCENJEVANJE. Sreda, 3. junij 2015 SPLOŠNA MATURA

Statistika 2 z računalniško analizo podatkov. Multipla regresija in polinomski regresijski model

Tabele termodinamskih lastnosti vode in vodne pare

NEPARAMETRIČNI TESTI Doc.dr. Tadeja Kraner Šumenjak

Arjana Žitnik. Rešene naloge iz kolokvijev in izpitov pri predmetu

DISKRETNA FOURIERJEVA TRANSFORMACIJA

numeričkih deskriptivnih mera.

Odvode odvisnih spremenljivk po neodvisni spremenljivki bomo označevali s piko: Sistem navadnih diferencialnih enačb prvega reda ima obliko:

METODE IN TEHNIKE PLANIRANJA

Statistika 2 z računalniško analizo podatkov. Statistično sklepanje

MATEMATIKA 1 UNIVERZITETNI ŠTUDIJSKI PROGRAM BIOKEMIJA 1. LETNIK

Matrike. Poglavje II. Matrika je pravokotna tabela realnih števil. Na primer: , , , 0 1

Spoznajmo sedaj definicijo in nekaj osnovnih primerov zaporedij števil.

Metoda glavnih komponent

KVANTITATIVNE METODE RAZISKOVANJA. Izr. prof. dr. Polona Selič, univ. dipl.psih.

1. UREJENE OBLIKE KVADRATNE FUNKCIJE

Transformator. Delovanje transformatorja I. Delovanje transformatorja II

PRILOGA VI POTRDILO O SKLADNOSTI. (Vzorci vsebine) POTRDILO O SKLADNOSTI ZA VOZILO HOMOLOGIRANEGA TIPA

Afina in projektivna geometrija

Multivariatna analiza variance

INŽENIRSKA MATEMATIKA I

II. LIMITA IN ZVEZNOST FUNKCIJ

Fazni diagram binarne tekočine

Nekateri primeri sklopov izpitnih vprašanj pri predmetu Naključni pojavi

Transcript:

1 OSNOVNI POJMI STATISTIKA Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v določenem prostoru in času Množičen pojav: ocenjevanje dijakov merjenje višin dijakov branje knjig dijakov smučanje v Sloveniji merjenje krvnega tlaka promet skozi določeno križišče mesečne plače zaposlenih serijska proizvodnja določenega izdelka 1 Osnovne naloge statistike: zbiranje podatkov (anketiranje, opazovanje, merjenje, štetje) razvrščanje podatkov, urejanje in grafično prikazovanje podatkov, povzemanje in sprejemanje zaključkev (odkrivanje lastnosti in zakonitosti populacije in napovedovanje vrednosti) Definicija : Populacija je množica, ki jo želimo statistično proučiti Statistična enota je en element populacije Populacijo lahko sestavljajo živa bitja, predmeti, dogodki Opredelitev populacije: stvarno (kdo ali kaj spada v populacijo in kdo ne) geografsko (kje je populacija opazovana) časovno (kdaj je zajeta) 3 4

Definicija 3: Vzorec je podmnožica (del) populacije Vzorec je slučajen, če imajo vse enote populacije enako možnost (enako verjetnost) biti izbrane v vzorec Slučajni vzorec predstavlja (reprezentira) celotno populacijo Enostavno slučajno vzorčenje: žrebanje (loterijski način) vzorci s ponavljanjem (enota, ki je bila že izbrana v vzorec, je ponovno izbrana), vzorci brez ponavljanja (enota, ki je bila že izbrana v vzorec, ne more biti ponovno izbrana) Definicija 4: Preučevano lastnost (značilnost) enote imenujemo statistična spremenljivka Vrednost statistične spremenljivke je lastnost ene opazovane enote in jo imenujemo podatek PRIMER 1 Statistične spremenljivke: višina dijaka, ocena dijaka Definicija 5: Parameter je statistična karakteristika populacije PRIMER Parametri: povprečna višina dijakov, povprečna ocena dijakov Število enot populacije označimo z N 5 6 Glede na način izražanja podatke ločimo na: opisne (ali kvalitativne): vrednosti le opišemo z besedami in jih ne moremo ovrednotiti numerično (npr spol, kraj bivanja, barva avtomobila), vrstne (ali ordinalne): vrednosti lahko uredimo le po velikosti, njihova razmerja pa nimajo pomena (npr šolska ocena, doseženo mesto na tekmi, zadovoljstvo z malico), številske (ali kvantitativne): vrednosti izrazimo numerično oz številsko Ločimo diskretne in zvezne številske podatke Nezvezne (ali diskretne): zaloga vrednosti končna ali neskončna množica realnih števil (npr število prometnih nesreč, št prebranih knjig, št dijakov v razredu) Zvezne: zavzamejo lahko vsako vrednost iz nekega intervala (npr višina ali teža dijaka, višina žepnine, cena knjig) PRIMER 3 V tabeli so zbrani nekateri podatki o podnebju v Sloveniji v letu 007: Zapšt Kraj Pov temp ( C) Pov vlaž (%) Št dni z dežjem 1 Bilje 13,4 71 19 Bovec 10,7 74 3 Letal JPLJ 10,1 80 113 4 Celje 11, 75 130 5 Črnomelj 1 77 14 6 Ilirska Bistr 10,8 76 7 Kočevje 9,7 79 143 8 Kredarica -0,3 77 77 Vir: Statistični urad Republike Slovenije 7 8

Odgovorite na naslednja vprašanja: 1 Kaj je v tem primeru populacija? S katerimi pogoji je opredeljena (stvarno, časovno, krajevno)? Kaj je statistična enota? 3 Katere statistične spremenljivke so predstavljene v tabeli? 4 Kakšna je posamezna spremenljivka glede na način izražanja? 5 Katere parametre populacije bi lahko določili? PRIMER 4 Izvedeti želimo, kakšno je mnenje dijakov na ŠC Novo mesto o malici v šol letu 008/009 Ker je število dijakov okoli 3000, ne moremo vprašati vsakega, zato se odločimo, da bomo oblikovali vzorec velikosti 00 dijakov, ki bo dobro predstavljal celo populacijo Ali bi bil v ta namen ustrezen vzorec, ki bi zajemal prvih 00 dijakov, ki pridejo v torek zjutraj v šolo? 9 10 UREJANJE PODATKOV Kdo zbira podatke? šole bolnišnice podjetja SURS (uradna statistika) EUROSTAT (evropska statistika) EPICENTER, NINAMEDIA (javnomnenjske raziskave) Spoznali bomo: ranžirno vrsto grupiranje podatkov Programski paketi za obdelavo podatkov: Excel, SPSS, SAS, Minitab, Mathlab, S-Plus, 11 1

RANŽIRNA VRSTA Ranžirno vrsto predstavljajo po velikosti urejeni številski podatki Uporabljamo jo za urejanje majhnega števila številskih podatkov Vsakemu podatku določimo zaporedno mesto v ranžirni vrsti, ki ga imenujemo rang Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili različni med seboj PRIMER 5 Število potnikov Na avtobusu, ki vozi vsak dan ob delovnikih ob 1445 iz Novega mesta v Ljubljano, so 1 dni zapored opazovali število potnikov Rezultati so 0, 38, 8, 35, 30, 40,, 3, 35, 3, 45, 35 Zapišite podatke v ranžirno vrsto in jim določite rang Rešitev: št potnikov 0 8 30 3 3 35 35 35 38 40 45 rang 13 14 GRUPIRANJE PODATKOV PRIMER 6 Poraba mleka 50 slovenskih družin v neki vasi smo vprašali, koliko mleka so porabili v prejšnjem tednu Zbrani podatki v litrih so: 1,1 1,7 1 0,5 0,9,1,3,3,6 3,1 3,7 3,9 3,1,5 3,3 3,3 3,9 3,8 4,1 4 4,3 4,4 4,4 5,1 5,9 5,3 5, 5,7 4,7 4,3 4, 4,3 4,7 4, 7,1 7, 7,5 7,5 7,6 6,3 6, 6,1 6,9 8,1 8, 8,5 9,3 9, 9,1 9,8 Grupiranje: združevanje podatkov v skupine (razrede): najprej določimo skupne lastnosti enot v posameznih razredih (od 5 do 0 razredov), enote porazdelimo po razredih, vsaka enota mora biti v natanko enem razredu (ne sme se zgoditi, da bi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšno enoto ne bi obstajal razred, v katerega bi jo uvrstili) Ali so podatki dovolj pregledni, da lahko povemo kaj o porabi mleka? 15 16

I Grupiranje številskih spremenljivk v r razredov: Najmanjša vrednost, ki še sodi v i-ti razred: x i,min Največja vrednost, ki še sodi v i-ti razred: x i,max (Absolutna) frekvenca razreda f i : število enot v i-tem razredu Frekvenčna tabela ali frekvenčna porazdelitev: predstavitev razredov in pripadajočih frekvenc: razred vrednost spr f i 1 x 1,min x 1,max f 1 x,min x,max f r x r,min x r,max f r Σ / N PRIMER 7 Poraba mleka - nadaljevanje Zbrane podatke grupiraj in vsakemu razredu določi frekvenco Frekvenčna porazdelitev številske spremenljivke 17 18 Kaj lahko izračunamo za grupirane podatke? Relativna frekvenca f i : delež enot v i-tem razredu glede na število vseh enot N, ki smo jih opazovali: f i = f i N Strukturni odstotek f i %: relativna frekvenca f i pomnožena s 100 %: f i %=f i 100 % Kumulativna frekvenca F i : število enot, ki imajo manjše vrednosti od spodnje meje i-tega razreda: F 1 = 0inF i = F i 1 + f i 1 (za i > 1) Relativna kumulativna frekvenca F i : delež vseh opazovanih enot, ki imajo manjše vrednosti od spodnje meje i-tega razreda: F i = F i N 19 0

Spodnja meja x i,s in zgornja meja x i,z razreda: zgornja meja razreda i-tega razreda enaka spodnji meji (i + 1)-vega razreda: x i,z = x i+1,s Zvezna spremenljivka: x i,s = x i,min in x i,z = x i,max Celoštevilska spremenljivka(dve zaporedni celi števili se razlikujeta za 1 - enotski razmik): x i,s = x i,min 0, 5 x i,z = x i,max + 05 Širina razreda d i : razlika med zgornjo in spodnjo mejo razreda d i = x i,z x i,s Sredina razreda x i : aritmetična sredina spodnje in zgornje meje razreda: x i = x i,s + x i,z Z grupiranjem enot v frekvenčne razrede dodelimo vsem enotam v i-tem razredu isto vrednost x i, s čimer izgubimo nekaj natančnosti pri obdelavi podatkov 1 PRIMER 8 Poraba mleka - nadaljevanje Za grupirane podatke iz primera o porabi mleka izračunajte fi, f i %, F i, Fi, x i,s, x i,z, d i, x i razred poraba mleka v l f i 1 0 pod 5 pod 4 13 3 4 pod 6 16 4 6 pod 8 9 5 8 pod 10 7 Σ / 50 PRIMER 9 Starost oseb V okulistični ambulanti so včeraj pregledali 45 oseb Njihove starosti v letih so: 33 3 34 37 18 1 36 38 4 7 7 8 9 1 4 5 7 3 15 3 4 16 13 154117198444567386547454831353533 Podatke grupirajte v razrede, nato pa za vsak razred izračunajte fi, f i %, F i, Fi, x i,s, x i,z, d i, x i Excel: grupiranje: FREQUENCY, nato CTRL-SHIFT-ENTER 3 4

II Grupiranje opisnih podatkov Za vsak razred lahko določimo le relativno frekvenco in strukturni odstotek vsakega razreda razred lastnost spr f i fi f i % 1 lastnost 1 f 1 f1 f 1 % lastnost f f f % r lastnost r f r fr f r % Σ / N 1 100 Frekvenčna porazdelitev opisne spremenljivke 3 GRAFIČNO PRIKAZOVANJE PODATKOV 5 Histogram je prikaz grupiranih številskih podatkov v pravokotnem koordinatnem sistemu s stolpci, kjer vsak stolpec ustreza enemu razredu Če so razredi enako široki, so višine stolpcev premosorazmerne s frekvencami razredov PRIMER 10 Potniki na vlaku Na vlaku so želeli ugotoviti strukturo potnikov Razdelili so jih na dijake, študente, delavce, brezposelne in upokojence Zbrani podatki so: dijak dijak dijak delavec brezposelen brezposelen brezposelen upokojenec upokojenec dijak dijak dijak dijak dijak dijak dijak študent študent študent študent delavec delavec delavec delavec dijak dijak dijak dijak dijak dijak študent študent študent študent študent študent dijak dijak dijak dijak dijak študent študent študent delavec delavec dijak dijak dijak dijak delavec delavec delavec delavec delavec delavec brezposelen brezposelen brezposelen študent študent študent delavec delavec delavec upokojenec upokojenec brezposelen brezposelen študent študent študent upokojenec upokojenec delavec upokojenec upokojenec študent študent študent študent dijak dijak dijak dijak dijak upokojenec upokojenec upokojenec upokojenec Oblikujte frekvenčno porazdelitev podatkov, nato pa za vsak razred izračunajte fi in f i % Excel: COUNTIF (pogoj je posamezna kategorija) 6 Frekvenčni poligon je linijski poligon v pravokotnem koordinatnem sistemu, ki povezuje točke, katerih abscise so enake sredinam frekvenčnih razredov, ordinate pa frekvencam: (x i, f i ) Da grafikon povežemo z abscisno osjo, dodamo še točki (x 0, 0) in (x r+1, 0) Št družin 18 16 14 1 10 8 6 4 0 16 13 9 7 5 0 - - 4 4-6 6-8 8-10 Poraba mleka v l Št družin 18 16 14 1 10 8 6 4 0 16 13 9 7 5 0 0-1 1 3 5 7 9 11 Poraba mleka v l Excel: Stolpični diagram (zmanjšamo presledke med stolpci, primeren za prikaz številskih podatkov) 7 Excel: Črtni diagram (primeren za prikaz številskih podatkov) 8

Strukturni stolpec uporabljamo za prikaz strukturnih odstotkov Narišemo stolpec poljubne širine in poljubne višine Višino stolpca proglasimo za 100 %, nato pa jo razdelimo v razmerju strukturnih odstotkov Posamezne dele stolpca ponavadi šrafiramo ali pobarvamo z različnimi barvami, zato za pojasnitev dodamo legendo Tudi strukturni krog uporabljamo za prikaz strukturnih odstotkov Delež enot v posameznem razredu je prikazan s krožnim izsekom Velikost središčnega kota za vsak razred izračunamo kot odstotek polnega kota: f i % 360 Tudi strukturni krog opremimo z legendo 100% 90% 80% 70% 60% 50% 40% 30% 0% 10% 0% 7 9 16 13 5 8-10 6-8 4-6 - 4 0-6 - 8 18% 8-10 14% 0-10% - 4 6% Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov) 4-6 3% 9 Excel: Tortni diagram (primeren za prikaz vrstnih in opisnih podatkov) 30 Prikaz s stolpci je podoben histogramu, uporabljamo pa ga lahko za prikaz grupiranih opisnih ali številskih podatkov Širina stolpca je poljubna, višina stolpca pa je premosorazmerna s frekvenco razreda PRIMER 11 Spodnji grafikon prikazuje zaslužke dijaka preko študentskega servisa v enem letu Primerjajte zaslužke dijaka po mesecih Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov) 31 3

PRIMER 1 Spodnji grafikon prikazuje iste zaslužke dijaka preko študentskega servisa v enem letu kot prejšnji grafikon V čem je razlika? Kaj lahko zdaj povemo o višinah zaslužkov dijaka po mesecih? 4 SREDNJE VREDNOSTI Srednja vrednost je mera za osredinjenost podatkov Pove, kje se nahajajo podatki Obravanali bomo tri srednje vrednosti: mediana modus aritmetična sredina (povprečje) 33 34 MEDIANA Definicija 6: Mediana (ali središčnica) je srednja vrednost, od katere ima polovica enot manjše ali enake vrednosti, polovica pa večje ali enake Označili jo bomo z Me Mediano za majhno število podatkov najhitreje določimo tako, da podatke najprej uredimo po velikosti v ranžirno vrsto, nato izračunamo mesto, na katerem se nahaja mediana: N+1 Če ta vrednost ni celo število, je mediana povprečje sosednjih dveh vrednosti PRIMER 13 Določite mediano zamud avtobusa v petih dneh:,, 6, 7, 10 min Rezultat komentirajte PRIMER 14 Določite mediano zamud avtobusa v šestih dneh:,, 6, 7, 10, 15 min Rezultat komentirajte Mediana je določena z mestom v ranžirni vrsti, zato ekstremno veliki (ali majhni) podatki ne vplivajo na njeno vrednost Excel: MEDIAN 35 36

MODUS Definicija 7: Modus (ali gostiščnica) je srednja vrednost, ki je enaka tisti vrednosti spremenljivke, ki se najpogosteje pojavlja Označili ga bomo z Mo PRIMER 15 Določite modus zamud avtobusa v petih dneh:,, 6, 7, 10 min Rezultat komentirajte Med podatki je lahko tudi več modusov (tiste vrednosti, ki se enakomnogokrat pojavljajo največkrat) Excel: MODE ARITMETIČNA SREDINA Definicija 8: Aritmetična sredina (povprečje) je srednja vrednost, ki jo dobimo tako, da vsoto vseh vrednosti spremenljivke delimo s številom enot v populaciji N Označili jo bomo z µ: Excel: AVERAGE µ = x 1 + x + + x N N ali µ = ΣN i=1 x i N 37 38 PRIMER 16 Izračunajte aritmetično sredino zamud avtobusa v petih dneh:,, 6, 7, 10 min 1 Rezultat komentirajte Kako bi se spremenila aritmetična sredina, če bi vsaki vrednosti prišteli 5 min? 3 Kolišna bi bila vsota podatkov, če bi vsakega nadomestili z aritmetično sredino? 4 Od vsakega podatka odštejte aritmetično sredino Kolikšna je vsota teh vrednosti? Lastnosti aritmetične sredine: Če vsakemu podatku prištejemo isto vrednost a, se tudi aritmetična sredina poveča za a Če vsak podatek nadmestimo z aritmetično sredino, ostane vsota podatkov nespremenjena Če od vsakega podatka odštejemo aritmetično sredino (izračunamo odklon od aritmetične sredine), je vsota vseh odklonov enaka 0 PRIMER 17 Ali je smiselno izračunati aritmetično sredino spremenljivke spol ali pa spremenljivke kraj bivanja? Odgovor obrazloži 39 40

PRIMER 18 V skupini je 5 dijakov Njihova povprečna starost je 15 let Kaj lahko sklepamo? 1 Da je največ dijakov starih 15 let Da so vsi dijaki stari približno 15 let 3 Da so vsi dijaki stari 15 let 4 Da je polovica dijakov starih manj kot 15 let, polovica pa več kot 15 let 5 Da je vsota starosti vseh otrok v skupini 75 let PRIMER 19 Povprečna ocena pisne naloge iz matematike petih dijakov je 3, Kaj lahko poveš o ocenah pisne naloge posameznih dijakov? 5 RAZPRŠENOST PODATKOV Razpršenost (ali variabilnost) je lastnost podatkov, da lahko zavzamejo različne vrednosti Podatki so lahko bolj ali manj razpršeni, kar je videti na sliki: Obravnavali bomo naslednje mere za razpršenost: variacijski razmik standardni odklon (standardna deviacija) medčetrtinski razmik 41 4 VARIACIJSKI RAZMIK Definicija 9: Variacijski razmik je razlika med največjo in najmanjšo vrednostjo v populaciji Označimo ga z VR VR = x max x min PRIMER 0 Izračunajte variacijski razmik zamud avtobusa v petih dneh:,, 6, 7, 10 min Rezultat komentirajte Excel: VR = MAX - MIN (izračunamo, ker ni posebnega ukaza) STANDARDNI ODKLON Definicija 10: Standardni odklon (ali standardna deviacija) je enaka korenu povprečja kvadratov odklonov vrednosti od aritmetične sredine Označimo ga s σ: Σ N i=1 σ = (x i µ) N Za uporabo je bolj preprosta formula: Σ N i=1 σ = x i µ N Dokaz 43 44

PRIMER 1 Izračunaj standardni odklon zamud avtobusa v petih dneh:,,6,7,10 min Rezultat komentiraj Kaj bi se zgodilo s standardnim odklonom, če bi vsem vrednostim prišteli 5 min? Kaj pove standardni odklon? Če je porazdelitev spremenljivke simetrična (lahko pogledamo histogram), se približno 3 vrednosti spremenljivke nahaja na intervalu [µ σ, µ + σ] Excel: standardni odklon: STDEVP ARITMETIČNA SREDINA IN STANDARDNI ODKLON GRUPIRANIH PODATKOV PRIMER Dijaki v T1A, T1B in T1C so pisali pisno nalogo iz matematike Povprečna ocena dijakov iz T1A je 3,4, povprečna ocena v T1B je 3,, v T1C pa,9 Kolikšna je povprečna ocena dijakov vseh treh razredov? 45 46 Aritmetična sredina (povprečje) grupiranih podatkov (tudi tehtana aritmetična sredina): µ = f 1x i + f x + + f r x r N Standardni odklon grupiranih podatkov: Σ r i=1 σ = f ixi µ N ali µ = Σr i=1 f ix i N Pri izračunu si pomagamo z razširjeno frekvenčno porazdelitvijo: razred vrednost f i x i f i x i f i xi 1 x 1,min x 1,max f 1 x 1 f 1 x 1 f 1 x1 x,min x,max f x f x f x r x r,min x r,max f r x r f r x r f r xr Σ / N / Σ r i=1 f ix i Σ r i=1 f ixi 47 48

PRIMER 3 Poraba mleka - nadaljevanje primera Izračunajte aritmetično sredino in standardni odklon porabe mleka 50 slovenskih družin prejšnji teden v neki vasi PRIMER 4 Starost oseb - nadaljevanje primera Izračunajte aritmetično sredino in standardni odklon starosti oseb, ki so bile včeraj pregledane v okulistični ambulanti razred poraba mleka v l f i x i 1 0 pod 5 1 pod 4 13 3 3 4 pod 6 16 5 4 6 pod 8 9 7 5 8 pod 10 7 9 Σ / 50 / razred starost f i x i 1 1 10 6 5,5 11 0 8 15,5 3 1 30 14 5,5 4 31 40 11 35,5 5 41 50 6 45,5 Σ / 45 / 49 6 KVARTILI IN ŠKATLA Z BRKI Definicija 11: Trije kvartili razdelijo številske podatke v ranžirni vrsti v štiri skupine: prvi kvartil Q 1 je tista vrednost, od katere je 5 % podatov manjših (ali enakih) in 75 % podatkov večjih (ali enakih) - nahaja se na -tem mestu N+1 4 drugi kvartil Q je tista vrednost, od katere je 50 % podatov manjših (ali enakih) in 50 % podatkov večjih (ali enakih) (tudi mediana) - nahaja se na (N+1) 4 -tem mestu tretji kvartil Q 3 je tista vrednost, od katere je 75 % podatov manjših (ali enakih) in 5 % podatkov večjih (ali enakih) - nahaja se na 3(N+1) 4 - tem mestu Če vrednosti N+1 povprečje sosednjih vrednosti 4, (N+1) 4 in 3(N+1) 4 niso celoštevilske, vzamemo za kvartil 51 50 S pomočjo kvartilov lahko nazorno pokažemo razpršenost podatkov tako, da narišemo škatlo z brki, za katero potrebujemo poleg kvartilov še najmanjšo in največjo vrednost med podatki Škatlo z brki imenujemo tudi okvir z ročaji ali grafikon kvartilov (ang box-and-whiskers plot ali box-plot) Definicija 1: Medčertinski razmik Q je razlika med tretjim in prvim kvartilom (Med Q 1 in Q 3 se nahaja 50 % podatkov) 5

PRIMER 5 V T1A so dijaki zbrali podatke o številu ur, ki so jih prejšnji teden preživeli za računalnikom Zbrani podatki so:,, 3, 4, 5, 6, 6, 7, 7, 8, 9, 10, 11, 11, 1, 1, 15, 15, 16, 17, 18, 1, 1, 1,, 4, 5, 8, 30, 30, 34 1 Izračunajte vse tri kvartile in jih obrazložite Izračunajte medčetrtinski razmik 3 Narišite škatlo z brki PRIMER 6 Na zdravniškem pregledu so stehtali 17 dijakov manjšega razreda Njihove teže v kg so: 50, 5, 53, 55, 56, 56, 60, 61, 64, 64, 65, 67, 71, 7, 73, 73, 80 1 Izračunajte vse tri kvartile in jih obrazložite Izračunajte medčetrtinski razmik 3 Narišite škatlo z brki 53 54 PRIMER 7 Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem grafikonu Kaj lahko sklepaš iz slike? PRIMER 8 Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem grafikonu Kaj lahko sklepaš iz slike? 55 56

7 KORELACIJA IN REGRESIJA PRIMER 9 Voznik beleži število kilometrov, ki jih prevozi s svojim avtomobilom, in porabo goriva pri vsaki vožnji Ugotoviti želi, kako je poraba goriva povezana s številom prevoženih kilometrov Kateri statistični spremenljivki nastopata v primeru? Ali bo pri različnih vožnjah, ko bo prevozil enako število kilometrov, vedno porabil enako količino goriva? Koliko goriva bo porabil za vožnje, pri katerih bo prevozil manj km, v primerjavi z vožnjami, pri katerih bo prevozil več km? Razmisli, kaj vpliva na porabo goriva Spremenljivka X : število prevoženih kilometrov Spremenljivka Y : količina porabljenega goriva Povezanost med številskima spremenljivkama X in Y imenujemo korelacija Povezanost spremenljivk lahko prikažemo v pravokotnem koordinatnem sistemu, če eno od spremenljivk proglasimo za neodvisno in drugo za odvisno Tako dobljeni diagram imenujemo razsevni diagram 57 58 Razsevni diagram: Spremenljivki X in Y sta povezani linearno, če točke v razsevnem diagramu ležijo na isti premici ali pa se od nje bolj ali manj odklanjajo (ovalna oblika množice točk v razsevnem diagramu) Excel: Raztreseni (XY) Razsevni diagram 59 Premico, ki se najbolj prilega točkam, imenujemo regresijska premica Ločimo pozitivno in negativno linearno povezanost: Pozitivna linearna povezanost: večje vrednosti spremenljivke X so povezane z v povprečju večjimi vrednostmi spremenljivke Y (regresijska premica je naraščajoča) Negativna linearna povezanost: večje vrednosti spremenljivke X so povezane z v povprečju manjšimi vrednostmi spremenljivke Y (regresijska premica je naraščajoča) Excel: Enačba regresijske premice: na grafikonu kliknemo z desnim gumbom miške na eno točko in izberemo Dodaj trendno črto Pod možnostmi izberemo Prikaži enačbo na grafikonu 60

Moč linearne povezanosti kaže Pearsonov koeficient r, katerega vrednosti se nahajajo na intervalu [ 1, 1] Moč linearne povezanosti med spremenljivkama X in Y je lahko: - močna pozitivna, če je 075 r < 1; pozlin povezanost neglin povezanost - srednje močna pozitivna, če je 04 r < 075; - šibka pozitivna, če je 0 r < 04; - ni linearne povezanosti, če r = 0; - šibka negativna, če je 04 < r < 0; - srednje močna negativna, če je 075 < r 04; - močna negativna, če je 1 < r 075 Excel: PEARSON ni lin povezanosti 61 ni povezanosti 6 8 ČASOVNE VRSTE PRIMER 30 Voznik je za 1 voženj zabeležil število prevoženih kilometrov in porabo goriva v litrih Rezultati so prikazani v tabeli: Kilometri 0 35 60 35 65 50 40 5 5 45 10 15 Gorivo,5 3,8 6 4 5,5 4 3,5,5 3 4 1,8 1 Narišite razsevni diagram (v zvezek in z Excel) Izračunajte Pearsonov koeficient korelacije (z Excel) Kakšno povezanost kaže? 3 Določite enačbo regresijske premice (z Excel) Premico vrišite v razsevni diagram 4 Koliko goriva bo v povprečju porabil voznik za 4 km? Mnogi pojavi se spreminjajo s časom Če podatke uredimo glede na trenutek ali obdobje, ki ga opisujejo, dobimo časovno vrsto Analiziranje časovne vrste nam lahko pomaga razumeti spremembe in napovedati vrednosti v prihodnosti Definicija 13: Časovna vrsta je niz istovrstnih podatkov v zaporednih časovnih trenutkih ali v posameznih zaporednih časovnih intervalih Grafični prikaz podatkov: podatke prikažemo z linijskim grafikonom, kjer na vodoravno os nanašamo čas, na navpično os pa vrednosti opazovanih podatkov 63 64

PRIMER 31 Poraba električne energije Dijak je doma 7 tednov beležil tedensko porabo električne energije Podatki so zbrani v tabeli: Zap št (k) teden kwh 1 1 teden 109 teden 98 3 3 teden 10 4 4 teden 103 5 5 teden 95 6 6 teden 90 7 7 teden 9 Podatke prikažite z linijskim grafikonom in izračunajte povprečno tedensko porabo Definicija 14: Linearni trend je premica y = kx + n, ki podaja dolgoročno smer razvoja časovne vrste Njeno enačbo bomo določili s programom Excel V enačbi linearnega trenda je x zaporedna številka obdobja Koeficient k pove, za koliko se spremeni vrednost y, kosex poveča za 1 obdobje Linearni trend bomo vrisali v linijski grafikon s programom Excel S pomočjo trenda lahko izračunamo napoved vrednosti y za vnaprej Opomba: linearni trend je poseben primer regresijke premice Excel: na sliki kliknemo z desnim gumbom miške na eno točko in izberemo Dodaj trendno črto Pod možnostmi izberemo Prikaži enačbo na grafikonu 65 66 PRIMER 33 Spodnji grafikon prikazuje upad vrednosti delnice v zadnjih 18 mesecih Ali je trend upada linearen? PRIMER 3 Za primer porabe električne energije s programom Excel vrišite linearni trend Napovejte, kolikšno porabo električne energije lahko pričakujemo 8 teden 67 68

Kaj lahko še izračunamo za časovno vrsto? Indeks s stalno osnovo I k/0 je v odstotkih izraženo razmerje med podatkom X k v trenutku ali intervalu k in podatkom X 0 vvnaprejizbranem trenutku ali intervalu Indeks s stalno osnovo torej izračunamo po formuli: I k/0 = X k X 0 100 Verižni indeks I k je v odstotkih izraženo razmerje med podatkom X k v trenutku ali intervalu k in podatkom X k 1 v prehodnem trenutku ali intervalu k 1 Verižni indeks izračunamo po formuli: Stopnja rasti S k je v odstotkih izražena razlika med podatkoma X k in X k 1 glede na podatek X k 1 Izračunamo jo po formuli: S k = X k X k 1 X k 1 100 Povprečna stopnja rasti S je stopnja, s katero bi morali zaporedno spreminjati podatke v časovni vrsti, da bi iz podatka v prvem trenutku ali intervalu dobili podatek v zadnjem trenutku ali intervalu Izračunamo jo po formuli: ( ) n 1 Xn S = 100 1 X 1 I k = X k X k 1 100 69 70 Trenutke ali obdobja, podatke ter indekse in stopnje pregledno prikažemo v tabeli: razred (k) obdobje X k I k/0 I k S k 1 X 1 I 1/0 I 1 S 1 X I /0 I S n X n I n/0 I n S n PRIMER 34 Za primer porabe električne energije izračunajte indekse s stalno osnovo glede na prvi teden, verižne indekse, stopnje rasti ter povprečno stopnjo rasti Rešitev: Rezultati so podani v tabeli: Zap št teden kwh I k/1 I k S k 1 1 teden 109 100 / / teden 98 89,9 89,9-10,1 3 3 teden 10 93,6 104,1 4,1 4 4 teden 103 93,6 101,0 1,0 5 5 teden 95 87, 9, -7,8 6 6 teden 90 8,6 94,7-5,3 7 7 teden 9 84,4 10,, Excel: oblikujemo formule za posamezne celice 71 7

Kontingenčna tabela Povprečna stopnja rasti: ( ) ( ) n 1 Xn 6 9 S = 100 1 = 100 X 1 109 1 =, 79 Če bi se poraba električne energije vsak teden zmanjšala za, 79%, biseiz začetne porabe 109 kwh v prvem tednu zmanjšala na 9 kwh v sedmem tednu Definicija 15: Kontingenčna ali dvorazsežna tabela prikazuje podatke po vrednostih dveh opisnih spremenljivk hkrati PRIMER 35 5 dijakov srednje šole smo vprašali o zadovoljstvu s šolsko malico Rezultati so zbrani v tabeli: letnik/zadovoljstvo zadovoljen nezadovoljen 1 letnik 35 15 letnik 45 15 3 letnik 35 10 4 letnik 0 50 Kaj lahko povemo o zadovoljstvu anketiranih dijakov z malico? 73 74 Rešitev: Za boljši pregled nad podatki, dodamo še vrstico skupaj in stolpec skupaj : letnik/zadovoljstvo zadovoljen nezadovoljen skupaj 1 letnik 35 15 50 letnik 45 15 60 3 letnik 35 10 55 4 letnik 0 50 70 skupaj 135 90 5 Struktura anketiranih dijakov po zadovoljstvu s šolsko malico za vsak letnik: letnik/zadovolj zadovoljen % nezadov % skupaj % 1 letnik 35 70,0% 15 30,0 % 50 100 % letnik 45 75,0% 15 5,0 % 60 100% 3 letnik 35 77,8% 10, % 55 100 % 4 letnik 0 8,6% 50 71,4 % 70 100 % skupaj 135 60,0% 90 40,0 % 5 100 % Strukturo prikažite tudi grafično 75 76

Struktura anketiranih dijakov po letnikih za vsako od mnenj o zadovoljstvu s šolsko malico: letnik/zadovolj zadovoljen % nezadov % skupaj % 1 letnik 35 5,9 % 15 16,7 % 50, % letnik 45 33,3 % 15 16,7 % 60 6,7 % 3 letnik 35 5,9 % 10 11,1 % 55 0,0 % 4 letnik 0 14,8 % 50 55,6 % 70 31,1 % skupaj 135 100 % 90 100 % 5 100 % Strukturo prikažite tudi grafično 77 78 PRIMER 36 Odrasle moške in ženske so vprašali, ali imajo vozniški izpit ali ne Podatki so zbrani v spodnji tabeli Oblikujte kontingenčno tabelo Izračunajte strukturo podatkov po spolu in strukturo po imetju vozniškega izpita ter ju prikažite grafično spol moški ženska ženska moški moški ženska ženska moški ženska ženska moški vozniški izpit da da ne ne da da da da ne da ne 79 Nalogo rešite s programom Excel (vrtilna tabela) 80