Anuška Ferligoj, Katja Lozar Manfreda, Aleš Žiberna: OSNOVE STATISTIKE NA PROSOJNICAH

Σχετικά έγγραφα
STATISTIKA Doc.dr. Tadeja Kraner Šumenjak

Numerično reševanje. diferencialnih enačb II

16. Kapacitivnost. =, od koder je

Katarina Košmelj UPORABNA STATISTIKA. Druga dopolnjena izdaja

UNIVERZA V MARIBORU. Fakulteta za kmetijstvo in biosistemske vede. Jože Nemec STATISTIKA OBRAZCI IN TABELE

Funkcijske vrste. Matematika 2. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 2. april Gregor Dolinar Matematika 2

PODATKI, FREKVENČNE PORAZDELITVE IN NJIHOV OPIS: MERE SREDNJE VREDNOSTI IN RAZPRŠENOSTI

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 22. oktober Gregor Dolinar Matematika 1

1. VAJA IZ TRDNOSTI. (linearna algebra - ponovitev, Kroneckerjev δ i j, permutacijski simbol e i jk )

Diferencialna enačba, v kateri nastopata neznana funkcija in njen odvod v prvi potenci

SKUPNE PORAZDELITVE VEČ SLUČAJNIH SPREMENLJIVK

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 5. december Gregor Dolinar Matematika 1

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 14. november Gregor Dolinar Matematika 1

NEPARAMETRIČNI TESTI. pregledovanje tabel hi-kvadrat test. as. dr. Nino RODE

Statistika 2, predavanja,

Tretja vaja iz matematike 1

KAPACITIVNOST(20).doc. 20. Kapacitivnost

KODE ZA ODKRIVANJE IN ODPRAVLJANJE NAPAK

p 1 ENTROPIJSKI ZAKON

Kontrolne karte uporabljamo za sprotno spremljanje kakovosti izdelka, ki ga izdelujemo v proizvodnem procesu.

IZPIT IZ ANALIZE II Maribor,

Metoda najmanjih kvadrata

10. REGRESIJA I KORELACIJA

STATISTIKA 5. predavanje. Doc.dr. Tadeja Kraner Šumenjak

8. Diskretni LTI sistemi

REGRESIJSKA ANALIZA. U razvoju regresijske analize najznačajniju ulogu su imali: Carl Friedrich Gauss ( ) Francis Galton (

SKLEP. Vrednosti eksperimentalni rezultatov so obremenjene z napako. Opisna statistika in kvaliteta procesov in meritev = 1

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 21. november Gregor Dolinar Matematika 1

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 10. december Gregor Dolinar Matematika 1

matrike A = [a ij ] m,n αa 11 αa 12 αa 1n αa 21 αa 22 αa 2n αa m1 αa m2 αa mn se števanje po komponentah (matriki morata biti enakih dimenzij):

Delovna točka in napajalna vezja bipolarnih tranzistorjev

PONOVITEV SNOVI ZA 4. TEST

RAČUNANJE SA PRIBLIŽNIM VREDNOSTIMA BROJEVA

Booleova algebra. Izjave in Booleove spremenljivke

vsota je komutativna, asociativna,skalarno množenje pa distributivno če obstaja tak skalar,da velja a = cb in b = ca, ter če velja da so n

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 12. november Gregor Dolinar Matematika 1

Univerza v Ljubljani Fakulteta za kemijo in kemijsko tehnologijo Katedra za fizikalno kemijo

Statistika II z računalniško analizo podatkov

Prof. dr. sc. Maja Biljan-August Prof. dr. sc. Snježana Pivac Doc. dr. sc. Ana Štambuk 2. IZDANJE. Poglavlje 2.

Vaja 1: Računanje z napakami

Splošno o interpolaciji

PROCESIRANJE SIGNALOV

Polarizacija. Procesi nastajanja polarizirane svjetlosti: a) refleksija b) raspršenje c) dvolom d) dikroizam

FAKULTETA ZA STROJNIŠTVO Matematika 4 Pisni izpit 22. junij Navodila

Gimnazija Krˇsko. vektorji - naloge

Osnove elektrotehnike uvod

Osnove matematične analize 2016/17

2. Pogreški pri merjenju in merilna negotovost

*M * Osnovna in višja raven MATEMATIKA NAVODILA ZA OCENJEVANJE. Sobota, 4. junij 2011 SPOMLADANSKI IZPITNI ROK. Državni izpitni center

pretok toka q t.j. število vozil, na časovno enoto gostota toka k t.j. število vozil na enoto dolžine hitrost toka v

PROCESIRANJE SIGNALOV

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 15. oktober Gregor Dolinar Matematika 1

13. Jacobijeva metoda za računanje singularnega razcepa

Matematika 1. Gregor Dolinar. 2. januar Fakulteta za elektrotehniko Univerza v Ljubljani. Gregor Dolinar Matematika 1

Aritmetički i geometrijski niz

Poglavje 5. Poglavje 5. Poglavje 5. c = 1! SPOMNIMO SE!!! Regulacijski sistemi. Regulacijski sistemi

Multivariabilna logistična regresija s ponovitvijo linearne regresije

Kotne in krožne funkcije

Integralni račun. Nedoločeni integral in integracijske metrode. 1. Izračunaj naslednje nedoločene integrale: (a) dx. (b) x 3 +3+x 2 dx, (c) (d)

Tokovni transformator z elektronskim ojačevalnikom

Definicija. definiramo skalarni produkt. x i y i. in razdaljo. d(x, y) = x y = < x y, x y > = n (x i y i ) 2. i=1. i=1


1. Έντυπα αιτήσεων αποζημίωσης Αξίωση αποζημίωσης Έντυπο Πίνακας μεταφράσεων των όρων του εντύπου...

PRESECI SA PRSLINOM - VELIKI EKSCENTRICITET

1.3 Vsota diskretnih slučajnih spremenljivk

2.5. SKLEPANJA TESTIRANJE HIPOTEZ

ss rt çã r s t Pr r Pós r çã ê t çã st t t ê s 1 t s r s r s r s r q s t r r t çã r str ê t çã r t r r r t r s

Linearna korelacija. Vrijedi: (1) 1 r 1

Na pregledni skici napišite/označite ustrezne točke in paraboli. A) 12 B) 8 C) 4 D) 4 E) 8 F) 12

V tem poglavju bomo vpeljali pojem determinante matrike, spoznali bomo njene lastnosti in nekaj metod za računanje determinant.

vezani ekstremi funkcij

Iterativno reševanje sistemov linearnih enačb. Numerične metode, sistemi linearnih enačb. Numerične metode FE, 2. december 2013

IZZIVI DRUŽINSKE MEDICINE. U no gradivo zbornik seminarjev

Poliedri Ines Pogačar 27. oktober 2009

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000,

1. Definicijsko območje, zaloga vrednosti. 2. Naraščanje in padanje, ekstremi. 3. Ukrivljenost. 4. Trend na robu definicijskega območja

Statistična analiza. doc. dr. Mitja Kos, mag. farm. Katedra za socialno farmacijo Univerza v Ljubljani- Fakulteta za farmacijo

3.2.1 Homogena linearna diferencialna enačba II. reda

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

Vaje: Električni tokovi

Sarò signor io sol. α α. œ œ. œ œ œ œ µ œ œ. > Bass 2. Domenico Micheli. Canzon, ottava stanza. Soprano 1. Soprano 2. Alto 1

Algebraične strukture

P P Ó P. r r t r r r s 1. r r ó t t ó rr r rr r rí st s t s. Pr s t P r s rr. r t r s s s é 3 ñ

A N A L I S I S K U A L I T A S A I R D I K A L I M A N T A N S E L A T A N S E B A G A I B A H A N C A M P U R A N B E T O N

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

ΠΡΙΤΣΙΝΑΔΟΡΟΣ ΛΑΔΙΟΥ ΑΕΡΟΣ ΓΙΑ ΠΡΙΤΣΙΝΙΑ M4/M12 ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ - ΑΝΤΑΛΛΑΚΤΙΚΑ

Ekonometrija 5. Ekonometrija, Osnovne studije. Predavač: Aleksandra Nojković

Vaje iz MATEMATIKE 8. Odvod funkcije., pravimo, da je funkcija f odvedljiva v točki x 0 z odvodom. f (x f(x 0 + h) f(x 0 ) 0 ) := lim

transformacija j y i x x promatramo dva koordinatna sustava S i S sa zajedničkim ishodištem z z Homogene funkcije Ortogonalne transformacije

Univerza v Ljubljani Fakulteta za računalništvo in informatiko MATEMATIKA. Polona Oblak

Osnove sklepne statistike

Obrada empirijskih podataka

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * NAVODILA ZA OCENJEVANJE. Sreda, 3. junij 2015 SPLOŠNA MATURA

!"!# ""$ %%"" %$" &" %" "!'! " #$!

1. Trikotniki hitrosti

TOPNOST, HITROST RAZTAPLJANJA

diferencialne enačbe - nadaljevanje

Podobnost matrik. Matematika II (FKKT Kemijsko inženirstvo) Diagonalizacija matrik

Izpeljava Jensenove in Hölderjeve neenakosti ter neenakosti Minkowskega

INTELIGENTNO UPRAVLJANJE

Transcript:

Auška Ferlgoj, Katja Lozar Mafreda, Aleš Žbera: OSNOVE STATISTIKE NA PROSOJNICAH Študjsko gradvo pr predmetu Statstka. Fakulteta za družbee vede, Uverza v Ljublja Ljubljaa, 0 5 BIVARIATNA ANALIZA 5 BIVARIATNA ANALIZA... 5. UVOD: BIVARIATNA ANALIZA... 5. POVEZANOST ZA NOMINALNI TIP PARA SPREMENLJIVK... 5.. Uredtev podatkov v kotgečo tabelo... 5.. Test povezaost... 5 5..3 Moč povezaost: kotgeč koefcet... 5.3 POVEZANOST ZA ORDINALNI TIP PARA SPREMENLJIVK... 3 5.3. Uredtev podatkov... 3 5.3. Izraču povezaost med dvema ordalma spremeljvkama... 3 5.3.3 Sklepaje z vzorca a populacjo Preverjaje domeve... 5 5.3.4 Kaj stormo, če mamo spremeljvke razlčh merskh lestvc (pr.: eo ordalo eo tervalo al razmerosto spremeljvko)?... 7 5.3.5 Kaj stormo, če so kakše vredost eake?... 8 5.4 POVEZANOST ZA INTERVALNI/RAZMERNOSTNI TIP PARA SPREMENLJIVK... 8 5.4. Leara povezaost dveh tervalh/razmerosth spremeljvk... 8 5.4. Kovaraca Pearsoov koefcet korelacje... 5.4.3 Sklepaje z vzorca a populacjo: test povezaost... 3 5.5 ODVISNOST ZA INTERVALNI/RAZMERNOSTNI TIP PARA SPREMENLJIVK: REGRESIJA... 5 5.5. Regresjska aalza - uvod... 6 5.5. Postopek regresjske aalze... 7 5.5.3 Regresjska premca... 7 5.5.4 Sklepaje z vzorca a populacjo statstčo sklepaje o regresjskem koefcetu... 3 5.5.5 Kvalteta regresjskega modela... 34 5.6 VAJE... 38

5. UVOD: BIVARIATNA ANALIZA Bvarata aalza: aalza dveh spremeljvk. Prmer: Povezaost med števlom ur učeja dosežem števlom točk a zptu. Preverjamo domevo, da so tst, k so se učl več ur, dosegl tud všjo oceo (domeva o Pearsoovem koefcetu korelacje, k mer learo povezaost med spremeljvkama). Povezaost Odvsost Mere povezaost odvsost ločmo glede a tp spremeljvk. Med jm se bomo učl asledjh:. NOMINALNI tp para spremeljvk (ea od spremeljvk je omala): χ, kotgeč koefcet (povezaost).. ORDINALNI tp para spremeljvk (ea spremeljvka je ordala, druga ordala al boljša): Spearmaov koefcet korelacje ragov (povezaost). 3. INTERVALNI/RAZMERNOSTNI tp para spremeljvk (obe spremeljvk sta terval/razmerost): koefcet korelacje (povezaost), regresjsk koefcet (odvsost). 5. POVEZANOST ZA NOMINALNI TIP PARA SPREMENLJIVK 5.. Uredtev podatkov v kotgečo tabelo Prmer: ENOTA: dodplomsk študet eke fakultete v letošjem študjskem letu; VZOREC: slučaj vzorec 00 študetov;. SPREMENLJIVKA: spol;. SPREMENLJIVKA: staovaje v času študja Zama as, al študetke v času študja drugače staujejo kot študet oz. al sta spol staovaje v času študja povezaa. V ta ame podatke študetov pr obeh spremeljvkah uredmo v dvodmezoalo frekvečo porazdeltev. To tabelo meujemo kotgeča tabela. Demo, da so podatk za vzorec ureje v asledj kotgeč tabel:

Tabela: Kotgeča tabela dmezje x3 z vpsam emprčm frekvecam Starš Št. dom Zasebo Skupaj Mošk 6 40 4 80 Žeske 48 36 36 0 Skupaj 64 76 60 00 Števlo študetov moškega spola, k žvjo pr staršh Števlo vseh študetov moškega spola Števlo vseh študetov Robe frekvece Ker as zama, al študetke drugače staujejo v času študja kot študet, moramo porazdeltev staovaja študetk prmerjat s porazdeltvjo študetov. Ker je števlo študetk razlčo od števla študetov, moramo zarad prmerjave zračuat relatve frekvece. Relatve frekvece struktur % po vrstcah (po spolu): Starš Št. dom Zasebo Skupaj Mošk 0 50 30 00 Žeske 40 30 30 00 Skupaj 3 38 30 00 Iterpetacja: 3% vseh študetov žv pr staršh, 38% v študetskem domu 30% zasebo. Med študet moškega spola jh 0% žv pr staršh, 50% v študetskem domu 30% zasebo. Med študetkam jh 40% žv pr staršh, 30% v študetskem domu 30% zasebo. Vdmo lahko, da glede bvaja zasebo med študet študetkam razlk. Prhaja pa do razlk pr drugh dveh tph staovaja: med študet jh več žv v študetskem domu, medtem ko jh med študetkam več žv pr staršh. 3

Relatve frekvece struktur % po stolpch (po staovaju v času študja): Starš Št. dom Zasebo Skupaj Mošk 5 57 40 40 Žeske 75 43 60 60 Skupaj 00 00 00 00 Iterpetacja: Med vsem študet je 40% moškh 60% žesk. Med tstm, k žvjo pr staršh, je 5% moškh 75% žesk. Med tstm, k žvjo v študetskem domu, je 57% moškh 43% žesk. Med tstm, k žvjo zasebo, je 40% moškh 60% žesk. (Nepravlo, ejaso: Pr staršh žv 5% moškh 75% žesk.) Vdmo lahko, da za ta prmer terpretacja po stolpch ajbolj prmera. Na osov teh podatkov b amreč lahko apačo zaključl, da pr zasebkh pogosteje bvajo študetke kot študet. Vedar dejasko med jm razlk je porazdeltev pr tej kategorj popoloma eaka porazdeltv po spolu v celotem vzorcu. Grafč prkaz prmerh strukturh odstotkov (v ašem prmeru po vrstcah) Odstotek zotraj spola 00 % 90 % 80 % 70 % 60 % 50 % 40 % 30 % 0 % 0 % 0 % 30 % 50 % 0 % 30 % 30 % 40 % Zasebo Št. dom Starš Mošk Žeske Iz grafa lahko razberemo, da študetke pogosteje kot študet bvajo pr staršh, medtem ko študet pogosteje bvajo v študetskem domu. Glede bvaja zasebo med jm razlk. 4

5.. Test povezaost Relatv odstotk po spolu (po vrstcah): Starš Št. dom Zasebo Skupaj Mošk 0 50 30 00 Žeske 40 30 30 00 Skupaj 3 38 30 00 Če med spoloma e b blo razlk, b ble v zgorj tabel obe porazdeltv (za moške žeske) eak porazdeltv pod skupaj. Naš prmer kaže, da se odstotk razlkujejo: pr. le 0% študetov kar 40% študetk žv med študjem pr staršh. Odstotk v študetskh domovh pa so ravo obrat. Zasebo pa stauje eak odstotek deklet fatov. Že pregled relatvh frekvec kaže, da sta spremeljvk poveza med seboj. Vprašaje: Al je do povezaost a vzorcu pršlo zato, ker a populacj res obstaja povezaost (res obstaja razlka med spoloma)? Al pa je to zgolj posledca slučaja zbre eot v vzorec? Postopek pr testu o povezaost za omal tp para spremeljvk (χ test) Kotgeča tabela kaže podatke za slučaj vzorec. Zato as zama, al so razlke v porazdeltv tpa staovaja v času študja po spolu statstčo začle (torej obstaja povezaost med spremeljvkama a populacj) e le uček vzorca (torej slučaje). V ta ame postavmo asledj dve domev o povezaost za omal tp para spremeljvk a populacj: H o : Spremeljvk a populacj sta poveza. H : Spremeljvk a populacj sta poveza. Za preverjaje teh domev (oz. čele domeve) a osov vzorčh podatkov, podah v kotgeč tabel (dvo-razsež frekveč porazdeltv), lahko uporabmo χ test (h-kvadrat test, agl. ch square). Ta test slo a prmerjav emprčh (dejaskh) frekvec s frekvecam, kakrše b ble v prmeru epovezaost (teoretče frekvece) (torej, če b bl porazdeltv staovaja v času študja deklet fatov eak). Če se bodo emprče frekvece zadost razlkovale od teoretčh frekvec, bomo sklepal, da a populacj povezaost obstaja. 5

Izraču teoretčh frekvec Emprče frekvece (frekvece z vzorca): Starš Št. dom Zasebo Skupaj Mošk 6 40 4 80 Žeske 48 36 36 0 Skupaj 64 m 76 m 60 m 3 00 Teoretča frekveca za celco j (celca s frekveco a presečšču -te vrstce j-tega stolpca): f m ' j j roba frekveca -te vrstce m j roba frekveca j-tega stolpca skupo števlo eot Teoretče frekvece (zračuae po zgorjem obrazcu za vsako celco): Starš Št. dom Zasebo Skupaj Mošk 5.6 30.4 4 80 Žeske 38.4 45.6 36 0 Skupaj 64 76 60 00 Teoretče frekvece so frekvece, kakrše b dobl, če med spremeljvkama e b blo povezaost. V tem prmeru b ble obe porazdeltv (za moške za žeske ) eak porazdeltv pod skupaj. Torej b ble relatve teoretče frekvece v vseh treh vrstcah eake. Relatve teoretče frekvece: Starš Št. dom Zasebo Skupaj Mošk 3 38 30 00 Žeske 3 38 30 00 Skupaj 3 38 30 00 χ statstka χ statstka, k prmerja emprče (dejaske) teoretče (hpotetče) frekvece, je asledja: 6

χ v s ( f f ') j f j j ' j al krajše k ( f f ') χ f ', kjer je ozaka za -to celco med k celcam kotgeče tabele. χ mer razlke med emprčm teoretčm frekvecam. Ko so emprče frekvece eake al zelo podobe frekvecam, kakrše b ble v prmeru epovezaost (torej teoretčm frekvecam), takrat je χ 0. V tem prmeru lahko zaključmo, da vzorč podatk e kažejo a povezaost med spremeljvkama. Če pa se emprče frekvece razlkujejo od teoretčh frekvec (takrat je χ > 0), potem lahko zaključmo, da vzorč podatk kažejo a povezaost med spremeljvkama. Domev Torej lahko domev zapšemo a asledj ač: H 0 : Spremeljvk sta poveza. χ 0 (V oblk γ γ H.) N razlk med emprčm teoretčm frekvecam. H : Spremeljvk sta poveza. χ >0 So razlke med emprčm teoretčm frekvecam. (Eostrask test.) Izračuajmo ekspermetalo vredost statstke χ za aš prmer. Emprče frekvece f : Starš Št. dom Zasebo Skupaj Mošk 6 40 4 80 Žeske 48 36 36 0 Skupaj 64 76 60 00 Teoretče frekvece f : Starš Št. dom Zasebo Skupaj Mošk 5.6 30.4 4 80 Žeske 38.4 45.6 36 0 Skupaj 64 76 60 00 7

k ( f χ (6 5.6) 5.6 f f ' ' ) (40 30.4) + 30.4 (4 4) + 4 + (48 38.4) 38.4 (36 45.6) + 45.6 (36 36) + 36.05 Preverjaje domeve χ porazdeltev Kdaj je χ zadost večj od 0, da zavremo čelo domevo rečemo, da sta spremeljvk poveza? Določmo krtčo območje. Stattka χ (če jo zračuamo z kotgeče tabele a vseh možh vzorch velkost ) se porazdeljuje po χ porazdeltv. χ porazdeltev: Defraa le za poztve vredost slučaje spremeljvke. Umodala, asmetrča v deso. Odvsa od prostosth stopej. Pr majšem števlu prostosth stopej je bolj asmetrča v deso, z večajem prostosth stopej pa se prblžuje ormal porazdeltv. V prmeru χ testa za preverjaje domeve o povezaost za omal tp para spremeljvk se statstka χ porazdelujejo po χ porazdeltv z m(s-)(v-) prostostm stopjam, pr čemer je s števlo stolpcev, v pa števlo vrstc v kotgeč tabel. Slka: χ porazdeltve pr razlčh prostosth stopjah Gostota 0.0 0. 0.4 0.6 Stopje prostost 4 0 0 5 0 5 0 5 χ 8

Krtčo območje Kako določmo krtčo območje? Iz tabele porazdeltve stadardzrae spremeljvke χ razberemo tsto vredost, k loč α% ekstremh vredost (torej loč α% vzorcev, k so malo verjet, od bolj verjeth vzorcev). Pr tem ščemo vredost χ pr verjetost (-α) prostostm stopjam [(s-)(v-)], pr čemer je s št. stolpcev, v pa števlo vrstc v kotgeč tabel. Na ta ač določmo krtčo območje, t.j. območje zavračaja čele domeve. Poščmo krtčo vredost za aš prmer pr 5% stopj začlost: [( s )( v ) ] χ [(3 )( ) ] χ () 5. 99 χ α 0.05 0.95 Tabela za χ porazdeltev (del tabele): V prmeru povezaost za omal tp para spremeljvk ščemo χ (-α) [(v-)(s-)]. Sklep χ e.05 > χ (-α) 5.99 9

0.5 0.4 0.3 0. 0. 0.0 α 0.95 α 0.05 0 4 5.99 8 0.05 χ 0.95 () Ker ekspermetala vredost pade v krtčo območje, čelo domevo lahko zavremo. Pr 5% stopj začlost lahko zaključmo, da sta spremeljvk statstčo začlo poveza med seboj, torej da se staovaje v času študja po spolu razlkuje. χ e (Izps z stat. programa: sg.004, kar beremo kot p vredost je 0.004, kar je maj ko 0.05 čelo domevo zavremo). Tako velka razlka med emprčm teoretčm frekvecam, merjea s χ statstko, kot smo jo dobl a ašem vzorcu, se lahko zgod le pr maj kot 0.5% vseh vzorch pr domev, da povezaost. Torej lahko zavremo domevo o epovezaost. Poovmo: Postopek pr testu o povezaost za omal tp para spremeljvk. Postavmo domev: H 0 : Spremeljvk sta poveza. χ 0 N razlk med emprčm teoretčm frekvecam. H : Spremeljvk sta poveza. χ >0 So razlke med emprčm teoretčm frekvecam.. Izračuamo teoretče frekvece: ' m j f l 3. Izračuamo ekspermetalo vredost teste statstke: k ( f f ') χ f ' f ', kjer je ozaka za -to celco med k celcam kotgeče tabele. 0

4. Poščemo krtčo vredost χ -α[(s-)(v-)]. 5. Sklep: prmerjamo χ e χ (-α): χ e < χ (-α) H 0 e zavremo. (Spremeljvk sta poveza.) Obrazložtev: Majha razlka med emprčm teoretčm frekvecam, k smo jo dobl a vzorcu, je zelo verjeta v prmeru, da spremeljvk a populacj sta poveza. Sklepamo torej, da spremeljvk sta poveza. χ e > χ (-α) H 0 zavremo ob stopj začlost α, kot pravla am ostae H. (Spremeljvk sta poveza). Obrazložtev: Tako velka razlka med emprčm teoretčm frekvecam, kot smo jo dobl a vzorcu, je zelo malo verjeta (le α% verjetost) v prmeru, da spremeljvk a populacj sta povezaost. Sklepamo torej, da sta spremeljvk poveza. Lastost χ statstke Statstka χ je lahko le poztva (gre amreč za kvadrate razlk med emprčm teoretčm frekvecam). Zato je tud test preverjaja domeve eostrask (H : χ >0 ). Zavzame lahko vredost a tervalu [0, χ max], kjer je χ max(h-), pr čemer je števlo eot v vzorcu ter hm(v,s) (ajmajše števlo zmed števla vrstc stolpcev kotgeče tabele). χ test pove, al a populacj obstaja povezaost med obavavama omalma spremeljvkama. Ne pove pa, kako moča je ta povezaost. χ statstka amreč prmerljva med razlčm kotgečm tabelam, ker je jea vredost odvsa od: a), števla eot v vzorcu, b) števla celc v tabel (števla vredost obravavah spremeljvk). 5..3 Moč povezaost: kotgeč koefcet Ker χ statstka prmerljva med razlčm tabelam, am e podaja formacje o moč povezaost. Sledjo mermo s kotgečm koefcet, k so zpelja z χ ter ormra (majo določe terval možh vredost so zato prmerljv med razlčm tabelam).

Cramerjev α α χ χ max χ ( h ), kjer je h m(v,s). α [0, ] Iterpretramo a asledj ač (za dao skupo eot, pr. vzorec): 0.05 < α < 0.3 šbka povezaost 0.3 < α < 0.6 sredje moča povezaost 0.6 < α < moča povezaost Pearsoov koefcet kotgece C C Pearsoov koefcet kotgece C je defra a tervalu [0, C max ], pr čemer je C max h h, kjer je h m(v,s). Kot tak prmerljv med razlčm tabelam, zato zračuamo popravlje Pearsoov koefcet kotgece C pop : C pop χ χ + C C max C pop [0, ] Iterpretramo a asledj ač (za dao skupo eot, pr. vzorec): 0. < C pop < 0.3 šbka povezaost 0.3 < C pop < 0.6 sredje moča povezaost 0.6 < C pop < moča povezaost Naš prmer: Cramejerev α α χ ( h ).05 00( ) 0.3... šbka povezaost. Popravlje Pearsoov koefcet kotgece C pop : C pop C C max χ χ + h h... sredje moča povezaost..05.05 + 00 0.3

5.3 POVEZANOST ZA ORDINALNI TIP PARA SPREMENLJIVK Prmer Vzemmo slučaj vzorec šesth poklcev ocemo, kolko so odgovor (O) kolko so fzčo apor (N). Poklce ato uredmo od ajmaj odgovorega do ajbolj odgovorega podobo, od ajmaj fzčo aporega do ajbolj aporega. Poklce, k so aše eote aalze, torej uredmo v ražro vrsto jm prpšemo rag (t.j. zaporedo mesto v ražr vrst). Uredtev poklcev po odgovorost: A B C D E F R O 3 4 5 6 ajmaj odgovore poklc ajbolj odgovore poklc Uredtev poklcev po fzč aporost: F D E B C A R N 3 4 5 6 ajmaj apore poklc ajbolj apore poklc 5.3. Uredtev podatkov Podatke zapšemo v tabelo, kjer v prv stolpec vpšemo eote, v drug tretj stolpec pa zaporedo mesto eote v ražr vrst glede a obravava lastost. Obravava spremeljvk sta torej rag glede a odgovorost (R O ) rag glede a fzčo aporost (R N ). Gre za ordal spremeljvk, saj smo eote uredl glede a obravavaa krterja. Poklc R O R N A 6 B 4 C 3 5 D 4 E 5 3 F 6 5.3. Izraču povezaost med dvema ordalma spremeljvkama Ko mamo podatke ustrezo urejee v tabelo, lahko povezaost med dvema ordalma spremeljvkama mermo s Spearmaovm koefcetom korelacje ragov, k mer povezaost med rag obravavah spremeljvk. Izračuamo ga po obrazcu: 3

r s d ( ) 6 Ozake v tem obrazcu pomejo asledje: r s... ozaka za Spearmaov koefcet korelacje ragov, k ga zračuamo a vzorcu d... razlka med ragoma za -to eoto... števlo eot v vzorcu Izraču povezaost za aš prmer: r s Poklc R O R N d d A 6-5 5 B 4-4 C 3 5-4 D 4 4 E 5 3 4 F 6 5 5 Vsota 0 66 d 6 66 ( ) 6( 6 ) 6 0.88 Spearmaov koefcet korelacje ragov lahko zavzame vredost a tervalu [-,]. Pome ključh vredost v tem tervalu je: r s... Popola poztva povezaost (za prmer glej spodaj). Če se z večajem ragov po prv spremeljvk večajo tud rag po drug spremeljvk, gre za poztvo povezaost. Takrat je koefcet poztve blzu. r s -... Popola egatva povezaost (za prmer glej spodaj). Če se z večajem ragov po prv spremeljvk majšajo rag po drug spremeljvk, gre za egatvo povezaost. Takrat je koefcet egatve blzu -. r s 0... N povezaost med spremeljvkama. Če e obstaja obea povezaost med rag po prv rag po drug spremeljvk, takrat je koefcet blzu 0. Ekstreme vredost koefceta korelacje ragov se v praks seveda redko zgodjo. V ašem kokretem prmeru smo dobl koefcet korelacje ragov r s -0.88, kar je blzu -. To pome, 4

da a zbraem vzorcu poklcev obstaja moča egatva povezaost med spremeljvkama: tst poklc, k so bolj odgovor, so v povprečju fzčo maj apor. Prmer: r s... Bolj kot je poklc odgovore, bolj je tud fzčo apore Poklc R O R N A B C 3 3 D 4 4 E 5 5 F 6 6 Prmer: r s -... Bolj kot je poklc odgovore, maj je fzčo apore Poklc R O R N A 6 B 5 C 3 4 D 4 3 E 5 F 6 5.3.3 Sklepaje z vzorca a populacjo Preverjaje domeve Na vzorcu poklcev smo zračual Spearmaov koefcet korelacje ragov, s katerm smo ugotovl, kako moča je povezaost med odgovorostjo fzčo aporostjo teh poklcev a daem vzorcu poklcev. Zama as, al smo takšo povezaost a vzorcu dobl zato, ker a populacj poklcev res obstaja povezaost, torej al lahko posplošmo a vse poklce. Al pa je povezaost a vzorcu le posledca slučaje zbre poklcev v vzorec? Na zastavljeo vprašaje odgovormo tako, da testramo domevo o epovezaost ordalh spremeljvk pr zbra stopj začlost. Postopek testraja domev je občaje, kot ga že pozamo.. Postavmo čelo alteratvo domevo H 0 : ρ s 0 5

Spremeljvk a populacj sta poveza, torej je Spearmaov koefcet korelacje ragov a populacj ρ s eak 0 oz. statstčo začlo razlče od 0. H : ρ s 0 Spremeljvk a populacj sta poveza, torej je Spearmaov koefcet korelacje ragov a populacj ρ s statstčo začlo razlče od 0.. Izberemo ustrezo testo statstko jo zračuamo Testa statstka, s katero preverjamo domevo o povezaost dveh ordalh spremeljvk, je statstka t, k se porazdeljuje prblžo po (am že poza) Studetov t porazdeltv z ( - ) prostostm stopjam. Porazdeltev teste statstke je torej odvsa od števla eot v vzorcu (števlo eot v vzorcu ). Testo statstko t, k je stadardzra koefcet korelacje ragov, zračuamo po asledjem obrazcu: t r s r s Ozake v tem obrazcu pomejo asledje: r s... Spearmaov koefcet korelacje ragov, zraču a vzorcu... števlo eot v vzorcu Za aš prmer je zraču ekspermetale vredost teste statstke t asledj: t r s r s 0.88 6 ( 0.88) 3.7 3. Določmo krtčo vredost teste statstke pr zbra stopj začlost Za aš prmer zračuamo vredost teste statstke pr 5% stopj začlost. Ker gre za dvostrask test, ščemo dve krtč vredost, k sta po absolut vredost eak. Iščemo torej ±t α/ ( - ). Za aš kokrete prmer z tabele Studetove porazdeltve razberemo ustrezo vredost ±t α/ ( - ) ±t 0.05/ (6 - ) ±t 0.05 (4) ±.776. Spearmaov koefcet korelacje ragov a populacj ozačujemo z grško črko ρ s (zgovarjamo "ro") z deksom "s". Na vzorcu smo ga ozačl r s. V tem prmeru mamo dvostrask test. Lahko b testral tud domevo, da je koefcet statstčo začlo večj al majš od 0 (ρ s > 0 oz. ρ s < 0), torej b uporabl eostrask test. 6

4. Sklep: prmerjava krtče ekspermetale vredost teste statstke t t e -3.7 t 0.05 (4) ±.776 t e > t α/ Ekspermetala vredost pade v krtčo območje, torej v območje zavračaja čele domeve (ekspermetala vredost je po absolut vredost večja od krtče vredost). Zavremo čelo domevo s 5% stopjo začlost ugotavljamo, da sta a populacj spremeljvk egatvo poveza med seboj. Za vse poklce lahko posplošmo, da so tst poklc, k so bolj odgovor, maj fzčo apor. 5.3.4 Kaj stormo, če mamo spremeljvke razlčh merskh lestvc (pr.: eo ordalo eo tervalo al razmerosto spremeljvko)? V tem prmeru spremeljvko, k ma boljšo mersko lestvco, obravavamo, kot da ma tako mersko lestvco, kot spremeljvka s slabšo mersko lestvco. Če b preverjal domevo o povezaost med omalo ordalo spremeljvko, b obe obravaval kot omal torej uporabl χ test. Če pa mamo eo ordalo eo tervalo al razmerosto spremeljvko, tak par spremeljvk obravavamo kot ordal tp para spremeljvk. Pred aalzo pa moramo eotam glede a vredost tervale/razmeroste spremeljvke prpsat rag ta rag obravavat kot ordalo spremeljvko. Npr. ugotovt želmo, al so poklc, k so bolj odgovor, tud bolje plača. Poleg že zah podatkov o odgovorost vzorca šesth poklcev mamo še podatek o povprečem mesečem osebem dohodku za ta vzorec poklcev. Poklce uredmo v ražro vrsto glede a velkost povprečega mesečega osebega dohodka, pr. od tstega z ajmajšm do tstega z ajvečjm povprečm osebm dohodkom. Poklcem ato prpšemo ustrez rag za spremeljvko R D (rag glede a dohodek). Poklc Dohodek R D A 800 C 000 B 500 3 D 800 4 F 000 5 E 500 6 7

Spremeljvk (rag glede a fzčo odgovorost rag glede a dohodek) uredmo v ustrezo tabelo. Nato adaljujemo s postopkom, kot je opsao zgoraj. Poklc R O R D A B 3 C 3 D 4 4 E 5 6 F 6 5 5.3.5 Kaj stormo, če so kakše vredost eake? Včash se zgod, da mata dve al več eot glede a obravavao ordalo spremeljvko eake vredost. V tem prmeru je potrebo zračuat povpreče prpadajoče rage. Npr. v vzorcu 8 poklcev so poklc A, B C ajmaj eako odgovor. Po odgovorost sled poklc D, ato E, ato pa F G, k sta spet eako odgovora. Najbolj odgovore pa je poklc H. Poklcem, k so eako odgovor, je potrebo prpsat eak rag, scer povpreč rag med sceršjm zaporedm števlkam v ražr vrst. Nato adaljujemo s postopkom, kot je opsao zgoraj. A B C < D < E < F G < H Napačo R O 3 4 5 6 7 8 Pravlo R O 4 5 6.5 6.5 8 kot povprečje (++3)/3 6.5 kot povprečje (6+7)/6.5 5.4 POVEZANOST ZA INTERVALNI/RAZMERNOSTNI TIP PARA SPREMENLJIVK 5.4. Leara povezaost dveh tervalh/razmerosth spremeljvk Vzemmo prmer dveh razmerosth spremeljvk: zobrazba (števlo przah let šole) števlo ur braja devh časopsov a tede 8

Podatk za 8 slučajo zbrah oseb so: 0 3 8 4 6 7 8 3 6 4 8 3 4 Grafčo lahko poazormo povezaost med dvema tervalma/razmerostma spremeljvkama z razsevm grafkoom. To je graf, v katerem v koordat sstem, kjer koordat predstavljata spremeljvk, vršemo eote s par vredost obeh spremeljvk. V ašem prmeru je razsev grafko: števlo ur braja devh časopsov a tede 7 6 5 4 3 0 eota (0, 3) 0 5 0 5 zobrazba (števlo przah let šole) Iz razsevega grafkoa lahko razberemo tpe povezaost med spremeljvkama: fukcjska povezaost: vse točke ležjo a krvulj; korelacjska (stohastča) povezaost: točke se od krvulje bolj al maj odklajajo (večja al majša povezaost). 9

Fukcjaska povezaost Korelacjska povezaost Zelo pogosta je leara povezaost med dvema spremeljvkama (točke se gostjo okol premce leare fukcje). Tpč prmer leare povezaost spremeljvk: Šbka poztva leara povezaost Sredje moča poztva leara povezaost Moča egatva leara povezaost N leare povezaost 0

Moža je tud eleara povezaost med spremeljvkama. Prmer eleare povezaost: Npr. za avtomoble: povezaost med starostjo avtomobla vredostjo avtomobla. 5.4. Kovaraca Pearsoov koefcet korelacje Povezaost za terval/razmerost tp para spremeljvk lahko mermo s kovaraco, k mer learo povezaost med spremeljvkama. C N Populacja N ( x µ )( y µ ) C Vzorec ( x )( y ) (x -µ )... Razlka (razdalja) med vredostjo spremeljvke za -to eoto artmetčo sredo spremeljvke (odklo eote od povprečja za ). (y -µ )... Razlka (razdalja) med vredostjo spremeljvke za -to eoto artmetčo sredo spremeljvke (odklo eote od povprečja za ). Iterpretramo: C > 0 poztva leara povezaost C 0 leare povezaost C < 0 egatva leara povezaost

Prmer leare (e)povezaost kovaraca: C > 0 C < 0 C 0 Ker kovaraca prmerljva, račuamo Pearsoov koefcet korelacje kot mero leare povezaost med dvema tervalma/razmerostma spremeljvkama. ρ C σ σ N ( x µ )( y N N ( x µ ) µ ) ( y µ ) Koefcet korelacje lahko zavzame vredost v tervalu [-, ]. ρ > 0 oz. blzu Poztva leara povezaost - če se z večajem vredost prve spremeljvke večajo vredost tud druge spremeljvke. ρ < 0 oz. blzu - Negatva leara povezaost - če se z večajem vredost prve spremeljvke vredost druge spremeljvke majšajo. ρ ~ 0 (blzu 0) Ne gre t za poztvo, t za egatvo learo povezaost, spremeljvk sta learo poveza.

Prmer leare (e)povezaost koefcet korelacje: ρ ρ +0.8 ρ +0. ρ ρ 0.5 ρ 0 5.4.3 Sklepaje z vzorca a populacjo: test povezaost Če mamo podatke za vzorec, zračuamo vzorč koefcet korelacje (terpretramo ga a eak ač kot za populacjo): r C s s ( x )( y ( x ) ) ( y ) Na osov vzorčega koefceta korelacje želmo ocet, al obstaja povezaost a populacj al pa je jegova vredost zgolj posledca slučaja zbre eot v vzorec. Statstčo sklepaje o korelacjsk povezaost test o povezaost za terval/razmerost tp para spremeljvk Postavmo čelo alteratvo domevo: H 0 : ρ 0 Na populacj spremeljvk sta learo poveza. H : ρ 0 Na populacj sta spremeljvk learo poveza. 3

(Alteratva domeva je lahko tud: H : ρ > 0 Na populacj sta spremeljvk poztvo learo poveza. H : ρ < 0 Na populacj sta spremeljvk egatvo learo poveza.) Testa statstka (stadardzra vzorč koefcet korelacje), s katero testramo domevo, je r t r Testa statstka se porazdeluje po Studetov t porazdeltv z m(-) prostostm stopjam. Prmer Prevermo domevo, da sta zobrazba (merjea s števlom przah let šole) števlo ur braja devh časopsov a tede povezaa med seboj pr 5% stopj začlost.. Izračuamo vzorč koefcet korelacje. x y x - y - (x -) (y -) (x -) (y -) 0 3 0 4 0 0 8 4 0 0 0 6 7 8 4 64 6 3 8 3 0 0 0 0 0 6 - - 4 4 4 4-4 - 6 4 8 3 0 0 0 0 0 4-4 - 6 4 8 64 4 0 0 04 6 48 x 64 8 y 8 4 3 8 r ( x )( y ( x ) 48 0.9 04 6 ) ( y ) 8 ( x 8)( y 8 8 ( x 8) 3) ( y 3) Pearsoov koefcet korelacje a vzorcu je velk (blzu ) poztve, torej a vzorcu obstaja moča poztva povezaost med spremeljvkama. Tste osebe, k majo več przah let šole, tud pogosteje berejo deve časopse. Al se je povezaost a vzorcu zgodla, ker dejasko a populacj obstaja povezaost med spremeljvkama, al pa je to zgolj slučaj? 4

. Postavmo čelo alteratvo domevo. H 0 : ρ 0 H : ρ 0 Na populacj spremeljvk sta learo poveza. (Izobrazba pogostost braja devh časopsov sta learo povezaa.) Na populacj sta spremeljvk learo poveza. (Izobrazba pogostost braja devh časopsov sta learo povezaa). 3. Izračuamo ekspermetalo vredost teste statstke. t e r r 0.9 8 0.9 5.75 4. Določmo krtčo območje. Ker gre za dvostrask test, je krtčo območje določeo s krtčma vredostma: 5. Sklep. ± t α/ (-)± t 0.05/ (8-)± t 0.05 (6) ±.45 α 0.05 α 0.05-4 -3 -.45-0.45 3 4 t α t α t e 5.75 t 5.75 >.45 oz. t e > t α/ H 0 zavremo, spremeljvk sta learo poveza. Ob 5% stopj začlost ugotavljamo, da sta zobrazba števlo ur braja devh časopsov a tede a populacj statstčo začlo poveza med seboj. (Izps z stat. programa: p.00, kar je P(t > 5.75)+P(t < -5.75). Ker je p majš od 0.05, H 0 zavremo. Verjetost, da dobmo a vzorcu koefcet korelacje po absolut vredost 0.9 al več oz. t-statstko po absolut vredost 5.75 al več, ob predpostavk, da a populacj leare povezaost, je zgolj 0.%. Zato podvommo v pravlost čele domeve o epovezaost.) 5.5 ODVISNOST ZA INTERVALNI/RAZMERNOSTNI TIP PARA SPREMENLJIVK: REGRESIJA Povezaost Odvsost Za terval/razmerost tp para spremeljvk merlo lahko:. povezaost s Pearsoovm koefcetom korelacje,. odvsost: z regresjsko aalzo. 5

5.5. Regresjska aalza - uvod Problem regresjske aalze: Kako med točke v razsevem grafkou vrsat krvuljo (pr. premco), da bo ajbolje poazarjala odvsost med spremeljvkama? Šbka poztva leara povezaost Sredje moča poztva leara povezaost Moča egatva leara povezaost N leare povezaost Regresjska aalza metoda za aalzo odvsost med tervalm/razmerostm spremeljvkam. Natačeje, metoda za pojasjevaje apovedovaje vredost odvsh spremeljvk s pomočjo vredost eodvsh spremeljvk. Tp regresjske aalze glede a števlo spremeljvk: - Bvarata regresja: ea eodvsa, ea odvsa spremeljvka. - Multpla regresja: več eodvsh, ea odvsa spremeljvka. Tp regresjske aalze glede a oblko regresjske fukcje (odvsost): - Leara regresja: regresjska fukcja je leara. - Neleara regresja: regresjska fukcja leara. V okvru predmeta Statstka bomo obravaval bvarato learo regresjo. 6

5.5. Postopek regresjske aalze. S pregledom grafče predstavtve odosa med dvema spremeljvkama v razsevem grafkou ugotovmo, al se med spremeljvkama akazuje leara povezaost.. Če lahko spremeljvk vsebsko deframo kot odvso () eodvso () spremeljvko, je smselo zračuat regresjsko premco. S premco bomo pojasl odvsost odvse spremeljvke od eodvse spremeljvke. Če mamo vzorec, pr tem preverjamo tud statstčo začlost regresjskega koefceta, k astopa v regresjsk premc. 3. S pomočjo premce lahko tud apovedujemo vredost odvse spremeljvke s pomočjo vredost eodvse spremeljvke. 4. Kakovost pojasjevaja odvsost ocemo z determacjskm koefcetom, kakovost apovedovaja vredost pa s stadardo apako ocee. 5.5.3 Regresjska premca Kako določmo learo regresjsko fukcjo regresjsko premco? Grafčo: Regresjska premca je med točke v razsevem grafkou postavljea tako, da so odklo točk od premce čmmajš. Na ta ač ajbolje poazarja odvsost med spremeljvkama. Matematčo: Regresjska premca je določea z metodo ajmajšh kvadratov, pr kater ščemo takše vredost apovedae odvse spremeljvke (točke a premc), da bodo kvadrat odkloov pravh vredost (dejaskh točk) od teh apovedah vredost (točk a premc) čmmajš. Defrajmo... Regresjska fukcja f() kaže, kakše b bl vplv spremeljvke a, če raze vplva spremeljvke e b blo drugh vplvov a spremeljvko. Ker pa so poavad še drug vplv a proučevao spremeljvko, se točke, k predstavljajo eote v razsevem grafkou, odklajajo od deale krvulje + E f() + E kjer meujemo eodvsa spremeljvka, odvsa spremeljvka E čle apake (al motja, dsturbaca). 7

Če je regresjska fukcja leara, zapšemo: f() a + b V tem prmeru je regresjska odvsost: + E a + b + E oz. za -to eoto y y + e a + bx + e Regresjsko odvsost s lahko azoro predstavmo v razsevem grafkou. y e y y y (x, y ) a +b x Leara regresjska fukcja je le ea od možh regresjskh fukcj. Scer pa regresjsko fukcjo lahko v splošem zapšemo f(, a, b,...) kjer so a, b,... parametr fukcje. Poavad se moramo a osov pregleda razsevega grafkoa odločt za tp regresjske fukcje ato ocet parametre fukcje, tako da se regresjska krvulja kar se da dobro prlega točkam v razsevem grafkou. Kot merlo prlagojeost krvulje točkam vzamemo N N e ( y ' y ) m e y -y... razlka med dejasko vredostjo y vredostjo y, apovedao z regresjsko fukcjo (pr. premco) odklo točke od krvulje (pr. premce) (apaka, rezdual). To metodo ocejevaja parametrov regresjske fukcje meujemo metoda ajmajšh kvadratov. Želmo amreč, da je krvulja (fukcja) postavljea tako, da so kvadrat odkloov točk od premce čm majš. 8

Ocejevaje parametrov leare regresjske fukcje leara regresja f(, a, b,...)... kakršakol fukcja (krvulja) a+b... prmer regresjske fukcje leara fukcja (krvulja je premca) leara regresjska fukcja V prmeru leare regresjske fukcje lahko ocemo parametra a b po metod ajmajšh kvadratov takole: F N e Mmum fukcje F lahko določmo tako, da parcalo odvajamo po obeh parametrh Dobmo sstem dveh learh eačb, z katerh lahko zračuamo ezaa parametra a b: C C a µ µ b σ σ Če zračuaa parametra a b vstavmo v regresjsko fukcjo a + b, dobmo To fukcjo meujemo tud prva regresjska fukcja. N F a ' ( y y ) N F 0 ; 0 b ( y a bx ) ' C µ + ( µ ) σ m Podobo b lahko ocel learo regresjsko fukcjo, kjer je odvsa eodvsa spremeljvka: a* + b* Če z metodo ajmajšh kvadratov podobo ocemo parametra a* b*, dobmo ' C µ + ( µ ) σ To fukcjo meujemo druga regresjska fukcja. Za vsak par spremeljvk je mogoče zračuat obe regresjsk fukcj, le ea od jh pa je občajo vsebsko smsela. C ' µ + ( µ ) σ... odvsa spremeljvka... eodvsa spremeljvka µ... artmetča sreda odvse spremeljvke µ... artmetča sreda eodvse spremeljvke σ... varaca eodvse spremeljvke C... kovaraca med spremeljvkama 9

Izraču regresjske premce, če mamo podatke za populacjo: C ' µ + ( µ ) σ Izraču regresjske premce, če mamo podatke za vzorec: ' C + ( ), kjer sta s s ( x ) C ( x )( y ) Lahko pa eako zapšemo/zračuamo tud takole (če mamo podatke za vzorec): ' a + b C b s, a b Prmer Vzemmo prmer 8 oseb, k smo ga obravaval v poglavju o povezaost dveh tervalh/razmerosth spremeljvk. Spremeljvk sta bl: zobrazba (števlo przah let šole) števlo ur braja devh časopsov a tede Spommo se podatkov za teh 8 slučajo zbrah oseb: 0 3 8 4 6 7 8 3 6 4 8 3 4 Zaje zračuajmo obe regresjsk premc ju vršmo v razsev grafko. Ko smo račual koefcet korelacje, smo že zračual artmetč sred: x 64 8 y 4 3 8 8 Izračual smo tud vsot kvadratov odkloov od artmetče srede za obe spremeljvk: ( x ) 04, vsoto produktov odkloov od obeh artmetčh sred: ( x )( y ) 48 ( y ) 6, 30

Prva regresjska premca je potem: ' C + s Druga regresjska premca pa je: ( ) + ( x )( y ) ( ) ( x ) 48 3 + ( 8) 0.68 + 0.46 04 ' C + s ( ) + 48 8 + ( 3).46 +.85 6 ( x )( y ) ( ) ( y ) Obe regresjsk premc lahko vršemo v razsev grafko prevermo, če se res ajbolje prlegata točkam v grafkou. Vsebsko smsela je v tem prmeru prva regresjska premca, k prkazuje odvsost števla ur braja devh časopsov a tede (odvsa spremeljvka ) od števla przah let šolaja (eodvsa spremeljvka ). števlo ur braja devh časopsov a tede 7 6 5 4 3 0.46 +.85 0.68 + 0.46 0 5 8 0 5 zobrazba (števlo przah let šole) Regresjsk premc se sekata v točk (, ), (8, 3), določe z artmetčma sredama spremeljvk. Kaj je razvdo z regresjske premce? a+b Odos med je odvse od dveh parametrov: a... določa, kje regresjska premca seka ordato, a (0), torej ma vredost a, ko ma vredost 0. b... določa aklo premce (poztva al egatva povezaost moč povezaost) 3

b meujemo REGRESIJSKI KOEFICIENT. Pove, za kolko se spreme vredost, če se spreme za eo eoto. Če je b0, potem odvsa od (spremeljvka je kostata, za katerokol vredost spremeljvke ma sto vredost, t.j. a). S pomočjo regresjske premce lahko apovedujemo vredost odvse spremeljvke: zračuamo vredost spremeljvke pr da vredost spremeljvke. (x )y a+bx Prmer Prmer 8 oseb, za katere mamo podatek o zobrazb (števlo przah let šole) - števlu ur braja devh časopsov a tede. Izračual smo regresjsko premco ' -0.68 + 0.46, k pojasjuje, kako je števlo ur braja devh časopsov (odvsa spremeljvka ) odvso od zobrazbe (eodvsa spremeljvka ). Kaj lahko razberemo z te regresjske premce? Napovejmo vredost, pr. 0-0.68 + 0.46*0 3.9. Če b bla pogostost braja devh časopsov a tede odvsa le od zobrazbe obeega drugega dejavka, potem b za osebo, k ma 0 let šolaja, apovedal, da bere deve časopse prblžo 4 ure a tede. b 0.46... Poztva odvsost: tst, k majo več let šolaja, tud pogosteje berejo deve časopse. Za vsako dodato leto šolaje se števlo ur braja poveča za 0.46 ure. Npr. 0 3.9, 4.38, razlka med jma je ravo 0.46 ure. (a -0.68... Pomelo b, kolko ur tedesko berejo deve časopse osebe, k majo obeega przaega leta šole. V tem prmeru vsebsko esmselo.) 5.5.4 Sklepaje z vzorca a populacjo statstčo sklepaje o regresjskem koefcetu Na vzorcu smo odvsost spremeljvke od spremeljvke opsal z learo fukcjo a+ b (regresjska premca a vzorcu). Zama as, kakša odvsost med spremeljvkama velja za populacjo, torej kakša je α + β (regresjska premca a populacj). b β regresjsk koefcet a vzorcu regresjsk koefcet a populacj Testramo domevo o regresjskem koefcetu, ajpogosteje domevo, da je β 0, torej da odvse od. 3

Testraje domeve o regresjskem koefcetu β Postavmo domev: H 0 : β β H H : β β H Neprstraska celka za populacjsk regresjsk koefcet β je vzorč regresjsk koefcet: C b s Če ga zračuamo a vseh možh vzorch, se porazdeljuje po Studetov t porazdeltv z m (-) prostostm stopjam sy r E( b) β SE( b) s Testa statstka (stadardzra vzorč regresjsk koefcet) je tedaj x b β H sx t SE( b) s r y ( b β ) H Prmer Prmer 8 oseb, za katere mamo podatek o zobrazb (števlo przah let šole) - števlu ur braja devh časopsov a tede. Za ta vzorec smo z regresjsko premco zračual odvsost števla ur braja devh časopsov od zobrazbe: ' -0.68 + 0.46 Prevermo domevo, da je regresjsk koefcet razlče od 0 pr 5% stopj začlost. Prevermo torej domevo, da a populacj res vplva a (da zobrazba vplva a braje devh časopsov).. Postavmo čelo alteratvo domevo: H 0 : β 0 e vplva a. Izobrazba e vplva a pogostost braja. H : β 0 vplva a. Izobrazba vplva a pogostost braja.. Ker gre za dvostrask test, je ob 5% stopj začlost krtčo območje določeo s krtčma vredostma: ±t α/ (-) ±t 0.05/ (8-) ±t 0.05 (6) ±.45 3. Ekspermetala vredost teste statstke je: sx te ( b β H ) s r ) 04 (8 ) (0.46 0) 5.75 6 ( 0.9 ) 4. Sklep: 5.75 >.45 oz. t e > t α/, H 0 zavremo, je odvsa od. ( x ( b β ) r H y ( y ) α 0.05 α 0.05-4 -3 -.45-0.45 3 4 t α t α t e 5.75 t 33

(Izps z stat. programa, p <.00, kar je P(t > 5.75) + P(t < -5.75). Ker je majše od 0.05, H0 zavremo.) 5. Iterpretacja Števlo ur braja devh časopsov a tede je learo odvso od przah let šole pr 5% stopj začlost. (Verjetost, da ob domev, da a populacj odvsost (torej, da je β 0), a vzorcu dobmo vzorč regresjsk koefcet z absoluto vredostjo 0.46 al več oz. t-statstko po absolut vredost 5.75 al večj, je tako majha (majša od 0.%), da lahko upravčeo podvommo v pravlost domeve o lear eodvsost.) 5.5.5 Kvalteta regresjskega modela Regresjska fukcja regresjsk model. Z regresjskm modelom (regresjsko fukcjo): - opsujemo odvsost odvse spremeljvke () od eodvse spremeljvke () - apovedujemo vredost odvse spremeljvke () a osov vredost eodvse spremeljvke (). Kako dober je regresjsk model (regresjska fukcja)? kazalca:. Determacjsk koefcet (delež pojasjee varace) kazalec kvaltete opsa odvsost med spremeljvkama z regresjsko premco.. Stadarda apaka ocee kazalec kvaltete apovedovaja vredost odvse spremeljvke s pomočjo regresjske premce. Defrajmo... Vredost odvse spremeljvke y lahko razstavmo a tr kompoete: y µ + (y - µ ) + (y y ) y (x, y ) e y y y µ y y µ y a + b µ y 0 µ x x Eačbo lahko preoblkujemo v: y - µ (y - µ ) + (y y ) 34

35 µ... rezultat splošh vplvov (povprečje) y - µ... rezultat vplva spremeljvke y y... rezultat vplva drugh dejavkov Zgorjo eačbo lahko preoblkujemo tako, da eakost ajprej a obeh straeh eačaja kvadrramo, ato seštejemo po vseh eotah ato delmo s števlom eot N. Dobmo: To lahko zapšemo takole: kjer posamez čle pomejo: σ... celota varaca spremeljvke σ... pojasjea varaca spremeljvke (pojasjea, odvsa od spremeljvke ) σ e... epojasjea varaca spremeljvke (odvsa od drugh vplvov) Determacjsk koefcet Delež pojasjee varace spremeljvke s spremeljvko v celot varac meujemo determacjsk koefcet defra je a tervalu [0, ]. Pokazat se da, da je v prmeru bvarate leare regresjske odvsost determacjsk koefcet eak kvadratu Pearsoovega koefceta korelacje: R ρ Če determacjsk koefcet v prmeru bvarate leare regresje račuamo a vzorcu, je obrazec asledj: Determacjsk koefcet oz. delež pojasjee varace am pove, kolko (kakše delež) varablost v vredosth odvse spremeljvke () lahko prpšemo vredostm eodvse spremeljvke () e kakšm drugm vplvom. + N N N y y N y N y N ' ' ) ( ) ( ) ( µ µ ' e σ σ σ + N N y y y y R ' ' ) ( ) ( µ µ σ σ ' ' ) ( ) ( r y y s s R y y

Determacjsk koefcet oz. delež pojasjee varace je tako ek kazalec kvaltete regresjske fukcje. Pove am, kako dobro ocejea regresjska fukcja/regresjsk model (ocejea parametra a b) opsuje odvsost odvse spremeljvke () od eodvse spremeljvke (), k je vključea v aalzo. Želmo, da je delež pojasjee varace oz. determacjsk koefcet čm večj. Delež pojasjee varace ma seveda vredost a tervalu [0, ]. Stadarda apaka ocee Kvadrat kore z epojasjee varace σ e meujemo stadarda apaka regresjske ocee mer razpršeost točk okol regresjske krvulje. V prmeru leare regresjske odvsost je stadarda apaka eaka: Če stadardo apako ocee račuamo a vzorcu, je obrazec asledj: Tud stadarda apaka regresjske ocee mer kakovost ocejevaja vredost odvse spremeljvke z regresjsko fukcjo/regresjskm modelom. Pove am, kakše je stadard odklo dejaskh vredost y od apovedah vredost y (apovedah z regresjsko fukcjo). Pove torej, kako dobro ocejea regresjska premca (ocejea parametra a b) apoveduje vredost odvse spremeljvke () s pomočjo vredost eodvse spremeljvke (), k je vključea v aalzo. s N ' σ e ( y y ) N e Želmo, da je stadarda apaka čm majša, torej da so odklo od regresjske krvulje (razlke med dejaskm apovedam vredostm) čm majš. ( y y ) ' σ s ρ r Prmer Poovo vzemmo prmer 8 oseb, za katere mamo podatke o dveh spremeljvkah: zobrazba (števlo przah let šole) števlo ur braja devh časopsov a tede Ocemo, kako dobro zračuaa regresjska fukcja - 0.68 + 0.46 opsuje odvsost pogostost braja devh časopsov a tede od zobrazbe (torej determacjsk koefcet) kako dobro lahko a osov zobrazbe apovedujemo pogostost braja devh časopsov (torej stadardo apako ocee). Z regresjsko premco ajprej zračuajmo apovedae vredost za vseh 8 oseb v vzorcu. Vstavljamo vredost x v regresjsko fukcjo y -0.68 + 0.46 x 36

x y y 0 3 3.9 8 4 3 6 7 6.68 8 3 3 6.08 4.6 8 3 3 4.6 Determacjsk koefcet al delež pojasjee varace zračuajmo () s pomočjo odkloov apovedah vredost od povprečja 3 al () s Pearsoovm koefcetom korelacje r 0.9. x y y (y ) (y ) 0 3 3.9 0 0.8464 8 4 3 0 6 7 6.68 6 3.544 8 3 3 0 0 6.08 4 0.8464 4.6 3.3856 8 3 3 0 0 4.6 4 3.3856 6.0064 s R s y' y ( y ' ( y ) ).0064 0.8464 6 R r 0.9 0.8464 Iterpretacja: Delež pojasjee varace oz. determacjsk koefcet je 0.8464, kar pome, da z zobrazbo (t.j. s przam števlom let šole) lahko pojasmo 85% varace (varablost, razlk) v pogostost braja devh časopsov (v števlu ur braja devh časopsov a tede). Ostale razlke (5%) so rezultat ekh drugh vplvov, k jh smo zajel v aš regresjsk model. Stadardo apako ocee zračuajmo () s pomočjo odkloov apovedah vredost od dejaskh vredost (rezdualov, ostakov) al () s pomočjo stadardega odkloa spremeljvke Pearsoovega koefceta korelacje. x y y (y ) (y y ) 0 3 3.9 0 0.8464 8 4 3 6 7 6.68 6 0.04 8 3 3 0 0 6.08 4.664 4.6 0.7056 8 3 3 0 0 4.6 4 0.056 6 3.8464 37

s e ( y ' y ) 3.8464 0.75 7 s e s r ( y ) r 6 8 0.9 0.75 Iterpretacja: Stadarda apaka ocee je 0.75 ure. Pr apovedaju pogostost braja devh časopsov (v števlu ur braja devh časopsov a tede) s pomočjo zobrazbe (s števlom przah let šole) se stadardo zmotmo za 0.75 ure. 5.6 VAJE. Ferlgoj: Naloge z statstke. Nomal tp para spremeljvk: 9. do 9.7. Ordal tp para spremeljvk: 9.8 do 9.. Iterval/razmerost tp para spremeljvk: 9. 9.9, 9. - 9.3, 9.5, 9.6.. V ek aket leta 00 so aketrac odgovarjal a vprašaje Al uporabljate teret za opravljaje bačh/borzh trasakcj?. Podatk so asledj: Spol Skupaj Mošk Žesk Al uporabljate teret Da, že uporabljam 76 39 5 za opravljaje Še e uporabljam, a 60 4 0 bačh/borzh me zama trasakcj? Ne me e zama 43 4 67 Skupaj 379 05 484 a) Kaj je eota aalze, kaj sta spremeljvk? Kolkša je velkost vzorca? b) Izračuajte smsele strukture odstotke, grafčo jh predstavte ter terpretrajte. Al a daem vzorcu obstaja razlka med moškm žeskam glede uporabe tereta za opravljaje bačh/borzh trasakcj? c) Al lahko a osov dah podatkov za populacjo ugotovmo, da obstaja povezaost med spolom uporabo tereta za opravljaje bačh/borzh trasakcj? Domevo preverte pr 0% stopj začlost. d) Kakša je moč povezaost? e) Preverte domevo, da je a populacj delež žesk, k že uporabljajo teret za opravljaje borzh/bačh trasakcj, majš od deleža moškh. Domevo preverte pr 5% stopj začlost. 38

3. Leta 00 sta stočaso dve orgazacj zvedl razskavo o obskaost spleth mest. Slučaj vzorec 0 spleth mest je bl v vsak od obeh razskav ragra ekolko drugače glede a zmerjeo pogostost obskovaja. Ragraje glede a t dve razskav je predstavljeo v spodj tabel, pr čemer žj rag predstavlja všjo obskaost (všje mesto splete stra a lestvc), všj rag pa žjo obskaost (žje mesto splete stra a lestvc). Spleto mesto Rag glede a Rag glede a. razskavo. razskavo Markurja.com Najd.s Mobtel 3 7 Emal.s 4 4 4ur.com 5 6 SOL 6 3 Pkpok 7 8 Delo 8 0 RTV Sloveja 9 9 TIS Telekom 0 5 a) Kaj je eota aalze kaj sta spremeljvk? b) Kako moča je povezaost med ragrajema dveh razskav a daem vzorcu spleth mest? c) Al lahko za celoto populacjo spleth mest rečemo, da obe razskav dajeta podobe rezultate? (Preverte domevo, da med ragrajem spleth mest v dveh razskavah obstaja statstčo začla poztva povezaost pr % stopj začlost.) 4. Spodja tabela prkazuje podatke o števlu prseljeh prebvalcev števlu razvez a 00 prebvalcev v ekem koledarskem letu za slučaj vzorec 0 sloveskh obč. Obča Števlo razvez/00 preb. Števlo prseljeh/00 preb. Borovca 4 Cerklje 5 9 Goršca 5 Grosuplje 9 6 Mklavž 7 8 Pvka 3 Prevalje 3 5 Selca 8 Tša 5 Vrasko a) Kaj je eota aalze kaj sta spremeljvk? b) Preverte, al a populacj vseh sloveskh obč obstaja statstčo začla leara povezaost med števlom prseljeh števlom razvez, pr 5% stopj začlost. 39

5. Na osov vzorca 0-h eot z eke akete o poltč partcpacj aalzrajte vplv posamezkovega občutka o možost vplvaja a družbee dogodke a pogostost zražaja meja v javost. Možost vplva je merjea a lestvc od do 5, kjer pome kakrše možost mam za vplvaje, 5 pa velke možost mam za vplvaje. Pogostost zražaja meja v javost pa je merjeo s števlo zražaj meja glede družbeh poltčh problemov v javh stuacjah v zadjh 4 leth. Poda so tud podatk o spolu aketraca ( mošk, žesk). Oseba Občutek Pogostost vplvaja zračaja meja Spol 4 6 3 3 4 5 9 5 3 6 0 7 5 5 8 4 4 9 7 0 4 5 a) Kaj je eota aalze, kolko katere spremeljvke obravavamo? b) Grafčo poazorte odos med spremeljvkama možost vplva a družbee dogodke pogostost zražaja meja v javost ter terpretrajte. c) Izračuajte Pearsoov koefcet korelacje med jma preverte, al a populacj obstaja leara povezaost med spremeljvkama (upoštevajte 0% stopjo začlost). Iterpretrajte. d) Izračuajte tud ustrezo regresjsko premco jo vršte v razsev grafko. Iterpretrajte. e) Preverte domevo, al za populacjo velja, da občutek o možost vplvaja a družbee dogodke poztvo vplva a pogostost zražaja meja v javost (upoštevajte 0% stopjo začlost). f) Kolkše del varablost (varace) v pogostost zražaja meja v javost e uspemo pojast z občutkom vplvaja a družbee dogodke? Kolkše del varace pa uspemo pojast? g) Ocete, kako pogosto b zražal meje ekdo, k je ajmaj preprča, da lahko vplva a družbee dogodke (ma torej vredost ). h) Kakša je stadarda apaka ocee pr takš apoved? ) Izračuajte stadardo apako še kot razlko med dejaskm apovedam vredostm z regresjske premce. Rezultata se morata ujemat. j) Al se pogostost zražaja meja v javost a populacj med moškm žeskam statstčo začlo razlkuje? Upoštevajte 5% stopjo začlost. (Predpostavljamo, da je varablost v pogostost zražaja meja eaka za populacjo moškh žesk.) 40

6. Spodja tabela prkazuje za 6 slučajo zbrah oseb podatke o števlu ur gledaja televzje a tede števlu obskov kopredstav a mesec. Oseba Št. ur gledaja TV/tede Št. obskov kopredstav/mesec 0 5 3 6 4 7 4 5 0 6 8 a) Kaj se eote kaj sta spremeljvk? Kakša je merska lestvca spremeljvk? b) Podatke grafčo predstavte z razsevm grafkoom. c) Z learo regresjsko fukcjo ocete, kolkokrat bo šla oseba v ko a mesec, če gleda 8 ur a tede televzjo. Premco vršte v razsev grafko. d) Kolkša je pr takem ocejevaju stadarda apaka ocee? e) Kolkše delež varace obska kopredstav lahko pojasmo z gledajem televzje? 7. Prmer zpth vprašaj. Domevo o povezaost spremeljvk spol smer študja preverjamo a) s χ testom b) s Pearsoovm koefcetom korelacje c) s Spearmaovm koefcetom korelacje ragov d) z tervalom zaupaja V kotgeč tabel, k prkazuje vredost dveh omalh spremeljvk a vzorcu 400 eot k ma 4 vrstce 6 stolpcev, zračuamo vredost χ 08. Kolkše je tedaj Cramerjev koefcet? a) C 0,3 b) C 0,46 c) α 0,33 d) α 0,3 Kotgeča tabela kaže povezaost med spremeljvkama spol zamaje za šport (z vredostm majho, sredje, velko). Vredost χ statstke je 3,4 stopja tvegaja 5%. Ugotovmo lahko asledje: a) χ (-α) 5,99; domeve, da sta spremeljvk epoveza, e moremo zavrt b) χ α 0,0; zavremo domevo, da sta spremeljvk epoveza c) χ (-α) 5,99; zavremo domevo, da sta spremeljvk poveza d) χ (-α) 5,99; zavremo domevo, da sta spremeljvk epoveza Na slučajem vzorcu 0-h djakov smo zračual Spearmaov koefcet korelacje ragov med razvrsttvjo djakov glede a uč uspeh (od tsth z ezadostm uspehom do tsth z odlčm uspehom) ter glede a sodelovaje v obšolskh dejavosth (od tsth, k kol e sodelujejo, do tsth, k redo sodelujejo). Vredost koefceta je 0,7. Al lahko za populacjo djakov trdmo, da obstaja poztva povezaost med učm uspehom sodelovajem v obšolskh dejavosth, ob 5% stopj začlost? a) H 0 : ρ s 0, H : ρ s > 0, z e 4.4, z α.65; e, poztva povezaost e obstaja b) H 0 : ρ s 0, H : ρ s 0, t e 4.4, t α/ ±.0; da, poztva povezaost obstaja c) H 0 : ρ s 0, H : ρ s 0, z e 4.4, z α/ ±.96; e, poztva povezaost e obstaja d) H 0 : ρ s 0, H : ρ s > 0, t e 4.4, t α.73; da, poztva povezaost obstaja 4

Pearsoov koefcet korelacje med dvema spremeljvkama je -0.8. Spremeljvk sta a) močo poztvo learo poveza b) močo egatvo learo poveza c) močo ekspoeto poveza d) epoveza Če je pr bvarat lear regresjsk aalz Pearsoov koefcet korelacje 0.50, je delež pojasjee varace a) 0,75 b) 0,5 c) 0 d) Med spremeljvkama velja leara regresjska zveza ' 5 +. Napovejte vredost spremeljvke ', če je vredost spremeljvke eaka 5. a) 35 b) 5 c) 3,5 d) 7 4