3. STATISTIKE Z DVEMA SPREMENLJIVKAMA

Σχετικά έγγραφα
Diferencialna enačba, v kateri nastopata neznana funkcija in njen odvod v prvi potenci

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 14. november Gregor Dolinar Matematika 1

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 5. december Gregor Dolinar Matematika 1

Regresija in korelacija

Funkcijske vrste. Matematika 2. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 2. april Gregor Dolinar Matematika 2

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 21. november Gregor Dolinar Matematika 1

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 10. december Gregor Dolinar Matematika 1

Tretja vaja iz matematike 1

NEPARAMETRIČNI TESTI. pregledovanje tabel hi-kvadrat test. as. dr. Nino RODE

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 22. oktober Gregor Dolinar Matematika 1

Splošno o interpolaciji

Kontrolne karte uporabljamo za sprotno spremljanje kakovosti izdelka, ki ga izdelujemo v proizvodnem procesu.

*M * Osnovna in višja raven MATEMATIKA NAVODILA ZA OCENJEVANJE. Sobota, 4. junij 2011 SPOMLADANSKI IZPITNI ROK. Državni izpitni center

KODE ZA ODKRIVANJE IN ODPRAVLJANJE NAPAK

Osnove sklepne statistike

Statistika II z računalniško analizo podatkov. Bivariatna regresija, tipi povezanosti

Na pregledni skici napišite/označite ustrezne točke in paraboli. A) 12 B) 8 C) 4 D) 4 E) 8 F) 12

Multivariatna analiza variance

IZPIT IZ ANALIZE II Maribor,

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 12. november Gregor Dolinar Matematika 1

Booleova algebra. Izjave in Booleove spremenljivke

Funkcije več spremenljivk

SKUPNE PORAZDELITVE VEČ SLUČAJNIH SPREMENLJIVK

13. Jacobijeva metoda za računanje singularnega razcepa

Statistika 2 z računalniško analizo podatkov. Multipla regresija in polinomski regresijski model

vezani ekstremi funkcij

Integralni račun. Nedoločeni integral in integracijske metrode. 1. Izračunaj naslednje nedoločene integrale: (a) dx. (b) x 3 +3+x 2 dx, (c) (d)

Osnove matematične analize 2016/17

D f, Z f. Lastnosti. Linearna funkcija. Definicija Linearna funkcija f : je definirana s predpisom f(x) = kx+n; k,

matrike A = [a ij ] m,n αa 11 αa 12 αa 1n αa 21 αa 22 αa 2n αa m1 αa m2 αa mn se števanje po komponentah (matriki morata biti enakih dimenzij):

Kotne in krožne funkcije

1. Trikotniki hitrosti

Kvadratne forme. Poglavje XI. 1 Definicija in osnovne lastnosti

Zanesljivost psihološkega merjenja. Osnovni model, koeficient α in KR-21

PONOVITEV SNOVI ZA 4. TEST

Delovna točka in napajalna vezja bipolarnih tranzistorjev

Numerično reševanje. diferencialnih enačb II

8. MULTIVARIATNE METODE 8.1. Uvod Zakaj jih uporabljati

1. Definicijsko območje, zaloga vrednosti. 2. Naraščanje in padanje, ekstremi. 3. Ukrivljenost. 4. Trend na robu definicijskega območja

Gimnazija Krˇsko. vektorji - naloge

Statistična analiza. doc. dr. Mitja Kos, mag. farm. Katedra za socialno farmacijo Univerza v Ljubljani- Fakulteta za farmacijo

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 15. oktober Gregor Dolinar Matematika 1

Tema 1 Osnove navadnih diferencialnih enačb (NDE)

cot x ni def. 3 1 KOTNE FUNKCIJE POLJUBNO VELIKEGA KOTA (A) Merske enote stopinja [ ] radian [rad] 1. Izrazi kot v radianih.

7.2. GRAFIČNI PRIKAZ PROSTORSKIH PODATKOV

Kotni funkciji sinus in kosinus

Enačba, v kateri poleg neznane funkcije neodvisnih spremenljivk ter konstant nastopajo tudi njeni odvodi, se imenuje diferencialna enačba.

Regularizacija. Poglavje Polinomska regresija

DISKRIMINANTNA ANALIZA

Definicija. definiramo skalarni produkt. x i y i. in razdaljo. d(x, y) = x y = < x y, x y > = n (x i y i ) 2. i=1. i=1

POROČILO 3.VAJA DOLOČANJE REZULTANTE SIL

diferencialne enačbe - nadaljevanje

DISKRETNA FOURIERJEVA TRANSFORMACIJA

Nekateri primeri sklopov izpitnih vprašanj pri predmetu Naključni pojavi

1. Έντυπα αιτήσεων αποζημίωσης Αξίωση αποζημίωσης Έντυπο Πίνακας μεταφράσεων των όρων του εντύπου...

METODA FAKTORSKE ANALIZE je osnovana na analizi medsebojnih korelacij. Tu potrebujemo neko vsebinsko poznavanje oz. neko teorijo, da pojav x vpliva na

Matematika I (VS) Univerza v Ljubljani, FE. Melita Hajdinjak 2013/14. Pregled elementarnih funkcij. Potenčna funkcija. Korenska funkcija.

Funkcija je predpis, ki vsakemu elementu x iz definicijskega območja D R priredi neko število f (x) R.

Navadne diferencialne enačbe

Odvode odvisnih spremenljivk po neodvisni spremenljivki bomo označevali s piko: Sistem navadnih diferencialnih enačb prvega reda ima obliko:

8. Diskretni LTI sistemi

Osnove elektrotehnike uvod

Afina in projektivna geometrija

Statistika 2 z računalniško analizo podatkov. Statistično sklepanje

Osnove merjenj. B. Golli, PeF. 22. oktober 2009

Transformator. Delovanje transformatorja I. Delovanje transformatorja II

Matematika 2. Diferencialne enačbe drugega reda

1.3 Vsota diskretnih slučajnih spremenljivk

p 1 ENTROPIJSKI ZAKON

Iterativno reševanje sistemov linearnih enačb. Numerične metode, sistemi linearnih enačb. Numerične metode FE, 2. december 2013

Reševanje sistema linearnih

Metoda glavnih komponent

Množico vseh funkcijskih vrednosti, ki jih pri tem dobimo, imenujemo zaloga vrednosti funkcije f. Oznaka: Z f

Analiza 2 Rešitve 14. sklopa nalog

REˇSITVE. Naloga a. b. c. d Skupaj. FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost 2. kolokvij 23.

Domače naloge za 2. kolokvij iz ANALIZE 2b VEKTORSKA ANALIZA

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * NAVODILA ZA OCENJEVANJE. Sreda, 3. junij 2015 SPLOŠNA MATURA

Interpolacija in aproksimacija funkcij

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

Vaje: Električni tokovi

Vaje iz MATEMATIKE 2. Vektorji

Postavitev hipotez NUJNO! Milena Kova. 10. januar 2013

Frekvenčna analiza neperiodičnih signalov. Analiza signalov prof. France Mihelič

Podobnost matrik. Matematika II (FKKT Kemijsko inženirstvo) Diagonalizacija matrik

Bézierove krivulje. Fakulteta za matematiko in fiziko, Univerza v Ljubljani. MARS 2009, Koper, / 54

FAKULTETA ZA STROJNIŠTVO Matematika 4 Pisni izpit 22. junij Navodila

Državni izpitni center SPOMLADANSKI IZPITNI ROK *M * FIZIKA NAVODILA ZA OCENJEVANJE. Petek, 10. junij 2016 SPLOŠNA MATURA

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

Kvantni delec na potencialnem skoku

11.5 Metoda karakteristik za hiperbolične PDE

1. UREJENE OBLIKE KVADRATNE FUNKCIJE

Navadne diferencialne enačbe

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

S programom SPSS se, glede na število ur, ne bomo ukvarjali. Na izpitu so zastavljena neka vprašanja, zraven pa dobimo računalniški izpis izračunov. T

Univerza v Ljubljani Fakulteta za računalništvo in informatiko MATEMATIKA. Polona Oblak

Matematika. Funkcije in enačbe

SEMINARSKA NALOGA Funkciji sin(x) in cos(x)

Enočlenske metode veljajo trenutno za najprimernejše metode v numeričnem reševanju začetnih problemov. Skoraj vse sodijo v

Matematika 1. Gregor Dolinar. 2. januar Fakulteta za elektrotehniko Univerza v Ljubljani. Gregor Dolinar Matematika 1

8. Navadne diferencialne enačbe

Transcript:

3. STATISTIKE Z DVEMA SPREMENLJIVKAMA Bivariatne metodo obravnavajo dve spremenljivki hkrati, zato so podatki zapisani: x 1 y 1 x 2 y 2 : : x n y n

3.1. KORELACIJSKI KOEFICIENT Mera stopnje linearne povezanosti je korelacijski koeficient ρ, njegova ocena, korelacijski koeficient vzorca pa r. Temelji na popravljeni vsoti zmnožkov VP (CSP - Corrected sum of Products): n VPxy CSPxy ( xi x)( yi y) xy x i 1 n y

3.1. KORELACIJSKI KOEFICIENT Grafična porazdelitev VP omogoča razumeti lastnosti podatkov, iz katerih izhaja korelacijski koeficient. Predznak VP zavisi od tega, v katerem kvadrantu je točka oz. ali je njena vrednost višja ali nižja od povprečja spremenljivke. x x y y ( x x)( y y) Q1 + + + Q2 - + - Q3 - - + Q4 + - -

3.1. KORELACIJSKI KOEFICIENT VP je odvisna od velikosti vzorca n. Učinek podecenjene vrednosti populacije zmanjšamo z deljenjem z (n-1). Dobljeno količino imenujemo kovarianca dveh spremenljivk (cov xy ): cov xy VP xy n 1

3.1. KORELACIJSKI KOEFICIENT Vpliv enot odpravimo s standardizacijo, tako da razlike spremenljivk delimo s pripadajočim standardnim odklonom, kar je enako deljenju kovariance z zmnožkom standardnih odklonov s x s y. Parameter je brez enot in se imenuje Pearsonov produkt momentni korelacijski koeficient r. r xy VK x cov s x s xy y x 2 i n i 1 ( ( x x )( y y) ( n 1) s n x i ) 2 x s s 2 x y ( n 1) VK VP x xy VK y

3.1. KORELACIJSKI KOEFICIENT Determinacijski koeficient D pove, koliko se spremeni x, zaradi spremembe y. Izračunamo ga: D r 2

3.1. KORELACIJSKI KOEFICIENT Opozorila: 1. Korelacijski koeficient ni splošna mera odnosa med dvema spremenljivkama, temveč le mera tendence k ravni črti. Vedno moramo skupaj z r preveriti tudi bivariatno sipanje.

3.1. KORELACIJSKI KOEFICIENT 2. Korelacijski koeficient je občutljiv na neobičajno visoke vrednosti outlierje.

3.1. KORELACIJSKI KOEFICIENT 3. Korelacijski koeficient dveh logaritmiranih spremenljivk je višji, kot če uporabimo njune naravne vrednosti.

3.1. KORELACIJSKI KOEFICIENT 4. Korelacijski koeficient zaprtih nizov podatkov je pogosto lažen. Problem rešimo tako, da namesto pravih vrednosti uporabimo: Razmerja Preostali delež Glavne komponente Hipotetično odprto množico Log-razmerje transformacijo.

3.1. KORELACIJSKI KOEFICIENT Visoka vrednost korelacijskega koeficienta ne pomeni nujno, da je linearna povezava med spremnljivkama tudi statistično značilna. Značilnost ugotovimo s testom: H 0 : ρ0 ni korelacije H 1 : ρ 0 korelacija obstaja Testna statistika t r n 2 2 1 r Zavrni H 0, kadar je t izračunana > t α, n-2. Test je veljaven le, če so podatki zajeti nepristransko iz populacije z normalno porazdelitvijo za obe spremenljivki, kar je v geologiji redko. Zato uporabimo neparametrični koeficient ali linearno regresijo.

3.2. BIVARIATNA REGRESIJA Prednosti regresije pred korelacijskim koeficientom: Lahko jo statistično testiramo kljub nenormalno porazdeljenim podatkom. Testiramo lahko različne ukrivljene odnose. Naravo bivariatnega odnosa natančneje definiramo z ustrezno enačbo.

3.2. BIVARIATNA REGRESIJA

3.2. BIVARIATNA REGRESIJA Vsi postopki skušajo regresijo izračunati tako, da je odstopanje od regresijske krivulje ter napaka regresije čim manjša. Napako lahko definiramo različno: Napaka izhaja le iz ene od obeh spremenljivk klasična regresija. Napaka izhaja iz obeh spremenljivk strukturna (sestavljena) regresija. Napako, ki izhaja iz ene od spremenljivk, zaradi ponovljenih meritev vnaprej poznamo metoda tehtanih najmanjših kvadratov.

3.2.1. Klasična regresija Spremenljivki sta si zelo različni: Neodvisna ali regresorska ali napovedovalna Označena je z x Nanašamo jo na absciso (vodoravno os) Je točno izmerjena in ne vsebuje napake Lahko jo določi uporabnik (npr. razdalje x, vzdolž katerih merimo vrednost spremnljivke y). Odvisna ali regresirana ali napovedana Označena je z y Nanašamo jo na ordinato (navpično os) Meritve niso zanesljive in vsa odstopanja točk od regresorske linije (napaka) naj bi bile le v navpični smeri

3.2.1. Klasična regresija

3.2.1.1. Klasična linearna regresija Regresijsko enačbo za populacijo zapišemo: y i β 0 + β 1 x i + ε kjer koeficient β 0 podaja sečišče premice z osjo y pri x 0 in β 1 njen naklon. ε i podaja odstopanje točk od premice.

3.2.1.1. Klasična linearna regresija Za vzorec velja: y i b 0 + b 1 x i kjer sta b 0 in b 1 iz vzorca izhajajoči oceni β 0 in β 1. Iščemo taka b 0 in b 1, da je celotna napaka Σε i2 čim manjša. Mera napake je vsota kvadratov zaradi odklona (SS D ): SS D n i 1 2 ( yˆ y) i kjer je ŷ i ocena y vrednost y, kjer navpičnica, ki poteka skozi točko, seka regresijsko premico.

3.2.1.1. Klasična linearna regresija Problem je rešljiv z dvema enačbama: Koeficienta regresijske premice dejansko izračunamo: + + n i i n i i n i i i n i i n i i x b x b y x x b n b y 1 2 1 1 0 1 1 1 0 1 x b y b n x x n y x xy VK VP s s r b x xy x y 1 0 2 2 1 ) (

3.2.1.1. Klasična linearna regresija Regresijo lahko pojmujemo kot razdelitev celotne variance podatkov na dva dela: Varainca zaradi regresijske premice pripisujemo jo nekemu (geološkemu) procesu. Varianca zaradi odstopanja od regresijske premice - pripisujemo jo naklučju. Obe kvantificiramo iz podatkov in izračunane regresijske premice:

3.2.1.1. Klasična linearna regresija Vsota kvadratov zaradi regresije: VK R n SSR i 1 Vsota kvadratov zaradi odstopanja: VK D n SSD i 1 Kar običajno izračunamo iz VK D VK C VK R Pri čemer je celotna vsota kvadratov: VK C n SST i 1 yˆ ( i yi yˆ ( i yi ( yi yi ) ) ) 2 2 2

3.2.1.1. Klasična linearna regresija Kako dobra je regresija preverimo s statistiko ustreznosti prileganja R 2 : 2 R VK VK R C

3.2.1.1. Klasična linearna regresija Statistična značilnost regresijske premice je odvisna od razmerja varianc iz obeh virov. Značilnost je višja, če je varianca zaradi regresije večja in varianca zaradi napake manjša. Značilnost regresije opravimo z AVAR regresije, kjer postavimo hipotezi: H 0 : β 1 0 H 1 : β 1 0 premica nima naklona premica ima naklon regresija obstaja

3.2.1.1. Klasična linearna regresija Regresija je statistično značilna na ravni zaupanja α, kadar izračunana vrednost F presega tabelirano. Tabela AVAR linearne regresije: Vir ν VK s 2 F F tab regresija 1 VK R s R 2 VK R s R2 / s D 2 F α,1,n-2 napaka n-2 VK D s D 2 VK D /(n-2) celotna N-1 VK C

3.2.1.1. Klasična linearna regresija Opozorila: 1. Točke, ki so outlierji (zlasti glede na neodvisno spremenljivko x) lahko prekomerno vplivajo na regresijo. Vpliv takih vrednosti preverimo tako, da jih odstranimo in ponovno izračunamo regresijo. 2. Razlika med točko in regresijsko premico v smeri y je preostanek. Veljavnost regresijskih statistik je odvisna od porazdelitve preostankov, ki : a. morajo biti normalno porazdeljeni b. morajo biti homoscedastični (brez trenda) c. Ne smejo biti avtokorelirani 3. Ne glede potrjeno statistično značilnost regresije, moramo paziti, kako uporabimo rezultat za napovedovanje. Ekstrapoliranje izven meja prvotnih podatkov ni priporočljivo, razen če poznamo (geološki) proces in vemo, da je to smiselno.

3.2.1.2. Krivuljna regresija Spremenljivki sta med seboj lahko povezani tudi s kako drugo krivuljo in ne le linearno premico. Prilagajanje takim krivuljam lahko ugotavljamo na dva načina: Podatke transformiramo v želeno obliko krivulje (npr. logaritmiranje, kvadriranje...) in zanje izračunamo linearno regresijo Uporabimo polinomno regresijo izračunamo prilagajanje izbrani polinomni funkciji.

3.2.1.2. Krivuljna regresija

3.2.1.2. Krivuljna regresija Najpreprostejša polinomna regresija je kvadratna, ki opisuje parabolično ukrivljenje. Linerarni enačbi dodamo člen x 2 : y b 0 + b 1 x + b 2 x 2 Značilnost kvadratne enačbe testiramo: H 0 : β 1 0 in β 2 0 H 1 : β 1 0 in/ali β 2 0

3.2.1.2. Krivuljna regresija Kadar smo za iste podatke ugotovili značilnost linearne regresije, smo že zavrnili H 0 in avtomatično zavrnemo tudi H 0 kvadratne regresije. V tem primeru testiramo le koeficient β 2. Dodajanje člena vodi do enačbe kubične regresije: y b 0 + b 1 x + b 2 x 2 +b 3 x 3 In regresije na četrto potenco: y b 0 + b 1 x + b 2 x 2 +b 3 x 3 + b 4 x 4

3.2.1.2. Krivuljna regresija Vsak dodatni člen da krivulji dodaten pomen. Kvadratna regresija nima točke prevoja, kubična dovoljuje eno, itd. Če zaporedno preverjamo enačbe, testiramo vedno le dodatni člen. Navadno hitro pridemo do točke, ko z dodajanjem člena nič ne pridobimo.

3.2.1.2. Krivuljna regresija Značilnost regresije preverimo z AVAR. H 0 zavrnemo, kadar izračunana vrednost presega kritično. Za polinomno regresijo reda k velja splošna tabela: Vir ν VK s 2 F F tab k-ta regresija k VK Rk s Rk2 VK Rk /k s Rk2 / s Dk 2 F α,k,n-k-1 (k-1)-ta regresija k-1 VK Rk-1 zvišanje prileganja 1 VK RZ VK Rk -VK Rk-1 s 2 RZ VK RZ s RZ2 / s 2 Dk F α,1,n-k-1 K-ta napaka n-k-1 VK Dk s Dk2 VK Dk /(n-k-1) celotna n-1 VK C

3.2.1.2. Krivuljna regresija Opozorila: Veljajo vsa opozorila kot za linearno regresijo Linearni in kvadratni členi so lastni številnim fizikalnim procesom, višje stopnje polinomov pa ne, zato je dobro prileganje višjim regresijam pogosto zgolj slučajno. Visoke stopnje polinomov imajo lahko skrajne naklone, ki pri ekstrapolaciji vodijo do neverjetnih ocen.

3.2.2. Strukturna regresija Spremenljivki sta enakovredni napaka izvira iz obeh (kar je v geologiji pogosto). Možna sta dva pristopa: Glavne osi Zmanjšane glavne osi (Reduced Major Axis RMA) Oba sta v paleontologiji uporabna za ugotavljanje izometrije in alometrije.

Črta glavne osi, ki poteka skozi roj podatkov, minimizira vsoto oddaljenosti med premico in vsako točko. Metoda je enakovredna multivariatni metodi glavnih komponent (PC). 3.2.2.1. Glavne osi

3.2.2.2. Zmanjšane glavne osi (RMA) Regresijska premica je izračunana tako, da je vsota površin trikotnikov med točkami podatkov in premico čim manjša.

3.2.2.2. Zmanjšane glavne osi (RMA) Naklon b 1 izračunamo iz: b 1 s x /s y Regresijska linija mora sekati skupno srednjo vrednost x in y, tako da za presečiščni koeficient b 0 velja: b 0 y - b 1 x

3.2.2.2. Zmanjšane glavne osi (RMA) Pri eliptičnem sipanju podatkov bo koeficient b 1 povezan z razmerjem osi elipse, ne glede na to, če dejansko ni naklona regresijske premice. Rezultat zato testiramo s standardno napako b 1 -s e : 1 r n 2 s e Če razpon b 1 ±1,96. s e vključuje vrednost 0, to pomeni da premica nima naklona in da regresija na ravni zaupanja 5% ni značilna.

3.2.3. Metoda tehtanih najmanjših kvadratov Neodvisno moramo poznati napako v x in/ali y smeri: Ponovljene meritve Poznavanje natančnosti merilne naprave Regresijsko premico prilagajamo tako, da poteka čim bližje točkam, ki izkazujejo najmanjšo napako. Napaka x in y je lahko pozitivno ali negativno korelirana.