DISKRIMINANTNA ANALIZA

Σχετικά έγγραφα
Multivariatna analiza variance

Diferencialna enačba, v kateri nastopata neznana funkcija in njen odvod v prvi potenci

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 5. december Gregor Dolinar Matematika 1

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 21. november Gregor Dolinar Matematika 1

Funkcijske vrste. Matematika 2. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 2. april Gregor Dolinar Matematika 2

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 22. oktober Gregor Dolinar Matematika 1

Kontrolne karte uporabljamo za sprotno spremljanje kakovosti izdelka, ki ga izdelujemo v proizvodnem procesu.

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 14. november Gregor Dolinar Matematika 1

Odvod. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 10. december Gregor Dolinar Matematika 1

Tretja vaja iz matematike 1

Metoda glavnih komponent

NEPARAMETRIČNI TESTI. pregledovanje tabel hi-kvadrat test. as. dr. Nino RODE

matrike A = [a ij ] m,n αa 11 αa 12 αa 1n αa 21 αa 22 αa 2n αa m1 αa m2 αa mn se števanje po komponentah (matriki morata biti enakih dimenzij):

KODE ZA ODKRIVANJE IN ODPRAVLJANJE NAPAK

Podobnost matrik. Matematika II (FKKT Kemijsko inženirstvo) Diagonalizacija matrik

Booleova algebra. Izjave in Booleove spremenljivke

Reševanje sistema linearnih

Specifični faktorji E i bodo imeli majhne variance, če so opazovane spremenljivke blizu faktorju F.

Zaporedja. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 15. oktober Gregor Dolinar Matematika 1

Gimnazija Krˇsko. vektorji - naloge

SKUPNE PORAZDELITVE VEČ SLUČAJNIH SPREMENLJIVK

13. Jacobijeva metoda za računanje singularnega razcepa

Funkcije več spremenljivk

*M * Osnovna in višja raven MATEMATIKA NAVODILA ZA OCENJEVANJE. Sobota, 4. junij 2011 SPOMLADANSKI IZPITNI ROK. Državni izpitni center

Definicija. definiramo skalarni produkt. x i y i. in razdaljo. d(x, y) = x y = < x y, x y > = n (x i y i ) 2. i=1. i=1

IZPIT IZ ANALIZE II Maribor,

Kvadratne forme. Poglavje XI. 1 Definicija in osnovne lastnosti

Numerično reševanje. diferencialnih enačb II

Lastne vrednosti in lastni vektorji

Kotne in krožne funkcije

Funkcije. Matematika 1. Gregor Dolinar. Fakulteta za elektrotehniko Univerza v Ljubljani. 12. november Gregor Dolinar Matematika 1

Statistika 2 z računalniško analizo podatkov. Multipla regresija in polinomski regresijski model

V tem poglavju bomo vpeljali pojem determinante matrike, spoznali bomo njene lastnosti in nekaj metod za računanje determinant.

1.3 Vsota diskretnih slučajnih spremenljivk

Iterativno reševanje sistemov linearnih enačb. Numerične metode, sistemi linearnih enačb. Numerične metode FE, 2. december 2013

Osnove matematične analize 2016/17

diferencialne enačbe - nadaljevanje

8. MULTIVARIATNE METODE 8.1. Uvod Zakaj jih uporabljati

8. Posplošeni problem lastnih vrednosti

REˇSITVE. Naloga a. b. c. d Skupaj. FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost 2. kolokvij 23.

DISKRETNA FOURIERJEVA TRANSFORMACIJA

8. Diskretni LTI sistemi

vezani ekstremi funkcij

Uporabna matematika za naravoslovce

PONOVITEV SNOVI ZA 4. TEST

Splošno o interpolaciji

Statistika II z računalniško analizo podatkov. Bivariatna regresija, tipi povezanosti

Problem lastnih vrednosti

Analiza 2 Rešitve 14. sklopa nalog

FAKULTETA ZA STROJNIŠTVO Matematika 4 Pisni izpit 22. junij Navodila

VEKTORJI. Operacije z vektorji

Statistična analiza. doc. dr. Mitja Kos, mag. farm. Katedra za socialno farmacijo Univerza v Ljubljani- Fakulteta za farmacijo

INŽENIRSKA MATEMATIKA I

Zanesljivost psihološkega merjenja. Osnovni model, koeficient α in KR-21

1. Definicijsko območje, zaloga vrednosti. 2. Naraščanje in padanje, ekstremi. 3. Ukrivljenost. 4. Trend na robu definicijskega območja

Delovna točka in napajalna vezja bipolarnih tranzistorjev

POROČILO 3.VAJA DOLOČANJE REZULTANTE SIL

v skupine Fakulteta za družbene vede Univerza v Ljubljani Zgledi uporabe statistike na različnih strokovnih področjih DMFA, Ljubljana 27. in 28.1.

Na pregledni skici napišite/označite ustrezne točke in paraboli. A) 12 B) 8 C) 4 D) 4 E) 8 F) 12

3.1 Reševanje nelinearnih sistemov

Matematika 1. Gregor Dolinar. 2. januar Fakulteta za elektrotehniko Univerza v Ljubljani. Gregor Dolinar Matematika 1

Projekcije in zmanjšanje dimenzionalnosti podatkov

Integralni račun. Nedoločeni integral in integracijske metrode. 1. Izračunaj naslednje nedoločene integrale: (a) dx. (b) x 3 +3+x 2 dx, (c) (d)

Inverzni problem lastnih vrednosti evklidsko razdaljnih matrik

Dodatna poglavja iz linearne algebre za 1. letnik finančne matematike na FMF. Primož Moravec

MATEMATIKA 1 UNIVERZITETNI ŠTUDIJSKI PROGRAM BIOKEMIJA 1. LETNIK

Poliedri Ines Pogačar 27. oktober 2009

Linearne preslikave. Poglavje VII. 1 Definicija linearne preslikave in osnovne lastnosti

Linearna algebra. Bojan Orel Fakulteta za računalništvo in informatiko

Matematika I (VS) Univerza v Ljubljani, FE. Melita Hajdinjak 2013/14. Pregled elementarnih funkcij. Potenčna funkcija. Korenska funkcija.

Problem lastnih vrednosti 1 / 20

Algebraične strukture

ZBIRKA REŠENIH NALOG IZ MATEMATIKE II

Matematično modeliranje 3. poglavje Dinamično modeliranje: diferencialne enačbe, sistemi diferencialnih enačb

S programom SPSS se, glede na število ur, ne bomo ukvarjali. Na izpitu so zastavljena neka vprašanja, zraven pa dobimo računalniški izpis izračunov. T

Regresija in korelacija

Afina in projektivna geometrija

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

STATISTIKA ANALIZA VARINCE Doc.dr. Tadeja Kraner Šumenjak

Osnove linearne algebre

Metoda voditeljev. Poglavje 2

p 1 ENTROPIJSKI ZAKON

Enačba, v kateri poleg neznane funkcije neodvisnih spremenljivk ter konstant nastopajo tudi njeni odvodi, se imenuje diferencialna enačba.

Vaje iz MATEMATIKE 2. Vektorji

Osnove sklepne statistike

Tema 1 Osnove navadnih diferencialnih enačb (NDE)

UNIVERZA V MARIBORU FAKULTETA ZA KEMIJO IN KEMIJSKO TEHNOLOGIJO MATEMATIKA III

Frekvenčna analiza neperiodičnih signalov. Analiza signalov prof. France Mihelič

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

Realne funkcije. Elementarne funkcije. Polinomi in racionalne funkcije. Eksponentna funkcija a x : R R + FKKT Matematika 1

Funkcije dveh in več spremenljivk

Odvode odvisnih spremenljivk po neodvisni spremenljivki bomo označevali s piko: Sistem navadnih diferencialnih enačb prvega reda ima obliko:

Oznake in osnovne definicije

Kotni funkciji sinus in kosinus

1 Seštevanje vektorjev in množenje s skalarjem

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA SANDRA BOLTA LASTNE VREDNOSTI GRAFA DIPLOMSKO DELO

Matrike. Poglavje II. Matrika je pravokotna tabela realnih števil. Na primer: , , , 0 1

Matematika. BF Lesarstvo. Zapiski ob predavanjih v šolskem letu 2009/2010

Osnove statistike. Drago Bokal Oddelek za matematiko in računalništvo Fakulteta za naravoslovje in matematiko Univerza v Mariboru. 1.

11.5 Metoda karakteristik za hiperbolične PDE

Transcript:

DISKRIMINANTNA ANALIZA Z diskriminantno analizo poiščemo tako linearno kombinacijo merjenih spremenljivk, da bo maksimalno ločila vnaprej določene skupine in da bo napaka pri uvrščanju enot v skupine najmanjša. Pri diskriminantni analizi torej gre za iskanje tistih razsežnosti, ki kar najbolj pojasnjujejo razlike med skupinami (pojasnjevanje) in za kar se da dobro prirejanje enot vnaprej danim skupinam (napovedovanje).

Predpostavke 1. k 2. 2. Vsaj 2 enoti v vsaki skupini. 3. p < n 2; p je število spremenljivk in n število vseh enot v vzorcu. 4. Nobena spremenljivka ne sme biti linearna kombinacija preostalih spremenljivk (multikolinearnost). 5. Pri statističnemu ocenjevanju se predpostavlja, da so v vsaki skupini enot (vzorcu) enote slučajno izbrane iz populacije, kjer se spremenljivke porazdeljujejo večrazsežno normalno. 6. Variančno-kovariančna matrika p p je v vsaki populacijski skupini enaka.

Diskriminantna analiza v primeru dveh skupin (kanonična diskriminantna analiza, Fisher 1936) skupini vektorja variančnoar. sredin kovariančna m. G 1 µ 1 Σ 1 G 2 µ 2 Σ 2 Predpostavka: Σ 1 = Σ 2 = Σ Fisher je definiral diskriminantno spremenljivko (funkcijo) Y kot linearno kombinacijo p merjenih spremenljivk X i Y = b 0 + b 1 X 1 + b 2 X 2 +... + b p X p = Xb tako da je kvocient razlik aritmetičnih sredin diskriminantne spremenljivke v obeh skupinah (G 1 in G 2 ) glede na varianco diskriminantne spremenljivke znotraj skupine maksimalen. Aritmetični sredini diskriminantne spremenljivke v skupinama G 1 in G 2 sta: ȳ 1 = b µ 1 ȳ 2 = b µ 2 Varianci diskriminantne spremenljivke v vsaki skupini pa: var Y 1 = var Y 2 = b Σb

Kvocient, ki naj bi bil maksimalen, pa je: b µ 1 b µ 2 b Σb = max To je pogoj, na osnovi katerega izračunamo uteži b i najboljše diskriminantne spremenljivke. Reševanje tega optimizacijskega problema privede do rešitve za b, ki je sorazmerna Σ 1 (µ 1 µ 2 ) (Rešitev je lahko pomnožena s poljubno konstanto.) Vzorčne ocene Ponavadi imamo vzorčne podatke za vsako populacijo G i, iz katerih ocenimo µ i in Σ. Vzorčne ocene za µ i so: x i = ( x i1, x i2,..., x ip ) in za Σ (angl. pooled sample variance-covariance matrix) S = 1 n 1 + n 2 2 (X 1X 1 + X 2X 2 ) kjer je n 1 število enot v vzorcu iz G 1 in n 2 število enot v vzorcu iz G 2. Ocena uteži je tedaj ˆb = S 1 ( x 1 x 2 )

Centroid skupine Aritmetično sredino diskriminantne spremenljivke v določeni skupini imenujemo centroid skupine. Centroid skupine i je ȳ i = b x i Pravila uvrščanja enot v skupine Denimo, da smo izračunali diskriminantno spremenljivko Y = Xb. Pravilo uvrščanja enote v optimalno skupino je tedaj: i-to enoto (glede na p izmerjenih spremenljivk) uvrstimo v skupino G 1, če je njena vrednost na diskriminantni spremenljivki y i ali v skupino G 2, če je y i ȳ 1 y i ȳ 2 y i ȳ 1 > y i ȳ 2 Ekvivalenten pogoj uvrščanja je metoda srednje točke kot točke ločevanja skupin. Če imata skupini enako število enot (n 1 = n 2 ), je točka ločevanja y c = ȳ1 + ȳ 2 2 Če imamo skupini neenakih velikosti (n 1 n 2 ), točko ločevanja izračunamo takole y c = n 2ȳ 1 + n 1 ȳ 2 n 1 + n 2

Klasifikacijska tabela Obnašanje diskriminatne spremenljivke lahko ocenimo tudi z deležem (ne)pravilno uvrščenih enot. Uporabimo dobljeno diskriminantno spremenljivko na podatkih, iz katerih je bila izračunana. Vsako enoto enoto uvrstimo v eno od obeh skupin glede na pravilo uvrščanja. Rezultate uvrščanja lahko predstavimo z naslednjo tabelo: število dobljeni skupini dejanski skupini enot G 1 G 2 G 1 n 1 a b G 2 n 2 c d Delež pravilno uvrščenih enot je a + d n 1 + n 2 Ob predpostavki, da je v obeh skupinah enako število enot, je spodnja meja tega deleža 0.50. Ocenjeni delež pravilno uvrščenih enot je optimistično pristranski, ker pri tem uporabljamo iste podatke za pravilo uvrščanja in oceno obnašanja.

Primer: majhna podjetja Populacijo sestavljajo majhna podjetja, v katerih je zaposlenih med 1 in 50 v vseh sektorjih razen v kmetijstvu v Sloveniji. Slučajni vzorec je bil dobljen na osnivi spiskov podjetij v Gospodarski zbornici R Slovenije in Obrtni zbornici R Slovenije. Od 200 slučajno izbranih podjetij, jih je v anketi sodelovalo 151. Podatki so bili zbrani z osebnim intervjujem. Zbiranje podatkov je potekalo v letu 1993. Skupini sta bili določeni takole: G 1 storitvena podjetja (n 1 = 70) in G 2 obrtna podjetja (n 2 = 75). Merjene spremenljivke so 12 faktorjev, ki pomagajo k uspešnosti podjetja. Dobljene uteži diskriminantne spremenljivke so: uteži PROD-MET -.54 MARK-MET.40 PRODUKT -.00 ODNOSI.01 USP-ZAP.22 USP-MAN.51 DRUŽINA -.33 GOSP-ZDR -.18 POL-ZVEZE.48 LOK-OBL -.28 DRŽAVA.16 PODJETJA.06

Centroidi so: servis.54 obrt -.50 Klasifikacijska tabela je: število dobljeni skupini dejanski skupini enot servis obrt servis 70 70% 30% obrt 75 30.7% 69.3% Odstotek pravilno uvrščenih enot je 70%. Lastniki servisnih podjetij bolj verjamejo kot latniki obrtnih podjetij, da je izboljšanje produktov manj pomembno in bolj pomembna usposobljenost managerjev, dobre politične zveze in izboljšanje marketinških pristopov.

Diskriminantna analiza na več skupinah V primeru več skupin razlike med skupinami popišemo z več diskriminantnimi spremenljivkami. Največ jih je min(p, k 1). Postopek za izračun diskriminantnih spremenljivk Označimo vsoto kvadratov in produktov odklonov od skupnega povprečja x (vse skupine skupaj) T = k n i i=1 j=1 in isto za posamezno skupino W i = n i j=1 Variabilnost znotraj skupin je: (x ij x)(x ij x) (x ij x i )(x ij x i ) W = W 1 + W 2 +... + W k ker velja (podobno kot v univariatni analizi): je T = W + B B = T W kjer je B vsota kvadratov in produktov odklonov med skupinami. Diskriminantni kriterij, ki ga je potrebno maksimizirati, je podoben kot v primeru dveh skupin: variabilnost med skupinami variabilnost znotraj skupin = max

Varianca diskriminantne spremenljivke Y = Xb je Varianca med skupinami je Varianca znotraj skupin pa var Y = b Σb var Y = b Bb var Y = b W b Tedaj je diskriminantni kriterij, ki ga je potrebno maksimizirati: b Bb b W b = max Rešitev dobimo tako, da izraz odvajamo po b in dobimo oziroma (B λw )b = 0 (W 1 B λi)b = 0 Rešitev enačbe so lastne vrednosti in lastni vektorji matrike W 1 B. Lastna vrednost λ i je sorazmerna s skupno varianco, ki je pojasnjena z i-to diskriminantno spremenljivko, ustrezni lastni vektor pa predstavlja uteži i-te diskriminantne spremenljivke. Delež skupne variance, pojasnjene z i-to diskriminantno spremenljivko, je λ i λ i

Zveza med diskriminantno analizo in kanonično korelacijsko analizo V primeru diskriminantne analize imamo k skupin in p merjenih spremenljivk. Za oceno diskriminatnih spremenljivk računamo lastne vrednosti in vektorje matrike W 1 B. Označimo lastne vrednosti z λ da j. Naredimo iz nominalne spremenljivke, ki določa k skupin v diskriminantni analizi, (k 1) dummy spremenljivk. Po drugi strani imamo p merjenih spremenljivk. Za ti dve skupini spremenljivk lahko izračunamo min ((k 1), p) kanoničnih rešitev. Te dobimo z izračunom lastnih vrednosti in lastnih vektorjev matrike Σ 1 XXΣ XY Σ 1 Y Y Σ Y X, ki jih označimo z λ kka j. Velja zveza: λ da j = λkka j 1 λ kka j