Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA)

Σχετικά έγγραφα
Andmeanalüüs molekulaarbioloogias

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

PLASTSED DEFORMATSIOONID

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

Funktsiooni diferentsiaal

Ruumilise jõusüsteemi taandamine lihtsaimale kujule

siis on tegemist sümmeetrilise usaldusvahemikuga. Vasakpoolne usaldusvahemik x i, E x = EX, D x = σ2

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

Lokaalsed ekstreemumid

9. AM ja FM detektorid

Enam kui kahe grupi keskmiste võrdlus

Geomeetrilised vektorid

2.2.1 Geomeetriline interpretatsioon

T~oestatavalt korrektne transleerimine

HAPE-ALUS TASAKAAL. Teema nr 2

HULGATEOORIA ELEMENTE

Kompleksarvu algebraline kuju

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

Ehitusmehaanika harjutus

Suhteline salajasus. Peeter Laud. Tartu Ülikool. peeter TTÜ, p.1/27

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil.

Matemaatiline analüüs I iseseisvad ülesanded

Matemaatiline statistika ja modelleerimine

Statistiline andmetöötlus, VL-0435 sügis, 2008

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

Matemaatiline analüüs I iseseisvad ülesanded

Epidemioloogiliste terminite lühisõnastik

Kandvad profiilplekid

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

Kontekstivabad keeled

τατιςτική ςτην Εκπαίδευςη II

Εισαγωγή στην Ανάλυση Διακύμανσης

Krüptoräsid (Hash- funktsioonid) ja autentimine. Kasutatavaimad algoritmid. MD5, SHA-1, SHA-2. Erika Matsak, PhD

Veaarvutus ja määramatus

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

2. Normi piiride määramine (R.D. Smith)

Juhuslik faktor ja mitmetasandilised mudelid

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

4 T~oenäosuse piirteoreemid Tsentraalne piirteoreem Suurte arvude seadus (Law of Large Numbers)... 32

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Ülesanne 4.1. Õhukese raudbetoonist gravitatsioontugiseina arvutus

Arvuti kasutamine uurimistöös

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks

Eesti koolinoorte XLIX täppisteaduste olümpiaad

Sisukord. 3 T~oenäosuse piirteoreemid Suurte arvude seadus (Law of Large Numbers)... 32

KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD

RF võimendite parameetrid

Matemaatika VI kursus Tõenäosus, statistika KLASS 11 TUNDIDE ARV 35

Matemaatiline statistika ja modelleerimine

Statistiline andmetöötlus VL.0435

Annegrete Peek. Üldistatud aditiivne mudel. Bakalaureusetöö (6 EAP)

,millest avaldub 21) 23)

Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist

Lexical-Functional Grammar

Vahendid Otsus Analüüs: Analüüsi Riskantseid Otsuseid

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008

KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS

Algebraliste võrrandite lahenduvus radikaalides. Raido Paas Juhendaja: Mart Abel

Matemaatiline statistika ja modelleerimine

Semantiline analüüs. Süntaksipuu dekoreeritakse tüübi- ja muu kontekstist sõltuva

Compress 6000 LW Bosch Compress LW C 35 C A ++ A + A B C D E F G. db kw kw /2013

Eesti koolinoorte 43. keemiaolümpiaad

Sisukord. 4 Tõenäosuse piirteoreemid 36

HSM TT 1578 EST EE (04.08) RBLV /G

Funktsioonide õpetamisest põhikooli matemaatikakursuses

ANALÜÜTILINE TÕENDAMINE. Juhend

1 Entroopia ja informatsioon

(Raud)betoonkonstruktsioonide üldkursus 33

AEGLASE SÕIDUKI LIIKLUSOHUTUSEST

4.1 Funktsiooni lähendamine. Taylori polünoom.

Skalaar, vektor, tensor

Arvuti kasutamine uurimistöös

Tuletis ja diferentsiaal

Aritmeetilised ja loogilised operaatorid. Vektor- ja maatriksoperaatorid

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Sõiduki tehnonõuded ja varustus peavad vastama järgmistele nõuetele: Grupp 1 Varustus

1 Funktsioon, piirväärtus, pidevus

Profile Analysis Ανάλυση προφίλ

KATEGOORIATEOORIA. Kevad 2016

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397

Kas Androidi ostmiseks on õige aeg? Eesti esimene võrdlustest!

Formaalsete keelte teooria. Mati Pentus

KATEGOORIATEOORIA. Kevad 2010

Skalaar, vektor, tensor

Vektoralgebra seisukohalt võib ka selle võrduse kirja panna skalaarkorrutise

AKU. Arvuti kasutamine uurimistöös

Analüütilise geomeetria praktikum II. L. Tuulmets

2. HULGATEOORIA ELEMENTE

Prisma. Lõik, mis ühendab kahte mitte kuuluvat tippu on prisma diagonaal d. Tasand, mis. prisma diagonaal d ja diagonaaltasand (roheline).

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE

ISC0100 KÜBERELEKTROONIKA

2. Normi piiride määramine

ELEKTRIMÕÕTMISTE TÄIENDKOOLITUS

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Smith i diagramm. Peegeldustegur

Transcript:

Kursus: Mitmemõõtmeline statistika Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA) Õppejõud: Katrin Niglas PhD, dotsent informaatika instituut Statistilise olulisustesti põhisammud: E I: Analüüsisin olemasolevaid andmeid kirjeldava statistika meetodite abil ning leidsin midagi huvitavat (nt. erinevuse või seose jne) E II : Tekkis küsimus: Kas võib üldistada? Ü V Ü (v eksperimentaalne disain) I. Õige olulisustesti valik (lähtuvalt probleemist ja andmetüübist) II. Valitud olulisustesti eelduste kontroll: III. Hüpoteesid: sisukas hüpotees H 1: IV. nullhüpotees H 0: Olulisuse nivoo α ( Kui väike peab olema H 0 kehtimise tõenäosus, et me võiks ilma suurema riskita ta mittekehtivaks tunnistada? ) Arvutused eesmärgiks hinnata H 0 kehtimise tõenäosust p ( Kui suur on tõenäosus, et olukorras, kus H 0 kehtib, tekkis valmis olnud erinevus v seos juhuse tõttu? ) (p = Sig = olulisuse tõenäosus) V. Otsus tulemuse kohta: p > α p α H 0 jääb kehtima - statistiliselt mitte oluline (ei üldista) H 1 tõestatud - statistiliselt oluline (võib üldistada) ei jah VI. Järelduse sõnastamine 1

MANOVA Rohkem kui ühe tunnuse keskmiste võrdlemine ühe või mitme grupeeriva tunnuse lõikes Mitu sõltuvat tunnust (arvtunnused) /tähist: DV/ Üks või mitu sõltumatut tunnust ehk faktorit/faktortunnust /tähist: IV/ (objekte gruppidesse jagavad tunnused ehk tunnused, millel on 2 või enam selgesti eristuvat taset st väärtust) faktoriaalne MANOVA ANOVA edasiarendus, kus testitakse sõltumatute tunnuste e faktorite mõju sõltuvate tunnuste kombinatsioonile Arendatud eksperimentaalsete uuringute jaoks (rakendatav ka mujal) MANOVA lihtne näide Eksperiment: katseisikuteks on 30 sundkäitumise sündroomiga patsienti Sundkäitumise sündroom väljendub sundmõtete mõtlemises ja sundtegevuste sooritamises (mida eksperimendis teatud raviga püütakse vähendada) => kaks sõltuvat tunnust mõtted ja tegevused Kaks erinevat raviviisi, mille mõju patsientidele tahetakse uurida. Eksperimendis jagatakse patsiendid kolme rühma: 1. käitumuslik lähenemine 2. kognitiiv-käitumuslik lähenemine 3. kontrollgrupp / ilma ravita => üks sõltumatu tunnus e kolme tasemega mõjutav faktor 2

MANOVA Koostatakse uus DV, mis on algsete DV-de selline lineaarkombinatsioon, mis eristab IV-de poolt määratud gruppe võimalikult hästi /nimetatakse vahest diskriminatfuntsiooniks/ Faktoriaalsete disainide puhul koostatakse iga IV peamõju ja koosmõju jaoks eraldi DV-de kõige sobivamad st gruppe kõige paremini eristavad lineaarkombinatsioonid Testitakse: Kas kombineeritud DV keskväärtuse erinevused gruppide vahel võivad olla tingitud juhusest? PS! IV-de mõju algsetele sõltuvatele tunnustele eraldi ei vaadelda! Miks eelistada MANOVA t (mitmele) ANOVA le Mitu DV-d => suurem (ja suhteliselt odav) võimalus leida erinevusi gruppide vahel st leida see aspekt, mida IV-d ehk faktorid (oluliselt) mõjutavad Nähtused, mille puhul on raske määratleda, mis on täpseim indikaator Väiksem oht teha I liiki viga (põhimõtteliselt sama loogika, miks teha ANOVA ja mitte mitut t-testi) Latentsed ehk peidetud tunnused => teatud tingimustel, mis siiski tihti ei esine, võib juhtuda, et kombineeritud tunnusele on efekt, aga algtunnustele mitte st MANOVA näitab erinevusi, aga ANOVA d mitte PS! MANOVA kasutamiseks peaks DV d olema kontseptuaalselt seotud! 3

MANOVA eeldused Sõltuvad tunnused: arvtunnused (st praktikas võrdsete vahedega skaala) Tundlik ekstreemsete väärtuste suhtes Sõltuvad tunnused võiks olla mõõdukalt ja lineaarselt korreleeritud (mittetäidetuse puhul madal võimsus, sest DV de lineaarkombinatsioon ei maksimeeri gruppide eraldamist) Sõltumatu(d) tunnus(ed): väheste väärtustega nn grupeeriv(ad) tunnus(ed) (NB! Sõltumatute ja sõltuvate gruppide/valimite jaoks eraldi testid!) Valimi suurus: igas grupis rohkem objekte kui on sõltuvaid tunnuseid (mittetäidetuse korral madal võimsus ning hajuvust puudutava eelduse täidetuse kontroll mittekorrektne) MANOVA eeldused Normaaljaotus Suhteliselt robustne mõõdukate kõrvalekallete suhtes (v.a ekstreemsetest väärtuste tingitud kõrvalekalded) PS! Kui valimite suurus üle 20 siis tavaliselt selle eelduse suhtes robustne Gruppide hajuvuste võrdsus MANOVA puhul dispersioonide ja kovariatsioonimaatriksite võrdsus! Testimiseks: Box s M Test Kui gruppide suurused on võrdsed, siis peetakse MANOVA teste robustseteks selle eelduse suhtes (st Box i testi võib ignoreerida). Kui gruppide suurused ei ole võrdsed ning Box i M < 0,001, siis ei ole testide/üldistuste korrektsus tagatud. 4

MANOVA hüpoteeside püstitus Hüpoteesid analoogsed ANOVA le (algse sõltuva tunnuse asemel võrreldakse kombineeritud tunnuse keskväärtusi). Kui faktoriaalne disain, siis testitakse rohkem kui ühte hüpoteeside paari (iga peamõju ja iga koosmõju kohta eraldi)! Nullhüpoteesid: Erinevused üldkogumis /vastavate/ gruppide keskväärtuste vahel puuduvad Peamõju kirjeldavate testide sisukas hüpotees: Vähemalt ühel /vastava/ faktori tasemel e ühel /antud/ tunnuse poolt moodustunud grupil on üldkogumis teistest erinev keskväärtus ehk antud faktor e tunnus mõjutab tulemust (on tulemusega seotud) MANOVA hüpoteeside püstitus Koosmõju kirjeldavate testide sisukas hüpotees: Vähemalt ühe /antud/ faktorite tasemekombinatsioonide paari korral on keskmiste erinevus gruppide vahel teistest paaridevahelistest keskmiste erinevustest üldkogumis erinev ehk ühe faktori efekt/mõju tulemusele sõltub teise faktori tasemetest ehk ühe faktori efekt/mõju tulemusele on teise faktori poolt moodustatud gruppides erinev NB! Faktor = sõltumatu tunnus faktori tase = sõltumatu tunnuse väärtus = üks võrreldav grupp PS! Koosmõju on statistilises mõttes sümmeetriline! 5

MANOVA testid hüpoteeside kontrollimiseks Pakutakse nelja testi F-statistiku ja selle stat. olulisuse hindamiseks: Pillai-Bartlett Trace Wilks Lambda *** Kui faktoril on ainult 2 taset/gruppi (st df=1) annavad kõik sama F-i Kui gruppe on rohkem (st df>1) siis F erinev, kuid stat.olulisuse osas tavaliselt sama tulemus R maksimeerib esimese grupi erinevuse teiste suhtes, ülejäänud püüavad leida lahendi, mis maksimeerib erinevused summaarselt Kõige levinum Wilks Lambda Hotelling s T2 Roy s largest root W, H ja R on võimsamad, kuid P on eeldustest kõrvalekallete suhtes robustsem st väikeste ja mitte võrdsete hajuvustega gruppide korral P! MANOVA järeltestid I Kui põhitestidega on leitud mõne faktori statistiliselt oluline peamõju või faktorite koosmõju kombineeritud sõltuvale tunnusele, siis tekivad täiendavad küsimused: I. Kui tugev on vastav mõju?... kui suure osa kombineeritud DV variatiivsusest kirjeldab vastav faktor või faktorite koosmõju? Effect size => partial Eta Squared (osalise eta ruut) => tõlgendatav kirjeldusmäärana protsentides 6

MANOVA järeltestid II Kui põhitestidega on leitud mõne faktori peamõju või faktorite koosmõju kombineeritud sõltuvale tunnusele, siis: II. Kas ja milliste algsete DV de jaoks on see mõju statistiliselt oluline? Kõige sagedamini kasutatakse ühemõõtmelisi ANOVA sid (NB! Eriti sobiv kui DV d on suhteliselt nõrgalt korreleeritud) Kui DV d on tugevalt korreleeritud, siis võiks kasutada Roy-Bergmanni stepdown analüüsi. Idee: DV d seatakse teoreetilistest kaalutlustest lähtuvalt prioriteetsuse järjekorda; mõju kõige kõrgema prioriteediga DV le testitakse ANOVA ga, ülejäänud DV dele aga järjestikustes ANCOVA des, kus kõrgema prioriteediga DV d võetakse mudelisse kui kovariandid ja vaadatakse, kas uus DV lisab midagi juba testitud DV de kombinatsioonile. MANOVA järeltestid III Kui põhitestidega on leitud mõne rohkem kui kahte taset/gruppi eristava faktori peamõju või faktorite koosmõju, siis: III. Milliste gruppide vahel on olulised erinevused? SPSS is palju erinevaid võimalusi paariviisilisteks võrdlusteks (iga DV jaoks tehakse analüüs eraldi): Marginal means gruppe kirjeldavad arvnäitajad, gruppide paariviisilised võrdlused (Bonferroni, Sidak) ja ühemõõtmelised olulisustestid Post hoc tests palju erinevaid paariviisilise võrdluse teste; levinuimad: Bonferroni, Tukey ja Scheffe Contrasts erinevused gruppide vahel võivad osutuda st.oluliseks ka siis, kui ühemõõtmelised testid st.olulisust ei näita 7

MANOVA järeltestid IV MANOVA on pööratud diskriminantanalüüs (ja vastupidi) MANOVA: mitu arvtunnust DV ks <= üks või enam grupeerivat tunnust IV ks Diskriminatanalüüs: üks või enam grupeerivat tunnust DV ks <= mitu arvtunnust IV ks Idee: mudelis olevate tunnuste vaheliste seoste detailsemaks analüüsiks arvutatakse nii MANOVA kui diskriminantanalüüsi tulemused Statistilise olulisustesti põhisammud: E I: Analüüsisin olemasolevaid andmeid kirjeldava statistika meetodite abil ning leidsin midagi huvitavat (nt. erinevuse või seose jne) E II : Tekkis küsimus: Kas võib üldistada? Ü V Ü (v eksperimentaalne disain) I. Õige olulisustesti valik (lähtuvalt probleemist ja andmetüübist) II. Valitud olulisustesti eelduste kontroll: III. Hüpoteesid: sisukas hüpotees H 1: IV. nullhüpotees H 0: Olulisuse nivoo α ( Kui väike peab olema H 0 kehtimise tõenäosus, et me võiks ilma suurema riskita ta mittekehtivaks tunnistada? ) Arvutused eesmärgiks hinnata H 0 kehtimise tõenäosust p ( Kui suur on tõenäosus, et olukorras, kus H 0 kehtib, tekkis valmis olnud erinevus v seos juhuse tõttu? ) (p = Sig = olulisuse tõenäosus) V. Otsus tulemuse kohta: p > α p α H 0 jääb kehtima - statistiliselt mitte oluline (ei üldista) H 1 tõestatud - statistiliselt oluline (võib üldistada) ei jah VI. Järelduse sõnastamine 8

F-jaotuste pere Kursus: Mitmemõõtmeline statistika Seminar II: Kordusmõõtmistega ANOVA ja MANOVA Õppejõud: Katrin Niglas PhD, dotsent informaatika instituut 9

Kordusmõõtmistega ANOVA ja MANOVA Sõltuvad valimid => kõigis võrreldavates gruppides on samad (katse)isikud Näiteid: Uurijat huvitavad muutused ajas (testitakse/mõõdetakse/küsitletakse samu inimesi teatud ajavahemike tagant sama tunnuse osas) Eeltest ja indiviidide taseme määramine enne mõjutamist (treatment) võimaldab mõju statistiliselt täpsemalt hinnata Uurija rakendab erinevaid eksperimentaalseid tingimusi samadele isikutele (eraldi gruppidele rakendades oleks vaja tunduvalt suuremat valimit) Uurija tahab võrrelda erinevate tunnuste keskmisi sama sihtrühma/üldkogumi puhul (nt Mida tähtsustavad uuritavad enam? Kas hoiakud eri asjade suhtes erinevad? Kas mõne väitega nõustutakse enam kui teisega? jne ) Kordusmõõtmistega ANOVA ja MANOVA Idee: gruppide vaheliste erinevuste asemel lähtutakse objektidest/indiviididest tulenevatest erinevustest st iga indiviidi jaoks arvutatakse võrreldavate tunnuste väärtuste erinevus/vahe ning võetakse arvesse tunnuste omavahelist korrelatsiooni. F-suhtena leitakse kui suur osa indiviidist lähtuvast variatiivsusest on süstemaatiline/mõjutamisest_tulenev võrreldes juhusliku indiviidist lähtuva variatiivsusega Grupipõhine võrdlus between-subjectsdesign Indiviidipõhine võrdlus within-subjectdesign Segamudelid 10

Kordusmõõtmistega ANOVA ja MANOVA Eeldused: ANOVA st tuttav gruppidevaheliste hajuvuste sarnasuse nõue on asendatud: Sfäärilisus (sphericity) kordusmõõtmiste põhjal arvutatud vahede hajuvus peab olema sarnane Mauchly s test H0: vahede hajuvus on sarnane H1: vahede hajuvus on erinev Kui nullhüpotees tuleb ümber lükata, mistõttu eeldust ei saa täidetuks pidada, siis: kui e (Epsilon) > 0.75 -> kasuta Huyn-Feldt parandust kui e (Epsilon) < 0.75 -> kasuta Greenhouse-Geiser parandust 11