Andmeanalüüs molekulaarbioloogias

Σχετικά έγγραφα
Ruumilise jõusüsteemi taandamine lihtsaimale kujule

siis on tegemist sümmeetrilise usaldusvahemikuga. Vasakpoolne usaldusvahemik x i, E x = EX, D x = σ2

Lokaalsed ekstreemumid

Funktsiooni diferentsiaal

2.2.1 Geomeetriline interpretatsioon

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

Kompleksarvu algebraline kuju

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA)

Statistiline andmetöötlus, VL-0435 sügis, 2008

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

PLASTSED DEFORMATSIOONID

Matemaatiline analüüs I iseseisvad ülesanded

Ehitusmehaanika harjutus

Matemaatiline analüüs I iseseisvad ülesanded

4 T~oenäosuse piirteoreemid Tsentraalne piirteoreem Suurte arvude seadus (Law of Large Numbers)... 32

Mitmest lülist koosneva mehhanismi punktide kiiruste ja kiirenduste leidmine

Excel Statistilised funktsioonid

Sisukord. 4 Tõenäosuse piirteoreemid 36

,millest avaldub 21) 23)

sin 2 α + cos 2 sin cos cos 2α = cos² - sin² tan 2α =

Sisukord. 3 T~oenäosuse piirteoreemid Suurte arvude seadus (Law of Large Numbers)... 32

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks

9. AM ja FM detektorid

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused

HAPE-ALUS TASAKAAL. Teema nr 2

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

Veaarvutus ja määramatus

Ülesanne 4.1. Õhukese raudbetoonist gravitatsioontugiseina arvutus

Geomeetrilised vektorid

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397

HULGATEOORIA ELEMENTE

KORDAMINE RIIGIEKSAMIKS VII teema Vektor. Joone võrrandid.

Juhuslik faktor ja mitmetasandilised mudelid

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

Vektorid. A=( A x, A y, A z ) Vektor analüütilises geomeetrias

Ecophon Square 43 LED

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

Compress 6000 LW Bosch Compress LW C 35 C A ++ A + A B C D E F G. db kw kw /2013

T~oestatavalt korrektne transleerimine

2017/2018. õa keemiaolümpiaadi lõppvooru ülesannete lahendused klass

KORDAMINE RIIGIEKSAMIKS V teema Vektor. Joone võrrandid.

AEGLASE SÕIDUKI LIIKLUSOHUTUSEST

Matemaatiline statistika ja modelleerimine

(Raud)betoonkonstruktsioonide üldkursus 33

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

I. Keemiline termodünaamika. II. Keemiline kineetika ja tasakaal

Epidemioloogiliste terminite lühisõnastik

STM A ++ A + A B C D E F G A B C D E F G. kw kw /2013

Deformatsioon ja olekuvõrrandid

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil.

KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD

2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused klass

Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus

Annegrete Peek. Üldistatud aditiivne mudel. Bakalaureusetöö (6 EAP)

6 Mitme muutuja funktsioonid

Arvuti kasutamine uurimistöös

Skalaar, vektor, tensor

Funktsioonide õpetamisest põhikooli matemaatikakursuses

5. TUGEVUSARVUTUSED PAINDELE

Prisma. Lõik, mis ühendab kahte mitte kuuluvat tippu on prisma diagonaal d. Tasand, mis. prisma diagonaal d ja diagonaaltasand (roheline).

ΔΗΜΟΤΙΚΕΣ ΕΚΛΟΓΕΣ 18/5/2014 ΑΚΥΡΑ

Kontrollijate kommentaarid a. piirkondliku matemaatikaolümpiaadi

Anonüümse HIV nõustamise ja testimise teenuse ülevaade aasta. Kristi Rüütel, Natalja Gluškova

Statistiline andmetöötlus VL.0435

HSM TT 1578 EST EE (04.08) RBLV /G

6.6 Ühtlaselt koormatud plaatide lihtsamad

Matemaatika VI kursus Tõenäosus, statistika KLASS 11 TUNDIDE ARV 35

Eesti koolinoorte XLI täppisteaduste olümpiaad

Enam kui kahe grupi keskmiste võrdlus

1. Soojuskiirguse uurimine infrapunakiirguse sensori abil. 2. Stefan-Boltzmanni seaduse katseline kontroll hõõglambi abil.

1 Kompleksarvud Imaginaararvud Praktiline väärtus Kõige ilusam valem? Kompleksarvu erinevad kujud...

Suhteline salajasus. Peeter Laud. Tartu Ülikool. peeter TTÜ, p.1/27

T~OENÄOSUSTEOORIA JA MATEMAATILINE STATISTIKA

Tuletis ja diferentsiaal

1 Funktsioon, piirväärtus, pidevus

; y ) vektori lõpppunkt, siis

Sisukord. 2 Programmeerimiskeel C

Mathematica kasutamine

Krüptoräsid (Hash- funktsioonid) ja autentimine. Kasutatavaimad algoritmid. MD5, SHA-1, SHA-2. Erika Matsak, PhD

MATEMAATILINE ANAL U US II Juhend TT U kaug oppe- uli opilastele

4.1 Funktsiooni lähendamine. Taylori polünoom.

Eesti koolinoorte 50. bioloogiaolümpiaad. Rakubioloogia praktiline töö

SORTEERIMINE JA FILTREERIMINE

II lisa. Teaduslikud järeldused ja positiivse arvamuse alused

Skalaar, vektor, tensor

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

TARTU ÜLIKOOL Teaduskool. STAATIKA TASAKAALUSTAMISTINGIMUSED Koostanud J. Lellep, L. Roots

Matemaatiline statistika ja modelleerimine

2-, 3- ja 4 - tee ventiilid VZ

Vahendid Otsus Analüüs: Analüüsi Riskantseid Otsuseid

Eesti koolinoorte 51. täppisteaduste olümpiaad

Matemaatiline analüüs IV praktikumiülesannete kogu a. kevadsemester

8. KEEVISLIITED. Sele 8.1. Kattekeevisliide. Arvutada kahepoolne otsõmblus terasplaatide (S235J2G3) ühendamiseks. F = 40 kn; δ = 5 mm.

KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS

Teaduskool. Alalisvooluringid. Koostanud Kaljo Schults

5. OPTIMEERIMISÜLESANDED MAJANDUSES

Transcript:

Andmeanalüüs molekulaarbioloogias Praktikum 3 Kahe grupi keskväärtuste võrdlemine Studenti t-test 1

Hüpoteeside testimise peamised etapid 1. Püstitame ENNE UURINGU ALGUST uurimishüpoteesi ja nullhüpoteesi. 2. Valime ENNE UURINGU ALGUST statistilise olulisuse nivoo α. Olulisuse nivoo määrab millises piires oleme me valmis vigu aktsepteerima. 3. Otsustame ENNE UURINGU ALGUST kas tahame teha ühepoolset või kahepoolset testi. ====================== TEOSTAME UURINGU ============================ 4. Valime nullhüpoteesi testimiseks sobiva statistilise testi. 5. Sisestame arvutiprogrammi (Excel, R, vms.) andmed, sooritame testi ning saame vastuseks nullhüpoteesi kehtimise tõenäosuse: P-väärtuse. 6. Võrdleme P-väärtust olulisuse nivoo α-ga. Kui P-väärtus on väiksem olulisuse nivoost, siis loeme tulemuse statistiliselt oluliseks. 7. Sõnastame tulemuse teaduslikus vormis. Tulemuses peaks olema välja toodud sisulise mõju suurus ning tulemuse statistiline olulisus (kas täpse P-väärtusena või statistilisuse olulisuse määrana). 2

Praktikumi teemad 1. Hüpoteeside testimine Student i t-test paarikaupa andmetele Testime, kas ravimi võtmine alandab vererõhku 2. Hüpoteeside testimine Student i t-test mitte-paarikaupa andmetele Võrdleme meeste ning naiste isiksuseomadusi Kasutame isiksuse andmeid, mis on allalaetavad kodulehelt http://bioinfo.ut.ee/amb/amb_praktikum3.xls 3

1. Hüpoteeside testimine Studenti t-test paarikaupa andmetele Küsimus: Kas ravim alandab vererõhku? Etapp 1: Sõnastame uurimishüpoteesi ning nullhüpoteesi Uurimishüpotees: Ravimi võtmise järel on inimeste vererõhk madalam kui enne ravimi võtmist Nullhüpotees: Ravimi võtmise järel on inimeste vererõhk sama, mis enne ravimi võtmist Etapp 2: Valime statistilise usaldusväärtuse nivoo α α = 0.05 Etapp 3: Otsustame, kas kasutame ühepoolset või kahepoolset testi. Kuna küsimus on seotud vererõhu VÄHENEMISEGA, siis võime kasutada ühepoolset testi. 4

1. Hüpoteeside testimine Studenti t-test paarikaupa andmetele Etapp 4: Valime sobiva statistilise testi Antud tüüpi hüpoteesi (kahe grupi keskväärtused ei erine) testimiseks sobib Studenti t-test paarikaupa andmetele Etapp 5: Leiame P-väärtuse Kasutame selleks Exceli funktsiooni =TTEST() Etapp 6: Võrdleme P-väärtust olulise nivooga Etapp 7: Sõnastame tulemuse 5

Keskväärtuse erinevuse testimine Kahe grupi normaaljaotusega jaotunud andmete erinevust saame testida Studenti t- testiga =TTEST(Data1;Data2;Mode;Type) Data1 ja Data2: lahtrid kahe grupi mõõtmistulemustega Mode: ühepoolne test (1) või kahepoolne test (2) Type: 1, 2 või 3 (1) paarikaupa andmed samadelt indiviididelt/objektidelt (2) andmed sõltumatutelt objektidelt, kuid sarnase hajuvusega (3) andmed sõltumatutelt objektidelt, kuid oluliselt erineva hajuvusega t-testi vastuseks saame P-väärtuse (tõenäosus, et kahe grupi keskväärtus ei ole erinev ja sellise keskväärtuse erinevusega valimid on saadud juhuslikult) 6

Keskväärtuse erinevuse testimine Type: 1, 2 või 3 (1) paarikaupa andmed samadelt indiviididelt/objektidelt (2) andmed sõltumatutelt objektidelt, kuid sarnase hajuvusega (3) andmed sõltumatutelt objektidelt, kuid oluliselt erineva hajuvusega tüüp 2 ja tüüp 3 vahel saame valida, kasutades täiendavat statistilist testi (F-testi) või kasutades andmete jaotuse visuaalset hindamist histogrammilt (kui jaotuste laiused on sarnased, siis tüüp 2, kui erinevad, siis tüüp 3). 7

2. Keskväärtuse erinevuse testimine paarikaupa andmetega Töölehel 4.1 Keskv. võrdlemine A on fiktiivsed vererõhu andmed enne ja pärast ravimi kasutamist. Kasutame gruppide erinevuse testimiseks Studenti t-testi: =TTEST(F2:F664,G2:G664,1,1) Leidsime, et P=2.8*10-14 Võrreldes saadud tulemust eelnevalt valitud usaldusväärtuse nivooga (0.05) võime nentida, et tulemus on statistiliselt oluline (kuna P<α). 8

1. Keskväärtuse erinevuse testimine paarikaupa andmetega Leiame samast andmestikust sisulise mõju suuruse (gruppide keskväärtuste vahe) ja sõnastame tulemuse kokkuvõtva lausega. Tulemuse sõnastus: Uuringust selgus, et peale ravimi võtmist oli inimeste vererõhk keskmiselt 5 ühiku võrra madalam kui enne ravimi võtmist. Tulemus oli statistiliselt oluline usaldusväärsuse nivool 0.05. 9

2. Keskväärtuse erinevuse testimine mitte-paarikaupa (sõltumatute) andmetega UURIMISHÜPOTEES: Meeste ja naiste neurootilisuse keskväärtus on erinev. NULLHÜPOTEES: Meeste ja naiste neurootilisuse keskväärtus ei ole erinev. Järgnevalt tuleb valida usaldusväärtuse nivoo ja otsustada, kas teha ühepoolne test või kahepoolne test. Kuna võimalik on mõlemasuunaline erinevus, tuleb antud juhul teha kahepoolne test. Statistilise testi valimiseks oleks esmalt vaja hinnata kummagi grupi neurootilisuse hajuvust, et valida Studenti testi tüüp 2 või tüüp 3. Analüüsi tegemiseks tuleb neurootilisuse andmed sorteerida inimeste soo järgi. 10

2. Keskväärtuse erinevuse testimine mitte-paarikaupa (sõltumatute) andmetega Antud juhul meeste ja naiste hajuvus sarnane, seetõttu võime kasutada tüüp 2 testi. =TTEST(G2:G281,G282:G664,2,2) 11

2. Keskväärtuse erinevuse testimine mitte-paarikaupa (sõltumatute) andmetega Testime: Kas meeste ja naiste neurootilisuse keskväärtus on oluliselt erinev? Tulemusena saame P-väärtuseks 2.89*10-4 Arvutame ka mõju sisulise suuruse (antud juhul keskväärtuste vahe). Tulemuse korrektne tõlgendus: Naiste neurootilisuse keskväärtus on 7 punkti võrra kõrgem kui meeste neurootilisuse keskväärtus. Erinevus on statistiliselt väga oluline (P<0.01). 12

2. Keskväärtuse erinevuse testimine sõltumatute andmegruppidega Testime: Kas meeste ja naiste ekstravertsuse (E), avatuse (O), põikpäisuse (A) ja meelekindluse (C) keskväärtus on oluliselt erinev? 13

3. Keskväärtuse erinevuse testimine katseandmetega Ühes bakalaureusetöös sooviti määrata kas regulaatorvalk p53 mõjutab geeniekspressiooni. Katsesüsteemi testimiseks sooritati positiivne kontrollkatse. Rakkudesse viidi reporterplasmiid, millel oli p53 valgu poolt represseeritav promootor ning selle taga lutsiferaasi tootev geen. Katseliselt mõõdeti lutsiferaasi aktiivsust tassidel a) kuhu oli p53 valku rakkudesse viidud või b) tassidel, kus rakkudesse p53 ei olnud lisatud. Kõigi analüüsitavate plasmiididega tehti 3 korduskatset. Saadi järgmised tulemused: Katse 1 Katse 2 Katse3 P53+ 65 72 23 P53-335 395 174 Kas positiivne kontroll töötas? 14

3. Keskväärtuse erinevuse testimine katseandmetega Ühes bakalaureusetöös sooviti määrata kas regulaatorvalk p53 mõjutab geeniekspressiooni. Katsesüsteemi testimiseks sooritati positiivne kontrollkatse. Rakkudesse viidi reporterplasmiid, millel oli p53 valgu poolt represseeritav promootor ning selle taga lutsiferaasi tootev geen. Katseliselt mõõdeti lutsiferaasi aktiivsust tassidel a) kuhu oli p53 valku rakkudesse viidud või b) tassidel, kus rakkudesse p53 ei olnud lisatud. Kõigi analüüsitavate plasmiididega tehti 3 korduskatset. Kas positiivne kontroll töötas? Jah, lutsiferaasi aktiivsuse keskväärtus on p53 juuresolekul 5,6 korda väiksem. Erinevus on statistiliselt oluline (P=0,029). 15

4. Eelnevate oskuste värskendamine Ühes bakalaureusetöös sooviti määrata kas regulaatorvalk p53 mõjutab geeniekspressiooni. Katsesüsteemi testimiseks sooritati positiivne kontrollkatse. Rakkudesse viidi reporterplasmiid, millel oli p53 valgu poolt represseeritav promootor ning selle taga lutsiferaasi tootev geen. Katseliselt mõõdeti lutsiferaasi aktiivsust tassidel a) kuhu oli p53 valku rakkudesse viidud või b) tassidel, kus rakkudesse p53 ei olnud lisatud. Kõigi analüüsitavate plasmiididega tehti 3 korduskatset. Joonistage p53+ ja p53- rakkude lutsiferaasi aktiivsusi kirjeldav tulpdiagramm koos 95% usalduspiiridega. 16