Praktikum 2. Kommentaarid andmestiku kohta

Σχετικά έγγραφα
Mõõtmised, andmetöötlus ja automaatika lihanduses ja piimanduses, VL-1112 & VL-1122

Mõõtmised, andmetöötlus ja automaatika lihanduses ja piimanduses, VL-1112 & VL-1122

Statistiline andmetöötlus, VL-0435 sügis, 2008

Ruumilise jõusüsteemi taandamine lihtsaimale kujule

Mõõtm., andmetöötlus ja autom. piimanduses ja lihanduses, VL-1112 ja VL-1122 Praktikum 1

Praktikum 1. Matemaatiline statistika ja modelleerimine, DK.0007

Andmete haldus ja analüüs MS Excelis Praktikum 1

Andmeanalüüs molekulaarbioloogias

Matemaatiline statistika ja modelleerimine

Funktsiooni diferentsiaal

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

2.2.1 Geomeetriline interpretatsioon

SORTEERIMINE JA FILTREERIMINE

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

Matemaatiline analüüs I iseseisvad ülesanded

Matemaatiline analüüs I iseseisvad ülesanded

Matemaatiline statistika ja modelleerimine

Kompleksarvu algebraline kuju

Lokaalsed ekstreemumid

Ehitusmehaanika harjutus

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

PLASTSED DEFORMATSIOONID

HAPE-ALUS TASAKAAL. Teema nr 2

Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus

Excel Statistilised funktsioonid

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks

KORDAMINE RIIGIEKSAMIKS VII teema Vektor. Joone võrrandid.

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

Geomeetrilised vektorid

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

KORDAMINE RIIGIEKSAMIKS V teema Vektor. Joone võrrandid.

sin 2 α + cos 2 sin cos cos 2α = cos² - sin² tan 2α =

HULGATEOORIA ELEMENTE

Matemaatilised ja trigonomeetrilised funktsioonid

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil.

Eesti elektrienergia hinna analüüs ja ühesammuline prognoosimine ARIMA tüüpi mudelitega

T~oestatavalt korrektne transleerimine

Funktsioonide õpetamisest põhikooli matemaatikakursuses

Kontekstivabad keeled

Eesti LV matemaatikaolümpiaad

Sissejuhatus mehhatroonikasse MHK0120

Kontrollijate kommentaarid a. piirkondliku matemaatikaolümpiaadi

Eesti koolinoorte XLIX täppisteaduste olümpiaad

I. Keemiline termodünaamika. II. Keemiline kineetika ja tasakaal

1. Paisksalvestuse meetod (hash)

Mathematica kasutamine

1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD

Ecophon Square 43 LED

1 Funktsioon, piirväärtus, pidevus

Enam kui kahe grupi keskmiste võrdlus

MATEMAATILISEST LOOGIKAST (Lausearvutus)

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

Ενότητα 21 Pivot Tables

HSM TT 1578 EST EE (04.08) RBLV /G

Krüptoräsid (Hash- funktsioonid) ja autentimine. Kasutatavaimad algoritmid. MD5, SHA-1, SHA-2. Erika Matsak, PhD

9. AM ja FM detektorid

Energiabilanss netoenergiavajadus

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397

20. SIRGE VÕRRANDID. Joonis 20.1

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

MateMaatika õhtuõpik

Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist

Parim odav. nutitelefon

Analüütilise geomeetria praktikum II. L. Tuulmets

Prisma. Lõik, mis ühendab kahte mitte kuuluvat tippu on prisma diagonaal d. Tasand, mis. prisma diagonaal d ja diagonaaltasand (roheline).

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008

2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused klass

MATEMAATILINE ANAL U US II Juhend TT U kaug oppe- uli opilastele

DEF. Kolmnurgaks nim hulknurka, millel on 3 tippu. / Kolmnurgaks nim tasandi osa, mida piiravad kolme erinevat punkti ühendavad lõigud.

Arvuti kasutamine uurimistöös

6.6 Ühtlaselt koormatud plaatide lihtsamad

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused

PÕHIKOOLI LÕPUEKSAM FÜÜSIKA 16. JUUNI Kool: Maakond/linn: Õpilase ees- ja perekonnanimi: MEELESPEA

1 MTMM Kõrgem matemaatika, eksamiteemad 2014

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE

Veaarvutus ja määramatus

1 Kompleksarvud Imaginaararvud Praktiline väärtus Kõige ilusam valem? Kompleksarvu erinevad kujud...

Milline navi on Androidi

Sisukord. 2 Programmeerimiskeel C

Programmeerimise eksamiülesannete kogu

Kandvad profiilplekid

Smith i diagramm. Peegeldustegur

Sirgete varraste vääne

1 Reaalarvud ja kompleksarvud Reaalarvud Kompleksarvud Kompleksarvu algebraline kuju... 5

ANTENNID JA RF ELEKTROONIKA

Algebraliste võrrandite lahenduvus radikaalides. Raido Paas Juhendaja: Mart Abel

Pinge. 2.1 Jõud ja pinged

Skalaar, vektor, tensor

4.1 Funktsiooni lähendamine. Taylori polünoom.

Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA)

; y ) vektori lõpppunkt, siis

Vektor. Joone võrrand. Analüütiline geomeetria.

Sisukord. 4 Tõenäosuse piirteoreemid 36

KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS

Pesumasin Πλυντήριο ρούχων Mosógép Veļas mašīna

MATEMAATIKA KITSA JA LAIA KURSUSE RIIGIEKSAM

Transcript:

Praktikum 2 Salvestage kursuse kodulehelt omale arvutisse andmestik lammas.xls (http://ph.emu.ee/~ktanel/vl_1112/lammas.xls). Kommentaarid andmestiku kohta Lammaste andmebaas on moodustatud aastal 2003 ja selles andmebaasis on samas tapamajas tapetud ja hinnatud 686 lamba (56-lt omanikult) rümpade andmed. Igale rümbale on määratud rümba kategooria väärtustega L ja S (vastavalt alla 12 kuu vanuste lammaste e tallede rümbad ja kõigi ülejäänud lammaste rümbad), lihakusklass väärtustega E, U, R, O, P ja P- (tegu on EUROP klassifitseerimisega, mis on EL riikides kehtiv lihakehade klassifitseerimissüsteem, kus hinnatakse iga lihakeha kommertsväärtust: E ekstra, U väga hea, R hea, O rahuldav, P lahja, P- eriti lahja), rasvasusklass väärtustega 1 kuni 5 (1 väherasvane, 2 kergelt rasvane, 3 keskmiselt rasvane, 4 rasvane ja 5 väga rasvane). Lisaks on fikseeritud ka see, kas loom oli pärit jõudluskontrollialusest karjast või mitte (vastavalt 1 või 0), kas realiseerimine leidis aset läbi ELaS-i turustusgrupi või mitte (vastavalt 1 või 0), samuti on teada rümba mass (kg) ja hind (EEK), mille alusel on arvutatud rümba 1 kg hind (EEK/kg). Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 1

Ülesanded Praktikumi tehniline pool hõlmab peamiselt PivotTable ja diagrammide kasutamist MS Excelis, lisaks ka veel χ 2 -testi, regressioonanalüüsi ja t-testi. 1. Kirjeldage lammaste jagunemist EUROP klassifitseerimissüsteemi alusel, leides erinevatesse klassidesse kuuluvate rümpade arvud ja protsendid (seda siis kolme tunnuse tarvis rümba üldkategooria, lihakusklass ja rasvasusklass). o Kui mõnda lihakus- ja/või rasvasusklassi kategooriat esineb väga vähe, pange see kokku sarnase naaberkategooriaga. o Illustreerige saadud tabeleid sektordiagrammidega, kirjutades igale sektorile juurde sellele vastava väärtuse ja esinemise suhtelise sageduse protsentides. 2. Kas rümpade jagunemine rasvasusklassidesse sõltub rümba üldkategooriast? o Võimaliku seose kirjeldamiseks konstrueerige (uuele töölehele) vastav kahemõõtmeline sagedustabel, viimasesse leidke nii rea- kui ka veeruprotsendid ja sõnastage lause(d), kasutades vähemalt kahte leitud suhtelistest sagedustest. o Testige rümpade üldkategooriatesse ja rasvasuklassidesse jagunemise vahelise seose statistilist olulisust. Konstrueerige uus kahemõõtmeline sagedustabel, mis sisaldab üksnes absoluutseid sagedusi, selle alusel arvutage tunnuste sõltumatuse juhule (nullhüpoteesile) vastavad sagedused ja teostage funktsiooni CHI.TEST abil χ 2 -test viimane võrdleb empiirilisi (andmetabelist arvutatud) sagedusi teoreetiliste (sõltumatuse juhule vastavate) sagedustega ja väljastab olulisuse tõenäosuse p väärtuse. Sõnastage lõppjäreldus (viidates sõnastuses ka p-väärtusele, millel järeldus baseerub). 3. Prognoosige tallerümpade 1 kg hinda lähtuvalt rümba massist. Kui palju võinuks 2002. aasta sügisel keskmiselt raha saada 20 kg kaaluva tallerümba eest. o Esmalt sorteerige/filtreerige algandmed vastavalt rümpade üldkategooriale ja tehke uuele töölehele koopia tallerümpade massidest ja 1 kg hindadest. o Teostage regressioonanalüüs graafiliselt. Selleks laske Excelil joonistada hajuvusdiagramm (punktdiagramm), kus x-teljel paiknevad rümpade massid ja y-teljel hinnad. Valmis diagrammile lisage regressioonisirge, regressioonivõrrand ja viimase baasil saadavate prognooside täpsust kirjeldav determinatsioonikordaja R 2. Lisaks tavalisele lineaarsele regressioonanalüüsile sobitage punktiparvest läbi ka ruutfunktsiooni graafik ning tellige sellegi tarvis Excelilt võrrand ja R 2 (parema võrdlemise huvides värvige vastav joon ja parameetrid näiteks punaseks). Kumba seost lineaarset või ruutseost eelistada tallerümba 1 kg hinna prognoosimisel? Miks? o Pange töölehele kirja regressioonivõrrand ja prognoosige 20 kg kaaluva tallerümba hinda. Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 2

ÜLESANNE 1. --- Sagedustabel PivotTable ga --- Kirjeldage lammaste jagunemist EUROP klassifitseerimissüsteemi alusel, leides erinevatesse klassidesse kuuluvate rümpade arvud ja protsendid (seda siis kolme tunnuse tarvis rümba üldkategooria, lihakusklass ja rasvasusklass). 1. Konstrueerime järgnevalt näitena sagedustabeli rümba lihakusklassi kohta, analoogselt käib sagedustabelite tegemine ka rümba üldkategooriale ja rasvasusklassile. Paigutage kursor andmetabeli suvalisse lahtrisse Insert-sakk PivotTable Loodava tabeli vasaku ülemise nurga asukoht Tulemus: Tulemuseks saadud sagedustabel: Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 3

Vaikimisi arvutab Excel lammaste numbrite summa Et selle asemel lihtsalt kokku lugeda, kui mitu lammast mingisse lihakusklassi kuulus, tuleb ära muuta PivotTable-s kasutatav funktsioon (Sum asemel Count): PivotTable Tools-sakk Options Summarize Values By Alternatiivina võib PivotTable-s rakendatavat funktsiooni muuta ka a) klikkides tabelil hiire parempoolse nupuga või b) klikkides PivotTable konstrueerimise aknas lahtris Values muuta soovitava funktsiooni järel paikneval kolmnurgal: a) b) Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 4

Lihakusklasside sisuliselt õiges järjekorras esitamiseks (Excel sorteerib tähestikulises, mitte sisulises järjekorras) on lihtsaim variant vales kohas olev klass lihtsalt ümber tõsta (klikkides selleks klassi nimel (näiteks lahtril P ) ja tõstes lahtri servast kinni hoides õigesse kohta): Tulemus: Lisaks absoluutsetele sagedustele võiks leida ka suhtelised sagedused. d) c) a) a) Lohistage PivotTable Field List s tunnus Lammas ka teine kord lahtrisse Values; b) nõudke, et Excel jagaks tabeli erinevate funktsioonide alusel ridadeks, mitte veergudeks (lohistage kastike Σ Values lahtrisse Row Labels); c) määrake vajadusel ka uue rea tarvis funktsiooniks Count (Sum asemel) ning d) nõudke väärtuste esitamist protsentidena (PivotTable Tools-sakk Options Show Values As % of Row Total). b) Tulemus: Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 5

Et paremaks kui hea (kood E ) on hinnatud vaid üht rümpa, võiks selle ühendada grupiga R (moodustada uus grupp vähemalt hindega hea rümbad). Grupeerige analoogsel viisil ka lahjad ja eriti lahjad rümbad (grupid P ja P-, sest ega seal suurt vahet pole). Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 6

2. PivotTable i abil konstrueeritud tabeli põhjal kenade jooniste tegemiseks on sageli mõttekas teha vajalikest väärtustest abitabel ja joonistada diagramm abitabeli alusel. Põhjuseks on see, et otse PivotTable alusel joonise tegemise tulemuseks on nn PivotChart, mis on sarnaselt PivotTable ga lingitud andmetabeliga, seeläbi kergesti täiendatav ja ümberarvutatav, aga ei võimalda muuta kõike tavalisel Exceli diagrammil muudetavat (või on see märksa keerulisem). Copy Järgnevalt andke lihakusklassidele sisuliselt õiged nimed trükkige need moodustatud abitabelisse ja konstrueerige abitabeli vastavate lahtrite alusel sektordiagramm. Kujundage saadud joonis (lisage sektoritele vastavate lihakusklasside nimed ja esinemissagedused, muutke soovi korral värve): 3. Viimaks konstrueerige sagedustabelid ja joonistage nende alusel sektordiagrammid ka rümba (üld)kategooriale ja rasvasusklassile (kui tundub, et aega üle jääb). Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 7

ÜLESANNE 2. --- Kahemõõtmeline sagedustabel ja χ 2 -test --- Kas rümpade jagunemine rasvasusklassidesse sõltub rümba üldkategooriast? 1. Võimaliku seose kirjeldamiseks konstrueerige (uuele töölehele) vastav kahemõõtmeline sagedustabel, viimasesse leidke nii rea- kui ka veeruprotsendid ja sõnastage lause(d), kasutades vähemalt kahte leitud suhtelistest sagedustest. Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 8

Muutke kõik kolm Exceli poolt leitud summat vaatluste arvudeks (Sum Count): ning esitage teine ja kolmas vaatluste arv (Count of Lammas 2 ja 3) vastavalt rea- ja veeruprotsendina: Tulemus: Kommentaarid (sõnastage lause(d), kasutades vähemalt kahte leitud suhtelistest sagedustest) Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 9

2. Testige rümpade üldkategooriatesse ja rasvasuklassidesse jagunemise vahelise seose statistilist olulisust. Esmalt et oleks selge, mida te üldse testite pange esmalt kirja kontrollitav hüpoteeside paar). Järgnevalt konstrueerige uus kahemõõtmeline sagedustabel, mis sisaldab üksnes absoluutseid sagedusi, tehke konstrueeritud tabeli väärtustest koopia Copy ja kustutage kopeeritud tabeli sisu (alles jätke rea- ja veerusummad!) Delete Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 10

Arvutage uude tabelisse kustutatud sageduste asemele tunnuste sõltumatuse juhule (nullhüpoteesile) vastavad nö teoreetilised sagedused (kujul: reasumma veerusumma / vaatluste arv). Teostage funktsiooni CHISQ.TEST (Excel 2003-s CHITEST) abil χ 2 -test viimane võrdleb empiirilisi (andmetabelist arvutatud) sagedusi teoreetiliste (sõltumatuse juhule vastavate) sagedustega ja väljastab olulisuse tõenäosuse p väärtuse Et oleks lihtsam aru saada, milliste arvude võrdlemisel χ2-test baseerub (ehk siis millised tabelite osad tuleb Exceli vastavale funktsioonile ette anda), võib vastavad lahtrid selguse mõttes näiteks ära värvida. Järgnevalt, nagu funktsioonide puhul ikka, tuleb kursor panna lahtrisse, kuhu soovitakse tulemust saada (ja juurde võiks enne ka kirjutada, mida arvutama hakatakse). Sõnastage lõppjäreldus (Kas seos on statistiliselt oluline? Miks te nii otsustasite?). Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 11

ÜLESANNE 3. --- Regressioonanalüüs graafiliselt --- Prognoosige tallerümpade 1 kg hinda lähtuvalt rümba massist. Kui palju võinuks 2002. aasta sügisel keskmiselt raha saada 20 kg kaaluva tallerümba eest? 1. Esmalt sorteerige/filtreerige algandmed vastavalt rümpade üldkategooriale ja tehke uuele töölehele koopia tallerümpade massidest ja 1 kg hindadest ja tehke uuele töölehele koopia tallerümpade massidest ja 1 kg hindadest. Copy Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 12

Rümba 1 kg hind, EEK Mõõtm., andmetöötlus ja autom. piimanduses ja lihanduses, VL-1112 ja VL-1122 Praktikum 2 2. Teostage regressioonanalüüs graafiliselt. Selleks laske Excelil joonistada hajuvusdiagramm (punktdiagramm), kus x-teljel paiknevad rümpade massid ja y-teljel hinnad. Valmis diagrammile lisage regressioonisirge, regressioonivõrrand ja viimase baasil saadavate prognooside täpsust kirjeldav determinatsioonikordaja R 2. Lisaks tavalisele lineaarsele regressioonanalüüsile sobitage punktiparvest läbi ka ruutfunktsiooni graafik ning tellige sellegi tarvis Excelilt võrrand ja R 2 (parema võrdlemise huvides värvige vastav joon ja parameetrid näiteks punaseks). Kumba seost lineaarset või ruutseost eelistada tallerümba 1 kg hinna prognoosimisel? Miks? R_kg_hind 50 45 40 35 30 25 20 15 10 5 0 0 5 10 15 20 25 30 35 R_kg_hind 50 45 40 35 30 25 20 y = 0,4573x + 29,29 R 2 = 0,1274 15 10 y = -0,1141x 2 + 4,7521x - 9,5525 R 2 = 0,3308 5 0 0 5 10 15 20 25 30 35 Rümba mass, kg 3. Pange töölehele kirja regressioonivõrrand ja prognoosige 20 kg kaaluva tallerümba hinda. Tanel Kaart http://ph.emu.ee/~ktanel/vl_0112/ 13