Mõõtmised, andmetöötlus ja automaatika lihanduses ja piimanduses, VL-1112 & VL-1122

Σχετικά έγγραφα
Praktikum 2. Kommentaarid andmestiku kohta

Mõõtmised, andmetöötlus ja automaatika lihanduses ja piimanduses, VL-1112 & VL-1122

Statistiline andmetöötlus, VL-0435 sügis, 2008

Mõõtm., andmetöötlus ja autom. piimanduses ja lihanduses, VL-1112 ja VL-1122 Praktikum 1

Praktikum 1. Matemaatiline statistika ja modelleerimine, DK.0007

Andmeanalüüs molekulaarbioloogias

Andmete haldus ja analüüs MS Excelis Praktikum 1

Ruumilise jõusüsteemi taandamine lihtsaimale kujule

Matemaatiline statistika ja modelleerimine

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

Kompleksarvu algebraline kuju

SORTEERIMINE JA FILTREERIMINE

Funktsiooni diferentsiaal

2.2.1 Geomeetriline interpretatsioon

Matemaatiline analüüs I iseseisvad ülesanded

Matemaatiline statistika ja modelleerimine

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

Matemaatiline analüüs I iseseisvad ülesanded

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

Lokaalsed ekstreemumid

PLASTSED DEFORMATSIOONID

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

Excel Statistilised funktsioonid

Ehitusmehaanika harjutus

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

HAPE-ALUS TASAKAAL. Teema nr 2

Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus

sin 2 α + cos 2 sin cos cos 2α = cos² - sin² tan 2α =

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks

Geomeetrilised vektorid

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

KORDAMINE RIIGIEKSAMIKS VII teema Vektor. Joone võrrandid.

KORDAMINE RIIGIEKSAMIKS V teema Vektor. Joone võrrandid.

T~oestatavalt korrektne transleerimine

Funktsioonide õpetamisest põhikooli matemaatikakursuses

Eesti elektrienergia hinna analüüs ja ühesammuline prognoosimine ARIMA tüüpi mudelitega

Eesti koolinoorte XLIX täppisteaduste olümpiaad

Kontekstivabad keeled

Ενότητα 21 Pivot Tables

9. AM ja FM detektorid

1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD

I. Keemiline termodünaamika. II. Keemiline kineetika ja tasakaal

DEF. Kolmnurgaks nim hulknurka, millel on 3 tippu. / Kolmnurgaks nim tasandi osa, mida piiravad kolme erinevat punkti ühendavad lõigud.

Mathematica kasutamine

Kontrollijate kommentaarid a. piirkondliku matemaatikaolümpiaadi

Arvuti kasutamine uurimistöös

HULGATEOORIA ELEMENTE

Enam kui kahe grupi keskmiste võrdlus

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil.

Matemaatilised ja trigonomeetrilised funktsioonid

Sissejuhatus mehhatroonikasse MHK0120

1. Paisksalvestuse meetod (hash)

Keemia lahtise võistluse ülesannete lahendused Noorem rühm (9. ja 10. klass) 16. november a.

1 MTMM Kõrgem matemaatika, eksamiteemad 2014

MATEMAATILISEST LOOGIKAST (Lausearvutus)

Eesti LV matemaatikaolümpiaad

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397

Ecophon Square 43 LED

Krüptoräsid (Hash- funktsioonid) ja autentimine. Kasutatavaimad algoritmid. MD5, SHA-1, SHA-2. Erika Matsak, PhD

Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA)

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

1 Funktsioon, piirväärtus, pidevus

20. SIRGE VÕRRANDID. Joonis 20.1

HSM TT 1578 EST EE (04.08) RBLV /G

Sisukord. 2 Programmeerimiskeel C

6.6 Ühtlaselt koormatud plaatide lihtsamad

KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS

Veaarvutus ja määramatus

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused

Analüütilise geomeetria praktikum II. L. Tuulmets

2. HULGATEOORIA ELEMENTE

1 Kompleksarvud Imaginaararvud Praktiline väärtus Kõige ilusam valem? Kompleksarvu erinevad kujud...

Parim odav. nutitelefon

MateMaatika õhtuõpik

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008

Smith i diagramm. Peegeldustegur

MATEMAATILINE ANAL U US II Juhend TT U kaug oppe- uli opilastele

2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused klass

1. Soojuskiirguse uurimine infrapunakiirguse sensori abil. 2. Stefan-Boltzmanni seaduse katseline kontroll hõõglambi abil.

Tallinna Tehnikaülikool Mehaanikainstituut Deformeeruva keha mehaanika õppetool. Andrus Salupere STAATIKA ÜLESANDED

; y ) vektori lõpppunkt, siis

Energiabilanss netoenergiavajadus

5. OPTIMEERIMISÜLESANDED MAJANDUSES

Sisukord. 4 Tõenäosuse piirteoreemid 36

Lexical-Functional Grammar

Lisa 1 Tabel 1. Veeproovide analüüside ja mõõtmiste tulemused Kroodi

PÕHIKOOLI LÕPUEKSAM FÜÜSIKA 16. JUUNI Kool: Maakond/linn: Õpilase ees- ja perekonnanimi: MEELESPEA

Sirgete varraste vääne

ANTENNID JA RF ELEKTROONIKA

Programmeerimise eksamiülesannete kogu

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE

Skalaar, vektor, tensor

Προγραμματισμός ταμειακής ροής για αγορές υλικών

Semantiline analüüs. Süntaksipuu dekoreeritakse tüübi- ja muu kontekstist sõltuva

Pesumasin Πλυντήριο ρούχων Mosógép Veļas mašīna

Transcript:

Praks 2 Eel- ja järeltöö 1. Salvestage arvutisse andmestik lammas.xls (http://ph.emu.ee/~ktanel/vl_1112/lammas.xls). 2. Avage salvestatud fail MS Excel is. 3. Peale ülesannete lahendamist salvestage fail nimega perekonnanimi_lammas.xls ja saatke e-meiliga aadressil tanel.kaart@emu.ee. Kommentaarid andmestiku kohta Rümpade EUROP klassifitseerimine on EL riikides kehtiv lihakehade klassifitseerimissüsteem, kus hinnatakse iga lihakeha kommertsväärtust. Rümbad jaotatakse järgmistesse kategooriatesse: alla 12 kuu vanuste lammaste e tallede rümbad (tähis L ) ning kõigi ülejäänud lammaste rümbad (tähis S ); visuaalselt hinnatatud lihakusklasside osas eristatakse: E (ekstra), U (väga hea), R (hea), O (rahuldav), P (lahja), P- (eriti lahja); visuaalselt hinnatud rasvasusklasside osas eristatakse: 1 (väherasvane), 2 (kergelt rasvane), 3 (keskmiselt rasvane), 4 (rasvane), 5 (väga rasvane). Antud andmestik sisaldab 686 lambarümba andmeid (56-lt omanikult) 2002. aasta sügisest (tapetud ja hinnatud kõik samas tapamajas). Iga lamba kohta on lisaks eelnevalt nimetatud kolmele rühmitavale tunnusele: rümba kategooria {L, S}, lihakusklass {E, U, R, O, P, P-} ja rasvasusklass {1, 2, 3, 4, 5}, fikseeritud ka see, kas loom oli pärit jõudluskontrollialusest karjast või mitte (vastavalt jkk = 1 või 0), kas realiseerimine leidis aset läbi ELaS-i turustusgrupi või mitte (vastavalt realis = 1 või 0), samuti on teada rümba mass (kg) ja hind (EEK), mille alusel on arvutatud rümba 1 kg hind (EEK/kg). Tanel Kaart 1

Ülesanded Praktikumi tehniline pool hõlmab peamiselt Pivot Table i ja diagrammide kasutamist MS Excel is, lisaks ka veel χ 2 -testi ja regressioonanalüüsi. 1. Kirjeldage lammaste jagunemist EUROP klassifitseerimissüsteemi alusel, leides erinevatesse klassidesse kuuluvate rümpade arvud ja protsendid (seda siis 3 tunnuse tarvis rümba üldkategooria, lihakusklass ja rasvasusklass). o Kui mõnda lihakus- ja/või rasvasusklassi kategooriat esineb väga vähe, pange see kokku sarnase naaberkategooriaga. o Illustreerige saadud tabeleid sektordiagrammidega, kirjutades igale sektorile juurde sellele vastava väärtuse ja esinemise suhtelise sageduse protsentides. 2. Kas rümpade jagunemine rasvasusklassidesse sõltub rümba üldkategooriast? o Võimaliku seose kirjeldamiseks konstrueerige (uuele töölehele) vastav 2-mõõtmeline sagedustabel, viimasesse leidke nii rea- kui ka veeruprotsendid ja sõnastage lause(d), kasutades vähemalt kahte leitud suhtelistest sagedustest. 3. Jätkuna punktile 2 testige rümpade üldkategooriatesse ja rasvasuklassidesse jagunemise vahelise seose statistilist olulisust. o Et oleks selge, mida te üldse testite, pange esmalt kirja kontrollitav hüpoteeside paar. o Järgnevalt konstrueerige uus 2-mõõtmeline sagedustabel, mis sisaldab üksnes absoluutseid sagedusi, selle alusel arvutage tunnuste sõltumatuse juhule (nullhüpoteesile) vastavad sagedused ja o teostage funktsiooni CHISQ.TEST (Excel 2003-s CHITEST) abil χ 2 -test viimane võrdleb empiirilisi (andmetabelist arvutatud) sagedusi teoreetiliste (sõltumatuse juhule vastavate) sagedustega ja väljastab olulisuse tõenäosuse p väärtuse. o Sõnastage lõppjäreldus (viidates sõnastuses ka p-väärtusele, millel järeldus baseerub). 4. Prognoosige tallerümpade 1 kg hinda lähtuvalt rümba massist. Kui palju võinuks 2002. aasta sügisel keskmiselt raha saada 20 kg kaaluva tallerümba eest. Esmalt sorteerige/filtreerige algandmed vastavalt rümpade üldkategooriale ja tehke uuele töölehele koopia tallerümpade massidest ja 1 kg hindadest. Teostage regressioonanalüüs graafiliselt. Selleks laske Excelil joonistada hajuvusdiagramm (punktdiagramm), kus x-teljel paiknevad rümpade massid ja y-teljel hinnad. Valmis diagrammile lisage regressioonisirge, regressioonivõrrand ja viimase baasil saadavate prognooside täpsust kirjeldav determinatsioonikordaja R 2. Tanel Kaart 2

Lisaks tavalisele lineaarsele regressioonanalüüsile sobitage punktiparvest läbi ka ruutfunktsiooni graafik ning tellige sellegi tarvis Excel lt võrrand ja R 2 (parema võrdlemise huvides värvige vastav joon ja parameetrid näiteks punaseks). Kumba seost lineaarset või ruutseost eelistada tallerümba 1 kg hinna prognoosimisel? Miks? o Pange töölehele kirja regressioonivõrrand ja prognoosige 20 kg kaaluva tallerümba hinda. 5. Lisaülesanne. Leidke Pivot Table i abil uuele töölehele rümpade arv, keskmine, minimaalne ja maksimaalne mass ning massi standardhälve sõltuvalt lamba päritolust (jõudluskontrolli alusest karjast või mitte). o Illustreerige leitud keskmisi tulpdiagrammiga, kus rümba masside varieeruvust kirjeldavad standardhälbed on kujutatud nö veajoontena (joonise tegemiseks tehke vajalikest Pivot Table i abil leitud väärtustest abitabel). o Sorteerige (või filtreerige) algandmed vastavalt jõudluskontrolli alla kuulumisele ning tehke leitud keskmistega samale lehele abitabel, mis sisaldab ühes veerus jõudluskontrollialusest karjast pärit rümpade masse ja teises veerus mitte jõudluskontrollialusest karjast pärit rümpade masse. o Testige keskmiste masside erinevuse statistilist olulisust (esmalt F-test ja selle tulemusest lähtuvalt õiget tüüpi t-test). Sõnastage lõppjäreldus. Kui aru ei saa (näiteks, mida mingi funktsioon teeb või miks midagi just näidatud kujul tööjuhendis realiseeritud on), siis küsi! Tanel Kaart 3

Illustreeritud (ja mittetäielik) tööjuhend 1. Konstrueerime järgnevalt näitena sagedustabeli rümba lihakusklassi kohta, analoogselt käib sagedustabelite tegemine ka rümba üldkategooriale ja rasvasusklassile. Paigutage kursor andmetabeli suvalisse lahtrisse Insert-sakk PivotTable Loodava tabeli vasaku ülemise nurga asukoht Tulemus: Tanel Kaart 4

Tulemuseks saadud sagedustabel: Vaikimisi arvutab Excel lammaste numbrite summa Et selle asemel lihtsalt kokku lugeda, kui mitu lammast mingisse lihakusklassi kuulus, tuleb ära muuta Pivot Table-s kasutatav funktsioon (Sum asemel Count): PivotTable Tools-sakk Options Summarize Values By Alternatiivina võib Pivot Table-s rakendatavat funktsiooni muuta ka a) klikkides tabelil hiire parempoolse nupuga või b) klikkides Pivot Table konstrueerimise aknas lahtris Values muuta soovitava funktsiooni järel paikneval kolmnurgal: a) b) Tanel Kaart 5

Lihakusklasside sisuliselt õiges järjekorras esitamiseks (Excel sorteerib tähestikulises, mitte sisulises järjekorras) on lihtsaim variant vales kohas olev klass lihtsalt ümber tõsta (klikkides selleks klassi nimel (näiteks lahtril P ) ja tõstes lahtri servast kinni hoides õigesse kohta): Tulemus: Lisaks absoluutsetele sagedustele võiks leida ka suhtelised sagedused. d) c) a) a) Lohistage PivotTable Field List s tunnus Lammas ka teine kord lahtrisse Values; b) nõudke, et Excel jagaks tabeli erinevate funktsioonide alusel ridadeks, mitte veergudeks (lohistage kastike Σ Values lahtrisse Row Labels); c) määrake vajadusel ka uue rea tarvis funktsiooniks Count (Sum asemel) ning d) nõudke väärtuste esitamist protsentidena (PivotTable Tools-sakk Options Show Values As % of Row Total). b) Tulemus: Tanel Kaart 6

Et paremaks kui hea (kood E ) on hinnatud vaid üht rümpa, võiks selle ühendada grupiga R (moodustada uus grupp vähemalt hindega hea rümbad). Grupeerige analoogsel viisil ka lahjad ja eriti lahjad rümbad (grupid P ja P-, sest ega seal suurt vahet pole). Tanel Kaart 7

Pivot Table i abil konstrueeritud tabeli põhjal kenade jooniste tegemiseks on sageli mõttekas teha vajalikest väärtustest abitabel ja joonistada diagramm abitabeli alusel. Põhjuseks on see, et otse Pivot Table alusel joonise tegemise tulemuseks on nn Pivot Chart, mis on sarnaselt Pivot Table ga lingitud andmetabeliga, seeläbi kergesti täiendatav ja ümberarvutatav, aga ei võimalda muuta kõike tavalisel Excel i diagrammil muudetavat (või on see märksa keerulisem). Copy Järgnevalt andke lihakusklassidele sisuliselt õiged nimed trükkige need moodustatud abitabelisse, ja konstrueerige abitabeli vastavate lahtrite alusel sektordiagramm. Kujundage saadud joonis (lisage sektoritele vastavate lihakusklasside nimed ja esinemissagedused, muutke soovi korral värve): Järgnevalt konstrueerige sagedustabelid ja joonistage nende alusel sektordiagrammid ka rümba (üld)kategooriale ja rasvasusklassile. Tanel Kaart 8

2. Kas rümpade jagunemine rasvasusklassidesse sõltub rümba üldkategooriast? Võimaliku seose kirjeldamiseks konstrueerige (uuele töölehele) vastav 2-mõõtmeline sagedustabel, viimasesse leidke nii rea- kui ka veeruprotsendid ja sõnastage lause(d), kasutades vähemalt kahte leitud suhtelistest sagedustest. Tanel Kaart 9

Muutke kõik kolm Exceli poolt leitud summat vaatluste arvudeks (Sum Count): Ning esitage 2. ja 3. vaatluste arv (Count of 2 ja 3) vastavalt rea- ja veeruprotsendina: Tulemus: Kommentaarid. (sõnastage lause(d), kasutades vähemalt kahte leitud suhtelistest sagedustest) Tanel Kaart 10

3. Rümpade üldkategooriatesse ja rasvasuklassidesse jagunemise vahelise seose statistiline olulisus. Et oleks selge, mida te üldse testite, pange esmalt kirja kontrollitav hüpoteeside paar. Järgnevalt konstrueerige uus 2-mõõtmeline sagedustabel, mis sisaldab üksnes absoluutseid sagedusi, tehke konstrueeritud tabeli väärtustest koopia Copy ja kustutage kopeeritud tabeli sisu (alles jätke rea- ja veerusummad!) Delete Arvutage uude tabelisse kustutatud sageduste asemele tunnuste sõltumatuse juhule (nullhüpoteesile) vastavad nö teoreetilised sagedused (kujul: reasumma veerusumma / vaatluste arv). Tanel Kaart 11

Teoreetiliste sageduste arvutamine: Teostage funktsiooni CHISQ.TEST (Excel 2003-s CHITEST) abil χ 2 -test viimane võrdleb empiirilisi (andmetabelist arvutatud) sagedusi teoreetiliste (sõltumatuse juhule vastavate) sagedustega ja väljastab olulisuse tõenäosuse p väärtuse Et oleks lihtsam aru saada, milliste arvude võrdlemisel χ2-test baseerub (ehk siis millised tabelite osad tuleb Excel i vastavale funktsioonile ette anda), võib vastavad lahtrid selguse mõttes näiteks ära värvida. Järgnevalt, nagu funktsioonide puhul ikka, tuleb kursor panna lahtrisse, kuhu soovitakse tulemust saada (ja juurde võiks enne ka kirjutada, mida arvutama hakatakse). Sõnastage lõppjäreldus (Kas seos on statistiliselt oluline? Miks te nii otsustasite?). Tanel Kaart 12

4. Prognoosige tallerümpade 1 kg hinda lähtuvalt rümba massist. Kui palju võinuks 2002. aasta sügisel keskmiselt raha saada 20 kg kaaluva tallerümba eest. Esmalt sorteerige/filtreerige algandmed vastavalt rümpade üldkategooriale ja tehke uuele töölehele koopia tallerümpade massidest ja 1 kg hindadest. ja tehke uuele töölehele koopia tallerümpade massidest ja 1 kg hindadest. Copy Tanel Kaart 13

Rümba 1 kg hind, EEK Mõõtmised, andmetöötlus ja automaatika lihanduses ja piimanduses, VL-1112 & VL-1122 Teostage regressioonanalüüs graafiliselt. Selleks laske Excelil joonistada hajuvusdiagramm (punktdiagramm), kus x-teljel paiknevad rümpade massid ja y-teljel hinnad. Valmis diagrammile lisage regressioonisirge, regressioonivõrrand ja viimase baasil saadavate prognooside täpsust kirjeldav determinatsioonikordaja R 2. Lisaks tavalisele lineaarsele regressioonanalüüsile sobitage punktiparvest läbi ka ruutfunktsiooni graafik ning tellige sellegi tarvis Excel lt võrrand ja R 2 (parema võrdlemise huvides värvige vastav joon ja parameetrid näiteks punaseks). Kumba seost lineaarset või ruutseost eelistada tallerümba 1 kg hinna prognoosimisel? Miks? R_kg_hind 50 45 40 35 30 25 20 15 10 5 0 0 5 10 15 20 25 30 35 R_kg_hind 50 45 40 35 30 25 20 y = 0,4573x + 29,29 R 2 = 0,1274 15 10 y = -0,1141x 2 + 4,7521x - 9,5525 R 2 = 0,3308 5 0 0 5 10 15 20 25 30 35 Rümba mass, kg Pange töölehele kirja regressioonivõrrand ja prognoosige 20 kg kaaluva tallerümba hinda. Tanel Kaart 14