AKU. Arvuti kasutamine uurimistöös

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "AKU. Arvuti kasutamine uurimistöös"

Transcript

1 AKU Arvuti kasutamine uurimistöös Informaatika valikaine õpik gümnaasiumile Autorid: Katrin Niglas, Kairi Osula, Kai Pata, Mart Laanpere Õppekomplekti loomist rahastas: SA Archimedes teaduse populariseerimise programm TEAME Tallinn 2012 See materjal on avaldatud Creative Commons Autorile viitamine Jagamine samadel tingimustel 3.0 Eesti litsentsi alusel.

2 Sisukord AKU... 1 Arvuti kasutamine uurimistöös...1 Sisukord Uurimistöö: mõisted, protsess, alustamine Uurimistöö olemus Arvuti roll uurimistöös Töö allikatega ja infootsing Viitamine *. Allikakriitiline lähenemine Andmete kogumine ja analüüsiks ettevalmistamine Andmete kogumise erinevad viisid Küsimustiku koostamise ABC Veebipõhise ku simustiku koostamine Pisut teooriat, mida hea teada ja arvestada juba enne andmete kogumist * Uuritavate valimine andmete kogumiseks - valim ja üldkogum Struktureeritud andmestik ja andmetabeli koostamine Andmete korrastamine Ülevaade andmetest Andmete analüüsimise põhisammud Sagedustabel Analüüsi tulemuste esitlemisest Tulpdiagramm Histogramm *. Valimi põhjal saadud tulemuste üldistamine üldkogumile * Vahemikhinnang valitud grupi osakaalu kirjeldamiseks üldkogumis Teised ühte tunnust puudutavad küsimused ja nendest lähtuv analüüs Keskmised Väärtuste hajuvust kirjeldavad arvnäitajad * Üldkogumi keskväärtuse vahemikhinnang Erinevuste uurimine Erinevuste uurimine kasutades keskväärtusi...54 Keskväärtuste vahelise erinevuse üldistamine: t-test*...56 Erinevuste uurimine kasutades sagedusi ja protsente...63 Erinevuste illustreerimine protsentuaalseid jaotusi võrdleva diagrammina Trendide e ajas toimuvate muutuste uurimine Seoste uurimine Kvalitatiivne sisuanalüüs Uurimistulemuste esitlemine Uurimisaruande vormistamine Tabelid, diagrammid ja joonised Siseviited, pealdis, indeks Uurimistulemuste ettekandmine / 85

3 1. Uurimistöö: mõisted, protsess, alustamine 1.1. Uurimistöö olemus Uurimistöö ehk uurimus on kirjalik kokkuvõte uurimisprotsessist ja selle tulemustest. Uurimisprotsess ehk uuring on tegevus, mille käigus otsitakse tõeseid teadmisi, fakte või uut informatsiooni mingi nähtuse kohta looduses, ühiskonnas, kultuuris või mujal. Tavaliselt sisaldab uurimus järgmisi osi: teema valiku põhjendus (miks uuriti?) probleemipüstitus ja uurimisküsimused (mida teada taheti?) uurimismeetod (kuidas andmeid koguti?) tulemuste analüüs ja järeldused (mis selgus?) Uuringutega tegelevad mitmete erialade esindajad. Näiteks võib uuriv ajakirjanik koguda ja analüüsida infokilde, tõendamaks parteijuhi mõjutatavust naaberriigi poolt. Kriminalist võib DNA-uuringu tulemusel lükata ümber prokuröri poolt esitatud mõrvasüüdistuse. Börsianalüütik võib varasemate aastate andmete põhjal ennustada Lõuna-Ameerika suvise põua mõju kohvifirma aktsia hinnale. Kõigi kolme eeltoodud näite puhul on kahtlemata tegemist uurimistegevusega, kuid mitte teadusuuringutega. Teadusuuring on uurimistegevuse eriline liik, mida eristab teistest: teostaja, kes on teiste teadlaste poolt tunnustatud teadlane suhestumine varasemate teadustöödega (kas neile toetumine või nende kritiseerimine/ümberlükkamine) meetod, mis on teiste teadlaste poolt tunnustatud kui teaduslik korratavus teiste teadlaste poolt üldistus, mis põhineb rangel järelduste tegemise viisil publitseerimine teadusajakirjas või konverentsil Riiklik õppekava eeldab, et iga gümnaasiumilõpetaja on vähemalt korra osalenud uuringu ettevalmistamises ja läbiviimises (kui ta just loomingulise töö esitamise kasuks ei otsusta). Õpilasuurimus kavandatakse, koostatakse ja kaitstakse sarnaselt teadusliku uurimistööga, ainult väiksemas mahus ja mitte niivõrd rangeid hindamiskriteeriumeid järgides. Sajandite jooksul on suuresti muutunud arusaam sellest, millist uuringut võiks lugeda teaduslikuks ja millist mitte. Aristoteles e.kr. Antiik-Kreeka tuntuimaks Süllogismi näide: teadlaseks võib pidada Suur eeldus: Kõik inimesed on Aristotelest, kes luges teaduslike surelikud teadmiste hulka ainult selliseid Väike eeldus: Kõik kreeklased on väiteid, mille tõesust oli võimalik inimesed järeldada süllogismi abil. Järeldus: Kõik kreeklased on surelikud Süllogism koosneb kolmest lausest: suur eeldus, väike eeldus ja järeldus. Inglise filosoof Francis Bacon ja prantsuse matemaatik Rene Descartes algatasid 17. sajandi algul revolutsiooni teadusmaailmas, kuulutades teaduslikeks 3 / 85

4 teadmisteks üksnes korduvate vaatluste ja eksperimentide kaudu kinnitust leidnud põhjustagajärg seosed ja hoiatades tõde moonutavate iidolite kummardamise eest. Francis Bacon Tõde ähmastavad iidolid, mille mõju tõeline teadlane peab teadvustama ja vältima: - hõimuiidolid - koopaiidolid - turuplatsi-iidolid - teatri-iidolid 20.sajandi esimesel poolel pakkus teaduslikkuse mõõdupuu välja Austria filosoof Karl Popper: teaduslikuks teadmiseks saavat lugeda ainult sellist väidet, mis on küll põhimõtteliselt ümberlükatav (e. falsifitseeritav), kuid kellelgi pole seni seda ümber lükata õnnestunud. Ainus tõeliselt teaduslik uurimismeetod oli Popperi jaoks teooria põhjal tehtud ennustuse testimine. Kui ennustus osutus tõeseks ka paljukordsel testimisel erinevate teadlaste poolt (kelle eesmärgiks oli see teooria ümber lükata), võis teooria tõeseks lugeda vastasel juhul tuli teooria kõrvale heita. Näiteks Sigmund Feudi psühhoanalüütilisi unenägude seletusi ei nõustunud Popper teaduslikeks lugema, kuna neid polnud põhimõtteliselt võimalik ümber lükata. Popperi nägemusega teaduse olemusest ei olnud paljud teadlased nõus, teiste seas kritiseeris seda Thomas Kuhn oma aastal ilmunud raamatus Teadusrevolutsioonide ülesehitus. Kuhni arvates on teadus see, millega tegelevad teadlased oma ajastu tõekspidamistest ja teiste teadlaste eeskujust (e. paradigmast) lähtudes. Samas võivad tänased tõekspidamised teaduse olemusest muutuda, kui leiab aset teadusrevolutsioon ja senikehtinud paradigma asendub uuega. Näiteks kosmoloogias leidis aset paradgima vahetus 16.sajandil, kui teadlased loobusid Koperniku avastuse mõjul senikehtinud Ptolemaiose geotsentrilisest maailmapildist, mille kohaselt kõik taevakehad tiirlevad ümber Maa. Kui 17.sajandil oli mõeldi teaduse (inglise keeles: science) all üldist loodusteadust, siis 20.sajandiks oli välja kujunenud hulgaliselt erinevaid teadusvaldkondi, millest igaühes tekkisid oma traditsioonid, paradigmad ja uurimismeetodid. Meetodid, mida ühes valdkonnas aktsepteeritakse kui teaduslikke, ei pruugi teise valdkonna teadlased sellisena tunnustada. Näiteks kasvatusteadustes on levinud uurimismeetodiks tegevusuuring, mille puhul rühm õpetajaid rakendab oma töös uudseid õppemeetodeid, ise oma tegevust ja õpilaste õpitulemusi pidevalt analüüsides. Paljudes teistes teadusvaldkondades peetaks teadlase taolist osalemist enese poolt uuritavas protsessis subjektiivseks ja mitteteaduslikuks. Eesti teaduse infosüsteem ETIS1 jagab teadusvaldkonnad neljaks suureks rühmaks: - bio- ja keskkonnateadused: biokeemia, mikrobioloogia, geneetika jne. - ühiskonnaja kultuuriteadused: keeleteadus, õigusteadus, psühholoogia, sotsioloogia jne. - terviseteadused: biomeditsiin, farmaatsia, sporditeadus jne. - loodus- ja tehnikateadused: matemaatika, arvutiteadused, füüsika jne. Tänapäeval on teadusuuringud üha sagedamini valdkondadevahelised e. interdistsiplinaarsed, hõlmates teadmisi, teadlasi ja uurimismeetodeid korraga mitmest erinevast valdkonnast. Näiteks arvutilingvistika ühendab keeleteaduse meetodid arvutiteaduste omadega, biokeemia puhul on ühendatud bioloogia ja keemia traditsioonid ja teadmised. Erinevate teadusvaldkondade kombineerimine on tänapäeval viljakaks kasvulavaks uutele teadmistele. Erinevates valdkondades võib uurimistegevus olla väga erinevalt üles ehitatud. Näiteks Higgsi bosoni olemasolu tõendavat eksperimenti kavandavad kümned tipp-füüsikud CERNi keskuses aastaid, kusjuures eksperiment ise kestab / 85

5 sekundeid ja selle käigus kogutud andmete põhjal kirjutatakse paari järgmise aasta jooksul sadu teadusartikleid. Seevastu humanitaarteadustes, näiteks ajaloos, on eksperimendi korraldamine tihtilugu praktiliselt võimatu. Ajaloolased uurivad juba ammu juhtunud sündmuste jälgi, püüdes leida uudseid tõlgendusi, mis lükkaks ümber varem kehtinud teooriad. Näiteks on Magnus Ilmjärv analüüsinud sadu ajaloolisi dokumente, leidmaks kinnitusi oma väitele, mille kohaselt oli Konstantinil Pätsil oluline roll Eesti Vabariigi iseseisvuse kaotamisel. Arvutiteadustes on uurimisprotsess tihtilugu seotud uue tarkvõi riistvaralahenduse tsüklilise arendamisega. Sel puhul koostatakse esimesel etapil uue lahenduse kohta põhjalik teoreetiline mudel, teisel programmeeritakse mudelist lähtuv tarkvaralahenduse prototüüp (osaliselt toimiv, ilma kujunduseta versioon). Kolmandal etapil testitakse prototüübi tulemuslikkust, tõhusust, stabiilsust või jõudlust ja neljandal etapil tehakse testide tulemuste põhjal prototüübis vajalikud muudatused. Käesolevas õpikus võtame aluseks õpilasuurimuse jaoks soovituslikud uurimisprotsessi etapid, mis peaksid sobima erinevate uurimisvaldkondade jaoks: Probleem: probleemipüstitus, uurimisküsimuste või hüpoteesi sõnastamine Teooria: töö allikatega, ülevaade varasematest uuringutest, teoreetiline baas, konkureerivate teooriate/paradigmade kaardistamine Meetod: uurimismeetodi valik, uuringudisain, valim, instrument Andmed: andmete kogumine ja korrastamine, andmetöötlus ja -analüüs Arutlus: andmete tõlgendamine, järelduste sõnastamine Aruanne: uurimisaruande vormistamine, visualiseerimine Avaldamine: tulemuste esitlemine, ettekanne, kaitsmine, levitamine Heas uurimistöös on igale etapile piisavalt tähelepanu pühendatud, sest kett on täpselt nii tugev nagu tema kõige nõrgem lüli. Ülesanded Koosta süllogism, mille järelduseks on: toonekured lendavad talveks Eestist ära lõunamaale. Otsi internetist selgitused Baconi iidolite tähenduste kohta! Milliseks iidoliks tuleks Baconi kohaselt pidada Aristotelest: kas hõimu-, turuplatsi- või teatriiidoliks? Miks ei saa skeptikute arvates parapsühholoogiat pidada teaduseks? Koosta mõistekaart Mis eristab teaduslikku uurimistööd mitteteaduslikust? 5 / 85

6 1.2. Arvuti roll uurimistöös Arvutite arengule andis ndatel aastatel hoogu II Maailmasõda. Esimesed elektroonilised arvutid sündisid vajadusest arvutada rakettrelvade lennutrajektoore või analüüsida vaenlase kodeeritud sõnumeid. Järgmistel aastakümnetel on arvutite ja interneti arengus olulist rolli mänginud ka teadlaste vajadused. Näiteks sündis täna interneti sünonüümiks kujunenud veeb (WWW, World Wide Web) aastal CERNi uurimiskeskuses töötavate füüsikute omavahelise infovahetuse keskkonnana. Tänapäeval on vähe eluvaldkondi, kus arvuteid ei kasutata. Ka teaduslikku uurimistööd on täna raske ette kujutada ilma arvutiteta, isegi sellistes pealtnäha arvutikaugetes uurimisvaldkondades nagu muusikateadus, folkloristika, järvesetete uurimine või psühholoogia. Mõned näited arvutite kasutamise kohta erinevates teadusprojektides: Inimgenoomi projekt (Human Genome Project2) kestis ja selle tulemuseks oli inimese geenide kaardistamine, aga ka geeniuuringute infotehnoloogilised vahendid ja eetilised põhimõtted. Projekti tulemusena muudeti interneti vahendusel kõigile kättesaadavaks nii andmed kui tarkvara, mis tõi kaasa geenitehnoloogia kiire arengu. Tänaseks on pärilike haiguste tuvastamisest isikliku geenikaardi põhjal saanud mitmemiljardilise käibega ärivaldkond. Eesti emotsionaalse kõne korpus3 on Eesti Keele Instituudis valminud andmebaas, mis sisaldab audiosalvestusi viha-, rõõmu- ja kurbuselausete ning neutraalsete lausetega (kokku 1700 lauset). Sellise andmebaasi abil on tulevikus võimalik õpetada arvutit analüüsima eestikeelses tekstis ja kõnes avalduvaid emotsioone. Veebirakendus Birdmap4 võimaldab igal huvilisel jälgida ja analüüsida GPSjälitusseadmega varustatud lindude rännet. Kuna andmed on kättesaadavad kogu maailma teadlastele, siis loob see võimaluse rahvusvahelisteks võrdlusuuringuteks. On tekkinud ka spetsiaalselt infotehnoloogia arendamise ja uurimisega tegelevad teadusvaldkonnad, üheks neist on informaatika. Informaatika on arvutiteaduse haru, mis käsitleb info struktuuri, loomist, hankimist, töötlemist, tõlgendamist, edastamist ja esitamist. Käesolev informaatika õpik vaatleb info leidmise, töötlemise, tõlgendamise ja esitlemise meetodeid ühes kitsas kontekstis gümnaasiumi uurimistöö läbiviimisel. Kui olete need meetodid uurimistöö kontekstis selgeks õppinud, siis oskate neid loodetavasti rakendada ka mujal. Vaatleme nüüd lähemalt, milline on info- ja kommunikatsioonitehnoloogia roll uurimuse igal etapil. Probleemipüstituse faasis on arvutist abi mõtete korrastamisel, näiteks ideekaardi meetodit kasutades (vt joonis 1). Kuigi ideekaarti saab kahtlemata ka pliiatsi ja paberi abil joonistada, on arvuti abil koostatud kaardil mitmeid eeliseid: seda saab teistega jagada, koostöös kaaslastega muuta, teha mitmeid versioone jne. Arvutitest ja internetist on probleemipüstituse faasis kindlasti abi ka enda kurssiviimisel varasemate uuringutega, mille lõpuosas on tavaliselt toodud soovitused edasisteks uuringuteks. Viimasel ajal on ka teadlaste ja üliõpilaste seas üha populaarsemaks muutumas oma käimasolevast või kavandatavast teadustööst blogimine, mis võimaldab jälgida teadlaste internetikogukondades / 85

7 kuumadeks peetavaid teemasid. Joonis 1. Ideekaart õppimise kohta täiskasvanueas. Töö allikatega toimub tänapäeval suuresti elektrooniliste andmebaaside abil. Praktiliselt kõik teadusajakirjad ja konverentsiettekannete teesid on kättesaadavad interneti vahendusel, tuleb vaid osata otsida. Samas on elektrooniliste kataloogide abil oluliselt kergem leida ka raamatukogudes hoiustatud raamatuid ja uurimistöid. Uurimismeetodi valikul on samuti abi internetis leiduvatest juhenditest, soovitustest ja näidetest. Andmete kogumine käib tänapäeval üldjuhul arvuti abil on siis tegu veebipõhise küsimustiku, arvuti külge ühendatud andurite, Kui uurimistegevuse käigus kogutakse andmeid intervjuu või vaatluse teel, siis on abi digitaalsest diktofonist ja videokaamerast, mille abil salvestatud materjal pärast arvutisse kopeeritakse ja seal siis juba töödeldakse. Audio- või videofailidena salvestatud intervjuud muudetakse tekstiks ehk transkribeeritakse spetsiaalse tarkvara abil (nt. Transcriva või InqScribe). Andmetöötlust ei tee ilmselt ükski teadlane enam ilma arvuti abita. Käesoleval kursusel tugineme me andmete analüüsimisel üksnes MS Excel ja LibeOffice kontoritarkvarale, kuid teadusmaailmas kasutatakse siinkohal üldjuhul spetsiaalselt uurimusliku andmetöötluse tarvis loodud tarkvara (nt. SPSS, Matlab, Minitab, Stata, PSPP, R, NVivo). Andmete tõlgendamine jääb seni küll peamiselt inimese tööks, kuid ka siin on arvutist palju abi. Näiteks võimaldab arvuti visualiseerida andmetes tekkivaid mustreid. Uurimisaruande vormistamist ei kujuta vist enam keegi ilma arvuti abita ette. Tekstitöötlustarkvara (nt. MS Word või LibreOffice) Uurimistulemuste avaldamine toimub tänapäeval üldjuhul elektrooniliste kanalite vahendusel. Uurimisaruande esitlemiselgi on esitlustarkvarast palju kasu. Käesolev õpik keskendub analüüsimisele arvuti abil. eelkõige andmete Ülesanne 7 / 85 kogumisele, töötlemise ja

8 1.3. Töö allikatega ja infootsing Teaduslik uurimistöö on alati dialoogis varasemate uurimustega, kas siis toetudes neile või üritades senikehtinud teooriaid ümber lükata. Teadlase jaoks on oluline mitte üritada uuesti jalgratast leiutada, ehk siis mitte taasavastada seda, mis on juba teada. Dialoogiline lähenemine eeldab varasemate uuringutega kursis olemist, mis võtab suure osa teadlase igapäevasest tööajast. Teadlasi võrreldakse seetõttu juba alates 12. sajandist kujundlikult kääbustega, kes seisavad hiiglaste õlgadel (ladina keeles: Nanos gigantium humeris insidentes). Näiteks aastal 1676 tunnistas inglise füüsik Isaac Newton oma optika-alastest saavutustest kirjutades: kui ma nägingi pisut kaugemale kui teised, siis üksnes tänu sellele, et seisin hiiglaste õlgadel. Selle ütlusega tegi Newton kummarduse prantsuse teadlase Renee Descartes i ja briti kolleegi Robert Hooke i poole, kelle varasemale teadustööle tuginedes oli tal õnnestunud oma optika käsitlus uuele tasemele viia. Ka õpilasuurimuse puhul on oluline viia ennast esmalt kurssi varasemate uurimistulemustega ja uurimistöö teemat puudutavate peamiste teooriatega. Alustada tuleks allikate otsingust kohaliku raamatukogu elektronkataloogis. Paljudes kooliraamatukogudes on kasutusel RIKSWEB infosüsteem 5, kohaliku küla- või linnaraamatukogu kataloogile saab üldjuhul veebi kaudu ligi URRAM 6 teenuse abil. RIKSWEB otsingut saab harjutada demo-veebilehel, otsides nii märksõnade, pealkirja, autori nime kui vaba teksti abil (joonis 2). Joonis 2. Allika otsing pealkirja järgi RIKSWEB demoportaalis. Veebipõhine raamatukogude kataloog URRAM võimaldab otsida allikaid kas ühest konkreetsest raamatukogust (näiteks lähimast küla- või linnaraamatukogust) või terve maakonna raamatukogudest korraga. Eesti suurim akadeemiliste teavikute elektronkataloog on ESTER 7. ESTERi / 85

9 avalehelt saab teha lihtotsingu, mispuhul otsisõna leitakse nii autori, pealkirja, märksõna, märkuste kui ka ilmumisandmete väljadelt. Lisaks võimaldab ESTER kasutada: fraasiotsingut, nt. eesti üliõpilaste selts (pole vaja ei jutumärke ega suurtähti) otsisõna katkestamist: nt. haridusp* (leiab vasted otsisõnadele hariduspoliitika, haridusparadigma kui ka haridusplatvorm) otsisõnade kombineerimiseks operaatoreid AND, OR, AND NOT, NEAR, WITHIN, näiteks a=kross AND t=mardileib (leiab kõik raamatud, mille autor on Kross ja pealkirjas (title) sisaldub sõna mardileib. ESTERi liitotsing võimaldab otsida juba keerukamate kombinatsioonide abil, mis tuleb kasuks näiteks levinud nimega autorite teoseid otsides (nt. Smith). Uurimistöö algfaasis on kindlasti kasu ka infootsingust üldkasutatavate interneti otsingumootorite (nt Google) abil. Google võimaldab lisaks lihtotsingule ühe või mitme märksõna abil ka keerukamaid otsinguid: fraasiotsing: kohustulik otsisõna: välditav sõna: Google pakub uurimistöö tegijatele loodud teenust Scholar 8, mille abil on võimalik otsida teadusartikleid. Väärtuslikuks allikaks uurimistööga tegelejale on veebipõhised teadusajakirjad, mida leidub kõigis valdkondades. Kuigi enamus veebipõhistest teadusajakirjadest on piiratud juurdepääsuga ja ingliskeelsed, leidub ka eestikeelseid ja juurdepääsupiiranguteta ajakirju, näiteks: Akadeemia ( Arvutustehnika ja Andmetöötlus ( Mäetagused ( Akadeemiake (akadeemiake.ee), Horisont (horisont.ee), Ajalooline ajakiri (kleio.ee). Mõnikord on mõistlik alustada allika otsingut hoopis konkreetse teadlase otsingust. Eestis on kõik teadlased kantud teaduse infosüsteemi ETIS (etis.ee), kust on kerge leida iga teadlase elulookirjeldus koos tema publikatsioonide nimekirjaga. Üliõpilaste lõputöid võib internetis leida siit: dspace.utlib.ee ja e-ait.tlulib.ee. Agar allikate otsija kogub juba mõne esimese päevaga sadu huvitavaid veebilehtede aadresse, mis võib kiiresti muutuda kaootiliseks kogumiks juhul kui selles korda ei looda. Lihtsaimaks tehniliseks abivahendiks veebiviidete kogumisel on ühisjärjehoidja teenus, näiteks Del.icio.us, Diigo või SpringBoard. Sellised teenused eeldavad väikese lisamooduli paigaldamist veebibrauseri külge ja kasutajakonto loomist teenusepakkuja serveril. Iga kord kui leiad uurimistöö jaoks olulise veebilehe, tuleb lihtsalt klõpsata brauseri tööriistaribal oleval järjehoidjateenuse nupul, lisada järjehoidja pealkiri ning märksõnad / 85

10 1.4. Viitamine Kuna uurimistööd kirjutades astutakse alati dialoogi varasemate uurimistööde ja teiste autoritega, siis ei pääse ükski uurimistöö tegija võõraste tekstide kasutamisest oma kirjutises. Teiselt autorilt laenatud tekst (ideed, väited, faktid) esitatakse oma töös kas sõnasõnalise laenu ehk tstitaadina või lühemas ümbersõnastuses ehk refereeringuna. Mõlemal juhul tuleb algallikale viidata. Viitamiseks nimetatakse oma kirjalikus töös teistelt autoritelt laenatud teksti äramärkimist kahes kohas: vahetult laenatud tekstilõigu järel viitena ja uurimistöö lõpus kasutatud kirjanduse loetelus äratoodud detailse viitekirje kujul. Viitamine on ühelt poolt vajalik tekstis kasutatud ideede, väidete, andmete jms autorite tunnustamiseks, teisalt annab viitamine lugejale võimaluse pöörduda vajadusel (nt kahtluse puhul kontrollimiseks) viidatud idee või väite algallika juurde. Heas uurimisaruandes on viiteid alati "parajal määral" nagu maitseaineid kogenud koka tehtud supis: kurjast on nii viitamise vältimine ja viidetega "üle pingutamine". Kui tekstis ei leidu ühtegi viidet, siis on tõenäoliselt tegemist laenatud ideede varjamisega, ilukirjandusliku heietusega ja/või sihiliku dialoogi vältimisega antud valdkonna asjatundjatega. Viidete ülikülluse all kannatav tekst aga muutub raskesti loetavaks ja autori oma mõtted jäävad esile toomata. Kuigi viitamine on kombeks ka teistes valdkondades (nt. kohtuasjad, õpikud), järgitakse viitamise reegleid kõige rangemalt just teadustekstides. Enamasti määravad teadusajakirja toimetajad või konverentsi korraldajad ka selle, millise enamlevinud standardi järgi viited vormistada tuleb. Ka õpilasuurimuste puhul nõutakse korrektset viitamist. Osa koole on sel eesmärgil koostanud eraldi juhendid õpilaste uurimistööde koostamise ja vormistamise kohta. Viitamist kohtame ka väljapool akadeemilist maailma. Näiteks ajaveebides on levinud tava viidata teise inimese ajaveebile, kelle poolt kirjutatu andis autorile põhjuse omapoolse sissekande tegemiseks. Siinkohal pole vaja järgida mingeid viitamisreegleid, sest klõpsamisest veebiaadressi piisab, et lugeja algallika juurde pääseks. Erinevates valdkondades kehtivad viitamisele erinevad nõudmised - näiteks trükiajakirjanduses tihtilugu ei vaevuta algallikat mainima. Kõik me oleme lugenud uudiseid stiilis "Jaapani teadlased avastasid et...". Enamasti ei sisalda sellised artiklid viiteid esmasele autorile (vt. "Teadlased: eelajalooline hiidhani oli lennukisuurune ") või parimal juhul sisaldavad viidet allikale, mis omakorda uudist vahendanud on (vt "Teadlased on lähedal tehisnina loomisele "). Gümnaasiumiastme uurimistöö võib viitamisreeglite ranguse osas paigutada teadusartiklite ja ajakirjanduse vahele: nii õppematerjalide loomisel kui näiteks foorumiaruteludel osaledes tuleks pidada heaks tooniks laenatud lausete autorile viitamist, kuid range viidete vormistamine APA stiilis leheküljenumbri täpsusega pole üldjuhul siinkohal rusikareegliks. Viitamisega on lähedalt seotud ka plagiaadi mõiste, mis tähendab teiste autorite loomingu esitamist omaloodu pähe. Plagiaadi vältimiseks tuleb kindlasti algallikale ja autorile viidata juhul kui kopeeritakse teise autori täpset sõnastust, refereeritakse (jutustatakse oma sõnadega kokkuvõtvalt ümber) teise autori ideid või kasutatakse teise autori poolt esitatud fakte, statistikat, tabeleid, jooniseid, diagramme jne. Kolm rusikareeglit, millest viitamisel tuleks lähtuda (Lõuna-Austraalia Ülikooli UniSA viitamisjuhise põhjal): algallikale peate viitama iga kord kui parafraseerite, jutustate kokkuvõtlikult ümber, tsiteerite või kopeerite teise autori loomingut - ükspuha, kas tegemist on tekstilise, graafilise või audiovisuaalse materjaliga viide esineb tavaliselt kahes kohas erineva detailsuse astmega: teksti sees ja teksti lõpul kasutatud kirjanduse loetelus. Neist esimene viide peab olema piisavalt täpne, et selle abil võiks üheselt määrata, millise detailse viitega kasutatud kirjanduse loetelus tegemist on ühes tekstis (uurimisaruandes, essees, referaadis) tuleks kasutada läbivalt ühte konkreetset viitamise stiili (nendest stiilidest ja seonduvatet formaatidest tuleb käesoleva kursuse järgmistes 10 / 85

11 osades põhjalikumalt juttu) Teadustekstides kasutatakse mitmeid erinevaid viitamissüsteeme, mida võib kokkuvõtvalt jagada kolme gruppi: joonealune viide, näiteks Tallinna Ülikooli koduleht9 nimi-aasta viide, näiteks: (Laanpere ja Põldoja, 2009) numbriviide, näiteks: [1] Joonealust viitamist paljudes teadusvaldkondades välditakse, aga näiteks ajaloo ja filosoofia alastes uurimustes on need siiski üldlevinud. Õpilasuurimuste puhul on joonealuseid viiteid soovitatav kasutada üksnes mitteakadeemilistele veebiallikatele viitamiseks (nt. toote, firma, ametiasutuse või ajakirja koduleht). Nimi-aasta viitamissüsteemide korral on viited töö tekstis ümarsulgudes. Viide algab autori perekonnanimega, millele järgneb ilmumisaasta ja lehekülje number. Kasutatud kirjanduse loetelus on viitekirjed järjestatud autorite perekonnanimede järgi. Numbriviitamissüsteemide puhul tuleb kasutatud kirjanduse loetelu koostada sellises järjekorras, nagu allikaid tekstis esinevad. Tekstis viidatakse kasutatud allikatele järjekorranumbri ja leheküljenumbriga. Tuntumad rahvusvahelised viitamissüsteemid on APA (ingliskeelne 10 ja eestikeelne11 versioon), MLA (ingliskeelne12 versioon) ja Chicago (ingliskeelne13 versioon) stiil, kuid erinevaid viitamisüsteeme on palju enam. Viitamissüsteemide stiilijuhendid on avaldatud spetsiaalsete raamatutena ning tasuta neid internetist alla laadida ei saa. Paljud ülikoolid ja raamatukogud on koostanud viitamissüsteemide juhenditest lühikokkuvõtteid. Viitamissüsteemi kokkuvõtte juures tuleb tähelepanu pöörata ka sellele, millise versiooni kohta see käib. Näiteks APA viitamissüsteemist ilmus eelmisel aastal uus 6. versioon, mis sisaldab võrreldes eelmise versiooniga terve rida uusi allika tüüpe (erinevad veebiallikad). Kuna viidete ja viitekirjete vormistamisega tegeleme põhjalikumalt alles käesoleva õpiku viimastes peatükkides, siis siinkohal sellele rohkem ruumi ei kuluta. Allikatega töötamise faasis on oluline iga leitud allika kohta detailne viitekirje säilitada. Internetis leidub mitmeid abivahendeid allikaviidete haldamiseks, näiteks Bibsonomy14 ja Mendeley15, mis võimaldavad hiljem viitekirjeid erinevatele viitamissüsteemidele vastavaks konverenteerida /

12 1.5*. Allikakriitiline lähenemine Allikakriitika on uurimismeetod, mille eesmärgiks on hinnata allika usaldusväärsust kasutamiskõlblikkust. Vikipeedia toob Skandinaavia ajaloolaste Olden-Jørgenseni ja Thuréni põhjal välja järgmised allikakriitilise lähenemise põhimõtted: Inimeste poolt loodud allikad võivad olla reliktid e. jäänukid (näiteks sõrmejälg) või narratiivid e. jutustused (näiteks kiri). Reliktid on usaldusväärsemad allikad kui narratiivid. Allikas võib olla võltsitud või rikutud, kindlad tõendid allika originaalsuse kohta tõstavad selle usaldusväärsust. Mida lähemal on allikas sündmusele, mida selle abil kirjeldada soovitakse, seda enam võib allikat usaldada. Esmased allikad, mis põhinevad originaalinfol, on usaldusväärsemad kui teisesed allikad, mis põhinevad algallikatel. Teisesed allikad on omakorda usaldusväärsemad kui kolmandased allikad jne. Kui mitmed teineteisest sõltumatud allikad sisaldavad sama infot, tõstab see info usaldusväärsust. Allika tendentslikkus on selle motivatsioon pakkuda kallutatud infot. Tendentslike allikate kasutamist tuleb vältida või tasandada ka teisele poolele kallutatud allikate kasutamisega. Kui on võimalik näidata, et tunnistajal või allikal puudub motivatsioon tendentsliku info edastamiseks, tõstab see allika usaldusväärsust. Allikakriitilise lähenemise väljakujunemises on olulist osa mänginud ajalooteadused ja arheoloogia, kus oli selge vajadus allikate ja leidude usaldusväärsust hinnata. Teaduse arenguga laienes allikakriitline lähenemine ka teistesse teadusvaldkondadesse. Tänapäeval on allikakriitiline lähenemine oluliseks oskuseks igale meediatarbijale. Internet loob võimaluse igaühel ükskõik millist infot avaldada, seega tuleb ajaveebide ja muu kasutajate poolt loodud sisu allikakriitilisust enne nende kasutamist hinnata. Allikakriitilise lähenemise aluseks on veendumus, et iga teksti autoril võib olla oma (varjatud või avalik) eesmärk lugeja mõjutamiseks. Teksti kallutatus, ühekülgsus, erapoolikus jne muudavad selle ebausaldusväärseks allikaks ja seda eriti uurimistöö puhul. Ideoloogilise erapoolikuse kõrval on tänapäeval levinuimaks äriline kallutatus: ühe konkreetse firma ärihuvidest lähtuvaid reklaamtekste ei saa tõsiseltvõetava õppematerjalina kasutada. Näiteks informaatikas on suhteliselt raske vältida brändivõi platvormieelistustega tekstide kasutamist õppematerjalina, kuid seejuures on alati võimalik kommentaaridega ja teiste firmade poolt pakutavate näidetega asja tasakaalustada. Just informaatika on traditsiooniliselt olnud veel ühe kallutatuse liigi kasvupinnaks: teatud arvutiplatvormi evangelistid toetavad emotsionaalselt üksnes oma lemmiktarkvara ja üritavad demoniseerida konkureerivaid lahendusi (nt. Linux vs. Microsoft, Mac vs PC, Android vs. IOS). Samas leidub evangeliste ka paljudes teistes valdkondades. Sotsiaalteadustes tuleb aga teadvustada tekstide koolkondlikku kallutatust tavaliselt on igas valdkonnas isiksusepsühholoogiast majandusteooriani rida omavahel konkureerivaid teooriaid, mis paljudes asjades on vastandlikel seisukohtadel. Uurimistöö peaks üritama koolkondade suhtes neutraalset seisukohta võtta, tuua esile ka teiste koolkondade nägemused. Kõigi tekstide kallutatuse hindamisel on olulisimaks allikakriitiliseks meetodiks autori ja tema tausta uurimine. Ilma autori nimeta tekstide puhul (mis näiteks reklaamtekstide puhul on üldlevinud) tuleks kohe eeldada kallutatust ja sedalaadi tekstide kasutamist õppematerjali allikana tuleks vältida. Kui autor on teada, siis tuleks uurida autori tausta, leidmaks võimalikke kallutatuse allikaid (koolkond, osapool, partei, religioon, firma jne). Eraldi võiks siinkohal välja tuua Vikipeedia kasutamise allikana. Vikipeedia on kogukonnapõhiselt loodud materjal ning seetõttu on kasutamisel konkreetsele autorile viitamine sageli võimatu. Lisaks sellele ei loeta entsüklopeediate tsiteerimist teadustöös heaks stiiliks. Vikipeedia tsiteerimist 12 / 85

13 üliõpilastöödes on kritiseerinud Vikipeedia looja Jimmy Wales isiklikult: "For god sake you're in college; don't cite the encyclopedia" (Young, 2006). Teisalt on ingliskeelse Vikipeedia olulisemad artiklid vikipedistide valvsa pilgu all, mis tõstab nende usaldusväärsust allikmaterjalidena. Samuti puudub Eestis sageli ligipääs esmastele allikatele, ning ainsaks võimaluseks on kasutada teiseseid allikaid nagu Vikipeedia artiklid. Lisaks kasutajate poolt loodud sisule on allikakriitiline lähenemine oluline ka massimeedia puhul, mis kipub sageli olema ühele või teisele poole kallutatud. Näiteid sellistest ajalehtedest ja telekanalitest teab iga lugeja ise. 13 / 85

14 EESMÄRGID 2. Andmete kogumine ja analüüsiks ettevalmistamine Käesolevas peatükis leiame vastused küsimustele: Kuidas andmeid koguda, et uurimistöö tulemused oleksid usaldusväärsed? Mida peaks küsimustiku koostamisel silmas pidama, mida vältima? Kas ka andmekogumist saab korraldada veebipõhiselt? Kas andmeid tuleb koguda kõigi kohta, keda/mida uurimistöö järeldused hõlmama peaksid? Kuidas sisestada andmed arvutisse nii, et neid oleks võimalik mugavalt analüüsida? Kuidas veenduda, et andmete sisestamisel pole tekkinud vigu? 2.1. Andmete kogumise erinevad viisid Näide: Malle soovib oma uurimistöös rääkida oma küla inimeste mälestustest, mis seonduvad jõulukommetega nende lapsepõlvekodus. Jukul on plaanis lähemalt uurida ilmastiku muutumist kodukandis. Kalle tahaks teada saada, kuidas on inimesed harjunud euro kasutamisega. Sassi aga huvitab, milliseid veebilehti tema eakaaslased kõige enam külastavad ja milliseid nad kõige õpetlikemaks peavad. Et oma küsimustele vastused saada, on neil kõigil on vaja koguda andmeid. Aga mil viisil on mõistlik ja võimalik andmeid koguda, et uurimistöö tulemused oleksid usaldusväärsed? Andmete saamiseks võib läbi viia otseseid mõõtmisi või kasutada andureid (mõõta võib nt temperatuuri, inimese pikkust, jooksu aega, vms), kasutada olemasolevaid allikaid (arhiivimaterjalid, inimeste veebipostitused või blogid, meediatekstid, fotod ja pildid, logid, vms), korraldada vaatlusi, küsitlusi või testimist. Seega, lähtuvalt sellest, mida me uurida tahame, võib andmetena kasutada väga erinevaid allikaid, kuid silmas tuleb pidada, et ei mindaks vastuollu eetikaga ning et uurimistöö läbiviija tunneks hästi vastavat tüüpi andmete analüüsimiseks sobivaid meetodeid. Andmete edasise töötlemise ja analüüsimise seisukohast ei ole tihti määrav kas, andmed on kogutud kirjalikult, suuliselt või visuaalse vaatluse teel vaid hoopis see, kuivõrd uurija määrab kindlaks või jätab avatuks selle, millisel kujul peavad kogutavad andmed olema (konkreetsed arvud, valikud etteantud variantide hulgast, vaba tekst, jms). Uurimismeetodite kontekstis räägitakse siinkohal tihti kvantitatiivsetest ja kvalitatiivsetest meetoditest. Kuna need märksõnad on uurimistööde läbiviimise juures väga laia tähendusväljaga, võiks andmete kogumisest rääkides eelistada sõnapaarile kvantitatiivne kvalitatiivne sisult konkreetsemaid märksõnu: struktureeritud ja struktureerimata andmekogumise viisid ja andmed. STRUKTUREERITUD andmekogumise meetodi STRUKTUREERIMATA andmekogumise tüüpilise tüüpilise näitena võib ette kujutada üht tavapärast näitena võib ette kujutada avatud intervjuud, mis ankeeti, kus vastajale on ette antud nii küsimused sarnaneb vabale vestlusele, kus intervjueerija ei kui ka võimalikud vastuste variandid, mille hulgast esita konkreetseid lühivastust eeldavaid küsimusi, ta vastavalt juhendile sobiva(d) välja peab valima. vaid suunab intervjueeritavat teatud teemadest rääkima, 14 / 85 esitab kuuldu põhjal täpsustavaid

15 küsimusi ning julgustab teda oma mõtteid põhjalikult lahti seletama ja põhjendama. Loomulikult võib ette kujutada ka vahepealset varianti, kus vastajale esitatakse kas kirjalikult või suuliselt vastamiseks avatud st ilma vastusevariantideta, kuid küllalt konkreetseid küsimusi, millele eeldatakse vastaja oma tõlgendusest lähtuvat, kuid siiski suhteliselt lühidat vastust. Sellisel juhul võiks rääkida poolstruktureeritud andmekogumise meetodist. Tavapärased andmekogumismeetodid: otsene loendamine ja mõõtmine dokumenteerimine / koondandmete talletamine *** struktureerimata e avatud, poolstruktureeritud ja struktureeritud intervjuud (suulised küsitlused) struktureeritud ja poolstruktureeritud ankeedid (kirjalikud küsimustikud) (standardiseeritud) võimekus ja sooritustestid psühholoogilisi ja sotsiaalseid nähtusi (nt hoiakud, väärtused, hinnangud, jms) mõõtvad testid *** struktureerimata andmete kodeerimine kontentanalüüs Ülesanne. Meenuta koos kaaslastega, mil viisil olete ise andmeid kogunud (või näinud kogutavat) ja täida järgmine tabel rühmatööna. Andmekogumise viisid: Mis eesmärgil oled Milliste uurimisteemadega kasutanud? või õppeainetega eelkõige seondub? Andmete lugemine anduritelt Olemasolevate allikate kasutamine Vaatlus Küsitlus Testimine 2.2. Küsimustiku koostamise ABC Näide. Liise soovib uurida, millised on tema klassikaaslaste plaanid peale keskhariduse omandamist. Ta alustas teemade kaardistamisest, mille kohta ta tahaks rohkem teada saada: Millised on klassikaaslaste keskhariduse omandamise järgsed plaanid edasiõppimiseks või töötamiseks? Missugune on edasiõppimise puhul esimene eelistus? Kuhu/kellena soovivad kaasõpilased tööle minna? Mis on tehtavate valikute põhjused? Liise otsustas, et parim viis nende teemade kohta andmete kogumiseks on küsitluse läbiviimine. Seega, peab ta nüüd oma laiematest küsimustest vormistama ankeedi küsimused. Liise oli pisut kimbatuses, sest ta polnud varem ankeeti koostanud ja ei teadnud, mida ta peab selle koostamise juures silmas pidama? Tihti mõeldakse, et kuna oleme ise vastanud paljudele küsimustikele ning erinevate küsimuste esitamine on 15 / 85

16 kõigile inimestele igapäevane tegevus, siis on küsimustiku koostamine väga lihtne tegevus. Uurimistööde läbiviimise juures tuleb aga tihti ette, et uurijale nii selgena näivad küsimused ei ole vastaja jaoks hästi arusaadavad, mistõttu jäävad uurijal vastused saamata või siis on saadud vastuste e andmete kvaliteet väga madal. Silmas tuleb aga pidada, et andmete kvaliteet on kogu uuringu kvaliteedi aluseks sellest üksi ei piisa heade ja usaldusväärsete tulemuste saamiseks, kuid kui andmete kvaliteet on kehv, siis ei aita ükski andmete analüüsimise meetod saada häid tulemusi! Seepärast ole küsimustiku koostamise juures eriti hoolas, küsi õpetaja või kellegi kogenuma abi ning püüa järgida alljärgnevalt toodud juhiseid. Hea küsimustik on: Hoiduda tuleks sellistest küsimustest nagu: selge sõnastusega, kergesti ja üheselt mõistetavate küsimustega, kompaktne ja kiiresti vastatav, vormistuselt korrektne; koostatud nii, et oleks minimiseeritud vastajate ja andmete töötlejate poolt potentsiaalselt tehtavate suunavad küsimused; teaduslikult täpse, kuid pika ja keeruka sõnastusega küsimused; mitmeti mõistetavad küsimused; ärritavad küsimused (sh küsimusega mittesobivad vastusevariandid). vigade hulk. Küsimuste/mõõdikute kavandamisel mõtle ja otsi infot järgneva kohta: kas saab uuritavat nähtust mõõta otse või läbi indikaatori(te)? kas antud nähtust on eelnevates uuringutes mõõdetud ning kas vastav kirjandus on usaldusväärne? kas saab juba olemasolevaid mõõdikuid kohandada või tuleb välja töötada uued mõõdikud/küsimused? (pööra tähelepanu: kultuurilised ja kontekstuaalsed erinevused; võrreldavus eelnevate uuringute tulemustega, jne) kas peaks kasutama kellegi kogenuma abi? kas peaks kasutama piloteerimist ning järelkontrolli? Jätkates punkti alguses kirjeldatud näidet, koostame ankeedi jaoks sobilikud küsimused ning lisame vajadusel ka vastusevariandid. 1. Kas oled mõelnud, mida teed peale keskhariduse omandamist? a) mul on kindel plaan õpinguid jätkata b) ei soovi õpinguid jätkata, lähen tööle c) olen sellele mõelnud, kuid ei oska hetkel öelda, mida ma tahan edaspidi teha 2. Kui kavatsed õpinguid jätkata, siis millises õppeasutuses (soovi korral kirjuta mitme õppeasutuse nimed)? 3. Millisel erialal sooviksid õpinguid jätkata (soovi korral kirjuta mitu eriala alustades kõige sobivamast)? Ülesanne. Koostatud näidisküsimustel 2. ja 3. pole vastusevariante välja toodud. Kas sina toimiksid samuti või lisaksid nendele küsimustele vastusevariandid? Põhjenda vastust. Ülesanne. Jätka näiteankeeti 3-5 küsimusega nii, et Liise poolt kaardistatud teemad oleksid kaetud. Ülesanne. Arutlege grupis, miks kirjalikes (eriti posti teel korraldatud) küsitlustes pole tavaliselt soovitav esitada avatud küsimusi? Ülesanne. Arutle, mis on avatud ja struktureeritud küsimuste eelised ja puudused või piirangud? 2.3. Veebipõhise ku simustiku koostamine Näide. Kuna Kirsti on usin arvutikasutaja ning teab, kuivõrd palju lihtsamaks võib infotehnoloogia kasutamine 16 / 85

17 muuta töö tegemise ja sõpradega suhtlemise, otsustas ta ka andmete kogumisel kasutada interneti võimalusi ning koostas veebipõhise küsimustiku kasutades selleks programmi Google Forms. Valmis küsimustiku aadressi edastas Kirsti oma sõpradele i teel, postitas foorumisse ning Facebooki. Esimesel päeval laekus 23 vastust, teisel 11 ning järgmistel päevadel vastuseid enam ei tulnud. Ülesanne: Arutle, mis võisid olla põhjused, et Kirsti loodetud mitmesaja vastuse asemel sai ainult pisut üle kolmekümne vastuse? Veebipõhisel andmekogumisel on omad tugevused: aja ja raha kulu suure hulga vastajateni jõudmiseks ja andmete kogumiseks on minimaalsed ning uuritavad saavad valida nendele sobiva aja vastamiseks. Siiski juhtub praktikas tihti, et veebipõhiselt saadetud küsitlusele ei saada soovitud hulgal vastuseid, sest igapäevases informatsioonitulvas jääb saadetud küsitlus märkamata või seda lihtsalt ignoreeritakse kuna vastamise palve saanutel puudub huvi teema vastu ja seetõttu ka motivatsioon oma aega panustada. Vastajate motivatsiooni võib vähendada ka see, kui pöördumine ja küsitlus on lohakalt, oskamatult või vigaselt vormistatud, sisaldades kirjavigu, ebakorrektset keelekasutust, ebasobivat või vastamist segavat kujundust, vms. Arvestada tuleb ka sellega, et kõik sihtgrupid ei pruugi olla aktiivsed ja vilunud arvutikasutajad, mistõttu sellisel teel saadetud küsitlus ei jõua nendeni või jääb vastamine toppama väheste arvutikasutusoskuste tõttu. Suurema osaluse tagamiseks peaks vastajate poole pöördumine olema motiveeriv ning vajadusel informeeritakse vastajaid eelnevalt uuringu toimumisest näiteks telefoni teel. Veebipõhiseid küsitluste koostamise ja läbiviimise programme on mitmeid. Alljärgnevas on võrdlevalt kirjeldatud mõnda neist. Pane tähele, et osad programmid on üsna piiratud võimalustega, kuid algajale kasutajale lihtsamad, teised jälle on väga professionaalset lähenemist lubavad, aga seeläbi ka keerulisemad kasutada. Valida tuleb see, mis vastab parimal viisil sinu eesmärkidele ja oskustele. Õpetused lihtsamate programmide Google Form i ja Zoho kasutamiseks leiad Google Form on lihtne veebipõhine küsitluste koostamise vahend, sisaldades 7 põhilist küsimuse tüüpi: lühike tekst, pikem tekstiala, valikvastusega küsimus (nii ühe kui ka mitme vastusevariandi valimise võimalused), hinnanguskaala ning tabeli tüüpi küsimus. Küsitluse tausta kujundamiseks pakutakse üle 90 erineva näidispõhja. Valmis küsitluse saab saata programmist otse ile, lisada veebilehele või kopeerida küsitluse aadress foorumisse vms. Küsitluse tulemused salvestatakse andmetabelina ning neid on võimalik alla laadida.xls failivormingus. Tulemuste graafilist kokkuvõtet on võimalik vaadata Google Docs keskkonnas. Connect.ee on eestikeelne küsitluste koostamise vahend, mis sisaldab 10 erinevat küsimuse tüüpi ning pakub kasutamiseks erinevaid uuringumalle. Eeldab kasutajaks registreerumist Connect.ee keskkonnas. Tasuta vahend sisaldab 3 kuulist kasutusaega, kuni 3 küsitlust (igas maksimaalselt 10 küsimust) ning kuni 50 vastaja tulemusi ühe küsitluse kohta. 17 / 85

18 Küsitluse aadressi saab saata e-posti teel või kopeerida otselingina. Tulemused on koondatud graafikutesse ning neid on võimalik alla laadida exceli formaadis edasiseks töötlemiseks. Zoho Creator on veebipõhiste küsitluste koostamise vahend, mis sisaldab mitut erinevat (tasulist) versiooni (tasuta 15 päevane proovimise võimalus). eformular on lihtne eesti keelne vahend, mis sisaldab põhjalikku abiinfosüsteemi. Formularide koostamine ja küsitluste läbiviimine on tasuta, tasuliseks muutub vastuste (alates 10. vastajast) vaatamine ja allalaadimine vastavalt hinnakirjale ( vastajat ). Eraldi hinnad kehtivad üldhariduskoolidele ning kutsehariduskeskustele. Lime Survey on vabatarkvaraline küsitluse loomise tarkvara, mille kasutamine eeldab tarkvara installeerimist arvutisse. Võimaldab koostada viite eritüüpi (kuni 28 alatüüpi) küsimusi. Ülesanne. Too näiteid teemadest ja sihtrühmadest, mille/kelle uurimisel sobiks kasutada veebipõhiseid andmekogumisvahendeid ja mille/kelle puhul mitte. Ülesanne. Koosta vastajaid motiveeriv pöördumine (kaaskiri) palumaks neil osaleda pt.2.2. näites käsitletud uuringus (teemaks tegurid, mis mõjutavad klassikaaslaste valikuid peale keskhariduse omandamist) Pisut teooriat, mida hea teada ja arvestada juba enne andmete kogumist Näide: Ats oli kokku kogunud suure hulga andmeid ja neid juba ka analüüsinud, kuid kui ta oma tulemusi õpetajale näitas, ütles viimane, et analüüsiks valitud meetodid ei ole andmetele kohased ja uuris, miks Ats oli valinud just sellised küsimused ja valikvastused, kui ta oma küsimustikku koostas? Ats ei osanud midagi kosta ja küsis, kas ta siis ei saagi kogutud andmeid analüüsida? Õpetaja rahustas Atsi, et mingi analüüsi saab ka tema kogutud andmete põhjal läbi viia, kuid samas mainis, et järgmine kord tasub analüüsi võimaluste peale mõelda juba enne andmete kogumist ja selleks on vaja teada pisut teooriat! Niisiis, enne kui (järgmine kord) otsustad, mil viisil ja milliste konkreetsete vahendite või meetoditega oma uurimistöös andmeid koguma hakata, õpime selgeks neli andmeanalüüsi juures möödapääsmatut märksõna: objekt, tunnus, väärtus ja skaala ning räägime pisut erinevatest struktureeritud andmete tüüpidest. Ühest küljest aitab nende mõistete teadmine paremini vastavatest teemadest rääkida ja aru saada, teisest küljest aitavad laiemad teadmised andmete olemusest kaasa parema ja usaldusväärsema analüüsitulemuse saamisele. Tuletame meelde, et vastavalt sellele, mida me uurida tahame, kogume me andmeid kas inimeste, koolide, valgete hiirte, kalendrikuude, kartulipõldude vms kohta. Kõiki selliseid indiviide või üksusi, kelle/mille käest või kohta on me andmeid kogume, nimetatakse statistilises andmeanalüüsis OBJEKTIDEKS. Andmeid koguma asudes oleme valmis mõelnud mingid neid objekte iseloomustavad omadused, mis meid huvitavad, näiteks: värvus, vanus, hind, kaal, arvamus millegi suhtes, jne selliseid omadusi nimetatakse muutujateks. Omadusi, mida saab mõõta nii (või mis on juba kokku võetud nii), et iga objekti jaoks saadakse ainult üks vastus ehk üks 18 / 85

19 ühik infot nimetatakse TUNNUSTEKS. Objektid ja tunnused peavad olema valitud enne andmete kogumist ning andmete kogumise käigus püüame saada tulemuse või vastuse iga objekti kohta kõigi meid huvitavate tunnuste lõikes - statistika terminoloogiast lähtudes on need VÄÄRTUSED. Nii võivad tunnuse haridus võimalikud väärtused olla näiteks algharidus, põhiharidus, keskharidus ja kõrgharidus, aga tunnuse vanus väärtused näiteks arvud 12, 27, 6, jne. Näeme, et andmed ehk väärtused võivad olla nii arvud kui sõnad. Kõik tunnused võimalikud väärtused kokku moodustavad SKAALA. Näiteks inimese pikkust mõõtes võtame kasutusele harjumuspärase arvskaala, mida näeme mõõdulindil, küsimustikku koostades peame aga tihti küsimustele vastusevariandid välja mõtlema ehk vastavate tunnuste jaoks skaala ise konstrueerima. Võimalikest väärtustest e skaalast, sõltub, mis tüüpi tunnusega on tegu ja sellest omakorda, milliseid analüüsi meetodeid vastava tunnuse analüüsimiseks saab kasutada. Õigeks analüüsimeetodi valikuks tuleb osata teha vahet vähemalt kolmel tunnuste põhitüübil: NIMITUNNUSED, JÄRJESTUSTUNNUSED ja INTERVALLTUNNUSED. Praktilise andmeanalüüsi seisukohast on intervalltunnusel olulised alamtüübid, mistõttu saame alljärgneva jaotuse, kus tüüpe eristavateks võtmeküsimusteks - kas on vastuseid e väärtusi see, saab üheselt järjestada või mitte?, kas vastustest/väärtustest moodustatud skaalal tekkivad vahemikud on võrdsed või mitte? ning - kas võimalikke erinevaid vastuseid e väärtusi on vähe või palju? Nimitunnused (nt rahvus: eestlane, venelane, soomlane,...) NB! Nimitunnusel ei ole väärtused üheselt järjestatavad, järjestustunnusel on! Järjestustunnused (nt haridustase: algharidus, põhiharidus, keskharidus,...) NB! Järjestustunnusel ei ole väärtuste vahemikud võrdsed, intervalltunnusel on! Intervalltunnused (s.h arvtunnused) (nt vanus: 27 a, 32 a, 51 a,...) Intervalltunnused väheste erinevate väärtustega (nt 4-palli rahuloluskaala: rahul, pigem rahul, pigem mitte rahul, mitte rahul) Intervalltunnused paljude erinevate väärtustega (nt palk: 926 eur, 1003 eur, 1442 eur,...) Vaadake alltoodud küsimusi ja kujutledes, et selliseid andmeid saaksite koguda nt saja kooli kohta, otsustage, mis tüüpi tunnuse moodustavad iga küsimuse põhjal saadavad andmed? Ülesanne: Mis tüüpi kooliga on tegu? (algkool, 9-klassiline kool, 12-klassiline kool) Kui kaugel on kool kesklinnast? Milline on kooli maine? (väga hea, hea, rahuldav, halb, väga halb) Millised huviringid koolis tegutsevad? (laulukoor, korvpalli trenn, kunstiring, jne) Mitu paralleelklassi avatakse? Kui suured on selles koolis klassid? (väikesed, keskmised, suured) Mis on õpetajate keskmine vanus selles koolis? 2.5.* Uuritavate valimine andmete kogumiseks - valim ja üldkogum Näide: Malle soovib oma uurimistöös rääkida oma küla inimeste mälestustest, mis seonduvad jõulukommetega nende lapsepõlvekodus. Kalle tahaks võrrelda huvitegevuse võimalusi maa ja linnakoolides. Sassi aga huvitab, 19 / 85

20 milliseid veebilehti tema eakaaslased kõige enam külastavad ja milliseid nad kõige õpetlikemaks peavad. Et oma küsimustele vastused saada, on neil kõigil vaja koguda andmeid. Aga kuidas otsustada, kellelt andmeid koguda? Kui me hoolikalt loeme näites toodud uurimistöö eesmärkide sõnastusi, siis näeme, et need määravad küll ära sihtrühma, kellelt või mille kohta andmeid koguda, kuid ei piiritle seda väga täpselt. Näiteks Malle puhul on selleks oma küla inimesed, Kalle puhul maa ja linna koolid ning Sassi puhul tema eakaaslased. Ülesanne: Arutle, kas Malle, Kalle ja Sass suudaksid koguda andmeid kõigi sihtrühma liikmete e objektide käest/kohta? On selge, et tegelikus elus ei ole tihti võimalik vaadelda, mõõta, loendada või küsitleda kõiki objekte, keda meie esialgsed uurimiseesmärgid sihtrühmana kirjeldavad. Olukorra lahendamise üks võimalus on piiritleda sihtrühm kitsamalt arvestades sellega, kelle käest või milliste objektide kohta me tegelikult suudame andmeid koguda ning teha oma järeldused ka ainult selle grupi kohta, mille kohta on meil andmed olemas. Algajatel uurijatel, kelle on veel vähe oskusi ning napib ka ajalist ning rahalist ressurssi uurimistöö läbiviimiseks, on tihti mõistlik just selline tagasihoidlik strateegia valida. Tõsisemate uuringute eesmärgiks on aga tihti ka üldistuste tegemine st mingi laiema objektide hulga kirjeldamine, mille kõiki objekte ei ole uuringu käigus reaalselt võimalik (ega ka mõttekas) vaadelda. Näiteks psühholoog, kes uurib valgete hiirte õppimisvõimet, loodab, et saavutatud tulemused ning seega ka järeldused kehtivad kõigi valgete hiirte puhul - mitte ainult praegu olemasolevate, vaid ka veel sündimata hiirte puhul ning ta võib isegi loota, et tema tulemusi võib sedavõrd üldistada, et need selgitaks inimese õppimist. Üldistavate järelduste aluseks võib olla teoreetiline teadmine objektide sarnasuses kohta, uuritud objektide tüüpilisus või statistiline tõenäosus. Viimasel juhul räägitakse andmete kogumisel valimist, mille põhjal saab teha järeldusi üldkogumi kohta. ÜLDKOGUMI (ehk populatsiooni) all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Näiteks võivad erinevate valdkondade esindajad tahta uurida (kõigi) Tallinna koolilaste õpimotivatsiooni; ära arvata erinevatel eksamitel läbipääsevate õpilaste (üld)arvu; ennustada viljasaaki (kõigil) uue väetisega väetatavatel põldudel; jne. Üldkogumist uurimiseks valitud (suhteliselt väikest) objektide gruppi nimetatakse VALIMIKS. Ülesanne. Too näide olukorrast, kus kogu üldkogumi uurimine ei ole praktiliselt võimalik. Ülesanne. Too näide üldkogumist, mille kõiki objekte oleks võimalik uurida, kuid see oleks väga ressursikulukas. Juhusliku valimi koostamine Näide. Juss sai ülesandeks uurida kõiki oma kooli õpilasi. Uuringu teemaks oli rahulolu kooli toiduga. Kuna Juss ja tema sõbrad olid koolitoiduga väga rahul, ei pidanud ta vajalikuks küsitleda kedagi peale oma sõprade. Kõikide kooli õpilaste küsitlemine oleks niikuinii liiga kaua aega võtnud. 20 / 85

21 Ülesanne. Vasta järgmistele küsimustele: a) Kes moodustasid antud näites üldkogumi? b) Kas Jussi arvamus, et ta kõiki kooli õpilasi küsitleda ei jõua, oli põhjendatud? c) Kas Jussi sõprade arvamus annab ülevaate sellest, mida arvavad kõik tema kooli õpilased. Põhjenda vastust. Selleks, et valimi põhjal üldkogumi kohta statistiliste meetodite abil üldistatud järeldusi teha, tuleb valimi liikmed valida JUHUSLIKULT. Juhuslikult ei ole antud kontekstis sugugi mitte sünonüüm suvalisele ; juhuslikkus statistikas tähendab, et igal üldkogumi liikmel peab olema võrdne võimalus valimisse valitud saada. Selleks, et tagada valimi esindamisvõime on mitmeid võimalusi. JUHUVALIM SÜSTEMAATILINE VALIM KIHTVALIM KÕIKNE VALIM Kui meil on kasutada üldkogumi liikmete nimekiri: kõigepealt tuleb üksikud liikmed nummerdada määrata valimi maht e. valimisse valitavate objektide arv juhuslike arvude tabeli või arvuti juhuslike arvude generaatori abil leida vastav hulk arve, mis määravad ära valimisse valitavate üldkogumi liikmete järjekorranumbrid. Kui meil ei ole üldkogumi liikmete nimekirja. Näiteks tänavaküsitlusel ei tea, kes teile järgmisena vastu tuleb ning loomulikult ei saa te neid vastutulijaid eelnevalt nummerdada. Nimekirja puudumisel tuleks toimida nii: eelnevalt tuleb otsustada, et te küsitlete peale iga eelmise intervjuu lõppemist näiteks täpselt viiendat vastutulijat või siis inimest, kes tuleb teile vastu täpselt 1 (või 2, või 3 või jne.) minutit peale eelmise intervjuu lõppu. Mõnel juhul, kui on ette teada, et üldkogum koosneb erinevatest osadest (näiteks gümnaasiumis õpib 700 naissoost ja 300 meessoost õpilast) ning meil on põhjust arvata, et need osad omavahel mõne tunnuse osas erinevad, siis on mõistlik kasutada kihtvalimit, kus eelnevalt otsustatakse kui palju liikmeid valitakse valimisse igast üldkogumi erinevast osast. Tavaliselt tehakse seda proportsionaalselt üldkogumi tegeliku jaotusega. Seega, kui me tahame saada sajaliikmelist valimit, mis oleks proportsionaalne eelnevas näites toodud üldkogumiga, siis peaksime välja valima 70 naist ja 30 meest, kusjuures naiste ja meeste hulgast tuleb valimi liikmed valida eelpool toodud nõudeid arvestades st. juhuslikult. Olukord kus üldkogumi suuruse või eripära tõttu kaasatakse uuringusse kõik üldkogumi objektid e. üldkogum = valim Ülesanne. Millist tüüpi valimi soovitaksid sina Jussil moodustada, et see oleks juhuslik ning annaks ülevaate kõikide kooli õpilaste arvamusest. Ülesanne. Süstemaatilist valimit saab koostada ka nimekirja olemasolu korral. Too näide. Ülesanne. Arutle oma pinginaabriga, millisel viisil võiks moodustada valimi Eesti avaliku arvamuse küsitluste läbiviimisel. Ülesanne. Kui reeglina kaasatakse Eestis avaliku arvamuse küsitlustesse umbes 1000 inimest, siis kui suur on tõenäosus, et sina satud juhuvaliku tulemusena valimisse? 21 / 85

22 2.6. Struktureeritud andmestik ja andmetabeli koostamine Näide: Malle oli läbi viinud ankeetküsitluse, milles kokku 26 küsimust. Ta hakkas õhinal paberil olevaid andmeid analüüsima lapates küsitluslehti ja lugedes kokku ühte moodi vastuseid. Üsna varsti Malle tüdis sellest tegevusest ja otsustas, et andmete analüüsimine on üks tülikas ja igav töö. Ülesanne: Arutle, kas sellisel viisil läbiviidud analüüs on mõistlik? Kui Malle ind poleks raugenud, kas ja kuivõrd oleksid tema analüüsi tulemused olnud piiratud? Kuidas andmete analüüsimise juures töömahtu vähendada ja analüüsitulemuste usaldusväärsust tõsta? Enne arvulisel või struktureeritud kujul olevate andmete analüüsima asumist on mõistlik andmed sisestada andmetabelisse kasutades selleks mõnd ruudulise töölehega arvutiprogrammi (nt MS Excel, OpenOffice.org Calc, Statistica, SPSS, jne) ning kasutada hiljem andmete analüüsimisel arvuti abi. Viimane päästab meid korduvast ja aeganõudvast andmete loendamisest ning võimaldab kiiresti ja mugavalt kasutada samu andmeid uute sisuliste analüüsiküsimuste vastamiseks. Algandmetest andmetabelit koostades tuleb eelkõige meeles pidada, et õige andmetabel peab olema askeetlik st hästi lihtsa ja alati samasuguse põhistruktuuriga: iga objekt saab endale tabelis ühe rea, iga tunnus omale ühe veeru ning iga väärtus ühe lahtri. Toon kaks näidet andmetabelitest, mis on mõlemad korrektse ülesehitusega, kuigi esimese puhul on tegu kooliõpilaste ning teisel puhul professionaalide poolt koostatud tabeliga. 22 / 85

23 Mugava ja paindliku analüüsi tagamiseks tuleb andmetabeli koostamisel arvestada veel mitmete reeglitega, millest olulisemad on järgmised: Igale tunnusele/veerule antakse nimi, mis peab olema unikaalne st teistest erinev ning suhteliselt lühike, sest pikkade nimede puhul võtab õigete tunnuste otsimine analüüsi käigus väga palju aega; ei kasutata mitut veergu ühendavaid pealkirju jms! Igas lahtris tohib olla ainult üks väärtus e üks ühik infot st mitut vastust ühte lahtrisse sisestada ei tohi! Seega, kui ühe ankeedi küsimuse puhul on vastajal lubatud valida mitu vastusevarianti, annab iga variant andmetabelis eraldi tunnuse/veeru. Professionaalid väldivad andmete sisestamist tekstidena ning kasutavad selle asemel vastusevariantide kodeerimist, sest nii hoitakse kokku aega, välditakse sisestusvigu ning hiljem on võimalik andmeid paindlikumalt analüüsida (PS! ilma kodeerimiseeskirja teadmata ei ole sellist andmestikku sisuliselt võimalik analüüsida; professionaalsed statistikapaketid lubavad kodeerimiseeskirja sisestada koos andmetega ja oskavad seal olevaid kirjeldusi ka kasutada!) Ühes veerus tohivad olla ainult üht tüüpi andmed st kui on otsustatud tunnuse sõnaliste väärtuste asemel kasutada arvulisi koode, siis arvude vahele muid sümboleid ei sisestata; puuduva vastuse/väärtuse jaoks mõeldakse välja sobiv arvuline kood või jäetakse vastav lahter lihtsalt tühjaks. Ülesanne. Lisaks uurimuse teemaga seonduvatele küsimustele kogutakse vastajate kohta selleks, et võrrelda tulemusi näiteks soo, vanuse, hariduse, elukoha või mõnede muude huvipakkuvate tunnuste lõikes, ka vastavaid sotsiaal-demograafilisi andmeid. Koosta küsimustiku alltoodud taustatunnuste osa kohta andmetabel ja sisesta sinna enda kohta käivad andmed. 1. Sugu: mees naine 6. Tegevusala: (märgi kõik sobivad vastused) 2. Vanus: aastat Käin tööl 3. Leibkonna liikmete arv: Üliõpilane, õpilane 4. Elukoht: Pensionär Tallinn Kodune Maakonnakeskus, suurem linn Töötu Väikelinn Maa-asula, küla 5. Kõrgem omandatud haridustase: Algharidus Kõigi uuringus osalejate vahel loositakse välja Põhiharidus 20x10 kinkekaardid. Loosimises osalemiseks Kutseharidus (ilma keskhariduseta) palun Keskharidus Kutseharidus + keskharidus Rakenduslik kõrgharidus kirjutage oma e-posti aadress: Täname koostöö eest! Ülikooliharidus, kraadiharidus 23 / 85

24 2.7. Andmete korrastamine Näide: Anne oli juba tükk aega andmeid analüüsinud, kui talle hakkasid tulemused kahtlased tunduma kui nüüd keskmiseks hindeks tuli grupil arvutuste kohaselt 5,72 oli selge, et seda ei saa tõeseks pidada, sest isegi üksikud hinded ei saa ju üle 5 olla! Anne oli kimbatuses ja ei osanud vea põhjust leida. Ülesanne: Mõtle ja arutle, mis võivad olla valede analüüsitulemuste põhjusteks? Andmete sisestamisel andmetabelisse peab olema väga hoolikas, et vältida sisestusvigu, sest tihti pole hiljem võimalik neid vigu leida. Samas peaks enne andmete sisulist analüüsi siiski veenduma, et andmete sisestamisel pole tekkinud tüüpilisi ja kergesti tuvastatavaid näpuvigu. Näiteks on tüüpilised vead sellised, kus arvude sisestamisel on koma jäänud panemata või on see sattunud valesse kohta; kodeeritud andmete puhul on koodi 2 asemel sisestatud 22 või koodi 5 asemel 55 ; tekstina sisestatavate andmete puhul on sama väärtuse jaoks kasutatud erinevaid sõnu (nt Harjumaa ja Harju maakond ) või on tekkinud kirjaviga (nt Tallinn asemel on sisestatud Talliin ); vms. Selliste vigade leidmiseks võib kasutada erinevaid tarkvara võimalusi, kuid Exceli puhul on üks väga nutikas lahendus kasutada filtreerimist. Valides Data/Sort&Filter/Filter lisatakse kõigi tunnuste/veergude päisele valikunupp, millel klõpsides kuvatakse rippmenüüs kõik veerust leitud erinevad väärtused. Kui nende hulgas on selliseid, mis antud tunnuse puhul pole lubatud, siis saab need sama filtreerimise võimalust kasutades üles leida ning vastavalt parandada (vajadusel tuleb õige väärtuse teadasaamiseks otsida üles vastava objekti mõõtmistulemuste leht või küsimustik!). Näide. Kontrollime andmestiku ess.xlsx (Euroopa Sotsiaaluuringu andmestik) sisestusvigade suhtes filtreerimise teel. Lisame filtreerimise valiknupu Data/Sort&Filter/Filter Kõikide meie andmestiku tunnuste päistesse ilmusid valiknupud. Avades tunnuse Regioon filtri näeme rippmenüüs valikuid erinevatest tunnuse väärtustest. Andmesisestusel on mõnel korral eksitud väärtuse Põhjaeesti sisestamisel, mille asemel peaks olema Põhja-Eesti. Eemaldame selekteeringu (Select All) ning valime ainult väärtuse, mida soovime kuuta (antud näites: Põhjaeesti). Valikut kinnitades (OK) näeme andmetabelis vaid neid objekte, kellel on regiooni väärtuseks Põhjaeesti. Teeme parandused ning eemaldame filtris määratud tingimuse (Clear Filter form Regioon ) Lisaks väärtuste loendile pakub fitreerimine ka andmetabeli järjestamist valitud tunnuse väärtuste põhjal (Sort). Andmete järjestamine värvi järgi (Sort by Color) eeldab, et andmete 24 / 85

25 sisestamisel on kasutatud erinevaid värve (Font Color). Sõnalise tunnuse korral saame kasutada teksti filtreid (Text Filters), mis pakuvad laiemaid võimalusi andmete filtreerimisel. Näiteks saab määrata, kas mingi fraas sisaldub (või ei sisaldu) filtreeritavates kirjetes. Samuti saab määrata, millise tähega/fraasiga algavad või lõpevad filtreeritavad kirjed. Samaaegselt saab määrata mitu tingimust. Numbrilise tunnuse filtreerimisel pakub numbrifilter (Number Filters) veelgi enam tingimuste määramise valikuid (suurem/väiksem teatavast väärtusest, väärtuste vahel asetsev, keskväärtusest väiksem/suurem jne). Pane tähele, et filtri kasutamise tagajärjel kuvatavad kirjed omavad algset rea numbrit ning objektid, mis ei vasta määratud tingimusele on peidetud (mitte kustutatud). Andmestiku all on ära toodud objektide arv, kui palju vastavale tingimusele vastavaid objekte leiti. Ülesanne. Arutle, miks peab olema ettevaatlik filtreeritud andmestikust näiteks kolme järjestikuse objekti kustutamisel. Ülesanne. Vaata tunnuse Tegevus sisestatud väärtusi. Arutle, milliseid väärtuseid võiks koondada üheks väärtuseks ja vii see koodamine läbi? Ülesanne. Paranda andmestikus esinevad sisestusvead (Leibkonna suuruseks on sisestatud 50, peaks olema 5; kooliskäidud aastate arvu 80 asemel peaks olema 8). Leia lisaks veel ühes tunnuses esinev sisestusviga. Ülesanne*. (Eeldab, et andmestikus on sisestusvead parandatud ning sobivad andmed koondatud) Kasuta filtreid ja leia, kui palju on küsitlusele vastanuid, kes... a)...on alla 65 aastased pensionärid b)...on magistrikraadiga töötud c)...elavad Kirde-Eestis ning kelle kodune keel on eesti keel d)...on üle 40 ja alla 50 aastased mehed ning käivad tasustatud tööl 25 / 85

26 EESMÄRGID 3. Ülevaade andmetest Käesolevas peatükis leiame vastused küsimustele: Millise meetodiga saab kõige lihtsamalt ülevaate andmetest? Millal ja kuidas on statistiliselt korrektne oma uuringu tulemusi üldistada? Kas mõnikord on ainult tekst tulemuste esitamiseks parim viis? Mis on diagrammide eesmärk ja kuidas seda saavutada? Miks ei piisa mõnikord ainult keskväärtuse arvutamisest? Milleks on vaja mediaani, moodi ja standardhälvet? 3.1. Andmete analüüsimise põhisammud Eeldame nüüd, et oleme andmete kogumise, sisestamise ja korrastamise etapid läbinud ja saame alustada andmete analüüsimist. Kuidas aga otsustada, millist meetodit oma andmete analüüsimiseks kasutama peaksid? Analüüs algab küsimuse sõnastamisest andmete kohta nt. Kui suur osa küsitlusele vastanutest omavad Facebook i kontot?, Kuidas jagunevad spordipäeval saadud jooksutulemused?, Kas ja kui palju hommikul ja õhtul mõõdetud õhutemperatuurid erinevad?, Kas käitumise hinne on seotud hindega klassijuhataja poolt õpetatud aines?, jne. Pane tähele, et need andmete analüüsi suunavad küsimused erinevad nii uurimisküsimustest, mis suunavad uurimistööd tervikuna, kui ka küsimustikus vastajatele esitatud küsimustest! Sammud andmete analüüsi läbiviimisel Sõnastan konkreetse andmetest lähtuva küsimuse, millele tahan vastust saada Valin püstitatud küsimusest lähtudes kasutadaolevate andmete jaoks sobiva analüüsimeetodi Tulemuste esitlemiseks valin andmete olemust ja tulemuste sisu parimal viisil välja toova ning sihtrühmale arusaadava ja esitluse kohale sobiva esitlusviisi ning visuaalse kujunduse. Analüüsi tuleks alustada lihtsamate ühte tunnust korraga puudutavate küsimustega, mis annavad andmetest esialgse üldise ülevaate. Peale esialgsete kokkuvõtete ja ülevaadete tegemist andmetest on võimalik asuda uurima ka erinevusi ja seoseid. Näide. 10. klasside õpilaste seas viidi läbi uuring internetikasutuse kohta. Muuhulgas küsiti ka seda, kui sageli õpilased külastavad Facebooki portaali, kusjuures vastamiseks anti ette viis vastusevarianti. Esmased analüüsi eeldavad küsimused võiks olla nt. sellised: Kui suur osa õpilasi kasutab Facebooki iga päev?, Kas ja kui palju leidub neid õpilasi, kes Facebooki üldse ei kasuta? Mis on kõige tüüpilisem kasutussagedus ehk millise vastusevariantidest on valinud kõige suurem osa õpilastest?. Ülesanne. Koosta antud teema kohta veel üks samalaadi küsimus Kõik need küsimused eeldavad vastamist kaht tüüpi küsimustele: Kui palju? Kui suur osa? Vastuse saamiseks seda tüüpi küsimustele tuleb loendamise teel leida erinevate vastutusevariantide e. 26 / 85

27 väärtuste esinemissagedused. Arvuti abil vastavat analüüsi läbi viies tuleb tunda nii tavapäraste statistiliste meetodite nimesid, kui ka kasutada oleva tarkvara võimalusi. Edaspidises on toodud näited Eesti koolides kõige laiemalt kättesaadava andmeanalüüsi võimaldava tarkvara MS Excel baasil Sagedustabel Isegi kui esmane küsimus eeldab ainult ühe vastusevariandi e väärtuse esinemissageduse leidmist, koostatakse arvuti abil analüüsi läbi viies mugavuse ja analüüsi kompaktsuse tõttu reeglina vastava tunnuse kõiki väärtusi kokkuvõttev sagedustabel, mis võiks antud näite puhul välja näha selline: Tabel 1. Facebooki portaali külastuste sagedus. Mitu korda päevas Tavaliselt kord päevas Küllalt regulaarselt, aga mitte iga päev Üsna harva, ebaregulaarselt Ei kasuta üldse KOKKU Vastajate arv Osakaal 54,2% 32,7% 3,7% 3,9% 5,5% 100 % Tabelis 1. on lisaks sagedustele (vastajate arv) välja toodud ka iga väärtuse esinemise osakaal protsentides, mis lihtsustab andmetest ülevaate saamist. Näide. Vaatame internetikasutuse osakaalusid 2008.aastal erinevates riikides aastaste laste seas. Tulemuste esitamiseks on koostatud kaks sisuliselt sama, kuid andmete paigutuse (väärtuste esituse) poolest erinevat tabelit (Tabel 2A ja Tabel 2B). Tabel 2A. Riik Eesti Itaalia Kreeka Leedu Läti Rootsi Soome Ungari Osakaal 93% 45% 50% 86% 83% 91% 94% 88% Tabel 2B. Riik Osakaal Soome 94% Eesti 93% Rootsi 91% Ungari 88% Leedu 86% Läti 83% Kreeka 50% Itaalia 45% Juhul kui tabelis toodud kategooriad ei ole sisuliselt tähenduslikus järjekorras, siis järjestatakse tabeli sageduste/osakaalude järgi (Tabel 2B). Sagedustabeli koostamine programmis Excel Sagedustabeli loomiseks kasutame vahendit Pivot Table (Liigendtabel) Aktiviseeri üks lahter andmetabelist. Vali Insert/PivotTable/PivotTable Avanenud aknas on võimalik muuta tabeli koostamiseks kasutatava andmetabeli asukohta või olla nõus pakutava andmetabeliga Tunnuse FACEBOOK väärtuste kokkulugemiseks lohista tunnus FACEBOOK Row väljale. See tagab, et loodava tabeli väärtused ja nendele vastavad sagedused kuvatakse ridades. 27 / 85 read

28 Kui viid tunnuse FACEBOOK Column väljale, saad sagedustabeli, mille väärtused ja sagedused on paigutatud veergudesse. Selleks, et väärtuste esinemissagedused kokku loendatakse, vii tunnus FACEBOOK väljale Values. Sõnalise tunnuse korral lisatakse tunnuse ette automaatselt funktsioon Count (loendamine). Numbrilise tunnuse korral pakutakse vaikimisi keskväärtuse leidmist (Average). Sel juhul tuleb funktsioon average asendada õigega (count). Selleks ava Values lahtris oleva tunnuse taga olev nool ja vali: Value Field Settings/ Summarize by/ Count Protsentide lisamiseks tabelisse vii tunnus FACEBOOK väljale. veelkord Values Klõpsa tunnuse järel oleval noolel ja vali: Value Field Settings/ Show value as/ % column (100% moodustub kokku veerus of olevatest väärtustest). Ülesanne. Anna ülevaade andmestiku õpilased.xls tunnuse Kuidas oled õppinud arvutit kasutama? väärtustest. Kujunda tabelit ning otsusta, kas antud tunnuse väärtuseid oleks korrektne suuruse järjekorda paigutada või mitte. Ülesanne. Püstita andmestiku õpilased.xls kohta 2 esmast andmeanalüüsi küsimust. Koosta püstitatud JÄTA MEELDE küsimuste kohta sagedustabelid ning kirjuta nendele järeldused. Sagedustabel loendab tunnuse väärtuste esinemissagedused. Tunnuse väärtuste jaotumisest ülevaatlikuma pildi saamiseks lisatakse tabelisse ka protsendid. Kui tunnuse väärtustel on sisuline järjestus, siis tabeli ridu sageduste järgi ei järjestata. Excelis kasutatakse sagedustabeli loomiseks vahendit Pivot Table (Liigendtabel) Analüüsi tulemuste esitlemisest Näide: Maril on analüüsi tulemusena koostatud sagedustabel, kuid ta on kuulnud, et analüüsi tulemusi peaks esitama alati diagrammina. Mari kõhkleb, sest ta on ka tabelina esitatud tulemusi näinud ja ei oska seetõttu otsustada, mil moel oma analüüsi tulemust teistele siis esitlema peaks. 28 / 85

29 Ülesanne: Mõtle ja arutle, millal võiks oma tulemusi esitleda tabelina ning millal diagrammina ning kas on veel mõni esitlemise võimalus? Statistilisi andmeid ja statistilise andme-analüüsi arvulisi tulemusi saab esitada: - teksti sees toodud arvudena tabelina arvjoonise e diagrammina Tulemuste esitlusviisi valik sõltub mitmetest teguritest: nt, kas tulemusi esitatakse paberil või suulises ettekandes, kes on sihtrühm ja mis on nende eeldatavad teadmised uurimuse teemavaldkonnas ning statistiliste meetodite alal, jms, kuid esmatähtis on, et esitlusviis toetaks parimal viisil tulemuste sisust kiiret ja õiget arusaamist ning oleks kompaktne. Üldjuhul vali esitluseks: - diagramm, kui soovid eelkõige anda kiiret ülevaadet üldtendentsi(de)st ja suundumus(te)st - tabel, kui on vajalik anda edasi täpset arvulist infot või kui võrreldavate arvnäitajate suurusjärgud on väga erinevad - tekst, kui korraga on vaja esitada vaid üks-kaks arvulist näitajat. Näide: Tulemus, mida Mari tahtis oma töös esitada, nägi Google Formi poolt koostatud kokkuvõttena välja nii: Kuna nagu tulemustest selgub, külastavad kõik 20 küsitlusele vastanut ekooli igapäevaselt ei ole antud juhul otstarbekas tulemuste esitamiseks kasutada ei tabelit ega ka diagrammi, sest lihtne lause aitab kogu tulemuse kenasti ja arusaadavalt edasi anda. Ülesanne: 2008.a. TNS Emori läbiviidud heategevusliku käitumise uuringu tulemuste esitamiseks on all toodud kaks võimalust (A sektordiagramm ja B tekst). Kaalu mõlema variandi tugevusi ja nõrkuseid ning otsusta, milline nendest on parem viis andmete esitamiseks suulises ettekandes ja uurimistöö kirjalikus raportis. A. SEKTORDIAGRAMM B. TEKST 2008.a. TNS Emori läbiviidud uuringus heategevuslikust käitumisest selgus, et 87% vastajatest on viimase aasta jooksul heategevusega ühel või teisel moel kokku puutunud. 29 / 85

30 Joonis 1. Heategevuses osalemine (2008.a.). Tulemusi kirjalikult uurimistöö raportis esitledes tuleb arvestada, et igale lisatud tabelile, diagrammile ja joonisele tuleb tekstiosas viidata ning tabelis või diagrammil olev sisu seletatakse tekstiosas lahti. Lahtiseletuseks ei sobi tabelis või diagrammil oleva arvulise info üks-ühene üleskirjutamine tekstina. Näiteks EI SOBI eelmise punkti Tabelis 1. Toodud tulemuste lahtiseletamiseks järgmine tekst: 47 õpilast ei kasuta Facebooki portaali üldse, 184 õpilast kasutab küllaltki regulaarselt, kuid mitte iga päev. 84 õpilast kasutab portaali mitu korda päevas, 101 kasutab tavaliselt kord päevas ja 224 õpilast kasutab Facebooki üsna harva. Tabelis või diagrammil olevate arvuliste tulemuste lahtiseletamisel uurimustöö tekstis tuleks välja tuua üldised tendentsid (nt. üle poolte vastanutest kasutavad portaali mitu korda päevas või ligikaudu 85% vastanutest kasutab portaali vähemalt üks kord päevas) ning see, mis on töö sisulises kontekstis antud tulemi korral oluline ja mida tahetakse esile tõsta. Ülesanne. Küsi oma klassi õpilastelt, kui sageli nemad Facebooki portaali külastavad. Soovi korral kasuta näites toodud skaalat. Koosta vastustest sagedustabel. Kirjuta tekst, mis sobib saadud sagedustabeli lahtiseletuseks. Ülesanne. Siim viis läbi uuringu, milles osales 48 poissi ja 72 türdukut. Antud tulemuste esitamiseks koostas Siim järgmise sagedustabeli. Poiss Tüdruk KOKKU Põhjenda, Arv kas Siim % 40% 60% 100% peaks või ei peaks koostatud sagedustabelit oma töös uuringu tulemuste esitamiseks kasutama. Ülesanne. Too näiteid tunnustest, mille tulemuste esitamiseks on sobivaim viis kasutada ainult teksti. Ülesanne. Too näiteid tunnustest, mille puhul tulemuste esitamiseks tuleks tekstile lisaks esitada ka tabel või diagramm. Näide. Moonika viis oma klassis läbi lühiuuringu sellest, kui paljud tema klassikaaslased on kokku puutunud heategevusega. Kokku osales uuringus 26 õpilast. 30 / 85

31 Tulemuste esitamisel kaalus Moonika kahe variandi vahel, kas esitada tulemused sagedustena (A) või protsentuaalselt (B). A. Kokku vastas 26 õpilast, kellest 8 on hea- B. Kokku vastas 26 õpilast, kellest 31% on hea- tegevusega kokku puutunud. tegevusega kokku puutunud. Ülesanne: Millise variandi valiksid sina Monika olukorras? Väikeste valimite korral on mõistlik tulemused esitada sagedustena. Protsentide kasutamine võib lugejatele edastada kallutatud pildi andmetest e tekitada ettekujutuse nagu oleks uuritud isikute hulgas tegelikust rohkem vastajaid. Näiteks esitades uuringu tulemusi sellisel kujul: uuringus osales 17 inimest, kellest 23,5% olid teinud rahalisi annetusi eelmise aasta jooksul, on 23,5% taga tegelikult vaid 4 inimest. Seega, korrektsem viis tulemuste esitamiseks oleks järgmine: uuringus osales 17 inimest, kellest 4 olid teinud rahalisi annetusi eelmise aasta jooksul. Soovi korral võib ülevaatlikkuse tõstmiseks sagedusele sulgudes lisada osakaalu: uuringus osales 17 inimest, kellest 4 (23%) olid teinud rahalisi annetusi eelmise aasta jooksul. Suurte valimite korral (kui vastajaid on rohkem kui 100), võib tulemuste esitamisel kasutada ka ainult protsente. Näiteks: Uuringus osales 350 õpilast, kellest 12% olid annetanud oma mänguasjad heategevuslikuks JÄTA MEELDE otstarbeks. Ühe või kahe arvulise näitaja esitamiseks kasuta teksti, mitte tabelit ega diagrammi. Kui vastajaid on alla saja, kasuta tulemuste esitamisel sagedusi. Kui vastajaid on üle saja, kasuta protsente. Küsitluste läbiviimise tarkvara poolt koostatud analüüsi suhtu ettevaatlikkusega ning mõtle läbi, kas automaatselt genereeritud tulem on alati parim viis andmete esitamiseks Tulpdiagramm Näide: TNS Emori andmetel vaatasid Eesti elanikud novembris 2011 televiisorit keskmiselt 4 tundi päevas. Meie kasutuses olevas andmestikus õpilased.xlsx on olemas tunnus Aeg teleri või video vaatamiseks päevas, mille väärtused on kogutud kõrvaltoodud skaalal. 0 tundi alla 1 tunni 1-2 tundi 3-4 tundi üle 5 tunni Vastuste jagunemise kirjeldamiseks saame koostada sagedustabeli, kuid kuna tunnusel on võimalikke väärtusi rohekm kui paar tükki (kokku 5), siis võime tulemuste esitamiseks kaaluda ka diagrammi koostamist. Ülesanne. Koosta andmestikku õpilased.xlsx kasutades tunnuse Aeg TV põhjal alljärgnev sagedustabel. Teleri vaatamise aeg päevas 0 tundi alla 1 tunni 1-2 tundi 3-4 tundi üle 5 tunni KOKKU Vastajate arv / 85

32 Koostame nüüd tulemuste visualiseerimiseks tulpdiagrammi, milles iga tulba kõrgus on proportsionaalne vastavasse kategooriasse kuuluvate õpilaste arvuga. Tulpdiagrammi koostamnine Tulpdiagrammi koostamiseks MS Exceli abil kasutame eelnevalt koostatud sagedustabelit. Märgistame kokkuvõetud andmed ning valime Insert/Charts/Column Tulpdiagrammi kujundamine Tulba kõrguse täpseks kirjeldamiseks on võimalik lisada tulpadele tulba täpset kõrgust väljendavad sildid. Selleks märgista tulbad ning vali: Layout/Labels/Data Labels Lisatud andmesiltide kujundamiseks märgista sildid ning vali: Layout/Labels/More Data Label Options Andmesiltide lisamisel tuleb lähtuda sellest, et joonisel olevad numbrid ja jooned ei kattuks/lõikuks vaid oleksid selgelt loetavad. Vajadusel lohista lisatud sildid ise sobivasse kohta või eemalda jooniselt abijooned. Tulpdiagrammile pealkirja lisamiseks vali: Layout/Labels/Chart Title/Above Chart Tulpade muutmiseks märgista tulbad ning vali: Format/Shape Styles Kui loodud tulpdiagramm kirjeldab vaid ühe tunnuse väärtuseid, ei ole tulpade kõrvale kuvatavat legendi vaja. Selle asemel on mõistlik lisada selgitus (õpilaste arv) y-teljele. Y-teljele selgituse lisamiseks vali: Layout/Labels/Axis Titles/Primary Vertical Axis Title/Rotated Title Joonis 1. Tulpdiagramm Ülesanne: Arutle, kas antud tulemustest saab kiirema ja parema ülevaate sagedustabelist või tulpdiagrammilt ning põhjenda, millise valiku teeksid sina antud tulemuste esitlemiseks? Ülesanne. Koosta andmestiku õpilased.xlsx tunnuse Keskmine hinne väärtuste jagunemise kirjeldamiseks tulpdiagramm. Väärtuste kokkuloendamisel selgub, et tühjasid lahtreid st puuduvaid vastuseid on 26. Kas need oleks mõttekas diagrammilt välja jätta või kaasa võtta? Kujunda diagramm esitluseks sobivale kujule. Näide 2. Martin koostas eesti keele tunni raames uuringu kaasõpilaste lugemisharjumustest ning küsis muuhulgas ka seda, mis liiki oli tema kooli 10.klasside õpilaste viimati loetud raamat. Tulemused koondas Martin järgnevasse tabelisse: 32 / 85

33 Mis liiki raamatut viimati lugesid? Kriminaalromaanid, põnevus Teatmeteosed Ajaloolised ja eluloolised romaanid Matka- ja reisiraamatud KOKKU Õpilaste arv Ülesanne. Sisesta sagedustabelis toodud andmed Exceli töölehele ja koosta nende põhjal tulpdiagramm. Vaata vaikimisi loodavat diagrammi (toodud all) ja too välja puudused diagrammi kujunduses, mida oleks vaja parema ülevaate saamiseks umber kujundada Kui tulpasid kirjedavad tekstid on pikad, siis paigutub tekst tavaliselt automaatselt nii, et seda on ebamugav lugeda (kaldu, üksteise alla vms.). Parema loetavuse saavutamiseks tuleks tulpdiagrammi teljed ära vahetada. Selleks märgista tulpdiagramm ning vali: Design/Change Chart Type/Bar Tulpade järjestamiseks kahanevasse järjekorda järjestame read sagedustabelis vastavalt sageduste kahanemise järjekorda. Skaala muutmiseks teljel märgistame skaala ning valime hiire parema klahvi alt avanenud rippmenüüst: Format Axis Reeglina peaks õige visuaalse ülevaate saamiseks skaala teljel algama 0-st. Määrame skaala miinimumväärtuseks (Fixed) 0. Maksimumväärtuseks võib meie näite puhul jääda ka 28, kuid soovides 5-ühikulise jaotusega skaalat, määrame maksimumväärtuseks 30. Jaotusühikud moodustatakse automaatselt mele sisestatud madalaima ja kõrgeima teljel kuvatava väärtuse järgi. Soovi korral saab neid ka muuta (major unit hõredam jaotus; minor unit tihedam jaotus). Lisades veel diagrammile pealkirja, x-telje kirjelduse ning kustutades legend, saame järgneva diagrammi, millel on toodud 10.klasside õpilaste viimase kuu lugemuse ülevaade. 33 / 85

34 Ülesanne. Koosta tulpdiagramm andmestiku õpilased.xlsx tunnuse Aeg õppimiseks kirjeldamiseks. Ülesanne. Koosta tulpdiagramm tunnuse Arvuti samastub kõige enam kirjeldamiseks. Kujunda saadud tulemit ning kirjuta sellele uurimuse tekstis toodav lahtiseletus Sektordiagramm Näide. Anna luges loodusõpetuse õpikust lauset Kõige suurem maailmajagu maailmas on Aasia, mis moodustab kogu maismaa pinnast 30% ja tal tekkis tahmine saada kompaktset ülevaadet kui suure osa maismaast hõlmavad teised maailmajaod. Terviku jaotumist osadeks kirjeldatakse tihti sektordiagrammi abil, milles kõik kategoorid kokku moodustavad 100% ning mis toob selgelt välja iga kategooria osa tervikust. Ülaltoodud näites Anna poolt soovitud ülevaate annab järgmine sektordiagramm: Ülesanne. Arutle, kas sama infot võiks esitada ka tulpdiagrammi abil ning mispoolest erineb saadav visuaalne 34 / 85

35 ülevaade sektor- ja tulpdiagrammi puhul? Näide: Vastajatel paluti hinnata väitega Õpilased käituvad tunnis paremini, kui seal arvuteid kasutada nõusolekut 4-palli skaalal. Vastuste jagunemise illustreerimiseks võime kasutada sektordiagrammi. Sektordiagrammi koostamiseks: Koonda tunnuse väärtused sagedustabelisse (Pivot Table) ja vajadusel sorteeri tabeli read sobivasse järjekorda Märgista kokkuvõetud andmed Vali Insert/Pie Sektordiagrammi kujundamine Sageduste ja/või lisamiseks märgista protsentide sektorid ning vali: Layout/Labels/Data Labels Lisatud siltide kujundamiseks märgista sildid ning vali: Layout/Labels/More Data Label Options Reeglina ei esitata ühel graafikul korraga sagedusi ja protsente, sest liigne numbrite rohkus võib segada kiire ja ülevaatliku ettekujutuse saamist andmetest. Sektordiagrammile pealkirja lisamiseks vali: Layout/Labels/Chart Title/Above Chart Sektorite värvi muutmiseks vali sektorid ühe kaupa (vali sektorid ning seejärel klõpsa konkreetse sektori peal) ja muuda nende värvi (Home/Font/Fill Color). Ülesanne. Mõtle ja arutle, kas alljärgnevad sektordiagrammid esitlevad vastvaid andmeid parimal võimalikul viisil? 35 / 85

36 Jäta meelde: - Ära kasuta kujundusviisi, kus kõik sektorid on üksteisest eraldatud, sest see vähendab diagrammi ülevaatlikkust! Sektori väljatõstmist kasutatakse siis, kui üks sektoritest on tulemuste kontekstis teistest olulisem või kesksem ning seda soovitakse seepärast rõhutada ning esile tõsta. Reeglina ei tõsteta - välja kõige suuremat sektorit. Soovituslikult võiks ühel sektordiagrammil olla 3-9 sektorit. Liiga paljude sektorite esitamine ühel diagrammil vähendab ülevaatlikkust. Vajadusel ühenda väiksemad sektorid ühiseks sektoriks Muu, - mis paigutatakse diagrammil viimaseks. Kolmemõõtmelisus loob olukorra, kus eespool asetsevad sektorid tunduvad visuaalselt suuremad kui tagumised, mistõttu on mõistlik seda kujundusviisi vältida. Ülesanne. Kasutades andmestikku õpilased.xlsx koosta sektordiagramm illustreerimaks õpilaste arvamusi väite Arvutimängud põhjustavad sõltuvust kohta. Milline on sinu arvamus antud küsimuses? Näide: Liina õde Mari on otsustanud paar kilo alla võtta, sest kõik tema sõbrad langetavat kaalu. Liinal tekib seepeal huvi teada saada, kuivõrd populaarne on kaalu Pilt tüdrukust langetamine kooliõpilaste seas? Ta otsustab koolis läbi viia väikese uuringu, mille raames ta küsib õpilaste kaalu, pikkust, rahuolu oma kehakaaluga ning seda, kas õpilased toituvad tervislikult ning mitu korda nädalas nad treeninguga tegelevad. Ülesanne. Milliste, juba õpitud, meetoditega saab ülevaate järgmiste küsimuste vastustest? a) Kuivõrd oled rahul oma praeguse kehakaaluga? (Väga rahul, pigem rahul, pigem ei ole rahul, üldse ei ole rahul) b) Kas toitud tervislikult? (jah, ei) Lisaks eelnevas ülesandes välja toodud järjestus- ja nimiskaalat kasutavatele tunnustele, sisaldas Liina küsimustik ka arvskaalal mõõdetavaid tunnuseid: pikkus, kaal ja treeninguga tegelemise sagedus nädalas. Lisaks arvutas Liina välja iga õpilase kehamassiindeksi (KMI) ja tahtis selle põhjal saada ülevaadet, kui suur osa õpilastest on ülekaalulised, kui suur osa normkaalus ning kui suur osa on alakaalus. Ta kasutas saadud andmete analüüsimiseks tuttavat tulpdiagrammi ja sai alljärgneva tulemuse:. Joonis 1. Tulpdiagramm õpilaste KMI väärtustest Ülesanne. Kas antud analüüsi tulemus aitab püstitatud küsimusele kiiresti ja selgesti vastuse saada? Põhjenda vastust! 36 / 85

37 Kuna tunnuse KMI väärtused on komakohtadega arvud, siis on sisuliselt iga õpilase KMI pisut erinev kõigi teiste õpilaste KMI-st. Kui sellise paljude erinevate väärtustega arvtunnuse kohta koostada tavaline tulpdiagramm, siis tulemus on täiesti ebaülevaatlik, sest tulpadena kantakse diagrammile arvutiprogrammide poolt tunnuse kõik erinevad väärtused ühekaupa. Ülaltoodud diagrammilt on näha, et suurem osa KMI-test esineb üks kord (enamus tulpasid on kõrgusega 1) ning on vaid mõned väärtused, mis korduvad 2 või 3 korda. Seega, tulpdiagramm ei anna ülevaatlikku pilti seda laadi andmete jaotusest ning selle kasutamine antud olukorras ei ole asjakohane. Järelikult tuleb leida mõni teine andmete analüüsimise meetod, mis paremini sobiks Histogramm Ülesanne. Kas alltoodud analüüsi tulemus aitab püstitatud küsimusele kiiremini ja paremini selge vastuse saada kui ülaltoodud joonisel olnud tulpdiagramm? Põhjenda vastust! Mille poolest erinevad need kaks diagrammi? Histogrammis on koondatud KMI väärtused vahemikesse ning iga tulp näitab konkreetsesse vahemikku kuuluvate vastajate arvu. Kuna antud histogrammi vahemikud on valitud nii, et nende otspunktid lähevad kokku arstide poolt määratud ala- ja ülekaalulisuse näitab piiridega, siis histogramm, et alakaalulisi e. neid, kelle KMI on alla 19 punkti on õpilaste seas rohkem (11 õpilast) kui ülekaalulisi (8 õpilast). Joonis 2. Histogramm õpilaste KMI väärtustest Histogramm on tulpdiagrammi spetsiifiline alamliik, kus telgede tähendused on alati üheselt määratud. Histogramm sobib ainult arvtunnuste kirjeldamiseks, kuna sellel teljel, millele tulbad toetuvad, on alati arvväärtustest moodustatud vahemikud. Kuna seal, kus lõppeb eelmine vahemik, algab kohe järgmine, siis on histogrammil sisuliselt sobilik tulbad asetada vahetult üksteise kõrvale. Tulpade kõrgus histogrammil kirjeldab alati antud vahemiku sagedust e seda, mitu tulemust (või kui suur osa tulemustest) antud vahemikku jäi. Ülesanne. Nimeta, millised näites 1. toodud tunnustest on veel arvtunnused, millel on palju erinevaid väärtuseid. Ülesanne. Mille poolest erinevad tulpdiagramm ja histogramm? Too välja nii sisulised kui ka visuaalsed erinevused. Histogrammi koostamine Excelis Näide. Anname ülevaate õpilaste kehamassiindeksitest (KMI) andmestiku treening.xlsx põhjal. Kuna tegemist on arvtunnusega, millel on palju erinevaid väärtuseid, siis koostame histogrammi. 37 / 85

38 Histogrammi koostamist Excelis tuleks alustada soovitud vahemike otspunktide määramisest. Selleks sisesta soovitud vahemike otspunktide väärtused töölehele eraldi veergu. Kui te sisestate numbrid 19, 22, 25 ja 28 moodustatakse kokku 5 vahemikku: 16-18, , , , ,9 Kui vahemike otspunkte ei sisestata, moodustab Excel vahemikud ise, mis annab küll kiire ülevaate andmete jagunemisest, kuid ei ole sisuliselt sobivaim lahendus. Histogrammi loomiseks kasutame lisavahendit Data/Data Analysis. Data Analysis sisaldab, histogrammile, mitmeid andmeanalüüsi vahendeid, lisaks erinevaid millega tutvume järgmistes tundides. Histogrammi loomise aknas tuleb määrata piirkond (Input Range), kus asuvad väärtused, millest histogrammi koostama hakatakse. Meie näites on selleks tunnuseks KMI. Output Options võimaldab määrata, kuhu loodav histogramm asetatakse. Chart Output tuleb märgistada, vastasel juhul histogrammi ei looda. Kuvatakse vaid sagedustabel koondatud vahemike väärtustest. Bin Range väljale tuleb sisestada loodavate vahemike otspunktide piirkonna aadress. Kui vahemike otspunkte ei sisestata, moodustab Excel vahemikud ise, mis ei ole alati sobivaim lahendus (vt. joonis 3). 38 / 85

39 Joonis 3. Histogramm KMI väärtustest. Vahemike otspunkte ette antud ei ole. Histogrammi kujundamine Excelis loodaval histogrammil on tulpade alla kirjutatud vahemike otspunktid. Diagrammi sisu paremaks mõistmiseks tuleks need asendada tegelike vahemike siltidega. Vahemike silte muuda loodud vahemikke kirjeldavas tabelis. Eelnevalt arutlesime, et histogrammil on õige paigutada tulbad vahetult üksteise kõrvale, sest seal, kus lõppeb eelmine vahemik, algab kohe järgmine. Selleks vali tulbad, tee paremklikk tulpade peal ning vali Format Data Series/Gap Width/No Histogrammi tulpade Gap värvi, pealkirjade ja skaala muutmine on sarnane tulpdiagrammi kujundamisega. (vt.pt.3.2.3) Ülesanne. Arutle ja põhjenda, kas tunnuse õdede-vendade arv väärtuste jaotusest ülevaate saamiseks sobib paremini tulpdiagramm või histogramm? Ülesanne. Koosta andmestiku treening.xlsx tunnuse kaal kohta histogramm ning kujunda saadud tulemit. Ülesanne. Leia andmestikust õpilased.xlsx tunnus, mille väärtuseid oleks sobilik esitada histogrammi abil. Koosta histogramm, kujunda saadud tulemit ning kirjuta sellele uurimuse tekstis toodav lahtiseletus. 39 / 85

40 JÄTA MEELDE Selleks, et arvtunnuste analüüsimiseks sobivaid meetodeid valida, tuleb teha vahet, kas tegemist on väheste erinevate väärtustega arvtunnusega või paljude erinevate väärtustega arvtunnusega. Kui arvtunnusel on vähe erinevaid väärtusi, siis saab kasutada nii tavalist sagedustabelit kui tulpdiagrammi, sest üksikute arv-väärtuste põhjal tekkivaid gruppe on vähe ja nad mahuvad kenasti tabelisse või tulpadeks ja sektoriteks vastavale diagrammile. Kui aga arvtunnusel on palju erinevaid väärtusi, siis tuleb enne sagedustabeli või diagrammi tegemist arv-väärtused grupeerida e neist vahemikud moodustada nii, et tekkinud vahemikke oleks tabelis või diagrammil eraldi rea, tulba või sektorina kirjeldamiseks paras hulk. Edaspidi õpime ka teise arvtunnuste analüüsimiseks sobivaid meetodeid! Vähe erinevaid väärtuseid Palju erinevaid väärtuseid Klaasikaaslaste vanus: arvtunnus, millel on vähe Õpetajate vanus: arvtunnus, millel on palju erinevaid väärtuseid. Sinu klassikaaslaste vanused erinevaid väärtuseid. Tõenäoliselt on teie koolis ei erine omavahel ilmselt palju rohkem kui 2-3 aasta õpetajaid väga erinevates vanustes - nii noori, võrra. keskealisi kui ka vanemaid õpetajaid. Õdede-vendade arv: arvtunnus, millel ka ei ole Õpilase pikkus: arvtunnus, mille väärtused väga palju võimalikke erinevaid väärtusi, sest saadakse mõõtmise teel. Jällegi on tõenäoline, et enamasti on Eesti peredes 1-3 last ja seega õdesid- sinu klassikaaslased on kõik erineva pikkusega. vendasid ühel lapsel 0-2. Ülesanne 1. Koosta andmestiku õpilased.xlsx tunnuse vanus kohta sagedustabel, histogramm ja tulpdiagramm. Arutle, millise nendest valiksid tulemuste esitamiseks ning miks? Ülesanne 2. Mõtle, mis tüüpi on tunnused kaal ja treeningu sagedus. Lisa omalt poolt kaks näidet erinevat tüüpi arvtunnuste kohta. 3.7*. Valimi põhjal saadud tulemuste üldistamine üldkogumile Näide: Pt.3.2 toodud näites jõudsime tulemuseni, et 54,2% küsitlusele vastanutest külastab Facebooki portaali mitu korda päevas. Aga kui me sooviksime teha järeldusi mitte ainult vastanute vaid ka kogu üldkogumi kohta. Seega tahaksime nüüd andmete põhjal teada: Kui suur osa Eesti õpilastest (e tema uuringu üldkogumist) külastab Facebooki lehte mitu korda päevas? 40 / 85

41 Mõtle veel! Kui me oleme uurinud vaid väikest osa üldkogumist, kas on loogiline eeldada, et meie valimi tulemus on täpselt sama, mis saaksime üldkogumis kui me teaksime kõigi üldkogumi objektide kohta vastavaid andmeid? Ülesanne. Tööta järgnev skeem iseseisvalt läbi. Kui 54,2% valimist külastab Facebooki lehte mitu korda päevas, kas me saame sellest järeldada, JA et ka täpselt 54,2% üldkogumist külastab Facebooki lehte mitu korda päevas? Õige! Selle, et valimi ja üldkogumi protsendid tulevad küllaltki sarnased tagab see, et meil on juhuvalim, mis esindab üldkogumit üsna hästi. Aga kui sarnased need valimi ja üldkogumi protsendid siis ikkagi on? EI Õige! Valimi ja üldkogumi protsendid ei pruugi JA olla võrdsed, kuid kas need võivad olla küllaltki sarnased? EI Matemaatiliste valemitega on seda võimalik väga täpselt välja arvutada. Valimi põhjal arvutatud arvkarakteristikud (antud juhul grupi osakaal) on vastavate üldkogumi parameetrite hindamise aluseks, kuid valimilt üldkogumile järelduste tegemisel tuleb alati arvestada juhusliku veaga, mida arvestades saame üldkogumi parameetri kohta VAHEMIKHINNANGU Mõtle veel. Juhuvalimi koostamisega tagati, et see esindaks võimalikult hästi üldkogumit. Väikese tõenäosusega on võimalik erandlik olukord, et valimi tulemus on väga erinev üldkogumi omast, kuid eeldusel, et valimi objektid on valitud juhuslikult, tulevad reeglina valimi tulemused küllaltki sarnased üldkogumi vastavatele näitajatele. Sellist hinnangute andmist üldkogumi parameetrite kohta nimetataksegi STATISTILISEKS JÄRELDAMISEKS e ÜLDISTAMISEKS. Kas statistilise järeldamise täpsus sõltub meie JA käsutuses oleva valimi suurusest? Praktikas võib muidugi tulla ette ka olukord, kus uurijat huvitav sihtrühm on suhteliselt väike (või uurimiseks eraldatud ressursid väga suured) ning ta suudab vajalikud andmed koguda (praktiliselt) kõigi üldkogumi liikmete kohta. Sel juhul räägitakse kõiksest uuringust või juhtumianalüüsist, ning eeldades, et andmekogumise meetodid on olnud sellised, JA mille puhul mõõtmisinstrumendist tingitud juhusliku vea arvestamine ei ole tähtis, võib vajalike järelduste tegemiseks piirduda olemasolevaid andmeid kokkuvõtvate meetoditega. Statistiline järeldamine on alati seotud statistilise e juhusliku veaga. Kas seda viga on võimalik ära hoida või kõrvaldada? Võimalikku juhuslikku viga statistilise järeldamise käigus ei suuda kõrvaldada ükski valem ega statistiline meetod. Küll aga võimaldavad viimased meil seda viga hinnata - mõõta. See on tõepoolest nii. Mida suurem on valim, seda täpsem on meie hinnang üldkogumile. Lisaks valimi suurusele on veel teisigi tegureid, mis mõjutavad hinnangute täpsust, kuid põhiline ja ühtlasi meie poolt mõjutatav on just valimi suurus. Seega, suurendades valimit saame suurendada oma üldistavate järelduste täpsust. Kui täpseks me saame oma järeldustes minna? Kas me võime üldkogumi kohta väita midagi 100% tõenäosusega? EI Suurendades valimit saame suurendada oma järelduse täpsust, kuid me ei saa kunagi öelda, et üldkogumi parameeter on 100%-lise kindlusega võrdne ühe konkreetse arvnäitajaga. (Välja arvatud juhul, kui me mõõdame kõiki üldkogumi objekte.) Parim, mis me teha saame, on väita, et alamgrupi osakaal üldkogumis või mistahes teine üldkogumi arvkarakteristik (nt üldkogumi keskväärtus) asub ühe või teise tõenäosusega ühes või teises väärtuste vahemikus. 41 / 85

42 JÄTA MEELDE Valimilt üldkogumile järelduste tegemise e üldistamise käigus tekkida võiva juhusliku vea arvutamisel tuleb lähtuda vastavatest valemitest, mis on välja töötatud kõigi põhiliste arvnäitajate jaoks (s.h alamgrupi osakaal, aritmeetiline keskmine, jne). Arvutusvalemiga määratud juhuslikku viga nimetatakse STANDARDVEAKS ja selle põhjal saab üldkogumi vastava arvnäitaja väärtusele e parameetrile hinnangu anda vastavalt alltoodud reeglitele: 68% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 1 st.viga 95% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2 st.viga 99% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2,5 st.viga Valemid ja matemaatiline taust on lahti seletatud järgmiste materjalides: K.Niglase loengumaterjalides lk K.Hiob Matemaatiline statistika Algkursus koolidele. Ptk ( lk.44-50) 3.8.* Vahemikhinnang üldkogumis valitud grupi osakaalu kirjeldamiseks Näide. Hindame pt.3.2 näites toodud andmete põhjal, mitu protsenti üldkogumi liikmetest külastab Facebooki lehte mitu korda päevas. Mida me teame? Facebooki külastab mitu korda päevas 347 e. Mida me tahame teada? 54,22% uuringus osalenud õpilastest. p=54,22% (vastava väärtuse osakaal valimis) Kui suur osa üldkogumi liikmetest külastab N=640 (valimi suurus) Facebooki lehte mitu korda päevas? Lahendus. Rakendame reeglit: 95% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2 st.viga St.viga%= Asendades valemis tähistused konkreetsete väärtustega, saame, 95% tõenäosusega jääb üldkogumi osakaal vahemikku: 54,22% 2 1,97% e. 54,22% et st.viga %= 3,94% Arvutuste põhjal saame järeldada, et nende õpilaste osakaal kõigi Eesti õpilaste seas (e üldkogumis), kes 42 / 85

43 külastavad Facebooki lehte mitu korda päevas, jääb 95% tõenäosusega vahemikku 50,3%... 58,2% Ülesanne. Leia kui suur osa Eesti õpilastest ei külasta Facebooki lehte üldse. Sõnasta järeldus ja selgita tulemust oma sõnadega. Ülesanne. Kui kõikidest Eesti koolidest valitud juhuvalimi uurimisel saadi teada, et ülikooli soovib edasi õppima minna 46%. Millise hinnangu saab selle põhjal anda üldkogumi vastavale osakaalule kui uuritud valimi suurus oli 1500 õpilast? Ülesanne a. läbiviidud uuringus Lapsed ja internet selgus, et uuritud 6-14.aastastest lastest on interneti jututoas või suhtlusprogrammis kontakti loonud võõrastega kohtumas käinud 6% vastanutest. Hinnake, kui suur osa Eesti aastastest lastest oli 2006.aasta seisuga võõrastega kohtumas käinud, kui on teada, et valimisse kuulus 145 õpilast ja 2006.a. seisuga oli Eestis aastast last Teised ühte tunnust puudutavad küsimused ja nendest lähtuv analüüs. Siiani vaatlesime pikalt võimalusi kuidas analüüsi läbi viia, et vastuseid saada Kui palju? ja Kui suur osa? tüüpi küsimustele. Andmete analüüsimise käigus tekkib aga varem või hiljem veel terve rida teisi lihtsamaid ja keerulisemaid küsimusi. Keerulisemad küsimused puudutavad korraga mitut tunnust, kuid jätkame hetkel veel lihtsamate, vaid ühte tunnust puudutavate, küsimustega nagu näiteks: Mis on kõige madalam ja kõige Mis kõrgem saadud tulemus? tase? on mõõtmiste keskmine Kui sarnased või erinevad on saadud tulemused? Kõigile nendele küsimustele vastuse saamiseks on välja töötatud matemaatilised algoritmid või valemid, mis olemasolevaid andmeid ühel või teisel viisil kokku võttes annavad tulemuseks andmete teatud aspekti kirjeldava arvulise tulemuse. Viimaseid nimetatakse andmeanalüüsi kontekstis ARVNÄITAJATEKS (vahel ka statistikuteks). Suurem osa arvnäitajatest on mõeldud kasutamiseks arvutunnuste korral, kuid leidub ka selliseid, mida saab kasutada järjestustunnuste või koguni nimitunnuste puhul Keskmised Näide. Mia otsustas 11.klassis sooritada keemia riigieksami ning kogus eelnevalt selle eksami kohta informatsiooni 50-lt oma kooli abituriendilt, kes olid keemia riigieksami sooritanud. Muuseas küsis Mia neilt riigieksamil saadud tulemust. Mia lootis, et eelmisel aastal koolikaaslaste poolt saadud eksamitulemuste analüüsimine annab talle parema pildi tema enda võimalustest. Kuna Mia arvas, et tal on keemias teistega võrreldes üsna keskmine tase, tahtis ta kohe teada, mis oli eelmisel aastal eksami sooritanute keskmine tulemus, aga põnev oli teada saada ka seda, kas keegi kukkus eksamil läbi või mis oli üldse kõige madalam ja kõige kõrgem saadud tulemus? Mia oli koolikaaslastega vestlemise käigus kõik 50 eksamitulemust järjest paberile kirjutanud, kuid niimoodi läbisegi olevast 50-st tulemusest oli väga raske midagi välja lugeda. 43 / 85

44 Matemaatika õpetaja soovitas, et parema ülevaate saamiseks tulemuste jagunemisest, võiks tulemused järjestada kasvamise või kahanemise järjekorda saades niimoodi VARIATSIOONIREA. Mia pusis tükk aega kuid sai tulemused õnnelikult kasvamise järjekorda: 50 õpilase eksamitulemused (VARIATSIOONIRIDA) Pärast tuli Mial pähe, et seda järjestamist saanuks veelgi mugavamalt teha, kui kõik 50 tulemust Exceli töölehel ühte veergu e tunnusesse sisestada ja siis andmete sorteerimise funktsiooni kasutada! Peale sorteerimist on lihtne näha, mis oli kõige madalam ja kõige kõrgem tulemus (ehk statistika terminoloogias kasutades leida minimaalne ja maksimaalne väärtus): need olid vastavalt 62 ja 96 punkti. Sellisest kasvavas järjekorras antud vaatlustulemuste reast on kerge leida ka jaotuse keskel paiknevat väärtust ehk MEDIAANI. Mediaan on selline väärtus, mis jagab vaatlustulemused kahte ossa nii, et pooled vaatlustulemused on mediaanist väiksemad ja pooled suuremad. Näide. Kui meil on teada seitsme õpetaja kohta nende keskmine kontrolltööde parandamise aeg nädalas (tundides) ning ajad on järjestatud kasvamise järjekorda: siis saame öelda, et mediaan on 4 (tundi nädalas), sest väärtus 4 asub tulemuste rea keskel. Kui meil on aga paaris arv vaatlustulemusi, siis ei saa me nende hulgast leida ühte, millest oleks võrdne arv väiksemaid ja suuremaid väärtusi. Seepärast leitakse sel juhul väärtus, mis asub täpselt kahe variatsioonireas keskel asuva väärtuse vahel. *** Mia näites õpilaste keemiaeksami tulemuste kohta on 25-es väärtus 79 ning 26-es 80. Et leida täpselt nende vahel paiknevat väärtust, tuleb need väärtused kokku liita ning jagada kahega: = 79,5. 2 Seega mediaaniks on 79,5 palli. Viimasest arvnäitajast saame teha nüüd omakorda sisulise tõlgenduse ja öelda, et poolte õpilaste eksamitulemus jäi alla 79,5 punkti ja pooltel õpilastel oli see üle 79,5 punkti. Näide. Kasutame Mia kogutud andmeid (keemia.xlsx) ning arvutame eksamitulemuste mediaani Excelis. Arvnäitajate leidmiseks kasutame Exceli funktsioone (Formulas/Insert Function või klõpsate valemirea alguses paiknevat funktsioonide nuppu) Mediaani arvutamiseks valime funktsiooni MEDIAN ning sisestame andmepiirkonna (hiirega märgistades. 44 / 85

45 Vastus ilmub andmetabelisse, valemireal jääb nähtavaks funktsioon, mida me kasutasime. *** Mediaan on üks statistikas kasutatavaid keskmist tendentsi väljendavaid suurusi. Kuid märksa sagedamini kasutatakse ARITMEETILIST KESKMIST, mida tavaliselt kutsutakse lihtsalt keskmiseks või siis keskväärtuseks ja mille arvutusalgoritmiga oled tuttav matemaatika kursustest. Tuletame selle algoritmi meelde: Aritmeetilise keskmise leidmiseks tuleb kõik vaatlustulemused kokku liita ning saadud summa jagada vaatlustulemuste arvuga. Leiame nüüd eelnevas näites toodud õpetajate kontrolltööde parandamise aja aritmeetilise keskmise: x= = 4,4 tundi nädalas. 7 7 Kui meil on aga teada, et algandmetena kasutatud arvud ei olnud täpsed vaid ümardatud või hinnangulised (st õpetajad ei pruugi kontrolltöid parandada täpselt 2 või 6 tundi vaid ligikaudu nii palju) siis peame ka arvnäitaja põhjal järeldust tehes jääma algandemete täpsuse tasemele ja ütlema, et keskmiselt parandavad õpetajad kontrolltöid 4 kuni 5 tundi nädalas. Näide. Kasutame taaskord Mia kogutud andmeid (keemia.xlsx) ning arvutame eksamitulemuste keskväärtuse Excelis. Keskväärtuse arvutamiseks kasutame funktsiooni AVERAGE. Keskmiseks eksamitulemuseks saame 79,1 punkti. Võrreldes kahte erinevat keskmist tendentsi väljendavat suurust: mediaani ja aritmeetilist keskmist, näeme, et nad on keemaieksami tulemuste puhul natuke erinevad, kuid siiski küllalt sarnased. Vaatame aga ühte teist näidet: Näide. Vaadake kahte alljärgnevat jaotust. Mõlemas on toodud viie inimese kuupalgad: I II Mediaanid kahes grupis on küllalt sarnased: I > 1400, II > Arvutades aga välja keskväärtused saame, et keskväärtus esimeses grupis on 1360, mis on mediaaniga küllalt sarnane, kuid teises grupis on keskväärtus 1720, millest on kõik peale ühe väärtuse madalamad. Esimese grupi puhul saame me nii mediaani kui keskväärtuse abil õige ettekujutuse grupi liikmete keskmisest 45 / 85

46 palgast. Kuid kumb keskmistest annab parema ettekujutuse tavapärasest palga suurusjärgust teises grupis? Teises grupis tuleks keskmist tendentsi väljendava suurusena (keskväärtusele lisaks) kasutada mediaani, sest keskväärtus on tugevalt mõjutatud ühest ebatüüpilisest, teistest väga erinevast väärtusest, mediaani aga JÄTA MEELDE sellised ekstreemsed väärtused ei mõjuta. Kui me järjestame tulemused kasvamise või kahanemise järjekorda saame variatsioonirea. Mediaan on väärtus, mis jagab vaatlustulemused kahte ossa nii, et pooled vaatlustulemused on mediaanist väiksemad ja pooled suuremad. Aritmeetilise keskmise (keskmise v keskväärtuse) leidmiseks tuleb kõik vaatlustulemused kokku liita ning saadud summa jagada vaatlustulemuste arvuga. Aritmeetilist keskmist on korrektne arvutada ainult intervalltunnuste (s.h arvtunnuste) puhul. Kõige enamkasutatav keskmist tendentsi väljendav suurus on keskväärtus. Kui keskväärtus ja mediaan on väga erinevad, tuleks keskmist tendentsi väljendava suurusena (keskväärtusele lisaks) kasutada mediaani, sest keskväärtus võib olla mõjutatud ühest/mitmest ebatüüpilisest, teistest väga erinevatest väärtustest, mediaani aga sellised ekstreemsed väärtused ei mõjuta. Ülesanne. Tiina grupikaaslaste testitulemused olid järgmised: Leia testitulemuste mediaan ning selgita selle tähendust. Leia ka keskväärus. Ülesanne. Andrese grupikaaslaste eksamihindeid oli järgmised: Millised väited on õiged? a) Eksamihinnete mediaan on 2,5 b) Eksamihinnete mediaanid on 2 ja 3 Ülesanne. Millised väited on korrektsed? a) Mediaan on alati reaalne väärtus uuritud valimi väärtuste hulgast b) Mediaan võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine c) Keskväärtus on alati reaalne väärtus uuritud valimi väärtuste hulgast d) Keskväärtus võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine Ülesanne. Tooge näiteid andmetest, mille keskmise taseme kirjeldamiseks peaks lisaks keskväärtusele kasutama ka mediaani. Ülesanne. Täida järgmine tabel, kirjutades igasse lahtrisse, kas seda arvnäitajat on antud tunnuse korral korrektne arvutada ja võimalik sisuliselt tõlgendada või mitte. Tunnus Sugu Vanus Sissetulek (0-199, , , , 800 ja rohkem) Kui tähtis on riiete ostmisel kaubamärk? (väga oluline, oluline, vähe oluline, üldse ei ole oluline) Lemmik kaubamärk Mediaan Keskväärtus Ülesanne. Kasutage andmestiku treening.xlsx andmeid ning leidke õpilaste pikkuse ja kaalu keskväärtus ja 46 / 85

47 mediaan. Otsustage, milliseid arvnäitajaid te antud tunnuste korral keskmise taseme kirjeldamiseks kasutaksite. Põhjendage vastust Väärtuste hajuvust kirjeldavad arvnäitajad Kuigi keskmised on kõige tuntumad ja enamkasutatavad arvnäitajad, ei anna ainult keskmise teadmine meile andmete kohta täit pilti. Seetõttu tuleb osata küsida ja analüüsida ka seda, kuivõrd erinevad või sarnased on tulemused/väärtused omavahel. Näide. Esimese klassi lapsevanematel paluti 7-palli süsteemis hinnata kuivõrd tähtsaks nad peavad seda, et kool arendaks lastes järgmisi väärtusi: 1) Kohuse- ja vastutustunne (viie lapsevanema vastused: ) 2) Aktiivsus, ettevõtlikus (viie lapsevanema vastused: ) Mõlemal juhul saame keskmiseks tähtsuse hinnanguks 4 palli, kuid ometi näeme selgelt, et lastevanemate arvamused nende kahe aspekti arendamise tähtsuse osas ei ole täpselt ühesugused: kohuse- ja vastutustunde arendamise osas on lapsevanemad olnud suhteliselt üksmeelselt arvamusel, et see on keskmise tähtsusega, kuid aktiivsuse ja ettevõtlikkuse arendamist on osad lastevanematest pidanud väga tähtsaks, teised jälle üldse mitte tähtsaks st vastajate arvamused on olnud väga erinevad. Sellist väärtuste omavahelise erinevuse määra nimetatakse statistikas HAJUVUSEKS. Hajuvus ongi keskmise kõrval teine oluline andmete jaotust iseloomustav suurus. Ülesanne Võrrelge kahte järgnevat punkt-diagrammi, kus on kujutatud kahe erineva õpilasterühma testitulemused. Mis on teie arvates kõige suurem erinevus nende kahe jaotuse vahel? Kas te oskate öelda, milline juba vaadeldud arvnäitajatest aitab seda erinevust kirjeldada? 50 õpilase testitulemused - GRUPP A 60 ** ****** ** ** ******* * * * * *** * ************** ****** * * * õpilase testitulemused - GRUPP B ** * *** * ****** * ***************** ******************* Diagrammidele peale vaadates võime kohe näha, et esimene jaotus on rohkem välja venitatud st 47 / 85

48 testitulemused grupis A on rohkem hajunud kui grupis B. Jaotuse hajuvust saame kõige lihtsamini väljendada arvutades jaotuse ulatuse (suurima ja vähima väärtuse vahe). Meie näites: grupis A on ulatus = = 34 punkti grupis B on ulatus = = 18 punkti Seega, saaksime ulatuse põhjal ka siis, kui meil andmetest diagrammi tehtud ei ole, teha järelduse, et grupis B on tulemuste omavahelised erinevused e hajuvus palju väiksem kui grupis A. Ulatus on kõige üldisem ja lihtsamini leitav hajuvuse näitaja, kuid tema suur puudus on selles, et ta sõltub ainult jaotuse kahest kõige äärmisest väärtusest, mis võivad aga mingil põhjusel olla teistest väga erinevad nn ekstreemsed väärtused (tuletage meelde näidet palkadest!). Seepärast on selle näitaja usaldatavus grupi kui terviku iseloomustamisel väike ning teda kasutatakse vaid jaotusest kõige üldisema pildi saamiseks. Kõige sagedamini kasutatav hajuvuse näitaja on aga STANDARDHÄLVE. Nagu aritmeetiline keskmine, nii võtab ka standardhälve arvesse kõik vaatlustulemused. Kui meie vaatlustulemused on kõik ühesugused (nt kõik lapsevanemad hindasid mõtlemisoskuse arendamist kooli poolt väga tähtsaks st valisid 7-palli skaalal vastuseks 7), siis andmetes hajuvust ei ole ning mistahes hajuvuse näitaja peaks andma vastuseks 0. Tavaliselt on aga vaatlustulemused hajuvad ning üksikud tulemused erinevad (hälbivad) keskväärtusest enamal või vähemal määral. Standardhälve ongi selline arvkarakteristik, mis võimaldab meil öelda, kui palju üksikud tulemused grupi aritmeetilisest keskmisest (keskmiselt) erinevad. Mida suurem on hajuvus, seda suuremad on erinevused ning seda suurem on ka standardhälve. Näide. Vaatame eelpool toodud näidet lapsevanemate hinnangutest. Kumba jaotuse puhul allolevatest on teie arvates standardhälve suurem? 1) Kohuse- ja vastutustunne (viie lapsevanema vastused: ) x =4 2) Aktiivsus, ettevõtlikus (viie lapsevanema vastused: ) x =4 Väärtused teises reas on rohkem hajunud (st. nad erinevad ehk hälbivad keskväärtusest rohkem) kui esimeses reas. Seega võime arvata, et standardhälve on suurem teises reas olevate andmete puhul. Arutluse kontrollimiseks sisestame hinnangud Exceli tabelisse ning arvutame mõlema jaotuse standardhälbed. Funktsioon STDEV arvutab märgistatud andmepiirkonna standardhälbe. Nagu näha, standardhälve on palju esimese väiksem jaotuse kui teise jaotuse puhul ning jääb alla ühe palli, sest üle ühe palli ei erinenud selle jaotuse puhul grupi keskmisest ju kellegi arvamus! meil oleks tegemist suurema Kui hulga andmetega (nt 68 lapsevanema arvamused), siis andmetele peale vaatamine (nagu antud väikeses näites) meile head ülevaadet vastuste hajuvusest ei annaks, kuid olles välja arvutanud, et vastuste standardhälve aktiivsuse ja ettevõtlikkuse tähtsuse hinnangute puhul on s = 2,8 palli ning kohuse- ja vastutustunde tähtsuse hinnangute puhul ainult s = 0,7 palli, saaksime kohe andmete kohta teha järelduse, et aktiivsuse ja ettevõtlikkuse arendamise tähtsuse osas läksid lastevanemate arvamused omavahel lahku e anti väga 48 / 85

49 erinevaid hinnanguid, aga kohuse- ja vastutustunde tähtsust hindasid lapsevanemad väga sarnaselt. Pane tähele, et hajuvuse näitaja põhjal ei saa teha järeldust selle kohta, kumba hinnati tähtsamaks; selleks on vaja JÄTA MEELDE teada ka keskmist! Ulatus on kõige lihtsamini leitav hajuvuse näitaja, kuid tema suur puudus on selles, et ta sõltub ainult jaotuse kahest kõige äärmisest väärtusest, mis võivad aga mingil põhjusel olla teistest väga erinevad. Standardhälve on kõige sagedamini kasutatav hajuvuse näitaja. Mida suuremad on väärtuste omavahelised erinevused, seda suurem on ka standardhälve. Kui kõik tulemused on ühesugused, on standardhälbe väärtuseks 0. Ülesanne. Kogutud andmete põhjal arvutati meeste vanuse standardhälbe väärtuseks 12 ja naiste vanuse standardhälbe väärtuseks 7. Milline väide on õige? a) Mehed on vanemad b) Naised on vanemad c) Meeste vanused on rohkem koondunud ümber oma grupi keskmise vanuse d) Naiste vanused on rohkem koondunud ümber oma grupi keskmise vanuse Ülesanne. Kasutades andmestikku treening.xlsx täida järgmises tabelis tühjad lahtrid. Arvnäitaja Maksimaalne väärtus Minimaalne väärtus Ulatus Keskväärtus Mediaan Standardhälve Pikkus Kaal Ülesanne. Vasta andmestiku treening.xlsx ning eelnevalt täidetud tabeli põhjal järgmistele küsimustele. 1. Kokku osales uuringus õpilast. 2. Õpilaste keskmine kaal oli 64,3 kg ning mediaan 64 kg. Kuna mediaan ja keskväärtus on väga, võime järeldada, et jaotusel ei ole väärtuseid. 3. Pooled õpilastest olid lühemad ja pooled pikemad kui cm. 4. Pikkuste jaotuse ulatus oli cm. See tähendab, et. 5. Kõige lühem õpilane kaalus kg. ja kõige pikem kg. 6. Uuritud õpilaste pikkuste standardhälve oli cm ning kaalude standardhälve kg. Kirjeldades jaotuste standardhälbeid saame öelda, et * Üldkogumi keskväärtuse vahemikhinnang Näide. Vaatame taas ptk 3.5. käsitletud Liina uuringut kaalu langetamisest kooliõpilaste seas. Uuritud õpilaste pikkuse ja kaalu suhtest arvutati välja KMI (kehamassiindeks) ning selle keskväärtus valimis oli 21,55. Kas ja millise hinnangu saame selle valimi tulemuse põhjal anda kõigi Eesti õpilaste KMI kohta? 49 / 85

50 Soovides saadud keskmise põhjal teha statistilist üldistust üldkogumile e kõikidele Eesti õpilastele, peame silmas pidama, et see on korrektne ainult juhul kui valim esinduslik st on koostatud juhuslikkuse põhimõttel, mis tagab, et igal Eesti kooli õpilasel on olnud võrdne tõenäosus valimisse sattuda. Kui see tingimus on täidetud kasutame üldkogumi keskväärtuse hindamiseks ptk esitatud mõttekäiku ning reegleid: 68% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 1 st.viga 95% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2 st.viga 99% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2,5 st.viga Keskväärtuse standardviga arvutatakse valimi standardhälbe ja valimi suuruse põhjal järgmiselt: Mida me teame? Mida me tahame teada? Kui suur on valimi KMI keskväärtus. Millisesse vahemikku jääb üldkogumi e kõigi = õpilaste keskmine KMI? N=114 (valimi suurus) =21,55 (valimi keskväärtus) s=2,24 (valimi standardhälve) Lahendus. Rakendame reeglit: 95% tõenäosusega asub üldkogumi parameeter vahemikus: valimi parameeter ± 2 st.viga = = Asendades valemis tähistused konkreetsete väärtustega, saame, et 95% tõenäosusega jääb üldkogumi keskmine vahemikku: valimi keskmine 95% tõenäosusega jääb üldkogumi keskmine vahemikku: 21,55 2 0,21 95% tõenäosusega jääb üldkogumi keskmine vahemikku: 21,55 0,42 = =0, % tõenäosusega jääb üldkogumi keskmine vahemikku: 21, ,97 Seega, oleme vastanud küsimusele, millisesse vahemikku jääb üldkogumi keskmine KMI ning võime öelda, et see keskmine asub 95%-lise tõenäosusega vahemikus 21, ,97 ehk ümardatult saame öelda, et Eesti õpilaste KMI jääb 21 ja 22 vahele. Ülesanne. Arutle, mis juhtub vahemikuga, kuhu jääb teatava tõenäosusega üldkogumi parameeter juhul kui me suurendame valimi suurust? Kas see vahemik muutub laiemaks või kitsamaks? Ülesanne. 10-ndate klasside õpilastest koostatud juhuvalimi keskmine matemaatika aastahinne oli 3,86. Hinnete standardhälve oli 0,4 ja valimi suurus Arvuta, millisesse vahemikku jääb kõikide Eesti 10-ndate 50 / 85

51 klassi õpilaste keskmine matemaatika aastahinne. Näide. Kasutame andmestikku treening.xlsx ning arvutame, millisesse vahemikku jääb üldkogumi keskmine treeninguga tegelemise arv nädalas. Esmalt arvutame valimi keskmise: 2,32 Üldkogumi keskmise hinnangu leidmiseks kasutame Exceli funktsiooni CONFIDENCE. Kui me soovime teha järeldust 95%-lise tõenäosusega, sisestame Alpha väljale 0,05. Eelnevalt välja arvutatud standardhälbe väärtuse sisestame Standard_dev väljale. Size väljale sisestame valimi suuruse. Saadud tulemuse põhjal saame välja kirjutada vastuse küsimusele: millisesse vahemikku jääb üldkogumi keskmine treeninguga tegelemise arv nädalas? 95% tõenäosusega jääb üldkogumi keskmine vahemikku: 2,32 0,27 Ülesanne. Kasuta andmestikku õpilased.xlsx ning leia, millisesse vahemikku jääb üldkogumi e kõikide õpilaste keskmine arvutikasutusaeg nädalas. 51 / 85

52 KORDA JA JÄTA MEELDE Üldkogumi all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused, oletused või prognoosid kehtiksid. Uurimiseks valitud (suhteliselt väikest) objektide gruppi nimetatakse valimiks. Selleks, et valim annaks üldkogumi kohta objektiivset ja usaldatavat informatsiooni, tuleb valimi liikmed valida juhuslikult: igal üldkogumi liikmel peab olema võrdne võimalus valimisse valitud saada. Selleks, et tagada valimi juhuslikkus on mitmeid võimalusi. Näiteks juhuvalim, süstemaatiline valim, kihtvalim. Valimi põhjal arvutatud arvnäitajad (näiteks aritmeetiline keskmine, mediaan jne.) on vastavate üldkogumi parameetrite hinnangu aluseks, kuid arvestada tuleb ka statistilist viga. Hinnangute andmist üldkogumi parameetrite kohta nimetatakse statistiliseks järeldamiseks e üldistamiseks. Statistilise üldistamise käigus tekkida võivat juhuslikku viga ei suuda kõrvaldada ükski valem ega statistiline meetod. Küll aga võimaldavad viimased meil seda viga hinnata - mõõta. 52 / 85

53 EESMÄRGID 4. Erinevuste uurimine Käesolevas peatükis leiame vastused küsimustele: Kuidas võrrelda erinevate gruppide tulemusi? Kuidas sõltub erinevuste uurimiseks kasutatav meetod tunnusetüübist? Milliseid graafilisi võimalusi on otstarbekas kasutada gruppide vaheliste erinevuste uurimisel? Kuidas lahendada olukord, kui võrreldavate gruppide suurused ei ole võrdsed? Millises olukorras on võimalik valimi keskmiste vahel olevat erinevust üldkogumile üldistada? Näide 1. Maria uurimistöö teema on Mobiiltelefoni roll õpilase elus. Töö raames viis ta läbi lühiuuringu, mis sisaldas 6 küsimust. Küsitlus. Uuringu tulemused on andmefailis: telefon.xlsx 1. Millise firma mobiiltelefoni sa kasutad? Ülesanne 1. Aita Marial otsustada, millist õpitud meetodit _ (sagedustabel, 2. Miks valisid just selle mobiiltelefoni? tulpdiagramm, sektordiagramm, histogramm, joondiagramm, kirjeldavad arvnäitajad vms.) kasutada andmete kokkuvõtmiseks ja millist tulemuste esitamiseks. Märgi enda valikud allolevasse tabelisse. Küsimuse nr. 3. Kui rahul oled oma praeguse Meetod, mida kasutad andmete telefoniga? esmaseks kokkuvõtmiseks ning väga rahul esitamiseks * 3. 4.** 5.*** 6. pigem rahul pigem ei ole rahul üldse ei ole rahul 4. Kui suur oli sinu eelmise kuu telefoniarve? * Telefoni valiku põhjuseid on küsitud avatud küsimusena. Arutle, viisil saaks teha esmase kokkuvõtte antud küsimuse vastustest mil ja kas küsimuse sõnastamise lihtsus kaalub siin üles ajamahuka andmete tagantjärgi kategoriseerimise või oleks küsitluse loomisel kohe olnud mõistlik koostada valikvastustega küsimus?. ** Andmete kokkuvõtmise meetodi valimisel arvesta sellega, et telefoniarve suuruse pidid vastajad maha kirjutama oma eelmise kuu arvelt, mistõttu on saadud vastused pea kõikidel vastajatel erinevad arvud. *** Meenuta, mil viisil on reeglina otstarbekas tulemusi esitleda kui korraga on vaja esitada vaid üks-kaks arvulist näitajat? Ülesanne 2. Kasuta andmetabelit telefon.xlsx ning anna esmane ülevaade Maria koostatud küsimustele saadud vastustest. Rakenda selleks eelmises ülesandes valitud meetodeid. Peale andmetest esmase kokkuvõtte uurimist tekkis Marial terve hulk uusi põnevaid küsimusi: näiteks, kas vanemate klasside õpilased kulutavad telefoni kasutamisele rohkem raha või kas poiste ja tüdrukute eelistused telefonide osas on erinevad? Õpetaja andis Mariale vihje, et selliseid võrdlusi saab teha samade juba õpitud meetodite abil, ainult, et andmed tuleb kokku võtta eraldi iga grupi jaoks ja siis neid võrrelda. Arvnäitajatest kasutatakse võrdluste läbiviimiseks 53 / 85

54 kõige sagedamini aritmeetilist keskmist, kui seda pole hetkel huvipakkuvate andmete kokkuvõtmiseks korrektne kasutada, siis saab teha võrdleva sagedustabeli. Tulemuste esitamiseks võib aga kasutada näiteks võrdlevat tulpdiagrammi või joondiagrammi. Maria mõtles natuke ja arvas, et telefoniarvete suuruse võrdlemiseks eri klasside õpilastel on kõige mõistlikum arvutada ja vaadata, kas ja kui palju erinevad erinevate klasside õpilaste keskmised telefoniarved? Ülesanne 3. Õpetaja kiitis Maria meetodi valiku heaks, kuid palus tal põhjendada, mille alusel saab otsustada, kas keskväärtust tohib või ei tohi antud andmete analüüsimisel kasutada. Meenuta eelnevalt õpitut ning esita vastav põhjendus! 4.1. Erinevuste uurimine kasutades keskväärtusi Olles veendunud, et tunnus, mille osas me soovime gruppe võrrelda, on intervalltunnus, mille puhul tohib keskväärtusi kasutada, saab erinevuste analüüsimisel kasutada järgmisi üldistatud küsimusi: Kas võrreldavate gruppide keskväärtused on erinevad? Millise grupi tulemuste keskväärtus on kõige suurem/väiksem? Kui palju erinevad võrreldavate gruppide keskmised tulemused üksteisest? Selleks, et Exceli abil võrrelda gruppide keskväärtusi, kasutame õpitud vahendit: liigendtabel (Pivot Table). Arvnäitajaid sisaldava tabeli koostamiseks viime tunnuse Klass väljale Row ning tunnuse Arve väljale Values. See tagab, et loodavas tabelis kuvatakse meid huvitavad grupid ehk erinevad klassid ja nende keskväärtused eraldi ridades. Arvtunnuse korral pakub Excel arvutamiseks automaatselt funktsiooni Sum (summa). Asendame olemasoleva funktsiooni nii, et tulemuseks saaksime iga klassi telefoniarvete keskväärtuse. Selleks klikime väljal Values oleva tunnuse taga oleval noolel ja valime: Value Field Settings/ Summarize by/ Average 54 / 85

55 Teised arvnäitajad Summarize value field by (väärtuseid kokkuvõttev funktsioon) valikus: Sum väärtuste summa Max kõige suurem väärtus Count väärtuste sagedus (arv) Min kõige väiksem väärtus Average keskväärtus StdDev väärtuste standardhälve Reeglina on gruppide paremaks võrdlemiseks ja erinevuste selgemaks tõlgendamiseks mõistlik vaadelda mitte ainult keskväärtusi vaid korraga mitut arvnäitajat. Mitme erineva arvnäitaja arvutamiseks viime tunnuse Arve veelkord väljale Values ning valime sobivad arvnäitajad. Tulemuseks saime tabeli, milles on arvutatud erinevate gruppide (10.klass, 11.klass, 12.klass) telefoniarvete suuruse kohta erinevad arvnäitajad. Tabel. Erinevate klasside õpilaste mobiiltelefoniarvete põhjal arvutatud arvnäitajad. Ülesanne 3. Selgita, mida saad tabelis toodud tulemuste põhjal järeldada võrreldes erinevaid klassetelefoniarvete suuruste... a)... keskväärtuste põhjal b)... maksimaalsete, minimaalsete väärtuste ning standardhälvete põhjal. Erinevuste illustreerimine keskväärtusi võrdleva diagrammina. Tihti on erinevustest parema ja kiirema ülevaate andmiseks mõistlik arvutatud arvnäitajad esitada diagrammina. Eelnenud näites meie poolt uuritud erinevuste graafiliseks esitamiseks loome tulpdiagrammi, milles tulpade kõrgused on võrdsed vastavate gruppide keskväärtustega. Tulpdiagrammi loomiseks: * Märgista arvutatud keskväärtused koos gruppide nimetustega * Vali Insert/Column/Clustered Column * Tulpdiagrammi kujundamise kohta vaata täpsemalt ptk 3.5. Tulemuseks saime tulpdiagrammi, milles iga tulba kõrgus on võrdne vastava grupi telefoniarvete keskväärtusega. 55 / 85

56 Joonis. Õpilaste keskmine telefoniarve suurus eelmisel kuul. Ülesanne 3. Arutle, kas erinevate gruppide keskväärtuste esitamiseks oleks sisuliselt sobilik kasutada sektordiagrammi? Põhjenda vastust. Ülesanne 4. Võrdle omavahel graafiliselt poiste-tüdrukute keskmiseid telefoniarvete suuruseid. Kirjuta tulemuste sisulist tähendust avav selgitus. Hinda kriitiliselt loodud diagrammi vajalikkust vastavate tulemuste esitamiseks ning põhjenda, kas esitaksid tulemused tekstina, tabelina või diagrammina Keskväärtuste vahelise erinevuse üldistamine: t-test* Meenutame peatükis 2.5 räägitu põhjal, et professionaalsetes uuringutes soovitakse ja suudetakse tihti uuring üles ehitada nii, et kogutud andmete põhjal saab teha järeldusi ka nende kohta, kellele otseselt andmeid kogutud ei ole. Sellisel puhul tuleb uuringu alguses defineerida üldkogum ning andmete kogumiseks moodustada juhuslik ja esindav valim. Kuigi kooliõpilased ise oma uuringutes sellised valimeid ilmselt moodustada ei saa, on olemas mitmeid suuremahulisi uuringuid, mille andmed on avalikult kõigile kättesadavad. Vaatleme allpool ühte neist. Euroopa Sotsiaaluuring (ESS) on sotsiaalteaduslik uuring, mille eesmärgiks on ühiskondade arengu seaduspärasuste uurimine. Andmed võimaldavad analüüsida hoiakute, institutsioonide arengu ja inimeste käitumise vahelist seost ning mitmeid muid protsesse ühiskonnas. Uuringuga on liitunud umbes 30 riiki ning andmeid kogutakse rangete, omavahelist võrdlust ning üldistamist lubavate standardite järgi. Reeglina iga kahe aasta tagant läbiviidavas uuringus kasutatakse ühte ja sama põhimoodulit, mis tagab andmete ajalise võrreldavuse. Isikuandmetest vabad andmefailid on vabaks allalaadimiseks ning kasutamiseks avatud kõikidele.16 Järgnevas kasutame väljavõtet ESS 2008.a. andmetest, mis kajastavad Eestit (ess.xlsx). Näide. Pikkade koolipäevade eel unistas 10.klassi õpilane Mikk sellest ajast, millal ta saaks juba tööle minna. Töölkäimisega kaasnes Miku arvates üks väga suur eelis koduseid ülesandeid ei anta ning peale tööpäeva oled vaba! Sellele, et on olemas erinevaid ameteid, millest osadega kaasneb ka koduse töö jätkumine, Mikk ei mõelnud. Ta arvas, et õpingutest ja sellega kaasnevatest kodustest ülesannetest pääsemine oleks piisav põhjus 16 Euroopa Sotsiaaluuring Eestis / 85

57 olla oluliselt rohkem rahul oma eluga. Kasutame ESS andmeid ning uurime esmalt, kas tasustatud tööl käivad vastajad on rohkem oma eluga rahul kui need, kelle põhiline tegevus on õppimine. Rahulolu eluga mõõdeti uuringus 10-palli skaalal, kusjuures 10 palli tähendas kõige suuremat rahulolu. Tabel. Erinevate elanikkonnagruppide keskmine rahulolu eluga. Vastajate Keskmine rahulolu arv eluga 881 6, , , , , , ,20 Põhiline tegevus viimase 7 päeva jooksul Tasustatud töö Pensionil Õpingud Töötu Kodune, hoolitseb laste või kellegi teise eest Muu tegevus KOKKU Näeme, et uuringus osalenud õppurite keskmine rahulolu eluga oli 7,34 palli, kuid osalenud töötajate keskmine rahulolu 6,3 palli. Seega, näitavad tulemused vastupidist tendentsi sellele, mida uskus Mikk töötajate rahulolu oli madalam kui õppurite oma (lihtsa lahutamise tehte abil näeme et, erinevuse suurus oli ligikaudu 1 pall). Samas, kuna antud uuringus oli tegemist Eestit esindava juhusliku valimiga, võiks siinkohal püstitada uue küsimuse: kas valimis ilmnenud tendents, et õppurite rahulolu on kõrgem kui töötajate oma kehtib ka kogu üldkogumi ehk Eesti aasta elanikkonna kohta või on võimalik, et selline 1-palline erinevus keskmiste vahel võinuks tekkida valimi iseärasusest tekkinud juhusliku vea tõttu ka siis, kui valim oleks moodustatud üldkogumist, kus erinevusi pole või on lausa vastupidised? Viimasel juhul jääks seega lahtiseks, kas ja milline erinevus üldkogumis on ning seega üldistavaid järeldusi teha ei tohiks. Tuletame meelde, et valimilt üldkogumile järelduste tegemise e üldistamise käigus tekkida võiva juhusliku vea hindamiseks on olemas vastavad statistilised meetodid. Peatükis 3 vaatlesime juba vahemikhinnangute e usaldusintervallide koostamist. Siin tuleks meil kasutada aga statistilist olulisustesti. Olulisusteste on mitmeid ning sobiva olulisustesti valik sõltub, nagu muudegi statistiliste meetodite valik, küsimuse ning andmete tüübist. Ülaltoodud näites võrdlesime kahte gruppi (õppureid ja töötajaid) keskväärtuste abil, kuna rahulolu oli mõõdetud intervalltunnusega sellises olukorras sobib olulisustestiks t-test. Statistilise olulisustesti põhisammud t-testi näitel: Eelsamm I: Analüüsisin olemasolevaid andmeid kirjeldava statistika meetodite abil ning leidsin midagi huvitavat (nt. erinevuse või seose, vms) Nägime, et töötajate keskmine rahulolu oli ligikaudu 1-palli võrra madalam kui õppurite oma. Valimite keskväärtused: töötajad õppurid Eelsamm II : Tekkis küsimus: Kas võib üldistada? Üldkogum Valim Üldkogum tüüpi uuringud (ehk valikuuringud) 6,3 7,34 Kuna tegemist oli Eestit esindava juhusliku valimiga, püstitasime küsimuse: kas valimis ilmnenud tendents, et õppurite rahulolu on või eksperimentaalne uuringudisain kõrgem kui töötajate oma kehtib ka 57 / 85

58 kogu üldkogumi ehk Eesti I. Õige olulisustesti valik (lähtuvalt küsimusest ja andmetüübist) Kasuta abiks tabelit Milline analüüsimeetod valida? aasta elanikkonna kohta? Kui valimis on võrreldud kahte gruppi keskväärtuste abil (eelduseks intervalltunnus), siis sobib olulisustestiks t-test. 58 / 85

59 II. Valitud olulisustesti eelduste kontroll: t-testi puhul tuleb kontrollida, kas võrreldavate gruppide hajuvused (seda näitab dispersioon) erinevad III. Hüpoteeside sõnastamine: sisukas hüpotees H1: väidab, et üldkogumis on erinevus/seos (tuleb täpsustada vastavalt testile!) nullhüpotees H0: väidab, et üldkogumis ei ole erinevust/seost Valin ka olulisuse nivoo α (α näitabkui väike peab olema H0 kehtimise tõenäosus, et me võiks ilma suurema riskita ta mittekehtivaks tunnistada?) mida nimetatakse olulisuse tõenäosuseks (pnäitab kui suur on tõenäosus, et olukorras, kus H0 kehtib, tekkis valmis olnud erinevus v seos juhuse tõttu?) V. Otsus tulemuse kohta: p > α H0 jääb kehtima, kuid pole tõestatud - erinevus/seos statistiliselt mitte oluline (ei üldista) p α H0 võib ümber lükata ja H1 tõestatuks pidada on ning sarnased vastavalt sobiv t-testi variant. H1: µ1 µ a. oli Eesti ja või valida õppurite ja töötajate keskmine rahulolu eluga erinev H0: µ1=µ a. oli Eesti õppurite ja töötajate keskmine rahulolu eluga ühesugune Tavapärased IV. Arvutused eesmärgiks hinnata H0 kehtimise tõenäosust p, standardhälve olulisuse väärtused: α=0,05 (ehk 5%) α=0,01 (ehk 1%) Kasutan vastavat nivoo tarkvara arvutuste läbiviimiseks. MS Excelis saab t-testi arvutusi tellida kasutades lisamoodulit Data/Data Analysis (Vt kasutusjuhend järgneb tabelile!) Leian arvuti poolt genereeritud tulemuste tabelist mind huvitava näitaja p Exceli puhul: P(T<=t) two-tail p=1,36126e-08=0, erinevus/seos statistiliselt oluline (võib üldistada) (ehk p α (0,000 0%) 0,05) lükkan H0 ümber ja loen H1 tõestatuks ESS uuringu tulemuste põhjal võin VI. Järelduse sõnastamine väita, et 2008.a. oli Eesti õppurite ja töötajate keskmine rahulolu eluga erinev, kusjuures õppurite rahulolu oli kõrgem kui töötajatel. 59 / 85

60 T-testi läbiviimine Excelis Kasutame ESS andmeid ning uurime, kas tasustatud tööl käivad vastajad on rohkem oma eluga rahul kui need, kelle põhiline tegevus on õppimine. * Järjesta andmetabel tegevusalade järgi kasvavasse või kahanevasse järjekorda * Vali Data/Data Analysis/t-Test: Two-Sample Assuming Equal Variances * Sisesta suurema keskväärtusega tegevusala (õpingud) üldise rahulolu eluga vastused Variable 1 Range väljale ning väiksema keskväärtusega tegevusala (tasustatud töö) vastused Variable 2 Range väljale. Exceli poolt genereeritud analüüsi tulemused: t-test: Two-Sample Assuming Equal Variances Õpingud Mean valimi Mean 7, väärtuste põhjal Variance 2, arvutatud keskväärtus Observations 148 Observations Pooled Variance uuritud gruppide 4, suurused Hypothesized Mean Difference 0 df 1027 P(T<=t) two tail t Stat 5, olulisuse tõenäosus P(T<=t) one-tail 6,80629E-09 t Critical one-tail 1, P(T<=t) two-tail 1,36126E-08 t Critical two-tail 1, Tasustatud töö 6, , Otsuse tulemuse kohta teeme olulisuse tõenäosuse abil: kuna p α (0,000 0,05), siis lükkame H0 ümber ja loeme H1 tõestatuks e ESS uuringu tulemuste põhjal võime väita, et 2008.a. oli Eesti õppurite ja töötajate keskmine rahulolu eluga erinev, kusjuures õppurite rahulolu oli kõrgem kui töötajatel. Ülesanne 5. Kasutades ESS andmete põhjal saadud arvutusi uuri, kas meeste naiste keskmine rahulolu eluga on üldiselt erinev. Eelsamm I: Analüüsisin Mida saad järeldada valimi tulemuste kohta tehtud arvutuste põhjal? 60 / 85

61 olemasolevaid andmeid kirjeldava statistika meetodite abil ning leidsin midagi huvitavat (nt. erinevuse või seose, vms) Eelsamm II : Kas võib üldistada? Üldkogum Valim Kas on tegemist Eestit esindava juhusliku valimiga? Üldkogum tüüpi uuringud või eksperimentaalne uuringudisain I. Õige olulisustesti valik (lähtuvalt küsimusest ja andmetüübist) Kasuta abiks tabelit Milline analüüsimeetod valida? III. Hüpoteeside sõnastamine: H1: üldkogumis erinevus/seos H0: üldkogumis on ei Mitme grupi keskväärtuseid me võrdleme? Kas uuritav tunnus on intervalltunnus? Millise testi me valima peaksime? Sõnasta hüpoteesid ning vali olulisuse nivoo. H1: H0: α: ole erinevust/seost IV. Arvutused V. Otsus tulemuse kohta: VI. Järelduse Otsusta olulisuse tõenäosuse väärtuse * jääb kehtima Ho, kuid see ei ole tõestatud * võime Ho ümber lükata ja pidada tõestatuks H1 Sõnasta järeldus. sõnastamine 61 / 85 põhjal, kas

62 Abivahend sobiva analüüsimeetodi valimiseks: Milline analüüsimeetod valida? Parameetrilised meetodid Mitteparameetrilised (eeldus: meetodid arvtunnused, intervalltunnused) (järjestus- või nimitunnused aga ka 1 grupp K.st: x, s, jne arvutunnused) K.st: sagedustabel, % (keskmine tase/ osakaal) 2 gruppi Ü.st: vahemikhinnangud (μ, σ) ERINEVUSED Ü.st: t-test 3 või enam gruppi K.st: x1 ERINEVUSED Ü.st: ANOVA 2 või enam tunnust K.st: SEOSED (korrelatsioonikordaja) Ü.st: H0: ρük=0 Ü.st: H0: rük=0 K.st: risttabel K.st: x1 Ü.st: vahemikhinnangud K.st: risttabel x2 Ü.st: χ2-test x2 x3 Pearsoni K.st: x1 r x2 Ü.st: Kruskall-Wallise test K.st: Spearmani ρ Ü.st: χ2-test 62 / 85 x3

63 4.3. Erinevuste uurimine kasutades sagedusi ja protsente Jätkame Maria küsitluse tulemuste analüüsimist ning vaatame, kuidas võrrelda poiste ja tüdrukute eelistusi erinevate firmade poolt toodetud telefonide osas. On üsna ilmne, et firmade osas keskväärtust me arvutada ei saa, kuid võiksime küsida näiteks, millise firma telefone on poiste hulgas kõige enam ja kas see langeb kokku tüdrukute hulgas kõige enamlevinud telefoni tootjaga? Selline küsimusepüstitus suunab meid leidma sagedusi ja nendest lähtuvaid protsente võrreldavate gruppide lõikes. Tuletame meelde, et tunnuse väärtuste jaotumise sageduste ning protsentuaalsete osakaalude leidmiseks on kõige otstarbekam kasutada sagedustabelit. Kuna nüüd ei taha me saada ülevaadet kogu valimist korraga vaid tüdrukutest ja poistest eraldi, siis on meil vaja sagedustabelit, milles oleks sagedused tüdrukute ja poiste kohta eraldi välja toodud. Sellist tabelit nimetatakse võrdlevaks sagedustabeliks või risttabeliks. Tabel. Poiste ja tüdrukute kasutuses olevate mobiiltelefonide tootjad Samsung Nokia Sony Ericsson Muu KOKKU pois tüdr s uk KOKKU Lisame tabelisse protsendid ja vaatame, kas võrdlemine muutub lihtsamaks? Tabel. Poiste ja tüdrukute kasutuses olevate mobiiltelefonide tootjad tüdru Samsung Nokia Sony Ericsson Muu KOKKU arv poiss % 61,0% 24,4% k arv ,8% 4,9% ,0% 61 % 47,5% 36,1% 8,2% 8,2% 100,0 % KOK KU arv % 52,9% 31,4% 9 7 8,8% 6,9% ,0% Viimases tabelis on paigutatud võrreldavad grupid veergudesse ning tabelisse on lisatud protsent nii, et poiste ja tüdrukute vastused on eraldi tervikud (eraldi 100%), mistõttu saame võrrelda ja öelda, näiteks, et Samsungi telefonid on uuringus osalenud poiste seas enam levinud kui osalenud tüdrukute seas, sest poistest kasutab Samsungi telefoni 61% ning tüdrukutest 47,5%. Samas Nokia telefonid on osalenud tüdrukute seas populaarsemad kui poiste seas, sest Nokia telefoni kasutab ligikaudu 36% tüdrukutest ja 24% poistest. 63 / 85

64 REEGEL Kui võrreldavate gruppide suurused ei ole võrdsed, siis tuleb gruppide võrdlemisel ja järelduste tegemisel kasutada protsentuaalset jaotust! Protsent peab olema arvutatud nii, et iga võrreldav grupp on omaette 100% - kui võrreldavad grupid (nt poisid ja tüdrukud) on ridades, siis on vaja rea protsenti ning kui veergudes, siis veeru protsenti. Eelnevalt toodud võrdleva sagedustabeli loomiseks: * Jäta aktiivne lahter oma andmetabeli piirkonda. * Vali Insert/PivotTable/PivotTable * Paiguta tunnus Firma väljale Row * Paiguta tunnus, mis annab võrreldavad grupid ( Sugu ) väljale Column * Kokkuvõtete tegemiseks vii võrdlemise aluseks olev tunnus ( Firma ) väljale. Values Kontrolli, et kokkuvõtvaks funktsiooniks oleks Count loendamine; kui ei ole, siis muuda funktsiooni. * Protsentide lisamiseks tabelisse vii tunnus Firma veelkord väljale Values. Klõpsa tunnuse järel oleval noolel ja vali: Value Field Settings/ Show value as/ % of column (100% moodustub kokku veerus olevatest väärtustest). Ülesanne 6. Arutle, kuidas on korrektne tõlgendada järgmistes tabelites olevaid protsente ning põhjenda, miks nii arvutatud protsente ei ole otstarbekas antud andmete kontekstis võrdluse aluseks võtta? Tabel A. KOKK Samsung Nokia Sony Ericsson Muu KOKKU poiss arv % 25 46,3% 10 31,3% ,4% 28,6% 40,2% arv poiss % 24,5% 9,8% ,9% 2,0% 40,2% tüdruk arv % 29 53,7% 22 68,8% ,6% 71,4% 59,8% U arv % 100,0% 100,0% ,0% 100,0% 100,0% Tabel B. Samsung Nokia Sony Ericsson Muu KOKKU t üdruk arv % 29 28,4% 22 21,6% ,9% 4,9% 59,8% KO KKU arv % 54 52,9% 32 31,4% ,8% 6,9% 100,0% Ülesanne 7. Anna võrdlev ülevaade sellest, milliste firmade mobiiltelefone kasutavad erinevate klasside õpilased. Kirjuta tekst, mis sobib saadud risttabeli lahtiseletuseks. 64 / 85

65 4.4. Erinevuste illustreerimine protsentuaalseid jaotusi võrdleva diagrammina. Protsentidena väljendatud erinevuste illustreerimiseks sobib võrdlev tulpdiagramm. Kasutame eelpool koostatud sagedustabelis olevaid andmeid ja koostame võrdleva tulpdiagrammi poiste ja tüdrukute telefonitootjate eelistuste illustreerimiseks. Võrdleva tulpdiagrammi koostamiseks: * Koosta võrdlev sagedustabel, mis sisaldab ainult võrreldavate gruppide protsentuaalseid jaotusi ning märgista see * Vali Insert/Column/Clustered Column Korrektses võrdlevas tulpdiagrammis moodustavad iga üksiku võrreldava grupi väärtused kokku 100%. Antud juhul moodustavad 100% nii poiste poolt kasutatavad telefonid kokku kui ka tüdrukute poolt kasutatavad telefonid kokku. Joonis. Poiste ja tüdrukute kasutuses olevate mobiiltelefonide tootjad Väga levinud kuid sisuliselt mittesobiv viis on koostada võrdlev tulpdiagramm võrreldavate gruppide tegelikest sagedustest. 65 / 85

66 Sama moodi nagu ei ole ainult sagedustega tabeli põhjal võimalik võrrelda kahe erineva suurusega grupi tegelikke erinevusi, ei aita ka sagedusi kasutav tulpdiagramm gruppe võrdlemisel erinevustest täpset pilti saada. Joonisel 4. võime näha, et kõik tüdrukute vastuseid esitavad tulbad on poiste omadest kõrgemad see on tingitud sellest, et tütarlapsi osales uuringus rohkem. Joonis. Poiste ja tüdrukute arv ning nende kasutuses olevad mobiiltelefonid Näide. Uurime järgnevalt, erinevates Eesti piirkondades elavate vastajate jagunemist tegevusalade järgi. Koostame võrdleva tulpdiagrammi. Kui võrreldavaid gruppe on rohkem kui kaks, läheb tavaline võrdlev tulpdiagramm üsna kirjuks ja seega raskesti arusaadavaks. Lahenduseks on kihtdiagrammi kasutamine. Kihtdiagrammis (100% Stacked Bar) esitatakse iga võrreldava grupi kohta üks tulp, mis on jagatud võrdluse aluseks oleva tunnuse väärtuste protsentuaalse osakaalu järgi kihtideks, mis kokku moodustavad 100%. 66 / 85

67 Kihtdiagrammi koostamiseks: * Koosta võrdlev sagedustabel, mis sisaldab kas võrreldavate gruppide sagedusi või protsentuaalseid jaotusi ning märgista see (NB! Seda tüüpi diagrammi koostamisel võib kasutada ka sagedusena esitatud kokkuvõtet) Kesk-Eesti Kirde-Eesti Lõuna-Eesti Lääne-Eesti Põhja-Eesti Tasustatud töö Pensionil 51,40% 25,23% 45,26% 31,05% 50,68% 24,11% 54,11% 22,08% 58,14% 21,55% Õpingud 11,68% 5,79% 10,41% 7,79% 8,68% Töötu 4,21% 9,47% 3,56% 8,23% 4,34% Kodune Muu tegevus 5,14% 2,34% 1,58% 6,84% 5,48% 5,75% 5,63% 2,16% 4,03% 3,26% KOKKU 100,00% 100,00% 100,00% 100,00% 100,00% * Vali Insert/Bar/100% Stacked Bar Olenevalt sellest, kui palju on võrreldavaid gruppe, tuleb otsustada, kas kasutada vertikaalsete või horisontaalsete tulpadega diagrammi varianti 5. Trendide e ajas toimuvate muutuste uurimine Näide 1. Eesti Meteoroloogia ja Hüdroloogia Instituudi (EMHI) koostatud ilmaprognoosidega oleme me kõik vähemal või rohkemal määral kokku puutunud. Alates välistemperatuuri jälgimisest, mis näiteks külmal talvepäeval võiks õpilasel (teatavatel lisatingimustel) lubada koolist puududa ning külmapühi pidada, lõpetades sellega, milline on sademete hulk ning vastavalt sellele kas vihmavari kaasa võtta või mitte. Vaatleme järgnevalt EMHI Tallinna mõõtmisjaama kogutud jaanuari kuu andmeid läbi 12 aasta ( ). 67 / 85

68 Tabel. Sademete koguhulk (mm) jaanuaris. Aasta Sademete Ülevaatlikuma pildi saamiseks tabelis esitatud summa (mm) andmetest koostame sademete hulga muutust , ,7 40, , , , , , ,3 42,4 48,4 71,4 kirjeldava joondiagrammi. Ajateljega joondiagrammi koostamiseks: * märgista andmed * vali Insert/Scatter/Scatter with Straight Lines and Markers Tulemuseks saame joondiagrammi, mis kujutab jaanuari kuu sademete koguhulga (mm) muutumise trendi toodud aastate lõikes. Joonis. Jaanuari kuu sademete koguhulga muutumine aastate lõikes. Ülesanne 1: Vaatle ülaltoodud joonist ning kirjelda sademete hulgas toimunud muutuste iseloomu Ülesanne 2: Kasutades Globe andmestikku leia keskmised temperatuurid aastate lõikes ning koosta trendi illustreeriv joondiagramm Näide 2. Aastatel kolmes etapis läbi viidud uuringus Õpilase elu-olu ilmnes, et õpilaste jaoks on kooliskäimine pigem oluline kui meeldiv tegevus. Näiteks pidas kokkuvõttes koolis käimist oluliseks 86% ning meeldivaks 62% kõikidest õpilastest.. Kuna tegemist on longitudinaalse uuringuga, kus samu andmeid on kogutud erinevatel aastatel, saab uurida, kas õpilaste hoiakud on aastatega muutunud. Kõiki õpilasi koos uurides selgus, et muutused on küllalt väikesed. Samas võrreldes tüdrukute ja poiste vastuseid eraldi, tuli välja, et muutused on olnud erisuunalised: tüdrukute hinnang kooli meeldivuse kohta, on aastatega tõusnud, samas poiste hinnang aga langenud. 68 / 85

69 Antud tulemuste illustreerimiseks oli uuringu raportis toodud alljärgnevad joonised: Joonis. Väljavõte uuringu Õpilase elu-olu tulemustest. Ülesanne 3. Vaatle joonisel esitatud tulemusi ja arutle, kas ja kuidas on aastate lõikes muutunud poistetüdrukute hinnangud kooli olulisuse kohta. Ülesanne 4. Arutlege grupis, milliseid tunnuseid on kasutatud ülaltoodud jooniste koostamisel ning mis on toodud protsentide taustal olevaks 100% ks? Mitu erinevat tervikut (100%) on joonisel kajastatud? 69 / 85

70 6. Seoste uurimine Näide1. Vaatleme järgnevalt EMHI jaanuari kuu andmete põhjal tuule kiiruse ning sademete koguhulga ühist käitumist aastate lõikes. Tuule kiirus Sademete (m/s) summa (mm) 3,0 51,4 2,3 27,7 3,2 40,4 4,7 79,5 4,0 106,7 3,4 12,1 4,1 81,3 3,1 22,8 3,8 47,3 3,9 42,4 3,1 48,4 4,3 71,4 Visuaalse ülevaate saamiseks koostame korrelatsioonivälja. Selleks: * märgista andmed * vali Insert/Scatter/Scatter with only Markers Joonis. Sademete kogusumma ja tuule kiiruse korrelatsiooniväli Koostatud diagrammi vaadeldes paistab silma üsna selge suundumus e punktiväli on koondunud tõusvas joones. Näeme, et väiksemale tuulekiiruse väärtusele vastab väiksem sademete koguhulk. Mida suuremaks muutub tuule kiirus, seda suuremaid väärtuseid omandab konkreetse väärtuse sademete kogusumma. Kui korrelatsioonivälja punktide pilv on selgelt koondunud, kas tõusvas või langevas joones võime öelda, et tegemist on vastavalt kas positiivse või negatiivse seosega. Seose suund loetakse positiivseks, kui ühe tunnuse väärtuste kasvades kasvavad ka teise tunnuse väärtused ning negatiivseks, kui ühe tunnuse väärtuste kasvades teise tunnuse väärtused kahanevad. 70 / 85

71 Tugev positiivne korrelatsioon Korrelatsioon puudub Tugev negatiivne korrelatsioon Mida rohkem on punktid koondunud punktipilvena, seda tugevam on seos kahe tunnuse vahel. Kahe tunnuse vahelise seose täpsemaks kirjeldamiseks, arvutatakse korrelatsioonikordaja. * Korrelatsioonikordaja väärtus võib olla vahemikus * Korrelatsioonikordaja märk näitab seda, kas on tegemist positiivse või negatiivse seosega. Lisaks seose suunale kirjeldab korrelatsioonikordaja ka seose tugevust. Seose tugevuse tõlgendamine sõltub sellest, mis nähtuste kohta andmed käivad, kuid tavapäraselt tõlgendatakse seosekordaja absoluutväärtust järgmiselt: I r I < 0.30 olematu, väga nõrk seos I r I < 0.70 keskmise tugevusega seos I r I > 0.70 tugev seos Täpsemalt kirjeldab seose tugevust ja suunda järgmine skeem: ,9 Väga tugev seos 0-0,9...-0,7 Tugev seos -0,7...-0,4 Keskmine seos -0,4...-0,2 Nõrk seos -0,2...0 Olematu, väga nõrk seos Olematu, väga nõrk seos Negatiivsed seosed 0,2...0,4 Nõrk seos 0,4...0,7 Keskmine seos 0,7...0,9 Tugev seos 0, Väga tugev seos Positiivsed seosed Vastavalt sellele, milline on korrelatsioonikordaja väärtus, saame arvteljel olevaid soovituslikke tõlgendusi arvesse võttes teha järelduse tunnuste vahelise seose tugevuse ja suuna kohta. Näiteks kui kahe tunnuse vahelise seose kordaja väärtus on arvutuste järgi -0,76, on tegemist negatiivse tugeva seosega. Ülesanne 1. Järgmises tabelis on toodud 6 vanarahvatarkust, mille põhjal vanasti ilma ennustati. Kõik need vanarahvatarkused viitavad mingitele seostele. Mõtle, kuidas ja millistes ühikutes saaks mõõta kirjeldatud nähtusi ning otsusta, millist suunda ennustab vanarahvatarkus kirjeldatud seostele (positiivne või negatiivne seos). Aruta paarilisega, kui tugevad võiksid teie kogemustele tuginedes olla antud seosed. Põhjendage vastust. Vanarahvatarkus Seose suund Mida kõrgemad on jõuluajal lumahanged, seda pikem vili suvel kasvab. Kuiv kevad - vihmane suvi. Mida rohkem on pihlakatel marju, seda rohkem sajab sügisel vihma. Kuidas temperatuur juulis - nõnda ka jaanuaris. Kui kevadel on palju udu, siis tuleb suvel palju vihma. Mida soojem on oktoober, seda külmem veebruar. Ülesanne 2. Too veel näiteid loodusnähtuste vahel esinevate seoste kohta. 71 / 85 Seose arvatav tugevus

72 Jätkame näidet ning arvutame vaadeldud tunnuste vahelise seose korrelatsioonikordaja. Kasutame selleks Exceli lisavahendit Data Analysis. * Vali Data/Data Analysis/Correlation * Väljale Input Range sisesta andmetabeli nende tunnuste piirkond, mille vahelise seose kordajat arvutama hakkad. NB! Tunnused peavad Exceli andmetabelis asetsema kõrvuti. * Labels in First Row märgista siis kui valitud piirkond sisaldab ka tunnuste nimesid/pealkirju. * Output Options annab võimaluse tulemi paigutamiseks olemasolevale töölehele (Output Options), uuele töölehele (New Worksheet By) või uude faili (New Workbook). Tulemuseks kuvatakse tabel, milles on arvutatud kahe uuritud tunnuse vahelise seose korrelatsioonikordaja: 0,68 Korrelatsioonikordaja absoluutväärtuse põhjal saame öelda, et tegemist on keskmise tugevusega seosega. Kuna kordaja on positiivse väärtusega (s.t pluss märgiga, mida tavapäraselt välja ei kirjutata), on tegemist positiivse seosega e. mida tugevam on aastate lõikes jaanuaris olnud tuul, seda suurem on olnud sademete kogusumma ning vastupidi, mida tuulevaiksem on olnud, seda vähem on olnud ka sademeid. Ülesanne 3. Kasuta andmestikku emhi.xlsx ning koosta tunnuste sademete koguhulk ning keskmine õhutemperatuur vahelise seose kirjeldamiseks korrelatsiooniväli. Seose täpsemaks kirjeldamiseks arvuta ka korrelatsioonikordaja. Arutle saadud tulemuste sisulise tausta üle ning mõtle, kas samasuguse suuna ja tugevusega seos võiks kirjeldada ka näiteks juuli kuu andmeid. Ülesanne 4. Selgita järgmiste uuringutulemuste sisu. 1. Uuringud näitasid, et korrelatsioon välistemperatuuri ja meeleolu vahel on praktiliselt null. 2. Antarktika liustikujää analüüs näitas tihedat positiivset seost temperatuuride ja süsihappegaasisisalduse 72 / 85

73 vahel. 3. TIMSS 2003 uuring näitas, et matemaatika kui õppeaine meeldivus oli enamike riikide lõikes negatiivses korrelatsioonis õpilaste edukusega matemaatikas. Ülesanne 5. Too näiteid oodatavatest seostest erinevate inimest kirjeldavate tunnuste vahel. Ülesanne 6. Too näiteid seostest erinevate kultuuri- ja/või sotsiaalsete nähtuste vahel. Näide 2. Mahukamate uuringute puhul arvutatakse korrelatsioonikordajad korraga mitme tunnuse ühiskäitumise kirjeldamiseks. Kasutame ESS andmestikku ning leiame korrelatsioonikordajad kolme järgmise tunnuse jaoks: * Koolis käidud aastad * Üldine rahulolu eluga (0-üldse ei ole rahul väga rahul) * Üldine rahulolu riigi majandusliku olukorraga (0-üldse ei ole rahul väga rahul) Tunnuste korrelatsioonikordajate arvutamiseks märgistame kõik soovitud tunnused. Meeldetuletuseks, et uuritavad tunnused peavad asetsema kõrvuti. Vastasel juhul tuleb andmetabelis tunnused üksteise kõrvale tõsta/kopeerida. Tulemuseks saime tabeli, milles on kirjeldatud kõikide uuritud tunnuste omavahelised korrelatsioonid. Koolis käidud aastad Koolis käidud aastad Üldine rahulolu eluga Üldine rahulolu riigi majandusliku olukorraga Üldine rahulolu eluga 1 0, , Üldine rahulolu riigi majandusliku olukorraga 1 0, Näeme, et kooliskäidud aastate arv ei ole seotud rahulolu küsimustega, vastavad korrelatsioonikordajad on 0,02 ning 0,05. Küll on aga seotud rahulolu eluga ning rahulolu riigi majandusliku olukorraga. Selliste küsimuste korral, kus vastused/väärtused on seotud mingi kirjeldusega, tuleb järelduste kokkukirjutamisel arvestada väärtuste kirjeldustega. Meie näites on mõlemad tunnused mõõdetud samasugusel skaalal: * Üldine rahulolu eluga (0-üldse ei ole rahul väga rahul) * Üldine rahulolu riigi majandusliku olukorraga (0-üldse ei ole rahul väga rahul) Seega saame teha järgmise järelduse: mida rohkem on vastaja üldiselt rahul oma eluga, seda rohkem on ta ka rahul riigi majandusliku olukorraga ning vastupidi, mida vähem on vastaja üldiselt rahul eluga, seda vähem on ta ka rahul riigi majandusliku olukorraga. 73 / 85

74 Ülesanne 7. Kasuta andmestikku ess.xlsx ning koosta kahe vabalt valitud tunnuse kirjeldamiseks korrelatsiooniväli. Arvuta korrelatsioonikordaja ning tõlgenda selle väärtust. Ülesanne 8. Sõnasta tabelis olevate tunnuste ning nende korral arvutatud korrelatsionikordajate põhjal järeldused. Tunnused Arvutatud korrelatsioonikordaja 0,72 * Vanus Järeldus * Milliseks Te hindate oma arvutikasutusoskusi? (1-väga head... 9-väga kehvad, ma ei oska üldse arvutit kasutada). * Kui tihti võtad sõna foorumites sinujaoks olulistel -0,25 teemadel? (0-mitte kunagi... 5-alati) * Koolis käidud aastate arv * Mitu korda oled sellel õppeaastal kooli hilinenud? 0,00 * Mitu päeva oled sellel õppeaastal koolist puudunud? * Kui suurt tähelepanu pöörad oma välimusele? (0- -0,48 üldse mitte.. 5-väga palju) * Vanus 7. Kvalitatiivne sisuanalüüs Kui uurija ei tea uuringu alguses, mida ta võib avastada ning millised seaduspärasused uuritava nähtuses või olukorras esinevad, siis on tegemist induktiivse lähenemisega. Uurija tegevused uuringus on järgmised: 1) Uurija kogub informatsiooni nähtuste või olukordade kohta, esitades küsimusi, tehes vaatlusi või kogudes asjassepuutuvaid tekste, pilte või objekte ning korrastab selle uuringu andmeteks; 2) Et andmeid paremini mõista, a) otsib uurija andmetest korduvaid elemente ehk andmeid iseloomustavaid kategooriaid (induktiivne sisuanalüüs) või b) loob varasematest teooriatest lähtudes kategooriad informatsiooni vähendamiseks andmetes (deduktiivne sisuanalüüs); 3) Et leida seaduspärasusi ja mustreid nähtustes ja olukordades, kogub uurija seejärel infot kategooriate esinemise sageduse ja viisi kohta andmetes; 4) Lõpuks arendab uurija välja oma teooria leitud seaduspärasusi arvestades või võrdleb avastatud seaduspärasusi varasemate teooriatega. Kust tulevad kvalitatiivse uuringu andmed? Meid ümbritsev maailm hõlmab endas teatud korrapära teatud nähtused ilmnevad teatud korrapäraga, mingid asjad juhtuvad vaid sel juhul, kui on täidetud teatud tingimused, teatud sündmused või nähtuse aspektid esinevad sageli koos. Selliste korrapärasuste või mustrite teaduslikuks avastamiseks on vaja uuritava nähtuse 74 / 85

75 või olukorra dokumenteerimine. Näiteks paneb uurija loodusvaatluse või eksperimendi käigus või situatsiooni kohta kirja või dokumenteerib video või foto vahendusel erinevaid tähelepanekuid, mis sel korral selles esinesid. Hiljem on uurijal võimalik sündmuse kohta tehtud tähelepanekuid süstematiseerida, lisades erinevaid kategooriaid. Ei ole olemas ühte ainukest kategoriseerimise võimalust, vaid kategooriate süsteem sõltub uurija eesmärgist. Uurida saab ka teistsuguseid andmeid, mis otseselt või kaudselt sisaldavad näiteks inimeste teadmisi, arvamusi, hoiakuid või käitumisviise nähtuste või olukordade kohta. Uurimisandmete kogumiseks sobivad seega järgmised meetodid: a) vaatlus, b) küsitlus (näiteks intervjuud, avatud vastusega küsimused), c) mitmesuguste dokumentide, tekstide või piltide või objektide kogumine. Näide 1. Fotod on kategoriseeritud erinevaid uurimiseesmärke silmas pidades: a) variant 1 Kas prügi taaskasutusvõimalus on loodud? b) variant 2 Kas elanikel on keskkonnahooliv käitumine? 75 / 85

76 Dokumenteeritud situatsioon Uurija tähelepanekud Prügi järelsorteerimine prügifirmas, et seda taaskasutada. Kategooria Variant 1: taaskasutus Prügi on eelnevalt sorteerimata. Variant 2: ei hooli keskkonnast Prügi ei teki, sest on loodud taara korduvkasutus. Variant 1: taaskasutus Elanikud ei viska taarat prügisse vaid viivad pakendite kogumispunkti. Variant 2: hoolib keskkonnast Prügi eelsorteerimise võimalus on loodud, et võimaldada taaskasutust. Variant 1: taaskasutus Elanikud ei sorteeri oma prügi. Variant 2: ei hooli keskkonnast Prügi eelsorteerimine elanike poolt, et võimaldada taaskasutust. Variant 1: taaskasutus Elanikud sorteerivad oma prügi. Variant 2: hoolib keskkonnast Näide 2. Õpilaste keskkonnaalaste teadmiste uuring Uuringus paluti õpilastel vastata küsimusele: Põhjenda, miks me ei tohiks Suure Munamäe ja teiste Lõuna-Eesti kuplite nõlvu metsast paljaks raiuda? Õpilaste vastused kategoriseeriti esmalt eri tüüpi vastusevariantideks: näit. Õhuga seotud seletused; Erosiooniga seotud seletused jne. Need moodustasid ülemkategooriad. Iga kategooria sees esines samuti eri tüüpi õpilaste vastuseid, mis omakorda kategoriseeriti: näiteks Puud toodavad hapnikku, Värske õhk, Õhusaastus, Kliimamuutus. Näites on välja toodud osalised uuringu tulemused: Uuringust selgus, et lisaks õigetele teadmistele esineb õpilastel hulk väärarusaamu, mida uuring aitas täpsustada. PÕHJUS 1: Õhuga seotud põhjendused Puud toodavad hapnikku Puid on vaja muidu ei saa hingata, hapnik saab otsa. Puud toodavad hapnikku. Kui need maha raiuda, jääks värsket õhku vähemaks. Sest puud toodavad hapnikku. Puud toodavad õhku Sest, et igal pool peavad kasvama puud ja need puud annavad õhku. 76 / 85

Arvuti kasutamine uurimistöös

Arvuti kasutamine uurimistöös Arvuti kasutamine uurimistöös Informaatika valikaine e-õpik gümnaasiumile Mart Laanpere, Katrin Niglas, Kairi Osula, Kai Pata Tallinna Ülikool 2013 Õppekomplekti rahastas ESF TeaMe programm Eesti Teadusagentuuri

Διαβάστε περισσότερα

Kompleksarvu algebraline kuju

Kompleksarvu algebraline kuju Kompleksarvud p. 1/15 Kompleksarvud Kompleksarvu algebraline kuju Mati Väljas mati.valjas@ttu.ee Tallinna Tehnikaülikool Kompleksarvud p. 2/15 Hulk Hulk on kaasaegse matemaatika algmõiste, mida ei saa

Διαβάστε περισσότερα

Arvuti kasutamine uurimistöös

Arvuti kasutamine uurimistöös Arvuti kasutamine uurimistöös Ülesannete kogu informaatika valikaine e-õpiku juurde Mart Laanpere, Katrin Niglas, Kairi Osula, Kai Pata Tallinna Ülikool 2013 Õppekomplekti rahastas ESF TeaMe programm Eesti

Διαβάστε περισσότερα

Geomeetrilised vektorid

Geomeetrilised vektorid Vektorid Geomeetrilised vektorid Skalaarideks nimetatakse suurusi, mida saab esitada ühe arvuga suuruse arvulise väärtusega. Skalaari iseloomuga suurusi nimetatakse skalaarseteks suurusteks. Skalaarse

Διαβάστε περισσότερα

2.2.1 Geomeetriline interpretatsioon

2.2.1 Geomeetriline interpretatsioon 2.2. MAATRIKSI P X OMADUSED 19 2.2.1 Geomeetriline interpretatsioon Maatriksi X (dimensioonidega n k) veergude poolt moodustatav vektorruum (inglise k. column space) C(X) on defineeritud järgmiselt: Defineerides

Διαβάστε περισσότερα

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA SISUKORD 8 MÄÄRAMATA INTEGRAAL 56 8 Algfunktsioon ja määramata integraal 56 8 Integraalide tabel 57 8 Määramata integraali omadusi 58

Διαβάστε περισσότερα

Ruumilise jõusüsteemi taandamine lihtsaimale kujule

Ruumilise jõusüsteemi taandamine lihtsaimale kujule Kodutöö nr.1 uumilise jõusüsteemi taandamine lihtsaimale kujule Ülesanne Taandada antud jõusüsteem lihtsaimale kujule. isttahuka (joonis 1.) mõõdud ning jõudude moodulid ja suunad on antud tabelis 1. D

Διαβάστε περισσότερα

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid Graafiteooria üldmõisteid Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid Orienteerimata graafid G(x i )={ x k < x i, x k > A}

Διαβάστε περισσότερα

Lokaalsed ekstreemumid

Lokaalsed ekstreemumid Lokaalsed ekstreemumid Öeldakse, et funktsioonil f (x) on punktis x lokaalne maksimum, kui leidub selline positiivne arv δ, et 0 < Δx < δ Δy 0. Öeldakse, et funktsioonil f (x) on punktis x lokaalne miinimum,

Διαβάστε περισσότερα

HAPE-ALUS TASAKAAL. Teema nr 2

HAPE-ALUS TASAKAAL. Teema nr 2 PE-LUS TSL Teema nr Tugevad happed Tugevad happed on lahuses täielikult dissotiseerunud + sisaldus lahuses on võrdne happe analüütilise kontsentratsiooniga Nt NO Cl SO 4 (esimeses astmes) p a väärtused

Διαβάστε περισσότερα

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale Vektorid II Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale Vektorid Vektorid on arvude järjestatud hulgad (s.t. iga komponendi väärtus ja positsioon hulgas on tähenduslikud) Vektori

Διαβάστε περισσότερα

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA SISUKORD 57 Joone uutuja Näited 8 58 Ülesanded uutuja võrrandi koostamisest 57 Joone uutuja Näited Funktsiooni tuletisel on

Διαβάστε περισσότερα

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1 laneedi Maa kaadistamine laneedi Maa kõige lihtsamaks mudeliks on kea. G Joon 1 Maapinna kaadistamine põhineb kea ümbeingjoontel, millest pikimat nimetatakse suuingjooneks. Need suuingjooned, mis läbivad

Διαβάστε περισσότερα

Ehitusmehaanika harjutus

Ehitusmehaanika harjutus Ehitusmehaanika harjutus Sõrestik 2. Mõjujooned /25 2 6 8 0 2 6 C 000 3 5 7 9 3 5 "" 00 x C 2 C 3 z Andres Lahe Mehaanikainstituut Tallinna Tehnikaülikool Tallinn 2007 See töö on litsentsi all Creative

Διαβάστε περισσότερα

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA PREDIKAATLOOGIKA Predikaatloogika on lauseloogika tugev laiendus. Predikaatloogikas saab nimetada asju ning rääkida nende omadustest. Väljendusvõimsuselt on predikaatloogika seega oluliselt peenekoelisem

Διαβάστε περισσότερα

HSM TT 1578 EST 6720 611 954 EE (04.08) RBLV 4682-00.1/G

HSM TT 1578 EST 6720 611 954 EE (04.08) RBLV 4682-00.1/G HSM TT 1578 EST 682-00.1/G 6720 611 95 EE (0.08) RBLV Sisukord Sisukord Ohutustehnika alased nõuanded 3 Sümbolite selgitused 3 1. Seadme andmed 1. 1. Tarnekomplekt 1. 2. Tehnilised andmed 1. 3. Tarvikud

Διαβάστε περισσότερα

Funktsiooni diferentsiaal

Funktsiooni diferentsiaal Diferentsiaal Funktsiooni diferentsiaal Argumendi muut Δx ja sellele vastav funktsiooni y = f (x) muut kohal x Eeldusel, et f D(x), saame Δy = f (x + Δx) f (x). f (x) = ehk piisavalt väikese Δx korral

Διαβάστε περισσότερα

9. AM ja FM detektorid

9. AM ja FM detektorid 1 9. AM ja FM detektorid IRO0070 Kõrgsageduslik signaalitöötlus Demodulaator Eraldab moduleeritud signaalist informatiivse osa. Konkreetne lahendus sõltub modulatsiooniviisist. Eristatakse Amplituuddetektoreid

Διαβάστε περισσότερα

Andmeanalüüs molekulaarbioloogias

Andmeanalüüs molekulaarbioloogias Andmeanalüüs molekulaarbioloogias Praktikum 3 Kahe grupi keskväärtuste võrdlemine Studenti t-test 1 Hüpoteeside testimise peamised etapid 1. Püstitame ENNE UURINGU ALGUST uurimishüpoteesi ja nullhüpoteesi.

Διαβάστε περισσότερα

Kontekstivabad keeled

Kontekstivabad keeled Kontekstivabad keeled Teema 2.1 Jaan Penjam, email: jaan@cs.ioc.ee Rekursiooni- ja keerukusteooria: KV keeled 1 / 27 Loengu kava 1 Kontekstivabad grammatikad 2 Süntaksipuud 3 Chomsky normaalkuju Jaan Penjam,

Διαβάστε περισσότερα

MATEMAATIKA AJALUGU MTMM MTMM

MATEMAATIKA AJALUGU MTMM MTMM Õppejõud: vanemteadur Mart Abel Õppejõud: vanemteadur Mart Abel Loenguid: 14 Õppejõud: vanemteadur Mart Abel Loenguid: 14 Seminare: 2 Õppejõud: vanemteadur Mart Abel Loenguid: 14 Seminare: 2 Hindamine:

Διαβάστε περισσότερα

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks 4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks 4.2.5.1 Ülevaade See täiustatud arvutusmeetod põhineb mahukate katsete tulemustel ja lõplike elementide meetodiga tehtud arvutustel [4.16], [4.17].

Διαβάστε περισσότερα

HULGATEOORIA ELEMENTE

HULGATEOORIA ELEMENTE HULGATEOORIA ELEMENTE Teema 2.2. Hulga elementide loendamine Jaan Penjam, email: jaan@cs.ioc.ee Diskreetne Matemaatika II: Hulgateooria 1 / 31 Loengu kava 2 Hulga elementide loendamine Hulga võimsus Loenduvad

Διαβάστε περισσότερα

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika Operatsioonsemantika Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika kirjeldab kuidas j~outakse l~oppolekusse Struktuurne semantika

Διαβάστε περισσότερα

PLASTSED DEFORMATSIOONID

PLASTSED DEFORMATSIOONID PLAED DEFORMAIOONID Misese vlavustingimus (pinegte ruumis) () Dimensineerimisega saab kõrvaldada ainsa materjali parameetri. Purunemise (tugevuse) kriteeriumid:. Maksimaalse pinge kirteerium Laminaat puruneb

Διαβάστε περισσότερα

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85 7.7. HII-RUUT TEST 85 7.7 Hii-ruut test Üks universaalsemaid ja sagedamini kasutust leidev test on hii-ruut (χ 2 -test, inglise keeles ka chi-square test). Oletame, et sooritataval katsel on k erinevat

Διαβάστε περισσότερα

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi Eesti koolinoorte XLVIII täppisteaduste olümpiaadi lõppvoor MATEMAATIKAS Tartus, 9. märtsil 001. a. Lahendused ja vastused IX klass 1. Vastus: x = 171. Teisendame võrrandi kujule 111(4 + x) = 14 45 ning

Διαβάστε περισσότερα

Sissejuhatus mehhatroonikasse MHK0120

Sissejuhatus mehhatroonikasse MHK0120 Sissejuhatus mehhatroonikasse MHK0120 2. nädala loeng Raavo Josepson raavo.josepson@ttu.ee Loenguslaidid Materjalid D. Halliday,R. Resnick, J. Walker. Füüsika põhikursus : õpik kõrgkoolile I köide. Eesti

Διαβάστε περισσότερα

Suhteline salajasus. Peeter Laud. Tartu Ülikool. peeter TTÜ, p.1/27

Suhteline salajasus. Peeter Laud. Tartu Ülikool. peeter TTÜ, p.1/27 Suhteline salajasus Peeter Laud peeter l@ut.ee Tartu Ülikool TTÜ, 11.12.2003 p.1/27 Probleemi olemus salajased sisendid avalikud väljundid Program muud väljundid muud sisendid mittesalajased väljundid

Διαβάστε περισσότερα

A - suurepärane % B - väga hea 81-90% C - hea 71-80% D - rahuldav 61-70% E - kasin 51-60% F - puudulik 0 50% Kirjeldav statistika

A - suurepärane % B - väga hea 81-90% C - hea 71-80% D - rahuldav 61-70% E - kasin 51-60% F - puudulik 0 50% Kirjeldav statistika Kursuse korraldus Andmeanalüüs: statistiline andmestik ja kirjeldav statistika Loeng 6 nädalat 31.01 7.02 14.02 21.02 28.02 7.03 IFI7041 Loeng: Kairi Osula Seminar: Taivo Tuuling Loengu slaidid ja muud

Διαβάστε περισσότερα

Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA)

Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA) Kursus: Mitmemõõtmeline statistika Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA) Õppejõud: Katrin Niglas PhD, dotsent informaatika instituut Statistilise olulisustesti põhisammud: E I: Analüüsisin

Διαβάστε περισσότερα

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV U-arvude koondtabel lk 1 lk 2 lk 3 lk 4 lk 5 lk 6 lk 7 lk 8 lk 9 lk 10 lk 11 lk 12 lk 13 lk 14 lk 15 lk 16 VÄLISSEIN - FIBO 3 CLASSIC 200 mm + SOOJUSTUS + KROHV VÄLISSEIN - AEROC CLASSIC 200 mm + SOOJUSTUS

Διαβάστε περισσότερα

Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus

Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus 1. Haljala valla metsa pindala Haljala valla üldpindala oli Maa-Ameti

Διαβάστε περισσότερα

1 Reaalarvud ja kompleksarvud Reaalarvud Kompleksarvud Kompleksarvu algebraline kuju... 5

1 Reaalarvud ja kompleksarvud Reaalarvud Kompleksarvud Kompleksarvu algebraline kuju... 5 1. Marek Kolk, Kõrgem matemaatika, Tartu Ülikool, 2013-14. 1 Reaalarvud ja kompleksarvud Sisukord 1 Reaalarvud ja kompleksarvud 1 1.1 Reaalarvud................................... 2 1.2 Kompleksarvud.................................

Διαβάστε περισσότερα

T~oestatavalt korrektne transleerimine

T~oestatavalt korrektne transleerimine T~oestatavalt korrektne transleerimine Transleerimisel koostatakse lähtekeelsele programmile vastav sihtkeelne programm. Transleerimine on korrektne, kui transleerimisel programmi tähendus säilib. Formaalsemalt:

Διαβάστε περισσότερα

KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS

KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS KEEMIAÜLESANNETE LAHENDAMISE LAHTINE VÕISTLUS Nooem aste (9. ja 10. klass) Tallinn, Tatu, Kuessaae, Nava, Pänu, Kohtla-Jäve 11. novembe 2006 Ülesannete lahendused 1. a) M (E) = 40,08 / 0,876 = 10,2 letades,

Διαβάστε περισσότερα

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused Koduseid ülesandeid IMO 017 Eesti võistkonna kandidaatidele vol 4 lahendused 17. juuni 017 1. Olgu a,, c positiivsed reaalarvud, nii et ac = 1. Tõesta, et a 1 + 1 ) 1 + 1 ) c 1 + 1 ) 1. c a Lahendus. Kuna

Διαβάστε περισσότερα

Funktsioonide õpetamisest põhikooli matemaatikakursuses

Funktsioonide õpetamisest põhikooli matemaatikakursuses Funktsioonide õpetamisest põhikooli matemaatikakursuses Allar Veelmaa, Loo Keskkool Funktsioon on üldtähenduses eesmärgipärane omadus, ülesanne, otstarve. Mõiste funktsioon ei ole kasutusel ainult matemaatikas,

Διαβάστε περισσότερα

KRITON Platon. Siin ja edaspidi tõlkija märkused. Toim. Tõlkinud Jaan Unt

KRITON Platon. Siin ja edaspidi tõlkija märkused. Toim. Tõlkinud Jaan Unt KRITON Platon AKADEEMIA, 1/1994 lk 57 71 Tõlkinud Jaan Unt SOKRATES: Miks sa nii vara siin oled, Kriton? Või polegi enam vara? KRITON: On küll. SOKRATES: Ja kui vara siis? KRITON: Alles ahetab. SOKRATES:

Διαβάστε περισσότερα

Kontrollijate kommentaarid a. piirkondliku matemaatikaolümpiaadi

Kontrollijate kommentaarid a. piirkondliku matemaatikaolümpiaadi Kontrollijate kommentaarid 2002. a. piirkondliku matemaatikaolümpiaadi tööde kohta Kokkuvõtteks Uuendusena oli tänavusel piirkondlikul olümpiaadil 10.-12. klassides senise 5 asemel 6 ülesannet, millest

Διαβάστε περισσότερα

Eesti LV matemaatikaolümpiaad

Eesti LV matemaatikaolümpiaad Eesti LV matemaatikaolümpiaad 2. veebruar 2008 Piirkonnavoor Kommentaarid Kokkuvõtteks Selleaastast komplekti võib paremini õnnestunuks lugeda kui paari viimase aasta omi. Lõppvooru pääsemise piirid protsentides

Διαβάστε περισσότερα

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil.

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil. 8. Sigvoolu, solenoidi j tooidi mgnetinduktsiooni vutmine koguvooluseduse il. See on vem vdtud, kuid mitte juhtme sees. Koguvooluseduse il on sed lihtne teh. Olgu lõpmt pikk juhe ingikujulise istlõikeg,

Διαβάστε περισσότερα

Vahendid Otsus Analüüs: Analüüsi Riskantseid Otsuseid

Vahendid Otsus Analüüs: Analüüsi Riskantseid Otsuseid Vahendid Otsus Analüüs: Analüüsi Riskantseid Otsuseid Link: http://home.ubalt.edu/ntsbarsh/opre640a/partix.htm Kui sa alustada kindlust, siis lõpetab kahtlusi, kuid kui te tahate sisu alustada kahtlusi,

Διαβάστε περισσότερα

2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused klass

2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused klass 2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused 11. 12. klass 18 g 1. a) N = 342 g/mol 6,022 1023 molekuli/mol = 3,2 10 22 molekuli b) 12 H 22 O 11 + 12O 2 = 12O 2 + 11H 2 O c) V = nrt p d) ΔH

Διαβάστε περισσότερα

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE 3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE 3.1. Loendamise põhireeglid Kombinatoorika on diskreetse matemaatika osa, mis uurib probleeme, kus on tegemist kas diskreetse hulga mingis mõttes eristatavate osahulkadega

Διαβάστε περισσότερα

Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist

Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist Loeng 2 Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist P2 - tuleb P1 lahendus T P~Q = { x P(x)~Q(x) = t} = = {x P(x)

Διαβάστε περισσότερα

Metsa kõrguse kaardistamise võimalustest radarkaugseirega. Aire Olesk, Kaupo Voormansik

Metsa kõrguse kaardistamise võimalustest radarkaugseirega. Aire Olesk, Kaupo Voormansik Metsa kõrguse kaardistamise võimalustest radarkaugseirega Aire Olesk, Kaupo Voormansik ESTGIS Narva-Jõesuu 24. Oktoober 2014 Tehisava-radar (SAR) Radarkaugseire rakendused Muutuste tuvastus Biomass Tormi-

Διαβάστε περισσότερα

Matemaatiline analüüs I iseseisvad ülesanded

Matemaatiline analüüs I iseseisvad ülesanded Matemaatiline analüüs I iseseisvad ülesanded. Leidke funktsiooni y = log( ) + + 5 määramispiirkond.. Leidke funktsiooni y = + arcsin 5 määramispiirkond.. Leidke funktsiooni y = sin + 6 määramispiirkond.

Διαβάστε περισσότερα

SISSEJUHATUS TEADVUSETEADUSESSE. Teema on niivõrd põnev ja huvitav, JAAN ARU TALIS BACHMANN

SISSEJUHATUS TEADVUSETEADUSESSE. Teema on niivõrd põnev ja huvitav, JAAN ARU TALIS BACHMANN SISSEJUHATUS JAAN ARU TALIS BACHMANN TEADVUSETEADUSESSE Ärgates kerkib me silme ette ümbritsev tuba koos selle ebaõnnestunud tapeedi ja osaliselt õnnestunud mööblivalikuga. Jõuame teadvusele iseendast

Διαβάστε περισσότερα

KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD

KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD Teema 3.1 (Õpiku peatükid 1 ja 3) Jaan Penjam, email: jaan@cs.ioc.ee Diskreetne Matemaatika II: Kombinatoorika 1 / 31 Loengu kava 1 Tähistusi 2 Kombinatoorsed

Διαβάστε περισσότερα

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397 Ecophon Line LED Ecophon Line on täisintegreeritud süvistatud valgusti. Kokkusobiv erinevate Focus-laesüsteemidega. Valgusti, mida sobib kasutada erinevates ruumides: avatud planeeringuga kontorites; vahekäigus

Διαβάστε περισσότερα

Ehitusmehaanika. EST meetod

Ehitusmehaanika. EST meetod Ehitusmehaanika. EST meetod Staatikaga määramatu kahe avaga raam /44 4 m q = 8 kn/m 00000000000000000000000 2 EI 4 EI 6 r r F EI p EI = 0 kn p EI p 2 m 00 6 m 00 6 m Andres Lahe Mehaanikainstituut Tallinna

Διαβάστε περισσότερα

Geoloogilised uuringud ja nende keskkonnamõju. Erki Niitlaan

Geoloogilised uuringud ja nende keskkonnamõju. Erki Niitlaan Geoloogilised uuringud ja nende keskkonnamõju Erki Niitlaan Ettekande sisu Mõisted Uuringu liigid Uuringu meetodid Eestis kasutavad uuringu meetodid Keskkonnamõju Kokkuvõtte Mõisted Geoloogia - kreeka

Διαβάστε περισσότερα

Retoorilised väljendusvahendid ja nende funktsioonid komöödias Aristophanese Herilased näitel

Retoorilised väljendusvahendid ja nende funktsioonid komöödias Aristophanese Herilased näitel Tartu Ülikool Filosoofiateaduskond Germaani, romaani ja slaavi filoloogia instituut Klassikalise filoloogia osakond Laura Viidebaum Retoorilised väljendusvahendid ja nende funktsioonid komöödias Aristophanese

Διαβάστε περισσότερα

KATEGOORIATEOORIA. Kevad 2010

KATEGOORIATEOORIA. Kevad 2010 KTEGOORITEOORI Kevad 2010 Loengukonspekt Lektor: Valdis Laan 1 1. Kategooriad 1.1. Hulgateoreetilistest alustest On hästi teada, et kõigi hulkade hulka ei ole olemas. Samas kategooriateoorias sooviks me

Διαβάστε περισσότερα

MATEMAATILISEST LOOGIKAST (Lausearvutus)

MATEMAATILISEST LOOGIKAST (Lausearvutus) TARTU ÜLIKOOL Teaduskool MATEMAATILISEST LOOGIKAST (Lausearvutus) Õppematerjal TÜ Teaduskooli õpilastele Koostanud E. Mitt TARTU 2003 1. LAUSE MÕISTE Matemaatilise loogika ühe osa - lausearvutuse - põhiliseks

Διαβάστε περισσότερα

,millest avaldub 21) 23)

,millest avaldub 21) 23) II kursus TRIGONOMEETRIA * laia matemaatika teemad TRIGONOMEETRILISTE FUNKTSIOONIDE PÕHISEOSED: sin α s α sin α + s α,millest avaldu s α sin α sα tan α, * t α,millest järeldu * tα s α tα tan α + s α Ülesanne.

Διαβάστε περισσότερα

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008 Sügis 2008 Jaguvus Olgu a ja b täisarvud. Kui leidub selline täisarv m, et b = am, siis ütleme, et arv a jagab arvu b ehk arv b jagub arvuga a. Tähistused: a b b. a Näiteks arv a jagab arvu b arv b jagub

Διαβάστε περισσότερα

Matemaatika VI kursus Tõenäosus, statistika KLASS 11 TUNDIDE ARV 35

Matemaatika VI kursus Tõenäosus, statistika KLASS 11 TUNDIDE ARV 35 Matemaatika VI kursus Tõenäosus, statistika Permutatsioonid, kombinatsioonid ja variatsioonid. Sündmus. Sündmuste liigid. Klassikaline tõenäosus. Geomeetriline tõenäosus. Sündmuste liigid: sõltuvad ja

Διαβάστε περισσότερα

2. HULGATEOORIA ELEMENTE

2. HULGATEOORIA ELEMENTE 2. HULGATEOORIA ELEMENTE 2.1. Hulgad, nende esitusviisid. Alamhulgad Hulga mõiste on matemaatika algmõiste ja seda ei saa def ineerida. Me võime vaid selgitada, kuidas seda abstraktset mõistet endale kujundada.

Διαβάστε περισσότερα

Eesti elektrienergia hinna analüüs ja ühesammuline prognoosimine ARIMA tüüpi mudelitega

Eesti elektrienergia hinna analüüs ja ühesammuline prognoosimine ARIMA tüüpi mudelitega TARTU ÜLIKOOL MATEMAATIKA INFORMAATIKATEADUSKOND Matemaatilise statistika instituut Finants- ja kindlustusmatemaatika eriala Kärt Päll Eesti elektrienergia hinna analüüs ja ühesammuline prognoosimine ARIMA

Διαβάστε περισσότερα

1. Paisksalvestuse meetod (hash)

1. Paisksalvestuse meetod (hash) 1. Paisksalvestuse meetod (hash) Kas on otsimiseks võimalik leida paremat ajalist keerukust kui O(log n)? Parem saaks olla konstantne keerukus O(1), mis tähendaks seda, et on kohe teada, kust õige kirje

Διαβάστε περισσότερα

HTPK Uurimismeetodid pedagoogikas 2 AP Lüümikud Lüümikud kajastavad kursuse sisu vaid osaliselt

HTPK Uurimismeetodid pedagoogikas 2 AP Lüümikud Lüümikud kajastavad kursuse sisu vaid osaliselt HTPK 01.119. Uurimismeetodid pedagoogikas 2 AP Lüümikud Lüümikud kajastavad kursuse sisu vaid osaliselt 1. Pedagoogilise uuringu olemus. Teadustöö olemus Pedagoogiline ja psühholoogiline Teadustöö kvaliteedi

Διαβάστε περισσότερα

TELERI JA KODUKINO OSTJA ABC EHK MIDA VÕIKS TEADA ENNE OSTMA MINEKUT. Lugemist neile, kes soovivad enamat kui telerit toanurgas

TELERI JA KODUKINO OSTJA ABC EHK MIDA VÕIKS TEADA ENNE OSTMA MINEKUT. Lugemist neile, kes soovivad enamat kui telerit toanurgas TELERI JA KODUKINO OSTJA ABC EHK MIDA VÕIKS TEADA ENNE OSTMA MINEKUT Lugemist neile, kes soovivad enamat kui telerit toanurgas 2 Eessõna Kõik sai alguse sellest, et erinevates foorumites küsivad inimesed

Διαβάστε περισσότερα

20. SIRGE VÕRRANDID. Joonis 20.1

20. SIRGE VÕRRANDID. Joonis 20.1 κ ËÁÊ Â Ì Ë Æ Á 20. SIRGE VÕRRANDID Sirget me võime vaadelda kas tasandil E 2 või ruumis E 3. Sirget vaadelda sirgel E 1 ei oma mõtet, sest tegemist on ühe ja sama sirgega. Esialgu on meie käsitlus nii

Διαβάστε περισσότερα

Matemaatiline analüüs I iseseisvad ülesanded

Matemaatiline analüüs I iseseisvad ülesanded Matemaatiline analüüs I iseseisvad ülesanded Leidke funktsiooni y = log( ) + + 5 määramispiirkond Leidke funktsiooni y = + arcsin 5 määramispiirkond Leidke funktsiooni y = sin + 6 määramispiirkond 4 Leidke

Διαβάστε περισσότερα

Kas Androidi ostmiseks on õige aeg? Eesti esimene võrdlustest!

Kas Androidi ostmiseks on õige aeg? Eesti esimene võrdlustest! Uus ipod Nano Nüüd kaamera ja raadioga Pentax K7 Mida arvata järjekordsest kaamerast? Odav ja hea ka Poola värk Poolakate telefoni käib kaks SIM-kaarti Säästuaeg Testis ilma jalata kuvar Kas Androidi ostmiseks

Διαβάστε περισσότερα

Algebraliste võrrandite lahenduvus radikaalides. Raido Paas Juhendaja: Mart Abel

Algebraliste võrrandite lahenduvus radikaalides. Raido Paas Juhendaja: Mart Abel Algebraliste võrrandite lahenduvus radikaalides Magistritöö Raido Paas Juhendaja: Mart Abel Tartu 2013 Sisukord Sissejuhatus Ajalooline sissejuhatus iii v 1 Rühmateooria elemente 1 1.1 Substitutsioonide

Διαβάστε περισσότερα

Eesti koolinoorte XLIX täppisteaduste olümpiaad

Eesti koolinoorte XLIX täppisteaduste olümpiaad Eesti koolinoorte XLIX täppisteaduste olümpiaad MATEMAATIKA PIIRKONDLIK VOOR 26. jaanuaril 2002. a. Juhised lahenduste hindamiseks Lp. hindaja! 1. Juhime Teie tähelepanu sellele, et alljärgnevas on 7.

Διαβάστε περισσότερα

Matemaatiline statistika ja modelleerimine

Matemaatiline statistika ja modelleerimine Matemaatiline statistika ja modelleerimine Kirjeldav statistika EMÜ doktorikool DK.7 Tanel Kaart Sagedused ja osakaalud diskreetne tunnus Mittearvuliste või diskreetsete tunnuste (erinevate väärtuste arv

Διαβάστε περισσότερα

6.6 Ühtlaselt koormatud plaatide lihtsamad

6.6 Ühtlaselt koormatud plaatide lihtsamad 6.6. Ühtlaselt koormatud plaatide lihtsamad paindeülesanded 263 6.6 Ühtlaselt koormatud plaatide lihtsamad paindeülesanded 6.6.1 Silindriline paine Kui ristkülikuline plaat on pika ristküliku kujuline

Διαβάστε περισσότερα

Juhuslik faktor ja mitmetasandilised mudelid

Juhuslik faktor ja mitmetasandilised mudelid Peatükk 2 Juhuslik faktor ja mitmetasandilised mudelid Uurime inimese verer~ohku. Inimese verer~ohk on üsnagi varieeruv ja s~oltub üsnagi tugevalt hetkeolukorrat mida inimene on enne m~o~otmist söönud/joonud,

Διαβάστε περισσότερα

IKT vahendite kasutamisest gümnaasiumi matemaatikakursuste õpetamisel

IKT vahendite kasutamisest gümnaasiumi matemaatikakursuste õpetamisel IKT vahendite kasutamisest gümnaasiumi matemaatikakursuste õpetamisel Allar Veelmaa, Loo Keskkool Gümnaasiumi riiklik õppekava 1 (edaspidi GRÕK) järgi võib õpilane valida kitsa ja laia matemaatikakursuse

Διαβάστε περισσότερα

Sisukord. 4 Tõenäosuse piirteoreemid 36

Sisukord. 4 Tõenäosuse piirteoreemid 36 Sisukord Sündmused ja tõenäosused 5. Sündmused................................... 5.2 Tõenäosus.................................... 8.2. Tõenäosuse arvutamise konkreetsed meetodid (üldise definitsiooni

Διαβάστε περισσότερα

Parim odav. nutitelefon

Parim odav. nutitelefon Transformer, väga eriline tahvelarvuti Samsungi relv ipadi vastu 2000 eurot maksev HP sülearvuti Kodune Logitechi helipark Nr 76, august 2011 Hind 2.79 ; 43.65 kr Parim odav Üheksa videokaamerat. Ainult

Διαβάστε περισσότερα

MateMaatika õhtuõpik

MateMaatika õhtuõpik Matemaatika õhtuõpik 1 2 Matemaatika õhtuõpik 3 Alates 31. märtsist 2014 on raamatu elektrooniline versioon tasuta kättesaadav aadressilt 6htu6pik.ut.ee CC litsentsi alusel (Autorile viitamine + Mitteäriline

Διαβάστε περισσότερα

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test) Peatükk 2 Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test) 2.1 Motivatsioon ja teststatistik Wilcoxoni astakmärgitesti kasutatakse kahe s~oltuva valimi v~ordlemiseks. Oletame näiteks, et soovime v~orrelda,

Διαβάστε περισσότερα

Sisukord. 3 T~oenäosuse piirteoreemid Suurte arvude seadus (Law of Large Numbers)... 32

Sisukord. 3 T~oenäosuse piirteoreemid Suurte arvude seadus (Law of Large Numbers)... 32 Sisukord Sündmused ja t~oenäosused 4. Sündmused................................... 4.2 T~oenäosus.................................... 7.2. T~oenäosuse arvutamise konkreetsed meetodid (üldise definitsiooni

Διαβάστε περισσότερα

Lexical-Functional Grammar

Lexical-Functional Grammar Lexical-Functional Grammar Süntaksiteooriad ja -mudelid 2005/06 Kaili Müürisep 6. aprill 2006 1 Contents 1 Ülevaade formalismist 1 1.1 Informatsiooni esitus LFG-s..................... 1 1.2 a-struktuur..............................

Διαβάστε περισσότερα

1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD

1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD 1. Reaalarvud 1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD Arvu mõiste hakkas kujunema aastatuhandeid tagasi, täiustudes ja üldistudes koos inimkonna arenguga. Juba ürgühiskonnas tekkis vajadus teatavaid hulki

Διαβάστε περισσότερα

4 T~oenäosuse piirteoreemid Tsentraalne piirteoreem Suurte arvude seadus (Law of Large Numbers)... 32

4 T~oenäosuse piirteoreemid Tsentraalne piirteoreem Suurte arvude seadus (Law of Large Numbers)... 32 Sisukord 1 Sündmused ja t~oenäosused 4 1.1 Sündmused................................... 4 1.2 T~oenäosus.................................... 7 1.2.1 T~oenäosuse arvutamise konkreetsed meetodid (üldise

Διαβάστε περισσότερα

Formaalsete keelte teooria. Mati Pentus

Formaalsete keelte teooria. Mati Pentus Formaalsete keelte teooria Mati Pentus http://lpcs.math.msu.su/~pentus/ftp/fkt/ 2009 13. november 2009. a. Formaalsete keelte teooria 2 Peatükk 1. Keeled ja grammatikad Definitsioon 1.1. Naturaalarvudeks

Διαβάστε περισσότερα

IKT ja teised läbivad teemad üldhariduskooli õppekavas. Kai Pata, Mart Laanpere, Erika Matsak, Priit Reiska

IKT ja teised läbivad teemad üldhariduskooli õppekavas. Kai Pata, Mart Laanpere, Erika Matsak, Priit Reiska IKT ja teised läbivad teemad üldhariduskooli õppekavas Kai Pata, Mart Laanpere, Erika Matsak, Priit Reiska Tallinna Ülikooli informaatika instituudi haridustehnoloogia keskus 2008 Sisukord Ülevaade uuringu

Διαβάστε περισσότερα

KOLMAPÄEV, 15. DETSEMBER 2010

KOLMAPÄEV, 15. DETSEMBER 2010 15-12-2010 1 KOLMAPÄEV, 15. DSEMBER 2010 ISTUNGI JUHATAJA: Jerzy BUZEK president 1. Osaistungjärgu avamine (Istung algas kell 08.35) 2. Komisjoni 2011. aasta tööprogrammi tutvustamine (esitatud resolutsiooni

Διαβάστε περισσότερα

Lego Mindstormi roboti programmeerimise juhendmaterjali koostamine

Lego Mindstormi roboti programmeerimise juhendmaterjali koostamine Tallinna Ülikool Informaatika Instituut Lego Mindstormi roboti programmeerimise juhendmaterjali koostamine Seminaritöö Autor: Raido Parring Juhendaja: Jaagup Kippar Autor:...... 2012 Juhendaja:...... 2012

Διαβάστε περισσότερα

Sild, mis ühendab uurimistööd tänapäeva füüsikas ja ettevõtlust nanotehnoloogias. Kvantfüüsika

Sild, mis ühendab uurimistööd tänapäeva füüsikas ja ettevõtlust nanotehnoloogias. Kvantfüüsika Sild, mis ühendab uurimistööd tänapäeva füüsikas ja ettevõtlust nanotehnoloogias Kvantfüüsika Tillukeste asjade füüsika, millel on hiiglaslikud rakendusvõimalused 2. osa KVANTOMADUSED JA TEHNOLOOGIA VI

Διαβάστε περισσότερα

Ecophon Square 43 LED

Ecophon Square 43 LED Ecophon Square 43 LED Ecophon Square 43 on täisintegreeritud süvistatud valgusti, saadaval Dg, Ds, E ja Ez servaga toodetele. Loodud kokkusobima Akutex FT pinnakattega Ecophoni laeplaatidega. Valgusti,

Διαβάστε περισσότερα

Joonis 1. Teist järku aperioodilise lüli ülekandefunktsiooni saab teisendada võnkelüli ülekandefunktsiooni kujul, kui

Joonis 1. Teist järku aperioodilise lüli ülekandefunktsiooni saab teisendada võnkelüli ülekandefunktsiooni kujul, kui Ülesnded j lhendused utomtjuhtimisest Ülesnne. Süsteem oosneb hest jdmisi ühendtud erioodilisest lülist, mille jonstndid on 0,08 j 0,5 ning õimendustegurid stlt 0 j 50. Leid süsteemi summrne ülendefuntsioon.

Διαβάστε περισσότερα

Kauaoodatud Spore [digi] käes testis Ainuraksest kosmosevallutajaks

Kauaoodatud Spore [digi] käes testis Ainuraksest kosmosevallutajaks Muusika! Uued kõrva sisse käivad klapid üllatavad kvaliteediga Uus kaamera Nikon D90: amatöörile parim Soome elab veel! Peaaegu nagu iphone: Nokia E71 on kiire ja mugav On see printer? HP teeb nalja Maailma

Διαβάστε περισσότερα

Füüsikalise looduskäsitluse alused

Füüsikalise looduskäsitluse alused Eesti Füüsika Selts Füüsikalise looduskäsitluse alused õpik gümnaasiumile autorid: Indrek Peil ja Kalev Tarkpea Tartu 2012 1 1. Sissejuhatus füüsikasse... 4 1.1. Maailm, loodus ja füüsika... 4 1.1.1. Füüsika

Διαβάστε περισσότερα

Veaarvutus ja määramatus

Veaarvutus ja määramatus TARTU ÜLIKOOL Tartu Ülikooli Teaduskool Veaarvutus ja määramatus Urmo Visk Tartu 2005 Sisukord 1 Tähistused 2 2 Sissejuhatus 3 3 Viga 4 3.1 Mõõteriistade vead................................... 4 3.2 Tehted

Διαβάστε περισσότερα

Sisukord. 2 Programmeerimiskeel C

Sisukord. 2 Programmeerimiskeel C Veiko Sinivee 2 Programmeerimiskeel C Sisukord Sissejuhatus...1 Programmeerimiskeel C...1 C - keele programmi ehitusest...4 Abiprogramm MAKE...13 Enamkasutatavad funktsioonid...16 Funktsioonid printf()

Διαβάστε περισσότερα

KATEGOORIATEOORIA. Kevad 2016

KATEGOORIATEOORIA. Kevad 2016 KTEGOORITEOORI Kevad 2016 Loengukonspekt Lektor: Valdis Laan 1 1. Kategooriad 1.1. Hulgateoreetilistest alustest On hästi teada, et kõigi hulkade hulka ei ole olemas. Samas kategooriateoorias sooviks me

Διαβάστε περισσότερα

Kõrv vastu arvutit: testis 2.1 arvutikõlarid

Kõrv vastu arvutit: testis 2.1 arvutikõlarid Microsofti telefoni- Windows on tagasi Testime Nikoni uut D7000 kaamerat Kinect teeb mängud täitsa uueks Uputame ja togime Samsungi matkafoni Nr 69, jaanuar 2011 Hind 42.90 kr; 2.74 Kõrv vastu arvutit:

Διαβάστε περισσότερα

; y ) vektori lõpppunkt, siis

; y ) vektori lõpppunkt, siis III kusus VEKTOR TASANDIL. JOONE VÕRRAND *laia matemaatika teemad. Vektoi mõiste, -koodinaadid ja pikkus: http://www.allaveelmaa.com/ematejalid/vekto-koodinaadid-pikkus.pdf Vektoite lahutamine: http://allaveelmaa.com/ematejalid/lahutaminenull.pdf

Διαβάστε περισσότερα

Milline on hea. odav Android? Pane oma failid siia: testime kõvakettaid. [digi] kool: DLNA, AirPlay, Wireless HDMI

Milline on hea. odav Android? Pane oma failid siia: testime kõvakettaid. [digi] kool: DLNA, AirPlay, Wireless HDMI LG tegi imeõhukese kuvari ja me testime Kaamera, mis sobib küünevärviga Lugejate nõudmisel: testis head klapid Katsetame HP kõik ühes arvutit Nr 71, märts 2011 Hind 2.79 ; 43.65 kr Pane oma failid siia:

Διαβάστε περισσότερα

Energiabilanss netoenergiavajadus

Energiabilanss netoenergiavajadus Energiabilanss netoenergiajadus 1/26 Eelmisel loengul soojuskadude arvutus (võimsus) φ + + + tot = φ φ φ juht v inf φ sv Energia = tunnivõimsuste summa kwh Netoenergiajadus (ruumis), energiakasutus (tehnosüsteemis)

Διαβάστε περισσότερα

Pesumasin Πλυντήριο ρούχων Mosógép Veļas mašīna

Pesumasin Πλυντήριο ρούχων Mosógép Veļas mašīna ET Kasutusjuhend 2 EL Οδηγίες Χρήσης 17 HU Használati útmutató 34 LV Lietošanas instrukcija 50 Pesumasin Πλυντήριο ρούχων Mosógép Veļas mašīna ZWG 6120K Sisukord Ohutusinfo _ 2 Ohutusjuhised _ 3 Jäätmekäitlus

Διαβάστε περισσότερα

1 Kompleksarvud Imaginaararvud Praktiline väärtus Kõige ilusam valem? Kompleksarvu erinevad kujud...

1 Kompleksarvud Imaginaararvud Praktiline väärtus Kõige ilusam valem? Kompleksarvu erinevad kujud... Marek Kolk, Tartu Ülikool, 2012 1 Kompleksarvud Tegemist on failiga, kuhu ma olen kogunud enda arvates huvitavat ja esiletõstmist vajavat materjali ning on mõeldud lugeja teadmiste täiendamiseks. Seega

Διαβάστε περισσότερα

ALGEBRA I. Kevad Lektor: Valdis Laan

ALGEBRA I. Kevad Lektor: Valdis Laan ALGEBRA I Kevad 2013 Lektor: Valdis Laan Sisukord 1 Maatriksid 5 1.1 Sissejuhatus....................................... 5 1.2 Maatriksi mõiste.................................... 6 1.3 Reaalarvudest ja

Διαβάστε περισσότερα