A - suurepärane % B - väga hea 81-90% C - hea 71-80% D - rahuldav 61-70% E - kasin 51-60% F - puudulik 0 50% Kirjeldav statistika

Σχετικά έγγραφα
Andmeanalüüs molekulaarbioloogias

Matemaatiline statistika ja modelleerimine

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

Geomeetrilised vektorid

Kompleksarvu algebraline kuju

Lisa 2 ÜLEVAADE HALJALA VALLA METSADEST Koostanud veebruar 2008 Margarete Merenäkk ja Mati Valgepea, Metsakaitse- ja Metsauuenduskeskus

Arvuti kasutamine uurimistöös

Töökorraldus. Õppematerialid. Töökorraldus. Harvey Motulsky Intuitive Biostatistics (2010, 1995)

Funktsiooni diferentsiaal

Seminar II: Mitmemõõtmeline dispersioonanalüüs (MANOVA)

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

9. AM ja FM detektorid

2.2.1 Geomeetriline interpretatsioon

Ruumilise jõusüsteemi taandamine lihtsaimale kujule

Matemaatiline statistika ja modelleerimine

Statistiline andmetöötlus, VL-0435 sügis, 2008

2. Normi piiride määramine (R.D. Smith)

Lokaalsed ekstreemumid

2. Normi piiride määramine

PLASTSED DEFORMATSIOONID

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

Ehitusmehaanika harjutus

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

4.2.5 Täiustatud meetod tuletõkestusvõime määramiseks

siis on tegemist sümmeetrilise usaldusvahemikuga. Vasakpoolne usaldusvahemik x i, E x = EX, D x = σ2

Kontekstivabad keeled

HULGATEOORIA ELEMENTE

HAPE-ALUS TASAKAAL. Teema nr 2

Lexical-Functional Grammar

Excel Statistilised funktsioonid

Matemaatika VI kursus Tõenäosus, statistika KLASS 11 TUNDIDE ARV 35

Tulemused kaalutud andmete alusel. Weighted results

AKU. Arvuti kasutamine uurimistöös

Arvuti kasutamine uurimistöös

HTPK Uurimismeetodid pedagoogikas 2 AP Lüümikud Lüümikud kajastavad kursuse sisu vaid osaliselt

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

Epidemioloogiliste terminite lühisõnastik

Vahendid Otsus Analüüs: Analüüsi Riskantseid Otsuseid

Veaarvutus ja määramatus

Geoloogilised uuringud ja nende keskkonnamõju. Erki Niitlaan

Funktsioonide õpetamisest põhikooli matemaatikakursuses

ΣΧΕΔΙΑΣΜΟΣ. ΠΟΛΥΞΕΝΗ ΗΛΙΟΠΟΥΛΟΥ Αγρονόμος-Τοπογράφος Μηχ. Δρ. Γεωγραφίας Καθηγήτρια Τμ. Τοπογραφίας ΤΕΙ ΑΘΗΝΑΣ

28. Sirgvoolu, solenoidi ja toroidi magnetinduktsiooni arvutamine koguvooluseaduse abil.

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

Anonüümse HIV nõustamise ja testimise teenuse ülevaade aasta. Kristi Rüütel, Natalja Gluškova

Metsa kõrguse kaardistamise võimalustest radarkaugseirega. Aire Olesk, Kaupo Voormansik

T~oestatavalt korrektne transleerimine

Sissejuhatus mehhatroonikasse MHK0120

KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD

EESTI KOOLIÕPILASTE TERVISEKÄITUMISE UURING

Matemaatiline analüüs I iseseisvad ülesanded

SISSEJUHATUS TEADVUSETEADUSESSE. Teema on niivõrd põnev ja huvitav, JAAN ARU TALIS BACHMANN

ÕPETAMISE JA AINEKURSUSTE HINDAMINE SÜGIS 2006/KEVAD 2007

HSM TT 1578 EST EE (04.08) RBLV /G

Eesti koolinoorte XLIX täppisteaduste olümpiaad

Κεφάλαιο 9. Υπολογισµός του είκτη Συσχέτισης. Ο Υπολογισµός του είκτη Συσχέτισης

KRITON Platon. Siin ja edaspidi tõlkija märkused. Toim. Tõlkinud Jaan Unt

Enam kui kahe grupi keskmiste võrdlus

Juhuslik faktor ja mitmetasandilised mudelid

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008

Ülesanne 4.1. Õhukese raudbetoonist gravitatsioontugiseina arvutus

Smith i diagramm. Peegeldustegur

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD

Milline on hea. odav Android? Pane oma failid siia: testime kõvakettaid. [digi] kool: DLNA, AirPlay, Wireless HDMI

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

1 Entroopia ja informatsioon

Juhend. Kuupäev: Teema: Välisõhu ja õhuheidete mõõtmised. 1. Juhendi eesmärk

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused

Ecophon Line LED. Süsteemi info. Mõõdud, mm 1200x x x600 T24 Paksus (t) M329, M330, M331. Paigaldusjoonis M397 M397

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE

8. KEEVISLIITED. Sele 8.1. Kattekeevisliide. Arvutada kahepoolne otsõmblus terasplaatide (S235J2G3) ühendamiseks. F = 40 kn; δ = 5 mm.

Vanemlusprogrammi Imelised aastad piloteerimise põhitulemused III ja IV etapi koolitused

AS MÕÕTELABOR Tellija:... Tuule 11, Tallinn XXXXXXX Objekt:... ISOLATSIOONITAKISTUSE MÕÕTMISPROTOKOLL NR.

Eesti elektrienergia hinna analüüs ja ühesammuline prognoosimine ARIMA tüüpi mudelitega

DEF. Kolmnurgaks nim hulknurka, millel on 3 tippu. / Kolmnurgaks nim tasandi osa, mida piiravad kolme erinevat punkti ühendavad lõigud.

2. HULGATEOORIA ELEMENTE

Kontrollijate kommentaarid a. piirkondliku matemaatikaolümpiaadi

HIV/AIDS-iga SEOTUD TEADMISED JA KÄITUMINE GAY-INTERNETILEHEKÜLGI KÜLASTAVATE MEESTE SEAS

1 Funktsioon, piirväärtus, pidevus

ESF5511LOX ESF5511LOW ET NÕUDEPESUMASIN KASUTUSJUHEND 2 EL ΠΛΥΝΤΉΡΙΟ ΠΙΆΤΩΝ ΟΔΗΓΊΕΣ ΧΡΉΣΗΣ 21 HU MOSOGATÓGÉP HASZNÁLATI ÚTMUTATÓ 41

RF võimendite parameetrid

LOFY Füüsika looduslikus ja tehiskeskkonnas I (3 EAP)

Sisukord. 3 T~oenäosuse piirteoreemid Suurte arvude seadus (Law of Large Numbers)... 32

Mõõtmised, andmetöötlus ja automaatika lihanduses ja piimanduses, VL-1112 & VL-1122

Energiabilanss netoenergiavajadus

,millest avaldub 21) 23)

4.1 Funktsiooni lähendamine. Taylori polünoom.

Matemaatiline analüüs I iseseisvad ülesanded

Compress 6000 LW Bosch Compress LW C 35 C A ++ A + A B C D E F G. db kw kw /2013

SELEKTSIOONIINDEKSID

20. SIRGE VÕRRANDID. Joonis 20.1

KATEGOORIATEOORIA. Kevad 2016

1 Reaalarvud ja kompleksarvud Reaalarvud Kompleksarvud Kompleksarvu algebraline kuju... 5

YMM3740 Matemaatilne analüüs II

MATEMAATILISEST LOOGIKAST (Lausearvutus)

Milline navi on Androidi

Transcript:

Kursuse korraldus Andmeanalüüs: statistiline andmestik ja kirjeldav statistika Loeng 6 nädalat 31.01 7.02 14.02 21.02 28.02 7.03 IFI7041 Loeng: Kairi Osula Seminar: Taivo Tuuling Loengu slaidid ja muud materjalid on avalikus veebis: www.tlu.ee/~kairio/7041 Kursuse korraldus Kursuse korraldus (OK) Kirjalik avatud küsimustega test 40% (OK) Rühmatöö 10% (TT) Kodused (is.) tööd 50% Positiivse hinde saamiseks peavad olema tehtud pos.tulemusele mõlemad osad (test & is.töö) Hinded sisestab praktikumi juhendaja Taivo Tuuling A - suurepärane 91-100% B - väga hea 81-90% C - hea 71-80% D - rahuldav 61-70% E - kasin 51-60% F - puudulik 0 50% 10% - rühma ettekanne ühes loengus NB! Kõik rühmad ei mahu viimasesse loengusse!!! Ühes rühmas 4-5 üliõpilast Teema huvitav küsimus, mis loengus tekkis. Ettekande aeg 4-5 minutit. Slaidid pdf ja saata mulle e- mailile (kairio@tlu.ee) Seda osa saab järgi vastata, aga siis olete te üksi rühmas ja mina annan huvitava teema! 40% - avatud küsimustega kirjalik test Põhieksamitel on materjalide kasutamine lubatud 25.04 & 23.05 Kõik mis on paberkandjal, arvutis on avatud 1 fail (slaidid), telefone ei kasuta Järeleksamitel me materjale ei kasuta Avatud küsimused, iga kord erinevad, mitu varianti Kirjutamiseks aega 1 tund Tulemused kahe päeva jooksul, tööd saab pärast näha (eelneval kokkuleppel) Lisalugemist Lisalugemist Uuri ja kirjuta Autorid: S. Hirsjärvi, P. Remes, P. Sajavaara Kirjastus: Medicina Ilmumisaasta: 2005 Uurija käsiraamat Autor: A.Kidron Kirjastus: Mondo Ilmumisaasta: 2008 Andmete analüüs ja tõlgendamine sotsiaalteadustes Autor: Liina Mai Tooding Kirjastus: Tartu Ülikooli kirjastus Ilmumisaasta 2007 Andmeanalüüs sotsiaalteadustes Autor: Liina Mai Tooding Kirjastus: Tartu Ülikooli kirjastus Ilmumisaasta: 1998 1

15.02.14 Lisalugemist Uuringutüüpe saab klassifitseerida järgmiselt: Statistilise andmetöötluse pakett SPSS 14.0 Põhikursus Autor: Katrin Niglas Kirjastus: Tallinna Ülikooli kirjastus Ilmumisaasta: 2008 Eesmärgi (purpose) alusel Uuringu lähenemise (approach) alusel Protsessi alusel Avastav Kirjeldav Analüütiline Ennustav Teoreetiline Empiiriline Rakenduslik Kvalitatiivne Kvantitatiivne Kombineeritud Uuringutüüpe saab klassifitseerida järgmiselt: Protsessi alusel KVANTITATIIVNE UURING KVALITATIIVNE UURING Kui palju? (probleemi kirjeldamine) Kuidas? (probleemi kirjeldamine) Miks? (probleemi põhjuste tuvastamine) Milleks? (probleemi põhjuste tuvastamine) Tulemused üldistatakse üldkogumile, mõnikord küsitav (või mittevajalik) Tulemuste analüüs töömahukas Üldistamine tugineb arvulisele argumendile Seoste uurimine (ei näita põhjuslikku seost) Hüpoteeside testimine Eelneb mahukas planeerimisfaas Uuritavate hulk väike (üldistamine pigem ennustamise, seaduspärasuste/trendide väljatoomine) uuritakse tõlgendusi, hoiakuid ning arvamusi (koos põhjendustega) Saab töötada välja efektiivseid lahendusi konkreetsetele isikutele, mille laiemat mõju saab hiljem uurida kvantitatiivsete meetoditega Eesmärgi (purpose) alusel Uuringu lähenemise (approach) alusel Protsessi alusel Avastav Kirjeldav Analüütiline Ennustav Teoreetiline Empiiriline Rakenduslik Kvalitatiivne Kvantitatiivne Kombineeritud Uuringu lähenemise põhjal Teoreetiline uurimus Eesmärk Olemasoleva teabe/uuringute analüüs Erinevate teooriate kriitiline analüüs (võrreldakse ühe eeliseid teisega) Autor peab näitama, milline on tema panus uute teadmiste otsingul, kasutamisel, süstematiseerimisel ja hindamisel. Näited Filosoofilised küsimused Puhta matemaatika teoreemid Ajaloolised uuringud Arvutikasutuseeetika (loogiline arutelu ja seisukohad). Tarkvara võrdlev analüüs Referaat (?) Seminaritöö kui referaat (teoreetiliste uuringute KÕIGE välimisem kiht) 2

Rakenduslik uurimus Empiiriline uuring Näited Personaalne arendusprojekt (või selle osa) Õppematerjalide loomine Probleemi analüüs (vajadused, eesmärgid, olemasolev teave) Disaini protsess (tööjaotus, ajakava, meetodid) Disaini protsessi resultaat (rakenduse visandid, vaheversioonid, lõplik rakendus) Hindamine e. evalvatsioon (rakenduse testimine, hindamine lähtuvalt standarditest, kasutajate tagasiside) Uurimisprobleem küsimus, hüpotees, eesmärk Valikumeetod juhuslik valim, üks juhtum, mitu juhtumit Andmekogumis meetod(id) struktureeritud ankeet, struktureerimata intervjuu,... Andmeanalüüsi meetodid statistilised meetodid, kodeerimine Tulemused/järeldused kirjeldused, empiirilised üldistused, seaduspärasused,... K.Niglas Uuringutüüpide omavaheline seotus Empiiriline uuring Igas uuringu põhiskeemis on teatud alametappidel vajalik rakendada kõrvalolevatele uuringutüüpidele omaseid mõtlemis- või tegutsemisviise. näiteks on hea arendusuuringu lahutamatuks osaks valdkonnaga seotud teooriate läbitöötamine empiirilise andmestiku kogumine ja analüüs vajaduste selgekstegemise ja/või rakenduse testimise etapis Uurimisprobleem küsimus, hüpotees, eesmärk Valikumeetod juhuslik valim, üks juhtum, mitu juhtumit Andmekogumis meetod(id) struktureeritud ankeet, struktureerimata intervjuu,... Andmeanalüüsi meetodid statistilised meetodid, kodeerimine Tulemused/järeldused kirjeldused, empiirilised üldistused, seaduspärasused,... K.Niglas Andmekogumismeetodid Pilootuuring struktureeritud või poolstruktureeritud INTERVJUUD (küsitlused) psühholoogilisi ja sotsiaalseid aspekte mõõtvad TESTID (väärtushinnangute skaalad) DOKUMENTEERIMINE koondandmete talletamine struktureeritud või poolstruktureeritud ANKEEDID (küsimusbkud) (standardiseeritud) võimekus ja sooritustestid VAATLUS struktureerimata andmete kodeerimine - KONTENTANALÜÜS Testib idee toimet reaalsetes tingimustes, kuid vähendatud mahus. Küsimustiku uuringueelne kontrollimine Vähendab probleemide ja vigade tekkimist reaalse andmekogumise käigus Vähe vastajaid N: reklaamplakatid, loterii, soodushind esmalt ühes kaupluses, reklaami väljapanek ühes geograafilises piirkonnas Nende põhjal tehakse omakorda järeldused täiendamisvajaduse ning edasise rakendamise kohta kogu sihtturul. 3

Küsimustik Küsimustik Hea küsimustik on: selge sõnastusega, kergesti ja üheselt mõistetavate küsimustega, kompaktne ja kiiresti vastatav, vormistuselt korrektne; koostatud nii, et oleks minimiseeritud vastajate ja andmete töötlejate poolt potentsiaalselt tehtavate vigade hulk. Hoiduda tuleks sellistest küsimustest nagu: suunavad küsimused; teaduslikult täpse, kuid pika ja keeruka sõnastusega küsimused; mitmeti mõistetavad küsimused; ärritavad küsimused (sh küsimusega mittesobivad vastusevariandid). Küsimuste/mõõdikute kavandamisel mõtle ja otsi infot järgneva kohta: kas saab uuritavat nähtust mõõta otse või läbi indikaatori(te)? kas antud nähtust on eelnevates uuringutes mõõdetud ning kas vastav kirjandus on usaldusväärne? kas saab juba olemasolevaid mõõdikuid kohandada või tuleb välja töötada uued mõõdikud/küsimused? (pööra tähelepanu: kultuurilised ja kontekstuaalsed erinevused; võrreldavus eelnevate uuringute tulemustega, jne) kas peaks kasutama piloteerimist ning järelkontrolli? K.Niglas Üldine skeem Millest sõltub andmeanalüüsimeetodi valik? Sissejuhatavad, lihtsad küsimused KONTAKTI LOOMINE Küsimused teema kohta. k.a. kontrollküsimused, provotseerivad (spontaansuse suurendamiseks) Kommentaaride lisamisvõimalus Vähemalt lõpus! Taustaküsimused Ainult uuringu jaoks olulised! Küsimuse tüübist Uurimisküsimus: laiem Analüüsiküsimus: nt. kas kaks gruppi on erinevad/seotud? Andmete tüübist (väärtuste järjestatavus, skaalavahemike võrdsus) Nimitunnused Nimitunnuse väärtuseid ei saa järjestada, järjestustunnusel saab Järjestustunnused Arvtunnuse skaalavahemikud on võrdsed, järjestustunnusel mitte Arvtunnused Arvtunnuse korral saame arvutada keskväärtust, st.hälvet; binaarse tunnuse korral mitte Binaarsed tunnused Sihtrühmast Uurija teadmised/oskused Kellele esitab, kuidas? Tunnuse tüübid Nimitunnused Järjestustunnused Intervalltunnused Binaarsed tunnused Arvestame järjestatavust, skaalavahemike võrdsust Nimitunnuse väärtuseid ei saa järjestada Järjestustunnuste väärtuseid saab järjestada Skaalavahemikud ei ole võrdsed Skaalavahemikud on võrdsed Vähe erinevaid väärtuseid Palju võimalikke väärtuseid Kaks võimalikku väärtust Järjestatavus ja skaalavahemike võrdsus ei ole probleem Eeltöö andmestiku korrastamine Puuduvad väärtused - kui palju neid on, mida teha tühjade lahtritega? Andmesisestusvead Andmete grupeerimine (vajadusel) Skaalade pööramine (vajadusel) 4

15.02.14 Sugu Vanus! Kool Õppevaldkond Tegevusala! 5

15.02.14 Andmeanalüüsi vahendid! Kuivõrd aitasid praeguse töökoha saamisele kaasa: omandatud (pea)eriala/erialad Frequency Percent Valid Percent Cumulative Percent Valid Nõustun täiesti 1016 46.5 62.3 62.3 Pigem nõustun 352 16.1 21.6 83.8 Pigem ei nõustu 146 6.7 8.9 92.8 Ei nõustu üldse 118 5.4 7.2 100.0 Total 1632 74.7 100.0 Missing System 554 25.3 Total 2186 100.0 Andmeanalüüsi küsimus Esmane analüüs Eesmärk KIRJELDAV (esmane analüüs) VÕRDLEV (erinevused gruppide vahel) tekst tabel diagramm uuritava nähtuse süstemaatiline kirjeldamine protsentjaotuste ja keskväärtuste kaudu, tabelite ja graafikute vormis. Vaadeldakse vaid üksiktunnuseid Kõrvale jäetakse tunnuste omavahelised seosed. KIRJELDAV (esmane analüüs) KORRELATSIOON (seosed tunnuste vahel) VÕRDLEV (erinevused gruppide vahel) KORRELATSIOON (seosed tunnuste vahel) Esmane ülevaade andmetest Sagedustabel Frequency - vastajate arv Percent - osakaal Valid percent - osakaal mittepuuduvatest väärtustest Cumulative percent - kumulatiivne protsent vanuse_grupid Valid Kui suur osa õpilasi kasutab Facebooki iga päev?, Kas ja kui palju leidub neid õpilasi, kes Facebooki üldse ei kasuta? Mis on kõige tüüpilisem kasutussagedus ehk millise vastusevariantidest on valinud kõige suurem osa õpilastest?. Missing Total kuni 2 0 21-30 31-40 41-50 51-60 üle 6 1 Total System Frequency 43 147 174 162 160 181 867 15 882 Percent 4,9 16,7 19,7 18,4 18,1 20,5 98,3 1,7 100,0 Valid Percent 5,0 17,0 20,1 18,7 18,5 20,9 100,0 Cumulative Percent 5,0 21,9 42,0 60,7 79,1 100,0 6

Sagedustabel Tabeli (ridade) järjestamine Internetikasutuse osakaalud 2008.aastal erinevates riikides 6.-17.aastaste laste seas. Juhul kui tabelis toodud kategooriad ei ole sisuliselt tähenduslikus järjekorras, siis järjestatakse tabeli read sageduste/osakaalude järgi (Tabel 2B). Järelduse koostamine Järeldustes... Tabeli 10. põhjal näeme, et 15 vastajat (38,5%) hindas ettevalmistust ebapiisavaks; 9 vastajat (23,1%) enam-vähem piisavaks ning 15 vastajat (38,5%) täiesti piisavaks. Ei tohi liialdada ebamääraste väljenditega Enamasti Sageli Suuremas osas Harva Mõnikord Kohati. Need tekitavad küsimusi, kui sageli, kui harva, mis tingimustel jne. Paremad on täpsemad väljendid alla poole (46%) ligi kolmandikul juhtudest peaaegu kolmveerand näidetest jne. Statistiliste andmete esitamine Üldine reegel TEKSTI SEES TOODUD ARVUDENA Vali esitluseks diagramm, kui soovid eelkõige anda kiiret ülevaadet üldtendentsi(de)st ja suundumus(te)st ARVJOONISE e DIAGRAMMINA Esitlusviis peaks toetama parimal viisil tulemuste sisust kiiret ja õiget arusaamist ning olema kompaktne. TABELINA Vali arvulise info edastusviisiks tekst, kui korraga on vaja esitada vaid üks- kaks arvulist näitajat Vali esitluseks tabel, kui on vajalik anda edasi täpset arvulist infot või kui võrreldavate arvnäitajate suurusjärgud on väga erinevad TNS Emori läbiviidud heategevusliku käitumise uuringu tulemused. Milline nendest on parem viis andmete esitamiseks suulises ezekandes ja uurimistöö kirjalikus raporbs. 7

Andmete esitamine - tekstina Tulpdiagramm Vastajaid vähem kui 100 23.03.09 toimunud kirjeldava statistika osa eksamil osales 39 üliõpilast. Eksamil osalenud 39-st üliõpilasest ligi kolmandik (15) oli osalenud kõikides loengutes; kõikides praktikumides osalemise vastav arv oli 10. Soovi korral võib ülevaatlikkuse tõstmiseks sagedusele sulgudes lisada osakaalu Uuringus osales 17 inimest, kellest 4 (23%) olid teinud rahalisi annetusi eelmise aasta jooksul. Vastajaid rohkem kui 100 Seisuga 30 aprill 2007 on 1.6% vanemahüvitise saajatest mehed. Tulba kõrgus näitab vastajate arvu või protsenb * Võrdleb erinevaid kategooriaid * Pika teksb korral teljed ära vahetada * Tulbad võiks paigutada suuruse järjekorda (kui ei ole sisulist järjestust) Keda sooviksite näha järgmise peaministrina? Joondiagramm Ajas muutuvate andmete kirjeldamine tuhat Õppijaid haridusastmete järgi, 1996-2004 (aasta alguses, tuhat) 80 70 60 Kõrgharidus Turu- uuringute AS küsitles 16-17.02 telefoni teel 305 valimisõiguslikku EesB elanikku. Küsitluse valim on representabivne ning üldistatav valimisõiguslike EesB elanike suhtes. 50 40 30 20 10 0 1996 1997 1998 1999 2000 2001 2002 2003 2004 Üldkeskharidus (gümnaasiumiklassid) Kutseharidus Tulpdiagramm Histogramm Kirjeldavad arvnäitajad Keskmine tase Hajuvus Jaotuse kuju Mood Ulatus Asümmeetria Mediaan Kvartiilid Ekstsess Aritmeetiline keskmine Protsentiilid Geomeetriline keskmine Dispersioon Harmooniline keskmine Standardhälve Ruutkeskmine Kaalutud keskmine 8

Aritmeetiline keskmine e keskväärtus Ulatus e haar (Range)...võimaldab suurt hulka numbrilisi andmeid koondada ja välja tuua üldtendentse.... maksimaalse ja minimaalse väärtuse vahe e. vahemiku laius, milles andmed paiknevad Puuduseks tundlikkus äärmuslike väärtuste suhtes, kasutatakse eelkõige väikese hajuvuse korral keskväärtuse suhtes. Nt keskmine vanus 44 ei ütle midagi selle kohta, kui palju on alla 20- aastaseid. Milliste maakondade tulemused hajuvad kõige rohkem? Harjumaa Hiiumaa Ida- Viru Jõgevama Järvamaa Maximum Minimum Range 95 15 80 Lääne- Vi Mood ja mediaan muutuvad siis, kui esineb olulisi muutusi andmetes Läänemaa Põlvamaa 100 15 85 Aritmeetiline keskmine muutub siis, kui muutub kasvõi üks rea liige Pärnumaa Raplamaa 95 15 80 Saaremaa 95 10 85 Keskväärtus on võrreldes teiste näitajatega kõige stabiilsem Kõigile teada tuntud arvnäitaja (kõik teavad ja oskavad arvutada) + lihtsamini leitav - sõltub äärmistest väärtustest, mis võivad olla ekstreemsed!! Tartumaa Valgamaa Viljandi Võrumaa 100 0 100 100 15 85 100 0 100 Kvartiilid Karpdiagramm Kvartiilid jagavad variatsioonirea nelja võrdsesse ossa Kõige suurem väärtus 25% andmetest Ülemine kvarbil Mediaan 50% andmetest Alumine kvarbil 25% andmetest Kõige väiksem väärtus Standardhälve Standardhälve Kui palju üksikud tulemused erinevad keskmisest? Kui andmed on ühesugused => st.hälve=0 Mida rohkem nad erinevad => suurem on st.hälve Maximum Minimum Range Std Deviation 1.õppejõud M=2,6 SD=0,55 2.õppejõud M=2,6 SD=1,82 Harjumaa Harjumaa 21,86 Hiiumaa 95 15 80 Hiiumaa 17,81 Ida- Viru Jõgevama Ida- Viru Jõgevama 22,05 21,10 5 5 Järvamaa Lääne- Vi Läänemaa 100 15 85 Järvamaa Lääne- Vi Läänemaa 18,49 18,81 19,58 4 4 Põlvamaa Pärnumaa Põlvamaa Pärnumaa 19,74 20,05 3 3 Raplamaa Saaremaa 95 15 80 95 10 85 Raplamaa Saaremaa 17,61 18,38 2 2 Tartumaa Valgamaa 100 0 100 100 15 85 Tartumaa Valgamaa 22,27 20,41 1 1 Viljandi Võrumaa 100 0 100 Viljandi Võrumaa 20,40 21,19 0 1 2 3 4 5 0 1 2 3 4 5 9

asümmeetria PosiBivne asümmeetria (skewness) Jaotus on väljavenitatud paremalt poolt Jaotuse saba on paremal pool Skaalal väiksemaid väärtuseid rohkem asümmeetria NegaBivne asümmeetria (skewness) Jaotus on väljavenitatud vasakult poolt Jaotuse saba on vasakul poolt Skaalal suuremaid väärtuseid rohkem 1900 1910 1920 1930 1940 1950 1960 1950 1960 1970 1980 1990 2000 2010 Tulemuste esitamine Andmeanalüüsi küsimus Uurimuses osalejate kommunikatsiooniga rahulolu määra hindamiseks arvutati välja üldise kommunikatsiooniga rahulolu keskmine näitaja M=4,82 (SD=0,94), mida suurem on saadud tulemus, seda kõrgem on rahulolu tase (1 väga rahulolematu, 7 väga rahul). Keskmise põhjal võib väita, et uuringus osalenud inimesed on oma organisatsioonide kommunikatsiooniga keskmisest rahulolevamad.. tekst tabel diagramm VÕRDLEV (erinevused gruppide vahel) keskväärtuste kaudu proportsioonide kaudu KIRJELDAV (esmane analüüs) tekst tabel diagramm KORRELATSIOON (seosed tunnuste vahel) Erinevuste uurimine Erinevuste uurimine Keskväärtuste arvutamise kaudu Keskväärtuste kaudu Milline on vastajate keskmine sissetulek? Kas mehed või naised teenivad keskmiselt rohkem? Kuidas sõltub sissetuleku suurus omandatud haridustasemest?... 10

15.02.14 Erinevuste uurimine Erinevuste uurimine Kui keskväärtust arvutada ei saa Kui keskväärtust arvutada ei saa Tunnused: nimitunnus, binaarne tunnus, järjestustunnus Millise haridustasemega vastajate seas on enam lahutatud isikuid? võrdlev sagedustabel e RISTTABEL Millise haridustasemega vastajate seas on enam lahutatud isikuid? Andmeanalüüsi küsimus Korrelatsioonanalüüs Seose visuaalne hindamine tekst KIRJELDAV tabel (esmane analüüs) diagramm VÕRDLEV (erinevused gruppide vahel) keskväärtuste kaudu proportsioonide kaudu tekst tabel diagramm Seose analüütiline hindamine KORRELATSIOON (seosed tunnuste vahel) tekst tabel diagramm Korrelatsioonikordajad KORRELATSIOONANALÜÜS Pearson s r Standardiseeritud kahe tunnuse vahelise seose kordaja Pearsoni kordaja puudused lineaarne seos: tunneb punktipilve, mis on venitatud piki sirget. Kuidas on seotud vanus ja majapidamistöödeks kuluv aeg? Correlations vanus Tunde majapidamistöödeks (tööpäeviti) tundlik erandite suhtes: paar üksikut erandit väikeses valimis võivad kahekordistada kordaja väärtust. Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Tunde majapidami stöödeks vanus (tööpäeviti) 1,198**,,000 882 873,198** 1,000, 873 873 **. Correlation is significant at the 0.01 level (2-tailed). 11

15.02.14 Korrelatsioonikordajad korrelatsioonanalüüs Spearman s ρ MPAR korrelatsioonikordaja Astakkorrelatsioonikordaja intervalltunnused ei vasta normaaljaotusele (ka erandlikud väärtused) Järjestustunnus(ed) asendab väärtused järjekorranumbritega ning kasutab Pearsoni kordaja valemit => Spearmani kordaja < Pearsoni kordaja (üldjuhul) Spearmani kordaja Correlations Spearman's rho sissetulek viimasel kuul Tunde majapidamistöödeks (tööpäeviti) Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Tunde majapidami sissetulek stöödeks viimasel kuul (tööpäeviti) 1,000 -,357**,,000 829 821 -,357** 1,000,000, 821 873 **. Correlation is significant at the.01 level (2-tailed). Korrelatsioonikordajad Korrelatsioonikordajad Kendall s τ MPAR korrelatsioonikordaja Astakkorrelatsioonikordaja kui on vähe andmeid ja palju sarnaseid väärtuseid Cramer s V Nimitunnuste seose tugevuse uurimiseks. Kordaja ei näita seose suunda, ainult tugevust. N: Eriala ja tööl käimise seos V=,45 Phi 2x2 binaarsete tunnuste korral Ruutjuur hii-ruudu väärtuse jagatisest valimi suurusega Milline kordaja valida? Tulemuste esitamine KORDAJA ANDMED LISATINGIMUS PEARSON I + I Seose kuju lineaarne Erandlikud väärtused puuduvad (ei domineeri) SPEARMAN I + I, I + J, J + J Seose kuju ei ole lineaarne ja jaotusel on erandlikud väärtused (I + I) KENDALL J + J Väike valim ja palju sarnaseid väärtuseid CRAMER I + N, I + B, N + B, N + N, N + J, B + J Tõlgendatakse vaid seose tugevust, mize suunda PHI B + B Tõlgendatakse vaid seose tugevust, mize suunda Tajutud stressi taseme ja enesetõhususe vahelise suhte analüüsil ilmnes oluline negatiivne korrelatsioon, mille kohaselt madalama enesetõhususega õpetajad tajusid stressi kõrgemalt (r=-.37, p=. 010). Laste väliskeskkonna mängu ja vanemate soovide vahel ilmnes tugev negatiivne seos (r=-0,713; p=0,05), mille põhjal võib väita, et vanemate soov oma lapsi näha teatud tegevustes ja olemuses erineb sellest (ootused on lapse mängulisusele on kõrgemad), millised on lapsed väljas mängides tegelikult. 12