Oblasti izučavanja. IX.1. Osnove analize podataka. IX. Analiza podataka UVOD U ANALIZU PODATAKA 13/11/15

Σχετικά έγγραφα
Analiza varijanse sa jednim Posmatra se samo jedna promenljiva

numeričkih deskriptivnih mera.

Uvod u neparametarske testove

Izbor statističkih testova Ana-Maria Šimundić

Uvod u neparametarske testove

NEPARAMETRIJSKE TEHNIKE

3.1 Granična vrednost funkcije u tački

Testiranje statistiqkih hipoteza

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

Računarska grafika. Rasterizacija linije

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

Str

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

Elementi spektralne teorije matrica

Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom ANOVA 07/12/2017. Tehnike za analizu podataka. Multivarijacione tehnike

Računarska grafika. Rasterizacija linije

5. Karakteristične funkcije

ELEKTROTEHNIČKI ODJEL

Zavrxni ispit iz Matematiqke analize 1

41. Jednačine koje se svode na kvadratne

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

IX. Analiza podataka (2) IX.1. Diskriminaciona analiza MARKETINŠKO ISTRAŽIVANJE. Tehnike za analizu podataka. Multivarijacione tehnike

III VEŽBA: FURIJEOVI REDOVI

Teorijske osnove informatike 1

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

X. Testiranje hipoteza. Osnovni koncepti testiranja hipoteza TESTIRANJE HIPOTEZA OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI 19/11/15

Postoji nekoliko statidtičkih testova koji koriste t raspodelu, koji se jednim imenom zovu t-testovi.

Ispitivanje toka i skiciranje grafika funkcija

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Obrada signala

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

FTN Novi Sad Katedra za motore i vozila. Teorija kretanja drumskih vozila Vučno-dinamičke performanse vozila: MAKSIMALNA BRZINA

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

INTELIGENTNO UPRAVLJANJE

Populacija vs. uzorak - Opisivanje, ocenjivanje i testiranje. Jelena Marinković, maj 2012.

18. listopada listopada / 13

Mašinsko učenje. Regresija.

Regresija i korelacija

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

Klasifikacija blizu Kelerovih mnogostrukosti. konstantne holomorfne sekcione krivine. Kelerove. mnogostrukosti. blizu Kelerove.

SISTEMI NELINEARNIH JEDNAČINA

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Chi-kvadrat test. Chi-kvadrat (χ2) test

, i = 1, 2, n. Tabela 1 Koeficijent proste korelacije. Standardizovani regresioni koeficijent. Regresioni koeficijent b

FTN Novi Sad Katedra za motore i vozila. Teorija kretanja drumskih vozila Vučno-dinamičke performanse vozila: MAKSIMALNA BRZINA

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

Program testirati pomoću podataka iz sledeće tabele:

Statistiqki softver 4 Sedmi qas

Betonske konstrukcije 1 - vežbe 3 - Veliki ekscentricitet -Dodatni primeri

Inženjerska grafika geometrijskih oblika (5. predavanje, tema1)

APROKSIMACIJA FUNKCIJA

Dvanaesti praktikum iz Analize 1

Osnovne teoreme diferencijalnog računa

3. OSNOVNI POKAZATELJI TLA

STATIČKE KARAKTERISTIKE DIODA I TRANZISTORA

Kaskadna kompenzacija SAU

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

1 Afina geometrija. 1.1 Afini prostor. Definicija 1.1. Pod afinim prostorom nad poljem K podrazumevamo. A - skup taqaka

KVADRATNA FUNKCIJA. Kvadratna funkcija je oblika: Kriva u ravni koja predstavlja grafik funkcije y = ax + bx + c. je parabola.

NOMENKLATURA ORGANSKIH SPOJEVA. Imenovanje aromatskih ugljikovodika

Zadaci iz Osnova matematike

POTPUNO RIJEŠENIH ZADATAKA PRIRUČNIK ZA SAMOSTALNO UČENJE

RELATIVNI BROJEVI. r b

OM2 V3 Ime i prezime: Index br: I SAVIJANJE SILAMA TANKOZIDNIH ŠTAPOVA

Operacije s matricama

OSNOVI ELEKTRONIKE VEŽBA BROJ 1 OSNOVNA KOLA SA DIODAMA

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

I.13. Koliki je napon između neke tačke A čiji je potencijal 5 V i referentne tačke u odnosu na koju se taj potencijal računa?

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Autori: Dr Biljana Popović, redovni profesor Prirodno matematičkog fakulteta u Nišu Mr Borislava Blagojević, asistent Gradjevinskog fakulteta u Nišu

Grafičko prikazivanje atributivnih i geografskih nizova

9.1 Testovi hipoteza u statistici

KOMUTATIVNI I ASOCIJATIVNI GRUPOIDI. NEUTRALNI ELEMENT GRUPOIDA.

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Statističke metode. doc. dr Dijana Karuović

PRIMJER 3. MATLAB filtdemo

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

Analitička statistika Testiranje hipoteze.

Linearna algebra 2 prvi kolokvij,

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

Trigonometrijske nejednačine

Populacija Ciljna/uzoračka populacija

IZVODI ZADACI (I deo)

7 Algebarske jednadžbe

RIJEŠENI ZADACI I TEORIJA IZ

Statističko zaključivanje - testiranje hipoteza. Katedra za medicinsku statistiku i informatiku

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

SEMINAR IZ KOLEGIJA ANALITIČKA KEMIJA I. Studij Primijenjena kemija

Uvod Teorija odlučivanja je analitički i sistematski pristup proučavanju procesa donošenja odluka Bez obzira o čemu donosimo odluku imamo 6 koraka za

Transcript:

Oblasti izučavanja UVOD U ANALIZU PODATAKA I. Priroda i obuhvat marketinških istraživanja II. Izvori podataka u marketinškim istraživanjima III. Faze istraživačkog procesa IV. Eksploratorna istraživanja V. Deskriptivna istraživanja VI. Merenje stavova i dizajniranje upitnika VII. Uzročna istraživanja: Izvođenje eksperimenata VIII. Izvlačenje uzoraka, vrste uzoraka IX. Analiza podataka (1) X. Analiza podataka (2)... 2 IX. Analiza podataka 1. Osnove analize podataka 2. Testiranje hipoteza 3. Regresiona i korelaciona analiza IX.1. Osnove analize podataka Priprema podataka za analizu Tabeliranje podataka Faktori koji utiču na izbor za analizu podataka Pregled statističkih tehnika za analizu podataka 3 4 1

Editovanje podataka (1) Priprema podataka za analizu Editovanje podataka Kodiranje podataka Statističko prilagođavanje podataka Sprovodi anketar ili supervizor na terenu ili istraživač pre početka analize Treba identifikovati sledeće probleme: Greške anketara (daje loša/pogrešna uputstva) Nedostajući odgovori Nejasni odgovori (nečitki ili nejasni) Međusobna neusklađenost odgovora (npr. kontradiktorni) Nedovoljna kooperativnost (npr. bira isti odgovor) Neodgovarajući ispitanik 5 6 Editovanje podataka (2) Pošto se identifikuju, problemi se mogu rešiti primenom sledećih postupaka: Ponovno kontaktiranje ispitanika, ako se smatra značajnim Odbaciti ceo upitnik ako je neupotrebljiv, ako ispitanik nije razumeo anketu ili je bio nekooperativan Odbaciti pojedinačno problematično pitanje Kodirati nejasne odgovore u kategoriju ne znam ili nemam mišljenje Kodiranje Zatvorena pitanja Šta su zatvorena pitanja i kada se koriste? Prednosti i nedostaci zatvorenih pitanja Kodiranje zatvorenih pitanja Otvorena pitanja Šta su otvorena pitanja i kada se koriste? Prednosti i nedostaci otvorenih pitanja Kodiranje otvorenih pitanja? 7 8 2

Statističko prilagođavanje podataka Ponderisanje; Respecifikacija varijabli; Veštačke varijable; i Transformacija skale. Ponderisanje Procedura po kojoj se svakom odgovoru iz baze podataka, dodeljuje određeni broj (ponder) u skladu sa prethodno utvrđenim pravilom Koristi se da se postigne reprezentativnost uzorka reprezentativnost u odnosu na ono što se želi izmeriti Ili da se bolje izmeri određena karakteristika npr. ponderisanje tržišnim učešćem 9 10 Respecifikacija varijabli Procedura po kojoj se postojeći podaci modifikuju kako bi se formirale nove varijable da bi se bolje realizovali ciljevi istraživanja, npr. veliki broj varijabli se pregrupiše u manji broj računanje odnosa dve varijable da bi se formulisala nova varijabla, izvlačenje kvadratnog korena i logaritamske transformacije, korišćenje veštačkih varijabli. Veštačke varijable Nazivaju se još i instrumentalnim i kvalitativnim varijablama Respecifikacija kategorijske varijable Ako postoji m nivoa kvalitativne varijable, koristi se (m 1) veštačka varijabla da se oni specifikuju M-ta varijabla je definisana sa prethodnih m-1 Najlakše objasniti na dihotomnim (binarnim) varijablama koje imaju samo dva nivoa. 11 12 3

Transformacija skale Manipulacija sa vrednostima merne skale Da se obezbedi uporedivost, npr. Standardizacija se može primeniti samo na podacima koji su dati na intervalnoj ili skali odnosa Od svake realizovane vrednosti se oduzme srednja vrednost i podeli sa standardnom devijacijom z i = ( Xi X ) sx Tabeliranje podataka Raspored frekvencija Deskriptivni statistički pokazatelji Unakrsno tabeliranje 13 14 Tabeliranje podataka Koristi se za: Čišćenje podataka Određivanje empirijske raspodele (raspodele frekvencija) Izračunavanje deskriptivnih statističkih pokazatelja (srednje vrednosti i procentualno učešće) Zatim se podaci unakrsno tabeliraju kako bi se videlo da li postoji povezanost između dve tipično nominalne varijable. Primer: Koliko često kupujete Politiku Pol: Svaki dan Ni Muškarac 80 70 30 20 Žena 40 60 50 50 15 16 4

Raspored frekvencija Predstavlja broj dobijenih odgovora za svako postavljeno pitanje Može biti organizovano po klasama ili grupama odgovora Može se prikazati štapićastim dijagramom Mogu se prekombinovati grupe/kategorije pitanja, kako u zavisnosti od cilja istraživanja/ vrste odgovora tako i frekvencije odgovora u pojedinim kateogrijama Primer: Koliko često kupujete Politiku Pol: Mušk arac Svaki dan Ni Uk. 80 70 30 20 200 Žena 40 60 50 50 200 Uk. 120 130 80 70 17 18 Koliko često kupujete Politiku? Ni Svaki dan Žena Muškarac Deskriptivni statistički pokazatelji Predstavljaju sumarnu informaciju dobijenu na osnovnu rasporeda frekvencija. Mogu biti: Mere centralne tendencije (srednja vrednost, medijana, modus) Mere disperzije (interval varijacije, standardna devijacija, koeficijent varijacije) Mere oblika rasporeda (simetričnost i spljoštenost).,naravno, kod upotrebe nominalnih mernih skala može se koristiti samo raspored frekvencija. 0 20 40 60 80 100 19 20 5

Čebiševljeva teorema Određuje gde se vrednosti raspodele frekvencija nekog pokazatelja nalaze u odnosu na njegovu srednju vrednost. Bez obzira na raspored: 75% vrednosti će biti unutar intervala ± 2 standardne devijacije 89% vrednosti će biti u okviru ± 3 standardne devijacije u odnosu na srednju vrednost posmatranog parametra. Ako je raspored simetrična kriva u obliku zvona, onda: Oko 68% vrednosti u populaciji će biti u okviru ± 1 standardne devijacije Oko 95% vrednosti će biti u okviru ± 2 standardne devijacije Oko 99% vrednosti će se nalaziti u okviru ± 3 standardne devijacije u odnosu na srednju vrednost posmatranog parametra. Unakrsno tabeliranje Tehnika koja služi za posmatranje odnosa između dve i više nominalnih varijabli Kada se obračun vrši po redovima ili kolonama, tabele sa unakrsnim tabeliranjem se nazivaju tabele kontingencije, budući da su procenti suštinski uslovljeni ukupnim sumama po redovima ili kolonama. Najveći broj marketinških istraživanja ne ide dalje od unakrsnog tabeliranja, a čak i ona istraživanja koja koriste sofisticiranije analitičke metode još uvek koriste unakrsno tabeliranje kao važnu komponentu. 21 22 Primer: Koliko često kupujete Politiku? Pol: Svaki dan Ni Muškarac 80 70 30 20 Žena 40 60 50 50 Primer: Koliko često kupujete Politiku? Pol: Mušk arac Svaki dan Ni Uk. 80 70 30 20 200 Žena 40 60 50 50 200 Uk. 120 130 80 70 23 24 6

Koliko često kupujete Politiku? - Štapićasti dijagram - Ni Svaki dan Žena Muškarac Faktori koji utiču na izbor za analizu podataka Vrsta podataka Dizajn istraživanja Pretpostavke na kojima se bazira testiranje statističkih pokazatelja 0 20 40 60 80 100 25 26 Vrsta podataka Dizajn istraživanja (1) Podaci na nominalnoj skali (nemetrički): Frekvencije, jedina mera centralne tendencije je modus, hikvadrat test Podaci dati na ordinalnoj skali (nemetrički): Percentili, kao i najveći broj neparametarskih testova (neki put pogrešna primena parametarskih metoda) Podaci dati na intervalnoj i na skali odnosa (metrički): Srednja vrednost (aritmetička sredina), mere disperzije, mere oblika raspodele, i širok izbor parametarskih i neparametarskih testova Nezavisnost uzoraka, npr.: X O 1 ako se ne mere na istom skupu, koristi se O 2, t-test za razliku dve srednje vrednosti; ALI O 1 X O 2, ako su oba merenja na istom skupu onda se koristi t-test uparenih razlika. Broj grupa, npr.: X 1 O 1 postoje tri grupe i tri srednje vrednosti za X 2 O 2 poređenje, ne može t-test za razliku srednjih O 3 vrednosti, već analiza varijanse 27 28 7

Dizajn istraživanja (2) Broj varijabli, npr.: X O 1 gde su ovo dva merenja različitih varijabli i O 2, više se ne mogu koristiti univarijacione tehn. Kontrola nad uticajem varijabli 29 Pretpostavke na kojima se bazira testiranje statističkih pokazatelja Neophodno odlično poznavanje pretpostavki na kojima se pojedini testovi baziraju. Npr.: Pretpostavke t-testa, na osnovu dva uzorka sa istom σ, su: 1. Uzorci su nezavisni; 2. Karakteristike koje nas zanimaju za svaku populaciju imaju normalan raspored; 3. Dve populacije imaju jednake varijanse. t-test nije osetljiv na povredu pretpostavke o normalnom rasporedu, ali jeste na pretpostavku o jednakim varijansama. 30 Tehnike za analizu podataka Pregled statističkih tehnika za analizu podataka Univarijacione i multivarijacione Parametarske i neparametarske Tehnike zavisnosti i međuzavisnosti Univarijacione Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Multivarijacione 31 32 8

Univarijacione za analizu podataka Podaci su nemetrički (nominalna i ordinalna skala) Neparametarske statističke Podaci su metrički (intervalna i skala odnosa) Parametarske statističke 33 - Hi-kvadrat - Kolmogorov- Smirnov - RUNS Neparametarske analize podataka Postoji samo jedan uzorak Postoje dva ili više uzoraka Nezavisni uzorci - Hi-kvadrat - Suma rangova - Kolmogorov Smirnov - KW ANOVA Zavisni uzorci - Test znakova - Vilkoksov test - Meknimarov test - Kokranov Q- test 34 Parametarske statističke Postoji samo jedan uzorak Postoje dva ili više uzoraka Tehnike za analizu podataka - t-test - z-test - t-test - z-test - ANOVA Nezavisni uzorci Zavisni uzorci - Upareni t- test Univarijacione Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Multivarijacione 35 36 9

Multivarijacione Tehnike zavisnosti Tehnike međuzavisnosti Jedna zavisna varijabla Više zavisnih varijabli Fokus na varijablama Fokus na objektima - ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih efekata - MANOVA i MANCOVA - Kanonička korelacija - Faktorska analiza - Analiza skupina - Višedimenzionalno skaliranje 37 10