Oblasti izučavanja UVOD U ANALIZU PODATAKA I. Priroda i obuhvat marketinških istraživanja II. Izvori podataka u marketinškim istraživanjima III. Faze istraživačkog procesa IV. Eksploratorna istraživanja V. Deskriptivna istraživanja VI. Merenje stavova i dizajniranje upitnika VII. Uzročna istraživanja: Izvođenje eksperimenata VIII. Izvlačenje uzoraka, vrste uzoraka IX. Analiza podataka (1) X. Analiza podataka (2)... 2 IX. Analiza podataka 1. Osnove analize podataka 2. Testiranje hipoteza 3. Regresiona i korelaciona analiza IX.1. Osnove analize podataka Priprema podataka za analizu Tabeliranje podataka Faktori koji utiču na izbor za analizu podataka Pregled statističkih tehnika za analizu podataka 3 4 1
Editovanje podataka (1) Priprema podataka za analizu Editovanje podataka Kodiranje podataka Statističko prilagođavanje podataka Sprovodi anketar ili supervizor na terenu ili istraživač pre početka analize Treba identifikovati sledeće probleme: Greške anketara (daje loša/pogrešna uputstva) Nedostajući odgovori Nejasni odgovori (nečitki ili nejasni) Međusobna neusklađenost odgovora (npr. kontradiktorni) Nedovoljna kooperativnost (npr. bira isti odgovor) Neodgovarajući ispitanik 5 6 Editovanje podataka (2) Pošto se identifikuju, problemi se mogu rešiti primenom sledećih postupaka: Ponovno kontaktiranje ispitanika, ako se smatra značajnim Odbaciti ceo upitnik ako je neupotrebljiv, ako ispitanik nije razumeo anketu ili je bio nekooperativan Odbaciti pojedinačno problematično pitanje Kodirati nejasne odgovore u kategoriju ne znam ili nemam mišljenje Kodiranje Zatvorena pitanja Šta su zatvorena pitanja i kada se koriste? Prednosti i nedostaci zatvorenih pitanja Kodiranje zatvorenih pitanja Otvorena pitanja Šta su otvorena pitanja i kada se koriste? Prednosti i nedostaci otvorenih pitanja Kodiranje otvorenih pitanja? 7 8 2
Statističko prilagođavanje podataka Ponderisanje; Respecifikacija varijabli; Veštačke varijable; i Transformacija skale. Ponderisanje Procedura po kojoj se svakom odgovoru iz baze podataka, dodeljuje određeni broj (ponder) u skladu sa prethodno utvrđenim pravilom Koristi se da se postigne reprezentativnost uzorka reprezentativnost u odnosu na ono što se želi izmeriti Ili da se bolje izmeri određena karakteristika npr. ponderisanje tržišnim učešćem 9 10 Respecifikacija varijabli Procedura po kojoj se postojeći podaci modifikuju kako bi se formirale nove varijable da bi se bolje realizovali ciljevi istraživanja, npr. veliki broj varijabli se pregrupiše u manji broj računanje odnosa dve varijable da bi se formulisala nova varijabla, izvlačenje kvadratnog korena i logaritamske transformacije, korišćenje veštačkih varijabli. Veštačke varijable Nazivaju se još i instrumentalnim i kvalitativnim varijablama Respecifikacija kategorijske varijable Ako postoji m nivoa kvalitativne varijable, koristi se (m 1) veštačka varijabla da se oni specifikuju M-ta varijabla je definisana sa prethodnih m-1 Najlakše objasniti na dihotomnim (binarnim) varijablama koje imaju samo dva nivoa. 11 12 3
Transformacija skale Manipulacija sa vrednostima merne skale Da se obezbedi uporedivost, npr. Standardizacija se može primeniti samo na podacima koji su dati na intervalnoj ili skali odnosa Od svake realizovane vrednosti se oduzme srednja vrednost i podeli sa standardnom devijacijom z i = ( Xi X ) sx Tabeliranje podataka Raspored frekvencija Deskriptivni statistički pokazatelji Unakrsno tabeliranje 13 14 Tabeliranje podataka Koristi se za: Čišćenje podataka Određivanje empirijske raspodele (raspodele frekvencija) Izračunavanje deskriptivnih statističkih pokazatelja (srednje vrednosti i procentualno učešće) Zatim se podaci unakrsno tabeliraju kako bi se videlo da li postoji povezanost između dve tipično nominalne varijable. Primer: Koliko često kupujete Politiku Pol: Svaki dan Ni Muškarac 80 70 30 20 Žena 40 60 50 50 15 16 4
Raspored frekvencija Predstavlja broj dobijenih odgovora za svako postavljeno pitanje Može biti organizovano po klasama ili grupama odgovora Može se prikazati štapićastim dijagramom Mogu se prekombinovati grupe/kategorije pitanja, kako u zavisnosti od cilja istraživanja/ vrste odgovora tako i frekvencije odgovora u pojedinim kateogrijama Primer: Koliko često kupujete Politiku Pol: Mušk arac Svaki dan Ni Uk. 80 70 30 20 200 Žena 40 60 50 50 200 Uk. 120 130 80 70 17 18 Koliko često kupujete Politiku? Ni Svaki dan Žena Muškarac Deskriptivni statistički pokazatelji Predstavljaju sumarnu informaciju dobijenu na osnovnu rasporeda frekvencija. Mogu biti: Mere centralne tendencije (srednja vrednost, medijana, modus) Mere disperzije (interval varijacije, standardna devijacija, koeficijent varijacije) Mere oblika rasporeda (simetričnost i spljoštenost).,naravno, kod upotrebe nominalnih mernih skala može se koristiti samo raspored frekvencija. 0 20 40 60 80 100 19 20 5
Čebiševljeva teorema Određuje gde se vrednosti raspodele frekvencija nekog pokazatelja nalaze u odnosu na njegovu srednju vrednost. Bez obzira na raspored: 75% vrednosti će biti unutar intervala ± 2 standardne devijacije 89% vrednosti će biti u okviru ± 3 standardne devijacije u odnosu na srednju vrednost posmatranog parametra. Ako je raspored simetrična kriva u obliku zvona, onda: Oko 68% vrednosti u populaciji će biti u okviru ± 1 standardne devijacije Oko 95% vrednosti će biti u okviru ± 2 standardne devijacije Oko 99% vrednosti će se nalaziti u okviru ± 3 standardne devijacije u odnosu na srednju vrednost posmatranog parametra. Unakrsno tabeliranje Tehnika koja služi za posmatranje odnosa između dve i više nominalnih varijabli Kada se obračun vrši po redovima ili kolonama, tabele sa unakrsnim tabeliranjem se nazivaju tabele kontingencije, budući da su procenti suštinski uslovljeni ukupnim sumama po redovima ili kolonama. Najveći broj marketinških istraživanja ne ide dalje od unakrsnog tabeliranja, a čak i ona istraživanja koja koriste sofisticiranije analitičke metode još uvek koriste unakrsno tabeliranje kao važnu komponentu. 21 22 Primer: Koliko često kupujete Politiku? Pol: Svaki dan Ni Muškarac 80 70 30 20 Žena 40 60 50 50 Primer: Koliko često kupujete Politiku? Pol: Mušk arac Svaki dan Ni Uk. 80 70 30 20 200 Žena 40 60 50 50 200 Uk. 120 130 80 70 23 24 6
Koliko često kupujete Politiku? - Štapićasti dijagram - Ni Svaki dan Žena Muškarac Faktori koji utiču na izbor za analizu podataka Vrsta podataka Dizajn istraživanja Pretpostavke na kojima se bazira testiranje statističkih pokazatelja 0 20 40 60 80 100 25 26 Vrsta podataka Dizajn istraživanja (1) Podaci na nominalnoj skali (nemetrički): Frekvencije, jedina mera centralne tendencije je modus, hikvadrat test Podaci dati na ordinalnoj skali (nemetrički): Percentili, kao i najveći broj neparametarskih testova (neki put pogrešna primena parametarskih metoda) Podaci dati na intervalnoj i na skali odnosa (metrički): Srednja vrednost (aritmetička sredina), mere disperzije, mere oblika raspodele, i širok izbor parametarskih i neparametarskih testova Nezavisnost uzoraka, npr.: X O 1 ako se ne mere na istom skupu, koristi se O 2, t-test za razliku dve srednje vrednosti; ALI O 1 X O 2, ako su oba merenja na istom skupu onda se koristi t-test uparenih razlika. Broj grupa, npr.: X 1 O 1 postoje tri grupe i tri srednje vrednosti za X 2 O 2 poređenje, ne može t-test za razliku srednjih O 3 vrednosti, već analiza varijanse 27 28 7
Dizajn istraživanja (2) Broj varijabli, npr.: X O 1 gde su ovo dva merenja različitih varijabli i O 2, više se ne mogu koristiti univarijacione tehn. Kontrola nad uticajem varijabli 29 Pretpostavke na kojima se bazira testiranje statističkih pokazatelja Neophodno odlično poznavanje pretpostavki na kojima se pojedini testovi baziraju. Npr.: Pretpostavke t-testa, na osnovu dva uzorka sa istom σ, su: 1. Uzorci su nezavisni; 2. Karakteristike koje nas zanimaju za svaku populaciju imaju normalan raspored; 3. Dve populacije imaju jednake varijanse. t-test nije osetljiv na povredu pretpostavke o normalnom rasporedu, ali jeste na pretpostavku o jednakim varijansama. 30 Tehnike za analizu podataka Pregled statističkih tehnika za analizu podataka Univarijacione i multivarijacione Parametarske i neparametarske Tehnike zavisnosti i međuzavisnosti Univarijacione Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Multivarijacione 31 32 8
Univarijacione za analizu podataka Podaci su nemetrički (nominalna i ordinalna skala) Neparametarske statističke Podaci su metrički (intervalna i skala odnosa) Parametarske statističke 33 - Hi-kvadrat - Kolmogorov- Smirnov - RUNS Neparametarske analize podataka Postoji samo jedan uzorak Postoje dva ili više uzoraka Nezavisni uzorci - Hi-kvadrat - Suma rangova - Kolmogorov Smirnov - KW ANOVA Zavisni uzorci - Test znakova - Vilkoksov test - Meknimarov test - Kokranov Q- test 34 Parametarske statističke Postoji samo jedan uzorak Postoje dva ili više uzoraka Tehnike za analizu podataka - t-test - z-test - t-test - z-test - ANOVA Nezavisni uzorci Zavisni uzorci - Upareni t- test Univarijacione Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Multivarijacione 35 36 9
Multivarijacione Tehnike zavisnosti Tehnike međuzavisnosti Jedna zavisna varijabla Više zavisnih varijabli Fokus na varijablama Fokus na objektima - ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih efekata - MANOVA i MANCOVA - Kanonička korelacija - Faktorska analiza - Analiza skupina - Višedimenzionalno skaliranje 37 10