Oblasti izučavanja. VIII.1. Osnovni principi izvlačenja uzoraka. VIII. Izvlačenje uzoraka IZVLAČENJE UZORAKA 04/12/2014

Oblasti izučavanja IZVLAČENJE UZORAKA 1. Priroda i obuhvat marketinških istraživanja 2. Izvori podataka u marketinškim istraživanjima 3. Faze istraživačkog procesa 4. Eksploratorna istraživanja 5. Deskriptivna istraživanja 6. Merenje stavova i dizajniranje upitnika 7. Uzročna istraživanja: Izvođenje eksperimenata 8. Izvlačenje uzoraka, vrste uzoraka 9. Analiza podataka 2 VIII. Izvlačenje uzoraka 1. Osnovni principi izvlačenja uzoraka Izvlačenje slučajnih uzoraka Izvlačenje neslučajnih uzoraka 2. Veličina uzorka i statistička teorija VIII.1. Osnovni principi izvlačenja uzoraka Osnovni pojmovi Izvlačenje slučajnih uzoraka Izvlačenje neslučajnih uzoraka 3 4 1

Pojmovi Osnovni pojmovi Populacija skup svih objekata koji poseduju određene zajedničke karakteristike u odnosu na konkretan problem marketinškog istraživanja Popis kada se zatraže odgovori od svih ispitanika u okviru populacije Parametar pokazatelj do koga se dođe na osnovu popisa Statistički pokazatelji uzorka, ili statistika informacije (pokazatelj) do kojih se dođe na osnovu podskupa populacije 5 6 Dobar uzorak Uzorak ili popis...reprezentuje ciljnu populaciju osnovni skup...je biran na slučajan način, tj. poznate su verovatnoće izbora...je dovoljno veliki da rezultati budu pouzdani Kada se treba opredeliti za popis? Ako je sama veličina populacije mala Informacije potrebne od svakog člana populacije Visoki troškovi donošenja pogrešne odluke Postoji mogućnost velikih grešaka u izvlačenju uzorka Kada se treba opredeliti za izvlačenje uzorka? Velika populacija, visoki troškovi i potrebno vreme Veća kontrola kvaliteta Posebno kod homogenih populacija Kada popis jednostavno nije moguć 7 8 2

OSNOVI ZADATAK UZORKA UZORAK TREBA/MORA DA BUDE SLIKA CILJNE POPULACIJE on to jeste bez velikih problema samo kada je uzorak samoponderišući ako nije onda mora da se ponderacijom rezultat merenja na uzorku svede na sliku populacije Uzorak i populacija: U čemu je problem? Na osnovu jednog dela zaključujemo o celom Kada bi celo u svim delovima bilo isto, bilo bi svejedno iz kog dela uzimamo uzorak na osnovu koga zaključujemo o celom Sva zanimljiva pitanja i sva važna saznanja i u nauci i u svakodnevnom životu su ona koja potiču od razlika 9 10 Greške vezane za prikupljanje podataka uzorkom Razlika između stvarne vrednosti (u populaciji) i opservirane vrednosti (u uzorku) Uzoračka greška razlika je isključivo posledica izvlačenja uzorka Smanjuju se povećanjem uzorka, ali po cenu sve teže kontrole kvaliteta istraživanja, pa se povećavaju neuzoračke greške Neuzoračke greške i u popisu i uzorku (npr. greške u merenju, evidentiranju, analizi, neodgovora) Proizilaze iz različitih izvora, teže se identifikuju i kontrolišu, pa je njihovo smanjivanje prioritetnije Proces izvlačenja uzorka 1. Identifikovanje ciljne populacije 2. Određivanje uzoračkog okvira 3. Prevazilaženje razlika 4. Izbor postupka izvlačenja uzorka 5. Određivanje odgovarajuće veličine uzorka 6. Dobijanje informacija od ispitanika 7. Definisanje odnosa prema onima što se nisu odazvali 8. Generisanje informacija za potrebe donošenja odluka 11 12 3

Određivanje ciljne populacije Utvrđivanje uzoračkog okvira Proces identifikacije (potencijalnih) elemenata uzorka - uzoračkih jedinica i područja pokrivenosti: 1. Obratite pažnju na ciljeve istraživanja 2. Razmotrite alternative 3. Upoznajte svoje tržište 4. Razmotrite odgovarajuću uzoračku jedinicu 5. Jasno navedite šta nije obuhvaćeno 6. Ne preterujte sa definisanjem 7. Formulišite definiciju za višekratnu upotrebu 8. Razmotrite posebne pogodnosti 13 Uzorački okvir je spisak članova populacije koji se koristi za dobijanje uzorka Sastavljanje spiskova za F2F Sastavljanje spiskova za telefonsko (CATI) intervjuisanje Prevazilaženje razlika između uzoračkog okvira i populacije tri problema 1. Problem podskupa 2. Problem nadskupa 3. Problem nepreklapanja 14 Izbor postupka za izvlačenje uzorka Izvlačenje slučajnih uzoraka Prost slučajan uzorak Stratifikovan uzorak Sistematski uzorak Uzorak skupina Višeetapni uzorak Izvlačenje neslučajnih uzoraka Na osnovu vrednosnog suda Na osnovu pogodnosti prigodan uzorak Na bazi kvota - kvotni uzorak Na principu grudve snega (koja se kotrlja) Uzorak tipičnih Izvlačenje slučajnih uzoraka Prost slučajan uzorak Stratifikovan uzorak Sistematski uzorak Uzorak skupina Višeetapni uzorak 15 16 4

Prost slučajan uzorak Postoji podjednaka verovatnoća da će biti izabran bilo koji član populacije, a time i svaki mogući uzorak (tablice slučajnih brojeva...). Razlikuje se sa i bez vraćanja SRSWR i SRSWoR Uzorak se izvlači na osnovu spiska (iz okvira) Balans između tačnosti i troškova povećanje efikasnosti izvlačenja uzorka (ovo je opšte pravilo o kome se vodi računa) zadržavanje istog nivoa tačnosti uz smanjenje troškova, zadržavanje istih troškova uz povećanje tačnosti, brže povećanje tačnosti od povećanja troškova i sporije smanjenje tačnosti od smanjenja troškova. Stratifikovani uzorak (1) Za unapređenje efikasnost izvlačenja uzorka se koriste informacije o podgrupama uzoračkog okvira Poboljšana efikasnost izvlačenja uzorka tako što tačnost raste brže od troškova Postupak izvlačenja u dva koraka U izradi plana izvlačenja uzorka treba potražiti prirodne podgrupe koje će biti homogenije od cele populacije, tzv. stratumi Idealno je da postoje velike razlike između, a velika sličnost unutar stratuma postiže se veća tačnost 17 18 Stratifikovan uzorak (2) Uzorak skupina Homogenost unutar grupa Heterogenost između grupa Sve grupe su uključene Glavna razlika stratifikovanih uzoraka je u izboru veličine uzorka u okviru svake grupe: 1. Proporcionalni startifikovani uzorak 1. Direktno proporcionalni stratifikovani uzorak 2. Obrnuto proporcionalan stratifikovani uzorak 2. Neproporcionalni stratifikovani uzorak 19 Efikasnost izvlačenja uzorka se povećava tako što se troškovi smanjuju brže nego tačnost Postupak izvlačenja uzorka u dva koraka Populacija se deli na podgrupe skupine Heterogenost unutar, a homogenost između Bira se slučajan uzorak skupina, a opserviraju svi Korisno kada se mogu identifikovati reprezentativne podgrupe Dobijaju se relativno neprecizni uzorci jer se heterogene skupine relativno teško formiraju 20 5

Sistematski uzorak Sistematski se bira svaka J-ta osoba na spisku, dok se prva bira slučajno na intervalu (1, J) Efikasnost izvlačenja uzorka se povećava smanjenjem troškova uz očuvanje tačnosti. Ali efikasnost zavisi od redosleda na spisku: Ako je spisak sastavljen slučajno tačnost je ista kao kod prostog slučajnog uzorka Ako su elementi na spisku poređani u monotonom redosledu, tačnost će biti veća Ako su elementi poređani po cikličnom redosledu treba voditi računa o koraku (J) i periodu ciklusa Višeetapni dizajn: Primer uzorka područja 1. Formiranje uzorka skupina okruga Verovatnoća da neki okrug bude uključen u uzorak skupina je proporcionalna broju njegovih stanovnika 2. Dobijanje uzorka skupina gradova iz svakog odabranog okruga Verovatnoća da će grad biti izabran je proporcionalna njegovoj veličini 3. Izbor uzorka skupina blokova u svakom gradu Svaki blok se ponderiše brojem jedinica stanovanja 4. Sistematski uzorak stanova u svakom bloku i izvlači slučajan uzorak stanara svake jedinice Stanari koji žive sami imaju veću verovatnoću izbora! 21 22 INPUT Greška uzorka SRSWoR, P=0.95, n=700, N=3M, err= +/- 1.6 na 5% Cluster, P=0.95, n=700, N=3M, err= +/- 2.8 na 5% FORMULA za račun uzoračke greške Incidencija Veličina n Dizajn efekt Populacija N 5 700 3.0 300000 OUTPUT C.I. 95% C.I. 99% C.I. donja 2.21 1.32 C.I. gornja 7.79 8.68 Estimation of SD 1.42 Estimation of 1.96*SD 2.78 Relative error 28.4 SMMRI Izvlačenje neslučajnih uzoraka Na osnovu pogodnosti Na osnovu vrednosnog suda Na bazi kvota U vidu grudve snega Istraživanje for all additional tržišta questions ask on dragisab@smmri.com23 24 6

Izvlačenje neslučajnih uzoraka Nema potrebe za uzoračkim okvirom Nema mogućnosti da se odredi preciznost Rezultati sadrže skrivene pristrasnosti i neizvesnosti, što je gore nego kada se one znaju Koristi se u situacijama kao što su: 1. Eksplorativne faze istraživačkog projekta 2. Pred-testiranje upitnika 3. Postojanje homogene populacije 4. Slučajevi kada istraživač nema statističko znanje 5. Kada je potrebno da se posao što pre obavi Vrste neslučajnih uzoraka 1. Uzorci na bazi vrednosnih sudova 2. Uzorak formiran po principu grudve snega 3. Prigodan uzorak 4. Kvotni uzorak 5. Uzorak tipičnih 25 26 Uzorci na bazi vrednosnih sudova Ekspert na osnovu sopstvenog suda identifikuje reprezentativne uzorke Veliki broj manje ili više očiglednih grešaka Ipak postoje situacije kada je preporučljivo: Izvlačenje slučajnih uzoraka fizički nije moguće ili je preterano skupo Ako uzorak treba da bude veoma mali (npr. 10) ovaj uzorak će često biti pouzdaniji od slučajnog uzorka Ponekad je korisno dobiti namerno pristrasan uzorak npr. ako se izmena proizvoda ne sviđa grupi onih koji bi inače njoj bili naklonjeni, onda... Uzorak formiran po principu grudve snega Vrsta uzorka na bazi vrednosnog suda koja je izuzetno podesna kada treba doći do malih, posebnih populacija Prvo se identifikuje jedan (ili više) član posebne populacije, koji zatim navede drugog, itd. Može se primeniti kad god treba dopreti do neke male populacije Postoji verovatnoća da će se izabrati one osobe koje su u društvenom smislu primetnije 27 28 7

Prigodni uzorak Kontaktiranje pogodnih uzoračkih jedinica Deluje neodbranjivo, što u apsolutnom smislu i jeste Ipak informacije treba oceniti ne u apsolutnom smislu već u kontekstu odlučivanja Korisno kao brza reakcija na prelim. koncept proizv. ili usluge, da li treba dalje da se razvija Nije pogodan kada pristrasnost rezultata može da ima ozbiljne ekonomske posledice, osim ako se te pristrasnosti ne mogu identifikovati Kvotni uzorak Zasnovan na vrednosnom sudu, ali uključuje minimalan broj za svaku podgrupu u populaciji Često se zasniva na demografskim podacima (geografska lokacija, starost, pol, obraz, prihod) Tako je uzorak uparen sa populacijom Time se eliminišu mnoge ozbiljne pristrasnosti Ipak ispitivači će kontaktirati one do kojih će lakše doći, koji imaju vremena, simpatični,..., što svakako uvodi pristrasnosti u rezultat 29 30 Uzorak tipičnih Određuju se karakteristike ispitanika čiji se stavovi žele istražiti ( tipični predstavnik) Formuliše se trijažni upitnik da se isti identifikuju Izbor u kvazi-slučajnoj proceduri, da se rasprši uzorak Važno je da se ispitanici međusobno ne poznaju da ne bude interakcija u grupnom razgovoru Obavezno se pravi ponovna trijaža pred sam ulazak u diskusionu grupu (risk-screening) Fokus-grupe 8 tipičnih predstavnika nekog mišljenja ili posebnih grupa Veći broj grupa... obavezno Pronalaženje različitih stavova i ulaženje u motive određenog stava, ali ne i ocenjivanje proporcije prisustva stava (nema generalizacije) Veoma važna dobra selekcija ispitanika Radi kao pokvarena ploča Veza za internet Jednostrano ogledalo 31 32 8

04/12/2014 Responsmetrija: 20 do 25 ljudi gleda govor ili reklamne spotove ili javne nastupe političara i snimaju se reakcije Problemi neodgovora Neodgovor usled toga što pojedinci: 1. 2. 3. 4. Kao i za FGD ispituju se tipični 33 Baziraju se na presretanju kupaca, preko 32% svih popunjenih upitnika ili intervjua kupaca u SAD se odnose na intervjue u prodavnicama Javljaju se ozbiljni problemi u vezi sa uzorkom Jedno od ograničenja je pristrasnost kao posledica metoda korišćenog za izbor uzorka 1. 2. 3. 4. Izbor tržnog centra Izbor dela tržnog centra u kome se kupci presreću Doba dana kada se obavlja intervjuisanje Oni koji češće odlaze u kupovinu imaju veću verovatnoću izbora Pristupi smanjenju pristrasnosti usled neodgovora: 1. Unapređenje dizajna istraživanja 2. Ponovno kontaktiranje 3. Procena efekta neodgovora Izvlačenje uzorka u tržnim centrima (1) Odbijaju da odgovore, Nisu sposobni da odgovore, Nisu kod kuće, i Nisu dostupni. 35 34 Izvlačenje uzorka u tržnim centrima (2) 1. Izbor tržnog centra za reprezentativnost: 2. Pre svega se odnosi na domaćinstva koja žive u blizini, pa je demografija okoline važna Uzeti nekoliko gradova sa različitim karakteristikama Lokacije izvlačenja uzorka unutar tržnog centra 3. Stratifikovanje ulazne lokacije, kombinacija ponderisanih stratuma (frekvencijom lokacije) Vreme izvlačenja uzorka 4. Stratifikacija po vremenskim segmentima (radni dani, večeri, vikendi) uz ponderaciju Izvlačenje uzoraka ljudi, nasuprot poseta tržnom centru Podjednako obuhvatiti one koji kupuju često i retko, pa se može postiviti pitanje koliko često dolazite, za ponder 36 9

Kako prevazići nepostojanje okvira? Izbor postupka za izvlačenje uzoraka Nekoliko pitanja VIŠEFAZNA PROCEDURA Npr. za anketu mešovitih radnji ili preduzeća koja imaju interni restoran nekog tipa Izbor (PPS Probability Proportional to Size sa verovatnoćom proporcionalnom nekom poznatom parametru) jedinica prve faze, npr. mesnih zajednica Popis - pobrojavanje svih elemenata Izbor sa poznatom (npr. SRSWoR) verovatnoćom u trećoj fazi 37 38 Koliko je važan trenutak? Nestabilnost subjektivnih stavova i procena => Rezultati se ponekad menjaju iz nedelje u nedelju Najpouzdaniji su trendovi 39 Najčešća pitanja: 1. Da li je uzorak reprezentativan za populaciju? (treba pitati za koji fenomen u populaciji je reprezentativan) 2. Kolika je veličina uzorka? (ne garantuje uspeh samo veličina ona smanjuje varijansu ali pristrasnost ostaje čak postaje OPASNIJA) A treba dati i odgovor: 1. Kolika je uzoračka greška i interval poverenja? (n=1500 5% je sa verovatnoćama 0,95 izmedju 3,9 i 6,1!) 2. Šta je okvir (sasečenost) koji se ocenjuje? (skoro nikada! se nema cela populacija a. popis ima grešku pokrivanja 1% do 3%, b. neregistrovana naselja...) 3. Koji su još izvori grešaka i kako su kontrolisani 40 10

Rezultati i interpretacija rezultata 1. Pogađanje, prognoza ili merenje? 2. Otkud razlike u rezultatima? Objašnjivo - prihvatljivo: uzorak, upitnik, momenat Opasno neprihvatljivo neadekvatnost METODOLOGIJE neprepoznavanje metodologije Pitanje veličine uzorka Praktično pitanje u marketinškim istraživanjima Istraživanje se ne može ni planirati ni sprovesti ako se ne zna veličina uzorka Ispravno određena veličina uzorka pruža dragocene informacije za donošenje razumnih odluka Direktno je povezana sa troškovima istraživanja Praktični (ad hoc) pristupi koji se koriste Formalni pristup za određivanje veličine uzorka: Pojmovi: karakteristike populacije, karakteristike uzorka, pouzdanost uzorka, interval ocene 41 42 Ad hoc metodi za određivanje veličine uzorka Iskustvena pravila Sadman: svaka grupa min 100 članova, podgrupa 20 do 50, neproporcionalni uzorak Budžetska ograničenja Uporediva istraživanja Faktori koji određuju veličinu uzorka: 1. Broj podgrupa ili grupa za analizu, 2. Vrednost potrebnih informacija i potrebna tačnost, 3. Troškovi izvlačenja uzorka, i 4. Varijabilnost populacije. Karakteristike populacije - PARAMETRI Populacijska srednja vrednost, µ Populacijska varijansa, σ 2 Populacijska standardna devijacija, σ 43 44 11

Karakteristike uzorka STATISTIČKI POKAZATELJI UZORKA n X i Uzoračka srednja vrednost Uzoračka varijansa Uzoračka standardna devijacija X = 1 n s 2 = 1 n 1 i i=1 ( X i X ) s = s 2 2 Pouzdanost uzorka pojam standardne greške X Varijacija u vrednosti greškom: σ = σ X X se meri svojom standardnom n veličina uzorka Intuitivno, varijacije u vrednosti X će biti veće ukoliko je veća populacijska varijansa, σ 2 Isto tako, povećanje veličine uzorka bi trebalo da smanjuje varijacije u X Stoga se standardna greška menja sa n n 45 46 Pouzdanost uzorka verovatnoće raspodele (1) Varijabla X ima normalan raspored Pretpostavlja se i da će varijacije uzoračke srednje vrednosti slediti normalan raspored X bi trebalo da bude blizu µ, i podjednako je verovatno da će biti veće ili manje od µ Verovatnoća da se X nalazi na rastojanju 1,96 σ X u odnosu na µ iznosi 0,95 Oko 95% uzoračkih srednjih vrednosti, X će biti u okviru ±1,96 standardne greške u odnosu na µ Verovatnoća je 0,90 da će se X nalaziti u okviru rastojanja 1,64 od populacijske srednje vrednosti, µ σ X 47 Pouzdanost uzorka verovatnoće raspodele (2) Čest izvor zabune je to što se ovde razmatraju dva potpuno odvojena rasporeda verovatnoće Prvi je raspored odgovora populacije, X, koga karakterišu populacijska srednja vrednost, µ, i populacijska standardna devijacija, σ Drugi je raspored X, uzorački raspored, čiju dispreziju pokazuje σ X Da bi se konceptualizovao ovaj raspored potrebno je da se zamisli veliki broj ponavljanja izvlačenja uzoraka 48 12

04/12/2014 Intervalne ocene (1) Uzoračka srednja vrednost X se koristi za ocenu nepoznate populacijske srednje vrednosti, µ Kako X ima drugačiju vrednost za svaki uzorak, ona nikad nije jednaka µ, već se javlja uzoračka greška, pa se ocena daje u intervalu: X ± uzoračka greška = intervalna ocena µ Veličina intervala zavisi od nivoa poverenja Za nivo poverenja od 95, intervalna ocena koja sadrži stvarnu populacijsku srednju vrednost je X ± 2σX = X ± 2σX 49 n 50 Intervalne ocene (2) Intervalne ocene (3) Ako populacijska standardna devijacija nije poznata, potrebno je da se oceni korišćenjem uzoračke standardne devijacije Intervalna ocena na nivou poverenja od 95%: X ± 2 s n = 95% interval poverenja ocene sa nepoznatim σ Zapravo, korišćenje s dodatno unosi neizvesnost, u interval poverenja ocene, za malu veličinu uzorka i za preciznu ocenu ovo se prilagođava korišćenjem trasporeda 51 Intervalna ocena populacijske sr vrednosti je: X ± zσ X n = X ± uzoračka greška z = 2 (1,96) za stepen poverenja od 95% z = 5/3 (1,64) za stepen poverenja od 90% σx = populacijska stand devijacija (s se koristi ako je nepoz) n = veličina uzorka Dakle, interval poverenja će zavisiti od tri činioca: 1. Stepen poverenja 2. Populacijska standardna devijacija 3. Veličina uzorka 52 13