Populacija vs. uzorak - Opisivanje, ocenjivanje i testiranje Jelena Marinković, maj 01.
Statistika p Nauka o generisanju informacija i znanja kroz prikupljanje, analizu i interpretaciju podataka koji su podložni slučajnom variranju.
Biostatistika p Biostatistika je statistika primenjena u oblastima povezanim sa zdravljem i bolešću (biomedicinske i javnozdravstvene nauke), kao i nauka koja razvija nove alate i metode za istraživanje ovih oblasti.
NIVOI ZNANJA PROCESNE AKTIVNOSTI DONOSIOCI ODLUKA ODLUKA PROSUĐIVANJE RAZUMEVANJE ZNANJE Vrednovanje Poređenje alternativa Interpretacija BIOSTATISTIKA (i druge metode) SAS i DS 010/011 INFORMACIJE PODACI (ŽIVOTNI) DOGAĐAJI Analiza Sortiranje, selekcija, asocijacija Merenje, posmatranje, prikupljanje Marinković Statistika J. Biostatistics. za istraživače In: Encyclopedia of Public Health. Katedra Springer-Verlag, za medicinsku 008. statistiku i informatiku
Statistički metod p Naučni metod = Statistički metod ( statističke metode) p Statistika kao naučni jezik n semantika: gde (na kojim mestima u istraživačkom procesu), šta, zašto, značenje i interpretacija n sintaksa: u kom obliku
A danas? p Kratka istorija p Statistički pojmovnik p Istraživački podaci, uzorkovanje, merenje p Deskripcija podataka p Inferencijalna statistika / statističko zaključivanje: n Ocenjivanje nepoznatih parametara osnovnog skupa n Testiranje hipoteza
SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku
Kratka istorija
Početak moderne statistike p početak 0-tog veka n Karl Pearson (1857-1936) n Sir Ronald Aylmer Fisher (1890-196) p velike korelacione studije (Pearson) vs male eksperimentalne studije (Fisher) n eksperimentalne studije: moć testa n faktorska analiza: konfirmatorno ili eksplanatorno
Početak moderne biostatistike p Sir Austin Bradford Hill (1897-1991) p 1946. prvi pravi randomizovani klinički ogled (streptomicin u lečenju plućne tuberkuloze) p 1959. statistika odlučivanje u uslovima nesigurnosti
Poreklo statistike - veština upravljanja državom (I) p popisi (prebrojavanje ljudi, porezi, bolesti) još pre nove ere p William Petty (163-1687), statistički ured p John Graunt (160-1674), London, Bill of mortality, zaključivanje na osnovu uzorka, izračunavanje očekivanog trajanja života p 1801, prvi moderni popis stanovništva
Poreklo statistike teorija verovatnoće (II) p matematički tretman sistematskih studija na osnovu podataka o mortalitetu i studija o igrama na sreću p Blaise Pascal (163-166) p Jakob Bernoulli (1654-1705), 1713. teorija verovatnoće, zakon velikih brojeva p Rev Thomas Bayes (170-1761), induktivno rezonovanje, uslovne verovatnoće, Bajesova teorema
Poreklo statistike teorija merenja p Abraham de Moivre (1667-1754), normalna raspodela p Pierre Simon Laplace (1749-187), centralna granična teorema p Carl Fridrich Gauss (1777-1855), statističko zaključivanje (III)
Izazovi novog milenijuma p metode statističkog učenja p ponovno uzorkovanje (resampling) p frekvencionistička i bajesovska statistika
Statistički pojmovnik
p Podaci Sadržaj pojmovnika p Variranje, varijabilitet, neizvesnost, nesigurnost p Varijabla (promenljiva) - obeležje p Populacija - uzorak p Parametar statistika (statistik) p Statistički model p Biostatistički dizajn studija SAS i DS 010/011
Podaci p Bilo koja činjenica ili zapažanje. p Predmet statistike. p Kako se generiše? p Model podataka. p Izvori podataka.
Variranje-Varijacija-Varijabilitet- Neizvesnot intra inter intra inter intra inter instrumentalna ocenjivačka individualna analitička biološka ukupni varijabilitet
Obeležje posmatranja Varijabla (promenljiva) p Obeležje je bilo koja kvantitativna ili kvalitativna karakteristika, svojstvo ili osobina jedinica posmatranja. p Obeležja se dele na konstantna i varijabilna (promenljiva, slučajno promenljiva). p Klasifikacije varijabli (promenljivih): n kvantitativne i kvalitativne n neprekidne i prekidne n zavisne i nezavisne.
Populacija vs uzorak jedinice posmatranja
Parametar vs statistik(a) jedinice posmatranja x Karakteristi ka Simbol za parametar Simbol za statistiku Aritmetička sredina µ Standardna devijacija σ SD (ili s ili sd) Varijansa σ SD (ili s ili sd ) Korelacija ρ r Proporcija π p
Statistički model p Formalni, simbolički, opis odnosa između rezultujuće (izlaz) i jedne ili više eksplanatornih (diskriminatornih, klasifikatornih, prediktivnih) varijabli (ulaz). p Vrste: deterministički i verovatnosni, statistički, parametarski i neparametarski, linearni i nelinearni,...
Biostatistički dizajn studija p Zajedničko svim vrstama studija: n identifikacija podataka koji se prikupljaju (podrazumeva izbor varijabli koje se mere, njihovu ulogu u studiji, način merenja, broj jedinica posmatranja tj. veličinu uzorka, i način njihovog izbora i praćenje); n odgovarajući statistički model za opisivanje i analizu podataka; i n listu pitanja na koje studija treba da da odgovor (Koje zaključke istraživači očekuju iz istraživanja? Koji zaključci se mogu izvući naosnovu studije? Na koju populaciju (e) je(su) zaključak(čci) primenljiv?...) p Posebne metode za posebne vrste studija, RKO npr. p Jedini aspekt koji je van statistike per se je formulacija istraživačkog problema.
SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku
Istraživački podaci; uzorkovanje; merenje
Istraživački podaci p Istraživanje p Uzorkovanje p Merenje
Istraživanje p Kontinuirani saznajni proces zasnovan na određenoj metodi i proceduri. p Sastoji se iz: izbora istraživačkog problema; formulacije preciznih ciljeva istraživanja i hipoteza; istraživačkog plana (dizajna); prikupljanja podataka; eksploracije podataka; analize podataka; interpretacije i zaključivanja, te saopštavanja rezultata istraživanja. p Podele: primarna i integrativna; eksperimentalna i opservaciona; sa i bez hipoteza; retrospektivna i prospektivna; longitudinalna i presečna; kvantitativna i kvalitativna;...
Tipovi istraživanja p Preventivne, dijagnostičke, terapijske / interventne, laboratorijske, genetske, p Ili: n Eksperimentalne studije: A. Kontrolisani ogledi (1. Randomizovani i nerandomizovani ogledi;. Crossover studije; 3. Spoljašnja kontrola) i B. Nekontrolisani ogledi n Opservacione studije: A. Deskriptivne studije i B. Analitičke studije (1. Anamnestičke studije;. Studije preseka; 3. Kohortne studije; 4. Istorijske kohortne studije)
Uzorkovanje p Proces formiranja (reprezentativnog) uzorka.
Merenje p Postupak po kome se proizvode podaci kroz opservaciju ili eksperimentaciju. p Proces dodeljivanja brojeva ili drugih simbola specifičnim karakteristikama jedinica posmatranja (objekata, osoba ili događaja). p Greške merenja: sistematske i slučajne.
Statistika i merenje p Karakteristike merenja: nivo merenja, proces merenja, uslovljenost merenja, nedostajući podaci n Karakteristike procesa merenja: (a) operacionalna definicija varijable; (b) ocena pouzdanosti i valjanosti merenja; (c) izabrana skala merenja i (d) ocena tačnosti i preciznosti instrumenata merenja.
Operacionalna definicija varijable p Iskaz o tome kako istraživač u pojedinoj studiji bira da je meri. n... hipotenzivni, normotenzivni i hipertenzivni ispitanici podeljeni su prema kriterijumima visine sistolnog i dijastolnog pritiska prema podeli SZO "... n... ispitanici su označeni kao depresivni ako je njihov skor na skali depresivnosti manji od 50...
A kako istraživač može da je meri? p Objektivne i subjektivne mere p Adekvatnost izabrane mere n Pouzdanost / ponovljivost / reliability n Validnost / valjanost / validity n Senzitivnost i specifičnost (dg testova) Standardizovane mere i testovi
Pouzdanost merenja p Pouzdanost označava do koje se mere metoda merenja konzistentno i postojano ponaša a uključuje: n unutar ili međuposmatračku pouzdanost, n pouzdanost unutrašnje konzistencije, n pouzdanost alternativnih formi i n test-retest pouzdanost. p sd ili sd p Koeficijent varijacije p Cronbach-ov alpha koeficijent p Kuder-Ričardsonova formula KR0 p slaganje (kappa koeficijent, Pirsonov koeficijent linearne korelacije, intraklasni koeficijent korelacije)
Valjanost merenja p Valjanost označava odnos između onoga što se pretpostavlja da bi test trebalo da meri i onog što on stvarno meri a uključuje: n konstrukcionu, n sadržinsku i n kriterijumsku validnost. p Poređenje sa referentnim tehnikama, zlatni standard (senzitivnost, specifičnost, pozitivna i negativna prediktivna vrednost) p slaganje (kappa koeficijent i Pirsonov koeficijent linearne korelacije)
Razlike između pouzdanosti i valjanosti Frekvencija A C B D Prava vrednost Merenje
Razlike između pouzdanosti i Frekvencija A valjanosti Nepouzd. C A- Validno i pouzdano B- Validno ali nepouzda. C- Nije valid. ali je pouzd D- Nije valid. i nije pouzd Nevalid. B Istina D Merenje
Skale merenja Stevens-ova klasifikacija: p Nominalna skala p Ordinalna skala p Intervalna skala p Omerna skala (skala odnosa)
Nominalna skala merenja p dodeljivanje imena, opisa ili određivanje kategorija mogućih pojavnih oblika obeležja p relacija ekvivalencije p kodiranje p dihotomna skala je najčešća p parametri i statistike p... pol, uzrok smrti, dijagnoza, krvna grupa,...
Ordinalna skala merenja p uključuje i redosled, hijerarhiju, vrednosti obeležja p relacije ekvivalencije i poretka p rangiranje p parametri i statistike p... težina kliničke slike, starosne grupe,...
Intervalna skala merenja p razlike između sukcesivnih vrednosti varijable su uvek jednake ali bez apsolutne nulte tačke p identifikacija intervala između bilo koje dve vrednosti ( a-b = b-c, a=/ 3c) p parametri i statistike p... IQ, temperatura u C,...
Omerna skala merenja p pored svega prethodnog ima i apsolutnu nulu p parametri i statistike p... visina, masa, pritisak,...
Instrumenti merenja p Tehnologija koja se koristi za merenje. p Enkoduje procedure koje se koriste za određivanje prisustva, odsustva ili količine varijable u jedinici posmatranja. p Najčešće korišćene tehnologije su: upitnik, intervju, opservacija, objektivne i subjektivne mere, te standardizovane mere i testovi
Koliko je dobar instrument ili alat merenja? p instrument, alat merenje n bez pristrasnosti ili greške n minimizacija bajasa prava vrednost - istina merenje tačno (valjano) precizno (pouzdano)
.............. Ilustracija razlike između Preciznosti i Tačnosti
............. dobra preciznost loša preciznost dobra preciznost loša preciznost loša tačnost dobra tačnost dobra tačnost loša tačnost Ilustracija razlike između Preciznosti i Tačnosti
Zavisno od ciljeva istraživanja: Zavisne Nezavisne Adekvatnost: 1. Valjanost, tačnost. Pouzdanost, preciznost Jedinica posmatranja Karakteristike, Varijable Merenje 1. Fizičko. Prebrojavanje 3. Ocenjivanje 4. Rangiranje Podaci Transformacije, rekodiranje 1. Osnovni skup. Uzorak Tipovi varijabli: 1. Kvalitativne. Kvantitativne Skala, nivo: 1. Nominalna. Ordinalna 3. Intervalna 4. Omerna Tipovi podataka: 1. Kvalitativni. Kvantitativni
SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku
Eksploracija podataka p Eksploracija podataka uključuje prve dve faze u analizi istraživačkih podataka, tj. pripremu podataka za analizu i njihovo opisivanje, a važna je za razumevanje kvaliteta podataka u bazi i kao početak detekcije onih oblasti u kojima ima najviše informacija. p Priprema podataka za analizu uključuje razvoj i dokumentovanje strukture baze podataka, unošenje podataka u računar, proveru podataka i njihovu eventualnu modifikaciju (promenu, zamenu, transformaciju). p Deskriptivna statistika opisuje osnovne karakteristike podataka.
Preliminarni pregled ili skrining podataka n a) detekcije nedostajućih vrednosti n b) analize frekvencija (učestalosti) n c) otkrivanja neobičnih vrednosti - "autlajera" (engl. outlier) i n d) ispitivanja logičkih veza. p Deo pregleda podataka je i primena različitih operacija modifikacije podataka, kao pripreme za dalji skrining podataka i analizu. Modifikacija obuhvata: n a) redefiniciju podataka n b) transformaciju podataka i n c) procenu nezavisnosti merenja.
Statističko opisivanje podataka p p p p p Mere kondenzovanja podataka n n n n Raspodele empirijskih učestalosti Tabeliranje Grafičko prikazivanje Relativni brojevi (odnosi, proporcije, stope) Mere centralne tendencije (računske i položajne) n Aritmetička sredina, medijana, mod, geometrijska sredina, harmonijska sredina, percentili Mere varijabiliteta (apsolutne i relativne) n Standardna devijacija, varijansa, interkvartilni opseg, binomna varijansa, koeficijent varijacije, standardizovana vrednost, kovarijansa Mere oblika raspodele n Modalnost, asimetričnost, spljoštenost Mere korelacije n
Izbor statističkih mera u funkciji skala merenja u istraživačkom uzorku. Statističke mere** Mere centralne tendencije Mere varijabiliteta Mere asimetrije i spljoštenosti Mere korelacije za dve varijable Mere korelacije za više od dve varijable Relativni brojevi *samo za binarne varijable Skale merenja Omerna i Intervalna Ordinalna Nominalna Aritmetička sredina Geometrijska i harmonijska sredina Opseg Varijansa Standardna devijacija Koeficijent varijacije Z skor Pirsonov koeficijent asimetričnosti α 3 i α 4 Koeficijent linearne korelacije Koeficijent višestruke linearne korelacije Parcijalni koeficijenti korelacije Indeksi i statistički koeficijenti Medijana Kvartili, decili, percentili Interkvartilni opseg Kvartilna devijacija Koeficijent kvartilne varijacije Spirmanov koeficijent korelacije rangova Kendalov koeficijent konkordanse Kendalov tau koeficijent Mod Binomna* varijansa Binomni* koeficijenti asimetrije i spljoštenosti Koeficijent kontingencije Koeficijent kontingencije Proporcije Odnosi Stope **podrazumeva se da se sve statističke mere izračunate u manje informativnim skalama mogu izračunati i kod onih informativnijih
Mere centralne tendencije Statitička mera Aritmetička sredina Harmonijska sredina Geometrijska sredina Medijana Negrupisani podaci grupisani podaci x n n x i i= = 1 ili H= n i= 1 x = n 1 xi k s= 1 fx G= n x1 x x3 x4 xn Vrednost koja odgovara srednjem članu niza uređenog po veličini, mesto medijane određujemo kao n + 1 MMed= ili MMed= f s f Kvartili Q I (i =1,,3) = i n / 4 Decili D I (i =1,,3,..,9) = i n / 10 Percentili P I (i =1,,3,..,99) = i n / 100 Mod Opservacija sa najvećom učestalošću x s je sredina klasnog ili grupnog intervala +1
Mere varijabiliteta Statistička mera Opseg Varijansa Standardna devijacija SD = SD= Negrupisani podaci-grupisani podaci I = max min n i= 1 n i= 1 ( x x) i n 1 ( x x) i n 1 ili SD = ili SD = Koeficijent varijacije CV= 100 Z skor z = SD x x x SD Interkvartilni opseg IO=Q 3 Q 1 Kvartilna devijacija Q3 Q KD= 1 Koeficijent kvartilne varijacije Q3 Q1 V q = 100 Q + Q Binomna varijansa x s je sredina klasnog ili grupnog intervala 3 1 SD = npq k s= 1 k f s= 1 ( x x) f s f ( x x) s f
Mere oblika raspodele p PKA = 3 (aritmetička sredina - medijana) / standardna devijacija p Mera asimetričnosti i mera spljoštenosti
Mere korelacije Statistička mera Pirsonov koeficijent linearne korelacije Spirmanov koeficijent korelacije r = r SD xy = SD SD x y = n Formula n xi yi ( xi )( yi ) xi ( xi ) n yi ( yi ) 6 ρ = 1 d i rangova n( n 1) Koeficijent kontigencije Koeficijent višestruke linearne korelacije Parcijalni koeficijenti korelacije (primer za dve nezavisne varijable - parcijalni koeficijent korelacije izmedju Y i X 1 pri konstantnom X ) Kendalov koeficijent konkordanse Kendalov tau koeficijent R r y.1... k χ C = n + χ ( yˆ y) ( yi y) = R y.1... k = ( r r r )/ ( 1 r )( r ) y1. = y1 y 1 y 1 W= 1 1 k τ = xy. z SD 3 ( n n) χ n 1
SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku
Statističko zaključivanje p Statističko zaključivanje je proces kojim, koristeći rezultate iz uzorka (podatke koje smo dobili istraživanjem), govorimo nešto o populaciji (ukupnost hipotetičkih podataka koje bi mogli dobiti ponavljanjem istraživanja beskonačan broj puta). n Ocenjivanje nepoznatih parametara osnovnog skupa (procenu izgleda populacije samo na osnovu uzorka ) n Testiranje hipoteza (procena verovatnoće da je opservirana razlika između grupa zavisna ili
Ciljna populacija Generalizacija Uzoračka populacija Uzorak Analiza Zaključak
Ocenjivanje populacionih parametara p Ocenjivanje je proces korišćenja informacija iz slučajnog uzorka u cilju donošenja zaključka o vrednosti populacionog parametra. p Ocene mogu biti tačkaste i intervalne. p Intervalne ocene, koje sadrže tačkastu ocenu i varijabilitet te ocene u drugim uzorcima, zovu se intervali poverenja a njihovi krajevi su granice poverenja. x z(ili)t SE µ x + z(ili)t SE
Izabrana deskriptivna statistička mera Aritmetička sredina; (n 30) ili populaciona varijansa poznata Aritmetička sredina; (n<30) ili populaciona varijansa nepoznata Razlika dve aritmetičke sredine sa poznatim populacionim varijansama Razlika dve aritmetičke sredine sa nepoznatim, ali približno sličnim, varijansama Prosečna razlika, varijansa razlika je poznata Prosečna razlika, varijansa razlika je nepoznata Standardna devijacija Odnos varijansi dve normalno raspodeljene populacije Broj uspeha (povoljnih ishoda događaja) Proporcija uspeha Najčešće korišćeni intervali poverenja Uzoračka statistika (S) Populacioni parametar (P) x µ x - x µ x - x 1 - x µ 1 - µ x 1 - x µ 1 - µ t Donja granica poverenja S - k 1-α/ SE z t z α 1 n 1;1 σ ( x 1 - x ) & $ σ1 $ % n1 n α + 1 n α n1 + n ;1 d δ d - d δ d - ( x 1 - x ) - t z Gornja granica poverenja S + k 1-α/ SE x + SD α x + t n σ #!! " & 1 SD $ + % n1 σ d α 1 n n 1;1 ( n 1) s SD σ χ SD 1 /SD X σ 1 /σ nπ* p = x/n π* & $ SD % SD 1 #! n " + t z z α 1 α n 1;1 σ ( x 1 - x )+ & $ σ1 $ % n1 n SD σ n α + 1 n α n1 + n ;1 d + SDd α d + t n 1 α / ( x 1 - x ) z #!! " & 1 SD $ + % n1 σ d α 1 n α n 1;1 ( n 1) s χ α / SD & # & # $! # & # $! $! $ SD1! 1 " $ Fα! $ $!!! ; DF1; DF % SD " F α 1 ; DF % 1 " % ; DF " 1 1 x nπ 1/ nπ (1 π p π 1/(n) π (1 π ) / n nπ (1 π d n x nπ + 1/ p π + 1/(n) π (1 π ) / n 1 n #! "
p Ponekad je u istraživanjima ocenjivanje jedini metod statističkog zaključivanja koji je potreban i dovoljan. To se posebno odnosi na istraživanja čiji je cilj opisivanje novog entiteta ili fenomena, ili opisivanje već poznatih entiteta ali u novim sredinama, različitim okruženjima ili na novim ispitanicima. p I u situacijama kada ovo nije jedini metod statističkog zaključivanja, obavezno se koristi jer daje važnu informaciju o veličini greške, tj. informaciju o odstupanju dobijene ocene - rezultata od prave populacione vrednosti samo zbog slučajnosti (okolnosti da smo formirali taj, a ne neki drugi mogući uzorak iste veličine iz iste populacije).
Testiranje hipoteza p Testiranje hipoteza je deo statističkog zaključivanja koji koristi uzoračke podatke za evaluaciju istinitosti hipoteza o populaciji. p Kao i kod ocenjivanja cilj procesa testiranja hipoteza je generalizacija sa uzorka na populaciju iz koje je uzorak slučajno izabran.
Hipoteza p Hipoteza je jednostavno iskaz o jednoj ili više populacija. p Istraživačka hipoteza je pretpostavka o predikciji ishoda eksperimenta (pretpostavka koja je pokretač istraživanja). p Statistička hipoteza je hipoteza formulisana na takav način da može biti evaluirana odgovarajućim statističkim tehnikama. p Statistička teorija poznaje i proste i složene, jednodimenzionalne i višedimenzionalne hipoteze.
Proces testiranja hipoteza 1. Podaci. Pretpostavke 3. Hipoteze 4. Izbor test statistike 5. Raspodela test statistike 6. Pravilo odlučivanja 7. Izračunavanje test statistike 8. Statistička odluka 9. Istraživački zaključak
4. Izbor odgovarajućeg statističkog testa p Izbor statističkog testa zavisi od: p a) kriterijuma na osnovu kojih ćemo birati statistički test (vrstu i tip) te koju test statistiku će taj test imati i p b) optimalnog izbora u slučajevima kada su za isti istraživački dizajn (i posledično, istraživačko pitanje) mogući alternativni statistički testovi (dva, tri, ili više).
4. Izbor odgovarajućeg statističkog testa a) p p p Prvi od kriterijuma je svakako samo istraživačko pitanje, odnosno već izabrani studijski plan. n n n n a) testiranje razlike/a, testiranje sličnosti oblika raspodela i testiranje povezanosti koje u potpunosti određuju vrstu statističkog testa i b) broj raspoloživih ili potrebnih uzoraka (1,, i više) c) odnos među uzorcima (zavisni i nezavisni uzorci) i d) deskriptivna statistička mera (ili mere), ako ih uopšte ima ili ako su uopšte potrebne, koje su nosilac bilo razlika, bilo sličnosti, bilo povezanosti koje testiramo, koje delimično određuju tip statističkog testa i njegovu test statistiku. Drugi kriterijum odnosi se na definisanje statističkog modela (određivanja prirode populacije iz koje ćemo uzorak izabrati i načina njegovog izbora), kao i načina merenja (neka od četiri skale merenja) varijable (varijabli) od interesa. Ova dva kriterijuma tada u potpunosti određuje i tip statističkog testa i njegovu test statistiku.
4. Izbor odgovarajućeg statističkog testa b) Prvi kriterijum za biranje jednog (između više) statističkih testova je njegova moć (snaga). Podsetimo se da je moć statističkog testa definisana kao verovatnoća odbacivanja H 0 kada je ona stvarno netačna (i zato i treba da bude odbačena), tj.,: p p Moć = 1 - verovatnoća greške II tipa = 1 - β Drugi kriterijum za biranje jednog između više statističkih testova je njegova efikasnost. Meri se količina porasta broja jedinica posmatranja u uzorku koja je potrebna da bi jedan test (B) bio isto toliko moćan koliko i drugi (A): p E (B/A) = (n A / n B ) x 100
Izbor statističkog testa Cilj istraživanja Opisivanje jedne grupe Poređenje jedne grupe sa hipotetičkom vrednošću Poređenje dva nezavisna uzorka Kvantitativno (iz Gausovski raspodeljene populacije) Aritmetička sredina, SD Tačkaste i intervalne ocene Jednouzorački z ili t-test Karakteristike procesa merenja Rangovi, skorovi ili kvantitativno (iz kontinuirano ali ne Gausovski raspodeljene populacije) Medijana, interkvartilni opseg Kolmogorov-Smirnov test Kategorijalni Binomni (dva moguća ishoda) Proporcija, binomna varijansa Hi-kvadrat ili Binomni test z ili t-test za dva nezavisna uzorka Man-Vitnijev test ili Test sume rangova Fišerov test ili hi-kvadrat test z ili t-test za dva Poređenje dva Vilkoksonov test zavisna (mečovana) zavisna uzorka ekvivalentnih parova uzorka MekNemarov test Poređenje tri ili više nezavisnih grupa # Jednofaktorska ANOVA Kraskal-Volisov test Hi-kvadrat test Poređenje tri ili više ANOVA u blokovima ili mečovanih grupa # za nezavisna merenja Fridmanov test Kohranov Q test Kvantifikacija Pirsonova linearna Spirmanova Koeficijent povezanosti između dve varijable # korelacija korelacija rangova kontingencije Predviđanje vrednosti jedne varijable na osnovu izmerenih vrednosti druge varijable # Predviđanje vrednosti jedne na osnovu izmerenih vrednosti dve ili više varijabli # Linearna ili nelinearna regresija Višestruka linearna ili nelinearna regresija Neparametarska regresija Jednostavna (univarijantna) logistička regresija Višestruka (multipla) logistička regresija # Neki od ciljeva istraživanja, pa prema tome i njima odgovarajuće statističke metode, biće izložene u sledećim poglavljima ovog udžbenika.
Najčešće korišćeni statistički testovi u istraživanjima sa jednim uzorkom u funkciji izabranih skala merenja. Skala merenja omerna ili intervalna ordinalna nominalna Statistički testovi z-test; t-test; Test varijanse Kolmogorov-Smirnovljev test; Jednouzorački test nizova Binomni test; Hi-kvadrat test slaganja
Najčešće korišćeni statistički testovi i njihove test statistike u funkciji istraživačkog cilja (u istraživanjima sa jednim uzorkom) Istraživački cilj Statistički test Test statistika H 0 : µ = µ 0 z-test z = x - µ 0 / (σ/ n) H 0 : π = π 0 z-test z = p - π 0 / (σ/ n) H 0 : µ = µ 0 t-test t = x - µ 0 / (SD/ n) Kada je H 0 tačna test statistika se raspodeljuje kao? raspodela (sa? broja stepena slobode) Standardna normalna raspodela Standardna normalna raspodela t-raspodela sa DF=n-1 Tablica XII H 0 : π = π 0 t-test t = p - π 0 / (SD/ n) t-raspodela sa DF=n-1 H 0 : σ = σ 0 Test varijanse χ = (n-1)sd / σ 0 χ raspodela sa DF=n-1 Slaganje empirijske sa hipotetičkom raspodelom Slaganje empirijske sa hipotetičkom raspodelom χ - test slaganja Kolmogorov- Smirnovljev test H 1 : ρ 0 t-test t = χ = (f-f) / F ili χ = (f-f, ) / f, ili često kao χ = (O-E) / E D = maximum F ( X ) F ( X ) & $ % s r 1 r t χ raspodela sa DF=k - r Tablica XI # n! ) t raspodela sa DF=n- " H 0 : α = α 0 t-test t = a - α 0 / SE a t raspodela sa DF=n- H 0 : β = β 0 t-test t = b - β 0 / SE b t raspodela sa DF=n- H 0 : ρ = c z-test z = z - z c / Slučajnost opservacija H 0 : π = π 0 Jednouzorački test nizova Binomni test 1 n određivanje broja nizova u, u n ispitanika 3 a za n 1 ili n veće od 0 u µ u 0. 5 z = x i = 0 σ ( n % & # p ' i $ u i i q n za n 5 i p između 0.3 i 0.7; za p manje od 0.3 i veće od 0.7 i npq 9 z= (x±0.5) -np / npq ; Standardna normalna raspodela Tačne verovatnoće Standardna normalna raspodela Tačne verovatnoće iz binomne raspodele Standardna normalna raspodela
Najčešće korišćeni statistički testovi u istraživanjima sa dva uzorka u funkciji izabranih skala merenja. Skale merenja dva zavisna uzorka dva nezavisna uzorka omerna ili intervalna z-test; t-test; F-test za odnos dve z-test; t-test; Randomizacioni varijanse; Randomizacioni test za test za vezane uzorke dva nezavisna uzorka ordinalna Test predznaka; Vilkoksonov Test medijane; Test sume test ekvivalentnih parova rangova; Man-Vitnijev test nominalna MekNemarov test Fišerov test tačne verovatnoće; Hi-kvadrat test nezavisnosti i homogenosti
Najčešće korišćeni statistički testovi i njihove statistike u funkciji istraživačkog cilja (u istraživanjima sa dva zavisna uzorka). Istraživački cilj Statistički test Test statistika H 1 : µ d 0* z-test z d µ /( n ) / d σ 0 d Kada je H 0 tačna test statistika se raspodeljuje kao? raspodela (sa? broja stepena slobode) = Standardna normalna raspodela H 1 : µ d 0* t-test t = d µ d / SE 0 d t-raspodela sa DF=n-1 H 1 : µ d 0* Test ekvivalentnih parova T, = m(n+1) T za n>5: z = T - µ T / σ T Posebne tablice Standardna normalna raspodela H 1 : a d** MekNemarov test χ = ( a - d - 1) / a+d χ sa DF=1 H 1 : µ d 0* H 1 : P(X A >X B ) P(X B >X A ) ili P(+) P(- ) 0.5** Randomizacioni test Test predznaka d (za n manje od 13) z =( d - µ ) / σ za n <1 i p=0.5, ili za n 5: P(k x n,p) = n C k p k q n-k, inače z =( k ± 0.5) - 0.5n / 0.5 n *ovo je za dvosmerno testiranje; inače može biti samo >0 ili <0; ** isto, samo P(+) < P(- ) ili P(+) > P(- ) Tačna verovatnoća p Standardna normalna raspodela Tačne verovatnoće binomne raspodele Standardna normalna raspodela
Najčešće korišćeni statistički testovi i njihove statistike u funkciji istraživačkog cilja (u istraživanjima sa dva nezavisna uzorka) Istraživački cilj Statistički test Test statistika H 1 : µ 1 - µ 0* z-test z = ( x1 x ) - ( µ 1 - µ ) 0 / & $ σ 1 % n1 # &! σ + $ " % n ##!! "! " Kada je H 0 tačna, test statistika se raspodeljuje kao? raspodela (sa? broja stepena slobode) Standardna normalna raspodela H 1 : π 1 - π 0* z-test z = (p 1 - p ) - (π 1 - π ) 0 / σ p1-p Standardna normalna raspodela H 1 : µ 1 - µ 0* t-test t = ( x1 x ) - ( µ 1 - µ ) 0 / SE x1-x t-raspodela sa DF=n 1 +n - H 1 : π 1 - π 0* t-test t = (p 1 - p ) - (π 1 - π ) 0 / SE p1-p t-raspodela sa DF= n 1 +n - H 1 : σ 1 / σ 1* Test varijansnog količnika F = SD 1 / SD F raspodela sa DF 1 =n 1-1 i DF =n -1 H 1 : ρ 1 - ρ 0* t-test Z = z 1 - z / SE z 1 - z Standardna normalna raspodela H 1 : α 1 - α 0* t-test a 1 - a / SE a 1 - a t raspodela sa DF= n 1 +n - 3 H 1 : β 1 - β 0* t-test b 1 - b / SE b1 - b t raspodela sa DF=n 1 +n -4 H 1 : dva kriterijuma klasifikacije nisu nezavisna H 1 : Uzorci ne potiču iz iste populacije H 1 : Učestalost ispitanika sa karakteristikom od interesa nije ista u obe populacije H 1 : Med 1 Med ** H 1 : Med 1 Med ** H 1 : µ 1 - µ 0* Hi-kvadrat test nezavisnosti Hi-kvadrat test homogenosti Fišerov test tačne verovatnoće Test medijane Test sume rangova Man-Vitnijev U test Randomizacioni test nizova za dva nezavisna uzorka χ = (O-E) / E; Jejtsova korekcija i Mood-ov izraz χ = (O-E) / E; Jejtsova korekcija i Mood-ov izraz p 1 = (a+b)!(c+d)!(a+c)!(b+d)! / a!b!c!d!n! i svi p za još ekstremnije slučajeve χ = n ( ad - bc - n/) / (a+b)(c+d)(a+c)(b+d) gde je tablica kontingencije formirana po značenju medijane U = n 1 n + n 1 (n 1 +1)/ - R 1 z =( U - µ U ) / σ U za velike uzorke, preko 0 p = 1 / (n 1 + n nad n 1 ) t-statistika χ -raspodela sa DF=(k- 1)(r-1) χ -raspodela sa DF=(k- 1)(r-1) Tačna verovatnoća zbira p-ova χ -raspodela sa DF=(k- 1)(r-1) Posebne tablice Standardna normalna raspodela Tačna verovatnoća t-raspodela da DF=n 1 +n - *dvosmerna radna hipoteza, a može biti i jednosmerna oblika µ 1 - µ < 0 ili µ 1 - µ > 0; ** može i > ili < kada je jednosmerno testiranje u pitanju
Testiranje hipoteza 0.95 α / α / Kritična vrednost Kritična vrednost
Matrica statističkog odlučivanja Naš zaključak Nulta hipoteza tačna U prirodi Nulta hipoteza pogrešna Prihvatamo nultu hipotezu Odbacujemo nultu hipotezu 1- α α greška prvog tipa β greška drugog tipa 1- β