Populacija vs. uzorak - Opisivanje, ocenjivanje i testiranje. Jelena Marinković, maj 2012.

Σχετικά έγγραφα
Uvod u neparametarske testove

numeričkih deskriptivnih mera.

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

Uvod u neparametarske testove

Testiranje statistiqkih hipoteza

Str

Populacija Ciljna/uzoračka populacija

Autori: Dr Biljana Popović, redovni profesor Prirodno matematičkog fakulteta u Nišu Mr Borislava Blagojević, asistent Gradjevinskog fakulteta u Nišu

Izbor statističkih testova Ana-Maria Šimundić

Analiza varijanse sa jednim Posmatra se samo jedna promenljiva

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

3.1 Granična vrednost funkcije u tački

3 Populacija i uzorak

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Statističko zaključivanje - testiranje hipoteza. Katedra za medicinsku statistiku i informatiku

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

Statističke metode. doc. dr Dijana Karuović

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

Chi-kvadrat test. Chi-kvadrat (χ2) test

Postoji nekoliko statidtičkih testova koji koriste t raspodelu, koji se jednim imenom zovu t-testovi.

Oblasti izučavanja. IX.1. Osnove analize podataka. IX. Analiza podataka UVOD U ANALIZU PODATAKA 13/11/15

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

Regresija i korelacija

Elementi spektralne teorije matrica

X. Testiranje hipoteza. Osnovni koncepti testiranja hipoteza TESTIRANJE HIPOTEZA OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI 19/11/15

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Program testirati pomoću podataka iz sledeće tabele:

SISTEMI NELINEARNIH JEDNAČINA

Računarska grafika. Rasterizacija linije

5. Karakteristične funkcije

Prosta linearna regresija (primer)

Binomna, Poissonova i normalna raspodela

NEPARAMETRIJSKE TEHNIKE

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

nepoznati parametar θ jednak broju θ 0, u oznaci H 0 (θ =θ 0 ), je primer proste hipoteze. Ako hipoteza nije prosta, onda je složena.

Uvod Teorija odlučivanja je analitički i sistematski pristup proučavanju procesa donošenja odluka Bez obzira o čemu donosimo odluku imamo 6 koraka za

Teorijske osnove informatike 1

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

Računarska grafika. Rasterizacija linije

FTN Novi Sad Katedra za motore i vozila. Teorija kretanja drumskih vozila Vučno-dinamičke performanse vozila: MAKSIMALNA BRZINA

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

9.1 Testovi hipoteza u statistici

Ispitivanje toka i skiciranje grafika funkcija

Metod uzorka i karakteristike nekih planova

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

POSTAVLJANJE I TESTIRANJE HIPOTEZA

18. listopada listopada / 13

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

Operacije s matricama

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

7 Algebarske jednadžbe

SADR\AJ. Predgovor. POGLAVLJE 2 Grafičko opisivanje podataka Klasifikacija varijabli 10 Kvalitativne ili numeričke 10 Mjerne skale 11

IX. Analiza podataka (2) IX.1. Diskriminaciona analiza MARKETINŠKO ISTRAŽIVANJE. Tehnike za analizu podataka. Multivarijacione tehnike

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

Numerička matematika 2. kolokvij (1. srpnja 2009.)

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

Obrada signala

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

Analitička statistika Testiranje hipoteze.

Mašinsko učenje. Regresija.

Zavrxni ispit iz Matematiqke analize 1

DRUGI KOLOKVIJUM IZ MATEMATIKE 9x + 6y + z = 1 4x 2y + z = 1 x + 2y + 3z = 2. je neprekidna za a =

Konstruisati efikasan algoritam znači dati skup preciznih uputstava kako doći do rešenja zadatog problema Algoritmi se mogu opisivati:

III VEŽBA: FURIJEOVI REDOVI

INTELIGENTNO UPRAVLJANJE

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

OSNOVI ELEKTRONIKE VEŽBA BROJ 1 OSNOVNA KOLA SA DIODAMA

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

BILJEŠKE ZA PREDAVANJA (za internu uporabu)

Konstruisanje. Dobro došli na... SREDNJA MAŠINSKA ŠKOLA NOVI SAD DEPARTMAN ZA PROJEKTOVANJE I KONSTRUISANJE

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

Grafičko prikazivanje atributivnih i geografskih nizova

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

PRIMJER 3. MATLAB filtdemo

IZVODI ZADACI (I deo)

Betonske konstrukcije 1 - vežbe 3 - Veliki ekscentricitet -Dodatni primeri

Skup svih mogućih ishoda datog opita, odnosno skup svih elementarnih događaja se najčešće obeležava sa E. = {,,,... }

Testiranje hipoteza statistika zaključivanja

RIJEŠENI ZADACI I TEORIJA IZ

VEROVATNO A I STATISTIKA A - TEST 1 9. NOVEMBAR 2013.

Statistiqki softver 4 Sedmi qas

9. TESTIRANJE HIPOTEZA O PARAMETRU. Josipa Perkov, prof., pred. 1

7. glava STATISTIČKO OCENJIVANJE CILJEVI POGLAVLJA. Nakon čitanja ovoga poglavlja bićete u stanju da:

Kaskadna kompenzacija SAU

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

APROKSIMACIJA FUNKCIJA

5 Ispitivanje funkcija

3. OSNOVNI POKAZATELJI TLA

, i = 1, 2, n. Tabela 1 Koeficijent proste korelacije. Standardizovani regresioni koeficijent. Regresioni koeficijent b

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

( ) ( ) 2 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET. Zadaci za pripremu polaganja kvalifikacionog ispita iz Matematike. 1. Riješiti jednačine: 4

41. Jednačine koje se svode na kvadratne

REGRESIJSKA ANALIZA zavisnost (korelacija) regresijske tehnike kvantitativno zavisnost (korelaciju) linearna regresija

Transcript:

Populacija vs. uzorak - Opisivanje, ocenjivanje i testiranje Jelena Marinković, maj 01.

Statistika p Nauka o generisanju informacija i znanja kroz prikupljanje, analizu i interpretaciju podataka koji su podložni slučajnom variranju.

Biostatistika p Biostatistika je statistika primenjena u oblastima povezanim sa zdravljem i bolešću (biomedicinske i javnozdravstvene nauke), kao i nauka koja razvija nove alate i metode za istraživanje ovih oblasti.

NIVOI ZNANJA PROCESNE AKTIVNOSTI DONOSIOCI ODLUKA ODLUKA PROSUĐIVANJE RAZUMEVANJE ZNANJE Vrednovanje Poređenje alternativa Interpretacija BIOSTATISTIKA (i druge metode) SAS i DS 010/011 INFORMACIJE PODACI (ŽIVOTNI) DOGAĐAJI Analiza Sortiranje, selekcija, asocijacija Merenje, posmatranje, prikupljanje Marinković Statistika J. Biostatistics. za istraživače In: Encyclopedia of Public Health. Katedra Springer-Verlag, za medicinsku 008. statistiku i informatiku

Statistički metod p Naučni metod = Statistički metod ( statističke metode) p Statistika kao naučni jezik n semantika: gde (na kojim mestima u istraživačkom procesu), šta, zašto, značenje i interpretacija n sintaksa: u kom obliku

A danas? p Kratka istorija p Statistički pojmovnik p Istraživački podaci, uzorkovanje, merenje p Deskripcija podataka p Inferencijalna statistika / statističko zaključivanje: n Ocenjivanje nepoznatih parametara osnovnog skupa n Testiranje hipoteza

SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku

Kratka istorija

Početak moderne statistike p početak 0-tog veka n Karl Pearson (1857-1936) n Sir Ronald Aylmer Fisher (1890-196) p velike korelacione studije (Pearson) vs male eksperimentalne studije (Fisher) n eksperimentalne studije: moć testa n faktorska analiza: konfirmatorno ili eksplanatorno

Početak moderne biostatistike p Sir Austin Bradford Hill (1897-1991) p 1946. prvi pravi randomizovani klinički ogled (streptomicin u lečenju plućne tuberkuloze) p 1959. statistika odlučivanje u uslovima nesigurnosti

Poreklo statistike - veština upravljanja državom (I) p popisi (prebrojavanje ljudi, porezi, bolesti) još pre nove ere p William Petty (163-1687), statistički ured p John Graunt (160-1674), London, Bill of mortality, zaključivanje na osnovu uzorka, izračunavanje očekivanog trajanja života p 1801, prvi moderni popis stanovništva

Poreklo statistike teorija verovatnoće (II) p matematički tretman sistematskih studija na osnovu podataka o mortalitetu i studija o igrama na sreću p Blaise Pascal (163-166) p Jakob Bernoulli (1654-1705), 1713. teorija verovatnoće, zakon velikih brojeva p Rev Thomas Bayes (170-1761), induktivno rezonovanje, uslovne verovatnoće, Bajesova teorema

Poreklo statistike teorija merenja p Abraham de Moivre (1667-1754), normalna raspodela p Pierre Simon Laplace (1749-187), centralna granična teorema p Carl Fridrich Gauss (1777-1855), statističko zaključivanje (III)

Izazovi novog milenijuma p metode statističkog učenja p ponovno uzorkovanje (resampling) p frekvencionistička i bajesovska statistika

Statistički pojmovnik

p Podaci Sadržaj pojmovnika p Variranje, varijabilitet, neizvesnost, nesigurnost p Varijabla (promenljiva) - obeležje p Populacija - uzorak p Parametar statistika (statistik) p Statistički model p Biostatistički dizajn studija SAS i DS 010/011

Podaci p Bilo koja činjenica ili zapažanje. p Predmet statistike. p Kako se generiše? p Model podataka. p Izvori podataka.

Variranje-Varijacija-Varijabilitet- Neizvesnot intra inter intra inter intra inter instrumentalna ocenjivačka individualna analitička biološka ukupni varijabilitet

Obeležje posmatranja Varijabla (promenljiva) p Obeležje je bilo koja kvantitativna ili kvalitativna karakteristika, svojstvo ili osobina jedinica posmatranja. p Obeležja se dele na konstantna i varijabilna (promenljiva, slučajno promenljiva). p Klasifikacije varijabli (promenljivih): n kvantitativne i kvalitativne n neprekidne i prekidne n zavisne i nezavisne.

Populacija vs uzorak jedinice posmatranja

Parametar vs statistik(a) jedinice posmatranja x Karakteristi ka Simbol za parametar Simbol za statistiku Aritmetička sredina µ Standardna devijacija σ SD (ili s ili sd) Varijansa σ SD (ili s ili sd ) Korelacija ρ r Proporcija π p

Statistički model p Formalni, simbolički, opis odnosa između rezultujuće (izlaz) i jedne ili više eksplanatornih (diskriminatornih, klasifikatornih, prediktivnih) varijabli (ulaz). p Vrste: deterministički i verovatnosni, statistički, parametarski i neparametarski, linearni i nelinearni,...

Biostatistički dizajn studija p Zajedničko svim vrstama studija: n identifikacija podataka koji se prikupljaju (podrazumeva izbor varijabli koje se mere, njihovu ulogu u studiji, način merenja, broj jedinica posmatranja tj. veličinu uzorka, i način njihovog izbora i praćenje); n odgovarajući statistički model za opisivanje i analizu podataka; i n listu pitanja na koje studija treba da da odgovor (Koje zaključke istraživači očekuju iz istraživanja? Koji zaključci se mogu izvući naosnovu studije? Na koju populaciju (e) je(su) zaključak(čci) primenljiv?...) p Posebne metode za posebne vrste studija, RKO npr. p Jedini aspekt koji je van statistike per se je formulacija istraživačkog problema.

SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku

Istraživački podaci; uzorkovanje; merenje

Istraživački podaci p Istraživanje p Uzorkovanje p Merenje

Istraživanje p Kontinuirani saznajni proces zasnovan na određenoj metodi i proceduri. p Sastoji se iz: izbora istraživačkog problema; formulacije preciznih ciljeva istraživanja i hipoteza; istraživačkog plana (dizajna); prikupljanja podataka; eksploracije podataka; analize podataka; interpretacije i zaključivanja, te saopštavanja rezultata istraživanja. p Podele: primarna i integrativna; eksperimentalna i opservaciona; sa i bez hipoteza; retrospektivna i prospektivna; longitudinalna i presečna; kvantitativna i kvalitativna;...

Tipovi istraživanja p Preventivne, dijagnostičke, terapijske / interventne, laboratorijske, genetske, p Ili: n Eksperimentalne studije: A. Kontrolisani ogledi (1. Randomizovani i nerandomizovani ogledi;. Crossover studije; 3. Spoljašnja kontrola) i B. Nekontrolisani ogledi n Opservacione studije: A. Deskriptivne studije i B. Analitičke studije (1. Anamnestičke studije;. Studije preseka; 3. Kohortne studije; 4. Istorijske kohortne studije)

Uzorkovanje p Proces formiranja (reprezentativnog) uzorka.

Merenje p Postupak po kome se proizvode podaci kroz opservaciju ili eksperimentaciju. p Proces dodeljivanja brojeva ili drugih simbola specifičnim karakteristikama jedinica posmatranja (objekata, osoba ili događaja). p Greške merenja: sistematske i slučajne.

Statistika i merenje p Karakteristike merenja: nivo merenja, proces merenja, uslovljenost merenja, nedostajući podaci n Karakteristike procesa merenja: (a) operacionalna definicija varijable; (b) ocena pouzdanosti i valjanosti merenja; (c) izabrana skala merenja i (d) ocena tačnosti i preciznosti instrumenata merenja.

Operacionalna definicija varijable p Iskaz o tome kako istraživač u pojedinoj studiji bira da je meri. n... hipotenzivni, normotenzivni i hipertenzivni ispitanici podeljeni su prema kriterijumima visine sistolnog i dijastolnog pritiska prema podeli SZO "... n... ispitanici su označeni kao depresivni ako je njihov skor na skali depresivnosti manji od 50...

A kako istraživač može da je meri? p Objektivne i subjektivne mere p Adekvatnost izabrane mere n Pouzdanost / ponovljivost / reliability n Validnost / valjanost / validity n Senzitivnost i specifičnost (dg testova) Standardizovane mere i testovi

Pouzdanost merenja p Pouzdanost označava do koje se mere metoda merenja konzistentno i postojano ponaša a uključuje: n unutar ili međuposmatračku pouzdanost, n pouzdanost unutrašnje konzistencije, n pouzdanost alternativnih formi i n test-retest pouzdanost. p sd ili sd p Koeficijent varijacije p Cronbach-ov alpha koeficijent p Kuder-Ričardsonova formula KR0 p slaganje (kappa koeficijent, Pirsonov koeficijent linearne korelacije, intraklasni koeficijent korelacije)

Valjanost merenja p Valjanost označava odnos između onoga što se pretpostavlja da bi test trebalo da meri i onog što on stvarno meri a uključuje: n konstrukcionu, n sadržinsku i n kriterijumsku validnost. p Poređenje sa referentnim tehnikama, zlatni standard (senzitivnost, specifičnost, pozitivna i negativna prediktivna vrednost) p slaganje (kappa koeficijent i Pirsonov koeficijent linearne korelacije)

Razlike između pouzdanosti i valjanosti Frekvencija A C B D Prava vrednost Merenje

Razlike između pouzdanosti i Frekvencija A valjanosti Nepouzd. C A- Validno i pouzdano B- Validno ali nepouzda. C- Nije valid. ali je pouzd D- Nije valid. i nije pouzd Nevalid. B Istina D Merenje

Skale merenja Stevens-ova klasifikacija: p Nominalna skala p Ordinalna skala p Intervalna skala p Omerna skala (skala odnosa)

Nominalna skala merenja p dodeljivanje imena, opisa ili određivanje kategorija mogućih pojavnih oblika obeležja p relacija ekvivalencije p kodiranje p dihotomna skala je najčešća p parametri i statistike p... pol, uzrok smrti, dijagnoza, krvna grupa,...

Ordinalna skala merenja p uključuje i redosled, hijerarhiju, vrednosti obeležja p relacije ekvivalencije i poretka p rangiranje p parametri i statistike p... težina kliničke slike, starosne grupe,...

Intervalna skala merenja p razlike između sukcesivnih vrednosti varijable su uvek jednake ali bez apsolutne nulte tačke p identifikacija intervala između bilo koje dve vrednosti ( a-b = b-c, a=/ 3c) p parametri i statistike p... IQ, temperatura u C,...

Omerna skala merenja p pored svega prethodnog ima i apsolutnu nulu p parametri i statistike p... visina, masa, pritisak,...

Instrumenti merenja p Tehnologija koja se koristi za merenje. p Enkoduje procedure koje se koriste za određivanje prisustva, odsustva ili količine varijable u jedinici posmatranja. p Najčešće korišćene tehnologije su: upitnik, intervju, opservacija, objektivne i subjektivne mere, te standardizovane mere i testovi

Koliko je dobar instrument ili alat merenja? p instrument, alat merenje n bez pristrasnosti ili greške n minimizacija bajasa prava vrednost - istina merenje tačno (valjano) precizno (pouzdano)

.............. Ilustracija razlike između Preciznosti i Tačnosti

............. dobra preciznost loša preciznost dobra preciznost loša preciznost loša tačnost dobra tačnost dobra tačnost loša tačnost Ilustracija razlike između Preciznosti i Tačnosti

Zavisno od ciljeva istraživanja: Zavisne Nezavisne Adekvatnost: 1. Valjanost, tačnost. Pouzdanost, preciznost Jedinica posmatranja Karakteristike, Varijable Merenje 1. Fizičko. Prebrojavanje 3. Ocenjivanje 4. Rangiranje Podaci Transformacije, rekodiranje 1. Osnovni skup. Uzorak Tipovi varijabli: 1. Kvalitativne. Kvantitativne Skala, nivo: 1. Nominalna. Ordinalna 3. Intervalna 4. Omerna Tipovi podataka: 1. Kvalitativni. Kvantitativni

SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku

Eksploracija podataka p Eksploracija podataka uključuje prve dve faze u analizi istraživačkih podataka, tj. pripremu podataka za analizu i njihovo opisivanje, a važna je za razumevanje kvaliteta podataka u bazi i kao početak detekcije onih oblasti u kojima ima najviše informacija. p Priprema podataka za analizu uključuje razvoj i dokumentovanje strukture baze podataka, unošenje podataka u računar, proveru podataka i njihovu eventualnu modifikaciju (promenu, zamenu, transformaciju). p Deskriptivna statistika opisuje osnovne karakteristike podataka.

Preliminarni pregled ili skrining podataka n a) detekcije nedostajućih vrednosti n b) analize frekvencija (učestalosti) n c) otkrivanja neobičnih vrednosti - "autlajera" (engl. outlier) i n d) ispitivanja logičkih veza. p Deo pregleda podataka je i primena različitih operacija modifikacije podataka, kao pripreme za dalji skrining podataka i analizu. Modifikacija obuhvata: n a) redefiniciju podataka n b) transformaciju podataka i n c) procenu nezavisnosti merenja.

Statističko opisivanje podataka p p p p p Mere kondenzovanja podataka n n n n Raspodele empirijskih učestalosti Tabeliranje Grafičko prikazivanje Relativni brojevi (odnosi, proporcije, stope) Mere centralne tendencije (računske i položajne) n Aritmetička sredina, medijana, mod, geometrijska sredina, harmonijska sredina, percentili Mere varijabiliteta (apsolutne i relativne) n Standardna devijacija, varijansa, interkvartilni opseg, binomna varijansa, koeficijent varijacije, standardizovana vrednost, kovarijansa Mere oblika raspodele n Modalnost, asimetričnost, spljoštenost Mere korelacije n

Izbor statističkih mera u funkciji skala merenja u istraživačkom uzorku. Statističke mere** Mere centralne tendencije Mere varijabiliteta Mere asimetrije i spljoštenosti Mere korelacije za dve varijable Mere korelacije za više od dve varijable Relativni brojevi *samo za binarne varijable Skale merenja Omerna i Intervalna Ordinalna Nominalna Aritmetička sredina Geometrijska i harmonijska sredina Opseg Varijansa Standardna devijacija Koeficijent varijacije Z skor Pirsonov koeficijent asimetričnosti α 3 i α 4 Koeficijent linearne korelacije Koeficijent višestruke linearne korelacije Parcijalni koeficijenti korelacije Indeksi i statistički koeficijenti Medijana Kvartili, decili, percentili Interkvartilni opseg Kvartilna devijacija Koeficijent kvartilne varijacije Spirmanov koeficijent korelacije rangova Kendalov koeficijent konkordanse Kendalov tau koeficijent Mod Binomna* varijansa Binomni* koeficijenti asimetrije i spljoštenosti Koeficijent kontingencije Koeficijent kontingencije Proporcije Odnosi Stope **podrazumeva se da se sve statističke mere izračunate u manje informativnim skalama mogu izračunati i kod onih informativnijih

Mere centralne tendencije Statitička mera Aritmetička sredina Harmonijska sredina Geometrijska sredina Medijana Negrupisani podaci grupisani podaci x n n x i i= = 1 ili H= n i= 1 x = n 1 xi k s= 1 fx G= n x1 x x3 x4 xn Vrednost koja odgovara srednjem članu niza uređenog po veličini, mesto medijane određujemo kao n + 1 MMed= ili MMed= f s f Kvartili Q I (i =1,,3) = i n / 4 Decili D I (i =1,,3,..,9) = i n / 10 Percentili P I (i =1,,3,..,99) = i n / 100 Mod Opservacija sa najvećom učestalošću x s je sredina klasnog ili grupnog intervala +1

Mere varijabiliteta Statistička mera Opseg Varijansa Standardna devijacija SD = SD= Negrupisani podaci-grupisani podaci I = max min n i= 1 n i= 1 ( x x) i n 1 ( x x) i n 1 ili SD = ili SD = Koeficijent varijacije CV= 100 Z skor z = SD x x x SD Interkvartilni opseg IO=Q 3 Q 1 Kvartilna devijacija Q3 Q KD= 1 Koeficijent kvartilne varijacije Q3 Q1 V q = 100 Q + Q Binomna varijansa x s je sredina klasnog ili grupnog intervala 3 1 SD = npq k s= 1 k f s= 1 ( x x) f s f ( x x) s f

Mere oblika raspodele p PKA = 3 (aritmetička sredina - medijana) / standardna devijacija p Mera asimetričnosti i mera spljoštenosti

Mere korelacije Statistička mera Pirsonov koeficijent linearne korelacije Spirmanov koeficijent korelacije r = r SD xy = SD SD x y = n Formula n xi yi ( xi )( yi ) xi ( xi ) n yi ( yi ) 6 ρ = 1 d i rangova n( n 1) Koeficijent kontigencije Koeficijent višestruke linearne korelacije Parcijalni koeficijenti korelacije (primer za dve nezavisne varijable - parcijalni koeficijent korelacije izmedju Y i X 1 pri konstantnom X ) Kendalov koeficijent konkordanse Kendalov tau koeficijent R r y.1... k χ C = n + χ ( yˆ y) ( yi y) = R y.1... k = ( r r r )/ ( 1 r )( r ) y1. = y1 y 1 y 1 W= 1 1 k τ = xy. z SD 3 ( n n) χ n 1

SAS i DS 010/011 Statistika za istraživače Katedra za medicinsku statistiku i informatiku

Statističko zaključivanje p Statističko zaključivanje je proces kojim, koristeći rezultate iz uzorka (podatke koje smo dobili istraživanjem), govorimo nešto o populaciji (ukupnost hipotetičkih podataka koje bi mogli dobiti ponavljanjem istraživanja beskonačan broj puta). n Ocenjivanje nepoznatih parametara osnovnog skupa (procenu izgleda populacije samo na osnovu uzorka ) n Testiranje hipoteza (procena verovatnoće da je opservirana razlika između grupa zavisna ili

Ciljna populacija Generalizacija Uzoračka populacija Uzorak Analiza Zaključak

Ocenjivanje populacionih parametara p Ocenjivanje je proces korišćenja informacija iz slučajnog uzorka u cilju donošenja zaključka o vrednosti populacionog parametra. p Ocene mogu biti tačkaste i intervalne. p Intervalne ocene, koje sadrže tačkastu ocenu i varijabilitet te ocene u drugim uzorcima, zovu se intervali poverenja a njihovi krajevi su granice poverenja. x z(ili)t SE µ x + z(ili)t SE

Izabrana deskriptivna statistička mera Aritmetička sredina; (n 30) ili populaciona varijansa poznata Aritmetička sredina; (n<30) ili populaciona varijansa nepoznata Razlika dve aritmetičke sredine sa poznatim populacionim varijansama Razlika dve aritmetičke sredine sa nepoznatim, ali približno sličnim, varijansama Prosečna razlika, varijansa razlika je poznata Prosečna razlika, varijansa razlika je nepoznata Standardna devijacija Odnos varijansi dve normalno raspodeljene populacije Broj uspeha (povoljnih ishoda događaja) Proporcija uspeha Najčešće korišćeni intervali poverenja Uzoračka statistika (S) Populacioni parametar (P) x µ x - x µ x - x 1 - x µ 1 - µ x 1 - x µ 1 - µ t Donja granica poverenja S - k 1-α/ SE z t z α 1 n 1;1 σ ( x 1 - x ) & $ σ1 $ % n1 n α + 1 n α n1 + n ;1 d δ d - d δ d - ( x 1 - x ) - t z Gornja granica poverenja S + k 1-α/ SE x + SD α x + t n σ #!! " & 1 SD $ + % n1 σ d α 1 n n 1;1 ( n 1) s SD σ χ SD 1 /SD X σ 1 /σ nπ* p = x/n π* & $ SD % SD 1 #! n " + t z z α 1 α n 1;1 σ ( x 1 - x )+ & $ σ1 $ % n1 n SD σ n α + 1 n α n1 + n ;1 d + SDd α d + t n 1 α / ( x 1 - x ) z #!! " & 1 SD $ + % n1 σ d α 1 n α n 1;1 ( n 1) s χ α / SD & # & # $! # & # $! $! $ SD1! 1 " $ Fα! $ $!!! ; DF1; DF % SD " F α 1 ; DF % 1 " % ; DF " 1 1 x nπ 1/ nπ (1 π p π 1/(n) π (1 π ) / n nπ (1 π d n x nπ + 1/ p π + 1/(n) π (1 π ) / n 1 n #! "

p Ponekad je u istraživanjima ocenjivanje jedini metod statističkog zaključivanja koji je potreban i dovoljan. To se posebno odnosi na istraživanja čiji je cilj opisivanje novog entiteta ili fenomena, ili opisivanje već poznatih entiteta ali u novim sredinama, različitim okruženjima ili na novim ispitanicima. p I u situacijama kada ovo nije jedini metod statističkog zaključivanja, obavezno se koristi jer daje važnu informaciju o veličini greške, tj. informaciju o odstupanju dobijene ocene - rezultata od prave populacione vrednosti samo zbog slučajnosti (okolnosti da smo formirali taj, a ne neki drugi mogući uzorak iste veličine iz iste populacije).

Testiranje hipoteza p Testiranje hipoteza je deo statističkog zaključivanja koji koristi uzoračke podatke za evaluaciju istinitosti hipoteza o populaciji. p Kao i kod ocenjivanja cilj procesa testiranja hipoteza je generalizacija sa uzorka na populaciju iz koje je uzorak slučajno izabran.

Hipoteza p Hipoteza je jednostavno iskaz o jednoj ili više populacija. p Istraživačka hipoteza je pretpostavka o predikciji ishoda eksperimenta (pretpostavka koja je pokretač istraživanja). p Statistička hipoteza je hipoteza formulisana na takav način da može biti evaluirana odgovarajućim statističkim tehnikama. p Statistička teorija poznaje i proste i složene, jednodimenzionalne i višedimenzionalne hipoteze.

Proces testiranja hipoteza 1. Podaci. Pretpostavke 3. Hipoteze 4. Izbor test statistike 5. Raspodela test statistike 6. Pravilo odlučivanja 7. Izračunavanje test statistike 8. Statistička odluka 9. Istraživački zaključak

4. Izbor odgovarajućeg statističkog testa p Izbor statističkog testa zavisi od: p a) kriterijuma na osnovu kojih ćemo birati statistički test (vrstu i tip) te koju test statistiku će taj test imati i p b) optimalnog izbora u slučajevima kada su za isti istraživački dizajn (i posledično, istraživačko pitanje) mogući alternativni statistički testovi (dva, tri, ili više).

4. Izbor odgovarajućeg statističkog testa a) p p p Prvi od kriterijuma je svakako samo istraživačko pitanje, odnosno već izabrani studijski plan. n n n n a) testiranje razlike/a, testiranje sličnosti oblika raspodela i testiranje povezanosti koje u potpunosti određuju vrstu statističkog testa i b) broj raspoloživih ili potrebnih uzoraka (1,, i više) c) odnos među uzorcima (zavisni i nezavisni uzorci) i d) deskriptivna statistička mera (ili mere), ako ih uopšte ima ili ako su uopšte potrebne, koje su nosilac bilo razlika, bilo sličnosti, bilo povezanosti koje testiramo, koje delimično određuju tip statističkog testa i njegovu test statistiku. Drugi kriterijum odnosi se na definisanje statističkog modela (određivanja prirode populacije iz koje ćemo uzorak izabrati i načina njegovog izbora), kao i načina merenja (neka od četiri skale merenja) varijable (varijabli) od interesa. Ova dva kriterijuma tada u potpunosti određuje i tip statističkog testa i njegovu test statistiku.

4. Izbor odgovarajućeg statističkog testa b) Prvi kriterijum za biranje jednog (između više) statističkih testova je njegova moć (snaga). Podsetimo se da je moć statističkog testa definisana kao verovatnoća odbacivanja H 0 kada je ona stvarno netačna (i zato i treba da bude odbačena), tj.,: p p Moć = 1 - verovatnoća greške II tipa = 1 - β Drugi kriterijum za biranje jednog između više statističkih testova je njegova efikasnost. Meri se količina porasta broja jedinica posmatranja u uzorku koja je potrebna da bi jedan test (B) bio isto toliko moćan koliko i drugi (A): p E (B/A) = (n A / n B ) x 100

Izbor statističkog testa Cilj istraživanja Opisivanje jedne grupe Poređenje jedne grupe sa hipotetičkom vrednošću Poređenje dva nezavisna uzorka Kvantitativno (iz Gausovski raspodeljene populacije) Aritmetička sredina, SD Tačkaste i intervalne ocene Jednouzorački z ili t-test Karakteristike procesa merenja Rangovi, skorovi ili kvantitativno (iz kontinuirano ali ne Gausovski raspodeljene populacije) Medijana, interkvartilni opseg Kolmogorov-Smirnov test Kategorijalni Binomni (dva moguća ishoda) Proporcija, binomna varijansa Hi-kvadrat ili Binomni test z ili t-test za dva nezavisna uzorka Man-Vitnijev test ili Test sume rangova Fišerov test ili hi-kvadrat test z ili t-test za dva Poređenje dva Vilkoksonov test zavisna (mečovana) zavisna uzorka ekvivalentnih parova uzorka MekNemarov test Poređenje tri ili više nezavisnih grupa # Jednofaktorska ANOVA Kraskal-Volisov test Hi-kvadrat test Poređenje tri ili više ANOVA u blokovima ili mečovanih grupa # za nezavisna merenja Fridmanov test Kohranov Q test Kvantifikacija Pirsonova linearna Spirmanova Koeficijent povezanosti između dve varijable # korelacija korelacija rangova kontingencije Predviđanje vrednosti jedne varijable na osnovu izmerenih vrednosti druge varijable # Predviđanje vrednosti jedne na osnovu izmerenih vrednosti dve ili više varijabli # Linearna ili nelinearna regresija Višestruka linearna ili nelinearna regresija Neparametarska regresija Jednostavna (univarijantna) logistička regresija Višestruka (multipla) logistička regresija # Neki od ciljeva istraživanja, pa prema tome i njima odgovarajuće statističke metode, biće izložene u sledećim poglavljima ovog udžbenika.

Najčešće korišćeni statistički testovi u istraživanjima sa jednim uzorkom u funkciji izabranih skala merenja. Skala merenja omerna ili intervalna ordinalna nominalna Statistički testovi z-test; t-test; Test varijanse Kolmogorov-Smirnovljev test; Jednouzorački test nizova Binomni test; Hi-kvadrat test slaganja

Najčešće korišćeni statistički testovi i njihove test statistike u funkciji istraživačkog cilja (u istraživanjima sa jednim uzorkom) Istraživački cilj Statistički test Test statistika H 0 : µ = µ 0 z-test z = x - µ 0 / (σ/ n) H 0 : π = π 0 z-test z = p - π 0 / (σ/ n) H 0 : µ = µ 0 t-test t = x - µ 0 / (SD/ n) Kada je H 0 tačna test statistika se raspodeljuje kao? raspodela (sa? broja stepena slobode) Standardna normalna raspodela Standardna normalna raspodela t-raspodela sa DF=n-1 Tablica XII H 0 : π = π 0 t-test t = p - π 0 / (SD/ n) t-raspodela sa DF=n-1 H 0 : σ = σ 0 Test varijanse χ = (n-1)sd / σ 0 χ raspodela sa DF=n-1 Slaganje empirijske sa hipotetičkom raspodelom Slaganje empirijske sa hipotetičkom raspodelom χ - test slaganja Kolmogorov- Smirnovljev test H 1 : ρ 0 t-test t = χ = (f-f) / F ili χ = (f-f, ) / f, ili često kao χ = (O-E) / E D = maximum F ( X ) F ( X ) & $ % s r 1 r t χ raspodela sa DF=k - r Tablica XI # n! ) t raspodela sa DF=n- " H 0 : α = α 0 t-test t = a - α 0 / SE a t raspodela sa DF=n- H 0 : β = β 0 t-test t = b - β 0 / SE b t raspodela sa DF=n- H 0 : ρ = c z-test z = z - z c / Slučajnost opservacija H 0 : π = π 0 Jednouzorački test nizova Binomni test 1 n određivanje broja nizova u, u n ispitanika 3 a za n 1 ili n veće od 0 u µ u 0. 5 z = x i = 0 σ ( n % & # p ' i $ u i i q n za n 5 i p između 0.3 i 0.7; za p manje od 0.3 i veće od 0.7 i npq 9 z= (x±0.5) -np / npq ; Standardna normalna raspodela Tačne verovatnoće Standardna normalna raspodela Tačne verovatnoće iz binomne raspodele Standardna normalna raspodela

Najčešće korišćeni statistički testovi u istraživanjima sa dva uzorka u funkciji izabranih skala merenja. Skale merenja dva zavisna uzorka dva nezavisna uzorka omerna ili intervalna z-test; t-test; F-test za odnos dve z-test; t-test; Randomizacioni varijanse; Randomizacioni test za test za vezane uzorke dva nezavisna uzorka ordinalna Test predznaka; Vilkoksonov Test medijane; Test sume test ekvivalentnih parova rangova; Man-Vitnijev test nominalna MekNemarov test Fišerov test tačne verovatnoće; Hi-kvadrat test nezavisnosti i homogenosti

Najčešće korišćeni statistički testovi i njihove statistike u funkciji istraživačkog cilja (u istraživanjima sa dva zavisna uzorka). Istraživački cilj Statistički test Test statistika H 1 : µ d 0* z-test z d µ /( n ) / d σ 0 d Kada je H 0 tačna test statistika se raspodeljuje kao? raspodela (sa? broja stepena slobode) = Standardna normalna raspodela H 1 : µ d 0* t-test t = d µ d / SE 0 d t-raspodela sa DF=n-1 H 1 : µ d 0* Test ekvivalentnih parova T, = m(n+1) T za n>5: z = T - µ T / σ T Posebne tablice Standardna normalna raspodela H 1 : a d** MekNemarov test χ = ( a - d - 1) / a+d χ sa DF=1 H 1 : µ d 0* H 1 : P(X A >X B ) P(X B >X A ) ili P(+) P(- ) 0.5** Randomizacioni test Test predznaka d (za n manje od 13) z =( d - µ ) / σ za n <1 i p=0.5, ili za n 5: P(k x n,p) = n C k p k q n-k, inače z =( k ± 0.5) - 0.5n / 0.5 n *ovo je za dvosmerno testiranje; inače može biti samo >0 ili <0; ** isto, samo P(+) < P(- ) ili P(+) > P(- ) Tačna verovatnoća p Standardna normalna raspodela Tačne verovatnoće binomne raspodele Standardna normalna raspodela

Najčešće korišćeni statistički testovi i njihove statistike u funkciji istraživačkog cilja (u istraživanjima sa dva nezavisna uzorka) Istraživački cilj Statistički test Test statistika H 1 : µ 1 - µ 0* z-test z = ( x1 x ) - ( µ 1 - µ ) 0 / & $ σ 1 % n1 # &! σ + $ " % n ##!! "! " Kada je H 0 tačna, test statistika se raspodeljuje kao? raspodela (sa? broja stepena slobode) Standardna normalna raspodela H 1 : π 1 - π 0* z-test z = (p 1 - p ) - (π 1 - π ) 0 / σ p1-p Standardna normalna raspodela H 1 : µ 1 - µ 0* t-test t = ( x1 x ) - ( µ 1 - µ ) 0 / SE x1-x t-raspodela sa DF=n 1 +n - H 1 : π 1 - π 0* t-test t = (p 1 - p ) - (π 1 - π ) 0 / SE p1-p t-raspodela sa DF= n 1 +n - H 1 : σ 1 / σ 1* Test varijansnog količnika F = SD 1 / SD F raspodela sa DF 1 =n 1-1 i DF =n -1 H 1 : ρ 1 - ρ 0* t-test Z = z 1 - z / SE z 1 - z Standardna normalna raspodela H 1 : α 1 - α 0* t-test a 1 - a / SE a 1 - a t raspodela sa DF= n 1 +n - 3 H 1 : β 1 - β 0* t-test b 1 - b / SE b1 - b t raspodela sa DF=n 1 +n -4 H 1 : dva kriterijuma klasifikacije nisu nezavisna H 1 : Uzorci ne potiču iz iste populacije H 1 : Učestalost ispitanika sa karakteristikom od interesa nije ista u obe populacije H 1 : Med 1 Med ** H 1 : Med 1 Med ** H 1 : µ 1 - µ 0* Hi-kvadrat test nezavisnosti Hi-kvadrat test homogenosti Fišerov test tačne verovatnoće Test medijane Test sume rangova Man-Vitnijev U test Randomizacioni test nizova za dva nezavisna uzorka χ = (O-E) / E; Jejtsova korekcija i Mood-ov izraz χ = (O-E) / E; Jejtsova korekcija i Mood-ov izraz p 1 = (a+b)!(c+d)!(a+c)!(b+d)! / a!b!c!d!n! i svi p za još ekstremnije slučajeve χ = n ( ad - bc - n/) / (a+b)(c+d)(a+c)(b+d) gde je tablica kontingencije formirana po značenju medijane U = n 1 n + n 1 (n 1 +1)/ - R 1 z =( U - µ U ) / σ U za velike uzorke, preko 0 p = 1 / (n 1 + n nad n 1 ) t-statistika χ -raspodela sa DF=(k- 1)(r-1) χ -raspodela sa DF=(k- 1)(r-1) Tačna verovatnoća zbira p-ova χ -raspodela sa DF=(k- 1)(r-1) Posebne tablice Standardna normalna raspodela Tačna verovatnoća t-raspodela da DF=n 1 +n - *dvosmerna radna hipoteza, a može biti i jednosmerna oblika µ 1 - µ < 0 ili µ 1 - µ > 0; ** može i > ili < kada je jednosmerno testiranje u pitanju

Testiranje hipoteza 0.95 α / α / Kritična vrednost Kritična vrednost

Matrica statističkog odlučivanja Naš zaključak Nulta hipoteza tačna U prirodi Nulta hipoteza pogrešna Prihvatamo nultu hipotezu Odbacujemo nultu hipotezu 1- α α greška prvog tipa β greška drugog tipa 1- β