Binomna, Poissonova i normalna raspodela Dejana Stanisavljević januar, 2012. godine
Identifikacija empirijske raspodele učestalosti Teorijske raspodele verovatnoća opisuju očekivano variranje ishoda nekog dogadjaja u populaciji Specifični matematički modeli raspodela verovatnoća opisuju se : 1. Funkcijom ili zakonom verovatnoće 2. Matematičkim očekivanjem 3. Varijansom
Identifikacija empirijske raspodele učestalosti 1. Tabelarni i grafički prikaz empirijske raspodele, uočavanje oblika raspodele i formulisanje pretpostavke o mogućem modelu teorijske raspodele 2. Deskripcija empirijske raspodele 3. Deskripcija pretpostavljene teorijske raspodele 4. Formiranje distribucije teorijskih učestalosti 5. Procena slaganja empirijskih i teorijskih učestalosti nekim od testova slaganja
Binomna raspodela Binomna raspodela je diskontinuirana teorijska raspodela verovatnoća Prekidnu slučajno promenljivu veličinu koja sledi zakone binomnog rasporedjivanja opisuje Bernulijev proces čija je karakteristika višestruko ponavljanje istog eksperimenta Osobine pojedinačnog Bernulijevog eksperimenta: 1. postoje dva medjusobno isključiva ishoda (dihotomni ili binarni ishodi) 2. verovatnoće ishoda od interesa (obeležava se sa p) i drugog ishoda (obeležava se sa q) konstantne su od eksperimenta do eksperimenta 3. eksperimenti su nezavisni
Binomna raspodela Definisana je sa dva parametra: n (veličina uzorka ili broj ponavljanja eksperimenta) p ( verovatnoća ishoda od interesa) Parcijalne tzv. binomne verovatnoće (verovatnoća x očekivanih ishoda u grupi od n pacijenata) mogu se dobiti primenom funkcije binomne verovatnoće: P x x nx p (1 p ) x! n! n x!
Deskriptivni parametri binomne raspodele Aritmetička sredina μ = np Varijansa σ 2 = np(1-p) Standardna devijacija σ = np( 1 p)
Primer. Letalitet od neke bolesti iznosi 0,3. Kolika je verovatnoća da će doći do smrtnog ishoda kod sva tri pacijenta sa ovim oboljenjem? p = 0,3 q = 0,7 n = 3 x = 3 p( x 3) 3! 3! (3 3)! 0,3 3 0,7 0 3! 3! 0! 0,3 3 0,7 0 0,027
Verovatnoće binomne raspodele za n=3 i p=0.5 x p 0 0.125 1 0.375 2 0.375 3 0.125 1.000 0,4 Verovatnoća 0,3 0,2 0,1 0 0 1 2 3
Poissonova raspodela Teoretska raspodela verovatnoća za opisivanje retkih dogadjaja u vremenu ili prostoru Diskretna raspodela verovatnoća za koju važi: Pojavljivanja dogadjaja su nezavisna Teoretski, moguć je beskonačan broj pojavljivanja dogadjaja u jednom intervalu Verovatnoća pojedinačnog pojavljivanja događaja u datom intervalu proporcionalna je dužini intervala Matematičko očekivanje je jednako varijansi 2
Poissonova raspodela Primeri moguće primene u analizi: raspodele retkih bolesti u različitim delovima zemlje broja zahteva za hitnu medicinsku intervenciju broja mutacija u lancu DNA za dati nivo radijacije broj bakterijskih kolonija, ili broja bakterija u preparatu broja nesreća broja recidiva
Funkcija verovatnoća Poissonove raspodele Verovatnoća pojavljivanja slučajnog dogadjaja odredjuje se po funkciji Poasonove verovatnoće: P x e x x broj pojavljivanja slučajnog događaja u datom intervalu prostora ili vremena, - parametar Puasonove raspodele i predstavlja prosečan broj pojavljivanja događaja u jednici prostora ili vremena, e 2.72 (osnova prirodnih logaritama) x!
Verovatnoća za nula događaja (x=0) dobija se iz tablice ili pomoću formule: P 0 e 0 0! e Verovatnoće za jedan, dva ili više (x=1, 2,...) događaja mogu se dobiti rekurzivnim formulama: P P P 1 2 P P 0 1 2 3 P2 3
Primer: Broj porođaja po danima u jednoj opštini u vremesnkom periodu od 110 dana iznosio je: broj porođaja 0 1 2 3 4 5 6 7 8 9 10 u jednom danu broj dana 2 10 18 23 22 16 10 5 3 0 1 a) Kolika je verovatnoća da u jednom danu budu dva porođaja? b) Kolika je verovatnoća da u jednom danu bude manje od 3 porođaja?
Prosečan broj porođaja po jednom danu iznosio je: =412/110=3.75 Verovatnoća da u jednom danu ne bude porođaja iznosi: P(0) = 0.024 a) Verovatnoća da u jednom danu budu dva porođaja oznosi: P(2) = 0.166 b) Verovatnoća da u jednom danu bude manje od 3 porođaja iznosi: P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278
Normalna raspodela Kontinuirana raspodela verovatnoća Funkcija verovatnoća normalne raspodele: f ( x ) 1 2 2 ( x ) e sredina, 2 varijansa, 3.14, e 2.72 f(x) 2 2 σ μ X
Osobine normalne raspodele Kontinuirana raspodela verovatnoća Unimodalna, zvonasta kriva Simetrična oko sredine Potpuno opisana parametrima i Dobra aproksimacija za mnoge biološke varijable Osnova u procesu statističkog zaključivanja
Osobine normalne raspodele U intervalu ± 1 nalazi se 68% vrednosti U intervalu ± 2 nalazi se 95% vrednosti U intervalu ± 3 nalazi se 99.7% vrednosti
Standardna normalna raspodela Sve normalne raspodele mogu biti pretvorene u standardnu normalnu raspodelu oduzimanjem aritmetičke sredine od svake vrednosti i deljenjem sa standardnom devijacijom čime se dobijaju standardni skorovi ili z-skorovi: Standardna normalna raspodela ima =0 i =1. 0.4 0.3 0.2 0.1 Z X -2-1 0 1 2 3
Tabele površine ispod krive standardne normalne raspodele Tabele pokazuje površine odnosno verovatnoće da neka vrednost bude veća ili manja od specifikovane standardne vrednosti. Ako tabela pokazuje površine od - do z 0 onda vrednosti u toj tabeli pokazuju verovatnoće: P(zz 0 ) Uz pomoć tabela se može izračunati verovatnoća da se neka vrednost nađe između dve specifikovane standardne vrednosti
Tabele površine ispod krive standardne normalne raspodele Primer: Telesna masa određene populacije dece je normalno raspoređena sa aritmetičkom sredinom 14kg i SD 2.5kg. Kolika je verovatnoća da će slučajno izabrano dete imati telesnu masu između 10kg i 17kg? 1014 1714 z1 1.6 z2 1. 2 2.5 2.5 P(10x 17)=P(-1.6z 1.2)= P(z 1.2)- P(z -1.6)= 0.8849-0.0548=0.8301
Provera normalnosti raspodele 1. CV>30% ukazuje na odstupanje od normalne raspodele. 2. Statističko testiranje normalnosti: Hi kvadrat test, Kolmogorov-Smirnov test i Shapiro-Wilk test Ako je p<0.05 u ovim testovima, empirijska raspodela statistički značajno odstupa od normalne raspodele.
Provera normalnosti raspodele Grafičke metode: 3. Histogram vizuelna procena da li je empirijska raspodela slična zvonastoj simetričnoj raspodeli. 4. Normalni Q Q grafikon. Ako je raspodela normalna tačke će biti na pravoj liniji. Odstupanje tačaka od prave linije ukazuje na odstupanje raspodele od normalne. 5. Detrendovan normalni Q Q grafikon. Ako je raspodela normalna tačke će biti ravnomerno raspoređene iznad i ispod horizontalne linije. Ako raspodela nije normalna raspored tačaka će imati neki oblik kao npr. slovo J.
Provera normalnosti raspodele 6. Grafikon kutije ( boxplot ) Ako postoji nekoliko ekstremnih vrednosti ili neobičnih vrednosti na bilo kom kraju raspodele to ukazuje na odstupanje od normalne raspodele. Ako medijana nije u centru grafikona kutije već je znatno bliža jednom od krajeva kutije, to ukazuje na odstupanje od normalne raspodele.