(BIO)STATISTIKA. seminari. smjer: Prehrambena tehnologija i Biotehnologija. pripremila: dr.sc. Iva Franjić

Σχετικά έγγραφα
3 Populacija i uzorak

Slučajne varijable Materijali za nastavu iz Statistike

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

(BIO)STATISTIKA. skripta. studij: Prehrambena tehnologija i Biotehnologija. doc. dr. sc. Iva Franjić 2012.

3.1 Granična vrednost funkcije u tački

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

1 Promjena baze vektora

Matematička analiza 1 dodatni zadaci

Riješeni zadaci: Limes funkcije. Neprekidnost

ELEKTROTEHNIČKI ODJEL

PISMENI ISPIT IZ STATISTIKE

1.4 Tangenta i normala

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

numeričkih deskriptivnih mera.

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

Sadrˇzaj. Sadrˇzaj 1. 4 UVJETNA VJEROJATNOST Ponovimo... 14

7 Algebarske jednadžbe

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

Linearna algebra 2 prvi kolokvij,

Funkcije dviju varjabli (zadaci za vježbu)

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

TRIGONOMETRIJSKE FUNKCIJE I I.1.

Linearna algebra 2 prvi kolokvij,

Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika

18. listopada listopada / 13

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

VJEROJATNOST popravni kolokvij veljače 2017.

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Operacije s matricama

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

2. OSNOVNI POJMOVI TEORIJE VJEROJATNOSTI

RIJEŠENI ZADACI I TEORIJA IZ

Diskretan slučajni vektor

5. Karakteristične funkcije

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

16 Lokalni ekstremi. Definicija 16.1 Neka je A R n otvoren, f : A R i c A. Ako postoji okolina U(c) od c na kojoj je f(c) minimum

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

Determinante. a11 a. a 21 a 22. Definicija 1. (Determinanta prvog reda) Determinanta matrice A = [a] je broj a.

Riješeni zadaci: Nizovi realnih brojeva

Uvod u vjerojatnost i matematičku statistiku

IZVODI ZADACI (I deo)

Teorijske osnove informatike 1

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

Osnovne teoreme diferencijalnog računa

Matematika 1 - vježbe. 11. prosinca 2015.

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

( , 2. kolokvij)

Slučajni procesi Prvi kolokvij travnja 2015.

SISTEMI NELINEARNIH JEDNAČINA

III VEŽBA: FURIJEOVI REDOVI

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo:

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

Skup svih mogućih ishoda datog opita, odnosno skup svih elementarnih događaja se najčešće obeležava sa E. = {,,,... }

Statistika i osnovna mjerenja

41. Jednačine koje se svode na kvadratne

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

VJEROJATNOST 1. kolokvij studenog 2013.

Elementi spektralne teorije matrica

( x) ( ) ( ) ( x) ( ) ( x) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Numerička matematika 2. kolokvij (1. srpnja 2009.)

Uvod u vjerojatnost i statistiku

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Slučajni vektor. Poglavlje 3

6 Polinomi Funkcija p : R R zadana formulom

U teoriji vjerojatnosti razmatraju se događaji koji se mogu, ali ne moraju dogoditi. Takvi se događaji zovu slučajnim događajima.

MJERA I INTEGRAL 2. kolokvij 30. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!)

Uvod u teoriju brojeva

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

( ) ( ) 2 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET. Zadaci za pripremu polaganja kvalifikacionog ispita iz Matematike. 1. Riješiti jednačine: 4

Jednodimenzionalne slučajne promenljive

POVRŠINA TANGENCIJALNO-TETIVNOG ČETVEROKUTA

VJEŽBE 3 BIPOLARNI TRANZISTORI. Slika 1. Postoje npn i pnp bipolarni tranziostori i njihovi simboli su dati na slici 2 i to npn lijevo i pnp desno.

( ) ( ) Zadatak 001 (Ines, hotelijerska škola) Ako je tg x = 4, izračunaj

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

Vjerojatnost i statistika

MATEMATIKA 1 8. domaća zadaća: RADIJVEKTORI. ALGEBARSKE OPERACIJE S RADIJVEKTORIMA. LINEARNA (NE)ZAVISNOST SKUPA RADIJVEKTORA.

Statistika. primjeri i zadaci. Ante Mimica, Marina Ninčević. 30. kolovoza 2010.

Dijagonalizacija operatora

UVOD DEFINICIJA: Statistika planiranje i provođenje pokusa skupljanje podataka interpretacija

LINEARNA ALGEBRA 1, ZIMSKI SEMESTAR 2007/2008 PREDAVANJA: NENAD BAKIĆ, VJEŽBE: LUKA GRUBIŠIĆ I MAJA STARČEVIĆ

4. poglavlje (korigirano) LIMESI FUNKCIJA

PRIMJER 3. MATLAB filtdemo

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

5. lekcija. Kontinuirane slučajne varijable.

Transcript:

(BIO)STATISTIKA seminari smjer: Prehrambena tehnologija i Biotehnologija pripremila: dr.sc. Iva Franjić

Sadržaj DESKRIPTIVNA STATISTIKA 4. Grafički prikaz podataka..................... 4. Srednje vrijednosti uzorka.................... 9.. Aritmetička sredina uzorka................ 9.. Medijan uzorka...................... 0..3 Uzorački mod....................... 0.3 Mjere disperzije ili varijabiliteta..................3. Raspon uzorka.......................3. Interkvartil.........................3.3 Uzoračka varijanca i uzoračka standardna devijacija.. 4.4 Mjere lokacije........................... 5.5 Mjere oblika............................ 9.6 Linearna regresija......................... 0 Slučajni uzorak i osnovne razdiobe. Slučajni uzorak........................... Osnovne razdiobe......................... 7.. Diskretne slučajne varijable............... 7.. Binomna razdioba.................... 3..3 Hipergeometrijska razdioba............... 35..4 Poissonova razdioba................... 38..5 Aproksimacija binomne razdiobe Poissonovom..... 4.3 Uvjetna vjerojatnost. Nezavisni dogadaji............ 43.4 Bayesova formula......................... 46.5 Neprekidne slučajne varijable.................. 48.5. Normalna razdioba.................... 5.5. Aproksimacija binomne razdiobe normalnom...... 55.5.3 Eksponencijalna razdioba................ 56

3 Procjena parametara 60 3. Pouzdani intervali za očekivanje normalne populacije..... 60 3.. Varijanca poznata..................... 60 3.. Varijanca nepoznata................... 63 3. Pouzdani intervali za očekivanje populacije na osnovi velikih uzoraka.............................. 65 3.. Pouzdan interval za parametar p binomne razdiobe.. 66 4 Testiranje statističkih hipoteza 68 4. Test o očekivanju normalno distribuirane populacije...... 69 4.. Varijanca poznata..................... 69 4.. Varijanca nepoznata................... 73 4. Testovi o očekivanju na osnovi velikih uzoraka......... 75 4.. Test o proporciji..................... 75 4.3 Usporedba očekivanja dviju normalno distribuiranih populacija (t-test).............................. 77 4.4 Usporedba proporcija....................... 80 4.5 Usporedba varijanci dviju normalno distribuiranih populacija (F-test).............................. 83 4.6 χ - test o prilagodbi modela podacima............. 86 4.7 χ - test nezavisnosti dviju varijabli............... 9 4.8 χ - test homogenosti populacija................. 95 4.9 Usporedba očekivanja više normalno distribuiranih populacija (jednofaktorska analiza varijance ANOVA).......... 99 4.0 Test koreliranosti dviju varijabli................. 03 5 Linearni regresijski model 07 3

DESKRIPTIVNA STATISTIKA Prilikom opažanja ili eksperimentiranja, pažnja istraživača redovito je usmjerena na jednu ili više veličina. Ako se promatra samo jedna veličina, označimo ju s X, onda je rezultat jednog mjerenja jedan realan broj x. Višestrukim ponavljanjem mjerenja veličine X dobiva se konačni niz brojeva x, x,..., x n kao rezultat n ponovljenih mjerenja koji nazivamo realizacija od X. Veličina X obično se naziva statističko obilježje, a dobiveni niz brojeva x, x,..., x n statistički podaci o promatranom statističkom obilježju X.. Grafički prikaz podataka Primjer Neka X označava broj dobiven bacanjem igrače kocke. Kocku smo bacali 0 puta i dobiveni su sljedeći podaci:, 3,, 6,, 6, 4, 6, 3, 3, 4, 3,, 4, 4,, 4, 5, 3, 5. statističko obilježje X = broj na kocki ImX = {,, 3, 4, 5, 6} skup svih vrijednosti koje X može poprimiti u našem primjeru, ImX je diskretan, tj. konačan skup, pa kažemo da je X diskretno obilježje obilježje može biti numeričko ili nenumeričko nenumeričko obilježje nazivamo i kategorija; npr. spol, boja i slično; možemo mu pridijeliti neku numeričku vrijednost, ali tada nema smisla računati npr. aritmetičku sredinu podataka! svakom elementu a i ImX možemo pridružiti broj f i frekvencija (učestalost) pojavljivanja elementa a i u nizu podataka broj f ri = f i n : relativna frekvencija od a i (n je broj ponavljanja pokusa, u ovom primjeru n = 0) Prikažimo podatke u TABLICI FREKVENCIJA 4

a i f i f ri 4 4 0 0 3 5 5 0 4 5 5 0 5 0 6 3 3 0 Σ 0.00 GRAFIČKI PRIKAZ PODATAKA POMOĆU STUPČASTOG DIJA- GRAMA (BAR - CHART) 5 4 3 3 4 5 6 Stupčasti dijagram može se crtati i tako da ukupna površina stupića bude jednaka, što je bolje zbog usporedbe, npr. za različite n: 0.5 0. 0.5 0. 0.05 3 4 5 6 5

Primjer U uzorku od 44 ribe ulovljene u Bračkom kanalu, bilo je 36 lokardi, zubataca i 96 srdela. vrsta ribe frekvencija relativna frekvencija lokarde 36 36 = 0.5 44 5% zubaci = 0.083 44 8.3% srdele 96 96 = 0.667 44 66.7% Σ 44.00 00% HORIZONTALNI STUPČASTI DIJAGRAM lokarde 0.5 zubaci 0.083 srdele 0.667 0. 0.4 0.6 0.8 STRUKTURNI KRUG (PIE CHART) -ako imamo relativno malo različitih vrijednosti koje statističko obilježje može poprimiti 67 % srdele 8 % zubaci 5 % lokarde 6

Primjer 3 Nacrtajmo histogram za podatke iz Primjera. svaka susjedna stupića se dodiruju i svaki ima težište u vrijednosti visina f i ili f ri površina svakog stupića jednaka je relativnoj frekvenciji pa je površina ispod cijelog grafa jednaka je nema smisla za nenumeričke vrijednosti 0.5 0. 0.5 0. 0.05 3 4 5 6 Primjer 4 Mjerena je visina (u metrima) 30 0-ogodišnjaka. Dobiveni su podaci:.85,.88,.78,.7,.80,.7,.75,.7,.79,.8,.69,.76,.60,.78,.76,.74,.70,.86,.7,.75,.69,.79,.83,.79,.65,.76,.59,.68,.74,.86. statističko obilježje X = visina neprekidno statističko obilježje (poprima vrijednosti iz nekog intervala) podatke najprije moramo svrstati u razrede:. odredimo x min i x max : x min =.59, x max =.88. izaberemo adekvatan broj razreda (okvirno: n) k = 6 3. odredimo zajedničku širinu razreda: c = x max x min k = (uvijek zaokružujemo na više!).88.59 6 = 0.0483 c=0.05 7

4. odredimo razrede (tj. lijevi prag razreda): I,..., I k pritom I I... I k mora obuhvaćati sve podatke I i = [a i,, a i, ], a i, = a i+, I i+ = [a i+,, a i+, ] RAZREDI f i f ri = f i /n f ri /c I = [.585,.635] 0.067.34 I = [.635,.685] 0.067.34 I 3 = [.685,.735] 7 0.33 4.66 I 4 = [.735,.785] 9 0.3 6 I 5 = [.785,.835] 6 0. 4 I 6 = [.835,.885] 4 0.33.66 Σ 30 0 Nacrtajmo histogram za ove podatke. (sada je jednaka širini razreda, tj. Širina stupića više nije proizvoljna c=0.05), pa da bi suma površina svih pravokutnika (odnosno površina ispod grafa) bila jednaka, na ordinatu ucrtavamo fr i c a ne f ri. Naime, 0 c = 0 0.05 =. 6 5 4 3.635.685.735.785.835.885 8

STEM AND LEAF DIJAGRAM stem leaf.5 9.6 90958.7 8596864059964.8 580636 stem leaf.5 9.6 0.6 5899.7 404.7 8596865996.8 03.8 5866. Srednje vrijednosti uzorka.. Aritmetička sredina uzorka Aritmetička sredina uzorka je broj x := n (x + x +... + x n ). Ako je ImX = {a, a,..., a k } i pritom se a i u uzroku ponavlja f i puta, tada x = n k f i a i, n = k f i. - ima smisla samo za numeričke podatke Primjer 5 Izračunajte x za podatke iz Primjera 4. Rješenje: x = (.59 +.60 +.65 +.68 +.69 + 4.7 +.70 +.74 +.75 30 +3.76 +.78 + 3.79 +.80 +.8 +.83 +.85 +.86 +.88) = 5.57.75 30 9

.. Medijan uzorka uredimo podatke (sortiramo ih po veličini): x () x ()... x (n) ima smisla samo za numeričke podatke Medijan uzorka je broj za koji vrijedi da je 50% svih podataka manje od ili jednako njemu i 50% svih podataka veće od ili jednako njemu. Ako je broj podataka neparan, tj n = k, k N, tada je m = x (k). Za paran n (n = k), vrijedi Općenito, m = x ( n+ ). Vrijedi m = x (k) + x (k+). x ( p q ) = x (k+ r q ) x ( p q ) := x (k) + r q ( x(k+) x (k) ) Primjer 6 Nadite medijan uzorka za podatke iz Primjera. Rješenje: Sortiramo podatke po veličini: 3 3 3 3 3 4 4 4 4 4 5 5 6 6 6 n = 0 = 0 m = x (0) + x () = 3 + 4 = 3.5..3 Uzorački mod Mod je ona vrijednost statističkog obilježja koja se u uzorku javlja s najvećom frekvencijom. koristan kod statističkih obilježja koja nisu numerička, pa nema aritmetičke sredine 0

BIMODALNI UZORAK: uzorak u kojem postoje vrijednosti s jednakom frekvencijom UNIMODALNI UZORAK: uzorak u kojem postoji samo jedan mod Ako svi podaci imaju istu frekvenciju pojavljivanja u uzorku, tada uzorak nema mod. Primjer 7 Nadite mod za podatke iz Primjera i 4. Rješenje: u Primjeru : mod = 3 & mod=4 bimodalan uzorak u Primjeru 4: mod =.7.3 Mjere disperzije ili varijabiliteta.3. Raspon uzorka Neka je x () x ()... x (n) uredeni niz podataka. Broj naziva se raspon uzorka. d = x (n) x () Primjer 8 Odredite raspon uzorka iz Primjera 4. Rješenje: d =.88.59 = 0.9

.3. Interkvartil Donji kvartil q L je ona vrijednost uzroka za koju vrijedi da je 5% svih podataka manje ili jednako od nje i 75% svih podataka veće ili jednako od nje. q L = x ( n+ 4 ) Gornji kvartil q U je ona vrijednost uzroka za koju vrijedi da je 75% svih podataka manje ili jednako od nje i 5% svih podataka veće ili jednako od nje. Interkvartil: d q = q U q L q U = x ( 3(n+) 4 ) Primjer 9 Odredite interkvartil za podatke iz Primjera 4. Rješenje: q L = x ( n+ 4 ) = x ( 30+ ) = x (7+ 3 4 4 ) = x (7) + 3 ( ) x(8) x (7) 4 =.70 + 3 (.7.70) =.75.7 4 q U = x = x 3(n+) ( ) ( 93 4 4 ) = x (3+ 4 ) = x (3) + ( ) x(4) x (3) 4 =.79 + (.80.79) =.795.79 4 d q = q U q L =.79.7 = 0.07 Uredenu petorku (x (), q L, m, q U, x (n) ) zovemo karakteristična petorka uzorka. Pomoću nje crtamo tzv. box and whisker dijagram, odnosno dijagram pravokutnika. Primjer 0 Nacrtajte box and whisker dijagram za podatke iz Primjera 4. x () =.59, q L =.7, m =.75, q U =.79, x (30) =.88, d q = 0.07

.6.65.7.75.8.85 Zadatak U tablici su dane težine 00 studenata PBF-a. Nacrtajte histogram, nadite aritmetičku sredinu, medijan te interkvartil ovog uzorka. težina (kg) broj studenata sredina razreda f ri f ri /c 60 6 5 6 0.05 0.07 63 65 8 64 0.8 0.06 66 68 4 67 0.4 0.4 69 7 7 70 0.7 0.09 7 74 8 73 0.08 0.07 Σ 00 0.334 Rješenje: 0.4 0. 0. 0.08 0.06 0.04 0.0 6.5 65.5 68.5 7.5 74.5 3

Aritmetička sredina: x = (6 5 + 64 8 + 67 4 + 70 7 + 73 8) = 67.45 00 Medijan: U prva razreda upada 5+8=3 podataka, a u prva 3 razreda 5+8+4=65 podataka, što znači da se medijan nalazi negdje unutar 3.razreda, tj. 65.5 m 68.5. Medijan dobivamo interpolacijom: m = 65.5 + 7 7 (68.5 65.5) = 65.5 + 4 4 3 = 67.43 Vrijednost medijana može se očitati i sa histograma - medijan je apscisa koja odgovara liniji koja dijeli histogram na dijela jednake površine. Interkvartil: Najprije moramo odrediti donji i gornji kvartil. Postupak je sličan kao kod odredivanja medijana - donji kvartil nalazi se negdje unutar 3.razreda tj. 65.5 q L 68.5, dok se gornji kvartil nalazi unutar 4.razreda (budući prva 3 razreda sadrže 65, a prva 4: 5+8+4+7=9 podatka), tj. 68.5 q U 7.5. Imamo: q L = 65.5 + (68.5 65.5) = 65.5 + 4 4 3 = 65.643 q U = 68.5 + 0 0 (7.5 68.5) = 68.5 + 7 7 3 = 69.6 d q = q U q L = 69.6 65.643 = 3.967 Definirajmo još i koeficijent kvartilne varijacije: v q = d q q L + q U -koristan kada varijabilitet želimo izraziti pomoću RELATIVNE veličine (neovisne o mjernim jedinicama).3.3 Uzoračka varijanca i uzoračka standardna devijacija Uzoračka varijanca: s = n n (x i x) 4

Uzoračka standardna devijacija: Vrijedi: s = + s s = = = n n n n (x i x) = n (x i x i x + x ) n ( n ) n n x i x x i + x ( n ) x i n x ( n ) = x i n x + n x n Ovaj oblik formule je puno praktičniji za računanje. Ako se u uzroku x, x,..., x n vrijednosti a, a,..., a k pojavljuju s frekvencijom f, f,..., f k, onda vrijedi: s = n k (a i x) f i = n ( k ) f i a i n x Primjer Izračunajte uzoračku varijancu s i uzoračku standardnu devijaciju s za podatke iz Primjera 4. Rješenje: s = n ( k ) f i a i n x = [ (.59 +.60 +.65 +.68 +.69 9 +.70 + 4.7 +.74 +.75 + 3.76 +.78 + 3.79 +.80 +.8 +.83 +.85 +.86 +.88 ) 30.75 ] 0.005 s = + s = 0.07.4 Mjere lokacije Medijan, te gornji i donji kvartil spadaju u mjere lokacije. Tu su još i: 5

DECILI: k-ti uzorački decil je broj D k = x ( k(n+) 0 ), k =,,..., 9 (k/0 podataka je manje ili jednako njemu) PERCENTILI: k-ti uzorački percentil je broj P k = x ( k(n+) 00 ), k =,,..., 99 (k% podataka je manje ili jednako njemu) decili su specijalni slučaj percentila: D = P 0, D = P 0,..., D 9 = P 90 Zadatak Izmjeren je kapacitet na 485 istovrsnih kondenzatora. Rezultati mjerenja su dani sljedećom tablicom frekvencija (podaci su u µf zaokruženi na dvije decimale) i razred f i ā i d i f i d i f i d i f ri F i 9.58 9.6 3 9.60 6 8 08 0.006 0.006 9.63 9.67 5 9.65 5 5 5 0.00 0.06 3 9.68 9.7 5 9.70 4 0 80 0.00 0.06 4 9.73 9.77 0 9.75 3 60 80 0.04 0.067 5 9.78 9.8 35 9.80 70 40 0.07 0.39 6 9.83 9.87 74 9.85 74 74 0.53 0.9 7 9.88 9.9 9 9.90 0 0 0 0.90 0.48 8 9.93 9.97 83 9.95 83 83 0.7 0.653 9 9.98 0.0 70 0.00 40 80 0.44 0.797 0 0.03 0.07 54 0.05 3 6 486 0. 0.908 0.08 0. 7 0.0 4 08 43 0.056 0.964 0.3 0.7 0.5 5 60 300 0.05 0.989 3 0.8 0. 0.0 6 7 0.004 0.993 4 0.3 0.7 3 0.5 7 47 0.006 0.999 Σ 485 39 507 6

() Nacrtajte histogram. (DZ) () Kako bi procijenili aritmetičku sredinu i varijancu uzroka? (3) Kako bi procijenili medijan te gornji i donji kvartil? Rješenje: 4 n = f i = f +... + f 4 = 485 Budući je n = 485 vrlo velik broj, n u formuli za s približno je jednak n. Dovoljno je, dakle, uzeti: s = k f i (ā i x) gdje je x = n n Nadalje, širina razreda je c = 0.05. Definirajmo: k f i ā i d i := āi ā 0 c ā i = ā 0 + c d i, gdje je ā 0 referentna vrijednost aritmetičkog niza ā,..., ā k. Za ā 0 se obično uzima vrijednost s najvećom frekvencijom. Dakle, ā 0 je mod (ili jedan od). U ovom zadatku ā 0 = 9.90. Imamo: ( x = k f i ā i = k f i (ā 0 + c d i ) = n n n = ā 0 + c d, gdje je d = n s = n = n k f i (ā i x) = n k k f i d i, ā 0 k f i + c ) k f i d i k f i (ā 0 + c d i ā 0 c d) f i (c(d i d)) = c n Iz podataka dobivamo da je d = 39 485 k f i (d i d) =... = c [ n = 0.658 x = 9.90 + 0.05 0.658 = 9.93 µf ) = 0.0 s = 0. µf ( s = 0.05 507 0.658 485 7 ] k f i d i d

Kod odredivanja medijana, te donjeg i gornjeg kvartila pomoći će nam graf kumulativnih relativnih frekvencija koji je prikazan na donjoj slici. 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0. 0. 9.575 9.65 9.675 9.75 9.775 9.85 9.875 9.95 9.975 0.05 0.075 0.5 0.75 0.5 0.75 Za kumulativne relativne frekvencije F j vrijedi: F j = j f ri, j =,..., k Medijan m je x-koordinata točke (m, 0.5) na grafu kumulativnih relativnih frekvencija. Ta točka leži na pravcu odredenom točkama (a 7, F 7 ) = (9.95, 0.48) i (a 8, F 8 ) = (9.975, 0.653) pa medijan možemo izračunati linearnom interpolacijom: F 7 = F 8 F 7 (m a 7 ) a 8 a 7 0.653 0.48 0.48 = (m 9.95) m = 9.93 µf 0.05 Slično se mogu izračunati donji q L i gornji kvartil q U. Njima su na grafu pridružene, redom, točke (q L, 0.5) i (q U, 0.75): 4 F 5 = F 6 F 5 a 6 a 5 (q L a 5 ) q L = 9.86 µf 8

3 4 F 8 = F 9 F 8 a 9 a 8 (q U a 8 ) q U = 0.0 µf.5 Mjere oblika Slično kao što se definira uzoračka varijanca, može se definirati uzorački k-ti centralni moment, k N: Specijalno, µ = n µ = s µ 3 = n n µ k = n (x i x) = n n (x i x) 3 n (x i x) k n x i n= n x n = n x n n x n = 0 Primjer Promatrajmo uzorak:,, 4, 5. Srednja vrijednost tog uzorka je x = ( + + 4 + 5) = 3. 4 S druge strane, 3.centalni moment tog uzorka je µ 3 = ( ( 3) 3 + ( 3) 3 + (4 3) 3 + (5 3) 3) = 0 3 Odavde možemo zaključiti da kada je uzorak simetričan s obzirom na aritmetičku sredinu, 3.centalni moment µ 3 = 0. Koeficijent asimetrije uzorka (skewness) definiran je s: Vrijedi: α 3 = µ 3 s 3 = n n ( ) 3 xi x = s n k ( ai x f i s ) 3 (i) α 3 = 0 uzorak je SIMETRIČAN (ii) α 3 > 0 uzorak je POZITIVNO ASIMETRIČAN (iii) α 3 < 0 uzorak je NEGATIVNO ASIMETRIČAN 9

.6 Linearna regresija Imamo n parova podataka (x i, y i ), i =,..., n. Želimo odrediti vezu izmedu nezavisne varijable x (nju možemo kontrolirati) i zavisne varijable y. Pretpostavimo da je veza linearna, tj. da je graf pripadajuće funkcije pravac y = αx + β. Procjenitelji su: pri čemu: Želimo odrediti procjenitelj za taj pravac oblika s x = n s y = n s xy = n y = ˆαx + ˆβ ˆα = s xy, ˆβ = ȳ ˆα x, s x ( n n ) (x i x) = x i n x n ( n n ) (y i ȳ) = yi nȳ n ( n n ) (x i x)(y i ȳ) = x i y i n xȳ n Zadatak 3 U tablici su dani podaci o broju emitiranih reklama tijekom mjesec dana za neki proizvod i ostvarenoj zaradi na tom proizvodu. pravac regresije za ove podatke. broj reklama 6 59 65 43 8 90 3 promet (u tisućama kuna) 8 63 8 7 85 98 0 5 Rješenje: n = 8 x = 8 ȳ = 8 8 8 x i = (6 + 59 + 65 + 43 + 8 + 90 + 3 + ) = 5 8 y i = (8 + 63 + 8 + 7 + 85 + 98 + 0 + 5) = 5 8 8 x i = 6 + 59 + 65 + 43 + 8 + 90 + 3 + = 6080 0 Procijenite

( n ) s x = x i n x = ( ) 6080 8 5 = 753.43 n 7 8 x i y i = 6 8 + 59 63 + 65 8 + 43 7 + 8 85 + 90 98 + 3 0 + 5 = 5838 s xy = n ( n ) x i y i n xȳ = (5838 8 5 5) = 78.57 7 = ˆα = s xy = 78.57 s x 753.43 = 0.954 = ˆβ = ȳ ˆα x = 5 0.954 5 =.346 = y = 0.954 x +.346 (PEARSONOV) KOEFICIJENT KORELACIJE r = n n ( xi x. r = 0 nema korelacije s x ) yi ȳ = s xy, r s y s x s y. r > 0 pozitivna korelacija (ako x raste, i y u pravilu raste) 3. r < 0 negativna korelacija (ako x raste, y u pravilu pada) Primjer 3 Nadite koeficijent korelacije za podatke iz Zadatka 3. Rješenje: s xy = 78.57 s x = 753.43 s x = 7.4435 ( n ) s y = yi nȳ = ( ) 797 8 5 = 03.43 s y = 3.99 n 7 = r = s xy s x s y = što je razmjerno visoka korelacija. 78.57 7.4435 3.99 = 0.88467

Slučajni uzorak i osnovne razdiobe. Slučajni uzorak Neka je X statističko obilježje koje izučavamo. Cilj statističke analize je da se na osnovi uzorka iz populacije izvedu odredeni zaključci o distribuciji obilježja X. Recimo da želimo raditi ispitivanje o zečevima (npr.duljini njihovih ušiju) u nekoj šumi. Populacija iz koje izabiremo uzorak su svi zečevi koji žive u toj šumi. Uzorak zečeva biramo na slučajan način. Dvije su različite mogućnosti da to učinimo: nakon što ulovimo zeca i izmjerimo mu dužinu ušiju, možemo ga pustiti i tako omogućiti da ga još (bar) jednom ulovimo te da on ude u uzorak (bar) dva puta. Druga mogućnost je da ga zadržimo dok ne izaberemo cijeli uzorak kako taj isti zec ne bi ušao u uzorak više od jednog puta. Slučajni uzorak kojeg uzimamo tako da svaki član populacije može ući u uzorak više od jednog puta zovemo jednostavni slučajni uzorak s ponavljanjem (slučaj kada zečeve puštamo natrag u šumu), a ukoliko svaki član populacije može ući u uzorak točno jednom tada se radi o jednostavnom slučajnom uzorku bez ponavljanja (slučaj kada zečeve ne puštamo prije nego izaberemo ostatak uzorka). Bitna razlika izmedu ove dvije vrste biranja uzroka je u tome što je u jednom slučaju populacija konačna a u drugom beskonačna. Naime, ako uzimamo uzorak s vraćanjem, tada možemo uzeti uzorak proizvoljne veličine, veće čak i od ukupnog broja članova same populacije. To je dakako u slučaju uzimanja uzorka bez vraćanja, nemoguće. S druge strane, često se promatraju konačne populacije koje su dovoljno velike da ih s aspekta statističke analize možemo smatrati beskonačnim. ZADAVANJE I RAČUNANJE VJEROJATNOSTI Primjer 4 Bacamo simetričnu kocku. paran broj? Kolika je vjerojatnost da je pao

Rješenje: Označimo s Ω skup svih elementarnih dogadaja, tj. skup svih mogućih ishoda pokusa kojeg radimo. Ω je kardinalni broj skupa Ω (ukupan broj njegovih članova). Tada je: Ω = {,, 3, 4, 5, 6}, Ω = 6 Označimo s A dogadaj čiju vjerojatnost računamo. Prebrojimo koliko elementarnih dogadaja je povoljno za dogadaj A. Dakle, zanimaju nas oni elementarni dogadaju, tj. ishodi, koji kad se dogode dogodi se i A. Imamo: A = {na kocki je pao paran broj} = {, 4, 6}, A = 3 Vjerojatnost dogadaja A računamo kao kvocijent odgovarajućih kardinalnih brojeva: P (A) = A Ω = 3 6 = Primjer 5 Bacamo simetrične kocke. Kolika je vjerojatnost da zbroj na te kocke bude jednak 7? Rješenje: Primjer se rješava slično kao prethodni - potrebno je odrediti i prebrojati skup Ω, te vidjeti koliko od njegovih elemenata je povoljno za dogadaj A (koji je u ovom slučaju dogadaj da je zbroj na kocke jednak 7). Ω = {(, ), (, ), (, 3), (, 4), (, 5), (, 6), (, ), (, ), (, 3),..., (6, 6)} = {(i, j) : i, j 6}, Ω = 6 6 = 36 A = {zbroj na kocke je jednak 7} = {(, 6), (, 5), (3, 4), (4, 3), (5, ), (6, )}, A = 6 = P (A) = A Ω = 6 36 = 6 Laplaceov model vjerojatnosti: Neka je Ω = {ω,..., ω m }, m N. Pretpostavimo da su svi elementarni dogadaji jednako vjerojatni. Tada 3

je P (ω i ) = pa je vjerojatnost dogadaja A, A Ω, jednaka: m P (A) = ω i A = A m = A Ω P (ω i ) = ω A m = m ω A = broj povoljnih elementarnih dogadaja ukupan broj elementarnih dogadaja Primjer 6 U kutiji se nalazi 0 mačića od kojih je tigrastih i 8 crnobijelih. Kolika je vjerojatnost da od 5 odabranih (na slučajan način izvučenih) mačića budu točno 3 tigrasta i crno-bijela ako a) mačiće ne vraćamo b) mačiće vraćamo? Rješenje: a) Pretpostavimo prvo da mačiće ne vraćamo. Dogadaj čiju vjerojatnost želimo izračunati je A = {izvukli smo 3 tigrasta i crno-bijela mačića}. Broj načina na koji od 0 mačića možemo izabrati njih 5, a da nam pritom nije važno koliko je izvučeno tigrastih a koliko crno-cijelih, je ( 0 5 ). Zapravo, imamo Ω = ( 0 5 ). Broj načina na koji od ukupno tigrastih mačića možemo izabrati njih 3 je ( ) 3. Analogno, broj načina na koji od ukupno 8 crno-bijelih mačića možemo izabrati je ( 8 ). Ako istovremeno izvučemo 3 tigrasta i crnobijela mačića, dogodit će se dogadaj A. Imamo: A = ( ) ( 3 8 ) Vjerojatnost dogadaja A je: P (A) = ( ) ) ( 3 8 ) = ( 0 5! 8! 3! 9!! 6! 0! 5! 5! = 0 8 7 3 0 9 8 7 6 5 4 3 = 0.3973 b) Pretpostavimo sada da mačiće vraćamo. Bitna razlika u odnosu na prethodni slučaj je što je sada vjerojatnost da izvučemo tigrastog mačića u svakom izvlačenju ista jer mačiće vraćamo pa svaki put izvlačimo iz istog skupa. U prethodnom slučaju, vjerojatnost da izvučemo tigrastog mačića se 4

smanjuje iz izvlačenja u izvlačenje budući u kutiji svaki put (kad izvučemo tigrastog mačića) ostaje sve manje tigrastih mačića. Vjerojatnost da (u jednom izvlačenju) izvučemo jednog tigrastog mačića (označimo taj dogadaj s B) je: P (B) = ( ( 0 ) ) = 0 = 3 5 = 0.6 Dogadaj da je izvučen crno-bijeli mačić (označimo taj dogadaj s C) je suprotan ili komplementaran dogadaju B - medusobno se isključuju a zajedno pokrivaju sve mogućnosti koje se mogu dogoditi (tj. B C je siguran dogadaj). Zbroj vjerojatnosti suprotnih dogadaja jednak je. Odatle lako izračunamo vjerojatnost od C: P (C) = P (B c ) = P (B) = 3 5 = 5 = 0.4 Naravno, P (C) možemo izračunati i direktno, slično kao što smo izračunali P (B): ( 8 P (C) = ( ) 0 ) = 8 0 = 5 = 0.4 Ostalo je izračunati P (A). Kako mačiće vraćamo, postoji uredaj pri njihovom izlačenju - zna se koji (i kakav) je bio prvi, koji drugi, koji treći itd. Tu nam se otvara mogućnost izbora: koji po redu je bio svaki od 3 izvučena tigrasta mačića? Prvi, treći i peti? Drugi, četvrti i peti? Drugi, treći i četvrti? Sve su to naime različiti elementarni dogadaji. Dakle, od 5 mjesta (u poretku izvlačenja) moramo izabrati 3 na kojima su bili tigrasti mačići (na preostala su onda crno-bijeli mačići). To možemo učiniti na ( 5 ) 3 načina. Vjerojatnost da u jednom izvlačenju bude izvučen tigrasti mačić je, kao što znamo, 3. Sljedeće izvlačenje je nezavisno od prethodnog, pa je 5 vjerojatnost sa smo izvukli tigrasta mačića jednaka 3 3 = ( 3 5 5 5) i analogno, vjerojatnost da smo ih izvukli 3 je ( 3 3. 5) U preostala izvlačenja morao se dogoditi suprotan dogadaj, odnosno morao je biti izvučen crno-bijeli mačić, vjerojatnost čega je (. 5) Uzmemo li sve do sad rečeno u obzir dobivamo: ( ) ( ) 3 ( ) 5 3 P (A) = = 0.3456 3 5 5 5

Zadatak smo mogli riješiti i tako da razmatramo izvlačenje crno-bijelih mačića, odnosno da biramo mjesta na koja su došla izvučena crno-bijela, što je moguće učiniti na ( 5 ) načina. Sada bi komplementaran dogadaj bio izvlačenje tigrastog mačića i tako bi dobili: P (A) = ( 5 ) ( 5 ) ( ) 3 3 5 što zbog simetrije binomnih koeficijenata očito daje isti rezultat kao gore. Napomena Općenito, kad imamo N predmeta od kojih je M jedne vrste, a N M druge, vjerojatnost da - bez vraćanja - izvučemo točno k predmeta prve vrste ako izvlačimo ukupno n predmeta (dakle, n k predmeta druge vrste) je: p X (k) = ( M ) ( k N M ) n k ( N, max (0, n (N M)) k min (M, n) () n) Mora vrijediti k min (M, n) jer niti možemo izvuči više predmeta prve vrste nego što ih ukupno izvlačimo (zato k n) niti možemo izvuči više predmeta prve vrste nego što ih ukupno uopće ima (zato k M). Uvjet k n (N M) n k N M osigurava pak da ne izvlačimo predmeta druge vrste (n k) više nego što ih ukupno ima (N M). Napomena Ako je vjerojatnost realizacije dogadaja A u nekom pokusu ( uspjeh ) jednaka p, tada je vjerojatnost da se dogadaj A dogodi točno k puta u n nezavisnih pokusa dana s ( ) n p X (k) = p k q n k, k 0 k n, () gdje je q = p vjerojatnost suprotnog dogadaja, odnosno neuspjeha. Primjer 6 odgovara izboru slučajnog uzorka bez, odnosno s vraćanjem. S () je zadana hipergeometrijska razdioba koja opisuje biranje slučajnog uzorka bez vraćanja, a s () binomna razdioba koja opisuje biranje s vraćanjem. 6

. Osnovne razdiobe Slučajna varijabla je funkcija X koja elementarnim dogadajima pridružuje brojeve. Dakle, X : Ω R... Diskretne slučajne varijable Označimo s ImX skup svih različitih vrijednosti koje slučajna varijabla X može poprimiti. Kažemo da je zadan zakon razdiobe ili distribucija slučajne varijable X ako je zadan skup ImX = {a, a, a 3,...}, te niz brojeva p i 0 tako da ) p i = P (X = a i ) ) p i = Zakon razdiobe zapisujemo u obliku tablice: ( ) a a a 3... X p p p 3... Budući je skup svih vrijednosti koje slučajna varijabla može poprimiti ImX = {a, a, a 3,...} diskretan (prebrojiv) skup, kažemo da je X diskretna slučajna varijabla. Definicija Neka je X : Ω R slučajna varijabla. Funkcija gustoće vjerojatnosti od X je funkcija p X : ImX [0, ] definirana s p X (a i ) := P (X = a i ) = p i Definicija Funkcija distribucije slučajne varijable X je funkcija F X : R [0, ] definirana s F X (x) := P (X x), x R. Vrijedi F X (x) = a i x p X (a i ). 7

Definicija 3 Matematičko očekivanje diskretne slučajne varijable je broj E[X] definiran s E[X] = a i p X (a i ) a i ImX Vrijedi: (i) E[g(X)] = g(a i ) p X (a i ), g : R R a i ImX (ii) E[X + Y ] = E[X] + E[Y ] (iii) E[cX] = c E[X], c R (iv) E[c] = c, c R Iz svojstva (ii) vidimo da je očekivanje aditivno, iz svojstva (iii) da je homogeno. Ta dva svojstva zajedno daju svojstvo linearnosti. Definicija 4 Broj Var[X] := (a i E X) p X (a i ) a i ImX zove se varijanca diskretne slučajne varijable X. Standardna devijacija slučajne varijable X je broj σ X := + Var[X] Vrijedi: (i) Var[X] = E[(X E X) ] (primijenimo svojstvo (i) od očekivanja za g(x) = (x E X) ) (ii) Var[X] = E[(X E X) ] = E[X X E X + (E X) ] = E[X ] E X E X + (E X) = E[X ] (E X) = Var[X] = E[X ] (E X) pritom: E[X ] = a i p X (a i ) a i ImX (iii) Var[aX + b] = E[(aX + b E (ax + b)) ] = E[(aX + b a E X b) ] = E[a (X E X) ] = a E[(X E X) ] = a Var X 8

Nadalje, ako su X i Y nezavisne slučajne varijable, onda vrijedi: E[X Y ] = E[X] E[Y ] Var[X + Y ] = Var[X] + Var[Y ] Općenito, ta identiteta ne vrijede! Zadatak 4 Slučajna varijabla zadana je razdiobom ( 0 X 0. 0. 0. 0.3 0. ) Odredite funkciju distribucije te slučajne varijable, te nacrtajte njen graf. Izračunaj vjerojatnost dogadaja X. Nadalje, izračunajte očekivanje i varijancu od X, te E[3X]. Rješenje: Funkciju distribucije moramo promatrati po intervalima. Krenimo od x,, tj. x <. U ovom slučaju: F X (x) = P (X x) = 0 budući slučajna varijabla X ne može poprimiti vrijednost x strogo manju od -. Dalje, neka je x [,. Tada: F X (x) = P (X x) = P (X = ) = 0. budući je - jedina vrijednost unutar intervala, (drugim riječima: jedina vrijednost manja od x) koju X može poprimiti, a vjerojatnost da se to dogodi znamo jer je dan zakon razdiobe od X. Neka je x [, 0. Tada: F X (x) = P (X x) = P (X = ) + P (X = ) = 0. + 0. = 0.3 budući su - i - jedine vrijednosti unutar intervala, 0 koje X može poprimiti, a vjerojatnost da se to dogodi očitavamo iz zakona razdiobe od X. 9

Dalje zaključujemo analogno ako je x [0, : F X (x) = P (X = ) + P (X = ) + P (X = 0) = 0. + 0. + 0. = 0.5 ako je x [, : F X (x) = P (X = ) + P (X = ) + P (X = 0) + P (X = ) = 0. + 0. + 0. + 0.3 = 0.8 te konačno, ako je x [, +, tj. x : F X (x) = P (X = ) + P (X = ) + P (X = 0) + P (X = ) + P (X = ) = 0. + 0. + 0. + 0.3 + 0. = što je bilo prirodno za očekivati budući X sigurno poprima vrijednost manju ili jednaku (tj. nikada ne poprima vrijednost veću od ). Tako smo dobili: 0, x < 0., x < 0.3, x < 0 F X (x) = 0.5, 0 x < 0.8, x <, x Grafički prikaz funkcije distribucije 0.8 0.5 0.3 0. - - Nadalje, treba izračunati P ( X ). Vrijedi: P ( X ) = P ( X ) = P (X = ) + P (X = 0) + P (X = ) = 0. + 0. + 0.3 = 0.7 30

Uočimo pritom da P ( X < ) = P ( < X < ) = P (X = 0) = 0. Preostalo je izračunati E[X] i Var[X]. E[X] = a i p X (a i ) = a i P (X = a i ) a i ImX a i ImX = 0. + ( ) 0. + 0 0. + 0.3 + 0. = 0.3 Varijancu računamo po formuli: Var[X] = E[X ] (E[X]) E[X] smo upravo izračunali, treba nam još E[X ]: E[X ] = a i p X (a i ) = a i ImX a i ImX a i P (X = a i ) = ( ) 0. + ( ) 0. + 0 0. + 0.3 + 0. =.7 pa imamo: Var[X] =.7 0.3 =.6 Koliko je E[3X]? To možemo izračunati na načina. Jedan je - odrediti razdiobu slučajne varijable Y = 3X. ImX = {,, 0,, } ImY = Im 3X = { 6, 3, 0, 3, 6} i pritom P (Y = 6) = P (3X = 6) = P (X = ) = 0. P (Y = 3) = P (3X = 3) = P (X = ) = 0. P (Y = 0) = P (3X = 0) = P (X = 0) = 0. i tako analogno dalje. Slijedi: ( 6 3 0 3 6 Y = 3X 0. 0. 0. 0.3 0. ) 3

pa onda E[Y ] = E[3X] = a i p Y (a i ) = a i P (Y = a i ) a i ImY a i ImY = 6 0. + ( 3) 0. + 0 0. + 3 0.3 + 6 0. = 0.9 Jednostavniji način rješavanja je iskoristiti svojstvo homogenosti očekivanja prema kojem je E[3X] = 3 E[X] = 3 0.3 = 0.9.. Binomna razdioba Definicija 5 Slučajna varijabla X ima binomnu razdiobu ili distribuciju s parametrima n i p ako je X poprima vrijednosti iz skupa {0,,,..., n} s vjerojatnostima p X (k) = P (X = k) = ( ) n p k q n k, 0 k n, (3) k gdje je q = p. S (3) je zadana funkcija gustoće binomne razdiobe. Slučajnu varijablu X koja ima binomnu razdiobu označavamo s: X B(n, p) Očekivanje bionomne razdiobe: Varijanca bionomne razdiobe: E [X] = np Var [X] = npq Osnovna svojstva koja opisuju binomnu distribuciju:. Pokus ponavljamo n puta.. Postoje samo mogućnosti ishoda u svakom pokusu. Jedan ishod ćemo zvati uspjeh a drugi neuspjeh. 3. Vjerojatnost uspjeha p jednaka je u svakom pokusu. Vjerojatnost neuspjeha je tada q = p. 3

4. Pokusi su medusobno nezavisni. 5. Binomna slučajna varijabla broji broj uspjeha k u tih n pokusa. Zadatak 5 Košarkaš gada koš 5 puta i u svakom pokušaju pogada s vjerojatnošću 3/4. Kolika je vjerojatnost da će košarkaš pogoditi koš: a) točno 3 puta b) barem 3 puta c) najviše puta Rješenje: Pokus je gadanje u koš; ponavljamo ga 5 puta. Uspjeh je pogodak u koš, neuspjeh je promašaj. Vjerojatnost uspjeha je zadana i jednaka je 3/4; vjerojatnost neuspjeha je tada /4 (=-3/4). Definiramo slučajnu varijablu X koja broji pogotke. Ona ima binomnu distribuciju: ( ) 3 X B 5, 4 Funkcija gustoće od X je: a) p X (k) = P (X = k) = ( 5 k ) ( 3 4 ) k ( ) 5 k, k = 0,,, 3, 4, 5 (4) 4 Želimo izračunati vjerojatnost da je košarkaš pogodio koš točno 3 puta. Zanima nas zapravo P (X = 3). Uvrštavanjem k = 3 u (4) lako dobijemo rješenje: ( ) ( ) 3 ( ) ( ) 5 3 5 3 3 P (X = 3) = = 3 4 4 3 4 = 0.6 5 b) Kolika je vjerojatnost da košarkaš pogodi koš barem 3 puta? Taj dogadaj izražen pomoću slučajne varijable X je X 3. Želimo dakle izračunati: P (X 3) = P (X = 3) + P (X = 4) + P (X = 5) P (X = 3) smo već izračunali pod a). P (X = 4) i P (X = 5) računamo na sličan način - uvrštavanjem k = 4 odnosno k = 5 u (4). Slijedi: ( ) ( ) 4 ( ) 5 3 P (X = 4) = = 5 34 4 4 4 4 = 0.395 5 ( ) ( ) 5 ( ) 0 ( ) 5 5 3 3 P (X = 5) = = = 0.4 5 4 4 4 = P (X 3) = 0.6 + 0.395 + 0.4 = 0.895 33

c) Kolika je vjerojatnost da košarkaš pogodi koš najviše puta? Taj dogadaj izražen pomoću slučajne varijable X je X a to je zapravo suprotan dogadaj dogadaju kojeg smo promatrali pod b) pa vrijedi: P (X ) = P (X 3) = 0.895 = 0.05 Naravno, vjerojatnost tog dogadaja mogla bi se računati i direktno: P (X ) = P (X = 0) + P (X = ) + P (X = ) Zadatak 6 Odredite očekivanje, varijancu i devijaciju slučajne varijable X B ( 5, 3 4). Konstruirajte interval E [X] ± σx te izračunajte P (E [X] σ X < X < E [X] + σ X ) Rješenje: Traženi interval je: Nadalje, E [X] = 5 3 4 = 3.75 Var [X] = 5 3 4 4 = 0.9375 σ X = 0.9375 = 0.968 3.75 ± 0.968 = 3.75 ±.936.84 < X < 5.686 P (.84 < X < 5.686) = P ( X 5) = P (X = ) + P (X = 3) + P (X = 4) + P (X = 5) Posljednje 3 vjerojatnosti već smo izračunali u prethodnom zadatku. Fali nam još: P (X = ) = ( 5 ) ( 3 4 ) ( ) 3 = 0 3 4 4 = 45 5 5 = 0.088 34

Sada dobivamo: P (E [X] σ X < X < E [X] + σ X ) = P (.84 < X < 5.686) = 0.088 + 0.6 + 0.395 + 0.4 = 0.983 Odavde možemo zaključiti da će ova slučajna varijabla u 98.3% slučajeva odstupati od svog očekivanja za najviše devijacije. Zadatak 7 Četiri prijatelja igraju neku igru s kartama. Prilikom podjele 5 karte jedan od igrača 3 puta zaredom nije dobio asa. Kolika je vjerojatnost da mu se to dogodi? Rješenje: Definirajmo slučajnu varijablu X koja broji koliko puta Igrač nije dobio asa. X ima binomnu razdiobu: X B(3, p). Potrebno je izračunati vrijednost parametra p što je vjerojatnost uspjeha, tj. vjerojatnost da u jednom izvlačenju igrač nije dobio asa. Ta vjerojatnost jednaka je omjeru broja svih ishoda u kojima Igrač nije dobio asa kroz broj svih mogućih ishoda dijeljenja karata. Oduzmemo li sve aseve, ostat će nam 48 karata. Stoga, ) p = P (igrač nije dobio niti jednog asa) = = X B(3, 0.3038) ( 48 3 ( 5 3 ) = 0.3038 Vjerojatnost da Igrač 3 puta zaredom nije dobio asa jednaka je: ( ) 3 P (X = 3) = (0.3038) 3 ( 0.3038) 0 = 0.08. 3..3 Hipergeometrijska razdioba Definicija 6 Slučajna varijabla X ima hipergeometrijsku razdiobu ili distribuciju ako je funkcija gustoće te slučajne varijable zadana s: ( M )( N M ) k n k p X (k) = P (X = k) = ( N, max (0, n (N M)) k min (M, n) n) (5) 35

Očekivanje hipergeometrijske razdiobe: E [X] = nm N Varijanca hipergeometrijske razdiobe: Var [X] = nm(n M)(N n) N (N ) Osnovna svojstva koja opisuju hipergeometrijsku distribuciju:. Pokus se sastoji od slučajnog izvlačenja, bez vraćanja, n elemenata iz skupa od N elemenata, od kojih je njih M jedne vrste (izvlačenje takvog smatramo uspjehom) i N M neke druge vrste (izvlačenje takvog smatramo neuspjehom).. Hipergeometrijska slučajna varijabla broji broj uspjeha (odnosno elemenata prve vrste) k u izvlačenju ukupno n elemenata. Zadatak 8 Kolika je vjerojatnost da se od 7 suglasnika i 5 samoglasnika napravi riječ koja se sastoji od 4 suglasnika i 3 samoglasnika? mora imati smisao) Rješenje: (riječ ne Od ukupno 7+5= slova želimo izabrati 4+3=7 slova. Neka je izvlačenje samoglasnika uspjeh. Slučajna varijabla X koja broji uspjehe ima hipergeometrijsku razdiobu a funkcija gustoće joj je zadana s: ( 5 7 ) p X (k) = P (X = k) = k)( 7 k ), 0 k 5 Dogadaj da su izabrana 4 suglasnika i 3 samoglasnika pomoću slučajne varijable X možemo izraziti kao X = 3. Sada: ( 5 )( 7 3 p X (3) = P (X = 3) = ) 4) = 75 396 = 0.44 ( 7 ( 7 Zadatak 9 Iz vaze koja sadrži 4 crvene i 6 bijelih ruža izvlačimo 3 ruže. S X označimo slučajnu varijablu koja broji izvučene crvene ruže. Odredite njen zakon razdiobe, te prosječan broj izvučenih crvenih ruža. 36

Rješenje: X = broj crvenih ruža Od ukupno 0=4+6 ruža izvlačimo 3, a izvlačenje crvene ruže smatramo uspjehom. Tada X ima hipergeometrijsku distribuciju a funkcija gustoće joj je: p X (k) = P (X = k) = ( 4 6 ) k)( 3 k ), 0 k 3 Dakle, ImX = {0,,, 3}. Trebaju nam pripadne vjerojatnosti. Imamo ( 4 )( 6 0 p X (0) = P (X = 0) = ( 3) 0 ) = 6 5 4 0 9 8 = 6 3 ( 4 )( 6 p X () = P (X = ) = ( ) ) = 4 6 5 0 0 9 8 = 3 3 p X () = P (X = ) = p X (3) = P (X = 3) = X Provjera da smo dobro računali: ( 0 3 ( 4 )( 6 ( ) 0 ) = 3 ( 4 )( 6 3( 0) 0 3 ( 0 3 4 3 6 0 9 8 3 ) = 4 0 9 8 3 ) /6 / 3/0 /30 6 + + 3 0 + 30 = Izračunajmo sada E [X] (što je zapravo prosječan broj): = 3 0 = 30 E [X] = 3 a k p X (k) = k=0 3 k=0 k p X (k) = 0 6 + + 3 0 + 3 30 = 6 5 =. Umjesto pomoću definicije, očekivanje smo mogli izračunati i pomoću gore navedene formule: E [X] = nm N = 3 4 4 + 6 = 0 =. 37

..4 Poissonova razdioba Definicija 7 Slučajna varijabla X ima Poissonovu razdiobu ili distribuciju s parametrom λ > 0 ako je funkcija gustoće te slučajne varijable zadana s: p X (k) = P (X = k) = λk k! e λ, k = 0,,, 3,... (6) Poissonova distribucija daje model vjerojatnosti rijetkih dogadaja (ponekad se naziva i zakon rijetkih dogadaja ) koji se dogadaju u jedinici vremena, površine, volumena i slično. Broj prometnih nesreća na odredenoj dionici autoceste u jednom danu, telefonski pozivi na centrali u jednoj minuti, defekti po jedinici duljine bakrene žice, broj mjesečnih nesreća u tvornici, broj oboljelih stabala po aru šume te broj vidljivih grešaka na dijamantu su npr. varijable čije se relativne frekvencije mogu dobro aproksimirati Poissonovom distribucijom. Slučajnu varijablu X koja ima Poissonovu razdiobu označavamo s: X P (λ) Očekivanje Poissonove razdiobe: Varijanca Poissonove razdiobe: E [X] = λ Var [X] = λ Osnovna svojstva koja opisuju Poissonovu distribuciju:. Pokus se sastoji od prebrojavanja koliko puta (k) se neki dogadaj dogodi u jedinici vremena, jedinici površine, volumena, težine, daljine ili bilo kojoj drugoj mjerenoj jedinici.. Vjerojatnost da će se dogadaj kojeg promatramo dogoditi jednaka je za svaku mjernu jedinicu (za svaku sekundu, svaki metar, svaki karat i sl.). 3. Broj dogadaja koji se dogode u pojedinoj jedinici vremena, površine ili volumena nezavisan je od broja dogadaja koji se dogodi u bilo kojoj drugoj jedinici. 38

4. Prosječni ili očekivani broj dogadaja u jednoj jedinici jednak je parametru λ, odnosno E[X] = λ. Zadatak 0 Dokažite da je E[X] = λ. Rješenje: Koristeći definiciju očekivanja, funkciju gustoće Poissonove razdiobe zadanu s (6) te svojstvo p X (k) = k=0 k=0 λ k k! e λ = dobivamo: E[X] = k p X (k) = k=0 = λ k= k= k λk k! e λ λ k (k )! e λ = λ m=0 λ m m! e λ = λ = λ Zadatak Slučajna varijabla X ima Poissonovu razdiobu. Ako vrijedi P (X = ) = P (X = ), izračunajte očekivanje E [X] i P (X 4). Rješenje: X P (λ) p X (k) = P (X = k) = λk k! e λ, k = 0,,, 3,... P (X = ) = P (X = ) λ! e λ = λ! e λ λ = λ λ λ = 0 λ(λ ) = 0 λ = 0, λ = Budući mora biti λ > 0, jedino rješenje je λ =. X P (), P (X = k) = k k! e 39

E [X] = λ = P (X 4) = P (X < 4) = P (X 3) = P (X = 0) P (X = ) P (X = ) P (X = 3) = 0 0! e! e! e 3 3! e ( = e + + + 4 ) = e 9 3 3 = 0.43 Zadatak Pretpostavimo da je 0 grešaka rasporedeno slučajno unutar knjige od 00 stranica. Odredite vjerojatnost da dana stranica knjige sadrži: a) niti jednu grešku b) točno jednu grešku c) barem dvije greške Rješenje: Definirajmo slučajnu varijablu X koja broji greške na pojedinoj stranici. Ona ima Poissonovu distribuciju. Kako bi odredili njenu funkciju gustoće, potreban nam je parametar λ. Znamo da je taj parametar jednak očekivanom ili prosječnom broju dogadaja (= broj grešaka) koji se dogode u jednoj jedinici (= na jednoj stranici). Stoga λ = 0 00 =. p X (k) = P (X = k) = λk k! e λ = (.)k k! e., k = 0,,,... (7) Pomoću ovako definirane slučajne varijable, dogadaj pod a) možemo zapisati kao X = 0, dogadaj pod b) kao X =, a dogadaj pod c) kao X. Vjerojatnosti tih dogadaja računamo uvrštavanjem odgovarajućih k u (7). Dobivamo: a) P (X = 0) = (.)0 0! e. = e. = 0.333 b) P (X = ) = (.) e. = 0.366! c) P (X ) = P (X = 0) P (X = ) = 0.333 0.366 = 0.30 40

Prethodni zadatak lijepo ilustrira zašto se Poissonova distribucija naziva i zakon rijetkih dogadaja. Dogadaji da na stranici nema niti jedne greške (X = 0) i da je na stranici točno jedna greška (X = ) - dakle rijetki dogadaji (u smislu malog broja grešaka) - imaju veću vjerojatnost nego dogadaj da su stranici ili 3 ili 4 ili 5 ili... ili n ili... grešaka (X )...5 Aproksimacija binomne razdiobe Poissonovom binomna razdioba B(n, p) može se aproksimirati Poissonovom razdiobom P(np). Aproksimacija je to bolja što je parametar n veći, a parametar p manji. Zadatak 3 Kolika je vjerojatnost da medu 00 ljudi bude barem 4 ljevaka, ako ljevaka ima prosječno %? Rješenje: Definirajmo slučajnu varijabu X koja broji ljevake. Ona ima binomnu razdiobu s parametrima n = 00 (promatramo 00 ljudi, tj. 00 puta ponavljamo pokus) i p = /00 (što je vjerojatnost uspjeha, odnosno vjerojatnost da je izabrani čovjek ljevak). Njena funkcija gustoće zadana je s: ( 00 P (X = k) = k ) ( 00 Zanima nas kolika je P (X 4): ) k ( ) 00 k 99, 0 k 00. 00 P (X 4) = P (X = 0) P (X = ) P (X = ) P (X = 3) ( ) ( ) 0 ( ) 00 ( ) ( ) ( ) 99 00 99 00 99 = 0 00 00 00 00 ( ) ( ) ( ) 98 ( ) ( ) 3 ( ) 97 00 99 00 99 =... 00 00 3 00 00 Dobiveni izrazi nisu baš praktični za računanje. Tu će nam pomoći aproksimacija Poissonovom razdiobom: B(n, p) P (np) 4

Sada dobivamo: λ = n p = 00 00 = P (X = k) = k k! e, k = 0,,,... P (X 4) = P (X = 0) P (X = ) P (X = ) P (X = 3) = 0 0! e! e! e 3 3! e ( = + + + 4 ) e = 0.43 3 Zadatak 4 Stroj proizvodi 99.8% ispravnih i 0.% neispravnih proizvoda. Kolika je vjerojatnost da u uzorku od 500 proizvoda više od 3 budu neispravna? Rješenje: Definirajmo slučajnu varijabu X koja broji neispravne proizvode. X ima binomnu razdiobu: X B(500, 0.00). Nas zanima P (X > 3) = P (X = 0) P (X = ) P (X = ) P (X = 3) Direktno korištenje binomne razdiobe ponovo bi dovelo do nezgrapnih izraza. Iskoristimo stoga aproksimaciju Poissonovom razdiobom: Slijedi: λ = n p = 500 0.00 = P (X = k) = k k! e =, k = 0,,,... k! e P (X > 3) = 0! e! e! e 3! e = 8 3e = 0.09 4

.3 Uvjetna vjerojatnost. Nezavisni dogadaji. Pretpostavimo da znamo da se dogodio dogadaj B. Utječe li to na vjerojatnost dogadaja A? Vjerojatnost dogadaja A uz uvjet da se dogodio dogadaj B zovemo uvjetna vjerojatnost, označavamo s P(A B) i definiramo s: P (A B) = P (A B). P (B) Dogadaj B pritom na neki način postaje novi skup svih elementarnih dogadaja, tj. novi Ω. Za dogadaje A i B kažemo da su nezavisni ako vrijedi: P (A B) = P (A) P (B), gdje A B predstavlja dogadaj kada se istovremeno dogode A i B. Pretpostavimo da su dogadaji A i B nezavisni. Tada P (A B) = P (A B) P (B) = P (A) P (B) P (B) = P (A). Dakle, ako su dogadaji nezavisni, onda uvjet da se dogodio jedan od njih ne utječe na vjerojatnost dogadanja onog drugog. Vrijedi i obrat - ukoliko vrijedi gornji identitet, tada su dogadaji nezavisni. Naime, P (A B) P (A B) = P (A) = P (A) P (A B) = P (A) P (B) P (B) dogadaji A i B su nezavisni Primjer 7 Promatramo obitelj s 3 djece. Pretpostavimo da je svih 3 = 8 mogućnosti kombinacija djece (po spolu i po starosti) jednako vjerojatno. Skup svih elementarnih dogadaja Ω je: Ω = {MMM, MMŽ, MŽM, ŽMM, ŽŽM, ŽMŽ, MŽŽ, ŽŽŽ}. Promatramo dogadaje: A = {u obitelji su djeca oba spola}, 43

B = {u obitelji nema više od djevojčice}. Jesu li ti dogadaji nezavisni? Da bismo odgovorili na to pitanje, potrebno je provjeriti vrijedi li definicija. Izračunajmo najprije P (A) i P (B). Što su povoljni elementarni dogadaji za A? Svi oni, koji pripadaju Ω, i koji opisuju obitelji s bar jednom djevojčicom odnosno bar jednim dječakom. Dakle, A = Ω\{ MMM, ŽŽŽ } pa je Slično vidimo da je P (A) = 8 = 3 4. B = { MMM, MMŽ, MŽM, ŽMM } pa je P (B) = 4 8 = + ( ) 3 = 8. Dogadaj A B opisuje istovremeno dogadanje dogadaja A i B, što znači da obitelj mora imati djecu oba spola i pritom najviše jednu djevojčicu - što znači zapravo točno jednu djevojčicu! - pa stoga A B = {MMŽ, MŽM, ŽMM} = B\{MMM} a odatle slijedi Kako je P (A B) = 3 8. P (A) P (B) = 3 4 = 3 = P (A B) 8 time smo pokazali da su dogadaji A i B - u ovom slučaju - nezavisni. No, vrijedi li to općenito, odnosno za obitelji s proizvoljnim brojem djece? Pokazuje se da za obitelji s ili 4 djece ova dogadaja nisu nezavisna! 44

Dokazat ćemo to za slučaj obitelji s 4 djece; samostalno to pokušajte učiniti za slučaj obitelji s djece. Imamo: P (A) = = 7 4 8, P (B) = + ( ) 4 = 5 ( 4 6 4 ) Konačno, kako je P (A) P (B) = 7 8 P (A B) = 4 = 4. 5 6 = 35 8 4 zaključujemo da dogadaji A i B nisu nezavisni! = P (A B), Zadatak 5 Bacamo kocke. Koja je vjerojatnost da je na prvoj kocki pao broj 5, ako je zbroj na dvije kocke jednak 7? Izračunajte P (max (X, Y ) ). Rješenje: Treba izračunati: Ω = {(i, j) : i, j 6} definiramo slučajne varijable X, Y : Ω R tako da X pamti broj na prvoj kocki, a Y na drugoj ImX = ImY = {,, 3, 4, 5, 6} P (X = 5 X + Y = 7) = P (X = 5, X + Y = 7) P (X + Y = 7) Imamo {X + Y = 7} = {(, 6), (, 5), (3, 4), (4, 3), (5, ), (6, )} {X = 5} {X + Y = 7} = {(5, )} pa stoga P (X = 5 X + Y = 7) = 6 6 6 = 6. 45

Nadalje, treba izračunati P (max (X, Y ) ). Dogadaj {max (X, Y ) }, realizirat će se ako na obje kocke ne padne broj veći od - samo tako maksimum može biti ne veći od. Bacanje prve kocke nezavisno je od bacanja druge, odnosno realizacija na prvoj kocki ne utječe na realizaciju na drugoj, stoga možemo koristiti svojstva nezavisnih dogadaja iz njihove definicije. Slijedi: P (max (X, Y ) ) = P (X, Y ) = P (X ) P (Y ) = 6 6 = 9.4 Bayesova formula Dogadaji H, H,... H n čine potpun sistem dogadaja ako je: ) P (H i ) > 0 za i =,,..., n ) H i H j = za i j, i, j =,,..., n 3) n H i = Ω Elemente potpunog sistema dogadaja H, H,..., H n nazivamo hipoteze. Važno! Hipoteze se uzajamno isključuju (svojstvo ) i točno jedna od njih se mora dogoditi (svojstvo 3), u svakom izvodenju pokusa. Formula potpune vjerojatnosti: Neka je {H, H,..., H n } potpun sistem dogadaja i neka je A proizvoljan dogadaj. Tada vrijedi: P (A) = n P (H i ) P (A H i ) Neka je zadan potpun sistem dogadaj {H, H,..., H n }. Pretpostavimo da je pokus izveden i da se kao njegov ishod pojavio dogadaj A. Vjerojatnosti P (H i ) bile su poznate prije izvodenja pokusa. Koliku vjerojatnost imaju hipoteze H i (i =,..., n) nakon izvodenja pokusa? Bayesova formula: Neka je {H, H,..., H n } potpun sistem dogadaja i neka je A Ω dogadaj takav da je P (A) > 0. Tada za svaki i =,,..., n 46

vrijedi P (H i A) = P (H i ) P (A H i ) n j= P (H j) P (A H j ) Dokaz. Primjenom definicije uvjetne vjerojatnosti slijedi i s druge strane P (H i A) = P (H i A) P (A) P (A H i ) = P (A H i) P (H i ) P (A H i ) = P (H i ) P (A H i ). Primjenimo ovo pa iz gornje jednakosti dobivamo P (H i A) = P (H i A) P (A) = P (H i ) P (A H i ) n j= P (H j) P (A H j ) Spoznaja da se dogodio dogadaj A mijenja naše uvjerenje o mogućnosti pojavljivanja hipoteza H, H,..., H n. Vrijedi: n P (H i A) = = n P (H i ) P (A H i ) n j= P (H j) P (A H j ) n j= P (H j)p (A H j ) n P (H i )P (A H i ) = P (A) P (A) = Primjer 8 Pri obradi jednoga pacijenta sumnja se na bolesti, H i H. U danim uvjetima njihove su vjerojatnosti dane s P (H ) = 0.6 i P (H ) = 0.4. Radi preciziranja dijagnoze obavlja se odredena pretraga na pacijentu, čiji su rezultati pozitivna ili negativna reakcija. U slučaju bolesti H vjerojatnost pozitivne reakcije je 0.9, a negativne 0., a u slučaju bolesti H i pozitivna i negativna reakcija imaju vjerojatnost 0.5. Pretraga je obavljena puta i oba puta reakcija je bila negativna. Kolike su vjerojatnosti svake od bolesti poslije ovih pretraga? Koja hipoteza je vjerodostojnija? Rješenje: Skup {H, H } je potpun sistem dogadaja - dogadaji H i H medusobno se isključuju a jedan se mora dogoditi. Definirajmo dogadaj A: 47

A = { pretraga je napravljena puta i oba puta reakcija je bila negativna} Želimo izračunati P (H A) = vjerojatnost da pacijent ima bolest H ako znamo da se dogodio A, te P (H A) = vjerojatnost da pacijent ima bolest H ako znamo da se dogodio A. To ćemo učiniti koristeći Bayesovu formulu. Treba nam P (A H ) = vjerojatnost da se dogodio A ako pacijent ima bolest H i P (A H ) = vjerojatnost da se dogodio A ako pacijent ima bolest H. Razumno je pretpostaviti da su napravljenje pretrage nezavisne jedna od druge pa imamo P (A H ) = 0. 0. = 0.0 P (A H ) = 0.5 0.5 = 0.5 Primjenom Bayesove formule dobivamo: P (H A) = P (H A) = P (H ) P (A H ) j= P (H j) P (A H j ) = 0.6 0.0 0.6 0.0 + 0.4 0.5 0.06 P (H ) P (A H ) j= P (H j) P (A H j ) = 0.4 0.5 0.6 0.0 + 0.4 0.5 0.94 ili, jednostavnije, P (H A) = P (H A) 0.94 Zaključujemo da dobiveni rezultati pretraga daju jak razlog da se pretpostavi bolest H! Hipoteza H je vjerodostojnija..5 Neprekidne slučajne varijable Za slučajnu varijablu X kažemo da je neprekidna ako vrijedi sljedeće: (i) ImX je interval u R (ii) postoji nenegativna funkcija f X : R R tako da za svaka dva broja a, b (a < b) vrijedi P (a X b) = 48 b a f X (t)dt

Funkciju f X zovemo funkcija gustoće od X. Vjerojatnost da vrijednost slučajne varijable X upadne u interval [a, b] jednaka je dakle površini ispod grafa funkcije gustoće na tom intervalu. Ako je na slici prikazana funkcija gustoće od X, tada je P ( X ) jednaka sljedećoj površini: - Funkcija distribucije F X od X definirana je s: F X (x) := P (X x) = x f X (t)dt (8) Vrijedi: P (a X b) = F X (b) F X (a) (9) Navedimo još dva svojstva neprekidne slučajne varijable: () Za svaki broj a R je () P (X = a) = lim b a P (a X b) = lim b a b a f X (t)dt = f X (t)dt = P ( < X < ) = a a f X (t)dt = 0 što znači da je ukupna površina ispod grafa funkcije gustoće jednaka. Matematičko očekivanje od X definirano je s: E [X] = t f X (t)dt, (0) 49

a za varijancu vrijedi relacija kao i kod diskretnih slučajnih varijabli Var [X] = E [X ] (E [X]) () gdje je sada E [X ] = Općenito, za g : R R vrijedi E [g(x)] = t f X (t)dt. () g(t) f X (t)dt. Zadatak 6 Funkcija gustoće neke slučajne varijable X dana je grafom. Odredite analitički prikaz od f X (x), F X (x), te izračunajte Var[X] i P ( X ). -3 - - 3 4 Rješenje: Da bi neka funkcija bila funkcija gustoće, mora zadovoljavati: ) f X (t) 0, t R ) + f X (t)dt = Prvo svojstvo dana funkcija očito zadovoljava, a iz drugog svojstva slijedi da površina dva trokuta sa slike - što je površina ispod grafa zadane funkcije - mora biti jednaka. Označimo li nepoznatu visinu na y-osi s v, slijedi: v + 3 v = v = Točke (, ) i (0, 0) jednoznačno odreduju pravac y = x, a točke (0, ) i (3, 0) pravac y = x, pa smo tako dobili analitički prikaz funkcije gustoće: 6 0, x < x f X (x) =, x < 0 x, 0 x 3 6 0, x 3 50

Sljedeći korak je odrediti funkciju distribucije F X (x). Prisjetimo se njene definicije (8). Imamo: x : F X (x) = x 0 : F X (x) = 0 x 3 : F X (x) = pa slijedi: x 3 : F X (x) = x x f X (t)dt = f X (t)dt = x 0dt = 0 0dt + = 4 (x ) = 4 ( x ) x = t + x x 3 f X (t)dt = 0 0dt + x 0 + t x 0 6 t f X (t)dt = 0dt = t 0 0dt + x 0 0 + t 3 0, x F X (x) = ( 4 x ), x 0 (3 + 6x x ), 0 x 3, x 3 ( t ) dt = t x ( t ) dt + x = 4 + x ( t ) dt + 0 6 t 0 x 3 0 ( t ) dt 6 ( t 6 ) dt 3 0 = 4 + 3 9 = Koliko je varijanca zadane slučajne varijable X? Izračunat ćemo je koristeći (). Najprije izračunajmo očekivanje E[X] pomoću (0). + 0 ( t f X (t)dt = t 0dt + t t ) 3 dt + E[X] = = t3 3 0 + t 3 0 6 t3 3 Nadalje, E[X ] računamo pomoću (): E[X ] = + + 3 0 = t4 4 t f X (t)dt = ( t t 6 0 + t3 3 ) dt + 3 = 0 6 + 9 4 7 8 = 7 x 3 3 0 6 t4 4 5 t 0dt + t 0dt 0 t 0 t ( t ) dt 3 = 0 8 + 7 6 8 4 = 5 4 ( t ) dt + 6 x 3 t 0dt