(BIO)STATISTIKA. skripta. studij: Prehrambena tehnologija i Biotehnologija. doc. dr. sc. Iva Franjić 2012.

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "(BIO)STATISTIKA. skripta. studij: Prehrambena tehnologija i Biotehnologija. doc. dr. sc. Iva Franjić 2012."

Transcript

1 (BIO)STATISTIKA skripta studij: Prehrambena tehnologija i Biotehnologija doc. dr. sc. Iva Franjić 2012.

2 2

3 Sadržaj 1 DESKRIPTIVNA STATISTIKA Grafički prikaz podataka Srednje vrijednosti uzorka Aritmetička sredina uzorka Medijan uzorka Uzorački mod Mjere disperzije ili varijabiliteta Uzoračka varijanca i standardna devijacija Raspon uzorka Interkvartil Mjere lokacije Mjere oblika OSNOVE TEORIJE VJEROJATNOSTI Osnovni pojmovi Nezavisni dogadaji Uvjetna vjerojatnost Bayesova formula Diskretne slučajne varijable Binomna razdioba

4 4 SADRŽAJ Hipergeometrijska razdioba Poissonova razdioba Aproksimacija binomne razdiobe Poissonovom Neprekidne slučajne varijable Normalna razdioba Aproksimacija binomne razdiobe normalnom Eksponencijalna razdioba STATISTIČKI TESTOVI Procjena parametara Statistički testovi Test i pouzdani interval za očekivanje Normalna populacija i poznata varijanca Normalna populacija i nepoznata varijanca Veliki uzorak t-test F-test ANOVA Test i pouzdani interval za proporciju Usporedba proporcija χ 2 - test o prilagodbi modela podacima χ 2 - test nezavisnosti dviju varijabli χ 2 - test homogenosti populacija LINEARNI REGRESIJSKI MODEL Linearna regresija Test koreliranosti dviju varijabli

5 Poglavlje 1 DESKRIPTIVNA STATISTIKA Deskriptivna ili opisna statistika je dio statistike koji obuhvaća jednostavne metode obrade podataka pomoću grafičkih prikaza te nekih jednostavnih numeričkih pokazatelja. Kada nas zanima neka pojava ili veličina, izvodimo pokus čiji rezultati su mjerenja koja bi nam mogla biti od pomoći i dati uvid u vrijednosti te pojave, odnosno veličine. Veličinu koju promatramo nazivamo (statističko) obilježje i označavamo s X. Rezultat mjerenja statističkog obilježja X je (realan) broj x. Ponavljanjem pokusa n puta, dobivamo višestruka mjerenja istog statističkog obilježja x 1,x 2,...,x n, koja nazivamo (statistički) podaci. 5

6 6 DESKRIPTIVNA STATISTIKA 1.1 Grafički prikaz podataka Primjer 1. Neka X označava broj dobiven bacanjem igrače kocke. Kocku smo bacali 20 puta, te dobili sljedeće podatke: 1,3,1,6,2,6,4,6,3,3,4,3,1,4,4,1,4,5,3,5. Statističko obilježje koje promatramo u ovom primjeru je broj na kocki. Označimo ga s X. Dakle, X= broj na kocki Skup svih vrijednosti koje X može poprimiti je ImX = {1,2,3,4,5,6}. Budući je taj skup diskretan, odnosno konačan, kažemo da je X diskretno obilježje. Općenito, obilježje može biti numeričko ili nenumeričko. Nenumeričko obilježje nazivamo i kategorija. Klasični primjeri su npr. spol i boja. Takvim podacima možemo dodijeliti neku numeričku vrijednost (recimo muški spol = 0, ženski spol = 1), no tada naravno nema smisla računati npr. aritmetičku sredinu podataka. Primjetimo da se u našem primjeru pojedine vrijednosti pojavljuju više puta. Svakom elementu skupa vrijednosti koje diskretno obilježje X može poprimiti - označimo ih s a i - možemo pridružiti njegovu frekvenciju ili učestalost pojavljivanja f i. Radi lakše usporedbe više uzoraka različitih duljina, uvodi se i pojam relativne frekvencije od a i koji se označava s f ri, a računa po formuli f ri = f i n

7 1.1 Grafički prikaz podataka 7 gdje je n duljina uzorka, odnosno broj ponavljanja pokusa (u ovom našem primjeru n = 20). Prikažimo sada podatke iz našeg primjera u TABLICI FREK- VENCIJA a i f i f ri % = % = % = % = % = % = % Σ = 20 Σ = 1.00 Σ = 100% STUPČASTI DIJAGRAM (BAR - CHART) Kada crtamo stupčasti dijagram diskretnog obilježja X, na x-os možemo nanijeti proizvoljnu širinu stupića; na y-os nanosimo frekvenciju f i ; stupića ima onoliko koliko ima različitih vrijednosti a i koje obilježje X može poprimiti

8 8 DESKRIPTIVNA STATISTIKA Stupčasti dijagram diskretnog obilježja može se crtati i tako da se na y-os nanese relativna frekvencija f ri, što je bolje zbog usporedbe, npr. za različite duljine uzoraka n Horizontalni stupčasti dijagram je varijacija stupčastog dijagrama: frekvencije, odnosno relativne frekvencije, nanosimo na x-os. šestice 0.15 petice 0.1 etvorke 0.25 trojke 0.25 dvojke 0.05 jedinice HISTOGRAM Histogram je još jedna (jako važna) varijacija stupčastog dijagrama. Glavna osobina mu je da je ukupna površina svih stupića koji ga čine jednaka 1, te da se svaka dva susjedna stupića medusobno dodiruju. Kako se (u slučaju diskretnog obilježja) širina baze stupića može izabrati proizvoljno, možemo ju izabrati tako da bude jednaka

9 1.1 Grafički prikaz podataka 9 1. Na y-os nanosimo relativne frekvencije. Tako postižemo da je površina svakog stupića jednaka upravo relativnoj frekvenciji, pa je stoga površina cijelog nastalog lika (što će reći ukupna površina ispod grafa) jednaka 1. Prikaz nema smisla za nenumeričke podatke! STRUKTURNI KRUG (PIE CHART) Ako imamo relativno malo različitih vrijednosti koje diskretno statističko obilježje može poprimiti, tada kao grafički prikaz možemo koristi strukturni krug. 5 dvojki 25 trojki 20 jedinica 15 šestica 25 etvorki 10 petica

10 10 DESKRIPTIVNA STATISTIKA Primjer 2. Mjerena je visina (u metrima) 30 dvadesetogodišnjaka. Dobiveni su podaci: 1.85, 1.88, 1.78, 1.72, 1.80, 1.72, 1.75, 1.72, 1.79, 1.82, 1.69, 1.76, 1.60, 1.78, 1.76, 1.74, 1.70, 1.86, 1.72, 1.75, 1.69, 1.79, 1.83, 1.79, 1.65, 1.76, 1.59, 1.68, 1.74, Statističko obilježje X koje promatramo u ovom primjeru je visina. Kako ono može poprimiti (sve) vrijednosti iz odredenog intervala, kojih ima beskonačno mnogo (za razliku od obilježja iz prethodnog primjera, gdje ih je bilo samo konačno mnogo), kažemo da je ono neprekidno statističko obilježje. Tablicu frekvencija sada je nemoguće napraviti kao u prvom primjeru. Ovdje je potrebno najprije svrstati podatke u razrede (intervale). Postupak je sljedeći: 1. Izaberemo odgovarajući broj razreda k - ne premalo i ne previše. Kao orijentacijsku pomoć pri tome možemo uzeti k n. U ovom primjeru n = , što znači da možemo uzeti k = 5 ili k = 6. Uzet ćemo npr. k = 6. Sami pokušajte ponoviti ovaj postupak za k = Odredimo širinu razreda c c = x max x min k = = c=0.05 Važno! Uvijek zaokružujemo na više i na onaj broj decimala koliko imaju podaci! Da smo npr. dobili c = , uzeli bismo c = Formiramo razrede, odnosno odredimo njihove rubove. Važno! Rubove razreda uvijek uzimamo na jednu decimalu više

11 1.1 Grafički prikaz podataka 11 nego što ih imaju podaci! Pritom je zgodno (zbog jednostavnijeg računa i preglednosti) uzimati 5 kao zadnju decimalu. Lijevi rub prvog razreda biramo tako da bude malo manji od najmanjeg podatka (i tako da mu zadnja decimala bude 5). Kako je ovdje x min = 1.59, za lijevi rub prvog razreda uzimamo Desni rub prvog razreda dobivamo tako da lijevom rubu dodamo širinu razreda c. Dakle, desni rub prvog razreda je = Desni rub prvog razreda je ujedno i lijevi rub sljedećeg (drugog) razreda, pa ponavljanjem gornjeg postupka lako odredimo i rubove preostalih razreda. 4. Prebrojimo koliko podataka je ušlo u pojedini razred, te formiramo donju tablicu. RAZREDI f i [1.585, 1.635] 2 [1.635, 1.685] 2 [1.685, 1.735] 7 [1.735, 1.785] 9 [1.785, 1.835] 6 [1.835, 1.885] 4 Σ = 30 Nacrtajmo sada histogram za ove podatke. Prisjetimo se najprije da je ovdje riječ o neprekidnom obilježju. To za posljedicu ima da širinu stupića više ne možemo birati proizvoljno, već je ona sada nužno jednaka širini razreda, tj. u ovom primjeru c = Važno! Ukupna površina svih stupića koji čine his-

12 12 DESKRIPTIVNA STATISTIKA togram (odnosno površina ispod grafa) mora biti jednaka 1, pa na y-os ucrtavamo f r i c, a ne f r i! RAZREDI f i f ri f ri /c [1.585, 1.635] [1.635, 1.685] [1.685, 1.735] [1.735, 1.785] [1.785, 1.835] [1.835, 1.885] Σ = 30 Σ = STEM AND LEAF ( PETELJKA I LIST ) DIJAGRAM stem leaf

13 1.2 Srednje vrijednosti uzorka 13 stem leaf Srednje vrijednosti uzorka Aritmetička sredina uzorka Aritmetička sredina uzorka je broj x = 1 n (x 1 +x x n ). Ima ju smisla računati samo za numeričke podatke. Ako je ImX = {a 1,a 2,...,a k } i pritom se a i u uzorku pojavljuje f i puta, tada x = 1 k k f i a i, gdje je n = f i. n Primjer 3. Izračunajte aritmetičku sredinu x za podatke iz Primjera 2. Rješenje: x = 1 30 ( ) =

14 14 DESKRIPTIVNA STATISTIKA Medijan uzorka Medijan uzorka m je broj takav da je 50% svih podataka manje od ili jednako njemu i 50% svih podataka veće od ili jednako njemu. Ima smisla samo za numeričke podatke. Prilikom odredivanja medijana podatke je najprije potrebno sortirati po veličini: x (1) x (2)... x (n). Pritom x (j) označava podatak koji je u promatranom uzorku j-ti po veličini. Općenito, m = x ( n+1 2 ). Ako je duljina uzorka neparan broj n = 2k 1, k N, tada je m = x (k). Ako je duljina uzorka paran broj n = 2k, k N, tada je m = x (k) +x (k+1). 2 Primjer 4. Nadite medijan uzorka za podatke iz Primjera 1. Rješenje: Sortirajmo podatke po veličini n = 20 = 2 10 m = x (10) +x (11) 2 = = Uzorački mod Mod je vrijednost statističkog obilježja koja se u uzorku pojavljuje s najvećom frekvencijom. Koristan je kod statističkih obilježja koja nisu numerička, pa ne možemo izračunati aritmetičku sredinu i medijan.

15 1.3 Mjere disperzije ili varijabiliteta 15 Unimodalan uzorak je onaj u kojem postoji samo jedan mod. Bimodalan uzorak je onaj u kojem postoje dva moda - dvije različite vrijednosti s jednakom (najvećom) frekvencijom. Ukoliko svi podaci imaju jednaku frekvenciju, tada uzorak nema mod. Primjer 5. Nadite mod za podatke iz Primjera 1 i 2. Rješenje: u Primjeru 1: mod = 3 & mod=4 bimodalan uzorak u Primjeru 2: mod = Mjere disperzije ili varijabiliteta Uzoračka varijanca i uzoračka standardna devijacija Uzoračka varijanca je kvadratno odstupanje podataka od aritmetičke sredine uzorka: s 2 = 1 n 1 n (x i x) 2. Uzoračka standardna devijacija je pozitivni korijen iz varijance: s = + s 2. Izvedimo sada formulu za varijancu koja će biti puno praktičnija za računanje. Vrijedi: n (x i x) 2 = = n (x 2 i 2x i x+ x 2 ) = n x 2 i 2 x n x 2 i 2 x n x+n x2 = n x i + n x 2 i n x2, n x 2

16 16 DESKRIPTIVNA STATISTIKA pa smo tako dobili ( n ) s 2 = 1 x 2 i n 1 n x2. Ako se u uzorku (medusobno različite) vrijednosti a i pojavljuju s frekvencijom f i (i = 1,2,...,k), onda vrijedi: s 2 = 1 n 1 k (a i x) 2 f i = 1 n 1 ( k ) f i a 2 i n x 2 Kao posljedica Čebiševljeve nejednakosti slijedi da se za k > 1 u intervalu x ks, x+ks nalazi barem 1 1 k 2 podataka. Specijalno, za k = 2, u intervalu x 2s, x + 2s nalazi se barem 3/4, odnosno 75% podataka. Za k = 3, u intervalu x 3s, x+3s nalazi se barem 8/9, odnosno 89% podataka. Primjer 6. Izračunajte uzoračku varijancu s 2 i uzoračku standardnu devijaciju s za podatke iz Primjera 2. Rješenje: s 2 = ( k ) 1 f i a 2 i n 1 n x2 = 1 [ ( ) ] s = + s 2 = 0.071

17 1.3 Mjere disperzije ili varijabiliteta Raspon uzorka Raspon uzorka je razlika najvećeg i najmanjeg podatka u uzorku: d = x max x min. Primjer 7. Odredite raspon uzorka iz Primjera 2. Rješenje: d = = Interkvartil Donji kvartil q L je broj takav da je 25% svih podataka manje od ili jednako njemu i 75% svih podataka veće od ili jednako njemu. q L = x ( n+1 4 ) Gornji kvartil q U je broj takav da je 75% svih podataka manje od ili jednako njemu i 25% svih podataka veće od ili jednako njemu. q U = x ( ) 3(n+1) 4 Interkvartil je razlika gornjeg i donjeg kvartila: d q = q U q L. Prilikom odredivanja kvartila trebat će nam sljedeća formula: x ( p q ) = x (k+ r q ) = x (k) + r ( ) x(k+1) x q (k).

18 18 DESKRIPTIVNA STATISTIKA Primjer 8. Odredite interkvartil za podatke iz Primjera 2. Rješenje: q L = x ( n+1 4 ) = x ( 30+1 ) = x ( ) = x (7) + 3 ( ) x(8) x 4 (7) = ( ) = q U = x 3(n+1) ( ) = x ( ) = x ( ) = x (23) + 1 ( ) x(24) x 4 (23) = ( ) = d q = q U q L = = 0.07 Uredenu petorku (x (1),q L,m,q U,x (n) ) nazivamo karakteristična petorka uzorka. Pomoću nje crtamo box and whisker dijagram (dijagram pravokutnika, brkata kutija ). Primjer 9. Nacrtajte box and whisker dijagram za podatke iz Primjera 2. x (1) = 1.59, q L = 1.72, m = 1.755, q U = 1.79, x (30) = 1.88, d q =

19 1.4 Mjere lokacije Mjere lokacije Medijan i kvartili spadaju u mjere lokacije jer se medu podacima nalaze na specifičnoj lokaciji. Tu su još i: DECILI: k-ti decil je broj D k = x ( ) k(n+1), k = 1,2,...,9 10 takav da je k/10 podataka manje od ili jednako njemu. PERCENTILI: k-ti percentil je broj P k = x ( ) k(n+1), k = 1,2,..., takav da je k/100 (k%) podataka manje od ili jednako njemu. Decili su specijalan slučaj percentila: D 1 = P 10, D 2 = P 20,...,D 9 = P 90. Takoder, m = D 5 = P 50, te q L = P 25 i q U = P Mjere oblika Uzorački k-ti centralni moment (k N) definira se na sljedeći način: Specijalno, µ 1 = 1 n 1 n µ k = 1 n 1 (x i x) = 1 n 1 µ 2 = s 2 uzoračka varijanca µ 3 = 1 n (x i x) 3 n 1 n (x i x) k. ( n ) x i n x n=1 = 1 n 1 (n x n x) = 0

20 20 DESKRIPTIVNA STATISTIKA Primjer 10. Promatrajmo uzorak: 1, 2, 4, 5. uzorka je x = 1 4 ( ) = 3. S druge strane, 3.centalni moment tog uzorka je µ 3 = 1 3 Srednja vrijednost tog ( (1 3) 3 +(2 3) 3 +(4 3) 3 +(5 3) 3) = 0 Odavde možemo zaključiti da kada je uzorak simetričan s obzirom na aritmetičku sredinu, 3.centalni moment µ 3 je jednak 0. Koeficijent asimetrije uzorka (skewness) definiran je s: Vrijedi: α 3 = µ 3 s 3 = 1 n 1 n ( ) xi x 3 = 1 s n 1 (i) α 3 = 0 uzorak je SIMETRIČAN k (ii) α 3 > 0 uzorak je POZITIVNO ASIMETRIČAN (iii) α 3 < 0 uzorak je NEGATIVNO ASIMETRIČAN ( ) ai x 3 f i s Grubo govoreći, uzorak je pozitivno asimetričan (positive skew, right-skewed) ako se desni kraj pripadnog histograma produljuje i pretvara u rep, dok je negativno asimetričan (negative skew, leftskewed) ako se isto dogada na lijevom kraju. Uzorak je simetričan ako je pripadni histogram simetričan.

21 1.5 Mjere oblika 21 Zadatak 1. U tablici su dane težine 100 studenata PBF-a. Nacrtajte histogram, nadite aritmetičku sredinu, uzoračku varijancu, medijan te interkvartil ovog uzorka. težina (kg) broj studenata Σ = 100 Rješenje: Nacrtajmo najprije histogram (slika 1.1 ). Za razliku od Primjera 2, ovdje nam nisu zadani goli podaci, nego su oni već svrstani u razrede. Znamo da se kod histograma stupići moraju dodirivati, no ako pogledamo prikazane razrede vidjet ćemo da kod

22 22 DESKRIPTIVNA STATISTIKA njih postoje rupe. Kako bi rupe zakrpali, prvi razred shvaćat ćemo kao [59.5, 62.5], drugi kao [62.5, 65.5] i tako redom. Stvarna širina razreda je tako c = 3 (a ne c = 2!). težina (kg) [59.5, 62.5] [62.5, 65.5] [65.5, 68.5] [68.5, 71.5] [71.5, 74.5] f i f ri f ri /c Slika 1.1: Histogram Kada su podaci zadani, aritmetičku sredinu i uzoračku varijancu lako je izračunati. No, kao što smo već primijetili, ovdje to nije slučaj. Podatke stoga moramo procijeniti. Najmanje ćemo pogriješiti ako ih procijenimo sredinama razreda u kojima se nalaze. Sredine razreda označavat ćemo s ā i. težina (kg) [59.5, 62.5] [62.5, 65.5] [65.5, 68.5] [68.5, 71.5] [71.5, 74.5] f i ā i

23 1.5 Mjere oblika 23 Sada imamo x = 1 5 f i ā i = 1 ( ) = n 100 ( 5 ) s 2 1 = f i ā 2 i n 1 n x2 = 1 ( ) = Medijan ćemo takoder morati procijeniti, kao i donji i gornji kvartil. Počnimo s medijanom. Odredimo najprije u kojem razredu se nalazi. U prva dva razreda sadržana su 5+18 = 23 podatka, dok je u prva tri razreda sadržano njih = 65. Kako je medijan pedeseti podatak po veličini (budući je n = 100), to znači da se on nalazi negdje unutar trećeg razreda, odnosno 65.5 m Medijan ćemo dobiti interpolacijom, za što su nam potrebne kumulativne relativne frekvencije F i = i f rj, i = 1,...,k. j=1 težina (kg) [59.5, 62.5] [62.5, 65.5] [65.5, 68.5] [68.5, 71.5] [71.5, 74.5] f ri F i Pomoću kumulativnih relativnih frekvencija možemo nacrtati GRAF KUMULATIVNIH RELATIVNIH FREKVENCIJA. Postupak je sljedeći: najprije ucrtamo točke u koordinatni sustav. Prva točka ima x- koordinatu jednaku lijevom rubu prvog razreda, a y-koordinata joj je jednaka 0. Sve ostale točke imaju x-koordinatu jednaku desnom rubu odgovarajućeg razreda, dok su im y-koordinate jednake kumulativnoj relativnoj frekvenciji pripadajućeg razreda. Dakle, točaka

24 24 DESKRIPTIVNA STATISTIKA uvijek imamo za jedan više od ukupnog broja razreda. Dvije po dvije susjedne točke zatim spojimo pravcem. Tako dobivamo graf po dijelovima linearne funkcije prikazan na slici 1.2. Slika 1.2: Graf kumulativnih relativnih frekvencija Graf kumulativnih relativnih frekvencija KUMULATIVNERELATIVNEFREKVENCIJE 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 59,5 62,5 65,5 68,5 71,5 74,5 TEŽINA Na grafu kumulativnih relativnih frekvencija: medijan je x-koordinata točke čija je y-koordinata jednaka 0.5: (m, 0.5) donji kvartil je x-koordinata točke čija je y-koordinata jednaka 0.25: (q L,0.25) gornji kvartil je x-koordinata točke čija je y-koordinata jednaka 0.75: (q U,0.75) Preciznije, točka (m, 0.5) leži na pravcu koji je odreden točkama (65.5, 0.23) i (68.5, 0.65). Sada imamo (jednadžba pravca kroz dvije točke): = (m 65.5) m = ( ) =

25 1.5 Mjere oblika 25 Primijetimo da se gornji račun može pojednostaviti m = ( ) = = = 67.43, ( ) pa sada vidimo da se medijan može odrediti na brz i jednostavan način budući je: 65.5: lijevi rub razreda unutar kojeg smo odredili da se medijan nalazi 27: broj podataka koje treba dodati na ona 23 podataka koliko ih ukupno ima u prva dva razreda da bi se došlo do podatka koji je na polovici po veličini - u ovom slučaju 50.-og podatka (23+27) 42: broj podataka u razredu unutar kojeg smo odredili da se medijan nalazi 3: širina razreda Ostalo je još odrediti interkvartil. Kvartile ćemo odrediti koristeći ovaj kraći način (pokušajte ih sami naći koristeći graf kumulativnih relativnih frekvencija). Budući je duljina uzorka 100, donji kvartil je otprilike 25. podatak po veličini, a gornji kvartil 75. To znači da je donji kvartil drugi po veličini podatak u trećem razredu (23+2=25) i 65.5 q L Kako bi primijenili gornju formulu treba nam: lijevi rub razreda u kojem se kvartil nalazi (65.5), broj podataka koji nam još treba do 25.-og podatka po veličini (2), broj podataka unutar razreda u kojem se traženi kvartil nalazi (42), te širina razreda (3). Sada imamo: q L = =

26 26 DESKRIPTIVNA STATISTIKA Znamo da se u prva tri razreda nalazi ukupno 65 podataka. U prva četiri se pak nalaze 92(= ) podatka. Dakle, gornji kvartil se nalazi unutar četvrtog razreda (68.5 q U 71.5) i deseti je podatak po veličini unutar tog razreda (65+10=75). Slijedi: i konačno q U = = d q = q U q L = = Tablica KONDENZATORI i razred f i ā i d i f i d i f i d 2 i f ri F i Σ

27 1.5 Mjere oblika 27 Zadatak 2. Izmjeren je kapacitet na 485 istovrsnih kondenzatora. Rezultati mjerenja dani su u gornjoj tablici KONDENZATORI ; podaci su u µf zaokruženi na dvije decimale. (1) Nacrtajte histogram. (DZ) (2) Kako biste procijenili aritmetičku sredinu i varijancu uzroka? (3) Kako biste procijenili medijan te gornji i donji kvartil? Rješenje: Budući imamo uzorak veličine n = 485, 1 n 1 s 2 približno je jednak 1 n. Dovoljno je, dakle, uzeti: u formuli za s 2 = 1 n k f i (ā i x) 2 gdje je x = 1 n k f i ā i Nadalje, širina razreda je c = Definirajmo: d i := āi ā 0 c ā i = ā 0 +c d i, gdje je ā 0 referentna vrijednost aritmetičkog niza ā 1,...,ā k. Za ā 0 se obično uzima vrijednost s najvećom frekvencijom. Dakle, ā 0 je mod (ili jedan od). U ovom zadatku ā 0 = Imamo: x = 1 n k f i ā i = 1 n ( k f i (ā 0 +c d i ) = 1 k ā 0 f i +c n = ā 0 +c d, gdje je d = 1 n s 2 = 1 n = 1 n k f i (ā i x) 2 = 1 n k k f i d i, ) k f i d i k f i (ā 0 +c d i ā 0 c d) 2 f i (c(d i d)) 2 = c 2 1 n k f i (d i d) 2 = c 2 ( 1 n ) k f i d 2 i d 2

28 28 DESKRIPTIVNA STATISTIKA Iz podataka dobivamo da je d = = x = = µf ) = s = 0.11 µf s 2 = ( Kod odredivanja medijana, te donjeg i gornjeg kvartila pomoći će nam graf kumulativnih relativnih frekvencija (vidjeti Zadatak 2) koji je prikazan na slici 1.3. Slika 1.3: Graf kumulativnih relativnih frekvencija Točka (m,0.5) leži na pravcu odredenom točkama(a 7,F 7 ) = (19.925,0.482) i (a 8,F 8 ) = (19.975,0.653), pa medijan možemo izračunati linearnom interpolacijom: 1 2 F 7 = F 8 F 7 (m a 7 ) a 8 a = (m ) m = µf

29 1.5 Mjere oblika 29 Slično se mogu izračunati donji q L i gornji kvartil q U. 1 4 F 5 = F 6 F 5 (q L a 5 ) a 6 a = (q L ) q L = µf F 8 = F 9 F 8 (q U a 8 ) a 9 a = (q U ) q U = µf

30 30 DESKRIPTIVNA STATISTIKA

31 Poglavlje 2 OSNOVE TEORIJE VJEROJATNOSTI 2.1 Osnovni pojmovi Slučajni pokus je pokus s više mogućih ishoda. Ishode slučajnog pokusa nazivamo dogadaji. Dogadaje koje ne možemo rastaviti na jednostavnije dogadaje nazivamo elementarni dogadaji. Dogadaje koji nisu elementarni nazivamo složeni dogadaji. Skup svih elementarnih dogadaja označavamo s Ω. Dogadaji (i elementarni i složeni) su podskupovi skupa elementarnih dogadaja. 31

32 32 OSNOVE TEORIJE VJEROJATNOSTI Kardinalni broj Ω skupa Ω jednak je ukupnom broju njegovih članova. Primjer 11. Bacamo simetričnu kocku. Kolika je vjerojatnost da je pao paran broj? Rješenje: Skup elementarnih dogadaja ovog slučajnog pokusa je: Ω = {1,2,3,4,5,6}. Primijetimo da je kardinalni broj tog skupa Ω = 6. Označimo s A dogadaj čiju vjerojatnost želimo izračunati (dogadaje uvijek označavamo velikim štampanim slovom i pritom krećemo od početka abecede): A = {na kocki je pao paran broj}. Ako nije paran, kakav još broj može biti? Neparan, naravno. Označimo: B = {na kocki je pao neparan broj}. Budući 3 elementarna ishoda daju paran broj, tj. A = {2, 4, 6} i isto tako 3 elementarna ishoda daju neparan broj, tj. B = {1,3,5}, jasno je da se dogadaji A i B pojavljuju s jednakom vjerojatnošću, odnosno vrijedi: P(A) = P(B) = 1 2. Uočimo još nešto: dogadaji A i B su komplementarni ili suprotni - medusobno se isključuju (A B = ), a zajedno pokrivaju sve moguće ishode (A B = Ω). Pišemo: B = A c.

33 2.1 Osnovni pojmovi 33 Neka je Ω skup elementarnih dogadaja i P(Ω) skup svih podskupova od Ω. Vjerojatnost je funkcija P : P(Ω) R koja svakom dogadaju A P(Ω) pridružuje broj P(A) tako da vrijedi: (P1) P(A) 0, A P(Ω) (P2) P(Ω) = 1 (P3) ( ) P A i =, i j P(A i ), za sve A i P(Ω) takve da je A i A j = Uredenu trojku(ω, P(Ω), P) nazivamo vjerojatnosni prostor. Vjerojatnosni prostor je matematički model za promatrani slučajni pokus. SVOJSTVA VJEROJATNOSTI (1) P( ) = 0 (2) A B P(A) P(B) (3) P(A c ) = 1 P(A) (4) P(A B) = P(A)+P(B) P(A B) LAPLACEOV MODEL VJEROJATNOSTI Neka je Ω = {ω 1,..., ω m }, m N. Pretpostavimo da su svi elementarni dogadaji jednako vjerojatni, tj. da je P(ω i ) = 1 m. Tada je vjerojatnost dogadaja A (A Ω) jednaka: P(A) = P(ω i ) = 1 m = 1 A A = m Ω ω i A ω i A broj povoljnih elementarnih dogadaja = ukupan broj elementarnih dogadaja

34 34 OSNOVE TEORIJE VJEROJATNOSTI Zadatak 3. Bacamo 2 simetrične kocke. Kolika je vjerojatnost da zbroj na te 2 kocke bude jednak 7? Rješenje: Odredimo najprije prostor elementarnih dogadaja Ω. Ω = {(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),...,(6,6)} = {(i,j) : 1 i,j 6} Ω = 6 6 = 36 Zanima nam vjerojatnost dogadaja A = {zbroj na 2 kocke jednak 7}. Budući su svi elementarni dogadaji jednako vjerojatni (jer bacamo simetrične kocke), možemo primijeniti Laplaceov model računanja vjerojatnosti. Potrebno je prebrojati koliko je elementarnih dogadaja povoljno za dogadaj A. Dakle, zanimaju nas oni elementarni dogadaji, tj. ishodi, koji kad se dogode - dogodi se i A. Imamo: A = {(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)} A = 6 Vjerojatnost dogadaja A računamo kao kvocijent odgovarajućih kardinalnih brojeva: = P(A) = A Ω = 6 36 = Nezavisni dogadaji Za dogadaje A i B kažemo da su nezavisni ako vrijedi: P(A B) = P(A) P(B), gdje A B predstavlja dogadaj kada se istovremeno dogode A i B.

35 2.2 Nezavisni dogadaji 35 Zadatak 4. Promatramo obitelj s 3 djece i dogadaje A = { u obitelji su djeca oba spola } B = { u obitelji nema više od 1 djevojčice }. Jesu li dogadaji A i B nezavisni? Rješenje: Da bismo mogli odgovoriti na ovo pitanje, moramo provjeriti vrijedi li definicija. Odredimo najprije skup svih elementarnih dogadaja: Ω = {MMM, MMŽ, MŽM, ŽMM, ŽŽM, ŽMŽ, MŽŽ, ŽŽŽ}. Prirodno je pretpostaviti da je svih 2 3 = 8 = Ω varijacija djece po spolu i starosti jednako vjerojatno. Izračunajmo najprije P(A) i P(B). Što su povoljni elementarni dogadaji za A? Svi oni koji pripadaju Ω i koji opisuju obitelji s bar jednom djevojčicom ili bar jednim dječakom. Dakle, pa je Slično vidimo da je pa je A = Ω\{ MMM, ŽŽŽ } P(A) = = 3 4. B = { MMM, MMŽ, MŽM, ŽMM } P(B) = 4 8 = 1+( 3) 1 = Dogadaj A B opisuje istovremeno dogadanje A i B, što znači da obitelj mora imati djecu oba spola i pritom najviše jednu djevojčicu - što zapravo znači točno jednu djevojčicu! - pa stoga A B = {MMŽ, MŽM, ŽMM} = B\{MMM}

36 36 OSNOVE TEORIJE VJEROJATNOSTI a odatle slijedi P(A B) = 3 8. Kako je P(A) P(B) = = 3 8 = P(A B) time smo pokazali da su dogadaji A i B - u ovom slučaju - nezavisni. No, vrijedi li to općenito, odnosno za obitelji s proizvoljnim brojem djece? Pokazuje se da za obitelji s 2 ili 4 djece ovi dogadaji nisu nezavisni! Dokazat ćemo to za slučaj obitelji s 4 djece; samostalno to pokušajte učiniti za slučaj obitelji s 2 djece. Imamo: Konačno, kako je P(A) = = 7 8, P(B) = 1+( ) = 5 ( ) P(A) P(B) = 7 8 P(A B) = 2 4 = = = P(A B), zaključujemo da dogadaji A i B nisu nezavisni! 2.3 Uvjetna vjerojatnost Pretpostavimo da znamo da se dogodio dogadaj B, te je P(B) > 0. Utječe li to na vjerojatnost dogadaja A? Vjerojatnost dogadaja A uz uvjet da se dogodio dogadaj B nazivamo uvjetna vjerojatnost, označavamo s P(A B) i definiramo s: P(A B) = P(A B). P(B)

37 2.3 Uvjetna vjerojatnost 37 Dogadaj B pritom na neki način postaje novi skup svih elementarnih dogadaja, tj. novi Ω. Pretpostavimo da su dogadaji A i B nezavisni. Tada P(A B) = P(A B) P(B) = P(A) P(B) P(B) = P(A). Dakle, ako su dogadaji nezavisni, onda uvjet da se dogodio jedan od njih ne utječe na vjerojatnost dogadanja onog drugog. Vrijedi i obrat - ukoliko vrijedi gornji identitet, tada su dogadaji nezavisni. Naime, P(A B) = P(A) P(A B) = P(A) P(A B) = P(A) P(B) P(B) dogadaji A i B su nezavisni Zadatak 5. Dvije prijateljice, Mirjana i Silvija, sretnu se u gradu. Mirjana kaže Silviji da ima 2 djece. Kolika je vjerojatnost, sa Silvijinog gledišta, da je drugo Mirjanino dijete kći ako Silvija otprije zna: a) da je jedno dijete sin, b) da je sin starije dijete. Rješenje: Definirajmo najprije prostor elementarnih dogadaja: Ω = {MM, MŽ, ŽM, ŽŽ}. Zanima nas dogadaj A = {jedno dijete je kći} = {MŽ, ŽM, ŽŽ}. Točnije, zanima nas uvjetna vjerojatnost dogadaja A - uz uvjet da se dogodio B 1 = {jedno dijete je sin} = {MM, MŽ, ŽM},

38 38 OSNOVE TEORIJE VJEROJATNOSTI odnosno B 2 = {starije dijete je sin} = {MM, MŽ}. Moramo izračunati P(A B 1 ) i P(A B 2 ). Uočimo da je A B 1 = {MŽ, ŽM} i A B 2 = {MŽ}. Sada P(A B 1 ) = P(A B 1) P(B 1 ) = = 2 3, P(A B 2) = P(A B 2) P(B 2 ) = = Bayesova formula Dogadaji H 1,H 2,...,H n čine potpun sistem dogadaja ako vrijedi: 1) P(H i ) > 0 za sve i = 1,2,...,n 2) H i H j = za i j, i,j = 1,2,...,n n 3) H i = Ω Elemente H 1,H 2,...,H n potpunog sistema dogadaja nazivamo hipoteze. Hipoteze se uzajamno isključuju (svojstvo 2) i točno jedna od njih se mora dogoditi u svakom izvodenju pokusa (svojstvo 3). Formula potpune vjerojatnosti Neka je {H 1,H 2,...,H n } potpun sistem dogadaja i neka je A Ω proizvoljan dogadaj. Tada vrijedi: P(A) = n P(H i ) P(A H i ).

39 2.4 Bayesova formula 39 Zadatak 6. U jednoj kutiji šibica nalazi se 5 neupotrebljenih i 6 potrošenih šibica, a u drugoj 2 neupotrebljene i 9 potrošenih šibica. Na slučajan način iz svake kutije biramo po jednu šibicu i stavljamo u treću praznu kutiju. Zatim iz te treće kutije izvlačimo jednu šibicu. Kolika je vjerojatnost da ćemo njome moći zapaliti vatru? Rješenje: Zanima nas vjerojatnost dogadaja: A = {izvučena je neupotrebljena šibica}. Definiramo potpun sistem dogadaja: H 1 = { u treću kutiju i iz prve i iz druge kutije prebačena neupotrebljena šibica } H 2 = { u treću kutiju iz prve kutije prebačena neupotrebljena, a iz druge potrošena šibica } H 3 = { u treću kutiju iz prve kutije prebačena potrošena, a iz druge neupotrebljena šibica } H 4 = { u treću kutiju i iz prve i iz druge kutije prebačena potrošena šibica } Vjerojatnost dogadaja A izračunat ćemo pomoću formule potpune vjerojatnosti. Izračunajmo najprije vjerojatnosti hipoteza. P(H 1 ) = = , P(H 2) = = P(H 3 ) = = , P(H 4) = = Potrebne uvjetne vjerojatnosti su P(A H 1 ) = 1, P(A H 2 ) = P(A H 3 ) = 1 2, P(A H 4) = 0.

40 40 OSNOVE TEORIJE VJEROJATNOSTI Slijedi: P(A) = 4 P(H i ) P(A H i ) = = Neka je zadan potpun sistem dogadaja {H 1,H 2,...,H n }. Pretpostavimo da je pokus izveden i da se kao njegov ishod pojavio dogadaj A. Vjerojatnosti P(H i ) bile su poznate prije izvodenja pokusa. Koliku vjerojatnost imaju hipotezeh i (i = 1,...,n) nakon izvodenja pokusa? Odgovor na to pitanje daje Bayesova formula. BAYESOVA FORMULA Neka je {H 1,H 2,...,H n } potpun sistem dogadaja i neka je A Ω dogadaj takav da je P(A) > 0. Tada za svaki i = 1,2,...,n vrijedi P(H i A) = P(H i ) P(A H i ) n j=1 P(H j) P(A H j ). Dokaz. Primjenom definicije uvjetne vjerojatnosti slijedi i s druge strane P(H i A) = P(H i A) P(A) P(A H i ) = P(A H i) P(H i ) P(A H i ) = P(H i ) P(A H i ). Primjenimo li ovo, iz gornje jednakosti slijedi P(H i A) = P(H i A) P(A) = P(H i) P(A H i ) n P(H j ) P(A H j ) j=1

41 2.4 Bayesova formula 41 Spoznaja da se dogodio dogadaj A mijenja naše uvjerenje o mogućnosti pojavljivanja hipoteza H 1,H 2,...,H n. Vrijedi: n P(H i A) = = n P(H i ) P(A H i ) n j=1 P(H j) P(A H j ) 1 n j=1 P(H j)p(a H j ) n P(H i )P(A H i ) = P(A) P(A) = 1 Zadatak 7. Pri obradi jednoga pacijenta sumnja se na 2 bolesti, H 1 i H 2. U danim uvjetima njihove su vjerojatnosti dane s P(H 1 ) = 0.6 i P(H 2 ) = 0.4. Radi preciziranja dijagnoze obavlja se odredena pretraga na pacijentu, čiji su rezultati pozitivna ili negativna reakcija. U slučaju bolesti H 1 vjerojatnost pozitivne reakcije je 0.9, a negativne 0.1, a u slučaju bolesti H 2 i pozitivna i negativna reakcija imaju vjerojatnost 0.5. Pretraga je obavljena 2 puta i oba puta reakcija je bila negativna. Kolike su vjerojatnosti svake od bolesti poslije ovih pretraga? Koja hipoteza je vjerodostojnija? Rješenje: Skup {H 1,H 2 } je potpun sistem dogadaja - dogadaji H 1 i H 2 medusobno se isključuju, a jedan se mora dogoditi. Definirajmo dogadaj A: A = {pretraga je napravljena 2 puta i oba puta reakcija je negativna} Želimo izračunati P(H 1 A) = vjerojatnost da pacijent ima bolest H 1 ako znamo da se dogodio A, te P(H 2 A) = vjerojatnost da pacijent ima bolest H 2 ako znamo da se dogodio A. To ćemo učiniti koristeći Bayesovu formulu. Treba nam P(A H 1 ) = vjerojatnost da se dogodio A ako pacijent ima bolest H 1 i P(A H 2 ) = vjerojatnost da se dogodio A ako pacijent ima bolest H 2. Razumno je pretpostaviti da su 2

42 42 OSNOVE TEORIJE VJEROJATNOSTI napravljenje pretrage nezavisne jedna od druge, pa imamo P(A H 1 ) = = 0.01 P(A H 2 ) = = 0.25 Primjenom Bayesove formule dobivamo: P(H 1 A) = P(H 2 A) = ili, jednostavnije, P(H 1 ) P(A H 1 ) 2 j=1 P(H j) P(A H j ) = P(H 2 ) P(A H 2 ) 2 j=1 P(H j) P(A H j ) = P(H 2 A) = 1 P(H 1 A) 0.94 Zaključujemo da dobiveni rezultati pretraga daju jak razlog da se pretpostavi bolest H 2. Hipoteza H 2 je vjerodostojnija. 2.5 Diskretne slučajne varijable Slučajna varijabla je funkcija X : Ω R koja elementarnim dogadajima pridružuje brojeve. Označimo s ImX skup svih različitih vrijednosti koje slučajna varijabla X može poprimiti. Ako je taj skup diskretan (prebrojiv), onda kažemo da je X diskretna slučajna varijabla. Zakon razdiobe ili distribucije diskretne slučajne varijable X je zadan ako je zadan skup ImX = {a 1,a 2,a 3,...}, te niz brojeva p i 0 takvih da je p i = P(X = a i ) i p i = 1.

43 2.5 Diskretne slučajne varijable 43 Zakon razdiobe zapisujemo u obliku tablice: X a 1 a 2 a 3... p 1 p 2 p 3... Neka je X : Ω R diskretna slučajna varijabla. Funkcija gustoće (vjerojatnosti) od X je funkcija p X : ImX [0,1] definirana s p X (a i ) = P(X = a i ) = p i, a i ImX. Funkcija distribucije od X je funkcija F X : R [0,1] definirana s F X (x) = P(X x), x R. Vrijedi F X (x) = a i xp X (a i ). Zadatak 8. Slučajna varijabla zadana je razdiobom X Odredite funkciju distribucije te slučajne varijable, te nacrtajte njen graf. Izračunajte vjerojatnost dogadaja X 1. Rješenje: Funkciju distribucije moramo promatrati po intervalima. Krenimo od x, 2, tj. x < 2. U ovom slučaju: F X (x) = P(X x) = 0 budući slučajna varijabla X ne može poprimiti vrijednost x strogo manju od -2.

44 44 OSNOVE TEORIJE VJEROJATNOSTI Dalje, neka je x [ 2, 1. Tada: F X (x) = P(X x) = P(X = 2) = 0.1 budući je -2 jedina vrijednost unutar intervala, 1 (drugim riječima: jedina vrijednost manja od x) koju X može poprimiti, a vjerojatnost da se to dogodi znamo jer je dan zakon razdiobe od X. Neka je x [ 1,0. Tada: F X (x) = P(X x) = P(X = 2)+P(X = 1) = = 0.3 budući su -2 i -1 jedine vrijednosti unutar intervala, 0 koje X može poprimiti. Dalje zaključujemo analogno ako je x [0,1 : F X (x) = P(X = 2)+P(X = 1)+P(X = 0) = = 0.5 ako je x [1,2 : F X (x) = P(X = 2)+P(X = 1)+P(X = 0)+P(X = 1) = = 0.8 te konačno, ako je x [2,+ : F X (x) = P(X = 2)+P(X = 1)+P(X = 0)+P(X = 1)+P(X = 2) = = 1 Tako smo dobili: F X (x) = 0, x < 2 0.1, 2 x < 1 0.3, 1 x < 0 0.5, 0 x < 1 0.8, 1 x < 2 1, x 2

45 2.5 Diskretne slučajne varijable 45 Grafički prikaz funkcije distribucije Nadalje, treba izračunati P( X 1). Vrijedi: P( X 1) = P( 1 X 1) = P(X = 1)+P(X = 0)+P(X = 1) Uočimo pritom da = = 0.7 P( X < 1) = P( 1 < X < 1) = P(X = 0) = 0.2 Matematičko očekivanje diskretne slučajne varijable X je broj E[X] definiran s Svojstva: (E1) E[g(X)] = a i ImX E[X] = a i ImX a i p X (a i ) g(a i ) p X (a i ), g : R R (E2) E[X +Y] = E[X]+E[Y] SVOJSTVO ADITIVNOSTI (E3) E[cX] = c E[X], c R SVOJSTVO HOMOGENOSTI (E4) E[c] = c, c R ADITIVNOST + HOMOGENOST = LINEARNOST!

46 46 OSNOVE TEORIJE VJEROJATNOSTI Varijanca diskretne slučajne varijable X je broj Var[X] definiran s Var[X] = (a i E[X]) 2 p X (a i ) a i ImX Standardna devijacija slučajne varijable X je broj σ X = + Var[X] Svojstva: (V1) Var[X] = E[(X E[X]) 2 ] (V2) Var[X] = E[X 2 ] (E[X]) 2, gdje je E[X 2 ] = a 2 i p X (a i ) (V3) Var[aX +b] = a 2 Var[X] a i ImX Svojstvo (V1) varijance slijedi odmah iz definicije nakon primjene svojstva (E1) očekivanja za g(x) = (x E[X]) 2. Dokaz svojstva (V2): Var[X] = E[(X E[X]) 2 ] = E[X 2 2X E[X]+(E[X]) 2 ] = E[X 2 ] 2E[X] E[X]+(E[X]) 2 = E[X 2 ] (E[X]) 2 Dokaz svojstva (V3): Var[aX +b] = E[(aX +b E[aX +b]) 2 ] = E[(aX +b ae[x] b) 2 ] = E[a 2 (X E[X]) 2 ] = a 2 E[(X E[X]) 2 ] = a 2 Var[X]

47 2.5 Diskretne slučajne varijable 47 Neka su X i Y diskretne slučajne varijable i neka je ImX = {a 1,a 2,...} i ImY = {b 1,b 2,...}. Kažemo da su X i Y nezavisne slučajne varijable ako vrijedi P(X = a i,y = b j ) = P(X = a i ) P(Y = b j ), i,j Ako su X i Y nezavisne slučajne varijable, onda vrijedi: E[X Y] = E[X] E[Y] Var[X +Y] = Var[X]+Var[Y] Općenito, ta dva identiteta ne vrijede! Zadatak 9. Neka je X diskretna slučajna varijabla iz Zadatka 8. Izračunajte njeno očekivanje E[X] i varijancu Var[X], te E[3X]. Rješenje: Primjenom definicije dobivamo: E[X] = a i p X (a i ) = a i P(X = a i ) a i ImX a i ImX = ( 1) = 0.3 Varijancu računamo po formuli: Var[X] = E[X 2 ] (E[X]) 2 E[X] već smo izračunali, treba nam još E[X 2 ]: E[X 2 ] = a i ImX a 2 i p X(a i ) = a 2 i ImX a 2 i P(X = a i) = ( 2) ( 1) = 1.7 pa imamo: Var[X] = = 1.61

48 48 OSNOVE TEORIJE VJEROJATNOSTI Koliko je E[3X]? To možemo izračunati na 2 načina. Jedan je - odrediti razdiobu slučajne varijable Y = 3X. ImX = { 2, 1,0,1,2} ImY = Im 3X = { 6, 3,0,3,6} i pritom P(Y = 6) = P(3X = 6) = P(X = 2) = 0.1 P(Y = 3) = P(3X = 3) = P(X = 1) = 0.2 P(Y = 0) = P(3X = 0) = P(X = 0) = 0.2 i tako analogno dalje. Slijedi: Y = 3X pa onda E[Y] = E[3X] = a i p Y (a i ) = a i P(Y = a i ) a i ImY a i ImY = ( 3) = 0.9 Jednostavniji način rješavanja je iskoristiti svojstvo homogenosti očekivanja prema kojem je E[3X] = 3E[X] = = 0.9 Zadatak 10. Bacamo 2 kocke. Kolika je vjerojatnost da je na prvoj kocki pao broj 5, ako je zbroj na dvije kocke jednak 7? Izračunajte P(max{X,Y} 2). Rješenje: Skup elementarnih dogadaja jeω = {(i,j) : i,j = 1,2,3,4,5,6}. Definirajmo slučajne varijable X,Y : Ω R tako da X pamti broj na

49 2.5 Diskretne slučajne varijable 49 prvoj kocki, a Y na drugoj. Imamo: ImX = ImY = {1,2,3,4,5,6}. Treba izračunati: P(X = 5 X +Y = 7) = P(X = 5, X +Y = 7) P(X +Y = 7) Imamo {X +Y = 7} = {(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)} {X = 5} {X +Y = 7} = {(5,2)} pa stoga P(X = 5 X +Y = 7) = = 1 6. Nadalje, treba izračunatip(max{x,y} 2). Dogadaj{max{X,Y} 2} realizirat će se ako na obje kocke ne padne broj veći od 2 - samo tako maksimum može biti ne veći od 2. Bacanje prve kocke nezavisno je od bacanja druge, odnosno realizacija na prvoj kocki ne utječe na realizaciju na drugoj, stoga možemo koristiti svojstvo nezavisnih dogadaja iz njihove definicije. Slijedi: P(max{X,Y} 2) = P(X 2, Y 2) = P(X 2) P(Y 2) = = 1 9

50 50 OSNOVE TEORIJE VJEROJATNOSTI Binomna razdioba Slučajna varijabla X ima binomnu razdiobu s parametrima n i p ako je funkcija gustoće te slučajne varijable zadana s: ( ) n p X (k) = P(X = k) = p k q n k, k = 0,1,2,...,n, k gdje je q = 1 p. Oznaka: X B(n,p) Očekivanje: Varijanca: E[X] = np Var[X] = npq Osnovna svojstva koja opisuju binomnu razdiobu: 1. Pokus ponavljamo n puta. 2. Pokusi su medusobno nezavisni. 3. Postoje samo dva moguća ishoda u svakom pokusu. Jedan nazivamo uspjeh, a drugi neuspjeh. 4. Vjerojatnost uspjeha p jednaka je u svakom pokusu. Vjerojatnost neuspjeha je tada q = 1 p. 5. Binomna slučajna varijabla poprima vrijednost k koja je jednaka broju uspjeha koji su se dogodili u tih n pokusa. 6. Binomna razdioba opisuje slučajno izvlačenje s vraćanjem. Zadatak 11. U kutiji se nalazi 20 kuglica od kojih je 12 crnih i 8 bijelih. Kolika je vjerojatnost da od 5 slučajno odabranih kuglica točno 3 budu crne i točno 2 budu bijele ako kuglice vraćamo?

51 2.5 Diskretne slučajne varijable 51 Rješenje: Dogadaj čiju vjerojatnost želimo izračunati je A = {izvučene su 3 crne i 2 bijele kuglice}. Kada biramo s vraćanjem, vjerojatnost da u jednom izvlačenju izvučemo crnu kuglicu jednaka je u svakom izvlačenju. Ako taj dogadaj označimo s C, imamo ( 12 1) P(C) = ( 20 1 ) = = 3 5 = 0.6 Dogadaj da je izvučena bijela kuglica (označimo taj dogadaj s B) komplementaran je dogadaju C. Znamo da je zbroj vjerojatnosti komplementarnih dogadaja jednak 1, pa odatle lako izračunamo vjerojatnost od B: P(B) = P(C c ) = 1 P(C) = = 2 5 = 0.4 Naravno, P(B) možemo izračunati i direktno, slično kao što smo izračunali P(C): P(B) = ( 8 1) ( 20 1 ) = 8 20 = 2 5 = 0.4 Ostalo je izračunati P(A). Kako kuglice vraćamo, postoji uredaj pri njihovom izvlačenju - zna se koja (i kakva) je bila prva, koja druga, koja treća itd. Tu nam se otvara mogućnost izbora: koja po redu je bila svaka od 3 izvučene crne kuglice? Prva, treća i peta? Druga, četvrta i peta? Druga, treća i četvrta? Sve su to naime različiti elementarni dogadaji. Dakle, od 5 mjesta (u poretku izvlačenja) moramo izabrati 3 na kojima su crne kuglice (na preostala 2 su onda automatski bijele). To možemo učiniti na ( 5 3) načina. Vjerojatnost da u jednom izvlačenju bude izvučena crna kuglica je, kao što znamo, 3 5. Sljedeće izvlačenje je nezavisno od prethodnog, pa je vjerojatnost da smo izvukli 2 crne kuglice jednaka = ( ) 3 2 5

52 52 OSNOVE TEORIJE VJEROJATNOSTI i analogno, vjerojatnost da smo ih izvukli 3 je ( 3 5) 3. U preostala 2 izvlačenja morao se dogoditi suprotan dogadaj, odnosno morala je biti izvučena bijela kuglica, vjerojatnost čega je ( ) Uzmemo li sve do sad rečeno u obzir dobivamo: P(A) = ( 5 3 )( 3 5 ) 3 ( ) 2 2 = Zadatak smo mogli riješiti i tako da razmatramo izvlačenje bijelih kuglica, odnosno da biramo mjesta na kojima su bijele kuglice, što je moguće učiniti na ( 5 2) načina. Sada bi komplementaran dogadaj bio izvlačenje crne kuglice i tako bi dobili: P(A) = ( 5 2 )( 2 5 ) 2 ( 3 5 što zbog simetrije binomnih koeficijenata očito daje isti rezultat kao gore. No, primijetimo da se zadatak može riješiti i na puno kraći način ako uvedemo slučajnu varijablu X koja broji izvučene crne kuglice (mogli bismo, naravno, definirati i varijablu koja broji bijele kuglice). Ta slučajna varijabla X očito ima binomnu razdiobu, s parametrima n = 5 (=broj ponavljanja pokusa = broj izvlačenja kuglica) i p = 3/5 (=vjerojatnost uspjeha = vjerojatnost izvlačenja crne kuglice u jednom izvlačenju). Dakle, X B(5, 3/5), a funkcija gustoće od X je oblika: p X (k) = P(X = k) = ( 5 k )( 3 5 ) 3 ) k ( ) 2 5 k, k = 0,1,2,3,4,5. 5 Nas zanima P(X = 3), dakle slučaj k = 3, što je jednako ( )( ) ( ) 2 2 P(A) = P(X = 3) = = Ako bi definirali slučajnu varijablu Y koja broji izvučene bijele kuglice, tada bismo imali Y B(5, 2/5), budući se u ovom slučaju

53 2.5 Diskretne slučajne varijable 53 mijenja ono što smatramo uspjehom (pa time i njegova vjerojatnost). Funkcija gustoće od Y je oblika ( )( ) 5 2 k ( ) 3 5 k p Y (k) = P(Y = k) =, k = 0,1,2,3,4,5, k 5 5 a nas zanima P(Y = 2) = P(A) što je jednako P(Y = 2) = ( 5 2 )( 2 5 ) 2 ( 3 5 ) 3 = Zadatak 12. Košarkaš gada koš 4 puta i u svakom pokušaju pogada s vjerojatnošću Kolika je vjerojatnost da će košarkaš pogoditi koš: a) točno 3 puta b) barem 3 puta c) najviše 2 puta. Rješenje: Pokus je gadanje u koš; ponavljamo ga 4 puta. Uspjeh je pogodak u koš, neuspjeh je promašaj. Vjerojatnost uspjeha je zadana i jednaka je 0.82; vjerojatnost neuspjeha je tada 0.18 (=1-0.82). Definirajmo slučajnu varijablu X koja broji pogotke. Ona ima binomnu razdiobu: X B(4, 0.82), a funkcija gustoće od X je: ( ) 4 p X (k) = P(X = k) = (0.82) k (0.18) 4 k, k = 0,1,2,3,4. (2.1) k a) Želimo izračunati vjerojatnost da je košarkaš pogodio koš točno 3 puta, što je zapravo P(X = 3). Uvrštavanjem k = 3 u (2.1) lako dobijemo rješenje: P(X = 3) = ( ) 4 (0.82) 3 (0.18) 1 =

54 54 OSNOVE TEORIJE VJEROJATNOSTI b) Kolika je vjerojatnost da košarkaš pogodi koš barem 3 puta? Moramo izračunati P(X 3) = P(X = 3)+P(X = 4). P(X = 3) smo već izračunali pod a), a P(X = 4) računamo analogno - uvrštavanjem k = 4 u (2.1). ( ) 4 P(X = 4) = (0.82) 4 (0.18) 0 = = P(X 3) = = c) Kolika je vjerojatnost da košarkaš pogodi koš najviše 2 puta, odnosno P(X 2)? Taj dogadaj je suprotan dogadaju kojeg smo promatrali pod b), te vrijedi: P(X 2) = 1 P(X 3) = = Naravno, vjerojatnost tog dogadaja možemo izračunati i direktno: P(X 2) = P(X = 0)+P(X = 1)+P(X = 2) Zadatak 13. Odredite očekivanje, varijancu i devijaciju slučajne varijable X B(4, 0.82). Konstruirajte interval E[X] ± 2σ X, te izračunajte P(E[X] 2σ X < X < E[X]+2σ X ). Rješenje: E[X] = np = = 3.28 Var[X] = npq = = σ X = Var[X] = = Traženi interval je: 3.28± = 3.28± < X <

55 2.5 Diskretne slučajne varijable 55 Nadalje, P(1.744 < X < 4.816) = P(2 X 4) = P(X = 2)+P(X = 3)+P(X = 4) P(X = 3) i P(X = 4) već smo izračunali u prethodnom zadatku. Nedostaje nam još: pa sada imamo: P(X = 2) = ( ) 4 (0.82) 2 (0.18) 2 = 0.131, 2 P(E[X] 2σ X < X < E[X]+2σ X ) = P(1.744 < X < 4.816) = = Odavde možemo zaključiti da će vrijednost ove slučajne varijable u 98% slučajeva odstupati od svog očekivanja za najviše 2 devijacije. Zadatak 14. Četiri prijatelja igraju neku igru s kartama. Prilikom podjele 52 karte jedan od igrača 3 puta zaredom nije dobio asa. Kolika je vjerojatnost da mu se to dogodi? Rješenje: Definirajmo slučajnu varijablu X koja broji koliko puta Igrač nije dobio asa. X ima binomnu razdiobu: X B(3, p). Potrebno je izračunati vrijednost parametra p što je vjerojatnost uspjeha, tj. vjerojatnost da u jednom izvlačenju Igrač nije dobio asa. Ta vjerojatnost jednaka je omjeru broja svih ishoda u kojima Igrač nije dobio asa kroz broj svih mogućih ishoda dijeljenja karata. Maknemo li sve aseve, ostat će nam 48 karata. Stoga, p = P(igrač nije dobio niti jednog asa) = = X B(3,0.3038) ( ( ) ) =

56 56 OSNOVE TEORIJE VJEROJATNOSTI Vjerojatnost da Igrač 3 puta zaredom nije dobio asa jednaka je: ( ) 3 P(X = 3) = (0.3038) 3 ( ) 0 = Hipergeometrijska razdioba Slučajna varijabla X ima hipergeometrijsku razdiobu ako je funkcija gustoće te slučajne varijable zadana s: ( M N M ) p X (k) = P(X = k) = k)( n k ( N, n) max{0,n (N M)} k min{n,m} Očekivanje: E[X] = nm N Varijanca: Var[X] = nm(n M)(N n) N 2 (N 1) Osnovna svojstva koja opisuju hipergeometrijsku razdiobu: 1. Pokus se sastoji od slučajnog izvlačenja bez vraćanja n elemenata iz skupa od ukupno N elemenata, od kojih je M jedne vrste (izvlačenje kojih smatramo uspjehom ) i N M neke druge vrste (izvlačenje kojih smatramo neuspjehom ). 2. Hipergeometrijska slučajna varijabla poprima vrijednost k jednaku broju uspjeha, odnosno broju izvučenih elemenata prve vrste od ukupno izvučenih n elemenata. Zadatak 15. U kutiji se nalazi 20 kuglica od kojih je 12 crnih i 8 bijelih. Kolika je vjerojatnost da od 5 slučajno odabranih kuglica točno 3 budu crne i 2 budu bijele ako kuglice ne vraćamo?

57 2.5 Diskretne slučajne varijable 57 Rješenje: Primijetimo najprije da je ovaj zadatak vrlo sličan Zadatku 11. Zanima nas vjerojatnost istog dogadaja A, no bitna razlika je u tome što sada kuglice ne vraćamo. Broj načina na koji od 20 kuglica možemo izabrati njih 5 (bilo kojih 5) je ( 20 5). Imamo Ω = ( 20 5) i pritom su svi elementarni dogadaji jednako vjerojatni. Broj načina na koji od ukupno 12 crnih kuglica možemo izabrati njih 3 je ( 12 3). Analogno, broj načina na koji od ukupno 8 bijelih kuglica možemo izabrati 2 je ( 8 2). Ako istovremeno izvučemo 3 crne i 2 bijele kuglice, dogodit će se A. Imamo: A = ( 12 8 ) 3) ( 2 Vjerojatnost dogadaja A je: P(A) = A Ω = ( 12 8 ) 3)( 2 ( 20 = 5) 12! 3! 9! 8! 2! 6! 20! 5! 15! = = Kao i Zadatak 11, i ovaj možemo riješiti tako da uvedemo slučajnu varijablu X koja broji izvučene crne kuglice. Ona ima hipergeometrijsku razdiobu, a funkcija gustoće joj je zadana s ( 12 8 ) p X (k) = P(X = k) = k)( 5 k ), k = 0,1,2,3,4,5. Sada ( 20 5 P(A) = P(X = 3) = ( 12 3 )( 8 2) ( 20 5) = Možemo uvesti i slučajnu varijablu Y koja broji izvučene bijele kuglice. Njena funkcija gustoće je ( 8 12 ) p Y (k) = P(Y = k) = k)( 5 k ( 20, k = 0,1,2,3,4,5, 5) pa odatle P(A) = P(Y = 2) = ( 8 12 ) 2)( 3 ( 20 = )

58 58 OSNOVE TEORIJE VJEROJATNOSTI Zadatak 16. Vještica želi otrovati Snjeguljicu. Uzela je košaru s 10 jabuka i otrovala 2. Na putu je počela malo peći savjest pa je odlučila dati Snjeguljici da sama izabere 2 jabuke iz košare umjesto da joj odmah da one 2 otrovane. a) Kolika je vjerojatnost da Snjeguljica izabere barem 1 otrovanu jabuku? b) Koliki je očekivani broj izvučenih neotrovanih jabuka? Rješenje: Definirajmo slučajnu varijablu X koja broji izvučene otrovane jabuke. Ona ima hipergeometrijsku razdiobu (izvlačenje je očito bez vraćanja), predmeti prve vrste ( uspjesi ) su otrovane jabuke, a funkcija gustoće od X je dana s: ( 2 8 ) p X (k) = P(X = k) = k)( 2 k ), k = 0,1,2. Na pitanje pod a) moći ćemo odgovoriti nakon što izračunamo P(X 1). To možemo na dva načina: ( 10 2 P(X 1) = P(X = 1)+P(X = 2) ili P(X 1) = 1 P(X = 0). Drugi put je očito kraći, pa računamo: ( 2 )( 8 0 P(X 1) = 1 P(X = 0) = 1 ( 2) 10 ) = = = Da bismo odgovorili na pitanje pod b), uvedimo novu slučajnu varijablu Y koja broji izvučene neotrovane jabuke; ona takoder ima hipergeometrijsku razdiobu, no sada su predmeti prve vrste ( uspjesi ) neotrovane jabuke, odnosno M = 8. Uvrštavanje u formulu za očekivanje hipergeometrijske razdiobe daje: E[Y] = nm N = = 1.6.

59 2.5 Diskretne slučajne varijable 59 Zadatak 17. Iz vaze koja sadrži 4 crvene i 6 bijelih ruža izvlačimo 3 ruže. S X označimo slučajnu varijablu koja broji izvučene crvene ruže. Odredite njen zakon razdiobe, te prosječan broj izvučenih crvenih ruža. Rješenje: Definirana je slučajna varijabla X = broj izvučenih crvenih ruža. Ona ima hipergeometrijsku razdiobu i pritom izvlačenje crvene ruže smatramo uspjehom, pa je funkcija gustoće dana s: ( 4 6 ) p X (k) = P(X = k) = k)( 3 k ( 10, k = 0,1,2,3. 3) Dakle, ImX = {0, 1, 2, 3}. Trebaju nam pripadne vjerojatnosti. Imamo ( 4 )( 6 0 p X (0) = P(X = 0) = ( 3) 10 ) = = )( 6 2) p X (1) = P(X = 1) = p X (2) = P(X = 2) = p X (3) = P(X = 3) = ( 4 1( 10 3 ( 4 2( 10 3 ( 4 3( 10 3 X ) = )( 6 1) ) = )( 6 ) 0) = = = = 1 30 Izračunajmo sada E[X] (što je zapravo prosječan broj): E[X] = 3 k=0 k p X (k) = = 6 5 = 1.2 Umjesto primjenom definicije, očekivanje smo mogli izračunati i pomoću formule: E[X] = nm N = = 1.2

60 60 OSNOVE TEORIJE VJEROJATNOSTI Poissonova razdioba Slučajna varijabla X ima Poissonovu razdiobu s parametrom λ > 0 ako je funkcija gustoće te slučajne varijable zadana s: p X (k) = P(X = k) = λk k! e λ, k = 0,1,2,3,... Oznaka: Očekivanje: Varijanca: X P(λ) E[X] = λ Var[X] = λ Poissonova distribucija daje model vjerojatnosti rijetkih dogadaja (ponekad se naziva i zakon rijetkih dogadaja ) koji se dogadaju u jedinici vremena, površine, volumena i slično. Broj prometnih nesreća na odredenoj dionici autoceste u jednom danu, telefonski pozivi na centrali u jednoj minuti, defekti po jedinici duljine bakrene žice, broj mjesečnih nesreća u tvornici, broj oboljelih stabala po aru šume te broj vidljivih grešaka na dijamantu su npr. varijable čije se relativne frekvencije mogu dobro aproksimirati Poissonovom distribucijom. Osnovna svojstva koja opisuju Poissonovu razdiobu: 1. Pokus se sastoji od prebrojavanja koliko puta (k) se neki dogadaj dogodi u jedinici vremena, jedinici površine, volumena, težine, daljine ili bilo kojoj drugoj mjerenoj jedinici. 2. Vjerojatnost da će se dogadaj kojeg promatramo dogoditi jednaka je za svaku mjernu jedinicu (za svaku sekundu, svaki metar, svaki karat i sl.). 3. Broj dogadaja koji se dogode u pojedinoj jedinici vremena, površine

61 2.5 Diskretne slučajne varijable 61 ili volumena nezavisan je od broja dogadaja u bilo kojoj drugoj jedinici. 4. Prosječni ili očekivani broj dogadaja u jednoj jedinici jednak je parametru λ, odnosno E[X] = λ. Zadatak 18. Slučajna varijabla X ima Poissonovu razdiobu. Ako vrijedi P(X = 1) = P(X = 2), izračunajte E[X] i P(X 3). Rješenje: Zadano je: X P(λ), P(X = k) = λk k! e λ, k = 0,1,2,3,... Iz danog uvjeta slijedi: P(X = 1) = P(X = 2) λ1 1! e λ = λ2 2! e λ λ = λ2 2 λ2 2λ = 0 λ(λ 2) = 0 λ 1 = 0, λ 2 = 2 Kako po definiciji mora biti λ > 0, jedino rješenje je λ = 2, pa imamo: X P(2), P(X = k) = 2k k! e 2, k = 0,1,2,3,... E[X] = λ = 2 P(X 3) = 1 P(X < 3) = 1 P(X 2) = 1 P(X = 0) P(X = 1) P(X = 2) = ! e ! e 2 22 = 1 e 2 (1+2+2) = ! e 2

62 62 OSNOVE TEORIJE VJEROJATNOSTI Zadatak 19. Pretpostavimo da je 220 grešaka rasporedeno slučajno unutar knjige od 200 stranica. Odredite vjerojatnost da dana stranica knjige sadrži: a) niti jednu grešku b) točno jednu grešku c) barem dvije greške Rješenje: Definirajmo slučajnu varijablu X koja broji greške na pojedinoj stranici. Svako slovo na pojedinoj stranici može biti greška (tipfeler) ili ne. Ako je greška, smatramo ga uspjehom (budući naš X broji upravo greške). Bi li ovdje mogla pomoći binomna razdioba? Da vidimo - kolika je vjerojatnost uspjeha (odnosno da slovo bude greška)? To ne znamo. Koliko ima slova na stranici (broj ponavljanja pokusa)? Ni to ne znamo. Što znamo? Znamo prosječan broj grešaka na stranici; on je jednak 220/200 = 1.1. Stoga, naš X ima Poissonovu razdiobu. Kako znamo da je parametar Poissonove razdiobe jednak očekivanom ili prosječnom broju dogadaja (= broj grešaka) koji se dogode u jednoj jedinici (= na jednoj stranici), imamo λ = 1.1. Slijedi p X (k) = P(X = k) = λk k! e λ = (1.1)k k! e 1.1, k = 0,1,2,...(2.2) Pomoću ovako definirane slučajne varijable, dogadaj pod a) možemo zapisati kao {X = 0}, dogadaj pod b) kao {X = 1}, a dogadaj pod c) kao {X 2}. Vjerojatnosti tih dogadaja računamo uvrštavanjem odgovarajućih k u (2.2). Dobivamo: a) P(X = 0) = (1.1)0 0! e 1.1 = e 1.1 = b) P(X = 1) = (1.1)1 e 1.1 = ! c) P(X 2) = 1 P(X = 0) P(X = 1) = = 0.301

63 2.5 Diskretne slučajne varijable 63 Prethodni zadatak lijepo ilustrira zašto se Poissonova razdioba naziva i zakon rijetkih dogadaja. Dogadaji X = 0 (na stranici nema niti jedne greške) i X = 1 (na stranici je točno jedna greška) - dakle rijetki dogadaji (u smislu malog broja grešaka) - imaju veću vjerojatnost nego dogadaj da su na stranici 2 ili 3 ili 4 ili 5 ili... ili n ili... grešaka (X 2) Aproksimacija binomne razdiobe Poissonovom Binomna razdioba B(n, p) može se aproksimirati Poissonovom razdiobomp(np) (dakle, λ = np). Aproksimacija je to bolja što je parametar n veći, a parametar p manji. Zadatak 20. Kolika je vjerojatnost da medu 200 ljudi barem 4 budu ljevaci ako ljevaka prosječno ima 1%? Rješenje: Definirajmo slučajnu varijabu X koja broji ljevake. Ona ima binomnu razdiobu s parametrima n = 200 (promatramo 200 ljudi, tj. 200 puta ponavljamo pokus) i p = 1/100 (što je vjerojatnost uspjeha, odnosno vjerojatnost da je izabrani čovjek ljevak). Njena funkcija gustoće zadana je s: ( 200 P(X = k) = k )( Zanima nas kolika je P(X 4): ) k ( ) k, 0 k P(X 4) = 1 P(X = 0) P(X = 1) P(X = 2) P(X = 3) ( )( ) ( ) ( )( ) ( 99 = ( )( ) ( ) ( )( ) ( =... ) 199 ) 197

64 64 OSNOVE TEORIJE VJEROJATNOSTI Dobiveni izrazi nisu baš praktični za računanje. Tu će nam pomoći aproksimacija Poissonovom razdiobom: λ = n p = 200 Sada dobivamo: B(n,p) P(np) 1 2k = 2 P(X = k) = 100 k! e 2, k = 0,1,2,... P(X 4) = 1 P(X = 0) P(X = 1) P(X = 2) P(X = 3) = ! e ! e ! e 2 23 ( = ) e 2 = ! e 2 Zadatak 21. Stroj proizvodi 99.8% ispravnih i 0.2% neispravnih proizvoda. Kolika je vjerojatnost da u uzorku od 500 proizvoda više od 3 budu neispravna? Rješenje: Definirajmo slučajnu varijabu X koja broji neispravne proizvode. Ona ima binomnu razdiobu X B(500, 0.002). Nas zanima P(X > 3) = 1 P(X = 0) P(X = 1) P(X = 2) P(X = 3) Direktno korištenje binomne razdiobe ponovo bi dovelo do nezgrapnih izraza. Iskoristimo stoga aproksimaciju Poissonovom razdiobom: Slijedi: λ = n p = = 1 P(X = k) = 1k k! e 1 = 1 k! e, k = 0,1,2,... P(X > 3) = 1 1 0! e 1 1! e 1 2! e 1 3! e = 1 8 3e =

65 2.6 Neprekidne slučajne varijable Neprekidne slučajne varijable Za slučajnu varijablu X kažemo da je neprekidna ako je ImX interval u R i postoji nenegativna funkcija f X : R R tako da vrijedi P(a X b) = b a f X (t)dt, za sve a,b R (a < b). Funkciju f X zovemo funkcija gustoće od X. Vjerojatnost da vrijednost slučajne varijable X bude u intervalu [a, b] jednaka je površini ispod grafa funkcije gustoće na intervalu [a,b]. Ako je na slici 2.1 prikazan graf funkcije gustoće od X, tada je P( 2 X 1) jednaka osjenčanoj površini. Slika 2.1: Graf funkcije gustoće i vjerojatnost -2 1 Funkcija distribucije F X neprekidne slučajne varijable X definirana je s: F X (x) = P(X x) = Vrijedi: x f X (t)dt (2.3) P(a X b) = F X (b) F X (a) (2.4) Navedimo još dva svojstva neprekidne slučajne varijable:

66 66 OSNOVE TEORIJE VJEROJATNOSTI (1) Za svaki a R vrijedi P(X = a) = lim b a P(a X b) = lim b a b a f X (t)dt = a a f X (t)dt = 0 (2) Ukupna površina ispod grafa funkcije gustoće jednaka je 1, odnosno vrijedi f X (t)dt = P( < X < ) = 1. Matematičko očekivanje neprekidne slučajne varijable X definirano je s E[X] = t f X (t)dt, (2.5) a za varijancu vrijedi ista relacija kao i kod diskretnih slučajnih varijabli Var[X] = E[X 2 ] (E[X]) 2 (2.6) no sada je E[X 2 ] = t 2 f X (t)dt. (2.7) Općenito, za g : R R vrijedi E[g(X)] = g(t) f X (t)dt. Zadatak 22. Funkcija gustoće neke slučajne varijable X dana je grafom prikazanim na donjoj slici. Odredite analitički prikaz od f X (x), F X (x), te izračunajte Var[X] i P( X 1).

67 2.6 Neprekidne slučajne varijable Rješenje: Da bi neka funkcija bila funkcija gustoće, mora zadovoljavati: 1 ) f X (t) 0, t R 2 ) + f X (t)dt = 1 Prvo svojstvo dana funkcija očito zadovoljava, a iz drugog svojstva slijedi da površina dva trokuta sa slike - što je površina ispod grafa zadane funkcije - mora biti jednaka 1. Označimo li nepoznatu visinu na y-osi s v, slijedi: 1 v v 2 = 1 v = 1 2 Točke ( 1,1/2) i (0,0) jednoznačno odreduju pravac y = x/2, a točke (0,1/2) i(3,0) pravac y = 1/2 x/6, pa smo tako dobili analitički prikaz funkcije gustoće: f X (x) = 0, x < 1 x/2, 1 x < 0 1/2 x/6, 0 x 3 0, x 3 Sljedeći korak je odrediti funkciju distribucije F X (x). Prisjetimo se njene definicije (2.3). Imamo: x 1 : F X (x) = x f X (t)dt = x 0dt = 0

68 68 OSNOVE TEORIJE VJEROJATNOSTI 1 x 0 : F X (x) = 0 x 3 : F X (x) = x 3 : F X (x) = pa slijedi: x f X (t)dt = 1 = 1 4 (x2 1) = 1 4 (1 x2 ) x = 1 2 t2 2 + x x 3 f X (t)dt = t x f X (t)dt = 0dt = 1 2 t2 2 x ( 0dt+ t ) dt = t2 x 2 1 0dt+ 0 1 ( t ) dt+ 2 x t2 x 2 = x 1 1 0dt t 3 ( t t2 2 0, x 1 (1 x 2 )/4, 1 x 0 F X (x) = (3+6x x 2 )/12, 0 x 3 1, x 3 ) dt x2 3 0 ( 1 2 t ) dt 6 ( 1 2 t 6 ) dt 3 0 = = 1 Varijancu zadane neprekidne slučajne varijable X izračunat ćemo koristeći (2.6). Najprije izračunajmo očekivanje E[X] pomoću (2.5) ( E[X] = t f X (t)dt = t 0dt+ t t ) dt = 1 2 t3 3 ( 1 t 2 t t2 2 ) dt t3 3 Nadalje, E[X 2 ] računamo pomoću (2.7): E[X 2 ] = = 1 2 t4 4 t 2 f X (t)dt = ( 1 t 2 2 t 6 ) dt t t4 4 t 0dt = = 7 12 t 2 0dt+ t 2 0dt 0 1 ( t 2 t ) dt = = 5 4

69 2.6 Neprekidne slučajne varijable 69 Sada, prema (2.6), imamo: Var[X] = 5 ( ) = Preostalo je još izračunati P( X 1) = P( 1 X 1). Primjenom (2.4) dobivamo: P( X 1) = P( 1 X 1) = F X (1) F X ( 1) F X (1) = 1 12 ( ) = 2 3 F X ( 1) = 0 (ili F X ( 1) = 14 ) (1 1) = 0 P( X 1) = F X (1) F X ( 1) = = Normalna razdioba Kažemo da neprekidna slučajna varijabla X ima normalnu razdiobu s parametrima µ i σ 2 ako joj je funkcija gustoće dana s: Oznaka: X N(µ,σ 2 ) f X (x) = 1 σ (x µ) 2 2π e 2σ 2 f X (x) > 0, x R ImX = R Očekivanje: E[X] = µ Varijanca: Var[X] = σ 2 ako je Normalna razdioba je invarijantna na linearne transformacije, tj. X N(µ,σ 2 ) i a,b R, a 0

70 70 OSNOVE TEORIJE VJEROJATNOSTI tada je Y = ax +b N(aµ+b, a 2 σ 2 ) Zato svakoj normalno distribuiranoj slučajnoj varijabli X N(µ,σ 2 ) možemo pridružiti standardiziranu slučajnu varijablu X = X E[X] = X µ N(0,1) σ X σ koja je takoder normalno distribuirana, ali s parametrima 0 i 1. Funkciju distribucije jedinične normalne razdiobe N(0, 1) označavamo s Φ(x). Imamo: i vrijedi Φ(x) = 1 2π x e t2 2 dt, x R Φ( x) = 1 Φ(x). Zadatak 23. Neka je zadana slučajna varijabla X N(0,1). Odredite vjerojatnosti dogadaja: a) X 1 b) X 1 c) 0 X 1 d) 1 X 2. Rješenje: a) P(X 1) = Φ(1) = b) P(X 1) = 1 P(X < 1) = 1 P(X 1) = 1 Φ(1) = c) P(0 X 1) = Φ(1) Φ(0) = = d) P( 1 X 2) = Φ(2) Φ( 1) = Φ(2) (1 Φ(1)) = = Zadatak 24. Neka je zadana slučajna varijabla X N(2,4). Odredite vjerojatnosti dogadaja: a) X 4, b) 0 X 4.

71 2.6 Neprekidne slučajne varijable 71 Rješenje: X N(2,4) X = X µ = X 2 N(0,1) σ 2 a) P(X 4) = 1 P(X < 4) = 1 P(X 4) = 1 F X (4) ( = 1 P X 4 2 ) = 1 Φ(1) = = b) P(0 X 4) = F X (4) F X (0) ( 0 2 = P X ) = P( 1 X 1) = Φ(1) Φ( 1) = Φ(1) (1 Φ(1)) = = Zadatak 25. Slučajna varijabla X mjeri odstupanje aviona od sredine dozvoljenog koridora. Normalno je distribuirana; očekivanje joj je 100m, a standardna devijacija 200m. Ako je avion upravljen da leti sredinom koridora, nadite vjerojatnost da: a) avion leti kroz koridor širine 500m b) iznad tog koridora. Rješenje: Slučajna varijabla X mjeri odstupanje aviona od sredine koridora i vrijedi: X N(100,200 2 ). a) Ako želimo da avion leti sredinom koridora širine 500m, tada on od sredine tog koridora može odstupati najviše 250m prema gore ili prema dolje pa imamo: ( P( 250 X 250) = P X ) = Φ(0.75) Φ( 1.75) = Φ(0.75) 1+Φ(1.75) = = b) Ako je avion iznad koridora, tada je X 250. P(X 250) = 1 P(X < 250) = 1 P(X 250) = ( ) = 1 Φ = 1 Φ(0.75) = =

72 72 OSNOVE TEORIJE VJEROJATNOSTI Zadatak 26. Slučajna varijabla X ima normalnu razdiobu N(2, 4). Izračunajte uvjetnu vjerojatnost: P( 1 X 1 0 < X < 3). Rješenje: P(A B) = P(A B) P(B) P(A B) = P( 1 X 1, 0 < X < 3) = P(0 < X 1) P(0 < X 1) P( 1 X 1 0 < X < 3) = P(0 < X < 3) = P ( < X 1 2 ) 2 P ( < X < ) = Φ( 0.5) Φ( 1) Φ(0.5) Φ( 1) = Φ(1) Φ(0.5) Φ(0.5) 1+Φ(1) = = Aproksimacija binomne razdiobe normalnom Neka je X B(n,p). Znamo da vrijedi E[X] = np i Var[X] = npq. Za velike n, prema Centralnom graničnom teoremu (CGT), vrijedi aproksimacija: X = X np npq N(0,1) Aproksimacija je to bolja što je vrijednost parametra p bliža 1/2. Vrijedi: ( ( ) (b+0.5) np (a 0.5) np P(a X b) = Φ ) Φ npq npq

73 2.6 Neprekidne slučajne varijable 73 Naime, ( P(a X b) = P a 1 2 < X < b+ 1 ) 2 = P = Φ ( a 1 2 np < X < b+ 1 2 np ) npq npq ( b+ 1 2 np ( a 1 2 ) Φ np ) npq npq Zadatak 27. Neki stroj proizvodi 60% proizvoda prve kvalitete. Izračunajte vjerojatnost da u uzorku od 75 proizvoda bude barem 40 proizvoda prve kvalitete. Rješenje: Slučajna varijabla X koja broji proizvode prve kvalitete ima razdiobu: X B(75, 0.6). Zanima nas P(X 40). Za realizaciju tog dogadaja povoljni su elementarni dogadaji X = 40, X = 41, X = 42,...,X = 50,...,X = 60,...,X = 75. Račun direktnim korištenjem binomne razdobe bio bi stoga predug. Aproksimacija Poissonovom razdiobom, osim što bi izrazi koje moramo zbrojiti bili nešto jednostavniji, ne bi smanjila broj pribrojnika. No, aproksimacija normalnom razdiobom znatno će pojednostavniti stvar: P(X 40) = 1 P(X 39) = 1 P ( X ) = 1 P (X 1.296) = 1 Φ( 1.3) = Φ(1.3) =

74 74 OSNOVE TEORIJE VJEROJATNOSTI Eksponencijalna razdioba Neprekidna slučajna varijabla X ima eksponencijalnu razdiobu s parametrom λ (λ > 0) ako joj je funkcija gustoće zadana s: λe λx, x > 0 f(x) = 0, x 0 Oznaka: X Exp(λ) Pogledajmo kako izgleda njena funkcija distribucije F(x). Za x 0, očito F(x) = 0, budući je tada F(x) = x f(t)dt = Pretpostavimo sada da je x > 0. Tada: F(x) = x f(t)dt = 0 0dt+ x 0 x 0dt = 0. λe λt dt = 0 e λt x 0 = 1 e λx Funkcija distribucije F(x) slučajne varijable s eksponencijalnom razdiobom je dakle: 1 e λx, x > 0 F(x) = 0, x 0 Očekivanje i varijanca E[X] = = t f(t)dt = t λe λt dt = lim 0 M + u = t dv = λe λt dt du = dt v = e λt = lim M + ( M e λm 1 ) M λ e λt = lim 0 M + = lim M + = 0 1 λ (0 1) = 1 λ M 0 ( te λt M 0 + t λe λt dt M 0 ) e λt dt 1 λ e λm 1 λ lim M + (e λm 1) Var[X] = E[X 2 ] (E[X]) 2 = 1 λ 2

75 2.6 Neprekidne slučajne varijable 75 Zadatak 28. Vrijeme ispravnog rada nekog uredaja je slučajna varijabla distribuirana po eksponencijalnom zakonu s očekivanjem 2 mjeseca. Kolika je vjerojatnost da će uredaj pokvariti u tijeku: a) prvog mjeseca b) drugog mjeseca c) drugog mjeseca, ako je poznato da u tijeku prvog mjeseca nije bio u kvaru. Rješenje: E[X] = 1 λ = 2 λ = 1 2 Slučajna varijabla X koja mjeri vrijeme ispravnog rada uredaja (izraženo u mjesecima) ima razdiobu X Exp [ 1 2]. Njena funkcija distribucije je F X (x) = 1 e x/2, x > 0 Dogadaj pod a) možemo izraziti kao {X 1}, dogadaj pod b) kao {1 X 2}, a dogadaj pod c) kao {1 X 2 X 1}. Izračunajmo vjerojatnosti tih dogadaja: a) P(X 1) = F X (1) = 1 e 1/2 = b) P(1 X 2) = F X (2) F X (1) = 1 e 1 (1 e 1/2 ) = c) P(1 X 2, X 1) P(1 X 2) P(1 X 2 X 1) = = P(X 1) 1 P(X 1) = F X(2) F X (1) 1 F X (1) = = 0.393

76 76 OSNOVE TEORIJE VJEROJATNOSTI

77 Poglavlje 3 TESTIRANJE STATISTIČKIH HIPOTEZA I POUZDANI INTERVALI 3.1 Procjena parametara Cilj statističke analize je na osnovi uzorka uzetog iz populacije izvesti odredene zaključke o distribuciji statističkog obilježja, odnosno slučajne varijable X, koju proučavamo. Neka je X slučajna varijabla s konačnim očekivanjem µ = E[X] i varijancom σ 2 = Var[X]. Promatramo slučajni uzorak koji se sastoji od n nezavisnih jednako distribuiranih slučajnih varijabli X 1,X 2,...,X n, čija je distribucija jednaka distribuciji mjerenog statističkog obilježja. Želimo procijeniti µ i σ 2 na osnovi uzorka. Pretpostavimo najprije da je X N(µ,σ 2 ). To onda znači i da je 77

78 78 STATISTIČKI TESTOVI X i N(µ,σ 2 ), i = 1,2,...,n. Aritmetičku sredinu uzorka definiramo s X = 1 n (X 1 +X X n ). (3.1) X je slučajna varijabla, pa pokušajmo odrediti njenu razdiobu. Ona će naslijediti normalnu razdiobu budući je dobivena kao zbroj nezavisnih normalno distribuiranih slučajnih varijabli, no s kojim parametrima? Imamo: [ ] E[ X] 1 = E n (X 1 +X X n ) = 1 n (E[X 1]+E[X 2 ]+...+E[X n ]) = 1 n (µ+...+µ) = 1 nµ = µ (3.2) n budući su sve X i jednako distribuirane, s očekivanjem µ. Nadalje, budući su X i i medusobno nezavisne imamo: [ ] Var[ X] 1 = Var n (X 1 +X X n ) = 1 n 2 (Var[X 1]+Var[X 2 ]+...+Var[X n ]) = 1 n 2 nσ2 = σ2 n Konačno, imamo da je X N ) (µ, σ2. n (3.3) Pokazuje se da svojstva (3.2) i (3.3), vrijede i ako X, odnosno X i, imaju neku drugu razdiobu (dakle, ne nužno normalnu) s očekivanjem µ i (konačnom) varijancom σ 2. Bi li aritmetička sredina uzorka X mogla biti dobar procjenitelj za očekivanje µ? Oboje su srednje vrijednosti, pa je to prirodna ideja. Odgovor je: da. Svojstvo (3.2) je zapravo provjera da je X nepristran procjenitelj - očekivanje procjenitelja je jednako parametru kojeg procjenjuje. Iz (3.3) lagano slijedi da je lim Var[ X] = 0 (3.4) n

79 3.2 Statistički testovi 79 što je zapravo provjera da je X konzistentan procjenitelj (ima minimalnu varijancu). Zbog tih lijepih svojstava, X je dobar izbor za procjenitelja od µ. Kažemo da je X točkasti procjenitelj za µ. Slično se može pokazati da je uzoračka varijanca S 2 = 1 n (X i n 1 X) 2 nepristran i konzistentan procjenitelj za varijancu σ 2. Kažemo da je S 2 točkasti procjenitelj za σ 2. Problem točkastih procjenitelja je što je teško odrediti pouzdanost njihove procjene. Zato je ponekad zgodno i potrebno raditi intervalne procjene (procjene u obliku intervala). Kažemo da je [L,D] (1 α) 100% pouzdan interval za parametar ξ, ako su L i D slučajne varijable ovisne o slučajnom uzorku X 1, X 2,...,X n, te ako vrijedi P(L ξ D) = 1 α, α (0,1). 3.2 Statistički testovi Mnoge situacije povezane sa slučajnim pojavama zahtijevaju da se donesu odluke tipa DA ili NE. Npr. pri praćenju procesa proizvodnje nekog proizvoda treba, na temelju rezultata mjerenja x 1,...,x n statističkog obilježja X, donijeti odluku o tome osigurava li proces proizvodnje zahtjevanu kvalitetu ili ne. Pri tom se naravno pretpostavlja da obilježje X koje karakterizira kvalitetu pojedinog proizvoda (količina odredenog sastojka npr.) ima slučajni karakter.

80 80 STATISTIČKI TESTOVI Riječ je zapravo o tome da se na temelju n mjerenja slučajne varijable X, odnosno na temelju vrijednosti x 1,...,x n slučajnog uzorka X 1,...,X n, donese odluka o prihvaćanju (DA) ili odbacivanju (NE) odredene pretpostavke o svojstvima slučajne varijable X. Takva pretpostavka zove se statistička hipoteza, a postupak donošenja odluke o prihvaćanju ili odbacivanju statističke hipoteze zove se testiranje. Primjer. Želimo testirati je li očekivanje trajanja neke vrste žarulja jednako npr. 1000h. Definiramo H 0 : µ = 1000h H 1 : µ 1000h H 0 je nulta hipoteza, a H 1 alternativna hipoteza. Alternativna hipoteza je tvrdnja suprotna nultoj hipotezi; ona je njena negacija. Budući iz alternativne hipoteze µ 1000h slijedi da može biti µ > 1000h ili µ < 1000h, kažemo da je H 1 dvostrana alternativna hipoteza. Ponekad je zgodnije imati jednostranu alternativnu hipotezu: H 1 : µ > 1000h ili H 1 : µ < 1000h. Kako znamo da je alternativna hipoteza tvrdnja suprotna nultoj hipotezi, tako onda uz alternativnu hipotezu H 1 : µ > 1000h stoji nulta u obliku H 0 : µ 1000h, a uz alternativnu H 1 : µ < 1000h nulta u obliku H 0 : µ 1000h. Tako ih zaista i shvaćamo i interpretiramo, no uvijek pišemo H 0 : µ = 1000h. Kada izaberemo dvostranu alternativnu hipotezu, kažemo da provodimo dvostrani test, a kada izaberemo jednostranu kažemo da provodimo jednostrani test.

81 3.2 Statistički testovi 81 Prilikom donošenja odluke o istinitosti hipoteze, postoji mogućnost pogreške, tj. donošenja krive odluke. To je jedan od razloga zašto se nikad ne kaže prihvaćamo hipotezu, već ne možemo ju odbaciti. Dvije su vrste mogućih pogrešaka: pogreška 1.vrste: odbacili smo nultu hipotezu ako je ona istinita pogreška 2.vrste: nismo odbacili nultu hipotezu ako je ona neistinita Svi mogući ishodi testa prikazani su u donjoj tablici. ne odbacujemo H 0 odbacujemo H 0 H 0 istinita pogreška 1.vrste H 0 neistinita pogreška 2.vrste Vjerojatnost pogreške prve vrste α, uz koju provodimo test, nazivamo nivo signifikantnosti ili razina značajnosti: α = P(pogreška 1.vrste)= P(odbacujemo H 0 H 0 istinita) Pomoću vjerojatnosti pogreške druge vrste β izražavamo snagu testa 1 β. β = P(pogreška 2.vrste)= P(ne odbacujemo H 0 H 0 neistinita) 1-β=P(odbacujemo H 0 H 0 neistinita)

82 82 STATISTIČKI TESTOVI Postupak provodenja statističkog testa 1. Najprije postavljamo HIPOTEZE (odnosno biramo odgovarajući test) H 0 : nulta hipoteza H 1 : alternativna hipoteza Nultu hipotezu smatramo istinitom dok ne uspijemo dokazati da je alternativna hipoteza istinita. Test završava zaključkom: ODBACUJEMO nultu hipotezu H 0 (tada zaključujemo da je istinita altenativna hipoteza H 1 ) ili NE MOŽEMO ODBACITI nultu hipotezu H 0 (tada ne možemo zaključiti da nulta hipoteza H 0 nije istinita, odnosno, uvjetno rečeno, možemo zaključiti da je istinita). 2. TEST STATISTIKA (TS) - svaki test ima test-statistiku čiju vrijednost treba izračunati na osnovi podataka. 3. KRITIČNO PODRUČJE (KP) - svaki test ima kritično područje. Kritično područje je interval (ili unija intervala). 4. PROVJERA je li vrijednost test-statistike ušla u kritično područje, tj. je li TS KP. Ako je TS KP, odnosno ako je vrijednost test-statistike ušla u kritično područje, tada nultu hipotezu H 0 odbacujemo. Ako je T S / KP, odnosno ako vrijednost test-statistike nije ušla u kritično područje, tada nultu hipotezu H 0 ne možemo odbaciti.

83 3.3 Test i pouzdani interval za očekivanje Test i pouzdani interval za očekivanje U ovom poglavlju govorit ćemo o testu o očekivanju, te pouzdanom intervalu za očekivanje, uz različite početne pretpostavke. (1 α)100% pouzdan interval za očekivanje µ je takav interval unutar kojeg se prava vrijednost parametra µ nalazi s vjerojatnošću 1 α. Forme tog intervala razlikovat će se, ovisno o početnim pretpostavkama. Pouzdani interval vrlo je srodan dvostranom testu za očekivanje. Nadalje, željet ćemo testirati je li očekivanje µ jednako nekom unaprijed zadanom broju µ 0 R. Nulta hipoteza je H 0 : µ = µ 0, dok za alternativnu hipotezu možemo izabrati bilo koju od sljedeće tri: H 1 : µ µ 0 ili H 1 : µ > µ 0 ili H 1 : µ < µ 0. Zbog različitih početnih uvjeta, ono što će se od slučaja do slučaja razlikovati jest test-statistika Normalna populacija i poznata varijanca Neka je X normalno distribuirana slučajna varijabla s nepoznatim očekivanjem µ i poznatom varijancom σ 2 i neka je X 1,X 2,...,X n slučajni uzorak duljine n. Znamo da ako je X normalno distribuirana, onda za aritmetičku sredinu uzorka X vrijedi a odatle slijedi X = X µ σ 2 n X N ) (µ, σ2, n = X µ σ n N(0,1).

84 84 STATISTIČKI TESTOVI TEST O OČEKIVANJU µ Ako je nulta hipoteza H 0 : µ = µ 0 istinita, tada je E[ X] = µ = µ 0, odnosno Z = X µ 0 n N(0,1). σ Ovako definiranu slučajnu varijablu Z N(0, 1) koristit ćemo kao test-statistiku u ovom testu. Test provodimo uz razinu značajnosti α. Promotrimo redom slučajeve različitog izbora alternativne hipoteze. (1) H 0 : µ = µ 0 H 1 : µ µ 0 Ako je H 0 : µ = µ 0 istinita, tada P( zα 2 Z z α 2 ) = 1 α, što je vjerojatnost da ne odbacimo H 0 ako je ona istinita, a gdje je Φ(zα 2 ) = 1 α 2. S druge strane, P((Z < zα 2 ) (Z > z α 2 )) = α je vjerojatnost da odbacimo H 0 ako je ona istinita (vidi sliku 3.1). Dakle, Nultu hipotezu H 0 odbacujemo ako je Z < zα 2 ili Z > zα 2

85 3.3 Test i pouzdani interval za očekivanje 85 Slika 3.1: Kritično područje dvostranog testa zα 2 zα 2 Područje obojeno zelenom bojom na slici 3.1 naziva se kritično područje. Ukupna površina kritičnog područja uvijek je jednaka razini značajnosti α uz koju se test provodi. (2) H 0 : µ = µ 0 H 1 : µ > µ 0 Kritično područje površine α u ovom slučaju cijelo je na desnoj strani (slika 3.2). Nultu hipotezu H 0 odbacujemo ako je Z > z α (3) H 0 : µ = µ 0 H 1 : µ < µ 0 Kritično područje površine α sada je cijelo na lijevoj strani (slika 3.3). Nultu hipotezu H 0 odbacujemo ako je Z < z α

86 86 STATISTIČKI TESTOVI Slika 3.2: Kritično područje jednostranog (desno) testa z Α Slika 3.3: Kritično područje jednostranog (lijevo) testa z Α POUZDANI INTERVAL za očekivanje µ Znamo da je u ovom slučaju X N(0,1), pa stoga vrijedi (vidi dvostrani test o očekivanju): Odatle lako slijedi: pa konačno P( zα 2 X zα 2 ) = 1 α. P( zα 2 X zα 2 ) = 1 α P( zα X µ 2 σ n ( P X zα 2 zα 2 ) = 1 α σ n µ X +zα 2 σ n ) = 1 α,

87 3.3 Test i pouzdani interval za očekivanje 87 (1 α) 100% pouzdan interval za očekivanje normalna populacija + varijanca poznata X zα 2 σ n µ X +zα 2 σ n Zadatak 29. Poznato je da napon u električnoj mreži od 220 volti ima normalnu distribuciju sa standarnom devijacijom od 6 volti. Ako je 16 nezavisnih mjerenja dalo rezultate: 208, 216, 215, 228, 210, 224, 212, 213, 224, 218, 206, 209, 208, 218, 220, 206, možemo li uz razinu značajnosti 0.01 zaključiti da je došlo do pada srednjeg napona u elektičnoj mreži? Rješenje: Zadano je: X N(µ,6 2 ), n = 16 Postavljamo hipoteze: H 0 : µ = 220 H 1 : µ < 220 Nulta hipoteza je da je srednja vrijednost napona jednaka 220 (odnosno da je veća od te vrijednosti), dakle da nije došlo do pada napona, dok je alternativna da je srednja vrijednost napona manja od 220, odnosno da je došlo do pada napona, što je tvrdnja za koju želimo provjeriti vrijedi li. Kad bismo kao alternativnu hipotezu uzeli H 1 : µ 220, u slučaju odbacivanja nulte hipoteze H 0 : µ = 220, mogli bismo zaključiti samo da srednji napon nije jednak 220, no ne bismo znali je li on veći ili manji od te vrijednosti.

88 88 STATISTIČKI TESTOVI Računamo vrijednost test-statistike: Z = X µ 0 n σ µ 0 = 220, x = z = 16 = z α = z 0.01 = = z < z 0.01 = odbacujemo nultu hipotezu H 0, odnosno možemo zaključiti da je došlo do pada napona! Zadatak 30. Vrijeme trajanja neke vrste elektronskih cijevi je normalno distribuirana slučajna varijabla X s nepoznatim očekivanjem µ i standardnom devijacijom σ = 40h. a) Uzet je uzorak od 30 elektronskih cijevi na osnovi kojeg je dobiveno prosječno vrijeme trajanje od 780h. Nadite 99% pouzdan interval za očekivanje µ vremena trajanja ove vrste elektronskih cijevi. b) Koliki uzorak treba uzeti kako bi se artimetička sredina uzorka X razlikovala od sredine µ za manje od 10h s vjerojatnošću 0.99? Rješenje: X N(µ,40 2 ) a) n = 30, x = 780, α = 0.01 Φ(zα 2 ) = Φ(z 0.005) = 1 α 2 = z = % pouzdan interval za očekivanje: σ 40 x±z = 780±2.58 = 780±18.84 n µ

89 3.3 Test i pouzdani interval za očekivanje 89 b) P( X µ < 10) = 0.99, n =? ( P( 10 < X µ < 10) = P 10 < X ) µ σ σ < 10 σ n n n ( = P 10 n < 40 X < 10 ) n = ( ) ( ) n n Φ Φ = Φ 4 4 n 4 = 2.58 n = n = ( ) n = 1.99 Φ 4 = n 107, tj. treba uzeti uzorak duljine barem 107. Možemo razmišljati i ovako: (1 α)100% pouzdani interval za očekivanje je: a odatle: zα 2 X zα 2 σ n µ X zα 2 σ n µ X +zα 2 σ n σ n X µ zα 2 σ n Kako nas zanima P( X µ < 10) = 0.99, traženi n možemo odrediti iz uvjeta: Odatle dobivamo: zα 2 σ n = z σ n < 10. ( ) n = n > z σ 10 = = n > n Normalna populacija i nepoznata varijanca Neka je X normalno distribuirana slučajna varijabla s nepoznatim očekivanjem µ i nepoznatom varijancom σ 2 i neka je X 1,X 2,...,X n slučajni uzorak duljine n.

90 90 STATISTIČKI TESTOVI Kao u prethodnom potpoglavlju, prirodno bi bilo krenuti od X = X µ σ n N(0,1). No, ovdje se sada pojavljuje problem u tome što ne znamo σ, odnosno σ 2. Kada nam je u statistici nešto nepoznato, onda to procijenimo. Varijancu σ 2 procjenjujemo pomoću njenog nepristranog i konzistentnog procjenitelja - uzoračke varijance: S 2 = 1 n 1 n (X i X) 2. Tako dobivamo aproksimaciju slučajne varijable X u obliku X µ n, S koja više nema jediničnu normalnu razdiobu. Ako je nulta hipoteza H 0 : µ = µ 0 istinita, tada T = X µ 0 n t(n 1) S ima Studentovu ili t-razdiobu s (n 1) stupnjeva slobode. Napomena: Za n, Studentova razdioba po distribuciji konvergira jediničnoj normalnoj razdiobi. Za broj stupnjeva slobode n 1 30 možemo aproksimativno uzeti da je t(n 1) N(0, 1) TEST O OČEKIVANJU µ Gore definiranu slučajnu varijablu T koristit ćemo kao test-statistiku. Promotrimo različite izbore alternativnih hipoteza. (1) H 0 : µ = µ 0, H 1 : µ µ 0 Nultu hipotezu H 0 odbacujemo ako je (vidi sliku 3.4) T > tα 2 (n 1) ili T < t α 2 (n 1)

91 3.3 Test i pouzdani interval za očekivanje 91 Slika 3.4: t Α 2 n 1 t Α 2 n 1 (2) H 0 : µ = µ 0, H 1 : µ > µ 0 Nultu hipotezu H 0 odbacujemo ako je (vidi sliku 3.5) T > t α (n 1) Slika 3.5: t Α n 1 (3) H 0 : µ = µ 0, H 1 : µ < µ 0 Nultu hipotezu H 0 odbacujemo ako je (vidi sliku 3.6) T < t α (n 1)

92 92 STATISTIČKI TESTOVI Slika 3.6: t Α n 1 POUZDANI INTERVAL za očekivanje µ Vrijedi (vidi sliku 3.4): ( P tα (n 1) X ) µ tα 2 S (n 1) 2 n = 1 α, a odatle ( P čime dobivamo X tα 2 (n 1) S n µ X +tα 2 (n 1) S n ) = 1 α, (1 α) 100% pouzdan interval za očekivanje normalna populacija + varijanca nepoznata X tα 2 (n 1) S n µ X +tα 2 (n 1) S n Zadatak 31. Tvornica tvrdi da je prosječan vijek trajanja njenih baterija 21.5 sati. Na slučajnom uzorku od 6 baterija iz te tvornice laboratorijskim mjerenjima vijeka trajanja dobivene su vrijednosti od 19, 18, 22, 20, 16, 25 sati. Može li se, uz razinu značajosti α = 0.05, zaključiti da dobiveni uzorak indicira kraći prosječan vijek trajanja baterija?

93 3.3 Test i pouzdani interval za očekivanje 93 Rješenje: µ 0 = 21.5, n = 6, α = 0.05 H 0 : µ = 21.5 H 1 : µ < 21.5 Treba nam vrijednosti test-statistike: T = X µ 0 n t(n 1) S x = 1 ( ) = 20 6 ( s 2 = ) (x i x) 2 = 1 x 2 i 6 x 2 = = 10 t = = t 0.05 (5) = t > t 0.05 (5) Nultu hipotezu H 0 ne možemo odbaciti, tj. ne možemo zaključiti da uzorak indicira kraći prosječni vijek trajanja baterija. Zadatak 32. NASA testira komponente svojih raketa. Recimo da NASA želi procijeniti srednje vrijeme trajanja neke mehaničke komponente korištene u raketi Columbia. Zbog ograničenja troškova, u simuliranim uvjetima svemira mogu testirati samo 10 komponenti. Dobiveni su podaci za vrijeme trajanja tih komponenti (u satima): x = , s = Procijenite očekivanje vijeka trajanja tih mehaničkih komponenti 95% pouzdanim intervalom (uz pretpostavku da je vrijeme trajanja mehaničkih komponenti normalno distribuirano).

94 94 STATISTIČKI TESTOVI Rješenje: 1 α = 0.95 α = 0.05 α 2 = t (9) = s x±t (9) = ± = ±25.97 n µ Veliki uzorak Neka je X slučajna varijabla nepoznate razdiobe s nepoznatim očekivanjem µ i nepoznatom, ali konačnom varijancom σ 2, te neka je X 1,X 2,...,X n slučajni uzorak velike duljine n (n ). Situacija je slična kao u prethodnom poglavlju: standardna devijacija σ nam je nepoznata, pa ju procijenimo uzoračkom standardnom devijacijom S. No, bitna razlika je u tome što ovdje radimo s velikim uzorkom. Posljedica toga (Centralni granični teorem!) je da slučajna varijabla X µ n ima (aproksimativno) jediničnu normalnu razdiobu (bez obzira na to koju razdiobu ima promatrano S obilježje X!), odnosno Z = X µ S n N(0,1). TEST O OČEKIVANJU µ Ako je nulta hipoteza H 0 : µ = µ 0 (µ 0 R) istinita, tada vrijedi Z = X µ 0 S n N(0,1), te tako definiranu slučajnu varijablu Z koristimo kao test-statistiku u ovom slučaju.

95 3.3 Test i pouzdani interval za očekivanje 95 Kritična područja, odnosno kriteriji odbacivanja nulte hipoteze H 0 : µ = µ 0 isti su kao u prvom slučaju (kada pretpostavljamo da imamo normalno distribuirano obilježje i poznatu varijancu); vidi slike 3.1, 3.2 i 3.3. Razlog tome je što u oba ova slučaja (prvom i trećem) test-statistika ima jediničnu normalnu razdiobu, dok se u drugom slučaju (normalno distribuirano obilježje i nepoznata varijanca) pojavljuje Studentova ili t-razdioba. Kritično područje uvijek ovisi o razdiobi test-statistike. POUZDANI INTERVAL za očekivanje µ U ovom slučaju vrijedi: čime dobivamo ( P zα X µ 2 S n ( P X zα 2 zα 2 ) = 1 α, S n µ X +zα 2 S n ) = 1 α, (1 α) 100% pouzdan interval za očekivanje na osnovi velikih uzoraka X zα 2 S n µ X +zα 2 S n Zadatak 33. Zoolog želi procijeniti očekivanu količinu šećera u krvi odredene životinjske vrste nastale nakon ubrizgavanja odredene količine adrenalina. Dobivena aritmetička sredina uzorka od 55 životinja je mg uz standardnu devijaciju uzorka od 10.5 mg. a) Odredite 90% pouzdan interval za očekivanje. b) Može li se, uz razinu značajnosti α = 0.01, zaključiti da je prosječna količina šećera u krvi ovih životinja bila veća od 128 mg?

96 96 STATISTIČKI TESTOVI Rješenje: a) Imamo: n = 55, x = 126.9, s = Nadalje, pa konačno 1 α = 0.9 α = 0.1 α 2 = 0.05 Φ(z 0.05 ) = 0.95 z 0.05 = 1.65, 126.9± = 126.9±2.34 = µ b) Želimo provjeriti je li prosječna količina šećera u krvi bila veća od 128, pa postavljamo hipoteze H 0 : µ = µ 0 = 128 H 1 : µ > 128 Test-statistika koju ćemo koristiti je: Z = X µ 0 S n N(0,1), a njena vrijednost na ovom uzorku je: z = = Kako je očito je z α = z 0.01 = 2.326, z = < z 0.01 = 2.326, pa stoga nultu hipotezu ne možemo odbaciti, odnosno ne možemo zaključiti da je prosječna količina šećera u krvi bila veća od 128. Primijetimo da zapravo uopće nismo morali koristiti tablice: kritično područje je ovdje cijelo na desnoj strani (nad pozitivnim dijelom x- osi), a test-statistika je negativnog predznaka, pa očito nije moguće da je ušla u kritično područje.

97 3.4 t-test Usporedba očekivanja dviju normalno distribuiranih populacija (t-test) Pretpostavimo da mjerimo isto statističko obilježje X u dvije različite populacije, te da je u obje te populacije X normalno distribuirana slučajna varijabla s jednakom varijancom σ 2. Označimo s X (1) statističko obilježje X u populaciji 1, te s X (2) statističko obilježje X u populaciji 2. Imamo: X (1) N(µ 1,σ 2 ) i X (2) N(µ 2,σ 2 ). Po pretpostavci, varijanca σ 2 od X (1) i X (2) je jednaka; ono što nas zanima je jesu li možda i očekivanja µ 1 i µ 2 jednaka. Iz obje populacije uzimamo uzorak; iz populacije 1 uzorak X (1) 1,X(1) 2,...,X(1) n 1 za obilježje X (1) duljine n 1, te iz populacije 2 uzorak X (2) 1,X(2) 2,...,X(2) n 2 za obilježje X (2) duljine n 2. Duljine n 1 i n 2 ne moraju biti jednake. Želimo testirati sljedeću nultu hipotezu H 0 : µ 1 = µ 2. Za alternativnu hipotezu možemo izabrati jednu od sljedeće tri: H 1 : µ 1 µ 2, H 1 : µ 1 > µ 2 ili H 1 : µ 1 < µ 2. Koristimo sljedeću test-statistiku T = X 1 X 2 S n1 n2 gdje su X 1 = 1 n 1 X (1) i, X2 = 1 n 1 n 2 S 2 = n 2 X (2) i, 1 ( (n1 1)S1 2 n 1 +n 2 2 +(n 2 1)S2) 2

98 98 STATISTIČKI TESTOVI i pritom X 1 i S1 2 predstavljaju aritmetičku sredinu i uzoračku varijancu prvog uzorka, a X 2 i S2 2 drugog. S2 se interpretira kao zajednička varijanca uzoraka 1 i 2. Ako je nulta hipoteza H 0 : µ 1 = µ 2 istinita, tada je T t(n 1 +n 2 2), odnosno test-statistika T ima Studentovu ili t-razdiobu s n 1 +n 2 2 stupnjeva slobode. Razmotrimo slučajeve različitih izbora alternativne hipoteze, te pripadne kriterije odbacivanja nulte hipoteze. Kako test-statistika T ima Studentovu razdiobu, kritična područja se formiraju slično kao u slučaju testa o očekivanju uz pretpostavku da je obilježje normalno distribuirano, a varijanca nepoznata. (1) H 0 : µ 1 = µ 2, H 1 : µ 1 µ 2 Nultu hipotezu H 0 odbacujemo ako (vidi sliku 3.4) T > tα 2 (n 1 +n 2 2) ili T < tα 2 (n 1 +n 2 2) (2) H 0 : µ 1 = µ 2, H 1 : µ 1 > µ 2 Nultu hipotezu H 0 odbacujemo ako (vidi sliku 3.5) T > t α (n 1 +n 2 2)

99 3.4 t-test 99 (3) H 0 : µ 1 = µ 2, H 1 : µ 1 < µ 2 Nultu hipotezu H 0 odbacujemo ako (vidi sliku 3.6) T < t α (n 1 +n 2 2) Zadatak 34. Ista vrsta jabuka uzgaja se u Slavoniji i u Zagorju. Na slučajan način izabrano je 7 slavonskih stabala te je izmjeren njihov prinos (u kg): 28, 26, 33, 29, 31, 27, 28. Prinos s 10 zagorskih stabala bio je: 36, 25, 21, 29, 30, 36, 27, 28, 30, 37. Može li se, uz razinu značajnosti 0.01, zaključiti da jabuke u Zagorju daju veći prinos, ako je poznato da je prinos normalna slučajna varijabla. Može li se, uz istu razinu značajnosti, zaključiti da se prinosi jabuka u Slavoniji i Zagorju razlikuju? Rješenje: n 1 = 7, n 2 = 10 Postavljamo hipoteze Koristimo test-statistiku H 0 : µ 1 = µ 2 H 1 : µ 1 < µ 2 T = X 1 X 2 S 1 t(n 1 +n 2 2) 1 n n 2 x 1 = 1 ( ) = x 2 = 1 ( ) = s 2 1 = = 5.81, s2 2 = =

100 100 STATISTIČKI TESTOVI s 2 = (n 1 1)s 2 1 +(n 2 1)s 2 2 n 1 +n 2 2 s = = = t = = t α (n 1 +n 2 2) = t 0.01 (15) = t > t 0.01 (15) Odatle zaključujemo da ne možemo odbaciti H 0, tj. da ne možemo zaključiti da jabuke u Zagorju daju veći prinos. Ako želimo testirati jesu li prinosi različiti, moramo postaviti hipoteze Tada nam treba H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 tα 2 (n 1 +n 2 2) = t (15) = Kako je t > t (15) (i očito t < t (15)) ponovo ne možemo odbaciti nultu hipotezu, tj. ne možemo zaključiti da se prinosi jabuka razlikuju. 3.5 Usporedba varijanci dviju normalno distribuiranih populacija (F-test) Pretpostavimo da mjerimo isto statističko obilježje X u dvije različite populacije, te da je u obje te populacije X normalno distribuirana slučajna varijabla.

101 3.5 F-test 101 Označimo s X (1) statističko obilježje X u populaciji 1, te s X (2) statističko obilježje X u populaciji 2. Imamo: X (1) N(µ 1,σ 2 1 ) i X(2) N(µ 2,σ 2 2 ). Iz populacije 1 uzimamo uzorak X (1) 1,X(1) 2,...,X(1) n 1 duljine n 1, a iz populacije 2 uzorak X (2) 1,X(2) 2,...,X(2) n 2 duljine n 2. Duljine n 1 i n 2 ne moraju biti jednake. Želimo testirati sljedeću nultu hipotezu H 0 : σ 2 1 = σ2 2. Za alternativnu hipotezu možemo izabrati jednu od sljedeće tri: H 1 : σ 2 1 σ2 2, H 1 : σ 2 1 > σ2 2 ili H 1 : σ 2 1 < σ2 2. Koristimo sljedeću test-statistiku F = S2 1 S2 2. Ako je nulta hipoteza H 0 : σ1 2 = σ2 2 istinita, tada F F(n 1 1, n 2 1) odnosno test-statistika F ima Fisherovu ili F-razdiobu s (uredenim) parom stupnjeva slobode (n 1 1, n 2 1). Razmotrimo sada različite slučajeve izbora alternativne hipoteze, te pripadne kriterije odbacivanja nulte hipoteze. (1) H 0 : σ 2 1 = σ2 2, H 1 : σ 2 1 σ2 2 Nultu hipotezu H 0 odbacujemo ako (vidi sliku 3.7) F > fα 2 (n 1 1,n 2 1) ili F < f 1 α 2 (n 1 1,n 2 1)

102 102 STATISTIČKI TESTOVI Slika 3.7: f1 Α 2 fα 2 n1 1,n2 1 (2) H 0 : σ 2 1 = σ2 2, H 1 : σ 2 1 > σ2 2 Nultu hipotezu H 0 odbacujemo ako (vidi sliku 3.8) F > f α (n 1 1,n 2 1) Slika 3.8: f Α n 1 1,n 2 1

103 3.5 F-test 103 (3) H 0 : σ 2 1 = σ2 2, H 1 : σ 2 1 < σ2 2 Nultu hipotezu H 0 odbacujemo ako (vidi sliku 3.9) F < f 1 α (n 1 1,n 2 1) Slika 3.9: f 1 Α n 1 1,n 2 1 Vrijedi f 1 α 2 (n 1,n 2 ) = 1 fα 2 (n 2,n 1 ) Zadatak 35. Iz dva 3.razreda neke srednje škole izabrano je, na slučajan način, po 10 učenika i izmjerena je njihova težina (zna se da je težina normalno distribuirana), a podaci su dani u tablici. Može li se, uz razinu značajnosti 0.02, zaključiti da su varijance težina u ta dva razreda jednake? 3a b

104 104 STATISTIČKI TESTOVI Rješenje: H 0 : σ 2 1 = σ2 2 H 1 : σ 2 1 σ2 2 x 1 = 59.1, x 2 = 58.9 s 2 1 = 1 9 ( 10 f = s2 1 s 2 2 x 2 i n x 2 ) = 8.322, s 2 2 = = = fα 2 (n 1 1,n 2 1) = f 0.01 (9,9) = 5.35 f 1 α 2 (n 1 1,n 2 1) = f 0.99 (9,9) = f 0.99 (9,9) < f < f 0.01 (9,9) 1 (n 2 1,n 2 1 1) = 1 f 0.01 (9,9) = fα Ne možemo odbaciti nultu hipotezu, tj. ne možemo zaključiti da se varijance u ova dva uzorka razlikuju. 3.6 Usporedba očekivanja više normalno distribuiranih populacija (jednofaktorska analiza varijance ANOVA) Jednofaktorska analiza varijance - skraćeno ANOVA (ANalysis Of VAriance) - je test koji koristimo za usporedbu očekivanja barem dvije normalno distribuirane populacije. Za usporedbu očekivanja točno dvije normalno distribuirane populacije koristimo t-test (iako, naravno, i u tom slučaju možemo primijeniti ANOVA-u). Pretpostavimo da mjerimo isto statističko obilježje X u k (k 2) različitih populacija, te da je u svim promatranim populacijama X

105 3.6 ANOVA 105 normalno distribuirana slučajna varijabla s jednakom varijancom σ 2 (ista pretpostavka kao kod t-testa!). Označimo sx (i) statističko obilježje X u populacijii (i = 1,2,...,k). Imamo: X (i) N(µ i,σ 2 ), i = 1,2,...,k. Uzimamo k nezavisnih slučajnih uzoraka X i1,x i2,...,x ini (i = 1,2,...,k), po jedan iz svake populacije; iz i-te populacije za obilježje X (i) duljine n i (i = 1,2,...,k). Želimo testirati nultu hipotezu H 0 : µ 1 = µ 2 =... = µ k, odnosno hipotezu da nema razlike u očekivanjima medu populacijama. Alternativna hipoteza je tada naravno da razlika postoji, točnije, da se barem dvije populacije razlikuju po očekivanjima H 1 : i,j, i j takvi da µ i µ j. Primijetimo da je alternativna hipoteza ovdje po prvi put jedinstvena (nemamo mogućnosti izbora). Za test-statistiku trebaju nam: aritmetička sredina svakog od uzoraka (i = 1, 2,... k) X i = 1 (X i X ini ) n i uzoračka varijanca svakog od uzoraka (i = 1, 2,... k) S 2 i = 1 n i 1 n i (X ij X i ) 2 j=1 ukupna aritmetička sredina svih podataka X = 1 n k n i X ij = 1 n j=1 k n i Xi, n = k n i

106 106 STATISTIČKI TESTOVI suma kvadrata odstupanja srednjih vrijednosti uzoraka od ukupne sredine, odnosno suma kvadrata u odnosu na tretman ( Sum of Squares due to Treatment ) SST = k n i ( X i X) 2 = k n i X2 i n X 2 suma kvadrata pogrešaka ( Sum of Squares due to Error ) SSE = = k n i k (X ij X i ) 2 = (n i 1)Si 2 j=1 k n i k Xij 2 n i X2 i j=1 srednjekvadratno odstupanje medu uzorcima (zbog razlike u tretmanima) srednjekvadratna pogreška MST = SST k 1 MSE = SSE n k Konačno, test-statistika je oblika F = MST MSE. Ako je nulta hipoteza H 0 istinita, tada je F F(k 1, n k), odnosno test-statistika ima Fisherovu ili F-razdiobu s parom stupnjeva slobode (k 1, n k).

107 3.6 ANOVA 107 Nultu hipotezu H 0 odbacujemo ako F > f α (k 1, n k). f Α k 1,n k ANOVA tablica: izvor stupnjevi suma srednjekvadratno vrijednost rasipanja slobode kvadrata odstupanje test-statistike zbog razlike medu tretmanima k 1 SST M ST F zbog greške n k SSE MSE n 1 SS pritom je SS = k n i (X ij X) 2 j=1

108 108 STATISTIČKI TESTOVI Zadatak 36. Pivovara koristi 3 različite linije za punjenje limenki piva. Postoji sumnja da se srednji neto sadržaj limenki razlikuje od linije do linije. Na slučajan način izabrano je 5 limenki sa svake linije, te je izmjeren njihov neto sadržaj. Može li se, uz razinu značajnosti 0.05, zaključiti da postoji značajna razlika u prosječnim neto sadržajima limenki po linijama? linija sadržaj u dcl Rješenje: Potrebno je provjeriti postoji li razlika izmedu prosječnih neto sadržaja limenki po linijama. Budući imamo 3 populacije (=linije), t-test nam ne može pomoći, već moramo provesti ANOVA-u. Krenimo redom: k = 3, n 1 = n 2 = n 3 = 5, n = 3 n i = 15 x 1 = 1 ( ) = x 2 = 1 ( ) = x 3 = x = SST = SSE = j=1 5 x ij = n i X2 i n X 2 = 5 k n i Xij 2 j=1 3 n i x i = x i = x 2 i 15 x2 = k n i X2 i = MST = SST k 1 = = j=1 5 x 2 ij 5 3 x 2 i =

109 3.7 Test i pouzdani interval za proporciju 109 MSE = SSE n k = = Konačno dobivamo vrijednost test-statistike: f = MST MSE = = Iz tablice za F-razdiobu očitamo: f α (k 1, n k) = f 0.05 (2, 12) = 3.89 Kako je f > f 0.05 (2,12) vidimo da je vrijednost test-statistike ušla u kritično područje, što znači da nultu hipotezu o jednakosti očekivanja moramo odbaciti. Zaključujemo stoga da postoji značajna razlika medu prosječnim neto sadržajima limenki po linijama. ANOVA tablica: izvor stupnjevi suma srednjekvadratno vrijednost rasipanja slobode kvadrata odstupanje test-statistike zbog tretmana zbog greške Test i pouzdani interval za proporciju p binomne razdiobe Test i pouzdani interval koji ćemo predstaviti u ovom poglavlju zapravo su specijalan slučaj testa i pouzdanog intervala za očekivanje

110 110 STATISTIČKI TESTOVI na osnovi velikih uzoraka, no zbog svoje važnosti zaslužuju posebno poglavlje. Pretpostavimo da promatramo obilježje X koje je binomno distribuirano, odnosno neka je X B(n,p), te neka je X 1,X 2,...,X n uzorak velike duljine n (n ). Oprez! Oznaka n koristi se i kao oznaka za duljinu uzorka i kao oznaka za parametar binomne razdiobe, što su općenito različite stvari i njihove vrijednosti nisu nužno uvijek jednake. Srećom, u kontekstu ovog testa one jesu jednake; pokus se sastoji od prebrojavanja predmeta/jedinki u uzorku koje zadovoljavaju odredeno svojstvo. poznata je iz konteksta. Vrijednost parametra n, dakle, Parametar koji je najčešće nepoznat, a zanima nas, jest parametar p, kojeg nazivamo i proporcija. Za procjenitelja parametra p uzet ćemo ˆp = X n. Ovo je dobar izbor procjenitelja budući je to nepristran i konzistentan procjenitelj. Provjerimo! Znamo da je E[X] = np i Var[X] = npq, q = 1 p. Imamo: [ ] X E[ˆp] = E = 1 n n E[X] = 1 n np = p [ ] X Var[ˆp] = Var = 1 n n 2 Var[X] = 1 pq npq = n2 n i očito lim n Var[ˆp] = 0. Budući po pretpostavci radimo s velikim uzorkom (n ), te smo u uvjetima Centralnog graničnog teorema, vrijedi ˆp = ˆp p pq n N (0,1).

111 3.7 Test i pouzdani interval za proporciju 111 TEST O PROPORCIJI p Želimo testirati je li proporcija p jednaka nekom unaprijed zadanom broju p 0 (0,1). Nulta hipoteza je H 0 : p = p 0, dok za alternativnu možemo izabrati bilo koju od sljedeće tri: H 1 : p p 0 ili H 1 : p > p 0 ili H 1 : p < p 0 Ako je nulta hipoteza H 0 : p = p 0 istinita, onda vrijedi Z = ˆp p 0 p 0 (1 p 0 ) n = ˆp p 0 p0 (1 p 0 ) n N (0,1). Ovako definiranu slučajnu varijablu Z koristit ćemo kao test-statistiku. Kako test-statistika Z ima jediničnu normalnu razdiobu, kritična područja ista su kao kod testa o očekivanja na osnovi velikog uzorka (čega je ovo, ponovimo još jednom, specijalan slučaj), odnosno za normalno distribuirano obilježje s poznatom varijancom. Dajmo ipak i kratak pregled različitih mogućnosti izbora alternativne hipoteze: (1) H 0 : p = p 0, H 1 : p p 0 Nultu hipotezu H 0 odbacujemo ako je Z > zα 2 3.1). ili Z < zα 2 (vidi sliku (2) H 0 : p = p 0, H 1 : p > p 0 Nultu hipotezu H 0 odbacujemo ako je Z > z α (vidi sliku 3.2). (3) H 0 : p = p 0, H 1 : p < p 0 Nultu hipotezu H 0 odbacujemo ako je Z < z α (vidi sliku 3.3).

112 112 STATISTIČKI TESTOVI POUZDANI INTERVAL za proporciju p Vrijedi pa odatle ( P P( zα ˆp p zα ) = 1 α, 2 pq 2 n ˆp zα 2 pq n p ˆp+z α 2 ) pq = 1 α. n Primijetimo da smo dobili pouzdan interval za p čiji rubovi uključuju vrijednost od p - koju ne znamo i želimo procijeniti. No, za velike n, dobit ćemo dovoljno dobre rezultate ako p zamijenimo s ˆp, pa tako dobivamo: (1 α) 100% pouzdan interval za proporciju p (na osnovi velikog uzorka) ˆp(1 ˆp) ˆp(1 ˆp) ˆp zα 2 n p ˆp+zα 2 n Zadatak 37. Proizvodač tvrdi da njegove pošiljke sadrže najviše 7% defektnih proizvoda. Uzet je slučajan uzorak od 200 komada iz jedne pošiljke i u njemu je nadeno 11 defektnih proizvoda. Možemo li, uz razinu značajnosti 0.05, zaključiti da proizvodač govori istinu? Rješenje: Postavljamo hipoteze: H 0 : p = 0.07 H 1 : p < 0.07 Kad bi za alternativnu hipotezu postavili H 1 : p 0.07, u slučaju odbacivanja nulte hipoteze mogli bi zaključiti samo da proporcija defektnih nije 0.07, a to može značiti da je veća, ali i da je manja od

113 3.7 Test i pouzdani interval za proporciju 113 te vrijednosti, što bi u danom kontekstu bilo još i bolje. Izračunajmo vrijednost odgovarajuće test-statistike: ˆp = = = z = 200 = z α = z 0.05 = 1.65 z > z 0.05 Nultu hipotezu H 0 ne možemo odbaciti, tj. ne možemo zaključiti da pošiljke sadrže manje od 7% defektnih proizvoda. Zadatak 38. Uzorak od 100 kućanstava nekog grada pokazao je da se u 55% kućanstava bar jedan član koristi Internetom. a) Nadite 95% pouzdan interval za omjer kućanstava u tom gradu koja se služe Internetom. b) Koliko kućanstava treba uzeti kako bi s vjerojatnošću 0.95 mogli tvrditi da se najmanje 50% kućanstava služi Internetom? Rješenje: a) ˆp = 0.55, n = α = 0.95 α = 0.05 α 2 = zα = z = ˆp(1 ˆp) ˆp±zα = 0.55± n 100 = p = 0.55±

114 114 STATISTIČKI TESTOVI b) n =? ( ) P p = 0.95 n n želimo da vrijedi: p 0.5, pa odatle n n n n = n Usporedba proporcija Pretpostavimo da mjerimo isto statističko obilježje X u dvije različite populacije, te da je u obje te populacija X slučajna varijabla koja ima binomnu razdiobu. Označimo s X (1) slučajnu varijablu koja predstavlja X u populaciji 1, a s X (2) slučajnu varijablu koja predstavlja X u populaciji 2. Imamo: X (1) B(n 1, p 1 ) i X (2) B(n 2, p 2 ). Pritom je istovremeno n 1 duljina uzorka uzeta iz populacije 1, a n 2 duljina uzorka uzeta iz populacije 2. Pretpostavljamo da su uzorci velike duljine (n 1, n 2 ), te da su medusobno nezavisni. Želimo testirati sljedeću nultu hipotezu H 0 : p 1 = p 2. Za alternativnu hipotezu možemo izabrati jednu od sljedeće tri: H 1 : p 1 p 2, H 1 : p 1 > p 2 ili H 1 : p 1 < p 2. Koristimo sljedeću test-statistiku

115 3.8 Usporedba proporcija 115 Z = ˆp 1 ˆp 2 ˆp(1 ˆp) 1 1 n n 2 gdje su s ˆp 1 i ˆp 2 označeni procjenitelji parametara p 1 i p 2 (vjerojatnosti uspjeha), dok je ˆp = n 1ˆp 1 +n 2ˆp 2 n 1 +n 2 procjena zajedničke vjerojatnosti uspjeha. Ako je nulta hipoteza H 0 : p 1 = p 2 istinita, tada je Sada imamo: Z N(0,1). (1) H 0 : p 1 = p 2, H 1 : p 1 p 2 Nultu hipotezu H 0 odbacujemo ako je Z > zα 2 (vidi sliku 3.1). ili Z < zα 2 (2) H 0 : p 1 = p 2, H 1 : p 1 > p 2 Nultu hipotezu H 0 odbacujemo ako je Z > z α (vidi sliku 3.2). (3) H 0 : p 1 = p 2, H 1 : p 1 < p 2 Nultu hipotezu H 0 odbacujemo ako je Z < z α (vidi sliku 3.3). Zadatak 39. Uzorci od 300 glasača iz županije A i 200 glasača iz županije B pokazali su da će 56% i 48% ljudi, redom, glasati za nekog odredenog kandidata. Može li se, uz razinu značajnosti 0.05, zaključiti da a) postoji razlika medu županijama b) tog kandidata više vole u županiji A. Rješenje: n 1 = 300, ˆp 1 = 0.56

116 116 STATISTIČKI TESTOVI n 2 = 200, ˆp 2 = 0.48 a) H 0 : p 1 = p 2 H 1 : p 1 p 2 ˆp = n 1ˆp 1 +n 2ˆp 2 = n 1 +n z = = zα 2 = z = = = z < z = Ne možemo odbaciti nultu hipotezu, tj. ne možemo zaključiti da postoji razlika medu županijama. b) H 0 : p 1 = p 2 H 1 : p 1 > p 2 z α = z 0.05 = 1.64 z > z 0.05 = Odbacujemo nultu hipotezu, tj. možemo zaključiti da kandidata više vole u županiji A. 3.9 χ 2 - test o prilagodbi modela podacima χ 2 - test o prilagodbi modela podacima je test koji primjenjujemo kada želimo provjeriti imaju li podaci neku unaprijed pretpostavljenu razdiobu. Pritom je izbor te moguće razdobe naravno šarolik. Nulta hipoteza ovog testa je H 0 : podaci odgovaraju pretpostavljenom modelu,

117 3.9 χ 2 - test o prilagodbi modela podacima 117 drugim riječima, H 0 : podaci imaju pretpostavljenu razdiobu. Alternativna hipoteza je time i ovdje jednoznačno odredena H 1 : podaci ne odgovaraju pretpostavljenom modelu. Test-statistika je oblika H = k (f i f i )2 f i gdje su f i eksperimentalne, a f i = np i teorijske frekvencije. Ako je nulta hipoteza H 0 istinita, tada za velike n (n ), gdje je n duljina uzorka, vrijedi H χ 2 (k r 1) gdje χ 2 (k r 1) označava χ 2 razdiobu s k-r-1 stupnjeva slobode. Pritom je k = (konačan) broj razreda r = broj nepoznatih (procijenjenih) parametara Nultu hipotezu H 0 odbacujemo ako H > χ 2 α(k r 1).

118 118 STATISTIČKI TESTOVI Slika 3.10: Χ 2 Α k r 1 Zadatak 40. Proizvodač tvrdi da je 5% njegovih proizvoda prve klase, 92% druge i 3% treće klase. U slučajnom uzorku od 500 proizvoda nadeno je 40 proizvoda prve, 432 druge i 28 treće klase. Može li se, uz razinu značajnosti 0.05, zaključiti da je proizvodač u pravu? Rješenje: Proizvodač tvrdi da njegovi proizvodi imaju navedenu razdiobu. Govori li istinu, provjerit ćemo χ 2 - testom. Duljina uzorka je n = 500. Kako bismo izračunali vrijednost odgovarajuće teststatistike trebaju nam teorijske frekvencije. Njih računamo po formuli f i = np i gdje je p i odgovarajuća vjerojatnost, odnosno, u ovom slučaju, odgovarajuća proporcija. Tako je Formirajmo tablicu: p 1 = 5 100, p 2 = , p 3 = i f i f i (f i f i )2 f i = = = Σ

119 3.9 χ 2 - test o prilagodbi modela podacima 119 Suma poslijednjeg stupca u tablici daje nam vrijednost tražene test-statistike: h = 3 (f i f i )2 f i = Tablična vrijednost s kojom ju moramo usporediti kako bismo donijeli odluku o istinitosti nulte hipoteze je χ 2 α(k r 1); pritom je α zadana razina značajnosti (= 0.05), k = 3 (ukupan broj razreda), a r = 0 (nije bilo nijednog nepoznatog parametra, pa ništa nije bilo potrebno procijenjivati). Dakle, χ 2 α (k r 1) = χ (2) = 6.0. Kako je h > χ (2), što znači da je vrijednost test-statistike ušla u kritično područje, moramo odbaciti nultu hipotezu. Drugim riječima, odbacujemo tvrdnju proizvodača da se kvaliteta njegovih proizvoda podvrgava navedenoj razdiobi, tj. proizvodač nije u pravu. Zadatak 41. Pet novčića, s istom ali nepoznatom vjerojatnošću p da padne pismo, bacaju se 100 puta (rezultati su dani u tablici). Uz razinu značajnosti 0.01, može li se zaključiti da broj pisama koji se dobije u jednom bacanju ima binomnu radiobu? broj pisama x i frekvencija f i Rješenje: Potrebno je provjeriti imaju li dani podaci binomnu razdiobu. Neka slučajna varijabla X broji koliko puta je palo pismo. Pokus koji izvodimo (ponavljamo ga 100 puta, dakle n = 100) je bacanje novčića 5 puta, a dogadaj koji tretiramo kao uspjeh je palo

120 120 STATISTIČKI TESTOVI je pismo. Parametar n binomne razdiobe od X je stoga jednak 5. Parametar p nije zadan, te ga moramo procijeniti. Oprez! n sada označava i duljinu uzorka i parametar razdiobe, no to su različite stvari i različite vrijednosti, pa na to treba pripaziti. Parametar p jednak je vjerojatnosti uspjeha u jednom bacanju novčića. Njegovu procjenu dobijemo tako da ukupan broj palih pisama podijelimo s ukupnim brojem bacanja novčića. Novčić je ukupno bačen = 500 puta (100 pokusa, a svaki se sastoji od 5 bacanja). Ukupan broj pisama računamo pomoću dane tablice: = 238. Konačno, ˆp = = Sljedeći korak je izračunati teorijske frekvencije f i = np i. Funkcija gustoće vjerojatnosti slučajne varijable X B(5,0.476) je ( ) 5 p i := p X (i) = P(X = i) = (0.476) i (0.524) 5 i, i pa dobivamo ( ) 5 f 0 = 100 p 0 = 100 (0.476) 0 (0.524) 5 = ( ) 5 f 1 = 100 p 1 = 100 (0.476) 1 (0.524) 4 = ( ) 5 f 2 = 100 p 2 = 100 (0.476) 2 (0.524) 3 = ( ) 5 f 3 = 100 p 3 = 100 (0.476) 3 (0.524) 2 = ( ) 5 f 4 = 100 p 4 = 100 (0.476) 4 (0.524) 1 = ( ) 5 f 5 = 100 p 5 = 100 (0.476) 5 (0.524) 0 =

121 3.9 χ 2 - test o prilagodbi modela podacima 121 Uočimo da je teorijska frekvencija prvog i poslijednjeg razreda < 5. Stoga ćemo te razrede spojiti s njima susjednim razredima. Ukoliko bismo tako opet dobili razred čija je teorijska frekvencija strogo manja od 5, postupak bismo ponavljali dok ne bismo dobili razred s (ukupnom) teorijskom frekvencijom 5. Nakon toga formiramo novu tablicu: i f i f i (f i f i )2 f i = = = = Σ Vrijednost test-statistike je dakle h = 4 (f i f i )2 f i = Konačan broj razreda je k = 4, a broj procijenjenih parametara je r = 1 (procijenili smo parametar p; da je bilo rečeno da bacamo simetrične novčiće, tada bismo imali p = 1/2, pa taj parametar ne bi bilo potrebno procjenjivati, odnosno bilo bi r = 0). očitavamo χ 2 α(k r 1) = χ (2) = 9.2. Iz tablice Kako je h < χ (2), što znači da vrijednost test-statistike nije ušla u kritično područje, ne možemo odbaciti nultu hipotezu, odnosno ne možemo zaključiti da se ne radi o binomnoj razdiobi.

122 122 STATISTIČKI TESTOVI Zadatak 42. Anketirano je 100 studenata vezano za broj njihovih odlazaka u kazalište tijekom godine; podaci su u tablici. Može li se, uz razinu značajnosti 0.05, zaključiti da se radi o uzorku iz normalno distribuirane populacije? broj posjeta [ 0.5, 1.5] [1.5, 3.5] [3.5, 5.5] [5.5, 7.5] [7.5, 9.5] [9.5, 11.5] broj studenata Rješenje: Normalna distribucija ima dva parametra - očekivanje µ i varijancu σ 2. Kako nijedan od njih nije zadan, moramo ih oba procijeniti, pa odmah slijedi da je r = 2. Procjenitelj za očekivanje je ˆµ = x, a za varijancu ˆσ 2 = s 2. U tablici su prikazani podaci sortirani u razrede. Kao predstavnike podataka iz svakog pojedinog razreda uzimamo sredinu tog razreda (kao što smo radili u deskriptivnoj statistici; vidi Zadatak 1). Sada ˆµ = 1 ( ) = ˆσ 2 = 1 99 ( ) = Postavljamo nultu hipotezu da slučajna varijabla X koja broji godišnje odlaske u kazalište ima distribuciju X N(6.06, 6.996) Sljedeći korak je odrediti teorijske frekvencije f i = 100 p i. Imamo

123 3.9 χ 2 - test o prilagodbi modela podacima 123 p 1 = P( 0.5 X 1.5) = P = Φ( 1.72) Φ( 2.48) = Φ(2.48) Φ(1.72) = = = f 1 = p 2 = P(1.5 X 3.5) = P ( X ) ( X ) = Φ( 0.97) Φ( 1.72) = Φ(1.72) Φ(0.97) = = = f 2 = p 3 = P(3.5 X 5.5) = P ( 0.97 X 0.21) = Φ( 0.21) Φ( 0.97) = Φ(0.97) Φ(0.21) = = = f 3 = p 4 = P(5.5 X 7.5) = P ( 0.21 X 0.54) = Φ(0.54) Φ( 0.21) = = = f 4 = p 5 = P(7.5 X 9.5) = P (0.54 X 1.30) = Φ(1.3) Φ(0.54) = = = f 5 = p 6 = P(9.5 X 11.5) = P (1.30 X 2.06) = Φ(2.06) Φ(1.3) = = = f 6 = 7.71 Budući je f 1 < 5, spojit ćemo prva dva razreda, pa će tako ostati ukupno 5 razreda. Dakle, k = 5. Formiramo novu tablicu:

124 124 STATISTIČKI TESTOVI i f i f i (f i f i )2 f i Vrijednost test-statistike je prema tome a h = 5 (f i f i )2 f i = 2.04, χ 2 α(k r 1) = χ (2) = 6, pa kako je h < χ (2), nultu hipotezu ne možemo odbaciti, odnosno ne možemo zaključiti da se ne radi o uzorku iz normalno distribuirane populacije. Zadatak 43. (DZ) Bilježen je broj četvorki rodenih u nekoj županiji tijekom 70 godina. Podaci su dani u tablici. Može li se, uz razinu značajnosti 0.05, zaključiti da podaci dolaze iz populacije s Poissonovom razdiobom? broj rodenih četvorki broj godina Napomena: ˆλ = x

125 3.10 χ 2 - test nezavisnosti dviju varijabli χ 2 - test nezavisnosti dviju varijabli Neka je (X 1,Y 1 ), (X 2,Y 2 ),...,(X n,y n ) slučajni uzorak duljine n za dvodimenzionalno diskretno statističko obilježje (X, Y) i neka je pritom: ImX = {a 1,...,a r }, ImY = {b 1,...,b s } = Im(X,Y) = {(a i,b j ) : i = 1,2,...,r, j = 1,2,...,s} Nadalje, neka je: f ij f i = s j=1 f ij frekvencija (a i,b j ) u uzorku (marginalna) frekvencija a i u uzorku g j = r f ij (marginalna) frekvencija b j u uzorku Kontingencijska frekvencijska tablica: X Y b 1 b 2... b s Σ a 1 f 11 f f 1s f 1 a 2 f 21 f f 2s f a r f r1 f r2... f rs f r Konačno, uvedimo oznake: Σ g 1 g 2... g s n p ij = P(X = a i, Y = b j ) (i = 1,2,...,r, j = 1,2,...,s) p i = P(X = a i ) q j = P(X = b j ) (i = 1,2,...,r) (j = 1,2,...,s).

126 126 STATISTIČKI TESTOVI Želimo testirati nultu hipotezu H 0 : p ij = p i q j, i,j odnosno H 0 : X i Y su medusobno nezavisne slučajne varijable Alternativna hipoteza je ponovo jednoznačno odredena H 1 : i,j, i j takvi da p ij p i q j odnosno H 0 : X i Y nisu medusobno nezavisne slučajne varijable uzeti: Ako je nulta hipoteza H 0 istinita, kao procjene za p i i q j možemo ˆp i = f i n i ˆq j = g j n. Očekivane vrijednosti f ij od f ij (teorijske frekvencije) su tada: f ij = n ˆp i ˆq j = n fi n gj n = f i g j n. Koristimo test-statistiku r s (f ij f ij H = )2 j=1 f ij χ 2 ((r 1)(s 1)) Nultu hipotezu o nezavisnosti odbacujemo ako (vidi sliku 3.10) H > χ 2 α((r 1)(s 1))

127 3.10 χ 2 - test nezavisnosti dviju varijabli 127 Zadatak 44. U cilju ispitivanja sklonosti potrošača nekom proizvodu, uzet je uzorak na temelju kojeg su dobiveni podaci dani u tablici. Može li se, uz razinu značajnosti 0.05, na osnovi ovih podataka zaključiti da sklonost potrošača tom proizvodu ne ovisi o njihovom dohotku? mjesečni dohodak sklonost potrošnji anketiranih kupaca (u kn) stalno kupuju povremeno kupuju ne kupuju Rješenje: < > Označimo s X slučajnu varijablu koja mjeri visinu dohotka, a s Y onu koja mjeri sklonost potrošnji. Postavljamo hipoteze: H 0 : X i Y su nezavisne slučajne varijable H 1 : X i Y su zavisne slučajne varijable Provest ćemo χ 2 -test o nezavisnosti dviju varijabli. Potrebno je izračunati teorijske frekvencije f ij za i = 1,2,3,4, j = 1,2,3, pa u tu svrhu pogledajmo najprije kolike su marginalne frekvencije f i i g j. mjesečni stalno povremeno ne dohodak kupuju kupuju kupuju < f 1 = f 2 = f 3 = 306 > f 4 = 237 g 1 = 600 g 2 = 200 g 3 = 100 n = 900

128 128 STATISTIČKI TESTOVI Sada imamo: f 11 = f 1 g 1 n = = 72 f 31 = f 3 g 1 n = = 204 f 12 = f 1 g 2 n = = 24 f 32 = f 3 g 2 n = = 68 f 13 = f 1 g 3 n = = 12 f 33 = f 3 g 3 n = = 34 f 21 = f 2 g 1 n = = 166 f 41 = f 4 g 1 n = = 158 f 22 = f 2 g 2 n = = 55.3 f 42 = f 4 g 2 n = = f 23 = f 2 g 3 n = = f 43 = f 4 g 3 n = = 26.3 Kako bismo lakše izračunali vrijednost test-statistike, zgodno je, radi preglednosti, eksperimentalnim frekvencijama u tablici pridružiti odgovarajuće teorijske: mjesečni dohodak stalno kupuju povremeno kupuju ne kupuju < /72 17/24 21/ /166 56/ / /204 85/68 26/34 > /158 42/ /26.3 Preostalo je izračunati vrijednost test-statistike: Iz tablice očitavamo: h = 4 3 (f ij f ij )2 f j=1 ij = χ 2 α((r 1)(s 1)) = χ ((4 1)(3 1)) = χ (6) = 12.6,

129 3.11 χ 2 - test homogenosti populacija 129 pa kako je h > χ (6) vidimo da je vrijednost test-statistike ušla u kritično područje. Nultu hipotezu o nezavisnosti stoga odbacujemo i zaključujemo da su visina mjesečnog dohotka (slučajna varijabla X) i sklonost potrošnji (slučajna varijabla Y ) medusobno zavisne χ 2 - test homogenosti populacija Pretpostavimo da nas zanima razdioba istog diskretnog statističkog obilježja X u raznim populacijama. Točnije, zanima nas je li razdioba od X jednaka u svim populacijama, odnosno jesu li populacije homogene s obzirom na X. Promatramo m različitih populacija. Iz svake uzimamo uzorak duljine n i (i = 1,2,...,m); uzorci su medusobno nezavisni. S X (i) označimo slučajnu varijablu koja predstavlja X u i-toj populaciji (i = 1,2,...,m). Nulta hipoteza je da su sve X (i) jednake po distribuciji, a alternativna je da postoji barem jedna koja se po distribuciji razlikuje od ostalih, odnosno H 0 : X (1) D = X (2) D =... D = X (m) H 1 : i,j, i j tako da X (i) D X (j) Kako su X (i) po pretpostavci diskretne slučajne varijable, njihov zakon razdiobe možemo prikazati sljedećom tablicom X (i) a 1 a 2... a k p (i) 1 p (i) 2... p (i) k pa sada H 0 možemo zapisati i ovako H 0 : p (i) j = p j, j = 1,...,k, i = 1,...,m

130 130 STATISTIČKI TESTOVI gdje je p j = P(X = a j ), što će reći da p j predstavljaju zajedničke (tj. po populacijama jednake) vjerojatnosti da X poprimi vrijednost a j. Uvedimo oznake: f ij f j = m f ij frekvencija a j u uzorku iz i-te populacije frekvencija a j u svim uzorcima zajedno n i = k j=1 f ij duljina uzorka iz i-te populacije Frekvencijska tablica: X a 1 a 2... a k populacija 1 f 11 f f 1k n 1 populacija 2 f 21 f f 2k n populacija m f m1 f m2... f mk n m f 1 f 2... f k n Ako je nulta hipoteza H 0 istinita, kao procjenu zajedničkih vjerojatnosti p j možemo uzeti: ˆp j = f j n, j = 1,...,k i tada su očekivane (teorijske) frekvencije f ij od a ij: f ij = n i ˆp j = n i f j n. Koristimo test-statistiku: m k (f ij f ij H = )2 χ 2 ((m 1)(k 1)) j=1 f ij

131 3.11 χ 2 - test homogenosti populacija 131 Nultu hipotezu o homogenosti populacija odbacujemo ako (vidi sliku 3.10) H > χ 2 α ((m 1)(k 1)) Zadatak 45. U tvorničkom pogonu proizvode se televizori. Svakog radnog dana u tjednu registrira se broj neispravnih televizora. Provedena su opažanja tijekom 750 dana i rezultati su prikazani u tablici. Može li se, uz razinu značajnosti 0.05, zaključiti da nema značajne razlike u pojavi neispravnih televizora tijekom tjedna? broj neispravnih televizora PON UTO SRI ČET PET > Rješenje: Neka je X broj neispravnih televizora po danu. Ako dane u tjednu shvatimo kao 5 različitih populacija (iz kojih su uzeti uzorci), onda je potrebno provjeriti ima li promatrano obilježje X jednaku distribuciju u svih tih 5 populacija, tj. dana. To ćemo provjeriti χ 2 -testom o homogenosti populacija. Hipoteze su: H 0 : X ima istu vjerojatnosnu razdiobu u svih 5 populacija, tj. X (1) D = X (2) D = X (3) D = X (4) D = X (5) H 1 : X nema istu vjerojatnosnu razdiobu u svih 5 populacija Kako bismo izračunali vrijednost odgovarajuće test-statistike, potrebne su nam teorijske frekvencije f ij, pa pogledajmo najprije kolike su duljine uzoraka n i iz svake od populacija (i = 1,2,3,4,5), te

132 132 STATISTIČKI TESTOVI marginalne frekvencije f j svake od vrijednosti a j koje X može poprimiti (j = 1,2,3). broj neispr.tv > PON n 1 = 150 UTO n 2 = 150 SRI n 3 = 150 ČET n 4 = 150 PET n 5 = 150 f 1 = 304 f 2 = 313 f 3 = 133 n = 750 Sada: f 11 = n 1 f 1 n = Kako je n 1 = n 2 = n 3 = n 4 = n 5 = 150, to je = 60.8 f 21 = n 2 f 1 n = f 31 = n 3 f 1 n = f 41 = n 4 f 1 n = f 51 = n 5 f 1 n = f 11, odnosno f 11 = f 21 = f 31 = f 41 = f 51 = Slično, f 12 = n 1 f 2 n f 13 = n 1 f 3 n = = = 62.6 = f 22 = f 32 = f 42 = f 52 = 26.6 = f 23 = f 33 = f 43 = f 53. Vrijednost test-statistike je: h = 5 3 (f ij f ij )2 f j=1 ij = Iz tablice za χ 2 -razdiobu očitavamo χ 2 α((m 1)(k 1)) = χ (4 2) = χ (8) = 15.5.

133 3.11 χ 2 - test homogenosti populacija 133 Kako je h < χ (8), vidimo da vrijednost test-statistike nije ušla u kritično područje, pa nultu hipotezu ne možemo odbaciti. Dakle, ne možemo zaključiti da populacije nisu homogene, što znači da promatrano statističko obilježje ( = broj pokvarenih televizora) ima jednaku distribuciju u svim populacijama ( = u svim danima).

134 134 STATISTIČKI TESTOVI

135 Poglavlje 4 LINEARNI REGRESIJSKI MODEL 4.1 Linearna regresija Pretpostavimo da želimo odrediti postoji li veza izmedu dvije varijable: x i y. Pritom je x nezavisna (neslučajna, kontrolirana) varijabla, dok je y zavisna (slučajna) varijabla. Kako bismo naglasili razliku izmedu njih, nezavisnu varijablu označavamo malim slovom (x), a zavisnu velikim (Y ). 1 Funkcija koja opisuje vezu izmedu x i Y može biti različitih ti- 1 Odakle naziv regresija? Sir Francis Galton je u svom radu Regression Toward Mediocrity in Hereditary Sature iz istraživao povezanost visina očeva i sinova i došao je do zaključka da su sinovi vrlo visokih (niskih) očeva uglavnom viši (niži) od prosjeka, ali ipak niži (viši) od svojih očeva - visina sinova teži prema srednjoj vrijednosti, a ne prema još većim (manjim) vrijednostima regresija! 135

136 136 LINEARNI REGRESIJSKI MODEL pova. Može biti npr. polinom, eksponencijalna funkcija, logaritamska funkcija, trigonometrijska funkcija, itd. Tip veze koji će nas ovdje zanimati je linearna veza. Pretpostavimo da imamo n parova podataka(x i,y i ), i = 1,2,...,n. Dobivene podatke potrebno je najprije prikazati grafički (dijagram raspršenja), kako bi se sa slike vidjelo postoji li eventualno veza medu varijablama, te kojeg je ona tipa; vidi sliku 4.1. Slika 4.1: Na prvoj gornjoj slici, veza medu prikazanim varijablama je očito kvadratna funkcija - kroz točke je moguće provući parabolu koja će dosta dobro opisivati povezanost varijabli. Na drugoj gornjoj slici, veza ne postoji - točke su jako raspršene. Konačno, na donje dvije slike, veza medu varijablama je očito linearna; graf pripadajuće funkcije je pravac Y = ax+b. Želimo naći

137 4.1 Linearna regresija 137 JEDNOSTAVNI LINEARNI REGRESIJSKI MODEL Y i = a x i +b+ε i, i = 1,2,...,n, gdje su a i b nepoznati parametri, x i vrijednosti nezavisne, a Y i vrijednosti zavisne varijable. Slučajne varijable ε i su slučajne greške. Pretpostavljamo da su one medusobno nezavisne, te da vrijedi ε i N(0,σ 2 ), i = 1,...,n. Sada treba naći dobre procjenitelje â i ˆb za parametre a i b. Nepristrane i konzistentne procjenitelje za a i b dobivamo metodom najmanjih kvadrata i oni su oblika: â = S xy Sx 2, ˆb = Ȳ â x, pri čemu je S xy kovarijanca: ( S xy = 1 n n ) (x i x)(y i n 1 Ȳ) = 1 x i Y i n xȳ n 1 Nepristran i konzistentan procjenitelj za varijancu σ 2 slučajnih grešaka ε i je pri čemu je SSE = n (Y i Ŷi) 2 = ˆσ 2 = SSE n 2 n ( ) 2 Y i (âx i +ˆb) = (n 1) ( Sy 2 â 2 Sx 2 ) ( ) = (n 1) S 2 y âs xy Sada znamo kako točkasto procijeniti parametre a i b, no uvijek je korisno imati i intervale procjene, te mogućnost testiranja hipoteza vezanih uz vrijednosti parametara a i b.

138 138 LINEARNI REGRESIJSKI MODEL (1 α)100% pouzdan interval za parametar a â tα 2 (n 2) ˆσ (n 1)S 2 x a â+tα 2 (n 2) ˆσ (n 1)S 2 x (1 α)100% pouzdan interval za parametar b ˆb t α(n 2) ˆσ 2 1 n + x 2 (n 1)S 2 x b ˆb + tα(n 2) ˆσ 2 1 n + x 2 (n 1)S 2 x Želimo li testirati nultu hipotezu: H 0 : a = a 0 (a 0 R) pri čemu za alternativnu hipotezu možemo izabrati bilo koju od: H 1 : a a 0, H 1 : a > a 0 ili H 1 : a < a 0 koristimo test-statistiku T a = â a 0 ˆσ (n 1)S 2 x H 0 t(n 2) Želimo li testirati nultu hipotezu: H 0 : b = b 0 (b 0 R) pri čemu za alternativnu hipotezu možemo izabrati bilo koju od: H 1 : b b 0, H 1 : b > b 0 ili H 1 : b < b 0 koristimo test-statistiku ˆb b0 T b = 1 ˆσ n + x 2 (n 1)Sx 2 H 0 t(n 2)

139 4.1 Linearna regresija 139 Kako u oba testa test-statistika ima Studentovu ili t-razdiobu, kritična područja, tj. kriteriji odbacivanja nulte hipoteze, formiraju se slično kao kod t-testa i testa o očekivanju za normalno distribuiranu populaciju s nepoznatom varijancom (vidi slike 3.4, 3.5 i 3.6). Razlika je jedino u broju stupnjeva slobode. Procjena linearnog modela može se dobiti za svaki set podataka, no pitanje je koliko je takav model dobar za te podatke. Pokazatelji je li nadeni linearni model dobar (prihvatljiv) model za dane podatke su: test značajnosti linearnog modela - svodi se na testiranje H 0 : a = 0, H 1 : a 0 koeficijent determinacije R 2 = 1 SSE (n 1)S 2 y [0,1] Što je vrijednost R 2 bliže 1, to je prilagodba linearnog modela podacima bolja. Koeficijent determinacije jednak je kvadratu koeficijenta korelacije (vidi sljedeće poglavlje). Zadatak 46. U tablici su dani podaci o broju emitiranih reklama tijekom 8 uzastopnih mjeseci za neki proizvod i ostvarenoj zaradi na tom proizvodu. broj reklama zarada (u tisućama kuna) a) Odredite procjenu pravca regresije za ove podatke. b) Odredite 95% pouzdane intervale za a i b.

140 140 LINEARNI REGRESIJSKI MODEL c) Uz razinu značajnosti 0.05, testirajte hipotezu da je koeficijent smjera tog pravca jednak 0, tj. linearna veza. da izmedu x i Y ne postoji d) Je li predloženi linearni model dobar za dane podatke? Rješenje: a) Procijenimo najprije parametre a i b: â = S xy Sx 2, ˆb = Ȳ â x. x = 1 8 ȳ = x i = 1 ( ) = 51 8 y i = 1 ( ) = x 2 i = = s 2 x = 1 n 1 ( n ) x 2 i n x 2 = 1 ( ) = x i y i = ( = n ) s xy = 1 x i y i n xȳ = 1 ( ) = n 1 7 = â = s xy s 2 = x = = ˆb = ȳ â x = = = y = x procjena pravca regresije za ove podatke b) Moramo naći pouzdane intervale za parametre a i b. U tu svrhu moramo izračunati: ˆσ 2 = SSE n 2, n SSE = (Y i Ŷi) 2

141 4.1 Linearna regresija 141 Znamo da je Ŷ i = âx i +ˆb, pa onda: ŷ 1 = âx 1 +ˆb = = ŷ 2 = âx 2 +ˆb = = ŷ 3 = âx 3 +ˆb = = ŷ 4 = âx 4 +ˆb = = ŷ 5 = âx 5 +ˆb = = ŷ 6 = âx 6 +ˆb = = ŷ 7 = âx 7 +ˆb = = ŷ 8 = âx 8 +ˆb = = Formirajmo tablicu: i x i y i ŷ i (y i ŷ i )

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1) 2.2 Srednje vrijednosti aritmetička sredina, medijan, mod Podaci (realizacije varijable X): x 1,x 2,...,x n (1) 1 2.2.1 Aritmetička sredina X je numerička varijabla. Aritmetička sredina od (1) je broj:

Διαβάστε περισσότερα

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011. INTEGRALNI RAČUN Teorije, metodike i povijest infinitezimalnih računa Lucija Mijić lucija@ktf-split.hr 17. veljače 2011. Pogledajmo Predstavimo gornju sumu sa Dodamo još jedan Dobivamo pravokutnik sa Odnosno

Διαβάστε περισσότερα

3 Populacija i uzorak

3 Populacija i uzorak 3 Populacija i uzorak 1 3.1 Slučajni uzorak X varijabla/stat. obilježje koje izučavamo Cilj statističke analize na osnovi uzorka izvesti odredene zaključke o (populacijskoj) razdiobi od X 2 Primjer 3.1.

Διαβάστε περισσότερα

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016. Broj zadataka: 5 Vrijeme rješavanja: 120 min Ukupan broj bodova: 100 Zadatak 1. (a) Napišite aksiome vjerojatnosti ako je zadan skup Ω i σ-algebra F na Ω. (b) Dokažite iz aksioma vjerojatnosti da za A,

Διαβάστε περισσότερα

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića Verovatnoća i Statistika I deo Teorija verovatnoće zadaci Beleške dr Bobana Marinkovića Iz skupa, 2,, 00} bira se na slučajan način 5 brojeva Odrediti skup elementarnih dogadjaja ako se brojevi biraju

Διαβάστε περισσότερα

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa Slučajne varijable Statistički podaci su distribuirani po odredenoj zakonitosti. Za matematičko (apstraktno) opisivanje te zakonitosti potrebno je definirati slučajnu varijablu kojoj pripada odredena razdioba

Διαβάστε περισσότερα

Slučajne varijable Materijali za nastavu iz Statistike

Slučajne varijable Materijali za nastavu iz Statistike Slučajne varijable Materijali za nastavu iz Statistike Kristina Krulić Himmelreich i Ksenija Smoljak 2012/13 1 / 1 Slučajna varijabla Slučajna varijabla je funkcija X koja elementarnim dogadajima pridružuje

Διαβάστε περισσότερα

1 Promjena baze vektora

1 Promjena baze vektora Promjena baze vektora Neka su dane dvije različite uredene baze u R n, označimo ih s A = (a, a,, a n i B = (b, b,, b n Svaki vektor v R n ima medusobno različite koordinatne zapise u bazama A i B Zapis

Διαβάστε περισσότερα

(BIO)STATISTIKA. seminari. smjer: Prehrambena tehnologija i Biotehnologija. pripremila: dr.sc. Iva Franjić

(BIO)STATISTIKA. seminari. smjer: Prehrambena tehnologija i Biotehnologija. pripremila: dr.sc. Iva Franjić (BIO)STATISTIKA seminari smjer: Prehrambena tehnologija i Biotehnologija pripremila: dr.sc. Iva Franjić Sadržaj DESKRIPTIVNA STATISTIKA 4. Grafički prikaz podataka..................... 4. Srednje vrijednosti

Διαβάστε περισσότερα

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1. σ-algebra skupova Definicija : Neka je Ω neprazan skup i F P(Ω). Familija skupova F je σ-algebra skupova na Ω ako vrijedi:. F, 2. A F A C F, 3. A n, n N} F n N A n F. Borelova σ-algebra Definicija 2: Neka

Διαβάστε περισσότερα

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x Zadatak (Darjan, medicinska škola) Izračunaj vrijednosti trigonometrijskih funkcija broja ako je 6 sin =,,. 6 Rješenje Ponovimo trigonometrijske funkcije dvostrukog kuta! Za argument vrijede sljedeće formule:

Διαβάστε περισσότερα

Matematička analiza 1 dodatni zadaci

Matematička analiza 1 dodatni zadaci Matematička analiza 1 dodatni zadaci 1. Ispitajte je li funkcija f() := 4 4 5 injekcija na intervalu I, te ako jest odredite joj sliku i inverz, ako je (a) I = [, 3), (b) I = [1, ], (c) I = ( 1, 0].. Neka

Διαβάστε περισσότερα

Riješeni zadaci: Limes funkcije. Neprekidnost

Riješeni zadaci: Limes funkcije. Neprekidnost Riješeni zadaci: Limes funkcije. Neprekidnost Limes funkcije Neka je 0 [a, b] i f : D R, gdje je D = [a, b] ili D = [a, b] \ { 0 }. Kažemo da je es funkcije f u točki 0 jednak L i pišemo f ) = L, ako za

Διαβάστε περισσότερα

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A. 3 Infimum i supremum Definicija. Neka je A R. Kažemo da je M R supremum skupa A ako je (i) M gornja meda skupa A, tj. a M a A. (ii) M najmanja gornja meda skupa A, tj. ( ε > 0)( a A) takav da je a > M

Διαβάστε περισσότερα

3.1 Granična vrednost funkcije u tački

3.1 Granična vrednost funkcije u tački 3 Granična vrednost i neprekidnost funkcija 2 3 Granična vrednost i neprekidnost funkcija 3. Granična vrednost funkcije u tački Neka je funkcija f(x) definisana u tačkama x za koje je 0 < x x 0 < r, ili

Διαβάστε περισσότερα

Sadrˇzaj. Sadrˇzaj 1. 4 UVJETNA VJEROJATNOST Ponovimo... 14

Sadrˇzaj. Sadrˇzaj 1. 4 UVJETNA VJEROJATNOST Ponovimo... 14 Sadrˇzaj Sadrˇzaj 1 4 UVJETNA VJEROJATNOST 3 4.1 Ponovimo................................. 14 1 Radni materijal 2 Poglavlje 4 UVJETNA VJEROJATNOST Thomas Bayes (1702 1762) uvodi pojam uvjetne vjerojatnosti:

Διαβάστε περισσότερα

ELEKTROTEHNIČKI ODJEL

ELEKTROTEHNIČKI ODJEL MATEMATIKA. Neka je S skup svih živućih državljana Republike Hrvatske..04., a f preslikavanje koje svakom elementu skupa S pridružuje njegov horoskopski znak (bez podznaka). a) Pokažite da je f funkcija,

Διαβάστε περισσότερα

7 Algebarske jednadžbe

7 Algebarske jednadžbe 7 Algebarske jednadžbe 7.1 Nultočke polinoma Skup svih polinoma nad skupom kompleksnih brojeva označavamo sa C[x]. Definicija. Nultočka polinoma f C[x] je svaki kompleksni broj α takav da je f(α) = 0.

Διαβάστε περισσότερα

numeričkih deskriptivnih mera.

numeričkih deskriptivnih mera. DESKRIPTIVNA STATISTIKA Numeričku seriju podataka opisujemo pomoću Numeričku seriju podataka opisujemo pomoću numeričkih deskriptivnih mera. Pokazatelji centralne tendencije Aritmetička sredina, Medijana,

Διαβάστε περισσότερα

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost M086 LA 1 M106 GRP Tema: CSB nejednakost. 19. 10. 2017. predavač: Rudolf Scitovski, Darija Marković asistent: Darija Brajković, Katarina Vincetić P 1 www.fizika.unios.hr/grpua/ 1 Baza vektorskog prostora.

Διαβάστε περισσότερα

Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika

Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika Teorem o uzastopnom prebrojavanju (TUP) Ako x 1 možemo birati na n 1 načina, ako x 2 možemo birati na n 2 načina,..... ako

Διαβάστε περισσότερα

Linearna algebra 2 prvi kolokvij,

Linearna algebra 2 prvi kolokvij, Linearna algebra 2 prvi kolokvij, 27.. 20.. Za koji cijeli broj t je funkcija f : R 4 R 4 R definirana s f(x, y) = x y (t + )x 2 y 2 + x y (t 2 + t)x 4 y 4, x = (x, x 2, x, x 4 ), y = (y, y 2, y, y 4 )

Διαβάστε περισσότερα

PISMENI ISPIT IZ STATISTIKE

PISMENI ISPIT IZ STATISTIKE 1. a) Trgovina odjeće prodaje odjeću u tri različite veličine: 32% veličine S, 44% veličine M i ostatak veličine L. Pokazalo se da je postotak odjeće s greškom redom 1%, 5% i 2%. Ako je trgovina ustanovila

Διαβάστε περισσότερα

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto Trigonometrija Adicijske formule Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto Razumijevanje postupka izrade složenijeg matematičkog problema iz osnova trigonometrije

Διαβάστε περισσότερα

1.4 Tangenta i normala

1.4 Tangenta i normala 28 1 DERIVACIJA 1.4 Tangenta i normala Ako funkcija f ima derivaciju u točki x 0, onda jednadžbe tangente i normale na graf funkcije f u točki (x 0 y 0 ) = (x 0 f(x 0 )) glase: t......... y y 0 = f (x

Διαβάστε περισσότερα

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D} Matematika 1 Funkcije radni nerecenzirani materijal za predavanja Definicija 1. Neka su D i K bilo koja dva neprazna skupa. Postupak f koji svakom elementu x D pridružuje točno jedan element y K zovemo funkcija

Διαβάστε περισσότερα

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016. Broj zadataka: 5 Vrijeme rješavanja: 0 min Ukupan broj bodova: 50 Zadatak.. kolokvij - 0. lipnja 0. (a Ako su X i Y diskretne slučajne varijable, dokažite da vrijedi formula E [X + Y ] = E [X] + E [Y ].

Διαβάστε περισσότερα

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI Sadrˇzaj Sadrˇzaj DVODIMENZIONALNI. DISKRETNI DVODIMENZIONALNI............................ KONTINUIRANI -dim tko želi znati više.............................. 5. KOVARIJANCA, KORELACIJA, PRAVCI REGRESIJE........

Διαβάστε περισσότερα

2. OSNOVNI POJMOVI TEORIJE VJEROJATNOSTI

2. OSNOVNI POJMOVI TEORIJE VJEROJATNOSTI 2. OSNOVNI POJMOVI TEORIJE VJEROJATNOSTI 2. ALGEBRA DOGAĐAJA 2.. Intuitivna definicija Slučajan pokus (eksperiment) jest takav pokus čiji ishodi nisu jednoznačno određeni skupom uvjeta pokusa. Sa Ω označavamo

Διαβάστε περισσότερα

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1 χ 2 test (Hi-kvadrat test) Jedan od prvih statističkih testova je χ 2 -test. Predložio ga je K. Pearson 900. godine, pa je poznat i pod nazivom Pearsonov test. χ 2 test je neparametarski test. Pomoću χ

Διαβάστε περισσότερα

TRIGONOMETRIJSKE FUNKCIJE I I.1.

TRIGONOMETRIJSKE FUNKCIJE I I.1. TRIGONOMETRIJSKE FUNKCIJE I I Odredi na brojevnoj trigonometrijskoj kružnici točku Et, za koju je sin t =,cost < 0 Za koje realne brojeve a postoji realan broj takav da je sin = a? Izračunaj: sin π tg

Διαβάστε περισσότερα

Linearna algebra 2 prvi kolokvij,

Linearna algebra 2 prvi kolokvij, 1 2 3 4 5 Σ jmbag smjer studija Linearna algebra 2 prvi kolokvij, 7. 11. 2012. 1. (10 bodova) Neka je dano preslikavanje s : R 2 R 2 R, s (x, y) = (Ax y), pri čemu je A: R 2 R 2 linearan operator oblika

Διαβάστε περισσότερα

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović Novi Sad April 17, 2018 1 / 22 Teorija grafova April 17, 2018 2 / 22 Definicija Graf je ure dena trojka G = (V, G, ψ), gde je (i) V konačan skup čvorova,

Διαβάστε περισσότερα

VJEROJATNOST popravni kolokvij veljače 2017.

VJEROJATNOST popravni kolokvij veljače 2017. Zadatak 1. (20 bodova) (a) (4 boda) Precizno definirajte pojam σ-algebre događaja na nepraznom skupu Ω. (b) (6 bodova) Neka je (Ω, F, P) vjerojatnosni prostor i A, B F događaji. Pomoću aksioma vjerojatnosti

Διαβάστε περισσότερα

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2. Sume kvadrata Koji se prirodni brojevi mogu prikazati kao zbroj kvadrata dva cijela broja? Propozicija 1. Ako su brojevi m i n sume dva kvadrata, onda je i njihov produkt m n takoder suma dva kvadrata.

Διαβάστε περισσότερα

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET Goran Stančić SIGNALI I SISTEMI Zbirka zadataka NIŠ, 014. Sadržaj 1 Konvolucija Literatura 11 Indeks pojmova 11 3 4 Sadržaj 1 Konvolucija Zadatak 1. Odrediti konvoluciju

Διαβάστε περισσότερα

Uvod u vjerojatnost i statistiku

Uvod u vjerojatnost i statistiku Vježbe 5. 1 Uvjetna vjerojatnost i nezavisnost dogadaja 2 Zadaci 3 Formula potpune vjerojatnosti 4 Bayesova formula 5 Zadaci Monty Hall problem - Koze i auto I Pretpostavite da igrate igru u kojoj birate

Διαβάστε περισσότερα

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka. Neka je a 3 x 3 + a x + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka. 1 Normiranje jednadžbe. Jednadžbu podijelimo s a 3 i dobivamo x 3 +

Διαβάστε περισσότερα

18. listopada listopada / 13

18. listopada listopada / 13 18. listopada 2016. 18. listopada 2016. 1 / 13 Neprekidne funkcije Važnu klasu funkcija tvore neprekidne funkcije. To su funkcije f kod kojih mala promjena u nezavisnoj varijabli x uzrokuje malu promjenu

Διαβάστε περισσότερα

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011. Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika Monotonost i ekstremi Katica Jurasić Rijeka, 2011. Ishodi učenja - predavanja Na kraju ovog predavanja moći ćete:,

Διαβάστε περισσότερα

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti). PRAVA Prava je kao i ravan osnovni geometrijski ojam i ne definiše se. Prava je u rostoru određena jednom svojom tačkom i vektorom aralelnim sa tom ravom ( vektor aralelnosti). M ( x, y, z ) 3 Posmatrajmo

Διαβάστε περισσότερα

Funkcije dviju varjabli (zadaci za vježbu)

Funkcije dviju varjabli (zadaci za vježbu) Funkcije dviju varjabli (zadaci za vježbu) Vidosava Šimić 22. prosinca 2009. Domena funkcije dvije varijable Ako je zadano pridruživanje (x, y) z = f(x, y), onda se skup D = {(x, y) ; f(x, y) R} R 2 naziva

Διαβάστε περισσότερα

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k. 1 3 Skupovi brojeva 3.1 Skup prirodnih brojeva - N N = {1, 2, 3,...} Aksiom matematičke indukcije Neka je N skup prirodnih brojeva i M podskup od N. Ako za M vrijede svojstva: 1) 1 M 2) n M (n + 1) M,

Διαβάστε περισσότερα

Operacije s matricama

Operacije s matricama Linearna algebra I Operacije s matricama Korolar 3.1.5. Množenje matrica u vektorskom prostoru M n (F) ima sljedeća svojstva: (1) A(B + C) = AB + AC, A, B, C M n (F); (2) (A + B)C = AC + BC, A, B, C M

Διαβάστε περισσότερα

RIJEŠENI ZADACI I TEORIJA IZ

RIJEŠENI ZADACI I TEORIJA IZ RIJEŠENI ZADACI I TEORIJA IZ LOGARITAMSKA FUNKCIJA SVOJSTVA LOGARITAMSKE FUNKCIJE OSNOVE TRIGONOMETRIJE PRAVOKUTNOG TROKUTA - DEFINICIJA TRIGONOMETRIJSKIH FUNKCIJA - VRIJEDNOSTI TRIGONOMETRIJSKIH FUNKCIJA

Διαβάστε περισσότερα

VJEROJATNOST 1. kolokvij studenog 2013.

VJEROJATNOST 1. kolokvij studenog 2013. Zadatak 1 (10 bodova (a (5 bodova Iskažite i dokažite teorem o strukturi vjerojatnosti na partitivnom skupu prebrojivog skupa. Zašto u slučaju prebrojivog skupa možemo promatrati samo vjerojatnosti definirane

Διαβάστε περισσότερα

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju RAČUN OSTATAKA 1 1 Prsten celih brojeva Z := N + {} N + = {, 3, 2, 1,, 1, 2, 3,...} Osnovni primer. (Z, +,,,, 1) je komutativan prsten sa jedinicom: sabiranje (S1) asocijativnost x + (y + z) = (x + y)

Διαβάστε περισσότερα

Diskretan slučajni vektor

Diskretan slučajni vektor Sveučilište J J Strossmayera u Osijeku Odjel za matematiku Sveučilišni preddiplomski studij matematike Mia Ćurić Diskretan slučajni vektor Završni rad Osijek, 206 Sveučilište J J Strossmayera u Osijeku

Διαβάστε περισσότερα

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA Fakultet za menadžment u turizmu i ugotiteljtvu, Opatija Sveučilišni preddiplomki tudij Polovna ekonomija u turizmu i ugotiteljtvu Noitelj kolegija: Prof. dr. c. Suzana Marković Aitentica: Jelena Komšić

Διαβάστε περισσότερα

Uvod u vjerojatnost i matematičku statistiku

Uvod u vjerojatnost i matematičku statistiku Uvod u vjerojatnost i matematičku statistiku - vježbe - Danijel Krizmanić 28. rujna 2007. Sadržaj Osnove vjerojatnosti 2 2 Kombinatorika i vjerojatnost 5 3 Uvjetna vjerojatnost. Nezavisnost 9 4 Geometrijske

Διαβάστε περισσότερα

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je, PARCIJALNI IZVODI I DIFERENCIJALI Sama definicija parcijalnog ivoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je, naravno, naučiti onako kako vaš profesor ahteva. Mi ćemo probati

Διαβάστε περισσότερα

Determinante. a11 a. a 21 a 22. Definicija 1. (Determinanta prvog reda) Determinanta matrice A = [a] je broj a.

Determinante. a11 a. a 21 a 22. Definicija 1. (Determinanta prvog reda) Determinanta matrice A = [a] je broj a. Determinante Determinanta A deta je funkcija definirana na skupu svih kvadratnih matrica, a poprima vrijednosti iz skupa skalara Osim oznake deta za determinantu kvadratne matrice a 11 a 12 a 1n a 21 a

Διαβάστε περισσότερα

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1 Strukture podataka i algoritmi 1. kolokvij Na kolokviju je dozvoljeno koristiti samo pribor za pisanje i službeni šalabahter. Predajete samo papire koje ste dobili. Rezultati i uvid u kolokvije: ponedjeljak,

Διαβάστε περισσότερα

Numerička matematika 2. kolokvij (1. srpnja 2009.)

Numerička matematika 2. kolokvij (1. srpnja 2009.) Numerička matematika 2. kolokvij (1. srpnja 29.) Zadatak 1 (1 bodova.) Teorijsko pitanje. (A) Neka je G R m n, uz m n, pravokutna matrica koja ima puni rang po stupcima, tj. rang(g) = n. (a) Napišite puni

Διαβάστε περισσότερα

Slučajni procesi Prvi kolokvij travnja 2015.

Slučajni procesi Prvi kolokvij travnja 2015. Zadatak Prvi kolokvij - 20. travnja 205. (a) (3 boda) Neka je (Ω,F,P) vjerojatnosni prostor, neka je G σ-podalgebra od F te neka je X slučajna varijabla na (Ω,F,P) takva da je X 0 g.s. s konačnim očekivanjem.

Διαβάστε περισσότερα

Riješeni zadaci: Nizovi realnih brojeva

Riješeni zadaci: Nizovi realnih brojeva Riješei zadaci: Nizovi realih brojeva Nizovi, aritmetički iz, geometrijski iz Fukciju a : N R azivamo beskoači) iz realih brojeva i ozačavamo s a 1, a,..., a,... ili a ), pri čemu je a = a). Aritmetički

Διαβάστε περισσότερα

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012 Iskazna logika 3 Matematička logika u računarstvu Department of Mathematics and Informatics, Faculty of Science,, Serbia novembar 2012 Deduktivni sistemi 1 Definicija Deduktivni sistem (ili formalna teorija)

Διαβάστε περισσότερα

IZVODI ZADACI (I deo)

IZVODI ZADACI (I deo) IZVODI ZADACI (I deo) Najpre da se podsetimo tablice i osnovnih pravila:. C`=0. `=. ( )`= 4. ( n )`=n n-. (a )`=a lna 6. (e )`=e 7. (log a )`= 8. (ln)`= ` ln a (>0) 9. = ( 0) 0. `= (>0) (ovde je >0 i a

Διαβάστε περισσότερα

Skup svih mogućih ishoda datog opita, odnosno skup svih elementarnih događaja se najčešće obeležava sa E. = {,,,... }

Skup svih mogućih ishoda datog opita, odnosno skup svih elementarnih događaja se najčešće obeležava sa E. = {,,,... } VEROVTNOĆ - ZDI (I DEO) U računu verovatnoće osnovni pojmovi su opit i događaj. Svaki opit se završava nekim ishodom koji se naziva elementarni događaj. Elementarne događaje profesori različito obeležavaju,

Διαβάστε περισσότερα

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo IZVODI ZADACI ( IV deo) LOGARITAMSKI IZVOD Logariamskim izvodom funkcije f(), gde je >0 i, nazivamo izvod logarima e funkcije, o jes: (ln ) f ( ) f ( ) Primer. Nadji izvod funkcije Najpre ćemo logarimovai

Διαβάστε περισσότερα

5. Karakteristične funkcije

5. Karakteristične funkcije 5. Karakteristične funkcije Profesor Milan Merkle emerkle@etf.rs milanmerkle.etf.rs Verovatnoća i Statistika-proleće 2018 Milan Merkle Karakteristične funkcije ETF Beograd 1 / 10 Definicija Karakteristična

Διαβάστε περισσότερα

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama. Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama. a b Verovatno a da sluqajna promenljiva X uzima vrednost iz intervala

Διαβάστε περισσότερα

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1; 1. Provjerite da funkcija f definirana na segmentu [a, b] zadovoljava uvjete Rolleova poučka, pa odredite barem jedan c a, b takav da je f '(c) = 0 ako je: a) f () = 1, a = 1, b = 1; b) f () = 4, a =,

Διαβάστε περισσότερα

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu 16. UVOD U STATISTIKU Statistika je nauka o sakupljanju i analizi sakupljenih podatka u cilju donosenja zakljucaka o mogucem toku ili obliku neizvjesnosti koja se obradjuje. Frekventna distribucija - je

Διαβάστε περισσότερα

( , 2. kolokvij)

( , 2. kolokvij) A MATEMATIKA (0..20., 2. kolokvij). Zadana je funkcija y = cos 3 () 2e 2. (a) Odredite dy. (b) Koliki je nagib grafa te funkcije za = 0. (a) zadanu implicitno s 3 + 2 y = sin y, (b) zadanu parametarski

Διαβάστε περισσότερα

16 Lokalni ekstremi. Definicija 16.1 Neka je A R n otvoren, f : A R i c A. Ako postoji okolina U(c) od c na kojoj je f(c) minimum

16 Lokalni ekstremi. Definicija 16.1 Neka je A R n otvoren, f : A R i c A. Ako postoji okolina U(c) od c na kojoj je f(c) minimum 16 Lokalni ekstremi Važna primjena Taylorovog teorema odnosi se na analizu lokalnih ekstrema (minimuma odnosno maksimuma) relanih funkcija (više varijabli). Za n = 1 i f : a,b R ako funkcija ima lokalni

Διαβάστε περισσότερα

Matematika 1 - vježbe. 11. prosinca 2015.

Matematika 1 - vježbe. 11. prosinca 2015. Matematika - vježbe. prosinca 5. Stupnjevi i radijani Ako je kut φ jednak i rad, tada je veza između i 6 = Zadatak.. Izrazite u stupnjevima: a) 5 b) 7 9 c). d) 7. a) 5 9 b) 7 6 6 = = 5 c). 6 8.5 d) 7.

Διαβάστε περισσότερα

Teorijske osnove informatike 1

Teorijske osnove informatike 1 Teorijske osnove informatike 1 9. oktobar 2014. () Teorijske osnove informatike 1 9. oktobar 2014. 1 / 17 Funkcije Veze me du skupovima uspostavljamo skupovima koje nazivamo funkcijama. Neformalno, funkcija

Διαβάστε περισσότερα

( x) ( ) ( ) ( x) ( ) ( x) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

( x) ( ) ( ) ( x) ( ) ( x) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) Zadatak 08 (Vedrana, maturantica) Je li unkcija () = cos (sin ) sin (cos ) parna ili neparna? Rješenje 08 Funkciju = () deiniranu u simetričnom području a a nazivamo: parnom, ako je ( ) = () neparnom,

Διαβάστε περισσότερα

9. GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE

9. GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE Geodetski akultet, dr sc J Beban-Brkić Predavanja iz Matematike 9 GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE Granična vrijednost unkcije kad + = = Primjer:, D( )

Διαβάστε περισσότερα

Jednodimenzionalne slučajne promenljive

Jednodimenzionalne slučajne promenljive Jednodimenzionalne slučajne promenljive Definicija slučajne promenljive Neka je X f-ja def. na prostoru verovatnoća (Ω, F, P) koja preslikava prostor el. ishoda Ω u skup R realnih brojeva: (1)Skup {ω/

Διαβάστε περισσότερα

Slučajni vektor. Poglavlje 3

Slučajni vektor. Poglavlje 3 Poglavlje 3 Slučajni vektor Ukoliko u jednom istraživanju za dani slučajni pokus pratimo nekoliko različitih slučajnih varijabli, moguće veze među njima nećemo dokučiti ako ih proučavamo samo svaku za

Διαβάστε περισσότερα

41. Jednačine koje se svode na kvadratne

41. Jednačine koje se svode na kvadratne . Jednačine koje se svode na kvadrane Simerične recipročne) jednačine Jednačine oblika a n b n c n... c b a nazivamo simerične jednačine, zbog simeričnosi koeficijenaa koeficijeni uz jednaki). k i n k

Διαβάστε περισσότερα

( ) ( ) 2 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET. Zadaci za pripremu polaganja kvalifikacionog ispita iz Matematike. 1. Riješiti jednačine: 4

( ) ( ) 2 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET. Zadaci za pripremu polaganja kvalifikacionog ispita iz Matematike. 1. Riješiti jednačine: 4 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET Riješiti jednačine: a) 5 = b) ( ) 3 = c) + 3+ = 7 log3 č) = 8 + 5 ć) sin cos = d) 5cos 6cos + 3 = dž) = đ) + = 3 e) 6 log + log + log = 7 f) ( ) ( ) g) ( ) log

Διαβάστε περισσότερα

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova) MEHANIKA 1 1. KOLOKVIJ 04/2008. grupa I 1. Zadane su dvije sile F i. Sila F = 4i + 6j [ N]. Sila je zadana s veličinom = i leži na pravcu koji s koordinatnom osi x zatvara kut od 30 (sve komponente sile

Διαβάστε περισσότερα

Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu

Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu Osječki matematički list 000), 5 9 5 Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu Šefket Arslanagić Alija Muminagić Sažetak. U radu se navodi nekoliko različitih dokaza jedne poznate

Διαβάστε περισσότερα

Statistika i osnovna mjerenja

Statistika i osnovna mjerenja Statistika i osnovna mjerenja Teorija vjerojatnosti M. Makek 2016/2017 Uvod Pokus bilo koji postupak ili proces koji rezultira opažanjem Ishod moguć rezultat pokusa (različiti ishodi se međusobno isključuju)

Διαβάστε περισσότερα

VJEŽBE 3 BIPOLARNI TRANZISTORI. Slika 1. Postoje npn i pnp bipolarni tranziostori i njihovi simboli su dati na slici 2 i to npn lijevo i pnp desno.

VJEŽBE 3 BIPOLARNI TRANZISTORI. Slika 1. Postoje npn i pnp bipolarni tranziostori i njihovi simboli su dati na slici 2 i to npn lijevo i pnp desno. JŽ 3 POLAN TANZSTO ipolarni tranzistor se sastoji od dva pn spoja kod kojih je jedna oblast zajednička za oba i naziva se baza, slika 1 Slika 1 ipolarni tranzistor ima 3 izvoda: emitor (), kolektor (K)

Διαβάστε περισσότερα

UVOD DEFINICIJA: Statistika planiranje i provođenje pokusa skupljanje podataka interpretacija

UVOD DEFINICIJA: Statistika planiranje i provođenje pokusa skupljanje podataka interpretacija OSNOVE STATISTIKE UVOD DEFINICIJA: Statistika je grana matematike koja obuhvaća sakupljanje, analizu, interpretaciju i prezentaciju podataka te izradu predviđanja koja se temelje na tim podacima. Smatra

Διαβάστε περισσότερα

Linearna algebra I, zimski semestar 2007/2008

Linearna algebra I, zimski semestar 2007/2008 Linearna algebra I, zimski semestar 2007/2008 Predavanja: Nenad Bakić, Vježbe: Luka Grubišić i Maja Starčević 22. listopada 2007. 1 Prostor radijvektora i sustavi linearni jednadžbi Neka je E 3 trodimenzionalni

Διαβάστε περισσότερα

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos . KOLOKVIJ PRIMIJENJENA MATEMATIKA FOURIEROVE TRANSFORMACIJE 1. Za periodičnu funkciju f(x) s periodom p=l Fourierov red je gdje su a,a n, b n Fourierovi koeficijenti od f(x) gdje su a =, a n =, b n =..

Διαβάστε περισσότερα

Elementi spektralne teorije matrica

Elementi spektralne teorije matrica Elementi spektralne teorije matrica Neka je X konačno dimenzionalan vektorski prostor nad poljem K i neka je A : X X linearni operator. Definicija. Skalar λ K i nenula vektor u X se nazivaju sopstvena

Διαβάστε περισσότερα

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke. Ĉetverokut - DOMAĆA ZADAĆA Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke. 1. Duljine dijagonala paralelograma jednake su 6,4 cm i 11 cm, a duljina jedne njegove

Διαβάστε περισσότερα

Uvod u teoriju brojeva

Uvod u teoriju brojeva Uvod u teoriju brojeva 2. Kongruencije Borka Jadrijević Borka Jadrijević () UTB 2 1 / 25 2. Kongruencije Kongruencija - izjava o djeljivosti; Teoriju kongruencija uveo je C. F. Gauss 1801. De nicija (2.1)

Διαβάστε περισσότερα

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000,

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000, PRERAČUNAVANJE MJERNIH JEDINICA PRIMJERI, OSNOVNE PRETVORBE, POTENCIJE I ZNANSTVENI ZAPIS, PREFIKSKI, ZADACI S RJEŠENJIMA Primjeri: 1. 2.5 m = mm Pretvaramo iz veće u manju mjernu jedinicu. 1 m ima dm,

Διαβάστε περισσότερα

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z.

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z. Pismeni ispit iz matematike 06 007 Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj z = + i, zatim naći z Ispitati funkciju i nacrtati grafik : = ( ) y e + 6 Izračunati integral:

Διαβάστε περισσότερα

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1. Pismeni ispit iz matematike 0 008 GRUPA A Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: λ + z = Ispitati funkciju i nacrtati njen grafik: + ( λ ) + z = e Izračunati

Διαβάστε περισσότερα

6 Polinomi Funkcija p : R R zadana formulom

6 Polinomi Funkcija p : R R zadana formulom 6 Polinomi Funkcija p : R R zadana formulom p(x) = a n x n + a n 1 x n 1 +... + a 1 x + a 0, gdje su a 0, a 1,..., a n realni brojevi, a n 0, i n prirodan broj ili 0, naziva se polinom n-tog stupnja s

Διαβάστε περισσότερα

( ) ( ) Zadatak 001 (Ines, hotelijerska škola) Ako je tg x = 4, izračunaj

( ) ( ) Zadatak 001 (Ines, hotelijerska škola) Ako je tg x = 4, izračunaj Zadaak (Ines, hoelijerska škola) Ako je g, izračunaj + 5 + Rješenje Korisimo osnovnu rigonomerijsku relaciju: + Znači svaki broj n možemo zapisai n n n ( + ) + + + + 5 + 5 5 + + + + + 7 + Zadano je g Tangens

Διαβάστε περισσότερα

SISTEMI NELINEARNIH JEDNAČINA

SISTEMI NELINEARNIH JEDNAČINA SISTEMI NELINEARNIH JEDNAČINA April, 2013 Razni zapisi sistema Skalarni oblik: Vektorski oblik: F = f 1 f n f 1 (x 1,, x n ) = 0 f n (x 1,, x n ) = 0, x = (1) F(x) = 0, (2) x 1 0, 0 = x n 0 Definicije

Διαβάστε περισσότερα

PRIMJER 3. MATLAB filtdemo

PRIMJER 3. MATLAB filtdemo PRIMJER 3. MATLAB filtdemo Prijenosna funkcija (IIR) Hz () =, 6 +, 3 z +, 78 z +, 3 z +, 53 z +, 3 z +, 78 z +, 3 z +, 6 z, 95 z +, 74 z +, z +, 9 z +, 4 z +, 5 z +, 3 z +, 4 z 3 4 5 6 7 8 3 4 5 6 7 8

Διαβάστε περισσότερα

MATEMATIKA Pokažite da za konjugiranje (a + bi = a bi) vrijedi. a) z=z b) z 1 z 2 = z 1 z 2 c) z 1 ± z 2 = z 1 ± z 2 d) z z= z 2

MATEMATIKA Pokažite da za konjugiranje (a + bi = a bi) vrijedi. a) z=z b) z 1 z 2 = z 1 z 2 c) z 1 ± z 2 = z 1 ± z 2 d) z z= z 2 (kompleksna analiza, vježbe ). Izračunajte a) (+i) ( i)= b) (i+) = c) i + i 4 = d) i+i + i 3 + i 4 = e) (a+bi)(a bi)= f) (+i)(i )= Skicirajte rješenja u kompleksnoj ravnini.. Pokažite da za konjugiranje

Διαβάστε περισσότερα

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo:

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo: 2 Skupovi Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo: A B def ( x)(x A x B) Kažemo da su skupovi A i

Διαβάστε περισσότερα

Dijagonalizacija operatora

Dijagonalizacija operatora Dijagonalizacija operatora Problem: Može li se odrediti baza u kojoj zadani operator ima dijagonalnu matricu? Ova problem je povezan sa sljedećim pojmovima: 1 Karakteristični polinom operatora f 2 Vlastite

Διαβάστε περισσότερα

TRIGONOMETRIJA TROKUTA

TRIGONOMETRIJA TROKUTA TRIGONOMETRIJA TROKUTA Standardne oznake u trokutuu ABC: a, b, c stranice trokuta α, β, γ kutovi trokuta t,t,t v,v,v s α,s β,s γ R r s težišnice trokuta visine trokuta simetrale kutova polumjer opisane

Διαβάστε περισσότερα

U teoriji vjerojatnosti razmatraju se događaji koji se mogu, ali ne moraju dogoditi. Takvi se događaji zovu slučajnim događajima.

U teoriji vjerojatnosti razmatraju se događaji koji se mogu, ali ne moraju dogoditi. Takvi se događaji zovu slučajnim događajima. Sažetak vjerojatnost Skup ishoda U teoriji vjerojatnosti razmatraju se događaji koji se mogu, ali ne moraju dogoditi. Takvi se događaji zovu slučajnim događajima. Jednostavne događaje u nekom pokusu zvat

Διαβάστε περισσότερα

4. poglavlje (korigirano) LIMESI FUNKCIJA

4. poglavlje (korigirano) LIMESI FUNKCIJA . Limesi funkcija (sa svim korekcijama) 69. poglavlje (korigirano) LIMESI FUNKCIJA U ovom poglavlju: Neodređeni oblik Neodređeni oblik Neodređeni oblik Kose asimptote Neka je a konačan realan broj ili

Διαβάστε περισσότερα

Vjerojatnost i statistika

Vjerojatnost i statistika Vjerojatnost i statistika vježbe 015/016. 1. siječnja 016. Sadržaj Sadržaj 1 Kombinatorika 4 1.1 Permutacije............................ 4 1. Permutacije s ponavljanjem................... 5 1.3 Varijacije.............................

Διαβάστε περισσότερα

POVRŠINA TANGENCIJALNO-TETIVNOG ČETVEROKUTA

POVRŠINA TANGENCIJALNO-TETIVNOG ČETVEROKUTA POVRŠIN TNGENIJLNO-TETIVNOG ČETVEROKUT MLEN HLP, JELOVR U mnoštvu mnogokuta zanimljiva je formula za površinu četverokuta kojemu se istoobno može upisati i opisati kružnica: gje su a, b, c, uljine stranica

Διαβάστε περισσότερα

MJERA I INTEGRAL 2. kolokvij 30. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!)

MJERA I INTEGRAL 2. kolokvij 30. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!) JMBAG IM I PZIM BOJ BODOVA MJA I INTGAL 2. kolokvij 30. lipnja 2017. (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!) 1. (ukupno 6 bodova) Neka je (, F, µ) prostor mjere i neka je (

Διαβάστε περισσότερα