Slučajne varijable Statistički podaci su distribuirani po odredenoj zakonitosti. Za matematičko (apstraktno) opisivanje te zakonitosti potrebno je definirati slučajnu varijablu kojoj pripada odredena razdioba (distribucija) vjerojatnosti. Slučajna varijabla je funkcija koja svakom ishodu slučajnog pokusa pridružuje neki realni broj. Razlikujemo diskretne slučajne varijable i kontinuirane slučajne varijable. Ako je pokus takav da slucajna varijabla poprima vrijednosti iz diskretnog skupa (te vrijednosti su uglavnom rezultat nekog prebrojavanja), onda govorimo o diskretnoj slučajnoj varijabli. Ako je pokus takav da slučajna varijabla poprima vrijednosti iz kontinuiranog skupa (vrijednosti slučajne varijable su uglavnom rezultat nekog mjerenja) onda govorimo o kontinuiranoj slučajnoj varijabli, jer se vrijednosti mjerenja prikazuju intervalima. Diskretna slučajna varijabla se zadaje vrijednostima koje su pridružene ishodima pokusa i vjerojatnostima da slučajna varijabla poprimi te vrijednosti. Kontinuirana slučajna varijabla se zadaje intervalima i vjerojatnostima da slučajna varijabla poprimi vrijednosti unutar pojedinog intervala (vjerojatnost da kontinuirana slučajna varijabla poprimi pojedinu vrijednost je nula). Diskretna slučajna varijabla Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa R(X) = {, 2, 3,, n, } s vjerojatnostima tako da je p( ), p( 2 ),, p( n ), p( ) + p( 2 ) + + p( n ) + =. Dakle, diskretna slučajna varijabla Xje zadana skupom uredenih parova {( i, p( i )), i =, 2, }
kojeg nazivamo razdiobom (distribucijom) vjerojatnosti diskretne slučajne varijable X. Funkciju p : R(X) [0, ], i p( i ), nazivamo zakonom vjerojatnosti. Razdiobu obično zazapisujemo u obliku ( ) X : 2 n. p( ) p( 2 ) p( n ) Funkciju F : R [0, ] F () = P {X } = i p( i ) nazivamo funkcijom razdiobe diskretne slučajne varijable X. Vrijedi lim F () = 0; lim F () = ; + < 2 = F ( ) F ( 2 ).. Numeričke karakteristike diskretne slučajne varijable Kada smo promatrali diskretna statistička obilježja, za niz statističkih podataka, 2, n, u kojem se vrijednosti a j pojavljuju f j puta, j =, 2,, k, računali smo aritmetičku sredinu formulom i varijancu formulom s 2 0 = n = n a j f j = j= (a. j ) 2 f j = j= j= a j f j n = a j r j j= (a j ) 2 r j = j= a 2 jr j 2. j= Sada, za diskretnu slučajnu varijablu zadanu s ( ) X : 2 n p p 2 p n definiramo matematičko očekivanje s µ = E [X] = i p i i= 2
i varijancu ili disperziju s V [X] = ( i E [X]) 2 p i = i= 2 i p i E [X] 2. i= Standardna devijacija ili standardno odstupanje je dano s = V [X]..2 Binomna razdioba Promatramo niz od n pokusa. U svakom pokusu se može pojaviti dogadaj A, s vjerojatnošću pojavljivanja p, ili se može pojaviti A, s vjerojatnošću q = p. Pretpostavljamo da se pokusi ponavljaju pod idealno jednakim uvjetima, pa je vjerojatnost da se dogodi A stalna i jednaka p. Dogadaj A nazivamo Bernoullijevim dogadajem. Rezultati ovih n pokusa mogu se predočiti nizovima kao što je A, A, A, A, A, A }{{} n Neka je diskretna slučajna varijabla X broj pojavljivanja dogadaja A u nizu od n pokusa. Sada je R(X) = {0,, 2,, n}. Vjerojatnost da se A pojavi puta u seriji od n pokusa je p() = p q n. Ovim izrazom je definiran zakon vjerojatnosti slučajne varijable. Budući da, po binomnom teoremu, vrijedi p() = =0 =0 p q n = (p + q) n =, slučajna varijabla X je dobro definirana i ima binomnu razdiobu. odredena parametrima n i p. Pišemo Ona je potpuno X : B(n, p). Specijalno vrijedi:. vjerojatnost da se A neće pojaviti ni jednom u n ponavljanja je p(0) = p 0 q n 0 = q n ; 0 3
2. vjerojatnost da se A pojavi n puta je p(n) = p n q n n = p n ; n 3. vjerojatnost da se A pojavi barem jednom je = Može se pokazati da vrijedi i rekurzivna formula p q n = p(0) = q n. p() = n + p q p( ), =, 2,, p(0) = qn, i da je matematičko očekivanje za X : B(n, p) a varijanca E [X] = p() = =0 p q n = np, =0 V [X] = npq..3 Poissonova razdioba Ova distribucija, slično kao i binomna, može se primijeniti kod slučajne varijable koja broji uspjehe. Medutim, ne pri nezavisnom ponavljanju pokusa nego u jediničnom vremenskom intervalu ili intervalu volumena, mase, itd. ako pokus zadovoljava sljedeće uvjete: vjerojatnost da se pojavi uspjeh ne ovisi o tome u kojem će se jediničnom intervalu dogoditi, broj uspjeha u jednom intervalu neovisan je o broju uspjeha u nekom drugom intervalu, očekivani broja uspjeha je isti za sve jedinične intervale i dan je pozitivnim realnim brojem m. Slučajna varijabla X ima Poissonovu razdiobu s parametrom m > 0, ako poprima vrijednosti iz skupa R(X) = {0,, 2, } s vjerojatnostima Tada pišemo X : P m. p() = P {X = } = m! e m. Može se pokazati da je matematičko očekivanje varijable X E [X] = p() = =0 4 =0 m! e m = m,
i varijanca V [X] = m. Kao i kod binomne razdiobe, za Poissonovu razdiobu vrijedi rekurzivna relacija p() = m p( ), =, 2, 3,, p(0) = e m..4 Aproksimacija binomne razdiobe Poissonovom Ako je X : B(n, p) i n > 50, p < 0. i np < 5, binomnu razdiobu smijemo aproksimirati Poissonovom, tj. B(n, p) P np, tj. možemo uzeti da je X : P np. 2 Kontinuirana slučajna varijabla Kontinuirana slučajna varijabla X može poprimiti svaku vrijednost iz skupa R ili nekog njegovog podintervala. Kod diskretne slučajne varijable vjerojatnost smo pridruživali točkama, dok kod kontinuirane slučajne varijable vjerojatnost pridružujemo intervalima. Neka je područje mogućih vrijednosti kontinuirane slučajne varijable X cijeli skup R. Funkcija gustoće vjerojatnosti f : R R varijable X je funkcija sa svojstvima:. f() 0, R (graf funkcije f je iznad osi ); 2. 3. 2 f()d = (površina izmedu grafa funkcije f i osi je ); f()d = P { < X < 2 } (vjerojatnost da X poprimi vrijedosti unutar intervala, 2 je jednaka površini ispod grafa funkcije f iznad intervala, 2 ). Funkcija razdiobe vjerojatnosti kontinuirane slučajne varijable X, F : R [0, ], dana je s Očigledno vrijedi F () = f()d. P {X < 2 } = F ( 2 ), P { < X} = F ( ), P { < X < 2 } = F ( 2 ) F ( ). 5
Matematičko očekivanje kontinuirane slučajne varijable X je µ = E [X] = f() d. Varinjanca ili disperzija je V [X] = ( E [X]) 2 f() d, a devijacija je = V [X]. 2. Normalna ili Gaussova razdioba Ako je područje vrijednosti kontinuirane slučajne varijable X cijeli skup R, a funkcija gustoće vjerojatnosti je dana s f() = 2π e ) 2, m, R, > 0, kažemo da X ima normalnu ili Gaussovu razdiobu. Normalna razdioba je potpuno odredena parametrima m i. Pišemo X : N ( m, 2). Vrijedi µ = E [X] = m, V [X] = 2. Graf funkcije f simetričan je s obzirom na pravac = m, a o ovisi spljoštenje. Dakle, za X : N ( m, 2) imamo P { < X < 2 } = 2 2π e ) 2 d; 6
P {X < 2 } = 2 2π e ) 2 d; P { < X} = 2π e ) 2 d. Ovi integrali nisu elementarno rješivi (to su primjeri neelementarnih integrala). Rješavamo ih tako da ih supstitucijom m Φ(u) = 2π u 0 = u svodimo na integral oblika e 2 u2 du, u > 0, kojeg nazivamo Gaussov integral, a za kojeg su vrijednosti za neke granice izračunate numeričkim metodama i dane u posebnim tablicama. Ako je X : N (0, ), kažemo da kontinuireana slučajna varijabla X ima jediničnu normalnu razdiobu. Tada je f() = e 2 u2. 2π Uočimo, ako je X : N (0, ), onda je P {X < 0} = 0.5 = P {0 < X}. Izrazimo vjerojatnosti za sve moguće kombinacije intervala preko Gaussovog integrala:. P { < X < 2 } = = u 2 2π 2 2π e ) 2 d = e 2 u2 du = {U : N (0, )} = P {u < U < u 2 } = u = m d = du 2 u u = m u 2 = 2 m = u a) 0 u u 2 = = Φ(u 2 ) Φ(u ); b) u 0 u 2 = = Φ(u 2 ) + Φ( u ); c) u u 2 0 = = Φ( u ) Φ( u 2 ). u = m 2. P { < X} = 2π e ) 2 d = du d = u u = m = = e 2 u2 du = {U : N (0, )} = P {u < U} = 2π u a) 0 u = = 0.5 Φ(u ); 7
b) u 0 = = 0.5 + Φ( u ). 3. P {X < 2 } = = u 2 2π 2 2π e u = m ) 2 d = d = du 2 u u 2 = 2 m e 2 u2 du = {U : N (0, )} = P {U < u 2 } = a) 0 u 2 = = 0.5 + Φ(u 2 ); b) u 2 0 = = 0.5 Φ( u 2 ). = 2.2 Aproksimacija binomne razdiobe normalnom Neka je X : B(n, p). Ako je n jako velik i ako je p 0.5, te ako vrijedi n + < p < npq > 9, n n + onda se binomna razdioba B(n, p) može aproksimirati normalnom razdiobom N ( m, 2), gdje je m = np i 2 = npq, tj. Tada je p() = B(n, p) N ( m, 2). p q n P N { 0.5 < X < + 0.5}; P B { X 2 } P N { 0.5 < X < 2 + 0.5}; P B { X} P N { 0.5 < X}; P B {X 2 } P N {X < 2 + 0.5}. i 8