Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika

Σχετικά έγγραφα
2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

3 Populacija i uzorak

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Slučajne varijable Materijali za nastavu iz Statistike

Sadrˇzaj. Sadrˇzaj 1. 4 UVJETNA VJEROJATNOST Ponovimo... 14

Operacije s matricama

2. OSNOVNI POJMOVI TEORIJE VJEROJATNOSTI

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

7 Algebarske jednadžbe

numeričkih deskriptivnih mera.

ELEKTROTEHNIČKI ODJEL

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

Matematička analiza 1 dodatni zadaci

Uvod u vjerojatnost i statistiku

3.1 Granična vrednost funkcije u tački

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

5. Karakteristične funkcije

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

18. listopada listopada / 13

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

(BIO)STATISTIKA. skripta. studij: Prehrambena tehnologija i Biotehnologija. doc. dr. sc. Iva Franjić 2012.

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Diskretan slučajni vektor

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

Slučajna varijabla i vjerojatnost.

Skup svih mogućih ishoda datog opita, odnosno skup svih elementarnih događaja se najčešće obeležava sa E. = {,,,... }

VJEROJATNOST popravni kolokvij veljače 2017.

Linearna algebra 2 prvi kolokvij,

Uvod u vjerojatnost i matematičku statistiku

Slučajni vektor. Poglavlje 3

6 Polinomi Funkcija p : R R zadana formulom

Elementi spektralne teorije matrica

radni nerecenzirani materijal za predavanja

Teorijske osnove informatike 1

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

Vjerojatnost i statistika

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo:

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

Riješeni zadaci: Limes funkcije. Neprekidnost

RIJEŠENI ZADACI I TEORIJA IZ

Vjerojatnost i statistika

Linearna algebra 2 prvi kolokvij,

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

1 Promjena baze vektora

Statistika i osnovna mjerenja

Uvod u teoriju brojeva

Jednodimenzionalne slučajne promenljive

Slučajni procesi Prvi kolokvij travnja 2015.

Vjerojatnost - 1. dio. Uvod u vjerojatnost. 1. Kolika je vjerojatnost da se pri bacanju dviju kocki pojavi: a) zbroj 8 b) barem jedna četvorka?

Dijagonalizacija operatora

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

PISMENI ISPIT IZ STATISTIKE

(BIO)STATISTIKA. seminari. smjer: Prehrambena tehnologija i Biotehnologija. pripremila: dr.sc. Iva Franjić

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

Funkcije dviju varjabli (zadaci za vježbu)

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

TRIGONOMETRIJSKE FUNKCIJE I I.1.

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

PRIMJER 3. MATLAB filtdemo

Riješeni zadaci: Nizovi realnih brojeva

Parametarski zadane neprekidne distribucije

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

UVOD DEFINICIJA: Statistika planiranje i provođenje pokusa skupljanje podataka interpretacija

U teoriji vjerojatnosti razmatraju se događaji koji se mogu, ali ne moraju dogoditi. Takvi se događaji zovu slučajnim događajima.

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

Determinante. a11 a. a 21 a 22. Definicija 1. (Determinanta prvog reda) Determinanta matrice A = [a] je broj a.

VJEROJATNOST 1. kolokvij studenog 2013.

VJEROJATNOST I STATISTIKA

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

( x) ( ) ( ) ( x) ( ) ( x) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

4. MJERE DISPERZIJE. Josipa Perkov, prof., pred. 1

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

41. Jednačine koje se svode na kvadratne

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Zadaci iz Osnova matematike

OSNOVNI PRINCIPI PREBROJAVANJA. () 6. studenog / 18

Osnovne teoreme diferencijalnog računa

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

Zavrxni ispit iz Matematiqke analize 1

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

Uvod u matematičku statistiku

Ispitivanje toka i skiciranje grafika funkcija

Izbor statističkih testova Ana-Maria Šimundić

IZVODI ZADACI (I deo)

( ) ( ) Zadatak 001 (Ines, hotelijerska škola) Ako je tg x = 4, izračunaj

APROKSIMACIJA FUNKCIJA

VOLUMEN ILI OBUJAM TIJELA

10. domaća zadaća. 3. Neka je X neprekidna slučajna varijabla takva da je X N(0, 1). S točnošću od odredite:

Transcript:

Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika Teorem o uzastopnom prebrojavanju (TUP) Ako x 1 možemo birati na n 1 načina, ako x 2 možemo birati na n 2 načina,..... ako x k možemo birati na n k načina, tada uredenu k-torku (x 1, x 2,..., x k ) možemo birati na n 1 n 2 n k načina. Primjeri 1. U razredu koji broji 30 učenika treba odabrati predsjednika, njegovog zamjenika i blagajnika. Na koliko načina je to moguć učiniti? Rj. Prema TUP-u na 30 29 28 načina. 2. Iz grada A u grad B vode 4 ceste, a iz B u C vode 3 ceste. Na koliko načina možemo iz A stići u C preko B? Rj. Na 12 načina. 3. Koliko ima četverozanamenkastih brojeva čije su svake dvije susjedne znamenke različite? Rj. Ima ih 9 4 4. Koliko ima: (a) različitih sedmeroznamenkastih brojeva? (b) različitih sedmeroznamenkastih brojeva kojima su prve 3 znamenke neparne? (c) različitih sedmeroznamenkastih brojeva kojima su prve 2 znamenke jednake? (d) različitih sedmeroznamenkastih brojeva kojima su sve znamenke različite? Rj. (a) 9 10 6 (b) 5 3 10 4 (c) 9 10 5 (d) 9 9 8 7 6 5 4 5. Test ima 10 pitanja s odgovorima da i ne. Na koliko načina se test može riješiti? Rj. 2 20 Permutacija n-članog skupa (ili permutacija od n elemenata) je svaka uredena n-torka različitih elemenata tog skupa. Ponekad se naglašava da se radi o permutaciji bez ponavljanja budući da je svaki element uredene n-torke različit. Prema TUP-u ima točno n! permutacija n-članog skupa. 1

Primjeri 1. Na koliko načina 6 ljudi može stati u red? Rj. 6! 2. Na koliko na koliko načina može 5 muškaraca i 5 žena sjesti u red od 10 sjedala ako osobe istog spola ne sjede skupa? Rj. 2(5!) 2 3. Na sastanku 4 čovjeka (A,B,C i D) trebaju dati priopćenje. Na koliko načina to mogu učiniti ako (a) B mora govoriti nakon A? (b) B mora govoriti neposredno nakon A? Rj. (a) 4! 2 (b) 3! Kombinacija r-tog razreda od n-elemenata (r n) je svaki r-člani podskup nekog n-članog skupa. Ima ih ( ) n(n 1) (n r + 1) n! n = r(r 1) 1 r!(n r)! =. r ( ) n Pascalov trokut za računanje binomnih koeficijenata r Primjeri 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1. Košarkaški tim ima 11 igrača. Na koliko načina trener može odabrati početnu postavu (5 igrača)? ( ) 11 Rj. 5 2. Iz špila od 52 karte slučajno izvlačimo 8 karata. Na koliko načina je moguće izvući (a) točno 3 asa? ( ) 4 Rj. (a) 3 ( 48 5 (b) barem 3 asa? ) ( ) ( ) 4 48 (b) + 3 5 ( ) 4 4 ( ) 48 4 2

3. Na koliko načina tri (a) jednake (b) različite knjige možemo dati trojici učenika ako ih je u razredu 20? ( ) ( ) 20 20 Rj. (a) (b) 3! = 20 19 18 3 3 4. Od 100 mobitela 5 ih je s greškom. Na koliko načina možemo odabrati 10 mobitela tako da (a) su svi ispravni, (b) je točno jedan neispravan, (c) je barem jedan jedan neispravan? Rj. (a) (b) (c) ( ) 95, ( 10 ) ( ) 5 95, ( 1) ( 9 ) ( ) 5 95 5 + 1( ) 9 ( ) 2 100 95 ili. 10 10 Binomni teorem: ( ) n x n y 0 + 0 (x + y) n = ( ) 95 + 8 ( ) n x n 1 y 1 + 1 ( ) 5 3 ( ) 95 + 7 ( ) n x n 2 y 2 + + 2 ( ) 5 4 ( ) 95 + 6 ( ) n x 0 y n = n ( ) 5 5 n k=0 ( ) 95 5 ( ) n x n k y k k 3

II. Vjerojatnost Dva pristupa vjerojatnosti (Laplace, 19.st.) (a) klasični (a priori) (b) statistički (a posteriori). U oba pristupa uključen je pojam slučajnog pokusa: pokus čiji ishod nije jednoznačno odreden uvjetima pokusa (npr. bacanje igraće kocke, novčića, mjerenje vremena trajanja žarulje,...). Suprotno slučajnom pokusu jest deterministički pokus čiji je ishod jednoznačno odreden uvjetima. Skup svih mogućih ishoda ili elementarnih dogadaja naziva se prostor elementarnih dogadaja Ω. Primjeri Slučajni pokus: bacanje kocke Ω = {1, 2, 3, 4, 5, 6}, Ω = 6 Slučajni pokus: bacanje kocke 2 puta (ili bacanje dviju kocki) Ω = {(1, 1), (1, 2),..., (1, 6), (2, 1),..., (2, 6),..., (6, 6)}, Ω = 36 Slučajni pokus: mjerenje trajanja žarulje Ω = [0, 4000] u satima, Ω R je neprebrojiv Slučajni pokus: bacanje novčića sve dok ne padne glava. Ishod je broj potrebnih bacanja. Ω = {1, 2, 3,...} = N, Ω je prebrojiv Podjela pokusa s obzirom na kardinalni broj prostora Ω: (a) diskretni: ako je Ω konačan ili prebrojiv (b) kontinuirani: ako Ω sadrži neki interval iz R Dogadaj je podskup skupa Ω. Ako je Ω diskretan onda bilo koji podskup, a ako je kontinuiran onda gledamo samo neke podskupove, to jest govorimo o familiji F dogadaja (F P(Ω)). Najprije ćemo proučiti slučaj kada je prostor Ω konačan ( Ω = n). Statistički pristup vjerojatnosti Želimo odrediti vjerojatnost nekog dogadaja A. Slučajni pokus ponavljamo N puta i zabilježimo da se dogadaj A realizirao N A puta (frekvencija dogadaja A). Relativna frekvencija dogadaja A je kvocijent N A. Za neku seriju pokusa uočili bi da se relativna N frekvencija dogadaja A stabilizira oko broja kojeg nazivamo vjerojatnost dogadaja A, u oznaci p(a). Preciznije, vrijedi N A p(a) = lim N N. 4

Primjer Slučajni pokus: bacanje novčića Dogadaj : A = {palo je pismo} Očekujemo N A N 0.5 Klasični pristup vjerojatnosti Pretpostavimo da se prostor Ω sastoji od n elementarnih dogadaja koji su jednako vjerojatni. Vjerojatnost dogadaja A definira se kao p(a) = A Ω = A n. Primjer Slučajni pokus: izvlačenje karte iz špila od 52 karte Dogadaj : A = {izvučen je as} = {A H, A K, A P, A T } Vjerojatnost dogadaja A: p(a) = 4 52 = 7.7% Osnovna svojstva vjerojatnosti 1. p(ω) = 1 2. Za disjunktne dogadaje A i B (to jest takve da je A B = ili z dogadaje koji se isključuju) vrijedi p(a B) = p(a) + p(b). Općenito, ako su dogadaji A 1, A 2,..., A k u parovima disjunktni onda 3. p(a c ) = 1 p(a) 4. Ako je A B, onda p(a 1 A 2 A k ) = p(a 1 ) + p(a 2 ) + + p(a k ). p(a) p(b), P (B\A) = p(b) p(a) 5. Za dogadaje A i B vrijedi p(a) = p(a B) + p(a\b). 6. Ako su dogadaji A 1, A 2,..., A k medusobno disjunktni i vrijedi Ω = k i=1 A k, onda p(a) = p(a A 1 ) + p(a A 2 ) + + p(a A k ). 7. Formula uključivanja/isključivanja (FUI ) p(a B) = p(a) + p(b) p(a B). 5

Primjeri 1. Izvlačimo kartu iz špila od 52 karte. Odredite vjerojatnost da je izvučena karta (a) desetka ili srce (b) niti as niti pik. Rj. (a) A = {izvučena je desetka}, B = {izvučeno je srce} Dogadaji A i B nisu disjunktni, vrijedi A B = {10 S }. Znamo izračunati vjerojatosti dogadaja A, B i A B: Dakle, p(a) = 4 52 = 1 13, p(b) = 13 52 = 1 4, p(a B) = 1 52. p(a B) = 1 13 + 1 13 1 52 = 4 13 = 31%. (b) C = {izvučena je as}, D = {izvučen je pik} Vjerojatnosti dogadaja C i D su Vrijedi p(c) = 1 13, p(d) = 1 4. p(c c D c ) = p((c D) c ) = 1 p(c D) = 1 p(c) p(d) + p(c D). Vjerojatnost dogadaja C D = {izvučena je as pik} je 1/52. Stoga je p(c c D c ) = 9 13 = 69%. 2. U posudi sa nalazi 15 kuglica: 6 crvenih, 4 bijele i 5 plavih. Ako izvučemo jednu kuglicu, odredite vjerojatnost da izvučena kuglica bude (a) crvena (b) plava (c) bijela (d) crvena ili plava (e) nije crvena Rj. (a) 6 15 = 40% (b) 5 15 = 33% (c) 4 15 3. Odredi vjerojatnost da u 3 bacanja kocke padne (a) bar jedna šestica (b) točno jedna šestica. = 27% (d) 11 15 = 73% (e) 1 6 15 = 60% Rj. (a) A = {pala je bar jedna šestica}, A c = {nije pala niti jedna šestica} Lako izračunamo vjerojatnost dogadaja A c : p(a c ) = 53. Stoga je 63 p(a) = 1 p(a c ) = 1 53 6 3 = 42%. (b) B = {pala je točno jedna šestica}, p(b) = 3 52 6 3 = 35%. 6

4. U posudi se nalazi 8 crvenih, 3 bijele i 9 plavih kuglica. Iz posude izvučemo 3 kuglice. Odredi vjerojatnost da (a) su sve crvene (b) su sve bijele (c) je 1 bijela i 2 crvene (d) je bar jedna bijela (e) su različitih boja. ( ) 20 Rj. Ω = 3 (a) p(a) = (8 3) 1 = 5% (b) p(b) = ( 20 3 ) ( 20 3 ) = 0.09% (c) p(a) = (3 1) ( 8 2) ( 20 (d) p(d c ) = (17 3 ) ( 20 3 ) = 60%, p(d) = 40% (e) p(e) = 8 3 9 ( 20 3 ) = 19% 3 ) = 7% Uvjetna vjerojatnost Primjer: Kolika je vjerojatnost da je pala šestica ako znamo da je pao paran broj? A = {pala je šestica}, B = {pao je paran broj} Tražimo vjerojatnost dogadaja A uz uvjet B. Tu vjerojatnost zovemo uvjetna i pišemo p(a B). Konkretno, ako znamo da je pao paran broj, to jest 2,4, ili 6, onda je p(a B) = 1 3. Općenito, ako je p(b) > 0, onda uvjetnu vjerojatnost računamo kao p(a B) = p(a B). p(b) U slučaju jednako vjerojatnih ishoda (kao u navedenom primjeru) to je p(a B) = A B. B Lako se uočava da je u slučaju uvjetne vjerojatnosti B preuzeo ulogu prostora Ω. Za dogadaje A i B kažemo da su nezavisni ako dogadaj B ne utiče na vjerojatnost dogadaja vjerojatnost dogadaja A, to jest ako je p(a B) = p(a), odnosno Primjeri p(a B) = p(a)p(b). 7

1. Vjerojatnost da će prvi strijelac pogoditi metu je 0.8, a drugi 0.9. Odredite vjerojatnost da će (a) obojica (b) niti jedan (c) barem jedan pogoditi metu. Rj. A = {prvi strijelac je pogodio metu}, B = {drugi strijelac je pogodio metu} (a) p(a B) = p(a)p(b) = 72% jer se A i B nazavisni dogadaji (b) p(a c B c ) = p((a B) c ) = 1 p(a B) = 1 (p(a) + p(b) p(a B)) = 0, 02 = 2% Ili, p(a c B c ) = p(a c )p(b c ) = 0.1 0.2 (jer su i A c i B c nazavisni dogadaji). (c) p(a B) = p(a) + p(b) p(a B) = 98%. 2. Kocka je bačena dva puta. Neka je A = {zbroj brojeva je 4}, B = {bar jedno bacanje je 3}. (a) Izračunajte p(a B). Rj. (a) p(a B) = 2 36 (b) Jesu li A i B nezavisni dogadaji? 11 p(a B), jer A B = {(1, 3), (3, 1)}, p(b) =, p(a B) = 36 p(b) = 2 11. (b) Ne, jer p(a) = 3 36 i p(a B) p(a)p(b) 3. Test ispituje je li osoba zaražena nekom rijetkom bolešću koja se pojavljuje jednom na 10 000 ljudi. Ako je osoba zaražena test je pozitivan s vjerojatnošću 99%, a ako osoba nije zaražena test je negativan s vjerojatnošću 98%. Drugim ruječima, lažno je negativan s vjerojatnošću 1%, lažno je pozitivan s vjerojatnošću 2%. Odredite vjerojatnost da je test pozitivan. Rj. Označimo Z = {osoba je zaražena}, Z c = {osoba nije zaražena}, T = {test je pozitivan}. Vrijedi p(z T ) = 99%, p(z c T ) = 2%. Kako su dogadaji T Z i T Z c disjunkni vrijedi p(t ) = p(t Z)+p(T Z c ) = p(z T )p(z)+p(z c T )p(z c 1 9999 ) = 0.99 +0.02 10000 10000, pa je p(t ) = 0.020097. Ovo znači da bi na 10 000 ljudi test bio pozitivan približno 201 put, što znači da bi 200 ljudi bilo laňo prikazano kao zaraženim. Ovaj test kvalificira se kao nekoristan. Ideju koju smo koristili za rješavanje prethodnog primjera možemo generalizirati na sljedeći način: ako za u parovima disjunktne dogadaje H 1, H 2,..., H m (to jest H i H j = za i j) vrijedi Ω = H 1 H 2 H m, 8

onda vrijedi tzv. formula potpune vjerojatnosti (FPV) p(a) = p(a H 1 )p(h 1 ) + p(a H 2 )p(h 2 ) + + p(a H m )p(h m ). Dogadaje H 1, H 2,..., H m s navedenim svojstima nazivamo potpun sistem dogadaja. Primjeri 1. Na nastavu dolazio redovito 70% studenata, dok njih 30% ne. Studenti koji dolaze na nastavu redovito polože kolokvij s vjerojatnošću 70%, a oni drugi s vjerojatnošću 40%. (a) Kolika je vjerojatnost da student položi kolokvij? (b) Ako je student položio kolokvij, kolika je vjerojatnost da je student dolazio redovito na nastavu? Rj. (a) A = {student je položio}, H 1 = {student je dolazio na nastavu}, H 2 = {student nije dolazio na nastavu}. Prema FPV p(a) = p(a H 1 )p(h 1 ) + p(a H 2 )p(h 2 ) = 0.7 0.7 + 0.4 0.3 = 61% (b) p(h 1 A) = p(h 1 A) p(a) = p(a H 1)p(H 1 ) p(a) = 0.7 0.7 0.61 = 80% 2. U tvornici lijekova dva stroja A i B pakiraju proizvedene tablete. Stroj A zapakira 40% ukupne robe, a stroj B preostalo. Od 100 pakiranja koja načini stroj A su 2 pakiranja neispravna, a od 200 pakiranja kojih načini stroj B su 3 pakiranja neispravna. Odredite vjerojatnost da je slučajno izabrano pakiranje neispravno. Rj. L = {slučajno izabrano pakiranje neispravno}, H 1 = {pakiranje načinio stroj A}, H 2 = {pakiranje načinio stroj B}. Prema FPV je p(l) = p(l H 1 )p(h 1 ) + p(l H 2 )p(h 2 ) = 2 100 0.4 + 3 0.6 = 1.7% 200 Diskretna slučajna varijabla Neka je Ω diskretni prostor elementarnih dogdaja i p vjerojatnost na njemu. Proizvoljna funkcija X : Ω R diskretna slučajna varijabla. Skup svih vrijednosti koje poprima funkcija X, to jest slika funkcije označava se s R(X) = {X(ω) : ω Ω}. Kako je Ω diskretan skup, to je i R(X) konačan ili prebrojiv. Svakoj vrijednosti x i R(X) pridružujmo pripadni dogadaj i njegovu vjerojatnost: {X = x i } = {ω Ω : X(ω) = x i }, p i = p({x = x i }). 9

Za A R koristimo oznaku {X A} = {ω Ω : X(ω) A}, p({x A}) = x i A p i. Slično, za a, b R {X a} = {ω Ω : X(ω) a}, {a X b} = {ω Ω : a X(ω) b}. Primjer: novčića. Slučajna varijabla X broji koliko se puta pojavilo pismo u 3 bacanja Ω = {P P P, P P G, P GP, GP P, GP G, GGP, GGG}, R(X) = {0, 1, 2, 3}. P ({X = 0} = P ({GGG} = 1/8 P ({X = 1} = P ({P GG, GGP, GP G} = 3/8 P ({X = 2} = P ({P P G, GP P, P GP } = 3/8 P ({X = 3} = P ({P P P } = 1/8. Kraće slučajnu varijablu X reprezentiramo tablicom distribucije ( ) x1 x 2 x N, p 1 p 2 p N za R(X) = {x 1, x 2,..., x N }. Uvijek vrijedi p i 0 i N i=1 p i = 1. Tablica distribucije za slučajnu varijablu X iz prethodnog primjera glasi ( ) 0 1 2 3. Očekivanje diskretne slučajne varijable X definira se kao 1 8 3 8 E(X) = x 1 p 1 + x 2 p 2 + + x N p N. Varijanca diskretne slučajne varijable X je 3 8 1 8 V ar(x) = N (x i E(X)) 2 p i. i=1 Za varijancu se još koristi oznaka σ 2, a za očekivanje µ. Standardna devijacija je V ar(x) = σ. Izračunajmo te vrijednosti za slučajnu varijablu iz primjera: µ = 0 1 8 + 1 3 8 + 2 3 8 + 3 1 8 = 12 8 = 1.5, σ 2 = (0 1.5) 2 1 8 + (1 1.5)2 3 8 + (2 1.5)2 3 8 + (3 1.5)2 1 8 = 0.75, 10

σ = 0.87. Varijanca se jednostavnije može izračunati pomoću formule V ar(x) = E(X 2 ) E(X) 2, gdje je X 2 slučajna varijabla s tablicom distribucije ( x 2 1 x 2 2 x 2 N p 1 p 2 p N (Zaista, ). V ar(x) = N N x 2 i p i 2E(X) x i p i + E(X) 2 i=1 i=1 N i=1 p i = N x 2 i p i 2E(X) 2 + E(X) 2, i=1 jer je E(X) = N i=1 x ip i i N i=1 p i = 1.) Očekivanje shvaćamo kao srednju vrijednost slučajne varijable, a standardna devijacija (ili varijanca) jest odstupanje slučajne varijable od očekivanja - ako je σ mali onda su vrijednosti slučajne varijable bliske očekivanju. Primjer: Igrač baca 3 novčića. Ako padnu 3 pisma dobiva 10 kuna, ako padnu 2 pisma dobiva 5 kuna, ako padne 3 pismo dobiva 1 kunu, te ako ne padne ni jedno pismo gubi 20 kuna. Zapišite tablicu distribucije, očekivanje i standardnu devijaciju. Rj. Tablica distribucije glasi ( 20 1 5 10 X = µ = 20 1 8 + 1 3 8 + 5 3 8 + 10 1 8 = 1, pa očekujemo da će dobiti 1 kunu. Standardna devijacije govori o riziku : σ 2 = E(X 2 ) E(X) 2 = 400 1 8 + 1 3 8 + 25 3 8 + 100 1 1 = 71, 25, 8 σ = 8.44. 1 8 Bernoullijeva slučajna varijabla je slučajna varijabla koja poprima točno dvije vrijednosti: 1 - uspjehi 0 - neuspjeh i to s vjerojatnošću p i q = 1 p. Tablica distribucije glasi ( ) 0 1 X =. q p Očito je µ = p i σ 2 = p p 2 = p(1 p) = pq. Primjer. X je pojavljivanje šestice u jednom bacanju kocke. ( ) 0 1 X =. 5/6 1/6 3 8 11 3 8 1 8 ).

µ = 1/6 = p, σ 2 = 5/36. Binomna slučajna varijabla broji uspjehe u n nezavisnih ponavljanja pokusa s točno 2 ishoda uspjeh/neuspjeh (1/0) opisanih Bernoullijevom slučajnom varijablom. Dakle, tablica distribucije glasi ( ) 0 1 2 n X = ( q n n ) 1) pq n 1 p 2 q n 2 p n. Da je X binomna slučajna varijabla zapisujemo kraće X B(n, p). Vrijedi ( n 2 µ = np, σ 2 = npq. Početni primjer s 3 bacanja novčića je X B(3, 1 2 ). Zadatci 1. U kutiji se nalaze 24 kuglice: 20 crnih i 4 bijele. Kuglicu izvalačimo jednu za drugom dok ne izvučemo crnu. Slučajna varijabla jednaka je broju izvučenih kuglica. Odredite tablicu distribucije, očekivanje i standardnu devijaciju. Rj. ( 1 2 3 4 5 X = X = 20 24 4 20 24 23 µ = 1.19, σ 2 = 0.214, σ = 0.462. 4 3 20 24 23 22 4 3 2 20 24 23 22 21 4 3 2 1 20 24 23 22 21 20 ( 1 2 3 4 5 0.833 0.145 0.02 0.0019 9.4 10 4 2. U kutiji se nalaze 3 crne i 5 bijelih kuglica. Slučajna varijabla X jednaka je broju bijelih kuglica u 2 slučajna izvlačenja (bez vraćanja). Odredite tablicu distribucije, očekivanje i standardnu devijaciju. Rj. µ = 1.25, σ 2 = 0.402, σ = 0634. ( 0 1 2 X = 3 2 2 3 5 8 7 8 7 3. Neka je X B(5, 0.3). Izračunajte p({1 X 3}) i p({x 4}). Rj. n = 5, p = 0.3, q = 0.7 p({1 X 3}) = p({x 4}) = ( ) 5 pq 4 + 1 5 4 8 7 ( ) 5 p 2 q 3 + 2 ), ), ). ( ) 5 p 3 q 2 = 0.8 = 80%. 3 ( ) 5 p 4 q + p 5 = 0.031 = 3.1% 4 12

4. Odredite vjerojatnost dobivanja barem jedna sedmice u 3 bacanja para kocki. Rj. p({(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}) = 6 = 1 36 6 X je binomna slučajna varijabla X B(3, 1/6), pa je ( ) 3 p({x 1}) = 1 p({x = 0}) = 1 p 0 q 3 = 42%. 0 5. Operacija uspjeva u 75% slučajeva. Kolika je vjerojatnost da (a) točno 75% od 8 pacijanata ima uspjelu operaciju? (b) barem 50% od 8 pacijanata ima uspjelu operaciju? Rj. X B(8, 0.75) (a) 75% 8 = 6, p({x = 6}) = ( ) 8 0.75 6 0.25 2 = 31% 6 (b) 50% 8 = 4, ( ) ( ) ( ) ( ) 8 8 8 8 p({x 4}) = 1 p({x 3} = 1 ( p 0 q 8 + p 1 q 7 + p 2 q 6 + p 3 q 5 ) = 97% 0 1 2 3 6. Ako je utvrdeno da je p = 0.8 vjerojatnost pojavljivanja neke kolonije mikroorganizama pod zadanim uvjetima, koja je vjerojatnost da se u 5 slučajeva ta kolonija ne pojavi manje od 4 puta? Rj. X B(5, 0.8) p({x 4}) = ( ) 5 p 4 q 1 + 4 ( ) 8 p 5 q 0 = 73.7%. 5 7. Vjerojatnost realizacija dogadaja A u jednom pokusu iznosi 0.08. Za seriju od 1000 pokusa, odredite očekivanje, varijancu i standardnu devijaciju. Rj. X B(1000, 0.08) Neprekidna slučajna varijabla µ = np = 80, σ 2 = npq = 73.6, σ = 8.6. X : Ω R je neprekidna slučajna varijabla ako slika R(X) sadrži neki interval, postoji funkcija f : R R takva da za sve a, b R vrijedi p({a X b}) = b a f(x)dx. 13

Funkciju f nazivamo funkcija gustoće slučajne varijable X. Za neprekidnu slučajnu varijablu definiramo još sljedeće pojmove funkcija distribucije, F : R R F (x) = x f(t)dt, očekivanje varijanca µ = E(X) = σ 2 = V ar(x) = xf(x)dx, (x µ) 2 f(x)dx, standardna devijacija σ = V ar(x). Normalna slučajna varijabla X, oznaka X N(µ, σ 2 ), je slučajna varijabla čija je funkcija gustoće f(x) = 1 σ (x µ) 2 2π e 2σ 2, pri čemu je µ R i σ > 0. Pokazuje se da je µ očekivanje i σ standardna devijacija ove slučajne varijable. X N(0, 1) naziva se standardna normalna slučajna varijabla. Ako je X N(µ, σ 2 ), onda X µ N(0, 1). σ 14

III. Statistika Deskriptivna (opisna) statistika služi predočavanje i opisivanje glavnih karakteristika sakupljenih podataka x 1, x 2,..., x N koji predstavljaju realizaciju varijable X. Popis osnovnih veličina i njihovih formula: Aritmetička sredina ili prosjek je x = x 1 + x 2 + x N N Frekvencija je broj pojavljivanja odredenog podatka, f i, N f i = N, i=1 frekvencija razreda je broj pojavljivanja odredenog razreda podatka ukoliko smo podatke podijelili u razred. Relativna frekvencija je kvocijent obične frekvencije i broja podataka, f ri, N f ri = N, i=1 Medijan je vrijednost varijable X za koju je 50% ili više podataka manje ili jednako od te vrijednosti i za koju je 50% ili više podataka veće ili jednako od te vrijednosti. Ako podatke poredamo po veličini x (1) x (2) x (N),. i N neparan onda je a ako je N paran onda je m = x ( N+1 2 ), m = 1 2 (x ( N 2 ) + x ( N 2 +1)). Umjesto da pamtimo formule za parni i neparni slučaj koristimo sljedeću formulu x ( m q ) = x (k) + r q (x (k+1) x (k) ), gdje je m = k + qr i 0 r < q (k i r postoje i jedinstveni su prema Teoremu o dijeljenju s ostatkom). Prema tome medijan možemo uvijek računati kao m = x ( N+1 2 ). 15

Raspon je razlika najvećeg i najmanjeg podatka d = x (N) x (1). Kvartili dijele podatke u četiri jednakobrojne skupine: prvi ili donji kvartil: ona vrijednost za koju vrijedi da je 25% svih podataka manje ili jednako od nje (odnosno 75% svih podataka je veće ili jednako od nje), q 1 = x ( N+1 4 ), drugi kvartil: medijan, treći ili gornji kvartil: ona vrijednost za koju vrijedi da je 25% svih podataka veće ili jednako od nje (odnosno 75% svih podataka je manje ili jednako od nje), q 3 = x ( 3(N+1) 4 ). Napomena: Postoji čak desetak različitih formula za računanje kvartila. Na primjer, gornja definicija ne poklapa se s onom iz Excela. Nulti i četvrti kvartil odgovaraju minimalnoj x (1), odnosno maksimalnoj vrijednosti x (N) uzorka. Svih pet kvartila nazivaju se karakteristična petorka uzorka. Interkvartil je jednak razlici d q = q 3 q 1. Varijanca uzorka je prosječno kvadratno odstupanje od prosjeka (s ) 2 = 1 N N (x i x) 2, i=1 a pripadna standardna devijacija se označava s s i računa kao drugi korijen iz varijance uzorka. Korigirana varijanca uzorka je s 2 = 1 N 1 N (x i x) 2 koja predstavlja dobar procjenitelj za varijancu σ 2 slučajne varijable. Pripadna korigirana standardna devijacija se označava sa s. Napomenimo da raspon, interkvartil, varijanca i standardna devijacija spadaju u tzv. mjere raspršenja. i=1 16

Centralni moment reda k (k N) danog uzorka računa se kao µ k = 1 N 1 N (x i x) k. Centralni moment reda 1 jednak je nuli, a reda 2 korigiranoj varijanci uzorka. Centralni moment reda 3 značajan je odredivanje tzv. koeficijenta asimetrije uzorka: i=1 α 3 = µ 3 s 3. Ako je α 3 = 0, onda je uzorak simetričan. Za α 3 > 0 je pozivno asimetričan, a α 3 < 0 je negativno asimetričan. Koeficijent asimetrije je mjera oblika. Na seminarima smo prikupili sljedeće podatke na uzorku od 20 studenta: seminar u 8h broj mobitela koji je student promijenio u posljednjih 5 godina: 3 3 1 2 2 2 1 4 2 2 3 3 3 2 3 2 3 3 4 4 seminar u 10h broj mobitela koji je student promijenio do sada: 5 5 6 2 3 4 5 4 5 5 6 6 8 9 11 4 5 6 6 5 seminar u 12h Koju ocjenu očekujem iz Matematike sa statistčkom analizom: 3 4 3 2 2 3 2 5 2 2 3 4 3 4 4 5 2 2 5 4 Analiza podataka: Seminar u 8h: Podatci poredani po veličini: Tablica frekvencija: x (1) = 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 = x (20) 1 2 3 4 f i 2 7 8 3 f ri 0.1 0.35 0.4 0.15 Kvartili q 0 = x (1) = 1 minimum, q 4 = x (20) = 4 maksimum, d = 4 1 = 3 raspon m = q 2 = 1(x 2 (10) + x (11) ) = 3 medijan 17

q 1 = x (5) + 1 4 (x (6) x (5) ) = 2 donji kvartil, q 3 = x (15) + 3 4 (x (16) x (15) ) = 3 gornji kvartil, d q = 3 2 = 1, interkvartil Mod je 3 (vrijednost uzorka koji se najviše pojavljuje). Aritmetička sredina: x = 2.6 Varijanca i standardna devijacija: (s ) 2 = 0.74, s = 0.86 Korigirana varijanca i korigirana standardna devijacija: s 2 = 0.78, s = 0.88 Centralni moment reda 3 i koeficijent asimetrije: µ 3 = 0.051, α 3 = 0, 073. Seminar u 12h: Podatci poredani po veličini: Tablica frekvencija: x (1) = 2 3 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 8 9 11 = x (20) 2 3 4 5 6 8 9 11 f i 1 1 3 7 5 1 1 1 U ovom slučaju preporuča se podatke rasporediti u razrede. razreda je n. Znači, u našem slučaju je to 4 ili 5 razreda. Preporučeni broj <4 4 5 6 >6 f i 2 3 7 5 3 f ri 0.1 0.15 0.35 0.25 0.15 Kvartili q 0 = x (1) = 2 minimum, q 4 = x (20) = 11 maksimum, d = 9 raspon m = q 2 = 1(x 2 (10) + x (11) ) = 5 medijan q 1 = x (5) + 1(x 4 (6) x (5) ) = 4.25 donji kvartil, q 3 = x (15) + 3(x 4 (16) x (15) ) = 6 gornji kvartil, d q, interkvartil Mod je 5 (vrijednost uzorka koji se najviše pojavljuje). Aritmetička sredina: x = 5.5 Varijanca i standardna devijacija: (s ) 2 = 3.85, s = 1.96 Korigirana varijanca i korigirana standardna devijacija: s 2 = 4.05, s = 2.01 Centralni moment reda 3 i koeficijent asimetrije: µ 3 = 8.21, α 3 = 1.01. Seminar u 12h: Podatci poredani po veličini: 18

Tablica frekvencija: x (1) = 2 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 = x (20) 2 3 4 5 f i 7 5 5 3 f ri 0.35 0.25 0.25 0.15 Kvartili q 0 = x (1) = 2 minimum, q 4 = x (20) = 5 maksimum, d = 3 raspon m = q 2 = 1 2 (x (10) + x (11) ) = 3 medijan q 1 = x (5) + 1 4 (x (6) x (5) ) = 2 donji kvartil, q 3 = x (15) + 3 4 (x (16) x (15) ) = 4 gornji kvartil, d q = 2, interkvartil Mod je 2 (vrijednost uzorka koji se najviše pojavljuje). Aritmetička sredina: x = 3.2 Varijanca i standardna devijacija: (s ) 2 = 1.16, s = 1.08 Korigirana varijanca i korigirana standardna devijacija: s 2 = 1.22, s = 1.11 Centralni moment reda 3 i koeficijent asimetrije: µ 3 = 7.92, α 3 = 7.17. Sve izračunate vrijednosti bit će puno jasnije pogledaju li se dijagrami! Primjer: Popisan je prosjek 30 studenata (na jednu decimalu): 3.4, 3.0, 4.6, 2.5, 4.3, 3.9, 3.6, 4.1, 2.8, 4.2, 3.9, 3.5, 3.4, 4.3, 4.5, 4.9, 3.9, 3.6, 3.6, 5.0, 3.2, 4.3, 3.9, 5.0, 3.4, 4.2, 3.3, 4.1, 2.8, 3.6 U rastućem poretku imamo sljedeći uzorak i odmah ih grupiramo u intervale duljine 0.5: 2.5, 2.8, 2.8 3.0, 3.2, 3.3, 3.4, 3.4, 3.4, 3.5, 3.6, 3.6, 3.6, 3.6, 3.9, 3.9, 3.9, 3.9, 4.1, 4.1, 4.2, 4.2, 4.3, 4.3, 4.3, 4.5, 4.6, 4.9, 5.0, 5.0 Tablica distibucije - rasporedit ćemo podatke u ekvidistatne intervale intervali [2.5, 3.0) [3.0, 3.5) [3.5, 4.0) [4.0, 4.5) [4.5, 5] f i 3 6 9 7 5 f ri 0.1 0.2 0.3 0.23 0.17 19

(b) Strukturni krug ( pita ; piechart) (a) Histogram (barchart) Slika 1: Broj mobitela koje je student promijenio u zadnjih 5 god. (b) Strukturni krug ( pita ; piechart) (a) Histogram (barchart) Slika 2: Broj mobitela koje je student promijenio do sada 20

(b) Strukturni krug ( pita ; piechart) (a) Histogram (barchart) Slika 3: Ocjena koju student očekuje iz MSSA Iz 2.5, 2.8, 2.8,3.0, 3.2, 3.3, 3.4, 3.4, 3.4, 3.5, 3.6, 3.6, 3.6, 3.6, 3.9, 3.9, 3.9, 3.9, 4.1, 4.1, 4.2, 4.2, 4.3, 4.3, 4.3, 4.5, 4.6, 4.9, 5.0, 5.0 odredimo: min = 2.5, max = 5.0, d = 2.5, mod = 3.9 (pojavljuje se 4 puta) q 1 = x ( 31 4 ) = x (7+ 3 4 ) = x (7) + 3 4 (x (8) x (7) ) = 3.4, q 3 = x ( 93 4 ) = x (7+ 3 4 ) = x (23) + 1 4 (x (24) x (23) ) = 4.3, d q = 0.9 x = 3.82 (aritmetička sredina na 2 decimale) (s ) 2 = 0.41, s = 0.64, s 2 = 0.42, s = 0.65 µ 3 = 0.00665, α 3 = 0.024 (uzorak je prilično simetričan!) 21

(b) Strukturni krug ( pita ; piechart) (a) Histogram (barchart) Slika 4: Prosjek studenta 22