Statistika. primjeri i zadaci. Ante Mimica, Marina Ninčević. 30. kolovoza 2010.

Σχετικά έγγραφα
2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

3 Populacija i uzorak

1.4 Tangenta i normala

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

Funkcije dviju varjabli (zadaci za vježbu)

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

Matematička analiza 1 dodatni zadaci

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

VJEROJATNOST popravni kolokvij veljače 2017.

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Slučajni procesi Prvi kolokvij travnja 2015.

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

Riješeni zadaci: Limes funkcije. Neprekidnost

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

ELEKTROTEHNIČKI ODJEL

18. listopada listopada / 13

Linearna algebra 2 prvi kolokvij,

3.1 Granična vrednost funkcije u tački

Linearna algebra 2 prvi kolokvij,

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

PISMENI ISPIT IZ STATISTIKE

Matematika 1 - vježbe. 11. prosinca 2015.

7 Algebarske jednadžbe

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

5. Karakteristične funkcije

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

2.7 Primjene odredenih integrala

TRIGONOMETRIJSKE FUNKCIJE I I.1.

16 Lokalni ekstremi. Definicija 16.1 Neka je A R n otvoren, f : A R i c A. Ako postoji okolina U(c) od c na kojoj je f(c) minimum

Numerička matematika 2. kolokvij (1. srpnja 2009.)

Slučajne varijable Materijali za nastavu iz Statistike

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

Elementi spektralne teorije matrica

1 Promjena baze vektora

Riješeni zadaci: Nizovi realnih brojeva

( , treći kolokvij) 3. Na dite lokalne ekstreme funkcije z = x 4 + y 4 2x 2 + 2y 2 3. (20 bodova)

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

( , 2. kolokvij)

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

Operacije s matricama

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

MJERA I INTEGRAL 2. kolokvij 30. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!)

numeričkih deskriptivnih mera.

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

radni nerecenzirani materijal za predavanja

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Determinante. a11 a. a 21 a 22. Definicija 1. (Determinanta prvog reda) Determinanta matrice A = [a] je broj a.

Diskretan slučajni vektor

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

PRIMJER 3. MATLAB filtdemo

Uvod u teoriju brojeva

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

MATEMATIKA 2. Grupa 1 Rexea zadataka. Prvi pismeni kolokvijum, Dragan ori

TRIGONOMETRIJA TROKUTA

VVR,EF Zagreb. November 24, 2009

SISTEMI NELINEARNIH JEDNAČINA

2. KOLOKVIJ IZ MATEMATIKE 1

Uvod u vjerojatnost i matematičku statistiku

( x) ( ) ( ) ( x) ( ) ( x) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z.

9. GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE

6 Polinomi Funkcija p : R R zadana formulom

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

RIJEŠENI ZADACI I TEORIJA IZ

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

Parametarski zadane neprekidne distribucije

VJEŽBE IZ MATEMATIKE 1

( ) ( ) 2 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET. Zadaci za pripremu polaganja kvalifikacionog ispita iz Matematike. 1. Riješiti jednačine: 4

1 Diferencijabilnost Motivacija. Kažemo da je funkcija f : a, b R derivabilna u točki c a, b ako postoji limes f f(x) f(c) (c) = lim.

MATEMATIKA Pokažite da za konjugiranje (a + bi = a bi) vrijedi. a) z=z b) z 1 z 2 = z 1 z 2 c) z 1 ± z 2 = z 1 ± z 2 d) z z= z 2

Signali i sustavi Zadaci za vježbu. III. tjedan

Linearna algebra I, zimski semestar 2007/2008

Diferencijalni račun

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

IZVODI ZADACI (I deo)

6 Primjena trigonometrije u planimetriji

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

Dijagonalizacija operatora

Teorijske osnove informatike 1

5. PARCIJALNE DERIVACIJE

Osnovne teoreme diferencijalnog računa

41. Jednačine koje se svode na kvadratne

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

Integrali Materijali za nastavu iz Matematike 1

LINEARNA ALGEBRA 1, ZIMSKI SEMESTAR 2007/2008 PREDAVANJA: NENAD BAKIĆ, VJEŽBE: LUKA GRUBIŠIĆ I MAJA STARČEVIĆ

KONVEKSNI SKUPOVI. Definicije: potprostor, afin skup, konveksan skup, konveksan konus. 1/5. Back FullScr

4.1 Elementarne funkcije

Slučajni vektor. Poglavlje 3

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

(BIO)STATISTIKA. skripta. studij: Prehrambena tehnologija i Biotehnologija. doc. dr. sc. Iva Franjić 2012.

Transcript:

Statistika primjeri i zadaci Ante Mimica, Marina Ninčević 3. kolovoza.

Sadržaj Opisna statistika 5. Zadaci za vježbu................................ 4 Neprekidne slučajne varijable 47. Normalna distribucija.............................. 49. Eksponencijalna distribucija.......................... 5.3 Γ-distribucija.................................. 53.4 χ -distribucija.................................. 55.5 Studentova t-distribucija............................ 56.6 Fisherova F-distribucija............................ 57.7 Zadaci za vježbu................................ 59 3 Neprekidni slučajni vektori. Uvjetno očekivanje 6 3. Neprekidni slučajni vektori........................... 6 3. Uvjetno očekivanje............................... 69 3.3 Zadaci za vježbu................................ 78 4 Procjena parametara 8 4. Metoda maksimalne vjerodostojnosti..................... 8 4. Metoda momenata............................... 86 4.3 Pouzdani intervali za parametre normalne razdiobe............. 87 4.4 Aproksimativni pouzdani intervali....................... 9 4.5 Zadaci za vježbu................................ 95 5 Testiranje statističkih hipoteza 97 3

4 SADRŽAJ 5. Zadaci za vježbu................................ 8 6 Linearni regresijski modeli 9 6. Zadaci za vježbu................................ 8 7 χ -test i Kolmogorov-Smirnovljev test 9 7. χ -test o pripadnosti distribuciji........................ 9 7. Kolmogorov-Smirnovljev test.......................... 34 7.3 χ -test o nezavisnosti.............................. 37 7.4 χ -test o homogenosti.............................. 39 7.5 Zadaci za vježbu................................ 4

Opisna statistika Zadatak. Kocku smo bacali puta i zabilježili smo sljedeće rezultate: 6 3 3 6 3 5 6 4 6 3 5 5 3 3 (a) Nacrtajte histogram relativnih frekvencija. (b) Odredite aritmetičku sredinu, mod i medijan uzorka. (c) Odredite varijancu i standardnu devijaciju uzorka. (d) Odredite raspon uzorka. (e) Odredite donji i gornji kvartil te interkvartil uzorka. (f) Nacrtajte dijagram pravokutnika ( box and whisker plot ). Rješenje: (a) Frekvencijska tablica: Histogram relativnih frekvencija: i y i f i r i = f i /.5 5.5 3 3 6.3 4 4.5 5 5 3.5 6 6 4. Σ. 5

6. OPISNA STATISTIKA.3.5..5..5 3 4 5 6 (b) Aritmetička sredina iznosi x = f y + +f 6 y 6 = +5 +6 3+ 4+3 5+4 6 = 3.6. f + +f 6 +5+6++3+4 Mod uzorka je 3. Podatke x,...,x n poredane po veličini označavamo s x (),...,x (n). Pri tome za s = k +r, gdje je k Z,r [,, vrijedi formula x (s) = x (k) +r [ x (k+) x (k) ]. (.) Uredimo podatke po veličini:,,,,,,3,3,3,3,3,3,4,5,5,5,6,6,6,6. Medijan uzorka je m = x ( n+ ) = x ( + ) = x (+ ) = x () + [x () x () ] = 3+ (3 3) = 3. (c) Varijanca uzorka iznosi s = +5 +6 3 + 4 +3 5 +4 6 3.6 +5+6++3+4 pa je standardna devijacija s =.64. =.673684 (d) Raspon uzorka je R = x () x () = 6 = 5. (e) Donji kvartil je q L = x ( n+ 4 ) = x ( + 4 ) = x (5+ 4) = x (5) + 4 [x (6) x (5) ] = + ( ) =. 4

. OPISNA STATISTIKA 7 Gornji kvartil je q U = x ( 3(n+) 4 ) = x ( 3(+) 4 ) = x (5+ 4) = x 3 (5) + 3 4 [x (6) x (5) ] = 5+ 3 (5 5) = 5. 4 Interkvartil iznosi d q = q U q L = 5 = 3. (f) Dijagram pravokutnika: 6 5 3 Riješimo sada ovaj zadatak u R-u. Ubacimo podatke u vektor rezultati: > rezultati<-c(6,3,3,6,3,5,6,,4,6,3,5,5,,,,,3,,3) Ispišimo podatke > rezultati [] 6 3 3 6 3 5 6 4 6 3 5 5 3 3 Duljina uzorka je > n<-length(rezultati) > n [] Tablica frekvencija je

8. OPISNA STATISTIKA > frekv<-data.frame(table(rezultati)) > frekv rezultati Freq 5 3 3 6 4 4 5 5 3 6 6 4 Promijenimo imena stupaca i dodajmo stupac relativnih frekvencija: > frekv<-data.frame(frekv,frekv[]/sum(frekv[])) > frekv rezultati frekvencije frekvencije..5 5.5 3 3 6.3 4 4.5 5 5 3.5 6 6 4. > names(frekv)[3]<-"rel. frekvencije" > frekv rezultati frekvencije rel. frekvencije.5 5.5 3 3 6.3 4 4.5 5 5 3.5 6 6 4. Histogram dobijemo na sljedeći način > hist(rezultati) Histogram of rezultati Frequency 3 4 5 6 3 4 5 6 rezultati

. OPISNA STATISTIKA 9 Ako naredbu hist upotrijebimo bez dodatnih argumenata, onda se razredi odreduju automatski i možda nećemo dobiti željeni histogram, kao što vidimo na gornjem histogramu. > hist(rezultati,probability=true,breaks=c(.5,.5,.5,3.5,4.5,5.5,6.5), xlab="broj na kocki",ylab="relativne frekvencije",main="histogram",col="red") Histogram relativne frekvencije..5..5..5.3 3 4 5 6 broj na kocki Dodatnim argumentom prob=true dobijemo površinu histograma jednaku. Koristeći breaks=c(.5,.5,.5,3.5,4.5,5.5,6.5) odredujemo granice razreda i u ovom slučaju razredu odgovara točno jedna kvalitativna vrijednost te su na y-osi zaista relativne frekvencije. Možemo izračunati: aritmetičku sredinu > mean(rezultati) [] 3.6 uzoračku varijancu > var(rezultati) [].673684 mod Prvo trebamo definirati funkciju > statmod <- function(x) { + z <- table(as.vector(x)) + names(z)[z == max(z)] + } i tada je mod

. OPISNA STATISTIKA > statmod(rezultati) [] "3" raspon uzorka > max(rezultati)-min(rezultati) [] 5 medijan > median(rezultati) [] 3 Medijan možemo dobiti i preko funkcije quantile: > quantile(rezultati,.5,type=6) 5% 3 donji i gornji kvartil > quantile(rezultati,.5,type=6) 5% > quantile(rezultati,.75,type=6) 75% 5 ili sve zajedno > quantile(rezultati,type=6) % 5% 5% 75% % 3 5 6 interkvartil > IQR(rezultati) [] 3 dijagram pravokutnika > boxplot(rezultati)

. OPISNA STATISTIKA 3 4 5 6 Napomena: ( x (),q L,m,q U,x (n) ) se zove karakteristična petorka uzorka. Napomena: Pri formiranju dijagrama pravokutnika outlieri su sve vrijednosti koje su od donjeg ili gornjeg kvartila udaljene za više od 3 d q. Brkovi su najmanja i najveća vrijednost koje nisu outlieri. Outlieri se posebno naznačavaju na dijagramu pravokutnika. Primijetite da u prethodnom zadatku nema outliera. Zadatak. Na nekom fakultetu je odabran uzorak od 4 studenata i izmjerene su im visine: 4 88 75 76 77 68 6 8 83 87 87 6 84 6 8 69 95 7 7 99 8 69 89 9 7 8 83 78 8 65 85 5 83 87 88 8 63 79 78 88 (a) Odredite karakterističnu petorku uzorka. (b) Nacrtajte dijagram pravokutnika. Rješenje: (a) Uredimo podatke: 4 6 6 6 63 65 68 69 69 7 7 7 75 76 77 78 78 79 8 8 8 8 8 83 83 83 84 85 87 87 87 88 88 88 88 89 9 95 99 5

. OPISNA STATISTIKA Tada je n = 4, x () = 4, q L = x ( 4+ 4 ) = x (+ 4) = x () + 4 [x () x () ] = 7+ (7 7) = 7.5, 4 m = x ( 4+ ) = x (+ ) = x () + [x () x () ] = 8+ (8 8) = 8.5, q U = x ( 3(4+) 4 ) = x (3+ 4) = x 3 (3) + 3 4 [x (3) x (3) ] = 87+ 3 (87 87) = 87, 4 x (4) = 5. Karakteristična petorka je (4, 7.5, 8.5, 87, 5). (b) Interkvartil iznosi d q = q U q L = 87 7.5 = 6.75 pa je q L 3 d q = 45.5 i q U + 3 d q =.5. Dijagram pravokutnika: 5 87 8.5 7.5 6 4 Riješimo zadatak u R-u. Na www.math.hr/nastava/stat pronadite datoteku visine.dat i snimite je u radni direktorij. Učitajmo podatke iz datoteke: > visine<-read.table("visine.dat",header=false) > visine

. OPISNA STATISTIKA 3 V 4 88 3 75 4 76 5 77 6 68 7 6 8 8 9 83 87 87 6 3 84 4 6 5 8 6 69 7 95 8 7 9 7 99 8 69 3 89 4 9 5 7 6 8 7 83 8 78 9 8 3 65 3 85 3 5 33 83 34 87 35 88 36 8 37 63 38 79 39 78 4 88 Naredbom quantile dobijemo karakterističnu petorku uzorka:

4. OPISNA STATISTIKA > quantile(visine$v,type=6) % 5% 5% 75% % 4. 7.5 8.5 87. 5. Dijagram pravokutnika: > boxplot(visine$v) 4 5 6 7 8 9 Zadatak.3 U 5 država izmjerena je prosječna konzumacija alkohola jednog stanovnika tijekom jedne godine. Nacrtajte histogram dobivenih sljedećih podataka u litrama: 4.7 (Meksiko) 8.4 (SAD).8 (Španjolska). (Njemačka).9 (Madarska) 5.8 (Luksemburg) 7.9 (Japan) 9. (Australija).9 (Danska) 3. (Češka) 3.9 (Irska) 8. (Italija).6 (Francuska).8 (V. Britanija) 8.3 (Kanada) Rješenje: Sada imamo neprekidno statističko obilježje, tj. podaci dolaze iz [, +. Odredimo broj razreda. Uzmimo na primjer k = 6.

. OPISNA STATISTIKA 5 Odredimo širinu razreda. Vrijedi x (5) x () = 5.8 4.7 =.85. k 6 Ako dobijemo broj koji ima veći broj decimalnih mjesta od broja decimalnih mjesta na koji su zaokruženi podaci, onda za širinu razreda c uzimamo broj koji je za jednu značajnu decimalu veći. U ovom slučaju je c =.9. Odredimo granice razreda. One moraju biti odredene za jedno decimalno mjesto više (zbog jednoznačnog svrstavanja podataka u razrede). Frekvencijska tablica: Histogram: i I i f i r i r i /c x i [4.45, 6.35 /5.35 5.4 [6.35, 8.5 /5.7 7.3 3 [8.5,.5 3 3/5.5 9. 4 [.5,.5 6 6/5.. 5 [.5, 3.95 /5.7 3. 6 [3.95, 5.85 /5.35 4.9 Σ 5..5.7.35 5.4 7.3 9.. 3. 4.9 U R-u: > drzave<-c(4.7,8.4,.8,.,.9,5.8,7.9,9.,.9,3.,3.9,8.,.6,.8,8.3) > drzave [] 4.7 8.4.8..9 5.8 7.9 9..9 3. 3.9 8..6.8 8.3 > k<-6

6. OPISNA STATISTIKA > c<-round((max(drzave)-min(drzave))/k,) > c [].9 > hist(drzave,probability=true,breaks=seq(4.45,by=c,length=k+), +xlab="prosjecna konzumacija/l",ylab="relativne frekvencije", +main="drzave",col="green") drzave relativne frekvencije..5..5. 4 6 8 4 6 prosjecna konzumacija/l Zadatak.4 Mjereno je vrijeme života litijske baterija koja se upotrebljava u kalkulatorima. Dobiveni su sljedeći podaci u satima: 485 564 78 5 39 66 64 9 6 379 584 4 349 377 99 9 45 478 76 5 38 737 33 3894 58 49 85 46 66 38 98 56 7 497 3367 4 786 46 35 99 37 5 6 778 373 44 396 83 379 454

. OPISNA STATISTIKA 7 (a) Odredite stem and leaf dijagram. (b) Nacrtajte histogram podataka. Rješenje: (a) Stem and leaf dijagram: 39456785334767455334 44574433 567 3 7893 4 (b) Vrijedi n = 5, x () = 4, x (5) = 485. Za k = 7 x (5) x () k Frekvencijska tablica: = 485 4 7 = 6.4 c = 6. i I i f i r i r i /c x i [3.5, 64.5 3.46.75 39 [64.5, 35.5 7.4.3 93 3 [35.5, 846.5 9.8.9 54 4 [846.5, 457.5..3 5 5 [457.5, 368.5 4.8.3 763 6 [368.5, 3679.5..3 3374 7 [3679.5, 49.5 5..6 3985 Σ 5.

8. OPISNA STATISTIKA Histogram:.75.9.3.6.3.3 39 93 54 5 763 3374 3985 Riješimo zadataku R-u. Na www.math.hr/nastava/stat pronadite datoteku baterije.dat i snimite je u radni direktorij. > baterije<-read.table("baterije.dat",header=false) > baterije V 485 66 3 584 4 9 5 38 6 49 7 98 8 4 9 37 44 564 64 3 4 4 45 5 737 6 85 7 56

. OPISNA STATISTIKA 9 8 786 9 5 396 78 9 3 349 4 478 5 33 6 46 7 7 8 46 9 6 3 83 3 5 3 6 33 377 34 76 35 3894 36 66 37 497 38 35 39 778 4 379 4 39 4 379 43 99 44 5 45 58 46 38 47 3367 48 99 49 373 5 454 > n<-length(baterije$v) > n [] 5 > stem(baterije$v,scale=.5) The decimal point is 3 digit(s) to the right of the 33334445555566667779 344444568 678 3 4899

. OPISNA STATISTIKA 4 3 > k<-7 > c=ceiling((max(baterije$v)-min(baterije$v))/k) > c [] 6 > hist(baterije$v,probability=true,breaks=seq(3.5,by=c,length=k+), +xlab="trajanje baterije/sti",ylab="relativne frekvencije", +main="baterije",col="yellow") baterije relativne frekvencije e+ e 4 4e 4 6e 4 3 4 trajanje baterije/sti Zadatak.5 Izmjeren je kapacitet 485 istovrsnih kondenzatora. Rezultati mjerenja su izraženi u µf: i razred frekvencija 9.58-9.6 3 9.63-6.67 5 3 9.68-9.7 5 4 9.73-9.77 5 9.78-9.8 35 6 9.83-9.87 74 7 9.88-9.9 9 8 9.93-9.97 83 9 9.98 -. 7.3 -.7 54.8 -. 7.3 -.7 3.8 -. 4.3 -.7 3 Σ 485 (a) Izračunajte aritmetičku sredinu i standardnu devijaciju uzorka. (b) Izračunajte medijan te donji i gornji kvartil.

. OPISNA STATISTIKA Rješenje: Budući da nemamo točno izmjerene podatke, već samo razrede i pripadne frekvencije, aritmetičku sredinu i standardnu devijaciju računamo tako da umjesto y i promatramo sredine razreda x i. Kod računanja s u formuli možemo umjesto n uzeti n jer je n = 485 velik. Tada je x = n k f i x i i s = n k f i (x i x). Kako sredine razreda x i čine aritmetički niz, možemo pojednostavniti formule za x i s. Odaberemo referentnu vrijednost, najčešće uzmemo mod uzorka, ovdje x = 9.9. Stavimo d i = x i x c x i = x +cd i, i =,,...,k. Sada je x = n k f i x i = n x = c n k k f i d i +x, f i (x +cd i ) = c n k k f i d i +x f i n }{{} = ( ) s = k f i (x i x) = k f i x +cd i c k f j d j x = n n n j= ( ( ) = c k f i d i n k k f j d j )d i + f j d j = n n j= j= ( ) ( ) = c k f i d k k i f j d j + f j d j n n n j= j= ( ) s = c k f i d k i f j d j. n n j= (a) Vratimo se zadatku. Širina razreda je c =.5 i tablica frekvencija glasi:

. OPISNA STATISTIKA i I i f i d i f i d i f i d i r i x i F i [9.575, 9.65 3-6 -8 8.6 9.6.6 [9.65, 9.675 5-5 -5 5. 9.65.6 3 [9.675, 9.75 5-4 - 8. 9.7.6 4 [9.75, 9.775-3 -6 8.4 9.75.67 5 [9.775, 9.85 35 - -7 4.7 9.8.39 6 [9.85, 9.875 74 - -74 74.53 9.85.9 7 [9.875, 9.95 9.9 9.9.48 8 [9.95, 9.975 83 83 83.7 9.95.653 9 [9.975,.5 7 4 8.44..797 [.5,.75 54 3 6 486..5.98 [.75,.5 7 4 8 43.56..964 [.5,.75 5 6 3.5.5.989 3 [.75,.5 6 7.4..993 4 [.5,.75 3 7 47.7.5. Σ 485 39 57. Pri tome su F i kumulativne relativne frekvencije, odnosno Sada je F = r, F i = F i +r i, i =,...,k. x =.5 39 +9.9 = 9.93µF, 485 [ ( ) ] s =.5 57 39 485 =. s =.µf. 485 (b) Za m,q L i q U crtamo graf kumulativnih relativnih frekvencija (vidi sliku.) i onda m,q L i q U odredimo linearnom interpolacijom: m 9.95 9.975 9.95 =.5.48.653.48 q L 9.85 9.875 9.85 =.5.39.9.39 q U 9.975.5 9.975 =.75.653.797.653 m = 9.95+.5.8 = 9.93,.7 q L = 9.85+.5. = 9.86,.53 q U = 9.975+.5.97 =...44

. OPISNA STATISTIKA 3 F i.964.98.797.75.653.5.48.9.5.39.67.6.6 9.6 9.65 9.7 9.75 9.8 9.85 9.9 9.95.5..5..5 x Slika.: Graf kumulativnih relativnih frekvencija Zadatak.6 Pokažite da za varijancu uzorka x,...,x n vrijedi ( ) s = x i n nx. Rješenje: Po definiciji je s = n = n = n (x i x) = ( x n i x i x+x ) = ( ) x i x x i +nx ( ) x i nx. ( ) = x i n x nx+nx = Napomena: Ako u nizu ima više istovrsnih mjerenja tako da se vrijednosti y,...y k

4. OPISNA STATISTIKA pojavljuju s frekvencijama f,...,f k, onda iz.6 slijedi s = ( k ) f i yi nx, gdje je x = f + +f k f + +f k k f i y i. Zadatak.7 Pokažite da je aritmetička sredina podataka x,...,x n jedinstveni broj u kojem funkcija v: R R, v(µ) = (x i µ) postiže minimum. Rješenje: Neka je µ R. v(µ) = = = v(µ) = (x i µ) = (x i x) + [(x i x)+(x µ)] = (x i x)(x µ)+ (x µ) = ( ) (x i x) +(x µ) x i nx +n(x µ) (x i x) +n(x µ) }{{} }{{} = (x i x) = v(x) Dakle, funkcija v postiže minimum u µ = x. Nadalje, Stoga je točka minimuma jedinstvena. v(µ) = v(x) n(x µ) = x = µ. Zadatak.8 Ako su podaci dobiveni afinom transformacijom y i = ax i +b, i =,...,n, a, podataka x,...,x n, pokažite da je aritmetička sredina transformiranih podataka jednaka y = ax+b, a uzoračka varijanca s (y) = a s. Rješenje: Aritmetička sredina je y = n y i = n (ax i +b) = a n x i + nb = ax+b, n

. OPISNA STATISTIKA 5 a uzoračka varijanca s (y) = n = n = a ( ) yi ny a x i +ab [ ] = (ax i +b) n(ax+b) = n x i }{{} =nx ( ) x i n nx = a s. +nb na b abnx nb = Napomena: Za standardnu devijaciju slijedi s(y) = s (y) = a s = a s. Zadatak.9 (Čebievljevanejednakost)Nekajex,...,x n skuppodatakaiε >. Pokažite da tada vrijedi: Rješenje: Vrijedi s = n n #{i: x i x ε} (n )s ε. (x i x) = n {i: x i x ε} #{i: x i x ε} (n )s ε. {i: x i x ε} (x i x) }{{} ε + ε = n #{i: x i x ε} ε n {i: x i x <ε} (x i x) }{{} Zadatak. Neka je x,...,x n skup podataka. Tada postoji jedinstveni broj m R koji minimizira funkciju d(µ) = x i µ ako i samo ako je n neparan ili je n = l i vrijedi x (l) = x (l+). Rješenje: Poredajmo podatke: x () x ()... x (n). Ako je µ x (), onda je d(µ) = x i µ = (x (i) µ) = x (i) nµ.

6. OPISNA STATISTIKA Ako je µ x (n), onda je d(µ) = x i µ = (µ x (i) ) = nµ Ako je x (k) µ x (k+), za neki k n, onda je x (i). d(µ) = = k x (i) µ = x (i) µ + x (i) µ = k (µ x (i) )+ i=k+ (x (i) µ) = (k n)µ k x (i) + x (i). i=k+ i=k+ Sada možemo skicirati grafove funkcije d za n neparan i n paran. Ako je n = l, iz slike. vidimo da je jedinstveni minimum funkcije m = x (l). Ako je n = l, iz slike.3 vidimo da funkcija d poprima minimum za sve µ [x (l),x (l+) ] pa je minimum m jedinstven ako i samo ako je x (l) = x (l+). x x x l x l x l x n x n Slika.: Graf funkcije d za n=l-.

. OPISNA STATISTIKA 7 x x x l x l x l x l x n x n Slika.3: Graf funkcije d za n=l. Pretpostavimo da imamo dvodimenzionalno obilježje dano kontingencijskom tablicom: X\Y b b b c Σ a f f f c f a f f f c f..... a r f r f r f rc f r Σ g g g c n Mjera statističke nezavisnosti obilježja je definirana sa Zadatak. Pokažite da je f := n r c j= (nf ij f i g j ) f i g j. (a) f = r c j= f ij f i g j, (b) f min{r,c}, (c) f = min{r,c} ako i samo ako je r c (r c) i u svakom retku (stupcu) kontingencijske tablice je točno jedna frekvencija različita od nule.

8. OPISNA STATISTIKA Rješenje: (a) f = n r = n ( r = r c j= c j= (nf ij f i g j ) f i g j = c j= f ij f i g j n n f ij f i g j r r c j= c j= f ij }{{} =n nf ij f i g j f i g j + + n ( r }{{} =n r c j= )( c f i j= }{{} =n ) (f i g j ) = f i g j ) r g j = c j= f ij f i g j. (b) Očito je f. r r c j= c j= f ij f i g j = f ij f i g j = r r c j= c j= Dakle, f min{r,c}. (c) Pretpostavimo da je r c. f ij f i }{{} f ij f ij g j f ij f i g }{{} j c r f ij g j= j r f i }{{} =g j c j= f ij }{{} =f i = c f c = r f r Ako u nekom retku i postoje barem dvije frekvencije različite od nula, tada je f i j < f i, za svaki j =,...,c pa vrijedi f = < r r c j= f ij f i g j = c,i i j= f ij g j + r c,i i j= c j= f ij g j = f ij f }{{} i c f ij g j + r c j= f ij g j= j }{{} =g j f i j f i }{{} < f ij g j = c = min{r,c}. Neka je u svakom retku točno jedna frekvencija različita od nula. Označimo ih

. OPISNA STATISTIKA 9 sa f j,f j,...,f rjr. Tada vrijedi f i = f iji, za svaki i =,...,r, pa je f = = r r c j= c k= f ij f i g j = f ik g k = Slučaj r c se pokazuje na isti način. r c f ij i f i g ji = r f ik g k k= }{{} =g k r f iji g ji = = c = min{r,c}. Napomena: f = min{r,c} postoji funkcijska veza izmedu obilježja. Zadatak. U cilju istraživanja imaju li muškarci i žene isti stav prema boksu, anketirano je 35 osoba i dobiveni su sljedeći podaci: (a) Odredite marginalne distribucije. spol \ stav pozitivan negativan ravnodušan muškarci 3 4 3 žene 4 8 8 (b) Izračunajte stupanj statističke zavisnosti. Rješenje: (a) Vrijedi spol \ stav pozitivan negativan ravnodušan Σ muškarci 3 4 3 žene 4 8 8 5 Σ 7 58 35 Marginalne distribucije su: f =,f = 5,g = 7,g =,g 3 = 58. (b) Mjera statističke nezavisnosti obilježja iznosi f = r c j= f ij f i g j = = 3 7 + 4 + 3 58 + 4 5 7 + 8 5 + 8 5 58 = =.495745.

3. OPISNA STATISTIKA Stupanj statističke zavisnosti je o = f min{r,c} =.495745 min{,3} =.495745, tj. oko 4.95% pa je statistička zavisnost stava o boksu i spola slaba. U R-u: > r<- > c<-3 > spol<-matrix(c(3,4,3,4,8,8),nrow=r,ncol=c,byrow=t) > spol [,] [,] [,3] [,] 3 4 3 [,] 4 8 8 > sume_stupaca<-colsums(spol) > sume_redaka<-rowsums(spol) > sume_stupaca [] 7 58 > sume_redaka [] 5 > marginalne<-matrix(kronecker(sume_redaka,sume_stupaca),nrow=r,ncol=c,byrow=t) > marginalne [,] [,] [,3] [,] 344 4 6 [,] 58 8 87 > f<-sum(spol^/marginalne)- > f [].495745 > o=f/(min(r,c)-) > o [].495745 Zadatak.3 Visine i udaljenosti koje su bile potrebne za osvajanje zlatne medalje na olimpijskim igrama u disciplinama skoka u vis i bacanju diska za atletičare dane su u metrima u sljedećoj tablici. Odredite uzoračku kovarijancu i Pearsonov koeficijent korelacije.

. OPISNA STATISTIKA 3 godina skok u vis bacanje diska 896.8 9.5 9.9 36.4 94.8 39.8 96.775 4.46 98.95 4.89 9.93 45. 9.935 44.685 94.98 46.55 98.94 47.3 93.97 49.49 936.3 5.48 948.98 5.78 95.4 55.3 godina skok u vis bacanje diska 956. 56.36 96.6 59.8 964.8 6. 968.4 64.78 97.3 64.4 976.5 67.5 98.36 66.64 984.35 66.6 988.38 68.8 99.34 65. 996.39 69.4.35 69.3 4.36 69.89 Rješenje: Stavimo X=visina u skoku u vis, Y =udaljenost u bacanju diska. i x i y i x i yi x i y i.8 9.5 3.76 849.73 5.765.9 36.4 3.6 98.88 68.476 3.8 39.8 3.4 54.9 7.74 4.775 4.46 3.563 78.93 73.595 5.95 4.89 3.693 67.99 77.8955 6.93 45. 3.749 43.94 87.553 7.935 44.685 3.7443 996.75 86.4655 8.98 46.55 3.94 3.8 9.3869 9.94 47.3 3.7636 39.8 9.88.97 49.49 3.889 449.6 97.4953.3 5.48 4.9 548.3.474.98 5.78 3.94 785.73 4.54 3.4 55.3 4.66 38.3.6 4. 56.36 4.4944 376.45 9.483 5.6 59.8 4.6656 35.7 7.89 6.8 6. 4.754 37. 3.98 7.4 64.78 5.76 496.45 45.7 8.3 64.4 4.979 447.36 43.6 9.5 67.5 5.65 4556.5 5.875.36 66.64 5.5696 444.89 57.7.35 66.6 5.55 4435.56 56.5.38 68.8 5.6644 4736.9 63.79 3.34 65. 5.4756 44.6 5.38 4.39 69.4 5.7 486.36 65.866 5.35 69.3 5.55 48.49 6.855 6.36 69.89 5.5696 4884.6 64.94 Σ 54.75 46.96 6.44 896.6 36.573

3. OPISNA STATISTIKA Radi se o dvodimenzionalnom neprekidnom statističkom obilježju. Iz prethodne tablice slijedi n = 6,x =.4,y = 54.883 i vrijedi S XX = S YY = S XY = (x i x) = (y i y) = x i nx = 6.44 6.4 =.43, yi ny = 896.6 6 54.883 = 3644.669, (x i x)(y i y) = Dakle, uzoračka kovarijanca je C(X,Y) = n x i y i nxy = 36.573 6.4 54.883 = 59.93. Nadalje, Pearsonov koeficijent korelacije je pa su X i Y pozitivno korelirane. Riješimo zadatak u R-u. r XY = Pronadite datoteku olimpijade.dat na (x i x)(y i y) = n S XY =.368. S XY SXX S YY =.96 http://www.math.hr/nastava/stat/vjezbe.html i spremite je u radni direktorij. U datoteci su podaci o visinama i udaljenostima koje su bile potrebne za osvajanje zlatne medalje na olimpijskim igrama od 896. godine. Učitajmo podatke: > olimp<-read.table("olimpijade.dat",header=true) > olimp godina skok_u_vis bacanje_diska 896.8 9.5 9.9 36.4 3 94.8 39.8 4 96.775 4.46 5 98.95 4.89 6 9.93 45. 7 9.935 44.685 8 94.98 46.55 9 98.94 47.3 93.97 49.49

. OPISNA STATISTIKA 33 936.3 5.48 948.98 5.78 3 95.4 55.3 4 956. 56.36 5 96.6 59.8 6 964.8 6. 7 968.4 64.78 8 97.3 64.4 9 976.5 67.5 98.36 66.64 984.35 66.6 988.38 68.8 3 99.34 65. 4 996.39 69.4 5.35 69.3 6 4.36 69.89 Tada je Pearsonov koeficijent korelacije > cor(olimp$skok_u_vis,olimp$bacanje_diska,method="pearson") [].96989 Drugi način: > attach(olimp) > SXX=sum((skok_u_vis-mean(skok_u_vis))^) > SYY=sum((bacanje_diska-mean(bacanje_diska))^) > SXY=sum((skok_u_vis-mean(skok_u_vis))*(bacanje_diska-mean(bacanje_diska))) > pearsonov_koef<-sxy/sqrt(sxx*syy) > pearsonov_koef [].96989 Zadatak.4 Pokažite da je Pearsonov koeficijent korelacije podataka (x,y ),...,(x n,y n ) jednak uzoračkoj kovarijanci standardiziranih podataka ( x x s x, y ) ( y xn x,...,, y ) n y. s y s x s y

34. OPISNA STATISTIKA Rješenje: Ako stavimo x i = x i x i y i = y i x za i =,...,n, uzoračka kovarijanca s x s x standardiziranih podataka je jednaka S X Y = (x i x n )(y i y ) = ( xi x x x )( yi y y y ) = n s x s x s y s y = (x i x)(y i y) = s x s y n n S S XY XY = = r XY. SXX S YY S XX n S Y Y n Zadatak.5 Pokažite da je Pearsonov koeficijent korelacije invarijantan na afine transformacije s istim predznakom koeficijenata smjera, odnosno ako su a,b,c,d R,a c, onda je r ax+b,cy+d = sgn(ac)r XY. Rješenje: Prema zadatku.8 vrijedi r ax+b,cy+d = S ax+b,cy+d SaX+b,aX+b S cy+d,cy+d = = = n n (ax i +b (ax+b))(cy i +d (cy +d)) = (ax i +b (ax+b)) n j= (cy j +d (cy +d)) ac n (x i x)(y i y) a c = n (x i x) n j= (y j y) = acs XY ac S XX S YY = sgn(ac)r XY. Zadatak.6 Aproksimirajte podatke (x,y ),...,(x n,y n ) pravcem y = α+βx metodom najmanjih kvadrata, tj. odredite točku (ˆα, ˆβ) R u kojoj funkcija L(α,β) = (α+βx i y i ),α,β R ima jedinstveni globalni minimum. Napomena: Ako je x = x = = x n, onda je traženi pravac x = x. Rješenje: Pretpostavimo da su barem dvije vrijednosti x i -ova različite. Iz α L = (α+βx i y i ) i β L = (α+βx i y i )x i,

. OPISNA STATISTIKA 35 nužan uvjet za lokalni ekstrem (ˆα, ˆβ) glasi odakle je ˆα (ˆα+ ˆβx i y i ) = (ˆα+ ˆβx i y i )x i = ˆαn+ ˆβ x i + ˆβ x i x i y i = x i y i = ˆαn+ ˆβnx ny = / x ˆαnx+ ˆβ(S XX +nx ) (S XY +nxy) = ˆβ = S XY S XX i ˆα = y ˆβx. Provjerimo sada dovoljan uvjet. Hesseova matrica glasi HL(ˆα, ˆβ) α L(ˆα, ˆβ) α β L(ˆα, ˆβ) n n x i = = β α L(ˆα, ˆβ) β L(ˆα, ˆβ) n x i. n x i Vrijedi n > i n n n x i n x i x i = 4n ( ) x i 4 x i > zbog aritmetičko-kvadratne nejednakosti i pretpostavke s početka. Stoga, prema Sylvesterovom kriteriju, funkcija L ima u točki (ˆα, ˆβ) strogi lokalni minimum. Budući da je jedina stacionarna točka, (ˆα, ˆβ) je jedinstveni globalni minimum. Zadatak.7 Za podatke iz zadatka.3 procijenite metodom najmanjih kvadrata visinu u skoku u vis i udaljenost u bacanju diska potrebne za osvajanje zlatne medalje na olimpijskim igrama u Pekingu 8. godine. Rješenje: (a) Stavimo X = vrijeme (godine) i Y = visina u skoku u vis (m). Tablica podataka:

36. OPISNA STATISTIKA i x i y i x i x i y i 896.8 359486 343.76 9.9 36 36. 3 94.8 3656 347. 4 96.775 363836 3383.5 5 98.95 364464 3634.74 6 9.93 3655744 369.6 7 9.935 36864 375. 8 94.98 37776 389.5 9 98.94 37784 374.3 93.97 37364 386.4 936.3 374896 393.8 948.98 379474 3857.4 3 95.4 3834 398.8 4 956. 385936 446.7 5 96.6 3846 433.6 6 964.8 385796 48.5 7 968.4 38734 448.3 8 97.3 3888784 4397.56 9 976.5 394576 4446. 98.36 394 467.8 984.35 393656 466.4 988.38 39544 473.44 3 99.34 396864 466.8 4 996.39 39846 477.44 5.35 4 47. 6 4.36 466 479.44 Σ 576 54.75 989876 6858.8 Slijedi n = 6,x = 95.3,y =.438 pa je S XX = S XY = x i nx = 989876 6 95.3 = 9874.6, x i y i nxy = 6858.8 6 95.3.438 = 7.4358. Prema prethodnom zadatku je Stoga je traženi pravac ˆβ = S XY S XX =.57385 i ˆα = y ˆβx = 9.8738. y = 9.8738 +.57385x pa je procjena visine u skoku uvis za olimpijske igre 8. godine y(8) =.436m. (b) Stavimo X = vrijeme (godine) i Y =udaljenost u bacanju diska (m). Tablica podataka:

. OPISNA STATISTIKA 37 i x i y i x i x i y i 896 9.5 359486 5568.4 9 36.4 36 68476. 3 94 39.8 3656 74789. 4 96 4.46 363836 79.76 5 98 4.89 364464 788. 6 9 45. 3655744 8644.5 7 9 44.685 36864 85795. 8 94 46.55 37776 888. 9 98 47.3 37784 93.96 93 49.49 37364 9564.68 936 5.48 374896 9779.8 948 5.78 379474 85.44 3 95 55.3 3834 748.56 4 956 56.36 385936 4.6 5 96 59.8 3846 599.8 6 964 6. 385796 984. 7 968 64.78 38734 7487.4 8 97 64.4 3888784 6996.8 9 976 67.5 394576 3338. 98 66.64 394 3947. 984 66.6 393656 334.4 988 68.8 39544 3684.6 3 99 65. 396864 979.4 4 996 69.4 39846 385.4 5 69.3 4 386. 6 4 69.89 466 459.56 Σ 576 46.96 989876 793 Dakle, n = 6,x = 95.3,y = 54.883 i vrijedi S XX = S XY = x i nx = 989876 6 95.3 = 9874.6, x i y i nxy = 793 6 95.3 54.883 =.5. Sada je ˆβ = S XY S XX =.3438 i ˆα = y ˆβx = 6.38. Traženi pravac je y = 6.38 +.3438x, a procjena y(8) = 74.647m. U R-u: Pogledajmo kako se visina u skoku u vis mijenjala s godinama: > plot(godina,skok_u_vis)

38. OPISNA STATISTIKA skok_u_vis.8.9....3.4 9 9 94 96 98 godina Procjena za 8. godinu metodom najmanjih kvadrata: > n=length(godina) > SXX<-sum(godina^)-n*mean(godina)^ > SXY<-sum(godina*skok_u_vis)-n*mean(godina)*mean(skok_u_vis) > beta<-sxy/sxx > alpha=mean(skok_u_vis)-beta*mean(godina) > f<-function(t) + alpha+beta*t > f(8) [].435548 Pogledajmo kako pravac opisuje podatke: > plot(godina,skok_u_vis) > abline(c(alpha,beta))

. OPISNA STATISTIKA 39 skok_u_vis.8.9....3.4 9 9 94 96 98 godina Do pravca regresije možemo doći i koristeći naredbu lm(podaci~podaci): > regr<-lm(skok_u_vis~godina) > regr Call: lm(formula = skok_u_vis ~ godina) Coefficients: (Intercept) godina -9.8738.5739 > plot(godina,skok_u_vis) > abline(regr$coefficients) Zadatak.8 U tablici su prikazane eksperimentalne vrijednosti tlaka nekog plina konstantne mase koje odgovaraju različitim volumenima V. volumen (V/m 3 ).543.68.74.887.86.94 tlak (p/pa).6.49.376.84.9. Iz termodinamike je poznata jednadžba pv γ = C, gdje su γ i C konstante.

4. OPISNA STATISTIKA (a) Odredite konstante γ i C. (b) Odredite p za V = m 3. Rješenje: Logaritmiranjem jednadžbe pv γ = C slijedi lnp = lnc γlnv. Stavimo li x = lnv,y = lnp,α = lnc i β = γ, dobivamo pravac y = α+βx. Procijenimo sada α i β metodom najmanjih kvadrata. Podaci su dani sljedećom tablicom: i x i y i x i x i y i -.66 -.49.378.998 -.48 -.79.36.343 3 -.39 -.978.43.359 4 -.99 -.587.43.59 5.75 -.65.9 -.85 6.666 -.96.439 -.593 Σ -.753-7.384.945 -.69768 pa je n = 6,x =.699,y =.3 i vrijedi S XX = S XY = x i nx =.945 6 (.699) =.943, x i y i nxy =.69768 6 (.699) (.3) =.55564. Prema zadatku.6 je i traženi pravac y =.39.4x. ˆβ = S XY S XX =.4 i ˆα = y ˆβx =.39 (a) Za konstante γ i C vrijedi ˆα = lnc i ˆβ = γ pa je C = eˆα =.5 i γ = ˆβ =.4. Dakle, plin zadovoljava jednadžbu pv.4 =.5. (b) Za V = m 3 iz dobivene jednadžbe slijedi p.4 =.5 p =.5.

. OPISNA STATISTIKA 4. Zadaci za vježbu.9 Izabran je slučajan uzorak od 33 osobe koje slušaju radio i zabilježeno koliko sati slušaju radio tjedno. Podaci su sljedeći: 9 8 7 4 8 6 8 8 7 8 6 7 7 8 9 6 5 8 5 6 8 7 8 5 5 8 7 6 6 4 5 (a) Nacrtajte histogram relativnih frekvencija. (b) Odredite aritmetičku sredinu, mod i medijan uzorka. (c) Odredite varijancu i standardnu devijaciju uzorka. (d) Odredite raspon uzorka. (e) Odredite donji i gornji kvartil te interkvartil uzorka. (f) Nacrtajte dijagram pravokutnika ( box and whisker plot ).. Pet novčića smo bacali puta i zabilježili dobiveni broj glava. Broj bacanja u kojima je palo,,, 3, 4 i 5 glava dan je u sljedećoj tablici: broj glava broj bacanja 38 44 34 3 87 4 64 5 5 Σ (a) Nacrtajte histogram podataka. (b) Odredite aritmetičku sredinu, varijancu i standardnu devijaciju uzorka.. Izabran je slučajan uzorak od 4 brucoša nekog fakulteta i zabilježeno koliko minuta gledaju televiziju tjedno. Podaci su dani u sljedećoj tablici:

4. OPISNA STATISTIKA (a) Nacrtajte histogram podataka. vrijeme gledanja broj studenata 3-399 4 4-499 46 5-599 58 6-699 76 7-799 68 8-899 6 9-999 48-99 - 99 6 Σ 4 (b) Izračunajte aritmetičku sredinu i standardnu devijaciju uzorka. (c) Izračunajte medijan te donji i gornji kvartil.. Dokažite da je x jedinstveni minimum funkcije v iz zadatka.7 koristeći prvu i drugu derivaciju..3 Od grupe pacijenata koji su se žalili na probleme sa spavanjem nekima je dana tableta za spavanje dok je drugima dana tableta sa šećerom (makar su svi mislili da su dobili tabletu za spavanje). Kasnije su upitani je li im tableta pomogla ili ne. Dobiveni su sljedeći podaci: Spavali dobro Nisu spavali dobro Uzeli tabletu za spavanje 44 Uzeli tabletu sa šećerom 8 35 (a) Odredite marginalne distribucije. (b) Izračunajte stupanj statističke zavisnosti..4 Bez upotrebe Hesseove matrice dokažite da je točka (ˆα, ˆβ) iz zadatka.6 jedinstveni globalni minimum funkcije L..5 Uzimajući u obzir podatke iz zadatka.3 samo od 896. do 988. godine, odredite Pearsonov koeficijent korelacije i uzoračku kovarijancu. Nadalje, procijenite metodom najmanjih kvadrata visinu u skoku u vis i udaljenost u bacanju diska potrebne za osvajanje zlatne medalje na olimpijskim igrama u Pekingu 8. godine, te usporedite dobiveni rezultat sa zadatkom.7. Rješenja:.9. (a) Vidi sliku.4. (b) x = 6.9394, mod=8, m=7 (c) s =.496, s =.5799 (d) R = 6 (e) g L = 6,q U = 8,d q = (f) Vidi sliku.5... (a) Vidi sliku.6. (b) x =.47,s =.443, s =.55.. (a) Vidi sliku.7. (b) x = 75,s = 9.3953 (c) Vidi sliku.8: m = 78.34, q L = 568.466, q U = 86.79..3. (a) f = 54,f = 6,g = 5,g = 45 (b) o =.54.5. Za X=visina i Y =udaljenost je r XY =.954, C(X,Y ) =.3447. Procjena visine je.45465, a udaljenosti 77.36.

. OPISNA STATISTIKA 43.33.88.55.66 4 5 6 7 8 9 Slika.4: Histogram relativnih frekvencija za zadatak.9. 8 7 6 4 Slika.5: Dijagram pravokutnika za zadatak.9.

44. OPISNA STATISTIKA.34.87.64.44.38.5 3 4 5 Slika.6: Histogram relativnih frekvencija za zadatak...9.7.55.45..5.55.35.5 349.5 449.5 549.5 649.5 749.5 849.5 949.5 49.5 49.5 Slika.7: Histogram relativnih frekvencija za zadatak..

. OPISNA STATISTIKA 45.985.93.8.75 x 349.5 449.5 549.5 649.5 m 749.5 849.5 949.5 49.5 49.5.655.5.485.95.5.5.35 F i Slika.8: Graf kumulativnih frekvencija za zadatak..

46. OPISNA STATISTIKA

Neprekidne slučajne varijable Definicija: Neka je (Ω,F,P) vjerojatnosni prostor. Funkcija X: Ω R je slučajna varijabla ako za sve a,b R, a < b vrijedi Funkciju F = F X : R [,] definiranu sa {a X b} F. F(a) := P(X a), a R zovemo funkcija distribucije slučajne varijable X. Napomena: Primjetite da je {X a} = { n X a} F n= pa je funkcija distribucije dobro definirana. Definicija: Slučajna varijabla X je neprekidna slučajna varijabla ako postoji nenegativna (izmjeriva) funkcija f: R R takva da je P(a X b) = b a f(x)dx, za sve a,b R, a < b. Funkciju f zovemo (vjerojatnosna) funkcija gustoće slučajne varijable X. Napomena: (a) Vrijedi ( ) F(x) = P(X x) = P { n X x} = n= = lim P( n X x) = lim n n x n f(t)dt = x f(t)dt. 47

48. NEPREKIDNE SLUČAJNE VARIJABLE Dakle, F(x) = x f(t)dt. f(t)dt, da bi funkcija f bila vjerojat- x (b) Zbog = lim F(x) = lim f(t)dt = x + x + nosna funkcija gustoće, mora vrijediti (i) f(x), x R, (ii) f(t)dt =. (c) P(X = a) = (d) Vrijedi a a f(t)dt = P(a < X b) = P({X b}\{x a}) = P({X b}) P({X a}) = F(b) F(a). Slijedi P(a X b) = P(X = a)+p(a < X b) = P(a < X b) = F(b) F(a). Analogno dobijemo P(a X < b) = P(a < X < b) = F(b) F(a). Definicija: Neka je X neprekidna slučajna varijabla s gustoćom f. Ako nepravi integral + x f(x)dx konvergira, onda broj EX := + xf(x)dx zovemo (matematičko) očekivanje slučajne varijable X i kažemo da slučajna varijabla X ima očekivanje. Napomena: Ako je g: R R (izmjeriva) funkcija, onda je i g(x) slučajna varijabla i vrijedi + E[g(X)] := g(x)f(x) dx. Definicija: Za r N sa M r := E[X r ] definiramo r-ti moment slučajne varijable X ukoliko očekivanje postoji. Ako postoji drugi moment slučajne varijable X, onda definiramo varijancu slučajne varijable X sa VarX := E[(X EX) ] = E[X ] (EX). Broj σ := VarX zovemo standardna devijacija slučajne varijable X.

. NEPREKIDNE SLUČAJNE VARIJABLE 49. Normalna distribucija Definicija: Slučajna varijabla X ima normalnu distribuciju s parametrima µ i σ > ako joj je funkcija gustoće Pišemo: X N(µ,σ ) Zadatak. Neka je X N(µ,σ ). (a) Pokažite da je X dobro definirana. f(x) = σ (x µ) π e σ, x R. (b) Izračunajte prvi moment, drugi moment i varijancu od X. Rješenje: (a) Trebamo pokazati da je pripadna funkcija f vjerojatnosna funkcija gustoće: (i) f(x), x R. (ii) Vrijedi + Izračunajmo I := f(x)dx = σ π + I = I I = e t dt. ( + + e (x µ) ) e t dt σ dx = ( + { } t = x µ σ dt = dx = + e t dt. σ π e t dt ) = {Fubinijev teorem} = = = + + π I = π e s +t dsdt = re r drdϕ = π + s = rcosϕ t = rsinϕ s +t = r = J = cosϕ rsinϕ sinϕ rcosϕ = r re r dr = π( e r ) = π f(x)dx = π I =.

5. NEPREKIDNE SLUČAJNE VARIJABLE (b) EX = + xf(x)dx = σ π + xe (x µ) σ dx = = + µ (µ+σt)e t dt = π π + e t dt { } t = x µ σ dt = dx = σ + σ π + te t dt = µ VarX = E[(X µ) ] = = + }{{} = π (x µ) f(x)dx = σ π + }{{} = jer je t te t neparna funkcija na simetričnoj domeni (x µ) e (x µ) σ dx = { } t = x µ + { σ dt = dx = σ u = t du = dt t e t dt = σ π dv = te t v = e t π ( te t ) + = σ }{{} = + σ π E[X ] = VarX +(EX) = σ +µ. + e t dt = σ. }{{} = π } = Zadatak. Neka je X N(µ,σ ). Pokažite da je X µ σ Rješenje: Stavimo Y := X µ. σ ( X µ F Y (x) = P(Y x) = P σ = µ+σx σ e (x µ) σ dt = π Y N(,). N(,). ) x = P(X µ+σx) = { } s = t µ σ ds = dt = x e s ds σ π Napomena: Funkciju distribucije jedinične normalne razdiobe označavamo sa Φ(x) = x π e t dt.

. NEPREKIDNE SLUČAJNE VARIJABLE 5 Vrijedi Φ( x) = Φ(x). Zadatak.3 Neka je X N(µ,σ ). Izračunajte Rješenje: Zbog X µ σ Slijedi P( X µ kσ), za k =,,3. N(,) je P( X µ kσ) = P( kσ X µ kσ) = P = Φ(k) Φ( k) = Φ(k). ( k X µ ) k = σ P( X µ σ) = Φ().843 =.686, P( X µ σ) = Φ().977 =.9544, P( X µ 3σ) = Φ(3).9987 =.9974. Zadatak.4 Neka je Y N(, 4). Izračunajte vjerojatnost da jednadžba 4x +4Yx+Y + = ima samo realna rješenja. Rješenje: Zbog µ = i σ = je Y ako je diskriminanta N(, ). Jednadžba ima samo realna rješenja D = (4Y) 4 4(Y +), Y Y, (Y +)(Y ). Tražena vjerojatnost je P(D ) = P((Y +)(Y ) ) = P({Y } {Y }) = {σ aditivnost} = ( Y = P(Y )+P(Y ) = P ) ( Y +P ) = = Φ( )+( Φ(/)) = Φ()+ Φ(/).843+.695 =.467.

5. NEPREKIDNE SLUČAJNE VARIJABLE. Eksponencijalna distribucija Definicija: Slučajna varijabla X ima eksponencijalnu distribuciju s parametrom λ > ako joj je funkcija gustoće Pišemo: X Exp(λ). f(x) = { λe λx, x >, inače = λe λx ½,+ (x). Zadatak.5 Neka je X Exp(λ). (a) Pokažite da je X dobro definirana. (b) Odredite funkciju distribucije slučajne varijable X. (c) Izračunajte EX,E[X ] i VarX. Rješenje: (a) (i) f(x), x R. + (ii) f(x)dx = λ + e λx dx = λ ( λ ) + e λx =. (b) P(X ) = f(x)dx = X > (g.s.) x F(x) = P( X }{{} > }{{}) = P( ) =. x x > F(x) = P(X x) = x x f(t)dt = λ = λ ( λ ) x e λt = e λx. e λt dt = F(x) = { e λx, x >, x.

. NEPREKIDNE SLUČAJNE VARIJABLE 53 (c) EX = E[X ] = + xf(x)dx = λ = ( xe λx) + + }{{} + = + + x f(x)dx = λ { } u = x du = dx xe λx dx = dv = e λx dx v = = λ e λx e λx dx = + λ λ e λx dx = λ, + = ( x e λx) + + }{{} = } {{ } = { } u = x x e λx du = xdx dx = dv = e λx dx v = = λ e λx + VarX = E[X ] (EX) = λ ( λ xe λx dx = + λ λ xe λx dx = λ, ) = λ. } {{ } =EX.3 Γ-distribucija Definicija: Γ-funkcija je funkcija Γ:,+ R definirana sa Γ(x) := t x e t dt. Zadatak.6 Pokažite sljedeća svojstva Γ-funkcije: (a) Γ(x+) = xγ(x), za x >. (b) Γ() =, Γ(n+) = n!, za n N. (c) Γ( ) = π, Γ( 3 ) = π. Rješenje:

54. NEPREKIDNE SLUČAJNE VARIJABLE (a) Γ(x+) = t x e t dt = = t x e t +x { } u = t x du = xt x dx dv = e t v = e t = dt t x e t dt = xγ(x). (b) Γ() = e t dt = e t =, Γ(n+) (a) = nγ(n) (a) = n(n )Γ(n ) = = n!γ() = n!. (c) Γ Γ ( ) = = { } t e t t = u dt = = dt = udu ( ) 3 (a) = ( ) Γ = e u du = π. + e u du }{{} = π u u e udu = = π, Definicija: Slučajna varijabla X ima Γ-distribuciju s paramerima α > i β > ako joj je funkcija gustoće f(x) = Γ(α)β α xα e x β, x > =, inače Γ(α)β α xα e x β ½, (x). Pišemo: X Γ(α,β). Napomena: X Exp(λ) f X (x) = λe λ ½, (x) = x Γ() /λ e /λ ½, (x) X Γ(,/λ). Zadatak.7 Neka je X Γ(α,β).

. NEPREKIDNE SLUČAJNE VARIJABLE 55 (a) Pokažite da je X dobro zadana. (b) Izračunajte EX i Var X. Rješenje: (a) (i) f(x), x R. (b) (ii) + EX = E[X ] = f(x)dx = + Γ(α)β α xf(x)dx = + Γ(α)β α x α e x β dx = { t = x β dt = dx β + } = Γ(α) x x α e x β dx = Γ(α)β α + = Γ(α+)βα+ x (α+) e x Γ(α)β α Γ(α+)β α+ β dx } {{ } = + x f(x)dx = Γ(α)β α + = Γ(α+)βα+.6 = (α+)αγ(α)β Γ(α)β α Γ(α) x x α e x β dx = Γ(α)β α = α(α+)β, t α e t dt =. } {{ } =Γ(α) + x α e x β dx =.6 = β αγ(α) Γ(α) = αβ, + x α+ e x β dx = VarX = E[X ] (EX) = α(α+)β (αβ) = αβ..4 χ -distribucija Definicija: Slučajna varijabla X ima χ -distribuciju s n stupnjeva slobode ako je X Γ ( n,). Dakle, x n f(x) = Γ( n e x, x > )n = x n, inače Γ( n e x ½,+ (x). )n Pišemo: X χ (n).

56. NEPREKIDNE SLUČAJNE VARIJABLE Zadatak.8 Neka je X N(,). Odredite distribuciju slučajne varijable Y = X. Rješenje: x < F Y (x) = P(Y x) = P( X }{{} x }{{}) = P( ) =. < x F Y (x) = P(Y x) = P(X x) = P( X x) = Y χ (). = P( x X x) = π = π = x x Γ( ) x x { } t = u e t dt = dt = du u x u e u du = e t dt = = x π Γ( ) e u du u = u e u ½,+ (u)du..5 Studentova t-distribucija Definicija: Slučajna varijabla ima (Studentovu) t-distribuciju s n stupnjeva slobode ako joj je gustoća f(x) = Γ ( ) n+ nπ Γ ( ) n (. + x )n+ n Pišemo: X t(n). Napomena: Slučajna varijabla X ima Cauchyevu distribuciju ako je X t(). Dakle, f(x) = Γ() π Γ ( ) +x = π π +x = π(+x ). Zadatak.9 Neka je X t(n). Odredite EX i VarX kada postoje. Rješenje: n = + x f(x)dx = π + X nema očekivanje ni varijancu. x +x dx = π ln(+x ) + = +

. NEPREKIDNE SLUČAJNE VARIJABLE 57 n EX = + VarX = E[X ] = I = n Γ ( ) n+ nπ Γ ( ) n xf(x)dx = Γ ( ) n+ nπ Γ ( ) n + n> = Γ ( ) n+ nπ Γ ( ) n + Γ ( n+ = n (n )π Γ ( ) n = n I = n n n + x ( + x n )n+ }{{} = jer je podintegralna funkcija neparna na simetričnoj domeni x f(x)dx = Γ ( ) n+ nπ Γ ( ) n + ( + x n ) + Γ ( ) n (n )π Γ ( ) n n ( ) + x n ( + x )n+ n dx = )n+ ( + t )n n + ( + t n + dx = x ( + x n )n+ dx = } {{ } divergira za n =, konvergira za n > dx = I I, gdje je { t n = x n dt n = dx n dt.6 = ) (n )+ } {{ } = ) Γ ( n+ nπ Γ ( ) n + ( + x n )n+ } {{ } = dx = n. VarX = n(n ) n = n n n X ima očekivanje za n i varijancu za n 3. dt } = = n(n ) n,.6 Fisherova F-distribucija Definicija: Slučajna varijabla X ima (Fisherovu) F-distribuciju s parametrima m N i n N ako joj je funkcija gustoće f(x) = Γ( ) m+n Γ ( ) ( m Γ n )m m n x m n ½,+ (x). (mx+n) m+n

58. NEPREKIDNE SLUČAJNE VARIJABLE Pišemo: X F(m,n). Zadatak. Neka je X F(m,n). Odredite distribuciju slučajne varijable Y = X. Rješenje: Y je dobro definirana jer je X > (g.s.). ( x F Y (x) = P(Y x) = P }{{} X > ( x > F Y (x) = P(Y x) = P X x Y F(n,m). = Γ( ) m+n Γ ( ( m ) Γ n )m m n n = Γ( ) m+n Γ ( ) ( m Γ n = Γ( ) n+m Γ ( ( n ) Γ m )m m n n )n n m m x }{{} + x x x ) = ) = P( ) =. ( X ) = x u m (mu+n) m+n v m + ( m v +n)m+n v n (nv +m) n+m v m+n v m+n du = { } u = v du = dv = v dv v = ½,+ (v)dv. Zadatak. Na slučajan način biramo točku iz pravokutnika stranica duljine 3 cm i 4 cm. Izračunajte očekivanu udaljenost točke od najbliže stranice pravokutnika. Rješenje: Označimo s X udaljenost točke od najbliže stranice pravokutnika. Tada je za x [,3/] F X (x) = P(X x) = P(X > x) = (4 x)(3 x) 4 3, x < F X (x) = x 3 + 7x, x 3/ 6, x > 3/ ( f X (x) = F X (x) = x 3 + 7 ) [,3/] (x) 6 = x 3 + 7x 6. EX = 3/ x ( x 3 + 7 ) dx = 7 6 48 =.565

. NEPREKIDNE SLUČAJNE VARIJABLE 59.7 Zadaci za vježbu. Slučajna varijabla X ima uniformnu distribuciju s parametrima a, b R ako joj je funkcija gustoće { f(x) = b a, x [a,b]., x / [a,b] Pišemo X U(a,b). Odredite funkciju distribucije i izračunajte P ( ) a X a+b..3 Neka je X N(µ,σ ). Izračunajte treći i četvrti moment od X..4 Neka je X N(3,4). Odredite c R t. d. je P(X > c) = P(X c)..5 Neka je X Exp(λ). Izračunajte P ( X λ)..6 Neka je X Γ(α,β). Izračunajte treći i četvrti moment od X..7 Neka X ima Cauchyevu distribuciju. Odredite funkciju distribucije..8 Neka je X slučajna varijabla s funkcijom gustoće f(x) = e x, x R. Odredite funkciju distribucije te izračunajte P(X > ) i P( < X < )..9 Beta-funkcija je funkcija B: R + R + R + definirana sa B(p,q) := Dokažite da je B(p,q) = Γ(p)Γ(q) Γ(p+q). x p ( x) q dx.. Slučajna varijabla X ima beta-distribuciju s parametrima p > i q > ako joj je funkcija gustoće f(x) = B(p,q) xp ( x) q, x,., x /, Pišemo X B(p,q). Izračunajte EX,VarX i E[X n ],n N.. Neka je X U(a, b). Odredite funkciju distribucije slučajne varijable Y ako je: (a) Y = αx +β,α,

6. NEPREKIDNE SLUČAJNE VARIJABLE (b) Y = e X.. Neka je X U(,). Odredite funkciju distribucije slučajne varijable Y = X..3 Neka je X N(µ,σ ). Odredite funkciju distribucije slučajne varijable Y = αx +β..4 Neka je X N(, ). Odredite funkciju distribucije slučajne varijable Y ako je: (a) Y = /X, (b) Y = X, (c) Y = X 3..5 Neka je X Exp(λ). Odredite funkciju distribucije slučajne varijable Y ako je: (a) Y = αx +β, (b) Y = X 3..6 Neka je X Exp(). Odredite funkciju distribucije slučajne varijable Y = X..7 Ako je X U(,), kojom transformacijom od X se dobije Y Exp(λ)?.8 Ako je X Exp(λ), kojom transformacijom od X se dobije Y sa Cauchyevom distribucijom?.9 Slučajna varijabla X ima funkciju distribucije { e x α, x > F(x) =, x, gdje je α >. Odredite funkciju distribucije slučajne varijable Y = /X. Rješenja:.. F X (x) =, x < a x a b a, a x b,, x > b P(a X a+b ) = /.3. E[X3 ] = µ 3 + 3µσ,E[X 4 ] = 3σ 4 + µ 4 + 6µ σ.4. c.4.5. e.6. E[X 3 ] = α(α + )(α + )β 3,E[X 4 ] = α(α + )(α + )(α + 3)β 4.7. F(x) = π arctgx +.8. { e x /, x F(x) = e x,p(x > ) = /,P( < X < ) = (e e )/.. EX = p /, x < p+q,varx = pq (p+q) (p+q+),e[xn ] = B(p+n,q).. (a) Za α > je F B(p,q) Y (x) = F X ( x β α ), za α < je F Y (x) = F X ( x β α ) (b) F Y (x) =, x <.. F Y (x) = x, x,.3. Y N(αµ + β,α σ ).4. (a) F Y (x) =, x > { FX ( x) F X ( x), x > (c) F, x Y (x) = F X ( 3 x).5. (a) Za α > je F Y (x) = F X ( x β { { (b) F Y (x) = { F Y (x) = e λ 3 x, x >, x, x e ( x)α, x <.6. F Y (x) = e x, x >, x 3/ F X (/y), x > /, x = / + F X (/y), x < { FX (lny), y >, y (b) F Y (x) = α ), za α < je F Y (x) = F X ( x β α ).7. Y = λ ln( X).8. Y = tg[π( e λx )].9.

3 Neprekidni slučajni vektori. Uvjetno očekivanje 3. Neprekidni slučajni vektori Definicija: Nekaje(Ω,F,P)vjerojatnosniprostor. Funkcija(X,Y): Ω R jeslučajni vektor ako za sve a,b,c,d R, a < b,c < d vrijedi {a X b,c Y d} F. Funkciju F = F X,Y : R [,] definiranu sa F(a,b) := P(X a,y b), a,b R zovemo funkcija distribucije slučajnog vektora (X, Y). Definicija: Slučajni vektor (X, Y) je neprekidni slučajni vektor ako postoji nenegativna (izmjeriva) funkcija f: R R takva da je P(a X b,c Y d) = b d a c f(x,y)dxdy, za sve a,b,c,d R, a < b,c < d. Funkciju f zovemo (vjerojatnosna) funkcija gustoće slučajnog vektora (X, Y). Napomena: (a) P(X = a,y = b) = a b a b f(x,y)dxdy = (b) Ako je g: R R (izmjeriva) funkcija, onda je E[g(X,Y)] := g(x,y)f(x,y)dxdy. R 6

6 3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE (c) Za C R izmjeriv, uz g(x,y) := ½C(x,y) je P((X,Y) C) = C f(x,y)dxdy. (d) P(a X b) = P(a X b,y R) = b + a X je neprekidna slučajna varijabla i f X (x) = f(x,y)dxdy = + Analogno, Y je neprekidna slučajna varijabla i f Y (y) = f(x,y)dy. + b a ( + f(x,y)dx. X i Y zovemo marginalne distribucije slučajnog vektora (X, Y). ) f(x,y)dy dx Zadatak 3. Funkcija gustoće slučajnog vektora (X, Y) je dana s f(x,y) = { e (x+y), x >,y >, inače. (a) Odredite marginalne distribucije. (b) Odredite funkciju gustoće slučajne varijable X Y. Rješenje: (a) Vrijedi f X (x) = + f(x,y)dy = f X (x) = + e (x+y) ½,, (x,y)dy = + e (x+y) dy, x > = =, x { e x, x >, x X Exp(). Analogno, Y Exp(). (b) ( X a FX(a) = P Y }{{} Y > a > ) }{{} a = P( ) =.

3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE 63 ( ) X FX(a) = P Y Y a = f(x,y)dxdy = x y a = = ay fx(a) = F X Y Y e (x+y) dxdy = e y ( e x ay ) dy = ) = ( e y + e (a+)y a+ e y = (a+), a >., a ay e x y a,x>,y> e x dx dy = e y( e ay) dy = = a+ (x+y) dxdy = Zadatak 3. Na slučajan način biramo točku iz kruga radijusa R. Ako točku označimo s (X,Y), onda je (X,Y) neprekidni slučajni vektor s uniformnom distribucijom na krugu radijusa R, tj. { c, x +y R f(x,y) =, x +y > R. (a) Odredite c. (b) Odredite marginalne distribucije X i Y. (c) Izračunajte vjerojatnost da je udaljenost D točke (X, Y) od ishodišta manja ili jednaka a. (d) Izračunajte ED. Rješenje: (a) = R f(x,y)dxdy = x +y R cdxdy = c x +y R dxdy = c R π c = R π.

64 3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE (b) Vrijedi R x + f X (x) = f(x,y)dy = dy, x R dy = R π R π x +y R R x, x > R R x x R = R π., x > R R y y R Analogno, f Y (y) = R π., y > R (c) Tražena vjerojatnost je F D (a), gdje je D = X +Y. Vrijedi D R. a < F D (a) = P( D }{{} a > R F D (a) = P( D }{{} R a R a }{{}) = P( ) = < a }{{} >R ) = P(Ω) = F D (a) = P(D a) = P( X +Y a) = P(X +Y a ) = a π = f(x,y)dxdy = dxdy = R π R π = a R. x +y a x +y a (d) Dakle, a f D (a) = R, a R, inače R ED = a da = R R 3. Zadatak 3.3 Neka je (X, Y) neprekidni slučajni vektor s funkcijom gustoće f. Odredite funkciju gustoće slučajne varijable: (a) X +Y (b) X Y Rješenje:

3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE 65 (a) F X+Y (a) = P(X +Y a) = f(x,y)dxdy = f X+Y (z) = = = + + + a x a x+y a f(x,y)dy dx = f(x,z x)dz dx = f(x,z x)dx = { } y = z x dy = dx { } z = x+y = dz = dy a = + + f(x,z x)dx dz f(z y,y)dy. (b) F X Y (a) = P(X Y a) = f(x,y)dxdy = = = = = f X Y = + + + a x f a a a x y a f(x,y)dy dx+ + ( f x, z ) dz dx+ x x ( f x, z ) dz dx+ x x ( f x, z ) dz dx = x x ( x, z ) dx x x. + + a a x f(x,y)dy dx = a a + ( f x, z ) dz dx = x x ( f x, z ) dz dx = x x ( f x, z ) dx dz x x { } z = x y = dz = xdy Napomena: Akoje(X,Y)slučajnivektorsfunkcijomgustoćef X,Y imarginalnimgustoćama f X i f Y, onda vrijedi X i Y su nezavisne f X,Y (x,y) = f X (x)f Y (y), x,y R.

66 3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE Zadatak 3.4 NekasuX Γ(α,β)iY Γ(α,β)nezavisne slučajne varijable. Pokažite da je tada X +Y Γ(α +α,β). Rješenje: Zbog nezavisnosti slučajnih varijabli X i Y vrijedi Slijedi f X,Y (x,y) = f X (x)f Y (y). f X+Y (z) = + f X,Y (z y,y)dy = + f X (z y)f Y (y)dy = = Γ(α )β α Γ(α )β α z f X+Y (z) =. z > + e z y β (z y) α ½, (z y)e y β y α ½, (y)dy f X+Y (z) = Γ(α )Γ(α )β α +α e = Γ(α )Γ(α )β α +α e z β z (z y) α y α dy = z β z α +α Zbog toga što je f X+Y funkcija gustoće, vrijedi = + f X+Y (z)dz = C = Cβ α +α + + { x = y } z dx = dy = z ( x) α x α dx = C e z β z α +α e z β z α +α dz = { w = z } β dw = dz = β w α +α e w dw = Cβ α +α Γ(α +α ) C = Γ(α +α )β α +α X +Y Γ(α +α,β) Napomena: Ako su X i Γ(α i,β),i =,...,n, nezavisne slučajne varijable, onda je X + +X n Γ(α + +α n,β).

3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE 67 Ako su X i χ (α i ),i =,...,n, nezavisne slučajne varijable, onda je X + +X n χ (α + +α n ). Ako su X i Exp(λ),i =,...,n, nezavisne slučajne varijable, onda je ( X + +X n Γ n, ). λ Ako su X,...,X n N(µ,σ ) nezavisne slučajne varijable, onda su X µ,..., X n µ N(, ) nezavisne slučajne varijable pa su σ σ ( ) ( ) X µ Xn µ,..., χ () nezavisne slučajne varijable, odakle je σ σ ( ) Xi µ χ (n). σ Zadatak 3.5 Neka su X χ (n) i Y N(,) nezavisne slučajne varijable i neka je Dokažite da je Z t(n). Z = Y. X n Rješenje: Prvo odredimo funkciju gustoće slučajne varijable x < F X(x) = P n x ( X n x ) = P( ) =. X n. F nx { } t = ny X(x) = P(X nx x ) = f X (t)dt = = f n dt = nydy X (ny )nydy f X(x) = nxf X (nx ) ½, (x). n

68 3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE Zbog nezavisnosti slučajnih varijabli X i Y slijedi f Z (z) = Z t(n) = f X n,y(x,zx) x dx = nxf X (nx )f Y (zx)xdx = n + n n πγ( n ( u = n = = n + n n πγ( n ) = + z n n n nπγ( n ) ( + z ) ( x x = n u n ( + z )n n n )n+ f X(x)f Y (zx) x dx n dx = e u x n e n ) ) / ( u ) n + z n ( ) du n + z u n n ( + z n du ) u = ( ) + z x n dx = u n+ e u du = Γ( n+ nπ Γ( n) ) ( + z Zadatak 3.6 Neka su X χ (n) i Y χ (m) nezavisne slučajne varijable te neka je Dokažite da je Z F(m,n). Z = Rješenje: Prvo odredimo funkciju gustoće slučajne varijable Y m. ( ) Y F Y (y) = P m m y = P(Y my) = f Y (y) = mf Y (my) m Analogno je fx(x) = nf X (nx). n Sada je zbog nezavisnosti f Z (z) = fx n, Y m z f Z (z) =. my Y m X n (x,zx) x dx = nm. f Y (t)dt = n )n+ { } y t = mu = f dt = mdu Y (mu)mdu f X (nx)f Y (mzx) x dx.

3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE 69 z > f Z (z) = = m m n n Γ( m )Γ(n )m+n m m n n Γ( m )Γ(n )m+n = Γ(m+n ) n Γ( m n )Γ(n )mm z m z m { } x m+n e (mz+n)x u = (mz+n)x dx = du = mz+n = dx m+n (mz +n) m+n z m (mz +n) m+n u m+n e u du = Z F(m,n) 3. Uvjetno očekivanje Definicija: Neka je (X,Y) slučajni vektor s funkcijom gustoće f = f X,Y : R R. Ako je y R takav da je f Y (y) >, onda definiramo uvjetnu funkciju gustoće f( y) = f X Y ( y): R R slučajne varijable X uz uvjet Y=y formulom f X Y (x y) := f X,Y(x,y). f Y (y) Napomena: Ako je y R takav da je f Y (y) >, onda definiramo P(X A Y = y) := f X Y (x y)dx. A Sjetite se da u tom slučaju za diskretni slučajni vektor (X,Y) vrijedi f X Y (x y) = f X,Y(x,y) f Y (y) = P(X = x,y = y) P(Y = y) = P(X = x Y = y). Napomena: Ako su X i Y nezavisne slučajne varijable, onda je f X Y (x y) = f X,Y(x,y) f Y (y) = f X(x)f Y (y) f Y (y) = f X (x).

7 3. NEPREKIDNI SLUČAJNI VEKTORI. UVJETNO OČEKIVANJE Definicija: Neka su X i Y slučajne varijable i neka slučajna varijabla X ima konačno očekivanje. Uvjetno (matematičko) očekivanje slučajne varijable X uz dano Y = y je definirano za sve y R takve da je f Y (y) > formulom x xf X Y(x y), za diskretne slučajne varijable E[X Y = y] := + xf X Y (x y)dx, za neprekidne slučajne varijable. Napomena: Ako jeh: R R(izmjeriva) funkcija i slučajna varijablah(x) ima konačno očekivanje, onda za sve y R takve da je f Y (y) > vrijedi x h(x)f X Y(x y), za diskretne slučajne varijable E[h(X) Y = y] := + h(x)f X Y (x y)dx, za neprekidne slučajne varijable. Napomena: Na ovaj način je dobro definirana funkcija g: {y R: f Y (y) > } R, g(y) = E[X Y = y]. Ako definiramo g(y) :=, za y R takve da je f Y (y) =, onda sa E[X Y] označavamo funkciju slučajne varijable Y koja je za Y = y jednaka g(y), odnosno Tada je E[X Y] slučajna varijabla i vrijedi E[X Y] := g(y). E[E[X Y]] = E[X]. Zadatak 3.7 Bacamo dvije simetrične kocke. Neka je X manji, a Y veći od brojeva koji su pali na kockama. (a) Odredite distribuciju slučajnog vektora (X, Y). (b) Odredite marginalne distribucije. (c) Odredite f X Y (x 4). (d) Odredite E[X Y = y]. (e) Odredite E[E[X Y]]. (f) Odredite EX. Rješenje: (a) Distribucija slučajnog vektora (X, Y) je dana sljedećom tablicom: