Sadrˇzaj Sadrˇzaj DVODIMENZIONALNI. DISKRETNI DVODIMENZIONALNI............................ KONTINUIRANI -dim tko želi znati više.............................. 5. KOVARIJANCA, KORELACIJA, PRAVCI REGRESIJE........ 7. Ponovimo.................................
Radni materijal
Poglavlje DVODIMENZIONALNI Pojam slučajne varijable generalizira se za dvije i n varijabli. U ovom poglavlju posebno će se obraditi diskretni dvodimenzionali slučajni vektor. Pojam n-dim slučajnog vektora važan je za definiciju slučajnog uzorka. Definicija. (n-dim, engl. random vector) Neka su su X : Ω R, X : Ω R,..., X n : Ω R slučajne varijable definirane na vjerojatnosnom prostoru (Ω, F, P). Funkciju (X, X,..., X n ) : Ω R n zovemo n-dim slučajni vektor ako vrijedi x, x,..., x n R, {ω Ω : X (ω) x, X (ω) x,..., X n (ω) x n } F i označavamo (X, X,..., X n )(ω) = (X (ω), X (ω),..., X n (ω)), ω Ω. Definicija. (FUNKCIJA DISTRIBUCIJE n-dim SLUČAJNOG VEKTORA, engl. distribution function of random vector) Neka je (X, X,..., X n ) : Ω R n n-dim slučajni vektor. Funkciju F : R n R definiranu na sljedeći način: F(x, x,..., x n ) := P(X x,..., X n x n ) zovemo funkcija distribucije diskretnog n-dim slučajnog vektora (X, X,.., X n ).
.. DISKRETNI DVODIMENZIONALNI. DISKRETNI DVODIMENZIONALNI MOTIV. Promatramo slučajni pokus bacanje igraće kocke i slučajnu varijablu X = suma brojeva koji su pali i slučajnu varijablu Y = broj ako su pali jednaki brojevi, inače. (a) Nadite funkciju vjerojatnosti slučajnog vektora (X, Y). (b)izračunajte vjerojatnost da je zbroj brojeva koji su pali veći od a manji ili jednak i da su pali isti brojevi? (c) Jesu li X i Y nezavisne varijable? (d) Izračunajte kovarijancu. (e) Jesu li X i Y korelirane varijable? Definicija. DISKRETNI n-dim Ako su slučajne varijable X, X,..., X n diskretne slučajne varijable, onda za slučajni vektor (X, X,..., X n ) kažemo da je diskretni n-dim slučajni vektor. Definicija. (FUNKCIJA VJEROJATNOSTI n-dim SLUČAJNOG VEKTORA, engl. probability function of random vector) Neka je (X, X,..., X n ) : Ω R n n-dim diskretni slučajni vektor. Funkciju f : R n R definiranu na sljedeći način: f (x, x,..., x n ) := P(X = x, X = x,...x n = x n ), (x,..., x n ) R(X, X,..., X n ),, inače zovemo funkcija vjerojatnosti diskretnog n-dim slučajnog vektora (X, X,..., X n ). Definicija.5 DISKRETNI -dim Ako su slučajne varijable X i Y diskretne slučajne varijable, onda za slučajni vektor (X, Y) kažemo da je diskretni dvodimenzionalni slučajni vektor. Definicija. (FUNKCIJA VJEROJATNOSTI diskretnog -dim SLUČAJNOG VEKTORA) Neka su X : Ω R, Y : Ω R diskretne slučajne varijable sa slikama R(X) = {x, x,...}, R(Y) = {y, y,...} Funkciju f : R R definiranu na sljedeći način: f (x, y) := P(X = x i, Y = y j ),, inače x = x i R(X), y = y j R(X), zovemo funkcija vjerojatnosti diskretnog -dim slučajnog vektora (X, Y). Radni materijal
. DVODIMENZIONALNI T: SVOJSTVA funkcije vjerojatnosti slučajne varijable X. (i) f (x i, y j ), (ii) f (x i, y j ) =. i= j= Dokaz: tko želi znati više (i) Za (x i, y j ) R, P(X = x i, Y = y j ) = P({ω : X(ω) = x i, Y(ω) = y j }) f (x i, y i ). (ii) Za (x i, y j ) (x k, y l ) {ω : X(ω) = x i, Y(ω) = y j } {ω : X(ω) = x k, Y(ω) = y l } =, svojstvo (ii) slijedi prema svojstvu (P), prebrojive aditivnosti funkcije P: i= f (x i, y j ) = j= i= P(X = x i, Y = y j ) = P(Ω) =. j= NAPOMENA. Diskretni -dim slučajni vektor je zadan sa svojom slikom R((X, Y)) = {(x i, y j ), i =,...; j =,...} i funkcijom vjerojatnosti f slučajne varijable, vrijednostima { f (x i, y j ), i =,...; j =,...}. U literaturi se zato može naći zapis slučajnog vektora (X, Y) kao uredene sheme: X/Y y y... y j... x p p p j... (X, Y) x p p j... x i p i p ij......... gdje su p ij = f (x i, y j ), i, j {,,...}. PRIMJER. Neka je (Ω, P(Ω), P) diskretni vjerojatnosni prostor slučajnog pokusa bacanje igraće kocke. Ω = {ω, ω, ω,..., ω }, P({ω i }) =, i =,..,. Neka je X : Ω R slučajna varijabla definirana na sljedeći način: X = broj koji je pao. Neka je Y : Ω R slučajna varijabla definirana na sljedeći način: Y = ako je pao paran broj veći od, inače. X je slučajna varijabla. Slika slučajne varijable je skup R(X) = {,,,, 5, }. Y je slučajna varijabla. Slika slučajne varijable je skup R(Y) = {, }. Naći funkciju vjerojatnosti slučajnog vektora (X, Y). 5 Radni materijal
.. DISKRETNI DVODIMENZIONALNI Rješenje: Funkcija vjerojatnosti slučajne varijable X je f : R R f (x, y) := = P(X = x i, Y = y j ),, inače. x = x i R(X), y = y j R(Y), x = x i {, }, y = y j {}, x = x i {,,, 5}, y = y j {}, inače. Slučajni vektor (X,Y) možemo za zadati s X/Y (X, Y) 5 PRIMJER. Neka je (X,Y) slučajni vektor za slučajni pokus izbora dva broja iz {,,}, pri čemu je X= prvi izabrani broj, Y= izabrani broj nije manji od prvog. Naći funkciju vjerojatnosti slučajnog vektora. Rješenje: (X, Y) X/Y. Definicija.7 (FUNKCIJA DISTRIBUCIJE DISKRETNOG -dim SLUČAJNOG VEKTORA) Neka je (X, Y) : Ω R diskretni -dim slučajni vektor sa slikom R((X, Y)) = {(x i, y j ), i =,...; j =,...}. Funkciju F : R R definiranu na sljedeći način: F(x, y) := P(X x, Y y) = f (x i, y j ) i: x i x j: y j y zovemo funkcija distribucije diskretnog -dim slučajnog vektora (X, Y). Radni materijal
. DVODIMENZIONALNI T: SVOJSTVA funkcije distribucije diskretnog -dim slučajnog vektora: (F) (F) lim F(x, y) = F(, ) = x, y lim F(x, y) = F(, y) = x lim F(x, y) = F(x, ) = y lim F(x, y) = F(, ) = x, y (F) F(x, y) (F) P(a < X b, a < Y b ) = F(b, b ) F(a, b ) F(b, a ) + F(a, a ), a, b, a, b R, a < b, a < b. (F) F je rastuća funkcija po svakoj varijabli. Dokaz: tko želi znati više (F) Kako je dogadaj X, Y nemoguć dogadaj F(, ) := P(X, Y ) = P( ) =. F(, y) = P(X Y y) = P( Y y) = P( ) =. (F) Budući je dogadaj X, Y siguran dogadaj, onda je F(, ) = P(Ω) =. (F) tvrdnja slijedi iz svojstava (F) i (F). (F) Neka su a, b R, a < b, a < b. Računamo P(a < X b, a < Y b ) = P(a < X b, Y b ) P(a < X b, Y a ) = (F(b, b ) F(a, b )) (F(b, a ) F(a, a )). (F) Neka su a, b R, a < b. P(a < X b, Y y) = F(b, y) F(a, y) F(b, ) + F(a, ) = F(b, y) F(a, y). Iz svojstva (F5) slijedi da je F(a, y) F(b, y), funkcija je rastuća po prvoj varijabli. 7 Radni materijal
.. DISKRETNI DVODIMENZIONALNI PRIMJER. Za slučajni vektor (X, Y) iz primjera zadan s X/Y (X, Y) 5 odredite vrijednost funkcije distribucije F(, ), F(, ), F(, ), F(, ), F(, ). Izračunajte vjerojatnost P( < X, < Y ) i P( < X, Y ). Rješenje: F(x, y) = P(X x, Y y) = f (x i, y j ) i: x i x j: y j y F(, ) = f (, ) = p =, F(, ) = f (, ) + f (, ) = p + p =, F(, ) = f (, ) + f (, ) = p + p =, F(, ) = f (, ) + f (, ) + f (, ) + f (, ) = p + p + p + p =, F(, ) = f (, ) + f (, ) + f (, ) + f (, ) = p + p + p + p =. Koristimo formule P(a < X b, a < Y b ) = F(b, b ) F(a, b ) F(b, a ) + F(a, a ) P(a < X b, Y b ) = F(b, b ) F(a, b ) P( < X, < Y ) = F(, ) F(, ) F(, ) + F(, ) = + =. P( < X, Y ) = F(, ) F(, ) = =. ili P( < X, < Y ) = P( ) =, P( < X, Y ) = P({ω }) + P({ω }) = + =. PRIMJER. Bacimo istovremeno dva novčića od kune i od 5 kuna. Neka su X i Y slučajne varijable definirane: X= ako je pao slavuj, inače Radni materijal 8
. DVODIMENZIONALNI Y= ako je pao medo, inače. Promatramo slučajni vektor (X,Y). Napišite funkciju vjerojatnosti slučajnog vektora. Odredite F(, ), P( < X, < Y ) i P( < X, Y ). Rješenje: R(X) = {, }, R(Y) = {, }. R((X, Y)) = {(x i, y j ), i =, ; j =, } = {(, ), (, ), (, ), (, )}. f (x, y) :=, x = x i {, }, y = y j {, }, inače. (X, Y) X/Y, f (, ) = f (, ) = f (, ) = f (, ) =. F(x, y) := P(X x, Y y) = i: x i x j: y j y f (x i, y j ) F(, ) = f (, ) = p = F(, ) = f (, ) + f (, ) = p + p = + =. F(, ) = f (, ) + f (, ) = p + p = + = F(, ) = f (, ) + f (, ) + f (, ) + f (, ) = p + p + p + p = Koristimo formule P(a < X b, a < Y b ) = F(b, b ) F(a, b ) F(b, a ) + F(a, a ) P(a < X b, Y b ) = F(b, b ) F(a, b ) P( < X, < Y ) = F(, ) F(, ) F(, ) + F(, ) = + =. ili P( < X, Y ) = F(, ) F(, ) = =. P( < X, < Y ) = P({(s, m)}) = =, P( < X, Y ) = P({s, 5}}) = =. Prisjetimo se motivacijskog primjera: Radni materijal
.. DISKRETNI DVODIMENZIONALNI PRIMJER.5 motiv Promatramo slučajni pokus bacanje igraće kocke i slučajnu varijablu X = suma brojeva koji su pali i slučajnu varijablu Y = broj ako su pali jednaki brojevi, inače. (a) Nadite funkciju vjerojatnosti slučajnog vektora (X, Y). (b) Izračunajte vjerojatnost da je zbroj brojeva koji su pali veći od a manji ili jednak i da su pali isti brojevi? Rješenje: (a) (X, Y) X/Y 5 7 8 (b) P( < X, Y = ) = f (, ) + f (5, ) + f (, ) = + + =. Definicija.8 (MARGINALNA FUNKCIJA VJEROJATNOSTI komponenata -dim SLUČAJNOG VEKTORA, engl. marginal distribution) Neka je (X, Y) : Ω R diskretni -dim slučajni vektor sa slikom R((X, Y)) = {(x i, y j ), i =,...; j =,...} i funkcijom vjerojatnosti f : R [, ] f (x, y) := P(X = x i, Y = y j ),, inače. (x, y) = (x i, y j ) R((X, Y)) Funkciju f (x) = f (X = x, Y = proizvoljno) = f (x, y j ), zovemo marginalna funkcija vjerojatnosti komponente X slučajnog vektora (X, Y). Funkciju f (y) = f (X = proizvoljno, Y = y) = f (x i, y) zovemo marginalna funkcija vjerojatnosti komponente Y slučajnog vektora (X, Y). Radni materijal j i
. DVODIMENZIONALNI X/Y y y... y j... f (x) x p p... p j... j p j x p p j... j p j............ x i p i p ij j p ij.................. f (y) i p i... i p ij i j p ij = PRIMJER. U prethodnim primjerima slučajnih vektora odredite marginalne funkcije vjerojatnosti komponenti X i Y slučajnog vektora (X, Y). Rješenje: X/Y f (x) (a) (b) 5 f (y) X/Y f (x) f (y) 8 5 8 5, X, Y 8 8 8 8 (c) X/Y f (x) f (y) Radni materijal
.. DISKRETNI DVODIMENZIONALNI (d) X/Y f (x) 5 5 7 8 5 f (y) Definicija. (MARGINALNA FUNKCIJA DISTRIBUCIJE VJEROJATNOSTI komponenata -dim SLUČAJNOG VEKTORA, engl. marginal distribution) Neka je (X, Y) : Ω R diskretni -dim slučajni vektor sa slikom R((X, Y)) = {(x i, y j ), i =,...; j =,...} i funkcijom distribucije vjerojatnosti F : R [, ] F(x, y) := P(X x, Y y) = f (x i, y j ) i: x i x j: y j y Funkciju F (x) := F(x, ) = P(X x, < Y ) = f (u), zovemo marginalna funkcija distribucije vjerojatnosti komponente X slučajnog vektora (X, Y). Funkciju F (y) := F(, y) = P( < X, Y y) = f (u) zovemo marginalna funkcija distribucije vjerojatnosti komponente Y slučajnog vektora (X, Y). u x u y Definicija. (NEZAVISNE SLUČAJNE VARIJABLE -dim SLUČAJNOG VEK- TORA, engl. independent variables) Neka je (X, Y) : Ω R -dim slučajni vektor sa funkcijom distribucije vjerojatnosti F(x, y). Za slučajne varijable X i Y kažemo da su nezavisne ako je za svaki (x, y) F(x, y) = F (x) F (y). Radni materijal
. DVODIMENZIONALNI Neka je (X, Y) : Ω R diskretni -dim slučajni vektor sa funkcijom vjerojatnosti f (x, y). Za slučajne varijable X i Y kažemo da su nezavisne ako je za svaki (x, y) Inače su X i Y zavisne. f (x, y) = f (x) f (y). PRIMJER.7 U primjerima provjeri jesu li slučajne varijable u slučajnim vektorima (X,Y) nezavisne. Rješenje: (a) nisu jer je npr. f (, ) f () f (), f (, ) =, f () =, f () = ; (b) nisu jer je npr. f (, ) f () f (), f (, ) =, f () = 8, f () = 8 ; (c) jesu jer je f (x i, y j ) = f (x i ) f (y j ), i, j =, ; (d) nisu jer je npr. f (, ) f () f (), f (, ) =, f () = 5, f () =. Definicija. (OČEKIVANJE -dim SLUČAJNOG VEKTORA) Neka je (X, Y) : Ω R -dim slučajni vektor i neka komponente X i Y su slučajne varijable koje imaju očekivnje E(X) i E(Y) onda se matematičko očekivanje slučajnog vektora definira s E(X, Y) = (E(X), E(Y)). Definicija. (OČEKIVANJE funkcije DISKRETNOG -dim SLUČAJNOG VEK- TORA) Neka je (X, Y) : Ω R diskretni -dim slučajni vektor sa slikom R((X, Y)) = {(x i, y j ), i =,.; j =,...} i funkcijom vjerojatnosti f : R [, ] f (x, y) := P(X = x i, Y = y j ),, inače. (x, y) = (x i, y j ) R((X, Y)) Neka je zadana funkcija h : R R. Kažemo da je slučajna varijabla h(x, Y) funkcija od slučajnog vektora (X,Y) i za nju definiramo očekivanje ako red h(x i, y j ) f (x i, y j ) konvergira i označavamo E(h(X, Y)) := i= h(x i, y j ) f (x i, y j ). j= i= j= Radni materijal
.. DISKRETNI DVODIMENZIONALNI PRIMJER.8 E(X Y) = i= x i y j f (x i, y j ) za h(x, y) = x y. j= PRIMJER. Ako su X i Y nezavisne slučajne varijable onda je jer E(X Y) = E(X) E(Y), E(X Y) = = x i y j f (x i, y j ) = x i y j f (x i ) f (y j ) i= j= i= j= i= j= x i f (x i ) y j f (y j ) = E(X) E(Y). PRIMJER. Ako je (X, X,..., X n ) n-dim slučajni vektor i sve varijable nezavisne onda E(X X... X n ) = E(X ) E(X )... E(X n ). PRIMJER. E(X + Y) = E(X) + E(Y) za h(x, y) = x + y. PRIMJER. Ako je (X, X,..., X n ) n-dim slučajni vektor onda E(X + X +... + X n ) = E(X ) + E(X ) +... + E(X n ). PRIMJER. Neka je (X, Y) diskretni -dim slučajni vektor takav da Y ne poprima vrijednost. Odredi E(sin X Y ). Rješenje: h(x, y) = sin x y E(sin X Y ) = i= h(x i, y j ) f (x i, y j ) = j= i= j= sin x i y j f (x i, y j ) Radni materijal
. DVODIMENZIONALNI. KONTINUIRANI -dim tko želi znati više MOTIV. Mladić i djevojka su dogovorili sastanak na trgu u sati. Čekat će se najdulje minuta nakon dolaska. Kolika je vjerojatnost da se susretnu ako su oboje došli na trg od do sati? Definicija. KONTINUIRANI -dim Ako su slučajne varijable X i Y kontinuirane slučajne varijable, onda za slučajni vektor (X, Y) kažemo da je kontinuirani dvodimenzionalni slučajni vektor. Definicija. (FUNKCIJA GUSTOĆE VJEROJATNOSTI kontinuiranog -dim SLUČAJNOG VEKTORA) Neka su X : Ω R, Y : Ω R kontinuirane slučajne varijable sa slikama R(X) i R(Y). Funkciju f : R R definiranu na sljedeći način: (i) f (x, y) (ii) f (x, y)dxdy =. zovemo funkcija gustoće vjerojatnosti kontinuiranog -dim slučajnog vektora (X, Y). Definicija.5 (FUNKCIJA DISTRIBUCIJE kontinuiranog -dim SLUČAJNOG VEKTORA) Neka je (X, Y) : Ω R kontinuirani -dim slučajni vektor sa slikom R((X, Y)). Funkciju F : R R definiranu na sljedeći način: F(x, y) := P(X x, Y y) = x y f (x, y)dxdy zovemo funkcija distribucije kontinuiranog -dim slučajnog vektora (X, Y). NAPOMENA. Neka je (X, Y) : Ω R kontinuirani -dim slučajni vektor sa slikom R((X, Y)) = [a, b] [c, d].tada vrijedi P(a < X b, c < Y d) = b d a c f (x, y)dxdy. NAPOMENA. Neka je (X, Y) : Ω R kontinuirani -dim slučajni vektor sa slikom R((X, Y)). Neka je dogadaj A vezan uz slučajni pokus i vektor (X, Y). Ako označimo područje u xy ravnini koje odgovara dogadaju A sa D A onda vjerojatnost dogadaja A (geometrijsku vjerojatnost) možemo računati pomoću 5 Radni materijal
.. KONTINUIRANI -dim tko želi znati više P(A) = f (x, y)dxdy. D A MOTIV. Mladić i djevojka su dogovorili sastanak na trgu u sati. Čekat će se najdulje minuta nakon dolaska. Kolika je vjerojatnost da se susretnu ako su oboje došli na trg od do sati? Rješenje: Neka su X i Y slučajne varijable koje predtavljaju vrijeme dolaska djevojke i mladića. Pretpostavit ćemo da jednaki vremenski intervali imaju jednaku vjerojatnost, pa su funkcije gustoće vjerojatnosti za obe varijable jednake:, x f (x) =, inače. f (x) =, x, inače. Budući su slučajne varijable X i Y nezavisne možemo odrediti funkciju gustoće vjerojatnosti slučajnog vektora (X, Y) : f (x, y) = f (x) f (y), x, y f (x, y) =, inače. Računamo vjerojatnost dogadaja A = {(x, y) [, ] [, ] : x y < } : P(A) = P( X Y < ) = D A f (x, y)dxdy = 5. (vidite PRIMJER?? u. poglavlju.) Radni materijal
. DVODIMENZIONALNI. KOVARIJANCA, KORELACIJA, PRAVCI RE- GRESIJE MOTIV. Promatramo slučajni pokus bacanje igraće kocke i slučajnu varijablu X = suma brojeva koji su pali i slučajnu varijablu Y = broj ako su pali jednaki brojevi, inače. (c) Jesu li X i Y nezavisne varijable? (d) Izračunajte kovarijancu. (e) Jesu li X i Y korelirane varijable? Definicija. (KOVARIJANCA SLUČAJNOG VEKTORA - engl.covariance of X and Y) Neka je (X, Y) : Ω R -dim slučajni vektor. Kovarijanca slučajnog vektora (X, Y) je µ XY = E((X E(X))(Y E(Y))) = E(X Y) E(X) E(Y). Ako su X i Y nezavisne slučajne varijable onda je µ XY =. PRIMJER. (a) Var(X + Y) = Var(X) + Var(Y) + µ XY (b) Ako su X i Y nezavisne slučajne varijable onda je Var(X + Y) = Var(X) + Var(Y). Dokaz: tko želi znati više Ako je h(x, y) = x + y onda je Z = X + Y slučajna varijabla, funkcija slučajnog vektora (X, Y). Var(Z) = E(Z ) (E(Z)) = E((X + Y) ) (E(X + Y)) = E(X + X Y + Y ) (E(X) + E(Y)) = E(X ) + E(X Y) + E(Y ) ((E(X)) + E(X) E(Y) + (E(Y)) ) = E(X ) (E(X)) + E(Y ) (E(Y)) + (E(X Y) E(X) E(Y)) Ako su X i Y nezavisne slučajne varijable onda je µ XY = pa tvrdnja slijedi iz (a). Definicija.7 (KOEFICIJENT KORELACIJE, engl. correlation coefficient ) Neka je (X, Y) : Ω R -dim slučajni vektor Neka je µ XY kovarijanca slučajnih varijabli X i Y, a σ i σ njihove standardne devijacije. Koeficijent korelacije komponenti X i Y slučajnog vektora je definiran s ρ XY = µ XY σ σ. 7 Radni materijal
.. KOVARIJANCA, KORELACIJA, PRAVCI REGRESIJE T: SVOJSTVA KOEFICIJENTA KORELACIJE ρ XY : (i) ρ XY = ρ YX, (ii) ρ XY, (iii) ρ XY = ako je Y = ax + b, a >, ρ XY = ako je Y = ax + b, a <, (iv) ρ UW = ρ XY, ako je U = ax + b, W = cy + d, a, c. D: tko želi znati više (ii) Za slučajnu varijablu U = σ X σ Y, odredimo varijancu: Var(U) = E(U ) (E(U)) = E(σ X σ σ XY + σ Y ) (σ E(X) σ E(Y)) = σ E(X ) σ σ E(XY) + σ E(Y ) (σ (E(X)) σ σ E(X)E(Y) + σ (E(Y)) ) = σ Var(X) + σ Var(Y) σ σ (E(XY) E(X)E(Y)) = σ σ + σ σ σ σ µ XY = σ σ σ σ µ XY. Budući je varijanca pozitivan broj zaključujemo da je µ XY σ σ, ρ XY. Analogno, promatrajući slučajnu varijablu U = σ X+σ Y dobit ćemo nejednakost µ XY σ σ, ρ XY. (iii) µ XY = E(XY) E(X)E(Y) = E(X(aX + b)) E(X)E(aX + b) = ae(x ) + be(x) a(e(x)) + be(x) = avar(x) = aσ, σ = Var(Y) = Var(aX + b) = a Var(X) = a σ, ρ XY = µ XY σ σ = aσ σ σ a = a a. Definicija.8 (NEKORELIRANE SLUČAJNE VARIJABLE) Neka je (X, Y) : Ω R -dim slučajni vektor Neka je µ XY kovarijanca slučajnih varijabli X i Y, a σ i σ njihove standardne devijacije. Za slučajne varijable X i Y kažemo da su nekorelirane ako je koeficijent korelacije ρ XY =. Ako je ρ XY slučajne varijable su korelirane. Radni materijal 8
. DVODIMENZIONALNI PRIMJER.5 (a) Ako su X i Y nezavisne slučajne varijable onda su one nekorelirane. (b) Ako su X i Y nekorelirane slučajne varijable onda one ne moraju biti nezavisne. Dokaz: (a) X i Y nezavisne µ XY = ρ XY = X i Y nekorelirane. (b) X i Y nekorelirane ρ XY = ali ne moraju biti X i Y nezavisne (mogu se naći primjeri). NAPOMENA. Neka je zadan slučajni vektor (X, Y) s funkcijom vjerojatnosti f (x, y), ili funkcija gustoće vjerojatnosti. Tražimo funkcijsku vezu izmedu slučajnih varijabli X i Y npr. Y = g(x) tako da E((Y g(x) )) min. Tada se krivulja dana jednadžbom y = g(x) zove regresijska krivulja od Y po X (u smislu najmanjih kvadrata) i odreduje se kao ili y = g(x) = E(Y X = x) = y = g(x) = E(Y X = x) = j= y j f (x, y j ) f (x y f (x, y) f (x) Ako pretpostavimo linearnu ovisnost Y od X tako da je g(x) = ax + b onda kao regresijsku krivulju dobijemo pravac: y µ = ρ XY σ σ (x µ ) je pravac regresije Y po X. Koeficijent a = ρ XY σ = µ XY σ σ je koeficijent regresije Y po X. PRIMJER. Neka je (X, Y) : Ω R -dim slučajni vektor. Neka je µ XY kovarijanca slučajnih varijabli X i Y, ρ XY koeficijent korelacije, σ i σ njihove standardne devijacije, a µ, µ njihova očekivanja. Pretostavimo da su X i Y zavisne slučajne varijable takve da je Y = ax + b. Parametre a i b možemo odrediti metodom najmanjih kvadrata tako da E((Y (ax + b)) ) ima minimalnu vrijednost. a = ρ XY σ = µ XY σ σ je koeficijent regresije Y po X. b = µ ρ XY σ µ = µ µ XY σ σ µ. y µ = µ XY σ (x µ ), Radni materijal
.. KOVARIJANCA, KORELACIJA, PRAVCI REGRESIJE y µ = ρ XY σ σ (x µ ) je pravac regresije Y po X. Analogno, ako je X=aY+b a = ρ XY σ = µ XY σ σ je koeficijent regresije X po Y x µ = µ XY σ (Y µ ), x µ = ρ XY σ σ (y µ ) je pravac regresije X po Y. Dokaz: tko želi znati više (metoda najmanjih kvadrata) Označimo K(a, b) = E((Y ax b) ) = E(Y µ a(x µ ) b + µ aµ ) = σ + a σ aµ XY + (µ b aµ ) K(a, b) je funkcija od varijable i tražimo njen ekstrem. Nužni uvjeti su K a = aσ µ XY (µ b aµ ) =, K b = (µ b aµ ) =. Rješavanjem ovog sustava od jed. s nepoznanice dobit ćemo a = µ XY σ, b = µ aµ = µ µ XY σ µ. NAPOMENA.5 Pravci regresije sijeku se u točki (µ, µ ) koja se zove centar zajedničke distribucije X i Y. Kut izmedu pravaca regresije tgϕ = ρ XY σ σ ρ XY σ +. σ Ako je ρ XY = ili pravci regresije se poklapaju i tada postoji potpuna linearna zavisnost izmedu X i Y. Ako je ρ XY = onda su pravci regresije y = µ, x = µ okpmiti, a ne postoji linearna zavisnost slučajnih varijabli X i Y. PRIMJER.7 Za primjer slučajnog vektora (X, Y) nadite kovarijancu, koeficijent korelacije i pravce regresije. Radni materijal
. DVODIMENZIONALNI X/Y f (x) f (y) 8 xi p ij y j xi p ij 5 8 8 8 8 yj p ij x i yj p ij 8 5 8 8 8 8 8 78 8 8 µ = E(X) = µ = E(Y) = E(X ) = E(Y ) = σ σ x i f (x i ) = y j f (y j ) = x i f (x i ) = y j f (y j ) = 8 + 8 + 8 = 8 8 + 5 8 + 8 = 5 8 8 + 8 = 8 8 8 + 8 = Var(X) = 8 ( 8 ) = = Var(Y) = 8 (5 8 ) = 7 8 + 5 8 + 8 = 8 Kovarijanca je µ XY = E(XY) E(X)E(Y) = 8 8 5 8 =. Pravac regresije Y po X je y µ = µ XY σ (x µ ), y 5 y = x +. Pravac regresije X po Y je x µ = µ XY σ (y µ ), x x = 7 y + 7, y = 7 x. Pravci se sijeku u točki (µ, µ ) = (, 5 ). tgϕ = 7 + 7 Koeficijent korelacije je ρ XY = 8 = 8 = 7 (x 8 ), = ; Kut izmedu pravaca regresije je ϕ = 8.. µ XY σ σ = 7 =.5. (y 5 8 ), Radni materijal
.. KOVARIJANCA, KORELACIJA, PRAVCI REGRESIJE y y x ( ) (, ), 5 y 7 x x Slika.: Pravci regresije slučajnog vektora (X, Y). Prisjetimo se motivacijskog primjera: PRIMJER.8 motiv Promatramo slučajni pokus bacanje igraće kocke i slučajnu varijablu X = suma brojeva koji su pali i slučajnu varijablu Y = broj ako su pali jednaki brojevi, inače. (c) Jesu li X i Y nezavisne varijable? (d) Izračunajte kovarijancu. (e) Jesu li X i Y korelirane varijable? Rješenje: (c) X/Y f (x) 5 5 7 8 5 f (y) Varijable nisu nezavisne jer je npr. f (, ) f () f (), f (, ) =, f () = 5, f () =. Radni materijal
. DVODIMENZIONALNI (d) E(X) = 7, E(Y) =, E(XY) = i x i j y j f (x i, y j ) = 7 Kovarijanca je µ XY = E(XY) E(X) E(Y) =, pa je i koeficijnt korelacije jednak ρ XY =. (e) Varijable su nekorelirane jer je koeficijnt korelacije jednak ρ XY =. Radni materijal
.. Ponovimo. Ponovimo DISKRETNI -dim diskretni -dim sl. vek. (X, Y) : Ω R funkcija vjerojatnosti f (x i, y j ) = P(X = x i, Y = y j ), (x i, y j ) R((X, Y)) funkcija distribucije vj. F(x, y) = P(X x, Y y) marginalne funkcije vj. po X f (x) = j f (x, y j ) po Y f (y) = i f (x i, y) nezavisne sl. var. funkcija -dim sl. vek. očekivanje od Z = h((x, Y)) ako su X i Y nezavisna f (x i, y j ) = f (x i ) f (y j ), za sve (x i, y j ) R((X, Y)) Z = h((x, Y)), h : R R E(Z) = i j h(x i, y j ) f (x i, y j ) E(X Y) = i j x i y j f (x i, y j ) E(X + Y) = E(X) + E(Y) E(X Y) = E(X) E(Y) KOVARIJANCA - KORELACIJA PRAVCI REGRESIJE kovarijanca od (X, Y) µ XY = E(XY) E(X) E(Y) koef. korelacije od (X, Y) ρ XY = µ XY σ σ nekorelirane sl. var. ρ XY = pravac regresije Y po X Var(X + Y) = Var(X) + Var(Y) + µ XY y µ = µ XY σ (x µ ) Radni materijal