0. REGRESIJA I KORELACIJA Jospa Perkov, prof., pred.
Jedodmezoala aalza stražvaje vaje jede pojave predočee ee statstčkm zom ezavso od drugh, statstčkm metodama (grafčko tabelaro prkazvaje za, zračuavaje razlčth th brojčah pokazatelja) kako b se dojel zaključc o svojstvma dae pojave Moštvo je slučajeva koj se odose a stražvaje vaje međusobog odosa dvju l vše e pojava promjea jede pojave uvjetovaa je promjeama druge l drugh Povezaost pojava može e bt: fukcoala veze se mogu predočt zrazma a temelju kojh se točo utvrđuje vrjedost jede za dau vrjedost druge (drugh) vrjedost: Y = f (X ) statstčka jedoj vrjedost jede pojave odgovara vše vrjedost druge (drugh) pojava
Pr stražvaju vaju masovh pojava aalzom treba utvrdt vezu među pojavama po oblku (leara l krvoljska), smjeru (poztva l egatva) jakost (fukcoala l statstčka) Istražvat se može jakost statstčkh veza stupaj statstčke povezaost zmeđu pojava mjer se metodama koje če područje korelacjske aalze Ako je svrha aaltčk (jedadžbom) zrazt odos zmeđu pojava, prmjet će e se regresjsk model Model koj sadrž jedu zavsu jedu ezavsu varjablu azva se modelom jedostave regresje,, a model sa dvje l vše e ezavsh varjabl model všestruke regresje Regresjska korelacjska aalza provode se a osov stvarh vrjedost pojava (varjabl) 3
Za određvaje oblka regresje kao vrlo prklado,, a jedostavo sredstvo služ djagram raspaja: kostrura se tako da se u koordat sustav (ajčešće e se korst I. kvadrat l do jega) uose parov vrjedost varjable X Y, tj.. o se sastoj od točaka (x(, y ) z rasporeda točaka zaključujemo ujemo o oblku, smjeru jakost veze 4
5
0.. JEDNOSTAVNA LINEARNA REGRESIJA Opsuje se odos među pojavama za koje je svojstveo da svakome jedčom om porastu vrjedost jede varjable odgovara prblžo jedaka leara promjea druge varjable Model jedostave leare regresje: Y = a + bx + u X = ezavsa varjabla Y = zavsa varjabla u = odstupaje od fukcoalog odosa a, b = parametr 6
Regresjska aalza provod se a temelju parova vrjedost varjabl X Y : (x(, y ), (x(, y ),..., (x(, y ), pa se model predočuje sustavom od jedadžb: y = a + bx + u Kada b odos među varjablama bo fukcoala,, svaka b vrjedost varjable u bla jedaka ul geometrjsk, sve b točke s koordatama (x(, y ), =,,..., ležale a stome pravcu 7
Kako su odos među pojavama statstčk, treba odredt krterj prema kojemu će e se zabrat jedadžba pravca ŷ = a + bx koja će ajbolje opsat odos pojava a temelju jhovh opažeh vrjedost u su procjee epozath vrjedost varjable u azvaju se rezdualm odstupajma: u = y yˆ a relatvo zražea rezduala odstupaja: u y yˆ, rel = y 00 Jedadžba pravca određea je ako su pozat parametr a b 8
Do procjee parametara ajčešće e se dolaz metodom ajmajh kvadrata sastoj se u određvaju oh procjea parametara za koje rezdual zbroj kvadrata postže e mmum b = = x = x y x y x, a = y b x Velča a b je regresjsk koefcjet pokazuje za kolko se u prosjeku mjeja vrjedost zavse varjable Y za jedču u promjeu vrjedost ezavse varjable X 9
Regresjska jedadžba je aaltčk zraz koj u smslu prosjeka opsuje odos među pojavama osova za mjereje reprezetatvost dsperzja oko regresje, koja se očtuje o a rezdualm odstupajma (maja( odstupaja emprjskh vrjedost zavse varjable od regresjskh vrjedost bolja reprezetatvost regresje) Stadarda devjacja regresje: σ Koefcjet varjacje regresje: V yˆ yˆ = y a y b = = = σ yˆ = y 00 x y 0
Specfča pokazatelj reprezetatvost regresje jest koefcjet determacje: R = a y + b x y y = =, 0 R y y = Model je reprezetatvj što je koefcjet determacje blž jedc
CHADOCKOVA LJESTVICA: koefcjet determacje 0.00 0.00 0.5 0.5 0.64 0.64.00.00 začeje odsutost veze slaba veza veza sredje jakost čvrsta veza potpua veza
PRIMJER. U tabel. zlože je postupak račuaja parametara leare regresjske jedadžbe dae su regresjske vrjedost. Uzmmo, a prmjer, da eko poduzeće aalzra podatke o ostvareom prometu dobt (oboje u ml. k) u 8 uzastoph goda: Promet Dobt x y x Regresjske vrjedost y x $ y 0 0 400.05 30 3 90 900.35 40 3.5 40 600 3.65 50 5 50 500 4.95 70 7 490 4900 7.55 80 8.5 680 6400 8.85 90 9 80 800 0.5 00 3 300 0000.45 480 50 3780 34800 50.00 Tabela.
Prkažmo prvo 8 parova vrjedost prometa dobt a djagramu raspaja: dobt u ml. k 4,0 Slka.,0 0,0 8,0 6,0 4,0,0 0,0 0 0 40 60 80 00 0 promet u ml. k
Vdmo sa slke da su točke raspoređee prblžo pravcu, a veza je poztva, tj. porast vrjedost jede varjable prat rast druge varjable Veza je prlče jakost jer su točke blzu zamšljeog pravca koj uvjek prolaz kroz točku ( x, y) Napomea: ovdje se rad o školskom prmjeru, s malm brojem parova vrjedost statstčk utemeljej zaključc dobvaju se a osov dulje serje vrjedost obju varjabl Ocjemo parametre a b leare regresje: x = x = = = = = 480 y 50 60, y 6.5 8 8
b 8 x y xy 3780 8 60 6.5 = = = = 8 34800 8 60 x x = 0.3 a = y b x = 6.5 0.3 60 =.55 Regresja s ocjejem parametrma glas: $ y = a + bx =.55 + 0.3x Prema dobveoj jedadžb, ako promet poraste za ml. k možemo očekvat povećaje dobt za 0.3 ml. k
Za da z emprjskh podataka ezavse varjable X, prpade se regresjske vrjedost (5. stupac z tabele ) račuaju jhovm uvrštavajem u regresjsku jedadžbu: $ y = a + bx =.55 + 0.3 0 =.05 $ y = a + bx =.55 + 0.3 30 =.35 L $ y = a + bx =.55 + 0.3 00 =.45 8 8 Regresjske su vrjedost pogodo sredstvo za progozraje. Na prmjer, možemo zračuat kolku dobt možemo očekvat ako b promet porastao a 0 ml. k: $ y( x= 0) = a + bx =.55 + 0.3 0 =.75 ml. k
σ = 48.5.55 50 0.3 3780 0.758 = + = = = = 8 $ y a y b x y ( ) y V $ y σ$ y 0.758 = 00 = 00 =.3% y 6.5 R = = y = a y + b x y y = = y.55 50 0.3 3780 8 6.5 0.4 48.5 8 6.5 06 + = = = 0.9566
0.. KOEFICIJENT LINEARNE KORELACIJE Pearsoov koefcjet leare korelacje - pokazatelj jakost smjera statstčke veze dvju pojava Podloga za jegovo račuaje je raspored točaka, tj.. parova opažeh vrjedost dvju varjabl u djagramu raspaja Podjelmo l djagram raspaja (slka.) pravcma X = x Y = y a 4 djela, vdmo, a prmjer da su, ako se rad o poztvoj learoj vez, točke (x(, y ) pretežo raspoređee u prvom trećem em kvadratu djagrama raspaja 9
0
Polaza velča a za mjereje jakost smjera je kovarjaca varjabl X Y: ( ) ( )( ) cov X, Y = µ = x x y y = x y x y = = Kovarjaca ovs o velč mjerm jedcama varjabl X Y,, a da b se dobo pokazatelj jakost eovsa o mjerm jedcama treba stadardzrat obje varjable Kovarjaca stadardzrah vrjedost je Pearsoov koefcjet leare korelacje: µ r =, r σ σ x y
Vrjedost koefcjeta jedaka ul govor da e postoj leara korelacja među pojavama, vrjedost da je potpua poztva smjera, a vrjedost - da je potpua egatvog smjera. Što je koefcjet po apsolutoj vrjedost blž jedc, veza je uža Pearsoov koefcjet leare korelacje moguće e je psat a vše ača: Kao produkt regresjskog koefcjeta b omjera stadardh x devjacja obju varjabl: r = b σ σ y Putem koefcjeta determacje: r = R ako se rad o egatvoj regresjskoj vez treba spred korjea stavt egatv predzak
0.3. KORELACIJA RANGA Isptvaje stupja veze zmeđu pojava dah u oblku modalteta redosljede (rag) varjable je moguće e a st ač kao za oe dae u oblku umerčkh zova, jer varjable raga emaju za to potreba metrčka svojstva Vrjedost dvju varjabl se ragraju po velč,, a povezaost jhovh ragova se mjer Spearmaovm koefcjetom korelacje raga: r s 6 d = =, r 3 s 3
Sa d su ozačee razlke zmeđu ragovma pojedh vrjedost varjable X Y : ( ) ( ) d = r x r y Vrjedostma pojede varjable prdruže su ragov tako da je ajmajoj vrjedost prdruže rag, sljedećoj po velč vrjedost ste varjable rag,... Maksmal moguć rag je. Ako se eka od vrjedost poavlja,, oda se svakoj od jh prdružuje uje artmetčka sreda prpadajućh h ragova 4
PRIMJER. Novar dvaju časopsa bral su meadžera gode. Desetorc kaddata ovar pojedog časopsa su daval bodove kojma je mjerea jhova uspješost. Izračuat ćemo stupaj korelacje krterja ocjejvaja obaju uredštava: 5
Red broj kaddata Bodov dodjeljeh od uredštva časopsa A x B Rag vrjedost varjable X Rag vrjedost varjable Y y r ( x ) ( ) Razlke ragova d r y Kvadrat razlka ragova 53 48 8 6 4 5 3 5-3 9 3 30 6 6 7-4 47 64 7 8-5 60 70 9 0-6 75 65 0 9 7 4 7-8 5 8 4.5 3.5.5 9 5 30 4.5 4 0.5 0.5 0 9 6 3 4 Ukupo - - 55 55 0 4.5 d
Objašjeje ragova u 4. stupcu: ajmajoj vrjedost varjable X koja zos 4, prdruže je rag. Sljedeć su po velč bodova 5 9, pa su jma prdruže ragov 3. ako toga sljede dva po velč jedaka broja bodova, 5, a kako su a redu ragov 4 5, to je svakoj vrjedost prdružea artmetčka sreda th dvaju ragova, tj. 4.5. Sljed po velč 30 bodova, kojma je prdruže rag 6,... r s d = 3 3 6 6 4.5 = = = 0.855 0 0 Spearmaov koefcjet korelacje raga je dosta blzu jedce, što zač da je veza među ragovma dvju varjabl poztva dosta jaka. Kaddat kojeg je jedo uredštvo ocjelo dobro, prošao je dobro kod drugog uredka obruto. To upućuje a dosta dobru usklađeost krterja obaju uredštva
PITANJA ZA USMENI DIO ISPITA: ) Razlka zmeđu fukcoale statstčke povezaost varjabl ) Djagram raspaja 3) Jedostava leara regresja 4) Chadockova ljestvca 5) Leara korelacja 6) Korelacja raga 8