SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET U RIJECI Specijalistički diplomski stručni studij građevinarstva Odabrana poglavlja inženjerske matematike MODEL JEDNOSTAVNE LINEARNE REGRESIJE Studenti: Sara Bestulić Lea Faraguna Dorijano Zupičić Nositeljica kolegija: mr. sc. Ines Radošević, prof. Rijeka, studeni 2016. 1
Regresijska analiza REGRESIJSKA ANALIZA JE STATISTIČKA METODA KOJOM SE ISPITUJU ODNOSI IZMEĐU POJAVA. S JEDNE STRANE SE NALAZI JEDNA ILI VIŠE POJAVA KOJE PREDSTAVLJAJU NEZAVISNE ILI OBJAŠNJAVAJUĆE VARIJABLE (X), A S DRUGE STRANE POJAVA KOJA PREDSTAVLJA ZAVISNU VARIJABLU (Y) KOJU SE ŽELI OBJASNITI. 2
PRIMJER: Na temelju primjera iz naše struke pokazati ćemo i objasniti model linearne regresije plaća i broja prodanih stanova u RH za određeno razdoblje. Godina Prosječno isplaćena neto plaća Broj prodanih stanova u RH x t y t x 2 t y t 2 y t e t x t y t 2001 3541,00 815,00 2885915,00 12538681,00 664225,00 877,38-62,38 2002 3720,00 879,00 3269880,00 13838400,00 772641,00 898,29-19,29 2003 3940,00 1024,00 4034560,00 15523600,00 1048576,00 923,98 100,02 2004 4173,00 1043,00 4352439,00 17413929,00 1087849,00 951,20 91,80 2005 4376,00 952,00 4165952,00 19149376,00 906304,00 974,91-22,91 2006 4603,00 941,00 4331423,00 21187609,00 885481,00 1001,43-60,43 2007 4841,00 959,00 4642519,00 23435281,00 919681,00 1029,23-70,23 2008 5178,00 1067,00 5524926,00 26811684,00 1138489,00 1068,59-1,59 2009 5311,00 1033,00 5486263,00 28206721,00 1067089,00 1084,13-51,13 2010 5343,00 1184,00 6326112,00 28547649,00 1401856,00 1087,87 96,13 UKUPNO 45026,00 9897,00 45019989,0 206652930,00 9892191,00 9897,00 0,000 Tabela 1. Prosječno isplaćena neto plaća i broj prodanih stanova u RH u razdoblju od 2001. do 2010. 3
BROJ PRODANIH STANOVA U 000 Dijagram rasipanja 1400,00 1200,00 1000,00 800,00 600,00 400,00 200,00 0,00 0,00 1000,00 2000,00 3000,00 4000,00 5000,00 6000,00 PROSJEČNO ISPLAĆENA NETO PLAĆA Grafikon 1. Dijagram rasipanja prosječno isplaćene neto plaće i broja prodanih stanova u RH u razdoblju od 2001. do 2010. Izvor: Tablica 1. Ovim modelom htjelo se dokazati da što je veća plaća, da je stanovništvo spremnije trošiti na kupnju stanova. Prema grafičkom prikazu doista slijedi da što je veća isplaćena neto plaća, da je i više prodanih stanova. Analitički će se to izraziti modelom jednostavne linearne regresije. Model jednostavne linearne regresije zahtijeva procjenu parametara pod pretpostavkom da između prosječno isplaćene neto plaće i broja prodanih stanova postoji linearna statistička veza. 4
Procjena parametara Parametri u modelu procijeniti će se metodom najmanjih kvadrata. U tabeli 1. nalaze se potrebni međurezultati. Model s procijenjenim parametrima (linearna regresijska jednadžba) dana je izrazom: Y t = a+ bx t b= X ty t n X Y X t 2 n X 2 = 45019989 10 4502,6 989,7 2066522930 10 4502,6 2 = 0,11681 a = Y b X = 989,7 0,11681 450,26 = 463,7576 X = Y = X t n = 45026 = 4502,6 10 Y t = 9897 = 989,7 n 10 Y t = 436,7576 + 0,11681X t 5
BROJ PRODANIH STANOVA U 000 Konstantni član a kada je neto isplaćena plaća 0 kn, broj prodanih stanova bit će 436,7576. Regresijski koeficijent b za svako povećanje plaće od 1000 kn, broj prodanih stanova povećati će se za 0,11681. 1400,00 1200,00 1000,00 800,00 600,00 400,00 200,00 y = 0,1168x + 463,76 R² = 0,5505 0,00 0,00 1000,00 2000,00 3000,00 4000,00 5000,00 6000,00 PROSJEČNO ISPLAĆENA NETO PLAĆA Grafikon 2. Dijagram rasipanja prosječno isplaćene neto plaće i broja prodanih stanova u RH u razdoblju od 2001. do 2010. sa ucrtanim regresijskim pravcem. Izvor: Tablica 1. 6
Regresijske vrijednosti Regresijske vrijednosti - vrijednosti regresijske funkcije s procijenjenim parametrima. Za x treba uvrstiti X t : Y 2001 = 436,7576 + 0,11681 3541 = 877,38 Prema regresiji, ako je prosječna neto plaća 3541 kn,stvaran broj prodanih stanova biti će 815, a očekivani 877,38. Razlika između stvarnog i očekivanog broja prodanih stanova čini rezidualno odstupanje te su razlike posljedica nesistematskih utjecaja na zavisnu varijablu. e t = Y t Y t 7
Rezidualno odstupanje Rezidualno odstupanje za 2001: e 1 = Y 1 Y 1 e 1 = 815 877,38 = 62,38 e 1,rel. = Y 1 Y 1 100 = 62,38 100 = 7,65% Y 1 815 Očekivani broj prodanih stanova je prema ocijenjenom modelu regresije precijenjen za 62,38 ili 7,65 %. 8
MJERE REPREZENTATIVNOSTI Varijanca Ukupna varijanca sastoji se od protumačenog i neprotumačenog dijela. Ukupan zbroj = Y t 2 n Y 2 = 9892191 10 989,7 2 = 97130,1 Protumačeni dio = a Y t + b X t Y t n Y 2 = 463,7576 9897 + 0,1168 45019989 10 989,7 2 = 53469,93 Neprotumačeni (rezidualni) dio = Y t 2 - a Y t - b X t Y t = 9892191 463,7576 9897 0,1168 45019989 = 43660,17 Napomena: Izračun parametara koji su nam potrebni da bi izračunali a i b u nastavku! Provjera: ukupan zbroj kvadrata = protumačeni dio + rezidualni dio 97130,1 = 53469,93 + 43660,17 97130,1 = 97130,1 9
MODELI REPREZENTATIVNOSTI a) Procjena standardne devijacije σ = y t 2 a y t b y t n 2 = 43660,17 8 = 73,875 stanova Koeficijent varijacije V = σ Y 100 = 73,875 989,7 100 = 7,46%% Prosječno odstupanje broja prodanih stanova od regresijskih vrijednosti je 73,875 stanova ili 7,46 %. S obzirom da je koeficijent vaijacije nizak, regresijski model je reprezentativan do 15 %. 10
MODELI REPREZENTATIVNOSTI b) Koeficijent determinacije R 2 = a Y t+ b X t Y t n Y 2 Y t 2 n Y 2 = 53469,93 97130,1 =0,5505 Udio protumačenog zbroja kvadrata u ukupnom zbroju kvadrata odstupanja jednak je 0,5505 pa je ovim modelom protumačeno 55,05% ukupnih odstupanja. Iako veći od 50%, prema ovome pokazatelju reprezentativnost modela je upitna. U praksi ako je koeficijent determinacije veći od 80 % model je reprezentativan. Uz mjere reprezentativnosti koriste se još i druge metode. 11
TESTIRANJE HIPOTEZE F-test F-test je mjera značajnosti procijenjenog modela Računa se kao: F = protumačena k neprotumačena n k 1 = 53469,93 1 43660,17 8 = 9,79 k broj nezavisnih varijabli n ukupan broj pojava Dobiveni F uspoređuje se sa graničnom vrijednošću dobivenoj iz tablice Hipoteze. 12
F-test H 0 : b = 0 H 1 : b 0 model nije značajan model je značajan α = 5% F = 9,797 F t = 5,32 F > F t pa sa 5 % značajnosti prihvaćamo H 1 da je izračunati modul značajan Kod modela jednostavne linearne regresije ekvivalent F-testu je t- test. T-test ispisuje značajnost pojedinog parametra odnosno da li je suvišan u modelu ili nije. 13
TESTIRANJE HIPOTEZE Signifikantnost modela/parametara, t-test H 0 : b = 0 H 1 : b 0 Standardna greška pogreške S b = σ 2 x 2 i n x 2 = 3,875 2 206652930 10 4502,6 2 = 0,0373 b = b t = b S b = 0,11681 0,0373 = 3,13 14
Signifikantnost modela/parametara, t-test Odluka je slijedeća: empirijski t-omjer (3,13) veći je od tabličnog. Prema tome, ne prihvaća se pretpostavka da je varijabla broj prodanih stanova suvišna u modelu. Provedenim t-testom statističke signifikantnosti procijenjenih koeficijenata zaključeno je da se prihvaća hipoteza o postojanju značajnog odnosa između varijabli broja prodanih stanova i neto plaće na razini 5 % signifikantnosti. Provjera: t 2 = F 15
ZAKLJUČAK Budući da je ispunjena jednakost t 2 = F odabrani model je reprezentativan! 16
U nastavku ćemo još navesti 2 rješena primjera iz knjige koji se rješavaju na isti princip kao i prethodno prikazan primjer. Primjer 12.4. od I.Sošić: Primjenjena statistika 17
Primjer 12.4. od I.Sošić: Primjenjena statistika 18
Primjer 12.4. od I.Sošić: Primjenjena statistika 19
Primjer 12.4. od I.Sošić: Primjenjena statistika 20
Primjer 12.5. od I.Sošić: Primjenjena statistika Mjere reprezentativnosti 21
Primjer 12.5. od I.Sošić: Primjenjena statistika 22
Pitanja: 1. ŠTO JE REGRESIJSKA ANALIZA? REGRESIJSKA ANALIZA JE STATISTIČKA METODA KOJOM SE ISPITUJU ODNOSI IZMEĐU POJAVA. S JEDNE STRANE SE NALAZI JEDNA ILI VIŠE POJAVA KOJE PREDSTAVLJAJU NEZAVISNE ILI OBJAŠNJAVAJUĆE VARIJABLE (X), A S DRUGE STRANE POJAVA KOJA PREDSTAVLJA ZAVISNU VARIJABLU (Y) KOJU SE ŽELI OBJASNITI. 2. NAPIŠI HIPOTEZU ZA T-TEST I F-TEST T-TEST T < T T = H 0 :B = 0 NE POSTOJI STATISTIČKI ODNOS IZMEĐU VARIJABLI T > T T = H 1 H 1 :B 0 POSTOJI STATISTIČKI ODNOS IZMEĐU VARIJABLI F-TEST F < F T = H 0 : B 1 = B 2 = B I = 0 NEMA STATISTIČKI SIGNIFIKANTAN ODNOS IZMEĐU NEZAVISNIH I ZAVISNE VARIJABLE F > F T = H 1 : b j 0 J=1,2... SVI KOEFICIJENTI NISU JEDNAKI 0, POSTOJI STATISTIČKI SIGNIFIKANTAN ODNOS IZMEĐU NEZAVISNIH I ZAVISNE VARIJABLE. 23
POPIS LITERATURE: 1. IVAN SOŠIĆ: PRIMIJENJENA STATISTIKA 2. DOC. DR. SC. IVA FRANJIĆ: (BIO)STATISTIKA, SKRIPTA, PREHRAMBENA TEHNOLOGIJA I BIOTEHNOLOGIJA, 2012. 3. MR.SC. BOJAN KOVAČIĆ: POSLOVNA STATISTIKA, INTERNA SKRIPTA, TEHNIČKO VELEUČILIŠTE U ZAGREBU, ELEKTORTEHNIČKI ODJEL 4. HTTP://WEB.EFZG.HR/DOK/STA/VBAHOVEC/STATISTICKE%20METODE%20ZA% 20EKONOMSKE%20ANALIZE/4_PREDAVANJE_JEDNOSTAVNA%20LINEARN A%20REGRESIJA.PDF 24
Zahvaljujemo na pažnji! Sara Bestulić Lea Faraguna Dorijano Zupičić 25