MODEL JEDNOSTAVNE LINEARNE REGRESIJE

Σχετικά έγγραφα
GRAĐEVINSKI FAKULTET SVEUČILIŠTE U RIJECI. Specijalistički diplomski stručni studij građevinarstva NORMALNA RAZDIOBA.

ELEKTROTEHNIČKI ODJEL

SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET U RIJECI. Specijalistički diplomski stručni studij

numeričkih deskriptivnih mera.

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

REGRESIJSKA ANALIZA zavisnost (korelacija) regresijske tehnike kvantitativno zavisnost (korelaciju) linearna regresija

Korelacijska i regresijska analiza

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

Grafičko prikazivanje atributivnih i geografskih nizova

Funkcije dviju varjabli (zadaci za vježbu)

3.1 Granična vrednost funkcije u tački

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

1.4 Tangenta i normala

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Obrada signala

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Matematička analiza 1 dodatni zadaci

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

Regresija i korelacija

RIJEŠENI ZADACI I TEORIJA IZ

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

5. Karakteristične funkcije

Ispitivanje toka i skiciranje grafika funkcija

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

SISTEMI NELINEARNIH JEDNAČINA

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

FAKULTET PROMETNIH ZNANOSTI

NEPARAMETRIJSKE TEHNIKE

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z.

7 Algebarske jednadžbe

Izbor statističkih testova Ana-Maria Šimundić

Zavrxni ispit iz Matematiqke analize 1

18. listopada listopada / 13

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

13. TESTIRANJE HIPOTEZE O NEPOZNATIM KARAKTERISTIKAMA POPULACIJE

3 Populacija i uzorak

( , 2. kolokvij)

TRIGONOMETRIJSKE FUNKCIJE I I.1.

DIMENZIONISANJE PRAVOUGAONIH POPREČNIH PRESEKA NAPREGNUTIH NA PRAVO SLOŽENO SAVIJANJE

Uvod u neparametarske testove

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

Korelacija i regresija seminar

Testiranje statistiqkih hipoteza

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

INTELIGENTNO UPRAVLJANJE

SEMINAR IZ KOLEGIJA ANALITIČKA KEMIJA I. Studij Primijenjena kemija

ZBIRKA POTPUNO RIJEŠENIH ZADATAKA

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

POTPUNO RIJEŠENIH ZADATAKA PRIRUČNIK ZA SAMOSTALNO UČENJE

Kaskadna kompenzacija SAU

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

Matematika 1 - vježbe. 11. prosinca 2015.

4. MJERE DISPERZIJE. Josipa Perkov, prof., pred. 1

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Osnovne teoreme diferencijalnog računa

GRAĐEVINSKI FAKULTET SVEUČILIŠTE U RIJECI. Specijalistički diplomski stručni studij MANN-WHITNEY-WILCOXONOV TEST ZA NEZAVISNE UZORKE.

Sistemi veštačke inteligencije primer 1

Računarska grafika. Rasterizacija linije

Eliminacijski zadatak iz Matematike 1 za kemičare

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

, i = 1, 2, n. Tabela 1 Koeficijent proste korelacije. Standardizovani regresioni koeficijent. Regresioni koeficijent b

FTN Novi Sad Katedra za motore i vozila. Teorija kretanja drumskih vozila Vučno-dinamičke performanse vozila: MAKSIMALNA BRZINA

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

Dvanaesti praktikum iz Analize 1

PISMENI ISPIT IZ STATISTIKE

Program testirati pomoću podataka iz sledeće tabele:

Analiza varijanse sa jednim Posmatra se samo jedna promenljiva

Linearna algebra 2 prvi kolokvij,

Mašinsko učenje. Regresija.

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

Riješeni zadaci: Limes funkcije. Neprekidnost

( , treći kolokvij) 3. Na dite lokalne ekstreme funkcije z = x 4 + y 4 2x 2 + 2y 2 3. (20 bodova)

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

Riješeni zadaci: Nizovi realnih brojeva

Antene. Srednja snaga EM zračenja se dobija na osnovu intenziteta fluksa Pointingovog vektora kroz sferu. Gustina snage EM zračenja:

41. Jednačine koje se svode na kvadratne

Numerička matematika 2. kolokvij (1. srpnja 2009.)

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000,

BILJEŠKE ZA PREDAVANJA (za internu uporabu)

100g maslaca: 751kcal = 20g : E maslac E maslac = (751 x 20)/100 E maslac = 150,2kcal 100g med: 320kcal = 30g : E med E med = (320 x 30)/100 E med =

Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu

MATEMATIKA 1 8. domaća zadaća: RADIJVEKTORI. ALGEBARSKE OPERACIJE S RADIJVEKTORIMA. LINEARNA (NE)ZAVISNOST SKUPA RADIJVEKTORA.

radni nerecenzirani materijal za predavanja

Regresijska zavisnost. Jednostavna regresija

Elementi spektralne teorije matrica

VJEŽBE 3 BIPOLARNI TRANZISTORI. Slika 1. Postoje npn i pnp bipolarni tranziostori i njihovi simboli su dati na slici 2 i to npn lijevo i pnp desno.

Operacije s matricama

Transcript:

SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET U RIJECI Specijalistički diplomski stručni studij građevinarstva Odabrana poglavlja inženjerske matematike MODEL JEDNOSTAVNE LINEARNE REGRESIJE Studenti: Sara Bestulić Lea Faraguna Dorijano Zupičić Nositeljica kolegija: mr. sc. Ines Radošević, prof. Rijeka, studeni 2016. 1

Regresijska analiza REGRESIJSKA ANALIZA JE STATISTIČKA METODA KOJOM SE ISPITUJU ODNOSI IZMEĐU POJAVA. S JEDNE STRANE SE NALAZI JEDNA ILI VIŠE POJAVA KOJE PREDSTAVLJAJU NEZAVISNE ILI OBJAŠNJAVAJUĆE VARIJABLE (X), A S DRUGE STRANE POJAVA KOJA PREDSTAVLJA ZAVISNU VARIJABLU (Y) KOJU SE ŽELI OBJASNITI. 2

PRIMJER: Na temelju primjera iz naše struke pokazati ćemo i objasniti model linearne regresije plaća i broja prodanih stanova u RH za određeno razdoblje. Godina Prosječno isplaćena neto plaća Broj prodanih stanova u RH x t y t x 2 t y t 2 y t e t x t y t 2001 3541,00 815,00 2885915,00 12538681,00 664225,00 877,38-62,38 2002 3720,00 879,00 3269880,00 13838400,00 772641,00 898,29-19,29 2003 3940,00 1024,00 4034560,00 15523600,00 1048576,00 923,98 100,02 2004 4173,00 1043,00 4352439,00 17413929,00 1087849,00 951,20 91,80 2005 4376,00 952,00 4165952,00 19149376,00 906304,00 974,91-22,91 2006 4603,00 941,00 4331423,00 21187609,00 885481,00 1001,43-60,43 2007 4841,00 959,00 4642519,00 23435281,00 919681,00 1029,23-70,23 2008 5178,00 1067,00 5524926,00 26811684,00 1138489,00 1068,59-1,59 2009 5311,00 1033,00 5486263,00 28206721,00 1067089,00 1084,13-51,13 2010 5343,00 1184,00 6326112,00 28547649,00 1401856,00 1087,87 96,13 UKUPNO 45026,00 9897,00 45019989,0 206652930,00 9892191,00 9897,00 0,000 Tabela 1. Prosječno isplaćena neto plaća i broj prodanih stanova u RH u razdoblju od 2001. do 2010. 3

BROJ PRODANIH STANOVA U 000 Dijagram rasipanja 1400,00 1200,00 1000,00 800,00 600,00 400,00 200,00 0,00 0,00 1000,00 2000,00 3000,00 4000,00 5000,00 6000,00 PROSJEČNO ISPLAĆENA NETO PLAĆA Grafikon 1. Dijagram rasipanja prosječno isplaćene neto plaće i broja prodanih stanova u RH u razdoblju od 2001. do 2010. Izvor: Tablica 1. Ovim modelom htjelo se dokazati da što je veća plaća, da je stanovništvo spremnije trošiti na kupnju stanova. Prema grafičkom prikazu doista slijedi da što je veća isplaćena neto plaća, da je i više prodanih stanova. Analitički će se to izraziti modelom jednostavne linearne regresije. Model jednostavne linearne regresije zahtijeva procjenu parametara pod pretpostavkom da između prosječno isplaćene neto plaće i broja prodanih stanova postoji linearna statistička veza. 4

Procjena parametara Parametri u modelu procijeniti će se metodom najmanjih kvadrata. U tabeli 1. nalaze se potrebni međurezultati. Model s procijenjenim parametrima (linearna regresijska jednadžba) dana je izrazom: Y t = a+ bx t b= X ty t n X Y X t 2 n X 2 = 45019989 10 4502,6 989,7 2066522930 10 4502,6 2 = 0,11681 a = Y b X = 989,7 0,11681 450,26 = 463,7576 X = Y = X t n = 45026 = 4502,6 10 Y t = 9897 = 989,7 n 10 Y t = 436,7576 + 0,11681X t 5

BROJ PRODANIH STANOVA U 000 Konstantni član a kada je neto isplaćena plaća 0 kn, broj prodanih stanova bit će 436,7576. Regresijski koeficijent b za svako povećanje plaće od 1000 kn, broj prodanih stanova povećati će se za 0,11681. 1400,00 1200,00 1000,00 800,00 600,00 400,00 200,00 y = 0,1168x + 463,76 R² = 0,5505 0,00 0,00 1000,00 2000,00 3000,00 4000,00 5000,00 6000,00 PROSJEČNO ISPLAĆENA NETO PLAĆA Grafikon 2. Dijagram rasipanja prosječno isplaćene neto plaće i broja prodanih stanova u RH u razdoblju od 2001. do 2010. sa ucrtanim regresijskim pravcem. Izvor: Tablica 1. 6

Regresijske vrijednosti Regresijske vrijednosti - vrijednosti regresijske funkcije s procijenjenim parametrima. Za x treba uvrstiti X t : Y 2001 = 436,7576 + 0,11681 3541 = 877,38 Prema regresiji, ako je prosječna neto plaća 3541 kn,stvaran broj prodanih stanova biti će 815, a očekivani 877,38. Razlika između stvarnog i očekivanog broja prodanih stanova čini rezidualno odstupanje te su razlike posljedica nesistematskih utjecaja na zavisnu varijablu. e t = Y t Y t 7

Rezidualno odstupanje Rezidualno odstupanje za 2001: e 1 = Y 1 Y 1 e 1 = 815 877,38 = 62,38 e 1,rel. = Y 1 Y 1 100 = 62,38 100 = 7,65% Y 1 815 Očekivani broj prodanih stanova je prema ocijenjenom modelu regresije precijenjen za 62,38 ili 7,65 %. 8

MJERE REPREZENTATIVNOSTI Varijanca Ukupna varijanca sastoji se od protumačenog i neprotumačenog dijela. Ukupan zbroj = Y t 2 n Y 2 = 9892191 10 989,7 2 = 97130,1 Protumačeni dio = a Y t + b X t Y t n Y 2 = 463,7576 9897 + 0,1168 45019989 10 989,7 2 = 53469,93 Neprotumačeni (rezidualni) dio = Y t 2 - a Y t - b X t Y t = 9892191 463,7576 9897 0,1168 45019989 = 43660,17 Napomena: Izračun parametara koji su nam potrebni da bi izračunali a i b u nastavku! Provjera: ukupan zbroj kvadrata = protumačeni dio + rezidualni dio 97130,1 = 53469,93 + 43660,17 97130,1 = 97130,1 9

MODELI REPREZENTATIVNOSTI a) Procjena standardne devijacije σ = y t 2 a y t b y t n 2 = 43660,17 8 = 73,875 stanova Koeficijent varijacije V = σ Y 100 = 73,875 989,7 100 = 7,46%% Prosječno odstupanje broja prodanih stanova od regresijskih vrijednosti je 73,875 stanova ili 7,46 %. S obzirom da je koeficijent vaijacije nizak, regresijski model je reprezentativan do 15 %. 10

MODELI REPREZENTATIVNOSTI b) Koeficijent determinacije R 2 = a Y t+ b X t Y t n Y 2 Y t 2 n Y 2 = 53469,93 97130,1 =0,5505 Udio protumačenog zbroja kvadrata u ukupnom zbroju kvadrata odstupanja jednak je 0,5505 pa je ovim modelom protumačeno 55,05% ukupnih odstupanja. Iako veći od 50%, prema ovome pokazatelju reprezentativnost modela je upitna. U praksi ako je koeficijent determinacije veći od 80 % model je reprezentativan. Uz mjere reprezentativnosti koriste se još i druge metode. 11

TESTIRANJE HIPOTEZE F-test F-test je mjera značajnosti procijenjenog modela Računa se kao: F = protumačena k neprotumačena n k 1 = 53469,93 1 43660,17 8 = 9,79 k broj nezavisnih varijabli n ukupan broj pojava Dobiveni F uspoređuje se sa graničnom vrijednošću dobivenoj iz tablice Hipoteze. 12

F-test H 0 : b = 0 H 1 : b 0 model nije značajan model je značajan α = 5% F = 9,797 F t = 5,32 F > F t pa sa 5 % značajnosti prihvaćamo H 1 da je izračunati modul značajan Kod modela jednostavne linearne regresije ekvivalent F-testu je t- test. T-test ispisuje značajnost pojedinog parametra odnosno da li je suvišan u modelu ili nije. 13

TESTIRANJE HIPOTEZE Signifikantnost modela/parametara, t-test H 0 : b = 0 H 1 : b 0 Standardna greška pogreške S b = σ 2 x 2 i n x 2 = 3,875 2 206652930 10 4502,6 2 = 0,0373 b = b t = b S b = 0,11681 0,0373 = 3,13 14

Signifikantnost modela/parametara, t-test Odluka je slijedeća: empirijski t-omjer (3,13) veći je od tabličnog. Prema tome, ne prihvaća se pretpostavka da je varijabla broj prodanih stanova suvišna u modelu. Provedenim t-testom statističke signifikantnosti procijenjenih koeficijenata zaključeno je da se prihvaća hipoteza o postojanju značajnog odnosa između varijabli broja prodanih stanova i neto plaće na razini 5 % signifikantnosti. Provjera: t 2 = F 15

ZAKLJUČAK Budući da je ispunjena jednakost t 2 = F odabrani model je reprezentativan! 16

U nastavku ćemo još navesti 2 rješena primjera iz knjige koji se rješavaju na isti princip kao i prethodno prikazan primjer. Primjer 12.4. od I.Sošić: Primjenjena statistika 17

Primjer 12.4. od I.Sošić: Primjenjena statistika 18

Primjer 12.4. od I.Sošić: Primjenjena statistika 19

Primjer 12.4. od I.Sošić: Primjenjena statistika 20

Primjer 12.5. od I.Sošić: Primjenjena statistika Mjere reprezentativnosti 21

Primjer 12.5. od I.Sošić: Primjenjena statistika 22

Pitanja: 1. ŠTO JE REGRESIJSKA ANALIZA? REGRESIJSKA ANALIZA JE STATISTIČKA METODA KOJOM SE ISPITUJU ODNOSI IZMEĐU POJAVA. S JEDNE STRANE SE NALAZI JEDNA ILI VIŠE POJAVA KOJE PREDSTAVLJAJU NEZAVISNE ILI OBJAŠNJAVAJUĆE VARIJABLE (X), A S DRUGE STRANE POJAVA KOJA PREDSTAVLJA ZAVISNU VARIJABLU (Y) KOJU SE ŽELI OBJASNITI. 2. NAPIŠI HIPOTEZU ZA T-TEST I F-TEST T-TEST T < T T = H 0 :B = 0 NE POSTOJI STATISTIČKI ODNOS IZMEĐU VARIJABLI T > T T = H 1 H 1 :B 0 POSTOJI STATISTIČKI ODNOS IZMEĐU VARIJABLI F-TEST F < F T = H 0 : B 1 = B 2 = B I = 0 NEMA STATISTIČKI SIGNIFIKANTAN ODNOS IZMEĐU NEZAVISNIH I ZAVISNE VARIJABLE F > F T = H 1 : b j 0 J=1,2... SVI KOEFICIJENTI NISU JEDNAKI 0, POSTOJI STATISTIČKI SIGNIFIKANTAN ODNOS IZMEĐU NEZAVISNIH I ZAVISNE VARIJABLE. 23

POPIS LITERATURE: 1. IVAN SOŠIĆ: PRIMIJENJENA STATISTIKA 2. DOC. DR. SC. IVA FRANJIĆ: (BIO)STATISTIKA, SKRIPTA, PREHRAMBENA TEHNOLOGIJA I BIOTEHNOLOGIJA, 2012. 3. MR.SC. BOJAN KOVAČIĆ: POSLOVNA STATISTIKA, INTERNA SKRIPTA, TEHNIČKO VELEUČILIŠTE U ZAGREBU, ELEKTORTEHNIČKI ODJEL 4. HTTP://WEB.EFZG.HR/DOK/STA/VBAHOVEC/STATISTICKE%20METODE%20ZA% 20EKONOMSKE%20ANALIZE/4_PREDAVANJE_JEDNOSTAVNA%20LINEARN A%20REGRESIJA.PDF 24

Zahvaljujemo na pažnji! Sara Bestulić Lea Faraguna Dorijano Zupičić 25