.9. Regresioa aaliza U prethodom tekstu je avedeo da se u ekoomskim aalizama mogu koristiti različite matematičke fukcije za opisivaje zavisosti između posmatraih veličia. Za fukciju ukupih troškova, a primer, avedeo je pet različitih oblika fukcija koje su u upotrebi. Do odgovora koju od mogućih fukcija treba koristiti u kokretom slučaju dolazi se empirijskim istraživajima. Istraživaja se zasivaju a sakupljaju i obradi relevatih statističkih podataka. Hipotezu o statističkoj zavisosti posmatraih slučajih promeljivih potrebo je zatim jaso formulisati i testirati. Ovde razmatramo ajjedostaviji slučaj kada postoje samo dve promeljive i, pr. obim proizvodje i troškovi. Promeljiva se po pravilu aziva ezaviso promeljivom, a promeljiva zaviso promeljivom. Prvi korak je sakupiti podatke,,..., i odgovarajuće podatke,,...,, pr. podatke o obimu proizvodje i odgovarajućim troškovima. Podaci se običo prikazuju u tabelama. Sledeći uobičajei korak je acrtati tačke (,, (,,..., (, u koordiatoj ravi 0. Rezultujući skup tačaka aziva se dijagram rasejaja, skater dijagram ili skatergram. Sa dijagrama rasejaja često se lako uočava da postoji eka glatka kriva koja aproksimira podatke. Takva kriva aziva se aproksimativa kriva. Na slikama.. i.3. prikazaa su dva dijagrama rasejaja i dve moguće aproksimative krive. Slika.. Dijagram rasejaja
30 Operativi meaxmet i ( i, i ci i Slika.3. Dijagram rasejaja Podaci a slici.. dobro se aproksimiraju pravom liijom pa se zaključuje da između posmatraih promeljivih postoji lieara relacija. Podatke a slici.3. prava liija e bi dobro aproksimirala što zači da između posmatraih promeljivih postoji eka elieara relacija. Problem određivaja glatke krive koja dobro aproksimira razmatrae podatke aziva se problem fitovaja krive. Ako je aaliza usmerea a proveravaje hipoteze da se radi o međusobo zavisim veličiama pa treba utvrditi zako koji opisuje tu zavisost, oda se problem fitovaja krive aziva problemom regresije. (Sama reč regresija je izvoro začila azadovaje, a u statistici i vraćaje a sredju vredost. Odgovarajuća kriva se aziva regresioom krivom ili regresioom liijom. Kada se čitava aaliza radi da bi se proceila vredost zaviso promeljive za eku (proizvolju vredost ezavise promeljive, oda se kaže da se rešava problem estimacije. Do krive koja dobro fituje podatke može se doći slobodom rukom. Moge lieare zavisosti klasičo se utvrđuju upravo a taj ači: studet ili aalitičar ajpre a dijagramu rasejaja pomoću lejira acrta pravu liiju a potom određuje jee parametre. Ovaj ači ima ograičee mogućosti i zavisi od idividualih procea. To ije u skladu sa opštom amerom auče metode da se rezultat, u ovom slučaju regresioa liija, odredi a što je moguće objektiviji ači. Da bi se taj cilj postigao, običo se za određivaje regresioe liije koristi metoda ajmajih kvadrata. Kada se umesto origialih podataka o dve promeljive koristi regresioa liija, oda se za eko određeo i dobija a regresiooj liiji vredost ci koja se u opštem slučaju razlikuje od origialog podatka i. Razlika e i i - ci (.3 aziva se greška, devijacija ili rezidual. Oa može biti pozitiva, egativa ili jedaka uli, slika.4.
. Mikroekoomska aaliza 3 Slika.4. Greška fitovaja Kao mera koja pokazuje koliko dobro eka kriva aproksimira date podatke koristi se zbir kvadrata greške F e +... + e. (.33 Od svih aproksimativih krivih oa kriva koja za dati skup podataka ima osobiu da je zbir kvadrata greške miimala aziva se ajbolja kriva fitovaja. Ako bi se problem modifikovao tako da se kao zaviso promeljiva posmatra a kao ezaviso promeljiva, oda bi u raču trebalo uzeti horizotale umesto vertikalih devijacija, odoso greške po, a e po. Tako dobijea kriva ajmajih kvadrata e bi se poklopila sa prethodom. Moguće je kao krivu ajmajih kvadrata koristiti i krivu račuatu sa ormalim odstojajem tačke od liije, ali se takav pristup u praksi primejuje mogo ređe..9.. Lieara regresija Pokažimo kako se određuju parametri lieare regresije a 0 + a. (.34 Neka je dato parova podataka ( i, i. Radi jedostavosti pisaja u ovom delu teksta izostavljaćemo idekse promeljivih i kada se ove alaze ispod zaka za sumiraje i i i i i i. i (.35
3 Operativi meaxmet Zbir kvadrata grešaka je fukcija parametara a 0 i a F(a 0, a Σ ( - a 0 - a (.36 Potrebi uslovi za miimum fukcije F(a 0, a su df 0 da 0 df da 0 koji daju sistem jedačia a 0 + a Σ Σ a Σ + a 0 Σ Σ. (.37 Dobijei sistem jedačia čije rešavaje daje parametre regresioe liije aziva se sistem ormalih jedačia. Parametri a 0 i a mogu se odrediti sledećim formulama ( ( a ( a 0 ( ( ( (, ili ( a a0 (.38 Ozačimo sredje vredosti podataka sa sr i sr sr Σ / sr Σ / (.39 i uvedimo smee x i i - sr y i i - sr. Jedačia liije ajmajih kvadrata može se tada apisati xy y x x y x ili x x. (.40 U posebom slučaju kada su podaci takvi da je Σ 0, tj. sr 0, jedačia regresioe liije postaje sr +. (.4 Iz ovih jedačia je jaso da liija ajmajih kvadrata prolazi kroz tačku ( sr, sr koja se zove cetroid ili cetar gravitacije podataka. Opisai postupak odgovara pretpostavki da je zavisa, a ezavisa promeljiva. Ako se posmatra kao zavisa, a kao ezavisa
. Mikroekoomska aaliza 33 promeljiva, oda treba odrediti parametre b 0 i b jedačie b 0 + b. Rezultujuća liija, kao što je već rečeo, e poklapa se u opštem slučaju sa prethodom. Primer.4. Sledeća tabela daje podatke o obimu proizvodje (u toama i troškovima (u hiljadama diara za jedo preduzeće. Q /toe/ 30 3 34 36 37 38 39 C /hiljade di/ 58 60 6 6 65 7 75 Odrediti zavisost troškova od obima proizvodje. Rešeje: Mada daas i xepi kalkulatori imaju ugrađee programe za račuaje parametara lieare regresije, ovde se daje klasiča postupak koji se oslaja a podatke i međurezultate date u sledećoj tabeli i Q C QC Q C c 30 58 740 900 56,6 3 60 860 96 58, 3 34 6 074 56 63, 4 36 6 3 96 66,3 5 37 65 405 369 68,0 6 38 7 736 444 69,6 7 39 75 95 5 7, Σ 45 453 597 8674 Sistem ormalih jedačia je 7 a 0 + 45 a 453 45 a 0 + 8674a 597 a jegovo rešeje a 0 7,84 i a,65 tj. C 7,84 +,65 Q. U posledjoj koloi prethode tabele date su vredosti troškova izračuate a osovu dobijee regresioe liije. Da je zadatak bio utvrditi zavisost obima proizvodje Q od ukupih troškova Q b 0 + b C, dobila bi se regresioa prava Q 4,4 + 0,47 C koja se razlikuje od prethode..9.. Nelieara regresija Za opisivaje regresioe liije često se koriste poliome jedačie a 0 + a + a Parabola ili kvadrata kriva
34 Operativi meaxmet a 0 + a + a + a 3 3 Kuba kriva a 0 + a +... + a k k Kriva k-tog stepea Dese strae gorjih jedačia zovu se poliomi drugog, trećeg i k-tog stepea, respektivo. Sledeći sistem ormalih jedačia za krivu k-tog stepea a 0 + a +... + a k k dobije je izjedačavajem sa ulom parcijalih izvoda fukcije zbira kvadrata greške po parametrima a 0 + a Σ +...+ a k Σ k Σ a 0 Σ + a Σ +...+ a k Σ k+ Σ... a 0 Σ k + a Σ k+ +...+ a k Σ k Σ k (.4 Od velikog broja drugih mogućih jedačia za regresioe liije u praksi se sledeće koriste veoma često jer se određivaje jihovih parametara svodi a postupak račuaja parametara lieare regresije. ili a 0 a a + a + 0 ab a ab a b + ili log log a+ (log b a + a b + 0 ili log log a+ (log b a + a g g 0 Modifikova Modifikova pq b ili log log p + b log q ab + g Ekspoeci Hiperbola jala Geometrijsk kriva a kriva a ekspoecijala kriva a geometrijs ka kriva Gomprecovakriva pq b + h Modifikova a Gomprecova kriva ab + g ili ab + g Logisti ~ ka kriva a + a ( log + a ( log 0 Pokažimo kako se problem određivaja parametara modifikovae geometrijske krive a b + g svodi a problem lieare regresije. Prebacivajem g a levu strau i logaritmovajem jedačie dobija se log (-g log a + b log. Smeom y log(-g, a o loga, a b, i x log dobija se lieara jedačia y a 0 + a. Primer.5. U fabrici kablova privode se kraju pripreme za proizvodju ovog kabla čija će prodaja cea izositi 3,78, a troškovi
. Mikroekoomska aaliza 35 proizvodje,93 ovčaih jediica (.j po dužom metru. Zavisost tražje x od cee p sličih proizvoda data je tabelom. Cea /.j. po m/,00,50 3,00 4,00 5,00 Tražja / km/ 880 80 750 680 670 Koliku godišju dobit treba očekivati od prodaje ovog kabla ako se pretpostavi sledeća teorijska zavisost tražje od cee x a p b? Rešeje: Najpre treba predvideti tražju koja odgovara cei p3,78.j. U tu svrhu odredićemo parametre a i b koristeći zaje o liearoj regresiji. Logaritmovajem se dobija logx loga + blogp Smeama logx, A loga i P logp problem se prevodi u određivaje parametara A i b lieare regresije A + bp. Rešavajem se dobija A 3,03, a 075 i b - 0,3, tj. x075 p 0,3 /km/ Tražja za ceu p 3,78 je x(3,78 70,9km. Dobit po dužom metru je d p - c 3,78 -,93 0,85, a ukupa dobit D 60465.j. Dijagram rasejaja pomaže pri odlučivaju koju od avedeih krivih treba koristiti. Ukoliko dijagram pokazuje eliearu zavisost između promeljivih, korisim se može pokazati dijagram trasformisaih promeljivih. Naprimer, za geometrijsku krivu treba koristiti logaritme origialih podataka ili specijali, logaritamski kalibrisa papir..9.3. Korelacija Regresioa liija izražava prirodu odosa između dve promeljive. Regresioa jedačia pokazuje kako se zaviso promeljiva meja kao rezultat promee ezaviso promeljive. Parametri regresije se izračuavaju a osovu statističkih podataka korišćejem opisaih algoritama. Sami parametri e sadrže iformaciju koliko dobro regresioa liija reprezetuje origiale podatke. U svrhu utvrđivaja stepea zavisosti između posmatraih veličia treba uraditi dodatu statističku aalizu. Stepe zavisosti aziva se korelacijom. Ukoliko su odstojaja realih podataka od regresioe liije maja, korelacija je veća, odoso, regresija bolje opisuje posmatrai skup podataka. Da bismo uveli meru korelacije između posmatraih promeljivih, podsetimo se defiicija stadarde devijacije i varijase.
36 Operativi meaxmet Kada se posmatra samo skup š i ć, defiiše se stadarda devijacija S promeljive ( sr y S Aalogo se defiiše stadarda devijacija S promeljive ( sr x S Stadarda devijacija promeljive za dato je ( c S. a stadarda devijacija za dato ( c S. Za male uzorke koriste se modifikovae stadarde devijacije, pr. ( c S. Varijasa je kvadrat odgovarajuće stadarde devijacije. Ukupa greška e i i - sr razlaže se a dva dela: objašjeu grešku ci - sr i eobjašjeu grešku i - ci, slika.5. e i ( i - ci + ( ci - sr e i + e i0. i ( i, i ci i Slika.5. Ukupa, objašjea i eobjašjea greška Greška e i0 se zove objašjeom jer je potpuo određea regresioom liijom. Neobjašjea greška je potpuo slučaja. Jaso je da regresioa liija
. Mikroekoomska aaliza 37 bolje opisuje date podatke ukoliko su eobjašjee greške maje. Kada eobjašjeih grešaka e bi bilo, regresija bi bila perfekta i svi podaci bi ležali a regresiooj liiji. Varijacija je zbir kvadrata greške. Ukupa varijacija je zbir kvadrata ukupih grešaka i jedaka je zbiru objašjee i eobjašjee varijacije ( sr ( c + ( c sr Koeficijet determiacije je odos objašjee i ukupe varijacije greške obja{wea varijacija ( c sr d ukupa varijacija ( Jaso je da regresioa liija bolje aproksimira statističke podatke ako je koeficijet determiacije bliži jediici. Za određivaje stepea korelacije dve promeljive uobičajeo se koristi koeficijet korelacije r r ± d. Koeficijet korelacije r se odosi a proceat varijacije u koji se može objasiti regresioom liijom. Koeficijet korelacije je između - i. Zak koeficijeta korelacije ukazuje da li sa rastom promeljiva opada, r egativo, ili raste, r pozitivo. Često korišćei obrasci za koeficijet korelacije su r r xy ( x ( y ( ( [ ( ][ ( ] c r. S S Ne postoji jedo čvrsto pravilo kako da se tumači kokreta vredost koeficijeta korelacije već to zavisi od kokretog istraživaja. Jedo opšte pravilo je sledeće. Ako je r > 0,7, kaže se da postoji jaka korelacija između posmatraih promeljivih. Ukoliko je 0,5<r<0,7, kaže se da podaci ukazuju da između posmatraih promeljivih postoji korelacija. Za r < 0,4 kaže se da podaci e ukazuju a međusobu korelisaost posmatraih promeljivih, slika.6.
38 Operativi meaxmet - -0.5 0 0.5 Slika.6. Ilustracija koeficijeta korelacije Primer.6. Praćejem troškova i obima proizvodje u toku posledjih dvaaest meseci dobijei su podaci prikazai u tabeli. Mes mar apr maj ju jul avg sep okt ov dec ja feb C 34,4 34,9 34,6 3, 3,8 33,8 34,3 34, 36,3 38, 37, 36, Q 9 3 8 7 9 4 6 4 5 Primeom metode ajmajih kvadrata odrediti fukciju aproksimative prave liije koja pokazuje kako se ukupi troškovi mejaju u zavisosti od obima proizvodje. Izračuati koeficijet korelacije. Ako se plaom za sledeći mesec predviđa obim proizvodje 5, kolike troškove treba očekivati. Rešeje: Raije opisaim postupkom dobija se a 0 3,64 i a 0,5, tj. C3,64+0,5Q. Koeficijet korelacije je 80,4% što ukazuje a jaku korelaciju između prikazaih troškova i obima proizvodje. Za Q5 dobija se C c 36,6. Jaka korelacija između dve posmatrae stohastičke veličie e mora da zači da između jih postoji uzročo poslediča veza. Zbog toga treba biti obazriv u tumačeju i korišćeju regresioih liija i koeficijeta korelacije.