Leara korelacja Korelacja je mjera leare zavsost dvju serja podataka 1,,..., 1,,...,. Drugm rječma, ako su točke 1, 1,,,..., gruprae oko regresjskog pravca, oda govormo da su podatc korelra learo korelra. Na osov toga govor se da su prpade velče, korelrae. Raza korelraost mjer se koefcjetom korelacje r : Vrjed: 1 1 r 1 Ako je r poztva oda je koefcjet smjera regresjskog pravca poztva obrato ako je r>0 oda je a>0, a ako je r<0 oda je a<0 3 Što je r blž 1 l -1 to su velče začajje learo korelrae, tj. podatc su blže regresjskom pravcu, a što je r blž 0, podatc su razbacaj. 4 Ako je r 1 l r -1 oda su sve točke, a regresjskom pravcu, tj. podatc su potpuo learo zavs. 5 Ako je r0 oda ema kakve leare zavsost među velčama. Prmjer 1. Odredmo koefcjet korelacje za podatke 0 1 3 4 6 3 1 - -3 z Prmjera. u lekcj Metoda ajmajh kvadrata. Napravmo tablcu poput oe za metodu ajmajh kvadrata, samo dodajmo redak s. 0 1 3 4 10 6 3 1 - -3 5 0 1 4 9 16 30 0 3-6 -1-13 36 9 1 4 9 59 5 13 5 10 115 r -0.98976 a pet decmala 530 10 5 59 5 30 15 što je vsoka raza leare zavsost. Uočte da je r<0, što je u skladu s tm da je a<0 sjette se da je jedadžba regresjskog pravca -.35.6.
Napomea. Naredba LReg uz podatke o parametrma također b am zbacla vrjedost koefcjeta r. Podatc u sljedećem prmjeru su vrlo sko learo korelra. Prmjer. Odredmo koefcjet korelacje za podatke -3 - -1 0 1 3 0-3 1-1 Uesmo podatke u kvadratu 77 mrežu kao a slc. Vdmo da podatc e prate jeda pravac, pa procjejujemo da je koefcjet korelacje blzu ule. -3 - -1 0 1 3 0 0-3 1-1 5 9 4 1 0 1 4 9 8 0-4 0-3 -1 0 4 4 9 4 1 1 3 Sad je r 7 1 0 0-0.04875 a šest decmala 7 8 0 7 3 5 što je praktčk jedako ul. Također, može se provjert da je prpada suma kvadrata odstupaja za learu regresju jedaka 19. 39 857 a šest decmala, što također upućuje a vrlo slabu learu vezu. Learu korelacju e treba shvatt kao jed oblk zavsost dvju velča serja podataka. Dvje velče mogu bt vrlo jaso zavse, a da m je koefcjet leare korelacje jedak ul; to samo zač da su oe learo ekorelrae. To pokazuje sljedeć prmjer. Prmjer 3. Odredmo koefcjet korelacje za podatke -3 - -1 0 1 3 9 4 1 0 1 4 9 Ucrtavajem podataka vdmo da o e prate jeda pravac. Kako je 0 0, vdmo da je r0. Dakle, podac su learo ekorelra. S druge strae, o su zavs. Name, poveza su relacjom ^ točke su a parabol. Često se postavlja ptaje koj koefcjet zače vsoku, koj sku, a koj sredju learu korelraost. Na to ptaje ema jasog odgovora. O ovs o zastveom području a koje se prmjejuje, a uutar zastveog područja a kokreta problem koj se razmatra. Na
prmjer, u pshologjskm stražvajma, u pravlu, čm je r>0.5 smatra se da je korelraost začaja, a ako je r>0.8 vrlo začaja, dok u preczm fzkalm l kemjskm stražvajem često t r0.9 e upućuje a začaju korelraost. Prmjer 4. U sljedećoj tablc su u prvom redku bodov prvh 9 ajboljh rezultata postguth z kolokvja a Matematc 1, a u drugoj su odgovarajuć bodov z Matematke. 103 93 84 81 81 80 79 79 78 99 73 8 85 77 79 73 55 83 Odredmo regresjsk pravac koefcjet korelacje. Kometrajmo rezultate. Da dobjemo predodžbu, podatke predočavamo u koordatom sustavu. Predvđamo poztva koefcjet korelacje jer podatc prate glavu djagoalu al e vsok, jer podatc varraju. Procjejujemo da je koefcjet regresjskog pravca ešto maj od 1. Zadatak se može zradt prema uzoru a prjašje prmjere. M ćemo se poslužt grafčkm kalkulatorom, koj ma gotov program za metodu ajmajh kvadrata learu korelacju. Dobjemo, zaokružujuć a dvje decmale, 0.791.9 r 0.56. Kometar. Dobl smo a0.79<1, što je u skladu s čjecom da su rezultat Matematke, ešto ž od rezultata Matematke 1. Koefcjet korelacje je blzu 1, al je već od 0.5, što, pr ovakvoj problematc upućuje a ezaemarvu korelacju. Suma kvadrata odstupaja jedaka je, a četr decmale, 763.7 što zgleda velko, al taj rezultat treba tumačt tako da je prosječo odstupaje oko 9 bodova, što je tako velko. Zašto as je u ovom prmjeru zamala leara korelacja među rezultatma? Zato što tutvo prhvaćamo da će rezultat z Matematke bt prblžo proporcoal oma z Matematke 1, tj. da odprlke jedake raze usvajaja ekog zaja uvjetuju odprlke jedake raze usvajaja ovog zaja koje počva a starom. Naravo da to e vrjed za svakog kokretog pojedca, već u prosjeku. Obrazložeje formule za koefcjet korelacje. Serju od podataka možemo shvatt kao vektor u -dmezoalom prostoru. Sjetmo se što za vektore zač da su learo zavs learo korelra. Slke upućuju a to da su dva vektora learo zavsa koleara, proporcoala ako samo ako je kut među jma ul-kut l spruže kut od 180 stupjeva. Što je kut blže 0 l 180, to vektore možemo smatrat vše learo korelram, a što je blže pravom kut, tj. 90 stupjeva, maje korelram. Za kut ϕ među vektorma uu 1,u,...,u v v 1,v,...,v vrjed
u1 v1 uv... uv cosϕ u v zraz u brojku je skalar produkt vektora, a u azvku su orme-dulje vektora. Vrjed: 1 1 cosϕ 1 Ako je cos ϕ >0 oda je kut među pravcma šljast, a ako je cos ϕ <0 oda je taj kut tup 3 Što je cos ϕ blž 1 l -1 vektor su sve blže tome da budu proporcoal learo zavs, a što je cos ϕ blž 0, vektor su to maje kolear. 4 Ako je cos ϕ 1 l cos ϕ -1 oda su vektor learo zavs; tada je kut od 0 stupjeva v c u, za c>0, l je kut od 180 stupjeva v c u, za c<0. 5 Ako je cos ϕ 0 oda su vektor okomt pa su ajudaljej od kolearost. Dakle, cos ϕ ma svojstva aaloga oma koje ma r. To zač da je cos ϕ koefcjet kolerost dvaju vektora slčo kako je r koefcjet leare korelacje dvju serja podataka. Da bsmo razmatraje s vektorma prmjel a razmatraje serja podataka, treba umjesto serja 1,,..., 1,,..., gledat pomakute serje,,..., 1,,..., 1 gdje su artmetčke srede podataka. Name, ako od tražee leare veze ab oduzmemo sttu relacju a b, dobt ćemo proporcoalost - a -. Ako b zadae točke zasta zadovoljavale tu jedadžbu, blo b 1 - a 1 - - a -. - a -. Međutm, to vrjed samo prblžo, a za mjeru te prblžost razumo je uzet kosus kuta među vektorma u: 1 -, -,..., - v: 1 -, -,..., -. Zato je prrodo koefcjet korelacje defrat kao r : Na prv pogled, to je oa formula koju smo apsal a početku, međutm, dobje se:
: r kako smo a početku mal.