ΕΡΓΑΙΑ Εθηίκεζε αμίαο κεηαπώιεζεο ζπηηηώλ κε αλάιπζε δεδνκέλωλ Παιεάο Δπζηξάηηνο ΑΘΗΝΑ 2014 1
ΠΔΡΙΔΥΟΜΔΝΑ 1) Δηζαγσγή 2) Πεξηγξαθηθή Αλάιπζε 3) ρέζεηο Μεηαβιεηώλ αλά 2 4) Πξνβιεπηηθά / Δξκελεπηηθά Μνληέια 5) πκπεξάζκαηα θαη πδήηεζε 2
Κεθάιαην 1 ν :Εηζαγωγή η ε λ ε ξ γ α ζ ί α α π η ή κ α ο έ ρ νπ λ δ νζ ε ί η α δ ε δ νκ έ λ α 8 κ ε η α β ι ε η ώ λ γ η α 11 7 ζ π ί η η α. θ ν π όο η ε ο ε ξ γ α ζ ί α ο ε ί λ α η ε ε θ η ί κ ε ζ ε η ε ο α μ ί α ο κ ε η α π ώ ι ε ζ ε ο η σ λ ζ π η η η ώ λ β ά ζ ε η η σ λ ά ι ι σ λ 7 ρ α ξ α θ η ε ξ η ζ η η θ ώ λ η νπ ο όπ σ ο ε ί λ α η ε ε ι η θ ί α, ε ζ έ ζ ε θ α η η ν κ έ γ ε ζ όο η νπ ο π ξ ν θ ε η κ έ λ νπ λ α ε θ η η κ ή ζ νπ κ ε α λ θ α η θ α η ά π όζ ν ε θ α ζ ε κ ί α α π ό α π η έ ο ε π ε ξ ε ά δ ε η η ε λ α μ ί α η ν π ο. Δ π ί ζ ε ο ε λ δ η α θ ε ξ όκ α ζ η ε λ α ε μ ε η ά ζ νπ κ ε θ α η η π ρ όλ α θ ξ α ί ε ο η η κ έ ο ( ou t l i e r s ) ε θ όζ νλ ε ε μα ί ξ ε ζ ή η νπ ο α π ό η ε λ α λ ά ιπ ζ ε κ π νξ ε ί λ α κ α ο δ ώ ζ ε η π η ν α μ η ό π η ζ η α α π νη ε ι έ ζ κ α η α. Γη α η ε λ α λ ά ιπ ζ ή κ α ο ζ α ρ ξ ε ζ η κ νπ ν η ή ζ νπ κ ε η ν ζ η α η η ζ η η θ ό π α θ έ η ν S P S S. 3
Κεθάιαην 2 ν :Πεξηγξαθηθή Αλάιπζε Ξ ε θ η λ ώ λ η α ο η ε λ α λ ά ιπ ζ ή κ α ο ζ α π π νι νγ ί ζ νπ κ ε η α β α ζ η θ ά π ε ξ η γ ξ α θ η θ ά κ έ η ξ α γ η α θ ά ζ ε κ ε η α β ι ε η ή. Θ α π ξ έ π ε η όκ σ ο λ α ζ ε κ ε η σ ζ ε ί όη η γ η α δ ύ ν κ ε η α β ι ε η έ ο έ ρ νπ κ ε θ α η ά γ λ σ ζ η ε ο η η κ έ ο ( m i s s i n g va l u e s ) η η ο νπ νί ε ο δ ε λ ε ί κ α ζ η ε ζ ε ζ έ ζ ε λ α γ λ σ ξ ί δνπ κ ε θ α η δ ε λ ζ α κ π νξ έ ζ νπ κ ε λ α η η ο ζ π κ π ε ξ η ι ά β νπ κ ε ζ η ε λ α λ ά ιπ ζ ή κ α ο. Π ξ νθ ύ π η ε η ν π α ξ α θ ά η σ π ί λ α θ α ο. Descriptive Statistics N Range Minimum Maximum Mean Variance price 117 1610,00 540,00 2150,00 1062,7350 144732,300 sqft 117 2913,00 837,00 3750,00 1653,8547 274285,574 age 68 52 1 53 14,97 160,507 feats 117 8 0 8 3,53 1,975 tax 107 1542,00 223,00 1765,00 793,4860 94975,082 Valid N (listwise) 66 1 Μ έ ζ ε η η κ ή, δ η α θ ύ κ α λ ζ ε θ α η ε ύ ξ νο γ η α η η ο κ ε η α β ι ε η έ ο. Υ ξ ε ζ η κ νπ νη ή ζ α κ ε κ όλ ν η η ο 5 κ ε η α β ι ε η έ ο α θ νύ ν η π π όι ν η π ε ο όλ η α ο θ α η ε γ νξ η θ έ ο ς ε π δ νκ ε η α β ι ε η έ ο ( d u m m y va r i a bl e s ) έ π α η ξ λ α λ κ όλ ν η η ο η η κ έ ο 0 θ α η 1. Α π ό η νλ π ί λ α θ α π α ξ α η ε ξ νύ κ ε όη η ε η η κ ή ( p r i c e ), η α η ε η ξ α γ σ λ η θ ά ( s q ft ) θ α η ν θ όξ νο ( tax) π α ξ νπ ζ η ά δ νπ λ α ξ θ ε η ά κ ε γ ά ι ε δ η α θ ύ κ α λ ζ ε. Θ α ή η α λ ε μ ί ζ νπ ρ ξ ή ζ η κ ν λ α β ξ νύ κ ε η η ο α θ ξ α ί ε ο η η κ έ ο η νπ ο. Γ η α η ν ζ θ νπ ό α π η ό ζ α ρ ξ ε ζ η κ νπ νη ή ζ νπ κ ε η ν η ζ η όγ ξ α κ κ α ( h i s t og r a m ) 1. 4
Κεθάιαην 3 ν :ρέζεηο Μεηαβιεηώλ αλά 2 η ε ζ π λ έ ρ ε η α η ε ο α λ ά ιπ ζ ή ο κ α ο ζ α ε μ ε η ά ζ νπ κ ε η η ο α λ ά δ ύ ν ζ ρ έ ζ ε η ο κ ε η α μ ύ η σ λ κ ε η α β ι ε η ώ λ κ α ο 2. Έ ρ νπ κ ε νρ η ώ ε π νκ έ λ σ ο όι νη ν η π η ζ α λ νί ζ π λ δ π α ζ κ νί ε ί λ α η 2 8. Α π ό α π η νύ ο έ ρ ε η λ όε κ α λ α ε μ ε η α ζ η νύ λ νη π α ξ α θ ά η σ : Σ η κ ή θ α η θ α ζ ε κ ί α α π ό η η ο π π όι ν η π ε ο. Φ όξ νο θ α η θ α ζ ε κ ί α α π ό η η ο π π ό ι νη π ε ο. Ο π ί λ α θ α ο ζ π ζ ρ ε η ί ζ ε σ λ ( π ί λ α θ α ο 4 η νπ π α ξ α ξ η ή κ α η νο ) κ α ο δ ί λ ε η η α π α ξ α θ ά η σ : Τ ς ε ι ή ζ π ζ ρ έ η η ζ ε η ε ο η η κ ή ο κ ε η ε λ έ θ ηα ζ ε, η α ρ α ξ α θ η ε ξ η ζ η η θ ά ( f e a t s ), η ν α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θ ό θ α η η ν θ όξ ν. Υ α κ ε ι ή ζ π ζ ρ έ η η ζ ε η ε ο η η κ ή ο κ ε η ε λ ε ιη θ ί α, η ν α λ έ ρ ε η μα λ α π νπ ι ε ζ ε ί θ α η η ε λ π ε ξ η νρ ή π νπ β ξ ί ζ θ ε η α η. Τ ς ε ι ή ζ π ζ ρ έ η η ζ ε η νπ θ όξ νπ κ ε η ε λ η η κ ή, η ε λ έ θ η α ζ ε, η α ρ α ξ α θ η ε ξ η ζ η η θ ά θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θό. Υ α κ ε ι ή ζ π ζ ρ έ η η ζ ε η νπ θ όξ νπ κ ε η ε λ ε ιη θ ί α, η ν α λ έ ρ ε η μα λ α π νπ ι ε ζ ε ί θ α η η ε λ π ε ξ η νρ ή π νπ β ξ ί ζ θ ε η α η. Σ η ο ζ ρ έ ζ ε η ο α π η έ ο κ π νξ νύ κ ε λ α η η ο δ νύ κ ε θ α η δ η α γ ξ α κ κ α η η θ ά ρ ξ ε ζ η κ νπ νη ώ λ η α ο η ν δ η ά γ ξ α κ κ α δ η α ζ π νξ ώ λ ( s c a t t e r p l ot ). 3 Ό π σ ο α λ α κ έ λ ακ ε η α δ ε π γ ά ξ η α κ ε η α β ι ε η ώ λ π νπ ζ ύ κ θ σ λ α κ ε η νλ π ί λ α θ α 4 έ ρ νπ λ π ς ε ι ό δ ε ί θ η ε ζ π ζ ρ έ η η ζ ε ο η νπ P e a r s on ( ε δ ώ κ ε γ α ι ύ η ε ξ ν η νπ 0, 5) π ξ νζ ε γ γ ί δ νπ λ η ε λ ε η θ όλ α κ ί α ο ε π ζ ε ί α ο ζ η ν α λ η ί ζ η ν η ρ ν γ ξ ά θ ε κ α ε λ ώ γ η α η η ο π π ό ι νη π ε ο π α ξ α η ε ξ ε ί η α η έ λ α < < λ έ θ νο > > ζ ε κ ε ί σ λ ( ό π σ ο γ η α η η ο κ ε η α β ι ε η έ ο f e a t s θ α η s q ft ). Π ξ έ π ε η ε π ί ζ ε ο λ α ζ ε κ ε η σ ζ ε ί όη η ζ ε θ α λ έ λ α δ η ά γ ξ α κ κ α δ ε λ π α ξ α η ε ξ νύ λ η α η α θ ξ α ί ε ο π α ξ α η ε ξ ή ζ ε η ο. Ό ζ ν γ η α η η ο η ξ ε η ο ς ε π δ νκ ε η α β ι ε η έ ο ε π ε η δ ή π α ί ξ λ νπ λ κ όλ ν δ ύ ν η η κ έ ο ζ α ρ ξ ε ζ η κ νπ νη ή ζ νπ κ ε η ν δ η ά γ ξ α κ κ α π ι α η ζ ί νπ α π νι ή μ ε σ λ γ η α λ α δ νύ κ ε α λ π α ξ νπ ζ η ά δνπ λ δ η α θ νξ νπ ν ί ε ζ ε 4. Α π ό η α δ η α γ ξ ά κ κ α η ά κ α ο π α ξ α η ε ξ ή ζ ε θ ε ζ ε κ α λ η η θ ή δ η α θ νξ νπ ν ί ε ζ ε η ε ο η η κ ή ο θ α η η νπ θ όξ νπ κ όλ ν όζ νλ α θ ν ξ ά η α γ σ λ η α θ ά ζ π ί η η α. Ο η ά ι ι ε ο δ ύ ν κ ε η α β ι ε η έ ο ( r e s a l e θ α η a r e a ) δ ε λ δ ε ί ρ λ νπ λ λ α η η ο ε π ε ξ ε ά δνπ λ π ν ιύ. Α π ό η η ο π α ξ α π ά λ σ ζ ρ έ ζ ε η ο κ α ο έ ρ ε η δε η ε ζ ε ί λ α ε μ ε η ά ζ νπ κ ε ι ε π η νκ ε ξ έ ζ η ε ξ α α π η ή κ ε η α μύ η η κ ή ο θ α η π ε ξ η νρ ή ο. Γη α η ν ζ θ ν π ό α π η ό ζ α θ ά λ νπ κ ε έ λ α λ έ ι ε γ ρ ν γ η α λ α η ν δ η α π η ζ η ώ ζ νπ κ ε. Θ α π ξ έ π ε η όκ σ ο λ α π ξ νε γ ε ζ ε ί έ λ α ο δ ε ύ η ε ξ ν ο γ η α λ α δ νύ κ ε α λ ε δ η α θ νξ ά η σ λ κ έ ζ σ λ γ η α η η ο δ ύ ν π ε ξ η νρ έ ο α θνι νπ ζ ε ί η ε λ θ α λ νλ η θ ή θ α η α λ νκ ή. Υ ξ ε ζ η κ νπ ν η ώ λ η α ο η νπ ο ε ι έ γ ρ νπο S h a pi r o - Wi l k θ α η K ol m og or o v - S m i r n ov θ α η νξ ί δνλ η α ο ε π ί π ε δ ν ζ ε κ α λ η η θόη ε η α ο 5 % π α ί ξ λ νπ κ ε η α π α ξ α θ ά η σ : 5
Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk area Statistic df Sig. Statistic df Sig. price 0,176 39,004,855 39,000 1,138 78,001,863 78,000 a. Lilliefors Significance Correction 2 Έ ι ε γ ρ νο K ol m og or o v - S mi r n o v θ α η S h a p i r o - W ilk γ η α η νλ έ ι ε ρ γ ν θ α λ νλ η θ ό η ε η α ο η ε ο η η κ ή ο η ωλ ζ π η η η ώλ. Σν S i g. ζ ύ κ θ σ λ α θ α η κ ε η νπ ο δ ύ ν ε ι έ γ ρνπ ο ε ί λ α η ζ ρ ε δ όλ 0 θ α η γ η α η α δ ύ ν δ ε ί γ κ α η α θ ά η η η ν ν π νί ν κ α ο θ ά λ ε η λ α α π νξ ξ ί ς νπ κ ε η ε λ π π όζ ε ζ ε π ε ξ ί θ α λ νλ η θ όη ε η α ο η σ λ δ ε δ νκ έ λ σ λ κ α ο. Θ α ρ ξ ε ζ η κ νπ ν η ή ζ νπ κ ε ε π νκ έ λ σ ο η νλ κ ε π α ξ α κ ε η ξ η θ ό έ ι ε γ ρ ν η νπ Wi l c ox on ν νπ ν ί νο δ ε λ π ξ νϋ π νζ έ η ε η θ α λ νλ η θ όη ε η α η σ λ δ ε δ νκ έ λ σ λ. Σ ν ε π ί π ε δ ν ζ ε κ α λ η η θ όη ε η α ο ζ α η ν νξ ί ζ νπ κ ε π ά ι η ζ η ν 5 %. Ο έ ι ε γ ρ νο κ α ο δ ί λ ε η η α π α ξ α θ ά η σ : Ranks area N Mean Rank Sum of Ranks price 0 39 51,81 2020,50 1 78 62,60 4882,50 Total 117 Test Statistics a price Mann-Whitney U 1240,500 Wilcoxon W 2020,500 Z -1,622 Asymp. Sig. (2-tailed),105 a. Grouping Variable: area 3 Έ ι ε γ ρ νο η ζ όη ε η α ο κ έ ζ ωλ γ η α η η ο η η κ έ ο η ωλ ζ π η η η ώλ κ ε η α μ ύ η ωλ δ ύ ν π ε ξ η νρ ώλ. Α θ νύ η ν A s y m p. S i g. ( 2 - t a i l e d ) ε ί λ α η 0, 1 0 5 ( νπ όη ε κ ε γ α ι ύ η ε ξ ν η νπ 0. 0 5 ) δ ε λ α π νξ ξ ί π η νπ κ ε η ε λ π π ό ζ ε ζ ε π ε ξ ί η ζ όη ε η α ο η σ λ κ έ ζ σ λ. Δ μ ά ι ι νπ θ α η α π ό η ν δ η ά γ ξ α κ κ α b ox p l ot η ν νπ ν ί ν π α ξ α ζ έ η νπ κ ε ζ η ε ζ π λ έ ρ ε η α ( π ί λ α θ α ο 6 η νπ π α ξ α ξ η ή κ α η νο ) δ ε λ π α ξ α η ε ξ ε ί η α η ζ ε κ α λ η η θ ή δ η α θ νξ ά. 6
4 B ox p l ot γ η α η ε λ η η κ ή θ α η η ε λ π ε ξ η ν ρ ή. π λ ε π ώ ο ε ί λ α η ε ύ ι νγ ν λ α π π νζ έ ζ νπ κ ε όη η ε π ε ξ η νρ ή ζ η ε λ νπ ν ί α β ξ ί ζ θ ε η α η η ν ζ π ί η η δ ε λ ε π ε ξ ε ά δ ε η, ζ ε κ α λ η η θ ά η νπ ι ά ρ η ζ η νλ, η ε λ α μ ί α η νπ. 7
Κεθάιαην 4 ν :Πξνβιεπηηθά/Εξκελεπηηθά Μνληέια η ν θ ε θ ά ι α η ν α π η ό ζ α ε θ α ξ κ όζ νπ κ ε κ νλ η έ ι α γ η α λ α κ ε η ξ ή ζ νπ κ ε η ν β α ζ κ ό π νπ νη κ ε η α β ι ε η έ ο ε π ε ξ ε ά δ νλ η α η ε κ ί α α π ό η ε λ ά ι ι ε. Θ α ζ η α ζ νύ κ ε ζ ε δ ύ ν α π ό α π η ά. Α π η ό η ε ο η η κ ή ο ζ ε ζ ρ έ ζ ε κ ε η η ο π π όι ν η π ε ο κ ε η α β ι ε η έ ο θ α η α π η ό η νπ θ όξ νπ ζ ε ζ ρ έ ζ ε κ ε η η ο η η κ έ ο. Γη α η ν π ξ ώ η ν κ νλ η έ ι ν ζ α ρ ξ ε ζ η κ νπ ν η ή ζ νπ κ ε η ε δ η α δ η θ α ζ ί α η ε ο π ν ι ι α π ι ή ο π α ιη λ δ ξ όκ ε ζ ε ο δ ε ι α δ ή η ε ρ ξ ή ζ ε π ν ι ι ώ λ κ ε η α β ι ε η ώ λ γ η α η ε λ π ξ ό β ι ε ς ε / π π ν ι νγ η ζ κ ό κ ί α ο ( η ε ο η η κ ή ο η σ λ ζ π η η η ώ λ ). Σν π ξ ώ η ν π ξ ά γ κ α π νπ ζ α π ξ έ π ε η λ α ε ι έ γ μνπ κ ε όκ σ ο ε ί λ α η ε ε μάξ η ε ζ ε κ ε η α μ ύ η σ λ κ ε η α β ι ε η ώ λ π έ ξ α λ η ε ο η η κ ή ο α θ νύ α λ ζ π κ π ε ξ η ι ά β νπ κ ε δύ ν η ζ ρ π ξ ά ε μα ξ η ε κ έ λ ε ο ζ η ν ί δ η ν κ νλ η έ ι ν ζ α α ι ι ν η ώ ζ νπ λ η ε λ όι ε ε η θ όλ α π νπ ζ α κ α ο δ ί λ ε η α π η ό γ η α η ε λ π ξ ό β ι ε ς ή κ α ο. Α π ό η ν λ π ί λ α θ α 4 η νπ π α ξ α ξ η ή κ α η νο π α ξ α η ε ξ νύ κ ε όη η ε κ όλ ε η ζ ρ π ξ ή ζ ρ έ ζ ε π νπ π π ά ξ ρ ε η γ η α η η ο κ ε η α β ι ε η έ ο π έ ξ α λ η ε ο η η κ ή ο ( p r i c e ) έ γ θ ε η η α η ζ η ν θ όξ ν κ ε η ε λ έ θ η α ζ ε όπ νπ ν ζ π λ η ε ι ε ζ η ή ο η νπ P e a r s on ε ί λ α η 0, 8 5 9. Δ π ί ζ ε ο η ν δ η ά γ ξ α κ κ α δ η α ζ π νξ ώ λ η νπ ο π α ξ α θ ά η σ π ξ νζ ε γ γ ί δ ε η α ξ θ ε η ά η ε λ ε π ζ ε ί α κ ε ε μα ί ξ ε ζ ε η ε δ ε μ η ά < < νπ ξ ά > > ζ η ε λ νπ ν ί α νη π α ξ α η ε ξ ή ζ ε η ο κ α ο θ α ί λ ε η α η λ α έ ρ νπ λ κ ε γ α ιύ η ε ξ ε δ η α θ ύ κ α λ ζ ε. Μ ε η ν π ξ ά ζ η λ ν ρ ξ ώ κ α θ α ί λ ε η α η ε ε π ζ ε ί α ε ι α ρ ί ζ η σ λ η ε η ξ α γ ώ λσ λ ε νπ νί α κ α ο ε π η η ξ έ π ε η λ α θ ά λ νπ κ ε η η ο π ξ νβ ι έ ς ε η ο η ε ο κ ί α ο κ ε η α β ι ε η ή ο κ έ ζ σ η εο ά ι ι ε ο. 5 Δ η ά γ ξ α κ κ α δ η α ζ π ν ξ ώλ η νπ θ ό ξ νπ η ωλ ζ π η η η ώλ κ ε η ε λ έ θ η α ζ ή η νπ ο. 8
Κά η η α μ η νζ ε κ ε ί σ η ν π νπ β ι έ π νπ κ ε ζ η ν δ η ά γ ξ α κ κ α ε ί λ α η ε ύ π α ξ μ ε κ ί α ο κ όλ ν α θ ξ α ί α ο π α ξ α η ή ξ ε ζ ε ο η ε λ νπ ν ί α έ ρ νπ κ ε ζ ε κ ε η ώ ζ ε η κ ε θόθ θ η λ ν. Π ξ ό θ ε η η α η γ η α έ λ α ζ π ί η η κ ε π νιύ κ ε γ α ιύ η ε ξ ε έ θ η α ζ ε α π ό η α π π ό ι νη π α. Αλ ην ε μα η ξ έ ζ νπ κ ε ζ α π ά ξ νπ κ ε η ν π α ξ α θ ά η σ δ η ά γ ξ α κ κ α : 6 Δ η ά γ ξ α κ κ α δ η α ζ π ν ξ ά ο η νπ θ ό ξ νπ θ α η η ε ο έ θ η α ζ ε ο ρ ωξ ί ο α θ ξ α ί ε ο π α ξ α η ε ξ ή ζ ε η ο. Μ ε η ε λ α θ α ί ξ ε ζ ε π νπ θ ά λ α κ ε π α ξ α η ε ξ νύ κ ε όη η η ν R 2, δ ε ι α δ ή ν ζ π λ η ε ι ε ζ η ή ο ζ πζ ρ έ η η ζ ε ο ησ λ δ ύ ν κ ε η α β ι ε η ώ λ, α π μ ή ζ ε θ ε ζ ε κ α λ η η θ ά α π ό 0, 7 3 7 ζ ε 0, 7 8. Η ε π ζ ε ί α κ α ο όκ σ ο δ ε λ ά ι ι α μ ε ζ ε κ α λ η η θ ά θ ι ί ζ ε. 9
Θ α μ ε θ η λ ή ζ νπ κ ε κ ε έ λ α κ νλ η έ ι ν γ ξ α κ κ η θ ή ο π α ιη λ δ ξ όκ ε ζ ε ο ρ σ ξ ί ο ζ η α ζ ε ξ ό όξ ν γ η α η ε λ α μ ί α. Α π ό η ν S P S S π α ί ξ λ νπ κ ε η α π α ξ α θ ά η σ : Model Summary Model R R Square b Square Adjusted R Std. Error of the Estimate 1,993 a,985,984 158,65627 a. Predictors: tax, resale, cor, age, area, feats, sqft b. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. Coefficients a,b Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 sqft,363,095,535 3,820,000 age,219 1,806,004,121,904 feats 14,685 14,712,050,998,322 area -28,410 45,641 -,018 -,622,536 cor 156,246 49,596,062 3,150,003 resale -62,003 47,397 -,024-1,308,196 tax,530,155,398 3,427,001 a. Dependent Variable: price b. Linear Regression through the Origin 7 Μ νλ η έ ι ν γ ξ α κ κ η θ ή ο π α ι η λ δ ξ όκ ε ζ ε ο η ε ο α μ ί α ο κ ε η η ο π π όι ν η π ε ο 7 κ ε η α β ι ε η έ ο. Α π ό η α α π νη ε ι έ ζ κ α η α π α ί ξ λ νπ κ ε η ν π α ξ α θ ά η σ κ νλ η έ ι ν: p r i c e = 0, 3 6 3 * s q ft + 0, 2 1 9 * a g e + 1 4, 6 8 5 * f e a t s - 2 8, 4 1 0 * a r e a + 1 5 6, 2 4 6 * c or - 6 2, 0 0 3 * r e s a l e + 0, 5 3 0 * t a x Ο ζ π λ η ε ι ε ζ η ή ο π νπ β ξ ί ζ θ ε η α η κ π ξ νζ η ά α π ό θ ά ζ ε κ ε η α β ι ε η ή κ α ο δ ε ί ρ λ ε η θ α η ά π όζ ν α π η ή ε π ε ξ ε ά δ ε η η ε λ α μ ί α. Γη α πα ξ ά δ ε η γ κ α η ν α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θό ( κ ε η α β ι ε η ή c or ) δ ε ί ρ λ ε η λ α αζ θ ε ί κ ε γ α ιύ η ε ξ ε ε π ί δ ξ α ζ ε α π ό η ν α λ έ ρ ε η μα λ α π νπ ι ε ζ ε ί ( r e s a l e ) α θ νύ νη ζ π λ η ε ι ε ζ η έ ο η νπ ο ε ί λ α η 1 5 6, 2 4 6 θ α η - 2 8, 4 1 0 α λ η ί ζ η νη ρ α. Α π η ό π ά ι η ζ ε κ α ί λ ε η όη η η α ζ π ί η η α π νπ έ ρ νπ λ μα λ α π νπ ι ε ζ ε ί ( θ α η ε π νκ έ λ σ ο έ ρ νπ λ r e s a l e =1) α λ α κ έ λ ε η α η λ α έ ρ νπ λ κ η θ ξ όη ε ξ ε α μ ί α α π ό η α π π όι ν η π α ε λ ώ α π η ά π νπ ε ί λ α η γ σ λ η α θ ά ( νπ όη ε c or = 1 ) 10
ζ α έ ρ νπ λ κ ε γ α ιύ η ε ξ ε. η ν M od e l S u m m a r y η ν R 2 κ α ο δ ε ί ρ λ ε η η ν π νζ νζ η ό η ε ο κ ε η α β ι ε η ή ο pr i c e π νπ ε μ ε γ ε ί η α η α π ό η ν κ νλ η έ ι ν δ ε ι α δ ή π όζ ν θ α ι ά π ξ νζ α ξ κ όδ ε η α η α π η ό ζ η α δ ε δ νκ έ λ α κ α ο. Μ ε 0, 9 8 5 ζ εκ α ί λ ε η όη η ε π ξ νζ α ξ κ νγ ή ε ί λ α η α ξ θ ε η ά θ α ι ή. Π α ξ όι α α π η ά όπ σ ο π ξ να λ α θ έ ξ α κ ε ν θ ό ξ νο θ α η ε έ θ η α ζ ε έ ρ νπ λ κ ε γ ά ι ε ζ π ζ ρ έ η η ζ ε κ ε η α μ ύ η νπ ο. Α π η ό ζ ε κ α ί λ ε η όη η α λ κ ί α ε μ α π η ώ λ ε μα η ξ ε ζ ε ί α π ό η ν κ νλ η έ ι ν δ ε λ ζ α ε π ε ξ ε ά ζ ε η ζ εκ α λ η η θ ά η α α π νη ε ι έ ζ κ α η ά κ α ο. Γη α π α ξ ά δ ε η γ κ α α λ η ξ έ μνπ κ ε μα λ ά η ε λ π α ξ α π ά λ σ π α ιη λ δ ξ όκ ε ζ ε ζ η ν S P S S α ι ι ά α π η ή η ε θ νξ ά δ ε λ ζ π κ π ε ξ η ι ά β νπ κ ε η ε λ έ θ η α ζ ε ζ α π ά ξ νπ κ ε : Model Summary Model R R Square b Square Adjusted R Std. Error of the Estimate 1,991 a,982,980 175,70813 a. Predictors: tax, resale, cor, age, area, feats b. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. Coefficients a,b Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 age 4,076 1,659,065 2,457,017 feats 38,171 14,802,129 2,579,012 area -35,377 50,506 -,023 -,700,486 cor 176,192 54,621,070 3,226,002 resale -32,319 51,781 -,012 -,624,535 tax 1,073,067,805 15,960,000 a. Dependent Variable: price b. Linear Regression through the Origin 8 Γ ξ α κ κ η θ ή π α ι η λ δ ξ όκ ε ζ ε η ε ο α μ ί α κ ε η η ο π π όι ν η π ε ο κ ε η α β ι ε η έ ο ε θ η όο η ε ο έ θ η α ζ ε ο. Π α ξ α η ε ξ νύ κ ε όη η κ ε η ε λ α θ α ί ξ ε ζ ε η ε ο κ ε η α β ι ε η ή ο έ θ η α ζ ε ( s q ft ) η ν R 2 κ ε η ώ ζ ε θ ε ε ι ά ρ η ζ η α α π ό 0, 9 8 5 ζ ε 0, 9 8 2. Α π η ό ή η α λ α λ α κ ε λ όκ ε λ ν α θ νύ ε η ζ ρ π ξ ή ζ ρ έ ζ ε κ ε η α μ ύ θ όξ νπ θ α η έ θ η α ζ ε ο η η ο έ θ α λ ε λ α δ ί λ νπ λ ζ ρ ε δ όλ η ε λ ί δ η α π ι ε ξ νθ νξ ί α γ η α η ε λ α μ ί α. Δ π ε η δ ή θ α η ά ι ι ε ο κ ε η α β ι ε η έ ο κ π νξ ε ί λ α π α ξ νπ ζ η ά δνπ λ η ν ί δ η ν π ξ όβ ι ε κ α ί ζ σ ο ζ α ή η α λ θ α ιύ η ε ξ ν λ α 11
ρ ξ ε ζ η κ νπ νη ή ζ νπ κ ε κ ί α δ η α δ η θ α ζ ί α π ξ όζ ζ ε ζ ε ο ή α θ α ί ξ ε ζ ε ο κ ε η α β ι ε η ώ λ ζ η ν κ νλ η έ ι ν κ α ο π ξ νθ ε η κ έ λ νπ λ α θ α η α ι ή μνπ κ ε κ ε όζ ν ι η γ όη ε ξ ε ο κ ε η α β ι ε η έ ο γ ί λ ε η α η α π ν θ ε ύ γ νλ η α ο έ η ζ η η η ο α ι ι ε ι ε π η δ ξ ά ζ ε η ο η νπ ο. Μ ί α α π ό α π η έ ο η η ο κ ε ζ όδ νπ ο π νπ ζ α ε θ α ξ κ όζ νπ κ ε ε ί λ α η α π η ή η εο for wa r d β ά ζ ε η η ε ο νπ νί α ο ζ η ν κ νλ η έ ι ν ε η ζ ά γ ν λ η α η δ η α δ νρ η θ ά ν η κ ε η α β ι ε η έ ο π νπ ε ί λ α η ζ η α η η ζ η η θ ά ζ ε κ α λ η η θ έ ο 5. Σν η ε ι η θ ό κ α ο κ νλ η έ ι ν δ η α κ νξ θ ώ λ ε η α η σ ο ε μή ο : p r i c e = 0, 3 7 1 * s q ft + 0, 5 4 5 * tax + 1 6 0, 9 5 4 * c o r ύ κ θ σ λ α κ ε α π η ό β ι έ π νπ κ ε όη η κ ε γ α ι ύ η ε ξ ε ε π ί δ ξ α ζ ε ζ η ε λ α μ ί α η σ λ ζ π η η η ώ λ έ ρ ε η η ν α λ ε ί λ α η γ σ λ η α θ ά όπ σ ο κ π νξ νύ κ ε ε π ί ζ ε ο λ α π α ξ α η ε ξ ή ζ νπ κ ε θ α η α π ό η νλ π ί λ α θ α 7 η νπ π α ξ α ξ η ή κ α η νο όπ νπ η α γ σ λ η α θ ά ζ π ί η η α έ ρ νπ λ θ α λ ε ξ ά κ ε γ α ι ύ η ε ξ ε α μ ί α α π ό η α π π όι ν η π α. Ο η π π όι ν η π ε ο η έ ζ ζ ε ξ η ο κ ε η α β ι ε η έ ο δ ε λ ή η α λ ζ η α η η ζ η η θ ά ζ ε κ α λ η η θ έ ο θ α η γ η α π η ό δ ε λ ε η ζ ή ρ ζ ε ζ α λ ζ η ν κ νλ η έ ι ν κ α ο. Θ α π ξ έ π ε η η ώ ξ α λ α ε ι έ γ μ νπ κ ε θ α η α λ η ζ ρ ύ νπ λ νη π ξ νϋ π νζ έ ζ ε η ο η νπ κ νλ η έ ι νπ 6. η ε ζ π λ έ ρ ε η α ζ α θ α η α ζ θ ε π ά ζ νπ κ ε έ λ α κ νλ η έ ι ν π νπ ζ α κ α ο π π νι νγ ί δ ε η η ε ζ ρ έ ζ ε θ όξ νπ θ α η α μ ί α ο. Α π η ή η ε θ νξ ά ζ α ρ ξ ε ζ η κ νπ νη ή ζ νπ κ ε η ε λ α π ι ή π α ι η λ δ ξ όκ ε ζ ε κ ε ζ η α ζ ε ξ ά έ ρ νλ η α ο λ α θ ά λ νπ κ ε κ όλ ν κ ε δ ύ ν κ ε η α β ι ε η έ ο. Ό π σ ο θ α η ζ η ν π ξ νε γ νύ κ ε λ ν ζ α π ξ έ π ε η λ α ε ι έ γ μνπ κ ε η η ο π ξ νϋ π ν ζ έ ζ ε η ο η νπ 7. Βι έ π νπ κ ε ι ν η π όλ όη η νη π ξ νϋ π ν ζ έ ζ ε η ο η ζ ρ ύ νπ λ θ α η ε π νκ έ λ σ ο η ν κ νλ η έ ι ν tax = 0, 7 3 3 * p r i c e ε ί λ α η θ α η ά ι ι ε ι ν γ η α η ε λ π ε ξ η γ ξ α θ ή η ε ο ζ ρ έ ζ ε ο κ ε η α μ ύ θ όξ νπ θ α η α μ ί α ο η σ λ ζ π η η η ώ λ. Σέ ι νο ζ α π π νι νγ ί ζ νπ κ ε η ε λ α μ ί α π νπ έ ρ ε η έ λ α κ έ ζ ν ( ζ π λ ε ζ η ζ κ έ λ ν) ζ π ί η η κ έ ζ σ η νπ κ νλ η έ ι νπ π νπ β γ ά ι α κ ε ζ έ η νλ η α ο θ ά ζ ε κ ε η α β ι ε η ή ί ζ ε κ ε η ε κ έ ζ ε η η κ ή η ε ο ( π ί λ α θ α ο 1 ). Σν α π νη έ ι ε ζ κ α ε ί λ α η 1083,049 ρ η ιη ά δ ε ο δ ν ι ά ξ η α. 12
Κεθάιαην 5 ν :πκπεξάζκαηα θαη πδήηεζε η ν η ε ι ε π η α ί ν θ ε θ ά ι α η ν ζ α ζ π λ νς ί ζ νπ κ ε η α ζ π κ π ε ξ ά ζ κ α η ά κ α ο α π ό η α π ξ νε γ νύ κ ε λ α π ξ ν θ ε η κ έ λ νπ λ α β γ ά ι νπ κ ε κ ί α η ε ιη θ ή ε η θ ό λ α γ η α η α δ ε δ νκ έ λ α κ α ο θ α η η ε λ α λ ά ιπ ζ ε π νπ θ ά λ α κ ε. Π ξ έ π ε η λα π π ε λ ζ π κ ί ζ νπ κ ε β έ β α η α όη η η α m i s s i n g va l u e s δ ε λ ι ή θ ζ ε θ α λ π π ό ς η λ. Α ξ ρ η θ ά κ ί α ζ ύ λ η νκ ε α λ α θ νξ ά ζ η η ο ζ π ζ ρ ε η ί ζ ε η ο : Τ ς ε ι ή ζ π ζ ρ έ η η ζ ε η ε ο η η κ ή ο κ ε η ε λ έ θ ηα ζ ε, η α ρ α ξ α θ η ε ξ η ζ η η θ ά ( f e a t s ), η ν α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θ ό θ α η η ν θ όξ ν. Υ α κ ε ι ή ζ π ζ ρ έ η η ζ ε η ε ο η η κ ή ο κ ε η ε λ ε ιη θ ί α, η ν α λ έ ρ ε η μα λ α π νπ ι ε ζ ε ί θ α η η ε λ π ε ξ η νρ ή π νπ β ξ ί ζ θ ε η α η. Τ ς ε ι ή ζ π ζ ρ έ η η ζ ε η νπ θ όξ νπ κ ε η ε λ η η κ ή, η ε λ έ θ η α ζ ε, η α ρ α ξ α θ η ε ξ η ζ η η θ ά θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θό. Υ α κ ε ι ή ζ π ζ ρ έ η η ζ ε η νπ θ όξ νπ κ ε η ε λ ε ιη θ ί α, η ν α λ έ ρ ε η μα λ α π νπ ι ε ζ ε ί θ α η η ε λ π ε ξ η νρ ή π νπ β ξ ί ζ θ ε η α η. Ό ζ ν γ η α η α δ ύ ν κ νλ η έ ι α π ξ ν β ι έ ς ε σ λ π νπ κ α ο δε η ή ζ ε θ α λ β ξ ή θ α κ ε : 1 ) Γη α η ν κ νλ η έ ι ν η ε ο η η κ ή ο κ ε η η ο π π όι νη π ε ο : p r i c e = 0, 3 7 1 * s q ft + 0, 5 4 5 * tax + 1 6 0, 9 5 4 * c o r 2 ) Γη α η ν κ νλ η έ ι ν η νπ θ όξ νπ κ ε η ε λ η η κ ή : tax = 0, 7 3 3 * p r i c e Κα η η α δ ύ ν κ νλ η έ ι α η ε ξ νύ λ η η ο π ξ νϋ π νζ έ ζ ε η ο π νπ π ξ να λ α θ έ ξ α κ ε νπ όη ε κ π νξ νύ λ λ α ρ ξ ε ζ η κ νπ ν η ε ζ νύ λ γ η α νξ ζ έ ο π ξ νβ ι έ ς ε η ο. Ό ζ ν γ η α η α ou t l i e r s β ξ ή θ α κ ε κ όλ ν έ λ α ζ η νλ π ί λ α θ α 5 θ α η α θ α η ξ ώ λ η α ο η ν ( π ί λ α θ α ο 6 ) π α ξ α η ε ξ ή ζ α κ ε ζ ε κ α λ η η θ ή β ε ι η ί σ ζ ε η νπ ζ π λ η ε ι ε ζ η ή ζ π ζ ρ έ η η ζ ε ο. Π α ξ όι α α π η ά δ ε λ θ ξ ί λ α κ ε α π α ξ α ί η ε η ε η ε λ α θ α ί ξ ε ζ ή η νπ α π ό η ν κ νλ η έ ι ν. Ω ο η ε ι ε π η α ί ν α π νη έ ι ε ζ κ α π π ν ι νγ ί ζ α κ ε η ε λ α μ ί α π νπ έ ρ ε η έ λ α κ έ ζ ν ( ζ π λ ε ζ η ζ κ έ λ ν) ζ π ί η η κ έ ζ σ η νπ κ νλ η έ ι νπ π ν π β γ ά ι α κ ε θ α η η ε β ξ ή θ α κ ε ί ζ ε κ ε 1 0 8 3, 049 ρ η ιη ά δ ε ο δ νι ά ξ η α. Έ η ζ η νι νθ ι ε ξ ώ ζ α κ ε η ε λ α λ ά ιπ ζ ε η σ λ δ ε δ νκ έ λ σ λ κ α ο. Φ πζ η θ ά ζ η α ζ ή θ α κ ε θ π ξ ί σ ο ζ η α ζ ε κ ε ί α π νπ κ α ο ε ί ρ αλ νξ η ζ η ε ί α π ό η α δε η νύ κ ε λ ά κ α ο π ξ νζ έ ρ νλ η α ο λ α β ξ νύ κ ε η η ο α θ ξ η β ε ί ο ζ ρ έ ζ ε ηο π νπ ζ π λ δ έ νπ λ η η ο κ ε η α β ι ε η έ ο κ α ο θ α η λ α θ ά λ νπ κ ε α μ η όπ η ζ η ε ο π ξ ν β ι έ ς ε η ο κ ε α π η έ ο. 13
Παξάξηεκα Εξγαζίαο Παιεάο Δπζηξάηηνο 14
1 Π α ξ α ζ έ η νπ κ ε ε δ ώ η α η ζ η νγ ξ ά κ κ α η α γ η α η ε λ α μ ί α, η ε λ έ θ η α ζ ε θ α η η ν θ όξ ν η σ λ ζ π η η η ώ λ. Η θ α κ π ύ ι ε π νπ ζ π κ π ε ξ η ι ά β α κ ε ε ί λ α η α π η ή η ε ο θ α λ νλ η θ ή ο θ α η α λ νκ ή ο κ ε κ έ ζ ε η η κ ή θ α η δ η α θ ύ κ α λ ζ ε απ ηή η σ λ π α ξ α η ε ξ ή ζ ε ώ λ κ α ο. Έ η ζ η π α ί ξ λ νπ κ ε κ ί α ε η θ όλ α γ η α η ν θ α η ά π όζ ν η α δ ε δ νκ έ λ α κ α ο ε ί λ α η θ α λ νλ η θ ά θ α η α λ ε κ ε κ έ λ α. 9 Ι ζ η όγ ξ α κ κ α γ η α η ε λ α μ ί α. Π α ξ α η ε ξ νύ κ ε κ ί α ε ι α θ ξ ά δ ε μ η ά α ζ π κ κ ε η ξ ί α ε θ όζ νλ έ λ α κ έ ξ νο η σ λ η η κ ώ λ ε ί λ α η ζ π γ θ ε λ η ξ σ κ έ λ ν ζ η ε δ ε μ η ά «νπ ξ ά» η νπ δ η α γ ξ ά κ κ α η νο. 15
10 Ι ζ η όγ ξ α κ κ α γ η α η ε λ έ θ η α ζ ε Κ η ε δ ώ π π ά ξ ρ ε η κ ί α δ ε μ η ά α ζ π κ κ ε η ξ ί α π α ξ όκ νη α κ ε α π η ή η νπ π ί λ α θ α 1 κ ε α ξ θ ε η έ ο η η κ έ ο λ α θ α η α λ έ κ νλ η α η δ ε μ η ά η σ λ π π ν ι νί π σ λ. 16
11 Ι ζ η όγ ξ α κ κ α γ η α η ν θ ό ξ ν Η θ α η α λ νκ ή η σ λ π α ξ α η ε ξ ή ζ ε ώ λ κ α ο θ α ί λ ε η α η λ α ε ί λ α η α ξ θ ε η ά ζ π κ κ ε η ξ η θ ή ζ ε α λ η ί ζ ε ζ ε κ ε η νπ ο δ ύ ν π ξ νε γ νύ κ ε λ νπ ο π ί λ α θ ε ο. Δ π ί ζ ε ο δ ε ί ρ λ ε η λ α α θ νι νπ ζ ε ί α ξ θ ε η ά π η ζ η ά η ε λ θ α λ ν λ η θ ή θ α κ π ύ ι ε. 17
2 price Pearson Correlation Correlations price age sqft resale feats area cor tax 1 -,169,845 ** -,079,420 **,168,555 **,876 ** Sig. (2-tailed),169,000,395,000,070,000,000 N 117 68 117 117 117 117 117 107 age Pearson Correlation -,169 1 -,040,136 -,188,227 -,012 -,292 * Sig. (2-tailed),169,748,267,125,063,924,017 N 68 68 68 68 68 68 68 66 sqft Pearson Correlation,845 ** -,040 1,041,395 **,145,520 **,859 ** Sig. (2-tailed),000,748,664,000,119,000,000 N 117 68 117 117 117 117 117 107 resale Pearson Correlation -,079,136,041 1 -,042 -,077 -,004 -,060 Sig. (2-tailed),395,267,664,656,407,966,539 N 117 68 117 117 117 117 117 107 feats Pearson Correlation,420 ** -,188,395 ** -,042 1,190 *,242 **,442 ** Sig. (2-tailed),000,125,000,656,040,009,000 N 117 68 117 117 117 117 117 107 area Pearson Correlation,168,227,145 -,077,190 * 1,043,197 * Sig. (2-tailed),070,063,119,407,040,645,042 N 117 68 117 117 117 117 117 107 cor Pearson Correlation,555 ** -,012,520 ** -,004,242 **,043 1,470 ** Sig. (2-tailed),000,924,000,966,009,645,000 N 117 68 117 117 117 117 117 107 tax Pearson Correlation,876 ** -,292 *,859 ** -,060,442 **,197 *,470 ** 1 Sig. (2-tailed),000,017,000,539,000,042,000 N 107 66 107 107 107 107 107 107 18
**. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). 12 Π ί λ α θ α ο α λ ά 2 ζ π ζ ρ ε η ί ζ ε ωλ γ η α η η ο 8 κ ε η α β ι ε η έ ο. Κ ά ζ ε θ ε ι ί η νπ π ί λ α θ α 4 κ α ο δ ε ί ρ λ ε η γ η α η η ο δ ύ ν κ ε η α β ι ε η έ ο ( α π η ή η ε ο γ ξ α κ κ ή ο θ α η α π η ή η ε ο ζ η ή ι ε ο ζ η ε λ νπ ν ί α β ξ ί ζ θ ε η α η ) η ν ζ π λ η ε ι ε ζ η ή ζ π ζ ρ έ η η ζ ε ο η νπ P e a r s on. Κ ε ι η ά π νπ έ ρ νπ λ π ς ε ι ό ζ π λ η ε ι ε ζ η ή i. e. θ νλ η ά ζ η ε κ νλ ά δ α π π νδ ε ι ώ λ νπ λ π ς ε ι ή ζ ε η η θ ή ζ π ζ ρ έ η η ζ ε θ α η α π η ά κ ε ζ π λ η ε ι ε ζ η ή θ νλ η ά ζ η ν 0 π π νδ ε ι ώ λ νπ λ ρ α κ ε ι ή ή θ α η κ ε δ ε λ η θ ή ζ π ζ ρ έ η η ζ ε. Μ ε θ ό θ θ η λ ν ρ ξ ώ κ α έ ρ νπ κ ε π π νγ ξ α κ κ ί ζ ε η η η ο ζ ρ έ ζ ε η ο π νπ έ ρ νπ λ λ όε κ α λ α ε μ ε η ά ζ νπ κ ε. Ο α ξ η ζ κ όο η ε ο γ ξ α κ κ ή ο S i g. ( 2 - t a i l e d ) κ α ο δ ε ί ρ λ ε η α λ ε ζ ρ έ ζ ε α π η ή ε ί λ α η ζ η α η η ζ η η θ ά ζ ε κ α λ η η θ ή. π γ θ ε θ ξ η κ έ λ α α λ ν α ξ η ζ κ όο α π η όο ε ί λ α η κ η θ ξ όη ε ξ νο α π ό η ν ε π ί π ε δ ν ζ ε κ α λ η η θ όη ε η α ο ( ε δ ώ 0, 0 5 ), η όη ε ε ζ ρ έ ζ ε ε ί λ α η ζ η α η η ζ η η θ ά ζ ε κ α λ η η θ ή, δ η α θ νξ ε η η θ ά δ ε λ ε ί λ α η. Δ ί λ α η π ξ ν θ α λ έ ο όη η όζ ν π η ν π ς ε ι όο ε ί λ α η ν ζ π λ η ε ι ε ζ η ή ο η νπ P e a r s on η όζ ν π η ν ρ α κ ε ι ή ζ α ε ί λ α η ε η η κ ή η νπ S i g. (2- t a i l e d ). 3 Έ λ α ο π ί λ α θ α ο κ ε όι α η α δ η α γ ξ ά κ κ α η α δ η α ζ π νξ ώ λ θ α ί λ ε η α η π α ξ α θ ά η σ. Ο η κ ε η α β ι ε η έ ο π νπ π α ξ νπ ζ η ά δ νπ λ π ς ε ι ή ζ π ζ ρ έ η η ζ ε έ ρ νπ λ δ η ά γ ξ α κ κ α π νπ κ νη ά δ ε η κ ε ε π ζ ε ί α. Έ λ α π α ξ ά δ ε η γ κ α θ α λ ε ξ ή ο ζ π ζ ρ έ η η ζ ε ο ε ί λ α η α π η ό η ε ο η η κ ή ο ( p r i c e ) θ α η η νπ κ ε γ έ ζ νπ ο ( s q ft ). Γ ε λ ζ π κ π ε ξ η ι ά β α κ ε η η ο η ξ ε η ο ς ε π δ νκ ε η α β ι ε η έ ο κ α ο α θ νύ έ ρ νπ λ κ όλ ν δ ύ ν η η κ έ ο. Γ η α π η έ ο ζ α ρ ξ ε ζ η κ νπ νη ή ζ νπ κ ε η ν δ η ά γ ξ α κ κ α π ι α η ζ ί ν π α π ν ι ή μ ε σ λ ( b ox p l ot ) ζ η ε ζ π λ έ ρ ε η α. 19
13 Π ί λ α θ α ο δ η α γ ξ α κ κ ά η ωλ δ η α ζ π ν ξ ά ο γ η α 5 κ ε η α β ι ε η έ ο. 20
Θ α π ά ξ νπ κ ε δ ύ ν δ η α γ ξ ά κ κ α η α γ η α θ ά ζ ε κ ί α α π ό η η ο η ξ ε η ο ς ε π δ νκ ε η α β ι ε η έ ο. Έ λ α γ η α η ε λ η η κ ή θ α η έ λ α γ η α η ν θ όξ ν. Θ α μ ε θ η λ ή ζ νπ κ ε α π ό η ε λ η η κ ή. 4 14 B ox p l ot γ η α η ε λ η η κ ή θ α η η ε λ π ε ξ η ν ρ ή. η ν δ η ά γ ξ α κ κ α α π η ό γ η α η η ο δ ύ ν π ε ξ η νρ έ ο ( 0 θ α η 1 ) έ ρ νπ κ ε έ λ α π α ξ α ι ι ε ι όγ ξ α κ κ ν ζ ρ ή κ α κ ε δ ύ ν α π νι ή μ ε η ο ( π ά λ σ θ α η θ ά η σ ). Σα π ά λ σ θ α η θ ά η σ ά θ ξ α η νπ π α ξ α ι ι ε ι νγ ξ ά κ κ νπ κ α ο δ ε ί ρ λ νπ λ η ν η ξ ί η ν θ α η π ξ ώ η ν η ε η α ξ η ε κ όξ η ν α λ η ί ζ η νη ρ α ε λ ώ ε νξ η δόλ η η α γ ξ α κ κ ή κ έ ζ α ζ ε α π η ό κ α ο δ ε ί ρ λ ε η η ε δ η ά κ ε ζ ν. Δ λ νι ί γ ν η ο η ν γ ξ ά θ ε κ α α π η ό κ α ο δ ε ί ρ λ ε η η ν ε ύ ξ νο ζ η ν νπ νί ν θ α η α λ έ κ νλ η α η ν η π α ξ α η ε ξ ή ζ ε η ο κ α ο. Βι έ π νπ κ ε ε δ ώ όη η ε π ε ξ η νρ ή 1 ( θ α ιύ η ε ξ ν ζ ε κ ε ί ν ζ ύ κ θ σ λ α κ ε η α δ ε δ νκ έ λ α κ α ο ) π α ξ νπ ζ η ά δ ε η κ ε γ α ιύ η ε ξ ε ο η η κ έ ο α π ό η ε λ π ε ξ η νρ ή 0. Π α ξ όι α α π η ά ε δ η ά κ ε ζ νο θ α ζ ώ ο θ α η η ν ε ύ ξ νο δ ε λ θ α ί λ ε η α η λ α δ η α θ έ ξ νπ λ π νιύ. Ο η η η κ έ ο π νπ ε κ θ α λ ί δνλ η α η κ ε η ε κ νξ θ ή θνπ θ ί δ α ο ε ί λ α η η α ou t l i e r s. 21
15 B ox p l ot γ η α η ε λ η η κ ή θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ ωλ η α θ ό. Π α ξ α η ε ξ νύ κ ε κ ί α θ α λ ε ξ ή α ύ μ ε ζ ε η ε ο η η κ ή ο ζ η α γ σ λ η α θ ά ζ π ί η η α α π ό η α π π ό ι νη π α η όζ ν ζ η ε δ η ά κ ε ζ ν όζ ν θ α η ζ η ν ε ύ ξ νο. Α μ ί δ ε η ε π ί ζ ε ο λ α ζ ε κ ε η σ ζ ε ί ε ύ π α ξ μ ε α θ ξ α ί σ λ η η κ ώ λ κ όλ ν ζ η α κ ε γ σ λ η α θά ζ π ί η η α. 22
16 B ox p l ot γ η α η ε λ η η κ ή θ α η η ν α λ η ν ζ π ί η η έ ρ ε η μ α λ α π νπ ι ε ζ ε ί. Δ δώ δε θ α ί λ ε η α η λ α π π ά ξ ρ ε η ζ εκ α λ η η θ ή δ η α θ νξ ν π νί ε ζ ε η ε ο η η κ ή ο κ ε η α μ ύ η σ λ δ ύ ν α π η ώ λ θ α η εγ νξ η ώ λ. Η κ όλ ε α ι ι α γ ή έ γ θ ε η η α η ζ η ν ε ύ ξ νο θ α η ζ η η ο α θ ξ α ί ε ο π α ξ α η ε ξ ή ζ ε η ο η ε ο π ξ ώ η ε ο ρ σ ξ ί ο ό κ σ ο α π η έ ο λ α η ε λ ε π ε ξ ε ά δ νπ λ ζ ε κ α λ η η θ ά. 23
Γη α η νπ ο θ όξ νπ ο έ ρ νπ κ ε η α π α ξ α ά η σ : 17 B ox p l ot γ η α η νλ θ ό ξ ν θ α η η ε λ π ε ξ η ν ρ ή. η ν δ η ά γ ξ α κ κ α δ ε λ θ α ί λ ε η α η ζ ε κ α λ η η θ ή δηαθ νξ νπ ν ί ε ζ ε η ν θ όξ νπ κ ε η α μ ύ η σ λ δ ύ ν π ε ξ η νρώ λ. η ε λ a r e a 1 νη η η κ έ ο δ ε ί ρ λ νπ λ ε ι α θ ξ ά κ όλ ν π η ν α π μ ε κ έ λ ε ο. 24
18 B ox p l ot γ η α η νλ θ ό ξ ν θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ ωλ η α θ ό. Δ δ ώ π α ξ α η ε ξ νύ κ ε κ ί α θ α λ ε ξ ή α ύ μ εζ ε η νπ θ όξ νπ όη α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θό. 25
19 B ox p l ot γ η α η νλ θ όξ ν θ α η η ν α λ η ν ζ π ί η η έ ρ ε η μ α λ α π νπ ι ε ζ ε ί. Ό π σ ο θ α η ζ η νλ π ί λ α θ α 9 δ ε λ θ α ί λ ε η α η ζ ε κ α λ η η θ ή δ η α θ νξ νπ ν ί ε ζ ε η ν θ όξ νπ κ ε η α μ ύ η σ λ δ ύ ν θ α η ε γ νξ η ώ λ π α ξ ά κ όλ ν κ ί α κ η θ ξ ή α ύ μ ε ζ ε η νπ ε ύ ξ νπ ο θ α η η ε ο δ η α κ έ ζ νπ γ η α η α ζ π ί η η α π νπ δ ε λ έ ρ νπ λ μα λ α π νπ ι ε ζ ε ί. 26
Σα α π νη ε ι έ ζ κ α η α π νπ π α ί ξ λ νπ κ ε ε ί λ α η η α α θό ι νπ ζ α : 5 Variables Entered/Removed a,b Variables Variables Model Entered Removed Method 1 sqft. Forward (Criterion: Probability-of-Fto-enter <=,050) 2 tax. Forward (Criterion: Probability-of-Fto-enter <=,050) 3 cor. Forward (Criterion: Probability-of-Fto-enter <=,050) a. Dependent Variable: price b. Linear Regression through the Origin Model Summary Model R R Square b Square Adjusted R Std. Error of the Estimate 1,988 a,977,976 189,66555 2,991 c,982,981 169,30391 3,992 d,984,984 157,67831 a. Predictors: sqft b. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. c. Predictors: sqft, tax d. Predictors: sqft, tax, cor 27
Coefficients a,b Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 sqft,670,013,988 52,307,000 2 sqft,384,069,566 5,549,000 tax,570,136,428 4,192,000 3 sqft,371,065,547 5,742,000 tax,545,127,409 4,296,000 cor 160,954 49,010,064 3,284,002 a. Dependent Variable: price b. Linear Regression through the Origin 20 Γ ξ α κ κ η θ ή π α ι η λ δ ξ όκ ε ζ ε γ η α η ε λ α μ ί α κ ε η ε κ έ ζ νδ ν s t e p w i s e. Ο η κ ε η α β ι ε η έ ο π νπ π ξ νζ η έ ζ ε θ α λ ζ η ν κ ν λ η έ ι ν ε ί λ α η δ η α δ νρ η θ ά ε έ θ η α ζ ε ( s q ft ), ν θ όξ νο ( tax) θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ σ λ η α θ ό ( c or ). Σ ν κ νλ η έ ι ν κ α ο δ η α κ νξ θ ώ λ ε η α η σ ο ε μ ή ο : p r i c e = 0, 3 7 1 * s q ft + 0, 5 4 5 * tax + 1 6 0, 9 5 4 * c o r κε R 2 = 0, 9 8 4 η ν νπ ν ί ν π π νδ ε ι ώ λ ε η α ξ θ ε η ά θ α ι ή π ξ νζ α ξ κ νγ ή Δ ξ κ ε λ ε ί α : Η α μ ί α ε λ όο ζ π η η η νύ π νπ ε ί λ α η γ σ λ η α θ ό ε ί λ α η θ α η ά κ έ ζ ν ό ξ ν π ξ νζ α π μ ε κ έ λ ε θ α η ά 1 6 0, 9 5 4 α π ό έ λ α π νπ δ ε λ ε ί λ α η π π ν ζ έ η σ λ η α ο όη η έ ρ νπ λ η ε λ ί δ η α έ θ η α ζ ε θ α η η νλ ί δ η ν θ όξ ν. Α λ η ί ζ η νη ρ α γ η α η η ο ά ι ι ε ο δ ύ ν κ ε η α β ι ε η έ ο κ α ο έ ρ νπ κ ε : Η δ η α θ νξ ά η ε ο α μ ί α ο κ ε η α μ ύ δ ύ ν ζ π η η η ώ λ π νπ έ ρ νπ λ ί δ η ν θ όξ ν θ α η ί δ η ν c or ( δ ε ι α δ ή ε ί η ε ε ί λ α η θ α η η α δ ύ ν γ σ λ η α θ ά ε ί η ε δ ε λ ε ί λ α η ) α ι ι ά δ η α θ έ ξ νπ λ θ α η ά 1 ζ η ε λ έ θ η α ζ ε α λ α κ έ λ ε η α η λ α ε ί λ α η 0. 3 7 1. Σ έ ι νο α λ ζ π γ θ ξ ί λ νπ κ ε δ ύ ν ζ π ί η η α κ ε η ν ί δ η ν c or θ α η η ε λ ί δ η α έ θ η α ζ ε α ι ι ά π νπ δ η α θ έ ξ νπ λ θ α η ά κ ί α κ νλ ά δ α ζ η ν θ όξ ν α λ α κ έ λ νπ κ ε δ η α θ νξ ά θ α η ά 0. 5 4 5 ζ η η ο α μ ί ε ο η νπ ο. Ο η π ξ νϋ π ν ζ έ ζ ε η ο η η ο νπ νί ε ο ζ α π ξ έ π ε η λ α ε ι έ γ μ νπ κ ε ε ί λ α η : 1 ) Η θ α λ νλ η θ ό η ε η α η σ λ θ α η α ι νί π σ λ. 2 ) Η α λ ε μ α ξ η ε ζ ί α η σ λ θ α η α ι ν ί π σ λ. 3 ) Η νκ νζ θ ε δ α ζ η η θ όη ε η α η σ λ θ α η α ι ν ί π σ λ. 4 ) Η γ ξ α κ κ η θ όη ε η α κ ε η α μ ύ η σ λ κ ε η α β ι ε η ώ λ η νπ κ νλ η έ ι νπ. 6 Σ α θ α η ά ι νη π α ε ί λ α η ε δ η α θ νξ ά η ε ο π ξ νβ ι ε π όκ ε λ ε ο η η κ ή ο η ε ο α μ ί α ο η σ λ ζ π η η η ώ λ ζ ύ κ θ σ λ α κ ε η ν κ νλ η έ ι ν α π ό η ε λ π ξ α γ κ α η η θ ή ( κ ε η α β ι ε η ή p r i c e ). 28
Η η ζ ρ ύ ο η νπ ο ε ί λ α η π νι ύ ζ ε κ α λ η η θ ή γ η α η ί α λ π α ξ α β η ά δ νλ η α η π π ά ξ ρ ε η κ ε γ ά ι ε π η ζ α λ όη ε η α λ α π ά ξ νπ κ ε α λ α θ ξ η β ή α π νη ε ι έ ζ κ α η α. Ξ ε θ η λ ώ λ η α ο α π ό η ε λ θ α λ νλ η θ ό η ε η α η σ λ θ α η α ι ν ί π σ λ ζ α θ ν η η ά μ νπ κ ε η ν η ζ η όγ ξ α κ κ ά η νπ ο θ α η ζ α θ ά λ νπ κ ε θ α η η νλ θ α η ά ι ι ε ι ν έ ι ε γ ρ ν θ α λ νλ η θ όη ε η α ο. Σ α θ α η ά ι νη π α ζ α η α π α ξ νπ ζ η ά ζ νπ κ ε κ ε κ ί α θ α η λ νύ ξ γ η α κ ε η α β ι ε η ή η ε λ r e s i d ua l ε ν π νί α ζ α ε ί λ α η ε δ η α θ νξ ά κ ε η α μ ύ η ε ο π ξ α γ κ α η η θ ή ο α μ ί α ο η σ λ ζ π η η η ώ λ ( κ ε η α β ι ε η ή p r i c e ) θ α η η ε ο π ξ νβ ι ε π όκ ε λ ε ο α π ό η ν κ νλ η έ ι ν α μ ί α ο η νπ ο ( κ ε η α β ι ε η ή p r i c e h a t ). Θ α η ε λ π π νι νγ ί ζ νπ κ ε σ ο ε μ ήο : p r i c e h a t = 0, 3 7 1 * s q f t + 0, 5 4 5 * tax + 1 6 0, 9 5 4 * c or Έ ρ νπ κ ε ι νη π ό λ η ν η ζ η όγ ξ α κ κ α : r e s i d ua l = p r i c e p r i c e h a t 21 Ι ζ η όγ ξ α κ κ α η ωλ θ α η α ι νί π ωλ η νπ κ νλ η έ ι νπ η ε ο α μ ί α ο κ ε η ν θ ό ξ ν, η ε λ έ θ η α ζ ε θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ ωλ η α θ ό. Βι έ π νπ κ ε όη η η α θ α η ά ι ν η π α α θ ν ι νπ ζ νύ λ α ξ θ ε η ά π η ζ η ά η ε λ θ α λ νλ η θ ή θ α κ π ύ ι ε. Γ η α η ε ζ π λ έ ρ ε η α ζ α θ ά λ νπ κ ε θ α η η νλ έ ι ε γ ρ ν θ α λ νλ η θ όη ε η α ο K ol m og or o v - S m i r n ov ν ν π νί νο κ α ο δ ί λ ε η η α π α ξ α θ ά η σ : 29
One-Sample Kolmogorov-Smirnov Test residual N 107 Normal Parameters a,,b Mean 9,7600 Std. Deviation 173,11814 Most Extreme Differences Absolute,111 Positive,082 Negative -,111 Kolmogorov-Smirnov Z 1,148 Asymp. Sig. (2-tailed),143 a. Test distribution is Normal. b. Calculated from data. 22 Έ ι ε γ ρ νο θ α λ νλ η θ ό η ε η α ο K ol m og or o v - S m i r n o v γ η α η α θ α η ά ι νη π α η ε ο π α ι η λ δ ξ όκ ε ζ ε ο η ε ο α μ ί α ο κ ε η ε λ έ θ η α ζ ε, η ν θ ό ξ ν θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ ωλ η α θ ό. Σν Asymp. Sig. (2-tailed) ε ί λ α η 0, 1 4 3 ά ξ α κ ε γ α ι ύ η ε ξ ν η νπ 0, 0 5 ν π όη ε δ ε λ α π νξ ξ ί π η νπ κ ε η ε λ π π όζ ε ζ ε π ε ξ ί θ α λ νλ η θ όη ε η α ο η σ λ θ α η α ι νί π σ λ. Γ η α η ε λ α λ ε μ α ξ η ε ζ ί α ζ α ρ ξ ε ζ η κ νπ ν η ή ζ νπ κ ε η νλ δ ε ί θ η ε D u r bi n - W a t s on Model Summary e,f Model R R Square b Square Adjusted R Std. Error of the Estimate Durbin-Watson 1,988 a,977,976 189,66555 2,991 c,982,981 169,30391 3,992 d,984,984 157,67831 1,801 a. Predictors: sqft b. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. c. Predictors: sqft, tax d. Predictors: sqft, tax, cor e. Dependent Variable: price f. Linear Regression through the Origin 23 Δ ε ί θ η ε ο D ur b i n - W a t s o n η ε ο π α ι η λ δ ξ όκ ε ζ ε ο η ε ο η η κ ή ο κ ε η ν θ όξ ν, η ε λ έ θ η α ζ ε θ α η η ν α λ η ν ζ π ί η η ε ί λ α η γ ωλ η α θ ό. 30
η νλ π α ξ α π ά λ σ π ί λ α θ α η α 3 κ νλ η έ ι α ε ί λ α η α π η ά π νπ π ή ξ α κ ε δ η α δ νρ η θ ά κ ε η ε λ κ έ ζ νδ ν f or wa r d θ α η κ α ο ε λ δ η α θ έ ξ ε η η ν η ξ ί η ν ( m od e l 3 ) ζ η ν νπ ν ί ν θ α η θ α η α ι ή μ α κ ε. Γ η α η ν κ νλ η έ ι ν α π η ό β ι έ π νπ κ ε όη η ν δ ε ί θ η ε ο η νπ D u r bi n - W a t s on ε ί λ α η 1, 8 0 1 δ ε ι α δ ή α ξ θ ε η ά θ νλ η ά ζ η ν 2 π ξ ά γ κ α π νπ π π νζ η ε ξ ί δ ε η ζ ε κ ε γ ά ι ν β α ζ κ ό όη η η α θ α η ά ι ν η π ά κ α ο ε ί λ α η α λ ε μ ά ξ η ε η α. Γ η α λ α ε ι έ γ μ νπ κ ε η ώ ξ α η ε λ νκ νζ θ ε δ α ζ η η θ όη ε η α ζ α π ξ έ π ε η λ α π ά ξ νπ κ ε η ε λ α λ ά ι π ζ ε δ η α θ ύ κ α λ ζ ε ο ρ σ ξ ί δ νλ η α ο η η ο π α ξ α η ε ξ ή ζ ε η ο κ α ο ζ ε νκ ά δ ε ο. Γ η α ι έ γ νπ κ ε ν η νκ ά δ ε ο α π η έ ο λ α γ ί λ νπ λ β ά ζ ε η η ε ο κ ε η α β ι ε η ή ο f e a t s δ ί λ νλ η ά ο κ α ο 9 νκ ά δ ε ο. residual Test of Homogeneity of Variances Levene Statistic df1 df2 Sig.,607 6 98,724 24 Έ ι ε γ ρ νο η νπ L e ve n e γ η α η ε λ η ζ ό η ε η α / νκ νζ θ ε δ α ζ η η θ όη ε η α η ωλ δ η α θ π κ ά λ ζ ε ωλ. Σ ν Sig. ε ί λ α η 0, 7 2 4, κ ε γ α ι ύ η ε ξ ν η νπ 0, 0 5, ά ξ α δ ε λ α π νξ ξ ί π η νπ κ ε η ε λ π π όζ ε ζ ε π ε ξ ί νκ νζ θ ε δ α ζ η η θ όη ε η α ο η σ λ δ η α θ π κ ά λ ζ ε σ λ. Σ έ ι νο γ η α η ε γ ξ α κ κ η θ όη ε η α κ ε η α μ ύ η ε ο πξ ν β ι ε π όκ ε λ ε ο θ α η π ξ α γ κ α η η θ ή ο α μ ί α ο η σ λ ζ π η η η ώ λ ζ α α ξ θ ε ζ η νύ κ ε ζ η ν δ η ά γ ξ α κ κ α δ η α ζ π νξ ώ λ η νπ ο. 25 Δ η ά γ ξ α κ κ α δ η α ζ π ν ξ ώλ κ ε η α μ ύ π ξ νβ ι ε π ό κ ε λ ε ο θ α η π ξ α γ κ α η η θ ή ο α μ ί α ο η ωλ ζ π η η η ώλ. 31
Η α ξ θ ε η ά π η ζ η ή π ξ νζ έ γ γ η ζ ε η ε ο ε π ζ ε ί α ο η νπ δ η α γ ξ ά κ κ α η νο κ α ο δ ί λ ε η η ε λ ε η θ όλ α π ν ι ύ θ α ι ή ο γ ξ α κ κ η θ όη ε η α ο α π ό η ν κ νλ η έ ι ν κ α ο. Μ ε η ε λ α π ι ή π α ι η λ δ ξ όκ ε ζ ε π α ί ξ λ νπ κ ε η α π α ξ α θ ά η σ : 7 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1,876 a,767,765 149,53329 a. Predictors: (Constant), price Coefficients a Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 36,344 43,237,841,402 price,703,038,876 18,581,000 a. Dependent Variable: tax 26 Γ ξ α κ κ η θ ή π α ι η λ δ ξ όκ ε ζ ε η νπ θ όξ νπ η ωλ ζ π η η η ώλ ζ ε ζ ρ έ ζ ε κ ε η ε λ η η κ ή η νπ ο. Σν R 2 ε ί λ α η 0, 7 6 7 θ α η η ν κ νλ η έ ι ν κ α ο δ η α κ νξ θ ώ λ ε η α η σ ο ε μ ή ο : Έ ρ νπ κ ε ι νη π όλ η α π α ξ α θ ά η σ : tax = 3 6, 3 4 4 + 0, 7 0 3 * pr i c e 1) Α ύ μ ε ζ ε η ε ο η η κ ή ο θ α η ά κ ί α κ νλ ά δ α ζ π λ ε π ά γ ε η α η ζ η ε λ α ύ μ ε ζ ε η νπ θ όξ νπ θ α η ά 0, 7 0 3. 2 ) Έ λ α ζ π ί η η κ ε κ ε δ ε λ η θ ή η η κ ή ζ α έ ρ ε η θ όξ ν ί ζ ν κ ε 3 6, 3 4 4. Α π η ό όκ σ ο δ ε λ έ ρ ε η λ όε κ α α θ νύ θ α λ έ λ α α π ό η α ζ π ί η η α κ α ο δ ε λ έ ρ ε η κ ε δ ε λ η θ ή α μ ί α. Δ π νκ έ λ σ ο ζ α ή η α λ ί ζ σ ο π η ν ι νγ η θ ό λ α μα λ α π ά ξ νπ κ ε η ν κ νλ η έ ι ν α ι ι ά ρ σ ξ ί ο ζ η α ζ ε ξ ά. Έ η ζ η έ ρ νπ κ ε : Model Summary Model R R Square b Square Adjusted R Std. Error of the Estimate 1,985 a,969,969 149,32617 a. Predictors: price 32
Model Summary Model R R Square b Square Adjusted R Std. Error of the Estimate 1,985 a,969,969 149,32617 a. Predictors: price b. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. Coefficients a,b Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 price,733,013,985 58,024,000 a. Dependent Variable: tax b. Linear Regression through the Origin 27 Γ ξ α κ κ η θ ή π α ι η λ δ ξ όκ ε ζ ε η νπ θ όξ νπ ζ ε ζ ρ έ ζ ε κ ε η ε λ η η κ ή ρ ωξ ί ο ζ η α ζ ε ξ ά. Σν θ α η λ νύ ξ γ η ν κ νλ η έ ι ν ( ρ σ ξ ί ο π ι έ νλ η ε ζ η α ζ ε ξ ά ) ε ί λ α η η ν: tax = 0, 7 3 3 * p r i c e Ο π όη ε η ώ ξ α ε α ύ μ ε ζ ε η νπ θ όξ νπ θ α η ά κ ί α κ νλ ά δ α ζ π λ ε π ά γ ε η α η ζ η ε λ α ύ μ ε ζ ε η ε ο η η κ ή ο θ α η ά 0. 7 3 3 ε λ ώ η ν R 2 α π μ ή ζ ε θ ε ζ η ν 0, 9 6 9 δ ί λ νλ η α ο κ α ο η ε λ ε η θόλ α π νιύ η ζ ρ π ξ ή ο ζ ρ έ ζ ε ο η σ λ δ ύ ν α π ηώ λ κ ε η α β ι ε η ώ λ. Γ η α η ν γ ξ α κ κ η θ ό κ νλ η έ ι ν π νπ β γ ά ι α κ ε ζ α π ξ έ π ε η η ώ ξ α λ α ε ι έ γ μ νπ κ ε α λ η ε ξ νύ λ η α η νη π ξ νϋ π ν ζ έ ζ ε η ο η νπ. Ό π σ ο π ξ να λ α θ έ ξ α κ ε θ α η ζ η ν 6 γ η α η ν π ξ νε γ νύ κ ε λ ν κ νλ η έ ι ν, α π η έ ο ε ί λ α η ν η π α ξ α θ ά η σ : 1 ) Η θ α λ νλ η θ ό η ε η α η σ λ θ α η α ι νί π σ λ. 2 ) Η α λ ε μ α ξ η ε ζ ί α η σ λ θ α η α ι ν ί π σ λ. 3 ) Η νκ νζ θ ε δ α ζ η η θ όη ε η α η σ λ θ α η α ι ν ί π σ λ. 4 ) Η γ ξ α κ κ η θ όη ε η α κ ε η α μ ύ η σ λ κ ε η α β ι ε η ώ λ η νπ κ νλ η έ ι νπ. Γ η α η νλ έ ι ε γ ρ ν η ε ο θ α λ ν λ η θ όη ε η α ο ζ α π ά ξ νπ κ ε θ α η π ά ι η η ν η ζ η όγ ξ α κ κ α η σ λ θ α η α ι νί π σ λ θ α η η ν Q - Q P l ot η α νπ ν ί α κ α ο δ ε ί ρ λ νπ λ π όζ ν π η ζ η ά π ξ νζ ε γ γ ί δ νπ λ η ε λ θ α λ νλ η θ ή θ α η α λ νκ ή. Γ η α λ α γ ί λ ε η α π η ό ζ α π ξ έ π ε η λ α η α δ ε κ η νπ ξ γ ή ζ νπ κ ε κ ί α λ έ α κ ε η α β ι ε η ή π νπ ζ α η ε λ νλ νκ ά ζ νπ κ ε r e s i d u a l s. Α ξ ρ η θ ά ζ α νξ ί ζ νπ κ ε η ε κ ε η α β ι ε η ή t a x h a t = p r i c e * 0. 7 3 3 π νπ ε ί λ α η ν θ όξ νο π νπ κ α ο δ ί λ ε η η ν κ νλ η έ ι ν π νπ β ξ ή θ α κ ε κ ε η ε λ π α ι η λ δ ξ όκ ε ζ ε. Σ α 33
θ α η ά ι νη π α ε π νκ έ λ σ ο ζ α νξ η ζ η νύ λ κ ε η νλ η ύ π ν r e s i d u a l s = t a x h a t - t a x. Έ ρ νπ κ ε η α π α ξ α θ ά η σ : 28 Ι ζ η όγ ξ α κ κ α η ωλ θ α η α ι νί π ωλ η ε ο π α ι η λ δ ξ όκ ε ζ ε ο η νπ θ ό ξ νπ κ ε η ε λ α μ ί α η ωλ ζ π η η η ώλ. Σ ν η ζ η όγ ξ α κ κ α κ α ο δ ε ί ρ λ ε η α ξ θ ε η ά θ α ι ή π ξ νζ α ξ κ νγ ή η σ λ θ α η α ι νί π σ λ ζ η ε λ θ α λ νλ η θ ή θ α η α λ νκ ή ε ν π νί α ζ π κ β ν ι ί δ ε η α η κ ε η ε λ θ α κ π ύ ι ε η νπ δ η α γ ξ ά κ κ α η νο. Σ ν ε π όκ ε λ ν δ η ά γ ξ α κ κ α ε ί λ α η η ν Q - Q P l ot : 34
29 Q -Q P l ot γ η α η α θ α η ά ι νη π α η ε ο π α ι η λ δ ξ όκ ε ζ ε ο η νπ θ όξ νπ κ ε η ε λ α μ ί α. Κα η ζ ε α π η ό η ν δ η ά γ ξ α κ κ α π α ξ α η ε ξ νύ κ ε κ ί α α ξ θ ε η ά θ α ι ή π ξ νζ α ξ κ νγ ή η σ λ θ α η α ι νί π σ λ ζ η ε λ θ α λ νλ η θ ή θ α η α λ νκ ή ( δ ε ι α δ ή ζ η ε λ ε π ζ ε ί α π νπ έ ρ ε η ). Σέ ι νο ζ α θ ά λ νπ κ ε η νλ έ ι ε γ ρ ν η νπ K ol m og or o v - S m i r n ov γ η α η νλ έ ι ε γ ρ ν η ε ο θ α λ νλ η θ όη ε η α ο. Π α ί ξ λ νπ κ ε : Test of Normality Kolmogorov-Smirnov a Statistic df Sig. residuals,079 107,094 30 Έ ι ε γ ρ νο θ α λ νλ η θ ό η ε η α ο γ η α η ν κ νλ η έ ι ν η νπ θ όξ νπ κ ε η ε λ α μ ί α. Σν Sig. ε ί λ α η 0, 0 9 4 νπ όη ε κ ε γ α ιύ η ε ξ ν η νπ ε π η π έ δ νπ ζ ε κ α λ η η θ όη ε η α ο ( π νπ έ ρ νπ κ ε νξ ί ζ ε η ζ η ν 0, 0 5 ) ά ξ α δ ε λ α π νξ ξ ί π η νπ κ ε η ε λ π π όζ ε ζ ε π ε ξ ί η ε ο θ α λ νλ η θ όη ε η α ο η σ λ θ α η α ι νί π σ λ. Γη α η ε λ α λ ε μα ξ η ε ζ ί α η σ λ θ α η α ι ν ί π σ λ ζ α ρ ξ ε ζ η κ νπ νη ή ζ νπ κ ε η ν λ έ ι ε γ ρ ν D u r bi n - Wa t s on ν νπ νί νο κ α ο δ ί λ ε η : 35
Model Summary c,d Model R R Square b Square Adjusted R Std. Error of the Estimate Durbin-Watson 1,985 a,969,969 149,32617 1,566 a. Predictors: price b. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. c. Dependent Variable: tax d. Linear Regression through the Origin 31 Δ ε ί θ η ε ο D ur b i n - W a t s o n γ η α η ν κ νλ η έ ι ν η νπ θ όξ νπ θ α η η ε ο α μ ί α ο. Η η η κ ή η νπ δ ε ί θ η ε D u r bi n - W a t s on ε ί λ α η θ νλ η ά ζ η ν 2 π ξ ά γ κ α π νπ κ α ο θ ά λ ε η λ α α π νθ α λ ζ νύ κ ε η ε λ κ ε α π η νζ π ζ ρ έ η ηζ ε η σ λ θ α η α ι ν ί π σ λ δ ε ι α δ ή η ε λ α λ ε μ α ξ η ε ζ ί α η νπ ο. Μ π νξ νύ κ ε ε π ί ζ ε ο λ α π ά ξ νπ κ ε θ α η η ν δ η ά γ ξ α κ κ α δ η α ζ π νξ ώ λ η σ λ θ α η α ι νί π σ λ η ε ο π α ι η λ δ ξ όκ ε ζ ε ο : 36
32 Δ η ά γ ξ α κ κ α δ η α ζ π ν ξ ώλ η ωλ θ α η α ι νί π ωλ η ε ο π α ι η λ δ ξ όκ ε ζ ε ο η νπ θ ό ξ νπ κ ε η ε λ α μ ί α. Βι έ π νπ κ ε θ α η α π ό ε δ ώ έ λ α λέ θ νο ζ ε κ ε ί σ λ π νπ π π νζ η ε ξ ί δ ε η α θ όκ α π ε ξ η ζ ζ όη ε ξ ν η ε λ η π ρ α η ό η ε η α θ α η θ α η ε π έ θ η α ζ ε η ε λ α λ ε μα ξ η ε ζ ί α κ ε η α μ ύ η σ λ θ α η α ι νί π σ λ η ε ο π α ι η λ δ ξ όκ ε ζ ε ο. Γη α η ε λ νκ νζ θ ε δ α ζ η η θ όη ε η α η σ λ θ α η α ι ν ί π σ λ ζ α θ ά λ νπ κ ε η νλ έ ι ε γ ρ ν η ε ο η ζ όη ε η α ο δ η α θ π κ ά λ ζ ε σ λ ρ σ ξ ί δνλ η α ο η η ο η η κ έ ο ζ ε νκ ά δ ε ο. Κα η π ά ιη ζ α θ η η ά μνπ κ ε κ ί α νκ ά δ α γ η α θ ά ζ ε η η κ ή η ε ο κ ε η α β ι ε η ή ο f e a t s ε π νκ έ λ σ ο 9. Σα α π νη ε ι έ ζ κ α η α : residuals Test of Homogeneity of Variances Levene Statistic df1 df2 Sig. 1,245 6 98,290 33 Έ ι ε γ ρ νο η ζ ό η ε η α ο / νκ νζ θ ε δ α ζ η η θ όη ε η α ο η ωλ δ η α θ π κ ά λ ζ ε ωλ η ωλ θ α η α ι νί π ωλ η νπ κ νλ η έ ι νπ η νπ θ ό ξ νπ κ ε η ε λ α μ ί α. Σ ν Sig. ε ί λ α η π ς ε ι όη ε ξ ν η νπ ε π η π έ δ νπ ζ ε κ α λ η η θ όη ε η α ο ( π νπ ε ί λ α η 0, 0 5 ) νπ όη ε δ ε λ α π νξ ξ ί π η νπ κ ε η ε λ π π ό ζ ε ζ ε π ε ξ ί η ζ όη ε η α ο / νκ νζ θ ε δ α ζ η η θ όη ε η α ο η σ λ δ η α θ π κ ά λ ζ ε σ λ κ ε η α μ ύ η σ λ νκ ά δ σ λ ησ λ θα η α ι νί π σ λ. 37
ANOVA residuals Sum of Squares df Mean Square F Sig. Between Groups 245719,372 8 30714,921 1,422,197 Within Groups 2116371,789 98 21595,630 Total 2362091,160 106 34 Π ί λ α θ α ο α λ ά ι π ζ ε ο δ η α θ ύ κ α λ ζ ε ο η ωλ θ α η α ι νί π ωλ η νπ κ νλ η έ ι νπ η νπ θ όξ νπ κ ε η ε λ α μ ί α. Ο π α ξ α π ά λ σ π ί λ α θ α ο κ α ο δ ί λ ε η η ν α π νη έ ι ε ζ κ α η νπ ε ι έ γ ρ νπ η ε ο η ζ όη ε η α ο η σ λ κ έ ζ σ λ κ ε η α μύ η σ λ νκ ά δ σ λ ησ λ θ α η α ι νί π σ λ. Μ ε Sig. ί ζ ν κ ε 0, 1 9 7 δ ε λ α π νξ ξ ί π η νπ κ ε η ε λ π π όζ ε ζ ε η ε ο η ζ όη ε η α ο η σ λ κ έ ζ σ λ. Η η ε ι ε π η α ί α π ξ νϋ π ό ζ ε ζ ε π νπ ζ α κ α ο α π α ζ ρ νι ή ζ ε η ε ί λ α η α π η ή η ε ο γ ξ α κ κ η θόη ε η α ο η σ λ κ ε η α β ι ε η ώ λ η νπ κ νλ η έ ι νπ δ ε ι α δ ή η νπ θ όξ νπ θ α η η ε ο α μ ί α ο η σ λ ζ π η η η ώ λ. Θ α με θ η λ ή ζ νπ κ ε κ ε έ λ α δ η ά γ ξ α κ κ α δ η α ζ π νξ ώ λ ( s c a t t e r p l ot ) η ν νπ ν ί ν θ α ί λ ε η α η π α ξ α θ ά η σ : 35 Δ η ά γ ξ α κ κ α δ η α ζ π ν ξ ώλ η νπ θ ό ξ νπ θ α η η ε ο η η κ ή ο η νπ θ όξ νπ π νπ π ξ νβ ι έ π ε η η ν κ νλ η έ ι ν. Π α ξ α η ε ξ νύ κ ε α ξ θ ε η ά θ α ι ή ζ πζ ρ έ η η ζ ε η σ λ δ ύ ν κ ε η α β ι ε η ώ λ κ αο π νπ π ξ νζ ε γ γ ί δ ε η η ε γ ξ α κ κ η θόη ε η α. 38