«Εκτίμηση αγοραίων αξιών ακινήτων με τη χρήση μοντέλου πολλαπλής γραμμικής παλινδρόμησης, εφαρμογή στην πόλη της Θεσσαλονίκης και της Βαρκελώνης»

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "«Εκτίμηση αγοραίων αξιών ακινήτων με τη χρήση μοντέλου πολλαπλής γραμμικής παλινδρόμησης, εφαρμογή στην πόλη της Θεσσαλονίκης και της Βαρκελώνης»"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ - ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΑΓΡΟΝΟΜΩΝ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΤΕΧΝΙΚΕΣ ΚΑΙ ΜΕΘΟΔΟΙ ΣΤΗΝ ΑΝΑΛΥΣΗ, ΣΧΕΔΙΑΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΤΟΥ ΧΩΡΟΥ» ΚΑΤΕΥΘΥΝΣΗ «ΚΤΗΜΑΤΟΛΟΓΙΟ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΧΩΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ» Μεταπτυχιακή διατριβή «Εκτίμηση αγοραίων αξιών ακινήτων με τη χρήση μοντέλου πολλαπλής γραμμικής παλινδρόμησης, εφαρμογή στην πόλη της Θεσσαλονίκης και της Βαρκελώνης» ΕΥΡΩΠΗ Β. ΑΝΑΣΤΑΣΙΑΔΟΥ Διπλ. Αγρονόμος τοπογράφος μηχανικός Α.Π.Θ. Υπεύθυνος Διατριβής: Αρβανίτης Απόστολος, Καθηγητής Α.Π.Θ. Εξεταστική επιτροπή Αρβανίτης Α. Καθηγητής Λαφαζάνη Π. Αναπλ. Καθηγήτρια Παπαδοπούλου Μ. Αναπλ. Καθηγήτρια Θεσσαλονίκη, Μάρτιος 2013

2 ΕΥΧΑΡΙΣΤΙΕΣ Η παρούσα μεταπτυχιακή διατριβή με τίτλο «Εκτίμηση αγοραίων αξιών ακινήτων με τη χρήση μοντέλου πολλαπλής γραμμικής παλινδρόμησης, εφαρμογή στην πόλη της Θεσσαλονίκης και της Βαρκελώνης» εκπονήθηκε στα πλαίσια του προγράμματος μεταπτυχιακών σπουδών με τίτλο «Κτηματολόγιο και Διαχείριση Χωρικών Δεδομένων» της κατεύθυνσης «Τεχνικές μέθοδοι στη Ανάλυση, Σχεδίαση & Διαχείριση του Χώρου» του Τμήματος Αγρονόμων Τοπογράφων Μηχανικών του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης. Με το πέρας της μεταπτυχιακής διπλωματικής εργασίας θα ήθελα να ευχαριστήσω θερμά τον Καθηγητή Αρβανίτη Απόστολο αρχικά για την εμπιστοσύνη που μου έδειξε με την ανάθεση της μεταπτυχιακής εργασίας, αλλά κυρίως για την πολύτιμη καθοδήγηση, επιμονή και υποστήριξη του, η οποία ήταν καθοριστικής σημασίας για την έκβαση της μεταπτυχιακής διατριβής. Επίσης, θα ήθελα να ευχαριστήσω εγκάρδια την Επίκουρο Καθηγήτρια Λαφαζάνη Περιστέρα, η οποία έδειξε εξαιρετικό διδακτικό ενδιαφέρον κατά τη διάρκεια της συνεργασίας μας και αφιέρωσε πολύτιμο χρόνο για τη δική μου καθοδήγηση στο δύσκολο αντικείμενο της στατιστικής ανάλυσης, με τις επιστημονικές συμβουλές και γνώσεις της. Τέλος, δε θα ήθελα να παραλείψω να ευχαριστήσω τη Γεωργοπούλου Ελισάβετ για την πολύτιμη συμβολή της και τον Διδάκτορα Μισιρλόγλου Συμεών, Διπλωματούχο Αγρονόμο Τοπογράφο Μηχανικό για την άριστη συνεργασία, το ενδιαφέρον του και τις συμβουλές του στη διάρκεια της εργασίας μέχρι και την τελική της παράδοση. Κλείνοντας το παρόν σημείωμα, αισθάνομαι την ανάγκη να ευχαριστήσω την οικογένεια μου και όλους τους δικούς μου ανθρώπους που με τη στήριξη και την υπομονή τους με βοήθησαν για την υλοποίηση ενός ακόμη στόχου στην ακαδημαϊκή μου πορεία. Θεσσαλονίκη, Μάρτιος 2013 Αναστασιάδου Ευρώπη

3 ΠΕΡΙΛΗΨΗ Η εκτίμηση της αξίας κατοικιών αποτελεί μία καθημερινή διαδικασία σε πολλούς τομείς μίας κοινωνίας. Πραγματοποιούνται εκτιμήσεις αξιών για αγοραπωλησίες, για λήψεις δανείων, για επενδυτικές κινήσεις ή ακόμη για φορολογικούς σκοπούς προς όφελος του κράτους. Στην παρούσα εργασία γίνεται προσπάθεια αυτοματοποίησης και ελέγχου της εκτίμησης αγοραίων αξιών ακινήτων μέσω γραμμικού μοντέλου εκτίμησης, με τη βοήθεια της στατιστικής και των βασικών αρχών εκτίμησης ακινήτων. Ο κύριος στόχος της παρούσας μεταπτυχιακής διατριβής διακρίνεται σε δύο βασικά σκέλη. Αρχικά, επιδιώκεται με τη βοήθεια ενός στατιστικού δείγματος η αναζήτηση των μεταβλητών που ερμηνεύουν τον τρόπο με τον οποίο διαμορφώνεται η αγοραία αξία των ακινήτων, ενώ δεύτερο στόχο αποτελεί η διερεύνηση των διαφοροποιήσεων που υφίστανται οι μεταβλητές ως προς τον αριθμό και το είδος τους ανάλογα με την περιοχή μελέτης. Μέσω των διαφοροποιήσεων που αναμένεται να υπάρχουν, διαφαίνεται η επίδραση του χώρου και της γεωγραφικής θέσης στα βάρη των μεταβλητών που διαμορφώνουν τις αγοραίες αξίες των ακινήτων, καθώς πρόκειται για ένα γεωγραφικό και οικονομικό φαινόμενο. Η εφαρμογή πραγματοποιείται σε δύο περιοχές της Θεσσαλονίκης (κέντρο και Εύοσμος)και σε τρεις περιοχές της Βαρκελώνης (Eixample, Sant Marti και Badalona). Η επιλογή των πέντε περιοχών μελέτης δεν γίνεται τυχαία, καθώς η κάθε μία από τις παραπάνω έχει χαρακτηριστικά που τη διαφοροποιούν από τις υπόλοιπες περιοχές σε κοινωνικό, οικονομικό, πληθυσμιακό και ιστορικό επίπεδο και τις καθιστούν άξιες μελέτης. Πηγή δεδομένων για την έρευνα αποτελεί η συγκέντρωση πέντε στατιστικών δειγμάτων μέσω του διαδικτύου. Ως μεταβλητές θεωρούνται οι αγοραίες αξίες των προς μελέτη οριζόντιων ιδιοκτησιών και οι τιμές που αντιστοιχίζονται στα βασικά χαρακτηριστικά τους γνωρίσματα όπως εμβαδόν, παλαιότητα, όροφος, γωνιακή θέση, ύπαρξη ανελκυστήρα, θέση στάθμευσης, είδος θέρμανσης, αριθμός δωματίων, αριθμός μπάνιων και βαθμός συντήρησης τους. Για το σχηματισμό των μοντέλων εκτίμησης αγοραίων αξιών αξιοποιείται σε πρώτο στάδιο η μέθοδος της πολλαπλής γραμμικής παλινδρόμησης με τη βοήθεια του στατιστικού εργαλείου SPSS 18. Για τον έλεγχο αξιοπιστίας των μοντέλων πραγματοποιούνται έλεγχοι επτά παραδοχών των γραμμικών μοντέλων ενώ ταυτόχρονα αξιοποιούνται μέθοδοι εκτίμησης της προβλεπτικής τους ικανότητας. Τελικό προϊόν της διαδικασίας είναι η δημιουργία πέντε γραμμικών εξισώσεων παλινδρόμησης που βοηθούν τον υπολογισμό των εκτιμώμενων αξιών ακινήτων. Σε δεύτερο στάδιο πραγματοποιείται ο σχηματισμός του ίδιου μοντέλου με τη βοήθεια της πολλαπλής γραμμικής παλινδρόμησης σε περιβάλλον ArcGIS10, με την ταυτόχρονη χαρτογράφηση των ακινήτων του δείγματος για τις δύο περιοχές μελέτης της Θεσσαλονίκης. Τα συμπεράσματα που προκύπτουν στο τέλος της εργασίας επικεντρώνονται στη μαθηματική και φυσική ερμηνεία των μοντέλων, στη σύγκριση των μεταβλητών που διαμορφώνουν τις τελικές αξίες ακινήτων στο εσωτερικό κάθε πόλης ξεχωριστά και στη i

4 συνέχεια σε επίπεδο κτηματαγοράς των δύο πόλεων. Τέλος, αξιολογούνται τα πλεονεκτήματα και μειονεκτήματα της δημιουργίας γραμμικών μοντέλων στο SPSS και σε περιβάλλον ArcGIS. Από τις πέντε τελικές εξισώσεις πολλαπλής παλινδρόμησης προκύπτει ότι η μοντελοποίηση αγοραίων αξιών ακινήτων είναι μία ιδιαίτερα ευαίσθητη διαδικασία, καθώς τα μεγέθη είναι συνεχώς μεταβαλλόμενα, ωστόσο με μία σταθερά ενημερωμένη βάση δεδομένων σε τοπικό επίπεδο μπορεί να δώσει ορθά και αξιόπιστα αποτελέσματα για κάθε χρήση ιδιωτική ή κρατική. Λέξεις κλειδιά: αγοραία αξία ακινήτου, πολλαπλή γραμμική παλινδρόμηση, στατιστική ανάλυση, Γεωγραφικά συστήματα Πληροφοριών ii

5 ARISTOTLE UNIVERSITY OF THESSALONIKI School of Rural & Surveying Engineering (RSE) Postgraduate Studies Cadastre and Spatial Analysis E. Anastasiadou Thessaloniki, March 2013 Estimation of Property Market Value with the Use of a Multiple Linear Regression Model: A Case Study of Thessaloniki and Barcelona ABSTRACT Estimating the value of property is a daily task in multiple areas within any given society. Estimations of this sort are conducted for real estate transactions, loans, and investments, as well as for determining property tax rates, etc. The present study proposes a method of automatizing and validating the estimation of the market values of properties with the use of a linear model of estimation, aided by statistics, and with the application of elementary principles of estimating property value. The main focus of the present M.Sc. thesis is twofold: first, using a statistical sample of properties, to determine the variables that explain the ways in which the market value of property is estimated; and second, to study the differentiations that these variables present in terms of their quantity and type, depending on a given geographical area under study. Analysis of expected differentiations of this sort shows that geographical location clearly affects the weight of variables that determine the market values of properties, as the nature of these variables is evidently geographical and economic. The proposed model has been applied to two areas in the Thessaloniki region (central Thessaloniki and Evosmos) and three areas in the Barcelona region (Eixample, Sant Marti and Badalona). None of the areas was randomly selected; the selection was made based on distinctive social, financial, historical, and population features which differentiate these five areas from others, thus exhibiting interesting research potentials. The data used in the research were acquired from five online statistical samples. The model considers as variables the market values of the horizontal properties under study, as well as their prices based on their features such as surface area, year of construction, floor, corner position, elevator, parking spot, type of heating, number of rooms, number of bathrooms, and level of maintenance. The formulation of the five models for estimating market values, one for each area, consists of two stages. The first stage is to utilize the multiple linear regression method, with the help of the SPSS 18 statistical software. In order to verify the validity of the models, tests of the seven assumptions of linear models are carried out, while at the same time methods for assessing their prediction ability are utilized. The product resulting from this procedure is the formulation of five linear regression equations, which assist in calculating the estimated market values of properties. The second stage involves the formulation of the same model with the help of multiple linear regression in ArcGIS 10 iii

6 environment, while at the same time the sample properties reflecting the two studied areas of Thessaloniki were mapped. The conclusions drawn at the end of the study focus on analyzing the models on mathematical and geographical terms; the variables are compared based on the way they form the final market values of properties within each specific city separately, as well as on the level of the real estate markets of both cities comparatively. Finally, the conclusions evaluate the advantages and disadvantages of creating linear models in SPSS and in ArcGIS environment. From the resulting five multiple regression equations it is concluded that the modelization of property market values is a particularly delicate procedure, as the parameters affecting property value constantly change; still, with the use of a database regularly updated on a local level, the modelization can indeed provide correct and reliable results that be applied to all uses in both the private and public sectors. Keywords: property market value; multiple linear regression; statistical analysis; Geographical Information Systems (GIS) iv

7 ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΠΕΡΙΛΗΨΗ... i ABSTRACT... iii ΕΙΣΑΓΩΓΗ ο ΚΕΦΑΛΑΙΟ ΤΟ ΑΣΤΙΚΟ ΑΚΙΝΗΤΟ ΩΣ ΑΝΤΙΚΕΙΜΕΝΟ ΜΕΛΕΤΗΣ 1.1 Μονάδα αναφοράς Αγοραία αξία ακινήτου Παράγοντες που επηρεάζουν την αξία ενός αστικού ακινήτου Γενικοί παράγοντες επίδρασης Ειδικοί παράγοντες επίδρασης Εφαρμογή ο ΚΕΦΑΛΑΙΟ ΠΕΡΙΟΧΕΣ ΜΕΛΕΤΗΣ 2.1 Περιοχές μελέτης στην πόλη της Θεσσαλονίκης Πρώτη περιοχή μελέτης Κέντρο Θεσσαλονίκης Δεύτερη περιοχή μελέτης Δημοτική Ενότητα Ευόσμου Περιοχές μελέτης στην πόλη της Βαρκελώνης Τρίτη περιοχή μελέτης Eixample Βαρκελώνης Τέταρτη περιοχή μελέτης Sant Marti Βαρκελώνης Τέταρτη περιοχή μελέτης Badalona Βαρκελώνης ο ΚΕΦΑΛΑΙΟ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ 3.1 Θεωρητικό υπόβαθρο Εφαρμογή Επιλογή στατιστικής μεθόδου Σχηματισμός του δείγματος Μέγεθος δείγματος Διαδικασία δειγματοληψίας Κατηγοριοποίηση και ποσοτικοποίηση των ανεξάρτητων μεταβλητών Μεθοδολογικό πλαίσιο Συμπεράσματα... 45

8 4 ο ΚΕΦΑΛΑΙΟ ΔΗΜΙΟΥΡΓΙΑ ΜΑΘΗΜΑΤΙΚΟΥ ΜΟΝΤΕΛΟΥ ΜΕΣΩ ΠΟΛΛΑΠΛΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΜΕ ΣΚΟΠΟ ΤΟΝ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟ ΥΠΟΛΟΓΙΣΜΟ ΤΗΣ ΑΓΟΡΑΙΑΣ ΑΞΙΑΣ ΔΙΑΜΕΡΙΣΜΑΤΩΝ ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΠΟΛΗ ΤΗΣ ΘΕΣΣΑΛΟΝΙΚΗΣ 4.1 Περιβάλλον εργασίας για τη στατιστική εφαρμογή - SPSS Εφαρμογή πολλαπλής γραμμικής παλινδρόμησης για ένα τμήμα του κέντρου της Θεσσαλονίκης (Πρώτο μοντέλο) Δημιουργία παλινδρομικού μοντέλου σε περιβάλλον spss Έλεγχος ικανοποίησης προϋποθέσεων αρχικού μοντέλου πολλαπλής γραμμικής παλινδρόμησης Σημαντικότητα ανεξάρτητων μεταβλητών Ανεξαρτησία οντοτήτων Πολυσυγγραμικότητα ή Συγγραμικότητα Κανονικότητα Ισότητα διακυμάνσεων/ομοσκεδαστικότητα Γραμμικότητα Ακραίες οντότητες και οντότητες επίδρασης Χρήση δεικτών για τον εντοπισμό των ακραίων οντοτήτων Χρήση δεικτών για τον εντοπισμό των οντοτήτων επίδρασης Χρήση γραφημάτων για τον εντοπισμό οντοτήτων επίδρασης Χρήση κατανομών για τον εντοπισμό οντοτήτων επίδρασης Έλεγχος προβλεπτικής ικανότητας του αρχικού μοντέλου Μέθοδος των διαστημάτων πρόβλεψης Μέθοδος του διαχωρισμού των δεδομένων (Data Splitting) Μέθοδος εύρεσης του βέλτιστου αριθμού σημαντικών μεταβλητών Διαδοχικές προσεγγίσεις για σχηματισμό τελικού μοντέλου Έλεγχος ικανοποίησης προϋποθέσεων τελικού μοντέλου πολλαπλής γραμμικής παλινδρόμησης Σημαντικότητα ανεξάρτητων μεταβλητών Ανεξαρτησία οντοτήτων Πολυσυγγραμικότητα ή Συγγραμικότητα Κανονικότητα Ισότητα διακυμάνσεων/ομοσκεδαστικότητα Γραμμικότητα

9 Ακραίες οντότητες και οντότητες επίδρασης Έλεγχος προβλεπτικής ικανότητας του τελικού μοντέλου Μέθοδος των διαστημάτων πρόβλεψης Μέθοδος του διαχωρισμού των δεδομένων (Data Splitting) Μέθοδος εύρεσης του βέλτιστου αριθμού σημαντικών μεταβλητών Ερμηνεία μοντέλου για την περιοχή του κέντρου Εφαρμογή πολλαπλής γραμμικής παλινδρόμησης για τη Δημοτική Ενότητα Ευόσμου (Δεύτερο μοντέλο) Διερεύνηση γραμμικής σχέσης μεταξύ της εξαρτημένης μεταβλητής Υ και των ανεξάρτητων Χ i Γραφήματα συσχέτισης των Χi με την Υ Συντελεστές μερικής συσχέτισης Εφαρμογή πολλαπλής γραμμικής παλινδρόμησης και δημιουργία τελικού μοντέλου Έλεγχος ικανοποίησης παραδοχών του γραμμικού μοντέλου Σημαντικότητα ανεξάρτητων μεταβλητών Ανεξαρτησία οντοτήτων Πολυσυγγραμικότητα ή συγγραμικότητα Κανονικότητα Ισότητα διακυμάνσεων ή ομοσκεδαστικότητα Γραμμικότητα Ακραίες οντότητες και οντότητες επίδρασης Έλεγχος προβλεπτικής ικανότητας του μοντέλου Μέθοδος των διαστημάτων πρόβλεψης Μέθοδος του διαχωρισμού των δεδομένων (Data Splitting) Μέθοδος εύρεσης του βέλτιστου αριθμού σημαντικών μεταβλητών Ερμηνεία μοντέλου για την περιοχή του Ευόσμου Συμπεράσματα ο ΚΕΦΑΛΑΙΟ ΔΗΜΙΟΥΡΓΙΑ ΜΑΘΗΜΑΤΙΚΟΥ ΜΟΝΤΕΛΟΥ ΜΕΣΩ ΤΗΣ ΠΟΛΛΑΠΛΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΜΕ ΣΚΟΠΟ ΤΟΝ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟ ΥΠΟΛΟΓΙΣΜΟ ΤΗΣ ΑΓΟΡΑΙΑΣ ΑΞΙΑΣ ΤΩΝ ΔΙΑΜΕΡΙΣΜΑΤΩΝ ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΠΟΛΗ ΤΗΣ ΒΑΡΚΕΛΩΝΗΣ 5.1 Εφαρμογή πολλαπλής γραμμικής παλινδρόμησης για την περιοχή Eixample (Τρίτο μοντέλο)

10 5.1.1 Διερεύνηση γραμμικής σχέσης μεταξύ της εξαρτημένης μεταβλητής Υ και των ανεξάρτητων Χ i Γραφήματα συσχέτισης των Χ i με την Υ Συντελεστές μερικής συσχέτισης Εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης και δημιουργία τελικού μοντέλου Έλεγχος ικανοποίησης παραδοχών του γραμμικού μοντέλου Σημαντικότητα ανεξάρτητων μεταβλητών Ανεξαρτησία οντοτήτων Πολυσυγγραμικότητα ή συγγραμικότητα Κανονικότητα Ισότητα διακυμάνσεων ή ομοσκεδαστικότητα Γραμμικότητα Ακραίες οντότητες και οντότητες επίδρασης Έλεγχος προβλεπτικής ικανότητας του μοντέλου Μέθοδος των διαστημάτων πρόβλεψης Μέθοδος του διαχωρισμού των δεδομένων (Data Splitting) Μέθοδος εύρεσης του βέλτιστου αριθμού σημαντικών μεταβλητών Ερμηνεία μοντέλου για την περιοχή Eixample Εφαρμογή πολλαπλής γραμμικής παλινδρόμησης για την περιοχή Sant Marti (Τέταρτο μοντέλο) Διερεύνηση γραμμικής σχέσης μεταξύ της εξαρτημένης μεταβλητής Υ και των ανεξάρτητων Χ i Γραφήματα συσχέτισης των Χ i με την Υ Συντελεστές μερικής συσχέτισης Εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης και δημιουργία τελικού μοντέλου Έλεγχος ικανοποίησης παραδοχών του γραμμικού μοντέλου Σημαντικότητα ανεξάρτητων μεταβλητών Ανεξαρτησία οντοτήτων Πολυσυγγραμικότητα ή συγγραμικότητα Κανονικότητα Ισότητα διακυμάνσεων ή ομοσκεδαστικότητα Γραμμικότητα Ακραίες οντότητες και οντότητες επίδρασης

11 5.2.4 Έλεγχος προβλεπτικής ικανότητας του μοντέλου Μέθοδος των διαστημάτων πρόβλεψης Μέθοδος του διαχωρισμού των δεδομένων (Data Splitting) Μέθοδος εύρεσης του βέλτιστου αριθμού σημαντικών μεταβλητών Ερμηνεία μοντέλου για την περιοχή Sant Marti Εφαρμογή πολλαπλής γραμμικής παλινδρόμησης για την περιοχή Badalona (Πέμπτο μοντέλο) Διερεύνηση γραμμικής σχέσης μεταξύ της εξαρτημένης μεταβλητής Υ και των ανεξάρτητων Χ i Γραφήματα συσχέτισης των Χ i με την Υ Συντελεστές μερικής συσχέτισης Εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης και δημιουργία τελικού μοντέλου Έλεγχος ικανοποίησης παραδοχών του γραμμικού μοντέλου Σημαντικότητα ανεξάρτητων μεταβλητών Ανεξαρτησία οντοτήτων Πολυσυγγραμικότητα ή συγγραμικότητα Κανονικότητα Ισότητα διακυμάνσεων ή ομοσκεδαστικότητα Γραμμικότητα Ακραίες οντότητες και οντότητες επίδρασης Έλεγχος προβλεπτικής ικανότητας του μοντέλου Μέθοδος των διαστημάτων πρόβλεψης Μέθοδος του διαχωρισμού των δεδομένων (Data Splitting) Μέθοδος εύρεσης του βέλτιστου αριθμού σημαντικών μεταβλητών Ερμηνεία μοντέλου για την περιοχή Badalona Συμπεράσματα ο ΚΕΦΑΛΑΙΟ ΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ Η ΜΕΘΟΔΟΣ ΤΗΣ ΠΟΛΛΑΠΛΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ 6.1 Εισαγωγή δεδομένων στο Γεωγραφικό Σύστημα Πληροφοριών Δημιουργία χωρικής βάσης δεδομένων Εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης στην περιοχή του κέντρου της Θεσσαλονίκης Διαδικασία πολλαπλής γραμμικής παλινδρόμησης

12 6.2.2 Παρουσίαση και ερμηνεία των αποτελεσμάτων Δημιουργία νέου επιπέδου της OLS διαδικασίας Γενική επίδοση του μοντέλου Σχολιασμός των συντελεστών πολλαπλής παλινδρόμησης Έλεγχος στατιστικής σημαντικότητας των ανεξάρτητων μεταβλητών Έλεγχος συγγραμμικότητας/πολυσυγγραμμικότητας Έλεγχος κανονικότητας των υπολοίπων Έλεγχος ανεξαρτησίας των υπολοίπων Εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης στην περιοχή του Ευόσμου Θεσσαλονίκης Συμπεράσματα ο ΚΕΦΑΛΑΙΟ ΣΥΜΠΕΡΑΣΜΑΤΑ & ΠΡΟΤΑΣΕΙΣ 7.1 Συμπεράσματα Προτάσεις ΒΙΒΛΙΟΓΡΑΦΙΚΕΣ ΠΑΡΑΠΟΜΠΕΣ

13 ΕΙΣΑΓΩΓΗ Στην παρούσα εισαγωγή πραγματοποιείται μία συνοπτική παρουσίαση του περιεχομένου όλων των κεφαλαίων που έπονται, ώστε με αυτόν τον τρόπο να γίνει κατανοητή προς των αναγνώστη η δομή της εργασίας και ο τρόπος που διαρθρώνονται τα επιμέρους κεφάλαια. Πιο συγκεκριμένα, στο πρώτο κεφάλαιο γίνεται αναφορά στη σημασία μελέτης της κατοικίας και ειδικότερα στον ελλαδικό χώρο, ενώ επισημαίνεται η χωρική μονάδα αναφοράς της παρούσας εφαρμογής. Επίσης, γίνεται η εισαγωγή στην έννοια της αγοραίας αξίας, όπου στόχο αποτελεί η προσέγγιση της και αναλύονται με λεπτομέρεια οι παράγοντες που διαμορφώνουν τις αγοραίες αξίες διαμερισμάτων σε αστικό περιβάλλον. Στο δεύτερο κεφάλαιο, πραγματοποιείται η περιγραφή των λόγων για τους οποίους επιλέγεται ως δεύτερη ευρωπαϊκή πόλη η Βαρκελώνη και αναλύονται οι ομοιότητες και οι διαφορές της αγοράς ακινήτων σε σχέση με τη Θεσσαλονίκη. Στη συνέχεια, για κάθε μία από τις πέντε περιοχές μελέτης δίνονται χάρτες για τον ορισμό της θέσης τους και στοιχεία που αναφέρονται στα πληθυσμιακά τους χαρακτηριστικά και στον τρόπο διαμόρφωσης του αστικού ιστού τους. Το τρίτο κεφάλαιο περιέχει τα στάδια της μεθοδολογίας όλης της εφαρμογής, με αναφορές στον προσδιορισμό των μεταβλητών, στο σχηματισμό του δείγματος, την ποσοτικοποίηση και κατηγοριοποίηση των μεταβλητών και στην επιλογή της μεθόδου στατιστικής ανάλυσης για τις πέντε περιοχές μελέτης. Όλες οι επιλογές δικαιολογούνται και στηρίζονται στη μελέτη του αντίστοιχου θεωρητικού υποβάθρου. Στο τέταρτο και πέμπτο κεφάλαιο της εργασίας πραγματοποιείται η εκτέλεση της πολλαπλής γραμμικής παλινδρόμησης σε περιβάλλον εργασίας SPSS 18 για την περιοχή της Θεσσαλονίκης και της Βαρκελώνης αντίστοιχα. Περιγράφονται αναλυτικά όλα τα βήματα της διαδικασίας και οι έλεγχοι υποθέσεων που απαιτούνται για την αξιολόγηση των μοντέλων. Στο τέλος κάθε κεφαλαίου πραγματοποιούνται συγκρίσεις και διατυπώνονται συμπεράσματα για την ποιότητα του κάθε μοντέλου. Το έκτο κεφάλαιο αναφέρεται στα Γεωγραφικά Συστήματα Πληροφοριών και στην αντίστοιχη εφαρμογή πολλαπλής γραμμικής παλινδρόμησης σε περιβάλλον ArcMap 10. Η εφαρμογή στο συγκεκριμένο λογισμικό πραγματοποιείται μόνο για της περιοχές της Θεσσαλονίκης διότι προσφέρεται το ανάλογο χαρτογραφικό υπόβαθρο. Τέλος, στο έβδομο κεφάλαιο γίνεται η μία συλλογική αξιολόγηση και αποτίμηση του εγχειρήματος με αναλυτική έκθεση των συμπερασμάτων και των προτάσεων για μελλοντική προσπάθεια και συνέχιση στο συγκεκριμένο επιστημονικό πεδίο. 1

14 ΚΕΦΑΛΑΙΟ 1 Ο ΤΟ ΑΣΤΙΚΟ ΑΚΙΝΗΤΟ ΩΣ ΑΝΤΙΚΕΙΜΕΝΟ ΜΕΛΕΤΗΣ Η εκτίμηση της αξίας των ακινήτων πραγματοποιείται καθημερινά για μία πολύ μεγάλη ποικιλία περιπτώσεων, όπως ζητήματα τραπεζών (λήψη δανείων, υποθήκες κ.λπ.), αγοραπωλησίες, λογιστικές καταστάσεις, φορολογία ακίνητης περιουσίας, απαλλοτριώσεις, δουλείες, διανομές, κληρονομικά, εταιρίες επενδύσεων κ.α. Είναι σαφές ότι πρόκειται για ένα επίκαιρο ζήτημα με πολλά περιθώρια μελέτης, το οποίο απασχολεί πολλούς κλάδους της επιστήμης. Αποτελεί κοινό τόπο πως κάθε ιδιοκτησία είναι μοναδική. Ωστόσο η ανάγκη διενέργειας πολλών εκτιμήσεων καθημερινά για την ικανοποίηση των παραπάνω σκοπών οδηγεί στην ανάγκη εφαρμογής της σύγχρονης τεχνολογίας προκειμένου να γίνει μια μορφή αυτοματοποίησης της διαδικασίας με στόχο τον καλύτερο έλεγχο των αποτελεσμάτων. Πιο συγκεκριμένα, ένα μαθηματικό μοντέλο εκτίμησης αξιών επιτυγχάνει την προσέγγιση της προβλεπόμενης αξίας του ακινήτου και ταυτόχρονα θέτει τα ανώτερα και κατώτερα όρια μέσα στα οποία θα πρέπει να βρίσκεται η αγοραία αξία του. Μία διαδικασία αυτοματοποιημένης εκτίμησης αγοραίων αξιών υποβάλλεται σε συγκεκριμένους χρονικούς και χωρικούς περιορισμούς, διότι αποτελεί ένα δυναμικό γεωγραφικό και οικονομικό φαινόμενο. Οι χρονικοί περιορισμοί οφείλονται στα δεδομένα της κτηματαγοράς που μεταβάλλονται δυναμικά ανάλογα με τις κοινωνικοοικονομικές εξελίξεις σε τοπικό ή διεθνές επίπεδο, ενώ οι χωρικοί περιορισμοί αφορούν την άμεση σύνδεση της αξίας ενός ακινήτου με τη γεωγραφική του θέση. Η ανάγκη περαιτέρω μελέτης της εκτίμησης των ακινήτων με μία σταθερή και αυτοματοποιημένη διαδικασία πηγάζει ταυτόχρονα και από έναν ακόμη βασικό παράγοντα. Η απόκτηση κυριότητας σε ακίνητα αποτελεί μία ιδιαίτερη αγορά με πολύ 2

15 Κ ε φ ά λ α ι ο 1 ο σημαντική επίδραση στις μακροοικονομικές εξελίξεις και τη χρηματοοικονομική σταθερότητα. Χαρακτηριστικό είναι το παράδειγμα της Ελλάδας, της οποίας τα νοικοκυριά παραδοσιακά για χρόνια τοποθετούν τις αποταμιεύσεις τους στα ακίνητα. Πιο συγκεκριμένα, σύμφωνα με στοιχεία της Τράπεζας της Ελλάδος που αναφέρονται στο έτος 2008 οι επενδύσεις στην αγορά κατοικίας αποτελούσαν το ¼ περίπου του συνόλου των επενδύσεων, ενώ το ποσοστό πλούτου των Ελλήνων που έχει τοποθετηθεί στα ακίνητα είναι 80 90% σε σχέση με τη συνολική τους περιουσία. Παρόμοια, εκτιμήσεις της Eurobank EFG Research, στο 4 ο τρίμηνο του 2008 έδειξαν ότι το 81,8% των περιουσιακών στοιχείων των νοικοκυριών είναι ακίνητα, το 17% είναι καταθέσεις και μόνο το 1,2% είναι μετοχές. Συνεπώς, η συστηματική παρακολούθηση και ανάλυση των εξελίξεων και των προοπτικών της αγοράς αυτής έχει επομένως πολύ μεγάλη σημασία για την πληρέστερη αξιολόγηση των μακροοικονομικών συνθηκών και προοπτικών της οικονομίας. Έπειτα από την παραπάνω εισαγωγή που αφορά στην ανάγκη εκτίμησης των αγοραίων αξιών με τη βοήθεια μαθηματικού μοντέλου εκτίμησης, το πρώτο κεφάλαιο εστιάζεται στη χωρική μονάδα αναφοράς που αξιοποιείται στην παρούσα εφαρμογή με την ταυτόχρονη επεξήγηση των βασικών συνιστωσών που οδηγούν στην επιλογή της, ενώ στη συνέχεια, προσδιορίζεται με ακρίβεια ο ορισμός της αξίας που επιτυγχάνεται να προσεγγιστεί (αγοραία αξία των ακινήτων) και οι κύριοι παράγοντες που τη διαμορφώνουν. 1.1 ΜΟΝΑΔΑ ΑΝΑΦΟΡΑΣ Ο όρος «εκτίμηση της αξίας ακινήτων» είναι πολύ γενικός και δε δίνει σαφή απάντηση για τη μονάδα αναφοράς που εξετάζεται. Για την έννοια του ακινήτου δίνονται περισσότεροι από ένας ορισμοί ανάλογα με τη νομική ή οικονομική σκοπιά από την οποία εξετάζεται. Σύμφωνα με τον Αστικό Κώδικα (Αρθ. 948 Α.Κ.) «ακίνητα πράγματα είναι το έδαφος και τα συστατικά αυτού μέρη», ενώ σύμφωνα με το Ζεντέλη, 2001 «με την έννοια ακίνητο ορίζεται το ιδεατό ή πραγματικό τμήμα του χώρου, που τεκμηριώνει αυτοτελές ή εξ αδιαιρέτου ιδιοκτησιακό δικαίωμα. Έτσι το ακίνητο είναι ένα περιουσιακό στοιχείο, που απεικονίζει το συμβατικό δικαίωμα της ιδιοκτησίας». Από οικονομική άποψη το ακίνητο είναι αυτό που περιλαμβάνει όλους τους συντελεστές παραγωγής, δηλαδή με άλλα λόγια είναι ίσο με το έδαφος, την εργασία, το κεφάλαιο και την επιχειρηματικότητα. Η έννοια του ακινήτου ταξινομείται σε επιμέρους κατηγορίες ανάλογα με τη χρήση του. Οι κατηγορίες των ακινήτων σύμφωνα με τα τεχνικά στοιχεία της Εμπορικής Τράπεζας είναι: 1. κατοικίες 2. εμπορικά ακίνητα 1 3. ξενοδοχεία 4. αποθήκες και οικόπεδα ή αγροτεμάχια που προορίζονται για ανάπτυξη αποθηκευτικών χώρων 1 Ως εμπορικά ακίνητα θεωρούνται τα γραφεία, καταστήματα, εμπορικά κέντρα ή τα οικόπεδα/αγροτεμάχια που προορίζονται για εμπορική ανάπτυξη και χωρίζονται σε αυτά με υψηλή ή μικρή εμπορευσιμότητα και σε εκείνα με μη ενεργή αγορά ακινήτων Μεταπτυχιακή διατριβή 3

16 Α σ τ ι κ ό α κ ί ν η τ ο 5. βιομηχανικές, αγροτικές, κτηνοτροφικές εγκαταστάσεις και οικόπεδα ή αγροτεμάχια που προορίζονται για βιομηχανική ανάπτυξη. Η παρούσα εφαρμογή περιορίζεται αποκλειστικά στη μελέτη ακινήτων με χρήση την κατοικία. Ο βασικότερος λόγος, για τον οποίο επιλέγεται η κατοικία ως αντικείμενο μελέτης είναι το παράδειγμα της Ελλάδας κατά το οποίο παρουσιάζεται ένα πολύ μεγάλο ποσοστό ιδιοκατοίκησης της τάξης του 80,1%, ενώ παρόμοια ποσοστά συναντώνται επίσης στις χώρες της Ανατολικής και Νότιας Ευρώπης. Η κατοικία καλύπτει σε πολύ μεγάλο βαθμό την ανάγκη στέγασης αλλά ταυτόχρονα θεωρείται ως μία ασφαλής επένδυση για πολλές οικογένειες και νοικοκυριά. Πολλούς συνεπώς αφορά η πορεία των τιμών της κτηματαγοράς και αποτελεί ένα ιδιαίτερα σημαντικό ζήτημα σε κάθε κοινωνία, όχι μόνο εντός των ορίων της Ελλάδας, αλλά και εκτός. (Σαμπανιώτης, 2012) (Αρβανιτίδης κα., 2008) Οι κατοικίες στο χώρο διακρίνονται σε δύο κύριες κατηγορίες. Στις κατοικίες σε αστικό περιβάλλον και σε αγροτικό περιβάλλον αντίστοιχα. Η βασική διαφοροποίηση των δύο χώρων συνδέεται άμεσα με την πυκνότητα του πληθυσμού και της απασχόλησης. Η παρούσα εφαρμογή εστιάζεται στις κατοικίες εντός του αστικού ιστού. Οι έντονοι μετασχηματισμοί στις οικονομικές, κοινωνικές δομές, οι διαρθρωτικές αλλαγές στην απασχόληση με τη μείωση του πρωτογενούς τομέα και η ανατίμηση της αστικής γης, οδήγησαν έντονο ρυθμό αστικοποίησης, με άμεση συνέπεια την έντονη ανοικοδόμηση και τον πολλαπλασιασμό των κατοικιών. (Ζεντέλης, 2001) Η μελέτη του αστικού χώρου έχει ιδιαίτερο ενδιαφέρον καθώς σύμφωνα με την Ανανιάδου, 1997 πρόκειται για ένα χώρο πολύ δυναμικό, με τον άνθρωπο δράστη και επηρεαζόμενο, όχι θεατή, παράγοντα δημιουργίας κοινωνικά και ατομικά. Η διαμόρφωση αξιών ακινήτων σε αστικό περιβάλλον διαφοροποιείται ανάλογα με τη συνοικία, τη γειτονιά ή ακόμη και με το δρόμο στον οποίο τα ακίνητα έχουν πρόσοψη. Συνεπώς, έχει μεγάλο ενδιαφέρον η δημιουργία μοντέλων εκτίμησης αξιών ακινήτων σε ένα τόσο ποικιλόμορφο περιβάλλον όπως ο αστικός χώρος. Επίσης, μία πόλη προσφέρει μεγάλο πλήθος δεδομένων για επεξεργασία, προσφέροντας με αυτόν τον τρόπο πολλές ερευνητικές δυνατότητες. Η τελευταία υποδιαίρεση αφορά στις οριζόντιες, κάθετες ιδιοκτησίες και τα οικόπεδα που προορίζονται για οικιστική ανάπτυξη. Αντικείμενο μελέτης αποτελούν στην προκειμένη περίπτωση, οι οριζόντιες ιδιοκτησίες, στις οποίες υπάρχει αποκλειστική κυριότητα σε όροφο ή διαμέρισμα μιας οικοδομής και αντίστοιχα συγκυριότητα στα κοινόχρηστα μέρη της οικοδομής. (Αρβανίτης, 2000) Η ομοιομορφία που παρουσιάζουν οι οριζόντιες ιδιοκτησίες ως προς τα χαρακτηριστικά που διαμορφώνουν την αξία τους, τις καθιστούν το καταλληλότερο αντικείμενο μελέτης. Συνεπώς, μονάδα αναφοράς αποτελούν αποκλειστικά οι οριζόντιες ιδιοκτησίες σε αστικό περιβάλλον. 1.2 ΑΓΟΡΑΙΑ ΑΞΙΑ ΑΚΙΝΗΤΟΥ Στον ελλαδικό χώρο η εκτίμηση της αξίας ενός ακινήτου πραγματοποιείται με διαφορετική μεθοδολογία ανάλογα το σκοπό που εξυπηρετεί. Η αξία ενός ακινήτου μπορεί να προκύψει βάσει του «συστήματος αντικειμενικού προσδιορισμού» - φορολογητέα αξία, 4

17 Κ ε φ ά λ α ι ο 1 ο ή από εκτιμήσεις της Εφορίας για την φορολογικούς σκοπούς, του Σώματος Ορκωτών Εκτιμητών (ΣΟΕ) για αγοραπωλησίες, επενδύσεις, χορήγηση δανείων, της Κτηματικής Εταιρείας του Δημοσίου (ΚΕΔ) για απαλλοτριώσεις κ.α. με αποτέλεσμα να προκύπτουν διαφορετικές τιμές για το ίδιο ακίνητο προκαλώντας συχνά αντιθέσεις. Δημιουργείται συνεπώς η ανάγκη συστηματικού προσδιορισμού της αξίας με βάση έναν αντικειμενικό και αντιπροσωπευτικό τρόπο, ο οποίος ταυτόχρονα να προσφέρει κοινωνική δικαιοσύνη όσον αφορά τη φορολόγηση. (Ζεντέλης, 2001) Από την ύπαρξη πολλών ειδών αξιών, όπως η αγοραία αξία, η αξία υπάρχουσας χρήσης, η εύλογη αξία, η πραγματική/τρέχουσα αξία κλπ. η αξία που αποτελεί στόχο κάθε εκτιμητή είναι η αγοραία αξία των ακινήτων και επιδιώκεται να προσεγγιστεί μέσω αυτοματοποιημένης διαδικασίας στην παρούσα μεταπτυχιακή διατριβή. Παρακάτω, παρατίθενται ορισμένοι βασικοί ορισμοί της αγοραίας αξίας των ακινήτων, σύμφωνα με το Ελληνικό Ινστιτούτο Εκτιμητικής (ΕΛ.Ι.Ε.), ώστε να είναι ξεκάθαρη στο εξής η έννοια της. Ο ορισμός που δίνεται από το Ευρωπαϊκό Συμβούλιο είναι: «Ως Αγοραία Αξία θα νοείται η τιμή στην οποία η γη και τα κτίρια θα μπορούσαν να πωληθούν στο πλαίσιο μίας ιδιωτικής σύμβασης μεταξύ ενός πρόθυμου πωλητή και ενός αγοραστή που κινείται εντός των πλαισίων της αγοράς κατά την ημερομηνία της εκτίμησης, με βάση την υπόθεση ότι το ακίνητο εκτίθεται δημόσια στην αγορά, ότι οι συνθήκες στην αγορά επιτρέπουν την τακτική πώληση και ότι μία κανονική περίοδος, λαμβάνοντας υπόψη τη φύση και μορφή του ακινήτου, είναι διαθέσιμη για τη διαπραγμάτευση της πώλησης». (ΕΛ.Ι.Ε., 2007) Ο εγκεκριμένος ορισμός IVSC/TEGoVA καλούμενος ως ο Ορισμός είναι: «Η Αγοραία Αξία είναι το εκτιμώμενο ποσό για το οποίο μία ιδιοκτησία θα μπορούσε να ανταλλαχθεί κατά την ημερομηνία της εκτίμησης μεταξύ ενός πρόθυμου αγοραστή και ενός πρόθυμου πωλητή σε μία συναλλαγή εντός των πλαισίων της αγοράς μετά από κατάλληλη προώθηση όπου τα συμβαλλόμενα μέρη έχουν το καθένα ενεργήσει με επίγνωση, σωφροσύνη και χωρίς εξαναγκασμό». (ΕΛ.Ι.Ε., 2007) 1.3 ΠΑΡΑΓΟΝΤΕΣ ΠΟΥ ΕΠΗΡΕΑΖΟΥΝ ΤΗΝ ΑΞΙΑ ΕΝΟΣ ΑΣΤΙΚΟΥ ΑΚΙΝΗΤΟΥ Οι παράγοντες που επιδρούν στην αξία ενός ακινήτου είναι πάρα πολλοί και σχετίζονται όχι μόνο με τα ιδιαίτερα χαρακτηριστικά της κάθε ιδιοκτησίας ως οντότητα, αλλά ταυτόχρονα συνδέονται με παράγοντες που αφορούν την τοπική κτηματαγορά στο σύνολο της. Η συμβολή του κάθε παράγοντα στη διαμόρφωση της αξίας είναι άγνωστη, διότι είναι μεγάλος ο αριθμός τους και ταυτόχρονα δε συμπεριφέρονται με τον ίδιο τρόπο στο χρόνο και στο χώρο. Για την προσπάθεια προσέγγισης της αγοραίας αξίας ακινήτων μέσα από την κατασκευή ενός μαθηματικού μοντέλου, απαραίτητη προϋπόθεση είναι η μελέτη όλων των παραγόντων που επιδρούν στις αξίες σε ένα θεωρητικό αρχικά επίπεδο ώστε στη συνέχεια να γίνει προσπάθεια συμμετοχής τους στην εφαρμογή. Στη συνέχεια λοιπόν αναφέρεται ένα πλήθος παραγόντων, αφού αρχικά ταξινομηθούν σε γενικούς και ειδικούς. Μεταπτυχιακή διατριβή 5

18 Α σ τ ι κ ό α κ ί ν η τ ο Γενικοί παράγοντες επίδρασης Ο πρώτος και κύριος παράγοντας που επιδρά στη διαμόρφωση αξιών ακινήτων είναι η θέση. Με τον όρο θέση εννοούνται τα γενικότερα χαρακτηριστικά γνωρίσματα της εκάστοτε περιοχής, είτε αυτά είναι ιστορικά, είτε πολεοδομικά, είτε γεωμορφολογικά και περιβαλλοντικά. Για την εκτίμηση αγοραίων αξιών που βρίσκονται σε αστικό περιβάλλον λαμβάνονται υπόψη και υπολογίζονται σημαντικά οι παρακάτω παράγοντες. Κοινωνικοοικονομικό επίπεδο Το κοινωνικοοικονομικό επίπεδο κάθε περιοχής συνδέεται άμεσα με την ιστορική διαμόρφωση του αστικού χώρου και την πληθυσμιακή κατανομή κατά περιόδους (π.χ. εγκατάσταση μεταναστών). Οι κοινωνικές δομές της κάθε περιοχής και η κοινωνική διαστρωμάτωση και σύνθεση του πληθυσμού κατά ηλικία, φύλλο και οικογενειακή κατάσταση έχει μία έμμεση επίδραση στις αγοραίες αξίες. Επίσης, σημαντική επίδραση διαδραματίζει το βιοτικό επίπεδο του μέσου ατόμου της περιοχής (εισόδημα). (Πλουμιστού, 2010) Πολεοδομική οργάνωση Ο πολεοδομικός σχεδιασμός μίας συνοικίας του αστικού ιστού καθορίζει τους κοινόχρηστους χώρους και τους χώρους πρασίνου που διαθέτει, τη διαρρύθμιση και τα πλάτη των δρόμων και των πεζοδρομίων, την ύπαρξη προκηπίων, τις χρήσεις, την εμπορικότητα, το μέγεθος και το σχήμα των οικοδομικών τετραγώνων, το μέγιστο επιτρεπόμενο ύψος των κτισμάτων κ.ο.κ. Συνεπώς, η πολεοδομική οργάνωση κάθε περιοχής διαμορφώνει μία γενικότερη εικόνα που επιδρά σημαντικά στην τιμή εκκίνησης μίας οριζόντιας ιδιοκτησίας. Οικιστική πυκνότητα Η οικιστική πυκνότητα κάθε περιοχής συνδέεται έμμεσα με τη διαμόρφωση της αξίας μιας οριζόντιας ιδιοκτησίας, καθώς υψηλές πυκνότητες οδηγούν πιθανά σε χαμηλότερη ποιότητα αστικού περιβάλλοντος και σε έντονη συμφόρηση. Από την άλλη μεριά, αυξημένος πληθυσμός συνεπάγεται αύξηση των υπηρεσιών και εξυπηρετήσεων μίας περιοχής που πάντα έχει θετική επίδραση στις αξίες των ακινήτων. Η οικιστική πυκνότητα κάθε περιοχής είναι αρκετά σημαντικός παράγοντας, γι αυτό πολλά στατιστικά δείγματα συλλέγοντα για την παραγωγή δεικτών όπως δείκτης πυκνοκατοίκησης (άτομα ανά δωμάτιο κατοικίας) ή το εμβαδόν διαμερίσματος ανά άτομο. (Καρανικόλας, 2010) Δίκτυα μεταφορών Στα πλαίσια μιας πόλης, οι αποστάσεις που μπορεί να χρειάζεται να διανύει κανείς για να προσέλθει στο χώρο εργασίας ή σε χώρους ψυχαγωγίας είναι ανάλογες με το μέγεθος της πόλης. Συνεπώς, η μετακίνηση με τη βοήθεια των συστημάτων μεταφοράς αποκτά ιδιαίτερη σημασία και βαρύτητα. Όσο μεγαλύτερη είναι η προσπελασιμότητα και η προσβασιμότητα σε μία περιοχή με τη χρήση της δημόσιας συγκοινωνίας, τόσο μεγαλύτερη αξία αποκτά η κάθε ιδιοκτησία. Επίσης, αναλόγως με το μέγεθος της πόλης και τις ανάγκες 6

19 Κ ε φ ά λ α ι ο 1 ο της, τα μέσα μαζικής μεταφοράς μπορεί να είναι υπέργεια δίκτυα (λεωφορεία, τραμ) ή και υπόγεια (μετρό), με άμεση συνέπεια στην ταχύτητα μετακίνησης προς τα σημεία εξυπηρέτησης και στο κόστος. Συντελεστής εμπορικότητας Βασικός παράγοντας για τη διαμόρφωση αξιών είναι η απόσταση από κεντρικά σημεία όπου συγκεντρώνονται οι υπηρεσίες και η εξυπηρέτηση των πολιτών. Όσο υψηλότερος είναι ο συντελεστής εμπορικότητας, τόσο αυξάνεται η αξία των διαμερισμάτων, ως προς αυτό το χαρακτηριστικό. Γενικά, αυξάνεται η αξία μίας ιδιοκτησίας όσο πιο κοντά βρίσκεται σε σχέση με σημεία ενδιαφέροντος, όπως σχολεία, νοσοκομεία, φαρμακεία, ΚΕΠ, κλπ. Περιβαλλοντική επιβάρυνση Η ποιότητα ζωής είναι ένα χαρακτηριστικό που ο καθένας θέλει να του προσφέρει ο χώρος κατοικίας του. Η περιβαλλοντική συνείδηση λοιπόν διαδραματίζει σημαντικό ρόλο στη διαμόρφωση των αξιών ακινήτων. Αρχικά, η περιβαλλοντική επιβάρυνση μίας περιοχής μπορεί να πηγάζει από το έντονο κυκλοφοριακό πρόβλημα. Μεγάλα επίπεδα ατμοσφαιρικής ρύπανσης είναι η πρώτη συνέπεια ενός τέτοιου φαινομένου. Σύμφωνα με τον Καρανικόλα, 2010 η επίδραση των ατμοσφαιρικών ρύπων στις αγοραίες αξίες των ακινήτων είναι μεγάλη και μελλοντικά πρόκειται να διευρυνθεί, καθώς οι πολίτες ευαισθητοποιούνται όλο και περισσότερο για τη διεκδίκηση καθαρότερου περιβάλλοντος. Είναι ένας πολύ σημαντικός παράγοντας επίδρασης, καθώς οι αέριοι ρύποι αποτελούν ένα έντονο πρόβλημα των σύγχρονων μεγαλουπόλεων. Συνέπεια του κυκλοφοριακού προβλήματος σε μία κεντρική οδό είναι επίσης τα μεγάλα επίπεδα ηχορύπανσης. Ωστόσο, σύμφωνα με τον Αραβαντινό, 2007 τα μεγάλα επίπεδα θορύβου οφείλονται γενικά στις μεταφορές και όχι μόνο στο οδικό δίκτυο. Επισημαίνει ότι περίπου 170εκ. άτομα από τον πληθυσμό της Ευρωπαϊκής Ένωσης εκτίθεται σε επίπεδα θορύβου που προκαλούν σοβαρή ενόχληση. Από τα παραπάνω άτομα το 88% υφίσταται θόρυβο από την οδική κυκλοφορία, το 8% από τις σιδηροδρομικές μεταφορές και το υπόλοιπο 4% από τις αεροπορικές. Η ηχορύπανση συνεπώς επιδρά σημαντικά στις αξίες των ακινήτων, καθώς παρατηρούνται χαρακτηριστικά παραδείγματα, όπου κατρακυλούν οι αξίες σε νεόδμητες οικοδομές που εμφανίζουν έντονα το φαινόμενο της ηχορύπανσης (π.χ. κατοικίες επί της περιφερειακής οδού της Θεσσαλονίκης). Τέλος, μεγάλη περιβαλλοντική επιβάρυνση υφίσταται συνοικίες ή προάστια που είναι τοποθετημένα κοντά σε βιομηχανικές περιοχές (έντονη ατμοσφαιρική ρύπανση) ή κοντά σε δίκτυα υψηλής τάσης ρεύματος (φόβος για πρόκληση ασθενειών), με αποτέλεσμα να υπάρχει επίσης πτώση στην τιμή εκκίνησης των κατοικιών που βρίσκονται στις συγκεκριμένες περιοχές. Αστικό πράσινο Το αστικό πράσινο, σε όλες τις μορφές του παρέχει πολλά θετικά οφέλη στην ποιότητα ζωής κάθε κοινωνίας. Σύμφωνα με τον Καρανικόλα, 2010 τα σπίτια που βρίσκονται κοντά σε περιοχές πρασίνου, προτιμώνται από τα υπόλοιπα που δεν έχουν αυτό το Μεταπτυχιακή διατριβή 7

20 Α σ τ ι κ ό α κ ί ν η τ ο χαρακτηριστικό, με μία τάση για αύξηση της τιμής, η οποία κινείται στο 7% περίπου. Σπίτια κοντά σε δημόσια πάρκα ή σε ανοιχτούς ελεύθερους χώρους προσελκύουν περισσότερους υποψήφιους αγοραστές, οι οποίοι είναι διατεθειμένοι να πληρώσουν περισσότερο για το συγκεκριμένο χαρακτηριστικό Ειδικοί παράγοντες επίδρασης Οι παραπάνω ανθρωπογεωγραφικοί παράγοντες λαμβάνονται υπόψη σε κάθε εκτίμηση μιας ιδιοκτησίας. Είναι χαρακτηριστικά της γενικότερης περιοχής και διαμορφώνουν ουσιαστικά μία τιμή εκκίνησης χαμηλή ή υψηλή ανάλογα με την περιοχή μελέτης. Οι παράγοντες που αναλύονται παρακάτω αναφέρονται στα ιδιαίτερα χαρακτηριστικά της κάθε οριζόντιας ιδιοκτησίας που την καθιστούν μοναδική και διαφοροποιούν την αξίας της σε σύγκριση με όλες τις υπόλοιπες ιδιοκτησίες της ίδιας περιοχής μελέτης. Πρωταρχικό ρόλο στη διαμόρφωση της αγοραίας αξίας μιας ιδιοκτησίας έχει το μέγεθος της. Η σχέση μεταξύ αξίας και εμβαδού δεν είναι όμως ανάλογη. Σύμφωνα με τη βιβλιογραφία το μέγεθος είναι μία ιδιαίτερη παράμετρος επίδρασης, καθώς τα μικρότερα από το σύνηθες μέγεθος ακίνητα λαμβάνουν ένα θετικό συντελεστή και αυξάνουν την τιμή τους ανά τετραγωνικό μέτρο, ενώ στην περίπτωση των μεγαλύτερων ακινήτων ο συντελεστής μεγέθους είναι αρνητικός και μπορεί να έχει ιδιαίτερα υψηλό βάρος επί της τελικής διαμόρφωσης της τιμής. (Καρανικόλας, 2010) Ορισμένες ακόμη ειδικές παράμετροι που επιδρούν στη διαμόρφωση της αξίας είναι η παλαιότητα του κτίσματος στο οποίο ανήκει η οριζόντια ιδιοκτησία και ο όροφος της. Η παλαιότητα έχοντας μία αρνητική συσχέτιση με την αξία, ενώ ο όροφος έχοντας μία θετική επίδραση. Άμεση συνέπεια του ορόφου ενός διαμερίσματος σε συνδυασμό με τη θέση του σε ένα κτίσμα (πρόσοψη σε οδό ή στον ακάλυπτο χώρο της οικοδομής) είναι επίσης η θέα του. Τα διαμερίσματα που βρίσκονται στους υψηλότερους ορόφους και έχουν πρόσοψη σε κύρια οδό είναι πιθανότερο να έχουν καλύτερη θέα από τα ακριβώς ίδια διαμερίσματα χαμηλότερων ορόφων και άρα μεγαλύτερη αξία. Επίσης, δύο διαμερίσματα που βρίσκονται στον ίδιο όροφο, αλλά το ένα από τα δύο είναι σε γωνιακή θέση έχουν διαφορετική αξία. Βασικός παράγοντας στη διαμόρφωση της αξίας είναι επίσης η ποιότητα κατασκευής της οικοδομής, η οποία τις περισσότερες φορές συνδέεται με την παλαιότητα της οικοδομής. Η ποιότητα του κτίσματος δεν αφορά μόνο την κατηγοριοποίηση τους βάσει της πολυτέλειας στην κατασκευή, αλλά κυρίως βάσει της στατικής επάρκειας τους και της αντισεισμικής μελέτης. Αντίστοιχα, σε επίπεδο διαμερίσματος σημαντική επίδραση έχει η κατάσταση του ακινήτου, δηλαδή ο βαθμός συντήρησης του στις περιπτώσεις των παλιών οικοδομών και η ποιότητα των βασικών του στοιχείων όσον αφορά τις νεόδμητες. Πιο συγκεκριμένα, η ποιότητα των κουφωμάτων, η ύπαρξη πόρτας ασφαλείας, οι υδραυλικές και ηλεκτρολογικές εγκαταστάσεις, το υλικό δαπέδου κλπ. Η γενικότερη κατάσταση του ακινήτου κρίνεται επίσης από την ενεργειακή απόδοση του. Το είδος θέρμανσης που διαθέτει (ατομική ή κεντρική θέρμανση, πετρέλαιο, φυσικό αέριο, ή ηλεκτρικά σώματα, 8

21 Κ ε φ ά λ α ι ο 1 ο τζάκι, κλιματισμός) και ο προσανατολισμός του είναι μόνο μερικά από τα στοιχεία που διαμορφώνουν την ενέργεια που απόδοση. Ένα από τα κυριότερα σύγχρονα προβλήματα του αστικού χώρου είναι η έλλειψη θέσεων στάθμευσης. Το μέγεθος του προβλήματος οδηγεί σε αύξηση των αγοραίων αξιών κατοικιών, όταν στην περιοχή ή στη γειτονιά που ανήκουν είναι εύκολη η αναζήτηση θέσεων στάθμευσης. Ακόμη περισσότερο πριμοδοτούνται όπως είναι φυσικό τα ακίνητα που διαθέτουν ιδιωτική θέση στάθμευσης. Τέλος, διαμερίσματα προς πώληση τα οποία έχουν αυθαιρεσίες βάσει του γενικού πολεοδομικού κανονισμού αποφεύγονται με άμεση επίδραση στη διαμόρφωση της αγοραίας αξίας τους Εφαρμογή Λαμβάνοντας υπόψη τους παραπάνω παράγοντες προκύπτει το συμπέρασμα ότι η εκτίμηση της αξίας ενός ακινήτου είναι ιδιαίτερα πολύπλοκη και η μοντελοποίηση της ακόμη δυσκολότερη. Σύμφωνα με τον Scarrett, 1991 καμία ιδιοκτησία δε μπορεί να είναι πανομοιότυπη με κάποια άλλη, ακόμη και εάν κατασκευαστικά είναι ίδιες, διότι καταλαμβάνουν ξεχωριστή θέση στο χώρο. Μπορεί για παράδειγμα να διαφέρει η πρόσοψη τους, η πλευρά του δρόμου στην οποία βρίσκονται, ο βαθμός συντήρησης τους κλπ. Όπως χαρακτηριστικά αναφέρει, σε πολλές περιπτώσεις πολύ μικρές διαφορές, οι οποίες δεν είναι πάντα εύκολα αναγνωρίσιμες, μπορεί να έχουν πολύ μεγάλη επίδραση στη διαμόρφωση της αξίας δύο ιδιοκτησιών. Η μοναδικότητα της κάθε ιδιοκτησίας αποτελεί τροχοπέδη στην ακριβή εκτίμηση της αξίας μέσω ενός μαθηματικού μοντέλου και ο μόνος τρόπος για να ξεπεραστεί είναι με τη βοήθεια παραδοχών, ώστε να γίνει μίας μορφής γενίκευση στην εκτίμηση. Η βασική παραδοχή που πραγματοποιείται αφορά τον παράγοντα γεωγραφική θέση. Συνεπώς, επιλέγονται περιοχές μελέτης, οι οποίες όσο είναι εφικτό διατηρούν «σταθερούς» τους γενικούς παράγοντες που διαμορφώνουν την αξία και διαφοροποιούνται μόνο ως προς τους ειδικούς. Συνεπώς, στόχος είναι ο σχηματισμός μοντέλων τα οποία να εμπεριέχουν την επίδραση της γεωγραφικής τους θέσης με έμμεσο τρόπο αποτυπωμένη στο μαθηματικό μοντέλο και την επίδραση των υπόλοιπων παραγόντων (εμβαδόν, παλαιότητα, όροφος κλπ.) με άμεσο τρόπο ως ξεχωριστές μεταβλητές. Πρόκειται για τη βασική αρχή στην οποία στηρίζεται όλη η μεθοδολογία που περιγράφεται στη συνέχεια. Επίσης, στην παρούσα εφαρμογή λαμβάνονται υπόψη μόνο εκείνοι οι παράγοντες που είναι διαθέσιμοι ως πρωτογενής πληροφορία, διότι πολύ δύσκολα μία βάση δεδομένων εμπεριέχει συγκεντρωμένα όλα τα στοιχεία που περιγράφονται αναλυτικά παραπάνω. Μεταπτυχιακή διατριβή 9

22 ΚΕΦΑΛΑΙΟ 2 Ο ΠΕΡΙΟΧΕΣ ΜΕΛΕΤΗΣ Η κύρια περιοχή μελέτης στην οποία αποφασίζεται να εκτελεστεί η εφαρμογή είναι η πόλη της Θεσσαλονίκης. Εν συνεχεία, η ανάγκη διεύρυνσης της έρευνας πέρα από τα σύνορα μίας πόλης για την εξαγωγή πληρέστερων συμπερασμάτων οδηγεί στην αναζήτηση μίας δεύτερης ευρωπαϊκής πόλης, η οποία να παρουσιάζει ορισμένα κοινά στοιχεία, όσο αυτό είναι δυνατό, όσον αφορά τα γεωμορφολογικά της στοιχεία, τη γενικότερη μορφή του αστικού δικτύου και τη διαμόρφωση του αστικού της χώρου στο πέρασμα των χρόνων. Ταυτόχρονα θα πρέπει να δημιουργεί ενδιαφέρον η σημερινή κατάσταση διαμόρφωσης των αγοραίων αξιών της. Η καταλληλότερη ευρωπαϊκή πόλη που πληροί σε μεγαλύτερο βαθμό τα παραπάνω κριτήρια είναι η Βαρκελώνη της Ισπανίας. Μεσογειακές πόλεις - λιμάνια και οι δύο, παραθαλάσσιες με παρόμοιο κλίμα, οι οποίες είναι πληθυσμιακά οι δεύτερες μεγαλύτερες πόλεις στη χώρα τους. Η Θεσσαλονίκη και η Βαρκελώνη συγκαταλέγονται στις πόλεις ύστερης εκβιομηχάνισης, όπου η συγκρότηση και μεγέθυνση τους συνδέεται με την ανάπτυξη της βιομηχανίας. Ωστόσο η διαμόρφωση της σημερινής τους κατάστασης συνδέεται κυρίως με τις ιστορικές συγκυρίες και τα παρεπόμενα τους (έλευση προσφύγων, μετακίνηση πληθυσμών κλπ) οι οποίες αποδίδονται κυρίως στην αναπαραγωγή κυρίαρχων κοινωνικών και οικονομικών δομών στο εσωτερικό των χωρών. (Μαλούτας, 2002) Οι δύο πόλεις διαφέρουν σαφώς ως προς την κλίμακα τους και τις διαρθρωτικές αλλαγές που έλαβαν χώρα κάτω από ένα οργανωμένο πλάνο αστικής μεγέθυνσης. Επίσης, μεταμορφώνονται στην πάροδο του χρόνου με διαφορετικούς ρυθμούς ανάπλασης, με αποτέλεσμα η κάθε μία να διαθέτει σήμερα τα δικά της χαρακτηριστικά και ιδιαιτερότητες όσον αφορά την κατοικία, την αρχιτεκτονική και εν τέλει τη διαμόρφωση των αξιών των ακινήτων τους. 10

23 Κ ε φ ά λ α ι ο 2 ο Τα μοντέλα εκτίμησης αξιών δεν μπορούν να πραγματοποιηθούν σε εκτάσεις ανάλογες μίας πόλης όπως η Θεσσαλονίκη ή ακόμη περισσότερο η Βαρκελώνη, εξαιτίας της τεράστιας ανομοιογένειας που υπάρχει στις αξίες των κατοικιών από συνοικία σε συνοικία, ακόμη και από γειτονιά σε γειτονιά. Στην παρούσα εφαρμογή η έρευνα βασίζεται στα δεδομένα πέντε διαφορετικών περιοχών μελέτης. Πιο συγκεκριμένα, οι δύο πρώτες περιοχές μελέτης ανήκουν στην πόλη της Θεσσαλονίκης και οι τρεις επόμενες στην πόλη της Βαρκελώνης. Στο κεφάλαιο γίνεται μία προσπάθεια να περιγραφούν με τη βοήθεια χαρτών τα χωρικά όρια των περιοχών μελέτης και με τη βοήθεια επίσημων στατιστικών δεδομένων και ιστορικών στοιχείων να περιγραφούν τα υπόλοιπα χαρακτηριστικά γνωρίσματα τους που τις καθιστούν κατάλληλες για έρευνα. Η ιστορία των περιοχών μελέτης δεν αποτελεί θέμα της διατριβής, παρόλα αυτά η μελέτη σε πολύ μικρό βαθμό της πορείας διαμόρφωσης του αστικού τους χώρου κάνει περισσότερο κατανοητή την επιλογή των περιοχών, την ύπαρξη και το βαθμό των αντιθέσεων τους, αλλά και το ζητούμενο που είναι η διαμόρφωση των αξιών των οριζόντιων ιδιοκτησιών τους. 2.1 ΠΕΡΙΟΧΕΣ ΜΕΛΕΤΗΣ ΣΤΗΝ ΠΟΛΗ ΤΗΣ ΘΕΣΣΑΛΟΝΙΚΗΣ Η Θεσσαλονίκη βρίσκεται στο νοτιοανατολικό άκρο της Ευρώπης και αποτελεί μία πόλη πολυκύμαντη με μεγάλο ενδιαφέρον ιστορικό, πολιτισμικό και οικονομικό. Η ιστορία της πόλης αποδεικνύει ότι η Θεσσαλονίκη είναι μία πόλη εξαιρετικά παλιά αλλά ταυτόχρονα εντυπωσιακά νέα με συνεχή αστική ζωή για περισσότερους από 23 αιώνες. Η ζωντάνια της είναι χαρακτηριστική, ενώ στη σύγχρονη εποχή η Θεσσαλονίκη είναι μια μεγαλούπολη που αποτελεί το διοικητικό και οικονομικό κέντρο της βόρειας Ελλάδας και είναι μία από τις σπουδαιότερες πόλεις της βαλκανικής χερσονήσου. Το πολεοδομικό συγκρότημα της Θεσσαλονίκης αποτελείται από έξι Δήμους και έχει πληθυσμό κατοίκους σύμφωνα με την τελευταία απογραφή του Η Θεσσαλονίκη του σήμερα αποτελείται κατά το πέρασμα στον 21 ο αιώνα από μια πολυκεντρική δομή, με την ταυτόχρονη όμως ισχυρή παρουσία του κέντρου που παραμένει ζωντανό και συγκεντρώνει μία πληθώρα χρήσεων κατοικίας, εμπορίου, εργασίας και ψυχαγωγίας. Στην ανατολική Θεσσαλονίκη κατά μήκος των μεγάλων αρτηριών εισόδου στην πόλη εγκαθίστανται μεγάλα εμπορικά κέντρα, κινηματογράφοι, περιοχές αναψυχής, νυχτερινά κέντρα και πολυτελή ξενοδοχεία, ενώ αντίστοιχα στη δυτική είσοδο της πόλης εγκαθίστανται κτιριακά συγκροτήματα για τα ΚΤΕΛ, τα ΚΤΕΟ, τα ΤΕΙ αλλά και ξενοδοχεία και νέα συγκροτήματα πολυκατοικιών. Τέλος, στο κέντρο αλλά και συνολικά σε όλες τις συνοικίες της πολυπολιτισμικής Θεσσαλονίκης σήμερα τοποθετούνται πολλά σημεία ενδιαφέροντος πολιτιστικού ενδιαφέροντος αλλά και αναψυχής, όπως το πολιτιστικό συγκρότημα της Μονής Λαζαριστών (Σταυρούπολη), Θέατρο Γης (Δήμος Θεσσαλονίκης), ΧΑΝΘ, θέατρα, αποθήκες στο λιμάνι, Αρχαιολογικό μουσείο, μουσείο Βυζαντινού πολιτισμού κλπ. (Καυκαλάς κ.α., 2008) 2 Μεταπτυχιακή διατριβή 11

24 Π ε ρ ι ο χ έ ς μ ε λ έ τ η ς Εικόνα 2.1: Η πόλη της Θεσσαλονίκης με τα διοικητικά όρια της (Πηγή: geodata.gov.gr) Η πρώτη περιοχή μελέτης που επιλέγεται από το πολεοδομικό συγκρότημα της πόλης αναφέρεται σε ένα μικρό σύνολο οικοδομικών τετραγώνων στο κέντρο της πόλης, που ανήκει στο Δήμο Θεσσαλονίκης συνολικής έκτασης 0,8km 2, ενώ η δεύτερη περιοχή μελέτης αναφέρεται στη Δημοτική ενότητα Ευόσμου στη δυτική Θεσσαλονίκη, συνολικής έκτασης περίπου 9km 2. Τα όρια της κάθε περιοχής, οι ιδιαιτερότητες τους και οι λόγοι για τους οποίους επιλέγονται περιγράφονται στα υποκεφάλαια που ακολουθούν Πρώτη περιοχή μελέτης - Κέντρο Θεσσαλονίκης Το κέντρο της Θεσσαλονίκης χαρακτηρίζεται από μεγάλη ανομοιογένεια 3, όσον αφορά τα δημογραφικά οικονομικοκοινωνικά χαρακτηριστικά και τις αξίες των ακινήτων κατά προέκταση. Συνεπώς, στόχο για την πρώτη περιοχή μελέτης (1 η εφαρμογή) αποτελεί η αναζήτηση μόνο ενός τμήματος του κέντρου της Θεσσαλονίκης που να παρουσιάζει όσο το δυνατό μεγαλύτερη ομοιογένεια στα χαρακτηριστικά των διαμερισμάτων της. Για παράδειγμα, αποφεύγεται να επιλεγεί περιοχή του κέντρου της Θεσσαλονίκης όπου βρίσκονται οδοί με έντονη εμπορικότητα 4, καθώς τα ακίνητα που έχουν πρόσοψη σε αυτές εμφανίζουν εξάρσεις ως προς τις αξίες τους. Η περιοχή μελέτης που επιλέγεται με βάσει τα παραπάνω κριτήρια ανήκει στην πρώτη δημοτική κοινότητα του Δήμου Θεσσαλονίκης και τοποθετείται μεταξύ μίας ζώνης από την οδό Καραολή και Δημητρίου των Κυπρίων μέχρι την οδό Εθνικής Αμύνης, και εκτείνεται μεταξύ της Εγνατίας και της Αγ. Δημητρίου. (Εικόνα 2.2). 3 Χαρακτηριστικό είναι το παράδειγμα της παλαιάς παραλίας, στην οποία οι τιμές κυμαίνονται μεταξύ και /τμ, στην περιοχή Διοικητήριο μεταξύ 800και /τμ, στην πλατεία Αριστοτέλους με /τμ κ.ο.κ. (Στοιχεία στο πλαίσιο ημερίδας του Ελληνικού Ινστιτιούτου Εκτιμητικής) 4 Αγ. Σοφίας, Τσιμισκή, Μητροπόλεως, Λεωφόρος Νίκης, Π. Πατρών γερμανού κλπ. 12

25 Κ ε φ ά λ α ι ο 2 ο Εικόνα2.2: Πρώτη περιοχή μελέτης στο κέντρο της πόλης (πορτοκαλί επιφάνεια) και σύγκριση της έκτασης της με τη συνολική έκταση του Δήμου Θεσσαλονίκης. Πηγή: δορυφορική απεικόνιση από Google earth Το πρώτο χαρακτηριστικό της επιλεγείσας περιοχής είναι η εμφάνιση αυξημένης χρήσης κατοικιών και όχι γραφείων και εμπορικών χώρων σε σύγκριση με το υπόλοιπο κέντρο της πόλης. Επίσης, η περιοχή επάνω από την Εγνατία θεωρείται περισσότερο υποβαθμισμένη και οι τιμές των κατοικιών βρίσκονται σε χαμηλότερα επίπεδα, συγκριτικά με το υπόλοιπο κέντρο. Ωστόσο πρόκειται για ένα θετικό χαρακτηριστικό, διότι συνεπάγεται πιο ομαλοποιημένη διαμόρφωση των αξιών. Επίσης, σύμφωνα με τις διατυπώσεις μεσιτικών γραφείων η περιοχή παρουσιάζει μία ανθεκτικότητα όσον αφορά τις αγοροπωλησίες που λαμβάνουν χώρα και προσελκύει το ενδιαφέρον ενός σημαντικού μέρους της πόλης είτε για ιδιοκατοίκηση είτε για επένδυση. Παρόλα αυτά, ο κύριος λόγος για τον οποίο είναι ενδιαφέρουσα η αναζήτηση της διαμόρφωσης των αξιών στη συγκεκριμένη περιοχή είναι το ενδιαφέρον που παρουσιάζει όσον αφορά την προσέλκυση μεγάλου πλήθους φοιτητών κάθε χρόνο και η μεγάλη πληθυσμιακή πυκνότητα που είναι αξιοσημείωτη σε σχέση με τα διεθνώς αποδεκτά όρια για τη βιωσιμότητα στις πόλεις. Σύμφωνα με ειδικούς της αγοράς ακινήτων 5, οι τιμές στα ενοίκια στις πλέον πυκνοκατοικημένες περιοχές Εγνατία, Αγίου Δημητρίου Κασσάνδρου ξεκινούν από 100 και φθάνουν τα 450 στα ανακαινισμένα διαμερίσματα. Επισημαίνουν επίσης ότι η περιοχή εμφανίζει ενδιαφέρον για τον φοιτητικό κόσμο, ο οποίος την προτιμά λόγω της γειτνίασης της με το χώρο των πανεπιστημίων, προκαλώντας έτσι κάποια κίνηση στην κατά τα άλλα λιμνάζουσα κτηματαγορά της Θεσσαλονίκης. 5. Αστέριος Παπαγεωργίου κτηματομεσίτης (http://www.unitedreporters.gr/news/gr/homepage/reportage_c/poso_epesan_oi_times_ton_akini ton_sti_thessaloniki) Μεταπτυχιακή διατριβή 13

26 Περιοχές μελέτης Στην πρώτη περιοχή μελέτης, αναμένονται στην πλειοψηφία τους πολυώροφες οικοδομές μεγάλων ηλικιών, χωρίς θέσεις στάθμευσης, με μικρούς εξώστες, ρετιρέ στους τελευταίους ορόφους και έλλειψη ανελκυστήρα σε πολλές από αυτές. Διαμερίσματα σε πολύ κακή κατάσταση, αλλά και διαμερίσματα ανακαινισμένα με θέα και κοντά στα πανεπιστήμια. Επίσης, στη συγκεκριμένη ζώνη δεν αναμένονται μεγάλες εξάρσεις σε τιμές, καθώς γεωγραφικά ανήκουν όλα τα διαμερίσματα, λίγο ή πολύ στην ίδια κατηγορία Δεύτερη περιοχή μελέτης Δημοτική ενότητα Ευόσμου Ο Δήμος Κορδελιού - Ευόσμου τοποθετείται στη βορειοδυτική πλευρά του πολεοδομικού συγκροτήματος της Θεσσαλονίκης και προήλθε από τη συνένωση των πρώην Δήμων Ελευθέριου Κορδελιού και Ευόσμου. Καταλαμβάνει συνολική έκταση 14 km2 περίπου και αποτελεί αντιπροσωπευτικό δείγμα των δυτικών συνοικιών της πόλης. Στην περιοχή του Δήμου Κορδελιού - Ευόσμου βρίσκεται η δυτική είσοδος της πόλης και περικλείεται από πολύ κεντρικές οδούς όπως η Μοναστηρίου, η εσωτερική περιφερειακή και η Εγνατία Οδός. Ο Δήμος Κορδελιού - Ευόσμου χαρακτηρίζεται από μία σειρά ιδιαίτερων γνωρισμάτων, άλλων θετικών και άλλων αρνητικών με αποτέλεσμα να καθίσταται όλη η περιοχή άξια για περαιτέρω μελέτη σε διάφορους τομείς κοινωνικού, εκπαιδευτικού και οικονομικού ενδιαφέροντος. Εικόνα2.3: Απεικόνιση Δημοτική ενότητας Ευόσμου (κίτρινο χρώμα) σε σύγκριση με τη συνολική έκταση του Δήμου Κορδελιού - Ευόσμου (κόκκινο περίγραμμα). Πηγή: δορυφορική απεικόνιση από Google earth 14

27 Κ ε φ ά λ α ι ο 2 ο Όπως αναφέρεται στα κριτήρια επιλογής της πρώτης περιοχής μελέτης, έτσι και από το Δήμο Κορδελιού Ευόσμου επιλέγεται ένα τμήμα του ως περιοχή μελέτης για περισσότερη ομοιομορφία στο εσωτερικό της. Τη συγκεκριμένη περιοχή αποτελούν τα σύνορα της Δημοτικής Ενότητας Ευόσμου (Εικόνα 2.3), καθώς η Δ.Ε. Ελευθέριου Κορδελιού τοποθετείται δυτικότερα και είναι περισσότερο υποβαθμισμένη περιοχή, ως προς τις αξίες πώλησης ανά τετραγωνικό μέτρο των κατοικιών. Ένα από τα βασικότερα θετικά γνωρίσματα της περιοχής του Ευόσμου είναι η προσέλκυση τα τελευταία χρόνια πολλών νέων ζευγαριών και οικογενειών που αναζητούν μία οικονομική πρώτη κατοικία. Η τεράστια ανοικοδόμηση και η ραγδαία οικιστική ανάπτυξη της περιοχής, αλλά ταυτόχρονα οι σαφώς χαμηλότερες τιμές ανά τετραγωνικό μέτρο που επικράτησαν σε σύγκριση με τα διαμερίσματα του κέντρου ή ακόμη περισσότερο της ανατολικής Θεσσαλονίκης, οδήγησαν τα νέα ζευγάρια να προτιμήσουν νεοδόμητες οικοδομές με ιδιωτικές θέσεις στάθμευσης και μεγάλους χώρους στη δυτική Θεσσαλονίκη. Ο χαμηλός δείκτης πληθυσμιακής γήρανσης άλλωστε οδηγεί μία περιοχή στη διαρκή εξέλιξη και στη δημιουργία ενός σύγχρονου και λειτουργικού κέντρου με ποικίλες δραστηριότητες σε όλους τους τομείς μίας κοινωνίας. Τα βασικότερα προβλήματα του Δήμου πηγάζουν από τη θέση την οποία βρίσκεται, όσον αφορά τη ρύπανση από τη βιομηχανική περιοχή και όλα τα μειονεκτήματα της αστικής δυτικής Θεσσαλονίκης, όπως διαμορφώθηκαν κυρίως από τη μετανάστευση και την αυθαίρετη δόμηση. Κτίσματα άναρχα τοποθετημένα, πολλά εκ των οποίων σε πολλά σημεία του Δήμου δεν έχουν ακόμη αντικατασταθεί με νέες οικοδομές. Επιπλέον, την τελευταία εικοσαετία, οι χαμηλές τιμές αγοράς των ακινήτων προσέλκυσαν οικογένειες ομογενών από την πρώην ΕΣΣΔ και οικονομικούς μετανάστες. Τα παραπάνω κριτήρια κρίθηκε ότι ικανοποιεί ο πρώην Δήμος Ευόσμου για μία ποικιλία παραγόντων. Από έρευνα στο διαδίκτυο που θα αποτελέσει την πηγή των δεδομένων παρουσιάζει μεγαλύτερο μέγεθος ακινήτων προς πώληση, άρα ευκολία συγκέντρωσης μεγαλύτερου δείγματος. Ταυτόχρονα, είναι μία περιοχή που εμφανίζει μία πολύ μεγάλη ανοικοδόμηση τα τελευταία χρόνια, άρα θα υπάρχουν στο δείγμα πολλές νεοδόμητες οικοδομές, που δεν χαρακτηρίζονται πολυτελείς κατοικίες αλλά είναι σπίτια σε πολύ καλή κατάσταση με θέση στάθμευσης και καινούριες τεχνολογίες σε κουφώματα κλπ. Παρόλα αυτά η βασικότερη αιτία επιλογής σχετίζεται με τα δεδομένα που προκύπτουν από τα στοιχεία της Ελληνικής Στατιστικής Αρχής 6 (ΕΛ.ΣΤΑΤ.). Σύμφωνα με την επίσημη απογραφή πληθυσμού του 2011, ο πρώην Δήμος Ευόσμου και νυν Δημοτική Ενότητα Ευόσμου είναι τρίτη σε πληθυσμό, ακολουθώντας το Δήμο Θεσσαλονίκης και Καλαμαριάς με μία αύξηση όμως της τάξης του 32% περίπου σε σχέση με την αντίστοιχη απογραφή του Οι πρώτοι έξι δήμοι σε πληθυσμό της Περιφερειακής Ενότητας Θεσσαλονίκης και οι αλλαγές που έλαβαν χώρα αποτυπώνονται στον παρακάτω πίνακα. 6 National Statistical Service of Greece Μεταπτυχιακή διατριβή 15

28 Π ε ρ ι ο χ έ ς μ ε λ έ τ η ς Πίνακας 2.1 : Δεδομένα της ΕΛ.ΣΤΑΤ. για τους πρώτους έξι πολυπληθέστερους δήμους της Θεσσαλονίκης ΑΥΞΗΣΗ/ ΜΕΙΩΣΗ % 1 Δ. ΘΕΣΣΑΛΟΝΙΚΗΣ 284,898 Δ. ΘΕΣΣΑΛΟΝΙΚΗΣ 260,08-8,7% 2 Δ. ΚΑΛΑΜΑΡΙΑΣ 55,04 Δ. ΚΑΛΑΜΑΡΙΑΣ 58,651 6,2% 3 Δ. ΕΥΟΣΜΟΥ 30,289 Δ.Ε. ΕΥΟΣΜΟΥ 44,375 31,7% 4 Δ. ΣΥΚΕΩΝ 30,257 Δ.Ε. ΣΥΚΕΩΝ 30,014-0,8% 5 Δ. ΑΠΕΛΟΚΗΠΩΝ 28,285 Δ.Ε. ΑΜΠΕΛΟΚΗΠΩΝ 27,356-3,3% 6 Δ. ΝΕΑΠΟΛΕΩΣ 26,534 Δ.Ε. ΝΕΑΠΟΛΕΩΣ 25,732-3% *Δ. : ΔΗΜΟΣ, Δ.Ε.: ΔΗΜΟΤΙΚΗ ΕΝΟΤΗΤΑ Παρατηρείται ότι είναι η πολυπληθέστερη περιοχή όλης της Δυτικής Θεσσαλονίκης και ότι εμφανίζει τόσο μεγάλη αύξηση πληθυσμού μέσα στην τελευταία δεκαετία, όταν οι υπόλοιπες πέντε πέραν της Καλαμαριάς εμφανίζουν μείωση. Σύμφωνα με τα παραπάνω στοιχεία, θα έχει ενδιαφέρον η δεύτερη περιοχή μελέτης που θα αναζητηθούν οι παράγοντες που επηρεάζουν την αγοραία αξία των ακινήτων να είναι η περιοχή του Ευόσμου. 2.2 ΠΕΡΙΟΧΕΣ ΜΕΛΕΤΗΣ ΣΤΗΝ ΠΟΛΗ ΤΗΣ ΒΑΡΚΕΛΩΝΗΣ Η Βαρκελώνη τοποθετείται στο νοτιοδυτικό τμήμα της Ευρώπης και αποτελεί πρωτεύουσα της αυτόνομης κοινότητας της Καταλονίας. Είναι η δεύτερη μεγαλύτερη πόλη της Ισπανίας σε πληθυσμό και έκταση, μετά τη Μαδρίτη. Ο συνολικός πληθυσμός της είναι περίπου κάτοικοι στο Δήμο της Βαρκελώνης και περίπου λαμβάνοντας υπόψη όλη τη μητροπολιτική περιοχή. Την πόλη χαρακτηρίζει η τέχνη, η αρχιτεκτονική και ο δυναμισμός. Μία πόλη με έντονο τουρισμό, η οποία αποτελεί ένα χαρακτηριστικό παράδειγμα αστικού σχεδιασμού, καθώς αναμορφώνεται τις τελευταίες δεκαετίες στη λογική μίας συμπαγούς πόλης. Σύμφωνα με τον Rowe, 2006 η Βαρκελώνη είναι μία από τις πιο ενεργές πόλεις του κόσμου την τελευταία εικοσιπενταετία όσον αφορά τον αστικό σχεδιασμό. Από τα πρώτα μικρά οικοδομικά τετράγωνα του 1980 στις σημερινές μεγάλης κλίμακας κατασκευές, οι οποίες συναντούν τις προκλήσεις της παγκόσμιας οικονομίας. Η ανάπτυξη της Βαρκελώνης αντανακλά έναν ταχέως αναπτυσσόμενο κόσμο, γεμάτο αλλαγές. Παρόλα αυτά πέρα από τη βιτρίνα των αλλαγών, νόημα έχουν οι ουσιαστικές αλλαγές που έχουν γίνει στη Βαρκελώνη και την έχουν μεταμορφώσει. Το 1992 φιλοξενεί τους ολυμπιακούς αγώνες που αποτέλεσαν αφορμή για την υλοποίηση ενός μαζικού προγράμματος αναγέννησης της πόλης. Οδοποιία, συγκοινωνιακές μελέτες, κατασκευή βιβλιοθηκών, αναδιαμόρφωση υποβαθμισμένων περιοχών, επέκταση του μετρό είναι μόνο μερικά από τα προγράμματα αστικής αναμόρφωσης που έλαβαν χώρα. Το 10% της πόλης αποτελεί χώρους πρασίνου, ενώ αναρίθμητες είναι οι πλατείες και οι πεζόδρομοι. Από τις τρεις περιοχές μελέτης της Βαρκελώνης, οι δύο πρώτες (Eixample και Sant Marti) ανήκουν στο Δήμο Βαρκελώνης, ενώ η τρίτη (Badalona) αποτελεί προάστιο της 16

29 Κεφάλαιο 2ο πόλης, όπως φαίνεται από την παρακάτω εικόνα. Τα ιδιαίτερα χαρακτηριστικά της κάθε μίας και ο λόγος για τον οποίο επιλέγονται σε σύγκριση με άλλες περιοχές αναλύονται παρακάτω. Εικόνα2.4: Απεικόνιση των 10 συνοικιών του μητροπολιτικού Δήμου της Βαρκελώνης (Πηγή: ) Τρίτη περιοχή μελέτης Eixample Βαρκελώνης To Eixample, το οποίο στα Καταλανικά σημαίνει «επέκταση», χτίστηκε κατά τη διάρκεια του 19ου αιώνα στην πρώτη μεγάλη επέκταση της Βαρκελώνης πέρα από τα τείχη της πόλης. Αποτελεί το επακόλουθο της βιομηχανικής ανάπτυξης και της δημογραφικής έκρηξης της εποχής, ενώ η κατασκευή του συνέπεσε με την έκρηξη του τοπικού πλούτου στην περιοχή. Σαν αποτέλεσμα, η περιοχή Eixample φιλοξενεί μερικά από τα πολυτελέστερα κτίρια και έχει μερικές από τις καλύτερες κατοικίες της Βαρκελώνης, καθώς οι πλούσιες τοπικές οικογένειες της εποχής, θέλοντας να επιδείξουν την κοινωνική τάξη και τον πλούτο τους, ανέθεσαν την κατασκευή μεγαλειωδών κτιρίων σε αρχιτέκτονες του μοντερνισμού, διασημότερος από τους οποίους είναι ο Gaudi. Σήμερα η περιοχή τοποθετείται κεντρικά, καθώς περικλείεται μεταξύ της Παλαιάς πόλης (Ciutat Vella) και των περιοχών Sants, Les Corts, Gracia, Sant Marti, Horta Guinardo Μεταπτυχιακή διατριβή 17

30 Περιοχές μελέτης και Sant Gervasi, ενώ διοικητικά χωρίζεται σε πέντε επιμέρους «γειτονιές», κάθε μία από τις οποίες έχει μερικά στοιχεία του την κάνουν μοναδική. Εικόνα2.5: Απεικόνιση περιοχής Eixample. Πηγή: δορυφορική απεικόνιση από Google earth Ο συνολικός πληθυσμός της περιοχής σύμφωνα με την απογραφή του 2009 ήταν κάτοικοι (η μεγαλύτερη σε πληθυσμό περιοχή) σε έκταση 7,50 km2, άρα πρόκειται για μία πυκνοδομημένη περιοχή της Βαρκελώνης. Επίσης, είναι μία όμορφη και καλαίσθητη περιοχή, η οποία κατά τη διάρκεια της ημέρας είναι γεμάτη με έντονη δραστηριότητα σε γραφεία, καταστήματα, πολυτελείς μπουτίκ, εστιατόρια και γκαλερί. Είναι ασφαλής με μεγάλη προσφορά ακινήτων πολύ καλής ποιότητας κυρίως στο ανατολικό Eixample που είναι μία από τις πιο ιδιαίτερες κατοικήσιμες περιοχές της πόλης. Το βράδυ ένας μεγάλος αριθμός μπαρ και εστιατορίων κυριαρχεί κυρίως στο δυτικό Eixample. Τα σπίτια είναι αρκετά παλιά, αλλά ταυτόχρονα καλά διατηρημένα. Η γειτονιά Fort Pius τον τελευταίο καιρό ξεχωρίζει για τον αυξημένο αριθμό ασιατών, κυρίως Κινέζων, με συνέπεια την απότομη ανάπτυξη της κινέζικης αγοράς με τον ταυτόχρονο πολλαπλασιασμό των καταστημάτων. Γενικά η περιοχή χαρακτηρίζεται από ευκατάστατες γειτονιές, αλλά ταυτόχρονα φιλοξενεί πλέον μεγάλο ποσοστό κατοίκων που είναι μετανάστες και άρα χαμηλότερων εισοδημάτων. Το ιδιαίτερο γνώρισμα της περιοχής είναι η μορφή των οικοδομικών τετραγώνων με τις χαρακτηριστικές αποτμήσεις στις γωνίες, σχηματίζοντας οκτάγωνα (Εικόνα 2.6), καθώς και οι ευθείς και μακρύς δρόμοι με τις μεγάλες λεωφόρους. Χάρη στις πρωτοποριακές ιδέες Καταλανών αρχιτεκτόνων η περιοχή και γενικότερα η πόλη έχει ένα πλήρως ιπποδάμειο ρυμοτομικό σύστημα. Τα οικοδομικά τετράγωνα είναι πολύ μεγάλα, με μεγάλους ελεύθερους χώρους στο κέντρο και χωρίζονται με δρόμους τουλάχιστον τριών 18

31 Κεφάλαιο 2ο λωρίδων και φαρδιά πεζοδρόμια7. Τα παραπάνω χαρακτηριστικά προσφέρουν διαμερίσματα με θέα, περισσότερες θέσεις στάθμευσης και δρόμους που αναπνέουν. Σε κάθε διασταύρωση οι δρόμοι φαίνονται μεγαλύτεροι, υπάρχει καλύτερη ορατότητα και καλύτερη κυκλοφορία του αέρα σε μία μεγάλη πόλη που το έχει ανάγκη. Οι ιδιαιτερότητες της περιοχής όπως τα οικοδομικά της τετράγωνα επηρεάζουν σαφώς και τις αξίες των ακινήτων που βρίσκονται εκεί σε υψηλότερα επίπεδα. Η μεγάλη επιφάνεια της περιοχής Eixample περιλαμβάνει μια εντυπωσιακή λίστα από κύρια αξιοθέατα με κυριότερη τη Sagrada Familia του Γκαουντί, ίσως το πιο εντυπωσιακό αρχιτεκτονικό στοιχείο της Βαρκελώνης, με αποτέλεσμα να δομείται μία υπέροχη περιοχή που φιλοξενεί μερικά από τα καλύτερα διαμερίσματα της πόλης. Εικόνα 2.6 : Αεροφωτογραφία Βαρκελώνης που απεικονίζει τη χαρακτηριστική ρυμοτομία της Το μεγάλο σε έκταση εύρος της περιοχής, τα μοντέρνα κτίρια, η ξεχωριστή ρυμοτομία, η έντονη δραστηριότητα κατά τη διάρκεια της ημέρας και της νύχτας, οι διαφορετικές κοινωνικές τάξεις που αλληλεπιδρούν και οι υψηλές αξίες που συναντώνται δημιουργούν μεγάλο ενδιαφέρον για την αγορά ακινήτων της περιοχής και για την εύρεση των πραγματικών παραγόντων που διαμορφώνουν τις τελικές αξίες πώλησης των διαμερισμάτων Τέταρτη περιοχή μελέτης - Sant Marti Βαρκελώνης To Sant Marti είναι μία από τις δέκα συνοικίες του Δήμου Βαρκελώνης και τοποθετείται στο ανατολικό τμήμα του Δήμου. Πρόκειται για μία παραθαλάσσια συνοικία, η οποία από ξηράς συνορεύει βόρεια με το Sant Andreu και το Horta Guinardo, δυτικά με το Eixampleκαι το Ciutat Vella και ανατολικά με το St Adria de Besos. Από το 1714 ήταν ένα αυτόνομο χωριό, το οποίο το 1897 ξεκίνησε να αποτελεί κομμάτι της Βαρκελώνης. Σήμερα η συνοικία Sant Marti χωρίζεται σε δέκα επιμέρους γειτονιές και σύμφωνα με την 7 Μεταπτυχιακή διατριβή 19

32 Περιοχές μελέτης απογραφή του 2005 ο πληθυσμός της είναι κάτοικοι. Αποτελεί τη δεύτερη μεγαλύτερη συνοικία της Βαρκελώνης μετά το Eixample, όπου σε συνδυασμό με το μέγεθος της την καθιστά την έκτη μεγαλύτερη σε πληθυσμιακή πυκνότητα. Εικόνα 2.7: Απεικόνιση περιοχής Sant Marti. Πηγή: δορυφορική απεικόνιση από Google earth Το χαρακτηριστικό γνώρισμα της περιοχής που τη διαφοροποιεί από όλες τις υπόλοιπες είναι η ανάδειξη της ως μίας από τις βιομηχανικές ζώνες της Βαρκελώνης με πολυάριθμα εργοστάσια και αποθήκες. Ο χαρακτηρισμός της ως βιομηχανικό κέντρο της Βαρκελώνης, στις αρχές του 20ου αιώνα βασιζόταν στη συγκέντρωση των περισσότερων εργοστασίων όλης της Καταλονίας. Όπως είναι αναμενόμενο οι πρώτοι κάτοικοι της περιοχής ανήκουν στην εργατική τάξη της πόλης (Καταλανοί) ή σε μετανάστες από όλη της Ισπανία. Όπως αναφέρεται και παραπάνω, σταθμό στην εξέλιξη της περιοχής αποτέλεσαν οι Ολυμπιακοί αγώνες του 1992 γιατί έδωσαν μεγάλα κίνητρα για αλλαγές. Η συνοικία Sant Marti κυριολεκτικά μεταμορφώθηκε. Πολλά από τα παλιά εργοστάσια επανασχεδιάστηκαν ή αντικαταστάθηκαν με νέες μοντέρνες κατοικήσιμες περιοχές όπως το Diagonal Mar, εμπορικά κέντρα, πάρκα, νέοι χώροι εργασίας και πανεπιστήμια. Ένα νέο σχέδιο με όνομα δίνει χώρο σε νέες εταιρίες και πολλές καινούριες θέσεις εργασίας στο σημερινό Sant Marti. Επικρατεί το πνεύμα της καινοτομίας, μοντέρνες οικοδομές κτίζονται, νέες εγκαταστάσεις και ζώνες πρασίνου, ενώ οι αλλαγές αποτελούν καθημερινό φαινόμενο. Η ρυμοτομία του Sant Marti βασίζεται στο μοντέλο που υπάρχει στο Eixample αν και το πλήθος των ακινήτων είναι πολύ διαφορετικό. Η ισχυρή αίσθηση της κοινότητας που επικρατούσε και συνεχίζει να επικρατεί, το βιομηχανικό παρελθόν της, οι τεράστιες εξελίξεις που έλαβαν χώρα, τα σχέδια για περαιτέρω ανάπτυξη της περιοχής, η παραθαλάσσια αίγλη της, η έντονη εμπορικότητα και η πολύ μικρή απόσταση της από το κέντρο της πόλης την καθιστά μία ιδιαίτερη περιοχή για την πόλη της Βαρκελώνης και άξια μελέτης. Τα παραπάνω χαρακτηριστικά της δεν υπάρχει 20

33 Κ ε φ ά λ α ι ο 2 ο αμφιβολία ότι έχουν θετική επίδραση στην αγορά ακινήτων του Sant Μarti, η οποία επιδιώκεται να ερευνηθεί μέσω στατιστικού μοντέλου στα επόμενα κεφάλαια Πέμπτη περιοχή μελέτης Badalona Βαρκελώνης Η Badalona αποτελεί προάστιο της Βαρκελώνης, το οποίο τοποθετείται μόνο 10km μακριά από την πόλη στο βορειοανατολικό τμήμα της. Αποτελεί μία αστική περιοχή (2010) κατοίκων και είναι ο τρίτος πιο πυκνοδομημένος δήμος της Καταλονίας μετά τη Βαρκελώνη και το L Hospitalet de Llobreget. Σήμερα χωρίζεται σε εννέα επιμέρους γειτονιές. Είναι μία από τις παλαιότερες πόλεις της περιοχής με πλούσια καλλιτεχνική και ιστορική κληρονομιά. Η περιοχή είναι τουριστική και φιλοξενεί αρκετά ξενοδοχεία καθώς η σύνδεση της με το κέντρο της Βαρκελώνης πραγματοποιείται με όλα τα δυνατά μέσα μαζικής μεταφοράς, μετρό, προαστιακό, λεωφορείο και τραμ. Εικόνα 2.8: Απεικόνιση της περιοχής Badalona. Πηγή: Η Badalona ήταν μία από τις πιο σημαντικές κωμοπόλεις κατά τη διάρκεια ανάπτυξης της βιομηχανίας στην Ισπανία από το 19 ο αιώνα και έπειτα. Η δύναμη της πηγάζει από την αλιεία, την κατασκευή μάλλινων και βαμβακερών αγαθών, γυαλιού και διαφόρων ποτών και προϊόντων όπως η ζάχαρη. Την περιοχή κατοικούν άνθρωποι της μεσαίας ή εργατικής τάξης, αν και οι αξίες των διαμερισμάτων είναι πολύ υψηλότερες από αντίστοιχες περιοχές στην πόλη της Θεσσαλονίκης. Τα χαρακτηριστικά που τη διαφοροποιούν σε σύγκριση με τις υπόλοιπες περιοχές και την κάνουν ενδιαφέρουσα ως προς τη μελέτη του τρόπου διαμόρφωσης των αξιών της είναι ποικίλα. Αρχικά, αποτελεί μία αυτόνομη περιοχή που η δομή της στο εσωτερικό αντιπροσωπεύει μία μικρή πόλη, παρόλο που απέχει πολύ μικρή απόσταση από την έντονη Μεταπτυχιακή διατριβή 21

34 Π ε ρ ι ο χ έ ς μ ε λ έ τ η ς ζωή και δραστηριότητα της Βαρκελώνης. Το κέντρο της, το λιμάνι, οι παραθαλάσσιες κατοικίες και το βιομηχανικό παρελθόν, της δίνουν χαρακτηριστικά που την καθιστούν σίγουρα ενδιαφέρουσα. Η κατοικία στη Badalona έχει επίσης τη μορφή των οριζόντιων ιδιοκτησιών που τοποθετούνται σε πολυώροφες οικοδομές και άρα δίνεται η δυνατότητα να συγκεντρωθεί ένα αξιόλογο μέγεθος στατιστικού δείγματος. Τέλος, σε μία περιοχή αυτής της κατηγορίας είναι περισσότερες οι πιθανότητες η διαμόρφωση των αξιών ακινήτων να είναι ομαλοποιημένη, χωρίς ιδιαίτερες εξάρσεις, γεγονός που μόνο θετική επίδραση μπορεί να έχει στη μοντελοποίηση της εκτίμησης αγοραίων αξιών στην περιοχή. 22

35 ΚΕΦΑΛΑΙΟ 3 Ο ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ Κάθε είδους στατιστική μελέτη απαιτεί μια ιδιαίτερα χρονοβόρα και αναπόφευκτη προεργασία. Έπειτα από τον προσδιορισμό του προβλήματος και την ανάλυση όλων των δεδομένων, τα βασικά βήματα αυτής της προεργασίας είναι η επιλογή της κατάλληλης στατιστικής μεθοδολογίας, ο προσδιορισμός των μεταβλητών, η κατηγοριοποίηση και ποσοτικοποίηση τους και τέλος ο σχηματισμός του δείγματος. Κάθε ένα από τα παραπάνω βήματα πρέπει να επεξηγείται ώστε να είναι δικαιολογημένη κάθε επιλογή του ερευνητή, καθώς αντικατοπτρίζει την πρόθεση που έχει για τη στατιστική ανάλυση και τα αποτελέσματα που αποζητά. Μία καλή προεργασία οδηγεί σε λιγότερα προβλήματα όταν ξεκινήσει η επεξεργασία του δείγματος και εξοικονομεί χρόνο και ενέργεια για κάθε ερευνητή. Στο πρώτο μέρος του κεφαλαίου που ακολουθεί αναλύεται το θεωρητικό υπόβαθρο στο οποίο στηρίζεται ο βασικός κορμός της προετοιμασίας των δεδομένων, ενώ στο δεύτερο μέρος περιγράφεται η μεθοδολογία, οι περιορισμοί και οι παραδοχές που λαμβάνουν χώρα στην παρούσα εφαρμογή. 3.1 ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ Προϋπόθεση για την υλοποίηση μίας στατιστικής μελέτης αποτελεί η διερεύνηση του προβλήματος σε βάθος, σε συνδυασμό με την ταυτόχρονη μελέτη μεγάλου όγκου σχετικής βιβλιογραφίας, έτσι ώστε να γίνει αντιληπτή η βασική μεθοδολογία που θα δώσει τα ζητούμενα αποτελέσματα. Πιο συγκεκριμένα, για την επιλογή της κατάλληλης μεθόδου γίνεται αρχικά μία διερεύνηση της σχέσης μεταξύ των μεταβλητών και στη συνέχεια επιλέγεται μία ή και περισσότερες στατιστικές μεθοδολογίες που υπάρχουν στη διεθνή βιβλιογραφία. Παρόλο που η ύπαρξη παραδειγμάτων για κάθε στατιστική μεθοδολογία διευκολύνει τον ερευνητή να κατανοήσει εάν το εκάστοτε μοντέλο είναι επαρκές για το 23

36 Κ ε φ ά λ α ι ο 3 ο δικό του στατιστικό πρόβλημα, θα πρέπει να λαμβάνεται υπόψη ότι αναλόγως με το είδος και το πλήθος των μεταβλητών, αλλά και με τις ιδιαιτερότητες της κάθε περίπτωσης, τα δεδομένα προσαρμόζονται διαφορετικά στο στατιστικό μοντέλο. Η συγκεκριμένη διαπίστωση οδηγεί στο συμπέρασμα ότι εάν υπάρχουν περισσότερα από ένα μοντέλα που θεωρητικά δίνουν λύση στο πρόβλημα, τότε για την επίλυση του μπορούν να εφαρμοστούν όλα και να επιλεγεί εν τέλει εκείνο ή εκείνα με την καλύτερη προσαρμογή των δεδομένων. Σε κάθε περίπτωση γίνονται παραδοχές και υπάρχουν περιορισμοί που πρέπει να ληφθούν υπόψη, καθώς κάθε πραγματικό θα πρέπει να αποδοθεί κατά το δυνατό καλύτερα, από ένα μοντέλο, δηλ. από μία θεωρητική μαθηματική κατασκευή. Το στάδιο που έπεται της επιλογής μεθόδου στατιστικής ανάλυσης είναι η αναζήτηση και ο σχηματισμός του δείγματος. Στις περιπτώσεις, όπου μελετώνται ορισμένα χαρακτηριστικά του γεωγραφικού χώρου πρέπει κάθε φορά να γίνεται ξεκάθαρη η δυναμική του φαινομένου. Ένα γεωγραφικό φαινόμενο χαρακτηρίζεται από το χρόνο κατά τον οποίο συμβαίνει, τα κοινωνικά, οικονομικά και πολιτικά χαρακτηριστικά τα οποία επιδρούν στο φαινόμενο με οποιονδήποτε τρόπο εκείνη την περίοδο και φυσικά τη χωρική μονάδα αναφοράς, όπου γίνεται η αναζήτηση των δεδομένων για το σχηματισμό του δείγματος. Η λεπτομερής μελέτη του χώρου και των ποσοτικών ή ποιοτικών χαρακτηριστικών που περιγράφουν το φαινόμενο στη συγκεκριμένη περιοχή μελέτης οδηγεί στη συλλογή των στοιχείων εκείνων που καθρεφτίζουν την ουσία του γεωγραφικού φαινομένου που μελετάται σε όλες τις πτυχές του και αποτελεί την πρώτη και ιδιαίτερα δύσκολη διαδικασία που πρέπει να πραγματοποιηθεί. Είναι γεγονός ότι για να μελετηθεί με τον πλέον ασφαλή τρόπο ένα φαινόμενο μέσω της στατιστικής ανάλυσης, θα πρέπει να εισαχθεί στο μοντέλο κάθε άτομο ή κάθε αντικείμενο του γεωγραφικού χώρου, δηλαδή να συμμετέχει στη μελέτη όλος ο πληθυσμός 8. Παρόλα αυτά είναι πρακτικά δύσκολη η συλλογή των δεδομένων που αναφέρονται στον πληθυσμό για λόγους κόστους, ταχύτητας, αδυναμίας ύπαρξης δεδομένων, ακόμη και για έλλειψη αναγκαιότητας στην ύπαρξη απόλυτης ακρίβειας. Η δυσκολία μπορεί να προσπεραστεί μέσω της χρησιμοποίησης μόνο ενός τμήματος του πληθυσμού επιλεγόμενου τυχαία, του δείγματος. (Ψωινός, 1999) Σύμφωνα με τον Πραμαγγιούλη, 2008 «Δειγματοληπτική έρευνα είναι η στατιστική έρευνα χαρακτηριστικών ενός πεπερασμένου πληθυσμού η οποία βασίζεται σε πληροφορίες που συλλέγονται από μέρος (δείγμα) αυτού του πληθυσμού». Σύμφωνα με Λαφαζάνη, 2010 θα πρέπει να πληρούνται δύο βασικές προϋποθέσεις προκειμένου να γίνει ορθός σχηματισμός του δείγματος: Πρώτον, θα πρέπει για κάθε εφαρμογή το μέγεθος n του δείγματος να είναι «μεγάλο», έτσι ώστε από τη μία μεριά να προσεγγίζονται πιο αντιπροσωπευτικά αποτελέσματα και από την άλλη μεριά να υπάρχει το περιθώριο να γίνονται στατιστικές δοκιμασίες για την έκβαση καλύτερου αποτελέσματος. Με άλλα λόγια «το περιθώριο σφάλματος είναι συνάρτηση του μεγέθους του δείγματος», άρα μικρό δείγμα σημαίνει μεγαλύτερη αβεβαιότητα για το αποτέλεσμα. 8 «Ως πληθυσμός ορίζεται το σύνολο ατόμων ή αντικειμένων με ένα ή περισσότερα κοινά χαρακτηριστικά». (Λαφαζάνη, 2003) Μεταπτυχιακή διατριβή 24

37 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Δεύτερον, θα πρέπει το δείγμα να είναι σίγουρα αντιπροσωπευτικό του πληθυσμού, δηλαδή τα άτομα του δείγματος να συλλέγονται με ένα αμερόληπτο τυχαίο τρόπο, ώστε όλα τα άτομα του πληθυσμού να έχουν τις ίδιες ακριβώς πιθανότητες να επιλεγούν, από τη μία, και από την άλλη να αποδίδονται κατά το δυνατό οι διαφοροποιήσεις του πληθυσμού. Σύμφωνα με το Δημητριάδη, 2002 «Ο χρυσός κανόνας για τη σωστή επιλογή του μεγέθους του δείγματος πρέπει να είναι ο εξής: Το μέγεθος του δείγματος πρέπει να είναι τόσο, ώστε να συνδυάζεται η μέγιστη δυνατή αξιοπιστία των αποτελεσμάτων με τη μέγιστη δυνατή οικονομία σε χρόνο και χρήμα.» Το κατάλληλο μέγεθος του δείγματος μπορεί να βρεθεί με τη βοήθεια περισσότερο χονδροειδών υπολογισμών, οι οποίοι συνδέονται με τον αριθμό των μεταβλητών που χρησιμοποιούνται και την ακρίβεια που απαιτείται στα εξαγόμενα αποτελέσματα. Πιο συγκεκριμένα, σύμφωνα με Δημητριάδης, 2010 στην περίπτωση πολλαπλής γραμμικής παλινδρόμησης ως ελάχιστα αποδεκτό όριο μπορούν να θεωρηθούν οι πέντε (5) οντότητες για κάθε μία ανεξάρτητη μεταβλητή που συμμετέχει στο μοντέλο, ενώ ως επιθυμητό όριο μπορούν να θεωρηθούν οι 15 οντότητες για κάθε μία ανεξάρτητη μεταβλητή. Η τεχνική λήψης ενός δείγματος μπορεί να διαφέρει ανάλογα με τον πληθυσμό και στηρίζεται σε επιστημονικά κριτήρια για τη συγκρότηση του. Οι τεχνικές δειγματοληψίας κατηγοριοποιούνται στις ακόλουθες. (Δαφέρμος, 2005) 1. Απλή τυχαία δειγματοληψία 2. Συστηματική δειγματοληψία 3. Δειγματοληψία κατά στρώματα 4. Δειγματοληψία κατά ομάδες 5. Δειγματοληψία κατά στάδια Παρόλα αυτά η μελέτη των δεδομένων δεν αφορά μόνο τον εντοπισμό τους αλλά παράλληλα την οργάνωση, κατηγοριοποίηση και ταξινόμηση τους, ώστε να μελετηθούν σε τέτοιο βαθμό που να συμμετέχουν με τον καλύτερο δυνατό τρόπο στη στατιστική ανάλυση με στόχο να δώσουν αξιόπιστα αποτελέσματα και λύση στο κάθε ερώτημα του μελετητή. Πολλές είναι οι κατηγορίες που μπορεί να ανήκει το κάθε δεδομένο όπως πρωτογενή δευτερογενή, πρωτοβάθμια δευτεροβάθμια, ποιοτικά ή ποσοτικά, σταθερές ή μεταβλητές. (Λαφαζάνη, 2010) Η συγκεκριμένη διαδικασία ονομάζεται κατηγοριοποίηση και ποσοτικοποίηση των μεταβλητών που περιγράφουν το γεωγραφικό φαινόμενο και είναι το τελευταίο, απαραίτητο βήμα πριν την έναρξη της στατιστικής ανάλυσης. Σύμφωνα με όλα τα παραπάνω σχόλια σχετικά με την προεργασία μιας στατιστικής ανάλυσης παρατίθεται το παρακάτω σχεδιάγραμμα που παρουσιάζει διαγραμματικά τα βασικά στάδια που απαιτούνται. 25

38 Κ ε φ ά λ α ι ο 3 ο 1. Κατανόηση του προς εξέταση φαινομένου 2. Προσδιορισμός μεταβλητών 3. Μελέτη σχετικής βιβλιογραφίας 4. Επιλογή στατιστικής μεθόδου ανάλυσης 5. Σχηματισμός δείγματος με τη βοήθεια περιορισμών και κριτηρίων 6. Κατηγοριοποίηση και ποσοτικοποίηση μεταβλητών 7. Στατιστική ανάλυση Διάγραμμα 3.1: Διαγραμματική απεικόνιση της στατιστικής προεργασίας 3.2 ΕΦΑΡΜΟΓΗ Τα παραπάνω επτά στάδια για τη στατιστική προσέγγιση ενός προβλήματος αναλύονται λεπτομερώς παρακάτω για το γεωγραφικό φαινόμενο που μας ενδιαφέρει και αφορά την προεκτίμηση αγοραίων αξιών ακινήτων. Τα βήματα που προαναφέρονται μαζί με τα ιδιαίτερα χαρακτηριστικά της στατιστικής μεθόδου που επιλέγεται και τους περιορισμούς και προϋποθέσεις της εφαρμογής αποτελούν το βασικό μεθοδολογικό κορμό της εργασίας, στον οποίο στηρίζεται η παρούσα εφαρμογή Επιλογή στατιστικής μεθόδου Το φαινόμενο που εξετάζεται στα πλαίσια της παρούσας μεταπτυχιακής διατριβής χαρακτηρίζεται πολυκριτηριακό και απαιτεί τη χρήση ενός μαθηματικού μοντέλου που να μπορεί να λάβει υπόψη του ένα σύνολο πολλών διαφορετικών μεταβλητών και να διερευνά τις σχέσεις μεταξύ τους. Πιο συγκεκριμένα, το ζητούμενο είναι η πρόβλεψη της αγοραίας αξίας των οριζόντιων ιδιοκτησιών με βάση τις τιμές ενός συνόλου μεταβλητών από τις οποίες εξαρτάται η αγοραία αξία. Σύμφωνα με τις τεχνικές πολυμεταβλητής ανάλυσης πρόκειται για την πρόβλεψη της συμπεριφοράς μιας μεταβλητής (εξαρτημένη), όταν είναι γνωστή η συμπεριφορά (δηλ. οι τιμές) ενός συνόλου άλλων μεταβλητών (ανεξάρτητων). Μεταπτυχιακή διατριβή 26

39 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Ένας από τους τρόπους αντιμετώπισης τέτοιων προβλημάτων είναι η τεχνική της πολλαπλής γραμμικής παλινδρόμησης, και αυτή επιλέγεται. Σύμφωνα με Λαφαζάνη, 2008 στα προβλήματα πολλαπλής παλινδρόμησης υπάρχει πάντοτε μία σαφής διάκριση μεταξύ των ανεξάρτητων και της εξαρτημένης μεταβλητής. Οι τιμές που παίρνουν οι ανεξάρτητες τυχαίες μεταβλητές μπορούν να καθοριστούν με ακρίβεια από τον ερευνητή, ενώ η εξαρτημένη που είναι και αυτή μία τυχαία μεταβλητή, μπορεί να πάρει για κάθε «ελεγχόμενη» τιμή της ανεξάρτητης μεταβλητής μία οποιαδήποτε τιμή μεταξύ ορισμένων «λογικών» ορίων. Η γενική εξίσωση ενός πολλαπλού γραμμικού παλινδρομικού μοντέλου είναι της μορφής:,όπου b 0 είναι ο σταθερός όρος, b 1,, b κ οι μερικοί συντελεστές πολλαπλής παλινδρόμησης (partial regression coefficients), χ 1, χ 2,, χ κ οι κ ανεξάρτητες μεταβλητές (predictor variables) και e το σφάλμα του παλινδρομικού μοντέλου. Στην παρούσα εφαρμογή η αντίστοιχη εξίσωση γραμμικής παλινδρόμησης είναι της μορφής: Αγοραία αξία ακινήτων = σταθερός όρος + b1 * (Εμβαδόν) b2 * (Παλαιότητα) + b3 * (Όροφος)+ + bκ * (Θέση στάθμευσης) Για την εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης, όπως φαίνεται και από την παραπάνω εξίσωση, γίνεται αρχικά η υπόθεση ότι η σχέση που συνδέει την αγοραία αξία των ακινήτων με τις μεταβλητές από τις οποίες αυτή εξαρτάται είναι γραμμική. Η θεώρηση της σύνδεσης με γραμμικό τρόπο αποτελεί την πρώτη παραδοχή που γίνεται στο μοντέλο. Στη διεθνή βιβλιογραφία συναντάται η χρήση της γραμμικής πολλαπλής παλινδρόμησης σε ποικιλία φαινομένων που αφορούν πρόβλεψη αξίας γης, τιμής κόστους κατασκευής κλπ. Μολοταύτα μέσω της διαδικασίας εκτέλεσης της παλινδρόμησης θα φανεί ξεκάθαρα στην πορεία εάν υφίσταται η αρχική υπόθεση για ύπαρξη γραμμικότητας και για το ποιες από τις μεταβλητές που λαμβάνουν μέρος στο μοντέλο επιδρούν θετικά ή αρνητικά στη διαμόρφωση της αγοραίας αξίας. Αποτελεί κοινό τόπο ότι ένας από τους παράγοντες που επηρεάζει σημαντικά την αξία των ακινήτων είναι η θέση τους. Παρόλα αυτά όταν ένας εκτιμητής ακινήτων επιθυμεί να υπολογίσει την αγοραία αξία ενός διαμερίσματος αστικού περιβάλλοντος μία από τις μεθόδους που μπορεί να εφαρμόσει είναι κατά κύριο λόγο η συγκριτική μέθοδος εκτίμησης, κάνοντας ταυτόχρονα την παραδοχή για ύπαρξη χωρικής ομοιομορφίας στα δεδομένα που συλλέγει. Η εφαρμογή της μεθόδου σύμφωνα με το Ζεντέλη, 2001 βασίζεται στη γνώση αντίστοιχων αξιών άλλων παρεμφερών ή κατά το δυνατόν παρόμοιων ακινήτων. Η συλλογή ενός ικανού αριθμού πρόσφατων αγοραπωλησιών αφορά ακίνητα που βρίσκονται στην ίδια περιοχή ή στον ίδιο δρόμο έτσι ώστε να θεωρείται ότι η επίδραση της θέσης είναι όμοια για όλα τα ακίνητα. Με παρόμοια λογική επιλέγεται να εφαρμοστεί το μοντέλο της παλινδρόμησης στις πέντε περιοχές μελέτης και με το παραπάνω κριτήριο επιλέγονται και τα πέντε δείγματα. Για τη δυνατότητα εκτέλεσης της μεθόδου γίνεται 27

40 Κ ε φ ά λ α ι ο 3 ο συνεπώς η παραδοχή ότι οι περιοχές μελέτης χαρακτηρίζονται στο εσωτερικό τους από χωρική ομοιομορφία. Στόχος είναι μέσω της εφαρμογής πολλαπλής γραμμικής παλινδρόμησης να εντοπιστούν ποιες είναι οι μεταβλητές που επηρεάζουν εν τέλει την αγοραία αξία των οριζόντιων ιδιοκτησιών και εν συνεχεία να φανεί εάν αυτές οι μεταβλητές είναι όμοιες ή διαφορετικές για κάθε περιοχή μελέτης. Η πολλαπλή γραμμική παλινδρόμηση επιλέγεται έναντι άλλων μεθόδων στατιστικής ανάλυσης, όπως για παράδειγμα της μη γραμμικής πολλαπλής παλινδρόμησης εξαιτίας του γεγονότος ότι πρόκειται για μία εξαιρετικά διαδεδομένη, σίγουρα πιο προσιτή μέθοδο, η οποία πλεονεκτεί στο γεγονός ότι είναι ελεγχόμενη και μπορεί με τη βοήθεια παραδοχών που πρέπει να ικανοποιούνται να οδηγήσει σε στατιστικά ορθά αποτελέσματα και σε ένα μοντέλο που θα συνοδεύεται από αξιοπιστία και σταθερότητα. Πρόκειται λοιπόν για ένα πολύ σημαντικό στατιστικό εργαλείο, το οποίο αφήνει το περιθώριο αποφάσεων στον ερευνητή, έχει δοκιμαστεί σε παρόμοιες εφαρμογές και μπορεί κανείς να το εμπιστευτεί Σχηματισμός του δείγματος Στην παρούσα εφαρμογή τον πληθυσμό μεγέθους Ν αποτελεί το σύνολο των οριζόντιων ιδιοκτησιών που βρίσκονται στις αντίστοιχες περιοχές μελέτης, όπως αυτές ορίζονται στο κεφάλαιο 2 και είναι προς πώληση τη συγκεκριμένη χρονική περίοδο της έρευνας. Όπως γίνεται αντιληπτό, η συγκέντρωση όλων αυτών των στοιχείων μπορεί να χαρακτηριστεί αδύνατη, καθώς δεν υπάρχει κάποιος αρμόδιος φορέας που να διαθέτει τη ζητούμενη πληροφορία συγκεντρωτικά. Στόχος είναι να σχηματιστεί το κατάλληλο στατιστικό δείγμα, ώστε να πληροί τις προϋποθέσεις μεγέθους που έχουν τεθεί και να δώσει ισάξια λύση στα ερωτήματα που καλείται να απαντήσει η παρούσα μεταπτυχιακή διατριβή. Ο σχηματισμός του δείγματος είναι μία ιδιαίτερα σοβαρή διαδικασία καθώς η έκβαση ενός αξιόπιστου αποτελέσματος και ο σχηματισμός ενός ισχυρού μαθηματικού μοντέλου εξαρτάται άμεσα από αυτό. Για τη συγκέντρωση του δείγματος και στις πέντε περιοχές αξιοποιείται η δειγματοληψία κατά στρώματα (ή στρωματοποιημένη δειγματοληψία). Πρόκειται για διαδικασία κατά την οποία πραγματοποιείται διαίρεση του πληθυσμού σε μη επικαλυπτόμενα στρώματα και επιλέγεται ένα απλό τυχαίο δείγμα από κάθε στρώμα. (Ψωινός, 2001). Η συγκεκριμένη διαδικασία δειγματοληψίας εφαρμόζεται στην παρούσα μελέτη, καθώς οι διαφορετικές περιοχές της πόλης της Θεσσαλονίκης και της Βαρκελώνης αντιστοιχούν στα διαφορετικά στρώματα, τα οποία στο εσωτερικό τους είναι ομοιογενή (όσο πιο πολύ γίνεται), ενώ μεταξύ τους είναι διαφορετικά (όσο πιο πολύ γίνεται). Η διαίρεση και κατηγοριοποίηση των περιοχών περιγράφεται αναλυτικά στο δεύτερο κεφάλαιο, ενώ παρακάτω φαίνεται σχηματικά 9 η λογική της στρωματοποιημένης δειγματοληψίας, στις δύο περιοχές μελέτης της Θεσσαλονίκης και στη μία από τις τρεις περιοχές της Βαρκελώνης, αντιπροσωπευτικά. 9 Οι τρεις εικόνες αποτελούν απλό σκαρίφημα επεξήγησης με τη βοήθεια πολυγώνων και όχι χάρτη των περιοχών Μεταπτυχιακή διατριβή 28

41 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Εικόνα 3.1: Σκαρίφημα επεξήγησης μεθοδολογίας δειγματοληψίας για την πρώτη περιοχή μελέτης Εικόνα 3.2: Σκαρίφημα επεξήγησης μεθοδολογίας δειγματοληψίας για τη δεύτερη περιοχή μελέτης Εάν θεωρηθεί ότι στην εικόνα 3.1 απεικονίζεται όλος ο δήμος Θεσσαλονίκης, η πρώτη διαίρεση σε στρώματα που πραγματοποιείται (με τα γράμματα Α, Β) είναι η 29

42 Κ ε φ ά λ α ι ο 3 ο διοικητική διαίρεση, σύμφωνα με την οποία διαχωρίζεται ο Δήμος σε δύο δημοτικές ενότητες. Εν συνεχεία, η δημοτική ενότητα της Θεσσαλονίκης (Α) διαιρείται σε επιπλέον στρώματα, τα οποία αντιστοιχίζονται στις πέντε βασικές δημοτικές κοινότητες (Α1, Α2, Α3, Α4, Α5), όπως ορίζονται από το πρόγραμμα «Καλλικράτης». Παρόλα αυτά στο στρώμα Α1 που είναι το κέντρο της πόλης υπάρχουν διαφοροποιήσεις και έντονη ποικιλομορφία σε όλα τα επίπεδα, άρα μεγάλη διακύμανση στις αξίες των ακινήτων που τοποθετούνται στο συγκεκριμένο στρώμα. Για αυτό το λόγο πραγματοποιείται επιπλέον στρωματοποίηση (Α11, Α12, Α13, Α14), ώστε να υπάρχει όσο γίνεται περισσότερη ομοιομορφία στο εσωτερικό του κάθε στρώματος. Στη συνέχεια, η περιοχή A12 διαιρείται σε περαιτέρω στρώματα, καθώς στο εσωτερικό της υπάρχουν διαμερίσματα με πρόσοψη σε κεντρικούς δρόμους, σε στενά δρομάκια του κέντρου, σε πλατείες κλπ. Για το σχηματισμό του δείγματος συλλέγονται διαμερίσματα από κάθε επιμέρους υποπεριοχή, προκειμένου να είναι αντιπροσωπευτικό το δείγμα της πρώτης περιοχής μελέτης. Η εικόνα 3.2 θεωρείται ότι απεικονίζει όλο το Δήμο Ελευθέριου Κορδελιού στο δυτικό τμήμα της πόλης. Ο πρώτος διαχωρισμός που δημιουργεί τα πρώτα στρώματα στηρίζεται στη διοικητική διαίρεση στις δύο δημοτικές ενότητες του δήμου, Δημοτική ενότητα Ελευθερίου Κορδελιού και Δημοτική ενότητα Ευόσμου (Α, Β). Στην περίπτωση της δημοτικής ενότητας του Ευόσμου πραγματοποιούνται επιπλέον διαιρέσεις, οι οποίες διαμορφώνονται βάσει των γενικών χαρακτηριστικών και αντικειμενικών αξιών στην περιοχή και δημιουργείται ένα ακόμη επίπεδο στρωματοποίησης (Β1, Β2, Β3, Β4). Για να προσεγγίζεται καλύτερα ο πληθυσμός από το δείγμα, συλλέγονται διαμερίσματα από κάθε κατηγορία Β1, Β2 κλπ και εν συνεχεία ενώνονται για να αποτελέσουν το αντιπροσωπευτικό δείγμα της δεύτερης περιοχής μελέτης. Με τη ίδια ακριβώς λογική δημιουργούνται τα επίπεδα στρωματοποίησης για τις τρεις περιοχές μελέτης της Βαρκελώνης. Χαρακτηριστικό είναι το παράδειγμα της κεντρικής περιοχής Eixample που αποτελεί την τρίτη περιοχή μελέτης της εφαρμογής (Σκαρίφημα 3.3). Η πρώτη διαίρεση σε στρώματα (γράμματα Α, Β κλπ) αποτελεί τη διοικητική διαίρεση που διαφοροποιεί τους αντίστοιχους «Δήμους» για τα δεδομένα της Ελλάδας. Στη συνέχεια ο Δήμος Βαρκελώνης χωρίζεται σε περιοχές (Α1, Α2, Α3.. Α10), οι οποίες διαφέρουν γεωγραφικά σε μεγάλο βαθμό, διότι είναι ανομοιογενείς όσον αφορά τη θέση, το εισόδημα των κατοίκων, την κοινωνική τους θέση και τα χαρακτηριστικά των κατοικιών. Συγκεκριμένα, το στρώμα Α5 αποτελεί την περιοχή Eixample η οποία διαιρείται σε περισσότερα στρώματα (υποπεριοχές). Απλό τυχαίο δείγμα συλλέγεται από τα έξι στρώματα Α51, Α52, Α53, Α54, Α55 και Α56 ώστε με την ένωση τους να αποτελέσουν το αντιπροσωπευτικό δείγμα της τρίτης περιοχής μελέτης. Μεταπτυχιακή διατριβή 30

43 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Εικόνα 3.3: Σκαρίφημα επεξήγησης μεθοδολογίας δειγματοληψίας για την Τρίτη περιοχή μελέτης Μέγεθος δείγματος Για τον έλεγχο του μεγέθους του δείγματος συμμετέχουν στο μοντέλο για την τελική διαμόρφωση της αγοραίας αξίας των ακινήτων. Όπως έχει αναφερθεί παραπάνω ως ελάχιστα αποδεκτό όριο θεωρούνται οι οντότητες για κάθε ανεξάρτητη μεταβλητή. Στην παρούσα εφαρμογή, όπως αναφέρεται αναλυτικά παρακάτω, ο αριθμός των μεταβλητών που θεωρείται ότι επηρεάζει τη διαμόρφωση της αγοραίας αξίας των διαμερισμάτων για την πόλη της Θεσσαλονίκης, με βάση την πηγή συλλογής των δεδομένων είναι συνολικά οκτώ (8), ενώ για την πόλη της Βαρκελώνης είναι συνολικά εννέα (9). Σύμφωνα με όρια που τίθενται στην ενότητα 3.1, για την περίπτωση της Θεσσαλονίκης ισχύει: Μέγεθος δείγματος n 5*8 που πρέπει να υπάρχει τουλάχιστον είναι 40. Μέγεθος δείγματος n 15*8 που θεωρείται ιδιαίτερα ικανοποιητικό είναι 120. Λαμβάνοντας υπόψη τα παραπάνω αλλά και με εμπόδιο τη μεγάλη δυσκολία εντοπισμού ακινήτων με χωρική αναφορά στις δύο περιοχές της Θεσσαλονίκης, το μέγεθος του δείγματος που συλλέγεται είναι 60 οντότητες ανά περιοχή μελέτης. Το μέγεθος του δείγματος θεωρείται ικανοποιητικό εφόσον βρίσκεται πάνω από το κατώτατο όριο ανοχής αλλά και εξαιτίας των δυσκολιών που παρατηρούνται, της απόρριψης εγγραφών για όσο το δυνατό καλύτερη αξιοπιστία του δείγματος και των δυνατοτήτων της παρούσας έρευνας. Ικανοποιητικό μπορεί επίσης να θεωρηθεί, διότι σύμφωνα με τη βιβλιογραφία (π.χ. 31

44 Κ ε φ ά λ α ι ο 3 ο Δαφέρμος, 2005) μεγάλα στατιστικά δείγματα θεωρούνται εκείνα που ξεπερνούν τις 30 οντότητες. Για την περίπτωση της Βαρκελώνης ισχύει αντίστοιχα: Μέγεθος δείγματος n 5*9 που πρέπει να υπάρχει τουλάχιστον είναι 45. Μέγεθος δείγματος n 15*9 που θεωρείται ιδιαίτερα ικανοποιητικό είναι 135. Τα μεγέθη των δειγμάτων που συλλέγονται είναι διαφορετικά για κάθε μία περιοχή της πόλης της Βαρκελώνης. Πιο συγκεκριμένα, για την περιοχή Eixample συλλέγονται 75 οριζόντιες ιδιοκτησίες, για την περιοχή Sant Marti συλλέγονται 60 και για την περιοχή Badalona συλλέγονται 80. Ο κύριος λόγος για τον οποίο συλλέγονται στις δύο από τις τρεις περιοχές μεγαλύτερα δείγματα οφείλεται κατά κύριο λόγο στο γεγονός ότι είναι διαθέσιμες περισσότερες εγγραφές. Συνεπώς, για τους ίδιους λόγους που αναφέρονται παραπάνω και βάσει της θεωρίας τα δείγματα των τριών τελευταίων περιοχών θεωρούνται ικανοποιητικά και ικανά να δημιουργήσουν μοντέλα προεκτίμησης των αγοραίων αξιών. Φυσικά, η τελευταία διαπίστωση θα πρέπει να επαληθευτεί μέσω της στατιστικής ανάλυσης που ακολουθεί Διαδικασία δειγματοληψίας Κρίνεται αδύνατο από την αρχή της μελέτης ενός φαινομένου να είναι ξεκάθαρες όλες οι πτυχές του. Αυτές ανακαλύπτονται σταδιακά κατά τη διαδικασία συλλογής των δεδομένων και της επεξεργασίας τους μέσω της στατιστικής ανάλυσης. Η διαδικασία συλλογής του δείγματος αποτελεί την πρώτη φάση προβληματισμού καθώς κάνουν την εμφάνιση τους εμπόδια και σημεία που πρέπει να οριοθετηθούν μέσω της λήψης αποφάσεων. Παρακάτω αναφέρονται όλα τα σημεία προβληματισμού και διατυπώνονται οι περιορισμοί και οι αποφάσεις της κεντρικής μεθοδολογίας της εφαρμογής. Πρωταρχικό ζήτημα προς διερεύνηση είναι η πηγή συλλογής των δεδομένων. Από την ελληνική βιβλιογραφία γνωρίζουμε ότι ένας εκτιμητής μπορεί να συλλέξει δεδομένα από εργολάβους, μηχανικούς, εκτιμητές, μεσίτες, έντυπες και ηλεκτρονικές αγγελίες, κατά τόπους εφορίες κλπ. Καμία από τις παραπάνω πηγές δεν αποτελεί οργανωμένη βάση δεδομένων σε επίπεδο είτε τοπικό, είτε εθνικό. Συνεπώς, η απουσία οργανωμένης τράπεζας πληροφοριών από οποιονδήποτε ιδιωτικό ή δημόσιο φορέα οδηγεί σε μία μόνο επιλογή που είναι το διαδίκτυο. Σήμερα, η οργάνωση των ιστοσελίδων που περιέχουν αγγελίες εμπλουτίζεται ιδιαίτερα με τη χρήση ακριβούς γεωγραφικής θέσης, φωτογραφικού υλικού και μεγάλου πλήθους αγγελιών που εισάγονται από ιδιώτες και κυρίως από μεγάλα μεσιτικά γραφεία σε όλη την πόλη. Η εύρεση κάθε είδους πληροφορίας μέσω του διαδικτύου αποτελεί το μέλλον, συνεπώς μία σύγχρονη έρευνα δε μπορεί να μη συγχρονίζεται με αυτό. Ταυτόχρονα, θέλοντας κανείς να αντιμετωπίσει την εφαρμογή με μία πιο σφαιρική σκοπιά που να δίνει τη δυνατότητα για δημιουργία παρόμοιων εφαρμογών πέρα από τα σύνορα της Θεσσαλονίκης, αλλά και της Ελλάδας κατ επέκταση θα κατέληγε και πάλι στην επιλογή των αγγελιών μέσω διαδικτύου. Πρόκειται για ένα προσιτό προς όλους τρόπο συλλογής δεδομένων, που σίγουρα ξεπερνά τα σύνορα και δίνει Μεταπτυχιακή διατριβή 32

45 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η τη δυνατότητα στον εκάστοτε ερευνητή να διευρύνει τις ερευνητικές του ανησυχίες σε ευρύτερο πεδίο, καθώς με αυτόν τον τρόπο πετυχαίνει ομοιομορφία στις ανεξάρτητες μεταβλητές που συλλέγει και μπορεί να συγκρίνει τη μέθοδο σε πολύ διαφορετικές γεωγραφικά περιοχές. Πέρα από τα θετικά γνωρίσματα της συλλογής δεδομένων από το διαδίκτυο, σε μία τέτοια προσπάθεια ελλοχεύουν ταυτόχρονα κίνδυνοι, οι οποίοι πρέπει να εντοπιστούν και να αποφευχθούν μέσω περιορισμών κατά τη συλλογή του δείγματος. Σε κάθε περίπτωση, η συλλογή κάθε μιας οριζόντιας ιδιοκτησίας θα πρέπει να συνοδεύεται από κριτική σκέψη, ώστε να αποφευχθούν σε πρώτη φάση τα σκόπιμα ή όχι χονδροειδή λάθη, με την παρουσία παράλογων τιμών στις μεταβλητές σε σχέση με το υπόλοιπο δείγμα, αναντιστοιχίας εικόνας με περιγραφική πληροφορία κλπ. Στις περιπτώσεις που εντοπίζονται τέτοιου είδους λάθη διαγράφονται απευθείας και αποφεύγεται η συμμετοχή τους στη στατιστική ανάλυση. Προσπερνώντας τα χονδροειδή λάθη που μπορεί να υπάρχουν στο δείγμα πρέπει να ληφθεί υπόψη και μία άλλη κατηγορία σφαλμάτων. Ένα βασικό γνώρισμα της λήψης του δείγματος είναι η ύπαρξη λαθών που οφείλονται στον τρόπο μέτρησης της κάθε μεταβλητής, ο οποίος είναι πολύ πιθανό να είναι υποκειμενικός. Σε αυτή την περίπτωση ο αριθμός των παραπάνω περιπτώσεων είναι άγνωστος και ο εντοπισμός τους είναι αδύνατος με αποτέλεσμα να γίνεται η βασική παραδοχή ότι τα σφάλματα είναι τυχαία και όχι συστηματικά, ενώ για να ισχύει η παραπάνω πρόταση ισχύουν οι παρακάτω προϋποθέσεις : 1. Τα στατιστικά μεγέθη των τιμών που προκύπτουν κατά τη μέτρηση είναι ίσα με τα στατιστικά μεγέθη των πραγματικών τιμών και 2. Οι μετρήσεις είναι μεταξύ τους ανεξάρτητες, δηλαδή δεν επηρεάζεται η τιμή της μίας μέτρησης από τις άλλες (Λαφαζάνη, 2010) Πολύ βασικό κομμάτι της διαδικασίας λήψης του δείγματος αποτελεί επίσης η ακριβής χωρική τοποθέτηση όλων των διαμερισμάτων. Πρόκειται για εφαρμογή με γεωγραφικό χαρακτήρα, συνεπώς η απόδοση της θέσης του δείγματος και η οπτικοποίηση του οδηγεί σε μία ολοκληρωμένη μελέτη και κάνει σαφή τα χωρικά της όρια. Πρακτικά στην πόλη της Θεσσαλονίκης όπου είναι διαθέσιμο χωρικό υπόβαθρο 10 (shapefiles), απορρίπτονται οι αγγελίες οι οποίες δεν περιέχουν χωρική αναφορά, διότι στα πλαίσια της εφαρμογής στη συνέχεια γίνεται μία προσπάθεια εφαρμογής της μεθόδου σε περιβάλλον Γεωγραφικών Συστημάτων Πληροφοριών, το οποίο επιβάλλει την ύπαρξη θέσης του δείγματος. Επίσης, δε μπορεί να αποκλειστεί μελλοντικά η δυνατότητα επέκτασης της εφαρμογής με την πιθανή χρήση αποστάσεων και γεωγραφικών δεδομένων που να προστεθούν στην ήδη υπάρχουσα μελέτη. Τέλος, ως ένα βαθμό η ηλεκτρονική αγγελία που είναι πλήρης (δηλ. περιλαμβάνει και τη χωρική αναφορά στο χάρτη της πόλης) δείχνει μία 10 Η χωρική αναφορά των διαμερισμάτων στην παρούσα έρευνα παραμένει δυστυχώς πλεονέκτημα μόνο της Θεσσαλονίκης, διότι η απουσία χωρικού υποβάθρου για την πόλη της Βαρκελώνης αποτέλεσε τροχοπέδη. 33

46 Κ ε φ ά λ α ι ο 3 ο συνέπεια και σοβαρότητα του ιδιοκτήτη που την ανέβασε, άρα θεωρητικά κρίνεται περισσότερο αξιόπιστη. Επίσης, στα πλαίσια της παρούσας εφαρμογής κρίνεται απαραίτητη η συλλογή μόνο των αγγελιών όπου περιέχουν φωτογραφικό υλικό του διαμερίσματος. Ο βασικός λόγος είναι ότι μέσω των φωτογραφιών διαφαίνεται η γενική κατάσταση του ακινήτου (ποιότητα δαπέδων, ανακαινισμένο μπάνιο κλπ.) και άρα δίνεται η δυνατότητα για την εισαγωγή άλλης μίας μεταβλητής, η οποία αναφέρεται στην κατάσταση του ακινήτου και στο βαθμό συντήρησης του. Για την ορθή επιλογή δείγματος, ένας παράγοντας που πρέπει επίσης να εξεταστεί διεξοδικά σχετικά με την πηγή των δεδομένων είναι η ιστοσελίδα ή οι ιστοσελίδες από τις οποίες θα αντληθεί η πληροφορία και σε τι υπερέχουν αυτές από άλλες, οι οποίες εν τέλει δεν επιλέγονται. Βασικό κριτήριο στην παρούσα εργασία για την τελική επιλογή υπήρξε το πόσο διαδεδομένος είναι ο ιστότοπος, το πλήθος αγγελιών που προσφέρει, η οργανωμένη και αναλυτική παρουσίαση των ακινήτων του και τέλος η ύπαρξη ή όχι χρέωσης του ιδιώτη ή επαγγελματία που ενδιαφέρεται να πωλήσει ένα ακίνητο. Για τους παραπάνω λόγους ο ιστότοπος που τελικά επιλέγεται για τη Θεσσαλονίκη είναι ο spitogatos.gr διότι διαθέτει μία ιδιαίτερα μεγάλη βάση δεδομένων με εκατοντάδες χιλιάδες αγγελίες για όλη την Ελλάδα, φωτογραφικό υλικό και ελκύει εξαιτίας των πολλών μηνιαίων επισκεπτών, της οργάνωσης του και των υπηρεσιών και δυνατοτήτων που προσφέρει ένα πολύ μεγάλο αριθμό από επαγγελματίες μεσίτες, μεγάλα κτηματομεσιτικά γραφεία, αλλά και ιδιώτες. Επίσης, για κάθε αγγελία υπάρχει αυτόματη λήξη της έπειτα από ένα διάστημα από την ημερομηνία καταχώρησης και είναι στην ευχέρεια του ιδιώτη ή μεσίτη εάν θα την ανανεώσει, γεγονός που επιβεβαιώνει το πόσο ενημερωμένα είναι τα δεδομένα των αγγελιών και επιβεβαιώνεται η σοβαρότητα που απαιτείται από τους ενδιαφερόμενους. Επίσης, με την επιλογή του spitogatos.gr ικανοποιείται ο στόχος που τίθεται παραπάνω για δυνατότητα εφαρμογής της μελέτης από κάθε μελετητή που βρίσκεται εκτός συνόρων, διότι οι αγγελίες του spitogatos.gr αυτόματα προβάλλονται στην ιστοσελίδα που αποτελεί την αγγλική εκδοχή του. Ταυτόχρονα, για την ύπαρξη ομοιομορφίας των δεδομένων που συλλέγονται, η οποία είναι απαραίτητη για τη μετέπειτα επεξεργασία τους, γίνεται μία προσπάθεια να μην επιλεγούν άλλοι ιστότοποι ως πηγές πληροφοριών, εκτός από την περίπτωση του Δήμου Ευόσμου, όπου εξαιτίας μη συγκέντρωσης του επιθυμητού αριθμού δείγματος (λόγω μικρότερης προσφοράς αξιόπιστων και με φωτογραφικό υλικό αγγελιών στη συγκεκριμένη περιοχή) ένας μικρός αριθμός αγγελιών αντλούνται από άλλο ιστότοπο 11. Αντίστοιχα για τη Βαρκελώνη αξιοποιείται η ιστοσελίδα fotocasa.com, η οποία συγκεντρώνει ένα πάρα πολύ μεγάλο πλήθος ακινήτων, τα περισσότερα εκ των οποίων διαθέτουν πλούσιο και αντιπροσωπευτικό φωτογραφικό υλικό, χωρική τοποθέτηση, πλήθος πληροφοριών για τα διαμερίσματα και χάρτες, οι οποίοι διευκολύνουν πάρα πολύ την ορθή συλλογή των δεδομένων. Η ιστοσελίδα παρόλο που παρέχει τις πληροφορίες στην ισπανική γλώσσα προτιμήθηκε έναντι των αντίστοιχων αγγλικών ιστότοπων εξαιτίας της καλύτερης οργάνωσης της, αλλά κυρίως εξαιτίας του μεγάλου πλήθους δεδομένων της. 11 Μεταπτυχιακή διατριβή 34

47 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Ένα επιπλέον στοιχείο που πρέπει να διευκρινιστεί αφορά την εξαρτημένη μεταβλητή, η οποία όπως παρέχεται από τις ηλεκτρονικές αγγελίες ισοδυναμεί με τη ζητούμενη τιμή πώλησης των διαμερισμάτων του δείγματος. Είναι αναμενόμενο να υπάρχει μία διαφορά μεταξύ της αγοραίας αξίας του ακινήτου και της τιμής που δίνεται στο διαδίκτυο, σε μερικά ακίνητα μεγαλύτερη, σε άλλα μικρότερη και σε άλλα μηδενική. Σύμφωνα με ειδικούς της αγοράς ακινήτων 12 της Θεσσαλονίκης, η τελική τιμή πώλησης, όπως αυτή έχει διαμορφωθεί σήμερα με τις υπάρχουσες συνθήκες στην κτηματαγορά, διαφέρει σημαντικά από την αρχικά ζητούμενη. Η διαφορά συνήθως κυμαίνεται σε μείωση από 10 έως 20% και εξαρτάται συνήθως από τον τρόπο εξόφλησης του ποσού και από τη μειωμένη ζήτηση. Ακραίες διαφορές εντοπίζονται και στις ενοικιάσεις επαγγελματικών χώρων, των οποίων οι τιμές μπορεί να μειωθούν και κατά 50%. Στα πλαίσια της εργασίας κρίνεται αδύνατη η γνώση της ακριβούς τιμής αγοραπωλησίας του κάθε ακινήτου, οπότε προτιμάται να μη γίνει η οποιαδήποτε αυθαίρετη αλλαγή των αρχικών τιμών και ορίζεται ως παραδοχή ότι οι ζητούμενες τιμές πώλησης είναι και οι αγοραίες αξίες των ακινήτων. Σύμφωνα με τις παραπάνω παραγράφους, στα πλαίσια της παρούσας έρευνας, η συλλογή των δεδομένων αποτελεί σίγουρα σημείο προβληματισμού, καθώς θα πρέπει να συνδυάζονται απαραίτητα πρώτον η συλλογή ενός μεγάλου αριθμού δεδομένων, το οποίο να είναι ενημερωμένο για να αντικατοπτριστεί όσο είναι εφικτό η σημερινή κατάσταση στην αγορά ακινήτων, δεύτερον να γίνεται η χωρική τοποθέτηση των διαμερισμάτων και τρίτον να υπάρχει φωτογραφικό υλικό. Εξαιτίας των παραπάνω περιορισμών που τίθενται και επιλογής της Βαρκελώνης ως επιπλέον πόλη έρευνας δικαιολογείται για ακόμη μία φορά η συλλογή των δεδομένων από το διαδίκτυο. Παρόλα αυτά, ακόμη και εάν η μελέτη περιοριζόταν αυστηρά στα σύνορα της Θεσσαλονίκης, οι αγγελίες από τον έντυπο τύπο δε θα ήταν επαρκείς διότι δε συνοδεύονται από φωτογραφικό υλικό και δεν γίνεται απόλυτη γεωγραφική αναφορά. Επίσης, η συλλογή του δείγματος από επιτόπια έρευνα, δηλαδή λήψη συνεντεύξεων σε μεσίτες ή μέσω ερωτηματολογίων (συνήθης τρόπος συλλογής δείγματος από ένα πληθυσμό στις στατιστικές μελέτες), δε θα ήταν εφικτή διότι οι μεν μεσίτες τις περισσότερες φορές δεν είναι εύκολα συνεργάσιμοι λόγω καχυποψίας και κυρίως όταν έχει να κάνει με μεγάλο αριθμό πληροφορίας, ενώ τα ερωτηματολόγια δεν θα μπορούσαν να έχουν πρακτική εφαρμογή στην παρούσα μελέτη. Αξιόπιστα δεδομένα κατέχουν όλες οι τράπεζες μέσω των εκτιμήσεων και επανεκτιμήσεων που πραγματοποιούνται για τη λήψη δανείων, τα οποία όμως δεν είναι πρωτογενή και όχι διαθέσιμα. Τέλος, στον ελλαδικό χώρο δεν υπάρχει αρμόδιος δημόσιος φορέας που να διαθέτει μία βάση δεδομένων με το σύνολο των αγοραπωλησιών που πραγματοποιούνται, ώστε να μπορούσαν να αξιοποιηθούν για παρόμοια εφαρμογή Κατηγοριοποίηση και ποσοτικοποίηση των ανεξάρτητων μεταβλητών Στην παρούσα εργασία, έχει γίνει κατανοητό από προηγούμενα κεφάλαια ότι η μονάδα αναζήτησης δεδομένων είναι το διαμέρισμα και ζητείται να προσδιοριστούν τα διαστήματα πρόβλεψης της αγοραίας αξίας ακινήτων μέσω μίας σειράς μεταβλητών. Η 12 Συνέντευξη του Χ. Μπακιρτζόγλου, Αγρονόμου Τοπογράφου Μηχανικού και Εκτιμητή Ακινήτων. 35

48 Κ ε φ ά λ α ι ο 3 ο διαδικασία συλλογής των δεδομένων και η επεξεργασία τους πραγματοποιείται σε πέντε ξεχωριστά σύνολα δεδομένων τα οποία ως μονάδα έχουν το διαμέρισμα αλλά πρόκειται για διακριτά σύνολα. Παρόλο που η κάθε περιοχή έχει τα δικά της χαρακτηριστικά γνωρίσματα και ιδιαιτερότητες όσον αφορά τη θέση τους και τα πολεοδομικά τους χαρακτηριστικά, οι ιδιοκτησίες έχουν την ίδια ακριβώς λογική. Πρόκειται για περιοχές με πολυώροφες οικοδομές, οι οποίες εμπεριέχουν ένα μεγάλο αριθμό οριζόντιων ιδιοκτησιών η κάθε μία και η τιμή τους εξαρτάται από τους ίδιου παράγοντες. Παρόλα αυτά εξετάζοντας τα δεδομένα που παρέχονται από τους δύο ιστότοπους προκύπτει το συμπέρασμα ότι η υπάρχει μία σχετική ομοιομορφία στα δεδομένα τους. Με άλλα λόγια οι περισσότερες μεταβλητές είναι κοινές και για τις δύο πόλεις, ενώ υπάρχουν και κάποιες μεταβλητές οι οποίες βρίσκονται μόνο στη μία ή μόνο στην άλλη πόλη. Για αυτό το λόγο επιλέγεται να δημιουργηθούν δύο διαφορετικά μοντέλα μεταβλητών, ένα για κάθε πόλη, προκειμένου να είναι αντιπροσωπευτικά και να εξεταστεί η κάθε πόλη μεμονωμένα ανάλογα με τις ιδιαιτερότητες της, όσον αφορά την αγορά ακινήτων. Συνεπώς, η επιλογή των τελικών ανεξάρτητων μεταβλητών θα είναι μίας μορφής για τα δύο σύνολα της Θεσσαλονίκης και μίας άλλης μορφής για τα τρία σύνολα της Βαρκελώνης. Η σύγκριση των στατιστικών αποτελεσμάτων που θα προκύψουν από το μαθηματικό μοντέλο θα αποτελεί ταυτόχρονα ένα ιδιαίτερα ενδιαφέρον αντικείμενο σχολιασμού αφού από τη μία μεριά θα φανούν με άμεσο τρόπο οι ομοιότητες και διαφορές της αγοράς ακινήτων στις δύο ευρωπαϊκές πόλεις και από την άλλη μεριά θα εντοπιστούν οι ομοιότητες και διαφορές μεταξύ των περιοχών μελέτης της κάθε πόλης ξεχωριστά. Επίσης, πρέπει να γίνει σαφές από την αρχή του κεφαλαίου ότι η επιλογή των μεταβλητών στηρίζεται στην σκοπιά με την οποία προσεγγίζεται το θέμα θεωρητικά. Η ανάλυση που θα ακολουθήσει και η μαθηματική προσέγγιση του προβλήματος θα δείξουν στην πραγματικότητα, ποιες από τις μεταβλητές επηρεάζουν την αγοραία αξία των διαμερισμάτων των δειγμάτων και ποιες είναι ικανές να δημιουργήσουν ένα όσο το δυνατό πιο ισχυρό μοντέλο για την μετέπειτα πρόβλεψη αξιών ακινήτων. Ο αριθμός των ανεξάρτητων μεταβλητών που θα συμμετέχουν στην παρούσα μελέτη είναι συνολικά οκτώ για την Θεσσαλονίκη και εννέα για τη Βαρκελώνη. Οι μεταβλητές συγκεντρώνονται έπειτα από τη μελέτη της βιβλιογραφίας και από τα δεδομένα που είναι διαθέσιμα στις ιστοσελίδες των ηλεκτρονικών αγγελιών. Πρόκειται για τις ανεξάρτητες μεταβλητές, δηλαδή τις μεταβλητές εκείνες που θεωρούμε ότι επιδρούν στην εξαρτημένη μεταβλητή (αγοραία αξία ακινήτων) και αποτελούν την αιτία που επηρεάζουν τη συμπεριφορά της (Λαφαζάνη,2010). Οι προαναφερθείσες μεταβλητές φαίνονται στους πίνακες 3.1 και 3.2. Μεταπτυχιακή διατριβή 36

49 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Πίνακας 3.1: Ανεξάρτητες μεταβλητές των οποίων η επίδραση στην αγοραία αξία των ακινήτων εξετάζεται για την πόλη της Θεσσαλονίκης Σύνολο ανεξάρτητων μεταβλητών 1 Εμβαδόν 2 Παλαιότητα 3 Όροφος 4 Θέση Διαμερίσματος/Γωνιακό ή όχι 5 Ύπαρξη ή απουσία ανελκυστήρα 6 Είδος Θέρμανσης 7 Κατάσταση ακινήτου 8 Ύπαρξη ή όχι θέσης στάθμευσης Πίνακας 3.2: Ανεξάρτητες μεταβλητές των οποίων η επίδραση στην αγοραία αξία των ακινήτων εξετάζεται για την πόλη της Βαρκελώνης Σύνολο ανεξάρτητων μεταβλητών 1 Εμβαδόν 2 Παλαιότητα 3 Όροφος 4 Ύπαρξη ή απουσία ανελκυστήρα 5 Είδος Θέρμανσης 6 Κατάσταση ακινήτου 7 Ύπαρξη ή όχι θέσης στάθμευσης 8 Αριθμός Δωματίων 9 Αριθμός Μπάνιων Όπως είναι ορατό από τους παραπάνω πίνακες, οι μεταβλητές που διαφέρουν μεταξύ των δύο πόλεων είναι οι ακόλουθες: 1. Θέση διαμερίσματος/γωνιακό ή όχι: Πρόκειται για ένα παράγοντα επίδρασης της αξίας ενός ακινήτου, ο οποίος επισημαίνεται πάντα στα χαρακτηριστικά των διαμερισμάτων της Θεσσαλονίκης και καθόλου στην πόλη της Βαρκελώνης. Πρόκειται για μία μεταβλητή που κρίνοντας από την αναφορά της στον ισπανικό ιστότοπο δεν διαδραματίζει τόσο σημαντικό ρόλο στη διαμόρφωση αξιών των διαμερισμάτων, όσο στην πόλη της Θεσσαλονίκης. 2. Αριθμός Δωματίων: Πρόκειται για ένα παράγοντα διαμόρφωσης της αξίας, ο οποίος υπάρχει ως πληροφορία και στις δύο πόλεις, με τη διαφορά ότι οι τιμές που δέχεται στην περιοχή της Βαρκελώνης παρουσιάζουν ποικιλομορφία και άρα φαίνεται να επιδρούν σημαντικά στη διαμόρφωση της αξίας των ακινήτων. Στις δύο περιοχές μελέτης της Θεσσαλονίκης τα διαμερίσματα διαθέτουν στη μεγαλύτερη 37

50 Κ ε φ ά λ α ι ο 3 ο πλειοψηφία τους δύο δωμάτια, σε αντίθεση με τα διαμερίσματα της Βαρκελώνης που έχουν μεγαλύτερα εμβαδά και διαφορετική διάταξη. 3. Αριθμός Μπάνιων: Όμοια για το συγκεκριμένο χαρακτηριστικό των διαμερισμάτων της Βαρκελώνης παρατηρούνται τιμές από ένα έως και τρία μπάνια με τιμές οι οποίες μοιράζονται σχεδόν ισόποσα στο μέγεθος των δειγμάτων. Αντίθετα, το τμήμα του κέντρου που επιλέγεται για το Δήμο Θεσσαλονίκης και ο πρώην Δήμος Ευόσμου έχουν στη μεγάλη πλειοψηφία τους μόνο ένα μπάνιο. Συνεπώς, πρόκειται για μία μεταβλητή που φαίνεται να επιδρά στη διαμόρφωση των αξιών μόνο της μία πόλης. Παρακάτω δίνονται τα γενικότερα χαρακτηριστικά της εξαρτημένης και των ανεξάρτητων μεταβλητών και περιγράφονται οι ποσοτικοποιήσεις που πραγματοποιούνται στην παρούσα εφαρμογή. Αγοραία αξία: Πρόκειται για μία συνεχή ποσοτική μεταβλητή, η οποία μετριέται σε χιλιάδες ευρώ, δηλαδή αναφέρεται στο συνολικό ποσό πώλησης και όχι στην τιμή ανά τμ. Εμβαδόν: Πρόκειται για μία συνεχή ποσοτική μεταβλητή, η οποία ως μονάδα μέτρησης έχει τα τετραγωνικά μέτρα (τμ). Στη συγκεκριμένη μεταβλητή, δίνεται κάθε φορά η τιμή που εμφανίζεται στην αντίστοιχη ιστοσελίδα, χωρίς δυστυχώς να γίνεται σαφές στην πηγή δεδομένων εάν αναφέρεται στο καθαρό ή μεικτό εμβαδόν του διαμερίσματος. Παλαιότητα: Είναι επίσης μία συνεχής ποσοτική μεταβλητή, διότι αφορά το χρόνο με μονάδα μέτρησης τα έτη που πέρασαν από τη χρονιά που αποπερατώθηκε η κατασκευή της οικοδομής. Το διαδίκτυο ως τιμή παλαιότητας δίνει πάντοτε τη χρονιά ανέγερσης της οικοδομής, δεδομένο όμως που επεξεργάζεται στη συνέχεια για να δοθεί ως τιμή μεταβλητής ο αριθμός των ετών. Όπως γίνεται κατανοητό και θα φανεί παρακάτω από τις εξισώσεις που προκύπτουν, πρόκειται για μία μεταβλητή που συσχετίζεται αρνητικά με την εξαρτημένη μεταβλητή του μοντέλου, διότι όσο αυξάνεται η τιμή της παλαιότητας, τόσο μειώνεται και η αγοραία αξία του διαμερίσματος. Όροφος: Η μεταβλητή που αναφέρεται στον όροφο είναι μία ποιοτική μεταβλητή, η οποία παραμένει στατιστικά επεξεργάσιμη έπειτα από την ποσοτικοποίηση της βάσει συγκεκριμένων κριτηρίων. Πιο συγκεκριμένα, τα διαμερίσματα που βρίσκονται στο ισόγειο ή στον ημιώροφο οικοδομής παίρνουν την τιμή ένα (1), ο πρώτος όροφος παίρνει την τιμή δύο (2), ο δεύτερος όροφος την τιμή τρία (3) κ.ο.κ. Τέλος, τα διαμερίσματα που αποτελούν εσοχές οικοδομής (ρετιρέ) δέχονται δύο επιπλέον μονάδες σε σχέση με τον όροφο που ήδη τοποθετούνται, διότι πρόκειται για διαμερίσματα που έχουν στη γενική περίπτωση καλύτερη θέα, μεγάλο μπαλκόνι σε σχέση με όλα τα άλλα διαμερίσματα της οικοδομής και κατά συνέπεια η αξία τους ανά τετραγωνικό μέτρο είναι μεγαλύτερη. Η ιδιαιτερότητα των ρετιρέ εντοπίζεται μόνο στην Θεσσαλονίκη και όχι στη Βαρκελώνη (τουλάχιστον όσον αφορά το δείγμα που συλλέχθηκε). Μεταπτυχιακή διατριβή 38

51 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Ανελκυστήρας: Πρόκειται για μία δίτιμη ονομαστική μεταβλητή, η οποία παίρνει ως τιμές, την ύπαρξη ανελκυστήρα στην οικοδομή και τη μη ύπαρξη. Για να μπορέσει να συμμετέχει σε στατιστική ανάλυση μία τέτοιου είδους μεταβλητή θα πρέπει να γίνει η ποσοτικοποίηση της με τρόπο ώστε να αντιστοιχίζεται ένας αριθμός σε κάθε μία από τις δύο περιπτώσεις, οι μεταβλητές αυτής της κατηγορίας χαρακτηρίζονται ως ψευδομεταβλητές (dummy variables). Οι τιμές που δίνονται είναι αντίστοιχα 0 και 1 (0 για τη μη ύπαρξη ανελκυστήρα και 1 για την ύπαρξη ανελκυστήρα). Πρόκειται για μία μεταβλητή της οποίας η επίδραση αναμένεται να είναι μεγαλύτερη στα κέντρα των δύο πόλεων, καθώς λόγω παλαιότητας των οικοδομών (μη σύγχρονες οικοδομές άρα περισσότερες πιθανότητες για απουσία ανελκυστήρα) η διασπορά των τιμών που δέχεται η μεταβλητή πιθανολογείται να είναι σημαντική. Θέση Διαμερίσματος/Γωνιακό ή όχι: Όμοια με την παραπάνω μεταβλητή, η θέση του διαμερίσματος είναι μία δίτιμη ονομαστική μεταβλητή, η οποία ως πληροφορία δίνει τη θέση του διαμερίσματος σε σχέση με την οικοδομή για τα κτίρια φυσικά που είναι τοποθετημένα στη γωνία των οικοδομικών τετραγώνων στα οποία ανήκουν. Όπως η θέση ενός οικοπέδου στο οικοδομικό τετράγωνο (δηλαδή εάν είναι γωνιακό, μεσαίο, τυφλό κλπ) είναι σημαντική, με όμοιο τρόπο η θέση ενός διαμερίσματος στην οικοδομή είναι εξίσου σημαντική για τη διαμόρφωση της αξίας του και κατά συνέπεια και της τιμής πώλησης του. Το διαμέρισμα που έχει πρόσωπο σε οδό έχει σαφέστατα μεγαλύτερη αξία σε σχέση με ένα διαμέρισμα ίδιων τετραγωνικών μέτρων, του ίδιου ορόφου που βλέπει στον ακάλυπτο χώρο 13. Με όμοιο τρόπο τα διαμερίσματα που έχουν πρόσωπο σε δύο οδούς είναι μεγαλύτερης αξίας σε σχέση με αυτά που δεν είναι γωνιακά. Κατά τη συγκριτική μέθοδο εκτίμησης των διαμερισμάτων λαμβάνεται πάντοτε υπόψη το συγκεκριμένο χαρακτηριστικό, συνεπώς κρίνεται σημαντική η συμμετοχή της συγκεκριμένης μεταβλητής στο μοντέλο της Θεσσαλονίκης και άρα άξια μελέτης η επίδραση που μπορεί να έχει στη διαμόρφωση των αγοραίων αξιών των ακινήτων. Θέρμανση: Η μεταβλητή που αφορά το είδος θέρμανσης του κάθε διαμερίσματος είναι μία ποιοτική μεταβλητή που παίρνει παραπάνω από δύο διακριτές τιμές και μετριέται σε τακτική κλίμακα. Τα διαμερίσματα αρχικά ιεραρχούνται ως προς το είδος θέρμανσης που διαθέτουν και στη συνέχεια πραγματοποιείται η ποσοτικοποίηση τους. Για να γίνει αυτού του είδους η ποσοτικοποίηση μελετούνται τα δύο δείγματα της Θεσσαλονίκης, έπειτα τα τρία δείγματα της Βαρκελώνης και κρίνεται η σχετική κατάταξη που θα πραγματοποιηθεί. Για την πόλη της Θεσσαλονίκης η μεταβλητή θέρμανση διακρίνεται στις κατηγορίες «Καθόλου θέρμανση», «Κεντρική θέρμανση», «Αυτόνομη θέρμανση» και τέλος «Αυτόνομη θέρμανση με ταυτόχρονη παρουσία τζακιού». Οι τέσσερις ψευδομεταβλητές που δημιουργούνται αντιστοιχίζονται για τις δύο περιοχές μελέτης της Θεσσαλονίκης στις τιμές 0, 1, 2, 3 αντίστοιχα. Όσον αφορά την πόλη της Βαρκελώνης, η μεταβλητή «θέρμανση» διακρίνεται στα κατηγορίες «Καθόλου θέρμανση», «Κλιματισμός», «Θέρμανση» (πετρέλαιο ή φυσικό 13 Η μόνη πληροφορία που αφορά τη θέση της οριζόντιας ιδιοκτησίας στην οικοδομή είναι η μεταβλητή «γωνιακό διαμέρισμα ή όχι». Για παράδειγμα, δεν υπήρξε εφικτή η συλλογή δεδομένων για το εάν ένα διαμέρισμα «βλέπει στην κεντρική οδό ή στον ακάλυπτο χώρο της οικοδομής. 39

52 Κ ε φ ά λ α ι ο 3 ο αέριο)και «Θέρμανση και κλιματισμός» με αύξουσα σειρά από τη δυσμενέστερη προς την ευμενέστερη περίπτωση. Οι συγκεκριμένες κατηγορίες διαμορφώνονται σύμφωνα με την παρεχόμενη πληροφορία από τον ιστότοπο που αναφέρεται στα διαμερίσματα της Βαρκελώνης. Οι αντίστοιχες τέσσερις ψευδομεταβλητές που δημιουργούνται αντιστοιχίζονται για τις τρεις περιοχές μελέτης της Βαρκελώνης στις τιμές 0, 1, 2, 3 αντίστοιχα. Συμπερασματικά τα διαμερίσματα διαχωρίζονται ως προς τη μεταβλητή «θέρμανση» σε διαφορετικές μεταξύ τους κατηγορίες ανάλογα με την περιοχή μελέτης. Επιβεβαιώνεται για ακόμη μία φορά το γεγονός ότι τα ιδιαίτερα χαρακτηριστικά γνωρίσματα της κάθε περιοχής οδηγούν σε διαφορετικές τιμές των μεταβλητών. Κατάσταση Ακινήτου: Η μεταβλητή «κατάσταση ακινήτου» επιλέγεται να χρησιμοποιηθεί διότι κρίνεται ιδιαιτέρως σημαντική η επίδραση της στη διαμόρφωση της αγοραίας αξίας των ακινήτων. Όπως είναι γνωστό για να γίνει εκτίμηση ενός ακινήτου είναι απαραίτητη η επίσκεψη στο ακίνητο με σκοπό την καταγραφή της υπάρχουσας κατάστασης, του βαθμού συντήρησης του διαμερίσματος και γενικότερα την «αίσθηση» που αυτό αφήνει στον εκτιμητή. Στην παρούσα έρευνα μία τέτοια διαδικασία δεν ήταν εφικτό να πραγματοποιηθεί. Παρόλα αυτά έγινε πολύ σύντομα αντιληπτό ότι κυρίως στην περιοχή του κέντρου της Θεσσαλονίκης και της Βαρκελώνης υπήρχε ανεξάρτητα από την παλαιότητα του ακινήτου μεγάλη ποικιλομορφία και διαφορετικός βαθμός συντήρησης των διαμερισμάτων. Όπως είναι λογικό δυο γειτονικά διαμερίσματα στην ίδια οικοδομή έχουν μεγάλη διαφορά στην αξία τους ανά τμ, όταν το ένα από τα δύο έχει καινούρια κουφώματα, πόρτα ασφαλείας, ανακαινισμένα δάπεδα, μπάνιο, συντήρηση υδραυλικών και ηλεκτρικών εγκαταστάσεων κλπ., ενώ το άλλο είναι ακριβώς όπως ήταν πριν σαράντα ή πενήντα χρόνια (για οικοδομές μεγάλης ηλικίας). Μπορεί με άλλα λόγια να έχει λιγότερη βαρύτητα στη διαμόρφωση της αγοραίας αξίας ενός διαμερίσματος η παλαιότητα της οικοδομής, όταν ο αγοραστής επιλέγει ένα πλήρως ανακαινισμένο διαμέρισμα στο κέντρο της πόλης, με όλα τα θετικά όπου αυτό συνεπάγεται κυρίως για ειδικές κατηγορίες ατόμων όπως οι φοιτητές. Κρίνεται απαραίτητη λοιπόν η συμμετοχή της παραπάνω μεταβλητής ενώ οι τιμές που επιλέγεται να παίρνει περιγράφονται αναλυτικά παρακάτω. Αρχικά, πρόκειται για μία πολυμερή ποιοτική μεταβλητή που παίρνει παραπάνω από δύο διακριτές τιμές, η ποσοτικοποίηση των οποίων πραγματοποιείται με υποκειμενικά κριτήρια. Οι κατηγορίες όπου διακρίνεται η κατάσταση του ακινήτου είναι «κακή κατάσταση», «μέτρια κατάσταση», «καλή κατάσταση» και «πολύ καλή κατάσταση». Το κριτήριο για τον παραπάνω διαχωρισμό είναι η εικόνα που παρουσιάζει το ακίνητο στο φωτογραφικό υλικό 14 που υπάρχει στην ηλεκτρονική αγγελία του και τα σημεία που οδηγούν στην τελική απόφαση είναι η γενική εντύπωση που αφήνει το ακίνητο, η ύπαρξη ή όχι καινούριων κουφωμάτων, εσωτερικών πορτών, πόρτας ασφαλείας, δαπέδων (όπου αυτό κρίνεται απαραίτητο), η ποιότητα της κουζίνας και του μπάνιου και τέλος η εικόνα που ο ιδιοκτήτης επιλέγει να προβάλλει για το ακίνητο του. Ένα πλήρως ανακαινισμένο διαμέρισμα άμεσα κατατάσσεται στην κατηγορία «πολύ καλή κατάσταση», ένα παλαιό και 14 Για τον παραπάνω λόγο δεν συμμετείχε στο μοντέλο κανένα ακίνητο, το οποίο δεν είχε επισυναπτόμενες φωτογραφίες του εσωτερικού του χώρου Μεταπτυχιακή διατριβή 40

53 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η σε πολύ κακή κατάσταση συντήρησης κατατάσσεται στην κατηγορία «σε κακή κατάσταση», ενώ για την επιλογή σε μέτρια ή καλή κατάσταση γίνεται επιλογή βάσει του βαθμού ικανοποίησης των παραπάνω κριτηρίων. Για την ποσοτικοποίηση της μεταβλητής δημιουργούνται ισάριθμες με το πλήθος των κατηγοριών της ονομαστικής μεταβλητής ψευδομεταβλητές με την ακόλουθη αντιστοίχιση τιμών : Κακή κατάσταση Τιμή 1 Μέτρια κατάσταση Τιμή 2 Καλή κατάσταση Τιμή 3 Πολύ καλή κατάσταση Τιμή 4 Σημαντικό είναι να σημειωθεί ότι για τον έλεγχο της ποσοτικοποίησης που πραγματοποιείται έγιναν ορισμένες απαραίτητες δοκιμές ώστε να προκύψει η επικρατέστερη βάσει της επίδρασης στο μοντέλο και να ακολουθήσει στη συνέχεια η ίδια λογική και στα πέντε μοντέλα της εφαρμογής. Στάθμευση: Πρόκειται για μία κοινή για τις πέντε περιοχές μελέτης μεταβλητή, η οποία ανήκει στην κατηγορία των δίτιμων ποιοτικών μεταβλητών και χρίζει ποσοτικοποίησης. Η τιμή των ψευδομεταβλητών, όπως αναφέρθηκε και παραπάνω είναι 0 και 1 για την περίπτωση μη ύπαρξης και ύπαρξης στάθμευσης αντίστοιχα. Η μεταβλητή της στάθμευσης κρίνεται απαραίτητο να ενταχθεί στο σχηματισμό του μοντέλου, καθώς στην πόλη της Θεσσαλονίκης και της Βαρκελώνης, όπως και σε πολλές άλλες μεγάλες πόλεις, η στάθμευση των οχημάτων αποτελεί ένα ουσιαστικό πρόβλημα. Είναι εύλογο συνεπώς, ο εκάστοτε αγοραστής να επιδιώκει να βρει κατοικία με δική της θέσης στάθμευσης και φυσικά να αποζημιώνει το συγκεκριμένο προνόμιο. Από τη μελέτη των δύο δειγμάτων παρατηρείται ότι το 87% των διαμερισμάτων στην περιοχή του Ευόσμου έχουν θέση στάθμευσης, το 3% μόνο των διαμερισμάτων στην περιοχή του κέντρου της Θεσσαλονίκης, το 9% στην περιοχή Eixample το 7% στην περιοχή Sant Marti και το 29% στην Badalona. Αριθμός Δωματίων: Η μεταβλητή που αναφέρεται στον αριθμό των δωματίων είναι μία συνεχής ποσοτική μεταβλητή, η οποία χρησιμοποιείται μόνο στις τρεις περιοχές μελέτης της Βαρκελώνης και δέχεται ως τιμές τους ακέραιους αριθμούς που αναφέρονται στα αριθμό των δωματίων του κάθε διαμερίσματος (υπνοδωμάτια, αποθήκες κλπ). Αριθμός Μπάνιων: Όμοια, η μεταβλητή που αναφέρεται στον αριθμό των μπάνιων είναι μία συνεχής ποσοτική μεταβλητή, η οποία χρησιμοποιείται μόνο στις τρεις περιοχές μελέτης της Βαρκελώνης και λαμβάνει τιμές, όπως αυτές δίνονται από τον αντίστοιχο ιστότοπο

54 Κ ε φ ά λ α ι ο 3 ο Σύμφωνα με αντίστοιχη μεθοδολογία που εφαρμόζεται στην περιοχή των Μεσογείων Αττικής, λαμβάνονται επιπλέον ανεξάρτητες μεταβλητές, όπως θέα της ιδιοκτησίας, τζάκι, σοφίτα, πισίνα και εάν είναι ή όχι διαμπερές. (Παπαευθυμίου κα., 2010) Στη στατιστική ανάλυση που ακολουθεί δεν εισάγονται μεταβλητές, όπως το τζάκι (0,1), η σοφίτα (0,1)και η πισίνα(0,1), διότι πρώτον δεν υφίστανται τα συγκεκριμένα χαρακτηριστικά στις επιλεγείσες περιοχές μελέτης και δεύτερον διότι οι παραπάνω πληροφορίες δεν είναι διαθέσιμες από τον ιστότοπο που αποτελεί την πηγή των δεδομένων. Όπως γίνεται αντιληπτό, η κάθε εφαρμογή που αφορά εκτιμήσεις ακινήτων είναι μοναδική και εξαρτάται από τα ιδιαίτερα χαρακτηριστικά της κάθε περιοχής και από την πηγή των απαραίτητων πληροφοριών. Συγκεντρωτικά, οι μεταβλητές που συμμετέχουν στο μοντέλο και για τις δύο πόλεις μαζί με τις ποσοτικοποιήσεις τους παρουσιάζονται στους ακόλουθους πίνακες: Πίνακας3.3: Μεταβλητές που συμμετέχουν στο μοντέλο για την πόλη της Θεσσαλονίκης Μεταβλητές Περιγραφή Τιμές 1. Μεταβλητή [Χ1] Εμβαδόν ακινήτου Τετραγωνικά μέτρα 2. Μεταβλητή [Χ2] Παλαιότητα Έτος ανέγερσης 3. Μεταβλητή [Χ3] Όροφος Αριθμός ορόφου 4. Μεταβλητή [Χ4] Γωνιακό διαμέρισμα Υφίσταται = 1 Δεν υφίσταται = 0 5. Μεταβλητή [Χ5] Ανελκυστήρας Υφίσταται = 1 Δεν υφίσταται = 0 6. Μεταβλητή [Χ6] Είδος θέρμανσης Καθόλου θέρμανση = 0 Κεντρική θέρμανση = 1 Αυτόνομη θέρμανση = 2 Αυτόνομη θέρμανση με τζάκι = 3 7. Μεταβλητή [Χ7] Κατάσταση ακινήτου Κακή κατάσταση = 1 Μέτρια κατάσταση = 2 Καλή κατάσταση = 3 Πολύ καλή κατάσταση = 4 8. Μεταβλητή [Χ8] Θέση στάθμευσης Υφίσταται = 1 Δεν υφίσταται = 0 Μεταπτυχιακή διατριβή 42

55 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η Πίνακας3.4: Μεταβλητές που συμμετέχουν στο μοντέλο για την πόλη της Βαρκελώνης Μεταβλητές Περιγραφή Τιμές 1. Μεταβλητή [AREA] Εμβαδόν ακινήτου Τετραγωνικά μέτρα 2. Μεταβλητή [AGE] Παλαιότητα Έτος ανέγερσης 3. Μεταβλητή [FLOOR] Όροφος Αριθμός ορόφου 4. Μεταβλητή [ELEV] Ανελκυστήρας Υφίσταται = 1 Δεν υφίσταται = 0 5. Μεταβλητή [HEATING] Είδος θέρμανσης Καθόλου θέρμανση = 0 Κλιματισμός = 1 Θέρμανση = 2 Θέρμανση και Κλιματισμός = 3 6. Μεταβλητή [QUALITY] Κατάσταση ακινήτου Κακή κατάσταση = 1 Μέτρια κατάσταση = 2 Καλή κατάσταση = 3 Πολύ καλή κατάσταση = 4 7. Μεταβλητή [PARKING] Θέση στάθμευσης Υφίσταται = 1 Δεν υφίσταται = 0 8. Μεταβλητή [ROOM] Αριθμός Δωματίων Αριθμός Δωματίων 9. Μεταβλητή [BATH] Αριθμός Μπάνιων Αριθμός Μπάνιων Μεθοδολογικό πλαίσιο Περιεκτικά η κύρια μεθοδολογία της παρούσας εφαρμογής βασίζεται στην παρακάτω συλλογιστική πορεία που αποτυπώνεται με διαγραμματικό τρόπο. Η μεθοδολογία χωρίζεται σε τρία βασικά σκέλη. Πρώτο μέρος της διαδικασίας αποτελεί η προεργασία της στατιστικής μελέτης. Προσδιορισμός μεταβλητών, συλλογή δείγματος, εύρεση κατάλληλης μεθόδου ανάλυσης, επιλογή στατιστικού λογισμικού και επεξεργασία των δεδομένων του δείγματος ώστε να είναι έτοιμα για επεξεργασία. Δεύτερο σκέλος αποτελεί η διαδικασία που μεσολαβεί από την πρώτη προσέγγιση του μοντέλου, με την εκτέλεση της πολλαπλής γραμμικής παλινδρόμησης, μέχρι την επιλογή του τελικού που να πληρεί όλες οι παραδοχές του γραμμικού μοντέλου. Πιο αναλυτικά, οι έλεγχοι που πρέπει να γίνουν αφορούν τη σημαντικότητα των ανεξάρτητων μεταβλητών, την ανεξαρτησία των οντοτήτων, τον έλεγχο πολυσυγγραμικότητας, κανονικότητας, σταθερότητας των διακυμάνσεων, τον έλεγχο γραμμικότητας, τον εντοπισμό των ακραίων οντοτήτων ή οντοτήτων επίδρασης και τέλος τον έλεγχο της προβλεπτικής δύναμης του μοντέλου. Τέλος, το τρίτο στάδιο της εφαρμογής αποτελεί η χωρική απεικόνιση του δείγματος και η εφαρμογή της μεθόδου σε περιβάλλον Γεωγραφικών Συστημάτων Πληροφοριών Η διαδικασία περιγράφεται αναλυτικά στο έκτο κεφάλαιο της διατριβής. 43

56 Κ ε φ ά λ α ι ο 3 ο ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΠΡΟΒΛΗΜΑΤΟΣ Μελέτη Θεωριών περί Εκτιμήσεως ακινήτων Έρευνα κατάλληλης πηγής δεδομένων για το δείγμα ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΜΕΤΑΒΛΗΤΩΝ ΚΑΙ ΣΥΛΛΟΓΗ ΔΕΙΓΜΑΤΟΣ Μελέτη Θεωριών περί στατιστικ ής ανάλυση ς ΕΥΡΕΣΗ ΚΑΤΑΛΛΗΛΗΣ ΜΕΘΟΔΟΥ ΑΝΑΛΥΣΗΣ Απαιτείται πολυμεταβλητή ανάλυση ΕΦΑΡΜΟΓΗ ΠΟΛΛΑΠΛΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΥΠΟΨΗΦΙΟ ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ Δημιουργία κατάλληλης Βάσης Δεδομένων Διαδοχικές προσεγγίσεις και επαναπροσδιορισμος των μεταβλητών ΠΡΩΤΗ ΠΡΟΣΕΓΓΙΣΗ ΕΛΕΓΧΟΙ ΑΚΡΑΙΩΝ ΤΙΜΩΝ 1. ΣΗΜΑΝΤΙΚΟΤΗΤΑ ΑΝΕΞΑΡΤΗΤΩΝ ΜΕΤΑΒΛΗΤΩΝ 2. ΑΝΕΞΑΡΤΗΣΙΑ ΟΝΤΟΤΗΤΩΝ 3. ΠΟΛΥΣΥΓΓΡΑΜΙΚΟΤΗΤΑ / ΣΥΓΓΡΑΜΙΚΟΤΗΤΑ 4. ΚΑΝΟΝΙΚΟΤΗΤΑ 5. ΣΤΑΘΕΡΟΤΗΤΑ ΔΙΑΚΥΜΑΝΣΕΩΝ 6. ΓΡΑΜΜΙΚΟΤΗΤΑ 7. ΑΚΡΑΙΕΣ ΟΝΤΟΤΗΤΕΣ ΚΑΙ ΟΝΤΟΤΗΤΕΣ ΕΠΙΔΡΑΣΗΣ ΕΛΕΓΧΟΙ ΠΡΟΒΛΕΠΤΙΚΗΣ ΙΚΑΝΟΤΗΤΑΣ ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΩΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ / OLS ArcGIS Μεταπτυχιακή διατριβή 44

57 Σ τ α τ ι σ τ ι κ ή π ρ ο σ έ γ γ ι σ η 3.3 ΣΥΜΠΕΡΑΣΜΑΤΑ Η εύρεση της αγοραστικής αξίας ενός ακινήτου με αντικειμενικά κριτήρια είναι από μόνη της μία πολύπλοκη και λεπτομερής διαδικασία που για να προσεγγιστεί με τον καλύτερο δυνατό τρόπο πρέπει να καλύπτονται πολλές προϋποθέσεις. Είναι απαραίτητη η συλλογή ενός μεγάλου αριθμού πληροφοριών σχετικά με τα γενικά και ειδικά χαρακτηριστικά του ακινήτου, είναι απαραίτητη η αυτοψία και η μελέτη της κτηματαγοράς. Συνεπώς, η εύρεση της κατάλληλης μεθοδολογίας που θα οδηγήσει σε μία πολύ καλή προεκτίμηση της αξίας είναι ομοίως πολύ πολύπλοκη. Από τη μελέτη της σχετικής βιβλιογραφίας περί εκτιμήσεων ακινήτων και της μεθοδολογίας ανάλυσης των δεδομένων θεωρείται ότι έγινε μία ιδιαίτερα ικανοποιητική προσπάθεια επιλογής ενός σημαντικού αριθμού κατάλληλων μεταβλητών (λαμβάνοντας υπόψη την έλλειψη τέτοιου είδους πληροφοριών στον ελλαδικό χώρο) αλλά και κατάλληλης στατιστικής μεθόδου για την προσέγγιση του επιθυμητού αποτελέσματος. Ένα μειονέκτημα της προσπάθειας είναι αδιαμφισβήτητα το μέγεθος του δείγματος. Κατά τη διάρκεια λήψης του, εμφανίζεται μία σειρά παραγόντων που αποτελούν τροχοπέδη στην εύρεση μεγαλύτερου αριθμού ακινήτων. Αρχικά, πρόβλημα αποτελεί το μέγεθος των περιοχών μελέτης, διότι βάσει μεθοδολογίας οφείλει να είναι όσο το δυνατό μικρότερο για την ύπαρξη σχετικής χωρικής ομοιομορφίας και για την ύπαρξη κοινών γενικών χαρακτηριστικών. Περιορισμός στην έκταση των περιοχών, συνεπάγεται μείωση των προς πώληση διαμερισμάτων στη συγκεκριμένη περιοχή, άρα μικρότερο δείγμα. Εμπόδιο παράλληλα αποτελούν οι βασικές παραδοχές που τίθενται βάσει μεθοδολογίας. Η πληρότητα των παραγόντων που αναφέρονται παραπάνω, δηλαδή πληρότητα στις τιμές των μεταβλητών, απόδοση θέσης και ύπαρξη φωτογραφικού υλικού, μειώνουν τον αριθμό του δείγματος, αλλά βοηθούν στο σχηματισμό ενός δείγματος πιο αξιόπιστου και ικανού να δώσει απαντήσεις στα ερωτήματα. 45

58 ΚΕΦΑΛΑΙΟ 4 Ο ΔΗΜΙΟΥΡΓΙΑ ΜΑΘΗΜΑΤΙΚΟΥ ΜΟΝΤΕΛΟΥ ΜΕΣΩ ΤΗΣ ΠΟΛΛΑΠΛΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΜΕ ΣΚΟΠΟ ΤΟΝ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟ ΥΠΟΛΟΓΙΣΜΟ ΤΗΣ ΑΓΟΡΑΙΑΣ ΑΞΙΑΣ ΤΩΝ ΔΙΑΜΕΡΙΣΜΑΤΩΝ ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΠΟΛΗ ΤΗΣ ΘΕΣΣΑΛΟΝΚΗΣ Η στατιστική ανάλυση δεδομένων υλοποιείται με τη βοήθεια των στατιστικών μεθόδων και με τη χρήση των κατάλληλων λογισμικών. Ωστόσο, στην πράξη δεν καθοδηγείται από αυτά, αλλά δημιουργείται και ελέγχεται με ενεργητικό τρόπο από τον εκάστοτε ερευνητή. Ποιος είναι ο αντικειμενικός στόχος; Ποια είναι τα δεδομένα που πρέπει να συλλεχθούν βάσει αυτού; Σε ποια ερωτήματα δίνουν απάντηση αυτά τα δεδομένα; Ο ερευνητής κατά τη διάρκεια της ανάλυσης έρχεται αντιμέτωπος με μία σειρά αποφάσεων που πρέπει να λάβει. Οι περισσότερες από τις οποίες πρέπει να δικαιολογούνται και να αναλύονται προσεκτικά. Ωστόσο, άλλες αποφάσεις επιλέγονται αυθαίρετα, καθώς δεν υπάρχει μόνο μία σωστή οδός, αλλά αντίθετα ένα πλήθος εξίσου αποδεκτών εναλλακτικών λύσεων. (Howitt & Cramer, 2006) Στο κεφάλαιο που ακολουθεί γίνεται μία προσπάθεια παρουσίασης όλης της διαδικασίας εκτέλεσης μίας πολλαπλής γραμμικής παλινδρόμησης σε περιβάλλον SPSS και παρουσιάζονται όλες οι παραδοχές, προϋποθέσεις και βήματα που απαιτούνται ώστε να επιλεγούν έπειτα από προσεγγίσεις οι τελικές εξισώσεις των δύο μοντέλων και η ερμηνεία τους. Λαμβάνονται επίσης αποφάσεις κατά τη διάρκεια της στατιστικής ανάλυσης, οι οποίες στηρίζονται σε βασικές αρχές της στατιστικής, αλλά και σε δοκιμές που λαμβάνουν χώρα ώστε να ακολουθείται κάθε φορά η βέλτιστη οδός. Από την ερμηνεία του μοντέλου στόχος είναι, με τη βοήθεια ενός πλήθους γραφημάτων, πινάκων και δεικτών να γίνει 46

59 Κ ε φ ά λ α ι ο 4 ο κατανοητή η επίδραση της κάθε μεταβλητής στην διαμόρφωση της αγοραίας αξίας των ακινήτων. 4.1 ΠΕΡΙΒΑΛΛΟΝ ΕΡΓΑΣΙΑΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΦΑΡΜΟΓΗ SPSS Η στατιστική χρησιμοποιείται σήμερα ολοένα και περισσότερο σε όλες τις επιστήμες κοινωνικού, οικονομικού, γεωγραφικού κλπ ενδιαφέροντος με αποτέλεσμα να γίνεται επιτακτική η ανάγκη βελτίωσης των λογισμικών που την υποστηρίζουν. Τα συγκεκριμένα λογισμικά έχουν τη δυνατότητα εισαγωγής, επεξεργασίας, ανάλυσης και παρουσίασης των αποτελεσμάτων σύντομα, με ποικίλους τρόπους όπως γραφήματα και πίνακες και σε ένα φιλικό προς το χρήστη περιβάλλον εργασίας. Παράλληλα, το επιπλέον χαρακτηριστικό το οποίο σίγουρα προσφέρουν πέραν της ταχύτητας είναι ο μεγάλος όγκος δεδομένων που μπορούν πλέον να επεξεργαστούν και η ευκολία της επεξεργασίας τους. Υπάρχει μία ποικιλία λογισμικών πακέτων στατιστικής όπως το SPSS, E-views, Minitab Assistat, Ezanova, Knme, Microsiris, Winidams εκ των οποίων τα πέντε τελευταία αποτελούν και «ελεύθερα» στατιστικά πακέτα - free software (Χατζηπέτρου, 2008). Για την παρούσα εφαρμογή επιλέγεται να χρησιμοποιηθεί το SPSS 18.0, καθώς είναι ίσως το πιο διαδεδομένο στατιστικό πρόγραμμα ανάλυσης δεδομένων. Παράλληλα, βασικό κριτήριο για την επιλογή του αποτέλεσε η πλατιά βιβλιογραφία που το συνοδεύει καθώς πρόκειται για ένα εξαιρετικά διαδεδομένο στατιστικό εργαλείο αλλά και η άποψη που εκφράζεται στη διεθνή βιβλιογραφία, ότι αποτελεί ένα κορυφαίο πακέτο ανάλυσης, το οποίο καλύπτει ένα πολύ μεγάλο εύρος στατιστικών τεχνικών, από τις πιο απλές μέχρι τις πιο σημαντικές και προχωρημένες. Τέλος, η ταχύτητα και η ευχρηστία του δίνουν τη δυνατότητα σε όλους τους χρήστες να εξερευνήσουν τις εναλλακτικές λύσεις που έχουν. (Howitt & Cramer, 2006) Για την ορθή χρήση του SPSS ακολουθούνται τέσσερα βασικά βήματα, τα οποία καθιστούν ολοκληρωμένη τη διαδικασία μελέτης ενός στατιστικού φαινομένου. Σε πρώτο στάδιο πραγματοποιείται η εισαγωγή του αρχείου δεδομένων στο SPSS. Το SPSS μπορεί να διαβάζει μία μεγάλη ποικιλία αρχείων που προέρχονται από διάφορους τύπους λογισμικού: αρχεία λογιστικών φύλλων, αρχεία βάσεων δεδομένων, αρχεία κειμένου, αρχεία του ίδιου του SPSS, που έχουν παραχθεί σε άλλα λειτουργικά συστήματα, καθώς και αρχεία άλλων στατιστικών πακέτων. Σε δεύτερο στάδιο γίνεται ο μετασχηματισμός των δεδομένων, όπου αυτό είναι απαραίτητο. Δηλαδή, διορθώσεις όπως επανακωδικοποίηση μεταβλητών, παραγωγή νέων, ένωση με άλλα αρχεία κλπ. Τρίτο στάδιο αποτελεί η ανάλυση των δεδομένων μέσω της επιλογής και εκτέλεσης στατιστικών διαδικασιών και της παραγωγής διαγραμμάτων υψηλής ευκρίνειας. Τελευταίο στάδιο αποτελεί η διαχείριση των παραγόμενων αποτελεσμάτων και η ερμηνεία τους, ώστε να κριθεί αποδεκτό ή όχι το μοντέλο που παράχθηκε. (Γναρδέλλης, 2006) 4.2 ΕΦΑΡΜΟΓΗ ΠΟΛΛΑΠΛΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΓΙΑ ΕΝΑ ΤΜΗΜΑ ΤΟΥ ΚΕΝΤΡΟΥ ΤΗΣ ΘΕΣΣΑΛΟΝΙΚΗΣ (ΠΡΩΤΟ ΜΟΝΤΕΛΟ) Αρχικά, πριν την έναρξη επεξεργασίας των δεδομένων μία πρώτη προσέγγιση στο περιεχόμενο του δείγματος επιτυγχάνεται εξετάζοντας τις τιμές του. Ορισμένα γενικά συμπεράσματα σχετικά με τα ιδιαίτερα χαρακτηριστικά της περιοχής είναι αρχικά ο μέσος όρος της ζητούμενης τιμής πώλησης από τους ιδιοκτήτες ανά τμ είναι /τμ., τιμή η Μεταπτυχιακή διατριβή 47

60 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ οποία χαρακτηρίζεται γενικά χαμηλή και δείχνει από τη μία μεριά την υποβάθμιση της συγκεκριμένης περιοχής του κέντρου που βρίσκεται επάνω από την οδό Εγνατία και την επίπτωση της οικονομικής κρίσης στο χώρο της αγοράς ακινήτων. Στο στατιστικό δείγμα του κέντρου παρατηρείται επίσης ότι συμπεριλαμβάνονται ακίνητα νεοδόμητα, κτίρια παλιά, πολύ παλιά και διατηρητέα. Ένα από τα βασικότερα χαρακτηριστικά του κέντρου άλλωστε είναι η έλλειψη ομοιομορφίας, η οποία είναι εμφανής από την ποικιλία που εμφανίζεται σε ουσιαστικά χαρακτηριστικά, όπως είναι η ύπαρξη ασανσέρ, το είδος θέρμανσης, ο βαθμός συντήρησης του διαμερίσματος κλπ. Επίσης, παρουσία νεοδόμητων οικοδομών στο δείγμα δίνει ενδιαφέρον για τα τελικά αποτελέσματα που θα προκύψουν. Για την έναρξη της επεξεργασίας η διαδικασία που προηγείται όλων είναι η δημιουργία ενός αρχείου.xls του οποίου η δομή είναι κατάλληλη για τη μετέπειτα επεξεργασία στο SPSS. Τοποθετούνται όλα τα δεδομένα του δείγματος που συλλέχθηκε με τις ποσοτικοποιημένες τους τιμές σε δέκα συνολικά στήλες του λογιστικού φύλλου, εκ των οποίων η πρώτη περιέχει μία αύξουσα αρίθμηση των διαμερισμάτων του δείγματος, η δεύτερη περιέχει τις αγοραίες αξίες των ακινήτων (εξαρτημένη μεταβλητή) και οι υπόλοιπες οκτώ περιέχουν τις ανεξάρτητες μεταβλητές που περιγράφονται αναλυτικά στο προηγούμενο κεφάλαιο. Οι γραμμές του λογιστικού φύλλου είναι συνολικά 61, καθώς στην πρώτη γραμμή βρίσκονται οι ετικέτες των μεταβλητών (ΑΑ, Υ, Χ1,Χ2,..Χ8) και ακολουθούν οι 60 οντότητες του δείγματος Δημιουργία παλινδρομικού μοντέλου σε περιβάλλον spss Στο παρόν υποκεφάλαιο περιγράφεται η διαδικασία εφαρμογής πολλαπλής παλινδρόμησης σε μορφή διαδοχικών βημάτων, σε περιβάλλον SPSS, ώστε να προκύψουν οι πίνακες και τα γραφήματα εκείνα που με τη μελέτη τους και την αξιολόγηση τους θα οδηγήσουν στο τελικό μοντέλο πολλαπλής παλινδρόμησης. ΒΗΜΑ 1 ο : Εισαγωγή δεδομένων στο περιβάλλον εργασίας Η εισαγωγή στο περιβάλλον του SPSS, γίνεται όταν ανοίξει το λογισμικό PASW Statistics 18. Εμφανίζεται αυτόματα το παράθυρο Data Editor (επεξεργασία δεδομένων του SPSS), δηλαδή μορφολογικά ένα λογιστικό φύλλο στο οποίο θα γίνει στη συνέχεια η καταχώριση των δεδομένων. Από το πλαίσιο διαλόγου Open File επιλέγεται ο τύπος αρχείου.xls και με την επιλογή του αρχείου εμφανίζονται όλα τα δεδομένα τοποθετημένα σε γραμμές και στήλες. (Εικόνα 4.1) Οι οριζόντιες γραμμές αποτελούν τις περιπτώσεις (cases) ή αλλιώς οντότητες και οι κατακόρυφες στήλες αποτελούν τις μεταβλητές (Variables), διότι για κάθε στήλη ενός αρχείου του Excel δημιουργείται μία μεταβλητή του αρχείου του SPSS. Όπως είναι ορατό από την εικόνα 4.1. η πρώτη στήλη των δεδομένων (AA)αποτελεί μία αύξουσα αρίθμηση των οντοτήτων. Υπάρχει η δυνατότητα μέσω της δεύτερης καρτέλας με όνομα Variable View (καρτέλα με βάση την ορολογία των λογιστικών φύλλων) να οριστούν οι ιδιότητες των μεταβλητών. Πιο συγκεκριμένα μπορούν να δοθούν στοιχεία, όπως το όνομα (Variable Names), ο τύπος της μεταβλητής (Variable Types αριθμός, αλφαριθμητικό, ημερομηνία κλπ), το πλάτος των στοιχείων που θα καταχωρούνται για κάθε μεταβλητή (Column Width), ο αριθμός των δεκαδικών ψηφίων, η ετικέτα της (value labels), η στοίχιση της (alignment), 48

61 Κ ε φ ά λ α ι ο 4 ο το επίπεδο μέτρησης μιας μεταβλητής 17 (Measurement level Διατεταγμένες, ονομαστικές μεταβλητές και μεταβλητές κλίμακας) κ.α. Εξαιτίας της εισαγωγής των δεδομένων μέσω ενός αρχείου Excel και όχι χειρονακτικά, τα στοιχεία της συγκεκριμένης καρτέλας είναι ήδη συμπληρωμένα βάσει της μορφής που είχαν στο λογιστικό φύλλο. Εικόνα 4.1: Καταχώρηση της βάσης δεδομένων σε περιβάλλον SPSS ΒΗΜΑ 2 ο : Δημιουργία γραφημάτων συσχέτισης της εξαρτημένης μεταβλητής Υ με τις ανεξάρτητες Χ i Πριν τη διαδικασία εκτέλεσης της πολλαπλής γραμμικής παλινδρόμησης και τη μελέτη των αποτελεσμάτων (report) που θα προκύψουν κρίνεται σημαντικό σε πρώτη φάση να οπτικοποιηθεί μέσω διαγράμματος η ύπαρξη ή όχι γραμμικής σχέσης μεταξύ της εξαρτημένης και των ανεξάρτητων μεταβλητών. Δίνεται η δυνατότητα με άλλα λόγια μέσω ενός διαγράμματος που παρέχει το λογισμικό να δοθεί μία πρώτη ουσιαστική εικόνα για τη σύνδεση που υπάρχει. Η ανάλυση συσχέτισης προηγείται της ανάλυσης παλινδρόμησης, διότι με βάσει το διάγραμμα επιλέγονται οι μεταβλητές εκείνες που θα λάβουν εν τέλει μέρος στη διαδικασία και απορρίπτονται εκείνες που δείχνουν μη γραμμική σχέση με την αξία των διαμερισμάτων. Τα γραφήματα συσχέτισης παράλληλα δείχνουν την ένταση και την κατεύθυνση της σχέσης. Το διάγραμμα που παρουσιάζεται παρακάτω δεν ερμηνεύεται αυθαίρετα αλλά βάσει ορισμένων κανόνων οι οποίοι αναλύονται στη συνέχεια. Το κατάλληλο διάγραμμα που θα δείξει γραφικά την ύπαρξη της σχέσης μεταξύ των μεταβλητών ανήκει στην κατηγορία των διαγραμμάτων διασποράς ή σκέδασης (scatterplots). Τα διαγράμματα διασποράς χρησιμοποιούνται για το διαγραμματικό προσδιορισμό της σχέσης που υπάρχει μεταξύ δύο ποσοτικών μεταβλητών οι οποίες αναφέρονται στο ίδιο σύνολο παρατηρήσεων. (Γναρδέλλης, 2006) Η διαδικασία εμφάνισης του σε περιβάλλον SPSS 18.0 περιγράφεται αναλυτικά παρακάτω. 17 Τα πραγματικά επίπεδα μέτρησης των μεταβλητών είναι είτε μεταβλητές κλίμακας, είτε διατεταγμένες μεταβλητές. Παρόλα αυτά επιλέγεται για όλες τις τιμές να αναγνωρίζονται ως μεταβλητές κλίμακας (Scale), διότι είναι η γενική κατηγορία και αντιστοιχεί σε ποσοτικά μεγέθη. Μεταπτυχιακή διατριβή 49

62 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Αρχικά εισάγονται όλα τα δεδομένα του δείγματος σε ένα νέο αρχείο *.sav (Βλ. ΒΗΜΑ 1 ο ) και από το Μενού του Data Editor επιλέγεται Graphs Legacy Dialogs Scatter/Dot Matrix (Εικόνα 4.2) Εικόνα4.2 : Διαδικασία εμφάνισης του διαγράμματος διασποράς Scatter/Dot για τον έλεγχο της σχέσης των μεταβλητών, σε περιβάλλον SPSS 18.0 Στο παράθυρο διαλόγου που εμφανίζεται γίνεται εισαγωγή όλων των μεταβλητών του μοντέλου στο δεξί υποπλαίσιο διαλόγου και με την επιλογή ΟΚ εμφανίζεται η εικόνα των διαγραμμάτων διασποράς (Διάγραμμα 4.1). Είναι εφικτό να κατασκευαστούν ξεχωριστά τα επτά γραφήματα που δείχνουν τη σχέση της κάθε ανεξάρτητης μεταβλητής με την εξαρτημένη, η εντολή matrix όμως οδηγεί στην παρακάτω εικόνα που απεικονίζει σε ένα μόνο γράφημα τις σχέσεις μεταξύ των μεταβλητών. 50

63 Κ ε φ ά λ α ι ο 4 ο Διάγραμμα 4.1: Γράφημα Matrix Scatter Plot για δείγμα 60 ακινήτων και για τις οκτώ ανεξάρτητες μεταβλητές Γραμμική είναι μία συσχέτιση, όπως φαίνεται στις παρακάτω απεικονίσεις όταν τα σημεία όλων των παρατηρήσεων συγκεντρώνονται γύρω από μία ευθεία και αντίστοιχα μη γραμμική όταν τα σημεία τείνουν να συγκεντρώνονται γύρω από μία καμπύλη. Ο βαθμός της συσχέτισης, δηλαδή το πόσο ισχυρή ή όχι είναι η γραμμική συσχέτιση συνδέεται κάθε φορά με το εάν είναι έντονα συγκεντρωμένα τα σημεία γύρω από την ευθεία γραμμή ή εάν είναι περισσότερο διασκορπισμένα. Τέλος, στην περίπτωση που όλα τα σημεία βρίσκονται πάνω στην ευθεία η συσχέτιση ονομάζεται πλήρης. (Ζήμερας, 2003) Εικόνα4.3: Χαρακτηριστικά παραδείγματα συσχέτισης μεταξύ μιας εξαρτημένης και μίας ανεξάρτητης μεταβλητής (Πηγή εικόνων: Ζήμερος, 2003) Χαρακτηριστικά είναι τα παραδείγματα της παραπάνω εικόνας, στα οποία ξεκινώντας την περιγραφή από αριστερά προς τα δεξιά, αρχικά απεικονίζεται μία αρνητική γραμμική συσχέτιση, στη συνέχεια μία θετική γραμμική συσχέτιση, ύπαρξη καμίας συσχέτισης και τέλος μια μη γραμμική συσχέτιση. Σύμφωνα με τα παραπάνω παραδείγματα και τα γραφήματα διασποράς της εικόνας 4.1, είναι ορατό ότι η εξαρτημένη μεταβλητή που αντιστοιχεί στην αγοραία αξία των ακινήτων δείχνει να μην έχει καμία γραμμική σχέση με τις ανεξάρτητες μεταβλητές Χ4 και Χ6, οι οποίες αντιστοιχούν στις μεταβλητές «Γωνιακό διαμέρισμα» και «Είδος θέρμανσης», αντίστοιχα. Με βάση τα παραπάνω δεδομένα το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης θα τρέξει με τις υπόλοιπες έξι μεταβλητές, ενώ οι Χ4 και Χ6 δεν υπάρχει λόγος να συμπεριληφθούν στη διαδικασία. Η επίδραση των έξι κύριων μεταβλητών μένει να διερευνηθεί μέσω της ανάλυσης που ακολουθεί, διότι η τελική επιλογή του μοντέλου εξαρτάται από μία μεγάλη ποικιλία παραγόντων. ΒΗΜΑ 3 ο : Εύρεση μερικής συσχέτισης της κάθε ανεξάρτητης μεταβλητής Χi με την εξαρτημένη Y Ο έλεγχος που προηγείται με το διάγραμμα σκέδασης είναι ουσιαστικός γιατί αποτελεί το πρώτο βασικό μεθοδολογικό βήμα. Πέραν όμως της οπτικοποιημένης «χονδροειδούς» εικόνας που παρέχει το διάγραμμα υπάρχει ένας ακόμη έλεγχος αυστηρότερος και ακριβέστερος. Μέσω του Μενού Analyze Correlate Partial ανοίγει ένα νέο παράθυρο στο οποίο εισάγεται κάθε φορά η εξαρτημένη μεταβλητή με μία από τις ανεξάρτητες και υπολογίζεται η «καθαρή» συσχέτιση της κάθε μίας με την εξαρτημένη. Συνολικά προκύπτουν οκτώ πίνακες της παρακάτω μορφής με το ποσοστό που ερμηνεύει η κάθε μεταβλητή στο μοντέλο. Μεταπτυχιακή διατριβή 51

64 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Σύμφωνα με τον πίνακα 4.1 το εμβαδόν των διαμερισμάτων στην περιοχή του κέντρου της Θεσσαλονίκης ερμηνεύει το 79% της αξίας του διαμερίσματος. Με άλλα λόγια συμμετέχει στην διαμόρφωση της τιμής κατά 79%. Η σχέση είναι ιδιαίτερα μεγάλη και γίνεται σαφές ότι είναι το εμβαδόν θα συμμετέχει στο παλινδρομικό μοντέλο που πρόκειται να σχηματιστεί. Πίνακας 4.1 : Ποσοστό μερικής συσχέτισης της αγοραίας αξίας και του εμβαδού στην περιοχή του κέντρου της Θεσσαλονίκης Correlations Control Variables Y X1 X2 & X3 & X4 & X5 & X6 & X7 & Χ8 Y Correlation 1,000,790 Significance (2-tailed).,000 df 0 52 X1 Correlation,790 1,000 Significance (2-tailed),000. df 52 0 Με όμοια διαδικασία προκύπτουν οι αντίστοιχες μερικές συσχετίσεις και των υπόλοιπων ανεξάρτητων μεταβλητών με την εξαρτημένη και είναι ορατές στον παρακάτω πίνακα. Πίνακας 4.2 : Μερικές συσχετίσεις μεταξύ των μεταβλητών στην περιοχή του κέντρου Μεταβλητές Συσχέτιση Επίπεδο στατιστικής σημαντικότητας Χ1 Y 0,790 0,000 Χ2 Y -0,493 0,000 Χ3 Y 0,052 0,727 Χ4 Y 0,123 0,412 Χ5 Y 0,186 0,210 Χ6 Y 0,083 0,579 Χ7- Y 0,399 0,006 Χ8 - Y 0,208 0,161 Αποδεικνύεται με έναν ακόμη πιο ακριβή τρόπο ότι οι μεταβλητές Χ4, Χ5 και Χ6 δεν έχουν καμία γραμμική σχέση με την εξαρτημένη μεταβλητή και άρα δεν υπάρχει κανένας λόγος να συμμετέχουν στη διαδικασία εκτέλεσης της πολλαπλής παλινδρόμησης. 52

65 Κ ε φ ά λ α ι ο 4 ο ΒΗΜΑ 4 ο : Διαδικασία εκτέλεσης της πολλαπλής γραμμικής παλινδρόμησης Από το Μενού Analyze επιλέγεται Regression Linear και εμφανίζεται το παράθυρο Linear Regression όπως φαίνεται στην παρακάτω εικόνα. Επιλέγεται αρχικά η εξαρτημένη μεταβλητή, η οποία μεταφέρεται στην περιοχή Dependent και το σύνολο των ανεξάρτητων μεταβλητών στην περιοχή Independent(s). Εικόνα 4.4: Επιλογή εξαρτημένης μεταβλητής, ανεξάρτητων μεταβλητών και μεθόδου εκτέλεσης της πολλαπλής γραμμικής παλινδρόμησης Στο πεδίο Method πρέπει να επιλεγεί η διαδικασία με την οποία θα εφαρμοστεί η πολλαπλή γραμμική παλινδρόμηση. Η επιλογή της μεθόδου είναι ιδιαίτερα σημαντική σε αυτό το βήμα, διότι θα καθοριστεί στην ουσία η μορφή της εξίσωσης του μοντέλου. Οι μέθοδοι που μπορεί να εφαρμόσει το SPSS είναι η μέθοδος Enter, Remove, Forward, Backward και Stepwise. Στην προκειμένη περίπτωση επιλέγεται η μέθοδος Stepwise για τους λόγους που περιγράφονται στην ακόλουθη παράγραφο. Σύμφωνα με τον Αγγελίδη, 2009 με τη μέθοδο Enter ο χρήστης εισάγει μόνος τις μεταβλητές που επιθυμεί, με την εντολή Forward το SPSS επιλέγει τις μεταβλητές που θα συμμετέχουν στο μοντέλο με κριτήριο επιλογής τα αντίστοιχα b να είναι στατιστικά σημαντικά τουλάχιστον στο επίπεδο του 20% (p. Value 0.2), ξεκινώντας από αυτή που έχει το μικρότερο p. Value και με την εντολή Backward με ακριβώς αντίστροφο τρόπο αρχικά εισάγονται όλες οι μεταβλητές στο μοντέλο και αφαιρούνται διαδοχικά με κριτήριο η τιμή p. value να είναι > 0.2 ξεκινώντας από αυτήν που έχει τη μεγαλύτερη τιμή. Τέλος, η μέθοδος Stepwise (μέθοδος που επιλέγεται στη συγκεκριμένη περίπτωση) είναι η πιο αξιόπιστη από τις παραπάνω διότι αποτελεί μία μέθοδο βέλτιστης επιλογής των μεταβλητών σύμφωνα με τον Γναρδέλλη, Η επιλογή των μεταβλητών γίνεται κατά βήματα και κάθε νέο βήμα θεωρείται ως μοντέλο. Πιο συγκεκριμένα, σε κάθε βήμα της Μεταπτυχιακή διατριβή 53

66 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ διαδικασίας αξιολογούνται οι μεταβλητές που βρίσκονται ήδη στην εξίσωση, σύμφωνα με τα κριτήρια επιλογής για απαλοιφή. Εάν τα p-value είναι μικρότερα από 0,05, δηλαδή το 5% επίπεδο σημαντικότητας, τότε οι μεταβλητές θεωρούνται στατιστικά σημαντικές. Στην αντίθετη περίπτωση που η τιμή p-value είναι μεγαλύτερη από 0,05 τότε οι μεταβλητές κρίνονται ακατάλληλες. Η διαδικασία ελέγχου της τιμής p-value πραγματοποιείται μέχρι να μην είναι κατάλληλη για προσθήκη ή απαλοιφή καμία από τις μεταβλητές του σετ των μεταβλητών (Πραμαγγιούλης, 2008) και (Dennis, 2006). Η μέθοδος της διαδοχικής επιλογής συνήθως χρησιμοποιείται όταν το μοντέλο είναι πειραματικό και δεν είναι γνωστή η συνεισφορά της κάθε μεταβλητής στην ερμηνεία του. (Δημητριάδης, 2010) ΒΗΜΑ 5 ο : Δημιουργία περιγραφικών στατιστικών μέτρων της διαδικασίας Linear Regression Από το παράθυρο διαλόγου Statistics (Εικ. 4.5) επιλέγονται όλα τα στοιχεία που είναι επιθυμητό να εμφανίζονται έπειτα από τις διαδοχικές προσεγγίσεις που θα πραγματοποιηθούν στη συνέχεια για το σχηματισμό του τελικού μοντέλου, ώστε να αποτελέσουν κύρια πηγή αξιολόγησης των αποτελεσμάτων. Εικόνα 4.5: Πλαίσιο διαλόγου Linear regression: Statistics Από την παραπάνω εικόνα, η επιλογή των Estimates δίνει τον πίνακα συντελεστών δηλαδή το σταθερό όρο, τους μερικούς συντελεστές παλινδρόμησης, τις τιμές του t test, και το επίπεδο σημαντικότητας του αντίστοιχου μερικού συντελεστή παλινδρόμησης (Sig.) βάσει του οποίου γίνεται η επιλογή ή αντίστοιχα η απόρριψη της μηδενικής υπόθεσης που σχετίζεται με τους συντελεστές. Η επιλογή Confidence intervals δίνει τα κατώτερα και ανώτερα άκρα του διαστήματος εμπιστοσύνης των συντελεστών που έχουν υπολογιστεί, η επιλογή Model Fit δίνει δύο βασικούς πίνακες εκ των οποίων ο πρώτος Model Summary, περιλαμβάνει το συντελεστή πολλαπλής συσχέτισης (R), το δείκτη προσδιορισμού (R Square), το διορθωμένο δείκτη προσδιορισμού (Adjusted R Square) και το τυπικό σφάλμα της εκτίμησης, ενώ ο δεύτερος ANOVA περιλαμβάνει το άθροισμα τετραγώνων της 54

67 Κ ε φ ά λ α ι ο 4 ο παλινδρόμησης και των σφαλμάτων, το συνολικό άθροισμα τετραγώνων, τους βαθμούς ελευθερίας, το μέσο των προηγούμενων αθροισμάτων, την τιμή του F κριτηρίου και το Sig.(στάθμη στατιστικής σημαντικότητας). Στη συνέχεια, η επιλογή Part and partial correlations δίνει τους τμηματικούς και μερικούς συντελεστές συσχέτισης, η επιλογή descriptives εμφανίζει δύο πίνακες, εκ των οποίων ο ένας Descriptive Statistics παρέχει τη μέση τιμή και την τυπική απόκλιση όλων των μεταβλητών, ενώ ο δεύτερος πίνακας Correlation δίνει τους συντελεστές συσχέτισης μεταξύ όλων των μεταβλητών, καθώς επίσης και τις στάθμες στατιστικής σημαντικότητας για όλους τους συντελεστές συσχέτισης που υπολογίστηκαν. Η επιλογή Collinearity diagnostics προσθέτει δύο βασικές τιμές, τον παράγοντα ανοχής Tolerance και τον παράγοντα πληθωριστικής διακύμανσης VIF, οι οποίοι όπως θα φανεί και σε παρακάτω υποκεφάλαιο αποτελούν κριτήριο για την ύπαρξη συγγραμμικότητας ή πολυσυγγραμμικότητας. Τελευταίες είναι δύο επιλογές, αρχικά ο δείκτης Durbin Watson, ο οποίος προστίθεται στον πίνακα Model Summary και αποτελεί δείκτη ελέγχου της ύπαρξης ανεξαρτησίας των οντοτήτων και τέλος η επιλογή Casewise diagnostics Outliers Outside τιμή 2 όπου αναφέρεται στις οντότητες που έχουν υπόλοιπο ± 2 και θα οδηγήσει σε μετέπειτα έλεγχο για το πόσο ικανοποιητικό είναι το μοντέλο (πιθανόν και μία πιο ελαστική επιλογή όπως η τιμή ± 3 να ήταν ικανοποιητική, εξαιτίας της ύπαρξης πραγματικών δεδομένων). (Αγγελίδης, 2009) ΒΗΜΑ 6 ο : Διαγράμματα που παράγονται κατά τη διαδικασία Linear Regression Σύμφωνα με τον Γναρδέλλη, 2006 η διαδικασία ανάλυσης παλινδρόμησης δίνει τη δυνατότητα παραγωγής διαγραμμάτων, κυρίως για τον έλεγχο της εγκυρότητας του υποδείγματος. Από το παράθυρο διαλόγου Plots (Εικ. 4.6) αρχικά επιλέγεται να εμφανιστούν όλα τα διαγράμματα μερικής συσχέτισης και το ιστόγραμμα των κανονικοποιημένων υπολοίπων (z-τιμές), αφού θεωρούμε ότι ακολουθούν την κανονική κατανομή. Επίσης, ορίζεται η δημιουργία ενός διαγράμματος όπου στον Υ άξονα έχει τα τυποποιημένα κατά Student διαγραμμένα υπόλοιπα (SDRESID)και στον Χ άξονα τις τυποποιημένες εκτιμώμενες τιμές (ZPRED)και ένα ακόμη διάγραμμα, στο οποίο στον άξονα Y έχει τις τυποποιημένες εκτιμώμενες τιμές και στον άξονα Χ την εξαρτημένη μεταβλητή του υποδείγματος (DEPENDNT). (Εικόνα 4.7) Μεταπτυχιακή διατριβή 55

68 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Εικόνα 4.6: Πλαίσιο διαλόγου Linear Regression: Plot. Δημιουργία πρώτου διαγράμματος διασποράς Εικόνα 4.7: Πλαίσιο διαλόγου Linear Regression: Plot. Δημιουργία δεύτερου διαγράμματος διασποράς ΒΗΜΑ 7 ο : Αποθήκευση νέων μεταβλητών που παράγονται από τη διαδικασία Linear Regression Από το παράθυρο διαλόγου Save (Εικ. 4.8) τσεκάρονται όλες οι επιλογές που δίνονται στο πλαίσιο διαλόγου, ώστε να αποθηκευτούν νέες μεταβλητές και διαγνωστικά στατιστικά μέτρα τα οποία παράγονται έπειτα από την εκτέλεση της πολλαπλής γραμμικής παλινδρόμησης. Οι νέες μεταβλητές αφορούν τις εκτιμώμενες τιμές, τα υπόλοιπα της παλινδρόμησης, καθώς και ορισμένες αποστάσεις και στατιστικά μέτρα που χρησιμοποιούνται για τον εντοπισμό «ασυνήθιστων» παρατηρήσεων με ισχυρή επίδραση στη διαμόρφωση του υποδείγματος. Η πρώτη κατηγορία επιλογών με τον τίτλο Predicted Values οδηγεί στην αποθήκευση των εκτιμώμενων τιμών (Unstandardized), των τυποποιημένων εκφράσεων των εκτιμώμενων τιμών (Standardized), των προσαρμοσμένων τιμών των εκτιμήσεων (Adjusted) και των τυπικών σφαλμάτων των εκτιμώμενων τιμών (S.E. of mean predictions). Η κατηγορία με τον τίτλο Distances οδηγεί στον υπολογισμό συγκεκριμένων στατιστικών μέτρων. Αρχικά, η απόσταση Mahalahobis αποτελεί μέτρο της απόκλισης των Χ i τιμών μιας οντότητας από τις αντίστοιχες μέσες τιμές των ανεξάρτητων μεταβλητών. Η επιλογή Cook s αποτελεί μέτρο της διαφοροποίησης των υπολοίπων όταν μία από τις οντότητες της ανάλυσης αποκλειστεί από τον υπολογισμό των συντελεστών της 56

69 Κ ε φ ά λ α ι ο 4 ο παλινδρόμησης. Τέλος, η επιλογή Leverage values αποτελεί μέτρο της επίδρασης μιας οντότητας στην προσαρμογή του υποδείγματος. Η επιλογή των Prediction Intervals αναφέρεται στα διαστήματα εμπιστοσύνης (ανώτατο και κατώτερο όριο) των εκτιμούμενων τιμών που αντιστοιχούν είτε όταν πρόκειται για τις μέσες τιμές υποπληθυσμών της Υ στις διάφορες τιμές των ανεξάρτητων μεταβλητών, είτε όταν πρόκειται για τις ατομικές τιμές της Υ (Mean και Individual αντίστοιχα)για τις ίδιες τιμές των ανεξάρτητων μεταβλητών. Στο πεδίο Confidence Interval ορίζεται το ακριβές διάστημα εμπιστοσύνης 95% για τις δύο προηγούμενες εκδοχές των εκτιμούμενων τιμών. Η κατηγορία των υπολοίπων (residuals) αναφέρεται στις τιμές των υπολοίπων δηλαδή στις διαφορές των εκτιμώμενων τιμών από τις παρατηρούμενες (Unstandardized)και στις τιμές των υπολοίπων έπειτα από το μετασχηματισμό τους. Πιο συγκεκριμένα, τα τυποποιημένα υπόλοιπα (Standardized residuals) είναι τα υπόλοιπα διαιρούμενα με την τυπική τους απόκλιση. Τα τυποποιημένα κατά Student υπόλοιπα (Studentized residuals) αναφέρονται στις τιμές των υπολοίπων που διαιρούνται με μία εκτίμηση της τυπικής τους απόκλισης η οποία μεταβάλλεται από οντότητα σε οντότητα ανάλογα με την απόσταση κάθε οντότητας από τις μέσες τιμές των ανεξάρτητων μεταβλητών. Τα διαγραμμένα υπόλοιπα (Deleted residuals) είναι το υπόλοιπο για κάθε οντότητα όταν αυτή δε συμμετέχει στον υπολογισμό των συντελεστών της παλινδρόμησης. Tα τυποποιημένα κατά Student διαγραμμένα υπόλοιπα είναι τα κατά student υπόλοιπα, όταν όμως η οντότητα δεν περιλαμβάνεται στους υπολογισμούς. Η τελευταία κατηγορία Influence Statistics αναφέρεται στις μεταβολές που προκύπτουν στους συντελεστές της παλινδρόμησης και στις εκτιμώμενες από το υπόδειγμα τιμές όταν μία οντότητα απομακρυνθεί από την ανάλυση. Ως BfBeta(s) ορίζονται οι διαφορές στους συντελεστές παλινδρόμησης όταν μία παρατήρηση απομακρυνθεί από την ανάλυση, ενώ οι αντίστοιχες τυποποιημένες τιμές (Standardized BfBeta) αναφέρονται στις τυποποιημένες διαφορές στους συντελεστές παλινδρόμησης. Ως DfFit ορίζεται η διαφορά στην εκτιμώμενη τιμή μιας οντότητας όταν αυτή απομακρυνθεί από την ανάλυση και αντίστοιχα η τυποποιημένη διαφορά υπολογίζεται μέσω της επιλογής του Standardized DfFit. Η τελευταία δυνατότητα που προσφέρεται (Covariance ratio) υπολογίζει το λόγο της ορίζουσας του πίνακα των συνδιακυμάνσεων όταν μία συγκεκριμένη οντότητα δε συμπεριλαμβάνεται στην ανάλυση προς την ορίζουσα του πίνακα των συνδιακυμάνσεων με όλες τις οντότητες να συμμετέχουν στην ανάλυση. (Γναρδέλλης, 2006) Μεταπτυχιακή διατριβή 57

70 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Εικόνα 4.8: Πλαίσιο διαλόγου Linear Regression: Save ΒΗΜΑ 8 ο : Επιλογές της διαδικασίας Linear Regression Στο παράθυρο διαλόγου Options (Εικ. 4.9) ορίζονται ουσιαστικά τα κριτήρια εισόδου εξόδου των μεταβλητών στο μοντέλο. Στην προκειμένη περίπτωση η μεταβλητή συμμετέχει στο μοντέλο αν το επίπεδο σημαντικότητας (significance level) για κάθε F τιμή είναι μικρότερο από την τιμή που δίνεται στο παράθυρο Entry (0.05). Αντίθετα αφαιρείται αν το επίπεδο σημαντικότητας για κάθε F τιμή είναι μεγαλύτερο από την τιμή που δίνεται στο παράθυρο Removal (0.10) 18. Είναι δηλαδή η ανοχή που δίνεται στη μέθοδο διαδοχικής επιλογής (stepwise) για την επιλογή των μεταβλητών, όπως αναφέρθηκε παραπάνω. 18 Οι τιμές που ορίζουν τα κριτήρια εισόδου και εξόδου των μεταβλητών στο μοντέλο και επιλέχθηκαν παραπάνω είναι οι προεπιλεγμένες τιμές του προγράμματος για την εφαρμογή της πολλαπλή γραμμικής παλινδρόμησης 58

71 Κ ε φ ά λ α ι ο 4 ο Εικόνα 4.9: Πλαίσιο διαλόγου Linear Regression: Options Η επιλογή της ένδειξης Include constant in equation γίνεται για να εμφανιστεί ο σταθερός όρος του μοντέλου στην εξίσωση παλινδρόμησης και η επιλογή της ένδειξης Exclude cases listwise γίνεται με σκοπό την συμμετοχή μόνο των οντοτήτων που έχουν έγκυρες τιμές για όλες τις μεταβλητές στην ανάλυση. (Δημητριάδης, 2010) ΒΗΜΑ 9 ο : Εμφάνιση αποτελεσμάτων σε περιβάλλον εργασίας Viewer Με την ολοκλήρωση των επιλογών που έγιναν στο πλαίσιο διαλόγου Linear Regression τα αποτελέσματα της διαδικασίας με τη μέθοδο Stepwise εμφανίζονται στο παράθυρο του Viewer. Το συγκεκριμένο περιβάλλον εργασίας δίνει τη δυνατότητα διαχείρισης και επεξεργασίας των αποτελεσμάτων για τη λήψη αποφάσεων και εξαγωγή τους σε διάφορες μορφές αρχείων. Η εξίσωση παλινδρόμησης που αποτελεί μία πρώτη προσέγγιση του προβλήματος είναι η ακόλουθη: Υ = , ,846 Χ ,365 Χ7-920,315 Χ2 δηλ., Αγοραία αξία = , ,846 * (Εμβαδόν) ,365 * (Κατάσταση ακινήτου) - 920,315 * (Παλαιότητα),με συντελεστή προσδιορισμού R 2 = 0,72. Μεταπτυχιακή διατριβή 59

72 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Έλεγχος ικανοποίησης προϋποθέσεων αρχικού μοντέλου πολλαπλής γραμμικής παλινδρόμησης Βασικός στόχος από την αρχή της συγκεκριμένης προσπάθειας είναι η δημιουργία μίας αξιόπιστης παλινδρομικής εξίσωσης που να ικανοποιεί τη δυνατότητα πρόβλεψης αγοραίων αξιών ακινήτων στις αντίστοιχες περιοχές μελέτης. Ο έλεγχος της αξιοπιστίας και του επιτυχούς σχηματισμού του μοντέλου ελέγχεται με μία σειρά διαδικασιών μέσω του SPSS που καθρεφτίζουν όλο το θεωρητικό υπόβαθρο που συνοδεύει τα μοντέλα πολλαπλής γραμμικής παλινδρόμησης. Η σειρά ελέγχων που ακολουθούν εκτελούνται στο αρχικό μοντέλο για να ελεγχθεί η αξιοπιστία του και η δύναμη της προβλεπτικής του ικανότητας Σημαντικότητα ανεξάρτητων μεταβλητών Ένα ουσιαστικό ερώτημα προς απάντηση είναι η ύπαρξη ή όχι στατιστικής σημαντικότητας των ανεξάρτητων μεταβλητών του μοντέλου. Σύμφωνα με τον Μισιρλόγλου, 2011 η λεγόμενη «σημαντικότητα των μεταβλητών» αναφέρεται στις μεταβλητές εκείνες που είναι ικανές να βοηθήσουν στην προβλεπτική ικανότητα του μοντέλου και μέσα από το λογισμικό του spss δίνεται με τη βοήθεια του ελέγχου γραφημάτων μερικής παλινδρόμησης (Partial Plots) και μέσω των τιμών t. Παρακάτω αναλύονται και οι δύο τρόποι ελέγχου. Γραφήματα Μερικής Παλινδρόμησης (Partial Residual Plots) Τιμές t Διαγράμματα μερικής συσχέτισης Τα διαγράμματα μερικής συσχέτισης απεικονίζουν την πραγματική, «καθαρή» σχέση μεταξύ της εξαρτημένης και κάθε μίας από τις ανεξάρτητες μεταβλητές που λαμβάνουν μέρος στο σχηματισμό του μοντέλου, απαλλαγμένες όμως από οποιαδήποτε επίδραση σε σχέση με τις άλλες ανεξάρτητες μεταβλητές. Τα διαγράμματα μερικής συσχέτισης δείχνουν ξεκάθαρα την ύπαρξη γραμμικότητας μεταξύ εξαρτημένης και ανεξάρτητων. Πρακτικά σημαίνει ότι υπολογίζονται τα υπόλοιπα της παλινδρόμησης μεταξύ της μεταβλητής Y και των άλλων ανεξάρτητων μεταβλητών, στη συνέχεια υπολογίζονται τα υπόλοιπα της παλινδρόμησης μεταξύ της Xi και των άλλων ανεξάρτητων μεταβλητών και τέλος κατασκευάζεται το διάγραμμα διασποράς μεταξύ των δύο μεταβλητών των υπολοίπων. (Λαφαζάνη, 2003 & Γναρδέλλης, 2006) 60

73 Κ ε φ ά λ α ι ο 4 ο Τα παρακάτω διαγράμματα αποτελούν το σύνολο των διαγραμμάτων μερικής συσχέτισης της εξαρτημένης μεταβλητής Y με όλες τις ανεξάρτητες μεταβλητές του μοντέλου. Στην ουσία, τα διαγράμματα παρέχουν μια διαγραμματική απεικόνιση της μερικής συσχέτισης κάθε ανεξάρτητης μεταβλητής με την εξαρτημένη. Οι μεταβλητές τις οποίες κράτησε εν τέλει το λογισμικό είναι τρεις από τις οκτώ. Με τα παρακάτω διαγράμματα βεβαιώνεται οπτικά η σημαντικότητα των ανεξάρτητων μεταβλητών και η ύπαρξη ή όχι γραμμικότητας. Διάγραμμα 1 Διάγραμμα 2 Διάγραμμα 3 Διάγραμμα 4 Μεταπτυχιακή διατριβή 61

74 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Διάγραμμα 5 Διάγραμμα 6 Διάγραμμα 7 Διάγραμμα 8 Διάγραμμα 4.2: Διαγράμματα μερικής παλινδρόμησης ως προς όλες τις ανεξάρτητες μεταβλητές Xi για την περιοχή του κέντρου της Θεσσαλονίκης - Διάγραμμα 1: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και του εμβαδού των διαμερισμάτων, η οποία είναι γραμμική. Παρατηρούνται δύο οντότητες (31 και 34) που βρίσκονται εκτός της ζώνης σταθερού πλάτους και άρα είναι πιθανές ακραίες οντότητες. 62

75 Κ ε φ ά λ α ι ο 4 ο - Διάγραμμα 2: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και της παλαιότητας των διαμερισμάτων, η οποία είναι γραμμική. Όμοια, επισημαίνονται οι δύο οντότητες 31 και 34, ως πιθανές ακραίες οντότητες. - Διάγραμμα 3: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και του ορόφου των διαμερισμάτων, η οποία δεν είναι γραμμική - Διάγραμμα 4: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων της θέσης στην οικοδομή του κάθε διαμερίσματος (γωνιακό/όχι), η οποία δεν είναι γραμμική - Διάγραμμα 5: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και της ύπαρξης ή όχι ανελκυστήρα, η οποία δεν είναι γραμμική - Διάγραμμα 6: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και του είδους θέρμανσης των διαμερισμάτων, η οποία δεν είναι γραμμική - Διάγραμμα 7: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και του βαθμού συντήρησης τους, η οποία είναι γραμμική. Όμοια, με το διάγραμμα 1 και 2, επισημαίνονται οι δύο οντότητες 31 και 34, ως πιθανές ακραίες οντότητες. - Διάγραμμα 8: Απεικονίζει τη σχέση που υπάρχει μεταξύ της αγοραίας αξίας των ακινήτων και της ιδιωτικής θέσης στάθμευσης, η οποία δεν είναι γραμμική Η διαγραμματική απεικόνιση των μερικών συσχετίσεων μόνο των τριών μεταβλητών είναι αρκετή στο συγκεκριμένο στάδιο, διότι μόνο αυτές ενδιαφέρουν για την αξιολόγηση του μοντέλου. Παρ όλα αυτά παρατίθενται όλες για να τονιστούν για ακόμη μία φορά οι διαφορές που υπάρχουν όσον αφορά την επίδραση των μεταβλητών. Τιμές t Οι τιμές t εξάγονται έπειτα από την εκτέλεση της γραμμικής πολλαπλής παλινδρόμησης και είναι ορατές στον πίνακα των συντελεστών παλινδρόμησης (Coefficients), ο οποίος σύμφωνα με τον Πραμαγγιούλη, 2008 είναι ο πίνακας εκτίμησης των παραμέτρων του μοντέλου αλλά και ελέγχου στατιστικής σημαντικότητας καθεμίας μεταβλητής. Όπως φαίνεται και από τον παρακάτω πίνακα κάθε γραμμή του αναφέρεται στους συντελεστές κάθε μίας από τις ανεξάρτητες μεταβλητές που συσχετίζονται με την εξαρτημένη μεταβλητή και επιδρούν στη διαμόρφωση της τιμής της με διαφορετική βαρύτητα η κάθε μία από αυτές. Μεταπτυχιακή διατριβή 63

76 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Πίνακας4.3: Πίνακας Coefficients που περιλαμβάνει τις τιμές μεταβλητών t των ανεξάρτητων Coefficients a Model Unstandardized Standardized 95,0% Confidence Collinearity Coefficients Coefficients Interval for B Correlations Statistics Lower Upper Zero- B Std. Error Beta t Sig. Bound Bound order Partial Part Tolerance VIF 3 (Constant) , ,749 -,575, , ,746 X1 1595, ,167,722 9,902, , ,702,716,798,700,938 1,066 X , ,896,284 3,570, , ,001,292,431,252,786 1,271 X2-920, ,517 -,257-3,235, , ,359 -,469 -,397 -,789 1,268,229 Η πέμπτη στήλη του πίνακα (t) οδηγεί στον έλεγχο της στατιστικής σημαντικότητας των συντελεστών με τη χρήση των t-tests που ελέγχουν εάν κάθε συντελεστής διαφέρει από την τιμή 0. Έτσι Μηδενική υπόθεση Ηο : Οι μερικοί συντελεστές παλινδρόμησης είναι μηδέν έναντι της εναλλακτικής υπόθεσης Η1: Τουλάχιστον ένας συντελεστής παλινδρόμησης διαφέρει από το μηδέν. Οι τιμές Sig. του πίνακα (παρατηρούμενο επίπεδο σημαντικότητας) που αντιστοιχούν στο στατιστικό έλεγχο για τη στατιστική σημαντικότητα ή όχι των ανεξάρτητων μεταβλητών είναι <0,05 με αποτέλεσμα να απορρίπτεται η μηδενική υπόθεση, οπότε και οι τρεις μεταβλητές είναι στατιστικά σημαντικές και κατάλληλες για το μοντέλο. Σύμφωνα με τον Δαφέρμο, 2005 η σημαντικότητα μιας ανεξάρτητης μεταβλητής είναι μεγάλη όταν οι τιμές του t είναι > Ι±2Ι και όσο πιο μεγάλη είναι η τιμή από το δύο τόσο πιο σημαντική είναι. Από τον παραπάνω πίνακα προκύπτει ότι και οι τρεις μεταβλητές είναι στατιστικά σημαντικές με την Χ1 (εμβαδόν διαμερίσματος) να συμβάλλει σημαντικότερα στην ερμηνεία της εξαρτημένης μεταβλητής, τη μεταβλητή Χ7 (κατάσταση ακινήτου) να ακολουθεί και τέλος τη Χ2 (παλαιότητα οικοδομής) Ανεξαρτησία οντοτήτων Ο όρος ανεξαρτησία των οντοτήτων σημαίνει ότι η συμμετοχή στο δείγμα μίας οντότητας δε θα πρέπει να επηρεάζει καθόλου τη συμμετοχή μιας άλλης οντότητας. Σύμφωνα με τον Γναρδέλλη, 2006 η πρώτη προϋπόθεση της ανεξαρτησίας των παρατηρήσεων διασφαλίζεται κατά το σχεδιασμό, ο οποίος αποτελεί την πρώτη φάση μιας μελέτης. Θεωρείται δεδομένο ότι κατά τη συλλογή ενός δείγματος οι οντότητες δεν έχουν προκύψει από επαναλαμβανόμενες μετρήσεις της ίδιας μεταβλητής. Σύμφωνα με τη βιβλιογραφία ο έλεγχος της παραδοχής της ανεξαρτησίας ελέγχεται με δύο τρόπους. Αρχικά, με τη βοήθεια του δείκτη Durbin Watson και στη συνέχεια με το 64

77 dimension0 Κ ε φ ά λ α ι ο 4 ο γράφημα σκέδασης (scatterplot) των τυποποιημένων κατά student υπολοίπων με τη σειρά καταγραφής των οντοτήτων. Δείκτης Durbin Watson Ο δείκτης Durbin Watson εμφανίζεται στα αποτελέσματα της ανάλυσης στον πίνακα Model Summary (Πίνακας 4.4) όπως φαίνεται παρακάτω. Με τη βοήθεια του δείκτη ελέγχεται εάν τα τυποποιημένα υπόλοιπα είναι ανεξάρτητα μεταξύ τους, δηλαδή ελέγχεται η ανεξαρτησία των αντίστοιχων οντοτήτων. Η θεωρία αναφέρει ότι ο έλεγχος των αυτοσυσχετίσεων (δηλαδή έλεγχος της ανεξαρτησίας των υπολοίπων) με τη χρήση του δείκτη γίνεται με τη βοήθεια συγκεκριμένων ορίων που κρίνουν το αποτέλεσμα. Πιο συγκεκριμένα, οι τιμές του δείκτη Durbin Watson κυμαίνονται μεταξύ 0 και 4 (0<D<4). Όταν οι τιμές του δείκτη βρίσκονται μεταξύ του 0 και του 2 δείχνουν θετική αυτοσυσχέτιση και όσο τείνουν στο 0 χαρακτηρίζονται από έντονη θετική συσχέτιση. Αντίστοιχα, όταν οι τιμές του δείκτη βρίσκονται μεταξύ 2 και 4 δείχνουν αρνητική αυτοσυσχέτιση και όσο τείνουν στο πάνω όριο χαρακτηρίζονται από έντονη αρνητική συσχέτιση. Παρόλα αυτά ζητούμενη σε κάθε μελέτη είναι η ανεξαρτησία των οντοτήτων, η οποία εξασφαλίζεται όταν η τιμή του δείκτη βρίσκεται μεταξύ 1.5 και 2.5. Πίνακας4.4: Δείκτης Durbin Watson στον πίνακα Model Summary Model Summary d Model Change Statistics Adjusted Std. Error R R R of the Square F Sig. F Durbin- R Square Square Estimate Change Change df1 df2 Change Watson 1,716 a,512, ,023,512 60, ,000 2,817 b,668, ,911,156 26, ,000 3,849 c,720, ,523,052 10, ,002 2,224 a. Predictors: (Constant), X1 b. Predictors: (Constant), X1, X2 c. Predictors: (Constant), X1, X2, X7 d. Dependent Variable: Y Η τιμή του δείκτη Durbin Watson όπως φαίνεται από τον παραπάνω πίνακα είναι 2,224, βρίσκεται κοντά στο πάνω όριο που τίθεται από την θεωρία (1,5<2,224<2,5) και προδίδει ανεξαρτησία των οντοτήτων. Μεταπτυχιακή διατριβή 65

78 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Διάγραμμα Σκέδασης : Studentized Residuals vs Sequence Πρόκειται για ένα διάγραμμα σκέδασης, το οποίο στόχο έχει την ανίχνευση της παραδοχής της ανεξαρτησίας μέσω της παρακάτω λογικής. Θεωρούμε μία νοητή γραμμή στο σημείο μηδέν, που χωρίζει τα θετικά τυποποιημένα υπόλοιπα από τα αρνητικά. Τα σημεία θα πρέπει να είναι τοποθετημένα τυχαία πάνω και κάτω από τη γραμμή και ταυτόχρονα να μη σχηματίζουν συσσωρεύσεις και πρότυπα. Με άλλα λόγια δε θα πρέπει η τιμή των υπολοίπων να εξαρτάται από τη σειρά με την οποία καταχωρήθηκαν μία προς μία οι οντότητες. (Δαφέρμος, 2005) Ο σχηματισμός του διαγράμματος γίνεται μέσω του βήματος Graphs Legacy Dialogs Scatter/Dot Simple Scatter Y: Studentized Residual, X: A/A (Εικόνα 4.10) Εικόνα 4.10: Δημιουργία διαγράμματος σκέδασης (Studentized Residuals vs Sequence) Το διάγραμμα σκέδασης που προκύπτει αποτυπώνεται παρακάτω (Διάγραμμα 4.3), και παράλληλα γίνεται επεξεργασία του ώστε να φανεί η τυχαία κατανομή γύρω από τη γραμμή 0. 66

79 Κ ε φ ά λ α ι ο 4 ο Διάγραμμα 4.3: Διάγραμμα σκέδασης (Studentized Residuals vs Sequence) Το διάγραμμα 4.3 παρουσιάζει τα επιθυμητά αποτελέσματα, διότι πρόκειται για μία τυχαία κατανομή των υπολοίπων, η οποία τοποθετείται με ομοιόμορφο τρόπο επάνω και κάτω από τη γραμμή του μηδέν και ταυτόχρονα βρίσκεται εντός μίας ζώνης σταθερού πλάτους (μεταξύ του ±2). Παρατηρείται ότι οι οντότητες 31 και 34 βρίσκονται εκτός της ζώνης σταθερού πλάτους ±2 και άρα είναι πιθανή η απομάκρυνση τους ως πιθανές ακραίες οντότητες σε επόμενο βήμα της εφαρμογής. Παρόλα αυτά, σύμφωνα με το δείκτη Durbin Watson και με το γράφημα σκέδασης των τυποποιημένων υπολοίπων κατά student με τη σειρά καταχώρησης των οντοτήτων (Α/Α) γίνεται σαφές ότι το αρχικό μοντέλο πρόβλεψης των αγοραίων αξιών ακινήτων για την περιοχή του κέντρου της Θεσσαλονίκης πληροί το έλεγχο της ανεξαρτησίας των οντοτήτων Πολυσυγγραμικότητα ή Συγγραμικότητα Πρόβλημα πολυσυγγραμικότητας ή συγγραμικότητας (multicollinearity or collinearity & Singularity) υπάρχει σε εκείνες τις περιπτώσεις όπου κάποιες από τις ανεξάρτητες μεταβλητές X i είναι γραμμικά εξαρτημένες μεταξύ τους, με αποτέλεσμα να δημιουργείται πρόβλημα στα αποτελέσματα που προκύπτουν από την εκτέλεση της πολλαπλής γραμμικής παλινδρόμησης. Σύμφωνα με Λαφαζάνη, 2011 το πρόβλημα πολυσυγγραμικότητας οδηγεί σε αύξηση των τυπικών σφαλμάτων των συντελεστών παλινδρόμησης με αποτέλεσμα οι συντελεστές αυτοί να μη θεωρούνται αξιόπιστοι για το μοντέλο. Μία σειρά από δείκτες και συντελεστές που αναλύονται παρακάτω βοηθούν στον έλεγχο ύπαρξης ή όχι πολυσυγγραμικότητας και εντοπίζουν την ανεξάρτητη μεταβλητή που συσχετίζεται με άλλη ή άλλες ή τις ομάδες ισχυρά συσχετισμένων μεταβλητών. Μεταπτυχιακή διατριβή 67

80 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Σύμφωνα με τον Μούτσικα, 2004 ένας απλός τρόπος αντιμετώπισης της πολυσυγγραμικότητας είναι η αφαίρεση ορισμένων ανεξάρτητων μεταβλητών, με την ταυτόχρονη όμως μείωση της πληροφορίας. Πιο συγκεκριμένα, στο μοντέλο θα πρέπει να κρατηθεί μόνο μία από τις ανεξάρτητες μεταβλητές όπου συσχετίζονται γραμμικά. Επισημαίνει επίσης ότι επειδή δεν είναι πάντα μία εύκολη διαδικασία, υπάρχουν και εναλλακτικές μέθοδοι (πχ. Principal components regression). Στην περίπτωση όπου οι παρακάτω συντελεστές και δείκτες δείξουν πρόβλημα πολυσυγγραμικότητας, τότε θα πρέπει να γίνει αφαίρεση της αντίστοιχης ανεξάρτητης μεταβλητής. Παράγοντας ανοχής (Tolerance factor) & Παράγοντας πληθωριστικής διακύμανασης (Variance inflation factor) Το SPSS υπολογίζει τον παράγοντα ανοχής και πληθωριστικής διακύμανσης μέσα από τον πίνακα των συντελεστών παλινδρόμησης (Coefficients), όπως φαίνεται παρακάτω (Πίνακας 4.5). Όταν η τιμή του παράγοντα ανοχής είναι μικρότερη από μία κρίσιμη τιμή, τότε η αντίστοιχη μεταβλητή X i απορρίπτεται από το μοντέλο πολλαπλής παλινδρόμησης, διότι είναι γραμμικός συνδυασμός των άλλων ανεξάρτητων μεταβλητών. Γενικά, οι τιμές του δείκτη tolerance βρίσκονται στο διάστημα [0,1]. Οριακή τιμή για τον έλεγχο αποτελεί το 0,5. Τιμές μεγαλύτερες από 0,5 είναι ικανοποιητικές για την παραδοχή της πολυσυγγραμικότητας, ενώ τιμές μικρότερες του 0,5 φανερώνουν ότι η μεταβλητή αποτελεί γραμμικό συνδυασμό των υπόλοιπων ανεξάρτητων μεταβλητών. Επίσης, η τιμή (1 tolerance)% μίας μεταβλητής είναι το ποσοστό της μεταβλητότητας της μεταβλητής, το οποίο μπορούν να εξηγήσουν οι υπόλοιπες ανεξάρτητες μεταβλητές του μοντέλου. (Αγγελίδης, 2009) Στην προκειμένη περίπτωση, οι τιμές του παράγοντα ανοχής για τις τρεις ανεξάρτητες μεταβλητές Εμβαδόν, Βαθμός συντήρησης ακινήτου και Παλαιότητα είναι αντίστοιχα 0.938, 0.786, 0.789, συνεπώς δεν υπάρχει πρόβλημα πολυσυγγραμικότητας σύμφωνα με τον πρώτο έλεγχο. Αντίστοιχα, η τιμή του παράγοντα πληθωριστικής διακύμανσης μεγαλώνει όταν ο παράγοντας T i μικραίνει. Σύμφωνα με την ηλεκτρονική βοήθεια του SPSS, τιμή μεγαλύτερη του 2, δείχνει ένα δείκτη που θεωρείται συνήθως προβληματικός. Σύμφωνα με τον Αγγελίδη, 2009 οριακή τιμή για τον δείκτη VIF είναι το 5, ενώ πιο ελαστική ανοχή θα μπορούσε να είναι και η τιμή 10. Σύμφωνα με τον πίνακα 4.5, οι αντίστοιχες τιμές VIF 1, VIF 7, VIF 2 είναι 1.066, 1.271, Παρατηρείται ότι όλες είναι εντός του ορίου που αναφέρει η θεωρία, άρα και ο έλεγχος του δεύτερου δείκτη δεν παρουσιάζει πρόβλημα συγγραμικότητας μεταξύ των ανεξάρτητων μεταβλητών. 68

81 n1 Κ ε φ ά λ α ι ο 4 ο Πίνακας4.5: Πίνακας Coefficients, όπου δίνονται οι δείκτες για τον έλεγχο συγγραμικότητας Tolerance & VIF Coefficients a Model Unstandardized Standardized 95,0% Confidence Collinearity Coefficients Coefficients Interval for B Correlations Statistics Lower Upper Zero- B Std. Error Beta t Sig. Bound Bound order Partial Part Tolerance VIF 3 (Constant) , ,749 -,575, , ,746 X1 1595, ,167,722 9,902, , ,702,716,798,700,938 1,066 X , ,896,284 3,570, , ,001,292,431,252,786 1,271 X2-920, ,517 -,257-3,235, , ,359 -,469 -,397 -,789 1,268,229 Έλεγχος ιδιοτιμών (Eigenvalues) & Δεσμευμένοι δείκτες (Condition indexes) Στον πίνακα Collinearity Diagnostics όπως φαίνεται παρακάτω δύο στήλες (Eigenvalue και condition index ) αποτελούν επίσης μέτρα για τη διάγνωση συγγραμικότητας. Όσον αφορά το δείκτη των ιδιοτιμών (Eigenvalues) τιμές οι οποίες βρίσκονται πολύ κοντά στο 0 φανερώνουν γραμμική συσχέτιση των ανεξάρτητων μεταβλητών. Όπως παρατηρείται από τον πίνακα 4.6 οι τιμές του δείκτη για κάθε μία ανεξάρτητη μεταβλητή δεν είναι πάρα πολύ κοντά στην τιμή του μηδέν και άρα δεν εμφανίζεται πρόβλημα πολυσυγγραμμικότητας σύμφωνα με τις τιμές Eigenvalues. Όσον αφορά τους δεσμευμένους δείκτες, τιμές μεγαλύτερες του 15 παρουσιάζουν ένα πιθανό πρόβλημα, ενώ εάν ξεπεράσουν την τιμή 30, τότε υπάρχει σίγουρα μεγάλο πρόβλημα συγγραμικότητας. (Αγγελίδης, 2009) Όμοια από τα στοιχεία του πίνακα διαπιστώνεται ότι οι τιμές των δεσμευμένων δεικτών δεν ξεπερνούν την τιμή 15 και άρα δεν εμφανίζουν κάποια ένδειξη ύπαρξης πολυσυγγραμμικότητας. Πίνακας4.6: Πίνακας Collinearity diagnostics, όπου δίνονται οι δείκτες για τον έλεγχο συγγραμικότητας Eigenvalue και Condition Index Collinearity Diagnostics a Model Dimension Condition Variance Proportions Eigenvalue Index (Constant) X1 X7 X ,640 1,000,00,01,01,01 2,219 4,076,00,01,43,13 3,122 5,458,00,56,05,23 4,019 13,773 1,00,42,50,63 Μεταπτυχιακή διατριβή 69

82 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Κανονικότητα Σύμφωνα με τον Σιάρδο, 2000 η κανονικότητα δεν θα πρέπει να αποκλείεται όταν η κατανομή των υπολοίπων δεν εμφανίζεται απόλυτα κανονική. Επισημαίνει, επίσης ότι η ανεπιτυχής προσαρμογή του υποδείγματος της παλινδρόμησης, η μεταβλητότητα στη διακύμανση, ο μικρός αριθμός των διαθέσιμων υπολοίπων κ.α. δε βοηθούν στην ακριβή διαπίστωση της κανονικότητας. Για αυτό το λόγο για την ικανοποίηση του ελέγχου της κανονικότητας σε ένα παλινδρομικό μοντέλο προτείνει την χρησιμοποίηση περισσότερων τρόπων. Ταυτόχρονα, σύμφωνα με το Δαφέρμο, 2005 για τους τρόπους ελέγχου της κανονικότητας θα πρέπει αρχικά να ληφθεί υπόψη το μέγεθος του δείγματος. Στις περιπτώσεις εκείνες που το δείγμα είναι μικρότερο από 30 παρατηρήσεις, χρησιμοποιούνται τα συνήθη residuals ή τα standardized residuals. Αντίθετα, όταν το δείγμα είναι μεγάλο, δηλαδή μεγαλύτερο από 30 παρατηρήσεις για την παραδοχή της κανονικότητας αξιοποιούνται τα studentized residuals. Το χαρακτηριστικό τους είναι ότι στα μεγάλα δείγματα τα studentized residuals ακολουθούν την κανονική κατανομή και συνεπώς πρέπει να ελεγχθεί εάν αυτό συμβαίνει στην προκειμένη περίπτωση. Ωστόσο, είναι σαφές ότι εάν ληφθούν υπόψη τα Studentized Deleted Residuals η παραδοχή της κανονικότητας ελέγχεται με ακόμη πιο ακριβή τρόπο. Για τον έλεγχο αρχικά αξιοποιείται το ιστόγραμμα των Studentized Deleted Residuals που έχει ήδη παραχθεί μέσω της διαδικασίας Analyze Regression Linear. Επίσης, μέσω της εντολής Analyze Descriptive Statistics Explore και των επιλογών που φαίνονται αναλυτικά στην εικόνα 4.11 παράγονται για τον έλεγχο της κανονικότητας τέσσερα ακόμη διαγράμματα και ένας πίνακας. Συγκεντρωτικά, οι τρόποι ελέγχου είναι οι ακόλουθοι: 1) Φυλλογράφημα των υπολοίπων (Εντολή Explore) 2) Test of normality : Kolmogorv Smirnov, Lillefors, Shapiro Wilk (Εντολή Explore) 3) Normal Q-Q Plot of Studentized deleted residuals (Εντολή Explore) 4) Detrended normal Q-Q Plot Studentized Deleted residuals (Εντολή Explore) 5) Histogram Studentized Deleted Residuals (Εντολή Explore) 6) Histogram standardized residuals (Εκτέλεση πολλαπλής γραμμικής παλινδρόμησης) 7) Normal P-P Plot of regression standardized residuals (Εκτέλεση πολλαπλής γραμμικής παλινδρόμησης) 8) Θηκόγραμμα των υπολοίπων (Boxplot of Residuals) (Εντολή Explore) 70

83 Κ ε φ ά λ α ι ο 4 ο Εικόνα4.11: Βήματα εκτέλεσης της διαδικασίας Explore Φυλλογράφημα των υπολοίπων [Stem And- Leaf- Plot of residuals Studentized deleted residuals] Το φυλλογράφημα των υπολοίπων, όπως φαίνεται και από την παρακάτω εικόνα έχει τη μορφή του ιστογράμματος στραμμένου 90 ο με τη φορά των δεικτών του ρολογιού. Τα δεδομένα ταξινομούνται, δίνοντας αρχικά προτεραιότητα στην τιμή του ακέραιου μέρους τους και μετά στην τιμή του δεκαδικού, σε οριζόντιες σειρές. Επίσης οι τιμές χωρίζονται σε δύο τμήματα, τον κορμό (stem) και το φύλλο (leaf). Μεταπτυχιακή διατριβή 71

84 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Το φυλλογράφημα παρέχει πληροφορίες που αφορούν τον προσδιορισμό του εύρους των τιμών μιας κατανομής, τον εντοπισμό του διαστήματος που παρατηρείται η μεγαλύτερη συγκέντρωση τιμών, την παρουσία ή όχι ασυμμετρίας στη μορφή της κατανομής και μία πρώτη προσέγγιση στην ύπαρξη ή όχι ακραίων τιμών. (Μισιρλόγλου, 2011) Studentized Deleted Residual Stem-and-Leaf Plot Frequency Stem & Leaf 4, , , , , , , , , Stem width: 1,00000 Each leaf: 1 case(s) Διάγραμμα 4.4: Φυλλογράφημα των υπολοίπων για την περιοχή του κέντρου της Θεσσαλονίκης (αρχικό δείγμα 60 οντοτήτων) Σύμφωνα με το φυλλογράφημα που παράγεται, μέσω της εντολής Explore, για την περιοχή του κέντρου δεν επισημαίνονται ακραίες τιμές και όλα τα Studentized Deleted Residuals ακολουθούν την κανονική κατανομή, όπως φαίνεται από την γνωστή καμπανοειδή μορφή που σχηματίζεται, στραμμένη όμως κατά 90 ο. Test of normality : Kolmogorv Smirnov, Lillefors, Shapiro Wilk Από τον παρακάτω πίνακα το στατιστικό κριτήριο Shapiro Wilk επιλέγεται να εφαρμοστεί στα μικρά δείγματα, ενώ το Kolmogorov Smirnov στα μεγάλα δείγματα (μεγαλύτερα των 30 οντοτήτων). Πίνακας4.7: Πίνακας Tests of Normality Kolmogorv Smirnov, Lillefors, Shapiro Wilk Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. Studentized Deleted Residual,067 60,200 *,978 60,345 72

85 Κ ε φ ά λ α ι ο 4 ο Ο έλεγχος της υπόθεσης της κανονικότητας των υπολοίπων γίνεται με τη χρήση του ελέγχου Kolmogorov Smirnov: Μηδενική Υπόθεση Ho: Τα υπόλοιπα κατανέμονται κανονικά και Εναλλακτική Υπόθεση H1: Τα υπόλοιπα δεν κατανέμονται κανονικά. Το τεστ για την κανονικότητα των Kolmogorov Smirnov και των Shapiro Wilk δίνει επίπεδο στατιστικής σημαντικότητας (Sig.) 20% και 34,5% αντίστοιχα, δηλαδή μεγαλύτερο του 5%. Συνεπώς, δεν μπορεί να απορριφθεί η υπόθεση ότι τα Studentized Deleted Residuals ακολουθούν την κανονική κατανομή. Normal Q-Q Plot of Studentized deleted Residuals Ο συγκεκριμένος τρόπος ελέγχου γίνεται μέσω της σύγκρισης της παρατηρούμενης αθροιστικής κατανομής των υπολοίπων προς την προσδοκώμενη αθροιστική κατανομή τους, παρατηρώντας τον τρόπο διασποράς τους ως προς την ευθεία γραμμή της κανονικής θεωρητικής κατανομής. (Σιάρδος, 2000) Διάγραμμα 4.5: Διάγραμμα κανονικότητας Normal Q-Q Plot of Studentized deleted Residuals για τον έλεγχο της κανονικότητας των υπολοίπων Μεταπτυχιακή διατριβή 73

86 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Από το παραπάνω γράφημα παρατηρείται ότι υπάρχουν διαφοροποιήσεις στα σημεία του διαγράμματος σε σχέση με τη γραμμή που ορίζει την πλήρη κανονικότητα, οι οποίες όμως δεν απορρίπτουν την περίπτωση της κανονικής κατανομής. Detrended normal Q-Q Plot Studentized Deleted residuals Το διάγραμμα «Detrended normal Q-Q Plot Studentized Deleted residual» (Διάγραμμα 4.6) απεικονίζει στον άξονα Χ τις παρατηρούμενες τιμές των Studentized Deleted Residuals, στον άξονα Υ τα ποσοστιαία σημεία μίας τυπικής κανονικής κατανομής και παρουσιάζει την απόκλιση των υπολοίπων από την κανονική κατανομή. Στο παρακάτω διάγραμμα εμφανίζεται μία τάση συγκέντρωσης των σημείων, η οποία οδηγεί στο συμπέρασμα ότι πιθανόν να πρέπει να απομακρυνθούν ορισμένα σημεία για τη βελτίωση της κανονικότητας στο μοντέλο. Διάγραμμα 4.6: Διάγραμμα Detrended normal Q-Q Plot Studentized Deleted residuals για τον έλεγχο της κανονικότητας των υπολοίπων Histogram Studentized Deleted Residuals Στο παρακάτω ιστόγραμμα (Διάγραμμα 4.7), το οποίο παράγεται μέσω της διαδικασίας Explore, εμφανίζεται μία μορφή κανονικότητας με ορισμένες εξαιρέσεις εκτροπών. Επίσης, στο διάγραμμα φαίνεται ότι υπάρχουν τιμές των υπολοίπων που ξεπερνούν την τιμή 2, γεγονός που συνεπάγεται την ανάγκη βελτιστοποίησης του μοντέλου. 74

87 Κ ε φ ά λ α ι ο 4 ο Διάγραμμα 4.7: Ιστόγραμμα των Studentized Deleted Residuals για τον έλεγχο της κανονικότητας των υπολοίπων Histogram Standardized Residuals Διάγραμμα 4.8: Ιστόγραμμα των Standartized Residuals για τον έλεγχο της κανονικότητας των υπολοίπων Μεταπτυχιακή διατριβή 75

88 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Υπάρχουν διάφορες γραφικές μέθοδοι για τον έλεγχο της κανονικότητας, εκ των οποίων το ιστόγραμμα συχνοτήτων του παραπάνω διαγράμματος (Διάγραμμα 4.8) χρησιμοποιείται πάρα πολύ συχνά στη συνήθη στατιστική ανάλυση. Πρόκειται για διάγραμμα που δημιουργήθηκε από την κύρια διαδικασία εκτέλεσης της γραμμικής παλινδρόμηση και όπως φαίνεται και από αυτό το διάγραμμα υπάρχουν ακραίες οντότητες που επιδρούν στην κανονικότητα του μοντέλου. Διάγραμμα Normal P-P Plot of regression standardized residuals Το παρακάτω γράφημα αναμενόμενης παρατηρούμενης αθροιστικής συχνότητας, δείχνει ότι η πλειοψηφία των παρατηρήσεων συγκεντρώνονται γύρω από την ευθεία γραμμή, με ελάχιστες αποκλίσεις που δεν επηρεάζουν όμως σημαντικά την κανονικότητα. Διάγραμμα 4.9: Διάγραμμα Normal P-P Plot of regression standardized residuals για τον έλεγχο της κανονικότητας των υπολοίπων Θηκόγραμμα των υπολοίπων (Boxplot of Residuals) Το θηκόγραμμα είναι ένας χαρακτηριστικός τύπος γραφήματος, ο οποίος βοηθά στην αναγνώριση των ακραίων τιμών του δείγματος 19 και στον προσδιορισμό με άμεσο τρόπο της θέσης των δεδομένων ως προς τη διάμεσο. Στο θηκόγραμμα στο σημείο που βρίσκεται 19 Ακραίες ή ασυνήθιστες λέγονται οι τιμές που είναι είτε πολύ μεγαλύτερες είτε πολύ μικρότερες από τον κύριο όγκο των δεδομένων. 76

89 Κ ε φ ά λ α ι ο 4 ο η διάμεσος υπάρχει μία οριζόντια γραμμή (Βλ. Διάγραμμα 4.10), η οποία βοηθά στον προσδιορισμό της ασυμμετρίας της κατανομής στο δείγμα. Διάγραμμα 4.10: Θηκόγραμμα για τον εντοπισμό των ακραίων τιμών του δείγματος μέσω της διαδικασίας Explore Στην προκειμένη περίπτωση, η διάμεσος του θηκογράμματος που αναφέρεται στο παλινδρομικό μοντέλο του κέντρου βρίσκεται στο κέντρο του ορθογωνίου, αλλά παρατηρείται ότι η μέγιστη τιμή της παρατήρησης των Studentized Deleted Residuals βρίσκεται μεταξύ των τιμών 2 και 3. Συνεπώς, είναι πιθανό να υπάρχουν οντότητες που εάν αγνοηθούν από το μοντέλο, μπορούν να βελτιώσουν την κανονικότητα του μοντέλου Ισότητα διακυμάνσεων/ομοσκεδαστικότητα Ο έλεγχος της ομοσκεδαστικότητας πραγματοποιείται για να ελεγχθεί η σχέση ανάμεσα στα υπόλοιπα και στις προβλεπόμενες από το μοντέλο τιμές. Η ανυπαρξία σχέσης ονομάζεται ομοσκεδαστικότητα και φανερώνει μία σταθερότητα στη διασπορά. (Δαφέρμος, 2005). Ο έλεγχος πραγματοποιείται μέσω της ερμηνείας των ακόλουθων διαγραμμάτων: Studentized Deleted Residuals vs Standardized Predicted Values Studentized Residuals vs Standardized Predicted Values Standardized Predicted Values vs Dependent Variable Στα δύο πρώτα διαγράμματα ο ομοσκεδαστικότητα ικανοποιείται όταν οι κουκκίδες των σημείων είναι τυχαία κατανεμημένες στο διάγραμμα. Αντίθετα, πρόβλημα ετεροσκεδασικότητας, δηλαδή ύπαρξη σχέσης μεταξύ των υπολοίπων (residuals) και των Μεταπτυχιακή διατριβή 77

90 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ προβλεπόμενων από το μοντέλο τιμών (predicted values), υφίσταται όταν εμφανίζονται πρότυπα και τάσεις στα δύο πρώτα διαγράμματα. Τα δύο πρώτα διαγράμματα ταιριάζουν πολύ διότι, το πρώτο (Διάγραμμα 4.11) που κατασκευάστηκε κατά τη διαδικασία εκτέλεσης της πολλαπλής γραμμικής παλινδρόμησης έχει στον Υ άξονα τα διαγραμμένα κατά student υπόλοιπα και στον Χ άξονα τις τυποποιημένες εκτιμώμενες/προβλεπόμενες τιμές του δείγματος των 60 τιμών, ενώ από την άλλη μεριά το δεύτερο διάγραμμα (Διάγραμμα 4.12) στον άξονα Y έχει τα κατά Student υπόλοιπα και στον άξονα Χ, τις τυποποιημένες προβλεπόμενες τιμές του δείγματος. Διάγραμμα 4.11: Διάγραμμα σκέδασης των Studentized Deleted Residuals με τα Standardized Predicted Values Το διάγραμμα 4.11 δείχνει τα σημεία τοποθετημένα μέσα σε μία σταθερή ζώνη γύρω από το 0 με εύρος από το -2 έως το 2. Παρατηρείται ότι οι οντότητες με Α/Α 31 και 34 ξεφεύγουν από τα όρια που έχουν τεθεί στο διάγραμμα και παρατηρείται μία μικρή τάση συγκέντρωσης των σημείων. Συνεπώς, παρόλο που οριακά ισχύει η ισότητα των διακυμάνσεων, υποδεικνύονται οντότητες που με την πιθανή απομάκρυνση τους να υπάρξει βελτίωση του διαγράμματος. Η ίδια λογική ακριβώς ισχύει και στο παρακάτω διάγραμμα, το οποίο όπως παρατηρείται δίνει τις ίδιες πληροφορίες. 78

91 Κ ε φ ά λ α ι ο 4 ο Διάγραμμα 4.12: Διάγραμμα σκέδασης των Studentized Residuals με τα Standardized Predicted Values Το τρίτο διάγραμμα απεικονίζει τη διασπορά των εκτιμώμενων τιμών έναντι των παρατηρούμενων. Πιο συγκεκριμένα, στον άξονα Υ βρίσκονται οι τυποποιημένες προβλεπόμενες τιμές, ενώ στον άξονα Χ οι παρατηρούμενες. Η ευθεία στο κέντρο αντιπροσωπεύει την ευθεία των ελαχίστων τετραγώνων και τα σημεία συσσωρεύονται με ομοιόμορφο τρόπο γύρω από αυτήν μέσα σε μία ζώνη σταθερού πλάτους. Στο διάγραμμα παρατηρούνται δύο οντότητες, οι οποίες οριακά είναι εκτός του εύρους (οντότητες 31 και 38). Μεταπτυχιακή διατριβή 79

92 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Διάγραμμα 4.13: Διάγραμμα σκέδασης των τυποποιημένων προβλεπόμενων τιμών έναντι των παρατηρούμενων Εν κατακλείδι σύμφωνα με τα διαγράμματα 4.11, 4.12 και 4.13 ικανοποιείται η απαίτηση της ομοσκεδαστικότητας Γραμμικότητα Η ύπαρξη γραμμικής σχέσης μεταξύ των μεταβλητών Υ με τις Χ i είναι ίσως η πρώτη βασική υπόθεση που γίνεται για το μοντέλο πολλαπλής παλινδρόμησης. Ο έλεγχος της συγκεκριμένης παραδοχής πραγματοποιείται με τη βοήθεια τεσσάρων κατηγοριών διαγραμμάτων. Η οπτική ερμηνεία και αξιολόγηση τους δίνουν απαντήσεις για την ύπαρξη γραμμικότητας ή όχι. Τα διαγράμματα που αξιοποιούνται είναι τα ακόλουθα: 1) Διαγράμματα σκέδασης της εξαρτημένης μεταβλητής με κάθε ανεξάρτητη. Πρόκειται για το διάγραμμα 4.1, το οποίο παρουσιάστηκε σαν πρωταρχικό βήμα πριν αναλυθούν τα αποτελέσματα της εκτέλεσης της παλινδρόμησης, διότι δίνει μία πρώτη εικόνα της σχέσης μεταξύ εξαρτημένης και κάθε ανεξάρτητης μεταβλητής. Σύμφωνα με το διάγραμμα Matrix, υπάρχει γραμμικότητα μεταξύ της εξαρτημένης μεταβλητής Υ και των ανεξάρτητων μεταβλητών Χ1 (Εμβαδόν), Χ2 (Παλαιότητα) και Χ7 (Κατάσταση ακινήτου). 2) Διάγραμμα σκέδασης των διαγραμμένων κατά student υπολοίπων με τις τυποποιημένες προβλεπόμενες τιμές (Studentized deleted residuals vs standardized predicted values), το οποίο είναι το διάγραμμα 4.11 που χρησιμοποιείται για τον έλεγχο της ισότητας/σταθερότητας των διακυμάνσεων. Το διάγραμμα παρουσιάζει γραμμικότητα, αλλά υποδεικνύει ότι υπάρχουν πιθανοί τρόποι βελτίωσης, αφαιρώντας τα κατάλληλα σημεία. 3) Διαγράμματα μερικής παλινδρόμησης/ συσχέτισης (Partial Regression Plots) τα οποία αξιοποιήθηκαν για τον έλεγχο σημαντικότητας των ανεξάρτητων μεταβλητών Χi (Βλ Διαγράμματα με αριθμούς 1,2,7 στο διάγραμμα 4.2). Βασικό χαρακτηριστικό των διαγραμμάτων μερικής συσχέτισης είναι ότι αποτελούν ίσως τον πιο αξιόπιστο έλεγχο της γραμμικότητας, όσο και της καλής προσαρμογής του υποδείγματος της παλινδρόμησης (Σιάρδος, 2000) 4) Διάγραμμα σκέδασης των κατά student υπολοίπων με τις τυποποιημένες προβλεπόμενες τιμές (Studentized residual vs standardized predicted values),το οποίο είναι το διάγραμμα 4.12 που χρησιμοποιείται για τον έλεγχο της ισότητας/σταθερότητας των διακυμάνσεων Σύμφωνα με όλα τα παραπάνω διαγράμματα που έχουν μελετηθεί σε προηγούμενα στάδια, ισχύει η ύπαρξη γραμμικότητας μεταξύ της αγοραίας αξίας των ακινήτων με το εμβαδό, την παλαιότητα και την κατάσταση του ακινήτου (π.χ. Partial Plots), με την ταυτόχρονη όμως υπόδειξη οντοτήτων που είναι πιθανή η απομάκρυνση τους για τη βελτιστοποίηση του μοντέλου. 80

93 Κ ε φ ά λ α ι ο 4 ο Ακραίες οντότητες και οντότητες επίδρασης Στο σύνολο ενός δείγματος πολλές είναι οι φορές ύπαρξης παρατηρήσεων με διαφορετική συμπεριφορά σε σχέση με όλες τις υπόλοιπες. Οι λόγοι μπορεί να είναι ακόμη και τυχαίο λάθος κατά τη συλλογή του δείγματος ή κατά τη διάρκεια επεξεργασίας του από το μελετητή. Οποιαδήποτε και αν είναι η αιτία που τις καθιστά αποκομμένες, θα πρέπει να γίνει έλεγχος τους είτε με τη βοήθεια δεικτών, κατανομών ή διαγραμμάτων ώστε να κριθεί εάν πρέπει να απομακρυνθούν ή όχι από το δείγμα. Αυτού του είδους οι παρατηρήσεις διακρίνονται σε δύο βασικές κατηγορίες. Η πρώτη κατηγορία περιλαμβάνει τις ακραίες τιμές που έχουν πολύ μικρή επίδραση στα αποτελέσματα της ανάλυσης και ονομάζονται ακραίες οντότητες (outliers). Η δεύτερη κατηγορία περιλαμβάνει τις παρατηρήσεις που φτάνουν στο σημείο να επηρεάσουν ριζικά την ανάλυση παλινδρόμησης και κατ επέκταση τους συντελεστές παλινδρόμησης 20 και ονομάζονται οντότητες επίδρασης (influential points). Όπως γίνεται σαφές για το σχηματισμό ενός γραμμικού μοντέλου πολλαπλής παλινδρόμησης θα πρέπει να απομακρυνθεί κάθε είδους παρατήρηση που επηρεάζει αισθητά το αποτέλεσμα και για αυτό οι έλεγχοι που ακολουθούν είναι ιδιαίτερα σημαντικοί. Σύμφωνα με το Δαφέρμο, 2005 ο έλεγχος ύπαρξης των outliers γίνεται με τη βοήθεια της απόστασης Mahalanobis (Mahalanobis distance D i 2 ) και του Levarage h i (centered leverage). Επίσης τρία γραφήματα βοηθούν στον εντοπισμό τους και είναι τα διαγράμματα σκέδασης 1) Cook s distance με Centered Leverage Values 2) Standardized DFFITS με την αύξουσα σειρά των παρατηρήσεων A/A και 3) Standardized DFBETA X i με A/A. Ο έλεγχος των influential points γίνεται με τη βοήθεια της απόστασης Cook (Cook s Distance : CD i ), του μέτρου DFFITS (Standardized DFFITS), του μέτρου DFBetas (Standardized DFBetas), της κατανομής t (Διαδικασία BONFERRONI), της κατανομής F και με τη βοήθεια των ίδιων ειδικών γραφημάτων που αναφέρθηκαν παραπάνω για τον έλεγχο των outliers, δηλ. 1) Cook s distance με Centered Leverage Values 2) Standardized DFFITS με την αύξουσα σειρά των παρατηρήσεων A/A και 3) Standardized DFBETA X i με A/A. Όλοι οι παραπάνω έλεγχοι πραγματοποιούνται αναλυτικά στα υποκεφάλαια που ακολουθούν Χρήση δεικτών για τον εντοπισμό των ακραίων οντοτήτων (outliers) Οι οντότητες του δείγματος που αποτελούν ακραίες οντότητες έχουν άμεση επίδραση στην κλίση της ευθείας παλινδρόμησης και όχι στους συντελεστές παλινδρόμησης (Δαφέρμος, 2005). Η εύρεση τους δε σημαίνει άμεση απομάκρυνση του σημείου, αλλά περαιτέρω διερεύνηση για την πιθανότητα να αποτελεί οντότητα επίδρασης. Οι δύο δείκτες που ελέγχονται είναι η απόσταση Mahalanobis και η τιμή Leverage. 20 «είναι μία παρατήρηση η οποία όταν απαλειφθεί από την ανάλυση, προκαλεί μία ουσιαστική αλλαγή σε τουλάχιστον έναν από τους συντελεστές μερικής παλινδρόμησης.» Δαφέρμος, 2005 Μεταπτυχιακή διατριβή 81

94 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Απόσταση Mahalanobis 2 Το βασικό χαρακτηριστικό της απόστασης Mahalanobis D i είναι ότι ο υπολογισμός της στηρίζεται αποκλειστικά στις τιμές των ανεξάρτητων μεταβλητών και όχι της εξαρτημένης. Κατά τη διαδικασία εκτέλεσης της πολλαπλής γραμμικής παλινδρόμησης, όπως φαίνεται από την εικόνα 4.8, επιλέγεται να υπολογιστούν αυτόματα όλες οι αποστάσεις, δείκτες και μέτρα που αξιοποιούνται στον έλεγχο των ακραίων τιμών, οι τιμές των οποίων εισάγονται σε νέες στήλες στο παράθυρο του Data Editor. Σε αυτές τις τιμές που υπολογίζονται αυτόματα είναι το μέτρο Mahalanobis που εκφράζει της απόσταση κάθε οντότητας από το κέντρο βάρους όλων των άλλων οντοτήτων. Μεγάλη τιμή της απόστασης συνεπάγεται πιθανότητα ύπαρξης ακραίας οντότητας. Παρόλα αυτά δεν πραγματοποιείται ο συγκεκριμένος έλεγχος, διότι σύμφωνα με την ίδια πηγή (Δαφέρμος, 2005) στην τιμή Leverage δίνεται μεγαλύτερη βαρύτητα και ο έλεγχος της καλύπτει και τον έλεγχο της απόστασης Mahalanobis. Centered Leverage Στην περίπτωση του SPSS, σύμφωνα με τον Δαφέρμο, 2005 σημασία έχει ο υπολογισμός του κεντραρισμένου Leverage, η τιμή του οποίου δίνεται από τη σχέση Centered Leverage = h i - = - όπου h i η τιμή Leverage, n ο αριθμός του δείγματος και D i 2 η απόσταση Mahalanobis. Σύμφωνα με τη διεθνή βιβλιογραφία επισημαίνονται τα εξής κριτήρια ελέγχου για την τιμή Leverage: 1) Δεν θα πρέπει να ξεπερνά την τιμή, όπου p είναι ο αριθμός των συντελεστών παλινδρόμησης μαζί με το σταθερό όρο και n το μέγεθος του δείγματος. 2) Θα πρέπει οι τιμές Levarage να βρίσκονται στο διάστημα (0, ), δηλαδή στο (0, 0,98) 3) Τιμές μικρότερες του 0,2 δεν θεωρούνται ακραίες τιμές για τις προβλεπόμενες τιμές 4) Τιμές μεγαλύτερες του 0,2 και μικρότερες του 0,5 χαρακτηρίζονται επικίνδυνες και πρέπει να εξετάζονται εκτενέστερα για την πιθανή απομάκρυνση τους 5) Τιμές μεγαλύτερες από την τιμή 0,5 πρέπει να αποφεύγονται Σύμφωνα με το τρίτο κριτήριο οι τιμές δε θα πρέπει να ξεπερνούν την τιμή 0,2. Από τον έλεγχο όλων των οντοτήτων της στήλης LEV στην επιφάνεια του Data Εditor, καμία οντότητα δεν ξεπερνά την τιμή 0,2. Συνεπώς, σύμφωνα με τον πρώτο έλεγχο εύρεσης ακραίων οντοτήτων, δεν υπάρχει καμία οντότητα που να θεωρείται αποκομμένη σε σχέση με τις υπόλοιπες οντότητες του δείγματος. 82

95 Κ ε φ ά λ α ι ο 4 ο Χρήση δεικτών για τον εντοπισμό των οντοτήτων επίδρασης Αποστάσεις Cook CD i Πρόκειται για μέτρο, το οποίο υπολογίζει για κάθε οντότητα τις αλλαγές που συμβαίνουν στις εκτιμήσεις των παλινδρομικών συντελεστών όταν η συγκεκριμένη απαλειφθεί από το παλινδρομικό μοντέλο. Ως ανοχή για τον έλεγχο θεωρείται η μονάδα, καθώς αποστάσεις CDi > 1 σηματοδοτούν ύπαρξη οντότητας επίδρασης. (Δαφέρμος, 2005) Σύμφωνα με τα δεδομένα που προκύπτουν από την εκτέλεση πολλαπλής παλινδρόμησης όλες οι τιμές Cook είναι μικρότερες της μονάδας και άρα δεν υποδεικνύονται οντότητες επίδρασης. Μέτρα DfFits Πρόκειται για μέτρο, το οποίο εκφράζει την επίδραση της κάθε οντότητας στις εκτιμήσεις των παλινδρομικών συντελεστών και ο υπολογισμός του δίνεται από την παρακάτω σχέση. DfFits i = *SDR με hi τιμή Leverage και SDR τα κατά Student διαγραμμένα υπόλοιπα. Σύμφωνα με Δαφέρμο, 2005 στα μεγάλα δείγματα (n>30) κριτήριο για την εύρεση των οντοτήτων επίδρασης είναι η σύγκριση των Standardized DfFits με την τιμή 2* = 0,52, ενώ για τα μικρά δείγματα (n 30) η οριακή τιμή είναι η μονάδα. Πιο συγκεκριμένα, όταν τα Standardized > 2*, τότε θεωρείται ότι η περίπτωση i αποτελεί οντότητα επίδρασης. Με βάση τα στοιχεία του Data Editor και τη στήλη SDF παρατηρείται ότι οι οντότητες 12, 29, 31, 38, 39 και 44 έχουν Standardized DfFits κατά απόλυτη τιμή μεγαλύτερα του 0,52. Οι τιμές αντίστοιχα είναι SDF 12 = 0,86 και SDF 29 = 0,58, SDF 31 = 0,58 SDF 38 = 0,74, SDF 39 = 0,61 και SDF 44 = 0,81. Μέτρα DfBetas Πρόκειται για το μέτρο που εκφράζει την επίδραση της κάθε οντότητας στην εκτίμηση του κάθε παλινδρομικού συντελεστή ξεχωριστά. Για τον υπολογισμό αυτής της επίδρασης πραγματοποιούνται δύο παλινδρομικές αναλύσεις, εκ των οποίων η πρώτη συμπεριλαμβάνει την i οντότητα, ενώ η δεύτερη όχι. Ο υπολογισμός της διαφοράς των δύο τιμών οδηγεί σε τρεις τιμές DfBetas (συνολικά στο μοντέλο συμμετέχουν τρεις ανεξάρτητες μεταβλητές) για κάθε οντότητα του μοντέλου. (Δαφέρμος, 2005) Για τον έλεγχο αξιοποιούνται οι απόλυτες τιμές των τυποποιημένων DfBetas (Standardized DfBetas), οι οποίες συγκρίνονται με μία ποσότητα οριακή για την ύπαρξη οντοτήτων επίδρασης. Πιο συγκεκριμένα, ο Δαφέρμος, 2005 αναφέρει ότι για μεγάλα δείγματα (n>30) απόλυτες τιμές standardized DfBetas μεγαλύτερες από την ποσότητα θεωρούνται οντότητες επίδρασης. Μεταπτυχιακή διατριβή 83

96 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ > = 0,258 Συγκρίνοντας τις τιμές που υπολογίζονται αυτοματοποιημένα από το SPSS με την οριακή τιμή 0,258 εμφανίζονται τα ακόλουθα αποτελέσματα: 1) Οι οντότητες 5, 12, 29, 30, 36, 38, και 44 με αντίστοιχες τιμές των Standardized DfBetas SDB1 5 = 0,27, SDB1 12 = 0,81, SDB1 29 = 0,47, SDB1 30 = 0,29, SDB1 36 = 0,29, SDB1 38 = 0,51 και SDB1 44 = 0,34 ξεπερνούν την οριακή τιμή που τέθηκε και άρα είναι υποψήφιες οντότητες επίδρασης. 2) Οι οντότητες 1, 7, 19, 39, 44, 45, και 47 με αντίστοιχες τιμές των Standardized DfBetas SDB2 1 = 0,32, SDB2 7 = 0,30, SDB2 19 = 0,28, SDB2 39 = 0,48, SDB2 44 = 0,53, SDB2 45 = 0,41 και SDB2 47 = 0,38 όμοια ξεπερνούν την οριακή τιμή και πιθανόν να πρέπει να απομακρυνθούν από το μοντέλο, διότι επιδρούν στο συντελεστή της παλαιότητας στην εξίσωση του παλινδρομικού μοντέλου. 3) Οι οντότητες 12, 19, 31, 34, 38 και 50 με αντίστοιχες τιμές των Standardized DfBetas SDB7 12 = 0,29, SDB7 19 = 0,36, SDB7 31 = 0,40, SDB7 34 = 0,39, SDB7 38 = 0,31 και SDB7 50 = 0,31 ξεπερνούν την οριακή τιμή που τέθηκε και άρα είναι υποψήφιες οντότητες επίδρασης Χρήση γραφημάτων για τον εντοπισμό οντοτήτων επίδρασης Η διαγραμματική απεικόνιση πάντοτε δίνει μία πιο ξεκάθαρη διάσταση των μεγεθών που πρόκειται να συγκριθούν. Τα παρακάτω τρία διαγράμματα σκέδασης βοηθούν στην οπτικοποίηση των ακραίων οντοτήτων και υποψήφιων οντοτήτων επίδρασης. Διάγραμμα σκέδασης των αποστάσεων Cook με κεντραρισμένες τιμές Leverage Στο διάγραμμα σκέδασης 4.14 τοποθετείται κάθε σημείο βάσει της τιμής Leverage και Cook, ώστε με βάσει τις οριακές τιμές ανοχής να φανούν οι ακραίες οντότητες και οντότητες επίδρασης. Σε ένα διάγραμμα Cook vs Leverage είναι πιθανό να φανούν τα εξής αποτελέσματα: - Κάθε οντότητα να έχει απόσταση Cook μικρότερη της μονάδας και τιμή Centered Leverage μικρότερη του 0,2. Σε αυτή την περίπτωση δεν ασκείται επίδραση από καμία παρατήρηση που να χαρακτηρίζεται στατιστικώς σημαντική. - Στη δεύτερη κατηγορία ανήκει η περίπτωση ύπαρξης μίας ή περισσότερων παρατηρήσεων με τιμή Leverage που περνά την τιμή 0,2 και δεν ξεπερνά την τιμή 0,5 όσον αφορά τον Χ άξονα. Σε αυτήν την περίπτωση οι παρατηρήσεις που ξεφεύγουν από το όριο επηρεάζουν την κλίση της ευθείας παλινδρόμησης και όχι το ίδιο το μοντέλο. (Δαφέρμος, 2005) Μένει να αξιολογηθεί εάν η συγκεκριμένη επίδραση κρίνεται από τον ερευνητή ως στατιστικά σημαντική ή όχι. 84

97 Κ ε φ ά λ α ι ο 4 ο - Πιθανή είναι επίσης η εμφάνιση οντοτήτων με τιμές Cook ιδιαίτερα μεγάλες και πιθανόν μεγαλύτερες της μονάδας ενώ η κάθε τιμή που αντιστοιχεί στην Centered Leverage να είναι εντός των επιτρεπόμενων ορίων. Πρόκειται για μία δυσχερέστερη περίπτωση σε σχέση με τις προηγούμενες κατά την οποία δεν υπάρχει επίδραση στην γραμμή παλινδρόμησης, αλλά υπάρχει σημαντική επίδραση στους συντελεστές γραμμικής παλινδρόμησης, άρα στο ίδιο το μοντέλο. Μία τέτοια παρατήρηση αποτελεί οντότητα επίδρασης και εξετάζεται σοβαρά η άμεση απομάκρυνση της. - Η τέταρτη και τελευταία περίπτωση αναφέρεται στο ενδεχόμενο μία τιμή να έχει ιδιαίτερα μεγάλες και τις δύο τιμές, με αποτέλεσμα να είναι υποψήφια οντότητα επίδρασης που επιβάλλεται η απομάκρυνση της από το μοντέλο. Διάγραμμα 4.14: Διάγραμμα σκέδασης των αποστάσεων Cook με τις Centered leverage τιμές Στο διάγραμμα 4.14 καμία παρατήρηση του μοντέλου δεν ξεπερνά τις οριακές τιμές 1 και 0,2, άρα δεν ασκείται από καμία οντότητα ουσιαστική επίδραση στην κλίση της εξίσωσης παλινδρόμησης, αλλά ούτε στο παλινδρομικό μοντέλο. Μεταπτυχιακή διατριβή 85

98 Σ χ η μ α τ ι σ μ ό ς μ ο ν τ έ λ ο υ Διάγραμμα σκέδασης των τυποποιημένων DfFits με την ακολουθία των παρατηρήσεων Α/Α Πρόκειται για διάγραμμα διαφορετικού τύπου (Sequence Chart), το οποίο δείχνει τον τρόπο που εξελίσσεται ο δείκτης Standardized DfFits σύμφωνα με τη σειρά καταχώρησης των παρατηρήσεων. Η κατασκευή του γραφήματος γίνεται μέσω του βήματος Analyze Forecasting Sequence Charts. Στη θέση των μεταβλητών (Variables) εισάγεται η τιμή Standardized DfFits, ενώ στον άξονα των Χ τοποθετείται η αύξουσα σειρά εισαγωγής των οντοτήτων στο δείγμα, όπως φαίνεται στην εικόνα Εικόνα 4.12: Διαδικασία δημιουργίας διαγράμματος σειράς (Sequence) Το αποτέλεσμα της διαδικασίας απεικονίζεται στο διάγραμμα Με κόκκινη γραμμή στο σημείο μηδέν τοποθετείται η αρχή μέτρησης των τιμών, ενώ οι υποψήφιες οντότητες επίδρασης είναι εκείνες που ξεπερνούν την κρίσιμη τιμή 0,52 (Βλ ). Παρατηρούνται πλέον διαγραμματικά οι έξι συνολικά οντότητες (με ΑΑ 12, 29, 31, 38, 39 και 44) που βρίσκονται εκτός της ζώνης που τέθηκε. Οι οντότητες 29, 31 και 38 ξεπερνούν ελάχιστα την τιμή 0,52, ενώ οι οντότητες 12, 39 και 44 φαίνεται να απέχουν αισθητά από το σύνολο των υπόλοιπων οντοτήτων. Όπως φαίνεται υποδεικνύονται αρκετές οντότητες, οι οποίες πιθανόν με την απομάκρυνση τους να οδηγήσουν στη βελτίωση του μοντέλου ως προς την αξιοπιστίας τους την αντιπροσωπευτικότητα του και την δύναμη της προβλεπτικής του ικανότητας. 86

99 Κ ε φ ά λ α ι ο 4 ο Διάγραμμα 4.15: Διάγραμμα Sequence των DfFits με την αύξουσα σειρά του δείγματος Διάγραμμα σκέδασης των τυποποιημένων DfBetas με την ακολουθία των παρατηρήσεων Α/Α Πρόκειται για ένα αντίστοιχο διάγραμμα με αυτό των Standardized DfFit έναντι της σειράς καταχώρησης των περιπτώσεων, με τη διαφορά ότι στον άξονα των Y γίνεται εισαγωγή περισσότερων από μίας μεταβλητών, οι οποίες απεικονίζονται με διαφορετικό χρωματισμό. Δημιουργείται ένα Sequence διάγραμμα (Analyze Forecasting Sequence Charts) με μεταβλητές στον άξονα Υ τις Standardized DfBetas και για τους τρεις συντελεστές του παλινδρομικού μοντέλου (δηλ. DFBeta1, DfBeta2 και DFBeta7), όταν στον Χ άξονα τοποθετείται η σειρά καταχώρησης των παρατηρήσεων Α/Α (Διάγραμμα 4.16). Η ανοχή που δίνεται για τα μεγάλα δείγματα είναι ίση με 0,258 (Βλ ) και οι οντότητες που ξεπερνούν το όριο απεικονίζονται στο παρακάτω διάγραμμα. Με πορτοκαλί γραμμή ορίζεται το πάνω και κάτω όριο έτσι ώστε να είναι ευκολότερα ορατές οι αποκλίσεις των οντοτήτων και τα μεγέθη των αποκλίσεων αυτών. Όπως παρατηρείται μεγαλύτερη επίδραση στον συντελεστή του εμβαδού παρουσιάζει η οντότητα 12 και 38, ενώ έπονται οι 44, 29, 30, 36 και 5 κατά φθίνουσα σειρά επίδρασης. Όσον αφορά τη μεταβλητή Χ2 (Παλαιότητα) μεγαλύτερη επίδραση δείχνει να έχει η οντότητα 44 και έπονται οι 39, 45, 47, 1, 7 και 19. Τέλος, όσον αφορά την μεταβλητή κατάσταση ακινήτου μεγαλύτερη επίδραση εμφανίζει η οντότητα 31 και έπονται οι 34, 19, 38, 50, και 12. Μεταπτυχιακή διατριβή 87

100 Σχηματισμός μοντέλου Διάγραμμα 4.16: Διάγραμμα Sequence των DfBetas με την αύξουσα σειρά του δείγματος Χρήση κατανομών για τον εντοπισμό οντοτήτων επίδρασης t κατανομή H t κατανομή μπορεί να βοηθήσει μέσω της διαδικασίας Bonferroni στον εντοπισμό των οντοτήτων επίδρασης με τη χρήση των Studentized Deleted Residuals που έχουν ήδη υπολογιστεί και βρίσκονται στα δεδομένα του Data Editor. Με τη βοήθεια της κατανομής t αλλά και F που ακολουθεί θα ληφθεί η τελική απόφαση για το εάν οι υποψήφιες οντότητες επίδρασης θα πρέπει να αφαιρεθούν από το μοντέλο ή όχι. Όπου ti ορίζεται η τιμή των Studentized Deleted Residuals, τα οποία ακολουθούν την κανονική κατανομή με βαθμούς ελευθερίας n-p-1 = =55. Πρώτο βήμα αποτελεί ο εντοπισμός της οντότητας με το μεγαλύτερο Studentiz