Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 23 ου Πανελληνίου Συνεδρίου Στατιστικής (2010), σελ.321-328 ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΧΩΡΙΚΩΝ ΔΙΑΦΟΡΟΠΟΙΗΣΕΩΝ ΤΩΝ ΕΠΙΔΡΑΣΕΩΝ ΚΟΙΝΩΝΙΚΟ ΟΙΚΟΝΟΜΙΚΩΝ ΠΑΡΑΓΟΝΤΩΝ ΣΤΗ ΓΟΝΙΜΟΤΗΤΑ ΤΟΥ ΠΛΗΘΥΣΜΟΥ ΤΗΣ ΕΛΛΑΔΑΣ ΣΕ ΕΠΙΠΕΔΟ ΚΑΠΟΔΙΣΤΡΙΑΚΩΝ ΔΗΜΩΝ ΜΕ ΤΗΝ ΕΦΑΡΜΟΓΗ ΥΠΟΔΕΙΓΜΑΤΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΤΑΘΜΙΣΜΕΝΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣΗΣ Απόστολος Τσιμπάνος 1,, Σταμάτης Καλογήρου 2 και Κλέων Τσίμπος 1 1. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης, Πανεπιστήμιο Πειραιώς 2. Τμήμα Γεωγραφίας, Χαροκόπειο Πανεπιστήμιο atsban@unp.gr, skalo@hua.gr, cleon@unp.gr ΠΕΡΙΛΗΨΗ Η Γεωγραφικά Σταθμισμένη Παλινδρόμηση (Geographcally Weghted Regresson) είναι μια τεχνική που αναπτύσσεται τα τελευταία χρόνια και επιτρέπει την εκτίμηση υποδειγμάτων παλινδρόμησης με παραμέτρους που δεν είναι σταθερές στο χώρο. Στην εργασία αυτή περιγράφεται συνοπτικά η μεθοδολογία της Γεωγραφικά Σταθμισμένης Παλινδρόμησης, η οποία στη συνέχεια χρησιμοποιείται στη μελέτη της σχέσης εξάρτησης της γονιμότητας με διάφορους κοινωνικοοικονομικούς παράγοντες στους Καποδιστριακούς Δήμους και Κοινότητες της Ελλάδας. Το συμπέρασμα που εξάγεται από την ανάλυση είναι ότι η κατεύθυνση και το μέγεθος των επιδράσεων των παραγόντων που επηρεάζουν τη γονιμότητα διαφοροποιούνται χωρικά. Λέξεις Κλειδιά: Γεωγραφικά Σταθμισμένη Παλινδρόμηση (GWR), Γονιμότητα 1. ΕΙΣΑΓΩΓΗ Ένα πρόβλημα που εμφανίζεται όταν εκτιμώνται υποδείγματα παλινδρόμησης με παρατηρήσεις που προέρχονται από διαφορετικές γεωγραφικές περιοχές είναι η ύπαρξη χωρικής ετερογένειας στα δεδομένα. Ο όρος χωρική ετερογένεια αναφέρεται στην έλλειψη σταθερότητας στη σχέση μεταξύ των μεταβλητών στις διαφορετικές γεωγραφικές περιοχές. Το φαινόμενο αυτό είναι πολύ συνηθισμένο όταν μελετώνται οικονομικές και δημογραφικές μεταβλητές και οφείλεται στις πληθυσμιακές και εισοδηματικές ανισότητες μεταξύ των περιοχών, στη διαφορετική έκταση που έχουν οι απογραφικές περιοχές και γενικότερα στην ανομοιογένεια των μεταβλητών στο 321
χώρο. Η παρουσία χωρικής ετερογένειας έχει ως αποτέλεσμα τα συμπεράσματα που προκύπτουν από την εκτίμηση ενός υποδείγματος παλινδρόμησης να είναι μη αξιόπιστα. H αντιμετώπιση του προβλήματος της χωρικής ετερογένειας γίνεται με τη χρησιμοποίηση τοπικών υποδειγμάτων (local models). Τα υποδείγματα αυτά θεωρούν ότι οι σχέσεις μεταξύ των μεταβλητών μεταβάλλονται από περιοχή σε περιοχή. Ουσιαστικά, αποτελούν επέκταση μιας ευρύτερης κατηγορίας στατιστικών μέτρων που ονομάζονται τοπικά στατιστικές συναρτήσεις (local statstcs) και που μελετάνε ένα χαρακτηριστικό σε μία συγκεκριμένη περιοχή του χώρου περιλαμβάνοντας στον υπολογισμό τους τη σχέση που υφίσταται με τις γειτονικές περιοχές. Οι τοπικές στατιστικές συναρτήσεις αποτελούν σημαντικό εργαλείο διερευνητικής ανάλυσης περιφερειακών δεδομένων διότι τα αποτελέσματα από την εφαρμογή τους μπορούν να οδηγήσουν τον ερευνητή στον εντοπισμό των χωρικών διαφοροποιήσεων του υπό εξέταση φαινόμενου. Η πιο γνωστή τεχνική εκτίμησης τοπικών υποδειγμάτων είναι η γεωγραφικά σταθμισμένη παλινδρόμηση. Στην εργασία αυτή χρησιμοποιείται η μέθοδος της γεωγραφικά σταθμισμένης παλινδρόμησης για να μελετηθούν οι χωρικές διαφοροποιήσεις στην επίδραση διαφόρων κοινωνικών και οικονομικών παραγόντων στη γονιμότητα του πληθυσμού της Ελλάδας με βάση τα στοιχεία της απογραφής πληθυσμού του 2001. Ειδικότερα, αρχικά περιγράφεται συνοπτικά ο τρόπος που λειτουργεί η μέθοδος και στη συνέχεια εξειδικεύεται ένα υπόδειγμα πολλαπλής γραμμικής παλινδρόμησης που ερμηνεύει τη γονιμότητα και το οποίο εκτιμάται αφενός με τη μέθοδο των ελάχιστων τετραγώνων (OLS) και αφετέρου με τη μέθοδο της γεωγραφικά σταθμισμένης παλινδρόμησης (GWR). Τέλος τα αποτελέσματα συγκρίνονται και σχολιάζονται. 2. Η ΓΕΩΓΡΑΦΙΚΑ ΣΤΑΘΜΙΣΜΕΝΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Έστω το υπόδειγμα της πολλαπλής γραμμικής παλινδρόμησης y x x (1) όπου 2 d N(0, ) 0 1 1 k k και το 1, 2,, n αναφέρεται σε n διαφορετικά γεωγραφικά σημεία. Το ανωτέρω υπόδειγμα συνηθίζεται να ονομάζεται στη βιβλιογραφία ολικό υπόδειγμα (global model) και υποθέτει ότι η σχέση εξάρτησης μεταξύ της εξαρτημένης μεταβλητής και των ανεξάρτητων μεταβλητών παραμένει σταθερή σε όλη την εξεταζόμενη γεωγραφική περιοχή. Η Γεωγραφικά Σταθμισμένη Παλινδρόμηση (Geographcally Weghted Regresson) αποτελεί μια τεχνική που έχει αναπτυχθεί από τους Fotherngham, Brunsdon και Charlton (2002) και επιτρέπει την εκτίμηση υποδειγμάτων με παραμέτρους που δεν παραμένουν σταθερές στο χώρο αλλά μεταβάλλονται. Ουσιαστικά, αποτελεί επέκταση της κλασικής μεθόδου παλινδρόμησης που παρέχει όμως τοπικές εκτιμήσεις των παραμέτρων του υποδείγματος σε κάθε γεωγραφικό σημείο. Εάν θεωρηθεί ότι η σχέση του υποδείγματος (1) δεν είναι σταθερή σε κάθε σημείο του χώρου τότε αυτό γράφεται: y ( u, v ) ( u, v ) x ( u, v ) x (2) 0 1 1 k k 322
όπου ( u, v ) είναι οι συντεταγμένες του σημείου. Δηλαδή, θεωρείται ότι κάθε παράμετρος του υποδείγματος αποτελεί μια συνεχή συνάρτηση των συντεταγμένων ενώ ( u, v ) είναι η τιμή της συνάρτησης αυτής για την k παράμετρο στο σημείο. k Το υπόδειγμα (2) ονομάζεται τοπικό υπόδειγμα (local model) και εκτιμάται χωριστά σε κάθε σημείο. Όμως, το πρόβλημα που εμφανίζεται είναι ότι για κάθε σημείο υπάρχουν περισσότερες παράμετροι που πρέπει να εκτιμηθούν από τις διαθέσιμες παρατηρήσεις. Υποθέτοντας ότι οι περιοχές που είναι γειτονικές μεταξύ τους παρουσιάζουν ομοιότητες, το υπόδειγμα (2) για την περιοχή μπορεί να εκτιμηθεί χρησιμοποιώντας τη μέθοδο των ελάχιστων τετραγώνων (OLS) με ένα υποσύνολο του δείγματος που αποτελείται από σημεία που βρίσκονται πλησίον της περιοχής. Με τον τρόπο αυτόν προκύπτουν εκτιμήσεις για τις παραμέτρους του υποδείγματος που είναι μεροληπτικές αλλά με μικρό βαθμό μεροληψίας και με τυπικά σφάλματα που εξαρτώνται από το μέγεθος του δείγματος που χρησιμοποιήθηκε. Ειδικότερα, όσο μεγαλύτερο είναι το μέγεθος του δείγματος τόσο μικρότερα θα είναι τα τυπικά σφάλματα των εκτιμήσεων αλλά και μεγαλύτερη η μεροληψία τους και αντίστροφα. Για να επιτευχθεί η μικρότερη δυνατή μεροληψία, οι παρατηρήσεις σταθμίζονται με τέτοιον τρόπο ώστε αυτές που βρίσκονται πιο κοντά στο σημείο να έχουν μεγαλύτερη βαρύτητα από τις πιο απομακρυσμένες. Κατά συνέπεια, για την εκτίμηση του υποδείγματος θεωρείται ότι οι σταθμίσεις αποτελούν φθίνουσες συναρτήσεις της απόστασης των παρατηρήσεων από το σημείο της παρατήρησης. Χρησιμοποιώντας πίνακες, το υπόδειγμα της γεωγραφικά σταθμισμένης παλινδρόμησης γράφεται ως Y β Χ 1 ε όπου Y είναι το n 1 διάνυσμα των τιμών της εξαρτημένης μεταβλητής, β και Χ πίνακες διαστάσεων n ( k 1), 1 είναι ένα ( k 1) 1 διάνυσμα από μονάδες και ε το n 1 διάνυσμα των σφαλμάτων. Οι εκτιμήσεις των παραμέτρων του υποδείγματος στο σημείο (δηλαδή η -οστή γραμμή του πίνακα β ) δίνονται από τη σχέση W Χ 1 ˆ β Χ Χ WY όπου W dag w, w,, w 1 2 είναι ένας n n διαγώνιος πίνακας που περιέχει τις σταθμίσεις για την περιοχή. Ο τρόπος της εκτίμησης έχει ομοιότητες με τη γνωστή σταθμική μέθοδο των ελάχιστων τετραγώνων (WLS). Η διαφορά έγκειται στο γεγονός πως στη σταθμική μέθοδο των ελάχιστων τετραγώνων ο πίνακας των σταθμίσεων παραμένει σταθερός για όλες τις παρατηρήσεις, ενώ στη γεωγραφικά σταθμισμένη παλινδρόμηση αναπροσαρμόζεται κάθε φορά που γίνεται η εκτίμηση για κάποια περιοχή με τον υπολογισμό των αντίστοιχων σταθμίσεων. Οι σταθμίσεις υπολογίζονται χρησιμοποιώντας κάποια συνάρτηση στάθμισης. Στην εργασία αυτή χρησιμοποιήθηκε η διτετράγωνη συνάρτηση που έχει τη μορφή: 2 2 w 1 d h όταν d h και w 0 διαφορετικά. Στη συνάρτηση αυτή, j j j j είναι η στάθμιση της j παρατήρησης όταν εκτιμάται το υπόδειγμα στο σημείο, w j dj η ευκλείδεια απόσταση μεταξύ των σημείων και j και n η απόσταση από το σημείο μέχρι το σημείο που βρίσκεται ο Ν κοντινότερος γείτονάς του η οποία h 323
αποκαλείται εύρος (bandwdth). Το πηλίκο στη συνάρτηση στάθμισης ονομάζεται πυρήνας (kernel) και καθορίζει τον αριθμό των σημείων που συμμετέχουν σε κάθε εκτίμηση. Χρησιμοποιώντας προσαρμοζόμενο πυρήνα (adaptve kernel) διασφαλίζεται ότι οι εκτιμήσεις σε κάθε περιοχή γίνονται με τον ίδιο αριθμό παρατηρήσεων με μη μηδενικές σταθμίσεις. Δηλαδή, το εύρος προσαρμόζεται και επιλέγεται με τέτοιον τρόπο ώστε για κάθε σημείο που γίνεται η εκτίμηση να θεωρείται ο ίδιος αριθμός κοντινών γειτόνων. Το άριστο εύρος προκύπτει από την ελαχιστοποίηση του διορθωμένου πληροφοριακού κριτηρίου του Akake που έχει προταθεί από τους Hurvch, Smonoff και Tsa (1998) και το οποίο για τη γεωγραφικά σταθμισμένη παλινδρόμηση είναι AIC 2n ln( ˆ ) n ln(2 ) n n tr( S) n 2 tr( S ), όπου S είναι ένας c πίνακας γνωστός στη βιβλιογραφία ως hat matrx για τον οποίο ισχύει Y ˆ SY και που εξαρτάται από το εύρος. Το αποτέλεσμα από την εφαρμογή της γεωγραφικά σταθμισμένης παλινδρόμησης είναι ένα σύνολο τοπικών εκτιμήσεων για τις παραμέτρους του υποδείγματος σε όλα τα σημεία στο χώρο με αντίστοιχους τοπικούς συντελεστές προσδιορισμού και τυπικά σφάλματα. Τα δεδομένα αυτά αφού χαρτογραφηθούν, μπορούν να οδηγήσουν στον εντοπισμό των χωρικών διαφοροποιήσεων ως προς την κατεύθυνση και το μέγεθος της σχέσης μεταξύ των μεταβλητών. Για την αξιολόγηση της ερμηνευτικής ικανότητας ενός υποδείγματος GWR μπορεί να υπολογιστεί εκ νέου ο συντελεστής προσδιορισμού του ολικού υποδείγματος αντικαθιστώντας τις εκτιμήσεις για την εξαρτημένη μεταβλητή με τις εκτιμήσεις που προέκυψαν από την εφαρμογή της GWR. Εφόσον το υπόδειγμα της γεωγραφικά σταθμισμένης παλινδρόμησης ερμηνεύει καλύτερα τα δεδομένα, ο αναθεωρημένος αυτός συντελεστής προσδιορισμού θα πρέπει να έχει μεγαλύτερη τιμή από τον συντελεστή προσδιορισμού από την εκτίμηση του ολικού υποδείγματος. Η ύπαρξη χωρικής μεταβλητότητας στις παραμέτρους του υποδείγματος μπορεί να εξεταστεί και με τη διενέργεια στατιστικού ελέγχου. Η μεθοδολογία που χρησιμοποιείται για την κατασκευή ενός τέτοιου ελέγχου βασίζεται στο γνωστό ως έλεγχο σημαντικότητας Monte Carlo που έχει αναπτυχθεί από τον Hope (1968). Αρχικά υπολογίζεται η διακύμανση των εκτιμηθεισών τιμών που προέκυψαν από την GWR για την υπό εξέταση παράμετρο και στη συνέχεια υπολογίζεται η κατανομή του ελέγχου για τη μηδενική υπόθεση περί της απουσίας μεταβλητότητας, πραγματοποιώντας μεταθέσεις των γεωγραφικών συντεταγμένων ως προς τις παρατηρήσεις. Ένας άλλος έλεγχος που έχει αναπτυχθεί από τους Brunsdon, Fotherngham, και Charlton (1999) συγκρίνει το ολικό υπόδειγμα με το υπόδειγμα της γεωγραφικά σταθμισμένης παλινδρόμησης και ελέγχει τη βελτίωση που επέρχεται στην προσαρμογή του υποδείγματος. Ο έλεγχος αυτός που ουσιαστικά αποτελεί έλεγχο ανάλυσης διακύμανσης (ANOVA) ελέγχει τη μηδενική υπόθεση της μη ύπαρξης F SSE SSE SSE η βελτίωσης με τη στατιστική συνάρτηση OLS GWR GWR οποία αν η μηδενική υπόθεση αληθεύει τότε ακολουθεί προσεγγιστικά την κατανομή 324
F. Στο προηγούμενο πηλίκο, με SSE και SSE συμβολίζονται το άθροισμα των OLS τετραγώνων των καταλοίπων από την παλινδρόμηση με τη μέθοδο των ελάχιστων τετραγώνων και το άθροισμα των τετραγώνων των καταλοίπων από τη γεωγραφικά σταθμισμένη παλινδρόμηση, αντίστοιχα. Πιο συγκεκριμένα, ισχύουν οι σχέσεις T YR Y με R OLS IS OLS IS OLS και YR Y με SSE OLS OLS T S GWR GWR SSE GWR GWR R I S I, όπου με S συμβολίζεται ο πίνακας hat που GWR GWR προέκυψε από την εκτίμηση με τη μέθοδο των ελάχιστων τετραγώνων και με πίνακας hat που προέκυψε από τη γεωγραφικά σταθμισμένη παλινδρόμηση. Επιπρόσθετα, ισχύει tr R R tr. Αξίζει να σημειωθεί OLS και OLS GWR R GWR SGW R ότι από την εφαρμογή αυτού του ελέγχου πολλές φορές προκύπτουν μη ακέραιοι βαθμοί ελευθερίας. 3. ΤΟ ΟΛΙΚΟ ΥΠΟΔΕΙΓΜΑ Για τη μέτρηση της γονιμότητας υπολογίστηκε ο δείκτης του λόγου του παιδικού προς τον αναπαραγωγικό πληθυσμό CWR P W 1000 ο οποίος ορίζεται ως ο 04 1549 αριθμός των παιδιών ηλικίας μέχρι πέντε ετών ανά χίλιες γυναίκες αναπαραγωγικής ηλικίας. Πρόκειται για έναν απογραφικό δείκτη γονιμότητας και όσο μεγαλύτερη είναι η τιμή του τόσο μεγαλύτερη είναι η γονιμότητα του εξεταζόμενου πληθυσμού. Τα στοιχεία αντλήθηκαν από την απογραφή του πληθυσμού της Ελλάδος του έτους 2001 και αφορούν τους δήμους και τις κοινότητες που έχουν προκύψει μετά την εφαρμογή του νόμου Καποδίστρια. Από την ανάλυση εξαιρέθηκαν 28 δήμοι που παρουσίαζαν υπερβολικά χαμηλές ή υψηλές τιμές στο δείκτη γονιμότητας με ταυτόχρονα πολύ μικρό μέγεθος πληθυσμού καταλήγοντας στη χρησιμοποίηση ενός δείγματος 1005 δήμων. Όπως φαίνεται στο Χάρτη 1, ο δείκτης CWR παρουσιάζει έντονη χωρική μεταβλητότητα λαμβάνοντας τιμές από 111 έως 350 ανάλογα με την περιοχή. Ο δείκτης CWR αποτέλεσε την εξαρτημένη μεταβλητή σε ένα υπόδειγμα γραμμικής παλινδρόμησης που περιλάμβανε ως ανεξάρτητες μεταβλητές το ποσοστό των εγγάμων γυναικών αναπαραγωγικής ηλικίας Pc_MW/W, δηλαδή το πηλίκο MW W 15 49 15 49 100, το ποσοστό συμμετοχής των γυναικών στο εργατικό δυναμικό Pc_f_empl, το ποσοστό των γυναικών υψηλής εκπαίδευσης Pc_f_hgh_ed, δηλαδή των γυναικών με μεταλυκειακούς τίτλους σπουδών και το ποσοστό των αλλοδαπών στο συνολικό πληθυσμό κάθε δήμου Pc_foregn. Το υπόδειγμα αυτό εκτιμήθηκε αρχικά με τη μέθοδο των ελάχιστων τετραγώνων. Τα αποτελέσματα συνοψίζονται στον Πίνακα 1. Πίνακας 1. Αποτελέσματα Εκτίμησης Ολικού Χάρτης 1. Δείκτης CWR Υποδείγματος (OLS) Parameter Estmate β St. Error p value Intercept 63,171 20,979 0,003 Pc_MW/W 3,070 0,267 0,000 Pc_f_empl -0,399 0,168 0,018 Pc_f_hgh_ed -0,189 0,228 0,409 325 Pc_foregn -0,099 0,267 0,712 Adj. R 2 OLS = 0,155 AIC = 10119,27 F = 47,312 ο
Από τα αποτελέσματα της εκτίμησης εξάγεται το συμπέρασμα ότι η γονιμότητα σε ολικό επίπεδο επηρεάζεται θετικά από το ποσοστό των εγγάμων γυναικών και αρνητικά από το ποσοστό των γυναικών που εργάζονται. Οι συντελεστές και για τις δύο μεταβλητές είναι στατιστικά σημαντικοί σε επίπεδο σημαντικότητας 5%. Οι συντελεστές του ποσοστού των γυναικών με υψηλή εκπαίδευση και του ποσοστού των αλλοδαπών είναι αρνητικοί δείχνοντας αρνητική επίδραση προς τη γονιμότητα, αλλά δεν είναι στατιστικά σημαντικοί. Οι δύο μη στατιστικά σημαντικές μεταβλητές θα παραμείνουν στο υπόδειγμα για να εξεταστεί η συμπεριφορά τους σε τοπικό επίπεδο. Ο προσαρμοσμένος συντελεστής προσδιορισμού από την εκτίμηση του υποδείγματος είναι 0,155 και θεωρείται χαμηλός υποδεικνύοντας ότι το υπόδειγμα έχει περιορισμένη ερμηνευτική ικανότητα. Σημειώνεται ότι στατιστικά στοιχεία για άλλους παράγοντες που ενδεχομένως επηρεάζουν τη γονιμότητα δεν είναι εύκολο να βρεθούν για τόσο μικρό επίπεδο χωρικής ανάλυσης. 4. ΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΠΟ ΤΗΝ ΕΚΤΙΜΗΣΗ ΜΕ ΤΗ GWR Το υπόδειγμα πολλαπλής παλινδρόμησης που αναφέρθηκε στην προηγούμενη ενότητα επανεκτιμήθηκε σε τοπικό επίπεδο εφαρμόζοντας τη μέθοδο της Γεωγραφικά Σταθμισμένη Παλινδρόμησης με προσαρμοζόμενο πυρήνα. Για τον καθορισμό των αποστάσεων μεταξύ των περιοχών χρησιμοποιήθηκαν οι γεωγραφικές συντεταγμένες των γεωγραφικών κεντροειδών κάθε δήμου και κοινότητας. Οι εκτιμήσεις έγιναν με το λογισμικό GWR 3.0 και με βάση την ελαχιστοποίηση του κριτηρίου AIC C καθορίστηκαν 103 κοντινοί γείτονες για την εκτίμηση κάθε τοπικού υποδείγματος. Πίνακας 2. Αποτελέσματα Εκτίμησης Τοπικών Υποδειγμάτων (GWR) Parameter Mn Q 1 Medan Q 3 Max Intercept -317,568-70,574 49,393 180,261 391,762 Pc_MW/W -2,169 2,015 3,545 4,907 7,706 Pc_f_empl -4,812-0,887-0,449 0,192 2,777 Pc_f_hgh_ed -3,648-1,158 0,328 0,919 4,881 Pc_foregn -5,862-1,130-0,111 1,219 4,802 Local R 2 0,268 0,496 0,609 0,699 0,893 Adj. R 2 GWR = 0,370 AIC C = 9964,157 Nearest Neghbours = 103 Χάρτης 2. Κατανομή Τοπικών R 2 Ο Πίνακας 2 περιέχει τα κύρια αποτελέσματα από τη διαδικασία της εκτίμησης. Η εφαρμογή της GWR συμβάλλει σημαντικά στην αύξηση της ερμηνευτικής ικανότητας του υποδείγματος, όπως διαπιστώνεται από την αυξημένη τιμή 0,370 του προσαρμοσμένου συντελεστή προσδιορισμού σε σχέση με το συντελεστή του ολικού υποδείγματος αλλά και ιδιαίτερα από τη μείωση που επέρχεται στη τιμή του κριτηρίου AIC C. Το συμπέρασμα αυτό υποστηρίζεται και από την υψηλή τιμή της στατιστικής συνάρτησης F για τον έλεγχο ανάλυσης διακύμανσης στη βελτίωση της 326
ερμηνευτικής ικανότητα του υποδείγματος από την εκτίμηση με την GWR που δίνεται αναλυτικά στον Πίνακα 3. Οι τοπικοί συντελεστές προσδιορισμού κυμαίνονται από 0,268 έως 0,893 με διάμεση τιμή 0,609 υποδεικνύοντας πως υπάρχει μεγάλη μεταβλητότητα στην ερμηνευτική ικανότητα του υποδείγματος από περιοχή σε περιοχή. Η κατανομή των τοπικών συντελεστών προσδιορισμού απεικονίζεται στο Χάρτη 2 από τον οποίο φαίνεται πως σε κάποιους δήμους της χώρας η επίδραση των μεταβλητών στη γονιμότητα είναι πιο ισχυρή. Πίνακας 3.Έλεγχος ANOVA βελτίωσης GWR Source SS DF MS F SSE OLS 1371975,9 1000 GWR Impr. 467605 115,15 4060,80 SSE GWR 904370,9 884,85 1022,06 3,97 Οι εκτιμήσεις του σταθερού όρου και των συντελεστών των τεσσάρων μεταβλητών παρουσιάζουν έντονη μεταβλητότητα τόσο ως προς το μέγεθος και τη κατεύθυνση της σχέσης εξάρτησης όσο και ως προς τη στατιστική τους σημαντικότητα. Ο έλεγχος σημαντικότητας μέσω προσομοίωσης Monte Carlo έδειξε ότι για επίπεδο σημαντικότητας 1% η χωρική μεταβλητότητα και των πέντε παραμέτρων είναι σημαντική. Οι χάρτες 3 6 απεικονίζουν τις τιμές των τοπικών στατιστικών συναρτήσεων t για τον έλεγχο της σημαντικότητας των μεταβλητών του υποδείγματος. Από την εκτίμηση του ολικού υποδείγματος είχε εξαχθεί το συμπέρασμα ότι το ποσοστό των γυναικών που εργάζονται επηρεάζει αρνητικά τη γονιμότητα με συντελεστή στατιστικά σημαντικό. Όπως προκύπτει από το Χάρτη 4, η σημαντικότητα του συντελεστή δεν ισχύει για τους περισσότερους δήμους της χώρας. Επιπρόσθετα, στους δήμους του νομού Φθιώτιδας η σχέση επίδρασης γίνεται θετική και στατιστικά σημαντική. Οι επιδράσεις του ποσοστού των γυναικών με υψηλή εκπαίδευση στη γονιμότητα όπως φαίνεται από το Χάρτη 5 είναι μοιρασμένες. Στις μισές περιοχές της χώρας η σχέση είναι αρνητική ενώ στις άλλες μισές θετική. Μάλιστα, στην Κρήτη οι αρνητικές επιδράσεις κρίνονται στατιστικά σημαντικές ενώ στην περιοχή της Ηπείρου υπάρχουν στατιστικά σημαντικές θετικές επιδράσεις. Ανάλογα συμπεράσματα προκύπτουν και για το ποσοστό των αλλοδαπών για το οποίο στο Χάρτη 6 εμφανίζονται περιοχές στις οποίες υπάρχουν θετικές και στατιστικά σημαντικές επιδράσεις. 5. ΣΥΜΠΕΡΑΣΜΑΤΑ Από την ανάλυση που προηγήθηκε διαπιστώνεται ότι η εφαρμογή της Γεωγραφικά Σταθμισμένης Παλινδρόμησης βελτιώνει σημαντικά την ερμηνευτική ικανότητα του υποδείγματος. Λόγω της ύπαρξης χωρικής μεταβλητότητας, οι σχέσεις μεταξύ των εξεταζόμενων μεταβλητών και του επιπέδου της γονιμότητας δεν είναι σταθερές σε όλες τις περιοχές της χώρας ούτε ως προς την ένταση της εξάρτησης, κάτι που αποκαλύπτεται από τις διαφορετικές τιμές των συντελεστών προσδιορισμού, αλλά ούτε και ως προς την κατεύθυνση των επιδράσεων και τη στατιστική τους σημαντικότητα. Τα αποτελέσματα που έχουν προκύψει για κάθε περιοχή αξίζει να 327
διερευνηθούν περαιτέρω για να εντοπιστεί εάν υπάρχουν τοπικές ιδιαιτερότητες που οδηγούν σε αυτά τα συμπεράσματα ή εάν και σε πoιo βαθμό έχει επιδράσει ο παράγοντας της τύχης. ABSTRACT The Geographcally Weghted Regresson (GWR) s a recently developed method that allows for the examnaton of spatal non-statonarty n the parameter estmates of regresson models. In ths paper, the GWR method s descrbed and subsequently appled n the study of the relatonshps between fertlty and varous socoeconomc determnants at the local authorty level of geography n Greece. The data come from the 2001 Populaton Census. The fndngs show that the drecton and magntude of the effects vary across space ndcatng the need to further explore these varatons n relaton to the specfc condtons prevalng n each local authorty. ΑΝΑΦΟΡΕΣ Brunsdon, C., Fotherngham, A. S., and Charlton, M. E. (1999). Some Notes on Parametrc Sgnfcance Tests For Geographcally Weghted Regresson. Journal of Regonal Scence, 39, 497-524. Fotherngham, A. S., Brunsdon, C., and Charlton, M. E. (2002). Geographcally weghted regresson: The analyss of spatally varyng relatonshps, Chchester: John Wley. Hope A. C. A. (1968). A Smplfed Monte Carlo Sgnfcance Test Procedure. Journal of the Royal Statstcal Socety Seres B, 30, 582-598. Hurvch C. M., Smonoff J. S. and Tsa C-L. (1998). Smoothng Parameter Selecton n Nonparametrc Regresson Usng an Improved Akake Informaton Crteron. Journal of the Royal Statstcal Socety Seres B, 60, 271-293. Χάρτες 3 6. Τοπικές τιμές στατιστικών συναρτήσεων t 3 4 5 6 328