Κεφάλαιο 3 Περιγραφή Γεωγραφικών Δεδομένων Βασικοί Γεωστατιστικοί Δείκτες

Σχετικά έγγραφα
ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Περιγραφική Στατιστική

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

Εφαρμοσμένη Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ν ν = 6. όταν είναι πραγµατικός αριθµός.

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Γιατί μετράμε την διασπορά;

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 7 ο, Τμήμα Α

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Η γραφική απεικόνιση µιας κατανοµής συχνότητας µπορεί να γίνει µε δύο τρόπους, µε ιστόγραµµα και µε πολυγωνική γραµµή.

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Εισαγωγή στη Στατιστική


ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Μάθηµα 3 ο. Περιγραφική Στατιστική

ΟΙ ΜΕΘΟΔΟΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΛΥΣΗΣ Χ. ΑΠ. ΛΑΔΙΑΣ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ B ΤΑΞΗΣ. χρησιμοποιήσουμε καθημερινά φαινόμενα όπως το θερμόμετρο, Θετικοί-Αρνητικοί αριθμοί.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

ΜΕΘΟΔΟΛΟΓΙΑ & ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΕΦΑΛΑΙΟ 2 Ο «ΣΤΑΤΙΣΤΙΚΗ»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

Συλλογή και παρουσίαση στατιστικών δεδομένων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΚΕΦΑΛΑΙΟ. 1. α. Tι ονοµάζεται συνάρτηση από το σύνολο Α στο σύνολο Β; β. Tι ονοµάζεται πραγµατική συνάρτηση πραγµατικής µεταβλητής;

Βιοστατιστική ΒΙΟ-309

ΜΑΘΗΜΑΤΙΚΑ Γ ΓΥΜΝΑΣΙΟΥ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Συλλογή και Παρουσίαση Δεδομένων

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Βιοστατιστική ΒΙΟ-309

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ. Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο.

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 2ο: ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑ Α

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Βιοστατιστική ΒΙΟ-309

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Mέτρα (παράμετροι) θέσεως

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Είδη Μεταβλητών. κλίµακα µέτρησης

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

i Σύνολα w = = = i v v i=

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Συναρτήσεις. Ορισμός Συνάρτησης

5.1 Δραστηριότητα: Εισαγωγή στο ορισμένο ολοκλήρωμα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Κεφάλαιο 2. Συστήματα Αρίθμησης και Αναπαράσταση Πληροφορίας. Περιεχόμενα. 2.1 Αριθμητικά Συστήματα. Εισαγωγή

Ιωάννης Σ. Μιχέλης Μαθηματικός

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΜΕΘΟΔΟΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΛΥΣΗΣ

Transcript:

Κεφάλαιο 3 Περιγραφή Γεωγραφικών Δεδομένων Βασικοί Γεωστατιστικοί Δείκτες Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται οι βασικότερες μέθοδοι περιγραφής των δεδομένων με πίνακες, διαγράμματα και χάρτες. Παρουσιάζονται: α. οι κατανομές συχνοτήτων και τα διαγράμματα που αντιστοιχούν σε αυτές (ραβδογράμματα και ιστογράμματα) καθώς και οι πίνακες διπλής εισόδου, β. σύνθετες γραφικές παραστάσεις (τριαδικό διάγραμμα και καμπύλη Lorez), γ. τα μέτρα κεντρικής τάσης και η επέκτασή τους στον γεωγραφικό χώρο με την παρουσίαση βασικών γεωστατιστικών δεικτών (χωρικός μέσος και χωρικός διάμεσος), δ. τα μέτρα διασποράς και η επέκτασή τους στον γεωγραφικό χώρο (τυπική απόσταση). Προαπαιτούμενη γνώση Από το κεφάλαιο 1 απαιτείται η κατανόηση της έννοιας της γεωγραφικής μήτρας δεδομένων και από το κεφάλαιο οι βασικές έννοιες και οι κλίμακες μέτρησης των δεδομένων. 3.1 Κατανομές Μεταβλητών και Τρόποι Περιγραφής Δεδομένων Στη σύγχρονη εποχή ο όγκος των γεωγραφικών δεδομένων, και των δεδομένων γενικά, είναι πολύ μεγάλος. Λόγω της ψηφιοποίησης των δεδομένων πολύ συχνά αυτά είναι διαθέσιμα σε αναλυτική μορφή (βλ. για παράδειγμα τα δεδομένα από τις Απογραφές Πληθυσμού της ΕΛΣΤΑΤ www.statstcs.gr). Με την απλή επισκόπηση των δεδομένων δεν είναι δυνατό να προκύψουν συμπεράσματα τα οποία να εξυπηρετούν τους σκοπούς της μελέτης. Για τον λόγο αυτό είναι απαραίτητο να χρησιμοποιηθούν τρόποι περιληπτικής περιγραφής των δεδομένων. Για παράδειγμα, τα δεδομένα τα οποία χρησιμοποιούνται σε πολλά από τα αποτελέσματα και τις εφαρμογές του βιβλίου αυτού, έχουν προκύψει από ένα σύνολο 8000 κατοικιών, από τις οποίες έχει επιλεγεί ένα δείγμα 800 κατοικιών. Ακόμα όμως και για αυτό το δείγμα δεν είναι δυνατό μόνο με την παρατήρηση των δεδομένων να προκύψουν συμπεράσματα για τις τιμές των κατοικιών, το εμβαδόν, την ηλικία τους κλπ. Όταν βέβαια ο αριθμός των παρατηρήσεων είναι μικρός, υπάρχει η δυνατότητα με ταξινομήσεις των τιμών να προκύψουν κάποια συμπεράσματα για τον τρόπο με τον οποίο μεταβάλλονται οι τιμές μιας μεταβλητής. Αυτή είναι η περίπτωση των δεδομένων του Πίνακα 1.1, ο οποίος περιλαμβάνει 51 παρατηρήσεις. Ακόμα όμως και για μικρό αριθμό παρατηρήσεων η συνοπτική παρουσίαση των δεδομένων είναι πολύ χρήσιμη. Η διαφοροποίηση των τιμών μιας μεταβλητής αποτελεί την κατανομή (dstrbuto) της μεταβλητής, την οποία περιγράφουν και αναλύουν οι στατιστικές μέθοδοι με πολλούς διαφορετικούς τρόπους. Στη γεωγραφική μήτρα δεδομένων του Πίνακα 1.1 οι τιμές στη στήλη ΠΛΗΘΥΣΜΟΣ 011 αποτελούν την κατανομή της μεταβλητής αυτής στους νομούς της Ελλάδας. Τα δεδομένα μπορεί να περιγραφούν με πολλούς τρόπους οι οποίοι είναι συμπληρωματικοί μεταξύ τους: πίνακες, γραφήματα και μέτρα για εκτίμηση παραμέτρων ή στατιστικών. Οι πίνακες παρουσιάζουν την κατανομή της μεταβλητής ως προς τις τιμές ή τις ομάδες τιμών, και περιγράφονται παρακάτω στην ενότητα Κατανομές Συχνοτήτων. Τα γραφήματα μπορεί να αντιστοιχούν στις κατανομές συχνοτήτων αλλά επίσης αφορούν και γραφικές παραστάσεις για ειδικούς σκοπούς, καθώς και την κατασκευή θεματικών χαρτών. Τα μέτρα για εκτίμηση παραμέτρων ή στατιστικών, εκφράζουν με μία τιμή τις τιμές της μεταβλητής (π.χ. μέσος όρος) αλλά και τη διασπορά των τιμών σε σχέση με μία κεντρική τιμή, για δεδομένα είτε από το σύνολο του στατιστικού πληθυσμού ή από δείγμα. Όταν τα μέτρα αυτά αφορούν σημεία σε χάρτη εμπίπτουν στην κατηγορία των γεωστατιστικών δεικτών οπότε υπολογίζεται ένα κεντρικό σημείο της κατανομής και εξετάζεται η γεωγραφική διασπορά των σημείων σε σχέση με το σημείο αυτό. 3. Κατανομές Συχνοτήτων Η κατανομή συχνοτήτων (frequecy dstrbuto) είναι ένας απλός τρόπος για την περιγραφή μιας μεταβλητής και παρουσιάζει τη συχνότητα εμφάνισης μιας τιμής στα δεδομένα. 56

Οι κατανομές συχνοτήτων μπορούν να χρησιμοποιηθούν για την περιγραφή μιας μεταβλητής μετρημένης σε οποιαδήποτε κλίμακα μέτρησης. Ειδικότερα για τις ποιοτικές μεταβλητές αποτελούν μία από τις ελάχιστες δυνατότητες στατιστικής επεξεργασίας και είναι πολύ χρήσιμες στην παρουσίαση αποτελεσμάτων από ερωτηματολόγια, επειδή οι μεταβλητές σε αυτά είναι συχνά ποιοτικές. Οι κατανομές συχνοτήτων παρουσιάζονται σε μορφή πινάκων και διαγραμμάτων. Τα διαγράμματα είναι κυρίως ραβδογράμματα (bar charts) και ιστογράμματα (hstograms). 3..1 Κατανομές συχνοτήτων για ποιοτικά δεδομένα Στην περίπτωση των ποιοτικών δεδομένων στα οποία οι τιμές των μεταβλητών είναι λεκτικά δεν χρειάζεται κάποια προετοιμασία των δεδομένων για την κατασκευή της κατανομής συχνοτήτων. Το ίδιο ισχύει και για τις διακριτές μεταβλητές οι οποίες λαμβάνουν μικρό εύρος τιμών. Παράδειγμα τέτοιων μεταβλητών αποτελούν ο όροφος και ο αριθμός των υπνοδωματίων για τις κατοικίες που εμφανίζονται στον Πίνακα 1.. Αντίθετα για τις συνεχείς ποσοτικές μεταβλητές χρειάζεται μία προεργασία, δηλαδή η ομαδοποίηση των τιμών της μεταβλητής, όπως θα εξηγηθεί παρακάτω. Το πρώτο βήμα για την κατασκευή ενός πίνακα κατανομής συχνοτήτων είναι η καταμέτρηση της συχνότητας της εμφάνισης κάθε τιμής η οποία ονομάζεται απόλυτη συχνότητα (absolute frequecy ή απλά frequecy). Η απόλυτη συχνότητα κάθε τιμής συμβολίζεται με f, όπου το παίρνει τιμές 1 έως τον αριθμό των τιμών της μεταβλητής. Ισχύει Σf=, όπου είναι το πλήθος των παρατηρήσεων. Μετά την εύρεση της απόλυτης συχνότητας ακολουθούν οι υπολογισμοί της σχετικής (relatve frequecy) και της αθροιστικής ή συσσωρευτικής συχνότητας (cumulatve frequecy), καθώς και η κατασκευή των σχετικών διαγραμμάτων. Οι σχετικές συχνότητες εκφράζουν την ποσοστιαία κατανομή των συχνοτήτων και προκύπτουν από τον τύπο f100 P και ΣP =100%. Οι αθροιστικές συχνότητες προκύπτουν όταν η συχνότητα (απόλυτη ή σχετική) κάθε κατηγορίας περιλαμβάνει και τις συχνότητες όλων των προηγούμενων κατηγοριών. ΠΑΡΑΔΕΙΓΜΑ 3.1: Kατανομή συχνοτήτων ονομαστικής μεταβλητής Στον Πίνακα 3.1 παρουσιάζονται δεδομένα για 65 οικοδομικά τετράγωνα, τα οποία περιλαμβάνουν δύο μεταβλητές: την αρίθμηση του οικοδομικού τετραγώνου σε ένα ρυμοτομικό σχέδιο και την επικρατούσα χρήση γης (επειδή σε ένα οικοδομικό τετράγωνο μπορεί να συνυπάρχουν περισσότερες της μιας χρήσεις γης καταγράφεται η επικρατούσα χρήση γης). Παρατηρούμε ότι και οι δύο μεταβλητές είναι ποιοτικές, αλλά η ονομασία του οικοδομικού τετραγώνου έχει αριθμητική μορφή (χωρίς βέβαια οι αριθμοί αυτοί να μπορεί να χρησιμοποιηθούν για αλγεβρικές πράξεις), ενώ οι τιμές της κατηγορικής μεταβλητής ΧΡΗΣΗ ΓΗΣ είναι λεκτικά. Στον Πίνακα 3. φαίνεται ο πίνακας κατανομής συχνοτήτων για τη μεταβλητή ΧΡΗΣΗ ΓΗΣ στα 65 οικοδομικά τετράγωνα. Για να κατασκευαστεί ο πίνακας αυτός απλά γίνεται καταμέτρηση της εμφάνισης κάθε τιμής. Η μεταβλητή ΧΡΗΣΗ ΓΗΣ λαμβάνει συνολικά οκτώ τιμές: «Εμπορικά καταστήματα», «Γραφεία», «Κατοικία» κλπ. οι οποίες φαίνονται στην πρώτη στήλη του Πίνακα 3.. Η δεύτερη στήλη περιλαμβάνει τις απόλυτες συχνότητες f, δηλαδή από τα 65 οικοδομικά τετράγωνα του Πίνακα 3.1 τα 5 έχουν επικρατούσα χρήση γης τα εμπορικά καταστήματα (f 1 =5), οκτώ τα Γραφεία (f =8), πέντε το Χονδρικό εμπόριο (f 3 =5), κ.ο.κ. Το άθροισμα των απόλυτων συχνοτήτων Σf==65, είναι ίσο με τον αριθμό των παρατηρήσεων, δηλαδή των οικοδομικών τετραγώνων. Η τρίτη στήλη είναι η σχετική συχνότητα η οποία προκύπτει ως το ποσοστό της απόλυτης συχνότητας επί του συνόλου των παρατηρήσεων, π.χ. για τα «Εμπορικά καταστήματα» η σχετική συχνότητα υπολογίζεται ως: 5 P 1 = 100= 38,46%. 65 57

Πίνακας 3.1 Ποιοτικά δεδομένα για κατανομή συχνοτήτων 58

Πίνακας 3. Κατανομή συχνοτήτων ποιοτικής μεταβλητής Επομένως το ποσοστό των οικοδομικών τετραγώνων με επικρατούσα χρήση «Εμπορικά καταστήματα» είναι 38,46%, με «Γραφεία» 1,31% κ.ο.κ. Τα αποτελέσματα του Πίνακα 3. εμφανίζονται στο Διάγραμμα 3.1 με μορφή ραβδογράμματος (bar chart). Επειδή οι χρήσεις γης είναι ονομαστική μεταβλητή, ο άξονας Χ του διαγράμματος δεν έχει ποσοτική διαβάθμιση. Για τον λόγο αυτό αφήνουμε κενά μεταξύ των στηλών (bars) ώστε να μη δημιουργηθεί η εντύπωση ότι υπάρχει σειρά στις τιμές της μεταβλητής. Για τον ίδιο λόγο στην περίπτωση των ποιοτικών δεδομένων δεν υπολογίζονται και οι αθροιστικές συχνότητες. ΠΑΡΑΔΕΙΓΜΑ 3.: Kατανομή συχνοτήτων διακριτής μεταβλητής Στον Πίνακα 3.3 παρουσιάζεται ο πίνακας κατανομής συχνοτήτων για μία ποσοτική διακριτή μεταβλητή, τη μεταβλητή ΟΡΟΦΟΣ, από τα δεδομένα του Πίνακα 1., όπως προκύπτει από το στατιστικό πακέτο SPSS. Οι όροφοι, 0 για το ισόγειο, 1 για τον πρώτο όροφο κ.ο.κ. εμφανίζονται στην πρώτη στήλη. Η απόλυτη συχνότητα εμφανίζεται στη στήλη Frequecy, η σχετική στη στήλη Percet και η αθροιστική στη στήλη Cumulatve Percet. Η στήλη Vald Percet παρουσιάζει τη σχετική συχνότητα επί των παρατηρήσεων για τις οποίες υπάρχουν δεδομένα, έχουν δηλαδή αφαιρεθεί από το σύνολο τυχόν ελλείπουσες τιμές (mssg values). Στον Πίνακα 3.3 οι στήλες Percet και Vald Percet συμπίπτουν επειδή δεν υπάρχουν κατοικίες για τις οποίες δεν έχει καταγραφεί ο όροφος. Σημειώνεται επίσης ότι η αθροιστική συχνότητα υπολογίζεται αυτόματα στο SPSS είτε πρόκειται για ποιοτική είτε για ποσοτική μεταβλητή και αφορά τη σχετική αθροιστική συχνότητα. Στην περίπτωση του Πίνακα 3.3, για την τιμή 0 της μεταβλητής «όροφος» στη στήλη της αθροιστικής συχνότητας, απλά επαναλαμβάνεται το ποσοστό από τη στήλη της σχετικής συχνότητας (percet) που είναι 8,%, δηλαδή το 8,% των κατοικιών στο δείγμα των 800 κατοικιών είναι ισόγεια. Στη συνέχεια, για την τιμή 1 της μεταβλητής ΟΡΟΦΟΣ η εγγραφή στη στήλη της αθροιστικής συχνότητας είναι 50,6%, η οποία προκύπτει από το άθροισμα 8,+,4=50,6, δηλαδή το 50,6% των κατοικιών βρίσκονται στο ισόγειο και τον 1 ο όροφο. Αντίστοιχα το 68,6% των κατοικιών βρίσκονται μέχρι τον ο όροφο κ.ο.κ. Παρατηρούμε επίσης ότι ενώ όλες οι στήλες καταλήγουν στη γραμμή Total σε ένα άθροισμα το ή το 100%, η στήλη της αθροιστικής συχνότητας καταλήγει στο 100% στην τελευταία τιμή, η οποία στον Πίνακα 3.3 είναι ο 8 ος όροφος, μέχρι τον οποίο περιλαμβάνεται αθροιστικά το 100% των παρατηρήσεων. Τέλος προκειμένου να υπολογιστούν σωστά οι αθροιστικές συχνότητες οι τιμές της μεταβλητής πρέπει να είναι σε σειρά (π.χ. από το ισόγειο στον 8 ο όροφο). 59

Διάγραμμα 3.1 Ραβδόγραμμα (Excel) Πίνακας 3.3 Κατανομή συχνοτήτων διακριτής μεταβλητής (SPSS) 3.. Κατανομές συχνοτήτων για ποσοτικά δεδομένα Στο Παράδειγμα 3. η ποσοτική μεταβλητή ΟΡΟΦΟΣ λαμβάνει μικρό αριθμό τιμών. Στις συνεχείς ποσοτικές μεταβλητές, επειδή ο αριθμός των τιμών είναι πολύ μεγάλος και οι τιμές επαναλαμβάνονται λίγες φορές, είναι απαραίτητο να ομαδοποιούνται οι τιμές της μεταβλητής προκειμένου να κατασκευαστεί ο πίνακας κατανομής συχνοτήτων. Στα ομαδοποιημένα δεδομένα οι ομάδες ονομάζονται τάξεις ή κλάσεις (classes). Οι τάξεις καθορίζονται ανάλογα με τη φύση των δεδομένων και το πρόβλημα που μελετάμε. Όμως υπάρχουν δύο βασικοί κανόνες που πρέπει να τηρούνται: Οι τάξεις πρέπει να είναι αποκλειστικές, δηλαδή οι τιμές που ανήκουν σε μία ομάδα δεν μπορούν να ανήκουν σε άλλη ομάδα. Για να επιτευχθεί ο σκοπός αυτός χωρίζονται οι τάξεις 60

μεταξύ τους σύμφωνα με την ακρίβεια των δεδομένων και δεν επαναλαμβάνεται η ίδια τιμή ως όριο δύο τάξεων. Οι τάξεις πρέπει να είναι εξαντλητικές, δηλαδή πρέπει να περιλαμβάνουν όλες τις τιμές της μεταβλητής. Δεν είναι απαραίτητο οι τάξεις να έχουν ίσα διαστήματα, ιδιαίτερα για γεωγραφικές κατανομές που παρουσιάζουν ασυνέχειες. Επίσης δεν υπάρχει μαθηματικό κριτήριο ούτε για τον αριθμό ούτε για το εύρος των τιμών των τάξεων. Συνήθως γίνεται μελέτη τιμών και ο ερευνητής αποφασίζει πόσες και ποιες ομάδες τιμών θα κατασκευάσει. ΠΑΡΑΔΕΙΓΜΑ 3.3: Κατανομή συχνοτήτων ποσοτικής μεταβλητής (νομοί Ελλάδας) Τα παραπάνω θα εξηγηθούν χρησιμοποιώντας τα δεδομένα του Πίνακα 1.1 και συγκεκριμένα τη μεταβλητή ΠΛΗΘΥΣΜΟΣ 011, η οποία εμφανίζει τον πληθυσμό των νομών της Ελλάδας από την Απογραφή Πληθυσμού της ΕΛΣΤΑΤ το 011. Στον Πίνακα 3.4 (στήλη 1) παρουσιάζονται οι τιμές της μεταβλητής αυτής ταξινομημένες κατά αύξουσα τάξη. Η ταξινόμηση των τιμών είναι μία συνήθης διαδικασία για τη μελέτη των τιμών και για να κατασκευαστούν οι ομάδες των τιμών. Από τη μελέτη των τιμών του Πίνακα 3.4 προκύπτει καταρχήν ότι όλοι οι νομοί έχουν διαφορετικό πληθυσμό, δηλαδή δεν υπάρχει τιμή της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 η οποία να επαναλαμβάνεται. Επομένως αν καταμετρηθούν οι συχνότητες κάθε τιμής για τη μεταβλητή ΠΛΗΘΥΣΜΟΣ 011, όπως έγινε προηγουμένως με την ποιοτική μεταβλητή ΧΡΗΣΗ ΓΗΣ και με τη διακριτή μεταβλητή ΟΡΟΦΟΣ, ο πίνακας κατανομής συχνοτήτων θα επαναλάβει τα δεδομένα του Πίνακα 3.4, χωρίς να τα συμπτύξει και να περιγράψει τη δομή τους, χωρίς να απαντήσει δηλαδή στο ερώτημα ποια είναι η κατανομή του πληθυσμού στους νομούς της Ελλάδας. Η απάντηση στο ερώτημα αυτό μπορεί ίσως να προκύψει εμπειρικά από την παρατήρηση του Πίνακα 3.4, επειδή ο αριθμός των παρατηρήσεων είναι περιορισμένος. Όταν όμως οι παρατηρήσεις είναι εκατοντάδες ή χιλιάδες χρειάζεται ο υπολογισμός του πίνακα κατανομής συχνοτήτων με τη διαδικασία που περιγράφεται παρακάτω. Από την παρατήρηση του Πίνακα 3.4 προκύπτει ότι οι περισσότεροι νομοί της Ελλάδας έχουν πληθυσμό έως 00.000 κατοίκους, πολύ λίγοι έχουν πληθυσμό στο διάστημα 00.000 έως 300.000, οι νομοί Ηρακλείου και Αχαΐας έχουν πληθυσμό λίγο μεγαλύτερο των 300.000 και μόνο οι νομοί Αττικής και Θεσσαλονίκης υπερβαίνουν το 1.000.000. Ο Ν. Αττικής μάλιστα με 3.88.434 κατοίκους υπερβαίνει κατά πολύ τον πληθυσμό των υπόλοιπων νομών. Το ζητούμενο είναι να προσδιοριστούν ο αριθμός των ομάδων των τιμών (των τάξεων) της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 και το εύρος των τιμών των ομάδων αυτών. Ο αριθμός των ομάδων εξαρτάται καταρχήν από το πλήθος των παρατηρήσεων. Όταν ο αριθμός των παρατηρήσεων είναι μικρός, όπως στα δεδομένα του Πίνακα 3.4, δεν είναι σκόπιμο να υπάρχουν πολλές ομάδες τιμών, επειδή θα προκύψουν ομάδες με μηδενικές ή πολύ μικρές συχνότητες. Αυτό δεν καταλήγει σε ουσιαστικά αποτελέσματα, ενώ δημιουργεί προβλήματα και στην οπτικοποίηση των αποτελεσμάτων με την κατασκευή θεματικών χαρτών. Χαρακτηριστικό παράδειγμα θα ήταν η ομαδοποίηση των τιμών της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 σε ίσα διαστήματα π.χ. ανά 50.000 κατοίκους. Στην περίπτωση αυτή θα χρειάζονταν 77(!) ομάδες τιμών για να καλυφθούν όλα τα δεδομένα των 51 νομών, επειδή ο πληθυσμός του Ν. Αττικής είναι πολύ μεγάλος. Οι περισσότερες από τις ομάδες αυτές θα είχαν μηδενική συχνότητα. Για να αντιμετωπιστούν τα προβλήματα αυτά, επιλέγεται ένας μικρός αριθμός ομάδων τιμών, συνήθως γύρω στις πέντε, και αν υπάρχει ομαλή αύξηση των τιμών μπορεί οι ομάδες να έχουν το ίδιο εύρος. Αν όμως υπάρχουν απότομες μεταβολές τιμών, όπως συμβαίνει με τους νομούς Θεσσαλονίκης και Αττικής στο συγκεκριμένο παράδειγμα, τότε το εύρος των τιμών στις ομάδες μπορεί να είναι διαφορετικό. Στον Πίνακα 3.5 παρουσιάζεται η κατανομή συχνοτήτων της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 στους 51 νομούς της Ελλάδας. Αρχικά επιλέγεται ένα εύρος τιμών ανά 50.000 κατοίκους, στη συνέχεια αυξάνεται στις 100.000 και για να περιληφθεί ο Ν. Αχαΐας, δημιουργείται μία ομάδα τιμών 00001-310000 κάτοικοι. Οι ομάδες τιμών ξεχωρίζουν μεταξύ τους σύμφωνα με την ακρίβεια των δεδομένων που είναι ακέραιοι αριθμοί, δηλαδή με έναν κάτοικο κάθε φορά. Αν η ακρίβεια ήταν σε δεκαδικά θα διαχωρίζονταν οι ομάδες τιμών με τον αντίστοιχο αριθμό δεκαδικών ψηφίων. Ο Πίνακας 3.5 δεν είναι η μοναδική λύση για τα δεδομένα του Πίνακα 3.4, θα μπορούσε δηλαδή η ομαδοποίηση των τιμών να είναι διαφορετική. Από τον Πίνακα 3.5 μπορούν να απαντηθούν ορισμένες βασικές ερωτήσεις για την κατανομή του πληθυσμού στους νομούς της Ελλάδας: Τι ποσοστό νομών έχει πληθυσμό έως 50.000 κατοίκους; Η απάντηση βρίσκεται στη στήλη Percet και είναι 15,7%. Τι ποσοστό νομών έχει πληθυσμό μέχρι 00.000 κατοίκους; Η απάντηση βρίσκεται στη στήλη Cumulatve Percet και είναι 84,3%. 61

Πόσοι νομοί έχουν πληθυσμό πάνω από 1.000.000; Η απάντηση βρίσκεται στη στήλη Frequecy και είναι δύο νομοί. Πίνακας 3.4 Ταξινομημένα δεδομένα για την μεταβλητή ΠΛΗΘΥΣΜΟΣ 011 και σχετικές συχνότητες 6

Πίνακας 3.5 Κατανομή συχνοτήτων συνεχούς μεταβλητής με ομαδοποίηση τιμών (SPSS) Σχετικά με τη στήλη των αθροιστικών συχνοτήτων (Cumulatve percet) πρέπει να σημειωθεί ότι αν υπάρχει κάποια συγκεκριμένη τιμή της μεταβλητής για την οποία υπάρχει ενδιαφέρον, για παράδειγμα ο πληθυσμός κάτω των 100.000 κατοίκων ή το εισόδημα κάτω από ένα όριο που είναι το όριο της φτώχειας, τότε πρέπει υποχρεωτικά η τιμή αυτή να αποτελέσει όριο μιας ομάδας τιμών. Τα αποτελέσματα του Πίνακα 3.5 παρουσιάζονται με μορφή ιστογράμματος στο Διάγραμμα 3.. Στο διάγραμμα αυτό φαίνεται ότι οι περισσότεροι νομοί είναι συγκεντρωμένοι στη μεσαία ομάδα τιμών και λιγότεροι νομοί βρίσκονται στη μικρότερη ή στη μεγαλύτερη πληθυσμιακή ομάδα. Αυτού του είδους η κατανομή των παρατηρήσεων στο διάγραμμα είναι επιθυμητή, επειδή μπορεί να συνδεθεί με τις ιδιότητες της κανονικής κατανομής, οι οποίες θα αναπτυχθούν στο επόμενο κεφάλαιο. Σχετικά με τη μορφή της κατανομής των παρατηρήσεων, χρήσιμα είναι και τα πολύγωνα συχνοτήτων, τα οποία αποτελούνται από τις γραμμές που ενώνουν το μέσο των στηλών του ιστογράμματος (Διάγραμμα 3.3). Στις κορυφές του πολυγώνου του Διαγράμματος 3.3 εμφανίζονται οι απόλυτες συχνότητες του Πίνακα 3.5. Στην περίπτωση συνεχών μεταβλητών μπορεί να κατασκευαστεί η καμπύλη συχνοτήτων. Η καμπύλη συχνοτήτων αποτελεί επέκταση του πολυγώνου συχνοτήτων, εφόσον το μέγεθος του δείγματος είναι μεγάλο. Καθώς μεγαλώνει το μέγεθος του δείγματος μπορεί να δημιουργηθεί μεγαλύτερος αριθμός τάξεων, οπότε μεγαλώνει και ο αριθμός των διαστημάτων που παρουσιάζονται στο ιστόγραμμα και στο πολύγωνο συχνοτήτων. Για πολύ μεγάλο πλήθος διαστημάτων το πολύγωνο συχνοτήτων προσεγγίζει μία ομαλή καμπύλη, την καμπύλη συχνοτήτων. Η καμπύλη αυτή αποτελεί προσέγγιση της θεωρητικής κατανομής του πληθυσμού από την οποία προήλθε το δείγμα (οι θεωρητικές κατανομές θα εξηγηθούν στο επόμενο κεφάλαιο). Όταν για παράδειγμα η κατανομή των συχνοτήτων είναι συμμετρική ως προς μία μέση τιμή και η καμπύλη συχνοτήτων έχει σχήμα καμπάνας, προσεγγίζει την κανονική κατανομή (βλ. Κεφάλαιο 4). Στο Διάγραμμα 3.4 φαίνεται η καμπύλη συχνοτήτων για το ιστόγραμμα του διαγράμματος 3.. Διάγραμμα 3. Ιστόγραμμα 63

Διάγραμμα 3.3 Πολύγωνο συχνοτήτων (Excel) Διάγραμμα 3.4 Καμπύλη συχνοτήτων ΠΑΡΑΔΕΙΓΜΑ 3.4: Kατανομή συχνοτήτων ποσοτικής μεταβλητής (800 κατοικίες) Στον Πίνακα 3.6 παρουσιάζεται η κατανομή συχνοτήτων για την αξία των 800 κατοικιών του Ν. Αττικής, τμήμα των οποίων παρουσιάζεται στη γεωγραφική μήτρα δεδομένων του Πίνακα 1.. Δεδομένου του σχετικά μεγάλου αριθμού των παρατηρήσεων, δεν είναι εύκολο να οριστούν οι τάξεις για τον πίνακα κατανομής συχνοτήτων. Στην περίπτωση αυτή είναι χρήσιμη η κατασκευή ενός διαγράμματος, το οποίο δείχνει την αύξηση των τιμών της μεταβλητής, αφού πρώτα οι παρατηρήσεις ταξινομηθούν κατά αύξουσα τάξη. Στο παράδειγμα των 800 κατοικιών, γίνεται πρώτα ταξινόμηση των κατοικιών κατά αύξουσα αξία και κατασκευάζεται το Διάγραμμα 3.5. Στον οριζόντιο άξονα βρίσκεται η αρίθμηση των ταξινομημένων παρατηρήσεων και στον κάθετο η αξία των κατοικιών σε ευρώ. Η μεταβολή των τιμών είναι ομαλή μέχρι την τιμή των 500.000 ευρώ περίπου και στη συνέχεια υπάρχει απότομη αύξηση τιμών, αυτό είναι και το σημείο ασυνέχειας (breakg pot). Μετά από δοκιμές, προκύπτουν οι τάξεις του Πίνακα 3.6 οι οποίες καταλήγουν σε ιστόγραμμα το οποίο προσεγγίζει το σχήμα της κανονικής κατανομής. Στο Vdeo 3.1 παρουσιάζεται η διαδικασία κατασκευής των τάξεων (ομαδοποίηση τιμών) και στο Vdeo 3. η διαδικασία δημιουργίας του πίνακα κατανομής συχνοτήτων και του ιστογράμματος στο SPSS. 64

Διάγραμμα 3.5 Μελέτη τιμών συνεχούς μεταβλητής ΑΞΙΑ ΚΑΤΟΙΚΙΩΝ Frequecy Percet Vald Percet Cumulatve Percet Vald έως 50000 50 6, 6, 6, 50001-80000 86 10,8 10,8 17,0 80001-130000 148 18,5 18,5 35,5 130001-30000 33 9,1 9,1 64,6 30001-400000 140 17,5 17,5 8,1 400001-650000 76 9,5 9,5 91,6 >650000 67 8,4 8,4 100,0 Total 800 100,0 100,0 Πίνακας 3.6 Κατανομή συχνοτήτων της αξίας 800 κατοικιών (SPSS) Vdeo 3.1 Βίντεο Κατασκευή τάξεων για συνεχή μεταβλητή Vdeo 3. Βίντεο Πίνακας κατανομής συχνοτήτων και ιστόγραμμα για συνεχή μεταβλητή 3..3 Οπτικοποίηση αποτελεσμάτων πινάκων κατανομής συχνοτήτων Τα δεδομένα που προκύπτουν από τους πίνακες κατανομής συχνοτήτων για ποσοτικές μεταβλητές, σύμφωνα με τα παραπάνω κριτήρια, χρησιμοποιούνται για την κατασκευή θεματικών χαρτών, στους οποίους το υπόμνημα αντιστοιχεί στις ομάδες τιμών, δηλαδή στις τάξεις του πίνακα κατανομής συχνοτήτων. ΠΑΡΑΔΕΙΓΜΑ 3.5: Xαρτογράφηση ποσοτικής μεταβλητής (ΠΛΗΘΥΣΜΟΣ 011) Στον Χάρτη 3.1 έχουν χαρτογραφηθεί τα δεδομένα της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 με τη βοήθεια του λογισμικού ArcGIS. Το υπόμνημα έχει κατασκευαστεί όχι με τους αυτόματους τρόπους οι οποίοι 65

διατίθενται από το λογισμικό (π.χ. τυπικές αποκλίσεις, σημεία ασυνέχειας κλπ.), οι οποίοι είναι βεβαίως εξίσου χρήσιμοι, αλλά με βάση τον πίνακα κατανομής συχνοτήτων για τη μεταβλητή ΠΛΗΘΥΣΜΟΣ 011 (Πίνακας 3.5). Στον Χάρτη 3.1 μπορούμε να παρατηρήσουμε την αντιστοιχία με τον Πίνακα 3.5 και με τον Πίνακα 3.4 ως εξής: οι νομοί με πληθυσμό έως 50000 κατοίκους είναι οκτώ και είναι οι νομοί Ευρυτανίας, Λευκάδας, Γρεβενών, Κεφαλληνίας, Φωκίδος, Ζακύνθου, Σάμου και Θεσπρωτίας. Με παρόμοιο τρόπο εμφανίζονται και οι υπόλοιπες τάξεις του πίνακα κατανομής συχνοτήτων. Δύο μόνο νομοί έχουν πληθυσμό άνω του 1.000.000 και αυτοί είναι οι νομοί Αττικής και Θεσσαλονίκης. Δεν είναι όμως πάντα δυνατή η οπτικοποίηση των αποτελεσμάτων από κατανομές συχνοτήτων γεωγραφικών δεδομένων. Στο προηγούμενο παράδειγμα υπάρχει σαφής αντιστοιχία μεταξύ των νομών και του πληθυσμού τους και οι νομοί αποτελούν πολύγωνα στον πίνακα των περιγραφικών χαρακτηριστικών του GIS. Για τα δεδομένα όμως του Πίνακα 3.6 δεν υπάρχει η αντιστοιχία αυτή. Παρόλο που είναι γνωστός ο δήμος στον οποίο ανήκουν οι κατοικίες, δεν είναι δυνατό να χαρτογραφηθούν απευθείας στο GIS. Aν υπήρχαν οι συντεταγμένες των κατοικιών, τα δεδομένα θα ήταν σημειακά δηλαδή σε κάθε σημείο θα αντιστοιχούσε μία αξία, οπότε θα μπορούσε να γίνει κάποιου είδους θεματική απεικόνιση. Εφόσον σκοπός της μελέτης είναι να διερευνηθεί η κατανομή των αξιών των κατοικιών στους δήμους του Ν. Αττικής, τότε πρέπει να βρεθεί ένας τρόπος να αντιστοιχιστούν οι αξίες των ακινήτων στους δήμους της Αττικής. Ένας απλός τρόπος είναι να υπολογιστεί η μέση αξία των κατοικιών για κάθε δήμο, με βάση τις κατοικίες που υπάρχουν σε κάθε δήμο στα δεδομένα των 800 κατοικιών και στη συνέχεια να δημιουργηθούν τάξεις για την μέση αξία ανά δήμο. ΠΑΡΑΔΕΙΓΜΑ 3.6: Xαρτογράφηση ποσοτικής μεταβλητής (800 κατοικίες) Η διαδικασία υπολογισμού της μέσης αξίας ανά δήμο παρουσιάζεται στο Vdeo 3.3. Η εφαρμογή 3.1 δίνει τη δυνατότητα στον χρήστη να δει τη χαρτογράφηση τριών μεταβλητών: τη μέση αξία, το μέσο εμβαδόν και τη μέση ηλικία των κατοικιών του δείγματος. Το αποτέλεσμα της χαρτογράφησης για τη μέση αξία παρουσιάζεται στον Χάρτη 3.. στον οποίο παρατηρούμε ότι οι υψηλότερες αξίες των κατοικιών παρατηρούνται κυρίως σε δήμους των βορείων και νοτίων προαστίων, ενώ οι χαμηλότερες σε ορισμένους δήμους του Πειραιά και της Δυτικής Αττικής. Iteractve 3.1 Xαρτογράφηση ποσοτικής μεταβλητής Διαδραστικό αντικείμενο 3..4 Παρατηρήσεις Μία σημαντική παρατήρηση σχετικά με τους πίνακες κατανομής συχνοτήτων είναι ότι όπως και σε όλες τις στατιστικές επεξεργασίες που θα ακολουθήσουν, υπάρχει απώλεια πληροφορίας σε σχέση με τα αρχικά δεδομένα. Στον πίνακα κατανομής συχνοτήτων χάνεται η πληροφορία της ονομασίας των επιμέρους παρατηρήσεων, στο παράδειγμα του Πίνακα 3.5 χάνεται η πληροφορία ποιοι νομοί ανήκουν σε κάθε τάξη. Η πληροφορία αυτή ανακτάται με την κατασκευή του θεματικού χάρτη αλλά και πάλι δεν είναι γνωστό μόνο από την παρατήρηση του χάρτη ποια είναι ακριβώς τα πληθυσμιακά μεγέθη των νομών. Για τον ίδιο λόγο η μεταβλητή η οποία προκύπτει από την ομαδοποίηση των τιμών (π.χ. οι ομάδες αξίας στην 1 η στήλη του Πίνακα 3.6), ενώ προέρχεται από ποσοτικά δεδομένα καταλήγει να μετράται στην ιεραρχική κλίμακα, δηλαδή είναι σαφές ότι μια κατοικία η οποία ανήκει στην πρώτη τάξη (<50.000 ευρώ) έχει μικρότερη αξία από μια κατοικία η οποία ανήκει στη δεύτερη τάξη (50.001-80.000 ευρώ), αλλά δεν είναι δυνατό να υπολογιστεί η αναλογία μεταξύ της αξίας των δύο κατοικιών, όπως συμβαίνει στην αναλογική κλίμακα μέτρησης. Αυτή η μετατροπή φαίνεται στο Vdeo 3.1, όπου στο αρχείο των δεδομένων στο SPSS δημιουργείται μία νέα στήλη της οποίας οι τιμές είναι τα λεκτικά: <50000, 50001-80000, 80001-130000, 130001-30000, 30001-400000, 400001-650000 και >650000. Κάθε μία από τις 800 κατοικίες λαμβάνει μία από τις τιμές αυτές και η νέα αυτή μεταβλητή (Ομάδες Αξίας) μετράται στην ιεραρχική κλίμακα. Επομένως, οι πίνακες κατανομής συχνοτήτων αφορούν ποιοτικά δεδομένα, δηλαδή μεταβλητές μετρημένες στην ονομαστική ή ιεραρχική κλίμακα μέτρησης. Στην περίπτωση ποσοτικών δεδομένων πρέπει να προηγηθεί ομαδοποίηση των τιμών της μεταβλητής, οπότε η ποσοτική μεταβλητή μετατρέπεται σε ιεραρχική. Στην πραγματικότητα οι πίνακες αυτοί αποτελούν μία από τις ελάχιστες στατιστικές επεξεργασίες για ποιοτικά δεδομένα. 66

Χάρτης 3.1 Χαρτογράφηση κατανομής συχνοτήτων Vdeo3.3 Υπολογισμός μέσης αξίας ανά δήμο Βίντεο 67

Χάρτης 3. Χαρτογράφηση μέσης αξίας 800 κατοικιών Μία άλλη σημαντική παρατήρηση είναι η σχέση των σχετικών συχνοτήτων με τις πιθανότητες, η οποία θα διερευνηθεί διεξοδικότερα στο επόμενο κεφάλαιο. Επειδή οι σχετικές συχνότητες δηλώνουν την εμφάνιση κάποιου χαρακτηριστικού του πληθυσμού, κατ αναλογία στο σύνολο των μετρήσεων, μπορεί να θεωρηθεί ότι «επέχουν θέση πιθανοτήτων» (Τσίμπος & Γεωργιακώδης, 010). Σύμφωνα με τα δεδομένα του Πίνακα 3.6 το ποσοστό των κατοικιών οι οποίες έχουν αξία 130.001-30.000 ευρώ είναι 9,1%, οπότε μπορεί να θεωρηθεί ότι η πιθανότητα μια κατοικία στο Ν. Αττικής να έχει αξία μεταξύ 130.001 και 30.000 ευρώ είναι 9,1%. Η πιθανότητα αυτή στηρίζεται στην εμπειρική κατανομή της αξίας των 800 κατοικιών και θα μπορούσε να προκύπτει άλλο αποτέλεσμα από ένα διαφορετικό δείγμα. Τα ζητήματα αυτά θα αναλυθούν στο επόμενο κεφάλαιο. Τέλος, οι πίνακες κατανομής συχνοτήτων δείχνουν τη δομή του πληθυσμού ή του δείγματος, δηλαδή παρουσιάζουν τη βαρύτητα που έχει κάθε τιμή ή κάθε ομάδα τιμών. Ειδικότερα οι σχετικές συχνότητες μπορεί να χρησιμοποιηθούν για τη σύγκριση της κατανομής της ίδιας μεταβλητής σε διαφορετικές γεωγραφικές περιοχές. Στο παράδειγμα του Πίνακα 3., ο πίνακας κατανομής συχνοτήτων των χρήσεων γης για τα οικοδομικά τετράγωνα θα ήταν διαφορετικός για μια άλλη περιοχή, η οποία δεν θα είχε έντονο εμπορικό χαρακτήρα και θα ήταν περιοχή κατοικίας. Κατά συνέπεια η κατασκευή πινάκων κατανομής συχνοτήτων της ίδιας μεταβλητής για διαφορετικές περιοχές μπορεί να χρησιμοποιηθεί για τη σύγκριση της δομής τους. 3.3 Διασταυρώσεις μεταβλητών Οι κατανομές συχνοτήτων μπορούν να κατασκευάζονται και για περισσότερες από μία μεταβλητές, οπότε προκύπτουν διασταυρώσεις μεταβλητών (crosstabulato) ή πίνακες διπλής, τριπλής κλπ. εισόδου ή πίνακες συνάφειας, οι οποίοι εμφανίζουν τη σχέση μεταξύ δύο ή περισσότερων μεταβλητών. Ο πίνακας διπλής εισόδου αποτελείται από γραμμές και στήλες, οι οποίες αντιστοιχούν στις τιμές των δύο μεταβλητών (οι γραμμές για τη μία μεταβλητή και οι στήλες για την άλλη). Όπως και στους απλούς πίνακες κατανομής συχνοτήτων οι μεταβλητές πρέπει να είναι ποιοτικές, μετρημένες στην ονομαστική ή την ιεραρχική κλίμακα. Στην περίπτωση ποσοτικών δεδομένων πρέπει να προηγηθεί η ομαδοποίηση των τιμών των μεταβλητών. 68

Ο πίνακας διασταυρώσεων για δύο μεταβλητές κατασκευάζεται με ανάλογο τρόπο όπως ο πίνακας κατανομής συχνοτήτων μίας μεταβλητής, μόνο που τώρα μετράται πόσες φορές υπάρχει ο κάθε συνδυασμός τιμών και καταγράφεται ο αριθμός (ή το ποσοστό) στο αντίστοιχο φατνίο. Έχει διαστάσεις από x έως x m, όπου ο αριθμός των γραμμών και m ο αριθμός των στηλών. ΠΑΡΑΔΕΙΓΜΑ 3.7: Διασταύρωση μεταβλητών Στον Πίνακα 3.7 φαίνεται η διασταύρωση της αξίας διαμερίσματος με τη θέση στάθμευσης όπως προκύπτει από το λογισμικό SPSS για τις 800 κατοικίες του Πίνακα 3.6. Σε κάθε φατνίο καταγράφεται οπωσδήποτε η απόλυτη συχνότητα (με την ένδειξη cout), και κατόπιν επιλογής στο SPSS, το ποσοστό γραμμής και το ποσοστό στήλης (με την ένδειξη wth-όνομα μεταβλητής). Οι καταμετρήσεις των απόλυτων συχνοτήτων αθροίζουν οριζοντίως και καθέτως στο πλήθος των παρατηρήσεων κάθε τιμής (με πράσινη επισήμανση στον Πίνακα 3.7). Για παράδειγμα στην πρώτη γραμμή του Πίνακα 3.7 συνολικά 50 κατοικίες έχουν αξία έως 50000 ευρώ και από αυτές 44 δεν έχουν θέση στάθμευσης και 6 έχουν. Αντίστοιχα στην πρώτη στήλη του πίνακα, συνολικά 4 κατοικίες δεν έχουν θέση στάθμευσης και από αυτές 44 έχουν αξία έως 50000 ευρώ, 67 από 50001 έως 80000 ευρώ, 6 από 80001 έως 130000 ευρώ κ.ο.κ. Πίνακας 3.7 Διασταύρωση μεταβλητών (SPSS) Επειδή, όπως και στην περίπτωση των απλών πινάκων κατανομής συχνοτήτων (μίας μεταβλητής), οι απόλυτες συχνότητες στον πίνακα διασταυρώσεων δεν διευκολύνουν στην απάντηση σημαντικών ερωτήσεων 69

οι οποίες αφορούν τη δομή των δεδομένων και τη σχέση μεταξύ των δύο μεταβλητών, είναι πολύ χρήσιμος ο υπολογισμός και των σχετικών συχνοτήτων για τον συνδυασμό των δύο μεταβλητών, οι οποίες εμφανίζονται ως ποσοστά γραμμής και στήλης. Τα ποσοστά της γραμμής (με κίτρινη επισήμανση) αθροίζουν στο 100% κατά μήκος της γραμμής. Επομένως από τις 50 κατοικίες με αξία έως 50.000 ευρώ, το 88% δεν έχει θέση στάθμευσης και το 1% έχει. Τα ποσοστά στήλης (με γαλάζια επισήμανση) αθροίζουν στο 100% κατά μήκος της στήλης. Δηλαδή από τις 4 κατοικίες χωρίς θέση στάθμευσης, το 18,% έχει αξία έως 50.000 ευρώ, το 7,7% έχει αξία από 50001 έως 80000 ευρώ, το 5,6% 80.001 έως 130.000 ευρώ κ.ο.κ. Μία σημαντική ιδιότητα του πίνακα διασταυρώσεων είναι ότι στην τελευταία γραμμή και στην τελευταία στήλη περιλαμβάνονται οι κατανομές συχνοτήτων των μεμονωμένων μεταβλητών. Στον Πίνακα 3.7 η τελευταία στήλη αποτελείται από τις απόλυτες και σχετικές συχνότητες της μεταβλητής ΑΞΙΑ ΚΑΤΟΙΚΙΑΣ, οι οποίες έχουν υπολογιστεί στον Πίνακα 3.6 (με μωβ επισήμανση φαίνονται οι σχετικές συχνότητες). Αντίστοιχα στην τελευταία γραμμή του Πίνακα 3.7 εμφανίζεται η κατανομή συχνοτήτων για την μεταβλητή ΘΕΣΗ ΣΤΑΘΜΕΥΣΗΣ. Οι απόλυτες συχνότητες είναι f 1 =4 για την τιμή ΟΧΙ και f =558 για την τιμή ΝΑΙ, ενώ οι σχετικές συχνότητες είναι 30,% και 69,8% αντίστοιχα. Ο πίνακας των διασταυρώσεων μπορεί να χρησιμοποιηθεί για να διαπιστωθεί η σχέση μεταξύ δύο μεταβλητών. Από την παρατήρηση του Πίνακα 3.7 είναι δυνατό να απαντηθούν ερωτήσεις της μορφής: Σε ποια ομάδα αξίας βρίσκεται το μεγαλύτερο ποσοστό των κατοικιών με θέση στάθμευσης; Η απάντηση βρίσκεται στην στήλη ΝΑΙ όπου εντοπίζεται το μεγαλύτερο ποσοστό στήλης 33,7% το οποίο αντιστοιχεί στην ομάδα αξίας 130.001 έως 30.000 ευρώ. Ποια ομάδα αξίας έχει το μεγαλύτερο ποσοστό κατοικιών με θέση στάθμευσης; Η απάντηση είναι στην προτελευταία γραμμή, δηλαδή η ομάδα αξίας 400001-650000 ευρώ όπου 94,7% των κατοικιών έχουν θέση στάθμευσης. Ποια ομάδα αξίας έχει το μικρότερο ποσοστό κατοικιών με θέση στάθμευσης; Η απάντηση είναι στην πρώτη γραμμή, δηλαδή η ομάδα αξίας έως 50.000 ευρώ, όπου μόνο το 1% των κατοικιών έχουν θέση στάθμευσης. Ανάλογα δηλαδή με τον τύπο της ερώτησης διαβάζονται τα ποσοστά των γραμμών ή των στηλών. Από τις παραπάνω ερωτήσεις φαίνεται ότι τα περισσότερα από τα φθηνότερα διαμερίσματα δεν διαθέτουν θέση στάθμευσης, ενώ το αντίθετο συμβαίνει για τα ακριβότερα διαμερίσματα. Αυτό αποτελεί ένδειξη ότι υπάρχει σχέση μεταξύ της αξίας των κατοικιών και της θέσης στάθμευσης. H σχέση αυτή θα διερευνηθεί περαιτέρω στο Κεφάλαιο 4, με τη βοήθεια του στατιστικού ελέγχου Χ. 3.4 Σύνθετες γραφικές παραστάσεις Στην ενότητα αυτή αναφέρονται δύο γραφικές παραστάσεις οι οποίες χρησιμοποιούνται εκτενώς στη διεθνή βιβλιογραφία αλλά και ειδικότερα στην απεικόνιση γεωγραφικών φαινομένων. Η χρησιμότητά τους αφορά την κατανόηση επιστημονικών εργασιών που τις αναφέρουν αλλά και τη χρησιμοποίησή τους σε εμπειρικές γεωγραφικές μελέτες. Πρόκειται για την καμπύλη Lorez με την οποία απεικονίζεται η άνιση κατανομή ενός φαινομένου και το τριαδικό γράφημα με το οποίο παρουσιάζεται η ομαδοποίηση παρατηρήσεων ως προς κάποιο χαρακτηριστικό, το οποίο όμως περιγράφεται από τρεις μεταβλητές. 3.4.1 Καμπύλη Lorez Η καμπύλη Lorez (Lorez curve) στηρίζεται στις αθροιστικές συχνότητες ενός πίνακα κατανομής συχνοτήτων και χρησιμοποιείται για να γίνουν συγκρίσεις σχετικά με τη συγκέντρωση και ανισοκατανομή διαφόρων φαινομένων όπως το εισόδημα, ο πληθυσμός, η απασχόληση κλπ. (Τσίμπος & Γεωργιακώδης, 010). Η σύγκριση γίνεται σε σχέση με μια ιδεατή ίση κατανομή, στην οποία οι συχνότητες για όλες τις κατηγορίες της κατανομής συχνοτήτων είναι ίσες. Στην οικονομική επιστήμη κλασική εφαρμογή της καμπύλης Lorez αποτελεί η μελέτη της ανισοκατανομής του εισοδήματος σε μία ομάδα πληθυσμού. Στη Γεωγραφική Ανάλυση τα δεδομένα αφορούν τη γεωγραφική κατανομή μιας μεταβλητής, όπως είναι ο πληθυσμός. Δηλαδή, ο πληθυσμός δεν παρουσιάζει ομοιόμορφη κατανομή, αφού άλλες πόλεις είναι μεγαλύτερες και άλλες μικρότερες. Με την καμπύλη Lorez μπορούμε να δείξουμε την ανισοκατανομή σε γραφική παράσταση και να τη μετρήσουμε. Επίσης μπορούν να γίνουν και διαχρονικές συγκρίσεις, αν για παράδειγμα η ανισοκατανομή του πληθυσμού μεγαλώνει ή μικραίνει, αλλά και συγκρίσεις μεταξύ διαφορετικών γεωγραφικών περιοχών για 70

το ίδιο φαινόμενο. Επίσης, ευρεία είναι η εφαρμογή της καμπύλης Lorez στη μελέτη των περιφερειακών ανισοτήτων, ενώ μπορεί να παρουσιάσει και τον συνδυασμό δύο μεταβλητών. Η καμπύλη Lorez κατασκευάζεται ως εξής: 1. Υπολογίζεται ο πίνακας σχετικών συχνοτήτων της μεταβλητής.. Οι σχετικές συχνότητες ταξινομούνται κατά αύξουσα ή φθίνουσα τάξη (αν ταξινομηθούν κατά φθίνουσα τάξη η καμπύλη Lorez εμφανίζεται πάνω από τη διαγώνιο). 3. Σχηματίζεται ο πίνακας των αθροιστικών συχνοτήτων με βάση τις ταξινομημένες συχνότητες 4. Κατασκευάζεται διάγραμμα με τις παρατηρήσεις στον οριζόντιο άξονα και τις αθροιστικές συχνότητες που τους αντιστοιχούν στον κατακόρυφο άξονα. 5. Κατασκευάζεται η διαγώνιος η οποία αντιπροσωπεύει την ίση κατανομή στο διάγραμμα. Όσο μεγαλύτερη είναι η απόσταση της καμπύλης Lorez από τη γραμμή ίσης κατανομής (διαγώνιος), τόσο μεγαλύτερη είναι η ανισοκατανομή της μεταβλητής στο χώρο. ΠΑΡΑΔΕΙΓΜΑ 3.8: Καμπύλη Lorez (νομοί Ελλάδας) Στον Πίνακα 3.4 παρουσιάζονται τα δεδομένα για την κατασκευή της καμπύλης Lorez με την ονομασία ΠΛΗΘΥΣΜΟΣ 011 στο Διάγραμμα 3.6. Η 1 η στήλη του πίνακα είναι τα ταξινομημένα δεδομένα της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011, δηλαδή ο πληθυσμός των νομών έχει ταξινομηθεί κατά αύξουσα τάξη. Στη η στήλη έχει υπολογιστεί η σχετική συχνότητα, δηλαδή το ποσοστό του πληθυσμού κάθε νομού στο συνολικό πληθυσμό της χώρας, ενώ στην 3 η στήλη εμφανίζεται η αθροιστική συχνότητα. Η 3 η στήλη έχει χρησιμοποιηθεί για την κατασκευή της καμπύλης ΠΛΗΘΥΣΜΟΣ 011 στο Διάγραμμα 3.5. Με παρόμοιο τρόπο έχουν κατασκευαστεί οι καμπύλες ΠΛΗΘΥΣΜΟΣ 1971 και ΠΛΗΘΥΣΜΟΣ 1991. Η γραμμή της ίσης κατανομής μπορεί να υπολογιστεί επίσης με τον ίδιο τρόπο ξεκινώντας από μία κατανομή ίσων ποσοστών. Αν δηλαδή όλοι οι νομοί της χώρας είχαν ίσο πληθυσμό, αυτή θα ήταν η ομοιόμορφη κατανομή και κάθε νομός θα είχε το 1/51 του συνολικού πληθυσμού ή ποσοστό 1,96%. Πρέπει να σημειωθεί ότι συχνά για να παρασταθεί η ανισοκατανομή του πληθυσμού χρησιμοποιούνται στο διάγραμμα δύο μεταβλητές, στον οριζόντιο άξονα το ποσοστό της έκτασης και στον κατακόρυφο το ποσοστό του πληθυσμού (Παππάς, 005). Στο Διάγραμμα 3.6, στον οριζόντιο άξονα εμφανίζεται η αρίθμηση των νομών και στον κατακόρυφο οι αθροιστικές συχνότητες από 0 έως 100%. Από τις τρεις καμπύλες Lorez φαίνεται ότι η ανισοκατανομή του πληθυσμού στους νομούς της Ελλάδας σταδιακά αυξάνεται από το 1971 στο 011, αφού διαδοχικά μεγαλώνει η απόσταση της καμπύλης από τη γραμμή της ίσης κατανομής. Η καμπύλη Lorez στο Διάγραμμα 3.6 έχει σχεδιαστεί με τα στοιχεία των μεμονωμένων νομών, δεδομένου ότι ο αριθμός τους είναι περιορισμένος. Συνήθης είναι επίσης η διαδικασία σχεδιασμού της καμπύλης Lorez από πίνακα κατανομής συχνοτήτων όπου οι τιμές είναι ομαδοποιημένες, όπως είναι δηλαδή τα δεδομένα στον Πίνακα 3.5. Η διαδικασία είναι η ίδια: υπολογίζονται οι σχετικές συχνότητες και ταξινομούνται και στη συνέχεια υπολογίζονται οι αθροιστικές συχνότητες, από τις οποίες σχεδιάζεται η καμπύλη. Υπάρχουν διάφοροι δείκτες που μετρούν την ανισοκατανομή. Ο συντελεστής G (G coeffcet) είναι ο πιο διαδεδομένος και υπολογίζεται με βάση το εμβαδόν που περιέχεται ανάμεσα στην καμπύλη Lorez και τη γραμμή ίσης κατανομής, το οποίο διαιρείται με το ήμισυ του εμβαδού της περιοχής του γραφήματος δηλαδή συντελεστής G=Α/Β στο Διάγραμμα 3.6. Ο συντελεστής G χρησιμοποιείται από τις στατιστικές αρχές για τη συγκριτική μελέτη της ανισοκατανομής του εισοδήματος, για παράδειγμα με τον συντελεστή G μπορεί να συγκριθεί η ανισοκατανομή του εισοδήματος στην Ελλάδα και σε άλλες χώρες και να μελετηθεί η διαχρονική εξέλιξη της ανισοκατανομής αυτής (βλ. για παράδειγμα ΕΛΣΤΑΤ, 01). 71

Διάγραμμα 3.6 Καμπύλη Lorez (Ιδία επεξεργασία δεδομένων από www.statstcs.gr) 3.4. Διάγραμμα διασποράς και Τριαδικό Διάγραμμα Οι γραφικές παραστάσεις που παρουσιάστηκαν προηγουμένως (ιστογράμματα, καμπύλη Lorez) αφορούν την απεικόνιση μίας μεταβλητής. Στην καμπύλη Lorez του Διαγράμματος 3.6 οι καμπύλες αφορούν την ίδια μεταβλητή σε μία διαχρονική σύγκριση. Όμως συχνά υπάρχει η ανάγκη απεικόνισης της σχέσης μεταξύ δύο ή περισσότερων μεταβλητών, οι οποίες αντιπροσωπεύουν διαφορετικά φαινόμενα ή πολλές όψεις του ιδίου φαινομένου. Αυτή η ανάγκη υπάρχει σε όλες τις επιστήμες, αλλά και στην ανάλυση γεωγραφικών προβλημάτων, τα οποία συνήθως χαρακτηρίζονται από συνθετότητα και δεν μπορούν να περιγραφούν μόνο από μία μεταβλητή. Όπως θα συζητηθεί αναλυτικά στο Κεφάλαιο 5, ένας συνηθισμένος τρόπος για να παρουσιαστεί η σχέση δύο μεταβλητών είναι ένα γράφημα με δύο άξονες Χ και Υ κάθε ένας από τους οποίους αναπαριστά μία μεταβλητή (Διάγραμμα 3.7). Αφού τοποθετηθεί η τιμή της μεταβλητής στον άξονα Χ σχεδιάζεται παράλληλος προς τον άξονα Υ. Το ίδιο γίνεται με την τιμή της μεταβλητής στον άξονα Υ, από την οποία σχεδιάζεται παράλληλος προς τον άξονα Χ. Το σημείο που προκύπτει από την τομή των καθέτων αντιπροσωπεύει μία παρατήρηση. Αν δημιουργηθούν πολλά τέτοια σημεία προκύπτει το διάγραμμα διασποράς ή σκεδασμού (scatter dagram). ΠΑΡΑΔΕΙΓΜΑ 3.9:Διάγραμμα διασποράς Στο Διάγραμμα 3.7 παρουσιάζεται το διάγραμμα διασποράς για 14 κατοικίες. Οι κατοικίες απεικονίζονται σε ένα σύστημα συντεταγμένων, στο οποίο ο άξονας Χ απεικονίζει το εμβαδόν των κατοικιών και ο άξονας Υ την αξία των κατοικιών. Για δύο σημεία έχουν σχεδιαστεί οι συντεταγμένες οι οποίες είναι Χ=103 τ.μ. και Υ=130000 ευρώ για το ένα σημείο και Χ=48 τ.μ. και Υ=85000 ευρώ για το δεύτερο σημείο. 7

Διάγραμμα 3.7 Απεικόνιση 14 κατοικιών σύμφωνα με δύο μεταβλητές (SPSS) Το τριαδικό διάγραμμα ή τριγωνικό γράφημα (terary dagram) αποτελεί επέκταση του διαγράμματος διασποράς σε τρεις άξονες και χρησιμοποιείται για να παραστήσει παρατηρήσεις ως προς τρεις μεταβλητές. Η διαφορά σε σχέση με το διάγραμμα διασποράς είναι ότι οι τρεις αυτές μεταβλητές αποτελούν έκφραση του ιδίου φαινομένου και λαμβάνουν τιμές από 0 έως 100%. Παραδείγματα τέτοιου είδους μεταβλητών είναι η ποσοστιαία σύσταση των εδαφών ως προς τρία συστατικά και η σύνθεση της απασχόλησης ως προς τρεις τομείς παραγωγής, τον πρωτογενή, τον δευτερογενή και τον τριτογενή 1. Οι τρεις μεταβλητές τοποθετούνται στις πλευρές ενός ισόπλευρου τριγώνου (βλ. Διάγραμμα 3.8 τρίγωνο αβγ), συνήθως κατά τη φορά των δεικτών του ρολογιού. Τα ποσοστά των τριών μεταβλητών πρέπει να αθροίζουν σε 100. Κάθε παρατήρηση απεικονίζεται με ένα σημείο, το οποίο έχει τρεις συντεταγμένες δηλαδή τις τιμές για κάθε μία μεταβλητή. Η τιμή της πρώτης μεταβλητής τοποθετείται στον αντίστοιχο άξονα (π.χ. τον αβ και σχεδιάζεται η παράλληλος προς τον προηγούμενο άξονα αγ). Δεδομένου ότι το άθροισμα των τιμών των τριών μεταβλητών είναι 100% κάθε παρατήρηση απεικονίζεται με ένα μόνο σημείο στο διάγραμμα. Συνήθως το τριαδικό διάγραμμα συνοδεύεται και από ένα υπόμνημα το οποίο δείχνει τον τρόπο με τον οποίο γίνεται η ανάγνωση των συντεταγμένων (Διάγραμμα 3.8). ΠΑΡΑΔΕΙΓΜΑ 3.10: Τριαδικό διάγραμμα (απασχόληση στους τομείς παραγωγής) Στο Διάγραμμα 3.8 οι τρεις άξονες συντεταγμένων εμφανίζουν τους τρεις τομείς παραγωγής στην Ελλάδα. Τα δεδομένα αφορούν την απασχόληση κατά τομέα παραγωγής των νομών της Ελλάδας σύμφωνα με τα δεδομένα της Απογραφής Πληθυσμού 011 της ΕΛΣΤΑΤ. Ο Ν. Αττικής για παράδειγμα έχει απασχόληση στον πρωτογενή τομέα 1,%, στον δευτερογενή 17% και στον τριτογενή 81,8%. Τα τρία μεγέθη αθροίζουν σε 100% και επομένως ο νομός μπορεί να παρασταθεί με ένα σημείο στην επιφάνεια του τριγώνου. Αρχικά τοποθετείται μία τιμή σε οποιοδήποτε άξονα, π.χ. η τιμή 1, στον άξονα αβ, στη συνέχεια σχεδιάζεται μία παράλληλος προς τον προηγούμενο κατά τη φορά των δεικτών του ρολογιού άξονα που είναι ο άξονας αγ (πράσινη διακεκομμένη γραμμή στο σχήμα). Η ίδια διαδικασία ακολουθείται και για τους άλλους δύο άξονες: τοποθετείται η τιμή 17 στον άξονα βγ και σχεδιάζεται παράλληλος προς τον άξονα αβ (κόκκινη διακεκομμένη γραμμή στο σχήμα και τέλος τοποθετείται η τιμή 81, στον άξονα αγ και σχεδιάζεται παράλληλος προς τον άξονα βγ (μπλε διακεκομμένη γραμμή στο σχήμα).με τον τρόπο αυτό προκύπτει το σημείο στην επιφάνεια του 1 Μία βασική διάκριση των τομέων παραγωγής είναι: ο πρωτογενής τομέας ο οποίος περιλαμβάνει τις δραστηριότητες που παρέχουν αγαθά σε φυσική κατάσταση απευθείας από τη φύση χωρίς να έχουν υποστεί καμία επεξεργασία (γεωργία, κτηνοτροφία, αλιεία και εξορύξεις), ο δευτερογενής ο οποίος περιλαμβάνει την παραγωγή αγαθών τα οποία έχουν προέλθει από την επεξεργασία πρώτων υλών (μεταποίηση και βιομηχανική δραστηριότητα) και ο τριτογενής ο οποίος περιλαμβάνει την παροχή υπηρεσιών, χωρίς την παραγωγή υλικού προϊόντος. 73

τριγώνου το οποίο παριστά τον Ν. Αττικής. Συνολικά στο Διάγραμμα 3.8 εμφανίζονται 51 σημεία, όσοι οι νομοί της Ελλάδας. Το τριαδικό διάγραμμα δείχνει σχηματικά μία ταξινόμηση των παρατηρήσεων. Δηλαδή στο Διάγραμμα 3.8, οι περισσότεροι νομοί έχουν μία συγκέντρωση στην κάτω αριστερή περιοχή του διαγράμματος, η οποία ορίζεται από υψηλή απασχόληση στον τριτογενή τομέα (στους περισσότερους νομούς άνω του 50%), απασχόληση στον δευτερογενή τομέα μεταξύ 10 και 0% και απασχόληση στον πρωτογενή τομέα έως 40%. Κατά αυτό τον τρόπο μπορεί να γίνει ομαδοποίηση των νομών ως προς τη σύνθεση της απασχόλησης (γεωργικοί, βιομηχανικοί, αστικοί, μικτής απασχόλησης κλπ.). Το τριαδικό διάγραμμα έχει πολλές εφαρμογές στη βιβλιογραφία αλλά κλασικό παράδειγμα αποτελεί η ομαδοποίηση των εδαφών ανάλογα με τη σύνθεσή τους. Διάγραμμα 3.8 Τριαδικό διάγραμμα απασχόλησης στους τρεις τομείς παραγωγής στους νομούς της Ελλάδας 011 (Ιδία επεξεργασία από ΕΛΣΤΑΤ) ΠΑΡΑΔΕΙΓΜΑ 3.11:Τριαδικο διάγραμμα (ταξινόμηση εδαφών) Στο Διάγραμμα 3.9 παρουσιάζεται η ταξινόμηση των εδαφών σύμφωνα με την ύπαρξη στη σύστασή τους τριών βασικών συστατικών, της άμμου, της αργίλου και της ιλύος (Σιδηράς, 00). Τα συστατικά αυτά ορίζονται με βάση το μέγεθος των σωματιδίων από τα οποία αποτελούνται (κοκκομετρία). Το τρίγωνο υποδιαιρείται σε 1 περιοχές βάσει των ποσοστών των τριών συστατικών του εδάφους και τα εδάφη χαρακτηρίζονται ως αργιλώδη, αμμώδη κλπ. Επειδή κάθε τύπος εδάφους έχει διαφορετικά χαρακτηριστικά, η κατάταξη αυτή μπορεί να χρησιμοποιηθεί για τη διαχείριση των καλλιεργειών και τον σχεδιασμό συστημάτων άρδευσης. 74

Διάγραμμα 3.9 Τριαδικό διάγραμμα ταξινόμησης εδαφών (Επεξεργασία από U.S. Departmet of agrculture, http://www.rcs.usda.gov/wps/portal/rcs/detal/j/home/?cd=rcs141p_018993 ) 3.5 Μέτρα Κεντρικής Τάσης Στην ενότητα 3. παρουσιάστηκαν οι κατανομές συχνοτήτων και οι γραφικές τους παραστάσεις που αποτελούν έναν βασικό τρόπο σύνοψης ενός συνόλου δεδομένων. Tα δεδομένα, κυρίως όταν είναι ποσοτικά, είναι δυνατό να περιγραφούν με ακόμα πιο συνοπτικό τρόπο, με μία μόνο τιμή η οποία αντιπροσωπεύει όλη την κατανομή και αντιστοιχεί σε αυτό που ο κοινός νους γνωρίζει ως τον μέσο όρο (average). Στη Στατιστική ανάλογα με την κλίμακα μέτρησης των δεδομένων υπάρχουν περισσότερα του ενός μέτρα τα οποία εκφράζουν τον μέσο όρο. Τα μέτρα αυτά ονομάζονται μέτρα κεντρικής τάσης (measures of cetral tedecy) ή μέτρα θέσης και λαμβάνουν υπόψη τις τιμές όλων των δεδομένων προκειμένου να τις αποδώσουν με μία μόνο τιμή. Τα μέτρα κεντρικής τάσης χρησιμοποιούνται κυρίως για να περιγράψουν ποσοτικά δεδομένα και σπανιότερα χρησιμοποιούνται για κατηγορικές ή ιεραρχικές μεταβλητές. Όλα τα μέτρα κεντρικής τάσης αντιπροσωπεύουν το κέντρο της κατανομής μιας μεταβλητής. Υπάρχουν τρία μέτρα κεντρικής τάσης: ο αριθμητικός μέσος (arrthmetc mea), η διάμεσος (meda) και η επικρατούσα τιμή (mode). 3.5.1 Αριθμητικός Μέσος Ο αριθμητικός μέσος είναι το σπουδαιότερο μέτρο κεντρικής τάσης και έχει ευρύτατη εφαρμογή στις περισσότερες μεθόδους στατιστικής ανάλυσης δεδομένων. Μπορεί να χρησιμοποιηθεί μόνο σε ισοδιαστημικές και αναλογικές κλίμακες. Για να υπολογίσουμε τον αριθμητικό μέσο μιας μεταβλητής, προσθέτουμε όλες τις τιμές της μεταβλητής και διαιρούμε το άθροισμα με το πλήθος των παρατηρήσεων (), δηλαδή: 75

x X 1 όπου x είναι οι τιμές της μεταβλητής Χ και το πλήθος των παρατηρήσεων Ο συμβολισμός αφορά τον εκτιμώμενο μέσο ο οποίος προκύπτει από δείγμα, ενώ ο μέσος του στατιστικού πληθυσμού συμβολίζεται με μ. Ο συμβολισμός μ χρησιμοποιείται στον έλεγχο των υποθέσεων (βλ Κεφάλαιο 4) και είναι θεωρητικός, με την έννοια ότι συχνά τα δεδομένα για τον στατιστικό πληθυσμό δεν είναι διαθέσιμα. Ορισμένες σημαντικές ιδιότητες του αριθμητικού μέσου είναι (Καλαματιανού, 199 Τσίμπος & Γεωργιακώδης, 010 ): 1. Η τιμή του αριθμητικού μέσου βρίσκεται πάντα μεταξύ της ελάχιστης και της μέγιστης τιμής της μεταβλητής.. Εάν όλες οι τιμές των διαθέσιμων παρατηρήσεων είναι ίσες με μία ποσότητα, τότε ο αριθμητικός τους μέσος είναι ίσος με την ποσότητα αυτή. 3. Το άθροισμα των αποκλίσεων από τον αριθμητικό μέσο ισούται με μηδέν: X 1 x X 0 4. Το άθροισμα των τετραγώνων των αποκλίσεων από τον αριθμητικό μέσο είναι ελάχιστο σε σχέση με οποιοδήποτε άλλο σημείο της κατανομής: 1 ( x X ) m 5. Αν οι τιμές ενός συνόλου δεδομένων αυξηθούν κατά μία σταθερή τιμή C, τότε και ο αριθμητικός μέσος αυξάνεται κατά C, δηλαδή γίνεται X C. 6. Αν οι τιμές ενός συνόλου δεδομένων πολλαπλασιαστούν με μία σταθερή τιμή C, τότε και ο αριθμητικός μέσος πολλαπλασιάζεται επί C, δηλαδή γίνεται 7. Ο αριθμητικός μέσος έχει γραμμική συμπεριφορά. Δηλαδή αν,,, είναι οι αριθμητικοί μέσοι k συνόλων δεδομένων με αντίστοιχα μεγέθη 1,,, k, τότε το σύνολο των δεδομένων που αποτελείται από = 1 + + + k δεδομένα έχει αριθμητικό μέσο X που ισούται με: X 1 X1 X... k X k 1 X 1... k 8. O αριθμητικός μέσος είναι ευαίσθητος στις ακραίες τιμές. k Οι δύο πρώτες ιδιότητες αφορούν τις αποκλίσεις από τον αριθμητικό μέσο. Η απόκλιση είναι πολύ σημαντική έννοια και θα χρησιμοποιηθεί και στα επόμενα κεφάλαια. Ο αριθμητικός μέσος είναι η κεντρική τιμή και η απόκλιση είναι η διαφορά από την κεντρική αυτή τιμή: Απόκλιση = x X Οι θετικές και αρνητικές αποκλίσεις αλληλοαναιρούνται και αθροίζουν στο μηδέν. Όλες οι ιδιότητες έχουν επίσης χρησιμότητα στον υπολογισμό και την κατανόηση του αριθμητικού μέσου. ΠΑΡΑΔΕΙΓΜΑ 3.1: Αριθμητικός μέσος κατανομής με ακραίες τιμές Από τα στοιχεία της γεωγραφικής μήτρας δεδομένων (Πίνακας 1.1) προκύπτει ότι ο αριθμητικός μέσος της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 είναι 1.049 κάτοικοι (αθροίζουμε τις τιμές για τους 51 νομούς και διαιρούμε με 51). Δηλαδή αντιστοιχούν κατά μέσο όρο 1.049 κάτοικοι ανά νομό. Από την παρατήρηση της 1 ης στήλης του Πίνακα 3.4 προκύπτει ότι μόνο πέντε νομοί έχουν πληθυσμό μεγαλύτερο του αριθμητικού μέσου. Επειδή υπάρχουν δύο νομοί, οι νομοί Αττικής και Θεσσαλονίκης, με πολύ μεγάλα μεγέθη πληθυσμού, ο αριθμητικός μέσος επηρεάζεται από τις τιμές αυτές και το μέγεθός του μεγαλώνει (8 η ιδιότητα του αριθμητικού μέσου). Κατά συνέπεια, όταν δεν υπάρχει ομαλή κατανομή των τιμών, ο αριθμητικός μέσος δεν είναι αντιπροσωπευτικός της κατανομής των τιμών της μεταβλητής. CX. X 1 X X k 76

Ο αριθμητικός μέσος μπορεί να υπολογιστεί και από κατανομές συχνοτήτων (ομαδοποιημένα δεδομένα), εφόσον τα δεδομένα δεν είναι διαθέσιμα σε αναλυτική μορφή. Στην περίπτωση αυτή, το άθροισμα των τιμών της μεταβλητής υπολογίζεται από το άθροισμα των γινομένων κάθε τιμής επί τη συχνότητά της, ενώ ο συνολικός αριθμός των παρατηρήσεων προκύπτει από το άθροισμα των συχνοτήτων. Ο γενικός τύπος υπολογισμού του αριθμητικού μέσου από κατανομή συχνοτήτων είναι: X k 1 f x, όπου f είναι η συχνότητα της τιμής x, k ο αριθμός των τάξεων και =Σf ΠΑΡΑΔΕΙΓΜΑ 3.13: Αριθμητικός μέσος από πίνακα κατανομής συχνοτήτων για διακριτή μεταβλητή Στον Πίνακα 3.8 παρουσιάζεται η κατανομή των κατοικιών της Ελλάδας ανάλογα με τον αριθμό των δωματίων τους. Υπάρχουν 517.084 κατοικίες με ένα δωμάτιο, 1.605.781 με δύο κ.ο.κ. Επομένως οι τιμές της μεταβλητής Αριθμός δωματίων είναι 1-9 και οι συχνότητες είναι ο αριθμός των κατοικιών κάθε κατηγορίας. Για να υπολογιστεί το μέσο μέγεθος των δωματίων ανά κατοικία για όλη τη χώρα θα έπρεπε να έχουμε στη διάθεσή μας τα άθροισμα των δωματίων όλων των κατοικιών της Ελλάδας και το άθροισμα των κατοικιών. Τα αθροίσματα αυτά προκύπτον από τον πίνακα κατανομής συχνοτήτων (Πίνακας 3.8) ως εξής: Ο συνολικός αριθμός των δωματίων προκύπτει αν πολλαπλασιαστούν οι τιμές x με την αντίστοιχη συχνότητα, δηλαδή ο αριθμός των δωματίων για κατοικίες με ένα δωμάτιο είναι 517.084, με δύο δωμάτια 1.605.781=3.11.56 κ.ο.κ. Αθροίζοντας τα γινόμενα για όλες τις κατηγορίες των κατοικιών προκύπτει το άθροισμα των δωματίων 19.00.373, ενώ το άθροισμα των κατοικιών είναι 6.371.901. Από τη διαίρεση των δύο αθροισμάτων προκύπτει ότι ο μέσος αριθμός δωματίων ανά κατοικία είναι ίσος με,99. Παρόλο που από τη φύση τους τα δωμάτια είναι ακέραιοι αριθμοί, α αριθμητικός μέσος προκύπτει με δεκαδικά ψηφία, τα οποία καλό είναι να μην στρογγυλεύονται γιατί συχνά έχουν σημασία σε διαχρονικές ή διαπεριφερειακές συγκρίσεις. Πίνακας 3.8 Υπολογισμός αριθμητικού μέσου από πίνακα κατανομής συχνοτήτων για διακριτή μεταβλητή (Ιδία επεξεργασία από ΕΛΣΤΑΤ Απογραφή Πληθυσμού-Κατοικιών 011, www.statstcs.gr) Στο Παράδειγμα 3.13 η μεταβλητή ΑΡΙΘΜΟΣ ΔΩΜΑΤΙΩΝ είναι διακριτή με περιορισμένο αριθμό ακέραιων τιμών. Αν τα δεδομένα αφορούν συνεχή μεταβλητή και δίνονται ομαδοποιημένα σε πίνακα κατανομής συχνοτήτων η διαδικασία περιλαμβάνει ένα επιπλέον βήμα, να αποδοθεί μία μεσαία τιμή σε κάθε ομάδα τιμών. Ο μαθηματικός τύπος υπολογισμού στην περίπτωση αυτή είναι: Στην πραγματικότητα η τελευταία κατηγορία σύμφωνα με την ΕΛΣΤΑΤ είναι 9+, αλλά για λόγους ευκολίας στον υπολογισμό έχει μετατραπεί σε 9 δωμάτια κατά μέγιστο. 77

k fm I X 1, όπου m είναι οι μεσαίες τιμές των τάξεων και k ο αριθμός των τάξεων ΠΑΡΑΔΕΙΓΜΑ 3.14: Αριθμητικός μέσος από πίνακα κατανομής συχνοτήτων για συνεχή μεταβλητή Στον Πίνακα 3.9 παρουσιάζονται δεδομένα για το εμβαδόν των κατοικιών της Ελλάδας σύμφωνα με την Απογραφή Πληθυσμού-Κατοικιών 011. Δεν υπάρχουν διαθέσιμα αναλυτικά δεδομένα για την επιφάνεια των κατοικιών, οι αριθμός των οποίων υπερβαίνει τα 6 εκατομμύρια. Σε τέτοιες περιπτώσεις τα δεδομένα συνήθως παρουσιάζονται σε πίνακες κατανομής συχνοτήτων. Για να υπολογιστεί ο αριθμητικός μέσος πρέπει να οριστούν οι μεσαίες τιμές m των διαστημάτων της στήλης ΕΜΒΑΔΟΝ. Γενικά οι μεσαίες τιμές m προκύπτουν από τον αριθμητικό μέσο των ορίων των διαστημάτων, π.χ. για την κατηγορία κατοικιών από 60 έως 79 τ.μ. η μεσαία τιμή είναι 69,5 και θεωρούμε με τον τρόπο αυτό ότι όλες οι κατοικίες (συνολικά 1.573.911) της κατηγορίας αυτής έχουν εμβαδόν 69,5τ.μ. κάτι βεβαίως το οποίο δεν ανταποκρίνεται στην πραγματικότητα. Θεωρούμε δηλαδή ότι όλες οι παρατηρήσεις που εμπίπτουν στην ίδια ομάδα τιμών έχουν ως τιμή τη μεσαία τιμή. Υπάρχουν όμως και τα ανοικτά διαστήματα στον Πίνακα 3.9, «μικρότερο από» και «μεγαλύτερο από», τα οποία δημιουργούν αβεβαιότητα στον καθορισμό των μεσαίων τιμών. Εφόσον πρέπει να γίνει μία εκτίμηση των ορίων των ανοικτών διαστημάτων, θα χρησιμοποιηθούν οι γνώσεις μας για το αντικείμενο που μελετάμε. Ως προς το διάστημα <30τ.μ. είναι λογικό να θεωρήσουμε μια ελάχιστη τιμή 15τ.μ. Ως προς τις κατοικίες με εμβαδόν άνω των 150τ.μ. είναι γνωστό από σχετικές μελέτες ότι υπάρχουν κατοικίες στην Ελλάδα οι οποίες ξεπερνούν τα 1000τ.μ. Επειδή ο αριθμητικός μέσος είναι ευαίσθητος στις ακραίες τιμές όταν αυξάνεται η μεσαία τιμή της τελευταίας κατηγορίας, θα μεγαλώνει και το μέγεθος του αριθμητικού μέσου. Στον Πίνακα 3.9 έχει υποτεθεί ότι η τελευταία κατηγορία είναι 150-500τ.μ. Τελικά προκύπτει το μέσο εμβαδόν ανά κατοικία στην Ελλάδα στα 91,73 τ.μ. Πίνακας 3.9 Υπολογισμός αριθμητικού μέσου από πίνακα κατανομής συχνοτήτων για συνεχή μεταβλητή (Ιδία επεξεργασία από ΕΛΣΤΑΤ Απογραφή Πληθυσμού-Κατοικιών 011, www.statstcs.gr) Αυτή η μέθοδος υπολογισμού του αριθμητικού μέσου εφαρμόζεται μόνο όταν δεν είναι διαθέσιμα τα αρχικά αναλυτικά δεδομένα και ο υπολογισμός του αριθμητικού μέσου γίνεται κατά προσέγγιση, όπως περιγράφηκε παραπάνω. Εξ άλλου αν η ομαδοποίηση των τιμών ήταν διαφορετική, θα μεταβαλλόταν και το μέγεθος του αριθμητικού μέσου. Στη σύγχρονη εποχή όλο και περισσότερο υπάρχουν διαθέσιμα αναλυτικά δεδομένα οπότε η διαδικασία του υπολογισμού από πίνακες κατανομής συχνοτήτων γίνεται σπανιότερη. Όμως η διαδικασία αυτή είναι απαραίτητη σε περιπτώσεις που τα δεδομένα δεν είναι διαθέσιμα σε αναλυτική μορφή, 78

όπως αυτά του Πίνακα 3.9, ενώ είναι χρήσιμη για την κατανόηση της έννοιας του σταθμισμένου αριθμητικού μέσου η οποία περιγράφεται παρακάτω. Ο σταθμισμένος αριθμητικός μέσος (weghted mea) αφορά τον υπολογισμό του αριθμητικού μέσου, όταν στις τιμές της μεταβλητής αποδίδεται κάποιο βάρος ή στάθμη (weght). Η στάθμιση μπορεί να αφορά τη συχνότητα εμφάνισης (f) της τιμής κάθε μεταβλητής, όπως στα παραδείγματα των Πινάκων 3.8 και 3.9. Επίσης μπορεί να αφορά τον υπολογισμό του αριθμητικού μέσου όταν είναι γνωστοί οι αριθμητικοί μέσοι από υποομάδες του πληθυσμού. Αυτή είναι η περίπτωση της 7 ης ιδιότητας του αριθμητικού μέσου που παρουσιάστηκε παραπάνω. Τα 1,,, k είναι στην πραγματικότητα τα βάρη για τους αριθμητικούς μέσους X 1 των υποομάδων του πληθυσμού, σταθμισμένου αριθμητικού μέσου είναι: X W 1 1 w x w X,, X k. Ο γενικός μαθηματικός τύπος υπολογισμού του όπου x είναι οι τιμές της μεταβλητής Χ, w τα βάρη και το πλήθος των παρατηρήσεων ΠΑΡΑΔΕΙΓΜΑ 3.15: Υπολογισμός σταθμισμένου αριθμητικού μέσου Αν σε μία Σχολή Πανεπιστημίου υπάρχουν τέσσερα Τμήματα για τα οποία έχουν υπολογιστεί οι μέσοι βαθμοί των αποφοίτων και είναι γνωστός ο αριθμός τους (Πίνακας 3.10), τότε ο μέσος βαθμός για τη Σχολή υπολογίζεται ως εξής: Πίνακας 3.10 Υπολογισμός σταθμισμένου αριθμητικού μέσου X X X... X... 1 (7,5 550) (5,8 50) (6,5 00) (5,5 350) 550 50 00 350 1 1 k k k 6,5 7,5 5,8 6,5 5,5 (και όχι 6, 3) 4 Η έννοια των βαρών είναι πολύ σημαντική στη Γεωγραφική Ανάλυση, όπως θα φανεί στο Κεφάλαιο αυτό κατά τη συζήτηση των γεωστατιστικών δεικτών, όπου τα βάρη μπορεί είναι κάτοικοι, μαθητές, προϊόντα κλπ. Επίσης συχνά γίνεται λανθασμένος υπολογισμός του αριθμητικού μέσου κυρίως από δείκτες ή από ποσοστά, περιπτώσεις όπου επίσης χρειάζεται στάθμιση. ΠΑΡΑΔΕΙΓΜΑ 3.16: Υπολογισμός σταθμισμένου αριθμητικού μέσου από ποσοστά Στον Πίνακα 3.11 παρουσιάζονται δεδομένα για τη μέση πρόσβαση στο διαδίκτυο των νοικοκυριών στις 13 περιφέρειες της Ελλάδας. Για να υπολογιστεί το μέσο ποσοστό για το σύνολο της χώρας είναι απαραίτητο να σταθμιστούν τα επιμέρους ποσοστά με το σύνολο των νοικοκυριών κάθε περιφέρειας. Από την διαδικασία αυτή προκύπτει το μέσο ποσοστό πρόσβασης στο διαδίκτυο για το σύνολο της χώρας 4,88%. Είναι συχνό λάθος να υπολογίζεται ο αριθμητικός μέσος των ποσοστών χωρίς στάθμιση, οπότε το αποτέλεσμα είναι λανθασμένο. Το ίδιο ισχύει και για δείκτες π.χ. ιατροί ανά χίλιους κατοίκους, ατυχήματα ανά χίλιους κατοίκους, 79

άτομα ανά δωμάτιο κλπ. Η παρατήρηση αυτή είναι πολύ σημαντική στην ανάλυση δεδομένων με πολυμεταβλητές μεθόδους (Κεφάλαιο 6), όπου συχνά χρησιμοποιούνται δείκτες και ποσοστά για την ταξινόμηση και τη μελέτη γεωγραφικών ενοτήτων. Πίνακας 3.11 Υπολογισμός σταθμισμένου αριθμητικού μέσου από ποσοστά (Επεξεργασία από ΕΛΣΤΑΤ Απογραφή Πληθυσμού-Κατοικιών 011, www.statstcs.gr) 3.5. Διάμεσος Η διάμεσος (meda) μιας κατανομής είναι η τιμή που χωρίζει τα δεδομένα σε δύο ίσα μέρη, δηλαδή τα μισά δεδομένα έχουν τιμές υψηλότερες και τα μισά χαμηλότερες από τη διάμεσο, ενώ η διάμεσος κατέχει την κεντρική θέση. Η διάμεσος δεν μπορεί να χρησιμοποιηθεί για κατηγορικές μεταβλητές αλλά χρησιμοποιείται για ποσοτικές και για ιεραρχικές μεταβλητές. Η διάμεσος έχει μεγάλη χρησιμότητα όταν επιδιώκεται η περιγραφή της κατανομής με μία μέση τιμή η οποία θα αντιπροσωπεύει τις περισσότερες παρατηρήσεις. Όπως αναφέρθηκε στην προηγούμενη ενότητα, ο αριθμητικός μέσος είναι ευαίσθητος στις ακραίες τιμές, οπότε για κατανομές με ακραίες τιμές είναι προτιμότερη η διάμεσος, ως ένα μέτρο το οποίο αντιπροσωπεύει την κεντρική τάση ή τη μέση παρατήρηση. Σε διεθνείς οργανισμούς συχνά χρησιμοποιείται η διάμεσος για να απεικονιστεί το μέσο εισόδημα των χωρών, επειδή τα πολύ υψηλά εισοδήματα μιας μικρής μειοψηφίας πολιτών ανεβάζουν κατά πολύ τον αριθμητικό μέσο. Επίσης συχνή είναι η χρήση της διαμέσου στην περιγραφή των μετεωρολογικών φαινομένων για σειρά ετών (χρονοσειρές), όπως βροχόπτωση, θερμοκρασία κλπ., ώστε να αποδίδεται μία μέση τιμή η οποία δεν επηρεάζεται από περιόδους με ακραία, μη συνήθη, καιρικά φαινόμενα. Για παράδειγμα αν θέλουμε να περιγράψουμε τη μέση βροχόπτωση σε μία χώρα με ένα μέτρο κεντρικής τάσης, βασιζόμενοι σε μια χρονοσειρά 100 ετών, είναι προτιμότερο προκειμένου να αποδοθεί ένα μέγεθος στη μέση βροχόπτωση να χρησιμοποιηθεί η διάμεσος αντί του αριθμητικού μέσου. Για τον υπολογισμό της διάμεσου ακολουθούνται τα εξής βήματα: 1. Οι τιμές της μεταβλητής ταξινομούνται κατά αύξουσα ή φθίνουσα τάξη. 80

υπολογισμός. Προσδιορίζεται η μεσαία θέση της κατανομής παίρνοντας το μέγεθος του δείγματος προσθέτοντας μία μονάδα και διαιρώντας δια δύο, δηλαδή: Θέση της διαμέσου = 1 3. Η τιμή της παρατήρησης η οποία κατέχει την παραπάνω θέση είναι η διάμεσος των δεδομένων. Αν το είναι περιττός αριθμός, η τιμή αυτή βρίσκεται στα δεδομένα. Αν το είναι άρτιος αριθμός, ο 1 δεν καταλήγει σε ακέραιο αριθμό και δεν υπάρχει μία μεσαία παρατήρηση, οπότε υπολογίζεται το ημιάθροισμα των δύο μεσαίων παρατηρήσεων. Ορισμένες σημαντικές ιδιότητες της διαμέσου είναι ότι: 1. Δεν επηρεάζεται από ακραίες τιμές π.χ. η διάμεσος των αριθμών 5, 7, 8, 15, 35 είναι 8 και η διάμεσος των αριθμών 5, 7, 8, 15, 3500 είναι πάλι 8.. Το άθροισμα των απόλυτων τιμών των αποκλίσεων από τη διάμεσο είναι μικρότερο παρά για οποιαδήποτε άλλη τιμή δηλ. Σ x -διάμεσος = m. ΠΑΡΑΔΕΙΓΜΑ 3.17:Υπολογισμός διαμέσου Στην πρώτη στήλη του Πίνακα 3.4, έχουν ταξινομηθεί τα δεδομένα για τη μεταβλητή ΠΛΗΘΥΣΜΟΣ 011 κατά αύξουσα τάξη. Το πλήθος των νομών είναι =51, οπότε η θέση της διαμέσου είναι 51 1 6 δηλαδή πρόκειται για τον Ν. Καρδίτσας και η τιμή της διαμέσου είναι 133.544. Η τιμή αυτή συγκρινόμενη με τον αριθμητικό μέσο που είναι 1.049 κάτοικοι, έχει μεγάλη διαφορά και αυτό οφείλεται στο γεγονός ότι ο αριθμητικός μέσος επηρεάζεται από τους δύο νομούς, Αττικής και Θεσσαλονίκης, των οποίων ο πληθυσμός είναι κατά πολύ μεγαλύτερος σε σχέση με τον πληθυσμό των υπόλοιπων νομών. Επομένως η διάμεσος μπορεί να θεωρηθεί ως πιο αντιπροσωπευτικό μέτρο κεντρικής τάσης για να εκφράσει το μέσο πληθυσμιακό μέγεθος των νομών της Ελλάδας. Η διάμεσος μπορεί να υπολογιστεί και για ομαδοποιημένα δεδομένα (ιεραρχική κλίμακα). ΠΑΡΑΔΕΙΓΜΑ 3.18:Υπολογισμος διαμέσου από ομαδοποιημένα δεδομένα Στον Πίνακα 3.6 παρουσιάζονται ομαδοποιημένα δεδομένα για την αξία των κατοικιών. Η διάμεσος μπορεί να εντοπιστεί σε μία από τις τάξεις της αξίας. Από την παρατήρηση των αθροιστικών σχετικών συχνοτήτων προκύπτει ότι το 35,5% των κατοικιών έχει αξία έως 130.000 ευρώ, ενώ το 64,6% έχει αξία έως 30.000 ευρώ. Επομένως προκύπτει ότι η διάμεσος η οποία έχει το 50% των παρατηρήσεων με τιμές χαμηλότερες και το υπόλοιπο 50% με τιμές υψηλότερες θα βρίσκεται στην ομάδα 130001-30000 ευρώ και αυτή είναι η τιμή της διαμέσου για τα ιεραρχικά δεδομένα. Υπάρχει και δυνατότητα παρεμβολής μέσα στα όρια της τάξης όπου ανήκει η διάμεσος, αν θέλουμε να προσεγγίσουμε τα ποσοτικά δεδομένα (Τσίμπος & Γεωργιακώδης, 010). ΠΑΡΑΔΕΙΓΜΑ 3.19:Υπολογισμος αριθμητικού μέσου και διαμέσου (800 κατοικίες) Στο Vdeo 3.4 υπολογίζονται τα μέτρα κεντρικής τάσης για τις 800 κατοικίες του Πίνακα 3.6. Ο αριθμητικός μέσος προκύπτει στο SPSS ως mea=75.09 ευρώ και η διάμεσος ως meda=170.000 ευρώ. Και στην περίπτωση αυτή η διάμεσος είναι σημαντικά μικρότερη του αριθμητικού μέσου, επειδή ο αριθμητικός μέσος επηρεάζεται από ορισμένες πολύ ακριβές κατοικίες. Vdeo 3.4 Περιγραφικά στατιστικά Βίντεο Μία επέκταση της διαμέσου είναι τα τεταρτημόρια (quartles), τα οποία μαζί με τη διάμεσο υποδιαιρούν τις παρατηρήσεις σε τέσσερεις ισοπληθείς ομάδες κάθε μία από τις οποίες περιλαμβάνει το 5% των ταξινομημένων παρατηρήσεων: Το πρώτο τεταρτημόριο συμβολίζεται με Q 1 και είναι η τιμή της μεταβλητής μέχρι την οποία περιλαμβάνεται το 5% των ταξινομημένων παρατηρήσεων. Το τρίτο τεταρτημόριο συμβολίζεται με Q 3 και είναι η τιμή της μεταβλητής μέχρι την οποία περιλαμβάνεται το 75% των ταξινομημένων παρατηρήσεων. Το δεύτερο τεταρτημόριο Q συμπίπτει με τη διάμεσο της κατανομής. 81

Η διαφορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου ονομάζεται ενδοτεταρτημοριακό εύρος (terquartle rage) και συμβολίζεται με IQR ενώ IQR= Q 3 - Q 1. Το διάγραμμα Box ή θηκόγραμμα (Box Plot) είναι ένα διάγραμμα το οποίο βασίζεται στα τεταρτημόρια και είναι χρήσιμο για τη διερεύνηση των δεδομένων και ιδιαίτερα για τον εντοπισμό ακραίων (ή απομακρυσμένων) παρατηρήσεων (outlers). Το διάγραμμα Box απεικονίζει τις τιμές των δύο τεταρτημορίων και της διαμέσου καθώς και την ελάχιστη και τη μέγιστη τιμή των δεδομένων. ΠΑΡΑΔΕΙΓΜΑ 3.0: Διάγραμμα Box Στο Διάγραμμα 3.10 παρουσιάζεται το διάγραμμα Box για τη μεταβλητή ΑΠΑΣΧΟΛΗΣΗ ΣΤΗ ΓΕΩΡΓΙΑ 011 (δεδομένα Πίνακα 1.1). Η μεταβλητή αυτή έχει ομαλή κατανομή των τιμών, χωρίς ακραίες τιμές, και το διάγραμμα Box εμφανίζει από κάτω προς τα πάνω την ελάχιστη τιμή, το πρώτο τεταρτημόριο, τη διάμεσο, το τρίτο τεταρτημόριο και τη μέγιστη τιμή. Το διάγραμμα αποτελείται από ένα ορθογώνιο παραλληλόγραμμο (box) του οποίου η βάση είναι το πρώτο τεταρτημόριο Q 1 και η πάνω πλευρά το τρίτο τεταρτημόριο Q 3 της μεταβλητής. Το ύψος του παραλληλογράμμου αντιστοιχεί στο ενδοτεταρτημοριακό εύρος (IQR). Από τις δύο πλευρές του ορθογωνίου ξεκινούν δύο τμήματα σαν ακροδέκτες ή κεραίες (whskers) που έχουν τη μορφή γράμματος Τ ή ανεστραμμένου Τ. Τα τμήματα αυτά ενώνουν την ελάχιστη και τη μέγιστη τιμή της μεταβλητής με την κάτω και την άνω πλευρά του ορθογωνίου αντίστοιχα (Τσίμπος & Γεωργιακώδης, 010). Η θέση της διαμέσου στο μέσο του παραλληλογράμμου δηλώνει συμμετρία, διαφορετικά υπάρχει ασυμμετρία. Διάγραμμα 3.10 Διάγραμμα Box (SPSS) Στην περίπτωση που τα δεδομένα παρουσιάζουν ακραίες τιμές το διάγραμμα Box είναι πιο σύνθετο. Οι κεραίες που ξεκινούν από την κάτω και άνω πλευρά του ορθογωνίου δεν καταλήγουν στην ελάχιστη και τη μέγιστη τιμή των δεδομένων, αλλά στο λεγόμενο κατώτερο εσωτερικό φράγμα (lower er fece) και στο ανώτερο εσωτερικό φράγμα (upper er fece), όπου: κατώτερο εσωτερικό φράγμα = Q 1 1,5 IQR, ανώτερο εσωτερικό φράγμα = Q 3 + 1,5 IQR. Όλες οι παρατηρήσεις που έχουν τιμές χαμηλότερες από το κατώτερο και υψηλότερες από το ανώτερο εσωτερικό φράγμα θεωρούνται ακραίες τιμές (outlers). ΠΑΡΑΔΕΙΓΜΑ 3.1: Διάγραμμα Box μεταβλητής με ακραίες τιμές Στο Διάγραμμα 3.11 φαίνεται το διάγραμμα Box για τη μεταβλητή ΠΛΗΘΥΣΜΟΣ 011 (δεδομένα Πίνακα 1.1). Το διάγραμμα αυτό είναι πολύ διαφορετικό από το Διάγραμμα 3.10 επειδή η κατανομή της μεταβλητής ΠΛΗΘΥΣΜΟΣ 011 περιλαμβάνει δύο παρατηρήσεις με ακραίες τιμές τους νομούς Αττικής και 8

Θεσσαλονίκης. Επίσης στο διάγραμμα εμφανίζονται ως ακραίες τιμές και οι νομοί Αχαΐας και Ηρακλείου, των οποίων οι τιμές υπερβαίνουν το ανώτερο εσωτερικό φράγμα 3. Πράγματι από την παρατήρηση του Πίνακα 3.4 προκύπτει ότι ο νομός Άρτας με πληθυσμό 67.877 κατοίκους είναι το πρώτο τεταρτημόριο Q 1 και ο νομός Ηλείας με πληθυσμό 159.300 κατοίκους είναι το τρίτο τεταρτημόριο Q 3, οπότε: Το ενδοτεταρτημοριακό εύρος είναι IQR= Q 3 - Q 1 = 159300-67877 = 9143. Το ανώτερο εσωτερικό φράγμα ισούται με Q 3 + 1,5 IQR = 159300 + 1,5 9143 = 96435 Κατά συνέπεια όπως φαίνεται από τα ταξινομημένα δεδομένα του Πίνακα 3.4 για τη μεταβλητή ΠΛΗΘΥΣΜΟΣ 011, οι τέσσερεις νομοί με πληθυσμό πάνω από το ανώτερο εσωτερικό φράγμα εμφανίζονται στο διάγραμμα Box. Διάγραμμα 3.11. Διάγραμμα Box (SPSS) μεταβλητής με ακραίες τιμές Από τα παραπάνω προκύπτει ότι το διάγραμμα Box είναι πολύ χρήσιμο για τη μελέτη των τιμών μιας μεταβλητής και για να διαπιστωθεί η ύπαρξη ακραίων τιμών, ιδιαίτερα όταν τα δεδομένα περιλαμβάνουν μεγάλο αριθμό παρατηρήσεων. Επίσης είναι δυνατό να σχεδιαστεί το διάγραμμα Box και για υποομάδες του πληθυσμού και να γίνουν συγκρίσεις για την κατανομή των τιμών της μεταβλητής σε αυτές. 3.5.3 Επικρατούσα τιμή Η επικρατούσα τιμή (mode) είναι η τιμή στην οποία αντιστοιχεί η μεγαλύτερη συχνότητα δηλαδή η τιμή που συναντάται πιο πολλές φορές στα δεδομένα. Είναι το μόνο μέτρο κεντρικής τάσης το οποίο μπορεί να εφαρμοστεί στην ονομαστική κλίμακα μέτρησης. Αν τα δεδομένα είναι σε κατανομές συχνοτήτων, τότε η επικρατούσα τιμή είναι η τιμή με τη μεγαλύτερη συχνότητα. Στον Πίνακα 3. (κατανομή συχνοτήτων χρήσεων γης) η επικρατούσα τιμή είναι τα εμπορικά καταστήματα. Αυτό σημαίνει ότι αν θέλουμε να χαρακτηρίσουμε την περιοχή μελέτης με μία χρήση γης, τότε το συμπέρασμα θα ήταν ότι πρόκειται για μια εμπορική περιοχή. Σε μια κατανομή συχνοτήτων μπορεί να υπάρχουν περισσότερες από μία επικρατούσες τιμές, όταν δύο ή περισσότερες τιμές έχουν την ίδια συχνότητα. Αυτή είναι η περίπτωση των δικόρυφων ή πολυκόρυφων κατανομών. 3 Λόγω της κλίμακας του διαγράμματος οι νομοί Αχαΐας και Ηρακλείου παριστάνονται με το ίδιο σημείο επειδή ο πληθυσμός τους έχει πολύ μικρή διαφορά. 83

Η επικρατούσα τιμή μπορεί να χρησιμοποιηθεί με όλες τις κλίμακες μέτρησης (και για ποσοτικά δεδομένα) αλλά οι εφαρμογές της είναι περιορισμένες επειδή δεν είναι εύκολος ο χειρισμός της αλγεβρικά. 3.6 Δείκτες χωρικής κεντρικότητας Τα μέτρα κεντρικής τάσης τα οποία παρουσιάστηκαν στην προηγούμενη ενότητα, προέρχονται από την Περιγραφική Στατιστική και χρησιμοποιούνται πολύ συχνά στην ανάλυση γεωγραφικών φαινομένων. Για την ανάλυση όμως των δεδομένων τα οποία έχουν γεωγραφική αναφορά, έχουν αναπτυχθεί επεκτάσεις των μέτρων κεντρικής τάσης ώστε να εφαρμόζονται σε χάρτη. Στις επόμενες ενότητες θα παρουσιαστούν δύο δείκτες χωρικής κεντρικότητας οι οποίοι αφορούν κατανομές σημείων στον γεωγραφικό χώρο οι οποίοι εντάσσονται στην κατηγορία των γεωστατιστικών δεικτών: ο χωρικός μέσος και ο χωρικός διάμεσος. 3.6.1 Χωρικός μέσος Ο χωρικός μέσος (mea ceter) είναι αντίστοιχος του αριθμητικού μέσου. Αναφέρεται σε γεωγραφικά δεδομένα τα οποία μπορούν να αποτελέσουν σημεία σε έναν χάρτη (π.χ. καταστήματα, σχολεία, κατοικίες, εργοστάσια, πόλεις, διοικητικά κτίρια). Στον δισδιάστατο χώρο κάθε σημείο περιγράφεται με τις συντεταγμένες του (X,Y ) και οι συντεταγμένες του χωρικού μέσου είναι: X X 1 και Y Y 1 όπου είναι ο αριθμός των σημείων στο χώρο. Αυτός ο χωρικός μέσος εξαρτάται μόνο από τη γεωμετρία του χώρου, δηλαδή τις συντεταγμένες των σημείων, και δεν προϋποθέτει ότι τα σημεία έχουν κάποιο βάρος (π.χ. μέγεθος, πληθυσμό κλπ.). Στην περίπτωση αυτή ο χωρικός μέσος αποκαλείται κεντροειδές (cetrod). Συχνά όμως τα σημεία έχουν κάποιο βάρος, π.χ. παριστάνουν οικισμούς σε έναν χάρτη με τον πληθυσμό τους, οπότε οι συντεταγμένες του χωρικού μέσου υπολογίζονται με ανάλογο τρόπο όπως για τον σταθμισμένο αριθμητικό μέσο: X w 1 1 X w w και Y w 1 1 Y w w, όπου X w και Y w είναι οι συντεταγμένες του σταθμισμένου χωρικού μέσου, X και Y οι συντεταγμένες των σημείων και w το βάρος του σημείου (π.χ. ο πληθυσμός του οικισμού). ΠΑΡΑΔΕΙΓΜΑ 3.: Υπολογισμός χωρικού μέσου Στο Διάγραμμα 3.10 παρουσιάζεται ο υπολογισμός του χωρικού μέσου (κεντροειδές) από πέντε σημεία για τα οποία δίνονται οι συντεταγμένες. Ο χωρικός μέσος ως επέκταση του αριθμητικού μέσου παρουσιάζει ανάλογες στατιστικές ιδιότητες. Το άθροισμα των αποκλίσεων από τις συντεταγμένες του αριθμητικού μέσου είναι μηδέν: 1 ( X X ) 1 ( Y Y) 0 Επίσης το άθροισμα των τετραγώνων των αποστάσεων όλων των σημείων από τον χωρικό μέσο είναι ελάχιστο, όταν ο χωρικός μέσος συγκρίνεται με οποιοδήποτε άλλο σημείο της χωρικής κατανομής (Κουτσόπουλος, 009): 1 [( X X ) ( Y Y) ] m Τέλος, η θέση του χωρικού μέσου δεν μεταβάλλεται σε περίπτωση περιστροφής ή μετάθεσης των αξόνων, παρόλο που οι αριθμητικές τιμές των συντεταγμένων μεταβάλλονται. 84

Διάγραμμα 3.1 Χωρικός μέσος Η δεύτερη ιδιότητα του χωρικού μέσου συντελεί ώστε να επηρεάζεται ιδιαίτερα από τις απομακρυσμένες θέσεις με τον ίδιο τρόπο που ο αριθμητικός μέσος επηρεάζεται από τις ακραίες τιμές. Για τον λόγο αυτό μπορεί να χρησιμοποιηθεί εναλλακτικά ως μέτρο χωρικής κεντρικότητας ο χωρικός διάμεσος που θα παρουσιαστεί στην επόμενη ενότητα. Ο χωρικός μέσος είναι η θέση πάνω σε έναν χάρτη η οποία αποτελεί την μέση θέση που αντιπροσωπεύει ένα σύνολο σημείων μιας γεωγραφικής κατανομής. Για τον λόγο αυτό μπορεί να χρησιμοποιηθεί για να παρατηρηθεί η διαχρονική εξέλιξη της γεωγραφικής κατανομής ενός φαινομένου. Κλασική εφαρμογή του χωρικού μέσου είναι η διαχρονική παρακολούθηση του πληθυσμού μιας περιφέρειας, ανάλογα με το που τείνει το κέντρο βάρος του πληθυσμού της. Οι παρατηρούμενες μεταβολές του πληθυσμιακού κέντρου μπορεί να συνδυαστούν και να ερμηνευτούν με τις κοινωνικές και οικονομικές εξελίξεις στην περιοχή μελέτης. ΠΑΡΑΔΕΙΓΜΑ 3.3: Υπολογισμός χωρικού μέσου (πληθυσμιακό κέντρο ΗΠΑ) Στον Χάρτη 3.3 φαίνεται η διαχρονική μετακίνηση του χωρικού μέσου του πληθυσμού των ΗΠΑ για την περίοδο 1790-010, όπως καταγράφεται από τη Στατιστική Υπηρεσία της χώρας, η οποία κάθε δέκα χρόνια καταγράφει το πληθυσμιακό κέντρο της χώρας. Είναι πολύ σαφής η διαρκής μετακίνηση του πληθυσμιακού κέντρου προς δυσμάς από τις πρώτες δεκαετίες, η οποία αντανακλά τη μετακίνηση του πληθυσμού για εγκατάσταση στη δυτική ακτή των ΗΠΑ, ενώ αργότερα η μετακίνηση του πληθυσμού είναι δυτικά αλλά και νότια. Στην περίοδο 1790-010 το πληθυσμιακό κέντρο των ΗΠΑ έχει μετακινηθεί 873 μίλια (Uted State Cesus, 010). Η εύρεση του χωρικού μέσου του πληθυσμού γίνεται με την παραδοχή ενός ιδεατού, επίπεδου χάρτη των ΗΠΑ και τα σημεία από τα οποία προκύπτει είναι τα κέντρα πολύ μικρών γεωγραφικών περιοχών οι οποίες αριθμούσαν τα 11.000.000 το 010. Οι συντεταγμένες δίνονται σε φ και λ, υποθέτοντας σφαιρικό σχήμα της γης, ενώ γίνονται διορθώσεις για τη μέτρηση του γεωγραφικού μήκους, λόγω της μεγάλης έκτασης των ΗΠΑ. Τα δεδομένα για τις τρεις τελευταίες απογραφές καταγράφονται σε βάσεις χωρικών δεδομένων (U.S. Cesus Bureau, 011). Η εύρεση του χωρικού μέσου, όπως φαίνεται και από τα παραπάνω, είναι μια πολύπλοκη διαδικασία και στη σύγχρονη εποχή είναι απαραίτητη η χρήση των GIS. Μια παρατήρηση είναι ότι ο υπολογισμός του χωρικού μέσου του πληθυσμού των ΗΠΑ δεν βασίζεται στους οικισμούς, οι οποίοι θα μπορούσαν να αποτελέσουν σημεία στον χάρτη, αλλά σε μικρές γεωγραφικές περιοχές, οι οποίες αποτελούν πολύγωνα και για τις οποίες με κάποια κριτήρια πρέπει να οριστεί ένα κέντρο. Σε περιπτώσεις εκτεταμένων γεωγραφικά περιοχών τίθενται θέματα συστήματος συντεταγμένων και χαρτογραφικών προβολών (Aboufadel & Aust, 006). Επίσης απαιτείται μεγάλος όγκος δεδομένων χαρτογραφικών και περιγραφικών, ενώ η εύρεση των κέντρων σε κάθε πολύγωνο απαιτεί και κάποιες παραδοχές (Παππάς, 000). 85

Χάρτης 3.3 Χωρικός μέσος πληθυσμού ΗΠΑ 1790-010 (U.S. Departmet of Commerce, Uted States Cesus Bureau (http://www.cesus.gov/geo/referece/cetersofpop.html) Τα δεδομένα για τον υπολογισμό του χωρικού μέσου είναι ένα σύνολο σημείων και το αποτέλεσμα είναι ένα σημείο, το κέντρο τους. Στην περίπτωση που ο χωρικός μέσος υπολογίζεται από πολύγωνα ή γραμμές, και όχι από σημεία, χρησιμοποιούνται τα κεντροειδή των γεωγραφικών οντοτήτων. Στο Vdeo 3.5 παρουσιάζεται ο υπολογισμός του χωρικού μέσου του πληθυσμού για τους Δήμους του Ν. Αττικής με τη χρήση της εργαλειοθήκης Spatal Statstcs του ArcGIS. Vdeo 3.5 Χωρικός μέσος Βίντεο ΠΑΡΑΔΕΙΓΜΑ 3.4: Υπολογισμός χωρικού μέσου (πληθυσμιακό κέντρο Ελλάδας) Στον Χάρτη 3.4, παρουσιάζεται ο υπολογισμός του πληθυσμιακού κέντρου της Ελλάδας για τα έτη 1981 και 1991. Ο υπολογισμός έχει γίνει με βάση τους ΟΤΑ (προ του Σχεδίου Καποδίστρια Ν. 539/97) σε κάθε έναν από τους οποίους ο πληθυσμός έχει αντιστοιχιστεί σε ένα κεντρικό σημείο σύμφωνα με κάποια κριτήρια (Παππάς 000). Καταρχήν παρουσιάζεται στον χάρτη το κεντροειδές της Ελλάδας, το οποίο υπολογίστηκε λαμβάνοντας υπόψη μόνο τα γεωμετρικά κέντρα των ΟΤΑ (χωρίς να λαμβάνεται υπόψη ο πληθυσμός τους). Το κεντροειδές, εφόσον δεν μεταβάλλονται οι γεωγραφικές ενότητες για τις οποίες υπολογίζεται, δεν έχει διαχρονική μεταβολή. Στη συνέχεια, υπολογίστηκαν τα πληθυσμιακά κέντρα για το 1981 και το 1991, έχοντας σταθμίσει τα κέντρα των ΟΤΑ με τον πληθυσμό τους. Από τον χάρτη φαίνεται ότι το κεντροειδές βρίσκεται στο Ν. Φθιώτιδας, στην πρώην Κοινότητα Αμφίκλειας, ενώ τα πληθυσμιακά κέντρα βρίσκονται στον Ευβοϊκό Κόλπο. Πράγματι επειδή ο υπολογισμός του χωρικού μέσου εξαρτάται από τη γεωμετρία του χώρου, στην περίπτωση της Ελλάδας, όπου ο νησιωτικός χώρος καταλαμβάνει μεγάλη έκταση, μπορεί να προκύψει ο χωρικός μέσος σε θαλάσσια περιοχή, όπου βέβαια δεν υπάρχουν κάτοικοι. Η μετακίνηση του πληθυσμιακού κέντρου μεταξύ 1981 και 1991 δεν είναι μεγάλη, αλλά το κέντρο έλκεται από την Αθήνα που έχει τον μεγαλύτερο πληθυσμό στη χώρα. Ο χωρικός μέσος έχει και άλλες εφαρμογές εκτός της εύρεσης του πληθυσμιακού κέντρου. Χρησιμοποιείται γενικά για την κατανόηση της εξέλιξης χωρικών μεταβλητών αλλά και για τη χωροθέτηση 86