Μάθημα Αστικής Γεωγραφίας Διδακτικό Έτος 2015-2016 Παραδόσεις Διδακτικής Ενότητας: Πληθυσμιακή πρόβλεψη Δούκισσας Λεωνίδας, Στατιστικός, Υποψ. Διδάκτορας, Τμήμα Γεωγραφίας, Χαροκόπειο Πανεπιστήμιο Σελίδα 1
Ένα μεγάλο μέρος των σημειώσεων αποτελεί κομμάτι του βιβλίου Forecasting Techniques for Urban and Regional Planning, Brian Field and Bryan MacGregor, UCL press Το προβλεπόμενο επίπεδο πληθυσμού αποτελεί μία σημαντική (εισαγωγή) στις προβλέψεις για τις απαιτήσεις σπιτιών και συνεπώς για τις απαιτήσεις γης. Επιπλέον, η ανωτέρω ακριβής εκτίμηση έχει άμεση συνάφεια με τις απαιτήσεις της τοπικής οικονομίας για υπηρεσίες και αγαθά (επενδύσεις σε σχολεία, νοσοκομεία, δρόμους, προμήθειες ενέργειας, νερού, κτλ). Είναι αρκετά σημαντικό για τους επιστήμονες που ασχολούνται με τον σχεδιασμό (planning) να κατανοήσουν την αξία, τους περιορισμούς και την ακρίβεια των ποικίλων τεχνικών που χρησιμοποιούνται για την πληθυσμιακή πρόβλεψη. Στις περισσότερες περιπτώσεις το ενδιαφέρον εστιάζεται στον μόνιμο πληθυσμό (εξαιρουμένων των τουριστών και των στρατιωτών). Στόχος της πρόβλεψης είναι η εξέταση των ιστορικών δεδομένων (συνήθως απογραφών δεκαετιών) και ο καθορισμός της σχέσης μεταξύ μίας κατάλληλης ανεξάρτητης μεταβλητής (στην περίπτωση μας είναι ο πληθυσμός). Οι προβλέψεις γίνονται για διαφορετικά μεγέθη και τύπους δεδομένων (είτε ολόκληρου του πληθυσμού είτε επιλεγμένων στοιχείων) Στόχος μας είναι να εντοπίσουμε τη σχέση μεταξύ της ανεξάρτητης και εξαρτημένης μεταβλητής αλλά και να παράγουμε την πληθυσμιακή πρόβλεψη. Είναι λοιπόν διττός ο στόχος Κατασκευή ενός μοντέλου Διττός στόχος Να παράγουμε πρόβλεψη Για να κατασκευάσουμε το εκάστοτε μοντέλο πρέπει πρώτα να έχουμε μία συνάρτηση! Τι είναι η συνάρτηση? Ανεξάρτητη Μεταβλητή (Χ) Υ (Εξαρτημένη) Σελίδα 2
Σημειώσεις Αστική Γεωγραφία: Πληθυσμιακή Πρόβλεψη Η βασική σχέση είναι 1. Συνολικές Προσεγγίσεις (Aggregate Approach) Χρησιμοποιούνται για να προβλέψουν τον συνολικό πληθυσμό. (συνήθως για μεγάλες περιοχές). Θα δούμε τα εξής είδη. 1) Μέθοδο Τάσεων 2) Συγκριτική μέθοδο 3) Αναλογική μέθοδο 4) Πολλαπλής Παλινδρόμησης 1. Μέθοδος Τάσεων Ορίζεται ο χρόνος ως η ανεξάρτητη μεταβλητή (ανάλογα με κάποιο από τα επόμενα υποτιθέμενα πρότυπα) 1. Γραμμική Τάση 2. Γεωμετρική/Εκθετική τάση Αξίζει να σημειωθεί ότι σε κάθε περίπτωση τα δεδομένα του προηγούμενου πληθυσμού αναλύονται για να καθορίσουν την τάση και στη συνέχεια η τάση μας δίνει την πρόβλεψη σε κάποια μελλοντική ημερομηνία. Αναλυτικά λοιπόν παίρνουμε τα εξής: 1. Γραμμική Τάση Αποτελεί την απλούστερη περίπτωση, και ουσιαστικά η αύξηση σε ίσες χρονικές περιόδους παραμένει σταθερή. Έστω ότι έχουμε το επόμενο παράδειγμα Π.χ.1 Έτος 1951 1961 1971 1981 1991 2001 2011 2021 Πληθυσμός 100.000 110.000 120.000 130.000 140.000 150.000 160.000? Τότε για να βρούμε τον πληθυσμό θα χρησιμοποιήσουμε την γραφική μέθοδο Σελίδα 3
Σχήμα 1. Γραμμική Αύξηση Πληθυσμού 180.000 160.000 140.000 120.000 100.000 80.000 60.000 40.000 20.000 0 1930 1950 1970 1990 2010 2030 Ο τύπος που μας δίνει την πληθυσμιακή πρόβλεψη ισούται με : Ας δούμε όμως πως βγαίνει αυτός ο τύπος: Στόχος μας είναι όπως είπαμε προηγουμένως να εκφράσουμε την τάση ως μία μαθηματική συνάρτηση. Συγκεκριμένα ως μία εξίσωση ευθείας γραμμής. Ο βασικός τύπος ευθείας γραμμής ισούται με: Όπου, x: η ανεξάρτητη μεταβλητή y: η εξαρτημένη μεταβλητή β: σταθερά α: η κλίση, η οποία παραμένει σταθερή Στη δική μας περίπτωση η εξίσωση (1) μπορεί να γραφεί ως: (1) Όπου, n: είναι ο αριθμός των ετών μεταξύ του t και του t+n P(t+n): είναι ο πληθυσμός που θα προβλεφθεί την χρονική στιγμή t+n P(t): είναι ο πληθυσμός στο χρόνο t (χρόνος βάσης=1951) Y=1951 β: κλίση Σελίδα 4
όπως είναι γνωστό από το λύκειο όταν έχω δύο σημεία τότε μπορώ να υπολογίσω την κλίση της ευθείας. ( στη συνέχεια γίνεται υπενθύμιση) Έτσι λοιπόν χρησιμοποιώντας δύο τυχαία σημεία από τον πίνακα του παραδείγματος μπορούμε να υπολογίσουμε την κλίση (δηλαδή την εφω) η οποία παραμένει σταθερή. Συνεπώς ο τύπος (2) γίνεται, Μπορούμε πλέον για το έτος 2021 να κάνουμε την πρόβλεψη: n=70 (2021-1951) Στην πραγματικότητα είναι εξαιρετικά απίθανο τα δεδομένα μας να παρουσιάζουν τέλεια γραμμική σχέση. Τρεις είναι οι τρόποι για να υπολογίσουμε την τέλεια βέλτιστη ευθεία. 1. Χρησιμοποιώντας δύο οποιοδήποτε σημεία (για κάθε δύο όμως που θα παίρνω θα έχω και άλλη ευθεία) 2. Να την κατασκευάσω με το μάτι (δεν χρειάζεται να περνά από όλα τα σημεία ακριβώς) Σελίδα 5
3. Να υπολογίσω την ευθεία παλινδρόμησης με την μέθοδο ελαχίστων τετραγώνων. (κλασσική μέθοδος στην στατιστική!) Η μέθοδος αυτή μας εξασφαλίζει ότι όλοι όσοι κάνουν την πρόβλεψη θα παράγουν την ίδια γραμμή τάσης και πρόβλεψη! 2. Γεωμετρική / Εκθετική Κλίση Στην προηγούμενη μέθοδο υποθέσαμε ότι η αύξηση του πληθυσμού σε ίσες χρονικές περιόδους παρέμενε σταθερή ανεξαρτήτως του συνολικού πληθυσμού. Μία πιο ρεαλιστική μέθοδος είναι να θεωρήσουμε ότι το μέγεθος της αύξησης στον πληθυσμό σχετίζεται με το μέγεθος του πληθυσμού. Η μέθοδος αυτή υποθέτει ότι ο λόγος μεταξύ της αύξησης του πληθυσμού και του συνολικού πληθυσμού είναι σταθερός αλλά η αυξάνεται. Πιο απλά, για κάθε δοσμένο χρονικό διάστημα n ο λόγος του μεγέθους του πληθυσμού στο τέλος του διαστήματος προς αυτόν στην αρχή παραμένει σταθερός δηλαδή: Όπου:, για όλα τα n (4) n: είναι ο αριθμός των ετών μεταξύ του t και του t+n P(t+n): είναι ο πληθυσμός που θα προβλεφθεί την χρονική στιγμή t+n P(t): είναι ο πληθυσμός στο χρόνο t Συνέχεια π.χ. Έτος Πληθυσμός Λόγος Λόγος Αύξησης 1951 100.000 1.1 0.1 1961 110.000 1.1 0.1 1971 121.000 1.1 0.1 1981 133.100 1.1 0.1 1991 146.410 1.1 0.1 2001 161.051 1.1 0.1 2011 177.156 1.1 0.1 2021 194.872 1.1 0.1 Ο πληθυσμός παρατηρούμε ότι αυξάνεται κατά το ( δηλαδή 10%) κάθε δέκα χρόνια. Επομένως η πρόβλεψη μας θα ισούται: (5) Σελίδα 6
Σχήμα 2. Εκθετικός Ρυθμός Αύξησης 250.000 Εκθετικός Ρυθμός Αύξησης Πληθυσμού 200.000 150.000 100.000 50.000 0 1940 1960 1980 2000 2020 2040 Πληθυσμός ανά δεκαετία Πιο γενικά, ο τύπος για την γεωμετρική αύξηση μπορεί να γραφεί αντί σε όρους του k σε όρους του r: Όπου: n: είναι ο αριθμός των ετών μεταξύ του t και του t+n P(t+n): είναι ο πληθυσμός που θα προβλεφθεί την χρονική στιγμή t+n P(t): είναι ο πληθυσμός στο χρόνο t Λίγα μαθηματικά.(β Λυκείου, Λογάριθμοι) Υπενθύμιση των ιδιοτήτων λογαρίθμων: (6) Έστω μέλη και έχω:, τότε για να λύσω ως προς r μπορώ να λογαριθμίσω και στα δύο Σελίδα 7
Για ποιο λόγο χρησιμοποιούμε τους λογαρίθμους; Για να μετασχηματίσουμε μη γραμμικές εξισώσεις σε γραμμικές! Π.χ.2 Έστω ότι έχουμε την μη γραμμική εξίσωση: Τότε λογαριθμόντας πλέον και στα δύο μέλη (μη αρνητικές ποσότητες) έχω μία γραμμική εξίσωση. Ο Γενικός τύπος είναι: Γραμμική πλέον εξίσωση Π.χ.3 Γραμμική πλέον εξίσωση μεταξύ του. (Μία καμπύλη παλινδρόμησης μπορεί να προκύψει από τα Ας επιστρέψουμε όμως στο αρχικό μας πρόβλημα εκτίμησης του πληθυσμού.. Η σχέση (6) μπορεί να γίνει: Σελίδα 8
Όπου Β μία σταθερά Αν πάρουμε antilog στην (7) έχουμε: (7) Για μαθηματικούς λόγους το πρότυπο της αύξησης γράφεται ως: Όπου: e = εκθετικός όρος, a = ρυθμός αύξησης 2. Συνθετικές Προσεγγίσεις Οι προσεγγίσεις που αναφέρθηκαν στην προηγούμενη ενότητα χρησιμοποιούνται για να προβλέψουν το συνολικό (aggregate) πληθυσμό. Συχνά, όταν ασχολούμαστε με το σχεδιασμό (planning) συνθετικές πληροφορίες απαιτούνται για τον πληθυσμό. Λεπτομέρειες για το φύλλο, την ηλικία, την επαγγελματική κατηγορία συχνά είναι απαραίτητες στην εκτίμηση της απαίτησης από πολλές υπηρεσίες. 1. Σύνθεση πληθυσμού Σε κάθε περιοχή η μεταβολή του πληθυσμού μπορεί να αντιπροσωπευθεί από τέσσερα συστατικά: α) τις γεννήσεις β) τους θανάτους γ) την μεταναστευτική εισροή δ) την μεταναστευτική εκροή Συνεπώς έχουμε τον ακόλουθο τύπο: (8) Σελίδα 9
Όπου, P(t+n): είναι ο πληθυσμός που θα προβλεφθεί την χρονική στιγμή t+n P(t): είναι ο πληθυσμός στο χρόνο t είναι αντίστοιχα οι γεννήσεις, οι θάνατοι, η μεταναστευτική εισροή και η μεταναστευτική εκροή. Π.χ.4 Έστω ότι ο πληθυσμός το 2011 είναι 100.000, ο δεκαετής ρυθμός ανάπτυξης αναπαραγωγής (γεννήσεων) ισούται με 0.20 και ο δεκαετής ρυθμός θανάτων ισούται με 0.16, τότε ο πληθυσμός του 2021 μπορεί να προβλεφθεί ως εξής: (υποθέτοντας ότι δεν υπάρχει μετανάστευση) Μία παραλλαγή της μεθόδου αυτής μπορεί να χρησιμοποιηθεί για να υπολογίσουμε τον τρέχοντα πληθυσμό εάν υπάρχουν τα διαθέσιμα στοιχεία. Όπου, P(t): είναι ο πληθυσμός στο χρόνο t : ο ρυθμός αναπαραγωγής για n χρόνια ο αριθμός γεννήσεων σε n χρόνια. Αντίστοιχα μπορεί να υπολογιστεί όταν διαθέτουμε και τον ρυθμό θανάτων. Π.χ.5 Έστω,,, Τότε μπορούμε να υπολογίσουμε τα εξής: Και ο εκτιμώμενος πληθυσμός ισούται με ημιάθροισμα των ανωτέρω δύο αριθμών : Σελίδα 10
2. Ανάλυση Κοορτής (Cohort Survival) Η χρήση των ακατέργαστων ρυθμών μπορεί να οδηγήσει σε σημαντικές ανακρίβειες καθώς και οι ρυθμοί αναπαραγωγής και οι ρυθμοί θανάτου εξαρτώνται από την ηλικιακή δομή του πληθυσμού. Η αναπαραγωγική ηλικία είναι αποκλειστικά στις γυναίκες της ηλικιακής ομάδας 15-44, ενώ οι ρυθμοί θανάτου αυξάνουν δραματικά στην ηλικιακή ομάδα 65+. Ένας πληθυσμός με ένα μεγάλο ποσοστό γυναικών σε αναπαραγωγική ηλικία είναι πιθανό να έχει υψηλό ρυθμό αναπαραγωγής, ενώ ένας πληθυσμός με μεγάλο ποσοστό ηλικιωμένων είναι πιθανό να έχει υψηλό ρυθμό θανάτου. Συνεπώς, εάν εφαρμοστούν τα ακατέργαστα ποσοστά σε έναν πληθυσμό με μία διαφορετική ηλικιακή δομή θα προκύψουν αρκετές ανακρίβειες. Με τον όρο κοορτή (cohort) ονομάζουμε μία ηλικιακή ομάδα. Η μέθοδος λοιπόν ανάλυσης κοορτής παράγει πληροφορίες στην μελλοντική ηλικιακή και κατά φύλλο κατανομή του πληθυσμού. Είναι η πιο ευρέως διαδεδομένη τεχνική σε επίπεδο τοπικής αυτοδιοίκησης. Π.χ.6. Η τεχνική της ανάλυσης κοορτής Ανδρες Αριθμός Ρυθμός Επιβίωσης Επιζώντες Υπολογισμοί 0-14 20.000 0.85 15.400 15-29 10.000 0.75 17.000 0.85*20.000=17.000 30-44 12.000 0.65 7.500 0.75*10.000=7.500 45-59 5.000 0.5 7.800 0.65*12.000=7.800 60+ 3.000 0.2 3.100 0.5*5.000+0.2*3.000=3100 Γυναίκες Αριθμός Ρυθμός Επιβίωσης Επιζώντες Ρυθμός Αναπαραγωγής Γεννήσεις 0-14 20.000 0.90 15.400 0 2*10000+0.9*12000= 20000+10800=30800 15-29 10.000 0.80 18.000 2.0 Η νέα κοορτή 0-14 για το 1996 30-44 12.000 0.70 8.000 0.9 45-59 5.000 0.6 8.400 0 60+ 3.000 0.4 4.200 0 1. Αποκτάμε πληροφορίες για την ηλικιακή δομή και για το φύλλο της περιόδου βάσης (εδώ το 1981) 2. Υπολογίζουμε τον ρυθμό αναπαραγωγής και ρυθμό επιβίωσης για κάθε κοορτή 3. Εφαρμόζουμε τον ρυθμό επιβίωσης και αναπαραγωγής στο έτος βάσης της πληθυσμιακής δομής Σελίδα 11
4. Διαιρούμε γεννήσεις σε άνδρες και γυναίκες εφαρμόζοντας τον ρυθμό φύλλου στο σύνολο των γεννήσεων. 3) Παλινδρόμηση (συνοπτικές σημειώσεις) (Πηγή: Παλινδρόμηση, Κούτρας - Ευαγγελάρας, εκδ. Σταμούλη, Στατιστική Κιόχος, εκδ.interbooks, Spss σημειώσεις, Μπούτσικας) Κύριο πρόβλημα σε αυτή την ενότητα αποτελεί η διερεύνηση της σχέσης μεταξύ δύο μεταβλητών X, Y (για παράδειγμα ηλικία (Χ) και πίεση αίματος (Υ)). Το γενικό πρόβλημα μπορεί να περιγραφεί ως εξής: Από έναν (θεωρητικά άπειρο) πληθυσμό λαμβάνουμε ένα δείγμα μεγέθους n και για κάθε άτομο του δείγματος καταγράφουμε τις τιμές δύο μεταβλητών X, Y. Με βάση λοιπόν τα ζεύγη τιμών: (X 1, Y 1 ), (X 2,Y 2 ),.,(X n,y n ) του δείγματος επιθυμούμε να διερευνήσουμε τη σχέση μεταξύ των μεταβλητών X, Y. Χ : ονομάζεται ανεξάρτητη ή ερμηνευτική μεταβλητή και δεν θεωρείται τυχαία μεταβλητή Υ: ονομάζεται εξαρτημένη μεταβλητή, θεωρείται τυχαία μεταβλητή. Π.χ. 7: Μπορούμε να προβλέψουμε την θερμοκρασία ανάλογα με το τιτίβισμα των τριζονιών? Έστω ότι επιθυμούμε να ελέγξουμε εάν υπάρχει κάποια σχέση ανάμεσα στον αριθμό των τιτιβισμάτων των τριζονιών (Χ) και της θερμοκρασίας (Y). (για περισσότερες πληροφορίες ανατρέξτε στο κείμενο: The Song of Insects by Dr.G.W. Pierce, Harvard College Press) Έπειτα από μετρήσεις ενός τυχαίο δείγματος πήραμε τα παρακάτω αποτελέσματα: X (τιτίβισμα/δευτερολεπτο) Y (Θερμοκρασία/Φαρενάιτ) 20,00 88,60 16,00 71,60 19,80 93,30 18,40 84,30 17,10 80,60 15,50 75,20 14,70 69,70 17,10 82,00 15,40 69,40 16,20 83,30 15,00 79,60 17,20 82,60 16,00 80,60 17,00 83,50 14,40 76,30 Σελίδα 12
Απεικονίζοντας σε ένα διάγραμμα διασποράς τα παραπάνω δεδομένα παρατηρούμε ότι ενδεχομένως να υπάρχει σχέση ανάμεσα στο πλήθος των τιτιβισμάτων/ δευτερόλεπτο και στην θερμοκρασία. Σχήμα 3. Διάγραμμα διασποράς. Θερμοκρασία έναντι πλήθος τιτιβισμάτων. 100,00 95,00 90,00 85,00 80,00 75,00 70,00 65,00 60,00 55,00 50,00 11,00 14,00 17,00 20,00 23,00 26,00 29,00 Y (Θερμοκρασία/Φαρενάιτ) Από το ανωτέρω σχήμα παρατηρούμε ότι όσο αυξάνεται ο αριθμός των τιτιβισμάτων (άξονας Χ) τόσο φαίνεται να αυξάνεται και η θερμοκρασία. Επομένως ενδεχομένως να υπάρχει μία γραμμική σχέση ανάμεσα στις δύο μεταβλητές. Φαίνεται ότι τα σημεία βρίσκονται κοντά σε μία ευθεία. Για παράδειγμα την : Δηλαδή, Οι αποκλίσεις, των από την ευθεία φαίνονται τυχαίες. Αν ονομάσουμε τις διαφορές αυτές τότε προκύπτει το απλό γραμμικό μοντέλο. Θεωρούμε λοιπόν, ότι τα X i, Y i συνδέονται με την σχέση:, Όπου b o ισούται με την τεταγμένη, b 1 είναι η κλίση, ε 1,.,ε n ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν την κανονική κατανομή με μέση τιμή μηδέν και σταθερή διακύμανση ίση με σ 2 η οποία όμως είναι άγνωστη. Δηλαδή ισχύει Ν(0,σ 2 ). Αξίζει να σημειωθεί ότι και οι τυχαίες μεταβλητές είναι ανεξάρτητες αφού στηρίζονται στα ανεξάρτητα σφάλματα ε ι. Σελίδα 13
Ο στόχος μας λοιπόν είναι να εκτιμήσουμε τις παραμέτρους b o, b 1 και σ 2 και να διερευνήσουμε πόσο ικανοποιητικά προσαρμόζονται τα δεδομένα μας στο μοντέλο αυτό. Χρησιμοποιώντας την μέθοδο μέγιστης πιθανοφάνειας ( οι τιμές των παραμέτρων που μεγιστοποιούν την συνάρτηση πιθανοφάνειας) θα είναι: Οι εκτιμήτριες μέγιστης πιθανοφάνειας των b o, b 1 προκύπτουν ισοδύναμα από την ελαχιστοποίηση (ως προς b o, b 1 ) του αθροίσματος των τετραγώνων των σφαλμάτων: για αυτό το λόγο και οι εκτιμήτριες των b o, b 1 καλούνται και εκτιμήτριες ελαχίστων τετραγώνων. Επομένως η εκτιμημένη ευθεία γραμμικής παλινδρόμησης θα είναι η : Ο στόχος μας είναι η πρόβλεψη! Μπορεί να επιτευχθεί με δύο τρόπους σημειακά με διάστημα εμπιστοσύνης Σελίδα 14
Οι διαφορές των προσαρμοσμένων από τις παρατηρούμενες καλούνται κατάλοιπα (residuals) ή εκτιμώμενα σφάλματα. Σχήμα Παρατηρούμενες και εκτιμώμενες τιμές στο απλό μοντέλο γραμμικής παλινδρόμησης Ερμηνεύοντας την συνολική μεταβλητότητα του μοντέλου Η δειγματική διασπορά των παρατηρήσεων αποδεικνύεται ότι χωρίζεται σε δύο αθροίσματα: Ισχύει ότι: SST = SSE + SSR SST: Η συνολική παρατηρούμενη μεταβλητότητα των SSR: Η μεταβλητότητα των προσαρμοσμένων τιμών που ερμηνεύεται από το μοντέλο. (Πόσο διαφέρουν οι προσαρμοσμένες τιμές από τον μέσο όρο τους). Σελίδα 15
SSE: Η μεταβλητότητα των σε σχέση με τις αντίστοιχες προσαρμοσμένες τιμές. Οφείλεται στην διασπορά των σφαλμάτων.(περιέχουν όλους τους παράγοντες που επηρεάζουν την τιμή των και δεν υπάρχουν στο μοντέλο). Επομένως, η συνολική παρατηρούμενη μεταβλητότητα των (SST) μπορεί να χωριστεί στα δύο, στην μεταβλητότητα που ερμηνεύεται από το μοντέλο (SSR) και στην μεταβλητότητα που οφείλεται σε παράγοντες που δεν έχουν περιληφθεί στο μοντέλο (SSE). Άρα, το πηλίκο (συντελεστής προσδιορισμού) Μπορεί να θεωρηθεί ότι εκφράζει το ποσοστό της μεταβλητότητας των παρατηρήσεων που ερμηνεύεται από το μοντέλο. (όσο μεγαλύτερο είναι το R 2, δηλαδή πιο κοντά στην μονάδα, τόσο καλύτερο είναι το μοντέλο που έχουμε θεωρήσει διότι ερμηνεύει μεγαλύτερο μέρος της παρατηρούμενης μεταβλητότητας). σχήμα: Έτσι στο παράδειγμα μας η εκτιμώμενη ευθεία παλινδρόμησης δίνεται στο επόμενο Σχήμα 5: Εκτιμώμενη ευθεία παλινδρόμησης. Θερμοκρασία έναντι πλήθος τιτιβισμάτων. 100,00 95,00 90,00 85,00 80,00 75,00 70,00 65,00 Y = 25,23+ 3,29*X R² = 0,69 60,00 10,00 15,00 20,00 25,00 30,00 Y (Θερμοκρασία/Φαρενάιτ) Γραμμική (Y (Θερμοκρασία/Φαρενάιτ)) Η εκτιμώμενη ευθεία παλινδρόμησης δίνεται από τον τύπο: Έτσι λοιπόν εάν θέλουμε να προβλέψουμε την θερμοκρασία που θα έχουμε εάν ακούμε 20 τιτιβίσματα του τριζονιού θα πάρουμε: =91,03 Fahrenheit Σελίδα 16
Σημειώσεις Αστική Γεωγραφία: Πληθυσμιακή Πρόβλεψη Κλείνοντας αξίζει να σημειωθεί ότι αρκετές φορές έχουμε πρόβλημα στο μοντέλο μας όταν τα σφάλματα (εi): 1. δεν ακολουθούν την κανονική κατανομή 2. δεν έχουν σταθερή διακύμανση 3. δεν είναι ανεξάρτητα μεταξύ τους Τότε πρέπει να προχωρήσουμε σε κατάλληλες στατιστικές τεχνικές και ελέγχους για την αξιοπιστία της ανάλυσης μας. (για παράδειγμα μετασχηματισμό των δεδομένων μας). Π.χ.8: Έστω ότι από 5 φοιτητές πήραμε τις βαθμολογίες τους στα μαθηματικά (X) και στην στατιστική (Y). Θέλουμε να ελέγξουμε εάν υπάρχει κάποιου είδους σχέση. Αρχικά κατασκευάζουμε τον επόμενο πίνακα όπου διαδοχικά υπολογίζουμε τις επόμενες στήλες του. 2 3 5 6 8 Σύνολο: 24 1 2 5 6 7 ( - ) -3,2-2,2-0,8 1,8 2,8 21 0 ( ) -2,8-1,8 0,2 1,2 3,2 0 ( )( - ) 8,96 3,96 0,16 2,16 8,96 24,2 7,84 3,24 0,04 1,44 10,24 Σύνολο: 22,8 Σελίδα 17
Άρα η εκτιμώμενη ευθεία παλινδρόμησης ισούται με: 8 7 6 5 4 3 2 1 0 Y= - 0,88+1,06*X R² = 0,9584 0 2 4 6 8 10 Γραμμική () Σελίδα 18
Π.χ. 9: Πληθυσμιακή πρόβλεψη στοιχείων απογραφής Θήρας-Θηρασιάς. Στον επόμενο πίνακα δίνονται τα παρακάτω πληθυσμιακά δεδομένα για το νησί της Σαντορίνης της περιοχής Θήρας Θηρασιάς. Πληθυσμός (Θήρα και Θηρασιά) 10-Έτη από το Έτος 1971 Πληθυσμός 1971 0 6.487 1981 1 7.328 1991 2 9.593 2001 3 13.670 2011 4 17.752 Για ευκολία στην ανάλυση μας, δημιουργούμε την δεύτερη στήλη όπου φτιάχνουμε μία νέα μεταβλητή με αύξοντα αριθμό 0 από το έτος βάσης δηλαδή το 1971. 20.000 18.000 16.000 14.000 12.000 10.000 8.000 6.000 4.000 2.000 0 Υ ^ = 2.887,2x + 5.191,6 R² = 0,9415 0 1 2 3 4 5 Σειρά1 Γραμμική (Σειρά1) Έτσι εάν θέλουμε να υπολογίσουμε την πληθυσμιακή πρόβλεψη για το έτος 2021 θα θέσουμε όπου X=5 στην εκτιμώμενη εξίσωση ευθείας και θα πάρουμε το παρακάτω αποτέλεσμα: ^ 2.887,2 *5 5.191, 19.627,6 2021 Σελίδα 19
****Πως γίνεται στο excel: Βήμα 1 ο : Βήμα 2 ο : Σελίδα 20
Βήμα3 ο : Κάνουμε κλικ στα τελευταία δύο κουτάκια Βήμα 4 ο : Εξίσωση ευθείας παλινδρόμησης Σελίδα 21