ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 7--05 ΜΗ ΓΡΑΜΜΙΚΕΣ ΠΑΛΙΝΔΡΟΜΗΣΕΙΣ Μ-Ν ΝΤΥΚΕΝ
Αναζήτηση της κατάλληλης σχέσης μεταξύ της εξαρτημένης Υ και ανεξάρτητης μεταβλητής Χ Η σχέση μεταξύ της εξαρτημένης μεταβλητής Υ και της ανεξάρτητης μεταβλητής Χ δεν είναι πάντα γραμμική: το νέφος των σημείων (Y, ),, δεν μπορεί πάντα να προσεγγίζεται μέσω της ευθείας παλινδρόμησης: Y, α ο α ε Με την απλή γραφική απεικόνιση του νέφους μπορούμε να καταλάβουμε αν η σχέση είναι ή δεν είναι γραμμική και κατά συνέπεια να επιλέξουμε διαφορετικό τύπο παλινδρόμησης, όπως: (α) Παραβολική παλινδρόμηση (πολυωνωμική παλινδρόμηση): Quadratc (β) Εκθετική παλινδρόμηση: Growth
Αναζήτηση της κατάλληλης σχέσης μεταξύ της εξαρτημένης Υ και ανεξάρτητης μεταβλητής Χ Παράδειγμα : Θέλουμε να εξετάσουμε την διαχρονική εξέλιξη του ΑΕΠ της Ελλάδας κατά την περίοδο 996-04. Το ΑΕΠ εκφράζεται σε δις εκ. σε σταθερές τιμές του προηγούμενου έτους. Πηγή: ΕΛΣΤΑΤ. Η διαχρονική εξέλιξη του ΑΕΠ σημαίνει ότι, εκφράζουμε την μεταβολή του ΑΕΠ με βάση την ανεξάρτητημεταβλητή Tme : Y f(tme) όπου Tme για το 996 (πρώτο έτος) και Tme 9 για το 04 (τελευταίο έτος)
Αναζήτηση της κατάλληλης σχέσης μεταξύ της εξαρτημένης Υ και ανεξάρτητης μεταβλητής Χ Η γραφική αναπαράσταση των δεδομένων αναδεικνύει ότι, η σχέση δεν είναι γραμμική. Για την παραγωγή του διαγράμματος, χρησιμοποιήσαμε την εντολή: Graphs, Chart Bulder, Le Μέχρι το 008, η προσέγγιση της σχέσης μπορεί να θεωρηθεί γραμμική. Όμως για το σύνολο της περιόδου, αυτό δεν ισχύει. Έχουμε μια παραβολική παλινδρόμηση δηλαδή μια πολυωνυμική παλινδρόμηση ης τάξης (Quadratc model).
Πολυωνυμικά μοντέλα p-τάξης Η γενική μορφή του πολυωνυμικού μοντέλου (polyomal model) είναι η ακόλουθη: Y... 0 p p ε Το μοντέλο περιλαμβάνει p ερμηνευτικές μεταβλητές, οι οποίες είναι δυνάμεις μιας μόνο ανεξάρτητης μεταβλητής Χ (μεταβλητή πρόβλεψης predctor varale). Αν p απλή γραμμική παλινδρόμηση Αν p Πολυωνυμικό μοντέλο ης τάξης (Quadratc) Αν p 3 Πολυωνυμικό μοντέλο 3 ης τάξης (Cuc) Τα μοντέλα 4 ης ή ανώτερης τάξης είναι πολύ σπάνια σε αντίθετα με τα μοντέλα ης τάξης και σε μικρότερο βαθμό 3 ης τάξης.
Παραβολική παλινδρόμηση Πολυωνυμική παλινδρόμηση ης τάξης Y ε 0,, [] Αθροίζοντας την [] για όλα τα, έχουμε: Πολλαπλασιάζοντας την [] επί Χ και αθροίζοντας για όλα τα, έχουμε: Τέλος πολλαπλασιάζοντας την [] επί Χ και αθροίζοντας για όλα τα, έχουμε: o Y o Y 3 o Y 4 3 [] [3] [4] Έχουμε γραμμικό σύστημα 3 εξισώσεων [], [3] και [4] με τρεις άγνωστους συντελεστές o, και Υπάρχει μια και μοναδική λύση για τους 3 συντελεστές.
Παραβολική παλινδρόμηση Πολυωνυμική παλινδρόμηση ης τάξης Y 0 ε o Οι συντελεστές και καθορίζουν τη θέση της καμπύλης. < 0 o Το πρόσημο του καθορίζει τη μορφή της καμπύλης. > 0
Αναζήτηση της κατάλληλης σχέσης μεταξύ της εξαρτημένης Υ και ανεξάρτητης μεταβλητής Χ Παράδειγμα : Η σχέση μεταξύ του συντελεστή δόμησης (Idex) και της απόστασης μίας κατοικίας από το κέντρο της πόλης του Readg στην Αγγλία (Dstace) δίνεται στον ακόλουθο πίνακα. Πηγή: Baxter R., «Computer ad Statstcal Techques for Plaers», Metue & Co Ltd, Lodo 976 Η εξαρτημένη μεταβλητή Υ Idex (Συντελεστή δόμησης) Η ανεξάρτητη μεταβλητή Χ Dstace (Απόσταση από το κέντρο της πόλης) Idex f(dstace)
Αναζήτηση της κατάλληλης σχέσης μεταξύ της εξαρτημένης Υ και ανεξάρτητης μεταβλητής Χ Η γραφική αναπαράσταση των δεδομένων αναδεικνύει ότι, η σχέση δεν είναι γραμμική. Για την παραγωγή του διαγράμματος, χρησιμοποιήσαμε την εντολή: Graphs, Chart Bulder, Le Και σε αυτό το παράδειγμα, η προσέγγιση της σχέσης δεν είναι γραμμική. Έχουμε μια εκθετική παλινδρόμηση (Growth model).
Εκθετική Παλινδρόμηση Η γενική μορφή της εκθετικής παλινδρόμησης είναι η ακόλουθη: λe Y a ε όπου e a o λ Y ao a ε ao a ε Y e e e Το μοντέλο μπορεί να μετατραπεί σε γραμμικό τύπο με τον εξής τρόπο: ly ao a ε Θα πρέπει απλώς να υπολογίσουμε την νέα μεταβλητή ly η οποία αποτελεί την εξαρτημένη μεταβλητή της γραμμικής παλινδρόμησης και με αυτή την μετατροπή, γίνεται εκτίμηση των συντελεστών a ο και a.
Άλλες Μη Γραμμικές Παλινδρομήσεις Με το SPSS, μπορούμε να εκτιμήσουμε διάφορες μορφές μη γραμμικής παλινδρόμησης. SPSS: Υποδείγματα για την εκτίμηση της καμπύλης παλινδρόμησης Η εντολή : Aalyze, Regresso, Curve estmato Μορφές καμπύλης Εξισώσεις Χρονική τάση Lear Y t 0.t Y 0. Εξισώσεις με μια ανεξάρτητη μεταβλητή Logarthmc Y t 0.L(t) Y 0.L( ) Iverse Y t 0.(/t) Y 0.(/ ) Quadratc Y t 0.t.t Y 0.. Cuc Y t 0.t.t 3.t 3 Y 0.. 3. 3 Compoud Y t 0. Y 0. Power Y t 0. Y 0. S Y t exp( 0 / t) Y exp( 0 / ) Growth Y t exp( 0.t) Y exp( 0. ) Expoetal Y t 0. exp(.t) Y 0. exp(. ) u Logstc Y t. t 0 Y u. 0
ΕΦΑΡΜΟΓΗ ΜΕ SPSS
ΠΑΡΑΒΟΛΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αρχείο: 4_Mη γραμμική παλινδρόμηση.xls Φύλλο: Quadratc (Τα δεδομένα βρίσκονται στο A:C0) Μοντέλο: AEP a o a tme a tme Η ανεξάρτητη μεταβλητή tme παίρνει τιμές για το ο έτος (996) έως 9 για το τελευταίο έτος (04). (α) Υπολογίζουμε την μεταβλητή tme με την εντολή: Trasform Compute varales tme tme ** Έχουμε δημιουργήσει μια νέα μεταβλητή tme που δεν είναι τίποτα άλλο από τη μεταβλητή tme στο τετράγωνο. (β) Εφαρμόζουμε την γραμμική παλινδρόμηση, επιλέγοντας για τις ανεξάρτητες μεταβλητές τις μεταβλητές: tme, tme
ΠΑΡΑΒΟΛΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αποτελέσματα: Δύο ανεξάρτητες μεταβλητές Αρχικά υπάρχει θετική σχέση με το χρόνο (α >0) ενώ στο τέλος υπάρχει αρνητική σχέση (α < 0) AEP 57,844,375 tme - 0,84tme
ΕΚΘΕΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αρχείο: 4_Mη γραμμική παλινδρόμηση.xls Φύλλο: Growth (Τα δεδομένα βρίσκονται στο A:C7) Μοντέλο: Idex a ds ce e a o ta LIdex ao ads ta ce (α) Υπολογίζουμε την μεταβλητή LIdex με την εντολή: Trasform Compute varales LIdex l(idex) Έχουμε δημιουργήσει μια νέα μεταβλητή LIdex που δεν είναι τίποτα άλλο από τo λογαριθμικό της μεταβλητής Idex. (β) Εφαρμόζουμε την γραμμική παλινδρόμηση, επιλέγοντας για την εξαρτημένη μεταβλητή Ldex και dstace ως ανεξάρτητη.
ΕΚΘΕΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αποτελέσματα: Μια ανεξάρτητη μεταβλητή LIdex -0,075-0,56 Dstace Idex e (-0,075-0,56 Dstace) Idex 0,98 e-0,56 Dstace