ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο TEI Δυτικής Μακεδονίας και στην Ανώτατη Εκκλησιαστική Ακαδημία Θεσσαλονίκης» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Σκοποί ενότητας Παρουσίαση και Ανάλυση της πολλαπλής γραμμικής Παλινδρόμησης καθώς και των αποτελεσμάτων της. 4
Περιεχόμενα ενότητας Πολλαπλή Γραμμική Παλινδρόμηση. Αποτελέσματα της Πολλαπλής Παλινδρόμησης. 5
Πολλαπλή Γραμμική Παλινδρόμηση (1 από 7) Πολλαπλή παλινδρόμηση: μια στατιστική μέθοδος για την ανάλυση της σχέσης που υπάρχει μεταξύ αρκετών ανεξάρτητων μεταβλητών και μιας εξαρτημένης μεταβλητής. Στατιστικό στοιχείο F. Στατιστικό στοιχείο t. 6
Πολλαπλή Γραμμική Παλινδρόμηση (2 από 7) Ας υποθέσουμε ότι έχουμε στη διάθεση μας παρατηρήσεις για το πλήθος των βιβλίων στατιστικής που έχουν πουληθεί, την τιμή τους, και το κατά κεφαλή εισόδημα των κατοίκων 15 διαφορετικών πόλεων μιας χώρας σε μια συγκεκριμένη χρονική περίοδο. Πίνακας 1: Δεδομένα Παραδείγματος. Πηγή: Διδάσκων (2015). 7
Πολλαπλή Γραμμική Παλινδρόμηση (3 από 7) Θα υποθέσουμε ότι η σχέση μεταξύ των Υ, Χ 1, και Χ 2 δίνεται από την εξίσωση: Y i =b 0 +b 1 X 1i + b 2 X 2i +u i Στην περίπτωση των παρατηρήσεων, το x 11 ισούται με 10, το x 21 με 9, το χ 21 με 20, το x 22 με 21. Πίνακας 2: Δεδομένα Παραδείγματος. Πηγή: Διδάσκων (2015). 8
Πολλαπλή Γραμμική Παλινδρόμηση (4 από 7) Y i =b 0 +b 1 X 1i + b 2 X 2j +u i Το b 1 αντιπροσωπεύει την επίδραση που έχει στην Y η ανεξάρτητη μεταβλητή X 1 με την προϋπόθεση ότι η Χ 2 παραμένει σταθερή. Παρόμοια, το b 2 αντιπροσωπεύει την επίδραση που έχει στην Y η ανεξάρτητη μεταβλητή Χ 2 όταν η X 1 παραμένει σταθερή. Αν η X 1 αυξηθεί κατά 1 και όλα τα άλλα παραμείνουν όπως ήταν, τότε η Y θα αυξηθεί κατά b 1. 9
Πολλαπλή Γραμμική Παλινδρόμηση (5 από 7) Y i =b 0 +b 1 X 1i + b 2 X 2j +u i Υποθέτουμε ότι οι επιδράσεις των X 1 και X 2 στην Y είναι αθροιστικές. Αυτό σημαίνει ότι η ποσότητα κατά την οποία επηρεάζει η X 1 την Y δεν εξαρτάται από το μέγεθος της X 2, και αντίστροφα. Περιμένουμε ότι το b 2 θα είναι θετικό γιατί, οι καταναλωτές θα αγοράζουν περισσότερα βιβλία όταν αυξάνεται το εισόδημα τους. Το b 1 θα είναι αρνητικό γιατί η ζήτηση των βιβλίων θα είναι μικρότερη όταν ανεβαίνει η τιμή τους. 10
Πολλαπλή Γραμμική Παλινδρόμηση (6 από 7) Y i =b 0 +b 1 X 1i + b 2 X 2j +u i Το b 0 ονομάζεται σταθερός όρος του μοντέλου, και είναι ανάλογος με τον όρο της κατακόρυφης απόστασης του μοντέλου της απλής γραμμικής παλινδρόμησης. Το u είναι μια τυχαία μεταβλητή που ονομάζεται όρος σφάλματος (error terms). Αντιπροσωπεύει την επίδραση όλων των δυνατών παραμέτρων εκτός της τιμής και του εισοδήματος. Το u θα πρέπει να είναι ανεξάρτητο από τα Χ 1 Χ 2. 11
Πολλαπλή Γραμμική Παλινδρόμηση (7 από 7) Y i =b 0 +b 1 X 1i + b 2 X 2j +u i Η αναμενόμενη τιμή του u είναι 0 και η διακύμανση σ 2, η οποία και είναι άγνωστη. Θα υποθέσουμε ότι το u ακολουθεί κανονική κατανομή. 12
Αποτελέσματα της Πολλαπλής Παλινδρόμησης (1 από 3) Αφού τροφοδοτήσουμε τους αριθμούς στον υπολογιστή και του ζητήσουμε να εκτελέσει τους υπολογισμούς, θα μας δώσει ένα αποτέλεσμα σαν το παρακάτω: EXCEL. Πίνακας 3: Δεδομένα Παραδείγματος. Πηγή: Διδάσκων (2015). Y =- 2,765-7,738 X 1 + 12,286 X 2 13
Αποτελέσματα της Πολλαπλής Παλινδρόμησης (2 από 3) Y =- 2,765-7,738 X 1 + 12,286 X 2 Το πρώτο πράγμα που μπορούμε να διαπιστώσουμε είναι ότι: Ο συντελεστής του X 1 είναι αρνητικός. Σημαίνει ότι η υψηλότερη τιμή οδηγεί σε λιγότερες πωλήσεις. Ο συντελεστής του X 2 είναι θετικός. Σημαίνει ότι το υψηλότερο εισόδημα σημαίνει μεγαλύτερες πωλήσεις. 14
Αποτελέσματα της Πολλαπλής Παλινδρόμησης (3 από 3) Y =- 2,765-7,738 X 1 + 12,286 X 2 Μπορούμε να χρησιμοποιήσουμε τις εκτιμώμενες τιμές των συντελεστών για να κάνουμε προβλέψεις για την τιμή του Y Για παράδειγμα, αν είχαμε υπόψη μας μια πόλη στην οποία το μέσο εισόδημα είναι 20 και η τιμή των βιβλίων στατιστικής 6, θα μπορούσαμε να προβλέψουμε ότι η ζήτηση για βιβλία στατιστικής θα είναι -2,765 -(7,738 χ 6) + (12,286 χ 20) = 196,5 15
TIMH R 2 (1 από 4) Ο υπολογιστής θα μας δώσει επίσης και μια τιμή R 2 για την παλινδρόμηση. Το R 2 ονομάζεται συντελεστής πολλαπλού προσδιορισμού Η τιμή του είναι 0,9957. Πίνακας 4: Στατιστικά Παλινδρόμησης. Πηγή: Διδάσκων (2015). 16
TIMH R 2 (2 από 4) Το R 2 μετρά το ποσοστό της απόκλισης της εξαρτημένης μεταβλητής το οποίο μπορεί να εξηγηθεί από την παλινδρόμηση. Η τιμή του R 2 κυμαίνεται πάντα από 0 έως 1. Πίνακας 5: Στατιστικά Παλινδρόμησης. Πηγή: Διδάσκων (2015). 17
TIMH R 2 (3 από 4) Πίνακας 6: Στατιστικά Παλινδρόμησης. Πηγή: Διδάσκων (2015). 18
TIMH R2 (4 από 4) Το R 2 =0,9957. Η εκτιμώμενη εξίσωση παλινδρόμησης προσαρμόζεται σε αυτά τα σημεία πολύ καλά. Υπάρχει πάντα η δυνατότητα να αυξήσουμε την τιμή του R 2 με την προσθήκη περισσότερων ανεξάρτητων μεταβλητών, είτε έχουν κάποια σχέση με την εξαρτημένη μεταβλητή είτε όχι. Για να είναι αξιόπιστα τα αποτελέσματα της παλινδρόμησης θα πρέπει το πλήθος των παρατηρήσεων να είναι σημαντικά μεγαλύτερο από το πλήθος των συντελεστών που προσπαθούμε να εκτιμήσουμε. Έτσι, μερικές φορές συνιστάται ο υπολογισμός του προσαρμοσμένου R 2 : Το προσαρμοσμένο R2 δεν αυξάνεται αναγκαστικά μετά την προσθήκη άλλης μιας μεταβλητής επειδή κάτι τέτοιο θα αυξήσει την τιμή του m. Για το παράδειγμά μας το προσαρμοσμένο R2 όπως δίνεται από τον πίνακα αποτελεσμάτων του EXCEL είναι 0,994992483. 19
ΤΟ ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ F (1 από 5) Μηδενική υπόθεση: δεν υπάρχει σχέση μεταξύ ανεξάρτητων και εξαρτημένης μεταβλητής. H 0 : b 1 = =b m = 0. Η πραγματική τιμή των συντελεστών και των m ανεξάρτητων μεταβλητών είναι μηδέν. Για να ελέγξουμε αυτή την υπόθεση. 20
ΤΟ ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ F (2 από 5) Όπου: n = Το πλήθος παρατηρήσεων (x i, γ i ). m= αριθμός των παραμέτρων. m-1 = αριθμός ανεξάρτητων μεταβλητών. Βαθμοί ελευθερίας είναι: m-1 για τον αριθμητή. n-m για τον παρανομαστή. 21
ΤΟ ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ F (3 από 5) Εάν το υπολογιζόμενο κατ' αυτόν τον τρόπο F είναι μεγαλύτερο από το "κρίσιμο F α, τότε απορρίπτουμε την βασική υπόθεση. Αν η μηδενική υπόθεση είναι αληθής, τότε αυτό το στατιστικό στοιχείο θα έχει κατανομή F με m-1 βαθμούς ελευθερίας στον αριθμητή και n-m βαθμούς ελευθερίας στον παρονομαστή και θα είναι μικρότερο του F α. n είναι το πλήθος των παρατηρήσεων. m-1 το πλήθος των ανεξάρτητων μεταβλητών. 22
ΤΟ ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ F (4 από 5) 23
ΤΟ ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ F (5 από 5) Στην περίπτωση μας, η υπολογιζόμενη τιμή του στατιστικού στοιχείου F είναι 1391,89827 μια τιμή που είναι πολύ μεγαλύτερη από το 3,89 (η οποία είναι η κρίσιμη τιμή του 95% μιας κατανομής F με 2 και 12 βαθμούς ελευθερίας). Κατά συνέπεια, απορρίπτουμε τη μηδενική υπόθεση. Πίνακας 7: Στατιστικά Παλινδρόμησης. Πηγή: Διδάσκων (2015). 24
Σημείωμα Αναφοράς Copyright ΤΕΙ Δυτικής Μακεδονίας, Νικόλαος Σαριαννίδης. «ΟΙΚΟΝΟΜΕΤΡΙΑ». Έκδοση: 1.0. Κοζάνη 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: URL. 25
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο. που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο. που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο. Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 26
Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς. το Σημείωμα Αδειοδότησης. τη δήλωση Διατήρησης Σημειωμάτων. το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει). μαζί με τους συνοδευόμενους υπερσυνδέσμους. 27