Πολλαπλή παλινδρόµηση Μάθηµα 3 ο
Πολλαπλή παλινδρόµηση (Multivariate regression ) Η συµπεριφορά των περισσότερων οικονοµικών µεταβλητών είναι συνάρτηση όχι µιας αλλά πολλών µεταβλητών Y = f ( X, X 2, X 3,..., X 1 n ) δηλαδή η Υ είναι συνάρτηση τωνnερµηνευτικών µεταβλητών Χ 1, Χ 2,..Χ η, οπότε για ένα δείγµα από n παρατηρήσεις µπορούµε να γράψουµε: Υ t = β 0 + β 1 Χ 1t + β 2 Χ 2t + +β η Χ ηt + u t Η παραπάνω σχέση αποτελεί το υπόδειγµα της γραµµικής πολυµεταβλητής παλινδρόµησης
Οι βασικές υποθέσεις (Testing hypotheses ) Οι βασικές υποθέσεις που συνιστούν το κλασικό γραµµικό υπόδειγµα στη γενική του µορφή είναι οι παρακάτω: Υπόθεση 1 Ο διαταρακτικός όρος u t είναι µια τυχαία µεταβλητή Υπόθεση 2 Οι ερµηνευτικές µεταβλητές είναι µη στοχαστικές Υπόθεση 3 Η µέση τιµή της µεταβλητής u t ισούται µε µηδέν
Υπόθεση 4 Οι διαταρακτικοί όροι u t έχουν την ίδια διακύµανση (οµοιοσκεδαστικότητα) Var (u t ) = σ 2 Υπόθεση 5 εν υπάρχει αυτοσυσχέτιση µεταξύ των διαταρακτικών όρων Cov(u i, u j ) = 0 i j Υπόθεση 6 εν υπάρχει συσχέτιση µεταξύ των διαταρακτικών όρων και των ερµηνευτικών µεταβλητών Cov(u i, Χ j ) = 0
Υπόθεση 7 Το υπόδειγµα παλινδρόµησης είναι σωστά εξειδικευµένο Υπόθεση 8 Οι ερµηνευτικές µεταβλητές µετρώνται χωρίς σφάλµατα Υπόθεση 9 Οι διαταρακτικοί όροι ακολουθούν την κανονική κατανοµή µε µέσο µηδέν και σταθερή διακύµανση u t N(0, σ 2 ) Υπόθεση 10 εν υπάρχουν γραµµικές σχέσεις µεταξύ των ερµηνευτικών µεταβλητών (πολυσυγραµµικότητα)
Η µέθοδος των ελαχίστων τετραγώνων (Ordinary Least Squares) Η εκτίµηση των παραµέτρων του υποδείγµατος της γραµµής παλινδρόµησης µπορεί να γίνει µε πολλούς τρόπους Ο πιο συνηθισµένος είναι η µέθοδος των ελαχίστων τετραγώνων (least squares method) γιατί είναι απλή και οι εκτιµητές που προκύπτουν από τη µέθοδο αυτή έχουν πολλές από τις ιδιότητες που θέλουµε για το υπόδειγµά µας Το κριτήριο στο οποίο βασίζεται η µέθοδος αυτή είναι η ελαχιστοποίηση του αθροίσµατος των τετραγώνων των καταλοίπων (minimum, sum of squared residuals), δηλαδή το άθροισµα των τετραγώνων των αποκλίσεων από τη γραµµή παλινδρόµησης που προκύπτει από τη µέθοδο των ελαχίστων τετραγώνων είναι ελάχιστο, µε άλλα λόγια δεν υπάρχει άλλη γραµµή παλινδρόµησης που το άθροισµα των τετραγώνων των αποκλίσεών της να είναι µικρότερο από αυτό που προκύπτει από τη µέθοδο των ελαχίστων τετραγώνων
Παράδειγµα 1
Ζητείται: 1) Να εκτιµηθεί η συνάρτηση της κατανάλωσης της ελληνικής οικονοµίας. 2) Να ελεγχθεί αυτή σε επίπεδο σηµαντικότητας 5% ως προς την ποιότητα των αποτελεσµάτων της
Στο παράθυρο PROCESS µπορείτε να κάνετε: Με την εντολή LIST ελέγχετε τα στοιχεία Με την εντολή PLOT κάνετε γραµµικά διαγράµµατα Με την εντολή XPLOT κάνετε γραµµικά διαγράµµατα δύο ή περισσοτέρων µεταβλητών πάνω σε µια άλλη µεταβλητή Με την εντολή HIST κάνετε το ιστόγραµµα µιας µεταβλητής Με την εντολή SCATTER κάνετε το διάγραµµα της διασποράς Με την εντολή ADD µπορείτε να προσθέσετε µια νέα µεταβλητή αφού πρώτα της δώσετε νέο όνοµα Με την εντολή DELETE διαγράφετε µια µεταβλητή Με την εντολή TITLE µπορείτε να δείτε όλες τις µεταβλητές και τις πράξεις που έχετε κάνει στις µεταβλητές σας Με την εντολή COR µπορείτε να πάρετε ορισµένα στατιστικά Με την εντολή ADF µπορείτε να πάρετε τα στατιστικά tests των Dickey και Fuller
Για τον έλεγχο της ποιότητας των αποτελεσµάτων εργαζόµαστε ως εξής: (αφού πρώτα τρέξουµε την παλινδρόµηση) Πηγαίνοντας στο παράθυρο Univariate και Νο 1 γραµµικές εκτιµήσεις, Linear regression menu και στη συνέχεια από το δεξιό βέλος εκτιµήσεις µε την µέθοδο OLS Ελέγχουµε τα πρόσηµα των εκτιµητών των συντελεστών της παλινδρόµησης Ελέγχουµε τη σηµαντικότητα των εκτιµηµένων συντελεστών
Ελέγχουµε την προσαρµογή της γραµµής παλινδρόµησης µε τη βοήθεια του διορθωµένου συντελεστή προσδιορισµού (R Bar Squared) ο ποίος προσδιορίζει το ποσοστό της συνολικής µεταβλητικότητας της εξαρτηµένης µεταβλητής που ερµηνεύεται από το υπόδειγµα της παλινδρόµησης Όσο µεγάλο είναι το R 2 (όσο πιο κοντά τείνει στη µονάδα) τόσο καλύτερη είναι η παλινδρόµηση Ελέγχουµε τη γραµµικότητα του υποδείγµατος (απλή παλινδρόµηση) ή το σύνολο των συντελεστών της παλινδρόµησης (πολλαπλή παλινδρόµηση) µε το δείκτη F (F-statistic) (Ανάλυση της διακύµανση ANOVA)
Ελέγχουµε µε τη βοήθεια του διαγράµµατος διασποράς για τις παραβιάσεις των βασικών υποθέσεων του υποδείγµατος Για τον έλεγχο αυτό κάνουµε τα παρακάτω βήµατα: Βήµα 1 Βρίσκω τις εκτιµηµένες τιµές της εξαρτηµένης µεταβλητής (έστω EY) Βήµα 2 Βρίσκω τα κατάλοιπα από την εκτίµηση της παλινδρόµησης (έστω U) Βήµα 3 Βρίσκω τα τυπικά κατάλοιπα (διαιρώντας τα κατάλοιπα από το βήµα 2) µε το τυπικό σφάλµα της παλινδρόµησης (S.E Regression) (έστω TU) Βήµα 4 Κατασκευάζω το διάγραµµα της διασποράς µε την εντολή SCATTER TU EY Αν κάποιο σηµείο του διαγράµµατος διασποράς είναι εκτός του διαστήµατος 2 και +2 τότε λέµε ότι έχουµε παραβίαση των υποθέσεων του υποδείγµατος
Ανάλυση της διακύµανσης (ANOVA)