ΜΑΘΗΜΑ 3 ο 1
Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ είναι συνάρτηση των η ερμηνευτικών μεταβλητών Χ 1, Χ 2,..Χ η, οπότε για ένα δείγμα από n παρατηρήσεις μπορούμε να γράψουμε: Υ t = β 0 + β 1 Χ 1t + β 2 Χ 2t +.β η Χ ηt + u t Η παραπάνω σχέση αποτελεί το υπόδειγμα της γραμμικής πολυμεταβλητής παλινδρόμησης. 2
Οι βασικές υποθέσεις (Testing hypotheses) Οι βασικές υποθέσεις που συνιστούν το κλασικό γραμμικό υπόδειγμα στη γενική του μορφή είναι οι παρακάτω: Υπόθεση 1 Ο διαταρακτικός όρος u t είναι μια τυχαία μεταβλητή. Υπόθεση 2 Οι ερμηνευτικές μεταβλητές είναι μη στοχαστικές. Υπόθεση 3 Η μέση τιμή της μεταβλητής u t ισούται με μηδέν. 3
Υπόθεση 4 Οι διαταρακτικοί όροι u t έχουν την ίδια διακύμανση (ομοιοσκεδαστικότητα). Var (u t ) = σ 2 Υπόθεση 5 Δεν υπάρχει αυτοσυσχέτιση μεταξύ των διαταρακτικών όρων. Cov(u i, u j ) = 0 i j Υπόθεση 6 Δεν υπάρχει συσχέτιση μεταξύ των διαταρακτικών όρων και των ερμηνευτικών μεταβλητών. Cov(u i, Χ j ) = 0 4
Υπόθεση 7 Το υπόδειγμα παλινδρόμησης είναι σωστά εξειδικευμένο. Υπόθεση 8 Οι ερμηνευτικές μεταβλητές μετρώνται χωρίς σφάλματα. Υπόθεση 9 Οι διαταρακτικοί όροι ακολουθούν την κανονική κατανομή με μέσο μηδέν και σταθερή διακύμανση. u t N(0, σ 2 ) Υπόθεση 10 Δεν υπάρχουν γραμμικές σχέσεις μεταξύ των ερμηνευτικών μεταβλητών (πολυσυγραμμικότητα). 5
Η μέθοδος των ελαχίστων τετραγώνων (Ordinary Least Squares) Η εκτίμηση των παραμέτρων του υποδείγματος της γραμμής παλινδρόμησης μπορεί να γίνει με πολλούς τρόπους. Ο πιο συνηθισμένος είναι η μέθοδος των ελαχίστων τετραγώνων (least squares method) γιατί είναι απλή και οι εκτιμητές που προκύπτουν από τη μέθοδο αυτή έχουν πολλές από τις ιδιότητες που θέλουμε για το υπόδειγμά μας. 6
Το κριτήριο στο οποίο βασίζεται η μέθοδος αυτή είναι η ελαχιστοποίηση του αθροίσματος των τετραγώνων των καταλοίπων (minimum, sum of squared residuals), δηλαδή το άθροισμα των τετραγώνων των αποκλίσεων από τη γραμμή παλινδρόμησης που προκύπτει από τη μέθοδο των ελαχίστων τετραγώνων είναι ελάχιστο. Με άλλα λόγια δεν υπάρχει άλλη γραμμή παλινδρόμησης που το άθροισμα των τετραγώνων των αποκλίσεών της να είναι μικρότερο από αυτό που προκύπτει από τη μέθοδο των ελαχίστων τετραγώνων. Μια άλλη μέθοδος για την εκτίμηση των παραμέτρων του υποδείγματος της γραμμής παλινδρόμησης είναι και η μέθοδος της μέγιστης πιθανοφάνειας (maximum log likelihood). 7
Για τον έλεγχο της ποιότητας των αποτελεσμάτων εργαζόμαστε ως εξής: (αφού πρώτα τρέξουμε την παλινδρόμηση). Ελέγχουμε τα πρόσημα των εκτιμητών των συντελεστών της παλινδρόμησης (σύμφωνα με την οικονομική θεωρία) Ελέγχουμε τη σημαντικότητα των εκτιμημένων συντελεστών (t Student) 8
Ελέγχουμε την προσαρμογή της γραμμής παλινδρόμησης με τη βοήθεια του διορθωμένου συντελεστή προσδιορισμού (R Bar Squared) ο ποίος προσδιορίζει το ποσοστό της συνολικής μεταβλητικότητας της εξαρτημένης μεταβλητής που ερμηνεύεται από το υπόδειγμα της παλινδρόμησης. ΌσομεγάλοείναιτοR 2 (όσο πιο κοντά τείνει στη μονάδα) τόσο καλύτερη είναι η παλινδρόμηση. Ελέγχουμε τη γραμμικότητα του υποδείγματος (απλή παλινδρόμηση) ή το σύνολο των συντελεστών της παλινδρόμησης (πολλαπλή παλινδρόμηση) με το δείκτη F (F-statistic) (Ανάλυση της διακύμανση ANOVA). 9
Ελέγχουμε με τη βοήθεια του διαγράμματος διασποράς για τις παραβιάσεις των βασικών υποθέσεων του υποδείγματος. Για τον έλεγχο αυτό κάνουμε τα παρακάτω βήματα: Βήμα 1 Βρίσκω τις εκτιμημένες τιμές της εξαρτημένης μεταβλητής (έστω EY). Βήμα 2 Βρίσκω τα κατάλοιπα από την εκτίμηση της παλινδρόμησης (έστω U). Βήμα 3 Βρίσκω τα τυπικά κατάλοιπα (διαιρώντας τα κατάλοιπα από το βήμα 2 με το τυπικό σφάλμα της παλινδρόμησης (S.E Regression) (έστω TU). Βήμα 4 Κατασκευάζω το διάγραμμα της διασποράς με την εντολή SCATTER TU EY Αν κάποιο σημείο του διαγράμματος διασποράς είναι εκτός του διαστήματος 2 και +2 τότε λέμε ότι έχουμε παραβίαση των υποθέσεων του υποδείγματος. 10
Scatter plot of TU on EY 1.5 1.0 0.5 0.0-0.5-1.0-1.5-2.0-2.5 100000 150000 200000 250000 300000 350000 EY TU 11
Ανάλυση της διακύμανσης (ANOVA) 12