ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: ΔΙΑΛΕΞΗ 04 Μαρί-Νοέλ Ντυκέν Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Θεσσαλίας» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Γενίκευση του «Γραμμικού Υποδείγματος» Εξειδίκευση του υποδείγματος. Το ζήτημα της «ανεξαρτησίας» των ερμηνευτικών μεταβλητών. Αναζήτηση «Πολυσυγγραμικότητας». Εφαρμογή στο SPSS. 4
Εξειδίκευση του υποδείγματος (α) Y i = a 0 + a 1 X i1 + a 2 X i2 + + a j X ij + + a k X ik + ε i i= 1,,n j= 1,., k. a j = Ξεχωριστή επίδραση των ανεξαρτήτων μεταβλητών όταν οι άλλες είναι σταθερές. a j = dy /d X j. 5
Εξειδίκευση του υποδείγματος (β) Μια σημαντική Υπόθεση : δεν υπάρχει ακριβής γραμμική σχέση ανάμεσα στις k ανεξάρτητες μεταβλητές X j Η υπόθεση αυτή αναφέρεται στην απουσία πλήρους πολυσυγγραμμικότητα (multicollinearity) η οποία θα πρέπει να ελεγχθεί συστηματικά. Οι άλλες βασικές υποθέσεις της γραμμικής παλινδρόμησης παραμένουν και ειδικότερα. Τα εκτιμημένα κατάλοιπα e i δεν συσχετίζονται: ούτε με την εκτιμημένη εξαρτημένη μεταβλητή (Ŷ). ούτε με τις ανεξάρτητες μεταβλητές Χ j. 6
Εκτίμηση της παλινδρόμησης Με την χρήση της ΜΕΤ, οι συντελεστές του υποδείγματος είναι αυτοί που εξασφαλίζουν την ελαχιστοποίηση του Άθροισμα των Τετραγώνων των Καταλοίπων (ΑΤΚ). Min ATK = Min Σ e i 2 = Min Σ (Y i - Ŷ i ) 2 όπου e i = εκτίμηση του ε i. Η ελαχιστοποίηση των ATK σημαίνει ότι η πρώτη παράγωγος σε σχέση με το κάθε συντελεστή είναι ίσον με μηδέν. Έλεγχος της παλινδρόμησης: η διαδικασία είναι η ίδια με αυτή που ακολουθήσαμε στο πλαίσιο του απλού μοντέλου με μια ανεξάρτητη μεταβλητή και βασίζεται στον υπολογισμό του συντελεστή προσδιορισμού και στον έλεγχο του Fisher. 7
Έλεγχος της παλινδρόμησης (α) Συντελεστής Πολλαπλού προσδιορισμού. R 2 e 1 1 2 i Διορθωμένος Συντελεστής Πολλαπλού Προσδιορισμού. R 2* 1 ATK N k N 1 1 ˆ 2 2 ˆ Y Όπου 2 ˆ = διακύμανση του διαταρακτικού όρου. 2 ˆ Y = διακύμανση της εξαρτημένης μεταβλητής. 8
Έλεγχος της παλινδρόμησης (β) Έλεγχος του Fisher Αν F Υπολογισμένο είναι μεγαλύτερο από τη τιμή του πίνακα για βαθμό σημαντικότητας α% και για (κ-1, Ν-κ) βαθμούς ελευθέριας, τότε δεχόμαστε την υπόθεση Η1 δηλαδή ότι υπάρχει τουλάχιστον ένα συντελεστή στατιστικά σημαντικό (διαφορετικό από μηδέν). Στο SPSS, ελέγχουμε την p-value που μας δίνει το βαθμό σημαντικότητας που πρέπει να επιλεχθούμε για να δεχόμαστε την υπόθεση Η1. F k 1 N k 9
Έλεγχος της παλινδρόμησης Έλεγχος του Student για κάθε συντελεστή ξεχωριστά. Η διαδικασία ελέγχου είναι ακριβώς η ίδια με αυτή που ακολουθήσαμε στον διμεταβλητό υπόδειγμα. Στόχος του ελέγχου είναι να επιβεβαιωθεί ότι, κάθε συντελεστή είναι διαφορετικό από το μηδέν, επομένως ότι, κάθε ανεξάρτητη μεταβλητή έχει πραγματική επιρροή στην εξαρτημένη μεταβλητή. Ο έλεγχος βασίζεται στην στατιστική του t-student. Στο SPSS, εξετάζουμε την τιμή της p-value που μας δίνει το βαθμό σημαντικότητας που πρέπει να επιλεχθούμε για να δεχόμαστε την υπόθεση Η1, δηλαδή για να δεχόμαστε ότι, ο συντελεστής a j είναι στατιστικά διαφορετικό από το μηδέν. 10
Ανεξαρτησία μεταξύ των ερμηνευτικών μεταβλητών (α) Τρεις βασικές περιπτώσεις: (α) Υπάρχει πλήρη συσχέτιση r X 1X 2 1 μεταξύ δύο ερμηνευτικών μεταβλητών: Πλήρης πολυσυγραμμικότητα. Τότε οι μεταβλητές δεν είναι καθόλου ανεξάρτητες και οι συντελεστές του μοντέλου δεν μπορούν να εκτιμηθούν. r X 1X 2 (β) Οι δύο ερμηνευτικές δεν συσχετίζονται καθόλου, τότε δεν υπάρχει κανένα πρόβλημα πολυσυγραμμικότητα. Ο συντελεστής προσδιορισμού του μοντέλου με 2 ερμηνευτιξκές μεταβλητές ισούται με τον άθροισμα των απλών συντελεστών προσδιορισμού όπως αυτοί προκύπτουν από τα 2 διμεταβλητά υποδείγματα: 2 2 2 R R R Y, X1X 2 Y, X1 Y, X 2 0 11
Ανεξαρτησία μεταξύ των ερμηνευτικών μεταβλητών (β) Αξίζει να σημειωθεί ότι, οι απλοί συντελεστές προσδιορισμού δεν είναι τίποτα άλλο πάρα τους απλούς συντελεστές συσχέτισης στο τετράγωνο. (γ) Υπάρχει μερική συσχέτιση μεταξύ των ερμηνευτικών μεταβλητών. Οι συντελεστές μπορούν να εκτιμηθούν όμως πρέπει να ελέγξουμε σε ποιο βαθμό το πρόβλημα της πολυσυγραμμικότητας είναι σοβαρό ή όχι, δηλαδή σε ποιο βαθμό οι εκτιμήσεις των συντελεστών της παλινδρόμησης εκφράζουν καλά την καθαρή επιρροή των ερμηνευτικών μεταβλητών. 12
Τι σημαίνει μερική συσχέτιση; (α) 1. Διακυμάνσεις και συνδιακυμάνσεις των συντελεστών αρκετά μεγάλες. Όσο η συσχέτιση είναι πιο στενή, τόσο έχουμε Υψηλό R 2 υψηλή τιμή της F-στατιστικής. μεγάλα τυπικά σφάλματα. επιρροή στο διάστημα εμπιστοσύνης των συντελεστών παλινδρόμησης. κακή επιρροή στην t-στατιστική που θα είναι μικρότερη από την τιμή που θα υπολογίσαμε εάν δεν υπήρξε συσχέτιση ανάμεσα στις ανεξάρτητες μεταβλητές. ο στατιστικός έλεγχος των ατομικών συντελεστών δεν είναι ακριβής. 13
Τι σημαίνει μερική συσχέτιση; (β) 2. Δεν μπορούμε να διαχωρίσουμε την επίδραση κάθε ανεξάρτητης μεταβλητής ξεχωριστά. ορισμένοι ατομικοί συντελεστές μη στατιστικά σημαντικοί: οι ανεξάρτητες μεταβλητές σε ατομική βάση δεν ερμηνεύουν σημαντικά την μεταβλητικότητα της εξαρτημένης μεταβλητής. Η πολυσυγγραμμικότητα μπορεί να επηρεάσει τις τιμές των συντελεστών και τα πρόσημα τους. Η πολυσυγγραμμικότητα μπορεί να συντελέσει έμμεσα σε λανθασμένη εξειδίκευση του υποδείγματος. 14
Έλεγχος της Ανεξαρτησίας (α) 1 ος απλός τρόπος (σοβαρή ένδειξη) R 2 και F: υψηλές τιμές. Οι περισσότεροι ατομικοί συντελεστές δεν είναι στατιστικά σημαντικοί (μικρή τιμή της t-στατιστικής), η κατάσταση αυτή υποδηλώνει με βεβαιότητα την ύπαρξη πολύ-συγγραμμικότητας στο υπόδειγμα. 15
Έλεγχος της Ανεξαρτησίας (β) 2 ος απλός τρόπος (σοβαρή ένδειξη όμως δεν φτάνει). Σύγκριση μεταξύ: του απλού συντελεστή συσχέτισης (Pearson Correlation): «ακαθάριστος» (Zero-order) που δεν δίνει συστηματικά την πραγματική καθαρή επιρροή της μεταβλητής Χj στην εξαρτημένη Υ και του μερικού συντελεστής συσχέτισης (partial) που δίνει την καθαρή επιρροή της μεταβλητής Χj όταν αφαιρέθηκε η επιρροή των άλλων ερμηνευτικών μεταβλητών. 16
Έλεγχος της Ανεξαρτησίας (γ) 3 ος τρόπος (τελική επιβεβαίωση) 2 Tolerance factor = TOL j 1 Rj όπου R j 2 = συντελεστής πολλαπλού προσδιορισμού της παλινδρόμησης που αφορά την μεταβλητή Χj σε σχέση με όλες τις υπόλοιπες ανεξάρτητες μεταβλητές, δηλαδή: Χ j = b 0 + b 1 X 1 + + b j-1 X j-1 + b j+1 X j+1 + + a k X k + ε j. Αν η μεταβλητή Χj δεν συσχετίζεται με τις άλλες ανεξάρτητες μεταβλητές τότε : TOLj = 1 Αντίθετα, τόσο έντονη είναι η συσχέτιση τόσο TOLj τείνει προς το 0. Όταν TOLj < 50% : πάνω από 50% της μεταβλητότητας της μεταβλητής Χj εξηγείται από τις άλλες ανεξάρτητες μεταβλητές του μοντέλου. ιδιαίτερα έντονο πρόβλημα. 17
Έλεγχος της Ανεξαρτησίας (δ) 3 ος τρόπος (συνέχεια) Variance Inflation Factor = VIF j 1 1 TOL 1 R 2 j j Όταν η μεταβλητή Χj συσχετίζεται έντονα με τις άλλες μεταβλητές, τότε R j 2 τείνει προς το 1 και επομένως VIFj τείνει προς το. Μεγάλες τιμές του VIFj αναδεικνύουν έντονο πρόβλημα πολυσυγγραμμικότητα. Στην περίπτωση όπου η μεταβλητότητα της Χj εξηγείται τουλάχιστον κατά 50% από τις άλλες ανεξάρτητες μεταβλητές ( TOL j > 0,5), τότε VIF j > 2, με αποτέλεσμα η διακύμανση του συντελεστή να είναι μεγάλη. Από τον ορισμό της, η διακύμανση του συντελεστή a j είναι : X * T.X * ( a j ) * T 2 ˆ X. X * j VIF όπου = πίνακας συσχέτισης μεταξύ των ερμηνευτικών μεταβλητών. όσον μεγαλύτερο είναι ο δείκτης VIF j, τόσο μεγαλύτερη είναι η διακύμανση του συντελεστή, γεγονός που δεν είναι συμβατό με τις βασικές υποθέσεις της ΜΕΤ. Var ˆ 18
Έλεγχος της Ανεξαρτησίας (ε) 3ος τρόπος (τελική φάση απόλυτη επιβεβαιώση). 19
Εφαρμογή με SPSS (α) Θεωρητικό μοντέλο του Feldstein & Horioka (1980) : εκτίμηση του βαθμού κινητικότητας του διεθνής κεφαλαίου. Η ανάλυση τους βασίζεται σε μια σχέση μεταξύ επίπεδο επένδυσης στο εσωτερικό της χώρας και αποταμίευσης 16 μεγάλων χώρων του ΟΟΣΑ για την περίοδο 1960-1974. Η εξειδίκευση της συνάρτησης είναι η ακόλουθα (μακροπρόθεσμα σχέση): Όπου : Inv = Ι/Y = I S S b b b Y. 1 2 0 1 2 Y Y μέσο ετήσιο ποσοστό ακαθαρίστων επενδύσεων στον ΑΕΠ για κάθε χώρα. Sav 1 = S 1 /Y = μέσο ετήσιο ποσοστό αποταμίευσης από το ιδιωτικό τομέα στον ΑΕΠ της χώρας. Sav 2 = S 2 /Y = μέσο ποσοστό αποταμίευσης από το δημόσιο τομέα στον ΑΕΠ της χώρας. Feldstein M., Horiaka C., (1980), Domestic saving and international capital flows, Economic Journal, No 90, pp 314-329. 20
Εφαρμογή με SPSS (β) Οι Feldstein & Horioka ανέδειξαν ότι, οι συντελεστές του υποδείγματος είναι πολύ μικρότεροι από 1, αποτέλεσμα που σημαίνει ότι, η αύξηση των δυνατοτήτων αποταμίευσης δεν προκαλούν αντίστοιχή αύξηση των εσωτερικών επενδύσεων, προκαλώντας κινητικότητα του διεθνή κεφαλαίου. Feldstein M., Horiaka C., (1980), Domestic saving and international capital flows, Economic Journal, No 90, pp 314-329. 21
Εφαρμογή με SPSS (γ) Προτείνεται να εξεταστεί το θεωρητικό υπόδειγμα του Feldstein & Horioka, χρησιμοποιώντας τα ακόλουθα δεδομένα 19 μεγάλων χώρων του ΟΟΣΑ για την περίοδο 1970-1998. Πηγή: OCDE, Perspectives économiques de l OCDE, 2000 Αρχείο: Data_LECTURE04.xls 22
Αποτελέσματα της παλινδρόμησης Ο συντελεστής συσχέτισης μεταξύ των 2 ανεξαρτήτων μεταβλητών δεν είναι σε επίπεδο 5% στατιστικά σημαντικό. Επομένως μπορούμε να θεωρήσουμε ότι, είναι με στατιστικούς όρους ανεξάρτητες. Αρχείο: Data_LECTURE04.xls. 23
Αποτελέσματα της παλινδρόμησης I Ποια είναι τα συμπεράσματα σας; 1. 2. 3. Αρχείο: Data_LECTURE04.xls. 24
Αποτελέσματα της παλινδρόμησηςii Αρχείο: Data_LECTURE04.xls. 25
Αποτελέσματα της παλινδρόμησης III Ποια είναι τα συμπεράσματα σας; 1. 2. 3. Αρχείο: Data_LECTURE04.xls. 26
Αποτελέσματα της παλινδρόμησης IV Ο συντελεστής TOL = 0,895 για τις δύο μεταβλητές. Τι σημαίνει; Τι παρατηρούμε όταν εφαρμόζουμε απλή παλινδρόμηση μεταξύ των μεταβλητών Sav1 και Sav2;? Αρχείο: Data_LECTURE04.xls. 27
Αποτελέσματα της παλινδρόμησης V Αρχείο: Data_LECTURE04.xls. 28
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Τέλος Ενότητας 4 ΔΙΑΛΕΞΗ 04