Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ: ΟΙΚΟΝΟΜΕΤΡΙΑ Το κλασικό Γραμμικό Υπόδειγμα ΔΙΑΛΕΞΗ 0 Μαρί-Νοέλ Ντυκέν, Μαρία Τσιάπα mdyken@prd.uth.gr, mtsapa@prd.uth.gr
A. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ A-1. ΣΤΟΧΟΣ Μέθοδος ανάλυσης γραμμικής σχέσης μεταξύ ή περισσότερων μεταβλητών Ερμηνεία της συμπεριφοράς μιας εξαρτημένης μεταβλητής (dependent : Y) με βάση μιας ή πολλαπλών ερμηνευτικών μεταβλητών (ndependent X 1,, X k ): ανάλυση της αιτιώδης επίδρασης των ερμηνευτικών στην εξαρτημένη μεταβλητή. Y = f ( X1,,... X k, ) = 1,..., n Θεωρητική σχέση [1] Η ανάλυση βασίζεται σε n παρατηρήσεις οι οποίες μπορεί να αφορούν περιόδους (π.χ. έτη, μήνες), επιχειρήσεις, αγροτικές εκμεταλλεύσεις, νοικοκυριά ή ακόμα διοικητικές- χωρικές ενότητες.
A. ΓΡΑΜΜΑΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ A-. Εμπειρική σχέση Η εξαρτημένη μεταβλητή δεν εξηγείται κατά 100% από τις επιλεγμένες ερμηνευτικές μεταβλητές διαταρακτικός όρος- κατάλοιπο (resdual) Y ( X1,,... X k, Η Εμπειρική σχέση: [] = f ) + ε ε είναιμιατυχαίαμεταβλητή. Οιτιμέςτηςείναιεκτωνπροτέρωνάγνωστες. Τι σημαίνει διαταρακτικός όρος - κατάλοιπο; Ορισμένες ερμηνευτικές μεταβλητές δεν λαμβάνονται υπόψη στο μοντέλο, κατά συνέπεια η ε αντιπροσωπεύει όλες αυτές τις μεταβλητές (πέραν Χ 1 Χ k ) που επηρεάζουν την εξαρτημένη Υ ή / και Η εξαρτημένη μεταβλητή δεν υπολογίζεται με απόλυτα «αξιόπιστο» τρόπο 3
A. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ A-3. Υποθέσεις 1) ΓραμμικήσχέσημεταξύΥκαιX, Y = a0+ a1 X + ε ΔΙΑΛΕΞΗ 03 a 0 καιa 1 :άγνωστοισυντελεστές:πρέπεινατουςεκτιμήσουμε ) Μέση τιμή των καταλοίπων: E( ε) = 0 E( Y / X ) = a0+ a1 X 3) Η διακύμανση των καταλοίπων πρέπει να παραμένει σταθερή Var ( ε ) =σε 4) Το κατάλοιπο για μια παρατήρηση δεν πρέπει να συσχετίζεται με τα άλλα κατάλοιπα (Μη αυτοσυσχέτιση, Non autocorrelaton): Cov( ε, ε ) = 0 j j (3) και (4) Οι παρατηρήσεις είναι ανεξάρτητες μεταξύ τους 4
A. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ A-3. Υποθέσεις 5) Κάθε κατάλοιπο δεν συσχετίζεται με τις ερμηνευτικές μεταβλητές: Cov( X, ε ) = 0 6) Το καλύτερο υπόδειγμα προϋποθέτει ότι, ε ακολουθεί κανονική κατανομή ε N (0, σ ε ) Y N( a + a X ; σ ε ) 0 1 5
A. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ A-4. Εκτίμηση: ΜΕΤ Μέθοδος των Ελάχιστων Τετραγώνων (ΜΕΤ : OLS= Ordnary Least Squares): ελαχιστοποίηση της διακύμανσης των καταλοίπων Error terms postve and negatve ε = 0 Ελαχιστοποίηση του αθροίσματος των Mn ε = Mn ( Y Yˆ) καταλοίπων στο Τετράγωνο Λύση: Οι συνθήκες της 1 ης και της ης τάξης ικανοποιούνται. Με το διμεταβλητό γραμμικό υπόδειγμα, έχουμε ένα σύστημα εξισώσεων με άγνωστουςπαραμέτρουςα 0 καια 1.Ηλύσητουσυστήματοςοδηγείσεμιακαι μοναδική λύση: â και 1 0 â : εκτιμητές των άγνωστων συντελεστών της παλινδρόμησης. 6
A. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ A-5. Ερμηνεία των συντελεστών Η τομή (σταθερός όρος) :, η γραμμή της παλινδρόμησης περνά Η κλίση : ( Y Y )( X ˆ1 = ( X X ) a aˆ 0 = Y aˆ 1X X ) Cov( Y, X ) = Var( X ) από το «μέσο σημείο» ( Y, X ) Επομένως: Yˆ = aˆ ˆ ˆ ε 0+ a1 X και e = = Y Yˆ Και: a ˆ1 Yˆ = X Όταν η ερμηνευτική μεταβλητή Χ αυξάνεται κατά μια μονάδα, η εξαρτημένη μεταβλητή Yˆ μεταβάλλεται cetersparbus κατάȃ 1 μονάδες. Γενικότερα,κάθεεκτιμημένοςσυντελεστήςȃ k «μετρά»τηνεπιρροήτηςσχετικής ερμηνευτικής μεταβλητής Χ k στη μεταβολή της εξαρτημένης μεταβλητής Y, θεωρώντας ότι, όλες οι άλλες μεταβλητές παραμένουν αμετάβλητες (ceters parbus).! 7
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-1. Χαρακτηριστικά των συντελεστών της ΜΕΤ Γραμμικότητα του συντελεστή όπου: w x = x x = X X y ( Y Y )( X X ) y. x a ˆ1 = = = w. y ( X X ) x = Y Y Οι εκτιμητές ΜΕΤ είναι B.L.U.E.(Best Lnear Unbased Estmator) Αμερόληπτοι εκτιμητές(unbased) E = [ aˆ1 ] a 1 Υποθέσεις [] και[5] απαραίτητες Έχουν τη μικρότερη δυνατή διακύμανση (effcent ) σ Y Var( aˆ 1) = σ aˆ = 1 ( X X ) με σ Y =σ ε Ο καλύτερος (best) εκτιμητής είναι αυτός που έχει τη μικρότερη δυνατή διακύμανση και αυτό εξασφαλίζεται όταν οι υποθέσεις [3] και [4] επιβεβαιώνονται: Gauss-Markov Theorem 8
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-1. Χαρακτηριστικά των συντελεστών της ΜΕΤ Οι συντελεστές ΜΕΤ είναι γραμμικές συναρτήσεις των παρατηρήσεων της εξαρτημένης μεταβλητής Οι συντελεστές ΜΕΤ ακολουθούν κανονική κατανομή υπό την προϋπόθεση ότι: Y N( aˆ + aˆ ; σ ) aˆ όπου σ σ Y ( X = aˆ 1 X ) Υπό αυτές τις συνθήκες, μπορούμε να ορίσουμε το (1-α)%Διάστημα εμπιστοσύνης για κάθε συντελεστή του μοντέλου aˆ 0 1X ε N( a ; σ 1 1 aˆ 1 1 t( n 1; α ) saˆ < a1 < aˆ 1+ ) ( n 1, α ) 1 ˆ1 t s a Το διάστημα αυτό αντανακλά την αβεβαιότηταπου περιβάλλει την ακρίβεια του εκτιμητή Τέλος είναι σημαντικό να εξετάζουμε σε ποιο βαθμό ο κάθε εκτιμητής είναι στατιστικά διαφορετικός από το μηδέν. Ο έλεγχος αυτός βασίζεται στη στατιστική του Student: t(n-1,a/) 9
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-. Αξιολόγηση των συντελεστών Σημειακός έλεγχος Υποθέσεις: Ho : aˆ1= 0 έναντι H1: aˆ1 0 1 Στατιστική(statstc of the test): t= (υπόθεση της κανονικότητας) σ Αν ισχύει Ho,τότε: t =, χρησιμοποιούμε τον εκτιμητή: σ aˆ1 Απόφαση: Αν t= aˆ 1 ˆ σ a ˆ1 a ˆ1 a ˆ1 a a ˆ1 > t (n-1,a/) (βλ.πίνακα)hoαπορρίπτεταιμεα%ρίσκο. Η απόρριψη της Ηο σημαίνει ότι, με στατιστικούς όρους, ο εκτιμητής είναι διαφορετικός από το μηδέν. Επομένως η ερμηνευτική μεταβλητή έχει επιρροή στην εξαρτημένη. ˆ σ a = s a ˆ1 ˆ1 Για να γνωρίζουμε σε ποιο βαθμό, η επιρροή είναι σημαντική, θα πρέπει να εξετάζουμε την p-value*(βαθμός αξιοπιστίας του αποτελέσματός μας) * Tα περισσότερα λογισμικά δίνουν αυτόματα την τιμή της p-value, και πρακτικά δεν θα έχουμε ανάγκη από το πίνακα του Student (!) 10
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-3. Συνολική Αξιολόγηση :[ANOVA], Ανάλυση της μεταβλητικότητας της εξαρτημένης μεταβλητής Υ ( Y Y) = ( Yˆ Y) + ( Y Yˆ ) SSΤ = SSE + SSR (N-1) (k-1) (Ν-k) Μεταβλητές Άθροισμα Τετραγώνων β.ε. Μέσοι Τετραγώνων SST Μέτρο της Συνολικής Διακύμανσης των παρατηρήσεων [Total Sum of Squares] N-1 SST/N-1 SSE SSR Μέτρο της Διακύμανσης που ερμηνεύεται από την Παλινδρόμηση [Explaned Sum of Squares] Μέτρο της Διακύμανσης που ΔΕΝ ερμηνεύεται από την Παλινδρόμηση (διακύμανση των καταλοίπων) [Unexplaned Sum of Squares] k-1 SSE/k-1 Ν-k SSR/N-k 11
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-4. Συνολική Αξιολόγηση (R καιr * ) Συντελεστής Προσδιορισμού R : % της συνολικής διακύμανσης που ερμηνεύεται από την παλινδρόμηση. Δεδομένου ότι: SST = SSE+ SSR SSE SST + SSR SST SSE = 1 = R SST 0 R 1 Διορθωμένος Συντελεστής Προσδιορισμού R * : λαμβάνει υπόψη (α) το μέγεθος και (β) τον αριθμό των ερμηνευτικών μεταβλητών διότι αυτά τα μεγέθηεπηρεάζουντηντιμήτουr. R * = 1 SSR /( N k) SST /( Ν 1) = 1 ˆ σ ε ˆ συ 1
B. Στατιστικοί έλεγχοι - Αξιολόγηση ΓΠΔ: γραμμή παλινδρόμησης του δείγματος 13
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-5. Σχέση μεταξύ R καιr * R * = 1 SSR /( N k) SST /( Ν 1) = 1 ( SST SSE) /( N _ k) SST /( N 1) R * = 1 (1 R ) N N 1 k R =1 R * =1 K>1 R * < R ότανοαριθμόςερμηνευτικώνμεταβλητώναυξάνεται, ο διορθωμένος συντελεστής αυξάνεται λιγότερο από τον απλό συντελεστή. R πάντα θετικός σε αντίθεση με R * που μπορεί να πάρει αρνητικές τιμές, ειδικά όταν η τιμή του απλού συντελεστή είναι χαμηλή. Σημαντικές διαφορές μεταξύ R και R * υποδηλώνουν πρόβλημα με τους βαθμούς ελευθερίας του υποδείγματος(ν-k) 14
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-6. Συνολική Αξιολόγηση : Έλεγχος Fsher Υποθέσεις: Ho : όλοιοι συντελεστές α 1 = α = = α k = 0 H1: Υπάρχει τουλάχιστον ένα α 0 Στατιστική(statstc of the test): SSE k 1 F = = SSR N k Απόφαση: ( Yˆ Y ) e N k k 1 ΑνF> F(k-1;N-k;α) (βλ.πίνακα)απόρριψητηςυπόθεσηςho (*). Ακόμα μια φορά, πιο σημαντική θα είναι η πληροφορία που μας προσφέρει η p-value του έλεγχου(βαθμός αξιοπιστίας του αποτελέσματός μας) (*) Πρακτικά δεν θα έχουμε ανάγκη από τους πίνακες (!), εφόσον θα εξετάζουμε κατευθείαν την p-value, στα αποτελέσματα 15
B. Στατιστικοί έλεγχοι - Αξιολόγηση B-7. Ερμηνεία του έλεγχου Fsher Ο έλεγχος του Fsher διαφέρει απόλυτα από το σημειακό έλεγχο του Student: Με το Student, ο έλεγχος αφορά την επίδραση ενός συγκεκριμένου συντελεστή στις τιμές της εξαρτημένης μεταβλητής. Ο έλεγχος Student εφαρμόζεται ξεχωριστά για κάθε ερμηνευτική μεταβλητή. Πρόκειται για σημειακή αξιολόγηση. Με το Fsher, ο έλεγχος μας επιτρέπει μόνο να εξετάζουμε σε ποιο βαθμό υπάρχει μια συνδυασμένη επίδραση των ερμηνευτικών μεταβλητών στις τιμές της εξαρτημένης μεταβλητής. Πρόκειται για συνολική αξιολόγηση. 16
ΕΦΑΡΜΟΓΗ: ΑΠΛΟ ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ 17
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ 1. Θεωρητικό μοντέλο του Feldsten& Horoka (1980) Στόχος: Υπόθεση: Μοντέλο: Μεταβλητές: «Εκτίμηση του βαθμού κινητικότητας του διεθνής κεφαλαίου μακροπρόθεσμα». Η κινητικότητα του κεφαλαίου σε διεθνές επίπεδο θα έπρεπε να σημαίνει ότι, όταν αυξάνεται η δυνατότητα εγχώριας αποταμίευσης, τότε οι εγχώριες επενδύσεις αυξάνουν σε μικρότερο ποσοστό, επιβεβαιώνοντας ότι, ένα τμήμα των αποταμιεύσεων επενδύονται στη διεθνή αγορά. Η εξειδίκευση της συνάρτησης είναι η ακόλουθη (μακροπρόθεσμα σχέση): I S Υπόθεση: Y = b + b Y Inv= Ι/Y= Αναλογία ακαθαρίστων επενδύσεων προς το ΑΕΠ για κάθε χώρα (μέσος δείκτης για τις εξεταζόμενες περιόδους). Sav = S/Y= Αναλογία ακαθαρίστων αποταμιεύσεων προς το ΑΕΠ της χώρας (μέσος δείκτης για τις εξεταζόμενες περιόδους). Παρατηρήσεις: 16 χώρες του ΟΟΣΑ με 4 περιόδους ανάλυσης: 1960-1974, 1960-64, 1965-69, 1970-74. +ε ˆ1<. 0 1 b 1 Feldsten M., HorakaC., (1980), Domestc savng and nternatonal captal flows, Economc Journal, No 90, pp 314-39 18
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ Αποτελέσματα του απλού μοντέλου του Feldsten& Horoka (1980) (*) Οι Feldsten & Horoka ανέδειξαν ότι, ο συντελεστής b 1 του υποδείγματος είναι μικρότερος από 1, αποτέλεσμα που θα σήμαινε ότι, η αύξηση των δυνατοτήτων εγχώριας αποταμίευσης δεν προκαλεί αντίστοιχη αύξηση των εγχωρίων επενδύσεων. Κατά συνέπεια, αυτό το γεγονός θα σήμαινε ότι υπάρχει κινητικότητα του διεθνές κεφαλαίου. Σε παρένθεση, τα τυπικά σφάλματα των εκτιμήσεων Ερώτηση: ο συντελεστής ˆb 1 είναι στατιστικά διαφορετικός από 1; (*) Μετά από την ανάλυση του απλού μοντέλου, οι Feldsten και Horaka παρουσιάζουν όντως πιο συνθετικό μοντέλο, βασισμένο σε πολλαπλή παλινδρόμηση 19
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ Επιβεβαίωση της υπόθεσης των Feldsten& Horoka; Σε ποιο βαθμό(με στατιστικούς όρους) μπορούμε να στηρίξουμε ότι ο συντελεστής είναι διαφορετικός από το 1; Υποθέσεις: Ηο: ˆb 1 = 1 έναντι Η1: ˆb 1 1 Δίπλευρος έλεγχος Στατιστική: t 1 ˆ 1 1 = b ˆ σ 1 Υπολογισμός της στατιστικής για τις 4 περιόδους: Απόφαση: t 1 < t(n-k;a/) Ισχύει Ηο Ν = 16 χώρες, k=, Ν-k=14 Για α = 5%, t(n-k; a/) = t(14; 0,05) =,145 Συμπέρασμα: Επιβεβαιώνεται η υπόθεση Ηο;. 0
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ. Εφαρμογή του μοντέλου με νέα δεδομένα Δεδομένα: LECTURE.xls Φύλλο εργασίας: Feldsten_Horoka_Model, Range:(A1:E0)* Μοντέλο: Η εξειδίκευση της συνάρτησης είναι ακριβώς αυτή που προτείνουν οι Feldsten& Horoka: I Y S = b + b. 1 +ε Υπόθεση για έλεγχο: b 1 0 ˆ1< Y Μεταβλητές: Inv= Ι/Y= Αναλογία ακαθαρίστων επενδύσεων προς το ΑΕΠ για κάθε χώρα (μέσος δείκτης για την εξεταζόμενη περίοδο). Sav = S/Y= Αναλογία ακαθαρίστων αποταμιεύσεων προς το ΑΕΠ της χώρας (μέσος δείκτης για την εξεταζόμενη περίοδο). Παρατηρήσεις: 19 χώρες του ΟΟΣΑ για την περίοδο ανάλυσης: 1970-1998 Πηγή: ΟΟΣΑ * η πρώτη γραμμή του φύλλου εργασίας περιλαμβάνει τα ονόματα των μεταβλητών 1
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ Τα δεδομένα : από Excel στο SPSS * Το SPSSδιαβάζει απευθείας τα δεδομένα που είναι σε Excel. Αρκεί η πρώτη γραμμή του φύλλου εργασίας να περιλαμβάνει τα ονόματα των μεταβλητών τα οποία εμφανίζονται στο στη γραμμή χωρίς αριθμό.
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ Οι εντολές για την απλή γραμμική παλινδρόμηση Εντολές για την εφαρμογή της γραμμικής παλινδρόμησης με SPSS: Analyze > Regresson > Lnear Dependent: Inv Independent(s): Sav Statstcs: Estmates Confdence Intervals Model Ft R squared change Descrptves Optons: Include constant n equaton 3
ΔΙΜΕΤΑΒΛΗΤΟ ΥΠΟΔΕΙΓΜΑ Παραγωγή αποτελεσμάτων - ερμηνεία Ποια τα συμπεράσματα σας; 4
ΕΠΙΣΤΡΟΦΗ ΣΤΙΣ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ 5
Επιστροφή στη Στατιστική. Δίπλευρος και μονόπλευρος Έλεγχος Τύπος έλεγχου Υπόθεση μηδέν Ηο Εναλλακτική υπόθεση Η1 Απόφαση: Ισχύει η υπόθεση Ηο όταν: Δίπλευρος ȃ 1 = a ȃ 1 a t < t(n-k; α/) Αριστερός Μονόπλευρος ȃ 1 = a ȃ 1 <a t < t(n-k; α) Δεξιός Μονόπλευρος ȃ 1 = a ȃ 1 >a t < t(n-k; α) aˆ 1 a Όπου t= και ˆ σ aˆ 1= εκτιμητής του τυπικού σφάλματος του συντελεστή ˆ σ aˆ1 Γιατί α/ στο Δίπλευρο έλεγχο; ΑνισχύειηυπόθεσηΗο,τότεέχουμεȃ 1 a=0 επομένως υπάρχει ένα Δ.Ε. μέσα στον οποίο βρίσκεται η μηδενική αυτή διαφορά. 6
Επιστροφή στη Στατιστική. Δίπλευρος και μονόπλευρος Έλεγχος Μπορούμε να στηρίξουμε ότι, ο συντελεστής ȃ 1 της παλινδρόμησης που εφαρμόσαμε (ȃ 1 = 0,636) είναι στατιστικά μικρότερος από την τιμή 1; Υποθέσεις: Ηο: ȃ 1 = 1 έναντι Η1: ȃ 1 < 1 Αριστερός μονόπλευρος έλεγχος Στατιστική: bˆ 1 t = ˆ σ 1 0,63 1 0,18 1 = =,934 Πίνακας: t(n-k;a) = t(17;0,05) = 1,740 Απόφαση: t > t(17;0,05) η Υπόθεση Ηο δεν είναι δεκτή, ισχύει η Η 1 : ο συντελεστής είναι < 1, δηλαδή η αύξηση της εγχώριας αποταμίευσης δεν προκαλεί αναλογική αύξηση των εγχωρίων επενδύσεων. 7