Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα
Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε μια πρώτη ιδέα για το αν και πώς δυο μεταβλητές συσχετίζονται, είναι να κατασκευάσουμε το διάγραμμα διασποράς (Scatter dagram ή Scatter plot). Να αναπαραστήσουμε δηλαδή τα ζεύγη των παρατηρήσεων σε ένα διάγραμμα.
Διάγραμμα Διασποράς Παράσταση σημείων (x,y ) σε σύστημα συντεταγμένων Χ και Υ. Το νέφος των σημείων που δημιουργείται ονομάζεται διάγραμμα διασποράς.
Διάγραμμα Διασποράς Φαίνονται οι παρατηρήσεις που πήραμε για το ύψος και το βάρος 6 εργατών μιας βιομηχανίας. Από το διάγραμμα διασποράς ποια είναι η σχέση μεταξύ του ύψους και του βάρους των εργατών;
Διάγραμμα Διασποράς Παράδειγμα βλέπε gretl Χ 2 3 4 5 Υ 3 7 5 4
Διάγραμμα Διασποράς
Συνδιακύμανση δύο τ.μ. Σε πολλές περιπτώσεις μας ενδιαφέρει να εξετάσουμε περισσότερα από ένα χαρακτηριστικά του πληθυσμού τα οποία είναι πιθανό να αλληλοεξαρτώνται. Για παράδειγμα η τιμή και η ποιότητα ενός προϊόντος. Στις περιπτώσεις αυτές μας ενδιαφέρει να ορίσουμε την συνδυασμένη συμπεριφορά δύο ή περισσοτέρων τ.μ.
Συνδιακύμανση δύο τ.μ. Η συνδιακύμανση των Χ,Υ στον πληθυσμό δίνεται από τον τύπο: Cov( X, Y) E[( X x)( Y Y )] Όταν αναφερόμαστε σε δείγμα μεγέθους ν η δειγματική διακύμανση ισούται με: ( x x)( y y) Cov( X, Y ) ( xyvxy) v v
Συνδιακύμανση δυο τ.μ. Αν Cov( X, Y ) 0 τότε έχουμε θετική συσχέτιση μεταξύ των Χ, Υ, δηλαδή όταν αυξάνεται (μειώνεται) η τιμή της Χ αυξάνεται(μειώνεται) και η τιμή της Υ. Αν Cov( X, Y ) 0 τότε έχουμε αρνητική συσχέτιση μεταξύ των Χ, Υ, δηλαδή όταν αυξάνεται η τιμή της Χ μειώνεται η τιμή της Υ. Αν Cov( X, Y ) 0 τότε οι μεταβλητές Χ,Υ είναι ανεξάρτητες.
Συντελεστής Συσχέτισης (Pearson) Καταλληλότερο μέτρο του βαθμού εξάρτησης δύο μεταβλητών είναι ο (πληθυσμιακός) συντελεστής συσχέτισης ο οποίος ορίζεται ως εξής: ( X, Y ) Cov( X, Y ) x Y Εάν ρ(χ,υ)=0 οι τ.μ. Χ, Υ ονομάζονται ασυσχέτιστες. Ισχύει - ρ(χ,υ), δηλαδή ο συντελεστής συσχέτισης παίρνει τιμές μεταξύ του - και του.
Συντελεστής Συσχέτισης Ο δειγματικός συντελεστής συσχέτισης Όταν αναφερόμαστε σε δείγμα μεγέθους n ο δειγματικός συντελεστής συσχέτισης r δίνεται από την σχέση: r ( x x)( s x s y y y)
Συντελεστής Συσχέτισης Ο προηγούμενος τύπος έχει ως εξής: n n n y y x x y y x x Y X r 2 2 ) ( ) ( ) )( ( ), (
Συντελεστής συσχέτισης-διάγραμμα Διασποράς
Απλή Γραμμική Παλινδρόμηση Στοχαστική σχέση μεταξύ των μεταβλητών Χ και Υ με ζεύγη τιμών (x, y ). Y b0 b X Χ: ανεξάρτητη μεταβλητή (ndependent varable) και Υ:εξαρτημένη μεταβλητή (dependent varable) b 0 :ο σταθερός όρος και εκφράζει την τιμή του Υ για Χ=0. b : συντελεστής παλινδρόμησης (κλίση), εκφράζει την οριακή μεταβολή του Υ στην μεταβολή του Χ κατά μία μονάδα. u
Απλή Γραμμική Παλινδρόμηση u Διαταρακτικός όρος. Μας δείχνει πόσο μακριά από την ευθεία βρίσκεται κάποια παρατήρηση. Περιλαμβάνει: Ερμηνευτικές μεταβλητές που επηρεάζουν την Υ αλλά δεν συμπεριλήφθηκαν στο μοντέλο. Σφάλματα μέτρησης. Σφάλματα που προέρχονται από την λανθασμένη διατύπωση της εξίσωσης παλινδρόμησης.
Απλή Γραμμική Παλινδρόμηση b Y X Κύριο ενδιαφέρον στην ανάλυση παλινδρόμησης ο συντελεστής b Προσδιορίζει όχι μόνο την ποιοτική σχέση μεταξύ των Χ, Υ αλλά και την ποσοτική.
Απλή Γραμμική Παλινδρόμηση Στόχος της παλινδρόμησης είναι η εύρεση της πληθυσμιακής γραμμής παλινδρόμησης με τη χρήση του διαθέσιμου στατιστικού τυχαίου δείγματος των n παρατηρήσεων. Η πληθυσμιακή γραμμή παλινδρόμησης είναι η ευθεία που διαμορφώνεται από την υπό συνθήκη μέση τιμή της μεταβλητής Υ σε κάθε επίπεδο της μεταβλητής Χ, δηλαδή: E( Y / X ) b b X E( u 0 Προσοχή!! Πως η μέση τιμή του Υ αλλάζει με το Χ. / X ) 0
Απλή Γραμμική Παλινδρόμηση (Σχήμα βλ. Wooldrdge, σελ. 26)
Υποθέσεις Κλασσικού Μοντέλου Παλινδρόμησης Γραμμικότητα: Η σχέση των Χ, Υ είναι γραμμική. Η u είναι τ.μ. με τις ιδιότητες: Η μέση τιμή του ισούται με 0: E(u)=0 Σταθερή διακύμανση:var(u)=σ 2 Συνδιακύμανση ίση με το 0: Cov( u, u j ) 0 Κανονική κατανομή: u~n(0, σ 2 ) Οι τιμές της Χ είναι καθορισμένες και ελεγμένες από τον ερευνητή.
Υποθέσεις Κλασσικού Μοντέλου Παλινδρόμησης Βασική υπόθεση: E( u / X ) E( u) 0
Μέθοδος των ελαχίστων τετραγώνων Στόχος: Η εκτίμηση της πληθυσμιακής γραμμής παλινδρόμησης και επομένως των συντελεστών που την προσδιορίζουν. Οι εκτιμητές συμβολίζονται με: b ˆ 0, b ˆ Αποτελούν συντελεστές της εξίσωσης: ˆ b ˆ b ˆ X ˆ, bˆ b o Y Y b 0 bˆ 0 b bˆ X X u uˆ Y o Κατάλοιπο ή σφάλμα της εκτίμησης: û
Μέθοδος των ελαχίστων τετραγώνων Σύμφωνα με αυτή τη μέθοδο η ευθεία που προσαρμόζεται καλύτερα στα δεδομένα (τα n σημεία στο επίπεδο) είναι αυτή που ελαχιστοποιεί το άθροισμα τετραγώνων των σφαλμάτων.
Μέθοδος των ελαχίστων τετραγώνων
Μέθοδος των ελαχίστων τετραγώνων Άθροισμα Τετραγώνων Σφαλμάτων( Sum of Squared Errors) 0 ˆ 0 ˆ ) ˆ ˆ ( ) ˆ ( ) ( ˆ 0 2 0 2 2 b SSE b SSE X b b Y Y Y u SSE n n n
Κανονικές Εξισώσεις n n n n n X b X b X Y X b nb Y 2 0 0 ˆ ˆ ˆ ˆ
Από την λύση των κανονικών εξισώσεων έχουμε: bˆ 0 Y bˆ X n bˆ ( X n ( X X )( Y X ) 2 Y )
Εναλλακτικά οι παραπάνω τύποι n XX n XY n n X X S Y Y X X S X n X Y n Y ύ 2 ) ( ) (, : X S S Y b S S b XX XY XX XY 0 ˆ ˆ
Ευθεία παλινδρόμησης Η ευθεία παλινδρόμησης της Υ πάνω στη Χ ή ευθεία ελαχίστων τετραγώνων. ˆ ˆ ˆ y bo b x ˆb 0 Εκφράζει την αναμενόμενη τιμή της μεταβλητής Υ όταν η Χ πάρει την τιμή 0. ˆb Εκφράζει τη μεταβολή της Υ όταν η Χ μεταβάλλεται κατά μία μονάδα. Κλίση της ευθείας παλινδρόμησης- Ρυθμός μεταβολής.
Παράδειγμα ο (6.2) Για τα δεδομένα του παρακάτω πίνακα να βρεθεί η ευθεία ελαχίστων τετραγώνων και να ερμηνευθούν οι σχετικοί συντελεστές. Χ 2 4 6 8 0 Υ 7 2 7 23
Παράδειγμα ο :Να συμπληρωθούν οι πίνακες Χ Υ ΧΥ Χ 2 Χ Υ Yˆ û
Παράδειγμα ο gretl
Παράδειγμα 2 ο Στον πίνακα δίνονται οι τιμές για δύο μεταβλητές, βαθμός στις εξετάσεις με άριστα το 4(GPA) και ώρες προετοιμασίας (ACT) για 8 φοιτητές. Να εκτιμήσετε τη σχέση μεταξύ των δυο μεταβλητών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Πόσο υψηλότερος αναμένεται να είναι το GPA αν οι ώρες προετοιμασίας αυξηθούν κατά 5;
Παράδειγμα 2ο
Παράδειγμα 3ο
Παράδειγμα 3ο
Παράδειγμα 4 ο Στα παρακάτω δεδομένα να εκτιμήσετε με χρήση της μεθόδου των ελαχίστων τετραγώνων τη σχέση μεταξύ των δυο μεταβλητών. Να ερμηνευθούν οι σχετικοί συντελεστές.
Παράδειγμα 4ο
Βιβλιογραφία Εισαγωγή στη σύγχρονη οικονομετρική ανάλυση Συγγραφείς:Κατρακυλίδης Κωνσταντίνος, Κοντέος Γεώργιος, Σαριαννίδης Νικόλαος J. Μ. Wooldrdge, Introductory Econometrcs: A Modern Approach, 2nd Edton.