ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 13-11-015 Εισαγωγή στην Γραμμική Παλινδρόμηση Γραμμική σχέση μεταξύ μεταβλητών Αν. Καθ. Μαρί-Νοέλ Ντυκέν
Στόχος Πολύ συχνά, η Τ.Μ. που εξετάζουμε π.χ. η κατανάλωση των νοικοκυριών εξαρτάται με κάποιον τρόπο από μια ή περισσότερες άλλες μεταβλητές. Είναι γνωστό ότι, ως ένα βαθμό, οι δαπάνες κατανάλωσης των νοικοκυριών εξαρτώνται από το εισόδημα τους βλέπε συνάρτηση κατανάλωσης του Keynes. Η γραμμική παλινδρόμηση είναι μια μέθοδος ανάλυσης και εκτίμησης της σχέσης μεταξύ ή περισσότερων μεταβλητών. Η γραμμική παλινδρόμηση συμβάλλει στην ερμηνεία της συμπεριφοράς μιας εξαρτημένης μεταβλητής dependent : με βάση μιας ερμηνευτικής μεταβλητής Χ ή πολλαπλών ερμηνευτικών μεταβλητών ndependent 1,, k. Ανάλυση της αιτιώδης επίδρασης των ερμηνευτικών μεταβλητών στην εξαρτημένη μεταβλητή. Σε ποιο βαθμό η μεταβολή της ερμηνευτικής μεταβλητής Χ προκαλεί συγχρόνως μεταβολή της μεταβλητής Υ;
Θεωρητική εμπειρική σχέση 0 + 1 1,, n Θεωρητική σχέση [1] Η ανάλυση βασίζεται σε n παρατηρήσεις οι οποίες μπορεί να αφορούν περιόδους π.χ. έτη, μήνες, επιχειρήσεις, αγροτικές εκμεταλλεύσεις, νοικοκυριά ή ακόμα διοικητικές - χωρικές ενότητες. Π.χ. Συνάρτηση κατανάλωσης: C t c o + c 1.R t t 000,. 013 14 παρατηρήσεις Επομένως, με βάση τα δεδομένα που διαθέτουμε, θέλουμε να εκτιμήσουμε τους δύο άγνωστους συντελεστές o & 1. Δεδομένου ότι, πρόκειται για εκτίμηση, η εξαρτημένη μεταβλητή δεν μπορεί να εξηγείται κατά 100% από την ή τις επιλεγμένες ερμηνευτικές μεταβλητές ε διαταρακτικός όρος - κατάλοιπο resdul 0 + 1 + ε 1,, n Εμπειρική σχέση [] Δεχόμαστε ότι, μεταξύ των παρατηρήσεων πραγματικά δεδομένα και των εκτιμήσεων, υπάρχουν αποκλίσεις.
Υποθέσεις 1 Η σχέση μεταξύ Υ και είναι γραμμική, 0 + 1 + ε 0 και 1 : άγνωστοι συντελεστές : πρέπει να τους εκτιμήσουμε Μέση τιμή των καταλοίπων: ε E 0 E / 0 + 1 3 Η διακύμανση των καταλοίπων πρέπει να παραμένει σταθερή Vr ε σ ε 4 Το κατάλοιπο για μια παρατήρηση δεν πρέπει να συσχετίζεται με τα άλλα κατάλοιπα. Μη αυτοσυσχέτιση, Non utocorrelton: Cov ε, ε j 0 j
Μέθοδος των Ελάχιστων Τετραγώνων Ο προσδιορισμός των συντελεστών 0 και 1 της ευθείας παλινδρόμησης βασίζεται στην Ελαχιστοποίηση του αθροίσματος των καταλοίπων στο τετράγωνο. η Μ.Ε.Τ. Mn Mn Mn S Λύση: Οι συνθήκες της 1 ης και της ης τάξης ικανοποιούνται. Η ελαχιστοποίηση της συνάρτησης S δίνεται από: Έχουμε ένα σύστημα με άγνωστες και εξισώσεις που μας δίνει τελικά: ε ε + + 1 0 1 0 ε 1 0 ε o 1 o 1 0 0 1 S S o και 1, ˆ Vr Cov n n o 1 ˆ Εκτιμήσεις των συντελεστών της ευθείας παλινδρόμησης
Πρώτα συμπεράσματα Η ευθεία παλινδρόμηση που έχουμε εκτιμήσει, περνάει από το σημείο που λέγεται κέντρο βάρους των δεδομένων., Cov, Vr Ο συντελεστής ˆ είναι η κλίση της ευθείας 1 Ο συντελεστής ˆ είναι η τομή της ευθείας. 1 0 ˆ Το μέτρο συσχέτισης μεταξύ των μεταβλητών δίνεται από τον συντελεστή συσχέτισης r,. r, όπου 1, + 1 r
Συνολική αξιολόγηση της παλινδρόμησης ˆ + ˆ Απόκλιση της τιμής Υ από τον μέσο Απόκλιση της τιμής Υ από την εκτίμηση που προέκυψε από την παλινδρόμηση Απόκλιση της εκτιμωμένης τιμής από τον μέσο ˆ + ˆ ΑΤΠ + ΑΤΚ N-1 k-1 Ν-k
Συνολική αξιολόγηση της παλινδρόμησης ˆ + ˆ ΑΤΠ + ΑΤΚ N-1 k-1 Ν-k Μεταβλητές Άθροισμα Τετραγώνων β.ε. Μέσοι Τετραγώνων Μέτρο της Συνολικής Διακύμανσης των παρατηρήσεων [Totl Sum of Squres] N-1 /N-1 ΑΤΠ ΑΤΚ Μέτρο της Διακύμανσης που ερμηνεύεται από την Παλινδρόμηση [Explned Sum of Squres] Μέτρο της Διακύμανσης που ΔΕΝ ερμηνεύεται από την Παλινδρόμηση διακύμανση των καταλοίπων [Unexplned Sum of Squres] k-1 ΑΤΚ/k-1 Ν-k ΑΤΠ/N-k
Συνολική αξιολόγηση της παλινδρόμησης Συντελεστής Προσδιορισμού R : % της συνολικής διακύμανσης που ερμηνεύεται από την παλινδρόμηση. Δεδομένου ότι: ΑΤΠ + ΑΤΚ ΑΤΠ + ΑΤΚ ΑΤΠ 1 R 0 R 1
Έλεγχος του Fsher Υποθέσεις: Ho : όλοι οι συντελεστές α 0 α 1 0 H1: Υπάρχει τουλάχιστον ένα α 0 Στατιστική sttstc of the test: F ΑΤΠ ΑΤΚ Απόφαση: k N 1 k ˆ e N k Αν F > Fk-1;N-k;α βλ. πίνακα Απόρριψη της Υπόθεσης Ho. k Ακόμα μια φορά, πιο σημαντική θα είναι η πληροφορία που μας προσφέρει η p-vlue του έλεγχου βαθμός αξιοπιστίας του αποτελέσματός μας Αν η P-vlue < 0,05 5% Απόρριψη της Υπόθεσης Ho, δεχόμαστε Η1. 1
ΑΝΑΛΥΣΗ ΜΕ SPSS Τα δεδομένα : 3_Παλινδρόμηση.xls Υ Εξαρτημένη μεταβλητή Τελική Κατανάλωση της Ελλάδας για την περίοδο 000-008 Χ Ανεξάρτητη μεταβλητή ερμηνευτική Εθνικό Εισόδημα Τα δεδομένα εκφράζονται σε δισεκατομμύρια Αριθμός παρατηρήσεων Ν 9 Εντολή: Anlyze > Regresson > Lner