ΑΚΡΑΙΕΣ ΤΙΜΕΣ ΣΤΗΝ ΠΑΛΙΝ ΡΟΜΗΣΗ

Σχετικά έγγραφα
Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΠΡΟΒΛΗΜΑ ΣΥΓΓΡΑΜΜΙΚΟΤΗΤΑΣ

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ

Το πρόγραμμα συγχρηματοδοτείται 75% από το Ευρωπαϊκό κοινωνικό ταμείο και 25% από εθνικούς πόρους.

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΜΜΚ 105: Πειραματική και Στατιστική Ανάλυση Δημιουργία Πινάκων και Γραφικών Παραστάσεων στην Excel 18/09/14

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Παράδειγμα 1 Προσαρμόζω το μοντέλο χωρίς quarter

1. Θα χρησιμοποιηθεί το αρχείο Ο γονικός έλεγχος στην εφηβική ηλικία. Στο. i. Με ποιες μεταβλητές που αφορούν σε σχέσεις εφήβων με τους γονείς τους

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 3ο 2 + +

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών


Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΜΑΘΗΜΑ 2 ο. ΗχρήσητουπακέτουEviews (Using Eviews econometric package)

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΦΥΛΛΟ ΑΠΑΝΤΗΣΗΣ 3 ης ΕΡΓΑΣΙΑΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΣΥΣΧΕΤΙΣΗ CORRELATION

Εισόδημα Κατανάλωση

Περιεχόμενα. Πρόλογος... 15

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Γ. Πειραματισμός - Βιομετρία

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Καθορισμός μεταβλητών και εισαγωγή δεδομένων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Περιεχόμενα. Πρόλογος... v

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Επεξεργασία πολλαπλών φύλλων εργασίας - Γραφημάτων Excel

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

SPSS Statistical Package for the Social Sciences

Άσκηση 6 Ώθηση δύναμης Μεταβολή ορμής

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Ενότητα 15 Μορφοποίηση της Γραφικής Παράστασης

E [ -x ^2 z] = E[x z]

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Πολλαπλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 7 (συνέχεια)

F x h F x f x h f x g x h g x h h h. lim lim lim f x

Συναρτήσεις Θεωρία Ορισμοί - Παρατηρήσεις

Παρουσίαση Libreoffice. Βασίλειος Καραβασίλης Μονάδα Αριστείας ΕΛΛΑΚ ΕΤΕΠΗ 27/04/2015

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Φύλλο Εργασίας για την y=αx 2

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Συνδυασμός Μαθηματικών με γραφικές παραστάσεις

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Οικονομετρία Ι. Ενότητα 6: Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Μελέτη της απόδοσης φωτοβολταϊκού στοιχείου Πειραματική διαδικασία 1/5. Προκαταρκτικές ρυθμίσεις

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

Άσκηση 1. Πληθυσμός (Χ i1 )

Σκοπός του μαθήματος

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

CTEC-153: ΥΤΛΛΑ ΕΡΓΑΙΑ

Η ΠΡΟΣΦΟΡΑ ΤΩΝ ΑΓΑΘΩΝ

Τεχνικές Προβλέψεων. 2η Ενότητα Προετοιμασία & Ανάλυση Χρονοσειράς

Κατασκευή µοντέλου και προσοµοίωσης: Μελέτη ελεύθερης πτώσης

Γενικές Παρατηρήσεις για τις Εργαστηριακές Ασκήσεις Φυσικοχηµείας

Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 4 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας)

ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΜΕ ΕXCEL

QS-LIS

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2010 ΕΚΦΩΝΗΣΕΙΣ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Transcript:

ΑΚΡΑΙΕΣ ΤΙΜΕΣ ΣΤΗΝ ΠΑΛΙΝ ΡΟΜΗΣΗ ΤΡΟΠΟΙ ΕΛΕΓΧΟΥ ΤΡΟΠΟΙ ΑΝΤΙΜΕΤΩΠΙΣΗΣ ΣΥΝΕΠΕΙΕΣ ΠΡΟΒΛΗΜΑΤΟΣ ΠΑΡΑ ΕΙΓΜΑΤΑ 1

Ακραίες παρατηρήσεις Γνώρισμά τους η μη προσαρμογή σε κάποιο μοντέλο που φαίνεται να προσαρμόζεται σωστά το κύριο σώμα των παρατηρήσεων. 2

ΤΡΟΠΟΙ ΕΛΕΓΧΟΥ Παρατηρήσεις με απόλυτες τιμές των τυποποιημένων υπολοίπων μεγαλύτερες του 3 θεωρούνται ακραίες *. Παρατηρήσεις με απόλυτες τιμές των τυποποιημένων υπολοίπων μεταξύ του 2 και 3 θεωρούνται πιθανές ακραίες και χρήζουν εξέτασης. Στατιστικός τρόπος ελέγχου. 3

Στατιστικός τρόπος ελέγχου. Επιτυγχάνεται με τα Μαθητικοποιημένα ιαγραφόμενα Υπόλοιπα. Απόλυτες τιμές των μαθητικοποιημένων διαγραφόμενων υπολοίπων για μία παρατήρηση μεγαλύτερες του IDF.T(1-a/2,n-p- 2), δηλαδή του t a /2, n p 2 υποδεικνύουν τη συγκεκριμένη παρατήρηση ως ακραία. 4

ΑΝΕΞΑΡΤΗΤΕΣ- ΑΚΡΑΙΕΣ Η εξέταση της ύπαρξης ακραίων τιμών λόγω μίας ή περισσότερων ανεξάρτητων μεταβλητών επιτυγχάνεται μέσω των ποσοτήτων Leverage, που δίνονται από τη σχέση: ( ' ) 1 h = x X X x ' ii i i Επισημαίνονται παρατηρήσεις με τιμές αυτού του δείκτη μεγαλύτερες του ( p + ) 2 1 n 5

Leverage Το λογισμικό μας εφοδιάζει με τις centered leverage δηλ. τις * 1 = hii οπότε συγκρίνεται με την τιμή ιαφοροποίηση cut off point h ii 2 p n 3 p n n 6

Multivariate outliers Cook Distance: Μας καθορίζει πόσο οι τιμές των υπολοίπων όλων των περιπτώσεων θα μεταβληθούν αν η συγκεκριμένη τιμή δε ληφθεί υπόψη στους υπολογισμούς των συντελεστών του μοντέλου Cut-off point: 1 ή 4/(n-p) ή 4/[n-p-1]] IDF.F(1-a,p+1,n-p-1)= F ap, + 1, n p 1 7

Cook s Distance C i = 2 ei hii p + 11 h ii 8

Multivariate Outliers Mahalanobis Distance Παρατηρήσεις με μεγάλες τιμές της απόστασης Mahalanobis θα πρέπει να εξετάζονται. 9

ΙΟΡΘΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ Εξέταση μήπως πρόκειται για λάθος καταγραφή ή δεν ορίστηκε η κωδική ονομασία των ελλιπών τιμών Απόρριψη ακραίων τιμών? Μετασχηματισμός για διόρθωση του προβλήματος. Χρήση ανθεκτικών μεθόδων σε ακραίες τιμές (Huber (1973) 10

ΣΥΝΕΠΕΙΕΣ Οι εκτιμητές και οι διακυμάνσεις αυτών δεν έχουν τις γνωστές ιδιότητες Ίσως προκαλείται και πρόβλημα κανονικότητας Μη εγκυρότητα των ελέγχων υποθέσεων και.ε. 11

Επηρεάζουσες παρατηρήσεις Πειραματικές μονάδες που επιδρούν σημαντικά στο μοντέλο παλινδρόμησης. Π.χ. οι συντελεστές των παραμέτρων του μοντέλου αλλάζουν αρκετά όταν οι τιμές των συγκεκριμένων πειραματικών μονάδων εξαιρούνται από τον υπολογισμό τους. Μία τέτοια κατάσταση είναι ανεπιθύμητη καθώς θέλουμε ένα μοντέλο παλινδρόμησης που να μην εξαρτάται από τις τιμές ενός μικρού αριθμού πειραματικών μονάδων. 12

Επηρεάζουσες- Τρόποι ελέγχου Linear Regression Save DfBeta(s): Η διαφορά στις τιμές των συντελεστών της παλινδρόμησης αν δεν ληφθεί υπόψη η συγκεκριμένη πειραματική μονάδα. Υπολογίζεται και για τον σταθερό όρο. Οι τυποποιημένες τιμές παρατίθενται στη στήλη Standardized DfBeta. Απόλυτες τιμές αυτών μεγαλύτερες από 2/ n μας υποδεικνύουν παρατήρηση που επιδρά στην εκτίμηση των συντελεστών της παλινδρόμησης. 13

Επηρεάζουσες- Τρόποι ελέγχου DfFit: Linear Regression Save t i 1 Μετρά την διαφορά στην προσαρμογή, δηλαδή στην εκτιμώμενη τιμή, αν δεν συμπεριληφθεί η συγκεκριμένη παρατήρηση στους υπολογισμούς. ίνονται και οι αντίστοιχες τυποποιημένες τιμές Standardized DfFit. Απόλυτες τιμές αυτών μεγαλύτερες του υποδεικνύουν επηρεάζουσες παρατηρήσεις. h 2 ii h ii 1/2 p + n 1 14

Επηρεάζουσες- Τρόποι ελέγχου Linear Regression Save Covariance ratio: Το πηλίκο της ορίζουσας του πίνακα διακυμάνσεων συνδιακυμάνσεων χωρίς η συγκεκριμένη παρατήρηση να λαμβάνεται υπόψη στους υπολογισμούς προς την αντίστοιχα ορίζουσα όταν λαμβάνεται υπόψη. Τιμές μεγαλύτερες (μικρότερες αντίστοιχα) του 1 1 3 p + + 1 1 3 p + n n υποδεικνύουν επηρεάζουσα παρατήρηση. 15

Υλοποίηση μεθόδων με cut-off point Υπολογισμός του cut-off point. ημιουργία στήλης με αύξοντες αριθμούς παρατήρησης. Συνάρτηση $CASENUM. Γραφική παράσταση των διαγνωστικών μέτρων ως προς τη νέα μεταβλητή. Graphs Legacy Dialog Scatter/Dot και Simple Scatter. 16

Υλοποίηση μεθόδων με cut-off point Κάνοντας διπλό κλικ στο γράφημα που προκύπτει και έπειτα δεξί κλικ ζητούμε να Add Y Axis Reference Line και στο πλαίσιο Position δηλώνουμε την τιμή του cut-off point. Αν υπάρχουν σημεία πάνω από αυτή την γραμμή με δεξί κλικ και επιλογή του Show Data Labels μας υποδεικνύεται ποια παρατήρηση είναι (εναλλακτικά αφού το επιλέξουμε με δεξί κλικ και επιλογή του Go to Case). 17

Παράδειγμα Chatterjee and Price (1980), p. 21 Στο αρχείο δεδομένων chatterjee21.sav καταγράφονται 30 παρατηρήσεις και 2 μεταβλητές που αφορούν την ακροαματικότητα πριν το δελτίο ειδήσεων (lead in) και την ακροαματικότητα του δελτίου ειδήσεων (newsrate). Θέλουμε να εξετάσουμε αν το πρόγραμμα πριν τις ειδήσεις επηρεάζει την ακροαματικότητα των ειδήσεων. 18