Το πρόβλημα Μία από τις ανεξάρτητες μεταβλητές μπορεί να εκφραστεί ως γραμμική συνάρτηση μιας ή περισσοτέρων εκ των υπολοίπων ανεξάρτητων μεταβλητών. Παραβιάζεται η σχετική υπόθεση Στην περίπτωση αυτή Τέλεια Πολυσυγγραμμικότητα ο όρος [ ] του β [ ] Y είναι αδύνατο να υπολογιστεί αφού η ορίζουσα του είναι μηδενική [ ]
Πρόβλημα δημιουργεί όχι μόνο η τέλεια αλλά και η υψηλή πολυσυγραμμικότητα. Όταν δηλαδή μεταξύ μιας ανεξάρτητης μεταβλητής και ενός γραμμικού μετασχηματισμού των υπολοίπων υπάρχει υψηλός βαθμός συσχέτισης. Η Μέθοδος των Ελαχίστων Τετραγώνων δεν μπορεί να διακρίνει με ακρίβεια τον ιδιαίτερο ρόλο των μεταβλητών που συσχετίζονται. Πρόκειται για ένα φαινόμενο που έχει να κάνει με το συγκεκριμένο δείγμα και πολύ λιγότερο με την θεωρητική σχέση των μεταβλητών.
Συνέπειες πολυσυγραμμικότητας Όλες οι επιθυμητές ιδιότητες των εκτιμητριών (αμεροληψία, αποτελεσματικότητα, συνέπεια κ.λ.π.) παραμένουν. Επίσης όλοι οι στατιστικοί έλεγχοι ισχύουν. Οι προβλέψεις δεν επηρεάζονται από την ύπαρξη υψηλής πολυσυγραμμικότητας.
Αυξάνει το μέγεθος των τυπικών σφαλμάτων των εκτιμητριών και κατά συνέπεια μειώνει τις τιμές της στατιστικής στους ελέγχους. Στην περίπτωση δύο ανεξάρτητων μεταβλητών S β ( n 3) ( ) ( ) r Τα διαστήματα εμπιστοσύνης έχουν μεγάλο εύρος Πιο συχνά δεχόμαστε την μηδενική υπόθεση. Μειώνεται η πιθανότητα οι εκτιμήσεις των συντελεστών να είναι στατιστικά σημαντικοί Αυξάνεται η πιθανότητα οι εκτιμήσεις των συντελεστών να έχουν μη αναμενόμενα πρόσημα Μπορεί να οδηγήσει σε σφάλμα εξειδικεύσεως. Παρόλα αυτά το R μπορεί να παραμένει υψηλό.
Οι εκτιμήσεις δείχνουν μεγάλη ευαισθησία σε διαφορετικές εξειδικεύσεις (προσθήκη ή αφαίρεση μεταβλητών) Η συνδιακύμανση των εκτιμητριών δύο μεταβλητών με υψηλό συντελεστή συσχέτισης είναι μεγάλη και δυσκολεύει την διάκριση των ιδιαίτερων ρόλων των δύο μεταβλητών.
Παράδειγμα Έστω η ακόλουθη μήτρα παρατηρήσεων των Χ: 5 5 5 4 5 5 5 ρ.55 4 ( ).35.7 σ V b.7.8 Έστω τώρα ότι η μήτρα των Χ μεταβάλλεται σε: 5 5 4 45 45 5 ρ.998 4 5 ( ).8 σ V b.8.64
Παράδειγμα Consmpon b bincome bwealh
Παράδειγμα Consmpon b bincome bwealh Τιμή του r..5.95.995.999 95% διάστημα εμπιστοσύνης για το b b.96 ± σ x b.96.33 ± σ x b.96.6 ± σ x b.96 ± σ x b.96 5 ± σ x
Παράδειγμα Y 3 Y 3 4 4 3 4 3 4 4 6 4 6 5 8 6 5 8 6 Y.939.4463.3 R r 3 3 (.773 ) (.848 ) (.85) (.543 ) (.45 ) (.35).8.55 Y.8.44.7 R r 3 3 (.748 ) (.7 ) (.5) (.68 ) (.475 ) (.6).8.88
Ανίχνευση πολυσυγραμμικότητας Είναι πρακτικά απίθανος ο μηδενικός βαθμός συσχέτισης μεταξύ δύο μεταβλητών. Σκόπος είναι η ανίχνευση του βαθμού πολυσυγγραμμικότητας και όχι η ύπαρξή της Ενδείξεις Πολλοι συντελεστές οι οποίοι δεν διαφέρουν στατιστικά από το μηδέν(χαμηλή τιμή της στατιστικής ) αλλά συγχρόνως υψηλό R Υψηλοί συντελεστές συσχέτισης μεταξύ ανεξάρτητων μεταβλητών (ικανή αλλά όχι αναγκαία προϋπόθεση) Οι εκτιμήσεις των συντελεστών μεταβάλλονται δραστικά όταν ανεξάρτητες μεταβλητές προσθέτονται ή αφαιρούνται.
Έχουν διατυπωθεί σοβαρές αντιρρήσεις για τους στατιστικούς ελέγχους πολυσυγγραμμικότητας που έχουν αναπτυχθεί. Δενυπάρχειομοφωνίαγιατοανείναιδυνατόναύπαρξουν τέτοιοι έλεγχοι. Συντελεστής Διογκώσεως της Διακυμάνσεως (VIF) Έστω Y β β β β 3 3 Βήμα ο Εκτίμηση των συναρτήσεων a a a 3 3 a a a 3 3 3 a 3 a a Υπολογισμός των R R R 3
Βήμα ο VIF R ( ) Υπολογισμός των VIF VIF β ( β ) R R ( β ) 3 Δείχνει την ταχύτητα με την οποία αυξάνεται η διακύμανση ενός εκτιμητή όταν υπάρχει πολυσυγγραμικότητα. ( β ) Όσο μεγαλύτερη η τιμή των VIF τόσο πιο σοβαρό το πρόβλημα (πρακτικά VIF> ή R j >,9). Ικανή αλλά όχι αναγκαία ένδειξη V σ Σ x j VIF j 3
Συντελεστής ανεκτικότητας (TOL) TOL j R VIF Εάν η μεταβλητή δεν συσχετίζεται με τις υπόλοιπες μεταβλητές, τότε TOL j ενώ αν υπάρχει τέλεια συχέτιση ανάμεσα στην j και τις υπόλοιπες μεταβλητές τότε TOL j. j
Λύσεις Δεν υπάρχουν συγκεκριμένες λύσεις. Η εφευρετικότητα συνήθως αναπτύσσεται με την εμπειρία. Μερικές χρήσιμες συμβουλές Αγνοήστε το θέμα τελείως αν δεν δημιουργεί πρόβλημα. Κυρίως αν δεν επηρεάζει την σημαντικότητα των συντελεστών. Ο μεγάλος αριθμός των ανεξάρτητων μεταβλητών (για να είστε μέσα ) δεν βοηθάει συνήθως. Μειώστε τον αριθμό των ανεξάρτητων μεταβλητών, κυρίως αυτών με <. Ελέξτε όμως την επίδρασή τους. Αυξήστε αν είναι δυνατό το μέγεθος του δείγματος Αλλάξτε τη μορφή της συνάρτησης. Ελέγξτε όμως τις πιθανές επιπτώσεις.
Το πρόβλημα της ετεροσκεδαστικότητας εμφανίζεται όταν παραβιάζεται η υπόθεση της σταθερής διακύμανσης του όρου σφάλματος Δηλαδή δεν ισχύει αλλά Το πρόβλημα var var ( ) E( ) σ ( ) E( ) σ και επειδή Y ( β β β β )... k k var ( ) var( Y ) σ Δηλαδή, η δεσμευμένη διακύμανση της εξαρτημένης μεταβλητής δεν είναι σταθερή.
Η φύση της ετεροσκεδαστικότητας Ομοσκεδαστικότητα σημαίνει ότι η διασπορά των τιμών γύρω από τον μέσο δεν εξαρτάται από τις τιμές της ερμηνευτικής μεταβλητής Χ. E σ ( ) Δεν ισχύει όμως πάντα π.χ. η μεταβλητικότητα στην συμπεριφορά της αποταμιεύσεως περιμένουμε να είναι μεγαλύτερη στις οικογένειες με μεγάλο εισόδημα παρά στις οικογένειες με χαμηλό εισόδημα. y x
Οι συνέπειες της ετεροσκεδαστικότητας Η μέθοδος των ελαχίστων τετραγώνων εξακολουθεί να δίνει αμερόληπτες και συνεπείς εκτιμήτριες. Η μέθοδος των ελαχίστων τετραγώνων δεν δίνει πλέον τις πιο αποτελεσματικές εκτιμήτριες. Υπάρχουν άλλες αμερόληπτες εκτιμήτριες με μικρότερες διακυμάνσεις. Οι διακυμάνσεις των είναι μεροληπτικές και ασυνεπείς. Οι στατιστικοί έλεγχοι που βασίζονται στις διακυμάνσεις αυτές οδηγούν σε λάθος συμπεράσματα. β Οι προβλέψεις που βασίζονται στις εκτιμήτριες αυτές είναι αμερόληπτες αλλά μη αποτελεσματικές.
Έλεγχος για την ύπαρξη ετεροσκεδαστικότητας Επειδή πίσω από το πρόβλημα της ετεροσκεδαστικότητας υπάρχει πολλές φορές το πρόβλημα της εξειδίκευσης πρέπει πριν οποιοδήποτε έλεγχο να έχει αποφασιστεί η οριστική μορφή της συνάρτησης Διαγραμματικός έλεγχος Η συνάρτηση εκτιμάται με την μέθοδο των ελαχίστων τετραγώνων και υπολογίζονται τα (εκτίμηση της διακύμανσης του ). Κατασκευάζουμε ένα διάγραμμα διασποράς με τα και την μεταβλητή που θεωρούμε ότι προκαλεί την ετεροσκεδαστικότητα ήμετην Y Η μέθοδος αυτή λειτουργεί συμβουλευτικά μόνο.
Ευθεία παλινδρόμησης απάνη για τρόφιμα 3 5 5 5 y.83x 4.768 5 5 Εβδομαδιαίο εισόδημα ιάγραμμα καταλοίπων Κατάλοιπα 5-5 - 5 5 x
Έλεγχος Goldfeld - Qan Αν υπάρχει ομοσκεδαστικότητα τότε η διακύμανση του όρου σφάλματος για ένα υποσύνολο του δείγματος δεν θα πρέπει να διαφέρει στατιστικά από την διακύμανση ενός άλλου υποσυνόλου. Επιλέγεται η μεταβλητή η οποία θεωρείται ότι προκαλεί την ετεροσκαδαστικότητα και οι παρατηρήσεις κατατάσσονται κατά αύξουσα τάξη μεγέθους με βάση τις τιμές αυτής της μεταβλητής Από το σύνολο του δείγματος αφαιρούνται οι d παρατηρήσεις που βρίσκονται στο κέντρο της κατανομής. Η αρχική συνάρτηση εκτιμάται με βάση τα δύο υποσύνολα του δείγματος που απομένουν μεγέθους n και n (n n ).
Ο αριθμός d επιλέγεται με τέτοιο τρόπο ώστε να αντιπροσωπεύει ένα ποσοστό μεταξύ του /3 και /6 των παρατηρήσεων και να αφήνει στην κάθε πλευρά του ικανό αριθμό παρατηρήσεων (n,n ) για να εκτιμηθεί η αρχική συνάρτηση. Από τις εκτιμήσεις των δύο συναρτήσεων υπολογίζονται τα σ και σ και η στατιστική F. F σ σ ESS ESS ( n k) ( n k) (Στον αριθμητή η μεγαλύτερη διακύμανση) Αν F>F(πινάκων) απορρίπτεται η υπόθεση ομοσκεδαστικότητας
Παράδειγμα 39.8 7.9 979 373.6 6.6 978 347.6 5.7 977 34. 4.7 976 36.7 4.3 975 96.5 44.6 974 38.5 68. 973 89.4 57. 97 67.8 5.6 97 4.5 34.7 97.9 3.9 969 4. 4. 968 9.9 6.6 967 8.4 6. 966 7.5 5. 965 55.3. 964 4. 4.3 963 3. 6. 96 4.7. 96.9 9. 96 7.5 6.9 959 5.5 9.8 958 ιαθέσιμο εισόδημα Αποταμίευση Y Έτος Ταξινομούμεμεβάση το Χ. Αφαιρούμε 6 κεντρικές παρατηρήσεις (/4)
Παράδειγμα Αποταμίευση Y 9.8 6.9 9.. 6. 4.3. 5. ιαθέσιμο εισόδημα 5.5 7.5.9 4.7 3. 4. 55.3 7.5 Αποταμίευση Y 57. 68. 44.6 4.3 4.7 5.7 6.6 7.9 ιαθέσιμο εισόδημα 89.4 38.5 96.5 36.7 34. 347.6 373.6 39.8 Y 9,7, 6 R,97 Y 6,,8 R,33 ( 3,95 ) (,9 ), ( ) ( ) F ( ) ( ) n k 643,5 n k, F 3,6 > F 4,8 (.5 ),( 6 ),( 6) 35,5, 643,5 3,6 Απορρίπτεται η μηδενική υπόθεση ομοσκεδαστικότητας άρα ο διαταρακτικός όρος χαρακτηρίζεται από ετεροσκεδαστικότητα.
Έλεγχος Park Εκτίμηση της Y β β β... β k k και υπολογισμός του Y β β β... β ( ) k k ln a a ln Z εκτίμηση της ( ) v Πιθανή αιτία ετεροσκεδαστικότητας Αν α στατιστικά διάφορο του η υπόθεση της ομοσκεδαστικότητας απορρίπτεται, άρα έχουμε ετεροσκεδαστικότητα.
Οι μέθοδοι Goldfeld Qan και Park αποδίδουν την ετεροσκεδαστικότητα σε μια μεταβλητή Όμως η ύπαρξη ετεροσκεδαστικότητας ισοδυναμεί με απόρριψη της H H ( ), Var,..., : σ E,,..., k : E σ ( ) ήτης ( ) k Έλεγχος της Η Έλεγχος της σχέσης του με τις Χ..Χ k- Αν διαπιστωθεί σχέση μεταξύ και έστω ενός Χ η Η απορρίπτεται
Έλεγχος Bresch-Pagan Εκτίμηση της Y β β β... β k k ( ) και υπολογισμός Y β β β... β k k Εκτίμηση της δ δ δ... δ k k v Έλεγχος της H : δ δ... δ k υπολογισμός του nr û H H απορρίπτεται αν nr > χ ak, Σε αυτή την περίπτωση δεν δεχόμαστε την υπόθεση για την ύπαρξη ομοσκεδαστικότητας.
Παράδειγμα Ας υποθέσουμε ότι με την κλασική μέθοδο των ελαχίστων τετραγώνων προέκυψαν τα εξής αποτελέσματα από παρατηρήσεις: 6,,6, 7 R, 46 Y (,6 ) (,34 ) (,378 ) Όπου Υ οι οικογενειακές δαπάνες για τρόφιμα, Χ το οικογενειακό εισόδημα και Χ ο αριθμός ατόμων της οικογένειας. Αν υποθέσουμε ότι η ετεροσκεδαστικότητα σχετίζεται και με τις δύο ερμηνευτικές μεταβλητές, εκτιμάμε τη βοηθητική παλινδρόμηση: 8,6,36 5,36 R, nr, > χ 5,99.5, Απορρίπτεται η μηδενική υπόθεση ότι οι συντελεστές στην βοηθητική παλινδρόμηση είναι ίσοι με το μηδέν, άρα δεν γίνεται δεκτή η υπόθεση ομοσκεδαστικότητας.
Έλεγχος Glesjer Εκτίμηση της Y β β β... β k k ( ) και υπολογισμός Y β β β... β k k Εκτίμηση της δ δ δ... δ k k v Έλεγχος της H : δ δ... δ k υπολογισμός του nr û H H απορρίπτεται αν nr > χ a, k Σε αυτή την περίπτωση δεν δεχόμαστε την υπόθεση για την ύπαρξη ομοσκεδαστικότητας.
Παράδειγμα Ας υποθέσουμε ότι με την κλασική μέθοδο των ελαχίστων τετραγώνων προέκυψαν τα εξής αποτελέσματα από παρατηρήσεις: 6,,6, 7 R, 46 Y (,6 ) (,34 ) (,378 ) Όπου Υ οι οικογενειακές δαπάνες για τρόφιμα, Χ το οικογενειακό εισόδημα και Χ ο αριθμός ατόμων της οικογένειας. Αν υποθέσουμε ότι η ετεροσκεδαστικότητα σχετίζεται και με τις δύο ερμηνευτικές μεταβλητές, εκτιμάμε τη βοηθητική παλινδρόμηση: 4,5, 7,4 R,3 nr,3 3 3 > χ 5,99.5, Απορρίπτεται η μηδενική υπόθεση ότι οι συντελεστές στην βοηθητική παλινδρόμηση είναι ίσοι με το μηδέν, άρα δεν γίνεται δεκτή η υπόθεση ομοσκεδαστικότητας.
Έλεγχος Harvey-Godfrey Εκτίμηση της Y β β β... β k k ( ) και υπολογισμός Y β β β... β k k Εκτίμηση της ln δ δ δ... δ k k v Έλεγχος της H : δ δ... δ k υπολογισμός του nr û H H απορρίπτεται αν nr > χ ak ln, Σε αυτή την περίπτωση δεν δεχόμαστε την υπόθεση για την ύπαρξη ομοσκεδαστικότητας.
Παράδειγμα Ας υποθέσουμε ότι με την κλασική μέθοδο των ελαχίστων τετραγώνων προέκυψαν τα εξής αποτελέσματα από παρατηρήσεις: 6,,6, 7 R, 46 Y (,6 ) (,34 ) (,378 ) Όπου Υ οι οικογενειακές δαπάνες για τρόφιμα, Χ το οικογενειακό εισόδημα και Χ ο αριθμός ατόμων της οικογένειας. Αν υποθέσουμε ότι η ετεροσκεδαστικότητα σχετίζεται και με τις δύο ερμηνευτικές μεταβλητές, εκτιμάμε τη βοηθητική παλινδρόμηση: ln 4,3,3 6,44 R, 4 nr,4 4 ln 4 > χ 5,99.5, Απορρίπτεται η μηδενική υπόθεση ότι οι συντελεστές στην βοηθητική παλινδρόμηση είναι ίσοι με το μηδέν, άρα δεν γίνεται δεκτή η υπόθεση ομοσκεδαστικότητας.
Σύνοψη ελέγχων Εκτίμηση της Y β β β... β k k ( ) και υπολογισμός Y β β β... β Εκτίμηση της: k k δ δ δ... δk k v Bresch-Pagan δ δ δ... δ v k k Glesjer ln δ δ δ... δ k k v Harvey-Godfrey Ειδική περίπτωση είναι ο έλεγχος Park.
Έλεγχος Whe Εκτίμηση της k k Y... β β β β και υπολογισμός ( ) k k Y... β β β β Εκτίμηση της k k k k k k k k v............ 3 δ δ δ δ δ δ δ δ δ Έλεγχος της... : 3 δ δ δ H υπολογισμός του R û H H απορρίπτεται αν, k k a nr χ > Σε αυτή την περίπτωση δεν δεχόμαστε την υπόθεση για την ύπαρξη ομοσκεδαστικότητας.
Παράδειγμα Ας υποθέσουμε ότι από την βοηθητική παλινδρόμηση προέκυψαν τα εξής αποτελέσματα από παρατηρήσεις: 6, 4,34 3, 4, 98, 476, 77 R,98 nr 9.8 > χ.7.5,5 Απορρίπτεται η μηδενική υπόθεση ότι οι συντελεστές στην βοηθητική παλινδρόμηση είναι ίσοι με το μηδέν. Αρα δεν γίνεται δεκτή η υπόθεση ομοσκεδαστικότητας.
Μέθοδοι εκτίμησης Η μέθοδος των Γενικευμένων Ελαχίστων Τετραγώνων Y β β β Έστω Y σ σ β σ β σ β σ * * * * * Y β β β ( ) ( ) * Var Var Var σ σ Όμως Στο μετασχηματισμένο υπόδειγμα δεν υπάρχει ετεροσκεδαστικότητα Περίπτωση η - το σ είναι γνωστό
Μέθοδοι εκτίμησης Οι εκτιμητές που παίρνουμε από την παλινδρόμηση: Y β β β * * (χωρίς σταθερό όρο) είναι άριστοι αμερόληπτοι γραμμικοί εκτιμητές (BLUE). Η διαδικασία αυτή είναι μια ειδική περίπτωση της μεθόδου των Γενικευμένων Ελαχίστων Τετραγώνων (GLS). H μέθοδος GLS στην περίπτωση της ετεροσκεδαστικότητας συμπίπτει με την Σταθμική μέθοδο των Ελαχίστων Τετραγώνων (WLS). Αν ορίσουμε ως * w * σ * Y σ β β β σ σ σ σ wy wβ β w β w w
Μέθοδοι εκτίμησης Η ελαχιστοποίηση του αθροίσματος του τετραγώνου των καταλοίπων της wy wβ β w β w w είναι ταυτόσημη με: ( w ) ( wy wβ β w β w ) Σε κάθε παρατήρηση δηλαδή, και για κάθε μια μεταβλητή δίνεται μια στάθμιση, που είναι αντιστρόφως ανάλογη της τυπικής απόκλισης του. Πρακτικά όμως είναι απίθανο να ξέρουμε την τυπική απόκλιση του και γι αυτό καταφεύγουμε σε άλλες μεθόδους για την περίπτωση της ετεροσκεδαστικότητας.
Περίπτωση η - το σ δεν είναι γνωστό. Είναι όμως γνωστός ο παράγοντας Ζ ι στη σχέση σ σζ Z Z Z Z Z Y β β β * * * * * Y β β β ( ) ( ) * Var Z Var Var Z Z Z σ σ Θα πάρουμε ακριβώς τους ίδιους εκτιμητές αν εφαρμόσουμε την Σταθμική μέθοδο των Ελαχίστων Τετραγώνων στο αρχικό υπόδειγμα: με στάθμιση: Y β β β w σ Z
Παράδειγμα: 6.6.6.7 R Y (.67) (.34) (.378).46 Υπόθεση: σ σ Y β β β * * Y β β β * Y.54 5.879.95 * * * (.3) (.7) (.87) Y.54 5.879.95 (.3) (.7) (.87)
Περίπτωση 3η - το σ δεν είναι γνωστό ούτε και ο παράγοντας Ζ ι. Εκτιμάται η σχέση της διακύμανσης σ και των πιθανών παραγόντων που την επηρεάζουν. Υποθέτουμε ότι οι παράγοντες που δημιουργούν το πρόβλημα της ετεροσκεδαστικότητας είναι περισσότεροι από ένας Αν a a a Z e σ σ a a a e Αν α, α και α γνωστά χρησιμοποιείται η προηγούμενη μέθοδος Επειδή είναι άγνωστα εκτιμώνται μέσω της συνάρτησης a a a σ e ε (, σ ) ε ~ ε Επειδή το είναι άγνωστο προσεγγίζεται με το û Έτσι ( ln a ) lnσ a a v όπου (, σ ) ν ~ ν
Ορίζουμε g û δ lnσ a lng a a δ ν Εκτιμώντας την συνάρτηση προκύπτουν δ έτσι, a, a και ^ lng g e ^ lng Η ĝ Μπορεί να χρησιμοποιηθεί ως συντελεστής στάθμισης και να εφαρμοστεί η σταθμική μέθοδος των ελαχίστων τετραγώνων. Y β β β g g g g Αντί της lng lng δ ay a Y ν a a δ ν μπορεί να χρησιμοποιηθεί η
Παράδειγμα: Y 6.6.6.7 R (.67) (.34) (.378).46 ^ ln g.59.3.43 R. (.66) (.698) (.33) Y g 7.656.56.677 R g g g (.479) (.9) (.45).93
Η μέθοδος της συνεπούς μήτρας διακυμάνσεων (Whe) Διορθώνει τις διακυμάνσεις και συνδιακυμάνσεις χωρίς να αλλάζει τις εκτιμήσεις των συντελεστών Οι συνεπείς διακυμάνσεις και συνδιακυμάνσεις προκύπτουν από την εφαρμογή του τύπου n Ειδικότερα Var ( β ) όπου n k ( ) ( x x )( ) j r j ( j j ) rj το κατάλοιπο από την Χ j f(υπόλοιπα Χ)
Παράδειγμα: Y 6.6.6.7 R (.67) (.34) (.378).46 Y 6.6.6.7 R (.358) (.8) (.43).46
Το πρόβλημα Το πρόβλημα της αυτοσυσχέτισης εμφανίζεται όταν παραβιάζεται η υπόθεση της μη συσχέτισης των σφαλμάτων Δηλαδή cov ( ) j Υπάρχει όταν η σειρά με την οποία εμφανίζονται οι παρατηρήσεις έχει νόημα j Υ Y α β Υ Y a β Χ Χ
Αυτοσυσχέτιση ου βαθμού Y β β... βk k ρ ε Διαδικασία αυτοσυσχέτισης ου βαθμού ΑR() E E( ε ) ( ) E ε σ ε ( ) s ε ε s < ρ < Συντελεστής αυτοσυσχέτισης ου βαθμού ρ > ρ < Θετική αυτοσυσχέτιση Αρνητική αυτοσυσχέτιση
Οι συνέπειες της αυτοσυσχέτισης Οι εκτιμητές που προκύπτουν από την μέθοδο των ελαχίστων τετραγώνων και οι προβλέψεις που βασίζονται σε αυτούς εξακολουθούν να είναι αμερόληπτοι και συνεπείς. Η μέθοδος των ελαχίστων τετραγώνων δεν δίνει πλέον τους πιο αποτελεσματικούς εκτιμητές και προβλέψεις. Υπάρχουν άλλοι αμερόληπτοι εκτιμητές με μικρότερες διακυμάνσεις. Αν μεταξύ των ανεξάρτητων μεταβλητών περιλαμβάνεται η εξαρτημένη με χρονική υστέρηση π.χ. Y -, τότε οι εκτιμητές δεν είναι ούτε συνεπείς. Οι εκτιμητές των διακυμάνσεων των β είναι μεροληπτικοί και ασυνεπείς. Οι στατιστικοί έλεγχοι που βασίζονται στις διακυμάνσεις αυτές οδηγούν σε λάθος συμπεράσματα.
Ανίχνευση της αυτοσυσχέτισης Διαγραμματική παρουσίαση Η συνάρτηση εκτιμάται με την μέθοδο των ελαχίστων τετραγώνων και υπολογίζονται τα û. Κατασκευάζουμε ένα διάγραμμα όπου στον κάθετο άξονα εμφανίζεται το και στον οριζόντιο ο χρόνος (). û Η μέθοδος αυτή λειτουργεί συμβουλευτικά μόνο.
ΟέλεγχοςDrbn - Wason Για να χρησιμοποιηθεί πρέπει: Να υπάρχει σταθερός όρος β Η υπόθεση που ελέγχεται να αφορά πρώτου βαθμού αυτοσυσχέτιση Να μην υπάρχει ως ανεξάρτητη μεταβλητή η εξαρτημένη με χρονική υστέρηση Εκτίμηση της εξίσωσης Υπολογισμός των û Υπολογισμός της στατιστικής d (Drbn-Wason) Y β β... βk k d n n ( ) ( )
( ) n n n n d Επειδή οι εκτιμήσεις των σφαλμάτων για μεγάλα δείγματα είναι συνήθως μικροί αριθμοί n n n ( ) ( ) ( ) n n n n n n n d ( ) ρ n n Επειδή όμως ( ) ρ d
ρ ρ ρ d d d 4 Θετική αυτοσυσχέτιση Αρνητική αυτοσυσχέτιση Μηδενική αυτοσυσχέτιση Διαπιστώνεται ότι όταν το d ήτο4-d τείνουν στο η πιθανότητα ύπαρξης αυτοσυσχέτισης αυξάνει ενώ όταν το d ήτο4-d τείνουν στο μειώνεται. H H : ρ : ρ > (d<) H H : ρ : ρ < (d>) d d L Η Η απορρίπτεται 4 d d L Η Η απορρίπτεται d d U Η Η δεν απορρίπτεται d d L d U Δεν υπάρχει συμπέρασμα 4 d d U Η Η δεν απορρίπτεται d 4 d L d U Δεν υπάρχει συμπέρασμα
Αβέβαιη περιοχή ρ > ρ ρ < d L d U 4 du 4 dl 4 d
Μειονεκτήματα Είναι δυνατό να δώσει αποτελέσματα που δεν οδηγούν σε συμπεράσματα Δεν είναι κατάλληλο στην περίπτωση που μεταξύ των ανεξάρτητων μεταβλητών περιλαμβάνεται η εξαρτημένη με χρονική υστέρηση. Δεν είναι κατάλληλο όταν η αυτοσυσχέτιση είναι μεγαλύτερου βαθμού.
Παράδειγμα Y 958 5. 5.58.8. 959 4.34 7.497 -.33.67 -.6.7 96 4.653.875 -.678.46.355.6 96 5.6 4.676 -.89.36.489.39 96 5.499 3.8 -.56.67 -.37.7 963 6.453 4.4 -.3..53.53 964 7.93 55.338.3.7.45. 965 8.97 7.456.34.799..463 966 8.65 8.4.648.4 -.693.48 967 9.4 9.895.834.696.86.35 968 9.647 4.64.855.73.. 969.67.98.79.53 -.45. 97 9.96 4.47 -.93.37 -.9.84 97.58 67.849 -.6.36 -.48.66 97.658 89.45 -.33.775 -.73.536 973 3.39 38.55.57.3.39.93 Αθροίσματα 8.74 7.3 Έστω ότι εκτιμήθηκε η συνάρτηση Y,36,375 την οποία θέλουμε να ελέγξουμε για την ύπαρξη αυτοσυσχέτισης. Υπολογίζουμε την στατιστική d: ( ) d 7,3 Για α5%, Τ6, Κ είναι,89 8,74 d L, και d U,37 d<d L άρα ρ>. ( )
Παράδειγμα Εάν είχαμε εκτιμήσει την τότε η d θα ήτανε: d ( ) 7,74, 3 5,735 Y 6,49 7,,453 Για α5%, Τ6, Κ είναι d L.98 και d U,54 d L < d < d U άρα δεν μπορούμε να βγάλουμε συμπέρασμα.
ΟέλεγχοςτουπολλαπλασιαστήLagrange Ισοδυναμεί με ένα έλεγχο προσθήκης μιας νέας μεταβλητής ( ). Εφαρμόζεται όταν έχουμε τουλάχιστον 3 βαθμούς ελευθερίας. Εκτίμηση της εξίσωσης Υπολογισμός των û Y β β... β k k Εκτίμηση της εξίσωσης γ... γ k k ρ γ ε Υπολογίζεται η στατιστική Αν Έλεγχος στατιστικής σημαντικότητας του ρ ( n ) R > χ ( n ) R Η στατιστική αυτή ακολουθεί την κατανομή χ με βαθμό ελευθερίας (ο αριθμός των περιορισμών, ρ) απορρίπτεται η μηδενική υπόθεση (ρ)
Παράδειγμα Y 958 5. 5.58.8 959 4.34 7.497 -.33.8 96 4.653.875 -.678 -.33 96 5.6 4.676 -.89 -.678 96 5.499 3.8 -.56 -.89 963 6.453 4.4 -.3 -.56 964 7.93 55.338.3 -.3 965 8.97 7.456.34.3 966 8.65 8.4.648.34 967 9.4 9.895.834.648 968 9.647 4.64.855.834 969.67.98.79.855 97 9.96 4.47 -.93.79 97.58 67.849 -.6 -.93 97.658 89.45 -.33 -.6 973 3.39 38.55.57 -.33 Έστω ότι εκτιμήθηκε η συνάρτηση Y,36,375 την οποία θέλουμε να ελέγξουμε για την ύπαρξη αυτοσυσχέτισης. Εκτιμάμε την: b b ρ.5..55 R.3 (.56 ) (.3 ) (.4) ( n ) R χ 5,3 4.5> 3,84
Έλεγχος με την στατιστική Όπως και στην περίπτωση του πολλαπλασιαστή Lagrange, χρειαζόμαστε μεγάλο δείγμα. Εκτίμηση της εξίσωσης Υπολογισμός των û Y β β... β k k Εκτίμηση της εξίσωσης ρ ε Έλεγχος στατιστικής σημαντικότητας του ρ: Υπολογισμός της στατιστικής : Και σύγκριση με την των πινάκων: ρ S ρ a/, n k Εάν > a /, n k απορρίπτεται η H.
Παράδειγμα Y 958 5. 5.58.8 959 4.34 7.497 -.33.8 96 4.653.875 -.678 -.33 96 5.6 4.676 -.89 -.678 96 5.499 3.8 -.56 -.89 963 6.453 4.4 -.3 -.56 964 7.93 55.338.3 -.3 965 8.97 7.456.34.3 966 8.65 8.4.648.34 967 9.4 9.895.834.648 968 9.647 4.64.855.834 969.67.98.79.855 97 9.96 4.47 -.93.79 97.58 67.849 -.6 -.93 97.658 89.45 -.33 -.6 973 3.39 38.55.57 -.33 Έστω ότι εκτιμήθηκε η συνάρτηση Y,36,375 την οποία θέλουμε να ελέγξουμε για την ύπαρξη αυτοσυσχέτισης. Εκτιμάμε την: ρ.55.55.477 >.5,4.45 (.).
Αμιγής και μη αμιγής αυτοσυσχέτιση Η ύπαρξη αυτοσυσχέτισης μπορεί να οφείλεται σε λαθεμένη εξειδίκευση του υποδείγματος (μη αμιγής αυτοσυσχέτιση). Π.χ. παράλειψη σημαντικής μεταβλητής. Η ύπαρξη αρνητικής αυτοσυσχέτισης είναι συνήθως ισχυρή ένδειξη μη αμιγούς αυτοσυσχέτισης
Μέθοδοι εκτίμησης Αλλαγή της συναρτησιακής μορφής Πολλές φορές η αυτοσυσχέτιση είναι το αποτέλεσμα μη σωστής εξειδίκευσης του υποδείγματος. Έτσι, η προσθήκη ουσιαστικών μεταβλητών ή μεταβλητών που ήδη υπάρχουν αλλά με άλλη μορφή (, ln κ.λ.π.) μπορεί να οδηγήσει σε περιορισμό η εξάλειψη του προβλήματος.
Y Η μέθοδος Cochrane-Orc (CORC) Y β β,... βk k, ρ ε Y β β... β, k k, ρy ρβ ρβ... ρβ ρ ρy, k k, ( ) ( )... ( ) β ρβ β ρβ β ρβ ρ, k k k k, ( ) ( )... ( ) Y ρy β ρ β ρ β ρ ε, k k k, Y β β... β ε * * * *, k k, Ικανοποιούνται όλες τις υποθέσεις του κλασσικού γραμμικού υποδείγματος. Θα μπορούσε να εκτιμηθεί με την μέθοδο των Ε.Τ. αν το ρ ήταν γνωστό. Επειδή δεν είναι γνωστό ακολουθείται η εξής διαδικασία: E ( ε ) ( ) E ε σ ε E ε ε s s ( )
Εκτίμηση της εξίσωσης Υπολογισμός των û Εκτίμηση του ρ Υπολογισμός των από την εξίσωση Y Εκτίμηση της εξίσωσηςy Y * β β... β k k * Y ρy * ρ ρ ε * * * β... β k k β ε Με βάση τα β, β,..., β k και την αρχική εξίσωση υπολογίζονται νέες εκτιμήσεις û Με βάση την εξίσωση υπολογίζεται νέος συντελεστής αυτοσυσχέτισης ρ Η διαδικασία αυτή επαναλαμβάνεται μέχρι οι τιμές δύο διαδοχικών εκτιμήσεων του ρ να μη διαφέρουν σημαντικά (π.χ.,).
Παράδειγμα (Cochrane-Orc) Αν εκτιμήσουμε την ευθεία παλινδρόμησης με τα στοιχεία του πίνακα παίρνουμε: Y 3,6,48 Στην συνέχεια εκτιμάμε την ρ e Και παίρνουμε μια εκτίμηση για το ρ:,66 * Y Y,66Y (.6) Οπότε, *,66 * * και * * Y 5,5,5,9 (.5) Y 958 6.7 95. 959 5. 99 96 6.7 7. 96 8.5 96.3 8.6 963 4. 43.6 964 8. 6.4 965 34.5 83.4 966 35.6 3.9 967 36.7.4 968 4.7 39.6 969 46.5 7.5 97 5. 34.4 97 57.8 338. 97 7.6 387.3 973 7. 497. 974 39. 58. 975 73.9 69.4 976 5.5 849.9 977 34. 994 978 74.3 9. 979 349.3 464.8 Στην τελευταία παλινδρόμηση το ρ δεν είναι στατιστικά σημαντικό άρα δεν υπάρχει αυτοσυσχέτιση. Θα είναι: * b 5,5 b 5,547 ρ,66 Y 5,547,5
Η μέθοδος Hldreh-L (HILU) Η μέθοδος αυτή βασίζεται στον ίδιο μετασχηματισμό της αρχικής εξίσωσης: Y ( ρ) β( ρ ) β k ( k ρ k ) ρ Y β... ε Αντί να εκτιμήσει το άγνωστο ρ χρησιμοποιεί εναλλακτικές τιμές στο διάστημα [-.,.] και επιλέγει αυτήν με το χαμηλότερο ε Επειδή οι τιμές στο διάστημα [.,.] είναι άπειρες σε ένα πρώτο στάδιο χρησιμοποιούνται τιμές που απέχουν.. Όταν εντοπιστεί το διάστημα στο οποίο ελαχιστοποιείται το ε χρησιμοποιούνται όλο και περισσότερο λεπτομερείς τιμές για να εντοπιστεί το απόλυτο ελάχιστο.
Παράδειγμα (Hldreh-L) Εκτιμούμε την ευθεία ( ) ( ) Y ρy β ρ β ρ ε για τιμές του ρ από - έως και κρατάμε τα ESS. ρ ESS ρ ESS - 349.4. 889.95 -.9 348.43. 78.49 -.8 86.836.3 69.534 -.7 56.5.4 65.6943 -.6 47.444.5 58.3568 -.5 989.633.6 556.8 -.4 753.73.7 553.763 -.3 537.768.8 57.843 -. 343.7.9 69.43 -. 7.94 666.87 Y 958 6.7 95. 959 5. 99 96 6.7 7. 96 8.5 96.3 8.6 963 4. 43.6 964 8. 6.4 965 34.5 83.4 966 35.6 3.9 967 36.7.4 968 4.7 39.6 969 46.5 7.5 97 5. 34.4 97 57.8 338. 97 7.6 387.3 973 7. 497. 974 39. 58. 975 73.9 69.4 976 5.5 849.9 977 34. 994 978 74.3 9. 979 349.3 464.8
Το μεγάλο πλεονέκτημα της μεθόδου αυτής σε σχέση με την μέθοδο Cochrane-Orc είναι ότι οδηγεί πάντα στο απόλυτο ελάχιστο (global mnmm) σημείο. Η μέθοδος Cochrane-Orc μπορεί να οδηγήσει σε σχετικά ελάχιστο (local mnmm) σημείο. Το μειονέκτημα της μεθόδου αυτής είναι ότι είναι περισσότερο χρονοβόρα.
Αυτοσυσχέτιση μεγαλύτερου βαθμού k k Y... β β β p p ε ρ ρ ρ ρ,..., 3 3 Η γενική μορφή υποδείγματος με αυτοσυσχέτιση p βαθμού AR(p). ΟέλεγχοςτουπολλαπλασιαστήLagrange p p k k ε ρ ρ ρ β β β...... : H... : p H ρ ρ ρ Ένα τουλάχιστον ρ δεν είναι
Εκτίμηση της εξίσωσης Υπολογισμός των û Y β β... β k k Εκτίμηση της εξίσωσης γ γ... γ ρ ρ... ρ ε k k p p Υπολογίζεται η στατιστική ( n p) R Η στατιστική αυτή ακολουθεί την κατανομή χ με p βαθμούς ελευθερίας ( όσοι και ο αριθμός των περιορισμών) Αν ( n p) R > χ p απορίπτεται η μηδενική υπόθεση (ρ) Η επιλογή του p γίνεται με βάση προηγούμενη εμπειρία ή άλλες εξωτερικές πληροφορίες. Ο έλεγχος της Η μπορεί να γίνει κατά τα γνωστά και με το κριτήριο της κατανομής F.
Εκτίμηση με τη μέθοδο Cochrane-Orc (CORC) Εκτίμηση της εξίσωσης Y β β... β k k Υπολογισμός των û Εκτίμηση των ρ από την εξίσωση ρ ρ ρ3 3,..., ρ p p ε Υπολογισμός των * * Εκτίμηση της εξίσωσης Y Y Y ρ... ρ py... ρ * Y ρ * * * β... β k k β ε Με βάση τα β, β,..., β k και την αρχική εξίσωση υπολογίζονται νέες εκτιμήσεις û Με βάση την εξίσωση υπολογίζονται νέοι συντελεστές αυτοσυσχέτισης ρ Η διαδικασία αυτή επαναλαμβάνεται μέχρι δύο ε διαδοχικών εκτιμήσεων να μη διαφέρουν σημαντικά. p p p