11. ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΔΕΔΟΜΕΝΑ ΧΡΟΝΟΣΕΙΡΩΝ 11.1 Η ΔΟΚΙΜΑΣΙΑ DURBIN-WATSON Όταν στη γραμική παλινδρόμηση τα σφάλματα δεν είναι ανεξάρτητα αλλά συμπεριφέρονται σύμγωνα με το μοντέλο 1 όπου = συντελεστής αυτοσυσχέτισης με υστέρηση (lag) 1 και = ανεξάρτητο 2 σφάλμα που ακολουθεί την κανονική κατανομή με μέση τιμή 0 και διακύμανση, τότε εφαρμόζουμε τη δοκιμασία Durbin-Wason για να δοκιμάζουμε τις υποθέσεις Το στατιστικό Durbin-Wason είναι H : 0 με H : 0. 0 1 DW n 2 ( e e ) και το συγκρίνουμε με τις τιμές ( d L ) και ( d U ), που δίνονται από στατιστικούς πίνακες, σύμφωνα με τους κανόνες: (α) Όταν DW du, τότε έχουμε ότι 0. (β) Όταν DW dl, τότε έχουμε ότι 0. (γ) Όταν dl DW du η δοκιμασία δεν μπορεί να καταλήξει σε συμπέρασμα (για την ύπαρξη η όχι θετικής αυτοσυσχέτισης). Παράδειγμα 11.1 Στον αρχείο C:\Forecasing Lab Daa\Incomplee Sales.MTW υπάρχουν, μεταξύ άλλων, δεδομένα για τις C2 Πωλήσεις ενός προϊόντος για την περίοδο 1980-1996 σε συνδυασμό με το C3 Εισόδημα των κατοίκων και την C4 Ανεργία σε μία περιοχή. Για να διερευνήσουμε την ύπαρξη θετικής σειριακής συσχέτισης στα σφάλματα της παλινδρόμησης των πωλήσεων πάνω στο εισόδημα, ανοίγουμε το αρχείο C:\Forecasing Lab Daa\Incomplee Sales.MTW. 1. Από τη γραμμή μενού επιλέγουμε Sa Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται: n 1 e 2 1 2 Ιωάννης Ι.Γεροντίδης, Καθηγητής 137
(α) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C2 Πωλήσεις για να εμφανιστεί στο πλαίσιο Response:. (β) Από τον αριστερό κατάλογο επιλέγουμε τη μεταβλητή C3 Εισόδημα και πατάμε στο κουμπί Selec για να εμφανιστεί στο πλαίσιο Predicors: (γ) Πατάμε στο κουμπί Opions και στο πλαίσιο διαλόγου Regression Opions που εμφανίζεται επιλέγουμε Durbin-Wason saisic. 3. Πατάμε δύο φορές ΟΚ και στο Session Window παίρνουμε μεταξύ άλλων τα αποτελέσματα Η τιμή του στατιστικού Durbin-Wason είναι 0.72 ενώ σε επίπεδο σημαντικότητας 0.01 με n 17 και k 1 έχουμε d 0.87 και d 1.10. Επειδή DW 0.72 0.87 dl, δεν μπορούμε να αποδεχθούμε την H : 0 0 έτσι ώστε συμπεραίνουμε ότι 0 και συνεπώς έχουμε την ένδειξη ύπαρξης θετικής αυτοσυσχέτισης. Κατά συνέπεια η παλινδρόμηση θα πρέπει να τροποποιηθεί προκειμένου να λάβει υπ όψη την αυτοσυσχέτιση. L U 11.2 ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΤΗΣ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ (α) Εσφαλμένος προσδιορισμός του μοντέλου Η επίλυση του προβλήματος της αυτοσυσχέτισης αρχίζει με τον κατάλληλο προσδιορισμό του μοντέλου παλινδρόμησης και συγκεκριμένα με τον εντοπισμό της μεταβλητής που πιθανόν έχει παραληφθεί. Στο παράδειγμα 11.1 είδαμε ότι η παλινδρόμηση των πωλήσεων πάνω στο εισόδημα έχει αυτοσυσχετισμένα σφάλματα. Συνεπώς μπορεί να υπάρχει μία άλλη μεταβλητή που απουσιάζει από το μοντέλο και η οποία μπορεί να περιγράψει την υπόλοιπη συσχέτιση παρά το γεγονός ότι η μεταβλητή εισόδημα περιγράφει το 99.5% της μεταβλητότητας στις πωλήσεις. Ιωάννης Ι.Γεροντίδης, Καθηγητής 138
Για να εφαρμόζουμε παλινδρόμηση των πωλήσεων ως προς το εισόδημα και την ανεργία: 1. Από τη γραμή μενού επιλέγουμε Window Incomplee Sales.MTW. 2. Από τη γραμμή εργαλείων πατάμε στο κουμπί Edi Las Dialog. 3. Στο πλαίσιο διαλόγου Regression που εμφανίζεται (με τις προηγούμενες επιλογές): (α) (β) Πατάμε δίπλα από το Εισόδημα στο πλαίσιο Predicors:. Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C4 Ανεργία για να εμφανιστεί στο πλαίσιο Predicors: 4. Πατάμε ΟΚ και από το Session Window έχουμε τα αποτελέσματα Τώρα η παλινδρόμηση ερμηνεύει το 99.9% της μεταβλητότητας στις πωλήσεις. Η τιμή του στατιστικού Durbin-Wason είναι 1.98 για την οποία σε επίπεδο σημαντικότητας 0.01 με n 17 και k 2 από την πίνακα έχουμε d 0.77 και du 1.25. Επειδή DW 1.98 1.25 du, δεν έχουμε ένδειξη για ύπαρξη σειριακής συσχέτισης. Κατά συνέπεια η προσαρμοσμένη ευθεία Y 0.014 0.03X1 0.35X 2 μπορεί να χρησιμοποιηθεί για την πρόβλεψη των πωλήσεων. L (β) όπου Παλινδρόμηση με διαφορές Η αυτοσυσχέτιση μπορεί να αντιμετωπιστεί και με το μοντέλο των διαφορών Y (1 ) X ' ' 0 1 Y Y Y ' 1 Ιωάννης Ι.Γεροντίδης, Καθηγητής 139
και X X X, ' 1 είναι οι γενικευμένες διαφορές. Όταν 1 τότε οι γενικευμένες διαφορές γίνονται οι απλές διαφορές ' Y Y Y 1 και ' X X X 1 ενώ ο σταθερός όρος της παλινδρόμησης μηδενίζεται. Παράδειγμα 11.2 Στο αρχείο C:\Forecasing Lab Daa\Differenced Sales.MTW υπάρχουν, μεταξύ άλλων, δεδομένα σχετικά με τις C2 πωλήσεις ενός προϊόντος και το διαθέσιμο C3 Eισόδημα των κατοίκων της περιοχής για την χρονική περίοδο 1976-1996. Για να προβλέψουμε μελλοντικές πωλήσεις θα προσαρμόσουμε το εκθετικό μοντέλο Πωλήσεις = (Εισόδημα) 1 η ισοδύναμα το λογαριθμογραμμικό μοντέλο Ln(Πωλήσεις) = Ln( ) + Ln(Εισόδημα). 1 Πριν προσαρμόσουμε το μοντέλο, θα μετασχηματίσουμε τις μεταβλητές πωλήσεις και εισόδημα. 1. Από τη γραμμή μενού επιλέγουμε Calc Calculaor. 2. Στο πλαίσιο διαλόγου Calculaor που εμφανίζεται: (α) Στο πλαίσιο Sore resul in variable: πληκτρολογούμε Ln(Πωλήσεις). (β) Πατάμε στο πλαίσιο Expression: και από τον αναδυόμενο κατάλογο του πλαισίου Funcions: επιλέγουμε Naural log. (γ) Πατάμε στο κουμπί Selec για να εμφανιστεί στο πλαίσιο Expression: η έκφραση. (δ) Διπλοπατάμε στη μεταβλητή C2 Πωλήσεις από τον αριστερό κατάλογο για να εμφανιστεί στo όρισμα της συνάρτησης LOGE. Ιωάννης Ι.Γεροντίδης, Καθηγητής 140
3. Πατάμε ΟΚ και στη στήλη C4 του Workshee εμφανίζεται η μεταβλητή Ln(Πωλήσεις). 4. Από τη γραμμή εργαλείων πατάμε στο κουμπί Edi Las Dialog. 5. Στο πλαίσιο διαλόγου Calculaor που εμφανίζεται με τις τελευταίες επιλογές: (α) Στο πλαίσιο Sore resul in variable: διαγράφουμε την προηγούμενη επιλογή και πληκτρολογούμε Ln(Εισόδημα). (β) Στη συνάρτηση LOGE(.) διαγράφουμε το προηγούμενο όρσμα και διπλοπατάμε στη μεταβήτή C3 Εισόδημα από τον αριστερό κατάλογο, για να εμφανιστεί στο όρισμα της συνάρτησης LOGE. 6. Πατάμε ΟΚ και στη στήλη C5 του Workshee εμφανίζεται η μεταβλητή Ln(Εισόδημα). Στη συνέχεια θα προσαρμόσουμε το λογαριθμογραμμικό μοντέλο. 1. Από τη γραμμή μενού επιλέγουμε Sa Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται: (α) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C4 Ln(Πωλήσεις) για να εμφανιστεί στο πλαίσιο Response:. (β) Από τον αριστερό κατάλογο διπλοπατάμε τη μεταβλητή C5 Ln(Εισόδημα) για να εμφανιστεί στο πλαίσιο Predicors: Ιωάννης Ι.Γεροντίδης, Καθηγητής 141
(γ) Πατάμε στο κουμπί Opions και στο πλαίσιο διαλόγου Regression Opions που εμφανίζεται επιλέγουμε Durbin-Wason saisic. 3. Πατάμε δύο φορές ΟΚ και στο Session Window παίρνουμε τα αποτελέσματα Παρατηρούμε ότι το 99.2% της μεταβλητότητας στις Ln(Πωλήσεις) ερμηνεύεται από το Ln(Εισόδημα). Η εκτιμούμενη ελαστικότητα των πωλήσεων ως προς το εισόδημα είναι 1 1.117 με τυπικό σφάλμα 0.023. Εν τούτοις για το στατιστικό Durbin- s 1 Wason έχουμε DW = 0.5 < 0.97 = d L που είναι η κατώτερη 0.01 κρίσημη τιμή που αντιστοιχεί σε n 21 και k 1. Αυτό σημαίνει ότι η αυτοσυσχέτιση των σφαλμάτων είναι θετική και μεγάλη ( 1). Για τον λόγο αυτό θα προσαρμόσουμε την παλινδρόμηση στις διαφορές των δύο λογαρίθμων. Προηγουμένως όμως θα υπολογίσουμε τις διαφορές των λογαρίθμων για τις πωλήσεις και το εισόδημα. 1. Από τη γραμμή μενού επιλέγουμε Daa Copy Columns o Columns. Ιωάννης Ι.Γεροντίδης, Καθηγητής 142
2. Στο πλαίσιο διαλόγου Copy Columns o Columns που εμφανίζεται: (α) Διπλοπατάμε στην μεταβλητή C4 Ln(Πωλήσεις) από τον αριστερό κατάλογο για να εμφανιστεί στο πλαίσιο Copy from columns:. (β) Από τον αναδυόμενο κατάλογο του πλαισίου Sore Copied Daa in Columns: επιλέγουμε In curren workshee, in columns. (γ) Στο πλαίσιο που ακολουθεί δίνουμε C6. 3. Πατάμε ΟΚ και στη στήλη C6 του Workshee εμφανίζεται η μεταβλητή Ln(Πωλήσεις)_1. 4. Επιλέγουμε το πρώτο κελλί της μεταβλητής Ln(Πωλήσεις)_1 και από τη γραμμή εργαλείων πατάμε στο κουμπί Inser Cell για να μετατοπιστούν τα δεδομένα μία θέση προς τα κάτω, ενώ στο πρώτο κελί υπάρχει αστερίσκος. 5. Από τη γραμμή μενού επιλέγουμε Calc Calculaor. 6. Στο πλαίσιο διαλόγου Calculaor που εμφανίζεται: (α) Στο πλαίσιο Sore resul in variable: δίνουμε DLn(Πωλήσεις). (β) Στο πλαίσιο Expression: δίνουμε Ln(Πωλήσεις) Ln(Πωλήσεις_1). 7. Πατάμε ΟΚ οπότε εμφανίζεται το πλαίσιο Error με την προειδοποίηση (Warning) ότι οι μεταβλητές που αφαιρούνται δεν έχουν το ίδιο μήκος. Ιωάννης Ι.Γεροντίδης, Καθηγητής 143
8. Πατάμε Cancel (για να προσπεράσουμε χωρίς ανησυχία) και στη στήλη C7 του Workshee παίρνουμε τη μεταβλητή DLn(Πωλήσεις). 9. Επαναλαμβάνουμε τα βήματα 1 έως 8 για την μεταβλητή Ln(Εισόδημα) για να πάρουμε στη στήλη C9 τη μεταβλητή DLn(Εισόδημα). Στη συνέχεια θα κάνουμε παλινδρόμηση της C7 DLn(Πωλήσεις) πάνω στη C9 DLn(Εισόδημα). 1. Από τη γραμμή μενού επιλέγουμε Sa Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται: (α) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C7 DLn(Πωλήσεις) για να εμφανιστεί στο πλαίσιο Response:. (β) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C9 DLn(Εισόδημα) για να εμφανιστεί στο πλαίσιο Predicors: 3. Πατάμε ΟΚ και στο Session Window παίρνουμε τα αποτελέσματα Ιωάννης Ι.Γεροντίδης, Καθηγητής 144
Από τα αποτελέσματα της παλινδρόμησης των διαφορών προκύπτει ότι ο σταθερός όρος της προσαρμοσμένης ευθείας είναι 0 (διότι η εκτίμηση 0.0201 δεν είναι στατιστικά σημαντική, γιατί;). Εν συνεχεία προσαρμόζουμε την ευθεία παλινδρόμησης χωρίς σταθερό όρο και συγχρόνως υπολογίζουμε και τα υπόλοιπα. 1. Από τη γραμμή εργαλείων πατάμε στο κουμπί Edi Las Dialog. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται πατάμε στο κουμπί Opions. 3. Στο πλαίσιο διαλόγου Regression Opions που εμφανίζεται αποεπιλέγουμε το Fi inercep και πατάμε ΟΚ. 4. Στο πλαίσιο διαλόγου Regression που επανεμφανίζεται πατάμε στο κουμπί Sorage και στο πλαίσιο διαλόγου Regression Sorage που εμφανίζεται επιλέγουμε Residuals. 3. Πατάμε δύο φορές ΟΚ και παίρνουμε αφ ενός μεν στο Workshee τη στήλη C10 RESI1 με τα υπόλοιπα, αφ ετέρου δε στο Session Window τα αποτελέσματα. Ιωάννης Ι.Γεροντίδης, Καθηγητής 145
Από τα αποτελέσματα προκύπτει ότι η παλινδρόμηση τώρα είναι σημαντική. Η ελαστικότητα των πωλήσεων ως προς το εισόδημα είναι 1 1.01, με τυπικό σφάλμα 0.093. Η ερμηνεία που μπορούμε να δώσουμε γι αυτό, είναι ότι το s 1 προηγούμενο τυπικό σφάλμα 0.023 υποεκτιμά το πραγματικό τυπικό σφάλμα του εκτιμητή λόγω της σειριακής συσχέτισης. Από το στατιστικό Durbin-Wason για n 20 και k 1 διαπιστώνουμε ότι dl 1.20 DW 1.28 1.41 du έτσι ώστε η δοκιμασία για θετική αυτοσυσχέτιση δεν μπορεί να καταλήξει σε συμπέρασμα. Για τον λόγο αυτό ελέγχουμε την αυτοσυσχέτιση των υπολοίπων 1. Από τη γραμμή μενού επιλέγουμε Sa Time Series Auocorrelaion. 2. Στο πλαίσιο διαλόγου Auocorrelaion Funcion που εμφανίζεται και από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C10 RESI1 για να εμφανιστεί πλαίσιο Series: 3. Στο πλαίσιο Tile: πληκτρολογούμε Συνάρτηση αυτοσυσχέτισης των υπολοίπων 4. Πατάμε ΟΚ και στο Graph Window παίρνουμε το διάγραμμα Ιωάννης Ι.Γεροντίδης, Καθηγητής 146
από το οποίο διαπιστώνουμε ότι σειριακή συσχέτιση έχει αφαιρεθεί. (γ) Αυτοπαλινδρούμενα μοντέλα To αυτοπαλινδρούμενο μοντέλο πρώτης τάξης έχει τη μορφή Y Y 0 1 1 και μπορεί να χρησιμοποιηθεί για την αφαίρεση της αυτοσυσχέτισης. Θα προσαρμόσουμε το αυτοπαλινδρούμενο μοντέλο πρώτης τάξης στα δεδομένα του παραδείγματος 11.1 και συγκεκριμένα θα κάνουμε παλινδρόμηση της C2 Πωλήσεις πάνω στην C5 LagΠωλήσεις. Επίσης θα υπολογίσουμε την πρόβλεψη για το έτος 1997 και μαζί από ένα 95% διάστημα εμπιστοσύνης και πρόβλεψης. Ανοίγουμε το αρχείο C:\Forecasing Lab Daa\Incomplee Sales.MTW. Στην περίπτωση του αυτοπαλινδρούμενου μοντέλου το στατιστικό Durbin-Wason είναι μεροληπτικό προς την τιμή 2, γι αυτό και δεν χρησιμοποιείται. 1. Από τη γραμμή μενού επιλέγουμε Sa Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται: (α) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C2 Πωλήσεις για να εμφανιστεί στο πλαίσιο Response:. (β) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C5 LagΠωλήσεις για να εμφανιστεί στο πλαίσιο Predicors: (γ) Πατάμε στο κουμπί Opions. Στο πλαίσιο διαλόγου Regression Opions που εμφανίζεται και στο πλαίσιο Predicion inervals for new observaions: δίνουμε 29.1 (οι πωλήσεις του 1996) Ιωάννης Ι.Γεροντίδης, Καθηγητής 147
(δ) Από την περιοχή Sorage επιλέγουμε τα Confidence limis και Predicion limis. 3. Πατάμε δύο φορές ΟΚ και στο Session Window παίρνουμε τα αποτελέσματα Παρατηρούμε ότι ο σταθερός όρος της παλινδρόμησης είναι μικρός και όχι σημαντικά 0 (γιατί;) γι αυτό και ξαναπροσαρμόσουμε το μοντέλο χωρίς σταθερό όρο. Από την ανάλυση της παλινδόμησης προκύπτει ότι το νέο μοντέλο δεν προκαλεί διαφοροποίηση στα αποτελέσματα. Ιωάννης Ι.Γεροντίδης, Καθηγητής 148
11.3 ΤΟ ΠΡΟΒΛΗΜΑ ΤΗΣ ΕΤΕΡΟΓΕΝΟΥΣ ΣΚΕΔΑΣΗΣ Η ετερογένεια της σκέδασης μπορεί να αντιμετωπιστεί με κάποιο μετασχηματισμό των δεδομένων όπως για παράδειγμα η λογαρίθμηση. Παράδειγμα 11.3 Στον αρχείο C:\Forecasing Lab Daa\Scedasic Sales.MTW υπάρχουν, μεταξύ άλλων, δεδομένα για τις C1 Πωλήσεις ενός προϊόντος για την περίοδο 1976-1996 σε συνδυασμό με το C2 Εισόδημα των κατοίκων σε μία περιοχή. Αρχικά θα κάνουμε γραμμική παλινδρόμηση των πωλήσεων πάνω στο εισόδημα. Ανοίγουμε το αρχείο C:\Forecasing Lab Daa\Scedasic Sales.MTW 1. Από τη γραμμή μενού επιλέγουμε Sa Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται: (α) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C1 Πωλήσεις για να εμφανιστεί στο πλαίσιο Response:. (β) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C2 Εισόδημα για να εμφανιστεί στο πλαίσιο Predicors (γ) Πατάμε στο κουμπί Sorage και στο πλαίσιο διαλόγου Regression Sorage που εμφανίζεται επιλέγουμε Residuals. 3. Πατάμε δύο φορές ΟΚ και στο Session Window παίρνουμε τα αποτελέσματα Στη συνέχεια θα κάνουμε τη γραφική παράσταση των υπολοίπων της παλινδρόμησης. Ιωάννης Ι.Γεροντίδης, Καθηγητής 149
1. Από τη γραμμή μενού επιλέγουμε Sa Time Series Time Series Plo. 2. Στο πλαίσιο διαλόγου Time Series Plos που εμφανίζεται επιλέγουμε Simple και πατάμε ΟΚ. 3. Στο πλαίσιο διαλόγου Time Series Plo Simple που εμφανίζεται: (α) Διπλοπατάμε στη μεταβλητή C3 RESI1 για ναεμφανιστεί στο πλαίσιο Series:. (β) Πατάμε στο κουμπί Time/Scale και στο πλαίσιο διαλόγου Time Series Plo Time/Scale που εμφανίζεται επιλέγουμε το Calendar από την περιοχή Time Scale. (γ) Από τον διπλανό αναδυόμενο κατάλογο επιλέγουμε Year. (δ) Παρακάτω και δίπλα από το All δίνουμε 1976. (ε) Στο πλαίσιο Incremen δίνουμε 1 και πατάμε ΟΚ. Ιωάννης Ι.Γεροντίδης, Καθηγητής 150
4. Στο πλαίσιο διαλόγου Time Series Plo Simple που επανεμφανίζεται: (α) Πατάμε στο κουμπί Labels. Εμφανίζεται το πλαίσιο διαλόγου Time Series Plo Labels όπου στο πλαίσιο Tile: πληκτρολογούμε Διάγραμμα υπολοίπων γραμμικού μοντέλου. 5. Πατάμε δύο φορές ΟΚ και στο Graph Window έχουμε το διάγραμμα Παρατηρούμε ότι εκτός από τη θετική αυτοσυσχέτιση των υπολοίπων (μία σειρά από αρνητικά υπόλοιπα ακολουθείται από μία σειρά από θετικά υπόλοιπα) υπάρχει και αύξηση του μεγέθους με την πάροδο του χρόνου. Για τον λόγο αυτό μετασχηματίζουμε τα δεδομένα με λογαρίθμηση και των δύο μεταβλητών και προσαρμόζουμε το λογαριθμογραμμικό μοντέλο από την προσαρμοσμένη ευθεία του οποίου προκύπτει ότι αυτό αν και ερμηνεύει καλύτερα τα δεδομένα απ ότι το γραμμικό μοντέλο, εν τούτοις δεν μπορεί να περιγράψει την υπάρχουσα καμπυλότητα. Ιωάννης Ι.Γεροντίδης, Καθηγητής 151
Για τον λόγο αυτό θα ενσωματώσουμε στο μοντέλο και την ανεξάρτητη μεταβλητή 2 2 X 2 X1 [Ln(Εισόδημα)] έτσι ώστε έχουμε το τετραγωνικό μοντέλο 2 Ln(Πωλήσεις) 0 1Ln(Εισόδημα) 2[Ln(Εισόδημα)]. 2 2 Αρχικά υπολογίζουμε τη μεταβλητή X 2 X1 [Ln(Εισόδημα)]. 1. Από τη γραμμή μενού επιλέγουμε Calc Calculaor. 2. Στο πλαίσο διαλόγου Calculaor που εμφανίζεται: (α) Στο πλαίσιο Sore resul in variable: πληκτρολογούμε (Εισόδημα)**2. (β) Πατάμε στο πλαίσιο Expression:. (γ) Από τον αριστερό κατάλογο διπλοπατάμε στη μεταβλητή C2 Εισόδημα για να εμφανιστεί στο πλαίσιο Expression:. (δ) Πατάμε στα πλήκτρα και από το υπάρχον πληκτρολόγιο. Ιωάννης Ι.Γεροντίδης, Καθηγητής 152
3. Πατάμε ΟΚ και στο Workshee εμφανίζεται η στήλη C3 (Εισόδημα)**2. Τα αποτελέσματα της παλινδρόμησης του τετραγωνικού μοντέλου είναι Από την γραφική παράσταση των υπολοίπων ως προς το χρόνο προκύπτει ότι αυτά τώρα είναι ομοιόμορφα διασκορπισμένα γύρω από το 0 έτσι ώστε το τετραγωνικό μοντέλο περιγράφει ικανοποιητικά τα δεδομένα. 11.4 ΕΠΟΧΙΚΑ ΔΕΔΟΜΕΝΑ ΚΑΙ ΠΑΛΙΝΔΡΟΜΗΣΗ Ένα εποχικό μοντέλο με τριμηνιαία εποχικότητα και τάση έχει τη μορφή Y S S S 0 1 2 2 3 3 4 4 όπου Y = εξαρτημένη μεταβλητή, = μεταβλητή χρόνος, S i = εικονική μεταβλητή που έχει την τιμή 1 για το i τρίμηνο του έτους και 0 διαφορετικά, για i = 2, 3 και 4, = σφάλματα και i = συντελεστές παλινδρόμησης, για i = 0,1,2,3,4. Ιωάννης Ι.Γεροντίδης, Καθηγητής 153
Παράδειγμα 11.4 Στον αρχείο C:\Forecasing Lab Daa\Quarerly Sales.MTW υπάρχουν τριμηνιαία δεδομένα για τις C1 Πωλήσεις ενός προϊόντος την περίοδο 1980-1995 και το πρώτο εξάμηνο του 1996. Οι άλλες μεταβλητές στα δεδομένα είναι C2 Χρόνος, και τρεις εικονικές C3 2 ο τρίμηνο, C4 3 ο τρίμηνο και C5 4 ο τρίμηνο. Η παλινδρόμησητων πωλήσεων πάνω στο χρόνο και στα τρίμηνα έδωσε τα αποτελέσματα Η προσαρμοσμένη ευθεία παλινδρόμησης είναι Yˆ 968 0.938 342S 472S 230S 2 3 4 και ερμηνεύει το 92.4% της συνολικής μεταβλητότητας. Οι προβλέψεις για το 3 ο και 4 ο τρίμηνο του 1996 είναι και Yˆ 67 968 0.938(67) 342(0) 472(1) 230(0) 559 Yˆ 68 968 0.938(68) 342(0) 472(0) 230(1) 802. Οι ευθείες των 4 τριμήνων έχουν την ίδια κλίση (0.938), αλλά οι σταθεροί όροι είναι διαφορετικοί. Για το 1 ο τρίμηνο ο σταθερός όρος είναι 968, για το 2 ο είναι 968-342 = 626, για το 3 ο είναι 968-472=496 και για το 4 ο είναι 968-230 = 738. Συμπερασματικά οι προβλέψεις των τριμήνων είναι μικρότερες για το 3 ο και αυξάνουν διαδοχικά στο 2 ο, 4 ο και 1 ο. Ιωάννης Ι.Γεροντίδης, Καθηγητής 154
11.5 ΑΣΚΗΣΕΙΣ 1. Στο αρχείο C:\Forecasing Lab Daa\Fuel Consumpion.MTW υπάρχουν δεδομένα για την ετήσια κατανάλωση της βενζίνης (σε εκατομμύρια λίτρων) σε μία περιοχή για την περίοδο 1973-1988 σε συνδυασμό με την τιμής ανά λίτρο και τον υπάρχοντα πληθυσμό στην περιοχή αυτή. (α) Να διερευνηθεί η ύπαρξη σειριακής συσχέτισης στα δεδομένα; (β) (γ) Υπάρχει εποχικότητα; Να κατάσκευάσετε το καλύτερο δυνατό μοντέλο για την πρόβλεψη της κατανάλωσης. 2. Στο αρχείο C:\Forecasing Lab Daa\Passengers.MTW υπάρχουν δεδομένα για την ετήσια διακίνηση των επιβατών (σε χιλάδες ατόμων) μιας αεροπορικής εταιρείας για την περίοδο 1979-2003. (α) Να προσαρμόσετε ένα μοντέλο παλινδρόμησης για χρονοσειρές με ανεξάρτητη μεταβλητή το χρόνο. (β) Να διερευνήσετε την συμπεριφορά των σφαλμάτων για το μοντέλο στο (α). (γ) Σε περίπτωση που χρειάζεται να μετασχηματίσετε κατάλληλα την εξαρτημένη μεταβλητή. (δ) Να προσαρμόσετε το μετασχηματισμένο μοντέλο. (ε) Να διερευνήσετε την συμπεριφορά των σφαλμάτων στο (δ). 3. Στο αρχείο C:\Forecasing Lab Daa\Indusry Sales.MTW υπάρχουν τριμηνιαία δεδομένα των πωλήσεων μιάς βιομηχανίας (σε χιλιάδες) σε συνδυασμό με τις πωλήσεις ολοκλήρου του κλάδου (σε εκατομμύρια) για την περίοδο 1998-2002. (α) Να προσαρμόσετε ένα μοντέλο παλινδρόμησης με εξαρτημένη μεταβλητή τις πωλήσεις και ανεξάρτητη το σύνολο. (β) Αφού κάνετε την γραφική παράσταση των υπολοίπων ως προς τον χρόνο διερευνήσετε την συμπεριφορά τους. (γ) Να διερευνήσετε την ύπαρξη αυτοσυσχέτισης με το στατιστικό Durbin-Wason. 4. Στο αρχείο C:\Forecasing Lab Daa\Elecrical Appliances Sales.MTW υπάρχουν τριμηνιαία δεδομένα των πωλήσεων (σε εκατομμύρια ) μιάς βιομηχανίας ηλεκτρικών ειδών για την περίοδο 1985-1995 και το 1 ο και 2 ο τρίμηνο του 1996. Να αναπτύξετε ένα μοντέλο πολλαπλής παλινδρόμησης με εικονικές μεταβλητές για την πρόβλεψη των πωλήσεων του 3 ου και 4 ου τριμήνου του 1996. Ιωάννης Ι.Γεροντίδης, Καθηγητής 155