4. ΕΠΙΛΟΓΗ ΤΗΣ ΜΕΘΟΔΟΥ ΠΡΟΒΛΕΨΗΣ Πριν από την επιλογή της κατάλληλης μεθόδου πρόβλεψης είναι σκόπιμο να λάβουμε υπ όψη τα παρακάτω ερωτήματα: (α) (β) (γ) (δ) (ε) (ζ) (η) Γιατί χρειαζόμαστε την πρόβλεψη; Ποιός θα την χρησιμοποιήσει; Ποιά είναι τα χαρακτηριστικά των δεδομένων; Ποιά θα είναι η περίοδος πρόβλεψης; Ποιές είναι οι ελάχιστες απαιτήσεις σε δεδομένα; Πόση ακρίβεια απαιτείται; Ποιό θα είναι το κόστος της πρόβλεψης; Ενας σημαντικός παράγοντας που επηρεάζει την επιλογή της μεθόδου πρόβλεψης είναι ο εντοπισμός και η κατανόηση των παρελθόντων επαναληπτικών σχημάτων (patterns) στα δεδομένα. Αν μπορέσουμε να εντοπίσουμε την τάση η/και τις κυκλικές η εποχικές επαναλήψεις, τότε μπορούμε να επιλέξουμε τις κατάλληλες τεχνικές για την αποτελεσματική προέκταση των επαναλήψεων αυτών στο μέλλον. Παράδειγμα 4.1 Στο αρχείο Operating Revenues.MTW περιέχονται δεδομένα για τα λετουργικά έσοδα μιάς επιχείρησης κατά τα έτη 1955-2000. (α) Να κάνετε τη γραφική παράσταση της χρονοσειράς. (β) Να υπολογίσετε τη συνάρτηση αυτοσυσχέτισης. (γ) Να κάνετε τη γραφική παράσταση της συνάρτησης αυτοσυσχέτισης. 4.1 Η ΣΥΝΑΡΤΗΣΗ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ Ανοίγουμε το αρχείο C:\Forecasting Lab Data\Operating Revenues.MTW. Για να κάνουμε τη γραφική παράσταση της χρονοσειράς 1. Από τη γραμμή μενού επιλέγουμε Stat Time Series Time Series Plot. 2. Στο πλαίσιο διαλόγου Time Series Plots που εμφανίζεται επιλέγουμε Simple OK. 3. Στο πλαίσιο διαλόγου Time Series Plots Simple που εμφανίζεται, διπλοπατάμε C1 Operating Revenue από τον αριστερό κατάλογο. 69
4. Πατάμε ΟΚ οπότε στο Graph Window παίρνουμε το διάγραμμα Για να υπολογίσουμε τη συνάρτηση αυτοσυσχέτισης και να πάρουμε τη γραφική της παράσταση 1. Από τη γραμμή μενού επιλέγουμε Stat Time Series Autocorrelation. 2. Στο πλαίσιο διαλόγου Autocorrelation Function που εμφανίζεται, διπλοπατάμε C1 Operating Revenue από τον αριστερό κατάλογο. 70
3. Πατάμε ΟΚ και η γραφική παράσταση εμφανίζεται στο Graph Window με την ονομασία Autocorrelation function for Operating Revenue. Για να πάρουμε τη συνάρτηση αυτοσυσχέτιση, από τη γραμμή μενού επιλέγουμε Window Session όπου έχουμε 4.2 ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ Οι δύο πρώτες στήλες (Lag, ACF)είναι οι τιμές του r k για 12 διαδοχικές χρονικές υστερήσεις. Η τρίτη στήλη (T) είναι οι τιμές του στατιστικού για τη δοκιμασία των υποθέσεων rk - k rk - 0 rk t SE( r ) SE( r ) SE( r ) k k k Η0: k 0 με εναλλακτική Η1: k 0, για k 1,2,...,12. Επειδή το δείγμα είναι μεγάλο ( n 46 ) η περιοχή αποδοχής της δοκιμασίας υπολογίζεται προσεγγιστικά από την κανονική κατανομή. Σε επίπεδο σημαντικότητας 71
0.05 η περιοχή αποδοχής είναι (-1.96, 1.96). Κατά συνέπεια η αυτοσυχέτιση για χρονικές υστερήσεις 1, 2, 3 και 4 εμφανίζεται στατιστικά σημαντική ενώ για υστερήσεις k 4 οι συντελεστές αυτοσυσχέτισης τείνουν σταδιακά στο μηδέν. Η τέταρτη στήλη (LBQ) είναι οι τιμές του στατιστικού m 2 rk Q n( n 2), k 1 n - k των Ljung-Box το οποίο χρησιμοποιείται για τον έλεγχο της υπόθεσης Η0: 1 0 &... & 0 με εναλλακτική Η1: 1 0 η... η 0, για m 2,...,12. m Κάτω από την Η0, το Q έχει την κατανομή χ 2 με ( m πλήθος εκτιμούμενων παραμέτρων) βαθμούς ελευθερίας. Για παράδειγμα για 12 χρονικές υστερήσεις είναι Q = 282.30 > 21.03 = χ 2 με 12 βαθμούς ελευθερίας σε επίπεδο σημαντικότητας = 0.05. Κατά συνέπεια υπάρχει υψηλού βαθμού αυτοσυσχέτιση και τάση στα δεδομένα. Για το λόγο αυτό θα αφαιρέσουμε την τάση για να δημιουργήσουμε μία στάσιμη χρονοσειρά. 4.3 ΑΦΑΙΡΕΣΗ ΤΗΣ ΤΑΣΗΣ Για να αφαιρέσουμε την τάση 1. Από τη γραμμή μενού επιλέγουμε Stat Time Series Differences. 2. Στο πλαίσιο διαλόγου Differences που εμφανίζεται, διπλοπατάμε C1 Operating Revenue από τον αριστερό κατάλογο και στο πλαίσιο Store differences in: δίνουμε C2. m 3. Πατάμε ΟΚ και οι υπολογισμένες διαφορές εμφανίζονται στη στήλη C2 του Worksheet. 72
Από τη γραφική παράσταση της χρονοσειράς των διαφορών (να την κάνετε και μόνοι σας, σαν άσκηση), καθώς και από το διάγραμμα της συνάρτησης αυτοσυσχέτισης (να το κάνετε επίσης), αλλά και από τις τιμές των συντελεστών αυτοσυσχέτισης, 73
προκύπτει ότι δεν υπάρχει πλέον τάση. Μόνο ο συντελεστής αυτοσυσχέτισης για υστέρηση 3 έχει την τιμή 0.32 που εμφανίζεται να είναι στατιστικά σημαντική ( 0), ενώ οι συντελεστές αυτοσυσχέτισης για υστέρηση k 3 έχουν τιμές κοντά στο 0. Το γεγονός αυτό θα πρέπει να κινήσει την υποψία μας μήπως υπάρχουν επαναλαμβανόμενα σχήματα στα δεδομένα που θα πρέπει να διερευνηθούν με πιό προηγμένες μεθόδους πρόβλεψης. Παράδειγμα 4.2 Στο αρχείο Marine Sales.MTW περιέχονται τριμηνιαία δεδομένα για πωλήσεων για τα έτη 1984 έως 1996 μιάς επιχείρησης σκαφών αναψυχής. Να διευρευνήσετε την ύπαρξη εποχικότητας στα δεδομένα. 4.4 ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΕΠΟΧΙΚΟΤΗΤΑΣ Ανοίγουμε το αρχείο C:\Forecasting Lab Data\Marine Sales.MTW. Από τη γραφική παράσταση της χρονοσειράς έχουμε ότι υπάρχουν εποχικές επαναλήψεις. Από τη γραφική παράσταση της συνάρτησης αυτοσυσχέτισης βλέπουμε ότι οι συντελεστές αυτοσυσχέτισης έχουν μεγάλες τιμές σε χρονικές υστερήσεις πολλαπλάσιες του 4. 74
Το γεγονός αυτό επιβεβαιώνεται και από τη συνάρτηση αυτοσυσχέτισης όπου οι τιμές των συντελεστών αυτοσυσχέτισης είναι στατιστικά σημαντικές για υστερήσεις πολλαπλάσιες του 4. Κατά συνέπεια υπάρχει εποχικότητα περιόδου 4. 75
4.5 ΑΣΚΗΣΕΙΣ ΠΑΡΑΔΕΙΓΜΑ 4.1 Μία επιχείρηση χονδρικής διακινεί τρόφιμα με τα οποία τροφοδοτεί 27 καταστήματα σε μία περιοχή. Η επιχείρηση έχει κατά καιρούς χρησιμοποιήσει διάφορους τρόπους διαφήμισης των προϊόντων της ενώ ποτέ δεν διερεύνησε τα αποτελέσματα των διαφημίσεων αυτών πάνω στον όγκο των πωλήσεών της παρά το γεγονός ότι τα αρμόδια τμήματα λογιστηρίου και μάρκετινγκ κρατάνε επαρκεί στοιχεία για το συγκεκριμένο σκοπό. Πρόσφατα η διοίκηση της επιχείρησης αποφάσισε ότι πρέπει να διερευνηθεί η επίδραση των διαφημίσεων στον όγκο των μηνιαίων πωλήσεων καθώς και η επίδραση που θα έχει η διαφήμιση των ανταγωνιστών της. Τα υπάρχοντα στοιχεία είναι δεδομένα 48 μηνών που περιλαμβάνουν τις μεταβλητές: Πωλήσεις Δαπάνες διαφήμισης σε εφημερίδες Δαπάνες διαφήμισης σε τηλεόραση Κωδικός μήνα (1 = Ιανουάριος, 2 = Φεβρουάριος,...,12 = Δεκέμβριος) Μία σειρά από 11 εικονικές (dummy) μεταβλητές που καταδικνύουν μήνα Διαφήμιση σε εφημερίδες με υστέρηση 1 μήνα Διαφήμιση σε εφημερίδες με υστέρηση 2 μήνες Διαφήμιση σε τηλεόραση με υστέρηση 1 μήνα Διαφήμιση σε τηλεόραση με υστέρηση 2 μήνες Αριθμός μήνα από 1έως 48 Κωδικός 1, 2 η 3 για την διαφήμιση ανταγωνιστών Το σύνολο των δεδομένων υπάρχει στο αρχείο Food Sales.MTW και βρίσκεται στον φάκελο C:\Forecasting Lab Data. Να διερευνηθούν τα δεδομένα για την ύπαρξη επαναλαμβανομένων σχημάτων. 76