ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές Κινητός Μέσος με χρήση της γραμμής τάσης Κινητός Μέσος με χρήση της ανάλυσης δεδομένων Μέτρα ακρίβειας της εξομάλυνσης Εκτίμηση του Ρυθμού Μεγέθυνσης Εκθετική προσαρμογή δεδομένων (μη γραμμική παλινδρόμηση) Το νόημα του R2 στη μη γραμμική παλινδρόμηση Μέτρα ακρίβειας της εξομάλυνσης
142 ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ - Ποσοτικές Εφαρμογές με το Excel
Ανάλυση Δεδομένων 143 1. Ανάλυση Δεδομένων Ανάλυση Δεδομένων είναι ο όρος που χρησιμοποιείται για τις διαδικασίες εξέτασης δεδομένων χρησιμοποιώντας κατάλληλες στατιστικές και γραφικές τεχνικές. Η εξέταση των δεδομένων συνίσταται από τέσσερεις κύριες φάσεις: 1. Παρουσίαση των δεδομένων κατά τρόπο ώστε να διευκολύνει την ανάλυση. Στο Excel παρέχονται ευκολίες τύπου βάσεων δεδομένων που μπορούν να χρησιμοποιηθούν για την αποθήκευση αριθμητικών και κατηγορικών πληροφοριών. Αυτές οι ευκολίες συνήθως περικλείουν διαδικασίες ταξινόμησης, αναζήτησης και εξαγωγής πληροφοριών. 2. Εξέταση καθεμιάς μεταβλητής στο σύνολο δεδομένων όσον αφορά την ορθότητα και τις ιδιότητες των μεταβλητών που αφορούν σε, παραδείγματος χάριν, προσδιορισμό ακραίων παρατηρήσεων, έλεγχο για missing data, παραγωγή διαγραμμάτων κατανομής συχνοτήτων, μέτρα θέσεων κλπ. 3. Παραγωγή κατάλληλων περιληπτικών στατιστικών και γραφημάτων. Παραδείγματος χάριν, η παραγωγή διαγραμμάτων διασποράς για τον προσδιορισμό μιας πιθανής σχέσης μεταξύ δύο μεταβλητών συνήθως βοηθά στον έλεγχο υποθέσεων για την ανάπτυξη ενός νοητικού υποδείγματος. 4. Αξιολόγηση της βιωσιμότητας της ανάπτυξης ενός τυπικού υποδείγματος. 1. ΣΤΑΤΙΣΤΙΚΕΣ ΣΥΝΑΡΤΗΣΕΙΣ Υποθέτομε ότι έχει γίνει η συλλογή των δεδομένων σ ένα αρχείο και ότι το αρχείο διαβάζεται από το Excel. Σε μια ανάλυση δεδομένων, ο αναλυτής συνήθως χρειάζεται μια συνοπτική στατιστική ανάλυση για καθεμιά μεταβλητή. Οι παρακάτω συναρτήσεις αναφέρονται στο κεφάλαιο της περιγραφικής στατιστικής AVERAGE STDEV STDEVP VAR VARP SUM COUNT MAX MIN MEDIAN MODE (υπολογίζει το μέσο ενός συνόλου δεδομένων) (υπολογίζει την τυπική απόκλιση) (υπολογίζει τη διακύμανση) (υπολογίζει το άθροισμα) (υπολογίζει το πλήθος των παρατηρήσεων ενός συνόλου δεδομένων) (υπολογίζει το μέγιστο) (υπολογίζει τον ελάχιστο) (υπολογίζει το διάμεσο) (υπολογίζει την επικρατούσα τιμή)
144 ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ - Ποσοτικές Εφαρμογές με το Excel Το Excel παρέχει επίσης το Πακέτο Εργαλείων Ανάλυσης που περιέχει τόσο τις παραπάνω συναρτήσεις, όσο και μια ομάδα εργαλείων ανάλυσης δεδομένων, τα οποία μπορούμε να χρησιμοποιήσομε για την ανάπτυξη περίπλοκων στατιστικών. Μερικά εργαλεία δημιουργούν γραφήματα, επιπλέον των πινάκων εξόδου. Για να έχετε πρόσβαση στα εργαλεία αυτά, επιλέξτε Εργαλεία Ανάλυση δεδομένων (Data Analysis) και θα εμφανιστεί ένας πίνακας με τις ακόλουθες διαδικασίες: Ανάλυση διακύμανσης Συσχέτιση Συνδιακύμανση Περιγραφικά στατιστικά (δίνει τα στατιστικά που αναφέρθηκαν παραπάνω) Εκθετική εξομάλυνση Έλεγχος F των διακυμάνσεων δύο δειγμάτων Ανάλυση Furier Ιστόγραμμα Κινητός μέσο Γεννήτορας τυχαίων αριθμών Τάξη και εκατοστημόρια Παλινδρόμηση Δειγματοληψία Έλεγχος t και z Αν δεν είναι εγκατεστημένη αυτή η δυνατότητα, τότε ανατρέξτε στο κεφάλαιο των Βοηθημάτων, όπου επιδεικνύεται η εγκατάσταση του εργαλείου Ανάλυση δεδομένων. Ως παράδειγμα, για τα δεδομένα της στήλης Α που βλέπομε στο επόμενο φύλλο Excel, η επιλογή Εργαλεία Ανάλυση δεδομένων Περιγραφικά στατιστικά παρέχει τα αποτελέσματα παραπλεύρως των δεδομένων υπό την επικεφαλίδα Στήλη 1.
Ανάλυση Δεδομένων 145 2. ΓΡΑΦΙΚΗ ΚΑΙ ΠΙΝΑΚΟΠΟΙΗΜΕΝΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΕΔΟΜΕΝΩΝ (ΙΣΤΟΓΡΑΜΜΑ) Υποθέτομε ότι πλέον των περιληπτικών στατιστικών, ο αναλυτής επιθυμεί να εξετάσει την κατανομή μιας μεταβλητής που υπόκειται των δεδομένων διά της παραγωγής πινάκων κατανομών και γραφημάτων. Στο Excel, ένας πίνακας κατανομής μπορεί να παραχθεί με τη δυνατότητα Ιστόγραμμα που παρέχει η Ανάλυση δεδομένων από το μενού των Εργαλείων. Θεωρούμε τα δεδομένα της στήλης Β του επόμενου φύλλου που είναι τριάντα δύο τιμές μιας μετοχής. Στη στήλη C υπολογίζομε τις αποδόσεις της μετοχής με επαναληπτική χρήση του τύπου =(B3-B2)/B2 εκκινώντας από το κελί C3. Παραπλεύρως των στηλών που περιέχουν τις τιμές της μετοχής και τις αποδόσεις σχεδιάζομε τα διαγράμματα διασποράς των τιμών και των αποδόσεων.
146 ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ - Ποσοτικές Εφαρμογές με το Excel Αναζητούμε ιδιότητες που θα μας υπεδείκνυαν την υποκείμενη κατανομή των αποδόσεων. Κατ αρχήν, στην περιοχή D35:D38 βρίσκομε την ελάχιστη τιμή, τη μέγιστη τιμή, το μέσο και την τυπική απόκλιση της απόδοσης. Οι δύο πρώτες υποδεικνύουν τα άκρα του διαστήματος των κλάσεων για την παραγωγή ενός ιστογράμματος. Έπειτα στην περιοχή C42:C49 δημιουργούμε κλάσεις εύρους 0,05 και στην περιοχή C42:C55 δημιουργούμε κλάσεις εύρους 0,025, αλλά είναι στην ευχέρεια του αναλυτή να δοκιμάσει μερικές
Ανάλυση Δεδομένων 147 εναλλακτικές έως ότου καταλήξει σε μια κατάλληλη. Το επόμενο φύλλο δείχνει τις επιλογές μας. Το ιστόγραμμα παράγεται καλώντας Εργαλεία Ανάλυση δεδομένων Ιστόγραμμα, οπότε εμφανίζεται το παράθυρο παραπλεύρως, πιέζομε ΟΚ, και εμφανίζονται
148 ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ - Ποσοτικές Εφαρμογές με το Excel τόσο οι πινακοποιημένες τιμές του ιστογράμματος, όσο και το γράφημά του (μετά από μερικές αισθητικές επεμβάσεις). Το ιστόγραμμα μπορεί να ενισχύει αρκετά τις υποθέσεις που αφορούν στην υποκείμενη κατανομή. Εν προκειμένω φαίνεται αρκετά ισχυρή η υποψία μας ότι οι αποδόσεις ακολουθούν μια ομοιόμορφη κατανομή. Η εικασία αυτή ενισχύεται επίσης από το διάγραμμα διασποράς των αποδόσεων που είδαμε παραπάνω. Γενικά, η ανάλυση δεδομένων βοηθά τον αναλυτή να αξιολογήσει τα οφέλη από την ανάπτυξη ενός τυπικού υποδείγματος σε πρώιμη φάση. Σε πολλές περιπτώσεις, η
Ανάλυση Δεδομένων 149 επαλήθευση των σχέσεων μεταξύ των μεταβλητών και η εξέταση της κατανομής των επιμέρους μεταβλητών του νοητικού υποδείγματος μπορεί να παράξουν επαρκή στοιχεία για τον τελικό χρήστη. Μπορεί όμως να φανεί ότι οι αναμενόμενες σχέσεις δεν ισχύουν ή ότι ισχύουν ασθενώς. Σ αυτή την περίπτωση ο αναλυτής έχει περιορισμένες απώλειες χρόνου. Στην προηγούμενη όμως περίπτωση, έχει δοθεί το έναυσμα για περαιτέρω ανάλυση.