ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΣΕΙΡΩΝ Με δεδομένη μια σειρά μπορούμε να εφαρμόσουμε διάφορους μετασχηματισμούς που είναι χρήσιμοι στους στατιστικούς και οικονομετρικούς υπολογισμούς. Οι πιο συνηθισμένοι υπολογισμοί είναι οι λογάριθμοι και οι χρονικές υστερήσεις. Ας θεωρήσουμε πχ τα χρηματιστηριακά στοιχεία που βρίσκονται στο αρχείο STOCKS.XLS το οποίο είναι αρχείο του Excel. Για να διαβάσουμε τα στοιχεία αυτά χρησιμοποιούμε τις εντολές File/New/Workfile/Undaed 5/File/Impor/Read Tex-Lous-Excel/Εντοπίζουμε το αρχείο STOCKS.XLS/Βάζουμε Α στο Upper Lef Daa Cell και 4 κάτω από την ένδειξη Names for Series or Number of Series if names in file/ok Έτσι έχουμε τις σειρές ASF, BIO, LSG και GEN στον φάκελο εργασίας. Για να κατασκευάσουμε τον λογάριθμο μιας σειράς χρησιμοποιούμε την εντολή genr lasf=log(asf) με την οποία δημιουργείται η νέα σειρά (LASF) που είναι ο λογάριθμος της ASF. Με παρόμοιο τρόπο μπορούμε να έχουμε άλλους αλγεβρικούς μετασχηματισμούς όπως είναι η πρόσθεση σειρών, ο πολλαπλασιασμός κλπ. Ας υποθέσουμε ότι θέλουμε να κατασκευάσουμε μια σειρά που είναι ο απλός μέσος όρος των σειρών ASF, BIO, LSG, να πάρουμε την διαφορά της από την σειρά του γενικού δείκτη GEN και να παρουσιάσουμε διαγραμματικά την διαφορά αυτή. Αυτό μπορεί να γίνει με τις εξής εντολές. genr average=(asf+bio+lsg)/3 genr diff=gen-average plo diff Το αποτέλεσμα είναι το ακόλουθο διάγραμμα. 800 600 400 00 000 800 600 50 00 50 00 50 DIFF
Η έννοια της χρονικής υστέρησης είναι πολύ σημαντική στην ανάλυση χρονολογικών σειρών. Ας υποθέσουμε ότι έχουμε μια χρονολογική σειρά X, δηλαδή την τιμή της μεταβλητής X για την χρονική περίοδο ( =,,.., T ) όπου T είναι ο συνολικός αριθμός των παρατηρήσεων. Η χρονική υστέρηση μία περιόδου είναι η X, δηλαδή η τιμή της μεταβλητής στην προηγούμενη χρονική περίοδο και παρόμοια μπορούμε να ορίσουμε τις χρονικές υστερήσεις της μορφής X, X 3 κλπ. Πιο συγκεκριμένα ας υποθέσουμε ότι X είναι η τιμή μιας μετοχής. Θα κατασκευάσουμε την μεταβλητή Y = X X, η οποία είναι η διαφορά της τιμής από την μια περίοδο (πχ ημέρα) στην άλλη, δηλαδή είναι η μεταβολή της τιμής. Προφανώς αυτή εκφράζει το κέρδος ή την ζημιά μας αν έχουμε μια μετοχή της συγκεκριμένης εταιρείας. Για να κατασκευάσουμε τις μεταβολές της τιμής για τον δείκτη των ασφαλειών, μπορούμε να δώσουμε την εντολή genr dasf=asf-asf(-) ή εναλλακτικά την εντολή genr dasf=@d(asf) με την οποία δημιουργείται η νέα σειρά dasf, η οποία είναι οι διαφορές της αρχικής σειράς asf. Ορισμένες από τις παρατηρήσεις που δημιουργήσαμε, είναι οι ακόλουθες. Las updaed: 06/9/0-6: Modified: 5 // dasf=@d(asf) NA 3.7000 0.4000-3.560000-3.85000-7.80000.740000 Η πρώτη παρατήρηση είναι NA που σημαίνει no available, δηλαδή μη διαθέσιμη. Ο λόγος είναι ότι όταν παίρνουμε διαφορές, μία παρατήρηση πρέπει να χαθεί γιατί η παρατήρηση της περιόδου 0 δεν υπάρχει. Αυτό μπορούμε να το κατανοήσουμε με την βοήθεια του ακόλουθου πίνακα. obs ASF ASF(-) DASF 79.4700 NA 74.6400 79.4700 3.7000 3 75.7800 74.6400 0.4000 4 749.00 75.7800-3.560000 5 735.3700 749.00-3.85000 6 77.5500 735.3700-7.80000 7 730.900 77.5500.740000 8 7.500 730.900-9.040000 9 73.000 7.500-8.30000
Για την παρατήρηση (δηλαδή = ), δεν μπορεί να ορισθεί η ASF = ASF0 και κατά συνέπεια η αντίστοιχη παρατήρηση για την DASF δεν μπορεί να ορισθεί. Στην συνέχεια ας δώσουμε την εντολή show asf asf(-) asf-asf(-) με την οποία ζητούμε να μας δοθούν οι παρατηρήσεις των μεταβλητών ASF, ASF και η διαφορά ASF ASF. Τα αποτελέσματα είναι στον ακόλουθο πίνακα. obs ASF ASF(-) ASF-ASF(-) 79.4700 NA 74.6400 NA 3 75.7800 79.4700 3.3000 4 749.00 74.6400 6.580000 5 735.3700 75.7800-7.4000 6 77.5500 749.00 -.67000 Στην περίπτωση αυτή χάνουμε δυο αρχικές παρατηρήσεις διότι λαμβάνουμε διαφορές δεύτερης τάξης. Παρόμοια αν πάρουμε διαφορές τάξης d, θα χάσουμε d παρατηρήσεις και η σειρά των διαφορών θα ορίζεται μόνο για τις παρατηρήσεις = d +, d +,..., T. Σε όλους τους υπολογισμούς του το πακέτο EViews πετάει τις παρατηρήσεις που δεν είναι διαθέσιμες και κάνει τους υπολογισμούς μόνον με τις διαθέσιμες παρατηρήσεις. Μια άλλη παρατήρηση είναι ότι στην προηγούμενη εντολή που δώσαμε, δεν κατασκευάσαμε πρώτα μια σειρά για την μεταβλητή asf-asf(-), αλλά δώσαμε απευθείας τον τρόπο υπολογισμού της σειράς. Αυτό ισχύει για τις περισσότερες εντολές του EViews και είναι χρήσιμο όταν δεν θέλουμε να κατασκευάσουμε έναν μεγάλο αριθμό σειρών που δεν μας χρειάζονται σε άλλους υπολογισμούς. Ορισμένες φορές είναι αναγκαίο να λάβουμε επαναλαμβανόμενες διαφορές. Ας ορίσουμε πχ Y = X X και Z = Y Y. Αυτές οι σειρές μπορούν να υπολογισθούν με τις εντολές genr dasf=asf-asf(-) genr ddasf=dasf-dasf(-) εναλλακτικά μπορούμε να κάνουμε χρήση της εντολής @d(asf,) η οποία υπολογίζει απευθείας την δεύτερη διαφορά. Για να συγκρίνουμε τα αποτελέσματα μπορούμε να δώσουμε την εντολή show ddasf @d(asf,) και θα έχουμε
obs DDASF @D(ASF,) NA NA NA NA 3-3.030000-3.030000 4-3.70000-3.70000 5-0.9000-0.9000 6 6.030000 6.030000 7 0.56000 0.56000 8 -.78000 -.78000 9 0.80000 0.80000 Παρόμοια μπορούμε να υπολογίσουμε και διαφορές ανώτερης τάξης. Στα χρηματοοικονομικά πολύ συχνά είναι απαραίτητο να υπολογίσουμε αποδόσεις μιας μετοχής ή ενός δείκτη. Αν με P συμβολίσουμε την τιμή μιας μετοχής, η απόδοση R υπολογίζεται με τον εξής τρόπο. Τι κερδίζουμε την περίοδο R = P P P Τι πληρώσαμε στην περίοδο - Η λογική της σχέσης είναι απλή. Αν στην περίοδο αγοράσαμε μια μετοχή τότε πληρώσαμε P, που είναι το κόστος μας. Στην περίοδο, η τιμή της μετοχής μεταβλήθηκε σε P και επομένως έχουμε κέρδος ή ζημιά P P, δηλαδή την διαφορά της τιμής. Ο λόγος των κερδών προς την τιμή είναι το ποσοστό απόδοσης της μετοχής. Ο παραπάνω τύπος αγνοεί τα μερίσματα που μπορεί να δίνει η μετοχή. Αν το μέρισμα της περιόδου ανά μετοχή είναι D, ο παραπάνω τύπος είναι προφανές ότι πρέπει να τροποποιηθεί σε R = P P + P D Στο EViews μπορούμε να υπολογίσουμε την απόδοση με αρκετούς τρόπους. Ένας τρόπος είναι να χρησιμοποιήσουμε απευθείας την εντολή genr rasf=(asf-asf(-))/asf(-) η οποία ακολουθεί τον ορισμό πιστά. Ο άλλος τρόπος είναι να χρησιμοποιήσουμε την εσωτερική εντολή @pch(asf) που σημαίνει percenage change. Για να συγκρίνουμε τους δυο τρόπους μπορούμε να δώσουμε την εντολή show rasf @pch(asf)
της οποίας τα αποτελέσματα φαίνονται παρακάτω. obs RASF @PCH(ASF) NA NA 0.08054 0.08054 3 0.03654 0.03654 4-0.00479-0.00479 5-0.08486-0.08486 6-0.00634-0.00634 7 0.003766 0.003766 Ένας τρίτος τρόπος (προσεγγιστικός) είναι να χρησιμοποιήσουμε λογαριθμικές διαφορές, οι οποίες ορίζονται ως W log( P ) log( P ) = Χρησιμοποιώντας την εντολή show rasf @pch(asf) @d(log(asf)) έχουμε τα εξής αποτελέσματα. obs RASF @PCH(ASF) @D(LOG(ASF)) NA NA NA 0.08054 0.08054 0.07893 3 0.03654 0.03654 0.0356 4-0.00479-0.00479-0.004740 5-0.08486-0.08486-0.08659 6-0.00634-0.00634-0.0069 7 0.003766 0.003766 0.003759 8-0.0379-0.0379-0.0456 Μια άλλη χρήσιμη εντολή είναι αυτή του κινητού μέσου, ο οποίος χρησιμοποιείται όταν θέλουμε να εξομαλύνουμε μια χρονολογική σειρά. Αν θεωρήσουμε μια σειρά X, ο κινητός μέσος τριών περιόδων είναι Y = ( + + X X X ) / 3, δηλαδή ένας απλός μέσος όρος της τρέχουσας περιόδου και των δυο προηγούμενων. Η λογική του μέτρου αυτού είναι ότι ο μέσος έχει μικρότερη διακύμανση από τις ατομικές παρατηρήσεις και επομένως μπορεί να εξομαλύνει μια χρονολογική σειρά που υπόκειται σε έντονες διακυμάνσεις και να μας δώσει με τον τρόπο αυτό μια πιο καθαρή εικόνα για την «τάση» της σειράς. Ας θεωρήσουμε την εντολή show asf (asf+asf(-)+asf(-))/3 που δίνει τα αποτελέσματα
obs ASF (ASF+ASF(-)+ASF(-))/3 79.4700 NA 74.6400 NA 3 75.7800 74.6300 4 749.00 748.33 5 735.3700 745.7900 6 77.5500 737.3800 7 730.900 73.0700 8 7.500 76.3633 9 73.000 7.500 Αυτό μπορεί να γίνει και αυτόματα με την χρήση της εντολής @movav(asf,d) η οποία δίνει τον κινητό μέσο d περιόδων (της τρέχουσας περιόδου και των περιόδων,,..., ( d ) ). Αν δώσουμε την εντολή plo asf @movav(asf,0) τότε ζητάμε να παρασταθεί γραφικά η αρχική σειρά και επίσης ο κινητός μέσος 0 περιόδων (δηλαδή 0 ημερών και επομένως όλων χονδρικά των συνεδριάσεων ενός μήνα). Το αποτέλεσμα φαίνεται στο επόμενο διάγραμμα.
300 00 00 000 900 800 700 50 00 50 00 50 ASF @MOVAV(ASF,0) Η εξομάλυνση μιας σειράς μπορεί να γίνει και με άλλες μεθόδους μια από τις οποίες είναι γνωστή σαν φίλτρο των Hodrick-Presco. Το φίλτρο των Hodrick-Presco, μοιάζει με την μέθοδο των κινητών μέσων όρων αλλά υπολογίζεται διαφορετικά προσπαθώντας να πετύχει δυο στόχους. Πρώτον, να παράγει μια νέα σειρά που να είναι όσο το δυνατόν πιο κοντά στην αρχική και δεύτερον, η νέα σειρά να είναι όσο το δυνατόν πιο ομαλή. Η νέα αυτή σειρά είναι μια εκτίμηση της τάσης. Η διαδικασία αυτή είναι διαθέσιμη αν κάνουμε διπλό κλικ στην σειρά (πχ την ASF) και επιλέξουμε Procs/Hodrick-Presco Filer Στην συνέχεια εμφανίζεται ένας πίνακας επιλογών που μας ζητά να ορίσουμε την λεγόμενη παράμετρο εξομάλυνσης που είναι 00 για ετήσια στοιχεία, 600 για τριμηνιαία και 4400 για μηνιαία στοιχεία. Φυσικά μπορούμε να επιλέξουμε κάποια άλλη τιμή αλλά οι συγκεκριμένες εξ ορισμού τιμές φαίνεται να συμπεριφέρονται καλά στην πράξη. Επίσης κάτω από την ένδειξη Smoohed Series, το πακέτο μας ζητά να ορίσουμε το όνομα κάποιας σειράς στην οποία να αποθηκεύσει τις ομαλοποιημένες τιμές. Μπορούμε να δώσουμε το όνομα HPASF. Στην συνέχεια επιλέγουμε ΟΚ και το πακέτο μας δίνει κατευθείαν το ακόλουθο διάγραμμα στο οποίο φαίνεται η αρχική σειρά και οι ομαλοποιημένες τιμές.
300 00 00 000 900 800 700 50 00 50 00 50 ASF HPASF Οι αποκλίσεις της αρχικής σειράς από την τάση είναι οι τιμές της σειράς από τις οποίες έχει αφαιρεθεί η τάση και μπορούν να κατασκευασθούν ή να παρασταθούν γραφικά με την εντολή genr u=asf-hpasf plo u πράγμα που μας δίνει το επόμενο διάγραμμα. 50 00 50 0-50 -00-50 50 00 50 00 50 U Για μια σειρά που αποτελείται μόνον από τάση και τυχαία σφάλματα, το παραπάνω διάγραμμα δεν είναι παρά τα τυχαία σφάλματα της σειράς. ΚΑΤΑΝΟΜΕΣ ΚΑΙ ΚΡΙΤΙΚΕΣ ΤΙΜΕΣ Αρκετές φορές στην στατιστική χρειάζεται να προσδιορίσουμε κριτικές τιμές ή παρόμοια πράγματα. Πχ στον δικατάληκτο έλεγχο του μέσου του πληθυσμού H 0 : µ = 0 έναντι της εναλλακτικής υπόθεσης H : µ 0 χρειάζεται η κριτική τιμή της τυπικής κανονικής κατανομής z α / η οποία ορίζεται από την σχέση
α P ( Z z α / ) =, όπου α είναι το επίπεδο σημαντικότητας του ελέγχου. Για την τυπική κανονική κατανομή είναι γνωστό ότι έχει συνάρτηση πυκνότητας πιθανότητας που δίνεται από την σχέση f ( z) = exp( z ). Η συνάρτηση κατανομής δίνεται π x εξ ορισμού από την σχέση F( x) = exp( z ) dz και είναι F( x) = P( Z z). π Κατά συνέπεια η κριτική τιμή που θέλουμε ικανοποιεί την εξίσωση F z / ) = α / ( α ή πιο απλά F( z q ) = q, όπου q = α / Με άλλα λόγια η κριτική τιμή z q είναι το σημείο μέχρι το οποίο αντιστοιχεί μάζα q. Η εξίσωση F( z q ) = q δεν μπορεί να λυθεί αναλυτικά ως προς z q γιατί το ολοκλήρωμα δεν είναι διαθέσιμο σε αναλυτική μορφή και επομένως έχουν κατασκευασθεί διάφορες αριθμητικές προσεγγίσεις. Παλαιότερα οι προσεγγίσεις αυτές γίνονταν διαθέσιμες σε πίνακες, αλλά σήμερα μπορούν να υπολογισθούν με τον Η/Υ. Η συνάρτηση πυκνότητας f (z) της τυπικής κανονικής κατανομής είναι διαθέσιμη στο EViews με την συνάρτηση @dnorm(x) όπου x μπορεί να είναι μια ορισμένη τιμή ή μια σειρά τιμών. Η συνάρτηση κατανομής είναι διαθέσιμη με την συνάρτηση @cnorm(x) όπου x μπορεί να είναι μια ορισμένη τιμή ή μια σειρά τιμών. Αν ανοίξουμε ένα workfile του EViews (undaed με παρατήρηση) και δώσουμε την εντολή @cnorm(-.67) θα εμφανισθεί το αποτέλεσμα 0.04735 που σημαίνει ότι η πιθανότητα η τυπική κανονική τυχαία μεταβλητή Z να είναι μικρότερη από.67 είναι 0.04735. Το πρόβλημα της εύρεσης της κριτικής τιμής με γνωστή την πιθανότητα είναι το αντίστροφο αυτού του προβλήματος, δηλαδή θέλουμε να λύσουμε την εξίσωση F( z q ) = q ως προς zq έχοντας το q. Αυτό επιτυγχάνεται με την συνάρτηση @qnorm(q) η οποία λαμβάνει την τιμή του q και επιστρέφει την τιμή του z q. Ας υποθέσουμε πχ ότι έχουμε επίπεδο σημαντικότητας 5%, δηλαδή α = 0. 05 και άρα q = α / = 0.975. Αν δώσουμε την εντολή @qnorm(0.975) θα πάρουμε.959964
το γνωστό.96 των πινάκων. Αυτό σημαίνει ότι η μάζα μέχρι το σημείο.959964 είναι 0.975 ή 97.5% πιθανότητα η τυπική κανονική τυχαία μεταβλητή να είναι μικρότερη από.959964. Ας υποθέσουμε τώρα ότι είχαμε ένα δείγμα n = 9 ατόμων από κανονικό πληθυσμό με γνωστή διακύμανση σ =, στο οποίο ο μέσος αριθμητικός ήταν X = 0. 5. Θέλουμε να ελέγξουμε την υπόθεση H 0 : µ = 0 έναντι της εναλλακτικής H : µ 0 σε επίπεδο σημαντικότητας α = 0. 05. Σχηματίζουμε την γνωστή στατιστική X µ 0.5 z = = = 0.75. Αφού η τιμή αυτή είναι μικρότερη από την κριτική τιμή σ / n 0.333.96 μπορούμε να δεχθούμε την μηδενική υπόθεση. Αντί να συγκρίνουμε την τιμή της στατιστικής με την κριτική τιμή, η σύγχρονη στατιστική μεθοδολογία βασίζεται στην p τιμή της στατιστικής. Αυτή ορίζεται ως p = P( Z > z) και είναι η πιθανότητα η στατιστική να έχει μια τιμή περισσότερο ακραία από αυτή που παρατηρούμε. Η τιμή αυτή είναι το ελάχιστο επίπεδο εμπιστοσύνης στο οποίο μπορούμε να απορρίψουμε την H 0. Θα έχουμε [ P( Z < z) ] = [ F( )] p = P( Z > z) = P( Z > z Z < z) = P( Z > z) + P( Z < z) = P( Z > z) = z Επομένως η p τιμή μπορεί να υπολογισθεί με βάση την συνάρτηση κατανομής. Στην περίπτωσή μας θα έχουμε show *(-@cnorm(0.75)) Που σημαίνει ότι θα απορρίπταμε την H 0 σε επίπεδα α = 0. 453 ή μεγαλύτερα. Εφόσον τέτοια επίπεδα εμπιστοσύνης είναι παράλογα μεγάλα, το πρακτικό συμπέρασμα είναι ότι απορρίπτουμε την μηδενική υπόθεση. Ανάλογες συναρτήσεις υπάρχουν και για την κατανομή Suden- με ν βαθμούς ελευθερίας. Οι συναρτήσεις αυτές δίνονται ως εξής. @cdis(x,v) για την συνάρτηση κατανομής @ddis(x,v) για την συνάρτηση πυκνότητας @qdis(q,v) για την εύρεση τιμής μέχρι την οποία υπάρχει μάζα q Σαν εφαρμογή ας υποθέσουμε ότι δείγμα 6 ατόμων είχαν μέσο εισόδημα 500 ευρώ με τυπική απόκλιση s = 00 ευρώ (η τιμή αυτή εκτιμήθηκε από το δείγμα και δεν είναι γνωστή). Για να ελέγξουμε την υπόθεση ότι το μέσο εισόδημα είναι 600 ευρώ έναντι της εναλλακτικής H : µ 600, χρησιμοποιούμε την γνωστή στατιστική X µ 500 600 = = = 4 s / n 00 / 6
η οποία έχει την κατανομή Suden- με n = 5 βαθμούς ελευθερίας. Αν είχαμε επίπεδο εμπιστοσύνης α = 0. 07, δηλαδή 7%, η κριτική τιμή θα ήταν n, / = 5,0. 65 Για να βρούμε αυτή την κριτική τιμή χρησιμοποιούμε την συνάρτηση show @qdis(0.965,5) και το αποτέλεσμα είναι.950940 οπότε απορρίπτουμε την μηδενική υπόθεση. Εναλλακτικά μπορούμε να βρούμε την p τιμή με την συνάρτηση show *(-@cdis(4,5)) και το αποτέλεσμα είναι 0.0059. Επομένως μπορούμε να απορρίψουμε την μηδενική υπόθεση σε κάθε επίπεδο μεγαλύτερο από αυτό, πχ σε 0.5%, %, 5% κλπ. Σαν πρόσθετη εφαρμογή ας υποθέσουμε ότι η τιμή μιας μετοχής ακολουθεί την κανονική κατανομή με μέσο % και τυπική απόκλιση 5%. Ποια είναι η πιθανότητα η μετοχή να έχει αρνητική απόδοση; Στο πρόβλημα αυτό έχουμε ότι X ~ N( µ, σ ) όπου µ = και σ = 5 = 5, δηλαδή X ~ N(,5) όπου X είναι η τιμή της μετοχής και θέλουμε την πιθανότητα P ( X < 0). Θα πρέπει να μετατρέψουμε την μεταβλητή σε τυπική και θα έχουμε: X µ 0 µ P( X < 0) = P < = P( Z < µ / σ ) = P( Z < / 5) = P( Z < 0.4) = F( 0.4) σ σ όπου F η τυπική κανονική συνάρτηση κατανομής. Στην συνέχεια χρησιμοποιούμε την συνάρτηση @cnorm(-0.4)=0.344578 επομένως η πιθανότητα η μετοχή να έχει αρνητική απόδοση είναι περίπου 34.5%. Σαν πρόσθετη εφαρμογή ας υποθέσουμε ότι θέλουμε να υπολογίσουμε τις τιμές της συνάρτησης κατανομής μιας Suden- με 7, 0 και 5 βαθμούς ελευθερίας που αντιστοιχούν σε πιθανότητας 0.60, 0.80, 0.90, 0.95 Καταρχήν δημιουργούμε ένα νέο Workfile (undaed, 4 παρατηρήσεις). Η εντολή που θα μας έδινε τους πίνακες αυτούς θα ήταν daa x <εισάγουμε τις παρατηρήσεις 0.6, 0.8, 0.9 και 0.95> show @qdis(x,7) @qdis(x,0) @qdis(x,5) Τα αποτελέσματα έχουν ως εξής. obs @QTDIST(X,7) @QTDIST(X,0) @QTDIST(X,5) 0.6367 0.6085 0.57885 0.896030 0.879058 0.86645 3.4494.3784.340606 α
4.894579.846.753050 Έτσι πχ η κριτική τιμή της κατανομής Suden- με 0 βαθμούς ελευθερίας μέχρι την οποία υπάρχει μάζα 0.80 είναι 0.897058 ενώ η κριτική τιμή της κατανομής Suden- με 5 βαθμούς ελευθερίας μέχρι την οποία υπάρχει μάζα 0.95 είναι.753050. Στην συνέχεια θα δούμε πρακτικά για ποιον λόγο στην στατιστική χρησιμοποιούμε X µ την κανονική κατανομή για τον λόγο = όταν το δείγμα είναι μεγάλο s / n ( n > 30 ) παρόλο που η τυπική απόκλιση σ είναι άγνωστη και εκτιμάται με το s. Ο λόγος όπως είναι γνωστό από την στατιστική είναι ότι οι κατανομές Suden- και κανονική είναι αρκετά κοντά όταν οι βαθμοί ελευθερίας της πρώτης υπερβαίνουν τους 30. Δημιουργούμε ένα νέο workfile (undaed, 7 παρατηρήσεις) και δίνουμε την εντολή daa x Στην συνέχεια δίνουμε τις παρατηρήσεις 3, -, -, 0,,, 3 οι οποίες είναι τα σημεία στα οποία θα συγκρίνουμε τις κατανομές. Στην συνέχεια δίνουμε την εντολή show x @cnorm(x) @cdis(x,0) @cdis(x,0) @cdis(x,30) @cdis(x,40) @cdis(x,70) δηλαδή υπολογίζουμε τις συναρτήσεις κατανομής της κανονικής και διαφόρων Suden- με 0, 0, 30, 40 και 70 βαθμούς ελευθερίας. Τα αποτελέσματα είναι τα ακόλουθα. obs X @CNORM(X) @CTDIST(X, 0) @CTDIST(X, 0) @CTDIST(X,3 0) @CTDIST(X,4 0) @CTDIST 0) -3.000000 0.00350 0.00667 0.003538 0.00695 0.0035 0.008 -.000000 0.0750 0.036694 0.09633 0.0733 0.066 0.046 3 -.000000 0.58655 0.70447 0.6468 0.6654 0.666 0.603 4 0.000000 0.500000 0.500000 0.500000 0.500000 0.500000 0.5000 5.000000 0.84345 0.89553 0.83537 0.837346 0.838339 0.8396 6.000000 0.97750 0.963306 0.970367 0.97687 0.973839 0.9753 7 3.000000 0.998650 0.99338 0.99646 0.997305 0.997685 0.998 Όπως φαίνεται από τον παραπάνω πίνακα, όσο αυξάνονται οι βαθμοί ελευθερίας τόσο καλύτερα προσεγγίζει την κανονική η κατανομή Suden-. Στην συνέχεια θα θέλαμε να δούμε διαγραμματικά την συνάρτηση κατανομής της κανονικής και της Suden- με 5 βαθμούς ελευθερίας. Θα θέλαμε να συγκρίνουμε τις κατανομές σε 50 σημεία στο διάστημα από έως οπότε θα δημιουργήσουμε ένα workfile με 50 παρατηρήσεις (undaed). Για να αποφύγουμε να περάσουμε τα στοιχεία με το χέρι μπορούμε να χρησιμοποιήσουμε την εξής διαδικασία. Με την εντολή genr =@rend
δημιουργούμε μια σειρά τις οποίας οι τιμές είναι 0,,,,48,49,50. Θέλουμε να μετασχηματίσουμε αυτή την σειρά σε μια νέα (έστω x) που να αρχίζει από το, να καταλήγει στο + και να καλύπτει τα ενδιάμεσα σημεία σε ίσες αποστάσεις. Η σειρά αυτή μπορεί να είναι γραμμικός μετασχηματισμός της πρώτης, δηλαδή μπορούμε να προσδιορίσουμε α και β τέτοια ώστε x = α + β και αν = 0 να έχουμε x = ενώ αν = 49 να έχουμε x =. Αν = 0 τότε x = a, οπότε έχουμε a =. Αν = 49 τότε x = a + β ( 49) = + β (49) = β = 4 / 49. Επομένως δημιουργούμε την σειρά genr x=-+(4/49)* Η σειρά αυτή είναι πραγματικά όπως την θέλουμε. Στην συνέχεια δίνουμε την εντολή sca x @dnorm(x) @ddis(x,5) με την οποία συγκρίνουμε τις συναρτήσεις πυκνότητας της κανονικής κατανομής και της κατανομής Suden- με 5 βαθμούς ελευθερίας. Με διπλό κλικ στο διάγραμμα επιλέγουμε X-Y Line Graph από την επιλογή Graph Type για να συνδέονται τα σημεία και να έχει το διάγραμμα μια καλύτερη παρουσίαση. Το αποτέλεσμα είναι όπως παρακάτω. 0.5 0.4 0.3 0. @DNORM(X) @DTDIST(X,5) 0. 0.0 - - 0 Αν συγκρίνουμε την κανονική με την Suden- με 30 βαθμούς ελευθερίας θα έχουμε X sca x @dnorm(x) @ddis(x,30) η οποία δίνει το ακόλουθο διάγραμμα. 0.5 0.4 0.3 0. @DNORM(X) @DTDIST(X,30) 0. 0.0 - - 0
Η σύγκριση των συναρτήσεων κατανομής μπορεί να γίνει με την εντολή sca x @cnorm(x) @cdis(x,30) και έχουμε το ακόλουθο διάγραμμα..0 0.8 0.6 0.4 @CNORM(X) @CTDIST(X,30) 0. 0.0 - - 0 X Πρακτικά λοιπόν η συμφωνία των κατανομών είναι τόσο μεγάλη ώστε να μας επιτρέπει να χρησιμοποιούμε την κανονική κατανομή αντί για την κατανομή Suden όταν οι βαθμοί ελευθερίας είναι μεγαλύτεροι του 30. Τέλος στο EViews υπάρχουν οι συναρτήσεις πυκνότητας και κατανομής αρκετών άλλων κατανομών όπως της βήτα, γάμα, χ, F κλπ. Στα επόμενα θα δούμε τις κατανομές χ και F που έχουν εφαρμογές στην οικονομετρία και πιο συγκεκριμένα στους οικονομετρικούς ελέγχους υποθέσεων. Η κατανομή χ έχει την εξής ιδιότητα. Αν Z, Z,.., Z n είναι ανεξάρτητες τυχαίες μεταβλητές από την τυπική κανονική κατανομή N (0,) τότε η τυχαία μεταβλητή Y = n Z i i= θα έχει μια κατανομή που είναι γνωστή σαν χ με n βαθμούς ελευθερίας, ή χ n όπου το n είναι παράμετρος της κατανομής. Η κατανομή αυτή χρησιμοποιείται στον έλεγχο της διακύμανσης του πληθυσμού και ασφαλώς ορίζεται μόνον στο διάστημα [ 0, ). Για να δούμε διαγραμματικά την κατανομή αυτή, μπορούμε να ορίσουμε εκ νέου την μεταβλητή x ως εξής genr x= και στην συνέχεια δίνουμε την εντολή sca x @dchisq(x,) @dchisq(x,0) @dchisq(x,0)
η οποία παράγει το επόμενο διάγραμμα. 0.4 0.3 0. @DCHISQ(X,) @DCHISQ(X,0) @DCHISQ(X,0) 0. Μια ιδιότητα που προκύπτει κατευθείαν από το διάγραμμα είναι ότι καθώς αυξάνονται οι βαθμοί ελευθερίας η κατανομή τείνει να γίνεται πιο συμμετρική γύρω από τον μέσο της και τελικά μπορεί και αυτή να προσεγγισθεί από την κανονική κατανομή. Ας υποθέσουμε ότι έχουμε ένα τυχαίο δείγμα από κανονικό πληθυσμό με μέγεθος n = 0 από το οποίο εκτιμήσαμε s =. 8. Μπορούμε να πούμε ότι η διακύμανση του πληθυσμού σ ισούται με ; Η στατιστική του ελέγχου είναι ( n ) s 9.8 = = 6.695. Αν θέλουμε να ελέγξουμε την υπόθεση H : 0 σ σ έναντι της εναλλακτικής H : σ > σε επίπεδο σημαντικότητας 8% χρειαζόμαστε την κριτική τιμή χ = n, α χ9,0.9 την οποία μπορούμε να βρούμε με την εντολή show @qchisq(0.9, 9) το οποίο δίνει την κριτική τιμή 8.836. Άρα μπορούμε να δεχθούμε την μηδενική υπόθεση σε επίπεδο σημαντικότητας 8%. Για να προσδιορίσουμε την p τιμή του ελέγχου δίνουμε την εντολή show -@cchisq(6.695,9) 0.0 0 0 0 30 40 της οποίας το αποτέλεσμα είναι 0.960. Επομένως μπορούμε να απορρίψουμε την μηδενική υπόθεση σε επίπεδα σημαντικότητας ίσα ή μεγαλύτερα από.9% περίπου. Η κατανομή F χαρακτηρίζεται από δυο παραμέτρους βαθμών ελευθερίας, ν και ν και χρησιμοποιείται στον έλεγχο ισότητας δυο διακυμάνσεων, τον έλεγχο περισσότερων από μιας παραμέτρων στα οικονομετρικά υποδείγματα κλπ. Με την εντολή genr x=x/5 sca x @dfdis(x,,0) @dfdis(x, 5,0) @dfdis(x, 0,40) X
μπορούμε να έχουμε το ακόλουθο διάγραμμα.0 0.8 0.6 0.4 @DFDIST(X,,0) @DFDIST(X,5,0) @DFDIST(X,0,40) 0. 0.0 0 4 6 8 X Αν υποθέσουμε ότι έχουμε δυο δείγματα από κανονικούς πληθυσμούς με μεγέθη και 0 από τα οποία εκτιμήσαμε s 6. 9 και s 6. 85 τότε ο λόγος = s / s = 0.903650 έχει την F, 9 κατανομή. Για να προσδιορίσουμε την κριτική τιμή της κατανομής για τον έλεγχο H 0 : σ / σ = έναντι της εναλλακτικής H : σ / σ (με επίπεδο σημαντικότητας 5%) μπορούμε να χρησιμοποιήσουμε την εντολή show @qfdis(0.05,, 9) @qfdis(0.975,, 9) που θα μας δώσει τα σημεία μέχρι τα οποία υπάρχει μάζα.5% και 97.5% αντίστοιχα. Τα σημεία αυτά είναι 0.7875 3.9074 = Φυσικά στην περίπτωση αυτή δεχόμαστε την μηδενική υπόθεση. Ο λόγος για τον οποίο χρειαζόμαστε και τις δυο κριτικές τιμές (δηλαδή σε.5% και 97.5%) είναι ότι η κατανομή F δεν είναι συμμετρική. Ας υποθέσουμε τώρα ότι έχουμε τον έλεγχο H 0 : σ / σ έναντι της εναλλακτικής H : σ / σ < και θέλουμε να προσδιορίσουμε την p τιμή. Στην περίπτωση αυτή μπορούμε να χρησιμοποιήσουμε την εντολή show @cfdis(0.903650,, 9) η οποία δίνει 0.4970, δηλαδή μπορούμε να απορρίψουμε την μηδενική υπόθεση σε επίπεδα σημαντικότητας ίσα ή μεγαλύτερα του 4.9%. Πρακτικά αυτό σημαίνει αποδοχή της μηδενικής υπόθεσης (στα συνηθισμένα επίπεδα εμπιστοσύνης). ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Οι έλεγχοι των βασικών στατιστικών υποθέσεων μπορούν να γίνουν αυτόματα στο EViews χωρίς να χρειάζεται ο υπολογισμός των στατιστικών ελέγχου, των κριτικών
τιμών ή των p τιμών και έτσι μπορεί κανείς να επικεντρωθεί στην λογική και τα αποτελέσματα των ελέγχων παρά τις λεπτομέρειες των υπολογισμών. Για την διεξαγωγή των παρακάτω ελέγχων θα χρησιμοποιήσουμε στοιχεία για την φτώχεια σε 3 χώρες της Ευρωπαϊκής Ένωσης πριν και μετά την εφαρμογή ενός μέτρου κοινωνικής πολιτικής. Οι δυο μεταβλητές που έχουμε είναι BEFORE και AFTER. Έλεγχος του μέσου Για να ελέγξουμε την υπόθεση ότι ο μέσος του πληθυσμού από τον οποίο ελήφθη η σειρά BEFORE ισούται με 5 κάνουμε διπλό κλικ στη σειρά και δίνουμε την σειρά εντολών View/Tess for Descripive Saisics/Simple Hypohesis Tess Στον πίνακα επιλογών που εμφανίζεται ορίζουμε την τιμή του μέσου που θέλουμε να ελέγξουμε (δηλαδή 5). Τα αποτελέσματα του ελέγχου είναι τα ακόλουθα. Hypohesis Tesing for BEFORE Dae: 06/9/0 Time: :9 Sample: 3 Included observaions: Tes of Hypohesis: Mean = 5.00000 Sample Mean = 6.6667 Sample Sd. Dev. = 3.76850 Mehod Value Probabiliy -saisic.07436 0.3057 Το πακέτο μας δίνει απευθείας τον δειγματικό μέσο X = 6. 6667 και την δειγματική τυπική απόκλιση s = 3. 76850. Η τιμή της στατιστικής ελέγχου X µ ( = ) είναι.074 και η s / n p τιμή που δίνεται απευθείας είναι 0.3057, άρα μπορούμε να απορρίψουμε την υπόθεση σε επίπεδα σημαντικότητας μεγαλύτερα του 30% περίπου. Σε μικρότερα επίπεδα σημαντικότητας θα πρέπει να δεχθούμε την υπόθεση. Πρέπει να σημειωθεί ότι οι έλεγχοι που αυτόματα διεξάγει το πακέτο, είναι δικατάληκτοι έλεγχοι. Αν έχουμε μονοκατάληκτο έλεγχο μπορούμε να χρησιμοποιήσουμε την ίδια τιμή της στατιστικής αλλά πρέπει να τροποποιήσουμε την p τιμή σύμφωνα με τα όσα είναι γνωστά από την στατιστική. Τιμές p για μονοκατάληκτο έλεγχο μπορούν βέβαια να βρεθούν με την χρήση των συναρτήσεων κατανομής της Suden- κατανομής. Έλεγχος υποθέσεων για τον μέσο μπορεί να διεξαχθεί όταν η τιμή της τυπικής απόκλισης του πληθυσμού, σ, είναι γνωστή. Την τιμή αυτή ορίζουμε στον πίνακα επιλογών κάτω από την ένδειξη mean es will use a known sandard deviaion if supplied. Κάτι τέτοιο όμως είναι σπάνιο στην πράξη. Αν πχ ήταν γνωστό ότι σ = 3.5 θα είχαμε τα ακόλουθα αποτελέσματα.
Hypohesis Tesing for BEFORE Dae: 06/9/0 Time: :38 Sample: 3 Included observaions: Tes of Hypohesis: Mean = 5.00000 Assuming Sd. Dev. = 3.500000 Sample Mean = 6.6667 Sample Sd. Dev. = 3.76850 Mehod Value Probabiliy Z-saisic.5470 0.48 -saisic.07436 0.3057 Η κατάλληλη στατιστική στην περίπτωση αυτή είναι το z που έχει την τιμή.5470 με p τιμή 0.48. Προσέξτε ότι η τυπική απόκλιση δεν εκτιμάται αλλά έχει μια γνωστή τιμή, πράγμα που φαίνεται από το ότι στα αποτελέσματα έχουμε την έκφραση Assuming Sd. Dev. = 3.500000 Έλεγχος της διακύμανσης Ο έλεγχος της διακύμανσης γίνεται στο EViews ακριβώς με την ίδια διαδικασία με την διαφορά ότι στον πίνακα ελέγχου ορίζουμε μόνον την τιμή της διακύμανσης. Αν ορίσουμε και την τιμή του μέσου, τότε το πακέτο θα κάνει δυο ξεχωριστούς ελέγχους, έναν για τον μέσο και έναν για την διακύμανση. Αν υποθέσουμε ότι θέλουμε να ελέγξουμε την υπόθεση ότι η διακύμανση της σειράς BEFORE είναι 8, κάνουμε διπλό κλικ στη σειρά και δίνουμε την σειρά εντολών View/Tess for Descripive Saisics/Simple Hypohesis Tess Στον πίνακα επιλογών που εμφανίζεται ορίζουμε την τιμή της διακύμανσης (Variance) που θέλουμε να ελέγξουμε (δηλαδή 8). Τα αποτελέσματα του ελέγχου είναι τα ακόλουθα. Hypohesis Tesing for BEFORE Dae: 06/9/0 Time: :5 Sample: 3 Included observaions: Tes of Hypohesis: Variance = 8.000000 Sample Variance = 4.55 Mehod Value Probabiliy Variance Raio 9.45833 0.0533 ( n ) s Η στατιστική του ελέγχου είναι σ την εντολή την οποία μπορούμε να υπολογίσουμε με show *4.55/8
και το αποτέλεσμα θα είναι αυτό που μας έδωσε το πακέτο και πριν, δηλαδή 9.45833. Από την p τιμή βλέπουμε ότι μπορούμε να απορρίψουμε την υπόθεση σε επίπεδο σημαντικότητας 6% ή 0% αλλά όχι σε 5%. Αυτό βέβαια είναι ένα οριακό αποτέλεσμα. Έλεγχος ισότητας δυο μέσων Εφόσον τα στοιχεία μας αναφέρονται στο ποσοστό φτώχειας πριν και μετά την εφαρμογή ενός μέτρου κοινωνικής πολιτικής, είναι λογικό να μας απασχολεί περισσότερο η υπόθεση ότι το μέσο ποσοστό είναι το ίδιο πριν και μετά την εφαρμογή του μέτρου. Για να ελέγξουμε την υπόθεση ότι οι δυο μέσοι είναι ίσοι, δίνουμε την εντολή show before afer και στην συνέχεια την σειρά εντολών View/Tess of Equaliy Στον πίνακα επιλογών που εμφανίζεται, επιλέγουμε Mean και έχουμε τα ακόλουθα αποτελέσματα. Tes for Equaliy of Means Beween Series Dae: 06/9/0 Time: :59 Sample: 3 Included observaions: 3 Mehod df Value Probabiliy -es 3 7.066540 3.36E-07 Anova F-saisic (, 3) 49.93598 3.36E-07 Analysis of Variance Source of Variaion df Sum of Sq. Mean Sq. Beween 635.503 635.503 Wihin 3 9.5897.79 Toal 4 97.8400 38.66000 Caegory Saisics Sd. Err. Variable Coun Mean Sd. Dev. of Mean BEFORE 6.6667 3.76850.085953 AFTER 3 6.0769 3.377907 0.936863 All 5 0.9000 6.777.43543
Η στατιστική του ελέγχου είναι 7.066 με p τιμή που είναι πρακτικά μηδέν, δηλαδή 7 3.36E-07 που σημαίνει 3.36 0. Στο τέλος του πίνακα, κάτω από την κατηγορία το πακέτο δίνει τους δειγματικούς μέσους και τις δειγματικές τυπικές αποκλίσεις καθώς επίσης και τα τυπικά σφάλματα των δειγματικών μέσων, που όπως είναι γνωστό απ ο την στατιστική είναι s / n. Έτσι πχ οι δειγματικοί μέσοι είναι 6.6 και 6.07 που σημαίνει ότι τα ποσοστά φτώχειας μειώθηκαν από 6.6% σε 6.07%. Τα τυπικά σφάλματα των μέσων είναι αρκετά μικρά (περίπου %) και επομένως η μείωση αυτή είναι δραστική, πράγμα που αντανακλάται στις p τιμές του ελέγχου. Πρέπει να σημειωθεί ότι το πακέτο διεξάγει τον έλεγχο με την υπόθεση ότι οι πληθυσμοί δεν έχουν κοινή διακύμανση και επομένως εκτιμά δυο δειγματικές διακυμάνσεις, s για το πρώτο δείγμα και s για το δεύτερο δείγμα. Η στατιστική του ελέγχου είναι X X X X = Var( X X ) s / n + s / n που έχει την κατανομή. n +n Για να διεξαχθεί έλεγχος του μέσου με κοινή διακύμανση μπορούμε να ακολουθήσουμε την ίδια διαδικασία αλλά να τσεκάρουμε στον πίνακα επιλογών την επιλογή Common Sample. Έλεγχος ισότητας δυο διακυμάνσεων Για τον έλεγχο της ισότητας δυο διακυμάνσεων χρησιμοποιούμε την σειρά εντολών View/Tess of Equaliy Στον πίνακα επιλογών που εμφανίζεται, επιλέγουμε Variance και έχουμε τα ακόλουθα αποτελέσματα. Tes for Equaliy of Variances beween Series Dae: 06/9/0 Time: 3:0 Sample: 3 Included observaions: 3 Mehod df Value Probabiliy F-es (, ).4045 0.7838 Barle 0.763 0.7090 Levene (, 3) 0.057668 0.8348 Brown-Forsyhe (, 3) 0.035498 0.8508 Caegory Saisics Mean Abs. Mean Abs. Mean Tukey- Variable Coun Sd. Dev. Mean Diff. Median Diff. Siegel Rank BEFORE 3.76850 3.07778 3.000000.75000 AFTER 3 3.377907.8507.84654 3.3077 All 5 6.777.93640.90000 3.00000 Barle weighed sandard deviaion: 3.56669
Η τιμή της στατιστικής ελέγχου είναι.4045 που έχει την κατανομή F με βαθμούς ελευθερίας (, ). Η p τιμή του ελέγχου είναι 0.78 και επομένως δεν μπορούμε να απορρίψουμε την υπόθεση της ισότητας των διακυμάνσεων στα συνηθισμένα επίπεδα σημαντικότητας. Οι υπόλοιπες στατιστικές που δίνει το πακέτο δεν θα μας απασχολήσουν. Από τους παραπάνω ελέγχους θα πρέπει αν είναι φανερό ότι η εφαρμογή του μέτρου κοινωνικής πολιτικής μείωσε το μέσο ποσοστό φτώχειας στην Ε.Ε χωρίς να επηρεάσει την διακύμανση του από χώρα σε χώρα. Επομένως είχαμε μια μετατόπιση της κατανομής προς τα αριστερά χωρίς να επηρεασθεί η διακύμανσή της. Έλεγχος αναλογίας Το EViews δεν δίνει απευθείας αποτελέσματα για τον έλεγχο της αναλογίας αλλά ο έλεγχος αυτός μπορεί να γίνει εύκολα. Ας υποθέσουμε ότι έχουμε ένα δείγμα.000 ατόμων τα 55 από τα οποία δήλωσαν ότι είναι ψηφοφόροι ενός κόμματος. Η δειγματική αναλογία επομένως είναι p = 55 /000 = 0. 55. Για να ελέγξουμε την υπόθεση ότι η άγνωστη αναλογία είναι π = 0. 50, η στατιστική είναι z = p π 0.55 0.5 = π ( π ) / n 0.5 0.5 /000 την οποία μπορούμε να υπολογίσουμε με την εντολή show (0.55-0.5)/sqr(0.5*0.5/000) που δίνει.5839. Η στατιστική έχει την τυπική κανονική κατανομή και αφού η κριτική τιμή σε επίπεδο σημαντικότητας 5% είναι.96, θα πρέπει να αποδεχθούμε την μηδενική υπόθεση. Για να βρούμε την p τιμή μπορούμε να χρησιμοποιήσουμε την τυπική κανονική συνάρτηση κατανομής σύμφωνα με τα γνωστά, δηλαδή με την εντολή show *(-@cnorm(.5839)) που δίνει 0.3846 οπότε η υπόθεση θα μπορούσε να απορριφθεί σε επίπεδα μεγαλύτερα του.38% περίπου. Έλεγχος ισότητας δυο μέσων ή διακυμάνσεων σε μια ενιαία σειρά Πολλές φορές έχουμε τα στοιχεία μας σε μια ενιαία σειρά και θέλουμε να δούμε αν οι μέσοι είναι ίσοι με βάση κάποια ταξινόμηση. Ας θεωρήσουμε πχ τα ακόλουθα στοιχεία.
obs X I 5.0000.000000 35.0000.000000 3 7.0000.000000 4 0.0000 0.000000 5 40.0000.000000 6 376.0000 0.000000 7 67.0000 0.000000 8 55.0000.000000 9 450.0000 0.000000 0 58.0000.000000 Τα στοιχεία αυτά αναφέρονται σε μηνιαία εισοδήματα ενός δείγματος ατόμων (μεταβλητή X ). Η μεταβλητή I = αν το άτομο είναι άνδρας και I = 0 αν είναι γυναίκα. Μεταβλητές σαν την I λέγονται και ψευδομεταβλητές. Ο σκοπός μας είναι να ελέγξουμε αν υπάρχει στατιστικά σημαντική διαφορά στο μέσο εισόδημα των ανδρών και γυναικών. Για να ελέγξουμε την διαφορά των μέσων χωρίς να κατασκευάσουμε δυο σειρές εισοδημάτων (μια για άνδρες και μια για γυναίκες) κάνουμε διπλό κλικ στην σειρά X και δίνουμε την σειρά εντολών View/Tess for Descripive Sas/Equaliy Tess by Classificaion Στην συνέχεια επιλέγουμε το όνομα της σειράς κατάταξης (δηλαδή την I ) κάτω από την ένδειξη Series/Group for Classify και επιλέγουμε αν θέλουμε έλεγχο του μέσου ή της διακύμανσης. Αν επιλέξουμε έλεγχο του μέσου θα έχουμε τα ακόλουθα αποτελέσματα.
Tes for Equaliy of Means of X Caegorized by values of I Dae: 06/9/0 Time: 4:4 Sample: 0 Included observaions: 0 Mehod df Value Probabiliy -es 8 0.965379 0.3667 Anova F-saisic (, 8) 0.93956 0.3667 Analysis of Variance Source of Variaion df Sum of Sq. Mean Sq. Beween 093.75 093.75 Wihin 8 8070.8 633.84 Toal 9 064.5 46.7 Caegory Saisics Sd. Err. I Coun Mean Sd. Dev. of Mean 0 4 45.7500 64.8967 8.44834 6 3.0000 4.0659 57.58993 All 0 359.5000 49.8757 47.39485 Η στατιστική ελέγχου είναι 0.965379 και έχει p τιμή 0.3667 που σημαίνει ότι στα επίπεδα σημαντικότητας 5%, 0% ή 0% μπορούμε να δεχθούμε την μηδενική υπόθεση ότι οι δυο μέσοι δεν διαφέρουν στατιστικά σημαντικά ανάμεσα σε άνδρες και γυναίκες. Αν επιλέγαμε έλεγχο ισότητας των διακυμάνσεων θα είχαμε τα εξής αποτελέσματα.
Tes for Equaliy of Variances of X Caegorized by values of I Dae: 06/9/0 Time: 4:6 Sample: 0 Included observaions: 0 Mehod df Value Probabiliy F-es (5, 3).366405 0.8480 Barle 0.083 0.77497 Levene (, 8) 0.04555 0.836333 Brown-Forsyhe (, 8) 0.057670 0.8657 Caegory Saisics Mean Abs. Mean Abs. Mean Tukey- I Coun Sd. Dev. Mean Diff. Median Diff. Siegel Rank 0 4 64.8967 7.7500 7.7500 5.500000 6 4.0659 06.0000 03.6667 5.500000 All 0 49.8757 0.7000 09.3000 5.500000 Barle weighed sandard deviaion: 50.4455 Εφόσον η p τιμή είναι 0.8480 μπορούμε να δεχθούμε την μηδενική υπόθεση ότι οι δυο διακυμάνσεις δεν διαφέρουν στατιστικά σημαντικά ανάμεσα σε άνδρες και γυναίκες στα συνηθισμένα επίπεδα σημαντικότητας. Έλεγχοι περισσότερων μέσων ή περισσότερων διακυμάνσεων Για να διαπιστώσουμε αν περισσότερες από δυο σειρές έχουν τον ίδιο μέσο ή διακύμανση μπορούμε να κατασκευάσουμε μια ομάδα (group) με τις αποδόσεις των χρηματιστηριακών δεικτών και να δώσουμε τις εντολές διπλό κλικ στην ομάδα MYVAR και επιλέγουμε View Tess of equaliy Τα αποτελέσματα για τον έλεγχο ισότητας των μέσων είναι τα ακόλουθα.
Tes for Equaliy of Means Beween Series Dae: 06/0/0 Time: 8:46 Sample: 5 Included observaions: 5 Mehod df Value Probabiliy Anova F-saisic (3, 996) 0.053005 0.983908 Analysis of Variance Source of Variaion df Sum of Sq. Mean Sq. Beween 3 0.0003 4.36E-05 Wihin 996 0.8968 0.00083 Toal 999 0.898 0.0008 Caegory Saisics Sd. Err. Variable Coun Mean Sd. Dev. of Mean RASF 50 0.00433 0.0488 0.00359 RBIO 50 0.0084 0.03900 0.005 RLSG 50 0.0099 0.040450 0.00558 RGEN 50 0.0074 0.04955 0.00578 All 000 0.0048 0.08647 0.000906 Ο έλεγχος αυτός είναι επέκταση του στατιστικού ελέγχου δυο μέσων και έχει την F κατανομή. Από την p τιμή του ελέγχου (0.983) είναι φανερό ότι δεν μπορούμε να απορρίψουμε την μηδενική υπόθεση (που υποθέτει ισότητα όλων των μέσων) σε επίπεδα σημαντικότητας 5%, 0% ή 0%. ΑΣΚΗΣΗ. Για ποιον λόγο οι μέσες αποδόσεις βρέθηκαν στατιστικά ίσες;
Παρόμοια μπορούμε να κάνουμε και έλεγχο ισότητας των διακυμάνσεων και να έχουμε τα παρακάτω αποτελέσματα. Tes for Equaliy of Variances beween Series Dae: 06/0/0 Time: 9:6 Sample: 5 Included observaions: 5 Mehod df Value Probabiliy Barle 3 3.9003 0.000000 Levene (3, 996) 9.440 4.49E- Brown-Forsyhe (3, 996) 6.4460.95E-0 Caegory Saisics Mean Abs. Mean Abs. Variable Coun Sd. Dev. Mean Diff. Median Diff. RASF 50 0.0488 0.06457 0.0639 RBIO 50 0.03900 0.0683 0.0689 RLSG 50 0.040450 0.08 0.07470 RGEN 50 0.04955 0.0769 0.07674 All 000 0.08647 0.09773 0.09589 Barle weighed sandard deviaion: 0.08688 Ο έλεγχος μπορεί να γίνει με διάφορους τρόπους (στατιστικές Barle, Forsyhe κλπ) αλλά όλες καταλήγουν στο ίδιο συμπέρασμα αφού η p τιμή είναι πρακτικά μηδέν. ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΣΤΟ EVIEWS Στην συνέχεια θα δούμε ορισμένες δυνατότητες του πακέτου στον τομέα της γραμμικής άλγεβρας. Σαν παράδειγμα θα χρησιμοποιήσουμε μια οικονομία με τρεις τομείς (γεωργία, βιομηχανία και υπηρεσίες πχ) των οποίων το προϊόν συμβολίζουμε με x, x και x 3. Το προϊόν του κάθε τομέα ισούται με τις αποστολές εμπορευμάτων (εισροών) προς τους άλλους τομείς και την αποστολή εμπορευμάτων προς τον δημόσιο τομέα. Αν υποθέσουμε ότι a ij συμβολίζει την αποστολή από τον κλάδο i στον κλάδο j κατά μονάδα του προϊόντος του κλάδου j και b i η συνολική ζήτηση του δημόσιου τομέα για το προϊόν του κλάδου i θα έχουμε x + = ax + a x + a3x3 b = ax + a x + a3x3 b 3 = a3x + a3 x + a33x3 b3 x + x + Σε αυτό το σύστημα, a αντιπροσωπεύει το μέρος του προϊόντος της γεωργίας που παραμένει στον τομέα σαν εισροή (κατά μονάδα του αγροτικού προϊόντος), a αντιπροσωπεύει το μέρος του προϊόντος της γεωργίας που χρησιμοποιείται σαν εισροή στην βιομηχανία (κατά μονάδα του βιομηχανικού προϊόντος) κοκ. Σε μορφή μητρών οι εξισώσεις αυτές μπορούν να γραφούν στην μορφή
x = Ax + b Ο σκοπός μας είναι να προσδιορίσουμε το προϊόν ισορροπίας του κάθε τομέα. Λύνοντας το γραμμικό σύστημα έχουμε ( I A) x = b ή x = ( I A) b όπου I είναι η 3 3 μοναδιαία μήτρα. Για να λύσουμε αυτό το σύστημα με το πακέτο μπορούμε να ανοίξουμε έναν νέο φάκελο εργασίας (undaed με παρατήρηση πχ) όπως στην επόμενη οθόνη. Στην συνέχεια δίνουμε την εντολή marix(3,3) A η οποία ορίζει μια νέα μήτρα με την ονομασία A της οποίας οι διαστάσεις είναι 3 3. Ο φάκελος εργασίας περιέχει πλέον ένα νέο στοιχείο με την ονομασία A με το σύμβολο της μήτρας.
Κάνοντας διπλό κλικ στην μήτρα A μπορούμε να εισάγουμε τα ακόλουθα στοιχεία για την μήτρα εισροών-εκροών με την χρήση της επιλογής edi:
Στην συνέχεια ορίζουμε το διάνυσμα b με την χρήση της εντολής vecor(3) b με την οποία ορίζουμε το διάνυσμα b με διαστάσεις 3. Στην συνέχεια εισάγουμε τα στοιχεία για το διάνυσμα b κάνοντας διπλό κλικ στο αντικείμενο b στον φάκελο εργασίας και χρησιμοποιώντας την επιλογή edi:
Για να λύσουμε το γραμμικό σύστημα x = ( I A) b θα χρησιμοποιήσουμε τις συναρτήσεις του πακέτου. Καταρχήν θα πρέπει να κατασκευάσουμε την μοναδιαία μήτρα με την εντολή marix i = @ ideniy(3) και στην συνέχεια θα λύσουμε το σύστημα με την εντολή marix x = @ inverse( i a) * b Στην συνέχεια κάνοντας διπλό κλικ στο αντικείμενο x στον φάκελο εργασίας έχουμε την λύση του γραμμικού συστήματος.
Μπορούμε να ελέγξουμε αν πραγματικά έχουμε βρει την λύση κατασκευάζοντας το διάνυσμα u = ( I A) x b και ελέγχοντας αν είναι μηδέν. Αρκετές άλλες συναρτήσεις μας επιστρέφουν χαρακτηριστικά μητρών που μπορεί να είναι χρήσιμα σε ορισμένες αναλύσεις, όπως πχ η ορίζουσα μιας μήτρας ή ο βαθμός της με τις εντολές marix da = @ de( a) marix ra = @ rank( a)
Είναι δυνατόν να συνδυάσουμε αρκετές συναρτήσεις σε μια και μόνον εντολή. Σαν παράδειγμα ας υποθέσουμε ότι θέλουμε να υπολογίσουμε την μήτρα B = ( A A). Αυτό μπορεί να γίνει με την εντολή
marix aa = @ inverse(@ ranspose( a) * a) και έχουμε το εξής αποτέλεσμα. Η συνάρτηση @ ranspose ( a) μας επιστρέφει την ανάστροφη μιας μήτρας. Το γινόμενο Kronecker δυο μητρών ορίζεται ως A B = [ a B]. Για να υπολογίσουμε το γινόμενο Kronecker των μητρών a και aa και έχουμε ij
Είναι σαφές ότι αυτή θα πρέπει να είναι μια μήτρα 9 9.