ΚΕΦΑΛΑΙΟ 6 Τεχνικές ελάττωσης διακύμανσης 6.. Στατιστική ανάλυση δεδομένων από προσομοίωση Όπως είδαμε και στα προηγούμενα κεφάλαια προκειμένου να εκτιμήσουμε μία ποσότητα θ η οποία συνδέεται με ένα στοχαστικό μοντέλο παράγουμε τυχαίους αριθμούς Χ Χ... Χ ~ F με μέση τιμή θ από το μοντέλο αυτό. Χρησιμοποιώντας τον νόμο των μεγάλων αριθμών προκύπτει ότι Χ Χ θ και επομένως εκτιμούμε σημειακά το θ από το Χ. Σε αυτό το σημείο όμως γεννάται το ερώτημα πόσο καλή είναι η εκτίμηση που παίρνουμε ή πόσους αριθμούς πρέπει να παράγουμε για να θεωρείται «καλή» η εκτίμηση βάσει κάποιων κριτηρίων που έχουμε θέσει. Επίσης ένα άλλο ερώτημα που τίθεται είναι αν μπορούμε να κατασκευάσουμε ένα διάστημα εμπιστοσύνης για την εκτίμηση του θ. Στην παράγραφο λοιπόν αυτή θα επιχειρήσουμε να εξετάσουμε τα παραπάνω ερωτήματα. 6... Ο Δειγματικός μέσος και η δειγματική διασπορά Έστω Χ Χ...Χ ανεξάρτητες και ισόνομες τυχαίες μεταβλητές από μία κατανομή F με μέση τιμή θ και διασπορά σ δηλαδή ΕΧ θ Χ σ. Η εκτίμηση της πληθυσμιακής μέσης τιμής θ συνήθως γίνεται μέσω της δειγματικής μέσης τιμής ˆ θ η οποία είναι αμερόληπτη εκτιμήτρια του θ. Ένα μέτρο του πόσο καλή είναι αυτή η εκτιμήτρια δίνεται από το μέσο τετραγωνικό της σφάλμα αναμενόμενη τετραγωνική απόκλιση της εκτιμήτριας από την παράμετρο s Επειδή εδώ E[ θ ] E E θ E bas. E θ θα είναι σ s E[ θ ]. Μία δυσκολία που παρουσιάζεται εδώ είναι ότι το σ είναι συνήθως άγνωστο. Επομένως για να μπορέσουμε να χρησιμοποιήσουμε το μέσο τετραγωνικό σφάλμα θα πρέπει πρώτα να εκτιμήσουμε και το σ από τα δεδομένα. Ως γνωστό αυτό εύκολα μπορεί να γίνει χρησιμοποιώντας την δειγματική διασπορά η οποία είναι αμερόληπτη εκτιμήτρια της πληθυσμιακής διασποράς σ. Επομένως ένα μέτρο του πόσο «καλή» είναι η εκτίμηση του θ από το θα είναι το εκτιμημένο μέσο τετραγωνικό σφάλμα Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 0
ˆ σ s. Άρα το παραπάνω μέγεθος μπορεί π.χ. να χρησιμοποιηθεί για την σύγκριση της αποτελεσματικότητας μεταξύ δύο εκτιμητριών του θ. 6... Διαστήματα εμπιστοσύνης για τον πληθυσμιακό μέσο. Έστω τώρα ότι προκειμένου να εκτιμήσουμε το θ παράγουμε τυχαίους αριθμούς Χ Χ... Χ ~ F και λαμβάνουμε θˆ. Η εκτίμηση αυτής της μορφής προφανώς είναι σημειακή εκτίμηση διότι εκτιμούμε το θ από ένα σημείο το. Η σημειακή όμως εκτίμηση αν και μας δίνει μία τιμή που πρέπει να είναι «κοντά» στην υπό εκτίμηση παράμετρο θ δεν μας δίνει καμία πληροφορία για την ακρίβεια ή το σφάλμα της εκτίμησης. Θα ήταν συνεπώς προτιμότερο αν μπορούσαμε να πούμε ότι βάσει του συγκεκριμένου τυχαίου δείγματος το θ βρίσκεται με κάποια «βεβαιότητα» μεταξύ δύο τιμών. Θα ήταν δηλαδή προτιμότερο να εκτιμήσουμε το θ χρησιμοποιώντας ένα διάστημα εμπιστοσύνης. Επειδή στην προσομοίωση λαμβάνουμε πάντοτε μεγάλα δείγματα μπορούμε να θεωρήσουμε επικαλούμενοι το Κεντρικό Οριακό Θεώρημα και τον νόμο των μεγάλων αριθμών για το ότι σ ότι θ ~ N0 και συνεπώς θα ισχύει ότι θ Pr za za a όπου z a είναι το άνω a-σημείο της τυπικής κανονικής κατανομής. Από την παραπάνω σχέση προκύπτει ότι και άρα τελικά το Pr za θ za a za za θα είναι ένα διάστημα εμπιστοσύνης δ.ε. συντελεστού α για το θ. Επομένως χρησιμοποιώντας προσομοίωση μπορούμε να εκτιμήσουμε μία ποσότητα προσφέροντας και ένα αντίστοιχο διάστημα εμπιστοσύνης. Φυσικά για τον υπολογισμό του παραπάνω δ.ε. χρειάζεται εκτός του να υπολογίσουμε και το. Ένας τρόπος είναι να αποθηκεύσουμε π.χ. σε μία λίστα όλους τους παραγόμενους ψευδο- τυχαίους αριθμούς Χ Χ... Χ και στο τέλος με βάση αυτούς να υπολογίσουμε το. Με αυτό τον τρόπο όμως θα πρέπει να δεσμεύσουμε μεγάλη μνήμη του υπολογιστή για την «αποθήκευση» των Χ. Εάν δεν χρειάζεται να τους αποθηκεύσουμε για κάποιον άλλο λόγο π.χ. για να φτιάξουμε ένα ιστόγραμμα συχνοτήτων μπορούμε να χρησιμοποιήσουμε μόνο δύο μεταβλητές οι οποίες θα ενημερώνονται σε κάθε βήμα: μία που θα καταγράφει το άθροισμα των Χ και μία που θα καταγράφει το άθροισμα των τετραγώνων των Χ. Αυτό μπορεί να γίνει ως εξής: Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 04
ΒΗΜΑ. Θέτουμε 0 0. 0 ΒΗΜΑ. Θέτουμε και παράγουμε έναν τυχαίο αριθμό ~ F. ΒΗΜΑ. Θέτουμε. ΒΗΜΑ 4. Αν < πάμε στο ΒΗΜΑ αλλιώς πάμε στο ΒΗΜΑ 5. ΒΗΜΑ 5. Θέτουμε και ΒΗΜΑ 6. Τυπώνουμε την σημειακή εκτίμηση και το δ.ε.a: z a z a Ας εφαρμόσουμε τα παραπάνω σε μία πολύ απλή περίπτωση. Έστω ότι θέλουμε να εκτιμήσουμε μέσω προσομοίωσης την μέση τιμή ολοκλήρωση Mot Carlo x E dx 0 όπου ~ 0. Μέσω του Matata θα είναι: 0000; 0; 0; Do[Rado[]; Exp[^]; ; ^ { }] ; - ^ - ; Prt[" "-^0.5.96""^0.5.96 ""];.466.45.47088 και επομένως μία σημειακή εκτίμηση για την παραπάνω μέση τιμή θα είναι το.466 ενώ ένα αντίστοιχο δ.ε. 95% θα είναι το.45.47088 η ακριβής τιμή είναι.4665. Στην περίπτωση που είναι δίτιμες 0 ή τ.μ. τότε η μέση τιμή ΕΧ Pr εκτιμάται και πάλι από τον δειγματικό μέσο #{ } ο οποίος σε αυτή την περίπτωση καλείται και δειγματικό ποσοστό. Η δειγματική διασπορά τώρα θα είναι διότι. Και επομένως σε αυτή την περίπτωση το δ.ε. συντελεστού α για την ΕΧ θα είναι za za za za. Όταν λοιπόν τα Χ είναι 0- δίτιμες τ.μ. π.χ. επιθυμούμε να εκτιμήσουμε μία πιθανότητα τότε δεν χρειάζεται να διατηρούμε μία μεταβλητή με τα αθροίσματα των τετραγώνων των Χ για τον υπολογισμό του δ.ε. διότι αρκεί το. Ο αντίστοιχος αλγόριθμος είναι ο εξής: Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 05
ΒΗΜΑ. Θέτουμε 0 0. ΒΗΜΑ. Θέτουμε και παράγουμε έναν τυχαίο αριθμό ~ F. ΒΗΜΑ. Θέτουμε. ΒΗΜΑ 4. Αν < πάμε στο ΒΗΜΑ αλλιώς πάμε στο ΒΗΜΑ 5. ΒΗΜΑ 5. Θέτουμε και ΒΗΜΑ 6. Τυπώνουμε την σημειακή εκτίμηση και το δ.ε.a: z a z a 6... Ένα κριτήριο για την επιλογή του πλήθους των παραγόμενων τυχαίων α- ριθμών Έστω και πάλι ότι προκειμένου να εκτιμήσουμε το θ από το θˆ παράγουμε ακολουθιακά τυχαίους αριθμούς Χ Χ.... Ένα εύλογο ερώτημα που ανακύπτει εδώ είναι πόσους αριθμούς θα πρέπει να χρησιμοποιήσουμε δηλαδή πότε θα πρέπει να σταματήσουμε την προσομοίωση προκειμένου η εκτίμηση να θεωρείται π.χ. «καλή» «ικανοποιητική» ή «πάρα πολύ καλή». Προφανώς θα πρέπει πρώτα να καθορίσουμε ποσοτικά τι εννοούμε «καλή» εκτίμηση. Ένας βολικός τρόπος είναι μέσω του εύρους d που επιθυμούμε να έχει το διάστημα εμπιστοσύνης συντελεστού π.χ. α 95% που θα προκύψει λαμβάνοντας τυχαίους αριθμούς. Έτσι π.χ. μπορούμε να θεωρήσουμε ως «ικανοποιητική» την εκτίμηση και να σταματήσουμε την προσομοίωση στους τυχαίους αριθμούς όταν το αντίστοιχο διάστημα εμπιστοσύνης συντελεστού 95% που προκύπτει από αυτούς του αριθμούς έχει εύρος μικρότερο από d το οποίο είναι προκαθορισμένο. Δηλαδή σταματάμε την προσομοίωση όταν ισχύει για πρώτη φορά ότι z a d ή ισοδύναμα a 0.05 d d 4.96 5.664 και φυσικά > 0 ή καλύτερα >00 για να ισχύει η κανονική προσέγγιση. Προκειμένου να εξετάζουμε σε κάθε επανάληψη της προσομοίωσης την παραπάνω συνθήκη διακοπής προφανώς θα πρέπει να υπολογίζουμε κάθε φορά το. Προκειμένου λοιπόν να εκτιμήσουμε το θ παράγοντας τυχαίους αριθμούς... ~ F μέσω ενός δ.ε. συντελεστού α 95% που θα έχει εύρος μικρότερο από d εργαζόμαστε ως εξής: BHMA 0. Προκαθορίζουμε το επιθυμητό εύρος d του δ.ε. α 95% για το θ. ΒΗΜΑ. Θέτουμε 0 0 0. ΒΗΜΑ. Θέτουμε και παράγουμε έναν τυχαίο αριθμό ~ F. ΒΗΜΑ. Θέτουμε. ΒΗΜΑ 4. Θέτουμε και d ΒΗΜΑ 5. Εάν >00 και 4.96 πάμε στο ΒΗΜΑ 6 αλλιώς πάμε στο ΒΗΜΑ. ΒΗΜΑ 6. Τυπώνουμε το και το δ.ε. 95%.96.96. Ας εφαρμόσουμε και πάλι τα παραπάνω στην απλή περίπτωση που επιθυμούμε να εκτιμήσουμε μέσω προσομοίωσης την μέση τιμή Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 06
x E dx 0 όπου ~ 0. Έστω επίσης ότι επιθυμούμε να πάρουμε και ένα δ.ε. 95% εύρους μικρότερου από d 0.0 δηλαδή θέλουμε να εκτίμηση ακρίβειας εκατοστού. Μέσω του Matata θα έχουμε: d 0.0; B d^4.96^; Exp[Rado[]^]; ; ; ^; 0; Wl[ < 00 > B ; Exp[Rado[]^]; ; ^; ; - ^ ]; Prt["" " " ]; Prt["" - ^0.5.96"" ^0.5.96""]; 4668.4645.45645.46645 και επομένως χρειάστηκαν 4668 τυχαίοι αριθμοί για να πάρουμε δ.ε. 95% εύρους 0.0. Τέλος στην περίπτωση που οι τυχαίοι αριθμοί Χ παίρνουν μόνο δύο τιμές 0 ή τότε η διαδικασία είναι απλούστερη. Σε αυτή την περίπτωση το εύρος του δ.ε. θα είναι za και συνεπώς σταματάμε την προσομοίωση όταν ισχύει για πρώτη φορά ότι ή ισοδύναμα a 0.05 όταν za d d 4.96 και φυσικά > 00. Παρατήρηση. Σε αυτό το σημείο μπορεί κάποιος να παρατηρήσει ότι ο δειγματικός μέσος που λαμβάνεται κατά την παραπάνω διαδικασία δεν βασίζεται σε σταθερό αλλά σε τυχαίο μέγεθος δείγματος Ν το οποίο εξαρτάται και από τις τιμές του δείγματος. Αυτό δεν επιφέρει κανένα πρόβλημα αρκεί το δείγμα Ν που θα προκύψει να είναι αρκετά μεγάλο. 6.. Μέθοδοι ελάττωσης διακύμανσης Σε ένα τυπικό μοντέλο προσομοίωσης επιθυμούμε να εκτιμήσουμε μία ποσότητα θ η οποία συνδέεται με ένα στοχαστικό μοντέλο και για το σκοπό αυτό παράγουμε τυχαίους αριθμούς Χ Χ... Χ από το μοντέλο αυτό με ΕΧ θ και εκτιμούμε το θ από το Χ. Στην προηγούμενη παράγραφο είδαμε ότι αν επιθυμούμε η εκτίμησή μας να είναι ικανοποιητική θα πρέπει να πάρουμε το σχετικά μεγάλο α- Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 07
νάλογα με την διασπορά της εκτιμήτριας. Για παράδειγμα ένα δ.ε. συντελεστού α για το θ θα είναι το a a z z και επομένως όσο μικρότερη είναι η διασπορά της εκτιμήτριας Χ τόσο ακριβέστερη είναι η εκτίμηση του θ. Επειδή οι τυχαίοι αριθμοί Χ Χ... Χ λαμβάνονται ανεξάρτητοι θα ισχύει ότι σ και άρα αν επιθυμούμε δ.ε. συντελεστού a και εύρους d θα πρέπει σ σ d za d 4 za 4 z a. d Υπάρχουν όμως περιπτώσεις όπου το πλήθος των αριθμών που θα πρέπει να παράγουμε ώστε να επιτύχουμε μία επιθυμητή ακρίβεια είναι πολύ μεγάλο και συνεπώς μία ικανοποιητική εκτίμηση του θ ίσως απαιτεί αρκετές ώρες προσομοίωσης ιδιαίτερα αν η παραγωγή κάθε ενός από τα βασίζεται και αυτή στην παραγωγή αρκετών τυχαίων αριθμών. Επομένως είναι φυσικό να αναζητήσουμε μεθόδους που θα οδηγούν συντομότερα με μικρότερο μέγεθος δείγματος σε μία ικανοποιητική εκτίμηση του θ. Από τα παραπάνω διαφαίνεται ότι ένας τρόπος για να λάβουμε ταχύτερα ικανοποιητική εκτίμηση για το θ είναι να μειώσουμε τη διασπορά της εκτιμήτριας για συγκεκριμένο. Σκοπός λοιπόν της παραγράφου αυτής είναι η μελέτη διαφόρων μεθόδων ελάττωσης της διασποράς της εκτιμήτριας του θ. Παρατήρηση. Για να είμαστε πιο ακριβείς η μείωση του πλήθους των τυχαίων α- ριθμών που χρειάζονται για την εκτίμηση του θ δεν συνεπάγεται πάντα μείωση και του χρόνου της προσομοίωσης. Για παράδειγμα αν υπάρχουν δύο τυχαίες μεταβλητές και Υ ώστε θ ΕΧ ΕΥ τότε μπορούμε να εκτιμήσουμε το θ παράγοντας αντίγραφα είτε της Χ είτε της Υ λαμβάνοντας τις εκτιμήσεις θ και θ αντίστοιχα. Αν τ αντίστοιχα τ Υ είναι ο χρόνος που χρειάζεται για την παραγωγή ε- νός τυχαίου αριθμού Χ αντ. Υ τότε για την ίδια ακρίβεια εκτίμησης του θ δηλαδή για να κατασκευάσουμε ένα δ.ε. εύρους d θα χρειαστούμε χρόνο σ σ τ 4 za τ και τ 4 za τ d d αντίστοιχα. Επομένως «ταχύτερη» εκτιμήτρια θα είναι η πρώτη αν σ τ < σ τ και η δεύτερη αν σ τ > σ τ. Μόνο αν οι χρόνοι τ Χ τ Υ είναι περίπου οι ίδιοι τότε μπορούμε να συγκρίνουμε μόνο τα ή ισοδύναμα τις διασπορές σ σ. 6... Αντιθετικές Attt τυχαίες μεταβλητές. Αν τα Χ είναι ανεξάρτητα τότε η διασπορά της εκτιμήτριας είναι σ. Μία ιδέα για την ελάττωσή της είναι να παράγουμε τους τυχαίους αριθμούς Χ με τέτοιο τρόπο ώστε να μην είναι όλοι ανεξάρτητοι. Αν οι τ.μ. Χ Χ...Χ δεν είναι ανεξάρτητες τότε Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 08
σ Cov j Cov < j < j Άρα αν οι... είναι αρνητικά συσχετισμένες Cov j 0 τότε σ < και με το ίδιο μέγεθος δείγματος θα λαμβάνουμε καλύτερες εκτιμήσεις. Απομένει τώρα να βρούμε μεθόδους παραγωγής αρνητικά συσχετισμένων τ.μ. Όπως και για την παραγωγή ανεξάρτητων τυχαίων αριθμών μπορούν να αναζητηθούν πολλές τέτοιες μέθοδοι ανάλογα με την εκάστοτε περίπτωση. Μία αρκετά απλή και αποτελεσματική μέθοδος παραγωγής αρνητικά συσχετισμένων τ.μ. είναι η μέθοδος των αντιθετικών μεταβλητών που θα παρουσιάσουμε στην συνέχεια. Έστω ότι κάθε ένας από τους τυχαίους αριθμούς Χ Χ... Χ παράγεται με βάση ανεξάρτητους τυχαίους αριθμούς... από την 0 δηλαδή... όπου... και είναι μονότονη συνάρτηση δηλαδή αύξουσα ή φθίνουσα. Η ιδέα εδώ για την παραγωγή αρνητικά συσχετισμένων ζευγών Χ είναι η ακόλουθη: Αντί να παράγουμε τα... από τα ανεξάρτητα διανύσματα... μπορούμε εναλλακτικά να τα παράγουμε χρησιμοποιώντας τις... κ.ο.κ. όπου... δηλαδή 4... Το τυχαίο διάνυσμα αποτελείται και αυτό από ομοιόμορφες τ.μ. και επομένως οι έχουν τις ίδιες κατανομές. Υποπτευόμαστε εδώ ότι εφόσον οι συντεταγμένες των είναι αρνητικά συσχετισμένες Cov Cov ar < 0 το ίδιο θα ισχύει και για τις. Πράγματι ο ισχυρισμός αυτός είναι σωστός αρκεί η να είναι μονότονη. Το αποτέλεσμα αυτό είναι ένα πολύ γνωστό θεώρημα που προκύπτει από τη θεωρία των συναφών assoatd τυχαίων μεταβλητών. Συγκεκριμένα ισχύει το ακόλουθο γενικότερο. Θεώρημα. Αν Υ Υ...Υ είναι ανεξάρτητες τ.μ. τότε για κάθε ζεύγος αυξουσών συναρτήσεων f g: R R θα ισχύει ότι αρκεί να ορίζεται η συνδιακύμανση. Cov f... g... 0. Απόδειξη. Όπως προαναφέρθηκε το αποτέλεσμα αυτό είναι ένα πολύ γνωστό θεώρημα που προκύπτει από τη θεωρία των συναφών τ.μ. Για λόγους πληρότητας παραθέτουμε μια απόδειξη η οποία δεν χρησιμοποιεί την θεωρία των συναφών τ.μ. αλλά στην ουσία ακολουθεί τα ίδια βήματα με αυτήν. Αρχικά θα δείξουμε ότι η παραπάνω ανισότητα ισχύει για δηλαδή για μία τυχαία μεταβλητή. Υπενθυμίζουμε ένα γνωστό αποτέλεσμα που ισχύει για ο- ποιεσδήποτε τ.μ. αρκεί να υπάρχουν οι μέσες τιμές ΕΧ ΕΧ ΕΧ Χ : j. Στο εξής όπου αναφέρεται ότι μία συνάρτηση : R R είναι αύξουσα αντίστοιχα φθίνουσα θα εννοείται ότι αυτή είναι μη-φθίνουσα κατά συντεταγμένη αντίστοιχα μη-αύξουσα κατά συντεταγμένη Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 09
Cov Pr > x > x Pr > x Pr > x dxdx Σύμφωνα με το παραπάνω η Cov f g θα είναι ίση με Pr x g > x Pr f > x Pr g > x f > dxdx Παρατηρούμε τώρα ότι το ενδεχόμενο [ f > x ] θα είναι της μορφής [ > y] ή [ y ] για κάποιο y διότι η f είναι αύξουσα. Το ίδιο θα ισχύει και για την g για κάποιο y. Επομένως είτε ισχύει y y είτε το αντίστροφο θα είναι Pr f > x g > x Pr f > x ή Pr f > x g > x Pr g > x Από το γεγονός αυτό και την παραπάνω έπεται ότι Cov f g 0. Ας μεταβούμε τώρα στη γενικότερη περίπτωση με επαγωγή. Δείξαμε ότι η ανισότητα του θεωρήματος ισχύει για. Έστω ότι ισχύει για k. θα δείξουμε ότι ισχύει και για k. Έστω f g: R k R αύξουσες συναρτήσεις. Θα είναι E f... k k g... k k E{ E f... k k g... k k E{ E f... k k k E g... k k k } E{ E f... k k k } E{ E g... k k k } E f... E g... k k k k k όπου η πρώτη ανισότητα προκύπτει από την για k για τα Υ...Υ k- ενώ η δεύτερη προκύπτει και πάλι από την για για την Υ k. Άρα η ισχύει και για k και το ζητούμενο απεδείχθη. Επομένως αν : αύξουσα από το παραπάνω θεώρημα για j j ~ 0 και f x... x x... x g x... x x... x x: αύξουσα θα ισχύει ότι Cov...... 0 Cov. Άρα Cov Cov 0 Cov 4 0 κ.ο.κ. Όμοια αποδεικνύεται η παραπάνω ανισότητα όταν η : είναι φθίνουσα θεωρούμε την. Επομένως σε αυτή την περίπτωση είναι προτιμότερο αντί της «απλής» εκτιμήτριας ˆ θ να εκτιμούμε το θ από την υποθ. ότι το είναι άρτιος θ διότι η δεύτερη εκτιμήτρια έχει μικρότερη διασπορά από την πρώτη και επιπλέον απαιτεί τους μισούς τυχαίους αριθμούς. Η «απλή» πρώτη εκτιμήτρια στο εξής θα καλείται και «πρωτογενής» εκτιμήτρια raw stato. 0 } Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 0
Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» Παράδειγμα. Ας δούμε σε ένα απλό παράδειγμα Mot Carlo ολοκλήρωσης ποιο μπορεί να είναι το κέρδος από τη χρήση αντιθετικών τ.μ. Ας υποθέσουμε ότι επιθυμούμε να εκτιμήσουμε μέσω προσομοίωσης το ολοκλήρωμα dx E x 0 θ το οποίο προφανώς είναι ίσο με. Χωρίς τη χρήση αντιθετικών τ.μ. θα χρησιμοποιούσαμε τυχαίους αριθμούς... ~ 0 και θέτοντας... 4 4 4 θα εκτιμούσαμε το θ από την πρωτογενή raw εκτιμήτρια ˆ θ. Παρατηρώντας τώρα ότι η συνάρτηση x x είναι αύξουσα μπορούμε να χρησιμοποιήσουμε τις... 4 και να εκτιμήσουμε το θ από την ˆ θ. Η σχετική αποτελεσματικότητα των δύο παραπάνω εκτιμητριών θα είναι ίση με και επειδή 0.40 E E Cov 0.0565 E E E η σχετική αποτελεσματικότητα θα είναι 0.047 0.40 0.0565. Η εκτιμήτρια λοιπόν που βασίζεται στις αντιθετικές μεταβλητές θα έχει διασπορά ίση με το.% της διασποράς της. Γενικότερα αν οι Χ παράγονται με βάση ανεξάρτητους τυχαίους αριθμούς... από μία κατανομή F όχι απαραίτητα ομοιόμορφη δηλαδή... όπου... και είναι μονότονη συνάρτηση τότε όμοια με παραπάνω μπορούμε εναλλακτικά να θέσουμε
F F F 4 F... όπου χρησιμοποιούμε τον συμβολισμό F F... F. Από την μέθοδο της αντιστροφής οι τ.μ. F F ~ F και από το παραπάνω Θεώρημα Cov F F 0 διότι η γενικευμένη αντίστροφη F - είναι αύξουσα διότι η F είναι αύξουσα και η F είναι μονότονη ως σύνθεση μονότονης με αύξουσα. Επομένως και εδώ θα ή- ταν προτιμότερο να χρησιμοποιήσουμε την εκτιμήτρια που βασίζεται στις αρνητικά συσχετισμένες τ.μ. Τέλος υπάρχουν περιπτώσεις που οι τ.μ.... δεν παράγονται μέσω της μεθόδου αντιστροφής. Μπορούμε και πάλι να κάνουμε κάτι ανάλογο με τα παραπάνω όπου χρησιμοποιούμε τις... και τις... αρκεί οι να έχουν συμμετρική σ.π.π. δηλαδή να ισχύει ότι Pr μ x Pr μ x για κάθε x όπου μ E. Σε αυτή την περίπτωση μπορούμε να χρησιμοποιήσουμε τις... και τις μ μ... μ δηλαδή να παράγουμε τις μ μ... 4 Πράγματι σε αυτή την περίπτωση οι τ.μ. και μ έχουν την ίδια κατανομή Pr μ x Pr μ μ x Pr μ μ x Pr x και Cov μ 0 διότι οι συναρτήσεις x και μx είναι αύξουσες ή φθίνουσες και οι δύο διότι έχουμε υποθέσει ότι η είναι μονότονη. Άρα στην περίπτωση που οι τ.μ. έχουν συμμετρικές σ.π.π. γύρω από την μέση τους τιμή μ μπορούμε να χρησιμοποιήσουμε την εκτιμήτρια της μορφής μ η οποία θα έχει μικρότερη διασπορά από την υποθ. ότι η : μονότονη. Εφαρμογή. Προσομοίωση συστήματος αξιοπιστίας. Με τον όρο σύστημα αξιοπιστίας εννοούμε ένα πεπερασμένο σύνολο μονάδων I {...} εφοδιασμένο με μία συγκεκριμένη δομή. Κάθε μία από τις μονάδες του συστήματος είναι δυνατό να βρίσκεται σε μία από τις δυο καταστάσεις: λειτουργία ή μη λειτουργία. Για την περιγραφή της κατάστασης της -μονάδας Ι χρησιμοποιείται η δείκτρια συνάρτηση: s αν η -μονάδα λειτουργεί 0 αν η -μονάδα δεν λειτουργεί. Όμοια το σύστημα δύναται και αυτό να βρεθεί σε δύο καταστάσεις: λειτουργία ή μη λειτουργία. Θεωρούμε ότι η κατάσταση του συστήματος καθορίζεται πλήρως από τις καταστάσεις των μονάδων που το αποτελούν. Η σχέση αυτή της κατάστασης του συστήματος από τα s περιγράφεται από την λεγόμενη συνάρτηση δομής του συστήματος. Συγκεκριμένα: Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές»
Ορισμός. H συνάρτηση φ:{0} {0} η οποία για κάθε διάνυσμα κατάστασης s s s... s των μονάδων του συστήματος απεικονίζει την κατάσταση φs του συστήματος καλείται συνάρτηση δομής του συστήματος. Το σύστημα λειτουργεί ή όχι ανάλογα με το αν φ ή 0 αντίστοιχα. Τα συστήματα που εμφανίζονται στην πράξη έχουν την εξής πολύ φυσιολογική ιδιότητα: η βελτίωση της κατάστασης μιας μονάδας από 0 σε συνεπάγεται την βελτίωση ή τουλάχιστον τη μη χειροτέρευση της κατάστασης του συστήματος. Τα συστήματα με την ιδιότητα αυτή καλούνται «μονότονα συστήματα». Προφανώς η συνάρτηση δομής φ ενός μονότονου συστήματος θα είναι αύξουσα κατά συντεταγμένη. Ας θεωρήσουμε τώρα ότι οι μονάδες του συστήματος βρίσκονται σε κατάσταση λειτουργίας με κάποια πιθανότητα. Ας συμβολίσουμε λοιπόν με την τ.μ. που εκφράζει την κατάσταση της - μονάδας του συστήματος. Η τ.μ. ή 0 ανάλογα με το αν η μονάδα λειτουργεί ή όχι και Pr p Pr 0 q p. Επίσης θα θεωρούμε ότι οι... είναι στοχαστικά ανεξάρτητες. Αν... είναι το τυχαίο διάνυσμα κατάστασης των μονάδων τότε η τ.μ. φ εκφράζει την κατάσταση του συστήματος φ αν το σύστημα λειτουργεί και 0 διαφορετικά. Ως αξιοπιστία R ενός συστήματος ορίζεται η πιθανότητα λειτουργίας του δηλαδή η R Prφ Εφ. Παραδείγματα. Μερικά πολύ απλά παραδείγματα συστημάτων είναι τα ακόλουθα: a. Σειριακό σύστημα: δεν λειτουργεί όταν τουλάχιστον μία από τις μονάδες του δεν λειτουργεί: 4 Είναι εύκολο να επαληθευτεί ότι η συνάρτηση δομής του δίνεται από τη σχέση φs Π s φ 0 αν και μόνο αν κάποιο από τα s s...s 0. Επομένως η αξιοπιστία του θα είναι R E φ E E p. β. Παράλληλο σύστημα: δεν λειτουργεί όταν όλες οι μονάδες του δεν λειτουργούν: 4 Αποδεικνύεται επίσης ότι η συνάρτηση δομής φ ενός μονότονου συστήματος μπορεί να γραφεί στη μορφή ν φ s s j όπου C C...C είναι κατάλληλα υποσύνολα του I{...}. Από την συγκεκριμένη αναπαράσταση είναι φανερό ότι το σύστημα δεν λειτουργεί φs0 αν και μόνο αν όλες οι μονάδες κάποιου C j έχουν χαλάσει υπάρχει C j τέτοιο ώστε s 0 C j. Αν τα C C...C ν είναι έτσι ώστε κανένα από αυτά δεν είναι υποσύνολο κάποιου άλλου τότε καλούνται ελάχιστα σύνολα διακοπής του συστήματος με συνάρτηση δομής φ. Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» C j
Η συνάρτηση δομής του θα δίνεται από τη σχέση φsπ s φ 0 αν και μόνο όλα τα s s...s 0. Επομένως η αξιοπιστία του θα είναι R E φ E E p. γ. Γέφυρα: Αποτελείται από 5 μονάδες και λειτουργεί π.χ. όταν καταφέρνει να «περάσει ρεύμα» από το Α στο Β. Με άλλα λόγια δεν λειτουργεί όταν δεν λειτουργούν οι μονάδες και 4 ή οι μονάδες και 5 ή οι μονάδες και και 5 ή οι μονάδες 4 και και. A 4 5 B Είναι εύκολο να επαληθευτεί ότι το συγκεκριμένο σύστημα έχει συνάρτηση δομής φ s s s s s 4 s s 5 s 5 s 4 s s αν π.χ. s s 4 0 τότε και φ 0 κ.ο.κ.. Επομένως η αξιοπιστία του θα είναι εκμεταλλευόμαστε και το γεγονός ότι r.. διότι r {0} R Eφ Ε 4 4 5 5 4 5 4 5 4 5 4 5 4 5 p p p p p 4 p p p p 4 p p p 5 p p p p 5 p 4 p 5 p p p 4 p 5 p p p 4 p 5 p p p 4 p 5 p p p p 4 p 5. δ. Σύστημα συνεχόμενο k-από-τα-:f. Το σύστημα αυτό αποτελείται από γραμμικά διατεταγμένες μονάδες και δεν λειτουργεί αν και μόνο αν δεν λειτουργούν τουλάχιστον k διαδοχικές μονάδες από τις. 4 Με άλλα λόγια το σύστημα δεν λειτουργεί αν και μόνο αν όλες οι μονάδες {... k} ή όλες οι μονάδες {... k} ή... ή όλες οι μονάδες {k k... } δεν λειτουργούν. Η αξιοπιστία του συγκεκριμένου συστήματος στην ειδική περίπτωση 4 k θα είναι R Εφ Ε 4... E 4 4 p p p p p p p p p 4 p p p 4 ενώ αν p p θα είναι Rp p p. Γενικότερα η αξιοπιστία του συγκεκριμένου συστήματος θα είναι k j j k Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 4 R E φ E. Είδαμε ότι στα απλά παραδείγματα αβγ παραπάνω η αξιοπιστία του συστήματος μπορεί να υπολογιστεί εύκολα. Δυστυχώς όμως αυτό αποτελεί την εξαίρεση παρά τον κανόνα. Αν και η αξιοπιστία των μονότονων συστημάτων τυπικά μπορεί να εκφραστεί μέσα από την συνάρτηση δομής φ εντούτοις στις περισσότερες πε- j
ριπτώσεις ο υπολογισμός της R Εφ αποτελεί μία αρκετά επίπονη εργασία ι- διαίτερα όταν έχουμε μεγάλο αριθμό μονάδων και φ με «πεπλεγμένη» δομή. Όπως είναι φυσικό ένας εναλλακτικός τρόπος υπολογισμού της αξιοπιστίας ενός συστήματος είναι μέσω προσομοίωσης. Παράγουμε λοιπόν... ~ 0 από τα οποία λαμβάνουμε τις καταστάσεις των μονάδων I > p και τελικά την αντίστοιχη κατάσταση του συστήματος φ φ... φ I > p... I > p... Επαναλαμβάνοντας την παραπάνω διαδικασία φορές παράγοντας τα... η πρωτογενής εκτιμήτρια της αξιοπιστίας R του συστήματος θα είναι η με αντίστοιχο δ.ε. συντελεστού a το z a z a. Ο γενικός αλγόριθμος εκτίμησης της αξιοπιστίας είναι απλός διότι εδώ έχουμε να κάνουμε με δίτιμες 0- τυχαίες μεταβλητές: BHMA 0. Θέτουμε s 0. BHMA. Για...: Παράγουμε ~ 0 και θέτουμε αν > p και 0 αν < p. BHMA. Εξετάζουμε αν φ αν το σύστημα λειτουργεί και αν ναι θέτουμε s s BHMA. Επαναλαμβάνουμε φορές τα βήματα. BHMA 4. Τυπώνουμε την εκτίμηση της αξιοπιστίας s και το δ.ε. συντελεστού α. Για παράδειγμα ας εκτιμήσουμε την αξιοπιστία ενός συνεχόμενου k-από-τα-:f συστήματος 4 με p p με κατάλληλη τροποποίηση του προγράμματος μπορεί να αντιμετωπισθεί και η γενικότερη περίπτωση που τα p δεν είναι όλα ίσα. Μέσω του Matata θα είναι 0000 επαναλήψεις: 4; k ; p 0.; s 0; 0000; Do[ Tabl[0 {}]; Do[If[Rado[]>-p [[]] ] { }]; φprodut[-produt[-[[]]{jjk-}]{j-k}]; s s φ; {a }]; a N[s]; Prt[a " -" a - a^0.5.96]; 0.4-0.008065 Για 4 k p p 0. εκτιμήσαμε λοιπόν ότι R 0.4 ±0.00806 δ.ε. 95%. Φυσικά για αυτές τις μικρές τιμές των k έχουμε βρει παραπάνω την ακριβή τιμή αξιοπιστίας R p p 0. 0. 0. 6. Για μεγαλύτερες τιμές των k όμως ο υπολογισμός της αξιοπιστίας μέσω του αναπτύγματος της φ γίνεται Η δείκτρια συνάρτηση της μορφής ΙΧ > x ορίζεται ως εξής: ΙΧ > x ή 0 ανάλογα με το αν ισχύει η σχέση μέσα στην παρένθεση δηλ. η Χ > x ή όχι αντίστοιχα. 4 Η αξιοπιστία του συγκεκριμένου συστήματος μπορεί να υπολογισθεί μέσω αναδρομικών τύπων. Η προσομοίωσή του εδώ γίνεται για λόγους καλύτερης κατανόησης της θεωρίας. Υπογραμμίζεται όμως ότι υπάρχουν συστήματα στα οποία είναι πρακτικά αδύνατος ο υπολογισμός της αξιοπιστίας ακόμη και με αναδρομικούς τύπους. Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 5.
πρακτικά αδύνατος οπότε εναλλακτικά μπορούμε να χρησιμοποιήσουμε προσομοίωση. Για παράδειγμα για 00 k 7 p 0.4 λαμβάνουμε μέσω 0000 επαναλήψεων την εκτίμηση: 0.06-0.00909 Στην συγκεκριμένη περίπτωση χρειαστήκαμε την παραγωγή 000000 τυχαίων αριθμών. Γίνεται λοιπόν φανερό ότι αν επιθυμούμε μεγαλύτερη ακρίβεια στην εκτίμηση που λαμβάνουμε από την προσομοίωση θα πρέπει να αυξήσουμε το και συνεπώς να αναμένουμε αρκετό χρόνο 5. Σε αυτή την περίπτωση ίσως είναι προτιμότερο να χρησιμοποιήσουμε αντιθετικές τ.μ. ώστε να πάρουμε καλύτερη εκτίμηση με τον ίδιο αριθμό επαναλήψεων. Σύμφωνα λοιπόν με την μέθοδο που περιγράψαμε παραπάνω μπορούμε για κάθε -αδα τυχαίων αριθμών... ~ 0 να παράγουμε δύο αρνητικά συσχετισμένες τιμές για την φ μία φορά χρησιμοποιώντας τα... και μία τα.... Επειδή φ φ... φ I > p... I > p... και η είναι φ αύξουσα κατά συντεταγμένη είναι εύκολο να δούμε ότι η u u...u είναι αύξουσα κατά συντεταγμένη. Επομένως E... E... και σύμφωνα με παραπάνω οι τ.μ....... είναι αρνητικά συσχετισμένες. Συνεπώς μπορούμε να παράγουμε το πλήθος -άδες... ~ 0 και για κάθε μία να παράγουμε δύο τιμές της φ υποθ. ότι : ακέραιος. Συμβολίζοντας H...... η τελική εκτιμήτρια της R θα είναι η H H δειγματικός μέσος των τιμών της φ. Επίσης ένα δ.ε. συντελεστού 95% για την αξιοπιστία R θα είναι H H H za H za για μεγάλο όπου H H H είναι η εκτίμηση της διακύμανσης της Η από το δείγμα Η Η... Η. Και η εκτιμήτρια H βασίζεται σε το πλήθος τιμές της φ αλλά αυτή τη φορά οι τιμές είναι ανά δύο αρνητικά συσχετισμένες και συνεπώς η H θα έχει μικρότερη διασπορά από την. Μάλιστα για μεγάλο δείγμα θα έχουμε ότι H H R R Cov H E H E R R 5 Τα πράγματα γίνονται πολύ χειρότερα όταν το πλήθος των μονάδων ενός συστήματος είναι μεγαλύτερο πράγμα όχι ασυνήθιστο στην πράξη π.χ. υποθέστε ότι μία οθόνη TFT με 04 768 εικονοστοιχεία θεωρείται ελαττωματική και επιστρέφεται για αντικατάσταση όταν δεν λειτουργούν τουλάχιστον εικονοστοιχεία που βρίσκονται μέσα σε ένα τετράγωνο 00 00 εικονοστοιχείων. Για την πρωτογενή - raw εκτίμηση της αξιοπιστίας ενός τέτοιου συστήματος μέσω προσομοίωσης 0000 επαναλήψεων χρειαζόμαστε την παραγωγή 0000 04 768 78640000 τυχαίων αριθμών! Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 6
και επομένως H H H Cov και η συσχέτιση μεταξύ των δύο τιμών της φ μπορεί να εκτιμηθεί ως εξής: Cov H H H ρ ρ. H H Επίσης η εκτίμηση της σχετικής αποτελεσματικότητας μεταξύ των δύο εκτιμητριών H δηλ. με και χωρίς τη χρήση αντιθετικών τ.μ. θα είναι H H H ρ. R R H H Ο σχετικός αλγόριθμος εκτίμησης της αξιοπιστίας χρησιμοποιώντας αντιθετικές τ.μ. είναι ο ακόλουθος: BHMA 0. Θέτουμε s 0 s 0. BHMA. Για...: Παράγουμε ~ 0 και θέτουμε Χ Ι > p και I > p BHMA. Θέτουμε H φ Χ φ Χ και s s Η s s Η BHMA. Επαναλαμβάνουμε φορές τα βήματα. BHMA 4. Θέτουμε H s και H s H και τυπώνουμε το H H δ.ε. συντελεστού a: H za H za και την εκτίμηση της συσχέτισης H H H. H H Για παράδειγμα ας εκτιμήσουμε και πάλι την αξιοπιστία ενός συνεχόμενου k-από-τα:f συστήματος με p p με κατάλληλη τροποποίηση του προγράμματος μπορεί να αντιμετωπισθεί και η γενικότερη περίπτωση που τα p δεν είναι όλα ίσα. Μέσω του Matata θα είναι 4 k p 0.7 0000 επαναλήψεις: 4; k ; p 0.; 0000; s 0; s 0; Do[ Tabl[0 {}]; Tabl[0 {}]; Do[ Rado[]; If[>-p [[]]]; If[->-p [[]] ]; { }]; φprodut[-produt[-[[]]{jjk-}]{j-k}]; φprodut[-produt[-[[]]{jjk-}]{j-k}]; ssφφ; ssφφ^4; {a}]; a N[s]; var N[s - a^]; Prt[a " -" var^0.5.96]; Prt[var - a - aa - a]; 0.9-0.0070666-0.06 Άρα και πάλι για 4 k p p 0.7 εκτιμάμε ότι R 0.9 ±0.0070666 δ.ε. 95%. Παρατηρούμε ότι τώρα λαμβάνουμε μικρότερο δ.ε. με το ίδιο παραπάνω είχαμε αντίστοιχα λάβει ±0.008065 διότι χρησιμοποιούμε αρνητικά συσχετισμένο δείγμα. Η εκτίμηση μάλιστα της συσχέτισης των είναι 0.06. Ε- πίσης χρησιμοποιώντας και το άλλο παράδειγμα 00 k 7 p 0.4 λαμβάνουμε μέσω 0000 επαναλήψεων την εκτίμηση: Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 7
0.064-0.008678 και εδώ η εκτίμηση της συσχέτισης των είναι 0.0708. 6... Η χρήση ρυθμιστικών μεταβλητών otrol varats Έστω και πάλι ότι επιθυμούμε να εκτιμήσουμε μέσω προσομοίωσης μία ποσότητα θ. Έως τώρα είδαμε ότι για το σκοπό αυτό αρκεί να βρούμε μία τ.μ. Χ με ΕΧ θ και να παράγουμε ανεξάρτητα αντίγραφά της Χ Χ... Χ λαμβάνοντας τελικά θˆ πρωτογενής εκτιμήτρια raw stato. Ας υποθέσουμε τώρα ότι μπορεί να βρεθεί και άλλη μία τ.μ. W η οποία έχει και αυτή μέση τιμή θ ΕW θ η οποία μπορεί να είναι και εξαρτημένη από την Χ. Θα μπορούσαμε τώρα με την συνδυασμένη χρήση των Χ W να εκτιμήσουμε καλύτερα το θ; Παρατηρούμε ότι η τ.μ. W είναι και αυτή αμερόληπτη εκτιμήτρια του θ E W θ θ θ με διασπορά W W Cov W η οποία είναι εύκολο να επαληθευτεί ότι ελαχιστοποιείται για Cov W Cov W. W Cov W W Επομένως μπορούμε να παράγουμε τα εξαρτημένα ζεύγη αριθμών Χ W Χ W... και να εκτιμήσουμε το θ από τον δειγματικό μέσο των W. Είναι ενδιαφέρον ότι η τεχνική των αντιθετικών τ.μ. εντάσσεται σε αυτήν την γενικότερη μέθοδο. Πράγματι οι τ.μ. Χ W έχουν και οι δύο μέση τιμή θ ακόμη περισσότερο έχουν την ίδια κατανομή και επειδή W θα είναι. Ε- πομένως η εκτίμηση του θ μπορεί να γίνει από τον δειγματικό μέσο των W... που είναι ακριβώς η μέθοδος εκτίμησης μέσω αντιθετικών τ.μ. Ας δούμε τώρα μία διαφορετική υλοποίηση της παραπάνω ιδέας. Ας υποθέσουμε ότι εκτός της τ.μ. Χ η οποία έχει μέση τιμή θ μπορούμε να παράγουμε και μία άλλη τ.μ. Υ η οποία είναι εξαρτημένη με την Χ αλλά έχει γνωστή μέση τιμή μ Υ ΕΥ που δεν είναι απαραίτητα ίση με θ. Η ιδέα εδώ είναι να χρησιμοποιήσουμε ως W την Χμ Υ η οποία θα έχει μέση τιμή θ. Έτσι προτείνεται να χρησιμοποιήσουμε την τ.μ. W μ μ η διασπορά της οποίας ελαχιστοποιείται για Cov και για το συγκεκριμένο θα είναι Cov μ Cov Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 8
Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 9. Η τ.μ. Υ καλείται ρυθμιστική μεταβλητή ή μεταβλητή ελέγχου otrol varat για την εκτιμήτρια της προσομοίωσης Χ. Επομένως μπορούμε να παράγουμε τα ζεύγη αριθμών Χ Χ Υ... και να εκτιμήσουμε το θ από τον δειγματικό μέσο των μ. Η διασπορά αυτής της εκτιμήτριας θα είναι Cov μ μ και από το κεντρικό οριακό θεώρημα ένα δ.ε. συντελεστού α για το θ θα είναι το ± a z μ. Επίσης η σχετική αποτελεσματικότητα της μ σε σχέση με την αρχική θα είναι μ μ μ Cov ρ <. Συνεπώς η νέα εκτιμήτρια του θ θα είναι αποτελεσματικότερη της αρχικής και μάλιστα θα είναι τόσο καλύτερη όσο μεγαλύτερη είναι η εξάρτηση μεταξύ των Χ Υ. Αυτό διαισθητικά εξηγείται ως εξής: αν οι Χ Υ είναι θετικά συσχετισμένες χονδρικά έχουν την ίδια συμπεριφορά τότε το θα είναι αρνητικό και αν π.χ. η Χ είναι μεγαλύτερη της μέσης της τιμής θ τότε πιθανώς και η Υ θα είναι μεγαλύτερη της μέσης της τιμής μ Υ διότι είναι θετικά συσχετισμένες και άρα μ Υ < 0 με συνέπεια η μ Υ να είναι πιο κοντά στο θ από ότι η Χ. Ανάλογη είναι και η δικαιολόγηση όταν Χ < θ ή οι Χ Υ είναι αρνητικά συσχετισμένες. Αν οι ποσότητες Cov δεν είναι γνωστές μπορούν να εκτιμηθούν από τις αντίστοιχα χρησιμοποιώντας τα δεδομένα της προσομοίωσης. Επομένως το μπορεί να εκτιμηθεί από το ˆ και η εκτίμηση της διασποράς της μ θα είναι η. Παράδειγμα. Ας δούμε την παραπάνω μέθοδο μέσα από το ίδιο απλό παράδειγμα Mot Carlo ολοκλήρωσης που χρησιμοποιήσαμε και παραπάνω. Έστω λοιπόν ότι επιθυμούμε να εκτιμήσουμε μέσω προσομοίωσης το ολοκλήρωμα
x θ E dx. Η πρωτογενής εκτίμηση του θ προφανώς γίνεται μέσω της ˆ θ 0 όπου... ~ 0. Ας δούμε πως μπορούμε να πάρουμε μία καλύτερη ε- κτίμηση χρησιμοποιώντας μία ρυθμιστική μεταβλητή. Το πρώτο και καθοριστικό βήμα είναι η επιλογή της ρυθμιστικής μεταβλητής Υ. Θα πρέπει να είναι μία τ.μ. συσχετισμένη με την Χ και με γνωστή μέση τιμή. Μία καλή επιλογή είναι η Υ η οποία προφανώς είναι θετικά συσχετισμένη με την. Η βέλτιστη τιμή της σταθεράς θα είναι x Cov E E E x dx 0 6 και άρα ˆ θ μ 6. Η σχετική αποτελεσματικότητα των δύο παραπάνω εκτιμητριών θα είναι ίση με ˆ θ Cov 7 9 0.067. ˆ θ Δηλαδή η νέα εκτιμήτρια ˆ θ θα έχει διασπορά ίση με το.6% της διασποράς της αρχικής θˆ. Εφαρμογή συνέχεια. Προσομοίωση συστήματος αξιοπιστίας. Ας υποθέσουμε και πάλι ότι επιθυμούμε να εκτιμήσουμε μέσω προσομοίωσης την αξιοπιστία R Prφ Εφ ενός συστήματος με συνάρτηση δομής φ και διάνυσμα καταστάσεων μονάδων... I > p... I > p. Παραπάνω είδαμε αυτό μπορεί να γίνει παράγοντας τυχαίους αριθμούς της μορφής Χ φ φ I > p... I > p από τυχαίους αριθμούς... ~ 0 και εκτιμώντας την αξιοπιστία R του συστήματος με το. Προκειμένου να μειώσουμε την διακύμανση της συγκεκριμένης εκτιμήτριας μπορούμε να χρησιμοποιήσουμε μία ρυθμιστική μεταβλητή. Μία λογική επιλογή είναι η Υ διότι είναι θετικά συσχετισμένη με την φ είναι και οι δύο αύξουσες συναρτήσεις των ανεξάρτητων... και έχει γνωστή μέση τιμή p. Με αυτόν τον τρόπο εκτιμούμε την R από τον μέσο όρο τυχαίων αριθμών της μορφής Cov H φ φ p φ p. Επειδή ο αριθμητής του δεν είναι γνωστός μπορεί και αυτός να εκτιμηθεί. Δηλαδή Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 0
φ φ p p και ένα προσεγγιστικό δ.ε. συντελεστού a για το R θα είναι φ φ ˆ φ ˆ ± p za. Για παράδειγμα ας εκτιμήσουμε και πάλι την αξιοπιστία ενός συνεχόμενου k-από-τα:f συστήματος με p p. Μέσω του Matata θα είναι 0000 επαναλήψεις: 4; k ; p 0.; fsu 0; 0000; ysu 0; xysu 0; ysu 0; Do[ Tabl[0 {}]; Do[If[Rado[] > - p [[]] ] { }]; fprodut[-produt[-[[]]{jjk-}] {j-k}]; fsu fsu f; s u[[[]] { }]; ysu ysu s; ysu ysu s^; xysu xysu fs; {a }]; -xysu - fsuysup-p; str N[fsu ysu - p]; Prt[stR" -" fsu-fsu-^ysu-ysu^^0.5.96]; 0.77-0.0057496 Για 4 k p p 0. εκτιμήσαμε λοιπόν ότι R 0.77 ±0.00575 δ.ε. 95%. Η ακριβής τιμή είναι 0.6. Είναι αξιοσημείωτο ότι τώρα το δ.ε. είναι αρκετά στενότερο από αυτά που πήραμε χρησιμοποιώντας την πρωτογενή εκτιμήτρια raw stator και την εκτιμήτρια αντιθετικών μεταβλητών 0.4 ±0.008065 και 0.9 ±0.0070666 αντίστοιχα. Μάλιστα η σχετική αποτελεσματικότητα της εκτιμήτριας μ σε σχέση με την πρωτογενή εκτιμάται μ ˆ φ φ φ φ 0.50955 πράγμα που επαληθεύει την μεγάλη βελτίωση της εκτίμησης. Επίσης για 00 k 7 p 0.4 λαμβάνουμε μέσω 0000 επαναλήψεων την εκτίμηση 0.0855 ±0.008697 η εκτίμηση της σχετικής αποτελεσματικότητας τώρα είναι 0.8506 διότι το άθροισμα των είναι τώρα λιγότερο συσχετισμένο με το φ. Εφαρμογή. Αποτίμηση της αξίας ενός δικαιώματος αγοράς Ασιατικού τύπου. Σε μία κατηγορία δικαιωμάτων αγοράς Ασιατικού τύπου υποθέτουμε ότι η τιμή εξάσκησης του δικαιώματος K strk prz δεν είναι προκαθορισμένη αλλά είναι ίση με τη μέση τιμή που είχε η μετοχή από το χρόνο αγοράς του δικαιώματος μέχρι τον χρόνο εξάσκησης π.χ. μετρούμενη κατά το τέλος των συνεδριάσεων κάθε ημέρα - υποθέτουμε ημέρες. Έστω λοιπόν Ν το πλήθος ημερών του έτους που διεξήχθησαν συναλλαγές στο χρηματιστήριο παραγώγων συνήθως λαμβάνεται N 5. Το κέρδος από τη χρήση του δικαιώματος αγοράς Ασιατικού τύπου θα είναι ax 0. Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές»
Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» είναι η τιμή της μετοχής κατά το τέλος της συνεδρίασης της -ημερας. Προσδιορίζουμε την τιμή του δικαιώματος από την παρούσα αξία του αναμενόμενου κέρδους από τη χρήση του όταν η υποκείμενη μετοχή είναι ουδέτερου ρίσκου rsk utral valuato N r E r είναι το επιτόκιο χωρίς κίνδυνο της αγοράς. Επειδή όπως έχουμε ήδη αναφέρει και σε προηγούμενο κεφάλαιο η παραπάνω μέση τιμή δεν μπορεί να δοθεί μέσω ενός κλειστού τύπου μπορεί να χρησιμοποιηθεί προσομοίωση για την εκτίμησή της. Σε κάθε επανάληψη της προσομοίωσης παράγουμε τις τιμές... όπως έ- χουμε περιγράψει σε προηγ. κεφάλαιο και λαμβάνουμε την τιμή. Ο μέσος όρος επαναλήψεων της παραπάνω διαδικασίας αποτελεί μία εκτίμηση για την μέση τιμή που αναζητούμε. Πολλαπλασιάζοντας με N r λαμβάνουμε τελικά την πρωτογενή raw εκτίμηση της παρούσας αξίας του αναμενόμενου κέρδους από τη χρήση του δικαιώματος. Η παραπάνω εκτίμηση γίνεται χωρίς τη χρήση τεχνικής ελάττωσης διακύμανσης. Προκειμένου να λάβουμε μία καλύτερη ε- κτίμηση με μικρότερη διασπορά μπορούμε να χρησιμοποιήσουμε μία ρυθμιστική μεταβλητή. Μια λογική αλλά όχι η μοναδική επιλογή εδώ είναι η χρήση της 0 διότι πρόκειται για μία ισχυρά συσχετισμένη με την Χ τ.μ. Παρατηρώντας ότι N r N r N r N r E E 0 0 0 0 0 0 διότι θεωρούμε ότι μ r σ το αναμενόμενο κέρδος από τη χρήση του δικαιώματος εκτιμάται από τον μέσο όρο τιμών της μορφής N r N r 0 0 μ. Η τιμή του θα πρέπει και αυτή να εκτιμηθεί μέσω της προσομοίωσης. Χρήση περισσότερων από μία ρυθμιστικών μεταβλητών. Τέλος είναι προφανές ότι ανάλογα με το στοχαστικό μοντέλο που μελετάμε μπορούμε να χρησιμοποιήσουμε περισσότερες από μία ρυθμιστικές μεταβλητές Υ Υ... Υ k. Έτσι γενικότερα μπορούμε να εκτιμήσουμε το θ από τον δειγματικό μέσο τιμών της μορφής... μ T k k k Z μ μ μ. Αν το τυχαίο διάνυσμα Υ Υ Υ...Υ k Τ αποτελείται από ανεξάρτητες τ.μ. τότε είναι εύκολο να αποδειχθεί ότι η διασπορά της τ.μ. Ζ ελαχιστοποιείται για Cov... k
ενώ στην γενικότερη περίπτωση θα είναι Cov όπου είναι ο πίνακας διασποράς [Cov j ] j του τ.δ. και Cov [Cov...Cov k ] T [... k ] Τ. Όταν τα είναι άγνωστα τότε θα πρέπει να εκτιμηθούν από τους τυχαίους αριθμούς της προσομοίωσης. Ένας εύκολος τρόπος να εκτιμήσουμε τα βασίζεται στην εξής ιδέα: Αντί να βρούμε το το οποίο ελαχιστοποιεί την διασπορά της τ.μ. T μ και στη συνέχεια να το εκτιμήσουμε μπορούμε πρώτα να εκτιμήσουμε τη συγκεκριμένη διασπορά και στη συνέχεια να βρούμε το ĉ που την ελαχιστοποιεί το οποίο θα εξαρτά- ται από το δείγμα δηλαδή θα είναι μία εκτίμηση του. Έστω ότι τα δεδομένα που παράγονται από τις επαναλήψεις της προσομοίωσης θα είναι τα... και Υ Υ... Υ. Η διασπορά της τ.μ. T μ θα είναι η η οποία εκτιμάται από το E T μ θ T θ a b T μ T όπου θέσαμε a θ μ b για να φανεί ότι η συγκεκριμένη ποσότητα είναι ίση με το επί το άθροισμα των τετραγώνων των υπολοίπων ε του πολλαπλού γραμμικού μοντέλου T T T a b ε θ μ ε... με Εε 0. Επειδή ως γνωστό οι εκτιμήτριες ελαχίστων τετραγώνων â bˆ των ab στο γραμμικό μοντέλο εκτιμώνται ελαχιστοποιώντας το ε ισοδύναμα ελαχιστοποιώντας την εκτίμηση της διασποράς του T μ προκύπτει ότι ˆ bˆ T διότι θ a b μ b. Επιπλέον παρατηρούμε ότι η εκτίμηση του θ από τον T μέσο όρο των τιμών μ που παράγονται είναι ίσο με ˆ T T T θ ˆ μ bˆ μ aˆ bˆ μ διότι ως γνωστό aˆ bˆ T όπου... k. Επίσης είναι ενδιαφέρον ότι η εκτίμηση της διασποράς της T μ θα είναι ˆ T T σ μ ˆ μ ˆ ε ˆ όπου ˆ σ είναι η εκτίμηση της διασποράς των υπολοίπων. Επομένως παράγουμε τυχαίους αριθμούς... και Υ Υ... Υ και χρησιμοποιώντας οποιοδήποτε στατιστικό πακέτο ακόμη και το Matata εφαρμόζουμε το πολλαπλό γραμμικό μοντέλο ανάλυση παλινδρόμησης b ε T a Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές»
Από την ανάλυση αυτή προκύπτει απευθείας η εκτίμηση του η εκτίμηση του θ και η εκτίμηση της διασποράς του θˆ ως εξής: ˆ bˆ ˆ aˆ bˆ ME θ T μ πρόβλεψη στο σημείο x μ ˆ ˆ σ ˆ θ. Για παράδειγμα μπορούμε να χρησιμοποιήσουμε περισσότερες από μία ρυθμιστικές μεταβλητές στην εφαρμογή που είδαμε παραπάνω και αφορούσε την εκτίμηση της αξίας ενός δικαιώματος αγοράς Ασιατικού τύπου. Στην προκειμένη περίπτωση είχε σχολιαστεί πιθανή χρήση μίας ρυθμιστικής μεταβλητής της 0. Είναι φανερό όμως ότι μπορούμε να χρησιμοποιήσουμε και περισσότερες π.χ. τις Υ... βελτιώνοντας ακόμη περισσότερο την εκτίμησή μας. Boutskas M.. 004 Σημειώσεις μαθήματος «Μέθοδοι Προσομοίωσης και Στατιστικές Υπολογιστικές Τεχνικές» 4