ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ» Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ελένη Νικολάου Α.Μ. [Ημερομηνία] Επιβλέπουσα: Ε.Σ. Μακρή Αναπληρώτρια Καθηγήτρια Πάτρα, Δεκέμβριος
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ» Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ελένη Νικολάου Α.Μ. [Ημερομηνία] Επιβλέπουσα: Ε.Σ. Μακρή Αναπληρώτρια Καθηγήτρια Εγκρίθηκε από την τριμελή εξεταστική επιτροπή την η Δεκεμβρίου Φ.Αλεβίζος Σ.Κουρούκλης Ε.Σ.Μακρή Αναπληρώτής Καθηγητής Καθηγητής Αναπληρώτρια Καθηγήτρια Πανεπιστήμιο Πατρών Πανεπιστήμιο Πατρών Πανεπιστήμιο Πατρών Πάτρα, Δεκέμβριος
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες. Ελένη Νικολάου Πτυχιούχος Μαθηματικός Πανεπιστήμιο Πατρών Copyright Ελένη Νικολάου, Με επιφύλαξη παντός δικαιώματος. All rights reserved. Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, η αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν τη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς τον συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευτεί ότι εκφράζουν επίσημες θέσεις του Πανεπιστημίου Πατρών.
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Ευχαριστίες Η διπλωματική εργασία αυτή έγινε στα πλαίσια του μεταπτυχιακού προγράμματος σπουδών «Μαθηματικά των υπολογιστών και των αποφάσεων» υπό την επίβλεψη της Αναπληρώτριας Καθηγήτριας Ευφροσύνης Μακρή. Με την ολοκλήρωση αυτής της εργασίας θα επιθυμούσα να ευχαριστήσω την κυρία Μακρή η οποία με έμπειρο χέρι, διακριτικότητα και υπομονή μου πρόσφερε την πολύτιμη βοήθεια της καθοδηγώντας με να προσανατολιστώ στο τομέα της θεωρίας ροών και κατά συνέπεια να ολοκληρώσω την εργασία αυτή. Επίσης θα ήθελα να ευχαριστήσω τους κοντινούς μου ανθρώπους, ιδιαίτερα την μητέρα μου, για την συνεχή στήριξη τους όλο αυτό τον καιρό. 7
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες 8
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες ΠΕΡΙΛΗΨΗ Θεωρούμε μια ακολουθία n δυαδικών πειραμάτων (Επιτυχία - Αποτυχία) και την τυχαία μεταβλητή Ε n,k η οποία απαριθμεί τον αριθμό των ροών επιτυχιών μήκους ακριβώς k (k ) στην ακολουθία. Στην παρούσα εργασία παρουσιάζεται μια μελέτη της τυχαίας μεταβλητής αυτής η οποία στηρίζεται στην καταγραφή και ανάλυση μεθόδων που έχουν εμφανισθεί στην διεθνή βιβλιογραφία για τον προσδιορισμό της ακριβούς και ασυμπτωτικής κατανομής της, της πιθανογεννήτριάς της και των ροπών της. Πιο συγκεκριμένα, αρχικά αναπτύσσεται η μέθοδος εμφύτευσης διακριτής τυχαίας μεταβλητής μη αρνητικών τιμών σε κατάλληλη Μαρκοβιανή αλυσίδα, για την εύρεση της ακριβούς συνάρτησης πιθανότητας. Η τυχαία μεταβλητή κατατάσσεται στις εμφυτεύσιμες σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου και δίνονται αναδρομικές σχέσεις που ικανοποιεί η συνάρτηση πιθανότητας, η πιθανογεννήτρια και οι ροπές της. Η μελέτη αυτή γίνεται για ακολουθίες ανεξάρτητων πειραμάτων Bernoulli, όχι κατ ανάγκη ισόνομων. Στη συνέχεια μελετάται η κατανομή, η μέση τιμή και η διασπορά της τυχαίας μεταβλητής μέσω συνδυαστικών μεθόδων. Η μελέτη αυτή δίνει αποτελέσματα για ανεξάρτητες και ισόνομες ακολουθίες Bernoulli και επεκτείνεται για ακολουθίες δυαδικών πειραμάτων που προκύπτουν από το δειγματοληπτικό σχήμα Pόlya Eggenberger. Επίσης περιγράφεται η μέθοδος και στην περίπτωση που τα δυαδικά πειράματα είναι διατεταγμένα σε κύκλο. Στην εργασία παρουσιάζεται επίσης μια μελέτη για την ασυμπτωτική συμπεριφορά της κατανομής της τυχαίας μεταβλητής καθώς και αριθμητικά αποτελέσματα για την περαιτέρω διευκρίνηση των μεθόδων που αναπτύσσονται. Η μελέτη στηρίχτηκε σε ερευνητικά αποτελέσματα που περιέχονται στις εργασίες: Fu, J.C. and Koutras, M.V. (99). Distribution theory of runs: A Markov chain approach. Journal of the American Statistical Association 89, -8. Han, Q., Aki, S. (999). Joint distributions of runs in a sequence of multi-state trials. Ann. Inst. Statist. Math., (), 9-7. Koutras, M.V. and Alexandrou, V.A.(99). Runs, scans and urn model distributions: A Unifed Markov Chain Approach. Annals of Mathematical Statistics, 7., 7-7. Makri F. S., Philippou A. N. and Psillakis Z.M. (7). Success run statistics defined on a urn model, Advances in Applied Probability, 9:99-9 9
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Makri F.S., Psillakis Z.M. (). On success runs of fixed length in Bernoulli sequence: Exact and asymptotic results. Computers and Mathematics with Applications,,7-77. Mood A.M.(9).The distribution theory of runs. The Annals of Mathematical Statistics,, 7-9. Sinha, K., Sinha, B.P. (9). On the distribution of runs of ones in binary strings. Computers and Mathematics with Applications, 8, 8-89. ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ Ροή Επιτυχίας, Βernoulli δοκιμές, Τεχνική εμφύτευσης σε Μαρκοβιανή Αλυσίδα, Pόlya Eggenberger δειγματοληπτικό σχήμα.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες ABSTRACT On success runs of fixed length in binary sequences Consider a sequence of n binary trials (Success - Failure). Let us denote by E n,k the random variable which counts the number of success runs in the sequence with length exactly equal to k (k ). In the dissertation we present a review of methods which have appeared in the literature for getting results for the exact and asymptotic distribution of E n,k, as well as, for its probability generating function and moments. First, the finite Markov chain imbedding technique is developed for the evaluation of probability mass function of the random variable. Next, noting that the random variable under study is a Markov chain of returnable type random variable, the respective method is presented and recursive schemes for the distribution of E n,k are obtained for the sequences of independent binary trials. Closed formulae for the distribution, the mean value and the variance of E n,k have been obtained using combinatorial analysis methods which are also presented. These results are obtained for sequences of independent and identically distributed Bernoulli random variables and they are extended to binary sequences derived according to the Pόlya Eggenberger urn model. Results for circularly ordered binary sequences are given, too. A result for the asymptotic behavior of the distribution is also presented. Throughout the dissertation numerical results are given to illustrate the methods. The dissertation is based on results of the papers: Fu, J.C. and Koutras, M.V. (99). Distribution theory of runs: A Markov chain approach. Journal of the American Statistical Association 89, -8. Han, Q., Aki, S. (999). Joint distributions of runs in a sequence of multi-state trials. Ann. Inst. Statist. Math., (), 9-7. Koutras, M.V. and Alexandrou, V.A.(99). Runs, scans and urn model distributions: A Unifed Markov Chain Approach. Annals of Mathematical Statistics, 7., 7-7. Makri F. S., Philippou A. N. and Psillakis Z.M. (7). Success run statistics defined on a urn model, Advances in Applied Probability, 9:99-9 Makri F.S., Psillakis Z.M. (). On success runs of fixed length in Bernoulli sequence: Exact and asymptotic results. Computers and Mathematics with Applications,,7-77.
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Mood A.M.(9).The distribution theory of runs. The Annals of Mathematical Statistics,, 7-9. Sinha, K., Sinha, B.P. (9). On the distribution of runs of ones in binary strings. Computers and Mathematics with Applications, 8, 8-89. KEY WORDS Success Run, Bernoulli trials, Markov chain imbedding technique, Pόlya Eggenberger urn model.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες ΠΕΡΙΕΧΟΜΕΝΑ. ΕΙΣΑΓΩΓΗ........ ΜΕΘΟΔΟΣ ΜΑΡΚΟΒΙΑΝΗΣ ΕΜΦΥΤΕΥΣΗΣ. Εισαγωγικά........8. Μέθοδος εμφύτευσης τυχαίας μεταβλητής σε Μαρκοβιανή αλυσίδα...9.. Εύρεση της κατανομής της τ.μ. Ε n,k με τη μέθοδο της εμφύτευσης τυχαίας β μεταβλητής σε Μαρκοβιανή αλυσίδα........ Eμφυτεύσιμη τυχαία μεταβλητή σε Μαρκοβιανή αλυσίδα διωνυμικού τύπου (M.V.Β.).... Eμφυτεύσιμη τυχαία μεταβλητή σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου (M.V.R.)..... Εύρεση της κατανομής της τ.μ. Ε n,k με τη μέθοδο της εμφύτευσης τυχαίας ξ ξ ξν μεταβλητής σε Μαρκοβιανή Αλυσίδα επιστρέψιμου τύπου.......9. Ανακεφαλαίωση..... ΣΥΝΔΥΑΣΤΙΚΕΣ ΜΕΘΟΔΟΙ. Εισαγωγικά....... Μελέτη της κατανομής της τυχαίας μεταβλητής Ε n,k σε δυαδικές δοκιμές..... Ακριβής κατανομή της τ.μ. Ε n,k σε δυαδικές δοκιμές διατεταγμένες σε γραμμή...9.. Ακριβής κατανομή της τ.μ. Ε n,k σε δυαδικές δοκιμές διατεταγμένες σε κύκλο...87.. Δεσμευμένη από κοινού κατανομή των τ.μ. Ε n,,e n,,,e n,n δοθέντος του αριθμού Y των αποτυχιών στην ακολουθία.....9. Μελέτη της ασυμπτωτικής κατανομής της τ.μ. Ε n,k....97. Ανακεφαλαίωση...99 ΑΝΑΦΟΡΕΣ......
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες. ΕΙΣΑΓΩΓΗ Ο όρος ροή σε μια ακολουθία δοκιμών αφορά τη διαδοχή (χωρίς διακοπή) όμοιων αποτελεσμάτων. Από στατιστικής απόψεως μπορούμε να ορίσουμε ως ροή επιτυχιών μια συνεχόμενη ακολουθία επιτυχιών (S) της οποίας προηγείται και έπεται μια αποτυχία ή τίποτε, σε n εκτελέσεις ενός πειράματος τύχης όπου σε κάθε επανάληψη μπορεί να προκύψουν δύο δυνατά αποτελέσματα, επιτυχία (S ή ) και αποτυχία (F ή ). Μήκος μιας ροής επιτυχιών είναι ο αριθμός k (k θετικός ακέραιος) των όμοιων στοιχείων της. Για παράδειγμα έστω ότι εκτελούμε n = διαδοχικές επαναλήψεις ενός πειράματος τύχης, που αφορά την ρίψη ενός νομίσματος και συμβολίζουμε με επιτυχία () την ένδειξη κεφαλή και με αποτυχία () την ένδειξη γράμματα. Αν η ακολουθία των αποτελεσμάτων είναι, μπορούμε εύκολα να παρατηρήσουμε ότι έχουμε δυο ροές επιτυχιών μήκους k = και δύο ροές επιτυχιών μήκους k =. Η έννοια της ροής επιτυχιών γεννήθηκε από την προσπάθεια διάσημων μαθηματικών του 7 ου αιώνα να απαντήσουν σε ερωτήσεις σχετικά με τυχερά παιχνίδια. Οι πρωτοπόρες μελέτες της εποχής εκείνης άνοιξαν τον δρόμο για την θεωρητική μελέτη μοντέλων που αναφέρονται σε ακολουθίες πειραμάτων. Έτσι στα τέλη του 9 ου αιώνα άρχισε η συστηματική μελέτη της έννοιας της ροής επιτυχιών. Συγκεκριμένα στις αρχές της δεκαετίας του 98 πολλοί ερευνητές μελετούν διεξοδικά τυχαίες μεταβλητές που σχετίζονται με ροές επιτυχιών και εξάγουν τύπους μέσω συνδυαστικών μεθόδων. Έχουν χρησιμοποιηθεί διάφορα σχήματα απαρίθμησης των ροών επιτυχιών και στην προσπάθεια ομαδοποίησης των κατανομών που σχετίζονται με ροές επιτυχιών εισάγεται ο όρος διωνυμικές κατανομές k τάξης, στην οποία ανήκουν οι τυχαίες μεταβλητές Ν n,k, η M n,k,η G n,k και η Ε n,k όπου κάθε μια ορίζει ένα διαφορετικό τρόπο καταμέτρησης ροών επιτυχιών. Στηριζόμενοι στην έννοια της ροής μπορούμε να ορίσουμε μια σειρά από τυχαίες μεταβλητές που μετρούν τον αριθμό των ροών σε ακολουθία n δοκιμών, όπως αναφέραμε και πιο πάνω. Τέτοιες τυχαίες μεταβλητές είναι οι: (α) L n η οποία παριστάνει το μέγιστο μήκος ροής επιτυχιών, (β) Ν n,k η οποία παριστάνει τον αριθμό των μη επικαλυπτόμενων ροών επιτυχιών μήκους k, (γ) Μ n,k η οποία παριστάνει τον αριθμό των επικαλυπτόμενων ροών επιτυχιών μήκους k, (δ) G n,k η οποία παριστάνει τον αριθμό των ροών επιτυχιών μήκους τουλάχιστον k, (ε) Ε n,k η οποία παριστάνει τον αριθμό των ροών επιτυχιών μήκους ακριβώς k.
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Για την καλύτερη κατανόηση των πιο πάνω τυχαίων μεταβλητών έστω ότι έχουμε μια ακολουθία n = δυαδικών δοκιμών με επιτυχία () και αποτυχία (),. Τότε έχουμε Ν, =, Ν, =, Ν, =, G, =, G, =, G, =, E, =, E, =, E, =, E, =, Μ, =, Μ, =, M, =. Η μελέτη τυχαίων μεταβλητών που σχετίζονται με ροές επιτυχιών έχει ποικίλες εφαρμογές σε διάφορα επιστημονικά πεδία. Στις αρχές του 9 ο αριθμός των ροών επιτυχιών χρησιμοποιήθηκε σε ελέγχους υποθέσεων από τους Wold και Wolfowitz (9) και στους ποιοτικούς ελέγχους από τον Mosteller (9). Πιο πρόσφατα εκτός από τη Στατιστική χρησιμοποιήθηκαν και σε άλλες επιστημονικές περιοχές, όπως στην αξιοπιστία συστημάτων (Philippou 98, Chao et al. 99), στην ψυχολογία (Grant 9) στην οικολογία (Pielou 99), σε βιολογικές εφαρμογές ιδιαίτερα στην αλληλουχία DNA (Goldstein 99), στην χρηματοοικονομική στοχαστική ανάλυση (Binswager και Embrechts 99) κ.α. Κύριος στόχος της εργασίας αυτής είναι η μελέτη μιας οικογένειας τυχαίων μεταβλητών που σχετίζονται με συγκεκριμένους σχηματισμούς σε ακολουθίες πειραμάτων με δύο δυνατά αποτελέσματα, Bernoulli ακολουθίες. Συγκεκριμένα θα επικεντρωθούμε στην μελέτη της κατανομής της τυχαίας μεταβλητής που μετρά τον αριθμό των ροών επιτυχιών μήκους ακριβώς k, την τ.μ. Ε n,k. Στη παρούσα εργασία θα παρουσιάσουμε μια ανασκόπηση της ερευνητικής δουλειάς των τελευταίων δεκαετιών που αφορούν την τ.μ. Ε n,k. Η μελέτη της κατανομής της τ.μ. αυτής γίνεται σε ακολουθίες ανεξάρτητων (ισόνομων ή μη) δυαδικών πειραμάτων διατεταγμένων είτε σε γραμμή είτε σε κύκλο. Συγκεκριμένα στο δεύτερο κεφάλαιο θα παρουσιάσουμε τη μέθοδο εμφύτευσης μιας τυχαίας μεταβλητής σε Μαρκοβιανή αλυσίδα. Στο κεφάλαιο αυτό ύστερα από σύντομη εισαγωγή στην θεωρία Μαρκοβιανών αλυσίδων, αρχικά θα παρουσιάσουμε την μέθοδο όπως εισήχθη από τους Fu και Koutras (99). Κατά την εφαρμογή των τύπων σύμφωνα με τους Fu και Koutras (99) η υπολογιστική δυσκολία που παρουσιάζεται είναι οι πολλαπλασιασμοί μεταξύ πινάκων οι οποίοι έχουν διάσταση που εξαρτάται από τον αριθμό των δοκιμών της ακολουθίας πειραμάτων. Στην πορεία η δυσκολία αυτή αντιμετωπίστηκε από τους Koutras και Alexandrou (99) οι οποίοι εισάγουν την έννοια της τυχαίας μεταβλητής διωνυμικού τύπου εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα (M.V.B.). Όμως η τ.μ. Ε n,k δεν αποτελεί τυχαία μεταβλητή διωνυμικού τύπου έτσι η μελέτη της με την προσέγγιση των Koutras και Alexandrou (99) είναι αδύνατη. Τέλος
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες σε αυτό το κεφάλαιο θα δούμε την επέκταση της μεθόδου αυτής σύμφωνα με τους Han και Αki (999) οι οποίοι εισάγουν την τυχαία μεταβλητή εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου (M.V.R.) και δίνουν αναδρομικές σχέσεις που ικανοποιούν την συνάρτηση πιθανότητας, την πιθανογεννήτρια και τις ροπές της. Στο κεφάλαιο αυτό θα δοθούν τύποι της συνάρτησης πιθανότητας, της μέσης τιμής, της διασποράς και της γεννήτριας συνάρτησης της τ.μ. Ε n,k σε ακολουθίες ανεξάρτητων ισόνομων ή μη δυαδικών δοκιμών. Στο τρίτο κεφάλαιο θα χρησιμοποιήσουμε συνδυαστικές μεθόδους κυρίως σε ανεξάρτητες και ισόνομες δυαδικές ακολουθίες για την μελέτη της τ.μ. Ε n,k σύμφωνα με τις οποίες οι τύποι που εξάγονται αποτελούνται από αθροίσματα που εμπεριέχουν διωνυμικούς συντελεστές. Αρχικά θα δούμε την προσέγγιση των Makri, Philippou και Psillakis (7) οι οποίοι μελετούν την κατανομή της τ.μ. που μελετάμε σε ακολουθία παραγόμενη σύμφωνα με το δειγματοληπτικό σχήμα Pόlya Eggenberger, διατεταγμένη γραμμικά ή κυκλικά. Στην πορεία θα δούμε την προσέγγιση των Sinha και Sinha (9) οι οποίοι έδωσαν το κλειστό τύπο υπολογισμού της συνάρτησης πιθανότητας της τ.μ. Ε n,k στην περίπτωση όπου p =, με την βοήθεια της γεννήτριας συνάρτησης. Επιπρόσθετα θα δούμε την εφαρμογή της προσέγγισης τους σε πραγματικά δεδομένα από την επιστήμη των υπολογιστών. Έπειτα οι Makri και Psillakis () δίνουν τον γενικό τύπο υπολογισμού της συνάρτησης πιθανότητας της τ.μ. Ε n,k για γενικό p, < p < και μελετούν την συμπεριφορά της μεταβλητής στα δεδομένα των Sinha και Sinha (9) για διάφορες τιμές του p. Αξίζει να αναφέρουμε ότι ο Mood (9) είναι αυτός που εισήγαγε τ.μ. Ε n,k και στην παρούσα εργασία παρουσιάζουμε την δεσμευμένη από κοινού συνάρτηση πιθανότητας των τ.μ. Ε n,,e n,,,e n,n δοθέντος του αριθμού Y των αποτυχιών στην ακολουθία, που έδωσε ο ίδιος. Οι Makri και Psillakis () έδωσαν επίσης την προσέγγιση της κατανομή της από μια Poisson και μια κανονική κατανομή. Στο κεφάλαιο αυτό θα δοθούν κλειστοί τύποι για την συνάρτηση πιθανότητας, της μέσης τιμής και της διασποράς της τ.μ. Ε n,k κάτω από συνδυαστικές μεθόδους. Σε όλη την εργασία για την καλύτερη εμπέδωση της θεωρίας αλλά και για την ορθότητα κάθε μεθόδου θα αναπτύσσουμε ως αριθμητικό παράδειγμα τη μελέτη της τυχαίας μεταβλητής E, κάτω από κάποιες ειδικές περιπτώσεις αντίστοιχα κάθε φορά. 7
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες. ΜΕΘΟΔΟΣ ΜΑΡΚΟΒΙΑΝΗΣ ΕΜΦΥΤΕΥΣΗΣ. Εισαγωγικά Στην ενότητα αυτή η μελέτη της κατανομής της τ.μ. Ε n,k θα γίνει με την χρήση της μεθόδου εμφύτευσης σε Μαρκοβιανή αλυσίδα. Με τη μέθοδο αυτή, η μελέτη της απαριθμήτριας τυχαίας μεταβλητής επιτεύχθηκε µε την εμφύτευση της σε µια Μαρκοβιανή αλυσίδα, η οποία εκμεταλλεύεται την ακολουθιακή φύση του σχηματισμού που εξετάζεται. Για την καλύτερη κατανόηση της μεθόδου αυτής θα παρουσιάσουμε την μέθοδο διαχρονικά και την εξέλιξη της βήμα βήμα. Στην πιο κάτω παράγραφο αρχικά θα παρουσιάσουμε την μέθοδο Μαρκοβιανής εμφύτευσης όπως εισήχθη για πρώτη φορά από τους Fu και Koutras (99). Με την μέθοδο αυτή η συνάρτηση πιθανότητας της τυχαίας μεταβλητής που μας ενδιαφέρει εκφράζεται μέσω πινάκων πιθανοτήτων μετάβασης της Μαρκοβιανής αλυσίδας. Η υπολογιστική δυσκολία που παρατηρείται κατά την εφαρμογή των τύπων που προκύπτουν, με την μέθοδο Μαρκοβιανής εμφύτευσης που εισήγαγαν οι Fu και Koutras (99), είναι οι πολλαπλασιασμοί μεταξύ πινάκων, τους οποίους η διάσταση εξαρτάται από τον αριθμών των δοκιμών της ακολουθίας πειραμάτων. Επομένως σύμφωνα με την προσέγγιση των Fu και Koutras (99), οι ακολουθίες που αποτελούνται από μεγάλο αριθμό δοκιμών έχουν ως αποτέλεσμα την χρήση πινάκων μεγάλης διάστασης, και ως επακόλουθο μεγάλη υπολογιστική δυσκολία. Πλεονέκτημα της μεθόδου αυτής είναι ότι μπορεί να εφαρμοστεί σε ανεξάρτητες δυαδικές δοκιμές και με μια παραλλαγή του τύπου εφαρμόζεται και σε ανεξάρτητες και ισόνομες δυαδικές δοκιμές. Η δυσκολία αυτή αντιμετωπίστηκε από τους Koutras και Alexandrou (99) οι οποίοι εισήγαγαν την έννοια της τυχαίας μεταβλητής διωνυμικού τύπου εμφυτεύσιμης σε Μαρκοβιανής αλυσίδας (M.V.B.). Σύμφωνα με τους Koutras και Alexandrou (99) η προσέγγιση τους αποτελεί μια υποκατηγορία της οικογένειας των εμφυτεύσιμων Μαρκοβιανών αλυσίδων, η οποία έρχεται να εμπλουτίζει την μέθοδο αυτή και να επιτρέψει τον ταχύτερο αριθμητικό υπολογισμό της συνάρτησης πιθανότητας της τυχαίας μεταβλητής. Αν και η μέθοδος αυτή παρουσιάζει πολλά πλεονεκτήματα σε σχέση με την μέθοδο των Fu και Koutras (99) καθώς επίσης επεκτείνεται και σε ανεξάρτητες μη ισόνομες δυαδικές δοκιμές και σε ανεξάρτητες και ισόνομες δυαδικές δοκιμές, δεν αποτελεί εργαλείο για την μελέτη της τ.μ. Ε n,k όπου μελετάμε. 8
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Τέλος οι Han και Aki (999) έρχονται να παρουσιάσουν μια νέα προσέγγιση η οποία αποτελεί την επέκταση της τυχαίας μεταβλητής διωνυμικού τύπου εμφυτεύσιμης σε Μαρκοβιανής αλυσίδας (M.V.B.) που εισήγαγαν οι Koutras and Alexandrou (99). Οι Han και Aki (999) εισάγουν την τυχαία μεταβλητή εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου (M.V.R.) και δίνουν αναδρομικές σχέσεις υπολογισμού την συνάρτησης πιθανότητας της τ.μ. Ε n,k στην περίπτωση ανεξάρτητων και μη ισόνομων δυαδικων δοκιμών. Πιο κάτω θα δώσουμε αναλυτικά το απαιτούμενο υπόβαθρο της μεθόδου αυτής προσαρμοσμένο στην μελέτη της τ.μ. Ε n,k, σε ανεξάρτητες και ισόνομες δοκιμές αλλά και σε μη ισόνομες δοκιμές, και για την καλύτερη κατανόηση της θα παρουσιάσουμε αριθμητικά παραδείγματα... Μέθοδος εμφύτευσης τυχαίας μεταβλητής σε Μαρκοβιανή αλυσίδα Όπως προαναφέρθηκε, οι Fu και Koutras (99) παρουσίασαν µια νέα μέθοδο για τη μελέτη τυχαίων μεταβλητών που απαριθµούν ροές επιτυχιών, σε ακολουθίες δοκιμών Bernoulli. Η μέθοδος αυτή αναφέρεται ως «μέθοδος Μαρκοβιανής εμφύτευσης» και συνίσταται στη μελέτη της τυχαίας μεταβλητής διαμέσου μιας εμφύτευσης της σε µια κατάλληλα ορισμένη Μαρκοβιανή αλυσίδα. Στον επόμενο ορισμό οι Fu και Koutras (99) εισήγαγαν την έννοια της τυχαίας μεταβλητής εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα. Έστω η ακολουθία Χ, Χ, Χ,, Χ n από n ανεξάρτητες δοκιμές Bernoulli με πιθανότητα επιτυχίας p t = P(X t = ) και πιθανότητα αποτυχίας q t = - p t για t =,,,n. Για n δεδομένο, έστω Γ n = {,,,,n} ένα σύνολο δεικτών και Ω = {α, α,, α m } ένας πεπερασμένος χώρος καταστάσεων. 9
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Ορισμός... (Fu και Koutras 99) Μια τ.μ. ακέραιων τιμών Χ n,k καλείται εμφυτεύσιμη σε πεπερασμένη Μαρκοβιανή αλυσίδα αν: i. Υπάρχει πεπερασμένη Μαρκοβιανή αλυσίδα {Υ t : t Γ n } ορισμένη στον πεπερασμένο χώρο καταστάσεων Ω. ii. υπάρχει πεπερασμένη διαμέριση {C xv, h xω=ω,,,l n } του χώρου καταστάσεων Ω. iii. για κάθε x =,,, l n, ισχύει P(X n,k = x) = P(Y n C x ). Έστω Λ t ο m x m πίνακας πιθανοτήτων μετάβασης της πεπερασμένης Μαρκοβιανής αλυσίδας ({Υ t : t Γ n }, Ω). Θεωρούμε ότι U r είναι ένα μοναδιαίο διάνυσμα διάστασης x m το οποίο έχει μονάδα στην r-οστή συνιστώσα και μηδέν οπουδήποτε αλλού και U r είναι το ανάστροφο διάνυσμα του U r, διάστασης m x. Επιπλέον, για κάθε στοιχείο της διαμέρισης C x, ορίζουμε το διάνυσμα U(C x ) = r:αrcx U r, διάστασης x m. Με την χρήση του πιο κάτω θεωρήματος που έδωσαν οι Fu και Koutras (99) είναι δυνατός ο υπολογισμός της συνάρτησης πιθανότητας μιας τυχαίας μεταβλητής εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα. Θεώρημα... (Fu και Koutras 99) Αν είναι Χ n,k είναι η τ.μ. εμφυτεύσιμη σε μια πεπερασμένη Μαρκοβιανή αλυσίδα τότε: P (X n,k = x) = π ( t n Λ ) U (C x), t όπου π = ( P(Y = α ), P(Y = α ), P(Y = α ),, P(Y = α m ) ) το διάνυσμα πιθανοτήτων αρχικών καταστάσεων της Μαρκοβιανής αλυσίδας, διάστασης x m.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Απόδειξη. Η τυχαία μεταβλητή Χ n,k είναι εμφυτεύσιμη σε μια πεπερασμένη Μαρκοβιανή αλυσίδα άρα P(X n,k = x) = P(Y n C x ) = P(Yn r). (.) C r x Εφαρμόζοντας την εξίσωση Chapman - Kolmogorov έχουμε: P(Y n = α r ) = P(Yn r / Y j)p(y j) Ω j = [P(Y = α ), P(Y = α ),, P(Y = α m )] P(Y n = a /Y = a ) P(Y n = a r /Y = a ) P(Y x [ n = a /Y = a ) P(Y n = a r /Y = a ) ] P(Y n = a /Y = a m ) P(Y n = a r /Y = a m ) [ ] b =j[,p(y n = α r / Y = α )P(Y = α ) + + P(Y n = α r / Y = α m )P(Y = α m ), ] x [ ] = [ P(Y n = α r / Y = α )P(Y = α ) + + P(Y n = α r /Y = α m )P(Y = α m ) ] n = π ( t Λ t ) U r. Η σχέση (.) γίνεται: P(X n,k = x) = a r C x n π ( t Λ ) U r t
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες n = π ( t Λ ) t α r C x U r n = π ( t Λ )U (C x ), για κάθε x =,,, l n. t Παρατήρηση... Σύμφωνα με το παραπάνω Θεώρημα είναι φανερό ότι μιλάμε για μη ομογενή Μαρκοβιανή αλυσίδα. Στην περίπτωση ομογενούς Μαρκοβιανής Αλυσίδας που αντιστοιχεί σε ακολουθία (ανεξάρτητων και ισόνομων δοκιμών Bernoulli), ο πίνακας πιθανοτήτων μετάβασης Λ t = Λ για κάθε t Γ n. Τότε η ακριβής κατανομή της τυχαίας μεταβλητής X n,k εκφράζεται ως εξής: P (X n,k = x) = π Λ n U (C x ), για κάθε x =,,, l n. Συνοψίζοντας, για να βρούμε την ακριβή κατανομή μιας τυχαίας μεταβλητής η οποία μπορεί να εμφυτευτεί σε Μαρκοβιανή αλυσίδα χρειάζεται να κατασκευάσουμε: i. έναν κατάλληλο χώρο καταστάσεων Ω ii. μία κατάλληλη διαμέριση {C x } του χώρου καταστάσεων Ω, και iii. τον πίνακα πιθανοτήτων μετάβασης Λ t, ο οποίος σχετίζεται με την τεχνική εμφύτευσης τυχαίων μεταβλητών, ακεραίων μη αρνητικών τιμών σε Μαρκοβιανή αλυσίδα.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες... Εύρεση της κατανομής της τ.μ. Ε n,k με τη μέθοδο της εμφύτευσης τυχαίας μεταβλητής σε Μαρκοβιανή αλυσίδα Η βασική ιδέα εύρεσης της ακριβούς κατανομής της τ.μ. Ε n,k είναι να μετατρέψουμε τον τρόπο που μετράμε τις ροές επιτυχιών μιας ακολουθίας δοκιμών, σε μια πεπερασμένη Μαρκοβιανή αλυσίδα με κατάλληλο χώρο καταστάσεων και κατάλληλο πίνακα πιθανοτήτων μετάβασης. Πριν περάσουμε στην διαδικασία εύρεσης της κατανομής θα δώσουμε κάποιες εισαγωγικές έννοιες: Χ n,k = Ε n,k : ο αριθμός των ροών επιτυχιών μήκους ακριβώς k σε δυαδική ακολουθία μήκους n. Χ n,k = x : η τιμή της τ.μ. Ε n,k m : ο αριθμός των συνεχόμενων επιτυχιών μετρώντας προς τα πίσω που βρίσκονται στο τέλος της ακολουθίας (παρέχει πληροφορίες για το στάδιο σχηματισμού του νέου προτύπου) S F S S F F S S S m Τα στοιχεία του χώρου Ω αναπαριστώνται με (x, i) όπου x παριστάνει τον αριθμό των ροών επιτυχιών μήκους k και το i σχετίζεται με τον αριθμό των συνεχόμενων επιτυχιών στην ακολουθία την δεδομένη χρονική στιγμή. Ο πίνακας πιθανοτήτων μετάβασης είναι ω Λ t = ( p(y,j ; x,i) ) όπου p(y,j ; x,i) = P(Y t = (y,j)/ Y t- = (x, i)). Εάν στην t- δοκιμή βρισκόμαστε στην κατάσταση (x, i) και στην t δοκιμή εμφανιστεί F (αποτυχία) τότε εισάγουμε την κατάσταση (x,) που παριστάνει το γεγονός ότι στην t οστή δοκιμή έχουμε x εμφανίσεις από ροές επιτυχιών μήκους k και η τελευταία δοκιμή είναι αποτυχία. Κάθε φορά που συμβαίνει μια αποτυχία τότε αρχίζουμε να μετράμε την επόμενη ροή από την αρχή και επομένως ισχύει p(x, ; x,i ) = q t. Οι τελευταίες καταστάσεις της Μαρκοβιανής αλυσίδας είναι απορροφητικές καταστάσεις (καταστάσεις που την στιγμή που εισέρχονται, δεν πρόκειται ποτέ να
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες εξέλθουν). Συνήθως θα θεωρούμε ότι P(Y = (,)) = άρα η τελευταία γραμμή του πίνακα πιθανοτήτων μετάβασης Λ t είναι πάντα (,,,,). Πιο κάτω φαίνεται πιο αναλυτικά ο τρόπος υπολογισμού της ακριβούς κατανομής της τ.μ. Ε n,k : Υποθέτουμε ότι έχουμε X, X,, X n μια ακολουθία ανεξάρτητων δοκιμών Βernoulli με δυνατά αποτελέσματα, επιτυχίας (S ή ) και αποτυχίας (F ή ), με αντίστοιχες πιθανότητες p t και q t = p t για t =,,, n. Ορίζουμε την πεπερασμένη Μαρκοβιανή αλυσίδα {Υ t πεπερασμένο χώρο καταστάσεων Ω. : t Γ n } ορισμένη στον Ω = Ω (Ε n,k ) = {(x,i): x =,,,l n, i = -, -,,, k - } { (,-) } με l n = [ n+ k+ ]. Ορίζουμε τις καταστάσεις: (x,i) για x =,,,l n και i =,,, k - Y t = (x,i) σημαίνει ότι m < k και υπάρχουν ακριβώς x ροές επιτυχίας μήκους ακριβώς k πριν τα τελευταία m + αποτελέσματα. Υπερπλήρεις καταστάσεις (Overflow States): (x, -), x =,,,l n Y t = (x,-), x =,,, l n σημαίνει ότι m > k και ακριβώς x ροές επιτυχίας μήκους k εμφανίστηκαν πριν τα τελευταία m+ αποτελέσματα. Αναμένουσες καταστάσεις (Waiting States): (x, -), x =,, l n Y t = (x,-), x =,, l n σημαίνει ότι m = k και ακριβώς x ροές επιτυχίας μήκους k εμφανίστηκαν μέχρι την τελευταία δοκιμή. Ορίζουμε τη διαμέριση του Ω (Ε n,k ): C = { (,i) : i = -,,, k-} C x = { (x,i) : i = -,-,,, k-}, x =,,, l n. όπου ισχύει Ω(Ε n,k ) = ln x= C x. Ορίζουμε τον πίνακα πιθανοτήτων μετάβασης Λ t = Λ t (Ε n,k ):
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Η δημιουργία του πίνακα μετάβασης βασίζεται στις πιθανότητες μετάβασης κατά την μετακίνηση από την δοκιμή t στην δοκιμή t. Έτσι έχουμε: ξξξξξξξ ξξξξξξξξλλλ ω p(y,j ; x,i) = P( Y t = (y,j)/ Y t- = (x, i) ) Μετάβαση από την κατάσταση (x,i) στην κατάσταση (x,) με πιθανότητα p(x, ; x,i) = q t Μετάβαση από την κατάσταση (x,i) στην κατάσταση (x,i+) με πιθανότητα p(x,i+ ; x,i) = p t, x =,,, l n, i =,,, k- Μετάβαση από την κατάσταση (x,k-) στην κατάσταση (x+,-) με πιθανότητα p(x+,- ; x,k-) = p t,x =,, l n - Μετάβαση από την κατάσταση (x,-) στην κατάσταση (x-,-) με πιθανότητα p(x-,- ; x,-) = p t,x =,, l n Μετάβαση από την κατάσταση (x,-) στην κατάσταση (x,-) με πιθανότητα p(x,- ; x,-) = p t,x =,,, l n Όπως προαναφέραμε πιο πάνω θεωρούμε ότι P(Y = (,)) = άρα το διάνυσμα αρχικών πιθανοτήτων π = (,,,,) και η τελευταία γραμμή του πίνακα πιθανοτήτων μετάβασης Λ t είναι πάντα (,,,). Σημειώνουμε επίσης ότι η διάσταση του πίνακα Λ t ( E n,k ) ισούται με: l n x C x = (l n +)(k+). Τέλος με την χρήση του Θεωρήματος... υπολογίζουμε την συνάρτηση πιθανότητας της τ.μ. Ε n,k. Για την καλύτερη κατανόηση της μεθόδου εμφύτευσης σε Μαρκοβιανή αλυσίδα που εισήγαγαν οι Fu και Koutras (99) παρουσιάζουμε τα ακόλουθα παραδείγματα.
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Παράδειγμα... Έστω μια ακολουθία n = ανεξάρτητων δοκιμών Bernoulli με πιθανότητα επιτυχίας p t = P(X t = ) και πιθανότητα αποτυχίας q t = - p t, p t = t+, t =,,,,. Θέλουμε να υπολογίσουμε την συνάρτηση πιθανότητας της τυχαίας μεταβλητής Ε n,k για k =, δηλαδή της Ε,. Ορίζουμε την πεπερασμένη Μαρκοβιανή αλυσίδα {Υ t : t Γ n } όπου Γ n = {,,,,} ορισμένη στον πεπερασμένο χώρο καταστάσεων Ω. Ω = Ω (Ε n,k ) = {(x,i): x =,,, i = -, -,,} { (,-) } με l n = [ + + ] = [ ] = Ω(Ε n,k ) = {(,-),(,),(,),(,-),(,-),(,),(,),(,-),(,-),(,),(,)} Ορίζουμε τις καταστάσεις: (x,i), για x =,, και i =, (x,-), για x=,, και (m > k=) (x,-), για x=, (m=k=) Ορίζουμε τη διαμέριση του Ω (Ε n,k ): C = { (,i) : i = -,,} C x = { (x,i) : i = -,-,,, x =, } Δηλαδή C = {(,-),(,),(,)} C = {(,-),(,-),(,),(,)} C = {(,-),(,-),(,),(,)} Με την χρήση των πιθανοτήτων μετάβασης που ορίσαμε παραπάνω μπορούμε να κατασκευάσουμε τον πίνακα πιθανοτήτων μετάβασης Λ t. Ορίζουμε το πίνακα πιθανοτήτων μετάβασης Λ t = Λ t (Ε n,k )
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Λ tξ (Ε n,k ) = (, ) (,) (,) (, ) (, ) (,) (,) (, ) (, ) (,) (,) (, ) (,) (,) (, ) (, ) (,) (,) (, ) (, ) (,) (,) p t q t q t p t q t p t p t q t p t q t q t p t q p t t p t q t p t q t q p t t Η διάσταση του πίνακα Λ t (E n,k ) ισούται με: x C x = C + C + C =(+)(+) = = Άρα ο Λ tν (Ε n,k ) όπως εξ άλλου φαίνεται από τον ίδιο τον πίνακα είναι διάστασης x. Η συνάρτηση πιθανότητας της τυχαίας μεταβλητής E n,k υπολογίζεται από τον πιο κάτω τύπο: P (Ε, = x) = π ( Λ t )U (C x ),x =,, t P (Ε, = x) = π (Λ Λ Λ Λ Λ ) U (C x ),x =,, όπου π = ( (P(Y = (,-)),P(Y = (,)),P(Y = (,)),P(Y = (,-)),P(Y = (,-)), P(Y = (,)),P(Y = (,)),P(Y = (,-)), P(Y = (,-)), P(Y = (,)), P(Y = (,)) ). 7
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες 8 Θεωρούμε ότι P(Y = (,)) = συνεπώς το διάνυσμα αρχικών πιθανοτήτων είναι π = (,,,,,,,,,,). Θεωρούμε την πιθανότητα επιτυχίας p t = P(X t = ) = t+,οπότε η πιθανότητα αποτυχίας είναι q t = - t+ = t t+,t =,,,,. Για κάθε τιμή του t υπολογίζουμε πιο κάτω τους πίνακες πιθανοτήτων μετάβασης. Για t = έχουμε p = και q = Λ =
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες 9 Για t = έχουμε p = και q = Για t = έχουμε p = και q = Λ = Λ =
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Για t = έχουμε p = και q = Για t = έχουμε p = και q = Λ = Λ =
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Συνεπώς t t Λ = Λ Λ Λ Λ Λ = =
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες = = 7 7 7 8 7 7 7 9 7 9 7 8 7 7 7 8 7 7 7 7 9 7 7 7 7 7 7 7 7 7 7 8 7 7 8 7 7 7 9 7 7 7 7 7 9 7 8 7 7 8 7 7 7 9 7 8 7 7 7 9 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 9 7 7 Η διαμέριση του Ω (Ε n,k ) είναι: U(C ) = (,,,,,,,,,,) U(C ) = (,,,,,,,,,,) U(C ) = (,,,,,,,,,,) Προχωράμε στον υπολογισμό της συνάρτησης πιθανότητας της τ.μ. Ε n,k : για x = P ( Ε, = ) = π (Λ Λ Λ Λ Λ ) U (C ) = (,,,,,,,,,,) x 7 7 7 8 7 7 7 9 7 9 7 8 7 7 7 8 7 7 7 7 9 7 7 7 7 7 7 7 7 7 7 8 7 7 8 7 7 7 9 7 7 7 7 7 9 7 8 7 7 8 7 7 7 9 7 8 7 7 7 9 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 9 7 7
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες = 8 7 8 7 7 7 7 7 = + 8 + 8 7 + + + =,79. 7 7 7 για x = P (Ε, = ) = π (Λ Λ Λ Λ Λ ) U (C ) = (,,,,,,,,,,) x 7 7 7 8 7 7 7 9 7 9 7 8 7 7 7 8 7 7 7 7 9 7 7 7 7 7 7 7 7 7 7 8 7 7 8 7 7 7 9 7 7 7 7 7 9 7 8 7 7 8 7 7 7 9 7 8 7 7 7 9 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 9 7 7 =
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες = 8 7 8 7 7 7 7 7 = + + + + + + + + + =,. 7 7 7 7 για x = P (Ε, = ) = π (Λ Λ Λ Λ Λ ) U (C ) = (,,,,,,,,,,) x 7 7 7 8 7 7 7 9 7 9 7 8 7 7 7 8 7 7 7 7 9 7 7 7 7 7 7 7 7 7 7 8 7 7 8 7 7 7 9 7 7 7 7 7 9 7 8 7 7 8 7 7 7 9 7 8 7 7 7 9 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 9 7 7
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες 8 8 = 7 7 7 7 7 7 = +.. + + 7 + + + = 7,. Άρα η ακριβής κατανομή της τ.μ. Ε, στην περίπτωση ανεξάρτητων αλλά όχι ισόνομων δυαδικών πειραμάτων είναι: x = P(E, = ) =,79 x = P(E, = ) =, x = P(E, = ) =,. Παράδειγμα... Έστω μια ακολουθία n = ανεξάρτητων και ισόνομων δοκιμών Bernoulli με πιθανότητα επιτυχίας p = P(X t = ) και πιθανότητα αποτυχίας q t = - p t όπου p t = = q t για t =,,,,. Θέλουμε να υπολογίσουμε την συνάρτηση πιθανότητας της τυχαίας μεταβλητής Ε n,k για k =, δηλαδή της Ε,. Προσδιορίζοντας τον νέο πίνακα πιθανοτήτων μετάβασης έχουμε: Χώρος καταστάσεων: Ω (Ε n,k ) ={(,-),(,),(,),(,-),(,-),(,),(,),(,-),(,-),(,),(,)}
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Καταστάσεις: (x,i), για x =,, και i =, (x,-), για x=,, και (m > k=) (x,-), για x =, (m=k=) Διαμέριση: C = {(,-),(,),(,)} C = {(,-),(,-),(,),(,)} C = {(,-),(,-),(,),(,)} Με την χρήση των πιθανοτήτων μετάβασης που ορίσαμε παραπάνω μπορούμε να κατασκευάσουμε τον πίνακα πιθανοτήτων μετάβασης Λ t. Πίνακα πιθανοτήτων μετάβασης Λ t = Λ t (Ε n,k ): Λ = Λ t =, t =,,,,
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες 7 Μετά από υπολογισμούς έχουμε: t t Λ = Προχωράμε στον υπολογισμό της συνάρτησης πιθανότητας της τ.μ. Ε n,k : για x = P (Ε, = ) = π Λ U (C ) = = (,,,,,,,,,,) 8 7 7 7 7 7 7 8 8 7 7 7 7 7 7 8
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες = = + + + + + = =,. για x = P (Ε, = ) = π Λ U (C ) = = (,,,,,,,,,,) 8 7 7 7 7 7 7 8 8
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες = = + + + + + + + + + = =,. για x = P (Ε, = ) = π Λ U (C ) = = (,,,,,,,,,,) 8 7 7 7 7 7 7 8 9
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες = = + + + = =,. Άρα η ακριβής κατανομή της τ.μ. Ε, στην περίπτωση ανεξάρτητων και ισόνομων πειραμάτων Bernoulli με πιθανότητα επιτυχίας p = είναι: x = P(E, = ) =, x = P(E, = ) =, x = P(E, = ) =,. Το σημαντικό πρόβλημα που παρατηρείται από τις πιο πάνω εφαρμογές για τον υπολογισμό της συνάρτησης πιθανότητας της τυχαίας μεταβλητής Ε n,k είναι η διάσταση του πίνακα Λ t ιδιαίτερα στην περίπτωση που το μήκος της ακολουθίας είναι μεγάλο. Δηλαδή όσο το μήκος της ακολουθίας, n, μεγαλώνει, τόσο η διάσταση των πινάκων που χρησιμοποιούμε γίνεται μεγάλη.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες.. Eμφυτεύσιμη τυχαία μεταβλητή σε Μαρκοβιανή αλυσίδα διωνυμικού τύπου (M.V.Β.) Τη δυσκολία του αριθμητικού υπολογισμού της μεθόδου που περιγράφηκε αντιμετώπισαν οι Κoutras και Alexandrou (99) εισάγοντας την έννοια της μεταβλητής διωνυμικού τύπου εμφυτέυσιμης σε Μαρκοβιανή αλυσίδα (Μ.V.B.). Στην μελέτη τους χρησιμοποιούν διανύσματα πιθανότητας των οποίων η διάσταση είναι ανεξάρτητη από τον αριθμό των δοκιμών της ακολουθίας και ο υπολογισμός της κατανομής των τυχαίων μεταβλητών γίνεται εύκολα μέσω αναδρομικών σχέσεων. Σύμφωνα με την τεχνική των Κoutras και Alexandrou (99) ο πίνακας Λ t μπορεί να εκφραστεί σε μια διδιαγώνια μορφή, δηλαδή οι μη μηδενικοί υποπίνακες Α t και B t εμφανίζονται ακριβώς επάνω από την κύρια διαγώνιο του πίνακα Λ t. Έτσι κατάφεραν να διαμορφώσουν μια τροποποιημένη τεχνική Μαρκοβιανής εμφύτευσης η οποία χρησιμοποιεί μόνο τους μη μηδενικούς υποπίνακες, ξεπερνώντας έτσι τη δυσκολία της μεγάλης διάστασης του πίνακα Λ t. Η τροποποιημένη τεχνική στηρίζεται στην χρήση των πινάκων Α t (x) και B t (x) καθώς και στα διανύσματα πιθανότητας f t (x) τα οποία σε κάθε δοκιμή στο χρόνο t περιγράφουν τον σχηματισμό της ακολουθίας που έχει προηγηθεί. Οι Κoutras και Alexandrou (99) έδωσαν τον πιο κάτω ορισμό της μεταβλητής διωνυμικού τύπου εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα. Ορισμός... (Κoutras και Alexandrou 99) Μια θετική ακέραια τυχαία μεταβλητή Χ n θα λέγεται μεταβλητή διωνυμικού τύπου εμφυτεύσιμη σε Μαρκοβιανή αλυσίδα (M.V.B.) αν η τ.μ. Χ n εμφυτεύεται σε Μαρκοβιανή αλυσίδα {Υ t : t } με Ω = {α,α,,α m } πεπερασμένο χώρο καταστάσεων και C x = {(x,i): x =,,, l n, i =,,, s} πεπερασμένη διαμέριση του Ω με l n = max {x : P(X n = x) > } και s = C x. ισχύει ότι P(Y t = (y,j)/y t- = (x,i) ) =, y x, x +, t =,,,n.
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Για κάθε Μ.V.B. ορίζουμε τους πίνακες μετάβασης διάστασης sxs : A t (x) = ( α ij (x) ) = ( P(Y t = (x,j)/y t- = (x,i)) ) B t (x) = ( b ij (x) ) = ( P(Y t = (x+,j)/y t- = (x,i)) ) και το διάνυσμα γραμμή των πιθανοτήτων που σχετίζεται με το χρόνο t και τον υποχώρο καταστάσεων C x διάστασης xs: f t (x) = ( P(Y t = (x,) ),P(Y t = (x,) ),,P(Y t = (x,s-)) ), x =,,, l n, t =,,,n. Σχετικά με τους πίνακες Α t (x) και B t (x) ισχύουν τα εξής: Τα στοιχεία του πίνακα Α t (x) αποτελούν τις μεταβάσεις ενός βήματος μέσα στις καταστάσεις, δηλαδή τις μεταβάσεις της Μαρκοβιανής αλυσίδας από μια κατάσταση (x,i) σε μια άλλη κατάσταση (x,j) της ίδιας κατάστασης x. Τα στοιχεία του πίνακα Β t (x) αποτελούν τις μεταβάσεις ενός βήματος μεταξύ των καταστάσεων, δηλαδή τις μεταβάσεις της Μαρκοβιανής αλυσίδας από μια κατάσταση (x,i) σε μια κατάσταση (x+,j) Το άθροισμα των Α t (x) + B t (x) είναι ένας στοχαστικός πίνακας. Το επόμενο θεώρημα δίνει τις αναδρομικές σχέσεις για την συνάρτηση πιθανότητας που διευκολύνουν τον αριθμητικό υπολογισμό της κατανομής μιας τυχαίας μεταβλητής διωνυμικού τύπου εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα. Θεώρημα... (Κoutras και Alexandrou 99) Η διπλή ακολουθία των διανυσμάτων f t (x), x =,, l n, t =,,, n ικανοποιεί τις αναδρομικές σχέσεις: f t () = f t- () A t (), t =,,, n f t (x) = f t- (x) A t (x) + f t- (x-) B t (x-), x =,, l n, t =,, n με αρχικές συνθήκες f (x) = π x, x =,, l n.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες H συνάρτηση πιθανότητας της Χ n δίνεται από τον τύπο P (X n = x) = f n (x), x =,,, l n όπου συμβολίζει το διάνυσμα διάστασης x s με όλες τις συνιστώσες του ίσες με. Για την καλύτερη κατανόηση της τεχνικής των Κoutras και Alexandrou (99) που ορίσαμε πιο πάνω πρέπει να κατανοήσουμε καλύτερα τον συλλογισμό που βρίσκεται πίσω από τους παραπάνω πίνακες. Η διαδικασία που περιγράφεται από μια M.V.B. δεν μπορεί να κινηθεί προς τα πίσω ή να μεταπηδήσει σε μια άλλη κατάσταση, χωρίς να επισκεφτεί πρώτα την αμέσως επόμενη κατάσταση. Με την χρήση των μεταβλητών διωνυμικού τύπου εμφυτεύσιμων σε Μαρκοβιανή αλυσίδα (Μ.V.B.) επιτυγχάνεται η μελέτη τυχαίων μεταβλητών που σχετίζονται με τον αριθμό των εμφανίσεων ροών επιτυχιών, καθώς και άλλων τυχαίων μεταβλητών οι οποίες σχετίζονται με τον χρόνο αναμονής για την εμφάνιση ροών επιτυχιών. Οι Κoutras και Alexandrou (99) με την νέα αυτή τεχνική παρατήρησαν ότι, συνήθως ο Λ t μπορεί να εκφραστεί σε μια διδιαγώνια μορφή, δηλαδή, οι μη μηδενικοί υποπίνακες Α t και Β t εμφανίζονται μόνο στην κύρια διαγώνιο και στην διαγώνιο που βρίσκεται ακριβώς επάνω από την κύρια. Όμως για την τυχαία μεταβλητή που μελετάμε, Ε n,k είναι αδύνατη η δημιουργία πίνακα πιθανοτήτων μετάβασης, Λ t (Ε n,k ) ο οποίος να πάρει την διδιαγώνια μορφή, όπως αναφέραμε πιο πάνω, καθώς και η δημιουργία αλυσίδας που να μην κινείται προς τα πίσω. Επομένως με την βελτιωμένη τεχνική εμφυτεύσιμης Μαρκοβιανής αλυσίδας με τ.μ. διωνυμικου τύπου που όρισαν οι Κoutras και Alexandrou (99) δεν είναι δυνατός ο υπολογισμός της κατανομής της τ.μ Ε n,k.
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες.. Eμφυτεύσιμη τυχαία μεταβλητή σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου (M.V.R.) Στην πορεία οι Han και Aki (999) εισήγαγαν μια νέα μέθοδο η οποία αποτελεί την επέκταση της εμφυτεύσιμης μεταβλητής σε Μαρκοβιανή αλυσίδα διωνυμικού τύπου σύμφωνα με την οποία μπορεί να υπολογιστεί η ακριβής κατανομή των πιο κοινών στατιστικών ροών επιτυχιών συμπεριλαμβανομένης και της τυχαίας μεταβλητής που μελετάμε, της Ε n,k. Σύμφωνα με την νέα τεχνική οι Han και Aki (999) εισάγουν την έννοια της τυχαίας μεταβλητής εμφυτεύσιμης σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου (M.V.R.). Ορισμός... (Han και Aki 999) Η θετική ακέραια τυχαία μεταβλητή Χ n καλείται εμφυτεύσιμη μεταβλητή σε Μαρκοβιανή αλυσίδα επιστρέψιμου τύπου (M.V.R.) αν: Υπάρχει Μαρκοβιανή αλυσίδα {Y t, t } ορισμένη στον πεπερασμένο χώρο καταστάσεων Ω, Υπάρχει διαμέριση {C x, x =,, } του χώρου καταστάσεων Ω, P(X n = x) = P(Y n C x ) για κάθε x =,, και P( Y t C y / Y t- C x ) = αν y x-, x, x+. Στην συνέχεια παραθέτουμε κάποια βασικά στοιχεία που θα μας είναι χρήσιμα στην πορεία ανάπτυξης της μεθόδου. Το διάνυσμα πιθανoτήτων: f t (x) = ( P(Y t = c x, ), P(Y t = c x, ),, P(Y t = c x,s ) ) με x =,,, l t και t όπου l t = max {x: P(Y t C x ) > } και όταν t = n, l t = l n Το διάνυσμα αρχικών πιθανοτήτων της Μαρκοβιανής αλυσίδας {Υ t : t } π x = f (x), x =,,, l t
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Οι πίνακες πιθανοτήτων μετάβασης: A t (x) = ( P(Y t = c x,j ) / P( Y t- = c x,i ) ) sxs B t (x) = ( P(Y t = c x+,j ) / P( Y t- = c x,i ) ) sxs C t (x) = ( P(Y t = c x-,j ) / P( Y t- = c x-,i ) ) sxs O A t (x) πίνακας αποτελείται από στοιχεία τα οποία αφορούν μεταβάσεις ενός βήματος σε καταστάσεις από C x σε C x. Ο Β t (x) πίνακας αποτελείται από στοιχεία τα οποία αφορούν μεταβάσεις ενός βήματος σε καταστάσεις από C x σε C x+. Ο C t (x) πίνακας αποτελείται από στοιχεία τα οποία αφορούν μεταβάσεις ενός βήματος σε καταστάσεις από C x σε C x-. Το επόμενο θεώρημα δίνει μια αναδρομική σχέση για τον υπολογισμό της συνάρτησης πιθανότητας μιας τ.μ. επιστρέψιμου τύπου. Θεώρημα... (Han και Aki 999) Το διάνυσμα πιθανοτήτων f t (x), x =,,, l t, t =,,, n ικανοποιεί τη σχέση f t (x) = f t- (x) A t (x) + f t- (x-) B t (x-) + f t- (x+) x C t (x+), n x =,,, l t, t =,,, n. και f t (y) =, y < ή y > l t, t =,,, n και f (x) = π x, x =,,, l. Τότε η συνάρτηση πιθανότητας της τυχαίας μεταβλητής Χ n η οποία είναι M.V.R. τύπου δίνεται από τον τύπο: P(X n = x) = f n (x), x=,,,l n. Στην συνέχεια επισυνάπτουμε τον τύπο της γεννήτριας συνάρτησης μιας τ.μ. Χ n l n φ n (z) =P(Xn x) z x = x l n x f n (x) z. x
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες l t Αντίστοιχα αν φ t (z) = x f t (x) z για την Μαρκοβιανή αλυσίδα, τότε φ n (z) = φ n (z) x Έπεται το θεώρημα που δίνει μια αναδρομική σχέση για τον υπολογισμό της γεννήτριας συνάρτησης μιας τ.μ. επιστρέψιμου τύπου. Θεώρημα... Αν Α t (x) = A t, B t (x) = B t, C t (x) = C t για όλα τα x =,, (δηλαδή οι πιθανότητες μετάβασης είναι ανεξάρτητες του x), έχουμε: φ t (z) = φ t- (z) (A t + z B t + z - C t ), t =,,, l όπου φ (z) = x π x z. x Απόδειξη. l t φ t (z) =f x t (x) z x l t = x ( f t (x) A t + f t (x ) B t + f t (x + ) x C t ) z x l t = x l t f t (x) A t z x + x l t f t (x) B t z x+ + x f t (x) C t z x Επειδή l t = max{x : P(X n = x) > } και f t (x) = για x < και x > l t και l l ln. Επομένως l t l t- {,},αφού η Μαρκοβιανή αλυσίδα δεν μπορεί να κινηθεί σε υψηλότερες καταστάσεις χωρίς να κινηθεί πρώτα στις δίπλα καταστάσεις. αν l t = l t-, έχουμε
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες l t φ t (z) = ( x l t f t (x) z x ) ) Α t + ( x f t (x) z x f t (l t )z l t ) z B t + l t + ( x f t (x) z x f t () z + f t (l t + )C t z l t + ) z C t = φ t- (z) (A t + z B t + z - C t ) - f t (l t ) z l t + B t - f t () z C t +. (.) Αν πολλαπλασιάσουμε και τις δύο πλευρές με και αντικαταστήσουμε όπου z = έχουμε: φ t () = l t x x P(X n x) = φ t- () = (A t + z B t + z - C t ) = (A t + B t + C t ) = Επομένως ( f t (l t ) l t + B t + f t () C t ) = ( f t (l t ) B t + f t () C t ) = Άρα f t (l t ) B t = και f t ()C t = Άρα από την σχέση (.) έχουμε φ t (z) = φ t- (z) (A t + z B t + z - C t ) αν l t = l t- +, έχουμε l t φ t (z) =( x l t f t (x) z x + f t (l t + ) z lt + ) Α t + ( x f t (x) z x ) z B t + cv l t + ( x f t (x) z x + f t ()z + f t (l t + )z l t + μμμμμμμμμμμμμμμμμ + + f t (l t + ) z l t + ) z C t = φ t- (z) (A t + z B t + z - C t ) + f t (l t + )z l t + A t - f t () z C t 7
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες + f t (l t + )z l t + C t + f t (l t + )z l t + C t (.) = φ t- (z) (A t + z B t + z - C t ) + f t- () z C t + +. Όμοια με πριν αν πολλαπλασιάσουμε και στις δύο πλευρές με και αντικαταστήσουμε όπου z = από την σχέση (.) έχουμε φ t (z) = φ t- (z) (A t + z B t + z - C t ), t. Παρατήρηση... Το f t- (x) C t είναι προς τα πίσω διάνυσμα πιθανοτήτων μετάβασης από την C x στην C x-. Το f t- (x) B t είναι προς τα εμπρός διάνυσμα πιθανοτήτων μετάβασης από την C x στην C x+. Η τ.μ. Χ t είναι μη αρνητική και το l t = max {x: P(X n = x) >},η μέγιστη δυνατή τιμή. Επομένως οι μεταβάσεις αυτές δεν μπορούν να εμφανιστούν για x = και x = l t- (για l t = l t- ). Για αυτό το λόγο στην απόδειξη έπεται ότι: f t- () C t = f t- (l t ) B t =. Παρατήρηση... Αν φ t (z) = φ t- (z) (A t + z B t + z - C t ) έχουμε: φ n (z) = φ n- (z) (A n + z B n + z - C n ) φ n (z) = φ n- (z) (A n + z Β n + z C n ) (A n + z B n + z - C n ) φ n (z) = φ n- (z) (A n + z B n + z C n )(A n + z B n + z C n )glglg 8
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες (A n +z B n +z - C n ) φ n (z) = φ (z) (A + z B + z C ) (A n + z B n + z C n ) φ n (z) = φ (z) (A + z B + z C )(A + z B + z C ) (A n + z B n + z C n ) n φ n (z) = φ (z) (A t + z B t + z - C t ) t όπου φ (z) = l l x f (x) z = x x x x z π.... Εύρεση της κατανομής της τ.μ. Ε n,k με τη μέθοδο της εμφύτευσης τυχαίας μεταβλητής σε Μαρκοβιανή Αλυσίδα επιστρέψιμου τύπου: Η βασική ιδέα εύρεσης της κατανομής της τ.μ. Ε n,k είναι μέσω αναδρομικών σχέσεων οι οποίες εκφράζονται από διανύσματα πιθανοτήτων και τους πίνακες Α t,b t και C t που ορίσαμε, οι οποίοι είναι μικρής διάστασης,με αποτέλεσμα τη μείωση του υπολογιστικού χρόνου εύρεσης της κατανομής. Πιο κάτω αναπτύσσουμε αναλυτικά τη διαδικασία υπολογισμού της ακριβούς κατανομής της τ.μ. Ε n,k : Έστω X, X,, X n μια ακολουθία ανεξάρτητων δοκιμών Βernoulli με δυνατά αποτελέσματα, επιτυχίας (S ή ) και αποτυχίας (F ή ), με αντίστοιχες πιθανότητες p t και q t = p t για t =,,, n. έστω x ο αριθμός των ροών επιτυχιών μήκους ακριβώς k μέχρι την t- οστή δοκιμή. έστω y * ο αριθμός των τελευταίων διαδοχικών επιτυχιών μετρώντας προς τα πίσω (y * = αν η t- οστη δοκιμή είναι ) l n = [ n+ k+ ] και y = { δδ y, αν y < k, αν y > k, αν y = k 9
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Ορίζουμε τη Μαρκοβιανή αλυσίδα {Υ t = (x,y): t =,, }με χώρο καταστάσεων Ω = {(x,y)/x =,,, l n, y =-,-,,, k-} = l n x= C x τη διαμέριση του Ω : C x = {(x,y)/ y = -,-,,, k-}, x =,,,ln Η διάσταση των πινάκων είναι s x s, s = k +. Η κατάσταση (,-) είναι υποθετική κατάσταση αφού δεν είναι εφικτό να δημιουργηθεί, αλλά την βάζουμε για να συμπληρώσουμε την διάσταση της C να ισούται με C x = k+. Επίσης με την (,-) έχουμε f t- () C t = και έτσι η Μαρκοβιανή αλυσίδα δεν μπορεί να μεταφερθεί σε αρνητική κατάσταση. Διανύσματα πιθανοτήτων: - f t (x) = ( P(Y t = (x, ), P(Y t = (x, ),, P(Y t = (x, k ), P(Y t = (x, ), P(Y t = (x, ) ), x =,,, l n - Το διάνυσμα αρχικής πιθανότητας: f (x) = π x = (P(Υ = (x, ), P(Υ (x, ),, P(Υ = (x, k ), P(Υ (x, ), P(Υ = (x, )). Οι πιθανότητες μετάβασης: - P(Y t = (x, y+)/y t- = (x,y) ) = p t, y =,,, k- - P(Y t = (x, -)/Y t- = (x,-) ) = p t - P(Y t = (x, )/Y t- = (x,y) ) = q t = - p t, y = -,-,,,, k- - P(Y t = (x+, -)/Y t- = (x,k-) ) = p t - P(Y t = (x-, -)/Y t- = (x,-) ) = p t. Οι πίνακες πιθανοτήτων μετάβασης: - Α t (x) = ( P( Y t = (x, j) / Y t = (x, i)) ) sxs - B t (x) = ( P( Y t = (x +, i) / Y t = (x, i)) ) sxs - C t (x) = ( P( Y t = (x, i) / Y t = (x, i)) ) sxs.
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Για τον υπολογισμό της συνάρτησης πιθανότητας της τ.μ. Ε n,k δίνεται από τις πιο κάτω αναδρομικές σχέσεις f t (x) = f t- (x) A t (x) + f t- (x-) B t (x-) + f t- (x+) x C t (x+) x =,,l n κα t =,,, n και f t (y) =, y < και y > l n, t =,,,n και f (x) = π x, x =,,, l Επομένως η συνάρτηση πιθανότητας της τ.μ. Χ n δίνεται από P (X n = x) = f n (x) Για την καλύτερη κατανόηση της μεθόδου της εμφύτευσης της Ε n,k σε Μαρκοβιανή αλυσίδα των Han και Aki (999) παρουσιάζουμε το ακόλουθο παράδειγμα. Παράδειγμα... Έστω μια ακολουθία n = ανεξάρτητων δοκιμών Bernoulli με πιθανότητα επιτυχίας p t = P(X t = ) και πιθανότητα αποτυχίας q t = - p t όπου p t = t+, t =,,,,. Θέλουμε να υπολογίσουμε την συνάρτηση πιθανότητας της τυχαίας μεταβλητής Ε n,k για k =, δηλαδή της Ε, χρησιμοποιώντας τη μέθοδο των Han και Aki (999). Αρχικά κάνουμε την απαραίτητη προεργασία για τον υπολογισμό της συνάρτησης πιθανότητας της τ.μ. Ε n,k δ l n = [ n+ y, αν y < ] = k+ [] = και y = {, αν y >, αν y = Η Μαρκοβιανή αλυσίδα {Υ t = (x,y): t =,,,, } Xώρος καταστάσεων Ω = {(x,y)/x =,,, y =-,-,, } ή αναλυτικά
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Ω = {(,),(,),(,-),(,-),(,),(,),(,-),(,-),(,),(,),(,-),(,-)} Η διαμέριση του Ω : C x = {(x,y)/x =,, y = -,-,,} C = {(,),(,),(,-),(,-)} C = {(,),(,),(,-),(,-)} C = {(,),(,),(,-),(,-)} Η διάσταση των πινάκων είναι s x s, s = k + = Το διάνυσμα αρχικών πιθανοτήτων: f (x) =π x = (P(Υ = (x, ), P(Υ = (x, ), P(Υ = (x, ), P(Υ = (x, ) ) Θεωρούμε ότι το διάνυσμα αρχικών πιθανοτήτων είναι P(Y = (,)) = άρα π = (,,,) π = (,,,) π = (,,,) Οι πίνακες πιθανοτήτων μετάβασης: A t = (x,) (x,) (x, ) (x, ) (x,) (x,) (x, ) (x, ) q t p t q t q t q t p t (x,) (x,) (x, ) (x, ) B t = (x,) (x,) (x, ) (x, ) pt
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες C t = Υπολογισμός συνάρτησης πιθανότητας: f t (x) = f t- (x) A t (x) + f t- (x-) B t (x-) + f t- (x+) x C t (x+) x =,, και t =,,,, f t (y) =, y < και y >, t =,,,, και f (x) = π x, x =,, P (X n = x) = f n (x) Για διάφορες τιμές του t και x υπολογίζουμε το αντίστοιχο διάνυσμα πιθανότητας όπως φαίνεται πιο κάτω Για t = : p t = t+ p = = q A =, B = ννννκαι C = ) (x, ) (x, (x,) (x,) ), (x ), (x,) (x,) (x p t
Ελένη Νικολάου Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Για x = : f () = f () A + f (-) B + f () C = π A + f (-) B αφού -< = ( ) = ( ) Για x = : f () = f () A + f () B + f () C = π A + π B + π C αφού π = αφού π = = ( ) = ( ) Για x = : f () = f () A + f () B + f () C = π A + π B + f () C = ( ) αφού π = αφού π = αφού > l n =
Ροές Επιτυχιών Συγκεκριμένου Μήκους σε Δυαδικές Ακολουθίες Για t = : p t = t+ p =, q = A = ν, B = και C = Για x = : f () = f () A + f (-) B + f () C = ( ) = ( ) Για x = : f () = f () A + f () B + f () C = ( ) = ( )