Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 2 ου Πανελληνίου Συνεδρίου Στατιστικής (27), σελ 37-45 ΠΙΘΑΝΟΤΗΤΑ ΕΞΑΛΕΙΨΗΣ ΚΑΙ ΚΛΑΔΩΤΕΣ ΑΛΥΣΙΔΕΣ Τρύφων Δάρας, Αθηνά Παλιεράκη 2 Λέκτορας, Γενικό Τμήμα, Πολυτεχνείο Κρήτης daras_tryfo2@yahoo.gr 2 Μαθηματικός, Μ.Δ.Ε. palath79@yahoo.gr ΠΕΡΙΛΗΨΗ Έστω ότι έχουμε έναν πληθυσμό ο οποίος εξελίσσεται αναφορικά με τον χρόνο (φορείς μίας μολυσματικής ασθένειας, πελάτες που φθάνουν σε ένα σημείο εξυπηρέτησης, κ.α.). Στον πληθυσμό αυτό υπάρχει ένας αρχικός «οργανισμός» ο οποίος στο τέλος του βιολογικού του κύκλου παράγει έναν τυχαίο αριθμό απογόνων σύμφωνα με μια υποθετική κατανομή. Η διαδικασία αυτή συνεχίζεται, θεωρητικά έπ άπειρον, κατά τον ίδιο τρόπο. Το μέγεθος, του πληθυσμού της οστής γενιάς μπορεί να μελετηθεί με την βοήθεια στοχαστικών (μοντέλων) ανελίξεων τα οποία καλούνται κλαδωτές αλυσίδες. Οι αλυσίδες αυτές πρωτοχρησιμοποιήθηκαν από τους Galto & Watso (873), σαν μοντέλα για την εκτίμηση της εξαφάνισης ενός ανδρικού πληθυσμού (διατήρηση επωνύμου). Σε τέτοιου είδους μοντέλα μας ενδιαφέρει, η πιθανότητα να εξαφανιστεί ο πληθυσμός κάποτε, η λεγόμενη πιθανότητα εξάλειψης. Στην εργασία αυτή (α) αποδεικνύουμε το θεμελιώδες θεώρημα των κ.α., για την πιθανότητα εξάλειψης, πρώτα με τον κλασσικό τρόπο των πιθανογγενητριών συναρτήσεων και κατόπιν με την βοήθεια της θεωρίας των martigales (β) μελετάμε την εν λόγω πιθανότητα σε ορισμένα θεωρητικά μοντέλα κ.α. (γ) γίνεται αναφορά παραδειγμάτων από τον Ελληνικό πληθυσμό με την βοήθεια δεδομένων από προηγούμενες απογραφές της Ε.Σ.Υ.Ε.. ΟΡΙΣΜΟΣ ΚΛΑΔΩΤΗΣ ΑΛΥΣΙΔΑΣ Έστω ότι θέλουμε να μελετήσουμε μία από τις ακόλουθες καταστάσεις: α) (Διάδοση επιδημίας) Ένας οργανισμός είναι φορέας μίας μολυσματικής αρρώστιας και μολύνει οργανισμούς του «γειτονικού» του περιβάλλοντος, οι οποίοι με την σειρά τους μολύνουν άλλους οργανισμούς με τον ίδιο τρόπο. Θα θέλαμε να ξέρουμε αν πρόκειται για επιδημία ή η αρρώστια τείνει να εξαλειφθεί; β) (Ουρές αναμονής) Ένας πελάτης φτάνει σε ένα σημείο εξυπηρέτησης το οποίο είναι κενό και αρχίζει να εξυπηρετείται. Κατά την διάρκεια της εξυπηρέτησης του, άλλοι πελάτες φθάνουν και σχηματίζουν μίαν ουρά. Πόσο μεγάλη μπορεί να γίνει η ουρά; Ποία η πιθανότητα κάποτε να πάψει να υπάρχει η ουρά; Σε κάθε ένα από τα παραπάνω συστήματα υπάρχει ένας προγεννήτορας (ή μηδενική γενιά) «οργανισμός» ο οποίος υποθέτουμε ότι στο τέλος της «ζωής» του ή του - 37 -
βιολογικού του κύκλου, παράγει έναν τυχαίο αριθμό ξ απογόνων σύμφωνα με μια κατανομή της μορφής: + P{ ξm } a m, m,,2,..., a m () Υποθέτουμε ότι όλοι οι απόγονοι δρουν ανεξάρτητα ο ένας από τον άλλον (Υ) και γεννούν απογόνους πάντα σύμφωνα με την παραπάνω κατανομή (Υ2). Η διαδικασία αυτή συνεχίζεται, θεωρητικά έπ άπειρον, κατά τον ίδιο τρόπο. Εάν με { X } + X m συμβολίσουμε το μέγεθος του πληθυσμού της οστής γενιάς, τότε η σ.α. καλείται κλαδωτή αλυσίδα. Ένα από τα ενδιαφέροντα ερωτήματα που μας απασχολούν σε ένα τέτοιο μοντέλο είναι η πιθανότητα να εξαφανιστεί ο πληθυσμός κάποτε (πιθανότητα εξάλειψης), δηλαδή η πιθανότητα: P X, για κάποιο 2. ΠΙΘΑΝΟΤΗΤΑ ΕΞΑΛΕΙΨΗΣ Έστω λοιπόν { X } + μία κλαδωτή αλυσίδα, στην οποία υποθέτουμε ότι ο αρχικός πληθυσμός αποτελείται από έναν μόνο οργανισμό, δηλ. X. Το μέγεθος του πληθυσμού X X X + της +-γενιάς είναι ίσο με: X+ ξ απογόνων που γεννά ο οργανισμός της οστής γενιάς. Οι + Υ2, είναι ανεξάρτητες τ.μ. με κοινή κατανομή την (). όπου ο αριθμός των ξ ξ, λόγω των Υ και Η πιθανογεννήτρια συνάρτηση (π.σ.) της τ.μ. ξ,,2,... ορίζεται από την σχέση: ενώ της τ.μ. + + φ(s) a s P ξ s X,,,2,... από την σχέση: φ (s) + P X s Αποδεικνύεται ότι φ (s)s,φ (s)φ(s) και επαγωγικά φ +(s) φ - (φ +(s)),,,... ' από όπου, για -, έχουμε : φ +(s) φ(φ (s)). Ακόμα εάν Eξ φ () m, τότε το αναμενόμενο μέγεθος του πληθυσμού της οστής γενιάς είναι ίσο με EX m. 2. Παρατήρηση Εξάλειψη δεν συμβαίνει ποτέ στην περίπτωση που ppξ. Η εξάλειψη είναι βέβαιη όταν p. Έτσι υποθέτουμε πάντα ότι: < p <. Ακόμα εάν X για κάποιο, τότε X,. 2.2 Πρόταση (Θεμελιώδες Θεώρημα των Κλαδωτών αλυσίδων) - 38 -
Η πιθανότητα π της τελικής εξάλειψης του πληθυσμού σε μία κλαδωτή αλυσίδα + X με X, είναι ίση με την μικρότερη θετική ρίζα της εξίσωσης sφ(s). Ακόμα, εάν m τότε π, ενώ εάν m> τότε π<. Απόδειξη (με την βοήθεια πιθανογεννητριών) Η πιθανότητα εξάλειψης του πληθυσμού στην οστή γενιά είναι ίση με: q PX φ () q φ ()φ(φ ())φ(q ) + + Αλλά η φ(s) είναι αυστηρά αύξουσα συνάρτηση (σαν δυναμοσειρά με μηαρνητικούς συντελεστές και < p <) και: qφ ()φ()q > q 2φ(q )> φ()q και εάν υποθέσουμε ότι: q >q-, (2) τότε: q φ(q ) > φ(q )q δηλαδή η + - (2) + q φραγμένη από το. Άρα το όριο της (πιθανότητα εξάλειψης): π limp X limq limφ () + + + είναι αυστηρά αύξουσα και υπάρχει και <π. Ακόμα, επειδή η φ(s) είναι συνεχής, η (2) έπεται ότι: πφ(π) Στην πραγματικότητα το π είναι η μικρότερη ρίζα της εξίσωσης: s φ(s) (4) Γιατί, έστω μια οποιαδήποτε θετική ρίζα της (4), τότε: qφ() < φ(s ) s και εάν s q < s, τότε: q +φ(q ) < φ(s ) s,, οπότε π lim q s. Έστω τώρα ότι p +p <. Η + φ(s) + (3) είναι μία κυρτή συνάρτηση ως προς s (γιατί η '' -2 φ (s) (-)p s > ), οπότε το γράφημα της μπορεί να τέμνει την διχοτόμο της 2 ης γωνίας των αξόνων, δηλαδή την ys, σε δύο το πολύ σημεία (δείτε τα σχήματα και 2). Επειδή φ (), το ένα σημείο τομής είναι σίγουρα το (,). σχήμα σχήμα 2-39 -
' α) Εάν mφ () >, τότε η κλίση της εφαπτομένης στο γράφημα της φ(s) στο σημείο s ξεπερνά το (σχήμα ). Εδώ < π <. ' β) Εάν mφ (), τότε η αντίστοιχη κλίση είναι μικρότερη ή ίση του (σχήμα 2). Εδώ π. 2.3 Παρατήρηση Για την πιθανότητα εξάλειψης λοιπόν ενός πληθυσμού, πρέπει να υπολογίσουμε την μικρότερη από τις ρίζες της εξίσωσης sφ(s). Η δυσκολία υπολογισμού του π δεν βρίσκεται τόσο στην επίλυση της παραπάνω εξίσωσης, όσο στον προσδιορισμό της π.σ. φ(s), της κατανομής αναπαραγωγής των απογόνων. Στην προσπάθεια μας να υπερνικήσουμε την δυσκολία εύρεσης της φ(s), θα επιχειρήσουμε την εξής διαφορετική προσέγγιση: θα δείξουμε ότι η ακολουθία { X } + συγκλίνει σε μία τ.μ. Χ (οριακή κατανομή) και θα μελετήσουμε την Χ. Η απόδειξη θα γίνει με την βοήθεια της θεωρίας των martigales. Απόδειξη του θεωρήματος (με την βοήθεια των martigales) Η στοχαστική ανέλιξη Ζ Χ /m είναι ένα martigale ως προς την ακολουθία των σ-αλγεβρών G σ Χ,Χ,,Χ. Πράγματι: Ε Ζ G ( ) + + + α) m < Χ Ε ξ,ξ,...,ξ m + Ε ξ +ξ 2 + +ξ Χ m Χ Χ Ε + [ ξ] m ανεξάρτητες Χ m + m Έχουμε: [ ] [ ] Αλλά: Ε Χ + X Eξ +ξ 2 +...+ξ E ξ m EΧ +E + X Ε Χ E Ε Χ+ X I[ X ] [ ] E ξ +ξ +...+ξ P X 2 [ ] [ ] E ξ P X E ξ EΧ m EΧ Ζ και χρησιμοποιώντας αναδρομικά τον τύπο, έχουμε EΧ m. > Για κάθε ε από την ανισότητα Marov, έχουμε m EX m ε ε P X > ε - 4 -
απ όπου προκύπτει lim P{ X > }, οπότε Τότε { } β) m > lim P X. P limx, δηλαδή ο πληθυσμός εξαφανίζεται, με πιθανότητα. Ισχυριζόμαστε ότι: P X τελικά ξ &PX -ξ (5) όπου ξ είναι το μοναδικό σταθερό σημείο στο [,), της π.σ. της ξφ(ξ) ). i) Εάν ξ (,), εύκολα αποδεικνύεται ότι η ακολουθία Χ είναι ένα (μηαρνητικό) martigale. Αλλά τότε, έπεται ότι: X σ.β X ξ ξ (δηλαδή για κάποια τ.μ. X. Για να δείξουμε την (5), αρκεί να δείξουμε ότι: { } Αν Ρ { } Ρ { } Ρ X m, m. m τ.ω. X m > N τ.ω. X m/ N > Θέτουμε: pp{ X+ m X m}. m Αλλά τότε: [ ] ανεξ P X+ X m P ξ p >, οπότε p<. Ακόμα είναι φανερό ότι μια κλαδωτή αλυσίδα είναι μια αλυσίδα Marov. Οπότε: { X m/ N} { XN m} { XN+ m XN m} Ρ { XN+2 m XN m,x N+ m }... Ρ Ρ Ρ που είναι άτοπο. Άρα X ή. Το ξ (,) οπότε έπεται ότι η Χ Marov p< limp Ρ { XN m } ξ Χ m είναι ομοιόμορφα φραγμένη, άρα: Χ Εξ Ε ξ (6) Χ Αλλά: Χ Ε ξ Εξ ξ (7) Οπότε από τις (6) και (7) έπεται ότι Χ ξ ξ ξ P limξ P P Ε Χ + Χ Χ και έτσι P Χ ξ - 4 -
ii) Εάν γ) m }, κάθε άτομο γεννά ξ, επειδή ξ φ(ξ) ξ p() p()p{ ξ έναν τουλάχιστον απόγονο, δηλαδή: X X... X +... οπότε για κάποιο Χ. Η πιθανότητα: P Χ< P X τελικά πεπερασμένη P X m, μεγάλα Άρα { } m P limx, δηλαδή ο πληθυσμός απειρίζεται. Ισχυριζόμαστε ότι η πιθανότητα εξάλειψης του πληθυσμού είναι. Η ακολουθία { X } + είναι ένα (μη-αρνητικό) martigale. Αλλά τότε: X σ.β X για κάποια τ.μ. X. X X Όπως προηγουμένως, X σ.β., άρα X δηλαδή ο πληθυσμός εξαφανίζεται (με πιθανότητα ), γιατί αν: Ρ { } Ρ { } Αλλά, όπως προηγουμένως Ρ { X m/ N} άρα P P{ X τελικά} 2.4 Παρατήρηση m τ.ω. X m > N τ.ω. X m/ N >. σ.β Χ και έτσι Από την παραπάνω απόδειξη το μόνο που μπορεί να συμπεράνει κανείς είναι ότι η + κ.α. συγκλίνει (θεωρητικά) σε μία τ.μ. Χ, της οποίας η μορφή είναι X άγνωστη. Εάν χρησιμοποιήσει την Ζ Χ /m πιθανότητα) σε μια τ.μ. Z. Αποδεικνύεται ότι, τότε η ακολουθία αυτή συγκλίνει (κατά ( ) EΖ E Χ /m EZ και: - 2 2 2 2 m - 2 σ σ (Ζ )σ (Χ /m ) σ m σ m, m> 2 2 2 2 m m -m m -m + m -m δηλαδή, συμπεραίνουμε ότι η Ζ είναι μία μη-τετριμμένη τ.μ., αλλά τίποτε παραπάνω Z Z για την μορφή της. Αν συμβολίσουμε με ψ (s)es, ψ(s)es, τότε: Χ Χ Z m m m m m - - ψ (s)es Es E s φ s φ φ s φ ψ s - 42 -
οπότε η π.σ. ψ(s) της Ζ ικανοποιεί την σχέση: ψ(s)φ ψ s m η οποία δύσκολα λύνεται ως προς ψ (δηλαδή έχουμε ακόμα μεγαλύτερη δυσκολία από πριν, εδώ πρέπει να είναι γνωστή όχι μόνον η φ, αλλά και η ψ). 2.5 Εφαρμογή (γεωμετρική κατανομή) Εάν η π.σ. p φ(s) -qs, τότε p p ψ(s) + -. q q p - + s q 2 3. Παραδείγματα κλαδωτών αλυσίδων α) (αμιγής διαδικασία θανάτου) Εάν X και η π.σ. φ(s)q+ps, p+q, p,q> (κάθε οργανισμός είτε πεθαίνει με πιθανότητα q είτε επιζεί με πιθανότητα p), τότε η π.σ. της είναι φ (s)-p +p s και φ (s)s s (βέβαιη εξάλειψη). X 2 β) Εάν φ(s)αs +βs+γ, α,β,γ> & φ() τότε π γ/α. γ) Εάν σε μία κ.α. οργανισμοί γεννούν απογόνους σύμφωνα με την λεγόμενη - γεωμετρική κατανομή ppξ b c, p p, b,c> & b+c< + m + -b-c - -(b+c) bs τότε η πιθανογεννήτρια φ(s) +bs ( cs ) +. -c -c -sc -b-c Υπάρχουν πάντα δύο λύσεις της εξίσωσης s φ(s), οι: s,s. c(-c) Ακόμα, η πιθανότητα εξάλειψης του πληθυσμού είναι ίση με: -s s m> π lim P X lim φ () lim -m + + + m-s m δ) (Ελληνικός Πληθυσμός) Ο πίνακας, παρουσιάζει την κατανομή { p } του αριθμού των αγοριών ανά Ελληνική οικογένεια για τα έτη 99 και 2 αντίστοιχα (στοιχεία των απογραφών των αντιστοίχων ετών, της Ε.Σ.Υ.Ε.) Πίνακας. Κατανομή αγοριών ανά οικογένεια για τα έτη 99 και 2 Αριθμός Έτος 99 Έτος 2 αγοριών,32,38-43 -
,2824,3224 2,389,2928 3,77,62 4,59,3 5,4,35 Πηγή: Ε.Σ.Υ.Ε. Κατασκευάζουμε ένα ραβδόγραμμα σχετικών συχνοτήτων (πιθανοτήτων) για τα στοιχεία του παραπάνω πίνακα (διάγραμμα ). Διάγραμμα. Κατανομή αγοριών ανά οικογένεια για τα έτη 99 και 2,35,3,25 πιθανότητα,2,5,,5, 2 3 4 5 Αριθμός των αγοριών ανά οικογένεια 99 2 Από το διάγραμμα είναι φανερό ότι, ο (μέσος) αριθμός αγοριών μίας Ελληνικής οικογένειας το έτος 2 είναι μικρότερος από τον (μέσο) αριθμό αγοριών το έτος 99. Υποθέτουμε ότι οι αρσενικοί οργανισμοί (αγόρια) αποκτούν απογόνους, οι οποίοι ανεξάρτητα ο ένας από τον άλλον έχουν πιθανότητα ½ να είναι αρσενικοί (αγόρια) και ½ να είναι θηλυκοί (κορίτσια). Υποθέτουμε ακόμα ότι οι «τάσεις» που εμφανίζει ο πίνακας (για κάθε μία από τις απογραφές που εμφανίζονται στον πίνακα) συνεχίζουν να ισχύουν (ξεχωριστά). Ο αριθμός των αρσενικών οστής (αγοριών) της γενιάς είναι μια κλαδωτή αλυσίδα. Η πιθανογεννήτρια συνάρτηση της κατανομής αναπαραγωγής του αριθμού των αγοριών, για το φ α 5 4 3 2 έτος 99, είναι: φ (s),4s +,59s +,77s +,389s +,2824s +,32 ενώ, η αντίστοιχη π.σ. α φ β, για το έτος 2, είναι: 5 4 3 2 φ β (s),35s +,3s +,62s +,2928s +,3234s +,38 Η πιθανότητα εξάλειψης s α των αγοριών, για τα δεδομένα του έτους 99, είναι η μικρότερη λύση της εξίσωσης: φ α (s)s - 44 -
5 4 3 2,4s +,59s +,77s +,389s +,2824s +,32s sα,698 ενώ, η πιθανότητα εξάλειψης των αγοριών, για τα δεδομένα του έτους 2, θα είναι η μικρότερη λύση της εξίσωσης: s β φ β (s)s οπότε: 5 4 3 2,35s +,3s +,62s +,2928s +,3234s +,38s sβ,753 δηλαδή s < s γεγονός που αναμενόταν (λιγότερα αγόρια ανά οικογένεια α β σημαίνει μεγαλύτερη πιθανότητα εξάλειψης). ε) (Εξάλειψη επωνύμων) Ο Lota με βάση τα στοιχεία απογραφής για τους απογόνους των λευκών οικογενειών του 92 στις Η.Π.Α., υπολόγισε ότι η κατανομή { p } των αγοριών κατά οικογένεια προσεγγίζεται από την: p,48, κ-,48-,4s p(,2)(,59), οπότε φ s και λύνοντας την εξίσωση -,56s κ φ( s ) s, s<, έχουμε ( ) s,86 (η πιθανότητα εξάλειψης είναι αρκετά μεγάλη). ( ) Εάν υπάρχουν άντρες με το ίδιο επώνυμο, τότε s,86. ABSTRACT Let s suppose that we have a populatio that evolves with respect to time (e.g. customers arrivig at a service poit). I this populatio, there exists a iitial orgaism which at the ed of its biological cycle produces a radom umber of descedats, accordig to a probability distributio. The process cotiuous th idefiitely i the same maer. The size of the geeratio ca be studied by usig stochastic processes, which are called brachig chais. What is of iterest is the probability of extictio of the populatio. I this paper, we prove the fudametal theorem of brachig chais, i regards to the probability of extictio, first i the classical way by usig probability geeratig fuctios ad the by usig martigales. We study specific examples of b.c. ad apply the theory to examples o the Gree populatio by usig data compiled by the Gree Natioal Statistics Bureau. ΑΝΑΦΟΡΕΣ Δάρας Τ., Παλιεράκη Α. (25) Κλαδωτές αλυσίδες και εφαρμογές τους. Πρακτικά 22 ου Συνεδρίου Ε.Μ.Ε., Λαμία. Κάκουλλος. Θ. (995). Στοχαστικές Ανελίξεις. Εκδόσεις Συμμετρία. Καλπαζίδου, Σ. (99). Στοιχεία Θεωρίας Στοχαστικών Ανελίξεων. Εκδόσεις ΖΗΤΗ. Θεσσαλονίκη. Χρυσαφίνου, Ο. (24). Εισαγωγή στις Στοχαστικές Ανελίξεις. Εκδόσεις ΣΟΦΙA. Feller, W. (968). A itroductio to Probability Theory ad its Applicatios. Wiley Easter, 3 rd ed. Grimmett, G. & Stirzaer, D. (992). Probability ad Radom Processes. Oxford Sciece Publicatios, 2 d. Ed. - 45 -
Karli, S. & Taylor, H. (975). A first course i Stochastic Processes. 2 d editio, Academic Press. Karli, S. & Taylor, H. (984). A itroductio to Stochastic Modelig. Academic Press. Resic, S. (992). Advetures of Stochastic Processes. Birhauser. - 46 -