Η Κατανομή Poisso Ας δούμε ένα πρόβημα: Σε μια κτηνοτροφική περιοχή υπάρχουν 3 αιγοπρόβατα. Κάθε χρόνο όα τα αιγοπρόβατα εμβοιάζονται για προστασία από κάποια ασθένεια. Σύμφωνα με την άδεια χρήσης του εμβοίου, υπάρχει πού μικρή πιθανότητα, ίση με, το εμβόιο να προκαέσει μια πού σοβαρή παρενέργεια που οδηγεί στο θάνατο του ζώου που εμβοιάζεται. Μας ενδιαφέρει να βρούμε την πιθανότητα, στη συγκεκριμένη περιοχή, να πεθάνουν σε ένα έτος ζώα από την παρενέργεια που προκαεί ο εμβοιασμός. Είναι προφανές ότι ο αριθμός Χ των ζώων που πεθαίνουν από τον εμβοιασμό στη συγκεκριμένη περιοχή σε ένα έτος είναι διωνυμική τυχαία μεταβητή με ~ B(3, ). Ενδιαφερόμαστε για τις πιθανότητες P ( ), όπου,,...,3. Έτσι, για την πιθανότητα σε ένα έτος να μην υπάρξουν θάνατοι ζώων από τον εμβοιασμό έχουμε, 3 3 3 P ( ) ( ) ( ) (.99998).478 και για την πιθανότητα σε ένα έτος να υπάρξουν ακριβώς θάνατοι από τον εμβοιασμό έχουμε, 3 5 P( ) ( ) ( ) 3 (.) (.99998) 99999 99998 3! (.)! 99998! (.99998) 99998 99998.445. Ήδη από αυτά τα δύο αριθμητικά παραδείγματα φαίνεται ότι για τιμές των παραμέτρων της διωνυμικής κατανομής όπως αυτές του προβήματός μας (κυρίως για πού μεγάο ), ο τύπος της συνάρτησης πιθανότητάς της δεν είναι πού πρακτικός για τον υποογισμό πιθανοτήτων (ιδιαίτερα χωρίς υποογιστική μηχανή). Μάιστα, για τιμές που δεν είναι κοντά στο ή το το πρόβημα γίνεται μεγάο. Η πιθανότητα, για παράδειγμα, σε ένα έτος να υπάρξουν ακριβώς 5 θάνατοι από τον εμβοιασμό είναι 3 5 5 99985 3! 5 P( 5) ( ) ( ) (.) (.99998) 5 5! 99985! 9998 99987... 3 5 99985 (.) (.99998)....89 3... 5 99985 Οι δυσκοίες αυτές, αναγνωρίσθηκαν από πού νωρίς. Ο Γάος μαθηματικός Simeo Deis Poisso (78-84) αναζήτησε τρόπο αντιμετώπισης του προβήματος και το 837, σε βιβίο του με εφαρμογές της θεωρίας πιθανοτήτων σε θέματα δικαστικών υποθέσεων, δημοσίευσε το παρακάτω εντυπωσιακό για την εποχή του οριακό θεώρημα. Έστω ότι η τυχαία μεταβητή Χ ακοουθεί τη διωνυμική κατανομή B (, με συνάρτηση πιθανότητας P( ) p (,,,,...,. Αν, για, το p έτσι ώστε η μέση τιμή της Χ να συγκίνει προς μια θετική σταθερά, δηαδή, να ισχύει p, τότε lim p ( e,,,,...! Με την υπόθεση ότι κάθε ζώο έχει την ίδια πιθανότητα να πεθάνει από τον εμβοιασμό σε ένα έτος. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουος (www.aua.gr/gpapadopoulos) 75
Πού αργότερα διαπιστώθηκε ότι η συνάρτηση e,,,,..., που εισάγεται! με το οριακό θεώρημα του Poisso, έχει όες τις ιδιότητες μιας συνάρτησης πιθανότητας. Έτσι ορίσθηκε η κατανομή Poisso. Ορισμός Έστω Χ μια διακριτή τυχαία μεταβητή με συνάρτηση πιθανότητας f ( ) P( ) e,,,,...! όπου >. Η κατανομή της τυχαίας μεταβητής Χ ονομάζεται κατανομή Poisso με παράμετρο και συμβοίζεται με P (). Δηαδή, η κατανομή Poisso ορίσθηκε ως οριακή κατανομή της διωνυμικής, έτσι: H Διωνυμική κατανομή προσεγγίζεται από την κατανομή Poisso aν για μεγάο (θεωρητικά ), η πιθανότητα επιτυχίας p συγκίνει στο ( p ) έτσι ώστε η μέση τιμή της κατανομής να συγκίνει σε μια θετική σταθερά ( p ). Πρακτικά, όμως, πόσο μεγάο πρέπει να είναι το και πόσο μικρό το p για να είναι ικανοποιητική η προσέγγιση; Έχει παρατηρηθεί ότι αν και p ώστε η μέση τιμή p να παίρνει μέτριες τιμές (στην πράξη, μικρότερες του ), η ακρίβεια της προσέγγισης είναι ικανοποιητική. Στα σχήματα που ακοουθούν φαίνεται γραφικά η σύγκιση της διωνυμικής κατανομής B (, στην κατανομή Poisso με p 3 όταν,3,, 3 και p.3,.,.3,. αντίστοιχα. Παρατηρείστε ότι για 3 και p. η προσέγγιση είναι τέεια. Το 889, από τον Ρωσο-Γερμανό μαθηματικό L.V. Borriewicz. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουος (www.aua.gr/gpapadopoulos) 7
Ως παράδειγμα εφαρμογής των παραπάνω ας δούμε πάι το εισαγωγικό πρόβημα. Επειδή 3 και p.. 3 μπορούμε να 3 υποογίσουμε πού πιο εύκοα τις ζητούμενες πιθανότητες αν χρησιμοποιήσουμε την προσέγγιση της διωνυμικής κατανομής B (3,.) από την κατανομή Poisso με παράμετρο p 3.. Έτσι έχουμε: Άρα: P ( P ( ) e ) e P ( 5) e P(.4788!.447! 5.893 5! ) e Αποδεικνύεται ότι, αν ~ P( ) τότε,,!,,,... μ E ( ) και σ V ( ). Στην πράξη, η παράμετρος, συνήθως δεν υποογίζεται από τα και p αά εκτιμάται εμπειρικά (από στατιστικά στοιχεία). Ερώτηση: Είναι άραγε αναμενόμενο (ογικό) η μέση τιμή της κατανομής Poisso να είναι ίση με τη διασπορά της 3 ; Η κατανομή Poisso ως οριακή κατανομή της διωνυμικής κατανομής έχει, όπως και η διωνυμική, μεγάο εύρος εφαρμογών σε διάφορες επιστημονικές περιοχές. Πιο συγκεκριμένα, χρησιμοποιείται για τη μοντεοποίηση «διωνυμικών καταστάσεων» όπου ενδιαφέρει ο αριθμός εμφανίσεων σπάνιων ενδεχομένων σε μεγάους πηθυσμούς (δη. όταν σε κάθε επανάηψη, η πιθανότητα επιτυχίας p είναι πού μικρή και ο αριθμός επαναήψεων πού μεγάος). Γι αυτό το όγο, στη βιβιογραφία αναφέρεται και ως κατανομή των σπάνιων ενδεχομένων (disribuio of rare eves 4 ). Ας δούμε μερικά χαρακτηριστικά παραδείγματα τυχαίων μεταβητών που ακοουθούν την κατανομή Poisso.. Ο αριθμός Χ των τροχαίων ατυχημάτων σε ένα τμήμα (με μεγάη κυκοφορία) του οδικού δικτύου μιας χώρας στη διάρκεια ενός Σαββατοκύριακου (ή μιας ημέρας, ή μιας εβδομάδας, ή ενός μήνα κτ.). Με την υπόθεση ότι κάθε αυτοκίνητο που περνάει από το συγκεκριμένο σημείο έχει την ίδια πιθανότητα p να εμπακεί σε τροχαίο ατύχημα, η Χ ακοουθεί την B (,. Επειδή ο αριθμός των αυτοκινήτων που διέρχονται από το συγκεκριμένο σημείο τη συγκεκριμένη χρονική περίοδο είναι μεγάος και η πιθανότητα ατυχήματος (επιτυχίας!) p είναι πού μικρή 5, η κατανομή της Χ προσεγγίζεται ικανοποιητικά από την κατανομή Poisso με p. Η παράμετρος εκφράζει τον μέσο αριθμό ατυχημάτων στο 3 Είναι. Θυμηθείτε τη μέση τιμή και τη διασπορά της διωνυμικής και παρατηρείστε ότι όταν συγκίνει στην Poisso το -p είναι περίπου. 4 Αναφέρεται επίσης ως νόμος των μικρών αριθμών. 5 Φοβάμαι ότι θιβερή εξαίρεση αποτεεί η Εάδα (με τους οδηγούς της και τους δρόμους της!!). Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουος (www.aua.gr/gpapadopoulos) 77
συγκεκριμένο σημείο τη συγκεκριμένη χρονική περίοδο και όπως αναφέραμε, στην πράξη, συνήθως εκτιμάται εμπειρικά (από στατιστικά στοιχεία).. Ο αριθμός Χ των τυπογραφικών αθών σε μια δακτυογραφημένη σείδα (ή σε ένα σύνοο σείδων). Όπως και στο προηγούμενο παράδειγμα πρόκειται για διωνυμική κατανομή B (,. Επειδή το είναι μεγάο (ποά γράμματα στο κείμενο) και η πιθανότητα τυπογραφικού άθους (επιτυχίας!) p είναι μικρή η κατανομή του αριθμού των τυπογραφικών αθών/σείδα προσεγγίζεται ικανοποιητικά από την κατανομή Poisso με p. Η παράμετρος εκφράζει τον μέσο αριθμό τυπογραφικών αθών/σείδα και όπως αναφέραμε και στο προηγούμενο παράδειγμα, στην πράξη, συνήθως εκτιμάται εμπειρικά (από στατιστικά στοιχεία). 3. Ο αριθμός Χ των κήσεων στο help desk ενός μεγάου Iere provider σε μια ημέρα (ή σε μια ώρα, ή σε μια εβδομάδα κτ.). 4. Ο αριθμός Χ των βαβών μιας μηχανής σε μια ημέρα (ή σε μια εβδομάδα κτ.). 5. Ο αριθμός Χ των ατόμων ενός πηθυσμού που ζουν περισσότερα από χρόνια.. Ο αριθμός Χ των παιδιών ενός πηθυσμού που θα γίνουν ψηότερα από.95μέτρα. 7. Ο αριθμός Χ των βακτηριδίων σε cm μιας πάκας Peri. 8. Ο αριθμός Χ των πεατών ενός super marke σε μια ημέρα, που θα αγοράσουν σοκοατάκια για σκύους. 9. Ο αριθμός Χ των εαττωματικών προϊόντων που παράγονται από μια συγκεκριμένη γραμμή παραγωγής σε ένα ορισμένο χρονικό διάστημα.. Ο αριθμός Χ των ανθασμένων τηεφωνικών κήσεων (άος αριθμός πηκτροογείται και άος καείται) σε μια ημέρα. Επίσης, ο αριθμός Χ των τηεφωνικών κήσεων που φθάνουν σε ένα τηεφωνικό κέντρο σε μια συγκεκριμένη χρονική περίοδο.. Ο αριθμός Χ των φυσαίδων σε υαοπίνακα συγκεκριμένης επιφάνειας.. Ο αριθμός Χ των θανάτων σε μια πόη από μια σπάνια ασθένεια σε ένα μήνα. 3. Ο αριθμός Χ των πεατών που φθάνουν σε ένα κέντρο εξυπηρέτησης (τράπεζα, ταχυδρομικό γραφείο, κατάστημα κτ.) σε μια ημέρα (ή σε μια ώρα, ή σε μια εβδομάδα, κτ.). 4. Ο αριθμός Χ των επιβατών μιας αεροπορικής πτήσης που ενώ έχουν κάνει κράτηση θέσης δεν εμφανίζονται την ώρα αναχώρησης. 5. Ο αριθμός Χ των α-σωματίων που εκπέμπονται από ραδιενεργό υικό σε συγκεκριμένο χρονικό διάστημα.. Ο αριθμός Χ των σεισμών μεγέθους περισσότερο των 5 βαθμών της κίμακας Richer που πήττουν μια σεισμογόνο περιοχή σε ένα έτος. 7. Ο αριθμός Χ των εαττωματικών σημείων που υπάρχουν σε συγκεκριμένο μήκος καωδίου. 8. Ο αριθμός Χ των βακτηριδίων σε διάυμα συγκεκριμένου όγκου. 9. Ο αριθμός Χ των αστεριών σε μια γααξιακή περιοχή συγκεκριμένου όγκου.. Ο αριθμός Χ των προβημάτων (ρωγμές και ακκούβες) στο οδόστρωμα ενός εθνικού δρόμου ανά Km.. Ως τεευταίο παράδειγμα αναφέρουμε εφαρμογές στη χωροδιάταξη (spaial paer) φυτών, ζώων κτ που είναι τυχαία διασκορπισμένα σε μια μεγάη έκταση ώστε κάθε δειγματοηπτική μονάδα (τετράγωνο «μικρού» εμβαδού) να έχει πού μικρή πιθανότητα να «φιοξενήσει» ένα φυτό ή ζώο. Όπως φαίνεται από τα παραπάνω παραδείγματα, η κατανομή Poisso βρίσκει εφαρμογή και σε περιπτώσεις όπου σε ένα τυχαίο πείραμα μας ενδιαφέρει πόσες φορές εμφανίζεται ένα ενδεχόμενο σε χρονικό διάστημα ή σε μήκος ή σε Εκτός αν η δακτυογράφος έχει πρόβημα. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουος (www.aua.gr/gpapadopoulos) 78
επιφάνεια ή σε όγκο. Αυτό συμβαίνει διότι, όταν ικανοποιούνται τρεις συνθήκες 7, τότε και οι περιπτώσεις αυτές είναι «διωνυμικές καταστάσεις» με πού μεγάο και p πού μικρό. Οι συνθήκες αυτές για την περίπτωση χρονικού διαστήματος είναι οι εξής 8 : Σ. Η πιθανότητα να εμφανισθεί το ενδεχόμενο σε ένα μικρό χρονικό διάστημα μια φορά είναι ανάογη του μήκους του. Σ. Η πιθανότητα να εμφανισθεί το ενδεχόμενο δύο ή περισσότερες φορές σε ένα μικρό χρονικό διάστημα είναι αμεητέα. Σ3. Οι εμφανίσεις του ενδεχομένου σε δύο ξένα χρονικά διαστήματα είναι ανεξάρτητα ενδεχόμενα. Υποθέτουμε επίσης ότι οι συνθήκες του πειράματος παραμένουν αμετάβητες (στο χρόνο, το χώρο, κτ.). Η εξήγηση, διαισθητικά, γιατί υπό τις συνθήκες Σ, Σ και Σ3, οι περιπτώσεις αυτές είναι «διωνυμικές καταστάσεις» με πού μεγάο και p πού μικρό είναι σχετικά απή 9. Με βάση τα προηγούμενα, είναι φανερό ότι για κάθε έχουμε μια τυχαία μεταβητή που εκφράζει πόσες φορές εμφανίσθηκε το ενδεχόμενο σε διάστημα. Πρόκειται δηαδή για μια οικογένεια τυχαίων μεταβητών {, } η οποία ονομάζεται στοχαστική διαδικασία (ανέιξη) Poisso. Για τη συνάρτηση πιθανότητας της, όπως αναφέραμε προηγουμένως, αποδεικνύεται ότι: Αν ένα ενδεχόμενο εμφανίζεται σε χρονικό διάστημα (ή σε μήκος ή σε επιφάνεια ή σε όγκο ) έτσι ώστε να ικανοποιούνται οι συνθήκες Σ, Σ και Σ3, τότε υπάρχει ένας θετικός αριθμός τέτοιος ώστε η κατανομή του αριθμού των εμφανίσεων του ενδεχομένου σε χρονικό διάστημα (ή σε μήκος ή σε επιφάνεια ή σε όγκο ), να δίνεται από τον τύπο ( ) P( ) e,,,,...! Δηαδή, η ακοουθεί την κατανομή Poiso με μέση τιμή. Το εκφράζει τον μέσο αριθμό εμφανίσεων του ενδεχομένου στη μονάδα του χρόνου (ή μήκους ή επιφάνειας ή όγκου) ή αιώς τον ρυθμό εμφάνισης του ενδεχομένου. Στην πράξη, το εκτιμάται εμπειρικά (από στατιστικά στοιχεία). Ας δούμε ένα παράδειγμα. Στο help desk ενός μεγάου Iere provider φθάνουν αιτήματα πεατών με ρυθμό 3 αιτήματα ανά επτό. Ποια είναι η πιθανότητα α) σε ένα επτό να φθάσουν το πού αιτήματα β) σε μισό επτό να φθάσουν το πού αιτήματα γ) σε επτά να φθάσουν το πού 4 αιτήματα και δ) σε 3 διαφορετικά χρονικά διαστήματα του ενός επτού να βρεθούν τουάχιστον δύο τέτοια διαστήματα σε καθένα από τα οποία να έχουν φθάσει το πού αιτήματα. Απάντηση 7 που είναι αρκετά απές και φυσιοογικές-ογικές 8 Ανάογα διατυπώνονται για μήκος, επιφάνεια ή όγκο. 9 Αν χωρίσουμε το διάστημα [, ) σε υποδιαστήματα ίδιου πάτους (όπου πού μεγάο ώστε ), η συνθήκη Σ εξασφαίζει ότι πρόκειται για δοκιμές Beroulli και οι Σ, Σ3 ότι είναι ανεξάρτητες με σταθερή πιθανότητα επιτυχίας, όπου ο αναμενόμενος αριθμός εμφανίσεων στη μονάδα χρόνου, χώρου, κτ. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουος (www.aua.gr/gpapadopoulos) 79
Ο αριθμός των αιτημάτων που φθάνουν στο help desk σε διάστημα επτών ακοουθεί κατανομή Poisso με 3 (3) P( ) e,,,,...! Επομένως έχουμε: 3 3 α) P ( ) P( ) + P( ) + P( ) e. 43!.5.5 β) P ( / ) P( / ) + P( / ) + P( / ) e. 888! 4 γ) P ( 4) e. 85! δ) Τα τρία χρονικά διαστήματα του ενός επτού μπορούν να θεωρηθούν ως τρεις ανεξάρτητες δοκιμές Beroulli στις οποίες επιτυχία σημαίνει: σε ένα επτό φθάνουν το πού δύο αιτήματα. Έτσι αν συμβοίσουμε με Υ τον αριθμό των επιτυχιών στις 3 δοκιμές είναι προφανές ότι Y ~ B(3,.43) δηαδή 3 y 3 y P( Y y) (.43) (.578), y,,,3 y και επομένως η ζητούμενη πιθανότητα είναι: 3 3 3 P ( Y ) (.43) (.578) + (.43) (.578).3857. 3 Παρατηρήσεις. Όπως και στη διωνυμική κατανομή, εύκοα αποδεικνύεται ο παρακάτω αναδρομικός τύπος υποογισμού των πιθανοτήτων P ( ),,,... μιας Poisso τυχαίας μεταβητής Χ. Για τις πιθανότητες P ( ),,,..., της τυχαίας μεταβητής ~ P( ) ισχύει, P( ) P( ) με αρχική συνθήκη,: P ( ) e.. Όπως και στη διωνυμική κατανομή, εύκοα αποδεικνύεται ότι η πιο πιθανή τιμή της ~ P( ) είναι η [ ] όταν ο θετικός αριθμός δεν είναι ακέραιος, ενώ όταν είναι ακέραιος οι τιμές της Χ με τη μεγαύτερη πιθανότητα είναι δύο: η και η. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουος (www.aua.gr/gpapadopoulos) 8