Μάθημα 3 ο a Τυχαία Μεταβλητή-Έννοιες και Ορισμοί Στο μάθημα αυτό θα ορίσουμε την έννοια της τυχαίας μεταβλητής και θα αναφερθούμε σε σχετικές βασικές έννοιες και συμβολισμούς. Ross, σσ 135-151 Μπερτσεκάς-Τσιτσικλής, Κεφ, σσ 8-104 http://compus.uom.gr/inf67/index.php 1
Τυχαία Μεταβλητή Εισαγωγικά Συχνά, τα αποτελέσματα πειραμάτων τύχης συνδέονται με αριθμητικές τιμές που μας ενδιαφέρουν περισσότερο από τα ίδια τα αποτελέσματά τους. Αυτό μας οδηγεί στη διατύπωση της έννοιας της τυχαίας μεταβλητής. http://compus.uom.gr/inf67/index.php
Εισαγωγικά Παράδειγμα 1 : Ρίχνουμε ένα ιδανικό νόμισμα. Κερδίζουμε ένα ευρώ, +1, όταν φέρνουμε κορώνα. Χάνουμε ένα ευρώ, 1, όταν φέρνουμε γράμματα. Η (συνηθισμένη αιτιοκρατική) μεταβλητή Χ παριστάνει την απόδοση του παιχνιδιού ως Χ=απόδοση: +1 1 Η προηγούμενη μεταβλητή Χ δεν αρκεί να περιγράψει επαρκώς το παιχνίδι. Ο επόμενος πίνακας συνοψίζει πληρέστερα το παιχνίδι, και είναι παράδειγμα τυχαίας μεταβλητής. Χ=απόδοση: +1 1 αντίστοιχη πιθανότητα: 1 1 http://compus.uom.gr/inf67/index.php 3
Εισαγωγικά Παράδειγμα : Ρίχνουμε ένα μεροληπτικό νόμισμα τρείς φορές. Η πιθανότητα να φέρουμε κορώνα είναι 3. Χ είναι η μεταβλητή που μετρά τον αριθμό των επιτυχιών σε τρείς ανεξάρτητες προσπάθειες. Υπολογίστε την πιθανότητα για όλα τα δυνατά αποτελέσματα. Ο επόμενος Πίνακας 1 συνοψίζει τα αποτελέσματα και η Εικόνα 1 δίνει το δενδροδιάγραμμα του δειγματικού χώρου και τις αντίστοιχες πιθανότητες. http://compus.uom.gr/inf67/index.php 4
Εισαγωγικά Πίνακας 1: Η κατανομή των επιτυχιών σε τρείς ανεξάρτητες προσπάθειες Χ 0 1 3 σύνολο p x 17 67 1 7 87 7 7 1 Κ ΑΠΟΤΕΛΕΣΜΑ ΚΚΚ ΠΙΘΑΝΟΤΗΤΑ 8/7 Κ Γ ΚΚΓ 4/7 Κ Γ Κ Γ ΚΓΚ 4/7 ΚΓΓ /7 Γ Κ Κ Γ ΓΚΚ 4/7 Γ Κ ΓΚΓ ΓΓΚ /7 /7 Γ Εικόνα 1: Δενδροδιάγραμμα της τυχαίας μεταβλητής X που μετρά τον αριθμό των επιτυχιών σε τρείς ανεξάρτητες προσπάθειες ΓΓΓ 1/7 http://compus.uom.gr/inf67/index.php 5
Εισαγωγικά Παράδειγμα 3 : Στο προηγούμενο παιχνίδι κερδίζουμε 10 όταν φέρουμε 3 κορώνες, δεν κερδίζουμε ούτε χάνουμε όταν φέρουμε κορώνες, και χάνουμε 1 για τα υπόλοιπα αποτελέσματα. Η τυχαία μεταβλητή Υ παριστά το παιχνίδι. Υ 1 0 10 p y 77 1 7 87 Μας συμφέρει ένα τέτοιο παιχνίδι; http://compus.uom.gr/inf67/index.php 6
Εισαγωγικά Σύμφωνα με τον συχνοτικό ορισμό, οι πιθανότητες δείχνουν πόσο συχνά συμβαίνει ένα ενδεχόμενο, όταν επαναλάβουμε το πείραμα πάρα πολλές φορές. Σταθμίζουμε τις αποδόσεις με τις πιθανότητες. 4 1 7 7 0 1 7 10 8 7 7 Παρατηρούμε ότι το αποτέλεσμα είναι αρνητικό. Αργότερα αυτό θα το ονομάσουμε μέση τιμή της Υ. Δείχνει την απόδοση που ελπίζουμε να έχουμε μακροπρόθεσμα. http://compus.uom.gr/inf67/index.php 7
Ορισμός Τυχαίας μεταβλητής Ορισμός τμ Ορισμός : Τυχαία μεταβλητή, (random variable), είναι μια συνάρτηση που απεικονίζει τον δειγματικό χώρο στο X: Όταν εκτελέσουμε το πείραμα και παρατηρήσουμε ένα συγκεκριμένο, τότε έχουμε μια συγκεκριμένη τιμή της X, την x X( ). Συνοπτικά γράφουμε X x. http://compus.uom.gr/inf67/index.php 8
Ορισμός τμ Ω ω P(ω) Χ(ω) p 0 1 P(Χ=x) x 0 R P : 0,1, P p X :, X x Διαγραμματική παράσταση μιας τυχαίας μεταβλητής http://compus.uom.gr/inf67/index.php 9
Ορισμός τμ Συνοψίζοντας: Με κεφαλαίο X συμβολίζουμε την τυχαία μεταβλητή. Με το αντίστοιχο πεζό γράμμα συμβολίζουμε μια συγκεκριμένη αριθμητική τιμή της X, την X x. Η μεταβλητή Χ λέγεται τυχαία επειδή το πεδίο ορισμού της είναι ο δειγματικός χώρος ενός πειράματος τύχης. Οι πιθανότητες μετρούν τη μάζα σε κάθε στοιχείο-ενδεχόμενο του δειγματικού χώρου. Κάθε στοιχείο του Ω απεικονίζεται σ ένα και μόνο ένα στοιχείο του. Άρα έχουμε ένα διαμερισμό του. Επομένως, για μια τυχαία μεταβλητή, το άθροισμα των πιθανοτήτων για όλες τις τιμές της είναι 1. http://compus.uom.gr/inf67/index.php 10
Ορισμός τμ Ορισμός-Εμπειρικός για τις Ασκήσεις Στα ενδεχόμενα του πειράματος τύχης αντιστοιχούμε κάποιο πραγματικό αριθμό Χ. Κάθε τιμή εμφανίζεται μόνο μια φορά. Σε κάθε τιμή επισυνάπτουμε τις αντίστοιχες πιθανότητες. Τα συνοψίζουμε σ ένα πίνακα δύο γραμμών, στη πρώτη φαίνονται οι τιμές της Χ και από κάτω οι αντίστοιχες πιθανότητες, βλ παραπάνω Παράδειγμα και 3. Λέμε ότι η Χ είναι τυχαία μεταβλητή. http://compus.uom.gr/inf67/index.php 11
Διακριτές Τυχαίες Μεταβλητές Διακριτές τμ Για λόγους ευκολίας διακρίνουμε τις τυχαίες μεταβλητές σε διακριτές, όταν παίρνουν ένα πεπερασμένο ή αριθμήσιμο αριθμό τιμών, και συνεχείς όταν παίρνουν τιμές στο ή κάποιο διάστημά του. http://compus.uom.gr/inf67/index.php 1
Διακριτές τμ Γενικεύοντας, για μια διακριτή τυχαία μεταβλητή, γράφουμε X x 1 x i x k px x pxx1 pxx i pxxk όπου p X x=px=x είναι η συνάρτηση κατανομής πιθανότητας, σκπ, (probability distribution function), ή συνάρτηση μάζας πιθανότητας, της διακριτής τυχαίας μεταβλητής Χ. Αν x A, το σύνολο των τιμών που απαρτίζουν το ενδεχόμενο A, τότε PA p x xa X http://compus.uom.gr/inf67/index.php 13
Διακριτές τμ Ορισμός : Η Fx=PX x px k, k i1 i x x, λέγεται αθροιστική συνάρτηση κατανομής, ασκ, (cumulative distribution function), ή απλά συνάρτηση κατανομής (distribution function). H Fx είναι μια μη-φθίνουσα συνάρτηση και συνεχής από δεξιά. Αν A ένα διάστημα τιμών, A x/ax b, τότε P A P a x b F b F a http://compus.uom.gr/inf67/index.php 14
Διακριτές τμ Παράδειγμα 4 : (συνέχεια από Παράδειγμα 1): Για την τμ Χ η σκπ και η ασκ Fx=PX x είναι p x 1, 0.5 1, 0.5 0, x 1 Fx=1, 1x1 1, 1 x, σ.κ.π. της τ.μ. Χ α.σ.κ. της τ.μ. Χ κ.π. 0.0 0. 0.4 0.6 0.8 1.0 πιθανότητα 0.0 0. 0.4 0.6 0.8 1.0 - -1 0 1 X -1.0-0.5 0.0 0.5 1.0 X Εικόνα : σκπ και ασκ για τη τμ Χ, βλ Παράδειγμα 1 http://compus.uom.gr/inf67/index.php 15
Διακριτές τμ Αναμενόμενη ή Μέση Τιμή Τυχαίας Μεταβλητής Έχουμε τη διακριτή τυχαία μεταβλητή X, με τιμές x i, i1,,k, και σκπ px x. Ορισμός : Ονομάζουμε αναμενόμενη τιμή, (expected value ή expectation ή mean), της διακριτής τυχαίας μεταβλητής X την k E X x p x i1 i X i Η EX ονομάζεται και μέσος της τυχαίας μεταβλητής X. Συχνά χρησιμοποιούμε τον συμβολισμό EX ή EX. http://compus.uom.gr/inf67/index.php 16
Διακριτές τμ Παράδειγμα 5 : (συνέχεια από Παράδειγμα 1): Να υπολογισθεί η αναμενόμενη τιμή της Χ. Έχουμε Χ 1 1 px 1 1 Άρα 1 1 EX1 1 0 http://compus.uom.gr/inf67/index.php 17
Διακριτές τμ Παράδειγμα 6 : Ένα πρόγραμμα αποτελείται από δύο τμήματα. Η τυχαία μεταβλητή X 1 δίνει τον αριθμό των λαθών στο πρώτο τμήμα, η X στο δεύτερο. Το ένα μέρος είναι ανεξάρτητο από το άλλο. X p x p x 1, 1 0 0.5 0.7 1 0.3 0. 0.1 0.1 3 0.1 0.0 a. Κάντε τις γραφικές παραστάσεις των p 1, p και F, 1 F. b. Υπολογίστε την πιθανότητα του ενδεχομένου η X 1 να έχει 1 ή λάθη. c. Υπολογίστε την πιθανότητα του ενδεχομένου η X 1 να έχει και πάνω λάθη. d. Υπολογίστε τη σκπ και ασκ της τυχαίας μεταβλητής Y X1 X http://compus.uom.gr/inf67/index.php 18
Διακριτές τμ b. P X 1X P X 1 P X 1 1 1 1 0.3 0.1 0.4 c. P X P X P X 3 1 1 1 0.10.1 0. http://compus.uom.gr/inf67/index.php 19
d. Διακριτές τμ Y 0 1 3 4 5 py 0.35 0.31 0.18 0.1 0.03 0.01 1.0 Υπολογισμοί: 1 PX 0PX 0 P Y 0 P X 0 X 0 1 0.50.7 0.35 1 1 PX1 1X 0PX1 1X 0 PX 1PX 0PX 0PX 1 P Y 1 P X 1 X 0 X 0 X 1 κλπ 1 1 0.30.7 0.50. 0.31 http://compus.uom.gr/inf67/index.php 0
Συναρτήσεις τμ Συνάρτηση Τυχαίας Μεταβλητής Στο Παράδειγμα 3 και 6 είδαμε πως γνωρίζοντας μια τυχαία μεταβλητή X, μπορούμε να ορίσουμε άλλες τυχαίες μεταβλητές, μετασχηματίζοντας την X. Εδώ, γενικεύουμε. Έστω X τυχαία μεταβλητή και Y g(x), όπου g( ) μια πραγματική συνάρτηση. Τότε η Y είναι τυχαία μεταβλητή που παίρνει τις αντίστοιχες τιμές της X, όπως ορίζονται από την g( ) και με τις πιθανότητες που αντιστοιχούν στις τιμές της X. Για μια διακριτή τυχαία μεταβλητή, η σκπ py υπολογίζεται εύκολα, τακτοποιώντας τις τιμές της Y (κάθε τιμή εμφανίζεται μία μόνο φορά) και υπολογίζοντας τις αντίστοιχες πιθανότητες. http://compus.uom.gr/inf67/index.php 1
Συναρτήσεις τμ Αναμενόμενη Τιμή Συνάρτησης Τυχαίας Μεταβλητής Έστω η τυχαία μεταβλητή X με σκπ της. X p x και Y g(x) μια συνάρτησή Για την Y μπορούμε να βρούμε την σκπ και να υπολογίσουμε τον μέσο, τη διακύμανση της, κλπ, όπως είπαμε παραπάνω. Εναλλακτικά, για ευκολία, μπορούμε να γράψουμε k E Y g x p x i1 i X i http://compus.uom.gr/inf67/index.php
Συναρτήσεις τμ Ορισμός : Ονομάζουμε διακύμανση, (variance), της τυχαίας μεταβλητής X την αναμενόμενη τιμή var X E X E X Ορισμός : Ονομάζουμε τυπική απόκλιση, (standard deviation), της τυχαίας μεταβλητής X την http://compus.uom.gr/inf67/index.php 3
Συναρτήσεις τμ Σχόλια: Ο μέσος προσδιορίζει τη θέση των τιμών της τμ. Η διακύμανση και η τυπική απόκλιση μετρούν τη διασπορά της τμ γύρω από τον μέσο της. Η τυπική απόκλιση μετράται στις ίδιες μονάδες μέτρησης με την τμ, όπως και ο μέσος της, και διαισθητικά είναι πιο κατανοητή από την διακύμανση. http://compus.uom.gr/inf67/index.php 4
Συναρτήσεις τμ Παράδειγμα 7 : (συνέχεια στο Παράδειγμα 1και 5) Στο Παράδειγμα 1 για τη ρίψη του νομίσματος, να υπολογίσετε την τυπική απόκλιση της απόδοσης Χ. Έχουμε και E X 0. Άρα Χ 1 1 px 1 1 1 1 var X 1 0 10 1 και 1. http://compus.uom.gr/inf67/index.php 5
Συναρτήσεις τμ Χρήσιμοι Υπολογισμοί για Αναμενόμενες Τιμές Έστω η τυχαία μεταβλητή X με σκπ σταθερές. p x, EX X και a, b, Αν X a, Ea EaX b aex b a, var a 0 var X E X E X var ax b a var X http://compus.uom.gr/inf67/index.php 6
Παράδειγμα 8 : Έστω η τμ Χ με σκπ px Συναρτήσεις τμ - -1 1 3 4 px 110 10 310 10 110 110 Ορίζουμε τις τυχαίες μεταβλητές Y 1 και Z 1. Να υπολογισθούν οι σκπ των Υ και Ζ Να παρασταθούν γραφικά οι σκπ των Χ, Υ και Ζ. Να υπολογισθούν οι μέσοι και οι τυπικές αποκλίσεις των Χ, Υ και Ζ. http://compus.uom.gr/inf67/index.php 7
Συναρτήσεις τμ Y 1: γραμμικός μετασχηματισμός, αλλάζει θέση και διασπορά Y -3-1 3 5 7 9 py 110 10 310 10 110 110 Z 1: μη-γραμμικός μετασχηματισμός, αλλάζει όλο το σχήμα Z 5 10 17 pz 510 310 110 110 http://compus.uom.gr/inf67/index.php 8
Η τ.μ. Χ και μετασχηματισμοί της σ.κ.π. της τ.μ. Χ Συναρτήσεις τμ κ.π. 0.0 0.4 0.8 0 5 10 15 τιμές X σ.κ.π. της τ.μ. Υ=*X+1 κ.π. 0.0 0.4 0.8 0 5 10 15 τιμές Υ σ.κ.π. της τ.μ. Ζ=X^+1 κ.π. 0.0 0.4 0.8 0 5 10 15 τιμές Ζ Εικόνα 3: σκπ της τμ Χ και των Y, Z στο Παράδειγμα 8. http://compus.uom.gr/inf67/index.php 9
Συναρτήσεις τμ Μέσοι και οι τυπικές αποκλίσεις των Χ, Υ και Ζ 1 3 1 1 EX 1 1 3 4 1 10 10 10 10 10 10 EX var X (1) X X 1 3 1 1 EX 1 1 3 4 4. () 10 10 10 10 10 10 Από (1) και () και X 4. 1 3. X 3. http://compus.uom.gr/inf67/index.php 30
EY EX1EX 111 3 Συναρτήσεις τμ Y var Y var X 1 4 var X 4 3. 1.8 Y 1.8 EZ var Z (1) Z Z E Z E X 1 E X 14.1 5. () 5 3 1 1 10 10 10 10 Από (1) και () E Z 5 10 17 48.4 Z 48.4 5. 1.36 και Z 1.36 http://compus.uom.gr/inf67/index.php 31
Συναρτήσεις τμ Ορισμός : Αντίστοιχα, η k-ροπή γύρω από το μηδέν, (k th -moment about zero), και η k-ροπή γύρω από τον μέσο, (k th -moment about mean),ορίζονται ως k 1,, Πιο ειδικά, συμβολίζουμε k k EX και k E X, 1. k Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι συντελεστές ασυμμετρίας (λοξότητας), (skewness), και διορθωμένης (υπερβάλλουσας) κύρτωσης, (excess kurtosis), του Pearson, που ορίζονται, αντίστοιχα, ως, 3 1 3/ 4 3 http://compus.uom.gr/inf67/index.php 3
Συναρτήσεις τμ Παράδειγμα 9 : (συνέχεια Παράδειγμα 8) Να υπολογισθεί ο συντελεστής ασυμμετρίας και κύρτωσης για τις μεταβλητές Χ, Υ και Ζ στο Παράδειγμα 8. Να σχολιασθούν, (βλ CoMPUS> > LECTURE_3_CalcRVs) -0.1048157, -0.996875-0.1048157, -0.996875 1.610385, 1.48064 Οι Χ και Υ έχουν τους ίδιους συντελεστές ασυμμετρίας και κύρτωσης. Έχουν ουρά αριστερά και είναι πλατύκυρτες. Η Ζ, ως μη γραμμικός μετασχηματισμός, διαφέρει. Έχει ουρά δεξιά και είναι λεπτόκυρτη (παχειά άκρα), βλ. Εικόνα 3 http://compus.uom.gr/inf67/index.php 33
Βιβλιογραφία Πρόσθετη Βιβλιογραφία Μαθήματος [1] Baron, M., Probability and Statistics for Computer Scientists, Chapman & Hall/CRC, 007 [] Grimmett, G. R. and D. R. Stirzaker, Probability and Random Processes, Oxford University Press, 1985 http://compus.uom.gr/inf67/index.php 34