4. Μεταβλητες. Probability Theory Ι. Θεωρια Πιθανοτητων Ι. ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (3 ο ) WINTER SEMESTER (3 st ) Iωαννης Αντωνιου

Θεωρια Πιθανοτητων Ι ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (3 ο ) Τμημα Μαθηματικων Αριστοτελειο Πανεπιστημιο Θεσσαλονικης Probability Theory Ι WINTER SEMESTER (3 st ) School of Mathematics Aristotle University of Thessaloniki 4. Μεταβλητες Iωαννης Αντωνιου iantonio@math.auth.gr Το παρόν εκπαιδευτικό υλικό υπόκειται σε Αδεια Χρήσης Creative Commons

Σκοπος - Περιεχομενο Πως Οριζονται οι Παρατηρησιμες Μεταβλητες και οι αντιστοιχες Κατανομες Πιθανοτητος Πως Οριζονται οι Ανεξαρτητες Μεταβλητες

Μεταβλητες = Παρατηρησιμες Μεταβλητες = Τυχαιες Μεταβλητες Variables = Observable Variables = Random Variables Περιγραφουν τις Παρατηρησιμες Ιδιοτητες που κωδικοποιουνται ως Αριθμοι η Συμβολα Μεταβλητη με τιμες στο Συνολο K Χ: Y K y X y = x, Y: ο Δειγματοχωρος K ένα συνολο από Συμβολα ειτε Αριθμους στο οποιο παιρνει τιμες η Μεταβλητη. Σε κάθε τιμη x της Μεταβλητης αντιστοιχει το Συνολο των Στοιχειωδων Ενδεχομενων που εχουν την αυτή τιμη: y: X y = x = X x. Tα Συνολα X x είναι Μετρησιμα στον χωρο Πιθανοτητων (Y, S, p) (αλλως δεν οριζεται η Πιθανοτητα Γεγονοτων που παρατηρουμε μεσω της Μεταβλητης): X x S Η αναγκαια αυτή Συνθηκη αποτελει τον ορισμο της (Τυχαιας) Μεταβλητης Ορισμος (Τυχαια) Μεταβλητη στον Χωρο Πιθανοτητων (Y, S, p) ονομαζουμε κάθε Μετρησιμη Συναρτηση από τον Δειγματοχωρο Y στο συνολο τιμων K Θεωρημα οι γνωστές χρησιμες συναρτήσεις (συνεχείς, κατά διαστήματα συνεχείς, περατωμένης μεταβολής) είναι Μετρησιμες και επομένως είναι υποδειγματα τυχαίων μεταβλητων

Ειδη Μεταβλητων Ποσοτικές η Αριθμητικες Μεταβλητές (Quantitative, Numerical) Χ: Y R: y X(y) ένας πραγματικος αριθμος, R : το Συνολο των Πραγματικων Αριθμων Αναπαριστουν ιδιοτητες μετρήσιμες αριθμητικα. Παίρνουν αριθμητικές τιμές. Παραδειγμα: η αποσταση μεταξυ των οφθαλμών των φοιτητων, το υψος των φοιτητων, το εισοδημα των οικογενειων των φοιτητων Διακριτη ή Απαριθμητη (Discrete) Ποσοτική Μεταβλητή Λαμβανει πεπερασμένο ή αριθμήσιμο πλήθος τιμών. Συνεχής (continuous) Ποσοτική Μεταβλητή Λαμβανει τιμές σε ένα διάστημα (α,β) με α < β Ποιοτικές ή Κατηγορικές ή Συμβολικές Μεταβλητές (Qualitative, Categorical, Nominal, Symbolic) Χ: Y K y X(y) ένα συμβολο, K ένα συνολο από Συμβολα Αναπαριστουν ιδιοτητες μη μετρήσιμες αριθμητικα. Οι τιμες τους είναι συμβολα Παραδειγμα: το χρώμα των οφθαλμών των φοιτητων, η συναισθηματικη κατασταση των φοιτητων, η βάση στη θέση κ στο DNA, Διατακτικές Μεταβλητές (Ordinal, Ranked) οι τιμες τους διατασσονται. Διατακτικες είναι οι Αριθμητικες Μεταβλητές και οσες Κατηγορικες Μεταβλητές Διατασσονται. Παραδειγμα Κατασταση Υγειας: Αριστη, Καλη, Μετρια, Κακη, Κρισιμη 5-level Likert Scale: Strongly Disagree, Disagree, Neither Agree Nor Disagree, Agree, Strongly Agree

Φασμα Μεταβλητης ονομαζεται το συνολο των Τιμων της Μεταβλητης φ Χ = {x: x ττττ πππ δδδδδδδ νν λλλλλ η Μεταβλητη Χ} K Φασμα R για Ποσοτικές η Αριθμητικες Μεταβλητές R : το Συνολο των Πραγματικων Αριθμων Φασμα Q R για Ποσοτικές η Αριθμητικες Μεταβλητές που επεξεργαζομαστε Q: το Συνολο των Ρητων Αριθμων Φασμα K για Ποιοτικές Μεταβλητές K Συνολο (αυθαιρετων) Συμβολων

Πιθανοτητα Μεταβλητης Εστω η Μεταβλητη Χ με Φασμα τιμων φ Χ K Η Κατανομη Πιθανοτητας της Χ είναι: p Χ ξ = p Χ Χ = ξ, για κάθε ξ από το Φασμα φ Χ Χ = ξ το Γεγονος ότι η Μεταβλητη Χ λαμβανει τιμη ξ Δηλαδη Χ = ξ είναι το συνολο των στοιχειωδων ενδεχομενων που αντιστοιχουν στην τιμη Χ = ξ Αν θελουμε να επεκτεινουμε την Πιθανοτητα p Χ της Μεταβλητης Χ, σ'ολο το Πεδιο τιμων K, απλα οριζουμε: p Χ ξ =0, για κάθε ξ στο K φ Χ

Παρατηρησιμες Μεταβλητες και Διαμερισεις Κάθε Μεταβλητη Χ: Y K Διαμεριζει τον Δειγματοχωρο Y σε Κελια Στοιχειωδων Ενδεχομενων y τα οποια δεν μπορουμε να διακρινουμε Παρατηρωντας μεσω της Μεταβλητης Χ, καθοτι: Χ(y ) = Χ y 2 = x y, y 2 ανηκουν στο αυτό κελι X x Τα Στοιχειωδη Ενδεχομενα y, y 2 ονομαζονται Ισοδυναμα Παρατηρησιακα (δια της Μεταβλητης Χ)

Παρατηρησιμες Μεταβλητες και Διαμερισεις Παραδειγμα Ξ = Χ = ξ = {y: X y = ξ ] p Χ ξ = 2 7 Ξ 2 = Χ = ξ 2 = {y: X y = ξ 2 ] p Χ ξ 2 = 8 7 Ξ 3 = Χ = ξ 3 = {y: X y = ξ 3 ] p Χ ξ 3 = 5 7 Ξ 4 = Χ = ξ 4 = {y: X y = ξ 4 ] p Χ ξ 4 = 3 7

Παραδειγμα 2: Α η Μεταβλητη "Αθροισμα των Ενδειξεων 2 Ζαριων" Το Αθροισμα των ενδειξεων 2 Ζαριων Παρατηρησιμα Γεγονοτα (Κελια) Observable Events (Cells) Πιθανοτητα Probability 2 Ξ 2 ={ (,)} /36=3% 3 Ξ 3 ={ (,2), (2,)} 2/36=6% 4 Ξ 4 ={ (2,2), (,3),(3,)} 3/36=8% 5 Ξ 5 ={ (,4), (2,3),(3,2), (4,)} 4/36=% 6 Ξ 6 ={ (,5), (2,4),(3,3), (4,2), (5,)} 5/36=4% 7 Ξ 7 ={ (,6), (2,5),(3,4), (4,3), (5,2), (6,)} 6/36=7% 8 Ξ 8 ={ (2,6), (3,5),(4,4), (5,3), (6,2)} 5/36=4% 9 Ξ 9 ={ (3,6), (4,5),(5,4), (6,3)} 4/36=% 0 Ξ 0 ={ (4,6), (5,5),(6,4)} 3/36=8% Ξ ={ (5,6), (6,5)} 2/36=6% 2 Ξ 2 ={ (6,6)} /36=3% Το πιο πιθανο Γεγονος (αποτελεσμα της Παρατηρησης της Μεταβλητης Α) είναι το [Α=7], με ρ[α=7]= /6 Το Γεγονος [Α=7] πραγματοποιειται με 6 τροπους (Στοιχειωδη) Ενδεχομενα: (,6), (2,5),(3,4), (4,3), (5,2), (6,)

Παραδειγμα 2: Β η Μεταβλητη "Διαφορα των Ενδειξεων 2 Ζαριων" Η Διαφορα Ενδειξεων 2 Ζαριων Παρατηρησιμα Γεγονοτα (Κελια) Observable Events (Cells) Πιθανοτητα Probability 0 Η 0 ={ (,), (2,2),(3,3), (4,4), (5,5),(6,6)} 6/36=6.66% Η ={ (,2), (2,3), (3,4), (4,5), (5,6), (6,5), (5,4), (4,3),(3,2), (2,)} 0/36=27.77% 2 Η 2 ={ (,3), (2,4), (3,5), (4,6), (6,4), (5,3),(4,2), (3,)} 8/36=22.22% 3 Η 3 ={ (,4), (2,5), (3,6), (6,3), (5,2),(4,)} 6/36=6.66% 4 Η 4 ={ (,5), (2,6), (6,2), (5,)} 4/36=.% 5 Η 5 ={ (,6), (6,)} 2/36=5.55% 6 + 0 + 8 + 6 + 4 + 2 = 36 36 36 36 36 36 36 36 =, αλλα: 6.66 + 27.77 + 22.22 + 6.66 +.+ 5.55=99.97? Το πιο πιθανο Γεγονος (αποτελεσμα της Παρατηρησης της Μεταβλητης Β) είναι το [Β=], με p[β=]= 0/36 Το Γεγονος [Β=] πραγματοποιειται με 0 τροπους (Στοιχειωδη) Ενδεχομενα: (,2), (2,3), (3,4), (4,5), (5,6), (6,5), (5,4), (4,3),(3,2), (2,)

Ορισμος Τα Συνολα Ξ, Ξ 2,, Ξ n οριζουν μια Διαμεριση του Δειγματοχωρου Υ σε n Κελια - Γεγονοτα (n-διαμεριση) που αντιστοιχουν στα αποτελεσματα των Μετρησεων μιας ή Περισσοτερων Μεταβλητων, αν και μονον αν: Y = Ξ Ξ 2 Ξ n και Ξ, Ξ 2,, Ξ n ξενα μεταξυ τους: Ξ κ Ξ λ = Κάθε Διαμεριση οριζει μια Κλαση Μεταβλητων που διαφερουν μονο στις τιμες ξ, ξ 2, που παιρνουν στα αντιστοιχα Κελλια. Oι τιμες ξ, ξ 2, αποτελουν τιτλους-σηματα (labels) για να Διακρινονται μεταξυ τους τα Κελλια της Διαμερισης Μεταβλητες που οριζουν την αυτή Διαμεριση ονομαζονται Μεταβλητες Ισοδυναμες Στατιστικα ή Ισοδυναμες Πληροφοριακα Καθοτι εχουν την αυτή Κατανομη Πιθανοτητας Διαμερισεις σε n Κελια με ισες αντιστοιχες Πιθανοτητες ονομαζονται Διαμερισεις Ισοδυναμες Στατιστικα ή Ισοδυναμες Πληροφοριακα

Πείραμα- Δειγματοχώροι- Μεταβλητές Πειραμα Δειγματοχωρος Πειραματος Μεταβλητη Μεταβλητες Παρατηρηση ιδιοτητων Χαρακτηριστικων ως Μεταβλητες τα δυνατα Ενδεχομενα Χ: Y R οι Τιμες της Μεταβλητης (Φασμα της Μεταβλητης) αντιστοιχουν και περιγραφουν τα δυνατα Αποτελεσματα η Γεγονοτα που ειναι Μετρησιμα Υποσυνολα του Δειγματοχωρου Ενα γεγονος δυναται να οριζεται απο τις τιμες 2 η περισσοτερων Μεταβλητων Ριψη 2 ζαριων Οι 36 διαταγμενες 2αδες (α,β), α,β=,2,3,4,5,6 Α= το αθροισμα των ενδειξεων 2 ζαριων σ Α ={2,3,4,5,6,7,8,9,0,,2} Β= η διαφορα των ενδειξεων 2 ζαριων σ Β ={0,,2,3,4,5} Το γεγονος [Α=7, Β=3] αντιστοιχει στα Ενδεχομενα: (2,5), (5,2) Το γεγονος [Α=7, Β=4] αντιστοιχει στο Ενδεχομενο:

Κοινη Παρατηρηση των Μεταβλητων (Α,Β) (α,β) = [Α=α,Β=β] το Γεγονος οτι Το Αθροισμα των Ενδειξεων 2 Ζαριων είναι Α=α, α=2,3,4,5,6,7,8,9,0,,2 Η Διαφορα των Ενδειξεων 2 Ζαριων είναι Β=β, β=0,,2,3,4,5 Τα Κοινα Γεγονοτα είναι τα διαταγμενα ζευγη: (α,β), α=2,3,4,5,6,7,8,9,0,,2, β=0,,2,3,4,5 Η Κοινη Διαμεριση εχει δυναμει 6=66 Κελια Ποσα Κελια περιεχουν ζευγη? Ποια η Πιθανοτητα εκαστου Κελιου?

Α Β (Α,Β) Παρατηρησιμα Γεγονοτα Πιθανοτητα 2 0 Ξ 2 Η 0 = Ξ 2 ={(,)} /32 2 Ξ 2 Η = 0 2 2 Ξ 2 Η 2 = 0 2 3 Ξ 2 Η 3 = 0 2 4 Ξ 2 Η 4 = 0 2 5 Ξ 2 Η 5 = 0 3 0 Ξ 3 Η 0 = 0 3 Ξ 3 Η = Ξ 3 ={(,2), (2,)} 2/32 3 2 Ξ 3 Η 2 = 0 3 3 Ξ 3 Η 3 = 0 3 4 Ξ 3 Η 4 = 0 3 5 Ξ 3 Η 5 = 0 4 0 Ξ 4 Η 0 = Ξ 4 ={(2,2)} /32 4 Ξ 4 Η = 0 4 2 Ξ 4 Η 2 = 0 4 3 Ξ 4 Η 3 = 0 4 4 Ξ 4 Η 4 = 0 4 5 Ξ 4 Η 5 = 0 5 0 Ξ 5 Η 0 = 0 5 Ξ 5 Η = {(2,3),(3,2)} 2/32 5 2 Ξ 5 Η 2 = 0 5 3 Ξ 5 Η 3 = {(,4), (4,)} 2/32 5 4 Ξ 5 Η 4 = 0 5 5 Ξ 5 Η 5 = 0 6 0 Ξ 6 Η 0 = 0 6 Ξ 6 Η = 0 6 2 Ξ 6 Η 2 ={(2,4), (4,2)} 2/32 6 3 Ξ 6 Η 3 = 0 6 4 Ξ 6 Η 4 = {(,5), (5,)} 2/32 6 5 Ξ 6 Η 5 = 0

7 0 Ξ 7 Η 0 = 0 7 Ξ 7 Η = {(3,4), (4,3)} 2/32 7 2 Ξ 7 Η 2 = 0 7 3 Ξ 7 Η 3 = {(2,5), (5,2)} 2/32 7 4 Ξ 7 Η 4 = 0 7 5 Ξ 7 Η 5 ={(,6), (6,)} 2/32 8 0 Ξ 8 Η 0 = 0 8 Ξ 8 Η = 0 8 2 Ξ 8 Η 2 = {(3,5), (5,3)} 2/32 8 3 Ξ 8 Η 3 = 0 8 4 Ξ 8 Η 4 ={(2,6), (6,2)} 2/32 8 5 Ξ 8 Η 5 = 0 9 0 Ξ 9 Η 0 = 0 9 Ξ 9 Η = {(4,5), (5,4)} 2/32 9 2 Ξ 9 Η 2 = 0 9 3 Ξ 9 Η 3 = {(3,6), (6,3)} 2/32 9 4 Ξ 9 Η 4 = 0 9 5 Ξ 9 Η 5 = 0 0 0 Ξ 0 Η 0 = {(5,5)} 0 Ξ 0 Η = 0 0 2 Ξ 0 Η 2 = {(4,6), (6,4)} 2/32 0 3 Ξ 0 Η = 0 0 4 Ξ 0 Η 4 = 0 0 5 Ξ 0 Η 5 = 0 0 Ξ Η 0 = 0 Ξ Η = Ξ ={(5,6), (6,5)} 2/32 2 Ξ Η 2 = 0 3 Ξ Η 3 = 0 4 Ξ Η 4 = 0 5 Ξ Η 5 = 0 2 0 Ξ 2 Η 0 = Ξ 2 ={(6,6)} /32 2 Ξ 2 Η = 0 2 2 Ξ 2 Η 2 = 0 2 3 Ξ 2 Η 3 = 0 2 4 Ξ 2 Η 4 = 0 2 5 Ξ 2 Η 5 = 0 Αθροισμα 4 32 + 4 2 32 =

Συνοψη: Στοιχειωδη Ενδεχομενα: 32 Διαφορετικα Αποτελεσματα: 8 Η Κοινη Διαμεριση των Α,Β εχει 8 Κελια λεπτοτερα των κελλιων των Α,Β. 4 Κελια εχουν Στοιχειο και Πιθανοτητα 32 εκαστο 4 Κελια εχουν 2 Στοιχεια και Πιθανοτητα 2 32 εκαστο

H Δείκτρια Συναρτηση ως Τυχαία Μεταβλητή Έστω ο χώρος πιθανοτήτων (Y, B, P), Η συνάρτηση, y Ξ Ξ y = 0, y Ξ Που οριζεται για κάθε Μετρησιμο συνολο Ξ είναι τ.μ. Και καλειται Η Δείκτρια Συναρτηση (Indicator Function) του Μετρησιμου Συνολου Ξ, Ξ. 7

Θεωρημα: Iδιοτητες των Δεικτριων Συναρτησεων Y (y) =, y in Y (y) = 0, y in Y Δ = Α Δ=Α Δ Α Δ Α ( Δ ) 2 = Δ A c = - A A B = A B A B = A + B - A B A B = A A B A B =( A - B ) 2, A B είναι η Συμμετρικη Διαφορα (Exclusive OR) των Συνολων Α, Β k Ak = k Ak, A k A λ = Α (Sy)= S A (y) 8

Αποδειξεις A B =- (A B) c = - A c B c = ( A c B c ) = (- A )( - B ) = A + B - A B A-B = A B c = A B c= A (- B ) = A - A B A B = (A-B) (B-Α) = A-B + B-A = ( A - A B ) + ( B - B A ) = A + B 2 A B = ( A - B ) 2 A B = (A B)-(A B) = A B (- A B ) = ( A + B - A B )(- A B )= A + B 2 A B = ( A - B ) 2 Α (Sy) =, Sy Α y S A 0, Sy Α y S A = S A (y), S:Y Y

ΘΕΩΡΗΜΑ Κάθε Mεταβλητη γραφεται ως Αθροισμα Δεικτριων Mεταβλητων (2αδικων Ερωτησεων) Α(y)=α y + α Ξ 2 y + Ξ2

Συνάρτηση Κατανομής (σ.κ.) Έστω Χ τ.μ. που αντιστοιχεί το χώρο πιθανοτήτων (Y, F, P) στο χώρο πιθανοτήτων R, B, P. Ορίζουμε την πραγματική συνάρτηση πραγματικής μεταβλητής: F X x = P X x = P({ω: ω Y, Χ(ω) x}), όπππ: x R και την ονομάζουμε συνάρτηση κατανομής. Λόγω του ορισμού της σ-άλγεβρας και του ότι τα σύνολα (, x] γενικεύουν τη σ- άλγεβρα B, η γνώση της συνάρτησης κατανομής εξασφαλίζει ότι μπορεί να βρεθεί η πιθανότητα οποιουδήποτε στοιχείου-συνόλου του B. Π.χ. P(α < X β) = P([Χ β] [Χ α]) = F X (β) F X (α) P α < X < β = P Χ < β Χ α = = lim x β F X x F X α = F X (β ) F X (α) διότι: [Χ < β] = lim [X β ] P([Χ < β]) = P( lim [X β ]) = n n n n = lim P([X β ]) = lim n n x β F X(x) αύξουσα ακολουθία γεγονότων 2

Ιδιότητες Η συνάρτηση κατανομής F X (x) ικανοποιεί, τις εξής ιδιότητες: (i) 0 F X (x), x R προφανές (αφού είναι πιθανότητα) (ii) F X (α) F X (β), αα α < β δηλ. αύξουσα όχι αυστηρά προφανές (iii) F X (x + ) = lim t x + F X(t) = F X (x + ), x R αν x n x και x n φθίνουσα, τότε δηλ. συνεχής από δεξιά A n = [Χ x n ] είναι φθίνουσα ακολουθία γεγονότων, και: lima n = An = {ω: X x n= lim t x +F X(t) = lim F X (x n n Στις μονότονες ακολουθίες γεγονότων P(lim (AA)) = lim (P(AA)) (iv) F X = lim F X x = 0, x F X (+ ) = lim F X(x) = x + σχηματίζουμε μία φθίνουσα ακολουθία γεγονότων με την x n και μία αύξουσα με την x n +

Απαριθμητές ή Διακριτές τ.μ. Έτσι λέγονται οι τ.μ. που παίρνουν τιμές σε ένα το πολύ αριθμήσιμο σύνολο τιμών x, x 2,, x n, με αντίστοιχες πιθανότητες p, p 2,, p n, έτσι ώστε: P(X = x k ) k= Ορίζουμε τη συνάρτηση πιθανότητας (σ.π.) f X (x), έτσι ώστε: = p k k= = f X (x) = P(X = x) = p k, αα x = x k, k =,2,3... 0, ααααύ που ικανοποιεί τις ιδιότητες: (i) f X (x) 0 (ii) f X (x k ) k= = Τότε: F X (x) = P(X x) = k 0, αα x < x f X (x i ), αα x k x x k+, k =,2,3, i= 23

Απαριθμητές ή Διακριτές τ.μ. (συν.) Η συνάρτηση πιθανότητας μπορεί επίσης να συσχετιστεί με τη σ.κ. f X (x) = Οπτικοποίηση F X x, αα x = x F X (x k ) F X (x k ), αα x = x k, k =,2,3, 0, ααααύ f X (x) F X (x) p +p 2 +p 3 p 3 p x x 2 x 3 x 4 x 5 x x 2 x 3 x 4 x 5 24

Παραδείγματα Π. 4.9. Ομοιόμορφη Διακριτή Κατανομή Χ {, 2, 3,, n} με σ.π. f X (x) = n, x =,2,3,..., n 0, ααααύ Π. 4.0. Σταθερή τ.μ. Χ = x 0, f X x 0 = F X (x) = 0, x < x 0, x x 0 Π. 4.. Κατανομή Bernoulli. x 0 Χ {0, } f X (0) = p f X = p F X (x) = 0, x < 0 p, 0 x <, x -p 0

Παραδείγματα (συν.) Π. 4.2. Διωνυμική Κατανομή f X (k) = n k pk p n k, k = 0,,2,3,..., n Χ {0,, 2, 3,, n} με σ.π. από διωνυμικό θεώρημα n f X (k) k=0 n = n k pk p n k k=0 = p + p n = Διωνυμική κατανομή για n = 20 p = 0., σ.κ. Β(20,0.5), Β(20,0.7), Β(40,0.5) p = 0.5 p = 0.8 26

Π. 4.3. Κατανομή Poisson Παραδείγματα (συν.) Χ {0,, 2, 3,, n, } με σ.π. f X k = P X = k = e λ λk, k = 0,,2,3,..., n, k! από γνωστό ανάπτυγμα Π. 4.4 (και.4). Κατανομή αθροίσματος 2 ζαριών f X (k) k=0 λk = e λ k! k=0 = e λ e λ = Αν Z παριστάνει το άθροισμα των 2 ζαριών τότε: Z=5 (,) (,2) (,3) (,4) (,5) (,6) (2,) (2,2) (2,3) (2,4) (2,5) (2,6) (3,) (3,2) (3,3) (3,4) (3,5) (3,6) (4,) (4,2) (4,3) (4,4) (4,5) (4,6) (5,) (5,2) (5,3) (5,4) (5,5) (5,6) (6,) (6,2) (6,3) (6,4) (6,5) (6,6) Z=7 f Z (k) = P(Z = k) = Z=2 Ζ {2, 3,, 2} που παριστάνεται και με πίνακα με σ.π. k, k = 2,3,..., 7 36 2 (k ), k = 7,8,..., 2 36 z 2 3 4 5 6 7 8 9 0 2 f Z (z) 36 2 36 36 36 36 36 36 36 36 36 36 27

Συνεχείς τ.μ. Αν η τ.μ. Χ παίρνει τιμές σε μη αριθμήσιμο σύνολο και υπάρχει συνάρτηση f X (x) τέτοια ώστε να ισχύει: F X (x) = x f X (t) dd, < x < τότε η τ.μ. Χ λέγεται (απόλυτα) συνεχής και η συνάρτηση f X (x) λέγεται συνάρτηση πυκνότητας (πιθανότητας) (σ.π.π.) Η συνάρτηση κατανομής F X (x) είναι τότε σχεδόν παντού (σ.π.) παραγωγίσιμη, δηλαδή παραγωγίσιμη σε όλα τα σημεία εκτός ίσως σε σημεία ενός συνόλου μέτρου 0 (π.χ. σε πεπερασμένα ή αριθμήσιμου πλήθους σημεία) και ισχύει: F X(x) = f X (x) σ. π. σσσ R Η f X (x) ικανοποιεί τις ιδιότητες: i f X x (ii) 0, σ. π. σσσ R f X (x) dd = Επίσης: P(α < X β) = f X (x) dd P(X = α) = F X (α) F X (α ) = 0 P(x < X x + ΔΔ) f X (x) dd α β, α β 28

Π. 4.5. Ομοιόμορφη Κατανομή Χ [α, β] με σ.π.π. Επειδή f X (x) dd = c dd = α β f X x = f X (x) = c, α x β 0, ααααύ β α, α x β 0, ααααύ άρα c = β α F X (x) = οπότε: 0, x < α x α β α, α x β, x > β f(x) β a F(x) α β α β

Π. 4.6. Εκθετική Κατανομή Χ [0, ) με σ.π.π. f X (x) = λe λλ, x 0 0, x < 0 f(x) λ F X (x) = F(x) 0, x < 0 e λλ, x 0 0 0 Α.4.3α. Να βρεθεί λ P X = P(X ) ή P X = 2 P(X ) = λe λλ dd 0 Β τρόπος: P X = 2 = e λ = 2 e λ = 2 F X = 2 κλπ 0 λ = 0.693 0.5

Π. 4.7. Τριγωνική Κατανομή f(x).0 0.8 Χ (, ) με σ.π.π. f X (x) = x, x 0, x > f(x) = + x 0.6 0.4 0.2 f(x) = x.5.0 0.5 0.5.0.5 x x <, F X (x) = 0 dd = 0 x < 0, F X (x) = 0 0 0 x <, F X (x) = f X x dd + + t dd = +x 2 2 x (x) dd + t dd = x 2 0 2 f X (x) dd = 0 + x 0 dd + 0 dd + 0 + x dd + dd = x, F X (x) = f X x (x) dd + 0 dd = F(x).0 0.8 0 + x F X (x) = 2 2 x 2 2 x < x < 0 0 x < x 0.6 0.4 0.2.5.0 0.5 0.5.0.5

Μικτές τυχαίες μεταβλητές Μικτή λέγεται μια τ.μ. Χ όταν η σ.κ. F X (x) έχει τις εξής ιδιότητες: α) Υπάρχει το πολύ αριθμήσιμο σύνολο τιμών x, x 2,, x n, στα οποία η σ.κ. έχει θετικό άλμα, δηλ. F X x k F X x k = p k > 0, και ισχύει: P(X = x k ) = p k k= k= = θ, 0 θ β) Η παράγωγος φ(x) της σ.κ. F X (x) στα σημεία συνέχειάς της ικανοποιεί τη σχέση: Αν συμβολίσουμε: τότε η f d (x) είναι σ.π. μιας διακριτής τ.μ. με σ.κ. έστω F d (x) f d (x k ) = F X(x k ) F X (x k ) θ φ(x) dd = p k θ = θ Αν στα σημεία συνέχειας της F X (x) συμβολίσουμε: f c (x) = φ(x) = F X(x θ θ τότε η f c (x) είναι σ.π.π. μιας συνεχούς τ.μ. με σ.κ. έστω F c (x) Και ισχύει: F X (x) = θ F d (x) + ( θ)f c (x) Κυρτό άθροισμα Διακριτής και συνεχούς

F X (x) = 0, x < α n )(x α n(β α), α x < β, x β F(x) n Η F X (x) είναι κυρτό άθροισμα των σ.κ. F d (x) = 0, x < β, x β F c (x) = x α β α, 0, x < α α α x < β, x β β δηλαδή: F X (x) = n F d(x) + n n F c(x Π.χ. Ποια η πιθανότητα P( α+β 2 < Χ β); α + β P( 2 α + β < X β) = F X (β) F X ( 2 ) = n + n n n 0 + n n 2 = n + 2n

TM Ιδιάζουσες (Singular) Αν η παράγωγος της σ.κ. μιας τ.μ. είναι σχεδόν παντού ίση με 0 η τ.μ. λέγεται ιδιάζουσα τ.μ. Αν την συμβολίσουμε F ss (x) τότε κάθε σ.κ. Αναλυεται ως κυρτό άθροισμα τριών σ.κ. (διακριτής, συνεχούς και ιδιάζουσας), δηλ. F X (x) = a d F d (x) + a ac F aa (x) + a ss F ss (x), a d + a ac + a ss =

Συναρτήσεις τυχαίας Μεταβλητής Έστω Χ τ.μ. που αντιστοιχεί το χώρο πιθανοτήτων (Y, F, P)στο χώρο πιθανοτήτων R, B, P Χ. Έστω ακόμη συνάρτηση y = h x : R R που ικανοποιεί την ιδιότητα: h ((, y]) = {x: x R, < h(x) y} B Τότε είναι σίγουρο ότι η αντίστροφη εικόνα h (B) οποιουδήποτε συνόλου του B, είναι επίσης σύνολο του B και μπορούμε να συμβολίσουμε: A = h (B) B, B B Αυτό σημαίνει ότι ο μετασχηματισμός Y = h(x) είναι τ.μ. η οποία αντιστοιχεί το χώρο πιθανοτήτων R, B, P Χ, στο χώρο πιθανοτήτων R, B, P Υ, όπου το μέτρο πιθανότητας P Υ ορίζεται: P Y (B) = P X (h (B)) = P X (A) = P(X (A)), μμ X (A) F Η συνάρτηση κατανομής αυτής της τ.μ. βρίσκεται από τη σχέση: F Y (y) = P(Y y) = P(h(X) y) = P(X D y όπου: D y = {x: x R, h(x) y η αντίστροφη εικόνα του (, y]

Αν η τ.μ. X είναι διακριτή με σύνολο τιμών x k, k =,2, τότε και η Y = h(x) είναι διακριτή, με σύνολο τιμών y k, = h x k, k =,2,. Ισχύει: f Y (y k ) = P(Y = y k ) = P(h(X) = y k ) = P({x k : h(x k ) = y k }) = f X (x k ) h(x k )=y k Αν η y = h(x) είναι μονότονη, τότε υπάρχει η αντίστροφη x = h (y) που είναι επισης μονότονη και η σ.κ. της Y = h(x) είναι: (Θ.4.3) F F Y (y) = X (h (y)) F X (h (y)) + P(X = h (y)) αα h(x) αύξξξξξ αα h(x) φφίννννν Αν η συνάρτηση y = h(x) είναι αυστηρά μονότονη, και η τ.μ. X είναι απόλυτα συνεχής, τότε η τ.μ. Y = h(x) είναι συνεχής με σ.π.π: (Θ.4.4) f Y (y) = f X h (y) d dd h (y)

Ρίχνουμε 3 νομίσματα. Ορίζουμε την Μεταβλητη: Y = X 2 όπου X είναι το πλήθος των κεφαλων που εμφανίστηκαν. Να βρεθεί η κατανομή της τ.μ. Y. Λύση Εύκολα διαπιστώνουμε ότι υπάρχουν 8 ισοπίθανα στοιχειωδη ενδεχόμενα τα ΚΚΚ, ΚΚΓ, ΚΓΚ, ΓΚΚ, ΚΓΓ, ΓΚΓ, ΓΓΚ, ΓΓΓ. Η τ.μ. Χ παίρνει τις τιμές Χ = 0,, 2, 3 και ισχύουν: P(X = 0) = P(X (0)) = P(ΓΓΓ) = 8 P(X = ) = P(X ()) = P(ΓΓΓ ΓΓΓ ΚΚΚ) = 3 8 Η Y = Χ 2 παίρνει τιμές: Y =, όταν Χ = 0, ή Χ = 2 Y = 0, όταν Χ = και Y = 4, όταν Χ = 3. Άρα: x 0 2 3 P(X = x) y 0 4 P(Y = y) 8 3 8 3 8 4 8 3 8 8 8

Π. 4.2. Η τ.μ. X έχει την τριγωνική κατανομή x, x f X (x) = 0, x > Ποια η κατανομή της Y = [22 + 2] όπου z συμβολίζει το ακέραιο μέρος του z. Οι τιμές της Y = [22 + 2] είναι 0,,2,3,4 και μάλιστα: Υ =.0 0.8 Υ = 2 Y = 0, όταν X < 2 Y =, όταν 2 X < 0 Υ = 0 0.6 0.4 Υ = 3 Y = 2, όταν 0 X < 2 0.2 Y = 3, όταν X < 2 Y = 4, όταν X = Υπολογίζουμε με ολοκληρώματα ή με εμβαδά του αντίστοιχου χωρίου, π.χ. 2 P(Υ = 0) = ( + x) dd = 8 άρα.5.0 0.5 0.5.0.5 2 2 2 = 8 2 8 = 3 8 y 0 2 3 3 3 P(Y = y) 8 8 8 8 38

Π. 4.22. Η τ.μ. X έχει την τυπική κανονική κατανομή, δηλ. με σ.π.π. 0.4 f X (x) = 2π e x2 2, x R 0.3 0.2 0. Ποια η κατανομή της τ.μ. Y = X 2 ; 3 2 2 3 Επειδή: F Y (y) = P(Y y) = P(X 2 0, y) = P( y X y), αα y < 0 αα y 0 Έπεται: 0, F Y (y) = F X ( y) F X ( y), Παραγωγίζοντας ως προς x έχουμε: 0, αα y < 0 f Y (y) =, αα y > 0 2ππ e y 2 αα y < 0 αα y 0 ααααααααα ττττ σσσ y = 0 0.25 0.20 0.5 0.0 0.05 2 4 6 8

Π. 4.22. Η τ.μ. X έχει την κατανομή, Cauchy, 0.30 δηλ. με π.π. f X (x) = π(+x 2 ), x R 0.25 0.20 0.5 0.0 0.05 Ποια η κατανομή της τ.μ. Y = X ; 0 5 5 0 F Y (y) = P(Y y) = P X y = P(X D y) Αν y < 0 τότε από σχήμα: D y = [, 0) άρα: y F Y (y) = P(X D y ) = P y X < 0 = = F X (0) F X y = 2 F X y

Αν y 0 τότε από σχήμα: D y = (, 0) [, + ) άρα: y F Y y = P X D y = = P < X < 0 + P X < + = y = F X (0) + F X = 3 F y 2 X y Παραγωγίζοντας για όλα τα y (τα διάφορα του 0) βρίσκουμε: f Y (y) = f X y y 2 = π + y 2 y 2 = π + y 2, y 0 Για y = 0 παίρνουμε αυθαίρετα f Y 0 = π, οπότε τελικά: Δηλαδή αν Χ είναι Cauchy τότε και η f Y (y) = π + y 2, y R /Χ ακολουθεί την ίδια κατανομή Cauchy. ΑΠΟΔΕΙΚΝΥΕΤΑΙ και το αντίστροφο: αν η Χ και η /Χ ακολουθούν την ίδια κατανομή, τότε Χ είναι Cauchy.

Π. 4.27. Η τ.μ. X έχει ομοιόμορφη κατανομή, στο [0,3] δηλ. η π.π. είναι: f X (x) =, αα 0 x 3 3 0, ααααύ Ποια η κατανομή G(y) της τ.μ. Y = h(x), όπου 0.5 0.4 0.3 0.2 0. 0 2 3 4.0 0.5 h(x) = x, αα 0 x 2 2 0, ααααύ 2 3 4 0.5 G(y) = P(Y y) = P(h(X) y) = P(X D y Αν y < 0 τότε από σχήμα: D y = άρα:.0 0.5 F Y (y) = P( ) = 0 2 3 4 y 0.5

Αν 0 y < τότε από σχήμα: D y =, 2y [2, ) άρα: G y = P X, 2y 2, = = P(X [0,2y 2,3]) = 2y+ 3 y.0 0.5 2 3 4 0.5 2y Αν y τότε D y = R, άρα: G(y) = P(X R) = δηλαδή: 0, αα y < 0 2y + G(y) =, αα 0 y < 3, αα y > G(y).5.0 0.5.0 0.5 0.5.0.5 2.0 0.5

Π. 4.28. Η τ.μ. X έχει την κανονική κατανομή Ν(μ, σ 2 ) δηλ. με σ.π.π. f X (x) = x μ 2 σ 2π e 2σ 2, x R Ποια η κατανομή της τ.μ. Υ = αχ + β, όπου α, β σταθερές; Επειδή y = αx + β είναι αυστηρά μονότονη, ισχύει το (Θ.4.4), δηλ.: f Y y = f X y β α d dd y β α = y (αα+β) 2 σ α 2π e 2 σ α 2 = α που είναι κανονική κατανομή Ν(αμ + β, (σ α ) 2 ). σ 2π e y β α μ 2 2σ 2 = ανηγμένη τ.μ της X Αν α = και β = μ X μ, δηλαδή αν Y = σ σ σ είναι η τυπική κανονική κατανομή Ν(0,) τότε η κατανομή της Y

Παράδειγμα (μη-μονότονη συνεχούς) Π. 4.29. Η τ.μ. X έχει την ομοιόμορφη κατανομή,, αα x 4 στο [,4] δηλ. με σ.π.π f X (x) = 5 0, ααααύ Ποια η κατανομή της Y = X 2 ; Αν 0 y < τότε : F Y (y) = P(Y y) = P(X 2 y) = P( y X y) = 2 y 5 0.4 0.2 2 2 3 4 5 0.2 6 Αν y < 6 τότε : F Y (y) = P(Y y) = P(X 2 y) = P( X y) = y + 5 Παραγωγίζοντας παίρνουμε: 0.30 0 5 f Y (y) = 5 y, 0 < y, < y 6 0 y 0, ααααύ 0.25 0.20 0.5 0.0 0.05 5 0 5 2 4 5 0.05

Η αντίστροφη της σ.κ. ΘΕΩΡΗΜΑ 4.6. Αν η τ.μ. Χ έχει συνεχή σ.κ. F Χ (x) τότε η τ.μ Υ = F Χ (Χ) έχει την ομοιόμορφη κατανομή στο (0,). (δεν απαιτείται απόλυτη συνέχεια της Χ) F Χ (x) είναι συνεχής και αύξουσα. Για δοσμένη τιμή y (0,) η εξίσωση F Χ x = y έχει είτε (α) μοναδική λύση είτε (β) τιμές σε διάστημα με άνω πέρας την τιμή x = sup {x: F Χ x = y} y y (α) F Y (y) = P(Y y) = P(F X (X) y) = = P(X F X (y)) = F X (F X (y)) = y (β) F Y (y) = P(Y y) = P(F X (X) y) = = P(X x ) = F X (x ) = y x f Y (y) = x x = F Χ (y), 0 < x < 0, ααααύ Η χρησιμότητα του θεωρήματος αυτού είναι ότι αν πάρουμε r, r 2,, r n τυχαίο δείγμα από την ομοιόμορφη κατανομή στο (0,) (μπορούσε να προκύψει και από πίνακες τυχαίων αριθμών), τότε οι τιμές x, x 2,, x n, όπου x k = F Χ (r k ), αποτελούν τυχαίο δείγμα από την κατανομή με σ.κ. F Χ (x).

Το ολοκλήρωμα Lebesgue - Stieltjes Έστω Χ τ.μ. από τον χώρο πιθανοτήτων (Y, F, P) στο χώρο πιθανοτήτων R, B, P και η σ.κ. F x = P(X x). Έστω η τμ Y = g(x) συναρτηση της Χ. Θεωρούμε μια διαμέριση της πραγματικης ευθειας R με λεπτοτητα c: < y < y 0 < y < y 2 < + Λεπτοτης Διαμερισης: το ελάχιστο άνω φράγμα των διαφορών y k+ y k. Ορίζουμε: + Ανω Αθροισμα Lebesgue: U(y) = y n P(y n < g(x) y n ) n= + Κατω Αθροισμα Lebesgue: L(y) = y n P(y n g(x) < y n ) n= Αν οι σειρές συγκλίνουν απόλυτα, τότε οσο αυξανει η λεπτοτης της Διαμερισης (c 0) το ελάχιστο άνω φράγμα της L(y) και το μέγιστο κάτω φράγμα των U(y) ταυτίζονται Το κοινο οριο καλειται ολοκλήρωμα Lebesgue Stieltjes και συμβολίζεται: g(x) dd(x) R ή g(x) dd(x) Περιορίζοντας τα γεγονότα στο συνολο Ξ R ορίζεται το ολοκλήρωμα: g(x) dd(x) Ξ = g(x) Ξ dd(x)

Ισχύουν: Ιδιότητες ολοκλ. Lebesgue - Stieltjes g(x) dd(x) Α g(x) dd(x) Α g(x) dd(x) Α = g(x) dd(x) i= Αν F(x) απόλυτα συνεχής με σ.π.π. f(x), τότε: Α i g(x) dd(x) Α Αν F(x) κλιμακωτή με άλματα p i = F x i, αα Α = Αi, Α i Α j =, i j i= = g(x) f(x) d x Α F(x i ) στα σημεία x i, τότε: g(x) dd(x) Α = g(x i ) p i x i Α Ολοκλήρωμα Riemann Αν F(x) μικτή F x = α F c x + α 2 F d (x), με α + α 2 = τότε: g(x) dd(x) Α = α g(x)df c (x) Α = α g(x)f c(x)d Α + α 2 g(x)df d (x) Α x + α 2 g(x i ) p i x i Α = ΠΟΡΙΣΜΑ σ. κ. F(x) dd(x) = 48

Kοινή Κατανομή 2 Μεταβλητων Για κάθε διατεταγμένο ζεύγος (x,y) πραγματικών τιμών ΟΡΙΖΟΥΜΕ Την Κοινη Αθροιστικη Κατανομη δύο Μεταβλητών ως εξής: F ( xy, ) = PX ( xy, y) και είναι γενίκευση της σ.κ. Μάλιστα: lim F ( x, y) = P( Y y) = F ( y) x XY lim F ( xy, ) = PX ( x) = F( x) y XY XY Μια βασική ιδιότητα της F XX (x, y) προκύπτει από το ότι η πιθανότητα του D στο σχήμα είναι 0 F ( x, y ) + F ( x, y ) F ( x, y ) F ( x, y ) 0 XY 2 2 XY XY 2 XY 2 Που σημαίνει ότι είναι αύξουσα και δεξιά συνεχής και ως προς και ως προς y. Επίσης F XY (, ) = 0, F (, ) = XY X Y Οριακά τείνει στις σ.κ. των περιθώριων κατανομών Υ (x,y 2 ) (x,y ) Σχήμα 2 D (x 2,y 2 ) (x 2,y ) Χ

Επιλέγουμε τυχαία με επανάθεση δύο από τα ψηφία {, 2, 3} Οριζουμε την Μεταβλητη Χ ως το μεγαλύτερο από τα ψηφία που εμφανίστηκε και την Μεταβλητη Υ το άθροισμα των ψηφίων. Τα φασματα τιμων είναι: Χ=, 2, 3 και Υ=2, 3, 4, 5, 6. Ο πίνακας Διπλής Εισόδου (Πιναξ Συναφειας, Contingency Table, Cross Tabulation) παριστάνει τις πιθανότητες P(X=x, Υ=y), για x=,2,3 και y=2,3,,6 Υ Χ 2 3 4 5 6 P(X=x) /9 0 0 0 0 /9 2 0 2/9 /9 0 0 3/9 3 0 0 2/9 2/9 /9 5/9 P(Y=y) /9 2/9 3/9 2/9 /9 3 P( Y = y) = P( X = x, Y = y) x= ΠΕΡΙΘΩΡΙΕΣ ΚΑΤΑΝΟΜΕΣ 6 PX ( = x) = PX ( = xy, = y) y= 2

Πιναξ Συναφειας = Contingency Table = Cross Tabulation Πιναξ Εισοδου 2 μεταβλητων Pearson K. 904, Mathematical contributions to the theory of evolution XIII. On the Theory of Contingency and its Relation to Association and Normal Correlation, Dulau, London

Ορισμος Εξαρτημενες και Ανεξαρτητες Μεταβλητες Οι Μεταβλητες Χ,Υ είναι Ανεξαρτητες όλα τα Γεγονοτα Χ = ξ, Υ = η είναι Ανεξαρτητα P[Χ = ξ, Υ = η] = P[Χ = ξ] P[Υ = η], για ολες τις τιμες ξ, η που λαμβανουν οι Μεταβλητες Χ,Υ Οι Μεταβλητες Χ,Υ είναι Εξαρτημενες τουλαχιστον δυο Γεγονοτα Χ = ξ, Υ = η δεν είναι Ανεξαρτητα P[Χ = ξ, Υ = η] = P[Χ = ξ] P[Υ = η], για τουλαχιστον ένα ζευγος τιμων ξ, η που λαμβανουν οι Μεταβλητες Χ,Υ

Εξαρτημενες και Ανεξαρτητες Μεταβλητες Ζητουμε: Απλουστερα Κριτηρια Δεικτες Εξαρτησης, που να απαντουν στα Ερωτηματα: Είναι οι Μεταβλητες Ανεξαρτητες? Αν οι Μεταβλητες είναι Εξαρτημενες: Ποσο Εξαρτημενες είναι? (Συντελεστης Pearson, Αμοιβαια Πληροφορια) Ποιος είναι ο τυπος της Εξαρτησης? (Αναλυση Παλινδρομησης)

Ρίχνουμε (κανονικό) νόμισμα 3 (ανεξάρτητες) φορές. Χ η Μεταβλητή με τιμή αν στην πρώτη ρίψη έρθει Κ (κορώνα) και 0 αν έρθει Γ (γράμματα). Υ η Μεταβλητή που μας δίνει το συνολικό αριθμό των εμφανίσεων Κ στις 3 ρίψεις Ζ η απόλυτη τιμή της διαφοράς των εμφανίσεων των Κ από αυτές των Γ. Ποιες εκ των 3 Μεταβλητων Είναι Ανεξαρτητες? Κατασκευαζουμε τους Πινακες Συναφειας των (Χ, Υ) και (Χ, Ζ) Ευρισκουμε τις Κοινες Κατανομες των (Χ, Υ) και (Χ, Ζ) Εξεταζουμε αν ισχυει η Συνθηκη Ανεξαρτησιας

y j x i 0 2 3 P[X=x] 0 /8 /4 /8 0 /2 0 /8 /4 /8 /2 P[Y=y] /8 3/8 3/8 /8 Οι X, Y δεν είναι ανεξάρτητες z j x i 3 P[X=x] 0 3/8 /8 /2 3/8 /8 /2 P[Z=z] 3/4 /4 Οι X, Z είναι ανεξάρτητες

Δεσμευμένες τ.μ. Δεσμευμένη κατανομή πιθανότητας της Χ, Υπο την δεσμευση της τιμης της μεταβλητης Υ [Y = y 0 ] ορίζεται: f ( xy, ) f x Y = y = x I XY 0 XY ( 0), fy ( y0) Δεσμευμένη κατανομή πιθανότητας της Y, όταν δίνεται X = x 0 ορίζεται: f ( x, y) f x X = x = y I XY 0 YX ( 0), fx ( x0) Αν Χ, Υ, είναι ανεξάρτητες οι δεσμευμένες κατανομές της μιάς, όταν δίνονται τιμές της άλλης, ταυτίζονται με τις αντίστοιχες περιθώριες x y Από το προηγούμενο παράδειγμα έχουμε: y 0 2 f XX (y Χ = 0) /4 /2 /4 y 2 3 f XX (y Χ = ) /4 /2 /4 Πολυχρόνης Μωυσιάδης: Θεωρία Πιθανοτήτων Ι: Τυχαίες Μεταβλητές 56