Η «ύλη» του προπτυχιακού µαθήµατος

Σχετικά έγγραφα
Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ

Τυχαίες Μεταβλητές Γεώργιος Γαλάνης Κωνσταντίνα Παναγιωτίδου

ΠΙΘΑΝΟΤΗΤΕΣ. Στατιστική Συµπερασµατολογία Ι, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

2. Στοιχεία Πολυδιάστατων Κατανοµών

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

ιωνυµική Κατανοµή(Binomial)

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B)

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΙΚΗΣ ΑΝΑΛΥΣΗΣ Ι ( )

Τυχαία μεταβλητή (τ.μ.)

11 Το ολοκλήρωµα Riemann

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ - ΜΕΣΗ ΤΙΜΗ

ρ. Ευστρατία Μούρτου

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Λυσεις Ασκησεων - Φυλλαδιο 1

Τυχαίες Μεταβλητές (τ.µ.)

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

Κεφάλαιο 3: Τυχαίες µεταβλητές και κατανοµές πιθανότητας.

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

Κεφάλαιο 3 ΠΑΡΑΓΩΓΟΣ. 3.1 Η έννοια της παραγώγου. y = f(x) f(x 0 ), = f(x 0 + x) f(x 0 )

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Βιομαθηματικά BIO-156

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Σηµειώσεις στις σειρές

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

p(x, y) = 1 (x + y) = 3x + 6, x = 1, 2 (x + y) = 3 + 2y, y = 1, 2, 3 p(1, 1) = = 2 21 p X (1) p Y (1) = = 5 49

Πιθανότητες Γεώργιος Γαλάνης Κωνσταντίνα Παναγιωτίδου

3. Κατανομές πιθανότητας

Κεφάλαιο 6 Παράγωγος

1 Ορισµός ακολουθίας πραγµατικών αριθµών

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

Παράρτηµα Α. Στοιχεία θεωρίας µέτρου και ολοκλήρωσης.

ΤΥΧΑΙΑ ΙΑΝΥΣΜΑΤΑ. Στατιστική Συµπερασµατολογία Ι, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΙΙΙ εσµευµένη Πιθανότητα

Βιομαθηματικά BIO-156. Τυχαίες μεταβλητές Κατανομές Πιθανοτήτων. Ντίνα Λύκα. Εαρινό Εξάμηνο, 2017

ΚΕΦΑΛΑΙΟ 1 Ο ΠΙΘΑΝΟΤΗΤΕΣ

Τυχαία Διανύσματα και Ανεξαρτησία

1 Το ϑεώρηµα του Rademacher

Τ Ε Ι Ιονίων Νήσων Τμήμα Εφαρμογών Πληροφορικής στη Διοίκηση και την Οικονομία. Υπεύθυνος: Δρ. Κολιός Σταύρος

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

200, δηλαδή : 1 p Y (y) = 0, αλλού

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές»

Βασικά στοιχεία της θεωρίας πιθανοτήτων

P(Ο Χρήστος κερδίζει) = 1 P(Ο Χρήστος χάνει) = 1 P(X > Y ) = 1 2. P(Ο Χρήστος νικά σε 7 από τους 10 αγώνες) = 7

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2015 ΕΚΦΩΝΗΣΕΙΣ

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Λυσεις Ασκησεων - Φυλλαδιο 2

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 3ο: ΠΙΘΑΝΟΤΗΤΕΣ ΘΕΜΑ Α. α) Τι λέγεται δειγματικός χώρος και τι ενδεχόμενο ενός πειράματος τύχης;

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΤΑΞΙΝΟΜΗΜΕΝΑ Ε ΟΜΕΝΑ

Αριθµητικά χαρακτηριστικά µιάς τυχαίας µεταβλητής

0. Σύντοµη επισκόπηση θεωρίας πιθανοτήτων

1 1 c c c c c c = 1 c = 1 28 P (Y < X) = P ((1, 2)) + P ((4, 1)) + P ((4, 3)) = 2 1/ / /28 = 18/28

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

< 1 για κάθε k N, τότε η σειρά a k συγκλίνει. +, τότε η η σειρά a k αποκλίνει.

Πιθανότητες Γεώργιος Γαλάνης Κωνσταντίνα Παναγιωτίδου

P(200 X 232) = =

Κεφάλαιο 2 ΣΥΝΑΡΤΗΣΕΙΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ. 2.1 Συνάρτηση

Κεφάλαιο 2: ιατάξεις και Συνδυασµοί.

ΗΥ-217-ΠΙΘΑΝΟΤΗΤΕΣ-ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2016 ΔΙΔΑΣΚΩΝ: ΠΑΝΑΓΙΩΤΗΣ ΤΣΑΚΑΛΙΔΗΣ

Μέση Τιµή. Έστω Χ τ.µ. και f Χ (x) ησ.π. ήσ.π.π. της Χ Μέση ή αναµενόµενη τιµή της Χ είναι ο αριθµός: αν η Χ είναι διακριτή, και αν η Χ είναι συνεχής.

Αρµονική Ανάλυση. Ενότητα: Ολοκλήρωµα Lebesgue - Ασκήσεις. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών

1 Οι πραγµατικοί αριθµοί

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2017 ιδάσκων : Π. Τσακαλίδης

Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών. ΗΥ-217: Πιθανότητες-Χειµερινό Εξάµηνο ιδάσκων : Π. Τσακαλίδης

xp X (x) = k 3 10 = k 3 10 = 8 3

Θεωρητικές Κατανομές Πιθανότητας

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Κεφάλαιο 2. Παραγοντοποίηση σε Ακέραιες Περιοχές

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]}

Αρµονική Ανάλυση. Ενότητα: L p Σύγκλιση. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών

ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΒΑΣΙΚΕΣ Ι ΙΟΤΗΤΕΣ ΤΗΣ (Συνέχεια)

(365)(364)(363)...(365 n + 1) (365) k

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Λυσεις Ασκησεων - Φυλλαδιο 1

X i = Y = X 1 + X X N.

ΑΣΚΗΣΕΙΣ - ΠΙΘΑΝΟΤΗΤΕΣ

Στοχαστικές Στρατηγικές

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

3.1 ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ

Κεφάλαιο 3: Τυχαίες µεταβλητές και κατανοµές πιθανότητας.

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

3 Αναδροµή και Επαγωγή

Κεφάλαιο 4. Ευθέα γινόµενα οµάδων. 4.1 Ευθύ εξωτερικό γινόµενο οµάδων. i 1 G 1 G 1 G 2, g 1 (g 1, e 2 ), (4.1.1)

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Λυσεις Ασκησεων - Φυλλαδιο 1

Πανεπιστήμιο Πελοποννήσου

Transcript:

ΠΙΘΑΝΟΤΗΤΕΣ Ι

Η «ύλη» του προπτυχιακού µαθήµατος Βασικές έννοιες Πείραµα τύχης ειγµατοχώρος Ενδεχόµενα Πιθανότητα εσµευµένη πιθανότητα Ανεξαρτησία Βασικά ϑεωρήµατα Θεώρηµα ολικής πιθανότητας Θεώρηµα Bayes Τυχαίες µεταβλητές (τ.µ.) Ορισµός τ.µ. Κατανοµή τ.µ. Συνάρτηση κατανοµής τ.µ. ιακριτές κατανοµές Ορισµός Συνάρτηση µάζας πιθανότητας Μέση τιµή, διακύµανση κλπ. Συνεχείς κατανοµές Ορισµός Συνάρτηση πυκνότητας πιθανότητας Μέση τιµή, διακύµανση κλπ. Οι κυριότερες διακριτές και συνεχείς κατανοµές ιωνυµική, γεωµετρική και αρνητική διωνυµική, υπεργεωµετρική, Poisson Οµοιόµορφη, κανονική, εκθετική και γάµµα, Weibull, ϐήτα

Βασικές έννοιες Πείραµα τύχης (ή τυχαίο πείραµα): Είναι ένα πείραµα του οποίου το σύνολο των δυνατών αποτελεσµάτων είναι γνωστό το ακριβές αποτέλεσµά του δεν µπορεί να προβλεφθεί µε ϐεβαιότητα εκ των προτέρων. ειγµατοσηµεία ή απλά ενδεχόµενα: Τα δυνατά αποτελέσµατα. ειγµατοχώρος του τυχαίου πειράµατος: Το σύνολο των δυνατών αποτελεσµάτων του τυχαίου πειράµατος. (Το σύνολο των δειγµατοσηµείων.) Ενδεχόµενα: ιάφορα υποσύνολα του δειγµατοχώρου. (!) εν είναι πάντα όλα τα υποσύνολα ενός δειγµατοχώρου ενδεχόµενα. Πραγµατοποίηση ενδεχοµένου: Ενα ενδεχόµενο λέµε ότι πραγµατοποιείται αν (και µόνον αν) περιέχει το αποτέλεσµα του τυχαίου πειράµατος. Ξένα ή ασυµβίβαστα ενδεχοµένα: Ενδεχόµενα που δεν έχουν κοινά στοιχεία (έχουν κενή τοµή) και εποµένως δεν πραγµατοποιούνται ταυτόχρονα.

Εστω Ω ένα σύνολο και A ένα σύνολο υποσυνόλων του. (!) Το A περιέχει σύνολα τα οποία είναι υποσύνολα του Ω. Το A καλείται σ-άλγεβρα αν (α) Ω A (ϐ) A A A c A (γ) A 1,A 2,... A A i A (!) Στο (γ) η A 1, A 2,... είναι µία το πολύ αριθµήσιµη συλλογή. Αν το A είναι πεπερασµένο σύνολο τότε συνήθως καλείται απλώς άλγεβρα. (!) Αν το Ω είναι πεπερασµένο τότε και το A είναι πεπερασµένο. Τα παραπάνω συνεπάγονται µεταξύ άλλων ότι A A 1,...,A k A k i=1 A i A A 1,A 2,... A A i A Μερικά τετριµµένα παραδείγµατα σ-αλγεβρών: Το δυναµοσύνολο του Ω, το σύνολο {Ω, }, το σύνολο {Ω,,A,A c } για κάποιο A Ω.

Ενα τυχαίο πείραµα µε δειγµατοχώρο Ω είναι καλά ορισµένο αν το σύνολο A των ενδεχοµένων αποτελεί µία σ-άλγεβρα. Είναι ξεκάθαρο ότι: Ο δειγµατοχώρος Ω πραγµατοποιείται πάντοτε. Το κενό σύνολο δεν πραγµατοποιείται ποτέ. Το A πραγµατοποιείται αν και µόνον αν το A c δεν πραγµατοποιείται. Αν A B και το A πραγµατοποιείται τότε πραγµατοποιείται και το B. Σε κάθε ένα από τα ενδεχόµενα αντιστοιχίζεται ένας αριθµός που εκφράζει την «τύχη» που έχει το ενδεχόµενο να περιέχει το αποτέλεσµα του τυχαίου πειράµατος. Ο αριθµός αυτός αυξάνεται όσο αυξάνεται η «τύχη» που δίνεται στο ενδεχό- µενο. Επειδή εξ ορισµού το αποτέλεσµα του πειράµατος περιέχεται στο Ω, ο αριθµός που αντιστοιχίζεται στο Ω είναι µεγαλύτερος ή ίσος του αριθµού που αντιστοιχίζεται σε κάθε άλλο ενδεχόµενο. Το αντίθετο συµβαίνει µε το κενό σύνολο.

Ο αριθµός που εκφράζει την «τύχη» ενός ενδεχοµένου A καλείται πιθανότητα του ενδεχοµένου A. Από πλευράς Μαθηµατικών, το µέτρο πιθανότητας είναι µία συνάρτηση P : A R (µε πεδίο ορισµού το σύνολο των ενδεχοµένων και µε τιµές στους πραγµατικούς αριθµούς) που έχει τις ακόλουθες χαρακτηριστικές ιδιότητες: (α) 0 P(A) 1, A A (ϐ) P(Ω) = 1 (γ) Αν A 1,A 2,... A είναι µία συλλογή ξένων ανά δύο ενδεχοµένων (δηλαδή A i A j = για i j) τότε P( A i ) = P(A i ). Από το (α) ϐλέπουµε ότι δεν νοείται αρνητική τιµή για µία πιθανότητα ή τιµή µεγαλύτερη της µονάδας. Συχνά εκφράζουµε τις πιθανότητες ως ποσοστά επί τοις εκατό. Π.χ. µία πιθανότητα 0.35 (= 35/100) µπορεί να την αναφέρουµε ως 35%.

Οι παραπάνω χαρακτηριστικές ιδιότητες συνεπάγονται µεταξύ άλλων ότι: P( ) = 0. Αν A,B A µε A B = τότε P(A B) = P(A) + P(B). Γενικότερα, αν A,B A τότε P(A B) = P(A) + P(B) P(A B). Αν A 1,...,A k A τότε P k i=1 ( A i) k i=1 P(A i ). (Σε περίπτωση που είναι ανά δύο ξένα έχουµε ισότητα.) Αν A A τότε P(A c ) = 1 P(A). Αν A,B A µε A B τότε P(A) P(B). Αν A / A τότε το P(A) δεν ορίζεται. (!) P(A) = 1 δεν συνεπάγεται A = Ω και P(A) = 0 δεν συνεπάγεται A =. Η τριάδα (Ω,A, P) καλείται χώρος πιθανότητας. Σχόλιο: Αν σε µερικούς αυτά ϕαίνονται «ξερά» Μαθηµατικά, ας τα σκεφτούν λίγο σε συνδυασµό µε την «τύχη» που αντιστοιχίζουµε στα διάφορα ενδεχόµενα και ϑα δουν ότι όλα είναι πολύ λογικά.

Σε πεπερασµένους δειγµατοχώρους και όταν όλα τα αποτελέσµατα είναι ισοπίθανα (δηλαδή κανένα δεν έχει προβάδισµα έναντι των υπολοίπων ώστε να είναι εκείνο το αποτέλεσµα του τυχαίου πειράµατος) εφαρµόζουµε τον κλασσικό ορισµό της πιθανότητας: πλήθος στοιχείων του A P(A) = πλήθος δυνατών αποτελεσµάτων Μπορούµε να δούµε ξεκάθαρα διάφορες ιδιότητες του µέτρου πιθανότητας: 0 P(A) 1 P(Ω) = 1 P(A c ) = 1 P(A) Αν A B τότε P(A) P(B) Αν A 1,A 2,A 3 είναι ανά δύο ξένα τότε P( A i ) = P(A i ) Γενικά, P( A i ) P(A i ).

Παράδειγµα (Ρίψη ενός Ϲαριού) Ω = {1, 2, 3, 4, 5, 6}, A = όλα τα υποσύνολα του Ω Συχνά τα ενδεχόµενα διατυπώνονται ως ϕράσεις: A = «το αποτέλεσµα είναι άρτιος αριθµός» = {2, 4, 6} B = «το Ϲάρι ϕέρνει 5 ή 6» = {5, 6} C = «το Ϲάρι δεν ϕέρνει άσσο» = {2, 3, 4, 5, 6} D = «το αποτέλεσµα είναι µικρότερο του 5» = {1, 2, 3, 4} Εάν το Ϲάρι είναι αµερόληπτο, δηλαδή αν όλα τα δυνατά αποτελέσµατα είναι ισοπίθανα (και εποµένως το κάθε ένα εµφανίζεται µε πιθανότητα 1/6) τότε από τον κλασσικό ορισµό της πιθανότητας έχουµε P(A) = 3/6 P(B) = 2/6 P(C) = 5/6 P(D) = 4/6

Ας υποθέσουµε ότι κάποιος που γνωρίζει το µέλλον µάς ενηµερώνει ότι το ενδεχόµενο B ϑα πραγµατοποιηθεί οπωσδήποτε. Γνωρίζοντας ότι το αποτέλεσµα του τυχαίου πειράµατος ϑα είναι ένα από τα στοιχεία του B, το B παίρνει τη ϑέση του δειγµατοχώρου Ω. Αυτή η αλλαγή του δειγµατοχώρου επηρεάζει γενικά τις πιθανότητες των δια- ϕόρων ενδεχοµένων. Η νέα πιθανότητα του ενδεχοµένου A καλείται δεσµευµένη πιθανότητα του A δοθέντος B. Ο κλασσικός συµβολισµός γι αυτήν είναι P(A B) και ισχύει P(A B) = P(A B) P(B) (µε την προϋπόθεση ότι P(B) 0) όπου P(A B) και P(B) είναι οι «αρχικές» πιθανότητες των A B και B. (!) ηλαδή για τις «αρχική» πιθανότητα του A ισχύει P(A) P(A Ω). (!) Να ϑυµάστε πως στις δεσµευµένες πιθανότητες ό,τι υπάρχει στα δεξιά της καθέτου ϑεωρείται ότι έχει πραγµατοποιηθεί.

Εάν η πιθανότητα του A µένει ανεπηρέαστη από την πραγµατοποίηση του B, αν δηλαδή P(A B) = P(A) τότε τα ενδεχόµενα A και B καλούνται ανεξάρτητα. Σε αυτήν την περίπτωση P(A) P(A B) = P(A B) P(B) P(A B) = P(A)P(B), εποµένως αν τα A, B είναι ανεξάρτητα τότε η πιθανότητα της τοµής τους ισούται µε το γινόµενο των πιθανοτήτων τους. Αυτός είναι ένας ισοδύναµος ορισµός για την ανεξαρτησία δύο ενδεχοµένων. Κάθε ενδεχόµενο είναι ανεξάρτητο του δειγµατοχώρου και του κενού. Ξένα ενδεχόµενα µπορεί να είναι ανεξάρτητα µόνο αν κάποιο από τα δύο έχει µηδενική πιθανότητα. Αν τα A, B είναι ανεξάρτητα τότε το ίδιο ισχύει και για τα A, B c, για τα A c, B και για τα A c, B c. Αν τα A, B είναι ανεξάρτητα τότε P(A B) = P(A) + P(B) P(A)P(B).

Τρία ενδεχόµενα A,B,C καλούνται ανεξάρτητα αν P(A B) = P(A)P(B), P(A C) = P(A)P(C), P(B C) = P(B)P(C) και επί πλέον P(A B C) = P(A)P(B)P(C). Αυτό γενικεύεται και σε περισσότερα από τρία ενδεχόµενα: Τα ενδεχόµενα A 1,...,A n καλούνται ανεξάρτητα αν η πιθανότητα της τοµής k 2 οποιωνδήποτε εξ αυτών ισούται µε το γινόµενο των αντίστοιχων πιθανοτήτων τους, αν ισχύει δηλαδή ( k P j=1 A ij ) = k j=1 P(A ij ) για κάθε υποσύνολο {i 1,...,i k } του {1,...,n} και για κάθε k = 2,...,n. (!) Εποµένως για να είναι τρία ή περισσότερα ενδεχόµενα ανεξάρτητα δεν αρκεί να είναι ανεξάρτητα «ανά δύο».

Παράδειγµα (Ρίψη δύο Ϲαριών) Ω = {11, 12, 13, 14, 15, 16, Και εδώ ως ενδεχόµενα µπορούµε να 21, 22, 23, 24, 25, 26, ϑεωρήσουµε όλα τα υποσύνολα του 31, 32, 33, 34, 35, 36, δειγµατοχώρου το πλήθος τους είναι 2 36. 41, 42, 43, 44, 45, 46, (!) Ενα σύνολο µε n στοιχεία έχει 51, 52, 53, 54, 55, 56, 2 n διαφορετικά υποσύνολα. 61, 62, 63, 64, 65, 66} Ας υποθέσουµε ότι τα Ϲάρια είναι αµερόληπτα (δηλαδή το κάθε ένα έχει πιθανότητα 1/6 να ϕέρει οποιοδήποτε αποτέλεσµα) και ότι ϱίχνονται ανεξάρτητα (δηλαδή το τι ϑα ϕέρει το ένα δεν επηρεάζει το τι ϑα ϕέρει το άλλο). Ετσι τα 36 αποτελέσµατα που περιέχει ο δειγµατοχώρος είναι ισοπίθανα: P(το αποτέλεσµα είναι ij) = P(το πρώτο Ϲάρι ϕέρνει i και το δεύτερο j) = P(το πρώτο Ϲάρι ϕέρνει i)p(το δεύτερο Ϲάρι ϕέρνει j) = (1/6)(1/6) = 1/36. (!) Γενικά, «και» σηµαίνει «τοµή» ενώ «ή» σηµαίνει «ένωση».

Παράδειγµα (Ρίψη δύο Ϲαριών) Ας ϑεωρήσουµε τα ακόλουθα ενδεχόµενα: A = «το πρώτο Ϲάρι ϕέρνει 6» = {61, 62, 63, 64, 65, 66} B = «το δεύτερο Ϲάρι ϕέρνει 4» = {14, 24, 34, 44, 54, 64} C = «το άθροισµα της Ϲαριάς είναι 7» = {16, 25, 34, 43, 52, 61} Τα A, B είναι ανεξάρτητα: P(A B) = P({64}) = 1/36 και P(A)P(B) = (1/6)(1/6) = 1/36. Τα A, C είναι επίσης ανεξάρτητα: (!) Αναµενόµενο µια που το κάθε ένα αναφέρεται σε διαφορετικό Ϲάρι. P(A C) = P({61}) = 1/36 και P(A)P(C) = (1/6)(1/6) = 1/36. Το ίδιο ισχύει προφανώς και για τα B, C. Τα A, B, C δεν είναι όµως ανεξάρτητα: P(A B C) = P( ) = 0 και P(A)P(B)P(C) = (1/6)(1/6)(1/6) = 1/216.

Βασικά ϑεωρήµατα ιαµέριση ενός συνόλου καλείται κάθε συλλογή ξένων ανά δύο συνόλων η ένωση των οποίων ισούται µε αυτό το σύνολο. (!) Μία διαµέριση ενός συνόλου «σπάει» αυτό το σύνολο σε κοµµάτια. Εστω A 1,A 2,... ενδεχόµενα που αποτελούν διαµέριση (είτε πεπερασµένη είτε άπειρη αλλά αριθµήσιµη) του δειγµατοχώρου Ω. (!) ηλαδή ισχύει A i A j, i j, και A i = Ω. Τότε κάθε υποσύνολο B του Ω µπορεί να γραφεί ως (B A i ) αφού η συλλογή B A 1,B A 2,... είναι µία διαµέρισή του. Θεώρηµα Ολικής Πιθανότητας. Αν A 1,A 2,... είναι διαµέριση του Ω τότε η πιθανότητα οποιουδήποτε ενδεχοµένου B µπορεί να εκφρασθεί ως P(B) = P(B A i ) = P(B A i )P(A i ). Ειδικότερα, επειδή A, A c είναι (προφανώς) διαµέριση του Ω έχουµε P(B) = P(B A)P(A) + P(B A c )P(A c ).

Θεώρηµα Bayes. Αν A, B ενδεχόµενα τότε ισχύει P(A B) = P(B A)P(A) P(B) (µε την προϋπόθεση ότι P(B) 0). Συνδυάζοντας το παραπάνω µε το Θεώρηµα Ολικής Πιθανότητας συµπεραίνουµε ότι αν A 1,A 2,... είναι ενδεχόµενα που αποτελούν διαµέριση του Ω και B ένα άλλο ενδεχόµενο, τότε P(A j B) = P(B A j)p(a j ) P(B Ai )P(A i ) (µε την προϋπόθεση ότι P(B) 0). Το Θεώρηµα Bayes δίνει έναν τρόπο υπολογισµού της «ενηµερωµένης» πιθανότητας ενός ενδεχοµένου A όπως αυτή διαµορφώνεται ϐάσει της πληροφο- ϱίας που δίνει η πραγµατοποίηση ενός άλλου ενδεχοµένου B. Το Θεώρηµα Bayes αποτελεί τον ϑεµέλιο λίθο της Μπεϋζιανής Στατιστικής που είναι µία διαφορετική ϑεώρηση της Στατιστικής, και µπορεί να δώσει απαντήσεις σε πολύ πιο δύσκολα προβλήµατα από ό,τι η Κλασσική Στατιστική εκµεταλλευό- µενη την µεγάλη ισχύ των σύγχρονων ηλεκτρονικών υπολογιστών.

Παράδειγµα Η εταιρεία πληροφορικής ΚΟΡΝΙΖΑ COMPUTERS προµηθεύεται DVD από τρεις διαφορετικούς κατασκευαστές, τους Κ 1, Κ 2, Κ 3. Το 60% των DVD το προµηθεύεται από τον Κ 1, το 25% από τον Κ 2 και το υπόλοιπο 15% από τον Κ 3. Είναι γνωστό ότι το 1% των DVD του κατασκευαστή Κ 1 είναι ελαττωµατικά. Τα αντίστοιχα ποσοστά για τους άλλους δύο κατασκευαστές είναι 2% και 0.75%, αντίστοιχα. Από το σύνολο των DVD που έχει προµηθευθεί η εταιρεία τον περασµένο χρόνο επιλέγουµε ένα στην τύχη. (α) Να ϐρεθεί η πιθανότητα το DVD να είναι ελαττωµατικό. (ϐ) Αν το DVD δεν είναι ελαττωµατικό, ποια είναι η πιθανότητα να προέρχεται από τον κατασκευαστή K 3 ; Λύση. Εστω τα ενδεχόµενα K i = «το DVD προέρχεται από τον κατασκευαστή Κ i», i = 1, 2, 3, E = «το DVD είναι ελαττωµατικό». (α) P(E) = 3 P(E K i )P(K i ) = (0.01)(0.60) + (0.02)(0.25) + (0.0075)(0.15) = 0.012125. i=1 (ϐ) P(K 3 E c ) = P(Ec K 3 )P(K 3 ) P(E c ) = (1 0.0075)(0.15) 1 0.012125 = 0.169417.

Τυχαίες µεταβλητές Για να διατυπώσουµε τον ορισµό της τυχαίας µεταβλητής ϑα χρειαστούµε κάποιες επί πλέον έννοιες τις οποίες ϑα συζητήσουµε σε λίγο. Προς το παρόν ας περιοριστούµε στο να πούµε ότι µία τυχαία µεταβλητή είναι µία συνάρτηση µε πεδίο ορισµού τον δειγµατοχώρο του τυχαίου πειράµατος και πεδίο τιµών κάποιο υποσύνολο των πραγµατικών αριθµών. (!) Οπως ϑα δούµε σε λίγο δεν είναι κάθε τέτοια συνάρτηση τυχαία µεταβλητή. Οι τυχαίες µεταβλητές είναι πολύ σηµαντικές έννοιες στη Θεωρία Πιθανοτήτων και τη Στατιστική. Ειδικά στη Στατιστική, τα οποιαδήποτε δεδοµένα συλλέγουµε ϑεωρούµε ότι είναι τιµές που πήραν αντίστοιχες τυχαίες µεταβλητές. Παραδοσιακά, οι τυχαίες µεταβλητές συµβολίζονται µε κεφαλαία γράµµατα, π.χ. X,Y,Z κλπ. Τα «κλασσικά» σύµβολα f,g κλπ. τα χρησιµοποιούµε για άλλες συναρτήσεις και όχι για τυχαίες µεταβλητές.

Η σ-άλγεβρα Borel των υποσυνόλων του R είναι η ελάχιστη σ-άλγεβρα που περιέχει όλα τα ανοικτά διαστήµατα, δηλαδή τα διαστήµατα της µορφής (α, β). Συνήθως η σ-άλγεβρα Borel του R συµβολίζεται µε B(R). Η B(R) περιέχει όλα τα συνηθισµένα υποσύνολα του R όπως τα [a,b], (a,b], [a,b), (,c], (,c), [d, ), (d, ), {x}, πεπερασµένες και άπειρες αλλά αριθµήσιµες ενώσεις και τοµές τους, τους ϕυσικούς, τους ακεραίους, τους ϱητούς κλπ. (!) Οποιο υποσύνολο του R σάς έρχεται αβίαστα στο µυαλό είναι στην B(R). Στην αρχή του σηµερινού µαθήµατος δώσαµε τον γενικό ορισµό µίας σ-άλγεβρας. Η B(R) ικανοποιεί όλες τις ιδιότητες που αναφέραµε εκεί. Φυσικά, ηb(r) δεν είναι η µοναδικήσ-άλγεβρα που µπορεί να ορισθεί επί του R. Κάθε σύνολο υποσυνόλων του R που ικανοποιεί τις απαιτούµενες ιδιότηες είναι επίσης σ-άλγεβρα. Εν τούτοις, η B(R) είναι όσο πλούσια χρειάζεται για να καλύψει τις ανάγκες της ϐασικής Θεωρίας Πιθανοτήτων και της Στατιστικής.

Εστω f : X Y µία συνάρτηση και R(f) Y το πεδίο τιµών της. (!) R από το αρχικό της λέξης range: «the range of f» είναι το πεδίο τιµών της f. Αν η f είναι ένα προς ένα τότε για κάθε y R(f) υπάρχει ένα και µόνον ένα x X τέτοιο ώστε f(x) = y. Ως γνωστόν, σε αυτήν την περίπτωση µπορούµε να ορίσουµε την αντίστροφη συνάρτηση f 1 : R(f) X για την οποία ισχύει f 1 (y) = x f(x) = y. Αν η f δεν είναι ένα προς ένα, τότε και πάλι µπορούµε να ορίσουµε ένα είδος αντίστροφης συνάρτησης µε τη διαφορά ότι δεν αναφέρεται σε µεµονωµένα στοιχεία του πεδίου ορισµού και του πεδίου τιµών της f αλλά σε υποσύνολα του X και του Y ως ακολούθως. Για οποιοδήποτε B Y ορίζουµε την αντίστροφη εικόνα του, f 1 (B) = {x X : f(x) B}. ηλαδή, η αντίστροφη εικόνα ενός υποσυνόλου B του Y είναι το υποσύνολο του X που περιέχει όλα εκείνα τα x οι εικόνες των οποίων µέσω της f περιέχονται στο B.

Είµαστε τώρα έτοιµοι να καταλάβουµε την έννοια της τυχαίας µεταβλητής. Ορισµός. Μία συνάρτηση X : Ω R καλείται τυχαία µεταβλητή αν για κάθε B B(R) ισχύει X 1 (B) {ω Ω : X(ω) B} A. (!) Ο ορισµός λέει ότι η X είναι τυχαία µεταβλητή αν η αντίστροφη εικόνα κάθε συνόλου Borel είναι ένα ενδεχόµενο. Σε περιπτώσεις που δεν είναι όλα τα υποσύνολα του δειγµατοχώρου ενδεχόµενα, υπάρχουν συναρτήσεις για τις οποίες οι αντίστροφες εικόνες συνόλων Borel δεν ανήκουν στην A και εποµένως αυτές δεν είναι τυχαίες µεταβλητές. Γιατί πρέπει οι αντίστροφες εικόνες των συνόλων Borel να είναι ενδεχόµενα; Εστω B ένα σύνολο Borel (δηλαδή ένα «ενδιαφέρον» υποσύνολο του R). Με την πραγµατοποίηση του τυχαίου πειράµατος η X ϑα πάρει τιµή στο B αν και µόνον αν το αποτέλεσµα (δειγµατοσηµείο) ω που ϑα προκύψει είναι τέτοιο ώστε X(ω) B. Προκειµένου λοιπόν να µπορούµε να υπολογίσουµε την πιθανότητα η X να πάρει τιµή στο (οποιοδήποτε) B ϑα πρέπει να µπορούµε να υπολογίσουµε την πιθανότητα του συνόλου που περιέχει τα δειγµατοσηµεία που στέλνουν την X στο B. Αλλά πιθανότητες ορίζονται µόνο για ενδεχόµενα.

Εστω X µία τυχαία µεταβλητή ορισµένη στον χώρο πιθανότητας (Ω,A, P). Θεωρούµε τη συνάρτηση P X : B(R) R που ορίζεται µέσω της σχέσης P X (B) = P(X B) P({ω Ω : X(ω) B}), B B(R). Είναι εύκολο να δειχθεί ότι η συνάρτηση P X είναι ένα µέτρο πιθανότητας (έχει τις τρεις ιδιότητες που συζητήθηκαν νωρίτερα) µε «δειγµατοχώρο» το R και σ- άλγεβρα την B(R). Αυτό το µέτρο πιθανότητας καλείται κατανοµή της τυχαίας µεταβλητής X. Η ορολογία που χρησιµοποιούµε για να δηλώσουµε ότι η τυχαία µεταβλητή X έχει κατανοµή P X είναι «η X ακολουθεί την κατανοµή P X» και γράφουµε συµβολικά X P X. (!) Βλέπουµε ότι µέσω της τυχαίας µεταβλητής X ορίζεται ένας νέος χώρος πιθανότητας, ο (R,B(R), P X ). (!) Συναρτήσεις που είναι τυχαίες µεταβλητές και εποµένως µπορεί να «µετρηθεί» η πιθανότητα να πάρουν τιµές στα υποσύνολα Borel του R λέγονται µετρήσιµες.

Το καλό νέο είναι ότι προκειµένου να καθορίσουµε την κατανοµή µίας τυχαίας µεταβλητής X δεν είναι απαραίτητο να γνωρίζουµε το µέτρο P X (B) κάθε υποσυνόλου Borel B του R αλλά µας αρκούν σύνολα της µορφής (,x]. Ορισµός. Η συνάρτηση F X : R R που ορίζεται από τη σχέση F X (x) = P(X x) = P(X (,x]) = P({ω Ω : X(ω) x}) για x R καλείται αθροιστική συνάρτηση κατανοµής της τυχαίας µεταβλητής X ή απλώς συνάρτηση κατανοµής της τυχαίας µεταβλητής X. (!) Από τον παραπάνω ορισµό να ϑυµάστε ότι F X (x) = P(X x), x R, αλλά έχετε στο πίσω µέρος του µυαλού σας ότι η ανισότητα X x παραπέµπει σε ένα υποσύνολο του Ω. Αφού η F X καθορίζει την κατανοµή της X, µπορούµε να γράφουµε X F X.

Μία συνάρτηση κατανοµής F έχει τρεις χαρακτηριστικές ιδιότητες: (α) Είναι αύξουσα συνάρτηση: Αν x < y τότε F(x) F(y). (ϐ) Είναι δεξιά συνεχής: lim x x0 F(x) = F(x 0 ), x 0 R. (!) x x 0 σηµαίνει «x τείνει στο x 0 ϕθίνοντας», δηλαδή από δεξιά. Γράφεται και ως x x + 0. (γ) Ισχύει lim F(x) = 0 και lim F(x) = 1. x x Μέσω της συνάρτησης κατανοµής µπορούµε να εκφράσουµε πιθανότητες η X να πάρει τιµή σε διάφορα «ενδιαφέροντα» υποσύνολα του R. P(X (,x]) P(X x) = F X (x) (εξ ορισµού) P(X (x, )) P(X > x) = 1 F X (x) P(X (α,β]) P(α < X β) = F X (β) F X (α) P(X (,x)) P(X < x) = lim y x F X (y) P(X [x, )) P(X x) = 1 lim y x F X (y) P(X {x}) P(X = x) = F X (x) lim y x F X (y) (!) Η F X δεν είναι απαραίτητα και αριστερά συνεχής, εποµένως µπορεί να ισχύει lim y x F X (y) F X (x).

Παράδειγµα (Ρίψη δύο Ϲαριών) Ω = {11, 12, 13, 14, 15, 16, Ας ϑεωρήσουµε την συνάρτηση X : Ω R 21, 22, 23, 24, 25, 26, που ορίζεται από τη σχέση 31, 32, 33, 34, 35, 36, X(ω) = πλήθος άσσων που περιέχονται στο ω 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, π.χ. X(11) = 2, X(12) = X(14) = X(51) = 1, 61, 62, 63, 64, 65, 66} X(23) = X(42) = X(55) = X(66) = 0 κλπ. Το πεδίο τιµών της X είναι το {0, 1, 2}. Η συνάρτηση κατανοµής της είναι η 0, αν x < 0, Εστω 25/36, αν 0 x < 1, A = το σύνολο των µαύρων ij F X (x) = 35/36, αν 1 x < 2, B = το σύνολο των µπλε ij 1, αν x 2. C = το σύνολο των κόκκινων ij Αν x < 0 τότε {ω Ω : X(ω) x} =. Εποµένως για x < 0 έχουµε F X (x) = P( ) = 0.

Παράδειγµα (Ρίψη δύο Ϲαριών) Ω = {11, 12, 13, 14, 15, 16, Ας ϑεωρήσουµε την συνάρτηση X : Ω R 21, 22, 23, 24, 25, 26, που ορίζεται από τη σχέση 31, 32, 33, 34, 35, 36, X(ω) = πλήθος άσσων που περιέχονται στο ω 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, π.χ. X(11) = 2, X(12) = X(14) = X(51) = 1, 61, 62, 63, 64, 65, 66} X(23) = X(42) = X(55) = X(66) = 0 κλπ. Το πεδίο τιµών της X είναι το {0, 1, 2}. Η συνάρτηση κατανοµής της είναι η 0, αν x < 0, Εστω 25/36, αν 0 x < 1, A = το σύνολο των µαύρων ij F X (x) = 35/36, αν 1 x < 2, B = το σύνολο των µπλε ij 1, αν x 2. C = το σύνολο των κόκκινων ij Αν 0 x < 1 τότε {ω Ω : X(ω) x} = A. Εποµένως για 0 x < 1 έχουµε F X (x) = P(A) = 25/36.

Παράδειγµα (Ρίψη δύο Ϲαριών) Ω = {11, 12, 13, 14, 15, 16, Ας ϑεωρήσουµε την συνάρτηση X : Ω R 21, 22, 23, 24, 25, 26, που ορίζεται από τη σχέση 31, 32, 33, 34, 35, 36, X(ω) = πλήθος άσσων που περιέχονται στο ω 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, π.χ. X(11) = 2, X(12) = X(14) = X(51) = 1, 61, 62, 63, 64, 65, 66} X(23) = X(42) = X(55) = X(66) = 0 κλπ. Το πεδίο τιµών της X είναι το {0, 1, 2}. Η συνάρτηση κατανοµής της είναι η 0, αν x < 0, Εστω 25/36, αν 0 x < 1, A = το σύνολο των µαύρων ij F X (x) = 35/36, αν 1 x < 2, B = το σύνολο των µπλε ij 1, αν x 2. C = το σύνολο των κόκκινων ij Αν 1 x < 2 τότε {ω Ω : X(ω) x} = A B. Εποµένως για 1 x < 2 έχουµε F X (x) = P(A B) = 35/36.

Παράδειγµα (Ρίψη δύο Ϲαριών) Ω = {11, 12, 13, 14, 15, 16, Ας ϑεωρήσουµε την συνάρτηση X : Ω R 21, 22, 23, 24, 25, 26, που ορίζεται από τη σχέση 31, 32, 33, 34, 35, 36, X(ω) = πλήθος άσσων που περιέχονται στο ω 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, π.χ. X(11) = 2, X(12) = X(14) = X(51) = 1, 61, 62, 63, 64, 65, 66} X(23) = X(42) = X(55) = X(66) = 0 κλπ. Το πεδίο τιµών της X είναι το {0, 1, 2}. Η συνάρτηση κατανοµής της είναι η 0, αν x < 0, Εστω 25/36, αν 0 x < 1, A = το σύνολο των µαύρων ij F X (x) = 35/36, αν 1 x < 2, B = το σύνολο των µπλε ij 1, αν x 2. C = το σύνολο των κόκκινων ij Αν x 2 τότε {ω Ω : X(ω) x} = A B C = Ω. Εποµένως για x 2 έχουµε F X (x) = P(Ω) = 1.

Παράδειγµα (Ρίψη δύο Ϲαριών) F X (x) = 0, αν x < 0, 25/36, αν 0 x < 1, 35/36, αν 1 x < 2, 1, αν x 2. 1 35/36 25/36 0 1 2 Σηµειώστε ότι η F X δεν είναι συνάρτηση κατανοµής µόνο της X. Π.χ., η τυχαία µεταβλητή Y : Ω R που ορίζεται µέσω της σχέσης Y (ω) = πλήθος πενταριών που περιέχει το ω έχει ακριβώς την ίδια συνάρτηση κατανοµής. (!) Το γεγονός ότι δύο (ή περισσότερες) τυχαίες µεταβλητές έχουν την ίδια κατανοµή δεν συνεπάγεται ότι αυτές είναι ίσες µεταξύ τους. ύο τυχαίες µεταβλητές που έχουν την ίδια κατανοµή λέγονται ισόνοµες.

Ενας πραγµατικός αριθµός x καλείται διάµεσος της κατανοµής της X (και της X) αν ισχύει P(X x) 1/2 και P(X x) 1/2. Γενικότερα, ένας πραγµατικός αριθµός x καλείται κάτω q-ποσοστιαίο σηµείο (ή q-ποσοστηµόριο) της κατανοµής της X (και της X) αν P(X x) q και P(X x) 1 q. Για q = 0.25 και q = 0.75 τα αντίστοιχα κάτω q-ποσοστιαία σηµεία λέγονται πρώτο και τρίτο τεταρτηµόριο αντίστοιχα. Το δεύτερο τεταρτηµόριο αντιστοιχεί στο q = 0.5 και συµπίπτει µε τη διάµεσο. Αντίστοιχα ορίζονται και τα άνω ποσοστιαία σηµεία µίας κατανοµής. Ανω q- ποσοστιαίο σηµείο της κατανοµής της X (και της X) είναι ένας πραγµατικός αριθµός x για τον οποίον ισχύει P(X x) 1 q και P(X x) q. (!) Τα άνω και τα κάτω ποσοστιαία σηµεία δεν είναι απαραιτήτως µοναδικά.

Παράδειγµα Αν X το πλήθος των άσσων στη ϱίψη δύο αµερόληπτων Ϲαριών τότε P(X x) = 0, αν x < 0, 25/36, αν 0 x < 1, 35/36, αν 1 x < 2, 1, αν x 2, και P(X x) = 1, αν x 0, 11/36, αν 0 < x 1, 1/36, αν 1 < x 2, 0, αν x > 2. Πρώτο τεταρτηµόριο και διάµεσος της κατανοµής είναι το 0 ενώ τρίτο τεταρτηµόριο είναι το 1. Αυτό προκύπτει από το ότι P(X 0) = 25/36 1/4 και P(X 0) = 1 3/4, P(X 0) = 25/36 1/2 και P(X 0) = 1 1/2, P(X 1) = 35/36 3/4 και P(X 1) = 11/36 1/4 και τα σηµεία αυτά είναι τα µοναδικά που ικανοποιούν τις απαιτούµενες ανισότητες. Επίσης, άνω 11/36-ποσοστιαίο σηµείο της κατανοµής είναι οποιοσδήποτε αριθµός x (0, 1) γιατί γι αυτούς ισχύει P(X x) = 25/36 1 11/36 και P(X x) = 11/36 11/36 ενώ άνω 10%-ποσοστιαίο σηµείο της κατανοµής είναι το 1 γιατί P(X 1) = 35/36 1 10/100 και P(X x) = 11/36 10/100 και είναι το µοναδικό σηµείο που ικανοποιεί αυτές τις ανισότητες.

ιακριτές τυχαίες µεταβλητές Μία τυχαία µεταβλητή λέµε ότι είναι διακριτή αν το πεδίο τιµών της είναι είτε πεπερασµένο είτε άπειρο αλλά αριθµήσιµο υποσύνολο του R. (!) Η τυχαία µεταβλητή που είδαµε στο προηγούµενο παράδειγµα ήταν διακριτή. Η κατανοµή µίας διακριτής τυχαίας µεταβλητής X καθορίζεται πλήρως και από την συνάρτηση µάζας πιθανότητας που ορίζεται ως f X (x) = P(X = x) = P({ω Ω : X(ω) = x}), x R. (!) Η συνάρτηση µάζας πιθανότητας αναφέρεται και απλώς ως συνάρτηση πιθανότητας. Αφού η f X καθορίζει την κατανοµή της X, µπορούµε να γράφουµε X f X. Εστω X το πεδίο τιµών της διακριτής τυχαίας µεταβλητής X. Τότε για τη συνάρτηση µάζας πιθανότητας f X της X ισχύουν οι ακόλουθες ιδιότητες: (α) f X (x) 0, x R (ϐ) x X f X (x) = 1. (!) Κάθε συνάρτηση f µε f(x) 0, x R, και x S f X(x) = 1 για κάποιο το πολύ αριθµήσιµο σύνολο S R, είναι συνάρτηση πιθανότητας κάποιας διακριτής τυχαίας µεταβλητής.

Η συνάρτηση µάζας πιθανότητας f X συνδέεται µε την αντίστοιχη συνάρτηση κατανοµής F X µέσω των ακόλουθων σχέσεων: F X (x) = y xf X (y), x R, και f X (x) = F X (x) lim y x F X (y) = P(X x) P(X < x), x R. Βλέπουµε δηλαδή ότι από την µία συνάρτηση µπορούµε να πάρουµε την άλλη. (Γι αυτό άλλωστε η συνάρτηση µάζας πιθανότητας καθορίζει πλήρως την κατανοµή της X όπως συµβαίνει και µε την συνάρτηση κατανοµής της.) Φυσικά, δύο διακριτές τυχαίες µεταβλητές µε την ίδια συνάρτηση µάζας πι- ϑανότητας έχουν την ίδια κατανοµή (είναι δηλαδή ισόνοµες). Υπενθυµίζω ότι αυτό δεν σηµαίνει πως οι δύο τυχαίες µεταβλητές είναι ίσες.

Εστω X διακριτή τυχαία µεταβλητή µε πεδίο τιµών X. Αν το άθροισµα x f X (x) x P(X = x) x X x X είναι πεπερασµένο τότε είναι πεπερασµένο και το άθροισµα x X xf X (x) x X xp(x = x). Σε αυτήν την περίπτωση το δεύτερο άθροισµα καλείται µέση τιµή της τυχαίας µεταβλητής X. Οι συνήθεις συµβολισµοί για την µέση τιµή της X είναι E(X), µ X ή, σε περίπτωση που δεν υπάρχει κίνδυνος σύγχυσης, απλώς µ. Η µέση τιµή εξαρτάται από την συνάρτηση µάζας πιθανότητας εποµένως είναι ένα µέγεθος που σχετίζεται µε την κατανοµή της τυχαίας µεταβλητής. Γι αυτό αναφερόµαστε σε αυτήν ως µέση τιµή της «τάδε» κατανοµής (αν αυτή έχει κάποιο όνοµα) ή ως µέση τιµή της κατανοµής µε συνάρτηση µάζας πιθανότητας f (ανεξάρτητα από το αν εκείνη τη στιγµή έχουµε ορίσει κάποια τυχαία µεταβλητή µε αυτήν την κατανοµή). Αλλοι όροι για την µέση τιµή είναι οι αναµενόµενη τιµή και µαθηµατική ελπίδα.

Παράδειγµα 1 Είδαµε ότι η συνάρτηση κατανοµής της τυχαίας µεταβλητής X που απαριθµεί τους άσσους που ϑα ϕέρουν τα δύο αµερόληπτα Ϲάρια ήταν F X (x) = 0, αν x < 0, 25/36, αν 0 x < 1, 35/36, αν 1 x < 2, 1, αν x 2. Η αντίστοιχη συνάρτηση µάζας πιθανότητας είναι f X (x) = Η µέση τιµή της είναι 25/36, x = 0, 10/36, x = 1 1/36, x = 2 0, διαφορετικά. 0 1 2 E(X) = (0)(25/36) + (1)(10/36) + (2)(1/36) = 12/36 (= 1/3)

Παράδειγµα 2 Εστω η κατανοµή µε συνάρτηση µάζας πιθανότητας f(x) = 3 π 2 x2, x = ±1, ±2,... 0, αλλού. 4 3 2 1 0 1 2 3 4 Επειδή η f δίνει ϑετικές τιµές µόνο στα σηµεία ±1, ±2,... καταλαβαίνουµε ότι µία τυχαία µεταβλητή µε την παραπάνω κατανοµή έχει πεδίο τιµών το σύνολο X = {..., 2, 1, 1, 2,...}. Η f είναι όντως συνάρτηση µάζας πιθανότητας αφού f(x) 0, x R, και x X Επειδή f(x) = 1 x= x f(x) = 3 π 2 x 2+ 1 x=1 x X x= η κατανοµή δεν έχει µέση τιµή. 3 π 2 x 2 = 6 π 2 x=1 1 x 2 = 1. 3 x π 2 x 2 + 3 x π 2 x 2 = 6 π 2 x=1 (!) Ισχύει x=1 n=1 1 x =, 1 n 2 = π2 6.

Θεωρώντας τις πιθανότητες που αντιστοιχίζονται στα διάφορα σηµεία ως µάζες που έχουν αυτά, η µέση τιµή είναι το κέντρο µάζας του συστήµατος: 1/2 µ 1/2 0 0.5 1 1/4 µ 3/4 0 0.75 1 3/4 µ 1/4 0 0.25 1 µ = (0)(0.5) + (1)(0.5) = 0.5 µ = (0)(0.25) + (1)(0.75) = 0.75 µ = (0)(0.75) + (1)(0.25) = 0.25 1/2 µ 1/2 x x 1 + x 2 1 x 2 2 3/8 µ 5/8 3x x 1 + 5x 2 1 x 2 8 4/5 µ 1/5 4x x 1 + x 2 1 x 2 5 2/10 5/10 3/10 x 1 x 2 x 3 µ = 2x 1 + 5x 2 + 3x 3 10 3/15 5/15 1/15 6/15 x 1 x 2 x 3 x 4 µ = 3x 1 + 5x 2 + x 3 + 6x 4 15 (!) Η µέση τιµή µίας τυχαίας µεταβλητής ϐρίσκεται πάντοτε µεταξύ του ελαχίστου και του µεγίστου του πεδίου τιµών της. Γενικά, δεν ανήκει στο πεδίο τιµών.

Εστω X µία διακριτή τυχαία µεταβλητή µε πεδίο τιµών X και συνάρτηση µάζας πιθανότητας f X. Αν για κάποια συνάρτηση g : X R ισχύει g(x) f X (x) < τότε το άθροισµα x X E{g(X)} := x X g(x)f X (x) είναι επίσης πεπερασµένο και καλείται µέση τιµή της g(x). Για οποιεσδήποτε σταθερές α,β R ισχύει E(αX + β) = αe(x) + β. (!) Γενικά δεν ισχύει E(g(X)) = g(e(x)). Η µοναδική περίπτωση που συµβαίνει αυτό είναι η παραπάνω, όταν δηλαδή g(x) = αx + β µε α,β R. Παίρνοντας α = 0 ϐλέπουµε ότι E(β) = β (η µέση τιµή σταθεράς είναι η ίδια η σταθερά) ενώ παίρνοντας β = 0 ϐλέπουµε ότι E(αX) = αe(x). Αν g(x) 0, x X, και g(x)f X (x) = τότε λέµε ότι E(g(X)) =. x X

Εστω k ένας ϑετικός ακέραιος. Ως k-οστή ϱοπή της τυχαίας µεταβλητής X (και της κατανοµής της) ορίζεται η E(X k ) = x X x k f X (x) εφ όσον ϕυσικά x X x k f X (x) <. (!) Η πρώτη ϱοπή της X είναι η µέση τιµή της. Αν υπάρχει και είναι πεπερασµένη η E(X k ) τότε το ίδιο συµβαίνει και για την E(X ν ) για κάθε ν < k. Π.χ., αν είναι πεπερασµένη η δεύτερη ϱοπή, E(X 2 ), τότε υπάρχει και είναι πεπερασµένη και η µέση τιµή E(X). (!) Αν το πεδίο τιµών µίας διακριτής τυχαίας µεταβλητής είναι µη πεπερασµένο, τότε οι ϱοπές της δεν καθορίζουν απαραίτητα την κατανοµή της. (!) Ειδικότερα, ένα πεπερασµένο πλήθος ϱοπών δεν χαρακτηρίζει σε καµµία περίπτωση µία κατανοµή. (!) Και να ϕανταστείτε ότι µερικοί το πιστεύουν αυτό για τη µέση τιµή!

Ως διακύµανση της X ορίζεται η ποσότητα E { (X E(X)) 2 } = x X(x E(X)) 2 f X (x). Συνήθεις συµβολισµοί για την διακύµανση της X είναι οι Var(X) και σ 2 X. Αν δεν υπάρχει κίνδυνος σύγχυσης συµβολίζεται και απλώς µε σ 2. Αναπτύσσοντας το τετράγωνο µπορούµε να δούµε ότι η διακύµανση µπορεί να υπολογισθεί και από τον τύπο Var(X) = E(X 2 ) (E(X)) 2. Από αυτόν ϐλέπουµε ότι είναι πεπερασµένη αν και µόνον αν E(X 2 ) <. Η διακύµανση είναι ένα µέτρο µεταβλητότητας της X (και της κατανοµής της). Είναι η µέση τιµή της τυχαίας µεταβλητής (X E(X)) 2 που είναι το τετράγωνο της απόκλισης της X από την µέση τιµή της E(X). Εποµένως η διακύµανση ισούται µε την µέση τετραγωνική απόκλιση της X από την µέση τιµή της. Για την διακύµανση χρησιµοποιείται και ο όρος διασπορά.

Παράδειγµα Είδαµε ότι η συνάρτηση µάζας πιθανότητας της τυχαίας µεταβλητής X που απαριθµεί τους άσσους που ϑα ϕέρουν τα δύο αµερόληπτα Ϲάρια είναι f X (x) = 25/36, x = 0, 10/36, x = 1 1/36, x = 2 0, διαφορετικά, και ότι έχει µέση τιµή E(X) = (0)(25/36) + (1)(10/36) + (2)(1/36) = 1/3. Η διακύµανση της X είναι Var(X) = x X(x E(X)) 2 f X (x) Επειδή η δεύτερη ϱοπή της X είναι = (0 1/3) 2 (25/36) + (1 1/3) 2 (10/36) + (2 1/3) 2 (1/36) = (1/9)(25/36) + (4/9)(10/36) + (25/9)(1/36) = 5/18. E(X 2 ) = x X x 2 f X (x) = 0 2 (25/36) + 1 2 (10/36) + 2 2 (1/36) = 7/18, η διακύµανσή της µπορεί να υπολογισθεί και από τον τύπο Var(X) = E(X 2 ) (E(X)) 2 = 7/18 (1/3) 2 = 5/18.

Για οποιεσδήποτε σταθερές α,β R ισχύει Var(αX + β) = α 2 Var(X). Παίρνοντας α = 0 ϐλέπουµε ότι Var(β) = 0 (η διακύµανση σταθεράς είναι πάντα µηδενική κάτι που είναι πολύ λογικό αφού µία σταθερά δεν έχει καθόλου µεταβλητότητα). Παίρνοντας α = 1 ϐλέπουµε ότι Var(X + β) = Var(X) πράγµα που σηµαίνει ότι η πρόσθεση µίας σταθεράς σε µία τυχαία µεταβλητή δεν αλλάζει την διακύµανσή της. Η (ϑετική) τετραγωνική ϱίζα της διακύµανσης καλείται τυπική απόκλιση. Οι µονάδες µέτρησης της τυπικής απόκλισης είναι ίδιες µε της τυχαίας µεταβλητής. Παράδειγµα. Η διακύµανση του πλήθους των άσσων που ϕέρνουν σε µία Ϲαριά τα δύο αµερόληπτα Ϲάρια είναι 5/18 άσσοι 2 (τετραγωνικοί άσσοι ) ενώ η τυπική του απόκλιση είναι 5/18 άσσοι. Ο συνήθης συµβολισµός για την τυπική απόκλιση της X είναι σ X ή απλώς σ εάν δεν υπάρχει κίνδυνος σύγχυσης.

Η κορυφή της κατανοµής µίας διακριτής τυχαίας µεταβλητής X (και της ίδιας της X) είναι η τιµή που µεγιστοποιεί την f X, δηλαδή η τιµή που παίρνει η X µε την µεγαλύτερη πιθανότητα. Η τιµή αυτή µπορεί να µην είναι µοναδική γιατί µπορεί να µεγιστοποιούν την πιθανότητα f X (x) = P(X = x) δύο ή και περισσότερες τιµές. Αν είναι µοναδική τότε η κατανοµή λέµε ότι είναι µονοκόρυφη, διαφορετικά λέµε ότι είναι πολυκόρυφη. Οι κεντρικές ϱοπές της X είναι οι ϱοπές της τυχαίας µεταβλητής X E(X). Η k-οστή κεντρική ϱοπή της X είναι η ποσότητα E{(X E(X)) k } = x X(x E(X)) k f X (x) και υπάρχει και είναι πεπερασµένη αν και µόνον αν υπάρχει και είναι πεπερασµένη η E(X k ). Η πρώτη κεντρική ϱοπή ισούται µε µηδέν αφού E(X E(X)) = E(X) E(X) (από την ιδιότητα E(X + β) = E(X) + β), ενώ η δεύτερη κεντρική ϱοπή E{(X E(X)) 2 } είναι η διακύµανση της X.

Η τυποποιηµένη εκδοχή της X είναι η τυχαία µεταβλητή Z = X E(X) Var(X). Ο παραπάνω µετασχηµατισµός της X, δηλαδή η αφαίρεση από αυτήν της µέσης τιµής της και η διαίρεση της διαφοράς µε την τυπική της απόκλιση, καλείται τυποποίηση της X. Αφού η X είναι διακριτή τυχαία µεταβλητή, η Z είναι επίσης µία διακριτή τυχαία µεταβλητή και ισχύει E(Z) = 0 και Var(Z) = E(Z 2 ) = 1. Οι επόµενες δύο ϱοπές της Z E(Z 3 ) = E{(X E(X))3 } {Var(X)} 3/2 και E(Z 4 ) = E{(X E(X))4 } {Var(X)} 2 καλούνται λοξότητα της X και κύρτωση της X (και της κατανοµής της). Η λοξότητα δείχνει αν η περισσότερη µάζα πιθανότητας συγκεντρώνεται πριν ή µετά τη µέση τιµή (αν είναι αρνητική ή ϑετική, αντίστοιχα) ενώ η κύρτωση σχετίζεται µε τις ουρές της κατανοµής (τις ακραίες τιµές της X): Οσο περισσότερη µάζα πιθανότητας «ξεφεύγει» προς τις ουρές τόσο µεγαλύτερη τιµή έχει.

Συνεχείς τυχαίες µεταβλητές Μία τυχαία µεταβλητή X : Ω R καλείται συνεχής αν ισχύει P(X = x) = 0, x R. (!) Αυτό δεν σηµαίνει ότι η X δεν παίρνει καµµία τιµή, σηµαίνει ότι η πιθανότητα να πάρει οποιαδήποτε συγκεκριµένη τιµή είναι µηδέν. Ο ορισµός συνεπάγεται ότι για συνεχείς τυχαίες µεταβλητές ισχύει P(α X β) = P(α < X < β) = F X (β) F X (α) δηλαδή η ύπαρξη ή µη του «ίσον» δεν επηρεάζει τις διάφορες πιθανότητες. Από τον ορισµό προκύπτει ότι το πεδίο τιµών µίας συνεχούς τυχαίας µεταβλητής είναι µη αριθµήσιµο: Πράγµατι, αν το πεδίο τιµών X της X ήταν αριθµήσιµο, αν δηλαδή µπορούσε να αναπαρασταθεί ως X = {x 1,x 2,...}, τότε ϑα είχαµε 1 = P(X X) = P(X = x) = P(X = x i ) = 0 + 0 + = 0. x X Στις τυπικές περιπτώσεις, το πεδίο τιµών συνεχών τυχαίων µεταβλητών είναι ένα διάστηµα (είτε πεπερασµένο είτε άπειρο) ή ένωση διαστηµάτων του R. i=1

Εάν υπάρχει συνάρτηση f : R R τέτοια ώστε η συνάρτηση κατανοµής της X να δίνεται από τη σχέση F X (x) = x f(y)dy, x R, (1) τότε λέµε ότι η X είναι µία απολύτως συνεχής τυχαία µεταβλητή και η κατανοµή της µία απολύτως συνεχής κατανοµή. Αν ισχύει η (1), τότε η συνάρτηση f καλείται συνάρτηση πυκνότητας πιθανότητας της X (και της κατανοµής της X). Η συνάρτηση πυκνότητας πιθανότητας λέγεται και απλά πυκνότητα πιθανότητας. Η πυκνότητα πιθανότητας δεν είναι µοναδική. Κάθε συνάρτηση που ικανοποιεί την (1) είναι µία εκδοχή της πυκνότητας πιθανότητας της κατανοµής της X. Εν τούτοις, αν f 1,f 2 είναι δύο διαφορετικές εκδοχές της πυκνότητας πιθανότητας της X τότε ισχύει P(f 1 (X) f 2 (X)) = 0, δηλαδή διαφορετικές εκδοχές της πυκνότητας πιθανότητας µίας απολύτως συνεχούς τυχαίας µεταβλητής διαφέρουν µόνο σε σύνολα µηδενικού µέτρου. (!) Η συνάρτηση κατανοµής όµως είναι µοναδική.

Στα x R που η F X είναι παραγωγίσιµη, µπορεί να ληφθεί ως πυκνότητα πιθανότητας η παράγωγος f X (x) = d dx F X(x). Οι πιο γνωστές απολύτως συνεχείς κατανοµές έχουν παραγωγίσιµη συνάρτηση κατανοµής και ως εκ τούτου η παράγωγός της ϑεωρείται ως η αντίστοιχη συνάρτηση πυκνότητας πιθανότητας. (!) Θα δούµε διαφορετικές εκδοχές πυκνότητας πιθανότητας σε ένα παράδειγµα αργότερα. Η πυκνότητα πιθανότητας f X µίας απολύτως συνεχούς τυχαίας µεταβλητής X ικανοποιεί (α) f X (x) 0, x R (ϐ) f X (x)dx = 1. (!) Κάθε συνάρτηση που ικανοποιεί τις δύο αυτές ιδιότητες είναι πυκνότητα πιθανότητας κάποιας απολύτως συνεχούς κατανοµής. Κάθε συνάρτηση κατανοµής είναι αύξουσα (δηλαδή µη ϕθίνουσα). Οµως στην περίπτωση των απολύτως συνεχών τυχαίων µεταβλητών αν η πυκνότητα πιθανότητας είναι αυστηρά ϑετική σε κάποιο ανοικτό διάστηµα γύρω από το x τότε η συνάρτηση κατανοµής είναι γνησίως αύξουσα σε αυτό το διάστηµα.

(!!!) Η πυκνότητα πιθανότητας δεν παριστάνει πιθανότητα. (!) Πολλοί ϕοιτητές συγχέουν την έννοια της πυκνότητας πιθανότητας µίας απολύτως συνεχούς τυχαίας µεταβλητής µε εκείνη της συνάρτησης µάζας πιθανότητας µίας διακριτής τυχαίας µεταβλητής. Οπως είδαµε, για µία διακριτή τυχαία µεταβλητή, η συνάρτηση µάζας πιθανότητας στο x R ισούται µε την πιθανότητα η τυχαία µεταβλητή να πάρει την τιµή x. Οµως, εξ ορισµού για µία απολύτως συνεχή τυχαία µεταβλητή X έχουµε f X (x) P(X = x) = 0, x R. Εν τούτοις, η πυκνότητα πιθανότητας στο x είναι κατά προσέγγιση ανάλογη της πιθανότητας η X να πάρει τιµή γύρω από το x αφού f X (x) = d dx F F X(x) = lim X (x + ǫ) F X (x ǫ) ǫ 0 2ǫ που σηµαίνει ότι για αρκετά µικρό ǫ έχουµε f X (x) F X(x + ǫ) F X (x ǫ) 2ǫ = 1 2ǫ P(x ǫ X x + ǫ). Από αυτό καταλαβαίνουµε ότι είναι πιθανότερο η τυχαία µεταβλητή να πάρει τιµή κοντά σε σηµεία µε µεγαλύτερη πυκνότητα πιθανότητας.

Η µέση τιµή, η διακύµανση, οι ϱοπές και άλλα µεγέθη που ορίσαµε για διακριτές κατανοµές ορίζονται και για απολύτως συνεχείς κατανοµές, µόνο που τα αθροίσµατα αντικαθίστανται από ολοκληρώµατα. Εστω f X η πυκνότητα πιθανότητας της κατανοµής της (απολύτως συνεχούς) τυχαίας µεταβλητής X µε πεδίο τιµών X. Αν το ολοκλήρωµα x f X (x)dx είναι πεπερασµένο, τότε η µέση τιµή της X (και της κατανοµής της) είναι η E(X) = xf X (x)dx. Γενικότερα, για µία συνάρτηση g : X R της X, αν g(x) f X (x)dx < τότε ως µέση τιµή της g(x) ορίζεται το ολοκλήρωµα E(g(X)) = g(x)f X (x)dx.

Εστω k ένας µη αρνητικός ακέραιος. Εφ όσον x k f X (x)dx < ως k-οστή ϱοπή της X (και της κατανοµής της) ορίζεται η E(X k ) = x k f X (x)dx ενώ ως k-οστή κεντρική ϱοπή της X (και της κατανοµής της) η E{(X E(X)) k } = (x E(X)) k f X (x)dx Ειδικότερα, η διακύµανση της X (και της κατανοµής της) είναι η Var(X) = E{(X E(X)) 2 } = (x E(X)) 2 f X (x)dx. Η διακύµανση µπορεί να υπολογισθεί και από τον τύπο E(X 2 ) (E(X)) 2. Ως τυπική απόκλιση της X (και της κατανοµής της) ορίζεται η ϑετική τετραγωνική ϱίζα της διακύµανσης, Var(X).

Η τυποποιηµένη εκδοχή της X είναι η τυχαία µεταβλητή Z = X E(X) Var(X). Αυτή έχει E(Z) = 0 και E(Z 2 ) = Var(X) = 1. Η τρίτη και η τέταρτη ϱοπή της Z καλούνται λοξότητα και κύρτωση της X (και της κατανοµής της). Ως κορυφές της κατανοµής της X ορίζονται τα τοπικά µέγιστα της «κλασσικής» πυκνότητας πιθανότητας της κατανοµής της. Αν υπάρχει µία µοναδική κορυφή τότε η κατανοµή λέγεται µονοκόρυφη διαφορετικά λέγεται πολυκόρυφη. Οι πυκνότητες πιθανότητας δύο µονοκόρυφων, µίας δικόρυφης και µίας τρικόρυφης κατανοµής.

Κυριότερες διακριτές κατανοµές Θα συζητήσουµε τις πιο συνηθισµένες στις εφαρµογές διακριτές κατανοµές: ιωνυµική κατανοµή Γεωµετρική κατανοµή Αρνητική διωνυµική κατανοµή Υπεργεωµετρική κατανοµή Κατανοµή Poisson ιακριτή οµοιόµορφη κατανοµή Φυσικά, οι διακριτές κατανοµές δεν περιορίζονται στις παραπάνω. Αν πάρετε οποιοδήποτε το πολύ αριθµήσιµο σύνολο S και ϑεωρήσετε µία συνάρτηση f µε f(x) 0, x R και f(x) = 1 τότε έχετε ορίσει µία διακριτή x S κατανοµή µε συνάρτηση µάζας πιθανότητας f.

ιωνυµική κατανοµή Ενα τυχαίο πείραµα µε δύο δυνατά αποτελέσµατα καλείται πείραµα Bernoulli. Σε ένα τέτοιο πείραµα επιλέγουµε αυθαίρετα το ένα από τα δύο αποτελέσµατα και το ονοµάζουµε επιτυχία (Ε) ενώ το άλλο το ονοµάζουµε αποτυχία (Α). Ας υποθέσουµε ότι πραγµατοποιούµε n 1 ανεξάρτητα πειράµατα Bernoulli που το κάθε ένα έχει πιθανότητα επιτυχίας p (0, 1). Το πλήθος των επιτυχιών σε αυτά τα n πειράµατα είναι µία διακριτή τυχαία µεταβλητή η κατανοµή της οποίας καλείται διωνυµική µε παραµέτρους n και p. Προφανώς, το πεδίο τιµών µίας τέτοιας τυχαίας µεταβλητής είναι το σύνολο {0, 1,...,n}. Ο κλασσικός συµβολισµός αυτής της κατανοµής είναι B(n,p). (!) B είναι το αρχικό της λέξης binomial = διωνυµικός, -ή, -ό. (!) Γράφοντας Y B(n, p) εννοούµε ότι η τυχαία µεταβλητή Y ακολουθεί την διωνυµική κατάνοµή µε παραµέτρους n και p. (!) Συχνά η πιθανότητα αποτυχίας 1 p των πειραµάτων Bernoulli συµβολίζεται µε q. (!) Οταν n = 1, όταν δηλαδή έχουµε ένα µόνο πείραµα, η κατανοµή ονοµάζεται Bernoulli.

Ο δειγµατοχώρος του τυχαίου πειράµατος που αποτελείται από τα n πειράµατα Bernoulli περίεχει ως δειγµατοσηµεία n-άδες αποτελούµενες από Ε και Α. Π.χ., για n = 5 µερικά δειγµατοσηµεία είναι τα ΕΕΕΕΕ, ΕΑΕΕΑ, ΑΕΑΑΑ, ΑΑΑΕΕ κλπ. Λόγω της ανεξαρτησίας των πειραµάτων, κάθε δειγµατοσηµείο έχει πιθανότητα εµφάνισης p πλήθος Ε (1 p) πλήθος Α. Επειδή σε µία n-άδα αποτελούµενη από Ε και Α µπορεί να έχουµε ακριβώς k το πλήθος Ε µε ( n k ) διαφορετικούς τρόπους, η πιθανότητα να παρατηρήσουµε ακριβώς k επιτυχίες στα n πειράµατα είναι ( ) n p k (1 p) n k, για k = 0, 1,...,n. k Εποµένως η συνάρτηση πιθανότητας της διωνυµικής κατανοµής B(n,p) είναι f(x) = ( ) n x p x (1 p) n x, x = 0, 1,...,n, 0, αλλού.

Το ότι η f είναι συνάρτηση µάζας πιθανότητας προκύπτει από το ιωνυµικό Θεώρηµα (α + β) n = n ( nk ) k=0 α k β n k. Εφαρµόζοντάς το παίρνουµε n n ( ) n f(x) = p x (1 p) n x = (p + 1 p) n = 1 n = 1. x x=1 n 1 x=0 x=0 Αν X B(n,p) τότε E(X) = np. Πράγµατι, n n ( ) n xf X (x) = x p x (1 p) n x = x x=0 x=0 n n! n = x x!(n x)! px (1 p) n x = = y=0 x=1 n(n 1)! y!(n 1 y)! py+1 (1 p) n 1 y = np n ( ) n x p x (1 p) n x x x=1 n! (x 1)!(n x)! px (1 p) n x n 1 y=0 ( n 1 y ) p y (1 p) n 1 y = np. (!) Το τελευταίο άθροισµα ισούται µε 1. Προσπαθήστε να δείξετε µόνοι σας ότι E(X 2 ) = np(1 p) + n 2 p 2. Από αυτό ϑα πάρετε ότι αν X B(n,p) τότε Var(X) = np(1 p).

.59.31.31.40.40 0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5 B(5, 0.5), µ = 2.5 B(5, 0.75), µ = 3.75 B(5, 0.25), µ = 1.25 B(5, 0.1), µ = 0.5.39.25.28.28 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 B(10, 0.5), µ = 5 B(10, 0.75), µ = 7.5 B(10, 0.25), µ = 2.5 B(10, 0.1), µ = 1.29.18.20.20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 B(20, 0.5), µ = 10 B(20, 0.75), µ = 15 B(20, 0.25), µ = 5 B(20, 0.1), µ = 2

Γεωµετρική κατανοµή Υποθέστε ότι επαναλαµβάνουµε ανεξάρτητα πειράµατα Bernoulli που έχουν πιθανότητα επιτυχίας p (0, 1). Το πλήθος των πειραµάτων που απαιτούνται µέχρι να παρατηρηθεί η πρώτη επιτυχία είναι µία διακριτή τυχαία µεταβλητή η κατανοµή της οποίας καλείται γεωµετρική µε παράµετρο p. Το πεδίο τιµών µίας τέτοιας τυχαίας µεταβλητής είναι το σύνολο {1, 2,...}. Ενας συµβολισµός της γεωµετρικής κατανοµής είναι Ge(p). (!) Ge είναι τα δύο πρώτα γράµµατα της λέξης geometric. (!) Γράφοντας Y Ge(p) εννοούµε ότι η τυχαία µεταβλητή Y ακολουθεί την γεωµετρική κατάνοµή µε παράµετρο (πιθανότητα επιτυχίας) p. (!) Εναλλακτικά, ως γεωµετρική κατανοµή ορίζουµε την κατανοµή της τυχαίας µεταβλητής που απαριθµεί το πλήθος των αποτυχιών που προηγούνται της πρώτης επιτυχίας. Αυτός ο ορισµός είναι ϐολικότερος σε αρκετές στατιστικές εφαρµογές. Η διαφορά είναι µικρή σε σχέση µε τον παραπάνω ορισµό: απλώς δεν µετράµε το τελευταίο πείραµα (την επιτυχία).

Ο δειγµατοχώρος του τυχαίου πειράµατος είναι το σύνολο Ω = {Ε, ΑΕ, ΑΑΕ, ΑΑΑΕ, ΑΑΑΑΕ,...}. Λόγω της ανεξαρτησίας των πειραµάτων, το δειγµατοσηµείο που περιέχει k 1 Α έχει πιθανότητα εµφάνισης (1 p) k 1 p για k = 1, 2,... Εποµένως, η συνάρτηση πιθανότητας της γεωµετρικής κατανοµής Ge(p) είναι f(x) = p(1 p) x 1, x = 1, 2,..., 0, αλλού. Το ότι είναι συνάρτηση µάζας πιθανότητας προκύπτει από τη γεωµετρική σειρά (το άθροισµα άπειρων όρων µίας γεωµετρικής προόδου µε πρώτο όρο 1 και λόγο λ όπου λ < 1), k=0 λ k = 1/(1 λ). Πράγµατι έχουµε f(x) = p(1 p) x 1 = p (1 p) y 1 = p 1 (1 p) = 1. x=1 x=1 y=0

Αν X Ge(p) τότε E(X) = 1/p. Πράγµατι, αν παραγωγίσουµε την γεωµετρική σειρά και το αποτέλεσµά της ως προς τον λόγο λ παίρνουµε και d dλ k=0 λ k = d ( 1 + dλ ) λ k = k=1 d 1 dλ1 λ = 1 (1 λ) 2, αντίστοιχα, εποµένως k=1 kλ k 1 = 1/(1 λ) 2. k=1 kλ k 1 (!) Αλλαγή σειράς παραγώγισης και άθροισης επιτρέπεται σε συγκλίνουσες δυναµοσειρές. Οπότε, xf X (x) = x=1 xp(1 p) x 1 = p x=1 x(1 p) x 1 = x=1 p {1 (1 p)} 2 = 1 p. Παραγωγίζοντας και δεύτερη ϕορά τη δυναµοσειρά (και κάνοντας µετά ό,τι χρειάζεται) ϑα ϐρείτε ότι E(X 2 ) = (2 p)/p 2. Από εκεί ϑα πάρετε ότι αν X Ge(p) τότε Var(X) = (1 p)/p 2.

Μία ενδιαφέρουσα ιδιότητα της γεωµετρικής κατανοµής είναι η έλλειψη µνήµης ή αµνήµων ιδιότητα: Αν X Ge(p) τότε P(X > x + y X > x) = P(X > y), δηλαδή δοθέντος του ότι έχουν γίνει πάνω από x πειράµατα χωρίς να έχει έρθει η επιτυχία, η πιθανότητα να έρθει η επιτυχία σε περισσότερα από y επί πλέον πειράµατα ισούται µε την πιθανότητα να έρθει η επιτυχία σε περισσότερα από y πειράµατα όταν ξεκινάµε από την αρχή: Η X «ξεχνάει» τα x πρώτα αποτυχηµένα πειράµατα. Για να το διαπιστώσουµε αυτό παρατηρούµε ότι για x = 1, 2,... έχουµε P(X > x) = f X (k) = p(1 p) k 1 = p(1 p) k+x 1 k=x+1 k=x+1 = (1 p) x p(1 p) k 1 = (1 p) x k=1 και εποµένως για x,y = 1, 2,... παίρνουµε P(X > x + y X > x) = P(X > x + y, X > x) P(X > x) = k=1 P(X > x + y) P(X > x) = (1 p)x+y (1 p) x = (1 p) y που είναι η P(X > y). (!) Η δεύτερη ισότητα προκύπτει από το ότι {X > x + y, X > x} = {X > x + y}. (!) Η έλλειψη µνήµης χαρακτηρίζει την γεωµετρική κατανοµή µεταξύ των κατανοµών µε τιµές στους ϑετικούς ακεραίους.

Αρνητική διωνυµική κατανοµή Υποθέστε ότι επαναλαµβάνουµε ανεξάρτητα πειράµατα Bernoulli που έχουν πιθανότητα επιτυχίας p (0, 1). Το πλήθος των πειραµάτων που απαιτούνται µέχρι να παρατηρηθεί η m-οστή επιτυχία είναι µία διακριτή τυχαία µεταβλητή η κατανοµή της οποίας καλείται αρνητική διωνυµική µε παραµέτρους m και p. Το πεδίο τιµών µίας τέτοιας τυχαίας µεταβλητής είναι το σύνολο {m,m + 1,m + 2,...}. Ενας συµβολισµός της αρνητικής διωνυµικής κατανοµής είναι N B(m,p). (!) N B είναι τα αρχικά των λέξεων negative binomial. (!) Γράφοντας Y N B(m, p) εννοούµε ότι η τυχαία µεταβλητή Y ακολουθεί την αρνητική διωνυµική κατάνοµή µε παραµέρους m και p. (!) Για m = 1 η αρνητική διωνυµική κατανοµή συµπίπτει µε την γεωµετρική κατανοµή. (Αν m = 1 τότε µετράµε το πλήθος των πειραµάτων µέχρι να δούµε την πρώτη επιτυχία που είναι ο ορισµός της γεωµετρικής τυχαίας µεταβλητής.)

Ο δειγµατοχώρος του τυχαίου πειράµατος είναι το σύνολο των πεπερασµένων ακολουθιών µήκους m που αποτελούνται από m Ε και οσαδήποτε Α έτσι ώστε όµως να υπάρχει στην τελευταία ϑέση Ε. Π.χ., για m = 3 µερικά δειγµατοσηµεία είναι τα ΕΕΕ, ΑΕΑΕΕ, ΕΑΑΑΑΕΕ, ΕΕΑΕ, ΑΕΑΑΑΕΑΕ κλπ. Λόγω της ανεξαρτησίας των πειραµάτων, ένα δειγµατοσηµείο µήκους k έχει πιθανότητα εµφάνισης (1 p) k m p m για k = m,m + 1,..., µια και περιέχει m Ε και k m Α. Επειδή υπάρχουν ( k 1 m 1) τρόποι µε τους οποίους µπορούν να ϐρεθούν τα m 1 Ε στις k 1 πρώτες ϑέσεις, η πιθανότητα να κάνουµε k πειράµατα µέχρι να παρατηρηθεί η m-οστή επιτυχία είναι ( ) k 1 p m (1 p) k m, για k = m,m + 1,... m 1 Εποµένως, η συνάρτηση πιθανότητας της αρνητικής διωνυµικής κατανοµής N B(m,p) είναι f(x) = ( ) x 1 p m (1 p) x m, x = m,m + 1,..., m 1 0, αλλού.

Αν X N B(m,p) τότε E(X) = m/p και Var(X) = m(1 p)/p 2. Εναλλακτικά, ως αρνητική διωνυµική κατανοµή ορίζουµε την κατανοµή της τυχαίας µεταβλητής Y που απαριθµεί το πλήθος των αποτυχιών που προηγούνται της m-οστής επιτυχίας. Η συνάρτηση µάζας πιθανότητας αυτής της κατανοµής είναι f Y (x) = P(Y = x) = ( m + x 1 m 1 ) p m (1 p) x, x = 0, 1, 2,..., 0, αλλού. Η Y συνδέεται µε την X που ακολουθεί την αρνητική διωνυµική κατανοµή που ορίσαµε νωρίτερα µέσω της σχέσης Y = X m (αφού µε την Y δεν µετράµε τις m επιτυχίες), εποµένως ισχύει P(Y = x) = P(X = x + m). Η αρνητική διωνυµική κατανοµή γενικεύεται και στην περίπτωση µη ακέραιου m (χωρίς όµως πια να έχει τη ϕυσική ερµηνεία καταµέτρησης πειραµάτων). Η γενίκευση αυτή είναι πιο χρήσιµη στις στατιστικές εφαρµογές.

Υπεργεωµετρική κατανοµή Υποθέτουµε ότι έχουµε α αντικείµενα τύπου Α και β αντικείµενα τύπου Β. Από το σύνολο τωνα+β αντικειµένων επιλέγουµε στην τύχη n όπου 1 n < α+β. Η κατανοµή της τυχαίας µεταβλητής που απαριθµεί το πλήθος των αντικειµένων τύπου Α που περιέχονται στα n που επιλέξαµε είναι µία διακριτή κατανοµή που καλείται υπεργεωµετρική. Το πεδίο τιµών µίας τέτοιας τυχαίας µεταβλητής είναι το σύνολο των ακεραίων από max{0,n β} µέχρι min{α,n}. (!) Αν n > β τότε ο ελάχιστος αριθµός αντικειµένων τύπου Α που µπορεί να περιέχονται στα n είναι n β και όχι 0 γιατί τότε µηδέν δεν γίνεται να παρατηρήσουµε αφού ακόµη κι αν πάρουµε όλα τα τύπου Β ϑα µένουν ακόµη n β ϑέσεις κενές. Αντίστοιχα προκύπτει το ότι η µέγιστη δυνατή τιµή είναι η min{α, n}. Ενας συµβολισµός της υπεργεωµετρικής κατανοµής είναι HG(n,α,β). (!) HG από τη λέξη hypergeometric. Τα δυνατά αποτελέσµατα αυτού του τυχαίου πειράµατος είναι n-άδες που αποτελούνται από Α και Β, όπως και αυτά της διωνυµικής κατανοµής. Τώρα όµως τα n επί µέρους πειράµατα δεν είναι ανεξάρτητα: Η πιθανότητα το πρώτο αντικείµενο να είναι τύπου Α ισούται µε α/(α+β) αλλά η πιθανότητα το δεύτερο αντικείµενο να είναι τύπου Α εξαρτάται από το τι ήταν το πρώτο κ.ο.κ.

Μία n-άδα που κατασκευάζεται χωρίς επανατοποθετήσεις µπορεί να περιέχει k ( α)( β αντικείµενα τύπου Α µε k n k) διαφορετικούς τρόπους. Τα α + β ( α+β) αντικείµενα µπορούν να ϕτιάξουν n n-άδες, άρα η πιθανότητα µία τυχαία επιλεγµένη n-άδα να περιέχει k αντικείµενα τύπου Α είναι ( αk )( β n k ( α+β n ) ), για k = max{0,n β},...,min{n,α}. Εποµένως η συνάρτηση πιθανότητας της υπεργεωµετρικής κατανοµής HG(n,α,β) είναι ( αx )( β ) n x ( f(x) = α+β ), x = max{0,n β},...,min{n,α}, n 0, αλλού. Αν X HG(n,α,β) τότε E(X) = nα α+β και Var(X) = nαβ(α+β n) (α+β) 2 (α+β 1). (!) Αν p = α/(α + β) το ποσοστό των αντικειµένων τύπου Α, τότε E(X) = np και Var(X) = np(1 p) ( 1 n 1 α+β 1). (Συγκρίνετε µε την µέση τιµή και τη διασπορά της διωνυµικής.)

Κατανοµή Poisson Μία τυχαία µεταβλητή X ακολουθεί την κατανοµή Poisson µε παράµετρο λ > 0 αν έχει συνάρτηση µάζας πιθανότητας f X (x) P(X = x) = e λ λx, x = 0, 1, 2,..., x! 0, αλλού. Η κατανοµή Poisson χρησιµοποιείται για να περιγράψει απαρίθµηση εµφανίσεων ενός όχι εξαιρετικά συχνού ϕαινοµένου στη µονάδα του χρόνου. (!) Το ποια είναι κάθε ϕορά η µονάδα του χρόνου εξαρτάται από το πρόβληµα. Ο κλασσικός συµβολισµός για την κατανοµή Poisson είναι P(λ). (!) Το µαθηµατικό µοντέλο που γεννάει την κατανοµή Poisson είναι η στοχαστική διαδικασία Poisson. Επειδή είναι δύσκολο να περιγραφεί µε λίγα λόγια, προτιµούµε σε ένα εισαγωγικό µάθηµα Πιθανοτήτων να ορίζουµε την κατανοµή µέσω της συνάρτησης πιθανότητας. (!) Εκτός από απαριθµήσεις ϕαινοµένων στη µονάδα του χρόνου µπορεί να απαριθµούµε ϕαινόµενα στη µονάδα µήκους ή εµβαδού ή χώρου. Και σε αυτές περιπτώσεις ενδέχεται να µπορεί να χρησιµοποιηθεί ως µοντέλο η κατανοµή Poisson.

Το ότι η f X είναι συνάρτηση πιθανότητας προκύπτει από την εκθετική σειρά k=0 λ k k! = eλ. Αν X P(λ) τότε E(X) = λ. Πράγµατι, xf X (x) = xe λλx x! = e λ x=0 x=0 = e λ y=0 λ y+1 y! x=1 = λe λ x λx x! = e λ y=0 x=1 λ x (x 1)! λ y y! = λe λ e λ = λ. Μπορείτε να δείξετε µόνοι σας ότι E(X 2 ) = λ 2 + λ. Από αυτό παίρνουµε ότι Var(X) = λ. (!) Βλέπουµε ότι η µέση τιµή και η διακύµανση της κατανοµής Poisson είναι ίσες µεταξύ τους. Αν και αυτό δεν χαρακτηρίζει την κατανοµή (υπάρχουν άπειρες κατανοµές µε αυτήν την ιδιότητα), είναι αρκετά ενδιαφέρουσα ιδιότητα. Αν υποψιαζόµαστε ότι µία διακριτή κατανοµή που δίνει ϑετική πιθανότητα στους µη αρνητικούς ακεραίους έχει τη µέση τιµή ίση µε τη διακύµανση, τότε ενδεχοµένως να της ταιριάζει το µοντέλο της Poisson.

Μία ενδιαφέρουσα σύνδεση της διωνυµικής κατανοµής και της κατανοµής Poisson είναι η ακόλουθη. Εστω X B(n,p n ). (Εδώ η πιθανότητα επιτυχίας είναι συνάρτηση του n.) Αν lim n np n = λ > 0 τότε lim n P(X = x) = e λλx, x = 0, 1, 2,..., x! δηλαδή οι πιθανότητες της διωνυµικής κατανοµής συγκλίνουν σε αυτές της Poisson. Η απόδειξη του ορίου ϐασίζεται στην προσέγγιση Stirling του παραγοντικού, k! 2πk(k/e) k καθώς k. (!) Η προσέγγιση προκύπτει από το ότι lim k k!/{ 2πk(k/e) k } = 1. Βασιζόµενοι σε αυτό παίρνουµε ότι για µεγάλο n, n! x!(n x)! px n(1 p n ) n x ( n ) 1/2(npn ) x n x x! 2πn(n/e) n 2π(n x)[(n x)/e] n x px n(1 p n ) n x = ( e x 1 + x np ) n x n 1 λx n x x! e x e x λ = e λλx x!.

ιακριτή οµοιόµορφη κατανοµή Εστω X = {x 1,...,x n }, n 2, ένα πεπερασµένο σύνολο. Η τυχαία µεταβλητή X που παίρνει κάθε µία από τις τιµές x 1,...,x n µε πιθανότητα 1/n λέµε ότι ακολουθεί την διακριτή οµοιόµορφη κατανοµή στο σύνολο X. Η συνάρτηση µάζας πιθανότητας αυτής της κατανοµής είναι (προφανώς) Η κατανοµή έχει µέση τιµή και διακύµανση f X (x) = P(X = x) = E(X) = x X Var(X) = x X xf X (x) = 1 n 1/n, x X, 0, διαφορετικά. n x i = x i=1 (x E(X)) 2 f X (x) = 1 n n (x i x) 2. i=1