Y = X 1 + X X N = X i. i=1

Σχετικά έγγραφα
X i = Y = X 1 + X X N.

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

f(y) dy = b a dy = b a x f(x) dx = b a dx = x 2 = b2 a 2 2(b a) b a dx = = (a2 + ab + b 2 )(b a) 3(b a)

x P (x) c P (x) = c P (x), x S : x c

Λύσεις 4ης Ομάδας Ασκήσεων

#(A B) = (#A)(#B). = 2 6 = 1/3,

Θεωρία Πιθανοτήτων, εαρινό εξάμηνο Λύσεις του πέμπτου φυλλαδίου ασκήσεων.. Δηλαδή:

B A B A A 1 A 2 A N = A i, i=1. i=1

ΗΥ-217-ΠΙΘΑΝΟΤΗΤΕΣ-ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2016 ΔΙΔΑΣΚΩΝ: ΠΑΝΑΓΙΩΤΗΣ ΤΣΑΚΑΛΙΔΗΣ

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

2πσ 2 e (x µ)2 /2σ 2 dx = 1. (13.1) e x2 dx. e y2 dy, I = 2. e (y2 +z 2) dy dz.

σ 1 < σ 2 < σ 3 σ 1 σ 2 σ 3

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B)

200, δηλαδή : 1 p Y (y) = 0, αλλού

Περιεχόμενα 2ης Διάλεξης 1 Σύνοψη προηγούμενου μαθήματος 2 Αξιωματικός ορισμός και απαρίθμηση 3 Διατάξεις - Συνδυασμοί 4 Παραδείγματα υπολογισμού πιθα

Pr (a X b, c Y d) = c. f XY (x, y) dx dy, (15.1) Pr ((X, Y ) R) = f XY (x, y) dx dy. (15.2)

Λύσεις 1ης Ομάδας Ασκήσεων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

> ln 1 + ln ln n = ln(1 2 3 n) = ln(n!).

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων


Τυχαία μεταβλητή (τ.μ.)

Απειροσ τικός Λογισμός ΙΙ Πρόχειρες Σημειώσεις Τμήμα Μαθηματικών Πανεπιστήμιο Αθηνών

Λύσεις 2ης Ομάδας Ασκήσεων

Εισαγωγή Η Θεωρία Πιθανοτήτων παίζει μεγάλο ρόλο στη μοντελοποίηση και μελέτη συστημάτων των οποίων δεν μπορούμε να προβλέψουμε ή να παρατηρήσουμε την

Γνωστό: P (M) = 2 M = τρόποι επιλογής υποσυνόλου του M. Π.χ. M = {A, B, C} π. 1. Π.χ.

Θεωρία Πιθανοτήτων, εαρινό εξάμηνο Λύσεις του φυλλαδίου ασκήσεων επανάληψης. P (B) P (A B) = 3/4.

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών

f(t) = (1 t)a + tb. f(n) =

ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Ι Φεβρουάριος 2018 Σειρά Α Θέματα 3 ως 7 και αναλυτικές (ή σύντομες) απαντήσεις

Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών. ΗΥ-217: Πιθανότητες-Χειµερινό Εξάµηνο ιδάσκων : Π. Τσακαλίδης

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση

ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ» - 6/2/2014 Διάρκεια Εξέτασης: 2 ώρες και 50 λεπτά Ομάδα Α

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Κεφάλαιο 12. Σειρές Ορισμός και Παραδείγματα Ορισμός

Υπολογιστικά & Διακριτά Μαθηματικά

(a + b) + c = a + (b + c), (ab)c = a(bc) a + b = b + a, ab = ba. a(b + c) = ab + ac

36 = Pr(B) = Pr(Γ E) = Pr(Γ) Pr(E) = = Pr(B) = Pr(B Γ) Pr(B) Pr(Γ) = 1 6. Pr(A B) = Pr(A) Pr(B).

Περιεχόμενα 3ης Διάλεξης 1 Σύνοψη Προηγούμενου Μαθήματος 2 Δεσμευμένη Πιθανότητα 3 Bayes Theorem 4 Στοχαστική Ανεξαρτησία 5 Αμοιβαία (ή πλήρης) Ανεξαρ

Θέμα: ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΙΣ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΚΕΦΑΛΑΙΟ 7 ΒΙΒΛΙΟ KELLER

Ονοματεπώνυμο: Ερώτημα: Σύνολο Μονάδες: Βαθμός:

Θεωρητικές Κατανομές Πιθανότητας

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες

4. Απαγορεύεται η χρήση υπολογιστή χειρός. Απαγορεύεται η χρήση κινητού, και ως υπολογιστή χειρός.

Περιεχόμενα 3ης Διάλεξης 1 Σύνοψη Προηγούμενου Μαθήματος 2 Δεσμευμένη Πιθανότητα 3 Bayes Theorem 4 Στοχαστική Ανεξαρτησία 5 Αμοιβαία (ή πλήρης) Ανεξαρ

Αριθμητική Ανάλυση και Εφαρμογές

Πεπερασμένες Διαφορές.

P (M = 9) = e 9! =

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014

h(x, y) = card ({ 1 i n : x i y i

X = = 81 9 = 9

f(x) = lim f n (t) = d(t, x n ) d(t, x) = f(t)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Φυσικής Σημειώσεις Ανάλυσης Ι (ανανεωμένο στις 5 Δεκεμβρίου 2012)

Στατιστική Ι. Ενότητα 5: Θεωρητικές Κατανομές Πιθανότητας. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

lim y < inf B + ε = x = +. f(x) =

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

1 Σύντομη επανάληψη βασικών εννοιών

Γιατί πιθανότητες; Γιατί πιθανότητες; Θεωρία πιθανοτήτων. Θεωρία Πιθανοτήτων. ΗΥ118, Διακριτά Μαθηματικά Άνοιξη 2017.

Θέμα: ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΚΕΦΑΛΑΙΟ 7 KELLER

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Η διακριτή συνάρτηση μάζας πιθανότητας δίνεται από την

p(x, y) = 1 (x + y) = 3x + 6, x = 1, 2 (x + y) = 3 + 2y, y = 1, 2, 3 p(1, 1) = = 2 21 p X (1) p Y (1) = = 5 49

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Στοχαστικές Στρατηγικές

07/11/2016. Στατιστική Ι. 6 η Διάλεξη (Βασικές διακριτές κατανομές)

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

Περιεχόμενα 5ης Διάλεξης 1 Ανισότητα Markov 2 Διασπορά 3 Συνδιασπορά 4 Ανισότητα Chebyshev 5 Παραδείγματα Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής 5

Dunamoseirèc A. N. Giannakìpouloc, Tm ma Statistik c OPA

ΑΝΑΛΥΣΗ 2. Μ. Παπαδημητράκης.

P(n, r) = n r. (n r)! n r. n+r 1

Πιθανότητες και Αρχές Στατιστικής (5η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος

Τυχαίες μεταβλητές και μέση τιμή

ΑΝΑΛΥΣΗ 2. Μ. Παπαδημητράκης.

Εισαγωγή Ορισμός Frequency moments

Θεωρία Πιθανοτήτων, εαρινό εξάμηνο Λύσεις του όγδοου φυλλαδίου ασκήσεων.

B = {x A : f(x) = 1}.

Μάθημα 3 ο a. Τυχαία Μεταβλητή-Έννοιες και Ορισμοί

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 6 η Ημερομηνία Αποστολής στο Φοιτητή: 23 Απριλίου 2012

Λύσεις Εξετάσεων Φεβρουαρίου Ακ. Έτους

Έντυπο Yποβολής Αξιολόγησης ΓΕ

P(n, r) = n! P(n, r) = n r. (n r)! n r. n+r 1 r n!

ΚΕΦΑΛΑΙΟ 3: Συνθήκες Αλυσίδων

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ. Έννοια Ορισμοί Τρόπος υπολογισμού Kατανομή πιθανότητας Ασκήσεις

d k 10 k + d k 1 10 k d d = k i=0 d i 10 i.

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

ΑΝΑΛΥΣΗ 1 ΔΩΔΕΚΑΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

EE728 (22Α004) - Προχωρημένα Θέματα Θεωρίας Πληροφορίας 3η σειρά ασκήσεων Διακριτά και Συνεχή Κανάλια. Παράδοση: Έως 22/6/2015

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

sin(5x 2 ) sin(4x) e 5t 2 1 (ii) lim x 0 10x 3 (iii) lim (iv) lim. 10t sin(ax) = 1. = 1 1 a lim = sin(5x2 ) = 2. f (x) = sin x. = e5t 1 = 1 0 = 0.

Ασκήσεις3 Διαγωνισιμότητα Βασικά σημεία Διαγωνίσιμοι πίνακες: o Ορισμός και παραδείγματα.

Transcript:

Κεφάλαιο 7 Διακριτές κατανομές Στο προηγούμενο κεφάλαιο είδαμε πως η έννοια της τυχαίας μεταβλητής Τ.Μ., δηλαδή μιας τυχαίας ποσότητας X που προσδιορίζεται από το σύνολο τιμών της S και την πυκνότητά της P, μας επιτρέπει να περιγράφουμε προβλήματα που μας ενδιαφέρουν με πιο σύντομο και σαφή τρόπο, χωρίς να αναγκαζόμαστε κάθε φορά να ορίζουμε σχολαστικά τον πλήρη χώρο πιθανότητας Ω και το αντίστοιχο μέτρο πιθανότητας P. Το επόμενο βήμα σε αυτήν τη διαδικασία της πιο αφαιρετικής περιγραφής, είναι η καταγραφή κάποιων σημαντικών τύπων τυχαίων μεταβλητών, ιδιαίτερα χρήσιμων στην πράξη, οι οποίοι εμφανίζονται συχνά σε βασικά προβλήματα των πιθανοτήτων. Σ αυτό το κεφάλαιο θα εντοπίσουμε πέντε τέτοιες κατηγορίες τυχαίων μεταβλητών και θα δείξουμε με παραδείγματα κάποιες από τις συνήθεις περιπτώσεις όπου χρησιμοποιούνται. Επιπλέον θα αποδείξουμε ορισμένες ιδιότητές τους π.χ., θα υπολογίσουμε τη μέση τιμή και τη διασπορά τους, έτσι ώστε να μπορούμε να τις χρησιμοποιούμε χωρίς να απαιτείται η επανάληψη των ίδιων υπολογισμών σε κάθε επιμέρους πρόβλημα. 7.1 Κατανομές Bernoulli, διωνυμική και γεωμετρική Η πιο απλή τυχαία μεταβλητή είναι εκείνη που παίρνει μόνο δύο τιμές, οι οποίες, στην απλούστερη περίπτωση είναι το «0» και το «1»: Ορισμός 7.1 Μια διακριτή Τ.Μ. X λέμε πως έχει κατανομή Bernoulli με παράμετρο p, για κάποιο p 0, 1, αν έχει σύνολο τιμών το S = {0, 1} και πυκνότητα P με τιμές P 1 = p και P 0 = 1 p. Για συντομία, αυτό συμβολίζεται: X Bernp. Παρατηρήσεις 1. Ο πιο πάνω ορισμός απλά λέει πως μια Τ.Μ. X έχει κατανομή Bernoulli όταν παίρνει μόνο τις τιμές 0 και 1, και η παράμετρος p της κατανομής είναι η πιθανότητα το X να ισούται με 1, δηλαδή p = PrX = 1 = P 1. 85

86 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ 2. Οι πιο συχνές χρήσεις τυχαίων μεταβλητών με κατανομή Bernoulli είναι είτε για την περιγραφή δυαδικών δεδομένων bits, είτε ως «δείκτες» που προσδιορίζουν αν κάποιο σημαντικό γεγονός έχει συμβεί ή όχι. Για παράδειγμα, μια Τ.Μ. X μπορεί να παίρνει την τιμή 1 αν κάποιο σύστημα παρουσιάζει σφάλμα, αν ο αλγόριθμός μας εκτελέστηκε κανονικά, αν μια κλήση σε ένα δίκτυο τηλεφωνίας ολοκληρώθηκε, αν κάποιος ασθενής θεραπεύτηκε, αν μια άλλη Τ.Μ. Y πάρει τιμή Y y κ.ο.κ., και στην αντίθετη περίπτωση να παίρνει την τιμή 0. Σε αρκετά παραδείγματα του προηγούμενου κεφαλαίου, π.χ, είδαμε τέτοιες Τ.Μ. να περιγράφουν τα αποτελέσματα διαδοχικών ρίψεων ενός νομίσματος. Στις Ασκήσεις 2 και 3 στο τέλος του κεφαλαίου θα δούμε κάποιες απλές ιδιότητες για τέτοιες δείκτριες, όπως συχνά ονομάζονται, τυχαίες μεταβλητές. 3. Οπως δείξαμε στο Παράδειγμα 6.7 του προηγούμενου κεφαλαίου, μια Τ.Μ. X Bernp έχει μέση τιμή µ = EX = p και διασπορά σ 2 = VarX = p1 p. Η συνάρτηση κατανομής F x της X υπολογίστηκε στο Παράδειγμα 6.4, 0, αν x < 0, F x = 1 p, αν 0 x < 1, 1, αν x 1. και η γραφική της αναπαράσταση δίνεται στο Σχήμα 6.1. 4. Αν και ο αυστηρός ορισμός που δώσαμε πιο πάνω περιορίζει τις δυνατές τιμές της παραμέτρου p στο διάστημα 0, 1, θα μπορούσαμε να επιτρέψουμε και τις ακραίες τιμές p = 0 και p = 1. Σε αυτές τις τετριμμένες περιπτώσεις, προφανώς η X είναι απλά μια σταθερά: X = 0 με πιθανότητα 1 όταν p = 0, και X = 1 με πιθανότητα 1 όταν p = 1. Παράδειγμα 7.1 Εστω πως στρίβουμε N φορές ένα νόμισμα με PrΚορώνα = p, για κάποιο p 0, 1. Οπως στο Παράδειγμα 6.4, μπορούμε να περιγράψουμε τα αποτελέσματα των διαδοχικών ρίψεων ορίζοντας N ανεξάρτητες Τ.Μ. X 1, X 2,..., X N, όπου η κάθε X i Bernp και X i = 1 αν φέραμε Κ τη φορά i, ενώ X i = 0 αν φέραμε Γ. Οπως στο Παράδειγμα 6.3, παρατηρούμε πως το πλήθος των φορών που φέραμε Κορώνα στις N ρίψεις, έστω Y, μπορεί να εκφραστεί ως: Y = X 1 + X 2 + + X N = N X i. i=1 Η Τ.Μ. Y έχει σύνολο τιμών S Y = {0, 1,..., N}. Για να υπολογίσουμε την πυκνότητά της, εξετάζουμε το χώρο πιθανότητας Ω του πειράματος, ο οποίος αποτελείται από στοιχεία της μορφής, ω = ΓKK K,

7.1. ΚΑΤΑΝΟΜ ΕΣ BERNOULLI, ΔΙΩΝΥΜΙΚ Η ΚΑΙ ΓΕΩΜΕΤΡΙΚ Η 87 που περιγράφουν τα αποτελέσματα των N ρίψεων. Π.χ., το πιο πάνω ω περιγράφει το αποτέλεσμα όπου φέραμε Γ την πρώτη φορά και Κ τις επόμενες N 1 φορές. Εφόσον το νόμισμα δεν είναι απαραίτητα δίκαιο δηλαδή δεν μας δίνεται ότι p = 1/2, δεν μπορούμε να θεωρήσουμε ότι όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα. Για τον υπολογισμό των τιμών της πυκνότητας P k = PrY = k της Y θα χρησιμοποιήσουμε το γεγονός ότι οι διαδοχικές ρίψεις δηλαδή οι Τ.Μ. X i είναι ανεξάρτητες. Οπως έχουμε ήδη παρατηρήσει, για να ορίσουμε ένα μέτρο πιθανότητας P σε έναν πεπερασμένο χώρο πιθανότητας Ω, αρκεί να ορίσουμε το P{ω} για κάθε στοιχειώδες ενδεχόμενο {ω}. Για παράδειγμα, για το στοιχειώδες ενδεχόμενο που αντιστοιχεί στο ω = ΓKK K όπως πιο πάνω, έχουμε, P{ω} = Pr{ΓKK K} = PrX 1 = 0, X 2 = 1, X 3 = 1,..., X N = 1 = PrX 1 = 0 PrX 2 = 1 PrX 3 = 1 PrX N = 1 = p1 p1 p 1 p = p1 p N 1, όπου στο τρίτο βήμα χρησιμοποιήσαμε την ανεξαρτησία των X i. Παρομοίως, έστω A k το υποσύνολο του Ω που αποτελείται από όλα τα ω Ω που περιέχουν k φορές Κ και N k φορές Γ. Τότε έχουμε, με το ίδιο σκεπτικό όπως πριν, P{ω} = p k 1 p N k, για κάθε ω A k, και αυτό ισχύει για κάθε δυνατή τιμή του k = 0, 1,..., N. Εχοντας τώρα ορίσει το μέτρο πιθανότητας για όλα τα στοιχειώδη ενδεχόμενα, υπολογίζουμε την πυκνότητα της Y ως εξής. Για k = 0, 1,..., N, P k = PrY = k = Pr{όλα τα ω με k φορές Κ και N k φορές Γ} = PrA k = Pr ω A k {ω}, και αφού τα στοιχειώδη ενδεχόμενα είναι πάντα ξένα μεταξύ τους, και P{ω} = p k 1 p N k για κάθε ω A k, P k = Pr{ω} = #A k p k 1 p N k. ω A k Τέλος, παρατηρούμε ότι, από τον κανόνα αρίθμησης #4, υπάρχουν N k τρόποι να διατάξουμε k Κορώνες και N k Γράμματα, άρα #A k = N k και συνεπώς: N P k = PrY = k = p k 1 p N k, για κάθε k S Y = {0, 1,..., K}. k

88 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Ορισμός 7.2 Μια διακριτή Τ.Μ. Y λέμε πως έχει διωνυμική κατανομή με παραμέτρους N και p, για κάποια N 1 και p 0, 1, αν έχει σύνολο τιμών το S = {0, 1,..., N} και πυκνότητα: N P k = PrY = k = p k 1 p N k, για κάθε k S = {0, 1,..., N}. k Για συντομία, αυτό συμβολίζεται: Y ΔιωνN, p. Παρατηρήσεις 1. Μια Τ.Μ. Y με διωνυμική κατανομή με παραμέτρους N και p, περιγράφει το πλήθος των «επιτυχιών» σε N διαδοχικά, ανεξάρτητα, όμοια πειράματα, όπου σε κάθε πείραμα η πιθανότητα επιτυχίας ισούται με p. Εδώ, βέβαια, «επιτυχία» θεωρείται το γεγονός που μας ενδιαφέρει στο εκάστοτε πρόβλημα π.χ. το να φέρουμε Κ με κάποιο νόμισμα, την εμφάνιση σφάλματος σε κάποιο σύστημα, την ορθή εκτέλεση ενός αλγόριθμου κλπ. 2. Οπως είδαμε στο Παράδειγμα 7.1, μια Τ.Μ. Y ΔιωνN, p μπορεί πάντα να εκφραστεί ως το άθροισμα Y = X 1 + X 2 + + X N, N ανεξάρτητων Τ.Μ. X i Bernp. Συνεπώς, χρησιμοποιώντας την Ιδιότητα 1 του Θεωρήματος 6.1, το Y έχει μέση τιμή, N µ = EY = E X i = i=1 N EX i, i=1 και, αφού κάθε Bernoulli Τ.Μ. X i με παράμετρο p έχει μέση τιμή EX i = p, έχουμε, µ = EY = Np. Παρομοίως, εφόσον τα X i είναι ανεξάρτητα μπορούμε να εφαρμόσουμε την Ιδιότητα 4 του Θεωρήματος 6.1, σε συνδυασμό με το γεγονός ότι κάθε X i έχει VarX i = p1 p, για να υπολογίσουμε τη διασπορά του Y ως, N σ 2 = VarY = Var X i = i=1 N VarX i = Np1 p. i=1 3. Οταν το N = 1, προφανώς η Y = X 1 είναι απλά μια Τ.Μ. με κατανομή Bernp. Και όπως στην περίπτωση της κατανομής Bernoulli, αν το p πάρει μία από τις δύο ακραίες τιμές p = 0 ή 1, τότε με πιθανότητα 1 έχουμε Y = 0 ή Y = N, αντίστοιχα. Μία από τις πιο συνηθισμένες περιπτώσεις χρήσης της διωνυμικής κατανομής είναι σε προβλήματα «επιλογών με επανατοποθέτηση» όπως το ακόλουθο.

7.1. ΚΑΤΑΝΟΜ ΕΣ BERNOULLI, ΔΙΩΝΥΜΙΚ Η ΚΑΙ ΓΕΩΜΕΤΡΙΚ Η 89 Παράδειγμα 7.2 Ενα mailbox περιέχει M μηνύματα email, εκ των οποίων τα k έχουν κάποιο ιό. Από τα M μηνύματα επιλέγουμε M/3 με επανατοποθέτηση. Εστω X το τυχαίο πλήθος των μηνυμάτων από αυτά που επιλέξαμε τα οποία έχουν τον ιό. Εδώ η X εκφράζει το πλήθος των «επιτυχιών» όπου επιτυχία εδώ θεωρούμε την επιλογή ενός μηνύματος με τον ιό ανάμεσα σε N = M/3 διαδοχικά πειράματα, τα οποία είναι εξ ορισμού ανεξάρτητα, και το καθένα έχει πιθανότητα επιτυχίας ίση με p = k/m. Άρα η X Διων M 3, k M. Μπορούμε λοιπόν να κάνουμε μερικούς απλούς υπολογισμούς. Ποια είναι η πιθανότητα να κολλήσουμε τον ιό από τα επιλεγμένα μηνύματα; Είναι η πιθανότητα να έχουμε επιλέξει τουλάχιστον ένα «μολυσμένο» μήνυμα, δηλαδή να έχουμε X 1, M/3 PrX 1 = 1 PrX = 0 = 1 P 0 = 1 0 = 1 1 k M/3, M k M 0 1 k M όπου χρησιμοποιήσαμε τον τύπο της πυκνότητας μιας διωνυμικής Τ.Μ. Παρομοίως, εφαρμόζοντας τον αντίστοιχο τύπο για τη μέση τιμή έχουμε, «μέσο πλήθος μηνυμάτων με ιό σε αυτά που επιλέξαμε» = EX = M 3 k M = k 3, το οποίο παρατηρούμε πως δεν εξαρτάται από το συνολικό πλήθος M των μηνυμάτων. Τέλος, αν έχουμε k = 4 μολυσμένα μηνύματα ανάμεσα σε M = 120, τότε, με N = 120/3 = 40 και p = 4/120 = 1/30, η πιθανότητα να έχουμε επιλέξει το πολύ δύο που να έχουν τον ιό είναι, PrX 2 = P 0 + P 1 + P 2 40 = p 0 1 p 40 + 0 40 1 p 1 1 p 39 + N 40 p 2 1 p 38 0.852. 2 Παράδειγμα 7.3 Οπως στο Παράδειγμα 6.4, στρίβουμε ένα νόμισμα με PrΚορώνα = p για κάποιο p 0, 1, σε συνεχόμενες, ανεξάρτητες ρίψεις, και για κάθε i = 1, 2,..., ορίζουμε τις ανεξάρτητες Τ.Μ., { 1, αν φέραμε Κ τη φορά i, X i = 0, αν φέραμε Γ τη φορά i, όπου η κάθε X i Bernp. Εστω Z η πρώτη χρονική στιγμή που φέρνουμε Κ, δηλαδή το μικρότερο i 1 τέτοιο ώστε X i = 1. Στο Παράδειγμα 6.4 είδαμε πως η Z έχει σύνολο τιμών το S Z = N = {1, 2,...} και πυκνότητα P m = 1 p m 1 p, για κάθε ακέραιο m 1. Ορισμός 7.3 Μια διακριτή Τ.Μ. Z λέμε πως έχει γεωμετρική κατανομή με παράμετρο p, για κάποιο p 0, 1, αν έχει σύνολο τιμών το S = N = {1, 2,...} και πυκνότητα: P k = PrZ = k = 1 p k 1 p, για κάθε k S = {1, 2,...}. Για συντομία, αυτό συμβολίζεται: Z Γεωμp.

90 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Παρατήρηση: Μια Τ.Μ. Z με γεωμετρική κατανομή με παράμετρο p, περιγράφει τη χρονική στιγμή της πρώτης επιτυχίας σε μια σειρά από διαδοχικά, ανεξάρτητα, όμοια πειράματα, όπου σε κάθε πείραμα η πιθανότητα επιτυχίας ισούται με p. Αν τα αποτελέσματα των πειραμάτων περιγράφονται από μια σειρά ανεξάρτητων τυχαίων μεταβλητών X i Bernp όπου X i = 1 αν έχουμε επιτυχία τη φορά i, τότε η Z μπορεί να εκφραστεί ως: Z = min{i 1 : X i = 1}. Παράδειγμα 7.4 Κάθε πακέτο δεδομένων που περνάει από έναν συγκεκριμένο κόμβο κάποιου δικτύου, «χάνεται» με πιθανότητα p = 0.01%, ανεξάρτητα από την τύχη των υπόλοιπων πακέτων. Εστω X το πρώτο πακέτο που χάνεται ή, πιο σχολαστικά, ο αύξων αριθμός του πρώτου πακέτου που χάνεται, έτσι ώστε X Γεωμp. Για να διευκολυνθούμε στον παρακάτω υπολογισμό, ορίζουμε τις ανεξάρτητες Τ.Μ. W 1, W 2,..., όπου κάθε W i Bernp περιγράφει αν το πακέτο i χάθηκε W i = 1 ή όχι W i = 0. Ποια είναι η πιθανότητα το πρώτο πακέτο που χάθηκε να είναι μετά τα 10,000 πρώτα; Χρησιμοποιώντας την ανεξαρτησία των W i : PrX > 10000 = PrW i = 0 για κάθε i = 1, 2,..., 10000 = PrW 1 = 0 PrW 2 = 0 PrW 10000 = 0 = 1 p 10000 = 0.9999 10000 0.3679. Θεώρημα 7.1 Ιδιότητες της γεωμετρικής κατανομής Εστω X Γεωμp. Η X έχει τις εξής ιδιότητες: 1. Ουρά: Για κάθε ακέραιο m 1: PrX > m = 1 p m. 2. Συνάρτηση κατανομής: F x = 0 για x < 1 και: F x = 1 1 p x, για x 1. 3. Ιδιότητα έλλειψης μνήμης: Για κάθε ζευγάρι ακεραίων m, n 1: PrX m + n X > n = PrX m. Δηλαδή, η πιθανότητα PrX m + n X > n είναι ανεξάρτητη του n, και ίση με εκείνη που αντιστοιχεί στο n = 0, δηλαδή, PrX m. 4. Μέση τιμή: EX = 1 p. 5. Διασπορά: VarX = 1 p p 2.

7.1. ΚΑΤΑΝΟΜ ΕΣ BERNOULLI, ΔΙΩΝΥΜΙΚ Η ΚΑΙ ΓΕΩΜΕΤΡΙΚ Η 91 Απόδειξη: Οπως στο Παράδειγμα 7.4, ορίζουμε τις ανεξάρτητες Τ.Μ. W i Bernp και θέτουμε το X ίσο με το μικρότερο i 1 τέτοιο ώστε W i = 1. Για την πρώτη ιδιότητα, παρατηρούμε πως το X είναι μεγαλύτερο από m αν και μόνο αν τα πρώτα m από τα W i είναι όλα ίσα με 0, οπότε, PrX > m = PrW 1 = 0, W 2 = 0,..., W m = 0 = PrW 1 = 0 PrW 2 = 0 PrW m = 0 = 1 p m. Η συνάρτηση κατανομής, ακριβώς όπως στην Ιδιότητα 2, έχει ήδη υπολογιστεί στο Παράδειγμα 6.4. Για την Ιδιότητα 3, χρησιμοποιούμε τον ορισμό της δεσμευμένης πιθανότητας σε συνδυασμό με την Ιδιότητα 1: PrX m + n X > n = = = = PrX m + n και X > n PrX > n PrX m + n PrX > n PrX > m + n 1 PrX > n 1 pm+n 1 1 p n = 1 p m 1 = PrX > m 1 = PrX m. Για τον υπολογισμό της μέσης τιμής θα χρησιμοποιήσουμε τον τύπο για την έκφραση μιας σειράς που σχετίζεται με μια άπειρη γεωμετρική πρόοδο. Λεπτομέρειες δίνονται στην Ενότητα 7.3. Συγκεκριμένα, εφαρμόζοντας τον τύπο 7.8 με x = 1 p, βρίσκουμε: EX = = kp k = k=1 p 1 p 1 p [1 1 p] 2 = 1 p. k1 p k 1 p = p 1 p k1 p k Παρομοίως, εφαρμόζοντας τον τύπο 7.9 με x = 1 p, βρίσκουμε, EX 2 = = k 2 P k = k=1 k 2 1 p k 1 p = p 1 p1 p + 1 1 p [1 1 p] 3 = 2 p p 2, p 1 p k 2 1 p k

92 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ και, τέλος, υπολογίζουμε, VarX = EX 2 [EX] 2 = 2 p p 2 1 p 2 = 1 p p 2, η οποία μας δίνει τη διασπορά της X, ολοκληρώνοντας την απόδειξη. Παράδειγμα 7.5 Ενας φάκελος αρχείων σε κάποιο PC περιέχει 100 αρχεία, εκ των οποίων τα 70 είναι αρχεία pdf και τα 30 είναι mp3. Επιλέγουμε 3 στην τύχη με επανατοποθέτηση. Παρατηρούμε πως το πλήθος X των αρχείων pdf που επιλέξαμε έχει κατανομή X Διων3, 70/100. Συνεπώς, η πιθανότητα να επιλέξαμε τουλάχιστον 2 αρχεία pdf είναι, PrX 2 = 1 PrX < 2 = 1 P 0 P 1 3 3 = 1 0.7 0 0.3 3 0.7 1 0.3 2 0 1 0.784. Παρομοίως, το μέσο πλήθος αρχείων pdf που επιλέξαμε είναι, EX = 3 70 100 = 2.1. Τέλος, αν συνεχίζαμε να επιλέγουμε αρχεία πάλι με επανατοποθέτηση μέχρι την πρώτη φορά που θα είχαμε ένα pdf, τότε το συνολικό πλήθος, έστω Z, των επιλεγμένων αρχείων θα είχε κατανομή Z Γεωμ70/100, και βάσει της παραπάνω ιδιότητας έλλειψης μνήμης θα μπορούσαμε να υπολογίσουμε, Prθα επιλέξουμε τουλάχιστον 2 ακόμα επιλέξαμε ήδη 3 = PrZ 3 + 2 Z > 3 όπου χρησιμοποιήσαμε και την πρώτη ιδιότητα του Θεωρήματος 7.1. Κλείνουμε αυτή την ενότητα με ένα διάσημο παράδειγμα. = PrZ 2 = PrZ > 1 = 1 70 100 = 0.3, Παράδειγμα 7.6 Το πρόβλημα γενεθλίων Ας υποθέσουμε πως βρίσκομαι σε ένα δωμάτιο μαζί με άλλα 29 άτομα. Ποια είναι η πιθανότητα κάποιος άλλος να έχει γενέθλια την ίδια μέρα με εμένα; 1

7.1. ΚΑΤΑΝΟΜ ΕΣ BERNOULLI, ΔΙΩΝΥΜΙΚ Η ΚΑΙ ΓΕΩΜΕΤΡΙΚ Η 93 Εστω n = 29 Τ.Μ. X i, όπου X i = 1 αν το άτομο i έχει τα ίδια γενέθλια με εμένα, αλλιώς X i = 0, για κάθε i = 1, 2,..., 29 θεωρώντας ότι εγώ είμαι ο τριακοστός. Υποθέτουμε πως τα X i είναι ανεξάρτητες Τ.Μ., προφανώς με κατανομή Bernoulli, και με παράμετρο, Άρα, p = Prο άνθρωπος i έχει τα ίδια γενέθλια με εμένα = 1 365. Prυπάρχει κάποιος με τα ίδια γενέθλια = 1 Prκανείς με τα ίδια γενέθλια = 1 PrX 1 = 0, X 2 = 0,..., X n = 0 = 1 PrX 1 = 0 PrX 2 = 0 PrX n = 0 = 1 1 p n 364 29 = 1 365 0.076 = 7.6%. Ας εξετάσουμε τώρα μια απλή παραλλαγή αυτού του προβλήματος ρωτώντας ποια είναι η πιθανότητα, ανάμεσα στα 30 άτομα, να υπάρχουν τουλάχιστον δύο που θα έχουνε γενέθλια την ίδια μέρα; Αν υποθέσουμε και πάλι πως τα γενέθλια των διαφορετικών ατόμων είναι ανεξάρτητα μεταξύ τους και πως η κάθε ημερομηνία έχει την ίδια πιθανότητα, δηλαδή 1/365, βρίσκουμε πως, Prυπάρχουν τουλάχιστον 2 με ίδια γενέθλια = 1 Prόλοι μεταξύ τους έχουν διαφορετικά γενέθλια = 1 Pr {ο 2ος διαφορετικά από τον 1ο} {ο 3ος διαφορετικά από τους δύο πρώτους} {ο 30ος διαφορετικά από τους 29 πρώτους} = 1 364 365 363 365 336 365 0.7 = 70%. Δηλαδή, με μόλις 30 άτομα σε ένα δωμάτιο, το πιθανότερο είναι να υπάρχουν τουλάχιστον δύο με τα ίδια γενέθλια! Δοκιμάστε το την επόμενη φορά που θα βρεθείτε με μια αρκετά μεγάλη παρέα, είναι μια καλή ευκαιρία να κερδίσετε ένα γενναίο στοίχημα. Παρατήρηση: Το πρώτο ερώτημα του πιο πάνω παραδείγματος θα μπορούσαμε να το σκεφτούμε σαν ένα πρόβλημα επιλογής με επανατοποθέτηση: Βάζουμε τις 365 μέρες του χρόνου σε μια σακούλα, επιλέγουμε μία από τις 365 για τα γενέθλια του πρώτου ατόμου, μετά επιλέγουμε μία ημερομηνία για τον δεύτερο πάλι από όλες τις 365 κ.ο.κ.

94 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Αντίθετα, ο υπολογισμός βάσει του οποίου απαντήθηκε το δεύτερο ερώτημα θυμίζει επιλογή χωρίς επανατοποθέτηση: Επιλέγουμε μία από τις 365 ημέρες του χρόνου για τα γενέθλια του πρώτου ατόμου, κατόπιν επιλέγουμε μία από τις υπόλοιπες 364 για τον δεύτερο, μετά μία από τις 363 που απομένουν για τον τρίτο, κλπ. Οπως αναφέραμε πιο πάνω, στα προβλήματα επιλογής με επανατοποθέτηση συχνά μας είναι χρήσιμη η διωνυμική κατανομή. Στην επόμενη ενότητα θα δούμε την αντίστοιχη κατανομή την υπεργεωμετρική η οποία προκύπτει σε προβλήματα επιλογής χωρίς επανατοποθέτηση. 7.2 Υπεργεωμετρική και Poisson κατανομή Παράδειγμα 7.7 Ξεκινάμε εξετάζοντας μια γενική μορφή του προβλήματος των τυχαίων επιλογών χωρίς επανατοποθέτηση. Εστω πως, { τα k είναι τύπου Ι, από N αντικείμενα όπου τα N k είναι τύπου ΙΙ, επιλέγουμε τυχαία n, χωρίς επανατοποθέτηση. [Υποθέτουμε ότι N k n.] Εστω η Τ.Μ., Y = «πλήθος αντικειμένων τύπου Ι ανάμεσα σε αυτά που επιλέξαμε», η οποία περιγράφει την ποσότητα που μας ενδιαφέρει εδώ. Η Y έχει, εξ ορισμού, σύνολο τιμών το S = {0, 1,..., n}, και η πυκνότητά της είναι εύκολο να υπολογιστεί: Για οποιοδήποτε m = 0, 1,..., n, η P m = PrY = m είναι η πιθανότητα του ενδεχομένου «επιλέξαμε m αντικείμενα τύπου Ι και n m τύπου ΙΙ». Από τους κανόνες αρίθμησης του Κεφαλαίου 4 σε συνδυασμό με τον κανόνα πιθανότητας #5 έχουμε, k N k P m = m n m N. n Ορισμός 7.4 Μια διακριτή Τ.Μ. Y λέμε πως έχει υπεργεωμετρική κατανομή με παραμέτρους N, k και n, για ακεραίους n k N, αν έχει σύνολο τιμών το S = {0, 1,..., n} και πυκνότητα: k N k P m = PrY = m = m n m N, για κάθε m S = {0, 1, 2,..., n}. n Για συντομία, αυτό συμβολίζεται: Y ΥπερN, k, n. Παράδειγμα 7.8 Εστω πως επιλέγουμε τυχαία τρία φύλλα από μια συνηθισμένη τράπουλα. Ποια είναι η πιθανότητα να επιλέξαμε ακριβώς μία φιγούρα;

7.2. ΥΠΕΡΓΕΩΜΕΤΡΙΚ Η ΚΑΙ POISSON ΚΑΤΑΝΟΜ Η 95 Αν ορίσουμε την Τ.Μ. X ως το πλήθος από φιγούρες που επιλέξαμε, τότε αφού η τράπουλα περιέχει 12 φιγούρες η X έχει κατανομή Υπερ52, 12, 3 και η ζητούμενη πιθανότητα ισούται με, 12 52 12 1 3 1 PrX = 1 = P 1 = 52 0.4235. 3 Παρατήρηση: Αν στο Παράδειγμα 7.7 επιλέγαμε τυχαία n αντικείμενα με επανατοποθέτηση, τότε η Y θα είχε κατανομή Διωνn, k/n αλλά, εφόσον εδώ δεν έχουμε επανατοποθέτηση, η Y έχει κατανομή ΥπερN, k, n. Ακολουθώντας κάποια από τα ίδια βήματα της μεθοδολογίας με την οποία εξετάσαμε ορισμένες από τις ιδιότητες της διωνυμικής κατανομής, μπορούμε να ορίσουμε κι εδώ n τυχαίες μεταβλητές Bernoulli, οι οποίες να εκφράζουν τα αποτελέσματα των διαδοχικών επιλογών: Εστω, για κάθε i = 1, 2,..., n: { 1 αν στην επιλογή i έχουμε αντικ. τύπου Ι, X i = 0 αν στην επιλογή i έχουμε αντικ. τύπου ΙΙ. Τότε, όπως και στην περίπτωση της διωνυμικής κατανομής, η Y μπορεί να εκφραστεί, Y = n X i. i=1 Κατ αρχάς παρατηρούμε πως, σε αντίθεση με την περίπτωση της διωνυμικής κατανομής, οι Τ.Μ. X i δεν είναι ανεξάρτητες. Για παράδειγμα, εύκολα υπολογίζουμε πως, PrX 2 = 1 X 1 = 0 = k N 1, ενώ PrX 2 = 1 X 1 = 1 = k 1 N 1. 7.1 Από την άλλη μεριά, λόγω της συμμετρίας του προβλήματος, όλες οι Bernoulli Τ.Μ. X i έχουν την ίδια παράμετρο. Ενας τρόπος για να πεισθούμε γι αυτό είναι να σκεφτούμε πως, αντί να επιλέξουμε n αντικείμενα χωρίς επανατοποθέτηση το ένα μετά το άλλο, ισοδύναμα πραγματοποιούμε το εξής πείραμα. Διατάσσουμε με τυχαίο τρόπο τα N αντικείμενα και μετά επιλέγουμε τα n πρώτα. Προφανώς, η πιθανότητα σε καθεμία από τις πρώτες n θέσεις να έχουμε αντικείμενο τύπου Ι είναι k/n, άρα, η παράμετρος p i της κάθε X i είναι ίδια: p i = PrX i = 1 = k, για κάθε i = 1, 2,..., n. N

96 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Εφαρμόζοντας τώρα την πρώτη ιδιότητα του Θεωρήματος 6.1, βρίσκουμε την εξής έκφραση για τη μέση τιμή μιας Τ.Μ. Y ΥπερN, k, n: n n µ = EY = E X i = EX i = n k N. 7.2 i=1 Ενας παρόμοιος αλλά λίγο πιο πολύπλοκος υπολογισμός μάς επιτρέπει να υπολογίσουμε και τη διασπορά της Y : VarY = i=1 nkn kn n N 2. 7.3 N 1 Λεπτομέρειες για την απόδειξη της 7.3 δίνονται στην Άσκηση 18 στο τέλος του κεφαλαίου. Παράδειγμα 7.9 Συνεχίζοντας το Παράδειγμα 7.8, μπορούμε να υπολογίσουμε το μέσο πλήθος από φιγούρες μεταξύ των 3 φύλλων που επιλέξαμε από τον τύπο 7.2 ως, EY = 3 12 52 = 9 13. Παράδειγμα 7.10 Εστω πως, από τα 10 εκατομμύρια άτομα ενός πληθυσμού, οι 100 χιλιάδες έχουν στο σπίτι τους σύνδεση internet μέσω γραμμής ADSL. Από αυτό τον πληθυσμό επιλέγουμε τυχαία, για μια έρευνα αγοράς, 150 άτομα, χωρίς επανατοποθέτηση. Τότε, το πλήθος, έστω X, των ανθρώπων με σύνδεση ADSL ανάμεσα στους επιλεγμένους έχει κατανομή X Υπερ10 7, 10 5, 150. Αν, αντίθετα, η επιλογή των ατόμων γίνει με επανατοποθέτηση, τότε το πλήθος Y των ανθρώπων με ADSL που θα επιλέξουμε θα έχει κατανομή Y Διων150, 0.01, αφού η πιθανότητα να επιλεγεί κάποιος με ADSL είναι p = 10 5 /10 7 = 0.01. Παρότι η πυκνότητα της Y μας είναι γνωστή, ο υπολογισμός των τιμών της πυκνότητας αυτής είναι αριθμητικά δύσκολος διότι απαιτεί τη χρήση τιμών της μορφής n! για μεγάλα n. Π.χ., PrY = 10 = 150 10 p 10 1 p 140 = 150! 10! 140!, όπου, για παράδειγμα, το 140! είναι μια ποσότητα της τάξης του 10 241. Προκειμένου να αποφύγουμε τέτοιου είδους υπολογισμούς με αστρονομικά μεγέθη οι οποίοι συχνά οδηγούν σε μεγάλα αριθμητικά σφάλματα στην πράξη, θα χρησιμοποιήσουμε την πιο κάτω προσέγγιση για το n! όταν το n παίρνει μεγάλες τιμές. Η απόδειξή της δίνεται στην Ενότητα 7.4. Λήμμα 7.1 Τύπος του Stirling Υπάρχει κάποια σταθερά C > 0 τέτοια ώστε, για μεγάλες τιμές του n, η τιμή του n! μπορεί να προσεγγιστεί ως, Πιο συγκεκριμένα, έχουμε, n! C n n n e n. n! C n n 1, καθώς το n. n e n

7.2. ΥΠΕΡΓΕΩΜΕΤΡΙΚ Η ΚΑΙ POISSON ΚΑΤΑΝΟΜ Η 97 Σημείωση. Αν και δεν θα μας χρειαστεί, η τιμή της σταθεράς C στο Λήμμα 7.1 μπορεί να υπολογιστεί ακριβώς με κάποιο επιπλέον κόπο, και είναι C = 2π. Παράδειγμα 7.11 Εστω πως σε ένα χρονικό διάστημα N δευτερολέπτων, όπου θεωρούμε πως το N είναι «μεγάλο», συμβαίνει ένα τυχαίο πλήθος Y γεγονότων, και κατά μέσο όρο συμβαίνουν EY = λ τέτοια γεγονότα. Πιο συγκεκριμένα, θεωρούμε πως για κάθε δευτερόλεπτο είτε συμβαίνει ένα γεγονός είτε όχι, και αυτά είναι ανεξάρτητα μεταξύ τους. Ορίζουμε λοιπόν N ανεξάρτητες Τ.Μ. X i Bernp, όπου η κάθε X i = 1 αν έχουμε γεγονός το δευτερόλεπτο i, αλλιώς X i = 0. Τότε, το συνολικό πλήθος Y ισούται με το άθροισμα των X i, και συνεπώς X ΔιωνN, p. Εφόσον υποθέτουμε πως EY = λ αλλά μια διωνυμική Τ.Μ. έχει EY = Np, θα πρέπει να θέσουμε την πιθανότητα p = λ/n. Οπως παρατηρήσαμε στο τελευταίο παράδειγμα, η διωνυμική κατανομή είναι δύσχρηστη για μεγάλα N. Το ακόλουθο θεώρημα μας λέει πως, σε αυτή την περίπτωση, μπορεί να προσεγγιστεί αποτελεσματικά από μια άλλη, πολύ πιο εύχρηστη, κατανομή. Θεώρημα 7.2 Ορισμός κατανομής Poisson Εστω λ > 0 μια δεδομένη σταθερά, και έστω για κάθε N μια Τ.Μ. Y N με κατανομή ΔιωνN, λ/n και πυκνότητα P N k = PrY N = k, για k = 0, 1,..., N. Καθώς το N οι τιμές της πυκνότητας P N k συγκλίνουν στις αντίστοιχες τιμές της πυκνότητας P k μιας Τ.Μ. Z με κατανομή Poisson με παράμετρο λ, δηλαδή με σύνολο τιμών το S = {0, 1, 2,...} και πυκνότητα, P k = e λ λk Με άλλα λόγια, για κάθε k = 0, 1, 2,..., έχουμε, καθώς το N. P N k =, για k S = {0, 1, 2,...}. k! N λ k 1 λ N k P k = e λ λk k N N k!, 7.4 Σημείωση. Για συντομία, το ότι μια Τ.Μ. Z έχει κατανομή Poisson με παράμετρο λ συμβολίζεται ως εξής: Z Poissonλ. Η κατανομή Poisson έχει δύο συνηθισμένες χρήσεις. Η μία είναι για να περιγράψει το πλήθος των γεγονότων που συμβαίνουν σε μια δεδομένη χρονική περίοδο, όταν αυτά συμβαίνουν με τον «πιο τυχαίο δυνατό τρόπο» και το μόνο που είναι γνωστό είναι το μέσο πλήθος τους. Η δεύτερη είναι προσέγγιση της διωνυμικής κατανομής. Οι ακριβείς συνθήκες κάτω από τις οποίες η κατανομή Poisson μάς δίνει πράγματι μια καλή προσέγγιση για τη διωνυμική δίνονται επιγραμματικά στο πιο κάτω πόρισμα, το οποίο είναι άμεση απόρροια του Θεωρήματος 7.2.

98 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Πόρισμα 7.1 Poisson προσέγγιση στη διωνυμική Εστω πως μια τυχαία μεταβλητή Y έχει κατανομή ΔιωνN, p, με παραμέτρους N, p που να ικανοποιούν τις εξής συνθήκες: το N είναι αρκετά «μεγάλο», δηλαδή N 100, το p είναι αρκετά «μικρό», δηλαδή p < 1/25, το γινόμενό Np είναι της τάξεως του 1. Τότε η κατανομή της Y μπορεί να προσεγγιστεί από την κατανομή μιας Τ.Μ. Z Poissonλ με λ = Np υπό την έννοια ότι: PrY = k PrZ = k = e λ λk, για κάθε k = 0, 1, 2,.... k! Για την απόδειξη του Θεωρήματος 7.2 θα χρησιμοποιήσουμε τις πιο κάτω εκφράσεις για την εκθετική συνάρτηση fx = e x. Η πρώτη μπορεί να ληφθεί ως ο ορισμός της e x και τη θεωρούμε γνωστή. Λεπτομέρειες για την απόδειξη της τρίτης έκφρασης, η οποία είναι μια ισχυρότερη μορφή της δεύτερης, δίνονται στην Άσκηση 19 στο τέλος του κεφαλαίου. Λήμμα 7.2 Εκθετική συνάρτηση Για κάθε πραγματική τιμή x, η εκθετική συνάρτηση e x μπορεί να εκφραστεί ως: 1. Η σειρά: 2. Το όριο: e x = x k k!. e x = lim 1 + x n. n n Επιπλέον, για μια οποιαδήποτε ακολουθία πραγματικών αριθμών {x n } που τείνουν στο x R καθώς το n, έχουμε: e x = lim 1 + x n n. 7.5 n n Απόδειξη του Θεωρήματος 7.2: Εστω λ > 0 και k 0 δεδομένα. Η ιδέα της απόδειξης είναι απλή: Θα εφαρμόσουμε τον τύπο του Stirling στην πυκνότητα P N k της διωνυμικής κατανομής. Θυμίζουμε ότι, όπως στο Λήμμα 7.1, η ακριβής διατύπωση του τύπου του Stirling μάς λέει πως υπάρχει μια σταθερά C και μια ακολουθία πραγματικών αριθμών {c n } που τείνει στο ένα, τέτοια ώστε, n! = c n C n n n e n, για κάθε n. Αντικαθιστώντας αυτή την έκφραση στα

7.2. ΥΠΕΡΓΕΩΜΕΤΡΙΚ Η ΚΑΙ POISSON ΚΑΤΑΝΟΜ Η 99 παραγοντικά N! και N k! που εμφανίζονται στην P N k, N λ k P N k = 1 λ N k k N N N! λ = N k! k! N = k N λ N k 7.6 N c N C N N N e N c N k C N k N k N k e N k 1 k! λ N k N λ N N k. N N λ Θέτοντας d N = c N /c N k, παρατηρώντας ότι d N 1 καθώς N, και απλοποιώντας, βρίσκουμε, P N k = 1 N N N k! e k N k N k N λ k N λ N N kdn kk N N N λ = 1 N λ N 1 λn k kdn k! e k N k 1 k/n N λ = 1 [ k! e k 1 1 λ k ] N 1 N 1 k/n 1 k/n [ λ 1 k/n ] k d N. 1 λ/n Το τελευταίο παραπάνω γινόμενο αποτελείται από έξι όρους. Καθώς το N, οι δύο πρώτοι είναι σταθεροί, και ο τέταρτος και ο έκτος τείνουν στο 1. Παρομοίως, ο πέμπτος όρος τείνει στο λ k. Για τον βασικότερο όρο, τον τρίτο, χρησιμοποιώντας την τρίτη έκφραση 7.5 από το Λήμμα 7.2, με x N = λ k 1 k/n, και παρατηρώντας πως τα x N τείνουν στο x = λ k καθώς το N, έχουμε, [ 1 1 λ k ] N e k λ. N 1 k/n Τέλος, συνδυάζοντας όλα τα παραπάνω, καθώς το N, και έχουμε αποδείξει τη ζητούμενη σχέση 7.4. P N k 1 k! e k e k λ λ k λ λk = e k!, Παρατήρηση: Το μόνο σημείο στην παραπάνω απόδειξη όπου εφαρμόστηκε ο τύπος του Stirling ήταν για να δεχθεί, στην έκφραση 7.6, ότι ο όρος N!/N k!n k τείνει στο 1 καθώς το N. Αλλά αυτό μπορεί εύκολα να αποδειχθεί και απευθείας, παρατηρώντας ότι, N! NN 1 N k + 1 = N k!n k N k, το οποίο είναι ο λόγος δύο πολυωνύμων ως προς N βαθμού k, με πρώτο όρο N k και στα δύο, και συνεπώς τείνει στο 1 καθώς το N.

100 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Παράδειγμα 7.12 Επανερχόμαστε στο Παράδειγμα 7.10, όπου το ζητούμενο ήταν να υπολογίσουμε την πιθανότητα PrY = 10 για μια Τ.Μ. Y Διων150, 0.01. Εδώ το γινόμενο 150 0.01 = 1.5, και προφανώς ικανοποιούνται και οι τρεις συνθήκες του Πορίσματος 7.1. Συνεπώς μπορούμε να προσεγγίσουμε την κατανομή της Y μέσω της κατανομής Poissonλ με λ = 1.5, έτσι ώστε: 1.5 1.510 PrY = 10 e 3.5 10 6. 10! Στο επόμενό μας αποτέλεσμα υπολογίζονται η μέση τιμή και η διασπορά μιας Τ.Μ. με κατανομή Poisson. Θεώρημα 7.3 Αν Z Poissonλ, τότε: EZ = λ και VarZ = λ. Απόδειξη: Για τη μέση τιμή έχουμε, µ = EZ = k P k = λ λk k e k! = e λ k λk k!. Το άθροισμα της πιο πάνω σειράς υπολογίζεται στην επόμενη ενότητα, και δίνεται από τον τύπο 7.10. Εφαρμόζοντάς τον, με x = λ, βρίσκουμε, µ = EZ = e λ λ e λ = λ. Παρομοίως υπολογίζεται και η μέση τιμή της Z 2 ως, EZ 2 = k 2 λ λk e k! = e λ k 2 λk k!, και, εφαρμόζοντας τον αντίστοιχο τύπο 7.11 με x = λ, προκύπτει πως, Συνεπώς, η διασπορά της Z είναι ίση με, ολοκληρώνοντας την απόδειξη. EZ 2 = e λ λ1 + λ e λ = λ1 + λ. σ 2 = VarZ = EZ 2 [EZ] 2 = λ1 + λ λ 2 = λ, Κλείνουμε αυτή την ενότητα με ένα ακόμα παράδειγμα.

7.3. Η ΓΕΩΜΕΤΡΙΚ Η ΚΑΙ ΣΥΝΑΦΕ ΙΣ ΣΕΙΡ ΕΣ 101 Παράδειγμα 7.13 Εστω πως σε καθένα από 1000 αντικείμενα δίνουμε τυχαία έναν αριθμό από το 1 ως το 1000 επιτρέποντας σε δύο αντικείμενα να έχουν τον ίδιο αριθμό, και μας ενδιαφέρει το τυχαίο πλήθος X των αντικειμένων που έχουν τον αριθμό 1. Τότε, το X έχει κατανομή ΔιωνN, p με παραμέτρους N = 1000 και p = 1/1000 = 0.001. Εφόσον το γινόμενο N p = 1, βάσει του Πορίσματος 7.1, η κατανομή του X μπορεί να προσεγγιστεί από την Poissonλ, με λ = N p = 1. Συνεπώς, μπορούμε, π.χ., να υπολογίσουμε ή, πιο σωστά, να προσεγγίσουμε την πιθανότητα να έχουν 2 ή 3 αντικείμενα τον αριθμό 1 ως, 1 12 13 PrX = 2 ή X = 3 = PrX = 2 + PrX = 3 e + e 1 2! 3! = 2 3 e 1 0.245. 7.3 Η γεωμετρική και συναφείς σειρές Εδώ συγκεντρώνουμε μερικά απλά αποτελέσματα που συχνά φαίνονται χρήσιμα σε προβλήματα που σχετίζονται με Τ.Μ. με γεωμετρική κατανομή. Ξεκινάμε από την απλή παρατήρηση ότι, για κάθε x R και κάθε n 1, 1 + x + x 2 +... + x n 1 x = 1 x n+1. [Αν αυτή η σχέση δεν σας είναι προφανής, αποδείξτε την με επαγωγή.] Υποθέτοντας ότι x 1 και διαιρώντας και τα δύο μέρη με το 1 x, έχουμε τον γνωστό τύπο για το άθροισμα των όρων μιας γεωμετρικής προόδου: n x k = 1 xn+1, για κάθε x 1. 1 x Αν περιοριστούμε τώρα σε τιμές του x με x < 1, τότε προφανώς το x n+1 0 καθώς το n, άρα, περνώντας στο όριο, προκύπτει ο τύπος του αθροίσματος μιας γεωμετρικής σειράς, gx = x k = 1, για κάθε x < 1. 7.7 1 x Από τον ορισμό της συνάρτησης gx στον τύπο 7.7 έχουμε δύο διαφορετικές εκφράσεις για την gx, μία ως σειρά και μία ως το 1/1 x. Μπορούμε επομένως να υπολογίσουμε την παράγωγο g x με δύο τρόπους: Αφού η παράγωγος ενός αθροίσματος ισούται με το άθροισμα των παραγώγων, αλλά και, g x = d x k = dx g x = d 1 = dx 1 x d dx xk = kx k 1, 1 1 x 2.

102 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ Εξισώνοντας τις δύο παραπάνω εκφράσεις και πολλαπλασιάζοντας και τα δύο μέρη με το x, προκύπτει το αποτέλεσμα: hx = kx k = x, για κάθε x < 1. 7.8 1 x 2 Επαναλαμβάνοντας την ίδια διαδικασία, μπορούμε να υπολογίσουμε την παράγωγο της νέας συνάρτησης hx με δύο τρόπους ως, h x = d kx k d = dx dx kxk = k 2 x k 1 ή h x = d dx x 1 x 2 = 1 x2 + 2x1 x 1 x 4 = 1 + x 1 x 3. Εξισώνοντας όπως πριν τις δύο εκφράσεις για την παράγωγο και πολλαπλασιάζοντας και τα δύο μέρη με το x, προκύπτει: k 2 x k = x1 + x, για κάθε x < 1. 7.9 1 x 3 7.4 Η συνάρτηση e x, δυναμοσειρές, τύπος του Stirling Σε αυτή την ενότητα θα υπολογίσουμε τις τιμές δύο σειρών που σχετίζονται με την κατανομή Poisson, και θα αποδείξουμε τον τύπο του Stirling όπως περιγράφεται στο Λήμμα 7.1. Ξεκινάμε θυμίζοντας, όπως στο Λήμμα 7.2, ότι, για κάθε πραγματικό αριθμό x, η εκθετική συνάρτηση μπορεί να εκφραστεί μέσω του αναπτύγματος του Taylor ως μια δυναμοσειρά: fx = e x = x k, για κάθε x R. k! Εφόσον για την εκθετική συνάρτηση ισχύει πως f x = fx, παίρνοντας την παράγωγο ως προς x και στα δύο μέρη της πιο πάνω σχέσης έχουμε, e x = k xk 1 k! = 1 x k xk k!, όπου χρησιμοποιήσαμε τη γνωστή ιδιότητα πως η παράγωγος ενός αθροίσματος ισούται με το άθροισμα των παραγώγων. Άρα έχουμε αποδείξει πως, για κάθε x R, xe x = k xk k!. 7.10

7.4. Η ΣΥΝ ΑΡΤΗΣΗ E X, ΔΥΝΑΜΟΣΕΙΡ ΕΣ, Τ ΥΠΟΣ ΤΟΥ STIRLING 103 Επαναλαμβάνοντας την ίδια διαδικασία ακόμη μία φορά, παίρνοντας παραγώγους έχουμε, d dx xex = x + 1 e x = d k xk = k d x k, dx k! dx k! και συνεπώς, ή, απλοποιώντας, x + 1 e x = xx + 1 e x = k 2 xk 1 k! = 1 x k 2 xk k!, k 2 xk k!. 7.11 Απόδειξη του Λήμματος 7.1: Κατ αρχάς παρατηρούμε πως, παίρνοντας λογαρίθμους, αρκεί να αποδείξουμε πως, για κάποια σταθερά C > 0, log n! n + 1 log n + n log C, καθώς το n, 7.12 2 όπου με log συμβολίζουμε τον φυσικό λογάριθμο με βάση το e ο οποίος μερικές φορές συμβολίζεται και ως ln. Για κάθε t > 0 ορίζουμε το ολοκλήρωμα, It = t και επίσης για k 1 ορίζουμε τις ακολουθίες, a k = 1 2 log k k b k = k+1/2 k 0 k 1/2 log t dt = t log t t, log x dx = k k 1/2 log k x dx, log x dx 1 k+1/2 2 log k = log x k dx. Από τον ορισμό των δύο ακολουθιών, η διαφορά τους ισούται με, a k b k = οπότε, αθροίζοντας τις διαφορές, k+1/2 k 1/2 log k k+1/2 x dx = log x dx + log k, n 1 a k b k = logn 1! k=1 k 1/2 k n 1/2 1/2 log x dx,

104 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ έχουμε, n 1 a k b k + a n = logn 1! + 1 n 1/2 2 log n k=1 = log n! 1 2 log n n 1/2 1/2 log x dx. Τώρα προσθέτοντας και αφαιρώντας το ολοκλήρωμα I1/2, βρίσκουμε, n log x dx log x dx n 1/2 n 1 a k b k + a n = log n! 1 n 2 log n log x dx + I1/2 k=1 = log n! n + 1 log n + n + I1/2. 2 Συνεπώς, για να αποδείξουμε τη ζητούμενη σχέση 7.12, αρκεί να δείξουμε πως το αριστερό μέρος της παραπάνω σχέσης, δηλαδή το n 1 k=1 a k b k +a n, τείνει σε κάποιο πεπερασμένο όριο καθώς το n. Παρατηρούμε πως, μετά από μια απλή αλλαγή μεταβλητών, οι ακολουθίες {a k } και {b k } μπορούν να εκφραστούν ως, a k = b k = 1/2 0 1/2 0 1 log log 1 t k 1 + t k 0 dt, dt, απ όπου εύκολα προκύπτει πως a n 0 καθώς n, και πως η διαφορά τους, a k b k = 1/2 0 log 1 t2 k 2 dt = 1/2 0 log 1 + t2 k 2 t 2 dt 0. Άρα, για να ολοκληρώσουμε την απόδειξη, αρκεί να δείξουμε πως η σειρά k=1 a k b k των θετικών όρων a k b k συγκλίνει σε κάποιο πεπερασμένο άθροισμα. Από την απλή ανισότητα βλ. Λήμμα 7.3 πιο κάτω log1 + x x έχουμε, log 1 + t2 k 2 t 2 t2 k 2 t 2, και εφόσον η συνάρτηση gt = t2 είναι αύξουσα ως προς t γιατί;, για τις τιμές του t στο k 2 t 2 σχετικό ολοκλήρωμα έχουμε gt g1 και, log 1 + t2 k 2 t 2 1 k 2 1 2 k 2,

7.4. Η ΣΥΝ ΑΡΤΗΣΗ E X, ΔΥΝΑΜΟΣΕΙΡ ΕΣ, Τ ΥΠΟΣ ΤΟΥ STIRLING 105 όπου η τελευταία στοιχειώδης ανισότητα ισχύει για κάθε k 2. Τελικά, λοιπόν, βρίσκουμε πως, a k b k = 1/2 0 t 2 log k 2 t 2 dt 1 k 2, και αφού η σειρά k=1 1/k2 <, τότε συγκλίνει και η ζητούμενη σειρά, ολοκληρώνοντας την απόδειξη. Κλείνουμε αυτό το κεφάλαιο με μια στοιχειώδη ανισότητα την οποία χρησιμοποιήσαμε ήδη πιο πάνω και η οποία θα μας φανεί χρήσιμη και αργότερα. Λήμμα 7.3 Για κάθε πραγματικό αριθμό x > 1 έχουμε log1 + x x ή, ισοδύναμα: e x 1 + x, για κάθε x R. 7.13 x e 1+ x 1-1 0 x Σχήμα 7.1: Σχηματική αναπαράσταση της ανισότητας στο Λήμμα 7.3. Απόδειξη: Εστω η συνάρτηση qx = e x x 1. Αρκεί να δείξουμε πως qx 0 για κάθε x, και εφόσον q0 = 0 αρκεί να δείξουμε πως η παράγωγος q x 0 για x 0 και q x 0 για x 0. Πράγματι, έχουμε q x = e x 1, το οποίο προφανώς ικανοποιεί τις ζητούμενες συνθήκες. Η ανισότητα 7.13 αναπαρίσταται γραφικά και στο Σχήμα 7.1.

106 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ 7.5 Ασκήσεις 1. Overbooking. Ενα αεροπλάνο έχει 50 θέσεις, και έχουν γίνει κρατήσεις από 55 επιβάτες. Η πιθανότητα καθένας από αυτούς να έρθει στο αεροδρόμιο είναι 90%, ανεξάρτητα από τους υπόλοιπους. Ποια είναι η πιθανότητα κάποιοι επιβάτες που θα φθάσουν στο αεροδρόμιο να είναι υπεράριθμοι; 2. Δείκτριες τυχαίες μεταβλητές. αʹ Εστω ένα οποιοδήποτε ενδεχόμενο A με πιθανότητα p = PA, και έστω η «δείκτρια» Τ.Μ. X, που παίρνει την τιμή X = 1 όταν συμβαίνει το A, και X = 0 όταν δεν συμβαίνει. Ποια είναι η κατανομή του X; βʹ Εστω μια οποιαδήποτε Τ.Μ. Y με συνάρτηση κατανομής F y. Για δεδομένο x R, η δείκτρια συνάρτηση h x : R {0, 1} ορίζεται ως, { 1, αν y x, h x y = 0, αν y > x. Δείξτε πως E[h x Y ] = F x. 3. Η ουρά της μέσης τιμής. Εστω μια διακριτή Τ.Μ. Y η οποία παίρνει πάντα τιμές μεγαλύτερες ή ίσες του μηδενός και έχει πεπερασμένη μέση τιμή EY. Δείξτε πως, καθώς το x, E Y [1 h x Y ] 0, όπου h x y είναι οι δείκτριες συναρτήσεις που ορίσαμε στην Άσκηση 2. Ερμηνεύστε διαισθητικά αυτό το αποτέλεσμα. 4. Ελάχιστο δύο γεωμετρικών τυχαίων μεταβλητών. Εστω X και Y δύο ανεξάρτητες τυχαίες μεταβλητές, με παραμέτρους p 1 και p 2 αντίστοιχα. Υπολογίστε την πυκνότητα της τυχαίας μεταβλητής Z = minx, Y. Μπορείτε να ερμηνεύσετε διαισθητικά το αποτέλεσμα; Υπόδειξη. Ισως σας βοηθήσει να υπολογίσετε πρώτα την πιθανότητα PrZ k. 5. Άθροισμα Poisson. Αν οι τυχαίες μεταβλητές X και Y είναι ανεξάρτητες, με κατανομή Poissonλ και Poissonµ αντίστοιχα, να δείξετε ότι η τυχαία μεταβλητή X+Y έχει κατανομή Poissonλ+µ. Υπόδειξη. Το διωνυμικό θεώρημα λέει πως a+b n = n n k a k b n k. 6. Ταυτότητα Vandermonde. Αποδείξτε την ταυτότητα Vandermonde, m n1 n2 n1 + n 2 =, 7.14 k m k m όπου n 1, n 2, m N. Χρησιμοποιήστε επιχειρήματα που βασίζονται αποκλειστικά στη συνδυαστική. Υπενθυμίζεται πως, κατά σύμβαση, θέτουμε n 0 = 1 για κάθε n, και n k = 0 για κάθε k > n.

7.5. ΑΣΚ ΗΣΕΙΣ 107 7. Άθροισμα διωνυμικών Τ.Μ. Χρησιμοποιήστε την ταυτότητα Vandermonde της Άσκησης 6, προκειμένου να δείξετε ότι το άθροισμα δύο διωνυμικών Τ.Μ. X, Y με παραμέτρους n 1, p και n 2, p αντίστοιχα, ανεξάρτητων μεταξύ τους, έχει Διωνn 1 + n 2, p κατανομή. Επίσης εξηγήστε πως θα μπορούσαμε να αποδείξουμε το ίδιο αποτέλεσμα χωρίς να χρειαστεί να κάνουμε υπολογισμούς. 8. Διάφορες κατανομές. Παρακάτω ορίζονται κάποιες τυχαίες μεταβλητές. Περιγράψτε την κατανομή και τις αντίστοιχες παραμέτρους καθεμίας από αυτές. αʹ Ρίχνουμε διαδοχικές ανεξάρτητες ζαριές με δύο ζάρια, μέχρι την 1 η φορά που θα φέρουμε διπλή. Εστω Y = συνολικό πλήθος από ζαριές που ρίξαμε. βʹ Επιλέγουμε στην τύχη, με επανατοποθέτηση, 6 φύλλα από μια τράπουλα. Εστω X το πλήθος από κούπες που επιλέξαμε. γʹ Οπως στο β, αλλά χωρίς επανατοποθέτηση. δʹ Ρίχνουμε 20 φορές ένα νόμισμα με PrΚορώνα= 0.3. Εστω Z = το πλήθος των φορών που φέραμε Γράμματα. 9. Ουρά στην τράπεζα. Σε μια τράπεζα, κάθε πεντάλεπτο υπάρχει πιθανότητα 5% να έρθει ένας νέος πελάτης. Υποθέτουμε πως οι αφίξεις πελατών σε διαφορετικά πεντάλεπτα είναι ανεξάρτητες, πως ποτέ δεν έρχονται δύο ή παραπάνω πελάτες σε ένα δεδομένο πεντάλεπτο, και ορίζουμε: X = πλήθος πελατών που έφτασαν τις πρώτες 2 ώρες, Y = το πρώτο 5λεπτο κατά το οποίο έφτασε πελάτης. αʹ Ποια είναι η κατανομή του X; βʹ Βρείτε την πιθανότητα να έρθουν ακριβώς 3 πελάτες τις πρώτες δύο ώρες. γʹ Ποια είναι η κατανομή του Y ; δʹ Κατά μέσο όρο πόσα λεπτά θα περιμένουν οι υπάλληλοι μέχρι την άφιξη του πρώτου πελάτη; εʹ Δεδομένου ότι δεν ήρθε κανείς τις πρώτες 2 ώρες, ποια είναι η πιθανότητα να μην έρθει κανείς και κατά την επόμενη μισή ώρα; 10. Επιθέσεις μηνυμάτων spam. Κάποιος διαφημιστής στέλνει ένα email στους 10 χιλιάδες λογαριασμούς του domain aueb.gr ζητώντας τον αριθμό της πιστωτικής κάρτας του παραλήπτη. Από προηγούμενες προσπάθειές του γνωρίζει ότι οι διαφορετικοί χρήστες ανταποκρίνονται ανεξάρτητα ο ένας από τον άλλον, και η πιθανότητα να απαντήσει κάποιος με τα ζητούμενα στοιχεία είναι 0.018%. Ποια είναι η πιθανότητα να του απαντήσουν τουλάχιστον τρεις χρήστες;

108 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ 11. Τα «ν» του Βαρουφάκη. Ως γνωστόν, ο πρώην υπουργός Οικονομικών κύριος Γιάνης Βαρουφάκης αρέσκεται στο να γράφει το μικρό του όνομα με ένα «ν» αντί για δύο. Στα κείμενα που ανεβαίνουν σε ένα δημοσιογραφικό σάιτ, με πιθανότητα 0.3% ο διορθωτής κάνει λάθος και γράφει το όνομά του με δύο «ν», ανεξάρτητα από φορά σε φορά. Αν σε έναν μήνα το όνομα του κ. Βαρουφάκη αναφέρθηκε 800 φορές: αʹ Εκφράστε το συνολικό πλήθος από «ν» που χρησιμοποιήθηκαν για όλες τις φορές που γράφτηκε το όνομά του, ως το άθροισμα μιας σταθεράς και μιας Τ.Μ. με γνωστή κατανομή. Ποια είναι αυτή η κατανομή; βʹ Υπολογίστε μια προσέγγιση για την πιθανότητα το συνολικό πλήθος από «ν» που χρησιμοποιήθηκαν να είναι ίσο με 810. 12. Άσχετος φοιτητής. Σε ένα διαγώνισμα υπάρχουν 250 ερωτήσεις πολλαπλής επιλογής. Ο εξεταζόμενος έχει παρανοήσει εντελώς το αντικείμενο του μαθήματος, και η πιθανότητα να απαντήσει σωστά είναι πολύ χειρότερη από το να απαντούσε τυχαία! μόνο 0.5% για την κάθε ερώτηση, ανεξαρτήτως των υπολοίπων ερωτήσεων. Βρείτε μια προσέγγιση της πιθανότητας ο εξεταζόμενος να απαντήσει σωστά σε ακριβώς τρεις ερωτήσεις. 13. Δύο διαφορετικές δημοσκοπήσεις. Σε κάποιον πληθυσμό M ψηφοφόρων, 3M/10 άτομα, δηλαδή το 30%, είναι ψηφοφόροι κάποιου συγκεκριμένου κόμματος. Για να προβλέψει το ποσοστό αυτού του κόμματος στις εκλογές, μια εταιρία δημοσκοπήσεων διαλέγει τυχαία, ομοιόμορφα και με επανατοποθέτηση N άτομα από τον πληθυσμό, και καταγράφει το πλήθος Y εκείνων που δήλωσαν ψηφοφόροι του. Ως πρόβλεψη του εκλογικού αποτελέσματος του κόμματος, δίνει το ποσοστό Y/N των ψηφοφόρων του στο τυχαίο δείγμα της. αʹ Ποια είναι η κατανομή του Y ; Ποια είναι η μέση τιμή και η διασπορά της πρόβλεψης του ποσοστού Y/N; βʹ Επαναλάβετε το προηγούμενο ερώτημα στην περίπτωση που η επιλογή γίνεται χωρίς επανατοποθέτηση. Συγκρίνετε με τα προηγούμενα αποτελέσματα. Ποια μέθοδος είναι πιο συμφέρουσα; 14. Βελάκια. Ρίχνουμε δέκα βελάκια σε ένα στόχο, με κλειστά μάτια. Οι διαδοχικές ρίψεις είναι ανεξάρτητες, και η πιθανότητα να πετύχουμε τον στόχο είναι μόνο 1%. αʹ Ποια η πιθανότητα ακριβώς 2 βελάκια να πέτυχαν τον στόχο; βʹ Αν αντί για 10, ρίχναμε 140 βελάκια, βρείτε μια προσέγγιση της ίδιας πιθανότητας. 15. Γινόμενο Bernoulli. Εστω n ανεξάρτητες τυχαίες μεταβλητές, X 1, X 2,..., X n, όπου η κάθε X i Bernp i, και έστω Z το γινόμενό τους. Παρατηρήστε πως το γινόμενο έχει επίσης κατανομή Bernoulli και υπολογίστε την παράμετρό της: α Χρησιμοποιώντας το Θεώρημα 6.1, και β χωρίς να χρησιμοποιήσετε το Θεώρημα 6.1.

7.5. ΑΣΚ ΗΣΕΙΣ 109 16. Χρηματιστήριο. Στο χρηματιστήριο, κάθε μέρα η τιμή μιας μετοχής αυξάνεται κατά 1 ευρώ με πιθανότητα 14%, αλλιώς μένει σταθερή, και οι αλλαγές αυτές είναι ανεξάρτητες από τη μία μέρα στην άλλη. Εστω ότι το πρωί της 1 ης μέρας η τιμή είναι 100 ευρώ, και έστω Y 1 η μεταβολή της τιμής κατά την 1 η μέρα, Y 2 η μεταβολή της τιμής κατά τη 2 η μέρα, και γενικά Y i η μεταβολή της τιμής κατά τη μέρα i. αʹ Ποια είναι η κατανομή των τυχαίων μεταβλητών Y i ; βʹ Εστω X η συνολική διαφορά της τιμής μετά από ένα μήνα δηλαδή 30 ημέρες. Ποια είναι η κατανομή της τυχαίας μεταβλητής X; γʹ Ποια είναι η πιθανότητα του ενδεχόμενου E ότι μετά από ένα μήνα η τιμή θα είναι μεταξύ 110 και 112 ευρώ συμπεριλαμβανομένων; δʹ Αν Z είναι η τιμή μετά από 60 μέρες, να βρεθεί η μέση τιμή και η διασπορά της. εʹ Αν αντί για 1 ευρώ, η τιμή αυξανόταν κατά δύο ευρώ ή έμενε σταθερή με τις ίδιες πιθανότητες, να βρεθεί η μέση τιμή και η διασπορά της τιμής της μετοχής μετά από δύο μήνες. 17. XOR Bernoulli. Εστω X και Y δύο ανεξάρτητες Τ.Μ. οι οποίες περιγράφουν δύο τυχαία bits στην εκτέλεση ενός προγράμματος. Εστω ότι η X Bern1/4, η Y Bern1/2, και έστω μια νέα Τ.Μ. η Z = X XOR Y. αʹ Η Z είναι δυαδική Τ.Μ. άρα έχει κατανομή Bernoulli. Να βρεθεί η παράμετρός της. βʹ Είναι η Z ανεξάρτητη από τη X ή όχι; Αποδείξτε την απάντησή σας. 18. Διασπορά υπεργεωμετρικής κατανομής. Στην παρατήρηση που ακολουθεί το Παράδειγμα 7.8 είδαμε πως μια Τ.Μ. Y ΥπερN, k, n μπορεί να εκφραστεί ως το άθροισμα n Τ.Μ. X 1, X 2,..., X n οι οποίες έχουν όλες κατανομή Bernk/N αλλά δεν είναι ανεξάρτητες. Εδώ θα αποδείξουμε τον τύπο 7.3 για τη διασπορά της Y. αʹ Δείξτε πως: EY 2 = n n EX i X j. i=1 j=1 βʹ Εξηγήστε γιατί, με βάση τον συλλογισμό που χρησιμοποιήσαμε για τον υπολογισμό της μέσης τιμής, όλοι οι όροι στο παραπάνω άθροισμα ικανοποιούν: EX i X j = EX 1 X 2, για κάθε i j, και EX 2 i = EX 2 1 = EX 1, για κάθε i. γʹ Υπολογίστε την παράμετρο της Bernoulli τυχαίας μεταβλητής X 1 X 2.

110 ΚΕΦΑΛΑΙΟ 7. ΔΙΑΚΡΙΤ ΕΣ ΚΑΤΑΝΟΜ ΕΣ δʹ Χρησιμοποιώντας τα τρία πιο πάνω βήματα, δείξτε πως: EY 2 = n k N + nn 1 k N k 1 N 1. εʹ Χρησιμοποιώντας το αποτέλεσμα του βήματος δ, αποδείξτε τον τύπο 7.3 για τη διασπορά της Y. 19. Αναπαράσταση της e x. Η τρίτη ιδιότητα του Λήμματος 7.2 λέει ότι, για οποιαδήποτε πραγματική ακολουθία {x n } που τείνει στο x R καθώς το n, ισχύει η σχέση 7.5: e x = lim 1 + x n n. n n Στα τρία πιο κάτω βήματα θα δούμε την απόδειξή της. αʹ Χρησιμοποιώντας το ανάπτυγμα Taylor, δείξτε ότι για οποιοδήποτε y > 1, έχουμε, για κάποιο ζ τέτοιο ώστε ζ y. log1 + y = y y 2 21 + ζ 2, βʹ Χρησιμοποιήστε το προηγούμενο σκέλος για να δείξετε ότι υπάρχει κάποιο n 0 1 και μια φραγμένη ακολουθία {ξ n }, τέτοια ώστε: n log 1 + x n n = x n 1 2n ξ n, για n n 0. γʹ Εξηγήστε πως το πιο πάνω αποτέλεσμα συνεπάγεται ότι ισχύει η 7.5.