Κεφάλαιο 23 Παραδείγµατα Μεθόδων E-M Αλγόριθµου

Σχετικά έγγραφα
Μέθοδος μέγιστης πιθανοφάνειας

A(θ) = n log θ B(x ) = 0. T (x ) = x i. Γ(n)θ n =

Μέθοδος Newton-Raphson

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Στατιστική Συμπερασματολογία

Στατιστική. Εκτιμητική

Στατιστική Συμπερασματολογία

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών. ΗΥ-217: Πιθανότητες-Χειµερινό Εξάµηνο ιδάσκων : Π. Τσακαλίδης

HMY 795: Αναγνώριση Προτύπων

ΑΣΚΗΣΕΙΣ ΣΤΗΝ ΕΚΤΙΜΗΤΙΚΗ

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

Παρεµβολή και Προσέγγιση Συναρτήσεων

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

X = = 81 9 = 9

Μέθοδος μέγιστης πιθανοφάνειας

Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram).

Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Επιστηµονικός Υπολογισµός Ι Ενότητα 1 - Εισαγωγή. Ευστράτιος Γαλλόπουλος

2. Στοιχεία Πολυδιάστατων Κατανοµών

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

Πανεπιστήμιο Ιωαννίνων Ακαδ. Έτος Τμήμα Μηχανικών Η/Υ & Πληροφορικής. Παρασκευάς Τσανταρλιώτης Α.Μ. 318

(X1 X 2 ) 2}. ( ) f 1 (x i ; θ) = θ x i. (1 θ) n x i. x i log. i=1. i=1 t2 i

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι-Θεωρητικές Κατανομές ΙΙ

1 1 c c c c c c = 1 c = 1 28 P (Y < X) = P ((1, 2)) + P ((4, 1)) + P ((4, 3)) = 2 1/ / /28 = 18/28

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Solution Series 9. i=1 x i and i=1 x i.

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ

ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΜΕΤΑΒΛΗΤΩΝ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

HMY 795: Αναγνώριση Προτύπων

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 13 Μαρτίου /31

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

CRAMER-RAO ΚΑΤΩ ΦΡΑΓΜΑ - ΑΠΟ ΟΤΙΚΟΙ ΕΚΤΙΜΗΤΕΣ

HMY 795: Αναγνώριση Προτύπων

Λογιστική Παλινδρόµηση

3. Κατανομές πιθανότητας

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟ ΟΥ ΙΟΥΝΙΟΥ 2004., η οποία όµως µπορεί να γραφεί µε την παρακάτω µορφή: 1 e

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ - ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ. Εισαγωγικές εξετάσεις για το Μεταπτυχιακό Πρόγραμμα - Μέρος 2ο

ΚΕΦΑΛΑΙΟ 3 ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. nn n n

HMY 795: Αναγνώριση Προτύπων

Πανεπιστήμιο Πελοποννήσου

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ρ. Ευστρατία Μούρτου

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

1.4 Λύσεις αντιστρόφων προβλημάτων.

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Τυχαία μεταβλητή (τ.μ.)


ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ

Π.χ. πρωτεύουσες, Εκ περιτροπής από δευτερεύουσες σε τριτεύουσες

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ» ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 4

Εκτίµηση Μη-Γραµµικών Μοντέλων

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE)

ΚΕΦΑΛΑΙΟ 4ο ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΑΠΟ ΣΥΝΕΧΕΙΣ ΚΑΙ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Λυσεις Ασκησεων - Φυλλαδιο 4

ΦΡΟΝΤΙΣΤΗΡΙΟ 11. β) τον εκτιμητή μέγιστης πιθανοφάνειας για την άγνωστη παράμετρο λ 0.

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Θεωρία Λήψης Αποφάσεων

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

S T (x) = exp. (α) m n q x = m+n q x m q x. (β) m n q x = m p x m+n p x. (γ) m n q x = m p x n q x+m. tp x = S Tx (t) = S T (x + t) { x+t

12xy(1 x)dx = 12y. = 12 y. = 12 y( ) = 12 y 1 6 = 2y. x 6x(1 x)dx = 6. dx = 6 3 x4

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

Απλός Προγραµµατισµός στην R

Μάθηση Λανθανόντων Μοντέλων με Μερικώς Επισημειωμένα Δεδομένα (Learning Aspect Models with Partially Labeled Data) Αναστασία Κριθαρά.

Math 6 SL Probability Distributions Practice Test Mark Scheme

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Ασκησεις - Φυλλαδιο 4. ιδασκων: Α. Μπεληγιάννης Ιστοσελιδα Μαθηµατος :

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΟΛΥΔΙΑΣΤΑΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

5. ΜΕΘΟΔΟΙ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

Μ Ε Ρ Ο Σ B. Στατιστική Συμπερασματολογία

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Έλεγχοι Χ 2 (Μέρος 1 ο ) 28/4/2017

Transcript:

Κεφάλαιο 23 Παραδείγµατα Μεθόδων E-M Αλγόριθµου Οι µέθοδοι E-M αλγόριθµου µπορούν να επεξηγηθούν πιο εύκολα στην περίπτωση ενός τυχαίου δείγµατος το οποίο αποτελείται από παρατηρηθείσες και µη παρατηρηθείσες ή εκλειπούσες τιµές. Ενα απλό παράδειγµα δείγµατος µε εκλειπούσες τιµές προκύπτει στην περίπτωση ελέγχου του χρόνου επιβίωσης. Για παράδειγµα, ένας αριθµός ηλεκτρικών λαµπτήρων ανάβει συνεχώς και καταµετρείται ο χρόνος που χρειάζεται µέχρι να πάψουν να λειτουργούν. Σε ένα τέτοιο παράδειγµα, είναι συνήθες ϕαινόµενο το πείραµα να διακοπεί πριν να πάψουν να λειτουργούν όλοι οι λαµπτήρες. Ο χρόνος επιβίωσης των λαµπτήρων οι οποίοι συνεχίζουν να δουλεύουν δεν έχει παρατηρη- ϑεί. Οµως, προφανώς ο αριθµός των λογοκριµένων παρατηρήσεων και ο χρόνος της λογοκρισίας περιέχουν πληροφορία για την κατανοµή του χρόνου επιβίωσης. Ακόµη ένα γνωστό παράδειγµα στο οποίο µπορεί να χρησιµοποιηθεί ο E-M αλγόριθµος είναι το πεπερασµένο µοντέλο µίξης κατανοµών. Κάθε παρατήρηση προέρχεται από µία άγνωστη παρατήρηση ενός υποτιθέµενου συνόλου κατανο- µών. Οι εκλείπουσες τιµές προσδιορίζουν την κατανοµή. Οι παράµετροι των κατανοµών πρόκειται να εκτιµηθούν. Ενα παράπλευρο κέρδος της µεθόδου είναι ότι εκτιµάται σε ποια κατηγορία ανήκουν τα δεδοµένα. Τα ελλειπή δεδοµένα µπορούν να είναι εκλείπουσες παρατηρήσεις της ίδιας τυχαίας µεταβλητής η οποία παράγει το δείγµα που παρατηρήθηκε, όπως στην περίπτωση του παραδείγµατος λογοκρισίας, ή µπορούν να προέρχονται από µία διαφορετική τυχαία µεταβλητή η οποία σχετίζεται µε κάποιο τρόπο µε την τυχαία 273

µεταβλητή που έχει παρατηρηθεί. Πολλές εφαρµογές της µεθόδου του E-M αλγόριθµου περιλαµβάνουν προ- ϐλήµατα µε ελλειπή δεδοµένα, αλλά αυτό δεν είναι αναγκαίο. Συχνά, ο E-M αλγόριθµος µπορεί να εφαρµοστεί ϐασισµένος σε µία τεχνητή ελλειπήσ τυχαία µεταβλητή για να συµπληρώσει το δεδοµένα που παρατηρήθηκαν. 23.1 Πρώτο Παράδειγµα : Πολυωνυµική Κατανοµή Ενα από τα πιο απλά παραδείγµατα της µεθόδου E-M αλγορίθµου δόθηκε από τους Dempster, Laird και Rubin (1977). Εστω η πολυωνυµική κατανοµή µε τέσσερα πιθανά αποτελέσµατα, η οποία έχει συνάρτηση πυκνότητας πιθανότητας, p(x 1, x 2, x 3, x 4 ) = n! x 1!x 2!x 3!x 4! π 1 x 1 π 2 x 2 π 3 x 3 π 4 x 4 µε n = x 1 + x 2 + x 3 + x 4 και π 1 + π 2 + π 3 + π 4 = 1. Εστω ότι όλες οι πιθανότητες συσχετίζονται µε µία παράµετρο θ, ως εξής: π 1 = 1 2 + 1 4 θ π 2 = 1 4 1 4 θ π 3 = 1 4 1 4 θ π 4 = 1 4 θ όπου 0 θ 1. εδοµένου µιας παρατήρησης (x 1, x 2, x 3, x 4 ), η λογαριθµική συνάρτηση πι- ϑανοφάνειας δίνεται από l(θ) = x 1 log(2 + θ) + (x 2 + x 3 ) log(1 θ) + x 4 log(θ). Σκοπός είναι να εκτιµηθεί η παράµετρος θ. Η παράγωγος δίνεται από d dθ l(θ) = x 1 2 + θ x 2 + x 3 1 θ + x 4 θ. και σε αυτό το απλό παράδειγµα, η εκτιµήτρια µεγίστης πιθανοφάνειας για το θ µπορεί να υπολογιστεί επιλύοντας µία απλή πολυωνυµική εξίσωση. 274

Για να χρησιµοποιηθεί ο E-M αλγόριθµος για αυτό το παράδειγµα,µπορεί κάποιος να υποθέσει την πολυωνυµική πέµπτης τάξης, η οποία παράγεται χωρίζοντας την πρώτη τάξη της αρχικής πολυωνυµικής σε δύο µε αντίστοιχες πιθανότητες 1/2 και θ/4. Η αρχική µεταβλητή x 1 είναι τώρα το άθροισµα της u 1 και της u 2. Κάτω από αυτόν το µετασχηµατισµό, η Ε.Μ.Π. του θ ϑεωρώντας το άθροισµα u 2 +x4 (ή x 2 +x 3 ) να είναι µία πραγµάτωση της διωνυµικής µε n = u 2 +x 4 +x 2 +x 3 και π = θ (ή 1 θ). Ωστόσο, το u 2 (ή το u 1 ) δεν είναι γνωστό. Συνεχίζοντας σαν να είχαµε παρατήρηση από µία πολυωνυµική µε πέντε πιθανά αποτελέσµατα, µε δύο ελλείποντα στοιχεία, η λογαριθµική πιθανοφάνεια δίνεται από, l c (θ) = (u 2 + x 4 ) log(θ) + (x 2 + x 3 ) log(1 θ), και η εκτιµήτρια µεγίστης πιθανοφάνειας για το θ είναι ίση µε u 2 + x 4 u 2 + x 2 + x 3 + x 4. Το Ε-ϐήµα του επαναληπτικού E-M αλγόριθµου συµπληρώνει την ελλείπουσα τιµή µε την αναµενόµενη τιµή δεδοµένου της τρέχουσας τιµής της παραµέτρου, θ (k) και της τιµής που έχει παρατηρηθεί. Αυτή είναι µία διωνυµική τυχαία µετα- ϐλητή σαν µέρος της x 1. Ετσι, µε θ = θ (k), E θ (k)(u 2 ) = 1 4 x 1θ (k) 1 2 + 1 = u(k) 2. 4θ(k) Πρέπει τώρα να µεγιστοποιηθεί η E θ (k)(l c (θ)). έχουµε, Επειδή η l c (θ) είναι γραµµική E(l c (θ)) = E(u 2 + x 4 ) log(θ) + E(x 2 + x 3 ) log(1 θ). Το µέγιστο επιτυγχάνεται όταν θ (k+1) = u (k) 2 + x 4. u (k) 2 + x 2 + x 3 + x 4 Πιο κάτω ϐλέπουµε πως εφαρµόζεται ο E-M αλγόριθµος για το πιο πάνω πα- ϱάδειγµα στην R, ϑέτοντας θ (0) = 0.10: > theta=0.1 > p1=1/2+theta/4 > p2=1/4-theta/4 > p3=1/4-theta/4 > p4=theta/4 > x<-rmultinom(1,size=100,prob=c(p1,p2,p3,p4)) 275

> > thetainitial=0.60 ####initial value, that is \theta_{0} > it <- 0 ####iterative count > del <- 1 ####iterative adjustment > thetaold=thetainitial ###assign the initial value to theta_{1} > while(abs(del) > 0.000001 && (it <- it+1) < 20) ##Loop for 20 iterations and + ##prespecified presicion + { + u2=(x[1]*thetaold)/(2+thetaold) ##Expectation step + thetanew=(u2+x[4])/(sum(x)-x[1]+u2) ##Maximization step + del=thetanew-thetaold ##Calculate the difference + ##between two iterations + thetaold=thetanew ##assign thetanew to thetaold for + ##the recursions + cat(it, thetanew, "\n") ##List the iterations + } 1 0.2333333 2 0.1391061 3 0.1047372 4 0.09068726 5 0.08467897 6 0.08206028 7 0.08090947 8 0.08040192 9 0.0801777 10 0.08007859 11 0.08003476 12 0.08001537 13 0.0800068 14 0.080003 15 0.08000133 16 0.08000059 Οπως παρατηρούµε, για να πάρουµε ακρίβεια στο έκτο δεκαδικό στοιχείο στην εκτίµησή µας χρειάστηκαν δεκαέξι επαναλήψεις, και η εκτιµήτρια µεγίστης πιθανοφάνειας για το θ υπολογίστηκε να είναι ίση µε 0.08000059, ενώ η αληθινή τιµή του θ είναι ίση µε 0.10. Ξαντρέχωντας τον αλγόριθµο για θ (0) = 0.2 παίρνουµε τα 276

πιο κάτω αποτελέσµατα : 1 0.3402985 2 0.2634429 3 0.2330699 4 0.2197439 5 0.2136309 6 0.2107696 7 0.2094176 8 0.2087760 9 0.2084709 10 0.2083256 11 0.2082564 12 0.2082235 13 0.2082078 14 0.2082003 15 0.2081967 16 0.208195 17 0.2081942 Είναι ϕανερό ότι σε αυτήν την περίπτωση για να γίνει η σύγκλιση σε ακρίβεια στο έκτο δεκαδικό στοιχείο χρειάστηκαν δεκαεπτά επαναλήψεις, καταλήγοντας στην τιµή 0.2081942 ως εκτίµηση του θ. 23.2 εύτερο Παράδειγµα : Παραλλαγή του Πειρά- µατος Ελέγχου Επιβίωσης Χρησιµοποιώντας Εκθετικό Μοντέλο Εστω ότι ο χρόνος επιβίωσης ενός λαµπτήρα ακολουθεί την εκθετική κατανοµή µε µέση τιµή θ. Για να εκτιµηθεί το θ, καταµετρήθηκε ο χρόνος n λαµπτήρων από την ώρα που ανάβουν για πρώτη ϕορά µέχρι να πάψουν να λειτουργούν, x 1,..., x n. Σε ένα άλλο πείραµα, ελέγχθηκαν m λαµπτήρες, αλλά αυτήν την ϕορά δεν καταµετρήθηκαν ξεχωριστά ο χρόνος επιβίωσης του κάθε λαµπτήρα, αλλά ο αριθµός των λαµπτήρων, r, οι οποίοι έπαψαν να λειτουργούν σε µία χρονική στιγµή t. Τα ελλειπή δεδοµένα είναι οι χρόνοι επιβίωσης των λαµπτήρων στο δεύτερο 277

πείραµα, u 1,..., u m. Τότε, l c (θ; x; u) = n(log(θ) + x/θ) m (log(θ) + u i /θ). Η αναµενόµενη τιµή του χρόνου επιβίωσης ενός λαµπτήρα που δεν έχει ακόµη πάψει να λειτουργεί είναι ίση µε t + θ, i=1 ενώ, κάποιου που έχει πάψει να λειτουργεί είναι ίση µε θ te t/θ(k) 1 e t/θ(k). Συνεπώς, χρησιµοποιώντας µία προσωρινή τιµή θ (k), και το γεγονός ότι οι r από τους m λαµπτήρες δεν λειτουργούν, έχουµε την E U x,θ (k)(l c ) να δίνεται στη µορφή q (k) (x, θ) = (n + m) log(θ) 1 θ (n x + (m r)(t + θ(k) ) + r(θ (k) th (k) )), όπου, h (k) = e t/θ(k) 1 e t/θ(k). Το k-οστό Μ ϐήµα ορίζει τη µέγιστη τιµή συναρτήσει της µεταβλητής θ, η οποία, δεδοµένου του θ (k), παρατηρείται στο σηµείο θ (k+1) = 1 n + m (n x + (m r)(t + θ(k) ) + r(θ (k) th (k) )). Ξεκινώντας µε µία ϑετική τιµή θ (0), η πιο πάνω εξίσωση επαναλαµβάνεται µέχρι να επέλθει η σύγκλιση. Η αναµενόµενη τιµή q (k) δε χρειάζεται να υπολογίζεται κάθε ϕορά. Για να δούµε πως δουλεύει ο αλγόριθµος, παράγονται αρχικά µερικά τεχνητά δεδοµένα µε τη ϐοήθεια της R: > # Generate data from an exponential with theta=2, and with the second > # experiment truncated at t=3. Note that R uses a form of the > # exponential in which the parameter is a multiplier; i.e., the R > # parameter is 1/theta. Set the seed, so computations are reproducible. > > set.seed(4) > n<-100 > m<-500 > theta<-2 278

> t<-3 > x<-rexp(n,1/theta) > r<-min(which(sort(rexp(m,1/theta))>=3))-1 Συνεχίζοντας, εφαρµόζεται ο E-M αλγόριθµος στην R χρησιµοποιώντας ως αρχική τιµή το θ (0) = 1 > # We begin with theta=1. > # (Note that theta.k is set to theta.kp1 at the beginning of the loop.) > theta.k<-.01 > theta.kp1<-1 > # Do some preliminary computations > n.xbar<-sum(x) > # Then loop and test for convergence > it <- 0 ####iterative count > del <- 1 ####iterative adjustment > while(abs(del) > 0.000001 && (it <- it+1) < 20) ###Loop for 20 iterations + ###and prespecified presicion + { + theta.kp1<-(n.xbar+ + (m-r)*(t+theta.k)+ + r*(theta.k- + t*exp(-t/theta.k)/(1-exp(-t/theta.k)) + ) + )/(n+m) + del<- theta.kp1-theta.k + theta.k<-theta.kp1 + cat(it, theta.kp1, "\n") + } 1 0.938414 2 1.631730 3 1.933344 4 2.034420 5 2.065981 6 2.075641 7 2.078580 8 2.079472 9 2.079743 279

10 2.079826 11 2.079851 12 2.079858 13 2.079860 14 2.079861 Παρατηρείται λοιπόν ότι η σύγκλιση στην εκτίµηση του θ επέρχεται µετά α- πό δεκατέσσερις επαναλήψεις, δίνοντας την τιµή 2.079861 µε ακρίβεια στο έκτο δεκαδικό στοιχείο. 23.3 Τρίτο Παράδειγµα : Εκτίµηση Κανονικού Μοντέλου Πεπερασµένης Μίξης Ενα κανονικό µοντέλο µίξης µπορεί να ορισθεί από δύο κανονικές κατανοµές, N(µ 1, σ 2 1) και N(µ 2, σ 2 2). Η πιθανότητα µία τυχαία µεταβλητή (αυτή που µπορεί να παρατηρηθεί) να ακολουθεί την πρώτη κατανοµή είναι w. Η παράµετρος σε αυτό το µοντέλο είναι το διάνυσµα θ = (w, µ 1, σ 2 1, µ 2, σ 2 2). Η συνάρτηση πυκνότητας πιθανότητας της µίξης δίνεται από : p(y; θ) = wp 1 (y; µ 1, σ 2 1) + (1 w)p 2 (y; µ 2, σ 2 2), όπου p j (y; µ j, σj 2 ) είναι η συνάρτηση πυκνότητας πιθανότητας της κανονικής µε παραµέτρους µ j και σ 2 j. Στον τυπικό µετασχηµατισµό C = (X, U), το X συµβολίζει τα δεδοµένα που έχουν παρατηρηθεί, και το U δίνει την κατηγορία των δεδοµένων που δεν έχουν παρατηρηθεί. Εστω U = 1 αν η παρατήρηση είναι από την πρώτη κατανοµή, και U = 0 αν η παρατήρηση είναι από την δεύτερη κατανοµή. Η µη δεσµευµένη αναµενόµενη τιµή E(U) δίνει την πιθανότητα µία παρατήρηση να προέρχεται από την πρώτη κατανοµή, η οποία είναι ίση µε w. Εστω n παρατηρήσεις του X, x 1,..., x n. εδοµένης µιας αρχικής τιµής του θ, µπορεί να εκτιµηθεί η δεσµευµένη αναµενόµενη τιµή E(U/x) για οποιαδήποτε πραγµάτωση του X: E(U/x, θ (k) ) = w (k) p 1 (x; µ (k) 1, σ2 1(k) ) p(x; w (k), µ (k) 1, σ2 (k) 1, µ (k) 2, σ2 (k) 2 ). Το ϐήµα Μ του E-M αλγόριθµου είναι οι γνωστές Ε.Μ.Π. των παραµέτρων : w (k+1) = 1 n E(U xi, θ (k) ) 280

µ (k+1) 1 1 = q (k) (x nw (k+1) i, θ (k) )x i σ1 2 (k+1) 1 = q (k) (x nw (k+1) i, θ (k) )(x i µ (k+1) 1 ) 2 µ (k+1) 1 2 = q (k) (x n(1 w (k+1) i, θ (k) )x i ) σ2 2 (k+1) 1 = q (k) (x n(1 w (k+1) i, θ (k) )(x i µ (k+1) 2 ) 2 ) Για να δούµε πως δουλεύει ο αλγόριθµος για την εκτίµηση της w, παράγουµε µερικά τεχνητά δεδοµένα στην R: > # Normal mixture. Generate data from normal mixture with w=0.7, > # mu_1=0, sigma^2_1=1, mu_2=1, sigma^2_2=2. > # Note that R uses sigma, rather than sigma^2 in rnorm. > # Set the seed, so computations are reproducible. > > set.seed(4) > n<-300 > w<-0.7 > mu1<-0 > sigma21<-1 > mu2<-5 > sigma22<-2 > x<-ifelse(runif(n)<w, rnorm(n,mu1,sqrt(sigma21)),rnorm(n,mu2,sqrt(sigma22))) > # Initialize > theta.k<-.1 > theta.kp1<-.5 > > it <- 0 ####iterative count > del <- 1 ####iterative adjustment > while(abs(del) > 0.000001 && (it <- it+1) < 20) ###Loop for 20 iterations + ###and prespecified presicion + { + tmp<-theta.k*dnorm(x,mu1,sqrt(sigma21)) + ehat.k<-tmp/(tmp+(1-theta.k)*dnorm(x,mu2,sqrt(sigma22))) 281

+ theta.kp1<-mean(ehat.k) + del<- theta.kp1-theta.k + theta.k<-theta.kp1 + cat(it, theta.kp1, "\n") + } 1 0.6130451 2 0.6686083 3 0.6715901 4 0.671751 5 0.6717596 6 0.6717601 Οπως ϕαίνεται από τα αποτελέσµατα, ο αλγόριθµος συγκλίνει σε έξι επαναλήψεις, µε ακρίβεια στο έκτο δεκαδικό στοιχείο, στην εκτίµηση 0.6717601. 282