n + 1 X(1 + X). ) = X i i=1 i=1

ΕΞΕΤΑΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΣΤΑΤΙΣΤΙΚΗ I: ΕΚΤΙΜΗΤΙΚΗ 6 Σεπτεµβρίου 005 Εξεταστική περίοδος Σεπτεµβρίου 005 ΘΕΜΑΤΑ 1 1. Εστω X (X 1,..., X ) τυχαίο δείγµα από γεωµετρική κατανοµή Ge(), Θ (0, 1). (α) (10 µονάδες) Να δειχεί ότι η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ και να ϐρεεί επαρκής και πλήρης στατιστική συνάρτηση. (ϐ) (10 µονάδες) Εστω X ο δειγµατικός µέσος και S η δειγµατική διασπορά. Να δειχεί µέσω τού Θεωρήµατος Lehma Scheffé ότι E{S X} + 1 X(1 + X). (γ) (10 µονάδες) Για «µεγάλο», να κατασκευασεί ένα 100(1 α)% προσεγγιστικό διάστηµα εµπιστοσύνης για το g() 1/.. Εστω X, Y ανεξάρτητες τυχαίες µεταβλητές µε κατανοµές γάµµα X G(α 1, ), Y G(α, ), Θ (0, ), όπου α 1, α είναι γνωστοί ϑετικοί αριµοί. (α) (15 µονάδες) Να ϐρεεί ο εκτιµητής µέγιστης πιανοφάνειας τού. (ϐ) (15 µονάδες) Να εξετασεί αν ο εκτιµητής που ϐρήκατε στο (α) είναι αποδεκτός για το µε κριτήριο το µέσο τετραγωνικό σφάλµα. Λύσεις 1. (α) Εχουµε X i f 1 (x; ) (1 ) x I {0,1,,...} (x), Θ, X f(x ; ) f 1 (x i ; ) (1 ) x i I {0,1,,...} (x i ) i1 i1 (1 ) x i I {0,1,,...} (x ) exp { log + x i log(1 )} I {0,1,,...} (x ), Θ. Η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ γιατί έχει πυκνότητες τής µορφής f(x ; ) exp { A() + B(x ) + C()T (x ) }, Θ, x S {x ; f(x ; ) > 0}, όπου A() log, B(x ) 0, C() log(1 ), T (x ) x i και το σύνολο S είναι το {0, 1,,...} που δεν εξαρτάται από το. Συνεπώς η στατιστική συνάρτηση T T (X ) X i

είναι επαρκής. Επειδή το πεδίο τιµών τού C() είναι το (, 0) [αφού (0, 1) 1 (0, 1) log(1 ) (, 0) ] το οποίο είναι το ίδιο ένα ανοικτό σύνολο, η T είναι και πλήρης. (ϐ) Σύµφωνα µε το Θεώρηµα Lehma Scheffé, αν S είναι µία οποιαδήποτε στατιστική συνάρτηση και η T είναι επαρκής και πλήρης, τότε η ϐελτίωση Rao Blackwell τού S, δηλαδή η στατιστική συνάρτηση E{S T } είναι ο ΑΟΕ εκτιµητής τού g() E S. Θέλουµε να υπολογίσουµε την δεσµευµένη µέση τιµή E{S X} όπου S είναι η δειγµατική διασπορά. Από το (α) ξέρουµε ότι η X i είναι επαρκής και πλήρης άρα το ίδιο ισχύει και για τον X X i / που είναι ένα προς ένα µετασχησµατισµός τού X i. Συνεπώς ο E{S X} ϑα είναι ο ΑΟΕ εκτιµητής τού g() E S. Αλλά ξέρουµε ότι η δειγµατική διασπορά είναι αµερόληπτος εκτιµητής τής διασποράς άρα g() Var X 1 (1 )/. Αρκεί λοιπόν να δείξουµε ότι ο ΑΟΕ εκτιµητής τού (1 )/ είναι ο X(1 +1 + X) κάτι που ϑα προκύψει αµέσως αν δείξουµε ότι είναι αµερόληπτος εκτιµητής του αφού είναι συνάρτηση τής επαρκούς και πλήρους στατιστικής συνάρτησης X. Εχουµε { } E + 1 X(1 + X) + 1 E { X + X } + 1 {E X + E X } + 1 {E X + Var X + (E X) } { 1 + 1 ( ) } 1 + 1 + 1, Θ. (γ) Αφού E X 1 (1 )/ και Var X 1 (1 )/, από το Κεντρικό Οριακό Θεώρηµα ϑα έχουµε { } X 1 { X + 1 1/} d N (0, 1) καώς, Θ. (1) 1 1 Ενας τρόπος να προχωρήσουµε είναι ο εξής. Από την (1) έχουµε ότι { lim P z X + 1 1/} α/ z α/ 1 α, Θ, 1 όπου z α/ είναι το α ποσοστιαίο σηµείο τής N (0, 1). Οµως, z α/ ( X + 1 1/) 1/ 1/ { X + 1 1/} z α/ 1 ( zα/ X + 1 1 ) { X + 1 1/} 1 ( 1 1 ( z α/ ) 1 + {z α/ ( X + 1)} 1 + ( X + 1) 0. z α/ ) zα/

(Η ϕορά τής ανισότητας στην δεύτερη γραµµή δεν αλλάζει γιατί 0 < < 1 1/ > 1 1/ 1/ > 0.) Καταλήξαµε σε ένα τριώνυµο ως προς 1/ το οποίο ϑα είναι αρνητικό για τιµές τού 1/ µεταξύ τών ϱιζών αφού ο συντελεστής τού δευτεροβάµιου όρου είναι zα/ που είναι ϑετικός για επαρκώς µεγάλο. Οι ϱίζες τού τριωνύµου είναι ( X + 1) z α/ ± {z α/ ( X + 1)} 4( X + 1) ( z α/ ) ( zα/ ) ( X + 1) zα/ ± z α/ zα/ + 4 X(1 + X) ( zα/ ), άρα για µεγάλο ένα 100(1 α)% προσεγγιστικό διάστηµα εµπιστοσύνης για το g() 1/ είναι το ( X + 1) z α/ z α/ zα/ + 4 X(1 + X) ( zα/ ), ( X + 1) z α/ + z α/ ( z α/ ) z α/ + 4 X(1 + X) Ενας δεύτερος τρόπος (κατά την γνώµη µου πιο απλός) για να ϐρούµε ένα προσεγγιστικό διάστηµα εµπιστοσύνης είναι µε χρήση τού Θεωρήµατος Slutsky το οποίο µάς επιτρέπει να αντικαταστήσουµε στην (1) την τυπική απόκλιση στον παρονοµαστή µε έναν συνεπή εκτιµητή της. Από τον ασενή νόµο τών µεγάλων αριµών έχουµε X p E X 1 1, Θ, άρα X(1 + X) p ( ) 1 1 + 1 1, p Θ, και X(1 + 1 X), Θ. [Σηµείωση. Την ιδέα για τον X(1 + X) µπορούµε να την πάρουµε και από το (ϐ) αφού πολλαπλασιασµένος µε το /( + 1) που συγκλίνει στην µονάδα είναι ο ΑΟΕ εκτιµητής τού (1 )/.] Εφαρµόζοντας το Θεώρηµα Slutsky ϐλέπουµε ότι { X + 1 1/} X(1 + X) d N (0, 1), Θ, και µπορούµε εύκολα να καταλήξουµε στο 100(1 α)% ασυµπτωτικό διάστηµα εµπιστοσύνης για το 1/, [. (α) Εχουµε X + 1 z α/ X(1 + X) X f 1 (x; ) xα1 1 e x/ Γ(α 1 ) α I 1 (0, ) (x), Y f (y; ) yα 1 e y/ Γ(α ) α I (0, )(y), ] X(1 + X), X + 1 + zα/. (X, Y ) f(x, y; ) f 1 (x; )f (y; ) xα1 1 y α 1 e (x+y)/ Γ(α 1 )Γ(α ) α 1+α I (0, ) (x, y)..

Για παρατηρηέν (x, y) (0, ) η συνάρτηση πιανοφάνειας είναι ο λογάριµός της είναι L( x, y) xα1 1 y α 1 e (x+y)/ Γ(α 1 )Γ(α ) α 1+α, (0, ), log L( x, y) (α 1 1) log x + (α 1) log y x + y και η παράγωγός του ως προς είναι Θέτοντας log L( x ) 0 παίρνουµε x + y log L( x ) α 1 + α, (0, ). 0 x + y α 1 + α log Γ(α 1 ) log Γ(α ) (α 1 + α ) log, x + y α 1 + α. Η δεύτερη παράγωγος τού λογαρίµου τής πιανοφάνειας ως προς είναι + y) log L( x ) (x 3 + α 1 + α, (0, ). και στο σηµείο (x + y)/(α 1 + α ) που µηδενίζει την πρώτη παράγωγο έχουµε (x + y) [(x + y)/(α 1 + α )] 3 + α 1 + α [(x + y)/(α 1 + α )] (α 1 + α ) 3 (x + y) < 0. (0, ), Άρα η πιανοφάνεια παρουσιάζει µέγιστο στο ˆ(x, y) (x + y)/(α 1 + α ). Επειδή ˆ(x, y) Θ (0, ) για κάε (x, y) (0, ), αυτή είναι η εκτίµηση µέγιστης πιανοφάνειας τού για τα παρατηρηέντα δεδοµένα και η στατιστική συνάρτηση ˆ ˆ(X, Y ) (X + Y )/(α 1 + α ) είναι ο εκτιµητής µέγιστης πιανοφάνειας τού. (ϐ) Ας ϑεωρήσουµε την κλάση εκτιµητών τού C : {c(x + Y ); c R}. Παίρνοντας c 1/(α 1 + α ) ϐλέπουµε ότι η C περιέχει τον εµπ τού. Το ΜΤΣ τού c(x + Y ) είναι ΜΤΣ(c(X + Y ), ) E {c(x + Y ) } Var {c(x + Y )} + [E {c(x + Y )} ] c {Var X + Var Y } + [c{e X + E Y } ] c (α 1 + α ) + [c(α 1 + α ) ] { c (α 1 + α ) + [c(α 1 + α ) 1] } { c (α 1 + α )(α 1 + α + 1) c(α 1 + α ) + 1 }, Θ.

Είναι εύκολο να ϐρούµε ότι το c που ελαχιστοποιεί (για κάε Θ) το τριώνυµο µέσα στο άγκιστρο είναι το c 1/(α 1 + α + 1). Συνεπώς ο εκτιµητής στην κλάση C µε το ελάχιστο ΜΤΣ είναι ο (X + Y )/(α 1 + α + 1). Επειδή λοιπόν ( ) ( ) X + Y X + Y ΜΤΣ α 1 + α + 1, < ΜΤΣ,, Θ, α 1 + α ο εµπ τού είναι µη αποδεκτός µε κριτήριο το ΜΤΣ.

ΕΞΕΤΑΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΣΤΑΤΙΣΤΙΚΗ I: ΕΚΤΙΜΗΤΙΚΗ 6 Σεπτεµβρίου 005 Εξεταστική περίοδος Σεπτεµβρίου 005 ΘΕΜΑΤΑ 1. Εστω X (X 1,..., X ) τυχαίο δείγµα από κατανοµή µε πυκνότητα πιανότητας f 1 (x; ) x (1 ) x 1 I {1,,...} (x), Θ (0, 1), η οποία έχει µέση τιµή E X 1 ( )/ και διασπορά Var X 1 (1 )/. (α) (10 µονάδες) Να δειχεί ότι η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ και να ϐρεεί επαρκής και πλήρης στατιστική συνάρτηση. (ϐ) (10 µονάδες) Εστω X ο δειγµατικός µέσος και S η δειγµατική διασπορά. Να δειχεί µέσω τού Θεωρήµατος Lehma Scheffé ότι E{S X} + 1 ( X 1). (γ) (10 µονάδες) Για «µεγάλο», να κατασκευασεί ένα 100(1 α)% προσεγγιστικό διάστηµα εµπιστοσύνης για το g() 1/.. Εστω X, Y ανεξάρτητες τυχαίες µεταβλητές µε εκετικές κατανοµές X E(), Y E(/), Θ (0, ). (α) (15 µονάδες) Να ϐρεεί ο εκτιµητής µέγιστης πιανοφάνειας τού. (ϐ) (15 µονάδες) Να εξετασεί αν ο εκτιµητής που ϐρήκατε στο (α) είναι αποδεκτός για το µε κριτήριο το µέσο τετραγωνικό σφάλµα. Λύσεις 1. (α) Εχουµε X i f 1 (x; ) x (1 ) x 1 I {1,,...} (x), Θ, X f(x ; ) f 1 (x i ; ) x i (1 ) xi 1 I {1,,...} (x i ) i1 i1 ( ) x i (1 ) x i I {1,,...} (x ) i1 exp {log x i + log + x i log(1 ) log(1 )} I {1,,...} (x ), Θ.

Η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ γιατί έχει πυκνότητες τής µορφής f(x ; ) exp { A() + B(x ) + C()T (x ) }, Θ, x S {x ; f(x ; ) > 0}, όπου A() log log(1 ), B(x ) log x i, C() log(1 ), T (x ) x i και το σύνολο S είναι το {1,,...} που δεν εξαρτάται από το. Συνεπώς η στατιστική συνάρτηση T T (X ) X i είναι επαρκής. Επειδή το πεδίο τιµών τού C() είναι το (, 0) [αφού (0, 1) 1 (0, 1) log(1 ) (, 0) ] το οποίο είναι το ίδιο ένα ανοικτό σύνολο, η T είναι και πλήρης. (ϐ) Σύµφωνα µε το Θεώρηµα Lehma Scheffé, αν S είναι µία οποιαδήποτε στατιστική συνάρτηση και η T είναι επαρκής και πλήρης, τότε η ϐελτίωση Rao Blackwell τού S, δηλαδή η στατιστική συνάρτηση E{S T } είναι ο ΑΟΕ εκτιµητής τού g() E S. Θέλουµε να υπολογίσουµε την δεσµευµένη µέση τιµή E{S X} όπου S είναι η δειγµατική διασπορά. Από το (α) ξέρουµε ότι η X i είναι επαρκής και πλήρης άρα το ίδιο ισχύει και για τον X X i / που είναι ένα προς ένα µετασχησµατισµός τού X i. Συνεπώς ο E{S X} ϑα είναι ο ΑΟΕ εκτιµητής τού g() E S. Αλλά ξέρουµε ότι η δειγµατική διασπορά είναι αµερόληπτος εκτιµητής τής διασποράς άρα g() Var X 1 (1 )/. Αρκεί λοιπόν να δείξουµε ότι ο ΑΟΕ εκτιµητής τού (1 )/ είναι ο +1 ( X 1) κάτι που ϑα προκύψει αµέσως αν δείξουµε ότι είναι αµερόληπτος εκτιµητής του αφού είναι συνάρτηση τής επαρκούς και πλήρους στατιστικής συνάρτησης X. Εχουµε { } E + 1 ( X 1) + 1 E ( X 1) + 1 {E X 1} + 1 {Var X + (E X) 1} { ( ) (1 ) + 1 + 1} (1 ), Θ. (γ) Αφού E X 1 ( )/ και Var X 1 (1 )/, από το Κεντρικό Οριακό Θεώρηµα ϑα έχουµε { } X (1 ) { X + 1 /} (1 ) d N (0, 1) καώς, Θ. () Ενας τρόπος να προχωρήσουµε είναι ο εξής. Από την () έχουµε ότι { lim P z X + 1 /} α/ z α/ 1 α, Θ, (1 )

όπου z α/ είναι το α ποσοστιαίο σηµείο τής N (0, 1). Οµως, { X + 1 /} z α/ z α/ { X + 1 /} (1 ) (1 ) z α/ ( X + 1 /) ( / zα/ / X + 1 ) ( ) zα/ ( z α/ ) 1 + {z α/ ( X + 1)} 1 + ( X + 1) 0. (Η ϕορά τής ανισότητας στην δεύτερη γραµµή δεν αλλάζει γιατί 0 < < 1 1/ > 1 1/ 1/ > 0.) Καταλήξαµε σε ένα τριώνυµο ως προς 1/ το οποίο ϑα είναι αρνητικό για τιµές τού 1/ µεταξύ τών ϱιζών αφού ο συντελεστής τού δευτεροβάµιου όρου είναι ( z α/ ) που είναι ϑετικός για επαρκώς µεγάλο. Οι ϱίζες τού τριωνύµου είναι {( X + 1) z α/ } ± 4{z α/ ( X + 1)} 8( X + 1) ( z α/ ) 4( zα/ ) ( X + 1) zα/ ± z α/ zα/ + ( X 1) ( z α/ ) άρα για µεγάλο ένα 100(1 α)% προσεγγιστικό διάστηµα εµπιστοσύνης για το g() 1/ είναι το ( X + 1) zα/ z α/ zα/ + ( X 1) ( zα/ ), ( X + 1) z α/ + z α/ ( z α/ ) z α/ + ( X 1). Ενας δεύτερος τρόπος (κατά την γνώµη µου πιο απλός) για να ϐρούµε ένα προσεγγιστικό διάστηµα εµπιστοσύνης είναι µε χρήση τού Θεωρήµατος Slutsky το οποίο µάς επιτρέπει να αντικαταστήσουµε στην () την τυπική απόκλιση στον παρονοµαστή µε έναν συνεπή εκτιµητή της. Από τον ασενή νόµο τών µεγάλων αριµών έχουµε X p E X 1, Θ, άρα /( X p + 1) / ( + 1 ) ( ), Θ, και 1 X+1 ( ) 1 ( X 1) p (1 ) 1, Θ, ( X p 1) X+1 (1 ), Θ. [Σηµείωση. Την ιδέα για τον 1 ( X 1) µπορούµε να την πάρουµε και από το (ϐ) αφού πολλαπλασιασµένος µε το /( + 1) που συγκλίνει στην µονάδα είναι ο ΑΟΕ εκτιµητής τού (1 )/.] Εφαρµόζοντας το Θεώρηµα Slutsky ϐλέπουµε ότι { X + 1 /} 1 ( X 1) d N (0, 1), Θ,

και µπορούµε εύκολα να καταλήξουµε στο 100(1 α)% ασυµπτωτικό διάστηµα εµπιστοσύνης για το 1/, [ ( ) ( 1 X X 1 + 1 z α/, 1 )] X X 1 + 1 + z α/.. (α) Εχουµε X f 1 (x; ) 1 e x/ I (0, ) (x), Y f (y; ) e y/ I (0, ) (y), (X, Y ) f(x, y; ) f 1 (x; )f (y; ) e (x+y)/ I (0, ) (x, y). Για παρατηρηέν (x, y) (0, ) η συνάρτηση πιανοφάνειας είναι L( x, y) e (x+y)/, (0, ), ο λογάριµός της είναι και η παράγωγός του ως προς είναι Θέτοντας log L( x ) 0 παίρνουµε log L( x, y) log log x + y, (0, ), log L( x ) + x + y, (0, ). 0 + x + y x + y. Η δεύτερη παράγωγος τού λογαρίµου τής πιανοφάνειας ως προς είναι log L( x ) (x + y) 3, (0, ). και στο σηµείο (x + y)/ που µηδενίζει την πρώτη παράγωγο έχουµε (x + y) [(x + y)/] [(x + y)/] 3 8 (x + y) < 0. Άρα η πιανοφάνεια παρουσιάζει µέγιστο στο ˆ(x, y) (x + y)/. Επειδή ˆ(x, y) Θ (0, ) για κάε (x, y) (0, ), αυτή είναι η εκτίµηση µέγιστης πιανοφάνειας τού για τα παρατηρηέντα δεδοµένα και η στατιστική συνάρτηση ˆ ˆ(X, Y ) (X +Y )/ είναι ο εκτιµητής µέγιστης πιανοφάνειας τού. (ϐ) Ας ϑεωρήσουµε την κλάση εκτιµητών τού C : {c(x + Y ); c R}.

Παίρνοντας c 1/ ϐλέπουµε ότι η C περιέχει τον εµπ τού. Το ΜΤΣ τού c(x + Y ) είναι ΜΤΣ(c(X + Y ), ) E {c(x + Y ) } Var {c(x + Y )} + [E {c(x + Y )} ] c {Var X + 4Var Y } + [c{e X + E Y } ] c { + 4( /4)} + [c{ + (/)} ] { c + (c 1) } { 6c 4c + 1 }, Θ. Είναι εύκολο να ϐρούµε ότι το c που ελαχιστοποιεί (για κάε Θ) το τριώνυµο µέσα στο άγκιστρο είναι το c 1/3. Συνεπώς ο εκτιµητής στην κλάση C µε το ελάχιστο ΜΤΣ είναι ο (X + Y )/3. Επειδή λοιπόν ΜΤΣ ( X + Y ο εµπ τού είναι µη αποδεκτός µε κριτήριο το ΜΤΣ. 3 ) ( ) X + Y, < ΜΤΣ,, Θ,