ΕΞΕΤΑΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΣΤΑΤΙΣΤΙΚΗ I: ΕΚΤΙΜΗΤΙΚΗ 8 Ιουνίου 005 Εξεταστική περίοδος Ιουνίου 005 ΘΕΜΑΤΑ Εστω X = (X,, X n ), n, τυχαίο δείγµα από κατανοµή Bernoull B(, θ), θ Θ = (0, ) (α) (0 µονάδες) Να δειχθεί ότι η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ και να ϐρεθεί επαρκής και πλήρης στατιστική συνάρτηση (ϐ) (0 µονάδες) Να ϐρεθεί ο ΑΟΕ εκτιµητής τού g(θ) = E θ (X X ) (γ) (0 µονάδες) Για «µεγάλο» n, να κατασκευασθεί ένα 00( α)% προσεγγιστικό διάστηµα εµπιστοσύνης για το θ Εστω X,, X n ανεξάρτητες παρατηρήσεις, X N (θt, ), =,, n, µε θ Θ = R και t,, t n γνωστές µη µηδενικές σταθερές (α) (0 µονάδες) Να δειχθεί ότι ο εκτιµητής µέγιστης πιθανοφάνειας τού θ είναι ο ˆθ = ˆθ(X ) = t X n t (ϐ) (0 µονάδες) Ποια είναι η κατανοµή τού ˆθ και ποιο είναι το µέσο τετραγωνικό σφάλµα του ; (γ) (0 µονάδες) Να κατασκευασθεί ένα 00( α)% διάστηµα εµπιστοσύνης για το θ Λύσεις (α) Εχουµε X f (x; θ) = θ x ( θ) x I 0, (x), θ Θ, X f(x ; θ) = f (x ; θ) = θ x ( θ) x I 0, (x ) = θ x ( θ) n x I 0, n(x ) = exp n log( θ) + ( ) θ x log I θ 0, n(x ) θ Θ Η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ γιατί έχει πυκνότητες τής µορφής f(x ; θ) = exp A(θ) + B(x ) + C(θ)T (x ), θ Θ, S = x ; f(x ; θ) > 0, x ( ) όπου A(θ) = n log( θ), B(x ) = 0, C(θ) = log θ θ, T (x ) = x και το σύνολο S είναι το 0, n που δεν εξαρτάται από το θ Συνεπώς η στατιστική συνάρτηση T = T ) = (X X είναι
επαρκής Επειδή το πεδίο τιµών τού C(θ) είναι το R (αφού θ (0, ) το οποίο είναι το ίδιο ένα ανοικτό σύνολο, η T είναι και πλήρης θ θ (0, ) C(θ) R) (ϐ) Είναι g(θ) = E θ (X X ) = E θ X + X X X ) = θ θ, αφού E θ X = E θx = Var θx +(E θ X ) = θ( θ)+θ = θ και E θ (X X ) = (E θ X )(E θ X ) = θ (λόγω ανεξαρτησίας) Είναι E θ T = nθ, θ Θ, άρα E θ (T/n) = θ, θ Θ, και E θ T = Var θ T + (E θ T ) = nθ( θ) + n θ = nθ + n(n )θ, θ Θ, συνεπώς, T E θ n(n ) = E θt E θ T n(n ) = nθ + n(n )θ nθ n(n ) = n(n )θ n(n ) = θ, θ Θ Συνδυάζοντας τα παραπάνω παίρνουµε ότι [ T E θ n ] ( ) [ T T ] = E θ E θ = (θ θ ) = g(θ), θ Θ, n(n ) n n(n ) [ T πράγµα που σηµαίνει ότι ο n ] είναι ο ΑΟΕ εκτιµητής τού g(θ) γιατί είναι αµερόληπτος και συνάρτηση τής επαρκούς και πλήρους στατιστικής συνάρτησης T n(n ) (γ) είτε στην Ενότητα 73 τών σηµειώσεων τού µαθήµατος Οποιοδήποτε από τα διαστήµατα (736) και (737) είναι µία σωστή απάντηση Εναλλακτικά, επειδή το θ είναι η µέση τιµή τής κατανοµής, µπορείτε να χρησιµοποιήσετε και το διάστηµα (7) (α) Εχουµε X f (x; θ) = X f(x ; θ) = exp (x θt ) I R (x), π f (x ; θ) = = (π) n/ exp Για παρατηρηθέν x R n η συνάρτηση πιθανοφάνειας είναι ο λογάριθµός της είναι L(θ x ) = (π) n/ exp exp (x θt ) I R (x ) π (x θt ) I R n(x ) (x θt ), θ R, log L(θ x ) = n log π (x θt ), θ R,
και η παράγωγός του είναι log L(θ x ) = θ Θέτοντας θ log L(θ x ) = 0 παίρνουµε t (x θt ), θ R 0 = t (x θt ) = t x θ t θ = t x n t Η δεύτερη παράγωγος τού λογαρίθµου τής πιθανοφάνειας είναι θ log L(θ x ) = t που είναι αρνητική για κάθε θ R, συνεπώς και για θ = ˆθ(x ) = t x / t πράγµα που σηµαίνει ότι σε αυτό το σηµείο ο λογάριθµος τής πιθανοφάνειας (και η πιθανοφάνεια) πα- ϱουσιάζουν µέγιστο Επειδή ˆθ(x ) Θ = R για κάθε x R n, αυτή είναι η εκτίµηση µέγιστης πιθανοφάνειας τού θ για τα παρατηρηθέντα δεδοµένα και η στατιστική συνάρτηση ˆθ = ˆθ(X ) = t X / t είναι ο εκτιµητής µέγιστης πιθανοφάνειας τού θ (ϐ) Ξέρουµε γενικά ότι αν X,, X n είναι ανεξάρτητες τυχαίες µεταβλητές µε X N (µ, σ ), =,, n, και a,, a n είναι σταθερές, τότε j= a jx j N ( j= a jµ j, j= a j σ j ) Για τον ˆθ έχουµε a j = t j / t, άρα ακολουθεί κανονική κατανοµή µε µέση τιµή j= t j t θt j = θ j= t j t = θ j= t j t = θ και διασπορά j= ( tj t ) = ( t ) t j = j= t Αφού E θ ˆθ = θ, θ Θ, ο ˆθ είναι αµερόληπτος εκτιµητής τού θ, συνεπώς το µέσο τετραγωνικό σφάλµα του ισούται µε την διασπορά του : ΜΤΣ(ˆθ, θ) = t ˆθ θ (γ) Από το (ϐ) ϐλέπουµε ότι η τυχαία µεταβλητή T, θ) := (X / t ποσότητα οδηγός Χρειαζόµαστε τώρα σταθερές c < c έτσι ώστε c T, θ) c = a, θ Θ, (X N (0, ), άρα είναι
Για το 00( α)% διάστηµα εµπιστοσύνης ίσων ουρών αρκεί να πάρουµε c = z α/ = (το ( α/) ποσοστιαίο σηµείο τής κατανοµής τής ποσότητας οδηγού) και c = (το (α/) ποσοστιαίο σηµείο τής κατανοµής τής ποσότητας οδηγού) Οπότε, z ˆθ θ α/ δηλαδή το το θ ˆθ ˆθ t t, ˆθ + / t t θ ˆθ + t = a, θ Θ, = a, θ Θ, είναι ένα 00( α)% διάστηµα εµπιστοσύνης για
ΕΞΕΤΑΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΣΤΑΤΙΣΤΙΚΗ I: ΕΚΤΙΜΗΤΙΚΗ 8 Ιουνίου 005 Εξεταστική περίοδος Ιουνίου 005 ΘΕΜΑΤΑ Εστω X = (X,, X n ) τυχαίο δείγµα από κατανοµή Posson P(θ), θ Θ = (0, ) (α) (0 µονάδες) Να δειχθεί ότι η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ και να ϐρεθεί επαρκής και πλήρης στατιστική συνάρτηση (ϐ) (0 µονάδες) Να ϐρεθεί ο ΑΟΕ εκτιµητής τού g(θ) = E θ (X ) (γ) (0 µονάδες) Για «µεγάλο» n, να κατασκευασθεί ένα 00( α)% προσεγγιστικό διάστηµα εµπιστοσύνης για το θ Εστω X,, X n ανεξάρτητες παρατηρήσεις, X N (θ, σ ), =,, n, µε θ Θ = R και σ,, σ n γνωστές ϑετικές σταθερές (α) (0 µονάδες) Να δειχθεί ότι ο εκτιµητής µέγιστης πιθανοφάνειας τού θ είναι ο ˆθ = ˆθ(X ) = τ τ X (ϐ) (0 µονάδες) Ποια είναι η κατανοµή τού ˆθ και ποιο είναι το µέσο τετραγωνικό σφάλµα του ; (γ) (0 µονάδες) Να κατασκευασθεί ένα 00( α)% διάστηµα εµπιστοσύνης για το θ Λύσεις (α) Εχουµε θ θx X f (x; θ) = e x! I Z + (x), θ Θ, X f(x ; θ) = f (x ; θ) = = e nθ θ x x! I Z n + (x ) e θ θx x! I Z + (x ) = exp nθ + x log θ log x! I Z n + (x ) θ Θ Η οικογένεια κατανοµών τού X είναι µία ΜΕΟΚ γιατί έχει πυκνότητες τής µορφής f(x ; θ) = exp A(θ) + B(x ) + C(θ)T (x ), θ Θ, x S = x ; f(x ; θ) > 0, όπου A(θ) = nθ, B(x ) = log x!, C(θ) = log θ, T (x ) = x και το σύνολο S είναι το Z n + που δεν εξαρτάται από το θ Συνεπώς η στατιστική συνάρτηση T = T (X ) = X είναι επαρκής
Επειδή το πεδίο τιµών τού C(θ) είναι το R (αφού θ (0, ) C(θ) = log θ R) το οποίο είναι το ίδιο ένα ανοικτό σύνολο, η T είναι και πλήρης (ϐ) Είναι g(θ) = E θ (X ) = E θ X X + = θ θ +, αφού E θ X = Var θx + (E θ X ) = θ + θ και E θ X = θ Είναι E θ T = nθ, θ Θ, άρα E θ (T/n) = θ, θ Θ, και E θ T = Var θ T + (E θ T ) = nθ + n θ, θ Θ, συνεπώς, E θ ( T n ) = E θt E θ T n = nθ + n θ nθ n = n θ n = θ, θ Θ Συνδυάζοντας τα παραπάνω παίρνουµε ότι ( T E θ n ) ( T n + = E θ n πράγµα που σηµαίνει ότι ο T ) ( ) T E θ + = θ θ + = g(θ), θ Θ, n + είναι ο ΑΟΕ εκτιµητής τού g(θ) γιατί είναι αµερόληπτος n n και συνάρτηση τής επαρκούς και πλήρους στατιστικής συνάρτησης T (γ) Στο Παράδειγµα 74 στις σηµειώσεις τού µαθήµατος κατασκευάζεται ένα τέτοιο προσεγγιστικό διάστηµα εµπιστοσύνης Εναλλακτικά, επειδή το θ είναι η µέση τιµή τής κατανοµής, µπορείτε να χρησιµοποιήσετε και το διάστηµα (7) ή ακόµη, χρησιµοποιώντας το Θεώρηµα Slutsky µπορείτε να δείξετε ότι n( Xn θ) Xn [ και να πάρετε το διάστηµα d N (0, ) X n Xn n, Xn + ] Xn n (α) Εχουµε X f (x; θ) = exp τ π τ (x θ) I R (x), X f(x ; θ) = f (x ; θ) = exp τ π τ (x θ) I R (x ) ( n ) = (π) n/ τ exp (x θ) I R n(x ) τ τ Για παρατηρηθέν R x n η συνάρτηση πιθανοφάνειας είναι ( n ) L(θ x ) = (π) n/ τ exp (x θ), θ R,
ο λογάριθµός της είναι και η παράγωγός του είναι log L(θ x ) = n log π log τ log L(θ x ) = θ Θέτοντας θ log L(θ x ) = 0 παίρνουµε 0 = τ (x θ) = τ x θ τ τ (x θ), θ R τ θ = Η δεύτερη παράγωγος τού λογαρίθµου τής πιθανοφάνειας είναι θ log L(θ x ) = τ που είναι αρνητική για κάθε θ R, συνεπώς και για θ = ˆθ(x ) = (x θ), θ R, τ τ τ που σηµαίνει ότι σε αυτό το σηµείο ο λογάριθµος τής πιθανοφάνειας (και η πιθανοφάνεια) πα- ϱουσιάζουν µέγιστο x x / τ πράγµα Επειδή ˆθ(x ) Θ = R για κάθε x R n, αυτή είναι η εκτίµηση µέγιστης πιθανοφάνειας τού θ για τα παρατηρηθέντα δεδοµένα και η στατιστική συνάρτηση ˆθ = ˆθ(X ) = τ X / τ είναι ο εκτιµητής µέγιστης πιθανοφάνειας τού θ (ϐ) Ξέρουµε γενικά ότι αν X,, X n είναι ανεξάρτητες τυχαίες µεταβλητές µε X N (µ, σ ), =,, n, και a,, a n είναι σταθερές, τότε j= a jx j N ( j= a jµ j, j= a j σ j ) Για τον ˆθ έχουµε a j = τj / τ, άρα ακολουθεί κανονική κατανοµή µε µέση τιµή j= j= και διασπορά ( ) τ j τ τj = ( τ τj τ θ = θ ) j= j= τ j τ = θ τj 4 τj = ( τ ) j= τ j = τ Αφού E θ ˆθ = θ, θ Θ, ο ˆθ είναι αµερόληπτος εκτιµητής τού θ, συνεπώς το µέσο τετραγωνικό σφάλµα του ισούται µε την διασπορά του : ΜΤΣ(ˆθ, θ) = τ (γ) Από το (ϐ) ϐλέπουµε ότι η τυχαία µεταβλητή T, θ) := (X ˆθ θ / τ ποσότητα οδηγός Χρειαζόµαστε τώρα σταθερές c < c έτσι ώστε c T (X, θ) c = a, θ Θ, N (0, ), άρα είναι
Για το 00( α)% διάστηµα εµπιστοσύνης ίσων ουρών αρκεί να πάρουµε c = z α/ = (το ( α/) ποσοστιαίο σηµείο τής κατανοµής τής ποσότητας οδηγού) και c = (το (α/) ποσοστιαίο σηµείο τής κατανοµής τής ποσότητας οδηγού) Οπότε, z ˆθ θ α/ δηλαδή το για το θ ˆθ / τ τ θ ˆθ + = a, θ Θ, τ = a, θ Θ, ˆθ, ˆθ + τ n είναι ένα 00( α)% διάστηµα εµπιστοσύνης τ