Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 13 Μαρτίου /31

Σχετικά έγγραφα
Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

Εφαρμοσμένη Στατιστική

Στατιστική. Εκτιμητική

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

Στατιστική Συμπερασματολογία

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE)

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

A(θ) = n log θ B(x ) = 0. T (x ) = x i. Γ(n)θ n =

ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική

Μέθοδος μέγιστης πιθανοφάνειας

Στατιστική Συμπερασματολογία

(X1 X 2 ) 2}. ( ) f 1 (x i ; θ) = θ x i. (1 θ) n x i. x i log. i=1. i=1 t2 i

Στατιστική Συμπερασματολογία

Μέθοδος μέγιστης πιθανοφάνειας

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

CRAMER-RAO ΚΑΤΩ ΦΡΑΓΜΑ - ΑΠΟ ΟΤΙΚΟΙ ΕΚΤΙΜΗΤΕΣ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Στατιστική Συμπερασματολογία

Εκτιμήτριες. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Ασκήσεις για ΑΕΙ και ΤΕΙ. Kglykos.gr. σε Εκτιμήτριες. μέθοδος ροπών και μέγιστης πιθανοφάνειας

X = = 81 9 = 9

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής

Μέθοδος Newton-Raphson

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Στατιστική Συμπερασματολογία

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

Στατιστική Συμπερασματολογία

Εισόδημα Κατανάλωση

Ανισότητα Cramér Rao

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΙΑ ΣΥΝΤΟΜΗ ΑΝΑΣΚΟΠΗΣΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Εισαγωγή στη θεωρία ακραίων τιμών

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Στατιστική Ι-Θεωρητικές Κατανομές Ι

ΕΞΕΤΑΣΕΙΣ ΣΤΟ ΜΑΘΗΜΑ ΠΙΘΑΝΟΤΗΤΕΣ ΣΤΑΤΙΣΤΙΚΗ ΤΜΗΜΑΤΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΙΟΥΝΙΟΥ ( ) ΟΜΑΔΑ Α ( 40% )

9. Παλινδρόμηση και Συσχέτιση

Εφαρμοσμένη Στατιστική

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Στατιστική Επιχειρήσεων ΙΙ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΑΣΚΗΣΕΙΣ ΣΤΗΝ ΕΚΤΙΜΗΤΙΚΗ

Πανεπιστήμιο Πελοποννήσου

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Απλή Παλινδρόμηση και Συσχέτιση

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

Δειγματικές Κατανομές

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

f(y) dy = b a dy = b a x f(x) dx = b a dx = x 2 = b2 a 2 2(b a) b a dx = = (a2 + ab + b 2 )(b a) 3(b a)

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

7. Εκτιμήσεις Τιμων Δεικτων

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Είδη Μεταβλητών. κλίµακα µέτρησης

Εφαρμοσμένη Στατιστική

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Μαθηματικά Και Στατιστική Στη Βιολογία

ΚΕΦΑΛΑΙΟ 1ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 3: ΟΡΙΑ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ

Στοιχεία της θεωρίας εκτίμησης παραμέτρων

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Transcript:

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 13 Μαρτίου 2017 1/31

Βασικοί ορισμοί. Ορισμός 1: Τυχαίο δείγμα. Τυχαίο δείγμα μεγέθους n από την κατανομή F(x; θ) (ή σ.π.π. f(x; θ)) καλείται μια συλλογή ανεξάρτητων και ισόνομων τυχαίων μεταβλητών X 1, X 2,..., X n F(x; θ) (ή ισοδύναμα f(x; θ)). Το τυχαίο δείγμα είναι στην ουσία μετρήσεις μιας τυχαίας μεταβλητής X f(x; θ). Π.χ. αν μας ενδιαφέρει το εισόδημα X των νοικοκυριών της Ελλάδας, η f(x; θ) είναι η κατανομή των εισοδημάτων όλων των νοικοκυριών της χώρας και οι X 1, X 2,..., X n είναι μετρήσεις που πήραμε ρωτώντας στην τύχη (αντιπροσωπευτικά) n νοικοκυριά. Ορισμός 2: Δειγματοληπτικός χώρος. Δειγματοληπτικός χώρος καλείται το σύνολο των δυνατών τιμών του δείγματος (π.χ. αν X R, τότε ο δειγματοληπτικός χώρος είναι ο R n ). Επίσης, παραμετρικός χώρος Θ καλείται το σύνολο των επιτρεπτών τιμών των παραμέτρων θ (π.χ. αν θ = (µ, σ 2 ) τότε ο παραμετρικός χώρος είναι ο R (0, )). 2/31

Βασικοί ορισμοί. Ορισμός 3: Στατιστική (ή δειγματική) συνάρτηση. Εστω τυχαίο δείγμα X 1, X 2,..., X n F(x; θ). Στατιστική (ή δειγματική) συνάρτηση (σ.σ.) καλείται κάθε μετρήσιμη συνάρτηση T = T(X) = T(X 1, X 2,..., X n ) των X 1, X 2,..., X n, που δεν εξαρτάται από άγνωστες παραμέτρους. Οι πλέον συνήθεις στατιστικές συναρτήσεις που εμφανίζονται σε προβλήματα της Στατιστικής είναι οι επόμενες: X = n 1 X, m r = n 1 X r, σ2 = n 1 (X X) 2. Π.χ. αν μας ενδιαφέρει να εκτιμήσουμε το χρόνο ζωής των παραγόμενων λαμπών μιας εταιρείας τότε είναι λογικό να πάρουμε δείγμα n λαμπών, και να χρησιμοποιήσουμε το μέσο όρο τους X ως εκτιμήτρια του χρόνου ζωής μιας οποιασδήποτε λάμπας. Προφανώς, μία εκτιμήτρια συνάρτηση T(X) είναι και αυτή μία τυχαία μεταβλητή (κάθε φορά που παίρνουμε ένα άλλο τυχαίο δείγμα X η T δίνει διαφορετική τιμή). 3/31

Βασικοί ορισμοί. Σημαντική παρατήρηση: Πως συνδέονται οι στατιστικές συναρτήσεις ( X, mr, σ 2, κ.λ.π.) που μελετάμε με το γεγονός ότι οι παρατηρήσεις X 1, X 2,..., X n που τις απαρτίζουν θεωρούνται ανεξάρτητες και ισόνομες προερχόμενες από κατανομή f(x; θ); Απάντηση: Καταρχήν παρατηρούμε ότι οι εν λόγω συναρτήσεις ορίζονται (όλες) ως κάποιας μορφής άθροισμα των X 1, X 2,..., X n. Ιδιότητα ανεξαρτησίας: Το ότι οι X 1, X 2,..., X n είναι ανεξάρτητες σημαίνει ότι V f(x ) = V(f(X )) (1) όπου f κάποια συνάρτηση των X : για παράδειγμα: στην περίπτωση του X, f(x) = x στην περίπτωση του mr, f(x) = x r στην περίπτωση του σ2, f(x) = (x X) 2 Η σχέση E f(x ) = Ef(X ), (2) ισχύει ανεξάρτητα του αν οι X 1, X 2,..., X n είναι ανεξάρτητες ή όχι. 4/31

Βασικοί ορισμοί. Η (1) είναι συνέπεια του ότι για 2 ανεξάρτητες τ.μ. X, Y, V(X + Y) = V(X) + V(Y). Τι ισχύει αν X, Y δεν είναι ανεξάρτητες; Ιδιότητα ισονομίας: Το ότι οι X 1, X 2,..., X n είναι ισόνομες σημαίνει ότι η κάθε μία από τις X ακολουθεί ίδια ακριβώς κατανομή (με ίδιες παραμέτρους) με τις άλλες. Δηλαδή η κάθε μια από τις X έχει ίδια μέση τιμή και διακύμανση με τις άλλες. Με άλλα λόγια EX 1 = EX 2 = = EX n = µ (3) όπου µ είναι η μέση τιμή της κοινής τους κατανομής και μπορεί να είναι είτε παράμετρος της κατανομής (όπως στην περίπτωση της κανονικής) είτε να υπολογίζεται συναρτήσει των παραμέτρων της κατανομής όπως στην περίπτωση της ομοιόμορφης. Φυσικά, ισχύει και ότι V(X 1 ) = V(X 2 ) = = V(X n ) = σ 2 (4) Οι (1), (3), (4) δεν ισχύουν αν οι X 1, X 2,..., X n δεν είναι ισόνομες. Μη ισονομία σημαίνει ότι οι X προέρχονται από την ίδια κατανομή αλλά με διαφορετικές παραμέτρους: X f(x; θ ), = 1,..., n και θ 1 θ 2 θ n. 5/31

Βασικοί ορισμοί. Οι τιμές που παίρνει μια στατιστική συνάρτηση θα πρέπει να βρίσκονται εντός του παραμετρικού χώρου Θ στον οποίο κινείται η παράμετρος θ Ορισμός 4. Εκτιμήτρια συνάρτηση. Εκτιμήτρια συνάρτηση της παραμέτρου θ (ή των παραμέτρων θ ή μιας παραμετρικής συνάρτησης g(θ)) θα καλείται μία σ.σ. T = T(X) η οποία χρησιμοποιείται για την εκτίμηση του θ (ή των θ ή του g(θ)). Για ένα τυχαίο δείγμα X μπορούμε να κατασκευάσουμε πολλές εκτιμήτριες για μια παράμετρο θ (π.χ. οι X, X1, (X (n) X (1) )/2, θα μπορούσαν να προταθούν ως εκτιμήτριες του μέσου µ ενός κανονικού πληθυσμού). Το ερώτημα είναι ποιες θεωρούνται «καλές» ή ποια είναι η «καλύτερη» από όλες. Διαισθητικά, αναμένουμε ότι μια «καλή εκτιμήτρια» T του θ θα λαμβάνει τιμές 1. «γύρω» από το θ και 2. «κοντά» στο θ με «μεγάλη» πιθανότητα. 6/31

Ιδιότητες εκτιμητών. Για το 1 απαιτούμε η τυχαία μεταβλητή T να έχει μέση τιμή θ ή «σχεδόν» θ Για το 2 απαιτούμε η τυχαία μεταβλητή T να έχει «μικρή» διασπορά. Π.χ. η δίπλα εικόνα έχει την κατανομή των τιμών τριών εκτιμητών της μέσης τιμής ενός πληθυσμού. Η πραγματική μέση τιμή είναι 0. Ποιόν εκτιμητή θα επιλέγατε; dnorm(x, 0, 1) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 4 2 0 2 4 Πρακτική Άσκηση 1: Παράγετε 20 δείγματα 20 παρατηρήσεων έκαστο από την N(2, 2 2 ) κατανομή. 1. εκτιμήστε την μέση τιμή κάθε δείγματος 2. κάντε τη γραφική παράσταση της κατανομής των τιμών 3. επαναλάβετε την άσκηση χρησιμοποιώντας ως εκτιμητή της μέσης τιμής την συνάρτηση (X mn + X max )/2 4. συγκρίνετε τις δύο κατανομές και διατυπώστε τα συμπεράσματα σας x 7/31

Αμερόληπτες εκτιμήτριες. Ορισμός 5: Αμερόληπτη εκτιμήτρια. Μία εκτιμήτρια συνάρτηση T της g(θ) καλείται αμερόληπτη εκτιμήτρια (α.ε.) εάν E(T) = E(T(X)) = g(θ) για κάθε θ. Η T θα λέγεται ασυμπτωτικά αμερόληπτη αν lm E(T(X)) = g(θ) για κάθε θ. n + Η διαφορά bas(t) = E(T) g(θ) καλείται μεροληψία της εκτιμήτριας T. Η μεροληψία μιας α.ε. είναι 0. Παράδειγμα 1: Εστω δείγμα X 1,..., X n από την ομοιόμορφη κατανομή U(0, θ), θ (0, + ). Δείξτε ότι μια αμερόληπτη εκτιμήτρια του θ είναι η T(X) = 2n 1 X. Απάντηση: Εχουμε ET(X) = 2n 1 E X = 2n 1 (3) ( ) EX = 2EX 1 = 2(θ + 0)/2 = θ ( ) για X U(a, b), EX = (a + b)/2. 8/31

Παράδειγμα. Παράδειγμα 2: Εάν X = (X 1, X 2 ) είναι ένα τυχαίο δείγμα από μια κατανομή με διασπορά σ 2, να δειχθεί ότι η στατιστική συνάρτηση (X 1 X 2 ) 2 /2 είναι αμερόληπτος εκτιμητής του σ 2. Απάντηση: Εχουμε ET(X) = 1 2 E(X 1 X 2 ) 2 = 1 2 E(X 2 1 + X 2 2 2X 1X 2 ) ( ) = Ορισμός διακύμ. 1 2 EX 2 1 + 1 2 EX 2 2 (EX 1) 2 ( ) = EX 2 1 (EX 1) 2 = V(X 1 ) = σ 2. ( ) Οι X 1, X 2 είναι ανεξάρτητες άρα E(X 1 X 2 ) = (EX 1 )(EX 2 ) = (EX 1 ) 2 και ( ) EX 2 1 = EX 2 2 (γιατί;). Αν έχουμε ένα τυχαίο δείγμα X 1, X 2,..., X n F(x; θ) με μέση τιμή µ και διασπορά σ 2, δηλ. σε αυτή την περίπτωση θ = (µ, σ 2 ) τότε αποδεικνύονται οι ακόλουθες προτάσεις: Πρόταση 1. Ο δειγματικός μέσος X είναι α.ε. της μέσης τιμής µ με διασπορά V( X) = n 1 σ 2. 9/31

Αμερόληπτες εκτιμήτριες. Απόδειξη: Για την αμεροληψία, η βασική εξίσωση της απόδειξης είναι: E( X) = E 1 n X = 1 n EX = EX 1 = µ (5) Ερώτηση: Τι πρέπει να υποθέσουμε για το δείγμα: X 1, X 2,..., X n για να ισχύει η απόδειξη; Βοήθεια: Χρησιμοποιούμε πουθενά στην (5) την ανεξαρτησία του δείγματος; Την ισονομία; Είναι απαραίτητο να υποθέσουμε είτε ότι X F(x; µ, σ 2 ) ή X F(x; θ), = 1,..., n ή μήπως δεν χρειαζόμαστε τίποτα από τα δύο; Για την διακύμανση, 1 V( X) = V n γιατί; γιατί; X = 1 V(X )= n 1 σ 2 n 2 10/31

Παράδειγμα. Παράδειγμα 3: Εστω δείγμα X 1,..., X n από την ομοιόμορφη κατανομή U(0, θ), θ (0, + ). Να βρεθεί αμερόληπτος εκτιμητής του θ 2. Απάντηση: Με βάση την παραπάνω πρόταση, και βάση του ότι η διακύμανση της ομοιόμορφης κατανομής είναι θ 2 /12 περιμένουμε ο ζητούμενος εκτιμητής να είναι κάποια συνάρτηση του ˆσ 2. Πράγματι, για X U(0, θ) Eˆσ 2 = E 1 (X X) 2 = 1 n n E X 2 2 n n X 2 X + n X = 1 n E X 2 2n X 2 2 + n X = EX 2 2 ne X = EX 2 1 E X 2. (6) Εφόσον το δείγμα είναι από ομοιόμορφη κατανομή, έχουμε EX 1 = θ/2 και V(X 1 ) = θ2 οπότε 12 V(X 1) = EX 2 1 (EX 1) 2 EX 2 1 = θ2. Ομοίως, 3 V( X) = E X 2 (E X) 2 οπότε E X 2 = θ2 + θ2 = θ2 (1+3n). Η (6) δίνει, 12n 4 12n Eˆσ 2 = θ2 3 θ2 (1 + 3n) = 4nθ2 θ 2 3nθ 2 = θ2 (n 1) 12n 12n 12n Οπότε, αμέσως προκύπτει ότι E(12n(n 1) 1 ˆσ 2 ) = θ 2 που είναι ο ζητούμενος α.ε. 11/31

Αμερόληπτες εκτιμήτριες. Πρόταση 2. Η δειγματική διασπορά S 2 είναι α.ε. της διασποράς σ 2. E(S 2 ) = E 1 (X X) 2 = 1 n 1 n 1 E X 2 2 n n X 2 X + n X = 1 n 1 E X 2 2 n X = 1 n 1 EX 2 2 ne X = n n 1 (EX 2 1 E X 2 ), γιατί εφόσον X 1, X 2,..., X n F(x; θ) και ισόνομες, κάθε X έχει μέση τιμή µ διακύμανση σ 2. Επειδή V(X) = EX 2 (EX) 2 έχουμε ότι EX 2 1 = V(X 1) + (EX 1 ) 2 = σ 2 + µ 2, E X 2 = V( X) + (E X) 2 = n 1 σ 2 + µ 2. Άρα τελικά, E(S 2 ) = n n 1 (σ2 + µ 2 n 1 σ 2 µ 2 ) = n n 1 (1 n 1 )σ 2 = σ 2. Αν δεν χρησιμοποιούμε αμερόληπτες ή σχεδόν αμερόληπτες εκτιμήτριες θα έχουμε υποεκτίμηση ή υπερεκτίμηση του g(θ). Μπορεί να υπάρχουν πολλές αμερόληπτες εκτιμήτριες για μία παράμετρο θ, όλες με μέση τιμή θ. 12/31

Αποτελεσματικότητα, Α.Ο.Ε.Δ. εκτίμηση. Το ερώτημα επομένως που τίθεται είναι ποια είναι η καλύτερη; Για τη σύγκριση μεταξύ εκτιμητριών δίνονται οι ακόλουθοι ορισμοί. Ορισμός 6: Αποτελεσματικότητα. Αν T 1, T 2 είναι δύο α.ε. της g(θ), η T 1 θα καλείται αποτελεσματικότερη της T 2 εάν ισχύει ότι V(T 1 ) < V(T 2 ). Ορισμός 7: Α.Ο.Ε.Δ. εκτιμήτρια. Αν μία α.ε. T = T(X) έχει (για κάθε θ) τη μικρότερη διασπορά μεταξύ όλων των α.ε. του g(θ) (που μπορούν να κατασκευαστούν από το τυχαίο δείγμα X) τότε θα καλείται άριστη ή αμερόληπτη ομοιόμορφα ελαχίστης διασποράς (Α.Ο.Ε.Δ.) εκτιμήτρια του g(θ). Προφανώς, αν T 1 είναι Α.Ο.Ε.Δ. και T 2 είναι μια άλλη α.ε. του g(θ), τότε V(T 1 ) V(T 2 ). Συνήθως, προκειμένου να εκτιμήσουμε το g(θ), ως βέλτιστη εκτιμήτρια θεωρείται η Α.Ο.Ε.Δ. εκτιμήτρια (αν υπάρχει). 13/31

Μέτρο πληροφορίας Fsher, ανισότητα Cramer-Rao Για να σιγουρέψουμε ότι ένας εκτιμητής είναι Α.Ο.Ε.Δ., χρειαζόμαστε ένα κάτω φράγμα της διακύμανσης των α.ε. της υπό εκτίμησης ποσότητας. Αυτό το κάτω φράγμα μας το δίνει η ανισότητα Cramer-Rao. Ορισμός 8: ανισότητα Cramer-Rao Εστω ότι ισχύουν οι συνθήκες. και έστω t(θ) = E θ T(X) και t (θ) = θ E θt(x). Τότε V θ (T(X)) I 1 (θ) { t (θ) }2, θ Θ. Επιπλέον, αν η T(X) είναι αμερόληπτος εκτιμητής του g(θ) τότε V θ (T(X)) I 1 (θ) { g (θ) }2, θ Θ. Ορισμός 9: Πληροφορία Fsher. Για ένα δείγμα X 1, X 2,..., X n από μια κατανομή f(x; θ) η ποσότητα ln f(x; θ) I(θ) = E θ λέγεται μέτρο πληροφορίας του Fsher. 14/31

Συνέπεια. Επειδή το κάτω φράγμα Cramer-Rao επαληθεύεται δύσκολα στην πράξη, χρησιμοποιούμε εναλλακτικά μέτρα επιβεβαίωσης της εκτίμησης. Μια ιδιότητα που διαισθητικά αναμένουμε να έχει μια «καλή» εκτιμήτρια είναι αυτή της συνέπειας. Μια συνεπής εκτιμήτρια βελτιώνεται με την αύξηση του μεγέθους του δείγματος, και για πολύ μεγάλο δείγμα γίνεται πρακτικά ίση με την υπό εκτίμηση ποσότητα: Ορισμός 10: Συνέπεια. Μία εκτιμήτρια T n = T(X 1, X 2,..., X n ) μιας παραμετρικής συνάρτησης g(θ) καλείται συνεπής αν ισχύει lm P((T n g(θ)) < ε) = 1 για κάθε ε > 0 n + δηλαδή με άλλα λόγια η T n συγκλίνει κατά πιθανότητα στην g(θ) (T n g(θ) καθώς n +.) 15/31

Συνέπεια. Ενα απλό κριτήριο για τη συνέπεια μιας εκτιμήτριας δίνεται στην ακόλουθη πρόταση. Πρόταση 3. Μία εκτιμήτρια T n = T(X 1, X 2,..., X n ) μιας παραμετρικής συνάρτησης g(θ) είναι συνεπής αν ισχύει lm E(T n) = g(θ), n + lm V(T n) = 0. n + Παράδειγμα: Ο δειγματικός μέσος X ενός τυχαίου δείγματος X 1, X 2,..., X n F(x; µ), είναι συνεπής εκτιμήτρια του μέσου µ. Απάντηση: Πράγματι, από την Πρόταση 1 έχουμε lm E( X) = lm EX 1 = µ n + n + lm V( X) = lm n + n + n 1 σ 2 = 0, άρα ικανοποιούνται οι συνθήκες του ορισμού της συνέπειας. 16/31

Μέσο τετραγωνικό σφάλμα. Η ποσότητα T g(θ) ονομάζεται σφάλμα του εκτιμητή T. Είναι πιο σύνηθες να χρησιμοποιείται το τετράγωνο του σφάλματος γιατί έχει καλύτερες ιδιότητες. Ορισμός 11: Μέσο τετραγωνικό σφάλμα. Αν T είναι μια εκτιμήτρια του g(θ), η ποσότητα MSE(T) = E(T g(θ)) 2 = V(T) + bas 2 (T) καλείται μέσο τετραγωνικό σφάλμα της T από την g(θ). Ορισμός 12. Αν T 1, T 2 είναι δύο εκτιμήτριες της g(θ), η T 1 θα καλείται αποτελεσματικότερη της T 2 εάν ισχύει ότι MSE(T 1 ) < MSE(T 2 ). Από ένα σύνολο εκτιμητριών του g(θ), καλύτερη θεωρείται αυτή που έχει το μικρότερο μέσο τετραγωνικό σφάλμα. Το ζητούμενο είναι να βρεθεί μια εκτιμήτρια συνάρτηση T, η οποία θα ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα. 17/31

Μέσο τετραγωνικό σφάλμα. Παράδειγμα: Να βρεθεί το μέσο τετραγωνικό σφάλμα του εκτιμητή T(X) = 12n(n 1) 1 ˆσ 2 του παραδείγματος 3. Απάντηση: T αμερόληπτος, άρα; MSE { T(X) } = bas 2 (T(X)) + V(T(X))= 12n V (n 1) 2 V(12n(n 1) 1 ˆσ 2 ) = 2 (X X) (1) = 144n2 (n 1) 4 = 144n2 (n 1) 4 ορισμός διακύμανσης V(X X)= {E(X X) 2 [ ] 2 } E(X X) = 144n3 (n 1) 4 { E(X 2 1 ) E X 2 } 144n3 (n 1) 4 γιατί κάνει 0; [ E(X - X) ] 2 = 144n3 (n 1) 4 θ 2 12 = 12n3 (n 1) 4 θ2. 18/31

Η μέθοδος της μέγιστης πιθανοφάνειας. Η πιο γνωστή μέθοδος εύρεσης μιας εκτιμήτριας για τις παραμέτρους θ μιας κατανομής F είναι η μέθοδος μέγιστης πιθανοφάνειας. Η μέθοδος αυτή είναι αρκετά ισχυρή διότι, με μία σχετικά απλή διαδικασία, οδηγεί σε εκτιμήτριες με πολύ καλές ιδιότητες - βασικά παράγει την πιο πιθανή να συμβεί στην πράξη εκτίμηση. Θεωρούμε ένα τυχαίο δείγμα X 1, X 2,..., X n από μία κατανομή με συνάρτηση σ.π. f(x; θ) που εξαρτάται από τις παραμέτρους θ = (θ 1,..., θ k ), και επιθυμούμε να εκτιμήσουμε το θ. Ορισμός 12: Συνάρτηση πιθανοφάνειας. Συνάρτηση πιθανοφάνειας ή πιθανοφάνεια του δείγματος X 1, X 2,..., X n καλείται η από κοινού σ.π. των X 1, X 2,..., X n θεωρούμενη ως συνάρτηση του θ, δηλαδή η n L X (θ) = f(x ; θ) 19/31

Η μέθοδος της μέγιστης πιθανοφάνειας. Ορισμός 13: εκτιμήτρια μέγιστης πιθανοφάνειας. Μία στατιστική συνάρτηση ˆθ καλείται εκτιμήτρια μέγιστης πιθανοφάνειας (ΕΜΠ) των παραμέτρων θ αν μεγιστοποιεί την πιθανοφάνεια L X (θ), δηλαδή, αν ισχύει ότι L X ( ˆθ) = sup L X (θ) θ Θ Ισοδύναμα, αντί να αναζητούμε το σημείο μεγίστου της L X (θ), είναι πιο εύκολο να αναζητούμε το σημείο μεγίστου της l(θ) = ln(l X (θ) (έχουν το ίδιο σημείο μεγίστου διότι η συνάρτηση ln είναι αύξουσα). Για k = 1 (δηλ. θ = θ), η συνάρτηση l(θ) παραγωγίζεται σε ολόκληρο τον παραμετρικό χώρο Θ οπότε μπορούμε να βρούμε το σημείο μεγίστου μέσα από τη λύση της εξίσωσης l (θ) = 0, ελέγχοντας παράλληλα ότι η δεύτερη παράγωγος l (θ) < 0. Για k 2, δηλ. όταν θ = (θ 1, θ 2,..., θ k ) έχουμε ένα πρόβλημα βελτιστοποίησης στο R k. 20/31

Η μέθοδος της μέγιστης πιθανοφάνειας. Δεδομένου ότι η l(θ) είναι παραγωγίσιμη στο Θ R k, σχηματίζουμε τις εξισώσεις l(θ) θ 1 = 0,..., l(θ) θ k = 0 η λύση του πιο πάνω συστήματος δίνει τον εκτιμητή μέγιστης πιθανόφάνειας ˆθ της θ, υπό τον όρο ότι αυτός ο εκτιμητής ικανοποιεί και την 2 l(θ) θ 2 1 < 0,..., 2 l(θ) θ 2 k < 0. Είναι πιθανό στη λύση ενός τέτοιου προβλήματος να μην υπάρχει πεπερασμένο μέγιστο, να υπάρχουν παραπάνω από ένα μέγιστα, η να έχουμε ακριβώς ένα μέγιστο. Αν ˆθ είναι η ΕΜΠ εκτιμήτρια της θ και g είναι αμφιμονοσήμαντη συνάρτηση, τότε η g( ˆθ) είναι η ΕΜΠ εκτιμήτρια της g(θ). Δείτε και τα παραδείγματα 1.11 1.14 από το βιβλίο `Μαθηματική Στατιστική στο moodle για εφαρμογές. 21/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Άσκηση 1: Εστω τυχαίο δείγμα X 1, X 2,..., X n από την εκθετική κατανομή με σ.π.π. f(x; θ) = θ 1 exp{xθ 1 }, 0 x +, θ (0, + ) Να υπολογισθεί ο Ε.Μ.Π. για την παράμετρο θ. Λύση: Η συνάρτηση πιθανοφάνειας του δείγματος είναι: n n 1 X L(θ) = f(x ; θ) = θ = 1 θ n e 1 n θ X θ e Ο λογάριθμος της συνάρτησης πιθανοφάνειας είναι: ln L(θ) = n ln θ 1 X θ Παραγωγίζοντας και εξισώνοντας με το 0 παίρνουμε ln L(θ) θ = n θ + 1 X θ 2 = 0 θ = X. Για να επιβεβαιώσουμε ότι έχουμε πράγματι μέγιστο, 2 ln L(θ) θ 2 = n θ 2 2 θ 3 X θ= X = n X 2 2n X X 2 < 0. 22/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Άσκηση 2: Εστω τυχαίο δείγμα X 1, X 2,..., X n από την κανονική κατανομή με σ.π.π. f(x; θ 1, θ 2 ) = 1 θ2 1 2π exp { (x θ 1) 2 2θ 2 }, θ 1 +, θ 2 (0, + ) Να υπολογισθεί ο Ε.Μ.Π. για τις παραμέτρους θ = (θ 1, θ 2 ). Λύση: Η συνάρτηση πιθανοφάνειας του δείγματος είναι: n n 1 1 L(θ) = f(x ; θ) = exp { (X } θ 1 ) 2 θ2 2π 2θ 2 = 1 1 exp θ n 2 (2π) n 1 (X θ 1 ) 2 2θ 2. Ο λογάριθμος της συνάρτησης πιθανοφάνειας είναι: ln L(θ) = n 2 ln θ 2 n 2 ln(2π) 1 2θ 2 (X θ 1 ) 2. 23/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Άσκηση 2 συνέχεια: Παραγωγίζοντας και εξισώνοντας με το 0 παίρνουμε ln L(θ) θ 1 Επίσης, ln L(θ) θ 2 από όπου παίρνουμε = 2( 1) n (X θ 1 ) = 0 θ 2 (X θ 1 ) = 0 ˆθ 1 = X = n n + (X θ 1 ) 2 = 0 nθ 2θ 2 2θ 2 2 + (X θ 1 ) 2 = 0 2 ˆθ 2 = ˆσ 2 = n 1 2 (X X) Άσκηση: Επιβεβαιώστε ότι οι δεύτερες μερικές παράγωγοι ως προς θ 1 και θ 2 του λογάριθμου της συνάρτησης πιθανοφάνειας είναι αρνητικές οπότε όντως έχουμε βρει τα μέγιστα. 24/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Άσκηση 3: Εχουμε παρατηρήσεις X 1, X 2,..., X n οι οποίες αφορούν ώρες επιβίωσης συγκεκριμένων πλοίων σε συνθήκες πίεσης (τα δεδομένα δίνονται στο αρχείο data.csv στο moodle). Ενα συγκεκριμένο μοντέλο που χρησιμοποιείται για ανάλυση δεδομένων επιβίωσης είναι η κατανομή Webull. f(y; λ; θ) = λyλ 1 θ λ e ( y θ )λ, y > 0, όπου λ παράμετρος που καθορίζει το σχήμα της κατανομής, και θ παράμετρος που καθορίζει την κλίμακα. Για το συγκεκριμένο παράδειγμα ξέρουμε ότι λ = 2, δηλ. X 1, X 2,..., X n Webull(2, θ). Η συνάρτηση πιθανοφάνειας είναι η f(x 1,..., X n ; θ) = n λx λ 1 θ λ e ( X θ ) λ. (7) 25/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Ισοδύναμα μπορούμε να μεγιστοποιήσουμε το λογάριθμο της (7). Εχουμε L(θ) = log f(x 1,..., X n ; θ) = Παραγωγίζοντας, d L(θ) dθ (λ 1) log X + log λ λ log θ = 0 λ θ + λx λ θ λ+1 = λn θ + λ n X λ = 0 θ λ+1 λ=2 2n θ + 2 n X 2 = 0 n n θ 3 θ = X 2 θ 3 θ 2 = n 1 X 2 θ = n 1 ( ) λ X θ. X 2. 26/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Για να υλοποιήσουμε τη διαδικασία εκτίμησης στην R: lfetmes<-as.matrx(read.csv("data.csv", header = FALSE, sep = "")) thetause <-mean(lfetmes) #MLE estmate of theta loglkelhood <- functon(data, theta, lambda=2) #defne the log - lkelhood functon { logl <- sum((lambda -1)*log(data)+log(lambda)-lambda*log(theta)-(data/ theta)^lambda) return(logl) } theta1 <- seq(7000, 15000, by=100) # defne a range of parameters loglk <- rep(na, length(theta1)) # defne a vector to store results for ( n 1:length(theta1)) #calculate log -lkelhood for each theta { loglk[] <- loglkelhood(lfetmes, theta1[]) } plot(theta1, loglk, type="l") # plot the results Ερώτηση: Ποιος είναι ο εκτιμητής μέγιστης πιθανοφάνειας της θ; (τι νούμερο υπολογίσαμε στην R; - αντιστοιχεί στο μέγιστο που φαίνεται στο γράφημα της επόμενης σελίδας; 27/31

Εκτίμηση με τη μέθοδο της μέγιστης πιθανοφάνειας. Το γράφημα της παρουσιάζεται στο πιο κάτω σχήμα και παρατηρούμε ότι υπάρχει τιμή της θ η οποία μεγιστοποιεί την L(θ). loglk 495 490 485 8000 10000 12000 14000 theta1 Η διαδικασία που δείχνουμε εδώ είναι χρήσιμη όταν δεν μπορούμε να βρούμε μέγιστο με αναλυτικό τρόπο οπότε χρησιμοποιούμε αριθμητικές μεθόδους για μεγιστοποίηση της συνάρτησης πιθανοφάνειας. 28/31

Εκτίμηση με τη μέθοδο των ροπών. Η μέθοδος των ροπών, όπως και η μέθοδος μέγιστης πιθανοφάνειας αποσκοπεί στον προσδιορισμό άγνωστων παραμέτρων μιας κατανομής. εφαρμόζεται σε κατανομές που υπάρχουν ροπές k-τάξης και περιγράφεται ως εξής: Εστω τ.δ. X 1, X 2,..., X n f(x; θ) με θεωρητικές ροπές µ 1 = EX, µ 2 = EX 2,..., µ k = EX k. Προσέξτε την αντιστοιχία με τις παραμέτρους μιας κατανομής: µ = µ 1 = EX, σ 2 = EX 2 µ 2 = µ 2 µ 2, κ.λ.π. Υπενθυμίζεται ότι οι δειγματικές ροπές αντίστοιχα είναι οι Θεώρημα m 1 = n 1 X, m 2 = n 1 X 2,..., m k = n 1 X k. Οι δειγματικές ροπές είναι αμερόληπτοι εκτιμητές των θεωρητικών ροπών. 29/31

Εκτίμηση με τη μέθοδο των ροπών. Το παραπάνω θεώρημα δείχνει τον τρόπο εκτίμησης με τη μέθοδο των ροπών: εξισώνονται οι θεωρητικές ροπές με τις δειγματικές ροπές ίσης τάξης. Με τον τρόπο αυτό συνδέονται οι εκτιμώμενες παράμετροι με στατιστικές συναρτήσεις και από τη λύση των εξισώσεων που προκύπτουν, υπολογίζονται οι εκτιμητές. Παράδειγμα 1: Να εκτιμηθεί η παράμετρος θ της σ.π.π. f(x; θ) = θx θ 1, 0 < x < 1, 0 < θ < + δοθέντος δείγματος μεγέθους n από την κατανομή. Λύση: Εχουμε να εκτιμήσουμε μόνο μία παράμετρο οπότε χρειαζόμαστε μόνο μία εξίσωση. Η ροπή πρώτης τάξης είναι µ 1 = EX = 1 0 xθx θ 1 dx = θ θ + 1. Η δειγματική ροπή πρώτης τάξης είναι η m 1 = X οπότε εξισώνοντας τις µ 1 και m 1 έχουμε: X = θ θ + 1 ˆθ = X. 1 X 30/31

Εκτίμηση με τη μέθοδο των ροπών. Παράδειγμα 2: Να εκτιμηθούν οι παράμετροι µ, σ 2 της N(x; µ, σ 2 ), δοθέντος δείγματος μεγέθους n από την κατανομή. Λύση: Εδώ τώρα έχουμε να εκτιμήσουμε δύο παραμέτρους οπότε χρειαζόμαστε δυο εξισώσεις. Εχουμε m 1 = µ 1 X = µ, m2 = µ 2 EX 2 = n 1 Χρησιμοποιώντας ότι EX = µ, EX 2 = σ 2 + µ 2, παίρνουμε: µ = n 1 X, σ 2 + µ 2 = n 1 οπότε καταλήγουμε στους εκτιμητές ˆµ = n 1 X, ˆσ 2 = n 1 X 2 µ 2 = n 1 X 2 X 2. X 2 X 2. Ερώτηση: Τι σχέση έχουν με τους εκτιμητές μέγιστης πιθανοφάνειας που υπολογίσαμε πιο πριν; 31/31