ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΕΚΤΙΜΗΣΗ ΓΙΑ ΤΟ ΜΟΝΤΕΛΟ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ

Σχετικά έγγραφα
ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Εφαρμοσμένη Στατιστική

CRAMER-RAO ΚΑΤΩ ΦΡΑΓΜΑ - ΑΠΟ ΟΤΙΚΟΙ ΕΚΤΙΜΗΤΕΣ

ΕΙΣΗΓΗΤΗΣ Κωνσταντινος Πετροπουλος Επικουρος Καθηγητης Τμημα Μαθηματικων Πανεπιστημιου Πατρων ΕΠΙΤΡΟΠΗ Σταυρος Κουρουκλης Καθηγητης Τμημα Μαθηματικων

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

Στατιστική. Εκτιμητική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 13 Μαρτίου /31

A(θ) = n log θ B(x ) = 0. T (x ) = x i. Γ(n)θ n =

Εισαγωγή-Αµερόληπτοι Εκτιµητές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE)

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

(X1 X 2 ) 2}. ( ) f 1 (x i ; θ) = θ x i. (1 θ) n x i. x i log. i=1. i=1 t2 i

Στατιστική Συμπερασματολογία

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

Εισόδημα Κατανάλωση

ΕΚΤΙΜΗΣΗ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΣΤΟ ΜΟΝΤΕΛΟ ΤΗΣ ΤΡΙΠΑΡΑΜΕΤΡΙΚΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

X = = 81 9 = 9

Εφαρμοσμένη Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Τυχαία Διανύσματα και Ανεξαρτησία

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Συμπερασματολογία

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Μαθηματικά Και Στατιστική Στη Βιολογία

3. Κατανομές πιθανότητας

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εισαγωγή στη Στατιστική

Θεωρία Πιθανοτήτων & Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Βιοστατιστική ΒΙΟ-309

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Βιοστατιστική ΒΙΟ-309

Απλή Παλινδρόμηση και Συσχέτιση

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Στατιστική Συμπερασματολογία

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

7. Εκτιμήσεις Τιμων Δεικτων

pdf: X U(a, b) 0, x < a 1 b a, a x b 0, x > b

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Βιοστατιστική ΒΙΟ-309

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

Αριθμητική Ανάλυση και Εφαρμογές

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

S T (x) = exp. (α) m n q x = m+n q x m q x. (β) m n q x = m p x m+n p x. (γ) m n q x = m p x n q x+m. tp x = S Tx (t) = S T (x + t) { x+t

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Other Test Constructions: Likelihood Ratio & Bayes Tests

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

E [X ν ] = E [X (X 1) (X ν + 1)]

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Στοιχεία της θεωρίας εκτίμησης παραμέτρων

Μέθοδος μέγιστης πιθανοφάνειας

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ

ΕΝΟΤΗΤΑ 1: ΟΡΙΣΜΟΣ ΠΕΔΙΟ ΟΡΙΣΜΟΥ ΠΡΑΞΕΙΣ ΣΥΝΑΡΤΗΣΕΩΝ ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΛΥΜΕΝΑ ΘΕΜΑΤΑ ΘΕΜΑ Α

Στατιστική Επιχειρήσεων ΙΙ

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ Οι συντεταγμένες ενός σημείου Απόλυτη τιμή...14

Στην περίπτωση της συνεχούς Τ.Μ. η μάζα πιθανότητας σε κάθε σημείο είναι μηδέν.

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Αριθμητική Ανάλυση και Εφαρμογές

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Στατιστική Συμπερασματολογία

n + 1 X(1 + X). ) = X i i=1 i=1

Στατιστική Συμπερασματολογία

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

Είδη Μεταβλητών. κλίµακα µέτρησης

Transcript:

Δ.Π.Μ.Σ. : Μαθηματικά των Υπολογιστών και των Αποφάσεων Τμήμα Μαθηματικών Τμήμα Μηχανικών Η/Υ & Πληροφορικής ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΕΚΤΙΜΗΣΗ ΓΙΑ ΤΟ ΜΟΝΤΕΛΟ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ Αντιόπη Ν. Κατσαρά A. M. : 351 Επιβλέπων : Κωνσταντίνος Πετρόπουλος Πάτρα, Ιούνιος 216

ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΕΚΤΙΜΗΣΗ ΓΙΑ ΤΟ ΜΟΝΤΕΛΟ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ Αντιόπη Ν. Κατσαρά A. M. : 351 Επιβλέπων : Κωνσταντίνος Πετρόπουλος Εγκρίθηκε από την τριμελή εξεταστική επιτροπή των Φίλιππος Αλεβίζος Αναπληρωτής Καθηγητής Πανεπιστημίου Πατρών Σταύρος Κουρούκλης Καθηγητής Πανεπιστημίου Πατρών Κωνσταντίνος Πετρόπουλος Επίκουρος Καθηγητής Πανεπιστημίου Πατρών Πάτρα, Ιούνιος 216

Πανεπιστήμιο Πατρών, Τμήμα Μαθηματικών Αντιόπη Ν. Κατσαρά - Με την επιφύλαξη παντός δικαιώματος

Περίληψη Η μεταπτυχιακή εργασία εντάσσεται ερευνητικά στην περιοχή της Μαθηματικής Στατιστικής κι έχει ως αντικείμενο το μοντέλο της Εκθετικοποιημένης Γάμμα κατανομής (Exponentiated Gamma Distribution), η οποία ανήκει στην οικογένεια των Εκθετικοποιημένων Κατανομών με σκοπό τη μοντελοποίηση δεδομένων και αποτελεί ένα σημαντικό μοντέλο χρόνου ζωής (life time model). Οι Gupta et. al. (1998) ήταν οι πρώτοι που εισήγαγαν και ασχολήθηκαν με την Εκθετικοποιημένη Γάμμα κατανομή. Μια μια τυχαία μεταβλητή X ακολουθεί την Εκθετικοποιημένη Γάμμα κατανομή αν έχει συνάρτηση κατανομής, F (x; θ, λ) = θλ 2 xe λx [1 e λx (λx + 1)] θ 1, όπου x, θ, λ είναι θετικοί πραγματικοί αριθμοί. Τα θ, λ είναι οι παράμετροι της κατανομής. Όταν θ = 1 και λ = 1 προκύπτει η Γάμμα Κατανομή με παράμετρο σχήματος a = 2 και παράμετρο κλίμακας b = 1. Στην παρούσα διατριβή γίνεται η μελέτη των ιδιοτήτων της Εκθετικοποιημένης Γάμμα κατανομής και παρατίθενται διαφορετικές μέθοδοι εκτίμησης των παραμέτρων της. Στο Κεφάλαιο 1 παρατίθενται, εισαγωγικά, κάποιοι βασικοί ορισμοί και θεωρήματα που είναι απαραίτητα. Στο Κεφάλαιο 2 ορίζεται το μοντέλο της Εκθετικοποιημένης Γάμμα κατανομής και μελετώνται ιδιότητες και χαρακτηριστικά μεγέθη αυτής. Ορίζεται ο Πίνακας Πληροφορίας του Fisher και αναλύονται η Συνάρτηση Επιβίωσης και η Συνάρτηση Κινδύνου. Στο Κεφάλαιο 3 μελετώνται διαφορετικές μέθοδοι εκτίμησης των παραμέτρων της Εκθετικοποιημένης Γάμμα κατανομής. Οι μέθοδοι είναι: Μέθοδος Μέγιστης Πιθανοφάνειας, Μέθοδος βασισμένη σε εκατοστιαία σημεία, Μέθοδος Ελαχίστων Τετραγώνων και Σταθμισμένων Ελαχίστων Τετραγώνων, Μέθοδος Ροπών και τέλος Μέθοδος L ροπών. Παρατίθενται στη συνέχεια γενικά συμπεράσματα αποδοτικότητας αποτελεσματικότητας (efficiency) των εκτιμητών. Το Κεφάλαιο 4 ασχολείται με την Εκτίμηση κατά Bayes των παραμέτρων της Εκθετικοποιημένης Γάμμα κατανομής ως προς την τετραγωνική ζημία και τη συνάρτηση ζημίας LINEX. Τέλος, στο Κεφάλαιο 5 παρατίθενται μερικές μερικές ιδιότητες κι εφαρμογές της Εκθετικοποιημένης Εκθετικής κατανομής, η οποία ανήκει στην ευρύτερη οικογένεια των Εκθετικοποιημένων κατανομών. ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ Εκθετικοποιημένη Γάμμα Κατανομή; Εκτίμηση Μέγιστης Πιθανοφάνειας; Εκτίμηση βασισμένη σε εκατοστιαία σημεία; Εκτίμηση Ελαχίστων Τετραγώνων; Εκτίμηση Σταθμισμένων Ελαχίστων Τετραγώνων; Εκτίμηση Ροπών; Εκτίμηση L ροπών; Εκτίμηση κατά Bayes; Συνάρτηση ζημίας LINEX.

Abstract This thesis presents research in the field of Mathematical Statistics. Specifically, it deals with the Exponentiated Gamma Distribution, which belongs to the family of Exponentiated Distributions and finds real life applications in modeling life time data. Gupta et. al. (1998) were the first who introduced the Exponentiated Gamma Distribution. The Exponentiated Gamma Distribution has distribution function, F (x; θ, λ) = θλ 2 xe λx [1 e λx (λx + 1)] θ 1, x > where θ and λ are positive parameters. When θ = 1 and λ = 1 is obtained the Gamma Distribution with shape parameter a = 2 and scale parameter b = 1. The subject of this thesis is to study properties of the Exponentiated Gamma Distribution and to present various methods of estimating its parameters. In Chapter 1 are given some basic definitions and theorems that are needed in the sequel. In Chapter 2 we present some properties and characteristics of the Exponentiated Gamma Distribution. The Fisher Information Matrix is derived and the survival function and hazard rate function are analysed. In Chapter 3 we study different estimation methods of the parameters of Exponentiated Gamma Distribution. These methods are: Maximum Likelihood Estimation, Percentile Estimation, Least Squares and Weighted Least Squares Estimation, Method of Moments and L Moments Estimation. We also present the results of some numerical investigation in order to compare the performance of the various estimators. In Chapter 4 we deal with the Bayes Estimation under the squared error loss function (quadratic loss) and LINEX (linear-exponential) loss function. The thesis is completed in Chapter 5 with a discussion of the Exponentiated Exponential Distribution, which also belong to the family of Exponentiated Distributions. KEYWORDS Exponentiated Gamma Distribution; Maximum Likelihood Estimation; Percentile Estimation; Least Squares Estimation; Weighted Least Squares Estimation; Moments Estimation; L Moments Estimation; Bayes Estimation; LINEX loss.

Περιεχόμενα 1 Βασικοί Ορισμοί και Θεωρήματα 3 1.1 Εισαγωγή - Γενικές Ιδιότητες....................... 3 1.2 Εκτιμητική................................... 5 1.2.1 Γενικά................................... 5 1.2.2 Αμερόληπτη Εκτίμηση.......................... 7 1.2.3 Συνάρτηση Ζημίας (Loss Function) - Συνάρτηση Κινδύνου (Risk Function) 8 1.2.4 Α.Ο.Ε.Δ. Εκτιμητής........................... 9 1.2.5 Σχετική Αποτελεσματικότητα - Αποτελεσματικότητα.......... 12 1.2.6 Επάρκεια................................ 12 1.2.7 Πληρότητα................................ 14 1.2.8 Συνέπεια................................. 15 1.3 Εκτίμηση με τη μέθοδο Μέγιστης Πιθανοφάνειας........... 15 1.4 Εκτίμηση με τη μέθοδο των Ροπών.................... 17 1.5 Εκτιμητές Bayes................................ 18 1.6 Διατεταγμένες Παρατηρήσεις....................... 2 2 Ιδιότητες της Εκθετικοποιημένης Γάμμα κατανομής 23 2.1 Συνάρτηση Πυκνότητας Πιθανότητας.................. 23 2.2 Χαρακτηριστικά μεγέθη της Εκθετικοποιημένης Γάμμα Κατανομής 25 2.3 Συναρτήσεις Επιβίωσης και Συνάρτηση Κινδύνου.......... 31 2.3.1 Συναρτήσεις Επιβίωσης για την Εκθετικοποιημένη Γάμμα Κατανομή. 31 2.3.2 Συνάρτηση Κινδύνου (Hazard Function)................ 35 2.3.3 Αντίστροφη Συνάρτηση Κινδύνου (Reversed Hazard Function).... 37 2.4 Πίνακας πληροφορίας του Fisher..................... 39 2.5 Μετασχηματισμοί Εκθετικοποιημένων Γάμμα τυχαίων μεταβλητών 48 3 Εκτίμηση παραμέτρων 49 3.1 Εκτιμητής Μέγιστης Πιθανοφάνειας (MLE).............. 49 3.1.1 Ειδικές περιπτώσεις........................... 51 3.2 Εκτίμηση βασισμένη σε εκατοστιαία σημεία (PCE)......... 52 3.2.1 Ειδικές περιπτώσεις........................... 54 3.3 Εκτίμηση με τη Μέθοδο των Ελαχίστων Τετραγώνων (LSE) και Σταθμισμένων Ελαχίστων Τετραγώνων (WLSE)........... 55 3.3.1 Μέθοδος ελαχίστων τετραγώνων.................... 56 3.3.2 Μέθοδος σταθμισμένων ελαχίστων τετραγώνων............ 57 3.4 Εκτίμηση με τη μέθοδο των ροπών (MME)............... 59 3.4.1 Ειδικές περιπτώσεις........................... 6 3.5 Εκτίμηση με τη μέθοδο των L - ροπών (LME)............. 61 1

ΠΕΡΙΕΧΟΜΕΝΑ 3.6 Γενικά συμπεράσματα αποδοτικότητας εκτιμητών.......... 63 4 Εκτιμητές Bayes 72 4.1 Εκτίμηση παραμέτρου υπό τετραγωνική συνάρτηση ζημίας.... 72 4.2 Εκτίμηση παραμέτρου υπό ασύμμετρη συνάρτηση ζημίας..... 74 4.3 Εκτίμηση παραμέτρου υπό συνάρτηση ζημίας LINEX........ 77 5 Εφαρμογή της Εκθετικοποιημένης Εκθετικής κατανομής 81 5.1 Εκθετικοποιημένη Εκθετική κατανομή.................. 81 5.2 Σύγκριση Εκθετικοποιημένης Εκθετικής με τις κατανομές Γάμμα και Weibull................................... 83 5.3 Εφαρμογές................................... 84 5.3.1 Πρώτη Εφαρμογή............................ 84 5.3.2 Δεύτερη Εφαρμογή............................ 85 2

Κεφάλαιο 1 Βασικοί Ορισμοί και Θεωρήματα Σ αυτό το κεφαλαίο θα αναφέρουμε κάποιους βασικούς ορισμούς και Θεωρήματα, χωρίς τις αποδείξεις τους, οι οποίες εμπεριέχονται σε βιβλία Μαθηματικής Στατιστικής (π.χ. Παπαϊωάννου και Φερεντίνος (2)). 1.1 Εισαγωγή - Γενικές Ιδιότητες Ορισμός 1.1.1. Εάν μια οικογένεια πυκνοτήτων πιθανότητας με παράμετρο µ > είναι της μορφής f µ (x) = f(x µ), όπου f είναι συνάρτηση πυκνότητας πιθανότητας, τότε το µ ονομάζεται παράμετρος θέσης (location parameter). Η παράμετρος θέσης καθορίζει την θέση (location) ή την μετατόπιση (shift) της κατανομής. Παρατήρηση 1.1.1. Σε οικογένειες κατανομών με περισσότερες παραμέτρους έχουμε την μορφή f µ,θ (x) = f θ (x µ), όπου µ είναι η παράμετρος θέσης, το θ είναι επιπλέον παράμετρος και το f θ είναι μια συνάρτηση των επιπλέον παραμέτρων. Ορισμός 1.1.2. Εάν μια οικογένεια πυκνοτήτων πιθανότητας με παράμετρο s είναι της μορφής f s(x) = f(x s)(1/s), όπου f είναι συνάρτηση πυκνότητας πιθανότητας, τότε το s ονομάζεται παράμετρος κλίμακας (scale parameter). Η τιμή της καθορίζει την «κλίμακα» της κατανομής. Όσο μεγαλύτερη η τιμή του s τόσο η κατανομή έχει πιο «βαριές» ουρές. Παρατήρηση 1.1.2. Μια παράμετρος που επηρεάζει το σχήμα μιας κατανομής και όχι απλά να τη μετατοπίζει (όπως η παράμετρος θέσης) ή να τη «συρρικνώνει»/ «τεντώνει» (όπως η παράμετρος κλίμακας), αναφέρεται ως παράμετρος σχήματος. 3

1.1. ΕΙΣΑΓΩΓΗ - ΓΕΝΙΚΕΣ ΙΔΙΟΤΗΤΕΣ Ορισμός 1.1.3. Έστω X μια συνεχής τυχαία μεταβλητή. Αν υπάρχει h > τέτοιο ώστε, M(t) = E(e tx ) <, ( t) στην περιοχή t < h, τότε η συνάρτηση M(t) αυτή ονομάζεται ροπογεννήτρια της τυχαίας μεταβλητής X. Αν η M(t) υπάρχει τότε M(t) = E(e tx ) = etx f(x)dx. Παρατήρηση 1.1.3. Δύο βασικές ιδιότητες των ροπογεννητριών μέσω των οποίων προκύπτουν η Μέση τιμή E(X) και η Διακύμανση V ar(x) είναι, 1. M () = µ 2. M () [M ()] 2 = σ 2 Θεώρημα 1.1.1. Έστω X μια συνεχής τυχαία μεταβλητή με πυκνότητα πιθανότητας f X (x). Έστω, επίσης, μια (μετρήσιμη) συνάρτηση g : R R, οπότε η Y = g(x) είναι μια τυχαία μεταβλητή. Θεωρούμε το σύνολο S = {x R f X (x) > } κι έστω T η εικόνα του S μέσω της g. Αν, 1. η συνάρτηση g : S T είναι αμφιμονοσήμαντη, οπότε υπάρχει η αντίστροφος συνάρτηση x = g 1 (y), y T, 2. η συνάρτηση g 1 είναι παραγωγίσιμη και η παράγωγός της είναι συνεχής στο T με g 1 (y), y T, τότε η πυκνότητα πιθανότητας της Y, f Y (y), δίνεται από τη σχέση, ( f Y (y) = f X g 1 (y) ) d dy g 1 (y), y T. Ορισμός 1.1.4. Αν µ είναι η μέση τιμή του πληθυσμού και σ η τυπική απόκλιση, τότε συντελεστής μεταβλητότητας (C.V. Coefficient of Variation) ονομάζεται το πηλίκο, C.V. = τυπική απόκλιση μέση τιμή = σ µ. Ακολουθούν ορισμοί σχετικά με την έννοια των ροπών. Η έννοια της ροπής προέρχεται από τη μηχανική και αναφέρεται στη μέτρηση της τάσης μιας δύναμης να παράγει περιστροφή. Ορισμός 1.1.5. Έστω X μια συνεχής τυχαία μεταβλητή και r ένας θετικός αριθμός. Η ποσότητα E(X r ), αν υπάρχει ως πεπερασμένος αριθμός, ονομάζεται «Ροπή r τάξης γύρω από το μηδέν» ή «Απλή Ροπή r τάξης» της X και συμβολίζεται με µ r. Δηλαδή έχουμε, E(X r ) = µ r = 4 x r f(x)dx.

1.2. ΕΚΤΙΜΗΤΙΚΗ Παρατήρηση 1.1.4. Η Απλή Ροπή r τάξης για συνεχή τυχαία μεταβλητή x υπάρχει αν, x r f(x)dx <. Ορισμός 1.1.6. Έστω X μια συνεχής τυχαία μεταβλητή και r ένας θετικός αριθμός. Η ποσότητα E[(X µ) r ], αν υπάρχει, ονομάζεται «Ροπή r τάξης γύρω από τη Μέση Τιμή» ή «Κεντρική Ροπή r τάξης» και συμβολίζεται με µ r. Δηλαδή έχουμε, E[(X µ) r ] = µ r = (x µ) r f(x)dx. Πρόταση 1.1.1. Οι «Ροπές r τάξης γύρω από τη Μέση Τιμή» συνδέονται με τις «Ροπές r τάξης γύρω από το μηδέν» ως εξής, µ 2 = µ 2 (µ 1) 2 µ 3 = µ 3 3µ 2µ 1 + 2(µ 1) 3 µ 4 = µ 4 4µ 3µ 1 + 6µ 2µ 1 3(µ 1) 4 Γενικός Τύπος: ( r µ r = µ r 1 ) ( r µ r 1µ 1 + 2 ) µ r 2(µ 1) 2... + ( 1) r ( r r ) (µ 1) r 1.2 Εκτιμητική 1.2.1 Γενικά Συχνά στη Στατιστική συναντώνται προβλήματα όπου απαιτείται η εκτίμηση μιας παραμέτρου του υπό μελέτη πληθυσμού. Γενικά, χρησιμοποιείται η τιμή μιας αντίστοιχης ποσότητας από ένα τυχαίο δείγμα ως εκτίμηση της άγνωστης παραμέτρου του πληθυσμού. Η περιοχή της Στατιστικής, η οποία ασχολείται με το πρόβλημα εκτίμησης μιας παραμέτρου του υπό μελέτη πληθυσμού, ονομάζεται «Εκτιμητική». Βασικά προβλήματα Εκτιμητικής Ανεύρεση μεθόδων καθορισμού των εκτιμητών των παραμέτρων. Ο καθορισμός κριτηρίων με βάση τα οποία αποφασίζεται πόσο «καλός» είναι ο εκτιμητής μιας παραμέτρου του πληθυσμού. 5

1.2. ΕΚΤΙΜΗΤΙΚΗ Ο καθορισμός κριτηρίων για το εάν ο εκτιμητής είναι ο καλύτερος δυνατός από τους διαθέσιμους εκτιμητές για μια παράμετρο του πληθυσμού. Ορισμός 1.2.1. Έστω X 1,..., X n τυχαίο δείγμα από κάποιο πληθυσμό, με συνάρτηση πυκνότητας πιθανότητας f(x, θ), όπου θ = (θ 1,..., θ k ) είναι άγνωστη παράμετρος. Το σύνολο των δυνατών τιμών της θ συμβολίζεται με Θ και ονομάζεται παραμετρικός χώρος. Οι παράμετροι αποτελούν το άγνωστο χαρακτηριστικό του πληθυσμού, το οποίο πρέπει να υπολογίσουμε ή να εκτιμήσουμε με μία ή περισσότερες στατιστικές συναρτήσεις. Το πρόβλημα της εκτίμησης είναι η μελέτη και η εύρεση στατιστικών συναρτήσεων προκειμένου να χρησιμοποιηθούν για την εκτίμηση παραμετρικών συναρτήσεων g(θ). Υπάρχουν 2 τρόποι εκτίμησης: Σημειακή Εκτίμηση: Χρησιμοποιούμε τις παρατηρήσεις ενός τυχαίου δείγματος και καθορίζουμε έναν αριθμό (ή συνάρτηση) που μπορεί να θεωρηθεί ως η εκτίμηση (αντίστοιχα, εκτιμητής) της παραμέτρου θ. Διαστήματα Εμπιστοσύνης: Χρησιμοποιώντας τις παρατηρήσεις ενός τυχαίου δείγματος καθορίζουμε ένα διάστημα πιθανών τιμών της υπό εκτίμηση παραμέτρου θ, το οποίο διάστημα ονομάζεται διάστημα εμπιστοσύνης. Στη συνέχεια, θα παραθέσουμε γενικές αρχές και ορισμούς, οι αποδείξεις των οποίων μπορούν να βρεθούν σε βιβλία Μαθηματικής (Θεωρητικής) Στατιστιστικής (π.χ. Παπαιωάννου - Φερεντίνος (Μαθηματική Στατιστική (2))). Έστω X 1,..., X n ένα τυχαίο δείγμα από κάποιο πληθυσμό με συνάρτηση πυκνότητας - πιθανότητας f(x, θ) (ή συνάρτηση πυκνότητας - πιθανότητας p(x, θ) για τη διακριτή περίπτωση), όπου θ Θ R k και g(θ) μια συνάρτηση με πεδίο ορισμού Θ και τιμές στο χώροr ν, όπου 1 ν k. Εκτιμητής είναι οποιαδήποτε στατιστική συνάρτηση T (X 1,..., X n ) με τιμές στο χώρο R ν, η οποία χρησιμοποιείται για την εκτίμηση του g(θ). Επειδή οι εκτιμητές της g(θ) μπορούν να καθοριστούν με πολλούς τρόπους υπάρχουν κριτήρια αξιολόγησης εκτιμητών, έτσι ώστε να επιλεγεί ο καλύτερος εκτιμητής. Τα κριτήρια εξαρτώνται από τους λόγους για τους οποίους γίνεται η εκτίμηση και δεν αξιολογούνται όλοι οι εκτιμητές βάσει ενός μοναδικού συνόλου κριτηρίων. 6

1.2. ΕΚΤΙΜΗΤΙΚΗ 1.2.2 Αμερόληπτη Εκτίμηση Ορισμός 1.2.2. Ο εκτιμητής T (X 1,..., X n ) της συνάρτησης g(θ) λέγεται αμερόληπτος αν E(T (X 1,..., Xn)) = g(θ), θ Θ. Εάν η g(θ) δίνει έναν αμερόληπτο εκτιμητή, τότε η g(θ) λέγεται εκτιμήσιμη συνάρτηση. Παρατήρηση 1.2.1. Ο έλεγχος της αμεροληψίας είναι εύκολος, όμως η δυσκολία έγκειται στο ότι είναι δύσκολο να βρεθεί συναρτησιακή έκφραση ενός εκτιμητή και αυτό επιτυγχάνεται είτε έμμεσα (βάσει μέσης τιμής, διακύμανσης, κλπ) είτε άμεσα με τη λύση της εξίσωσης U(x)f(x)dx = g(θ) ή U(x)P (X = x) = g(θ), όπου U(x) ο ζητούμενος εκτιμητής του g(θ) και X συνεχής ή διακριτή αντίστοιχα. Εάν ο εκτιμητής T της g(θ) δεν είναι αμερόληπτος, τότε έχει μεροληψία (bias), η οποία δίνεται από τον τύπο bias = b(t ) = E(T ) g(θ). Παρατήρηση 1.2.2. Ενώ η αμεροληψία είναι μια χρήσιμη ιδιότητα δεν ενημερώνει για τη μεταβλητότητα του εκτιμητή, η οποία έχει σχέση με την ακρίβεια ή την ορθότητα της εκτίμησης. Για το λόγο αυτό ζητάμε εκτιμητές με ελάχιστη διακύμανση - διασπορά (Αρχή Ελάχιστης Διασποράς). Ορισμός 1.2.3. Το Μέσο Τετραγωνικό Σφάλμα του εκτιμητή T = T (X ), ορίζεται ως εξής, MT Σ(T, θ) = E(T g(θ)) 2. Πρόταση 1.2.1. MT Σ(T, θ) = V ar(t ) + b 2 (T ). Παρατήρηση 1.2.3. Αν ο T είναι αμερόληπτος εκτιμητής της g(θ), τότε MT Σ(T, θ) = V ar(t ). Ορισμός 1.2.4. Ο εκτιμητής T 1 ονομάζεται καλύτερος από τον T 2 (ως προς το Μέσο Τετραγωνικό Σφάλμα) για τη g(θ), αν MT Σ(T 1, θ) MT Σ(T 2, θ), θ Θ και για κάποιο θ Θ. MT Σ(T 1, θ ) < MT Σ(T 2, θ ), 7

1.2. ΕΚΤΙΜΗΤΙΚΗ 1.2.3 Συνάρτηση Ζημίας (Loss Function) - Συνάρτηση Κινδύνου (Risk Function) Γενικά, η εκτίμηση της παραμετρικής παράστασης g(θ) από μια τιμή d, μετριέται από τη συνάρτηση ζημιάς (Loss function) L(d, θ) για την οποία ισχύουν, και L(d, θ) για όλα τα θ, d L[g(θ), θ] = για όλα τα θ, έτσι ώστε η ζημιά να είναι μηδέν όταν η παράμετρος εκτιμάται από τη σωστή τιμή. Ορισμός 1.2.5. Η ακρίβεια ή μη-ακρίβεια ενός εκτιμητή δ μετριέται από τη συνάρτηση κινδύνου (Risk function) που ορίζεται ως, R(δ, θ) = E θ {L[δ(X), θ]} Το Μέσο Τετραγωνικό Σφάλμα είναι μια συνάρτηση ζημίας. Επομένως, μπορούμε να επαναδιατυπώσουμε τους παραπάνω ορισμούς αντικαθιστώντας το Μέσο Τετραγωνικό Σφάλμα με μια οποιαδήποτε συνάρτηση ζημιάς L(d, θ). Παρατήρηση 1.2.4. Υπάρχουν διάφορες συναρτήσεις ζημίας, οι οποίες μπορούν να χρησιμοποιηθούν ανάλογα με το περιεχόμενο κάθε προβλήματος. Ακολουθούν ενδεικτικά κάποιες από αυτές. Τετραγωνική συνάρτηση ζημίας (Squared error loss) L(d, θ) = (d θ) 2 Συνάρτηση ζημίας απόλυτου σφάλματος (Absolute error loss) L(d, θ) = d θ Γραμμική συνάρτηση ζημίας (Linear loss) L(d, θ) = { K (θ d),θ>d K 1 (d θ),θ<d όπου K >, K 1 > σταθερές. -1 συνάρτηση ζημίας (-1 loss) L(d, θ) = { 1, d θ >ϵ, d θ ϵ όπου ϵ > σταθερά. Συνάρτηση ζημίας LINEX (LINear EXponential) (LINEX loss function) L(d, θ) = k(e c 1(d θ) c 1 (d θ) 1), όπου k, c 1 > σταθερές. 8

1.2. ΕΚΤΙΜΗΤΙΚΗ 1.2.4 Α.Ο.Ε.Δ. Εκτιμητής Ορισμός 1.2.6. Ένας εκτιμητής T (X 1,..., X n ) της g(θ) λέγεται Αμερόληπτος Ομοιόμορφα Ε- λάχιστης Διασποράς (Α.Ο.Ε.Δ.), εάν είναι αμερόληπτος κι έχει ελάχιστη διασπορά (διακύμανση) μεταξύ όλων των αμερόληπτων εκτιμητών για θ Θ. Αν, δηλαδή, T 1 ένας άλλος αμερόληπτος εκτιμητής, τότε V ar(t ) V ar(t 1 ), για κάθε θ Θ. Στη συνέχεια θα μελετήσουμε την εύρεση (Α.Ο.Ε.Δ.) εκτιμητών. [ ] 2 Ορισμός 1.2.7. Η ποσότητα I x (θ) = E lnf(x,θ) θ λέγεται μέτρο πληροφορίας του Fisher που περιέχεται στο X για την παράμετρο θ. Αν το θ είναι μια κ- διάστατη παράμετρος, δηλαδή θ = (θ 1,..., θ k ), η αντίστοιχη ποσότητα λέγεται πίνακας πληροφορίας του Fisher και ορίζεται ως εξής, ( [ ]) lnf(x, θ) lnf(x, θ) I x (θ) = E, θ i θ j k k όπου το (()) k k συμβολίζει έναν k k πίνακα. (Αντίστοιχα ορίζεται στην διακριτή περίπτωση μόνο που έχουμε p(x, θ) αντί για f(x, θ)). Από τα παραπάνω φαίνεται, ότι για να βρούμε ΑΟΕΔ εκτιμητή πρέπει να ελαττώσουμε ό- σο το δυνατόν περισσότερο τη διασπορά μίας στατιστικής συνάρτησης σε σχέση με την προς εκτίμηση ποσότητα, δηλαδή είναι επιθυμητό να βρούμε ένα κάτω φράγμα για τη διασπορά των αμερόληπτων εκτιμητών αυτής της ποσότητας. Αυτό το κάτω φράγμα μας προσφέρει το Θεώρημα Cramer-Rao, το οποίο ισχύει όταν επαληθεύονται οι παρακάτω συνθήκες, (Ι1) Ο παραμετρικός χώρος Θ είναι ανοικτό υποσύνολο του R. { } (I2) To σύνολο S = x; f X (x; θ) δεν εξαρτάται από το θ. θ Θ και κάθε στατιστική συνάρ- (I3) f θ X(x; θ)dx = f R n θ X (x; θ)dx, θ Θ. R n (I4) T (X) f R n θ X(x; θ)dx = T (X)f θ X (x; θ)dx, R n τηση T (X). (Ι5) Αν I(θ) = E θ ( 2, lnf θ X(x; θ)) τότε, < I(θ) <, θ Θ. Η ποσότητα I(θ) ονομάζεται αριθμός ή μέτρο πληροφορίας Fisher. Θεώρημα 1.2.1. (Θεώρημα Cramer-Rao) Έστω X = (X 1, X 2,..., X n ) ένα δείγμα με από κοινού πυκνότητα πιθανότητας f X (x; θ), θ Θ. Εάν T (X) είναι στατιστική συνάρτηση με E θ (T (X)) = g(θ), θ Θ και ισχύουν οι συνθήκες (Ι1)-(Ι5), τότε, V ar θ (T (X)) (g (θ)) 2, θ Θ. I(θ) 9

1.2. ΕΚΤΙΜΗΤΙΚΗ Το κάτω φράγμα για τη διασπορά των αμερόληπτων εκτιμητών του g(θ) ονομάζεται Cramer- Rao Κάτω Φράγμα (C.R.-Κ.Φ.), ενώ για τον υπολογισμό του αριθμού πληροφορίας Fisher χρησιμοποιούμε συνήθως κάποιες βοηθητικές ιδιότητες. Ιδιότητες 1. I(θ) = E θ ( 2 θ 2 lnf X (x ; θ)) 2, θ Θ. 2. Αν το δείγμα X = (X 1, X 2,..., X n ) αποτελείται από ανεξάρτητες και τυχαίες μεταβλητές, όπου κάθε μια από τις X i ακολουθεί μια κατανομή με πυκνότητα πιθανότητας f Xi (x i ; θ), i = 1, 2,..., n, τότε, n I(θ) = I i (θ), όπου I i (θ) = E θ ( θ lnf X i (x i ; θ) ) 2. 3. Αν το δείγμα X = (X 1, X 2,..., X n ) είναι τυχαίο, τότε, I(θ) = ni 1 (θ), όπου I 1 (θ) είναι ο αριθμός πληροφορίας Fisher για κάθε μια από τις X 1, X 2,..., X n. Η δυσκολία του Θεωρήματος Cramer-Rao βρίσκεται στην επαλήθευση των συνθηκών (Ι1)- (Ι5), η οποία άρεται όταν η οικογένεια του τυχαίου διανύσματος X ανήκει στη Μονοπαραμετρική Εκθετική Οικογένεια Κατανομών (ΜΕΟΚ). Ορισμός 1.2.8. Η οικογένεια κατανομών { f X (x ; θ), Εκθετική Οικογένεια Κατανομών (ΜΕΟΚ) αν, { } 1. Το σύνολο S = x; f X (x; θ) > δεν εξαρτάται από το Θ. 2. f X (x ; θ) = e A(θ)+B(x )+c(θ)d(x ), x S, θ Θ. } θ Θ ανήκει στη Μονοπαραμετρική Θεώρημα 1.2.2. Αν το δείγμα X = (X 1, X 2,..., X n ) έχει κατανομή με πυκνότητα πιθανότητας f X (x; θ), η οποία ανήκει στη ΜΕΟΚ και η c(θ) (που εμφανίζεται στον τύπο της f X (x; θ) έχει συνεχή και μη μηδενική παράγωγο θ Θ, τότε οι συνθήκες (Ι2), (Ι3) και (Ι4) του Θεωρήματος Cramer-Rao ισχύουν και η (Ι4) ισχύει για κάθε στατιστική συνάρτηση T = T (X ). Η παρακάτω Πρόταση δίνει ουσιαστικά έναν τρόπο εύρεσης του ΑΟΕΔ εκτιμητή για μια παραμετρική συνάρτηση g(θ) και γραμμικούς συνδυασμούς αυτής. Πρόταση 1.2.2. Αν το δείγμα X = (X 1, X 2,..., X n ) έχει κατανομή με πυκνότητα πιθανότητας ( f X (x; θ), η οποία ανήκει στη ΜΕΟΚ f X (x; θ) = e A(θ)+B(x)+C(θ)D(x)) και ισχύουν, 1

1.2. ΕΚΤΙΜΗΤΙΚΗ α) Το σύνολο Θ είναι ανοικτό υποσύνολο του R. β) Το c(θ) έχει συνεχή και μη μηδενική παράγωγο θ Θ. γ) < I(θ) <. Τότε, 1. Η στατιστική συνάρτηση D(x ) είναι ΑΟΕΔ εκτιμητής της g(θ) = E θ (D(x )). 2. H στατιστική συνάρτηση c 1 D(x ) + c 2 με c 1, c 2 σταθερές, όπου c 1, είναι ΑΟΕΔ εκτιμητής της c 1 g(θ) + c 2. Επίσης, ισχύει και η παρακάτω Πρόταση. Πρόταση 1.2.3. Έστω ότι ισχύουν οι συνθήκες (Ι1), (Ι2), (Ι3) και (Ι5) του Θεωρήματος Cramer- Rao και η (Ι4) ισχύει για κάποια στατιστική συνάρτηση T (X ), αμερόληπτο εκτιμητή του g(θ). Έστω ακόμα ότι η παραμετρική συνάρτηση g(θ) είναι μη σταθερά (ως συνάρτηση του θ) και η T (X ) επιτυγχάνει το C.R.-Κ.Φ., δηλαδή, V ar θ (T (X)) = (g (θ)) 2, θ Θ, I(θ) τότε, f X (x; θ) = e A(θ)+B(x)+C(θ)T (x), x S, θ Θ, δηλαδή η κατανομή του δείγματος X ανήκει στη ΜΕΟΚ. Παρατήρηση 1.2.5. Οι Προτάσεις 1.2.2 και 1.2.3 συνεπάγονται το γεγονός ότι η εύρεση του εκτιμητή για κάποια παραμετρική συνάρτηση g(θ) είναι δυνατή με τη χρήση του Θεωρήματος Cramer-Rao αν και μόνο αν η κατανομή του δείγματος X = (X 1, X 2,..., X n ) ανήκει στη ΜΕΟΚ και η g(θ) έχει μια συγκεκριμένη μορφή g(θ) = E θ (D(X )) ή είναι κάποιος γραμμικός μετασχηματισμός της E θ (D(X )). Όπως γίνεται εύκολα αντιληπτό από την παραπάνω Παρατήρηση η μέθοδος εύρεσης ΑΟΕΔ εκτιμητή με χρήση του Θεωρήματος Cramer-Rao μας περιορίζει τόσο ως προς την οικογένεια του δείγματος, όσο και ως προς τη μορφή των παραμετρικών συναρτήσεων, για τις οποίες βρίσκουμε ΑΟΕΔ εκτιμητές, οπότε χρειάζεται μια διαφορετική μέθοδος από την προηγούμενη, η οποία να μην έχει αυτού του είδους τα προβλήματα. 11

1.2. ΕΚΤΙΜΗΤΙΚΗ 1.2.5 Σχετική Αποτελεσματικότητα - Αποτελεσματικότητα Ορισμός 1.2.9. Έστω U = U(X) ένας Α.Ο.Ε.Δ. εκτιμητής της g(θ). Τότε ο U ονομάζεται α- ποτελεσματικός (με την έννοια της διασποράς). Έστω T ένας οποιοσδήποτε άλλος αμερόληπτος εκτιμητής της g(θ) με πεπερασμένη διασπορά. Το πηλίκο V ar(u) ονομάζεται σχετική αποτελεσματικότητα του αμερόληπτου εκτιμητή T σε σχέση με τον αποτελεσματικό εκτιμητή U. Η σχετική V ar(t ) αποτελεσματικότητα παίρνει τιμές στο διάστημα (, 1). Ορισμός 1.2.1. Ορίζουμε ως αποτελεσματικότητα (efficiency) ενός αμερόληπτου εκτιμητή ˆθ μιας πραγματικής παραμέτρου θ και συμβολίζουμε με eff(ˆθ) το λόγο, όπου I 1 θ eff(ˆθ) = I 1 θ V (ˆθ), το κάτω φράγμα της ανισότητας Cramer - Rao (I θ = ni x (θ)). Αν η τιμή του eff(ˆθ) είναι κοντά στη μονάδα, τότε αυτό συνηγορεί υπέρ της επιλογής του ˆθ ως εκτιμητή. 1.2.6 Επάρκεια Ορισμός 1.2.11. Έστω το δείγμα X = (X 1, X 2,..., X n ) που έχει κατανομή με πυκνότητα πιθανότητας f X (x; θ), θ Θ, τότε η στατιστική συνάρτηση T (X) ονομάζεται επαρκής αν η δεσμευμένη κατανομή του X T (X) = t δεν εξαρτάται από το θ για κάθε τιμή t, για την οποία μπορεί να οριστεί η δεσμευμένη κατανομή. Ένας τρόπος εύρεσης μιας επαρκούς στατιστικής συνάρτησης, εκτός του ορισμού, δίνεται από την παρακάτω πρόταση, η οποία αναφέρεται και ως παραγοντικό κριτήριο των Neyman- Fisher. Θεώρημα 1.2.3. (Παραγοντικό κριτήριο των Neyman-Fisher) Η στατιστική συνάρτηση T (X) είναι επαρκής αν και μόνο αν f X (x; θ) = q(t (X); θ)h(x), x και θ Θ, όπου q και h είναι συναρτήσεις. Παρατήρηση 1.2.6. Ισχύουν οι παρακάτω ιδιότητες για τις επαρκείς στατιστικές συναρτήσεις, 1) Το δείγμα X = (X 1, X 2,..., X n ) είναι τετριμμένα επαρκής στατιστική συνάρτηση. 12

1.2. ΕΚΤΙΜΗΤΙΚΗ 2) Η στατιστική συνάρτηση T (X) = (X (1),..., X (n) ) είναι επαρκής, όπου οι X (i), i = 1,..., n είναι οι διατεταγμένες παρατηρήσεις. 3) Έστω T 1 = T 1 (X) επαρκής στατιστική συνάρτηση και T 2 = K(T 1 )(X), όπου K( ) είναι «1-1» συνάρτηση, τότε η στατιστική συνάρτηση T 2 (X) είναι επαρκής. Συνήθως, όταν μιλάμε για επαρκή στατιστική συνάρτηση αναφερόμαστε στην ελάχιστη ε- παρκή. Ορισμός 1.2.12. Eλάχιστη επαρκής στατιστική συνάρτηση είναι μια επαρκής στατιστική συνάρτηση, η οποία προέρχεται από την μεγαλύτερη δυνατή «σύμπτηξη» (δηλαδή έχει τη μικρότερη δυνατή διάσταση). Παρατήρηση 1.2.7. Σχεδόν πάντα η διάσταση της παραμετρικής συνάρτησης g(θ) συμπίπτει με τη διάσταση της ελάχιστης επαρκούς στατιστικής συνάρτησης. Στο παρακάτω Θεώρημα χρησιμοποιείται η έννοια της επάρκειας στη βελτίωση εκτιμητών. Θεώρημα 1.2.4. (Rao-Blackwell) Έστω ότι T (X ) είναι μια επαρκής στατιστική συνάρτηση και S = S(X ) είναι εκτιμητής της παραμετρικής συνάρτησης g(θ). Θέτουμε S = E θ (S T ). Τότε, 1. Η S είναι στατιστική συνάρτηση. 2. E θ (S ) = E θ (S), θ Θ, έτσι αν S είναι αμερόληπτος εκτιμητής για τη g(θ), τότε S είναι αμερόληπτος εκτιμητής για τη g(θ). 3. V ar θ (S ) V ar θ (S), θ Θ και ισχύει αυστηρή ανισότητα, εκτός εάν S είναι συνάρτηση της στατιστικής συνάρτησης, οπότε S = S. 4. MT Σ(S, θ) MT Σ(S, θ), θ Θ και ισχύει αυστηρή ανισότητα εκτός εάν S είναι συνάρτηση της στατιστικής συνάρτησης T, οπότε S = S. Eπομένως, αν S είναι ένας εκτιμητής της g(θ), ο οποίος δεν είναι συνάρτηση της επαρκούς στατιστικής συνάρτησης T, τότε o S είναι μη αποδεκτός και βελτιώνεται από τον S = E θ (S T ) που ονομάζεται βελτίωση του S κατά Rao-Blackwell ή Rao-Blackwell βελτίωση του S. Παρατήρηση 1.2.8. Έστω T 1 και T 2 είναι επαρκείς στατιστικές συναρτήσεις και S είναι αμερόληπτος εκτιμητής της g(θ). Τότε S1 = E θ (S T 1 ) είναι η Rao-Blackwell βελτίωση του S μέσω της T 1 και S2 = E θ (S T 2 ) είναι η η Rao-Blackwell βελτίωση του S μέσω της T 2. Όμως, μέσω του Θεωρήματος 1.2.4 δεν μπορούμε να συγκρίνουμε αυτές τις δύο βελτιώσεις. Η έννοια της πληρότητας θα βοηθήσει σε αυτή τη σύγκριση. 13

1.2. ΕΚΤΙΜΗΤΙΚΗ 1.2.7 Πληρότητα Ορισμός 1.2.13. Η στατιστική συνάρτηση T = T (X) ονομάζεται πλήρης, αν ισχύει η ακόλουθη σχέση, E θ (ϕ(t )) =, Θ ϕ(t) =, για κάθε δυνατή τιμή t της T, δηλαδή ϕ(t ) =. Θεώρημα 1.2.5. (Lehmann-Scheffé) Έστω T = T (X ) είναι επαρκής και πλήρης στατιστική συνάρτηση και S είναι ένας αμερόληπτος εκτιμητής της g(θ). Τότε ο S = E θ (S T ) είναι μοναδικός ΑΟΕΔ εκτιμητής της g(θ). Άρα, με τη βοήθεια του Θεωρήματος των Lehmann-Scheffé μπορούμε να βρούμε ΑΟΕΔ εκτιμητή με τη χρήση επαρκούς και πλήρους στατιστικής συνάρτησης και μάλιστα, αν υπάρχει αυτός ο ΑΟΕΔ εκτιμητής, είναι και μοναδικός. Πόρισμα 1.2.1. (Lehmann-Scheffé) Έστω T = T (X ) είναι επαρκής και πλήρης στατιστική συνάρτηση και S είναι ένας αμερόληπτος εκτιμητής της g(θ), ο οποίος είναι συνάρτηση της επαρκούς και πλήρους T. Τότε S είναι μοναδικός ΑΟΕΔ εκτιμητής της g(θ). Όπως καταλαβαίνουμε, σε αυτή τη μεθοδολογία είναι σημαντική η εύρεση μιας επαρκούς και πλήρους στατιστικής συνάρτησης και μέσω του ορισμού δεν είναι πάντα εύκολο. Αν, όμως, η κατανομή του δείγματος X ανήκει στην Πολυπαραμετρική Εκθετική Οικογένεια Κατανομών (ΠΕΟΚ) τα πράγματα απλοποιούνται. Ορισμός 1.2.14. Η οικογένεια κατανομών { f X (x ; θ), Εκθετική Οικογένεια Κατανομών (ΠΕΟΚ), διάστασης k, αν, { } 1. Το σύνολο S = x; f X (x; θ) > δεν εξαρτάται από το θ. 2. f X (x ; θ) = e A(θ)+B(x )+ k j=1 c j(θ)d j (x ), x S, θ Θ. } θ Θ ανήκει στην Πολυπαραμετρική Παρατήρηση 1.2.9. Η ΠΕΟK διάστασης 1 συμπίπτει με τη ΜΕΟΚ. Πρόταση 1.2.4. Έστω ότι το δείγμα X = (X 1, X 2,..., X n ) έχει κατανομή, η οποία ανήκει στην ΠΕΟΚ διάστασης k, τότε ισχύουν τα εξής, 1. Η στατιστική συνάρτηση T (X ) = (D 1 (X ), D 2 (X ),..., D k (X )) είναι επαρκής. 2. Αν το πεδίο τιμών του διανύσματος (c 1 (θ), c 2 (θ),..., c k (θ)) περιέχει ένα ανοικτό υποσύνολο του R k, τότε η T (X ) είναι πλήρης. 14

1.3. ΕΚΤΙΜΗΣΗ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ Το παρακάτω Θεώρημα, γνωστό και ως Θεώρημα Basu, πιστοποιεί και μια άλλη χρήση της επάρκειας και της πληρότητας, αυτής της απόδειξης ανεξαρτησίας μεταξύ στατιστικών συναρτήσεων (δηλαδή τυχαίων μεταβλητών). Θεώρημα 1.2.6. (Basu) Έστω T (X ) επαρκής και πλήρης στατιστική συνάρτηση και S(X ) είναι μία στατιστική συνάρτηση, η κατανομή της οποίας δεν εξαρτάται από το θ. Τότε οι στατιστικές συναρτήσεις T (X ) και S(X ) είναι ανεξάρτητες. 1.2.8 Συνέπεια Ορισμός 1.2.15. Έστω T n = T (X 1, X 2,..., X n ), n = 1, 2,... ένας εκτιμητής της παραμετρικής συνάρτησης g(θ). Τότε ο εκτιμητής T n ονομάζεται συνεπής αν, lim P ( T n g(θ) > ε) =, ε >. n Η παρακάτω πρόταση δίνει τις ικανές συνθήκες, έτσι ώστε ένας εκτιμητής για τη g(θ) να είναι συνεπής. Πρόταση 1.2.5. Έστω ότι ο εκτιμητής T n ικανοποιεί τις παρακάτω συνθήκες, 1. V ar θ T n, n +. 2. b(t n, θ) = E θ T n g(θ), n +. Τότε ο T n είναι συνεπής εκτιμητής της παραμετρικής συνάρτησης g(θ). 1.3 Εκτίμηση με τη μέθοδο Μέγιστης Πιθανοφάνειας Αρχικά θα ορίσουμε την πιθανοφάνεια. Ορισμός 1.3.1. Έστω X 1, X 2,..., X n τυχαίο δείγμα από ένα πληθυσμό με συνάρτηση πυκνότητας f(x, θ). Τότε η συνάρτηση L(θ x) = Π n f xi (x i, θ) θεωρούμενη ως συνάρτηση της παραμέτρου θ ονομάζεται συνάρτηση πιθανοφάνειας. Ορισμός 1.3.2. Έστω L(θ x) η συνάρτηση πιθανοφάνειας ενός τυχαίου δείγματος X 1, X 2,..., X n. Ο εκτιμητής θ = θ(x 1,..., X n ) λέγεται Εκτιμητής Μέγιστης Πιθανοφάνειας του θ εάν L( θ x) = max θ Θ L(θ x), (L(θ x) = L(θ)). 15

1.3. ΕΚΤΙΜΗΣΗ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ Παρατήρηση 1.3.1. Για ευκολία, αντί για την L(θ x) μεγιστοποιούμε την lnl(θ x), διότι το μέγιστο λαμβάνεται στο ίδιο σημείο. Στη συνέχεια, θα παρουσιάσουμε (χωρίς απόδειξη) ορισμένες ιδιότητες των Εκτιμητών Μέγιστης Πιθανοφάνειας. Θεώρημα 1.3.1. Έστω X 1, X 2,..., X n τυχαίο δείγμα με συνάρτηση πυκνότητας πιθανότητας f(x, θ),θ Θ R r, r 1 κι έστω T = (T 1,..., T r ), T j = T j (x), j = 1, 2,..., r μια επαρκής στατιστική συνάρτηση για το θ = (θ 1,..., θ r ). Εάν θ = ( θ 1,..., θ r ) είναι ο μονοσήμαντα ορισμένος (ή μοναδικός) ΕΜΠ του θ, τότε ο θ είναι συνάρτηση μόνο του T. Θεώρημα 1.3.2. Έστω X 1, X 2,..., X n τυχαίο δείγμα με συνάρτηση πυκνότητας πιθανότητας f(x, θ), θ Θ R κ και θ = ( θ 1,..., θ κ ) ο ΕΜΠ εκτιμητής της θ = (θ 1,..., θ κ ), όπου θ j = θ j (x 1,..., x n ). Εάν ϕ(θ) = ϕ 1 (θ),..., ϕ r (θ), για 1 r κ είναι ένας μετασχηματισμός του παραμετρικού χώρου Θ, τότε ο ΕΜΠ της ϕ(θ) είναι ϕ( θ) = (ϕ 1 ( θ),..., ϕ r ( θ)), όπου ϕ j ( θ 1,..., θ κ ) είναι ο ΕΜΠ της ϕ j (θ 1,..., θ κ ), j = 1,..., r. Θεώρημα 1.3.3. Έστω X 1, X 2,..., X n τυχαίο δείγμα με συνάρτηση πυκνότητας πιθανότητας f(x, θ), θ Θ R κι έστω ότι ισχύουν οι συνθήκες ομαλότητας Cramer - Rao για έναν αμερόληπτο εκτιμητή U της θ και V ar(u) είναι το Cramer - Rao κάτω φράγμα. Αν θ είναι ο ΕΜΠ της θ, τότε θ = U (εκτός πιθανόν από σημεία με f θ (x) =, θ Θ). Στη συνέχεια θα δώσουμε ορισμούς και θεωρήματα σχετικά με την ασυμπτωτική συμπεριφορά των ΕΜΠ. Ορισμός 1.3.3. Έστω μια ακολουθία T n, n 1 εκτιμητών μιας παραμέτρου θ. Η T n είναι ασυμπτωτικά κανονική εάν θ Θ : n(t n θ) κ N(, σ 2 (θ)), όπου σ 2 (θ) είναι μια διακύμανση που εξαρτάται γενικά από το θ Θ. Ορισμός 1.3.4. Έστω μια ακολουθία T n, n 1 εκτιμητών μιας παραμέτρου θ. Η T n είναι ασυμπτωτικά αποδοτική, όταν θ Θ, 1. n(t n θ) κ N(, σ 2 (θ)). 2. Για κάθε άλλη ακολουθία εκτιμητών W n, n 1 με n(wn θ) κ N(, zθ 2 ), θ Θ. ισχύει σ 2 θ z2 θ, θ Θ. 16

1.4. ΕΚΤΙΜΗΣΗ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΩΝ ΡΟΠΩΝ Προκειμένου να καθορίσουμε την ασυμπτωτική κατανομή των ΕΜΠ, παραθέτουμε τις παρακάτω συνθήκες ομαλότητας. Έστω μια τυχαία μεταβλητή X με συνάρτηση πυκνότητας - πιθανότητας f(x, θ), θ Θ, όπου Θ ένα ανοικτό διάστημα στο R κι έστω ένα τυχαίο δείγμα X 1, X 2,..., X n από την f(x, θ). Ακολουθούν οι συνθήκες ομαλότητας. 1. Για όλα τα x R, υπάρχουν οι παράγωγοι lnf(x,θ) θ 2. Υπάρχει μια συνάρτηση H : R (, ), τέτοια ώστε θ Θ, α. 3 lnf(x,θ) < H(x). 3 θ β. E θ [H(x)] < M(< ) και το M είναι ανεξάρτητο του θ Θ. [ ] 3. E lnf(x,θ) θ =, θ Θ. θ 4. Ισχύουν θ Θ, [ ] α. E 2 lnf(x,θ) θ 2 θ β. I x (θ) <. [ ] 2 = E lnf(x,θ) θ θ = Ix (θ)., 2 lnf(x,θ), 3 lnf(x,θ), θ Θ. 2 θ 3 θ Ασυμπτωτική Κατανομή των ΕΜΠ Θεώρημα 1.3.4. Έστω ότι ισχύουν οι παραπάνω συνθήκες ομαλότητας κι επιπλέον n υπάρχει ένας μονοσήμαντα ορισμένος ΕΜΠ θ n της θ. Τότε, 1. θn είναι συνεπής εκτιμητής για το θ. 2. θn είναι ασυμπτωτικά κανονικός εκτιμητής για το θ, δηλαδή n( θ n θ) κ N(, 1 I x (θ) ). 3. θn είναι ασυμπτωτικά αποδοτικός ή αποτελεσματικός εκτιμητής. 1.4 Εκτίμηση με τη μέθοδο των Ροπών Γενικά Έστω X 1,..., X n ένα τυχαίο δείγμα από ένα πληθυσμό, με συνάρτηση πυκνότητας - πιθανότητας f(x, θ) κι έστω µ 1,.., µ k οι πρώτες k ροπές ως προς το μηδέν, οι οποίες είναι εκφρασμένες ως συναρτήσεις των αγνώστων παραμέτρων θ 1,..., θ k. Έστω επίσης m 1,..., m k οι ροπές του δείγματος. Η μέθοδος των ροπών στηρίζεται στο ότι οι µ k ροπές εκτιμώνται από τα αντίστοιχα m k, ενώ οι παράμετροι θ k από την επίλυση του συστήματος µ k (θ k ) = m k,k = 1, 2,... 17

1.5. ΕΚΤΙΜΗΤΕΣ BAYES Πλεονέκτημα: Εύκολη επίλυση συστήματος. Mειoνέκτημα: Μειωμένη αποτελεσματικότητα (έναντι ΕΜΠ και Α.Ο.Ε.Δ.), η οποία ουσιαστικά οφείλεται στην «εμπειρικότητα» της μεθόδου. 1.5 Εκτιμητές Bayes Η εκτίμηση κατά Bayes γίνεται από μια διαφορετική σκοπιά σε σχέση με ότι έχουμε αντιμετωπίσει μέχρι τώρα που αντιλαμβανόμασταν το θ απλά σαν ένα πραγματικό αριθμό χωρίς καμιά ιδιότητα. Αν π.χ. θεωρήσουμε μια βιομηχανία, η οποία παράγει ηλεκτρικούς λαμπτήρες, τότε ο χρόνος αυτών των λαμπτήρων ακολουθεί την εκθετική κατανομή με άγνωστη παράμετρο θ και αυτή η παράμετρος εκφράζει το μέσο χρόνο ζωής των λαμπτήρων. Επομένως, δεν πρέπει να α- ναμένουμε «μεγάλες» τιμές για το θ αλλά ούτε και «μικρές». Δηλαδή σε σχέση με το πρόβλημα και την εμπειρία που διαθέτουμε πρέπει να δώσουμε μια διαφορετική βαρύτητα στις διάφορες τιμές του θ, για να εκμεταλλευτούμε αυτήν την εμπειρία, ώστε να δώσουμε καλύτερη εκτίμηση για το θ. Oπότε, θεωρούμε το θ σαν μια τυχαία μεταβλητή με πυκνότητα πιθανότητας π(θ), θ Θ και τις εξής ιδιότητες, π(θ), και θ Θ π(θ)dθ = 1 (ή π(θ) = 1). Θ θ H συνάρτηση π(θ) ονομάζεται εκ των προτέρων κατανομή του θ κι εκφράζει είτε την προσωπική μας αντίληψη για την πιθανή τιμή του θ, είτε συνοψίζει κάποιες εκ των προτέρων (δηλαδή πριν τη συλλογή δεδομένων) πληροφορίες για το θ. Θεωρούμε μια συνάρτηση ζημίας L(t, θ) και προσπαθούμε να ελαχιστοποιήσουμε τη συνάρτηση κινδύνου R(T, θ) = E θ (L(T (X )), θ)). Επειδή έχουμε θεωρήσει ότι το θ είναι μια τυχαία μεταβλητή, προφανώς η συνάρτηση κινδύνου είναι και αυτή μία τυχαία μεταβλητή, επομένως είναι λογικό σε αυτή την περίπτωση να προσπαθούμε να ελαχιστοποιήσουμε την μέση τιμή της, δηλαδή την BR(T ) = E(R(T, θ)) = R(T, θ)π(θ)dθ, η οποία ονομάζεται κίνδυνος Bayes του εκτιμητή. Συνεπώς βέλτιστος εκτιμητής είναι εκείνος που ελαχιστοποιεί τον κίνδυνο Bayes, οπότε καταλήγουμε στον εξής ορισμό για τον εκτιμητή Bayes. Θ Ορισμός 1.5.1. Ο εκτιμητής T = T (X) ονομάζεται εκτιμητής Bayes του g(θ), ως προς τη συνάρτηση ζημίας L(t, θ) και την εκ των προτέρων κατανομή π(θ) αν, R(T, θ)π(θ)dθ R(T, θ)π(θ)dθ Θ Θ 18

1.5. ΕΚΤΙΜΗΤΕΣ BAYES για κάθε εκτιμητή T = T (X ). Συνήθως, για να υπολογίσουμε αυτόν τον εκτιμητή Bayes πρέπει να βρούμε πρώτα την εκ των υστέρων κατανομή του θ, π(θ x ) = f(x; θ)π(θ), f(x) όπου f(x ) = Θf(x ; θ)π(θ)dθ. Η εκ των υστέρων κατανομή συνοψίζει την πληροφορία για το θ μετά τη συλλογή των δεδομένων κι έχει τις ιδιότητες της συνάρτησης πυκνότητας πιθανότητας. Παρατήρηση 1.5.1. Είναι σημαντικό να τονίσουμε σε αυτό το σημείο ότι δε μας ενδιαφέρει ιδιαίτερα η ακριβής συνάρτηση π(θ x ), αλλά η μορφή της εκ των υστέρων κατανομής για την οποία διαπιστώνουμε, συνήθως, ότι ακολουθεί κάποια από τις γνωστές κατανομές. Στο επόμενο θεώρημα δίνουμε ένα διαφορετικό τρόπο υπολογισμού του εκτιμητή Bayes. Θεώρημα 1.5.1. Για X = x ο εκτιμητής Bayes T = T (X) της παραμετρικής συνάρτησης g(θ) ως προς τη συνάρτηση L(t, θ) και την εκ των προτέρων κατανομή π(θ) έχει τιμή T (x) = t, όπου t είναι η τιμή του t που ελαχιστοποιεί τη συνάρτηση, h (t) = L(t, θ)π(θ x)dθ. Θ Αν επιπλέον, η συνάρτηση ζημίας είναι το τετραγωνικό σφάλμα, δηλαδή L(t, θ) = (t g(θ)) 2, τότε η εύρεση του εκτιμητή Bayes γίνεται πιο απλά, όπως φαίνεται και στο παρακάτω Θεώρημα. Θεώρημα 1.5.2. Έστω ότι η συνάρτηση ζημίας για την εκτίμηση του g(θ) είναι το τετραγωνικό σφάλμα L(t, θ) = (t g(θ)) 2. Τότε για X = x ο εκτιμητής Bayes T = T (X ) της παραμετρικής συνάρτησης g(θ) έχει τιμή T (x ) = E θ (g(y )), όπου Y είναι μια τυχαία μεταβλητή με κατανομή την εκ των υστέρων κατανομή π(θ x ). Ορισμός 1.5.2. Έστω παραδείγματος χάρη ένα τυχαίο δείγμα X 1, X 2,..., X n N(θ, σ 2 ) με Θ = (, + ). Αν η π(θ) είναι τέτοια ώστε, + π(θ)dθ = +, η π(θ) ονομάζεται μη γνήσια εκ των προτέρων κατανομή (improper prior) κι έχει τις ακόλουθες ιδιότητες, 19

1.6. ΔΙΑΤΕΤΑΓΜΕΝΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ π(θ), και θ Θ π(θ)dθ = + (ή π(θ) = + ). Θ θ Οι εκτιμητές Bayes που βασίζονται στις improper priors (ή αλλιώς non-informative priors όπως αναφέρονται στην βιβλιογραφία), ονομάζονται γενικευμένοι εκτιμητές Bayes. 1.6 Διατεταγμένες Παρατηρήσεις Πρόταση 1.6.1. Έστω X 1, X 2,..., X n τυχαίο δείγμα και X 1:n X 2:n... X n:n οι διατεταγμένες παρατηρήσεις του δείγματος. Τότε η συνάρτηση πυκνότητας των διατεταγμένων παρατηρήσεων X i:n είναι, Απόδειξη f i:n (x) = n! (i 1)!(n i)! [F (x)]i 1 [1 F (x)] n i f(x), < x <. (1.1) Έστω X 1, X 2,..., X n τυχαίο δείγμα ενός απόλυτα συνεχούς πληθυσμού με συνάρτηση πυκνότητας πιθανότητας f(x) και συνάρτηση κατανομής F (x). Θεωρούμε X 1:n X 2:n... X n:n τις διατεταγμένες παρατηρήσεις του δείγματος που λήφθηκαν οργανώνοντας το δείγμα σε αύξουσα σειρά μεγέθους. Το γεγονός x < X i:n... x + δx είναι ουσιαστικά το ακόλουθο γεγονός, όπου παρατηρούμε ότι X r x για τα i 1 στοιχεία από τα X r, x < X r x + δx για ακριβώς ένα στοιχείο από τα X r και X r > x + δx για τα εναπομείναντα n i στοιχεία από τα X r. Δεδομένου ότι το δx είναι πολύ μικρό μπορούμε να πούμε ότι, n! P (x < X i:n x + δx) = (i 1)!(n i)! [F (x)]i 1 [1 F (x + δx)] n i [F (x + δx) F (x)] + O ( (δx) 2), (1.2) όπου O ((δx) 2 ), ένας όρος της τάξης (δx) 2 (a term of order), είναι η πιθανότητα που αντιστοιχεί στο γεγονός ότι έχουμε περισσότερα από ένα X r στο διάστημα (x, x + δx]. Από τη συνάρτηση 1.2 συμπεραίνουμε ότι η συνάρτηση πυκνότητας για τα X i:n (1 i n) είναι, 2

1.6. ΔΙΑΤΕΤΑΓΜΕΝΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ ( ) P (x < Xi:n x + δx) f i:n (x) = lim δx δx n! = (i 1)!(n i)! [F (x)]i 1 [1 F (x)] n i f(x), < x <. Πρόταση 1.6.2. Έστω X = (X 1, X 2,..., X n ) ένα τυχαίο δείγμα με συνάρτηση κατανομής F ( ). Έστω, επίσης, X 1:n < X 2:n <... < X n:n οι διατεταγμένες παρατηρήσεις του παρατηρηθέντος δείγματος. Τότε ισχύουν τα εξής, Απόδειξη E(F (X i:n )) = i n + 1, V ar(f (X i:n)) = i(n i + 1) (n + 1) 2 (n + 2). (1.3) Από την Πρόταση 1.6.1 η συνάρτηση πυκνότητας πιθανότητας για τις διατεταγμένες παρατηρήσεις ορίζεται ως εξής, f Xi:n (x) = n! (i 1)!(n i)! [F (x)]i 1 [1 F (x)] n i, < F (x) < 1. E(F Xi (X)) = = = 1 n! F (x) (i 1)!(n i)! [F (x)]i 1 [1 F (x)] n i d(f (x)) ( ) i 1 (n + 1)! n + 1 i!(n + i)! [F (x)]i [1 F (x)] n i dx i n + 1 1 f Xi+1:n+1 (x)dx, όπου f Xi+1:n+1 (x) είναι η πυκνότητα της i + 1 - διατεταγμένης παρατήρησης από n + 1 παρατηρήσεις, προφανώς 1 f X i+1:n+1 (x)dx = 1. Επομένως, E(F (X (i) )) = i. n+1 Γνωρίζουμε ότι V ar(f (X (i) )(X)) = E[F X(i) (X)] 2 [E(F X(i) (X))] 2 κι έχουμε, E(F (X (i:n) ) 2 ) = 1 1 F (x) 2 n! (i 1)!(n i)! [F (x)]i 1 [1 F (x)] n i d(f (x)) n! = (i 1)!(n i)! [F (x)]i+1 [1 F (x)] n i d(f (x)) i(i + 1) 1 = (n + 1)(n + 2) = i(i + 1) n(n + 2) 1 (n + 2)! (i + 1)!(n i)! [F (x)]i+1 [1 F (x)] n i d(f (x)) f i+2:n+2 (x)dx, 21

1.6. ΔΙΑΤΕΤΑΓΜΕΝΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ όπου f i+2:n+2 (x) είναι η πυκνότητα της i + 2 διατεταγμένης παρατήρησης, από τις n + 2 παρατηρήσεις, και προφανώς 1 f i+2:n+2(x)dx = 1. Άρα, Επομένως, έχουμε, E(F (X (i:n) ) 2 ) = i(i + 1) n(n + 2). V ar(f (X (i) )(X)) = E[F X(i) (X)] 2 [E(F X(i) (X))] 2 ( ) 2 i(i + 1) i = (n + 1)(n + 2) n + 1 = i(i + 1)(n + 1) i2 (n + 2) (n + 1) 2 (n + 2) i(n i + 1) = (n + 1) 2 (n + 2). 22

Κεφάλαιο 2 Ιδιότητες της Εκθετικοποιημένης Γάμμα κατανομής Στο κεφάλαιο που ακολουθεί παραθέτουμε ορισμένους ορισμούς σχετικά με το μοντέλο της Εκθετικοποιημένης Γάμμα κατανομής, καθώς και μερικές βασικές ιδιότητες. Οι Gupta et. al. (1998) ήταν οι πρώτοι που εισήγαγαν την Εκθετικοποιημένη Γάμμα κατανομή (Exponentiated Gamma Distribution). Ουσιαστικά, στην εργασία τους, πρότειναν μια οικογένεια εκθετικοποιημένων κατανομών με σκοπό τη μοντελοποίηση δεδομένων αποτυχίας χρόνου ζωής (failure time data). 2.1 Συνάρτηση Πυκνότητας Πιθανότητας Ορισμός 2.1.1. Μια συνεχής τυχαία μεταβλητή X με συνάρτηση πυκνότητας πιθανότητας, f(x; θ, λ) = θλ 2 xe λx [1 e λx (λx + 1)] θ 1, (2.1) όπου θ, λ, x >, λέμε ότι ακολουθεί την Εκθετικοποιημένη Γάμμα κατανομή (Exponentiated Gamma Distribution) με παραμέτρους θ και λ. Η Εκθετικοποιημένη Γάμμα κατανομή EG συμβολίζεται ως EG(θ, λ). Πρόταση 2.1.1. Αν X είναι μια Εκθετικοποιημένη Γάμμα τυχαία μεταβλητή τότε η συνάρτηση κατανομής της δίνεται από τη σχέση F (x; θ, λ) = [1 e λx (λx + 1)] θ, θ, λ, x >. Απόδειξη Από τον Ορισμό 2.1.1 προκύπτει ότι, F (x; θ, λ) = x f(t)dt = x θλ 2 te λt [1 e λt (λt+1)] θ 1 dt = [1 e λx (λx+1)] θ, θ, λ, x >. Είναι σημαντικό να τονίσουμε ότι για θ = 1 και λ = 1, η συνάρτηση πυκνότητας της EG ταυτίζεται με τη συνάρτηση πυκνότητας μιας Γάμμα κατανομής με παράμετρο σχήματος a = 2 23

2.1. ΣΥΝΑΡΤΗΣΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ και παράμετρο κλίμακας β = 1, δηλαδή EG(1, 1) G(2, 1). Στη συνέχεια θα μελετήσουμε γραφικά τη συμπεριφορά της πυκνότητας πιθανότητας, η οποία δίνεται στη συνάρτηση (2.1) με τη βοήθεια του Wolfram Mathematica 1. Από τους Ορισμούς 1.1.2 και?? είναι προφανές ότι το θ είναι παράμετρος σχήματος (shape parameter), ενώ το λ είναι παράμετρος κλίμακας (scale parameter). Παρατήρηση 2.1.1. Αρχικά μελετάμε τη συμπεριφορά της συνάρτησης πυκνότητας πιθανότητας ως προς την παράμετρο σχήματος θ όταν η παράμετρος κλίμακας λ θεωρείται σταθερή (λ = 1). Σχήμα 2.1: Συνάρτηση πυκνότητας πιθανότητας της EG(θ, λ), όταν λ = 1. Από το Σχήμα 2.1 συμπεραίνουμε ότι για τιμές του θ κοντά στο μηδέν η συνάρτηση είναι φθίνουσα, ενώ για τιμές κοντά στο 1 αλλά και για θ > 1 η συνάρτηση παρουσιάζει θετική ασυμμετρία. Παρατήρηση 2.1.2. Στη συνέχεια μελετάμε την παράμετρο κλίμακας λ για δύο περιπτώσεις. Αρχικά για τιμές του θ > 1 κι έπειτα για τιμές του θ 1. Η μελέτη γίνεται με αυτόν τον τρόπο, διότι για θ = 1 η συνάρτησή μας αλλάζει σχήμα. Θεωρώντας θ = 2 η γραφική παράσταση για διάφορες τιμές του λ έχει ως εξής, 24

2.2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΓΕΘΗ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ Σχήμα 2.2: Συνάρτηση πυκνότητας πιθανότητας της EG(θ, λ), όταν θ = 2. Θεωρώντας θ =.8 η γραφική παράσταση για διάφορες τιμές του λ έχει ως εξής, Σχήμα 2.3: Συνάρτηση πυκνότητας πιθανότητας της EG(θ, λ), όταν θ =, 8. 2.2 Χαρακτηριστικά μεγέθη της Εκθετικοποιημένης Γάμμα Κατανομής Πρόταση 2.2.1. Έστω X EG(θ, 1), τότε η διάμεσος m για την Εκθετικοποιημένη Γάμμα κατανομή, για λ = 1, προκύπτει ως αριθμητική λύση από την παρακάτω εξίσωση, j= k= ( θ ( 1) j j όπου το θ είναι πραγματικός αριθμός. )( ) j e jm m k =, 5, (2.2) k 25

2.2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΓΕΘΗ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ Σύμφωνα με την εργασία των Shawky and Bakoban (211), η διάμεσος της Εκθετικοποιημένης Γάμμα κατανομής δεν μπορεί να βρεθεί σε αναλυτική μορφή και για λ = 1 προκύπτει από τη σχέση, F (m) = [1 e m (1 + m)] θ =, 5. Πρόταση 2.2.2. Έστω X EG(θ, λ), τότε η ροπογεννήτρια M X (t) = E(e tx ), τυχαίας μεταβλητής X δίνεται από τη σχέση, Απόδειξη M X (t) = θ + j= k= ( 1) j ( θ 1 j )( ) j k Για αυτήν την απόδειξη θα χρειαστούμε τις συναρτήσεις, και (1 z) θ 1 = + j= ( ) θ 1 ( 1) j z j = j (1 + λx) k = k m= Επίσης, αν θ Z + τότε η (2.4) γίνεται, j= + j= θ 1 ( ) θ 1 (1 z) θ 1 = ( 1) j z j = j Έστω X EG(θ, λ) τότε, E(e tx ) = e tx f(x)dx = t > της λ k+2 Γ(k + 2), θ >. (2.3) (λ t + λj) k+2 ( 1) j Γ(b) j!γ(b j)! zj, z < 1, θ R (2.4) ( ) k (λx) m, k Z. (2.5) m θ 1 j= ( 1) j Γ(b) j!γ(b j)! zj, z < 1. e tx θλ 2 xe λx [1 e λx (λx + 1)] θ 1 dx. (2.6) Αν στο ολοκλήρωμα (2.6) θέσουμε z = 1+λx, και με τη βοήθεια των συναρτήσεων (2.4) και e λx (2.5), η ροπογεννήτρια παίρνει την εξής μορφή, E(e tx ) = = θ = θ + j= k= + + ( ) θ 1 e tx θλ 2 xe λx ( 1) j j j= k= j= ( 1) j ( θ 1 j ( 1) j ( θ 1 j e λxj k= ( ) j (λx) k dx k )( j + )λ k+2 x k+1 e (λ t+λj)x dx k )( ) j k λ k+2 Γ(k + 2) (λ t + λj) k+2. 26

2.2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΓΕΘΗ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ Παρατήρηση 2.2.1. Στην περίπτωση όπου θ Z + χρησιμοποιώντας τον τύπο, έχουμε ότι η ροπογεννήτρια θα είναι, θ 1 M X (t) = θ j= k= θ 1 ( ) θ 1 (1 z) θ 1 = ( 1) j z j, j ( 1) j ( θ 1 j j= )( ) j k λ k+2 Γ(k + 2) (λ t + λj) k+2, θ Z +. (2.7) Παρατήρηση 2.2.2. Για θ = 1 και λ = 1 έχουμε ότι, M X (t) = 1 (1 t) 2, t >, η οποία είναι η ροπογεννήτρια συνάρτηση της κατανομής G(2, 1). Σύμφωνα με την Παρατήρηση 1.1.3, από τις ιδιότητες της ροπογεννήτριας μπορούν να υ- πολογιστούν η μέση τιμή και η διασπορά μιας κατανομής. Ορίζουμε ως, A r (θ) = + j=1 k= ( 1) j ( θ 1 j )( ) j Γ(r + k + 2) k, r = 1, 2,... (2.8) (1 + j) r+k+2 Άρα, λοιπόν, για τη μέση τιμή και τη διασπορά της Εκθετικοποιημένης Γάμμα κατανομής έχουμε, Πρόταση 2.2.3. Έστω X EG(θ, λ). Τότε, όπου το A 1 (θ) δίνεται από την (2.8) για r = 1. Απόδειξη E(X) = θ λ [2 + A 1(θ)], (2.9) Σύμφωνα με την Παρατήρηση 1.1.3, για να βρούμε τη μέση τιμή αρκεί να λύσουμε την εξίσωση M () = µ. Γνωρίζουμε ότι όταν θ R, M X (t) = θ + j= k= Παραγωγίζοντας ως προς t έχουμε, M X (t) = θ M X(t) = θ + j= k= + j= k= ( 1) j ( θ 1 j ( 1) j ( θ 1 j ( 1) j ( θ 1 j 27 )( ) j k )( ) j k )( ) j k λ k+2 Γ(k + 2) (λ t + λj) k+2. λ k+2 Γ(k + 2) (λ t + λj) k+2 λ k+2 Γ(k + 3) (λ t + λj) k+3.

2.2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΓΕΘΗ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ Για t = έχουμε, M X() = θ + j= k= Από την (2.8) και για r = 1 έχουμε, A 1 (θ) = + j=1 k= ( 1) j ( θ 1 j ( 1) j ( θ 1 j )( ) j k λ k+2 Γ(k + 3). (2.1) (λ + λj) k+3 )( ) j Γ(k + 3) k. (2.11) (1 + j) k+3 Συνδυάζοντας, λοιπόν, τις εξισώσεις (2.1) και (2.11) καταλήγουμε στο εξής, µ = M X() = θ = θ [ Γ(3) λ + 1 λ + = θ λ [2 + A 1(θ)]. j= k= + j=1 k= ( 1) j ( θ 1 j ( 1) j ( θ 1 j )( ) j λ k+2 Γ(k + 3) k (λ + λj) k+3 )( ) ] j Γ(k + 3) k (1 + j) k+3 Πρόταση 2.2.4. Έστω X EG(θ, λ). Τότε, Απόδειξη V ar(x) = θ λ 2 [6 + A 2(θ)] θ2 λ 2 [2 + A 1(θ)] 2. (2.12) Σύμφωνα με την Παρατήρηση 1.1.3 γνωρίζουμε ότι M () [M ()] 2 = σ 2. Η δεύτερη παράγωγος της ροπογεννήτριας είναι, + M X(t) = θ και για t = έχουμε, j= k= + M X() = θ j= k= ( 1) j ( θ 1 j Από την (2.8) και για r = 2 έχουμε, A 2 (θ) = + ( 1) j ( θ 1 j j=1 k= )( ) j k ( 1) j ( θ 1 j )( ) j k λ k+2 Γ(k + 4) (λ t + λj) k+4 λ k+2 Γ(k + 4). (2.13) (λ + λj) k+4 )( ) j Γ(k + 4) k Άρα, συνδυάζοντας τις εξισώσεις (2.13) και (2.14) έχουμε,. (2.14) (1 + j) k+4 28

2.2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΓΕΘΗ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ V ar(x) = σ 2 = M () [M ()] 2 = θ + j= k= [ Γ(4) = θ λ 2 ( )( ) θ 1 j ( 1) j j k + A 2(θ) λ 2 λ k+2 Γ(k + 4) (λ + λj) k+4 ] θ2 λ 2 [Γ(3) + A 1(θ)] 2 = θ λ 2 [6 + A 2(θ)] θ2 λ 2 [2 + A 1(θ)] 2. [ θ + j= k= ( 1) j ( θ 1 j )( ) j Γ(k + 3) k (λ + λj) k+3 ] 2 Πρόταση 2.2.5. Έστω X EG(θ, λ), τότε οι ροπές r-τάξης (r = 1, 2, 3, 4) γύρω από το μηδέν δίνονται από τις σχέσεις, µ 1 = µ = θ λ [2 + A 1(θ)] (2.15) µ 2 = θ λ 2 [6 + A 2(θ)] (2.16) µ 3 = θ λ 3 [24 + A 3(θ)] (2.17) Γενικά, όπου το A r (θ) δίνεται από τη σχέση (2.8). Απόδειξη Γνωρίζουμε ότι µ r = E(X r ) = xr f(x)dx. Άρα, µ 4 = θ λ 4 [12 + A 4(θ)]. (2.18) µ r = θ λ r [Γ(r + 2) + A r(θ)], (2.19) µ r = E(X r ) = x r f(x)dx = x r θλ 2 xe λx [1 e λx (λx + 1)] θ 1 dx. Θέτοντας z = 1+λx e λx και χρησιμοποιώντας τις εξισώσεις (2.4) και (2.5) έχουμε, 29

2.2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΓΕΘΗ ΤΗΣ ΕΚΘΕΤΙΚΟΠΟΙΗΜΕΝΗΣ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗΣ µ r = = = θ = θ + j= k= + j= k= θλ 2 x r+1 e λx [1 e λx (λx + 1)] θ 1 dx + ( ) θ 1 θλ 2 x r+1 e λx ( 1) j j j= e λxj k= ( ) j λ k x k dx k ( )( j θ 1 + ( 1) )λ j k+2 x r+k+1 e (λ+λj)x dx k j ( )( j θ 1 ( 1) j k j = θ λ r [Γ(r + 2) + A r(θ)]. ) λ k+2 Γ(r + k + 2) λ r+k+2 (1 + j) r+k+2 Στη συνέχεια, χρησιμοποιούμε τις κεντρικές ροπές στην ανάλυση ασυμμετρίας και κύρτωσης. Ασυμμετρία Η κατανομή ενός πληθυσμού μπορεί να είναι είτε συμμετρική είτε μη συμμετρική. Στην πρώτη περίπτωση, η κορυφή, η διάμεσος και η μέση τιμή συμπίπτουν. Στη δεύτερη περίπτωση, ένα από τα τμήματα στα οποία χωρίζει την κατανομή η κορυφή περιέχει περισσότερες παρατηρήσεις από το άλλο. Υπάρχουν δύο ειδών ασυμμετρίες, η θετική ασυμμετρία και η αρνητική ασυμμετρία. Στη θετική ασυμμετρία, οι περισσότερες παρατηρήσεις, καθώς η διάμεσος και η μέση τιμή, βρίσκονται δεξιά της κορυφής. Αντίθετα, στην αρνητική ασυμμετρία οι περισσότερες παρατηρήσεις, καθώς η διάμεσος και η μέση τιμή, βρίσκονται αριστερά της κορυφής. Ο συντελεστής ασυμμετρίας Pearson είναι, Διακρίνουμε τις εξής περιπτώσεις: β 1 = µ2 3. (2.2) µ 3 2 Όταν β 1 = έχουμε συμμετρία. Όταν β 1 > έχουμε θετική ασυμμετρία. Όταν β 1 < έχουμε αρνητική ασυμμετρία. Παρατήρηση 2.2.3. Από τη σχέση (2.2) και την Πρόταση 1.1.1 έχουμε ότι ο συντελεστής ασυμμετρίας για την Εκθετικοποιημένη Γάμμα κατανομή υπολογίζεται από τη σχέση, όπου τα µ 1, µ 2, µ 3 δίνονται στην Πρόταση 2.2.5. β 1 = [µ 3 3µ 2µ 1 + 2(µ 1) 3 ] 2 [µ 2 (µ 1) 2 ] 3, (2.21) 3

2.3. ΣΥΝΑΡΤΗΣΕΙΣ ΕΠΙΒΙΩΣΗΣ ΚΑΙ ΣΥΝΑΡΤΗΣΗ ΚΙΝΔΥΝΟΥ Κύρτωση Τα μέτρα κυρτότητας αφορούν το βαθμό συγκέντρωσης των δεδομένων γύρω από το μέσο και τα άκρα της κατανομής. Μια κατανομή, η οποία έχει σχετικά μεγάλη συχνότητα (κορυφή) κι επομένως μεγάλη συγκέντρωση τιμών γύρω από το μέσο, λέγεται λεπτόκυρτη (leptokurtic), ενώ αν η μέγιστη συχνότητα της είναι σχετικά μικρή λέγεται πλατύκυρτη (platykurtic). Κατανομές που προσεγγίζονται από την Κανονική κατανομή λέγονται μεσόκυρτες (mesokurtic). Ένα μέτρο που εκφράζει το βαθμό κυρτότητας μιας κατανομής είναι ο συντελεστής κύρτωσης του Pearson, ο οποίος ορίζεται από τον τύπο, β 2 = µ 4. (2.22) µ 2 2 Από τη σχέση (2.22) και την Πρόταση 1.1.1 έχουμε, Παρατήρηση 2.2.4. Η κυρτότητα για την Εκθετικοποιημένη Γάμμα κατανομή υπολογίζεται από τη σχέση, όπου τα µ 1, µ 2, µ 3 και µ 4 δίνονται στην Πρόταση 2.2.5. β 2 = µ 4 4µ 3µ 1 + 6µ 2µ 1 3(µ 1) 4 [µ 2 (µ 1) 2 ] 2, (2.23) 2.3 Συναρτήσεις Επιβίωσης και Συνάρτηση Κινδύνου 2.3.1 Συναρτήσεις Επιβίωσης για την Εκθετικοποιημένη Γάμμα Κατανομή Χρόνος επιβίωσης είναι ο χρόνος μέχρι να συμβεί ένα συγκεκριμένο ενδεχόμενο (όπως αντίδραση σε θεραπεία, θάνατος, εμφάνιση πάθησης). Τα Δεδομένα Επιβίωσης (Survival Data) περιλαμβάνουν το Χρόνο Επιβίωσης, την αντίδραση σε δεδομένη θεραπεία, τα χαρακτηριστικά του ασθενούς, που σχετίζονται με την απόκριση στη θεραπεία, την επιβίωση και την εξέλιξη μιας πάθησης. Ορισμός 2.3.1. Η συνάρτηση, η οποία καθορίζει την πιθανότητα η συνιστώσα ενός συστήματος να μην έχει αποτύχει μέχρι τη χρονική στιγμή t, είναι γνωστή ως Συνάρτηση επιβίωσης ή αξιοπιστίας (Survival or Reliability Function) και σημειώνεται ως, R(t) = F x (t) = 1 F x (t), t, όπου F X (t) είναι η συνάρτηση κατανομής της τυχαίας μεταβλητής X. 31