ΕΞΟΜΑΛΥΝΣΗ ΠΟΣΟΣΤΩΝ ΘΝΗΣΙΜΟΤΗΤΑΣ ΜΕΣΩ ΜΕΤΡΩΝ ΑΠΟΚΛΙΣΗΣ

Σχετικά έγγραφα
TO ΠΡΟΒΛΗΜΑ ΤΗΣ ΤΟΠΟΘΕΤΗΣΗΣ ΠΟΛΩΝ ΜE ΑΝΑΤΡΟΦΟΔΟΤΗΣΗ ΤΩΝ ΜΕΤΑΒΛΗΤΩΝ ΚΑΤΑΣΤΑΣΗΣ

3. Χαρακτηριστικές Παράμετροι Κατανομών

Αριθµητικά χαρακτηριστικά µιάς τυχαίας µεταβλητής

, όπου x = 0,1,..., Έτσι, για την πιθανότητα σε ένα έτος να μην υπάρξουν θάνατοι ζώων από τον εμβολιασμό έχουμε, 2! !

Εφαρμοσμένα Μαθηματικά ΙΙ 10ο Σετ Ασκήσεων (Λύσεις) Ιδιοτιμές - Ιδιοδιανύσματα

0. Σύντοµη επισκόπηση θεωρίας πιθανοτήτων

Έστω η πραγµατική συνάρτηση f(t) της πραγµατικής µεταβλητής t (π.χ χρόνος). Ο µετασχηµατισµός Laplace της συνάρτησης f(t) δίνεται από τη σχέση:

Λύσεις Προαιρετικής Eργασίας Τεχνικές Εκτίμησης

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΙΙ

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

Βρέθηκε ότι το πηλίκο φ/λ = 68,5905 J K 1.

6.8 Συµβολή Κυµάτων. y = y 1 + y http : //perif ysikhs.wordpress.com 55 Μιχάλης Ε. Καραδηµητριου

ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ

Support Vector Machines

Παραδείγματα Ιδιοτιμές Ιδιοδιανύσματα Ι. Λυχναρόπουλος

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

14. ΜΕΘΟ ΟΙ ΓΙΑ ΤΗΝ ΕΠΙΛΥΣΗ ΜΗ-ΓΡΑΜΜΙΚΩΝ ΠΡΟΒΛΗΜΑΤΩΝ

ΚΕΦΑΛΑΙΟ 5 ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ

ΚΕΦΑΛΑΙΟ 1. Μέσο μήκος ροής στα διαγράμματα ελέγχου τύπου Shewhart

ΤΕΠΑΚ, Τμήμα Πολιτικών Μηχ. / Τοπογράφων Μηχ. και Μηχ. Γεωπληροφορικής

Το πρόβλημα των μηδενικών ιδιοτιμών.

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

Πεπερασμένες διαφορές για την ελλειπτική εξίσωση στις δύο διαστάσεις

ΚΕΦΑΛΑΙΟ 2. Mεγιστικές συναρτήσεις/τελεστές

Κύμα ονομάζουμε τη διάδοση μιας διαταραχής από σημείο σε σημείο του χώρου με ορισμένη ταχύτητα.

ΤΟ EWMA ΙΑΓΡΑΜΜΑ ΓΙΑ ΤΗΝ ΙΑΚΥΜΑΝΣΗ ΜΕ ΕΚΤΙΜΩΜΕΝΕΣ ΠΑΡΑΜΕΤΡΟΥΣ

ΤΟ ΦΩΣ ΛΑΜΠΤΗΡΑ ΠΥΡΑΚΤΩΣΕΩΣ ΚΑΙ Η ΣΤΑΘΕΡΑ ΤΟΥ PLANK

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

R 1. e 2r V = Gauss E + 1 R 2

Γραπτή Εξέταση στο Μάθημα "ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ" 6ο Εξάμηνο Ηλεκτρολόγων Μηχ. & Μηχ. Υπολογιστών Θέματα και Λύσεις. μ 1.

Προσαρµοστικοί Αλγόριθµοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Οαλγόριθµος καθόδου κατά την µέγιστη κλίση (Steepest-descent)

ΚΕΦΑΛΑΙΟ 4: ΙΔΙΟΤΙΜΕΣ ΚΑΙ ΙΔΙΟΔΙΑΝΥΣΜΑΤΑ

3Τοπολογικοί διανυσματικοί χώροι. y A, για κάθε λ [ 0,1]

ΚΕΦΑΛΑΙΟ 4. Προσομοίωση Βασικών Στοχαστικών Ανελίξεων : Ανέλιξη Poisson και Κίνηση Brown

6.8 Συµβολή Κυµάτων. y = y 1 + y perif ysikhs.wordpress.com 55 Μιχάλης Ε. Καραδηµητριου

) = 2lnx lnx 2

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Κεφάλαιο 1. Πρότυπα. Στο κεφάλαιο αυτό εισαγάγουµε την έννοια του προτύπου πάνω από δακτύλιο που θα παίξει σηµαντικό ρόλο στα επόµενα κεφάλαια.

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

ΙΔΙΟΤΗΤΕΣ ΜΟΝΟΤΟΝΙΑΣ ΣΕ ΑΝΑΝΕΩΤΙΚΕΣ ΑΝΕΛΙΞΕΙΣ

ΝΙΚΟΛΑΟΥ ΙΩ. ΔΑΡΑ ΕΠΙΚΟΥΡΟΥ ΚΑΘΗΓΗΤΟΥ ΣΤΡΑΤΙΩΤΙΚΗΣ ΣΧΟΛΗΣ ΕΥΕΛΠΙΔΩΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΚΑΙ ΣΤΡΑΤΙΩΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ ΑΥΤΗΣ. ΤΟΜΟΣ 2 ΟΣ ΒΙΒΛΙΟ 1 ο

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ακαδημαϊκό έτος Λύσεις για την Προαιρετική Εργασία

4. Ειδικές Διακριτές, Συνεχείς Κατανομές

και Y εάν και 4. Να βρεθούν οι κατανομές των υπό συνθήκη τ.μ. [ Y Y ] και [ ] p x x p x p x Po x Po x e

3Τοπολογικοί διανυσματικοί χώροι. y A, για κάθε λ [ 0,1]

όπου α (β) = η αναλογία των μη εμπορεύσιμων αγαθών στο συνολικό εγχώριο (ξένο) δείκτη τιμών.

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Στατιστική Συμπερασματολογία

Κύματα (Βασική θεωρία)

Διάστημα εμπιστοσύνης της μέσης τιμής

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Σεµινάριο Αυτοµάτου Ελέγχου

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

ˆ Αποτελείται από σωµατίδια, τα οποία πληρούν το µέσο χωρίς διάκενα. ˆ Τα σωµατίδια αυτά συνδέονται µεταξύ τους µε ελαστικές δυνάµεις.

x y x z για κάθε x, y, . Ένας δακτύλιος R καλείται μεταθετικός αν

Διπλωματική Εργασία. Εφαρμοσμένη Θεωρία Πινάκων

ΣΤΟΙΧΕΙΑ ΑΡΙΘΜΗΤΙΚΗΣ ΑΝΑΛΥΣΗΣ

Generalized Fibonacci-Like Polynomial and its. Determinantal Identities

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

Στατιστική Συμπερασματολογία

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

L2 {mk. K Z 1Z 2 e 2. v 8 ě 4 ˆ 10 7 m/s. Z 2 79, e 1.6ˆ10 19 C, 9ˆ10 9 Nm 2 /C 2

Εισόδημα Κατανάλωση

HMY 795: Αναγνώριση Προτύπων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

6. ΑΡΙΘΜΗΤΙΚΗ ΟΛΟΚΛΗΡΩΣΗ

Κεφάλαιο 6 Τυπικές συναρτήσεις κατανομής στην τεχνική υδρολογία

3. Κατανομές πιθανότητας

5 Haar, R. Haar,. Antonads 994, Dogaru & Carn Kerkyacharan & Pcard 996. : Haar. Haar, y r x f rt xβ r + ε r x β r + mr k β r k ψ kx + ε r x, r,.. x [,

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

ΘΕΜΑΤΑ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΛΛΗΝΙΩΝ ΕΞΕΤΑΣΕΩΝ 2010 ΦΥΣΙΚΗ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Στοιχεία Πιθανοτήτων και Θεωρίας Ουρών

ΠΕΠΕΡΑΣΜΕΝΕΣ ΙΑΦΟΡΕΣ ΚΑΙ ΕΞΙΣΩΣΕΙΣ ΙΑΦΟΡΩΝ

1. Τετραγωνικές μορφές. x y 0. 0x y 0 1α 1β 2α 2β 3. 0x + y 0

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014

Εργαστήριο Δημογραφικών & Κοινωνικών Αναλύσεων

ρ. Ευστρατία Μούρτου

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

II.7 ΕΣΣΙΑΝΟΣ ΠΙΝΑΚΑΣ

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

Εξαιτίας της συμβολής δύο κυμάτων του ίδιου πλάτους και της ίδιας συχνότητας. που διαδίδονται ταυτόχρονα στο ίδιο γραμμικό ελαστικό μέσο

Εργαστήριο Δημογραφικών & Κοινωνικών Αναλύσεων

Ανάκτηση Πληροφορίας

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Διμεταβλητές κατανομές πιθανοτήτων

Vol. 34 ( 2014 ) No. 4. J. of Math. (PRC) : A : (2014) Frank-Wolfe [7],. Frank-Wolfe, ( ).

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ.

3.7 Παραδείγματα Μεθόδου Simplex

ΧΡΟΝΟΙ ΑΝΑΜΟΝΗΣ ΜΕΧΡΙ ΤΗΝ ΠΡΩΤΗ ΕΜΦΑΝΙΣΗ ΣΧΗΜΑΤΙΣΜΩΝ ΣΕ ΜΙΑ ΔΙΔΙΑΣΤΑΤΗ ΑΚΟΛΟΥΘΙΑ ΤΡΙΤΙΜΩΝ ΔΟΚΙΜΩΝ

Κεφάλαιο 4 Διανυσματικοί Χώροι

Transcript:

Εηνικό Στατιστικό Ινστιτούτο Πρακτικά 2 ου Πανεηνίου Συνεδρίου Στατιστικής (27), σε 363-37 ΕΞΟΜΑΛΥΝΣΗ ΠΟΣΟΣΤΩΝ ΘΝΗΣΙΜΟΤΗΤΑΣ ΜΕΣΩ ΜΕΤΡΩΝ ΑΠΟΚΛΙΣΗΣ Αθανάσιος Σαχάς και Τάκης Παπαϊωάννου 2 Τμήμα Στατιστικής & Ασφαιστικής Επιστήμης, Πανεπιστήμιο Πειραιώς asachlas@unp.gr, 2 takpap@unp.gr ΠΕΡΙΛΗΨΗ Συχνά στην πράξη χρειάζεται να αναθεωρούμε τις αρχικές εκτιμήσεις των ποσοστών θνησιμότητας με σκοπό την παραγωγή ομαότερων εκτιμήσεων. Αυτό γίνεται μέσω μιας διαδικασίας που έγεται εξομάυνση (graduaton). Στην εργασία αυτή διερευνούμε τη χρήση των μέτρων απόκισης δύναμης (power dvergence) τάξης που εισήγαγαν οι Cresse and Read, με κατάηους γραμμικούς και/ή τετραγωνικούς περιορισμούς, για να βρούμε το καύτερο μέτρο και να πάρουμε την καύτερη εξομάυνση. Τα αποτεέσματα δείχνουν ότι μέτρα απόκισης με μη πιθανοτικά διανύσματα (non-probablty vectors), όπως συμβαίνει με τα ποσοστά θνησιμότητας, ικανοποιούν, υπό ορισμένες συνθήκες, μερικές από τις ιδιότητες των μέτρων απόκισης όπως αυτά ορίζονται στη στατιστική θεωρία πηροφοριών. Οι αποκίσεις δύναμης δίνουν επίσης αποτεέσματα ισοδύναμα με αυτά άων μεθόδων εξομάυνσης. Παρουσιάζεται επίσης μια αριθμητική διερεύνηση. Φαίνεται ότι η επιογή > και πιο συγκεκριμένα η 2 / 3, που προτάθηκε από τους Cresse and Read για όγους στατιστικής ισχύος, είναι μια καή επιογή όσον αφορά τόσο την ομαότητα όσο και την προσαρμογή. Keywords: Graduaton; Kullback-Lebler dvergence; Cresse-Read dvergence; Ft; Smoothness; Dvergence wth non-probablty vectors. ΕΙΣΑΓΩΓΗ Ο αναογιστής, για να περιγράψει το πραγματικό αά άγνωστο πρότυπο θνησιμότητας ενός πηθυσμού, υποογίζει από πρωτογενή δεδομένα αδρούς δείκτεςποσοστά (rates) θνησιμότητας, αδρές πιθανότητες θανάτου ή εντάσεις θνησιμότητας, τα οποία συνήθως αποτεούν μια ανώμαη σειρά. Για το όγο αυτό, είναι συνήθης πρακτική να αναθεωρούνται οι αρχικές εκτιμήσεις με σκοπό την παραγωγή ομαότερων εκτιμήσεων, μέσω μιας διαδικασίας που ονομάζεται εξομάυνση. Στην εξομάυνση υπάρχουν δυο κυρίαρχα και αντικρουόμενα στοιχεία: ο βαθμός ομαότητας και η προσαρμογή των ομαοποιημένων εκτιμήσεων στις αρχικές. Το δεύτερο αυτό στοιχείο οδηγεί στη χρήση μέτρων απόκισης μεταξύ των νέων και αρχικών τιμών. Οι Zhang and Brockett (987) χρησιμοποίησαν για το σκοπό αυτό το μέτρο απόκισης των Kullback-Lebler KL D ( v, u) v x ln( v x u x ), x - 363 -

όπου {v x } είναι μια σειρά ομαών ποσοστών στην ηικία x, η οποία θέουμε να είναι όσο το δυνατόν πιο κοντά στη σειρά {u x } των παρατηρούμενων τιμών και επιπέον υπέθεσαν ότι το πραγματικό αά άγνωστο πρότυπο πιθανότητας είναι () ομαό, () αυξανόμενο με την ηικία x (μονότονο), () απότομα αυξανόμενο στις μεγάες ηικίες (κυρτό). Επίσης υπέθεσαν ότι (v) ο αριθμός των θανάτων στα εξομαυμένα δεδομένα είναι ίσος με τον αριθμό των θανάτων στα παρατηρούμενα δεδομένα και (v) το σύνοο των εξομαυμένων ηικιών θανάτου ισούται με τις παρατηρούμενες συνοικές ηικίες θανάτου. Οι παραπάνω πέντε περιορισμοί γράφονται ως εξής: () T T T S ( Av) ( Av) v A Av M, όπου Μ είναι μια προκαθορισμένη σταθερά και A ένας n (n-3) πίνακας με γραμμές της μορφής ( - 3-3 ), () Bv, όπου B ένας n (n-) πίνακας με γραμμές της μορφής ( - ), () Cv, όπου C T T ένας n (n-2) πίνακας με γραμμές της μορφής ( -2 ), (v) d v d u, όπου T ( l x, lx+,..., lx+ n T T d ), (v) e v e u, όπου d ( xlx,( x + ) lx+,...,( x + n ) lx+ n ). Οι Zhang and Brockett (987) εαχιστοποίησαν το μέτρο απόκισης των KL Kullback-Lebler D ( v, u), υπό τους περιορισμούς ()-(v) θεωρώντας παράηα και το δυϊκό πρόβημα. Άμεσα παρατηρεί κανείς ότι η χρήση του μέτρου πηροφορίας των Kullback- Lebler στην εξομάυνση είναι αντικανονική διότι τα ποσοστά θνησιμότητας u και v δεν είναι πιθανοτικά διανύσματα καθώς ισχύει u > και >. Οι Sachlas and Papaoannou (27) εξέτασαν εάν το μέτρο απόκισης των Kullback-Lebler μεταξύ δυο μη πιθανοτικών διανυσμάτων μπορεί να θεωρηθεί ως μέτρο απόκισης και ως μέτρο πηροφορίας, μεετώντας τις ιδιότητές του, υπό το πρίσμα των γενικών ιδιοτήτων των μέτρων πηροφορίας και απόκισης. Απέδειξαν, όπως αναμενόταν, ότι το μέτρο απόκισης των Kullback-Lebler με διανύσματα μη πιθανότητας, δεν έχει τις ιδιότητες του μέτρου των Kullback-Lebler με διανύσματα πιθανοτήτων. Υπό ορισμένες συνθήκες, βέβαια, κάποιες από αυτές ικανοποιούνται. Στο παρόν άρθρο μεετάμε περαιτέρω τη χρήση μέτρων απόκισης ως εργαεία εξομάυνσης. Στο Εδάφιο 2 εξερευνούμε τη χρήση της οικογένειας των μέτρων απόκισης δύναμης (Read and Cresse, 988) με στόχο να βρούμε την καύτερη απόκιση ώστε να επιτύχουμε την «καύτερη» εξομάυνση. Μια αριθμητική διερεύνηση δίνεται στο Εδάφιο 3 ενώ το Εδάφιο 4 περιαμβάνει τα συμπεράσματα. 2. ΧΡΗΣΗ ΤΩΝ ΑΠΟΚΛΙΣΕΩΝ ΔΥΝΑΜΗΣ ΤΩΝ ESSIE-READ Ξεκινώντας από την ιδέα των Brockett and Zhang (986) να εαχιστοποιήσουν την απόκιση των Kullback-Lebler ώστε να βρει την καύτερα προσαρμοσμένη σειρά εξομαυμένων τιμών {v x } υπό τους περιορισμούς () έως (v), στην ενότητα αυτή εξετάζουμε τη χρήση του δείκτη απόκισης δύναμης. Οι Cresse and Read (984) όρισαν μια απόκιση δύναμης μεταξύ δυο διανυσμάτων πιθανότητας p, q ως εξής - 364 - T n x n v x

n p I ( p, q ) p +, ( ) q όπου είναι μια παράμετρος (πραγματικός αριθμός). Οι τιμές του μέτρου για,- n ορίζονται ως όρια. Για, έχουμε I ( p, q ) p ln( p q ) που είναι το μέτρο των Kullback-Lebler ενώ για n, έχουμε I ( p, q ) q ln( q p ) απόκιση δύναμης ικανοποιεί τις ιδιότητες άων μέτρων απόκισης όπως τη μη αρνητικότητα, τη συμμετρία, τη συνέχεια, τη μη προσθετικότητα και ισχυρή μη προσθετικότητα. Σημειώνουμε ότι το μέτρο I ( p, q ) είναι μια drected απόκιση (Cresse and Read, 984). Οι Cresse and Read (984) επίσης χρησιμοποίησαν την οικογένεια των στατιστικών αποκίσεων δύναμης, για σκοπούς καής προσαρμογής, τα οποία ορίζονται ως εξής n 2 x 2nI( ) x + ( ) npˆ. () Το είναι μια παράμετρος πραγματικών αριθμών, που επιέγεται από το χρήστη. Είναι εύκοο να δει κανείς (Read and Cresse, 988) ότι το 2nI() που δίνεται από τη Σχέση () είναι ίσο με () τη στατιστική συνάρτηση X 2 για, () τη στατιστική συνάρτηση G 2 για, () τη στατιστική συνάρτηση του τροποποιημένου όγου πιθανοφάνειας για, (v) τη στατιστική συνάρτηση των Freeman-Tukey F 2 για -(/2) και (v) το τροποποιημένο X 2 του Neyman για -2. Ως εναακτική επιογή των X 2 και G 2, οι Cresse and Read (984) πρότειναν τη στατιστική συνάρτηση της απόκισης δύναμης με 2/3, η οποία βρίσκεται μεταξύ τους. 2. Απόκιση δύναμης χωρίς πιθανοτικά διανύσματα Έχουμε ήδη αναφέρει ότι στο πρόβημα της εξομάυνσης δεν έχουμε διανύσματα πιθανότητας. Για το όγο αυτό θα πρέπει να ορίσουμε την drected απόκιση δύναμης για μη πιθανοτικά διανύσματα. Ορισμός 2. Ορίζουμε ως n p D ( p, p +, R ( ) q την drected απόκιση δύναμης των Cresse-Read σειράς μεταξύ δυο μη πιθανοτικών διανυσμάτων p και q, όπου p και q. Τώρα θα πρέπει να δούμε κατά πόσο το μέτρο αυτό ικανοποιεί τις ιδιότητες των μέτρων απόκισης. Στη συνέχεια, θεωρούμε ότι και -. - 365 -. Η

Λήμμα 2. Για την drected απόκιση των Cresse-Read με μη πιθανοτικά διανύσματα p, q, ισχύει ότι k D ( p, p k I ( p, q ), k ( + ) όπου I ( p διανυσμάτων q q q q., ) είναι η drected απόκιση των Cresse-Read μεταξύ των πιθανοτήτων p, q, k p q, p p p και Πρόταση 2. (Μη αρνητικότητα) D ( p, εάν μια από τις ακόουθες συνθήκες ισχύει: () p q, () p q και (-,), () p q και m < I ( p, q ), (v) > > p q και (-,), (v) < p q και m < I ( p, q ), όπου m ( k ) ( k ( + )). Η ισότητα ισχύει εάν μια από τις παρακάτω συνθήκες ισχύει: (a) p q και pq, (b) p q ή p q και m I ( p, q ). Επιπέον, εάν Πρόταση 2.2 Ισχύει D ισχύει: () p q, () > < < p q ισχύει ότι D ( p, αν και μόνο αν pq. ( p, I ( p, q ) όταν μια από τις παρακάτω συνθήκες p q και (-,), () > p q και (-,). Η ισότητα ισχύει εάν m I ( p, q ) ανεξάρτητα από την τιμή του, όπου το m όπως στην Πρόταση 2.. Ορισμός 2.2 (Διδιάστατη απόκιση) Έστω p,,2 δυο διμεταβητά μέτρα (συναρτήσεις μη πιθανότητας) που σχετίζονται με δυο διακριτές μεταβητές X,Y στο R 2 για τις οποίες ισχύει p. H drected απόκιση των Cresse-Read x y μεταξύ δυο διδιάστατων συναρτήσεων μη πιθανοτήτων p, p 2 ορίζεται ως εξής: p( x, D X, Y ( p, p2 ) p( x,. ( + ) x y p2-366 - <

Ορισμός 2.3 (Υπό συνθήκη απόκιση) Για τις διακριτές μεταβητές X,Y και τις συναρτήσεις μη πιθανότητας p,,2, όπως αυτές ορίσθηκαν παραπάνω, έστω ότι ισχύει f ( x) p, h p f ( x), g ( p και y r ( x p g ( x),,2. Θέτουμε h D Y X x ( h, h2 ) h ( + ) y h και ορίζουμε την [ ] h D Y X x ( h, h2 ) E X DY X ( h, h2 ) f( x) h ( + ) x y h για τη μεταβητή X ενώ η D r, ) ορίζεται με ανάογο τρόπο. X Y y ( r2 Η ισχυρή προσθετικότητα δεν ισχύει για την απόκιση δύναμης με μη πιθανοτικά διανύσματα. Άωστε, όπως είναι γνωστό, δεν ισχύει και για πιθανοτικά διανύσματα εκτός εάν. Για την ασθενή προσθετικότητα έχουμε τα παρακάτω: Πρόταση 2.3 (Ασθενής προσθετικότητα) Εάν h g ( και συνεπακόουθα p f ( x) g (,,2, έχουμε ότι οι τυχαίες μεταβητές είναι οι «τυποποιημένες» τιμές των X, Y, είναι ανεξάρτητες και x X, Y, οι οποίες X, Y ( 2 X 2 Y 2 2 2 ( + ) X Y (a) D p, p ) D ( f, f ) + D ( g, g ) + p ( η ) + p η ( + ) I ( f, f ) I ( g, g ), όπου p p,,2, x y (b) D p, p ) D ( f, f ) D ( g, ) εάν η και εάν ένα από τα περιθώρια X, Y ( 2 X 2 + Y g 2 ( 2 ( g 2 ζεύγη f, f ), g, ) είναι όμοια, όπου η p p. 2 Πρόταση 2.4 (Μέγιστη πηροφορία και επάρκεια) Έστω YT(X) ένας μετρήσιμος μετασχηματισμός της X. Τότε DX ( p, p2 ) DY ( g, g 2 ), όταν b>, όπου b p ( x) p2 ( x), με την ισότητα να ισχύει αν και μόνο αν x x ο Y είναι «επαρκής», όπου p p (x), g g (,,2. Έχουμε ήδη δει ότι η drected απόκιση δύναμης D ( p,, υπό ορισμένες q συνθήκες είναι μη αρνητική, προσθετική, μεγαύτερη από το I ( p, ), - 367 -

αναοίωτη υπό επαρκείς περιορισμούς και ικανοποιεί την ιδιότητα της μέγιστης πηροφορίας. Έτσι, μπορούμε να θεωρούμε το D ( p, ως μέτρο απόκισης και συνεπώς να το χρησιμοποιούμε για εξομάυνση. 3.2 Εξομάυνση μέσω αποκίσεων δύναμης Βασισμένοι στα παραπάνω μπορούμε να εφαρμόσουμε την απόκιση δύναμης στο πρόβημα της αναογιστικής εξομάυνσης. Για να πάρουμε τις εξομαυμένες τιμές v x, εαχιστοποιούμε την απόκιση των Cresse-Read vx D ( v, u) v x ( + ) x u x για δοθέν υπό τους περιορισμούς v και g ( v ) ( 2) v D v + b v + c,,2,...,r, όπου D είναι ένας θετικά ημιορισμένος πίνακας για κάθε και b, c είναι σταθερές. Οι περιορισμοί αυτοί είναι ισοδύναμοι με τους περιορισμούς ()-(v) που δόθηκαν στo Εδάφιο. Η εαχιστοποίηση γίνεται για διάφορες τιμές της παραμέτρου και επιέγουμε ως καύτερη εξομάυνση αυτή που δίνει ικανοποιητικά αποτεέσματα για την ομαότητα και την προσαρμογή. Με αυτό τον τρόπο μπορούμε να ερμηνεύσουμε την προκύπτουσα σειρά των εξομαυμένων τιμών, ως τη σειρά που ικανοποιεί τους περιορισμούς και είναι εάχιστα διαχωρίσιμη από την άποψη της απόκισης των Cresse-Read από τη σειρά των αδρών δεδομένων. Είναι προφανές ότι εάν επιέξουμε, κάνουμε την εξομάυνση μέσω του μέτρου απόκισης των Kullback-Lebler που περιέγραψαν οι Zhang and Brockett (987). Στην επόμενη ενότητα παραθέτουμε μια αριθμητική διερεύνηση. 3. ΑΡΙΘΜΗΤΙΚΗ ΔΙΕΡΕΥΝΗΣΗ Για την αριθμητική διερεύνηση, χρησιμοποιήσαμε τα εξής σύνοα δεδομένων με πιθανότητες θανάτου: Το πρώτο (L85) προέρχεται από τον London (985). Το δεύτερο (HKM) προέρχεται από την Actuaral Socety of Hong Kong (www.actuares.org.hk) και αναφέρεται στους άνδρες. Το τρίτο (HKF) επίσης προέρχεται από την ίδια Socety και αναφέρεται στις γυναίκες. Το μέγεθος των παραπάνω δεδομένων είναι διαφορετικό. Εφαρμόσαμε διάφορες εξομαύνσεις σε κάθε σύνοο δεδομένων, χρησιμοποιώντας διαφορετικές τιμές της παραμέτρου μεταξύ των οποίων είναι οι τιμές,, -, -(/2) και -2, οι οποίες δίνουν τη στατιστική συνάρτηση X 2, το μέτρο απόκισης των Kullback-Lebler, τη στατιστική συνάρτηση του τροποποιημένου όγου πιθανοφάνειας, τη στατιστική συνάρτηση των Freeman-Tukey F 2 και το τροποποιημένο X 2 του Neyman, αντίστοιχα. Χρησιμοποιήσαμε επίσης την τιμή 2/3 που πρότειναν οι Cresse and Read (984). Η τιμή του M στον πρώτο περιορισμό, ήταν διαφορετική σε κάθε σύνοο δεδομένων και υποογιστηκε μέσω εξομάυνσης με τη μέθοδο των Whttaker-Henderson (London, 985). Είναι ογικό και αναμενόμενο ότι διαφορετική επιογή του οδηγεί σε διαφορετικές εξομαυμένες τιμές. Το μέτρο ομαότητας S, το οποίο υποογίστηκε μετά την εφαρμογή της μεθόδου εξομάυνσης των Whttaker-Henderson (τιμή Μ) - 368 - T

καθώς και η μέση τιμή της ομαότητας S από διάφορες εξομαύνσεις με αποκίσεις δύναμης και -4, -3.5, -3, -2.5, -2, -.5, -, -2/3, -.5,,.5, 2/3,,.5, 2, 2.5, 3, 3.5, 4 δίνονται στον Πίνακα. Είναι φανερό ότι και οι δυο μέθοδοι δίνουν περίπου τα ίδια αποτεέσματα για το μέτρο ομαότητας S. Στο Σχήμα, παρουσιάζονται τα διαγράμματα της τιμής του μέτρου ομαότητας S έναντι της τιμής της παραμέτρου, με το S να απεικονίζεται στον άξονα των y και το στον άξονα των x. Η διακεκομμένη γραμμή σε κάθε διάγραμμα δηώνει την τιμή της παραμέτρου M που εμπέκεται στον περιορισμό της ομαότητας. Παρατηρούμε ότι τα τρία διαγράμματα παρουσιάζουν το ίδιο πρότυπο. Για <, το S ισούται περίπου με το M. Στη συνέχεια, όταν (,.5), το S παίρνει μια πού μικρή τιμή (κοντά στο μηδέν) ενώ για τις υπόοιπες τιμές του, ισούται περίπου με το M. Συνεπώς, για (,.5), η μέθοδος υπερεξομαύνει τα δεδομένα. Έτσι για έχουμε περίπου τα ίδια αποτεέσματα συμπεριαμβανομένης και της εξομάυνσης με το Kullback-Lebler (). Πίνακας : Τιμή του μέτρου ομαότητας Σετ Δεδομένων S μέσω Whttaker-Henderson S μέσω Απόκισης Δύναμης L85 Μ.355697.332 HKM Μ.248294.25776 HKF Μ.48469.2345 S,45 Σχήμα : Μέτρο ομαότητας S έναντι του S,3,4,25,35,3,2,25,5,2,5,,,5,5 S L85,8 HKM,6,4,2,,8,6,4,2 HKF Στο Σχήμα 2, παρουσιάζουμε τα ανάογα διαγράμματα που αφορούν το μέτρο προσαρμογής F, με το F να απεικονίζεται στον άξονα των y και το στον άξονα των x. Ως F πήραμε το Χ 2. Και εδώ παρατηρούμε ένα παρόμοιο πρότυπο. Για τιμές του - 369 -

<, το μέτρο προσαρμογής αυξάνει, μέχρι μια μέγιστη τιμή. Αυτό στην πράξη σημαίνει ότι η εξομάυνση δεν είναι αποδεκτή καθώς οι εξομαυμένες τιμές διαφέρουν αρκετά από τις αδρές τιμές. Όταν το, το F εαττώνεται και σταθεροποιείται για τις υπόοιπες τιμές του. Σχήμα 2: Μέτρο προσαρμογής F έναντι του F 9 F 8 8 7 7 6 6 5 5 4 4 3 3 2 2 L85 F 9 HKM 8 7 6 5 4 3 2 HKF Όσον αφορά την ομαότητα, στο σετ L85 η εξομάυνση μέσω της απόκισης των Kullback-Lebler δίνει μια πάρα πού μικρή τιμή για το μέτρο της ομαότητας, το οποίο σημαίνει ότι η μέθοδος υπερεξομαύνει τα δεδομένα. Το ίδιο αποτέεσμα ισχύει και για την εαχιστοποίηση των αποκίσεων δύναμης με (,). Στο σετ HKM η εαχιστοποίηση της απόκισης των Kullback-Lebler δίνει τα ίδια αποτεέσματα με τη μέθοδο της εαχιστοποίησης των αποκίσεων δύναμης με <- και >. Τέος, στο σετ HKF η εξομάυνση μέσω της απόκισης των Kullback- Lebler υπερεξομαύνει τα δεδομένα, κάτι το οποίο συμβαίνει και με τη χρησιμοποίηση των αποκίσεων δύναμης με < <. 5. Το τεικό μας συμπέρασμα, είναι ότι η επιογή 2/3 που πρότειναν οι Cresse and Read (984) για όγους στατιστικής ισχύος είναι επίσης μια καή επιογή για εξομάυνση. 4. ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΣΧΟΛΙΑ Για εξομάυνση, εκτός του μέτρου απόκισης των Kullback-Lebler D ( p, με μη πιθανοτικά διανύσματα, άα μέτρα απόκισης, όπως τα μέτρα απόκισης δύναμης, μπορούν να χρησιμοποιηθούν. Αποδείξαμε ότι στην περίπτωση που δεν έχουμε πιθανοτικά διανύσματα, το μέτρο απόκισης δύναμης ικανοποιεί ορισμένες από τις ιδιότητες που το μέτρο με διανύσματα πιθανότητας ικανοποιεί. Υπό ορισμένες συνθήκες είναι μη αρνητικό, προσθετικό, μεγαύτερο από το I ( p, q ), - 37 - KL

αναοίωτο υπό επαρκείς περιορισμούς και ικανοποιεί την ιδότητα της μέγιστης πηροφορίας. Άρα, το D ( p, μπορεί να θεωρηθεί ως μέτρο απόκισης και συνεπώς να χρησιμοποιείται στο πρόβημα της εξομάυνσης. Στην αριθμητική διερεύνηση, η εαχιστοποίηση της απόκισης δύναμης για διάφορες τιμές του έδωσε ισοδύναμα αποτεέσματα, όσον αφορά την ομαότητα, με αυτά άων μεθόδων εξομάυνσης όπως είναι η Whttaker-Henderson μέθοδος. Δεν μπορούμε να πούμε ποια τιμή του είναι η καύτερη για εξομάυνση. Για την καή προσαρμογή, τιμές του <- δεν δίνουν αποδεκτά αποτεέσματα και συνεπώς θα πρέπει να αποφεύγονται. Τιμές του (,.5), υπερεξομαύνουν τα δεδομένα. Η τιμή 2/3 που πρότειναν οι Cresse and Read (984) για όγους στατιστικής ισχύος, είναι μια καή επιογή. ABSTRACT Frequently we have to revse the ntal estmates of death probabltes wth the am of obtanng smoother estmates. Ths s done through a procedure called graduaton. In ths paper we explore the use of the measures of power dvergence statstcs of order that Cresse and Read ntroduced wth proper lnear and/or quadratc constrants wth the am of fndng the best dvergence to use n order to obtan the best graduaton. The results so far ndcate that dvergences wth non-probablty vectors n ther arguments, as s the case wth mortalty rates, share, under some condtons, some of the propertes of probablstc or nformaton theoretc dvergences. The power dvergence statstcs also gve results equvalent to those that other frequently used graduaton methods gve. A numercal nvestgaton s also presented. It seems that the choce > and partcularly the 2 / 3 that Cresse and Read proposed n the lght of statstcal power, s a good choce as far as smoothness and goodness of ft are concerned. ΑΝΑΦΟΡΕΣ Brockett, P.L., Zhang, J., 986. Informaton Theoretcal Mortalty Graduaton, Scandnavan Actuaral Journal, 3-4. Cresse, N.A.C., Read, T.R.C., 984. Multnomal Goodness-of-Ft Tests, Journal of Royal Statstcal Socety, B, Vol. 46, No. 3, 44-464. London, D., 985. Graduaton: The Revson of Estmates, ACTEX Publcatons, Wnsted, Connectcut. Read, T.R.C., Cresse, N.A.C., 988. Goodness-of-Ft Statstcs for Dscrete Multvarate Data, Sprnger-Verlag, New York. Sachlas, A.P. and Papaoannou, T. 27. Graduaton of Mortalty Rates through Dvergences, Submtted paper. Zhang, J., Brockett, P.L., 987. Quadratcally Constraned Informaton Theoretc Analyss, SIAM Journal of Appled Mathematcs, Vol. 47, No. 4, 87-885. - 37 -