Ζωγράφος Κωνσταντίνος, Καθηγητής του Τμήματος Μαθηματικών του Πανεπιστημίου Ιωαννίνων. Λουκάς Σωτήριος, Καθηγητής του Τμήματος Μαθηματικών του

Η παρούσα Μεταπτυχιακή Διατριβή εκπονήθηκε στο πλαίσιο των σπουδών για την απόκτηση του Μεταπτυχιακού Διπλώματος Ειδίκευσης στη Στατιστική και Επιχειρησιακή Έρευνα, που απονέμει το Τμήμα Μαθηματικών του Πανεπιστημίου Ιωαννίνων. Εγκρίθηκε την 3/05/03 από την εξεταστική επιτροπή: Ζωγράφος Κωνσταντίνος, Καθηγητής του Τμήματος Μαθηματικών του Πανεπιστημίου Ιωαννίνων. Λουκάς Σωτήριος, Καθηγητής του Τμήματος Μαθηματικών του Πανεπιστημίου Ιωαννίνων. Μπατσίδης Απόστολος, Λέκτορας του Τμήματος Μαθηματικών του Πανεπιστημίου Ιωαννίνων (Επιβλέπων). Υπεύθυνη Δήλωση «Δηλώνω υπεύθυνα ότι η παρούσα διατριβή εκπονήθηκε κάτω από τους διεθνείς ηθικούς και ακαδημαϊκούς κανόνες δεοντολογίας και προστασίας της πνευματικής ιδιοκτησίας. Σύμφωνα με τους κανόνες αυτούς, δεν έχω προβεί σε ιδιοποίηση ξένου επιστημονικού έργου και έχω πλήρως αναφέρει τις πηγές που χρησιμοποίησα στην εργασία αυτή» Υπογραφή Κωνσταντίνος Μπαρδάκας

Αφιερώνεται στους γονείς μου Λάμπρο και Δέσποινα και στον αδερφό μου Γιώργο.

ΠΡΟΛΟΓΟΣ Η παρούσα διατριβή πραγματοποιήθηκε κατά τη διάρκεια του τελευταίου έτους φοίτησής μου στο Τμήμα Μαθηματικών της Σχολής Θετικών Επιστημών του Πανεπιστημίου Ιωαννίνων για την απόκτηση μεταπτυχιακού διπλώματος ειδίκευσης στον κλάδο «Στατιστική και Επιχειρησιακή Έρευνα», με μέλη της Τριμελούς Συμβουλευτικής Επιτροπής τους κ.κ. Κωνσταντίνο Ζωγράφο και Σωτήριο Λουκά, Καθηγητές του Τμήματος Μαθηματικών της Σχολής Θετικών Επιστημών του Πανεπιστημίου Ιωαννίνων και Απόστολο Μπατσίδη, Λέκτορα του Τμήματος Μαθηματικών της Σχολής Θετικών Επιστημών του Πανεπιστημίου Ιωαννίνων. Ως θέμα έχει την παρουσίαση των κυριότερων μεθοδολογιών για την αντιμετώπιση του προβλήματος του ελέγχου μη εμφωλευμένων υποθέσεωνμοντέλων, την αποσαφήνισή τους μέσω παραδειγμάτων για την ειδική περίπτωση της λογαριθμοκανονικής έναντι της εκθετικής κατανομής και τη σύγκριση και αξιολόγηση των μεθοδολογιών αυτών μέσω μελέτης προσομοίωσης. Εκμεταλλευόμενος τη θέση αυτή, επιθυμώ να εκφράσω την ευγνωμοσύνη και τις ευχαριστίες μου σε όσους συνέβαλαν στην πραγματοποίηση αυτής της διατριβής. Ευχαριστώ θερμά τον Επιβλέποντά μου κ. Απόστολο Μπατσίδη, ο οποίος πρότεινε το θέμα της παρούσας μεταπτυχιακής διατριβής. Η καθοδήγησή του, η ηθική υποστήριξη και το αμέριστο

ενδιαφέρον που επέδειξε, συνέβαλαν καθοριστικά στην περάτωση των μεταπτυχιακών μου σπουδών. Θα ήθελα επίσης, να ευχαριστήσω ιδιαίτερα τους κ.κ. Κωνσταντίνο Ζωγράφο και Σωτήριο Λουκά, για τη συμμετοχή τους στην Τριμελή Συμβουλευτική Επιτροπή, για το χρόνο που αφιέρωσαν για την κρίση της διατριβής καθώς και για τις χρήσιμες και εύστοχες παρατηρήσεις τους. Ειλικρινείς είναι οι ευχαριστίες μου προς όλους τους διδάσκοντες του Τομέα «Πιθανοτήτων, Στατιστικής και Επιχειρησιακής Έρευνας», για την πολύτιμη βοήθειά τους όλα αυτά τα χρόνια, αλλά και προς όλους τους διδάσκοντες του Τμήματος Μαθηματικών της Σχολής Θετικών Επιστημών του Πανεπιστημίου Ιωαννίνων. Ακόμη, ευχαριστώ όλους τους συναδέλφους μου του προγράμματος Μεταπτυχιακών Σπουδών του Τομέα «Πιθανοτήτων, Στατιστικής και Επιχειρησιακής Έρευνας» του Τμήματος Μαθηματικών της Σχολής Θετικών Επιστημών του Πανεπιστημίου Ιωαννίνων για τη συνεργασία μας. Τέλος, περισσότερο από όλους, θα ήθελα να ευχαριστήσω τους γονείς μου Λάμπρο και Δέσποινα και τον αδερφό μου Γιώργο που με στήριξαν πνευματικά, συναισθηματικά, ηθικά και οικονομικά

όλα αυτά τα χρόνια. Χωρίς τη βοήθειά τους, την ενθάρρυνσή τους και την προτροπή τους, δε θα τα είχα καταφέρει έως τώρα. Μπαρδάκας Κωνσταντίνος Ιωάννινα, Αύγουστος 03.

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ Εισαγωγή... Ορισμός Μη Εμφωλευμένων Μοντέλων 4. Παραδείγματα Μη Εμφωλευμένων Υποθέσεων...9.3 Περίληψη Διατριβής...8 ΚΕΦΑΛΑΙΟ Μεθοδολογία του Cox (96, 96)...3. Εισαγωγή 4. Η Μεθοδολογία...30.3 Ειδική Περίπτωση.44 ΚΕΦΑΛΑΙΟ 3 Μεθοδολογία του Atkiso (970)...65 3. Εισαγωγή 66 3. Η Μεθοδολογία...69 3.3 Ειδική Περίπτωση.79 ΚΕΦΑΛΑΙΟ 4 Μεθοδολογία των Epps et. al. ( 98).....85 4. Εισαγωγή 85 4. Η Μεθοδολογία...89

ΚΕΦΑΛΑΙΟ 5 4.3 Ειδική Περίπτωση 97 Μεθοδολογία του Vuo (989)..5 ΚΕΦΑΛΑΙΟ 6 5. Εισαγωγή.6 5. Η Μεθοδολογία 3 5.3 Ειδική Περίπτωση..33 Μεθοδολογία του Clarke (003)..37 ΚΕΦΑΛΑΙΟ 7 6. Εισαγωγή.38 6. Η Μεθοδολογία 40 6.3 Ειδική Περίπτωση..45 Συγκριτική Μελέτη Προσομοίωσης....47 7. Εισαγωγή.48 7. Μελέτη Προσομοίωσης.....53 7.. Αξιολόγηση της σύγκλισης των ελεγχοσυναρτήσεων....53 7.. Αξιολόγηση της απόδοσης... 64 Αντί επιλόγου...78 ΠΑΡΑΡΤΗΜΑ Α 79 Α. Λογαριθμοκανονική (loormal) κατανομή...79

Α. Εκθετική (expoetial) κατανομή..80 Α.3 Κανονική (ormal) κατανομή...87 ΠΑΡΑΡΤΗΜΑ Β.99 ΠΑΡΑΡΤΗΜΑ Γ.05 Abstract o the MSc Dissertatio...07 ΒΙΒΛΙΟΓΡΑΦΙΑ.09

ΚΕΦΑΛΑΙΟ Εισαγωγή Η Στατιστική Συμπερασματολογία είναι ο κλάδος της Στατιστικής που έχει ως αντικείμενο την ανάπτυξη μεθοδολογιών που οδηγούν στην εξαγωγή συμπερασμάτων για έναν ή περισσότερους υπό μελέτη πληθυσμούς. Η Στατιστική Συμπερασματολογία χωρίζεται σε δύο μεγάλα μέρη: την Εκτιμητική και τους Ελέγχους Στατιστικών Υποθέσεων. Αντικείμενο της Εκτιμητικής είναι κυρίως η εκτίμηση αγνώστων ποσοτήτων, παραμέτρων είτε σε σημείο είτε σε διάστημα, ενώ του ελέγχου στατιστικών υποθέσεων η ανάπτυξη μεθοδολογιών για την αποδοχή ή μη μιας υπόθεσης. Η διαδικασία για τη λήψη απόφασης για την αποδοχή ή μη της υπό έλεγχο υπόθεσης ονομάζεται στατιστικό τεστ. Στο πλαίσιο αυτό, αναφέρουμε τα τεστ πηλίκου πιθανοφάνειας, τα τεστ σημαντικότητας, τη θεωρία των στατιστικών αποφάσεων, τη θεωρία των κανόνων του Bayes, τα τυχαιοποιημένα και μη τυχαιοποιημένα στατιστικά τεστ και τη θεωρία των Neyma - Pearso. Η παρούσα μεταπτυχιακή διατριβή εστιάζει σ ένα από τα προβλήματα που έχει απασχολήσει τη στατιστική βιβλιογραφία από τη δεκαετία του 60 και τις εργασίες του Cox (βλέπε Cox (960, 96)). Ειδικότερα, έστω X,, X ένα τυχαίο δείγμα (τ.δ.) από κάποιον πληθυσμό με συνάρτηση πυκνότητας πιθανότητας (σ.π.π.) ή συνάρτηση πιθανότητας (σ.π.), έστω h, η συναρτησιακή μορφή της οποίας μας είναι άγνωστη. Θέλουμε να εξετάσουμε αν μπορεί να θεωρηθεί ότι το τ.δ. προέρχεται είτε από την οικογένεια κατανομών H x, θ, θ, είτε από την οικογένεια κατανομών

H x, γ, γ, όπου οι συναρτησιακές μορφές των και μας είναι γνωστές, αλλά εξαρτώνται από έναν πεπερασμένο αριθμό αγνώστων παραμέτρων, που συμβολίζονται με τα διανύσματα θ και γ, αντίστοιχα. Τα σύνολα και απαρτίζουν τον παραμετρικό χώρο, όπου οι αντίστοιχες πυκνότητες, x θ και, x γ είναι καλά ορισμένες. Τέλος, υποθέτουμε ότι κάθε κατανομή η οποία ανήκει στην οικογένεια κατανομών της H δεν μπορεί να προκύψει από την H, είτε με περιορισμό των παραμέτρων, είτε μέσω μιας οριακής διαδικασίας και αντίστροφα. Υποθέτουμε, δηλαδή, ότι έχουμε, όπως συνήθως αναφέρεται, ξεχωριστές (separate) οικογένειες κατανομών. Με τον όρο ξεχωριστές (separate) εννοούμε ότι καμία εκ των δύο αυτών κατανομών δεν μπορεί να προκύψει ως ειδική ή οριακή περίπτωση της άλλης. Ένας άλλος όρος που χρησιμοποιείται για να περιγράψει την ίδια κατάσταση είναι ο όρος μη εμφωλευμένα μοντέλα (o-ested models). Ένας πιο ακριβής μαθηματικός ορισμός των μη εμφωλευμένων μοντέλων θα δοθεί στην επόμενη ενότητα. Όταν η μηδενική υπόθεση είναι εμφωλευμένη στην εναλλακτική, για τον έλεγχο της υπόθεσης αν ένα τυχαίο δείγμα μπορεί να θεωρηθεί ότι προέρχεται από μία εκ των δύο κατανομών, μπορούν να χρησιμοποιηθούν κλασσικές διαδικασίες, όπως είναι το τεστ πηλίκου πιθανοφανειών ή αυτές που βασίζονται στους πολλαπλασιαστές Larae και το τεστ του Wald. Όμως, αυτές οι μεθοδολογίες παύουν να ισχύουν στην περίπτωση του ελέγχου των μη εμφωλευμένων μοντέλων (βλέπε Loh (985, σελ. 36)) και για το λόγο αυτό έχουν εισαχθεί εναλλακτικές μεθοδολογίες. Επιπρόσθετα, έτσι όπως έχει διατυπωθεί το πρόβλημα δεν υπάρχει φυσική μηδενική υπόθεση, καθώς κάθε μία εκ των δύο

υποθέσεων μπορεί να θεωρηθεί ως η μηδενική υπόθεση. Στην πράξη συνηθέστερα, η ανάλυση των μη εμφωλευμένων υποθέσεων πραγματοποιείται λαμβάνοντας ως μηδενική υπόθεση κάθε μία εκ των δύο υποθέσεων εναλλάξ. Έτσι, προκύπτουν τα ακόλουθα πιθανά αποτελέσματα: i) απορρίπτουμε την H έναντι της 3 H και όχι αντίστροφα, ii) απορρίπτουμε την H έναντι της H και όχι αντίστροφα, iii) δεν απορρίπτουμε καμία από τις δύο υποθέσεις έναντι στην άλλη, και τέλος iv) κάθε μία εκ των δύο υποθέσεων απορρίπτεται έναντι της άλλης. Τα δύο πρώτα αποτελέσματα είναι οικεία από τα κλασσικά στατιστικά τεστ και είναι άμεσα ερμηνεύσιμα. Το τρίτο αποτέλεσμα εμφανίζεται όταν και τα δύο μοντέλα βρίσκονται εξίσου «κοντά» στην h κι έτσι χαρακτηρίζονται ως ισοδύναμα. Το τέταρτο αποτέλεσμα προτείνει την ύπαρξη ενός τρίτου πιθανού μοντέλου, καθώς και οι δύο οικογένειες κατανομών είναι το ίδιο αναποτελεσματικές στη μοντελοποίηση των δειγματικών δεδομένων. Η ύπαρξη των παραπάνω πιθανών αποτελεσμάτων, όπως αναλυτικά θα σχολιαστεί στην Παρατήρηση.., οδηγεί κάποιες φορές σε ασάφειες. Οι μη εμφωλευμένες υποθέσεις είναι ευρέως χρησιμοποιούμενες σε πολλές πρακτικές εφαρμογές, ιδίως στον τομέα της οικονομίας, αλλά και στη βιομηχανία, στην κοινωνιολογία, στη βιολογία, στην ιατρική (βλέπε Ero (983)), στη μηχανική (βλέπε Lawless (98)) και στις πολιτικές επιστήμες. Για μια εκτενή ανασκόπηση των εφαρμογών αυτών παραπέμπουμε στους Pesara ad Weeks (999) και Pesara ad Ulhoa (007). Στη βιβλιογραφία έχουν εισαχθεί και αναπτυχθεί διάφορες μεθοδολογίες αντιμετώπισης του παραπάνω προβλήματος. Σκοπός

της παρούσας μεταπτυχιακής διατριβής είναι να παρατεθούν οι σημαντικότερες και πιο ευρέα χρησιμοποιούμενες σε πρακτικές εφαρμογές. Στο εισαγωγικό αυτό κεφάλαιο, για τη διευκόλυνση της μελέτης της διατριβής, δίνεται αρχικά μία πιο λεπτομερής περιγραφή του υπό μελέτη προβλήματος καθώς και ένας πιο ακριβής μαθηματικός ορισμός των μη εμφωλευμένων μοντέλων. Έπειτα, ο ορισμός αυτός αποσαφηνίζεται μέσω παραδειγμάτων. Τέλος, το εισαγωγικό αυτό κεφάλαιο ολοκληρώνεται με μία σύντομη ιστορική αναδρομή, ενώ ταυτόχρονα δίνεται και η περίληψη του περιεχομένου της μεταπτυχιακής διατριβής.. Ορισμός Μη Εμφωλευμένων Μοντέλων. Μέχρι στιγμής δεν έχει δοθεί ένας σαφής και λεπτομερής ορισμός των εμφωλευμένων και μη εμφωλευμένων μοντέλων, καθώς έχει αναφερθεί μόνο ότι με τον όρο μη εμφωλευμένα μοντέλα εννοούμε ότι κανένα μοντέλο δεν μπορεί να προκύψει από το άλλο, είτε με περιορισμούς στις παραμέτρους είτε μέσω μιας οριακής διαδικασίας. Στην ενότητα αυτή παρατίθεται ένας μαθηματικός ορισμός των μη εμφωλευμένων μοντέλων, που δόθηκε από τον Pesara (987). Ο ορισμός αυτός βασίζεται σε ένα κριτήριο της «εγγύτητας» (closeess) των δύο υπό σύγκριση κατανομών. Η εγγύτητα δύο κατανομών μπορεί να μετρηθεί με διάφορους τρόπους, υιοθετώντας διαφορετικά μέτρα της απόστασής τους, της απόκλισής τους (diverece measure), τα οποία έχουν εισαχθεί στη βιβλιογραφία. Για μία εκτενή ανασκόπηση και μελέτη της χρήσης των μέτρων απόκλισης στη στατιστική συμπερασματολογία παραπέμπουμε στην πρόσφατη μονογραφία του Pardo (006). O Pesara (987) για τον ορισμό των εμφωλευμένων και μη εμφωλευμένων μοντέλων χρησιμοποίησε ένα κριτήριο της 4

«εγγύτητας» των δύο κατανομών, ο υπολογισμός του οποίου στηρίζεται στο μέτρο απόκλισης που παρουσιάστηκε και μελετήθηκε από τους Kullback ad Leibler (95) και Kullback (959). Ορισμός.. Έστω F και G δύο κατανομές, με σ.π. ή σ.π.π. x, θ και x, γ, αντίστοιχα. Η Kullback-Leibler απόκλιση της G ως προς την F ορίζεται ως I X, θ θγ, E l, θ X, γ όπου με E συμβολίζεται η αναμενόμενη τιμή υπό την H. θ Επομένως, για τις υποθέσεις H και (..) H, στην περίπτωση συνεχών δεδομένων, το μέτρο απόκλισης των Kullback-Leibler της H ως προς την H γράφεται, υπό την προϋπόθεση ότι το ολοκλήρωμα υπάρχει, ως x, θ I θ, γ l x, dx, θ R x, γ (..) όπου R είναι το πεδίο ορισμού της τυχαίας μεταβλητής X υπό την υπόθεση H. Στην επόμενη πρόταση παρουσιάζονται κάποιες βασικές ιδιότητες του μέτρου απόκλισης των Kullback-Leibler, για την απόδειξη των οποίων παραπέμπουμε, μεταξύ άλλων, στους Perasa (987) και Pardo (006). 5

Πρόταση.. Έστω F και G δύο κατανομές με σ.π. ή σ.π.π. x, θ και x, γ, αντίστοιχα. Το μέτρο απόκλισης των Kullback-Leibler έχει τις εξής ιδιότητες: i) I θγ, 0 x, θ x, γ. ii) Γενικά, I θ, γ I,, με την ισότητα να ισχύει αν και μόνο αν γ θ και επιπλέον προκύπτει ότι δεν ικανοποιείται απαραίτητα η τριγωνική ανισότητα, I I I, h h όπου hx, η σ.π.π. ή σ.π. μιας άλλης κατανομής. Πριν προχωρήσουμε στην παρουσίαση των ορισμών του Pesara (987) παρατίθενται κάποιες χρήσιμες έννοιες και συμβολισμοί για την κατανόηση αυτών των ορισμών. Έστω θ και γ οι πραγματικές τιμές των θ και γ υπό την H 0 0 και H, αντίστοιχα. Συμβολίζεται με προς γ του I, Leibler της 6 i (, γ ) το iimum ως I θ γ 0 θγ, δηλαδή του μέτρου απόκλισης των Kullback- H ως προς την H. Υποθέτουμε ότι η ποσότητα θ, γ παίρνει μοναδικό ελάχιστο ως προς γ στο σημείο * 0 I 0 γ θ. Τότε, ένα μέτρο της εγγύτητας της H ως προς την H ορίζεται να είναι το 0 0 * 0 C θ I,. θ γ θ (..3) Παρατήρηση.. (Pesara (987) ) Το σημείο γ* θ 0 υπάρχει αν x, γ 0 για κάθε xr, όπου R είναι το πεδίο ορισμού της

τυχαίας μεταβλητής X υπό την H. Σε διαφορετική περίπτωση η I 0 θ, γ δεν ορίζεται. Όμοια, υποθέτοντας ότι η I γ,θ 0 παίρνει μοναδικό ελάχιστο ως προς θ στο σημείο θ* γ 0, χρησιμοποιούμε ως ένα μέτρο εγγύτητας της H ως προς την H το 0 0 * 0 C γ I,. γ θ γ (..4) Πλέον, είμαστε σε θέση να παραθέσουμε τους ορισμούς των εμφωλευμένων, των ολικά μη εμφωλευμένων και των μερικώς μη εμφωλευμένων μοντέλων, που δόθηκαν από τον Pesara (987). Ορισμός.. (Pesara (987)) Η υπόθεση (ested) στην υπόθεση C 0 0 H αν και μόνο αν C 0 0 H είναι εμφωλευμένη θ για κάθε θ, ενώ η H είναι εμφωλευμένη (ested) στην H αν και μόνο αν γ για κάθε γ. 0 0 Ορισμός..3 (Pesara (987)) Οι υποθέσεις H και H είναι ολικά μη εμφωλευμένες (lobally o ested) αν C 0 0 γ 0 για κάθε θ και γ. 0 0 0 C θ και Ορισμός..4 (Pesara (987)) Η υπόθεση εμφωλευμένη (partially o ested) στην 7 H είναι μερικώς μη H αν C 0 θ για 0

κάποιες τιμές του θ. Η υπόθεση H είναι μερικώς μη 0 εμφωλευμένη (partially o ested) στην κάποιες τιμές του γ. 0 H αν C 0 γ για Οι παραπάνω ορισμοί συνοψίζονται στο Διάγραμμα που ακολουθεί. Διάγραμμα Πηγή: McAleer ad Pesara (986). 0 Υποθέσεις Μηδενική υπόθεση η H Εναλλακτική υπόθεση η H C θ 0 0 για κάποια ή για κάθε θ 0 C θ 0 0 για κάθε θ 0 Μη εμφωλευμένες Οι H και H είναι μη εμφωλευμένες Εμφωλευμένες Η H είναι εμφωλευμένη στην Οι H και H είναι ολικά μη εμφωλευμένες αν C H 0 0 γ για κάθε γ 0 C 8 θ 0 0 για κάθε H Η C θ 0 0 για κάποια H H είναι μερικώς μη εμφωλευμένη στην H

Στην επόμενη ενότητα οι παραπάνω ορισμοί θα αποσαφηνιστούν περισσότερο μέσω συγκεκριμένων παραδειγμάτων.. Παραδείγματα Μη Εμφωλευμένων Υποθέσεων. Στην ενότητα αυτή χρησιμοποιώντας τους Ορισμούς..-..4, θα εξεταστεί αν συγκεκριμένες οικογένειες κατανομών H H είναι εμφωλευμένες, μερικώς ή ολικά μη εμφωλευμένες. Για τη διευκόλυνση στη μελέτη όσων ακολουθούν σε αυτήν την ενότητα, καθώς και στην υπόλοιπη διατριβή, στο Παράρτημα Α έχουν συγκεντρωθεί οι κατανομές και οι ιδιότητές τους, που απαντούν συχνότερα σε όσα ακολουθούν. Επιπλέον, σε όσα d lx ακολουθούν x, όπου με x dx x γνωστή συνάρτηση Γάμμα, με t x t e dt. 0 και συμβολίζεται η Παράδειγμα.. Στο παράδειγμα αυτό θα εξεταστεί αν η λογαριθμοκανονική (lo-ormal) κατανομή με παράμετρο θ, και η εκθετική κατανομή με παράμετρο, με σ.π.π. που δίνονται στις σχέσεις () και (7), αντίστοιχα, του Παραρτήματος Α, είναι εμφωλευμένες ή όχι. 9

Βήμα ο Υπολογισμός του I, E l X, l X, θ θ θ. Προκύπτει από τις σχέσεις () και (8) του Παραρτήματος Α ότι: E lx θ I E X θ, l l θ E X θ l. (..) Λαμβάνοντας υπόψη τη σχέση (3) και την Πρόταση του Παραρτήματος Α, είναι: I θ, l l exp. (..) Βήμα ο Εύρεση του i I θ,, όπου 0, 0 0 0 πραγματική τιμή της παραμέτρου θ,, υπό την H. θ είναι η Για το σκοπό αυτό υπολογίζεται, αρχικά, η πρώτη παράγωγος του I θ,, λαμβάνοντας υπόψη τη σχέση (..) και I θ, 0 τίθεται ίση με το μηδέν. Είναι exp 0 0 και προκύπτει ότι μηδενίζεται στο σημείο * θ exp. 0 0 (..3) 0 Εύκολα διαπιστώνουμε ότι το σημείο * 0 ελαχίστου. Βήμα 3 ο Υπολογισμός του C I 0, ( ) 0 * 0 θ θ θ. θ είναι όντως σημείο 0

Με αντικατάσταση στην (..), λαμβάνοντας υπόψη την (..3) και ότι καθώς l προκύπτει ότι 0 0 C θ 0, θ, 0 0 C θ 0 l l l 0.6. 0 0 Βήμα 4 ο Υπολογισμός του I, E l X, l X, Είναι θ θ. lx X I, θ E l lx l. (..4) Επομένως, λαμβάνοντας υπόψη τις Προτάσεις και 4 του Παραρτήματος Α, προκύπτει ότι: I όπου l, θ l, (..5) 0.577 και.6449. Βήμα 5 ο Εύρεση του i I, 0 θ της παραμέτρου υπό την υπόθεση H. θ, όπου 0 είναι η πραγματική τιμή Για το σκοπό αυτό υπολογίζονται αρχικά οι πρώτες μερικές παράγωγοι του, σχέση (..5). Είναι και I θ ως προς και, λαμβάνοντας υπόψη τη I, θ l, (..6)

ή ισοδύναμα,, θ I l,, θ I. (..7) Θέτοντας τις μερικές παραγώγους I, 0 θ I και, θ 0 ίσες με το μηδέν και επιλύοντας το σύστημα των εξισώσεων που προκύπτει, έχουμε ότι αυτές μηδενίζονται στα σημεία και l (..8) * 0 0 (..9) * 0. Εύκολα διαπιστώνεται ότι το σημείο θ * 0 * 0, * 0 είναι όντως σημείο ελαχίστου. Βήμα 6 ο Υπολογισμός του C 0 I, 0 * 0 θ. Με αντικατάσταση στην (..5), λαμβάνοντας υπόψη τις (..8) και (..9), καθώς C 0 l 0.09 0, 0.577 και.6449. Βήμα 7 ο Χαρακτηρισμός με βάσει τους Ορισμούς..-..4.

Αφού C θ 0 0 και C για κάθε θ και, η 0 0 0 0 λογαριθμοκανονική κατανομή και η εκθετική κατανομή είναι ολικά μη εμφωλευμένες. Παράδειγμα.. Στο παράδειγμα αυτό θα εξεταστεί αν η λογαριθμοκανονική (lo-ormal) κατανομή με παράμετρο θ, και η κανονική κατανομή με παράμετρο γ,, με σ.π.π. που δίνονται στις σχέσεις () και (9), αντίστοιχα, του Παραρτήματος Α, είναι εμφωλευμένες ή όχι. Βήμα ο Υπολογισμός του I, E l X, l X, θ θ θ. Λαμβάνοντας υπόψη τις σχέσεις () και (0) του Παραρτήματος Α, προκύπτει ότι: E X E X θ θ l l l I θγ, E l X. θ Συνδυάζοντας την (3) και την Πρόταση του Παραρτήματος Α, ύστερα από λίγη άλγεβρα, προκύπτει ότι: I θγ, l l e e Βήμα ο Εύρεση του i I θ, γ, όπου γ 0, 0 0 0 πραγματική τιμή της παραμέτρου θ,, υπό την H.. (..0) θ είναι η 3

και. Είναι και Θα ελαχιστοποιήσουμε τη συνάρτηση, 0 I θ γ ως προς 0 0 I, e θ γ, (..) 0 I θ, γ E X θ 4. (..) Θέτοντας κάθε μία από αυτές ίσες με το μηδέν και επιλύοντας το σύστημα των εξισώσεων που προκύπτει, ύστερα από λίγη άλγεβρα, έχουμε ότι: 0 0 * θ 0 e (..3) και 0 0 0 e e * θ0 E X * 0. θ θ (..4) Ύστερα από αλγεβρικές πράξεις διαπιστώνεται ότι το σημείο, * 0 * 0 * 0 γ θ θ θ είναι πράγματι σημείο ελαχίστου. Βήμα 4 ο Υπολογισμός του C I, 0 0 * 0 θ θ γ θ. Με αντικατάσταση στην (..0), λαμβάνοντας υπόψη τις (..3) και (..4), προκύπτει, ύστερα από αλγεβρικές πράξεις, ότι: 0 C θ I θ, γ θ l e l l. 0 0 * 0 0 0 (..5) 4

Αποδεικνύεται, εύκολα π.χ. γραφικά, ότι η ποσότητα C θ 0 είναι διάφορη του μηδενός θ, και μάλιστα 0 C θ 0, θ. 0 0 Βήμα 5 ο -Βήμα 6 ο Στο παράδειγμα αυτό πρέπει η προσοχή να εστιαστεί στο γεγονός ότι το πεδίο ορισμού της λογαριθμοκανονικής και της κανονικής κατανομής είναι το 0, και το,, αντίστοιχα. Επομένως, το πεδίο ορισμού της λογαριθμοκανονικής κατανομής δεν καλύπτει ολόκληρο το πεδίο ορισμού της κανονικής κατανομής. Αυτό έχει ως συνέπεια, το * 0 να μην υπάρχει. Επιπρόσθετα, λαμβάνοντας υπόψη την Πρόταση.. i), μπορούμε να θεωρήσουμε την ποσότητα, 0 κάθε γ και θ. 0 Βήμα 7 ο Αφού C θ 0 0 και C I γ θ διάφορη του μηδενός, για γ για κάθε θ και γ, 0 0 0 η λογαριθμοκανονική και η κανονική κατανομή είναι ολικά μη εμφωλευμένες. 0 Παράδειγμα..3 Στο παράδειγμα αυτό θα εξεταστεί αν η Poisso κατανομή με σ.π. x H :, e x!, 0, x 0,, (..6) x και η γεωμετρική κατανομή με σ.π. είναι εμφωλευμένες ή όχι. x H : x,, 0, x,, (..7) 5

Βήμα ο Υπολογισμός του I, E l X, l X, Εύκολα προκύπτει ότι:. I, E X l l X! X l l, ή ισοδύναμα όπου I l, l l l, (..8) x e l E l X! l x!. (..9) x! Βήμα ο Εύρεση του i I, 0 της παραμέτρου, υπό την H. x 0, όπου 0 είναι η πραγματική τιμή Για το σκοπό αυτό υπολογίζεται, αρχικά, η πρώτη παράγωγος του I, 0 I, Είναι ως προς και τίθεται ίση με το μηδέν. 0 0 και προκύπτει ότι: * 0 το οποίο είναι πράγματι σημείο ελαχίστου. Βήμα 3 ο Υπολογισμός του C 0 I, 0 * 0, (..0) 0. Από τις (..9) και (..0), προκύπτει, μετά από λίγη άλγεβρα, και καθώς η ποσότητα 0 όρων που τείνει στο, ότι: l είναι ένα άθροισμα θετικών 6

C l l 0,. 0 0 0 0 0 0 Βήμα 4 ο Υπολογισμός του I, E l X, l X, Είναι, μετά από λίγη άλγεβρα,. όπου I, l l l, (..) l X l E l X! l X!. (..) Βήμα 5 ο Εύρεση του i I, 0 X 0, όπου 0 είναι η πραγματική τιμή της παραμέτρου, υπό την υπόθεση H. Καθώς I, 0 0, προκύπτει ότι: 0 0 * 0, (..3) το οποίο διαπιστώνεται εύκολα ότι είναι όντως σημείο ελαχίστου. Βήμα 6 ο Υπολογισμός του C 0 I, 0 * 0 0. Από τις (..) και (..), λαμβάνοντας υπόψη ότι η ποσότητα 0, προκύπτει ότι: l είναι ένα άθροισμα θετικών όρων που τείνει στο 0 0 C 0 I, 0 l 0 l l 0 0 0,. 0 0 0 Βήμα 7 ο Χαρακτηρισμός με βάσει τους Ορισμούς..-..4. 7

Αφού C 0 0 και C, για κάθε και, η 0 0 0 0 Poisso κατανομή και η γεωμετρική κατανομή είναι ολικά μη εμφωλευμένες. Τα προηγούμενα τρία παραδείγματα είχαν ως στόχο να αποσαφηνιστεί ο μαθηματικός ορισμός των μη εμφωλευμένων μοντέλων που δόθηκε από τον Pesara (987), με σκοπό την αντικατάσταση του μέχρι τότε απλοϊκού ορισμού, ότι δύο μοντέλα είναι μη εμφωλευμένα αν κανένα εκ των δύο μοντέλων δεν μπορεί να προκύψει από το άλλο, είτε με περιορισμούς στις παραμέτρους είτε μέσω μιας οριακής διαδικασίας. Παρόλα αυτά, πρέπει να επισημανθεί ότι η ερευνητική δραστηριότητα προϋπήρχε αυτού του ορισμού και ξεκινά τη δεκαετία του 60 με τις εργασίες του Cox (96, 96). Στην επόμενη ενότητα δίνεται η περίληψη του περιεχομένου της μεταπτυχιακής διατριβής, ενώ ταυτόχρονα παρατίθενται κάποια ιστορικά στοιχεία..3 Περίληψη Διατριβής Στη βιβλιογραφία έχουν εμφανιστεί διάφοροι τρόποι αντιμετώπισης του υπό μελέτη προβλήματος ξεκινώντας από τη δεκαετία του 60 και τις πρωτοπόρες εργασίες του Cox (96, 96). Οι μεθοδολογίες αυτές, ανάλογα με τη διατύπωση της προς έλεγχο υπόθεσης, ταξινομούνται σε δύο μεγάλες κατηγορίες. Η πρώτη κατηγορία περιλαμβάνει τις προσεγγίσεις, σύμφωνα με τις οποίες μία από τις δύο υποψήφιες κατανομές λαμβάνεται ως μηδενική υπόθεση, έχοντας την άλλη ως εναλλακτική, κι αντίστροφα. Ουσιαστικά πρόκειται, δηλαδή, για μεθόδους στο πλαίσιο του ελέγχου δύο στατιστικών υποθέσεων. Από την άλλη μεριά, η δεύτερη κατηγορία περιλαμβάνει τις 8

προσεγγίσεις, σύμφωνα με τις οποίες η μηδενική υπόθεση είναι ότι οι δύο κατανομές περιγράφουν το τ.δ. ισοδύναμα κι έχει ως εναλλακτικές ότι μία κατανομή είναι καλύτερη της άλλης. Άρα, η προσέγγιση μοιάζει περισσότερο ως επιλογή του καλύτερου μοντέλου (model selectio). Αντικείμενο αυτής της μεταπτυχιακής διατριβής είναι η κριτική ανασκόπηση και παρουσίαση των κυριότερων μεθόδων στατιστικού ελέγχου καθεμίας εκ των δύο παραπάνω κατηγοριών. Στη συνέχεια, θα δοθεί μια σύντομη περίληψη του περιεχομένου της μεταπτυχιακής διατριβής, δίνοντας παράλληλα και κάποια ιστορικά στοιχεία. Αντικείμενο μελέτης στο Κεφάλαιο (Μεθοδολογία του Cox) είναι η τροποποιημένη διαδικασία του πηλίκου των λογαρίθμων των μέγιστων πιθανοφανειών, η οποία παρουσιάστηκε από τον Cox (96, 96). Πέρα της πρωτοπόρας μεθοδολογίας ο Cox (96, 96) παρέθεσε και κάποιες άλλες ιδέες για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Μία από αυτές ήταν η προσέγγιση του περιεκτικού μοντέλου (comprehesive model approach), η οποία αναπτύχθηκε από τον Atkiso (970). Η γενική ιδέα της προσέγγισης αυτής είναι τα μη εμφωλευμένα μοντέλα να ελέγχονται χρησιμοποιώντας ένα κατασκευασμένο γενικό μοντέλο, που περιλαμβάνει τα υπό θεώρηση μη εμφωλευμένα μοντέλα ως ειδικές περιπτώσεις. Η μέθοδος αυτή αποτελεί το αντικείμενο μελέτης του Κεφαλαίου 3 (Μεθοδολογία του Atkiso). Μία άλλη μεθοδολογία αντιμετώπισης του υπό μελέτη προβλήματος, η οποία ανήκει στην πρώτη κατηγορία που αναφέραμε πρωτύτερα, είναι αυτή των Epps et al. (98). Η προσέγγισή αυτή, η οποία βασίζεται στην εμπειρική ροπογεννήτρια συνάρτηση, παρουσιάζεται στο Κεφάλαιο 4 (Μεθοδολογία των Epps, Sileto, Pulley). 9

Στα Κεφάλαια 5 και 6 θα παρουσιαστούν δύο προσεγγίσεις, σύμφωνα με τις οποίες η μηδενική υπόθεση είναι ότι οι δύο κατανομές περιγράφουν το τ.δ. ισοδύναμα κι έχει ως εναλλακτικές ότι μία εκ των κατανομών είναι καλύτερη της άλλης. Ειδικότερα, αντικείμενο μελέτης του Κεφαλαίου 5 (Μεθοδολογία του Vuo) είναι η προσέγγιση του Vuo (989). Ο Vuo (989) στηρίχθηκε στο μέτρο εγγύτητας δύο κατανομών, που αναφέραμε στην παράγραφο. και εστίασε στον έλεγχο της υπόθεσης ότι τα υπό θεώρηση μοντέλα είναι «εξ ίσου» κοντά στο πραγματικό μοντέλο. Παρακινούμενος από την εργασία του Vuo (989), ο Clarke (003) παρουσίασε μια εναλλακτική προσέγγιση, η οποία ουσιαστικά προέκυψε τροποποιώντας κατάλληλα το προσημικό τεστ. Στο πλαίσιο αυτό, το προσημικό τεστ εφαρμόζεται στις διαφορές των λογαρίθμων των πιθανοφανειών των δύο μη εμφωλευμένων μοντέλων. Η προσέγγιση αυτή παρουσιάζεται στο Κεφάλαιο 6 (Μεθοδολογία του Clarke). Για την αποσαφήνιση των παραπάνω μεθόδων, σε κάθε κεφάλαιο, αναπτύσσεται η αντίστοιχη θεωρία για τον έλεγχο της υπόθεσης αν ένα τ.δ. μπορεί να θεωρηθεί ότι προέρχεται από τη λογαριθμοκανονική ή την εκθετική κατανομή. Στο Κεφάλαιο 7 (Συγκριτική Μελέτη Προσομοίωσης), στο πλαίσιο του ελέγχου της λογαριθμοκανονικής έναντι της εκθετικής κατανομής, παρακινούμενοι από προγενέστερες μελέτες, διεξάγουμε μία μελέτη προσομοίωσης για τη σύγκριση και την αξιολόγηση των μεθόδων που παρουσιάστηκαν στα Κεφάλαια -6, ενώ ταυτόχρονα παρουσιάζονται και τα αποτελέσματα προγενέστερων μελετών. Επιπλέον, στο Παράρτημα Α συγκεντρώνονται οι ιδιότητες των κατανομών και κάποια ενδιάμεσα αποτελέσματα, που απαντούν συχνότερα σε ολόκληρη τη διατριβή, στο Παράρτημα Β δίνονται οι συνθήκες υπό τις οποίες οι μέθοδοι που αναπτύχθηκαν 0

στα Κεφάλαια -6 έχουν ισχύ, ενώ στο Παράρτημα Γ δίνονται οι τιμές της αθροιστικής συνάρτησης της διωνυμικής κατανομής με πιθανότητα επιτυχίας p 0.5, καθώς είναι χρήσιμες για την υλοποίηση της μεθόδου του Clarke (003), που παρουσιάζεται στο Κεφάλαιο 6. Τέλος, η διατριβή ολοκληρώνεται με την περίληψή της στα Αγγλικά (Abstract o the MSc Dissertatio) και τη Βιβλιογραφία.

ΚΕΦΑΛΑΙΟ Μεθοδολογία του Cox (96, 96) Στο κεφάλαιο αυτό θα παρουσιαστεί η μεθοδολογία που προτάθηκε από τον Cox (96, 96) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Ο Cox (96,96) ήταν από τους πρώτους ερευνητές που ασχολήθηκαν με το πρόβλημα του ελέγχου μη εμφωλευμένων υποθέσεων. Παρήγαγε μια γενική μέθοδο βασισμένη στο πηλίκο μέγιστων πιθανοφανειών, την οποία και παρουσίασε σε δύο εργασίες του (Cox (96, 96)). Επιπλέον, όπως θα δούμε και στο επόμενο κεφάλαιο αυτής της μεταπτυχιακής διατριβής, πρότεινε κι άλλες ιδέες αντιμετώπισης του προβλήματος. Η διάρθρωση του Κεφαλαίου έχεις ως εξής: στην Παράγραφο. παρατίθενται κάποιες εισαγωγικές έννοιες, ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί στο κεφάλαιο αυτό, αναφέρονται οι συνθήκες υπό τις οποίες ισχύει η μεθοδολογία του Cox (96, 96), καθώς και κάποια χρήσιμα αποτελέσματα για τη διευκόλυνση της μελέτης του υπόλοιπου κεφαλαίου. Στη συνέχεια, στην Παράγραφο. παρουσιάζεται η μεθοδολογία του Cox (96, 96), ενώ στην Παράγραφο.3 αποσαφηνίζεται μέσω της μελέτης της ειδικής περίπτωσης του ελέγχου της υπόθεσης αν ένα τυχαίο δείγμα,, X X μπορεί να θεωρηθεί ότι προέρχεται είτε από την λογαριθμοκανονική είτε από την εκθετική κατανομή.

. Εισαγωγή Στην παράγραφο αυτή δίνονται κάποιες εισαγωγικές έννοιες και συμβολισμοί, οι συνθήκες υπό τις οποίες ισχύει η μεθοδολογία του Cox (96,96), καθώς και κάποια χρήσιμα αποτελέσματα για τη διευκόλυνση της μελέτης του υπόλοιπου κεφαλαίου. Ο Cox (96, 96) αντιμετώπισε το πρόβλημα του ελέγχου των μη εμφωλευμένων μοντέλων, που περιγράφηκε στο προηγούμενο κεφάλαιο, τροποποιώντας τη μέθοδο του πηλίκου μέγιστων πιθανοφανειών. Αν χρησιμοποιήσουμε ως στατιστικό το πηλίκο μέγιστων πιθανοφανειών και θεωρήσουμε ως μηδενική υπόθεση που θέλουμε να ελέγξουμε την H με εναλλακτική την ισχυρίζεται ότι είναι λογικό να θεωρήσουμε ως στατιστική συνάρτηση ελέγχου την C, ˆ H T L E θ L (..) όπου sup x, θ x, θˆ θ L sup x, γ x, γˆ γ, (..) με ˆθ και ˆγ να είναι οι Ε.Μ.Π. των παραμέτρων θ και γ υπό τις και H, αντίστοιχα. Επιπλέον, με E ˆ θ τιμή, υπό την 4 H συμβολίζεται η αναμενόμενη H, όταν η άγνωστη παράμετρος θ αντικαθίσταται από τον Ε.Μ.Π. ˆθ. Ο Cox (96, 96) πρότεινε αυτήν τη στατιστική

συνάρτηση, καθώς θεώρησε λογική τη σύγκριση της L με τον καλύτερο εκτιμητή της τιμής που αναμένουμε να λάβει υπό την H. Επομένως, στατιστικά σημαντικές αρνητικές τιμές του στατιστικού C T οδηγούν στην απόρριψη της H, με κατεύθυνση προς την H. Με παρόμοιο τρόπο, αν θεωρηθεί ως μηδενική υπόθεση η με εναλλακτική την H η στατιστική συνάρτηση ελέγχου είναι η C ˆ, H T L E γ L (..3) θέλοντας να συγκριθεί η L με τον καλύτερο εκτιμητή της τιμής που αναμένεται να λάβει υπό την H. Στατιστικά σημαντικές αρνητικές τιμές του στατιστικού C T οδηγούν στην απόρριψη της H, με κατεύθυνση προς την H. Τέλος, μια στατιστικά σημαντική αρνητική τιμή του στατιστικού T ( ή του C C T ) και ταυτόχρονα μια στατιστικά σημαντική θετική τιμή του στατιστικού T ( ή του οδηγεί στην απόρριψη και της H και της H. C C T ), Οι δυνατές αποφάσεις του στατιστικού τεστ του Cox (96, 96) συγκεντρώνονται στον Πίνακα, που ακολουθεί. Παρατήρηση.. Όταν οι υποθέσεις H και H είναι εμφωλευμένες, οι δεύτεροι όροι των σχέσεων (..) και (..3) είναι ίσοι με το μηδέν, ενώ όταν είναι μη εμφωλευμένες πρέπει να υπολογιστούν. Ο υπολογισμός αυτός καθιστά τη μέθοδο του Cox (96, 96) να μην είναι πάντοτε εύκολα εφαρμόσιμη, καθώς ακόμα και μια ασυμπτωτικά ισοδύναμη έκφραση, υπό τη μηδενική 5

υπόθεση, δεν είναι πάντοτε υπολογίσιμη. Σε τέτοιες περιπτώσεις χρησιμοποιούνται είτε τεχνικές προσομοίωσης είτε αριθμητικές μέθοδοι υπολογισμού της αναμενόμενης τιμής (βλέπε Schork (993) και αναφορές εκεί). Πίνακας Όλες οι δυνατές αποφάσεις του τεστ του Cox (96,96). Πηγή: Rojas-Rojas et al. (007) C T στατιστικά σημαντικές αρνητικές τιμές Μη στατιστικά σημαντικές τιμές στατιστικά σημαντικές θετικές τιμές στατιστικά σημαντικές αρνητικές τιμές Απορρίπτουμε και την H και την H Αποδεχόμαστε την H Απορρίπτουμε και την H και την H C T Μη στατιστικά σημαντικές τιμές Αποδεχόμαστε την H Αποδεχόμαστε και την H και την H Πιθανόν αποδεχόμαστε την H στατιστικά σημαντικές θετικές τιμές Απορρίπτουμε και την την H H και Πιθανόν αποδεχόμαστε την H Άτοπο ( H και H απορρίπτονται) Παρατήρηση.. Κάποιοι ερευνητές με βάση τις δυνατές αποφάσεις που δίνονται στον Πίνακα αποφαίνονται ότι τα 6

αποτελέσματα του στατιστικού τεστ του Cox (96, 96), όπως και κάθε άλλου ίδιας φιλοσοφίας, για την επιλογή του καταλληλότερου μεταξύ δύο «ανταγωνιστικών» μοντέλων, δεν είναι πάντοτε σαφή. Ειδικότερα, η πιθανότητα είτε απόρριψης και των δύο μοντέλων, χωρίς μια υπόδειξη για το τι ακολουθεί στην περίπτωση αυτή, οδήγησε σε αρνητικές κριτικές (βλέπε Graer et al. (995)), είτε αποδοχής και των δύο, θεωρείται ως αδυναμία του στατιστικού τεστ. Αυτή θα ήταν όντως αδυναμία αν ο κυρίαρχος σκοπός ήταν η επιλογή ενός εκ των δύο μοντέλων, αλλά όταν και τα δύο δεν περιγράφουν ικανοποιητικά τις δειγματικές παρατηρήσεις είναι προτιμότερο να αναζητηθεί ένα τρίτο με καλύτερη προσαρμογή (βλέπε Perasa ad Weeks (999) και αναφορές εκεί). C Η εύρεση της ασυμπτωτικής κατανομής της T υπό την H, αποτέλεσε το αντικείμενο μελέτης των εργασιών του Cox (96, 96) και παρατίθεται στην επόμενη ενότητα. Ο προσδιορισμός αυτής προϋποθέτει ότι ισχύουν κάποιες συνθήκες, γνωστές και ως συνθήκες ομαλότητας. Οι συνθήκες αυτές καθώς δεν δόθηκαν από τον Cox (96, 96), ο οποίος απλά έκανε λόγο για την ύπαρξή τους (βλέπε Cox (96, σελ. 05) και Cox (96, σελ. 408)), δόθηκαν σε μεταγενέστερη εργασία (βλέπε White (98)). Οι συνθήκες αυτές για λόγους πληρότητας παρατίθενται στο Παράρτημα Β. Στο σημείο αυτό, θα πρέπει να αναφερθεί ότι ο White (98) επιπλέον έδωσε μια αναλυτική απόδειξη της στατιστικής συνάρτησης του Cox (96, 96). Σε όσα ακολουθούν θα παρουσιαστεί αναλυτικά η αρχική απόδειξη που δόθηκε από τον Cox (96, 96). Στη συνέχεια, πριν παρουσιαστεί η μεθοδολογία του Cox (96, 96) δίνεται ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί. Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες 7

μεταβλητές με σ.π.π. x, υπό την H και, Με L και L των x, και, x υπό την H. συμβολίζονται οι συναρτήσεις πιθανοφάνειας x, αντίστοιχα. Για λόγους απλότητας σε όσα ακολουθούν υποθέτουμε ότι οι παράμετροι και είναι μονοδιάστατες, επομένως ότι R και R. Επιπρόσθετα, υποθέτουμε ότι πληρούνται οι συνθήκες ομαλότητας (βλέπε Παράρτημα Β). Συμβολίζονται με ˆ και παραμέτρων και υπό την H και H, υποθέτουμε ότι όταν η H ˆ οι Ε.Μ.Π. των αντίστοιχα, ενώ, είναι αληθής, ο Ε.Μ.Π. ˆ της παραμέτρου συγκλίνει κατά πιθανότητα στην, όπου η αληθής τιμή της παραμέτρου. Τέλος, σε όσα ακολουθούν χρησιμοποιείται ο ακόλουθος συμβολισμός: i i l X, l X, F l X,, F, F, i i i, i, (..4) και l X, i G l X,, G. i i i, (..5) Όταν παραλείπεται ο δείκτης i στους παραπάνω συμβολισμούς σημαίνει ότι αντικαθίσταται το F l X, και F l X,. X από το X. Για παράδειγμα, i Χρησιμοποιώντας τους συμβολισμούς αυτούς και υποθέτοντας ότι μπορούμε να αντιστρέψουμε τη σειρά της παραγώγισης με την ολοκλήρωση, έχουμε τα ακόλουθα αποτελέσματα: 8

Πρόταση... (Cox (96)) Ισχύουν τα ακόλουθα: i) E F 0. (, ) l, l, l,. ii) E FF x x dx E X X Cov F, F E FF x, l x, dx. iii) E F F F F x, l x, dx. iv) v) E L E l X, I, όπου πληροφορίας του Fisher. vi) x, E F G x, l dx. x, x, E F F G x, l dx. x, vii) I το μέτρο Η απόδειξη της παραπάνω πρότασης παρατίθεται στο Παράρτημα Α. Τέλος, χρησιμοποιώντας το νόμο των μεγάλων αριθμών και λαμβάνοντας υπόψη το αποτέλεσμα v) της Πρότασης.., προκύπτει το ακόλουθο Λήμμα. 9

Λήμμα.. Έστω ˆ ο Ε.Μ.Π. της παραμέτρου υπό την υπόθεση H. Υπό την πρόσθετη υπόθεση ότι ισχύουν οι συνθήκες ομαλότητας του παραρτήματος Β, αποδεικνύεται ότι: L ˆ E L I. (..6) Στην επόμενη ενότητα θα παρουσιασθεί η μέθοδος του Cox (96, 96). Η μέθοδος αυτή, παρότι γενική, μερικές φορές δεν μπορεί να εφαρμοστεί, είτε λόγω των όσων αναφέρθηκαν στην Παρατήρηση.. είτε λόγω ότι δεν ικανοποιούνται οι συνθήκες που δίδονται στο Παράρτημα Β.. Η Μεθοδολογία Στην ενότητα αυτή θα παρουσιαστεί ο τρόπος C προσδιορισμού της κατανομής της στατιστικής συνάρτησης T της σχέσης (..), στην περίπτωση που το μέγεθος του δείγματος είναι μεγάλο. Για λόγους απλούστευσης, αρχικά, σε όσα ακολουθούν υποθέτουμε ότι οι παράμετροι και είναι μονοδιάστατες, επομένως ότι R και R. Επιπρόσθετα, θεωρούμε ότι πληρούνται οι συνθήκες του Παραρτήματος Β. Στο πλαίσιο αυτό, C αρχικά θα προσδιοριστεί η κατανομή ενός τμήματος της T, της ποσότητας L ˆ E ˆ L ˆ. Πρόταση.. (Cox (96)) Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π. x, υπό την H και x, υπό την H, με R και R. Υπό την H, η σ.σ. 30

ˆ ˆ ˆ L E L (..) ακολουθεί ασυμπτωτικά κανονική κατανομή με μέση τιμή μηδέν και διακύμανση Var Cov F, F F, Var F υπό τον όρο ότι αυτή είναι θετική, με F, i i, ορίστηκαν στην (..4), ενώ με Cov F, F συνδιακύμανση των F και F υπό την H. (..) F και F, όπως αυτές i, συμβολίζεται η Απόδειξη (Cox (96)) Αναπτύσσοντας κατά Taylor τη συνάρτηση L γύρω από το σημείο ˆ, συνυπολογίζοντας ότι L ˆ 0, προκύπτει ότι προσεγγιστικά ισχύει ότι: 3 L L ˆ ˆ L ˆ, (..3) Επιπλέον, με παρόμοιο τρόπο προκύπτει ότι προσεγγιστικά ισχύει ότι: Από την (..4) έχουμε ότι: L L ˆ ˆ L ˆ. (..4) L ˆ. (..5) L ˆ

Είναι γνωστό (βλέπε Λήμμα...) ότι: l, ˆ X L E l X, Var και συνδυάζοντας τις (..3) και (..6) προκύπτει ότι: l X, L ˆ L ˆ Var. (..6) (..7) Ισοδύναμα, λαμβάνοντας υπόψη ότι l X, l X, Var E E F, (..8) και το συμβολισμό (..4), έχουμε ότι: i L ˆ ˆ. F E F (..9) i Συνδυάζοντας τις σχέσεις (..9) και (..7) είναι: l X, E L ˆ E L E ˆ Var x, l x, dx, (..0) οπότε εύκολα προκύπτει ότι: ˆ ˆ ˆ E ˆ L x, l x, dx. (..) Αναπτύσσοντας κατά Taylor τη συνάρτηση x, ˆ l x, ˆ από το προκύπτει ότι: 3 γύρω

, l,, ˆ l, ˆ, l, x x X X x x ˆ ˆ x, l x,. Λαμβάνοντας υπόψη τις σχέσεις iii) και iv) της Πρότασης.. και τους συμβολισμούς (..4), προκύπτει ότι: ˆ ˆ ˆ, E F F F F E L E F Cov F F ˆ. Συνδυάζοντας τις (..7) και (..) είναι: (..) i ˆ E F F F. L ˆ E L ˆ F E F ˆ Cov F, F ˆ i (..3) Από τις σχέσεις (..5) και (..6) έχουμε ότι:, ˆ ˆ ˆ Cov F F L E L F E i F F i, i Var F ˆ E F F F. (..4) Η ποσότητα i Cov 33 F, F F E F Fi, που εμφανίζεται στην i Var F πρώτη γραμμή της (..4), διαιρεμένη με το, συγκλίνει κατά πιθανότητα στο μηδέν. Αυτό σημαίνει ότι είναι τάξης κατά πιθανότητα. Επίσης, η ποσότητα που εμφανίζεται στη δεύτερη γραμμή της σχέσης (..4) συγκλίνει κατά πιθανότητα στο μηδέν,

που σημαίνει ότι είναι τάξης κατά πιθανότητα. Αγνοώντας, στη συνέχεια, τη δεύτερη γραμμή της σχέσης (..4), δηλαδή θεωρώντας μόνο τους όρους οι οποίοι, διαιρεμένοι με το, συγκλίνουν κατά πιθανότητα στο μηδέν, θεωρούμε μόνο την ποσότητα Cov F, F F E F F. i i, (..5) i Var F Αυτή μπορεί να θεωρηθεί ότι είναι το άθροισμα των σφαλμάτων ενός μοντέλου γραμμικής παλινδρόμησης με εξαρτημένη μεταβλητή την F και ανεξάρτητη την F, ενώ το πηλίκο Cov Var F, F F είναι ο συντελεστής παλινδρόμησης της F, υπό την υπόθεση H. Οπότε, η ποσότητα L ˆ E ˆ L ˆ, αγνοώντας τους όρους της δεύτερης γραμμής της σχέσης (..4), μπορεί να θεωρηθεί ότι ισούται με το άθροισμα των σφαλμάτων σε αυτό το μοντέλο γραμμικής παλινδρόμησης. Επομένως, προκύπτει ότι η ποσότητα ˆ ˆ ˆ L E L ακολουθεί ασυμπτωτικά κανονική κατανομή με μέση τιμή μηδέν και διακύμανση Var Cov F, F F, Var F υπό τον όρο ότι η παραπάνω διακύμανση είναι θετική. (..6) Παρατήρηση.. α) Είναι αυτονόητο ότι η προσέγγιση της κατανομής της στατιστικής συνάρτησης L ˆ E ˆ L ˆ 34, υπό την

H, μπορεί να βελτιωθεί λαμβάνοντας υπόψη τη δεύτερη γραμμή της (..4), δηλαδή τον όρο τάξης κατά πιθανότητα. Επιπλέον, σε αυτή την περίπτωση, η προσέγγιση θα μπορούσε να βελτιωθεί συνεκτιμώντας ότι η μέση τιμή της στατιστικής συνάρτησης δεν είναι μηδέν, αλλά προκύπτει να είναι ίση με E F E F F F, (..7) λαμβάνοντας υπόψη τα αποτελέσματα της Πρότασης... β) Επιπλέον, η παράλειψη της δεύτερης γραμμής της (..4) έχει ως αποτέλεσμα ορισμένες φορές η εκτιμώμενη τιμή της ασυμπτωτικής διακύμανσης που προκύπτει να μην είναι θετική. Ειδικότερα, στο συμπέρασμα αυτό κατέληξαν οι Al-Khalidi ad Hwa (99) εφαρμόζοντάς τη μέθοδο του Cox (96, 96) για την περίπτωση της κανονικής έναντι της λογαριθμοκανονικής κατανομής, μιας περίπτωσης δηλαδή όπου η απόφαση για απόρριψη ή μη της μηδενικής υπόθεσης εξαρτάται και από το πεδίο ορισμού των δύο τ.μ., χρησιμοποιώντας προσομοιωμένα δεδομένα. Στην επόμενη πρόταση προσδιορίζεται η κατανομή της στατιστικής συνάρτησης που προτάθηκε από τον Cox (96, 96) για τον έλεγχο της H έναντι της H, υπό την H. Σε όσα ακολουθούν θα περιοριστούμε στους όρους εκείνους οι οποίοι διαιρεμένοι με το, συγκλίνουν κατά πιθανότητα στο μηδέν. Η απόδειξη είναι παρόμοια με αυτήν της Πρότασης.. και για το λόγο αυτό θα δοθεί εν συντομία. 35

Πρόταση.. (Cox (96)) Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π. x, υπό την H και x, υπό την H, με R και R. Συμβολίζονται με ˆ και ˆ οι Ε.Μ.Π. των παραμέτρων και υπό την H και H, αντίστοιχα. Επιπλέον, υποθέτουμε ότι για δοθέν, ο Ε.Μ.Π. ˆ της παραμέτρου, συγκλίνει υπό την στατιστική συνάρτηση H κατά πιθανότητα στο ˆ ˆ ˆ ˆ ˆ C. Η T L L E L L (..8) ακολουθεί ασυμπτωτικά, υπό την τιμή μηδέν και διακύμανση Var F G H, κανονική κατανομή με μέση Cov F G, F Var υπό τον όρο ότι αυτή είναι θετική, όπου F, i όπως αυτές ορίστηκαν στις σχέσεις (..4) και (..5). F i,, (..9) F και G οι ποσότητες i Σκιαγράφηση Απόδειξης (Cox (96)) Όμοια με την απόδειξη της Πρότασης.. και καθώς περιοριζόμαστε στους όρους εκείνους που διαιρεμένοι με το συγκλίνουν κατά πιθανότητα στο μηδέν, επομένως είναι τάξης, προκύπτει ότι ισχύει προσεγγιστικά: Επιπρόσθετα, έχουμε ότι: L ˆ L ˆ L L. (..0) 36

x, E L ˆ L ˆ x, l dx (..) x, και x, E ˆ L ˆ L ˆ x, l dx x,, ˆ x x, l dx. x, Ισοδύναμα, λαμβάνοντας υπόψη την Πρόταση..: ˆ ˆ E L L ˆ E F G E F F G. ˆ (..) (..3) Από τις σχέσεις (..)-(..3) έχουμε προσεγγιστικά ότι:, C Cov F G F T F G E F G F. i i i, (..4) i Var F C Έτσι, η ποσότητα T μπορεί να θεωρηθεί ότι ισούται με το άθροισμα των σφαλμάτων σε ένα μοντέλο γραμμικής παλινδρόμησης των F G με τα F i i i,, i,,,. Άρα, υπό την H, C η στατιστική συνάρτηση T L ˆ L ˆ E ˆ L ˆ L ˆ ακολουθεί, ασυμπτωτικά, κανονική κατανομή με μέση τιμή μηδέν και διακύμανση: Var F G υπό τον όρο ότι αυτή είναι θετική. 37 Cov F G, F Var F, (..5)

Όσα προηγήθηκαν θεμελιώθηκαν, υπό την υπόθεση ότι οι διανυσματικές παράμετροι ήταν μονοδιάστατες. Στη συνέχεια, στην πρόταση που ακολουθεί παρουσιάζεται η γενίκευση του αποτελέσματος της Πρότασης.. στην περίπτωση που η παράμετρος θ είναι διανυσματική, με θ R p, ενώ η παράμετρος γ μπορεί να είναι είτε διανυσματική είτε όχι. Η απόδειξη αυτής της γενίκευσης βασίζεται στην παρατήρηση ότι σε αυτήν την περίπτωση C η στατιστική συνάρτηση T μπορεί να θεωρηθεί ως το άθροισμα των σφαλμάτων ενός μοντέλου πολλαπλής παλινδρόμησης Y Z, όπου Y είναι το -διάστατο διάνυσμα στήλη με Y F G E F G,, F G E F G, (..6) θ θ και Z είναι ο p πίνακας με,, t Z Z Z όπου Z, i,,, i είναι το p -διάστατο διάνυσμα, με συνιστώσες Z l X, θ,, l X, θ, i,,. (..7) i i i p Τότε, υπό τις συνθήκες που δίνονται στο Παράρτημα Β, προκύπτει το ακόλουθο αποτέλεσμα. t Πρόταση..3 (Cox (96)) Έστω X,, X ένα τ.δ. από έναν πληθυσμό με σ.π.π. x, θ, υπό την 38 H, και, x γ υπό την H, με θ R p και γ. Συμβολίζονται με ˆθ και ˆγ οι Ε.Μ.Π. των παραμέτρων θ και γ υπό την H και H, αντίστοιχα. Επιπλέον, υποθέτουμε ότι για δοθέν θ, ο Ε.Μ.Π. ˆγ της παραμέτρου γ,

συγκλίνει, υπό την H, κατά πιθανότητα στο στατιστική συνάρτηση ˆ ˆ ˆ ˆ γ. Υπό την θ C i i θ θ i i H, η T F θ G γ E F θ G γ Z Z Z Z Y (..8) ακολουθεί ασυμπτωτικά, υπό την τιμή μηδέν και διακύμανση: H, κανονική κατανομή με μέση, Var F G Y Z Z Z Z Y θ (..9) όπου ZZ και ZY είναι οι p p και p πίνακες με συνιστώσες ZZ και jk j σχέσεις: ZY, j, k,, p, που προσδιορίζονται από τις jk j k Z Z Cov F, F, j, k,, p, (..30) θ και j j Z Y Cov F G, F, j,, p, (..3) θ αντίστοιχα, όπου F l X, θ, G l X, θ l X, θ F, j,, p. j j γ και Τέλος, για λόγους πληρότητας, η ενότητα αυτή ολοκληρώνεται με την παράθεση των αντίστοιχων προτάσεων όταν το ενδιαφέρον επικεντρώνεται στην εύρεση ενός τρόπου ελέγχου έχοντας ως μηδενική υπόθεση την H και εναλλακτική την H. 39

Πρόταση..4 (Cox (96)) Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π. x, υπό την H και x, υπό την H, με R και R. Συμβολίζονται με ˆ και ˆ οι Ε.Μ.Π. των παραμέτρων και υπό την H και H, αντίστοιχα. Επιπλέον, υποθέτουμε ότι για δοθέν, ο Ε.Μ.Π. ˆ της παραμέτρου, συγκλίνει, υπό την Υπό την H, η στατιστική συνάρτηση H, κατά πιθανότητα στο. ˆ ˆ ˆ ˆ ˆ T L L E L L (..3) C ακολουθεί ασυμπτωτικά, υπό την H, κανονική κατανομή με μέση τιμή μηδέν και διακύμανση Var G F Cov G F, G Var G, (..33) υπό τον όρο ότι αυτή είναι θετική, όπου G και G, οι ποσότητες όπως αυτές ορίστηκαν στην (..5). Πρόταση..5 (Cox (96)) Έστω X,, X ένα τ.δ. από έναν πληθυσμό με σ.π.π. x, θ υπό την 40 H και, x γ υπό την H, με p θ R και γ R p. Συμβολίζονται με ˆθ και ˆγ οι Ε.Μ.Π. των παραμέτρων θ και γ υπό την H και H, αντίστοιχα. Επιπλέον, υποθέτουμε ότι για δοθέν γ, ο Ε.Μ.Π. ˆθ της παραμέτρου θ, συγκλίνει, υπό την στατιστική συνάρτηση H, κατά πιθανότητα στο θ. Υπό την H, η γ

ˆ ˆ ˆ ˆ C i i γ γ i i T G γ F θ E G γ F θ W W W W R (..34) ακολουθεί ασυμπτωτικά, υπό την H, κανονική κατανομή με μέση τιμή μηδέν και διακύμανση: Var G F RW W W W R, (..35) γ όπου R είναι το -διάστατο διάνυσμα στήλη R G F E ( G F ),, G F E ( G F ) t (..36) γ γ και W είναι ο p πίνακας με W W W,, t όπου W, i i,,, είναι το p -διάστατο διάνυσμα με συνιστώσες W l X,,, l X,, i γ γ (..37) p ενώ με WW και WR συμβολίζονται οι p p και p πίνακες με συνιστώσες WW και jk j προσδιορίζονται από τις σχέσεις: jk j k WR, j, k,, p, που W W Cov G, G, j, k,, p, (..38) γ και j j W R Cov G F, G, j,, p, (..39) γ 4

αντίστοιχα, όπου G l X, γ, F l X, γ l X, γ G, j,, p. j j θ και Παρατήρηση.. Η στατιστική συνάρτηση του Cox (96, 96) και η ασυμπτωτική διακύμανσή της, όπως αυτές προσδιορίστηκαν σε καθεμία από τις προτάσεις..-..5, εξαρτώνται από τις άγνωστες παραμέτρους θ και γ. Επομένως, στην πράξη, για να εφαρμοστεί η μεθοδολογία αυτή, ο Cox (96, 96) πρότεινε ότι οι παράμετροι θ και γ θα πρέπει να αντικατασταθούν από τους αντίστοιχους Ε.Μ.Π. ˆθ και ˆγ. Τέλος, ο Pereira (977) απέδειξε ότι η σ.σ. του Cox (96, 96) συγκλίνει κατά πιθανότητα, υπό τη μηδενική υπόθεση, σε μία αρνητική τιμή. Έπειτα από την πρωτοπόρα εργασία του Cox (96, 96) διάφοροι ερευνητές επικέντρωσαν το ενδιαφέρον τους τόσο στη γενίκευση ή στην εφαρμογή της σε ειδικές περιπτώσεις, όσο και στη μελέτη των ιδιοτήτων της προτεινόμενης μεθοδολογίας. Στο πρώτο πλαίσιο, πέραν των όσων θα αναφερθούν στον επίλογο της μεταπτυχιακής αυτής διατριβής, αξίζει να αναφερθεί σε αυτό το σημείο η προσέγγιση που προτάθηκε από τον Williams (970 a, b), ο οποίος παρατηρώντας ότι οι συνθήκες για την εγκυρότητα της μεθοδολογίας του Cox (96, 96) δεν ισχύουν πάντοτε, πρότεινε την απευθείας προσομοίωση της κατανομής της στατιστικής συνάρτησης του Cox (96, 96), υποθέτοντας ότι θ θ. ˆ * * Έτσι, γέννησε B το πλήθος δείγματα X,, X, k,, B, k k όπου B ένας αρκετά μεγάλος ακέραιος, από έναν πληθυσμό με 4

* σ.π.π., ˆ x θ. Για κάθε ένα σύνολο δεδομένων υπολόγισε τις τιμές των Ε.Μ.Π. των άγνωστων παραμέτρων, δηλαδή τους ˆ B θ και ˆ B γ, και με τη βοήθεια αυτών υπολόγισε την τιμή της στατιστικής συνάρτησης B ˆ B B T l x, θ / x, γ ˆ. ib ib i Η H απορρίπτεται τότε, με επίπεδο σημαντικότητας, αν η τιμή της T χρησιμοποιώντας τα πραγματικά διαθέσιμα δεδομένα είναι μεγαλύτερη από την B μεγαλύτερη τιμή των B T, όπου με συμβολίζεται το ακέραιο μέρος του αριθμού. Δηλαδή, αν η T είναι μεγαλύτερη από το B προσομοιωμένων τιμών T. % ποσοστιαίο σημείο των Στο πλαίσιο της μελέτης των ιδιοτήτων της διεξήχθησαν τόσο αναλυτικές έρευνες όσο και μελέτες προσομοίωσης. Τα αποτελέσματα των τελευταίων θα αποτελέσουν αντικείμενο μελέτης του Κεφαλαίου 7, ενώ στο σημείο αυτό θα αναφερθούν κάποιες ιδιότητες που έχουν προκύψει με αναλυτικές μελέτες. Ειδικότερα, o Pereira (977) απέδειξε, υπό την υπόθεση ότι τα δύο «ανταγωνιστικά» μοντέλα ορίζονται στο ίδιο διάστημα, ότι η πιθανότητα απόρριψης της π.χ. H όταν η H είναι αληθής τείνει στο καθώς το μέγεθος του δείγματος τείνει στο άπειρο, δηλαδή το τεστ είναι συνεπές. Τέλος, ο Loh (985), μέσω της θεώρησης μιας ειδικής περίπτωσης, απέδειξε ότι η σ.σ. του Cox (96, 96) δε διατηρεί το επίπεδο σημαντικότητας. Περισσότερες ιδιότητες και κριτικές για τη μέθοδο του Cox (96, 96) θα δοθούν στο Κεφάλαιο 7. 43

.3 Ειδική Περίπτωση Στην ενότητα αυτή, θα αποσαφηνιστούν οι προτάσεις που δόθηκαν στην προηγούμενη ενότητα, θεωρώντας την ειδική περίπτωση της λογαριθμοκανονικής και της εκθετικής κατανομής, που όπως είδαμε στο προηγούμενο κεφάλαιο πρόκειται για μη εμφωλευμένα μοντέλα. Θεωρούμε, δηλαδή, ένα τυχαίο δείγμα X,, X και θέλουμε να ελέγξουμε αν αυτό το τ.δ. μπορεί να θεωρηθεί ότι προέρχεται από την l N, ή από την / Exp, με σ.π.π. αυτές που δίνονται στις σχέσεις () και (7) αντίστοιχα, του Παραρτήματος Α. Καθώς δεν ξέρουμε ποια από τις δύο κατανομές είναι αυτή που τίθεται στη μηδενική υπόθεση και ποια στην εναλλακτική, στη συνέχεια, εναλλάσσονται οι ρόλοι αυτοί στα δύο παραδείγματα που ακολουθούν και αναπτύσσεται η μεθοδολογία του Cox (96, 96). Ειδικότερα, στο επόμενο παράδειγμα θα ελέγξουμε τη μηδενική υπόθεση ότι τα δεδομένα προέρχονται από την l N, έναντι της Exp / στο Παράδειγμα.3.., ενώ το αντίστροφο πρόβλημα θα μελετηθεί Παράδειγμα.3. Σύμφωνα με τη μεθοδολογία του Cox (96, 96) στο παράδειγμα αυτό θα ελέγξουμε τη μηδενική υπόθεση ότι τα δεδομένα προέρχονται από την l, H ότι προέρχονται από την Exp /, 44 H N έναντι της εναλλακτικής. Καθώς η παράμετρος θ είναι διδιάστατη θα εφαρμοστεί η Πρόταση..3. Επομένως πρέπει να βρεθεί για αυτήν την περίπτωση η μορφή της

C στατιστικής συνάρτησης T που δίνεται στη σχέση (..8) και η οποία, υπό την H, ακολουθεί ασυμπτωτικά κανονική κατανομή με μέση τιμή μηδέν και διακύμανση που δίνεται στη σχέση (..9). Βήμα ο Προσδιορίζονται οι Ε.Μ.Π. ˆθ και ˆ των παραμέτρων θ και υπό την με H και H, αντίστοιχα. Επιπλέον, προσδιορίζουμε για δοθέν θ, το όριο θ, στο οποίο ο Ε.Μ.Π. ˆ της παραμέτρου, συγκλίνει, υπό την H, κατά πιθανότητα. Οι Ε.Μ.Π. των παραμέτρων, Παράρτημα Α) i θ θ θ και είναι (βλέπε ˆ l X, (.3.) i και X ˆ i ˆ l, (.3.) i ˆ X. (.3.3) i i Επιπρόσθετα, καθώς E X exp 0.5 θ, προκύπτει ότι: exp 0.5. (.3.4) θ Βήμα ο Υπολογισμός των F l X, θ, G l i i X, i i l X, θ F j j, j,. θ και 45

Οι ποσότητες F και G προκύπτουν εύκολα από τις σχέσεις () και i i (8) του Παραρτήματος Α. Επίσης, είναι και F l X, θ lx, (.3.5) F θ l X, lx Βήμα 3 ο Υπολογισμός της E F G θ.. (.3.6) Είναι, λαμβάνοντας υπόψη τα αποτελέσματα του προηγούμενου βήματος και τις σχέσεις (3), (5) και (6) του Παραρτήματος Α, Βήμα 4 Ο Υπολογισμός του E F G 0.5l 0.5 0.5. (.3.7) θ Z l X,, l X,, i,,. i i i θ θ Είναι από το Βήμα lx lx i i Z,., i,,. i (.3.8) Βήμα 5 ο Υπολογισμός του πίνακα Z ' Z Cov F, F jk j k, jk,,. Είναι δηλαδή θ Z ' Z με συνιστώσες 46

Var F Cov F, F θ θ Z ' Z, Cov F, F Var F θ θ (.3.9) όπου τα F και αντίστοιχα. Είναι F δίνονται στις σχέσεις (.3.5) και (.3.6), l X~ N, Var F Var l X. (.3.0) θ θ lx Επιπρόσθετα, θέτοντας V ~ N(0,), και λαμβάνοντας / υπόψη την Πρόταση 5 του Παραρτήματος Α, προκύπτει ότι: Τέλος, 4 Var F. 4 Var V 4 E V E V θ θ θ θ (.3.) lx Cov F F Cov,,, θ θ lx ή ισοδύναμα, λαμβάνοντας υπόψη την Πρόταση 5 i) του Παραρτήματος Α, 47

3, Cov V V E V E V E V θ θ θ θ Cov F, F 0. (.3.) θ Άρα, συνοψίζοντας και 3/ 3/ 0 ZZ (.3.3) 0 0 ZZ. (.3.4) 0 Βήμα 6 ο Προσδιορισμός του διδιάστατου διανύσματος ZY, j j,, με συνιστώσες Z Y Cov F G, F, j,. Επομένως, j θ j θα βρεθεί το: με F, αντίστοιχα, και Covθ F G, F ZY Cov F G, F θ (.3.5) F όπως υπολογίστηκαν στις σχέσεις (.3.5) και (.3.6), lx X F G lx l l θ. θ (.3.6) Είναι, από τις σχέσεις (.3.5) και (.3.6), 48

l Cov V, V θ, θ Var X Cov V X,, θ Cov F G F θ / / θ (.3.7) lx όπου V ~ N 0,. Λαμβάνοντας υπόψη ότι Var lx / θ, Cov V, V 0 και τη σχέση () του Παραρτήματος Α, προκύπτει θ ότι: Επιπλέον, Cov F G, F =0. (.3.8) θ, /, Cov F G F Cov V V VarV θ θ θ 4 Cov X V θ θ,, (.3.9) lx ~ 0,. Είναι γνωστό ότι Cov V V με V N /, 0 και θ VarV θ και από την Πρόταση 5 iii) του Παραρτήματος Α έχουμε Cov X, V. ότι Επομένως, θ θ Cov F G F,. (.3.0) θ Συνδυάζοντας τα προηγούμενα: 0 ZY (.3.) 49

Βήμα 7 ο Υπολογισμός της στατιστικής συνάρτησης ˆ ˆ ˆ C i i θ θ i i T F θ G ˆ E F θ G Z Z Z Z Y. (.3.) Λαμβάνοντας υπόψη την Παρατήρηση.., οι άγνωστες παράμετροι θ, και θ αντικαθίστανται από τους Ε.Μ.Π. ˆθ, ˆ και θ ˆ, αντίστοιχα. Λαμβάνοντας υπόψη το Βήμα ο προκύπτει, ύστερα από λίγη άλγεβρα, ότι: i ˆ ˆ ˆ ˆ i i F θ G l l ˆ. (.3.3) Επιπλέον, λαμβάνοντας υπόψη την (.3.7), θ i θ ˆ ˆ ˆ E F θ G ˆ l. (.3.4) Είναι, από τις σχέσεις (.3.8), (.3.4) και (.3.), ˆ 0 l X ˆ l X ˆ i 0 i Zi Z Z Z Y ˆ θ θ ˆ ˆ ˆ ˆ 0 ˆ ή ισοδύναμα μετά από λίγη άλγεβρα Άρα, X i X i ˆ ˆ l l ˆ. Z Z Z Z Y (.3.5) i θ ˆ ˆ θ 50

ˆ ˆ Z Z Z Z Y 0. i θ θ ˆ i (.3.6) Επομένως, λαμβάνοντας υπόψη τις σχέσεις (.3.3), (.3.4) και (.3.6), ύστερα από λίγη άλγεβρα, ο αριθμητής της στατιστικής συνάρτησης γίνεται: ˆ l ˆ l ˆ l. θ θˆ (.3.7) Βήμα 8 ο Τέλος, θα υπολογίσουμε την ασυμπτωτική διακύμανση από τη σχέση (..9). Είναι lx X Var F G Var l X. θ θ θ (.3.8) lx ~ 0,, προκύπτει ότι: Θέτοντας V N / VarV θ /, Var F G VarV Var X Cov V V θ θ θ θ 4 / Cov V, X Cov X, V. θ θ θ θ Είναι, λαμβάνοντας υπόψη την Πρόταση 5 του Παραρτήματος Α,, 0, Cov θ X, V /, Cov X, V Cov V V θ και θ θ θ θ Var X e. (.3.9) θ θ 5

Άρα, Var F G e e, (.3.30) θ και με λίγη άλγεβρα ή ισοδύναμα, 0 0 YZ ZZ ZY 0, 0 YZ ZZ ZY. (.3.3) Επομένως, συνδυάζοντας τις σχέσεις (.3.30) και (.3.3), η ασυμπτωτική διακύμανση είναι ίση με e e. (.3.3) Η ασυμπτωτική διακύμανση, όπως δίνεται στη σχέση (.3.3), περιέχει την άγνωστη παράμετρο και δεν μπορεί να υπολογιστεί. Για το λόγο αυτό, στη στατιστική συνάρτηση του Cox (96, 96) που δίνεται στο επόμενο βήμα, η άγνωστη παράμετρος αντικαθίσταται από τον Ε.Μ.Π. ˆ, ο οποίος δόθηκε στη σχέση (.3.). Βήμα 9 ο Υπό την 96) είναι η H, η στατιστική συνάρτηση του Cox (96, 5

T C e ˆ l θ ˆ, (.3.33) ˆ ˆ ˆ η οποία ακολουθεί ασυμπτωτικά, υπό την H, κανονική κατανομή με μέση τιμή μηδέν και διακύμανση ίση με τη μονάδα. Όπως έχουμε αναφέρει, στην πράξη η ανάλυση των μη εμφωλευμένων υποθέσεων πραγματοποιείται λαμβάνοντας ως μηδενική υπόθεση κάθε μία εκ των δύο υποθέσεων εναλλάξ. Έτσι, για να διατυπώσουμε τον κανόνα απόφασης στο παράδειγμά μας θα πρέπει πρώτα να αντιστρέψουμε τους ρόλους της μηδενικής και της εναλλακτικής υπόθεσης, έχοντας ως μηδενική υπόθεση την εκθετική και ως εναλλακτική τη λογαριθμοκανονική κατανομή. Αυτό γίνεται στο παράδειγμα που ακολουθεί. Παράδειγμα.3. Σύμφωνα με τη μεθοδολογία του Cox (96, 96), θα ελέγξουμε τη μηδενική υπόθεση H ότι τα δεδομένα μας προέρχονται από την Exp / έναντι της εναλλακτικής H προέρχονται από την l N, μονοδιάστατη θα εφαρμοστεί η Πρόταση..4. ότι. Καθώς η παράμετρος είναι Βήμα ο Προσδιορίζονται οι Ε.Μ.Π. ˆθ και ˆ των παραμέτρων θ και υπό την δοθέν, το όριο H και H, αντίστοιχα. Επιπλέον, προσδιορίζουμε για θ, στο οποίο ο Ε.Μ.Π. ˆθ της παραμέτρου θ, συγκλίνει, υπό την H, κατά πιθανότητα. 53

Οι Ε.Μ.Π. των ˆθ και ˆ προσδιορίστηκαν στις σχέσεις (.3.), (.3.) και (.3.3), αντίστοιχα. Επιπρόσθετα, υπό την H, οι Ε.Μ.Π. των ˆ και ˆ συγκλίνουν στη μέση τιμή και στη διακύμανση, αντίστοιχα, της τυχαίας μεταβλητής U lx, όπου η τυχαία μεταβλητή X ακολουθεί την Exp / του Παραρτήματος Α προκύπτει ότι: και 54. Από την Πρόταση 4 ii), vi) l, (.3.34). (.3.35) Βήμα ο Υπολογισμός των F l X, θ, G l X, i i i i l X, G. και Οι ποσότητες F και G προκύπτουν εύκολα από τις σχέσεις () και i i (8) του Παραρτήματος Α, ενώ G l X, X. Βήμα 3 ο Υπολογισμός της E G F. (.3.36) Λαμβάνοντας υπόψη ότι E lx l E lx και E X, προκύπτει ότι:, E G F l l. (.3.37)

l,, W X, i,,. Βήμα 4 Ο Υπολογισμός του i i Είναι από το Βήμα X W, i,,. i (.3.38) Βήμα 5 ο Υπολογισμός της Var G, που ισοδυναμεί, σε αυτήν την περίπτωση, με τον προσδιορισμό του πίνακα WW ' της Πρότασης..5. X Var G Var. (.3.39) Βήμα 6 ο Προσδιορισμός της Cov ( G F, G ), που ισοδυναμεί, σε αυτήν την περίπτωση, με τον προσδιορισμό του διανύσματος W ' R, της Πρότασης..5. Επομένως, είναι ή ισοδύναμα l X X X Cov ( G F, G ) Cov l X,, Cov l X, X Cov Cov ( G F, G ) l X, X Var X 3. (.3.40) 55

Από τις Προτάσεις και 4 vii) του Παραρτήματος Α είναι Var X και Cov l X, X. Επίσης, Cov l X, X Cov l X, X Cov l X, X. Από την Πρόταση 4 viii) του Παραρτήματος Α είναι Άρα, Cov l X, X l. Cov l X, X. (.3.4) Επομένως, από τη σχέση (.3.40), λαμβάνοντας υπόψη τα παραπάνω, έπειτα από λίγη άλγεβρα, έχουμε ότι: Cov ( G F, G ). (.3.4) Βήμα 7 ο Υπολογισμός της στατιστικής συνάρτησης ˆ ˆ C ˆ ˆ. θ θ (.3.43) i i i i T G F E G F W W W W R Λαμβάνοντας υπόψη την Παρατήρηση.., οι άγνωστες παράμετροι θ, και θ αντικαθίστανται από τους Ε.Μ.Π. ˆθ, ˆ και θ, αντίστοιχα. ˆ Λαμβάνοντας υπόψη το Βήμα ο προκύπτει, ύστερα από λίγη άλγεβρα, ότι: 56

i ˆ ˆ ˆ ˆ i i G F θ l l ˆ. (.3.44) Επιπλέον, λαμβάνοντας υπόψη την (.3.37) E G F θ l l ˆ. (.3.45) i ˆ ˆ Από τις σχέσεις (.3.38), (.3.39) και (.3.4) προκύπτει ότι: W W W W R x ˆ ˆ ( ' ) '. i ˆ i (.3.46) Οπότε, W ( W ' W ) W ' R ˆ 0. i x (.3.47) ˆ i i ˆ i Άρα, λαμβάνοντας υπόψη τις σχέσεις (.3.44), (.3.45) και (.3.47), ύστερα από λίγη άλγεβρα, ο αριθμητής της στατιστικής συνάρτησης γίνεται: ˆ ˆ l, ˆ ˆ (.3.48) όπου ˆ 0.577 l ˆ και.6449. ˆ Βήμα 8 ο Τέλος, θα υπολογίσουμε την ασυμπτωτική διακύμανση από τη σχέση (.3.36). 57

Είναι R W W W 4 4 ' ( ' ) W ' R. (.3.49) Επιπροσθέτως, lx X Var G F Var l X, (.3.50) που ισούται με Var lx l, Var X Cov X X Var G F Var lx 4 l, l, l Cov X X Cov X X. (.3.5) Στη σχέση (.3.5) θα πρέπει να προσδιοριστεί η ποσότητα Var lx, η οποία είναι ίση με: 4 E lx E lx 4 4 Cov l X,l X. Οπότε, από τη σχέση (.3.5), λαμβάνοντας υπόψη τη σχέση (.3.4) και τις Προτάσεις και 4 vi), vii) του Παραρτήματος Α προκύπτει, έπειτα από λίγη άλγεβρα, ότι: 58

l l 4 E X E X Var G F 4 Όμως, Επομένως, l,l. Cov X X 3 Cov l X,lX E lx E lx E l X. l l 4 E X E X Var G F 4 3 E lx E lx E l X. (.3.5) Συνδυάζοντας τις σχέσεις (.3.49), (.3.5) και λαμβάνοντας υπόψη την Πρόταση 4 ii), iii), iv), v) του Παραρτήματος Α, προκύπτει, έπειτα από λίγη άλγεβρα, ότι η ασυμπτωτική διακύμανση είναι ίση με 0.834. 4 (.3.53) Βήμα 9 ο Υπό την H, η στατιστική συνάρτηση του Cox (96, 96) είναι η 59

ˆ ˆ l ˆ C ˆ T, (.3.54) 0.533 η οποία ακολουθεί ασυμπτωτικά, υπό την H, κανονική κατανομή με μέση τιμή μηδέν και διακύμανση ίση με τη μονάδα. Κανόνας απόφασης (βλέπε Sayyareh et al. (00)) C C i) Απορρίπτουμε και τις δύο κατανομές αν T z και T z. ii) Δεν απορρίπτουμε κάποια από τις δύο κατανομές αν C T z και T z. C iii) Αποδεχόμαστε την εκθετική ενώ απορρίπτουμε την C C λογαριθμοκανονική αν T z και T z. iv) Αποδεχόμαστε την λογαριθμοκανονική ενώ απορρίπτουμε την C C εκθετική αν T z και T z. Πριν ολοκληρωθεί αυτό το κεφάλαιο, θέλουμε να αναφέρουμε ότι ο παραπάνω έλεγχος αποτέλεσε αντικείμενο μελέτης, μεταξύ άλλων, από τον Jackso (968). Στο πλαίσιο της μελέτης της σύγκλισης της σ.σ. στην κανονική κατανομή, ο Jackso (968) έγραψε τη στατιστική συνάρτηση της σχέσης (.3.33) στη C T q ˆ, ˆ, ˆ. Έπειτα, προσέγγισε την αναμενόμενη τιμή μορφή της στατιστικής συνάρτησης C T υπό τη λογαριθμοκανονική κατανομή (υπόθεση H ), αναπτύσσοντας κατά Taylor τη q ˆ, ˆ, ˆ γύρω από το σημείο,, και παίρνοντας συνάρτηση 60

την αναμενόμενη τιμή της επέκτασης αυτής. Έτσι, λοιπόν, προέκυψε η εξής προσέγγιση για την αναμενόμενης τιμή της στατιστικής συνάρτησης T : E T C e. e Όσον αφορά τη διακύμανση της στατιστικής συνάρτησης T C, μια ανάλογη ανάπτυξη, σύμφωνα με τον Jackso (968), καταλήγει σε μια αρκετά περίπλοκη έκφραση, η οποία συγκλίνει με πολύ αργό ρυθμό. Με παρόμοιο τρόπο, για την περίπτωση όπου η εκθετική κατανομή συνιστά τη μηδενική υπόθεση, ο Jackso (968) προσέγγισε την αναμενόμενη τιμή της στατιστικής συνάρτησης της σχέσης (.3.54) υπό την εκθετική κατανομή. Ειδικότερα, αναπτύσσοντας κατά Taylor τη συνάρτηση ˆ, ˆ, ˆ ˆ l ˆ l ˆ, που εμφανίζεται στον παρονομαστή της σχέσης (.3.54), γύρω από το σημείο,,,, και παίρνοντας την αναμενόμενη τιμή της επέκτασης αυτής, προέκυψε η εξής προσέγγιση για την αναμενόμενη τιμής της στατιστικής συνάρτησης C T : E T C.067 0.5. 0.534 4 C T 6

C Όσον αφορά τη διακύμανση της στατιστικής συνάρτησης T, μια ανάλογη ανάπτυξη καταλήγει και πάλι σε μια αρκετά περίπλοκη έκφραση, η οποία συγκλίνει με πολύ αργό ρυθμό. Επιπρόσθετα, ο Jackso (968) υπολόγισε την ισχύ των στατιστικών συναρτήσεων C T και C T για τον έλεγχο της λογαριθμοκανονικής κατανομής έναντι της εκθετικής κατανομής, υποθέτοντας ότι οι κατανομές τους υπό τις αντίστοιχες εναλλακτικές είναι κανονικές, μια υπόθεση δεσμευτική. C Για να υπολογιστεί η ισχύς της στατιστικής συνάρτησης T απαιτείται η εύρεση της αναμενόμενης τιμής και της διακύμανσής της υπό την εναλλακτική υπόθεση H, δηλαδή όταν τα δεδομένα ακολουθούν εκθετική κατανομή. Ο Jackso (968) αναπτύσσοντας q ˆ, ˆ, ˆ γύρω από το σημείο κατά Taylor τη συνάρτηση,,,, και παίρνοντας την αναμενόμενη τιμή και τη διακύμανση της επέκτασης αυτής υπό την H, βρήκε ότι 3 C E T H 0.55.7/ O και C Var T H 0.473 O. Καθώς, υπό την C H, η στατιστική συνάρτηση T είναι αρνητική, και λαμβάνοντας υπόψη τον Πίνακα, προκύπτει ότι η C περιοχή απόρριψης του δίπλευρου ελέγχου είναι T z, με / επίπεδο σημαντικότητας. Επομένως, η ισχύς είναι: 6

C C P T z T ~ N /, z 0.55.7/ / PZ 0.473.6055z 0.5876 4.487, / όπου z είναι το εκατοστιαίο σημείο της τυπικής κανονικής. Με παρόμοιο τρόπο και αναπτύσσοντας κατά Taylor τη ˆ, ˆ, ˆ γύρω από το σημείο,, θ, ο Jackso συνάρτηση (968) παίρνοντας την αναμενόμενη τιμή και τη διακύμανση της επέκτασης αυτής κάτω από την H, βρήκε ότι 3 E T H e O και C.8783 l 0.383 3 C Var T H 3.59 e O. Καθώς, υπό την C H, η στατιστική συνάρτηση T είναι αρνητική, και λαμβάνοντας υπόψη τον Πίνακα, προκύπτει ότι η C περιοχή απόρριψης του δίπλευρου ελέγχου είναι T z, με / επίπεδο σημαντικότητας. Επομένως, η ισχύς είναι: 63

C C P T z T ~ N /, z.8783 l 0.383 3e P Z 3.59 e z 0.939 / l 0.6566 3.59 e. Περαιτέρω σχολιασμός των ιδιοτήτων και της συμπεριφοράς της στατιστικής συνάρτησης του Cox (96, 96) θα δοθούν στο Κεφάλαιο 7. 64

ΚΕΦΑΛΑΙΟ 3 Μεθοδολογία του Atkiso (970) Στο προηγούμενο κεφάλαιο παρουσιάστηκε η μεθοδολογία του Cox (96, 96) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων, που περιγράφηκε στο Κεφάλαιο. Εκτός από αυτήν τη μέθοδο, ο Cox (96, 96) παρέθεσε και κάποιες άλλες ιδέες για την αντιμετώπιση του προβλήματος. Μία από αυτές ήταν η προσέγγιση του περιεκτικού μοντέλου (comprehesive model approach). Η προσέγγιση αυτή βασίζεται στο συνδυασμό των δύο μοντέλων σε ένα γενικό μοντέλο, του οποίου τα δύο υποψήφια μοντέλα αποτελούν ειδικές περιπτώσεις. Παρακινούμενος από αυτήν τη σκέψη, o Atkiso (970) ανέπτυξε ένα στατιστικό τεστ για τον έλεγχο των μη εμφωλευμένων μοντέλων, το οποίο απέδειξε ότι είναι ασυμπτωτικά ισοδύναμο, υπό τη μηδενική υπόθεση, με το αντίστοιχο του Cox (96, 96). Η μέθοδος αυτή αποτελεί το αντικείμενο μελέτης αυτού του κεφαλαίου. Στο πλαίσιο αυτό, στην Παράγραφο 3. παρατίθενται κάποιες εισαγωγικές έννοιες και ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί. Στη συνέχεια, στην Παράγραφο 3. παρουσιάζεται η μεθοδολογία του Atkiso (970) και αποδεικνύεται ότι οι ελεγχοσυναρτήσεις των Atkiso (970) και Cox (96, 96) είναι ασυμπτωτικά ισοδύναμες, υπό τη μηδενική υπόθεση. Τέλος, στην Παράγραφο 3.3, η μέθοδος αποσαφηνίζεται μέσω της εφαρμογής της για τον έλεγχο της υπόθεσης αν ένα τ.δ. μπορεί να θεωρηθεί ότι προέρχεται είτε από την λογαριθμοκανονική

είτε από την εκθετική κατανομή, μη γνωρίζοντας ποια από τις δύο τίθεται στη μηδενική υπόθεση και ποια στην εναλλακτική. 3. Εισαγωγή Στην παράγραφο αυτή για τη διευκόλυνση της μελέτης του κεφαλαίου, δίνονται κάποιες εισαγωγικές έννοιες και ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί. Εκτός από τη μέθοδο που λεπτομερώς παρουσιάστηκε στο προηγούμενο κεφάλαιο, ο Cox (96, 96) παρέθεσε και κάποιες άλλες ιδέες για την αντιμετώπιση του προβλήματος που περιγράφηκε στο Κεφάλαιο. Ειδικότερα, πρότεινε τη θεώρηση ενός γενικού μοντέλου, που κατασκευάζεται έτσι ώστε να συνδυάζει τις δύο κατανομές και από το οποίο προκύπτει καθεμία απ αυτές ως ειδική περίπτωση. Στο πλαίσιο αυτό, ο Cox (96, 96) πρότεινε την υιοθέτηση του μοντέλου με σ.π.π. που δίνεται από τη σχέση: c, θ, γ, θ, γ x x x, z z dz (3..) όπου είναι η λεγόμενη παράμετρος μίξης, με 0,, και αντιπροσωπεύει το βάρος που αντιστοιχεί στην υπόθεση x, θ. Εύκολα προκύπτει ότι όταν έχουμε ότι c x x, θ, ενώ έχουμε ότι, 0 όταν 0 c x x γ. 66

Παρατήρηση 3.. α) Στη σχέση (3..) χρησιμοποιήθηκε μια εκθετική μίξη των x, θ και, x γ. Η υιοθέτηση αυτής της μίξης αποτελεί μία αιτία κριτικής αυτής της μεθόδου (βλέπε, μεταξύ άλλων, ενότητα σχολίων στην εργασία του Atkiso (970) και Perasa (98)). Εναλλακτικά, έχει προταθεί να χρησιμοποιηθεί μια γραμμική μίξη αυτών (βλέπε σχέση () του Atkiso (970, σελ. 34)), καθώς και ένας συνδυασμός των δύο αυτών μίξεων (βλέπε Perasa (98)). β) Όπως επισημαίνει ο Quadt (97), το ολοκλήρωμα που δίνεται στον παρονομαστή της σχέσης (3..) γενικά δεν είναι άμεσα υπολογίσιμο, παρά μόνο με αριθμητικές μεθόδους. Αυτό συνεπάγεται ότι η μεγιστοποίηση της αντίστοιχης πιθανοφάνειας είναι κάποιες φορές δύσκολη. Από όσα προηγήθηκαν, προκύπτει ότι αντί να ελέγξουμε αν το τ.δ. X,, X περιγράφεται ικανοποιητικά από την x, θ έναντι της x, γ ή αντίστροφα, θα ελέγξουμε μία κατάλληλα διατυπωμένη υπόθεση για την τιμή της παραμέτρου. Επομένως, ο έλεγχος ανάγεται στον έλεγχο μιας ισοδύναμης υπόθεσης για την παράμετρο, ενώ οι τιμές των παραμέτρων θ και γ δεν καθορίζονται υπό την προς έλεγχο υπόθεση. Αυτό σημαίνει ότι οι παράμετροι θ και γ είναι ενοχλητικές (uisace) παράμετροι. Οι Bartlett (953) και Neyma (959), ανεξάρτητα ο ένας από τον άλλο, πρότειναν μια ασυμπτωτικά κανονική στατιστική συνάρτηση για τον έλεγχο της τιμής μιας παραμέτρου, στην παρουσία άλλων ενοχλητικών παραμέτρων. Η μέθοδος αυτή ουσιαστικά εφαρμόζεται από τον Atkiso (970) για το υπό μελέτη πρόβλημα και η εφαρμογή της αποτελεί αντικείμενο μελέτης της επόμενης ενότητας. Για λόγους πληρότητας στη συνέχεια 67

παρατίθεται η μέθοδος των Bartlett (953) και Neyma (959) (βλέπε και Mora (970)). Έστω X,, X ένα τ.δ. από έναν πληθυσμό με σ.π.π. c x, ψ, όπου,,, k ψ και θέλουμε να ελέγξουμε την υπόθεση H :. Ο Neyma (959) πρότεινε να 0 0 χρησιμοποιηθεί η στατιστική συνάρτηση k L L T, N (3..) j j j i i όπου με L συμβολίζεται ο λογάριθμος της συνάρτησης πιθανοφάνειας,, i,, k είναι οι αληθινές τιμές των i ενοχλητικών παραμέτρων, L i είναι η παράγωγος του λογαρίθμου της συνάρτησης πιθανοφάνειας ως προς, για, ενώ L 0 j i είναι η παράγωγος του λογαρίθμου της συνάρτησης πιθανοφάνειας ως προς, j,, k, για τις αληθινές j τιμές των ενοχλητικών παραμέτρων. Επιπλέον, είναι οι j συντελεστές παλινδρόμησης του πρώτου όρου ως προς τους άλλους, όπως εκτιμώνται από τις δεύτερης τάξης παραγώγους. Δηλαδή, οι συντελεστές αυτοί προκύπτουν από την επίλυση των k το πλήθος εξισώσεων k L L E 0, s,, k. (3..3) j s j j s 68

Είναι προφανές ότι η στατιστική συνάρτηση της σχέσης (3..) δεν μπορεί να χρησιμοποιηθεί για την κατασκευή ενός στατιστικού τεστ, καθώς εξαρτάται από τις άγνωστες παραμέτρους, i,, k. i Παρόλα αυτά, ο Neyma (959) απέδειξε ότι αν αντικατασταθούν οι άγνωστες παράμετροι,, k από τους τάξης συνεπείς εκτιμητές, έστω ˆ, ˆ, ˆ, τότε, για μεγάλα μεγέθη δείγματος, η 3 k στατιστική συνάρτηση που προκύπτει, έστω T, είναι στοχαστικά N ισοδύναμη με τη στατιστική συνάρτηση T. Επιπρόσθετα, ο Neyma N / (959) απέδειξε ότι η στατιστική συνάρτηση T Var N T N ακολουθεί ασυμπτωτικά τυπική κανονική κατανομή. Η παραπάνω μεθοδολογία εφαρμόστηκε στο πλαίσιο των μη εμφωλευμένων μοντέλων από τον Atkiso (970). Η μέθοδος αυτή, η οποία ισχύει υπό τις συνθήκες που δίδονται στο Παράρτημα Β, αποτελεί το αντικείμενο μελέτης της επόμενης ενότητας. 3. Η Μεθοδολογία Στην ενότητα αυτή θα παρουσιαστεί η μεθοδολογία του Atkiso (970), όπως αυτή προκύπτει με εφαρμογή της μεθόδου που προτάθηκε από τους Bartlett (953) και Neyma (959) για τον έλεγχο της υπόθεσης ότι μια παράμετρος είναι ίση με δοθείσα τιμή, όταν υπάρχουν ενοχλητικές παράμετροι. Επιπλέον, θα αποδειχθεί ότι οι ελεγχοσυναρτήσεις των Atkiso (970) και Cox (96, 96) είναι ασυμπτωτικά ισοδύναμες, υπό τη μηδενική υπόθεση. Για λόγους απλότητας, αρχικά, σε όσα ακολουθούν υποθέτουμε ότι οι παράμετροι και είναι μονοδιάστατες, δηλαδή ότι R και R. 69

Από όσα προηγήθηκαν στην προηγούμενη ενότητα γίνεται αντιληπτό ότι ο έλεγχος της υπόθεσης αν το τ.δ. X,, X προέρχεται από την οικογένεια κατανομών H, με κατεύθυνση προς την υπόθεση H, ανάγεται σε ένα πρόβλημα ελέγχου αν η παράμετρος είναι ίση με δοθείσα τιμή, ενώ οι υπόλοιπες παράμετροι, 3, είναι ενοχλητικές, υπό την θεώρηση ότι το τ.δ. προέρχεται από έναν πληθυσμό με σ.π.π. όπως ορίστηκε στη σχέση (3..). Στο σημείο αυτό επισημαίνεται ότι ο έλεγχος αυτός δεν είναι ισοδύναμος με τον αρχικό έλεγχο, καθώς η απόρριψη της υπόθεσης δεν συνεπάγεται την υιοθέτηση του μοντέλου και για αυτό το λόγο απαιτείται η αντιστροφή των ρόλων των και H. Ο λογάριθμος της συνάρτησης πιθανοφάνειας L για μία παρατήρηση, έστω X, είναι i i i L l x, l x, l z, z, dz. H Με βάση τη σ.σ. της σχέσης (3..) θα πρέπει, αρχικά, να προσδιοριστούν οι μερικές παράγωγοι L, L και L, κι έπειτα να υπολογιστούν για τις αληθινές τιμές των και και για. Υποθέτοντας ότι μπορούμε να αντιστρέψουμε τη σειρά της παραγώγισης με την ολοκλήρωση έχουμε: 70

, l,,,, l, z z z z z z dz L z, z, dz l x, l x,, i i L z z z dz l x, i,,, z, z, dz l x,, i και z, z, z, dz L z, z, dz l x,. i Υπό την υπόθεση ότι και χρησιμοποιώντας τους συμβολισμούς των (..4) και (..5), προκύπτει ότι: L, F G E F G, i i L, Fi, και L, 0. Επιπλέον, για, χρησιμοποιώντας τους συμβολισμούς των σχέσεων (..4) και (..5), έπειτα από λίγη άλγεβρα, προκύπτει ότι ο συντελεστής είναι ίσος με 7

7,. L E Cov F G F Var F L E Άρα,,,, N i i i i Cov F G F T F G E F G F Var F και,. N Cov F G F Var T Var F G Var F Συνδυάζοντας τα παραπάνω, καταλήγουμε στην ακόλουθη πρόταση: Πρόταση 3.. (Atkiso (970)) Έστω,, X X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π., x υπό την H και, x υπό την H, με R και R. Η στατιστική συνάρτηση,., ~ 0,,, i i i i A H Cov F G F F G E F G F Var F T N Cov F G F Var F G Var F (3..)

όπου F, F και G, οι ποσότητες όπως αυτές ορίστηκαν στις i i, i σχέσεις (..4) και (..5). A Είναι προφανές ότι η στατιστική συνάρτηση T εξαρτάται από τις άγνωστες παραμέτρους και κι επομένως, για να χρησιμοποιηθεί στην πράξη, σύμφωνα με τον Neyma (959), αρκεί να αντικατασταθούν με εκτιμητές που είναι συνεπείς τάξης. Στο πλαίσιο αυτό, ο Atkiso (970) προτείνει την αντικατάσταση της παραμέτρου, από τον Ε.Μ.Π. ˆ ο οποίος, λόγω των συνθηκών του Παραρτήματος Β, ικανοποιεί τη σχέση: Fi, ˆ i 0. Όσον αφορά, όμως, την εκτίμηση της παραμέτρου, υπό την υπόθεση ότι, η συνάρτηση πιθανοφάνειας είναι ανεξάρτητη της και δεν μπορεί να χρησιμοποιηθεί η μέθοδος της Μέγιστης Πιθανοφάνειας. Το πρόβλημα αυτό είναι γνωστό στη βιβλιογραφία ως πρόβλημα του Davies (977) και αντιμετωπίζεται υπολογίζοντας τον Ε.Μ.Π. της, έστω ˆ, όταν 0, δηλαδή υπό την H. Τότε προτείνεται η αντικατάσταση της άγνωστης παραμέτρου από την, όπου με ˆ συμβολίζεται το όριο στο οποίο συγκλίνει, υπό την H, ο Ε.Μ.Π. ˆ. Οπότε, ο αριθμητής της στατιστικής συνάρτησης (3..) γίνεται: ˆ ˆ ˆ ˆ T F ˆ G E F ˆ G. (3..) A i i i Παρατήρηση 3.. Σύμφωνα με τις (3..) και (3..) το στατιστικό του Atkiso (970) για τον έλεγχο μη εμφωλευμένων υποθέσεων είναι πανομοιότυπο με το στατιστικό του Cox (96,96). 73

Συγκεκριμένα, ο αριθμητής του στατιστικού του Cox (96, 96) δίνεται από τη σχέση: ˆ ˆ ˆ ˆ T ˆ F G ˆ E F G. (3..3) C i i i Η διαφοροποίηση έγκειται στο γεγονός ότι υπό την H, ο αριθμητής του στατιστικού του Atkiso (970) έχει αναμενόμενη τιμή ίση με το μηδέν, αν η πραγματική τιμή της παραμέτρου είναι γνωστή, ενώ ο αριθμητής του στατιστικού του Cox (96, 96) έχει αυτήν την ιδιότητα μόνο ασυμπτωτικά, καθώς ο ˆ συγκλίνει κατά πιθανότητα στο. Επιπλέον, όταν η άγνωστη παράμετρος εκτιμάται, κανένα από τα δύο στατιστικά δεν είναι αμερόληπτα, και μάλιστα προκύπτει ότι το ποσό μεροληψίας του στατιστικού του Atkiso (970) είναι μικρότερο (βλέπε Atkiso (970), σελ. 335). Όπως αναφέρθηκε στην προηγούμενη παρατήρηση, οι στατιστικές συναρτήσεις των Cox (96, 96) και Atkiso (970) διαφοροποιούνται μόνο ως προς τον τρόπο εκτίμησης της άγνωστης παραμέτρου. Ωστόσο, προκύπτει, όπως θα αποδειχθεί στην επόμενη πρόταση, ότι είναι ασυμπτωτικά ισοδύναμες, υπό τη μηδενική υπόθεση. Θεώρημα 3.. (Atkiso (970)) Οι στατιστικές συναρτήσεις των Atkiso (970) και Cox (96, 96) είναι ασυμπτωτικά ισοδύναμες, υπό τη μηδενική υπόθεση. 74

Απόδειξη (Atkiso (970)) Θεωρούμε τη διαφορά των αριθμητών των δύο στατιστικών συναρτήσεων: C ˆ ˆ A i i i ˆ ˆ. (3..4) T T G G Αναπτύσσοντας κατά Taylor την ποσότητα Gi ˆ σχέση (3..4) γίνεται: γύρω από το ˆ, η T T G G C ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ A i i i i Καθώς ˆ είναι ο Ε.Μ.Π. της παραμέτρου, λόγω των συνθηκών του Παραρτήματος Β, ισχύει ότι: G ˆ 0. Άρα, i i C T ˆ T ˆ ˆ ˆ G ˆ. (3..5) A i i Είναι γνωστό (βλέπε Λήμμα...) ότι: Var ˆ G ˆ. i (3..6) i 75

συγκλίνει κατά Επομένως, η ποσότητα ˆ ˆ G ˆ i πιθανότητα στο μηδέν. A i Επιπρόσθετα, οι ποσότητες T C ˆ και T ˆ συγκλίνουν κατά πιθανότητα στο μηδέν, είναι δηλαδή τάξης κατά πιθανότητα, οπότε οι δύο στατιστικές συναρτήσεις είναι ασυμπτωτικά ισοδύναμες, υπό τη μηδενική υπόθεση. Παρατήρηση 3.. Ο Pereira (977, σελ. ) παρατήρησε ότι παρότι υπό την μηδενική υπόθεση τα δύο στατιστικά τεστ είναι ασυμπτωτικά ισοδύναμα, δεν υπάρχει λόγος να αναμένουμε να έχουν ίδια συμπεριφορά υπό την εναλλακτική υπόθεση. Επιπλέον, ο Pereira (977) απέδειξε ότι εν αντιθέσει με το τεστ του Cox (96, 96), το τεστ του Atkiso (970) δεν είναι πάντοτε συνεπές και ο Dastoor (983) δίνει επαρκή και αναγκαία συνθήκη έτσι ώστε να είναι. Τέλος, εν αντιθέσει με το τεστ του Cox (96, 96), το τεστ του Atkiso (970) δεν συγκλίνει κατά πιθανότητα πάντοτε σε μια αρνητική τιμή και για αυτό το λόγο, όπως επισημαίνει ο Dastoor (983) πρέπει να χρησιμοποιείται δίπλευρος έλεγχος. Σε όσα προηγήθηκαν, το ενδιαφέρον επικεντρώθηκε στην εύρεση ενός τρόπου ελέγχου έχοντας ως μηδενική υπόθεση την και εναλλακτική την 76 H H, υπό τις υποθέσεις ότι X,, X είναι ανεξάρτητες και ισόνομες τυχαίες μεταβλητές και οι άγνωστες παράμετροι και είναι τέτοιες ώστε R και R. Τα αποτελέσματα αυτά είναι δυνατό να γενικευτούν θεωρώντας είτε ότι,, X X είναι ανεξάρτητες άλλα όχι και ισόνομες τυχαίες μεταβλητές, είτε ότι οι άγνωστες παράμετροι είναι διανυσματικές.

Καθώς στη μεταπτυχιακή αυτή διατριβή το ενδιαφέρον επικεντρώνεται μόνο στην περίπτωση που οι X,, X είναι ανεξάρτητες και ισόνομες τυχαίες μεταβλητές, για λόγους πληρότητας παρατίθενται τα αποτελέσματα της δεύτερης γενίκευσης. Πρόταση 3.. (Atkiso (970)) Έστω X,, X ένα τ.δ. από έναν πληθυσμό με σ.π.π. x, θ υπό την x γ υπό την H, με H και, θ R p και γ. Η στατιστική συνάρτηση ˆ ˆ θˆ θ θˆ A i i i i T F θ G γ E F θ G γ Z Z Z Z Y (3..7) ακολουθεί, υπό την H, ασυμπτωτικά κανονική κατανομή με μέση τιμή μηδέν και διακύμανση:, Var F G Y Z Z Z Z Y θ (3..8) όπου Y, Z, Z Z και ZY οι ποσότητες όπως αυτές ορίστηκαν στις i σχέσεις (..30), (..3), (..34) και (..3.5) αντίστοιχα, με l, θ, G l x, θ F x l x, θ γ και F, j,, p. j Τέλος, η ενότητα αυτή ολοκληρώνεται με την παράθεση των αντίστοιχων προτάσεων όταν το ενδιαφέρον επικεντρώνεται στην εύρεση ενός τρόπου ελέγχου έχοντας ως μηδενική υπόθεση την και εναλλακτική την H. 77 j H

Πρόταση 3..3 (Atkiso (970)) Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π. x, υπό την H και x, υπό την H, με R και R. Η στατιστική συνάρτηση ˆ ˆ ˆ ˆ ˆ T L L E L L (3..9) A ακολουθεί, υπό την H, ασυμπτωτικά κανονική κατανομή με μέση τιμή μηδέν και διακύμανση Var G F Cov G F, G Var G, (3..0) υπό τον όρο ότι αυτή είναι θετική, με F, G και G οι ποσότητες όπως αυτές ορίστηκαν στις σχέσεις (..4) και (..5), αντίστοιχα. Πρόταση 3..4 (Atkiso (970)) Έστω X,, X ένα τ.δ. από έναν πληθυσμό με σ.π.π. X, θ υπό την X γ υπό την H, με H και, θ και γ R p. Η στατιστική συνάρτηση ˆ ˆ ˆ ˆ A i i γ γ γ i i T G γ F θ E G γ F θ W W W W R (3..) ακολουθεί, υπό την H, ασυμπτωτικά κανονική κατανομή με μέση τιμή μηδέν και διακύμανση: 78

Var G F RW W W W R, (3..) γ όπου R, W, W W και WR οι ποσότητες όπως αυτές ορίστηκαν i στις σχέσεις (..4), (..4), (..43) και (..44), αντίστοιχα, με l, γ, F l x, γ G x l x, γ θ και G, j,, p. j Παρατήρηση 3..3 α) Η στατιστική συνάρτηση του Atkiso (970) και η ασυμπτωτική διακύμανσή της, όπως αυτές προσδιορίστηκαν σε καθεμία από τις παραπάνω προτάσεις, εξαρτώνται από τις άγνωστες παραμέτρους θ και γ. Είναι προφανές ότι για την εφαρμογή της μεθοδολογίας οι παράμετροι θ και γ αντικαθίστανται από τους εκτιμητές ˆθ και αντίστοιχα. j γ ( ή ˆθ θ και ˆγ ), ˆγ β) Σύμφωνα με τον Atkiso (970, σελ. 335), όταν εκτιμάται η άγνωστη παράμετρος θ, οι στατιστικές συναρτήσεις των Cox (96, 96) και Atkiso (970), υπό την H, δεν είναι αμερόληπτες, με τη σ.σ. του Atkiso (970) να είναι περισσότερο αμερόληπτη από αυτή του Cox (96, 96). Αυτό έχει ως συνέπεια η ασυμπτωτική διακύμανση που δίνεται στη σχέση (3..8) να προσεγγίζεται πιο γρήγορα για τη σ.σ. A T από ότι για την C T, καθώς θεωρητικά η διακύμανση αυτή υπολογίστηκε υποθέτοντας ότι και οι δύο σ.σ. είναι αμερόληπτες. 3.3 Ειδική Περίπτωση Στην ενότητα αυτή θα αποσαφηνιστεί η μεθοδολογία του Atkiso (970) στην περίπτωση που τα δύο μη εμφωλευμένα 79

μοντέλα είναι αυτά της λογαριθμοκανονικής και της εκθετικής κατανομής (βλέπε ενότητα.3). Καθώς δεν ξέρουμε ποια από τις δύο κατανομές είναι αυτή που τίθεται στη μηδενική υπόθεση και ποια αυτή που τίθεται στην εναλλακτική, στη συνέχεια εναλλάσσονται οι ρόλοι αυτοί στα δύο παραδείγματα που ακολουθούν. Παράδειγμα 3.3. Ακολουθώντας τη μεθοδολογία του Atkiso (970) στο παράδειγμα αυτό θα ελεγχτεί η μηδενική υπόθεση ότι τα δεδομένα προέρχονται από τη λογαριθμοκανονική κατανομή έναντι της εναλλακτικής ότι προέρχονται από την εκθετική κατανομή. Βήμα ο Βήμα 3 ο Όμοια με το Βήμα ο Βήμα 3 ο της μεθοδολογίας του Cox (96, 96), προσδιορίζονται οι Ε.Μ.Π. ˆθ και ˆ των παραμέτρων θ και υπό την H και H, αντίστοιχα. Επίσης, προσδιορίζεται για δοθέν θ, το όριο θ, στο οποίο ο Ε.Μ.Π. ˆ της παραμέτρου, συγκλίνει, υπό την H, κατά πιθανότητα. Τέλος, προσδιορίζονται οι ποσότητες F l x, θ, G l i i x, i i E F G θ. και η Βήμα 4 ο Υπολογισμός του αριθμητή της εκάστοτε στατιστικής συνάρτησης που θα χρησιμοποιηθεί με βάση όσα διατυπώθηκαν στις Προτάσεις 3.. και 3.., ανάλογα με τη διάσταση της παραμέτρου υπό την H. Επομένως, απαιτείται ο υπολογισμός του ˆ ˆ A i i θ θ i T F θˆ G E F θ ˆ G. (3.3.) 80

Από το βήμα ο της μεθοδολογίας του Cox (96, 96), κι έπειτα από λίγη άλγεβρα, προκύπτει ότι: ˆ ˆ ˆ i i ˆ ˆ F θ G l l. (3.3.) ˆ θ θ i θˆ Άρα, συνδυάζοντας τις σχέσεις (3.3.) και (.3.9) είναι: ˆ ˆ A ˆ T e ˆ 0.5 l. ˆ θ θˆ ˆ ˆ ˆ θ (3.3.3) Βήμα 5 ο Υπολογισμός της ασυμπτωτικής διακύμανσης της στατιστικής συνάρτησης που χρησιμοποιήθηκε στο προηγούμενο βήμα. Αυτή ισούται με αυτή της στατιστικής συνάρτησης του Cox (96, 96) και όπως έχει αποδειχθεί στο Παράδειγμα.3. δίνεται από τη σχέση: e. (3.3.4) Βήμα 6 ο Προσδιορισμός της στατιστικής συνάρτησης ελέγχου, λαμβάνοντας υπόψη και την Παρατήρηση 3.. α). Για τον έλεγχο της υπόθεσης ότι το τυχαίο δείγμα προέρχεται από τη λογαριθμοκανονική κατανομή χρησιμοποιούμε τη στατιστική συνάρτηση: 8

T A e ˆ ˆ θˆ ˆ ˆ, (3.3.5) η οποία, υπό την κατανομή. H, ακολουθεί ασυμπτωτικά τυπική κανονική Παράδειγμα 3.3. Όμοια με το Παράδειγμα.3., σύμφωνα με τη μεθοδολογία του Atkiso (970), θα ελέγξουμε τη μηδενική υπόθεση ότι τα δεδομένα μας προέρχονται από την εκθετική κατανομή έναντι της εναλλακτικής ότι προέρχονται από τη λογαριθμοκανονική κατανομή. Βήμα ο Βήμα 3 ο Όμοια με το Βήμα ο -3 ο της μεθοδολογίας του Cox (96, 96), προσδιορίζονται οι Ε.Μ.Π. ˆθ και ˆ των παραμέτρων θ και υπό την με H και H, αντίστοιχα. Επίσης, προσδιορίζεται για δοθέν, το όριο θ, στο οποίο ο Ε.Μ.Π. ˆθ της παραμέτρου θ, συγκλίνει, υπό την H, κατά πιθανότητα. Τέλος, προσδιορίζονται οι ποσότητες F l x, θ, G l i i x, i i και η E G F. Βήμα 4 ο Υπολογισμός του αριθμητή της στατιστικής συνάρτησης του Atkiso (970), που δίνεται από τη σχέση θ ˆ θ ˆ ˆ θ ˆ T G ˆ F E G ˆ F. A i i i 8

Προκύπτει, με λίγη άλγεβρα, από τις σχέσεις (.3.5), (.3.6), (.3.43) και λαμβάνοντας υπόψη ότι ˆ i i l X ˆ 0, ότι: και ˆ ˆ A ˆ ˆ ˆ T θ ˆ. (3.3.6) Βήμα 5 ο Υπολογισμός της ασυμπτωτικής διακύμανσης του θ ˆ θ ˆ ˆ θ ˆ T G ˆ F E G ˆ F. A i i i Η διακύμανση αυτή είναι ίση με αυτή της στατιστικής συνάρτησης του Cox (96, 96) και όπως έχει αποδειχθεί στο παράδειγμα.3. δίνεται από τη σχέση 0.834. 4 (3.3.7) Βήμα 6 ο Προσδιορισμός της στατιστικής συνάρτησης ελέγχου. Για τον έλεγχο της υπόθεσης ότι το τυχαίο δείγμα προέρχεται από την εκθετική κατανομή χρησιμοποιούμε τη στατιστική συνάρτηση A T ˆ ˆ ˆ ˆ ˆ, (3.3.8) 0.53/ 83

η οποία, υπό την κατανομή. H, ακολουθεί ασυμπτωτικά τυπική κανονική Κανόνας απόφασης: Έχοντας, πλέον, λάβει ως μηδενική υπόθεση κάθε μία εκ των δύο υποθέσεων, τη λογαριθμοκανονική και την εκθετική, εναλλάξ, ο κανόνας απόφασης προσδιορίζεται όπως έχει διατυπωθεί στον Πίνακα της ενότητας. με κατάλληλη αντικατάσταση και λαμβάνοντας υπόψη την Παρατήρηση 3... Πιο συγκεκριμένα: i) Αν ii) Αν iii) Αν iv) Αν A T A T A T A T απορρίπτουμε τη λογαριθμοκανονική κατανομή. z αποδεχόμαστε τη λογαριθμοκανονική κατανομή. z απορρίπτουμε την εκθετική κατανομή. z αποδεχόμαστε την εκθετική κατανομή. z 84

ΚΕΦΑΛΑΙΟ 4 Μεθοδολογία των Epps et al. (98) Στο κεφάλαιο αυτό θα παρουσιαστεί η μεθοδολογία των Epps et al. (98) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Η μεθοδολογία αυτή βασίζεται στην εμπειρική ροπογεννήτρια συνάρτηση. Στο πλαίσιο αυτό, στην Παράγραφο 4. παρατίθενται κάποιες εισαγωγικές έννοιες και ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί. Στη συνέχεια, στην Παράγραφο 5. παρουσιάζεται η μεθοδολογία των Epps et al. (98), ενώ στην Παράγραφο 5.3 η μέθοδος αποσαφηνίζεται μέσω του ελέγχου της υπόθεσης αν ένα τ.δ μπορεί να θεωρηθεί ότι προέρχεται είτε από την λογαριθμοκανονική είτε από την εκθετική κατανομή. 4. Εισαγωγή Στην ενότητα αυτή, χρησιμοποιώντας το συμβολισμό του δευτέρου κεφαλαίου και υπό της συνθήκες του Παραρτήματος Β, παρατίθενται κάποιες εισαγωγικές έννοιες χρήσιμες για την παρουσίαση της μεθοδολογίας των Epps et al. (98). Καθώς η μεθοδολογία που προτάθηκε από τον Cox (96, 96) είχε διαπιστωθεί με μελέτες προσομοίωσης (βλέπε Pereira (977) και Κεφάλαιο 7 της μεταπτυχιακής διατριβής) ότι δε δίνει πάντοτε καλά αποτελέσματα, οι Epps et al. (98) πρότειναν μια εναλλακτική μεθοδολογία που στηρίζεται στην εμπειρική ροπογεννήτρια συνάρτηση. Η παρακίνηση τους να προτείνουν μια μεθοδολογία που βασίζεται στην εμπειρική ροπογεννήτρια συνάρτηση προέκυψε κυρίως λόγω του θεωρήματος του μονοσήμαντου των ροπογεννητριών, από το οποίο προκύπτει ότι

υπάρχει μια ένα-προς-ένα αντιστοιχία μεταξύ της ροπογεννήτριας και της κατανομής μιας τυχαίας μεταβλητής. Στο πλαίσιο αυτό, αν θεωρήσουμε ότι η H διαδραματίζει το ρόλο της μηδενικής υπόθεσης, προκύπτει ότι ο έλεγχος της έναντι της H είναι ισοδύναμος με τον έλεγχο της έναντι της H H : M t M t, θ (4..) X H : M t M t, γ, (4..) X όπου με M t, θ και M, συναρτήσεις, όταν η τ.μ. ακολουθεί την x, θ και την, t γ συμβολίζονται οι ροπογεννήτριες x γ, αντίστοιχα, υπό την προυπόθεση ότι οι ροπογεννήτριες αυτές υπάρχουν, ενώ MX t είναι η άγνωστη ροπογεννήτρια της τ.μ. X. Είναι εύκολα αντιληπτό ότι, καθώς η ποσότητα MX t είναι άγνωστη, για τη διενέργεια του υπό μελέτη ελέγχου θα πρέπει να χρησιμοποιηθεί ένας εκτιμητής της, ο οποίος εκτιμητής θα ήταν επιθυμητό να έχει κάποιες κάποιες καλές ιδιότητες π.χ. να είναι συνεπής. Στο επόμενο λήμμα αποδεικνύεται ότι η MX t μπορεί να εκτιμηθεί με συνέπεια (cosistetly estimated) από την εμπειρική ροπογεννήτρια συνάρτηση που δίνεται από τη σχέση: tx j m t e. (4..3) j 86

Λήμμα 4.. Η εμπειρική ροπογεννήτρια συνάρτηση συνεπής εκτιμητής της ροπογεννήτριας συνάρτησης M t. Απόδειξη Για την εμπειρική ροπογεννήτρια συνάρτηση ισχύει ότι: και j i tx X mt είναι X E m t E e M t (4..4) Var m t Var e E e E e, j j ή ισοδύναμα, tx j tx j tx j Var mt M t M t. X X (4..5) Από τις σχέσεις (4..4) και (4..5) συνεπάγεται ότι η εμπειρική ροπογεννήτρια συνάρτηση mt είναι συνεπής εκτιμητής της MX t, καθώς E mt M X t και Var mt 0, καθώς το. Με βάση το παραπάνω λήμμα είναι φυσικό ο στατιστικός έλεγχος της υπό μελέτης μηδενικής υπόθεσης να βασίζεται στην εμπειρική ροπογεννήτρια συνάρτηση 87 tx j e j m t. Επομένως, το επόμενο βήμα είναι ο προσδιορισμός της κατανομής της mt. Στο

ακόλουθο λήμμα προσδιορίζεται η ασυμπτωτική κατανομή αυτής της στατιστικής συνάρτησης. Η απόδειξη αυτού του αποτελέσματος προκύπτει άμεσα με εφαρμογή του Κεντρικού Οριακού Θεωρήματος και παραλείπεται. Λήμμα 4.. (Epps et al. (98)) Η εμπειρική ροπογεννήτρια συνάρτηση ακολουθεί, ασυμπτωτικά κανονική κατανομή με μέση τιμή M ( t) και διακύμανση X M t X M X t τέτοιο ώστε 0 M t X M X t., για κάθε t Επομένως προκύπτει άμεσα το ακόλουθο Πόρισμα: Πόρισμα 4.. Υπό την υπόθεση ότι η, 0 M t, θm t, θ η στατιστική συνάρτηση, M t θ ορίζεται, και m t M t θ (4..6) ακολουθεί ασυμπτωτικά, υπό τη μηδενική υπόθεση κατανομή με μέση τιμή μηδέν και διακύμανση, θ, θ M t M t. H, κανονική (4..7) Είναι άμεσα αντιληπτό ότι η στατιστική συνάρτηση του Πορίσματος 4.. (βλέπε σχέση (4..6)) δεν μπορεί να εφαρμοστεί στην πράξη, καθώς εξαρτάται από την άγνωστη παράμετρο θ. Για το λόγο αυτό, προτείνεται η αντικατάσταση της άγνωστης παραμέτρου θ από τον Ε.Μ.Π. ˆθ. Τότε καταλήγουμε στη στατιστική m t M t, θ ˆ, την οποία πρότειναν οι Epps et al. συνάρτηση 88

(98) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Η εύρεση της κατανομής αυτής της σ.σ. και η κατασκευή ενός κριτηρίου ελέγχου της υπό μελέτης υπόθεσης αποτελούν το αντικείμενο μελέτης της επόμενης ενότητας. 4. Η μεθoδολογία Στην ενότητα αυτή θα παρουσιαστεί η μεθοδολογία των Epps et al. (98) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Ειδικότερα, θα παρουσιαστεί η μεθοδολογία ελέγχου των Epps et al. (98) θεωρώντας ότι η μηδενική υπόθεση είναι η H : M t M t, X H : M t M t, γ. X θ και η εναλλακτική η Με το σκεπτικό που αναπτύχθηκε στην προηγούμενη ενότητα, οι Epps et al. (98) για την αντιμετώπιση του υπό μελέτη προβλήματος κατέληξαν στη στατιστική συνάρτηση m t M t, θ ˆ. Αντικείμενο μελέτης αυτής της ενότητας είναι, αρχικά, ο προσδιορισμός της ασυμπτωτικής κατανομής αυτής της σ.σ. και έπειτα ο καθορισμός του κανόνα απόφασης. Στο παραπάνω πλαίσιο, στο επόμενο Θεώρημα προσδιορίζεται η ασυμπτωτική κατανομή της στατιστικής m t M t, θ ˆ υπό τη μηδενική υπόθεση συνάρτησης H : M t M t, θ. Η απόδειξη αυτού του αποτελέσματος X ακολουθεί ίδια πορεία με αυτή της Πρότασης.. του Cox (96, 96) και παραλείπεται (βλέπε Epps et al. (98)). 89

Θεώρημα 4.. (Epps et al. (98)) Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π. x, θ και, H, αντίστοιχα, με H και, p 90 x γ υπό την,, p θ p R και γ p R. Συμβολίζεται με ˆθ ο Ε.Μ.Π. της παραμέτρου θ υπό την H. Υπό την προυπόθεση ότι ισχύουν οι συνθήκες του Παραρτήματος Β, η στατιστική συνάρτηση E, θˆ ˆ t, θ m t M t T t ακολουθεί ασυμπτωτικά, υπό την N 0,, για κάθε t, τέτοιο ώστε 0, ˆ t θ t M t M t, (4..) H, τυπική κανονική κατανομή, όπου, θ, θ M t M t, θ, θ, θ, (4..) p p ij i j i j με ij να είναι το i, j πληροφορίας του Fisher, δηλαδή του -στοιχείο του αντιστρόφου του πίνακα l X, θ E, i, j,,, p. θ i j Όπως εύκολα γίνεται αντιληπτό το παραπάνω θεώρημα δύναται να ισχύει για διάφορες τιμές της παραμέτρου t. Είναι ευνόητο ότι θα πρέπει η παράμετρος t να επιλέγεται έτσι ώστε να μεγιστοποιείται η ισχύς του τεστ υπό την προϋπόθεση ότι 0 t, θ. Για το σκοπό αυτό είναι απαραίτητος ο ˆ προσδιορισμός της ασυμπτωτικής κατανομής υπό την εναλλακτική

υπόθεση. Ο προσδιορισμός αυτός επιτυγχάνεται στο ακόλουθο θεώρημα. Η απόδειξη αυτού του αποτελέσματος ακολουθεί ίδια πορεία με αυτή της Πρότασης.. του Cox (96, 96) και παραλείπεται (βλέπε Epps et al. (98)). Θεώρημα 4.. (Epps et al. (98)) Υπό τις προϋποθέσεις του Θεωρήματος 4.. και υποθέτοντας, επιπλέον, ότι για δοθέν γ, ο Ε.Μ.Π. ˆθ της παραμέτρου θ, συγκλίνει, υπό την H, κατά πιθανότητα στο θ, η στατιστική συνάρτηση της σχέσης (4..) γ ακολουθεί ασυμπτωτικά, υπό την H : M t M t, X κατανομή με παραμέτρους θέσης και κλίμακας: t γ, κανονική, γ, θ γ t, θ γ M t M t, (4..3) και αντίστοιχα, όπου t t, γ t, θ γ, (4..4), θ l, θ γ γ p p M t X ij tx t, γ M t, γ M t, γ E e γ i j i j, θ, θ l, θ l, θ γ γ γ γ M t M t X X p p p p il jm E γ i j l m i j l m, 9

με ij να είναι το i, j l X, θ l X, θγ -στοιχείο του αντιστρόφου του πίνακα E E, i, j,,, p. γ θθγ γ i j i j Αφού προσδιορίστηκε η κατανομή της στατιστικής συνάρτησης των Epps et al. (98) υπό τη μηδενική και την εναλλακτική υπόθεση, θα πρέπει, στη συνέχεια, να κατασκευαστεί η κρίσιμη περιοχή. Ο προσδιορισμός αυτός είναι εφικτός διακρίνοντας δύο περιπτώσεις. Αρχικά θεωρούμε ότι: t M t M t γ, γ, θ 0. Σε αυτήν την περίπτωση η μηδενική υπόθεση απορρίπτεται για E μεγάλες θετικές τιμές της στατιστικής συνάρτησης T t. Άρα, με επίπεδο σημαντικότητας, προκύπτει ότι η περιοχή απόρριψης E είναι. T t z Έπειτα, θεωρούμε ότι: t M t M t γ 9, γ, θ 0, οπότε σε αυτήν την περίπτωση η μηδενική υπόθεση απορρίπτεται για μεγάλες αρνητικές τιμές της στατιστικής συνάρτησης E δηλαδή όταν. T t z E T t, Επομένως, σε κάθε περίπτωση, η κρίσιμη περιοχή, σε επίπεδο σημαντικότητας είναι E C X,, X : T t z, όπου με συμβολίζεται το πρόσημο του t. Όμως, το πρόσημο αυτό είναι άγνωστο, καθώς εξαρτάται από την άγνωστη παράμετρο

γ. Για να χρησιμοποιηθεί σε πρακτικές εφαρμογές αντικαθίσταται από ένα συνεπή εκτιμητή του, έστω ˆ, που καθορίζεται εκτιμώντας την άγνωστη παράμετρο γ από τον Ε.Μ.Π. ˆγ. Άρα η κρίσιμη περιοχή είναι: για κάθε t τέτοιο ώστε E ˆ T t z, (4..5) 0 ˆ t, θ, t. Σε όσα ακολουθούν υποθέτουμε ότι αυτή η προϋπόθεση πληρείται. Την ίδια κρίσιμη περιοχή προτείνουν και οι Epps et al. (98), βασιζόμενοι στο ακόλουθο σκεπτικό το οποίο δεν περιγράφεται αλλά αφήνεται να εννοηθεί, καθώς λέγεται ότι εφαρμόζεται το Θεμελιώδες Λήμμα των Neyma-Pearso (Epps (03)). Η στατιστική συνάρτηση των Epps et al. (98) ακολουθεί ασυμπτωτικά τυπική κανονική κατανομή υπό τη μηδενική υπόθεση και κανονική κατανομή με παραμέτρους θέσης και κλίμακας και t t αντίστοιχα, υπό την εναλλακτική. Υπολογίζοντας το πηλίκο του Λήμματος των Neyma-Pearso, οι Epps et al. (98), αγνοώντας τον όρο καταλήγουν ότι η κρίσιμη περιοχή t μεγέθους είναι εκείνη όπου η ποσότητα E E 0.5T t t T t t είναι μικρή. Το ζητούμενο προκύπτει λαμβάνοντας υπόψη ότι για μεγάλα ισχύει ότι / t O και t O. Επισημαίνεται ότι ο όρος t όντας συνάρτηση του t θα μπορούσε να ληφθεί υπόψη στην επιλογή του βέλτιστου t, ώστε να μεγιστοποιείται η ισχύς του τεστ. Ωστόσο, σύμφωνα με τους Epps et al. (98) ο παραπάνω 93

ισχυρισμός για την κρίσιμη περιοχή παραμένει λογικός για μεγάλα μεγέθη δείγματος. Λαμβάνοντας υπόψη τα παραπάνω, προκύπτει ότι η ισχύς του τεστ είναι: E P ˆ T t z H ή ισοδύναμα E P t ˆT t ˆ t t z ˆ t H, όπου t z t, t, η α.σ.κ. της τυπικής κανονικής κατανομής και (4..6) t t z t,. (4..7) Επομένως, για προκαθορισμένο επίπεδο σημαντικότητας, η ισχύς μπορεί να μεγιστοποιηθεί επιλέγοντας ένα t, έτσι ώστε να ελαχιστοποιείται ως προς t η συνάρτηση,t. Η επιλογή αυτή θα αποσαφηνιστεί στην επόμενη ενότητα μέσω μίας εφαρμογής. Παρατήρηση 4.. (Epps et al. (98)) Στην πράξη πρέπει να ελαχιστοποιηθεί ως προς t η συνάρτηση ˆ,t, η οποία εξαρτάται από έναν συνεπή εκτιμητή της παραμέτρου θ. Η βέλτιστη αυτή τιμή του t εξαρτάται από το μέγεθος του δείγματος και από τον Ε.Μ.Π. ˆθ, και μπορεί να αποδειχθεί ότι δεν επηρεάζει την ασυμπτωτική 94

κατανομή της στατιστικής συνάρτησης των Epps et al. (98), αν η συνάρτηση,t παρουσιάζει ελάχιστο για κάθε. Αν εναλλάξουμε το ρόλο των H και H στη μηδενική και εναλλακτική υπόθεση, με ανάλογο τρόπο αποδεικνύεται το επόμενο θεώρημα. Θεώρημα 4..3 (Epps et al. (98)) Έστω X,, X ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με σ.π.π., H και x θ και x, γ H, αντίστοιχα, με, p υπό την θ p R και,, p γ p R. Συμβολίζονται με ˆθ και ˆγ οι Ε.Μ.Π. των παραμέτρων θ και γ υπό την H και H, αντίστοιχα. Επιπλέον, υποθέτουμε ότι για δοθέν θ, ο Ε.Μ.Π. ˆγ της παραμέτρου γ, συγκλίνει, υπό την H, κατά πιθανότητα στο γ. Υπό την θ προϋπόθεση ότι ισχύουν οι υποθέσεις του Παραρτήματος Β, υπό την H, η στατιστική συνάρτηση E, γˆ t, γˆ m t M t X T t ακολουθεί ασυμπτωτικά τυπική κανονική κατανομή N 0,, για κάθε t, τέτοιο ώστε 0 t, γ ˆ, όπου p p M ( t, γ) M ( t, γ) ij ( t, ) M ( t, γ) M ( t, γ ), (4..8) i j i j, 95

με ij να είναι το i, j -στοιχείο του αντιστρόφου του πίνακα πληροφορίας του Fisher, δηλαδή του l X, γ E, i, j,,, p. γ i j εναλλακτική υπόθεση H, η E Επιπρόσθετα, υπό την T t ακολουθεί ασυμπτωτικά κανονική κατανομή με παραμέτρους θέσης και κλίμακας: t, θ, γ θ t, γ θ M t M t (4..9) και αντίστοιχα, όπου t t, θ t, γ θ (4..0), γ l, γ p p M t X θ ij tx t, θ M t, θ M t, θ E e θ i j i j, γ, γ l, γ l, γ p p p p M t M t X X θ θ il jm θ θ E, θ i j l m i j l m θ με ij να είναι το, l X, γ l X, γθ i j -στοιχείο του αντιστρόφου του E E, i, j,,, p. θ γγθ θ i j i j 96

Παρατήρηση 4.. Προφανώς η κρίσιμη περιοχή και η επιλογή της παραμέτρου t γίνεται με παρόμοιο τρόπο με αυτόν που αναπτύχθηκε έχοντας την H ως μηδενική και την H ως εναλλακτική. Η διαδικασία αυτή της επιλογή του βέλτιστου t ίσως ήταν ο λόγος που οδήγησε να μην βρίσκει εφαρμογές σε πρακτικές εφαρμογές η μεθοδολογία αυτή. Η μεθοδολογία των Epps et al. (98) θα αποσαφηνιστεί στην επόμενη ενότητα. 4.3 Ειδική Περίπτωση Στην ενότητα αυτή θα αποσαφηνιστεί η μεθοδολογία των Epps et al. (98) για την περίπτωση της λογαριθμοκανονικής κατανομής έναντι της εκθετικής κατανομής. Καθώς, η ροπογεννήτρια της λογαριθμοκανονικής κατανομής δεν υπάρχει, και λαμβάνοντας υπόψη ότι η μεθοδολογία των Epps et al. (98) προϋποθέτει την ύπαρξη των ροπογεννητριών των δύο υποψήφιων μοντέλων, θεωρούμε το μετασχηματισμό Y lx, i,,. Κατά αυτόν τον τρόπο, προκύπτει το ισοδύναμο πρόβλημα του ελέγχου αν το τ.δ. Y,, Y προέρχεται από την κανονική κατανομή, την λογαριθμοεκθετική κατανομή, με σ.π.π. y, θ και, 97 i i N ή y που προσδιορίζονται στις σχέσεις (0) και (9), αντίστοιχα, του Παραρτήματος Α. Οι ροπογεννήτριες συναρτήσεις της κανονικής και της λογαριθμοεκθετικής κατανομής δίνονται στη σχέση () και στην Πρόταση 4 i), αντίστοιχα, του Παραρτήματος Α. Καθώς δεν ξέρουμε ποια από τις δύο κατανομές είναι αυτή που τίθεται στη μηδενική υπόθεση και ποια αυτή που τίθεται στην εναλλακτική, στα δύο παραδείγματα που ακολουθούν,

εναλλάσσονται οι ρόλοι της μηδενικής και της εναλλακτικής υπόθεσης και αναπτύσσεται η μεθοδολογία των Epps et al. (98). Παράδειγμα 4.3. (Epps et al. (98)) Λογαριθμοκανονική έναντι Εκθετικής Σύμφωνα με τη μεθοδολογία των Epps et al. (98), στο παράδειγμα αυτό θα ελέγξουμε τη μηδενική υπόθεση ότι το τ.δ. προέρχεται από την κανονική κατανομή με παράμετρο θ, έναντι της εναλλακτικής ότι προέρχεται από τη λογαριθμοεκθετική κατανομή με παράμετρο. Βήμα ο Υπολογισμός του Ε.Μ.Π. της παραμέτρου θ,, p Ε.Μ.Π. της παραμέτρου,.3. και είναι ˆ Y l X. i i. Ο θ έχει υπολογιστεί στο Παράδειγμα Y Y, και ˆ S i Y Y, Y με i i Βήμα ο Υπολογισμός της M ˆ, t θ. Είναι ˆ ˆ ˆ Y M t, θ exp t t exp Yt S t. (4.3.) Βήμα 3 ο Υπολογισμός της διαφοράς των ροπογεννητριών, θ, M t M t θ. Είναι i M t, θ M t, θ exp Yt S t exp Yt S t. (4.3.) Y Y 98

Βήμα 4 ο Υπολογισμός του αντίστροφου του πίνακα πληροφορίας l Y, του Fisher E θ και προσδιορισμός των στοιχείων του θ θ, για i, j,... p. ij Στο συγκεκριμένο παράδειγμα καθώς η παράμετρος θ είναι διδιάστατη ο πίνακας πληροφορίας του Fisher είναι. Από τις σχέσεις (.3.7) και (.3.8) του Παραδείγματος.3. και λαμβάνοντας υπόψη ότι Y lx προκύπτει ότι: Βήμα 5 ο Υπολογισμός των 0. (4.3.3) 0 M t, θ για i,, p. Είναι i t, θ t M t exp t t te, (4.3.4) και t, θ t t M t t t e exp. Βήμα 6 ο Υπολογισμός της ˆ t, θ, όπου (4.3.5) t θ M t θ M t θ, θ, θ M t M t,,,. p p ij i j i j 99

Επομένως, για το συγκεκριμένο παράδειγμα, λαμβάνοντας υπόψη τις σχέσεις (4.3.4), (4.3.5) και τα αποτελέσματα των προηγούμενων βημάτων, προκύπτει ότι: ή ισοδύναμα, t, θˆ expyt S t expyt S t 4 4 S t Y Yt S t Y S t Y Yt S t Y Y Y exp exp, t ˆ ty t S t S t S t S 4 4, θ exp exp /. Y Y Y Y (4.3.6) Καθώς πρέπει ˆ 0 t, θ, προκύπτει ότι t 0. Σε όσα έπονται η παραπάνω συνθήκη λαμβάνεται υπόψη. Βήμα 7 ο Υπολογισμός της τιμής της στατιστικής συνάρτησης E, θˆ ˆ t, θ m t M t Y T t Στο συγκεκριμένο παράδειγμα προκύπτει ότι θα πρέπει να υπολογιστεί η τιμή της στατιστικής συνάρτησης: ή ισοδύναμα της m t exp Y Yt S t Y E T t, t, θˆ. 00

m t exp Y Yt S t Y E T t, t 0, 4 4 exps t S t t S Y Y Y (4.3.7) ty i t όπου m t e X. Y i i i Βήμα 8 ο Εύρεση του κατά πιθανότητα ορίου του Ε.Μ.Π. της παραμέτρου θ όταν τα δεδομένα προέρχονται από την εναλλακτική κατανομή. Επομένως, θέλουμε να βρούμε, για το συγκεκριμένο παράδειγμα, την κατά πιθανότητα σύγκλιση του ˆ, ˆ, όταν τα δεδομένα προέρχονται από την λογαριθμοεκθετική κατανομή. Κατά αυτόν τον τρόπο θα προσδιοριστεί το διάνυσμα,. Από την Πρόταση 4 ii) και vi) του Παραρτήματος Α προκύπτει ότι: Βήμα 9 ο Υπολογισμός της t, θ l,. (4.3.8) θ, όπου t θ M t θ M t θ, θ, θ M t M t,,,. p p ij i j i j Λαμβάνοντας υπόψη τα όσα προηγήθηκαν, έπειτα από λίγη άλγεβρα, προκύπτει ότι: t t t t θ 4, t e e t t. 0

Βήμα 0 ο Υπολογισμός της, θ l, θ p p M t Y ij ty t, M t, M t, E e i j i j όπου, θ, θ l, θ l, θ M t M t Y Y p p p p il jm E i j l m i j l m ij είναι το ( i, j) -στοιχείο του αντιστρόφου του πίνακα l Y, θ E i j, i, j,,, p. Ο πρώτος όρος της t, είναι: t M t, M t, t t, (4.3.9) άρα προκύπτει ότι t 0.5. Σε όσα έπονται η παραπάνω συνθήκη λαμβάνεται υπόψη. Για το δεύτερο όρο πρέπει να υπολογιστούν τα. Οπότε, έχουμε: ij, ή ισοδύναμα, Y E E Y ( Y ) E E 3, 0

0 0 0 0 0. Var Y 0 3 (4.3.0) Επιπρόσθετα, έχουμε: M t, θ t t t tm t exp,, θ ή ισοδύναμα, M t, θ t t t t exp /. (4.3.) και M t, θ t exp t t t M t,, θ ή ισοδύναμα, M t, θ t t expt t /. (4.3.) Συνδυάζοντας τις σχέσεις (4.3.0), (4.3.), (4.3.) και την Πρόταση 6 του Παραρτήματος Α, προκύπτει ότι ο δεύτερος όρος της t, είναι: 03

t t t / t t e,, t t t t t, j η zeta συνάρτηση του Hurwitz (βλέπε όπου j 0 Gradstey (980)). Τέλος, συνδυάζοντας τις σχέσεις (4.3.0), (4.3.), (4.3.) και την Πρόταση 7 του Παραρτήματος Α, ο τρίτος όρος της t, είναι: t exp. 4 t t t t t Επομένως, η ποσότητα t, / t είναι ίση με t t tt / t t t t e t t, t t exp. 4 t t t t Βήμα ο Υπολογισμός των t και t, της κρίσιμης περιοχής και του κανόνα απόφασης με βάσει όσα αναπτύχθηκαν στην προηγούμενη ενότητα. Είναι 04

t,, e t t t M t M t t t e t t θ. Επομένως, λαμβάνοντας υπόψη το αποτέλεσμα του Βήματος 9, προκύπτει ότι: t t t t e t t t 4 e e t t. (4.3.3) Επιπλέον, λαμβάνοντας υπόψη τα αποτελέσματα των Βημάτων 9 και 0, προκύπτει ότι: t t t, / t t t 4 e e t t με t,, / t η ποσότητα όπως δίνεται στο Βήμα 0. Η κρίσιμη περιοχή σε επίπεδο σημαντικότητας είναι (4.3.4) 4 4 exp S t S t t S Y Y Y Yt SY t C X,, X : ˆ m t e z, Y 05

όπου με ˆ συμβολίζεται ο εκτιμητής του πρόσημου του t, το οποίο καθορίζεται εκτιμώντας την άγνωστη παράμετρο από τον Ε.Μ.Π. ˆ. Ο υπολογισμός της συνάρτησης,t προκύπτει από τη σχέση,t t z t (4.3.3) και (4.3.4)., λαμβάνοντας υπόψη τις Παρατήρηση 4.3. α) Η συνάρτηση,t για την περίπτωση της λογαριθμοκανονικής έναντι της εκθετικής κατανομής είναι ανεξάρτητη της παραμέτρου, καθώς, όπως φαίνεται από τις σχέσεις (4.3.3) και (4.3.4), τα 06 t και t δεν εξαρτώνται από αυτή. Επομένως, η τιμή του t που ελαχιστοποιεί τη συνάρτηση,t εξαρτάται μόνο από το επίπεδο σημαντικότητας και το μέγεθος του δείγματος (βλέπε Epps et al. (98)). Η ελαχιστοποίηση αυτή δεν είναι εφικτό να πραγματοποιηθεί με αναλυτικό τρόπο, αλλά μόνο με χρήση ενός λογισμικού. Παρόλα αυτά, και σε αυτήν την περίπτωση παρουσιάζονται δυσκολίες, ανάλογα με τη μέθοδο ελαχιστοποίησης, την αρχικοποίηση ή το λογισμικό που θα χρησιμοποιηθεί. Τα προβλήματα αυτά είναι έντονα σε μια μικρή περιοχή του t γύρω από την τιμή 0, διότι εκεί ο παρονομαστής του t παίρνει τιμές κοντά στο 0. Χρησιμοποιώντας μία ευρητική (heuristic) μέθοδο προέκυψε με χρήση της Matlab και της Octave ότι, για επίπεδο σημαντικότητας 5% και για μεγέθη δείγματος 5,50,00,50,00, η τιμή του t είναι σε μια περιοχή του 0.05. Αντίθετα, ο Epps (03), χρησιμοποιώντας τη ρουτίνα rid της Fortra και με βήμα 0.0 για 0.05, αποκτά διαφορετικές τιμές. Για παράδειγμα, είναι:

(, t optimal ): (5,-0.), (50, 0.), (00, 0.3), (50, 0.35), (00, 0.4) και (000, 0.6). Το θέμα αυτό χρήζει περαιτέρω διερεύνησης και σε όσα ακολουθούν θεωρήσαμε, για κάθε, t 0.05. optimal β) Τα στατιστικά τεστ των Epps et al. (98) και Atkiso (970) είναι ίδια για t στην περίπτωση της λογαριθμοκανονικής κατανομής έναντι της εκθετικής κατανομής, όταν η μηδενική υπόθεση είναι αληθής, εκτός από τους όρους οι οποίοι διαιρεμένοι / με το συγκλίνουν κατά πιθανότητα στη μονάδα (βλέπε Epps et al. (98)). Παράδειγμα 4.3. (Epps et al. (98)) Εκθετική έναντι Λογαριθμοκανονικής Ας αντιστρέψουμε τους ρόλους της μηδενικής και της εναλλακτικής υπόθεσης του προηγούμενου παραδείγματος. Επομένως, σύμφωνα με τη μεθοδολογία των Epps et al. (98), θα ελέγξουμε τη μηδενική υπόθεση έναντι της εναλλακτικής t H : M t, t, t, (4.3.5) H : M t, θ exp t t, t R. (4.3.6) Βήμα ο Αρχικά, υπολογίζεται ο Ε.Μ.Π. της παραμέτρου. Είναι Yi ˆ X X e. i i i 07

Βήμα ο Υπολογισμός της ˆ t ˆ ˆ M t, t, t. M t,. Είναι Βήμα 3 ο Υπολογισμός της διαφοράς των ροπογεννητριών M t, M t,. Είναι t t M t, M t, t t, t (4.3.7) Βήμα 4 ο Υπολογισμός του αντίστροφου του πίνακα πληροφορίας του Fisher ij E, για i, j,, p. l Y, και προσδιορισμός των στοιχείων του Στο συγκεκριμένο παράδειγμα καθώς η παράμετρος είναι μονοδιάστατη δεν υπολογίζουμε πίνακα αλλά την Επομένως, l Y, e Y X E E E 3 3.. Βήμα 5 ο Υπολογισμός των M t, i για i,, p. Είναι p και M t, t t t t t. Βήμα 6 ο Υπολογισμός της t,, όπου (4.3.8) 08

t M t M t,, M t M t,,,. p p ij i j i j Για το συγκεκριμένο παράδειγμα, καθώς p, λαμβάνοντας υπόψη τα αποτελέσματα των προηγούμενων βημάτων προκύπτει ότι: t t, t t t, (4.3.9) με t 0.05,t 0,. Βήμα 7 ο Υπολογισμός της τιμής της στατιστικής συνάρτησης E, ˆ t, ˆ m t M t Y T t Στο συγκεκριμένο παράδειγμα προκύπτει ότι θα πρέπει να υπολογιστεί η τιμή της στατιστικής συνάρτησης: t m t ( X ) t E Y T t, t 0,, (4.3.0) t X t t t όπου ty i t m t e X. Y i Σε όσα έπονται η παραπάνω i i συνθήκη λαμβάνεται υπόψη.. Βήμα 8 ο Εύρεση του κατά πιθανότητα ορίου του Ε.Μ.Π. της παραμέτρου όταν τα δεδομένα προέρχονται από την εναλλακτική κατανομή. Είναι exp. θ (4.3.) 09

Βήμα 9 ο Υπολογισμός της t, Είναι από τη σχέση (4.3.9) θ. t ( t, ) t t t. θ θ (4.3.) Βήμα 0 ο Υπολογισμός της θ θ θ, l, M t Y p p θ ij ty t, M t, M t, E e θ i j i j όπου ij,, l, l, p p p p M t M t Y Y θ θ il jm θ θ E, θ i j l m i j l m είναι το i, j -στοιχείο του αντιστρόφου του πίνακα Y θ l Y, l, E E, i, j,,, p. θ γγθ θ i j i j Για το παράδειγμά μας προκύπτει, ύστερα από λίγη άλγεβρα, ότι:, θ, θ t t t t M t M t e e e θ t t t t t t t t t t t t e θ ( ) t e e, ενώ l Y, X θ θ E E θ θ 3, θ θ θ 0

διότι, E X e, όταν X N θ θ Επίσης, ~ l,. Y Y e Var e e e e θ θ l Y, E E θ θ θ 4 4 θ θ θ θ θ Άρα, Y t θ Y l Y, ty ty e e θ ty E e E e E e θ θ θ θ θ θ θ ή ισοδύναμα, M t M t, Y Y θ θ θ t t t t l Y, ty E e e e θ θ θ θ Συνδυάζοντας τα παραπάνω, προκύπτει ότι: t t t t t t, θ e e t t e e θ θ θ θ θ e t 4 t t, θ θ t t t t κι έπειτα από αλγεβρικές πράξεις, έχουμε ότι: θ t t t t t t t t t, θ e e t t e e θ (4.3.3) t t e...

Βήμα ο Υπολογισμός των t και t, της κρίσιμης περιοχής και του κανόνα απόφασης με βάσει όσα αναπτύχθηκαν στην προηγούμενη ενότητα. Είναι ή ισοδύναμα, t t t t e t θ t θ t t t, t t t e e t e t t t t (4.3.4) και t t t ( t ) t t t t e e t t e e t t e. t t t (4.3.5) Η κρίσιμη περιοχή με επίπεδο σημαντικότητας αποτελείται από εκείνα τα X,, X που είναι τέτοια ώστε: t t X t t t ˆ m t X t z, Y όπου με ˆ συμβολίζεται ο εκτιμητής του προσήμου του t, το οποίο καθορίζεται εκτιμώντας την άγνωστη παράμετρο θ από τον

Ε.Μ.Π. ˆθ και υπό τους περιορισμούς που έχουν διατυπωθεί για την τιμή της t. Η ποσότητα,t t z t προσδιορίζεται χρησιμοποιώντας τα παραπάνω αποτελέσματα. Η συνάρτηση,t εξαρτάται μόνο από την παράμετρο, καθώς τόσο το t όσο και το t εξαρτώνται μόνο από την παράμετρο. Επομένως, μπορούμε να εκτιμήσουμε την παράμετρο από τη δειγματική διακύμανση Y i συνεπής εκτιμητής της. S Y Y, i,,, που είναι i Άρα στην πράξη η επιλογή του t για δοθέν επίπεδο σημαντικότητας και μέγεθος δείγματος εξαρτάται από τα διαθέσιμα δεδομένα και δεν μπορεί να προταθεί ένας γενικός τρόπος προσδιορισμού. 3

ΚΕΦΑΛΑΙΟ 5 Μεθοδολογία του Vuo (989) Στη βιβλιογραφία, όπως έχει προηγούμενα αναφερθεί, έχουν εμφανιστεί διάφοροι τρόποι αντιμετώπισης του προβλήματος που διατυπώθηκε στο Κεφάλαιο και ταξινομούνται σε δύο μεγάλες κατηγορίες. Μέχρι στιγμής έχουν παρουσιαστεί μεθοδολογίες σύμφωνα με τις οποίες μία από τις δύο υποψήφιες κατανομές λαμβάνεται ως μηδενική υπόθεση, έχοντας την άλλη ως εναλλακτική, κι αντίστροφα. Σε αυτό το κεφάλαιο θα παρουσιαστεί μια μέθοδος, η οποία ανήκει στην κατηγορία εκείνη η οποία περιλαμβάνει τις προσεγγίσεις, σύμφωνα με τις οποίες η μηδενική υπόθεση είναι ότι οι δύο κατανομές περιγράφουν το τ.δ. ισοδύναμα κι έχει ως εναλλακτικές ότι μία κατανομή είναι καλύτερη της άλλης για τη μοντελοποίηση. Επομένως, θα παρουσιαστεί ένας στατιστικός έλεγχος που εντάσσεται στην κατηγορία αυτών της επιλογής του καλύτερου μοντέλου. Στο πλαίσιο αυτό, στο κεφάλαιο αυτό θα παρουσιαστεί η μεθοδολογία που προτάθηκε από τον Vuo (989) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Ο Vuo (989), χρησιμοποιώντας το κριτήριο πληροφορίας των Kullback ad Leibler (95), πρότεινε ένα στατιστικό που βασίζεται στο πηλίκο μέγιστων πιθανοφανειών. Η μεθοδολογία αυτή έχει την επιθυμητή ιδιότητα ότι συμπίπτει με την αντίστοιχη των εμφωλευμένων μοντέλων. Η διάρθρωση του Κεφαλαίου 5 έχεις ως εξής. Στην Παράγραφο 5. παρατίθενται κάποιες εισαγωγικές έννοιες και ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί. Στη συνέχεια, στην Παράγραφο 5. παρουσιάζεται η μεθοδολογία του Vuo

(989), ενώ στην Παράγραφο 5.3 η μέθοδος αυτή αποσαφηνίζεται μέσω του ελέγχου της υπόθεσης αν ένα τυχαίο δείγμα X,, X μπορεί να θεωρηθεί ότι προέρχεται από την λογαριθμοκανονική ή την εκθετική κατανομή. 5. Εισαγωγή Στην παράγραφο αυτή, για τη διευκόλυνση της μελέτης του κεφαλαίου, δίνονται κάποιες εισαγωγικές έννοιες και συμβολισμοί, καθώς και οι συνθήκες υπό τις οποίες ισχύει η μεθοδολογία του Vuo (989). Έστω X,, X ένα τυχαίο δείγμα (τ.δ.) από κάποιο πληθυσμό με συνάρτηση πυκνότητας πιθανότητας (σ.π.π.) ή συνάρτηση πιθανότητας (σ.π.) h, η συναρτησιακή μορφή της οποίας μας είναι άγνωστη. Θέλουμε να εξετάσουμε αν μπορεί να θεωρηθεί ότι το τ.δ. προέρχεται είτε από την οικογένεια κατανομών H x, θ, θ είτε από την οικογένεια κατανομών H ( x, γ), γ, υποθέτοντας ότι πρόκειται για μη εμφωλευμένα μοντέλα (βλέπε αναλυτική περιγραφή του προβλήματος στο Κεφάλαιο ). Είναι φυσικό ότι θα επιλεγεί η οικογένεια κατανομών εκείνη, που είναι πιο «κοντά» στην άγνωστη αληθινή κατανομή h, αν αυτό ισχύει για μία από τις δύο οικογένειες κατανομών. Ένα μέτρο της εγγύτητας δύο κατανομών που έχει εισαχθεί στη βιβλιογραφία είναι το μέτρο απόκλισης των Kullback ad Leibler (95). Σύμφωνα με τον Ορισμό.. το μέτρο αυτό δύναται να καθορίσει 6

και την εγγύτητα μεταξύ των κατανομών x, θ, x, γ και της πραγματικής κατανομής. Οι «αποστάσεις» αυτές ορίζονται να είναι: θ γ I E lh X E l X,, I E lh X E l X,, h h h h h h όπου E h κατανομή h. είναι η αναμενόμενη τιμή ως προς την πραγματική Είναι προφανές ότι η οικογένεια κατανομών H θεωρείται ότι περιγράφει καλύτερα το τ.δ. αν και μόνο αν i I i I, ή sup l, sup l,. ισοδύναμα αν και μόνο αν E X θ h E h X γ h h Επομένως, η καταλληλότητα ενός εκ των δύο πιθανών μοντέλων καθορίζεται, εξαρτάται από την ελάχιστη πιθανή «απόσταση» μεταξύ του μοντέλου και της αληθινής κατανομής. Χαρακτηριστικά o Vuo (989) αναφέρει ότι «αν η απόσταση μεταξύ ενός καθορισμένου μοντέλου και της πραγματικής κατανομής ορίζεται ως το ελάχιστο του Κριτηρίου Πληροφορίας των Kullback-Leibler (KLIC) που σχετίζεται με αυτές τις κατανομές, τότε είναι φυσικό να ορίσουμε το «καλύτερο» μοντέλο ανάμεσα από μια συλλογή ανταγωνιστικών μοντέλων να είναι το μοντέλο που είναι πιο κοντά στην πραγματική κατανομή». Όμως, όπως έχει επισημανθεί στη βιβλιογραφία (βλέπε, μεταξύ άλλων, Sawa (978)), ο παραπάνω κανόνας δεν είναι άμεσα εφαρμόσιμος, καθώς εξαρτάται πλήρως από την άγνωστη αληθινή κατανομή h. Επιπλέον, για τη θεμελίωση ενός πρακτικά εφαρμόσιμου κανόνα για τον καθορισμό του καταλληλότερου 7

μοντέλου θα πρέπει επιπλέον να αντικατασταθούν οι άγνωστες παράμετροι θ και γ από κατάλληλους εκτιμητές. Για το σκοπό αυτό παρατίθεται ο ακόλουθος ορισμός. Ορισμός 5.. (Sawa (978)) Έστω οι οικογένειες κατανομών H x, θ, θ και μορφή των x, θ και, H x, γ, γ, όπου η συναρτησιακή x γ μας είναι γνωστή, αλλά εξαρτάται από έναν πεπερασμένο αριθμό άγνωστων παραμέτρων που συμβολίζονται με θ και γ, αντίστοιχα. Επίσης, τα σύνολα και απαρτίζουν τον παραμετρικό χώρο όπου οι αντίστοιχες πυκνότητες είναι καλά ορισμένες. Οι ποσότητες και θ θ armax E * l X, θ, (5..) h γ γ armax E * l X, γ, (5..) h ονομάζονται ψευδοαληθείς τιμές των θ και γ, αντίστοιχα. η Προκύπτει (βλέπε Sawa (978)) ότι αν η αληθινή σ.π.π. είναι h και η ( x, θ) ικανοποιεί τις συνθήκες ομαλότητας (βλέπε Παράρτημα Β), η ψευδοαληθής τιμή ικανοποιεί την ακόλουθη σχέση: E l X, θ 0. θ h θθ* (5..3) 8

Από τα παραπάνω γίνεται αντιληπτό ότι το τ.δ. προέρχεται από την οικογένεια κατανομών για την οποία η ποσότητα E l, h X * E l X, γ h * είναι μέγιστη. Επομένως, i) αν E l X, * E l X, h h * θ ή X, θ * θ γ ή E l 0, τότε h X, γ* οι δύο κατανομές περιγράφουν ισοδύναμα το τ.δ., θ γ ή ii) αν E l X, * E l X, h h * X, θ * E l 0, τότε h X, γ* το τ.δ περιγράφεται καλύτερα από την κατανομή H, και τέλος, θ γ ή iii) αν E l X, * E l X, h h * X, θ * E l 0, τότε h X, γ* το τ.δ περιγράφεται καλύτερα από την κατανομή H. Με βάση το παραπάνω σκεπτικό, ο Vuo (989) ανήγαγε το X, θ * υπό μελέτη πρόβλημα στον έλεγχο της H : E l 0, 0 h X, γ* έναντι της αντίστοιχης κάθε φορά εναλλακτικής υπόθεσης. Παρατήρηση 5.. Μια βασική διαφοροποίηση της προσέγγισης του Vuo (989) από αυτές των Cox (96, 96), Atkiso (970) και Epps et al. (98), που είδαμε σε προηγούμενα κεφάλαια αφορά τη διατύπωση της προς έλεγχο υπόθεσης. Η μηδενική υπόθεση, σύμφωνα με τη μεθοδολογία του Vuo (989), είναι ότι οι δύο κατανομές περιγράφουν το τ.δ. ισοδύναμα, έχοντας ως εναλλακτικές ότι μία κατανομή είναι καλύτερη της άλλης. Αυτό έρχεται σε αντίθεση με τη μηδενική υπόθεση των μεθοδολογιών των Cox 9

(96, 96), Atkiso (970) και Epps et al. (98), σύμφωνα με τις οποίες μία από τις δύο κατανομές λαμβάνεται ως μηδενική υπόθεση, έχοντας την άλλη ως εναλλακτική, κι αντίστροφα. X, θ * Είναι εύκολα αντιληπτό ότι η ποσότητα E l h X, γ * είναι άγνωστη και για τη διενέργεια του υπό μελέτη ελέγχου θα πρέπει να χρησιμοποιηθεί ένας εκτιμητής της, ο οποίος θα ήταν επιθυμητό να έχει κάποιες καλές ιδιότητες π.χ. να είναι συνεπής. Στο επόμενο Λήμμα αποδεικνύεται ότι, υπό την προϋπόθεση ότι πληρούνται οι συνθήκες που παρατίθενται στο Παράρτημα Β, η άγνωστη αυτή ποσότητα μπορεί να εκτιμηθεί με συνέπεια από τη στατιστική συνάρτηση LR ˆ θ γˆ X, θˆ i, l X, γˆ i i, όπου θˆ, γ ˆ οι Ε.Μ.Π. των θ και γ, αντίστοιχα. Επομένως, η άγνωστη ποσότητα * * εκτιμάται με συνέπεια από τη δειγματική μέση τιμή του πηλίκου μέγιστων πιθανοφανειών. Πριν προχωρήσουμε παραθέτουμε κάποια χρήσιμα Λήμματα. Λήμμα 5.. (Vuo (983)) Έστω θ ˆ είναι μια ακολουθία Ε.Μ.Π.. Τότε i) υπό τις υποθέσεις - του Παραρτήματος Β, για κάθε, υπάρχει σχεδόν σίγουρα ένας ΕΜΠ θ ˆ. ii) Υπό τις υποθέσεις -3 του Παραρτήματος Β, ισχύει ότι θ ˆ θ... * iii) Υπό τις υποθέσεις -5 του Παραρτήματος Β, ισχύει ότι ˆ A A B θˆ B θ. θ.. θ * και.. * 0

iv) Υπό τις υποθέσεις -6 του Παραρτήματος Β, ισχύει ότι όπου.. θ θ * θ * ˆ N 0, C, ˆ l X, θ i l X, θ A ˆ θ, A θ E * h i i j i j ˆ ˆ l X, θ l X, θ i i B ˆ θ, B θ * i i j θ * θ* l X, l X, E h i j * * * *, C θ A θ B θ A θ για i, j,, p. *, Λήμμα 5.. (Vuo(989)) Αν ισχύουν οι υποθέσεις -3 του Παραρτήματος Β, τότε όπου LR ˆ θ γˆ και γ, αντίστοιχα. * Απόδειξη X, θ.. * LR θ ˆ, γˆ E l, h X, γ* X, θˆ i, l X, γˆ i i (5..4), με θ ˆ και γ ˆ τους Ε.Μ.Π. των θ * Από το i) του Λήμματος 5.., οι Ε.Μ.Π. θ ˆ και γ ˆ των παραμέτρων θ και γ αντίστοιχα, υπάρχουν σχεδόν σίγουρα, και μάλιστα * *

σύμφωνα με το ii) του Λήμματος 5.. ισχύει ότι.. γˆ προκύπτει ότι: * θˆ.. θ και γ. Λαμβάνοντας υπόψη το iii) του Λήμματος 5.. εύκολα ˆ X, θ i X, θ ˆ.. * LR θ, γˆ l l E h i X, γˆ X, i γ* και η απόδειξη ολοκληρώθηκε. Με βάση το Λήμμα 5.. είναι φυσικό ο στατιστικός έλεγχος της υπό μελέτης μηδενικής υπόθεσης να βασίζεται στην ποσότητα LR θˆ, γ ˆ. Επομένως, θα πρέπει να προσδιοριστεί η κατανομή αυτής της ποσότητας. Ο προσδιορισμός αυτός, υπό τις υποθέσεις που παρατίθενται στο Παράρτημα Β, είναι το αντικείμενο μελέτης του επόμενου κεφαλαίου και οφείλεται στον Vuo (989). Πριν από αυτόν τον προσδιορισμό, θα αποδειχθεί μια πρόταση η αναγκαιότητα της οποίας θα γίνει αντιληπτή στην επόμενη ενότητα. * Πρόταση 5.. Αν ισχύουν οι υποθέσεις -3 και 7 του Παραρτήματος Β, τότε η ποσότητα E X θ* h X γ* E h X θ* E h X γ* E l X, E l X, E l X, E l X, h θ* h γ* h θ* h γ* l, l, l, l, είναι πεπερασμένη.

Απόδειξη Οι όροι E l X, θ και E l X, h * h γ * είναι πεπερασμένοι σύμφωνα με την Υπόθεση 7 του Παραρτήματος Β. Επίσης, οι όροι E l X, θ, E l h * X, h * θ* γ h * E l X, h * γ και E l X, E l X, h γ είναι πεπερασμένοι σύμφωνα με την Υπόθεση 3 του Παραρτήματος Β. Τέλος, από την ανισότητα Cauchy-Schwarz προκύπτει ότι: θ γ * * θ* γ * E l X, l X, E l X, E l X,. h h h Επομένως, λαμβάνοντας υπόψη και την Υπόθεση 3 του Παραρτήματος Β, ο όρος E l X, * l X, h * θ γ είναι πεπερασμένος και η απόδειξη ολοκληρώθηκε. 5. Η Μεθοδολογία Στην ενότητα αυτή θα παρουσιαστεί η μεθοδολογία του Vuo (989) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Ειδικότερα, θα δοθούν τα απαραίτητα λήμματα και θεωρήματα για την εύρεση της κατανομής, υπό τη μηδενική υπόθεση, της στατιστικής συνάρτησης που προτάθηκε από τον Vuo (989) για τον εν λόγω έλεγχο. Τέλος, θα δοθεί η κρίσιμη περιοχή του στατιστικού ελέγχου. Όπως έχει ήδη αναφερθεί στην προηγούμενη ενότητα, ο Vuo (989) πρότεινε έναν τρόπο ελέγχου της X, θ * H : E l 0, δηλαδή της υπόθεσης ότι οι δύο οικογένειες 0 h X, γ* 3

κατανομών περιγράφουν ισοδύναμα το τ.δ., έναντι μίας εκ των δύο εναλλακτικών όπως αυτές διατυπώθηκαν. Με βάση όσα αναφέρθηκαν στην προηγούμενη ενότητα ο στατιστικός έλεγχος της υπό μελέτης μηδενικής υπόθεσης βασίζεται στην ποσότητα LR θˆ, γ ˆ η ασυμπτωτική κατανομή της οποίας προσδιορίζεται στο ακόλουθο θεώρημα, λαμβάνοντας υπόψη και την Πρόταση 5... Θεώρημα 5.. (Vuo (989)) Αν ισχύουν οι υποθέσεις -3 και 7 του Παραρτήματος Β, τότε X, θ *.. LR θ ˆ, γˆ E l N 0, *, h X, γ* X, θ * όπου Var l, ή ισοδύναμα, * h X, γ * (5..) X, θ, * X θ * E l E l * h h X, γ X, * γ * (5..) με (βλέπε Πρόταση 5..). * Απόδειξη Έστω L θ l X, θ i και L γ l X, i i i γ. Επιπλέον, έστω θ και γ οι ψευδοαληθείς τιμές των παραμέτρων θ και γ, * * 4

αντίστοιχα. Αναπτύσσοντας κατά Taylor τις συναρτήσεις * L γ * γύρω από το σημείο θ ˆ και γ ˆ, αντίστοιχα, έχουμε ότι: και 5 L θ και ˆ L θ L θ θ ˆ θ A θ ˆ θ o * * *, p (5..3) L γ L γˆ γˆ γ A γˆ γ o * * *, p (5..4) όπου ο συμβολισμός o () δηλώνει τους όρους οι οποίοι συγκλίνουν p κατά πιθανότητα στο μηδέν, ενώ l X, γ A E h γ γ Εύκολα προκύπτει ότι: άρα, αντίστοιχα. * * * * l X, A E θ και h θθ LR θ, γ L θ L γ, (5..5) ˆ ˆ θ, γˆ θ, γ ˆ * * θ θ* θ θ* LR LR A γˆ γ * A γˆ γ * o. p Όμως, ισχύει ότι: ˆ * O p συμβολισμός θ θ και ˆ * O p γ γ, όπου ο O p δηλώνει ότι οι ποσότητες ˆ * θ θ και

ˆ * γ γ είναι φραγμένες κατά πιθανότητα. Έτσι, άμεσα προκύπτει ότι: X, θ, ˆ * * ˆ X θ LR θ, γ E l LR, * * E l o. h θ γ h p X, γ X, * γ* Από το Κεντρικό Οριακό Θεώρημα, έχουμε ότι ο όρος LR θ, γ * * συγκλίνει κατά κατανομή στην N (0, ), όπου * X, θ, * X θ * E l E l. * h h X, γ X, * γ * (5..6) Έπειτα από λίγη άλγεβρα προκύπτει ότι: θ γ θ γ E l X, θ E l X, γ E l X, θ E l X, γ * h * h * h * h * E l X, l X, E l X, E l X,. h * * h * h * Επομένως, σύμφωνα με την Πρόταση 5.. ισχύει ότι και η * απόδειξη ολοκληρώθηκε. Στο Θεώρημα 5.. αποδείχθηκε ότι αν ισχύουν οι υποθέσεις -3 και 7 του Παραρτήματος Β, τότε X, θ *.. LR θ ˆ, γˆ E l N 0, *, h X, γ* όπου η διακύμανση προσδιορίζεται μέσω της σχέσης (5..6). * Είναι άμεσα αντιληπτό ότι η διακύμανση αυτή δεν μπορεί να υπολογιστεί στην πράξη, καθώς εξαρτάται από την άγνωστη 6

αληθινή κατανομή h. Επομένως, για να μπορεί να χρησιμοποιηθεί στην πράξη η παραπάνω στατιστική συνάρτηση θα πρέπει η άγνωστη διακύμανση να εκτιμηθεί κατάλληλα. * Στο πλαίσιο αυτό, δύο τρόποι εκτίμησης της άγνωστης διακύμανσης προτάθηκαν από τον Vuo (989). Ειδικότερα, ο Vuo (989) προτείνει ότι η άγνωστη διακύμανση μπορεί να εκτιμηθεί είτε από την ποσότητα ˆ ˆ X, θ X, θ i i ˆ l l, i X, γˆ i X, γˆ i i (5..7) είτε από την ποσότητα ˆ X, θ i l ˆ LR θ ˆ, γˆ. i X, γˆ i (5..8) Στο ακόλουθο λήμμα αποδεικνύεται ότι οι εκτιμητές αυτοί είναι συνεπείς εκτιμητές της πληθυσμιακής διακύμανσης *, που δόθηκε στη σχέση (5..6). Λήμμα 5.. (Vuo(989)) Αν ισχύουν οι υποθέσεις -3 και 7 του Παραρτήματος Β, τότε και (5..9) ˆ.. * 7

X, θ l,.. * E * h X, γ* (5..0) όπου ˆ και οι εκτιμητές της άγνωστης διακύμανσης δίνονται στις σχέσεις (5..7) και (5..8), αντίστοιχα. * που Απόδειξη Είναι ˆ ˆ X, θ X, θ i i ˆ l l. i X, γˆ i X, γˆ i i Από το Λήμμα 5.. ισχύει ότι ˆ X, θ i X, θ.. * E h i X, γˆ X, γ i * l l. (5..) Επειδή οι θ ˆ και γ ˆ είναι συνεπείς εκτιμητές των θ και γ * * αντίστοιχα, ισχύει ότι X, θˆ i X, θ.. i * l l. i X, γˆ i X, γ i i * (5..) Με εφαρμογή του Θεωρήματος του Jerich (969), προκύπτει ότι: 8

i.. i i X, θ X, θ X, θ l l dh X l hx dx, X X X * * *, γ,, * γ* γ* ή ισοδύναμα X, θ X, θ i *.. i * E h i, γ*, γ i i * l l, X X για κάθε θγ,. (5..3) Επομένως, συνδυάζοντας τις σχέσεις (5..) και (5..3) προκύπτει ότι Καθώς με.. ˆ * X, θ X, θ.. * * ˆ E l E l. h h * X, γ* X, γ* ˆ LR θˆ, γ ˆ,, και λαμβάνοντας υπόψη ότι από το Λήμμα 5.. ισχύει ότι: έχουμε ότι X, θ.. * LR θ ˆ, γˆ E l, h X, γ* 9

που ολοκληρώνει την απόδειξη. X, θ l,.. * E * h X, γ* Συνδυάζοντας τα αποτελέσματα του Θεωρήματος 5.. και του Λήμματος 5.. προκύπτουν δύο ουσιαστικά διαφορετικές στατιστικές συναρτήσεις, για τον έλεγχο της υπό μελέτης μηδενικής υπόθεσης, ανάλογα με τον τρόπο εκτίμησης της άγνωστης διακύμανσης συνάρτηση είναι:. Αν εκτιμηθεί από την ποσότητα * V T LR θˆ ˆ, γˆ, ˆ, η στατιστική ενώ αν η διακύμανση εκτιμηθεί από την ποσότητα * στατιστική συνάρτηση είναι: V T LR θˆ, γˆ. (5..4), η (5..5) Στο επόμενο Θεώρημα προσδιορίζεται η ασυμπτωτική κατανομή των T και V T. V Θεώρημα 5..3 (Vuo (989)) Αν ισχύουν οι υποθέσεις -7 του Παραρτήματος Β, τότε i) υπό την μηδενική υπόθεση ότι τα δύο μοντέλα είναι ισοδύναμα, ισχύει ότι: 30

και LR θˆ, γˆ.. T N V ˆ LR θˆ, γˆ.. T N V 0, 0,. (5..6) (5..7) ii) Υπό την υπόθεση ότι το τ.δ. περιγράφεται πιο ικανοποιητικά από την H και T.. (5..8) V T. (5..9).. V iii) Υπό την υπόθεση ότι το τ.δ. περιγράφεται πιο ικανοποιητικά από την H και T.. (5..0) V Απόδειξη T. (5..).. V Η απόδειξη του αποτελέσματος i) προκύπτει άμεσα συνδυάζοντας τα αποτελέσματα του Θεωρήματος 5.. και του Λήμματος 5.. και λαμβάνοντας υπόψη ότι προφανές, αφού, υπό την 0 * H, τα. Το αποτέλεσμα ii) είναι επίσης T και V T είναι αθροίσματα V 3

θετικών όρων. Όμοια, υπό την H, τα T και V T είναι αθροίσματα V αρνητικών όρων, άρα και το αποτέλεσμα iii) είναι προφανές. Παρατήρηση 5.. Οι λογάριθμοι των πιθανοφανειών που χρησιμοποιούνται στο στατιστικό του Vuo (989) επηρεάζονται αν ο αριθμός των άγνωστων παραμέτρων των υποθέσεων H και H που εκτιμούμε είναι διαφορετικός. Έτσι, ο Vuo (989) προτείνει τη θεώρηση της διορθωμένης στατιστικής συνάρτησης της μορφής: όπου K, ˆ ˆ ˆ ˆ LR θ, γ LR θ, γ K θ, γ, (5..) θγ ένας παράγοντας διόρθωσης. Στο πλαίσιο αυτό, ο Vuo (989) πρότεινε δύο διαφορετικούς παράγοντες διόρθωσης. Ο πρώτος βασίζεται στο κριτήριο πληροφορίας του Akaike (973) και είναι K θγ, p q, (5..3) ενώ ο δεύτερος βασίζεται στο κριτήριο πληροφορίας του Schwarz (978) και είναι ο: p q K θγ, l l, (5..4) όπου p και q ο αριθμός των εκτιμώμενων παραμέτρων των H και H, αντίστοιχα. Η μέθοδος του Vuo (989) θα αποσαφηνιστεί μέσω της εφαρμογής της στην επόμενη ενότητα. 3

Παρατήρηση 5.. α) Ο Vuo (989) συγκρίνοντας τη μεθοδολογία του με αυτή του Akaike (973, 974), για το πρόβλημα της επιλογής του καταλληλότερου μοντέλου, επισήμανε ότι η διαφορά μεταξύ τους έγκειται στο γεγονός ότι η προσέγγισή του είναι στοχαστική. Οι Amemiya (980) και McAleer ad Bera (983) ισχυρίστηκαν ότι η σημαντικότερη διαφορά μεταξύ του ελέγχου μη εμφωλευμένων υποθέσεων και επιλογής του καταλληλότερου μοντέλου είναι ότι η πρώτη διαδικασία επιτρέπει «ένα στοχαστικό ισχυρισμό σχετικά με την επιλογή μοντέλου», ενώ η δεύτερη όχι. Πλέον, με βάση την προσέγγιση του Vuo (989), ο ισχυρισμός αυτός καταρρίπτεται. Έτσι, όπως και στον κλασσικό έλεγχο υποθέσεων, τα αποτελέσματα σχετικά με την κατανομή της σ.σ. του Vuo (989) χρησιμοποιούνται για την ύπαρξη ενδείξεων υπέρ ενός εκ των δύο «ανταγωνιστικών» μοντέλων. Επομένως, δεν είναι απαραίτητη η επιλογή ενός εκ των δύο μοντέλων, αν αυτά είναι ισοδύναμα. β) Η διαφορά μεταξύ της προσέγγισης του Vuo (989) και του Cox (96, 96) έγκειται στην προς έλεγχο μηδενική υπόθεση. Ειδικότερα, οι προς έλεγχο υποθέσεις των δύο προσεγγίσεων είναι πανομοιότυπες, αν και μόνο αν οι υποθέσεις είναι πλήρως εμφωλευμένες (βλέπε Vuo (989), σελ 39). 5.3 Ειδική Περίπτωση Στην ενότητα αυτή αποσαφηνίζεται η μεθοδολογία του Vuo (989) που αναπτύχθηκε στην προηγούμενη παράγραφο αυτού του κεφαλαίου στην περίπτωση που τα δύο «ανταγωνιστικά» μοντέλα είναι αυτό της λογαριθμοκανονικής και της εκθετικής κατανομής. 33

Για τη θεωρητική εφαρμογή της μεθοδολογίας του Vuo (989) σε αυτήν την ειδική περίπτωση ουσιαστικά απαιτείται η υλοποίηση των ακόλουθων βημάτων. Βήμα Ο : Εύρεση των Ε.Μ.Π. θ ˆ και. Οι Ε.Μ.Π. θ ˆ και δίνονται ˆ ˆ στις σχέσεις (.3.), (.3.) και (.3.3), αντίστοιχα. Βήμα ο : Υπολογισμός της LR ˆ θ ˆ X, θˆ i, l. X, ˆ i i Λαμβάνοντας υπόψη τις σχέσεις () και (8) του Παραρτήματος Α, εύκολα προκύπτει ότι: X, θˆ i ˆ, ˆ l l l ˆ LR θ X l ˆ, i i X, ˆ i i ή ισοδύναμα ˆ ˆ ˆ ˆ LR θ, l l ˆ. (5.3.) Επιπρόσθετα μπορούν να βρεθούν τα διορθωμένα στατιστικά χρησιμοποιώντας ως παράγοντα διόρθωσης είτε τον όρο K θ, p q, είτε τον όρο p q K θ, l l l l l. Επομένως, και ˆ ˆ ˆ ˆ AIC LR θ, l l ˆ. (5.3.) 34

ˆ ˆ ˆ ˆ SIC LR θ, l l ˆ l, (5.3.3) αντίστοιχα. Βήμα 3 ο : Υπολογισμός είτε της είτε της, ˆ, ˆ X θ X θ i i ˆ l l, i X, ˆ i X, ˆ i i ˆ X, θ i l ˆ LR ˆ, ˆ. i X, ˆ θ i Είναι λαμβάνοντας υπόψη τις σχέσεις () και (8) του Παραρτήματος Α, και ˆ lx i ˆ ˆ X l l l ˆ i X i ˆ i ˆ LR ˆ θ, ˆ, ˆ lx i ˆ X ˆ i lx l l. i ˆ i ˆ 35

Βήμα 4 ο : Υπολογισμός της τιμής είτε της στατιστικής συνάρτησης ˆ LR θ, ˆ T, είτε της στατιστικής συνάρτησης V ˆ V T LR θˆ, ˆ. Εναλλακτικά, λαμβάνοντας υπόψη την Παρατήρηση 5.., μπορεί να υπολογιστούν οι αντίστοιχες διορθωμένες στατιστικές συναρτήσεις. i,. Έστω T οι παρατηρούμενες αυτές τιμές για i, obs V Βήμα 5 ο Κανόνας απόφασης: Με επίπεδο σημαντικότητας ισχύουν τα ακόλουθα: i) αν T i, obs V z, απορρίπτεται η μηδενική υπόθεση ότι οι δύο οικογένειες κατανομών περιγράφουν ισοδύναμα το τ.δ. και το τυχαίο δείγμα προέρχεται από την κατανομή H, ii) αν T iii) αν i, obs V z, απορρίπτεται η μηδενική υπόθεση ότι οι δύο οικογένειες κατανομών περιγράφουν ισοδύναμα το τ.δ. και το τυχαίο δείγμα προέρχεται από την κατανομή H, τέλος T i, obs V z /, δεν μπορούμε να διακρίνουμε ποια από τις δύο οικογένειες κατανομών μοντελοποιεί καλύτερα τις δειγματικές παρατηρήσεις. 36

ΚΕΦΑΛΑΙΟ 6 Μεθοδολογία του Clarke (003) Στο κεφάλαιο αυτό θα παρουσιαστεί μια ακόμη μεθοδολογία που ανήκει στην κατηγορία αυτών, όπου η μηδενική υπόθεση είναι ότι οι δύο κατανομές περιγράφουν το τ.δ. ισοδύναμα κι έχει ως εναλλακτικές ότι μία κατανομή είναι καλύτερη της άλλης. Ειδικότερα, αντικείμενο μελέτης αυτού του κεφαλαίου αποτελεί η μεθοδολογία που προτάθηκε από τον Clarke (003) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Ο Clarke (003), παρακινούμενος από τον Vuo (989) εφάρμοσε ένα τροποποιημένο προσημικό τεστ κατά ζεύγη στις διαφορές των λογαρίθμων των πιθανοφανειών δύο μη εμφωλευμένων μοντέλων. Επομένως, η ουσιαστική διαφοροποίηση της μεθοδολογίας του Clarke (003) σε σχέση με αυτή του Vuo (989) είναι ότι η αναμενόμενη τιμή που εμφανίζεται στη μηδενική υπόθεση της μεθοδολογίας του Vuo (989) αντικαθίσταται από τη διάμεσο. Επιπρόσθετα, η μεθοδολογία αυτή, όπως και του Vuo (989), έχει την επιθυμητή ιδιότητα ότι συμπίπτει με την αντίστοιχη των εμφωλευμένων μοντέλων. Στο πλαίσιο αυτό, στην Παράγραφο 6. παρατίθενται κάποιες εισαγωγικές έννοιες και ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί. Στην Παράγραφο 6. παρουσιάζεται η μεθοδολογία του Clarke (003), ενώ στην παράγραφο 6.3 η μέθοδος αποσαφηνίζεται μέσω της ειδικής περίπτωσης του ελέγχου της υπόθεσης αν ένα τυχαίο δείγμα μπορεί να θεωρηθεί ότι προέρχεται από την λογαριθμοκανονική ή την εκθετική κατανομή.

6. Εισαγωγή Στην παράγραφο αυτή για τη διευκόλυνση της μελέτης του κεφαλαίου, δίνονται κάποιες εισαγωγικές έννοιες, ο απαραίτητος συμβολισμός που θα χρησιμοποιηθεί στο κεφάλαιο αυτό καθώς και οι συνθήκες, υπό τις οποίες ισχύει η μεθοδολογία του Clarke (003). Στο προηγούμενο κεφάλαιο, αναφέρθηκε ότι ο Vuo (989) πρότεινε έναν τρόπο ελέγχου της υπόθεσης ότι δύο οικογένειες κατανομών περιγράφουν ισοδύναμα το τ.δ., έναντι της εναλλακτικής ότι το τ.δ. μπορεί να θεωρηθεί ότι περιγράφεται καλύτερα είτε από την H είτε από την H. Ουσιαστικά, το τεστ του Vuo (989), όπως είδαμε, ανάγεται στον έλεγχο της 38 X, θ * H : E l 0, 0 h X, γ* όπου θ και γ οι ψευδοαληθείς τιμές των παραμέτρων θ και γ, * * αντίστοιχα. Επομένως, ελέγχει αν η αναμενόμενη τιμή, υπό τη μηδενική υπόθεση, του πηλίκου των λογαρίθμων μέγιστων πιθανοφανειών είναι στατιστικά σημαντικά διάφορη ή όχι του μηδενός. Παρακινούμενος από την παραπάνω μεθοδολογία, ο Clarke (003) ανήγαγε το υπό μελέτη πρόβλημα στον έλεγχο αν η διάμεσος, υπό τη μηδενική υπόθεση, του πηλίκου των λογαρίθμων είναι στατιστικά σημαντικά διάφορη του μηδενός ή όχι. Η αιτιολόγηση της ιδέας αυτής έγκειται στο γεγονός ότι αν οι δύο οικογένειες κατανομών περιγράφουν ισοδύναμα το τυχαίο δείγμα, τότε η πιθανότητα το πηλίκο αυτό να είναι θετικό ή αρνητικό είναι ίση με 0.5. Σε διαφορετική περίπτωση, αν η πιθανότητα αυτή είναι μεγαλύτερη (μικρότερη) του 0.5 μπορούμε να πούμε ότι το τυχαίο δείγμα προέρχεται από την οικογένεια κατανομών αντίστοιχα). H ( H,

Από τα παραπάνω γίνεται ουσιαστικά αντιληπτό ότι κατά αυτόν τον τρόπο ο Clarke (003) ανήγαγε το πρόβλημα στον έλεγχο ότι η διάμεσος ενός πληθυσμού είναι ίση με το μηδέν, υπό την προϋπόθεση ότι: Υπόθεση : οι διαφορές i * i * ανεξάρτητες μεταξύ τους, και l X, θ l X, γ, i,,, είναι X, θ i * Υπόθεση : καθένα από τα l, i,,, προέρχεται από X, γ έναν πληθυσμό με συνεχή αθροιστική συνάρτηση κατανομής. Στο πλαίσιο αυτό και λαμβάνοντας υπόψη όσα προαναφέρθηκαν, ενδιαφερόμαστε να ελέγξουμε την υπόθεση ότι η διάμεσος m της άγνωστης κατανομής 0 0 i * X, θ* l X, γ * είναι ίση με m, δηλαδή τη μηδενική υπόθεση H : m 0 έναντι είτε της 0 H : m 0 είτε της H : m 0. Κλασσικοί τρόποι αντιμετώπισης του παραπάνου ελέγχου είναι το προσημικό τεστ (si test) και το τεστ του Wilcoxo (945). Το τεστ του Wilcoxo (945) στηρίζεται στις τάξεις (raks) των διαφορών των δειγματικών τιμών από την τιμή m, 0 αποκλείοντας από την περαιτέρω ανάλυση τις δειγματικές τιμές που είναι ίσες με 0 m και προϋποθέτει ότι οι διαφορές που προκύπτουν είναι συμμετρικές περί το μηδέν. Καθώς η υπόθεση αυτή δεν επαληθεύεται πάντοτε ο Clarke (003) τροποποιεί κατάλληλα το προσημικό τεστ, το οποίο προαπαιτεί μόνο ότι τα δεδομένα είναι διατάξιμα (βλέπε, μεταξύ άλλων, Kvam ad Vidakovic (007)). Για περισσότερες λεπτομέρειες σχετικές με αυτές τις μη παραμετρικές 39

μεθοδολογίες παραπέμπουμε μεταξύ άλλων στους Coover (999) και Kvam ad Vidakovic (007). Σε όσα ακολουθούν θα χρησιμοποιηθεί ο ακόλουθος συμβολισμός. Είναι ˆ ˆ d l X, θ l X, γ, (6..) i i i με θ ˆ και γ ˆ τους Ε.Μ.Π. των θ και γ, αντίστοιχα, και * * δηλαδή CL 0, i T I d, (6..) i T είναι το πλήθος των θετικών διαφορών CL ˆ ˆ i i θ γ, καθώς με I d l X, l X, συμβολίζεται η γνωστή ως δείκτρια συνάρτηση. A i, 0, di A, d A i 6. Η Μεθοδολογία Στην ενότητα αυτή, αρχικά, θα παρουσιαστεί η μεθοδολογία του Clarke (003) για την αντιμετώπιση του προβλήματος του ελέγχου των μη εμφωλευμένων μοντέλων. Ο Clarke (003), όπως έχει ήδη αναφερθεί, παρακινούμενος από τον Vuo (989), εφαρμόζει ένα τροποποιημένο προσημικό τεστ κατά ζεύγη στις διαφορές των λογαρίθμων των πιθανοφανειών δύο μη εμφωλευμένων μοντέλων για τον έλεγχο της ή ισοδύναμα της i i H : P l X, θ l X, γ 0.5 (6..) 0 * * 40

i i H : P l X, θ l X, γ 0 0.5, (6..) 0 * * όπου θ και γ οι ψευδοαληθείς τιμές των παραμέτρων θ και γ, * * αντίστοιχα. Στο ακόλουθο θεώρημα παρατίθεται το τροποποιημένο προσημικό τεστ, έτσι όπως αρχικά προτάθηκε από τον Clarke (003). Τα αποτελέσματα που δίνονται προκύπτουν με άμεση εφαρμογή του προσημικού τεστ. Θεώρημα 6.. (Clarke (003)) Υπό την προϋπόθεση ότι ισχύουν οι Υποθέσεις και που διατυπώθηκαν στην προηγούμενη ενότητα, η στατιστική συνάρτηση ˆ ˆ CL 0, i T I d, όπου i d l X, θ l X, γ, ακολουθεί, υπό τη μηδενική υπόθεση, i i i διωνυμική κατανομή με παραμέτρους και p 0.5, δηλαδή 0 T ~, p 0.5. CL H Απόδειξη Η απόδειξη ανάγεται στην απόδειξη για την κατανομή της στατιστικής συνάρτησης του προσημικού ελέγχου και παραλείπεται (βλέπε, μεταξύ άλλων, Gibbos (97), σελ. 68). Επομένως, χρησιμοποιώντας το Θεώρημα 6.. μπορούν να κατασκευαστούν οι κρίσιμες περιοχές τόσο για τους μονόπλευρους ελέγχους όσο και για τους δίπλευρους. Σε όσα ακολουθούν με obs T CL 4

συμβολίζεται η παρατηρούμενη τιμή της στατιστικής ελεγχοσυνάρτησης T. CL Έλεγχος ισοδύναμων μοντέλων έναντι της υπόθεσης ότι το τ.δ. μπορεί να θεωρηθεί ότι περιγράφεται καλύτερα από την H. Η μηδενική υπόθεση απορρίπτεται όταν T t, δηλαδή για ακέραιες τιμές μεγαλύτερες ή ίσες του t, όπου το σημείο t είναι τέτοιο ώστε: obs CL CL 0 CL CL P T t H P T t T B (6..3) αληθής ~,0.5. Δηλαδή, t είναι ο μικρότερος ακέραιος για τον οποίο επαληθεύεται η σχέση Τότε, tt 0.5. t τιμή obs / ~,0.5 p P T T T B 0.5. CL CL CL obs it i CL (6..4) Έλεγχος ισοδύναμων μοντέλων έναντι της υπόθεσης ότι το τ.δ. μπορεί να θεωρηθεί ότι περιγράφεται καλύτερα από την H. Η μηδενική υπόθεση απορρίπτεται όταν T t, δηλαδή για ακέραιες τιμές μικρότερες ή ίσες του t, όπου obs CL CL 0 CL CL αληθής ~,0.5, t είναι τέτοιο ώστε: P T t H P T t T B (6..5) 4

δηλαδή Επίσης, t είναι ο μεγαλύτερος ακέραιος τέτοιος ώστε: t 0.5. (6..6) t0 t p τιμή P T T obs / T ~ B,0.5 Δίπλευρος έλεγχος CL CL CL obs T CL i0 Η μηδενική υπόθεση απορρίπτεται όταν 0.5. i T t, δηλαδή για ακέραιες τιμές μικρότερες ή ίσες του obs CL 4 ακέραιες τιμές μεγαλύτερες ή ίσες του t, όπου 4 ακέραιοι αριθμοί που ικανοποιούν τις σχέσεις και CL 0 CL CL t και 3 T t ή obs CL 3 t ή για 3 t είναι οι 4 P T t H αληθής P T t T ~ B,0.5 /, (6..7) 3 3 CL 0 CL CL P T t H αληθής P T t T ~ B,0.5 /, (6..8) αντίστοιχα, δηλαδή 4 4 t είναι ο μεγαλύτερος ακέραιος τέτοιος ώστε: 3 ενώ t είναι ο μικρότερος ακέραιος έτσι ώστε: 4 t 3 0.5 /, (6..9) t0 t 0.5 /. (6..0) t tt4 43

Επίσης, αν mi obs obs, CL CL t 0.5. i0 i t T T, προκύπτει ότι p τιμή Για τον πιο εύκολο προσδιορισμό των κρίσιμων σημείων t, i i,,4, δίνονται οι τιμές της αθροιστικής συνάρτησης της διωνυμικής κατανομής με πιθανότητα επιτυχίας p 0.5 στο Παράρτημα Γ. Είναι προφανές ότι η μεθοδολογία του Clarke (003) θα έχει ίδιες ιδιότητες με αυτές του προσημικού ελέγχου. Δύο από τις γνωστές ιδιότητες του προσημικού ελέγχου είναι η αμεροληψία και η συνέπεια. Τέλος, ένας εναλλακτικός τρόπος ελέγχου για μεγάλες τιμές του μεγέθους δείγματος προκύπτει χρησιμοποιώντας την προσεγγιστική κατανομή, υπό τη μηδενική υπόθεση, της στατιστικής συνάρτησης T. Αποδεικνύεται, με άμεση εφαρμογή CL του Κεντρικού Οριακού Θεωρήματος, ότι υπό τη μηδενική υπόθεση και για μεγάλες τιμές του μεγέθους δείγματος. T 0.5 CL Z N 0,. (6..) 0.5 Τότε, η μηδενική υπόθεση ότι τα μοντέλα είναι ισοδύναμα απορρίπτεται έναντι μίας εκ των τριών ακόλουθων εναλλακτικών: i) H P X θ i * X γ i * ii) H P X i * X i * : l, l, 0 0.5, : l, θ l, γ 0 0.5 και 44

iii) H P X θ i * X γ i * αν : l, l, 0 0.5, i) Z z, ii) Z z και iii) Z z, αντίστοιχα. / Παρατήρηση 6.. α) Όπως και στο στατιστικό του Vuo (989), οι λογάριθμοι των πιθανοφανειών που χρησιμοποιούνται στο στατιστικό του Clarke (003) επηρεάζονται αν ο αριθμός των άγνωστων παραμέτρων των H και H που εκτιμούμε είναι διαφορετικός. Έτσι, χρησιμοποιείται σε τέτοιες περιπτώσεις διορθωμένο στατιστικό: όπου, το T T K θγ,, (6..) CL CL K θγ ένας παράγοντας διόρθωσης. Ο παράγοντας διόρθωσης που προτάθηκε από τον Clarke (003) είναι ο p q K θγ, l l, (6..3) όπου p και q ο αριθμός των εκτιμώμενων παραμέτρων των H και H, αντίστοιχα. β) Επισημαίνεται ότι στη σχέση (6..) μπορεί να χρησιμοποιηθεί, κατά τα γνωστά, η διόρθωση συνεχείας. 6.3 Ειδική Περίπτωση Στην ενότητα αυτή αποσαφηνίζεται η μεθοδολογία του Clarke (003) στην περίπτωση που τα δύο «ανταγωνιστικά» 45

μοντέλα είναι αυτό της λογαριθμοκανονικής και της εκθετικής κατανομής. Βήμα Ο : Εύρεση των Ε.Μ.Π. θ ˆ και ˆ lx ˆ και ˆ X. i i i i. Είναι ˆ l X, ˆ i i Βήμα ο : Υπολογισμός των διαφορών d ˆ X θ X ˆ i i i i,,. Εύκολα προκύπτει ότι: lx ˆ i i i i ˆ ˆ l, l,, ˆ X d lx l l ˆ. (6.3.) Βήμα 3 ο : Υπολογισμός της τιμής της στατιστικής συνάρτησης Η στατιστική συνάρτηση είναι CL 0, i T I d i lx ˆ i 0, ˆ X l l l ˆ i T I X, CL i ˆ i ˆ (6.3.) δηλαδή είναι ο αριθμός των θετικών διαφορών d, i,,. Βήμα 4 ο Υπολογισμός της παρατηρούμενης τιμής της σ.σ. της σχέσης (6.3.) και απόφαση σύμφωνα με όσα αναφέρθηκαν στην προηγούμενη ενότητα.. i 46

ΚΕΦΑΛΑΙΟ 7 Συγκριτική Μελέτη Προσομοίωσης Στα προηγούμενα κεφάλαια παρουσιάστηκαν και αναπτύχθηκαν οι κυριότερες μελέτες για το πρόβλημα που παρουσιάστηκε στο Κεφάλαιο και σχετίζεται με την επιλογή ενός εκ των δύο μη εμφωλευμένων μοντέλων. Στο κεφάλαιο αυτό και στο πλαίσιο του ελέγχου της λογαριθμοκανονικής έναντι της εκθετικής κατανομής, παρακινούμενοι από προγενέστερες μελέτες (βλέπε μεταξύ άλλων Jackso (968)) θα διεξάγουμε μία μελέτη προσομοίωσης για τη σύγκριση και την αξιολόγηση των μεθόδων που παρουσιάστηκαν στα προηγούμενα κεφάλαια. Ειδικότερα, το ενδιαφέρον θα επικεντρωθεί α) στο πόσο καλά προσεγγίζονται οι ασυμπτωτικές κατανομές των στατιστικών ελεγχοσυναρτήσεων από την κανονική κατανομή, β) στο εμπειρικό επίπεδο σημαντικότητας και γ) στην ισχύ των μεθόδων που συγκρίνονται. Η διάρθρωση του Κεφαλαίου 7 έχει ως εξής. Στην ενότητα 7. για την καλύτερη μελέτη αυτού του κεφαλαίου θα παραθέσουμε συγκεντρωτικά τα αποτελέσματα που προέκυψαν στα προηγούμενα κεφάλαια για την ειδική περίπτωση του ελέγχου των μη εμφωλευμένων μοντέλων της λογαριθμοκανονικής και της εκθετικής κατανομής. Στο πλαίσιο αυτό, θα προσδιοριστεί η μορφή της σ.σ. και θα δοθούν οι κανόνες απόφασης. Στην ενότητα 7. θα περιγραφεί η μελέτη προσομοίωσης που διεξήχθη και θα παρουσιαστούν τα αποτελέσματα αυτής. Ειδικότερα, το ενδιαφέρον θα επικεντρωθεί στη σύγκλιση των στατιστικών συναρτήσεων στην κανονική κατανομή και στην αξιολόγηση της απόδοσής τους ως προς το επίπεδο σημαντικότητας και την ισχύ. Τα αποτελέσματα αυτά θα συγκριθούν και με αποτελέσματα προγενέστερων μελετών προσομοίωσης, τα οποία και θα αναφερθούν.

7. Εισαγωγή Έστω X,, X ένα τυχαίο δείγμα το οποίο θέλουμε να ελέγξουμε αν μπορεί να θεωρηθεί ότι προέρχεται από την N ή από την Exp / l,, με σ.π.π. αυτές που δίνονται στις σχέσεις () και (7) αντίστοιχα, του Παραρτήματος Α. Στην ενότητα αυτή για την καλύτερη μελέτη αυτού του κεφαλαίου θα παραθέσουμε συγκεντρωτικά τα αποτελέσματα που προκύπτουν για την ειδική περίπτωση του ελέγχου αυτών των μη εμφωλευμένων μοντέλων. Σε όσα ακολουθούν είναι: ˆ l X, i ˆ X ˆ i l, ˆ X, i ˆ l ˆ, ˆ S Y Y Y i i i i i ˆ ˆ ˆ θ, Y lx, i,,, i i και ty i t m t e X. Y i i i exp 0.5, Y Yi i, Cox (96, 96): Σύμφωνα με τις σχέσεις (.3.33) και (.3.54), προκύπτει ότι υπό τη λογαριθμοκανονική κατανομή, T C ˆ l θˆ ˆ ˆ ˆ e ενώ, υπό την εκθετική κατανομή, ~ N(0,), 48

T C ˆ ˆ l ˆ ˆ 0.533 ~ N(0,). Κανόνας απόφασης (βλέπε Sayyareh et al. (00)) C C i) Απορρίπτουμε και τις δύο κατανομές αν T z και T z. ii) Δεν απορρίπτουμε κάποια από τις δύο κατανομές αν T z. C C T z και iii) Αποδεχόμαστε την εκθετική ενώ απορρίπτουμε την C C λογαριθμοκανονική αν T z και T z. iv) Αποδεχόμαστε την λογαριθμοκανονική ενώ απορρίπτουμε την C C εκθετική αν T z και T z. Atkiso (970): Σύμφωνα με τις σχέσεις (3.3.5) και (3.3.8) προκύπτει ότι υπό τη λογαριθμοκανονική κατανομή, T A ˆ θˆ ˆ ˆ ˆ e ~ N(0,), ενώ, υπό την εκθετική κατανομή, A T ˆ ˆ ˆ ˆ ˆ 0.533/ 49 ~ N(0,).

Κανόνας απόφασης (βλέπε Atkiso (970)) i) Αν ii) Αν iii) Αν iv) Αν A T A T A T A T απορρίπτουμε τη λογαριθμοκανονική κατανομή. z αποδεχόμαστε τη λογαριθμοκανονική κατανομή. z απορρίπτουμε την εκθετική κατανομή. z αποδεχόμαστε την εκθετική κατανομή. z Epps et al. (98): Σύμφωνα με τις σχέσεις (4.3.7) και (4.3.0) προκύπτει ότι, υπό τη λογαριθμοκανονική κατανομή, m t exp Y Yt S t Y E T t ~ N (0,), 4 4 exps t S t t S Y Y Y για τιμές του 0, εκθετική κατανομή, exp SYt SYt t S Y 0, ενώ, υπό την 4 4 t με t ( ) m t X t E Y T t ~ N (0,). t X t t t για t, με t 0,. Για την επιλογή του t βλέπε Κεφάλαιο 4. 50

Κανόνας απόφασης ˆ T t z. E i) Απορρίπτεται η λογαριθμοκανονική κατανομή αν ii) Απορρίπτεται η εκθετική κατανομή αν ˆ E T t z, όπου με ˆ και ˆ συμβολίζονται οι εκτιμητές των προσήμων των t, όπως αυτά προσδιορίστηκαν στις σχέσεις (4.3.3) και (4.3.4), αντίστοιχα, του Κεφαλαίου 4. Vuo (989): Όπως έχει ήδη αναφερθεί στο Κεφάλαιο 5, η ελεγχοσυνάρτηση που προτάθηκε από τον Vuo (989) δύναται να λάβει διαφορετικές μορφές ανάλογα με τον παράγοντα διόρθωσης που χρησιμοποιείται, καθώς και τον εκτιμητή της διακύμανσης. Σε όσα έπονται θα χρησιμοποιηθούν τα ακόλουθα: υπό την υπόθεση ότι οι δύο μη εμφωλευμένες κατανομές μοντελοποιούν ισοδύναμα το τ.δ. ισχύει ότι: με V ˆ ˆ ˆ l l ˆ T ~ N (0,), ˆ lx i ˆ l l ˆ X l ˆ i X i ˆ i ˆ ˆ ˆ l l ˆ. 5

Κανόνας απόφασης (Vuo (989)) i) Μοντελοποιεί καλύτερα τα δεδομένα η εκθετική αν T z V ii) Μοντελοποιεί καλύτερα τα δεδομένα η λογαριθμοκανονική αν T z. V iii) Οι δύο κατανομές είναι ισοδύναμες αν T z. Clarke (003): Υπό την υπόθεση ότι οι δύο μη εμφωλευμένες κατανομές μοντελοποιούν ισοδύναμα το τ.δ. και χρησιμοποιώντας τη διόρθωση που προτάθηκε από τον Clarke (003), ισχύει ότι:. V / ˆ lx adj i l l 0, ˆ X l ˆ i T I X CL i ˆ i ˆ 0.5l B,0.5. Κανόνας απόφασης με χρήση της διωνυμικής κατανομής (Clarke (003)): i) Μοντελοποιεί καλύτερα τα δεδομένα η εκθετική αν adj, obs CL F T. ii) Μοντελοποιεί καλύτερα τα δεδομένα η λογαριθμοκανονική αν adj, obs CL F T. iii) Οι δύο κατανομές είναι ισοδύναμες αν adj, obs adj, obs * F mi T, T, CL CL όπου με adj, obs CL F T, συμβολίζεται η τιμή της α.σ.κ. της B(,0.5) στην παρατηρούμενη τιμή της ελεγχοσυνάρτησης. 5

7. Μελέτη προσομοίωσης Στην ενότητα αυτή παρακινούμενοι, μεταξύ άλλων, από τους Jackso (968), Atkiso (970), Pereira (978), Epps et al. (98) και Sayyareh et al. (00), θα μελετήσουμε χρησιμοποιώντας την περίπτωση του ελέγχου των μη εμφωλευμένων μοντέλων της λογαριθμοκανονικής και της εκθετικής κατανομής τη συμπεριφορά των ελεγχοσυναρτήσεων των Cox (96, 96), Atkiso (970), Epps et al. (98), Vuo (989) και Clarke (003). Ειδικότερα, το ενδιαφέρον θα επικεντρωθεί α) στο πόσο καλά προσεγγίζονται οι ασυμπτωτικές κατανομές των στατιστικών ελεγχοσυναρτήσεων των Cox (96, 96), Atkiso (970) και Epps et al. (98) από την κανονική κατανομή, και στην αξιολόγησή όλων των μεθόδων ως προς το β) επίπεδο σημαντικότητας και γ) την ισχύ. Ταυτόχρονα, θα παρουσιαστούν και τα αποτελέσματα προγενέστερων μελετών. 7.. Αξιολόγηση της σύγκλισης των ελεγχοσυναρτήσεων Στην ενότητα αυτή θα διεξαχθεί μία μελέτη προσομοίωσης για την αξιολόγηση της σύγκλισης των ελεγχοσυναρτήσεων των Cox (96, 96), Atkiso (970) και Epps et al. (98). Η παρακίνηση για τη μελέτη αυτή προήλθε από προγενέστερες μελέτες που είναι διαθέσιμες στη βιβλιογραφία. Ειδικότερα, στο πλαίσιο του ελέγχου των μη εμφωλευμένων μοντέλων της λογαριθμοκανονικής και της εκθετικής κατανομής, ο Jackso (968) αξιολογεί τη σύγκλιση στην κανονική κατανομή της στατιστικής συνάρτησης του Cox (96, 96), ο Atkiso (970) τη σύγκλιση στην κανονική κατανομή της στατιστικής συνάρτησης που προτάθηκε από τον ίδιο. Αργότερα, ο Pereira (978) αξιολογεί τη σύγκλιση των στατιστικών συναρτήσεων των Cox (96, 96) και Atkiso (970), ενώ οι Epps et al. (98) διεξήγαγαν παρόμοια μελέτη για τη στατιστική συνάρτηση που πρότειναν. 53

Όπως ίσως γίνεται αντιληπτό, και όσο είμαστε σε θέση να γνωρίζουμε, δεν έχουν συγκριθεί οι μέθοδοι των Cox (96, 96), Atkiso (970) και Epps et al. (98). Επιπλέον, οι μελέτες αυτές στηρίζονται σε 500-000 προσομοιωμένα δείγματα. Οι δύο παραπάνω λόγοι αποτέλεσαν και το έναυσμα για την πραγματοποίηση μιας πιο εκτενούς μελέτης προσομοίωσης. Σχεδιασμός της μελέτης προσομοίωσης Παρόμοια με προγενέστερες μελέτες, θέλοντας να αξιολογήσουμε τη σύγκλιση των ελεγχοσυναρτήσεων των Cox (96, 96), Atkiso (970) και Epps et al. (98) αρχικά προσομοιώνουμε 0.000 δείγματα μεγέθους 5,50,00,50,00 από την λογαριθμοκανονική κατανομή με παραμέτρους 0 και 0.,0.5,0.8,,,4,5. Για καθένα συνδυασμό των παραπάνω C A E παραμέτρων υπολογίζονται οι τιμές των T, T, και T, δηλαδή υπολογίζονται 0.000 τιμές αυτών υπό τη μηδενική υπόθεση. Επίσης, υπολογίζονται οι τιμές των 54 C A E T, T και T, δηλαδή υπολογίζονται 0.000 τιμές αυτών υπό την εναλλακτική υπόθεση. Στους Πίνακες -6, παρατίθενται τα εμπειρικά αποτελέσματα για την αναμενόμενη τιμή, τη διακύμανση, τη λοξότητα και την κύρτωση αυτών. Έπειτα, προσομοιώνουμε 0.000 δείγματα μεγέθους 5,50,00,50,00 από την εκθετική κατανομή με παράμετρο και υπολογίζονται οι τιμές των C T, T A, και E T, δηλαδή υπολογίζονται 0.000 τιμές αυτών υπό τη μηδενική υπόθεση. Επίσης, υπολογίζονται οι τιμές των C T, T A, και E T, δηλαδή υπολογίζονται 0.000 τιμές αυτών, υπό την εναλλακτική υπόθεση. Στους Πίνακες 7 και 8 παρατίθενται τα εμπειρικά αποτελέσματα για

την αναμενόμενη τιμή, τη διακύμανση, τη λοξότητα και την κύρτωση αυτών. Παρουσίαση και ανάλυση των αποτελεσμάτων Πίνακας : Κατανομή της T υπό τη μηδενική υπόθεση C 55

Πίνακας : Κατανομή της T υπό τη μηδενική υπόθεση A 56

Πίνακας 3: Κατανομή της T υπό τη μηδενική υπόθεση E 57

Πίνακας 4: Κατανομή της T υπό την εναλλακτική υπόθεση C 58

Πίνακας 5: Κατανομή της T υπό την εναλλακτική υπόθεση A 59

Πίνακας 6: Κατανομή της T υπό την εναλλακτική υπόθεση E 60

Πίνακας 7: Κατανομή των T, T και T υπό τη μηδενική υπόθεση C A E 6

Πίνακας 8: Κατανομή των T, T και T υπό την εναλλακτική υπόθεση C A E 6

Από τους Πίνακες -3 προκύπτουν τα ακόλουθα συμπεράσματα: C α) Οι στατιστικές συναρτήσεις T, T A, και E T, προσεγγίζουν την κανονική κατανομή με πολύ αργό ρυθμό (βλέπε και Jackso, 968, Atkiso, 970) β) Φαίνεται η σ.σ. των Epps et al. (98) να υπερτερεί σε σχέση με αυτές των Cox (96, 96) και Atkiso (970), ως προς την ταχύτητα σύγκλισης. γ) Η στατιστική συνάρτηση του Atkiso (970) σε σύγκριση με αυτή του Cox (96, 96) προσεγγίζει καλύτερα την κανονική κατανομή όσον αφορά τη μέση τιμή και τη διακύμανση, ενώ αυτή του Cox (96, 96) προσεγγίζει καλύτερα την κανονική κατανομή όσον αφορά τη λοξότητα και την κύρτωση. Το συμπέρασμα αυτό έρχεται σε συμφωνία με τα αποτελέσματα του Atkiso (970) (βλέπε Atkiso (970), σελ. 338, Πίνακας 4) και παραπέμπουμε στον Pereira (977) για μια πρόσθετη ευρετική επεξήγηση. δ) Για και για μεγάλα μεγέθη δείγματος, π.χ. 00, η προσέγγιση της κανονικής κατανομής από τη στατιστική συνάρτηση του Cox (96, 96) είναι κακή. Αντίθετα, η προσέγγιση της κανονικής κατανομής των Epps et al. (98) παραμένει ακριβής μέχρι και για 4, και είναι αρκετά καλή ακόμα και για 5, για μικρά μεγέθη δείγματος. ( Epps et al. (98)). ε) Γενικότερα, παρατηρείται μια κακή προσέγγιση της κανονικής κατανομής όσο η τιμή της παραμέτρου αυξάνεται, παίρνοντας τιμές μεγαλύτερες της μονάδας και για τις τρεις στατιστικές συναρτήσεις, επηρεάζοντας περισσότερο τις T και T. C A 63

Από τον Πίνακα 4 προκύπτει ότι C στ) η στατιστική συνάρτηση T έχει αρνητική αναμενόμενη τιμή υπό την H, ενώ από τον Πίνακα 5 προκύπτει ότι ζ) για 0., 0.5 η στατιστική συνάρτηση A T έχει θετική αναμενόμενη τιμή υπό την H, κάτι που έρχεται σε συμφωνία με τα αποτελέσματα του Pereira (977). Από τον Πίνακα 7 παρατηρείται η) μια κακή προσέγγιση της κανονικής κατανομής από τις στατιστικές συναρτήσεις T, T, και T. C A Από τα προηγούμενα ίσως γίνεται αντιληπτό ότι η μέθοδος των Epps et al. (98), παρότι πιο περίπλοκη ίσως είναι προτιμότερη για το συγκεκριμένο έλεγχο συγκριτικά με αυτές των Cox (96, 96) και Atkiso (970), με κριτήριο την ταχύτητα σύγκλισης. Όμως ασφαλέστερα συμπεράσματα θα εξαχθούν μετά τη μελέτη προσομοίωσης της επόμενης ενότητας. E 7.. Αξιολόγηση της απόδοσης Στην ενότητα αυτή το ενδιαφέρον θα επικεντρωθεί στην αξιολόγηση της απόδοσής των ελεγχοσυναρτήσεων που παρουσιάστηκαν σε αυτήν τη μεταπτυχιακή διατριβή για την περίπτωση του ελέγχου των μη εμφωλευμένων μοντέλων της λογαριθμοκανονικής και της εκθετικής κατανομής ως προς το επίπεδο σημαντικότητας και την ισχύ. Η παρακίνηση για τη μελέτη αυτή προήλθε από προγενέστερες μελέτες που είναι διαθέσιμες στη βιβλιογραφία. Ειδικότερα, στο πλαίσιο του ελέγχου των μη 64

εμφωλευμένων μοντέλων της λογαριθμοκανονικής και της εκθετικής κατανομής, ο Jackso (968) υπολόγισε την ισχύ των στατιστικών συναρτήσεων C T και C T του Cox (96, 96), υποθέτοντας ότι οι κατανομές τους υπό τις αντίστοιχες εναλλακτικές υποθέσεις είναι κανονικές. Αργότερα, ο Pereira (978) μελέτησε την ισχύ και το επίπεδο σημαντικότητας των μεθοδολογιών του Cox (96, 96) και του Atkiso (970) και τις συνέκρινε μεταξύ τους. Οι Epps et al. (98) μελέτησαν το επίπεδο σημαντικότητας και την ισχύ της μεθοδολογίας τους κάνοντας μια σύγκριση με την αντίστοιχη του Cox (96, 96), ενώ οι Sayyareh et al. (00), στο πλαίσιο της επιλογής του καταλληλότερου μεταξύ δύο «ανταγωνιστικών μοντέλων», υπολόγισαν τη σχετική συχνότητα των στατιστικών τεστ των Cox (96, 96), Vuo (989) και Clarke (003) για καθεμία από τις δυνατές αποφάσεις αυτών. Όπως ίσως γίνεται αντιληπτό, και όσο είμαστε σε θέση να γνωρίζουμε, δεν έχουν συγκριθεί οι μέθοδοι των Κεφαλαίων -6. Επιπλέον, οι προγενέστερες μελέτες στηρίζονται επί το πλείστον σε 500-000 προσομοιωμένα δείγματα. Οι δύο παραπάνω λόγοι αποτέλεσαν και το έναυσμα για την πραγματοποίηση μιας πιο εκτενούς μελέτης προσομοίωσης. Σχεδιασμός της μελέτης προσομοίωσης Αρχικά προσομοιώνουμε 0.000 δείγματα μεγέθους 5,50,00,50,00 από την λογαριθμοκανονική κατανομή με παραμέτρους 0 και 0.,0.5,0.8,,,4,5. Για καθένα συνδυασμό των παραπάνω παραμέτρων υπολογίζονται οι τιμές των T, T, C A E T, T, T, T, T και C A E V 65 adj T. Παρόμοια, προσομοιώνουμε CL 0.000 δείγματα μεγέθους 5,50,00,50,00 από την εκθετική

κατανομή με παράμετρο και υπολογίζονται οι τιμές των παραπάνω στατιστικών συναρτήσεων. Με βάση τις τιμές αυτών και τους κανόνες που συγκεντρωτικά δόθηκαν στη ενότητα 7. λαμβάνουμε την αντίστοιχη απόφαση. Τα αποτελέσματα αυτής της μελέτης προσομοίωσης δίδονται στους Πίνακες 9 και 0. Παρουσίαση και ανάλυση των αποτελεσμάτων Ειδικότερα, παρακινούμενοι από τους Sayyareh et al. (00), στον Πίνακα 9 παρατίθενται τα αποτελέσματα που αφορούν τη σχετική συχνότητα του στατιστικού τεστ του Cox (96, 96) για καθεμία από τις τέσσερις δυνατές αποφάσεις, γεννώντας δείγματα από τη λογαριθμοκανονική και την εκθετική κατανομή, ενώ στον Πίνακα 0 συγκεντρώνονται οι σχετικές συχνότητες των στατιστικών τεστ των Vuo (989) και Clarke (003) για καθεμία από τις τρεις δυνατές αποφάσεις, γεννώντας δείγματα από τη λογαριθμοκανονική και την εκθετική κατανομή Σύμφωνα με τα αποτελέσματα του Πίνακα 9, α) στην περίπτωση που τα δείγματα γεννώνται από τη λογαριθμοκανονική κατανομή, το στατιστικό τεστ του Cox (96, 96) αποδέχεται τη λογαριθμοκανονική και απορρίπτει την εκθετική κατανομή σε αρκετά ικανοποιητικό ποσοστό, για κάθε τιμή της παραμέτρου, ιδιαίτερα για μεγέθη δείγματος 00. Το αποτέλεσμα αυτό συμφωνεί με αυτό των Sayyareh et al. (00). Επισημαίνεται ότι για 5 και για τιμές της παραμέτρου 0.8,, παρουσιάζει ένα σημαντικό ποσοστό αποδοχής και των δύο κατανομών της τάξης του 35-50% περίπου. β) Στην περίπτωση που τα δείγματα γεννώνται από την εκθετική κατανομή, το στατιστικό τεστ του Cox (96, 96) αποδέχεται την εκθετική και απορρίπτει τη λογαριθμοκανονική κατανομή σε αρκετά 66

ικανοποιητικό ποσοστό για μεγέθη δείγματος 00, ενώ για 5, 50 παρουσιάζει μεγαλύτερο ποσοστό αποδοχής και των δύο κατανομών, ακόμα και της τάξης του 90%, όταν 5. Επιπρόσθετα, από τα αποτελέσματα του Πίνακα 0, προκύπτει ότι γ) στην περίπτωση που τα δείγματα γεννώνται από τη λογαριθμοκανονική κατανομή, τα στατιστικά τεστ των Vuo (989) και Clarke (003) επιλέγουν ως καλύτερη κατανομή να περιγράψει τα δεδομένα τη λογαριθμοκανονική σε αρκετά ικανοποιητικό ποσοστό, όταν το μέγεθος του δείγματος είναι 00. Το συμπέρασμα αυτό έρχεται σε συμφωνία με αυτό των Sayyareh et al. (00, σελ. 80, Πίνακας ). δ) Όταν 00 και τα δύο στατιστικά τεστ εμφανίζουν μεγάλη πιθανότητα ισοδυναμίας των δύο κατανομών, και ιδιαίτερα αυτό του Clarke (003) της τάξης του 65%. Για μικρότερα μεγέθη δείγματος 5, 50 τα αποτελέσματα δεν είναι τόσο ξεκάθαρα, καθώς για τιμές της παραμέτρου 0.8 εμφανίζονται μεγάλες πιθανότητες ισοδυναμίας των δύο κατανομών και από τα δύο στατιστικά τεστ, ενώ για 0.5 καλύτερη φαίνεται να είναι η λογαριθμοκανονική κατανομή. ε) Στην περίπτωση που τα δείγματα γεννώνται από την εκθετική κατανομή, για μικρά μεγέθη δείγματος, το μεγαλύτερο ποσοστό των φορών οι δύο κατανομές προκύπτουν ισοδύναμες και από τα δύο στατιστικά τεστ, ενώ όσο το μέγεθος του δείγματος αυξάνεται η πιθανότητα να επιλεγεί η εκθετική κατανομή μεγαλώνει. Σε γενικές γραμμές μπορούμε να πούμε ότι και τα δύο στατιστικά τεστ επιλέγουν τις περισσότερες φορές το σωστό μοντέλο, όταν το μέγεθος του δείγματος είναι μεγάλο. 67

Από τα παραπάνω συμπεραίνουμε ότι δεν μπορεί να προταθεί κάποιο τεστ εκ των δύο ως καλύτερο. Παρακινούμενοι από τους Jackso (968), Pereira (978) και Epps et al. (98), στον Πίνακα παρουσιάζονται τα αποτελέσματα που αφορούν το εμπειρικό επίπεδο σημαντικότητας των C T, T A, και E T, δηλαδή οι εκτιμώμενες πιθανότητες απόρριψης της λογαριθμικής κατανομής με βάση 0.000 προσομοιωμένες τιμές. Οι τιμές αυτές προήλθαν προσομοιώνοντας δείγματα από τη λογαριθμική κατανομή για διάφορες τιμές της παραμέτρου και διάφορα μεγέθη δείγματος. Παρόμοια, στον Πίνακα παρουσιάζονται τα αποτελέσματα που αφορούν το εμπειρικό επίπεδο σημαντικότητας των T, T, και T, δηλαδή οι εκτιμώμενες πιθανότητες απόρριψης της εκθετικής κατανομής με βάση 0.000 προσομοιωμένες τιμές που προήλθαν προσομοιώνοντας δείγματα από την εκθετική κατανομή με παράμετρο, για διάφορα μεγέθη δείγματος. Τέλος, στον Πίνακα 3, C παρουσιάζονται τα αποτελέσματα που αφορούν την ισχύ των T, T A, και E T, δηλαδή οι εκτιμώμενες πιθανότητες απόρριψης της εκθετικής κατανομής με βάση 0.000 προσομοιωμένες τιμές που προήλθαν προσομοιώνοντας δείγματα από τη λογαριθμική κατανομή για διάφορες τιμές της παραμέτρου και διάφορα μεγέθη δείγματος, ενώ στον Πίνακα 4 παρουσιάζονται τα αποτελέσματα που αφορούν την ισχύ των T, T, και T, δηλαδή οι εκτιμώμενες πιθανότητες απόρριψης της λογαριθμικής κατανομής με βάση 0.000 προσομοιωμένες τιμές που προήλθαν προσομοιώνοντας δείγματα από την εκθετική κατανομή με παράμετρο για διάφορα μεγέθη δείγματος. Από τους Πίνακες -4 προκύπτουν τα ακόλουθα συμπεράσματα: 68 C C A A E E

α) Λαμβάνοντας ως μηδενική υπόθεση τη λογαριθμοκανονική κατανομή και ως εναλλακτική την εκθετική, σύμφωνα με τον Πίνακα, τα εμπειρικά επίπεδα σημαντικότητας είναι περίπου ίδια, όσον αφορά τις μεθοδολογίες των Cox (96, 96) και Atkiso (970), ενώ αυτά των Epps et al. (98) διαφέρουν σε σχέση με των δύο προαναφερθέντων και γίνονται πιο ακριβή όσο το μέγεθος του δείγματος αυξάνεται. β) Οι εκτιμητές του επιπέδου σημαντικότητας γίνονται πολύ συντηρητικοί για τα στατιστικά τεστ των Epps et al. (98), Cox (96, 96) και Atkiso (970), όσο η τιμή της παραμέτρου μεγαλώνει. Επιπλέον, για μικρά μεγέθη δείγματος, τα εμπειρικά επίπεδα σημαντικότητας του στατιστικού τεστ των Epps et al. (98) είναι πιο ακριβή, όταν η παράμετρος είναι μεγάλη (όμοια αποτελέσματα με αυτά των Epps et al. (98), σελ. 397, Πίνακας 3). γ) Αντιστρέφοντας τους ρόλους της μηδενικής και της εναλλακτικής υπόθεσης, με βάση τις πιθανότητες σφάλματος τύπου Ι που συγκεντρώνονται στον Πίνακα, τα εμπειρικά επίπεδα σημαντικότητας των τριών μεθοδολογιών διαφέρουν. Προκύπτει το στατιστικό τεστ των Epps et al. (98) να είναι πιο ακριβές από αυτό του Cox (96, 96) όσο το μέγεθος του δείγματος αυξάνεται. Στο σημείο αυτό και πριν προχωρήσουμε σε αξιολόγηση της απόδοσης των μεθόδων ως προς την ισχύ υπενθυμίζουμε ότι στη στατιστική βιβλιογραφία έχουν εμφανιστεί διάφοροι τρόποι αξιολόγησης της απόδοσης μιας μεθόδου ως προς το επίπεδο σημαντικότητας. Μεταξύ άλλων αναφέρουμε ότι ένα προσομοιωμένο επίπεδο σημαντικότητας, έστω ˆ, θεωρείτε ότι βρίσκεται κοντά στο πραγματικό, π.χ. 0.05, αν ˆ [0.0357,0.0695](Dale, 986). δ) Όσον αφορά την ισχύ, υπό τη λογαριθμοκανονική κατανομή, σύμφωνα με τον Πίνακα 4, η ισχύς του στατιστικού τεστ των Epps 69

et al. (98) είναι μεγαλύτερη από αυτή των στατιστικών τεστ των Cox (96, 96) και Atkiso (970), ιδιαίτερα για μικρά μεγέθη δείγματος. Επιπλέον, όσο το αυξάνει η ισχύς και των τριών τείνει στη μονάδα. Επομένως, το προτιμότερο στατιστικό τεστ φαίνεται να είναι αυτό των Epps et al. (98). Συγκρίνοντας την ισχύ των και T, προκύπτει ότι το στατιστικό τεστ T είναι προτιμότερο του T A A 70 C C T, καθώς η ισχύς του είναι μεγαλύτερη όταν τα μεγέθη του δείγματος είναι μικρά, κάτι που έρχεται σε συμφωνία με τα αποτελέσματα του Pereira (978) (βλέπε Pereira (978), σελ. 5, Πίνακας 5). ε) Υπό την εκθετική κατανομή, η ισχύς των στατιστικών συναρτήσεων των Epps et al. (98), Cox (96, 96) και Atkiso (970) εξαρτάται από την παράμετρο. Όπως φαίνεται στον Πίνακα 3, σε γενικές γραμμές η ισχύς τους είναι μεγάλη και προσεγγίζει τη μονάδα αρκετά γρήγορα, καθώς το μέγεθος του δείγματος αυξάνεται. Για τιμές της παραμέτρου 0.5, 0.8, η στατιστική συνάρτηση του Cox (96, 96) έχει πολύ μεγαλύτερη ισχύ από αυτή των Epps et al. (98) και Atkiso (970). Τέλος, για μεγάλες τιμές της παραμέτρου το στατιστικό τεστ των Epps et al. (98) είναι προτιμότερο των τριών, κάτι που έρχεται σε συμφωνία με τα αποτελέσματα των Epps et al. (98) (βλέπε Epps et al. (98), σελ. 396, Πίνακας ). Συνοψίζοντας, φαίνεται ότι η μέθοδος των Epps et al. (98), παρότι πιο περίπλοκη ίσως είναι προτιμότερη για το συγκεκριμένο έλεγχο συγκριτικά με αυτές των Cox (96, 96) και Atkiso (970), ενώ μεταξύ των Clarke (003) και Vuo (989) δεν μπορεί να προταθεί κάποια ως καλύτερη. Παρατήρηση 7.. α) Ο Pesara (984) απέδειξε ότι για τον έλεγχο της μηδενικής υπόθεσης ότι τα δεδομένα προέρχονται από την

l N, έναντι της εναλλακτικής ότι προέρχονται από την exp /, ότι το στατιστικό τεστ του Cox (96, 96) είναι κατά 7% ασυμπτωτικά πιο αποτελεσματικό από αυτό του Atkiso (970) (βλέπε Pesara (984), σελ. 50). Επιπλέον, για τον έλεγχο της μηδενικής υπόθεσης ότι τα δεδομένα προέρχονται από την exp / έναντι της εναλλακτικής ότι προέρχονται από την l N,, αν 9.5, τότε το στατιστικό τεστ του Cox (96, 96) είναι ασυμπτωτικά πιο αποτελεσματικό από αυτό του Atkiso (970), ενώ αν 9.5 τότε το στατιστικό τεστ του Atkiso (970) είναι ασυμπτωτικά πιο αποτελεσματικό από αυτό του Cox (96, 96) (βλέπε Pesara (984), σελ. 50). β) Ο Clarke (003) συγκρίνοντας τη μέθοδό του με αυτήν του Vuo (989) κατέληξε στο συμπέρασμα ότι για μεσόκυρτες κατανομές, όπως είναι η κανονική, το στατιστικό τεστ του Vuo (989) είναι προτιμότερο, ενώ για λεπτόκυρτες κατανομές, όπως είναι η Laplace, με λεπτότερες ουρές και ψηλότερες κορυφές, προτιμότερο είναι το στατιστικό τεστ του Clarke (003). Επιπλέον, οι Clarke ad Siorio (00) με βάση μια μελέτη προσομοίωσης συμπεραίνουν ότι το στατιστικό τεστ του Clarke (003) έχει μεγαλύτερη πιθανότητα να επιλέξει το λάθος μοντέλο, ενώ αυτό του Vuo (989) έχει μεγαλύτερη πιθανότητα να μην επιλέξει κανένα από τα δύο «ανταγωνιστικά» μοντέλα. Βέβαια, σύμφωνα με τους Clarke ad Siorio (00), η μεγαλύτερη ισχύς που παρουσιάζει το στατιστικό τεστ του Clarke (003) υπερκαλύπτει το μειονέκτημα αυτό. 7

Πίνακας 9: Σχετική συχνότητα του στατιστικού τεστ του Cox (96, 96) για καθεμία από τις τέσσερις δυνατές αποφάσεις 7

Πίνακας 0: Σχετική συχνότητα των στατιστικών τεστ των Vuo (989) και Clarke (003) για καθεμία από τις τρεις δυνατές αποφάσεις 73

Πίνακας : Μηδενική υπόθεση: λογαριθμοκανονική κατανομή, εναλλακτική υπόθεση: εκθετική κατανομή Μονόπλευρος έλεγχος 74

Πίνακας : Μηδενική υπόθεση: εκθετική κατανομή, εναλλακτική υπόθεση: λογαριθμοκανονική κατανομή Μονόπλευρος έλεγχος 75

Πίνακας 3: Μηδενική υπόθεση: εκθετική κατανομή, εναλλακτική υπόθεση: λογαριθμοκανονική κατανομή Μονόπλευρος έλεγχος 76