ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Σχετικά έγγραφα
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΟΜΕΑΣ ΜΑΘΗΜΑΤΙΚΩΝ. Διπλωματική Εργασία ΕΠΙΜΗΘΕΑΣ ΣΤΑΥΡΟΣ

ΤΟ ΜΟΝΤΕΛΟ ΑΝΑΛΟΓΙΚΩΝ ΚΙΝΔΥΝΩΝ ΤΟΥ COX ΚΑΙ ΕΦΑΡΜΟΓΗ ΣΤΗΝ R

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική. Εκτιμητική

Μέθοδος μέγιστης πιθανοφάνειας

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μαθηματική Εισαγωγή Συναρτήσεις

Τυχαία μεταβλητή (τ.μ.)

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Στατιστική Συμπερασματολογία

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ- 1 o ΔΙΑΓΩΝΙΣΜΑ

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. B. Πώς ορίζεται ο συντελεστής μεταβολής ή συντελεστής. μεταβλητότητας μιας μεταβλητής X, αν x > 0 και πώς, αν

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Γ. Β Α Λ Α Τ Σ Ο Σ. 4ο ΓΥΜΝΑΣΙΟ ΛΑΜΙΑΣ 1. Γιώργος Βαλατσός Φυσικός Msc

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Λύσεις των θεμάτων ΔΕΥΤΕΡΑ 19 ΙΟΥΝΙΟΥ 2017 ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ


Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

Ανάλυση επιβίωσης (survival analysis)

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μαθηματική Εισαγωγή Συναρτήσεις

3. Προσομοίωση ενός Συστήματος Αναμονής.

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ Οι συντεταγμένες ενός σημείου Απόλυτη τιμή...14

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Στοχαστικές Στρατηγικές

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ.

Πανεπιστήμιο Αιγαίου

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Ενδεικτικές ασκήσεις ΔΙΠ 50

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ. Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο.

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Πανεπιστήμιο Πελοποννήσου

ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ ΜΗ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ ΣΥΝΑΡΤΗΣΕΙΣ ΜΟΝΟΤΟΝΙΑ-ΑΚΡΟΤΑΤΑ-ΣΥΜΜΕΤΡΙΕΣ ΣΥΝΑΡΤΗΣΗΣ

Η Κανονική Κατανομή. Κανονικές Κατανομές με την ίδια διασπορά και διαφορετικές μέσες τιμές.

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

Δ Ι Α Γ Ω Ν Ι Σ Μ Α Σ Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α Γ Ε Ν Ι Κ Η Σ Π Α Ι Δ Ε Ι Α Σ. οι τιμές μιας μεταβλητής Χ ενός δείγματος πλήθους ν με k.

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

Γ. Πειραματισμός - Βιομετρία

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ Το μοντέλο αναλογικού κινδύνου του Cox στην Ανάλυση Επιβίωσης ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ελπίδα Θ. Παύλου Επιβλέπων: Πολυχρόνης Μωυσιάδης Καθηγητής Α.Π.Θ. Θεσσαλονίκη, Δεκέμβριος 2006

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ Το μοντέλο αναλογικού κινδύνου του Cox στην Ανάλυση Επιβίωσης ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ελπίδα Θ. Παύλου Επιβλέπων: Πολυχρόνης Μωυσιάδης Καθηγητής Α.Π.Θ. Εγκρίθηκε από την τριμελή εξεταστική επιτροπή την 20 Νοεμβρίου 2006 Π. Μωυσιάδης Φ. Κολυβά Μαχαίρα Ε. Μπόρα-Σέντα Καθηγητής Α.Π.Θ. Επ. Καθηγήτρια Α.Π.Θ. Επ. Καθηγήτρια Α.Π.Θ. Θεσσαλονίκη, Δεκέμβριος 2006

.. Ελπίδα Θ.Παύλου Πτυχιούχος Μαθηματικός Α.Π.Θ. Copyrght Ελπίδα Θ. Παύλου, 2006. Με επιφύλαξη παντός δικαιώματος. All rghts reserved. Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν τη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς τον συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευτεί ότι εκφράζουν τις επίσημες θέσεις του Α.Π.Θ.

ΠΕΡΙΛΗΨΗ Το μοντέλο αναλογικού κινδύνου του Cox είναι το πιο διαδεδομένο μοντέλο στην ανάλυση επιβίωσης και χρησιμοποιείται για την εύρεση της σχέσης μεταξύ μιας μεταβλητής που δηλώνει το χρόνο επιβίωσης ενός ατόμου και άλλων συμμεταβλητών. Οι παρατηρήσεις που εκφράζουν το χρόνο επιβίωσης του ατόμου μπορεί να είναι λογοκριμένες ή και πλήρεις. Το μοντέλο του Cox μοντελοποιεί τη συνάρτηση κινδύνου σε σχέση με άλλες μεταβλητές και είναι ένα ημιπαραμετρικό μοντέλο. Η εκτίμηση των συντελεστών παλινδρόμησης επιτυγχάνεται μέσω της συνάρτησης μερικής πιθανοφάνειας όταν δεν υπάρχουν λογοκριμένες παρατηρήσεις ή μέσω παραλλαγών αυτής όταν οι παρατηρήσεις είναι λογοκριμένες. Στα πρώτα τρία κεφάλαια αναπτύσσονται μέθοδοι που αφορούν την ανάλυση επιβίωσης γενικά, ενώ στα κεφάλαια 4, 5 και 6 αναπτύσσεται το μοντέλο αναλογικού κινδύνου του Cox. Συγκεκριμένα, στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στην ανάλυση επιβίωσης. Εισάγεται η έννοια της λογοκρισίας και δίνονται εκτιμήσεις των συναρτήσεων επιβίωσης. Στο δεύτερο κεφάλαιο αναπτύσσονται μη παραμετρικές μέθοδοι εκτίμησης των συναρτήσεων επιβίωσης και δίνονται εκτιμήσεις των συναρτήσεων επιβίωσης όταν υπάρχουν λογοκριμένες παρατηρήσεις. Το θέμα του τρίτου κεφαλαίου είναι οι μη παραμετρικές μέθοδοι για τη σύγκριση καμπύλων επιβίωσης. Το μοντέλο του Cox αναπτύσσεται στο τέταρτο κεφάλαιο, όπως και η έννοια της μερικής πιθανοφάνειας. Αναπτύσσονται επίσης μέθοδοι για τη σύγκριση συναρτήσεων επιβίωσης βάση του μοντέλου αναλογικού κινδύνου του Cox. Στο πέμπτο κεφάλαιο δίνονται διάφορες εφαρμογές στο μοντέλο του Cox και αναπτύσσονται επεκτάσεις του μοντέλου. Το τελευταίο κεφάλαιο ασχολείται με μεθόδους που εξετάζουν αν ισχύει η υπόθεση της αναλογικότητας των κινδύνων και με υπόλοιπα, που χρησιμοποιούνται για διάφορους ελέγχους που αφορούν την καταλληλότητα του μοντέλου. Σε κάθε κεφάλαιο, δίνονται οι συναρτήσεις του S-Plus και της R οι οποίες αντιμετωπίζουν τα αντίστοιχα προβλήματα. 5

ABSTRACT The Cox proportonal hazards model s the most well-recognsed model n survval analyss for explorng the relatonshp between a varable that s shows the survval tme of a person and other covarates. The observatons that shows the survval tme of a person mght be censored or uncensored. The Cox model s modellng the hazard functon and t s a semparametrc model. The regresson coeffcents are estmated by the partal lkelhood functon when there aren t any censored observatons or through modfcatons of the partal lkelhood when the observatons are censored. The frst three chapters are concerned wth the methods that are related wth survval analyss n general In chapters 4, 5 and 6 s developed the Cox proportonal hazards model. Partcularly, n the frst chapter s ntroduce survval analyss. It ntroduces the meanng of censorng and gves estmatons of survval functons. The second chapter developes non parametrc methods of estmatng survval functons and gves estmates of the survval functon when there are censored observatons. The subect of the thrd chapter s the non parametrc methods for the comparson of survval curves. The Cox proportonal hazards model s developed n the forth chapter and the meanng of partal lkelhood as well. Also, t s developed the methods for the comparson of survval functons based on Cox s proportonal hazards model. Chapter fve shows dfferent applcatons n the Cox model and develops generalzatons of the model. Last chapter concerns wth the methods that exmnes f the proportonalty assumpton s vald and wth resduals that are used for several tests that concerns wth the valdty of the model 6

ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ......5 ABSTRACT...... 6 ΠΕΡΙΕΧΟΜΕΝΑ......7 Κεφάλαιο Σελίδα 1. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ....11 1.1 Ορισμοί...11 1.2 Λογοκριμένα Δεδομένα...12 1.2.1 Είδη Λογοκριμένων δεδομένων...14 1.2.2 Προϋποθέσεις της ανάλυσης επιβίωσης...17 1.3 Συναρτήσεις του χρόνου επιβίωσης...18 1.4 Σχέσεις μεταξύ των συναρτήσεων επιβίωσης...20 2. ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΤΗΝ ΕΚΤΙΜΗΣΗ ΤΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΕΠΙΒΙΩΣΗΣ...31 2.1 Εκτιμητές γινομένου-ορίου...31 2.2 Καμπύλη επιβίωσης...33 2.3 Διάμεσος χρόνος επιβίωσης...35 2.4 Διαστήματα εμπιστοσύνης για το S(t)...40 2.5 Πίνακες επιβίωσης- Η αναλογιστική μέθοδος...44 2.6 Ο Nelson-Aalen εκτιμητής της αθροιστικής συνάρτησης κινδύνου......46 2.7 Περιγραφή των συναρτήσεων.....50 3. ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΤΗ ΣΥΓΚΡΙΣΗ ΚΑΜΠΥΛΩΝ ΕΠΙΒΙΩΣΗΣ......52 7

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης 3.1 Σύγκριση δύο καμπύλων επιβίωσης.......53 3.1.1 To Gehan s Generalzed Wlcoxon τεστ...54 3.1.2 Το τεστ των Cox-Mantel...56 3.1.3 To Logrank τεστ...57 3.1.4 Το Peto and Peto s Generalzed Wlcoxon τεστ...60 3.2 Κινδυνότητα...61 3.3 Το τεστ των Mantel και Haenszel...62 3.4 Σύγκριση κ (κ>2) καμπύλων επιβίωσης...63 4. ΤΟ ΜΟΝΤΕΛΟ ΑΝΑΛΟΓΙΚΟΥ ΚΙΝΔΥΝΟΥ ΤΟΥ COX....67 4.1 Εισαγωγή στο μοντέλο αναλογικού κινδύνου του Cox....67 4.1.1 Το μοντέλο του Cox...68 4.2 Εκτίμηση των συντελεστών παλινδρόμησης β....71 4.3 Έλεγχοι υποθέσεων... 76 4.3.1 Έλεγχοι λόγου πιθανοφάνειας...76 4.3.2 Έλεγχοι του Wald...76 4.3.3 Score tests...77 4.3.4 Διαστήματα εμπιστοσύνης...77 4.4 Σύγκριση κατανομών επιβίωσης... 78 4.4.1 Σύγκριση δύο κατανομών επιβίωσης...78 4.4.2 Σύγκριση m κατανομών επιβίωσης...87 4.5 Ύπαρξη δεσμών και μερική πιθανοφάνεια... 88 4.5.1 Πιθανοφάνεια του Berslow...89 4.5.2 Πιθανοφάνεια του Efron...89 4.5.3 Διακριτή πιθανοφάνεια...89 4.6 Εκτίμηση της αναφορικής συνάρτησης κινδύνου......94 4.7 Περιγραφή των συναρτήσεων coxph( ) και survdff( ).97 4.7.1 Συνάρτηση coxph( )...98 4.7.2 Συνάρτηση survdff( )...98 8

Περιεχόμενα 5. ΕΦΑΡΜΟΓΕΣ ΣΤΟ ΜΟΝΤΕΛΟ ΑΝΑΛΟΓΙΚΟΥ ΚΙΝΔΥΝΟΥ ΤΟΥ COX......99 5.1 Εφαρμογές στο μοντέλο αναλογικού κινδύνου του Cox......99 5.1.1 Προσαρμογή του μοντέλου του Cox με συνεχείς μεταβλητές...99 5.1.2 Προσαρμογή του μοντέλου του Cox με περισσότερες από μία μεταβλητή...101 5.1.3 Αλληλεπίδραση μεταβλητών...106 5.2 Επεκτάσεις του μοντέλου του Cox...108 5.2.1 Στρωματοποίηση...109 5.2.2 Μεταβλητές εξαρτώμενες από το χρόνο...115 5.2.2.1 Το γενικευμένο μοντέλο του Cox...116 5.2.2.2 Μορφή των δεδομένων...118 6. ΕΛΕΓΧΟΙ ΤΗΣ ΥΠΟΘΕΣΗΣ ΤΗΣ ΑΝΑΛΟΓΙΚΟΤΗΤΑΣ ΤΩΝ ΚΙΝΔΥΝΩΝ...121 6.1 Γραφικές μέθοδοι για τον έλεγχο της αναλογικότητας των κινδύνων...121 6.2 Έλεγχος της αναλογικότητας των κινδύνων βασισμένος στις ορισμένες εξαρτώμενες από το χρόνο μεταβλητές...127 6.3 Υπόλοιπα...129 6.3.1 Τα υπόλοιπα Cox-Snell...131 6.3.2 Τροποποιημένα Cox-Snell υπόλοιπα...132 6.3.3 Υπόλοιπα Schoenfeld...133 6.3.4 Υπόλοιπα martngale...135 6.3.5 Υπόλοιπα απόκλισης...136 ΠΑΡΑΡΤΗΜΑ Α... 137 ΠΑΡΑΡΤΗΜΑ Β... 143 ΒΙΒΛΙΟΓΡΑΦΙΑ... 157 9

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης 10

ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ 1.1 Ορισμοί Η ανάλυση επιβίωσης (survval analyss) είναι μια περιοχή έρευνας στη στατιστική, η οποία δημιουργήθηκε για την ανάλυση δεδομένων τα οποία δε μπορούν να επεξεργαστούν από τις συνηθισμένες στατιστικές μεθόδους. Τα δεδομένα αυτά δίνουν τη χρονική διάρκεια μέχρι να γίνει ένα συγκεκριμένο γεγονός. Ο χρόνος επιβίωσης ή χρόνος αποτυχίας (survval tme ή falure tme), αναφέρεται σε μια μεταβλητή που μετράει το χρόνο (ημέρες,εβδομάδες,μήνες, κλπ) που μεσολαβεί από τη στιγμή της έναρξης της παρακολούθησης ενός ατόμου (άνθρωπος, αντικείμενο, φαινόμενο κτλ.), μέχρι τη στιγμή που το άτομο θα αντιμετωπίσει το ενδεχόμενο. Παραδείγματα: Ο χρόνος μέχρι να πεθάνει ένας οργανισμός (ενδεχόμενο: θάνατος) Ο χρόνος μέχρι να ανταποκριθεί ένας ασθενής σε μια θεραπεία (ενδεχόμενο: ίαση) Ο χρόνος ζωής μιας ηλεκτρονικής συσκευής (ενδεχόμενο: βλάβη της συσκευής) Ο χρόνος επιβίωσης είναι το βασικό σημείο ενδιαφέροντος σε πολλές βιοχημικές εφαρμογές (π.χ. ο χρόνος μέχρι την αντίδραση ενός οργανισμού σε ένα φάρμακο), σε κοινωνικές (π.χ. ο χρόνος μέχρι την εγκυμοσύνη), οικονομικές επιστήμες (π.χ. ο χρόνος μέχρι ένας δείκτης να ξεπεράσει ένα όριο) καθώς και στη μηχανική (π.χ. ο χρόνος μέχρι να χαλάσει ένα εξάρτημα μιας μηχανής). Ενδεχόμενα ερωτήματα που μπορεί να προκύψουν είναι ο χαρακτηρισμός της κατανομής του χρόνου επιβίωσης, καθώς και η σύγκριση αυτού του χρόνου μεταξύ διαφορετικών ομάδων ή ακόμη η μοντελοποίηση της σχέσης του χρόνου επιβίωσης σε σχέση με άλλες μεταβλητές. 11

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης Οι χρόνοι επιβίωσης συνήθως έχουν μια κατανομή η οποία διαφέρει πολύ από την κανονική. Πολλές από τις συνηθισμένες στατιστικές μεθόδους προϋποθέτουν ότι η κατανομή της μεταβλητής που εξετάζουμε είναι κανονική, έτσι δεν είναι κατάλληλες τέτοιες μέθοδοι για την ανάλυση δεδομένων επιβίωσης Το ιδιαίτερο χαρακτηριστικό που εμφανίζεται στα δεδομένα επιβίωσης και δεν επιτρέπει τη χρήση των συνηθισμένων στατιστικών τεχνικών (όπως αναφέρθηκε στην αρχή), είναι ότι οι χρόνοι επιβίωσης ορισμένων παρατηρήσεων είναι λογοκριμένοι (censored). Αυτό συνήθως συμβαίνει επειδή τα άτομα μπορεί να εισέρχονται στη μελέτη σε διαφορετικούς χρόνους, με συνέπεια ο χρόνος παρακολούθησης μερικών ατόμων να μην είναι επαρκής ώστε να καταγραφεί ο χρόνος μέχρι την πραγματοποίηση του υπό μελέτη γεγονότος. 1.2 Λογοκριμένα Δεδομένα (Censored data) Λογοκριμένα δεδομένα, έχουμε όταν υπάρχουν παρατηρήσεις, των οποίων οι χρόνοι επιβίωσης δεν είναι ακριβείς. Η πληροφορία για το χρόνο επιβίωσης ενός ατόμου στην περίπτωση αυτή είναι μερική (αφού γνωρίζουμε μόνο ένα κάτω φράγμα του χρόνου επιβίωσης). Ο όρος censorng χρησιμοποιήθηκε για πρώτη φορά από τον Hald (1949). Τα δεδομένα που δεν είναι λογοκριμένα ονομάζονται μη-λογοκριμένα ή πλήρη δεδομένα Για να γίνει κατανοητή η έννοια των λογοκριμένων παρατηρήσεων, δίνεται ένα παράδειγμα στο οποίο υπάρχουν λογοκριμένες παρατηρήσεις. Παράδειγμα 1.1: Σε μια έρευνα για τη μελέτη της αποτελεσματικότητας μιας νέας θεραπείας για μια ασθένεια, η μεταβλητή που μας ενδιαφέρει είναι ο αριθμός των ημερών που θα επιζήσει ο κάθε ασθενής, δηλαδή ο χρόνος επιβίωσης κάθε ατόμου. Οι ασθενείς μπορεί να εισέρχονται στη μελέτη σε διαφορετικούς χρόνους, ενώ η διάρκεια της μελέτης είναι προεπιλεγμένη. Έτσι, για κάθε ασθενή, καταγράφεται ο χρόνος, από την είσοδό του στη μελέτη, μέχρι το θάνατό του. Στο τέλος της μελέτης, το πιθανότερο είναι να υπάρχουν 12

Εισαγωγή στην ανάλυση επιβίωσης ασθενείς που επέζησαν σε ολόκληρη τη διάρκεια της μελέτης (συνήθως οι ασθενείς που εισήλθαν αργά στη μελέτη), ενώ θα υπάρχουν ασθενείς με τους οποίους χάθηκε η επαφή. Ο χρόνος επιβίωσης των ατόμων αυτών, θα είναι τουλάχιστον όσο ο χρόνος από την είσοδο τους στη μελέτη, μέχρι τη στιγμή που ολοκληρώθηκε η μελέτη (για την πρώτη περίπτωση), και μέχρι τη στιγμή που χάθηκε η επαφή (στη δεύτερη περίπτωση). Αυτές οι παρατηρήσεις, είναι λογοκριμένες (censored) παρατηρήσεις. Σίγουρα, δε θα θέλαμε να αποκλείσουμε τα άτομα αυτά από τη μελέτη θεωρώντας τα ως ελλειπή δεδομένα. Κάτι τέτοιο, θα επηρέαζε πολύ την ανάλυση και τα αποτελέσματα που θα παίρναμε δε θα ήταν σωστά, αφού οι περισσότεροι από τους ασθενείς αυτούς είναι επιζώντες και επομένως αντανακλούν στην επιτυχία της νέας θεραπευτικής μεθόδου. Οι λογοκριμένες παρατηρήσεις δεν προκύπτουν μόνο λόγω του χρόνου λήξης της έρευνας, μπορεί να προκύψουν και σε άλλες περιπτώσεις: Όταν ο ασθενής χάνεται από την παρακολούθηση: Ο ασθενής μπορεί να αποφάσισε να μετακομίσει ή να αλλάξει θεράποντα ιατρό. Ο ασθενής αποσύρεται από την παρακολούθηση: Όταν η θεραπεία έχει πολύ κακές επιδράσεις, τότε είναι αναγκαίο ο ασθενής να σταματήσει τη θεραπεία. Ακόμη, μπορεί ο ασθενής να μην θέλει να λαμβάνει μέρος σε τέτοια διαδικασία μετά από κάποιο χρονικό διάστημα. Για να γίνουν κατανοητά τα πιο πάνω, θεωρούμε το σχήμα 1 όπου φαίνονται οι χρόνοι μέχρι τον θάνατο τριών ασθενών: Ασθενής 1: Ασθενής 2: Ασθενής 3: Τ 3 + Τ 1 Τ 2 + 0 Χρόνος Τέλος μελέτης Σχήμα 1: Χρόνοι επιβίωσης τριών ασθενών 13

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης Ο ασθενής 1 εισέρχεται στη μελέτη στο χρόνο 0 και πεθαίνει στο χρόνο Τ 1, έτσι δίνει μια μη-λογοκριμένη (uncensored) παρατήρηση. Ο ασθενής 2 εισέρχεται αργότερα στη μελέτη και στο τέλος της μελέτης είναι ακόμη ζωντανός. Ο χρόνος επιβίωσης του δεν είναι γνωστός. Γνωρίζουμε μόνο ότι ο χρόνος επιβίωσης του είναι τουλάχιστον Τ 2. Έτσι, ο ασθενής 2 δίνει τη λογοκριμένη (censored) παρατήρηση Τ + 2. Ο ασθενής 3 δεν εισέρχεται στη μελέτη από την αρχή, χάνεται όμως από την παρακολούθηση πολύ πριν από το τέλος της μελέτης, δίνοντας έτσι μια λογοκριμένη παρατήρηση, Τ + 3. Σημείωση: Με + δίπλα από ένα χρόνο, θα συμβολίζουμε τις λογοκριμένες παρατηρήσεις. 1.2.1. Είδη λογοκριμένων δεδομένων Υπάρχουν 3 είδη λογοκρισίας. Η δεξιά λογοκρισία (rght censorng), η αριστερή λογοκρισία (left censorng) και η λογοκρισία διαστήματος (nterval censorng). Επιπλέον, η δεξιά λογοκρισία χωρίζεται σε 3 κατηγορίες, τη λογοκρισία τύπου Ι (Type I censorng), τη λογοκρισία τύπου ΙΙ (Type II censorng) και την τυχαία λογοκρισία (random censorng). Θεωρούμε ότι Τ είναι ο χρόνος επιβίωσης ή χρόνος αποτυχίας του ατόμου και u ο χρόνος στον οποίο σταματά η μελέτη. Δεξιά λογοκρισία (rght censorng): Στην περίπτωση αυτή, ο χρόνος επιβίωσης Τ, είναι μεγαλύτερος από το χρόνο u. Δηλαδή, δε γνωρίζουμε τον ακριβή χρόνο επιβίωσης του - στού ατόμου, γνωρίζουμε μόνο ότι ο χρόνος επιβίωσης του είναι στο διάστημα (u, ). H δεξιά λογοκρισία, είναι η πιο συνηθισμένη μορφή λογοκρισίας. Παρατηρείται σε περιπτώσεις όπου ένα άτομο χάνεται ή αποσύρεται από την παρακολούθηση, ή ακόμη όταν η μελέτη τερματίζεται σε ένα προκαθορισμένο χρόνο. Λογοκρισία τύπου Ι (Type I censorng): Όταν από την αρχή της έρευνας προκαθορίζεται ο χρόνος διάρκειάς της, έστω u, τότε έχουμε λογοκρισία τύπου Ι. Ο χρόνος u ονομάζεται χρόνος λογοκρισίας (censorng tme). Έτσι, ο ερευνητής καταγράφει τους χρόνους αποτυχίας ή επιβίωσης των ατόμων που απέτυχαν κατά 14

Εισαγωγή στην ανάλυση επιβίωσης τη διάρκεια της έρευνας, ενώ για τα υπόλοιπα άτομα το μόνο που είναι γνωστό είναι ότι οι χρόνοι επιβίωσης τους είναι μεγαλύτεροι από u. Στη λογοκρισία τύπου Ι, όταν δεν υπάρχουν απώλειες από ατυχήματα, όλες οι λογοκριμένες παρατηρήσεις ισούνται με το μήκος της περιόδου της μελέτης. Παράδειγμα 1.2: Θεωρούμε 8 ποντίκια (A,B,C,D,E,F,G,H) που υποβάλλονται σε διαδικασία καρκινογένεσης με εμβολιασμό καρκινικών κυττάρων την ίδια χρονική στιγμή. Μας ενδιαφέρει ο χρόνος που απαιτείται για την ανάπτυξη όγκου προκαθορισμένου μεγέθους. Ο ερευνητής αποφασίζει να τερματίσει το πείραμα μετά από 40 εβδομάδες (u=40). Από το σχήμα 2, βλέπουμε ότι οι ποντικοί Β, C, D, F και G ανέπτυξαν όγκο στους χρόνους 25, 22, 24, 8 και 38 αντίστοιχα (οι χρόνοι αυτοί είναι οι χρόνοι αποτυχίας), ενώ οι ποντικοί A,E και Η δεν ανέπτυξαν όγκο κατά τη διάρκεια της μελέτης, άρα οι χρόνοι επιβίωσης τους δεν είναι γνωστοί. Έτσι, τα δεδομένα επιβίωσης είναι 40+, 25, 22, 24, 40+, 8, 38 και 40+ εβδομάδες. Τα λογοκριμένα δεδομένα στην περίπτωση αυτή είναι τύπου Ι. Σχήμα 2: Ένα παράδειγμα λογοκριμένων δεδομένων τύπου Ι Λογοκρισία τύπου ΙΙ (Type II censorng): Στην λογοκρισία τύπου ΙΙ, η μελέτη συνεχίζεται μέχρι να αποτύχουν r άτομα. Ο αριθμός r καθορίζεται πριν την 15

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης έναρξη της μελέτης. Έτσι, αν έχουμε n άτομα υπό μελέτη, τότε στο τέλος της μελέτης, γνωρίζουμε τους χρόνους αποτυχίας r ατόμων, ενώ για τα υπόλοιπα n-r άτομα, γνωρίζουμε μόνο ότι ο χρόνος επιβίωσης τους είναι μεγαλύτερος από το χρόνο επιβίωσης των r ατόμων που απέτυχαν. Δηλαδή, στη λογοκρισία τύπου ΙΙ, οι λογοκριμένες παρατηρήσεις ισούνται με τη μεγαλύτερη μη-λογοκριμένη παρατήρηση. Για παράδειγμα, στο πείραμα με τα 8 ποντίκια, αν ο ερευνητής ήθελε να τερματίσει την έρευνα όταν 4 (r=4) από τους ποντικούς εμφανίσουν όγκο, τα δεδομένα που θα έπαιρνε θα ήταν: 25,22,24,8,25+,25+,25+,25+. Τυχαία Λογοκρισία (Random censorng): Στην περίπτωση αυτή, ο χρόνος λογοκρισίας που αντιστοιχεί σε κάθε υπό παρακολούθηση άτομο δεν είναι σταθερός, αλλά είναι τυχαίος. Για παράδειγμα, σε κλινικές μελέτες, ενώ οι χρονικές στιγμές έναρξης και λήξης της έρευνας είναι προκαθορισμένες, οι ασθενείς εισέρχονται σε αυτή σε διαφορετικές (τυχαίες) χρονικές στιγμές, με αποτέλεσμα οι χρόνοι λογοκρισίας τους να είναι τυχαίοι. Αριστερή Λογοκρισία (left censorng): Το μόνο που είναι γνωστό στην περίπτωση αυτή, είναι ότι ο χρόνος επιβίωσης, Τ είναι μικρότερος από ένα χρονικό διάστημα. Ο ακριβής χρόνος επιβίωσης δεν είναι γνωστός. Παράδειγμα 1.3: Στην πιθανή ερώτηση Πότε κάπνισες για πρώτη φορά;, θα παίρναμε τριών ειδών απαντήσεις: 1. Ακριβής ηλικία στην οποία το άτομο κάπνισε για πρώτη φορά μη-λογοκριμένη παρατήρηση. 2. Δεν κάπνισα ποτέ δεξιά λογοκριμένη παρατήρηση (διότι μπορεί να αρχίσει το κάπνισμα μετά το τέλος της μελέτης) και 16

Εισαγωγή στην ανάλυση επιβίωσης 3. Κάπνισα (ή καπνίζω), αλλά δε θυμάμαι πότε ήταν η πρώτη φορά αριστερά λογοκριμένη παρατήρηση (αφού ο ακριβής χρόνος επιβίωσης δεν είναι γνωστός και είναι μικρότερος από την ηλικία του ερωτόμενου). Λογοκρισία σε διάστημα (Interval censorng): Στη λογοκρισία σε διάστημα, γνωρίζουμε μόνο ότι ο χρόνος επιβίωσης, Τ, βρίσκεται σε ένα διάστημα (U 1,U 2 ). Αυτού του είδους η λογοκρισία, παρατηρείται συνήθως όταν έχουμε περιοδική παρακολούθηση. Παράδειγμα 1.4: Έστω ότι μια ομάδα ατόμων που είχαν μια ασθένεια και είναι τώρα σε ύφεση μετά από χειρουργική επέμβαση, εξετάζεται ανά τακτά χρονικά διαστήματα (έστω κάθε μήνα), για τυχόν υποτροπίαση της ασθένειας (χρόνος αποτυχίας=χρόνος υποτροπίασης). Τότε ο ακριβής χρόνος αποτυχίας δε θα είναι γνωστός, αλλά το μόνο που θα γνωρίζουμε είναι το χρονικό διάστημα στο οποίο παρουσιάστηκε το γεγονός. π.χ. αν για ένα ασθενή που εξετάζεται κάθε μήνα βρέθηκε τον τρίτο μήνα που εξετάστηκε ότι υποτροπίασε, γνωρίζουμε μόνο ότι ο χρόνος αποτυχίας για τον ασθενή αυτό είναι μεταξύ 61 και 90 ημέρες, χωρίς να είναι γνωστός ο ακριβής χρόνος. 1.2.2. Προϋποθέσεις της Ανάλυσης Επιβίωσης Οι μέθοδοι για την ανάλυση επιβίωσης, προϋποθέτουν ότι οι παρατηρήσεις είναι ανεξάρτητες. Επιπλέον, πρέπει να ισχύει ακόμη μία προϋπόθεση για τις μεθόδους που υπάρχουν για τα λογοκριμένα δεδομένα επιβίωσης, αυτή της ανεξάρτητης λογοκρισίας. Δηλαδή, ένα άτομο που είναι λογοκριμένο (censored) και είναι ζωντανό στο χρόνο t, πρέπει να έχει τον ίδιο κίνδυνο επακόλουθης αποτυχίας (ή να έχει την ίδια πιθανότητα να επιβιώσει) με ένα άτομο που είναι μη-λογοκριμένο (uncensored), στο χρόνο t. Στατιστικά, η προϋπόθεση αυτή, είναι ισοδύναμη με την ανεξαρτησία της διαδικασίας της λογοκρισίας με το χρόνο επιβίωσης. Έτσι, αν υπάρχουν λογοκριμένες παρατηρήσεις που προκύπτουν μόνο λόγω διαφορετικών εισόδων στη μελέτη, τότε η υπόθεση της ανεξαρτησίας φαίνεται να ισχύει. Όταν όμως οι λογοκριμένες παρατηρήσεις προκύπτουν επειδή χάθηκε το άτομο από την 17

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης παρακολούθηση, ή όταν προκύπτουν λόγω αποχώρησης του ασθενή από τη μελέτη εξαιτίας επιπλοκών της θεραπείας, τότε είναι πιθανόν η υπόθεση της ανεξαρτησίας να μην ισχύει. 1.3. Συναρτήσεις του χρόνου επιβίωσης Η κατανομή των χρόνων επιβίωσης, χαρακτηρίζεται συνήθως από τρεις συναρτήσεις, τη συνάντηση επιβίωσης (survvorshp functon), τη συνάρτηση πυκνότητας πιθανότητας (probablty densty functon) και τη συνάρτηση κινδύνου (hazard functon). Στην πράξη, οι τρεις αυτές συναρτήσεις μπορούν να χρησιμοποιηθούν για να επεξηγήσουν διαφορετικές όψεις των δεδομένων. Έστω Τ ο χρόνος επιβίωσης. 1. Συνάρτηση επιβίωσης (Survval ή survvorshp functon): Η συνάρτηση αυτή, που συμβολίζεται με S(t), ορίζεται ως η πιθανότητα το άτομο να επιβιώνει για χρόνο μεγαλύτερο του t: S(t)=P(ένα άτομο επιβιώνει για χρόνο μεγαλύτερο του t)=p(t>t) (1.1) Επειδή F(t)=P(T t)ή S(t)=1-F(t) (1.2) H S(t) είναι μια φθίνουσα συνάρτηση του t με τις ιδιότητες: S(t)=1 για t=0 και S(t)=0 για t= Δηλαδή, η πιθανότητα το άτομο να επιβιώνει τουλάχιστον στο χρόνο 0 είναι 1 και η πιθανότητα επιβίωσης σε ένα άπειρο χρόνο είναι 0. Η γραφική παράσταση του S(t) συναρτήσει του t ονομάζεται καμπύλη επιβίωσης (survval curve) και προτάθηκε από τον Berkson το 1942. 18

Εισαγωγή στην ανάλυση επιβίωσης Στην πράξη, όταν δεν υπάρχουν λογοκριμένες παρατηρήσεις, η συνάρτηση επιβίωσης εκτιμάται ως η αναλογία των ασθενών που επιβιώνουν για χρόνο μεγαλύτερο του t. αρ. ατό μων που επιβιώ νουν για χρόνο μεγαλύ τερο του t St ˆ( ) = (1.3) συνολικό ς αριθμό ς ατόμων Έστω ότι υπάρχουν n παρατηρήσεις. Τις ταξινομούμε σε αύξουσα σειρά και τις ονομάζουμε t (1), t (2),, t (k). Θα έχουμε τώρα κ διακεκριμένες παρατηρήσεις (παρατηρήσεις με τους ίδιους χρόνους επιβίωσης θα έχουν το ίδιο σύμβολο), τέτοιες ώστε: t (1) <t (2) <..<t (k). Για κάθε (πλήρη) χρόνο επιβίωσης, υπολογίζεται η αντίστοιχη συνάρτηση επιβίωσης. Όταν υπάρχουν λογοκριμένες παρατηρήσεις, τότε ο αριθμητής δε μπορεί πάντα να οριστεί. Για παράδειγμα αν έχουμε το σύνολο δεδομένων: 3,4,5,6+,6+,7,7,8+,10+ και θέλουμε να υπολογίσουμε το S ˆ(9), αυτό δε μπορεί να υπολογιστεί βάση της σχέσης (1.3), αφού δε γνωρίζουμε τον ακριβή αριθμό των ατόμων που επιβιώνουν σε χρόνο μεγαλύτερο του 9 (Μπορεί ο τέταρτος, ο πέμπτος και ο όγδοος ασθενής να επιβιώνουν για χρόνο μεγαλύτερο του 9, μπορεί και όχι). Το S ˆ(4) όμως μπορεί να υπολογιστεί, από τους 9 ασθενείς έχουν χρόνους επιβίωσης μεγαλύτερους του 4. 7 S ˆ(4) = αφού 7 9 Έτσι, όταν έχουμε λογοκριμένα δεδομένα καταφεύγουμε σε μη παραμετρικές μεθόδους για την εκτίμηση του St (), όπως είναι η μέθοδος γινομένου ορίου (product-lmt (PL) method) ή αλλιώς μέθοδος Kaplan-Meer ή στη μέθοδο των πινάκων επιβίωσης (lfe tables). Παράδειγμα 1.4: Εκτίμηση της καμπύλης επιβίωσης μη-λογοκριμένων δεδομένωνεφαρμογή με το S-Plus και την R : Οι χρόνοι ύφεσης της οξείας λευχαιμίας 42 ασθενών καταγράφηκαν από τον Frerech σε μια κλινική μελέτη που έγινε για να προσδιοριστεί η ικανότητα ενός φαρμάκου, του 6-MP (6-mercaptopurne) να διατηρεί την ύφεση. Οι ασθενείς χωρίστηκαν 19

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης τυχαία σε δύο ομάδες των 21 ατόμων η κάθε μία. Στη μία ομάδα (6-ΜP), οι ασθενείς λάμβαναν 6-MP ενώ στη δεύτερη ομάδα (Placebo) οι ασθενείς έπαιρναν ψευδοφάρμακο. Η μελέτη τερματίστηκε μετά από ένα χρόνο. Καταγράφηκαν οι ακόλουθοι χρόνοι σε εβδομάδες: 6-MP (21 ασθενείς): 10, 7, 32+, 23, 22, 6, 16, 34+, 32+, 25+, 11+, 20+, 19+, 6, 17+, 35+, 6, 13, 9+, 6+, 10+. Placebo (21 ασθενείς): 1,22,3,12,8,17,2,11,8,12,2,5,4,15,8,23,5,11,4,1,8. Πηγή Δεδομένων: Βιβλίο «Statstcal Models and Methods for Lfetme Data-Jerald F.Lawless, p.5» Επειδή η σχέση (1.3) χρησιμοποιείται για την εκτίμηση της συνάρτησης και της καμπύλης επιβίωσης μόνο για μη-λογοκριμένα δεδομένα, θα χρησιμοποιήσουμε μόνο τους χρόνους επιβίωσης της ομάδας Placebo και θα εκτιμήσουμε την καμπύλη επιβίωσης για τους ασθενείς της ομάδας αυτής. Η καμπύλη επιβίωσης και η συνάρτηση επιβίωσης για την ομάδα 6-ΜΡ μπορεί να εκτιμηθεί με τις μεθόδους που αναπτύσσονται στο κεφάλαιο 2. Όταν δίνεται ξεχωριστά ο χρόνος επιβίωσης κάθε ατόμου και στα δεδομένα αυτά δεν υπάρχουν λογοκριμένες παρατηρήσεις, τότε μπορεί να χρησιμοποιηθεί η συνάρτηση escfud (Estmated survval curve for uncensored data) για την εκτίμηση της καμπύλης επιβίωσης. #Estmated Survval Curve for Unsensored Data (escfud) # t: το διάνυσμα των χρόνων επιβίωσης escfud<-functon(t){ s0<-1 tme<-sort(t) s<-c() for( n 1:length(tme)) { s[]<-0 for( n 1:length(tme)) { s[]<-felse(tme[]>tme[],s[]+1,s[]+0)}} t1<-c(0,tme) st<-(c(s0,s/length(t))) plot(t1,st,type='s',xlab="",ylab="",axes=f,col=6) par(new=t) plot(t1,st,type="n",xlab="survval tme",ylab="estmated Survval functon") st } 20

Εισαγωγή στην ανάλυση επιβίωσης Με την εκτέλεση της συνάρτησης escfud με t<-c(1,22,3,12,8,17,2,11,8,12,2,5,4,15,8,23,5,11,4,1,8) παίρνουμε την συνάρτηση επιβίωσης (διάνυσμα st) και την καμπύλη επιβίωσης των δεδομένων (Διάγραμμα 1). Πίνακας 1: Εκτιμώμενη συνάρτηση επιβίωσης των χρόνων επιβίωσης των ατόμων που ανήκουν στην ομάδα Placebo Placebo t 0 1 2 3 4 5 8 11 12 15 17 22 23 Ŝ(t) 1 0.905 0.81 0.762 0.667 0.571 0.381 0.286 0.191 0.143 0.095 0.048 0 Estmated Survval functon 0.0 0.2 0.4 0.6 0.8 1.0 0 5 10 15 20 25 Survval tme Διάγραμμα 1: Καμπύλη Επιβίωσης της ομάδας Placebo Θεωρητικά, για τον υπολογισμό των St, ˆ( ) χρησιμοποιούμε τη σχέση 1.3. Ο παρονομαστής θα παίρνει στο παράδειγμα μας την τιμή 21, που είναι ο αριθμός των ατόμων της ομάδας Placebo που παίρνουν μέρος στη μελέτη. Για την εκτίμηση του S ˆ(1), βρίσκουμε τον αριθμό των ατόμων που έχουν χρόνο επιβίωσης μεγαλύτερο του t (1) =1. Υπάρχουν 19 άτομα με χρόνο επιβίωσης μεγαλύτερο της μίας εβδομάδας, έτσι, 19 S ˆ(1) = = 0,905. Όμοια, υπάρχουν 17 άτομα με χρόνο μεγαλύτερο του t (2) =2, συνεπώς, 21 21

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης 17 S ˆ(1) = = 0,810 και συνεχίζοντας με τον ίδιο τρόπο, βρίσκουμε τη συνάρτηση 21 επιβίωσης για κάθε (πλήρη) χρόνο επιβίωσης. 2. Συνάρτηση πυκνότητας πιθανότητας ή συνάρτηση πυκνότητας (Probablty densty functon ή densty functon: Όπως και με οποιαδήποτε άλλη συνεχή τυχαία μεταβλητή, η συνάρτηση πυκνότητας πιθανότητας του χρόνου επιβίωσης Τ, ορίζεται ως το όριο της πιθανότητας ότι ένα άτομο αποτυγχάνει σε ένα μικρό διάστημα (t,t+δt) ανά μονάδα πλάτους Δt. Μπορεί να εκφραστεί ως εξής: αρ. ατόμων που αποτυγχάνουν στο διάστημα (t,t+δt) f() t = (1.4) Δt ή Pt ( T< t+ Dt) f(t)= lm D t 0 Dt (1.4) Η καμπύλη της f(t) ονομάζεται καμπύλη πυκνότητας (densty curve). H συνάρτηση πυκνότητας έχει τις ακόλουθες δύο ιδιότητες: f(t) ³ 0 " t ³ 0 και f(t)=0 για t<0 Το εμβαδόν μεταξύ της καμπύλης πυκνότητας και του άξονα των t ισούται με 1. Στην πράξη, όταν δεν υπάρχουν λογοκριμένες παρατηρήσεις, η συνάρτηση πυκνότητας πιθανότητας f(t), εκτιμάται ως την αναλογία των ατόμων που αποτυγχάνουν σε ένα διάστημα ανά μονάδα πλάτους: αρ. ατόμων που αποτυγχάνουν στο διάστημα που ξεκινά στο χρόνο t fˆ( t ) = (συνολικός αριθμός ατόμων) *(πλάτος διαστήματος) (1.5) Όπως και με την εκτίμηση της συνάρτησης επιβίωσης, η σχέση (1.5) εφαρμόζεται μόνο όταν δεν υπάρχουν λογοκριμένα δεδομένα. 22

Εισαγωγή στην ανάλυση επιβίωσης 3. Συνάρτηση κινδύνου (hazard functon): Ο όρος αυτός χρησιμοποιήθηκε για πρώτη φορά από τον Barlow το 1963. Η συνάρτηση κινδύνου (h(t) ή λ(t)) καθορίζει το στιγμιαίο λόγο αποτυχίας στο Τ=t, δεδομένου της επιβίωσης στο χρόνο t και ορίζεται ως: Pt ( T< t+ D t T³ t) h(t)= lm (1.6) D t 0 Dt Από τις σχέσεις (1.4) και (1.6) παίρνουμε: Pt ( T< t+ D t) 1 f( t) f( t) h(t)= lm = f( t) = = D t 0 PT ( ³ t) D t PT ( ³ t) St ( ) 1 - Ft ( ) (1.7) Η συνάρτηση κινδύνου είναι γνωστή και ως στιγμιαίος λόγος αποτυχίας (nstantaneous falure rate) ή ως δεσμευμένος λόγος θνησιμότητας (condtonal mortalty). Η ποσότητα h(t)δt (Δt μικρό) είναι προσεγγιστικά η πιθανότητα θανάτου ενός ατόμου στο διάστημα [t,t+δt), γνωρίζοντας ότι το άτομο έχει επιβιώσει μέχρι τη χρονική στιγμή t. Στην πράξη, όταν δεν υπάρχουν λογοκριμένες παρατηρήσεις, η συνάρτηση κινδύνου εκτιμάται ως η αναλογία των ατόμων που αποτυγχάνουν σε ένα διάστημα ανά μονάδα χρόνου, δεδομένου ότι επιβίωσαν μέχρι την αρχή του διαστήματος: αρ. ατόμων που αποτυγχάνουν στο διάστημα που ξεκινά στο χρόνο t ht ˆ( ) = (αρ. ατόμων που είναι ζωντανά μέχρι το χρόνο t) *(πλάτος χρονικού διαστήματος) αρ. ατόμων που αποτυγχάνουν ανά μονάδα χρόνου στο διάστημα που ξεκινά στο t = αρ. ατόμων που είναι ζωντανά στο χρόνο t Οι ασφαλιστές χρησιμοποιούν συνήθως μία διαφορετική εκτίμηση της συνάρτησης κινδύνου, το μέσο λόγο κινδύνου του διαστήματος, στον οποίο οι αριθμοί των ασθενών που πεθαίνουν ανά μονάδα χρόνου στο διάστημα, διαιρείται με το μέσο αριθμό των επιζώντων στο μέσο σημείο του διαστήματος. ˆ * αρ. ατόμων που αποτυγχάνουν ανά μονάδα χρόνου στο διάστημα h () t = (1.8) 1 (αρ. ατόμων που επιβιώνουν μέχρι το t)- (αρ. αποτυχιών στο διάστημα) 2 23

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης Ο λόγος κινδύνου μπορεί να αυξάνει, να μειώνεται, να μένει σταθερός ή να δηλώνει μια πιο περίπλοκη διαδικασία. Στο σχήμα 3 φαίνονται διάφορες μορφές της συνάρτησης κινδύνου. Η συνάρτηση h 1 (t) είναι μια φθίνουσα συνάρτηση κινδύνου και δεν εμφανίζεται συχνά στην πράξη. Δείχνει ότι σε αρχικούς χρόνους ο κίνδυνος είναι μεγάλος, ενώ όσο περνάει ο χρόνος ο κίνδυνος μειώνεται. Η h 2 (t) είναι η λεκανοειδής καμπύλη (bathtub curve) όπως ονομάζεται, και περιγράφει την εξέλιξη της ανθρώπινης ζωής. Στη διάρκεια μιας αρχικής περιόδου, ο κίνδυνος είναι μεγάλος (υψηλή βρεφική θνησιμότητα), στη συνέχεια, μέχρι μια συγκεκριμένη ηλικία ο κίνδυνος παραμένει σταθερός ενώ σε μεγαλύτερες ηλικίες αυξάνεται ακόμη περισσότερο. Η h 3 (t) είναι μια σταθερή συνάρτηση κινδύνου, δηλαδή ο κίνδυνος παραμένει σταθερός. Αυτό συμβαίνει όταν π.χ. εξετάζουμε τον κίνδυνο θανάτου υγιών ατόμων ηλικίας 18-40, των οποίων οι κύριες αιτίες θανάτου είναι τα ατυχήματα. Η h 4 (t) είναι μια αύξουσα συνάρτηση, η οποία συναντάται συχνά. Με την πάροδο του χρόνου το ρίσκο κινδύνου αυξάνεται. Για παράδειγμα ασθενείς με οξεία λευχαιμία, έχουν ένα αυξανόμενο λόγο διακινδύνευσης. Τέλος, ασθενείς με φυματίωση έχουν ρίσκο που αυξάνεται αρχικά, ενώ μετά από θεραπεία μειώνεται και η συνάρτηση κινδύνου στην περίπτωση αυτή έχει τη μορφή της h 5 (t). Σχήμα 3: Παραδείγματα συναρτήσεων κινδύνου 24

Εισαγωγή στην ανάλυση επιβίωσης Η αθροιστική συνάρτηση κινδύνου (cumulatve hazard functon) ορίζεται ως: t Ht () = ς hx ( ) dx (1.9) 0 1.4 Σχέσεις μεταξύ των συναρτήσεων επιβίωσης Οι τρεις συναρτήσεις επιβίωσης είναι μαθηματικά ισοδύναμες. Αν δοθεί μία από αυτές, τότε μπορούμε να βρούμε τις άλλες δύο. Ήδη από τη σχέση (1.7), πήραμε ότι f () t ht () = St () Επειδή η συνάρτηση πυκνότητας πιθανότητας οποιασδήποτε κατανομής είναι ίση με την παράγωγο της συνάρτησης κατανομής της, έχουμε ότι: d d f () t = F() t = [1- S()] t = - SΆ() t (1.10) dt dt f(t)= ( ) Από τις σχέσεις (1.7) και (1.10), παίρνουμε ότι: - SΆ() t d ht () = = - ln St () (1.11) St () dt Ολοκληρώνοντας την (1.11) από 0 μέχρι t και χρησιμοποιώντας τη σχέση S(0)=1, έχουμε: ς t hxdx ( ) =- [ln St ( ) - ln S (0) 0 0 ] ή Ht () =- ln( St ()) (1.12) ή St ( ) = exp[ - Ht ( )] (1.12) 25

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης Επίσης, από τη σχέση (1.7) και τη σχέση (1.12) παίρνουμε: f () t = h()exp[ t - H()] t (1.13) Παράδειγμα 1.5 Θέλουμε να βρούμε και να σχεδιάσουμε την εκτιμώμενη συνάρτηση επιβίωσης, την εκτιμώμενη συνάρτηση κινδύνου και την εκτιμώμενη συνάρτηση πυκνότητας. Τα δεδομένα είναι ομαδοποιημένα και επειδή είναι πλήρη μπορούν να χρησιμοποιηθούν οι σχέσεις που δόθηκαν στην παράγραφο 1.3. Ακολουθεί ένα μέρος των δεδομένων. Τα πλήρη δεδομένα βρίσκονται στο παράρτημα Α (Δεδομένα 1.5) Ζωντανά άτομα στο διάστημα: 1100 860 680 496 358 240 180 128 84 52 Θανάτοι στο διάστημα : 240 180 184 138 118 60 52 44 32 28 Στην πρώτη στήλη δίνεται το χρονικό διάστημα της παρακολούθησης. Οι χρονιές είναι χωρισμένες σε διαστήματα πλάτους 1 το κάθε ένα. Το 0 συμβολίζει την πρώτη χρονιά που άρχισε η παρακολούθηση. Δημιουργήθηκε μία επιπλέον στήλη, η τέταρτη που έχει τα κάτω άκρα των διαστημάτων. Στη δεύτερη στήλη δίνεται ο αριθμός των ζωντανών ατόμων στην αρχή του αντίστοιχου διαστήματος ενώ στην τρίτη στήλη υπάρχει ο αριθμός των ατόμων που πέθαναν στο αντίστοιχο χρονικό διάστημα. Για την εκτίμηση της συνάρτησης επιβίωσης θα χρησιμοποιήσουμε τη σχέση (1.3). Για το πρώτο χρονικό διάστημα, 0-1, έχουμε: 860 S ˆ(1) = = 0.7818, κλπ. 1100 1100 S ˆ(0) = = 1, για το δεύτερο: 1100 Για την εκτίμηση της συνάρτησης κινδύνου θα χρησιμοποιήσουμε τη σχέση (1.8). Για το πρώτο χρονικό διάστημα, έχουμε: 180 h ˆ(1) = = 0.2338, κλπ. 860-180 / 2 240 h ˆ(0) = = 0.2449, για το δεύτερο: 1100-240 / 2 26

Εισαγωγή στην ανάλυση επιβίωσης Για την εκτίμηση της συνάρτησης κινδύνου θα χρησιμοποιήσουμε τη σχέση (1.5). Για το πρώτο χρονικό διάστημα, έχουμε: 180 f ˆ(1) = = 0.1636, κλπ. 1100 240 f ˆ(0) = = 0.2182, για το δεύτερο: 1100 Με τη βοήθεια του S-Plus και της R βρέθηκαν οι πιο πάνω ποσότητες. Το πρόγραμμα που χρησιμοποιήθηκε βρίσκεται στο παράρτημα Β (Πρόγραμμα 2), ενώ τα αποτελέσματα παρουσιάζονται στον πίνακα 2. Επίσης, παρουσιάζονται οι καμπύλες των εκτιμώμενων ποσοτήτων. Από το διάγραμμα 2, για St ˆ( ) = 0.5, φαίνεται ότι ο μέσος χρόνος επιβίωσης είναι περίπου 3 χρόνια. Οι εκτιμώμενες συναρτήσεις πιθανότητας και κινδύνου σχεδιάζονται στα μέσα κάθε χρονικού διαστήματος. Πίνακας 2: Εκτιμώμενες συναρτήσεις επιβίωσης Χρονικό Διάστημα Ŝ(t) ˆf(t) ĥ(t) 0-1 1 0.2182 0.2449 1-2 0.7818 0.1637 0.2338 2-3 0.6182 0.1673 0.3129 3-4 0.4509 0.1255 0.3232 4-5 0.3255 0.1073 0.3946 5-6 0.2182 0.0545 0.2857 6-7 0.1636 0.0473 0.3377 7-8 0.1164 0.04 0.4151 8-9 0.0764 0.0291 0.4706 ³ 9 0 --- --- 27

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης Estmated Survval functon 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 1 2 3 4 5 6 7 8 9 Year Διάγραμμα 2: Εκτιμώμενη καμπύλη επιβίωσης Από το διάγραμμα 3 βλέπουμε ότι η μεγαλύτερη συχνότητα θανάτων παρατηρείται στο χρονικό διάστημα 0-1, ενώ από το διάγραμμα 4 βλέπουμε ότι η συνάρτηση κινδύνου έχει μια αυξητική τάση, εκτός στο διάστημα 5-6 όπου μειώνεται, αλλά αμέσως μετά συνεχίζει την αυξητική της τάση. Estmated densty functon 0.0 0.1 0.2 0.3 0 1 2 3 4 5 6 7 8 9 Years Διάγραμμα 3: Εκτιμώμενη καμπύλη πυκνότητας-πιθανότητας 28

Εισαγωγή στην ανάλυση επιβίωσης Estmated hazard functon 0.0 0.1 0.2 0.3 0.4 0.5 0 1 2 3 4 5 6 7 8 9 Year Διάγραμμα 4: Εκτιμώμενη καμπύλη της συνάρτησης κινδύνου 29

30

ΚΕΦΑΛΑΙΟ 2-ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΤΗΝ ΕΚΤΙΜΗΣΗ ΤΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΕΠΙΒΙΩΣΗΣ 2.1 Εκτιμητές γινομένου-ορίου (Product-Lmt estmates) της συνάρτησης επιβίωσης Όταν στις παρατηρήσεις μας υπάρχουν λογοκριμένα δεδομένα, τότε χρησιμοποιείται μια διαφορετική μέθοδος εκτίμησης της συνάρτησης επιβίωσης, από αυτή που χρησιμοποιήθηκε στην παράγραφο 1.3. Η μέθοδος προτάθηκε από τους Kaplan και Meer (1958) και ονομάζεται μέθοδος γινομένου-ορίου (Product-Lmt method (PL)) ή και μέθοδος Kaplan-Meer. Ο εκτιμητής της S(t) που προκύπτει, ονομάζεται εκτιμητής Kaplan- Meer ή εκτιμητής γινομένου-ορίου (PLE,.e. Product-Lmt Estmator). Προϋποθέσεις για τη μέθοδο Kaplan-Meer: Τα άτομα που χάθηκαν από την παρακολούθηση, έχουν την ίδια πιθανότητα επιβίωσης με τα άτομα που συνεχίζουν στην παρακολούθηση. Αυτό δε μπορεί να ελεγχθεί και μπορεί να οδηγήσει σε μεροληψία που μειώνει το S(t). Οι πιθανότητες επιβίωσης είναι οι ίδιες για άτομα που εισήλθαν στην αρχή της μελέτης με των ατόμων που εισήλθαν πιο αργά στη μελέτη-αυτό μπορεί να ελεγχθεί. Το γεγονός που μελετάται (π.χ. θάνατος) συμβαίνει στον καθορισμένο χρόνο. Καθυστερημένη καταγραφή του γεγονότος, θα προκαλέσει αύξηση του S(t). Θεωρούμε ότι έχουμε να εξετάσουμε ένα πρόβλημα, στο οποίο η ερώτηση κεντρικού ενδιαφέροντος είναι: Ποια η πιθανότητα οι ασθενείς να επιβιώσουν για μία συγκεκριμένη διάρκεια χρόνου;. Την απάντηση αυτή δίνει ο εκτιμητής γινομένου-ορίου (product-lmt estmator). Έστω: 31

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης p 1 : η πιθανότητα επιβίωσης για έναν τουλάχιστο χρόνο p 2 : η πιθανότητα επιβίωσης το δεύτερο χρόνο, δεδομένου ότι οι ασθενείς επιβίωσαν τον πρώτο χρόνο M p : η πιθανότητα επιβίωσης τον χρόνο, δεδομένου ότι επιβίωσαν τα προηγούμενα -1 χρόνια. Σημείωση: Εκτός από χρόνια μπορεί να έχουμε ημέρες, εβδομάδες, μήνες κλπ, ανάλογα με το πρόβλημα. Υποθέτουμε ότι είναι γνωστοί οι πλήρεις και οι λογοκριμένοι χρόνοι Ν ατόμων, σε ένα τυχαίο δείγμα {t 1,t 2,.,t N }. Έστω t (1) <t (2) <.<t (k), k N, οι διακεκριμένοι, ταξινομημένοι χρόνοι αποτυχίας (δηλαδή οι χρόνοι στους οποίους συμβαίνουν θάνατοι (αποτυχίες)) και έτσι, αντιστοιχούν σε πλήρεις χρόνους ζωής. Όταν σε ένα χρόνο t ( ), συμβαίνουν πολλές αποτυχίες, τότε οι παρατηρήσεις αυτές ονομάζονται ισό-τιμες (ted) παρατηρήσεις ή δεσμοί. Για =1,2,,k έστω: n : ο αριθμός των ατόμων που είναι σε κίνδυνο στο χρόνο t ( ), δηλαδή είναι ο αριθμός των ζωντανών ατόμων στην αρχή του διαστήματος [t (),t (+1) ) ή διαφορετικά, είναι ο αριθμός των ατόμων που έχουν χρόνους αποτυχίας ή λογοκρισίας μεγαλύτερους ή ίσους με t ( ). d : ο αριθμός των θανάτων στο ( ) t και c : ο αριθμός των διαφυγών (αντιστοιχούν σε λογοκριμένους χρόνους ζωής) στο διάστημα [t (),t (+1) ). Έτσι, η ποσότητα n- d συμβολίζει τον αριθμό των ασθενών που επιβιώνουν στο χρόνο t ( ) και η ποσότητα n- d - c, συμβολίζει τον αριθμό των ασθενών που είναι σε κίνδυνο στο χρόνο t ( + 1) : n = n - + d - c 1 32

Μη παραμετρικές μέθοδοι για την εκτίμηση των συναρτήσεων επιβίωσης Βάση των πιο πάνω συμβολισμών και του ορισμού της p, η p γράφεται: p n- d d = = 1- (2.2) n n (όπου p = pt ( ( ) )) Ο Kaplan-Meer εκτιμητής του S(t), ορίζεται ως: ˆ( ) = 1 2 t St p p K p (2.3) ή σύμφωνα με τη σχέση 2.2: ζ d φ ˆ( ) 1 St = Υ - η (2.4) ηθ n χψ t : t Διαφορετικά, ο εκτιμητής St ˆ( ) μπορεί να υπολογιστεί βάση της αναδρομικής σχέσης: St ˆ( ) = St ˆ( ) p (2.5) - 1 Θεωρούμε ότι S ˆ(0) = 1, δηλαδή ότι όλοι οι ασθενείς είναι ζωντανοί στο χρόνο 0. Παρατηρούμε από τη σχέση 2.2, ότι p = 1 όταν d t =0, δηλαδή όταν δεν πεθαίνει κανένα άτομο. Έτσι, ο εκτιμητής Kaplan-Meer της πιθανότητας επιβίωσης στο χρόνο t, αλλάζει μόνο σε χρόνους στους οποίους πεθαίνει τουλάχιστον ένα άτομο. Ως συνέπεια, μπορούμε να παραλείψουμε τους χρόνους στους οποίους δεν παρατηρούνται θάνατοι, δηλαδή τους λογοκριμένους χρόνους, στον υπολογισμό τoυ PLE St. ˆ( ) Στην πράξη, ο εκτιμητής γινομένου-ορίου, μπορεί να εκτιμηθεί κατασκευάζοντας έναν πίνακα, ο οποίος θα έχει 5 στήλες. Η πρώτη στήλη θα περιέχει τους διακεκριμένους πλήρεις χρόνους επιβίωσης, σε αύξουσα σειρά. Η δεύτερη στήλη θα έχει τον αριθμό των 33

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης ατόμων που βρίσκονται σε κίνδυνο ( n ), ενώ η τρίτη στήλη θα έχει τον αριθμό των θανάτων ( d ) στους διάφορους χρόνους επιβίωσης (αποτυχίας). Στην τέταρτη στήλη θα είναι οι τιμές των p (σχέση 2.2) και στην τελευταία στήλη θα είναι οι εκτιμητές Kaplan- Meer. Στο παράδειγμα 2.1 αναπτύσσεται η μέθοδος εκτίμησης των St ˆ( ) τόσο θεωρητικά, όσο και με τo S-Plus και την R. 2.2 Καμπύλη επιβίωσης Η γραφική παράσταση του St ˆ( ) συναρτήσει του t, δίνει τον εκτιμητή Kaplan-Meer της καμπύλης επιβίωσης και μας δίνει μια καλή περιγραφή των δεδομένων. Η St ˆ( ) είναι σκαλωτή φθίνουσα συνάρτηση, συνεχής από αριστερά. Η τιμή της St ˆ( ) δεν αλλάζει, παρά μόνο στα σημεία όπου παρατηρούνται θάνατοι ή γενικότερα αποτυχίες (πλήρεις χρόνοι). Έτσι, κάθε επόμενο βήμα προς τα κάτω θα είναι λίγο μεγαλύτερο και η τιμή της μειώνεται n- d κατά αμέσως μετά τον πλήρη χρόνο, t ( ). n Επειδή η λογοκρισία του ασθενή μειώνει τον αριθμό των ασθενών που συνεισφέρουν στην καμπύλη, (μειώνεται το n ), κάθε θάνατος μετά από αυτό το σημείο παριστάνει μια μεγαλύτερη αναλογία του υπόλοιπου πληθυσμού από την αναλογία που θα είχαμε αν γνωρίζαμε τους πλήρεις χρόνους. Έτσι, η λογοκρισία επηρεάζει την καμπύλη επιβίωσης. Όταν η μεγαλύτερη παρατήρηση είναι μη-λογοκριμένη, τότε ο Kaplan-Meer εκτιμητής στο σημείο αυτό είναι 0, αφού τότε θα έχουμε ότι nk = dk και c k = 0, οπότε, από τη σχέση 2.2 θα έχουμε ότι p k = 0 και έτσι, Sk ˆ( ) = 0. Στην καμπύλη επιβίωσης τότε, θα έχουμε μια κάθετη γραμμή στο t k, από τον προτελευταίο πλήρη χρόνο που θα κατεβαίνει κάθετα στο t k. Δηλαδή φαίνεται ότι St () = 0, για κάθε t³ tk. Αυτό το δραματικό αποτέλεσμα βασίζεται μόνο σε ένα ασθενή και είναι λάθος να συμπεράνουμε ότι η πιθανότητα ένας ασθενής (με την ίδια ασθένεια) δε θα επιβιώσει περισσότερο από το χρόνο t k. Αντίθετα, όταν η μεγαλύτερη παρατήρηση είναι λογοκριμένη, τότε η καμπύλη 34

Μη παραμετρικές μέθοδοι για την εκτίμηση των συναρτήσεων επιβίωσης επιβίωσης δεν είναι 0 μετά το t max, αφού στην περίπτωση αυτή, nmax Ή dmax, συνεπώς S ˆ(max) Ή 0. Στην περίπτωση αυτή, η καμπύλη μετά το tmax, θα συνεχίζει παράλληλα με τον άξονα των t χωρίς να κατεβαίνει προς τα κάτω. 2.3 Διάμεσος χρόνος επιβίωσης (medan survval tme) Ο διάμεσος χρόνος επιβίωσης είναι ο χρόνος επιβίωσης, στον οποίο το 50% των υπό μελέτη ατόμων επιβιώνει. Μ: Όταν δεν υπάρχουν λογοκριμένες παρατηρήσεις, τότε ο διάμεσος χρόνος επιβίωσης, εκτιμάται από τη μεσαία παρατήρηση των ταξινομημένων χρόνων επιβίωσης t(1), t(2),..., t ( n) αν ο αριθμός των παρατηρήσεων, n, είναι περιττός, δηλαδή M = t ( + 1)/2 και από το μέσο όρο των t ( n /2) και t ( n /2 + 1) αν ο n είναι άρτιος, δηλαδή Μ= 1 [ t( /2) + t ] ( /2+ 1) n 2 n n Όταν δεν υπάρχουν λογοκριμένα δεδομένα, ο διάμεσος χρόνος επιβίωσης μπορεί να βρεθεί και από την καμπύλη επιβίωσης, βρίσκοντας την τιμή του χρόνου για την οποία ισχύει ότι St () =0.5. Όταν υπάρχουν λογοκριμένοι χρόνοι επιβίωσης, ο διάμεσος χρόνος επιβίωσης εκτιμάται από την Kaplan-Meer καμπύλη επιβίωσης, βρίσκοντας την τιμή Μ για την οποία ισχύει: SM ˆ( ) =0.5 Παράδειγμα 2.1-Σύγκριση δύο θεραπειών: Έγινε μία μελέτη σε τριάντα ασθενείς με μελάνωμα, για να συγκριθούν δύο ανοσοθεραπείες, η BCG θεραπεία (Θεραπεία 1) και η Corynebacterum parvum (Θεραπεία 2), για τις ικανότητες τους να παρατείνουν την ύφεση και το χρόνο επιβίωσης του ασθενή. 35

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης Μετρήθηκε η διάρκεια της ύφεσης, ο χρόνος επιβίωσης, η αρχική κατάσταση των ασθενών, η θεραπεία που χορηγήθηκε στον κάθε ασθενή και επίσης καταγράφηκαν οι ηλικίες και το φύλο των ασθενών. Τα δεδομένα της μελέτης αυτής βρίσκονται στο παράρτημα Α (Melanoma). Όλοι οι ασθενείς είχαν υποβληθεί σε εγχείρηση αφαίρεσης όγκου προτού αρχίσει η θεραπεία, έτσι στο χρόνο της πρώτης θεραπείας δεν υπήρχε καμία ένδειξη μελανώματος. Θα χρησιμοποιηθούν οι χρόνοι επιβίωσης των ασθενών ανάλογα με τις θεραπείες (Μεταβλητές STme και Treatment αντίστοιχα) και θα υπολογιστούν οι εκτιμητές Kaplan- Meer για κάθε θεραπεία, καθώς και η καμπύλη επιβίωσης. Δίνονται στη συνέχεια οι χρόνοι επιβίωσης των ασθενών για τις δύο θεραπείες (σε μήνες). 11 ασθενείς ακολούθησαν τη θεραπεία 1 ενώ οι υπόλοιποι 19 τη θεραπεία 2: Θεραπεία 1 (ΒCG): 33.7+, 3.9, 10.5, 5.4, 19.5, 23.8+,7.9, 16.9+, 16.6+, 33.7+, 17.1+ Θεραπεία 2 (Parvum): 8, 26.9+, 21.4+, 18.1+, 16+, 6.9,11+, 24.8+, 23+, 8.3, 10.8+, 12.2+, 12.5+, 24.4, 7.7, 14.8+, 8.2+, 8.2+, 7.8+. Πηγή Δεδομένων: Βιβλίο «Statstcal Methods for Survval Data Analyss-Elsa T.Lee, p.20» Ο υπολογισμός του εκτιμητή Kaplan-Meer και η εκτιμώμενη καμπύλη επιβίωσης μπορεί να γίνει από διάφορα προγράμματα, όπως το SPSS, το S-Plus, την R κ.α. Θα δοθούν οι εντολές στο S-Plus και την R οι οποίες αντιμετωπίζουν το πρόβλημα αυτό και στη συνέχεια θα περιγραφεί και θεωρητικά ο υπολογισμός του εκτιμητή. Υπολογισμός του Εκτιμητή Kaplan-Meer με το S-Plus και την R: Συνάρτηση survft: Η συνάρτηση survft δημιουργεί εκτιμητές Kaplan Meer ως εξής: mel.surv<-survft (Surv (STme, Status1) ~Treatment) summary (mel.surv) Η περιγραφή των εντολών δίνεται στην παράγραφο 2.7 36

Μη παραμετρικές μέθοδοι για την εκτίμηση των συναρτήσεων επιβίωσης Με την εκτέλεση της summary(mel.surv), παίρνουμε ένα πίνακα με: τους πλήρεις χρόνους επιβίωσης, τους αριθμούς n και d, τους εκτιμητές Kaplan-Meer, τα τυπικά σφάλματα των εκτιμήσεων και τα διαστήματα εμπιστοσύνης των εκτιμητών. Στους πίνακες 1Α και 1Β που ακολουθούν, παρουσιάζονται οι εκτιμητές Kaplan-Meer της συνάρτησης επιβίωσης για τις δύο θεραπείες. Να σημειωθεί ότι η St ˆ( ) εκτιμάται μόνο για τους χρόνους στους οποίους παρατηρούνται θάνατοι, δηλαδή για τους πλήρεις χρόνους. Θα αναλυθεί ο τρόπος εκτίμησης της St ˆ( ) για την ομάδα ασθενών που ακολουθούν τη θεραπεία BCG. Αρχικά, στο χρόνο 0, υπάρχουν n 0 =11 ασθενείς που βρίσκονται σε κίνδυνο. Επίσης n 1 =11. Στο διάστημα [ (1), (2) t t )=[3.9,5.4) έχουμε 1 θάνατο στους 3.9 μήνες, δηλαδή d 1 =1 1 και p 1 = 1- = 0.909 ή St ˆ( ) = 0.909 για 3.9 t<5.4. Έτσι, στην αρχή του επόμενου 11 διαστήματος θα έχουμε n 2 =11-1-0=10 που είναι οι ασθενείς που βρίσκονται σε κίνδυνο στο διάστημα [ t (2), t (3) ) και d 2 =1 αφού παρατηρείται ένας θάνατος στους 5.4 μήνες ενώ δεν έχουμε λογοκριμένες παρατηρήσεις στο πρώτο διάστημα. Συνεπώς, p 2 1 = 1- = 0.9 ή Sˆ ( t) = 0.909 0.9 = 0.818 για 5.4 t<7.9. 10 1 Όμοια, p ˆ 3 = 1- = 0.889 ή S( t) = 0.818 0.889 = 0.727 για 7.9 t<10.5. Στην αρχή του 9 επόμενου χρονικού διαστήματος, [ t (4), t (5) )=[10.5,19.5), έχουμε n 4 =8 άτομα σε κίνδυνο. Στο διάστημα αυτό, παρατηρείται ένας θάνατος, στους 10.5 μήνες, ενώ έχουμε και 3 άτομα τα οποία χάθηκαν από την παρακολούθηση, (3 λογοκριμένες παρατηρήσεις), δηλαδή c 4 =3, έτσι θα έχουμε στην αρχή του τελευταίου διαστήματος, n 5 =8-1-3=4 ασθενείς σε κίνδυνο 1 και: p ˆ 4 = 1- = 0.875 ή S( t) = 0.727 0.875 = 0.636 για t Ξ [10.5,19.5). Στο τελευταίο 8 1 3 διάστημα, έχουμε p 5 = 1- = = 0.75 και St ˆ( ) = 0.636 0.75 = 0.477, t ³ 19.5. Αξίζει 4 4 να σημειωθεί ότι στο χρόνο t (5) =19.5 έχουμε 1 μόνο θάνατο και 3 λογοκριμένους χρόνους, 37

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης έτσι το St ˆ( ) για το τελευταίο διάστημα θα είναι διάφορο του 0. (Θα ήταν 0 μόνο αν είχαμε d 5 =3). Με ανάλογο τρόπο προκύπτουν και τα αποτελέσματα του πίνακα 1B. Πίνακες 1A και 1B:Kaplan-Meer εκτιμητής της συνάρτησης επιβίωσης S(t) Θεραπεία 1: BCG t () n t d t p Ŝ(t) Τυπικό σφάλμα 3.9 11 1 0.909 0.909 0.0867 5.4 10 1 0.9 0.818 0.1163 7.9 9 1 0.889 0.727 0.1343 10.5 8 1 0.875 0.636 0.1450 19.5 4 1 0.75 0.477 0.1755 Θεραπεία 2: Parvum t () n t d t p Ŝ(t) Τυπικό σφάλμα 6.9 19 1 0.947 0.947 0.0512 7.7 18 1 0.9444 0.895 0.0704 8.0 16 1 0.9375 0.839 0.0854 8.3 13 1 0.9231 0.774 0.1003 24.4 3 1 0.6667 0.516 0.2211 Kaplan-Meer εκτιμητής της καμπύλης επιβίωσης: Η γραφική της Kaplan-Meer καμπύλης επιβίωσης για τα δεδομένα του παραδείγματος γίνεται με τις παρακάτω εντολές: plot(mel.surv, col=c(5,6), cex = 2, lty=c(1,4), lwd=2.6, xlab="survval Tme n months", ylab="proporton Survvng") legend(locator(1), legend=c("bcg","parvum"), lty=c(1,4), lwd=2, col=c(5,6)) Proporton Survvng 0.0 0.2 0.4 0.6 0.8 1.0 BCG Parvum 0 5 10 15 20 25 30 35 Survval Tme n months Διάγραμμα 1: Kaplan-Meer εκτιμώμενη καμπύλη επιβίωσης 38

Μη παραμετρικές μέθοδοι για την εκτίμηση των συναρτήσεων επιβίωσης Με γραμμή χρώματος πορτοκαλί παρουσιάζεται η καμπύλη επιβίωσης των ασθενών της πρώτης ομάδας (Θεραπεία BCG), ενώ με γαλάζιο χρώμα είναι η καμπύλη επιβίωσης των ασθενών της δεύτερης ομάδας. Η κάθετες μικρές γραμμές πάνω στις δύο καμπύλες επιβίωσης υποδεικνύουν τους λογοκριμένους χρόνους. Από το διάγραμμα 1 μπορούμε να δούμε ότι οι ασθενείς της ομάδας «Parvum», είχαν υψηλότερους χρόνους επιβίωσης από τους ασθενείς της ομάδας «BCG». Αυτό, είναι μια ένδειξη ότι η θεραπεία Parvum είναι πιο αποτελεσματική από τη θεραπεία BCG για ασθενείς με μελάνωμα που υποβάλλονται σε εγχείρηση αφαίρεσης όγκου. Βέβαια, αν η διαφορά στους χρόνους επιβίωσης με τις δύο θεραπείες είναι σημαντική, θα το δείξει ένας στατιστικός έλεγχος (Κεφάλαιο 3). Από το διάγραμμα 1, αλλά και με τη βοήθεια του S-Plus, μπορούμε να βρούμε τους διάμεσους χρόνους επιβίωσης των δύο θεραπειών. Έτσι, τρέχοντας την mel.surv παίρνουμε ότι ο διάμεσος χρόνος επιβίωσης για την ομάδα ασθενών BCG είναι 19.5 μήνες, ενώ για την ομάδα Parvum, δεν μπορεί να υπολογιστεί. Αυτό συμβαίνει επειδή μόνο 5 από τους 19 χρόνους επιβίωσης είναι πλήρεις χρόνοι (ποσοστό μικρότερο του 50%) και επιπλέον ο τελευταίος χρόνος επιβίωσης, 26.9+, είναι λογοκριμένος χρόνος. Αν η τελευταία παρατήρηση ήταν πλήρης ενώ λιγότεροι χρόνοι επιβίωσης από 50% ήταν πλήρεις, τότε δε θα υπήρχε πρόβλημα στην εκτίμηση του διάμεσου χρόνου επιβίωσης. Συνοπτικά το πρόγραμμα για τον υπολογισμό των εκτιμητών Kaplan-Meer και της εκτιμώμενης Kaplan-Meer καμπύλης επιβίωσης: Melanoma<-read.table( Melanoma.txt,header=TRUE) attach(μelanoma) lbrary(survval) # Μόνο για την R χρειάζεται mel.surv<-survft (Surv(STme, Status1) ~Treatment) summary (mel.surv) mel.surv plot(mel.surv,col=c(5,6),cex = 2,lty=c(1,4),lwd=2.6,xlab="Survval Tme n months", ylab="proporton Survvng") legend(locator(1),legend=c("bcg","parvum"),lty=c(1,4),lwd=2,col=c(5,6)) 39

Το μοντέλο αναλογικού κινδύνου του Cox στην ανάλυση επιβίωσης 2.4 Διαστήματα Εμπιστοσύνης για το Ŝ(t) Τα διαστήματα εμπιστοσύνης που υπολογίζονται στους πλήρεις χρόνους, δίνουν μια καλή ένδειξη για την αξιοπιστία των εκτιμητών σε αυτούς τους χρόνους. Τα διαστήματα εμπιστοσύνης που θα αναπτυχθούν στην παράγραφο αυτή είναι σημειακά διαστήματα εμπιστοσύνης. Ένα (1-α)100% διάστημα εμπιστοσύνης στο χρόνο t για την ποσότητα S(t), θεωρώντας ότι οι εκτιμητές Kaplan-Meer ακολουθούν κανονική κατανομή, είναι: St ˆ() ± z SESt [ ˆ()] (α) a /2 που ονομάζεται διάστημα εμπιστοσύνης απλού τύπου (plan type). Μπορεί να δειχθεί ότι ο Kaplan-Meer εκτιμητής, St, ˆ( ) της συνάρτησης επιβίωσης S(t) είναι συνεπής εκτιμητής και ακολουθεί ασυμπτωτικά κανονική κατανομή. Πιο συγκεκριμένα ισχύει: St ˆ()~ NSt ( ˆ(), VSt ˆ( ˆ())) όπου V ˆ( S ˆ ( t )) είναι μια οποιαδήποτε συνεπής εκτίμηση του V( Sˆ ( t )). Υπάρχουν διάφοροι τρόποι υπολογισμού της σφάλματος SE[ St]: ˆ( ) 1. Μέθοδος του Greenwood: V ˆ( S ˆ ( t )) και κατ επέκταση του τυπικού Μια εκτίμηση για το τυπικό σφάλμα που δόθηκε από τον Greenwood (1926), είναι: όπου: ζ [ ˆ( )] ˆ d φ SEGr S t = S( t) ε (2.6) ηt : ( ) tn n- d ηθ χψ n : ο αριθμός των ατόμων που είναι σε κίνδυνο στο χρόνο ( ) 1/2 t και 40

Μη παραμετρικές μέθοδοι για την εκτίμηση των συναρτήσεων επιβίωσης d : ο αριθμός των θανάτων στο ( ) t. 2. Μέθοδος του Peto: Μια πιο αξιόπιστη εκτίμηση του τυπικού σφάλματος δόθηκε από τον Peto (1984): SE P μst ˆ()[1 St ˆ()] ό ιsˆ( t ) ω ο - ο κ = λ ϊϋ ν ύ ο R ξ t ώο 1/2 (2.7) όπου Rt = n0 - ct, c t είναι ο αριθμός των λογοκριμένων παρατηρήσεων πριν το χρόνο t και n 0 είναι ο συνολικός αριθμός των ασθενών που λαμβάνουν μέρος στη μελέτη. Αν δεν υπάρχουν λογοκριμένες παρατηρήσεις πριν το χρόνο t, τότε: μ St ˆ()[1 - St ˆ()] ό SE = ο ν ύ ο ο n ξ 0 ώο 1/2 (2.8) Μέθοδος μετασχηματισμού (Transformaton Method): Σε ορισμένες περιπτώσεις το διάστημα εμπιστοσύνης απλού τύπου (plan type), (α), περιλαμβάνει τιμές που μπορεί να είναι μεγαλύτερες του 1 ή μικρότερες του 0, έτσι είναι αναγκαία η μετατροπή των άκρων των διαστημάτων εμπιστοσύνης στο διάστημα [0,1]. Έτσι, με μετασχηματισμό του St () σε μια κλίμακα που είναι πιο κοντά στο να ακολουθεί κανονική κατανομή, το πρόβλημα αυτό λύνεται. Μπορεί να δειχθεί ότι η log{-log[s(t)]} ακολουθεί κανονική κατανομή με τυπικό σφάλμα που δίνεται από τη σχέση: SE Tr 1/2 1/2 1/2 ι d ω ι d ω ι d ω ε t : ( ) : ( ) : ( ) tn n d ε t tn n d ε t tn n d [ ˆ κ - ϊ κ - ϊ κ - ϊ S( t)] = λ ϋ = λ ϋ = λ ϋ log[ St ˆ( )] ι n n d ω ζ dφ log - log - Υ t : t n ε η κ ϊ t : t ηθ n ψχ λ ϋ (2.9) 41