ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Σχετικά έγγραφα
Άσκηση 10, σελ Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

1991 US Social Survey.sav

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

Είδη Μεταβλητών. κλίµακα µέτρησης

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

2.3. Ασκήσεις σχ. βιβλίου σελίδας Α ΟΜΑ ΑΣ

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ


ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΙ ΑΞΙΟΛΟΓΗΣΗΣ ΤΗΣ ΥΠΟΘΕΣΗΣ ΤΟΥ ΑΝΑΛΟΓΙΚΟΥ ΚΙΝ ΥΝΟΥ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Κεφάλαιο 5. Οι δείκτες διασποράς

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

c(2x + y)dxdy = 1 c 10x )dx = 1 210c = 1 c = x + y 1 (2xy + y2 2x + y dx == yx = 1 (32 + 4y) (2x + y)dxdy = 23 28

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Εισαγωγή στη Στατιστική

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

ειγµατοληπτική κατανοµή

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

11 Το ολοκλήρωµα Riemann

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2005

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ.

15, 11, 10, 10, 14, 16, 19, 18, 13, 17

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Περιγραφική Στατιστική

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

14 Εφαρµογές των ολοκληρωµάτων

Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram).

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μάθηµα 3 ο. Περιγραφική Στατιστική

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2006 ΕΚΦΩΝΗΣΕΙΣ

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2012 ΕΚΦΩΝΗΣΕΙΣ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

Παράδειγµα (Risky Business 1)

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Μηχανική ΙI. Μετασχηµατισµοί Legendre. της : (η γραφική της παράσταση δίνεται στο ακόλουθο σχήµα). Εάν

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

4.ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους.

Γ ΤΑΞΗ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑ Α Β )

9. Παλινδρόμηση και Συσχέτιση

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2003

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2003

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Επαναληπτικό Διαγώνισµα Μαθηµατικά Γενικής Παιδείας Γ Λυκείου

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Ανάλυση επιβίωσης (survival analysis)

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Μέθοδος Newton-Raphson

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ Η ΧΡΗΣΙΜΟΠΟΙΗΣΗ ΤΗΣ ΑΝΑΛΥΣΗΣ ΕΠΙΒΙΩΣΗΣ ΣΤΗΝ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΙΑ ΙΚΑΣΙΑΣ Πολύβιος Γ. Μαρκαντωνάκης ΕΡΓΑΣΙΑ Που υποβλήθηκε στο Τµήµα Στατιστικής του Οικονοµικού Πανεπιστηµίου ΑΘηνών ως µέρος των απαιτήσεων για την απόκτηση Μεταπτυχιακού ιπλώµατος Συµπληρωµατικής Ειδίκευσης στη Στατιστική Μερικής Παρακολούθησης (Part-time) Αθήνα Ιανουάριος 2013

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ Εργασία που υποβλήθηκε στο Τµήµα Στατιστικής του Οικονοµικού Πανεπιστηµίου Αθηνών ως µέρος των απαιτήσεων για την απόκτηση Μεταπτυχιακού ιπλώµατος Συµπληρωµατικής Ειδίκευσης στη Στατιστική Μερικής Παρακολούθησης (Part-time) Η ΧΡΗΣΙΜΟΠΟΙΗΣΗ ΤΗΣ ΑΝΑΛΥΣΗΣ ΕΠΙΒΙΩΣΗΣ ΣΤΗΝ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΙΑ ΙΚΑΣΙΑΣ Πολύβιος Γ. Μαρκαντωνάκης Υπεύθυνο µέλος ΕΠ: Κ. ηµάκη Αναπληρώτρια Καθηγήτρια Ο ιευθυντής Μεταπτυχιακών Σπουδών

ΕΥΧΑΡΙΣΤΙΕΣ Θα ήθελα να ευχαριστήσω όλους τους διδάσκοντες για το σύνολο των γνώσεων που αποκόµισα τα δύο χρόνια της φοίτησής µου στο Μεταπτυχιακό τµήµα του Οικονοµικού Πανεπιστηµίου Αθηνών. Θα ήθελα επίσης, να ευχαριστήσω ιδιαιτέρως την κυρία Κατερίνα ηµάκη, καθηγήτρια του τµήµατος Στατιστικής, για την πολύτιµη βοήθειά της και την καθοδήγηση που µου προσέφερε στην εκπόνηση της ιπλωµατικής µου διατριβής. Τέλος θα ήθελα να ευχαριστήσω την οικογένειά µου για την στήριξη που µου παρείχε στην προσπάθειά µου. Ι

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ Ονοµάζοµαι Πολύβιος Μαρκαντωνάκης και γεννήθηκα στην Αθήνα. Αποφοίτησα από την Οδοντιατρική Σχολή του Πανεπιστηµίου Αθηνών το 1992. Εργάστηκα ως οδοντίατρος και από το 2003 ως καθηγητής Μέσης Εκπαίδευσης σε Τεχνικά Λύκεια. Η ολοένα και µεγαλύτερη χρήση στατιστικών µεθόδων στην Ιατρική επιστήµη µου δηµιούργησε την ανάγκη εµβάθυνσης στον συγκεκριµένο τοµέα και µε οδήγησε στη τµήµα Στατιστικής του Οικονοµικού Πανεπιστηµίου Αθηνών, όπου τον Οκτώβριο του 2010 ξεκίνησα τις µεταπτυχιακές µου σπουδές. III

ABSTRACT Polyvios Markantonakis THE USE OF SURVIVAL ANALYSIS IN THE EVALUATION OF EDUCATIONAL PROCESS January 2013 Survival analysis deals with statistical methods used either for analyzing survival data or for studying survival time. Survival time is the time to the occurrence of a given event. Life data have special characteristics and therefore their study through the classical methods of parametric and non parametric statistics is not possible. Survival analysis methods may be applied in many areas: medical research, reliability research, business, criminology, epidemiology and social and behavioral sciences. In the present work survival analysis is used to evaluate the educational process. The introduction presents a brief historical overview and reference is made to the special characteristics and prerequisites of survival analysis. The second chapter analyses the functions of survival time. The third chapter presents the parametric models, or in other words the life distributions and compares the two teaching methods with the use of survival analysis. The fourth chapter presents non parametric methods of survival analysis and compares the students performance with regard to their sex and age. Finally, the fifth chapter presents the semi parametric Cox model and compares the students grade with regard to teaching method, sex and age. For the data processing the statistical packages Minitab and SPSS have been used. V

ΠΕΡΙΛΗΨΗ Πολύβιος Μαρκαντωνάκης Η ΧΡΗΣΙΜΟΠΟΙΗΣΗ ΤΗΣ ΑΝΑΛΥΣΗΣ ΕΠΙΒΙΩΣΗΣ ΣΤΗΝ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΙΑ ΙΚΑΣΙΑΣ Ιανουάριος 2013 Η ανάλυση επιβίωσης είναι η µελέτη της διάρκειας ζωής. Τα δεδοµένα χρόνων επιβίωσης εµφανίζουν ιδιαίτερα χαρακτηριστικά, τα οποία δεν επιτρέπουν την µελέτη τους µε τις µεθόδους της κλασσικής παραµετρικής και µη παραµετρικής στατιστικής. Οι µέθοδοι της ανάλυσης επιβίωσης µπορούν να εφαρµοστούν σε πολλούς τοµείς. Εδώ θα χρησιµοποιήσουµε την ανάλυση επιβίωσης για να αξιολογήσουµε την εκπαιδευτική διαδικασία. Στην εισαγωγή παρουσιάζεται µια σύντοµη ιστορική αναδροµή και γίνεται αναφορά στα ιδιαίτερα χαρακτηριστικά και στις προϋποθέσεις της Ανάλυσης Επιβίωσης. Στο δεύτερο κεφάλαιο αναλύονται οι συναρτήσεις των χρόνων επιβίωσης. Στο τρίτο κεφάλαιο παρουσιάζονται τα παραµετρικά µοντέλα δηλαδή οι κατανοµές που περιγράφουν τους χρόνους ζωής και συγκρίνονται οι δύο µέθοδοι διδασκαλίας µε την βοήθεια της ανάλυσης επιβίωσης. Στο τέταρτο κεφάλαιο παρουσιάζονται µη παραµετρικές µέθοδοι ανάλυσης των χρόνων επιβίωσης και γίνεται σύγκριση της επίδοσης των µαθητών ως προς την µέθοδο διδασκαλίας, ως προς το φύλο και ως προς την ηλικία των µαθητών. Τέλος, στο πέµπτο κεφάλαιο παρουσιάζεται το ηµιπαραµετρικό µοντέλο του Cox και γίνεται σύγκριση του βαθµού των µαθητών ως προς την µέθοδο διδασκαλίας, το φύλο και την ηλικία. Για την επεξεργασία των δεδοµένων χρησιµοποιήθηκαν τα στατιστικά πακέτα Minitab και SPSS. VI

ΚΑΤΑΛΟΓΟΣ ΠΕΡΙΕΧΟΜΕΝΩΝ Σελίδα ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ 1.1 Σύντοµη ιστορική αναδροµή... 1 1.2 Γενικά... 2 1.3 Προϋποθέσεις της Ανάλυσης Επιβίωσης... 4 ΚΕΦΑΛΑΙΟ 2: ΣΥΝΑΡΤΗΣΕΙΣ ΧΡΟΝΟΥ ΕΠΙΒΙΩΣΗΣ 2.1 Βασικές Συναρτήσεις χρόνου επιβίωσης... 5 2.2 Συνάρτηση (πυκνότητας) πιθανότητας... 5 2.3 Συνάρτηση επιβίωσης (survival function)... 6 2.4 Συνάρτηση βαθµού κινδύνου... 6 2.5 Μέση υπολειπόµενη ζωή... 7 ΚΕΦΑΛΑΙΟ 3: ΣΤΑΤΙΣΤΙΚΑ ΜΟΝΤΕΛΑ ΧΡΟΝΟΥ ΕΠΙΒΙΩΣΗΣ 3.1 Εισαγωγή... 9 3.2 Παραµετρικές µέθοδοι... 9 3.3 Η κατανοµή Weibull... 10 3.4 Εφαρµογή στην εκπαιδευτική διαδικασία... 11 3.5 Παραµετρική ανάλυση των δεδοµένων... 17 ΚΕΦΑΛΑΙΟ 4: ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟ ΟΙ 4.1 Γενικά... 23 4.2 είγµα χωρίς περικοµµένες παρατηρήσεις (πλήρες δείγµα)... 23 4.3 είγµα µε περικοµµένες παρατηρήσεις. Μέθοδος Kaplan-Meier... 23 4.4 ιακύµανση Kaplan-Meier... 25 4.5 Χρήση του Kaplan-Meier για την εκτίµηση συγγενών ποσοτήτων... 26 4.6 Nelson-Aalen εκτιµητής... 27 4.7 Ανάλυση µε την µέθοδο Kaplan-Meier... 27 4.8 Εφαρµογή µε το Minitab... 29 4.9 Σύγκριση καµπυλών επιβίωσης µε µη παραµετρικές µεθόδους... 32 4.10 Ο Logrank έλεγχος... 33 4.11 Εφαρµογή στο logrank test... 36 4.12 Σύγκριση ως προς το φύλο... 40 4.13 Σύγκριση ως προς την ηλικία... 43

ΚΕΦΑΛΑΙΟ 5: ΜΟΝΤΕΛΟ ΤΟΥ COX 5.1 Εισαγωγή... 47 5.2 Το Μοντέλο του COX... 47 5.3 Το P.H. Μοντέλο του Cox... 48 5.4 Εφαρµογή στο Μοντέλο του Cox... 51 ΒΙΒΛΙΟΓΡΑΦΙΑ... 59

ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ Πίνακας Σελίδα 3.4.1 Χρόνος επιβίωσης για την γραπτή δοκιµασία 12 4.11.1 Υπολογισµοί Vi για τους µαθητές της εφαρµογής ανάλογα µε την µέθοδο διδασκαλίας.. 36 5.4.1 Output της εφαρµογής µε την χρησιµοποίηση του cox µοντέλου µε βοηθητικές µεταβλητές την µέθοδο διδασκαλίας, το φύλο και την ηλικία µε την βοήθεια του στατιστικού πακέτου SPSS....51 5.4.2 Output της εφαρµογής µε την χρησιµοποίηση του cox µοντέλου µε βοηθητικές µεταβλητές την µέθοδο διδασκαλίας και το φύλο µε την βοήθεια του στατιστικού πακέτου SPSS...52 XI

ΚΑΤΑΛΟΓΟΣ ΓΡΑΦΗΜΑΤΩΝ Γράφηµα Σελίδα 3.5.1 ιάγραµµα πιθανοτήτων για τις κατανοµές weibull, lognormal, εκθετική, κανονική των µαθητών της εφαρµογής 19 3.5.2 ιάγραµµα πιθανοτήτων συνάρτησης πυκνότητας, πιθανότητας συνάρτησης επιβίωσης και συνάρτηση κινδύνου για την κατανοµή weibull των µαθητών της εφαρµογής.. 20 3.5.3 ιάγραµµα πιθανοτήτων για την κατανοµή weibull των µαθητών της εφαρµογής 21 4.8.1 Συνάρτηση επιβίωσης για τους µαθητές της εφαρµογής µε το στατιστικό πακέτο Minitab 31 4.8.2 Συνάρτηση επιβίωσης και διάστηµα εµπιστοσύνης 95% για τους µαθητές της εφαρµογής µε το στατιστικό πακέτο Minitab...31 4.11.1 Συνάρτηση επιβίωσης ανάλογα µε την µέθοδο διδασκαλίας για τους µαθητές της εφαρµογής µε το Minitab.. 40 4.12.1 Συναρτήσεις επιβίωσης αγοριών (1) και κοριτσιών (2) για τους µαθητές της εφαρµογής µε το Minitab....42 4.13.1 Συναρτήσεις επιβίωσης ενηλίκων (2) και ανηλίκων (1) µαθητών για τους µαθητές της εφαρµογής µε το Minitab.. 44 5.4.1 Συνάρτηση επιβίωσης των µαθητών της εφαρµογής µε την χρήση του SPSS. 54 XIII

5.4.2 Συνάρτηση επιβίωσης των µαθητών της εφαρµογής µε την χρήση του στατιστικού πακέτου SPSS....55 5.4.3 Συνάρτηση κινδύνου των µαθητών της εφαρµογής ανάλογα µε την µέθοδο διδασκαλίας µε την βοήθεια του SPSS...56 5.4.4 Συνάρτηση κινδύνου των µαθητών της εφαρµογής ανάλογα µε το φύλο µε την βοήθεια του SPSS...57 5.4.5 Συνάρτηση κινδύνου των µαθητών της εφαρµογής ανάλογα µε το φύλο µε την βοήθεια του SPSS...58 XIV

XV

ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 1.1 Σύντοµη ιστορική αναδροµή Η πρώτη καταγραφή χρόνων επιβίωσης παρατηρείται στην Μ. Βρετανία τον 17 ο αιώνα από τον John Grant. Στην µελέτη του παρουσιάζονται οι γεννήσεις και οι θάνατοι σε διάστηµα µερικών δεκαετιών στις ενορίες του Λονδίνου. Λίγο αργότερα στα τέλη του 17 ου αιώνα ο Haley σχηµάτισε τον πρώτο πίνακα επιβίωσης µε δεδοµένα από τον πληθυσµό της πόλης Breslan της Πολωνίας. Μεγάλη ανάπτυξη στην µελέτη της διάρκειας ζωής έδωσαν οι δύο παγκόσµιοι πόλεµοι, όπου µελετήθηκε ο χρόνος ζωής των µηχανικών και των ηλεκτρικών στρατιωτικών εξαρτηµάτων που χρησιµοποιήθηκαν. Η πρόοδος και το ενδιαφέρον συνεχίστηκε και µετά το τέλος του δεύτερου παγκόσµιου πολέµου µε την αξιολόγηση του χρόνου ζωής των ηλεκτρικών συσκευών. Η αξιολόγηση γινόταν παραµετρικά µε την χρήση µοντέλων χρόνου ζωής και την εκτίµηση των παραµέτρων τους µε την βοήθεια του εκθετικού µοντέλου, του µοντέλου Weibull κ.α. Τα τελευταία 30 χρόνια µε την βοήθεια των ηλεκτρονικών υπολογιστών έγινε ευρεία χρήση της ανάλυσης επιβίωσης σε όλους τους τοµείς της επιστήµης: Βιολογία, Ιατρική, Εκπαίδευση, Κοινωνιολογία, Μηχανική, καθώς παράγονται όλο και περισσότερα λογισµικά πακέτα για τον σκοπό αυτό. 1

1.2 Γενικά Η ανάλυση επιβίωσης είναι η µελέτη της διάρκειας ζωής δηλαδή ο χρόνος που µεσολαβεί από την στιγµή της έναρξης παρακολούθησης ενός ατόµου µέχρι να συµβεί ένα συγκεκριµένο ενδεχόµενο. Το ενδεχόµενο αυτό δεν έχει πάντα αρνητική σηµασία αλλά µπορεί να είναι και ένα θετικό γεγονός. Παραδείγµατα χρόνων επιβίωσης αποτελούν: Ο χρόνος µέχρι να πεθάνει ένας οργανισµός. Ο χρόνος µέχρι την υποτροπή µιας ασθένειας. Ο χρόνος µέχρι την ίαση µιας ασθένειας. Ο χρόνος µέχρι κάποιος δείκτης της οικονοµίας να ξεπεράσει κάποιο όριο. Ο χρόνος ζωής ενός µηχανήµατος. Ο χρόνος επιβίωσης είναι το βασικό σηµείο ενδιαφέροντος στο σύνολο των επιστηµών και σε µεγάλο αριθµό εφαρµογών. Αυτό που µας ενδιαφέρει όταν αναλύουµε χρόνους επιβίωσης είναι η συνάρτηση κατανοµής, η σύγκριση των χρόνων µεταξύ διαφορετικών οµάδων και η µοντελοποίηση τους µε άλλες µεταβλητές. Ιδιαίτερο χαρακτηριστικό των χρόνων επιβίωσης είναι ότι τα αποτελέσµατα δεν είναι συνήθως διαθέσιµα για το σύνολο των δεδοµένων. Αυτές οι παρατηρήσεις είναι περικοµµένες (censored cases). Λογοκριµένη ή περικοµµένη παρατήρηση, είναι η παρατήρηση της οποίας ο χρόνος επιβίωσης δεν είναι ακριβής, δηλαδή δεν έχει παρατηρηθεί κατά την διάρκεια της µελέτης. Αυτό συµβαίνει είτε γιατί τα άτοµα εισέρχονται στην µελέτη σε διαφορετικούς χρόνους, είτε γιατί δεν επέρχεται το καθοριστικό γεγονός µέχρι το τέλος της έρευνας, είτε άλλοτε γιατί το υποκείµενο χάνεται πριν τελειώσει η έρευνα. 2

Όταν υπάρχουν περικοµµένες παρατηρήσεις τα δεδοµένα δεν µπορούν να επεξεργαστούν από τις συνηθισµένες στατιστικές µεθόδους. Υπάρχουν 3 είδη περικοπών : η δεξιά (right censoring), η αριστερή (left censoring) η περικοπή διαστήµατος (interval censoring). Στην δεξιά περικοπή η έναρξη είναι σταθερή και το φαινόµενο εξελίσσεται προς τα δεξιά όπου διαπιστώνεται η ύπαρξη των περικοµµένων ή µη παρατηρήσεων. ιακρίνεται στην περικοπή τύπου Ι και ΙΙ που είναι γνωστές ως µεµονωµένες περικοπές, ενώ η τύπου ΙΙΙ είναι γνωστή και ως τυχαία περικοπή. Στην περικοπή τύπου Ι το άτοµο χάνεται ή αποσύρεται κατά την διάρκεια της έρευνας. Επίσης σε αυτήν µπορεί οι χρόνοι επιβίωσης να είναι µεγαλύτεροι από τον χρόνο παρακολούθησης. Οι περικοµµένες παρατηρήσεις τότε θα έχουν χρόνο επιβίωσης όσο και η χρονική διάρκεια της έρευνας. Στην περικοπή τύπου ΙΙ: η έρευνα συνεχίζεται µέχρι να αποτύχει συγκεκριµένος αριθµός ατόµων, ο οποίος έχει προκαθοριστεί. Άρα αν n ήταν τα άτοµα που συµµετείχαν στην έρευνα, γνωρίζουµε τους χρόνους αποτυχίας για τα r άτοµα, ενώ για τα υπόλοιπα n-r, ο χρόνος επιβίωσης ισούται µε το χρόνο της µεγαλύτερης µη περικοµµένης παρατήρησης. Στην περικοπή τύπου III ο χρόνος παρακολούθησης δεν είναι σταθερός αλλά τυχαίος. Τα άτοµα εισέρχονται στην έρευνα σε τυχαίες χρονικές στιγµές και άρα ο χρόνος παρακολούθησης δεν είναι σταθερός. Στην αριστερή περικοπή ο χρόνος επιβίωσης δεν είναι γνωστός, γιατί η γέννηση ενός γεγονότος δεν είναι προσδιορισµένη ακριβώς. Το µόνο που γνωρίζουµε είναι ότι η διάρκεια ζωής είναι µεγαλύτερη από την αρχή της έρευνας και άρα ο χρόνος επιβίωσης δεν µπορεί να καθοριστεί µε ακρίβεια. Στην περικοπή σε διάστηµα δεν γνωρίζουµε την ακριβή στιγµή της έναρξης του γεγονότος. Το µόνο που γνωρίζουµε είναι ότι η έναρξη συνέβη 3

µέσα σε συγκεκριµένο χρονικό διάστηµα. Περικοπή σε διάστηµα έχουµε όταν υπάρχει περιοδική παρακολούθηση των υποκειµένων. Οι περισσότερες έρευνες στηρίζονται στην δεξιά περικοπή, µε τους 3 εναλλακτικούς της τύπους όπως περιγράφηκαν προηγουµένως. Για πλήρη και περικοµµένα δεδοµένα χρησιµοποιούνται παραµετρικές και µη παραµετρικές µέθοδοι ανάλυσης. Όταν ένα µοντέλο ή µια κατανοµή προσαρµόζεται στα δεδοµένα χρησιµοποιούνται παραµετρικές κατανοµές για την ανάλυση επιβίωσης. Οι πιο συχνά χρησιµοποιούµενες κατανοµές είναι η κανονική, η Weibull, η γ, η εκθετική, η λογαριθµοκανονική και η λογαριθµολογιστική. Αν εφαρµόσουµε παραµετρική προσέγγιση τότε η στατιστική συµπερασµατολογία θα βασίζεται στην κατανοµή που θα επιλέξουµε. Εάν στους χρόνους επιβίωσης των δεδοµένων µας δεν προσαρµόζεται ικανοποιητικά κάποια γνωστή κατανοµή, τότε θα χρησιµοποιήσουµε µη παραµετρικές µεθόδους ανάλυσης και η συµπερασµατολογία θα βασίζεται σε αυτές. 1.3 Προϋποθέσεις της Ανάλυσης Επιβίωσης Για να µπορέσουµε να εφαρµόσουµε ανάλυση επιβίωσης θα πρέπει οι παρατηρήσεις να είναι ανεξάρτητες. Επιπρόσθετα για τα περικοµµένα δεδοµένα θα πρέπει να ισχύει η υπόθεση της ανεξάρτητης περικοπής. Εάν ένα άτοµο είναι περικοµµένο θα πρέπει να έχει την ίδια πιθανότητα αποτυχίας µε ένα άτοµο που είναι µη περικοµµένο για κάθε συγκεκριµένη χρονική στιγµή. ηλαδή µία παρατήρηση που είναι περικοµµένη και ζωντανή σε µια οποιαδήποτε χρονική στιγµή πρέπει να έχει την ίδια πιθανότητα αποτυχίας µε µια παρατήρηση που είναι µη περικοµµένη την ίδια χρονική στιγµή. 4

ΚΕΦΑΛΑΙΟ 2 ΣΥΝΑΡΤΗΣΕΙΣ ΧΡΟΝΟΥ ΕΠΙΒΙΩΣΗΣ 2.1 Βασικές Συναρτήσεις χρόνου επιβίωσης Ο χρόνος επιβίωσης µέχρι να συµβεί ένα γεγονός περιγράφεται από µια τυχαία µεταβλητή που µπορεί να είναι συνεχής ή διακριτή. Η τυχαία αυτή µεταβλητή δεν µπορεί να πάρει αρνητικές τιµές γιατί ο χρόνος ως την αποτυχία δεν µπορεί να πάρει τιµές που να προηγούνται του αρχικού χρόνου που είναι µηδέν. Για κάθε τυχαία µεταβλητή η συµπεριφορά της περιγράφεται από 4 συναρτήσεις: την συνάρτηση (πυκνότητας) πιθανότητας, την συνάρτηση επιβίωσης, την συνάρτηση κινδύνου την συνάρτηση της µέσης υπολειπόµενης ζωής Αποδεικνύεται ότι µεταξύ των συναρτήσεων αυτών ισχύουν σχέσεις ισοδυναµίας µε την έννοια ότι εάν γνωρίζουµε µια από αυτές µπορούµε να βρούµε και τις άλλες. Ένας από τους στόχους της ανάλυσης επιβίωσης είναι η εκτίµηση αυτών των συναρτήσεων. 2.2 Συνάρτηση (πυκνότητας) πιθανότητας Έστω Χ µια τυχαία µεταβλητή που περιγράφει την συµπεριφορά ενός συστήµατος. Η Χ παίρνει τιµές που είναι µεγαλύτερες ή ίσες µε το 0. Η αθροιστική συνάρτηση συµβολίζεται µε F(x) και εκφράζει την πιθανότητα η τυχαία µεταβλητή Χ να πάρει τιµές µικρότερες ή ίσες του t, δηλαδή περιγράφει την πιθανότητα αποτυχίας µέχρι την χρονική στιγµή t: F ( t) = P( X t) 5

και για την οποία ισχύει : 2.3 Συνάρτηση επιβίωσης (survival function) Συνήθως αυτό που θέλουµε να περιγράψουµε δεν είναι η πιθανότητα αποτυχίας αλλά η πιθανότητα επιβίωσης δηλαδή η πιθανότητα το x να ξεπεράσει τον χρόνο t. Η συνάρτηση αυτή συµβολίζεται µε ( ) S t ή ( ) F t και ορίζεται ως η πιθανότητα το άτοµο να επιβιώσει για χρόνο µεγαλύτερο του t και άρα να µην αποτύχει έως την συγκεκριµένη χρονική στιγµή. X ( ) = ( > ) F t P X t Για συνεχή χρόνο ζωής ισχύει ότι: X f X ( t) = df dt X ( t). Η συνάρτηση επιβίωσης συνδέεται µε την αθροιστική συνάρτηση κατανοµής: ( ) ( ) ( ) S( t) R t F t = P( X > t) = 1 P( X t) = 1 F t, t 0 X X 2.4 Συνάρτηση βαθµού κινδύνου Η συνάρτηση βαθµού κινδύνου h(t) εκφράζει την δεσµευµένη πιθανότητα η συνιστώσα του συστήµατος που έχει επιβιώσει µέχρι την χρονική στιγµή t, να αποτύχει την αµέσως επόµενη χρονική στιγµή. X ( ) h t ( < + > ) P t X t t X t = lim για t 0 t 0 t 6

Αποδεικνύεται ότι στην περίπτωση συνεχούς χρόνου, ισούται µε το πηλίκο της πυκνότητας πιθανότητας προς την συνάρτηση επιβίωσης. ηλαδή : Με αυτόν τον τρόπο συνδέονται οι παραπάνω συναρτήσεις και µπορούµε να υπολογίσουµε την συνάρτηση κινδύνου αν γνωρίζουµε την πιθανότητα στιγµιαίας αποτυχίας και την συνάρτηση επιβίωσης. 2.5 Μέση υπολειπόµενη ζωή Ο µέσος υπολειπόµενος χρόνος µετράει τον χρόνο ζωής που αναµένεται κατά µέσο όρο να έχει ένα άτοµο ηλικίας t. x Συµβολίζεται µε µ ( t) Είναι η αναµενόµενη τιµή που υπολείπεται να ζήσει η µονάδα (x-t) δεδοµένου ότι το x είναι µεγαλύτερο του t. x µ ( t) = E( X t X > t), t 0, Αν ο χρόνος είναι 0, τότε η µέση υπολειπόµενη ζωή της µονάδας., εκφράζει τη µέση ζωή Η µέση υπολειπόµενη ζωή συνδέεται µε την συνάρτηση επιβίωσης F ( t ) ως εξής: x 1 µ ( t) = F( x) dx, t 0. F( t) t 7

8

ΚΕΦΑΛΑΙΟ 3 ΣΤΑΤΙΣΤΙΚΑ ΜΟΝΤΕΛΑ ΧΡΟΝΟΥ ΕΠΙΒΙΩΣΗΣ 3.1 Εισαγωγή Ένα πρόβληµα ανάλυσης επιβίωσης ανάλογα µε τις ενδείξεις που υπάρχουν, είναι δυνατόν να µελετηθεί παραµετρικά, δηλαδή µε τη χρησιµοποίηση κατανοµών που υποπτευόµαστε ότι ακολουθούν τα δεδοµένα ή µη παραµετρικά, όταν τα δεδοµένα δεν φαίνεται να προέρχονται από κάποια συγκεκριµένη κατανοµή. Η µη παραµετρική ανάλυση απαιτεί λιγότερες προϋποθέσεις, και είναι πολύ πιο εύκολη από την παραµετρική µεθοδολογία. Όµως είναι λιγότερη ισχυρή από πλευράς συµπερασµατολογίας. Στην πράξη συνήθως προτιµάται η µη παραµετρική ανάλυση. 3.2 Παραµετρικές µέθοδοι Κατανοµές χρόνου ζωής (life distribution) ονοµάζονται οι κατανοµές που περιγράφουν τη συµπεριφορά τυχαίων µεταβλητών, οι οποίες µε την σειρά τους περιγράφουν την ζωή ατόµων, µονάδων κ.λ.π. Οι περισσότερο χρησιµοποιούµενες είναι: α) Η εκθετική κατανοµή. β) Η κατανοµή Weibull. γ) Η κατανοµή Γάµα. δ) Η λογαριθµοκανονική κατανοµή. ε) Η λογαριθµολογιστική κατανοµή. Ακολουθεί µια σύντοµη παρουσίαση της κατανοµής Weibull που είναι η ευρύτερα χρησιµοποιούµενη κατανοµή για την ανάλυση τέτοιου τύπου δεδοµένων. 9

3.3 Η κατανοµή Weibull Ορισµός Μια συνεχής τυχαία µεταβλητή Χ µε συνάρτηση επιβίωσης ( ) ( λ ) p FX t = exp t, t 0, λ, p > 0 λέγεται ότι ακολουθεί την κατανοµή Weibull µε παράµετρο λ,p>0. Συµβολικά X ~ Weibull(, p) λ. Η συνάρτηση κατανοµής πιθανότητας της Χ δίνεται από τη σχέση ( ) ( ) ( λ ) p FX t = 1 FX t = 1 exp t, t 0, λ, p > 0 η συνάρτηση πυκνότητας πιθανότητας προκύπτει ως p p ( ) ( ) ( ) ' 1 p fx t = FX t = pλ t exp λt, t 0, λ, p > 0 η συνάρτηση βαθµού κινδύνου δίνεται από τη σχέση: X p p 1 ( ) = λ h t p t Η µορφή της συνάρτησης κινδύνου εξαρτάται από τις τιµές των παραµέτρων της κατανοµής, συγκεκριµένα για p<1 η h(t) είναι φθίνουσα µε t 0 ( ) και h( t) lim h t = lim = 0 ενώ για p>1 η h(t) είναι αύξουσα µε t 0 t ( ) και h( t) limh t = 0 lim = t Βασικές Ιδιότητες της Κατανοµής: Έστω ότι ( λ ) X ~ Weibull, p, t 0, λ, p > 0. Τότε, 1 p + 1 i. E( X ) = λ Γ p 10

p 1 p 1 = λ Γ + Γ + p p 2 2 ii. Var( X ) όπου Γ η Γάµα συνάρτηση. 3.4 Εφαρµογή στην εκπαιδευτική διαδικασία Για την εφαρµογή των δεδοµένων επιβίωσης χρησιµοποιήθηκε δείγµα µαθητών της Β Τάξης Επαγγελµατικών Λυκείων της Αθήνας. Το δείγµα αποτελείται από 38 κορίτσια και 15 αγόρια. Τα 31 άτοµα είναι ηλικίας µέχρι 18 ετών (ανήλικα) ενώ τα υπόλοιπα είναι µεγαλύτερα των 18 ετών (ενήλικα). Σε όλες τις τάξεις έγινε η παρουσίαση 2 ίδιων διδακτικών ενοτήτων ενός ιατρικού µαθήµατος (Στοιχείων Ανατοµίας - Φυσιολογίας), που περιλαµβάνονται στο πρόγραµµα σπουδών των µαθητών. Στη συνέχεια της κάθε παρουσίασης δόθηκε γραπτό τεστ (ένα για κάθε ενότητα), όπου οι µαθητές σε συγκεκριµένο χρόνο (15 λεπτά) έπρεπε να απαντήσουν σε ερωτήµατα που αφορούσαν την ύλη που παρουσιάστηκε. Για την παρουσίαση των δύο διδακτικών ενοτήτων εφαρµόστηκαν δύο µέθοδοι διδασκαλίας ο δασκαλοκεντρικός και ο µαθητοκεντρικός. Στον δασκαλοκεντρικό ο καθηγητής παρουσίασε την καινούργια διδακτική ενότητα, ενώ στον µαθητοκεντρικό οι µαθητές χωρίστηκαν σε οµάδες των 4-6 ατόµων και σε κάθε οµάδα ανατέθηκε η διερεύνηση µιας υποενότητας του µαθήµατος η οποία παρουσιάστηκε από τους µαθητές στην οµάδα που αυτοί ανήκαν. Ο καθηγητής συντόνισε την όλη διαδικασία και απαντούσε στα ερωτήµατα των µαθητών που δεν µπορούσαν να διευκρινιστούν από τα άλλα άτοµα της οµάδας. Τα γραπτά που παραδόθηκαν και διορθώθηκαν ήταν ανώνυµα. Καταγράφηκε µόνο το φύλο, η ηλικία καθώς και ο τρόπος διδασκαλίας. Οι βαθµολογίες των µαθητών στην εικοσάβαθµη κλίµακα αποτελούν τους χρόνους επιβίωσης. Ακριβής παρατηρήσεις είναι η βαθµολογίες των µαθητών που παρέδωσαν το γραπτό τους µέσα στο προκαθορισµένο χρόνο των 15 λεπτών. Τα γραπτά που παραδόθηκαν µετά την λήξη του χρόνου αυτού διορθώθηκαν, αλλά θεωρήθηκαν περικοµµένες παρατηρήσεις, γιατί η βαθµολογία που αφορούσε την κατανόηση του 11

µαθήµατος θα γινόταν µε διαγώνισµα συγκεκριµένης χρονικής διάρκειας και άρα ο βαθµός των συγκεκριµένων µαθητών στον προβλεπόµενο χρόνο δεν είναι τώρα γνωστός. Τα δεδοµένα έχουν την ακόλουθη µορφή: ΒΑΘΜΟΣ STATUS ΜΕΘΟ ΟΣ ΦΥΛΟ ΗΛΙΚΙΑ 14 1 1 2 2 15 1 1 2 1 14 1 1 2 2 14 1 1 1 2 11 1 1 1 2 17 1 1 2 2 19 1 1 2 2 18 1 1 2 2 11 1 1 2 2 13 1 1 1 2 12 1 1 1 1 14 1 1 2 2 15 1 1 2 2 15 1 1 1 2 13 1 1 2 2 12 1 1 2 2 12

12 1 1 2 2 16 1 1 2 2 14 1 2 2 2 15 1 2 2 1 16 1 2 2 2 15 1 2 2 2 16 1 2 1 2 14 1 2 1 2 19 1 2 2 2 18 1 2 2 2 18 1 2 2 2 14 1 2 2 2 15 1 2 1 2 13 1 2 1 1 17 1 2 2 2 17 1 2 2 2 16 1 2 1 2 16 1 2 2 2 14 1 2 2 2 15 1 2 2 2 19 1 2 2 2 13

7 1 1 2 1 9 1 1 1 1 10 1 1 2 1 11 1 1 2 1 10 1 1 1 1 12 1 1 1 1 14 1 1 2 2 15 1 1 2 2 15 1 1 2 1 18 1 1 2 1 20 1 1 2 1 17 1 1 2 1 11 1 1 1 1 14 1 1 2 1 12 1 1 2 1 12 1 1 2 1 13 1 1 1 1 15 1 1 2 1 16 1 1 2 1 12 1 1 2 1 11 1 1 1 1 14

10 1 1 1 1 12 1 1 2 1 17 1 1 2 1 16 1 1 2 1 13 1 1 2 1 14 1 1 2 1 19 1 1 2 1 9 1 2 2 1 12 1 2 1 1 11 1 2 2 1 14 1 2 2 1 12 1 2 1 1 15 1 2 1 1 16 1 2 2 2 18 1 2 2 2 18 1 2 2 1 20 1 2 2 1 19 1 2 2 1 19 1 2 2 1 15 1 2 1 1 16 1 2 2 1 15

14 1 2 2 1 14 1 2 2 1 14 1 2 1 1 17 1 2 2 1 17 1 2 2 1 14 1 2 2 1 15 1 2 1 1 13 1 2 1 1 13 1 2 2 1 18 1 2 2 1 18 1 2 2 1 16 1 2 2 1 17 1 2 2 1 20 1 2 2 1 12 0 1 2 1 9 0 1 1 1 14 0 1 2 1 13 0 1 2 1 14 0 2 1 1 16 0 2 2 1 14 0 2 2 1 16

13 0 1 1 2 16 0 1 2 2 14 0 1 1 2 15 0 2 1 2 17 0 2 2 2 15 0 2 1 2 Πίνακας 3.4.1 Χρόνος επιβίωσης για την γραπτή δοκιµασία Στην πρώτη στήλη εµπεριέχεται ο βαθµός του κάθε µαθητή. Στην δεύτερη στήλη ένδειξη για το αν η παρατήρηση είναι περικοµµένη (0) ή όχι περικοµµένη (1). Στην τρίτη στήλη υπάρχουν οι τιµές της µεταβλητής που αφορά τη µέθοδο διδασκαλίας που ακολουθήθηκε. Στην δασκαλοκεντρική µέθοδο η τιµή της µεταβλητής είναι 1 και στην µαθητοκεντρική η τιµή είναι 2. Στην τέταρτη στήλη καταγράφεται το φύλο των µαθητών (1 για τα αγόρια, 2 για τα κορίτσια) και στην πέµπτη στήλη η ηλικία (2 για τα άτοµα τα µικρότερα των 18 χρόνων και 1 για τα άτοµα ηλικίας µεγαλύτερης ή ίσης των 18 χρόνων). 3.5 Παραµετρική ανάλυση των δεδοµένων Για την παραµετρική ανάλυση χρησιµοποιούµε το στατιστικό πακέτο MINITAB και την επιλογή stat και reliability/survival. Στην συνέχεια επιλέγουµε Distribution Analysis (Right censoring) και τέλος distribution ID plot. ηλώνουµε την µεταβλητή βαθµός στην οποία θα γίνει η ανάλυση επιβίωσης. Στην επιλογή censor δηλώνουµε την στήλη status όπου οι περικοµµένες παρατηρήσεις παίρνουν την τιµή 0 και οι µη περικοµµένες την τιµή 1. ηλώνουµε το µηδέν στο censoring value και επιλέγουµε τέσσερις κατανοµές για να δούµε αν 17

προσαρµόζονται ικανοποιητικά ή όχι τα δεδοµένα µας σε κάποια από αυτές. Χρησιµοποιούµε την κατανοµή Weibull, την Lognormal, την Exponential και την Normal, βλέπουµε τις γραφικές τους παραστάσεις και κάνουµε ελέγχους καλής προσαρµογής. Αν ο έλεγχος γίνεται χωρίς την βοήθεια στατιστικών πακέτων, κάνουµε έλεγχο X 2 ή έλεγχο Komogoroff-Smirnoff. Αν χρησιµοποιήσουµε στατιστικά πακέτα για την ανάλυση τότε ο έλεγχος που επιλέγουµε είναι η στατιστική συνάρτηση Anderson-Darling, και ο έλεγχος του συντελεστή συσχέτισης του Pearson. Η συνάρτηση Anderson-Darling υποδηλώνει καλύτερη προσαρµογή όταν η τιµή της είναι η µικρότερη δυνατή, ενώ στον έλεγχο του συντελεστή συσχέτισης καλύτερη προσαρµογή θα έχει η κατανοµή της οποίας η τιµή του συντελεστή συσχέτισης είναι πλησιέστερη στη µονάδα. Εδώ χρησιµοποιούµε την µέθοδο εκτίµησης Maximum-Likelihood, και µε βάση τα αποτελέσµατα του στατιστικού πακέτου βλέπουµε ότι οι κατανοµές Weibull και Normal προσαρµόζονται πολύ καλά στα δεδοµένα µας. Καλύτερη προσαρµογή έχουµε όταν οι παρατηρήσεις βρίσκονται όσο το δυνατόν πιο κοντά στην ευθεία γραµµή του γραφήµατος. Επίσης βλέπουµε την τιµή του Anderson-Darling για τις παραπάνω κατανοµές. 18

Probability Plot for ΒΑΘΜΟΣ ML Estimates-Censoring Column in STATUS Percent 99,9 90 50 10 1 0,1 5 Weibull 10 ΒΑ ΘΜΟΣ 20 Percent 99,9 99 90 50 10 1 0,1 10 Lognormal ΒΑ ΘΜΟΣ 20 A nderson-darling (adj) Weibull 1,031 Lognormal 1,314 Exponential 25,288 Normal 0,975 Percent 99,9 90 50 10 1 0,1 0,01 0,1 Exponential 1 ΒΑ ΘΜΟΣ 10 100 Percent 99,9 99 90 50 10 1 0,1 10 Normal 15 ΒΑ ΘΜΟΣ 20 25 ιάγραµµα 3.5.1 ιάγραµµα πιθανοτήτων για τις κατανοµές weibull, lognormal, εκθετική, κανονική των µαθητών της εφαρµογής ίνεται επίσης ο µέσος, το τυπικό του σφάλµα και το 95% διάστηµα εµπιστοσύνης σε κάθε περίπτωση. Standard 95% Normal CI Distribution Mean Error Lower Upper Weibull 14,9291 0,27883 14,3925 15,4857 Lognormal 14,9880 0,31001 14,3926 15,6081 Exponential 16,6344 1,72491 13,5751 20,3832 Normal 14,9349 0,27940 14,3873 15,4825 19

Βλέπουµε ότι µε βάση τον δείκτη A.D. καλύτερη προσαρµογή έχουν η Normal και η Weibull κατανοµή. Με βάση τα παραπάνω και συνυπολογίζοντας τον συντελεστή συσχέτισης επιλέγουµε την κατανοµή Weibull για να την προσαρµόσουµε στα δεδοµένα µας. Συνεχίζοντας την ανάλυση, παρουσιάζεται η συνάρτηση πυκνότητας πιθανότητας, η συνάρτηση επιβίωσης (δηλαδή η πιθανότητα ένας µαθητής να πάρει βαθµό µεγαλύτερο ή ίσο του σηµείου που βρισκόµαστε) και η συνάρτηση κινδύνου της Weibull κατανοµής µε το συγκεκριµένο ρ και λ. Το στατιστικό πακέτο κάνει εκτίµηση για την παράµετρο µορφής µε ρ=6.22440 και για την παράµετρο κλίµακας, (λ=16.0596) της κατανοµής. Παρατηρούµε ότι η προσαρµογή στα δεδοµένα είναι πολύ καλή. Distribution Overview Plot for ΒΑΘΜΟΣ ML Estimates-Censoring Column in STATUS PDF 0,15 0,10 0,05 Probability Density Function Percent 99,9 90 50 10 1 Weibull Table of Statistics Shape 6,22440 Scale 16,0598 Mean 14,9291 StDev 2,79654 Median 15,1414 IQ R 3,77857 Failure 93 Censor 13 AD* 1,031 0,00 10 15 ΒΑ ΘΜΟΣ 20 0,1 5 10 ΒΑ ΘΜΟΣ 20 100 Surv iv al Function 1,5 Hazard Function Percent 50 Rate 1,0 0,5 0 10 15 ΒΑ ΘΜΟΣ 20 0,0 10 15 ΒΑ ΘΜΟΣ 20 ιάγραµµα 3.5.2 ιάγραµµα πιθανοτήτων συνάρτησης πυκνότητας, πιθανότητας συνάρτησης επιβίωσης και συνάρτηση κινδύνου για την κατανοµή weibull των µαθητών της εφαρµογής Για τα δεδοµένα µας ο µέσος είναι 14.92, το τυπικό του σφάλµα είναι 2.79 και η διάµεσος είναι 15.14. 20

Στο σχήµα που ακολουθεί παρατηρούµε την προσαρµογή της κατανοµής στα δεδοµένα. Βλέπουµε ότι οι τιµές βρίσκονται πάνω στην ευθεία και σε Ε 95%. Standard 95,0% Normal CI Estimate Error Lower Upper Mean(MTTF) 14,9291 0,278831 14,3925 15,4857 Standard Deviation 2,79654 0,187825 2,45161 3,19000 Median 15,1414 0,285148 14,5928 15,7108 First Quartile(Q1) 13,1465 0,342511 12,4920 13,8352 Third Quartile(Q3) 16,9251 0,281966 16,3813 17,4868 Interquartile Range(IQR) 3,77857 0,272161 3,28108 4,35148 Probability Plot for ΒΑΘΜΟΣ Weibull - 95% CI Censoring Column in STATUS - ML Estimates Percent 99,9 99 90 80 70 60 50 40 30 20 10 5 3 2 1 Table of Statistics Shape 6,22440 Scale 16,0598 Mean 14,9291 StDev 2,79654 Median 15,1414 IQ R 3,77857 Failure 93 Censor 13 AD* 1,031 0,1 4 5 6 7 8 9 10 ΒΑΘΜΟΣ 15 20 ιάγραµµα 3.5.3 ιάγραµµα πιθανοτήτων για την κατανοµή weibull των µαθητών της εφαρµογής 21

22

ΚΕΦΑΛΑΙΟ 4 ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟ ΟΙ 4.1 Γενικά Εκτός από την παραµετρική ανάλυση και την χρησιµοποίηση συγκεκριµένων κατανοµών, µπορούµε να αναλύσουµε τα δεδοµένα µας µε µη παραµετρικές µεθόδους, χρησιµοποιώντας κυρίως την µέθοδο Kaplan-Meier. 4.2 είγµα χωρίς περικοµµένες παρατηρήσεις (πλήρες δείγµα) Για ένα τυχαίο δείγµα n χρόνων επιβίωσης (t i, i=1,2.3, n) διατάσσουµε κατά αύξουσα σειρά µεγέθους τους χρόνους επιβίωσης και εκτιµάµε την εµπειρική αθροιστική συνάρτηση κατανοµής F t από τον αριθµό των παρατηρήσεων που είναι µικρότερες ή ίσες του χρόνου t. Άρα : Και συνεπώς η εµπειρική συνάρτηση επιβίωσης που δείχνει τον αριθµό των παρατηρήσεων που είναι µεγαλύτερες από τον χρόνο t θα είναι: 4.3 είγµα µε περικοµµένες παρατηρήσεις. Μέθοδος Kaplan-Meier Τα περισσότερα δείγµατα δεδοµένων διάρκειας ζωής δεν είναι πλήρη. Σε αυτήν την περίπτωση ο εκτιµητής που χρησιµοποιείται πιο συχνά είναι ο Kaplan - Meier ή product limit εκτιµητής. Για την ανάλυση χρησιµοποιούµε τον αλγόριθµο του Elton ή τον Kaplan- Meier εκτιµητή. Συγκεκριµένα για την κατασκευή της γραφικής παράστασης 23

µοιράζουµε αρχικά την µάζα όλης της κατανοµής σε ίσα µέρη. Όταν έχουµε περικοµµένη παρατήρηση διώχνουµε την µάζα της περικοµµένης παρατήρησης στα δεξιά και την προσθέτουµε στις παρατηρήσεις που ακολουθούν. Ξεκινάµε το γράφηµα από την τιµή 1 και όπου υπάρχει περικοµµένη παρατήρηση την αγνοούµε. Άρα στην περικοµµένη παρατήρηση δεν θα υπάρχει σκαλοπάτι. Επίσης όταν σε ένα χρόνο υπάρχει χρόνος αποτυχίας και περικοµµένη παρατήρηση, την περικοµµένη παρατήρηση την υπολογίζουµε µετά τον χρόνο αποτυχίας. Έστω ότι το δείγµα περιέχει κ<n διατεταγµένους χρόνους επιβίωσης µε dj dκ θανάτους σε αυτούς τους χρόνους αντίστοιχα. Αν nj είναι ο αριθµός των υποκείµενων σε κίνδυνο αµέσως πριν τον χρόνο rj, τότε η εκτίµηση της δεσµευµένης πιθανότητας θα είναι: και υποθέτοντας ανεξαρτησία σε κάθε rj, ο Kaplan-Meier εκτιµητής της S(t), θα είναι σε κάθε χρόνο αποτυχίας η ποσότητα: Παρατηρούµε ότι: Το γράφηµα του Kaplan - Meier εκτιµητή είναι πάντα µε σκαλοπάτια. Πάντα ξεκινάει από το 1 και άρα για t<r 1 τότε S(t)=1. Αν η τελευταία παρατήρηση είναι περικοµµένη τότε S(t)=α>0 για t>r κ Στην περίπτωση αυτή ο Kaplan-Meier εκτιµητής είναι µεροληπτικός για κάθε t>r κ. Όταν στο δείγµα δεν έχουµε περικοµµένες παρατηρήσεις (πλήρες δείγµα), τότε η συνάρτηση επιβίωσης S(t) µπορεί και πάλι να υπολογιστεί µε τον Kaplan- Meier εκτιµητή µε τον παραπάνω τρόπο. 24

4.4 ιακύµανση Kaplan-Meier Η διακύµανση σε πλήρη δείγµατα ή δείγµατα µε περικοµµένες παρατήρησης υπολογίζεται από τον τύπο του Greenwood και είναι: Για να φτιάξουµε.ε 95% συµµετρικό γύρω από την εκτίµηση S(t), τότε θα πρέπει να υπολογίσουµε την εξής ποσότητα: Όταν όµως η συνάρτηση επιβίωσης είναι κοντά στο 0 ή στο 1, ένα συµµετρικό Ε είναι συχνά ακατάλληλο γιατί µπορεί να οδηγήσει σε περιοχή εκτός του [0,1] που βέβαια δεν έχει νόηµα αφού η S(t) είναι η πιθανότητα να επιβιώσει κάποιος µετά τον χρόνο t. Για αυτό τον λόγο κάνουµε µετασχηµατισµό είτε µέσω του logit: είτε µέσω του complimentary loglog: Η διακύµανση υπολογίζεται µε την δ µέθοδο και είναι: και άρα το διάστηµα εµπιστοσύνης 95% θα είναι: Απολογαριθµοποιούµε και υπολογίζουµε το Ε για την S(t). 25

4.5 Χρήση του Kaplan-Meier για την εκτίµηση συγγενών ποσοτήτων Από τον εκτιµητή S(t) µπορεί να εκτιµηθεί η h(t) η οποία είναι: και η διακύµανσή της Υπολογίζουµε επίσης το ρ-οστο εκατοστηµόριο του χρόνου επιβίωσης: Η εκτίµηση του t ρ στον οποίο παίρνουµε τον µικρότερο χρόνο επιβίωσης των παρατηρήσεων θα είναι: Από τον συγκεκριµένο τύπο µπορούµε να υπολογίσουµε την διάµεσο και τα τεταρτηµόρια της κατανοµής. Ο διάµεσος χρόνος επιβίωσης tm είναι ο χρόνος που αναµένεται να επιβιώσει το 50% των ατόµων του πληθυσµού. Είναι ο µικρότερος χρόνος αποτυχίας που θα έχει S(t) 0,5. Το πρώτο τεταρτηµόριο είναι ο µικρότερος χρόνος αποτυχίας που θα έχει S(t) 0,75. Το τρίτο τεταρτηµόριο είναι ο µικρότερος χρόνος αποτυχίας που θα έχει S(t) 0,25. Ο µέσος χρόνος επιβίωσης ή µέση διάρκεια ζωής εκτιµάται από το εµβαδόν της γραφικής παράστασης της συνάρτησης επιβίωσης µε ολοκλήρωµα και ισούται µε το άθροισµα όλων των εµβαδών του ορθογωνίου µεταξύ της καµπύλης S(t) και των αξόνων Χ και Υ. Όταν η τελευταία παρατήρηση είναι µη περικοµµένη ο µέσος χρόνος επιβίωσης υπολογίζεται εύκολα από το παραπάνω εµβαδόν. Αν η τελευταία παρατήρηση είναι περικοµµένη τότε η καµπύλη επιβίωσης δεν τέµνει τον άξονα του 26

Χ. Για να υπολογίσουµε τον µέσο παίρνουµε τον αµέσως επόµενο φυσικό αριθµό από την τελευταία περικοµµένη τιµή και υπολογίζουµε το εµβαδόν που περικλείει η καµπύλη επιβίωσης έως τον αριθµό αυτό. Μαζί µε την σηµειακή εκτίµηση του υπολογίζεται και η διακύµανση της και στην συνέχεια µπορούµε να φτιάξουµε.ε. 95% για τον. 4.6 Nelson-Aalen εκτιµητής Είναι εναλλακτικός εκτιµητής του Kaplan-Meier. Ο συγκεκριµένος εκτιµητής αντί να εκτιµήσει την συνάρτηση επιβίωσης h(t):, εκτιµάει την συνάρτηση κινδύνου Όπου dj ο αριθµός θανάτων και nj ο αριθµός των ατόµων που βρίσκονται σε κίνδυνο την χρονική στιγµή j. Αν θέλουµε να εκτιµήσουµε την συνάρτηση επιβίωσης S(t) αυτή συνδέεται µε το ως εξής: 4.7 Ανάλυση µε την µέθοδο Kaplan-Meier Από τα δεδοµένα µας βρίσκουµε την συνάρτηση επιβίωσης. Που υπολογίζεται από τον τύπο: 27

greenwood : Για να υπολογίσουµε το τυπικό σφάλµα θα χρησιµοποιήσουµε τον τύπο του Στη συνέχεια θα πάρουµε την διακύµανση και θα υπολογίσουµε διάστηµα εµπιστοσύνης 95% µε άνω όριο το 1. Ο διάµεσος χρόνος επιβίωσης δηλαδή τον χρόνο αποτυχίας µε πιθανότητα 50% βλέπουµε ότι είναι 15. Αυτό σηµαίνει ότι στον προκαθορισµένο χρόνο παράδοσης του διαγωνίσµατος οι µισοί µαθητές παίρνουν βαθµό µεγαλύτερο από το 15. Η µέση διάρκεια ζωής εκτιµάται στο διάγραµµα από το εµβαδόν που περικλείεται µεταξύ της καµπύλης επιβίωσης και των αξόνων X,Y. Άρα για τον υπολογισµό του συνολικού εµβαδού θα προσθέσουµε όλα τα επιµέρους εµβαδά: µ=7*1+2*0.99+1*0.97+1*0.94+1*0.86+1*0.79+1*0.72+1*0.56+1*0.43+1*0.31+1* 0.22+1*0.12+1*0.04+0=14.94 Για την διακύµανση ισχύει: όπου το r αντιστοιχεί σε µη περικοµµένη παρατήρηση και A είναι το εµβαδόν που βρίσκεται δεξιά από τον χρόνο αποτυχίας. Υπολογίζουµε την διακύµανση που είναι 0.0784 και στη συνέχεια φτιάχνουµε διάστηµα εµπιστοσύνης 95% της µέσης διάρκειας ζωής. Το διάστηµα εµπιστοσύνης 95% είναι (14.8616, 15.0184). 28

4.8 Εφαρµογή µε το Minitab Από την επιλογή stat επιλέγουµε reliability/survival, στην συνέχεια distribution analysis (right censoring) και στην συνέχεια non parametric distribution analysis. Η µεταβλητή ενδιαφέροντος είναι η βαθµολογία των µαθητών. Από το censor δηλώνουµε την στήλη που περιέχει τις περικοµµένες παρατηρήσεις (status) και βάζουµε στο censoring value την τιµή 0 για να δείξουµε ότι η παρατήρηση 0 είναι περικοµµένη. Στο πίνακα αποτελεσµάτων θα έχουµε : Standard 95,0% Normal CI Mean(MTTF) Error Lower Upper 14,9716 0,279120 14,4245 15,5186 Median = 15 IQR = 4 Q1 = 13 Q3 = 17 Η µέση τιµή είναι 14.971, η τυπική απόκλιση 0.279 και το διάστηµα εµπιστοσύνης 95% (14.424, 15.518). Η διάµεσος είναι 15, το πρώτο τεταρτηµόριο έχει τιµή 13 και το τρίτο 17. Στη συνέχεια ακολουθεί εκτίµηση της συνάρτησης επιβίωσης µε την µέθοδο Kaplan-meier, το τυπικό σφάλµα και τα διαστήµατα εµπιστοσύνης 95% για κάθε χρόνο αποτυχίας. Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 7 106 1 0,990566 0,0093894 0,972163 1,00000 9 105 2 0,971698 0,0161072 0,940129 1,00000 29

10 102 3 0,943119 0,0225534 0,898915 0,98732 11 99 6 0,885960 0,0309901 0,825220 0,94670 12 93 10 0,790696 0,0396851 0,712914 0,86848 13 82 7 0,723197 0,0437355 0,637477 0,80892 14 73 16 0,564688 0,0489115 0,468823 0,66055 15 53 13 0,426180 0,0497638 0,328645 0,52371 16 38 10 0,314027 0,0476588 0,220618 0,40744 17 26 8 0,217403 0,0435497 0,132048 0,30276 18 17 8 0,115096 0,0349889 0,046519 0,18367 19 9 6 0,038365 0,0215201 0,000000 0,08054 20 3 3 0,000000 0,0000000 0,000000 0,00000 Στην συνέχεια δίνεται η συνάρτηση επιβίωσης του Κ.Μ εκτιµητή για την βαθµολογία των µαθητών και διάγραµµα µε διαστήµατα εµπιστοσύνης 95%. 30

100 80 Survival Plot for ΒΑΘΜΟΣ Kaplan-Meier Method Censoring Column in STATUS Table of Statistics Mean 14,9716 Median 15 IQR 4 Percent 60 40 20 0 0 5 10 ΒΑΘΜΟΣ 15 20 ιάγραµµα 4.8.1 Συνάρτηση επιβίωσης για τους µαθητές της εφαρµογής µε το στατιστικό πακέτο Minitab 100 80 Survival Plot for ΒΑΘΜΟΣ Kaplan-Meier Method - 95% CI Censoring Column in STATUS Table of Statistics Mean 14,9716 Median 15 IQR 4 Percent 60 40 20 0 0 5 10 ΒΑΘΜΟΣ 15 20 ιάγραµµα 4.8.2 Συνάρτηση επιβίωσης και διάστηµα εµπιστοσύνης 95% για τους µαθητές της εφαρµογής µε το στατιστικό πακέτο Minitab 31

Η συνάρτηση επιβίωσης στον χρόνο t(i) εκφράζει την πιθανότητα ένας µαθητής να πάρει βαθµό µεγαλύτερο ή ίσο από το βαθµό που αντιστοιχεί στον συγκεκριµένο χρόνο. Για παράδειγµα η πιθανότητα ένας µαθητής να πάρει βαθµό µεγαλύτερο ή ίσο του 10 είναι 94.3%, µεγαλύτερο ή ίσο του 15 είναι 42.6% και µεγαλύτερο ή ίσο του 18 είναι 11.5%. Η αθροιστική συνάρτηση κατανοµής στον χρόνο t(i) εκφράζει την πιθανότητα ένας µαθητής να πάρει βαθµό µικρότερο από τον βαθµό που αντιστοιχεί στον συγκεκριµένο χρόνο επιβίωσης. Για παράδειγµα η πιθανότητα ένας µαθητής να πάρει βαθµό µικρότερο του 10 είναι 3,7% µικρότερο του 15 είναι 37,4% και µικρότερο του 18 είναι 78,5%. 4.9 Σύγκριση καµπυλών επιβίωσης µε µη παραµετρικές µεθόδους Στα δεδοµένα επιβίωσης δεν µας ενδιαφέρει µόνο η εκτίµηση της συνάρτησης επιβίωσης αλλά κυρίως η σύγκριση κατανοµών επιβίωσης ατόµων που ανήκουν σε δύο ή περισσότερες οµάδες και διαφέρουν προς ένα χαρακτηριστικό. Μια τέτοια σύγκριση µπορεί να γίνει οπτικά από τις καµπύλες επιβίωσης των διαφορετικών οµάδων όταν αυτές σχεδιαστούν στο ίδιο γράφηµα. Αυτό όµως δίνει µόνο µια γενική ιδέα για την µεταξύ τους διαφορά και δεν µπορούµε να συµπεράνουµε αν οι διαφορές είναι ή όχι στατιστικά σηµαντικές. Άρα είναι αναγκαίο κάποιο στατιστικό τεστ. Αν τα δεδοµένα δεν περιέχουν περικοµµένες παρατηρήσεις τότε µπορούµε να χρησιµοποιήσουµε τα µη παραµετρικά τεστ Wilcoxon ή Mann-Whitney. Αν τα δεδοµένα περιέχουν περικοµµένες παρατηρήσεις, το οποίο είναι το σύνηθες, θα χρησιµοποιήσουµε το Genen s Generehsed Wilcoxon test, το Coxmental test, και κυρίως το Logrank test. 32

4.10 Ο Logrank έλεγχος Είναι ο πιο διαδεδοµένος έλεγχος για την σύγκριση δύο καµπυλών επιβίωσης. Συγκεκριµένα για την σύγκριση των δεδοµένων επιβίωσης που ανήκουν σε δύο ή περισσότερες διαφορετικές οµάδες υποθέτουµε ότι δεν υπάρχει διαφορά στην επιβίωση έναντι της εναλλακτικής υπόθεσης ότι υπάρχει διαφορά µεταξύ των οµάδων: Ορισµένες φορές µπορούµε να χρησιµοποιήσουµε την µηδενική υπόθεση ότι οι πιθανότητες επιβίωσης για την πρώτη οµάδα είναι µεγαλύτερες από την δεύτερη έναντι της εναλλακτικής υπόθεσης ότι οι πιθανότητες επιβίωσης της δεύτερης είναι περισσότερες από ότι της πρώτης οµάδας. Για να κάνουµε έλεγχο Logrank αρχικά ενοποιούµε τα δεδοµένα µας, αφαιρούµε τις περικοµµένες παρατηρήσεις και διατάσσουµε τους χρόνους αποτυχίας σε αύξουσα σειρά. Υποθέτουµε ότι d ji είναι ο αριθµός των αποτυχιών της οµάδας 1 την χρονική στιγµή t(j) και n 1j είναι ο αριθµός των υποκείµενων που είναι σε κίνδυνο την χρονική στιγµή t(j) από την 1 η οµάδα. Αντίστοιχα d 2j και n 2j είναι οι αριθµοί των αποτυχιών και των ατόµων σε κίνδυνο από την οµάδα 2. Θεωρούµε ότι d j είναι ο συνολικός αριθµός των αποτυχιών την χρονική στιγµή t(j) και από τις δύο οµάδες, δηλαδή και nj είναι ο αριθµός των ατόµων σε κίνδυνο την χρονική στιγµή tj και από τις δύο οµάδες. ηλαδή 33

Ο έλεγχος logrank ελέγχει την εξετάζοντας την διαφορά µεταξύ του παρατηρούµενου και αναµενόµενου αριθµού αποτυχιών στις δύο οµάδες για όλα τα t(j) κάτω από την µηδενική υπόθεση. ΟΜΑ Α Αποτυχία Επιζών Σύνολο 1 d1j n1j-d1j n1j 2 d2j n2j-d2j n2j Σύνολο dj nj-dj nj Οι τυχαίες µεταβλητές d 1j και d 2j ακολουθούν υπεργεωµετρική κατανοµή. Αν κρατήσουµε σταθερά τα περιθώρια αθροίσµατα µπορούµε να υπολογίσουµε τους αναµενόµενους αριθµούς αποτυχιών: Και την διασπορά της κατανοµής που δίνεται από τον τύπο: Φτιάχνουµε τον πίνακα συνάφειας για κάθε χρόνο αποτυχίας j και για τις δύο οµάδες και υπολογίζουµε το e1j και v1j. Ο έλεγχος ισότητες των συναρτήσεων S1 και S2 βασίζεται στην ποσότητα: ηλαδή υπολογίζουµε το άθροισµα όλων των διαφορών µεταξύ των παρατηρούµενων και των αναµενόµενων θανάτων. Αποδεικνύεται ότι η u ακολουθεί προσεγγιστικά κανονική κατανοµή : u ~ N (0,V) για µεγάλο αριθµό αποτυχιών 34

Τέλος υπολογίζουµε την ποσότητα µε και την συγκρίνουµε µε την κρίσιµη τιµή Χ 2 1, 0,95 Προσεγγιστικά µπορούµε να χρησιµοποιήσουµε τις αναµενόµενες και τις παρατηρούµενες τιµές χωρίς να χρειάζεται ο υπολογισµός της διακύµανσης: Όπου Εκτός από τον έλεγχο Logrank που σταθµίζει ισότιµα όλους τους χρόνους αποτυχίας, υπάρχουν και άλλοι έλεγχοι οι οποίοι δίνουν περισσότερο ή λιγότερο βάρος σε κάποιους από τους χρόνους αποτυχίας. Αν θέλουµε να δώσουµε µεγαλύτερο βάρος στην αρχή της µελέτης χρησιµοποιούµε τον έλεγχο Wilcoxon, τον έλεγχο Torone-ware ή τον έλεγχο peto. O flemigton-harrigton δίνει µεγαλύτερη ευελιξία. Ο έλεγχος αυτός µπορεί να δώσει έµφαση άλλοτε στην αρχή και άλλοτε στο τέλος της µελέτης. Η επιλογή του ελέγχου γίνεται µε βάση την µεγαλύτερη ισχύ, η οποία εξαρτάται από τον τρόπο που θεωρούµε ότι απορρίπτεται η Ηο. Η φύση του προβλήµατος µπορεί να επιβάλλει πιο έντονες διαφορές στην αρχή ή στο τέλος της µελέτης για αυτό τον λόγο επιλέγεται ένα συγκεκριµένο τεστ. Η επιλογή του ελέγχου πρέπει να γίνεται εκ των προτέρων. 35

4.11 Εφαρµογή στο logrank test Θα συγκρίνουµε τις βαθµολογίες των µαθητών για τις δύο οµάδες ως προς την µέθοδο διδασκαλίας. Η µηδενική υπόθεση και η εναλλακτική είναι : δηλαδή οι δύο µέθοδοι είναι το ίδιο αποτελεσµατικοί. δηλαδή οι δύο µέθοδοι δεν είναι το ίδιο αποτελεσµατικές. Για να κάνουµε τον έλεγχο θα φτιάξουµε τον παρακάτω πίνακα: j d 1j n 1j d 2j n 2j d j n j e 1j v 1j 1 1 53 1 53 2 106 1 0,25 t 1 =7 2 1 52 0 52 1 104 0,5 0,25 t 2 =9 3 3 50 0 52 3 102 1,47 0,24 t 3 =10 4 5 47 1 52 6 99 2,84 0,24 t 4 =11 5 8 42 2 51 10 93 4,51 0,22 t 5 =12 6 4 33 3 49 7 82 2,81 0,24 t 6 =13 7 7 27 9 46 16 73 5,91 0,18 t 7 =14 8 6 18 7 35 13 53 4,41 0,17 t 8 =15 9 3 12 7 26 10 38 3,15 0,16 t 9 =16 10 3 8 5 18 8 26 2,46 0,15 t 10 =17 11 2 5 6 12 8 17 2,35 0,12 t 11 =18 12 2 3 4 6 6 9 2 0,08 t 12 =19 13 1 1 2 2 3 3 1 0 t 13 =20 Πίνακας 4.11.1 Υπολογισµοί Vi για τους μαθητές της εφαρμογής ανάλογα με την μέθοδο διδασκαλίας Υπολογίζουµε την ποσότητα Σd 1j =46, Σd 2j =47, Σe 1j = 34,41 και Σ v 1j = 2,3 Στην συνέχεια θα υπολογίσουµε την ποσότητα U=11,59 και στην συνέχεια και θα την συγκρίνουµε µε την κρίσιµη τιµή απορρίπτεται ή όχι η µηδενική υπόθεση. για να δούµε αν 36

Το αποτέλεσµα 58,40 >3,84 δείχνει ότι απορρίπτεται η µηδενική υπόθεση και άρα υπάρχει στατιστικά σηµαντική διαφορά ως προς την µέθοδο διδασκαλίας που ακολουθήθηκε. Με τον ίδιο τρόπο βρίσκουµε ότι υπάρχουν στατιστικά σηµαντικές διαφορές στην βαθµολογία των µαθητών ως προς το φύλο. Αντίθετα ο έλεγχος δεν έδειξε στατιστικά σηµαντική διαφορά στην βαθµολογία των µαθητών των δύο ηλικιακών οµάδων. Για να κάνουµε το Logrank test µε το στατιστικό πακέτο minitab θα επιλέξουµε stat και Reliability/Survival. Στη συνέχεια θα προχωρήσουµε µε την επιλογή distribution analysis (Right censoring) και τέλος θα επιλέξουµε Non parametric distribution analysis. Θα πάρουµε το output που ακολουθεί: Distribution Analysis: Βαθµός by Μέθοδος 1 Standard 95,0% Normal CI Mean(MTTF) Error Lower Upper 14,0292 0,409806 13,2260 14,8324 Median = 14 IQR = 4 Q1 = 12 Q3 = 16 Kaplan-Meier Estimates Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 37

7 53 1 0,981132 0,0186891 0,944502 1,00000 9 52 1 0,962264 0,0261750 0,910962 1,00000 10 50 3 0,904528 0,0406184 0,824918 0,98414 11 47 5 0,808302 0,0545196 0,701445 0,91516 12 42 8 0,654340 0,0659284 0,525122 0,78356 13 33 4 0,575026 0,0688386 0,440105 0,70995 14 27 7 0,425945 0,0703704 0,288022 0,56387 15 18 6 0,283963 0,0666390 0,153353 0,41457 16 12 3 0,212972 0,0613013 0,092824 0,33312 17 8 3 0,133108 0,0528842 0,029457 0,23676 18 5 2 0,079865 0,0430961 0,000000 0,16433 19 3 2 0,026622 0,0260545 0,000000 0,07769 20 1 1 0,000000 0,0000000 0,000000 0,00000 Distribution Analysis: Βαθµός by Μέθοδος 2 Standard 95,0% Normal CI Mean(MTTF) Error Lower Upper 15,8730 0,337199 15,2121 16,5339 Median = 16 IQR = 4 Q1 = 14 Q3 = 18 38

Kaplan-Meier Estimates Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 9 53 1 0,981132 0,0186891 0,944502 1,00000 11 52 1 0,962264 0,0261750 0,910962 1,00000 12 51 2 0,924528 0,0362839 0,853413 0,99564 13 49 3 0,867925 0,0465066 0,776773 0,95908 14 46 9 0,698113 0,0630590 0,574520 0,82171 15 35 7 0,558491 0,0690859 0,423085 0,69390 16 26 7 0,408128 0,0700650 0,270803 0,54545 17 18 5 0,294759 0,0664611 0,164498 0,42502 18 12 6 0,147379 0,0539845 0,041572 0,25319 19 6 4 0,049126 0,0335900 0,000000 0,11496 20 2 2 0,000000 0,0000000 0,000000 0,00000 Test Statistics Method Chi-Square DF P-Value Log-Rank 8,2456 1 0,004 Wilcoxon 11,9539 1 0,001 39

Survival Plot for ΒΑΘΜΟΣ Kaplan-Meier Method Censoring Column in STATUS Percent 100 80 60 40 ΜΕΘΟ ΟΣ 1 2 Table of Statistics Mean Median IQR 14,0292 14 4 15,8730 16 4 20 0 0 5 10 ΒΑΘΜΟΣ 15 20 ιάγραµµα 4.11.1 Συνάρτηση επιβίωσης ανάλογα µε την µέθοδο διδασκαλίας για τους µαθητές της εφαρµογής µε το Minitab Ο έλεγχος Longrak και Wilcoxon δείχνει ότι υπάρχει διαφορά στις δύο µεθόδους διδασκαλίας (p-value 0.000). Η µαθητοκεντρική µέθοδος διδασκαλίας (2) έχει καλύτερο αποτέλεσµα από την δασκαλοκεντρική (1). 4.12 Σύγκριση ως προς το φύλο Αν θέλουµε να δούµε αν υπάρχει διαφορά στην βαθµολογία των µαθητών µεταξύ αγοριών και κοριτσιών θα κάνουµε Logrank έλεγχο ως προς το φύλο. Distribution Analysis: Βαθµός by Φύλο 1 Kaplan-Meier Estimates 40

Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 9 30 1 0,966667 0,0327731 0,902433 1,00000 10 28 2 0,897619 0,0560324 0,787798 1,00000 11 26 3 0,794048 0,0749667 0,647116 0,94098 12 23 4 0,655952 0,0881682 0,483146 0,82876 13 19 4 0,517857 0,0927843 0,336003 0,69971 14 14 3 0,406888 0,0924113 0,225765 0,58801 15 9 5 0,180839 0,0789236 0,026152 0,33553 16 2 2 0,000000 0,0000000 0,000000 0,00000 Distribution Analysis: Βαθµός by Φύλο 2 Kaplan-Meier Estimates Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 7 76 1 0,986842 0,0130710 0,961223 1,00000 9 75 1 0,973684 0,0183616 0,937696 1,00000 10 74 1 0,960526 0,0223358 0,916749 1,00000 11 73 3 0,921053 0,0309317 0,860428 0,98168 12 70 6 0,842105 0,0418273 0,760125 0,92409 13 63 3 0,802005 0,0457969 0,712245 0,89177 14 59 13 0,625292 0,0561049 0,515328 0,73526 41

15 44 8 0,511603 0,0585584 0,396830 0,62637 16 36 8 0,397913 0,0577149 0,284794 0,51103 17 26 8 0,275478 0,0537936 0,170045 0,38091 18 17 8 0,145841 0,0438542 0,059889 0,23179 19 9 6 0,048614 0,0271821 0,000000 0,10189 20 3 3 0,000000 0,0000000 0,000000 0,00000 Survival Plot for ΒΑΘΜΟΣ Kaplan-Meier Method Censoring Column in STATUS Percent 100 80 60 40 ΦΥΛΟ 1 2 Table of Statistics Mean Median IQR 13,4199 14 3 15,4778 16 4 20 0 0 5 10 ΒΑΘΜΟΣ 15 20 ιάγραµµα 4.12.1 Συναρτήσεις επιβίωσης αγοριών (1) και κοριτσιών (2) για τους µαθητές της εφαρµογής µε το Minitab Distribution Analysis: Βαθµός by Φύλο Comparison of Survival Curves Test Statistics Method Chi-Square DF P-Value Log-Rank 13,2556 1 0,000 Wilcoxon 10,8289 1 0,001 42

Ο έλεγχος Longrak και Wilcoxon δείχνει ότι υπάρχει διαφορά στα δύο φύλα (p-value 0.000). και p-value 0,001. Βλέπουµε πως τα κορίτσια παίρνουν µεγαλύτερη βαθµολογία από τα αγόρια. 4.13 Σύγκριση ως προς την ηλικία Αν θέλουµε να δούµε αν υπάρχει διαφορά στην βαθµολογία των µαθητών µεταξύ ενηλίκων και ανηλίκων θα κάνουµε Logrank έλεγχο ως προς την ηλικία. Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 7 63 1 0,984127 0,0157465 0,953264 1,00000 9 62 2 0,952381 0,0268303 0,899795 1,00000 10 59 3 0,903955 0,0372890 0,830870 0,97704 11 56 4 0,839387 0,0465483 0,748154 0,93062 12 52 8 0,710250 0,0575775 0,597400 0,82310 13 43 5 0,627663 0,0615998 0,506930 0,74840 14 37 7 0,508916 0,0642486 0,382991 0,63484 15 27 7 0,376975 0,0640868 0,251367 0,50258 16 20 4 0,301580 0,0613632 0,181310 0,42185 17 15 5 0,201053 0,0549631 0,093328 0,30878 18 10 4 0,120632 0,0453616 0,031725 0,20954 19 6 3 0,060316 0,0334777 0,000000 0,12593 20 3 3 0,000000 0,0000000 0,000000 0,00000 43

Kaplan-Meier Estimates Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 11 43 2 0,953488 0,0321147 0,890545 1,00000 12 41 2 0,906977 0,0442955 0,820159 0,99379 13 39 2 0,860465 0,0528413 0,756898 0,96403 14 36 9 0,645349 0,0736673 0,500964 0,78973 15 26 6 0,496422 0,0778116 0,343914 0,64893 16 18 6 0,330948 0,0757190 0,182542 0,47935 17 11 3 0,240690 0,0707634 0,101996 0,37938 18 7 4 0,103153 0,0542816 0,000000 0,20954 19 3 3 0,000000 0,0000000 0,000000 0,00000 Survival Plot for ΒΑΘΜΟΣ Kaplan-Meier Method Censoring Column in STATUS Percent 100 80 60 40 ΗΛΙΚΙΑ 1 2 Table of Statistics Mean Median IQR 14,5714 15 5 15,5375 15 3 20 0 0 5 10 ΒΑΘΜΟΣ 15 20 ιάγραµµα 4.13.1 Συναρτήσεις επιβίωσης ενηλίκων (2) και ανηλίκων (1) µαθητών για τους µαθητές της εφαρµογής µε το Minitab 44

Method Chi-Square DF P-Value Log-Rank 0,71801 1 0,397 Wilcoxon 3,23398 1 0,072 Ο έλεγχος Longrak και Wilcoxon δείχνουν ότι δεν υπάρχει στατιστικά σηµαντική διαφορά στην βαθµολογία µεταξύ ενηλίκων και ανηλίκων (pvalue=0,397 και 0,072 αντίστοιχα). 45

46

ΚΕΦΑΛΑΙΟ 5 ΜΟΝΤΕΛΟ ΤΟΥ COX 5.1 Εισαγωγή Ο έλεγχος Logrank και οι άλλοι έλεγχοι που αναφέρθηκαν ελέγχουν την ισότητα συναρτήσεων επιβίωσης διαφόρων οµάδων, λαµβάνοντας υπόψη ένα συγκεκριµένο χαρακτηριστικό. Όλοι οι παραπάνω έλεγχοι δεν µπορούν να προσαρµοστούν για την διερεύνηση της επίδρασης περισσοτέρων από ένα χαρακτηριστικών και άρα περισσότερων από µιας µεταβλητής που επηρεάζουν την επιβίωση. Σε µια τέτοια περίπτωση συνήθως χρησιµοποιείται ένα µοντέλο παλινδρόµησης. Το πιο συχνά εφαρµόσιµο είναι το µοντέλο παλλινδρόµησης του Cox ή µοντέλο αναλογικού κινδύνου του Cox (PH µοντέλο του Cox). Το µοντέλο του Cox όπως παρουσιάστηκε το 1972από τον Cox µοντελοποιεί την συνάρτηση κινδύνου (h(t)). Το µοντέλο χρησιµοποιείται ευρέως και σήµερα για περικοµµένα και µη δεδοµένα επιβίωσης και για την διερεύνηση των διαφορών στην επιβίωση µεταξύ οµάδων µε διαφορετικά χαρακτηριστικά και της σχέσης των χρόνων επιβίωσης και επεξηγηµατικών µεταβλητών. Μας επιτρέπει επίσης να εκτιµήσουµε τον κίνδυνο θανάτου ενός ατόµου σε σχέση µε συγκεκριµένες µεταβλητές που ενδεχόµενα να επηρεάζουν. 5.2 Το Μοντέλο του COX Το µοντέλο του Cox είναι ένα ηµιπαραµετρικό µοντέλο παλινδρόµησης. Η συνάρτηση κινδύνου έχει την εξής µορφή: Επίσης το β είναι ένα διάνυσµα µεταβλητών (β1, β2,...βn). Οι µεταβλητές αυτές παριστάνουν διάφορα χαρακτηριστικά όπως, φύλο, ηλικία, θεραπεία κ.τ.λ. Το µοντέλο αναλογικού κινδύνου του Cox δίνεται από την σχέση: 47