ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ"

Transcript

1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ Η ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΩΣ ΕΡΓΑΛΕΙΟ ΕΛΕΓΧΟΥ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗΣ ΤΗΣ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΔΙΑΔΙΚΑΣΙΑΣ ΑΛΕΞΑΝΔΡΟΣ Π. ΜΑΚΡΗΣ ΕΡΓΑΣΙΑ Που υποβλήθηκε στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ως μέρος των απαιτήσεων για την απόκτηση Μεταπτυχιακού Διπλώματος Ειδίκευσης στη Στατιστική Μερικής Παρακολούθησης (Part-time) Αθήνα Ιούνιος 23

2

3 ΕΥΧΑΡΙΣΤΙΕΣ Θα ήθελα να ευχαριστήσω: Κατ αρχήν την κυρία Κατερίνα Δημάκη, Αναπληρώτρια Καθηγήτρια του Τμήματος Στατιστικής, και επιβλέπουσα καθηγήτρια αυτής της διπλωματικής εργασίας, που με οδήγησε στις άγνωστες μέχρι πρότινος για μένα ατραπούς της Ανάλυσης Επιβίωσης, για τη στήριξη και υπομονή της στη διάρκεια συγγραφής της παρούσας εργασίας. Όλους τους διδάσκοντες στο Μεταπτυχιακό τμήμα που παρακολούθησα για τις πολύτιμες γνώσεις που αποκόμισα αυτά τα δύο χρόνια. Το Δ/ντη του 4ου Γενικού Λυκείου Λεωνίδα Μαυρογιαννάκη, το συνάδελφο Κωνσταντίνο Παπακωνσταντίνου και τους μαθητές των τμημάτων Α και Α 2 της Α Λυκείου κατά το σχολικό έτος 2 22, για τη βοήθεια ή συμμετοχή στην πραγματοποίηση του τεστ (εφαρμογή), από το οποίο προέκυψε η παρούσα διπλωματική εργασία. Τα µέλη της οικογένειάς µου για την υπομονή και ανοχή που έδειξαν σε όλη τη διάρκεια των μεταπτυχιακών σπουδών µου. Τέλος, τη Βαρονέτα (Dr) για την πολύτιμη και άρρητη βοήθειά της σε κρίσιμα σημεία των μεταπτυχιακών σπουδών µου. I

4 II

5 ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ Ονομάζομαι Αλέξανδρος Μακρής, γεννήθηκα στο Κουτσοπόδι Άργους Αργολίδας και είμαι απόφοιτος του Μαθηματικού Τμήματος της Φυσικομαθηματικής Σχολής του Πανεπιστήμιου Πατρών. Εργάζομαι στη Β/μια εκπαίδευση ως καθηγητής Μαθηματικών. Είμαι συγγραφέας των βιβλίων: Α Γενικού Λυκείου Άλγεβρα και Στοιχεία Πιθανοτήτων, 22. Γ Λυκείου Στατιστική Πιθανότητες, 28 Μιγαδικοί Συναρτήσεις 29 Όρια Συνέχεια, 27 Η Ανάλυση, 28 Το Ολοκλήρωμα, 28 Η Aνάλυση στις Εξετάσεις, θέματα Η εκκρεμότητα μου με τη στατιστική χρονολογείται από το έτος αποφοίτησής μου, οπότε και μου προτάθηκε από τον τότε καθηγητή μου στη Στατιστική, κο Ρούσα, να μείνω βοηθός του και να κάνω μεταπτυχιακό, κάτι που δεν έγινε για οικογενειακούς λόγους. Τον Οκτώβρη του 2, ξεκίνησα τη φοίτησή µου στο Μεταπτυχιακό Πρόγραµµα «Εφαρµοσµένη Στατιστική για Εκπαιδευτικούς» του Οικονομικού Πανεπιστημίου Αθηνών. III

6 IV

7 ABSTRACT Title SURVIVAL ANALYSIS AS A TOOL FOR THE EVALUATION OF THE EDUCATIONAL PROCESS Alexandros Makris 23 Survival Data Analysis is the area of Statistics that deals with statistical methods for analyzing survival data derived from various appropriate applications. Conventional statistical methods are not always applicable to the analysis of those data. The introductory Chapter gives a short report about the evolution of Survival Data Analysis and states fundamental observations about the evaluation strategy. Survival time is defined as the time to the occurrence of a given event. In the second Chapter survival data are presented giving emphasis on the types of censored data. In the third Chapter we define and study the functions of survival time: the survival function, the hazard rate function and the mean residual life. In the fourth Chapter we study the most commonly used life time distributions. In the fifth Chapter the parametric analysis of an application is presented using the statistical package Minitab. In the sixth Chapter the non parametric methods of estimating survival functions are introduced. In the seventh Chapter the non parametric analysis of an application is presented using the statistical software Minitab. In the eighth Chapter non parametric methods for comparing survival distributions are introduced: the Cox Mantel test, the Logrank test and the Peto and Peto test. The ninth Chapter deals with the non parametric comparison of the survival distributions involved in the application already presented. In the tenth Chapter general observations and conclusions are presented. V

8 VI

9 ΠΕΡΙΛΗΨΗ Τίτλος Η ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΩΣ ΕΡΓΑΛΕΙΟ ΕΛΕΓΧΟΥ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗΣ ΤΗΣ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΔΙΑΔΙΚΑΣΙΑΣ Αλέξανδρος Μακρής 23 Η Ανάλυση Επιβίωσης είναι ο κλάδος της Στατιστικής Επιστήμης που μελετά και ερμηνεύει τα δεδομένα χρόνου ζωής. Στο εισαγωγικό Κεφάλαιο, γίνεται σύντομη ιστορική αναδρομή στην εξέλιξη της Ανάλυσης Επιβίωσης, ακολουθούν βασικές επισημάνσεις σχετικά με τη στρατηγική αξιολόγησης, προσδιορίζεται η έννοια του χρόνου επιβίωσης και παρουσιάζεται το ερευνώμενο θέμα. Στο Κεφάλαιο 2 αναλύονται τα δεδομένα επιβίωσης και διακρίνονται τα είδη λογοκρισίας. Στο Κεφάλαιο 3 παρουσιάζονται οι ιδιότητες των συναρτήσεων του χρόνου επιβίωσης, οι οποίες είναι: η συνάρτηση επιβίωσης, η συνάρτηση πυκνότητας πιθανότητας, η συνάρτηση βαθμού κινδύνου και η μέση υπολειπόμενη ζωή. Στο κεφάλαιο 4 παρουσιάζονται οι κυριότερες κατανομές χρόνου αποτυχίας και προσδιορίζονται οι βασικές τους ιδιότητες. Στο Κεφάλαιο 5 ακολουθεί παραμετρική ανάλυση της εφαρμογής με το στατιστικό πακέτο Minitab. Στο Κεφάλαιο 6 αναλύονται οι μη παραμετρικές μέθοδοι εκτίμησης συναρτήσεων επιβίωσης. Επίσης, παρουσιάζεται ο υπολογισμός της διαμέσου των δεδομένων επιβίωσης και η μέθοδος Kaplan Meier για τη συνάρτηση βαθμού κινδύνου. Στο Κεφάλαιο 7 πραγματοποιείται μη παραμετρική ανάλυση της εφαρμογής με το στατιστικό πακέτο Minitab χρησιμοποιώντας τη μέθοδο Kaplan Meier. Στο Κεφάλαιο 8 παρουσιάζονται μη παραμετρικές μέθοδοι για τη σύγκριση των συναρτήσεων επιβίωσης, ειδικότερα ο έλεγχος Cox Mantel,ο έλεγχος Logrank και ο γενικευμένος έλεγχος Wilcoxon των Peto and Peto. Στο Κεφάλαιο 9 πραγματοποιείται σύγκριση των συναρτήσεων επιβίωσης με μη παραμετρικές μεθόδους στην εφαρμογή, με τη χρήση του στατιστικού πακέτου Minitab. Στο Κεφάλαιο παρατίθενται γενικές διαπιστώσεις και συμπεράσματα. VII

10 VIII

11 Π Ε Ρ Ι Ε Χ Ο Μ Ε Ν Α Ευχαριστίες Βιογραφικό Σημείωμα Abstract Περίληψη Περιεχόμενα Κατάλογος Πινάκων Κατάλογος Γραφημάτων I III V VII IX XIII XVII ΚΕΦΑΛΑΙΟ ο Εισαγωγικές έννοιες. ΙΣΤΟΡΙΚΗ ΑΝΑΔΡΟΜΗ.2 Η στρατηγική αξιολόγησης: βασικές επισημάνσεις 2.3 Ο χρόνος επιβίωσης 3.4 Ερευνώμενο θέμα: αναγνώριση ιδιοτήτων συναρτήσεων με παρατήρηση σε αντίστοιχο σχήμα (τεστ). 4 Άτομα κατά φύλο και κατά τμήμα που συμμετείχαν στο τεστ. 4 τεστ 8 ΚΕΦΑΛΑΙΟ 2ο Δεδομένα Επιβίωσης (περικομμένα ή λογοκριμένα ή αποκομμένα δεδομένα) 2. Εισαγωγή Είδη περικομμένων δεδομένων Κατηγορίες δεξιάς λογοκρισίας 2.3. Περικοπή δεδομένων τύπου Ι (Λογοκρισία τύπου Ι) Περικοπή δεδομένων τύπου ΙΙ (Λογοκρισία τύπου ΙΙ) Περικοπή δεδομένων τύπου ΙΙΙ (Τυχαία Λογοκρισία) Προϋποθέσεις για την Ανάλυση Επιβίωσης 6 ΚΕΦΑΛΑΙΟ 3ο Συναρτήσεις Χρόνου Επιβίωσης 3. Εισαγωγή Συνάρτηση επιβίωσης (survival ή survivorship function) Συνάρτηση βαθμού κινδύνου (hazard rate function) Περίπτωση συνεχούς τυχαίας μεταβλητής Περίπτωση διακριτής τυχαίας μεταβλητής 22 IX

12 3.4 Μέση υπολειπόμενη ζωή (mean residual life) Συνοπτικά 25 ΚΕΦΑΛΑΙΟ 4ο Στατιστικά Μοντέλα Χρόνου Αποτυχίας 4. Εισαγωγή Εκθετική κατανομή H κατανομή Pareto Η κατανομή Weibull H κατανομή Γάμμα Η λογαριθμοκανονική κατανομή Η λογαριθμολογιστική κατανομή Η Γεωμετρική κατανομή 47 ΚΕΦΑΛΑΙΟ 5ο Εφαρμογή Παραμετρική Ανάλυση Εφαρμογής Με Το Στατιστικό Πακέτο Minitab 5. Εισαγωγή Εφαρμογή Μέθοδος Ελαχίστων Τετραγώνων Μέθοδος Μέγιστης Πιθανοφάνειας: Πλεονεκτήματα Παραμετρική Ανάλυση με τη μέθοδο ελαχίστων τετραγώνων Τμήμα ο Τμήμα 2ο Παραμετρική Ανάλυση με τη μέθοδο μέγιστης πιθανοφάνειας Τμήμα ο Τμήμα 2ο Προσαρμογή της κατανομής για το Τμήμα και το Τμήμα ΤΜΗΜΑ ο o Με τη μέθοδο ελαχίστων τετραγώνων η Weibull έχει την καλύτερη προσαρμογή. 66 2o Με τη Μέθοδο Μέγιστης Πιθανοφάνειας η Lognormal έχει την καλύτερη προσαρμογή ΤΜΗΜΑ 2ο Με τη μέθοδο ελαχίστων τετραγώνων η κανονική έχει την καλύτερη προσαρμογή. 73 X

13 ΚΕΦΑΛΑΙΟ 6ο Μη Παραμετρικές Μέθοδοι Εκτίμησης Συναρτήσεων Επιβίωσης 6. Εισαγωγή Περίπτωση η: Μη Παραμετρικές Μέθοδοι Εκτίμησης των Συναρτήσεων Επιβίωσης για Πλήρες Δείγμα Περίπτωση 2η: Μη Παραμετρικές Μέθοδοι Εκτίμησης των Συναρτήσεων Επιβίωσης για Δείγμα με Περικομμένες Παρατηρήσεις Υπολογισμός της Διαμέσου των Δεδομένων Επιβίωσης Μέθοδος Kaplan Meier για τη Συνάρτηση Βαθμού Κινδύνου 84 ΚΕΦΑΛΑΙΟ 7ο Εφαρμογή Μη Παραμετρική Ανάλυση Εφαρμογής Με Το Στατιστικό Πακέτο Minitab Μέθοδος Kaplan Meier 7. Εισαγωγή Ανάλυση της Εφαρμογής με το Στατιστικό Πακέτο Minitab ΤΜΗΜΑ ο Ανάλυση των δεδομένων χωριστά για κάθε φύλο ΤΜΗΜΑ ο 88 FILO = A = Αγόρι 89 2 FILO = Κ = Κορίτσι ΤΜΗΜΑ 2ο Ανάλυση των δεδομένων χωριστά για κάθε φύλο ΤΜΗΜΑ 2ο FILO = A = Αγόρι 96 2 FILO = Κ = Κορίτσι Σύγκριση των Διαγραμμάτων Επιβίωσης Αγοριών και Κοριτσιών με το Στατιστικό Πακέτο Minitab ΤΜΗΜΑ 2 ΤΜΗΜΑ 2 3 ΤΜΗΜΑ και 2 FILO = A = Αγόρι 2 FILO = Κ = Κορίτσι 2 ΚΕΦΑΛΑΙΟ 8ο Μη Παραμετρικές Μέθοδοι Σύγκρισης Συναρτήσεων Επιβίωσης 8. Εισαγωγή Έλεγχος Cox Mantel Έλεγχος Logrank Ο Γενικευμένος Έλεγχος Wilcoxon των Peto and Peto. 9 XI

14 8.5 Σύγκριση των στατιστικών τεστ ΚΕΦΑΛΑΙΟ 9ο Εφαρμογή Μη Παραμετρικές Μέθοδοι Σύγκρισης Συναρτήσεων Επιβίωσης Με Το Στατιστικό Πακέτο Minitab 9. Εισαγωγή 9.2 Εφαρμογή Σύγκριση δύο Καμπυλών με το Στατιστικό Πακέτο MINITAB ΤΜΗΜΑ ο Distribution Analysis: Bαθμολογία (Τμήμα) ΤΜΗΜΑ 2ο Distribution Analysis: Bαθμολογία (Τμήμα2) ΤΜΗΜΑ ο και ΤΜΗΜΑ 2ο Distribution Analysis: Bαθμολογία Ανάλυση των δεδομένων χωριστά για κάθε φύλο 9.4. ΤΜΗΜΑ ο (Αγόρια) ΤΜΗΜΑ 2ο (Αγόρια) ΤΜΗΜΑ ο και ΤΜΗΜΑ 2ο (Αγόρια) Distribution Analysis: Bαθμολογία (Τμήμα και Τμήμα2) ΤΜΗΜΑ ο (Κορίτσια) ΤΜΗΜΑ 2ο (Κορίτσια) ΤΜΗΜΑ ο και ΤΜΗΜΑ 2ο (Κορίτσια) Distribution Analysis: Bαθμολογία (Τμήμα και Τμήμα2) 3 ΚΕΦΑΛΑΙΟ ο Σχολιασμός Στατιστικών Ελέγχων Συμπεράσματα. Σχολιασμός των Στατιστικών Ελέγχων 33.2 Συμπεράσματα 4 ΒΙΒΛΙΟΓΡΑΦΙΑ 43 XII

15 ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ Πίνακας Εφαρμογής Παραμετρική Ανάλυση με τη μέθοδο ελαχίστων τετραγώνων Πίνακας Distribution ID Plot: t(i) (Τμήμα ) 55 Πίνακας Percentiles 55 Πίνακας MTTF 56 Πίνακας Distribution ID Plot: t(i) (Τμήμα 2) 58 Πίνακας Percentiles 58 Πίνακας MTTF 59 Παραμετρική Ανάλυση με τη μέθοδο μέγιστης πιθανοφάνειας Πίνακας Distribution ID Plot: t(i) (Τμήμα ) 6 Πίνακας Percentiles 6 Πίνακας MTTF 62 Πίνακας Distribution ID Plot: t(i) (Τμήμα 2) 63 Πίνακας Percentiles 64 Πίνακας MTTF 64 Προσαρμογή της κατανομής για το Τμήμα και το Τμήμα 2 Με τη μέθοδο ελαχίστων τετραγώνων η Weibull έχει την καλύτερη προσαρμογή. Distribution Analysis: t(i) ΤΜΗΜΑ 66 Parameter Estimates 66 Characteristics of Distribution 66 Table of Percentiles 67 Distribution Overview Plot: t(i) ΤΜΗΜΑ 68 Με τη Μέθοδο Μέγιστης Πιθανοφάνειας η Lognormal έχει την καλύτερη προσαρμογή. Distribution Analysis: t(i) ΤΜΗΜΑ 69 Parameter Estimates 69 Characteristics of Distribution 7 Table of Percentiles 7 Distribution Overview Plot: t(i) ΤΜΗΜΑ 72 Με τη μέθοδο ελαχίστων τετραγώνων η Normal έχει την καλύτερη προσαρμογή. Distribution Analysis: t(i) ΤΜΗΜΑ 2 73 Parameter Estimates 73 Characteristics of Distribution 73 Table of Percentiles 74 XIII

16 Distribution Overview Plot: t(i) ΤΜΗΜΑ 2 75 Distribution Analysis: t(i) (Τμήμα ) 86 Nonparametric Estimates Characteristics of Variable 86 Kaplan-Meier Estimates 86 Distribution Analysis: t(i) (Τμήμα ) κατά φύλο Variable: t(i) ΤΜΗΜΑ FILO = A = Αγόρι 89 Nonparametric Estimates Characteristics of Variable 89 Kaplan-Meier Estimates 89 Distribution Analysis: t(i) (Τμήμα ) κατά φύλο Variable: t(i) ΤΜΗΜΑ FILO = Κ = Κορίτσι 9 Nonparametric Estimates Characteristics of Variable 9 Kaplan-Meier Estimates 9 Distribution Analysis: t(i) (Τμήμα ) κατά φύλο Comparison of Survival Curves 9 Distribution Analysis: t(i) (Τμήμα 2) 93 Nonparametric Estimates Characteristics of Variable 93 Kaplan-Meier Estimates 93 Distribution Analysis: t(i) (Τμήμα 2) κατά φύλο Variable: t(i) ΤΜΗΜΑ FILO = A = Αγόρι 96 Nonparametric Estimates Characteristics of Variable 96 Kaplan-Meier Estimates 96 Distribution Analysis: t(i) (Τμήμα 2) κατά φύλο Variable: t(i) ΤΜΗΜΑ FILO = Κ = Κορίτσι 97 Nonparametric Estimates Characteristics of Variable 97 Kaplan-Meier Estimates 97 Distribution Analysis: t(i) (Τμήμα 2) κατά φύλο Comparison of Survival Curves 98 Distribution Analysis: t(i) (Τμήμα και 2) κατά φύλο Variable: t(i) Τμήμα και 2 FILO = A = Αγόρι Nonparametric Estimates Characteristics of Variable 2 Kaplan-Meier Estimates 2 Distribution Analysis: t(i) (Τμήμα και 2) κατά φύλο Variable: t(i) Τμήμα και 2 FILO = Κ = Κορίτσι 2 Nonparametric Estimates Characteristics of Variable 3 XIV

17 Kaplan-Meier Estimates 3 Distribution Analysis: t(i) (Τμήμα και 2) κατά φύλο Comparison of Survival Curves 4 ΠΙΝΑΚΑΣ ΕΦΑΡΜΟΓΗΣ 9.2 (Τμήμα ) 3 ΠΙΝΑΚΑΣ 2 ΕΦΑΡΜΟΓΗΣ 9.2 (Τμήμα 2) 4 (Τμήμα) Distribution Analysis: Bαθμολογία (Τμήμα) 7 Nonparametric Estimates Characteristics of Variable 7 Kaplan-Meier Estimates 7 Empirical Hazard Function 8 (Τμήμα2) Distribution Analysis: Bαθμολογία (Τμήμα2) 8 Nonparametric Estimates Characteristics of Variable 8 Kaplan-Meier Estimates 9 Empirical Hazard Function 9 (Τμήμα και Τμήμα2) Distribution Analysis: Bαθμολογία (Τμήμα και Τμήμα2) Comparison of Survival Curves 2 Log-Rank Statistic 2 Variance/Covariance of Log-Rank Statistic 2 Wilcoxon Statistic 2 Variance/Covariance of Wilcoxon Statistic 2 Test Statistics 2 Αγόρια (Τμήμα) Distribution Analysis: Bαθμολογία (Τμήμα) 22 Nonparametric Estimates Characteristics of Variable 22 Kaplan-Meier Estimates 22 Empirical Hazard Function 23 Αγόρια (Τμήμα2) Distribution Analysis: Bαθμολογία (Τμήμα2) 23 Nonparametric Estimates Characteristics of Variable 23 Kaplan-Meier Estimates 24 Empirical Hazard Function 24 Αγόρια (Τμήμα και Τμήμα2) XV

18 Distribution Analysis: Bαθμολογία (Τμήμα και Τμήμα2) Comparison of Survival Curves 25 Log-Rank Statistic 25 Variance/Covariance of Log-Rank Statistic 25 Wilcoxon Statistic 25 Variance/Covariance of Wilcoxon Statistic 25 Test Statistics 25 Κορίτσια (Τμήμα) Distribution Analysis: Bαθμολογία (Τμήμα) 27 Nonparametric Estimates Characteristics of Variable 27 Kaplan-Meier Estimates 27 Empirical Hazard Function 28 Κορίτσια (Τμήμα2) Distribution Analysis: Bαθμολογία (Τμήμα2) 28 Nonparametric Estimates Characteristics of Variable 28 Kaplan-Meier Estimates 29 Empirical Hazard Function 29 Κορίτσια (Τμήμα και Τμήμα2) Distribution Analysis: Bαθμολογία (Τμήμα και Τμήμα2) Comparison of Survival Curves 3 Log-Rank Statistic 3 Variance/Covariance of Log-Rank Statistic 3 Wilcoxon Statistic 3 Variance/Covariance of Wilcoxon Statistic 3 Test Statistics 3 XVI

19 ΚΑΤΑΛΟΓΟΣ ΓΡΑΦΗΜΑΤΩΝ Διάγραμμα.4. Τμήμα 4 Διάγραμμα.4.2 Τμήμα 5 Διάγραμμα.4.3 Τμήμα 2 5 Διάγραμμα.4.4 Τμήμα 2 6 Διάγραμμα.4.5 Φύλο ανά τμήμα 6 Διάγραμμα.4.6 Φύλο ανά τμήμα 7 Διάγραμμα 2. Χρόνοι επιβίωσης τριών ασθενών Διάγραμμα 2.2 Λογοκριμένα Δεδομένα Τύπου I 3 Διάγραμμα 2.3 Λογοκριμένα Δεδομένα Τύπου IΙ 4 Διάγραμμα 2.4 Λογοκριμένα Δεδομένα Τύπου IIΙ 5 Διάγραμμα 3. survival curve 8 Διάγραμμα 3.2 survival curve 8 Διάγραμμα 3.3 Συναρτήσεις Βαθμού Κινδύνου 2 Διάγραμμα 4.2. Εκθετική Κατανομή Συνάρτηση Πυκνότητας Πιθανότητας 28 Διάγραμμα Εκθετική Κατανομή Συνάρτηση Πυκνότητας Πιθανότητας 29 Διάγραμμα 4.2.3: Εκθετική Κατ Συνάρτηση Βαθμού Αθροιστικής Αποτυχίας 3 Διάγραμμα Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Εκθετικής Κατανομής 3 Διάγραμμα 4.3. Κατανομή Pareto 32 Διάγραμμα Κατανομή Pareto(θ, α) 34 Διάγραμμα Κατανομή Pareto(θ, α) 34 Διάγραμμα 4.4. Κατανομή Weibull(λ, p) 35 Διάγραμμα Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Weibull(λ, p) 36 Διάγραμμα 4.5. Κατανομή Gamma(α, β) 38 Διάγραμμα Κατανομή Gamma(α, β) 38 Διάγραμμα Κατανομή Gamma(α, β) 39 Διάγραμμα Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Gamma 39 Διάγραμμα 4.6. Κατανομή Lognormal 4 Διάγραμμα Κατανομή Lognormal 4 Διάγραμμα Κατανομή Lognormal 4 Διάγραμμα Κατανομή Lognormal 42 XVII

20 Διάγραμμα Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Lognormal 43 Διάγραμμα 4.7. συνάρτηση κατανομής πιθανότητας Log-logistic 44 Διάγραμμα Log-logistic 45 Διάγραμμα Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Log-logistic 46 Διάγραμμα 4.8. Γεωμετρική Κατανομή 47 Διάγραμμα Γεωμετρική Κατανομή 48 Διάγραμμα Γεωμετρική Κατανομή 48 Διάγραμμα Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Γεωμετρικής Κατανομής 5 Διάγραμμα 5.2.: Διάγραμμα που δείχνει τον αριθμό περικομμένων και μη περικομμένων παρατηρήσεων ως προς το χρόνο. 53 Διάγραμμα 5.2.2: Διάγραμμα που δείχνει τον αριθμό περικομμένων και μη περικομμένων παρατηρήσεων ως προς το χρόνο. 54 Διάγραμμα 5.4.: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη μέθοδο των ελαχίστων τετραγώνων Τμήμα 57 Διάγραμμα 5.4.2: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη μέθοδο των ελαχίστων τετραγώνων Τμήμα 2 6 Διάγραμμα 5.5.: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη μέθοδο μέγιστης πιθανοφάνειας Τμήμα 63 Διάγραμμα 5.5.2: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη μέθοδο μέγιστης πιθανοφάνειας Τμήμα 2 65 Διάγραμμα 5.6.: Διάγραμμα πιθανοτήτων για την κατανομή Weibull, της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 68 Διάγραμμα 5.6.2: Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου, για την κατανομή Weibull της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 69 Διάγραμμα 5.6.3: Διάγραμμα πιθανοτήτων για την κατανομή Lognormal, της εφαρμογής 5.2 με τη Μέθοδο Μέγιστης Πιθανοφάνειας 7 XVIII

21 Διάγραμμα 5.6.4: Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου, για την κατανομή Lognormal της εφαρμογής 5.2 με τη Μέθοδο Μέγιστης Πιθανοφάνειας 72 Διάγραμμα 5.6.5: Διάγραμμα πιθανοτήτων για την κατανομή Normal, της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 75 Διάγραμμα 5.6.6: Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου, για την κατανομή Normal της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 76 Διάγραμμα 6.: Εκτίμηση του μέσου χρόνου Επιβίωσης, με το Minitab 82 Διάγραμμα 6.2: Υπολογισμός διαμέσου χρόνου επιβίωσης t(m) = 8 (δείγμα πλήρες) 83 Διάγραμμα 6.3: Υπολογισμός διαμέσου χρόνου επιβίωσης με γραμμική παρεμβολή t (m) = 7.3 (δείγμα πλήρες) 83 Διάγραμμα 6.4: Υπολογισμός διαμέσου χρόνου επιβίωσης με γραμμική παρεμβολή t (m) = 9.6 (δείγμα με περικοπές) 84 Διάγραμμα 7.2.: Συνάρτηση Επιβίωσης και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 με το Minitab. 87 Διάγραμμα 7.2.2: Αθροιστική Συνάρτηση Κατανομής Αποτυχίας και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 με το Minitab. 88 Διάγραμμα 7.2.3: Συνάρτηση Βαθμού κινδύνου για την εφαρμογή 5.2 με το Minitab. 88 Διάγραμμα 7.2.4: Συνάρτηση Επιβίωσης και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 των αγοριών κοριτσιών με το Minitab. 9 Διάγραμμα 7.2.5: Αθροιστική Συνάρτηση Κατανομής Αποτυχίας και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 των αγοριών κοριτσιών με το Minitab. 92 Διάγραμμα 7.2.6: Συνάρτηση Βαθμού κινδύνου για την εφαρμογή 5.2 των αγοριών κοριτσιών με το Minitab. 92 Διάγραμμα 7.2.7: Συνάρτηση Επιβίωσης και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 με το Minitab. 94 Διάγραμμα 7.2.8: Αθροιστική Συνάρτηση Κατανομής Αποτυχίας και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 με το Minitab. 95 Διάγραμμα 7.2.9: Συνάρτηση Βαθμού κινδύνου για την εφαρμογή 5.2 με το Minitab. 95 XIX

22 Διάγραμμα 7.2.: Συνάρτηση Επιβίωσης και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 των αγοριών κοριτσιών με το Minitab. 98 Διάγραμμα 7.2.: Αθροιστική Συνάρτηση Κατανομής Αποτυχίας και «ζώνη» εμπιστοσύνης για την εφαρμογή 5.2 των αγοριών κοριτσιών με το Minitab. 99 Διάγραμμα 7.2.2: Συνάρτηση Βαθμού κινδύνου για την εφαρμογή 5.2 των αγοριών κοριτσιών με το Minitab. 99 Διάγραμμα 7.3.: Συνάρτηση Επιβίωσης Αγοριών και Κοριτσιών για την εφαρμογή 5.2 με το Minitab για το Τμήμα. Διάγραμμα 7.3.2: Συνάρτηση Επιβίωσης Αγοριών και Κοριτσιών για την εφαρμογή 5.2 με το Minitab για το Τμήμα 2. Διάγραμμα 7.3.3: Συνάρτηση Επιβίωσης Αγοριών και Κοριτσιών για την εφαρμογή 5.2 με το Minitab για το Τμήμα και 2. 4 Διάγραμμα 9.2.: Διάγραμμα που δείχνει τον αριθμό περικομμένων και μη περικομμένων παρατηρήσεων ως προς τη βαθμολογία. 5 Διάγραμμα 9.2.2: Διάγραμμα που δείχνει τον αριθμό περικομμένων και μη περικομμένων παρατηρήσεων ως προς τη βαθμολογία. 5 Διάγραμμα 9.3.: Συνάρτηση Επιβίωσης της βαθμολογίας στο ΤΜΗΜΑ και στο ΤΜΗΜΑ2 για την εφαρμογή 9.2 με το Minitab. 2 Διάγραμμα 9.3.2: Συνάρτηση Βαθμού κινδύνου της βαθμολογίας στο ΤΜΗΜΑ και στο ΤΜΗΜΑ2 για την εφαρμογή 9.2 με το Minitab. 2 Διάγραμμα 9.4.: Συνάρτηση Επιβίωσης της βαθμολογίας στο ΤΜΗΜΑ και στο ΤΜΗΜΑ2 για την εφαρμογή 9.2 με το Minitab για τα αγόρια. 26 Διάγραμμα 9.4.2: Συνάρτηση Βαθμού κινδύνου της βαθμολογίας στο ΤΜΗΜΑ και στο ΤΜΗΜΑ2 για την εφαρμογή 9.2 με το Minitab για τα αγόρια. 26 Διάγραμμα 9.4.3: Συνάρτηση Επιβίωσης της βαθμολογίας στο ΤΜΗΜΑ και στο ΤΜΗΜΑ2 για την εφαρμογή 9.2 με το Minitab για τα κορίτσια. 3 Διάγραμμα 9.4.4: Συνάρτηση Βαθμού κινδύνου της βαθμολογίας στο ΤΜΗΜΑ και στο ΤΜΗΜΑ2 για την εφαρμογή 9.2 με το Minitab για τα κορίτσια. 3 XX

23 ΚΕΦΑΛΑΙΟ ο Εισαγωγικές Έννοιες. ΙΣΤΟΡΙΚΗ ΑΝΑΔΡΟΜΗ Η Ανάλυση Επιβίωσης έκανε την εμφάνισή της το 662 με τη δημοσίευση της εργασίας του John Graunt «Natural and Political Observations upon the Bill of Mortality». Ο Graunt στο βιβλίο του, κατέγραψε γεννήσεις και θανάτους που σημειώθηκαν σε διάστημα μερικών δεκαετιών στις ενορίες του Λονδίνου, αντιμετωπίζοντας για πρώτη φορά το «θάνατο» ως ένα γεγονός προς μελέτη. Στα τέλη του 7ου αιώνα, ο Edmund Halley προχώρησε περισσότερο δημιουργώντας τον πρώτο πίνακα επιβίωσης με στοιχεία από τον πληθυσμό της περιοχής Breslau της Πολωνίας και αποτελώντας πρόδρομο των σύγχρονων δημογραφικών πινάκων. Η μεγαλύτερη ώθηση, ωστόσο, στην Ανάλυση Επιβίωσης δόθηκε κατά τη διάρκεια των δύο Παγκοσμίων Πολέμων, καθώς μελετήθηκε η αξιοπιστία των στρατιωτικών μηχανών και εξαρτημάτων. Παράλληλα, πλήθος ερευνητών στους τομείς της Ιατρικής, Βιολογίας και Επιδημιολογίας συνέβαλαν με τις μελέτες τους στην εξέλιξη του κλάδου. Μετά το Β Παγκόσμιο Πόλεμο ως τις μέρες μας, η Ανάλυση Επιβίωσης επεκτάθηκε εντυπωσιακά, τόσο στη βιομηχανία ηλεκτρονικών συσκευών όσο και στην Ιατρική. Ιδιαίτερα μελετήθηκε η ανάπτυξη παραμετρικών μοντέλων του χρόνου ζωής ως προς την εκτίμηση των παραμέτρων τους και την αξιολόγηση της απόδοσής τους. Σήμερα η Ανάλυση Επιβίωσης, δίνοντας τη δυνατότητα για ποικίλες εφαρμογές και σε άλλους τομείς, όπως η κοινωνιολογία, η απασχόληση, η μετανάστευση, η εκπαίδευση κ.ά, παραμένει πάντοτε εξαιρετικά επίκαιρη και αποκαλύπτει το εύρος των εφαρμογών της και την ανθεκτικότητα της ανάλυσης των δεδομένων της.

24 .2 Η στρατηγική αξιολόγησης: βασικές επισημάνσεις Η διαμόρφωση της οργανωτικής στρατηγικής, όταν κρίνεται αναγκαία, είναι γενικά ένα πρόβλημα με μη προσδιορισμένη δομή, που περιέχει: α) τις δραστηριότητες, β) τις λύσεις και γ) την αξιολόγηση των προτεινόμενων λύσεων. Αξιολόγηση σημαίνει προσδιορισμός της χρησιμότητας, της αλήθειας και της αποτελεσματικότητας μιας πραγματικότητας ή, γενικά, μιας οντότητας. Συνεπώς, απαιτείται η εκτίμηση της λειτουργίας που μπορεί να διαδραματίσει αυτή η πραγματικότητα ή η οντότητα. Ο όρος «στρατηγική» έχει πολλές σημασίες. Συνδυάζει την τήρηση κανόνων στην περίπτωση μιας σύγκρουσης, το υψηλό επίπεδο και το μακροπρόθεσμο χαρακτήρα ενός σχεδιασμού, γενικά κάθε σημαντική απόφαση. Όλες οι παραπάνω σημασίες είναι ενδιαφέρον να συνδυαστούν, όταν εξετάζουμε τη σχέση ανάμεσα σε μια οργάνωση και στο περιβάλλον της. Αρχικά, η στρατηγική εμπεριέχει την έννοια της ιεράρχησης των στόχων. Είναι σημαντικό οι στόχοι να ταξινομούνται με την εφαρμογή τυποποιημένων διαδικασιών, ώστε ο ερευνητής να οδηγηθεί στην εκτίμηση της κατάστασης. Τέτοιες τυποποιημένες και απαρέγκλιτες διαδικασίες είναι τα κριτήρια βάσει των οποίων πραγματοποιείται η στρατηγική της αξιολόγησης. Τα κριτήρια αυτά σχετίζονται με: Α) τη σαφήνεια και συμβατότητα των στόχων Β) το διαχωρισμό των στόχων σε ουσιώδεις και σε επουσιώδεις Γ) την ανταγωνιστικότητα και τη δυνατότητα η στρατηγική να οδηγεί σε υλοποιήσιμες λύσεις και Δ) την αποτελεσματικότητα της στρατηγικής. Επιπλέον, για να είναι επιτυχής η στρατηγική της αξιολόγησης πρέπει να είναι εξασφαλισμένη η ισοτιμία όσων συμμετέχουν και να αποφεύγεται η ασυμμετρία και η ανισότητα ευκαιριών στο ερευνώμενο περιβάλλον. Αυτό, όμως, δεν πρέπει να οδηγήσει στο συμπέρασμα ότι η στρατηγική της αξιολόγησης οδηγεί πάντοτε σε απόλυτα ασφαλή αποτελέσματα, καθώς υπεισέρχονται και άλλες παράμετροι (κοινωνικές, μορφωτικές, ψυχολογικές κ.ά) που αλλοιώνουν τα τελικά δεδομένα και οι οποίες μπορούν, μάλιστα, να ανατρέψουν τις αρχικές προβλέψεις για την 2

25 αποτελεσματικότητα της στρατηγικής αξιολόγησης. Ωστόσο, η τελευταία αποτελεί μια τακτική βάση που προμηθεύει τον ερευνητή με ένα σημαντικό εργαλείο, - ανεξάρτητα από τις ειδικές περιπτώσεις αποκλείοντας σε μεγάλο βαθμό την τυχαιότητα. Από τα παραπάνω γίνεται φανερό ότι η βασική λειτουργία της στρατηγικής αξιολόγησης μπορεί να διαμορφώσει με ευκρίνεια τους στόχους της έρευνας και να μετατρέψει μιαν ασαφή πραγματικότητα σε ένα δομημένο και οργανωτικά επιλύσιμο πρόβλημα..3 Ο χρόνος επιβίωσης Το βασικό χαρακτηριστικό, που αποτελεί ταυτόχρονα την ειδοποιό διαφορά που διακρίνει την Ανάλυση Επιβίωσης από τους άλλους κλάδους της Στατιστικής, είναι ότι εξετάζει σε ποια χρονική στιγμή αναμένεται να προκληθεί «θάνατος» σε κάποιο βιολογικό οργανισμό, καθώς και την πιθανότητα αποτυχίας σε μηχανικά συστήματα ή μέρη αυτών. Κάνοντας χρήση των μεθόδων της ανάλυσης αξιοπιστίας, ένας ερευνητής έχει τη δυνατότητα να διαπιστώσει ποιοι παράγοντες και σε ποιο ποσοστό επιδρούν στην εμφάνιση του ερευνώμενου γεγονότος. Επομένως, από τα παραπάνω προκύπτει ότι ο χρόνος επιβίωσης (survival time) μπορεί να ορισθεί ως ο χρόνος μέχρι να συμβεί ένα συγκεκριμένο γεγονός, όπως είναι η εμφάνιση μιας πάθησης, η επιδείνωση της ασθένειας ή ακόμη και ο θάνατος. Έτσι, στις περισσότερες περιπτώσεις, τα πειραματικά δεδομένα της Ανάλυσης Επιβίωσης αφορούν στο χρόνο αποτυχίας (failure time), το χρόνο δηλαδή κατά τον οποίο προκαλείται θάνατος ή βλάβη στο αντικείμενο που ερευνάται. Ο χρόνος επιβίωσης χρήζει ειδικής μεταχείρισης για το λόγο ότι είναι περιορισμένος στο να είναι πάντοτε θετικός. Αναφέρεται σε μια μεταβλητή (ημέρες, εβδομάδες, μήνες κ.λ.π) που μεσολαβεί από τη στιγμή της έναρξης της παρακολούθησης ενός ατόμου (άνθρωπος, αντικείμενο, φαινόμενο κ.λ.π), μέχρι τη στιγμή που το άτομο θα αντιμετωπίσει το ενδεχόμενο. Ο χρόνος είναι το βασικό σημείο ενδιαφέροντος σε πολλές βιοχημικές εφαρμογές (π.χ ο χρόνος μέχρι να αντιδράσει ένας οργανισμός σε ένα φάρμακο), κοινωνικές (π.χ ο χρόνος μέχρι την έναρξη μιας εγκυμοσύνης), μηχανικές (π.χ ο χρόνος μέχρι να χαλάσει ένα εξάρτημα μιας μηχανής). 3

26 .4 Ερευνώμενο θέμα: αναγνώριση ιδιοτήτων συναρτήσεων με παρατήρηση σε αντίστοιχο σχήμα (τεστ). Το ερευνώμενο θέμα αυτής της εργασίας, δηλαδή η Ανάλυση Επιβίωσης ως εργαλείο αξιολόγησης της εκπαιδευτικής διαδικασίας, θα στηριχτεί σε παρατηρήσεις πάνω σε τεστ. Στο τεστ εξετάσαμε την αναγνώριση ιδιοτήτων συναρτήσεων, με παρατηρήσεις σε αντίστοιχο σχήμα. Το τεστ δόθηκε σε μαθητές της Α Λυκείου το Μάιο του 22. Ειδικότερα, το τεστ δόθηκε την ίδια ημέρα και ώρα σε δύο τμήματα. Άτομα κατά φύλο και κατά τμήμα που συμμετείχαν στο τεστ. FILO ANA TMHMA 4 2 SEX A K Count SEX TMHMA A TMHMA K Διάγραμμα.4. Τμήμα 4

27 TMHMA Category A K A 5; 26,3% K 4; 73,7% Διάγραμμα.4.2 Τμήμα FILO ANA TMHMA SEX 2 A K 8 Count SEX 2 TMHMA 2 A TMHMA 2 K Διάγραμμα.4.3 Τμήμα 2 5

28 TMHMA2 Category A K K ; 52,6% A 9; 47,4% Διάγραμμα.4.4 Τμήμα 2 FILO ANA TMHMA 4 2 SEX 2 A K Count SEX 2 TMHMA A K TMHMA A K TMHMA 2 A K Διάγραμμα.4.5 Φύλο ανά τμήμα 6

29 FILO ANA TMHMA 8 SEX 2 A K Percent SEX 2 TMHMA A K TMHMA A K TMHMA 2 A K Percent within levels of TMHMA. Διάγραμμα.4.6 Φύλο ανά τμήμα o Το ένα τμήμα είχε διδαχθεί το μάθημα κυρίως με τη βοήθεια Η/Υ (προβολές) και με τη βοήθεια πίνακα, Τμήμα o ενώ το άλλο τμήμα μόνο με χρήση πίνακα. Τμήμα 2 Ο χρόνος που είχαν στη διάθεσή τους οι μαθητές ήταν 7min από την ώρα που πήραν το τεστ στα χέρια τους. Το τεστ βαθμολογήθηκε ως εξής: o ο μαθητής που ασχολήθηκε με μία ερώτηση και την έλυσε σωστά πήρε το βαθμό 2. o ο μαθητής που ασχολήθηκε με δύο ερωτήσεις και τις έλυσε σωστά πήρε το βαθμό 3. o Η διαδικασία συνεχίστηκε έτσι μέχρι την 5η ερώτηση και αν τις έλυσε σωστά πήρε το βαθμό 6. Περικοπή έχουμε όταν: o ο μαθητής ξεπέρασε τα 7 min. o υπάρχουν ερωτήσεις με τις οποίες δεν ασχολήθηκε καθόλου. Μη περικοπή (ακριβείς παρατηρήσεις) έχουμε όταν: o ο μαθητής ασχολήθηκε με όλα τα ερωτήματα ανεξάρτητα αν κατάφερε ή όχι να απαντήσει σε κάποιο ερώτημα ή αν κατάλαβε αν η λύση του είναι σωστή ή λανθασμένη. o παρέδωσε το γραπτό του και δεν ασχολήθηκε με κανένα ερώτημα. Οπότε πήρε το βαθμό. 7

30 Το τεστ που δόθηκε και στα δύο τμήματα είναι το παρακάτω: Η Ανάλυση Επιβίωσης Ως Εργαλείο Ελέγχου Και Αξιολόγηση Της Εκπαιδευτικής Διαδικασίας Χρόνος Παραλαβής: Χρόνος Παράδοσης: Αγόρι: Κορίτσι: Σχολείο: Τμήμα: Ημερομηνία: Διδακτική Ώρα: Για τη γραφική παράσταση του σχήματος, να απαντήσετε στα ερωτήματα: α) είναι γραφική παράσταση συνάρτησης, γιατί; β) είναι άρτια - περιττή - τίποτα, γιατί; γ) να βρείτε τα διαστήματα στα οποία είναι γνησίως αύξουσα - γνησίως φθίνουσα. δ) να βρείτε τα ακρότατα (αν υπάρχουν) ε) να συμπληρώσετε τον αντίστοιχο πίνακα μεταβολών. Απαντήσεις α)... β)... γ)... δ)... ε) x - + f(x).. 8

31 ΚΕΦΑΛΑΙΟ 2ο Δεδομένα Επιβίωσης (περικομμένα ή λογοκριμένα ή αποκομμένα δεδομένα) 2. Εισαγωγή Η έννοια των αποκομμένων δεδομένων χρησιμοποιήθηκε για πρώτη φορά από τον Hald (949). Τα δεδομένα που δεν είναι αποκομμένα ονομάζονται πλήρη. Τα λογοκριμένα δεδομένα είναι αυτά, για τα οποία δεν είναι γνωστός ο χρόνος που συμβαίνει το γεγονός. Το μόνο που μπορεί να λεχθεί είναι ότι ο χρόνος επιβίωσής τους είναι μεγαλύτερος από την τιμή που έχει καταγραφεί. Η πληροφορία για το χρόνο επιβίωσης ενός ατόμου στην περίπτωση αυτή είναι μερική. Ο όρος censored (λογοκριμένος) χρησιμοποιήθηκε επίσης για πρώτη φορά από τον Hald (949). Στις λογοκριμένες ή περικομμένες παρατηρήσεις για τις οποίες ο χρόνος επιβίωσης δεν είναι γνωστός ή δεν είναι ακριβής συμβαίνει το γεγονός ότι ο «θάνατος» δεν έχει παρατηρηθεί μέχρι τη λήξη της έρευνας, είτε γιατί το υποκείμενο χάθηκε πριν τελειώσει η έρευνα, είτε γιατί το υποκείμενο δεν εισήλθε στην έρευνα από την αρχή της. Όταν τα δεδομένα, λοιπόν, δεν είναι πλήρη, δεν μπορούν να εφαρμοστούν οι μέθοδοι ανάλυσης της κλασικής Στατιστικής. 2.2 Είδη περικομμένων δεδομένων Τα είδη των περικομμένων δεδομένων ή είδη λογοκρισίας είναι τρία: η δεξιά λογοκρισία (right censoring), η αριστερή λογοκρισία (left censoring) και η λογοκρισία διαστήματος (interval censoring). Στην πρώτη κατηγορία δεδομένων ανήκουν οι παρατηρήσεις των οποίων η πραγματική τιμή είναι άγνωστη, είναι όμως γνωστό ότι είναι μεγαλύτερη ή ίση με κάποια δεδομένη τιμή L (Τ L). 9

32 Στη δεύτερη κατηγορία ανήκουν οι παρατηρήσεις, των οποίων η πραγματική τιμή είναι άγνωστη, είναι όμως γνωστό ότι είναι μικρότερη ή ίση με κάποια δεδομένη τιμή L (T L). Στην τελευταία κατηγορία τα δεδομένα είναι ταυτόχρονα αποκομμένα από δεξιά και από αριστερά. Αυτό σημαίνει ότι η πραγματική τιμή είναι άγνωστη, βρίσκεται όμως εντός κάποιου γνωστού διαστήματος τιμών (m T M). Παράδειγμα 2.: Σε μια έρευνα για τη μελέτη της αποτελεσματικότητας μιας νέας θεραπείας για μια ασθένεια, η μεταβλητή που μας ενδιαφέρει είναι ο αριθμός των ημερών που θα επιζήσει ο κάθε ασθενής, δηλαδή ο χρόνος επιβίωσης κάθε ατόμου. Οι ασθενείς μπορεί να εισέρχονται στη μελέτη σε διαφορετικούς χρόνους, ενώ η διάρκεια της μελέτης είναι προεπιλεγμένη. Έτσι, για κάθε ασθενή, καταγράφεται ο χρόνος, από την είσοδό του στη μελέτη, μέχρι το θάνατό του. Στο τέλος της μελέτης, το πιθανότερο είναι να υπάρχουν ασθενείς που επέζησαν σε ολόκληρη τη διάρκεια της μελέτης (συνήθως οι ασθενείς που εισήλθαν αργά στη μελέτη), ενώ θα υπάρχουν ασθενείς με τους οποίους χάθηκε η επαφή. Ο χρόνος επιβίωσης των ατόμων αυτών, θα είναι τουλάχιστον όσο ο χρόνος από την είσοδο τους στη μελέτη, μέχρι τη στιγμή που ολοκληρώθηκε η μελέτη (για την πρώτη περίπτωση), και μέχρι τη στιγμή που χάθηκε η επαφή (στη δεύτερη περίπτωση). Αυτές οι παρατηρήσεις, είναι λογοκριμένες (censored) παρατηρήσεις. Σίγουρα, δε θα θέλαμε να αποκλείσουμε τα άτομα αυτά από τη μελέτη θεωρώντας τα ως ελλιπή δεδομένα. Κάτι τέτοιο, θα επηρέαζε πολύ την ανάλυση και τα αποτελέσματα που θα παίρναμε δε θα ήταν σωστά, αφού οι περισσότεροι από τους ασθενείς αυτούς είναι επιζώντες και επομένως αντανακλούν στην επιτυχία της νέας θεραπευτικής μεθόδου. Οι λογοκριμένες παρατηρήσεις δεν προκύπτουν μόνο λόγω του χρόνου λήξης της έρευνας, μπορεί να προκύψουν και σε άλλες περιπτώσεις: Όταν ο ασθενής χάνεται από την παρακολούθηση: Ο ασθενής μπορεί να αποφάσισε να μετακομίσει ή να αλλάξει θεράποντα ιατρό. Ο ασθενής αποσύρεται από την παρακολούθηση: Όταν η θεραπεία έχει πολύ κακές επιδράσεις, τότε είναι αναγκαίο ο

33 ασθενής να σταματήσει τη θεραπεία. Ακόμη, μπορεί ο ασθενής να μην θέλει να λαμβάνει μέρος σε τέτοια διαδικασία μετά από κάποιο χρονικό διάστημα. Για να γίνουν κατανοητά τα πιο πάνω, θεωρούμε το διάγραμμα όπου φαίνονται οι χρόνοι μέχρι τον θάνατο τριών ασθενών: Ασθενής Τ Ασθενής 2 Ασθενής 3 Τ 3 + Τ 2 + xάθηκε t xρόνος Τέλος μελέτης Διάγραμμα 2.: Χρόνοι επιβίωσης τριών ασθενών Ο ασθενής εισέρχεται στη μελέτη στο χρόνο t = και πεθαίνει στο χρόνο Τ, έτσι δίνει μια μη λογοκριμένη (uncensored) παρατήρηση. Ο ασθενής 2 εισέρχεται αργότερα στη μελέτη και στο τέλος της μελέτης είναι ακόμη ζωντανός. Ο χρόνος επιβίωσης του δεν είναι γνωστός. Γνωρίζουμε μόνο ότι ο χρόνος επιβίωσης του είναι τουλάχιστον Τ 2. Έτσι, ο ασθενής 2 δίνει τη λογοκριμένη (censored) παρατήρηση Τ 2 +. Ο ασθενής 3 δεν εισέρχεται στη μελέτη από την αρχή, χάνεται όμως από την παρακολούθηση πολύ πριν από το τέλος της μελέτης, δίνοντας έτσι μια λογοκριμένη παρατήρηση, Τ 3 +. Σημείωση: Με «+» δίπλα από ένα χρόνο, θα συμβολίζουμε τις λογοκριμένες παρατηρήσεις. 2.3 Κατηγορίες δεξιάς λογοκρισίας (right censoring or censoring to the right) Η δεξιά λογοκρισία χωρίζεται σε τρεις κατηγορίες:

34 τη λογοκρισία τύπου Ι (Type I censoring), τη λογοκρισία τύπου ΙΙ (Type II censoring) που είναι γνωστή και ως μεμονωμένα περικομμένα δεδομένα και την τυχαία λογοκρισία (random censoring) ή περικομμένα δεδομένα τύπου ΙΙΙ που είναι γνωστά και ως προοδευτικά περικομμένα δεδομένα (Cohen, 965). Η δεξιά λογοκρισία είναι η πιο συνηθισμένη μορφή λογοκρισίας. Παρατηρείται σε περιπτώσεις όπου ένα άτομο χάνεται ή αποσύρεται από την παρακολούθηση ή ακόμη όταν η μελέτη τερματίζεται σε έναν προκαθορισμένο χρόνο. Όταν δεν υπάρχουν περικομμένες παρατηρήσεις, το σετ των χρόνων επιβίωσης ονομάζεται πλήρες Περικοπή δεδομένων τύπου Ι (Λογοκρισία τύπου Ι) Περικοπή δεδομένων τύπου Ι έχουμε, όταν από την αρχή της έρευνας προκαθορίζεται ο χρόνος διάρκειάς της, ο οποίος ονομάζεται χρόνος λογοκρισίας, έστω u. Ο ερευνητής καταγράφει τους χρόνους αποτυχίας ή επιβίωσης των ατόμων που απέτυχαν κατά τη διάρκεια της έρευνας, ενώ για τα υπόλοιπα το μόνο που είναι γνωστό είναι ότι οι χρόνοι επιβίωσής τους είναι μεγαλύτεροι από u. Στη λογοκρισία τύπου Ι, όταν δεν υπάρχουν απώλειες από ατυχήματα, όλες οι λογοκριμένες παρατηρήσεις ισούνται με το μήκος της περιόδου της μελέτης. Παράδειγμα 2.2 Ας θεωρήσουμε ότι έχουμε συσκευασίες που περιέχουν χρωστική ουσία για βαφή μαλλιών, οι οποίες μελετώνται ως προς τη διάρκεια αντοχής τους για ένα χρονικό διάστημα δύο μηνών (t = 2). Από τα παραπάνω προκύπτει ότι οι βαφές που μετά το πέρας των δύο μηνών θα εξακολουθούν να είναι αποτελεσματικές αποτελούν αποκομμένες παρατηρήσεις, διότι Τ > t = 2. Το πλήθος των ολοκληρωμένων παρατηρήσεων στην περίπτωση αυτή, κατά τη διάρκεια διεξαγωγής του πειράματος, είναι τυχαίο. Θεωρούμε ενδεικτικά 8 βαφές Α, Β, Γ, Δ, Ε, Ζ, Η, Θ που υποβάλλονται σε διαδικασία ελέγχου της αποτελεσματικότητάς τους την ίδια χρονική στιγμή. Ο ερευνητής αποφασίζει να τερματίσει το πείραμα μετά από 8 εβδομάδες (u = 8). 2

35 Από το σχήμα, βλέπουμε ότι οι βαφές Β, Γ, Δ και Η έπαψαν να είναι αποτελεσματικές στους χρόνους 6, 4, 5 και 7 αντίστοιχα (οι χρόνοι αυτοί είναι οι χρόνοι αποτυχίας), η βαφή Ζ χάθηκε από την έρευνα μετά από 2 βδομάδες (το άτομο με τη βαφή Ζ άλλαξε χώρα), ενώ οι βαφές Α, Ε και Θ συνέχισαν να είναι αποτελεσματικές κατά τη διάρκεια της μελέτης, άρα οι χρόνοι επιβίωσής τους δεν είναι γνωστοί. Έτσι, τα δεδομένα επιβίωσης των 8 βαφών είναι ίσα με: 8+, 6, 4, 5, 8+, 2+, 7 και 8+ εβδομάδες. Το «+» συμβολίζει περικομμένη παρατήρηση. Τα λογοκριμένα δεδομένα στην περίπτωση αυτή είναι τύπου Ι. Θ Η Ζ Ε Δ Γ Β Α xάθηκε x x x x Χρόνος (Εβδομάδες) Διάγραμμα 2.2: Λογοκριμένα Δεδομένα Τύπου I Περικοπή δεδομένων τύπου ΙΙ (Λογοκρισία τύπου ΙΙ) Περικοπή δεδομένων τύπου ΙΙ έχουμε, όταν η διάρκεια της μελέτης του δείγματος δεν είναι ορισμένη εξ αρχής. Έτσι, η διαδικασία ολοκληρώνεται, όταν το γεγονός που μελετάται παρατηρηθεί σε έναν προκαθορισμένο αριθμό ατόμων, έστω r. Οπότε, αν έχουμε n άτομα υπό μελέτη, τότε στο τέλος της μελέτης γνωρίζουμε τους χρόνους αποτυχίας r ατόμων, ενώ για τα υπόλοιπα n r άτομα, το μόνο που γνωρίζουμε είναι ότι ο χρόνος επιβίωσής τους είναι μεγαλύτερος από το χρόνο επιβίωσης των r ατόμων που απέτυχαν. Μια άλλη επιλογή είναι η διαδικασία να ολοκληρώνεται, όταν το γεγονός που μελετάται παρατηρηθεί σε έναν προκαθορισμένο ποσοστό ατόμων, π.χ. 75% και στη 3

36 συνέχεια, για όσα άτομα συνεχίζουν, θεωρούμε ότι έχει παρατηρηθεί το γεγονός που μελετάται. Σε αυτήν την περίπτωση, εάν δεν υπάρξουν θάνατοι από ατυχήματα, οι χρόνοι επιβίωσης των περικομμένων παρατηρήσεων θεωρούνται ίσοι με το χρόνο επιβίωσης της μεγαλύτερης μη περικομμένης παρατήρησης. Παράδειγμα 2.3 Στην περίπτωση του προηγούμενου πειράματος των συσκευασιών βαφής, το πείραμα θα ολοκληρωθεί όταν συμπληρωθεί ένας συγκεκριμένος αριθμός παρατηρήσεων. Έστω ότι ορίζουμε να ολοκληρωθεί το πείραμα μόλις σταματήσει να δίνει αποτελέσματα η κατά σειρά 8η βαφή. Επομένως, η διάρκεια του πειράματος είναι άγνωστη και οι τελευταίες 2 βαφές θεωρούνται αποκομμένες. Ειδικά στο παράδειγμα με τις 8 βαφές Α, Β, Γ, Δ, Ε, Ζ, Η, Θ ο ερευνητής μπορεί να αποφασίσει να τερματίσει την έρευνα όταν έξι από τις οκτώ βαφές πάψουν να είναι αποτελεσματικές, δηλαδή 6 8 =,75 = 75%. Από το σχήμα 3, βλέπουμε ότι τα δεδομένα επιβίωσης των 8 βαφών είναι ίσα με: +, 6, 4, 5,, 2+, 7 και + εβδομάδες. Το «+» συμβολίζει περικομμένη παρατήρηση. Την η βδομάδα η βαφή Ε έπαψε να είναι αποτελεσματική, τότε η έρευνα σταματά γιατί το 75% δεν είναι αποτελεσματικές και οι βαφές Α, Θ που συνεχίζουν θεωρούνται περικομμένες. Τα λογοκριμένα δεδομένα στην περίπτωση αυτή είναι τύπου IΙ. Θ Η Ζ Ε Δ Γ Β Α xάθηκε x x x x x Χρόνος (Εβδομάδες) 9 Διάγραμμα 2.3: Λογοκριμένα Δεδομένα Τύπου IΙ 4

37 2.3.3 Περικοπή δεδομένων τύπου ΙΙΙ (Τυχαία Λογοκρισία) Στην περικοπή δεδομένων τύπου ΙΙΙ, ο χρόνος λογοκρισίας που αντιστοιχεί σε κάθε άτομο υπό μελέτη δεν είναι σταθερός αλλά τυχαίος. Για παράδειγμα, σε κλινικές μελέτες, ενώ οι χρονικές στιγμές έναρξης και λήξης της έρευνας είναι προκαθορισμένες, οι ασθενείς εισέρχονται σε αυτήν σε διαφορετικές άρα τυχαίες χρονικές στιγμές. Έτσι, οι χρόνοι λογοκρισίας τους είναι τυχαίοι. Παράδειγμα 2.4 Έστω ότι η Ιατρική Σχολή του Πανεπιστημίου Πατρών, με πρωτοβουλία ομάδας καθηγητών, αποφασίζει να μελετήσει για έξι μήνες την επίδραση της διατροφής σε fast food στην πεπτική λειτουργία ατόμων ηλικίας 3 4 ετών, χωρίς προγενέστερα πεπτικά προβλήματα. Ο αρχικός αριθμός των ατόμων που συμμετέχουν στο πείραμα είναι 2. Αν όμως, κατά τη διάρκεια διεξαγωγής της μελέτης αυτής προκύψουν και άλλα άτομα που ενδιαφέρονται να συμμετέχουν, τότε είναι πιθανό να προστεθούν στο δείγμα παρά το γεγονός ότι η έρευνα είναι ήδη σε εξέλιξη. Η μορφή των παρατηρήσεων που προκύπτουν εμφανίζεται παρακάτω στο διάγραμμα 4: Α x Β Γ xάθηκε Δ t t t 2 t 3 t 4 Διάγραμμα 2.4: Λογοκριμένα Δεδομένα Τύπου IIΙ 5

38 Στην κατηγορία Α ανήκουν τα άτομα που εισήλθαν στην έρευνα τη χρονική στιγμή t = και το προς μελέτη γεγονός προκλήθηκε όσο ακόμη η μελέτη ήταν σε εξέλιξη. Στην κατηγορία Β ανήκουν τα άτομα που εισήλθαν στο πείραμα τη χρονική στιγμή t 2 > t και μέχρι τη χρονική στιγμή t 4 όπου έληξε το πείραμα δεν έχει προκληθεί το μελετώμενο γεγονός. Στην κατηγορία Γ ανήκουν άτομα που εισήλθαν στο πείραμα τη χρονική στιγμή t > t και τη χρονική στιγμή t 3 αποχώρησαν από το πείραμα χωρίς ακόμη να έχει προκληθεί το υπό μελέτη γεγονός. Στην κατηγορία Δ ανήκουν τα άτομα που εισήλθαν στο πείραμα στην αρχή του και μέχρι τη λήξη του δεν είχε παρατηρηθεί ακόμα το υπό μελέτη γεγονός. Είναι προφανές ότι οι κατηγορίες Β, Γ, Δ αποτελούν περιπτώσεις δεξιάς λογοκρισίας - περικοπής. 2.4 Προϋποθέσεις για την Ανάλυση Επιβίωσης Οι μέθοδοι για την Ανάλυση Επιβίωσης προϋποθέτουν ότι οι παρατηρήσεις είναι ανεξάρτητες. Επιπλέον, πρέπει να ισχύει και η προϋπόθεση της ανεξάρτητης λογοκρισίας. Δηλαδή, ένα άτομο που είναι λογοκριμένο και είναι ζωντανό στο χρόνο t, πρέπει να έχει τον ίδιο κίνδυνο επακόλουθης αποτυχίας (ή να έχει την ίδια πιθανότητα να επιβιώσει) με ένα άτομο που είναι μη λογοκριμένο στο χρόνο t. Έτσι, αν υπάρχουν λογοκριμένες παρατηρήσεις που προκύπτουν μόνο λόγω διαφορετικών εισόδων στη μελέτη, τότε η υπόθεση της ανεξαρτησίας φαίνεται να ισχύει. Όταν όμως οι λογοκριμένες παρατηρήσεις προκύπτουν επειδή χάθηκε το άτομο από την παρακολούθηση ή όταν προκύπτουν λόγω αποχώρησης του ασθενή από τη μελέτη εξαιτίας επιπλοκών της θεραπείας, τότε είναι πιθανόν η υπόθεση της ανεξαρτησίας να μην ισχύει. 6

39 ΚΕΦΑΛΑΙΟ 3ο Συναρτήσεις Χρόνου Επιβίωσης 3. Εισαγωγή Ο χρόνος επιβίωσης ορίζεται ως ο χρόνος μέχρι να συμβεί ένα συγκεκριμένο γεγονός, το οποίο μπορεί να είναι η εμφάνιση μιας ασθένειας, η αντίδραση σε κάποια φαρμακευτική αγωγή, η επιδείνωση μιας κατάστασης ή ο θάνατος. Οι συναρτήσεις του χρόνου επιβίωσης περιγράφουν ή χαρακτηρίζουν την κατανομή των χρόνων επιβίωσης και μπορούν να χρησιμοποιηθούν για να επεξηγήσουν διαφορετικές όψεις δεδομένων. Αυτές οι συναρτήσεις είναι μαθηματικά ισοδύναμες, με την έννοια ότι αν μια από αυτές είναι γνωστή, τότε εύκολα μπορεί να προκύψουν και οι άλλες. Οι συναρτήσεις του χρόνου επιβίωσης είναι: o η συνάρτηση επιβίωσης ή συνάρτηση αξιοπιστίας (survivor function or reliability function) survival ή survivorship function o η συνάρτηση πυκνότητας πιθανότητας ή πυκνότητα αποτυχίας (probability failure density function or failure density) o η συνάρτηση βαθμού κινδύνου (Hazard rate function) o η μέση υπολειπόμενη ζωή, ευρύτερα γνωστή ως μέση υπολειπόμενη ζωή κατά τη χρονική στιγμή t (mean residual life at time t) 3.2 Συνάρτηση επιβίωσης (survival ή survivorship function) Στη συνάρτηση επιβίωσης έστω ότι Χ είναι μία τυχαία μεταβλητή που αναφέρεται στο χρόνο επιβίωσης της συνιστώσας ενός συστήματος, δηλαδή στο χρόνο ως την αποτυχία. Η τυχαία μεταβλητή Χ μπορεί να είναι συνεχής ή διακριτή. Η συνάρτηση f x (t) προσδιορίζει την πιθανή συμπεριφορά επιβίωσης μιας 7

40 συνιστώσας ενός συστήματος και ονομάζεται πυκνότητα αποτυχίας (failure density). Η f x (t) ορίζεται στον ημιάξονα των θετικών πραγματικών αριθμών (αποτυχία δεν μπορεί να συμβεί πριν από την έναρξη της χρήσης) και καθορίζει την πιθανότητα στιγμιαίας αποτυχίας τη χρονική στιγμή t. Στην πραγματικότητα η f x (t) είναι η συνάρτηση πυκνότητας πιθανότητας. Το μοντέλο αποτυχίας (failure model) περιλαμβάνει την εξειδικευμένη μορφή της f x (t) καθώς και τις τιμές των παραμέτρων της. Η γραφική παράσταση της f x συναρτήσει του χρόνου t, ονομάζεται καμπύλη επιβίωσης (survival curve) και προτάθηκε από τον Berkson το 942. Μια απότομα φθίνουσα καμπύλη, όπως αυτή του παρακάτω γραφήματος 3., υποδεικνύει χαμηλό ποσοστό επιβίωσης ή μικρή διάρκεια επιβίωσης. f x (t),,8,6,4, t Χρόνια Σε Δεκάδες Διάγραμμα 3.: survival curve Αντιθέτως, μία βαθμιαία φθίνουσα καμπύλη, όπως του γραφήματος 3.2, υποδεικνύει υψηλό ποσοστό ή μεγαλύτερη διάρκεια επιβίωσης. f x (t),,8,6,4, t Χρόνια Σε Δεκάδες Διάγραμμα 3.2: survival curve 8

41 έχουμε: Για την πιθανή συμπεριφορά επιβίωσης μιας συνιστώσας ενός συστήματος o τη συνάρτηση πυκνότητας πιθανότητας, f x (t), που καθορίζει την πιθανότητα στιγμιαίας αποτυχίας τη χρονική στιγμή t. o την αθροιστική συνάρτηση κατανομής αποτυχίας, F x (t), (cumulative probability of failure) που καθορίζει την πιθανότητα αποτυχίας μέχρι τη χρονική στιγμή t. t F x (t) = f (x) dx, t o τη συνάρτηση επιβίωσης ή συνάρτηση αξιοπιστίας, S(t) ή (survivor function or reliability function) x F x (t), που καθορίζει την πιθανότητα να μην έχει αποτύχει μέχρι τη χρονική στιγμή t. S(t) = R(t) = F x (t) = F x (t), t Για δεδομένη συνάρτηση κατανομής F x (t) = P(X t) έχουμε: o την κατανομή υπολειπόμενης ζωής κατά την χρονική στιγμή t, F x (t), (residual life distribution at time t) F x (t) = P(x < X x + t/x > x), t. Η συνάρτηση υπολειπόμενης ζωής ορίζεται για εκείνα τα x για τα οποία P(X > x) >. o η συνάρτηση υπολειπόμενης ζωής γράφεται ισοδύναμα: F x (t) = F x (x+t), t F (x) x o τη συνάρτηση βαθμού αποτυχίας, r x (t), το λόγο (failure rate function) που εκφράζει την πιθανότητα ένα σύστημα να επιζήσει για μια χρονική περίοδο t δεδομένου ότι επέζησε μέχρι τη χρονική στιγμή x r x (t) = P(X > x + t) P(X > x) = F(x + t) F(x), t o τη συνάρτηση βαθμού πολλαπλασιαστικής αποτυχίας, r x (t), (multiplicative failure rate function) που ορίζεται από το λόγο: r x (t) = P(X > x t ) P(X > x), t 9

42 o τη συνάρτηση βαθμού προσθετικής αποτυχίας, r x (t), (additive failure rate function) που ορίζεται από το λόγο: r x (t) = P(X > x + t ), t P(X > x) 3.3 Συνάρτηση βαθμού κινδύνου (hazard rate function) o Η συνάρτηση βαθμού κινδύνου, h x (t), (hazard rate function) εκφράζει τη στιγμιαία πιθανότητα αποτυχίας του συστήματος στο χρόνο t δοθέντος ότι αυτό επέζησε μέχρι τη χρονική στιγμή t. Δηλαδή, η συνάρτηση βαθμού κινδύνου εκφράζει την τάση προς διακοπή ενός συστήματος στο χρονικό διάστημα (t, t + Δt] με δεδομένη την επιβίωσή του ως τη χρονική στιγμή t. Αν X η μη αρνητική τυχαία μεταβλητή που εκφράζει το χρόνο επιβίωσης και έχει συνάρτηση επιβίωσης h x (t) = Δt F x (t), τότε: P(σύστημα ηλικίας t θα αποβιώσει στο (t, t + Δt) / επέζησε μέχρι τη στιγμή t) lim Δt (O όρος αυτός χρησιμοποιήθηκε για πρώτη φορά από τον Barlow (963). Αναφέρεται και ως στιγμιαίος λόγος αποτυχίας (instantaneous failure rate) και ως δεσμευμένη θνησιμότητα (conditional mortality)) επομένως η συνάρτηση βαθμού κινδύνου h x (t) ορίζεται, για την περίπτωση: o συνεχούς κατανομής, από τη σχέση: f x (t) o h x (t) = F (t), t x o διακριτής κατανομής, από τη σχέση: o h x (t) = P(X = t), t =,, 2, P(X t) Η συνάρτηση βαθμού κινδύνου μπορεί να αυξάνει, να μειώνεται, να μένει σταθερή ή να δηλώνει μια πιο περίπλοκη διαδικασία. Στο παρακάτω διάγραμμα 3.3 φαίνονται διάφορες μορφές που μπορεί να πάρει η συνάρτηση βαθμού κινδύνου. 2

43 h(t) h (t) h 4 (t) Χρόνος h 2 (t) Διάγραμμα 3.3: Συναρτήσεις Βαθμού Κινδύνου t h 3 (t) h 5 (t) Η συνάρτηση h (t) είναι αύξουσα, υποδηλώνει αυξημένο κίνδυνο με την πάροδο του χρόνου και τη συναντούμε συχνά στην πράξη. Για παράδειγμα, ασθενείς με οξεία λευχαιμία που δεν ανταποκρίνονται στη φαρμακευτική αγωγή, έχουν αυξανόμενο βαθμό κινδύνου. Η συνάρτηση h 2 (t) είναι φθίνουσα. Μπορεί, για παράδειγμα, να υποδεικνύει τον κίνδυνο που διατρέχουν στρατιώτες, οι οποίοι έχουν τραυματιστεί από σφαίρα και πρόκειται να υποβληθούν σε χειρουργική επέμβαση. Ο κίνδυνος θα μειωθεί στην περίπτωση που η εγχείρηση είναι επιτυχής. Η συνάρτηση h 3 (t) είναι σταθερή και συνεπάγεται ότι και ο κίνδυνος παραμένει σταθερός. Αυτό συμβαίνει όταν, για παράδειγμα, εξετάζουμε τον κίνδυνο θανάτου υγιών ατόμων ηλικίας 8-4, των οποίων οι κύριες αιτίες θανάτου είναι τα ατυχήματα. Η h 4 (t) είναι γνωστή ως λεκανοειδής καμπύλη (bathtub curve) και περιγράφει την εξέλιξη της ανθρώπινης ζωής. Αρχικά, ο κίνδυνος είναι μεγάλος (υψηλή βρεφική θνησιμότητα), έπειτα και μέχρι μια συγκεκριμένη ηλικία, παραμένει σταθερός, ενώ σε μεγαλύτερες ηλικίες αυξάνεται ακόμα περισσότερο. Τέλος, ας θεωρήσουμε ένα παράδειγμα ασθενών με φυματίωση. Θα έχουν κίνδυνο, ο οποίος αυξάνεται αρχικά, ενώ μετά από τη λήψη της θεραπείας, ο κίνδυνος θα μειωθεί και η συνάρτηση βαθμού κινδύνου θα έχει τη μορφή της h 5 (t). 2

44 Η συνάρτηση βαθμού κινδύνου h x (t) είναι ένα εξειδικευμένο χαρακτηριστικό των δεδομένων. Παρ όλ αυτά, είναι εξαιρετικά χρήσιμη για τη μελέτη του χρόνου επιβίωσης, δεδομένου ότι στις περισσότερες περιπτώσεις υπάρχουν πληροφορίες σχετικές με τη διαχρονική εξέλιξη της h x (t). Αξίζει να σημειωθεί ότι η βασική αυτή έννοια χρησιμοποιείται στην Αναλογιστική Στατιστική και τη Δημομετρία, όπου είναι γνωστή ως ένταση θνησιμότητας (force of mortality). Στην οικονομική επιστήμη ο αντίστροφος λόγος ονομάζεται Mill s Ratio. H συνάρτηση βαθμού κινδύνου ορίζει μονοσήμαντα την κατανομή της τυχαίας μεταβλητής Χ, τόσο στην περίπτωση που η περίπτωση που αυτή είναι διακριτή. Θεώρημα Χ είναι συνεχής όσο και στην Έστω X τυχαία μεταβλητή με μη αρνητικές τιμές η οποία έχει συνάρτηση επιβίωσης F x (t). Η κατανομή της X ορίζεται μονοσήμαντα από τη συνάρτηση βαθμού κινδύνου h x (t) Περίπτωση συνεχούς τυχα ίας μεταβλητής Για μια συνεχή τυχαία μεταβλητή X έχουμε: για τη συνάρτηση βαθμού κινδύνου o h (t) = x f x (t), t F (t) x για τη συνάρτηση πυκνότητας πιθανότητας o f x (t) = - df x (t) dt ότι η συνάρτηση επιβίωσης ορίζεται μονοσήμαντα από τη συνάρτηση βαθμού κινδύνου o F x (t) = t - h x (x) dx e, t ότι η συνάρτηση πυκνότητας πιθανότητας ορίζεται μονοσήμαντα από τη συνά ρτηση βα θμού κινδύνου x o f x (t) = h x (t) e, t Περίπτωση διακριτής τυχαίας μεταβλητής t - h (x) dx Για μια διακριτή τυχ αία μεταβλητή X έχουμε: για τη συνάρτηση βαθμού κινδύνου o h (t) = x P(X = t), t =,, 2, P(X t) 22

45 ότι η συνάρτηση επιβίωσης ορίζεται μονοσήμαντα από τη συνάρτηση βαθμού κινδύνου o P(X t) = t- i= [ h x (i)], t =,, 2, ότι η συνάρτηση πυκνότητας πιθανότητας ορίζεται μονοσήμαντα από τη συνάρτηση βαθμού κινδύνου o P(X = t) = P(X = ) t- i= [ h x(i)] h x(i +), t =,, 2, h (i) x 3.4 Μέση υπολειπόμενη ζωή (mean residual life) o Η μέση υπολειπόμενη ζωή κατά τη χρονική στιγμή t, μ x (t) (mean residual life at time t) εκφράζει την αναμενόμενη ζωή μιας συνιστώσας που έχει ήδη ηλικία t, δηλαδή έχει επιβιώσει ως τη χρονική στιγμή t και εξακολουθεί να λειτουργεί. Ορίζεται για την περίπτωση: συνεχούς κατανομής, από τη σχέση: o μ x (t) = Ε(X t/ X > t), t διακριτής κατανομής, από τη σχέση: o μ x (t) = Ε(X t/ X > t), t =,, 2,. Η μέση υπολειπόμενη ζωή εμφανίζεται στη διεθνή βιβλιογραφία στα μέσα της δεκαετίας του 6. Σε αντίθεση με τη συνάρτηση βαθμού κινδύνου, η συνάρτηση μέσης υπολειπόμενης ζωής δεν έχει αξιοποιηθεί επαρκώς σε εφαρμογές. Παρ όλ αυτά, μπορεί να αναδειχθεί ως καταλληλότερος δείκτης της φθοράς, της γήρανσης ή της παλαίωσης, από ότι η συνάρτηση βαθμού κινδύνου. Η μη αρνητική τυχαία μεταβλητή X της οποίας τη συμπεριφορά θέλουμε να μελετήσουμε, μπορεί, για παράδειγμα, να περιγράφει το χρόνο ως την αποτυχία μιας συνιστώσας ενός συστήματος. Τότε, σύμφωνα με το συμβολισμό που έχουμε υιοθετήσει, μ x () εκφράζει την αναμενόμενη ζωή μιας καινούργιας συνιστώσας, ενώ μ x (t) είναι η αναμενόμενη ζωή που υπολείπεται σε μία συνιστώσα ηλικίας t. Με τον όρο «ηλικίας t» εννοούμε ότι η συνιστώσα «έζησε» ως τη χρονική στιγμή t και εξακολουθεί να λειτουργεί στο χρόνο t. 23

46 Η μέση υπολειπόμενη ζωή μ x (t) μπορεί να υπολογιστεί μέσω της συνάρτησης επιβίωσης F x (t). Θεώρημα Έστω X τυχαία μεταβλητή με συνάρτησης επιβίωσης F x ( t), για μια συνεχή τυχαία μεταβλητή X αποδεικνύεται ότι: o μ x (t) = F x (t) F x (x) dx, t t για μ ια διακριτή τυχαία μεταβλητή X αποδεικνύεται ότι: o μ x (t) = F x (t) x=t F (x), t =,, 2,. x Η συνάρτηση επιβίωσης F (t) μπορεί να υπολογιστεί από τη μέση x υπολειπόμενη ζωή μ x (t). Θεώρημα Έστω X τυχαία μεταβλητή με μη αρνητικές τιμές, η οποία έχει συνάρτηση επιβίωσης F x (t). Η κατανομή της X ορίζεται μονοσήμαντα από τη μέση υπολειπόμενη ζωή μ x (t). για μια συνεχή τυχαία μεταβλητή X αποδεικνύεται ότι: o F x (t) = x μ () x μ (t) e t dt x μ (x) για μια διακ ριτή τυχαία μεταβλητή X αποδεικνύεται ότι: o r μ x (i) P(X > r) = x, r =, 2, 3, i= μ (i +) Η συνάρτηση βαθμού κινδύνου h x (t) μπορεί να υπολογιστεί από τη μέση υπολειπόμενη ζωή μ (t). Θεώρημα συνάρτηση επιβίωσης x Έστω X τυχαία μεταβλητή με μη αρνητικές τιμές, η οποία έχει F x (t). Η συνάρτηση βαθμού κινδύνου και η μέση υπολειπόμενη ζωή μ x (t) συνδέονται μέσω των σχέσεων. για μια συνεχή τυχαία μεταβλητή X αποδεικνύεται ότι: o h (t) = x x +μ (t), t x μ (t) για μια διακ ριτή τυχαία μεταβλητή X αποδεικνύεται ότι: o h (t) = x x x μ (t) μ (t ) +, t =,, 2,. x μ (t) 24

47 3.5 Συνοπτικά Οι συναρτήσεις χρόνου επιβίωσης είναι μαθηματικά ισοδύναμες. Δηλαδή, αν γνωρίζουμε μία, τότε εύκολα μπορούν να προκύψουν οι άλλες. S(t) = F x (t) Συνάρτηση επιβίωσης αξιοπιστίας f x (t) Συνάρτηση πυκνότητας πιθανότητας (πυκνότητα αποτυχίας) h x (t) Συνάρτηση κινδύνου μ x (t) Μέση υπολειπόμενη ζωή Για μια συνεχή τυχαία μεταβλητή X έχουμε: Συνάρτηση επιβίωσης (αξιοπιστίας) F x (t) Μας ενδιαφέρει η πιθανότητα να μην έχει αποτύχει ως τη χρονική στιγμή t. o S(t) = R(t) = F x (t) = F x (t), t o - h x (x) dx F (t) = e, t x t Συνάρτηση πυκνότητας πιθανότητας f x (t) Καθορίζει την πιθανότητα στιγμιαίας αποτυχίας τη χρονική στιγμή t o f x (t) = - df x (t) dt H αθροιστική συνάρτηση κατανομής αποτυχίας μέχρι t, F x (t) είναι: t o F x (t) = f (x) dx, t x Συνάρτηση κινδύνου h x (t) Εκφράζει τη στιγμιαία πιθανότητα αποτυχίας του συστήματος στο χρόνο t, 25

48 δοθέντος ότι αυτό επέζησε μέχρι τη χρονική στιγμή t. f x (t) o h x (t) = F (t), t x o f x (t) = - df x (t) dt άρα h x (t) = dlnf x (t) dt - h x (x) dx o f x (t) = h x (t) e, t t Μέση υπολειπόμενη ζωή μ x (t) Η μ x (t) είναι καταλληλότερος δείκτης της φθοράς, της παλαίωσης ή της γήρανσης από την h x (t). Η μ x (t) είναι η αναμενόμενη ζωή που υπολείπεται σε μια συνιστώσα «ηλικίας t» Η «ηλικία t» είναι η συνιστώσα που «έζησε» ως τη χρονική στιγμή t και εξακολουθεί να λειτουργεί στο χρόνο t. f x (t) o h x (t) = F (t), t x Η μέση υπολειπόμενη ζωή μ x (t) μπορεί να υπολογιστεί μέσω της συνάρτησης επιβίωσης F x (t) o μ x (t) = F x (t) F x (x) dx, t t Η συνάρτηση επιβίωσης F x (t) μπορεί να υπολογιστεί από τη μέση υπολειπόμενη ζωή μ x (t). o F x (t) = x μ () x μ (t) e t dt x μ (x) Η συνάρτηση βαθμού κινδύνου h x (t) μπορεί να υπολογιστεί από τη μέση υπολειπόμενη ζωή μ x (t). o h x (t) = x x +μ (t) μ (t), t Σημείωση: Οι αποδείξεις των παραπάνω τύπων έγιναν σε εργασία των Δημάκη και Ξεκαλάκη (996), στην οποία προτείνεται η μέση υπολειπόμενη ζωή ως καταλληλότερος από τη συνάρτηση βαθμού κινδύνου δείκτης φθοράς μιας πειραματικής μονάδας. 26

49 ΚΕΦΑΛΑΙΟ 4ο Στατιστικά Μοντέλα Χρόνου Αποτυχίας 4. Εισαγωγή Η κατανομή αποτυχίας είναι η προσπάθεια να περιγραφεί μαθηματικά η διάρκεια ζωής ενός υλικού, ενός συστήματος ή ενός οργανισμού. Τα δεδομένα επιβίωσης καθώς και οι συναρτήσεις επιβίωσης εκφράζουν την πιθανότητα η συνιστώσα του συστήματος να έχει ή να μην έχει αποτύχει έως τη χρονική στιγμή t. Στη φύση όμως υπάρχουν πολλές αιτίες που μπορούν να οδηγήσουν στην «αποτυχία» ενός συστήματος. Είναι δύσκολη η απομόνωση των φυσικών αυτών αιτίων και ο καθορισμός ενός μοντέλου που θα περιγράφει τα χαρακτηριστικά του μελετώμενου συστήματος σύμφωνα με ορισμένο μαθηματικό υπόδειγμα. Ωστόσο, υπάρχουν κάποιες θεωρητικές στατιστικές κατανομές, με επαρκή αριθμό ιδιοτήτων, που διευκολύνουν την προσέγγιση σε διάφορα φυσικά φαινόμενα και χρησιμοποιούνται για τη μελέτη των δεδομένων επιβίωσης. Οι κυριότερες κατανομές μοντέλα χρόνου αποτυχίας είναι οι ακόλουθες: o η εκθετική κατανομή (Exponential) o η κατανομή Weibull o η κατανομή Γάμμα (Gamma) o η λογαριθμοκανονική κατανομή (Lognormal) o η κατανομή Pareto o Η Λογαριθμολογιστκή κατανομή (Log-logistic) o η γεωμετρική κατανομή (Geometric) Τα πρώτα τέσσερα είδη κατανομών έχουν χαρακτηρισθεί ως κατανομές χρόνου ζωής (life time distributions). Όμως και οι άλλες κατανομές ικανοποιούν ένα σημαντικό αριθμό ιδιοτήτων και επομένως μπορούν να χρησιμοποιηθούν με επιτυχία για την αντιμετώπιση συναφών προβλημάτων. 27

50 4.2 Εκθετική κατανομή (Exponential) Είναι η απλούστερη κατανομή, ιδιαίτερα ενδιαφέρουσα στις πρακτικές εφαρμογές λόγω των μαθηματικών ιδιοτήτων της. Συμβολίζεται Χ exp(λ), t, λ >. Ορισμός: Μια συνεχής τυχαία μεταβλητή Χ, λέγεται ότι ακολουθεί την εκθετική κατανομή με παράμετρο λ >, αν έχει συνάρτηση επιβίωσης: o S(t) = F x (t) = e, t, λ >. -λt Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ, είναι: o F x (t) = F x (t) = e, t, λ >. Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ, είναι: o f x (t) = - d F x (t) dt Βασικές Ιδιότητες Της Κατανομής Έστω ότι Χ exp(λ), t -λt -λt = λ e, t, λ >., λ >, τότε: o Ε(X) = λ o Var(X) = λ 2 Τα διαγράμματα που ακολουθούν δίνουν τη συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της εκθετικής κατανομής. f x (t),,8,6,4,2, t Διάγραμμα 4.2.: Εκθετική Κατανομή Συνάρτηση Πυκνότητας Πιθανότητας 28

51 Διάγραμμα 4.2.2: Εκθετική Κατανομή Συνάρτηση Πυκνότητας Πιθανότητας Αποδεικνύονται οι παρακάτω προτάσεις για την εκθετική κατανομή: ο. Έστω Χ συνεχής τυχαία μεταβλητή που ορίζεται στο [, + ). Η Χ ακολουθεί την εκθετική κατανομή με παράμετρο λ >, αν και μόνον αν α) η συνάρτηση βαθμού κινδύνου κατά τη χρονική στιγμή t είναι σταθερή, ίση με λ. β) η μέση υπολειπόμενη ζωή κατά τη χρονική στιγμή t είναι σταθερή, ίση με λ. 2ο. Έστω Χ συνεχής τυχαία μεταβλητή με τιμές t. Τότε η σχέση hx(t) μ x (t) = ορίζει μονοσήμαντα την κατανομή Χ, ως εκθετική με παράμετρο λ >. 3ο. Αν {Ν t, t } είναι μια στοχαστική ανέλιξη Poisson με ρυθμό λ και Τ =, Τ, Τ 2, είναι η ακολουθία των χρονικών στιγμών κατά τις οποίες λαβαίνουν χώρα τα γεγονότα, τότε για κάθε n, η ακολουθία των χρόνων που μεσολαβούν μεταξύ δύο διαδοχικών γεγονότων, Τ Τ, Τ 2 Τ, είναι ακολουθία ανεξάρτητων και ισόνομων εκθετικών (λ) ανεξάρτητων των συγκεκριμένων χρονικών στιγμών Τ, Τ 2, που συμβαίνουν τα γεγονότα. 4ο. Έστω Χ συνεχής τυχαία μεταβλητή με τιμές t >. Τότε η σχέση P(X > t + y / X > t) = P(X > y), y >, ορίζει μονοσήμαντα την κατανομή της X ως εκθετική με παράμετρο λ. 5ο. Έστω Χ μια συνεχής τυχαία μεταβλητή, η οποία παίρνει μη αρνητικές τιμές. Τότε αποδεικνύεται ότι: α) Η Χ ακολουθεί την εκθετική κατανομή με παράμετρο λ >, αν και 29

52 μόνο αν η συνάρτηση βαθμού αθροιστικής αποτυχίας είναι σταθερή ως προς x για κάθε t.,,8,6 h(t),4,2, t Διάγραμμα 4.2.3: Εκθετική Κατανομή Συνάρτηση Βαθμού Αθροιστικής Αποτυχίας β) Η πρόταση: η συνάρτηση βαθμού αθροιστικής αποτυχίας είναι σταθερή ως προς x για κάθε t είναι ισοδύναμη με την πρόταση: η τυχαία μεταβλητή Χ έχει την ιδιότητα της έλλειψης αθροιστικής μνήμης Μοντέλα που οδηγούν στην εκθετική κατανομή: ο. Ο χρόνος αναμονής μέχρις ότου πραγματοποιηθεί το πρώτο γεγονός σε μια διαδικασία Poisson με παράμετρο λ ακολουθεί την εκθετική κατανομή με συνάρτηση επιβίωσης την F (t) = e, t, λ >, δηλαδή Χ exp(λ) x -λt 2ο. Η σταθερή συνάρτηση βαθμού κινδύνου οδηγεί σε εκθετική κατανομή. Με άλλα λόγια, αν h(t) = λ, λ >, τότε η κατανομή της τυχαίας μεταβλητής Χ, η οποία περιγράφει το χρόνο ζωής ενός εξαρτήματος, έχει συνάρτηση επιβίωσης την F (t) = e, t, λ >, δηλαδή Χ exp(λ) x -λt 3ο. Η σταθερή μέση υπολειπόμενη ζωή οδηγεί σε εκθετική κατανομή. Με άλλα λόγια, αν μ x (t) =, τότε η κατανομή της τυχαίας μεταβλητής Χ, η οποία λ περιγράφει το χρόνο ζωής ενός εξαρτήματος, έχει συνάρτηση επιβίωσης F (t) = e, t, λ >, δηλαδή Χ exp(λ) x -λt Από τα παραπάνω προκύπτει ότι η παράμετρος λ επιδέχεται φυσική ερμηνεία, δεδομένου ότι εκφράζει τη συνάρτηση βαθμού κινδύνου της κατανομής. Στην 3

53 περίπτωση που θέλουμε η παράμετρος της εκθετικής κατανομής να εκφράζει τη μέση υπολειπόμενη ζωή, καταλληλότερη έκφραση της συνάρτησης επιβίωσης είναι η F x (t) = - t e θ, t, θ > Ιδιότητα Έλλειψης Αθροιστικής Μνήμης ή «Αμνησία» Είναι η πιο βασική ιδιότητα της εκθετικής κατανομής. Δε σημαίνει βέβαια την απώλεια μνήμης ενός λογικού όντος για ένα μέρος ή για ολόκληρη τη ζωή του. Στην περίπτωση της εκθετικής κατανομής σημαίνει ότι, αν ο χρόνος ζωής ενός ατόμου ή ενός εξαρτήματος μηχανής ακολουθεί αυτό το είδος της κατανομής, τότε το άτομο αυτό δεν «γερνάει». Φυσικά, η παραπάνω υπόθεση δεν είναι ρεαλιστική για ζωντανούς οργανισμούς αλλά έχει πρακτική χρησιμότητα για τη μέτρηση του χρόνου ζωής ορισμένων μηχανικών εξαρτημάτων. Η ιδιότητα αυτή όμως εξυπηρετεί ιδιαίτερα στην περίπτωση των ελέγχων χρόνου ζωής με επανατοποθέτηση. Στην περίπτωση που ο χρόνος ζωής ενός εξαρτήματος ακολουθεί την εκθετική κατανομή με παράμετρο λ >, τότε αποδεικνύεται ότι: η δεσμευμένη πιθανότητα, ο χρόνος ως την αποτυχία Χ να υπερβεί το t + y, δοθέντος ότι έχει ήδη υπερβεί το t, ισούται με την πιθανότητα το Χ να υπερβεί το y. PDF,,5 Distribution Overview Plot for Exponential LSXY Estimates-Complete Data Probability Density Function Percent 99,9 9 5 Exponential Table of Statistics Mean,3669 StDev,3669 Median,78576 IQ R,3892 F ailure Censor A D*,889,,,5 3, Exponential 4,5,,,, Exponential Surv iv al Function Hazard Function, Percent 5 Rate,95,,5 3, Exponential 4,5,9,,5 3, Exponential 4,5 Διάγραμμα 4.2.4: Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Εκθετικής Κατανομής 3

54 4.3 Η κατανομή Pareto Συμβολίζεται Χ Pareto(θ, α), t θ, α > και θ >. Ορισμός: Μια συνεχής τυχαία μεταβλητή Χ, λέγεται ότι ακολουθεί την κατανομή Pareto με παραμέτρους α >, θ >, αν έχει συνάρτηση επιβίωσης: α o S(t) = F x (t) = θ t α, t θ, α > και θ >. Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ, είναι: α o F x (t) = F x (t) = θ t α, t θ, α > και θ >. Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ, είναι: o f x (t) = - d F x (t) dt Βασικές Ιδιότητες Της Κατανομής Έστω ότι Χ Pareto(θ, α), t o Ε(X) = o Var(X) = α α+ ( = αθ t ), t θ, α > και θ >. αθ α, α >. θ, α > και θ >, τότε: αθ 2 (α ) (α 2 ), α > 2. Διάγραμμα 4.3.: Κατανομή Pareto(θ, α) 32

55 ΠΡΟΣΟΧΗ Στην κατανομή Pareto ισχύει η ιδιότητα έλλειψης πολλαπλασιαστικής μνήμης. Στην περίπτωση που ο χρόνος ζωής ενός οργανισμού ακολουθεί την κατανομή Pareto με παραμέτρους α > και θ =, αποδεικνύεται ότι η δεσμευμένη πιθανότητα ο χρόνος ως την αποτυχία Χ να υπερβεί το ty, δοθέντος ότι έχει ήδη υπερβεί το t, ισούται με την πιθανότητα το Χ να υπερβεί το y. Αποδεικνύονται οι παρακάτω προτάσεις για την κατανομή Pareto: ο. Έστω Χ συνεχής τυχαία μεταβλητή που ορίζεται στο [θ, + ), θ >. Η Χ ακολουθεί την κατανομή Pareto(θ, α), α, θ > αν και μόνον αν α) η συνάρτηση βαθμού κινδύνου κατά τη χρονική στιγμή t είναι αντιστρόφως ανάλογη ως προς t. (η παραπάνω πρόταση καθορίζει τη μορφή της συνάρτησης βαθμού κινδύνου στην περίπτωση που η κατανομή του χρόνου ζωής είναι η Pareto). β) η συνάρτηση μέσης υπολειπόμενης ζωής κατά τη χρονική στιγμή t είναι γραμμική συνάρτηση του t. (η παραπάνω πρόταση καθορίζει τη μορφή της συνάρτησης μέσης υπολειπομένης ζωής στην περίπτωση που η κατανομή του χρόνου ζωής είναι η Pareto). 2ο. Έστω Χ συνεχής τυχαία μεταβλητή με τιμές t θ. Τότε, η σχέση: h x (t) μ x (t) = C, C >, ορίζει μονοσήμαντα την κατανομή της Χ ως Pareto(θ, α) με παραμέτρους α > και θ >. (όπως προκύπτει από την παραπάνω πρόταση, το γινόμενο της συνάρτησης βαθμού κινδύνου επί τη μέση υπολειπομένη ζωή είναι σταθερό και οδηγεί σε μονοσήμαντο προσδιορισμό της κατανομής ως Pareto). 3ο. Έστω Χ συνεχής τυχαία μεταβλητή με τιμές t. Τότε, η σχέση P(X > ty / X > t) = P(X > y), t, y > ορίζει μονοσήμαντα την κατανομή Χ ως Pareto(, α), α >. 4ο. Έστω Χ συνεχής τυχαία μεταβλητή η οποία παίρνει τιμές μεγαλύτερες ή ίσες από τη μονάδα α) Η Χ ακολουθεί την Pareto(, α), α >, αν και μόνον αν η συνάρτηση βαθμού πολλαπλασιαστικής αποτυχίας είναι σταθερή ως προς x για κάθε t. β) Τότε η πρόταση η συνάρτηση βαθμού πολλαπλασιαστικής αποτυχίας είναι σταθερή ως προς x για κάθε t, είναι ισοδύναμη με την πρόταση: 33

56 η τυχαία μεταβλητή Χ έχει την ιδιότητα της έλλειψης πολλαπλασιαστικής μνήμης. Μοντέλα που οδηγούν στην κατανομή Pareto: ο. Αν η συνάρτηση βαθμού κινδύνου κατά τη χρονική στιγμή t είναι αντιστρόφως ανάλογη ως προς το χρόνο, τότε η κατανομή της τυχαίας μεταβλητής Χ που περιγράφει το χρόνο ζωής ενός οργανισμού είναι η Pareto με παραμέτρους α, θ >. 2ο. Αν η συνάρτηση μέσης υπολειπόμενης ζωής κατά τη χρονική στιγμή t είναι γραμμική συνάρτηση του χρόνου, τότε η κατανομή της τυχαίας μεταβλητής Χ που περιγράφει το χρόνο ζωής ενός οργανισμού είναι Pareto με παραμέτρους α >, θ >. Διάγραμμα 4.3.2: Κατανομή Pareto (θ, α) Distribution Overview Plot for Pareto LSXY Estimates-Complete Data PDF,6,4,2, Probability Density F unction - Pareto 2 Percent Smallest Extreme V alue Pareto 2 Table of Statistics Loc 5,278 Scale 58,6558 Mean 8,42 StDev 75,229 Median 93,7799 IQ R 92,2382 Failure 8 Censor AD* 2,354 C orrelation,93 Surv ival Function Hazard Function,75 Percent 5 Rate,5,25 - Pareto 2, - Pareto 2 Διάγραμμα 4.3.3: Κατανομή Pareto(θ, α) 34

57 4.4 Κατανομή Weibull Η κατανομή Weibull αποτελεί τη γενίκευση της εκθετικής κατανομής. Επειδή όμως δεν χαρακτηρίζεται από σταθερή συνάρτηση κινδύνου, έχει ευρύτερο φάσμα εφαρμογών. Συμβολίζεται Χ Weibull(λ, p), t, λ > και p >. Ορισμός: Μια συνεχής τυχαία μεταβλητή Χ, λέγεται ότι ακολουθεί την κατανομή Weibull με παραμέτρους λ >, p >, αν έχει συνάρτηση επιβίωσης: o S(t) = F x (t) = p (λt) e, t, λ > και p >. Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ, είναι: o F x (t) = F x (t) = p (λt) e, t, λ > και p >. Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ, είναι: o f x (t) = - d F x (t) dt = p p pλ t Βασικές Ιδιότητες Της Κατανομής e (λt) p, t, λ > και p >. Έστω ότι Χ Weibull(λ, p), t, λ > και p >, τότε: o Ε(X) = p λ Γ + p o Var(X) = 2 p 2 p λ Γ + Γ + p p Διάγραμμα 4.4.: Κατανομή Weibull(λ, p) Η κατανομή Weibull είναι από τις πιο διαδεδομένες κατανομές στο πλαίσιο της θεωρίας της Επιβίωσης. Οι μεγάλες τεχνικές δυσκολίες που παρουσιάζονται κατά τη μελέτη της κατανομής αντιμετωπίζονται, καθώς υπάρχει συναρτησιακή σχέση μεταξύ των τυχαίων μεταβλητών που ακολουθούν εκθετική κατανομή και κατανομή Weibull. 35

58 Αποδεικνύονται οι παρακάτω προτάσεις για την κατανομή Weibull: ο. Αν X exp(θ) τότε Y = 2ο. Αν X Pareto(, α) τότε Y = p X Weibull(λ = p θ, p). p {ln X} Weibull(λ = p α, p). 3ο. Έστω Χ συνεχής τυχαία μεταβλητή που ορίζεται στο [, + ). Τότε η Χ ακολουθεί την Weibull(λ, p), λ, p >, αν και μόνον αν η συνάρτηση βαθμού κινδύνου δίνεται από τη σχέση: h x (t) = pλ p t p. Μοντέλα που οδηγούν στην κατανομή Weibull: Αν η συνάρτηση βαθμού κινδύνου κατά τη χρονική στιγμή t είναι δυναμοσυνάρτηση του χρόνου, τότε η κατανομή της τυχαίας μεταβλητής Χ που περιγράφει το χρόνο ζωής ενός εξαρτήματος είναι η Weibull με παραμέτρους λ, p >. Η ασυμπτωτική κατανομή της μικρότερης διατεταγμένης στατιστικής συνάρτησης από μια προκαθορισμένη κατανομή πιθανότητας αποδεικνύεται ότι είναι η κατανομή Weibull. PDF,5,,5,, Probability Density Function,4,8 Weibull Distribution Overview Plot for Weibull LSXY Estimates-Complete Data,2 Percent 99,9 9 5,, Weibull, Weibull Table of Statistics Shape,9392 Scale, Mean, StDev, Median, IQ R,375 F ailure Censor A D*,394 C orrelation,996 Surv ival Function Hazard Function 7,5 Percent 5 Rate 5, 2,5,,4,8 Weibull,2,,,4,8 Weibull,2 Διάγραμμα 4.4.2: Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Weibull(λ, p) 36

59 4.5 Κατανομή Γάμμα (Gamma) Συμβολίζεται Χ Γάμμα(α, β), t >, α > και β >. Ορισμός: Μια συνεχής τυχαία μεταβλητή Χ, λέγεται ότι ακολουθεί την κατανομή Γάμμα με παραμέτρους α >, β >, αν έχει συνάρτηση επιβίωσης: o S(t) = F x (t) = Ειδικές περιπτώσεις α β βy α e y dy, t >, y >. Γ(α) Όπου Γ(α) είναι η συνάρτηση Γάμμα, η οποία ορίζεται από τη y t σχέση: Γ(α) = e y dy, t >. o Γ() = o Γ 2 = π o Γ(t) = (t ) Γ(t )), αν t >. o Γ(t) = (n )!, αν t = n Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ, είναι: o F x (t) = α t β βy α e y dy, t >, y >. Γ(α) Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ, είναι: o f x (t) = - d F x (t) dt = α β βt α e t, t >, y >. Γ(α) Τυποποιημένη κατανομή Γάμμα, λέγεται η κατανομή Γάμμα με παραμέτρους α = και β =. o Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της, είναι: o f x (t) = e t Γ(α) t α, t >, α >. o Η συνάρτηση κατανομής της X, είναι: o I α (t) = F x (t) = P(X t) = t e y y α dy, t >, y >. Γ(α) Η συνάρτηση αυτή ονομάζεται και ελλιπής συνάρτηση Γάμμα. Βασικές Ιδιότητες Της Κατανομής 37

60 Έστω ότι Χ Γάμμα(α, β), t >, α > και β >, τότε: o Ε(X) = α β o Var(X) = α β 2 Διάγραμμα 4.5.: Κατανομή Gamma Διάγραμμα 4.5.2: Κατανομή Gamma Αποδεικνύεται η παρακάτω πρόταση για την κατανομή Γάμμα: Έστω X συνεχής τυχαία μεταβλητή που ορίζεται στο [, + ). Η X ακολουθεί την Γάμμα(α, β), α, β >, αν και μόνο αν η συνάρτηση βαθμού κινδύνου δίνεται από τη σχέση: h x (t) = α α βt β ( βt) e. Γ(α)[ I ( βt)] α 38

61 Μοντέλα που οδηγούν στην κατανομή Γάμμα: Έστω X ο χρόνος αναμονής σε μια ανέλιξη Poisson με παράμετρο λ μέχρις ότου συμβεί το n-οστό γεγονός, τότε Χ Γάμμα(α = n, β = λ). o Για α = έχουμε Γάμμα(, β) exp(β). Distribution Overview Plot for Gamma Kaplan-Meier Estimates-Complete Data Survival Function Hazard Function, 8,8 Percent 6 4 Rate,6,4 2,2, 2,5 5, 7,5 Gamma,,, 2,5 5, 7,5 Gamma, Διάγραμμα 4.5.3: Κατανομή Gamma Distribution Overview Plot for Gamma LSXY Estimates-Complete Data PDF,2,, -3 Probability Density F unction Gamma 3 6 Percent 99,9 9 5, -5 Smallest Extreme V alue 5 Gamma Table of Statistics Loc 3,5482 Scale,45344 Mean 2,3587 StDev,864 Median 2,622 IQ R 2,28558 F ailure Censor A D* 7,5 C orrelation,78 Surviv al Function Hazard Function 3 Percent 5 Rate 2-3 Gamma Gamma 3 6 Διάγραμμα 4.5.4: Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Gamma 39

62 4.6 Λογαριθμοκανονική κατανομή (Lognormal) Η λογαριθμοκανονική κατανομή στην πιο απλή μορφή της μπορεί να οριστεί ως η κατανομή μιας μεταβλητής, της οποίας ο λογάριθμος ακολουθεί την κανονική κατανομή. Συμβολίζεται Χ Λ(μ, σ 2 ), μ, σ >. Ορισμός: Μια συνεχής τυχαία μεταβλητή Χ, λέγεται ότι ακολουθεί τη λογαριθμοκανονική κατανομή, αν Χ είναι ο χρόνος ζωής ενός εξαρτήματος και Υ = lnχ o S(t) = F x (t) = N(μ, σ 2 ) και έχει συνάρτηση επιβίωσης: lnx μ - 2 σ 2 e dx, t >, μ και σ >. 2πσ Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ, είναι: o F x (t) = lnx μ - 2 σ 2 t e dx, t >, μ και σ >. 2πσ Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ, είναι: o f x (t) = - d F x (t) dt Βασικές Ιδιότητες Της Κατανομής Έστω ότι Χ Λ(μ, σ 2 ), μ o Ε(X) = 2 σ μ+ e 2 = e 2πσt lnt μ - 2 σ, σ >, τότε: o Var(X) = 2μ+σ 2 2 σ e ( e ) 2, t >, μ και σ >. Διάγραμμα 4.6.: Κατανομή Lognormal 4

63 Διάγραμμα 4.6.2: Κατανομή Lognormal Διάγραμμα 4.6.3: Κατανομή Lognormal 4

64 Διάγραμμα 4.6.4: Κατανομή Lognormal ΠΡΟΣΟΧΗ Η λογαριθμοκανονική κατανομή προσφέρεται για τη μελέτη μη περικομμένων δεδομένων, ενώ, στην περίπτωση που τα δεδομένα είναι περικομμένα, η εφαρμογή δεν είναι καλή. Αποδεικνύεται η παρακάτω πρόταση για τη λογαριθμοκανονική κατανομή: Έστω Χ Ν(μ, σ 2 ) συνεχής τυχαία μεταβλητή. Αποδεικνύεται ότι η συνάρτηση πυκνότητας πιθανότητας της Y = e x δίνεται από τη σχέση: f x (t) = p e 2πt p( 2 lnλt) 2 2, t >, λ και p >. Μοντέλα που οδηγούν στη λογαριθμοκανονική κατανομή: Η μορφή της συνάρτησης βαθμού κινδύνου της Lognormal κατανομής είναι ιδιαίτερα πολύπλοκη. Για το λόγο αυτό είναι πολύ δύσκολο να προκύψει η συνάρτηση επιβίωσης της κατανομής αυτής μέσω της συνάρτησης βαθμού κινδύνου. Αποδεικνύεται όμως ότι η Lognormal κατανομή μπορεί να προκύψει μέσω φυσικής διαδικασίας, κατά την οποία η αποτυχία συμβαίνει όταν το υλικό υπερβεί κάποιο όριο αντοχής. Συγκεκριμένα, ας υποθέσουμε ότι X < X 2 <... < X n είναι μια 42

65 ακολουθία τυχαίων μεταβλητών οι οποίες περιγράφουν το βαθμό παραμόρφωσης σε διαδοχικά στάδια της εξέλιξής της. Ένα μοντέλο αναλογικών αποτελεσμάτων (proportionate effect model) θεωρείται ότι διέπει το μέγεθος των βαθμών παραμόρφωσης. Με άλλα λόγια, η μεταβολή του βαθμού παραμόρφωσης στο στάδιο i, X i X i, είναι ανάλογη προς το μέγεθος του βαθμού παραμόρφωσης X i, και το αντικείμενο αποτυγχάνει όταν το μέγεθος του βαθμού παραμόρφωσης γίνει X n. Αποδεικνύεται ότι το lnx n, για μεγάλο n, ακολουθεί ασυμπτωτικά την κανονική και κατά συνέπεια το X n ακολουθεί τη Lognormal κατανομή. Σχόλια Η Lognormal κατανομή είναι στενά συνδεδεμένη με την κανονική κατανομή. Γενικότερα, η Lognormal κατανομή μπορεί να εφαρμοστεί για μεταβλητές που είναι θετικές και έχουν κάποιες πολύ μεγάλες τιμές. Με τη λήψη του λογαρίθμου της καθεμιάς από τις τυχαίες μεταβλητές, το σύνολο των αριθμών που προκύπτουν θα είναι λογαριθμοκανονικά κατανεμημένο. Η Lognormal κατανομή μπορεί να μοντελοποιήσει ορισμένες περιπτώσεις, όπως: o την αλλαγή στην κατανομή των τιμών των μετοχών. o τη συγκέντρωση των ατμοσφαιρικών ρύπων. o τα ποσοστά επιβίωσης των ασθενών με καρκίνο. o τα ποσοστά αποτυχίας στον έλεγχο ενός προϊόντος. Distribution Overview Plot for LNormal LSXY Estimates-Complete Data PDF,6,4,2, Probability Density Function 4 8 LNormal 2 Percent 99, ,, Lognormal LNormal Table of Statistics Loc,68828 Scale,6 Mean,7858 StDev 2,57748 Median,73 IQ R,5833 F ailure Censor A D*,576 C orrelation,994 Survival Function Hazard Function,8 Percent 5 Rate,6,4 4 LNormal 8 2,2 4 8 LNormal 2 Διάγραμμα 4.6.5: Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Lognormal 43

66 4.7 Η Λογαριθμολογιστική κατανομή (Log-logistic) (γνωστή ως κατανομή Fisk στην οικονομία) Συμβολίζεται Χ Λ(λ, p), t, λ > και p >. Ορισμός: Μια συνεχής τυχαία μεταβλητή Χ, που εκφράζει το χρόνο ζωής ενός εξαρτήματος, λέγεται ότι ακολουθεί την λογαριθμολογιστική κατανομή με παραμέτρους λ >, p >, αν έχει συνάρτηση επιβίωσης: o S(t) = F x (t) = +(λt) p, t >, λ > και p >. Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ, είναι: o F x (t) = F x (t) = (λt) p +(λt) p = - p +(λt), t >, λ > και p >. Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ, είναι: o f x (t) = - d F x (t) dt Βασικές Ιδιότητες Της Κατανομής Έστω ότι Χ Λ(λ, p), t >, λ > και p >, τότε: = p p 2 λp(λt) [+ (λt) ], t >, λ > και p >. o Ε(X) = - λ b sinb = b π, b =, p > λ sinb p o Var(X) = 2 λ 2 2b b 2 sin2b sin b, p > 2 Διάγραμμα 4.7.: Συνάρτηση Κατανομής Πιθανότητας Log-logistic Αποδεικνύονται οι παρακάτω προτάσεις: ο. Έστω Χ συνεχής τυχαία μεταβλητή που ακολουθεί τη λογαριθμολογιστική κατανομή με παραμέτρους λ και p. Τότε η τυχαία μεταβλητή Y για την οποία 44

67 ισχύει ότι lnx = α + σy, α = lnλ, σ = p, ακολουθεί τη λογιστική κατανομή, δηλαδή η συνάρτηση πυκνότητας πιθανότητάς της δίνεται από τη σχέση: F Y (y) = e y y 2 (+ e ) 2ο. Έστω Χ συνεχής τυχαία μεταβλητή που ορίζεται στο [, + ). Τότε η Χ ακολουθεί τη λογαριθμολογιστική κατανομή (λ, p), λ, p >, αν και μόνον αν η συνάρτηση βαθμού κινδύνου δίνεται από τη σχέση: h x (t) = λp(λt) +(λt) p p, t >, λ > και p >. Διάγραμμα 4.7.2: Log-logistic Σχόλια Η Log-logistic έχει παρόμοιο σχήμα με τη Lognormal κατανομή, αλλά έχει βαρύτερες ουρές. Η αθροιστική συνάρτηση κατανομής μπορεί να γραφεί σε κλειστή μορφή, σε αντίθεση με εκείνη της Lognormal. αποτελεί πολύ καλή προσέγγιση στη λογαριθμοκανονική κατανομή έχοντας το πλεονέκτημα της καλής προσαρμογής στην περίπτωση που τα δεδομένα είναι περικομμένα. 45

68 Χρησιμοποιείται στην ανάλυση επιβίωσης ως ένα παραμετρικό μοντέλο για συμβάντα των οποίων το ποσοστό αρχικά αυξάνει και αργότερα μειώνεται. Για παράδειγμα, έχει χρησιμοποιηθεί o στη θνησιμότητα από καρκίνο μετά τη διάγνωση ή τη θεραπεία. o στην υδρολογία ως μοντέλο για τις βροχοπτώσεις, καθώς και o στα οικονομικά ως ένα απλό μοντέλο της κατανομής του πλούτου ή του εισοδήματος. Η Log-logistic έχει το πλεονέκτημα (όπως η εκθετική κατανομή και η κατανομή Weibull) να έχει απλές αλγεβρικές εκφράσεις για τη συνάρτηση επιβίωσης και τη συνάρτηση βαθμού κινδύνου. Έτσι εμφανίζεται πολύ προτιμότερη από τη λογαριθμοκανονική κατανομή. Παρατήρηση Στην περίπτωση που p <, η συνάρτηση κινδύνου συμπεριφέρεται σαν την αντίστοιχη της κατανομής Weibull. Στην περίπτωση που p=, η συνάρτηση κινδύνου συμπεριφέρεται σαν την αντίστοιχη της κατανομής Pareto, δηλαδή είναι αντιστρόφως ανάλογη ως προς το χρόνο. Στην περίπτωση που p >, η συνάρτηση κινδύνου μοιάζει με εκείνην της λογαριθμοκανονικής κατανομής.. Distribution Overview Plot for LLogistic LSXY Estimates-Complete Data PDF 2 Probability Density F unction 5 LLogistic Percent 99, ,,,,,, Loglogistic LLogistic Table of Statistics Loc 2,739 Scale,955 Mean * StDev * Median 5,3468 IQ R 23,956 F ailure Censor A D*,33 C orrelation,852 Surviv al Function Hazard Function 2 Percent 5 Rate 5 LLogistic 5 LLogistic Διάγραμμα 4.7.3: Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Κατανομής Log-logistic 46

69 4.8 Η Γεωμετρική κατανομή (Geometric) Συμβολίζεται Χ G(p), < p <, q = p. Ορισμός: Μια διακριτή τυχαία μεταβλητή Χ, λέγεται ότι ακολουθεί τη Γεωμετρική κατανομή με παράμετρο p >, αν έχει συνάρτηση επιβίωσης: o S(t) = F x (t) = q t+, t =,, 2,, < p <, q = p. Η συνάρτηση κατανομής πιθανότητας (αποτυχίας) της Χ είναι: o F x (t) = F x (t) = P(X t) = q t+. Η συνάρτηση πυκνότητας πιθανότητας (αποτυχίας) της Χ είναι: t o f x (t) = P(X = t) = p q, t =,, 2,, < p <, q = p. Βασικές Ιδιότητες Της Κατανομής Έστω ότι Χ G(p), < p <, q = p, τότε: o Ε(X) = q p o Var(X) = q p 2 Διάγραμμα 4.8.: Γεωμετρική Κατανομή 47

70 Διάγραμμα 4.8.2: Γεωμετρική Κατανομή Διάγραμμα 4.8.3: Γεωμετρική Κατανομή 48

71 Αποδεικνύονται οι παρακάτω προτάσεις για τη γεωμετρική κατανομή: Έστω Χ διακριτή τυχαία μεταβλητή που παίρνει ακέραιες και μη αρνητικές τιμές. ο. Η Χ ακολουθεί τη γεωμετρική κατανομή με παράμετρο p >, αν και μόνον αν η συνάρτηση βαθμού κινδύνου κατά τη χρονική στιγμή t είναι σταθερή και ίση με p. 2ο. Η Χ ακολουθεί τη γεωμετρική κατανομή με παράμετρο p >, αν και μόνον αν η συνάρτηση μέσης υπολειπόμενης ζωής κατά τη χρονική στιγμή t είναι σταθερή και ίση με p. 3ο. Τότε, η σχέση h x (t) μ x (t) = ορίζει μονοσήμαντα την κατανομή της Χ ως γεωμετρική με παράμετρο p >. 4ο. Τότε, η σχέση P(X > t + y / X > t) = P(X y), y =,, 2, 3, ορίζει μονοσήμαντα την κατανομή της Χ ως γεωμετρική με παράμετρο p >. Μοντέλα που οδηγούν στην γεωμετρική κατανομή: ο. Σε μια ακολουθία δοκιμών Bernouli, έστω Χ ο αριθμός των αποτυχιών πριν εμφανισθεί η πρώτη επιτυχία. Τότε η Χ ακολουθεί τη γεωμετρική κατανομή με συνάρτηση επιβίωσης: F x (t) = P(X > t) = q t+, t =,, 2,, < p <, q = p. o Δηλαδή Χ G(p), < p <, q = p. 2ο. Σταθερή συνάρτηση βαθμού κινδύνου οδηγεί σε γεωμετρική κατανομή. Δηλαδή, αν h x (t) = p, p >, τότε η κατανομή της διακριτής τυχαίας μεταβλητής Χ, η οποία περιγράφει το χρόνο ζωής ενός οργανισμού, έχει συνάρτηση επιβίωσης: F x (t) = P(X > t) = q t+, t =,, 2,, < p <, q = p. o Δηλαδή Χ G(p), < p <, q = p. 3ο. Σταθερή μέση υπολειπόμενη ζωή οδηγεί σε γεωμετρική κατανομή. Δηλαδή, αν μ x (t) =, τότε η κατανομή της διακριτής τυχαίας μεταβλητής Χ, η p οποία περιγράφει το χρόνο ζωής ενός οργανισμού, έχει συνάρτηση επιβίωσης: F x (t) = P(X > t) = q t+, t =,, 2,, < p <, q = p. o Δηλαδή Χ G(p), < p <, q = p. Από τα παραπάνω προκύπτει ότι η παράμετρος p επιδέχεται φυσική ερμηνεία, δεδομένου ότι εκφράζει τη συνάρτηση βαθμού κινδύνου της κατανομής. 49

72 Σχόλια Αυτή χρησιμοποιείται αντί για την εκθετική κατανομή, στην περίπτωση που ο χρόνος t είναι μια διακριτή μεταβλητή ποσότητα. Χρησιμοποιείται με παράμετρο p, όπου p είναι η πιθανότητα «αποτυχίας» και κατανέμει το χρόνο αναμονής μέχρι την εμφάνιση της πρώτης «αποτυχίας». Ιδιότητα Έλλειψης Αθροιστικής Μνήμης ή «Αμνησίας», δηλαδή αν ο διακριτός χρόνος ζωής ενός ατόμου ή ενός εξαρτήματος μηχανής ακολουθεί τη γεωμετρική κατανομή, τότε υποθέτουμε πως αυτό δε «γερνάει». ΠΡΟΣΟΧΗ: Τόσο στη γεωμετρική κατανομή όσο και στην εκθετική κατανομή ισχύει η ιδιότητα έλλειψης αθροιστικής μνήμης. Στην περίπτωση που ο χρόνος ζωής ενός οργανισμού ακολουθεί τη γεωμετρική κατανομή με παράμετρο p >, αποδεικνύεται ότι η δεσμευμένη πιθανότητα ο χρόνος επιβίωσης να υπερβεί το t + y, δοθέντος ότι έχει ήδη υπερβεί το t, ισούται με την πιθανότητα το Χ να υπερβεί το y. PDF,2,, -4 Probability Density F unction 4 Geometric Distribution Overview Plot for Geometric LSXY Estimates-Complete Data 8 Percent 99,9 9 5, - Smallest Extreme V alue Geometric Table of Statistics Loc 4,396 Scale,6363 Mean 3,9476 StDev 2,9842 Median 3,53949 IQ R 2,57287 F ailure Censor A D* 8,445 C orrelation,765 Surviv al Function 3 Hazard Function Percent 5 Rate Geometric Geometric 8 Διάγραμμα 4.8.4: Συνάρτηση Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου Γεωμετρικής Κατανομής 5

73 ΚΕΦΑΛΑΙΟ 5ο Εφαρμογή Παραμετρική Ανάλυση Εφαρμογής Με Το Στατιστικό Πακέτο Minitab 5. Εισαγωγή Το στατιστικό πακέτο Minitab έχει τη δυνατότητα να ελέγχει σε ποιο ποσοστό τα δεδομένα μιας εφαρμογής ακολουθούν συγκεκριμένες κατανομές. Η κατανομή Weibull προτάθηκε από τον Waloddi Weibull το 939 και αργότερα χρησιμοποιήθηκε σε μηχανικές και ιατρικές εφαρμογές. Είναι η πιο κατάλληλη για τη μελέτη δεδομένων επιβίωσης, γιατί μπορεί να περιγράψει δεδομένα διάρκειας ζωής, στα οποία συμβαίνει είτε φθορά λόγω χρόνου, είτε αντίθετα βελτίωση στο πέρασμα του χρόνου, είτε ακόμα και σταθερότητα στον κίνδυνο θανάτου. Παρουσιάσαμε τα βασικά στοιχεία της κατανομής Weibull στην παράγραφο 4.4 και στη συνέχεια θα αναλύσουμε την εφαρμογή παραμετρικά με το Minitab. Η εκτίμηση των παραμέτρων λ και p της κατανομής Weibull μπορεί να γίνει: o Με τη μέθοδο ελαχίστων τετραγώνων (Least squares method). o Με τη μέθοδο μεγίστης πιθανοφάνειας (Maximum Likelihood method). o Με διάφορες αριθμητικές μεθόδους. o Με χρήση στατιστικών πακέτων. Το στατιστικό πακέτο MINITAB χρησιμοποιείται για να εκτιμήσει σε ποιο ποσοστό τα δεδομένα μιας εφαρμογής ακολουθούν συγκεκριμένες κατανομές είτε τη μέθοδο ελαχίστων τετραγώνων, είτε τη μέθοδο μεγίστης πιθανοφάνειας. 5

74 5.2 Εφαρμογή Εισάγουμε τα δεδομένα στο Minitab σε τέσσερις στήλες Η πρώτη στήλη (filo) δείχνει το φύλο, (Α-αγόρι, Κ-κορίτσι). Η δεύτερη στήλη (sex) περιέχει τους αριθμούς και 2,..(το δείχνει αγόρι και το 2 δείχνει κορίτσι). Η τρίτη στήλη (t(i)) περιέχει τους χρόνους επιβίωσης. Η τέταρτη στήλη (cens) περιέχει τους αριθμούς και, (το δείχνει περικομμένη παρατήρηση και το δείχνει μη περικομμένη παρατήρηση). ΠΙΝΑΚΑΣ ΕΦΑΡΜΟΓΗΣ 5.2 TMHMA TMHMA 2 filo sex t(i) cens filo sex t(i) cens Κ 2 7+ Κ Κ Α 3+ 3 Α 5+ 3 Κ Κ Κ Κ Κ Κ Κ Κ Α 6 8 Κ Κ Κ Α 7 Α 7 Α 6 Κ 2 4 Κ Κ Α 3 3 Κ Α 4+ 4 Α 6 4 Α 5 5 Α 7 5 Κ 2 6 Α 7+ 6 Κ Κ Α 6+ 8 Κ Α 4+ 9 Κ Κ 2 52

75 Στην παραπάνω εφαρμογή, περικομμένες παρατηρήσεις θεωρήθηκαν: όσοι μαθητές παρέδωσαν το γραπτό τους μέσα σε 7min και υπήρχαν ερωτήματα με τα οποία δεν ασχολήθηκαν. όσοι καθυστέρησαν να παραδώσουν το γραπτό τους πέρα από 7min. Γι αυτούς είναι άγνωστο αν θα έλυναν σωστά την άσκηση σε περισσότερο χρόνο. Μη περικομμένες παρατηρήσεις θεωρήθηκαν: όσοι μαθητές παρέδωσαν το γραπτό τους μέσα σε 7min και απάντησαν σε όλα τα ερωτήματα. όσοι επέστρεψαν το γραπτό τους και δεν απάντησαν σε κανένα ερώτημα. Και τα δύο είδη περικομμένων χρόνων που έχουμε είναι μεμονωμένα περικομμένα δεδομένα ή δεξιά περικομμένα δεδομένα. Αξίζει να σημειωθεί ότι σε ένα τέτοιο «πείραμα», σχεδόν πάντα θα υπάρχουν περικομμένα δεδομένα, αφού κάποιοι μαθητές θα κάνουν λάθος και κάποιοι δε θα προλαβαίνουν να παραδώσουν έγκαιρα το γραπτό τους. Διαφορετικά, θα είχαμε επιτύχει την τέλεια διδασκαλία. Total Time on Test Plot for t(i) TMHMA System Column in cens Scaled Total Time on Test,,8,6,4,2 cens Parameter, MLE MTBF,823529,,,2,4,6 Scaled Failure Number,8, Διάγραμμα 5.2.: Διάγραμμα που δείχνει τον αριθμό περικομμένων και μη περικομμένων παρατηρήσεων ως προς το χρόνο. 53

76 Total Time on Test Plot for t(i) TMHMA 2 System Column in cens Scaled Total Time on Test,,8,6,4,2 cens2 Parameter, MLE MTBF,823529,,,2,4,6 Scaled Failure Number,8, Διάγραμμα 5.2.2: Διάγραμμα που δείχνει τον αριθμό περικομμένων και μη περικομμένων παρατηρήσεων ως προς το χρόνο. 5.3 Μέθοδος Ελαχίστων Τετραγώνων Μέθοδος Μέγιστης Πιθανοφάνειας: Πλεονεκτήματα Α) Η Μέθοδος Ελαχίστων Τετραγώνων εξασφαλίζει καλύτερη γραφική απεικόνιση στο διάγραμμα πιθανοτήτων, επειδή η γραμμή αντιστοιχεί στα σημεία πάνω στο διάγραμμα. Επίσης, για δείγματα με μικρό αριθμό λογοκριμένων παρατηρήσεων, η μέθοδος των ελαχίστων τετραγώνων είναι πιο κατάλληλη από τη μέθοδο της μέγιστης πιθανοφάνειας, ειδικά για μικρά δείγματα. Β) Στη Μέθοδο Μέγιστης Πιθανοφάνειας, οι υπολογισμοί των παραμετρικών κατανομών είναι πιο ακριβείς απ ότι στη μέθοδο των ελαχίστων τετραγώνων. Επιπλέον, επιτρέπει την πραγματοποίηση μιας ανάλυσης, όταν δεν υπάρχουν αποτυχίες.όταν υπάρχει μόνο μια αποτυχία και μερικές δεξιά λογοκριμένες παρατηρήσεις, ο υπολογισμός της παραμέτρου με τη μέγιστη πιθανοφάνεια μπορεί να ακολουθεί την κατανομή Weibull. Τέλος, η μέθοδος αυτή έχει ελκυστικές μαθηματικές ιδιότητες. Όταν είναι δυνατόν, είναι καλό να δοκιμάζονται και οι δύο μέθοδοι. Έτσι, τα αποτελέσματα τους βοηθούν στην καλύτερη εξαγωγή συμπερασμάτων. 54

77 5.4 Παραμετρική Ανάλυση με τη μέθοδο ελαχίστων τετραγώνων Εξετάζουμε, με τη μέθοδο ελαχίστων τετραγώνων (Least squares method), κατά πόσο στα δεδομένα μας προσαρμόζονται οι κατανομές Weibull, λογαριθμοκανονική (Lognormal), εκθετική (Exponential), κανονική (Normal). Για τον έλεγχο της προσαρμογής, η μέθοδος ελαχίστων τετραγώνων χρησιμοποιεί: α) το στατιστικό τεστ Anderson Darling (AD) Μεταξύ δύο ή περισσοτέρων κατανομών, καλύτερη προσαρμογή έχει αυτή με τη μικρότερη τιμή για το (AD). β) το συντελεστή συσχέτισης Pearson (Correlation Coefficient) Μεταξύ δύο ή περισσοτέρων κατανομών, καλύτερη προσαρμογή έχει αυτή με την πλησιέστερη στο ένα () τιμή για το συντελεστή συσχέτισης ΤΜΗΜΑ ο Distribution ID Plot: t(i) (Τμήμα ) Goodness-of-Fit Distribution Anderson-Darling (adj) Correlation - Coefficient Weibull 3,28,966 Lognormal 3,26,958 Exponential 5,473 * Normal 3,259,96 Για το Τμήμα, συμπεραίνουμε ότι οι κατανομές Weibull, λογαριθμοκανονική (Lognormal) και η κανονική (Normal), προσαρμόζονται αρκετά καλά στα δεδομένα μας, ενώ η εκθετική (Exponential) δεν προσαρμόζεται καλά. Με κριτήριο το στατιστικό τεστ Anderson Darling (AD) καλύτερη προσαρμογή έχει η κανονική (Normal). Με κριτήριο το συντελεστή συσχέτισης Pearson (Correlation Coefficient) καλύτερη προσαρμογή έχει η Weibull. Table of Percentiles Standard 95% Normal CI Distribution Percent Percentile Error Lower Upper Weibull 3,626, ,39 4,9225 Lognormal 3,67889, , ,83645 Exponential,695799,8274,47564,5943 Normal 3,3389,773394, ,

78 Weibull 5 4,49, ,835 5,595 Lognormal 5 4,3499, ,5285 5,26377 Exponential 5,355,92556,23,5973 Normal 5 4,295, ,27 5,3356 Weibull 4,66595, ,7383 5,8242 Lognormal 4,6823, , ,5346 Exponential,729425,934,437744,2546 Normal 4,68884, , ,6245 Weibull 5 6,3732, ,747 7,744 Lognormal 5 6,2993, ,5292 7,7875 Exponential 5 4,79875,252 2, ,99629 Normal 5 6,34568, ,6924 7,823 Ο παραπάνω είναι πίνακας ποσοστιαίων σημείων Το Percent %, για παράδειγμα, μας δείχνει το χρόνο κατά τον οποίο αναμένεται να αποτύχει το % του πληθυσμού Μας δίνει ακόμη το τυπικό σφάλμα (Standard Error) για κάθε ποσοστιαίο σημείο. Για κάθε ποσοστιαίο σημείο μας δίνει διάστημα εμπιστοσύνης 95% (95% Normal CI) Η διάμεσος των παρατηρήσεων είναι η τιμή του ποσοστιαίου σημείου 5%. o Για την Weibull η τιμή της διαμέσου είναι , με διάστημα εμπιστοσύνης (5.747, 7.744). o Για την Lognormal η τιμή της διαμέσου είναι , με διάστημα εμπιστοσύνης (5.5292, ). o Για την Normal η τιμή της διαμέσου είναι 6,34568, με διάστημα εμπιστοσύνης (5.6924, 7.823). Table of MTTF Standard 95% Normal CI Distribution Mean Error Lower Upper Weibull 6,28455,3345 5,6626 6,9748 Lognormal 6,4647, ,589 7,

79 Exponential 6,9234,8366 4,5473,5362 Normal 6,34568, ,6924 7,82 Στον παραπάνω πίνακα δίνονται οι τιμές του αναμενόμενου χρόνου αποτυχίας (Mean Time To Failure, MTTF), το τυπικό σφάλμα (Standard Error) και το 95% διάστημα εμπιστοσύνης (95% Normal CI). Για την κατανομή Weibull η τιμή για τον αναμενόμενο χρόνο αποτυχίας είναι 6,28455 με διάστημα εμπιστοσύνης (5.6626, ). Για την κανονική κατανομή (Normal) η τιμή για τον αναμενόμενο χρόνο αποτυχίας είναι 6,34568 με διάστημα εμπιστοσύνης (5.6924, 7.82). Παρατηρούμε ότι και η τιμή της διαμέσου και η τιμή του μέσου ταυτίζονται στην κανονική κατανομή (Normal) με τις αντίστοιχες τιμές στη μη παραμετρική ανάλυση. Ακολουθεί το διάγραμμα πιθανοτήτων, με το οποίο μπορούμε επίσης να συγκρίνουμε ποια κατανομή κάνει την καλύτερη προσαρμογή στα δεδομένα μας. Κάθε διάγραμμα έχει μια ευθεία γραμμή που είναι σχεδιασμένη με βάση την κατανομή που θέλουμε να προσαρμόσουμε. Οι παρατηρήσεις (τα κόκκινα σημεία) είναι τοποθετημένα με μη παραμετρική μέθοδο εκτίμησης. Όσο πιο κοντά στην ευθεία βρίσκονται τα σημεία αυτά, τόσο καλύτερη είναι η προσαρμογή της συγκεκριμένης κατανομής. Percent 9 5 Weibull Probability Plot for t(i) TMHMA LSXY Estimates-Censoring Column in cens Percent Lognormal C orrelation C oefficient Weibull,966 Lognormal,958 Exponential * Normal,96 4 t(i) t(i) 8 Percent 9 5 Exponential Percent Normal, t(i) 4 6 t(i) 8 Διάγραμμα 5.4.: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 57

80 Στο υπόμνημα έχουμε το συντελεστή συσχέτισης και συμπεραίνουμε ότι: η εκθετική δεν είναι κατάλληλη για τα δεδομένα. η Weibull προσαρμόζεται κατά 96,6%, δηλαδή έχει πολύ καλή προσαρμογή. η λογαριθμοκανονική προσαρμόζεται κατά 95,8% και η κανονική προσαρμόζεται κατά 96,%, δηλαδή είναι πολύ καλή και η δική τους προσαρμογή ΤΜΗΜΑ 2ο Distribution ID Plot: t(i) (Τμήμα 2) Goodness-of-Fit Distribution Anderson-Darling (adj) Correlation - Coefficient Weibull 2,358,949 Lognormal 2,436,927 Exponential 2,745 * Normal 2,3,956 Για το Τμήμα 2, συμπεραίνουμε ότι οι κατανομές Weibull, λογαριθμοκανονική (Lognormal) και η κανονική (Normal), προσαρμόζονται αρκετά καλά στα δεδομένα μας, ενώ η εκθετική (Exponential) δεν προσαρμόζεται καλά. Με κριτήριο το στατιστικό τεστ Anderson Darling (AD) και με κριτήριο το συντελεστή συσχέτισης Pearson (Correlation Coefficient) καλύτερη προσαρμογή έχει η κανονική (Normal). Table of Percentiles Standard 95% Normal CI Distribution Percent Percentile Error Lower Upper Weibull,3682,432282, ,67646 Lognormal,6479,36384,24,95 Exponential,76944,229574,428752,3884 Normal -,8575, ,6896 2,547 Weibull 5,8446,77484, ,39337 Lognormal 5,228,55244, ,7556 Exponential 5,392695,766,2882,7473 Normal 5,6,3475 -,5758 3,

81 Weibull,7474,9688, ,82857 Lognormal,7382,588442, ,3749 Exponential,86626,24669,449473,44757 Normal 2,352,7583,4932 4,2222 Weibull 5 6,8982,42 3, ,6238 Lognormal 5 5,9944,6677 3,4772,77 Exponential 5 5,3664, ,957 9,52332 Normal 5 6,3776,957 4, ,829 Ο παραπάνω είναι πίνακας ποσοστιαίων σημείων όπως στο Τμήμα. Η διάμεσος των παρατηρήσεων είναι η τιμή του ποσοστιαίου σημείου 5%. o Για την Weibull η τιμή της διαμέσου είναι , με διάστημα εμπιστοσύνης ( , ). o Για την Lognormal η τιμή της διαμέσου είναι , με διάστημα εμπιστοσύνης (3.4772,.77). o Για την Normal η τιμή της διαμέσου είναι , με διάστημα εμπιστοσύνης ( , 7.829) Table of MTTF Standard 95% Normal CI Distribution Mean Error Lower Upper Weibull 7,47 2, ,776 3,959 Lognormal 9,354 4,5279 3,952 22,3292 Exponential 7, , ,2665 3,7393 Normal 6,3776,957 4, ,829 Στον παραπάνω πίνακα δίνονται οι τιμές του αναμενόμενου χρόνου αποτυχίας (Mean Time To Failure, MTTF), το τυπικό σφάλμα (Standard Error) και το 95% διάστημα εμπιστοσύνης (95% Normal CI). Για την κατανομή Weibull η τιμή για τον αναμενόμενο χρόνο αποτυχίας είναι 7,47 με διάστημα εμπιστοσύνης (3.776, 3.959). Για την κανονική κατανομή (Normal) η τιμή για τον αναμενόμενο χρόνο αποτυχίας είναι 6,3776 με διάστημα εμπιστοσύνης ( , 7.829). 59

82 Παρατηρούμε ότι και η τιμή της διαμέσου και η τιμή του μέσου ταυτίζονται στην κανονική κατανομή (Normal) με τις αντίστοιχες τιμές στη μη παραμετρική ανάλυση. Ακολουθεί το διάγραμμα πιθανοτήτων, με το οποίο μπορούμε επίσης να συγκρίνουμε ποια κατανομή κάνει την καλύτερη προσαρμογή στα δεδομένα μας. Κάθε διάγραμμα έχει μια ευθεία γραμμή που είναι σχεδιασμένη με βάση την κατανομή που θέλουμε να προσαρμόσουμε. Οι παρατηρήσεις (τα κόκκινα σημεία) είναι τοποθετημένα με μη παραμετρική μέθοδο εκτίμησης. Όσο πιο κοντά στην ευθεία βρίσκονται τα σημεία αυτά, τόσο καλύτερη είναι η προσαρμογή της συγκεκριμένης κατανομής. Percent 9 5 Weibull Probability Plot for t(i) TMHMA 2 LSXY Estimates-Censoring Column in cens Percent Lognormal C orrelation C oefficient Weibull,949 Lognormal,927 Exponential * Normal,956 t(i) t(i) Percent 9 5 Exponential Percent Normal, t(i) 5 t(i) 5 Διάγραμμα 5.4.2: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων Στο υπόμνημα έχουμε το συντελεστή συσχέτισης και συμπεραίνουμε ότι: η εκθετική δεν είναι κατάλληλη για τα δεδομένα. η Weibull προσαρμόζεται κατά 94,9%, δηλαδή έχει πολύ καλή προσαρμογή. η λογαριθμοκανονική προσαρμόζεται κατά 92,7% και η κανονική προσαρμόζεται κατά 95,6%, δηλαδή έχει την καλύτερη προσαρμογή. 6

83 5.5 Παραμετρική Ανάλυση με τη μέθοδο μέγιστης πιθανοφάνειας Εξετάζουμε, με τη μέθοδο μεγίστης πιθανοφάνειας (Maximum Likelihood method), κατά πόσο στα δεδομένα μας προσαρμόζονται οι κατανομές Weibull, λογαριθμοκανονική (Lognormal), εκθετική (Exponential), κανονική (Normal). Για τον έλεγχο της προσαρμογής, η μέθοδος μεγίστης πιθανοφάνειας χρησιμοποιεί το στατιστικό τεστ Anderson Darling (AD) Μεταξύ δύο ή περισσοτέρων κατανομών, καλύτερη προσαρμογή έχει αυτή με τη μικρότερη τιμή για το (AD) ΤΜΗΜΑ ο Distribution ID Plot: t(i) (Τμήμα ) Goodness-of-Fit Distribution Anderson-Darling (adj) Weibull 3,535 Lognormal 3,54 Exponential 4,55 Normal 3,5 Για το Τμήμα, συμπεραίνουμε ότι με την μέθοδο μέγιστης πιθανοφάνειας, η λογαριθμοκανονική (Lognormal) κατανομή, προσαρμόζεται καλύτερα στα δεδομένα μας, ενώ η εκθετική (Exponential) έχει τη χειρότερη προσαρμογή. Table of Percentiles Standard 95% Normal CI Distribution Percent Percentile Error Lower Upper Weibull 3,48963,5723 2,536 4,82 Lognormal 3,9674, ,2527 4,7672 Exponential,9394,2899,569,6828 Normal 3,675, ,5657 4,77784 Weibull 5 4,3899, ,5236 5,4533 Lognormal 5 4,46243,357 3, ,2558 Exponential 5,475629,4347,26343, Normal 5 4,4228, , ,286 6

84 Weibull 4,84557, ,6877 5,7766 Lognormal 4,7929, ,8944 5,4773 Exponential,976979,29457,545,7644 Normal 4,8945, ,6966 5,56925 Weibull 5 6,3436, ,7777 6,87965 Lognormal 5 6,54, ,537 6,8475 Exponential 5 6,42736, ,55948,659 Normal 5 6,22753, ,6298 6,82589 Ο παραπάνω είναι πίνακας ποσοστιαίων σημείων Το Percent %, μας δείχνει το χρόνο κατά τον οποίο αναμένεται να αποτύχει το % του πληθυσμού Μας δίνει ακόμη το τυπικό σφάλμα (Standard Error) για κάθε ποσοστιαίο σημείο. Για κάθε ποσοστιαίο σημείο μας δίνει διάστημα εμπιστοσύνης 95% (95% Normal CI) Η διάμεσος των παρατηρήσεων είναι η τιμή του ποσοστιαίου σημείου 5%. o Για τη Normal η τιμή της διαμέσου είναι 6,22753, με διάστημα εμπιστοσύνης (5.6298, ). Table of MTTF Standard 95% Normal CI Distribution Mean Error Lower Upper Weibull 6,2433,277 5, ,787 Lognormal 6,26965, ,6472 7, Exponential 9, , ,3524 6,7438 Normal 6,22753,3529 5,6298 6,8259 Στον παραπάνω πίνακα δίνονται οι τιμές του αναμενόμενου χρόνου αποτυχίας (Mean Time To Failure, MTTF), το τυπικό σφάλμα (Standard Error) και το 95% διάστημα εμπιστοσύνης (95% Normal CI). Όμοια με τη μέθοδο ελαχίστων τετραγώνων Παρατηρούμε ότι και η τιμή της διαμέσου και η τιμή του μέσου ταυτίζονται στην κανονική κατανομή (Normal) με τις αντίστοιχες τιμές στη μη παραμετρική ανάλυση. 62

85 Ακολουθεί το διάγραμμα πιθανοτήτων, με το οποίο μπορούμε επίσης να συγκρίνουμε ποια κατανομή κάνει την καλύτερη προσαρμογή στα δεδομένα μας. Κάθε διάγραμμα έχει μια ευθεία γραμμή που είναι σχεδιασμένη με βάση την κατανομή που θέλουμε να προσαρμόσουμε. Οι παρατηρήσεις (τα κόκκινα σημεία) είναι τοποθετημένα με μη παραμετρική μέθοδο εκτίμησης. Όσο πιο κοντά στην ευθεία βρίσκονται τα σημεία αυτά, τόσο καλύτερη είναι η προσαρμογή της συγκεκριμένης κατανομής. Percent 9 5 Weibull Probability Plot for t(i) TMHMA ML Estimates-Censoring Column in cens Percent Lognormal A nderson-darling (adj) Weibull 3,535 Lognormal 3,54 Exponential 4,55 Normal 3,5 4 t(i) t(i) 8 Percent 9 5 Exponential Percent Normal, t(i) 4 6 t(i) 8 Διάγραμμα 5.5.: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη Μέθοδο Μέγιστης Πιθανοφάνειας Στο υπόμνημα έχουμε το συντελεστή Anderson Darling (AD) και συμπεραίνουμε ότι με τη μέθοδο μέγιστης πιθανοφάνειας, η λογαριθμοκανονική (Lognormal) κατανομή προσαρμόζεται καλύτερα στα δεδομένα μας, ενώ η εκθετική (Exponential) έχει τη χειρότερη προσαρμογή ΤΜΗΜΑ 2ο Distribution ID Plot: t(i) (Τμήμα 2) Goodness-of-Fit Distribution Anderson-Darling (adj) Weibull 2,57 Lognormal 2,478 Exponential 2,56 63

86 Normal 2,448 Για το Τμήμα 2, συμπεραίνουμε ότι με την μέθοδο μέγιστης πιθανοφάνειας, η κανονική (Normal) κατανομή προσαρμόζεται καλύτερα στα δεδομένα μας, ενώ η εκθετική (Exponential) έχει τη χειρότερη προσαρμογή. Table of Percentiles Standard 95% Normal CI Distribution Percent Percentile Error Lower Upper Weibull,7455,43747,2378 2,3538 Lognormal,8539,3424,3539,8478 Exponential,864329,273325,46556,664 Normal -,3436,384-2,876 2,2773 Weibull 5,62379,639, ,4679 Lognormal 5,438,45459, ,66672 Exponential 5,4422,39495,237348,89847 Normal 5,4874, , ,4277 Weibull 2,2965,674334,299 4,8294 Lognormal,94368,526252,433 3,3436 Exponential,96,286534,487532,6843 Normal 2,445,847393, ,36 Weibull 5 5,68496, ,2853 7,665 Lognormal 5 5,72722,3476 3,692 9,833 Exponential 5 5,967,8855 3,2738,789 Normal 5 5,8254, , ,247 Ο παραπάνω είναι πίνακας ποσοστιαίων σημείων όπως στο Τμήμα. Η διάμεσος των παρατηρήσεων είναι η τιμή του ποσοστιαίου σημείου 5%. o Για τη Normal η τιμή της διαμέσου είναι 5,8254, με διάστημα εμπιστοσύνης (4,36338, 7,247) Table of MTTF Standard 95% Normal CI 64

87 Distribution Mean Error Lower Upper Weibull 6,693, ,3936 8,227 Lognormal 8,7232 2,7224 4,2539 5,7 Exponential 8,6 2,7956 4, ,9835 Normal 5,8254, , ,247 Στον παραπάνω πίνακα δίνονται οι τιμές του αναμενόμενου χρόνου αποτυχίας (Mean Time To Failure, MTTF), το τυπικό σφάλμα (Standard Error) και το 95% διάστημα εμπιστοσύνης (95% Normal CI). Όμοια με τη μέθοδο ελαχίστων τετραγώνων Παρατηρούμε ότι και η τιμή της διαμέσου και η τιμή του μέσου ταυτίζονται στην κανονική κατανομή (Normal) με τις αντίστοιχες τιμές στη μη παραμετρική ανάλυση. Ακολουθεί το διάγραμμα πιθανοτήτων, με το οποίο μπορούμε επίσης να συγκρίνουμε ποια κατανομή κάνει την καλύτερη προσαρμογή στα δεδομένα μας, όπως στο Τμήμα. Percent 9 5 Weibull Probability Plot for t(i) TMHMA 2 ML Estimates-Censoring Column in cens2 Percent Lognormal A nderson-darling (adj) Weibull 2,57 Lognormal 2,478 Exponential 2,56 Normal 2,448 t(i) t(i) Percent 9 5 Exponential Percent Normal, t(i) 4 t(i) 8 2 Διάγραμμα 5.5.2: Διάγραμμα πιθανοτήτων για τις κατανομές Weibull, lognormal, εκθετική, κανονική, της εφαρμογής 5.2 με τη Μέθοδο Μέγιστης Πιθανοφάνειας Στο υπόμνημα έχουμε το συντελεστή Anderson Darling (AD) και συμπεραίνουμε ότι με τη μέθοδο μέγιστης πιθανοφάνειας, η κανονική (Νormal) κατανομή, προσαρμόζεται καλύτερα στα δεδομένα μας, ενώ η εκθετική (Exponential) έχει την χειρότερη προσαρμογή. 65

88 5.6 Προσαρμογή της κατανομής για το Τμήμα και το Τμήμα ΤΜΗΜΑ ο o Με τη μέθοδο ελαχίστων τετραγώνων η Weibull έχει την καλύτερη προσαρμογή. Προσαρμογή της κατανομής Weibull Εξετάζουμε, με τη μέθοδο ελαχίστων τετραγώνων (Least squares method), την κατανομή Weibull και θα έχουμε τις εκτιμήσεις για τις παραμέτρους της p, λ. Distribution Analysis: t(i) ΤΜΗΜΑ Variable: t(i) ΤΜΗΜΑ Censoring Information Count Uncensored value Right censored value 8 Censoring value: cens = Estimation Method: Least Squares (failure time(x) on rank(y)) Distribution: Weibull Parameter Estimates Standard 95% Normal CI Parameter Estimate Error Lower Upper Shape 6,422, ,3845,348 Scale 6,7756, ,7866 7,54345 Log-Likelihood = -9,365 Goodness-of-Fit Anderson-Darling (adjusted) = 3,28 Correlation Coefficient =,966 Η εκτίμηση για την παράμετρο μορφής (Shape) είναι p = 6,422 και για την παράμετρο κλίμακας (Scale) λ = 6,7756. Characteristics of Distribution Standard 95% Normal CI Estimate Error Lower Upper Mean(MTTF) 6,28455, ,6626 6,9748 Standard Deviation,2994,345858, ,874 66

89 Median 6,3732, ,747 7,744 First Quartile(Q) 5,5982, , ,3465 Third Quartile(Q3) 7,477,4422 6, ,6476 Interquartile Range(IQR),63788,499354,992 2,977 Table of Percentiles Standard 95% Normal CI Percent Percentile Error Lower Upper 3,626, ,39 4, ,55, , , ,79962, ,7527 5,37 4 3,9883, , , ,49, ,835 5, ,2725, , , ,38674,5749 3, , ,48873, ,529 5, ,587,5494 3, , ,66595, ,7383 5, ,28297,4385 4,5366 6, ,7938, ,246 6, ,599,3434 5,4227 6, ,3732, ,747 7, ,6743, ,37 7, ,98283,475 6, , ,32646, ,4452 8, ,77386,6557 6,6733 9, ,8364, ,763 9, ,89378, , , ,9637, ,7672 9, ,3597, , , ,992, ,8337 9, ,274,7486 6, , ,33428, ,92277, ,48659, ,98525,36 67

90 99 8,7882, ,779,743 Percent Probability Plot for t(i) TMHMA Weibull - 95% CI Censoring Column in cens - LSXY Estimates Table of Statistics Shape 6,422 Scale 6,7756 Mean 6,28455 StDev,2994 Median 6,3732 IQ R,63788 Failure Censor 8 A D* 3,28 C orrelation, t(i) Διάγραμμα 5.6.: Διάγραμμα πιθανοτήτων για την κατανομή Weibull, της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων Το Overview Plot της κατανομής Weibull δείχνει τα ακόλουθα στοιχεία: Το πρώτο διάγραμμα δείχνει τη μορφή της κατανομής που επιλέξαμε, ακόμα κι αν δεν είναι η πιο κατάλληλη για τα δεδομένα. Το δεύτερο είναι το διάγραμμα πιθανοτήτων για τη Weibull που έχουμε ήδη εξηγήσει. Το τρίτο είναι το διάγραμμα της συνάρτησης επιβίωσης για την κατανομή που επιλέξαμε και δείχνει γραφικά την πιθανότητα ένας μαθητής να μη βρει τη σωστή απάντηση μέχρι το χρόνο t, δηλαδή να βρει τη λύση σε χρόνο μεγαλύτερο ή ίσο του t. Το τελευταίο είναι το διάγραμμα της συνάρτησης κινδύνου για την κατανομή που επιλέξαμε και δείχνει γραφικά την πιθανότητα ένας μαθητής που δεν έχει βρει τη σωστή λύση μέχρι το χρόνο t, να μην τη βρει και κατά το αμέσως επόμενο απειροστό διάστημα. Distribution Overview Plot: t(i) ΤΜΗΜΑ Goodness-of-Fit Distribution Anderson-Darling (adj) Correlation - Coefficient Weibull 3,28,966 68

91 PDF,3,2,, 4 Distribution Overview Plot for t(i) TMHMA LSXY Estimates-Censoring Column in cens Probability Density Function 6 t(i) 8 Percent Weibull t(i) 6 8 Table of Statistics Shape 6,422 Scale 6,7756 Mean 6,28455 StDev,2994 Median 6,3732 IQ R,63788 F ailure Censor 8 A D* 3,28 C orrelation,966 Surv iv al Function Hazard Function 3 Percent 5 Rate t(i) t(i) 8 Διάγραμμα 5.6.2: Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου, για την κατανομή Weibull της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 2o Με τη Μέθοδο Μέγιστης Πιθανοφάνειας η Lognormal έχει την καλύτερη προσαρμογή. Προσαρμογή της κατανομής Lognormal Εξετάζουμε, με τη Μέθοδο Μέγιστης Πιθανοφάνειας (Maximum Likelihood method), την κατανομή Lognormal και θα έχουμε τις εκτιμήσεις για τις παραμέτρους της μ, σ 2. Distribution Analysis: t(i) ΤΜΗΜΑ Variable: t(i) ΤΜΗΜΑ Censoring Information Count Uncensored value Right censored value 8 Censoring value: cens = Estimation Method: Maximum Likelihood Distribution: Lognormal Parameter Estimates Standard 95% Normal CI Parameter Estimate Error Lower Upper Location,8668,542683,732,9234 Scale,9546,462,2927,

92 Log-Likelihood = -9,64 Goodness-of-Fit Anderson-Darling (adjusted) = 3,54 Η εκτίμηση για την παράμετρο μορφής (Location) είναι,8668 και για την παράμετρο κλίμακας (Scale),9546. Characteristics of Distribution Standard 95% Normal CI Estimate Error Lower Upper Mean(MTTF) 6,26965, ,6472 7,97 Standard Deviation,23524,294873,773667,9728 Median 6,54, ,537 6,8475 First Quartile(Q) 5,39275, , ,227 Third Quartile(Q3) 7,677, ,7378 7,97487 Interquartile Range(IQR),6242,37535,3844 2,5398 Table of Percentiles Standard 95% Normal CI Percent Percentile Error Lower Upper 3,9674, ,2527 4, ,29, , , ,2662, ,68 5, ,372, , , ,46243,357 3, , ,5457, ,937 5, ,62, , , ,6762, ,634 5, ,73526,3329 4,2877 5,4384 4,7929, ,8944 5, ,297, ,6565 5, ,5534,3324 4,9894 6, ,85467,3238 5, ,58 5 6,54, ,537 6,8475 7

93 6 6,4637,3694 5, , ,8424, ,35 7, ,2494, ,3263 8, ,89926, ,723 9, ,995, , , ,998, ,8342 9, ,2443, , , ,3386, , , ,47962, ,599, ,65657, ,4729, ,8798,984 7,26637, ,8398, ,4264, ,68576,4572 7,6849 2,23 Percent Probability Plot for t(i) TMHMA Lognormal - 95% CI Censoring Column in cens - ML Estimates Table of Statistics Loc,8668 Scale,9546 Mean 6,26965 StDev,23524 Median 6,54 IQ R,6242 Failure Censor 8 A D* 3, t(i) Διάγραμμα 5.6.3: Διάγραμμα πιθανοτήτων για την κατανομή Lognormal, της εφαρμογής 5.2 με τη Μέθοδο Μέγιστης Πιθανοφάνειας Το Overview Plot της κατανομής Lognormal δείχνει τα ακόλουθα στοιχεία: Το πρώτο διάγραμμα δείχνει τη μορφή της κατανομής που επιλέξαμε, ακόμα κι αν δεν είναι η πιο κατάλληλη για τα δεδομένα. Το δεύτερο είναι το διάγραμμα πιθανοτήτων για τη Lognormal που έχουμε ήδη εξηγήσει. 7

94 Το τρίτο είναι το διάγραμμα της συνάρτησης επιβίωσης για την κατανομή που επιλέξαμε και δείχνει γραφικά την πιθανότητα ένας μαθητής να μη βρει τη σωστή απάντηση μέχρι το χρόνο t, δηλαδή να βρει τη λύση σε χρόνο μεγαλύτερο ή ίσο του t. Το τελευταίο είναι το διάγραμμα της συνάρτησης κινδύνου για την κατανομή που επιλέξαμε και δείχνει γραφικά την πιθανότητα ένας μαθητής που δεν έχει βρει τη σωστή λύση μέχρι το χρόνο t, να μην τη βρει και κατά το αμέσως επόμενο απειροστό διάστημα. Distribution Overview Plot: t(i) ΤΜΗΜΑ Goodness-of-Fit Distribution Anderson-Darling (adj) Lognormal 3,54 PDF,3,2, Distribution Overview Plot for t(i) TMHMA ML Estimates-Censoring Column in cens Probability Density F unction Percent Lognormal Table of Statistics Loc,8668 Scale,9546 Mean 6,26965 StDev,23524 Median 6,54 IQ R,6242 Failure Censor 8 A D* 3,54, 4 6 t(i) t(i) 8 Surv iv al Function,5 Hazard Function Percent 5 Rate,,5 4 6 t(i) 8, 4 6 t(i) 8 Διάγραμμα 5.6.4: Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου, για την κατανομή Lognormal της εφαρμογής 5.2 με τη Μέθοδο Μέγιστης Πιθανοφάνειας 72

95 5.6.2 ΤΜΗΜΑ 2ο Με τη μέθοδο ελαχίστων τετραγώνων η κανονική έχει την καλύτερη προσαρμογή. Προσαρμογή της κατανομής Normal Εξετάζουμε, με τη μέθοδο ελαχίστων τετραγώνων (Least squares method), την κατανομή Normal και θα έχουμε τις εκτιμήσεις για τις παραμέτρους της μ, σ. Distribution Analysis: t(i) ΤΜΗΜΑ 2 Variable: t(i) ΤΜΗΜΑ 2 Censoring Information Count Uncensored value Right censored value 9 Censoring value: cens2 = Estimation Method: Least Squares (failure time(x) on rank(y)) Distribution: Normall Parameter Estimates Standard 95% Normal CI Parameter Estimate Error Lower Upper Mean 6,3776,957 4, ,829 StDev 3,62,8925, ,429 Log-Likelihood = -28,847 Goodness-of-Fit Anderson-Darling (adjusted) = 2,3 Correlation Coefficient =,956 Η εκτίμηση για το μέσο (Mean) είναι μ = 6,3776 και για την τυπική απόκλιση (StDev) s = 3,62. Characteristics of Distribution Standard 95% Normal CI Estimate Error Lower Upper Mean(MTTF) 6,3776,957 4, ,829 Standard Deviation 3,62,8925, ,429 Median 6,3776,957 4, ,829 First Quartile(Q) 3,9724, , ,

96 Third Quartile(Q3) 8,32,3 5,553,6532 Interquartile Range(IQR) 4,37,2343 2, ,359 Table of Percentiles Standard 95% Normal CI Percent Percentile Error Lower Upper -,8575, ,6896 2, ,2522,6947-3,4253 2,9239 3,278585, , ,936 4,676987,3985-2,493 3,43 5,6,3475 -,5758 3, ,27689,2594 -,7688 3,7366 7,5874,986 -, , ,73529,524 -, , ,93224,83 -, ,38 2,352,7583,4932 4, ,4663,86434, , ,432,844 2,8627 6, ,2699, ,6462 6, ,3776,957 4, , ,8354,38 4, , ,64353,9835 5,2948 9, ,6489,4262 5,82856,42 9 9,962, ,526 3,44 9,433,873 6,638 3, ,342, ,6976 3, ,5568,9588 6,872 4,38 94,7986,982 6,9767 4, ,745 2,5388 7,4893 5, 96,3985 2,45 7,295 5,595 97,7969 2, , , ,3265 2,3946 7, , ,63 2, ,73 8,352 74

97 Percent Probability Plot for t(i) TMHMA 2 Normal - 95% CI Censoring Column in cens2 - LSXY Estimates Table of Statistics Mean 6,3776 StDev 3,62 Median 6,3776 IQ R 4,37 Failure Censor 9 A D* 2,3 C orrelation, t(i) 5 2 Διάγραμμα 5.6.5: Διάγραμμα πιθανοτήτων για την κατανομή Normal, της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων Το Overview Plot της κατανομής Normal δείχνει τα ακόλουθα στοιχεία: Το πρώτο διάγραμμα δείχνει τη μορφή της κατανομής που επιλέξαμε, ακόμα κι αν δεν είναι η πιο κατάλληλη για τα δεδομένα. Το δεύτερο είναι το διάγραμμα πιθανοτήτων για τη Normal που έχουμε ήδη εξηγήσει. Το τρίτο είναι το διάγραμμα της συνάρτησης επιβίωσης για την κατανομή που επιλέξαμε και δείχνει γραφικά την πιθανότητα ένας μαθητής να μη βρει τη σωστή απάντηση μέχρι το χρόνο t, δηλαδή να βρει τη λύση σε χρόνο μεγαλύτερο ή ίσο του t. Το τελευταίο είναι το διάγραμμα της συνάρτησης κινδύνου για την κατανομή που επιλέξαμε και δείχνει γραφικά την πιθανότητα ένας μαθητής που δεν έχει βρει τη σωστή λύση μέχρι το χρόνο t, να μην τη βρει και κατά το αμέσως επόμενο απειροστό διάστημα. Distribution Overview Plot: t(i) ΤΜΗΜΑ 2 Goodness-of-Fit Distribution Anderson-Darling (adj) Correlation - Coefficient Normal 2,3,956 75

98 PDF,2,8,4 Distribution Overview Plot for t(i) TMHMA 2 LSXY Estimates-Censoring Column in cens Probability Density Function Percent Normal Table of Statistics Mean 6,3776 StDev 3,62 Median 6,3776 IQ R 4,37 F ailure Censor 9 A D* 2,3 C orrelation,956, 5 t(i) 5 5 t(i) 5 Surviv al Function Hazard Function,75 Percent 5 Rate,5,25 5 t(i) 5, 5 t(i) 5 Διάγραμμα 5.6.6: Πυκνότητας Πιθανότητας, Συνάρτηση Επιβίωσης, Συνάρτηση Κινδύνου, για την κατανομή Normal της εφαρμογής 5.2 με τη Μέθοδο Ελαχίστων Τετραγώνων 76

99 ΚΕΦΑΛΑΙΟ 6ο Μη Παραμετρικές Μέθοδοι Εκτίμησης Συναρτήσεων Επιβίωσης 6. Εισαγωγή Βασικό πρόβλημα της Ανάλυσης Επιβίωσης είναι να εκτιμηθεί κάποια από τις βασικές συναρτήσεις, από το δείγμα των δεδομένων. Οι μη παραμετρικές μέθοδοι χρησιμοποιούνται, όταν στον πληθυσμό που μελετάται δεν προσαρμόζεται συγκεκριμένη κατανομή ούτε κάποιο γνωστό μοντέλο. Επίσης, εφαρμόζονται, όταν είναι ασύμφορη μια μελέτη αναζήτησης τέτοιου μοντέλου. Τότε, η συνηθέστερη περίπτωση είναι να αφήσουμε τα δεδομένα να δείξουν το πρότυπό τους. Οι μη παραμετρικές μέθοδοι είναι πιο απλές και ευνόητες, αλλά παρουσιάζουν το μειονέκτημα να είναι λιγότερο αποτελεσματικές και αξιόπιστες σε προβλέψεις. Τις μη παραμετρικές μεθόδους εκτίμησης της συνάρτησης επιβίωσης τις χρησιμοποιούμε, τόσο στην περίπτωση που το δείγμα είναι πλήρες (δηλαδή, δεν περιέχει περικομμένες παρατηρήσεις), όσο και στην περίπτωση που το δείγμα δεν είναι πλήρες (δηλαδή, περιέχει περικομμένες παρατηρήσεις). 6.2 Περίπτωση η: Μη Παραμετρικές Μέθοδοι Εκτίμησης των Συναρτήσεων Επιβίωσης για Πλήρες Δείγμα. 77

100 Έστω t, t 2, t 3,, t n οι ακριβείς χρόνοι ζωής n μονάδων μιας έρευνας. Η ερευνώμενη μονάδα αποτελεί ένα τυχαίο δείγμα από έναν πληθυσμό μονάδων με ίδια χαρακτηριστικά με τις υπό μελέτη. Προκειμένου να εκτιμήσουμε τη συνάρτηση επιβίωσης των n μονάδων, εργαζόμαστε ως εξής: t t2 3 Κατατάσσουμε τους χρόνους επιβίωσης,, t,, κατά αύξουσα τάξη μεγέθους: tn t () t (2) t (3) t (n), όπου o το t αντιστοιχεί στη μικρότερη τιμή των t, i =, 2, 3, n και () o το t αντιστοιχεί στη μεγαλύτερη τιμή των t, i =, 2, 3, n. (n) Από τον ορισμό της συνάρτησης επιβίωσης στο χρόνο, προκύπτει ότι αυτή μπορεί να εκτιμηθεί από τον τύπο: o όπου, n S ( t (i) ) = n i = i n n i, είναι ο αριθμός των μονάδων του δείγματος που επιβίωσαν για χρόνο μεγαλύτερο από t (i). Ισοβαθμίες (tied observations) i i t (i) έχουμε, αν δύο ή περισσότερες τιμές των t (i) είναι ίσες. Τότε, ως κοινή εκτίμηση των τιμών της συνάρτησης επιβίωσης, επιλέγεται εκείνη που αντιστοιχεί στη μεγαλύτερη τιμή του i. o (συντηρητική εκτίμηση) δηλαδή επιλέγεται η μικρότερη εκτίμηση της συνάρτησης επιβίωσης. Για παράδειγμα, αν t (3) = t (4) = t τότε S (5) ( t (3) ) = S ( t ) = S (4) ( t (5) ) = n 5. n Στην αρχή της έρευνας όλες οι μονάδες λειτουργούν και καμία δεν επιβιώνει για χρόνο μεγαλύτερο από t (n), οπότε έχουμε ότι: S ( t () ) = n n o δηλαδή στην αρχή των χρόνων δεν έχουμε κανένα θάνατο και S ( t (n) ) = = n n = n 78

101 o δηλαδή μετά το χρόνο t (n) καμία μονάδα δε θα επιβιώσει. Η S ( t (i) ) είναι μια βηματική συνάρτηση ( step function), όπως υποδηλώνεται από τους S n i i ( t(i) ) = =, S ( t ) =, S () ( t (n) ) =, n n η οποία ξεκινά από την τιμή και φθίνει με βήμα n μέχρι το. o Αν κάνουμε το διάγραμμα της S ( t ) ως προς το χρόνο t, μπορούμε, με τη βοήθεια αυτού, να υπολογίσουμε τα κυριότερα στατιστικά μέτρα της τυχαίας μεταβλητής που περιγράφει το χρόνο επιβίωσης. (i) (i) 6.3 Περίπτωση 2η: Μη Παραμετρικές Μέθοδοι Εκτίμησης των Συναρτήσεων Επιβίωσης για Δείγμα με Περικομμένες Παρατηρήσεις. Επειδή στην πράξη τα δείγματα των δεδομένων διάρκειας ζωής συνήθως δεν είναι πλήρη, αλλά έχουμε λογοκρισία στους χρόνους επιβίωσης, η συνάρτηση επιβίωσης μπορεί να εκτιμηθεί με τη μέθοδο product limit (που προτάθηκε από τους Kaplan και Meier το 958) και αποδεικνύεται ότι: S ( t (i) ) = Π r n r n r+ o όπου r είναι θετικός ακέραιος για τον οποίο ισχύει t (r) t(i) o και t (r) είναι μη περικομμένη παρατήρηση. Ισοβαθμίες (tied observations) έχουμε αν δύο ή περισσότερες τιμές των t (i) είναι ίσες Σε αυτή την περίπτωση οι αντίστοιχες εκτιμήσεις της συνάρτησης επιβίωσης θα πρέπει να ταυτίζονται. Συμβατικά επιλέγεται εκείνη που αντιστοιχεί στη μεγαλύτερη τιμή του i o (συντηρητική εκτίμηση) δηλαδή επιλέγεται η μικρότερη εκτίμηση της συνάρτησης επιβίωσης. Για παράδειγμα, αν t (3) = t (4) = t (5) και η t είναι περικομμένη, τότε S (2) ( t (3) ) = S ( t (4)) = S ( t (5) ) = n n + n 3 n 3+ n 4 n 4+ n 5 n 5+ = n n 3 n n 2 n 4 n 3 n 5 n 4. 79

102 Η διακύμανση, είτε το δείγμα είναι πλήρες είτε υπάρχει περικοπή, υπολογίζεται από τον τύπο του Greenwood (926): Var[S ( t )] [ S ( t )] (i) (i) 2 Σ r (n r)(n r + ) o Προφανώς, η διακύμανση είναι διαφορετική για κάθε t (i). Το τυπικό σφάλμα της εκτίμησης της S(t) είναι: SE[S ( t )] = (i) Var[S(t (i))] Υπολογίζοντας το τυπικό σφάλμα της S(t), μπορούμε να κατασκευάσουμε μια 95% ζώνη εμπιστοσύνης για την S(t), με βάση τον τύπο: S ( t ) ±,96 SE[S ( t )] = S ( t ) ±,96 Var[S(t (i))] (i) (i) Η μέση ζωή των υπό μελέτη μονάδων ταυτίζεται με τη μέση υπολειπόμενη ζωή τους τη χρονική στιγμή t =, δηλαδή μ μ x (). Όμως, έχει αποδειχθεί (Πανεπιστημιακές Παραδόσεις Κατερίνα Δημάκη 2) ότι: μ x (t) = S(x) dx S(t), t, επομένως, t (i) μ = S() t S(x) dx = S(x) dx, αφού S( ) = t o Δηλαδή, το εμβαδόν κάτω από την εκτιμηθείσα συνάρτηση επιβίωσης ισούται αριθμητικά με την εκτίμηση μ. Έστω m το πλήθος των μη περικομμένων διακεκριμένων παρατηρήσεων και () (2) t t (3) (m) t t οι διατεταγμένες τιμές αυτών. Τότε η εκτίμηση της μέσης τιμής μ δίνεται από τη σχέση: () μ =, t + S () (2) () ( t )( t t ) + + S (m ) (m) (m ) ( t )( t t ) o Δηλαδή, το άθροισμα των εμβαδών όλων των ορθογωνίων κάτω από την εκτιμηθείσα καμπύλη επιβίωσης S (t), ισούται αριθμητικά με την εκτίμηση μ. Προϋποθέσεις για τον υπολογισμό του μ o Πρέπει η εκτιμηθείσα καμπύλη επιβίωσης S (t) να είναι κλειστή. (δηλαδή η τελευταία παρατήρηση να είναι μη περικομμένη) o Αν δεν ισχύει αυτό, 8

103 o θεωρούμε συμβατικά ότι η καμπύλη κλείνει σε κάποια επόμενη (m) χρονική στιγμή ( t + ) και εκφράζουμε τον τύπο στην περίπτωση της υποθετικής χρονικής τιμής. Η διακύμανση της εκτίμησης μ προσδιορίζεται από τη σχέση: Var( μ) = Σ r 2 Ar (n r)(n r + ) o όπου το r παίρνει εκείνες τις ακέραιες τιμές, για τις οποίες το t (r) αντιστοιχεί σε ακριβή χρόνο επιβίωσης o και το Α r ταυτίζεται αριθμητικά με το εμβαδόν κάτω από την εκτιμηθείσα καμπύλη S (t) δεξιά από το t (r). Οπότε το Α r, τάξης k, εκφραζόμενο από τις μη περικομμένες παρατηρήσεις είναι: A k = S (k) (k+ ) (k) ( t )( t t ) + S (k+ ) ( t )( t o Προφανώς έχουμε ότι: A r = m k= r (k+ 2) A k (k+ ) t Αν δεν υπάρχουν περικομμένες παρατηρήσεις, o ο τύπος για το μ ανάγεται στον: ) + + S (m ) (m) (m ) ( t )( t t ) t = t n i o και ο τύπος για τη διακύμανση της εκτίμησης μ ανάγεται στον: Var( μ ) = Σ r (t t) i n 2 Είναι γνωστό από την κλασική στατιστική συμπερασματολογία ότι η Var( μ) είναι μη αμερόληπτη εκτιμήτρια. Για να διορθωθεί η μεροληψία, οι Kaplan - Meier προτείνουν τις παρακάτω σχέσεις: o Var( μ ) = o Var( μ ) = m m Σ r 2 Ar (n r)(n r + ) o όπου m το πλήθος των μη περικομμένων παρατηρήσεων. n n Σ r (ti t) = 2 n n Σ r (t t) o όπου n το μέγεθος του δείγματος. i n 8

104 ΣΧΟΛΙΟ Υπολογισμός του Μέσου Χρόνου Επιβίωσης Ο μέσος χρόνος επιβίωσης μ, ή αλλιώς μέση διάρκεια ζωής, εκτιμάται από τη γραφική παράσταση της συνάρτησης επιβίωσης, υπολογίζοντας το εμβαδόν που περικλείεται από την καμπύλη επιβίωσης και τους ημιάξονες Οχ, Οy. Διάγραμμα 6.: Εκτίμηση του μέσου χρόνου Επιβίωσης, με το Minitab Αν η τελευταία παρατήρηση είναι μη περικομμένη, η καμπύλη επιβίωσης είναι μια κλειστή καμπύλη και εύκολα υπολογίζεται το παραπάνω εμβαδόν. Αν η τελευταία παρατήρηση είναι περικομμένη, η καμπύλη επιβίωσης είναι ανοικτή καμπύλη. Τότε παίρνουμε τον αμέσως επόμενο φυσικό από την τελευταία περικομμένη τιμή και τελειώνουμε εκεί τον υπολογισμό του εμβαδού. 6.4 Υπολογισμός της Διαμέσου των Δεδομένων Επιβίωσης Η κατανομή των χρόνων επιβίωσης συνήθως είναι θετικά μετατοπισμένη, γι αυτό η διάμεσος είναι η καταλληλότερη έκφραση της θέσης της κατανομής. Ο διάμεσος χρόνος επιβίωσης t (m) είναι ο χρόνος για τον οποίο ισχύει P(X > t (m) ) = S(t (m) ) =,5, Δηλαδή ο χρόνος πέρα από τον οποίο αναμένεται να επιβιώσει το 5% των ατόμων του υπό μελέτη πληθυσμού ή αλλιώς ο χρόνος θανάτου με πιθανότητα 5%. Η συνάρτηση επιβίωσης είναι μια βηματική συνάρτηση και ο υπολογισμός του χρόνου με ακριβή πιθανότητα,5 δεν είναι δυνατός, γι αυτό: 82

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F Άσκηση 0, σελ. 9 από το βιβλίο «Μοντέλα Αξιοπιστίας και Επιβίωσης» της Χ. Καρώνη (i) Αρχικά, εισάγουμε τα δεδομένα στο minitab δημιουργώντας δύο μεταβλητές: τη x για τον άτυπο όγκο και την y για τον τυπικό

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2 ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική

Διαβάστε περισσότερα

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ.

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ. ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό 2016 2017 Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ. Πέτρος Πιστοφίδης Εισαγωγή

Διαβάστε περισσότερα

ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΙ ΑΞΙΟΛΟΓΗΣΗΣ ΤΗΣ ΥΠΟΘΕΣΗΣ ΤΟΥ ΑΝΑΛΟΓΙΚΟΥ ΚΙΝ ΥΝΟΥ

ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΙ ΑΞΙΟΛΟΓΗΣΗΣ ΤΗΣ ΥΠΟΘΕΣΗΣ ΤΟΥ ΑΝΑΛΟΓΙΚΟΥ ΚΙΝ ΥΝΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΙ ΑΞΙΟΛΟΓΗΣΗΣ ΤΗΣ ΥΠΟΘΕΣΗΣ ΤΟΥ ΑΝΑΛΟΓΙΚΟΥ ΚΙΝ ΥΝΟΥ Γεώργιος

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. iii

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. iii ΕΥΧΑΡΙΣΤΙΕΣ Ευχαριστώ τον Προϊστάμενο της Διεύθυνσης Δευτεροβάθμιας εκπαίδευσης του νομού Χανίων κύριο Βασίλειο Γλυμιδάκη, για τη διευκόλυνση που μου παρείχε έτσι ώστε να έχω πρόσβαση στα δεδομένα κάθε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Ανάλυση επιβίωσης (survival analysis)

Ανάλυση επιβίωσης (survival analysis) Hippokratia 2014 Ανάλυση επιβίωσης (survival analysis) Κων/νος Α. Τουλής, MD MRes MSc PhD Ενδοκρινολόγος, 424 ΓΣΝΕ Τι είναι η ανάλυση επιβίωσης; Η ανάλυση επιβίωσης (survival analysis) είναι μια ομάδα

Διαβάστε περισσότερα

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 )

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 ) Μέρος IV Πολυδιάστατες τυχαίες μεταβλητές Πιθανότητες & Στατιστική 07 Τμήμα Μηχανικών Η/Υ & Πληροφορικής Παν. Ιωαννίνων Δ5 ( ) Πολυδιάστατες μεταβλητές Πολλά ποσοτικά χαρακτηριστικά που σχετίζονται με

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ Διπλωματική

Διαβάστε περισσότερα

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Εισαγωγή στην Κανονική Κατανομή Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Ένα πρόβλημα Πρόβλημα: Ένας μαθητής είχε επίδοση στο τεστ Μαθηματικών 18 και στο τεστ

Διαβάστε περισσότερα

S T (x) = exp. (α) m n q x = m+n q x m q x. (β) m n q x = m p x m+n p x. (γ) m n q x = m p x n q x+m. tp x = S Tx (t) = S T (x + t) { x+t

S T (x) = exp. (α) m n q x = m+n q x m q x. (β) m n q x = m p x m+n p x. (γ) m n q x = m p x n q x+m. tp x = S Tx (t) = S T (x + t) { x+t ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕ ΚΑΤΕΥΘΥΝΣΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΑ ΜΑΘΗΜΑΤΙΚΑ ΑΣΚΗΣΕΙΣ ΑΝΑΛΥΣΗΣ ΘΝΗΣΙΜΟΤΗΤΑΣ ΙΩΑΝΝΗΣ Σ. ΣΤΑΜΑΤΙΟΥ ΣΑΜΟΣ, ΕΑΡΙΝΟ ΕΞΑΜΗΝΟ 2013-2014

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ιασωνίδου Χ. Μαριάννα Επιβλέπουσα: Κολυβά-Μαχαίρα Φωτεινή Αν. Καθηγήτρια Α.Π.Θ. Εγκρίθηκε από την τ

ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ιασωνίδου Χ. Μαριάννα Επιβλέπουσα: Κολυβά-Μαχαίρα Φωτεινή Αν. Καθηγήτρια Α.Π.Θ. Εγκρίθηκε από την τ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ιασωνίδου Χ. Μαριάννα Επιβλέπουσα: Κολυβά-Μαχαίρα Φωτεινή Αν. Καθηγήτρια Α.Π.Θ. Θεσσαλονίκη, Μάιος 2017 ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαβάστε περισσότερα

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ 1.Έστω ο δειγματικός χώρος Ω = { 1,,, K,10} με ισοπίθανα απλά ενδεχόμενα. Να 4 βρείτε την πιθανότητα ώστε η συνάρτηση f ( x ) = x 4x + λ να

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ ΚΑΤΑΝΟΜΈΣ ΚΕΦΑΛΑΙΟ 8 81 Εισαγωγή Οι κατανομές διακρίνονται σε κατανομές συχνοτήτων, κατανομές πιθανοτήτων και σε δειγματοληπτικές κατανομές Στη συνέχεια θα γίνει αναλυτική περιγραφή αυτών 82 Κατανομές

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 2: Έλεγχοι Υποθέσεων

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Μέρος ΙΙ. Τυχαίες Μεταβλητές

Μέρος ΙΙ. Τυχαίες Μεταβλητές Μέρος ΙΙ. Τυχαίες Μεταβλητές Ορισμοί Συναρτήσεις κατανομής πιθανότητας και πυκνότητας πιθανότητας Διακριτές τυχαίες μεταβλητές Ειδικές κατανομές διακριτών τυχαίων μεταβλητών Συνεχείς τυχαίες μεταβλητές

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1. Γ ΛΥΚΕΙΟΥ-ΓΕΝΙΚΗ ΠΑΙΔΕΙΑ ΜΑΘΗΜΑΤΙΚΑ ο ΔΙΑΓΩΝΙΣΜΑ ΘΕΜΑ ο Δίνεται η συνάρτηση f Ι. Το πεδίο ορισμού της f είναι:., υ -, B., Γ. -,.,., ΙΙ. Το όριο f lm 0 είναι ίσο με: Α. 0 Β. Γ. Δ. Ε. Τίποτε από τα προηγούμενα

Διαβάστε περισσότερα

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή Γεώργιος Ζιούτας Άδειες

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ Σε αντίθεση με την διακριτή τυχαία μεταβλητή, μία συνεχής τυχαία μεταβλητή παίρνει μη-αριθμήσιμο (συνεχές) πλήθος τιμών. Δεν μπορούμε να καταγράψουμε το σύνολο των τιμών

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Ονοματεπώνυμα Σπουδαστριών: Μποτονάκη Ειρήνη (5422), Καραλή Μαρία (5601) Μάθημα: Β06Σ03 Στατιστική

Διαβάστε περισσότερα

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 25 ΜΑΪΟΥ 2004 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 25 ΜΑΪΟΥ 2004 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΤΑΞΗ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 25 ΜΑΪΟΥ 2004 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΘΕΜΑ 1ο Α. Να αποδείξετε ότι

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Στοχαστικές Στρατηγικές

Στοχαστικές Στρατηγικές Στοχαστικές Στρατηγικές 3 η ενότητα: Εισαγωγή στα στοχαστικά προβλήματα διαδρομής Τμήμα Μαθηματικών, ΑΠΘ Ακαδημαϊκό έτος 2018-2019 Χειμερινό Εξάμηνο Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & Πανεπιστήμιο

Διαβάστε περισσότερα

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) .5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην

Διαβάστε περισσότερα

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική Ενότητα 3: Έλεγχοι υποθέσεων - Διαστήματα εμπιστοσύνης Δρ.Ευσταθία Παπαγεωργίου, Αναπληρώτρια Καθηγήτρια Οι ερευνητικές υποθέσεις Στην έρευνα ελέγχουμε

Διαβάστε περισσότερα

«Εφαρμογή της ανάλυσης επιβίωσης για την αξιολόγηση της θνησιμότητας των δέντρων στο δάσος Ελατιάς Δράμας»

«Εφαρμογή της ανάλυσης επιβίωσης για την αξιολόγηση της θνησιμότητας των δέντρων στο δάσος Ελατιάς Δράμας» Δημοκρίτειο Πανεπιστήμιο Θράκης Τμήμα Δασολογίας Μεταπτυχιακή διατριβή «Εφαρμογή της ανάλυσης επιβίωσης για την αξιολόγηση της θνησιμότητας των δέντρων στο δάσος Ελατιάς Δράμας» Αποστολοπούλου Ευαγγελία

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ Η ΧΡΗΣΙΜΟΠΟΙΗΣΗ ΤΗΣ ΑΝΑΛΥΣΗΣ ΕΠΙΒΙΩΣΗΣ ΣΤΗΝ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΙΑ ΙΚΑΣΙΑΣ Πολύβιος Γ. Μαρκαντωνάκης ΕΡΓΑΣΙΑ Που υποβλήθηκε

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος. ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΣΥΛΛΟΓΗ ΑΣΚΗΣΕΩΝ ου ΚΕΦΑΛΑΙΟΥ Άσκηση 1 (Προτάθηκε από Χρήστο Κανάβη) Έστω CV 0.4 όπου CV ο συντελεστής μεταβολής, και η τυπική απόκλιση s = 0. ενός δείγματος που έχει την ίδια

Διαβάστε περισσότερα

ΠΙΝΑΚΑΣ 1. Αγόρι 390 (51.25%) 360 (43.11%) 750 Κορίτσι 371 (48.75%) 475 (56.89%) (100%) 835 (100%) 1596

ΠΙΝΑΚΑΣ 1. Αγόρι 390 (51.25%) 360 (43.11%) 750 Κορίτσι 371 (48.75%) 475 (56.89%) (100%) 835 (100%) 1596 ΙΙ. ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Α. Γενικά στοιχεία. Όπως φαίνεται παραπάνω, το 4.55% των ερωτηθέντων μαθητών πηγαίνουν στο Γυμνάσιο ενώ 47.48% αυτών φοιτούν στο Λύκειο ( για το 11.97% των μαθητών του δείγματος

Διαβάστε περισσότερα

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες)

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες) Εργαστήριο Μαθηματικών & Στατιστικής Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ η Πρόοδος στο Μάθημα Στατιστική //7 ο Θέμα α) Περιγράψτε τη σχέση Θεωρίας Πιθανοτήτων και Στατιστικής. β) Αν Α, Β ενδεχόμενα του δειγματικού χώρου Ω

Διαβάστε περισσότερα

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη ΕΚΔΟΣΕΙΣ ΚΕΛΑΦΑ 59 Θέμα 1 ο (ΜΑΪΟΣ 004, ΜΑΪΟΣ 008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Έχουμε f (x+h) - f (x) = c - c = 0 και για h 0 είναι f (x + h) - f (x) 0 m

Διαβάστε περισσότερα

Τυχαία μεταβλητή (τ.μ.)

Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) είναι μια συνάρτηση X ( ) με πεδίο ορισμού το δειγματικό χώρο Ω του πειράματος και πεδίο τιμών ένα υποσύνολο πραγματικών αριθμών που συμβολίζουμε συνήθως

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

1. Σκοπός της έρευνας

1. Σκοπός της έρευνας Στατιστική ανάλυση και ερμηνεία των αποτελεσμάτων των εξετάσεων πιστοποίησης ελληνομάθειας 1. Σκοπός της έρευνας Ο σκοπός αυτής της έρευνας είναι κυριότατα πρακτικός. Η εξέταση των δεκτικών/αντιληπτικών

Διαβάστε περισσότερα

ΤΟ ΜΟΝΤΕΛΟ ΑΝΑΛΟΓΙΚΩΝ ΚΙΝΔΥΝΩΝ ΤΟΥ COX ΚΑΙ ΕΦΑΡΜΟΓΗ ΣΤΗΝ R

ΤΟ ΜΟΝΤΕΛΟ ΑΝΑΛΟΓΙΚΩΝ ΚΙΝΔΥΝΩΝ ΤΟΥ COX ΚΑΙ ΕΦΑΡΜΟΓΗ ΣΤΗΝ R ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΟ ΜΟΝΤΕΛΟ ΑΝΑΛΟΓΙΚΩΝ ΚΙΝΔΥΝΩΝ ΤΟΥ COX ΚΑΙ ΕΦΑΡΜΟΓΗ ΣΤΗΝ R ΠΡΟΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

Απειροστικός Λογισμός Ι, χειμερινό εξάμηνο Λύσεις τέταρτου φυλλαδίου ασκήσεων. ( n(n+1) e 1 (

Απειροστικός Λογισμός Ι, χειμερινό εξάμηνο Λύσεις τέταρτου φυλλαδίου ασκήσεων. ( n(n+1) e 1 ( . Αποδείξτε ότι: Απειροστικός Λογισμός Ι, χειμερινό εξάμηνο 08-9. Λύσεις τέταρτου φυλλαδίου ασκήσεων. +) 7 +) +), 5 +7 5 5, +log ) 7 log 4, +, ++ + + ) +4+4 + +4, + si +, +) +), + [ ], + + 0, + +, ) +,,

Διαβάστε περισσότερα

Περιεχόμενα. σελ. Πρόλογος 1 ης Έκδοσης... ix Πρόλογος 2 ης Έκδοσης... xi Εισαγωγή... xiii

Περιεχόμενα. σελ. Πρόλογος 1 ης Έκδοσης... ix Πρόλογος 2 ης Έκδοσης... xi Εισαγωγή... xiii Περιεχόμενα Πρόλογος 1 ης Έκδοσης... ix Πρόλογος 2 ης Έκδοσης... xi Εισαγωγή... xiii 1. Ειδικές συναρτήσεις 1.0 Εισαγωγή... 1 1.1 Εξίσωση του Laplace Συστήματα συντεταγμένων... 2 1.2 Συνάρτηση δ του Dirac...

Διαβάστε περισσότερα

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0 ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής Δεσμευμένη αξιοπιστία Η δεσμευμένη αξιοπιστία R t είναι η πιθανότητα το σύστημα να λειτουργήσει για χρονικό

Διαβάστε περισσότερα

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ ΕΙΣΑΓΩΓΗ Ο όρος «ποιότητα», είναι μια απλή έννοια που εκφράζεται

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Προσδιοριστής (determinant) Συνώνυμα

Προσδιοριστής (determinant) Συνώνυμα Προσδιοριστής Το χαρακτηριστικό (συγγενές, περιβαλλοντικό ή συμπεριφοράς) των ατόμων από το οποίο εξαρτάται η συχνότητα εμφάνισης της μελετώμενης έκβασης Προσδιοριστής (determinant) Συνώνυμα Έκθεση Μελετώμενος

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΘΗΝΑ, 2001 Π Ε Ρ Ι Ε Χ Ο Μ Ε Ν Α ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ iii ix ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ 1 1.1

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ Δήμητρα Αικατερίνη Χαρ.

ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ Δήμητρα Αικατερίνη Χαρ. ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ Δήμητρα Αικατερίνη Χαρ. Αλεξανδροπούλου ΕΡΓΑΣΙΑ Που υποβλήθηκε στο Τμήμα Στατιστικής του Οικονομικού

Διαβάστε περισσότερα

6 ντήρηση καλούνται να παίξουν ολοένα και πιο σημαντικό ρόλο στην ανταγωνιστικότητα των επιχειρήσεων. Στο σημείο αυτό θεωρώ χρέος μου και ευχαρίστηση

6 ντήρηση καλούνται να παίξουν ολοένα και πιο σημαντικό ρόλο στην ανταγωνιστικότητα των επιχειρήσεων. Στο σημείο αυτό θεωρώ χρέος μου και ευχαρίστηση 5 ΠΡΟΛΟΓΟΣ Με την παγκοσμιοποίηση διευρύνθηκαν θεαματικά οι αγορές και με την απομάκρυνση κάθε μορφής προστατευτισμού οι επιχειρήσεις καλούνται πλέον να λειτουργούν σε ένα άκρως ανταγωνιστικό περιβάλλον.

Διαβάστε περισσότερα

ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ

ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ ΚΕΦΑΛΑΙΟ 8 ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ Στις ενότητες που ακολουθούν εξετάζουμε συνεχείς κατανομές με ευρεία χρήση στις εφαρμογές. Σε αυτές περιλαμβάνονται η ομοιόμορφη, η εκθετική, η Γάμμα και η

Διαβάστε περισσότερα

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p ΑΣΚΗΣΗ 1 ΣΕΜΦΕ 14-15 i. Έστω yi ο αριθμός των προσπαθειών κάθε μαθητή μέχρι να πετύχει τρίποντο. Ο αριθμός των προσπαθειών πριν ο μαθητής να πετύχει τρίποντο θα είναι xi = yi - 1, i = 1,,18. 2 2 3 2 1

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Το υπουργείο μας. Ατυχήματα - πρώτες βοήθειες στο σχολείο

Το υπουργείο μας. Ατυχήματα - πρώτες βοήθειες στο σχολείο Αθήνα 29 Το υπουργείο μας Ατυχήματα - πρώτες βοήθειες στο σχολείο Χρήστος Τριπόδης Αναστάσιος Χριστάκης Παναγιώτα Γ. Ψυχογιού Νικόλαος Τριπόδης Αθήνα 29 Ατυχήματα - πρώτες βοήθειες στο σχολείο Συγγραφείς:

Διαβάστε περισσότερα

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B)

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B) Πιθανότητες και Αρχές Στατιστικής (4η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2017-2018 Σωτήρης Νικολετσέας, καθηγητής 1 / 39 Περιεχόμενα

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 Η Θεωρία Πιθανοτήτων είναι ένας σχετικά νέος κλάδος των Μαθηματικών, ο οποίος παρουσιάζει πολλά ιδιαίτερα χαρακτηριστικά στοιχεία. Επειδή η ιδιαιτερότητα

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f =

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f = ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 16 (version 9-6-16) 1. A Να δώσετε τον ορισμό της παραγώγου μιας συνάρτησης σε ένα σημείο x του πεδίο ορισμού της. Απάντηση: Παράγωγος μιας συνάρτησης σε ένα σημείο x του πεδίο

Διαβάστε περισσότερα

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες Είπαμε ότι γενικά τα συστηματικά σφάλματα που υπεισέρχονται σε μια μέτρηση ενός φυσικού μεγέθους είναι γενικά δύσκολο να επισημανθούν και να διορθωθούν.

Διαβάστε περισσότερα

ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ- 1 o ΔΙΑΓΩΝΙΣΜΑ

ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ- 1 o ΔΙΑΓΩΝΙΣΜΑ ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f 1 ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ- 1 o ΔΙΑΓΩΝΙΣΜΑ Ι. Το πεδίο ορισμού της f είναι:, 1 υ -1, B. 1, Γ. -1,., 1. 1, f 1 ΙΙ. Το όριο lm είναι ίσο με: 0 Α. 0 Β. 1 Γ. -1 Δ. 1/ Ε. Τίποτε

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 5

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 5 (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 5 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Εργαστήριο Δημογραφικών & Κοινωνικών Αναλύσεων

Εργαστήριο Δημογραφικών & Κοινωνικών Αναλύσεων ΥΠΟΔΕΙΓΜΑΤΑ ΣΤΑΣΙΜΟΥ ΚΑΙ ΣΤΑΘΕΡΟΥ ΠΛΗΘΥΣΜΟΥ (ΕΛΕΥΘΕΡΙΑ ΑΝΔΡΟΥΛΑΚΗ) Η εξέταση των πολύπλοκων δεσμών που συνδέουν τα δημογραφικά φαινόμενα με τους πληθυσμούς από τους οποίους προέρχονται και τους οποίους

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Τυχαίες Μεταβλητές. Ορισμός

Τυχαίες Μεταβλητές. Ορισμός Τυχαίες Μεταβλητές Ορισμός Μία τυχαία μεταβλητή (τ.μ.) είναι μία συνάρτηση (ή μία μεταβλητή) η οποία καθορίζει αριθμητικές τιμές σε μία ποσότητα που σχετίζεται με το αποτέλεσμα ενός πειράματος, όπου μία

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. B. Πώς ορίζεται ο συντελεστής μεταβολής ή συντελεστής. μεταβλητότητας μιας μεταβλητής X, αν x > 0 και πώς, αν

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. B. Πώς ορίζεται ο συντελεστής μεταβολής ή συντελεστής. μεταβλητότητας μιας μεταβλητής X, αν x > 0 και πώς, αν ΘΕΜΑ 1o ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 22 ΜΑΪΟΥ 2008 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΠΕΝΤΕ (5)

Διαβάστε περισσότερα

Πιθανολογική Ανάλυση Αποφάσεων. Συστήματα Αποφάσεων Εργαστήριο Συστημάτων Αποφάσεων και Διοίκησης

Πιθανολογική Ανάλυση Αποφάσεων. Συστήματα Αποφάσεων Εργαστήριο Συστημάτων Αποφάσεων και Διοίκησης Πιθανολογική Ανάλυση Αποφάσεων Αβεβαιότητα Known knowns Ποσοτικοποιήσιμη Πιθανότητα Known unknowns Εκτίμηση ενδεχομένου Unknown unknowns Αρνητική επίδραση Ρίσκο Black Swan Πιθανολογική Προσέγγιση Θεωρούμε

Διαβάστε περισσότερα

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΚΕΦΑΛΑΙΟ 11 ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ Θα εισαγάγουμε την έννοια του τυχαίου αριθμού με ένα παράδειγμα. Παράδειγμα: Θεωρούμε μια τυχαία μεταβλητή με συνάρτηση πιθανότητας η οποία σε

Διαβάστε περισσότερα

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Γαροφαλάκης Ιωάννης Πολυτεχνική Σχολή Τμήμα Μηχ/κών Η/Υ & Πληροφορικής Περιεχόμενα ενότητας Εισαγωγή Συλλογή

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ. Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο.

ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ. Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο. ΘΕΜΑ (ΙΟΥΝΙΟΣ 000) ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο. Τιμές Μεταβλητής Συχνότητα σχετική Σχετική Αθροιστική f % f N 0

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΜΣ στη «Ναυτιλία» Τμήμα Β art time Χαράλαμπος Ευαγγελάρας hevangel@unipi.gr Η έννοια της Πιθανότητας Ο όρος πιθανότητα είναι συνδέεται άμεσα με τη μελέτη

Διαβάστε περισσότερα

Κεφάλαιο 3.1 Εξισώσεις 1 ου Βαθμού Επιμέλεια Σημειώσεων: Ντάνος Γιώργος ΚΕΦΑΛΑΙΟ 3.1 ΕΞΙΣΩΣΕΙΣ 1 ΟΥ ΒΑΘΜΟΥ 1

Κεφάλαιο 3.1 Εξισώσεις 1 ου Βαθμού Επιμέλεια Σημειώσεων: Ντάνος Γιώργος ΚΕΦΑΛΑΙΟ 3.1 ΕΞΙΣΩΣΕΙΣ 1 ΟΥ ΒΑΘΜΟΥ 1 Κεφάλαιο 3.1 Εξισώσεις 1 ου Βαθμού Επιμέλεια Σημειώσεων: Ντάνος Γιώργος ΚΕΦΑΛΑΙΟ 3.1 ΕΞΙΣΩΣΕΙΣ 1 ΟΥ ΒΑΘΜΟΥ 1 Εξίσωση πρώτου βαθμού ή πρωτοβάθμια εξίσωση με άγνωστο x ονομάζεται κάθε εξίσωση της μορφής

Διαβάστε περισσότερα