ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣ/ΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ. Μεθοδολογία Μοντελοποίησης στην Ανάλυση Επιβίωσης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣ/ΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ. Μεθοδολογία Μοντελοποίησης στην Ανάλυση Επιβίωσης"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣ/ΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ Μεθοδολογία Μοντελοποίησης στην Ανάλυση Επιβίωσης Διπλωματική Εργασία του Μεταπτυχιακού Φοιτητή Μπέγκα Κωνσταντίνου Επιβλέπων: Λέκτορας Νάκας Χρήστος Θεσσαλονίκη, Δεκέμβρης 2009 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 1

2 ΚΕΦΑΛΑΙΟ 1 ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ 1.1 Δεδομένα Επιβίωσης Ιδιαίτερα χαρακτηριστικά χρόνων επιβίωσης Ανεξάρτητη και με πληροφορία λογοκρισία Συναρτήσεις χρόνων επιβίωσης Συνάρτηση κινδύνου Αθροιστική συνάρτηση κινδύνου Σχέση συνάρτησης επιβίωσης και αθροιστικής συνάρτησης κινδύνου Εκτίμηση της συνάρτησης επιβίωσης Μη παραμετρικές μέθοδοι Εκτίμηση πιθανοτήτων επιβίωσης Μη Παραμετρική Εκτίμηση της συνάρτησης επιβίωσης Kaplan Meier εκτιμητής Πίνακες χρόνων επιβίωσης Σύγκριση της αναλογιστικής μεθόδου και του Kaplan-Meier εκτιμητή Εκτίμηση αθροιστικής συνάρτησης κινδύνου Μερικές Παραμετρικές συναρτήσεις επιβίωσης Εκθετική Weibull Rayleigh Γάμμα Compertz Makeham.26 ΚΕΦΑΛΑΙΟ 2 ΜΟΝΤΕΛΟ COX 2.1 Μοντελοποίηση δεδομένων επιβίωσης..27 2

3 2.2 Μοντέλο ανάλογων κινδύνων Συνάρτηση αναφοράς Συνάρτηση κινδύνου στο μοντέλο του Cox Κατηγορικές τυχαίες μεταβλητές Αξιολόγηση μεταβλητών ενός Cox μοντέλου Προσαρμογή του μοντέλου ανάλογων κινδύνων Σύγκριση εναλλακτικών μοντέλων 35 ΚΕΦΑΛΑΙΟ 3 ΜΟΝΤΕΛΟ ΕΠΙΤΑΧΥΝΟΜΕΝΩΝ ΧΡΟΝΩΝ ΕΠΙΒΙΩΣΗΣ 3.1 Προσαρμογή της συνάρτησης επιβίωσης Weibull στο μοντέλο επιταχυνόμενων χρόνων ζωής Σχέση μεταξύ του εκθετικού και του Weibull μοντέλου επίδραση του μοντέλου επιταχυνόμενων χρόνων στη συνάρτηση κινδύνου 41 ΚΕΦΑΛΑΙΟ 4 ΧΡΟΝΙΚΑ ΜΕΤΑΒΑΛΛΟΜΕΝΕΣ ΜΕΤΑΒΛΗΤΕΣ 4.1 Εξωγενείς χρονικά μεταβαλλόμενες μεταβλητές Ενδογενείς χρονικά μεταβαλλόμενες μεταβλητές Συμπεράσματα.47 4,4 Εφαρμογές.48 ΚΕΦΑΛΑΙΟ 5 ΑΝΤΑΓΩΝΙΣΤΙΚΟΙ ΚΙΝΔΥΝΟΙ 5.1 Εισαγωγή Πολυσταδιακά μοντέλα Προσεγγίσεις των ανταγωνιστικών κινδύνων..58 ΚΕΦΑΛΑΙΟ 6 ΕΦΑΡΜΟΓΕΣ ΣΥΜΠΕΡΑΣΜΑΤΑ Εφαρμογή 1: Λογοκρισία 64 3

4 Εφαρμογή 2 : Κατασκευή μοντέλου παλινδρόμησης Cox..68 Εφαρμογή 3 : Παραμετρικά μοντέλα.75 Εφαρμογή 4 : Εφαρμογές Ανταγωνιστικών κινδύνων ΠΑΡΑΡΤΗΜΑ 89 ΒΙΒΛΙΟΓΡΑΦΙΑ

5 ΠΡΟΛΟΓΟΣ Η παρούσα εργασία εκπονήθηκε στα πλαίσια του προγράμματος μεταπτυχιακών σπουδών του τμήματος Μαθηματικών του Αριστοτελείου Πανεπιστημίου. Όπως γίνεται αντιληπτό και από τον τίτλο πραγματεύεται εφαρμογές στην ανάλυση επιβίωσης. Αρχικά επιχειρείται μια εισαγωγή στην ανάλυση επιβίωσης με αναφορά σε έννοιες όπως η λογοκρισία, η συνάρτηση κινδύνου και η αθροιστική της όπως και στην εκτίμηση αυτών και συνεχίζεται με μη παραμετρικές μεθόδους εκτίμησης. Τέλος στο πρώτο κεφάλαιο παρατίθενται και κάποιες παραμετρικές συναρτήσεις επιβίωσης. Συνεχίζοντας στο δεύτερο κεφάλαιο μελετάται το μοντέλο του Cox με την αξιολόγηση μεταβλητών του όπως και η προσαρμογή του μοντέλου των ανάλογων κινδύνων και η σύγκριση εναλλακτικών μοντέλων. Έπειτα στο τρίτο κεφάλαιο εισάγετε η έννοια του μοντέλου επιταχυνόμενων χρόνων επιβίωσης. Συγκεκριμένα προσαρμόζεται η συνάρτηση επιβίωσης Weibull στο μοντέλο επιταχυνόμενων χρόνων ζωής μας απασχολεί ακόμα η σχέση μεταξύ του εκθετικού και του Weibull μοντέλου και η επίδραση του μοντέλου επιταχυνόμενων χρόνων στη συνάρτηση κινδύνου. Για να καταλήξουμε στους ανταγωνιστικούς κινδύνους στο πέμπτο κεφάλαιο μελετήθηκαν οι χρονικά μεταβαλλόμενες μεταβλητές (τέταρτο κεφάλαιο) και παρουσιάστηκαν οι αντίστοιχες εφαρμογές. Η έννοια στην οποία δόθηκε ιδιαίτερη έμφαση στην παρούσα εργασία είναι αυτή των ανταγωνιστικών κινδύνων. Όπως αναφέρθηκε και παραπάνω με τους ανταγωνιστικούς κινδύνους ασχολούμαστε εκτενώς στο πέμπτο κεφάλαιο με τη βοήθεια βέβαια των εφαρμογών που υπάρχουν στο τελευταίο κεφάλαιο της εργασίας. Κεφάλαιο 1 5

6 Ανάλυση Επιβίωσης H ανάλυση επιβίωσης αναφέρεται στην περιγραφή της ανάλυσης δεδομένων που αντιστοιχούν στο χρονικό διάστημα από ένα καλά ορισμένο χρονικό σημείο μέχρι την εμφάνιση ενός γεγονότος που ενδιαφέρει τον ερευνητή. Στη γενικότερη περίπτωση η ανάλυση επιβίωσης περιλαμβάνει τις τεχνικές για τυχαίες μεταβλητές που παίρνουν θετικές τιμές όπως: Χρόνοι θανάτου Χρόνοι εκκίνησης (υποτροπής) μίας ασθένειας Διάστημα παραμονής σε ένα νοσοκομείο Διάρκεια μίας απεργίας Χρήματα που καταβάλλονται από μία ασφάλεια ζωής Χρόνος μίας διδακτορικής διατριβής Στο πεδίο της ιατρικής το χρονικό σημείο της έναρξης της μελέτης για κάθε άτομο στην μελέτη είναι τυπικά το σημείο εισόδου τους σε μία κλινική δοκιμή (χρόνος διάγνωσης, έναρξη θεραπείας κλπ). Αν το γεγονός που μας ενδιαφέρει είναι ο θάνατος τότε μιλάμε πραγματικά για χρόνους επιβίωσης. Οι χρόνοι επιβίωσης μπορεί να αφορούν 1. Ανθρώπους 2. Ζώα 3. Φυτά 4. Βιομηχανικά Ηλεκτρονικά Εξαρτήματα Από κλινικής άποψης, ο χρόνος επιβίωσης χρησιμοποιείται για να δείξει όχι μόνο «χρόνο θανάτου» αλλά χρόνο για οποιοδήποτε γεγονός το οποίο γενικά ορίζεται ως αποτυχία (για παράδειγμα πρόοδος ασθένειας, μετάσταση ή τοξικό γεγονός). Η 6

7 δυσκολία στο να βρεθεί η εμπειρικά και θεωρητικά στοιχεία για να υποστηριχθεί μια συγκεκριμένη οικογένεια κατανομών χρόνων αποτυχίας ενθάρρυνε την δημιουργία μη παραμετρικών μεθόδων. Το 1972 ο Sir David Cox εισάγει το μοντέλο παλινδρόμησης ανάλογων κινδύνων το οποίο αποτελεί την φυσική εξέλιξη των τυπικών μη-παραμετρικών μοντέλων. Η ανάλυση επιβίωσης στο πεδίο της βιοϊατρικής πραγματεύεται τα εξής βασικά προβλήματα: 1. εκτίμηση των κατανομών χρόνων αποτυχίας 2. σύγκριση των χρόνων επιβίωσης διαφορετικών ομάδων και εκτίμηση των επιδράσεων της αγωγής 3. προγνωστική εκτίμηση των διαφορετικών μεταβλητών όπως των βιοχημικών ιστολογικών και κλινικών χαρακτηριστικών, είτε από κοινού είτε ατομικά. 1.1 Δεδομένα ανάλυσης επιβίωσης Τα δεδομένα της ανάλυσης επιβίωσης προκύπτουν όταν ο σκοπός της έρευνας είναι να μελετηθεί ο ενδιάμεσος χρόνος μεταξύ ενός χρόνου έναρξης που τίθεται και ενός γεγονότος που παρατηρείται. Ο χρόνος έναρξης της παρατήρησης είναι συνήθως μια ιατρική επέμβαση όπως η πρώτη διάγνωση μίας ασθένειας ή η έναρξη θεραπείας σε μια κλινική μελέτη. Στις επιδημιολογικές έρευνες, το σημείοχρόνος έναρξης είναι η έναρξη της έκθεσης του ατόμου σε ένα παράγοντα κινδύνου. Το τελικό γεγονός πιθανόν να είναι ο θάνατος ή ένα συγκεκριμένο γεγονός το οποίο μας ενδιαφέρει. Η ανάλυση επιβίωσης είναι χρήσιμη οποτεδήποτε ο ερευνητής ενδιαφέρεται όχι μόνο για τη συχνότητα του ενός συγκεκριμένου γεγονότος, αλλά επίσης στη χρονική διαδικασία που βρίσκεται πίσω από την εμφάνιση αυτή. 1.2 Ιδιαίτερα χαρακτηριστικά χρόνων επιβίωσης Τα ιδιαίτερα χαρακτηριστικά των χρόνων επιβίωσης είναι σε αδρές γραμμές τα εξής: 7

8 1. Οι χρόνοι επιβίωσης σπάνια ακολουθούν συμμετρικές κατανομές. 2. Οι χρόνοι επιβίωσης συχνά «λογοκρίνονται» όταν υπεισέρχονται στην έρευνα γίνεται δηλαδή αναφορά σε: i. Άτομα για τα οποία δεν έχει καταγραφεί το γεγονός στο τέλος της μελέτης ii. iii. Άτομα που χάθηκαν Άτομα που πέθαναν από άλλο αίτιο Εντούτοις η λογοκρισία μπορεί να προκύψει και λόγω χρονικών ορίων και άλλων περιορισμών που εξαρτώνται από το πείραμα. Προκύπτουν δύο κύριες κατηγορίες λογοκρισίας η Ι και η ΙΙ. Έστω ένα πείραμα το οποίο γίνεται με 80 ποντίκια ο ερευνητής αποφασίζει ότι πρέπει τα ποντίκια να θανατωθούν μετά από 2 έτη. Ο χρόνος αποτυχίας-θανάτου είναι κοινός για όλα τα υποκείμενα της έρευνας (2 έτη). Σε αυτή την περίπτωση παρατηρείται λογοκρισία τύπου Ι. Αν στη ίδια έρευνα ο ερευνητής αποφάσιζε τη διακοπή της έρευνας για συγκεκριμένο αριθμό αποτυχιών, για παράδειγμα αν τα 4/6 των ποντικιών είχανε όγκο τότε η λογοκρισία θα ήταν τύπου ΙΙ. Στις κλινικές και στις επιδημιολογικές έρευνες, η λογοκρισία προκαλείται κυρίως λόγω χρονικών περιορισμών και επομένως είναι τύπου Ι. Πέραν του παραπάνω διαχωρισμού η λογοκρισία ανάλογα με τα χαρακτηριστικά της μπορεί να υποστεί και άλλους διαχωρισμούς. Σε κάθε περίπτωση κάποιο άτομο εισέρχεται στη μελέτη το χρόνο t 0 και πεθαίνει στο χρόνο t 0 + t ή λογοκρίνεται στον χρόνο t 0 + c αυτή λοιπόν η περίπτωση κατά την οποία γνωρίζουμε ότι ο χρόνος ζωής του ατόμου είναι μεγαλύτερος από κάποιο χρόνο U αντιστοιχεί στη λεγόμενη δεξιά λογοκρισία. Ονομάζεται δεξιά λογοκρισία επειδή το γεγονός που δεν καταγράφηκε βρίσκεται στα δεξιά του χρόνου λογοκρισίας δηλαδή γνωρίζουμε ότι το γεγονός δεν έχει συμβεί στο τέλος της έρευνας. Επιπλέον, τα δεδομένα που προκύπτουν από μία τέτοια διαδικασία μπορούν να περιγράφουν με ζευγάρια της μορφής ( Xi, δ i ), i= 1,2,... n Xi = min( Ti, Ui ) 8

9 Και ορίζουμε ως δείκτρια συνάρτηση (indicator function) αποτυχίας την δ = i { 1 εαν Τι Uι 0 αλλιως ως U i συμβολίζω τον χρόνο λογοκρισίας. Η δεξιά λογοκρισία είναι η πιο διαδεδομένη μορφή λογοκρισίας. Επίσης υπάρχει και η λογοκρισία από αριστερά στην περίπτωση την οποία ο χρόνος ζωής ενός ατόμου είναι μικρότερος από κάποιο χρόνο U, και η λογοκρισία σε διάστημα στην περίπτωση κατά την οποία ο χρόνος ζωής του ατόμου είναι μικρότερος από κάποιο χρόνο L ή μεγαλύτερος από κάποιο χρόνο R. 1.3 Ανεξάρτητη και με πληροφορία λογοκρισία Λέμε ότι η λογοκρισία είναι ανεξάρτητη (μη ενημερωτική) εάν ο χρόνος λογοκρισίας U i είναι ανεξάρτητος του χρόνου T i. Για παράδειγμα αν U i είναι το προγραμματισμένο τέλος της έρευνας ( 2 χρόνια αφότου ξεκίνησε η έρευνα), τότε είναι συνήθως ανεξάρτητος του T i. Πιο απλά τα άτομα που έχουν υποστεί λογοκρισία οιασδήποτε μορφής δεν είναι λιγότερο η περισσότερο πιθανό να πεθάνουν από ότι τα υπόλοιπα άτομα της έρευνας. Όμως είναι πιθανό και να μην είναι ανεξάρτητοι αυτοί οι χρόνοι αν για παράδειγμα U i είναι ο χρόνος κατά τον οποίο εξέρχεται από την έρευνα ένας ασθενής για διάφορους λόγους, όπως κρίσιμα γεγονότα τα οποία σχετίζονται με την τοξικότητα των φαρμάκων ή την επιδείνωση των κλινικών συνθηκών, τότε πολύ πιθανόν να μην είναι Uiκαι T i ανεξάρτητοι χρόνοι. Ένα άτομο που λογοκρίνεται στο χρονικό σημείο U πρέπει να είναι αντιπροσωπευτικό προς όλα τα υπόλοιπα που λογοκρίνονται στον ίδιο χρόνο. Το είδος αυτό λογοκρισίας ονομάζεται λογοκρισία με πληροφορία αν η κατανομή του U i περιέχει οποιαδήποτε πληροφορία σχετικά με τις παραμέτρους που χαρακτηρίζουν την κατανομή του T i. Ένας ιδιαίτερος τύπος πληροφοριακής λογοκρισίας που χρήζει μελέτης έχει να κάνει με τους λεγόμενους ανταγωνιστικούς κινδύνους(θα μελετηθούν αργότερα). Αυτός ο τύπος λογοκρισίας χρησιμοποιείται όταν είναι αναγκαία η εκτίμηση της κατανομής του χρόνου αποτυχίας από μία συγκεκριμένη αιτία και οι χρόνοι 9

10 αποτυχίας από άλλες αιτίες θεωρούνται ως λογοκριμένες παρατηρήσεις για την αιτία που μας αφορά. 1.4 Συναρτήσεις Χρόνων Επιβίωσης Πρακτικά στην ανάλυση επιβίωσης ενδιαφερόμαστε για τον υπολογισμό της πιθανότητας Pr( T t) > και την συμβολίζουμε ( ) Pr( το ατοµο στη µελετη επιβιωνει περαν του χρονου t ) S t = H ( ) Pr(T> t) = 1 Pr T< t συναρτηση κατανοµης ( ) ( ) t= 0 S t = 1 και t S t = 0 και στις ειδικές περιπτώσεις όπου Για συνεχή τυχαία μεταβλητή: S( t) ( ) = f u du Ενώ για διακριτή τυχαία μεταβλητή: ( ) = ( ) = ( j) = t= 0 S t f u f a f u t ai> t a j t j 1.5 Συνάρτηση Κινδύνου λ ( t) Συχνά καλείτε στιγμιαίος ρυθμός αποτυχίας και ορίζεται για συνεχείς και διακριτές τυχαίες μεταβλητές. Η συνάρτηση κινδύνου δηλώνει τη στιγμιαία πιθανότητα θανάτου ενός ατόμου το χρόνο t δοθέντος ότι αυτό επέζησε μέχρι τη χρονική στιγμή t. Η συναρτησιακή της μορφή ορίζεται Αρχικά για συνεχείς ως: 10

11 λ ( t) = lim Pr ( t T < t+ t T t) = lim = lim f ( t) = S( t) t 0 t 0 1 t 0 t 1 Pr t 1 Pr t ([ t T < t+ t] [ T t] ) Pr( T t) ( t T < t+ t) Pr( T t) Για την περίπτωση διακριτών τυχαίων μεταβλητών: λ ( aj) λj = Pr ( T = aj T aj) P(T= aj ) = P T a f a = S a = ( j) ( j) ( j) ka : k aj ( ) f ( a ) f t 1.6 Αθροιστική Συνάρτηση Κινδύνου Λ ( t) k Λ = Για τη συνεχή περίπτωση τυχαίων μεταβλητών: ( t) λ( ) Και για τη διακριτή περίπτωση: ( t) Λ = λ k ka : k < t t 0 udu Η αθροιστική συνάρτηση κινδύνου δεν έχει τόσο διαισθητική ερμηνεία όσο η συνάρτηση κινδύνου αλλά είναι αρκετά χρήσιμη για γραφικές αξιολογήσεις: 1. Συνέπειας συγκεκριμένων παραμετρικών μοντέλων 2. Της υπόθεσης ανάλογων κινδύνων για τα μοντέλα Cox 1.7 Σχέση μεταξύ συνάρτησης επιβίωσης και συνάρτησης κινδύνου. Έχει ήδη αποδειχθεί ότι για μία συνεχή τυχαία μεταβλητή ισχύει ( t) ( ) ( ) f t λ = S t 11

12 ' ' Επειδή ισχύει: f ( t) = S ( t) ή ισοδύναμα S ( t) f ( t) = μπορούμε να χρησιμοποιήσουμε τις παραπάνω σχέσεις για να δείξουμε ότι: 1 logs( t) = t = S( t) f ( t) S( t) ( ) ( ) ( ) ' S t f t = λ( t) = logs( t) S t t 1.8 Σχέση μεταξύ συνάρτησης επιβίωσης και αθροιστικής συνάρτησης κινδύνου Συνεχής Περίπτωση t ( t) λ( ) Λ = = 0 t 0 t 0 u du ( ) ( ) f u du S u = log S( u) du u ( ) ( ) ( ) = logs t + logs 0 S t = e Λ ( t) Διακριτή Περίπτωση Υποθέτουμε ότι aj < t a j + 1 τότε ( ) = ( 1, 2, K, j+ 1) = P( T a1) P( T a2 T a1) KP( T aj+ 1 T aj) = ( 1 λ1) K ( 1 λj) = ( 1 λk) S t P T a T a T a ka : k< k 1.9 Εκτίμηση της συνάρτησης επιβίωσης ή συνάρτησης κινδύνου. Μπορούμε να εκτιμήσουμε την συνάρτηση επιβίωσης (ή κινδύνου) με δύο τρόπους 12

13 Προσαρμόζοντας ένα παραμετρικό μοντέλο για λ ( t) βασισμένο σε μία συγκεκριμένη συνάρτηση πυκνότητας f ( t). Αναπτύσσοντας ένα εμπειρικό μοντέλο εκτίμησης της συνάρτησης επιβίωσης (μηπαραμετρική εκτίμηση) Στην περίπτωση μη-ύπαρξης λογοκρισίας ~ Η εμπειρική εκτίμηση της συνάρτησης επιβίωσης S( t ), είναι η αναλογία των ατομικών συναρτήσεων επιβίωσης με χρόνο πραγματοποίησης μεγαλύτερο από t. Στην περίπτωση ύπαρξης λογοκρισίας ~ Αν υπάρχουν λογοκριμένες παρατηρήσεις, τότε η S( t ) δεν είναι καλός εκτιμητής της πραγματικής S ( t), τότε άλλες μη παραμετρικές μέθοδοι θα πρέπει να χρησιμοποιηθούν έτσι ώστε να υπολογιστεί σωστά η εκτίμηση της S ( t) στην περίπτωση της λογοκρισίας(πίνακες επιβίωσης, Kaplan-Meier εκτιμητής) 1.10 Μη παραμετρικές μέθοδοι Εκτίμηση των Πιθανοτήτων Επιβίωσης Ας υποθέσουμε πως έχουμε μια κλινική μελέτη στην λευχαιμία με 20 ασθενείς τους οποίους και καταγράφω ως προς τους χρόνους υποτροπής. Χωρίζω σε δύο ομάδες τους ασθενείς και στην μία χορηγώ ψευδοφάρμακο (Placebo). Καταγράφω τους εξής χρόνους (+: ύπαρξη λογοκρισίας), χρόνοι υποτροπής σε ημέρες: Placebo Active 13

14 Παρατηρώ αμέσως ότι στην ομάδα των ασθενών που χορήγησα το ψευδοφάρμακο όλοι οι ασθενείς υποτροπίασαν ενώ στην αντίστοιχη ομάδα που χορήγησα το active 14

15 φάρμακο 11 από τους 20 υποτροπίασαν καθώς οι υπόλοιποι 9 είχαν λογοκριμένους χρόνους επιβίωσης. Μία κλασική στατιστική ανάλυση θα χρησιμοποιούσε τις μέσες τιμές των χρόνων υποτροπής των δύο ομάδων τους οποίους και θα συνέκρινε. Πράγματι στην ομάδα των ασθενών που χορηγήθηκε ψευδοφάρμακο ο υπολογισμός είτε του αριθμητικού είτε του αρμονικού μέσου, γίνεται άμεσα και εύκολα. Εν αντιθέσει με την ομάδα στην οποία χορηγήθηκε το κανονικό φάρμακο όπου οι λογοκριμένοι χρόνοι δημιουργούν βασικό πρόβλημα. Ακόμα και αν προσέγγιζα από την σκοπιά των αποτυχιών-αριθμός ατόμων που υποτροπίασαν- δεν θα πετύχαινα καταγραφή των χρόνων υποτροπής παρά μόνο θα είχα μια απάντηση στο ερώτημα αν ο ασθενής υποτροπίασε ή όχι. Για αυτό το λόγο οι αναπτύχθηκαν οι μέθοδοι που θα αναλύσουμε παρακάτω έτσι ώστε: 1. να προσαρμόζουν την λογοκρισία 2. να καταγράφουν γεγονότα για διαφορετικές περιόδους παρατήρησης κάθε πειραματικής μονάδας και 3. να γίνεται καταγραφή του χρόνου στον οποίο πραγματοποιούνται τα γεγονότα Μη-Παραμετρική Εκτίμηση της Συνάρτησης Επιβίωσης Θα γίνει αναφορά σε 3 μεθόδους για την εκτίμηση της συνάρτησης επιβίωσης ( ) Pr( T t) S t = χωρίς να περιοριστούμε στις παραμετρικές μεθόδους. Οι τρεις μη-παραμετρικές μέθοδοι είναι: 1. Ο Kaplan-Meier εκτιμητής 2. Πίνακες Χρόνων Επιβίωσης- Αναλογιστική Μέθοδος 3. Αθροιστικός Εκτιμητής Κινδύνου 15

16 Kaplan-Meier εκτιμητής Ας υποθέσουμε ότι θέλουμε να εκτιμήσουμε την πιθανότητα επιβίωσης κάποιων ασθενών οι οποίοι σε κάποιο χρονικό σημείο διαγνώστηκαν να έχουν μια ασθένεια. Η μέθοδος product limit ισοδύναμη του Kaplan-Meier εκτιμητή βασίζεται σε μία απλή παραδοχή πως για να επιβιώσουν οι ασθενείς ένα χρόνο μετά από την διάγνωση, θα πρέπει να επιβιώνουν καθημερινά από την πρώτη μέχρι και την τελευταία ημέρα του υπό μελέτη χρονικού διαστήματος (στην προκειμένη περίπτωση του ενός έτους). Είναι λοιπόν εύλογο για τον υπολογισμό της πιθανότητας Pr( T t) θα πρέπει να υπολογισθεί για συγκεκριμένη ημέρα η αναλογία των ασθενών, ανάμεσα σε αυτούς που εισέρχονται στη μελέτη και σε αυτούς που καταφέρνουν να επιβιώσουν μέχρι την επόμενη ημέρα. Αρχικά λοιπόν η πιθανότητα υπολογίζεται από το παρακάτω κλάσμα ^ αριθµός ασθενών που εισέρχονται στη µελέτη-αριθµός θανάτων την πρώτη µέρα p ( 1) = αριθµός ατόµων που εισέρχονται στη µελέτη Εν συνεχεία όμως ο αριθμός των εν ζωή ασθενών οι οποίοι και απεικονίζονται στον παρονομαστή είναι πολύ πιθανό να είναι αρκετά μικρότερος από τον αρχικό. Για παράδειγμα την 300 η ημέρα από την αρχή της έρευνας κανείς από τους ασθενείς που είχαν αποτυχία (θάνατος) ή πιθανόν έχουν λογοκριθεί σε κάποια από τις προηγούμενες ημέρες δεν μεταβιβάζει κάποια πληροφορία στην πιθανότητα επιβίωσης της 300 ης ημέρας. Μόνο ασθενείς που είναι ζωντανοί και υπό παρακολούθηση ακριβώς πριν την 300 η ημέρα συμπεριλαμβανομένων και αυτών των οποίων η ο χρόνος αποτυχίας είναι η 300 η ημέρα., αυτή η ομάδα ασθενών ^ ονομάζεται ασθενείς σε κίνδυνο και η πιθανότητα p( 300) ως εξής : ^ αριθµός ασθενών σε κίνδυνο την 300η µέρα - αριθµός θανάτων την 300η µέρα p ( 300) = αριθµός ασθενών σε κίνδυνο την 300η µέρα Αυτό το οποίο βασικά μας αφορά είναι πως θα συνδυάσουμε τις παραπάνω πιθανότητες έτσι ώστε να φθάσουμε στην P ( 365). 16

17 Ο υπολογισμός της παραπάνω πιθανότητας γίνεται βήμα-βήμα υπολογίζοντας αρχικά τις ημερήσιες πιθανότητες επιβίωσης οι οποίες προκύπτουν από κάποια γινόμενα για παράδειγμα P( 2) p( 1) p( 2) πιθανότητα επιβίωσης των τριών ημερών P =. Εν συνεχεία υπολογίζεται η ( 3) = P( 2) p( 3) και ούτω καθεξής μέχρι να φθάσω στην ( 365) P. Αναφορικά με τα δεδομένα που χρησιμοποίησα στην αρχή της ενότητας μπορώ να εφαρμόσω τους απλούς υπολογισμούς που αναφέρθηκαν παραπάνω για να υπολογίσω την πιθανότητα επιβίωσης σε διαφορετικά χρονικά σημεία. Στην κατηγορία του ψευδοφάρμακου όπως έχει αναφερθεί δεν υπάρχει λογοκρισία και η μέγιστη διάρκεια επιβίωσης είναι οι 18 εβδομάδες αντίθετα στην κατηγορία χορήγησης του φαρμάκου παρατηρώ 9 λογοκριμένες παρατηρήσεις και μεγαλύτερο χρόνο επιβίωσης, Γραφικά τα παραπάνω αποτυπώνονται στο παρακάτω σχήμα 17

18 Γράφημα 1. Παρουσιάζονται οι συναρτήσεις επιβίωσης των δύο αγωγών. Ο Product Limit Estimator (Kaplan, Meier ;1958) είναι πιθανώς η πιο διαδεδομένη προσέγγιση της συνάρτησης επιβίωσης. Ο γενικός τύπος όταν δεν υπάρχει λογοκρισία είναι: ^ ( ) S t Αριθµός Ατόµων οταν T t = Συνολικό Μέγεθος είγµατος και χρησιμοποιείται για να εκτιμηθεί μη-παραμετρικά η συνάρτηση επιβίωσης, ακόμα και με την παρουσία λογοκρισίας. Η εκτίμηση αυτή γίνεται με τη βοήθεια της παρακάτω συνάρτησης: ( ) S t d = 1 ja : j< t r j j 18

19 Όπου d j είναι ο αριθμός των θανάτων στο χρονικό σημείο a j και r j είναι ο αριθμός ατόμων σε κίνδυνο τη χρονική στιγμή a j. Διακύμανση Kaplan-Meier εκτιμητή (Greenwood): ^ ^ 2 k j Var S ( t) = S ( t) t tk tk + 1 j= 1 n j n j d j d ( ) [, ) Τυπική Απόκλιση Kaplan-Meier εκτιμητή: 1/ 2 ^ ^ k d j se. S( t) = S( t) j= 1 nj( nj dj) 95% Διάστημα Εμπιστοσύνης για τη συνάρτηση επιβίωσης: S( t) 1.96 se. S( t) ^ ^ ± Πίνακες Χρόνων Επιβίωσης-Αναλογιστική Μέθοδος Αρχικά η μέθοδος των πινάκων επιβίωσης αναπτύχθηκε από τους δημογράφους και τους αναλογιστές για να περιγράψουν την διάρκεια ζωής του πληθυσμού. Ο πληθυσμός ενός πίνακα επιβίωσης απεικονίζει τη διάρκεια της ζωής μιας υποθετικής κοορτής, που προκύπτει από γέννηση σε θάνατο ο οποίος υποτίθεται ότι έχει την ίδια θνησιμότητα όπως αυτή εκτιμάτε από τον παρατηρούμενο πληθυσμό. Η εκτιμώμενη ηλικία και οι ρυθμοί θανάτου που σχετίζονται με το φύλο, εφαρμόζονται στην υποθετική κοορτή, η οποία συνήθως αποτελείται από ή άτομα. Για κάθε κατηγορία ηλικίας, ο αριθμός των γεγονότων και των επιζησάντων που εισέρχονται στην αμέσως επόμενη ηλικιακή κατηγορία, είναι υπολογισμένη στη βάση του ρυθμού θανάτου που σχετίζεται με την ηλικία εκτιμώμενη στον πληθυσμό. Από τα δεδομένα των πινάκων επιβίωσης είναι δυνατό να υπολογιστεί η εκτιμώμενη ηλικία θανάτου ενός ατόμου μιας συγκεκριμένης ηλικίας, η πιθανότητα επιβίωσης από μία ηλικία σε μία άλλη και άλλες σχετικές ποσότητες. Η αναλογιστική μέθοδος υπολογισμού της συνάρτησης επιβίωσης γίνεται μέσω των πινάκων των χρόνων επιβίωσης. Η μέθοδος εφαρμόζεται σε κατηγοριοποιημένα 19

20 δεδομένα (τυπική για πολύ μεγάλα δείγματα). Για ένα δείγμα N ατόμων χωρίζουμε τον χρόνο σε,όχι υποχρεωτικά ίσα μεταξύ τους, διαστήματα Ij = t j, t j+ 1 j= 0,1, K, m 1 T = t t j j+ 1 j Έστω d j, c j ο αριθμός γεγονότων και λογοκριμένων παρατηρήσεων αντίστοιχα στο διάστημα I, n : j ο αριθμός των ατόμων σε κίνδυνο στην αρχή του I j. Στο I j η πιθανότητα αποτυχίας εκτιμάται από το qˆ i d n i =, όπου j cj nj = n j 2 Και η συνάρτηση επιβίωσης σύμφωνα με τον εκτιμητή της αναλογιστικής μεθόδου : ( ) * S t nj dj = t k t t k+ 1 n j= 1 j Παρατηρήσεις: Αν δεν υπάρχει λογοκρισία η διάμεσος x 0.5 είναι x = t ([ n+ ] ) /2, n περιττ oς 1 = t( /2) + t ( /2 1), n αρτιος n n + 2 Αν υπάρχει λογοκρισία η διαδικασία υπολογισμού είναι η εξής: o Υπολογίζουμε τον KM εκτιμητή και ζωγραφίζουμε την αντίστοιχη συνάρτηση επιβίωσης. ^ Η διάμεσος θα είναι το χρονικό σημείο για το οποίο S( x 0.5) = 0.5 Ο εκτιμητής ΚΜ στηρίζεται στη υπόθεση της λογοκρισίας χωρίς πληροφορία 20

21 Ο εκτιμητής ΚΜ είναι καλά ορισμένος t< tmax, αν η τελευταία παρατήρηση είναι «γεγονός» τότε S( t ) max = 0, αν όμως είναι λογοκριμένη τότε η S( t ) δεν ορίστηκε ^ a) ( ) = ( ) ^ S t S t max ^ b) S( t) ^ S t = e c) ( ) = 0, t> t ( ( max) ) t ln S t tmax max Σύγκριση της αναλογιστικής μεθόδου και του Kaplan-Meier εκτιμητή. Εξαιτίας του γεγονότος ότι τα δεδομένα, είτε έχουν τη μορφή χρόνων αποτυχίας, είτε τελευταία στιγμή επιβίωσης είναι σε συνεχή μορφή, παρά ομαδοποιημένα οδηγούμαστε στη χρήση του K-M εκτιμητή για την καμπύλη επιβίωσης. Εντούτοις, σε μεγάλο αριθμό δεδομένων με πολλές αποτυχίες προτιμάτε η μέθοδος των πινάκων επιβίωσης εάν απαιτείται μια πιο απλή και πιο συνοπτική αναπαράσταση της αθροιστικής συνάρτησης. Ο πίνακας επιβίωσης κατασκευάζεται δεδομένου ότι τα συνεχή δεδομένα ομαδοποιούνται από χρονικά διαστήματα, το μέγεθος των οποίων συνήθως διαφέρει. Όταν οι μεμονωμένοι χρόνοι της λογοκρισίας είναι γνωστοί τότε είναι καλό να χρησιμοποιηθεί ένας εκτιμητής του πιο αποτελεσματικού αριθμού των αρχικών ατόμων που συμμετείχαν στην έρευνα και εκτέθηκαν στον κίνδυνο n j. Θεωρούμε ως θij το χρονικό σημείο κατά το οποίο ένα ένα άτομο i, αποχωρεί ή χάνεται, ενώ ήταν σε κίνδυνο το χρονικό διάστημα I j, ο αριθμός n j των ατόμων που εισέρχονται στην έρευνα το διάστημα Ij = tj, t j + 1) είναι δυνατό να προσαρμοστούν όπως φαίνεται στην παρακάτω σχέση για να προκύψει το n j: c j ( 1 θ ) n = n j j ij i= 1 21

22 Η παραπάνω σχέση μειώνει το n j, όπως αυτό υπολογίζεται στην πιθανότητα αποτυχίας di n, εάν το θ ij υπολογίζεται να είναι 1 2 j για όλα τα άτομα με λογοκριμένα δεδομένα. Παρ όλα αυτά ο απλός αναλογιστικός εκτιμητής qˆi είναι ένας καλός και εύρωστος εκτιμητής του q i(πιθανότητας αποτυχίας) Εκτίμηση αθροιστικής συνάρτησης κινδύνου Μία λογική εκτίμηση της αθροιστικής συνάρτησης κινδύνου είναι: ( ) = logs( t) και η αντίστοιχη εκτίμηση H( t) = logs( t) H t ^ ^ ^ Όπου S( t ) είναι ο Product Limit Estimator και αποτελεί τον Kaplan-Meier εκτιμητή της αθροιστικής συνάρτησης κινδύνου H( t ). ^ Μία προσέγγιση πρώτης τάξης για την H( t ) είναι η ποσότητα: ^ HNA t ( ) = d r j jt : j < t j Η οποία είναι γνωστή με το όνομα Nelson-Aalen εκτιμητής ( NA ) της αθροιστικής συνάρτησης κινδύνου H( t ). Ο ΝΑ εκτιμητής της H( t) έχει καλύτερη συμπεριφορά και ιδιότητες από τον εκτιμητή της αθροιστικής συνάρτησης κινδύνου ^ ( ) logs( t) H t ^ = όταν το μέγεθος του δείγματος είναι μικρό, και προφανώς ^ ισχύει H( t) HNA( t) ^. Με τη βοήθεια της σχέσης S( t) = exp H( t) μπορώ να δημιουργήσω την εναλλακτική εκτίμηση για τη συνάρτηση επιβίωσης S( t ) που είναι η ακόλουθη: 22

23 ^ SNA t ( ) = exp HNA( t) ^ η οποία είναι γνωστή με το όνομα Nelson-Aalen εκτιμητής της συνάρτησης επιβίωσης S( t ). Προφανώς ισχύει και ότι ^ ^ SNA t S t ( ) ( ). Διακύμανση: Αναφορικά με τη διακύμανση του εκτιμητή έχουν προταθεί διάφορες εκτιμήσεις, για την εκτίμηση της ποσότητας V H ( t) ^ ^ NA χρησιμοποιείτε ο τύπος του Tsiatis ενώ για την εκτίμηση της ποσότητας V SNA( t) τύπος του Greenwood. ^ ^ χρησιμοποιείτε ο Οι τύποι που αναφέρθηκαν προηγούμενα είναι οι V HNA( t) ^ ^ = d (Tsiatis) j 2 jt : j < trj Διαστήματα Εμπιστοσύνης: Ένα προσεγγιστικό διάστημα εμπιστοσύνης για την H( t ) είναι το ακόλουθο: H ( t) z V H ( t) ^ ^ ^ ± NA a/2 NA Και το αντίστοιχο διάστημα εμπιστοσύνης για την συνάρτηση επιβίωσης είναι: ^ S t ( ) exp ± z V H ( t) NA a/2 NA ^ ^ 1.11 Μερικές παραμετρικές συναρτήσεις επιβίωσης Εκθετική κατανομή (1 παράμετρος) Συμβολίζουμε την εκθετική κατανομή με παράμετρο λ ως Exp( λ ) με συναρτήσεις πυκνότητας επιβίωσης και κινδύνου τις εξής: 23

24 ( ) λt f t = λe για t 0 ( ) ( ) ( ) S t λ ( t) ( ) ( ) t ( ) = λ( u) d( u) Λ t = f ud u = e t f t = S t t 0 0 ( ) = λd u = λt λt = λ σταθερος κινδυνος Το κύριο χαρακτηριστικό της εκθετικής κατανομής είναι ότι έχει σταθερή συνάρτηση κινδύνου το οποίο οφείλεται στην έλλειψη μνήμης της εκθετικής κατανομής Κατανομή Weibull ( 2 παράμετροι) Γενικεύοντας την εκθετική: ( ) S t = e ( ) = ( ) = t κ 1 λ = κλt κ κ 1 λt f t S t κλt e ( t) κ λt t ( t) λ( ) Λ = udu= λt 0 κ Η παράμετρος λ καλείται παράμετρος κλίμακας και η κ παράμετρος μορφής και χρησιμοποιείται ο συμβολισμός W( λ, κ ). Για κ=1 η κατανομή Weibull ανάγεται στην εκθετική κατανομή με παράμετρο λ, δηλαδή W( λ,1) = Exp( λ) Στην περίπτωση που 0< κ < 1 φθίνουσα συνάρτηση κινδύνου 24

25 Για κ > 1 αύξουσα συνάρτηση κινδύνου Κατανομή Rayleigh Μετασχηματισμός της εκθετικής κατανομής με 2 παράγοντες και με λ t = λ + λt συνάρτηση κινδύνου της μορφής: ( ) Κατανομή Γάμμα Για την κατανομή Γάμμα με παραμέτρους λ (παράμετρος κλίμακας) και κ (παράμετρος μορφής) συμβολίζεται με G( λ, κ ) η συνάρτηση πυκνότητας, η συνάρτηση επιβίωσης και η συνάρτηση κινδύνου είναι οι εξής: ( ) f t ( ) κ 1 ( ) Γ( κ) λt λ λt e =, για t 0 λ,κ>0 1 S( t) = 1 I( κ, λt) = 1 Γ h t ( ) ( ) f t = S t ( κ) λt κ 1 u u e du Η συνάρτηση επιβίωσης και η συνάρτηση κινδύνου της κατανομής G( λ, κ ) εκφράζονται συναρτήσει της μη πλήρους Γάμμα συνάρτησης ( ) Η συνάρτηση κινδύνου της κατανομής G( λ, κ ): 0 I κ, x κ, x> 0 1. Για κ=1 ανάγεται στην εκθετική κατανομή με παράμετρο λ, δηλαδή ( ) = ( λ) G λ,1 exp. 2. είναι αύξουσα για κ > 1 3. είναι φθίνουσα για 0< κ < Gompertz-Makeham κατανομή 25

26 Η Gompertz-Makeham κατανομή είναι χρήσιμη για παρατηρήσεις με μικρές ακραίες τιμές περικομμένη στο 0. Το μοντέλο της Compertz κατανομής για την οποία έχουμε ότι: αt λ at f ( t) = λe exp ( 1 e ), t 0, λ, α > 0 α λ αt S( t) = exp ( 1 e ) α ( ) h t = λe αt Κεφάλαιο 2 Μοντέλο του Cox 2.1 Μοντελοποίηση δεδομένων Επιβίωσης Για κάθε ασθενή της μελέτης μπορεί να έχουν καταγραφεί από το μελετητή χαρακτηριστικά όπως η ηλικία το φύλο, ο καρδιακός ρυθμός, οι συνήθειες του όπως το κάπνισμα η διατροφή και άλλα χαρακτηριστικά τα οποία μπορούν να επηρεάσουν τους χρόνους επιβίωσης και την επίδραση των οποίων θα επιθυμούσαμε να μελετήσουμε. Θα κατασκευάσουμε για τον παραπάνω λόγο γενικευμένα γραμμικά μοντέλα για τον κίνδυνο θανάτου για τους εξής λόγους: 1. Για να βρούμε τον πιθανό συνδυασμό ανεξάρτητων τυχαίων μεταβλητών που επηρεάζει την μορφή της συνάρτησης κινδύνου. 2. Για να εκτιμήσουμε την συνάρτηση κινδύνου για κάθε ασθενή και κατά συνέπεια τη συνάρτηση επιβίωσης από τη γνωστή σχέση ( ) λ ( ) S t = exp[ u du]. t 0 26

27 . Για τους παραπάνω λόγους μελετούμε το ευρέως διαδεδομένο μοντέλο των ανάλογων κινδύνων (PH model). λ ( tz j i) = λ0( t) Ψ ( Z) Ψ Ζ = Πολύ συχνά ο δεύτερος όρος του γινομένου συναντάτε ως ( ) Z e β Σχετικά με το διάνυσμα των συμμεταβλητών Ζ αυτό μας δίνει πληροφορίες για διάφορα άλλα χαρακτηριστικά/ιδιότητες του κάθε υποκειμένου της έρευνας. Γενικά το Ζ είναι δυνατό να περιέχει 1. Συνεχείς ευμετάβλητους παράγοντες (π.χ ηλικία, πίεση αίματος) 2. Διακριτούς παράγοντες (π.χ φύλο, οικογενειακή κατάσταση) 3. Πιθανές αλληλεπιδράσεις Το μοντέλο ανάλογων κινδύνων υποθέτει ότι ισχύει : N «πραγματικές» συναρτήσεις επιβίωσης δεν τέμνονται λ ψλ = δηλαδή οι Σε αυτή την περίπτωση λέμε ότι οι κίνδυνοι για τις δύο ομάδες ασθενών είναι ανάλογοι, δηλαδή η αναλογία παραμένει σχεδόν σταθερή με την πάροδο του χρόνου. Στην περίπτωση που τέμνονται οι συναρτήσεις επιβίωσης η αναλογία είναι περίπου 1. Επιστέφοντας στην σχέση των δύο θεραπειών με n συμβόλισα την νέα και s την τυπική, επίσης με ψ συμβόλισα το λόγο των κινδύνων θανάτου t για ένα άτομο υπό τη νέα θεραπεία σε σχέση με ένα άτομο υπό την τυπική θεραπεία. Αν ψ<1 τότε ο κίνδυνος θανάτου είναι μικρότερος για τη νέα θεραπεία. S Αν ψ>1 τότε ο κίνδυνος θανάτου είναι μικρότερος για την τυπική θεραπεία. 2.2 Μοντέλο ανάλογων κινδύνων του Cox Το μοντέλο ανάλογων κινδύνων του Cox είναι το γενικότερο των μοντέλων παλινδρόμησης επειδή δεν είναι βασισμένο σε οποιεσδήποτε υποθέσεις σχετικά με τη φύση ή τη μορφή της βασικής κατανομής επιβίωσης. Το πρότυπο υποθέτει ότι το ποσοστό κινδύνου της βασικής συνάρτησης (παρά το χρόνο επιβίωσης) είναι μια 27

28 λειτουργία των ανεξάρτητων μεταβλητών (covariates) καμία υπόθεση δεν γίνεται για τη φύση ή τη μορφή της συνάρτησης κινδύνου. Κατά συνέπεια, από μία άποψη, το μοντέλο παλινδρόμησης Cox μπορεί να θεωρηθεί μια μη παραμετρική μέθοδος. Το παραπάνω μοντέλο μπορεί να γραφεί με την παρακάτω μορφή ( j i) = ( ) λ tz λ0 t exp( βz) Αποτελεί το πιο συνηθισμένο μοντέλο για δεδομένα επιβίωσης αφού 1. είναι εύκολη η επιλογή των συμμεταβλητών του διανύσματος Ζ 2. είναι εύκολο στην προσαρμογή υπάρχει ποικιλία λογισμικού Καλείται μοντέλο ανάλογων κινδύνων αφού: υποθέτοντας Ζ=1 για ομάδα ατόμων εντός θεραπευτικής αγωγής και Ζ=0 για μία βασική ομάδα εκτός αγωγής οι αντίστοιχες συναρτήσεις κινδύνου είναι οι λ 1( t) και λ 0( t). Μπορώ λοιπόν να γράψω λ ( t) = λ( t Ζ= 1) = λ exp( βz) = λ exp( β) 1 j 0 0 Επιπλέον αν χρησιμοποιήσω την αναλογία των συναρτήσεων κινδύνου για τις άλλες δύο τυχαίες ομάδες όπου Ζ=x και Z=0, προκύπτει: ( jζ= ) ( tjζ= 0) ( ) exp( ) λ ( t) λ t x λ t βx λ 0 = = 0 exp ( βx) Το οποίο δείχνει ξεκάθαρα οι ανεξάρτητες μεταβλητές υπεισέρχονται στη συνάρτηση κινδύνου με «πολλαπλασιαστικό τρόπο». ( ) ( ) λ1 t β Και θεωρώ με φ την αναλογία κινδύνουφ = = e lnφ = β λ t 0 Ο Cox επίσης εισήγαγε μία μέθοδο για την εκτίμηση του β και κατ επέκτασιν της αναλογίας κινδύνου επιτρέποντας έτσι την χρησιμοποίηση κάποιας αυθαίρετης βασικής συνάρτησης κινδύνου. Αυτή η μέθοδος βασίζεται διαμόρφωση της μερικής πιθανοφάνειας. Η εκτίμηση του β μας επιτρέπει να προσδιορίσουμε αριθμητικά 28

29 το σχετικό ρυθμό αποτυχίας για ένα άτομο με διάνυσμα μεταβλητών x 1 με αναφορά σε κάποιο άτομο με αντίστοιχο διάνυσμα x 2. Για παράδειγμα στη σύγκριση αγωγών που μπορεί να γίνει με το βασικό μοντέλο ανάλογων κινδύνων του Cox έστω λ ψλ Β 1 = με e β Α ˆ ψ = και μία εκτιμωμένη τιμή 1 ˆ β = 0.8. Αυτό σημαίνει ότι ο ρυθμός αποτυχίας για τους ασθενείς που χρησιμοποίησαν το φάρμακο B είναι 0,45 φορές λιγότερος από ότι οι ασθενείς που χρησιμοποίησαν το ˆ 0.8 β1 φάρμακο Α εφόσον e = e = Στην πλειοψηφία τους τα ευρέως χρησιμοποιούμενα στατιστικά πακέτα εκτός από τον άμεσο υπολογισμό της παραμέτρου β δίνουν και το τυπικό σφάλμα του, δηλαδή το SE( ˆβ 1). Παρέχεται η δυνατότητα να ελέγξω την μηδενική υπόθεση της ισότητας μεταξύ των συναρτήσεων η οποία είναι ισοδύναμη με την υπόθεση ότι 1 ˆβ =0 εφόσον 1 0 e =. Μία μέθοδος για να ελέγξω αυτή την υπόθεση είναι να υπολογίσω το στατιστικό Z το οποίο ισούται με z= ˆ β ˆ 1 / SE( β1). Εν συνεχεία ανατρέχω στον στατιστικό πίνακα της κανονικής κατανομής και μπορώ να βγάλω το ανάλογο συμπέρασμα είτε απορρίπτοντας είτε αποδεχόμενοι την μηδενική υπόθεση. 2.3 Συνάρτηση Αναφοράς Όπως παρατηρήθηκε και προηγουμένως χρησιμοποιήθηκε η λ 0( t) ως συνάρτηση κινδύνου της βασικής ομάδας ελέγχου. Η λ 0( t) καλείται αναφορική συνάρτηση κινδύνου και απεικονίζει τη συνάρτηση κινδύνου για υποκείμενα της έρευνας των οποίων όλες οι ανεξάρτητες μεταβλητές Z1K Zp είναι ίσες με 0. Η γενική μορφή είναι λ( tz j i) = λ0( t) exp( β1ζ 1+ + βpzp) δηλώσει ότι Z=0 λ( tz ) λ ( t) exp( 0) λ ( t) j i 0 0 K και εφόσον έχω = =. Το γενικευμένο γραμμικό μοντέλο που προκύπτει λογαριθμίζοντας είναι: ( t) ( t) λ i log = β1x1 ι + + β x λ K 0 p pi 29

30 Προκύπτει πως το μοντέλο ανάλογων κινδύνων του Cox είναι ένα γραμμικό μοντέλο για το δεκαδικό λογάριθμο (Log) της αναλογίας των συναρτήσεων κινδύνου. Ένα από τα μεγαλύτερα πλεονεκτήματα του μοντέλου ανάλογων κινδύνων του Cox είναι η δυνατότητα εκτίμησης των παραμέτρων β οι οποίες και αντικατοπτρίζουν τις επιδράσεις της αγωγής και των άλλων ανεξάρτητων μεταβλητών χωρίς να κάνω καμία υπόθεση για την βασική συνάρτηση κινδύνου λ 0( t ). Αυτό σημαίνει ότι δε χρειάζεται να υποθέσω πως η ( ) συγκεκριμένο παραμετρικό μοντέλο. λ t 0 ακολουθεί ένα Το γεγονός αυτό κάνει το μοντέλο ανάλογων κινδύνων του Cox Ημι-παραμετρικό. 2.4 Συνάρτηση Κινδύνου στο μοντέλο Cox Η συνάρτηση κινδύνου των ασθενών που είχαν ως διάνυσμα μεταβλητών το 0 είναι t 0 0 και είναι δυνατό να συμβολιστεί ως 0 ( ) = λ ( ) = Λ ( ) S t,0 exp[ u du] exp[ t ] ( ) 0 S t. Και η αντίστοιχη ομάδα με διάνυσμα μεταβλητών ( 1,0) συνάρτηση επιβίωσης β1 ( ) ( ) ( ) expβ1 { } ( ) S t, x = exp[ Λ 0 t e ] = exp[ Λ 0 t ] = S0 t 2.5 Κατηγορικές Τυχαίες μεταβλητές x= έχει expβ1 Δεχόμενοι ότι μας απασχολεί η αξιολόγηση της επίδρασης στην επιβίωση του μεγέθους του όγκου σε ασθενείς με καρκίνο του πνεύμονα, συμπεριλαμβάνω στο μοντέλο του Cox δίτιμες τυχαίες μεταβλητές, όπως η αγωγή και η ομάδα προϊστορίας.. Υποθέτουμε ότι υπάρχουν τρεις κατηγορίες όγκων, αυτοί με βαθμό 3 με βαθμό 4 και μία ενδιάμεση ομάδα με βαθμό 3-4. Σε αυτές τις περιπτώσεις μας απασχολεί εάν ο βαθμός του όγκου επιδρά στην πρόγνωση του καρκίνου ή όχι. Ένας τρόπος για να διερευνήσουμε το παραπάνω ζήτημα είναι να προσαρμόσουμε στο μοντέλο Cox τις δείκτριες μεταβλητές για να περιγράψουμε την έννοια του βαθμού ενός καρκινικού όγκου. Αρχικά δημιουργούμε, στην περίπτωση μας δύο, δείκτριες μεταβλητές τις g 1 και g 2 ως ακολούθως: 30

31 g 1=1 ενδιάμεσος βαθμός όγκου 3-4 g 1=0 διάφορος του 3-4 g 2=1 βαθμός όγκου 4 g 2=0 διάφορος του 4 Με αυτό τον τρόπο η κατάταξη των ομάδων σε κατηγορίες ανταποκρίνεται πλέον σε διαφορετικά ζευγάρια τιμών της μεταβλητής g. Για παράδειγμα το ζευγάρι g 1=0, g 2=0 αντιστοιχεί στον όγκο βαθμού 3 εφόσον δεν ανήκει σε καμία άλλη ομάδα. Παρόμοια μπορώ να καταλήξω και στους δύο εναπομείναντες βαθμούς. Το μοντέλο Cox για τον βαθμό του όγκου, αγνοώντας πάλι επιπλέον πιθανές μεταβλητές, είναι το εξής: B= logλ = γ g + γ g Το παραπάνω μοντέλο μπορεί να προσαρμοστεί σε δεδομένα με τον ίδιο τρόπο όπως εξηγήθηκε προηγούμενα. Σε αυτό το μοντέλο υπάρχουν δύο συντελεστές παλινδρόμησης οι γ1και γ 2 για να εκτιμηθούν. Και οι δύο συντελεστές σχετίζονται με το βαθμό του όγκου. Γενικά αν μία κατηγορική μεταβλητή έχει g κατηγορίες τότε οι d-1 βωβές μεταβλητές είναι αναγκαίο να κατασκευαστούν για τους αντίστοιχους όρους ενός Cox μοντέλου και συνακόλουθα είναι αναγκαίο να εκτιμηθούν g-1 συντελεστές παλινδρόμησης. 2.6 Αξιολόγηση μεταβλητών ενός Cox μοντέλου. Ένα μοντέλο ανάλογων κινδύνων του Cox πρέπει να περιέχει όσο το δυνατόν λιγότερες μεταβλητές γίνεται και να περιγράφει επαρκώς τα δεδομένα. Έτσι εάν σημαντικό πρόβλημα που προκύπτει είναι πως θα επιλεγούν αυτές οι μεταβλητές οι οποίες θα συμπεριληφθούν στο τελικό μοντέλο. Τα βήματα για να γίνει η επιλογή είναι: 1)Αρχικά να ελεγχθεί αν οι υποθέσεις των επιλεγμένων κλάσεων των μοντέλων ικανοποιούνται στα συγκεκριμένα δεδομένα που δίνονται 31

32 2)Έπειτα ορίζεται ένα βασικό σχέδιο για να επιλεχθούν οι μεταβλητές στον γραμμικό εκτιμητή, εάν πολλές επεξηγηματικές μεταβλητές είναι υποψήφιες προς αποκλεισμό. 3)Αξιολογείται η ικανότητα προσαρμογής η οποία είναι ουσιαστικά η δυνατότητα που έχει το μοντέλο ώστε να περιγράψει τις μεταβλητές που θα προκύψουν αφού γίνει η προσαρμογή του μοντέλου. 2.7 Προσαρμογή του μοντέλου ανάλογων κινδύνων. β1x1+ β2x2+ K+ βpxp Θεωρώ λοιπόν το μοντέλο λ ( ) = λ ( t) i t e 2. Θέλω να εκτιμήσω τους συντελεστές β1k β στο μοντέλο του Cox. Επίσης είναι αναγκαίο να εκτιμηθεί και η λ 0( t). p Χρήση της μεθόδου μεγίστης πιθανοφάνειας για την εκτίμηση. Τα δεδομένα της μελέτης θα είναι: για n άτομα, με r γεγονότα και n-r δεξιά λογοκριμένες τιμές. Υποθέτουμε ότι οι χρονικές στιγμές των γεγονότων είναι διαφορετικές για τα r άτομα και συμβολίζω τους διατεταγμένους χρόνους εμφάνισης των γεγονότων με t ( 1) < t ( 2) < K < t ( r) ( ) Συμβολίζω με R t ( j) τον αριθμό των ατόμων σε κίνδυνο στο χρόνο t ( j). Η πιθανοφάνεια είναι L( p) = r j= 1 T exp β x ~ ~ exp ~ l R( t( j) ) x x ( j) T β x p ~ με ( j) x το διάνυσμα των ~ τιμών για τις τυχαίες μεταβλητές 1K για το άτομο που πεθαίνει τη χρονική στιγμή t ( j). Επίσης p l R( t( )) ~ j p T exp β x το άθροισμα των τιμών e ~ β ~ T x των ατόμων 32

33 σε κίνδυνο στο t ( j). Η παραπάνω σχέση γράφεται και ως L ( β) T β x i ~ n e = T β x i j= 1 ~ e l R( ti) δ i με δi = 1, αν στον t ( i) εχω γεγονος δi = 0, αλλιως Και λογαριθμίζοντας log ~ ~ ~ i ι> 1 l R( ti ) m T x T i ~ L β = δi β x log e β Και η μεγιστοποίηση γίνεται με τη μέθοδο Newton-Raphson. Για την κατασκευή της πιθανοφάνειας στηριχθήκαμε στους χρόνους επιβίωσης. Η πιθανότητα να είναι t ij ο χρόνος θανάτου του (i) ατόμου δεδομένου ότι ο χρόνος αυτός είναι χρόνος γεγονότος (ένας από τους r) αποτυπώνεται ως πιθανότητα: P ατοµο µε x πεθανε στο χρονο t ~ ( ) ( j j ) έχω ένα θάνατο στο χρόνο ( j) βοήθεια των δεσμευμένων πιθανοτήτων P( A / B) ( ) ( ) P AB = = P B λi( t( j) ) λl( t( j) ) l R t ( ( j) ) t με τη Προκύπτει: e l R t T β x( j) ~ e ( j) T β x ~ ~ l και παίρνουμε το γινόμενο για τους r χρόνους θανάτου. Η συνάρτηση πιθανοφάνειας που κατασκευάστηκε ονομάζεται μερική συνάρτηση πιθανοφάνειας γιατί δεν περιλαμβάνει τους χρόνους επιβίωσης (Partial Likelihood function). Τότε το μοντέλο με τους εκτιμώμενους συντελεστές είναι: λ ( t) ( t) ˆ log i = β1x1 + K + βpxp λ Σύγκριση εναλλακτικών μοντέλων ˆ 33

34 Έστω ότι έχω προς σύγκριση 2 μοντέλα Cox το λ ( t) ( t) log i = β1x1 + K + βpxp λ0 Και το λ ( t) ( t) log i = β1x1 + K+ βpxp+ βp+ 1xp+ 1+ K + βp+ qxp+ q λ0 Όπως είναι εύκολο να παρατηρηθεί το πρώτο μοντέλο εμπεριέχεται στο δεύτερο. Απομένει ο έλεγχος της υπόθεσης H0 : βp 1= K = βp q = 0 έναντι της εναλλακτικής HA : βi 0 για καποιο i ( ) ( ) + +. Χρησιμοποιώντας ως ελεγχοσυνάρτηση Lˆ 1 την 2log την οποία και συγκρίνω με την Χ-τετράγωνο κατανομή με L ˆ q 2 βαθμούς ελευθερίας. 2 Xq Ως L(β) έχω την ακόλουθη ποσότητα L ( β) = e l R t T β x( j) ~ e ( j) T β x ~ ~ l και έπειτα αντικαθιστώ τους εκτιμητές της μέγιστης πιθανοφάνειας. Κεφάλαιο 3 Μοντέλο Επιταχυνόμενων χρόνων επιβίωσης Το μοντέλο επιταχυνόμενων χρόνων ζωής ανήκει στις παραμετρικές μεθόδους εκτίμησης και υποθέτοντας ότι Τ ι μία τυχαία μεταβλητή που απεικονίζει το χρόνο αποτυχίας για το i_οστό υποκείμενο της έρευνας και έστω xi1, xi 2, K, xip οι τιμές των p μεταβλητών για το ίδιο υποκείμενο τότε το μοντέλο έχει ως γενική μορφή την: log( T i ) = β0+ β1x i 1+ K + β p x ip + σει με ε ι τον όρο της τυχαίας διαταραχής, log( T i ) τον λογάριθμο κάποιου χρόνου ζωής, β,, 0 K βp και σ τις προς εκτίμηση 34

35 παραμέτρους. Ισοδύναμα και θεωρώντας ως Ζ ι το διάνυσμα των τιμών xπροκύπτει το: log( T ) = β * Z + σε i AFT i Παρατηρούμε από τα παραπάνω ότι είναι δυνατό να μοντελοποιηθούν οι λογαριθμοποιημένοι χρόνοι ζωής ως μία γραμμική συνάρτηση των μεταβλητών. 3.1 Προσαρμογή της συνάρτησης επιβίωσης Weibull στο μοντέλο επιταχυνόμενων χρόνων επιβίωσης. Μελετήθηκε στα εισαγωγικά της ανάλυσης επιβίωσης στο κεφάλαιο των παραμετρικών συναρτήσεων η κατανομή Weibull. Μπορούμε σε αυτό το σημείο να παρατηρήσουμε πως αυτή προσαρμόζεται στο μοντέλο των επιταχυνόμενων χρόνων ζωής. Από το λογάριθμο-γραμμικό μοντέλο προκύπτει ότι η συνάρτηση επιβίωσης είναι exp ( ) ( T T β Ζ exp β Ζ ) T a a S( t Z) = exp( λ exp( β Ζ ) t ) = exp( λt ) = S0( t) όπου ( ) 0 S t είναι η συνάρτηση επιβίωσης της κατανομής (, ) Επίσης κάνοντας χρήση της σχέσης h( t) ( ) W λ α. S t = προκύπτει ότι όπου η S t βασική συνάρτηση κινδύνου είναι η συνάρτηση κινδύνου της κατανομής W( λ, α ).Αντικαθιστώντας το θ = β = γ διαδοχικά προκύπτει αρχικά για τη α συνάρτηση επιβίωσης Τ ( ) ( ) ( ) a Τ ( ) ( ) α T ( ) 0 ( ) S t Z = exp λ exp aθ Ζ t = exp λ t exp θ Ζ = S t exp θ Z T πλέον η συνάρτηση επιβίωσης είναι η S( t Z) = S 0 t exp( θ Z) Αντίστοιχα η συνάρτηση κινδύνου Τ α 1 ( ) = λ exp( θ Ζ) α T T = exp( θ Ζ) λα t exp( θ Ζ) T T = exp( θ Ζ) h 0 t exp( θ Z) h t Z a t α 1 35

36 Το παραπάνω μοντέλο το οποίο έχει ως συνάρτηση επιβίωσης T την S( t Z) = S 0 t exp( θ Z) T T ( ) = exp( θ Ζ) 0 exp( θ ) και ως συνάρτηση κινδύνου την h t Z h t Z καλείται μοντέλο των επιταχυνόμενων χρόνων αποτυχίας-ζωής (accelerated failure time model AFT model). Ο βασικός λόγος για την ονομασία του μοντέλου ως μοντέλο επιταχυνόμενων κινδύνων είναι ο όρος exp( T Z) θ ή αλλιώς ο παράγοντας επιτάχυνσης ο οποίος μας πληροφορεί για το πόσο αλλάζει η κλίμακα του χρόνου στην συνάρτηση αναφοράς όταν μεταβληθεί η τιμή των συμμεταβλητών από 0 σε Ζ. H συνάρτηση αναφοράς που υπολογίζεται στο χρονικό σημείο 0 είναι η: S t Z S 0 t S 0 t T ( = 0) = e x p( θ 0) = ( ) Έστω οι χρόνοι 0 Z tpκαι t p. Οι αντίστοιχες συναρτήσεις επιβίωσης σύμφωνα με τα 0 0 παραπάνω είναι S( tp Z 0) S0( tp) 1 p Z Z T διάφορο του μηδενικού ( p ) 0 p ( θ ) = = = και όταν το διάνυσμα είναι ( ) S t Z = 0 = S t exp Z = 1 p. Όπως είναι εμφανές η σχέση η οποία συνδέει τους 2 χρόνους ζωής είναι η 0 Z T Z t = t exp θ Z = t exp γ Τ Ζ. ( ) ( ) p p p Άρα μία επιπλέον σημασία του παράγοντα επιτάχυνσης είναι αυτή η οποία δίνεται με τη βοήθεια του p-ποσοστιαίου σημείου του χρόνου ζωής ενός ατόμου στο οποίο όπως φαίνεται αντιστοιχεί διάνυσμα συμμεταβλητών 0 Z = και είναι exp( θ T Z) φορές το αντίστοιχο p-ποσοστιαίο σημείου των συμμεταβλητών που γενικώς είναι διάφορες του μηδενός. Αξίζει να σημειωθεί ότι το παραμετρικό Weibull μοντέλο όπως και το εκθετικό είναι τα μοναδικά που έχουν αναπαράσταση και ως μοντέλα αναλογικών κινδύνων αλλά και ως μοντέλα επιταχυνόμενων χρόνων. Συγκεκριμένα Εκθετικό Μοντέλο Θεωρώντας ως χρόνους αποτυχίας τους T T( Z ) i = οι οποίοι ακολουθούν εκθετική κατανομή. Η συνάρτηση επιβίωσης η οποία χαρακτηρίζει τα δεδομένα i t είναι Si( t) = e λ με λi exp( β ι) χρόνων είναι το log( T ) = βz + ε µε exp( ε ) ~ e( 1) i i = Ζ και το αντίστοιχο μοντέλο επιταχυνόμενων i 36

37 Weibull μοντέλο Θεωρούμε ως χρόνους αποτυχίας τους T T( Z ) κατανομή. Η συνάρτηση επιβίωσης είναι η ( ) i i = που ακολουθούν την Weibull k i t S t = e λ με λ = exp( βζ ) Το μοντέλο επιταχυνόμενων κινδύνων για χρόνους που ακολουθούν Weibull κατανομή είναι το: log( T ) = σβz + σε µε exp( ε ) ~ e( 1) i i i i ι Επομένως τα μοντέλα Weibull και εκθετικό μπορούν να γραφτούν ως λογαριθμογραμμικά μοντέλα των χρόνων επιβίωσης. Η λογαριθμο-γραμμική αυτή μορφή για το εκθετικό μοντέλο μπορεί να παραχθεί με δύο κυρίως τρόπους είτε: 1. Δημιουργώντας μία νέα μεταβλητή T = T ( βz ) 2. Λογαριθμίζοντας το Z T, log( T ) Z Z 0 *exp T 0 = log exp ( βzi) Αναφορικά με την 1 η περίπτωση υπενθυμίζεται ότι η συνάρτηση επιβίωσης λ ενός εκθετικού μοντέλου είναι: S ( t) = PT ( t) = e t, µε λ= exp( βz ) Έπεται ότι T 0 ~ exp( 1) i Z i i Και η βασική συνάρτηση επιβίωσης ( ) = ( ) = PT ( Z exp ( βz) t) = P TZ t exp( βz) = exp λt exp( βz) S t P T t 0 0 ( ) Αντικαθιστώντας το λ προκύπτει S ( t) = βζt ( βz) = ( t) 0 exp exp( ) exp exp 37

38 Συνεχίζοντας, λογαριθμίζεται ο χρόνος επιβίωσης έτσι ώστε να μελετήσω και τη δεύτερη περίπτωση ( ) T T = = T Ζι ( 0) ( ( β )) 0 log Z log log log exp exp( βζι) από τις ιδιότητες του εκθετικού μοντέλου ακολουθεί ότι: log ( ) log( ) T = βz + T = βz + ε όπου Z i 0 i και 3.2 Σχέση του εκθετικού και του Weibull μοντέλου. Θεωρώντας ότι οι χρόνοι αποτυχίας TZ ακολουθούν την Weibull κατανομή γεγονός S t e λ το οποίο συνεπάγεται μια συνάρτηση επιβίωσης της μορφής ( ) t k ( β ) λ = exp Ζ τότε δημιουργώντας μία νέα μεταβλητή ότι ισούται με ι i = με * T Z μπορώ να υποθέσω k T Z και ακολουθεί μία εκθετική κατανομή με παράμετρο * λ = exp( βζ ι). Συνεπάγεται ότι log( T ) = βzi+ ε. Όμως εφόσον T = T * k τότε και log( T ) = log( T ) = k *log( T ) και συνεπώς * ( log( T )) ( 1 )( ) log( T ) = = βzi+ ε = σβz k k i+ σε εφόσον βέβαια αντικαταστήσω το σ µε 1/k. * k Z Z Μπορώ να καταλήξω στον παρακάτω ορισμό του μοντέλου επιταχυνόμενων χρόνων log( T ) = β * Z + σε με εξαρτημένη μεταβλητή το λογάριθμο μιας i AFT i τυχαίας μεταβλητής επιβίωσης και με βaft συνάρτηση κινδύνου λ exp( βz) =. σβ = e το οποίο e β προέρχεται από τη Το ιδιαίτερο χαρακτηριστικό, όπως έχει αναφερθεί και παραπάνω, του μοντέλου επιταχυνόμενων χρόνων είναι: S( t Z) = S ( t) = S ( φt) ; i 0 Η παραπάνω σχέση των συναρτήσεων επιβίωσης καθιστά φανερή την επίδραση των μεταβλητών η οποία είτε επιταχύνει είτε επιβραδύνει την κλίμακα του χρόνου. 3.3 Επίδραση του μοντέλου επιταχυνόμενων χρόνων στη συνάρτηση κινδύνου. Όπως και στη συνάρτηση επιβίωσης ο παράγοντας που διαφοροποιεί ένα απλό μοντέλο από ένα μοντέλο επιταχυνόμενων κινδύνων είναι ο παράγοντας φ. 38

39 Συγκεκριμένα λ ( ) φλ ( φt) i t =. Ένας τρόπος για να μεταφράσω το μοντέλο 0 επιταχυνόμενων χρόνων είναι μέσω της επίδρασης στη διάμεσο των χρόνων επιβίωσης. Αν λοιπόν S ( t) S ( φt) i = 0.5, τοτε = 0.5 Γεγονός το οποίο σημαίνει ότι M = φm 0. Και για τις διάφορες τιμές του φ ξεχωρίζω κάποιες περιπτώσεις i δηλαδή: 0 1. Για φ <1, παρατηρείται μια επιτάχυνση σχετικά με το χρόνο που συμβαίνει το γεγονός. Αν λοιπόν M 0=2 χρόνια και ο παράγοντας φ = 0.5 τότε προφανώς M i = 1χρόνος. Το φ δρα ως παράγοντας που επιταχύνει τον χρόνο κατάληξης του ασθενούς. 2. Για φ >1, παρατηρείται μια επιμήκυνση ή καθυστέρηση στο χρόνο που συμβαίνει το γεγονός 3. Γενικά λοιπόν, ο χρόνος ζωής ενός ατόμου (έστω i)είναι φ φορές επί το χρόνο που παρατηρείται στην ομάδα αναφοράς. Πότε μπορούν να ταυτιστούν τα μοντέλα ανάλογων κινδύνων και επιταχυνόμενων χρόνων αποτυχίας; Σύμφωνα με το μοντέλο ανάλογων κινδύνων S( t) = S ( t) ( βζ ) 0 exp i ( ) Και αντίστοιχα για το μοντέλο επιταχυνόμενων χρόνων S( t) = S ( t) t ( βζ ) T ~ Weibull λ,κ. Τοτε λ t = λκt Θεωρώ πως ( ) ( ) κ-1 i 0 exp i Υπό τις προϋποθέσεις του μοντέλου επιταχυνόμενων χρόνων: λ ( ) = φλ ( φt) i t 0 βzi βzi λ0( t) ( ) ( κ 1 βz ) i βzi λκ 0 t βz κ i κ-1 ( ) λ0 κ βzi ( ) λ0( t) =e e =e e = e κt = e 39

40 Το οποίο όμως θυμίζει το μοντέλο ανάλογων κινδύνων: λ ( ) exp( β ) λ ( t) i t = Ζ. Όπως είναι φανερό το μοντέλο επιταχυνόμενων χρόνων που προέρχεται από την οικογένεια των Weibull κατανομών είναι το μοναδικό που συμπίπτει με το μοντέλο των ανάλογων κινδύνων. ι 0 40

41 Κεφάλαιο 4 Χρονικά μεταβαλλόμενες μεταβλητές Ως χρονικά μεταβαλλόμενες ή χρονικά εξαρτημένες μεταβλητές (time-varying variables) καλούνται εκείνες οι μεταβλητές οι οποίες μεταβάλλουν την τιμή τους με την πάροδο του χρόνου. Ενδεικτικά κάποιες χρονικά εξηρτημένες μεταβλητές είναι: 1. Η αθροιστική έκθεση σε κάποιον παράγοντα κινδύνου 2. Κατάσταση καπνίσματος 3. Μεταμόσχευση (π.χ καρδιάς ή νεφρού) Συγκεκριμένα επιλέγω την δίτιμη απεικόνιση δηλαδή τιμή 0 για την κατάσταση πριν τη μεταμόσχευση και 1 μετά από αυτή. 4. Αρτηριακή πίεση Θεωρούμε ένα διάνυσμα τέτοιου είδους μεταβλητών το οποίο για το i-οστό ( 1,, ) = K και υποκείμενο της μελέτης συμβολίζεται ως Z ( t) Z ( t) Z ( t) i i iq αντιστοιχεί στο χρονικό σημείο t. Ο συγκεκριμένος συμβολισμός μας επιτρέπει να συμβολίσουμε και τις χρονικά μεταβαλλόμενες μεταβλητές. Για παράδειγμα εάν η j-οστή μεταβλητή είναι χρονικά μεταβαλλόμενη τότε το Z ij διάνυσμα παραμένει σταθερό με τη πάροδο του χρόνου. Με τη βοήθεια της μοντελοποίησης του ρυθμού κινδύνου είναι δυνατό να κατανοήσουμε και διαισθητικά την έννοια των χρονικά H μεταβαλλόμενων μεταβλητών. Θεωρώντας ως ( ) Z t την προϊστορία του H διανύσματος μέχρι το χρονικό σημείο t, έστω λοιπόν Z ( t) Z ( u) i i T { i,0 u t} =, τότε μπορούμε να ορίσουμε το ρυθμό κινδύνου στο χρονικό σημείο t δοθείσης της ( i ) H προϊστορίας ως λ t Z ( t) ( ) H P t Ti < t+ h Ti t, Zi t = lim h 0 h 41

42 Η παραπάνω σχέση απεικονίζει τον στιγμιαίο κίνδυνο αποτυχίας κατά το χρόνο t, H δοθέντος ότι το άτομο ήταν σε κίνδυνο το χρόνο t με προϊστορία ( ) Z t. Για έναν τέτοιο δεσμευμένο ρυθμό κινδύνου μπορούμε να θεωρήσουμε ένα μοντέλο ανάλογων κινδύνων τύπου ( ) H ( i ( )) ( ) H T H ( t Zi t ) 0( t) exp g( Zi ( t) ) λ = λ β όπου g Z t είναι το διάνυσμα μίας συνάρτησης της προϊστορίας των μεταβλητών το οποίο και επηρεάζει τον κίνδυνο. Είναι επιβεβλημένο όμως ο ερευνητής να είναι ιδιαίτερα προσεκτικός όσον αφορά ( i ) H τη χρήση της παράστασης ( ) g Z t, καθώς είναι δυνατό πίσω από αυτή την παράσταση να κρύβονται διαφορετικές συναρτήσεις. i 1. Μπορεί να χρησιμοποιηθεί η αθροιστική έκθεση στον παράγοντα κινδύνου με την απαραίτητη προγνωστική προσαρμογή (extrapolation). Για παράδειγμα H ( Zi ( t) ) = Zi( uij) uij ui( j 1) j ( ) g όπου u ij είναι οι μέρες στις οποίες έγιναν μετρήσεις πριν την ημέρα t. 2. Μέγιστη έκθεση μέχρι την ημέρα t H ( i ( )) g Z t 3. Μέγιστη έκθεση μέχρι την ημέρα t g uij< t ( ) Z u i ij = # ηµερων H ( Z ( t) ) max Z ( u ) { u t} i = i ij : ij < Μπορούμε επίσης να θεωρήσουμε και σύνθετα μοντέλα όπως το H H H H ( t Z ( t) ) = λ ( t) ( β g ( Z ( t) ) β g ( Z ( t) ) με g Z ( t) λ 0 exp + i 1 1 i 2 2 ( ) H αθροιστική έκθεση και g Z ( t) i 42 i ( ) i 1 την 2 την μέγιστη έκθεση μέχρι την ημέρα t. Στο τελευταίο μοντέλο μας δίνεται η δυνατότητα να ελέγξουμε εάν αυτά τα διαφορετικά στοιχεία της ιστορίας είναι σημαντικά για την επιβίωση ελέγχοντας εάν οι παράμετροι β 1,β 2 είναι στατιστικώς σημαντικές.

43 Πρέπει να είμαστε ιδιαιτέρως προσεκτικοί στην ερμηνεία των ρυθμών κινδύνου στις χρόνο-εξαρτώμενες μεταβλητές καθώς η συνάρτηση κινδύνου με αυτές δε χρησιμοποιείται απαραίτητα για την κατασκευή κατανομών συναρτήσεων επιβίωσης. Για παράδειγμα, στην περίπτωση που έχουμε μια χρονικά-ανεξάρτητη συμμεταβλητή Z τότε η υπό συνθήκη συνάρτηση επιβίωσης ( ) [ ] S t Z = P T t Z = e t λ ( ) 0 uz du Είναι καλά ορισμένη και αρκετά σημαντική. Αλλά, η ακόλουθη συνάρτηση S [ ] H ( t Z) PT t Z ( t) = μπορεί να μην είναι και τόσο χρήσιμη εφόσον η προϊστορία Z H ( t) μετρήθηκε όταν το υποκείμενο της έρευνας ήταν εν ζωή. Είναι αρκετά χρήσιμο να διαφοροποιήσουμε τις έννοιες ενδογενής και εξωγενής. 4.1 Εξωγενείς χρόνο-εξαρτώμενες μεταβλητές Μια εξωγενής ή συμπληρωματική χρονικά μεταβαλλόμενη μεταβλητή είναι αυτή της οποίας οι τιμές που παίρνει με την πάροδο του χρόνου σχετίζονται με έναν εξωγενή αλλά προκαθορισμένο κανόνα που όμως δεν σχετίζεται άμεσα με το άτομο. Για παράδειγμα εξωγενής προς το άτομο παράγοντες είναι τα επίπεδα της ατμοσφαιρικής ρύπανσης ή η ηλικία του ατόμου. Αναφορικά με την περίπτωση της ηλικίας αυτή θεωρείται ως μια σταθερή μεταβλητή με τιμή η οποία μετράται στην αρχή της έρευνας και εφόσον οι δοκιμές έχουν περιορισμένη διάρκεια. Εντούτοις μια μελέτη μακράς διαρκείας μπορεί να απαιτεί τη συμμετοχή της ηλικίας σαν μια χρόνο-εξαρτώμενη μεταβλητή εάν αυτή συμμετέχει σε αξιοσημείωτες αλλαγές του κινδύνου με την πάροδο κάποιου χρονικού διαστήματος. Μια σημαντικότατη εφαρμογή των καλώς ορισμένων χρόνοεξαρτώμενων μεταβλητών είναι για να ελεγχθεί η υπόθεση των ανάλογων κινδύνων στο μοντέλο του Cox με σταθερές μεταβλητές. Μια άλλη μορφή των εξωγενών μεταβλητών η οποία καλείται και επικουρική (ancillary) και παίρνει τιμές οι οποίες έχουν εκκίνηση μια στοχαστική διαδικασία 43

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Πανεπιστήμιο Αιγαίου

Πανεπιστήμιο Αιγαίου Πανεπιστήμιο Αιγαίου ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΑΝΑΛΟΓΙΣΤΙΚΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΑ ΜΑΘΗΜΑΤΙΚΑ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΕΠΙΒΙΩΣΗΣ ΜΕ ΑΝΤΑΓΩΝΙΣΤΙΚΟΥΣ ΚΙΝΔΥΝΟΥΣ- ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΣΕ ΔΕΔΟΜΕΝΑ ΑΠΟ ΓΥΝΑΙΚΕΣ

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Στατιστική. Εκτιμητική

Στατιστική. Εκτιμητική Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ F3W.PR09 Όνομα: Επίθετο: Ημερομηνία: 7/0/07 Πρωί: Απόγευμα: Θεματική ενότητα: Αναλογιστικά Πρότυπα Επιβίωσης Ερώτηση Εάν η τυχαία μεταβλητή Τ έχει συνάρτηση πυκνότητας f ep 3 3 να υπολογίσετε το 90 ο εκατοστημόριο

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς Καστοριά, Ιούλιος 14 A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας Διανύσματα Καστοριά,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0 ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής Δεσμευμένη αξιοπιστία Η δεσμευμένη αξιοπιστία R t είναι η πιθανότητα το σύστημα να λειτουργήσει για χρονικό

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 2 ου κεφαλαίου Σταύρος Χατζόπουλος 20/02/2017, 06/03/2017, 13/03/2017 1 Κεφάλαιο 2. Έλεγχος Απλών Υποθέσεων Τα προβλήματα ελέγχου υποθέσεων απορρέουν από παρατηρήσεις

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3. .. ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3. Ποιες μεταβλητές λέγονται ποσοτικές; 4. Πότε μια ποσοτική μεταβλητή

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Πεπερασμένες και Διαιρεμένες Διαφορές Εισαγωγή Θα εισάγουμε την έννοια των διαφορών με ένα

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) .5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην

Διαβάστε περισσότερα

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) 4. ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) Η μέθοδος της βηματικής παλινδρόμησης (stepwise regression) είναι μιά άλλη μέθοδος επιλογής ενός "καλού" υποσυνόλου ανεξαρτήτων μεταβλητών.

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.outras@e.aegea.gr Τηλ: 7035468 Μέθοδος Υπολογισμού

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

Τυχαία μεταβλητή (τ.μ.)

Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) είναι μια συνάρτηση X ( ) με πεδίο ορισμού το δειγματικό χώρο Ω του πειράματος και πεδίο τιμών ένα υποσύνολο πραγματικών αριθμών που συμβολίζουμε συνήθως

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β; σελ 1 από 5 ΚΕΦΑΛΑΙΟ 1 Ο Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β; 1. Σ-Λ Η σχέση με:, είναι συνάρτηση. 2. Σ-Λ Η σχέση είναι συνάρτηση.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

X = = 81 9 = 9

X = = 81 9 = 9 Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη

Διαβάστε περισσότερα

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη ΕΚΔΟΣΕΙΣ ΚΕΛΑΦΑ 59 Θέμα 1 ο (ΜΑΪΟΣ 004, ΜΑΪΟΣ 008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Έχουμε f (x+h) - f (x) = c - c = 0 και για h 0 είναι f (x + h) - f (x) 0 m

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

Θεωρητικές Κατανομές Πιθανότητας

Θεωρητικές Κατανομές Πιθανότητας Θεωρητικές Κατανομές Πιθανότητας Θεωρητικές Κατανομές Πιθανότητας Α. ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ α) Διακριτή Ομοιόμορφη κατανομή β) Διωνυμική κατανομή γ) Υπεργεωμετρική κατανομή δ) κατανομή Poisson Β. ΣΥΝΕΧΕΙΣ

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα. Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Μαθηματικά Ενότητα 2: Διαφορικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 4 ου κεφαλαίου Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών Σταύρος Χατζόπουλος 27/03/2017, 03/04/2017, 24/04/2017 1 Εισαγωγή Έστω το τ.δ. X,,, από την κατανομή

Διαβάστε περισσότερα

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων Copyright 2009 Cengage Learning 8.1 Συναρτήσεις Πυκνότητας Πιθανοτήτων Αντίθετα με τη διακριτή τυχαία μεταβλητή που μελετήσαμε στο Κεφάλαιο 7, μια συνεχής τυχαία

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης 10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης Διαστήματα εμπιστοσύνης για τον μέσο ενός πληθυσμού (Μικρά δείγματα) Άσκηση 10.7.1: Ο επόμενος πίνακας τιμών δείχνει την αύξηση σε ώρες ύπνου που είχαν

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014 ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014 Περιεχόμενα 1 Εισαγωγή 2 2 Μεγιστικός τελέστης στην μπάλα 2 2.1 Βασικό θεώρημα........................ 2 2.2 Γενική περίπτωση μπάλας.................. 6 2.2.1 Στο

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 7: Επεκτάσεις του γραμμικού υποδείγματος σε μη γραμμικές μορφές Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Περιγραφική Στατιστική

Περιγραφική Στατιστική Περιγραφική Στατιστική Παναγιώτα Λάλου. Βασικές έννοιες Ορισμός: Στατιστικός πληθυσμός ονομάζεται το σύνολο των πειραματικών μονάδων π.χ άνθρωποι, ζώα, επιχειρήσεις κ.λπ, οι οποίες συμμετέχουν στην έρευνα

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής στην Προσχολική Ηλικία Περιεχόμενα ενότητας Παρουσιάζονται οι βασικές

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα