Εφαρμοσμένη Βιοστατιστική: Ανάπτυξη Web Λογισμικού για τον Καρκίνο του Μαστού
|
|
- Ξένη Δασκαλοπούλου
- 9 χρόνια πριν
- Προβολές:
Transcript
1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΝΑΛΟΓΙΣΤΙΚΩΝ- ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ Διπλωματική Εργασία: Εφαρμοσμένη Βιοστατιστική: Ανάπτυξη Web Λογισμικού για τον Καρκίνο του Μαστού Χριστάκης Αναστάσιος Α.Μ. 333/ Επιβλέπων Καθηγητής: Αναπληρωτής Καθηγητής Τσιμήκας Τζων ΣΑΜΟΣ 2010
2 Ευχαριστίες Θα ήθελα να ευχαριστήσω τους ακόλουθους ανθρώπους για την πολύτιμη συνεισφορά τους στην αποπεράτωση της παρούσας διπλωματικής εργασίας: Τον Δρ. Άρη Περπέρογλου, για την αρχική ιδέα της υλοποίησης μιας τέτοιας διπλωματικής εργασίας. Είχα την ευκαιρία να ασχοληθώ με ένα θέμα εξαιρετικά ενδιαφέρον και να διδαχθώ σε όλη την διαδρομή μέχρι την ολοκλήρωση της εργασίας πολλά. Τον φίλο μου, Γιώργο Τσάκωνα, χωρίς την παρουσία του οποίου οι ατελείωτες γραμμές κώδικα δεν θα αποκτούσαν ποτέ την μορφή μιας άρτια ολοκληρωμένης και σύγχρονης εφαρμογής. Το Γενικό Νοσοκομείο Αθηνών Αλεξάνδρα και ιδιαίτερα τον κ. Δημητρακάκη, για την καθοδήγηση του σχετικά με τις ιατρικές διαδικασίες. Την φίλη μου, Ειρηάννα Καραΐνδρου, για τις μεταφράσεις και τις συντακτικές παρατηρήσεις. Τέλος, θέλω να ευχαριστήσω τους γονείς μου, για την άυλη και υλική υποστήριξη που μου παρέχουν όλα αυτά τα χρόνια.
3 Στην μητέρα μου, Ευδοκία
4 Πίνακας περιεχομένων Ευχαριστίες Εισαγωγή Προσδιορισμός του προβλήματος 5 Ο σκοπός και οι στόχοι της διπλωματικής εργασίας 5 Υλικά και μέθοδος 5 Τι είναι μια δυναμική ιστοσελίδα; 7 Δομή εργασίας 8 Κεφάλαιο 1 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank 9 Πρόλογος Ανασκόπηση Ένα παράδειγμα των καμπυλών Kaplan-Meier Γενικά χαρακτηριστικά των καμπυλών Kaplan-Meier Ο έλεγχος log-rank για δύο ομάδες Ο έλεγχος log-rank για περισσότερες ομάδες Σύνοψη 34 Κεφάλαιο 2 Εγχειρίδιο χρήσης της εφαρμογής 35 Πρόλογος Είσοδος χρήστη Αρχική σελίδα Νέα καταχώρηση Βασικές πληροφορίες Ιατρικό ιστορικό Χειρουργείο Παρακολούθηση Σύνοψη καταχώρησης 52
5 2.4 Αναζήτηση Διόρθωση ή διαγραφή καταχώρησης Διόρθωση Διαγραφή Σύνθετη αναζήτηση Βήμα Βήμα Βήμα Αποτελέσματα Στατιστικές εκτιμήσεις Βήμα Βήμα Βήμα Βήμα Γραφική αναπαράσταση αποτελεσμάτων 73 Κεφάλαιο 3 Λεξικό ειδικών όρων 75 Πρόλογος 77 Λεξικό 78 Επίλογος Συμπεράσματα και μελλοντική προοπτική 99 Βιβλιογραφία 101 Παράρτημα I Τύπος για τον πίνακα του log-rank για πολλά group 103 Παράρτημα II Δεσμευμένη πιθανότητα 104 Παράρτημα III Κωδικοποίηση μεταβλητών εξόδου στο Excel 105 Παράρτημα IV Κώδικας που εκτελείται στο R κατά την εκτέλεση του μοντέλου Kaplan Meier 108
6 Εισαγωγή
7 Εισαγωγή Προσδιορισμός του προβλήματος Η αρχική ιδέα για την υλοποίηση της παρούσας διπλωματικής εργασίας προήλθε από την ανάγκη σχεδίασης και υλοποίησης ενός σύγχρονου ηλεκτρονικού συστήματος καταγραφής, αποθήκευσης και επεξεργασίας δεδομένων για ασθενείς με καρκίνο του μαστού που θα έχει την δυνατότητα να διατεθεί και να χρησιμοποιηθεί άμεσα από ογκολογικά τμήματα νοσοκομείων της χώρας μας. Η παντελής έλλειψη ενός παρόμοιου εφαρμόσιμου συστήματος στην Ελλάδα, επέβαλλε έναν εξαιρετικά προσεκτικό σχεδιασμό και την τμηματική επίλυση διαφόρων προβλημάτων καθώς υπήρξε η ανάγκη αντιμετώπισης όχι μόνο προγραμματιστικών ή στατιστικών προβλημάτων αλλά και η ανάγκη κατανόησης ιατρικών διαδικασιών. Ο σκοπός και οι στόχοι της διπλωματικής εργασίας Η γενική ιδέα της διπλωματικής εργασίας, ήταν η ανάπτυξη μιας δυναμικής ιστοσελίδας που θα μπορεί να προσφέρει ένα πλήθος εφαρμογών που θα δώσουν λύση στα περισσότερα από τα προβλήματα που αντιμετωπίζει ένα ογκολογικό τμήμα στον τομέα του καρκίνου του μαστού. Τα απαρχαιωμένα συστήματα που χρησιμοποιούν τα περισσότερα ογκολογικά τμήματα για τον καρκίνο του μαστού σήμερα στην Ελλάδα και η ανάγκη εκσυγχρονισμού αυτών των συστημάτων, έδωσαν το έναυσμα για την υλοποίηση ενός τόσο εφαρμοσμένου ερευνητικού έργου. Η χειρόγραφη καταγραφή δημογραφικών, ιατρικών και χειρουργικών στοιχείων των ασθενών, οι ατελείωτοι σωροί από φακέλους ασθενών που στοιβάζονται στις αποθήκες των νοσοκομείων και η μηδαμινή δυνατότητα στατιστικής ανάλυσης δεδομένων ασθενών με καρκίνο του μαστού λόγω της μη ψηφιακής καταγραφής των δεδομένων αυτών, ήταν οι τρεις βασικοί άξονες πάνω στους οποίους κινήθηκε το παρών έργο. Τέλος, η ανάγκη για διαφορετικά επίπεδα πρόσβασης για διαφορετικές ομάδες ατόμων στα δεδομένα, ικανοποιείται μέσω αυτής της εφαρμογής. Υλικά και μέθοδος Ο σχεδιασμός και η υλοποίηση της δυναμικής ιστοσελίδας για τον καρκίνο του μαστού απαιτούσε άριστη γνώση προγραμματισμού, χρήση στατιστικών μεθόδων και προγραμμάτων καθώς και την κατανόηση πλήθους ιατρικών όρων. Για την άρτια 5
8 Εισαγωγή ολοκλήρωση και σχεδίαση της εφαρμογής για το καρκίνο του μαστού χρειάστηκαν περισσότερες από γραμμές κώδικα και χρησιμοποιήθηκαν τα εξής προγράμματα: HTML: Τα αρχικά HTML προέρχονται από τις λέξεις Hyper Text Markup Language. Η HTML δεν είναι μια γλώσσα προγραμματισμού, είναι μια περιγραφική γλώσσα, δηλαδή ένας ειδικός τρόπος γραφής κειμένου και κλήσης άλλων αρχείων ή εφαρμογών βασισμένος σε οδηγίες. Ο Web client αναγνωρίζει αυτόν τον ειδικό τρόπο γραφής και εκτελεί τις εντολές που περιέχονται σε αυτόν. PHP: Η PHP είναι μια γλώσσα προγραμματισμού που σχεδιάστηκε για τη δημιουργία δυναμικών σελίδων στο διαδίκτυο και είναι επισήμως γνωστή ως Hyper Text Preprocessor. Είναι μια server-side (εκτελείτε στον διακομιστή) scripting γλώσσα που γράφεται συνήθως πλαισιωμένη από την HTML, για την μορφοποίηση των αποτελεσμάτων. Αντίθετα από μια συνηθισμένη HTML σελίδα, η σελίδα PHP δεν στέλνεται άμεσα σε έναν πελάτη (client). Αντί για αυτό, πρώτα αναλύεται και μετά αποστέλλεται το παραγόμενο αποτέλεσμα. Τα στοιχεία HTML στον πηγαίο κώδικα μένουν ως έχουν, αλλά ο PHP κώδικας ερμηνεύεται και εκτελείται. Ο κώδικας PHP μπορεί να θέσει ερωτήματα σε βάσεις δεδομένων, να δημιουργήσει εικόνες, να διαβάσει και να γράψει αρχεία, να συνδεθεί με απομακρυσμένους υπολογιστές και άλλα. Σε γενικές γραμμές οι δυνατότητες που μας δίνει είναι απεριόριστες. CSS: Η CSS (Cascading Style Sheets-Διαδοχικά Φύλλα Στυλ) είναι μια γλώσσα υπολογιστή που ανήκει στην κατηγορία των γλωσσών φύλλων στυλ που χρησιμοποιείται για τον έλεγχο της εμφάνισης ενός εγγράφου που έχει γραφτεί με μια γλώσσα σήμανσης. Η CSS λοιπόν, είναι μια γλώσσα του υπολογιστή που διαμορφώνει την στιλιστική ανάπτυξη μιας ιστοσελίδας δηλαδή διαμορφώνει τα χαρακτηριστικά, τα χρώματα, την στοίχιση και δίνει περισσότερες δυνατότητες σε σχέση με την html. JavaScript: Η JavaScript είναι γλώσσα προγραμματισμού η οποία έχει σαν σκοπό την παραγωγή δυναμικού περιεχομένου και την εκτέλεση κώδικα από την πλευρά του πελάτη (client-side) σε ιστοσελίδες. MySQL: Η MySQL είναι ένα σύστημα διαχείρισης σχεσιακής βάση ανοικτού κώδικα (relational database management system - RDBMS) που χρησιμοποιεί την Structured Query Language (SQL), την πιο γνωστή γλώσσα για την προσθήκη, την πρόσβαση και την επεξεργασία δεδομένων σε μία Βάση Δεδομένων. Η MySQL είναι γνωστή κυρίως για την ταχύτητα, την αξιοπιστία, και την ευελιξία που παρέχει. Δουλεύει καλύτερα όταν διαχειρίζεται περιεχόμενο και όχι όταν εκτελεί συναλλαγές. 6
9 Εισαγωγή R: Το r είναι μια γλώσσα προγραμματισμού συνοδευόμενη από ένα περιβάλλον για επεξεργασία δεδομένων, υπολογισμών και γραφημάτων. Αν και χρησιμοποιείται κυρίως στην στατιστική, οι δημιουργοί του προτιμούν να το αποκαλούν εργαλείο για ανάλυση δεδομένων, τονίζοντας ότι περιλαμβάνει σύγχρονες και παλιές στατιστικές μεθοδολογίες. Έτσι λοιπόν, με τον συνδυασμό όλων αυτών των προγραμμάτων, κατέστη δυνατή η ολοκληρωμένη σχεδίαση της δυναμικής ιστοσελίδας που μπορεί να θεωρηθεί βάση δεδομένων, ιατρικός φάκελος ασθενών, πηγή άντλησης ιατρικών δεδομένων για ερευνητές, στατιστικό πρόγραμμα ανάλυσης επιβίωσης ή όλα τα παραπάνω μαζί. Η εφαρμογή είναι σχεδιασμένη έτσι ώστε να μπορεί να ανταπεξέλθει στις απαιτήσεις ενός server στον παγκόσμιο ιστό προσφέροντας όλες εκείνες τις δικλείδες ασφαλείας που απαιτούνται λόγω τις ευαισθησίας των δεδομένων. Επίσης, είναι δυνατή η εφαρμογή του προγράμματος σε οποιοδήποτε τοπικό δίκτυο (π.χ. τοπικό δίκτυο νοσοκομείου) μετά τον ορισμό των κατάλληλων ρυθμίσεων. Τι είναι μια δυναμική ιστοσελίδα; Καθώς μέχρι τώρα γίνεται συνεχώς η χρήση του όρου δυναμική ιστοσελίδα, καλό θα ήταν να δοθεί μια ακριβής περιγραφή του όρου αυτού για να γίνει απολύτως ξεκάθαρη η έννοια του. Οι δυναμικές ιστοσελίδες εμφανισιακά μπορεί σε πολλές περιπτώσεις να μην έχουν μεγάλη διαφορά από τις στατικές, οι δυνατότητές τους όμως είναι πολύ περισσότερες, από πολλές πλευρές. Στην περίπτωση αυτή ουσιαστικά μιλάμε για μία εφαρμογή (πρόγραμμα), και όχι ένα απλό ηλεκτρονικό έγγραφο HTML. Συμπεριλαμβάνουν προγραμματισμό και ουσιαστικά είναι web εφαρμογές. Η κατασκευή δυναμικών ιστοσελίδων είναι προφανώς αρκετά πιο πολύπλοκη από τις απλές στατικές ιστοσελίδες και ο βαθμός δυσκολίας τους εξαρτάται από τις λειτουργίες και τις δυνατότητες που περιλαμβάνει η εκάστοτε web εφαρμογή. Το περιεχόμενο των δυναμικών ιστοσελίδων, αποθηκεύεται και αντλείται δυναμικά από μία ή περισσότερες βάσεις δεδομένων, ενώ διαθέτουν εκτός από το frontend (user interface) και backend (administration area), μέσω του οποίου γίνεται εύκολα η διαχείριση του περιεχομένου της ιστοσελίδας. Η χρήση των βάσεων δεδομένων, είναι αυτή που επιτρέπει την εύκολη προσθαφαίρεση περιεχομένου στις δυναμικές ιστοσελίδες, καθώς δεν απαιτείται να επεξεργάζεται κανείς κάθε φορά την ίδια την ιστοσελίδα, αλλά απλά να διαχειρίζεται έμμεσα το περιεχόμενο στην βάση δεδομένων και οι υπόλοιπες διαδικασίες γίνονται αυτοματοποιημένα από τον "μηχανισμό" της ιστοσελίδας. 7
10 Εισαγωγή Για την εύκολη διαχείριση του περιεχομένου σε μία δυναμική ιστοσελίδα, υπάρχει επιπρόσθετα στην ιστοσελίδα αυτή ένας εύχρηστος μηχανισμός "CMS" (Content Management System Σύστημα Διαχείρισης Περιεχομένου), μέσω του οποίου η προσθαφαίρεση περιεχομένου μπορεί να γίνει ακόμη και από κάποιον αρχάριο. Φυσικά, η "περιοχή διαχείρισης" της ιστοσελίδας, προστατεύεται με κωδικό πρόσβασης (password), και δεν μπορούν να εισέλθουν σε αυτή οι επισκέπτες της ιστοσελίδας. Δομή εργασίας Το πρώτο κεφάλαιο της εργασίας παρουσιάζει το θεωρητικό υπόβαθρο του στατιστικού μοντέλου που χρησιμοποιεί η εφαρμογή για να κάνει ανάλυση επιβίωσης. Περιγράφεται λοιπόν το μοντέλο Kaplan-Meier και ο έλεγχος log-rank για δύο ή περισσότερες ομάδες. Σε όλη την διάρκεια του κεφαλαίου παραθέτονται τα αντίστοιχα παραδείγματα για κάθε ενότητα, τα αποτελέσματα των οποίων ανακτήθηκαν, με την χρήση του στατιστικού πακέτου R. Το δεύτερο κεφάλαιο είναι ουσιαστικά το εγχειρίδιο χρήσης του προγράμματος. Σε αυτήν την ενότητα μπορεί να ανατρέξει ο αρχάριος χρήστης της εφαρμογής, ο γιατρός ή ο βιοστατιστικός. Το κεφάλαιο αυτό περιγράφει αναλυτικά την δομή και τον τρόπο λειτουργίας της εφαρμογής και καθοδηγεί βήμα-βήμα τον χρήστη στην εξερεύνηση της με την βοήθεια εικόνων και επεξηγηματικών γραφημάτων. Το τρίτο κεφάλαιο είναι ένα λεξικό ειδικών όρων. Είναι ένας αλφαβητικός κατάλογος με όρους που συναντά ο χρήστης του συστήματος όταν επιχειρήσει να εισάγει δεδομένα για μια νέα εγγραφή ασθενούς με καρκίνο του μαστού, να διορθώσει μια καταχώρηση ή απλά να εμφανίσει τα αποτελέσματα μιας καταχώρησης. Σκοπός του λεξικού είναι η σωστή ενημέρωση του χρήστη και η ορθή πληροφόρηση του ασθενή, όπου απαιτείται. Με το τέλος του τρίτου κεφαλαίου ακολουθεί ένας σύντομος επίλογος της διπλωματικής εργασίας μετά την ολοκλήρωση του σχεδιασμού της δυναμικής ιστοσελίδας αλλά και του παρόντος τόμου. Τέλος ακολουθεί η βιβλιογραφία που χρησιμοποιήθηκε για την διεκπεραίωση του τόμου αυτού και τα παραρτήματα. 8
11 Κεφάλαιο 1 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank
12 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Πρόλογος Το παρόν κεφάλαιο έχει στόχο να παρουσιάσει το θεωρητικό υπόβαθρο των εφαρμοσμένων στατιστικών τεχνικών που χρησιμοποιούνται στην παρούσα εργασία. Ξεκινάει λοιπόν με μια σύντομη αναφορά στους σκοπούς της ανάλυσης επιβίωσης, στη βασική ορολογία και στους συμβολισμούς που χρησιμοποιούνται. Στην συνέχεια περιγράφεται πως μπορούν να εκτιμηθούν και να σχεδιαστούν καμπύλες επιβίωσης με την μέθοδο Kaplan-Meier. Οι εκτιμημένες πιθανότητες επιβίωσης υπολογίζονται με την χρήση του τύπου του οριακού γινομένου. Έπειτα, περιγράφεται πως γίνεται η σύγκριση μεταξύ δύο ή περισσότερων καμπυλών επιβίωσης κάνοντας χρήση του log-rank test κάτω από την αρχική υπόθεση πως όλες οι καμπύλες είναι ίδιες. Για δύο ομάδες, το log-rank βασίζεται (α) στο άθροισμα των παρατηρούμενων μείον των αναμενόμενων τιμών για μια δεδομένη ομάδα και (β) στον υπολογισμό της διακύμανσης. Για περισσότερες από δύο ομάδες, είναι προτιμότερη η χρήση κάποιου στατιστικού πακέτου στον υπολογιστή καθώς ο τύπος του log-rank είναι πολύπλοκος και απαιτεί πολλές μαθηματικές πράξεις. Ο στατιστικός έλεγχος προσεγγίζει εκείνον του χ τετράγωνο για μεγάλα δείγματα, με G-1 βαθμούς ελευθερίας όπου το G δηλώνει τον αριθμό των ομάδων που συγκρίνονται. Το πλαίσιο που ακολουθεί δίνει στον αναγνώστη μια ιδέα από το υλικό που θα καλυφθεί μέχρι το τέλος του κεφαλαίου: - Ανασκόπηση - Ένα παράδειγμα των καμπυλών Kaplan-Meier - Γενικά χαρακτηριστικά των καμπυλών Kaplan-Meier - Ο έλεγχος log-rank για δύο ομάδες - Ο έλεγχος log-rank για περισσότερες ομάδες - Σύνοψη 11
13 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Ο υπολογισμός των αριθμητικών τιμών και ο σχεδιασμός των γραφημάτων στα παραδείγματα που παρουσιάζονται σε όλη την διάρκεια του κεφαλαίου έγινε με την χρήση του στατιστικού πακέτου ανοικτού κώδικα R. Οι τύποι, οι πίνακες, τα γραφήματα και τα πιο βασικά σημεία του κεφαλαίου παρουσιάζονται στο περιθώριο της σελίδας. 12
14 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Σε μια επιστημονική δημοσίευση του 1958 στο Journal of the American Statistical Association, οι Kaplan και Meier πρότειναν έναν τρόπο για να εκτιμάται το S(t) χωρίς παραμέτρους, ακόμα και με την παρουσία λογοκρισίας. Η μέθοδος αυτή βασίζεται στην ιδέα της εξαρτημένης πιθανότητας. 1.1 Ανασκόπηση Η ανάλυση επιβίωσης είναι μια συλλογή από στατιστικές διαδικασίες για την ανάλυση δεδομένων των οποίων οι μεταβλητές ενδιαφέροντος που παίρνουμε ως αποτέλεσμα, είναι ο χρόνος μέχρι να συμβεί ένα γεγονός εννοώντας τον θάνατο, η συχνότητα μιας ασθένειας, η υποτροπή μετά από ύφεση ή οποιαδήποτε άλλη σχεδιασμένη εμπειρία ενδιαφέροντος που μπορεί να συμβεί σε ένα άτομο. Όταν κάνουμε ανάλυση επιβίωσης, συχνά αναφερόμαστε στις χρονικές μεταβλητές σαν χρόνο επιβίωσης. Τυπικά επίσης, αναφερόμαστε στο γεγονός σαν αποτυχία. Γεγονός: Αρχή ΧΡΟΝΟΣ Γεγονός Θάνατος Εμφάνιση νόσου Υποτροπή Χρόνος = χρόνος επιβίωσης Γεγονός = αποτυχία Τα περισσότερα χρονικά δεδομένα επιβίωσης είναι λογοκριμένα. Στην πραγματικότητα, η λογοκρισία συμβαίνει όταν έχουμε μερικές πληροφορίες για τον χρόνο επιβίωσης των ατόμων αλλά δεν γνωρίζουμε τον ακριβή χρόνο επιβίωσης τους. Λογοκρισία : Δεν γνωρίζουμε ακριβώς τον χρόνο επιβίωσης Μερικά άτομα πεθαίνουν από άλλες αιτίες Μερικά άτομα φεύγουν για κάποιον λόγο από την παρακολούθηση Η μελέτη σταματά σε κάποιον χρόνο Τα περισσότερα χρονικά δεδομένα επιβίωσης είναι δεξιά λογοκριμένα, διότι το πραγματικό χρονικό διάστημα επιβίωσης το οποίο δεν γνωρίζουμε, έχει αποκοπεί από την δεξιά πλευρά του παρατηρούμενου χρονικού διαστήματος και μας δίνει ένα παρατηρούμενο χρονικό διάστημα το οποίο 13
15 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Συμβολισμός : T = χρόνος επιβίωσης t = συγκεκριμένη τιμή για το T είναι μικρότερο από το πραγματικό χρονικό διάστημα επιβίωσης. Χρησιμοποιούμε τον παρατηρούμενο χρόνο επιβίωσης για να επιστήσουμε την σημασία του πραγματικού χρόνου επιβίωσης. Ως συμβολισμό, δηλώνουμε με το κεφαλαίο T την τυχαία μεταβλητή για τον χρόνο επιβίωσης ενός ατόμου. Επίσης συμβολίζουμε με ένα πεζό t οποιαδήποτε συγκεκριμένη τιμή ενδιαφέροντος για την μεταβλητή T. δ = (0,1) = 1 για αποτυχία 0 για λογοκρισία S(t) = συνάρτηση επιβίωσης = Pr(T > t) Με το ελληνικό δέλτα (δ), δηλώνουμε μια τυχαία μεταβλητή που παίρνει τις τιμές 0 και 1, δηλώνοντας είτε λογοκρισία είτε αποτυχία. Ένα άτομο που δεν αποτυγχάνει, δηλαδή δεν του συμβαίνει γεγονός κατά την διάρκεια της μελέτης, πρέπει να έχει λογοκριθεί είτε πριν είτε μετά το τέλος της μελέτης. Η συνάρτηση επιβίωσης (survivor function) η οποία συμβολίζεται με S(t), δίνει την πιθανότητα μια τυχαία μεταβλητή T να ξεπερνά τον συγκεκριμένο χρόνο t. Θεωρητικά, καθώς το t κυμαίνεται από το 0 έως το άπειρο, η συνάρτηση επιβίωσης είναι ένα γράφημα με ομαλή φθίνουσα καμπύλη η οποία ξεκινά στο S(t)=1 για t=0 και κατευθύνεται προς το 0 όσο το t τείνει στο άπειρο. Στην πράξη, χρησιμοποιώντας δεδομένα, συχνά παίρνουμε σαν γραφικό αποτέλεσμα εκτιμημένες καμπύλες επιβίωσης που είναι διαβαθμισμένες συναρτήσεις όπως απεικονίζονται εδώ και όχι ομαλές καμπύλες. h(t) = συνάρτηση κινδύνου για T>t Η συνάρτηση κινδύνου (hazard function), δηλώνεται με h(t) και δίνει το στιγμιαίο ενδεχόμενο ανά μονάδα χρόνου για να συμβεί το γεγονός δεδομένου ότι το άτομο έχει επιζήσει μέχρι τον χρόνο t. 14
16 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Σε αντίθεση με την συνάρτηση επιβίωσης, η οποία εστιάζει στην μη αποτυχία, η συνάρτηση κινδύνου εστιάζει στην αποτυχία. Με άλλα λόγια, όσο υψηλότερος είναι ο μέσος κίνδυνος τόσο χειρότερη είναι η επίδραση στην επιβίωση. Ο κίνδυνος είναι περισσότερο ρυθμός παρά πιθανότητα. Σαν αποτέλεσμα, οι τιμές της συνάρτησης κινδύνου, κυμαίνονται μεταξύ του 0 και του άπειρου. Αδιαφορώντας για το ποια συνάρτηση S(t) ή h(t) θα προτιμήσει κάποιος, υπάρχει μια ξεκάθαρα ορισμένη σχέση μεταξύ των δύο. Στην πραγματικότητα εάν κάποιος γνωρίζει τον τύπο το S(t) μπορεί να καταλήξει στον αντίστοιχο του h(t) και το αντίστροφο. h(t) : 0 έως άπειρο S(t) h(t) Η γενική διάταξη των δεδομένων για μια ανάλυση επιβίωσης δίνεται από τον πίνακα που παρουσιάζεται εδώ. Η πρώτη στήλη αναγνωρίζει τα αντικείμενα της μελέτης. Η δεύτερη στήλη δίνει πληροφορίες για τους παρατηρούμενους χρόνους επιβίωσης. Η Τρίτη στήλη δίνει πληροφορίες για το δ, την μεταβλητή της διχοτόμου η οποία υποδηλώνει την κατάσταση λογοκρισίας. Οι υπόλοιπες πληροφορίες στον πίνακα δίνουν τιμές για επεξηγηματικές μεταβλητές ενδιαφέροντος. Μια εναλλακτική διάταξη δεδομένων παρουσιάζεται εδώ. Αυτή η διάταξη είναι η βάση από την οποία παράχθηκαν οι καμπύλες επιβίωσης ΚΜ. Η πρώτη στήλη στον πίνακα δίνει διατεταγμένους χρόνους επιβίωσης από τον μικρότερο στον μεγαλύτερο. Η δεύτερη στήλη δίνει την συχνότητα μέτρησης αποτυχιών σε κάθε συγκεκριμένο χρόνο αποτυχίας. Η Τρίτη στήλη δίνει την συχνότητα μέτρησης που δίνεται με q j αυτών των ατόμων που λογοκρίθηκαν στο χρονικό διάστημα με αρχή τον χρόνο αποτυχίας t (j) μέχρι τον επόμενο χρόνο αποτυχίας (χωρίς να περιλαμβάνεται και αυτός μέσα στο διάστημα) δηλαδή την στιγμή t (j+1). Η τελευταία στήλη δίνει τον συνολικό αριθμό ατόμων σε κίνδυνο (risk set), ο οποίος Γενική διάταξη δεδομένων: Εναλλακτική διάταξη δεδομένων: 15
17 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Πίνακας διατεταγμένων αποτυχιών : - χρησιμοποιεί όλες τις πληροφορίες μέχρι το χρόνο της λογοκρισίας - Το S(t) απορρέει από το R(t) Πιθανότητα επιβίωσης : Χρήση της μεθόδου Kaplan-Meier (KM) δίνεται από την συλλογή των ατόμων τα οποία επέζησαν τουλάχιστον έως τον χρόνο t (j). Για να εκτιμήσουμε την πιθανότητα επιβίωσης σε δεδομένη χρονική στιγμή, κάνουμε χρήση του συνολικού κινδύνου εκείνη την στιγμή. Αυτό γίνεται για να συμπεριλάβουμε τις πληροφορίες που έχουμε για ένα λογοκριμένο άτομο έως την στιγμή της λογοκρισίας και όχι να πετάξουμε όλες τις πληροφορίες από ένα λογοκριμένο άτομο. Ο πραγματικός υπολογισμός για τέτοιες πιθανότητες επιβίωσης, μπορεί να εκτελεστεί χρησιμοποιώντας την μέθοδο Kaplan-Meier. Εισάγουμε την μέθοδο ΚΜ στην επόμενη ενότητα μέσω ενός παραδείγματος. 16
18 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank 1.2 Ένα παράδειγμα των καμπυλών Kaplan-Meier Τα δεδομένα αυτού του παραδείγματος προέρχονται από μια μελέτη του χρόνου ύφεσης σε εβδομάδες για δύο ομάδες ασθενών με λευχαιμία, με 21 ασθενείς σε κάθε ομάδα. Η ομάδα 1 (group 1) είναι η ομάδα στην οποία χορηγήθηκε θεραπεία και η ομάδα 2 (group 2) είναι η ομάδα που της χορηγήθηκε εικονικό φάρμακο (placebo). Η βασική ερώτηση ενδιαφέροντος, αφορά την σύγκριση της εμπειρίας επιβίωσης των δύο ομάδων. Από τα 21 άτομα της ομάδας 1, τα 9 απέτυχαν κατά την διάρκεια της περιόδου που γινόταν η μελέτη και τα 12 λογοκρίθηκαν. Αντίθετα, κανένα από τα δεδομένα της ομάδας 2 δεν λογοκρίθηκε και αυτό διότι και τα 21 άτομα της ομάδας που χορηγήθηκε θεραπεία placebo σταμάτησαν να βρίσκονται σε ύφεση κατά την διάρκεια της περιόδου της μελέτης. Από μια απλή περιγραφική στατιστική για τον μέσο χρόνο επιβίωσης και τον μέσο ρυθμό κινδύνου παρατηρείται ότι η ομάδα 1 εμφανίζει να έχει καλύτερη πρόγνωση επιβίωσης από την ομάδα 2, υποδεικνύοντας ότι θεραπεία είναι πιο αποτελεσματική από το placebo. Να σημειώσουμε ωστόσο, ότι η περιγραφική στατιστική κάνει συνολικές συγκρίσεις αλλά δεν συγκρίνει τις δύο ομάδες σε διαφορετικές χρονικές στιγμές. ΠΑΡΑΔΕΙΓΜΑ Τα δεδομένα: Χρόνοι αδράνειας (σε εβδομάδες) για δύο ομάδες ασθενών με λευχαιμία Group 1 θεραπεία (n=21) 6, 6, 6, 7, 10, 13, 16, 22, 23, 6+, 9+, 10+, 11+, 17+, 19+, 20+, 25+, 32+, 32+, 34+, 35+ σημείωση: το + δηλώνει λογοκρισία Group 2 placebo (n=21) 1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22, 23 #αποτυχιών # λογοκριμένων Group Group Περιγραφική στατιστική: T = 17,1, T = 8,6 h = 0,25, h = 0,115, = 4,6 17
19 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) Group 1 - θεραπεία Group 2 placebo t ( ) n m q > t ( ) n m q Group 2 μη λογοκριμένα άτομα t ( ) n m q S (t ( ) ) /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0 Ένας πίνακας από διατεταγμένους χρόνους επιβίωσης παρουσιάζεται εδώ για κάθε μια ομάδα. Αυτοί οι πίνακες παρέχουν τις βασικές πληροφορίες που απαιτούνται για τον υπολογισμό της καμπύλης ΚΜ. Κάθε πίνακας ξεκινά από τον χρόνο επιβίωσης ίσο με το 0, παρόλα αυτά κανένα αντικείμενο δεν αποτυγχάνει από την αρχή της παρακολούθησης. Ο λόγος για την ύπαρξη του μηδενός είναι για να συμπεριλάβει το ενδεχόμενο κάποια αντικείμενα να λογοκρίθηκαν πριν τον πρώτο χρόνο αποτυχίας. Επίσης κάθε πίνακας περιλαμβάνει μια στήλη που δηλώνεται σαν n j, η οποία δίνει τον αριθμό των ατόμων που βρίσκονται σε κίνδυνο στην αρχή κάθε διαστήματος. Δεδομένου ότι ο συνολικός κίνδυνος ορίζεται ως η συλλογή των ατόμων που έχουν επιζήσει το λιγότερο ως τον χρόνο t (j), γίνεται δεκτό ότι στο n j περιλαμβάνονται τα άτομα που απέτυχαν την χρονική στιγμή t (j). Με άλλα λόγια το n j μετρά αυτά τα αντικείμενα σε κίνδυνο, που απέτυχαν ακαριαία πριν την χρονική στιγμή t (j). Τώρα θα περιγράψουμε πώς υπολογίζεται μια καμπύλη ΚΜ για τον πίνακα της ομάδας 2. Οι υπολογισμοί για την ομάδα 2 είναι αρκετά απλοί διότι δεν υπάρχουν λογοκριμένα αντικείμενα σε αυτήν. Ο πίνακας με τους διατεταγμένους χρόνους αποτυχίας για την ομάδα 2 παρουσιάζεται εδώ ξανά με την προσθήκη μιας ακόμα στήλης που περιλαμβάνει εκτιμήσεις για την πιθανότητα επιβίωσης. Αυτές οι εκτιμήσεις είναι οι πιθανότητες επιβίωσης ΚΜ για αυτήν την ομάδα. Θα γίνει αναφορά για τους υπολογισμούς αυτών των πιθανοτήτων περιληπτικά στην συνέχεια. 18
20 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Μια γραφική παράσταση των πιθανοτήτων επιβίωσης από ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) μια ΚΜ σε αντιστοιχία με κάθε διατεταγμένο χρόνο αποτυχίας εμφανίζεται εδώ. Εμπειρικές γραφικές παραστάσεις όπως αυτή τυπικά σχεδιάζονται σαν μια βαθμιαία συνάρτηση που ξεκινάει με μια οριζόντια γραμμή στην πιθανότητα επιβίωσης που ισούται με 1 και μετά κατεβαίνει σε άλλη πιθανότητα επιβίωσης καθώς περνάμε από τον ένα διατεταγμένο χρόνο επιβίωσης στον άλλο. Καμπύλη Kaplan-Meier για το Group 2 (placebo) Τώρα θα περιγράψουμε πως υπολογίζονται οι πιθανότητες επιβίωσης για τα δεδομένα της ομάδας 2. Να θυμίσουμε πως η πιθανότητα επιβίωσης δίνει την πιθανότητα ένα αντικείμενο της μελέτης να έχει επιβιώσει μετά από μια συγκεκριμένη χρονική στιγμή. Επομένως, λαμβάνοντας υπόψη τα δεδομένα της ομάδας 2, η πιθανότητα επιβίωσης μετά την χρονική στιγμή 0 είναι 1 όπως ισχύει και σε οποιοδήποτε άλλο σύνολο δεδομένων. S(t) = Pr(T>t) Στην συνέχεια, η πιθανότητα πεπερασμένης επιβίωσης στην πρώτη διατεταγμένη χρονική στιγμή της μιας εβδομάδας δίνεται από το κλάσμα 19/21 διότι 2 άτομα απέτυχαν στην μία εβδομάδα, οπότε 19 άτομα από τους αρχικούς 21 παρέμειναν σαν επιζώντες μετά το πέρας της πρώτης εβδομάδας. Ομοίως, η επόμενη πιθανότητα αφορά αντικείμενα που επέζησαν μετά το πέρας 2 εβδομάδων η οποία ισούται με το κλάσμα 17/21 διότι 2 αντικείμενα απέτυχαν στην 1 εβδομάδα και 2 αντικείμενα απέτυχαν στις 2 εβδομάδες, που σημαίνει πως απέμειναν 17 από τα 21 συνολικά άτομα μετά το πέρας των δύο εβδομάδων. Οι υπόλοιπες πιθανότητες επιβίωσης στον πίνακα υπολογίζονται με τον ίδιο τρόπο, μετρώντας δηλαδή τον αριθμό των αντικειμένων που έχουν επιβιώσει μετά το πέρας μιας συγκεκριμένης χρονικής στιγμής που έχουμε λάβει Group 2 placebo t ( ) n m q S (t ( ) ) /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0, /21=0 19
21 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) S t ( ) = # ατόμων που επιβίωσαν t ( ) 21 Χωρίς λογοκρισία στο group 2 Εναλλακτικός τύπος : προσέγγιση ΚΜ υπόψη και διαιρούμε με το 21, τον αριθμό των αντικειμένων στην αρχή της αναφερόμενης μελέτης. Σημειώνεται ότι κανένα αντικείμενο στην ομάδα 2 δεν είναι λογοκριμένο, οπότε η στήλη q για την ομάδα 2 αποτελείται από μηδενικά. Αν κάποιο από τα q είναι μη μηδενικό θα χρειαστεί ένας εναλλακτικός τύπος για τον υπολογισμό των πιθανοτήτων επιβίωσης. Αυτός ο εναλλακτικός τύπος ονομάζεται προσέγγιση Kaplan-Meier και μπορεί να απεικονίσει τα δεδομένα της ομάδας 2 ακόμα και αν όλες οι τιμές για το q είναι 0. S (4) = = = 0,67 Pr (T > T ( ) T T ( ) ) 19 = Pr (T > 1 T 1) = Pr (T > 3 T 3) = αριθμός ατόμων σε κίνδυνο την 3 εβδομάδα Για παράδειγμα, ένας εναλλακτικός τρόπος για να υπολογίσουμε την πιθανότητα επιβίωσης που υπερβαίνει τις 4 εβδομάδες για τα δεδομένα της ομάδας 2, μπορεί να γραφτεί χρησιμοποιώντας τον τύπο ΚΜ που δίνεται εδώ. Αυτός ο τύπος περιλαμβάνει το γινόμενο των όρων των εξαρτημένων πιθανοτήτων. Αυτό σημαίνει ότι κάθε όρος του γινομένου είναι η πιθανότητα να υπερβεί μια συγκεκριμένη, διατεταγμένη χρονική στιγμή t (j) δεδομένου ότι ένα αντικείμενο επιβιώνει μέχρι αυτόν τον χρόνο αποτυχίας. Συνεπώς, στον τύπο ΚΜ για χρόνο επιβίωσης μετά της 4 εβδομάδες, ο όρος 19/21 δίνει την πιθανότητα της επιβίωσης μετά το πέρας της πρώτης διατεταγμένης χρονικής στιγμής, δηλαδή μετά την πρώτη εβδομάδα, δεδομένης της επιβίωσης μέχρι τότε. Σημειώνεται εδώ ότι και τα 21 άτομα στην ομάδα 2 επέζησαν έως και την πρώτη εβδομάδα αλλά οι 2 αποτυχίες την χρονική στιγμή της 1 εβδομάδας άφησαν 19 άτομα να έχουν επιβιώσει μετά το πέρας της πρώτης εβδομάδας. Ομοίως, ο όρος 16/17 δίνει την πιθανότητα επιβίωσης μετά το πέρας της τρίτης διατεταγμένης χρονικής στιγμής την 3 εβδομάδα, δεδομένης της επιβίωσης μέχρι εκείνη την στιγμή. Υπήρχαν 17 άτομα τα οποία επιβίωσαν μέχρι την Τρίτη 20
22 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank εβδομάδα και ένα από αυτά έπειτα απέτυχε, αφήνοντας 16 επιζώντες μετά το πέρας της τρίτης εβδομάδας. Σημειώνεται ότι τα 17 άτομα στον παρανομαστή αντιπροσωπεύουν τον αριθμό συνολικού κινδύνου της τρίτης εβδομάδας. Προσέξτε ότι οι όροι του γινομένου στον τύπο ΚΜ για την επιβίωση μετά τις 4 εβδομάδες, σταματούν στην τέταρτη εβδομάδα με το στοιχείο 14/16. Ομοίως ο τύπος ΚΜ για την επιβίωση μετά τις 8 εβδομάδες, σταματά στην όγδοη εβδομάδα. ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) S (4) = S (8) = Γενικότερα, κάθε τύπος του ΚΜ για μια πιθανότητα επιβίωσης, περιορίζεται στο γινόμενο των όρων μέχρι την εβδομάδα επιβίωσης που έχει προκαθοριστεί. Αυτό εξηγεί γιατί ο τύπος ΚΜ αναφέρεται συχνά σαν τύπος οριακού γινομένου. Στην συνέχεια, μελετούμε τον τύπο ΚΜ για τα δεδομένα από την ομάδα 1, στην οποία υπάρχουν μερικές λογοκριμένες παρατηρήσεις. Οι εκτιμημένες πιθανότητες επιβίωσης λαμβάνονται χρησιμοποιώντας τον τύπο ΚΜ όπως δείχνεται εδώ για την ομάδα 1. Η πρώτη εκτίμηση επιβίωσης στην λίστα είναι το S (0) = 1, όπως ισχύει πάντα, γιατί αυτό δίνει την πιθανότητα επιβίωσης μετά την χρονική στιγμή μηδέν. Group 1 (θεραπεία) τύπος ΚΜ = τύπος οριακού γινομένου t ( ) n m q S (t ( ) ) Οι άλλες εκτιμήσεις επιβίωσης υπολογίζονται πολλαπλασιάζοντας την εκτίμηση της αμέσως προηγούμενης χρονικής αποτυχίας με ένα κλάσμα. Για παράδειγμα το κλάσμα αυτό είναι το 18/21 μετά το πέρας της έκτης εβδομάδας, διότι 21 αντικείμενα παρέμειναν μέχρι την έκτη εβδομάδα και 3 από αυτά τα αντικείμενα απέτυχαν να 21
23 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) Group1 (θεραπεία) t ( ) n m q S (t ( ) ) = 0, , = 0,8067 0, = 0,7529 0, = 0,6902 0, = 0,6275 0, = 0,5378 0, = 0,4482 Το κλάσμα την στιγμή t ( ) : Pr (T > T ( ) T T ( ) ) Μη διαθέσιμο την στιγμή t ( ) : Αποτυχία πριν την στιγμή t ( ) ή λογοκριμένο πριν την στιγμή t ( ) (μόνο για το Group 1) Καμπύλες ΚΜ για τα δεδομένα ύφεσης επιβιώσουν μετά την έκτη εβδομάδα. Το κλάσμα 16/17 δείχνει την επιβίωση μετά την εβδομάδα 7, διότι 17 άτομα παρέμειναν μέχρι την εβδομάδα 7 και ένας από αυτούς απέτυχε να επιβιώσει μετά την έβδομη εβδομάδα. Τα άλλα κλάσματα υπολογίζονται ομοίως. Για έναν συγκεκριμένο χρόνο αποτυχίας t (j), το κλάσμα μπορεί γενικά να εκφραστεί σαν την εξαρτημένη πιθανότητα επιβίωσης μετά από την χρονική στιγμή t (j), δεδομένης της διαθεσιμότητας σε χρόνο t (j). Αυτός είναι ακριβώς ο ίδιος τύπος που χρησιμοποιήθηκε προηγουμένως για τον υπολογισμό κάθε όρου του γινομένου για τα δεδομένα της ομάδας 2, στον τύπο του οριακού γινομένου. Επισημαίνεται πως ένα αντικείμενο μπορεί να μην είναι διαθέσιμο στον χρόνο t (j) για έναν από τους δύο παρακάτω λόγους: (1) είτε το αντικείμενο έχει αποτύχει προ του χρόνου t (j) είτε, (2) το αντικείμενο έχει λογοκριθεί προ του χρόνου t (j). Η ομάδα 1 έχει λογοκριμένες παρατηρήσεις, ενώ η ομάδα 2 όχι. Συνεπώς, για την ομάδα 1 οι λογοκριμένες παρατηρήσεις πρέπει να ληφθούν υπόψη όταν προσδιορίζεται ο διαθέσιμος αριθμός στο t (j). Οι γραφικές παραστάσεις των καμπυλών ΚΜ για τις ομάδες 1 και 2 παρουσιάζονται εδώ στο ίδιο γράφημα. Παρατηρούμε ότι η καμπύλη ΚΜ για την ομάδα 1 βρίσκεται συνεχώς ψηλότερα από την αντίστοιχη καμπύλη ΚΜ της ομάδας 2. Αυτά τα γραφήματα δείχνουν ότι η ομάδα 1, αυτή δηλαδή που δέχθηκε την πραγματική θεραπεία, έχει καλύτερη πρόγνωση επιβίωσης από την ομάδα 2 που δέχθηκε θεραπεία placebo. Επιπρόσθετα, όσο ο αριθμός των εβδομάδων αυξάνει, οι δύο καμπύλες εμφανίζουν μεγαλύτερη απόκλιση μεταξύ τους, κάτι που υποδεικνύει ότι τα ευεργετικά αποτελέσματα της θεραπείας έναντι του placebo είναι μεγαλύτερα όσο κάποιος παραμένει σε κατάσταση ύφεσης. 22
24 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Οι γραφικές παραστάσεις για τις καμπύλες ΚΜ που παρουσιάστηκαν μέχρι τώρα μπορούν εύκολα να αποκτηθούν από τα περισσότερα υπολογιστικά πακέτα που εκτελούν ανάλυση επιβίωσης συμπεριλαμβανομένων των SAS, Stata, SPSS και R. Ο χρήστης ενός τέτοιου στατιστικού πακέτου χρειάζεται να έχει ένα ΚΜ πρόγραμμα με το βασικό πλάνο δεδομένων και να εκτελέσει τις απαραίτητες εντολές για να εξάγει τα ανάλογα γραφήματα. Μοντέλα KM εκτελούνται στα στατιστικά πακέτα: o SAS o Stata o SPSS o R Ο κώδικας που χρησιμοποιείται στην R για την εκτέλεση των μοντέλων KM παρουσιάζεται στο παράρτημα στο τέλος της εργασίας. 23
25 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank 1.3 Γενικά χαρακτηριστικά των καμπυλών Kaplan-Meier Γενικός τύπος ΚΜ: S t ( ) = S (t ( ) ) P r (T > t ( ) T t ( ) ) Τύπος οριακού γινομένου ΚΜ: S t ( ) = P r (T > t ( ) T t ( ) ) Ο γενικός τύπος για μια ΚΜ πιθανότητα επιβίωσης σε χρόνο αποτυχίας t (j) δίνεται εδώ. Αυτός ο τύπος δίνει την πιθανότητα επιβίωσης μετά τον προηγούμενο χρόνο αποτυχίας t (j-1), πολλαπλασιασμένο με την εξαρτημένη πιθανότητα επιβίωσης μετά την χρονική στιγμή t (j), δεδομένης της επιβίωσης τουλάχιστον για χρόνο t (j). Ο παραπάνω τύπος μπορεί επίσης να εκφραστεί σαν οριακό γινόμενο, αν αντικαταστήσουμε στην πιθανότητα επιβίωσης S (t ( ) ), το γινόμενο όλων των κλασμάτων που εκτιμούν τις εξαρτημένες πιθανότητες για χρόνο αποτυχίας t (j-1) και νωρίτερα. ΠΑΡΑΔΕΙΓΜΑ S (10) = 0, = 0,7529 = = S (16) = 0, = 0,6275 = = S t ( ) = P r T > t ( ) T t ( ) = = S t ( ) P r (T > t ( ) T t ( ) ) Για παράδειγμα, η πιθανότητα επιβίωσης μετά από 10 εβδομάδες δίνεται στον πίνακα για την ομάδα 1 ως το γινόμενο 0,8067 (14/15) που ισούται με 0,7529. Όμως το 0,8067 μπορεί εναλλακτικά να γραφτεί σαν το γινόμενο των κλασμάτων 18/21 και 16/17. Συνεπώς ο τύπος του οριακού γινομένου για επιβίωση μετά την 10 εβδομάδα, δίνεται από το τριπλό γινόμενο που παρουσιάζεται εδώ. Ομοίως, η πιθανότητα επιβίωσης μετά από 16 εβδομάδες, μπορεί να γραφτεί είτε ως 0,6902 (10/11) είτε ως το γινόμενο πέντε όρων όπως φαίνεται εδώ. Η γενική έκφραση του τύπου οριακού γινομένου για εκτιμήσεις επιβίωσης ΚΜ παρουσιάζεται εδώ μαζί με τον γενικό τύπο ΚΜ που δόθηκε νωρίτερα. Και οι δύο εκφράσεις είναι ισοδύναμες. Ισχύει ότι: Pr(A B) = Pr (A) Pr (B A) Μια απλή μαθηματική απόδειξη για τον τύπο ΚΜ μπορεί να περιγραφεί με όρους πιθανοτήτων. Ένας από τους βασικούς κανόνες των πιθανοτήτων είναι πως η πιθανότητα ενός 24
26 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank συνδυασμού γεγονότων, για παράδειγμα Α και Β, ισούται με την πιθανότητα του ενός γεγονότος, για παράδειγμα του Α, επί την εξαρτημένη πιθανότητα ενός άλλου γεγονότος, του Β στο παράδειγμα μας δεδομένου του Α. A= T t ( ) A B = B B= T > t ( ) Pr(A B) = Pr(B) = S(t ( ) ) Εάν θέσουμε ως Α το γεγονός ότι ένα αντικείμενο επιβίωσε για χρόνο τουλάχιστον t (j) και ως Β το γεγονός ένα αντικείμενο να επιβίωσε μετά το πέρας της χρονικής στιγμής t (j), το συνδυαζόμενο γεγονός Α και Β απλοποιεί το γεγονός Β το οποίο είναι συμπληρωματικό του Α. Ακολουθεί ότι η πιθανότητα Α και Β ισούται με την πιθανότητα επιβίωσης πέρα από τον χρόνο t (j). Ακόμα, επειδή το t (j) είναι ο επόμενος χρόνος αποτυχίας μετά το t (j-1), μπορεί να μην υπάρχουν αποτυχίες μετά τον χρόνο t (j-1) και πριν τον χρόνο t (j). Συνεπώς, η πιθανότητα του Α είναι ισοδύναμη με την πιθανότητα επιβίωσης μετά τον (j-1) διατεταγμένο χρόνο αποτυχίας. Επιπλέον, η εξαρτημένη πιθανότητα του Β δοθέντος του Α είναι ισοδύναμη με την εξαρτημένη πιθανότητα του τύπου ΚΜ. Συνεπώς, χρησιμοποιώντας τους βασικούς κανόνες των πιθανοτήτων μπορεί να παραχθεί ο τύπος ΚΜ. Χωρίς αποτυχίες κατά την διάρκεια: t ( ) < T < t ( ) Pr(A) = Pr T > t ( ) = S(t ( ) ) Pr(B A) = Pr (T > t ( ) T t ( ) ) Έτσι, από τον τύπο Pr(A B), Pr(A B) = Pr(A) Pr(B A) S t ( ) = S(t ( ) ) Pr (T > t ( ) T t ( ) ) Απόδειξη του τύπου της δεσμευμένης πιθανότητας στο παράρτημα, στο τέλος της εργασίας 25
27 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank 1.4 Ο έλεγχος log-rank για δύο ομάδες Είναι οι καμπύλες ΚΜ στατιστικά ισοδύναμες ; Εδώ περιγράφεται ο τρόπος με τον οποίο εκτιμάται εάν δύο ή περισσότερες καμπύλες ΚΜ είναι στατιστικά ισοδύναμες. Σε αυτή την παράγραφο θα εξετάσουμε την περίπτωση που έχουμε μόνο 2 ομάδες. Η πιο δημοφιλής μέθοδος για τέτοιους ελέγχους ονομάζεται log-rank test. Όταν δηλώνουμε ότι δύο καμπύλες ΚΜ είναι στατιστικά ισοδύναμες, σημαίνει ότι βασιζόμενοι σε διαδικασίες ελέγχου οι οποίες συγκρίνουν τις δύο καμπύλες, δεν καταλήγουμε σε τέτοια στοιχεία ώστε να ισχυριστούμε ότι οι πραγματικές καμπύλες επιβίωσης είναι διαφορετικές. Log rank test X 2 test Συνολική σύγκριση των καμπυλών ΚΜ Παρατηρούμενες τιμές έναντι αναμενόμενων τιμών Κατηγορίες που ορίζονται από τους διατεταγμένους χρόνους αποτυχίας Το log-rank test είναι ένα μεγάλου δείγματος χ 2 test που χρησιμοποιεί ως κριτήριο ελέγχου μια στατιστική ανάλυση που παρέχει μια συνολική σύγκριση των καμπυλών ΚΜ που εξετάζονται. Αυτού του είδους η στατιστική, όπως και πολλές άλλες, χρησιμοποιείται σε άλλα είδη χ 2 test, κάνοντας χρήση των παρατηρούμενων τιμών έναντι των αναμενόμενων τιμών στις κατηγορίες των αποτελεσμάτων. Οι κατηγορίες για την στατιστική log-rank, ορίζονται από τους διατεταγμένους χρόνους αποτυχιών για ολόκληρο το σύνολο δεδομένων που αναλύεται. 26
28 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Σαν παράδειγμα των πληροφοριών που απαιτούνται για το log-rank test, θεωρούμε ξανά την σύγκριση μεταξύ πραγματικής θεραπείας (ομάδα 1) και θεραπείας placebo (ομάδα 2) δεδομένων κατά την ύφεση 42 ασθενών με λευχαιμία. Εδώ, για κάθε διατεταγμένο χρόνο αποτυχίας t (j), στο σύνολο των δεδομένων, παρουσιάζεται ο αριθμός των αντικειμένων που αποτυγχάνουν (m ij ) σε αυτό τον χρόνο χωριστά κατά ομάδες (i) και επίσης παρουσιάζεται ο αριθμός των αντικειμένων σε κίνδυνο (n ij ) στον ίδιο χρόνο χωριστά κατά ομάδες. Για παράδειγμα, την τέταρτη εβδομάδα κανένα αντικείμενο δεν απέτυχε στην ομάδα 1, ενώ 2 αντικείμενα απέτυχαν στην ομάδα 2. Επίσης την ίδια εβδομάδα, ο συνολικός αριθμός ατόμων σε κίνδυνο για την ομάδα 1 περιλαμβάνει 21 άτομα, ενώ ο συνολικός αριθμός ατόμων σε κίνδυνο για την ομάδα 2 περιλαμβάνει 16 άτομα. Ομοίως, την δέκατη εβδομάδα, ένα αντικείμενο απέτυχε στην ομάδα 1 και κανένα αντικείμενο στην ομάδα 2. Ο συνολικός αριθμός ατόμων σε κίνδυνο για την κάθε ομάδα περιλαμβάνει 15 και 18 αντικείμενα αντίστοιχα. Στην επόμενη σελίδα, επεκτείναμε τον προηγούμενο πίνακα για να συμπεριλάβουμε σε αυτόν αναμενόμενες τιμές καθώς επίσης και τις παρατηρούμενες μείον τις αναμενόμενες τιμές για κάθε ομάδα σε κάθε διατεταγμένο χρόνο αποτυχίας. Ο τύπος για τις αναμενόμενες τιμές σε κάθε ομάδα, φαίνεται εδώ. Για την ομάδα 1, αυτός ο τύπος υπολογίζει την αναμενόμενη τιμή την στιγμή j, (e 1j ), ως τον λόγο των συνολικών αντικειμένων που βρίσκονται σε κίνδυνο και για τις δύο ομάδες την στιγμή j, ο οποίος είναι n 1j /(n 1j +n 2j ), πολλαπλασιασμένο με τον συνολικό αριθμό αποτυχιών σε αυτό τον χρόνο και για τις δύο ομάδες (m 1j +m 2j ). Ο τύπος των αναμενόμενων τιμών της ομάδας 2 υπολογίζεται ομοίως. ΠΑΡΑΔΕΙΓΜΑ Δεδομένα ύφεσης : n=42 # αποτυχιών n e = (m n + n + m ) n # ατόμων σε κίνδυνο t ( ) m m n n Αναμενόμενες τιμές κελιών: e = (m n + n + m ) 27
29 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Ανεπτυγμένος πίνακας (δεδομένα ύφεσης) # αποτυχιών #ατόμων σε κίνδυνο Αναμενόμενες τιμές Παρατηρούμενες Αναμενόμενες j t ( ) m m n n e e m e m e (21/42)x2 (21/42)x2-1,00 1, (21/40)x2 (19/40)x2-1,05 1, (21/38)x1 (17/38)x1-0,55 0, (21/37)x2 (16/37)x2-1,14 1, (21/35)x2 (14/35)x2-1,20 1, (21/33)x3 (12/33)x3 1,09-1, (17/29)x1 (12/29)x1 0,41-0, (16/28)x4 (12/28)x4-2,29 2, (15/23)x1 (8/23)x1 0,35-0, (13/21)x2 (8/21)x2-1,24 1, (12/18)x2 (6/18)x2-1,33 1, (12/16)x1 (4/16)x1 0,25-0, (11/15)x1 (4/15)x1-0,73 0, (11/14)x1 (3/14)x1 0,21-0, (10/13)x1 (3/13)x1-0,77 0, (7/9)x2 (2/9)x2-0,56 0, (6/7)X2 (1/7)x2-0,71 0,71 Σύνολα ,26 10,74-10,26 10,26 O E = (m ij e ij ) i=1,2 ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) O E = 10,26 O E = 10,26 Όταν δύο ομάδες συγκρίνονται, το log-rank test υπολογίζεται χρησιμοποιώντας το άθροισμα των παρατηρούμενων μείον των αναμενόμενων τιμών στο σύνολο των χρόνων αποτυχίας για την μια από της δύο ομάδες. Σε αυτό το παράδειγμα, αυτό το άθροισμα είναι -10,26 για την ομάδα 1 και 10,26 για την ομάδα 2. Θα χρησιμοποιήσουμε την τιμή της ομάδας 2 για να εκτελέσουμε τον έλεγχο, αλλά όπως μπορούμε να διαπιστώσουμε εκτός από το πρόσημο, η διαφορά είναι η ίδια και για τις δύο ομάδες. Δύο group: O E = Συνολικό άθροισμα παρατηρούμενων μείων αναμενόμενων τιμών για το group 2 Log-rank = ( ) ( ) Για την περίπτωση των δύο ομάδων, το log-rank test που παρουσιάζεται εδώ, υπολογίζεται διαιρώντας το τετράγωνο του αθροίσματος των παρατηρούμενων μείον των αναμενόμενων τιμών για μια από τις δύο ομάδες, ας πούμε για την ομάδα 2, προς την διακύμανση του αθροίσματος των παρατηρούμενων μείον των αναμενόμενων τιμών. 28
30 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Η έκφραση για την εκτιμώμενη διακύμανση δίνεται εδώ. Ο τύπος της διακύμανσης είναι ο ίδιος και για τις δύο ομάδες. Αυτός ο τύπος περιλαμβάνει τον συνολικό αριθμό ατόμων που βρίσκονται σε κίνδυνο σε κάθε ομάδα(n ij ) και τον αριθμό των αποτυχιών της κάθε ομάδας την χρονική στιγμή j. Το άθροισμα είναι για όλους τους ξεχωριστούς χρόνους αποτυχίας. Η αρχική ή μηδενική υπόθεση (H 0 ) που ελέγχεται είναι ότι δεν υπάρχει γενική διαφορά μεταξύ των δύο καμπυλών επιβίωσης. Κάτω από αυτή την αρχική υπόθεση το log-rank είναι μια προσέγγιση του χ 2 με ένα βαθμό ελευθερίας. Συνεπώς, μια τιμή P-value για το log-rank test καθορίζεται από τους πίνακες κατανομής του χ 2. Αρκετά υπολογιστικά προγράμματα είναι διαθέσιμα για τον υπολογισμό του log-rank test. Για τα δεδομένα ύφεσης ασθενών με λευχαιμία, τα αποτελέσματα που έδωσε το στατιστικό πρόγραμμα R δίνονται εδώ. Το αποτέλεσμα του log-rank είναι 16,79 και η αντίστοιχη τιμή για το P-value είναι 0. Αυτή η τιμή του P-value δείχνει ότι η αρχική υπόθεση θα πρέπει να απορριφθεί. Μπορούμε επομένως να συμπεράνουμε ότι η ομάδα που δέχθηκε πραγματική θεραπεία και η ομάδα που δέχθηκε θεραπεία placebo έχουν σημαντικά διαφορετικές καμπύλες επιβίωσης. Var(O E ) = ( ), i=1,2 ( ) H 0 : καμία διαφορά ανάμεσα στις καμπύλες επιβίωσης Log-rank test ~x 2 με έναν βαθμό ελευθερίας υπό την H 0 Περιγραφική στατιστική για τις καμπύλες ΚΜ Log-rank στατιστική Εναλλακτική στατιστική ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) Δεδομένα ύφεσης Group Παρατηρηθέν συμβάντα Αναμενόμενα συμβάντα , ,75 Σύνολο 30 30,00 Log-rank=chi2(2)=16.79 P-value = Pr>chi2 = Παρόλο που η χρήση ενός στατιστικού πακέτου είναι ο πιο εύκολος τρόπος υπολογισμού του log-rank test, δίνονται εδώ κάποιες λεπτομέρειες για τον μαθηματικό υπολογισμό του. Έχουμε ήδη δει νωρίτερα υπολογισμούς όπου η τιμή Ο 2 -Ε 2 είναι 10,26. Η εκτιμώμενη διακύμανση του Ο 2 -Ε 2 από τον τύπο της διακύμανσης που δίνεται παραπάνω και είναι 6,2685. Το log-rank test υπολογίζεται υψώνοντας στο τετράγωνο το 10,26 και διαιρώντας με το 6,2685 το οποίο ισούται με 16,793 όπως είδαμε και από το αποτέλεσμα που έδωσε το στατιστικό πακέτο R. O E = 10,26 Var(O E ) = 6,2685 Log-rank statistics= ( ) = ( ) = (10,26) 6,2685 = 16,793 29
31 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Προσεγγιστικός τύπος : # X (O E ) ΠΑΡΑΔΕΙΓΜΑ (συνέχεια) E Χ = ( 10,26) + (10,26) 19,26 10,74 = 15,276 Log-rank statistic = 16,793 Μια προσέγγιση του log-rank test που δίνεται εδώ, μπορεί να υπολογιστεί χρησιμοποιώντας παρατηρούμενες και αναμενόμενες τιμές για κάθε ομάδα χωρίς να χρειαστεί να υπολογίσουμε τον τύπο της διακύμανσης. Ο προσεγγιστικός τύπος προέρχεται από τον κλασσικό τύπο του χ 2 test που αθροίζει για κάθε ομάδα που συγκρίνεται το τετράγωνο των παρατηρούμενων μείον των αναμενόμενων τιμών διαιρώντας το με τις αναμενόμενες τιμές. Ο υπολογισμός του προσεγγιστικού τύπου δίνεται εδώ για τα δεδομένα ύφεσης ασθενών με λευχαιμία. Οι αναμενόμενες τιμές είναι 19,26 και 10,24 για τις ομάδες 1 και 2 αντίστοιχα. Η τιμή του χ 2 που υπολογίστηκε είναι 15,276, η οποία είναι ελάχιστα μικρότερη από εκείνη του log-rank test (16,793). 30
32 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank 1.5 Ο έλεγχος log-rank για περισσότερες ομάδες Το log-rank test μπορεί να χρησιμοποιηθεί για να συγκρίνει τρεις ή περισσότερες καμπύλες επιβίωσης. Η αρχική υπόθεση για αυτή την πιο γενική κατάσταση είναι ότι όλες οι καμπύλες επιβίωσης είναι οι ίδιες. Παρόλο που η ίδια διάταξη του πίνακα μπορεί να χρησιμοποιηθεί για να εκτελεσθούν οι υπολογισμοί όταν υπάρχουν πάνω από δύο ομάδες, ο στατιστικός έλεγχος είναι πιο περίπλοκος από μαθηματικής σκοπιάς καθώς περιέχει διακυμάνσεις και συνδιακυμάνσεις των αθροισμάτων των παρατηρούμενων μείον των αναμενόμενων τιμών για κάθε ομάδα. Ένας βολικός μαθηματικός τύπος μπορεί να δοθεί σε μορφή πινάκων. Παρουσιάζεται αυτή η μορφή στο παράρτημα στο τέλος του κεφαλαίου. H 0 : Όλες οι καμπύλες επιβίωσης είναι ίδιες Στατιστική log-rank για περισσότερα από 2 group περιλαμβάνει διακύμανση και συνδιακύμανση O E. Τύπος σε μορφή πινάκων : Παράρτημα στο τέλος του κεφαλαίου Δεν θα δώσουμε άλλες λεπτομέρειες για τον υπολογισμό του log-rank καθώς οποιοδήποτε στατιστικό πακέτο μπορεί να εκτελέσει εύκολα αυτούς τους υπολογισμούς από μια βάση δεδομένων. Αντί για αυτό παραθέτουμε την χρήση αυτού του ελέγχου με δεδομένα για περισσότερες από δύο ομάδες. Εάν ο αριθμός των ομάδων που συγκρίνονται είναι G( 2), τότε το log-rank έχει προσέγγιση μεγάλου δείγματος κατανομής Χ 2 με G-1 βαθμούς ελευθερίας. Για αυτό τον λόγο, η απόφαση για την σημαντικότητα του ελέγχου, παίρνεται χρησιμοποιώντας τους πίνακες του ελέγχου Χ 2 με τους κατάλληλους βαθμούς ελευθερίας. Ο προσεγγιστικός τύπος που περιγράφηκε προηγουμένως και περιλαμβάνει μόνο παρατηρούμενες και αναμενόμενες τιμές χωρίς να απαιτείται ο υπολογισμός των διακυμάνσεων και συνδιακυμάνσεων, μπορεί να χρησιμοποιηθεί και στην G( 2)groups: log rank statistic~x με G 1 βαθμούς ελευθερίας Προσεγγιστικός τύπος: # X = (O E ) Δεν απαιτείται γιατί το στατιστικό πρόγραμμα στον υπολογιστή υπολογίζει το ακριβές νούμερο του logrank E 31
33 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank περίπτωση που υπάρχουν περισσότερες από δύο ομάδες προς σύγκριση. Παρόλα αυτά, στην πράξη, η χρήση αυτού του προσεγγιστικού τύπου δεν ενδείκνυται όσο υπάρχουν διαθέσιμα υπολογιστικά προγράμματα που μπορούν να υπολογίσουν την ακριβή τιμή του log-rank. ΠΑΡΑΔΕΙΓΜΑ n = 137 Δοκιμές για καρκίνο του πνεύμονα στην διοίκηση απόστρατων Στήλη 1: Θεραπεία (συνήθης, τεστ=2) Στήλη 2: Κυτταρικός τύπος 1 (μεγάλος, άλλο=0) Στήλη 3: Κυτταρικός τύπος 2 (αδενικός, άλλο=0) Στήλη 4: Κυτταρικός τύπος 3 (μικρός, άλλο=0) Στήλη 5: Κυτταρικός τύπος 4 (λεπιδωτός, άλλο=0) Στήλη 6: Χρόνος επιβίωσης (μέρες) Στήλη 7: Κατάσταση απόδοσης (χειρότερη=0.καλύτερη=100) Στήλη 8: Διάρκεια ασθένειας (μήνες) Στήλη 9: Ηλικία Στήλη 10: Προηγούμενη θεραπεία (καμία, οποιαδήποτε=1) Στήλη 11: Κατάσταση (λογοκριμένος, θάνατος=1) Ολόκληρο το data set που χρησιμοποιήθηκε σε αυτό το παράδειγμα υπάρχει στην διεύθυνση : gnments/vets.txt Τώρα δίνουμε ένα παράδειγμα για να επεξηγήσουμε την χρήση του log-rank test όταν συγκρίνει περισσότερες από δύο ομάδες. Το σύνολο των δεδομένων vets.dat, εξετάζει χρόνους επιβίωσης σε ημέρες για 137 ασθενείς από δοκιμές για καρκίνο του πνεύμονα στην διοίκηση απόστρατων που αναφέρεται σαν παράδειγμα οι Kalbfleisch και Prentice στο κείμενο τους (The Statistical Analysis of Survival Time Data, John Wiley, 1980, σελ ). Μια λίστα από τις μεταβλητές που χρησιμοποιούνται δίνεται εδώ. Η κατάσταση αποτυχίας ορίζεται από την κατάσταση των μεταβλητών (στήλη 11). Από το σύνολο των μεταβλητών της λίστας, επικεντρωνόμαστε στην μεταβλητή της κατάστασης απόδοσης (στήλη 7). Αυτή η μεταβλητή είναι συνεχής, για αυτό τον λόγο πριν πάρουμε τις καμπύλες ΚΜ και το logrank test, πρέπει να κατηγοριοποιήσουμε αυτή την μεταβλητή. Τάξεις κατάστασης απόδοσης Group # Τάξη Μέγεθος Αν, για την μεταβλητή της κατάστασης απόδοσης, διαλέξουμε τις κατηγορίες 0-59, και εξασφαλίζουμε τρεις ομάδες μεγεθών 52, 50 και 35 αντίστοιχα. 32
34 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank Οι καμπύλες ΚΜ για κάθε μια από τις τρεις ομάδες απεικονίζονται εδώ. Παρατηρούμε ότι αυτές οι καμπύλες εμφανίζονται λίγο διαφορετικές. Ένας έλεγχος σημαντικότητας αυτής της διαφορετικότητας παρέχεται από το log-rank test. Καμπύλες ΚΜ για την κατάσταση απόδοσης των group Περιγραφικές πληροφορίες για τις τρεις καμπύλες ΚΜ μαζί με τα αποτελέσματα του ελέγχου log-rank, παρουσιάζονται εδώ. Επειδή έχουμε τρεις ομάδες που συγκρίνονται (G=3), οι βαθμοί ελευθερίας για το log-rank test είναι G-1 άρα 2. Το log-rank υπολογίζεται 29,181 με P-value ίσο με μηδέν. Συνεπώς το συμπέρασμα από το log-rank test είναι ότι υπάρχει σημαντικά υψηλή διαφορά μεταξύ των τριών καμπυλών επιβίωσης για την κατάσταση της απόδοσης των ομάδων. Group Παρατηρηθέν συμβάντα Αναμενόμενα συμβάντα , , ,53 Σύνολο ,000 Log-rank = chi2(2) = 29,18 P-value = Pr>chi2 = 0,000 G = 3 groups ; df = G-1 = 2 Το log-rank τεστ είναι στατιστικά σημαντικό Συμπέρασμα: Υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των τριών group 33
35 Καμπύλες επιβίωσης Kaplan-Meier και ο έλεγχος log-rank 1.6 Σύνοψη Καμπύλες ΚΜ: Σε αυτό το σημείο παραθέτεται μια σύνοψη του κεφαλαίου. Αρχικά, περιγράψαμε πως μπορεί να εκτιμηθεί και να σχεδιαστεί μια καμπύλη επιβίωσης με την χρήση της μεθόδου Kaplan-Meier. Για να υπολογιστούν ΚΜ καμπύλες, πρέπει να σχεδιαστεί ένα πλάνο δεδομένων που θα βάζει σε σειρά τους χρόνους αποτυχίας από τον μικρότερο προς τον μεγαλύτερο. Για κάθε έναν από τους διατεταγμένους αυτούς χρόνους αποτυχίας, η εκτιμώμενη πιθανότητα επιβίωσης, υπολογίζεται χρησιμοποιώντας τον τύπο του οριακού t(j) : Ο j ιοστός κατά σειρά χρόνος αποτυχίας S t ( ) = P r T > t ( ) T t ( ) = = S t ( ) P r (T > t ( ) T t ( ) ) Log-rank test: H 0 η ίδια καμπύλη επιβίωσης για όλα τα group ( ) Log-rank = ( ) log rank statistic~x με G 1 βαθμούς ελευθερίας υπό την Η γινομένου. Εναλλακτικά, αυτή η εκτίμηση, μπορεί να υπολογιστεί σαν το γινόμενο των εκτιμήσεων επιβίωσης για τον προηγούμενο χρόνο αποτυχίας πολλαπλασιασμένο με την εξαρτημένη πιθανότητα να επιβιώσει το άτομο πέραν του τρέχοντος χρόνου αποτυχίας. Όταν συγκρίνονται καμπύλες επιβίωσης, το log-rank test δίνει έναν στατιστικό έλεγχο για την αρχική υπόθεση μιας κοινής καμπύλης επιβίωσης. Για δύο ομάδες, το log-rank test βασίζεται στο άθροισμα των παρατηρούμενων μείον των αναμενόμενων αποτελεσμάτων για μια δοθείσα ομάδα και στις εκτιμήσεις των διακυμάνσεων της. Ο στατιστικός έλεγχος προσεγγίζει τον έλεγχο του χ-τετράγωνο για μεγάλα δείγματα, με G-1 βαθμούς ελευθερίας, όπου το G δηλώνει τον αριθμό των ομάδων που συγκρίνονται. 34
Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21
ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις
Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο
Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,
Κεφάλαιο 9. Έλεγχοι υποθέσεων
Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές
Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..
Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας
Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο
Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή
ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ
Συναρτήσεις Προεπισκόπηση Κεφαλαίου Τα μαθηματικά είναι μια γλώσσα με ένα συγκεκριμένο λεξιλόγιο και πολλούς κανόνες. Πριν ξεκινήσετε το ταξίδι σας στον Απειροστικό Λογισμό, θα πρέπει να έχετε εξοικειωθεί
Ξέρουμε ότι: Συνάρτηση-απεικόνιση με πεδίο ορισμού ένα σύνολο Α και πεδίο τιμών ένα σύνολο Β είναι κάθε μονοσήμαντη απεικόνιση f του Α στο Β.
Η έννοια της ακολουθίας Ξέρουμε ότι: Συνάρτηση-απεικόνιση με πεδίο ορισμού ένα σύνολο Α και πεδίο τιμών ένα σύνολο Β είναι κάθε μονοσήμαντη απεικόνιση f του Α στο Β. Δηλαδή: f : A B Η ακολουθία είναι συνάρτηση.
Κεφάλαιο 9. Έλεγχοι υποθέσεων
Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές
Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )
ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και
ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών
44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.
Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση
Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
math-gr Παντελής Μπουμπούλης, M.Sc., Ph.D. σελ. 2 math-gr.blogspot.com, bouboulis.mysch.gr
III Όριο Παντελής Μπουμπούλης, MSc, PhD σελ blogspotcom, bouboulismyschgr ΜΕΡΟΣ Πεπερασμένο Όριο στο Α Ορισμός Όριο στο : Όταν οι τιμές μιας συνάρτησης f προσεγγίζουν όσο θέλουμε έναν πραγματικό αριθμό,
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της
Μερικές φορές δεν μπορούμε να αποφανθούμε για την τιμή του άπειρου αθροίσματος.
Σειρές Σειρές και μερικά αθροίσματα: Το πρόβλημα της άθροισης μιας σειράς άπειρων όρων είναι πολύ παλιό. Μερικές φορές μια τέτοια σειρά καταλήγει σε πεπερασμένο αποτέλεσμα, μερικές φορές απειρίζεται και
2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για
2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο
I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr
I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο
Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής
Σήματα και Συστήματα Διάλεξη 1: Σήματα Συνεχούς Χρόνου Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Εισαγωγή στα Σήματα 1. Σκοποί της Θεωρίας Σημάτων 2. Κατηγορίες Σημάτων 3. Χαρακτηριστικές Παράμετροι
Μαθηματική Εισαγωγή Συναρτήσεις
Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας Διανύσματα Καστοριά,
Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)
Κεφάλαιο 10 Συνεχείς τυχαίες μεταβλητές Σε αυτό το κεφάλαιο θα εξετάσουμε τις ιδιότητες που έχουν οι συνεχείς τυχαίες μεταβλητές. Εκείνες οι Τ.Μ. X, δηλαδή, των οποίων το σύνολο τιμών δεν είναι διακριτό,
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών
Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..
Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας
ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ
Εισαγωγή στη Στατιστική
Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων
Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α
ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΟΜΕΑΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ Η/Υ, ΠΛΗΡΟΦΟΡΙΚΗΣ & ΙΚΤΥΩΝ Εργ. Τεχνολογίας Λογισμικού & Υπηρεσιών S 2 ELab Π Τ Υ Χ Ι Α
5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο
5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που
Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:
Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον
Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα
Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια
Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ
Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ 1 Συναρτήσεις Όταν αναφερόμαστε σε μια συνάρτηση, ουσιαστικά αναφερόμαστε σε μια σχέση ή εξάρτηση. Στα μαθηματικά που θα μας απασχολήσουν, με απλά λόγια, η σχέση
Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες
Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω
Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:
Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον
5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV
5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι
ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών
ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ-ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ. ΜΕΡΟΣ Α : Άλγεβρα. Κεφάλαιο 2 ο (Προτείνεται να διατεθούν 12 διδακτικές ώρες) Ειδικότερα:
ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ-ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΜΕΡΟΣ Α : Άλγεβρα Κεφάλαιο ο (Προτείνεται να διατεθούν διδακτικές ώρες) Ειδικότερα:. -. (Προτείνεται να διατεθούν 5 διδακτικές ώρες).3 (Προτείνεται να διατεθούν
K15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων
K15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων Γιάννης Λιαπέρδος TEI Πελοποννήσου Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ Η έννοια του συνδυαστικού
ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ
ΑΡΧΗ 1ης ΣΕΛΙ ΑΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΓΩΝΙΣΜΑ ΠΕΡΙΟΔΟΥ : ΦΕΒΡΟΥΑΡΙΟΥ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ : 7 ΘΕΜΑ Α :
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ
ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 1 η Ημερομηνία Αποστολής στον Φοιτητή: 17 Οκτωβρίου 2011
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) ΕΡΓΑΣΙΑ η Ημερομηνία Αποστολής στον Φοιτητή: 7 Οκτωβρίου 0 Ημερομηνία παράδοσης της Εργασίας: 5 Νοεμβρίου 0 Οι ασκήσεις
Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,
Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της
Κάνοντας ακριβέστερες μετρήσεις με την βοήθεια των Μαθηματικών. Ν. Παναγιωτίδης, Υπεύθυνος ΕΚΦΕ Ν. Ιωαννίνων
Κάνοντας ακριβέστερες μετρήσεις με την βοήθεια των Μαθηματικών Ν. Παναγιωτίδης, Υπεύθυνος ΕΚΦΕ Ν. Ιωαννίνων Αν κάναμε ένα τεστ νοημοσύνης στους μαθητές και θέταμε την ερώτηση: Πως μπορεί να μετρηθεί το
Αριθμητική Ανάλυση & Εφαρμογές
Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου
Μαθηματική Εισαγωγή Συναρτήσεις
Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς Καστοριά, Ιούλιος 14 A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας
ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1
ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΣΥΝΑΡΤΗΣΕΙΣ Η έννοια της συνάρτησης είναι θεμελιώδης στο λογισμό και διαπερνά όλους τους μαθηματικούς κλάδους. Για το φοιτητή είναι σημαντικό να κατανοήσει πλήρως αυτή
Περιγραφική Ανάλυση ποσοτικών μεταβλητών
Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο
Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης
Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης Σύνοψη Σκοπός της συγκεκριμένης άσκησης είναι ο υπολογισμός του μέτρου της στιγμιαίας ταχύτητας και της επιτάχυνσης ενός υλικού σημείου
1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης
1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης Στη συγκεκριμένη ενότητα εξετάζουμε θέματα σχετικά με την αριθμητική πεπερασμένης ακρίβειας που χρησιμοποιούν οι σημερινοί υπολογιστές και τα
Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o
ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ
Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ
Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΚΑΙ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ (Α ΜΕΡΟΣ: ΣΥΝΑΡΤΗΣΕΙΣ) Επιμέλεια: Καραγιάννης Ιωάννης, Σχολικός Σύμβουλος Μαθηματικών
Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson
Έλεγχος Ανεξαρτησίας x του Parso Έστω ότι λαμβάνουμε δείγμα μεγέθους. Η πιθανότητα π εμφάνισης ενός χαρακτηριστικού να βρεθεί στο κελί (i,j) κάτω από την υπόθεση Η 0 της ανεξαρτησίας δίνεται από την σχέση
Μετατόπιση, είναι η αλλαγή (μεταβολή) της θέσης ενός κινητού. Η μετατόπιση εκφράζει την απόσταση των δύο θέσεων μεταξύ των οποίων κινήθηκε το κινητό.
Μετατόπιση, είναι η αλλαγή (μεταβολή) της θέσης ενός κινητού. Η μετατόπιση εκφράζει την απόσταση των δύο θέσεων μεταξύ των οποίων κινήθηκε το κινητό. Η ταχύτητα (υ), είναι το πηλίκο της μετατόπισης (Δx)
Ανάλυση επιβίωσης (survival analysis)
Hippokratia 2014 Ανάλυση επιβίωσης (survival analysis) Κων/νος Α. Τουλής, MD MRes MSc PhD Ενδοκρινολόγος, 424 ΓΣΝΕ Τι είναι η ανάλυση επιβίωσης; Η ανάλυση επιβίωσης (survival analysis) είναι μια ομάδα
Το φτερό του αεροπλάνου
Το φτερό του αεροπλάνου Γνωστικό Αντικείμενο: Φυσική (Πίεση) Τάξη: Β Γυμνασίου Χρονική Διάρκεια Προτεινόμενη χρονική διάρκεια σχεδίου εργασίας: 5 διδακτικές ώρες Διδακτικοί Στόχοι Οι μαθητές: - Να εξηγούν
ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2
ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική
X = = 81 9 = 9
Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη
Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test
1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset
Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)
Μαθηματικά Ενότητα 2: Διαφορικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό
Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής
Κύρια σημεία Ερευνητική Μεθοδολογία και Μαθηματική Στατιστική Απόστολος Μπουρνέτας Τμήμα Μαθηματικών ΕΚΠΑ Αναζήτηση ερευνητικού θέματος Εισαγωγή στην έρευνα Ολοκλήρωση ερευνητικής εργασίας Ο ρόλος των
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης
ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ
ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών
Y Y ... y nx1. nx1
6 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΤΗ ΧΡΗΣΗ ΠΙΚΑΚΩΝ Η χρησιμοποίηση και ο συμβολισμός πινάκων απλοποιεί σημαντικά τα αποτελέσματα της γραμμικής παλινδρόμησης, ιδίως στην περίπτωση της πολλαπλής παλινδρόμησης Γενικά,
ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ
ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ ΕΙΣΑΓΩΓΗ Ο όρος «ποιότητα», είναι μια απλή έννοια που εκφράζεται
ΜΑΘΗΜΑΤΙΚΑ ΟΙΚΟΝΟΜΙΚΗΣ ΑΝΑΛΥΣΗΣ
ΑΘΑΝΑΣΙΟΣ Χ. ΑΛΕΞΑΝΔΡΑΚΗΣ ΑΝ. ΚΑΘΗΓΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ ΜΑΘΗΜΑΤΙΚΑ ΟΙΚΟΝΟΜΙΚΗΣ ΑΝΑΛΥΣΗΣ Β ΤΟΜΟΣ Κάθε γνήσιο αντίτυπο φέρει την υπογραφή του συγγραφέα και τη σφραγίδα του εκδότη ISBN SET: 960-56-026-9
Γιώργος Καριπίδης-Ανθούλα Σοφιανοπούλου ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΚΑΤΕΥΘΥΝΣΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΣΤΑ ΟΡΙΑ ΣΥΝΑΡΤΗΣΗΣ
Γιώργος Καριπίδης-Ανθούλα Σοφιανοπούλου ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΚΑΤΕΥΘΥΝΣΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΣΤΑ ΟΡΙΑ ΣΥΝΑΡΤΗΣΗΣ ΓΕΩΜΕΤΡΙΚΗ ΕΡΜΗΝΕΙΑ του ορίου συνάρτησης όταν χ χ Για να έχει νόημα το όριο συνάρτησης f με πεδίο
ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης
ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση
Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.
Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι
ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική
ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων
6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά
Μέθοδος μέγιστης πιθανοφάνειας
Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα
Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθ η γη
Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης
ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 2: Έλεγχοι Υποθέσεων
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής στην Προσχολική Ηλικία Περιεχόμενα ενότητας Παρουσιάζονται οι βασικές
Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών
Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για
ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)
ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για
ΜΑΘΗΜΑ 3ο. Βασικές έννοιες
ΜΑΘΗΜΑ 3ο Βασικές έννοιες Εισαγωγή Βασικές έννοιες Ένας από τους βασικότερους σκοπούς της ανάλυσης των χρονικών σειρών είναι η διενέργεια των προβλέψεων. Στα υποδείγματα αυτά η τρέχουσα τιμή μιας οικονομικής
Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής
Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Γιάννης Γαροφαλάκης Αν. Καθηγητής ιατύπωση του προβλήματος (1) Τα συστήματα αναμονής (queueing systems), βρίσκονται
Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες
Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες Εισαγωγή-Σκοπός. Τρόποι δημιουργίας δυναμικών ιστοσελίδων. Dynamic Web Pages. Dynamic Web Page Development Using Dreamweaver. Τρόποι δημιουργίας δυναμικών
ΣΤΑ ΚΕΦΆΛΑΙΑ ΠΟΥ ΑΚΟΛΟΥΘΟΎΝ ΘΑ ΑΣΧΟΛΗΘΟΎΜΕ με την αξιολόγηση διάφορων ΔΙΑΧΡΟΝΙΚΗ ΑΞΙΑ ΤΟΥ ΧΡΗΜΑΤΟΣ. κεφάλαιο 2
κεφάλαιο 2 ΔΙΑΧΡΟΝΙΚΗ ΑΞΙΑ ΤΟΥ ΧΡΗΜΑΤΟΣ ΣΤΑ ΚΕΦΆΛΑΙΑ ΠΟΥ ΑΚΟΛΟΥΘΟΎΝ ΘΑ ΑΣΧΟΛΗΘΟΎΜΕ με την αξιολόγηση διάφορων επενδυτικών προτάσεων. Πριν από την ανάλυση των προτάσεων αυτών, είναι απαραίτητο να έχετε
Κεφάλαιο 4. μιας και αντιστοιχεί στην περίοδο μηδέν, είναι δηλαδή το αρχικό κεφάλαιο. Όμοια έχουμε τα κεφάλαια K1, K2, K
Κεφάλαιο. Ανατοκισμός. Εισαγωγή Στη διαδικασία με την οποία ένα κεφάλαιο κατατίθεται στον απλό τόκο, στο τέλος κάθε περιόδου παίρνουμε τον τόκο και αφήνουμε το αρχικό κεφάλαιο να τοκιστεί. Έτσι το κεφάλαιο
ΠΕΡΙΕΧΟΜΕΝΑ 1 ΠΡΑΓΜΑΤΙΚΟΙ ΑΡΙΘΜΟΙ ΑΚΟΛΟΥΘΙΕΣ ΑΡΙΘΜΩΝ EΞΙΣΩΣΕΙΣ...47 ΠΡΟΛΟΓΟΣ... 9
ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ... 9 1 ΠΡΑΓΜΑΤΙΚΟΙ ΑΡΙΘΜΟΙ...11 1.1 Βασικές θεωρητικές γνώσεις... 11 1.. Λυμένα προβλήματα... 19 1. Προβλήματα προς λύση... 4 1.4 Απαντήσεις προβλημάτων Πραγματικοί αριθμοί... 0 ΑΚΟΛΟΥΘΙΕΣ
Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )
Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η
Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress
ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress ΚΟΤΣΟΓΙΑΝΝΙΔΗΣ ΛΑΖΑΡΟΣ Επιβλέπων καθηγητής Σφέτσος Παναγιώτης ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ Ως Ηλεκτρονικό Εμπόριο ή
Για την τοπική μελέτη μιας συνάρτησης f ενδιαφέρον έχει η συμπεριφορά της συνάρτησης γύρω απο κάποια θέση x 0
5 Όριο συνάρτησης Α ΑΠΑΡΑΙΤΗΤΕΣ ΓΝΩΣΕΙΣ ΘΕΩΡΙΑΣ Για την τοπική μελέτη μιας συνάρτησης f ενδιαφέρον έχει η συμπεριφορά της συνάρτησης γύρω απο κάποια θέση (δηλαδή όταν το βρίσκεται πολύ κοντά στο ) ή στο
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος
Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση
Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση Πέρα όµως από την Γνωσιακή/Εννοιολογική ανάλυση της δοµής και του περιεχοµένου των σχολικών εγχειριδίων των Μαθηµατικών του Δηµοτικού ως προς τις έννοιες
Η έννοια του συνόλου. Εισαγωγικό κεφάλαιο 27
Εισαγωγικό κεφάλαιο 27 Η έννοια του συνόλου Σύνολο είναι κάθε συλλογή αντικειμένων, που προέρχονται από την εμπειρία μας ή τη διανόησή μας, είναι καλά ορισμένα και διακρίνονται το ένα από το άλλο. Αυτός
α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις
ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΙΕΘΝΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΣΧΕΣΕΩΝ ΚΑΙ ΑΝΑΠΤΥΞΗΣ ΜΑΘΗΜΑ: ΣΤΑΤΙΣΤΙΚΗ IΙ ΕΙΣΗΓΗΤΡΙΑ: ΣΑΒΒΑΣ ΠΑΠΑ ΟΠΟΥΛΟΣ ΠΑΛΑΙΑ ΘΕΜΑΤΑ ********************************************************************
Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες
Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού
Συσχέτιση μεταξύ δύο συνόλων δεδομένων
Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,
Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA
ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 3: One-Way ANOVA
1. Πότε χρησιμοποιούμε την δομή επανάληψης; Ποιες είναι οι διάφορες εντολές (μορφές) της;
1. Πότε χρησιμοποιούμε την δομή επανάληψης; Ποιες είναι οι διάφορες (μορφές) της; Η δομή επανάληψης χρησιμοποιείται όταν μια σειρά εντολών πρέπει να εκτελεστεί σε ένα σύνολο περιπτώσεων, που έχουν κάτι
4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER
4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι
Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017
Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική
2. Να γράψετε έναν αριθμό που είναι μεγαλύτερος από το 3,456 και μικρότερος από το 3,457.
1. Ένα κεφάλαιο ενός βιβλίου ξεκινάει από τη σελίδα 32 και τελειώνει στη σελίδα 75. Από πόσες σελίδες αποτελείται το κεφάλαιο; Αν το κεφάλαιο ξεκινάει από τη σελίδα κ και τελειώνει στη σελίδα λ, από πόσες
Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17
Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις
ΕΞΕΤΑΣΤΕΑ ΥΛΗ (SYLLABUS) Ενότητα Advanced Βάσεις Δεδομένων, Προχωρημένο Επίπεδο. Copyright 2013 ECDL Foundation Ref: SL_AM3_Syl2.
ΕΞΕΤΑΣΤΕΑ ΥΛΗ (SYLLABUS) Ενότητα Advanced Βάσεις Δεδομένων, Προχωρημένο Επίπεδο Copyright 2013 ECDL Foundation Ref: SL_AM3_Syl2.0_v1 Page 17 of 29 Βάσεις Δεδομένων, Προχωρημένο Επίπεδο Ακολουθεί η Εξεταστέα