Ανάλυση Επιβίωσης σε Συνδυασμό με τη Μέθοδο Πλησιέστερων Γειτόνων για Απόδοση Ελλειπουσών Τιμών

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ανάλυση Επιβίωσης σε Συνδυασμό με τη Μέθοδο Πλησιέστερων Γειτόνων για Απόδοση Ελλειπουσών Τιμών"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Ανάλυση Επιβίωσης σε Συνδυασμό με τη Μέθοδο Πλησιέστερων Γειτόνων για Απόδοση Ελλειπουσών Τιμών ΑΝΤΩΝΙΟΣ ΜΥΡΩΝ Α.Ε.Μ. 297 ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων: ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ (Αναπληρωτής Καθηγητής) Τμήμα Πληροφορικής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σεπτέμβριος 2011

2 2

3 ΕΥΧΑΡΙΣΤΙΕΣ Το χρονικό διάστημα εκπόνησης της παρούσης εργασίας κατά τη διάρκεια των σπουδών μου, υπήρξαν κάποια άτομα που στάθηκαν αρωγοί και με βοήθησαν να αντεπεξέλθω με επιτυχία στις δυσκολίες που συνάντησα. Πρώτα από όλα, θα ήθελα να ευχαριστήσω τα μέλη της οικογένειάς μου για το ενδιαφέρον και την υποστήριξη που μου έχουν προσφέρει όλα αυτά τα χρόνια. Επίσης, θα ήθελα να ευχαριστήσω και τον επιβλέποντα καθηγητή της διπλωματικής μου εργασίας κ Ελευθέριο Αγγελή για το συμβουλευτικό ρόλο και τις παραινέσεις του κατά την υλοποίηση της μελέτης. 3

4 ΠΡΟΛΟΓΟΣ Ο συνδυασμός της ανάλυσης επιβίωσης με τη μέθοδο πλησιέστερων γειτόνων K-NN δεν έχει χρησιμοποιηθεί ευρέως στη διεθνή βιβλιογραφία. Στην παρούσα διατριβή, προτείνουμε και υλοποιούμε μια μέθοδο που συνδυάζει την K-NN, που λειτουργεί με βασική ιδέα την απόδοση τιμών σε ελλείποντα σύνολα δεδομένων, με άλλες μεθόδους του τομέα της ανάλυσης επιβίωσης, όπως η παλινδρόμηση Cox και η Kaplan-Meier. Αυτή η μέθοδος βρίσκει εφαρμογή σε δύο κλινικά σύνολα δεδομένων, τα ο- ποία περιλαμβάνουν πληροφορίες για ασθενείς που έχουν υποστεί μεταμόσχευση μυελού των οστών και καρκίνο του πνεύμονα. Στη συνέχεια τα αποτελέσματα συγκρίνονται προκειμένου να εκτιμηθεί η απόδοση της K-NN για διαφορετικό αριθμό γειτόνων. Περιγράφουμε επίσης και άλλες μεθόδους απόδοσης τιμών σε ελλείποντα δεδομένα που έχουν χρησιμοποιηθεί και από πλευράς ανάλυσης επιβίωσης στη βιβλιογραφία, όπως η INI, η BPCA και η PLS των οποίων η απόδοση συγκρίνεται επίσης με αυτήν της K-NN για διαφορετικές εφαρμογές, συμπεριλαμβανομένης και της δικής μας. Η νέα μεθοδολογία που προτείνεται σε αυτή τη μελέτη περιλαμβάνει την δημιουργία ελλειπουσών τιμών από ολοκληρωμένα σύνολα δεδομένων, σε τέτοιο ποσοστό ώστε να καθίσταται δυνατή η εξαγωγή χρήσιμων συμπερασμάτων σχετικά με την απόδοση της μεθόδου K-NN. Τότε, εφαρμόζουμε τη μέθοδο απόδοσης τιμών K-NN για διαφορετικό αριθμό γειτόνων (k=2, 5, 7, 10 και 15) για τα δύο κλινικά σύνολα δεδομένων. 4

5 Στο επόμενο βήμα, δημιουργούμε δύο καμπύλες επιβίωσης, από τα αρχικά σύνολα δεδομένων και αυτά που προκύπτουν μετά από την εφαρμογή της K-NN, χρησιμοποιώντας τη μέθοδο Kaplan-Meier και περιγράφουμε τα αποτελέσματά τους. Έπειτα, συγκρίνουμε τις καμπύλες με βάση τα διαγράμματα που προκύπτουν, αλλά χρησιμοποιώντας επιπλέον και μέτρα σύγκρισης όπως το log-rank τεστ. Για την εκτίμηση της απόδοσης της μεθόδου, λάβαμε υπόψη αποτελέσματα από άλλες εφαρμογές στη βιβλιογραφία. Τέλος, προτείνουμε πιθανές μελλοντικές εφαρμογές και εκτιμούμε τα συνολικά αποτελέσματα της μελέτης. 5

6 ABSTRACT The combination of Survival Analysis with K-Nearest Neighbor method has not been widely used in many studies in the international literature. In this thesis, we propose and implement a method that combines K-NN, which basic idea works as data imputation, with other methods of the domain of Survival Analysis, such as Cox Regression and Kaplan-Meier. This method finds implementation on two clinical survival datasets, including details for patients with lung cancer and bone marrow transplant. The results are then compared in order to evaluate the performance of K-NN method for the different number of neighbors. We also describe other data imputation methods that have been used in terms of survival analysis in the literature, such as INI, BPCA and PLS and their performance is also compared with that of K-NN for different applications, including ours. The new methodology proposed in this study primarily includes the generating missing values from complete datasets at a rate that will allow useful conclusions about the performance of the K-NN imputation method. Then, we apply the K-NN imputation method for different number of neighbors (k=2, 5, 7, 10 and 15) to the two clinical datasets. In the next step, we create two survival curves, from the initial and imputed datasets, using Kaplan-Meier method and describe their results. We compare them graphically and using other benchmarks such as log-rank test. To evaluate the performance of the method, we also considered results of other applications in the literature. 6

7 Finally, we make recommendations for future possible applications and estimate the overall results of the study. 7

8 ΠΕΡΙΕΧΟΜΕΝΑ 1 Ανάλυση Επιβίωσης- Εισαγωγή Ορισμοί, ιστορικά στοιχεία, πλεονεκτήματα Χαρακτηριστικά των Δεδομένων Επιβίωσης Τύποι Λογοκρισίας Είδη Λογοκριμένων Δεδομένων Συνάρτηση Κατανομής Επιβίωσης Συνάρτηση Πυκνότητας για διακριτά Συνάρτηση Επιβίωσης Σχέσεις μεταξύ των Συναρτήσεων Επιβίωσης Συνάρτηση Κινδύνου Αθροιστική Συνάρτηση Κινδύνου Μέθοδος Kaplan-Meier Τεστ καταλληλότητας Log-rank test Παλινδρόμηση Αναλογικών Κινδύνων Cox Η αρχική Συνάρτηση Κινδύνου Εκτίμηση των παραμέτρων του μοντέλου Μεταβλητές εξαρτώμενες από το χρόνο Εκτιμώντας την Επιβίωση στο Μοντέλο Παλινδρόμησης Cox Παραμελημένες Μεταβλητές Συντελεστές Παλινδρόμησης Παραμετρικά Μοντέλα Κινδύνου (PH) Σημαντικά Χαρακτηριστικά Σύγκριση της επιβίωσης PH του Cox με την επιβίωση Kaplan-Meier

9 2 Περιγραφή Μεθόδων που έχουν συνδυαστεί με την Ανάλυση Επιβίωσης για την απόδοση τιμών σε ελλείποντα σύνολα δεδομένων Μέθοδος Πλησιέστερων Γειτόνων K-NN Μέθοδος INI Μέθοδος BPCA Μέθοδος PLS Εφαρμογές και Αποτελέσματα Εφαρμογές για το Συνδυασμό σε σύνολο δεδομένων Καρκινώματος Περιγραφή του Συνόλου Δεδομένων Καρκινώματος Απόδοση τιμών με τον K-NN Μεθοδολογία - Αποτελέσματα Εφαρμογή για το Συνδυασμό σε κλινικά σύνολα δεδομένων Καρκίνου του Λάρυγγα και Μυελού των Οστών Περιγραφή των Συνόλων Δεδομένων Περιγραφή του Συνόλου Δεδομένων Καρκίνου του Λάρυγγα Περιγραφή του Συνόλου Δεδομένων Μυελού των Οστών Μεθοδολογία - Αποτελέσματα Σύγκριση της Μεθόδου Κ-ΝΝ με τις υπόλοιπες για την απόδοση τιμών σε ελλείποντα σύνολα δεδομένων Μελλοντικές Εργασίες και Συμπεράσματα Βιβλιογραφία

10 ΚΕΦΑΛΑΙΟ 1 ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ - ΕΙΣΑΓΩΓΗ 1.1 Ορισμοί, Ιστορικά Στοιχεία, Πλεονεκτήματα Η ανάλυση επιβίωσης αποτελεί μια ισχυρή, αλλά εννοιολογικά απλή στατιστική μεθοδολογία που επιτρέπει τη δημιουργία εμπειρικών μοντέλων για ανάλυση δεδομένων, όπου η «σημαντική» μεταβλητή μπορεί να θεωρηθεί ως ο χρόνος μέχρι την εμφάνιση ενός γεγονότος, [9]. Το βασικό πλεονέκτημα της ανάλυσης επιβίωσης είναι ότι επιτρέπει την κατασκευή ενός πιθανοτικού μοντέλου για τη διάρκεια μιας παρατήρησης χρησιμοποιώντας υπάρχουσες πληροφορίες, όχι μόνο από ολοκληρωμένες αλλά και από παρατηρήσεις που βρίσκονται σε εξέλιξη. Η Ανάλυση Επιβίωσης είναι ουσιαστικά μια ταξινόμηση στατιστικών τεχνικών, η οποία χρησιμοποιείται ευρέως στις ιατρικές και βιολογικές εφαρμογές. Ο όρος «επιβίωση» προέρχεται από τη βιομηχανία της ασφάλειας, όπου αυτές οι μέθοδοι χρησιμοποιήθηκαν αρχικά για την κοστολόγηση ασφαλίστρων. Αυτός ο τύπος της ανάλυσης προσφέρει μεγάλη ευελιξία στη μοντελοποίηση της διάρκειας και στον υπολογισμό διάφορων στατιστικών, χρήσιμων για συμπεράσματα και εκτίμηση. Όπως και σε οποιαδήποτε άλλη στατιστική μεθοδολογία, η προσέγγιση χρησιμοποιεί σύνολα δεδομένων για την πραγματοποίηση μετρήσεων στις παρατηρήσεις, [5]. Ένας άλλος ορισμός που θεωρεί την ανάλυση επιβίωσης ως πρόβλημα στον τομέα των επιστημών ζωής, περιλαμβάνει τη μελέτη επιβίωσης μιας οντότητας ή μήκους χρόνου μιας διαδικασίας που προκαλείται από ένα συγκεκριμένο αρχικό γεγονός 10

11 και τερματίζεται από ένα ακόλουθο τερματικό γεγονός. Έχοντας κατά νου ότι η διάρκεια μιας παρατήρησης είναι στην ουσία μια μεταβλητή χρόνου, φαίνεται λογικό να θέσουμε την ανάλυση διαρκείας στο πλαίσιο επιβίωσης που έχει αναπτυχθεί και μελετηθεί εκτενώς στη στατιστική βιβλιογραφία. Υπό αυτό το πρίσμα, η διάρκεια ζωής ενός ατόμου μπορεί να θεωρηθεί αφηρημένα ως ο χρόνος ζωής μιας οντότητας από το αρχικό μέχρι το τερματικό γεγονός. Πρέπει να σημειωθεί ότι καθώς η ανάλυση επιβίωσης έχει εφαρμοστεί σε πολλές άλλες ερευνητικές περιοχές, όπως στη μηχανική και τα οικονομικά, ανάλογα με την ε- φαρμογή, έχουν χρησιμοποιηθεί και άλλοι όροι για το χρόνο επιβίωσης, όπως χρόνος αποτυχίας ή ιστορικό γεγονός. Ανάλογοι όροι χρησιμοποιούνται για τις διάφορες πιθανοτικές συναρτήσεις που σχετίζονται με τους χρόνους επιβίωσης. Οι στατιστικές μέθοδοι που θα περιγραφούν έχουν χρησιμοποιηθεί εδώ και πολύ καιρό στην ιατρική και μηχανική έρευνα για τη μελέτη του χρόνου επιβίωσης των ασθενών ή την αξιοπιστία των συσκευών. Κατά τις τελευταίες δεκαετίες, αυτές οι μέθοδοι έχουν γνωρίσει μεγάλη εξάπλωση σε διάφορες ερευνητικές περιοχές όπως το μάρκετινγκ, την εγκληματολογία, την επιδημιολογία, και ακόμα τις κοινωνικές και συμπεριφορικές επιστήμες. Η βασική έννοια του χρόνου επιβίωσης ορίζεται ως ο χρόνος μέχρι την εμφάνιση ενός προκαθορισμένου τερματικού γεγονότος. Αυτό το γεγονός έχει ζωτική σημασία ανάλογα με τον τομέα εφαρμογής (θάνατος, αποτυχία, απόκριση στη θεραπεία, κτλ.). Τα δεδομένα διάρκειας μπορούν ως εκ τούτου να συμπεριλαμβάνουν εκτός από τη διάρκεια και άλλες μεταβλητές που χαρακτηρίζουν τις παρατηρήσεις. Η μελέτη των δεδομένων διάρκειας εστιάζει στην εκτίμηση των πιθανοτήτων διάρκειας, στις συγκρίσεις μεταξύ κατανομών διαφορετικών έργων και στην αναγνώριση των προγνωστικών παραγόντων που σχετίζονται με τη διάρκεια, [13]. 11

12 Το τερματικό γεγονός έχει κρίσιμη σημασία στην ανάλυση και εξαρτάται από το περιεχόμενο της μελέτης (θάνατος, αποτυχία, απόκριση στη θεραπεία κτλ.). Σε πολλές περιπτώσεις, ιδιαίτερα σε ιατρικές εφαρμογές, χρησιμοποιείται ο όρος χρόνος διάρκειας ή απλά διάρκεια για να προσδιορίσει το χρόνο από το μήνα γέννησης έως το μήνα θανάτου, [14]. 1.2 Χαρακτηριστικά των Δεδομένων Επιβίωσης Τα δεδομένα επιβίωσης γενικά περιγράφονται και μοντελοποιούνται με όρους δυο σχετικών πιθανοτήτων, με όνομα επιβίωση και κίνδυνος. Η πιθανότητα επιβίωσης (η οποία ονομάζεται επίσης συνάρτηση επιβίωσης) S(t) είναι η πιθανότητα για μια παρατήρηση να επιβιώσει από τον αρχικό χρόνο (π.χ. ασθενής με διάγνωση καρκίνου) έως μια συγκεκριμένη χρονική στιγμή t. Αυτές οι τιμές περιγράφουν άμεσα την εμπειρία επιβίωσης σε μια ομάδα μελέτης, [1]. Όταν δεν χρησιμοποιούνται κατάλληλα, τα στατιστικά μοντέλα μπορεί να οδηγήσουν σε παραπλανητικά συμπεράσματα. Ο έλεγχος ότι ένα συγκεκριμένο μοντέλο είναι μια κατάλληλη αναπαράσταση για τα δεδομένα αποτελεί ως εκ τούτου σημαντικό βήμα. Δυστυχώς, αυτή η διαδικασία είναι πολύπλοκη, και έχει αποτελέσει το αντικείμενο αρκετών μελετών. Ανεξάρτητα από τον τύπο του μοντέλου που προσαρμόζεται και τον τρόπο που επιλέγονται οι μεταβλητές ώστε να βρίσκονται στο μοντέλο, είναι σημαντικό να εκτιμήσουμε πόσο καλά το μοντέλο αναπαριστά τα δεδομένα. Ένα μοντέλο επιβίωσης θεωρείται επαρκές εάν αναπαριστά τα πρότυπα επιβίωσης στα δεδομένα με ικανοποιητικό βαθμό. Αυτή η πτυχή του μοντέλου είναι γνωστή και ως καλής προσαρμογής. Πρακτικά, τα θέματα που αφορούν στην επιλογή του πιο κατάλληλου τύπου μοντέλου και 12

13 των πιο κατάλληλων μεταβλητών σχετίζονται σημαντικά, και η επάρκεια ενός μοντέλου μπορεί να αξιολογηθεί με διάφορους τρόπους. Η σωστή μοντελοποίηση των δεδομένων επιβίωσης δεν είναι μια απλή διαδικασία, και δεν είναι δυνατόν να προταθεί μια «έτοιμη» λύση πριν ξεκινήσει η διαδικασία επιλογής ποιων (εάν υπάρχουν) προτεινόμενων μοντέλων είναι πιο κατάλληλα για ένα σύνολο δεδομένων. Παρόλο που είναι δυνατόν να επιλεγεί ένα μοντέλο από τα προτεινόμενα που είναι βέλτιστα από καθαρά στατιστική άποψη (π.χ. μέτρα καταλληλότητας), μη-στατιστικές θεωρήσεις πρέπει να ληφθούν υπόψη επίσης. Η επιλογή του μοντέλου και των συντελεστών σ αυτό θα πρέπει, σε γενικές γραμμές να προταθούν από την εμπειρία και με βάση το συγκεκριμένο ζήτημα υπό-έρευνα. Ω- στόσο, οι βάσιμοι μη-στατιστικοί λόγοι που ενισχύουν την άποψη για επιλογή του μοντέλου δεν πρέπει να υπερισχύουν τους σημαντικούς στατιστικούς λόγους για μη επιλογή του μοντέλου, [3]. Παρόλο που ο μέσος όρος αποτελεί το πιο γνωστό μέτρο κεντρικής τάσης μιας κατανομής, στις κατανομές διάρκειας οι οποίες έχουν γενικά λοξή μορφή, η χρήση της διαμέσου προτιμάται καθώς ένας μικρός αριθμός έργων με εξαιρετικά μεγάλες ή μικρές διάρκειες μπορεί να επηρεάσει το μέσο χρόνο διάρκειας ώστε να είναι υπερβολικά μικρός ή μεγάλος. Εάν έχουν ολοκληρωθεί όλα τα έργα σε ένα σύνολο δεδομένων, τότε η διάμεση διάρκεια είναι μόνο η διάμεσος όλων των χρόνων διάρκειας. Ωστόσο, στην περίπτωση που είναι παρόντες και λογοκριμένοι χρόνοι, υπολογίζεται πρώτα η καμπύλη επιβίωσης Kaplan-Meier (περιγράφεται σε επόμενη ενότητα) και η διάμεσος υπολογίζεται ως η τιμή της M που ικανοποιεί την εξίσωση ( ) Η ερμηνεία είναι αρκετά απλή: είναι ο χρόνος που το 50% των έργων θα τερματιστούν ενώ το άλλο 50% θα είναι ενεργό πέρα από αυτό το χρόνο. Σημειωτέον ότι καθώς η μέθοδος Kaplan-Meier 13

14 υπολογίζει μια καμπύλη με τη διαδικασία stepwise «σταδιακή» (και όχι μια ομαλή), μπορούν να προκύψουν ορισμένα προβλήματα στον υπολογισμό του M. Αυτά επιλύονται με τεχνικές παρεμβολής. Τα περισσότερα στατιστικά προγράμματα υπολογίζουν το M αυτόματα μαζί με τα διαστήματα εμπιστοσύνης, [13]. Τα δεδομένα επιβίωσης είναι ένας όρος που χρησιμοποιείται για να περιγράψει κατά κύριο λόγο τα δεδομένα που αναπαριστούν το χρόνο μέχρι την εμφάνιση κάποιου γεγονότος. Ο χρόνος για ένα γεγονός θεωρείται ότι είναι μια θετική πραγματική εκτιμώμενη μεταβλητή που έχει συνεχή κατανομή. Είναι απαραίτητο να ορίσουμε ένα χρονικό σημείο, έστω, χρόνος 0, από το οποίο ξεκινά η μέτρηση. Στις περισσότερες περιπτώσεις, το καθορισμένο αρχικό χρονικό σημείο θα είναι ο χρόνος κάποιου γεγονότος. Όταν μετράμε το χρόνο ως ηλικία, το καθοριστικό χρονικό σημείο είναι η γέννηση. Ως χρόνος μετάβασης μπορεί να θεωρηθεί η μετάβαση από μια εμβρυακή σε μια κατάσταση ανθρώπινης ύπαρξης. Για τη μελέτη εμφάνισης περιπλοκών σε μια ασθένεια, η φυσική χρονική κλίμακα είναι η διάρκεια της ασθένειας, αλλά για πολλές α- σθένειες δεν παρατηρείται, καθώς ο ακριβής χρόνος εμφάνισης της ασθένειας είναι άγνωστος. Προκειμένου να χρησιμοποιήσουμε τις μεθόδους των δεδομένων επιβίωσης, η κατάστασή τους χρειάζεται να είναι γνωστή για όλους τους χρόνους, μέχρι τη λογοκρισία (τέλος της μελέτης). Τα δεδομένα επιβίωσης χρησιμοποιούν μόνο έναν ή λίγους τύπους καταστάσεων και γεγονότων. Από την άλλη μεριά, ο χρόνος μέχρι το γεγονός θεωρείται λεπτομερώς στην ανάλυση επιβίωσης ορισμένες φορές πολύ πιο συχνά. Ένα γεγονός ορίζεται ουσιαστικά ως η μετάβαση από μια κατάσταση (μεταξύ ενός συνόλου καταστάσεων) προς μια άλλη και η μεγαλύτερη έμφαση δίνεται στην εκλογή χρόνου αυτού του γεγονότος, [7]. 14

15 1.3 Τύποι Λογοκρισίας Οι περισσότεροι στατιστικολόγοι αναφέρουν την παρουσία των λογοκριμένων δεδομένων, ως το πιο ιδιαίτερο χαρακτηριστικό στην Ανάλυση Επιβίωσης, [7]. Το φαινόμενο αυτό εμφανίζεται όταν ορισμένες παρατηρήσεις στο σύνολο δεδομένων δεν έχουν «συναντήσει» το τερματικό γεγονός, δηλαδή δεν έχουν ολοκληρωθεί έως το τέλος της μελέτης ή έως τη στιγμή που διεξάγεται η ανάλυση. Αυτές οι περιπτώσεις σε ένα σύνολο δεδομένων ονομάζονται λογοκριμένοι χρόνοι. Επίσης λογοκρισία στα δεδομένα μπορεί να εμφανιστεί, όταν ορισμένες παρατηρήσεις αποχωρήσουν μετά από μια περίοδο μελέτης ( lost to follow-up ), δηλαδή ο ερευνητής χάσει κάθε επαφή μαζί τους και δεν γνωρίζει εάν έχουν ολοκληρωθεί ή όχι, [13]. Οι συγκεκριμένες δυσκολίες που αναφέρονται στην Ανάλυση Επιβίωσης προκύπτουν σε μεγάλο βαθμό από το γεγονός, ότι μόνο ορισμένα άτομα έχουν εμπειρευτεί το γεγονός και, ως επακόλουθο, οι χρόνοι επιβίωσης θα είναι άγνωστοι για υποσύνολο της ομάδας μελέτης. Το φαινόμενο της λογοκρισίας, για τις κλινικές περιπτώσεις των δεδομένων επιβίωσης που μελετάται και σε επόμενες ενότητες μπορεί να προκύψει με τους ακόλουθους τρόπους: (α) ο ασθενής δεν έχει (μέχρι στιγμής) βιώσει το σχετικό «αποτέλεσμα», όπως υποτροπή ή θάνατος, μέχρι το χρόνο ολοκλήρωσης της μελέτης. (β) ο ασθενής αποχώρησε ( lost to follow up ), κατά τη διάρκεια της περιόδου μελέτης. (γ) ο ασθενής δέχεται ένα διαφορετικό γεγονός που καθιστά την επιπλέον παρακολούθηση αδύνατη. Αυτοί οι λογοκριμένοι χρόνοι επιβίωσης υποεκτιμούν τον πραγματικό αλλά άγνωστο χρόνο έως το γεγονός. Απεικονίζοντας τη δια- 15

16 δικασία επιβίωσης ενός ατόμου με ένα χρονοδιάγραμμα, το γεγονός τους, ε- ντοπίζεται πέρα από το τέλος της περιόδου παρακολούθησης. Αυτή η κατάσταση συχνά ονομάζεται δεξιά λογοκρισία. Λογοκρισία μπορεί να συμβεί επίσης, όταν παρατηρείται η εμφάνιση μιας κατάστασης ή μιας συνθήκης αλλά δεν είναι γνωστό από πού ξεκίνησε. Για παράδειγμα, θεωρούμε μια μελέτη που διερευνά το χρόνο μέχρι την επανεμφάνιση του καρκίνου μετά τη χειρουργική αφαίρεση του πρωτοπαθούς όγκου. Εάν οι ασθενείς εξετάζονταν 3 μήνες μετά το χειρουργείο προκειμένου να ελεγχθεί επανεμφάνιση του φαινομένου, τότε σε εκείνους που θα παρουσιάζονταν θα είχαν χρόνο επιβίωσης αριστερά λογοκριμένο, διότι ο πραγματικός χρόνος επανεμφάνισης παρουσιάστηκε λιγότερο από 3 μήνες μετά την εγχείρηση. Ωστόσο, τα περισσότερα δεδομένα επιβίωσης περιλαμβάνουν δεξιά λογοκριμένες παρατηρήσεις. Λόγω της λογοκρισίας - μη-παρατήρηση του σημαντικού γεγονότος μετά από μια περίοδο παρακολούθησης ένα ποσοστό με σημαντικούς χρόνους επιβίωσης θα είναι συχνά άγνωστο. Σε αυτήν την περίπτωση, θεωρείται ότι εκείνοι οι ασθενείς που είναι λογοκριμένοι, έχουν τις ίδιες προοπτικές επιβίωσης με εκείνους που συνεχίζουν στην έρευνα, που σημαίνει ότι η λογοκρισία είναι μη-πληροφοριακή, [1]. Αντίθετα, η πληροφοριακή λογοκρισία συμβαίνει όταν τα άτομα αποχωρούν από την έρευνα ( lost to follow up ) για λόγους που σχετίζονται με το δικό τους (άγνωστο) «αποτέλεσμα». Δυστυχώς, είναι δύσκολο και να αναγνωρίσουμε πληροφοριακή λογοκρισία και να έχουμε πρόσβαση στην επίδρασή της. Είναι χρήσιμο ωστόσο να γνωρίσουμε τι ποσοστό λογοκριμένων παρατηρήσεων «χάθηκε κατά την παρακολούθηση» πριν από το τέλος της μελέτης (Clark et al, 2002), [4]. 16

17 Είδη Λογοκριμένων Δεδομένων Στη βιβλιογραφία, παρατηρούμε τρεις τύπους λογοκρισίας, το οποίο στην περίπτωση ενός συγκεκριμένου τύπου έργων είναι: Τύπος I λογοκρισίας. Αυτός εμφανίζεται σε μελέτες (π.χ. ελεγχόμενα πειράματα) που αρχίζουν με την ταυτόχρονη έναρξη ενός ορισμένου αριθμού έργων. Ορισμένες φορές, λόγω περιορισμών στο χρόνο και/ή κόστος, οι ερευνητές αποφασίζουν να παρατηρήσουν την ανάπτυξη των έργων για μια προκαθορισμένη περίοδο χρόνου, μετά την οποία τα ελλιπή έργα αναγκάζονται να τερματίσουν ή να εγκαταλειφθούν. Οι χρόνοι διάρκειας που καταγράφηκαν για τα έργα που τερμάτισαν κατά την περίοδο μελέτης είναι οι χρόνοι από την αρχή του πειράματος μέχρι τον τερματισμό τους. Οι χρόνοι διάρκειας των εγκαταλελειμμένων έργων θεωρούνται λογοκριμένοι και καταγράφονται ως τουλάχιστον το μήκος της περιόδου μελέτης. Επιπλέον, είναι πιθανό ορισμένες παρατηρήσεις να εγκαταλειφθούν ή να αποτύχουν και κατά την περίοδο μελέτης. Οι διάρκειές τους, από την αρχή της μελέτης έως την εγκατάλειψη, θεωρούνται επίσης λογοκριμένες. Τύπος II λογοκρισίας. Σύμφωνα με αυτό το σενάριο, οι ερευνητές περιμένουν ένα προκαθορισμένο ποσοστό έργων (για παράδειγμα 80 ή 90%) ώστε να ολοκληρωθεί κανονικά. Τότε, τα ελλιπή έργα εγκαταλείπονται και οι διάρκειές τους θεωρούνται λογοκριμένες και ισοδύναμες με τη μεγαλύτερη διάρκεια ολοκλήρωσης. Τύπος III ή τυχαία λογοκρισία. Αυτή είναι η πιο συχνή περίπτωση στην έρευνα των περιπτώσεων. Η περίοδος της μελέτης είναι προκαθορισμένη και τα έργα ξεκινούν σε διαφορετικούς χρόνους κατά τη διάρκεια αυτής της περιόδου. Για αυτά που ολοκληρώνονται πριν το τέλος της μελέτης οι 17

18 ακριβείς χρόνοι διάρκειάς τους είναι γνωστοί. Άλλα ίσως αποχωρήσουν από την έρευνα πριν την ολοκλήρωση ( lost to follow up ) και, πιο συχνά, άλλα ίσως βρίσκονται σε εξέλιξη στο τέλος της μελέτης. Ένα «χαμένο» έργο έχει λογοκριμένη διάρκεια τουλάχιστον το χρόνο από την έναρξη έως την τελευταία επαφή. Ένα ελλιπές έργο έχει επίσης λογοκριμένη διάρκεια τουλάχιστον από την έναρξη μέχρι το τέλος της μελέτης. Οι παραπάνω τύποι λογοκρισίας είναι τύποι δεξιάς λογοκρισίας. Ωστόσο, είναι δυνατόν να συναντήσουμε τύπους αριστερής λογοκρισίας και λογοκρισίας διαστήματος. Η αριστερή λογοκρισία μπορεί να συμβεί όταν είναι γνωστό ότι το έργο τερματίστηκε πριν από έναν ορισμένο χρόνο t, αλλά ο ακριβής χρόνος τερματισμού είναι άγνωστος. Η λογοκρισία διαστήματος μπορεί να συμβεί όταν ένα έργο γνωρίζεται ότι έχει τερματιστεί μεταξύ των χρόνων α και β, [13]. Ένα από τα πιο σημαντικά πλεονεκτήματα της ανάλυσης επιβίωσης είναι ότι δεν χρειάζεται να περιμένουμε μέχρις ότου όλες οι παρατηρήσεις που περιλαμβάνονται στη μελέτη να φθάσουν το «σημαντικό» γεγονός ώστε να υπολογιστεί η S(t). Αντ αυτού, απλά ορίζονται τα όρια της περιόδου παρατήρησής μας, και μετά αναθέτουμε μια λογική τιμή, που δείχνει για κάθε παρατήρηση, εάν ήταν «νεκρή» ή «ζωντανή» στο τέλος της μελέτης, [9]. 1.4 Συνάρτηση Κατανομής Επιβίωσης Προκειμένου να περιγράψουμε την κατανομή του χρόνου επιβίωσης για ένα πληθυσμό παρατηρήσεων, δηλώνουμε με T τη θετική τυχαία μεταβλητή που αναπαριστά το χρόνο ως το τερματικό γεγονός, για τον οποίο ενδιαφερόμαστε, έχοντας Πιθανοτική 18

19 Συνάρτηση Πυκνότητας f(t) και Αθροιστική Συνάρτηση Κατανομής F(t) = P(T t), [5] Συνάρτηση Πυκνότητας για διακριτά Η Πιθανοτική Συνάρτηση Πυκνότητας (PDF) είναι μια μη-αρνητική συνάρτηση που δηλώνεται με f(t) και είναι η πιο γνωστή συνάρτηση πιθανότητας για οποιαδήποτε τυχαία μεταβλητή. Ορίζεται ως το όριο της πιθανότητας για μια παρατήρηση να ολοκληρωθεί στο χρονικό διάστημα (t, t + Δt) ανά μονάδα πλάτους Δt. Ο μαθηματικός τύπος που ορίζει την PDF είναι: f(t) = ( ) (1.1) Η καμπύλη της f(t) ονομάζεται καμπύλη πυκνότητας και η περιοχή μεταξύ της καμπύλης και του t-άξονα είναι ίση με 1. Πρακτικά, εάν δεν υπάρχει κάποια παρατήρηση σε εξέλιξη (λογοκριμένη περίπτωση), η f(t) εκτιμάται ως η αναλογία των παρατηρήσεων που ολοκληρώνεται σε ένα διάστημα ανά μονάδα πλάτους: ( ) ( ) ( ) (1.2) Η καμπύλη πυκνότητας μπορεί να χρησιμοποιηθεί ώστε να υπολογιστεί η αναλογία των παρατηρήσεων για οποιοδήποτε χρονικό διάστημα, καθώς επίσης και να εντοπιστούν κορυφές ολοκληρωμένων παρατηρήσεων με υψηλή συχνότητα, [13]. 19

20 Συνάρτηση Επιβίωσης Η συνάρτηση επιβίωσης αναπαριστά την πιθανότητα ένα άτομο να επιζήσει από τον αρχικό χρόνο μέχρι κάποιο χρόνο πέρα από το t. Επίσης, περιγράφει με άμεσο τρόπο την επιβίωση για μια μελέτη και συνήθως εκτιμάται από τη μέθοδο Kaplan Meier, η οποία περιγράφεται αναλυτικά σε επόμενη υποενότητα, [1]. Η συνάρτηση επιβίωσης ορίζεται ως εξής: S(t) = P(T > t) = 1 F(t) (1.3) Είναι η πιθανότητα επιβίωσης για χρόνο μεγαλύτερο από t, π.χ. η πιθανότητα το τερματικό γεγονός να συμβεί μετά το χρόνο t. Η συνάρτηση S(t) είναι μια μη-αύξουσα συνάρτηση του χρόνου με ιδιότητες: S(t) = { } (1.4) Η καμπύλη της S(t) ονομάζεται και καμπύλη επιβίωσης. Ένα παράδειγμα καμπύλης επιβίωσης, φαίνεται στο επόμενο Σχήμα (1.1). 20

21 Σχήμα 1.1: Παράδειγμα καμπύλης επιβίωσης, το οποίο έχει δημιουργηθεί με το στατιστικό πρόγραμμα SPSS Γενικά, μια απότομη καμπύλη επιβίωσης αναπαριστά χαμηλό ρυθμό επιβίωσης ή σύντομο χρόνο επιβίωσης, ενώ μια βαθμιαία ή επίπεδη καμπύλη επιβίωσης είναι ένδειξη υψηλού ρυθμού ή μεγαλύτερου χρόνου επιβίωσης. Παρακάτω ορίζεται το μαθηματικό μοντέλο που χρησιμοποιείται για τον υπολογισμό της συνάρτησης επιβίωσης: Έστω ότι με r(t) συμβολίζεται ο αριθμός των περιπτώσεων που βρίσκονται σε κίνδυνο στο χρόνο t, δηλαδή, τα υποκείμενα που είναι ακόμα ζωντανά στο δείγμα πριν το χρόνο t. Εάν ορίσουμε ένα σύνολο χρονικών διαστημάτων I i = [t i, t i+1 ], που καλύπτουν το [0, ), τότε η πιθανότητα p i για την επιβίωσή τους στο διάστημα I i είναι: 21

22 p i = ( ) ( ) (1.5) όπου το d i είναι ο αριθμός των θανάτων που μετρούνται στο διάστημα I i. Ως εκ τούτου, η πιθανότητα επιβίωσης μέχρι το t i είναι: P(T > t i ) = S(t i ) ~ ~ ( ) ( ) (1.6) Σημειώνουμε ότι το κλάσμα στο τελευταίο μέρος θα είναι διάφορο της μονάδας για τα χρονικά διαστήματα που συμβαίνει ο θάνατος. Ορίζουμε την εκτίμηση Kaplan-Meier της καμπύλης επιβίωσης S(t), δηλωμένης ως (t), ως τη μέγιστη εκτίμηση πιθανότητας που ορίζεται ως: (t) = ( ) ( ) (1.7) Το πακέτο επιβίωσης στο στατιστικό λογισμικό R υπολογίζει αυτόματα την εκτίμηση του S(t) χρησιμοποιώντας τη μέθοδο Kaplan-Meier. Μπορεί επίσης, μέσω αυτής της μεθόδου να απεικονίσει αρκετές καμπύλες επιβίωσης που α- ντιστοιχούν σε διαφορετικά έργα στο ίδιο γραφικό, με σκοπό τη σύγκρισή τους, [5] Σχέσεις μεταξύ των Συναρτήσεων Επιβίωσης Σε πολλές εφαρμογές το σύνολο των δεδομένων αποτελείται από δείγμα, που ανήκει σε δύο ή περισσότερες ομάδες. Με άλλα λόγια, ο χρόνος επιβίωσης μπορεί να συνδυαστεί με μια κατηγορική μεταβλητή (παράγοντας) που να περιλαμβάνει δύο ή περισσότερα επίπεδα, χωρίζοντας το σύνολο σε ομάδες. 22

23 Σε μια τέτοια περίπτωση είναι χρήσιμο να δημιουργήσουμε μια καμπύλη επιβίωσης για κάθε περίπτωση και μετά να συγκρίνουμε τις καμπύλες είτε γραφικά, είτε μέσω ενός στατιστικού τεστ (όπως το log-rank τεστ) προκειμένου να ερευνήσουμε πως ο παράγοντας επηρεάζει το χρόνο επιβίωσης. Τα στατιστικά προγράμματα όπως το SPSS, προσφέρουν δύο είδη τεστ σύγκρισης, συνολική (ελέγχοντας τη συνολική επίδραση ενός παράγοντα) και σε ζευγάρι (ελέγχοντας κάθε ζευγάρι για διαφορές), [5]. Στην ενότητα 4 χρησιμοποιούμε τη συγκεκριμένη μέθοδο για σύγκριση των αποτελεσμάτων της εφαρμογής της μελέτης μας σε πραγματικά ιατρικά σύνολα δεδομένων. Συνοπτικά, η κατανομή των χρόνων διάρκειας μπορεί να περιγραφεί από τρεις συναρτήσεις: (1) την Πιθανοτική Συνάρτηση Πυκνότητας (PDF), (2) τη Συνάρτηση Επιβίωσης και (3) τη Συνάρτηση Κινδύνου Αυτές οι τρεις συναρτήσεις είναι μαθηματικά ισοδύναμες με την έννοια ότι εάν μια από αυτές είναι γνωστή, οι άλλες δύο μπορούν να προέλθουν από ένα μαθηματικό τύπο. Ωστόσο, η ερμηνεία τους είναι διαφορετική και μπορεί να χρησιμοποιηθεί με διαφορετικούς τρόπους για να περιγράψει τα δεδομένα. Ακόμα, αυτές οι συναρτήσεις εκτιμώνται από τα δεδομένα μέσω μεθόδων προσέγγισης, [13]. 1.5 Συνάρτηση Κινδύνου Ο κίνδυνος συνήθως δηλώνεται με h(t) ή λ(t) και είναι η πιθανότητα για ένα άτομο που βρίσκεται «υπό-παρατήρηση» για το χρονικό διάστημα Δt, να διαθέτει ένα γεγονός σε αυτό το χρόνο. 23

24 Σε αντίθεση με τη συνάρτηση επιβίωσης, η οποία εστιάζει στη μη διάθεση ενός γεγονότος, η συνάρτηση κινδύνου εστιάζει στην εμφάνιση του γεγονότος, [1]. Γι αυτό οι μεγάλες τιμές της S(t) αντιστοιχούν σε μικρές τιμές της h(t) και αντίστροφα, [14]. Συγκεκριμένα, εκφράζει την πιθανότητα για την ύπαρξη ενός γεγονότος σε μια στιγμή, δεδομένης της επιβίωσης μέχρι εκείνο το χρονικό διάστημα. Επιπλέον, η μελέτη της είναι ενδιαφέρουσα καθώς παρέχει στον ερευνητή πρόβλεψη για τους ρυθμούς συνθήκης αποτυχίας και αποτελεί διαγνωστικό εργαλείο για τη δημιουργία ενός μαθηματικού μοντέλου για ανάλυση επιβίωσης. Συνοπτικά, ο κίνδυνος σχετίζεται με το τρέχον ποσοστό εκδήλωσης του γεγονότος, ενώ η επιβίωση αντανακλά την αθροιστική μη-εμφάνιση, [1]. Ακόμα, η συνάρτηση κινδύνου αποτελεί έναν άλλον τρόπο για την περιγραφή της κατανομής T και ορίζεται ως: h(t) = ( ) (1.8) Ο αριθμητής αναπαριστά την πιθανότητα ένα άτομο να δεχτεί το τερματικό γεγονός στο επόμενο χρονικό διάστημα, έχοντας ήδη επιβιώσει από την αρχή του διαστήματος, [5]. Ένας εναλλακτικός ορισμός δίνεται από: h(t) = ( ) ( ) ( ) ( ) (1.9) Η καμπύλη του h(t) μπορεί να έχει οποιοδήποτε μέγεθος. Μπορεί να είναι αύξουσα, φθίνουσα, σταθερή ή ένδειξη μιας πιο πολύπλοκης διαδικασίας. Οι σχέσεις μεταξύ f(t), S(t) και h(t), που περιγράφηκαν και σε προηγούμενη ενότητα, είναι: f(t) = d/dt [1-S(t)] (1.10) 24

25 και h(t) = f(t)/s(t) = - d/dt [logs(t)] (1.11) Οι παραπάνω τρείς συναρτήσεις αποτελούν εναλλακτικούς τρόπους για την περιγραφή της κατανομής των χρόνων επιβίωσης. Ωστόσο, η καμπύλη της συνάρτησης επιβίωσης είναι πιο χρήσιμη για συγκρίσεις της προόδου επιβίωσης μεταξύ διαφορετικών ομάδων, ενώ η συνάρτηση κινδύνου παρέχει μια χρήσιμη γραφική περιγραφή του «κινδύνου», ή πιο γενικά, την «πιθανότητα» τερματισμού στο χρόνο t, [14] Αθροιστική Συνάρτηση Κινδύνου Ο αθροιστικός κίνδυνος H(t) χρησιμοποιείται συχνά σε μελέτες στην ανάλυση επιβίωσης. Ορίζεται ως η ενσωμάτωση του κινδύνου ή η περιοχή της συνάρτησης κινδύνου μεταξύ των χρόνων 0 και t, και διαφέρει από τη log-καμπύλη επιβίωσης μόνο στην ένδειξη. Έτσι, η H(t) = - log [S(t)]. Η H(t) χρησιμοποιείται ως ενδιάμεσο μέτρο για τον υπολογισμό του h(t) και ως διαγνωστικό εργαλείο έχει πρόσβαση στην εγκυρότητα του μοντέλου, [1]. Έστω ότι Τ μια μη-αρνητική τυχαία μεταβλητή που αναπαριστά το χρόνο επιβίωσης ενός ατόμου, και F(t) η Αθροιστική Συνάρτηση Κινδύνου (CDF) του Τ. Η συνάρτηση κινδύνου σχετίζεται με το F, εκτιμώμενη σε χρόνο t 0, και εκφράζεται ως η στιγμιαία πιθανότητα θανάτου το χρόνο t, δεδομένης της επιβίωσης του ατόμου μέχρι το χρόνο t, [6]. Η Αθροιστική Συνάρτηση Κινδύνου (CHF) ορίζεται ως H(t) = ( ) (1.12) 25

26 Οι τιμές της H(t) δεν αποτελούν πιθανότητες και η ερμηνεία της συνάρτησης δεν είναι εύκολη. Ωστόσο, είναι μια συνάρτηση που παίζει σημαντικό ρόλο στη θεωρία της ανάλυσης επιβίωσης καθώς χρησιμοποιείται για εκτίμηση των παραμέτρων κατανομής και για συγκρίσεις μεταξύ μη-παραμετρικών και παραμετρικών κατανομών μέσω των μοντέλων που συνδέουν το χρόνο διάρκειας t και τις τιμές της H(t), [14]. Οι τιμές της συνάρτησης υπολογίζονται εύκολα μέσω των εκτιμήσεων Kaplan-Meier του S(t), χρησιμοποιώντας τον τύπο της H(t) = -log[s(t)]. Στη μέθοδο Kaplan-Meier θεωρούμε ότι το δείγμα που συμμετέχει στη μελέτη είναι ανεξάρτητο, [5]. Ενσωματώνοντας την S(t)=1-F(t) στη συνάρτηση (1.12) βλέπουμε ότι: H(t) = -log (1- F(t)), ή ισοδύναμα F(t) = 1 e -H(t) (1.13) Συνεπώς, η F ορίζεται μοναδικά από τη συνάρτηση κινδύνου, και αντίστροφα. Εάν το F είναι κατάλληλο, δηλαδή η F(τ F )=1, τότε H(τ F )=, ή ισοδύναμα, ( ) (1.14) Με άλλα λόγια, η h(t) δεν περιλαμβάνεται στο διάστημα [0, τ F ), [6]. Αντίστροφα, στην περίπτωση που το h(t) περιλαμβάνεται στο διάστημα [0, τ F ), προκύπτει ένα ακατάλληλο F όπως για παράδειγμα στη συνθήκη ( ) (1.15) 26

27 1.6 Μέθοδος Kaplan-Meier Η πιο ευρέως χρησιμοποιούμενη μέθοδος για εκτίμηση της συνάρτησης επιβίωσης, παρουσία λογοκριμένων τιμών είναι γνωστή ως product-limit (P-L) ή Kaplan-Meier (K-M) μέθοδος (Kaplan and Meier 1958). Η ονομασία product limit προέρχεται από το όριο, όταν δηλαδή ο χρόνος χωρίζεται σε διαστήματα, και το μήκος διαστήματος τείνει στο 0. Ο βασικός σκοπός της διαδικασίας είναι η εκτίμηση μιας συνάρτησης επιβίωσης με μη-παραμετρικό τρόπο. Η πιθανότητα επιβίωσης μπορεί να εκτιμηθεί μη-παραμετρικά από προηγούμενους χρόνους επιβίωσης, λογοκριμένους και μη-λογοκριμένους. Έστω ότι για k παρατηρήσεις παρατηρούνται γεγονότα την αντίστοιχη περίοδο με διακριτούς χρόνους t 1 < t 2 < t 3 < t 4 < t 5 < < t k. Καθώς τα γεγονότα θεωρείται ότι συμβαίνουν ανεξάρτητα το ένα από το άλλο, οι πιθανότητες επιβίωσης από το ένα διάστημα μέχρι το επόμενο πολλαπλασιάζονται μαζί ώστε να δώσουν την αθροιστική πιθανότητα επιβίωσης. Πιο συγκεκριμένα, η πιθανότητα επιβίωσης το χρόνο t j, S(t j ), υπολογίζεται από το S(t j-1 ), δηλαδή την πιθανότητα επιβίωσης στο t j-1, όπου n j ο αριθμός των παρατηρήσεων που ήταν «ζωντανές» μόλις πριν το t j, και όπου d j ο αριθμός των γεγονότων στο t j, με S(t j ) = S(t j-1 ) (1 - ), (1.16) όπου t 0 = 0 και S(0) = 1. Τα διαστήματα εμπιστοσύνης για την πιθανότητα επιβίωσης μπορούν επίσης να υπολογιστούν. 27

28 Η καμπύλη επιβίωσης Kaplan Meier, το διάγραμμα της πιθανότητας επιβίωσης της Kaplan-Meier στο χρόνο, παρέχει χρήσιμη σύνοψη των δεδομένων που μπορούν να χρησιμοποιηθούν για να υπολογιστούν μέτρα όπως ο χρόνος επιβίωσης της διαμέσου. Η μεγάλη λοξή γραμμή που εμφανίζεται στην κατανομή των περισσοτέρων δεδομένων επιβίωσης είναι ο λόγος που ο μέσος όρος δεν χρησιμοποιείται συχνά, [1]. Επιπλέον, στις περιπτώσεις που μια γνωστή θεωρητική κατανομή (όπως η lognormal) έχει τη δυνατότητα να «προσαρμοστεί» στα δεδομένα, η μη-παραμετρική μέθοδος Kaplan-Meier αποτελεί έναν αποδοτικό τρόπο για την αξιολόγηση της ποιότητας προσαρμογής της, [13]. Ο υπολογισμός της συγκεκριμένης μεθόδου απαιτεί ως προαπαιτούμενο τη γνώση των χρόνων επιβίωσης έως το τερματικό γεγονός για όλα τα δείγματα της μελέτης. Εάν δηλώσουμε τους διαδοχικούς χρόνους εμφάνισης των γεγονότων με t 1, t 2,, σε κάθε χρονική στιγμή t i, χρειάζεται να υπολογίσουμε τον αριθμό των τερματικών γεγονότων d i και τον αριθμό των λογοκριμένων παρατηρήσεων c i. Ο αριθμός των παρατηρήσεων που βρίσκονται «σε κίνδυνο» (π.χ. οι παρατηρήσεις που αναμένεται να τερματιστούν) είναι n i, όπου: n i < n i-1 d i-1 c i-1. (1.17) Η πιθανότητα επιβίωσης υπό-συνθήκη εκτιμάται με: P(T > t 1 T > t i-1 ) = (n i -d i )/n i = 1 - d i /n i (1.18) Η πιθανότητα επιβίωσης χωρίς συνθήκη είναι η συνάρτηση επιβίωσης και δίνεται α- πό: 28

29 S(t i ) = P(T > t i )=P(t > t i T > t i-1 ) P(T > t i-1 ) = (1 n i /d i ) S(t i-1 ) (1.19) Δηλώνοντας με t 0 το αρχικό σημείο της μελέτης, προκύπτει ότι P(T > t 0 )=1 και ως εκ τούτου προκύπτουν και τα τελευταία αποτελέσματα στη σχέση εκτίμησης της καμπύλης επιβίωσης (1.16), [5]. Υπάρχουν συγκεκριμένοι περιορισμοί για την εφαρμογή της μεθόδου Kaplan-Meier στα δεδομένα. Πρώτα απ όλα, θεωρείται ότι οι παρατηρήσεις που συμμετέχουν στη μελέτη είναι ανεξάρτητες μεταξύ τους, με την έννοια ότι η διάρκεια οποιασδήποτε παρατήρησης δεν εξαρτάται από καμία άλλη. Δεύτερον, οι λογοκριμένοι χρόνοι πρέπει να είναι ανεξάρτητοι από τους χρόνους επιβίωσης. Ωστόσο, η παραδοχή παραβιάζεται εάν η παρατήρηση αναγκαστεί να τερματίσει απρόοπτα, εξαιτίας σοβαρών προβλημάτων στη διαδικασία ανάπτυξης. Σε περιπτώσεις όπου συμβαίνει τέτοιου είδους λογοκρισία, η μέθοδος δεν είναι κατάλληλη για εφαρμογή. Ένας τελευταίος σημαντικός περιορισμός είναι ότι δεν υπάρχουν αλλαγές στη διάρκεια του χρόνου, στις συνθήκες της μελέτης ή στους τύπους των δεδομένων που συμμετείχαν στη μελέτη, [13]. 1.7 Τεστ καταλληλότητας Log-rank τεστ Το τεστ logrank (Peto et al, 1977) αποτελεί την πιο ευρέως χρησιμοποιούμενη μέθοδο σύγκρισης δύο ή περισσοτέρων καμπυλών επιβίωσης. Για παράδειγμα, η επιβίωση 29

30 δύο ή περισσοτέρων ομάδων ασθενών μπορεί να συγκριθεί χρησιμοποιώντας αυτό το μη-παραμετρικό τεστ. Οι ομάδες μπορεί να είναι είτε προγνωστικές είτε σκέλη θεραπείας (treatment arms). Το logrank τεστ συγκρίνει τον παρατηρούμενο αριθμό γεγονότων, έστω O i για την ομάδα θεραπείας i, με τον αναμενόμενο αριθμό τους, E i, υπολογίζοντας το στατιστικό τεστ: = ( ) (1.20) Αυτή η τιμή συγκρίνεται με την κατανομή με (g-1) βαθμούς ελευθερίας, όπου το g είναι ο αριθμός των ομάδων. Με αυτό τον τρόπο, υπολογίζεται μια P-τιμή, η οποία βοηθάει για την εκτίμηση της στατιστικής σημασίας των διαφορών μεταξύ των συνολικών καμπυλών επιβίωσης. Εάν οι ομάδες διατάσσονται φυσικά, για παράδειγμα κατά ηλικία ή κατά το στάδιο που έχει προχωρήσει η ασθένεια, ένα καταλληλότερο τεστ θα ήταν να θεωρήσουμε την πιθανότητα ύπαρξης μιας τάσης σε όλη την διάρκεια επιβίωσής τους. Υπολογίζοντας το O i και το E i για κάθε ομάδα, και θεωρώντας ότι η επιβίωση μπορεί να αυξηθεί ή να μειωθεί μεταξύ των ομάδων καταλήγουμε σε ένα πιο δυναμικό τεστ. Για τα νέα O i και Ε i, το τεστ στατιστικής για την τάση συγκρίνεται με την κατανομή με ένα βαθμό ελευθερίας (Collett, 1994). Μόνο στην περίπτωση που δύο ομάδες συγκρίνονται, τότε το logrank τεστ ε- λέγχει την υπόθεση null, δηλαδή εάν η αναλογία των ρυθμών κινδύνου για τις δύο ομάδες είναι ίση με 1. Η αναλογία κινδύνου (HR) αποτελεί μέτρο της σχετικής εμπειρίας επιβίωσης για τις δύο ομάδες και μπορεί να εκτιμηθεί μέσω του: 30

31 HR =, (1.21) όπου O i /E i είναι ο εκτιμώμενος σχετικός κίνδυνος για την ομάδα i. Ένα διάστημα εμπιστοσύνης (CI) για το HR μπορεί επίσης να υπολογιστεί (Collett, 1994). Ένα HR που ισούται με 1 δεν δείχνει καμία διαφορά στην επιβίωση. Πρακτικά, είναι προτιμότερο να εκτιμηθεί η HR χρησιμοποιώντας τεχνικές μοντελοποίησης παλινδρόμησης, όπως παλινδρόμηση Cox. Επίσης, μπορούν να χρησιμοποιηθούν και άλλα μη-παραμετρικά τεστ που θα συγκρίνουν τις ομάδες με όρους επιβίωσης (Collett, 1994). Όμως το logrank τεστ χρησιμοποιείται τόσο ευρέως, ώστε η χρήση οποιασδήποτε άλλης μεθόδου να καθίσταται σχεδόν απαραίτητο να δηλωθεί στο πρωτόκολλο της μελέτης. Οι εναλλακτικές μέθοδοι περιλαμβάνουν σύγκριση των χρόνων επιβίωσης της διαμέσου, ωστόσο η σύγκριση των διαστημάτων εμπιστοσύνης δεν συστήνεται για την κάθε ομάδα, [19]. Όπως αναφέρθηκε και προηγουμένως, η μέθοδος logrank θεωρείται πιο δυναμική, [20] συγκριτικά με τις υπόλοιπες, αλλά η έλλειψη ενός συνοδευτικού μέτρου επίδρασης για την απόκτηση της P-τιμής λειτουργεί περιοριστικά, [1]. 1.8 Παλινδρόμηση Αναλογικών Κινδύνων Cox Το μοντέλο Cox (αναλογικοί κίνδυνοι ή PH), (Cox, 1972) αποτελεί την πιο συνηθισμένη προσέγγιση που χρησιμοποιείται για ανάλυση χρονικών δεδομένων επιβίωσης σε ιατρική έρευνα. 31

32 Αποτελεί ένα μοντέλο παλινδρομικής ανάλυσης επιβίωσης, το οποίο περιγράφει τη σχέση μεταξύ της συχνότητας εκδήλωσης, όπως εκφράζεται από τη συνάρτηση κινδύνου και μια σειρά μεταβλητών. Μαθηματικά, το μοντέλο Cox ορίζεται ως: h(t) = h 0 (t) X exp {b 1 x 1 + b 2 x b p x p } (1.22) όπου η συνάρτηση κινδύνου h(t) εξαρτάται (ή ορίζεται) από μια σειρά μεταβλητών p (x 1, x 2,, x p ), των οποίων η επίδραση μετριέται με βάση το μέγεθος των αντίστοιχων συντελεστών (b 1, b 2,, b p ). Ο όρος h 0 ονομάζεται αρχικός κίνδυνος, και αποτελεί την τιμή του κινδύνου, εάν όλα τα x i ισοδυναμούν με το 0 (η ποσότητα exp(0) ι- σοδυναμεί με 1). Το «t» στο h(t) δηλώνει ότι ο κίνδυνος μπορεί να μεταβάλλεται (και πιθανώς να μεταβάλλεται) στην πάροδο του χρόνου, [2]. Όταν τα δεδομένα περιέχουν έναν μεγάλο αριθμό χαρακτηριστικών έργου, συχνά είναι δύσκολο να αναγνωρίσουμε ποια σχετίζονται πιο στενά με την πρόγνωση. Αυτές οι μεταβλητές συνήθως αλληλεπιδρούν με πολύπλοκους τρόπους και οι ξεχωριστές τους επιδράσεις συνδέονται με απρόβλεπτους τρόπους. Γι αυτό το λόγο, προτιμάται να μελετήσουμε τη συνδυασμένη επίδραση όλων των μεταβλητών στη διάρκεια μοντελοποιώντας αυτή τη σχέση. Υπάρχουν διάφορα παραμετρικά μοντέλα για τη μοντελοποίηση της σχέσης διάρκειας με άλλες μεταβλητές αλλά απαιτούν τη γνώση μιας θεωρητικής κατανομής. Αυτή η γνώση συχνά δεν είναι διαθέσιμη, γι αυτό η συνήθης πρακτική είναι να χρησιμοποιείται μια τάξη συγκριτικών, ημι-παραμετρικών μοντέλων για δεδομένα διαρκείας. Η πιο γνωστή μεθοδολογία είναι η ανάλυση παλινδρόμησης Cox, [14]. Ένα σημαντικό χαρακτηριστικό του μοντέλου Cox είναι ότι η συνάρτηση του αρχικού κινδύνου εκτιμάται μη-παραμετρικά, και συνεπώς σε αντίθεση με τα περισ- 32

33 σότερα άλλα στατιστικά μοντέλα, οι χρόνοι επιβίωσης δεν θεωρείται ότι ακολουθούν μια συγκεκριμένη στατιστική κατανομή. Ο κίνδυνος για το γεγονός σε οποιαδήποτε ομάδα είναι μια σταθερά πολλαπλάσια του κινδύνου. Αυτή η παραδοχή οδηγεί στο συμπέρασμα ότι οι καμπύλες κινδύνου για τις διάφορες ομάδες πρέπει να είναι αναλογικές και άρα δεν μπορούν να διασταυρωθούν μεταξύ τους. Η αναλογικότητα συνεπάγεται ότι οι ποσότητες exp(b i ) ονομάζονται λόγοι κινδύνου. Μια τιμή του b i μεγαλύτερη από το 0, ή ισοδύναμα ένας λόγος κινδύνου μεγαλύτερος από 1, δείχνει ότι όσο η τιμή της i-οστής μεταβλητής αυξάνει, ο κίνδυνος του γεγονότος αυξάνει και συνεπώς το μήκος της επιβίωσης μειώνεται. Με άλλα λόγια, ένας λόγος κινδύνου μεγαλύτερος από 1 δείχνει μια μεταβλητή που σχετίζεται θετικά με την πιθανότητα γεγονότος, και συνεπώς σχετίζεται αρνητικά με το μήκος της επιβίωσης. Αυτή η παραδοχή αναλογικότητας είναι συχνά κατάλληλη για τα χρονικά δεδομένα επιβίωσης, αλλά είναι σημαντικό να επιβεβαιώσουμε ότι διατηρείται, [2]. Το μοντέλο παλινδρόμησης Cox έχει γίνει δημοφιλές καθώς βοηθάει ιδιαίτερα στην περιγραφή των σχετικών κινδύνων. Αυτό σημαίνει, ότι αφαιρεί αποτελεσματικά την επίδραση του χρόνου. Ωστόσο, διαθέτει και ένα μεγάλο μειονέκτημα, καθώς προτείνει να λαμβάνεται υπόψη μόνο ο σχετικός κίνδυνος ακόμα και σε περιπτώσεις ό- που θα ήταν χρήσιμο να εκτιμηθεί μόνο ο απόλυτος κίνδυνος, [7]. 33

34 Η αρχική Συνάρτηση Κινδύνου Πρώτα απ όλα, χρειάζεται να τονίσουμε τη σημασία της συνάρτησης κινδύνου h(t). Η Συνάρτηση Κινδύνου εξ ορισμού είναι μια έκφραση αθροιστικής γνώσης στο χρόνο, γενικά γνωστή ως «γήρανση». Καθώς η Συνάρτηση Κινδύνου εφαρμόζεται μόνο σε έργα που έχουν μείνει ενεργά μέχρι ένα συγκεκριμένο χρονικό διάστημα, συνεπώς ευθύνεται και για τη «γήρανση» που έχει λάβει χώρα στο σύνολο δεδομένων. Το ενδιαφέρον σημείο εδώ είναι ότι όταν τα έργα παρατηρούνται στη διάρκεια του χρόνου, ουσιαστικά εντοπίζεται μια διαδικασία γήρανσης. Ως εκ τούτου είναι λογικό να χρησιμοποιήσουμε τη Συνάρτηση Κινδύνου για τη μοντελοποίηση της διαδικασίας γήρανσης σε ένα σύνολο δεδομένων. Ας υποθέσουμε ότι η Συνάρτηση Κινδύνου είναι μια συνάρτηση που εξαρτάται από ένα σύνολο δεδομένων πρόβλεψης x 1 = (x 11,, x 1p ) και δεικτών πρόβλεψης x 2 = (x 21,, x 2p ) και (έστω) ότι τα x 2 = (x 21,, x 2p ) έχουν ανάλογες συναρτήσεις κινδύνου (HFs), δηλαδή η αναλογία κινδύνου (HR) HR(t;x 1,x 2 ) = ( ) ( ) (1.23) είναι μια σταθερά, με την έννοια ότι δεν μεταβάλλεται στο χρόνο. Το νόημα μιας τέτοιας υπόθεσης είναι ότι ο λόγος του υπό όρων ρυθμού ολοκλήρωσης των δύο έργων είναι ο ίδιος ανεξάρτητα από το πόσο είναι η διαφάνειά τους. Η σταθερά HR οδηγεί σε ένα μοντέλο όπου η συνάρτηση κινδύνου δεδομένου του συνόλου των προγνωστικών δεικτών για ένα έργο εκφράζεται ως προϊόν δύο συναρτήσεων: h(t;x) = h 0 (t)g(x) (1.24) Η συνάρτηση h 0 (t) χαρακτηρίζει πως η Συνάρτηση Κινδύνου μεταβάλλεται ως συνάρτηση μόνο της διάρκειας. Η h 0 (t) ονομάζεται αρχική τιμή της Συνάρτησης Κινδύ- 34

35 νου και αναπαριστά τη Συνάρτηση Κινδύνου όταν το g(x) = 1. Προκειμένου να ερευνήσουμε τη h 0 (t) ως Συνάρτηση Κινδύνου όταν αφαιρούμε την επίδραση όλων των προγνωστικών δεικτών, μια συνήθη επιλογή του g(x) απαιτεί ότι το g(0) = 1, [14] Εκτίμηση των παραμέτρων του μοντέλου Οι παράμετροι παλινδρόμησης b 1,, b p υπολογίζονται με τη βελτιστοποίηση μιας μερικής συνάρτησης πιθανοφάνειας. Αυτός ο τύπος διαδικασίας εκτίμησης εφαρμόζεται σε όλα τα μεγάλα πακέτα στατιστικού λογισμικού. Το μοντέλο περιλαμβάνει μοναδικές διαδικασίες επιλογής υποσυνόλου των χαρακτηριστικών για την εξάλειψη άσχετων μεταβλητών και την πρόληψη του μοντέλου, [8] Μεταβλητές εξαρτώμενες από το χρόνο Ιδιαίτερη προσοχή πρέπει να δοθεί στη βασική παραδοχή του μοντέλου Cox, ότι ο λόγος h(t;x)/h 0 (t) δεν αποτελεί συνάρτηση του χρόνου. Η εγκυρότητα μιας τέτοιας παραδοχής ελέγχεται από στατιστικά τεστ. Ωστόσο, εάν η παραδοχή παραβιαστεί, μια συμπληρωματική εκδοχή του μοντέλου παλινδρόμησης Cox, που ωστόσο δεν περιγράφεται στη μελέτη μας, μπορεί να χρησιμοποιηθεί ώστε να συμπεριλάβει προγνωστικούς δείκτες εξαρτώμενους από το χρόνο. Τα διαθέσιμα στατιστικά πακέτα (όπως το SPSS και S-plus) παρέχουν διαδικασίες με ευρεία ποικιλία επιλογών προκειμένου να δημιουργήσουν και να επικυρώσουν ένα αποδοτικό μοντέλο, [14]. 35

36 Εκτιμώντας την Επιβίωση στο Μοντέλο Παλινδρόμησης Cox Μια ενδιαφέρουσα πτυχή του μοντέλου παλινδρόμησης Cox είναι ότι μπορεί να αναπαρασταθεί με όρους είτε της Συνάρτησης Κινδύνου είτε της Συνάρτησης Επιβίωσης. Αποδεικνύεται ότι το ισοδύναμο μοντέλο διάρκειας γράφεται ως εξής: S(t;x) = [S 0 (t)] g(x), (1.25) όπου S 0 (t) είναι η αρχική συνάρτηση Επιβίωσης και g(x) = exp ( ). Θα πρέπει να τονιστεί ότι η παλινδρόμηση Cox δεν δημιουργεί εκτιμήσεις σημείων (μεμονωμένες τιμές) της διάρκειας ενός έργου. Η πρόγνωσή της είναι μια συνολική κατανομή των τιμών της επιβίωσης με εκχωρημένες πιθανότητες. Γι αυτό για οποιαδήποτε τιμή των δεικτών πρόβλεψης μπορούμε να πάρουμε γραφικές αναπαραστάσεις της Συνάρτησης Επιβίωσης, [14] Παραμελημένες μεταβλητές Δεν είναι δυνατό στην πράξη να συμπεριλάβουμε όλες τις σχετικές μεταβλητές. Για παράδειγμα, μπορεί να γνωρίζουμε ότι κάποιος δεδομένος παράγοντας είναι σημαντικός, αλλά εάν δεν γνωρίζουμε την τιμή του παράγοντα για κάθε άτομο, δεν μπορούμε να συμπεριλάβουμε τη μεταβλητή στην ανάλυση. Επιπλέον, υπάρχει πιθανότητα να μη γνωρίζουμε ότι υπάρχουν μεταβλητές που χρειάζεται να συμπεριληφθούν. Αυτή η παραδοχή αναφέρει ότι όταν κάποιος παράγοντας είναι σημαντικός, είναι αναγκαίο να αποκτήσουμε τις τιμές του, αλλά εάν αυτό δεν είναι δυνατό, συνηθίζεται να α- γνοείται η παρουσία αυτών των μεταβλητών, [7]. Μια λύση που προτείνεται στο πρόβλημα εύρεσης των σημαντικότερων μεταβλητών είναι η εκτέλεση αλγορίθμων (π.χ. σταδιακής παλινδρόμησης Cox) που είναι ικανοί να κατασκευάζουν μοντέλα που περιλαμβάνουν τις πιο σημαντικές μεταβλη- 36

37 τές. Αυτό είναι πολύ χρήσιμο για τις περιπτώσεις που οι προγνωστικοί δείκτες συσχετίζονται, [14] Συντελεστές παλινδρόμησης Στις περισσότερες περιπτώσεις, ένας μεγάλος αριθμός σημαντικών επεξηγηματικών μεταβλητών, ή παραγόντων κινδύνου, είναι γνωστός. Μπορεί να είναι βασικές μεταβλητές, όπως η ηλικία και το φύλλο, μπορεί ακόμα να είναι συγκεκριμένες μεταβλητές, όπως η θεραπεία και η δοκιμή φαρμάκων, όταν εξετάζονται κλινικά δεδομένα επιβίωσης, ή μπορεί να είναι και «ενοχλητικές» μεταβλητές, που είναι χρήσιμο να συμπεριληφθούν προκειμένου να περιγράψουν τον κίνδυνο των γεγονότων, όσο πιο ακριβέστερα γίνεται, αλλά για των οποίων την επίδραση δεν ενδιαφερόμαστε. Σε ό- λες τις περιπτώσεις, θα χρησιμοποιούνται όροι όπως μεταβλητές ή επεξηγηματικές μεταβλητές. Αυτές οι επεξηγηματικές μεταβλητές μπορεί να είναι σταθερές, ή να αλλάζουν στο χρόνο (χρονο-εξαρτώμενες μεταβλητές). Σε κάθε περίπτωση, ο σχετικός κίνδυνος περιγράφεται παραμετρικά, και η συνάρτηση κινδύνου μη-παραμετρικά και ως εκ τούτου το μοντέλο ονομάζεται ημι-παραμετρικό, [7]. 1.9 Παραμετρικά Μοντέλα Κινδύνου (Parametric Hazard) Σημαντικά χαρακτηριστικά Τα παραμετρικά μοντέλα κινδύνου PH (Parametric Hazard) είναι μια κατηγορία μοντέλων παρόμοια σε σύλληψη και ερμηνεία με το μοντέλο Cox (PH). Η βασική διαφορά μεταξύ των δύο είναι ότι ο κίνδυνος θεωρείται ότι ακολουθεί μια συγκεκριμένη στατιστική κατανομή όταν ένα πλήρες παραμετρικό μοντέλο PH προσαρμόζεται στα δεδομένα, ενώ το μοντέλο Cox δεν βάζει κάποιο περιορισμό. 37

38 Εκτός από αυτή τη διαφορά, τα δύο μοντέλα είναι ισοδύναμα. Οι αναλογίες κινδύνου έχουν την ίδια ερμηνεία, είτε προέρχονται από το Cox είτε από ένα πλήρες παραμετρικό μοντέλο παλινδρόμησης, και η αναλογικότητα των κινδύνων θεωρείται δεδομένη. Επιπλέον, δημιουργούνται διαφορετικά παραμετρικά μοντέλα PH όταν επιλέγονται διαφορετικές συναρτήσεις κινδύνου, [2]. Η παραδοχή για τα μοντέλα PH, που είναι ότι οι κίνδυνοι είναι ανάλογοι (και όχι επικαλυπτόμενοι) σε όλα τα σημεία στο χρόνο, θα πρέπει να επαληθεύεται. Στην περίπτωση που ένα μοντέλο PH είναι έγκυρο, τότε ένα διάγραμμα της συνάρτησης του λογαρίθμου αθροιστικού κινδύνου για κάθε ομάδα ενάντια στο λογάριθμο του χρόνου θα πρέπει να αναπαριστά γραμμές που είναι παράλληλες μεταξύ τους. Το διάγραμμα που περιγράφεται είναι επίσης γνωστό ως διάγραμμα log(- log(επιβίωσης)), καθώς ο αθροιστικός κίνδυνος είναι ισοδύναμος με τον αρνητικό λογάριθμο της αναλογίας επιβίωσης. Αυτή η προσέγγιση απαιτεί υποκειμενική αξιολόγηση. Δυστυχώς, οι συγκλίνουσες ή αποκλίνουσες γραμμές μπορεί να οφείλονται είτε σε έλλειψη αναλογικότητας ή σε παράλειψη μιας σημαντικής μεταβλητής. Από την άλλη μεριά, οι παράλληλες γραμμές μπορεί να σημαίνουν ότι τα μοντέλα PH είναι κατάλληλα, [3] Σύγκριση της επιβίωσης PH του Cox με την επιβίωση Kaplan-Meier Το βασικό μειονέκτημα που παρουσιάζουν τα παραμετρικά μοντέλα είναι η δυσκολία εύρεσης μιας κατανομής που αντικατοπτρίζει καλύτερα αυτή των πραγματικών χρόνων επιβίωσης. Αυτή αποτελεί μια σημαντική προϋπόθεση που χρειάζεται να ελεγχθεί. 38

39 Ωστόσο, όταν βρεθεί μια κατάλληλη κατανομή, το παραμετρικό μοντέλο δίνει περισσότερες πληροφορίες από το μοντέλο Cox. Σε τέτοιες περιπτώσεις είναι εύκολη η κατασκευή της συνάρτησης κινδύνου και η απόκτηση προβλεπόμενων χρόνων επιβίωσης. Επιπλέον, η κατάλληλη χρήση τέτοιων μοντέλων προσφέρει το πλεονέκτημα μεγαλύτερης αποδοτικότητας και περισσότερο ακριβέστερων εκτιμήσεων (π.χ. μικρότερα τυπικά σφάλματα). Τα αποτελέσματα από τα μοντέλα Cox ή τα παραμετρικά PH μπορούν να συγκριθούν άμεσα, καθώς οι τύποι των μοντέλων είναι απλώς διαφορετικές προσεγγίσεις για την εκτίμηση της ίδιας ποσότητας. Οι προϋποθέσεις ώστε μια μέθοδος να είναι έγκυρη είναι: (α) το αποτέλεσμα της μεταβλητής να είναι σταθερό (κατά κύριο λόγο) καθ όλη τη διάρκεια της μελέτης και (β) να διατηρηθεί η παραδοχή της αναλογικότητας, [2]. Ένας απλός έλεγχος για την επάρκεια του μοντέλου είναι η σύγκριση της συνολικής καμπύλης επιβίωσης (Kaplan-Meier) με την προβλεπόμενη επιβίωση που βασίζεται στο μοντέλο. Για οποιαδήποτε ομάδα παρατηρήσεων, τα δύο πρέπει να βρίσκονται κοντά, εάν όχι να είναι ταυτόσημα. 39

40 ΚΕΦΑΛΑΙΟ 2 Περιγραφή Μεθόδων που έχουν συνδυαστεί με την Ανάλυση Επιβίωσης για την απόδοση τιμών σε ελλείποντα σύνολα δεδομένων 2.1 Μέθοδος Πλησιέστερων Γειτόνων K-NN Ο αλγόριθμος K-Πλησιέστερων Γειτόνων (K-NN) είναι ο πιο απλός μεταξύ όλων των άλλων στη μηχανική μάθηση. Επιλύει προβλήματα ταξινόμησης και παλινδρόμησης χωρίς να δημιουργεί σαφώς ένα μοντέλο. Αντ αυτού, όταν χρειάζεται να γίνει πρόβλεψη για μια συγκεκριμένη παρατήρηση, ο αλγόριθμος επιλέγει ένα σύνολο k παρόμοιων παραδειγμάτων από τα δεδομένα, με βάση τη μικρότερη απόστασή τους από αυτή και επιστρέφει το μέσο όρο τους (παλινδρόμηση) ή την κυρίαρχη απόκριση (ταξινόμηση). Η πιο συνήθης μετρική απόστασης που χρησιμοποιείται για την εφαρμογή της μεθόδου είναι η Ευκλείδεια απόσταση και ορίζεται ως εξής: d(x q, x i ) = ( ) (2.1) Άλλες εναλλακτικές της Ευκλείδειας απόστασης είναι η απόσταση Manhatan ή city block, η Mahalanobis, η απόσταση συνημιτόνου κ.ά., οι οποίες ωστόσο χρησιμοποιούνται περισσότερο σε ειδικές περιπτώσεις. Ο αλγόριθμος K-NN μοιάζει με το βήμα των μεθόδων για την ανάκτηση περιπτώσεων, ένα πολύ γνωστό παράδειγμα της υποστήριξης αποφάσεων. Η ταξινόμηση και η παλινδρόμηση, όταν κάνουν χρήση του αλγορίθμου K- NN έχουν αρκετά πλεονεκτήματα και μειονεκτήματα. Ένα από τα μειονεκτήματα είναι ότι οι μέθοδοι K-NN λειτουργούν ανεπαρκώς στους τομείς μεγάλων διαστάσεων. 40

41 Επιπλέον, ο αλγόριθμος «ξεγελιέται» εύκολα από τις διαφορές στις κλίμακες στις ο- ποίες οι μεταβλητές εκφράζονται. Ο αλγόριθμος K-NN εφαρμόζεται συνήθως για ταξινόμηση, εξομάλυνση, ή δυαδική παλινδρόμηση και δεν έχει χρησιμοποιηθεί από πολλές μελέτες στο πλαίσιο της ανάλυσης επιβίωσης, [8] Η λειτουργία του ως μέθοδος απόδοσης τιμών σε ελλείπουσες τιμές δεδομένων περιγράφεται στην ενότητα Μέθοδος Global-Local Imputation Algorithm INI Η μέθοδος Global-Local Imputation INI αποτελεί μια υβριδική μέθοδο για την απόδοση ελλειπουσών τιμών. Ο αλγόριθμος INI αποτελεί συνδυασμό του αλγορίθμου ελαχίστων τετραγώνων και της μεθόδου πλησιέστερων γειτόνων (NN), (Myrtveit, 2001). Ο συνδυασμός αυτών των δύο μεθόδων δημιούργησε τον αλγόριθμο INI που εκφράζει τη μέθοδο NN, βασισμένη στη μέθοδο ελαχίστων τετραγώνων. Αυτή η μέθοδος έχει εφαρμοστεί επιτυχημένα και στη μέθοδο αντικατάστασης με βάση το μέσο όρο, αλλά με διάφορες ρυθμίσεις στο πλαίσιο του τομέα της βιοπληροφορικής, [23]. H μέθοδος ΙΝΙ καθώς προκύπτει και από την ονομασία της αποτελεί έναν συνδυασμό καθολικής και τοπικής μεθόδου. Συνδυάζει την τοπική προσέγγιση μέσω της μεθόδου πλησιέστερων γειτόνων (NN) και την καθολική προσέγγιση μέσω του αλγορίθμου Επαναληπτικής Μεγιστοποίησης Ελαχίστων Τετραγώνων (IMLS). Ο αλγόριθμος INI περιγράφεται παρακάτω ως εξής: 41

42 Βήμα 1: Ο αλγόριθμος ΙΝΙ ξεκινάει με την εφαρμογή του αλγορίθμου IMLS στον πίνακα X με σκοπό την καταχώρηση όλων των ελλειπουσών τιμών του σε έναν άλλο πίνακα X*. Βήμα 2: Θεωρούμε ως οντότητα-στόχο X l την πρώτη γραμμή του πίνακα X που περιέχει ελλείπουσα τιμή. Βήμα 3: Βρίσκονται οι K γείτονες της X l στον πίνακα X. Βήμα 4: Δημιουργούμε έναν πίνακα X c, ο οποίος αποτελείται από τη X l και τις γραμμές του X που αντιστοιχούν στους επιλεγμένους K γείτονες. Βήμα 5: Στη συνέχεια, εφαρμόζεται ο IMLS στον πίνακα X c και αποδίδονται οι ελλείπουσες τιμές στη X l. Βήμα 6: Εάν δεν υπάρχουν άλλες ελλείπουσες τιμές στον X, ο αλγόριθμος τερματίζεται, διαφορετικά επιστρέφουμε στο δεύτερο βήμα, [22]. 2.3 Μέθοδος BPCA (Bayesian Principal Component Analysis) Η BPCA (Oba et al., 2003) είναι μια τεχνική απόδοσης τιμών βασισμένη στο Bayesian PCA (Bishop, 1998). Ο αλγόριθμος BPCA εκτελείται επαναλαμβανόμενα εναλλάσσοντας την κατανομή των παραμέτρων της PCA (Ανάλυση Βασικού Στοιχείου) και την κατανομή των ελλειπουσών τιμών μέχρι να σημειωθεί σύγκλιση. Ένα πλεονέκτημα από τη χρήση αυτής της προσέγγισης είναι ότι οι παράμετροι δεν απαιτείται να είναι σταθερές, καθώς ο αλγόριθμος από μόνος του καθορίζει την κατάλληλη διάσταση για την PCA. 42

43 Η μέθοδος BPCA αποτελείται από τρία βασικά συστατικά στοιχεία. Πρώτα είναι το βασικό στοιχείο της παλινδρόμησης, που αποτελεί μια προσέγγιση χαμηλής κατάταξης του συνόλου δεδομένων. Στη συνέχεια εκτελείται η εκτίμηση Bayesian. Αυτή η εκτίμηση θεωρεί ότι το σφάλμα υπολοίπου και η προβολή της κάθε παρατήρησης του συνόλου δεδομένων στα βασικά στοιχεία, λειτουργούν ως κανονικές ανεξάρτητες τυχαίες μεταβλητές με άγνωστες παραμέτρους. Τέλος, η εκτέλεση της εκτίμησης Bayesian με επαναλήψεις υλοποιείται επαναλαμβάνοντας την εκτίμηση Bayesian με σκοπό τη μεγιστοποίηση των άγνωστων παραμέτρων της Bayesian, [16]. 2.4 Μέθοδος PLS Ο αλγόριθμος των Μερικών Ελαχίστων Τετραγώνων (PLS) είναι μια άλλη μέθοδος για την απόδοση ελλειπόντων δεδομένων. Είναι μια στατιστική μέθοδος που σχετίζεται με το βασικό στοιχείο της παλινδρόμησης. Ο PLS λειτουργεί βρίσκοντας ένα γραμμικό μοντέλο. Το πετυχαίνει προβάλλοντας τις προβλεπόμενες και τις παρατηρούμενες μεταβλητές σε νέο χώρο. Η μέθοδος αναπτύχθηκε από τον Herman Wold τις δεκαετίες 1960 και Αρχικά χρησιμοποιήθηκε για την αντιμετώπιση προβλημάτων στον τομέα της οικονομετρίας και τη δεκαετία του 1980 προσαρμόστηκε για τη διαχείριση προβλημάτων παλινδρόμησης στους τομείς της χημειομετρικής και της φασματομετρικής (Boulesteix and Strimmer, 2006). Αυτή η μέθοδος προσαρμόστηκε αργότερα και σε προβλήματα βιοπληροφορικής, πιο συγκεκριμένα στους τομείς της γονιδιοματικής και πρωτεϊνοματικής, και 43

44 αποδείχτηκε ότι διαθέτει μεγάλες δυνατότητες λόγω της ικανότητας της να λειτουργεί με ικανοποιητικό βαθμό σε δεδομένα με μικρό αριθμό δειγμάτων και μεγάλο αριθμό παραμέτρων. Παρά το πλεονέκτημα αυτό, η βασική αρχή του PLS είναι δύσκολο να κατανοηθεί λόγω του μεγάλου αριθμού των αλγοριθμικών μεταβλητών. Όσον αφορά την απόδοση τιμών, η PLS μπορεί να περιγραφεί και ως τεχνική μείωσης διαστάσεων που συνδυάζεται μαζί με ένα μοντέλο παλινδρόμησης (Boulestex and Strimmer, 2006). Η βασική λειτουργία του αλγορίθμου της βασίζεται στην εύρεση νέων μεταβλητών μέσω γραμμικών συνδυασμών στις αρχικές μεταβλητές, [15]. 44

45 ΚΕΦΑΛΑΙΟ 3 Εφαρμογές και Αποτελέσματα 3.1 Εφαρμογή του Συνδυασμού σε προηγούμενες έρευνες Σε αυτήν την ενότητα περιγράφουμε μια εφαρμογή που συνδυάζει την ανάλυση επιβίωσης με τη μέθοδο πλησιέστερων γειτόνων K-NN, σε σύνολο δεδομένων με ελλείπουσες τιμές. Παρόλο που έχει ήδη χρησιμοποιηθεί και σε προηγούμενες εργασίες, η μελέτη της εφαρμογής θα συνεισφέρει στην εξαγωγή χρήσιμων συμπερασμάτων όταν συνδυαστεί με την εφαρμογή που αναπτύσσεται στα πλαίσια της παρούσας εργασίας. Ακολουθεί η περιγραφή του συνόλου δεδομένων Περιγραφή του Συνόλου Δεδομένων Καρκινώματος Το σύνολο δεδομένων καρκινώματος αποτελείται από 111 δείγματα και αριθμούς γονιδίων. Το δείγμα για αυτό το σύνολο δεδομένων αποκτήθηκε αρχικά από ένα σύνολο 100 αρχικών δειγμάτων καρκίνου του παχέος εντέρου και αντίστοιχα δείγματα επιθηλιακών κυττάρων, μέσω χειρουργικών τομών που έγιναν κατά την περίοδο μεταξύ Απριλίου 1994 και Σεπτεμβρίου 2000 (Muro et al. 2003). Τα δείγματα στη συνέχεια επεξεργάστηκαν οι ερευνητές στο Πανεπιστήμιο Osaka και παρήγαγαν τον τελικό πίνακα δεδομένων (Muro et al. 2003), [15]. Το σύνολο δεδομένων περιέχει τιμές από τις οποίες οι είναι ελλείπουσες και οι παρατηρούμενες, [16]. 45

46 3.1.2 Απόδοση τιμών με τον K-NN Ο αλγόριθμος K-NN που περιγράφεται σε αυτήν την ενότητα, ως μέθοδος απόδοσης τιμών, είναι ο αλγόριθμος που χρησιμοποιήθηκε σε εφαρμογές προηγούμενων ερευνητικών εργασιών, αλλά και στη δική μας που περιγράφεται αναλυτικά στην επόμενη ενότητα. Εκτός από τις δυνατότητες του αλγορίθμου που περιγράψαμε στην ενότητα 2.1, μια ομάδα ερευνητών πρόσφατα ανακάλυψε την ικανότητά του να λειτουργεί και ως μέθοδος απόδοσης τιμών σε ιατρικά δεδομένα με ελλείπουσες τιμές. Ο αλγόριθμος K-NN είναι ένας από τους πιο απλούς αλγορίθμους στη μηχανική μάθηση. Η σύντομη λειτουργία του για την απόδοση δεδομένων φαίνεται παρακάτω (Hastie et al, 2009): 1) Δίνεται ένα σύνολο δεδομένων, που αποτελείται από έναν πίνακα που εκφράζει τα γονίδια στις γραμμές και τα δείγματα στις στήλες. 2) Επιλέγεται μια k-τιμή προσεκτικά, συνήθως χρησιμοποιώντας ευριστικές τεχνικές όπως η «διασταυρουμένη επικύρωση» (cross-validation). 3) Για κάθε γονίδιο με ελλείπουσες τιμές, βρίσκουμε τον k-πλησιέστερο γείτονα χρησιμοποιώντας την Ευκλείδεια μετρική απόσταση, δεσμεύοντας τις στήλες στις οποίες τα γονίδια δεν λείπουν. 4) Για κάθε υποψήφιο γείτονα μπορεί να λείπουν ορισμένες συντεταγμένες για τον υπολογισμό της απόστασης. Για την επίλυση αυτού του προβλήματος, υ- πολογίζουμε τη μέση απόσταση από τις μη-ελλείπουσες συντεταγμένες. 5) Όταν βρίσκονται οι K-NN για ένα γονίδιο, η απόδοση γίνεται με τον μέσο υ- πολογισμό των μη-ελλειπόντων στοιχείων των γονιδίων τους. 46

47 Το κύριο πλεονέκτημα της χρήσης του αλγορίθμου K-NN είναι ότι πρόκειται για πολύ αποδοτική και ευαίσθητη μέθοδος, όταν αφορά την εκτίμηση ελλείπουσας τιμής. Αυτή είναι η βασική ιδέα για τον K-NN όταν λειτουργεί για την απόδοση ελλειπουσών τιμών σε δεδομένα μικροσυστοιχίας DNA (π.χ. σύνολο δεδομένων καρκινώματος). Για το σκοπό της εκτίμησης της ελλείπουσας τιμής, o Κ-ΝΝ χρησιμοποιεί την πληροφορία από τα υποψήφια γονίδια, που περιλαμβάνουν τις τιμές που πρέπει να αποδοθούν στο στόχο-γονίδιο. Για παράδειγμα, μια ελλείπουσα τιμή του γονιδίου j σε ένα πείραμα εκτιμάται με βάση τα k υποψήφια γονίδια με τη διαθέσιμη τιμή σ αυτό το πείραμα. Αυτή η k αντιστοιχεί σε k γονίδια πιο στενά ή τα πλησιέστερα στο γονίδιο στόχο j. Η επιλογή του μέτρου απόστασης για την επιλογή k γονιδίων είναι πολύ σημαντική καθώς καθορίζει την ακρίβεια της απόδοσης. Οι Troyanskaya et al. (2001) χρησιμοποίησαν την Ευκλείδεια μετρική ως μέτρο απόστασης, η οποία και εκτελέστηκε σωστά σ αυτό το πείραμα. Παρακάτω ακολουθεί ο αλγόριθμος απόδοσης τιμών για τον K-NN. Θεωρείται ότι ένας στόχος-γονίδιο j L έχει ελλείπουσα τιμή σε ένα πείραμα v. Διατίθεται ένα σύνολο υποψήφιων γονιδίων για την απόδοση ελλείπουσας τιμής, δηλωμένη με y v, και αυτά τα γονίδια έχουν τιμές διαθέσιμες στο πείραμα v που αντιστοιχούν με ελλείπουσα τιμή y vj. Έστω ότι το σύνολο των υποψήφιων γονιδίων είναι C v. Τότε, επιλέγονται k γονίδια μεταξύ των C v έτσι ώστε να είναι κοντά στο γονίδιο j (kπλησιέστερος γείτονας). Το μέτρο απόστασης είναι η σταθμισμένη Ευκλείδεια Μετρική και υπολογίζεται μεταξύ του στόχου-γονιδίου x j και κάθε υποψήφιου γονιδίου x k, k C v με βάση τα διαθέσιμα δεδομένα και είναι, [18]: 47

48 d(x j, X k ) = { n jk -1 ( ) 2 } ½, k C v (3.1) Ακολουθεί ο ψευδοκώδικας για την απόδοση τιμών στον K-NN: 1) Δώσε τον αριθμό των γειτόνων, k 2) Όρισε τις M στήλες με ελλείπουσες τιμές, και όρισε τις ετικέτες (labels) των σειρών των ελλειπουσών τιμών μέσα σε κάθε στήλη: L j, για j L 3) ΓΙΑ j L ΚΑΝΕ Ανάθεσε το γονίδιο-στόχο : x j ΓΙΑ v L j ΚΑΝΕ α) Βρες το υποψήφιο σύνολο γονιδίων με σειρά ελλείπουσας τιμής v: C v = {στήλη k:k έχει μια διαθέσιμη σειρά v, k=1,, ρ, k j} β) Υπολόγισε την απόσταση κάθε υποψήφιου γονιδίου από το στόχο γονίδιο: d jl = d(x j,x l ), l C v. γ) Βρες τα υποψήφια γονίδια που αντιστοιχούν με τις k «μικρότερης» απόστασης: C v. δ) Εκτίμησε την ελλείπουσα τιμή μέσω ενός σταθμισμένου μέσου όρου των τιμών έκφρασης των k πλησιέστερων γονιδίων στη σειρά v, με βάση τα w ji εξαρτώμενα από το d jl, l C v *, ΤΕΛΟΣ rj = l C v *: ŷ vj = Σ l Cv* w jl, y vl ΤΕΛΟΣ 48

49 3.1.3 Μεθοδολογία Αποτελέσματα Συνοπτικά η μεθοδολογία, [16] που ακολουθήθηκε σε προηγούμενες μελέτες για το συνδυασμό της Ανάλυσης Επιβίωσης και της Μεθόδου Πλησιέστερων Γειτόνων K- NN στο σύνολο δεδομένων καρκινώματος, αναλύεται σε τέσσερα στάδια: α) Το πρώτο στάδιο περιλαμβάνει την συμπλήρωση των ελλειπουσών τιμών των συνόλων δεδομένων χρησιμοποιώντας τη Μέθοδο Πλησιέστερων Γειτόνων K-NN, όπως περιγράφηκε στην προηγούμενη υποενότητα. Το λογισμικό που χρησιμοποιήθηκε είναι το Matlab και η ενσωματωμένη συνάρτηση KNNimpute. β) Το δεύτερο στάδιο περιλαμβάνει την επιλογή των γονιδίων που θα ήταν καταλληλότερα, ώστε να χρησιμοποιηθούν στην ανάλυση επιβίωσης. Δηλαδή τα γονίδια που οφείλονται περισσότερο για την επιδείνωση της ασθένειας ή τελικά το θάνατο ενός ασθενή. Προτού γίνει αυτό θεωρήθηκε χρήσιμο να φιλτραριστεί το σύνολο δεδομένων, ώστε να συμπεριληφθούν μόνο τα γονίδια που εκφράζονται με βάση ένα συγκεκριμένο χαρακτηριστικό (π.χ. τα γονίδια που περιλαμβάνουν το χαρακτηριστικό του όγκου). Η μέθοδος που ακολουθήθηκε στη συγκεκριμένη έρευνα για την επιλογή μετά το φιλτράρισμα είναι η μοντελοποίηση παλινδρόμησης Cox, που όπως περιγράφηκε και στο πρώτο κεφάλαιο συνεισφέρει και στην επιλογή των σημαντικότερων μεταβλητών. γ) Το τρίτο στάδιο περιλαμβάνει την ομαδοποίηση των γονιδίων που προκύπτουν από το προηγούμενο στάδιο. Το κριτήριο για την ομαδοποίηση τους είναι οι κοινές ιδιότητες με βάση την κωδικοποίηση. Ο αλγόριθμος που χρησιμοποιείται για το σκοπό αυτό είναι ο k-means. Ο αλγόριθμος k-means, απαιτεί ως είσοδο έναν πίνακα Μ σημείων σε Ν διαστάσεις και έναν πίνακα με k 49

50 αρχικά κέντρα ομάδων σε N διαστάσεις. Η γενική διαδικασία του αλγορίθμου k-means στοχεύει στην αναζήτηση k-υπομάδας με τοπικά βέλτιστο άθροισμα τετραγώνων μέσα στην ομάδα, μετακινώντας τα σημεία από τη μια ομάδα στην άλλη, Hartigan and Wong (1979). Τα γονίδια τότε ομαδοποιούνται σε δύο κατηγορίες. Η πρώτη ονομάζεται «ομάδα υψηλού κινδύνου» και η δεύτερη «ομάδα χαμηλού κινδύνου» για τα γονίδια που φέρουν τις αντίστοιχες ιδιότητες. δ) Το τελευταίο στάδιο περιλαμβάνει την ταξινόμηση των γονιδίων. Η ταξινόμηση γονιδίων γίνεται μέσω του ταξινομητή SVM. Ο αλγόριθμος SVM ε- κτελείται, αποκτώντας ένα σύνολο δειγμάτων εκπαίδευσης. Το κάθε σύνολο εκπαίδευσης που προκύπτει θα σημειώνεται ότι ανήκει σε μια από τις δύο κατηγορίες. Για κάθε νέο παράδειγμα που εμφανίζεται, ο αλγόριθμος SVM θα δημιουργήσει ένα μοντέλο το οποίο και θα προβλέπει εάν α- νήκει στη μια ή στην άλλη κατηγορία, [19]. 3.2 Εφαρμογή για το Συνδυασμό σε κλινικά σύνολα δεδομένων Καρκίνου του Λάρυγγα και Μυελού των Οστών Περιγραφή των Συνόλων Δεδομένων Σε αυτήν την ενότητα περιγράφονται τα σύνολα δεδομένων που χρησιμοποιήσαμε για την δικιά μας εφαρμογή και περιλαμβάνουν στοιχεία για τη μελέτη των ασθενών που έχουν υποστεί μεταμόσχευση μυελού των οστών και στοιχεία για ασθενείς που εμφάνισαν καρκίνο του λάρυγγα. 50

51 Περιγραφή του Συνόλου Δεδομένων Καρκίνου του Λάρυγγα Το σύνολο δεδομένων (1983) περιέχει στοιχεία για 90 άτομα με διαγνωσμένο καρκίνο του λάρυγγα κατά την περίοδο σε ένα Ολλανδικό νοσοκομείο. Οι χρόνοι που καταγράφονται είναι τα χρονικά διαστήματα (σε χρόνια) μεταξύ της πρώτης θεραπείας και είτε του θανάτου είτε του τέλους της μελέτης (1 Ιανουαρίου 1983). Ε- πίσης καταγράφονται η ηλικία των ασθενών, ο χρόνος της διάγνωσης, η χρονιά της διάγνωσης, και το στάδιο καρκίνου του ασθενή. Τα τέσσερα στάδια της ασθένειας στη μελέτη βασίστηκαν στην ταξινόμηση T.N.M. (αρχικός όγκος (T), κομβική ανάμιξη (N) και κατάταξη απομακρυσμένης μετάστασης (M)) η οποία χρησιμοποιήθηκε για την κατηγοριοποίηση των σταδίων του καρκίνου (1972). Τα στάδια διατάσσονται από το λιγότερο προς το περισσότερο επιβλαβές, [17]. Πιο αναλυτικά το σύνολο δεδομένων καρκίνου του λάρυγγα αποτελείται από 90 γραμμές, οι οποίες αναπαριστούν τους ασθενείς και από 5 στήλες, οι οποίες είναι οι μεταβλητές (το στάδιο της ασθένειας, η ηλικία του ασθενή, η χρονιά της διάγνωσης, ο χρόνος της διάγνωσης και τέλος το αποτέλεσμα, εάν δηλαδή ο ασθενής έζησε ή απεβίωσε). Σε σύνολο 450 τιμών τα ελλείποντα δεδομένα ήταν 25 και τα παρατηρούμενα Περιγραφή του Συνόλου Δεδομένων Μυελού των Οστών Η μεταμόσχευση μυελού των οστών αποτελεί μια πρότυπη θεραπεία για την αντιμετώπιση της οξείας λευχαιμίας. Η ανάρρωση των ασθενών μετά τη μεταμόσχευση μυελού των οστών μπορεί να εξαρτάται από διάφορους παράγοντες κινδύνου οι οποίοι είναι γνωστοί για τη διάρκεια της περιόδου μεταμόσχευσης, όπως η ηλικία και το 51

52 φύλλο του ασθενή και/ή του δότη, το στάδιο της αρχικής ασθένειας, ο χρόνος από τη διάγνωση μέχρι τη μεταμόσχευση, κ.ά. Ωστόσο, η τελική πρόγνωση μπορεί να αλλάξει καθώς το μετά-μεταμοσχευτικό ιστορικό των ασθενών εξελίσσεται με την εμφάνιση διάφορων γεγονότων σε τυχαίους χρόνους από τη στιγμή της εκκίνησης της διαδικασίας ανάρρωσης, όπως η ανάπτυξη οξείας ή χρόνιας ασθένειας με συμπτώματα αντίδρασης του μοσχεύματος έναντι του ξενιστή (GVHD), η επιστροφή των αιμοπεταλίων σε φυσιολογικά επίπεδα, ή η εμφάνιση μολύνσεων. Η μεταμόσχευση μπορεί να θεωρηθεί αποτυχημένη είτε στην περίπτωση που «επιστρέψει» η λευχαιμία στον ασθενή (υποτροπή) είτε στην περίπτωση που ο ασθενής πεθάνει ενώ βρίσκεται σε ύφεση (η θεραπεία σχετίζεται με το θάνατο). Στο σύνολο δεδομένων που μελετάται αρκετοί πιθανοί παράγοντες κινδύνου εντοπίστηκαν για την περίοδο της μεταμόσχευσης. Για κάθε ασθένεια, οι ασθενείς ομαδοποιήθηκαν σε κατηγορίες κινδύνου ανάλογα με την κατάστασή τους τη στιγμή της μεταμόσχευσης. Αυτές οι κατηγορίες ήταν οι ακόλουθες: ALL (38 ασθενείς), AML ύφεση χαμηλού κινδύνου (54 ασθενείς), και AML δεύτερη ύφεση υψηλού κινδύνου ή μη-θεραπεύσιμη πρώτη ύφεση (15 ασθενείς), ή δεύτερη ή μεγαλύτερη υποτροπή ή ο ασθενής δεν έχει βρεθεί καθόλου σε ύφεση (30 ασθενείς). Άλλοι παράγοντες κινδύνου που μελετήθηκαν την περίοδο της μεταμόσχευσης περιλαμβάνουν το ρόλο του δέκτη και του δότη, την ανοσολογική κατάσταση του κυτταρομεγαλοϊού (CVM) για το δέκτη και το δότη, την ηλικία του δέκτη και του δότη (ποικίλει μεταξύ 7-52 και 2-56, χρόνια, αντίστοιχα), το χρόνο αναμονής από τη διάγνωση ως τη μεταμόσχευση (κυμαίνεται μεταξύ 0,8-87,2 μήνες, με μέσο όρο 19,7 μήνες), τη Γαλλο-Αμερικανο-Βρετανική (FAB) ταξινόμηση βασισμένη σε πρότυπα μορφολογικά κριτήρια για τους ασθενείς στην AML κατηγορία. Οι AML ασθενείς με ταξινόμηση FAB τέταρτου ή πέμπτου βαθμού θεωρήθηκε ότι έχουν πιθανό αυξημένο 52

53 κίνδυνο υποτροπής ή θανάτου που σχετίζεται με τη θεραπεία. Τέλος, ένας τελευταίος παράγοντας που έχει σημαντικό ρόλο για τους ασθενείς είναι η δόση προφυλακτικού φαρμάκου συνδυασμού μεθοτρεξάνης (MTX) με κυκλοσπορίνης και πιθανώς πρεδνιζολόνης μεθυλίου που δόθηκε σε δύο νοσοκομεία της Αυστραλίας (SVH και AH). Για τους ασθενείς στα άλλα νοσοκομεία δεν δόθηκε μεθοτρεξάνη (MTX) αλλά ένας συνδυασμός κυκλοσπορίνης και πρεδνιζολόνης μεθυλίου, [17]. Πιο αναλυτικά το σύνολο μυελού των οστών αποτελείται από 137 γραμμές, οι οποίες αναπαριστούν τους ασθενείς και από 22 στήλες, οι οποίες είναι οι μεταβλητές (η κατηγορία κινδύνου του ασθενή, ο χρόνος έως τον θάνατο ή ο χρόνος μελέτης του ασθενή, ο χρόνος επιβίωσης των ασθενών απαλλαγμένοι από ασθένειες, ο δείκτης θανάτου, ο δείκτης υποτροπής, ο δείκτης επιβίωσης των ασθενών απαλλαγμένοι από ασθένειες, ο χρόνος μέχρι την οξεία αντίδραση του μοσχεύματος κατά του ξενιστή, ο δείκτης για την οξεία αντίδραση του μοσχεύματος κατά του ξενιστή, ο χρόνος μέχρι την εμφάνιση χρόνιας αντίδρασης του μοσχεύματος κατά του ξενιστή, ο δείκτης για τη χρόνια αντίδραση του μοσχεύματος κατά του ξενιστή, ο χρόνος επιστροφής των αιμοπεταλίων σε φυσιολογικά επίπεδα, ο δείκτης αποκατάστασης των αιμοπεταλίων σε φυσιολογικά επίπεδα, η ηλικία του ασθενή, η ηλικία του δότη, το φύλο του ασθενή, το φύλο του δότη, η ανοσολογική κατάσταση του κυτταρομεγαλοϊού για το δέκτη και το δότη, ο χρόνος αναμονής για τη μεταμόσχευση, η Γαλλο-Αμερικανο- Βρετανική ταξινόμηση, τα νοσοκομεία που νοσηλεύθηκαν οι ασθενείς και εάν δόθηκε στους ασθενείς μεθοτρεξάνη). Σε σύνολο τιμών τα ελλείποντα δεδομένα ήταν 182 και τα παρατηρούμενα

54 3.2.2 Μεθοδολογία - Αποτελέσματα Προηγουμένως, περιγράψαμε τη μεθοδολογία και την εφαρμογή που έχει γίνει σε προηγούμενες μελέτες. Σε αυτήν την ενότητα περιγράφεται η μεθοδολογία που ακολουθήσαμε στη μελέτη μας για την εφαρμογή με Συνδυασμό της Ανάλυσης Επιβίωσης και της μεθόδου πλησιέστερων γειτόνων K-NN καθώς και τα αποτελέσματα που προέκυψαν, συνοδευόμενα με την αντίστοιχη ερμηνεία. Η μεθοδολογία συνοψίζεται σε τέσσερα στάδια: α) Δημιουργία ελλειπουσών τιμών στα σύνολα δεδομένων επιβίωσης μυελού των οστών και καρκίνου του λάρυγγα με τεχνητό μη αυτόματο τρόπο. β) Απόδοση τιμών στα σύνολα δεδομένων με ελλείπουσες τιμές, χρησιμοποιώντας τη μέθοδο πλησιέστερων γειτόνων K-NN. γ) Εφαρμογή μεθόδων της Ανάλυσης Επιβίωσης (Kaplan-Meier και παλινδρόμηση Cox) για τα σύνολα δεδομένων πριν και μετά την εφαρμογή της μεθόδου πλησιέστερων γειτόνων και δημιουργία αντίστοιχων διαγραμμάτων ε- πιβίωσης. δ) Σύγκριση των αποτελεσμάτων-διαγραμμάτων που προέκυψαν πριν και μετά την εφαρμογή της μεθόδου K-NN για τα αντίστοιχα σύνολα δεδομένων με την ανάλογη ερμηνεία. Δημιουργία ελλειπουσών τιμών Στο πρώτο βήμα, προκειμένου να εξυπηρετήσουμε τις ανάγκες της έρευνάς μας αλλά και να ελέγξουμε την απόδοση της μεθόδου K-NN, ως μέθοδος απόδοσης τιμών σε ελλείποντα δεδομένα, δημιουργήσαμε τεχνητές ελλείπουσες τιμές με μη αυτόματο τυχαίο τρόπο, έτσι ώστε το ποσοστό των ελλειπουσών τιμών να αντιπροσωπεύει πε- 54

55 ρίπου το 6% επί του συνόλου των δεδομένων στις δύο περιπτώσεις που μελετάμε (σύνολο δεδομένων καρκίνου του λάρυγγα και μυελού των οστών). Το ποσοστό αυτό συμπίπτει με το ποσοστό των ελλειπουσών τιμών επί του συνόλου και για το σύνολο δεδομένων καρκινώματος, το οποίο περιγράψαμε στην προηγούμενη ενότητα. Συνεπώς, η σύγκριση της απόδοσης για τη μέθοδο K-NN σε όλες τις περιπτώσεις θα είναι περισσότερο αξιόπιστη. Απόδοση τιμών με τη μέθοδο πλησιέστερων γειτόνων K-NN Στη συνέχεια, στο δεύτερο βήμα, αποδώσαμε τιμές στα σύνολα δεδομένων που προέκυψαν εφαρμόζοντας τη μέθοδο πλησιέστερων γειτόνων. Το λογισμικό που χρησιμοποιήθηκε είναι το Matlab και η ενσωματωμένη συνάρτηση KNNimpute. Ο αλγόριθμος και η μεθοδολογία της μεθόδου περιγράφηκε αναλυτικά στην ενότητα Ο αριθμός των γειτόνων που επιλέχτηκε ήταν k = 2, 5, 7, 10 και 15. Ενδεικτικά παραθέτουμε τα αποτελέσματα που προέκυψαν στα παρακάτω Σχήματα ( ). 55

56 Σχήμα 3.2: Το σύνολο δεδομένων για τη μελέτη καρκίνου του λάρυγγα που προέκυψε μετά από εφαρμογή του K-NN στο αρχικό σύνολο για k=2 Σχήμα 3.3: Το σύνολο δεδομένων για τη μελέτη καρκίνου του λάρυγγα που προέκυψε μετά από εφαρμογή του K-NN στο αρχικό σύνολο για k=5 56

57 Σχήμα 3.4: Το σύνολο δεδομένων για τη μελέτη μυελού των οστών που προέκυψε μετά από εφαρμογή του K-NN στο αρχικό σύνολο για k=2 Σχήμα 3.5: Το σύνολο δεδομένων για τη μελέτη μυελού των οστών που προέκυψε μετά από εφαρμογή του K-NN στο αρχικό σύνολο για k=15 57

58 Μια παρατήρηση που μπορεί να γίνει για τα αποτελέσματα που επέστρεψε η μέθοδος πλησιέστερων γειτόνων στο σύνολο δεδομένων καρκίνου του λάρυγγα είναι ότι λόγω του μικρού μεγέθους δείγματος και του αριθμού των χαρακτηριστικών του, τα αποτελέσματα για αριθμό γειτόνων με k = 5, 7, 10 και 15 ταυτίζονταν μεταξύ τους. Εφαρμογή μεθόδων Ανάλυσης Επιβίωσης Στο τρίτο βήμα, πραγματοποιήσαμε Ανάλυση Επιβίωσης για τα σύνολα δεδομένων πριν και μετά την εφαρμογή της μεθόδου K-NN, για τον διάφορο αριθμό γειτόνων. Το λογισμικό που χρησιμοποιήθηκε σε αυτήν την περίπτωση είναι το SPSS και οι μέθοδοι με τις οποίες έγινε η ανάλυση είναι η Kaplan-Meier και η παλινδρόμηση Cox. Στα επόμενο μέρος της έρευνας, ακολουθούν τα αποτελέσματα που προέκυψαν για τα αρχικά σύνολα δεδομένων των ασθενών που έχουν υποστεί μεταμόσχευση μυελού των οστών και των ασθενών με καρκίνο του λάρυγγα. Έπειτα περιγράφεται η αντίστοιχη ερμηνεία τους. 58

59 Σύνολο Δεδομένων Καρκίνου του Λάρυγγα Σχήμα 3.6: Διάγραμμα επιβίωσης Kaplan-Meier για το αρχικό σύνολο δεδομένων ασθενών με καρκίνο του λάρυγγα Από το Σχήμα 3.6 καθώς και από άλλους σχετικούς πίνακες που προέκυψαν επιβεβαιώνεται ότι ο αριθμός των ασθενών που τελικά επέζησε ή τουλάχιστον επέζησε μέχρι το τέλος της έρευνας (λογοκριμένες παρατηρήσεις) ήταν 40, ενώ ο αριθμός των ατόμων που πέθανε, εξαιτίας της συγκεκριμένης ασθένειας είναι 50, αφότου είχε προηγηθεί κάποιο άλλο γεγονός. Επιπλέον, ο μέσος χρόνος επιβίωσης εκτιμήθηκε στους 5,748 μήνες ενώ η διάμεσος, όπως φαίνεται και από το διάγραμμα, στους 6 μήνες. Τα ίδια συμπεράσματα προκύπτουν όταν γίνεται ανάλυση επιβίωσης για το σύνολο δεδομένων καρκίνου του λάρυγγα, στο οποίο συμπληρώνονται οι ελλείπουσες τιμές με τη μέθοδο K-NN για k=2, 5, 7, 10 και

60 Όπως αναφέραμε και προηγουμένως, οι τιμές που επέστρεψε η μέθοδος Κ-ΝΝ για τη συμπλήρωση των στοιχείων του συνόλου δεδομένων στη μελέτη καρκίνου του λάρυγγα είναι παρόμοια, για αριθμό γειτόνων με k = 5, 7, 10 και 15. Συνεπώς, τα αποτελέσματα και για την ανάλυση επιβίωσης συμπίπτουν επίσης. Ωστόσο, το πιο σημαντικό μέρος της έρευνας εστιάζει στη σύγκριση των αποτελεσμάτων στην ανάλυση επιβίωσης μεταξύ του αρχικού συνόλου δεδομένων και αυτού που προκύπτει μετά την εφαρμογή της μεθόδου πλησιέστερων γειτόνων για τον διάφορο αριθμό γειτόνων. Τα αποτελέσματα που προέκυψαν για τα δύο σύνολα δεδομένων είναι: Σχήμα 3.7: Διάγραμμα επιβίωσης K-M με k=2, για το σύνολο δεδομένων ασθενών με καρκίνο του λάρυγγα, με ποσοστό ελλειπουσών τιμών 17% επί του συνόλου στο χρόνο επιβίωσης 60

61 Σχήμα 3.8: Διάγραμμα επιβίωσης K-M για k = 5, 7, 10 και 15 στο σύνολο δεδομένων ασθενών με καρκίνο του λάρυγγα, με ποσοστό ελλειπουσών τιμών 17% επί του συνόλου στο χρόνο επιβίωσης Καθώς παρατηρούμε τα παραπάνω σχήματα μπορούμε να διαπιστώσουμε ότι το σύνολο δεδομένων καρκίνου του λάρυγγα που προκύπτει για μικρό αριθμό γειτόνων (k=2) παρουσιάζει μεγαλύτερη ταύτιση με το αρχικό. Ενώ, όταν αυξάνει ο αριθμός των γειτόνων (k=5) εμφανίζονται μεγαλύτερες αποκλίσεις και περισσότερες αλληλεπικαλύψεις μεταξύ των καμπυλών. Επιπλέον, ένα άλλο σημαντικό στοιχείο που δίνεται από το διάγραμμα με α- ριθμό γειτόνων k=5 (Σχήμα 3.8) είναι ότι για το 60% περίπου των ασθενών (0,4 στον άξονα Αθροιστικής Επιβίωσης) προκύπτει μεγαλύτερο χρονικό διάστημα επιβίωσης από το φυσιολογικό. Αυτό επιβεβαιώνεται και από τον Πίνακα 3.2, ο οποίος αναπαριστά το μέσο χρόνο επιβίωσης των ασθενών στις δύο αντίστοιχες περιπτώσεις. 61

62 Συμπερασματικά, λαμβάνοντας υπόψη ότι ο προβλεπόμενος χρόνος επιβίωσης των ασθενών σε ιατρικές μελέτες είναι σημαντικό να μην αποκλίνει σημαντικά και πολύ περισσότερο να μην είναι μεγαλύτερος από το πραγματικό αποτέλεσμα, αποδεικνύεται ότι το σύνολο δεδομένων που προκύπτει με μικρότερο αριθμό γειτόνων (k=2) είναι πιο αξιόπιστο. Ένα άλλο ενδιαφέρον σημείο από τα αποτελέσματα προκύπτει, εφαρμόζοντας το logrank τεστ για τον έλεγχο της ισότητας των κατανομών επιβίωσης για τα δύο γραφήματα (Πίνακας 3.1). Και για τα δύο γραφήματα δεν προέκυψε σημαντικότητα στην διαφορά μεταξύ των κατανομών επιβίωσής τους (sig.> 0,05). Αυτό πρακτικά ερμηνεύεται ότι και οι δύο ομάδες που συγκρίνονται προέρχονται από τον ίδιο πληθυσμό, κάτι το οποίο είναι και αληθές. k (συνδυασμένο με το αρχικό δείγμα) Σημαντικότητα (Significance) 2 0, ,8 Πίνακας 3.1: Οι P-τιμές που προκύπτουν από το logrank test για τις διάφορες τιμές του k στο σύνολο δεδομένων καρκίνου του λάρυγγα όταν συνδυαστεί με το αρχικό δείγμα K Μέσος Χρόνος Επιβίωσης Διάμεσος Χρόνος Επιβίωσης Αρχικό δείγμα 5, ,429 4,3 5 5,823 6,2 Πίνακας 3.2: Ποσοτικά χαρακτηριστικά συνόλου δεδομένων καρκίνου του λάρυγγα για αρχικό δείγμα και για k=2 και 5 62

63 Στη συνέχεια εφαρμόσαμε ανάλυση παλινδρόμησης Cox στο σύνολο δεδομένων και από τα τελικά αποτελέσματα προέκυψαν τα εξής συμπεράσματα: Για το αρχικό δείγμα, η σημαντικότερη αιτία στην οποία οφείλεται ο θάνατος του ασθενή είναι το στάδιο της ασθένειας (stage). Για το δείγμα που προέκυψε με αριθμό γειτόνων k=2, οι παράγοντες στους οποίους οφείλεται ο θάνατος του ασθενή είναι το στάδιο της ασθένειας (stage) και η ηλικία του (age). Ενώ για το δείγμα με αριθμό γειτόνων k=5, 7, 10 και 15, η μόνη αιτία φαίνεται να είναι το στάδιο της ασθένειας (stage). Συνοπτικά, τα αποτελέσματα με τις σημαντικότερες μεταβλητές ανά κατηγορία φαίνονται στον παρακάτω Πίνακα 3.3. k Μεταβλητές Significance Αρχικό δείγμα Stage 0 Stage 0 2 Age 0,029 5, 7, 10, 15 Stage 0 Πίνακας 3.3: Οι σημαντικότερες μεταβλητές ανά κατηγορία πλησιέστερων γειτόνων στο σύνολο δεδομένων καρκίνου του λάρυγγα Σύνολα Δεδομένων Μυελού των Οστών Για το σύνολο δεδομένων που μελετά την κατάσταση επιβίωσης των ασθενών που έχουν υποβληθεί σε μεταμόσχευση μυελού των οστών προκύπτουν τα παρακάτω διαγράμματα επιβίωσης. 63

64 Σχήμα 3.9: Διάγραμμα επιβίωσης Kaplan-Meier για το αρχικό σύνολο δεδομένων ασθενών που έχουν υποβληθεί σε μεταμόσχευση μυελού των οστών, με ποσοστό ελλειπουσών τιμών 65% επί του συνόλου στο χρόνο επιβίωσης Από το Σχήμα 3.9 καθώς και από άλλους σχετικούς πίνακες που προέκυψαν επιβεβαιώνεται ότι ο αριθμός των ασθενών που τελικά επέζησε ή τουλάχιστον επέζησε μέχρι το τέλος της έρευνας (λογοκριμένες παρατηρήσεις) ήταν 56, ενώ ο αριθμός των ατόμων που πέθανε, εξαιτίας της συγκεκριμένης ασθένειας είναι 81, αφότου είχε προηγηθεί κάποιο άλλο γεγονός. Επιπλέον, ο μέσος χρόνος επιβίωσης εκτιμήθηκε στις 1.251,034 ημέρες ενώ η διάμεσος, όπως φαίνεται και από το διάγραμμα, στις 641 ημέρες. Τα ίδια συμπεράσματα προκύπτουν όταν γίνεται ανάλυση επιβίωσης για το σύνολο δεδομένων, στο οποίο συμπληρώνονται οι ελλείπουσες τιμές με τη μέθοδο K-NN για 64

65 k=2, 5, 7, 10 και 15.Τα ποσοτικά χαρακτηριστικά του μέσου χρόνου και της διαμέσου φαίνονται στον Πίνακα 3.4. Στη συνέχεια ακολουθεί η σύγκριση των αποτελεσμάτων μεταξύ του αρχικού συνόλου δεδομένων και αυτού που προκύπτει μετά την εφαρμογή της μεθόδου πλησιέστερων γειτόνων στην ανάλυση επιβίωσης για k=2, 5 και 15, για το σύνολο δεδομένων μυελού των οστών καθώς και η ερμηνεία που δίνεται με ανάλογους πίνακες και διαγράμματα. Σχήμα 3.10: Διάγραμμα επιβίωσης Kaplan Meier με k=2, για το σύνολο δεδομένων ασθενών που έχουν υποβληθεί σε μεταμόσχευση μυελού των οστών, με ποσοστό ελλειπουσών τιμών 65% επί του συνόλου στο χρόνο επιβίωσης 65

66 Σχήμα 3.11: Διάγραμμα επιβίωσης Kaplan-Meier με k=5, για το σύνολο δεδομένων ασθενών που έχουν υποβληθεί σε μεταμόσχευση μυελού των οστών, με ποσοστό ελλειπουσών τιμών 65% επί του συνόλου στο χρόνο επιβίωσης Σχήμα 3.12: Διάγραμμα επιβίωσης Kaplan-Meier με k=15, για το σύνολο δεδομένων ασθενών που έχουν υποβληθεί σε μεταμόσχευση μυελού των οστών, με ποσοστό ελλειπουσών τιμών 65% επί του συνόλου στο χρόνο επιβίωσης 66

67 Όπως και προηγουμένως, παρατηρώντας τα παραπάνω σχήματα μπορούμε να διαπιστώσουμε ότι το σύνολο δεδομένων που προκύπτει για μικρό αριθμό γειτόνων (k=2) παρουσιάζει τη μεγαλύτερη ομοιότητα με το αρχικό, καθώς ταυτίζονται σχεδόν απόλυτα, ενώ καθώς αυξάνει ο αριθμός των γειτόνων για k=5 (Σχήμα 3.11) και k=15 (Σχήμα 3.12), εμφανίζονται ολοένα και μεγαλύτερες αποκλίσεις και περισσότερες αλληλεπικαλύψεις μεταξύ των καμπυλών. Σε αντίθεση με το πείραμα στο προηγούμενο σύνολο δεδομένων, εδώ δεν προκύπτουν μεγαλύτεροι χρόνοι επιβίωσης από το φυσιολογικό για τα διάφορα k, όχι μόνο στην πλειοψηφία των δειγμάτων αλλά και γενικότερα όπως φαίνεται από τα διαγράμματα και επιβεβαιώνεται από τον Πίνακα 3.4. Παρατηρώντας το Σχήμα 3.10 οι καμπύλες σχεδόν ταυτίζονται για k=2, ενώ για μεγαλύτερες τιμές του k (k=5 και 15) εμφανίζονται πολύ μικρές αλλά ορατές α- ποκλίσεις σταδιακά. Άρα καταλήγουμε και πάλι στο συμπέρασμα ότι μικρές τιμές του k δίνουν καλύτερες προβλέψεις για το σύνολο δεδομένων. k Μέσος Χρόνος Επιβίωσης Διάμεσος Χρόνος Επιβίωσης (σε ημέρες) (σε ημέρες) Αρχικό δείγμα 1.251, , , , , , , Πίνακας 3.4: Ποσοτικά χαρακτηριστικά συνόλου δεδομένων καρκίνου του λάρυγγα για αρχικό δείγμα και για k=2, 5, 7, 10 και 15 67

68 Και σε αυτήν την περίπτωση το log-rank τεστ (Πίνακας 3.5) που εφαρμόστηκε για όλα τα k (2,5 7, 10 και 15), έδειξε ότι για τα δύο γραφήματα δεν προκύπτει σημαντικότητα στην διαφορά μεταξύ των κατανομών επιβίωσής τους (sig.> 0,05). Αυτό πρακτικά ερμηνεύεται ότι οι δύο ομάδες που συγκρίνονται είναι σχετικά όμοιες και με μεγάλη πιθανότητα προέρχονται και από τον ίδιο πληθυσμό, κάτι το οποίο είναι αληθές. k (συνδυασμένο με το αρχικό δείγμα) Significance (Σημαντικότητα) 2 0,95 5 0, , , ,669 Πίνακας 3.5: Οι P-τιμές που προκύπτουν από το logrank test για τις διάφορες τιμές του k στο σύνολο δεδομένων μυελού των οστών όταν συνδυαστεί με το αρχικό δείγμα Στη συνέχεια εφαρμόσαμε ανάλυση παλινδρόμησης Cox στο σύνολο δεδομένων και από τα τελικά αποτελέσματα προέκυψαν τα εξής συμπεράσματα: Για το αρχικό δείγμα, οι σημαντικότεροι παράγοντες που επηρέασαν το θάνατο των ασθενών βρέθηκαν ότι είναι: (α) ο χρόνος επιβίωσης των ασθενών απαλλαγμένοι από ασθένειες (Disease_Free_Survival_Time) με δείκτη σημαντικότητας sig.=0. (β) ο δείκτης υποτροπής, δηλαδή εάν ο ασθενής βρίσκεται σε υποτροπή ή είναι απαλλαγμένος από ασθένειες (Relapse_Indicator) με sig.=0. 68

69 (γ) ο χρόνος μέχρι την οξεία αντίδραση του μοσχεύματος κατά του ξενιστή (Time_to_Acute_Graft_Versus_Host_Disease) με sig.=0 (δ) ο δείκτης για την οξεία αντίδραση του μοσχεύματος κατά του ξενιστή (Acute_Graft_Versus_Host_Disease_Indicator) με sig.=0,001 (ε) ο χρόνος μέχρι την εμφάνιση χρόνιας αντίδρασης του μοσχεύματος κατά του ξενιστή (Time_to_Chronic_Graft_Versus_Host_Disease) με sig.=0 (στ) ο δείκτης για τη χρόνια αντίδραση του μοσχεύματος κατά του ξενιστη (Chronic_Graft_Versus_Host_Disease_Indicator) με sig.=0 Για τα δείγματα που προκύπτουν για k=2, 5, 10 και 15, οι σημαντικότεροι παράγοντες θανάτου είναι: (α) ο χρόνος επιβίωσης των ασθενών απαλλαγμένοι από ασθένειες (Disease_Free_Survival_Time) με sig.=0 (β) ο δείκτης υποτροπής, δηλαδή εάν ο ασθενής βρίσκεται σε υποτροπή ή είναι απαλλαγμένος από ασθένειες (Relapse_Indicator) με sig.=0 (γ) ο χρόνος μέχρι την εμφάνιση χρόνιας αντίδρασης του μοσχεύματος κατά του ξενιστή (Time_to_Chronic_Graft_Versus_Host_Disease) με sig.=0 (δ) ο δείκτης για τη χρόνια αντίδραση του μοσχεύματος κατά του ξενιστή (Chronic_Graft_Versus_Host_Disease_Indicator) με sig.=0. Επιπλέον, για το δείγμα για k=7, προκύπτουν 5 σημαντικοί παράγοντες θανάτου: (α) ο χρόνος επιβίωσης των ασθενών απαλλαγμένοι από ασθένειες (Disease_Free_Survival_Time) με sig.=0 69

70 (β) ο δείκτης υποτροπής, δηλαδή εάν ο ασθενής βρίσκεται σε υποτροπή ή είναι απαλλαγμένος από ασθένειες (Relapse_Indicator) με sig.=0,001 (γ) ο χρόνος μέχρι την εμφάνιση χρόνιας αντίδρασης του μοσχεύματος κατά του ξενιστή (Time_to_Chronic_Graft_Versus_Host_Disease) με sig.=0 (δ) ο δείκτης για τη χρόνια αντίδραση του μοσχεύματος κατά του ξενιστή (Chronic_Graft_Versus_Host_Disease_Indicator) με sig.=0 (ε) ο χρόνος μέχρι την επιστροφή των αιμοπεταλίων σε φυσιολογικά επίπεδα (Time_To_Return_of_Platelets_to_Normal_Levels) με sig.=0,026. Τέλος, οι καμπύλες επιβίωσης που προκύπτουν από την Kaplan-Meier και τη μέθοδο Cox για τα αντίστοιχα σύνολα δεδομένων για το διάφορο αριθμό γειτόνων k αλλά και το αρχικό σύνολο, είναι παρόμοιες και σχεδόν ταυτίζονται μεταξύ τους, το οποίο πρακτικά σημαίνει ότι το μοντέλο είναι επαρκές. Όπως και στο προηγούμενο σύνολο δεδομένων, οι καμπύλες επιβίωσης που προκύπτουν από την Kaplan-Meier και τη μέθοδο Cox για τα αντίστοιχα σύνολα δεδομένων για το διάφορο αριθμό γειτόνων k αλλά και το αρχικό σύνολο είναι παρόμοιες και σχεδόν ταυτίζονται μεταξύ τους, το οποίο πρακτικά σημαίνει ότι το μοντέλο είναι επαρκές. 70

71 ΚΕΦΑΛΑΙΟ 4 Σύγκριση της Μεθόδου Κ-ΝΝ με τις υπόλοιπες για την απόδοση τιμών σε ελλείποντα σύνολα δεδομένων Σε όλα τα πειράματα που έχουν γίνει, η απόδοση τιμών με τον αλγόριθμο K-NN αποδεικνύεται ότι είναι μια γρήγορη μέθοδος για τα ελλείποντα δεδομένα. Ακόμα και όταν εφαρμόζεται σε μεγάλα σύνολα δεδομένων, η απόδοση του αλγορίθμου ολοκληρώνεται μέσα σε λίγα δευτερόλεπτα. Αυτό αποδεικνύει καθαρά ότι ο αλγόριθμος K-NN είναι από τους πιο απλούς, εάν όχι ο πιο απλός μεταξύ των διαθέσιμων αλγορίθμων στη μηχανική μάθηση. Τα πειράματα έδειξαν επίσης ότι η απόδοση τιμών στον K-NN δουλεύει καλύτερα με μικρό αριθμό γειτόνων, ή k αριθμό. Η απόδοση των πειραμάτων για k=2 και k=5 ήταν καλύτερη από αυτήν για k=10 και k=15 στο σύνολο δεδομένων καρκινώματος και μυελού των οστών. Το ίδιο ισχύει και για k=2 έναντι k=5 στο σύνολο δεδομένων καρκίνου του λάρυγγα. Η διαπίστωση αυτή επιβεβαιώνει τη γενική γνώση που υπάρχει στην ερευνητική κοινότητα για τα χαρακτηριστικά του K-NN, καθώς έχει διαπιστωθεί ότι ο K-NN αποδίδει σε γενικές γραμμές ικανοποιητικά όταν ο k είναι μικρός αριθμός. Συγκριτικά, με τις μεθόδους που έχουν περιγραφεί, για το συνδυασμό της α- νάλυσης επιβίωσης με τη μέθοδο πλησιέστερων γειτόνων, ως μέθοδος απόδοσης ελλειπόντων δεδομένων, η INI εμφανίζει την καλύτερη P-τιμή για το σύνολο δεδομένων καρκινώματος. Έπειτα ακολουθεί η PLS, [16] και η BPCA. 71

72 Δυστυχώς, η K-NN αποδείχτηκε η χειρότερη, μεταξύ όλων των άλλων μεθόδων πλην της BPCA όσον αφορά το σύνολο δεδομένων για το καρκίνωμα αλλά και για άλλα σύνολα δεδομένων που έχουν ερευνηθεί στη διεθνή βιβλιογραφία. Συνοπτικά, η μέθοδος K-NN δεν αποδείχτηκε αρκετά καλή όταν συγκρίνεται με άλλες μεθόδους όπως οι INI, BPCA και PLS. Σε γενικές γραμμές, η απόδοση τιμών με τη χρήση του αλγορίθμου K-NN α- ποδείχτηκε γρήγορος και σχετικά καλός τρόπος για την απόδοση δεδομένων στο σύνολο δεδομένων καρκινώματος. Πιο συγκεκριμένα και μεταξύ όλων των άλλων μεθόδων, η μέθοδος K-NN είναι η γρηγορότερη μέθοδος απόδοσης. Ακόμα και στα μεγάλα σύνολα δεδομένων, ο χρόνος υπολογισμού ήταν μόλις λίγα δευτερόλεπτα. Παρά το γεγονός αυτό, η μέθοδος K-NN δεν εκτελέστηκε σωστά στην ανάλυση επιβίωσης. Ένα πρότυπο που αναδείχτηκε, δείχνει ότι τα μικρότερα σύνολα δεδομένων αποδείχτηκαν καλύτερα. Ένα ακόμα συμπέρασμα που προκύπτει είναι ότι η μέθοδος K-NN δεν αποδίδει ικανοποιητικά για πολύ μεγάλα (περίπτωση καρκινώματος για μικροσυστοιχίες DNA) και πολύ μικρά δείγματα δεδομένων ( περίπτωση καρκίνου του λάρυγγα). Η μέθοδος INI αποδεικνύεται η καλύτερη, καθώς εμφανίζεται πραγματικά αποδοτική στις P-τιμές αλλά και η καμπύλη Kaplan-Meier απέδειξε το ίδιο. Η μέθοδος διαθέτει τη μεγαλύτερη ακρίβεια μεταξύ των υπολοίπων μεθόδων. Αυτή η καλή ακρίβεια κυρίως οφείλεται στο συνδυασμό πλεονεκτημάτων του αλγορίθμου πλησιέστερου γείτονα και του αλγορίθμου ελαχίστων τετραγώνων. 72

73 Το μόνο μειονέκτημά της παρατηρείται σε περιγραφικά μεγάλα σύνολα δεδομένων, καθώς χρειάζεται ισχυρό «υπολογιστικό» υλικό, διότι δεν υπάρχει αρκετή μνήμη να διατηρήσει τον πίνακα συστοιχίας και το οποίο θα οδηγήσει σε παραβίαση μνήμης. Παρά το γεγονός αυτό, η μέθοδος INI συστήνεται λόγω του σημαντικού πλεονεκτήματος που εμφανίζει συγκρινόμενη με άλλες μεθόδους. Σχήμα 4.1: Η καμπύλη Kaplan-Meier για την INI στο σύνολο δεδομένων καρκινώματος, Ting (2010) Η τρίτη μέθοδος είναι η BPCA. Είναι μια μέση μέθοδος βαθμολόγησης για το σύνολο δεδομένων του καρκινώματος και δεν ξεπερνάει σε απόδοση εκτέλεσης την K-NN. Στο Σχήμα 4.2 φαίνονται τα αποτελέσματα που προέκυψαν όταν η BPCA εφαρμόστηκε σε σύνολο δεδομένων για το καρκίνωμα. 73

74 Σχήμα 4.2: Η καμπύλη Kaplan-Meier για το BPCA στο σύνολο δεδομένων καρκινώματος, Ting (2010) Ένα θετικό στοιχείο της BPCA είναι ότι δεν χρειάζεται να καθοριστούν οι παράμετροί της εκ των προτέρων, καθώς ο αλγόριθμος από μόνος του καθορίζει την κατάλληλη διάσταση PCA. Ωστόσο αυτή η μέθοδος είναι δύσκολη στον υπολογισμό. Για μεγαλύτερα σύνολα δεδομένων χρειάστηκαν 6 ημέρες έτσι ώστε να ολοκληρωθεί η εκτέλεση του υπολογισμού. Ένα άλλο μειονέκτημα της BPCA είναι το υψηλό ποσοστό σφαλμάτων απόδοσης όταν το σύνολο δεδομένων περιλαμβάνει μόνο ένα μικρό αριθμό δειγμάτων. Η τελευταία μέθοδος είναι η PLS, [16]. Αυτή η μέθοδος είναι η δεύτερη καλύτερη μαζί με την INI σε όρους P-τιμών. Όπως συμβαίνει και στις περισσότερες μεθόδους, η PLS δεν αποδίδει αποτελεσματικά σε ένα πραγματικά μεγάλο σύνολο δεδομένων. Στο Σχήμα 4.3 φαίνονται τα αποτελέσματα που προέκυψαν όταν η PLS ε- φαρμόστηκε στο σύνολο δεδομένων καρκινώματος, [16]. 74

75 Σχήμα 4.3: Η καμπύλη Kaplan-Meier για το PLS στο σύνολο δεδομένων καρκινώματος 75

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Τυχαία μεταβλητή (τ.μ.)

Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) είναι μια συνάρτηση X ( ) με πεδίο ορισμού το δειγματικό χώρο Ω του πειράματος και πεδίο τιμών ένα υποσύνολο πραγματικών αριθμών που συμβολίζουμε συνήθως

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής Κύρια σημεία Ερευνητική Μεθοδολογία και Μαθηματική Στατιστική Απόστολος Μπουρνέτας Τμήμα Μαθηματικών ΕΚΠΑ Αναζήτηση ερευνητικού θέματος Εισαγωγή στην έρευνα Ολοκλήρωση ερευνητικής εργασίας Ο ρόλος των

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική Ενότητα 3: Έλεγχοι υποθέσεων - Διαστήματα εμπιστοσύνης Δρ.Ευσταθία Παπαγεωργίου, Αναπληρώτρια Καθηγήτρια Οι ερευνητικές υποθέσεις Στην έρευνα ελέγχουμε

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 2: Έλεγχοι Υποθέσεων

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0 ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής Δεσμευμένη αξιοπιστία Η δεσμευμένη αξιοπιστία R t είναι η πιθανότητα το σύστημα να λειτουργήσει για χρονικό

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

«Εφαρμογή της ανάλυσης επιβίωσης για την αξιολόγηση της θνησιμότητας των δέντρων στο δάσος Ελατιάς Δράμας»

«Εφαρμογή της ανάλυσης επιβίωσης για την αξιολόγηση της θνησιμότητας των δέντρων στο δάσος Ελατιάς Δράμας» Δημοκρίτειο Πανεπιστήμιο Θράκης Τμήμα Δασολογίας Μεταπτυχιακή διατριβή «Εφαρμογή της ανάλυσης επιβίωσης για την αξιολόγηση της θνησιμότητας των δέντρων στο δάσος Ελατιάς Δράμας» Αποστολοπούλου Ευαγγελία

Διαβάστε περισσότερα

Ανάλυση επιβίωσης (survival analysis)

Ανάλυση επιβίωσης (survival analysis) Hippokratia 2014 Ανάλυση επιβίωσης (survival analysis) Κων/νος Α. Τουλής, MD MRes MSc PhD Ενδοκρινολόγος, 424 ΓΣΝΕ Τι είναι η ανάλυση επιβίωσης; Η ανάλυση επιβίωσης (survival analysis) είναι μια ομάδα

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Διάγνωση και προσυμπτωματικός έλεγχος

Διάγνωση και προσυμπτωματικός έλεγχος Διάγνωση και προσυμπτωματικός έλεγχος Χρήστος Α. Βενέτης MD, MSc Μαιευτήρας- Γυναικολόγος Υποψήφιος Διδάκτωρ Α.Π.Θ. Μονάδα Ανθρώπινης Αναπαραγωγής Α Μαιευτική- Γυναικολογική Κλινική Ιατρική Σχολή, Α.Π.Θ.

Διαβάστε περισσότερα

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ.

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ. ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό 2016 2017 Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ. Πέτρος Πιστοφίδης Εισαγωγή

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) 4. ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) Η μέθοδος της βηματικής παλινδρόμησης (stepwise regression) είναι μιά άλλη μέθοδος επιλογής ενός "καλού" υποσυνόλου ανεξαρτήτων μεταβλητών.

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2 ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΛΗΘΥΣΜΟΙ ΔΕΙΓΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΕΔΟΜΕΝΩΝ Περιγραφική Στατιστική Με τις στατιστικές μεθόδους επιδιώκεται: - η συνοπτική αλλά πλήρης και κατατοπιστική παρουσίαση των ευρημάτων μιας

Διαβάστε περισσότερα

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή Γεώργιος Ζιούτας Άδειες

Διαβάστε περισσότερα

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Σχέση μεταξύ εμβολίων και αυτισμού Θέση ύπνου των βρεφών και συχνότητα εμφάνισης του

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (# 252) Ε ΕΞΑΜΗΝΟ 9 η ΕΙΣΗΓΗΣΗ ΣΗΜΕΙΩΣΕΙΣ ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΛΙΓΗ ΘΕΩΡΙΑ Στην προηγούμενη διάλεξη μάθαμε ότι υπάρχουν διάφορες μορφές έρευνας

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες Είπαμε ότι γενικά τα συστηματικά σφάλματα που υπεισέρχονται σε μια μέτρηση ενός φυσικού μεγέθους είναι γενικά δύσκολο να επισημανθούν και να διορθωθούν.

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ Συνδυασμένη χρήση μοντέλων προσομοίωσης βελτιστοποίησης. Η μέθοδος του μητρώου μοναδιαίας απόκρισης Νικόλαος

Διαβάστε περισσότερα

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,

Διαβάστε περισσότερα

Έρευνα Μάρκετινγκ Ενότητα 5

Έρευνα Μάρκετινγκ Ενότητα 5 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΨΥΧΟΛΟΓΙΚΗ ΕΤΑΙΡΕΙΑ ΒΟΡΕΙΟΥ ΕΛΛΑΔΟΣ (ΨΕΒΕ) ΗΜΕΡΙΔΑ Προχωρημένες μέθοδοι ανάλυσης ποσοτικών δεδομένων στις επιστήμες της συμπεριφοράς

ΨΥΧΟΛΟΓΙΚΗ ΕΤΑΙΡΕΙΑ ΒΟΡΕΙΟΥ ΕΛΛΑΔΟΣ (ΨΕΒΕ) ΗΜΕΡΙΔΑ Προχωρημένες μέθοδοι ανάλυσης ποσοτικών δεδομένων στις επιστήμες της συμπεριφοράς ΨΥΧΟΛΟΓΙΚΗ ΕΤΑΙΡΕΙΑ ΒΟΡΕΙΟΥ ΕΛΛΑΔΟΣ (ΨΕΒΕ) ΗΜΕΡΙΔΑ Προχωρημένες μέθοδοι ανάλυσης ποσοτικών δεδομένων στις επιστήμες της συμπεριφοράς Σάββατο 8 Δεκεμβρίου 2018 9:00-13.30 Αμφιθέατρο Κεντρικής Βιβλιοθήκης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

3. Προσομοίωση ενός Συστήματος Αναμονής.

3. Προσομοίωση ενός Συστήματος Αναμονής. 3. Προσομοίωση ενός Συστήματος Αναμονής. 3.1. Διατύπωση του Προβλήματος. Τα συστήματα αναμονής (queueing systems), βρίσκονται πίσω από τα περισσότερα μοντέλα μελέτης της απόδοσης υπολογιστικών συστημάτων,

Διαβάστε περισσότερα

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Γαροφαλάκης Ιωάννης Πολυτεχνική Σχολή Τμήμα Μηχ/κών Η/Υ & Πληροφορικής Περιεχόμενα ενότητας Εισαγωγή Συλλογή

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Σεμινάριο Τελειοφοίτων. 6- Εμπειρική μέτρηση & ανάλυση

Σεμινάριο Τελειοφοίτων. 6- Εμπειρική μέτρηση & ανάλυση Σεμινάριο Τελειοφοίτων 6- Εμπειρική μέτρηση & ανάλυση Πόσο συχνά; Πόσο μεγάλο; Πόσο αντιπροσωπευτικό; Πως αλληλεπιδρούν οι μεταβλητές X και Y; Ποια είναι η αιτιώδης συνάφεια μεταξύ των φαινομένων Α και

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ. Χρηματοδότηση Το παρόν

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη ΕΚΔΟΣΕΙΣ ΚΕΛΑΦΑ 59 Θέμα 1 ο (ΜΑΪΟΣ 004, ΜΑΪΟΣ 008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Έχουμε f (x+h) - f (x) = c - c = 0 και για h 0 είναι f (x + h) - f (x) 0 m

Διαβάστε περισσότερα

6. Στατιστικές μέθοδοι εκπαίδευσης

6. Στατιστικές μέθοδοι εκπαίδευσης 6. Στατιστικές μέθοδοι εκπαίδευσης Μία διαφορετική μέθοδος εκπαίδευσης των νευρωνικών δικτύων χρησιμοποιεί ιδέες από την Στατιστική Φυσική για να φέρει τελικά το ίδιο αποτέλεσμα όπως οι άλλες μέθοδοι,

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΣΤΡΑΤΗΓΙΚΗ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ Αθανάσιος Νταραβάνογλου Διπλωματική

Διαβάστε περισσότερα

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων Παράδειγμα Μας δίνονται τα παρακάτω δεδομένα που αντιπροσωπεύουν τις τιμές πίεσης σε ατμόσφαιρες

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Μεταπτυχιακή Διπλωματική Εργασία. Κ. Αλεξανδρής Αν. Καθηγητής, ΤΕΦΑΑ, ΑΠΘ

Μεταπτυχιακή Διπλωματική Εργασία. Κ. Αλεξανδρής Αν. Καθηγητής, ΤΕΦΑΑ, ΑΠΘ Μεταπτυχιακή Διπλωματική Εργασία Κ. Αλεξανδρής Αν. Καθηγητής, ΤΕΦΑΑ, ΑΠΘ Μεταπτυχιακή Διπλωματική Εργασία Οδηγός Εκπόνησης Μεταπτυχιακής Εργασία ς Βασικά Σημεία Καθορισμός Θέματος Επιλογή Επιβλέποντα Πρωτογενή

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ Σε αντίθεση με την διακριτή τυχαία μεταβλητή, μία συνεχής τυχαία μεταβλητή παίρνει μη-αριθμήσιμο (συνεχές) πλήθος τιμών. Δεν μπορούμε να καταγράψουμε το σύνολο των τιμών

Διαβάστε περισσότερα

ΜΕΡΟΣ ΙΙΙ: ΘΕΩΡΙΑ ΠΑΡΑΓΩΓΟΥ ΚΑΙ ΠΡΟΣΦΟΡΑΣ

ΜΕΡΟΣ ΙΙΙ: ΘΕΩΡΙΑ ΠΑΡΑΓΩΓΟΥ ΚΑΙ ΠΡΟΣΦΟΡΑΣ ΜΕΡΟΣ ΙΙΙ: ΘΕΩΡΙΑ ΠΑΡΑΓΩΓΟΥ ΚΑΙ ΠΡΟΣΦΟΡΑΣ Τεχνολογία και Συναρτήσεις Παραγωγής -H πλευρά της προσφοράς στην οικονομία μελετάει τη διαδικασία παραγωγής των αγαθών και υπηρεσιών που καταναλώνονται από τα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας Διανύσματα Καστοριά,

Διαβάστε περισσότερα

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ 1. Έστω συνάρτηση ζήτησης με τύπο Q = 200 4P. Να βρείτε: α) Την ελαστικότητα ως προς την τιμή όταν η τιμή αυξάνεται από 10 σε 12. 1ος τρόπος Αν P 0 10 τότε Q 0 200 410

Διαβάστε περισσότερα

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ ΜΕΡΟΣ ΙΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ 36 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ Πολλές από τις αποφάσεις

Διαβάστε περισσότερα