ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΝΑΛΟΓΙΣΤΙΚΩΝ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΙΓΑΙΟΥ

Σχετικά έγγραφα
Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αναλυτική Στατιστική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34


Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Μέθοδος μέγιστης πιθανοφάνειας

ΔΙΑΓΝΩΣΤΙΚΈΣ ΔΟΚΙΜΑΣΊΕΣ

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Στατιστική. Εκτιμητική

9. Παλινδρόμηση και Συσχέτιση

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

Γ. Πειραματισμός - Βιομετρία

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Το Κεντρικό Οριακό Θεώρημα

Εισόδημα Κατανάλωση

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ Οι συντεταγμένες ενός σημείου Απόλυτη τιμή...14

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Δειγματοληψία στην Ερευνα. Ετος

ΑΝΑΛΥΣΗ ΕΥΑΙΣΘΗΣΙΑΣ Εισαγωγή

Γ. Πειραματισμός Βιομετρία

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Το Κεντρικό Οριακό Θεώρημα

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

1.2 Δραστηριότητα: Εισαγωγή στο όριο ακολουθίας

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

( ) ΘΕΜΑ 1 κανονική κατανομή

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

( 1)( 3) ( ) det( ) (1 )( 1 ) ( 2)( 2) pl( ) det( L ) (5 )( 7 ) ( 1) ( ) det( M ) (1 )(1 )

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

Εισαγωγή στη Στατιστική

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Το Κεντρικό Οριακό Θεώρημα

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

Απλή Γραμμική Παλινδρόμηση II

Στατιστική Συμπερασματολογία

Μέθοδος μέγιστης πιθανοφάνειας

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Χ. Εμμανουηλίδης, 1

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

3. Κατανομές πιθανότητας

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Value at Risk (VaR) και Expected Shortfall

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Ιωάννης Σ. Μιχέλης Μαθηματικός

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ-ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ. ΜΕΡΟΣ Α : Άλγεβρα. Κεφάλαιο 2 ο (Προτείνεται να διατεθούν 12 διδακτικές ώρες) Ειδικότερα:

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ» ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΠΑΝΑΛΗΠΤΙΚΗ ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ 5 Ιουλίου 2009

ΛΟΗ Β. PDF created with pdffactory trial version

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Transcript:

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΝΑΛΟΓΙΣΤΙΚΩΝ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΙΓΑΙΟΥ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕ ΘΕΜΑ «ΛΕΙΑΝΣΗ ΕΠΙΦΑΝΕΙΩΝ ROC ΜΕ ΧΡΗΣΗ ΠΥΡΗΝΩΝ» ΕΙΣΗΓΗΤΡΙΑ: ΛΙΑΠΑΤΗ ΑΦΡΟΔΙΤΗ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ΝΑΚΑΣ ΧΡΗΣΤΟΣ ΣΑΜΟΣ 8

- -

- 3 -

ΠΕΡΙΕΧΟΜΕΝΑ: Κεφάλαιο πρώτο. Εισαγωγή.6 Κεφάλαιο δεύτερο. Μέτρα διαγνωστικής ακρίβειας...8. Ευαισθησία και ειδικότητα 8. Συνδυασμένα μέτρα ευαισθησίας και ειδικότητας...3 Η καμπύλη ROC..4.4 Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC.6.5 Ευαισθησία σε σταθερό FPR...8.6 Μερικό εμβαδόν κάτω από την καμπύλη ROC...8.7 Λόγος πιθανοφανειών..9 Κεφάλαιο τρίτο 3 Εκτίμηση των μέτρων διαγνωστικής ακρίβειας... 3. Δίτιμα δεδομένα... 3.. Ευαισθησία και ειδικότητα.. 3.. Ο λόγος πιθανοφανειών (LR)..3 3..3 Ο σχετικός λόγος συμπληρωματικών πιθανοτήτων (odds ratio)...4 3. Διατεταγμένα δεδομένα..5 3.. Λείανση καμπύλης ROC (Το δικανονικό μοντέλο).5 3.. Εκτίμηση ευαισθησίας για σταθερό FPR 8 3..3 Το εμβαδόν και το μερικό εμβαδόν κάτω από την καμπύλη ROC (παραμετρικό μοντέλο) 8 3..4 Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC (μη παραμετρικό μοντέλο).3 3..5 Τα εκφυλισμένα δεδομένα..3 3.3 Συνεχή δεδομένα.34 3.3. Η εμπειρική καμπύλη ROC.34 3.3. Λείανση καμπυλών ROC με τη χρήση παραμετρικών μεθόδων.36 3.3.3 Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC (παραμετρικές και μη παραμετρικές μέθοδοι)...37-4 -

Κεφάλαιο τέταρτο 4 Λείανση καμπύλης ROC με χρήση πυρήνων..38 4. Λείανση καμπυλών ROC με χρήση μη παραμετρικών μεθόδων 38 4. Επιλογή παραμέτρου για τη λείανση μιας συνάρτησης κατανομής...4 4.3 Κριτήριο βελτιστοποίησης και βέλτιστες παράμετροι λείανσης...4 4.4 Παράμετροι λείανσης για λείανση καμπύλης ROC 44 4.5 Διαστήματα εμπιστοσύνης για καμπύλες ROC..46 Κεφάλαιο πέμπτο 5 Επιφάνειες και υπερεπιφάνειες ROC...48 5. Επιφάνειες ROC με συνεχείς μετρήσεις..48 5. Λείανση επιφανειών ROC με χρήση πυρήνων...5 5.3 Κώδικας S-PLUS για λείανση επιφανειών ROC 5 5.4 Υπερεπιφάνειες ROC...56 Βιβλιογραφία 58-5 -

Κεφάλαιο : Εισαγωγή Κατά την τελευταία εικοσαετία, μια πλειάδα ερευνών που πραγματοποιήθηκαν πάνω σε θέματα που αφορούν στη βιοστατιστική, συντέλεσαν στην ανάπτυξη νέων στατιστικών μεθόδων. Η πορεία που ακολούθησαν οι ερευνητές, τα σφάλματα στα οποία υπέπεσαν και η ανάγκη διόρθωσης τους, έπαιξαν καθοριστικό ρόλο στον επαναπροσδιορισμό της οπτικής της διαγνωστικής ιατρικής. Πολλές από τις μελέτες επανεξετάστηκαν και οι τρόποι σχεδιασμού και ανάλυσής τους αναθεωρήθηκαν. Ένα από τα ζητήματα που απασχόλησαν την επιστημονική κοινότητα ήταν οι διαγνωστικοί έλεγχοι, ο ρόλος των οποίων είναι κυρίαρχος στις αποφάσεις που λαμβάνονται για την μέριμνα υγείας. Οι ειδικοί διαπίστωσαν ότι μέσα από τους ελέγχους αυτούς μπορούσαν να κατανοήσουν το μηχανισμό και τη φύση μιας νόσου (Mc Neil και Adelstei 976), να συλλέξουν πληροφορίες για τους ασθενείς και να επηρεάσουν τελικά τους ασφαλιστικούς φορείς προς όφελος του κοινωνικού συνόλου (Sox, Jr. et al. 989). Η διαπίστωση αυτή προσανατόλισε τις έρευνες τόσο στην εύρεση μεθόδων που θα εξασφαλίζουν την αποτελεσματικότητα των ελέγχων όσο και στη διαμόρφωση ενός θεωρητικού πλαισίου για τη σωστή ερμηνεία των αποτελεσμάτων των ελέγχων. Με δεδομένο ότι τα αποτελέσματα των διαγνωστικών ελέγχων είναι αυτά που καθοδηγούν τους ασφαλιστικούς φορείς σε αποφάσεις σχετικές με το είδος της θεραπείας που θα πρέπει να ακολουθήσει ένας ασθενής, είναι σημαντικό ένας έλεγχος να έχει όσο το δυνατόν μεγαλύτερη ακρίβεια στο διαχωρισμό υγιών-ασθενών. Παρ όλα αυτά, η ποιότητα του ελέγχου δεν καθορίζεται μόνο από τη διαχωριστική του ικανότητα. Εξίσου σημαντικό ρόλο παίζει και ο τρόπος με τον οποίο θα ερμηνευθεί από τους ειδικούς, το πλήθος των πληροφοριών που θα δώσει για μία νόσο, τα τεχνικά χαρακτηριστικά του μηχανολογικού εξοπλισμού που θα αξιοποιηθούν για την πραγματοποίηση του, και το όποιο οικονομικό ή κοινωνικό αντίκτυπο έχει ένα ενδεχόμενο σφάλμα. Προκειμένου να αποσαφηνιστούν οι προϋποθέσεις κάτω από τις οποίες ένας έλεγχος θα θεωρείται αποτελεσματικός, το 99 προτάθηκε ένα ιεραρχικό μοντέλο 6 επιπέδων (Fryback και Thorbury), σύμφωνα με το οποίο, ένας έλεγχος θα πρέπει αρχικά να είναι «τεχνικά αποτελεσματικός». - 6 -

Η «τεχνική» αποτελεσματικότητα ορίζεται από χαρακτηριστικά όπως, μεταξύ άλλων, η ανάλυση και η σαφήνεια εικόνας ενός ακτινολογικού ελέγχου. Σε ένα δεύτερο επίπεδο, ο ερευνητής θα πρέπει να εξετάζει τη «διαγνωστική ακρίβεια» του ελέγχου, μέτρα της οποίας είναι η ευαισθησία, η ειδικότητα και η καμπύλη ROC. Στη συνέχεια θα πρέπει να αποτελέσει αντικείμενο εξέτασης η αποτελεσματικότητα «διαγνωστικής σκέψης», που είναι δυνατόν να μετρηθεί από τη διαφορά της πιθανότητας ύπαρξης της νόσου, που εκτιμήθηκε από τους γιατρούς πριν τη γνωστοποίηση των αποτελεσμάτων του ελέγχου, μείον την πιθανότητα ύπαρξης της νόσου μετά τη γνωστοποίηση των αποτελεσμάτων. Εξίσου σημαντικές για έναν έλεγχο είναι η «θεραπευτική» αποτελεσματικότητα και η αποτελεσματικότητα της «έκβασης του ασθενούς», εκ των οποίων η πρώτη μετράται από το ποσοστό του χρόνου που χρειάζεται για το σχεδιασμό της θεραπείας πριν ο διαγνωστικός έλεγχος αλλάξει από τα αποτελέσματα, ενώ η δεύτερη σχετίζεται με τον αριθμό των θανάτων που απεφεύχθησαν και την αλλαγή στην ποιότητα ζωής των ασθενών. Στην κορυφή του ιεραρχικού μοντέλου βρίσκεται η «κοινωνική» αποτελεσματικότητα, που αντανακλά το βαθμό ανταπόκρισης του ελέγχου στις κοινωνικές απαιτήσεις (το κόστος του όπως αυτό μετράται από κοινωνική άποψη). Προκειμένου ένας διαγνωστικός έλεγχος να χαρακτηριστεί ως αποτελεσματικός, θα πρέπει να κριθεί αποτελεσματικός στο σύνολο των 6 επιπέδων του ιεραρχικού αυτού μοντέλου. Η παρούσα εργασία επικεντρώνεται στο επίπεδο που αφορά στη διαγνωστική ακρίβεια ενός ελέγχου. Ειδικότερα, παρουσιάζονται τα διάφορα μέτρα διαγνωστικής ακρίβειας και οι μέθοδοι εκτίμησης τους με έμφαση στην παραγωγή λείων καμπυλών και επιφανειών ROC με χρήση της μεθόδου των πυρήνων. Η πρακτική εφαρμογή των λείων καμπυλών και επιφανειών ROC οδηγεί στη διεξαγωγή συμπερασμάτων σχετικά με τη διακριτική ικανότητα ενός ελέγχου που διαχωρίζει τους ασθενείς σε δύο ή τρεις κατηγορίες αντίστοιχα. - 7 -

Κεφάλαιο : Μέτρα Διαγνωστικής Ακρίβειας Με σκοπό να εξεταστεί ένας έλεγχος ως προς την αποτελεσματικότητα διαγνωστικής ακρίβειας, θα πρέπει να παρουσιαστούν τα διάφορα μέτρα αυτής. Ειδικότερα, με τον όρο «εγγενής ακρίβεια» εκφράζεται η ικανότητα του ελέγχου να εκτελεί σωστά τον διαχωρισμό υγιών-ασθενών. Ως μέθοδος μέτρησης της εγγενούς ακρίβειας εφαρμόζεται η σύγκριση των αποτελεσμάτων του ελέγχου με την πραγματική κατάσταση του ασθενούς. Για την υλοποίηση της σύγκρισης αυτής χρησιμοποιείται ένας έλεγχος αναφοράς, ένας έλεγχος δηλαδή που δε σχετίζεται με αυτόν του οποίου την ακρίβεια θέλουμε να εξετάσουμε. Ας υποθέσουμε για παράδειγμα ότι εφαρμόζεται ένας έλεγχος ο οποίος μας δίνει πληροφορίες σχετικά με την παρουσία καλοήθους ή κακοήθους όγκου. Στην περίπτωση αυτή θα μπορούσε να χρησιμοποιηθεί ως έλεγχος αναφοράς μια έκθεση βιοψίας. Η σύγκριση των ευρημάτων της βιοψίας με τα αποτελέσματα του ελέγχου θα οδηγήσει στον υπολογισμό της εγγενούς ακρίβειας. Αν τα εξαγόμενα από μια τέτοια σύγκριση συγκλίνουν στο συμπέρασμα ότι ο διαγνωστικός έλεγχος έχει καλό επίπεδο εγγενούς ακρίβειας, θα πρέπει να αξιολογηθεί και σε συγκεκριμένες κλινικές καταστάσεις, να μελετηθεί δηλαδή η συμπεριφορά του ελέγχου λαμβάνοντας υπόψη τη φύση της νόσου, τα χαρακτηριστικά των ασθενών και τις πιθανές επιπτώσεις λανθασμένης διάγνωσης.. Ευαισθησία και ειδικότητα Δύο βασικά μεγέθη διαγνωστικής ακρίβειας είναι η ευαισθησία και η ειδικότητα. Ευαισθησία (Se) ενός ελέγχου είναι η ικανότητά του να ανιχνεύσει τους πάσχοντες από ένα νόσημα, ενώ ειδικότητα (Sp) είναι αντίστοιχα η ικανότητά του να ανιχνεύσει τους μη πάσχοντες. Προκειμένου να οριστούν πληρέστερα τα παραπάνω μέτρα, θα ονομάσουμε θετικά τα αποτελέσματα που δηλώνουν παρουσία της νόσου και αρνητικά αυτά που δηλώνουν απουσία της νόσου και θα τα συμβολίσουμε με Τ= και Τ= αντίστοιχα. - 8 -

Επιπλέον, θα συμβολίσουμε με D την πραγματική κατάσταση των ανθρώπων που θα υποβληθούν στον διαγνωστικό έλεγχο, όπου με D= θα σημειώνονται οι πάσχοντες και με D= οι υγιείς. Ορισμός. : Ευαισθησία (Se) είναι η πιθανότητα (Ρ) τα αποτελέσματα του ελέγχου να είναι θετικά (Τ=), δεδομένου ότι η νόσος παρουσιάζεται (D=) Ορισμός. : Se = P( T = / D = ) Ειδικότητα (Sp) είναι η πιθανότητα (Ρ) τα αποτελέσματα του ελέγχου να είναι αρνητικά (Τ=), δεδομένου ότι δεν παρουσιάζεται η νόσος (D=) Sp = P( T = / D = ) Η ευαισθησία και η ειδικότητα μπορούν εναλλακτικά να εκφραστούν ως ποσοστά των αληθώς θετικών και αληθώς αρνητικών αποτελεσμάτων, αντίστοιχα. Ποσοστό των αληθώς θετικών αποτελεσμάτων (TPR) θεωρούμε το ποσοστό των πασχόντων από μία συγκεκριμένη νόσο που έχουν θετικό αποτέλεσμα, ενώ ποσοστό των αληθώς αρνητικών αποτελεσμάτων (TNR) το ποσοστό των μη πασχόντων που έχουν αρνητικό αποτέλεσμα. Αντίστοιχα ορίζονται τα ποσοστά των ψευδώς αρνητικών και ψευδώς θετικών αποτελεσμάτων Όπως προκύπτει από τα παραπάνω, το FNR είναι το συμπληρωματικό ποσοστό της ευαισθησίας ενώ το FPR το συμπληρωματικό ποσοστό της ειδικότητας και επομένως Se + FNR = και Sp + FPR = Προκειμένου να εξετάσουμε τη συμπεριφορά ευαισθησίας και ειδικότητας, ας υποθέσουμε ότι έχουμε ένα δείγμα ασθενών οι οποίοι έχουν υποστεί εμφύτευση τεχνητών βαλβίδων καρδιάς. Μέσω ψηφιακής απεικόνισης επιχειρείται διαχωρισμός των ασθενών με κριτήριο το αν οι τεχνητές βαλβίδες διατηρούνται ανέπαφες ή έχουν υποστεί φθορά. Ως μέτρο για το διαχωρισμό αυτό χρησιμοποιείται η απόσταση των τεχνητών βαλβίδων από τη βάση. Στον πίνακα. δίνονται οι μετρήσεις της απόστασης αυτής για τους ασθενείς - 9 -

Σπασμένες Βαλβίδες.58.4.8.5.5..7.7.5.3 Ανέπαφες Βαλβίδες.3.3.7.5.3.3.3... Πίνακας. Μετρήσεις απόστασης σε ασθενείς Στο σημείο αυτό θα πρέπει να σημειωθεί ότι οι παραπάνω ασθενείς υποβλήθηκαν σε χειρουργική επέμβαση με σκοπό να ελεγχθεί η πραγματική κατάσταση της τεχνητής βαλβίδας. Όπως φαίνεται από τον παραπάνω πίνακα, οι μισοί από τους ασθενείς βρέθηκε να έχουν υποστεί φθορά στα εμφυτεύματά τους. Οι τιμές της απόστασης για ασθενείς με ανέπαφες βαλβίδες κυμαίνονται από. μέχρι.3 ενώ για τους υπόλοιπους από.3 μέχρι.58. Αν θέλουμε τώρα να υπολογίσουμε την ευαισθησία και την ειδικότητα του ελέγχου θα πρέπει να επιλέξουμε μία τιμή απόστασης, ώστε αν ένας ασθενείς έχει βρεθεί με τιμή μικρότερη από αυτή να κατηγοριοποιείται ως αρνητικός και με τιμή μεγαλύτερη αντίστοιχα ως θετικός. Μια πιθανή τιμή θα μπορούσε να είναι η.5. Σ αυτή την περίπτωση η ευαισθησία και η ειδικότητα θα είναι.8 και.7 αντίστοιχα. Η τιμή.5, που αυθαίρετα επιλέξαμε για την κατηγοριοποίηση θετικών και αρνητικών αποτελεσμάτων, ονομάζεται σημείο απόφασης. Η επιλογή του σημείου απόφασης επηρεάζει την ευαισθησία και την ειδικότητα του ελέγχου. Στον πίνακα που ακολουθεί παρουσιάζεται η ευαισθησία και η ειδικότητα του ελέγχου για διάφορες τιμές του σημείου απόφασης. - -

Καθορισμός των θετικών Ευαισθησία Ειδικότητα αποτελεσμάτων >.58.. >.3.5. >.7.6.8 >.5.8.7 >.3.9.6 >...3... Πίνακας. Εκτιμήσεις ευαισθησίας και ειδικότητας για το παράδειγμα φθαρμένων βαλβίδων Αν επιλέξουμε ως σημείο απόφασης την τιμή.3, όπως βλέπουμε από τον πίνακα. η ευαισθησία θα μειωθεί στο.5 ενώ η ειδικότητα θα αυξηθεί στο., ενώ με επιλογή μικρότερης τιμής θα έχουμε αύξηση της ευαισθησίας και μείωση της ειδικότητας. Καθίσταται έτσι σαφές ότι μαζί με την ευαισθησία και την ειδικότητα θα πρέπει να δίνεται και το σημείο απόφασης. Στο παράδειγμα αυτό, η μέτρηση της απόστασης της τεχνητής βαλβίδας από τη βάση πραγματοποιείται με τη χρήση ηλεκτρονικού υπολογιστή και κατά συνέπεια αποτελεί αντικειμενικό αποτέλεσμα. Σε άλλες περιπτώσεις, όπως για παράδειγμα στις μαστογραφίες για την ανίχνευση καρκίνου του μαστού, τα αποτελέσματα ερμηνεύονται υποκειμενικά. Ο διαχωρισμός θετικών και αρνητικών αποτελεσμάτων γίνεται σύμφωνα με την κρίση του διαγνώστη. Η ευαισθησία και η ειδικότητα, ως μέτρα εγγενούς ακρίβειας, δεν επηρεάζονται από τον επιπολασμό, από το ποσοστό δηλαδή των νοσούντων, αλλά μόνο από τον αριθμό των ασθενών ή των υγιών, αντίστοιχα, γεγονός το οποίο επιτρέπει την εφαρμογή τους σε πληθυσμούς με διαφορετικό επιπολασμό. Παρ όλα αυτά, τα δύο μέτρα επηρεάζονται από το φάσμα της νόσου, δηλαδή την κλινική σοβαρότητα της ασθένειας ή την ανατομική έκταση της. Για παράδειγμα, η ευαισθησία της μαστογραφίας θα είναι μεγαλύτερη όταν εφαρμόζεται σε ασθενείς που βρίσκονται σε προχωρημένο στάδιο καρκίνου του μαστού, καθώς, όσο μεγαλύτερος είναι ο όγκος τόσο ευκολότερα ανιχνεύεται. - -

. Συνδυασμένα μέτρα ευαισθησίας και ειδικότητας Στη διαγνωστική ιατρική, συχνά παρίσταται η ανάγκη σύγκρισης δυο ελέγχων. Για την επίτευξη αυτής της σύγκρισης είναι ευκολότερο να διαχειριστεί κανείς δύο μόνο αριθμούς παρά τις αντίστοιχες ευαισθησίες και ειδικότητες των δύο ελέγχων. Είναι χρήσιμο λοιπόν να εισάγουμε ορισμένα μέτρα που θα ενσωματώνουν τα δύο προηγούμενα σε ένα μόνο δείκτη. Το πιο γνωστό από τα μέτρα αυτά είναι η ακρίβεια ή πιθανότητα σωστού αποτελέσματος ελέγχου. Προκειμένου να οριστεί το μέτρο αυτό παρατίθεται ο πίνακας συνάφειας.3: Αποτελέσματα ελέγχου Πραγματική κατάσταση Θετικά (Τ=) Αρνητικά (Τ=) Σύνολο Ασθενείς (D=) s s Υγιείς (D=) r r Σύνολο m m Ν Πίνακας. 3 Βασικός πίνακας συνάφειας Όπως προκύπτει από τον πίνακα, η πιθανότητα σωστού αποτελέσματος θα είναι ( s + r ) N δηλαδή η αναλογία των TPs (αληθώς θετικών) και TNs (αληθώς αρνητικών) προς ολόκληρο το δείγμα. Το μέτρο αυτό αποτελεί το σταθμισμένο μέσο της ευαισθησίας και της ειδικότητας με βάρη τον επιπολασμό [P(D=)] και το συμπλήρωμά του [P(D=)], αφού: P(TP ή TN) = (αριθμός σωστών αποφάσεων)/ν = Se P( D = ) + Sp P( D = ) - -

Ένα από τα βασικότερα μειονεκτήματα του μέτρου που εξετάζεται είναι ότι επηρεάζεται από τον επιπολασμό. Θυμίζουμε ότι με τον όρο επιπολασμό εννοούμε το λόγο των πραγματικά νοσούντων προς το σύνολο του πληθυσμού που υπεβλήθη σε έλεγχο. Ας υποθέσουμε για παράδειγμα ότι έχουμε δεδομένα από δύο πληθυσμούς, τον πρώτο με επιπολασμό 5% και τον δεύτερο με %. Στην πρώτη περίπτωση, η ευαισθησία και η ειδικότητα θα δώσουν ίσα βάρη ενώ στη δεύτερη η ειδικότητα θα δώσει μεγαλύτερο βάρος. Αυτό θα έχει σαν αποτέλεσμα η πιθανότητα σωστού αποτελέσματος του ελέγχου να είναι πολύ μεγαλύτερη για τα δεδομένα του πρώτου πληθυσμού. Ένα δεύτερο μειονέκτημα της πιθανότητας σωστού αποτελέσματος είναι ότι αντιμετωπίζει τα FP (ψευδώς θετικά) και FN (ψευδώς αρνητικά) σαν ανεπιθύμητα, παρ ότι αυτό δε θα έπρεπε να συμβαίνει πάντα (Zweig και Campbell, 993). Για παράδειγμα ας θεωρήσουμε δύο ελέγχους Α και Β, με ευαισθησία % αλλά ειδικότητα % για τον Α, και % ευαισθησία, αλλά % ειδικότητα για τον Β αντίστοιχα. Εάν ο επιπολασμός είναι 5%, οι δύο έλεγχοι θα δίνουν την ίδια πιθανότητα σωστού αποτελέσματος, παρά τις διαφορετικές ευαισθησίες και ειδικότητες (Metz 978). Δύο άλλα μέτρα που χρησιμοποιούνται κυρίως στο στάδιο της μετα-ανάλυσης είναι ο σχετικός λόγος συμπληρωματικών πιθανοτήτων (odds ratio) και ο δείκτης του Youde. Ο σχετικός λόγος συμπληρωματικών πιθανοτήτων εκφρασμένος με όρους ευαισθησίας και ειδικότητας δίνεται από τον ακόλουθο τύπο: Se ( Se) Se Sp odds ratio = = Sp ( Sp) FNR FPR Αν η τιμή του odds ratio είναι ίση με μονάδα, εξάγεται το συμπέρασμα ότι η πιθανότητα θετικού αποτελέσματος είναι ίση για ασθενείς και υγιής. Εάν η τιμή του είναι μεγαλύτερη της μονάδας, η πιθανότητα θετικού αποτελέσματος είναι μεγαλύτερη για τους πάσχοντες, ενώ, εάν είναι μικρότερη, είναι μεγαλύτερη για τους υγιείς. Ο δείκτης του Youde, από την άλλη πλευρά, ισούται με Se+SP- ή Se-FPR, κυμαίνεται μεταξύ του. και του. και εκφράζει την πιθανότητα θετικού αποτελέσματος μεταξύ ασθενών ως προς τους υγιείς. Τα δύο μέτρα που αναφέρθηκαν δεν εξαρτώνται από τον επιπολασμό, γεγονός που τα καθιστά πιο αξιόπιστα σε σχέση με την πιθανότητα σωστού αποτελέσματος. Παρ όλα - 3 -

αυτά, έχουν και αυτά το μειονέκτημα να βασίζονται σε ένα μόνο σημείο απόφασης και επιπλέον να αντιμετωπίζουν τα FP και FN αποτελέσματα ως ανεπιθύμητα..3 Η καμπύλη ROC Το σημαντικότερο μειονέκτημα των μέτρων που αναλύθηκαν στις προηγούμενες ενότητες είναι ότι δεν συμπεριλαμβάνουν όλα τα ενδεχόμενα σημεία απόφασης. Το 97, ο Lusted εισήγαγε στην διαγνωστική ιατρική μία μέθοδο περιγραφής της εγγενούς ακρίβειας ενός ελέγχου, η οποία υπερνικά το πρόβλημα λαμβάνοντας υπόψη όλα τα πιθανά σημεία απόφασης. Ο δείκτης που χρησιμοποιήθηκε από τον Lusted ονομάζεται λειτουργικός χαρακτηριστικός δείκτης (ROC) ή καμπύλη ROC. Η καμπύλη ROC είναι ένα γράφημα, με τον άξονα y να περιλαμβάνει τις τιμές ευαισθησίας ενός ελέγχου και τον άξονα x τις τιμές του FPR ή -ειδικότητας, όπου κάθε ζεύγος ευαισθησίας και FPR (FPR,Se) αντιστοιχεί σ ένα σημείο απόφασης. Η σύνδεση των σημείων αυτών αποτελεί την εμπειρική καμπύλη ROC. Στην εικόνα. παρουσιάζεται η καμπύλη ROC για τα δεδομένα ψηφιακής απεικόνισης τεχνητών βαλβίδων καρδιάς, όπως αυτά φαίνονται στον πίνακα.. Εικόνα. Εμπειρική και λεία καμπύλη ROC για τα δεδομένα απεικόνισης τεχνιτών βαλβίδων καρδιάς - 4 -

Στην παραπάνω εικόνα κάθε κύκλος πάνω στην καμπύλη αντιστοιχεί σ ένα ζεύγος ευαισθησίας και FPR (FPR,Se) ή, όπως αναφέρθηκε, σ ένα σημείο απόφασης. Για παράδειγμα, το σημείο στο αριστερό άκρο (.,.5) αντιστοιχεί στο >.3, ενώ οι ευθείες που ενώνουν τα σημεία παράγονται από όλα τα πιθανά σημεία απόφασης. Σε πολλές περιπτώσεις, για την εξαγωγή ασφαλέστερων συμπερασμάτων, είναι χρήσιμο να προσαρμόζουμε ένα στατιστικό μοντέλο στα αποτελέσματα του διαγνωστικού ελέγχου. Το μοντέλο που χρησιμοποιείται συνήθως στη διαγνωστική ιατρική είναι το δικανονικό, δηλαδή δύο κανονικές κατανομές, μία για τα αποτελέσματα των υγιών και μια γι αυτά των ασθενών. Στην εικόνα., εκτός της εμπειρικής, έχει σχεδιαστεί και η καμπύλη που παίρνουμε μετά την προσαρμογή των αποτελεσμάτων της ψηφιακής απεικόνισης των τεχνητών βαλβίδων καρδιάς. Η νέα καμπύλη ονομάζεται προσαρμοσμένη καμπύλη ROC. Κατά τη χρήση του δικανονικού μοντέλου, η καμπύλη είναι δυνατό να καθοριστεί πλήρως από δύο παραμέτρους. Η πρώτη παράμετρος, είναι η διαφορά των μέσων των κατανομών των αποτελεσμάτων για ασθενείς και υγιείς, ενώ η δεύτερη είναι ο λόγος των τυπικών αποκλίσεων των αποτελεσμάτων ασθενών προς υγιών. Στην πορεία αυτής της εργασίας θα συζητηθεί εκτενώς το δικανονικό αυτό μοντέλο. Θα πρέπει να σημειωθεί ότι η εγγενής ακρίβεια ορίζεται πλήρως από την καμπύλη ROC, η οποία συχνά ορίζεται από τις δύο προαναφερθείσες παραμέτρους. Συγκριτικά με τα μέτρα εγγενούς ακρίβειας που παρουσιάστηκαν σε προηγούμενες ενότητες, η καμπύλη ROC έχει ιδιαίτερη αξία. Αρχικά, όπως έχει ήδη αναφερθεί, συμπεριλαμβάνει όλα τα ενδεχόμενα σημεία απόφασης. Επιπλέον, είναι ανεξάρτητη του επιπολασμού, αφού βασίζεται στην ειδικότητα και στην ευαισθησία του ελέγχου. Ένα άλλο πλεονέκτημα αυτού του μέτρου είναι η ανεξαρτησία του από τη μονάδα μέτρησης των αποτελεσμάτων, γεγονός που σημαίνει ότι παραμένει αμετάβλητο σε μετασχηματισμούς όπως ο γραμμικός, ο λογαριθμικός και ο μετασχηματισμός τετραγωνικής ρίζας. Τέλος, σε περιπτώσεις όπου επιχειρείται η σύγκριση δύο ή περισσότερων ελέγχων, μπορούμε να εξασφαλίσουμε άμεση οπτική σύγκριση των ελέγχων για όλα τα πιθανά σημεία απόφασης χρησιμοποιώντας καμπύλες ROC. - 5 -

.4 Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC Ένα ακόμα μέτρο διαγνωστικής ακρίβειας ενός ελέγχου είναι το εμβαδόν της περιοχής κάτω από την καμπύλη ROC. Η έκταση των τιμών που μπορεί να πάρει το μέτρο αυτό είναι από. μέχρι και.. Στην περίπτωση που το εμβαδόν είναι μονάδα η αντίστοιχη καμπύλη θα αποτελείται από τα ευθύγραμμα τμήματα (,)-(,) και (,)-(,) και ο διαγνωστικός έλεγχος θα χαρακτηρίζεται απολύτως ακριβής. Αντιθέτως, ένας έλεγχος με εμβαδόν. ονομάζεται ανακριβής, καθώς χαρακτηρίζει τους υγιείς θετικούς και τους ασθενείς αρνητικούς. Πρακτικά, η χαμηλότερη τιμή που μπορεί να πάρει το εμβαδόν κάτω από την καμπύλη είναι.5. Σ αυτήν την περίπτωση η καμπύλη ROC είναι το ευθύγραμμο τμήμα (,)-(,) και ο διαγνωστικός έλεγχος στον οποίο αντιστοιχεί δεν έχει καμία αξία, αφού η πιθανότητα να κάνει σωστό διαχωρισμό υγιών ασθενών περιορίζεται στο 5%. Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC επιδέχεται δύο βασικές ερμηνείες. Σύμφωνα με την πρώτη, αντιστοιχεί στη μέση τιμή της ευαισθησίας για όλες τις πιθανές τιμές ειδικότητας, ενώ σύμφωνα με τη δεύτερη, αντιστοιχεί στη μέση τιμή της ειδικότητας για όλες τις πιθανές τιμές ευαισθησίας. Στην εικόνα. απεικονίζεται η εμπειρική και η προσαρμοσμένη καμπύλη ROC για δεδομένα από ασθενείς που υποβλήθηκαν σε εξέταση μαστογραφίας. Το εμβαδόν κάτω από την εμπειρική καμπύλη είναι.83. Πρακτικά αυτό σημαίνει ότι ένας ασθενής με καρκίνο του στήθους έχει πιθανότητα.83 να δώσει θετικό αποτέλεσμα στον έλεγχο. Από την άλλη μεριά, το εμβαδόν κάτω από την προσαρμοσμένη καμπύλη είναι.86. Γενικά, εάν ο αριθμός των σημείων απόφασης δεν είναι μεγάλος, το εμβαδόν κάτω από την εμπειρική καμπύλη θα είναι μικρότερο από το εμβαδόν κάτω από την προσαρμοσμένη καμπύλη (Εικόνα.). - 6 -

Εικόνα. Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC, περιγράφει τη διακριτική ικανότητα ενός ελέγχου, δεδομένου ότι δεν επηρεάζεται από τον επιπολασμό και τα σημεία απόφασης που χρησιμοποιούνται για τη χάραξη της καμπύλης. Παρ όλα αυτά, σε εφαρμογές που μας ενδιαφέρει ένα τμήμα της καμπύλης, η αξία του ως μέτρο αμφισβητείται. Για παράδειγμα, αν εφαρμόσουμε την ψηφιακή απεικόνιση τεχνητών βαλβίδων καρδιάς με σκοπό να εντοπίσουμε τους ασθενείς που δεν παρουσιάζουν συμπτώματα, μας ενδιαφέρει μόνο το τμήμα της καμπύλης στο οποίο έχουμε υψηλή ειδικότητα. Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC θα μας δώσει όμως τη μέση τιμή της ειδικότητας για όλες της ευαισθησίες. Αντίστοιχα προβλήματα μπορεί να δημιουργηθούν κατά την εφαρμογή του μέτρου στη σύγκριση δύο ή περισσοτέρων ελέγχων. Μπορεί τα εμβαδά των δύο ελέγχων να είναι ίσα, οι καμπύλες τους όμως να διαφέρουν σε κλινικά σημαντικές περιοχές ή αντίστροφα, τα δύο εμβαδά να διαφέρουν, αλλά να είναι ίσα σε τμήμα που παρουσιάζει κλινικό ενδιαφέρον. Στις ενότητες που ακολουθούν προτείνονται μέτρα εγγενούς ακρίβειας τα οποία εστιάζουν σ ένα μόνο τμήμα της καμπύλης, ξεπερνώντας την αδυναμία του εμβαδού κάτω από την καμπύλη ROC. - 7 -

.5 Ευαισθησία σε σταθερό FPR Η ευαισθησία για σταθερό FPR είναι ένα εναλλακτικό μέτρο εγγενούς ακρίβειας, με τη χρήση του οποίου μας δίνεται η δυνατότητα να επικεντρώσουμε σ ένα τμήμα της καμπύλης ROC. Αν για παράδειγμα μας ενδιαφέρει το FPR να είναι e, το εξεταζόμενο μέτρο θα είναι η ευαισθησία που αντιστοιχεί σ αυτό το FPR ή συμβολικά Se ( FPR= e). Ο καθορισμός του FPR εξαρτάται από τα χαρακτηριστικά της κλινικής εφαρμογής, δηλαδή από τον επιπολασμό και τις συνέπειες που μπορεί να έχει μια λανθασμένη διάγνωση. Θα πρέπει ωστόσο να είμαστε ιδιαιτέρως προσεκτικοί με την επιλογή του FPR αφού, εάν αυτό καθοριστεί μετά την εξέταση των δεδομένων, θα εισάγει μεροληψία στα αποτελέσματα της μελέτης..6 Μερικό εμβαδόν κάτω από την καμπύλη ROC Ένα επιπλέον μέτρο εγγενούς ακρίβειας που μπορεί να χρησιμοποιηθεί σε συγκεκριμένες κλινικές εφαρμογές, είναι το μερικό εμβαδόν κάτω από την καμπύλη ROC. Το μερικό εμβαδόν ορίζεται ως η περιοχή ανάμεσα σε δύο FPR, e και e, και συμβολίζεται A. Αντίστοιχα, μπορεί να οριστεί η περιοχή μεταξύ δύο ευαισθησιών ( e FPR e ) A( e Se e ). Όπως προκύπτει από τον ορισμό του μέτρου, εάν επιλέξουμε e e =, θα πάρουμε την ευαισθησία για σταθερό FPR, ενώ εάν e = και e = θα πάρουμε το εμβαδόν κάτω από την καμπύλη ROC. Προκειμένου να ερμηνευθεί το μέτρο που εξετάζεται, θα πρέπει να μελετηθεί η μέγιστη και η ελάχιστη τιμή του. Η μέγιστη τιμή είναι ίση με το πλάτος του διαστήματος e e και η ελάχιστη ισούται με ( )( e e)( e + e) (McClish 989). Οι McClish, Jiag, Metz και Nishidawa (996) όρισαν την κανινοκοποιημένη μορφή του μερικού εμβαδού διαιρώντας με τη μέγιστη τιμή του το δείκτη μερικού εμβαδού, που αντιστοιχεί στη μέση τιμή της ευαισθησίας για όλες τις ειδικότητες. Σύμφωνα με τον Dwyer (997), όταν το μερικό εμβαδόν ορίζεται για ευαισθησίες μεγαλύτερες από e, δηλαδή A, ο δείκτης μερικού εμβαδού θα είναι η ( e TPR ) - 8 -

πιθανότητα ένας τυχαία επιλεγμένος υγιής να διαχωριστεί σωστά σε σχέση μ ένα τυχαία επιλεγμένο ασθενή, για τον οποίο ο διαγνωστικός έλεγχος έδωσε αρνητικό αποτέλεσμα για TPR = e. Με ανάλογο τρόπο ερμηνεύεται και η περίπτωση A(. FPR e ). Ένα σημαντικό πρόβλημα αναφορικά με το μερικό εμβαδόν έχει να κάνει με το γεγονός ότι η ελάχιστη τιμή του εξαρτάται από την περιοχή της καμπύλης στην οποία έχουμε εστιάσει. Για να γίνει σαφές το παραπάνω, ας υποθέσουμε ότι έχουμε το μερικό εμβαδόν A με ελάχιστη τιμή. και μέγιστη., και το μερικό εμβαδόν (.8 FPR.) ( FPR.) A με.8 και., αντίστοιχα. Αν υπολογίσουμε το ίδιο μερικό εμβαδόν και για τις δύο περιπτώσεις τότε και ο δείκτης μερικού εμβαδού θα είναι ίδιος, ωστόσο οι δύο περιοχές δεν μπορούν να θεωρηθούν ισοδύναμες. Για την επίλυση αυτού του προβλήματος ο McClish (989) πρότεινε τον μετασχηματισμό: A( e FPR e) mi + max mi που παίρνει τιμές από.5 μέχρι. Όπως και στην περίπτωση της ευαισθησίας με σταθερό FPR, το διάστημα που χρησιμοποιείται για τον υπολογισμό μερικού εμβαδού θα πρέπει να καθορίζεται εκ των προτέρων, ώστε να αποκλειστεί η περίπτωση μεροληψίας στα αποτελέσματα της μελέτης..7 Λόγος πιθανοφανειών Ένας ακόμα δείκτης διαγνωστικής ακρίβειας είναι ο λόγος πιθανοφανειών ή συμβολικά LR. Ο λόγος πιθανοφανειών δίνεται από τον παρακάτω τύπο: PT ( = t/ D= ) LR() t = PT ( = t/ D= ) όπου το t μπορεί να παίρνει μια συγκεκριμένη τιμή ή να είναι ένα διάστημα τιμών. Αν το ενδιαφέρον μας εστιάζεται σε θετικά αποτελέσματα ελέγχου, ο τύπος που PT ( = / D= ) χρησιμοποιείται είναι LR( + ) = και αντίστοιχα για αρνητικά PT ( = / D= ) αποτελέσματα LR( ) = PT ( = / D= ). Αξίζει δε να σημειωθεί ότι ο LR(+) είναι ο PT ( = / D= ) - 9 -

λόγος της ευαισθησίας προς τον FPR, ενώ ο LR(-) είναι ο λόγος του FNR προς την ειδικότητα. Όπως φαίνεται από τον ορισμό του λόγου πιθανοφάνειας, εάν αυτός ισούται με τη μονάδα, μπορεί να εξαχθεί το συμπέρασμα ότι το αποτέλεσμα του διαγνωστικού ελέγχου (θετικό ή αρνητικό) είναι εξ ίσου πιθανό για ασθενείς και υγιείς. Κατ αντιστοιχία, εάν είναι μικρότερος της μονάδας το αποτέλεσμα είναι πιο πιθανό για υγιείς, ενώ εάν είναι μεγαλύτερος της μονάδας, το αποτέλεσμα είναι πιθανότερο για τους ασθενείς. Θα πρέπει ωστόσο να επιδειχθεί ιδιαίτερη προσοχή στην ερμηνεία του λόγου πιθανοφάνειας. Μπορεί να εξαχθεί το συμπέρασμα ότι ένα αποτέλεσμα είναι πιο πιθανό σε μία από τις δύο κατηγορίες ασθενών, όχι όμως ότι δοθέντος του αποτελέσματος κάποιος είναι πιο πιθανό να νοσεί. Έτσι για παράδειγμα, εάν από τα δεδομένα μαστογραφιών έχουμε καταλήξει σ ένα LR(+) ίσο με.53, αυτό σημαίνει ότι ένα θετικό αποτέλεσμα είναι.53 φορές πιο πιθανό σε ασθενείς με καρκίνο και όχι ότι δοθέντος θετικού αποτελέσματος ένας ασθενείς είναι.53 φορές πιο πιθανό να έχει καρκίνο. Αν προσπαθήσουμε τώρα να ερμηνεύσουμε «γεωμετρικά» το λόγο πιθανοφάνειας θα δούμε ότι ο αριθμητής του LR(+) είναι η y συντεταγμένη της καμπύλης ROC, ενώ ο παρονομαστής είναι η x συντεταγμένη. Εάν τα αποτελέσματα του ελέγχου είναι διαστήματα τιμών, τότε ο λόγος πιθανοφάνειας για ένα διάστημα t t θα αντιστοιχεί στην κλίση της ευθείας μεταξύ t και t στην εμπειρική καμπύλη ROC (Choi 998). Ο λόγος πιθανοφάνειας είναι ανεξάρτητος του επιπολασμού. Το ουσιαστικότερο μειονέκτημα αυτού του μέτρου είναι η δυσκολία εκτίμησης της τυπικής του απόκλισης και της κατανομής του. - -

Κεφάλαιο 3: Εκτίμηση των μέτρων διαγνωστικής ακρίβειας Η μέθοδος βάσει της οποίας επιχειρείται ο υπολογισμός ενός μέτρου διαγνωστικής ακρίβειας εξαρτάται τόσο από τον τύπο των δεδομένων που διαθέτει ο ερευνητής όσο και από τις υποθέσεις που θα κάνει σχετικά με την κατανομή τους. Σε ότι αφορά τον τύπο των δεδομένων, ένας διαγνωστικός έλεγχος μπορεί να παράγει θετικά και αρνητικά αποτελέσματα, διατεταγμένα ή συνεχή. Στην πρώτη περίπτωση τα δεδομένα ονομάζονται δίτιμα και η ακρίβεια του ελέγχου υπολογίζεται από μέτρα όπως η ευαισθησία, η ειδικότητα, ο λόγος συμπληρωματικών πιθανοτήτων (odds ratio) και ο λόγος πιθανοφανειών (likelihood ratio). Στην περίπτωση των διατεταγμένων δεδομένων τα αποτελέσματα μπορούν να πάρουν ορισμένες μόνο τιμές. Ως παράδειγμα θεωρούμε έναν έλεγχο μαστογραφίας στον οποίο τα αποτελέσματα δίνονται με τον εξής τρόπο: - σίγουρα υγιής, -μάλλον υγιής, 3-δεν προκύπτει συμπέρασμα, 4-μάλλον ασθενής, 5- σίγουρα ασθενής. Τα συνεχή δεδομένα προέρχονται από αντικειμενικές μετρήσεις όπως εργαστηριακές τιμές (π.χ. τιμές ενός ενζύμου). Προκειμένου να υπολογιστεί η ακρίβεια για διατεταγμένα και συνεχή δεδομένα, χρησιμοποιούνται μέτρα όπως η καμπύλη ROC, το εμβαδόν και το μερικό εμβαδόν κάτω από την καμπύλη ROC καθώς και η ευαισθησία για σταθερό FPR. Η μέθοδος που τελικά επιλέγεται ως καταλληλότερη εξαρτάται αφενός από το αν τα δεδομένα είναι διατεταγμένα ή συνεχή, αφετέρου από την υπόθεση που θα κάνουμε για την κατανομή των αποτελεσμάτων. Οι μέθοδοι που χρησιμοποιούνται για τον υπολογισμό της ακρίβειας και στηρίζονται στην υπόθεση ότι τα αποτελέσματα ακολουθούν μια συγκεκριμένη κατανομή, ονομάζονται παραμετρικές, διαφορετικά ονομάζονται μη παραμετρικές. Στο κεφάλαιο αυτό θα αναλυθούν ορισμένες από αυτές τις μεθόδους θεωρώντας ως δεδομένο ότι η πραγματική κατάσταση κάθε ατόμου που υπεβλήθη στον υπό εξέταση διαγνωστικό έλεγχο είναι γνωστή και χωρίς σφάλμα. Τέλος, για λόγους απλούστευσης, υποθέτουμε ότι για όλα τα διατεταγμένα και συνεχή δεδομένα οι μεγαλύτερες τιμές συνεπάγονται μεγαλύτερη πιθανότητα της νόσου. - -

3. Δίτιμα δεδομένα 3.. Ευαισθησία και ειδικότητα Στο προηγούμενο κεφάλαιο δόθηκε ο ορισμός της ευαισθησίας ως αναλογία των αληθώς θετικών αποτελεσμάτων και της ειδικότητας ως αναλογία των αληθώς αρνητικών αποτελεσμάτων. Επιπλέον, παρουσιάστηκαν τα δεδομένα για δίτιμα αποτελέσματα όπως φαίνονται στον πίνακα 3.: Αποτελέσματα Ελέγχου Πραγματική κατάσταση Θετικά (Τ=) Αρνητικά (Τ=) Σύνολο Ασθενείς (D=) s s Υγιείς (D=) r r Σύνολο m m Ν Πίνακας 3. Βασικός πίνακας συνάφειας Οι εκτιμήσεις ευαισθησίας και ειδικότητας όπως προκύπτουν από τον παραπάνω πίνακα θα είναι αντίστοιχα Se ˆ s = και και οι εκτιμώμενες διακυμάνσεις της ευαισθησίας και ειδικότητας ˆ r Sp = (3.) ˆ ( ˆ ˆ ˆ Se Se) ss Var( Se) = = (3.) 3 ˆ ( ˆ ˆ ˆ Sp Sp) rr Var( Sp) = = (3.3) 3 Με σκοπό την απεικόνιση της αβεβαιότητας μιας τιμής ως μια εκτίμηση της ακρίβειας, κατασκευάζεται ένα (-α)% διάστημα εμπιστοσύνης, υπό την προϋπόθεση μεγάλου δείγματος, ώστε να ακολουθεί κανονική κατανομή: - -

και αντίστοιχα για την ειδικότητα ( Se ˆ z ˆ ˆ ˆ ˆ ˆ a Var( Se), Se z a Var( Se) ) + (3.5) ( Sp ˆ z ˆ ˆ ˆ ˆ ˆ a Var( Sp), Sp z a Var( Sp) ) + (3.6) Ο τύπος που χρησιμοποιήθηκε για την εύρεση των παραπάνω δ.ε. έχει δύο βασικά μειονεκτήματα. Αρχικά, το ποσοστό στο οποίο το δ.ε. περιλαμβάνει την πραγματική τιμή της παραμέτρου της ακρίβειας είναι αρκετά μικρότερο του επιθυμητού. Αντιθέτως, το δ.ε. λειτουργεί ικανοποιητικά για μικρού μεγέθους δείγματα και τιμές ακρίβειας κοντά στο. Από την άλλη, για τιμές ακρίβειας κοντά στη μονάδα το άνω όριο του δ.ε. μπορεί να ξεπερνά τη μονάδα, τιμή που είναι αδύνατη. Με σκοπό να αποφευχθούν τα προβλήματα που δημιουργούνται από τη χρήση του δ.ε. που παρουσιάστηκε, οι Agresti και Coull το 998 πρότειναν το εναλλακτικό δ.ε. Se ˆ + z ( ) ± z Se ˆ ( Se ˆ ) z /(4 ) + + z a a a a (3.7) 3.. Ο λόγος Πιθανοφανειών (LR) Ο λόγος πιθανοφανειών για δίτιμα δεδομένα, όπως παρουσιάστηκε στο δεύτερο κεφάλαιο, δίνεται από την σχέση: P( T = / D = ) Se LR( + ) = = (3.8) P( T = / D = ) Sp Η εκτίμηση του λόγου πιθανοφανειών προέρχεται από την αντικατάσταση των εκτιμήσεων ευαισθησίας και ειδικότητας στην ισότητα (3.8). Σε ότι αφορά την κατανομή του λόγου πιθανοφανειών, πρόκειται για μια μη συμμετρική κατανομή, αντίθετα με την κατανομή του λογαρίθμού του, που προσεγγίζει την κανονική κατανομή. Η εκτίμηση της διακύμανσης του θετικού λόγου πιθανοφανειών είναι ( Simel, Samsa και Matchar, 99) ˆ ˆ ˆ (l( ˆ Se Sp Var LR( + ))) = + (3.9) s r Το διάστημα εμπιστοσύνης για το λόγο πιθανοφανειών είναι προτιμότερο να κατασκευαστεί χρησιμοποιώντας λογαρίθμους. Υποθέτοντας ασυμπτωτική κανονικότητα - 3 -

τα (-α)% όρια εμπιστοσύνης για το λογάριθμο του θετικού λόγου πιθανοφανειών είναι: Se ˆ Se ˆ Sp ˆ l z a / Sp ˆ ± + (3.) s r Συνεπώς τα όρια εμπιστοσύνης του θετικού λόγου πιθανοφανειών είναι: το οποίο γράφεται Se ˆ Se ˆ Sp ˆ exp l z a / Sp ˆ ± + s r (3.) Se ˆ e Sp ˆ Se ˆ Sp ˆ ± z a / + s r Οι εκτιμήσεις για τον αρνητικό λόγο πιθανοφανειών λαμβάνονται αντίστοιχα. (3.) 3..3 Ο σχετικός λόγος συμπληρωματικών πιθανοτήτων (odds ratio) Με τη χρήση του odds ratio δίνεται στους ερευνητές η δυνατότητα να συμπεράνουν αν οι πιθανότητες ενός θετικού αποτελέσματος ελέγχου είναι μεγαλύτερες για τους πάσχοντες από τη νόσο ενδιαφέροντος απ ότι για τους υγιείς. Η εκτίμηση του odds ratio δίνεται από τη σχέση: ˆ ( ˆ ) ( Sp ˆ ) Sp ˆ Se Se sr oˆ = = sr Η εκτίμηση της διακύμανσής του είναι: Var ˆ ( oˆ) oˆ = + + + s s r r (3.3) (3.4) Όπως η κατανομή του λόγου πιθανοφανειών, έτσι και η κατανομή του odds ratio είναι μια μη συμμετρική κατανομή, αντίθετα με το λογάριθμό του που κατανέμεται κατά προσέγγιση κανονικά. Προκειμένου να κατασκευαστεί ένα (-α)% διάστημα εμπιστοσύνης για τον odds ratio θα υπολογιστούν πρώτα τα όρια εμπιστοσύνης για το λογάριθμό του. Η εκτίμηση του λογαρίθμου του odds ratio είναι: - 4 -

ˆ Var(log( oˆ )) = + + + (3.5) s s r r και επομένως τα όρια εμπιστοσύνης : l( oˆ) ± z SE (l( oˆ)) (3.6) a / Λαμβάνοντας εκθετική συνάρτηση, τα όρια εμπιστοσύνης για τον odds ratio διαμορφώνονται τελικά ως εξής: sr ± z s + s + r + r e sr a / (3.7) Χρησιμοποιώντας την παραπάνω μεθοδολογία είναι δυνατόν να βρεθούμε σε αδιέξοδο αν κάποιο από τα s, s, r, r ισούται με. Για την επίλυση του προβλήματος αυτού, ο Cox (97) πρότεινε την πρόσθεση.5 μονάδων σε κάθε κελί του πίνακα 3.. Οι τιμές που λαμβάνονται τότε έχουν μικρότερη ασυμπτωτική μεροληψία και μέσο τετραγωνικό σφάλμα. 3. Διατεταγμένα δεδομένα 3.. Λείανση καμπύλης ROC ( Το δικανονικό μοντέλο) Ένας διαγνωστικός έλεγχος είναι δυνατό να παράγει αποτελέσματα διατεταγμένα σε Κ κατηγορίες. Προκειμένου να σχεδιαστεί η εμπειρική καμπύλη ROC, θα πρέπει να οριστούν οι τιμές της ευαισθησίας και ειδικότητας. Για κάθε τιμή αποτελέσματος Τ, θεωρούμε τις τιμές που είναι μεγαλύτερες του Τ ως θετικές, ενώ αυτές που είναι μικρότερες ως αρνητικές. Οι εκτιμήσεις ευαισθησίας και ειδικότητας για κάθε κατηγορία δίνονται από τις σχέσεις: K Se() i = TPR() i = P( T i \ D = ) = s (3.8α) j = i K FPR() i = S p() i = P( T i \ D = ) = r (3.8β) j= i Η εμπειρική καμπύλη ROC είναι το γράφημα των σημείων FPR ( i), Se ( i), i =,..., K. j j - 5 -

Σχεδιάζοντας την εμπειρική καμπύλη ROC, μπορεί κανείς να διαπιστώσει ότι πρόκειται για ένα τραχύ γράφημα (συνάρτηση μοναδιαίου βήματος), που δεν μπορεί να δώσει παρά μια ιδέα για τη σχέση του ελέγχου με την υπό εξέταση νόσο. Προκύπτει έτσι η ανάγκη προσαρμογής μιας λείας καμπύλης στα δεδομένα ώστε να εξασφαλιστεί μια καλύτερη εικόνα της αποτελεσματικότητας του διαγνωστικού ελέγχου. Ένας από τους πιο διαδεδομένους τρόπους προσαρμογής ενός μοντέλου με διατεταγμένα δεδομένα είναι η εφαρμογή του δικανονικού μοντέλου. Πιο συγκεκριμένα, υποθέτουμε διατεταγμένα αποτελέσματα ελέγχου, Τ και Τ, υγιών και ασθενών, ως μια κατηγοριοποίηση δύο λανθανουσών συνεχών τυχαίων μεταβλητών, * T και αντίστοιχα, οι οποίες ακολουθούν κατανομές F και F. Αν c είναι ένα σημείο απόφασης τότε για την ευαισθησία και την ειδικότητα θα έχουμε : * * T, FPR() c = P( T > c \ D = ) = F () c (3.9α) TPR() c = P( T > c \ D = ) = F () c (3.9β) * Για κάθε αποτέλεσμα ελέγχου Τi, που παίρνει μία από τις Κ διατεταγμένες τιμές, υποθέτουμε ότι υπάρχουν Κ- σημεία απόφασης.,,..., K * ) Αν T c, τότε Τi= ) Αν 3) Αν i * c j < Ti c j T * i, τότε Τi =j, j=,,,k- > c K, τότε Τi =Κ c c c τέτοια ώστε: Το δικανονικό μοντέλο προκύπτει από την υπόθεση ότι οι F και F είναι κανονικές κατανομές. Πιο συγκεκριμένα, βασίζεται στην υπόθεση ότι τα αποτελέσματα του ελέγχου προέρχονται από κανονικές κατανομές ή μπορούν να μετασχηματιστούν μονοτονικά ώστε να προέρχονται από αυτές. Υποθέτουμε, λοιπόν, ότι τα έχουν μετασχηματιστεί κατάλληλα ώστε: T N ( µ, σ ) * T N ( µ, σ ) * * T και * T όπου µ, µ είναι οι μέσοι και σ, σ οι διακυμάνσεις των κανονικών κατανομών. Μπορεί να οριστεί η πιθανότητα των καταγεγραμμένων αποτελεσμάτων, με βάση την κατανομή τους, ως: - 6 -

P = PT ( = j\ D= ) =Φ( c) Φ ( c ) (3.α) j j j και j j j P = P( T = j \ D = ) =Φ( bc a) Φ( bc a) (3.β) όπου cj = ( c j µ )/ σ, b = σ / σ, α = ( µ µ )/ σ, c =, c K = + και Φ είναι η αθροιστική κανονική κατανομή. Οι παράμετροι a, b και c, c,..., c K μπορούν να εκτιμηθούν με μεθόδους μέγιστης πιθανοφάνειας, από τις οποίες μπορούν να ληφθούν και οι εκτιμήσεις των διακυμάνσεων και συνδιακιμάνσεων των παραμέτρων αυτών. Ιδιαίτερη προσοχή θα πρέπει να δοθεί στην περίπτωση κατά την οποία παρουσιάζονται κενά κελιά στον πίνακα αποτελεσμάτων του ελέγχου. Για τη σωστή εκτίμηση των παραμέτρων είναι αναγκαία η προσθήκη ενός διαταρακτικού όρου πριν την εφαρμογή αλγορίθμων. Η καμπύλη ROC σχεδιάζεται τελικά από τη συλλογή των σημείων [ Φ( c), Φ( bc a )], όπου < c < + ή εναλλακτικά [ FPR, Φ( bζ a)] για FPR και ΦΖ ( ) = FPR. FPR Ο Haley (988) χρησιμοποίησε και άλλες κατανομές, όπως τη διωνυμική, την Poisso, τη Γάμμα και τη Χ με σκοπό να διαπιστώσει αν η καμπύλη προσαρμόζεται εξίσου καλά με τη χρήση κάποιου από αυτά τα μοντέλα. Το δικανονικό μοντέλο βρέθηκε να προσαρμόζεται πολύ ικανοποιητικά. Μια άλλη κατανομή που έτυχε της προσοχής των ερευνητών είναι η λογιστική (Ogilvie, Greelma!968 και Grey 97), η οποία προσαρμόζεται εξίσου ικανοποιητικά αφού είναι σχεδόν όμοια με την κανονική. Παρ ότι το λογιστικό μοντέλο είναι πιο εύχρηστο, το λογισμικό που διατίθεται βασίζεται στη δικανονική υπόθεση. Ο στατιστιστικός έλεγχος που εφαρμόζεται για τον έλεγχο καλής προσαρμογής στην δικανονική υπόθεση είναι: X K [ PT ( i = k\ D= i) PT ( i = k\ D= i)] = i (3.) = = PT ( = k\ D= i) i k i όπου PT ( = k\ D= ) = sk /, PT ( = k\ D= ) = rk / είναι οι παρατηρηθείσες πιθανότητες αποτελεσμάτων και PT ( = k\ D= i) είναι η αναμενόμενη πιθανότητα όπως αυτή υπολογίστηκε κάτω από τη δικανονική υπόθεση. Το στατιστικό ελέγχου FPR κατανέμεται προσεγγιστικά σαν X. K 3-7 -

3.. Εκτίμηση ευαισθησίας για σταθερό FPR Σύμφωνα με τα όσα αναφέρθηκαν στην προηγούμενη ενότητα μπορούμε να καθορίσουμε την ευαισθησία που αντιστοιχεί σε κάθε συγκεκριμένη τιμή ειδικότητας χρησιμοποιώντας παραμετρικές μεθόδους. Συνεπώς, για σταθερό FPR e και εκτιμήσεις a και b η ευαισθησία εκτιμάται ως: Se ( FPR= e) = Φ( bz e a) (3.) Σημειώνεται ότι αν γίνει γραφική απεικόνιση των σημείων αυτών θα βρίσκονται πάνω στην ευθεία Z TPR = bz a. FPR Για τη διακύμανση είναι γνωστό ότι: Var( Z ) ( TPR = Var bz a) Var( Z ) = Z Var( b ) + Var( a ) Z Cov( a, b ) FPR TPR FPR FPR Για την εκτίμηση της διακύμανσης και συνδιακύμανσης διατίθενται προγράμματα όπως το ROCFIT, ενώ εναλλακτικά μπορούν να χρησιμοποιηθούν οι μέθοδοι jackkife (McNeil, Haley 984) ή bootstrap. Υποθέτοντας ασυμπτωτική κανονικότητα, ένα (-α)% δ.ε για την ευαισθησία θα καθορίζεται από τα όρια εμπιστοσύνης: LL( Z ) = Z ( TPR z Var Z TPR ) και UL( Z ) = Z ( TPR + z Var ZTPR ) TPR a / TPR a / και κατά συνέπεια το ζητούμενο διάστημα εμπιστοσύνης για την ευαισθησία θα είναι: [ Φ[ LLZ ( )], Φ [ ULZ ( )]] TPR TPR 3..3 To εμβαδόν και το μερικό εμβαδόν κάτω από την καμπύλη ROC (παραμετρικό μοντέλο) Μια γενική έκφραση του εμβαδού κάτω από την καμπύλη ROC μεταξύ δύο FPR, με FPR = e και FPR = e δίνεται από την σχέση: c A( ) = TPR() c dfpr() c (3.3) e FPR e c όπου c i τα σημεία απόφασης που αντιστοιχούν σε κάθε FPRi = ei και TPR(c), FPR(c) όπως ορίστηκαν από τις σχέσεις (3.9). - 8 -

Στην περίπτωση της δικανονικής υπόθεσης, η σχέση αυτή μπορεί να γραφτεί ως: c ( e FPR e) = Φ( ) ( ) c A bυ αφυdυ (3.4) όπου c i = Φ ( e) και φυ ( ) η πυκνότητα της τυπικής κανονικής κατανομής, δηλαδή i / ( ) e φυ = υ. Προκειμένου να υπολογιστεί το εμβαδόν κάτω από ολόκληρη την π καμπύλη, θα πρέπει να θέσουμε e =, c = και e =, c = +, οπότε το ζητούμενο θα είναι: α A = Φ + b (3.5) Όπως έχει αποδειχθεί (McClish 989, Obuchowski και McClish 997), η διακύμανση για το μερικό εμβαδόν κάτω από την καμπύλη θα δίνεται από τη σχέση: Var( A ( e FPR e )) = f Var( a) + g Var( b ) + fgcov( a, b ) (3.6) όπου a / ( + b ) e f = [ Φ( h ) Φ( h)] π ( + b ) a / ( + b ) a / ( + b ) h / h / abe 3 e g = [ e e ] [ Φ( h) Φ( h)] π ( + b ) π ( + b ) (3.7) και h = [ Φ ( e ) + ab /( + b )] + b i i Ο τύπος της διακύμανσης γίνεται απλούστερος στην περίπτωση που υπολογίζεται για ολόκληρη την περιοχή κάτω από την καμπύλη ROC, οπότε οι f και g θα είναι αντίστοιχα: f = e a / ( + b ) π ( ) + b και g = abe a / ( + b ) π ( + b ) 3 (3.8) Η περιοχή και οι διακυμάνσεις μπορούν να υπολογιστούν αν στις ισότητες (3.4)-(3.8) αντικατασταθούν οι εκτιμήσεις των α και b. Αξίζει να σημειωθεί δε, ότι ένα από τα πλεονεκτήματα του δικανονικού μοντέλου είναι η απλή έκφραση που παρέχει για τον υπολογισμό του εμβαδού κάτω από ολόκληρη την καμπύλη. - 9 -

Όπως αναφέρθηκε και στο προηγούμενο κεφάλαιο, προκειμένου να ερμηνεύσουμε το μερικό εμβαδόν θα πρέπει να υπολογιστούν η μέγιστη και ελάχιστη τιμή του. Υπενθυμίζεται ότι το συνολικό εμβαδόν μπορεί να πάρει τιμές από.5 μέχρι. Κατά συνέπεια, το μερικό εμβαδόν θα βρίσκεται μέσα στο ορθογώνιο που ορίζεται από τα σημεία ( e,), ( e,), ( e,), ( e,) και έχει πλευρές μήκους και e e, και έτσι η μέγιστη τιμή του θα είναι: A = e e (3.9) mx( e, e) Η ελάχιστη τιμή του θα δίνεται όταν αυτό περιορίζεται στο τραπέζιο με κορυφές τα σημεία ( e,), ( e, e ), ( e,), ( e, e ), οπότε θα είναι: Ami( e, e) = ( e e )( e + e ) (3.3) Στην περίπτωση κατά την οποία εξετάζονται ολικές ή μερικές περιοχές με τιμές κοντά στη μέγιστη τιμή τους, η υπόθεση της κανονικότητας μπορεί να παραβιάζεται και η κατανομή που ακολουθούν να είναι μια λοξή μη κανονική κατανομή. Προκειμένου να ξεπεραστεί το πρόβλημα αυτό προτείνεται ο παρακάτω μετασχηματισμός, με την εφαρμογή του οποίου η κατανομή του εμβαδού προσεγγίζει περισσότερο την κανονική. Amx + A ( e FPR e) At = l Amx A( e FPR e) Η διακύμανση του εκτιμητή σ αυτή την περίπτωση είναι: 4Amx Var( Α t ) = Var( Α ( e FPR e) ) ( A A ) mx ( e FPR e ) (3.3) (3.3) και ένα (-α)% δ.ε. είναι: A mx L e e, A L mx + e + e U U όπου L =Α t z a / Var( Α t) και U =Α+ t z a / Var( Α t) Οι Obuchowski και Lieber (998) εξέτασαν την καταλληλότητα του ασυμπτωτικού δ.ε. σε σχέση με το δειγματικό μέγεθος καταλήγόντας στο συμπέρασμα ότι αν το εμβαδόν κάτω από την καμπύλη είναι περίπου.8 και τα δειγματικά μεγέθη υγιών-ασθενών μικρότερα των 5, οι ασυμπτωτικές μέθοδοι δεν είναι επαρκείς. Στην περίπτωση που το - 3 -

εμβαδόν κάτω από την καμπύλη κυμαίνεται κοντά στο.95, τα δεδομένα ενδέχεται να είναι εκφυλισμένα, γεγονός που σημαίνει ότι τα δεδομένα προέρχονται από το δικανονικό μοντέλο υπάρχουν όμως δυσκολίες κατά τον υπολογισμό της παραμέτρου b ή κάποιων σημείων απόφασης. Αν ωστόσο τα δεδομένα δεν είναι εκφυλισμένα και το δειγματικό μέγεθος των υγιών είναι τουλάχιστον 3, οι ασυμπτωτικές μέθοδοι βρέθηκαν να είναι κατάλληλες. Ανάλογα συμπεράσματα έχουν διατυπωθεί και για δεδομένα που δεν προέρχονται από το δικανονικό μοντέλο (Mossma 995) ενώ η καταλληλότητα των μεθόδων για μερικό εμβαδόν δεν έχει εξεταστεί. 3..4 Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC (μη παραμετρική μέθοδος) Το εμβαδόν της περιοχής κάτω από την καμπύλη ROC είναι δυνατόν να εκτιμηθεί τόσο με τη χρήση παραμετρικών μεθόδων, όπως παρουσιάστηκε στην προηγούμενη ενότητα, όσο και με τη χρήση μη παραμετρικών, αθροίζοντας τα εμβαδά των τραπεζίων που το αποτελούν. Μια μη παραμετρική εκτίμηση του εμβαδού αυτού, η οποία χρησιμοποιείται είτε για συνεχή είτε για διατεταγμένα δεδομένα, δίνεται από τον τύπο: Α NP = Ψ( T i, Ti) (3.33) i = j = όπου T i τα αποτελέσματα του ελέγχου για τον i-οστό υγιή, T i τα αποτελέσματα για τον i-οστό ασθενή και Ψ μια συνάρτηση μεταβλητών με, αν Υ>Χ ΨΧΥ (, ) = /, αν Υ=Χ, αν Υ<Χ Η αναμενόμενη τιμή είναι: E( Α NP ) = PT ( < T) + PT ( = T) Στην περίπτωση των διατεταγμένων δεδομένων, τα αποτελέσματα ελέγχου με ίδιες τιμές θα είναι αρκετά και κατά συνέπεια η πιθανότητα PT ( = T) θα είναι μεγαλύτερη από. Αυτό σημαίνει ότι η αναμενόμενη τιμή της εκτίμησης της περιοχής κάτω από την καμπύλη είναι μία υποεκτίμηση της πραγματικής περιοχής - 3 -

Για την εκτίμηση της διακύμανσης μη παραμετρικών περιοχών έχουν παρουσιαστεί αρκετές μέθοδοι. Μια τέτοια εκτίμηση παρουσιάζεται με τη μορφή: ANP ( ANP ) + ( )( Q ANP ) + ( )( Q ANP ) Var( Α NP ) = (3.34) όπου Q είναι η πιθανότητα δύο τυχαία επιλεγμένοι ασθενείς να έχουν υψηλότερα αποτελέσματα από ένα τυχαία επιλεγμένο υγιή και Q η πιθανότητα ένας τυχαία επιλεγμένος ασθενής να έχει υψηλότερο αποτέλεσμα ελέγχου από δύο τυχαία επιλεγμένους υγιείς (Bamber 975, Haley και McNeil 98). Δεδομένης της δυσκολίας εκτίμησης των παραπάνω πιθανοτήτων, οι Haley και McNeil (98) τις εκτίμησαν προσεγγιστικά βασιζόμενοι στην εκθετική κατανομή: Q Α NP = και Q Α NP Α = +Α Αδυναμία της προσέγγισης αυτής είναι το γεγονός ότι υποεκτιμά τις ζητούμενες πιθανότητες όταν το εμβαδόν κάτω από την καμπύλη είναι κοντά στην ελάχιστη τιμή του (=.5) και τις υπερεκτιμά όταν το εμβαδόν πλησιάζει τη μέγιστη τιμή του (=.) (Haley και McNeil 98, Haley και Hajia-Tilaki 997). Με σκοπό να ξεπεραστούν τα προβλήματα αυτά, οι ερευνητές έχουν προτείνει μία σειρά εναλλακτικών μεθόδων εκτίμησης της διακύμανσης της περιοχής κάτω από την καμπύλη, η παρουσίαση των οποίων ξεφεύγει από τους στόχους αυτής της διατριβής. NP NP 3..5 Τα εκφυλισμένα δεδομένα Στην ενότητα 3..3, όπου εκτιμήθηκε το εμβαδόν κάτω από την καμπύλη με χρήση παραμετρικών μεθόδων, είδαμε ότι η εφαρμογή του δικανονικού μοντέλου είναι δυνατόν να δημιουργήσει προβλήματα σε κάποιες περιπτώσεις. Πιο συγκεκριμένα, προγράμματα όπως το ROCFIT και το RSCORE μπορεί να μην συγκλίνουν ή να δίνουν ως εκτίμηση το άπειρο είτε για κάποιο σημείο απόφασης είτε για την παράμετρο b. Τέτοιου είδους προβλήματα δημιουργούνται όταν το δειγματικό μέγεθος είναι μικρό και τα δεδομένα δεν έχουν ταξινομηθεί σωστά με αποτέλεσμα να υπάρχουν μηδενικές κατηγορίες. Τα δεδομένα αυτού του τύπου ονομάζονται εκφυλισμένα (Metz 989). Το - 3 -

πρόβλημα που δημιουργούν τα δεδομένα που εξετάζονται είναι εμφανές στην καμπύλη ROC που προέρχεται από αυτά. Αντίθετα με την περίπτωση των δικανονικών δεδομένων, η καμπύλη ROC θα ξεκινάει από το (.) φτάνοντας σε κάποιο σημείο σχεδόν κατακόρυφα, θα συνεχίζει οριζόντια μέχρι μια τιμή FPR κοντά στην μονάδα και θα καταλήγει στο σημείο (,) μέσω μιας σχεδόν κάθετης ευθείας (εικόνα 3.) Εικόνα 3. Παράδειγμα καμπύλης ROC για εκφυλισμένα δεδομένα Η χρήση μη παραμετρικών μεθόδων για την εκτίμηση του εμβαδού κάτω από την καμπύλη θα μπορούσε να αποτελέσει λύση στο πρόβλημα των εκφυλισμένων δεδομένων (Rockette, Obuckowski και Gur 99), δυστυχώς όμως η μεροληψία στον εκτιμητή είναι σημαντική (Dorfma και Berbaum 995). Ένα μοντέλο που προτάθηκε με σκοπό να ξεπεραστούν τέτοιου είδους ζητήματα είναι το δίγαμμα (Dorfma et al 997). Σύμφωνα με αυτό, τα αποτελέσματα ελέγχου των υγιών ακολουθούν Γάμμα κατανομή με παραμέτρους r και ( T Γ( r,) ), και τα αποτελέσματα των ασθενών ακολουθούν επίσης Γάμμα κατανομή με παραμέτρους r και λ ( T Γ(, r λ) με < λ ). Δεδομένου - 33 -

ότι η κατανομή Γάμμα προσεγγίζει την κανονική κατανομή καθώς η παράμετρος r αυξάνει, τα δεδομένα θα προσαρμόζονται ικανοποιητικά κατά την εφαρμογή της. Επιπλέον, κατά την εκτίμηση του εμβαδού ή του μερικού εμβαδού κάτω από την καμπύλη όταν τα δειγματικά μεγέθη είναι μικρά, το δίγαμμα μοντέλο παρουσιάζει μικρότερη μεροληψία (Dorfma et al 997). 3.3 Συνεχή δεδομένα Όπως έχει αναφερθεί, οι καμπύλες ROC χρησιμοποιούνται για την αξιολόγηση της ακρίβειας ενός διαγνωστικού ελέγχου. Ωστόσο, μπορεί να φανούν εξίσου χρήσιμες και στην αξιολόγηση συγκεκριμένων μεταβλητών, οι οποίες παρέχουν πληροφορίες σχετικές με την έκβαση ενός ασθενούς. Ένα τέτοιο παράδειγμα είναι η μέτρηση εγκεφαλονωτιαίου υγρού σε ασθενείς που έχουν υποστεί κρανιοεγκεφαλικές κακώσεις, με σκοπό την πρόβλεψη μιας κακής εξέλιξης στην υγεία του ασθενούς όπως ο θάνατος, η κωματώδης κατάσταση ή κάποια σοβαρή ανικανότητα. Στις περιπτώσεις αυτές το εμβαδόν της περιοχής κάτω από την καμπύλη αποτελεί μέτρο της ικανότητας του ελέγχου να κάνει διάκριση μεταξύ ασθενών με καλή ή κακή έκβαση. Μεταβλητές όπως η προαναφερθείσα παράγουν συνεχή αποτελέσματα ελέγχου. 3.3. Η εμπειρική καμπύλη ROC Η θεωρητική καμπύλη ROC είναι ένα γράφημα από σημεία [FPR(c),TPR(c)] για κάθε τιμή του c, με c +. Για την περίπτωση συνεχών δεδομένων ο Campbell (994) πρότεινε την κατασκευή της εμπειρικής καμπύλης ROC ως γράφημα των εκτιμήσεων των αθροιστικών συναρτήσεων κατανομής. Συμβολίζουμε με Τ τα συνεχή αποτελέσματα ελέγχου των υγιών και με Τ τα αποτελέσματα των ασθενών. Υποθέτουμε ότι οι τυχαίες μεταβλητές Τ και Τ έχουν αθροιστικές συναρτήσεις κατανομών F και F αντίστοιχα, με F() c = F () c και F() c = F () c. Αν θεωρήσουμε ένα δείγμα υγιών μεγέθους και ένα δείγμα ασθενών μεγέθους, η εμπειρική καμπύλη ROC θα είναι το γράφημα που αποτελείται - 34 -

από τα σημεία [ F( ci), F( c i)], με το c i να κυμαίνεται πάνω από όλες τις παρατηρηθείσες τιμές αποτελεσμάτων και F c I ( ) = i T j> ci j= [ ] F c I ( ) = i T j> ci j= [ ] όπου I[ T > c ] κ j i, αν Tκ j> cj =, αν Tκ j c j, κ=, Το γράφημα που προκύπτει αποτελείται + + σημεία τουλάχιστον. Επιπλέον, δεδομένου ότι εξετάζεται η περίπτωση συνεχών δεδομένων, τα σημεία θα ενώνονται με κάθετες και οριζόντιες ευθείες μήκους / και / αντίστοιχα. Στην εικόνα 3. παρουσιάζεται μία εμπειρική καμπύλη κατασκευασμένη με την παραπάνω μεθοδολογία. Εικόνα 3. - 35 -

3.3. Λείανση καμπυλών ROC με τη χρήση παραμετρικών μεθόδων Η παραμετρική μέθοδος που χρησιμοποιείται για την προσαρμογή λείας καμπύλης ROC σε συνεχή δεδομένα είναι όμοια με αυτή που εφαρμόστηκε στην περίπτωση των διατεταγμένων δεδομένων. Αν τα δεδομένα ακολουθούν δικανονική κατανομή ή είναι γνωστή η συνάρτηση βάσει της οποίας μπορούν να μετασχηματιστούν, οι παράμετροι του δικανονικού μοντέλου μπορούν να εκτιμηθούν απευθείας από τους μέσους και τις διακυμάνσεις των κατανομών των υγιών και ασθενών. Συγκεκριμένα: b σ = και u u a = σ σ όπου σ i η εκτίμηση της τυπικής απόκλισης και u i η εκτίμηση του μέσου για τα δείγματα υγιών και ασθενών. Οι εκτιμήσεις των διακυμάνσεων και της συνδιακύμανσης δίνονται από τους παρακάτω τύπους: ( a + ) + b Var( a) =, ( + ) b Var( b ) =, ab Cov( a, b ) =. Στις περισσότερες περιπτώσεις συνεχών αποτελεσμάτων ελέγχου η υπόθεση της δικανονικότητας δεν είναι αληθής και κατά συνέπεια τα παραπάνω δεν μπορούν να εφαρμοστούν. Για τη λύση του προβλήματος αυτού ο Zou (998) πρότεινε ένα Box-Cox μετασχηματισμό με την εφαρμογή του οποίου τα δεδομένα μετατρέπονται σε δικανονικά. Ο μετασχηματισμός αυτός έχει τη μορφή: και λ ( Tkj ) Ψ λ ( Tkj ) =, λ, k=, και j=,..., λ Ψ ( T ) = log( T ), λ=, k=, και j=,..., λ kj kj k k όπου T kj τα αποτελέσματα ελέγχου για τον j-οστό υγιή (όταν k=) και ασθενή (όταν k=). Ο μετασχηματισμός εφαρμόζεται αφού πρώτα εκτιμηθεί η παράμετρος λ με μεθόδους μέγιστης πιθανοφάνειας και στη συνέχεια εκτιμώνται οι παράμετροι α και b. Στην περίπτωση που τα δεδομένα δεν μπορούν να μετασχηματιστούν, κατηγοριοποιούνται ή τροποποιούνται ώστε να έχουν μορφή διατεταγμένων δεδομένων. - 36 -