ΣΥΓΧΡΟΝΑ ΕΡΓΑΛΕΙΑ ΜΕΤΡΗΣΗΣ ΠΟΙΟΤΗΤΑΣ ΖΩΗΣ Δηµοσθένης Β. Παναγιωτάκος Αναπληρωτής Καθηγητής Βιοστατιστικής & Επιδηµιολογίας Τµήµα Επιστήµης Διαιτολογίας-Διατροφής Χαροκόπειο Πανεπιστήµιο ΔΗΛΩΣΗ ΕΝΔΙΑΦΕΡΟΝΤΟΣ : KAMIA
Οι µετρήσεις Οι µετρήσεις είναι συνυφασµένες µε την καθηµερινή ζωή, π.χ. Χρόνος Αποστάσεις Σφυγµοµετρήσεις της κοινής γνώµης Έρευνα Θετικές επιστήµες Κοινωνικές επιστήµες Ιατρική, βιολογία
Οι µετρήσεις Οι µετρήσεις έχουν συµβάλει στην εξέλιξη της έρευνας και στην προαγωγή της ποιότητας της ζωής του ανθρώπου. Για να συµβούν τα ανωτέρω επιβάλλεται η ακρίβεια των µετρήσεων. Το τελευταίο δεν είναι πάντα «εύκολη» υπόθεση. Π.χ. Μέτρηση της συµπεριφοράς, των συναισθηµάτων κ.λ.π.
Μέτρηση της συµπεριφοράς Ο άνθρωπος διακρίνεται για τη συµπεριφορά του η οποία συνδέεται συχνά µε τα συναισθήµατα του. Άγχος, κατάθλιψη, θλίψη, αισιοδοξία, λύπη, θυµός, πόνος, κλπ Τα συναισθήµατα, µαζί µε το περιβάλλον, επηρεάζουν τη συµπεριφορά του ανθρώπου και ενδέχεται να οδηγήσουν σε υποβάθµιση της ποιότητας της ζωής. Π.χ. το άγχος και το περιβάλλον αφθονίας οδηγούν στην παχυσαρκία, και κατά συνέπεια στην υποβάθµιση της καλής υγείας.
Μπορείτε να µετρήσετε τι αισθάνονται αυτοί οι άνθρωποι;
Μέτρηση της συµπεριφοράς & Υγεία Τρόπο ζωής, Υγεία Συµπεριφορά, Ποιότητα ζωής Μόρφωση, παιδεία, οικονοµική κατάσταση Μίκρο-Περιβάλλον (οικογένεια) Μίκρο-Περιβάλλον (εργασία) Περιβάλλον (κοινωνία)
Μέτρηση της συµπεριφοράς & ποιότητας ζωής Όµως η µέτρηση της συµπεριφοράς και της ποιότητας ζωής είναι µια πολύ δύσκολη υπόθεση, διότι εµπλέκονται πολλοί παράγοντες Ψυχολογικοί Νοητικοί Κοινωνικοί Μεθοδολογικοί
Μέτρηση της συµπεριφοράς Πως γίνεται η µέτρηση της συµπεριφοράς και της ποιότητας ζωής; Η µέτρηση της συµπεριφοράς στην έρευνα γίνεται µε τη χρήση κλιµάκων. Κλίµακα είναι µια τ.µ. (διακριτή ή συνεχής), η οποία, συνήθως, προκύπτει από άθροισµα άλλων τ.µ. Οι περισσότερες κλίµακες που έχουν προταθεί για τη µέτρηση της συµπεριφοράς χαρακτηρίζονται (αναφορικά µε τις αρχές µέτρησης): είτε από απουσία µεθοδολογικού πλαισίου, είτε από αυθαίρετο µεθοδολογικό πλαίσιο
Κλίµακα Συνιστώσα 1 (απλή κλίµακα), Χ 1 Συνιστώσα 2, Χ 2 Συνιστώσα 3, Χ 3 Συνιστώσα 4, Χ 4 Κλίµακα X κ = 1 X i Κατάσταση υγείας Συνιστώσα κ, Χ κ Διαγνωστική ακρίβεια Ζητούµενο Συνιστώσες της κλίµακας
Χρησιµότητα των κλιµάκων Εφαρµογή κλιµάκων Διάγνωση µέσω συµπτωµάτων Τελική έκβαση Ίαση, αναπηρία, θάνατος Υποκλινική εκδήλωση της νόσου µε διάφορα σηµεία. Αλλαγή µετρήσιµων βιοχηµικών ή άλλων χαρακτηριστικών Υγιειοδιαιτητική αγωγή Φαρµακευτική αγωγή Έναρξη Πορεία της νόσου Πορεία της ζωής
Παραδείγµατα κλιµάκων µέτρησης ποιότητας ζωής The following questions ask how much your heart failure (heart condition) affected your life during the past month (4 weeks). After each question, circle the 0, 1, 2, 3, 4 or 5 to show how much your life was affected. If a question does not apply to you, circle the 0 after that question. Minnesota Living With Heart Failure Questionnaire
Panagiotakos DB, Pitsavos C, Arvaniti F, Stefanadis C. Prev Med. 2006 Παραδείγµατα κλιµάκων µέτρησης διατροφικής συµπεριφοράς Το Μεσογειακό Διατροφικό Σκορ MedDietScore Πόσο συχνά καταναλώνετε τα παρακάτω τρόφιµα; Συχνότητα Κατανάλωσης (µερίδες/εβδοµάδα) 1. Δηµητριακά ολικής αλέσεως (π.χ. ψωµί, ζυµαρικά, ρύζι, κλπ) Ποτέ 1-6 7-12 13-18 19-31 >32 0 1 2 3 4 5 2. Πατάτες Ποτέ 1-4 5-8 9-12 13-18 >18 0 1 2 3 4 5 3. Φρούτα και χυµούς Ποτέ 1-4 5-8 9-15 16-21 >22 0 1 2 3 4 5 4. Λαχανικά και σαλάτες Ποτέ 1-6 7-12 13-20 21-32 >33 0 1 2 3 4 5 5. Όσπρια Ποτέ <1 1-2 3-4 5-6 >6 0 1 2 3 4 5 6. Ψάρι και σούπες Ποτέ <1 1-2 3-4 5-6 >6 0 1 2 3 4 5 7. Κόκκινο κρέας και προιόντα του 1 2-3 4-5 6-7 8-10 >10 5 4 3 2 1 0 8. Πουλερικά 3 4-5 5-6 7-8 9-10 >10 5 4 3 2 1 0 9. Γαλακτοκοµικά πλήρη σε λιπαρά 10 11-15 16-20 21-28 29-30 >30 5 4 3 2 1 0 10. Ελαιόλαδο στην καθηµερινή µαγειρική Ποτέ Σπάνια <1 1-3 3-5 καθημερινά+ 0 1 2 3 4 5 11. Αλκοολούχα ποτά (ml/ηµέρα, 100 ml = 1 ποτήρι 12%) <300 5 300 4 400 3 500 2 600 1 >700 ή 0 0
Παραδείγµατα κλιµάκων µέτρησης συναισθηµάτων Ψυχολογική αξιολόγηση (κλίµακα κατάθλιψης GDS) Επιλέξτε µια απάντηση που σας εκπροσωπεί καλύτερα για το τελευταίο διάστηµα (90 ηµέρες). ΝΑΙ ΟΧΙ Είστε βασικά ευχαριστηµένοι µε τη ζωή σας; 0 1 Εγκαταλείψατε πολλές από τις δραστηριότητες και τα ενδιαφέροντά σας; 1 0 Αισθάνεστε ότι η ζωή σας είναι άδεια; 1 0 Βαριέστε συχνά; 1 0 Είστε στα κέφια σας τον περισσότερο καιρό; 0 1 Φοβάστε ότι θα σας συµβεί κάτι κακό; 1 0 Αισθάνεστε ευτυχισµένος τον περισσότερο καιρό; 0 1 Αισθάνεστε συχνά αβοήθητος; 1 0 Προτιµάτε να µένετε στο σπίτι παρά να βγαίνετε έξω και να κάνετε διάφορα καινούρια πράγµατα; 1 0 Αισθάνεστε ότι έχετε περισσότερα προβλήµατα µε τη µνήµη σας απ ότι οι άλλοι; 1 0 Πιστεύετε ότι είναι υπέροχο πράγµα που είστε ζωντανός τώρα; 0 1 Αισθάνεστε άχρηστος έτσι όπως είστε τώρα; 1 0 Αισθάνεστε γεµάτος ενέργεια; 0 1 Αισθάνεστε ότι η κατάστασή σας είναι απελπιστική; 1 0 Πιστεύετε ότι οι περισσότεροι άνθρωποι είναι σε καλύτερη κατάσταση από εσάς; 1 0 ΣΥΝΟΛΙΚΟ(ΣΚΟΡ( Sheikh JI, Yesavage JA: Geriatric Depression Scale (GDSA Guide to Assessment and Intervention 165-173, NY: The Haworth Press, 1986.
Χαρακτηριστικά µιας κλίµακας Αξιοπιστία Εσωτερική συνοχή Επαναληψιµότητα επαναληπτότητα Εγκυρότητα
Αξιοπιστία (µτφρ Reliability) Η πιθανότητα µιας µέτρησης χωρίς αστοχία. Δηλαδή, η συνέπεια µε την οποία ένα ερωτηµατολόγιο µετράει ένα χαρακτηριστικό. Αξιοπιστία Τυχαίο σφάλµα
Χαρακτηριστικό της αξιοπιστίας Το ερωτηµατολόγιοκλίµακα Το χαρακτηριστικό για το οποίο το ερωτηµατολόγιο κατασκευάστηκε να µετρήσει Δηλ., µεγαλύτερες τιµές στη κλίµακα δεν οδηγούν σε αυξηµένη πιθανότητα εκτίµησης του στόχου (π.χ. άριστη ποιότητα διατροφής).
Μέθοδοι µέτρησης της αξιοπιστίας ενός ερωτηµατολογίου Η αξιοπιστία ενός ερωτηµατολογίου µετράται µέσω: Της εσωτερικής συνοχής του Της επαναληψιµότητας του (repeatability, testretest reliability) Της επαναληπτότητας τους (reproducibility, inter-rater reliability, αξιοπιστία µεταξύ των κριτών)
Εσωτερική συνοχή (µτφρ Internal consistency) Στα περισσότερα ερωτηµατολόγια κλίµακες υπάρχουν από τον κατασκευαστή περισσότερες από µια ερωτήσεις που αποτιµούν παρεµφερή χαρακτηριστικά. Η εσωτερική συνοχή είναι ένας δείκτης του κατά πόσο οι συναφείς ερωτήσεις στο ίδιο ερωτηµατολόγιο έχουν απαντηθεί µε παρόµοιο τρόπο από τους ερωτώµενους. Δηλ. αυτές οι ερωτήσεις αναµένεται να συσχετίζονται ισχυρά µεταξύ τους.
Εσωτερική συνοχή Πότε έχει σηµασία να ελεγχθεί; Ιδιαίτερη σηµασία έχει η εξασφάλιση εσωτερικής συνοχής του ερωτηµατολογίου όταν οι ερωτήσεις θα χρησιµοποιηθούν για τη δηµιουργία ενός δείκτη που θα διακρίνει «κλινική εικόνα» των ανθρώπων. Πλεονεκτήµατα: Απαιτείται µόνο µία συµπλήρωση του ερωτηµατολογίου. Οικονοµία σε χρόνο και χρήµα.
Μέτρα εσωτερικής συνοχής Μέση συσχέτιση µεταξύ των ερωτήσεων Μέση συσχέτιση των ερωτήσεων µε το σύνολο Συνοχή όταν τα ερωτήµατα διαιρούνται σε 2 οµάδες Το στατιστικό Cronbachs α
Επαναληψιµότητα Ελέγχουµε κατά πόσο τα αποτελέσµατα από το εργαλείο που χρησιµοποιούµε παραµένουν σταθερά στο χρόνο (σταθερότητα). Εφαρµόζουµε τον ίδιο έλεγχο (π.χ. ερωτηµατολόγιο) 2 φορές στο ίδιο δείγµα.
Επαναληψιµότητα Προσοχή! Σηµαντικό ρόλο παίζει το χρονικό διάστηµα που µεσολαβεί µεταξύ των µετρήσεων. Ενδέχεται ότι όσο µεγαλύτερο είναι το χρονικό διάστηµα τόσο µικρότερη θα είναι η συσχέτιση µεταξύ των 2 µετρήσεων. Αν είναι πολύ µικρό το χρονικό διάστηµα, ενδέχεται η δεύτερη µέτρηση να έχει επηρεαστεί από την πρώτη.
Η µέτρηση της επαναληψιµότητας Η µέτρηση της επαναληψιµότητας γίνεται µε: Μέθοδος των Blandt & Altman Συντελεστής συµφωνίας τ- του Kendall Kappa coefficient Intra-Class Correlation (ICC) coefficient Συντελεστής συσχέτισης
Επαναληπτότητα Όταν χρησιµοποιούµε πολλούς ερευνητές για µια µέτρηση ενδιαφερόµαστε για το αν τα αποτελέσµατα είναι αξιόπιστα/συνεπή. π.χ. Ας θεωρήσουµε ότι θέλουµε να αξιολογήσουµε τη µαστογραφία ως διαγνωστικό µέτρο για τη γρήγορη διάγνωση του Ca µαστού. Για να είναι αξιόπιστο µέτρο η µαστογραφία θα πρέπει όσοι ακτινολόγοι δουν τις ίδιες µαστογραφίες να διατυπώσουν το ίδιο συµπέρασµα. Για να ελέγξουµε αν δύο ή περισσότεροι παρατηρητές είναι συνεπείς στις παρατηρήσεις τους θα πρέπει να ελέγξουµε το βαθµό συµφωνίας τους.
Επαναληπτότητα Μέτρα Επαναληπτότητας: Cohens Kappa coefficient : όταν το χαρακτηριστικό που µετράµε είναι κατηγορικό, π.χ. ο ακτινολόγος λέει αν κάποια γυναίκα έχει Ca µαστού ή όχι, βλέποντας τη µαστογραφία. Intra-class correlation coefficient (ICC):όταν το χαρακτηριστικό µου µετράµε είναι ποσοτικό π.χ. ψυχολόγοι παρατηρούν κάποια άτοµα και βαθµολογούν µε ένα σκορ την επιθετικότητά τους.
Εγκυρότητα (µτφρ Validity) Η ικανότητα ενός ερωτηµατολογίου να αποτιµά το χαρακτηριστικό για το οποίο σχεδιάστηκε να µετρήσει.
Χαρακτηριστικό της εγκυρότητας Το ερωτηµατολόγιοκλίµακα Το χαρακτηριστικό για το οποίο το ερωτηµατολόγιο κατασκευάστηκε να µετρήσει Δηλ., µεγαλύτερες τιµές στη κλίµακα αυξηµένη πιθανότητα εκτίµησης του στόχου (π.χ. άριστη ποιότητα διατροφής).
Σχέση αξιοπιστίας & εγκυρότητας Αξιόπιστο, αλλά όχι έγκυρο εργαλείο Αξιόπιστο και έγκυρο εργαλείο Ούτε αξιόπιστο ούτε έγκυρο εργαλείο
Πότε απαιτείται έλεγχος αξιοπιστίας και εγκυρότητας; Στα ερωτηµατολόγια που αποσκοπούν στο να αξιολογήσουν κάποια µη µετρήσιµα χαρακτηριστικά χρησιµοποιώντας µια σειρά από ερωτήσεις. Π.χ. συναισθήµατα (άγχος, κατάθλιψη) ή συµπεριφορές (π.χ. επιθετικότητα κλπ), ποιότητα ζωής Ιδιαίτερη προσοχή πρέπει να δίνεται όταν χρησιµοποιούµε ερωτηµατολόγια που έχουν χρησιµοποιηθεί ευρέως και µε επιτυχία σε πληθυσµούς µε διαφορετικά χαρακτηριστικά από αυτά του δικού µας, Όταν µεταφράζουµε ένα ερωτηµατολόγιο.
Μορφές εγκυρότητας Φυσιογνωµική εγκυρότητα Έλεγχος του πόσο επαρκείς είναι οι ερωτήσεις που χρησιµοποιήθηκαν για την κατασκευή του εργαλείου. Εγκυρότητα περιεχοµένου Εκτίµηση από ειδικούς του πόσο κατάλληλες είναι οι ερωτήσεις που συµπεριλαµβάνονται στο εργαλείο προκειµένου να είναι εφικτή η πλήρης αξιολόγηση του φαινοµένου για το οποίο κατασκευάστηκε. Προβλεπτική εγκυρότητα Το εργαλείο µπορεί να χρησιµοποιηθεί για πρόβλεψη κάποιων µελλοντικών γεγονότων. Παράλληλη εγκυρότητα
Παράλληλη εγκυρότητα Εφαρµογή του ερωτηµατολογίου Κλινική αξιολόγηση από ειδικούς
Μεθοδολογικά ερωτήµατα Για την αύξηση της διαγνωστικής ακρίβειας µιας κλίµακας εγείρονται διάφορα µεθοδολογικά ερωτήµατα: Πόσες συνιστώσες θα έχει µια κλίµακα; Πόσες διαβαθµίσεις θα έχει η κάθε συνιστώσα; Η βαθµονόµηση των συνιστωσών µιας κλίµακας πρέπει να είναι µονότονη; Ποιος ο ρόλος του σφάλµατος στη βαθµονόµηση; Ποιος ο βαθµός συσχέτισης µεταξύ των συνιστωσών; Ποιος ο βαθµός συσχέτισης των συνιστωσών µε το διερευνούµενο χαρακτηριστικό; Τα βάρη στις συνιστώσες επηρεάζουν τη διαγνωστική ακρίβεια;
Με τη χρήση προσοµοιωµένων δεδοµένων Ν= 100 ή 1000 Δηµιουργία τ.µ. X i από διάφορες συνεχείς κατανοµές Δηµιουργία τ.µ. Υ από την διωνυµική, p=0,5, p=0,33 Διαµερίσεις των τ.µ. X i 2, 3, 4, 5, 6, 8, 10, 15, 50, 100 κλάσεις Άθροιση των τιµών τω ν τ.µ. X i κλίµακες Βαθµονόµση των τ.µ. X i Η διαδικασία επαναλήφθηκε 1000 φορές Υπολογισµός της διαγνωστικής ακρίβειας (Se, Spe, AUC) κάθε κλίµακας
Η διαγνωστική ακρίβεια µιας κλίµακας είναι αύξουσα συνάρτηση του αριθµού των διαµερίσεων. D1=1/ D1=0: 1 / 3 Σενάριο 1: Το µέγεθος δείγµατος σε κάθε αρχείο δεδοµένων ήταν 1000 και κάθε δείκτης προέκυψε αθροίζοντας 10 συνιστώσες. Σενάριο 2: Το µέγεθος δείγµατος σε κάθε αρχείο δεδοµένων ήταν 100 και κάθε δείκτης προέκυψε αθροίζοντας 10 συνιστώσες. Σενάριο 3: Το µέγεθος δείγµατος σε κάθε αρχείο δεδοµένων ήταν 1000 και κάθε δείκτης προέκυψε αθροίζοντας 5 συνιστώσες. Σενάριο 4: Το µέγεθος δείγµατος σε κάθε αρχείο δεδοµένων ήταν 100 και κάθε δείκτης προέκυψε αθροίζοντας 5 συνιστώσες. D1=1/ D1=0: 1 / 2 Κουρλαµπα Γ. Διδακτορική Διατριβή, 2010
Αριθµός διαµερίσεων των συνιστωσών ενός δείκτη Αριθµός διαµερίσεων, κ Πληροφορία, Ι Διαγνωστική ακρίβεια, Δ
Δυσταξινόµηση Στη µέτρηση της συµπεριφοράς η µη ορθή ταξινόµηση είναι σύνηθες φαινόµενο. Π.χ. ένα άτοµο βαθµολογεί τον πόνο 8/10 και σε άλλη χρονική στιγµή (για το ίδιο βιολογικά ερέθισµα) δίνει βαθµολογία 6/10. Περιορισµένη ικανότητα ποσοτικοποίησης του συναισθήµατος Ενδογενή προβλήµατα στην κλίµακα µέτρησης. Ασαφής ορισµός του συναισθήµατος.
Δυσταξινόµηση -2 +2-1 +1 «Αληθής» τιµή Σενάριο 1 25% δείγµατος Σενάριο 2 50% δείγµατος Σενάριο 3 75% δείγµατος
Η διαγνωστική ακρίβεια µιας κλίµακας είναι αύξουσα συνάρτηση του αριθµού των διαµερίσεων, ανεξαρτήτως του βαθµού δυσταξινόµησης. Η επίδραση του βαθµού δυσταξινόµησης στη διαγνωστική ακρίβεια των δεικτών που έχουν δηµιουργηθεί χρησιµοποιώντας συνιστώσες µε διαφορετικούς αριθµούς διαµερίσεων. Τα δεδοµένα παρουσιάζονται ως AUC (95% Διάστηµα Εµπιστοσύνης). Αριθµός των διαµερίσεων για κάθε συνιστώσα Δείκτες 10 4 3 2 S 0,893 (0,869-0,917) 0,888 (0,864-0,912) 0,882 (0,858-0,906) 0,850 (0,826-0,874) S 1_25 0,886 (0,862-0,909) 0,883 (0,859-0,907) 0,877 (0,853-0,900) 0,849 (0,825-0,873) S 2_25 0,867 (0,843-0,891) 0,863 (0,839-0,886) 0,859 (0,835-0,883) 0,836 (0,812-0,859) S 1_50 0,873 (0,849-0,897) 0,873 (0,849-0,897) 0,868 (0,844-0,892) 0,844 (0,820-0,868) S 2_50 0,822 (0,798-0,846) * 0,820 (0,796-0,844) * 0,813 (0,789-0,837) * 0,805 (0,781-0,829) * S 1_75 0,855 (0,831-0,879) * 0,859 (0,835-0,883) * 0,856 (0,832-0,880) * 0,835 (0,811-0,859) S 2_75 0,772 (0,748-0,796) * 0,771 (0,747-0,795) * 0,768 (0,744-0,792) * 0,752 (0,728-0,776) * S: Gold standardδείκτης S 1_25 : Ο δείκτης µε τις 10 διαµερίσεις δηµιουργήθηκε χρησιµοποιώντας ένα ποσοστό δυσταξινόµησης στο 25% του δείγµατος και σφάλµα ταξινόµησης ίσο µε ±1 διαµέριση σε σχέση µε τον S δείκτη. Οι υπόλοιποι δείκτες δηµιουργήθηκαν χρησιµοποιώντας συνιστώσες µε 2, 3 ή 4 διαµερίσεις. Αυτές προέκυψαν χρησιµοποιώντας τη διάµεσο, τα τριτηµόρια και τα τεταρτηµόρια των αρχικών συνιστωσών. κοκ * p<0,05 για σύγκριση µε την AUC του δείκτη S. AUC: Επιφάνεια κάτω από την ROC καµπύλη
Η διαγνωστική ακρίβεια µιας κλίµακας είναι αύξουσα συνάρτηση του αριθµού των συνιστωσών της κλίµακας που συσχετίζονται µε την εξαρτηµένη µτβλ. Η AUC (95% Διάστηµα Εµπιστοσύνης) των δεικτών ανάλογα µε το βαθµό συσχέτισης των συνιστωσών µε την κατάσταση υγείας/ έκβαση που ο δείκτης αποσκοπεί να αξιολογήσει. Αριθµός των συνιστωσών που δηµιουργήθηκαν χωρίς να συσχετίζονται µε την έκβαση (D) Δείκτες 2 εκ των 10 5 εκ των 10 8 εκ των 10 Όλες I 0,936 (0,935 0,937)* 0,842 (0,841 0,843)* 0,649 (0,648 0,650)* 0,501 (0,499 0,502) I100 0,928 (0,927 0,929)* 0,824 (0,823 0,825) 0,639 (0,638 0,640) 0,501 (0,499 0,502) I50 0,928 (0,927 0,929)* 0,824 (0,823 0,825) 0,639 (0,638 0,640) 0,501 (0,499 0,502) I15 0,928 (0,927 0,929)* 0,823 (0,822 0,825) 0,639 (0,638 0,640) 0,500 (0,499 0,502) I10 0,928 (0,927 0,929)* 0,823 (0,822 0,825) 0,639 (0,638 0,640) 0,501 (0,499 0,502) I8 0,927 (0,926 0,928)* 0,822 (0,821 0,823) 0,638 (0,637 0,639) 0,500 (0,499 0,502) I6 0,926 (0,925 0,927)* 0,821 (0,820 0,822) 0,637 (0,636 0,638) 0,500 (0,499 0,502) I5 0,924 (0,923 0,925) 0,819 (0,818 0,820) 0,636 (0,635 0,637) 0,501 (0,499 0,502) I4 0,921 (0,920 0,922) 0,817 (0,816 0,819) 0,635 (0,634 0,636) 0,501 (0,499 0,502) I3 0,915 (0,914 0,916) 0,810 (0,809 0,811) 0,631 (0,630 0,632) 0,501 (0,499 0,502) I2 0.894 (0,893 0.895) 0,790 (0,789 0,791) 0,619 (0,618 0,619) 0,500 (0,499 0,502)
Συνιστώσες και εξαρτηµένη µτβλ Συνιστώσα 1 (απλή κλίµακα), Χ 1 Συνιστώσα 2, Χ 2 Συνιστώσα 3, Χ 3 Συνιστώσα 4, Χ 4 Κλίµακα X κ = 1 X i Περιγραφή ενός χαρακτηριστικού Κατάσταση υγείας Συνιστώσα κ, Χ κ Ποιο είναι το ζητούµενο ;
Η διαγνωστική ακρίβεια µιας κλίµακας είναι φθίνουσα συνάρτηση του βαθµού ενδοσυσχέτισης των συνιστωσών. Η AUC (95% Διάστηµα Εµπιστοσύνης) των δεικτών που δηµιουργούνται χρησιµοποιώντας συνιστώσες µε διαφορετικούς βαθµούς συσχέτισης µεταξύ τους και διαφορετικό αριθµό διαµερίσεων. I10 I8 I6 Δείκτες Βαθµός αλληλοσυσχέτισης των συνιστωσών Ασυσχέτιστες συνιστώσες Ελαφρά συσχετισµένες Μέτρια έως ισχυρά συσχετισµένες 0,941 (0,940 0,942) 0,909 (0,908 0,910) 0,761 (0,759 0,762) 0,925 (0,924 0,926) 0,887 (0,886 0,888) 0,758 (0,757 0,759) 0,912 (0,911 0,913) 0,882 (0,881 0,883) 0,754 (0,753 0,755) I5 I4 I3 I2 0,903 (0,902 0,904) 0,876 (0,875 0,878) 0,750 (0,749 0,751) 0,889 (0,888 0,890)* 0,870 (0,869 0,871) 0,750 (0,749 0,751) 0,885 (0,884 0,886) * 0,864 (0,863 0,865) * 0,749 (0,748 0,750) 0,883 (0,882 0,884)* 0,860 (0,859 0,861) * 0,748 (0,747 0,749) 0,02 r 0,15 για κάθε συνιστώσα µε τις υπόλοιπες 0,25 r 0,75 για κάθε συνιστώσα µε τις υπόλοιπες * p-value<0,05 για σύγκριση µε τον δείκτη Ι10 p-value<0,05 για σύγκριση µε τον δείκτη Ι8
Η διαγνωστική ακρίβεια των δεικτών που δηµιουργούνται χρησιµοποιώντας µόνο συνιστώσες που συσχετίζονται µε την έκβαση είναι υψηλότερη σε σχέση µε αυτή των δεικτών όπου ορισµένες συνιστώσες συσχετίζονται µε την έκβαση. Σύγκριση ανάµεσα στη διαγνωστική ακρίβεια δεικτών που δηµιουργήθηκαν χρησιµοποιώντας 10 µετρίως έως ισχυρά συσχετισµένες µε την έκβαση συνιστώσες, χρησιµοποιώντας µόνο τις συνιστώσες που συσχετίζονται µε την έκβαση και τη διαγνωστική ακρίβεια µεµονωµένων συνιστωσών µεταξύ αυτών που συσχετίζονται µε την έκβαση. Δείκτες που δηµιουργήθηκαν χρησιµοποιώντας 10 συνιστώσες Μέτρα διαγνωστικής ακρίβειας 1 ασυσχέτιστη και 9 συσχετισµένες µε την έκβαση 3 ασυσχέτιστες και 7 συσχετισµένες µε την έκβαση 5 ασυσχέτιστες και 5 συσχετισµένες µε την έκβαση 8 ασυσχέτιστες και 2 συσχετισµένες µε την έκβαση AUC (95% ΔΕ) 0,720 (0,685 0,755) 0,762 (0,729 0,795) 0,642 (0,602 0,682) 0,581 (0,541 0,619) Ευαισθησία (95% ΔΕ) 66,3 (58,7% - 73,9%) 69,2% (62,3% - 76,1%) 59,9% (51,7% - 68,1%) 55,9% (45,8% - 65,9%) Ειδικότητα (95% ΔΕ) 67,0% (58,8% - 75,2%) 70,4% (63,0% - 77,8%) 61,7% (53,2% - 70,2%) 56,9 (46,5% - 67,3%) Δείκτες που δηµιουργήθηκαν χρησιµοποιώντας µόνο συνιστώσες που συσχετίζονται µε την έκβαση 9 συσχετισµένες µε την έκβαση 7 συσχετισµένες µε την έκβαση 5 συσχετισµένες µε την έκβαση 2 συσχετισµένες µε την έκβαση AUC (95% ΔΕ) 0,743 (0,709 0,776) 0,848 (0,823 0,873) 0,749 (0,716 0,782) 0,842 (0,812 0,872) Ευαισθησία (95% ΔΕ) 68,2% (61,4% - 75,2%) 77,0% (71,3% - 82,6%) 68,1% (60,9% - 75,3%) 75,9% (69,2% - 82,5%) Ειδικότητα (95% ΔΕ) 68,4% (61,1% - 75,7%) 77,1% (71,2% - 82,9%) 68,8% (61,4% - 76,4%) 76,9% (70,4% - 83,4%) Μία µόνο συνιστώσα που συσχετίζεται µε την έκβαση AUC (95% ΔΕ) 0,737 (0,702 0,772) 0,770 (0,735-0,805) 0,737 (0,702 0,772) 0,770 (0,735-0,805) Ευαισθησία (95% ΔΕ) 68,3% (62,3% - 74,3%) 70,1% (66,4% - 73,8%) 68,3% (62,3% - 74,3%) 70,1% (66,4% - 73,8%) Ειδικότητα (95% ΔΕ) 67,1% (60,6% - 73,6%) 70,4% (64,7% - 76,1%) 67,1% (60,6% - 73,6%) 70,4% (64,7% - 76,1%) p<0,05 για τη σύγκριση µε την AUC, ευαισθησία ή ειδικότητα του δείκτη που δηµιουργήθηκε χρησιµοποιώντας αυτές τις 7 συνιστώσες που συσχετίζονται µε την έκβαση και 3 επιπλέον που δεν συσχετίζονται p<0,05 για τη σύγκριση µε την AUC, ευαισθησία ή ειδικότητα του δείκτη που δηµιουργήθηκε χρησιµοποιώντας αυτές τις 5 συνιστώσες που συσχετίζονται µε την έκβαση και 5 επιπλέον που δεν συσχετίζονται p<0,05 για τη σύγκριση µε την AUC, ευαισθησία ή ειδικότητα του δείκτη που δηµιουργήθηκε χρησιµοποιώντας αυτές τις 2 συνιστώσες που συσχετίζονται µε την έκβαση και 8 επιπλέον που δεν συσχετίζονται AUC: Επιφάνεια κάτω από την ROC καµπύλη
Χρήση σταθµισµένων δεικτών Είναι φανερό ότι δεν έχουν όλες οι συνιστώσες ενός δείκτη τον ίδιο βαθµό συσχέτισης µε την εξαρτηµένη µτβλ. Η χρήση βαρών για τις συνιστώσες µπορεί να αυξήσει τη διαγνωστική ακρίβεια; Ποια βάρη είναι τα πιο κατάλληλα;
Η διαγνωστική ακρίβεια των δεικτών που δηµιουργούνται µε τη χρήση βαρών σε κάθε συνιστώσα είναι µεγαλύτερη αυτής των µη σταθµισµένων δεικτών. Αποτελέσµατα από τη µελέτη προσοµοιωµένων δεδοµένων. Διαγνωστική ακρίβεια των δεικτών που δηµιουργήθηκαν χρησιµοποιώντας τα ίδια βάρη για όλες τις συνιστώσες (S1) ή ειδικά βάρη για κάθε συνιστώσα (S2, S3, S4 και S5). Μέτρα διαγνωστικής ακρίβειας Χρησιµοποιώντας τη διάµεσο των δεικτών AUC ως κατώφλι Δείκτες( Ευαισθησία Ειδικότητα (95% ΔΕ) (95% ΔΕ) (95% ΔΕ) Αρχικό(αρχείο( S1 0,641 (0,602-0,680) 65% (59% - 71%) 55% (51% - 59%) S2 0,709 (0,674-0,745) ** 74% (69% - 79%) * 59% (57% - 61%) S3 0,709 (0,674-0,745) ** S4 0,710 (0,675-0,746) ** S5 0,702 (0,666-0,738) ** 74% (69% - 79%) * 59% (57% - 61%) 72% (66% - 78%) * 57% (54% - 60%) 72% (66% - 78%) * 57% (51% - 59%) Αρχείο(για(ελέγχου(εγκυρότητας(( S1 0,642 (0,603-0,680) 58% (50%-64%) 57% (53%-61%) S2 0,737 (0,703-0,771) ** 76% (71%-81%) ** 59% (55%-63%) S3 0,737 (0,703-0,771) ** S4 0,742 (0,709-0,775) ** S5 0,728 (0,698-0,762) ** 76% (71%-81%) ** 59% (55%-63%) 78% (73%-83%) ** 59% (55%-63%) 76% (71%-81%) ** 58% (54%-62%) Για τις συνιστώσες του S2, οι Σχετικοί Λόγοι που αποκτήθηκαν από τα µοντέλα απλής λογαριθµιστικής παλινδρόµησης, όταν οι συνιστώσες εισήχθησαν ως κατηγορικές µεταβλητές, χρησιµοποιήθηκαν ως βάρη. Για τις συνιστώσες του S3, οι Σχετικοί Λόγοι που αποκτήθηκαν από τα µοντέλα πολλαπλής λογαριθµιστικής παλινδρόµησης, όταν οι συνιστώσες εισήχθησαν ως κατηγορικές µεταβλητές, χρησιµοποιήθηκαν ως βάρη. Για τις συνιστώσες του S4, το γινόµενο των βαρών που προέκυψαν από την µέθοδο που χρησιµοποιήθηκε για τους δείκτες S2 και S3 µε το Deviance statistic/10 των µοντέλων πολλαπλής λογαριθµιστικής παλινδρόµησης χρησιµοποιήθηκαν ως βάρη. Για τις συνιστώσες του S5, το γινόµενο των βαρών που προέκυψαν από την µέθοδο που χρησιµοποιήθηκε για τους δείκτες S2 και S3 µε το αντίστροφο της διακύµανσης του ΣΛ χρησιµοποιήθηκαν ως βάρη.
Συµπεράσµατα Η διαγνωστική ακρίβεια ενός δείκτη αυξάνει όσο αυξάνει ο αριθµός των διαµερίσεων των συνιστωσών του δείκτη, Το συγκεκριµένο εύρηµα ισχύει ανεξάρτητα από το βαθµό συσχέτισης µεταξύ των συνιστωσών και το βαθµό συσχέτισης των συνιστωσών µε την έκβαση που ο δείκτης αποσκοπεί να αξιολογεί. Η διαγνωστική ακρίβεια ενός δείκτη αυξάνει όσο αυξάνει ο αριθµός των συνιστωσών. η αύξηση είναι µεγαλύτερη όταν οι συνιστώσες συσχετίζονται καθόλου ή ελαφρώς µεταξύ τους, όταν οι συνιστώσες συσχετίζονται µε το χαρακτηριστικό που ο δείκτης αποσκοπεί να αξιολογεί Η διαγνωστική ακρίβεια ενός δείκτη αυξάνει όταν αποδίδονται ειδικά βάρη σε κάθε συνιστώσα, λαµβάνοντας υπόψη το βαθµό συσχέτισης κάθε συνιστώσας µε την έκβαση.
Βιβλιογραφικές αναφορές Kourlaba G, Panagiotakos DB. Dietary quality indices and human health: A review. Maturitas 2009; 62(1):1-8 Kourlaba G, Panagiotakos D, Stavrinos V. The diagnostic accuracy of composite indices is associated with the number of partitions of their components: A simulation study. Adv Appl Statistics 2008:8;89-99. Kourlaba G, Polychronopoulos E, Zampelas A, Lionis C, Panagiotakos D. Development of a diet index for the elderly and its relation to cardiovascular disease risk factors; The Elderly Dietary Index. J Am Diet Assoc 2009; 109(6): 1022-1030 Kourlaba G, Panagiotakos D. The diagnostic accuracy of a composite index increases as the number of partitions of the components increases and when specific weights are assigned to each component. J Appl Stat 2009 (In press) Kourlaba G, Panagiotakos DB. The number of index components affects the diagnostic accuracy of a diet quality index: The role of intra- and intercorrelation structure of the components. Ann Epidemiology 2009; 19(10): 692-700
Συµπεράσµατα Κλίµακες µέτρησης της ποιότητας ζωής σύνδεση των µαθηµατικών µε την Κοινωνία.
Επόµενα βήµατα Μαθηµατική θεµελίωση των ευρηµάτων των προσοµοιώσεων. Πρόταση κατάλληλων βαρών για τις συνιστώσες ενός δείκτη. Πρόταση για τον ιδανικό αριθµό των συνιστωσών ενός δείκτη.