ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ Μ. ΑΡΒΑΝΙΤΙΔΟΥ- ΒΑΓΙΩΝΑ ΚΑΘΗΓΗΤΡΙΑ
ΚΛΙΝΙΚΑ ΣΗΜΑΝΤΙΚΟ ΕΥΡΗΜΑ VS ΣΤΑΤΙΣΤΙΚΑ ΣΗΜΑΝΤΙΚΟ ΕΥΡΗΜΑ Ι 1. Η στατιστική σημαντικότητα αντανακλά την επίδραση της τύχης στο αποτέλεσμα ενώ η κλινική σημαντικότητα αντανακλά τη βιολογική αξία του αποτελέσματος. (π.χ. διαφορά 0,02 Kg σε δύο μεγάλες ομάδες ενηλίκων δεν αποτελεί κλινικό εύρημα ακόμη και εάν αυτή η διαφορά αποδεχτεί τυχαία 1 φορά στις 100 p<0.01, ή 1 στους 100000 p<0,00001) 2. Η στατιστική βασίζεται στην πιθανότητα,όχι στη βιολογία, αναφέρεται σε πληθυσμούς, οι κλινικοί θεραπεύουν άτομα. 3. Τα συμπεράσματα στη στατιστική απαιτούν επαρκή αριθμό δεδομένων για να είναι ισχυρά, οι κλινικές αποφάσεις συχνά πρέπει να παρθούν με ανεπαρκή δεδομένα. Απουσία αποδείξεων δεν αποτελεί απόδειξη απουσίας.
ΚΛΙΝΙΚΑ ΣΗΜΑΝΤΙΚΟ ΕΥΡΗΜΑ VS ΣΤΑΤΙΣΤΙΚΑ ΣΗΜΑΝΤΙΚΟ ΕΥΡΗΜΑ ΙΙ 4. Οι στατιστικές απαντήσεις είναι πιθανότητες, η ιατρική θεραπεία απαιτεί δεσμευτικές αποφάσεις. Ακόμη και στις περιπτώσεις p<0.001 μπορεί να είναι αποτέλεσμα τύχης. Το αποτέλεσμα από κάποιο δείγμα είναι εκτίμηση του τα περιμένουμε σε μεγάλο πληθυσμό. 5. Η στατιστική ανάλυση πάντα απαιτεί μέτρηση, η ιατρική πράξη μερικές φορές χρειάζεται διαίσθηση. Δυστυχώς δεν μετρώνται όλα στην ιατρική (πόνος, ποιότητα ζωής, καρδιακή ηπατική λειτουργία) καιοιμετρήσειςδενείναι ικανές να αντικαταστήσουν εμπειρία οξυδέρκεια, διαίσθηση κ.α. 6. Οι στατιστικές και κλινικές εφαρμογές του όρου Κανονικός συχνά συγχέονται και είναι ασαφείς. Στη στατιστική ο όρος Κανονικός γενικά αναφέρεται στην κατανομή των τιμών. Στην ιατρική ο όρος συνήθως χρησιμοποιείται για το κοινό, αποδεκτό ή υγιές.
ΔΙΑΤΥΠΩΣΗ ΕΡΩΤΗΣΕΩΝ ΑΝΑΖΗΤΗΣΗ ΑΠΑΝΤΗΣΕΩΝ Ερευνητικός στόχος Είδος μελέτης Καθορισμός δείγματος Συλλογή δεδομένων Καθορίζουν ποιές στατιστικές δοκιμασίες είναι κατάλληλες, πώς, και πότε εφαρμόζονται στα δεδομένα.
III. Πληθυσμός και δείγμα Σκοπός να προβούμε σε συμπεράσματα για τον πληθυσμό από τη μελέτη και τον έλεγχο του δείγματος. Για να συμβεί αυτό πρέπει : να είναι τυχαίο δηλαδή κάθε μονάδα του πληθυσμού να έχει ίσες πιθανότητες να συμπεριληφθεί στο δείγμα να είναι αντιπροσωπευτικό, να έχει τις ιδιότητες και τα χαρακτηριστικά του πατρικού πληθυσμού, να έχουν εφαρμοσθεί οι επιστημονικές μέθοδοι δειγματοληψίας ο πληθυσμός να καθορίζεται στην αρχή της έρευνας με μεγάλη ακρίβεια απλή τυχαία δειγματοληψία δειγματοληψία κατά στρώματα συστηματική δειγματοληψία δειγματοληψία κατά ομάδες
Πληθυσμός-Δείγμα Πληθυσμός: Συσσώρευση ατόμων, πραγμάτων γεγονότων (άτομα, αντικείμενα, γεγονότα, διαδικασίες, παρατηρήσεις) Δείγμα: Επιλέγεται από μεγαλύτερο πληθυσμό, είναι αντιπροσωπευτικό, ανεξάρτητο,χρησιμοποιείται για εκτιμήσεις σημαντικών πληροφοριών όλου του πληθυσμού
Ι. Τι ονομάζουμε Μεταβλητή; Κάθε τι που μεταβάλλεται, ποικίλλει ή παραλλάσσει, έχει όνομα και τιμή (χαρακτηριστικό, ιδιότητα, ικανότητα, παράγοντας). Ποιοτικές μεταβλητές : φύλο, οικογενειακή κατάσταση, μορφωτικό επίπεδο, θρησκεία κατηγορίες κατά το δυνατόν αδιάκριτες και οπωσδήποτε αμοιβαία αποκλειόμενες όταν η μεταβλητή διαθέτει δύο επίπεδα (διχοτομική). Ποσοτικές μεταβλητές : ηλικία, βάρος, ύψος, CK, ομοκυστεϊνη διαθέτουν μονάδα μέτρησης - Συνεχής ποσοτική : κυμαίνεται ανάμεσα σε ελάχιστη και μέγιστη τιμή πραγματικών αριθμών και παίρνει οποιαδήποτε τιμή. - Διακριτή ποσοτική μεταβλητή: δεν κτενίζει όλες τις δυνατές τιμές αλλά λαμβάνει ορισμένες, διακριτές τιμές, πάντα ακέραιοι αριθμοί.
Παραδείγματα από διάφορους τύπους δεδομένων Ποσοτικές μεταβλητές Συνεχείς Δείκτης μάζας σώματος (ΔΜΣ), ηλικία, βάρος, αρτηριακή πίεση Ασυνεχείς ο αριθμός επισκέψεων σε ένα ιατρείο ημέρες νοσηλείας στη μονάδα εντατικής θεραπείας Ποιοτικές μεταβλητές Ονομαστικές Ναι/Όχι Φύλο (Άντρας/Γυναίκα) Ομάδα αίματος A, B, AB, Ο Διατακτικές Στάδια καρκίνου Ελάχιστος, μέτριος, έντονος πόνος
ΙΙ. Η θέση μιας μεταβλητής σε ένα στατιστικό μοντέλο Ανεξάρτητη (independent, predictor variable) : όταν εκτιμάται η επίδρασή της σε άλλη/ες μεταβλητές Εξαρτημένη (dependant response) : ότανητιμήτης επηρεάζεται ή προσδιορίζεται από τις μεταβολές της ανεξάρτητης μεταβλητής Παρασιτική ή αστάθμητη μεταβλητή (confounding)
ΙV. Κλίμακες μέτρησης Ονομαστικές ή κατηγορικές (nominal scales) (φύλο, θρησκεία): κάθε παρατηρησιακή μονάδα ανήκει σε μία κατηγορία η οποία διακρίνεται με σαφή τρόπο από τις υπόλοιπες. Τακτικές κλίμακες (ordinal scales) η ένταξη των υποκειμένων γίνεται σε κατηγορίες σαφείς, ισοδύναμες και διατεταγμένες (βαθμός ικανοποίησης, στάδια νόσου). Aριθμητικές ή ισοδιαστημικές κλίμακες (interval scales): Τα υποκείμενα εντάσσονται σε σαφώς καθορισμένες, αμοιβαία αποκλειόμενες, διατεταγμένες κατηγορίες και χρησιμοποιούν σταθερή μονάδα μέτρησης. Αναλογικές κλίμακες (ratio scales): Οι αναλογικές κλίμακες έχουν όλα τα χαρακτηριστικά των διαστημικών και επιπλέον διαθέτουν τον πραγματικό εναρκτήριο σημείο αναφοράς το οποίο αντιστοιχεί το απόλυτο Ο.
ΑΝΑΦΟΡΑ ΠΟΣΟΣΤΩΝ Όταν γράφουμε ποσοστά, πάντα δίνουμε τον αριθμητή και τον παρανομαστή π.χ. 30 από 90 ασθενείς (33%) Από 1000 άνδρες με καρδιολογικό νόσημα οι 800 (80%) είχαν υψηλή χοληστερόλη και από αυτούς τους 800 οι 250 (31%) είχαν καθιστική δουλειά. Όταν το μέγεθος του δείγματος είναι μεγαλύτερο του 100, στο ποσοστό δεν χρησιμοποιούμε περισσότερο από ένα δεκαδικό. Όταν είναι μικρότερο του 100 δεν χρησιμοποιούμε δεκαδικό. Όταν είναι μικρότερο του 20 δεν αναφέρουμε ποσοστά.
ΠΕΡΙΓΡΑΦΗ ΣΥΝΕΧΩΝ ΜΕΤΑΒΛΗΤΩΝ ΚΕΝΤΡΙΚΗ ΤΑΣΗ ΚΑΙ ΔΙΑΣΠΟΡΑ ΣΤΗΝ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Μέση τιμή δείχνουν εάν SD δείχνουν Διάμεση υπάρχει Εύρος τιμών διασπορά Επικρατούσα συρροή Τεταρτημόρια τιμών SEM Δείκτες ασυμμετρίας: στρεβλότητα, κύρτωση Δείκτες ομοιογένειας: CV Θηκογράμματα (box plots) και dot charts κατάλληλα και για κανονική κατανομή και μη κανονική κατανομή. Μη χρησιμοποιείτε μέσο όρο και τυπικό σφάλμα του μέσου (standard error of the mean, SEM)
ΠΕΡΙΓΡΑΦΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Χρησιμοποιούμε τη μέση τιμή και την τυπική απόκλιση μόνο για περιγραφή δεδομένων με κανονική κατανομή (εξοικείωση όλων). Επειδή τα περισσότερα βιολογικά χαρακτηριστικά δεν κατανέμονται κανονικά η διάμεση τιμή, το εύρος τιμών και τα τεταρτημόρια είναι τα ενδεδειγμένα περιγραφικά στοιχεία στην ιατρική. Όταν η τυπική απόκλιση ξεπερνά το μισό της μέσης τιμής τότε τα δεδομένα δεν έχουν κανονική κατανομή - προϋπόθεση αρνητικές τιμές να είναι αδύνατες. Όταν η μέση τιμή είναι μεγαλύτερη από τη διάμεσο η καμπύλη δεν είναι κανονική, στρέφεται στα δεξιά. Μην χρησιμοποιείτε το SEM για περιγραφή των δεδομένων. Το 95% CI προτιμώνται για την περιγραφή μιας εκτίμησης. Η μεταβλητότητα δύο ή περισσότερων μεταβλητών δίνεται καλύτερα με το CV (coefficient of variation). CV = (SD/mean) x 100%.
Το τυπικό σφάλμα του μέσου είναι μέτρηση ακρίβειας για ένα υπολογιζόμενο πληθυσμιακό μέσο, ενώ η τυπική απόκλιση (SD) δείχνει την μεταβλητότητα των πραγματικών τιμών γύρω από το μέσο όρο των τιμών που μετρήθηκαν σε δείγμα. Το SEM δεν είναι περιγραφική στατιστική. Λάθος όταν χρησιμοποιείται. ΓΙΑΤΙ ΤΟΤΕ ΧΡΗΣΙΜΟΠΟΙΕΙΤΑΙ? Παράδειγμα: 100 άνδρες βάρους 72 Kg SD = 8 Kg Περιγραφική στατιστική Σε κανονική κατανομή 68% (⅔ περίπου) ζυγίζουν 64 80 Kg Σε πληθυσμιακό επίπεδο από όπου προήλθε το δείγμα SEM = SD/ n = 8/ 100 = 0.8 Η ΕΞΗΓΗΣΗ σε τυχαία δείγματα 100 ανδρών από τον ίδιο πληθυσμό τα ⅔ (68%) αναμένεται να έχουν μέσο βάρος 71,2 έως 72,8 Kg Στην περίπτωση αυτή το εκφράζουμε ως μέσο βάρος 72 Kg (95% CI) 70,4 73,6
ΠΕΡΙΓΡΑΦΗ ΔΕΔΟΜΕΝΩΝ Δεδομένα κατά ζεύγη (συγκέντρωση ορμόνης πριν και μετά θεραπεία) δίδονται συγχρόνως σε πίνακα ή γράφημα. Σε μη κανονική κατανομή κάνουμε μετατροπή των τιμών (λογαριθμική, εκθετική, τετραγωνική ρίζα). Τα αποτελέσματα της ανάλυσης πρέπει να μετατραπούν στην αρχική μορφή για να είναι αξιολογήσιμα (π.χ. Kg Kg²)
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΡΙΘΜΗΤΙΚΗ ΑΚΡΙΒΕΙΑ Αναφορά των αριθμών με τον κατάλληλο βαθμό ακρίβειας. Υπερβολική ακρίβεια (π.χ. μέσο βάρος 67.873 Kg) Τα αριθμητικά δεδομένα στρογγυλοποιούνται όταν παρουσιάζονται, όχι όταν αναλύονται. Στις περισσότερες κλινικές και βιολογικές μελέτες, αριθμοί με τρία ή περισσότερα δεκαδικά θα πρέπει να ελέγχονται για περιττή ακρίβεια.
ΙΣΧΥΣ ΚΑΙ ΣΧΕΤΙΖΟΜΕΝΟΙ ΠΑΡΑΓΟΝΤΕΣ ΜΕΓΕΘΟΣ ΤΟΥ ΔΕΙΓΜΑΤΟΣ (αυξάνει με μεγάλο δείγμα) ΜΕΤΑΒΛΗΤΟΤΗΤΑ ΤΟΥ ΔΕΙΓΜΑΤΟΣ (αυξάνει όσο μειώνεται η μεταβλητότητα) Η ΕΠΙΔΡΑΣΗ ΕΝΔΙΑΦΕΡΟΝΤΟΣ (είναι μεγαλύτερη για μεγαλύτερες επιδράσεις) ΤΟ ΕΠΙΠΕΔΟ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ (αυξάνει αν το επίπεδο σημαντικότητας είναι μεγαλύτερο)
ΣΥΓΚΡΙΣΗ ΟΜΑΔΩΝ Όσο περισσότερες υποθέσεις ελέγχονται σε μια βάση δεδομένων τόσο πιθανότερο να διαπράξουμε λάθος τύπου Ι, δηλαδή να συμπεράνουμε μια σημαντική διαφορά ενώ στην πραγματικότητα ισχύει η υπόθεση Ο. Ησυσχέτιση(association) όταν είναι σημαντική δεν αποδεικνύει αιτία. «Ψαρεύοντας προσδοκίες». Ο ψαράς και η μπότα. Η κατάσταση p ing στις εργασίες. Επιλογή από τις συγκρίσεις μόνον εκείνες που δείχνουν στατιστικά σημαντική διαφορά : Λάθος. Υπερκατάτμιση των μεταβλητών έλεγχος κατά ζεύγη (ενώ πρέπει π.χ. AVONA Bonferroni s διόρθωση για τις πολλαπλές δοκιμασίες νέα alpha = παλιό alpha / n. π.χ. Εάν 12 τιμές p προσδιορίστηκαν με επίπεδο alpha 0.05 νέο alpha 0,05/12 τοp θεωρείται στατιστικά σημαντικό εάν <0.004.
ΣΥΓΚΡΙΣΗ ΠΟΣΟΤΙΚΗΣ ΜΕΤΑΒΛΗΤΗΣ ΜΕΤΑΞΥ ΔΥΟ ΔΕΙΓΜΑΤΩΝ ΙΙ 7. Παράγοντες που επηρεάζουν τη στατιστική δύναμη μιας δοκιμασίας κάθε φορά είναι: το μέγεθος του δείγματος (σε μικρά δείγματα a level 0.10,0.15 αντί 0.05) πόσο μεγάλη είναι η διαφορά της ανεξάρτητης μεταβλητής μεταξύ των ομάδων a level που καθορίζει ο ερευνητής (π.χ.0.05, 0.01) a priori και post hoc ή posteriori συγκρίσεις (Bonferroni 0.05/ν συγκρίσεις) effect size (eta square=το ποσοστό της διακύμανσης της εξαρτημένης μεταβλητής που ερμηνεύεται από την ανεξάρτητη) eta square=t 2 / t 2 +(N 1 +N 2-2) 0.01= μικρή επίδραση 0.06=μέτρια επίδραση 0.14=μεγάλη επίδραση
ΠΕΡΙΓΡΑΦΗ ΚΑΤΗΓΟΡΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ Καθορισμός των όρων του κλάσματος στην αναλογία (ratio) στο ποσοστό (proportion) στην εκατοστιαία αναλογία (percentage). Προτιμότερο να αναφέρουμε ως κείμενο παρά σχηματικά (στήλες). Εάν μια ποσοτική συνεχής μεταβλητή μετατραπεί σε κατηγορική, επεξηγούμε τα όρια (cut-οff points) και τη λογική για τη μετατροπή αυτή. Προσοχή στην επεξήγηση και ερμηνεία μιας κατηγορικής μεταβλητής την οποία χειριστήκαμε ως συνεχή μεταβλητή π.χ. ένταση μιας νόσου 1=απουσία, 2=ήπιας, 3=μέτριας, 4=μεγάλης βαρύτητας π.χ. μέση τιμή 2,3. Αντίθετα σε 7βάθμια κλίμακα ικανοποίησης από ιατρικές υπηρεσίες μπορεί να χρησιμοποιηθεί μέση τιμή π.χ. 5,3.