Εισαγωγή στη Βιοστατιστική Π.Μ.Σ.: Έρευνα στη Γυναικεία Αναπαραγωγή Οκτώβριος Νοέμβριος 2017 1
Περιεχόμενα Ορισμός της Στατιστικής Περιγραφική στατιστική t-test Δοκιμασία X 2 Μη-παραμετρικές δοκιμασίες Συντελεστές συσχέτισης Απλή γραμμική παλινδρόμηση, ANOVA Πολλαπλή γραμμική παλινδρόμηση Λογαριθμιστική παλινδρόμηση 2
Διδακτικά Εγχειρίδια (προαιρετικά) Βιοστατιστική Δ. Τριχόπουλος, Α. Τζώνου και Κ. Κατσουγιάννη Επιστημονικές εκδόσεις Μαρίας Παρισιάνου Αρχές της Βιοστατιστικής Pagano, M. and Gauvreau K. (μετάφραση στα ελληνικά Ουρ. Δαφνή). Eκδόσεις Έλλην 3
Τι είναι η Στατιστική; Εργαλείο αποκάλυψης της αλήθειας που υπάρχει στα δεδομένα; Εργαλείο απόκρυψης της αλήθειας που υπάρχει στα δεδομένα; «Ψεύδεστε δια της Στατιστικής» Πονοκέφαλος όσων την χρειάζονται αλλά δεν την γνωρίζουν; 4
Ορισμός «Στατιστική είναι η τέχνη του να μαθαίνεις από τα δεδομένα. Περιλαμβάνει τη συλλογή δεδομένων, την περιγραφή τους και την ανάλυσή τους, η οποία συνήθως οδηγεί σε συμπεράσματα» (Ross, 2005) 5
Τι είναι η Βιοστατιστική (Ιατρική Στατιστική); Η επιστήμη που ασχολείται με τη συλλογή τη διαχείριση την ανάλυση την ερμηνεία των αριθμητικών δεδομένων και ερευνητικών υποθέσεων που προκύπτουν στο χώρο της Iατρικής και της Bιολογίας. Η Bιοστατιστική συνεισφέρει στον σχεδιασμό και στην ορθή εξαγωγή συμπερασμάτων σε έρευνες στο χώρο της Iατρικής και της Bιολογίας. 6
Ιατρικές έρευνες ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΧΕΔΙΑΣΜΟΣ ΕΚΤΕΛΕΣΗ (ΣΥΛΛΟΓΗ ΔΕΔΟΜΕΝΩΝ) ΔΙΟΡΘΩΣΗ ΣΤΟΙΧΕΙΩΝ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΡΜΗΝΕΙΑ ΕΥΡΗΜΑΤΩΝ ΠΑΡΟΥΣΙΑΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΔΗΜΟΣΙΕΥΣΗ 7
Ιατρικές έρευνες ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΧΕΔΙΑΣΜΟΣ ΕΚΤΕΛΕΣΗ (ΣΥΛΛΟΓΗ ΔΕΔΟΜΕΝΩΝ) ΔΙΟΡΘΩΣΗ ΣΤΟΙΧΕΙΩΝ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΡΜΗΝΕΙΑ ΕΥΡΗΜΑΤΩΝ ΠΑΡΟΥΣΙΑΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΔΗΜΟΣΙΕΥΣΗ 8
Στατιστικά προγράμματα Σχεδιασμένα για στατιστική ανάλυση Μεγάλες δυνατότητες στατιστικών τεχνικών Εύκολος χειρισμός δεδομένων Kόστος ; 9
Στατιστικά προγράμματα Λογιστικά φύλλα (spread sheets) Γενικής χρήσης, περιορισμένων δυνατοτήτων ανάλυσης Excel Lotus 123 Ειδικά στατιστικά προγράμματα Αυξημένων δυνατοτήτων ανάλυσης R SAS SPSS STATA SPlus Statistica MINITAB... 10
Στατιστική Περιγραφική στατιστική Ασχολείται με τη συνοπτική, αλλά εμπεριστατωμένη παρουσίαση των δεδομένων Συμπερασματολογική στατιστική Επιδιώκεται η συναγωγή συμπερασμάτων που βασίζονται στα ευρήματα μιας μελέτης 11
Παράδειγμα Μελέτη σύγκρισης μηχανών και παραδοσιακών μετρήσεων Θέλουμε να συγκρίνουμε αυτόματα μηχανήματα μέτρησης πίεσης (που βρίσκονται στο δρόμο των ΗΠΑ), με τον παραδοσιακό τρόπο (υπό την παρουσία ειδικού - συνήθως νοσηλευτή). Η μελέτη αυτή έγινε στις ΗΠΑ (για λεπτομέρειες στο βιβλίο του Rosner, 1994, σελ. 1 4). 12
(συν.) Στη μελέτη αυτή για κάθε άτομο μετράμε την πίεση του με το μηχάνημα και για το ίδιο άτομο μετράμε την πίεση και με τον παραδοσιακό τρόπο με τη βοήθεια ενός ειδικευμένου νοσηλευτή. Το ερευνητικό ερώτημα είναι κατά πόσο τα αποτελέσματα των 2 μεθόδων (μέτρηση πίεσης με το μηχάνημα και με τη βοήθεια ειδικού) διαφέρουν μεταξύ τους 13
Σχεδιασμός της μελέτης 1. Πόσα μηχανήματα θα εξετάσουμε και που θα τοποθετηθούν αυτά ; 2. Πόσους ανθρώπους θα εξετάσουμε ανά μηχάνημα; 3. Ποια θα είναι η σειρά των μετρήσεων ; 4. Άλλα δεδομένα που θα πρέπει να συλλέξουμε; 5. Πως θα γίνει η καταχώρηση και η κωδικοποίηση των δεδομένων; 6. Πως θα γίνει ο έλεγχος της ακρίβειας και της ακεραιότητας των δεδομένων; 14
Απαντήσεις στα ερωτήματα 1. Πόσα μηχανήματα θα εξετάσουμε και που θα τοποθετηθούν αυτά ; Επιλέχθηκαν 4 μηχανήματα σε μη-κοντινές περιοχές. 2. Πόσους ανθρώπους θα εξετάσουμε ανά μηχάνημα; Χρησιμοποιήθηκαν στατιστικοί μέθοδοι καθορισμού του μεγέθους δείγματος. Βάση αυτών, αποφασίστηκε να μετρηθούν 100 άτομα ανά μηχάνημα 15
(συν.) 3. Ποια θα είναι η σειρά των μετρήσεων ; Συνήθως η πρώτη μέτρηση είναι πιο υψηλή. Έτσι, αν ορίσουμε την πρώτη μέτρηση να λαμβάνεται συστηματικά από το μηχάνημα ή από τον ειδικευμένο νοσηλευτή τότε θα δημιουργηθεί ένα συστηματικό σφάλμα που θα οφείλεται στη σειρά δειγματοληψίας και όχι στην πραγματική διαφορά των δύο μετρήσεων. Αυτό μπορεί να αποφευχθεί μέσω της τυχαιοποίησης (ανάθεση της σειράς με τυχαίο τρόπο). 16
(συν.) 4. Άλλα δεδομένα που θα πρέπει να συλλέξουμε; Σίγουρα θα πρέπει να ρωτήσουμε τους συμμετέχοντες και επιπλέον ατομικά τους στοιχεία που επηρεάζουν την πίεση όπως βάρος, ύψος και φύλο. Επίσης άλλα δημογραφικά στοιχεία (π.χ. ηλικία, τόπος κατοικίας) ή ιατρικά στοιχεία (π.χ. ιστορικό υπέρτασης) που θα μας δώσουν πληροφόρηση ως προς τον πληθυσμό που χρησιμοποιεί τα μηχανήματα. 17
(συν.) 5. Πως θα γίνει η καταχώρηση και η κωδικοποίηση των δεδομένων; Στην κωδικοποίηση γίνεται πλήρης ορισμός των ονομάτων των μεταβλητών, των κωδικών των κατηγοριών όπου υπάρχουν, στις ελλιπείς τιμές (missing values) Επίσης τα δεδομένα εισήχθηκαν 2 φορές και έγινε αυτόματη σύγκριση των αρχείων για εντοπισμό λαθών πληκτρολόγησης. 18
(συν.) 6.Πως θα γίνει ο έλεγχος της ακρίβειας και της ακεραιότητας των δεδομένων; Στον έλεγχο των δεδομένων έγινε απλή περιγραφική ανάλυση, εκτύπωση ελαχίστων και μεγίστων τιμών ανά μεταβλητή και τυχαίος δειγματοληπτικός έλεγχος μερικών ερωτηματολογίων. 19
Περιγραφική ανάλυση 20
Ελλιπείς τιμές Τα αρχικά δεδομένα ήταν υπολογισμένα να αποδώσουν 100 τιμές ανά τοποθεσία, αλλά όπως παρατηρείται υπήρξαν ελλιπείς τιμές (missing values), γεγονός συνηθισμένο στην Ιατρική Έρευνα και τη Βιοστατιστική. Ο αναμενόμενος αριθμός μη απόκρισης πρέπει και λαμβάνεται υπ όψιν στον καθορισμό του μεγέθους δείγματος. 21
Συμπερασματολογική στατιστική Μας ενδιαφέρει να ελέξουμε αν υπάρχουν διαφορές μεταξύ των μετρήσεων της μηχανής και του ανθρώπου. Επειδή έχουμε ζευγάρια ποσοτικών μετρήσεων για κάθε άτομο (η πίεση με το μηχάνημα και με τον ειδικό) για το λόγο αυτό αποφασίζουμε να χρησιμοποιήσουμε τη δοκιμασία t ανά ζεύγη (paired t-test). Οπότε, πραγματοποιούμε τη στατιστική ανάλυση και συμπεραίνουμε... 22
Συμπερασματολογική στατιστική Είπαμε ότι μας ενδιαφέρει να ελέξουμε αν υπάρχουν διαφορές μεταξύ των μετρήσεων της μηχανής και του ανθρώπου. Το ερώτημα αυτό αφορά τις μηχανές και τους ανθρώπους που χρησιμοποιήσαμε στο δείγμα μας, ή όχι; Και αν όχι, σε ποιόν πληθυσμό αναφέρεται; Το ερώτημα αυτό αναφέρεται σε όλο τον πληθυσμό! 23
Συμπερασματολογική στατιστική Οπότε και το συμπέρασμα που θα βγάλουμε θα αναφέρεται σε όλο τον πληθυσμό. Αυτό ακριβώς κάνουμε στη Στατιστική: συλλέγουμε ένα δείγμα, και βάση αυτών που βλέπουμε στο δείγμα βγάζουμε συμπεράσματα για όλο τον πληθυσμό! 24
Βασικές έννοιες Πληθυσμός - δείγμα Κεντρική ιδέα στην όλη στατιστική διαδικασία αποτελεί η μελέτη ενός δείγματος αποτελούμενου από (n) παρατηρήσεις και προερχόμενου από ένα πληθυσμό αναφοράς αποτελούμενο από (Ν) παρατηρήσεις. Το δείγμα πρέπει να είναι τυχαίο υποσύνολο του πληθυσμού. Κάθε έρευνα έχει σκοπό να καταλήξει σε συμπεράσματα για τον πληθυσμό, και όχι για τοδείγμα! 25
Παράδειγμα Έστω ότι μας ενδιαφέρει να ερευνήσουμε το ύψος των ανδρών στο λεκανοπέδιο της Αττικής Ιδανικά, θα θέλαμε να μετρήσουμε όλους τους άνδρες που ζουν στο λεκανοπέδιο της Αττικής Αυτό είναι ανέφικτο, για πολλούς λόγους! Έτσι, θα πάρουμε ένα δείγμα από τον πληθυσμό αναφοράς, και θα δουλέψουμε με αυτό 26
(συνέχεια) Συλλέγουμε τυχαία 500 άνδρες (δείγμα), και μετράμε το ύψος τους Σκοπός μας είναι να καταλήξουμε σε συμπεράσματα για το ύψος όλων των ανδρών στο λεκανοπέδιο της Αττικής (πληθυσμός αναφοράς) Και όχι μόνο για τους 500 που είχαμε στο δείγμα μας 27
(συνέχεια) Για να συμβεί αυτό θα πρέπει το δείγμα μας να είναι αντιπροσωπευτικό όλου του πληθυσμού αναφοράς Αυτό δεν είναι πάντα τόσο εύκολο και απλό και χρειάζεται να είμαστε πολύ προσεκτικοί στην επιλογή του δείγματος Έτσι, στο παράδειγμά μας τι θα μπορούσε να μην λειτουργήσει καλά και να μας οδηγήσει σε εσφαλμένα συμπεράσματα; 28
(συνέχεια) Σε κάθε έρευνα, αφού συλλέξουμε το δείγμα μας, περνάμε τα στοιχεία μας στον υπολογιστή (π.χ. στο Excel ή σε κάποιο στατιστικό πρόγραμμα) Έτσι, στο προηγούμενο παράδειγμα θα έχουμε μια στήλη με π.χ. το ύψος, την ηλικία κ.λ.π. Κάθε στήλη αντιπροσωπεύει μια μεταβλητή 29
30
Τυχαίες μεταβλητές Στη Στατιστική για να αποτιμήσουμε ποσοτικά τα διάφορα μεγέθη, χαρακτηριστικά ή έννοιες που μας αφορούν σε μια μελέτη, χρησιμοποιούμε τις τυχαίες μεταβλητές 31
Η ανάγκη χρήσης μεταβλητών Μεγέθη Ηλικία, βάρος, λιπίδια κλπ Χαρακτηριστικά Φύλο, επάγγελμα κλπ Έννοιες Άγχος, μόρφωση, διατροφή κλπ Υπάρχει ανάγκη ποσοτικής αποτίμησης ΜΕΤΑΒΛΗΤΕΣ 32
Είδη μεταβλητών Ποιοτικές, κατηγορικές (Qualitative, Categorical) Μεταβλητές που δεν μπορούν να μετρηθούν (κατηγοριοποίηση) Διατάξιμες (ιεράρχηση) Μη διατάξιμες Ποσοτικές (Quantitative) Μεταβλητές που μπορούν να μετρηθούν Συνεχείς Διακριτές Οι ποσοτικές μεταβλητές μπορούν να μετατραπούν σε ποιοτικές (διατάξιμες) αλλά είναι γνωστό και το σχετικό τους μέγεθος. Το αντίστροφο συνήθως δεν ισχύει. 33
Είδη μεταβλητών Μη διατάξιμες (δεν επιδέχονται αριθμητικές μετρήσεις και δεν υπάρχει ιεραρχία). Π.χ.: Φύλο (διχοτομική μεταβλητή) 0 άνδρας 1 γυναίκα Ομάδα αίματος 0 ομάδα αίματος O 1 ομάδα αίματος A 2 ομάδα αίματος B 3 ομάδα αίματος AB 34
Είδη μεταβλητών Διατάξιμες (δεν επιδέχονται αριθμητικές μετρήσεις αλλά υπάρχει ιεραρχία). Π.χ.: 1 χωρίς συμπτώματα 2 ελαφρά συμπτώματα 3 μέτρια συμπτώματα 4 έντονα συμπτώματα 35
Είδη μεταβλητών Διακριτές (επιδέχονται αριθμητικές μετρήσεις, αλλά είναι δυνατόν να λάβουν μόνο ορισμένες τιμές) Αριθμός τροχαίων ατυχημάτων στην Αθήνα σε μια ημέρα Αριθμός μαθητών σε μια τάξη 36
Είδη μεταβλητών Συνεχείς (επιδέχονται αριθμητικές μετρήσεις και μπορούν να πάρουν θεωρητικά όλες τις τιμές των πραγματικών αριθμών, σε ένα διάστημα) Βάρος Συστολική πίεση Χρόνος επιβίωσης Θερμοκρασία 37
Περιγραφική στατιστική 38
Περιγραφική Στατιστική Για να περιγράψουμε τα δεδομένα μας, χρησιμοποιούμε διαφορετικούς τρόπους για τις ποιοτικές και τις ποσοτικές μεταβλητές Στη συνέχεια θα δούμε τους κυριότερους τρόπους, για κάθε μια από τις δυο κατηγορίες μεταβλητών 39
Ποιοτικές μεταβλητές Στις ποιοτικές μεταβλητές χρησιμοποιούμε την κατανομή συχνοτήτων Κατανομή συχνοτήτων (frequency distribution). Με την κατανομή συχνοτήτων καταγράφεται για κάθε τιμή του ποιοτικού μεγέθους ο αντίστοιχος αριθμός παρατηρήσεων ή/και το αντίστοιχο ποσοστό. 40
Παράδειγμα «Σε ποιες βαθμίδες είναι αποτελεσματικότερες οι Νέες Τεχνολογίες;» Αριθ. Ποσοστό Κατηγορία απάντησης Ατόµων Απαντ. Δηµοτικό 13 6.2 Γυµνάσιο 53 25.4 Λύκειο-ΤΕΕ 68 32.5 Τριτοβάθµια 16 7.7 Όλες 59 28.2 Σύνολο απαντήσεων 209 100 41
Κατανομή συχνοτήτων: 56% γυναίκες, 44% άνδρες σε δείγμα 12.000... Είναι πολύ σημαντικό να δίνετε το μέγεθος δείγματος Κάθε παρατήρηση πρέπει να μπορεί να περιληφθεί σε μία και μόνο μία από τις υπάρχουσες κατηγορίες Π.χ. Υγιή άτομα, πάσχοντα από καρκίνο του πνεύμονα, εμφραγματίες Π.χ. Έγγαμοι, άγαμοι Αν αναμένεται να υπάρχουν απαντήσεις εκτός από αυτές που χρησιμοποιούμε, κατασκευάζουμε και μια κατηγορία παρατηρήσεων που καλύπτει περιστατικά άλλα ή άγνωστα 42
Γραφικές παραστάσεις κατανομών συχνοτήτων ποιοτικών μεταβλητών Ιστογράμματα Κυκλικά διαγράμματα Ραβδογράμματα 43
Παράδειγμα Κατανομή συχνοτήτων: 44
Ραβδόγραμμα 45
Πίτα 46
Ποσοτικές μεταβλητές Αν έχουμε μια ποσοτική μεταβλητή με πολύ λίγα επίπεδα, μπορούμε να χρησιμοποιήσουμε την κατανομή συχνοτήτων Κατανομή συχνοτήτων (frequency distribution). Με την κατανομή συχνοτήτων καταγράφεται για κάθε τιμή ή εύρος τιμών του ποσοτικού μεγέθους ο αντίστοιχος αριθμός παρατηρήσεων. Κατανομή συχνοτήτων 400 οικογενειών με 3 παιδιά, ανάλογα με τον αριθμό των αγοριών Αγόρια Συχνότητα Συχνότητα % 0 52 13 1 133 33,25 2 146 36,5 3 69 17,25 47
Ραβδόγραμμα 48
Ιστογράμματα Στην περίπτωση που έχουμε μια ποσοτική μεταβλητή με πολύ λίγα επίπεδα, τότε χρησιμοποιούμε το ραβδόγραμμα Στο προηγούμενο παράδειγμα είχαμε μια ποσοτική μεταβλητή με 4 επίπεδα, μόνο Στην περίπτωση αυτή είναι όντως ποσοτική μεταβλητή ή μήπως είναι ποιοτική; 49
Ιστογράμματα Σε γενικές γραμμές, μια ποσοτική μεταβλητή έχει πάρα πολλές δυνατές απαντήσεις Π.χ. Βάρος Το κατάλληλο γράφημα στην περίπτωση αυτή είναι το ιστόγραμμα Στο επόμενο γράφημα παρουσιάζεται το ιστόγραμμα του Δείκτη Μάζας Σώματος από ένα δείγμα 2994 ατόμων 50
Ιστόγραμμα Ιστόγραμμα του ΔΜΣ (ΒΜΙ) σε δείγμα 2994 ατόμων. 51
Ιστογράμματα Πόσο συμμετρικά είναι τα δεδομένα; Πόσο διεσπαρμένα είναι τα δεδομένα; Υπάρχουν διαστήματα με υψηλή συγκέντρωση δεδομένων; Υπάρχουν κενά στα δεδομένα; Υπάρχουν παρατηρήσεις μακριά από τις υπόλοιπες (ακραίες παρατηρήσεις - outliers); 52
Ομαδοποίηση Σε κάποιες περιπτώσεις, μπορεί να επιλέξουμε την ομαδοποίηση Την κατασκευή ομάδων βάση των τιμών της ποσοτικής μεταβλητής μας Στην επόμενη διαφάνεια, έχουμε ένα τέτοιο παράδειγμα 53
Ομαδοποίηση Κατανομή συχνοτήτων 111 δειγμάτων ούρων ανάλογα με τον αριθμό πυοσφαιρίων κατά οπτικό πεδίο Αριθμός Πυοσφαιρίων Αριθμός δειγμάτων 0-9 25 10-19 40 20-29 18 30-39 14 40-49 6 50 + 8 54
Ομαδοποίηση Αριθμός ομάδων; 6-10 Κεντρική τιμή κάθε ομάδος; Ανάγκη διατήρησης σταθερού εύρους όλων των ομάδων; 55
Ομαδοποίηση Η ομαδοποίηση καταλήγει να μετατρέψει την ποσοτική μεταβλητή μας σε μια ποιοτική Σε γενικές γραμμές, από στατιστικής πλευράς δεν συνίσταται! Ειδικά στις περιπτώσεις στατιστικών ελέγχων (που θα δούμε στη συνέχεια) έχουμε σαν αποτέλεσμα να χάνουμε ισχύ 56
Ιστόγραμμα, καμπύλη συχνοτήτων Η γραφική παράσταση μιας κατανομής συχνοτήτων γίνεται με το ιστόγραμμα (histogram), το οποίο τελικά μπορεί να προσεγγίσει μια ομαλή καμπύλη, που ονομάζεται καμπύλη συχνοτήτων (frequency curve). Μονοκόρυφες ή πολυκόρυφες Κανονική κατανομή, θετικά λοξή, αρνητικά λοξή 57
Περιγραφή ποσοτικών μεταβλητών Γραφήματα, Ιστόγραμμα συχνοτήτων Ιστόγραμμα Συχνοτήτων του ΔΜΣ (ΒΜΙ) σε δείγμα 2994 ατόμων. 58
Καμπύλες συχνοτήτων (μονοκόρυφες) 59
Αντιπροσωπευτικές τιμές των κατανομών συχνοτήτων ποσοτικών μεταβλητών Υπολογίζονται με βάση τα στοιχεία της κατανομής και μπορούν να υποδείξουν τα κύρια χαρακτηριστικά της Τιμές θέσης Επικρατούσα τιμή, μέση τιμή, διάμεσος Τιμές βαθμού διασποράς Σταθερή απόκλιση, ακραίες τιμές, εκατοστημόρια 60
Τιμές θέσης Επικρατούσα τιμή είναι η τιμή στην οποία σημειώθηκαν οι περισσότερες παρατηρήσεις Μέση τιμή είναι το αλγεβρικό άθροισμα όλων των μετρήσεων διαιρεμένο με το πλήθος αυτών Διάμεσος είναι η τιμή που είναι συγχρόνως μεγαλύτερη από τις μισές μετρήσεις και μικρότερη από τις άλλες μισές n 1 Η τιμή της διατεταγμένης παρατήρησης 2 61
Παράδειγμα: Οι 17 μαθητές μιας τάξης σημείωσαν τον παρακάτω αριθμό απουσιών (σε αυξανόμενη σειρά) 0, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 6, 7, 7, 34, 82 62
Παράδειγμα Οι 17 μαθητές μιας τάξης σημείωσαν τον παρακάτω αριθμό απουσιών (σε αυξανόμενη σειρά) 0, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 6, 7, 7, 34, 82 Επικρατούσα τιμή: 2 απουσίες Μέση τιμή: 10 απουσίες Διάμεσος: 4 απουσίες 63
Μέση τιμή και διάμεσος Αν η κατανομή είναι συμμετρική, η μέση τιμή και η διάμεσος βρίσκονται πολύ κοντά Τέτοια κατανομή είναι η κανονική κατανομή Σε αυτές τις περιπτώσεις δεν έχει μεγάλη σημασία αν θα επιλέξουμε τη διάμεσο ή τη μέση τιμή Συνήθως, τότε προτιμάται η μέση τιμή Στις μη συμμετρικές κατανομές προτιμάται η διάμεσος. Η μέση τιμή επηρεάζεται περισσότερο από τις ακραίες τιμές, και από τη μη συμμετρικότητα Εδώ η χρήση της μέσης τιμές οδηγεί σε παραπλανητικά αποτελέσματα 64
Μέση τιμή και διάμεσος Οπότε, στις συμμετρικές κατανομές προτιμάται η μέση τιμή Σε αυτές τις περιπτώσεις δεν έχει μεγάλη σημασία αν θα επιλέξουμε τη διάμεσο ή τη μέση τιμή Γιατί είναι σχεδόν ο ίδιος αριθμός Στις μη συμμετρικές κατανομές προτιμάται η διάμεσος. Εδώ η χρήση της μέσης τιμές οδηγεί σε παραπλανητικά αποτελέσματα 65
Μέση τιμή και διάμεσος Άρα, φαίνεται ότι η διάμεσος είναι σε γενικές γραμμές καλύτερη επιλογή από τη μέση τιμή Παρόλο που οι περισσότεροι από εμάς πιστεύουν το αντίθετο, και χρησιμοποιούν κυρίως τη μέση τιμή 66
Παράδειγμα: Το παρακάτω ιστόγραμμα αντιστοιχεί στα δεδομένα του τελευταίου παραδείγματος, με τον αριθμό απουσιών. Με βάση αυτό το ιστόγραμμα, ποιο μέτρο θέσης θα επιλέγατε για τα δεδομένα αυτά; 67
Παράδειγμα: 68
Επικρατούσα τιμή; Η επικρατούσα τιμή είναι χρήσιμη σε περιπτώσεις πολυκόρυφων κατανομών 69
Τιμές βαθμού διασποράς Σταθερή απόκλιση (standard deviation): _ x 2 SD = ( x i x) = i n 1 n 1 Οι ακραίες τιμές προσδιορίζουν το εύρος της κατανομής 2 ( xi ) n 2 Εκατοστημόρια: ( n 1)* K 100 70
Τιμές βαθμού διασποράς Διακύμανση (variance) 2 ( x x) Var = = SD 2 n 1 Τυπικό σφάλμα (standard error) SE = SD n _ 71
Σύντομη εισαγωγή στο SPSS Μέχρι στιγμής μιλήσαμε για την Περιγραφική Στατιστική, και τους τρόπους που την πραγματοποιούμε ανάλογα με το αν έχουμε ποιοτικά ή ποσοτικά δεδομένα Την Περιγραφική Στατιστική συνήθως την πραγματοποιούμε σε ένα στατιστικό πρόγραμμα Μιας και στο μάθημά μας θα χρησιμοποιήσουμε το SPSS, στις επόμενες διαφάνειες θα κάνουμε μια μικρή εισαγωγή στο πρόγραμμα αυτό 72
Χώρος εισαγωγής δεδομένων Χώρος διαχείρισης δεδομένων 73
Ετικέτα μεταβλητής (π.χ. Age of subjects) Ετικέτες τιμών μεταβλητής (π.χ. 1 = male, 2 = female) Όνομα μεταβλητής (μέχρι 8 χαρακτήρες, χωρίς σημεία στίξης) Μήκος και αριθμός δεκαδικών ψηφίων μεταβλητής Τύπος μεταβλητής (αριθμητική, κείμενο κλπ) 74
Περιστατικά Τρόπος εισαγωγής δεδομένων Μεταβλητές CRP BMI AGE MALE 1 0,81 23,6 56 1 2 1,18 28,3 53 0 3 1,27 27,2 72 1 4 1,91 29,3 50 1 5 1,53 22,2 47 0 6 2,20 24,3 44 1 7 4,08 24,5 49 1 8 3,01 23,6 54 1 9 2,48 27,5 59 1............... 75
Μενού επιλογών στατιστικών μεθόδων 76
Μενού επιλογών περιγραφικών στατιστικών μεθόδων 77
Μενού επιλογών γραφημάτων 78
Επιλογή μεταβλητών για ανάλυση 79
Statistics Παράδειγμα Περιγραφικά Στατιστικά Μέτρα (Summary Statistics) Body Mass Index (kg/m2) N Valid Mean Std. Error of Mean Median Mode Std. Deviation Variance Range Minimum Maximum Sum Percentiles Mis sing 10 20 25 30 40 50 60 70 75 80 90 2994 48 26,3347,08250 25,8841 22,04 a 4,51400 20,376 54,97 11,69 66,67 78846,09 20,9572 22,5896 23,2315 23,8472 24,8971 25,8841 26,9896 28,2828 28,9811 29,5525 32,0501 a. Multiple modes exist. The smallest value is shown 80
Συμπερασματολογική στατιστική 81
Πραγματική μέση τιμή Δειγματική μέση τιμή Αν και έχουμε ορίσει τη μέση τιμή, στη συνέχεια θα δείτε να αναφερόμαστε σε 2 μέσες τιμές: την πραγματική και τη δειγματική Η δειγματική μέση τιμή είναι η μέση τιμή των παρατηρήσεων στο δείγμα μας. Και μπορούμε να την υπολογίσουμε Η πραγματική μέση τιμή είναι η μέση τιμή των παρατηρήσεων σε όλο τον πληθυσμό αναφοράς Συνήθως, ΔΕΝ μπορούμε να την υπολογίσουμε 82
Πραγματική μέση τιμή Δειγματική μέση τιμή Από τις δύο μέσες τιμές, αυτή που μας ενδιαφέρει ουσιαστικά είναι η πραγματική μέση τιμή Μας ενδιαφέρει όλος ο πληθυσμός αναφοράς Όμως, η μόνη που μπορούμε να υπολογίσουμε είναι η δειγματική μέση τιμή Μπορούμε να εκτιμήσουμε την πραγματική μέση τιμή, αν γνωρίζουμε τη δειγματική; Ναι, και θα δούμε πώς... 83
Πραγματική μέση τιμή Τι σχέση έχει η πραγματική μέση τιμή και η δειγματική μέση τιμή; Η μέση τιμή ενός δείγματος αποτελεί μια κατά προσέγγιση εκτίμηση της πραγματικής μέσης τιμής του πληθυσμού Το τυπικό σφάλμα (SE) αποτελεί μέτρο της ενδεχόμενης απόστασης της δειγματικής μέσης τιμής από την αντίστοιχη πραγματική 84
Διάστημα αξιοπιστίας Ένας τρόπος για να εκτιμήσουμε την πραγματική μέση τιμή, αν γνωρίζουμε τη δειγματική είναι χρησιμοποιόντας το διάστημα αξιοπιστίας, ή διάστημα εμπιστοσύνης 85
Διάστημα αξιοπιστίας Στην κανονική κατανομή και όταν ο αριθμός των παρατηρήσεων είναι μεγάλος : το διάστημα: (δειγματική μέση τιμή 1,96*SE) περιλαμβάνει την πραγματική μέση τιμή με πιθανότητα 95% 86
Παράδειγμα Έστω ότι η μέση τιμή μιας σειράς πολυάριθμων μετρήσεων αναστημάτων ήταν 164 εκ. και το SE ήταν 0,5 εκ. Άρα, η δειγματική μέση τιμή είναι 164 εκ. Τότε, το 95% διάστημα αξιοπιστίας πραγματική μέση τιμή είναι το διάστημα για την (164-1.96*0.5, 164+1.96*0.5) Αυτό σημαίνει ότι είμαστε 95% σίγουροι ότι η πραγματική μέση τιμή του πληθυσμού βρίσκεται στο διάστημα (163.02, 164.98) Στην περίπτωση αυτή, η πιθανότητα να κάνουμε λάθος είναι 5%=0,05 87
(συν.) Αντίστοιχα μπορούμε να κατασκευάσουμε 90% ΔΕ, ή 99% ΔΕ Αυτά θα έχουν πιθανότητα λάθους 10% και 1%, αντίστοιχα Τι σχέση θα έχουν αυτά τα 2 με το 95% ΔΕ; Το επίπεδο P =5%=0,05 έγινε συμβατικά δεκτό ως το όριο για την πιθανότητα λάθους Για το λόγο αυτό μας ενδιαφέρει η πιθανότητα λάθους να είναι το πολύ μέχρι και 5%. Αντίστοιχα, χρησιμοποιείται για να μας δείξει πότε μια διαφορά θεωρείται στατιστικά σημαντική Αν έχει πιθανότητα λάθους μικρότερη από 0,05 88
Έλεγχος υπόθεσης Στην Στατιστική μπορούμε να ελέγξουμε αν μια συγκεκριμένη υπόθεση είναι αληθής ή όχι, στον πληθυσμό αναφοράς Π.χ. Αν η μέση τιμή μιας ορμόνης στο αίμα είναι ίδια σε γυναίκες που γέννησαν με καισαρική ή με φυσιολογικό τοκετό Υπάρχουν διάφορες στατιστικές δοκιμασίες (έλεγχοι), και η κάθε μια από αυτές ελέγχει ένα συγκεκριμένο είδος υπόθεσης Στη συνέχεια θα δούμε αναλυτικά τις πιό σημαντικές από τις δοκιμασίες αυτές 89
Έλεγχος υπόθεσης Σε όλες τις στατιστικές δοκιμασίες θα έχουμε δύο υποθέσεις, για να αποφασίσουμε ποια από τις 2 φαίνεται να είναι πιο πιθανή για τον πληθυσμό αναφοράς Η μια υπόθεση λέγεται μηδενική (Η 0 ) και η άλλη εναλλακτική (Η Α ) 90
Έλεγχος υπόθεσης Στη συνέχεια θα μιλήσουμε για μια διαδικασία που χρησιμοποιείται στη Στατιστική και ονομάζεται έλεγχος υπόθεσης Ο έλεγχος υπόθεσης είναι μια διαδικασία βάση της οποίας συνάγουμε συμπεράσματα για μια παράμετρο του πληθυσμού (π.χ. τη μέση τιμή), χρησιμοποιώντας πληροφορίες που προέρχονται από το δείγμα μας Έτσι, π.χ. υπάρχει μια στατιστική δοκιμασία που ελέγχει αν η μέση τιμή μιας μεταβλητής είναι ίση με ένα δοσμένο αριθμό Α 91
Έλεγχος υπόθεσης Η διαδικασία που ακολουθούμε σε ένα οποιαδήποτε έλεγχο υπόθεσης είναι η παρακάτω: Εστω, ότι θέλουμε να ελέγξουμε αν η μέση τιμή μ του ύψους μιας ομάδας παιδιών είναι 90εκ. Αρχικά, ξεκινάμε υποθέτοντας ότι η μηδενική υπόθεση(h 0 ) ισχύει: π.χ. στο παραπάνω παράδειγμα υποθέτουμε ότι η πραγματική μέση τιμή του πληθυσμού είναι ίση με η δοσμένη τιμή H 0 : μ=90εκ. 92
(συν.) Η εναλλακτική υπόθεση είναι πάντα αντίθετη της μηδενικής υποθεσης Έτσι, στο παράδειγμα που αναφερόμαστε: η εναλλακτική υπόθεση είναι H Α : μ 90εκ. Στη συνέχεια ελέγχουμε αν το δείγμα μας είναι περισσότερο συνεπής με τη μηδενική υπόθεση ή με την εναλλακτική υπόθεση Το τελικό συμπέρασμα θα αντιστοιχεί σε όλο τον πληθυσμό αναφοράς, και όχι μόνο στο δείγμα μας 93
p-value Πώς καταλαβαίνουμε αν το δείγμα μας είναι περισσότερο συνεπής με τη μηδενική υπόθεση ή με την εναλλακτική υπόθεση; Απο την p-value Κάθε στατιστική δοκιμασία μας δίνει σαν αποτέλεσμα ένα αριθμό, που λέγεται p-value Η p-value θα μας δείξει ποια υπόθεση φαίνεται πιο συμβατή για τον πληθυσμό που μας ενδιαφέρει 94
p-value Έτσι, συγκρίνουμε την υπολογιζόμενη p-value με το στατιστικό επίπεδο αναφοράς που συνήθως είναι το 0,05 Θυμηθείτε που μιλάγαμε για πιθανότητα λάθους μέχρι το πολύ 5% = 0,05 Αν p-value < 0,05, τότε απορρίπτουμε την H 0 και αποδεχόμαστε την H Α Αν p-value > 0,05, τότε αποτυγχάνουμε να απορρίψουμε την H 0 (ΠΡΟΣΟΧΗ: ποτέ δεν αποδεχόμαστε την H 0!!!) 95
Σύγκριση 2 δειγμάτων Στην Ιατρική είναι πολύ συχνό να θέλουμε να συγκρίνουμε 2 διαφορετικούς πληθυσμούς, ως προς μια μεταβλητή. Π.χ. Τη συστολική πίεση, σε 2 ομάδες ασθενών που έχουν λάβει διαφορετική θεραπεία Το ύψος, μεταξύ ανδρών και γυναικών Για το λόγο αυτό συγκρίνουμε τα δείγματά μας και βάση των αποτελεσμάτων, εξάγουμε συμπεράσματα για τους ευρύτερους πληθυσμούς από τους οποίους προέρχονται τα δείγματα (πληθυσμοί αναφοράς) 96
t-test για ανεξάρτητα δείγματα Ο έλεγχος που χρησιμοποιείται στην περίπτωση αυτή λέγεται t-test Δυό δείγματα είναι ανεξάρτητα αν αποτελούνται από διαφορετικά άτομα που δεν έχουν σχέση μεταξύ τους. Π.χ δεν είναι ανεξάρτητα αν όλα τα άτομα ανήκουν και στο ένα και στο άλλο δείγμα Ή αν π.χ. έχουμε πάρει δίδυμα αδέρφια, και το ένα παιδί ανήκει στη μια ομάδα και το άλλο στην άλλη 97
t-test: Προϋποθέσεις Έστω ότι θέλουμε να συγκρίνουμε δύο διαφορετικές μέσες τιμές, που προέρχονται από δύο ανεξάρτητους πληθυσμούς. Προϋποθέσεις: Η μεταβλητή που μας ενδιαφέρει ακολουθεί την κανονική κατανομή και στους 2 πληθυσμούς. Οι τυπικές αποκλίσεις δεν διαφέρουν. Ελέγχουμε αν η μια δεν είναι διπλάσια της άλλης, ή μεγαλύτερη 98
Εφαρμογή Μετρήθηκαν τα επίπεδα σιδήρου στον ορό δύο ομάδων παιδιών. Η ομάδα Α αποτελείται από υγιή παιδιά και η ομάδα Β αποτελείται από παιδιά που πάσχουν από κυστική ίνωση. Να διερευνηθεί αν οι μέσες τιμές σιδήρου στις δύο ομάδες είναι ίσες. Το πρώτο βήμα είναι να ελέγξουμε αν οι μετρήσεις σιδήρου ακολουθούν την κανονική κατανομή και στα 2 δείγματα Ελέγξαμε τα ιστογράμματα, και οι δύο κατανομές προσεγγίζουν την κανονική κατανομή. 99
(συνέχεια) Έχουμε: Ομάδα A: μ 1 =18,9 μmol/l n 1 =9 SD 1 =5,9 μmol/l Ομάδα B: μ 2 =11,9 μmol/l n 2 =13 SD 2 =6,3 μmol/l 100
(συν.) Είναι οι 2 δειγματικές μέσες τιμές μας ίσες; Προφανώς όχι (18,9 11,9), αλλά δεν μας ενδιαφέρουν οι δειγματικές τιμές!! Μας ενδιαφέρει αν οι πραγματικές μέσες τιμές μπορεί να είναι ίσες! 101
(συνέχεια) Έτσι, έχουμε δύο υποθέσεις: H 0 : μ 1 =μ 2 (Μηδενική υπόθεση) H A : μ 1 μ 2 (Εναλλακτική υπόθεση) Είναι πιθανό η παρατηρούμενη διαφορά στις δύο δειγματικές μέσες τιμές (18.9 και 11.9) να οφείλεται σε τυχαίες διακυμάνσεις (αλλά κατά βάση οι 2 μέσες τιμές να είναι ίσες στον πληθυσμό); Ή πρέπει να συμπεράνουμε ότι η παρατηρούμενη διαφορά στις δειγματικές μέσες τιμές οφείλεται σε διαφορετικές πραγματικές μέσες τιμές των δύο πληθυσμών υπό έλεγχο; 102
(συνέχεια) Η αντίστοιχη p-value=0,006 (αυτή μας τη δίνει το στατιστικό πρόγραμμα) Επειδή p-value<0,05, απορρίπτουμε την H 0 στο επίπεδο σημαντικότητας 0,05. Άρα, η διαφορά στις μέσες τιμές σιδήρου ανάμεσα στις 2 ομάδες είναι στατιστικά σημαντική. Συμπέρασμα: Προκύπτει ότι τα παιδιά με κυστική ίνωση έχουν διαφορετική μέση τιμή σιδήρου στον ορό, από τα υγιή παιδιά (σε όλο τον πληθυσμό αναφοράς) Προσοχή: δεν συμπεραίνουμε ποιά ομάδα έχει υψηλότερα επίπεδα σιδήρου!!! 103
95% διάστημα εμπιστοσύνης Τα στατιστικά πακέτα (όπως το SPSS) εκτιμάνε το 95% ΔΕ για τη διαφορά των δύο μέσων τιμών Στο προηγούμενο παράδειγμα το 95% είναι: (1.4, 12.6) Οπότε, είμαστε 95% σίγουροι ότι το διάστημα (1.4, 12.6) καλύπτει την πραγματική διαφορά στις μέσες τιμές σιδήρου, στους δύο διαφορετικούς πληθυσμούς Προσέξτε ότι το παραπάνω διάστημα δεν περιλαμβάνει το 0, οπότε συμβαδίζει με τον έλεγχο υπόθεσης στο επίπεδο του 0,05 104
99% διάστημα εμπιστοσύνης Αν ενδιαφερόμαστε για το 99% ΔΕ; 105
Εφαρμογή 2 Σε μια έρευνα για τη διάρκεια του 2ου σταδίου του τοκετού συγκρίθηκαν τα ιστορικά τοκετού 10 παιδιών, που πέθαναν ξαφνικά (ομάδα Α), με τα ιστορικά 10 παιδιών που αποτέλεσαν τη συγκριτική ομάδα (ομάδα Β), ως προς τη διάρκεια του 2ου σταδίου του τοκετού (δεν απαιτείται το n1 να είναι ίσο με n2). Οι μετρήσεις ήταν: Διάρκεια σε λεπτά Ομάδα Α: 30 25 16 18 15 13 10 25 15 10 Ομάδα Β: 13 20 50 17 45 35 10 28 19 25 106
(συν.) Ελέγξαμε τις κατανομές της διάρκειας τοκετού στις 2 ομάδες, και είδαμε ότι και στις 2 περιπτώσεις ακολουθούν την κανονική κατανομή Ο έλεγχος έγινε με το ιστόγραμμα Οπότε η πρώτη προϋπόθεση του t-test ικανοποιείται 107
(συνέχεια) Η μέση τιμή της διάρκειας του 2ου σταδίου του τοκετού της ομάδας Α είναι: μ 1 = x i 30 25... 10 = 17,7 min n 10 1 Η μέση τιμή της διάρκειας του 2ου σταδίου του τοκετού της ομάδας Β είναι: μ 2 = x i 13 20... 25 = 26,2 min n 10 2 108
(συνέχεια) Υπολογισμός των τυπικών σφαλμάτων: SD 1 =6,8 και SD 2 =13,99. Παρατηρούμε ότι το SD 2 είναι υπεριπλάσιο του SD 1 Άρα, δεν πληρούνται και οι 2 προϋποθέσεις εφαρμογής του t-test. Έτσι, στην περίπτωση αυτή δεν μπορούμε να εφαρμόσουμε τον έλεγχο t-test. Θα μάθουμε παρακάτω άλλη μέθοδο που μπορούμε να χρησιμοποιήσουμε Πρός το παρόν, δεν μπορούμε να κάνουμε κάτι..., 109
Διάστημα εμπιστοσύνης για τη διαφορά των μέσων τιμών Στην περίπτωση του t-test, τα στατιστικά προγράμματα υπολογίζουν το 95% ΔΕ για τη διαφορά των μέσων τιμών των 2 ομάδων Αυτή ερμηνεύεται: με 95% πιθανότητα, η διαφορά των μέσων τιμών των 2 ομάδων στο γενικό πληθυσμό βρίσκεται μεταξύ (, ) 110
Σχέση μεταξύ ορίων αξιοπιστίας και στατιστικής σημαντικότητας Στενή σχέση μεταξύ των δύο Μια διαφορά είναι στατιστικά σημαντική στο επίπεδο του 5% αν και μόνο αν το διάστημα αξιοπιστίας δεν περιλαμβάνει την τιμή που καθορίζεται από τη μηδενική υπόθεση (στα παραδείγματα που κάναμε ήταν ότι η διαφορά είναι ίση με 0). Αυτό οφείλεται στο ότι και οι δύο μέθοδοι βασίζονται σε παρόμοια προσέγγιση της θεωρητικής κατανομής του στατιστικού ελέγχου. Το διάστημα αξιοπιστίας εκφράζει καλύτερα την αβεβαιότητα και παρέχει περισσότερες πληροφορίες. 111
Μηδενική υπόθεση στο t-test Στο t-test για τη σύγκριση 2 μέσων τιμών αρχικά υποθέτουμε ότι δεν υπάρχει πραγματική διαφορά μεταξύ των μ 1 και μ 2 (Η 0 ), δηλαδή μ 1 =μ 2 Αν μετά τη στατιστική δοκιμασία καταλήξουμε σε πολύ μικρή p-value (< 0,05), απορρίπτουμε την Η 0 και αποδεχόμαστε την Η Α Στην περίπτωση αυτή δείχνουμε ότι ισχύει η Η Α Αν όχι (p-value > 0,05), τότε αποτυγχάνουμε να απορρίψουμε την Η 0 Στην περίπτωση αυτή δε δείχνουμε ΤΙΠΟΤΑ 112
Μηδενική υπόθεση στο t-test Αυτό, γιατί ποτέ δεν μπορούμε να είμαστε σίγουροι για το τι συμβαίνει. Βρήκαμε, δηλαδή, p-value>0,05 γιατί: 1. Όντως ισχύει η Η 0 ; 2. Έχουμε μικρό δείγμα, με αποτέλεσμα να μην έχουμε ικανοποιητική ισχύ; 113
Παράδειγμα στο SPSS Στη συνέχεια, θέλουμε να ελέγξουμε αν ο μέσος ημερήσιος αριθμός τσιγάρων διαφέρει μεταξύ ανδρών και γυναικών, σε κάποιο συγκεκριμένο πληθυσμό αναφοράς 114
115
116
Παράδειγμα, με 2 ανεξάρτητα δείγματα Group Statistics # of cigaretes / day Sex of Subjects Male Female Std. Error N Mean Std. Deviation Mean 941 26,05 16,690,544 655 18,54 12,510,489 Independent Samples Test # of cigaretes / day Equal variances ass umed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-tes t for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper 49,312,000 9,757 1594,000 7,50,769 5,996 9,013 10,261 1585,345,000 7,50,731 6,070 8,939 P-value < 0,001 117
(συν.) Η 0 : μ 1 =μ 2, όπου μ 1 ο μέσος ημερήσιος αριθμός τσιγάρων για τους άνδρες και μ 2 για τις γυναίκες p-value<0,001, οπότε p-value<0,05 Άρα, απορρίπτουμε την Η 0 και συμπεραίνουμε ότι ο μέσος ημερήσιος αριθμός τσιγάρων ανδρών και γυναικών διαφέρει στατιστικά σημαντικά, στο γενικό πληθυσμό 118
(συν.) 95% ΔΕ: (5,996, 9,013) Άρα, είμαστε 95% σίγουροι ότι η μέση ημερήσια διαφορά τσιγάρων που καπνίζουν τα 2 φύλα είναι μεταξύ (5,996, 9,013), στο γενικό πληθυσμό 119
t-test για παρατηρήσεις κατά ζεύγη (paired t-test) Μερικές φορές οι παρατηρήσεις των 2 συγκρινόμενων ομάδων εμφανίζουν ατομική αντιστοιχία (δηλαδή, δεν είναι ανεξάρτητες). Για κάθε παρατήρηση στην 1 η ομάδα υπάρχει μια αντίστοιχη παρατήρηση στη 2 η ομάδα Π.χ. Μέτρηση της συστολικής αρτηριακής πίεσης στα ίδια άτομα, πρίν και μετά από σωματική άσκηση. Σύγκριση της αποτελεσματικότητας 2 φαρμάκων στους ίδιους ασθενείς. Τότε οι συγκρίσεις πρέπει να γίνονται κατά ζεύγη. 120
(συνέχεια) Αυτή η αντιστοιχία χρησιμοποιείται για να ελαττώσει την επιρροή από εξωτερικούς παράγοντες που αυξάνουν τη μεταβλητότητα των μετρήσεων Αν οι μετρήσεις γίνονται στα ίδια άτομα, τότε ένα σημαντικό μέρος της βιολογικής μεταβλητότητας που υπάρχει μεταξύ ανθρώπων εξαφανίζεται Αυτό έχει σαν αποτέλεσμα πιο ακριβείς συγκρίσεις 121
(συνέχεια) Μερικές φορές οι μετρήσεις δε γίνονται στα ίδια άτομα, αλλά σε εξομοιωμένα (matched) άτομα. Έτσι, είναι δυνατόν να χορηγηθούν τα συγκρινόμενα άτομα σε δίδυμα αδέρφια, ή σε άτομα του ίδιου φύλου, ηλικίας, βάρους, κτλ. Τότε, πάλι οι συγκρίσεις πρέπει να γίνονται κατά ζεύγη. 122
Εφαρμογή Πέντε άτομα που έπασχαν από μια νόσο θερμομετρήθηκαν το πρωί (ομάδα Α) και το βράδυ (ομάδα Β) της ίδιας μέρας. Οι τιμές της θερμοκρασίας (σε ο C) ήταν: Άτομο 1 ο 2 ο 3 ο 4ο 5 ο Πρωινή θερμ. 37.1 37.4 37.2 37.3 37.0 Βραδυνή θερμ. 37.8 38.2 38.1 38.1 37.6 Υπάρχει διαφορά μεταξύ πρωινής και βραδινής θερμοκρασίας; 123
(συν.) Στο παράδειγμά μας οι παρατηρήσεις εμφανίζουν ατομική αντιστοιχία (κάθε άτομο έχει παρατήρηση και στις 2 ομάδες). Άρα, για τον έλεγχο της διαφοράς των μέσων τιμών της θερμοκρασίας μεταξύ των ομάδων Α και Β ενδείκνυται η εφαρμογή του t-test κατά ζεύγη. 124
(συν.) Η δοκιμασία t-test κατά ζεύγη λαμβάνει υπόψη τις διαφορές των παρατηρήσεων σε κάθε ζευγάρι. Για τον έλεγχο αυτό, θα υπολογίσουμε τις διαφορές των αντίστοιχων θερμομετρήσεων. Άτομο 1 ο 2 ο 3 ο 4 ο 5 ο Διαφορά θερμ. (δ) 0.7 0.8 0.9 0.8 0.6 125
Μηδενική και εναλλακτική υπόθεση Η μηδενική και η εναλλακτική υπόθεση στο t-test κατά ζεύγη είναι για τη μέση διαφορά δ. H 0 : δ=0 (μηδενική υπόθεση) H A : δ 0 (εναλλακτική υπόθεση) όπου: δ=μέση τιμή (βραδυνή θερμ. πρωινή θερμ.) 126
(συν.) Το αντίστοιχο p-value είναι 0,023. Άρα τι συμπεραίνουμε; 127
(συν.) Ποιά ήταν η μηδενική υπόθεση στο προηγούμενο παράδειγμα; H μέση βραδυνή θερμοκρασία και η μέση πρωινή θερμοκρασία δεν διαφέρουν στατιστικά, ή Η διαφορά της μέσης βραδυνής θερμοκρασίας από τη μέση πρωινή θερμοκρασία δεν είναι στατιστικά διαφορετική από το 0, ή μ 1 =μ 2 Άρα, συμπεραίνουμε ότι η μέση βραδινή θερμοκρασία διαφέρει από τη μέση πρωινή (με πιθανότητα 5% το εύρημα αυτό να είναι τυχαίο). 128
(συν.) Το 95% ΔΕ για τη διαφορά είναι: (0,621, 0,899) Παρατηρείστε ότι το 0 δεν περιλαμβάνεται στο 95% ΔΕ (όπως αναμενόταν)... 129
(συν.) Αν θέλαμε το 99% ΔΕ για τη διαφορά; Το 99% ΔΕ της διαφοράς είναι: (0,53, 0,99) Παρατηρείστε ότι το 0 δεν περιλαμβάνεται στο 99% διάστημα αξιοπιστίας το νέο διάστημα έχει μεγαλύτερο εύρος, όπως αναμενόταν. Πριν ήταν: (0.62, 0.90) 130
Παράδειγμα Στη συνέχεια θα ελέγξουμε αν ο δείκτης μάζας σώματος (ΔΜΣ)) στον πληθυσμό αναφοράς μεταβλήθηκε από το 2001 στο 2006. Για το λόγο αυτό επιλέξαμε ένα δείγμα 1615 ατόμων από τον πληθυσμό αυτό, και μετρήσαμε το ΔΜΣ το 2001 και το 2006. Το δείγμα θα μας βοηθήσει να βγάλουμε συμπεράσματα για τον πληθυσμό αναφοράς. 131
132
Σύγκριση του ΔΜΣ των ιδίων ατόμων σε 2 διαφορετικές χρονικές περιόδους (2001 και 2006). 133
Παράδειγμα Διαφορά μέσων τιμών δύο εξαρτημένων δειγμάτων. Paired Samples Statistics Pair 1 Body Mass Index (kg/m2) bmi06 Mean N Std. Deviation Std. Error Mean 25,7829 1615 3,69540,09195 26,1831 1615 3,59815,08954 Paired Samples Test Pair 1 Body Mass Index (kg/m2) - bmi06 Mean Std. Deviation Paired Differences 95% Confidence Interval of the Difference Std. Error Mean Lower Upper t df Sig. (2-tailed) -,40015 4,21030,10477 -,60565 -,19466-3,819 1614,000 95% ΔΕ για τη διαφορά των μέσων τιμών ΔΜΣ p-value 134
t-test κατά ζεύγη ή απλό t-test; Αν αντί γιά t-test κατά ζεύγη στο προηγούμενο παράδειγμα χρησιμοποιούσαμε το απλό t-test θα ήταν λάθος; Δεν θα ήταν λάθος, αλλά σε περιπτώσεις παρατηρήσεων κατά ζεύγη ενδείκνυται το t-test κατά ζεύγη Στις περιπτώσεις αυτές, η δοκιμασία αυτή είναι πιό ισχυρή από το απλό t-test, Δηλαδή, τεκμηριώνει με μικρότερο αριθμό παρατηρήσεων την ενδεχόμενη στατιστική σημαντικότητα μιας πραγματικής διαφοράς. 135
t-test κατά ζεύγη ή απλό t-test; Αυτό σημαίνει όταν αν έχουμε ένα σχετικά μικρό δείγμα και υπάρχει πραγματική διαφορά στις μέσες τιμές που εξετάζουμε στον πληθυσμό, τότε μπορεί: Αν χρησιμοποιήσουμε το t-test κατά ζεύγη να βρούμε στατιστικά σημαντικό αποτέλεσμα Αν χρησιμοποιήσουμε το απλό t-test να μη βρούμε στατιστικά σημαντικό αποτέλεσμα 136
Πολλαπλές συγκρίσεις Αν ένα αποτέλεσμα είναι στατιστικά σημαντικό στο επίπεδο του 5%, αυτό σημαίνει ότι: αν ισχύει η Η 0, τότε αυτό το αποτέλεσμα θα προέκυπτε από τύχη στο 5% των περιπτώσεων Αν κατά τη διάρκεια μιας έρευνας επιχειρούνται πολλαπλές συγκρίσεις μεταξύ διαφόρων ομάδων, τότε υπάρχει αυξημένη πιθανότητα ανάδειξης στατιστικά σημαντικών ευρημάτων ακόμα και αν δεν υπάρχει διαφορά (δηλ. από τύχη...) 137
Πολλαπλές συγκρίσεις Έτσι, αν π.χ. γίνουν 100 συγκρίσεις μεταξύ ομάδων των οποίων οι μέσες τιμές δε διαφέρουν μεταξύ τους (δηλαδή ισχύει η Η 0 ), αναμένεται ότι σε 5 από αυτές θα προκύψει στατιστικά σημαντικό αποτέλεσμα (σφάλμα τύπου 1), λόγω των πολλαπλών συγκρίσεων Δηλαδή, ενώ γνωρίζουμε ότι δεν υπάρχει διαφορά στις μέσες τιμές, θα βρούμε στατιστικά σημαντικό αποτέλεσμα Στην πράξη προσπαθούμε όσο μπορούμε να αποφεύγουμε τις πολλαπλές συγκρίσεις 138
Πολλαπλές συγκρίσεις Ένας τρόπος να το πετύχουμε αυτό, είναι να προγραμματίσουμε από την αρχή της έρευνας τι ακριβώς θέλουμε να κάνουμε στη στατιστική ανάλυση Και να μην κάνουμε επιπλέον πράγματα στη συνέχεια Αν αυτό δεν είναι δυνατό, υπάρχουν μέθοδοι που διορθώνουν τις συνέπειες αυτές των πολλαπλών συγκρίσεων (π.χ. διορθώσεις Bonferroni, μέθοδος Duncan ) 139
Κανονική κατανομή Στη Στατιστική και τη Βιοστατιστική, η πιο χρήσιμη κατανομή είναι η κανονική κατανομή Αυτή χαρακτηρίζεται πλήρως από τη μέση τιμή και την τυπική της απόκλιση
(συν.) Το επόμενο γράφημα απεικονίζει διάφορες μεταβλητές που ακολουθούν την κανονική κατανομή, και έχουν διαφορετική μέση τιμή και τυπική απόκλιση
142
Κανονική κατανομή Έστω, ότι μας ενδιαφέρει αν μια μεταβλητή ακολουθεί ή όχι την κανονική κατανομή Το πρώτο βήμα για να αποφασίσουμε, είναι να κατασκευάσουμε το ιστόγραμμά της, και να ελέγξουμε οπτικά πόσο κοντά είναι στην κανονική κατανομή Π.χ., στο επόμενο ιστόγραμμα δίνεται η κατανομή πνευμονικών μετρήσεων (FEV1)
(συν.) Με βάση το ιστόγραμμα, τι συμπέρασμα βγάζετε; 145
(συν.) Κάτι άλλο που μπορούμε να κάνουμε στη συνέχεια για έλεγχο της κανονικότητας, είναι να χρησιμοποιήσουμε τον έλεγχο των Kolmogorov- Smirnov Η 0 : Η μεταβλητή μας ακολουθεί την κανονική κατανομή Η Α : Η μεταβλητή μας δεν ακολουθεί την κανονική κατανομή Στην περίπτωση αυτή, δεν θέλουμε να απορρίψουμε την μηδενική υπόθεση
147
148
149
Οπότε, p-value=0,200. Οπότε, δεν μπορούμε να απορρίψουμε τη μηδενική μας υπόθεση. Άρα δεν έχουμε ιδιαίτερες ενδείξεις ότι η μεταβλητή μας δεν ακολουθεί την κανονική κατανομή... 150
(συν.) Χρειάζεται να τονίσουμε ότι ο έλεγχος των Kolmogorov-Smirnov παρουσιάζει αρκετά προβλήματα, μιας και: Αν έχουμε μικρό δείγμα, ο έλεγχος αυτός δεν έχει αρκετή ισχύ για να απορρίψει την Η 0. Έτσι θα καταλήξουμε στο ότι έχουμε κανονική κατανομή Σε μεγάλα δείγματα, ακόμα και μικρές αποκλίσεις από τη κανονική κατανομή θα έχουν σαν αποτέλεσμα ο έλεγχος να απορρίπτει την κανονική κατανομή 151
(συν.) Πρακτικά, λοιπόν, δεν είναι και πολύ καλός έλεγχος! Επικίνδυνο να βασιστείς πάνω του Οπότε, τι κάνουμε στην πράξη; Στην περίπτωση που έχουμε ένα ικανοποιητικό ιστόγραμμα και πάνω από 50 παρατηρήσεις (ανά ομάδα), τότε συνήθως αποδεχόμαστε την κανονικότητα της μεταβλητής μας. 152
(συν.) Αν έχουμε μια ποσοτική μεταβλητή και μικρό μέγεθος δείγματος (λιγότερες από 30 παρατηρήσεις), τότε είναι καλύτερα να χρησιμοποιούμε μη-παραμετρικές μεθόδους Αυτές θα τις δούμε στη συνέχεια 153
Έλεγχος ανεξαρτησίας 2 ποιοτικών χαρακτηριστικών Παράδειγμα η παρουσία καρκίνου δεν εξαρτάται από το φύλο (Η ο ) η παρουσία καπνίσματος δεν εξαρτάται από το μορφωτικό επίπεδο: καθόλου δημοτικό γυμνάσιο - λύκειο ΑΕΙ/ΤΕΙ (Η ο ) Μπορούμε να χρησιμοποιήσουμε το t-test; 154