(ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο, 09-04-2013
Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα Διάλεξη 7/ 2
Άντε και βρίσκουμε ότι υπάρχει συσχέτιση ανάμεσα σε δύο μεταβλητές. Το επόμενο ερώτημα είναι: η σχέση αυτή είναι πραγματική ή μήπως είναι ένα τυχαίο αποτέλεσμα? Με άλλα λόγια πως μπορούμε να ξέρουμε αν το αποτέλεσμα από μια στατιστική διαδικασία είναι στατιστικά σημαντικό; Διάλεξη 7/ 3
Στατιστικά σημαντικό αποτέλεσμα = Όταν το αποτέλεσμα δεν έχει προέλθει από τυχαίους παράγοντες Στατιστικά μη σημαντικό αποτέλεσμα = Όταν το αποτέλεσμα έχει προέλθει από τυχαίους παράγοντες Όλα τα στατιστικά κριτήρια που θα μάθουμε, μας πληροφορούν για την πιθανότητα που υπάρχει τα αποτελέσματά μας να έχουν προκύψει από τυχαίους παράγοντες. Αν η πιθανότητα είναι μικρή >>>>>>>>>> ΟΧΙ ΤΥΧΑΙΑ Αν πιθανότητα είναι μεγάλη>>>>>>>>>>>>>>> ΤΥΧΑΙΑ Διάλεξη 7/ 4
Το επόμενο ερώτημα είναι: Πόσο μικρή θα πρέπει να είναι η πιθανότητα για να μην έχουμε τυχαία αποτελέσματα; Στις κοινωνικές επιστήμες έχει καθοριστεί ότι για να έχουμε στατιστικά σημαντικά αποτελέσματα η πιθανότητα σφάλματος θα πρέπει να είναι το πολύ 0,05 (5%) (συμβολίζεται με p<0.05) Βέβαια έχουμε και άλλα επίπεδα στατιστικής σημαντικότητας: 0,01 (1%)>>>> (p<0.01) αλλά και 0,001 (1%ο) >>> (p < 0.001). Διάλεξη 7/ 5
Στατιστικός Έλεγχος Υποθέσεων Πρόκειται για μια διαδικασία μέσω της οποίας ο αντικειμενικός στόχος είναι, χρησιμοποιώντας τη στατιστική, να ελέγξουμε αν η υπόθεση που έχουμε διατυπώσει είναι αποδεκτή ή όχι. Με άλλα λόγια, είναι ένα μοντέλο λήψης απόφασης με τη βοήθεια του οποίου αποφασίζουμε αν θα δεχθούμε ή θα απορρίψουμε την υπόθεση που έχουμε διατυπώσει. Διάλεξη 7/ 6
Τι σημαίνει η έννοια της υπόθεσης; Είναι μια σύντομη και ακριβής πρόταση στην οποία περιγράφουμε τι πιστεύουμε ότι θα συμβεί στην έρευνα ή το πείραμά μας. Σε κάθε έρευνα διατυπώνουμε 2 υποθέσεις: Μηδενική Υπόθεση (Η 0 ) Εναλλακτική ή Πειραματική Υπόθεση (Η 1 ) Διάλεξη 7/ 7
Είναι η υπόθεση που υποστηρίζει ότι δεν υπάρχει σχέση μεταξύ των μεταβλητών που μελετώνται Μηδενική Υπόθεση (Η 0 ) Διατυπώνεται με σκοπό να λειτουργήσει ως κριτήριο σύγκρισης για την εναλλακτική υπόθεση Στη διαδικασία του ελέγχου των υποθέσεων πάντοτε ελέγχουμε τη μηδενική υπόθεση έναντι της εναλλακτικής Διάλεξη 7/ 8
Εναλλακτική ή Πειραματική Υπόθεση (Η 1 ) Είναι η υπόθεση που αναφέρεται στην εκτίμηση που κάνει ο υπεύθυνος της έρευνας αναφορικά με τη σχέση που υπάρχει μεταξύ των μεταβλητών που μελετά Ουσιαστικά πρόκειται για την ερευνητική του υπόθεση Διάλεξη 7/ 9
Υπόθεση. Μονής Κατεύθυνσης; (one tailed) ή Διπλής Κατεύθυνσης; (two tailed) Διάλεξη 7/ 10
Υπόθεση Μονής Κατεύθυνσης: Είναι η υπόθεση που διατυπώνεται με κάποια σαφή πρόβλεψη για το αποτέλεσμα της έρευνάς μας προτού συλλέξουμε τα δεδομένα μας Διάλεξη 7/ 11
Υπόθεση Διπλής Κατεύθυνσης: Είναι η υπόθεση που διατυπώνεται χωρίς να επιχειρείται κάποια συγκεκριμένη πρόβλεψη Διάλεξη 7/ 12
ΠΑΡΑΔΕΙΓΜΑ Ένας ερευνητής θέλησε να διαπιστώσει κατά πόσο η από απόσταση εκπαίδευση είναι καλύτερη από τη δια ζώσης εκπαίδευση. Για το σκοπό αυτό, επέλεξε δύο ομάδες ατόμων (τμήματα) και δίδαξε μια συγκεκριμένη ύλη τόσο εξ αποστάσεως όσο και δια ζώσης. Στο τέλος του χρόνου σύγκρινε τις επιδόσεις των φοιτητών των δύο ομάδων στο ίδιο τεστ ώστε να διαπιστώσει ποια μέθοδος είχε καλύτερα αποτελέσματα Διάλεξη 7/ 13
ΠΑΡΑΔΕΙΓΜΑ Κοιτώντας τα δεδομένα φαίνεται ότι οι δύο ομάδες παρουσιάζουν διαφορές στην επίδοση. Είναι όμως οι διαφορές αυτές πραγματικές (εξαιτίας της μεθόδου διδασκαλίας) ή οφείλονται σε τυχαίους παράγοντες (πχ εξαιτίας της δειγματοληψίας μας;) Διάλεξη 7/ 14
Στατιστικός Έλεγχος Υποθέσεων Σε κάθε έρευνα διατυπώνουμε 2 υποθέσεις: Μηδενική Υπόθεση (Η 0 ) = Οι επιδόσεις των μαθητών που διδάχθηκαν την ύλη με την εξ αποστάσεως μέθοδο ΔΕΝ θα είναι διαφορετικές από τις επιδόσεις των μαθητών που διδάχθηκαν την ύλη με τη δια ζώσης μέθοδο Εναλλακτική Υπόθεση (Η 1 ) = Οι επιδόσεις των μαθητών που διδάχθηκαν την ύλη με την εξ αποστάσεως μέθοδο θα είναι διαφορετικές από τις επιδόσεις των μαθητών που διδάχθηκαν την ύλη με τη δια ζώσης μέθοδο ΔΕΝ επιχειρούμε κάποια συγκεκριμένη πρόβλεψη, οπότε αναφερόμαστε σε ΥΠΟΘΕΣΗ ΔΙΠΛΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Διάλεξη 7/ 15
Στατιστικός Έλεγχος Υποθέσεων Αν όμως έχουμε γνώση από προηγούμενες έρευνες μπορούμε να κάνουμε την υπόθεση μας πιο συγκεκριμένη δηλ. ΥΠΟΘΕΣΗ ΜΟΝΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Μηδενική Υπόθεση (Η 0 ) = Οι επιδόσεις των μαθητών που διδάχθηκαν την ύλη με την εξ αποστάσεως μέθοδο ΔΕΝ θα είναι καλύτερες από τις επιδόσεις των μαθητών που διδάχθηκαν την ύλη με τη δια ζώσης μέθοδο Εναλλακτική Υπόθεση (Η 1 ) = Οι επιδόσεις των μαθητών που διδάχθηκαν την ύλη με την εξ αποστάσεως μέθοδο θα είναι καλύτερες από τις επιδόσεις των μαθητών που διδάχθηκαν την ύλη με τη δια ζώσης μέθοδο Διάλεξη 7/ 16
Αφού διατυπώσουμε τις υποθέσεις μας ο Στατιστικός Έλεγχος Υποθέσεων έχει ως σκοπό να Απορρίψουμε ή να Αποδεχτούμε τη μηδενική υπόθεση Διάλεξη 7/ 17
Γενική διαδικασία για τον έλεγχο υποθέσεων: 1. Πρώτα βρίσκουμε το αποτέλεσμα (δηλ. τη στατιστική τιμή) που προκύπτει από τη χρήση του στατιστικού κριτηρίου που εφαρμόσαμε. Το στατιστικό κριτήριο εξαρτάται από το πρόβλημα που μελετάμε (μπορεί να είναι μια απλή συσχέτιση, ή στην περίπτωση μας το κριτήριο τ για το έλεγχο της διαφοράς των μέσων όρων 2 διαφορετικών δειγμάτων) 2. Για κάθε πιθανή στατιστική τιμή έχει οριστεί από τους στατιστικολόγους και η πιθανότητα εμφάνισης μιας τιμής τουλάχιστον ίδιας με αυτή, όταν η Η0 είναι αληθινή ( η λεγόμενη κρίσιμη τιμή) 3. Στη συνέχεια, και με βάση την κρίσιμη τιμή, καθορίζουμε την περιοχή απόρριψης της Η0 4. Τέλος, εφόσον η στατιστική τιμή βρίσκεται μέσα στα όρια αυτής της περιοχής, θα πρέπει να απορρίψουμε την Η0. Σε αντίθετη περίπτωση θα πρέπει να την αποδεχθούμε Διάλεξη 7/ 18
Γενική διαδικασία για τον έλεγχο υποθέσεων: 1. Ας υποθέσουμε ότι από τη χρήση του στατιστικού κριτηρίου που χρησιμοποιήσαμε βρήκαμε τη στατιστική τιμή = 3,67 2. Από τους αντίστοιχους πίνακες βρίσκουμε ότι για επίπεδο στατιστικής σημαντικότητας α=0,05 και για υπόθεση διπλής κατεύθυνσης, η κρίσιμη τιμή είναι 2,09 Διάλεξη 7/ 19
3. Στη συνέχεια, και με βάση την κρίσιμη τιμή, καθορίζουμε την περιοχή απόρριψης της Η0 4. Η στατιστική τιμή πέφτει μέσα στην περιοχή απόρριψης της Η0 (γκρι περιοχή). Επομένως θα πρέπει να απορρίψουμε την Η0 και να δεχθούμε την Η1 Διάλεξη 7/ 20
Διάλεξη 7/ 21
Συνοψίζοντας για τον έλεγχο υποθέσεων 1. Κάθε φορά που επιθυμούμε να προσδιορίσουμε μια συσχέτιση, η μια διαφορά, στο δείγμα μας (ή σε διαφορετικά δείγματα), χρησιμοποιούμε ένα κατάλληλο στατιστικό κριτήριο (πχ το δείκτη συσχέτισης, ή το t- test) 2. To στατιστικό κριτήριο που χρησιμοποιούμε έχει εκ των προτέρων γνωστές ιδιότητες (ιδιαιτέρα η κατανομή συχνοτήτων του) 3. Αφού γνωρίζουμε την κατανομή του, μπορούμε να εκτιμήσουμε την πιθανότητα να λάβει το στατιστικό κριτήριο, την τιμή που έλαβε 4. Εφόσον η πιθανότητα να λάβει το στατιστικό κριτήριο την τιμή που έλαβε είναι μικρότερη από το επίπεδο στατιστικής σημαντικότητας που έχουμε ορίσει (συνήθως 0,05) τότε δεχόμαστε την εναλλακτική υπόθεση. Διάλεξη 7/ 22
Δηλ. έχοντας τα δεδομένα από το δείγμα μας: Εξετάζουμε ( με κατάλληλο στατιστικό τεστ) αν θα δεχτούμε Τη μηδενική υπόθεση Για τον πληθυσμό Διάλεξη 7/ 23
Σημαντική παρατήρηση: Ποτέ μα ποτέ δεν μπορούμε να είμαστε σίγουροι για το ποια από τις 2 υποθέσεις είναι η σωστή. Συνήθως λοιπόν, οι ερευνητές δουλεύουν με πιθανότητες. Συγκεκριμένα εξετάζουμε την πιθανότητα τα αποτελέσματα μας να είναι τυχαία. Όσο η πιθανότητα αυτή μειώνεται τόσο μεγαλύτερη είναι η εμπιστοσύνη μας προς την αποδοχή της εναλλακτικής υπόθεσης. Στην ψυχολογία, έχει επικρατήσει να χρησιμοποιούμε το όριο του 95% αναφορικά με τη βεβαιότητα: μόνο όταν είμαστε 95% βέβαιοι ότι τα αποτελέσματα μας δεν είναι τυχαία, μόνο τότε δεχόμαστε ότι τα αποτελέσματα μας είναι πραγματικά Διάλεξη 7/ 24
Υπάρχουν δύο πιθανά σφάλματα. Σφάλμα Τύπου Ι (Τype I error) συμβαίνει όταν απορρίπτουμε μία αληθής μηδενική υπόθεση (πχ ένα σφάλμα τύπου Ι συμβαίνει όταν ο δικαστής καταδικάσει κάποιον αθώο). Σφάλμα Τύπου ΙΙ (Type II error) συμβαίνει όταν δεχόμαστε τη μηδενική υπόθεση ενώ δεν είναι αληθινή (πχ ένοχος κατηγορούμενος αθωώνεται). Ισχύς (power) = η ικανότητα του κριτηρίου να απορρίπτει τη μηδενική υπόθεση ενώ αυτή είναι πράγματι λανθασμένη. (δείτε το video: errortypes.avi) Διάλεξη 7/ 25
Required Sample Size (N) (Algorithm: Fisher Z Refined) 300 250 200 150 100 50 One Correlation: Sample Size Calculation One Correlation, t-test (H0: Rho = 0 N vs. Rho (Power = 0.9, Alpha = 0.05 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Population Correlation (Rho) Διάλεξη 7/ 26
Correlation is not causation Ο δείκτης συσχέτισης είναι ένα στατιστικό κριτήριο που μας πληροφορεί μόνο για τη συμμεταβολή των δύο μεταβλητών που μελετώνται και όχι για το εάν υπάρχει αιτιώδης σχέση μεταξύ τους Η υψηλή συσχέτιση δεν δηλώνει σχέσεις αιτίου και αποτελέσματος. Μπορεί να οφείλεται σε μια τρίτη μεταβλητή, την οποία δεν έχουμε συμπεριλάβει στην έρευνά μας, και η οποία να λειτουργεί ως αίτιο Διάλεξη 7/ 27
Διάλεξη 7/ 28