A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ
Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010
Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.att.sch.gr/abouras
Κανονική κατανομή τυποποιημένες τιμές standardized values Ως Ζ τιμή ή τυποποιημένη τιμή μιας παρατήρησης (μέτρη( μέτρη- σης) ορίζεται η απόσταση της παρατήρησης αυτής από το μέσο του συνόλου των παρατηρήσεων εκφρασμένη σε μο- νάδες τυπικής απόκλισης. Εναλλακτικά η Ζ-τιμή Ζ ορίζεται ως ο αριθμός των τυπικών α-α ποκλίσεων κατά τις οποίες μια παρατήρηση βρίσκεται πάνω ή κάτω από το μέσο. Z = Χ σ μ
Κανονική κατανομή τυποποιημένες τιμές standardized values Αγόρι 14 ετών: Ύψος 163, μέσος ύψους ηλικίας 155, τυπική απόκλιση κατανομής 9 Κορίτσι 11 ετών: Ύψος 130, μέσος ύψους ηλικίας 128, τυπική απόκλιση κατανομής 7 Είναι τα παιδιά ψηλά; Ποιο θεωρείται ψηλότερο; ( Χ Χ) 163 155 0,89 s 9 Ζ= = = ( Χ Χ ) 130 128 0,29 s 7 Ζ= = =
Κανονική κατανομή Χρησιμότητα και ερμηνεία του πίνακα κανονικής κατανομής
Κανονική κατανομή τυποποιημένες τιμές standardized values Αγόρι: : ύψος 163, μέσος ηλικιακό ύψος 155 Ζ=0,89 Το αγόρι είναι ψηλότερο από το 50+31,33=81,33% των συνομηλίκων του
Κανονική κατανομή τυποποιημένες τιμές standardized values Κορίτσι: : ύψος 130, μέσος ηλικιακό ύψος 128 Ζ=0,29 Το κορίτσι είναι ψηλότερο από το 50+11,41=61,41% των συνομηλίκων της
Κανονική κατανομή τυποποιημένες τιμές standardized values
Κανονική κατανομή τυποποιημένες τιμές standardized values +2,13 = 0,4834 +2,53 = 0,4943
Κανονική κατανομή τυποποιημένες τιμές standardized values
Κανονική κατανομή τυποποιημένες τιμές standardized values
Διαστήματα εμπιστοσύνης για μέσες τιμές X ± a Z1 2 σ n Μέσος = 26 Δείγμα = 100 Τυπική απόκλιση = 8 α = 0,01 8 26 ± 2,58 100 (23,94,28,06) α=0,05 Ζ= 1,96 α=0,01 Ζ= 2,58
Έλεγχος υποθέσεων Η μελέτη ενός φαινομένου ξεκινάει με τη διατύπωση μιας ερευνητικής υπόθεσης. Στόχος είναι, με τη βοήθεια στης στατιστικής, να ελεγχθεί αν η υπόθεση που έχει διατυπωθεί είναι αποδεκτή ή όχι. Λήψη απόφασης Ο έλεγχος υποθέσεων είναι ένα μοντέλο λήψης αποφάσεων με τη βοήθεια του οποίου αποφασίζουμε αν θα δεχτούμε ή θα απορρίψουμε την υπόθεση που έχουμε διατυπώσει. Βασικό ρόλο παίζει η διατύπωση των υποθέσεων.
Έλεγχος υποθέσεων Διατύπωση των υποθέσεων Μηδενική υπόθεση (null( hypothesis) Συμβολίζεται με το Ηο Δηλώνει ότι δεν υπάρχει σχέση ή συσχέτιση των μεταβλη- των που ερευνούνται. Εναλλακτική υπόθεση (alternative( hypothesis) Συμβολίζεται με το Η 1 Αναφέρεται στην πρόβλεψη που κάνουμε αναφορικά με τη σχέση ή τη συσχέτιση που υπάρχει μεταξύ των μεταβλητών που ερευνούνται. Στη διαδικασία του ελέγχου των υποθέσεων ελέγχουμε πά- ντοτε τη μηδενική υπόθεση έναντι της εναλλακτικής υπό- θεσης.. Αποδοχή της εναλλακτικής υπόθεσης σημαίνει απόρ- ριψη της μηδενικής.
Έλεγχος υποθέσεων Παράδειγμα: Μας ενδιαφέρει να μελετήσουμε την επίδοση των φοιτητών στο μάθημα της Στατιστικής (ως προς το φύλο). Μηδενική υπόθεση: Ηο : Χ Φοιτητών = Χ Φοιτητριών Δεν υπάρχει διαφορά στην επίδοση στο μάθημα της Στατι- στικής μεταξύ των φοιτητών και φοιτητριών. Εναλλακτική υπόθεση : Η 1 : Χ Φοιτητών Χ Φοιτητριών Οι επιδόσεις στο μάθημα της Στατιστικής διαφέρουν.
Έλεγχος υποθέσεων Επιλογή του κατάλληλου στατιστικού κριτηρίου Οι παράγοντες που παίζουν σημαντικό ρόλο στην επιλογή του κατάλληλου στατιστικού κριτηρίου είναι: - Το είδος των μεταβλητών που χρησιμοποιούνται - Η κλίμακα μέτρησης των μεταβλητών - Η φύση του πληθυσμού από τον οποίο προέρχεται το δείγμα της έρευνας Κάνουμε διάκριση ανάμεσα σε παραμετρικά και σε μη πα- ραμετρικά στατιστικά κριτήρια. (Πρέπει να ισχύουν ορισμένες προϋποθέσεις για τις παρα- μέτρους του πληθυσμού από τον οποίο προέρχεται το δείγμα: κανονική κατανομή δεδομένων, ίσες ή άνισες δια- κυμάνσεις των δειγμάτων, εξαρτημένα ή ανεξάρτητα δείγ- ματα)
Έλεγχος υποθέσεων Το επίπεδο σημαντικότητας Τα στατιστικά κριτήρια υπολογίζουν την πιθανότητα που υπάρχει για μια διαφορά ή μια συσχέτιση να προκύψει εξαι- τίας τυχαίων παραγόντων (δειγματοληπτικό σφάλμα) και όχι λόγω της σχέσης που υπάρχει μεταξύ των μεταβλητών. α Η ποσοστιαία πιθανότητα το αποτέλεσμα να έχει εμφανι- στεί λόγω τυχαίων παραγόντων ονομάζεται επίπεδο σημα- ντικότητας (significance level) και συμβολίζεται με το α. Συνήθως χρησιμοποιούμε τα επίπεδα σημαντικότητας α=0,05 και α=0,01.
Έλεγχος υποθέσεων Σφάλματα τύπου Ι και τύπου ΙΙ
Έλεγχος υποθέσεων Κρίσιμη τιμή Είναι η τιμή σε ένα στατιστικό κριτήριο πέρα από την οποία η Ηο απορρίπτεται. Οι κρίσιμες τιμές για κάθε στατιστικό κριτήριο έχουν συγκεντρωθεί σε ειδικούς πίνακες, οι οποίοι ονομάζονται πίνακες κρίσιμων τιμών και είναι διαφορετικές για κάθε επίπεδο στατιστικής σημαντικότητας.
Έλεγχος υποθέσεων Η περιοχή απόρριψης H περιοχή της δειγματοληπτικής κατανομής στην οποία η Ηο απορρίπτεται ονομάζεται περιοχή απόρριψης (rejection area). Η διαδικασία που ακολουθούμε για να απορρίψουμε ή να δεχτούμε τη μηδενική υπόθεση είναι η ακόλουθη: - Πρώτα βρίσκουμε τη στατιστική τιμή (statistical value) που προέρχεται από την εφαρμογή του στατιστικού κριτηρίου. - Για κάθε πιθανή στατιστική τιμή που θα βρούμε έχει οριστεί και η πιθανότητα εμφάνισης μιας τιμής τουλάχιστον ίδιας με αυτήν, όταν η Ηο είναι αληθινή (κρίσιμη τιμή, critical value)
Παράδειγμα Έλεγχος υποθέσεων Εξέταση μηδενικής υπόθεσης Επιλογή στατιστικού κριτηρίου t=3,67
Έλεγχος υποθέσεων Εύρεση κρίσιμης τιμής φοιτητές = 10, φοιτήτριες=12 βαθμοί ελευθερίας (df( df)=10+12-2=202=20 κρίσιμη τιμή 2,09 (υπόθεση διπλής Κατεύθυνσης)
Έλεγχος υποθέσεων Βαθμοί ελευθερίας Ο στατιστικός ορισμός για τους βαθμούς ελευθερίας είναι: Ο αριθμός των παρατηρήσεων μείον τον αριθμό των περιο- ρισμών που δεν επιτρέπουν στις παρατηρήσεις να μεταβάλ- λονται ελεύθερα. Ας υποθέσουμε ότι επιλέγουμε τυχαία τρεις τιμές από ένα σύνολο τιμών ενός πληθυσμού, π.χ. 3, 7, 8. Από τη στιγμή που και οι τρεις τιμές που επιλέξαμε είναι ελεύθερες να με- ταβάλλονται (δηλ. θα μπορούσαμε να επιλέξουμε τρεις δια- φορετικές τιμές), υπάρχουν 3 βαθμοί ελευθερίας. Στην περίπτωση που για να υπολογίσουμε το μέσο όρο του πληθυσμού χρησιμοποιούμε το μέσο των τιμών που επιλέ- ξαμε οι ελεύθερα μεταβαλλόμενες τιμές είναι δυο, αφού η τρίτη πρέπει να είναι συνάρτηση των δυο άλλων.
Έλεγχος υποθέσεων Απόρριψη ή όχι της μηδενικής υπόθεσης t>tο ή t<-tο
Έλεγχος υποθέσεων Απόρριψη ή όχι της μηδενικής υπόθεσης Η 1 : μ χ -μ ψ >0 t>tο (n+m-2, 1-α) 1 Η 1 : μ χ -μ ψ <0 t<-tο (n+m-2, 1-α1 μηδενική υπόθεση μονής κατεύθυνσης
Έλεγχος υποθέσεων Στατιστικά κριτήρια (παράδειγμα) μ = 7,5 (μέσος πληθυσμού = 7,5) μ 7,5 X μ 8,7 7,5 1,2 T = = = = 2,22 s 1, 7 0,54 N 10 T > t α n 1,1 2 T < t α n 1,1 2 t n 1,1 α 2 = t = 9, 0, 9 7 5 2,26 Δεν απορρίπτεται η μηδενική
Πίνακας κρίσιμων τιμών Έλεγχος υποθέσεων
Έλεγχος υποθέσεων Στατιστικά κριτήρια (παράδειγμα, ανεξάρτητα δείγματα) Ηο: μ Α =μ Γ Η 1 : μ Α μ Γ
Έλεγχος υποθέσεων Στατιστικά κριτήρια (παράδειγμα) απορρίπτω τη μηδενική υπόθεση αν: T > t α n+ m 2,1 2 T < t α n+ m 2,1 2 t n α + m 2,1 2 = t = 23,0,975 2,07 1,72<2,07 οπότε δεν απορρίπτεται η μηδενική υπόθεση
Έλεγχος υποθέσεων Στατιστικά κριτήρια (παράδειγμα, εξαρτημένα δείγματα) Ηο: λ χ >λ αλ Η 1 : λ χ <λ αλ
Έλεγχος υποθέσεων Στατιστικά κριτήρια (παράδειγμα, εξαρτημένα δείγματα) απορρίπτω τη μηδενική υπόθεση αν: T > tn 1,1 a 2,64>1,90 οπότε απορρίπτεται η μηδενική υπόθεση
Έλεγχος υποθέσεων (SPSS)( One-Sample Statistics VAR00001 Std. Error N Mean Std. Deviation Mean 10 8,7000 1,70294,53852 One-Sample Test VAR00001 Test Value = 7.5 95% Confidence Interval of the Mean Difference t df Sig. (2-tailed) Difference Lower Upper 2,228 9,053 1,20000 -,0182 2,4182 Αν α=0,05> sig απορρίπτεται η μηδενική υπόθεση
Έλεγχος υποθέσεων (SPSS)( Group Statistics VAR00003 VAR00005 1,00 2,00 Std. Error N Mean Std. Deviation Mean 12 13,0000 3,01511,87039 13 11,0000 2,79881,77625 VAR00003 Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,002,969 1,720 23,099 2,00000 1,16264 -,40510 4,40510 1,715 22,443,100 2,00000 1,16625 -,41589 4,41589
Έλεγχος υποθέσεων (SPSS)( Paired Samples Statistics Pair 1 VAR00007 VAR00008 Std. Error Mean N Std. Deviation Mean 5,2500 8 1,28174,45316 3,7500 8 1,03510,36596 Paired Samples Correlations Pair 1 VAR00007 & VAR00008 N Correlation Sig. 8,054,899 Paired Samples Test Pair 1 VAR00007 - VAR0000 Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed) 1,50000 1,60357,56695,15938 2,84062 2,646 7,033
Το στατιστικό κριτήριο (χ 2 ) Το χ 2 είναι το κατάλληλο κριτήριο για την περίπτωση που τα δεδομένα της έρευνας είναι κατηγορικά. Το χ 2 μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συ- χνότητα κατηγοριών που προέρχονται μόνο από ένα δείγμα (δείκτης προσαρμογής ή καταλληλότητας chi square as a goodness of fit test), ή από δυο ή περισσότερα δείγματα (χ 2 για ανεξαρτησία chi square as a test of independence) Τα δεδομένα πρέπει να έχουν τη μορφή συχνοτήτων. Το τεστ ουσιαστικά εξετάζει τη σχέση μεταξύ των κατηγοριών στις στήλες και τις γραμμές ενός πίνακα.
Το στατιστικό κριτήριο χ 2 για ένα δείγμα Εξετάζει αν υπάρχει διαφορά μεταξύ των δεδομένων που έχουν συλλεχθεί (πραγματικές συχνότητες observed frequencies) και αυτών που θα περιμέναμε να εμφανιστούν αν ίσχυε η μηδενική υπόθεση (αναμενόμενες συχνότητες expected frequencies).
Το στατιστικό κριτήριο χ 2 (παράδειγμα) Ηο: : Οι συχνότητες των τριών τύπων μελέτης δεν είναι δια- φορετικές μεταξύ τους Η1: Οι συχνότητες των τριών τύπων μελέτης είναι διαφο- ρετικές μεταξύ τους
Το στατιστικό κριτήριο χ 2 (παράδειγμα) Βαθμοί ελευθερίας (df): k-1 1 (k κατηγορίες) df: : 3-1=23 Αν 2 > 2 k,1 x x α Απορρίπτεται η μηδενική υπόθεση 7,34>5,9 απόρριψη
Το στατιστικό κριτήριο χ 2 (παράδειγμα) Παρατηρούμενες συχνότητες
Το στατιστικό κριτήριο χ 2 (παράδειγμα) Αναμενόμενες συχνότητες Βαθμοί ελευθερίας (df):(k-1) (λ-1)= (3-1) 1) (3-1)= 1)=4 Κρίσιμη τιμή 9,49 =41,38 41,38>9,49 απόρριψη
Το στατιστικό κριτήριο χ 2 (παράδειγμα SPSS)
Το στατιστικό κριτήριο χ 2 (παράδειγμα SPSS)
Το στατιστικό κριτήριο χ 2 (παράδειγμα SPSS)
Το στατιστικό κριτήριο χ 2 (παράδειγμα SPSS)
Το στατιστικό κριτήριο χ 2 (παράδειγμα SPSS) perioxi * programma Crosstabulation perioxi Total 1,00 2,00 3,00 Count Expected Count % within perioxi % within programma % of Total Count Expected Count % within perioxi % within programma % of Total Count Expected Count % within perioxi % within programma % of Total Count Expected Count % within perioxi % within programma % of Total programma 1,00 2,00 3,00 Total 50 55 45 150 70,0 52,5 27,5 150,0 33,3% 36,7% 30,0% 100,0% 17,9% 26,2% 40,9% 25,0% 8,3% 9,2% 7,5% 25,0% 80 80 40 200 93,3 70,0 36,7 200,0 40,0% 40,0% 20,0% 100,0% 28,6% 38,1% 36,4% 33,3% 13,3% 13,3% 6,7% 33,3% 150 75 25 250 116,7 87,5 45,8 250,0 60,0% 30,0% 10,0% 100,0% 53,6% 35,7% 22,7% 41,7% 25,0% 12,5% 4,2% 41,7% 280 210 110 600 280,0 210,0 110,0 600,0 46,7% 35,0% 18,3% 100,0% 100,0% 100,0% 100,0% 100,0% 46,7% 35,0% 18,3% 100,0%
Το στατιστικό κριτήριο χ 2 (παράδειγμα SPSS) Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association Chi-Square Tests Asymp. Sig. Value df (2-sided) 41,385 a 4,000 41,420 4,000 38,411 1,000 N of Valid Cases 600 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 27,50. Επειδή α=0,05>0 απορρίπτεται η μηδενική υπόθεση
Μη παραμετρικά κριτήρια Σύγκριση παραμετρικών με μη παραμετρικά στατιστικά κριτήρια
Μη παραμετρικά κριτήρια Αντιστοιχία μεταξύ παραμετρικών με μη παραμετρικών στατιστικών κριτηρίων