(ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 5 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο, 27-03-2013
Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα Διάλεξη 5 / 2
Περιγράφοντας & Εξερευνώντας την Κανονική Κατανομή (normal ή Gaussian distribution) Διάλεξη 5 / 3
Η κανονική κατανομή αποτελεί στην ουσία μια υποθετική κατανομή η οποία έχει ορισμένα ιδιαιτέρα χρήσιμα και ελκυστικά για τις στατιστικές αναλύσεις χαρακτηριστικά. Πολλές μεταβλητές στην ψυχολογία θεωρούμε ότι σχηματίζουν κανονική κατανομή στον πληθυσμό. Το πόσο μπορούμε να αποκλίνουμε από το σχήμα της κανονικής κατανομής είναι συζητήσιμο. Τα περισσότερα και ισχυρότερα στατιστικά κριτήρια (τεστ) που χρησιμοποιούμε προϋποθέτουν ότι οι μετρήσεις του πληθυσμού θα ακολουθούσαν κανονική κατανομή. Με βάση την κανονική κατανομή μπορούμε να εξάγουμε συμπεράσματα για μεμονωμένες τιμές μεταβλητών που την ακολουθούν Διάλεξη 5 / 4
Χαρακτηριστικά της Κανονικής Κατατομής (ΚΤ) 1. Έχει κωδωνοειδές σχήμα (καμπάνας) και η καμπύλη είναι ασυμπτωτική (asymptotic) προς τον οριζόντιο άξονα, δηλ. θεωρητικά δεν αγγίζει ποτέ τον οριζόντιο άξονα, αλλά προεκτείνεται και προς τις δύο κατευθύνσεις προς το άπειρο 2. Είναι συμμετρική γύρω από το μέσο όρο 3. Ο ΜΟ, η Δμ και η Δστ είναι ίσες 4. Μπορούμε εύκολα να την προσδιορίσουμε από το ΜΟ και την τυπική απόκλιση (ΤΑ) 5. Η επιφάνεια κάτω από τη γραμμή είναι ανάλογη της σχετικής συχνότητας των παρατηρήσεων μας Διάλεξη 5 / 5
Ποια είναι η σχέση ανάμεσα στην ΚΤ και την ΤΑ? Κάθε δείγμα έχει ένα μέσο όρο και μια τυπική απόκλιση Διαφορετικές τιμές για το ΜΟ και την ΤΑ έχουν ως αποτέλεσμα η ΚΤ να έχει διαφορετικό σχήμα χωρίς όμως να χάνει τις ιδιότητες της (Δείτε το αρχείο normadistribution.avi στο Φάκελο VIDEO) Διάλεξη 5 / 6
Σε όλες τις κανονικές κατανομές η ΤΑ «κόβει»- διαχωρίζει ένα συγκεκριμένο ποσοστό των τιμών. Αν για παράδειγμα γνωρίζουμε ότι οι τιμές μιας μεταβλητής ακολουθούν την ΚΤ και επιπλέον γνωρίζουμε το ΜΟ και την ΤΑ τότε μπορούμε να υπολογίσουμε το ποσοστό των τιμών που βρίσκεται σε οποιοδήποτε εύρος μας ενδιαφέρει Διάλεξη 5 / 7
Για μια μεταβλητή που ακολουθεί την κανονική κατατομή: Το 68% περίπου των τιμών της μεταβλητής βρίσκεται ±1 τυπική απόκλιση από το μέσο όρο Διάλεξη 5 / 8
Το 95% περίπου των τιμών της μεταβλητής βρίσκεται ±2 τυπικές αποκλίσεις από το μέσο όρο Το 99.7% περίπου των τιμών της μεταβλητής βρίσκεται ±3 τυπικές αποκλίσεις από το μέσο όρο Διάλεξη 5 / 9
Τα ποσοστά αυτά είναι απλά προσεγγίσεις. Στη πραγματικότητα τα αληθινά ποσοστά μπορεί να είναι διαφορετικά από τα θεωρητικά. Εντούτοις, τα ποσοστά αυτά είναι πολύ χρήσιμα γιατί αν μας δοθεί πολύ μικρή πληροφορία μπορούμε να ανακατασκευάσουμε τα αρχικά δεδομένα με σημαντικά πλεονεκτήματα Διάλεξη 5 / 10
Είδαμε ότι το σχήμα της κανονικής κατανομής επηρεάζεται από την τυπική απόκλιση. Υπάρχει όμως μια ΚΤ η οποία ονομάζεται τυπική κανονική κατανομή (standard normal distribution), η οποία έχει μέσο όρο μηδέν και τυπική απόκλιση ίση με τη μονάδα Ν(0,1). Την τυπική κανονική κατανομή μπορούμε να τη χρησιμοποιήσουμε για να υπολογίσουμε το πόσο πιθανή είναι μια συγκεκριμένη τιμή της μεταβλητής μας (πχ. Αν βρούμε ότι η τιμή μιας μεταβλητής είναι μεγαλύτερη από το 2 (στην τυπική κανονική κατανομή) τότε ξέρουμε ότι η τιμή αυτή έχει πολύ μικρή πιθανότητα να παρατηρηθεί αφού το 95% των τιμών βρίσκονται στο ±2) Διάλεξη 5 / 11
Γενικά μπορούμε να μετατρέψουμε τις τιμές μιας μεταβλητής που ακολουθεί την κανονική κατανομή σε Τυπική Κανονική Κατανομή μέσω των τυπικών ή z-τιμών (standard ή z-scores). ΓΙΑΤΙ είναι χρήσιμο αυτό? Διάλεξη 5 / 12
Οι τυπικές τιμές Τυπική τιμή (ή z-τιμή) (standardised or z-scores): Αποτελεί ένα τρόπο για να «σταντάρουμε» την τιμή μιας μεταβλητής (σκορ) σε σχέση με τις άλλες τιμές στο δείγμα μας. Συγκεκριμένα δείχνει πόσες τυπικές αποκλίσεις πάνω ή κάτω από το μέσο όρο βρίσκεται η αντίστοιχη αρχική τιμή. Με άλλα λόγια επαναπροσδιορίζουμε την κάθε τιμή στο δείγμα μας με βάση το πόσο κοντά η μακριά βρίσκεται από το ΜΟ. Επιπλέον αυτός ο επαναπροσδιορισμός σημαίνει ότι οι τιμές θα ακολουθούν μια κατανομή όπου ο ΜΟ=0 και η ΤΑ=1 Διάλεξη 5 / 13
Χαρακτηριστικά τυπικών τιμών: 1. Η κατανομή των τυπικών τιμών έχει ίδιο σχήμα με αυτό της αρχικής κατανομής (η θέση των τιμών είναι ίδια). 2. Ο μέσος όρος της τυπικής κατανομής είναι πάντα 0 και η τυπική απόκλισή της είναι πάντα 1. 3. Οι τυπικές τιμές εκφράζονται σε αριθμούς χωρίς μονάδες (ή σε μονάδες τυπικής απόκλισης και είναι ανεξάρτητες από τη μονάδα μέτρησης). Διάλεξη 5 / 14
Η τυπική κανονική κατανομή Διάλεξη 5 / 15
Ο τύπος υπολογισμού της τυπικής τιμής: z = ( X s X ) Όπου: Χ είναι η τιμή της μεταβλητής X s είναι ο μέσος όρος είναι η τυπική απόκλιση Διάλεξη 5 / 16
ΓΙΑΤΙ είναι χρήσιμες οι τυπικές τιμές Αυτό που μας προσφέρουν οι τυπικές τιμές είναι δύο πράγματα: 1. Ένα σημείο αναφοράς ως προς το μέσο όρο 2. Τη δυνατότητα να συγκλίνουμε τιμές από διαφορετικά δείγματα Πχ Έστω ένα δείγμα 300 ατόμων για τα οποία μετράμε την ΕQ. Τι συμπέρασμα θα βγάζαμε αν για ένα άτομο η EQ είναι 125? Αν όμως το άτομο αυτό έχει ένα z score=3, τότε ξέρουμε ότι είναι έχουμε άτομο με ιδιαιτέρα υψηλή EQ Διάλεξη 5 / 17
«Η επιφάνεια κάτω από τη καμπύλη» Στα περισσότερα βιβλία στατιστικής θα βρείτε στο τέλος του βιβλίου ένα πίνακα που ονομάζεται: ΠΙΝΑΚΑΣ ΤΗΣ ΤΥΠΙΚΗΣ ΚΑΝΟΝΙΚΗΣ ΚΑΤΑΝΟΜΗΣ Ο πίνακας αυτός μας βοηθά να ανακαλύψουμε πράγματα για κάθε τιμή της μεταβλητής μας αρκεί πρώτα να την μετατρέψουμε σε τυπικές τιμές. Διάλεξη 5 / 18
Περιοχή κάτω από το z (below z)= το ποσοστό των τιμών που είναι μικρότερες από μια συγκεκριμένη τιμή του z Περιοχή πάνω από το z (above z)= το ποσοστό των τιμών που είναι μεγαλύτερες από μια συγκεκριμένη τιμή του z Διάλεξη 5 / 19
ΓΙΑΤΙ είναι χρήσιμο αυτό? Περιοχή ανάμεσα στο μέσο όρο και το z = το ποσοστό των τιμών που βρίσκονται μεταξύ του μέσου όρου και μιας συγκεκριμένης τιμής του z Διάλεξη 5 / 20
Παραδείγματα 1. Σε ένα τεστ δημιουργικότητας, ο μο= 100 και η ΤΑ=15. 263 άτομα στο Παν/μιο Κρήτης απάντησαν στο τεστ. Ένας φοιτητής από το τμήμα Ψυχολογίας έλαβε σκορ 130. Τι ποσοστό των ατόμων έλαβαν μεγαλύτερο σκορ από 130? Και συγκεκριμένα πόσα άτομα? Διάλεξη 5 / 21
Μετατρέπουμε την αρχική τιμή σε z-score: Διάλεξη 5 / 22
Πoσοστό = 0,0228*100=2,228% Με άλλα λόγια 2,228% είναι το ποσοστό των ατόμων που έλαβαν μεγαλύτερο σκορ από το 130 ή 226*2,228 = 6 άτομα Διάλεξη 5 / 23
2. Σε ένα τεστ δημιουργικότητας, ο μο= 100 και η ΤΑ=15. 263 άτομα στο Παν/μιο Κρήτης απάντησαν στο τεστ. Ένας καθηγητής από το τμήμα Ψυχολογίας έλαβε σκορ 60. Τι ποσοστό των ατόμων έλαβαν μικρότερο σκορ από 60? Και συγκεκριμένα πόσα άτομα? Διάλεξη 5 / 24
Μετατρέπουμε την αρχική τιμή σε z-score: Διάλεξη 5 / 25
Πoσοστό = 0,0038*100=0,38% Με άλλα λόγια 0,38% είναι το ποσοστό των ατόμων που έλαβαν μικρότερο σκορ από το 60 ή 226*0,0038 = 1 άτομο Διάλεξη 5 / 26
3. Σε μια έρευνα μέτρησα το χρόνο που κάποιος καθηγητής χρειάζεται για να κάνει το κοινό του να κοιμηθεί. Βρήκα ότι ο μο=7 λεπτά και τα= 2 λεπτά. Το ερώτημα είναι ποιος είναι ο ελάχιστος χρόνος που το κοινό έμεινε ξύπνιο για το 10% των καθηγητών που είχαν το μεγαλύτερο ενδιαφέρον να τους παρακολουθήσει κάποιος? Διάλεξη 5 / 27
Μετατρέπουμε το ποσοστό (10% ή 0,10) σε z-score: Διάλεξη 5 / 28
Διάλεξη 5 / 29
Συμπέρασμα το 10% από τους πιο ενδιαφέροντες καθηγητές κρατάει ξύπνιο το κοινό τους για 9, 56 λεπτά Διάλεξη 5 / 30
Άλλες τυπικές τιμές Ένα θέμα που προκύπτει από τις τυπικές τιμές είναι το αρνητικό πρόσημο το οποίο δημιουργεί σύγχυση. Πχ τι σημαίνει μια βαθμολογία σε ένα IQ τεστ ίση με -2? Για να ξεπεραστεί αυτό το μειονέκτημα χρησιμοποιούμε τις Τ-τιμές: Τ-τιμές (T-scores): Οι τυπικές τιμές μιας κανονικής κατανομής που έχουν μετατραπεί σε άλλη ισοδύναμη κλίμακα, η οποία δεν περιλαμβάνει αρνητικές τιμές. Ο τύπος υπολογισμού: Τ = 50 +10z Η νέα αυτή κατανομή έχει μέσο όρο 50 και τυπική απόκλιση 10 Διάλεξη 5 / 31
Πχ για z-τιμή = -3 έχουμε Τ = 50 + 10(-3)= 50-30= 20. Για z-τιμή = +3 έχουμε Τ= 50 + 10(+3)= 50 + 30= 80. Κανονική κατανομή του δείκτη νοημοσύνης Διάλεξη 5 / 32
Διάλεξη 5 / 33
Εξετάζοντας πότε μια κατανομή είναι κανονική (δείτε το video KS-test.avi) Tests of Normality Kolmogorov-Smirnov exam computer lectures numeracy df Sig..102 100.012.095 100.027.064 100.200.153 100.000 Διάλεξη 5 / 34
Tests of Normality Kolmogorov-Smirnov exam computer lectures numeracy df Sig..102 100.012.095 100.027.064 100.200.153 100.000 Διάλεξη 5 / 35
Αν η μεταβλητή δεν ακολουθεί την κανονική κατανομή ΔΕΝ μπορούμε να κάνουμε αναλύσεις? Φυσικά και μπορούμε χρησιμοποιώντας τα λεγόμενα μηπαραμετρικά (non parametric) τεστ. Χαρακτηριστικό τους είναι ότι δεν χρειάζονται τις προϋποθέσεις που χρειάζονται τα παραμετρικά τεστ (?). Το πρόβλημα είναι όμως ότι παρουσιάζουν μειωμένη δύναμη (power). Αυτό σημαίνει ότι αν υπάρχει ένα φαινόμενο στα δεδομένα μας το οποίο θέλουμε να αναδείξουμε, τότε είναι πιο πιθανό να το αναδείξουμε με τα παραμετρικά και όχι με τα μη παραμετρικά τεστ. Διάλεξη 5 / 36
Γνωστά μη-παραμετρικά τεστ: 1. Mann-Witney test (για διαφορές μεταξύ 2 ομάδων σε ανεξάρτητα δείγματα) 2. Wilcoxon Signed-Rank test (για διαφορές μεταξύ 2 ομάδων σε εξαρτημένα δείγματα) 3. Kruskat-Wallis test (για διαφορές μεταξύ >2 ομάδων σε ανεξάρτητα δείγματα) Διάλεξη 5 / 37
Τα σκορ σε ένα τεστ ακολουθούν την κανονική κατανομή με ΜΟ=100 και ΤΑ=20. Αν μετατρέψουμε τα σκορ σε z-τιμές ποια από τις παρακάτω προτάσεις είναι αληθινή: Α. Και ο μέσος όρος και η διάμεσος είναι ίσα με το μηδέν Β. Ο ΜΟ = 0 αλλά δεν μπορούμε να προσδιορίσουμε τη διάμεσο Γ. Ο ΜΟ και οι τυπικές τιμές θα είναι ίσες με το 100 Δ. Ο ΜΟ και οι τυπικές τιμές θα είναι ίσες με το 5 Διάλεξη 5 / 38
Tετάρτη: 03-04-2013 Διάλεξη 5 / 39
Διάλεξη 5 / 40