Διάλεξη 1 Βασικές έννοιες

Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 1 Βασικές έννοιες ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο, 27-02-2013

Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα Διάλεξη 1/ 2

Βαθμολογία: 6 ατομικές εργασίες: (Η συλλογή δεδομένων μέσω ερωτηματολογίου, η καταχώριση στο SPSS και η αποστολή του αρχείου SPSS στο διδάσκοντα θεωρείται εργασία και βαθμολογείται ΌΧΙ Τελική εξέταση : Διάλεξη 1/ 3

Διάλεξη 1/ 4

Προσοχή: Η παράδοση των 5 ατομικών εργασιών θα γίνεται σε ένα μόνο αρχείο zip kai μόνο μέσω email >στο statisticsuoc@gmail.com Στο email πρέπει να γράφετε στο θέμα τα εξής: ErgSPSS-Epitheto-Onoma Διάλεξη 1/ 5

Για να θυμηθούμε μερικά βασικές έννοιες 1. Τι είναι η Στατιστική? 2. Τυχαία Δειγματοληψία? 3. Μεταβλητές? 4. Η βασική μαθηματική εξίσωση της στατιστικής? 5. Δείκτες κεντρικής Τάσης? 6. Δείκτες διασποράς? 7. Κλίμακες μέτρησης? 8. Κανονική κατανομή? Διάλεξη 1/ 6

9. Τυπική κανονική κατανομή? 10. Στατιστική σημαντικότητα? 11. Έλεγχος υποθέσεων? Διάλεξη 1/ 7

Τι είναι Στατιστική; Στατιστική είναι ένας τρόπος με τον οποίο αντλούμε πληροφορίες από δεδομένα. Στατιστική Δεδομένα Πληροφορίες Δεδομένα: Γεγονότα, κυρίως αριθμητικά, συλλεγμένα για αναφορά ή πληροφορία. Στατιστική είναι ένα εργαλείο για να δημιουργήσουμε μία νέα αντίληψη από ένα σύνολο αριθμών. Πληροφορία: Γνώση αναφερόμενη για κάποιο συγκεκριμένο γεγονός. ΔΕΔΟΜΕΝΑ =210895496 >>>ΠΛΗΡΟΦΟΡΙΑ 210-895 496 Definitions: Oxford English Dictionary Διάλεξη 1/ 8

Διάλεξη 1/ 9

Τυχαία (random sampling) ονομάζεται η δειγματοληψία κατά την οποία κάθε μέλος του πληθυσμού έχει την ίδια πιθανότητα, με τα υπόλοιπα μέλη, να επιλεχθεί στο δείγμα. Μη τυχαία (non random sampling) ονομάζεται η δειγματοληψία κατά την οποία ορισμένα άτομα έχουν μεγαλύτερη (αλλά άγνωστη) πιθανότητα να επιλεγούν στο δείγμα. Η τυχαία δειγματοληψία, αυξάνει την εγκυρότητα των αποτελεσμάτων της έρευνας μας Διάλεξη 1/ 10

Πληθυσμός Δείγμα Διάλεξη 1/ 11

Convenience Sampling Ερευνητής Διάλεξη 1/ 12

Volunteer Sampling Εγώ θα λάβω μέρος! Εγώ θα λάβω μέρος! Ερευνητής Εγώ θα λάβω μέρος! Διάλεξη 1/ 13

Network/Snowball Sampling Ερευνητής Διάλεξη 1/ 14

Simple Random Sampling 2, 6, 7, 12, 18 Διάλεξη 1/ 15

ΜΕΤΑΒΛΗΤΕΣ Κάθε τι (αντικείμενο ή κατάσταση) που επιδέχεται περισσότερες από μια τιμές. Οι τιμές αυτές δεν χρειάζεται να είναι κατ ανάγκη αριθμητικές. Για παράδειγμα: Το βάρος, το ύψος, το φύλο, μάρκες αυτοκινήτων, η δημιουργικότητα, η συναισθηματική νοημοσύνη Στην ψυχολογία πολλές μεταβλητές δεν μπορούμε να τις μετρήσουμε απευθείας (πχ νοημοσύνη) και χρησιμοποιήσουμε διάφορες τεχνικές και έμμεσους τρόπους (πχ ερωτηματολόγια αυτό-αναφοράς) για να τις εκτιμήσουμε. Διάλεξη 1/ 16

Βασική μαθηματική εξίσωση: Αποτέλεσμα = (Μοντέλο) + Λάθος Διάλεξη 1/ 17

O Μέσος όρος, η Δεσπόζουσα τιμή (mode), και η Διάμεσος (median) ανήκουν στους λεγόμενους δείκτες κεντρικής τάσης (central tendency measures) και χρησιμοποιούνται για να δείξουν το κέντρο μιας σειράς δεδομένων (κατανομής). Η Τυπική απόκλιση, το Ενδοτεταρτημοριακό εύρος (interquartile range) και το Εύρος (range) και ανήκουν στους λεγόμενους δείκτες διασποράς και χρησιμοποιούνται για να δείξουν τη διακύμανση των τιμών μιας σειράς δεδομένων (κατανομής). Διάλεξη 1/ 18

Ο μέσος όρος ως παράδειγμα ενός απλού στατιστικού μοντέλου Ο μέσος όρος είναι στην ουσία ένα απλό μοντέλο. Αποτελεί μια σύνοψη των δεδομένων μας. Είναι μια υποθετική τιμή, η οποία μπορεί να υπολογιστεί για κάθε σύνολο δεδομένων αλλά δεν είναι απαραίτητο να υπάρχει στα δεδομένα μας. Για παράδειγμα υποθέστε ότι ρωτάμε 5 φοιτητές να μας πουν τον αριθμό των «κολλητών» που έχουν. Τα δεδομένα μας μπορεί να είναι ως εξής: 1, 2, 3, 3 και 4. Στην περίπτωση αυτή ο Μ.Ο = (1+2+3+3+4)/5 = 2,6 Είναι μάλλον αδύνατο να έχουμε 2,6 φίλους. Επομένως η τιμή του Μ.Ο. είναι μια υποθετική τιμή. Υπό την έννοια αυτή ο Μ.Ο. αποτελεί ένα μοντέλο που κατασκευάσαμε προκειμένου να περιγράψουμε κατά τρόπο συνοπτικό τα δεδομένα μας. Διάλεξη 1/ 19

Η τυπική απόκλιση είναι ένα μέτρο του πόσο καλή είναι η προσαρμογή του μέσου όρου στα δεδομένα. Μικρές τιμές (σε σχέση με το μ.ο. ) δείχνουν ότι τα δεδομένα μας είναι κοντά στο μ.ο. Μεγάλες τιμές της τυπικής απόκλισης (σε σχέση με το μ.ο.) δείχνουν ότι τα δεδομένα μας βρίσκονται μακριά από το μ.ο. ή αλλιώς ότι ο μ.ο. δεν αναπαριστά με ακρίβεια τα δεδομένα μας. Διάλεξη 1/ 20

Το τυπικό σφάλμα (standard error) (ή ποσό αντιπροσωπευτικό είναι το δείγμα μας ) Από τα προηγούμενα μαθήματα γνωρίζουμε ότι στην ψυχολογία παίρνουμε τυχαία δείγματα από κάποιον πληθυσμό (στον οποίο δεν έχουμε πρόσβαση) για να εξηγήσουμε φαινόμενα σε επίπεδο πληθυσμού. Είδαμε ότι μπορούμε να περιγράψουμε το δείγμα μας με το μ.ο. και με την τυπική απόκλιση εξετάζουμε την προσαρμογή του μ.ο. στα δεδομένα του δείγματος. Γνωρίσουμε επίσης ότι κάθε δείγμα που παίρνουμε από τον πληθυσμό μας είναι ένα από τα άπειρα δείγματα που μπορούμε να πάρουμε (θυμηθείτε τη δειγματοληπτική κατανομή) Το τυπικό σφάλμα είναι η τυπική απόκλιση της δειγματοληπτικής κατανομής και μας δίνει μια εκτίμηση του πόσο αντιπροσωπευτικό είναι το δείγμα μας. Διάλεξη 1/ 21

Διάλεξη 1/ 22

Χαρακτηριστικά της Κανονικής Κατατομής (ΚΤ) 1. Έχει κωδωνοειδές σχήμα (καμπάνας) και η καμπύλη είναι ασυμπτωτική (asymptotic) προς τον οριζόντιο άξονα, δηλ. θεωρητικά δεν αγγίζει ποτέ τον οριζόντιο άξονα, αλλά προεκτείνεται και προς τις δύο κατευθύνσεις προς το άπειρο 2. Είναι συμμετρική γύρω από το μέσο όρο 3. Ο ΜΟ, η Δμ και η Δστ είναι ίσες 4. Μπορούμε εύκολα να την προσδιορίσουμε από το ΜΟ και την τυπική απόκλιση (ΤΑ) 5. Η επιφάνεια κάτω από τη γραμμή είναι ανάλογη της σχετικής συχνότητας των παρατηρήσεων μας Διάλεξη 1/ 23

Είδαμε ότι το σχήμα της κανονικής κατανομής επηρεάζεται από την τυπική απόκλιση. Υπάρχει όμως μια ΚΤ η οποία ονομάζεται τυπική κανονική κατανομή (standard normal distribution), η οποία έχει μέσο όρο μηδέν και τυπική απόκλιση ίση με τη μονάδα Ν(0,1). Την τυπική κανονική κατανομή μπορούμε να τη χρησιμοποιήσουμε για να υπολογίσουμε το πόσο πιθανή είναι μια συγκεκριμένη τιμή της μεταβλητής μας (πχ. Αν βρούμε ότι η τιμή μιας μεταβλητής είναι μεγαλύτερη από το 2 (στην τυπική κανονική κατανομή) τότε ξέρουμε ότι η τιμή αυτή έχει πολύ μικρή πιθανότητα να παρατηρηθεί αφού το 95% των τιμών βρίσκονται στο ±2) Διάλεξη 1/ 24

ΓΙΑΤΙ είναι χρήσιμες οι τυπικές τιμές Αυτό που μας προσφέρουν οι τυπικές τιμές είναι δύο πράγματα: 1. Ένα σημείο αναφοράς ως προς το μέσο όρο 2. Τη δυνατότητα να συγκλίνουμε τιμές από διαφορετικά δείγματα Πχ Έστω ένα δείγμα 300 ατόμων για τα οποία μετράμε την ΕQ. Τι συμπέρασμα θα βγάζαμε αν για ένα άτομο η EQ είναι 125? Αν όμως το άτομο αυτό έχει ένα z score=3, τότε ξέρουμε ότι είναι έχουμε άτομο με ιδιαιτέρα υψηλή EQ Διάλεξη 1/ 25

Επίπεδο στατιστικής σημαντικότητας (significance level alpha). Το ορίζει ο ερευνητής και συνήθως είναι 0,05 ή 0,001 δηλαδή η πιθανότητα να πάρουμε τη συγκεκριμένη τιμή στο στατιστικό δείκτη εξαιτίας τυχαίων παραγόντων είναι μόλις 5% και 1% αντίστοιχα. Η τιμή p (p value), ενός στατιστικού τεστ είναι η πιθανότητα να παρατηρήσουμε ένα στατιστικό τεστ τουλάχιστον τόσο ακραίο όσο η υπολογισμένη, δοθέντος ότι η μηδενική υπόθεση είναι αληθής. Και οι δύο χρησιμοποιούνται στον έλεγχο υποθέσεων Διάλεξη 1/ 26

Στατιστικός έλεγχος υποθέσεων Αντιλαμβάνεστε ότι η στατιστική υπόθεση είναι στην ουσία ένας ισχυρισμός που κάνουμε για μια παράμετρο στον πληθυσμό μας (πχ μέσος όρος ή συσχέτιση). Διατυπώνουμε δύο εναλλακτικές: Μηδενική Υπόθεση- Ηο: συνήθως ένας ουδέτερος ισχυρισμός Εναλλακτική Υπόθεση- Η1 : μονής (one tailed) ή διπλής (two tailed) κατεύθυνσης πχ. η παρακολούθηση τηλεόρασης σχετίζεται με την κατάθλιψη? (διπλής κατεύθυνσης) Έστω μ Υ η μέση μεταβολή στην κατάθλιψη μετά από παρακολούθηση τηλεόρασης Ηο:μ Υ =0 κατάθλιψη >>>>η παρακολούθηση τηλεόρασης ΔΕΝ σχετίζεται με την H : µ 0 >>>>η παρακολούθηση τηλεόρασης σχετίζεται με την κατάθλιψη 1 Y Διάλεξη 1/ 27

Συνοψίζοντας για τον έλεγχο υποθέσεων 1. Κάθε φορά που επιθυμούμε να προσδιορίσουμε μια συσχέτιση, η μια διαφορά, στο δείγμα μας (ή σε διαφορετικά δείγματα), χρησιμοποιούμε ένα κατάλληλο στατιστικό κριτήριο (πχ το δείκτη συσχέτισης, ή το t- test) 2. To στατιστικό κριτήριο που χρησιμοποιούμε έχει εκ των προτέρων γνωστές ιδιότητες (ιδιαιτέρα η κατανομή συχνοτήτων του) 3. Αφού γνωρίζουμε την κατανομή του, μπορούμε να εκτιμήσουμε την πιθανότητα να λάβει το στατιστικό κριτήριο, την τιμή που έλαβε 4. Εφόσον η πιθανότητα να λάβει το στατιστικό κριτήριο την τιμή που έλαβε είναι μικρότερη από το επίπεδο στατιστικής σημαντικότητας που έχουμε ορίσει (συνήθως 0,05) τότε δεχόμαστε την εναλλακτική υπόθεση. Διάλεξη 1/ 28

Σφάλμα Τύπου Ι (Τype I error) συμβαίνει όταν απορρίπτουμε μία αληθής μηδενική υπόθεση (δηλ βρίσκουμε κάτι το οποίο στην ουσία δεν υπάρχει- Σφάλμα τύπου Ι συμβαίνει όταν ο δικαστής καταδικάσει κάποιον αθώο), α είναι η πιθανότητα να κάνουμε σφάλμα τύπου Ι Σφάλμα Τύπου ΙΙ (Type II error) συμβαίνει όταν δεχόμαστε τη μηδενική υπόθεση ενώ δεν είναι αληθινή (δηλ. δεν βρίσκουμε κάποια ένδειξη ενώ υπάρχει>> ένοχος κατηγορούμενος αθωώνεται), β είναι η πιθανότητα να κάνουμε σφάλμα τύπου ΙΙ Ισχύς (power) = η ικανότητα του κριτηρίου να απορρίπτει μια ψευδή μηδενική υπόθεση δηλ. να βρούμε μια ένδειξη εκέι που πραγματικά υπάρχει. Ισχύς=1-β. Διάλεξη 1/ 29

Ο Ρόλος των Η/Υ στην στατιστική Στατιστικά πακέτα: Διάλεξη 1/ 30

ΓΝΩΡΙΜΙΑ ΜΕ ΤΟ SPSS Διάλεξη 1/ 31

Διάλεξη 1/ 32