Δειγματοληψία Θεωρητικές Κατανομές Εκτιμητική Έλεγχοι Υποθέσεων. Επιμέλεια: Άγγελος Μάρκος, Επικ. Καθηγητής εκδ.2 /

Σχετικά έγγραφα
Αξιολόγηση στο μάθημα

Δειγματοληψία στην Ερευνα. Ετος

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Τρόποι και μέθοδοι δειγματοληψίας

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 3 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Εισαγωγή στην κοινωνική έρευνα. Earl Babbie. Κεφάλαιο 6. Δειγματοληψία 6-1

ΆΣΚΗΣΗ 1 Η διάμεσος τιμή της ηλικίας των Ελλήνων το 1990 ήταν 30 έτη. Το 2001, η διάμεσος τιμή ήταν 33,1 (Πηγή:Ε.Σ.Υ.Ε.).

Μεθοδολογία Έρευνας Διάλεξη 6 η : Μέθοδοι Δειγματοληψίας

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διάλεξη 1 Βασικές έννοιες

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Δειγµατοληψια. Καθηγητής Α. Καρασαββόγλου Επίκουρος Καθηγητής Π. Δελιάς

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σεμινάριο ΕΚΠ65 ιπλωματικές Εργασίες Αθήνα, 11 Οκτωβρίου 2009

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Δείγμα & Δειγματοληψία στην Έρευνα ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (#252) Θυμηθείτε. Γιατί δειγματοληψία; Δειγματοληψία

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Μαθησιακοί στόχοι κεφαλαίου

Ερευνητική υπόθεση. Η ερευνητική υπόθεση αναφέρεται σε μια συγκεκριμένη πρόβλεψη σχετικά με τη σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές.

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 5

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ. Ματσάγκος Ιωάννης-Μαθηματικός

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

Εισαγωγή στην Εκτιμητική

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Στατιστική Επιχειρήσεων ΙΙ

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Είδη Μεταβλητών. κλίµακα µέτρησης

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Σκοπός του μαθήματος

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. Κατανομές πιθανότητας

Δειγματοληψία. Δειγματοληψία στην επιδημιολογική επιτήρηση και διερεύνηση επιδημιών. Τύπος μελέτης και στόχος δειγματοληψίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μέθοδοι Γεωργοοικονομικής & Κοινωνιολογικής Έρευνας

Επιλογή Δείγματος. Απόστολος Βανταράκης Αναπλ. Καθηγητής Ιατρικής

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

Περιεχόμενα. Πρόλογος... 15

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Πειραματική έρευνα: Δειγματοληψία, μεταβλητές, υποθέσεις

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 3: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (3/4) Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

ΔΕΙΓΜΑ & ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΣΤΗΝ ΕΡΕΥΝΑ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Πιθανότητες - Κατανομές ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Στατιστική Συμπερασματολογία

Μεθοδολογία Επιστημονικής Έρευνας

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

5. Έλεγχοι Υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

14/11/ Καθορισμός & επιλογή συμμετεχόντων 1/16. Διαδικασία συλλογής δεδομένων. 1. Καθορισμός & επιλογή συμμετεχόντων 2/16

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων.

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Εισόδημα Κατανάλωση

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

i Σύνολα w = = = i v v i=

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Έρευνα Μάρκετινγκ Ενότητα 4

Βιοστατιστική ΒΙΟ-309

Δειγματικές Κατανομές

Transcript:

Δειγματοληψία Θεωρητικές Κατανομές Εκτιμητική Έλεγχοι Υποθέσεων Επιμέλεια: Άγγελος Μάρκος, Επικ. Καθηγητής εκδ.2 / 03.04.2016 1

Πληθυσμός και Δείγμα Πληθυσµός Δειγµατοληψίας Δείγµα Πληθυσµός - Στόχος 2

Πληθυσμός και Δείγμα Έρευνα για το κάπνισμα σε παιδιά ηλικίας 12 ετών στην Ελλάδα Μαθητές της Στ τάξης όλων των δηµοτικών σχολείων της χώρας Μαθητές Στ τάξης Παιδιά ηλικίας 12 ετών της χώρας 3

Πληθυσμός-στόχος και Πληθυσμός δειγματοληψίας Ο πληθυσμός-στόχος (target population) είναι το σύνολο των υποκειμένων που ενδιαφέρουν τον ερευνητή και συνήθως έχουν ένα κοινό χαρακτηριστικό π.χ. όλα τα παιδιά χωρισμένων γονέων, όλοι οι μαθητές πρωτοβάθμιας εκπαίδευσης, όλοι οι έφηβοι με διάγνωση νευρικής ανορεξίας. q Στις περισσότερες περιπτώσεις, ο ερευνητής δεν μπορεί να έχει πρόσβαση σε όλα τα υποκείμενα του πληθυσμούστόχου ώστε να επιλέξει το δείγμα. qτο σύνολο των υποκειμένων στα οποία ο ερευνητής έχει πρόσβαση και από τα οποία προκύπτει το δείγμα, ονομάζεται πληθυσμός δειγματοληψίας ή στατιστικός πληθυσμός (sampled population). 4

Πληθυσμός-στόχος και Πληθυσμός δειγματοληψίας Ο πληθυσμός-στόχος Τα υποκείμενα που έχουν τα χαρακτηριστικά που επιθυμεί ο ερευνητής Ο πληθυσμός δειγματοληψίας Ένα τμήμα του πληθυσμού στόχου στο οποίο ο ερευνητής έχει πρόσβαση. Το Δείγμα Τα υποκείμενα της έρευνας 5

Στατιστικά: Είναι οι δείκτες που περιγράφουν ένα δείγμα π.χ. δειγματικός μέσος όρος, δειγματική διακύμανση, s 2 aναλογία P Παράμετροι: Είναι οι δείκτες που περιγράφουνέναν πληθυσμό π.χ. πληθυσμιακός μέσος όρος μ, πληθυσμιακή διακύμανση, σ 2 αναλογία π Ν = το μέγεθος του πληθυσμού n = το μέγεθος του δείγματος Βασικές Έννοιες - Συμβολισμοί Επαγωγική Στατιστική: Εκτιμητική Έλεγχος Υποθέσεων x

Επαγωγική Στατιστική Περιλαμβάνει: Εκτιμητική: Ο προσδιορισμός (εκτίμηση) των χαρακτηριστικών παραμέτρων ενός πληθυσμού από τα στατιστικά ενός επιλεγμένου δείγματός. Ελέγχους Υποθέσεων για μία ή περισσότερες παραμέτρους ενός πληθυσμού με βάσητα στατιστικά ενόςδείγματος. Η μεγάλη συνεισφορά της είναι ότι επιτρέπει στον ερευνητή να καθορίσει με σχετική ακρίβεια την πιθανότητα σφάλματος που περιέχεται στα συμπεράσματα τα οποία διατυπώνει μετά τη στατιστική ανάλυση. 7

Αντιπροσωπευτικότητα του Δείγματος Η ακρίβεια της γενίκευσης των αποτελεσμάτων από το δείγμα στον πληθυσμό από τον οποίο προέρχεται, εξαρτάται από την αντιπροσωπευτικότητα του δείγματος. q Για να μπορούν να γενικευτούν τα αποτελέσματα μιας έρευνας από το δείγμαπου μελετήθηκε στο συνολικό πληθυσμό, πρέπει να έχουν ακολουθηθεί οι αρχές της δειγματοληψίας (sampling). q Η δειγματοληψία είναι η διαδικασία με την οποία επιλέγουμε ένα δείγμα από τον πληθυσμό επιδιώκοντας αυτό να είναι κατά το δυνατόν αντιπροσωπευτικότερο (δηλαδή, να διαθέτει κατά προσέγγιση τα χαρακτηριστικά του πληθυσμού στον οποίο ανήκει).επομένως, ο ερευνητής πρέπει να επιλέξει ένα όσο το δυνατόνπιο αντιπροσωπευτικό δείγμα. 8

Αντιπροσωπευτικότητα του Δείγματος Η αντιπροσωπευτικότητα του δείγματος καθορίζεται από δύο στοιχεία κυρίως: α) τη μέθοδο επιλογής των υποκειμένων που θα αποτελέσουν το δείγμα, και β) το μέγεθος του δείγματος. Επομένως, τα βασικά προβλήματα που καλείται να αντιμετωπίσει ένας ερευνητής σχετικά με τη δειγματοληψία είναι: α) να είναι το δείγμα όσο το δυνατόν πιο όμοιο με τον πληθυσμό ώστε να εξασφαλίζεται μια ικανοποιητικότερη προσέγγιση στις εκτιμήσεις για την αληθή τιμή του πληθυσμού β) να επιλέξει το μέγεθος του δείγματος έτσι ώστε να είναι εφικτή η έρευνά του (πχ. από πλευράς κόστους, χρόνου). 9

Τύποι Δειγμάτων q Δείγματα υπολογιζόμενα με πιθανότητες (probability samples) κάθε μέλος του πληθυσμού έχει την ίδια πιθανότητα να επιλεγεί και η ένταξη ή ο αποκλεισμός του από το δείγμα είναι καθαρά θέμα τύχης. Προϋπόθεση: ο πληθυσμός είναι εκ των προτέρων γνωστός. q Δείγματα υπολογιζόμενα χωρίς πιθανότητες (nonprobability samples): κάποια μέλη του πληθυσμού θα αποκλειστούν σκόπιμα από το δείγμα, ενώ κάποια άλλα θα περιληφθούν οπωσδήποτε σε αυτό (δηλαδή δεν έχουν όλα τα υποκείμενα την ίδια πιθανότητα να επιλεγούν). Ο ερευνητής δεν γνωρίζει το ακριβές μέγεθος του πληθυσμού και μεροληπτεί υπέρ συγκεκριμένων υποκειμένων. 10

Μέθοδοι για Δείγματα Μη Πιθανοτήτων (δηλαδή μέθοδοι που δεν στηρίζονται στη Θεωρία Πιθανοτήτων) - δειγματοληψία ευκολίας ή συμπτωματική δειγματοληψία (convenient / accidental sampling) - δειγματοληψία αναλογίας ή ποσοστιαία δειγματοληψία (quota sampling) - δειγματοληψία ακραίων περιπτώσεων (extreme or deviant case sampling) - δειγματοληψία τυπικής περίπτωσης (typical case sampling) - ομοιογενής δειγματοληψία (homogeneous sampling) - δειγματοληψία μέγιστης διακύμανσης (maximum variation sampling) - δειγματοληψία χιονοστιβάδας (snowball sampling) - ευκαιριακή δειγματοληψία (opportunistic or emergent sampling) 11

H δειγματοληψία ευκολίας Πολύ συχνά, ιδιαίτερα στην εκπαιδευτική έρευνα, πολλά μέλη του συνολικού πληθυσμού δεν είναι διαθέσιμα ή δεν είναι πρόθυμα να πάρουν μέρος σε μια έρευνα. Επιπλέον, επειδή η διαδικασία επιλογής ενός τυχαίου δείγματος από ένα μεγάλο πληθυσμό είναι χρονοβόρα και δαπανηρή, οι ερευνητές αναγκάζονται να χρησιμοποιήσουν δείγματα απλώς και μόνο επειδή είναι διαθέσιμα (π.χ., φοιτητές που προσφέρονται εθελοντικά ή "υποχρεώνονται" να συμμετάσχουν σε μια έρευνα). Τα δείγματα αυτά δεν έχουν την ίδια διάρθρωση με αυτή του γενικού πληθυσμού και για το λόγο αυτό θεωρούνται μεροληπτικά. 12

H δειγματοληψία ευκολίας Για παράδειγμα, έχει διαπιστωθεί ότι οι εθελοντές συμμετέχοντες έχουν υψηλότερους δείκτες νοημοσύνης, ανώτερη επαγγελματική θέση, μεγαλύτερη ανάγκη επιδοκιμασίας, είναι λιγότερο αυταρχικοί και καλύτερα προσαρμοσμένοι από τους μη εθελοντές. Εξυπακούεται ότι τα συμπεράσματα ισχύουν μόνο για τους πληθυσμούς εκείνους που έχουν χαρακτηριστικά όμοια με αυτά του δείγματος της έρευνας. Η επιλογή του «βολικού» δείγματος μπορεί να γίνει και κατά στρώματα για να εξασφαλιστεί η εκπροσώπηση υποομάδων του πληθυσμού στο δείγμα (ωστόσο όχι αντιπροσωπευτικά). Στην περίπτωση αυτή ονομάζεται δειγματοληψία αναλογίας. 13

Μέθοδοι για Δείγματα Πιθανοτήτων (δηλαδή μέθοδοι που βασίζονται στη Θεωρία Πιθανοτήτων) - απλή τυχαία δειγματοληψία (simple random sampling) -συστηματική τυχαία δειγματοληψία (systematic random sampling) - συστηματική δειγματοληψία με πιθανότητα ανάλογη του μεγέθους (probability proportional to size sampling) - τυχαία δειγματοληψία κατά στρώματα (ή διαστρωματική) (stratified sampling) - τυχαία δειγματοληψία κατά συστάδες (ή κατά ομάδες) (cluster sampling) - τυχαία δειγματοληψία κατά επίπεδα (ή στάδια / πολυσταδιακή) (multistage sampling) 14

Η απλή τυχαία δειγματοληψία (1) Κάθε μέλος του πληθυσμού (α) έχει την ίδια πιθανότητα να επιλεγεί και (β) κάθε μια επιλογή είναι τελείως ανεξάρτητη από την άλλη. Για παράδειγμα, αν για έναν πληθυσμό 100 ατόμων, κάθε άτομο έχει την ίδια πιθανότητα να επιλεγεί, τότε η πιθανότητα αυτή είναι 1/100. Βήματα εφαρμογής 1. Σαφής ορισμός του πληθυσμού από τον οποίο θα επιλεγεί το δείγμα 2. Απαρίθμηση και καταγραφή όλων των μελών του πληθυσμού μία λίστα. 3. Επιλογή των υποκειμένων του δείγματος μέσω τυχαίας διαδικασίας. Η τυχαία επιλογή μπορεί να γίνει με: ζάρι/α, νόμισμα, κλήρωση, πίνακες τυχαίων αριθμών 15

Η απλή τυχαία δειγματοληψία (2) Πίνακες Τυχαίων Αριθμών - Ο απλούστερος και πλέον αξιόπιστος τρόποςεπιλογής ενόςτυχαίου δείγματος βασίζεται στη χρήση πινάκων τυχαίων αριθμών. - Ένας πίνακας τυχαίων αριθμών περιέχει ψηφία από 0 έως 9 οργανωμένα σε πεντάδες. Ο πίνακας είναι κατασκευασμένος με τέτοιο τρόπο ώστε ξεκινώντας από οποιοδήποτε σημείο του και ακολουθώντας οποιαδήποτε διαδρομή, τα ψηφία που συναντώνται προκύπτουν τυχαία, έχοντας όλα την ίδια πιθανότητα εμφάνισης. 16

Η απλή τυχαία δειγματοληψία (3) Ένας Πίνακας Τυχαίων Αριθμών 17 RAND Corporation, 2001

Η απλή τυχαία δειγματοληψία (4) q Η απλή τυχαία δειγματοληψία καταλήγει σε αντιπροσωπευτικό δείγμα διότι κάθε επιλογή προκύπτει στην τύχη, όπως όταν ρίχνουμε ένα νόμισμα αρκετές φορές και τελικά κάθε ενδεχόμενο (κορώνα ή γράμματα) εμφανίζεται με πιθανότητα 50/50. qη απλή τυχαία δειγματοληψία πρέπει να γίνει με επανατοποθέτηση για να είναι ίδια κάθε φορά η πιθανότητα επιλογής για κάθε μέλος του πληθυσμού. Συνήθως, όμως για πρακτικούς λόγους η δειγματοληψίαγίνεταιχωρίς επανατοποθέτηση. qτο βασικό της μειονέκτημα είναι ότι ο πληθυσμός πρέπει να είναι εκ των προτέρων γνωστός στον ερευνητή. Χρησιμοποιείται σπάνια στην εκπαιδευτική έρευνα. 18

H συστηματική τυχαία δειγματοληψία (1) Σε αρκετές περιπτώσεις ο πληθυσμός είναι τόσο μεγάλος που η απαρίθμηση όλων των μελών του, η καταχώρησή τους σε πίνακες και η επιλογή δείγματος με την απλή τυχαία δειγματοληψία καθίσταται εξαιρετικά επίπονη και πρακτικά αδύνατη. Όταν όμως υπάρχει μια ενημερωμένη λίστα με τα μέλη ενός πληθυσμού και ο πληθυσμός παρουσιάζει ομοιογένεια στη σύστασή του, τότε συχνά χρησιμοποιείται η απλή μέθοδος της συστηματικής δειγματοληψίας. Η μέθοδος αυτή απαιτεί πρώτα να επιλέξουμε τυχαία το πρώτο μέλος του δείγματος και τα επόμενα μέλη να επιλέγονται από τον ίδιο κατάλογο μετά από κάθε σταθερόδιάστημαδιαδοχικώνμονάδων. 19

H συστηματική τυχαία δειγματοληψία (2) Παράδειγμα Ν=100 (ολόκληρος ο πληθυσμός) και θέλουμε δείγμα n=20 Ν / n = 5 (άρα χρειαζόμαστε έναν ανά πέντε) Επιλέγουμε τυχαία έναν αριθμό από το 1 έως το 5 (π.χ. το 4) Ξεκινάμε από τον #4 και επιλέγουμε κάθε 5 ο (9 ο, 14 ο, 19 ο, 24 ο,. μέχρι τον 99 ο ) 20

H συστηματική τυχαία δειγματοληψία (2) Για παράδειγμα, αν ένας ερευνητής θέλει να επιλέξει από ένα αλφαβητικό κατάλογο 100 μαθητών ένα δείγμα 20 μαθητών. Επιλέγει τυχαία ένα αριθμό μεταξύ 1 και 5 (π.χ. το 4) και στη συνέχεια επιλέγει κάθε πέμπτο μαθητή (τον 9ο, τον 14ο κ.ο.κ. ως τον 99ο). Η συστηματική δειγματοληψία είναι μια πολύ απλή και εύχρηστη μέθοδος που επιτρέπει την επιλογή ενός δείγματος ακόμα και όταν τα στοιχεία του πληθυσμού που είναι καταγεγραμμένα σε ένα κατάλογο δενέχουν αριθμηθεί. Ωστόσο, για να μπορεί να χρησιμοποιηθεί η συστηματική δειγματοληψία στη θέση της τυχαίας δειγματοληψίας, το σύνολο των μελών του πληθυσμού πρέπει να είναι κατανεμημένα με εντελώς τυχαίο τρόπο. Αλλιώς, υπάρχει ο κίνδυνος το συστηματικό δείγμα να είναι μεροληπτικό. 21

H τυχαία δειγματοληψία κατά στρώματα (1) Ένας κοινωνιολόγος πρόκειται να πραγματοποιήσει μια έρευνα σε μία μεγάλη πολιτεία τηςαμερικής. Μέρος του ερευνητικού του σχεδίου είναι να καταγράψει τη γνώμη συμμετεχόντων από τέσσερις διαφορετικές εθνικότητες: Ασιάτες, Αφρο- Αμερικάνους, Ισπανόφωνους και Λευκούς. Αν χρησιμοποιήσει την απλή τυχαία δειγματοληψία για να επιλέξει 300 άτομα με τυχαίο τρόπο, το δείγμα μπορεί να περιέχει λίγα μόνο άτομα από κάποια ή κάποιες από τις τέσσερις ομάδες (υπο-εκπροσώπηση). Κατά συνέπεια, δεν μπορεί να προχωρήσει σε συγκρίσεις μεταξύ των ομάδων. Το πρόβλημα αυτό αντιμετωπίζεται με την «κατά-στρώματα τυχαία δειγματοληψία». 22

H τυχαία δειγματοληψία κατά στρώματα (2) Τα μέλη του πληθυσμού χωρίζονται σε δύο ή περισσότερες ομοιογενείς ομάδες, που ονομάζονται στρώματα, έτσι ώστε κάθε υποκείμενο να ανήκει σε μια μόνο ομάδα. Η διαστρωμάτωση του πληθυσμού γίνεται με βάση ορισμένες μεταβλητές που σχετίζονται άμεσα με τη μεταβλητή που αποτελεί το αντικείμενο της έρευνας. Για παράδειγμα, σε πολλές έρευνες στην ψυχολογία η ακριβής αντιπροσώπευση της μεταβλητής του φύλου μέσα στο δείγμα παίζει σημαντικό ρόλο στην αξιολόγηση των αποτελεσμάτων. Σε αυτές τις έρευνες ο πληθυσμός χωρίζεται σε δύο στρώματα - άνδρες και γυναίκες. Στη συνέχεια από το κάθε στρώμα γίνεται τυχαία επιλογή των μελών του δείγματος (πχ με πίνακα τυχαίων αριθμών ή με συστηματική δειγματοληψία). Ο αριθμός των μελών που επιλέγονται από το κάθε στρώμα μπορεί να είναι ανάλογος προς το μέγεθος του συγκεκριμένου στρώματος στον ευρύτερο πληθυσμό στον οποίο ανήκει. 23

H τυχαία δειγματοληψία κατά στρώματα (3) Παράδειγμα Υποθέστεότι σεμια επιχείρησηυπάρχει το ακόλουθοπροσωπικό: άντρες, μόνιμη απασχόληση: 90 άντρες, μερική απασχόληση: 18 γυναίκες, μόνιμη απασχόληση: 9 γυναίκες, μερική απασχόληση: 63 Σύνολο: 180 και καλούμαστε να επιλέξουμε ένα δείγμα 40 ατόμων, που στρωματοποιείταισύμφωνα με τις παραπάνω κατηγορίες. 24

H τυχαία δειγματοληψία κατά στρώματα (4) Το πρώτοβήμα είναι να υπολογιστεί το ποσοστό κάθε στρώματος. Άντρες, μόνιμη απασχόληση (90/180) x 100 = 50% Άντρες, μερικήαπασχόληση (18/180) x100 = 10% Γυναίκες, μόνιμη απασχόληση (9/180) x 100 = 5% Γυναίκες, μερικήαπασχόληση (63/180) x 100 = 35% Αυτό μας λέει ότι από τα 40 άτομα του δείγματός μας, 50% πρέπει να είναι άντρες, μόνιμη απασχόληση (20) 10% πρέπει να είναι άντρες, μερικήαπασχόληση (4) 5% πρέπει να είναι γυναίκες μόνιμη απασχόληση (2) 35% πρέπεινα είναιγυναίκες με μερικήαπασχόληση (14) 25

H τυχαία δειγματοληψία κατά στρώματα (5) Από τα παραπάνω γίνεται φανερό ότι, για να εφαρμοστεί η δειγματοληψία κατά στρώματα, πρέπει να είναι από πριν γνωστή η κατανομή των χαρακτηριστικών του πληθυσμού που σχετίζονται με τη μεταβλητή που αποτελεί το θέμα της έρευνας. Πιθανές πηγές πληροφοριών για τη διάρθρωση του πληθυσμού μπορεί να είναι κάποιες προηγούμενες μελέτες που καλύπτουν παρόμοια θέματα ή τα αποτελέσματα μιας έρευνας πιλότου (pilot study). Αν όμως δεν υπάρχουν οι απαιτούμενες πληροφορίες σχετικά με τη διαστρωμάτωση του πληθυσμού, τότε πρέπει να αποφεύγεται η χρησιμοποίηση της μεθόδου αυτής αφού, σε αυτή την περίπτωση, είναι δυνατό να επιτευχθεί ένας ίσος βαθμός ακριβείας χρησιμοποιώντας την τυχαία δειγματοληψία. 26

H τυχαία δειγματοληψία κατά συστάδες Οι προηγούμενες μέθοδοι δειγματοληψίας βασίζονται στην επιλογή των μελών ενός πληθυσμού ένα-προς-ένα. Ωστόσο, συχνά οι συμμετέχοντες ανήκουν ήδη σε ομάδες-συστάδες και ο ερευνητής μπορεί να επιλέξει με τυχαίο τρόπο ομάδες αντί για υποκείμενα. Παράδειγμα: Ένας ερευνητής θέλει να επιλέξει ένα δείγμα 300 μαθητών της ΣΤ δημοτικού. Αντί να επιλέξει τους μαθητές έναν προς έναν, μπορεί εναλλακτικά να επιλέξει τυχαία 10 τάξεις (με 30 μαθητές σε κάθε τάξη). Αυτή ονομάζεται δειγματοληψία κατά συστάδες. Πλεονεκτήματα: 1. Είναι ένας γρήγορος τρόπος να επιλέξουμε μεγάλο δείγμα 2. Οι μετρήσεις μπορούναν γίνουν κατά ομάδες. Μειονεκτήματα: Κάθε παρατήρηση δεν είναι τελείως ανεξάρτητη από την άλλη (παρόμοια συμπεριφορά μεταξύ παρατηρήσεων της ίδιας συστάδας). 27

Η τυχαία δειγματοληψία κατά επίπεδα ή στάδια (1) Θέλουμε να ερευνήσουμε τις προτιμήσεις των μαθητών του Γυμνασίου για τα προγράμματα της εκπαιδευτικής τηλεόρασης, χρησιμοποιώντας ένα δείγμα 500 μαθητών. - Σε πρώτο επίπεδο από τις 60 σχολικές περιφέρειες επιλέγουμε τυχαία τις 12 (20%). Στις 12 αυτές περιφέρειες λειτουργούν 610 σχολεία. - Σε δεύτερο επίπεδο από τα 610 σχολεία επιλέγουμε τυχαία τα 91 (15%). Στα 91 αυτά σχολεία λειτουργούν 820 τάξεις - Σε τρίτο επίπεδο από τις 820 τάξεις επιλέγουμε τυχαία τις 82 (10%). Στις 82 αυτές τάξεις φοιτούν 2.100 μαθητές - Σε τέταρτο επίπεδο από τους 2.100 μαθητές επιλέγουμε τυχαία τους 500, οι οποίοι θα αποτελέσουν το δείγμα μας. 28

Η τυχαία δειγματοληψία κατά επίπεδα ή στάδια (2) Βήματα O πληθυσμός χωρίζεται σε έναν ορισμένο αριθμό ομάδων πρώτου-ευρύτερου επιπέδου. Κάθε ομάδα πρώτου επιπέδου χωρίζεται σε έναν ορισμένο αριθμό ομάδων δεύτερου-στενότερου επιπέδου. Κάθε τέτοια ομάδα χωρίζεται σε έναν ορισμένο αριθμό ομάδων τρίτου-στενότερου επιπέδου ομάδων κ.ο.κ. Από τις ομάδες του πρώτου επιπέδου επιλέγουμε τυχαία έναν ορισμένο αριθμό ομάδων δεύτερου επιπέδου κ.ο.κ. Τέλος από τις επιλεγείσες ομάδες του τελευταίου επιπέδου επιλέγουμε τυχαία από κάθε μια τον αναλογούντα αριθμό περιπτώσεων. 29

Συστηματική δειγματοληψία με πιθανότητα ανάλογη του μεγέθους Υποθέστε ότι έχουμε έξι σχολεία με μέγεθος (από το μικρότερο στο μεγαλύτερο) 150, 180, 200, 220, 260 και 490 μαθητές, αντίστοιχα (1500 μαθητές συνολικά), και ότι θέλουμε να επιλέξουμε τυχαία τα τρία από αυτά. Ορίζουμε ως διάστημα δειγματοληψίαςτο πηλίκο 1500 / 3 = 500. Στη συνέχεια επιλέγουμε τυχαία έναν αριθμό από το 1 ως το 500 (π.χ. το 137) και προσθέτουμε σε αυτό το διάστημα δειγματοληψίας. Άρα 137, 637 και 1137. Τελικά επιλέγονται τα σχολεία στα οποία ανήκουν οι μαθητές 137, 637 και 1137, δηλαδή το πρώτο, το τέταρτο και το έκτο σχολείο. 30

Μέθοδοι Δειγματοληψίας (συγκεντρωτικά) Είδος Δειγματοληψίας Περιγραφή Πλεονεκτήματα / Μειονεκτήματα Δείγμα Πιθανοτήτων 1. Απλή Τυχαία (Simple) Το δείγμα επιλέγεται με τυχαίο τρόπο από μια λίστα με όλα τα μέλη του πληθυσμού, ο οποίος εξασφαλίζει ότι κάθε υποκείμενο έχει την ίδια πιθανότητα να επιλεγεί και κάθε επιλογή είναι ανεξάρτητη από την άλλη. Η διαδικασία επιλογής είναι δίκαιη και αμερόληπτη. Δύσκολο να εφαρμοστεί διότι δεν είναι συχνά γνωστός ολόκληρος ο πληθυσμός. 2. Συστηματική Τυχαία (Systematic) Το δείγμα συντίθεται με την επιλογή κάθε ν-οστού υποκειμένου μιας λίστας με όλα τα μέλη του πληθυσμού, μετά από την πρώτη τυχαία επιλογή. Απλή και εύχρηστη μέθοδος, αλλά η επιλογή δεν είναι πραγματικά τυχαία και η ανεξαρτησία δεν εξασφαλίζεται. 31

Μέθοδοι Δειγματοληψίας (συγκεντρωτικά) Είδος Δειγματοληψίας Περιγραφή Πλεονεκτήματα / Μειονεκτήματα 3. Τυχαία Κατά Στρώματα (Stratified) Το δείγμα επιλέγεται με τη διαίρεση του πληθυσμού σε στρώματα και την τυχαία επιλογή ενός αριθμού υποκειμένων, ανάλογου του ποσοστού τους στον αντίστοιχο πληθυσμό. Ικανοποιητική προσέγγιση της αληθούς τυχαίας δειγματοληψίας. Εξασφαλίζει ότι η σύνθεση του δείγματος θα είναι αντιπροσωπευτική του πληθυσμού (σε σχέση με διαστρωμάτωσή του), αλλά μερικές ομάδες ενδέχεται να υπο-εκπροσωπούνται στο δείγμα. 4. Τυχαία Κατά Συστάδες (Cluster) Αντί να επιλέγονται υποκείμενα, επιλέγονται συστάδες υποκειμένων (προϋπάρχουσες ομάδες) από μια λίστα όλων των συστάδων του πληθυσμού. 32 Απλή και εύχρηστη μέθοδος για την επιλογή μεγάλου, σχετικά τυχαίου δείγματος, αλλά επιλογή δεν είναι πραγματικά τυχαία και η ανεξαρτησία δεν εξασφαλίζεται.

Μέθοδοι Δειγματοληψίας (συγκεντρωτικά) Είδος Δειγματοληψίας Περιγραφή Πλεονεκτήματα / Μειονεκτήματα 5. Τυχαία Κατά Επίπεδα (Multi-Stage) Δείγμα Μη Πιθανοτήτων 1. Ευκολίας (Convenience) 2. Αναλογίας (Quota) Ο πληθυσμός χωρίζεται σε επίπεδα και το δείγμα επιλέγεται τυχαία από το τελευταίο επίπεδο, αφού επιλεγούν τυχαία οι ομάδες των παραπάνω επιπέδων. Το δείγμα επιλέγεται με τρόπο βολικό στον ερευνητή. Το δείγμα επιλέγεται με τρόπο βολικό στον ερευνητή, αλλά διατηρείται η αναλογία των υποκειμένων στα στρώματα του πληθυσμού. Απλή και εύχρηστη μέθοδος, αλλά δεν δίνει σε όλα τα μέλη του πληθυσμού την ίδια πιθανότητα να περιληφθούν στο δείγμα. Απλή μέθοδος αλλά μεροληπτική. Βελτιώνεται η σύνθεση του δείγματος αλλά είναι μεροληπτική. 33

Το μέγεθος του δείγματος (1) Σε μια δειγματοληπτική ή πειραματική έρευνα το μέγεθος του δείγματος αποτελεί τον κρισιμότερο παράγοντα που επηρεάζει: α) τη σημαντικότητα των αποτελεσμάτων της έρευνας και τη δυνατότητα γενίκευσής τους β) την απορρόφηση και την κατανομή των διαθέσιμων χρονικών και οικονομικών πόρων γ) την αποδοχή της αποτελεσματικότητας και της χρηστικής αξίας της έρευνας σε σχέση με τους δεοντολογικούς και ηθικούς κανόνες, οι οποίοι διέπουν το συγκεκριμένο επιστημονικό πεδίο 34

Το μέγεθος του δείγματος (2) q Η επιλογή ενός πραγματικά τυχαίου δείγματος είναι δύσκολη (κόστος vs ακρίβεια) qανοχή στις δειγματοληπτικές παρεκκλίσεις: διαφέρει ανάλογα με το είδος της έρευνας (το δείγμα «ευκολίας» σε ορισμένες περιπτώσεις είναι αναπόφευκτο, προσοχή στα βαρύγδουπα συμπεράσματα) qο διαρκής έλεγχος της αντιπροσωπευτικότητας του δείγματος είναι αναγκαίος. - μεγάλη η σημασία της πιλοτικής έρευνας (αν είναι εφικτή) - ανάλυση του δημογραφικού προφίλ μικρού αριθμού υποκειμένων από αυτούς που αρνήθηκαν να συμμετάσχουν στην έρευνα 35

Το μέγεθος του δείγματος (2) Μια ακριβής απάντηση στο ερώτημα «Πόσο πρέπει να είναι το μέγεθος του δείγματος» είναι αδύνατη. Διότι: α) Η πιστή τήρηση κανόνων της τυχαίας δειγματοληψίας à αδύνατη. β) Το σφάλμα δειγματοληψίας δε μπορεί να εξαλειφθεί πλήρως αλλά. το μέγεθος του δείγματος μπορεί να εκτιμηθεί με βάση το είδος της ποσοτικής ανάλυσης στην οποία θα υποβληθούν τα δεδομένασύμφωνα με εμπειρικάαλλάκαι στατιστικά κριτήρια. 36

Το μέγεθος του δείγματος με βάση εμπειρικά κριτήρια Οι ακόλουθες εμπειρικές υποδείξεις στοχεύουν να απαντήσουν στο ερώτημα «ποιο είναι το ελάχιστο απαιτούμενο μέγεθος του δείγματος για μια συγκεκριμένη ποσοτική ανάλυση;» Στις έρευνες που συγκρίνονται οι μέσοι όροι ή οι τυπικές αποκλίσεις δύο ή περισσότερων ομάδων, οι 50 συμμετέχοντες για κάθε ομάδα είναι μια καλή βάση. Καλό είναι να μην είναι λιγότεροι από 30. Στις έρευνες που εφαρμόζεται η ανάλυση παραγόντων σε ψυχομετρικές κλίμακες απαιτούνται τουλάχιστον 5 έως 10 συμμετέχοντες ανά πρόταση της κλίμακας. Στις έρευνες που υπολογίζονται δείκτες συσχέτισης ή συνάφειας, οι 100 συμμετέχοντες είναι μια καλή αφετηρία. Καλό είναι να μην είναι λιγότεροι των 50 και ασφαλώς όχι λιγότεροι των 30... 37

Το μέγεθος του δείγματος με βάση στατιστικά κριτήρια Το μέγεθος του δείγματος μπορεί να εκτιμηθεί πριν πραγματοποιηθεί μια έρευνα μέσω μιας μεθοδολογίας που ονομάζεται εκ των προτέρων Ανάλυσης Ισχύος (a priori Power Analysis). Το βασικό ερώτημα που τίθεται εδώ είναι «ποιο είναι το ελάχιστο απαιτούμενο μέγεθος δείγματος έτσι ώστε να μπορώ με μεγάλη πιθανότητα να θεωρήσω ως σημαντική μια προκαθορισμένη διαφορά, επίδραση ή σχέσηπου έχει νόημα να ανιχνευτεί;» Για παράδειγμα, θέλουμε να δούμε τα επίπεδα κατάθλιψης μεταξύ δύο γκρουπ πχ μεταξύ των πρωτοετών φοιτητών και φοιτητριών του ΠΤΔΕ Αλεξ/πολης, χρησιμοποιώντας το εργαλείο BDI. Θέλουμε να αποφασίσουμε πόσα άτομα θα χρειαστούν για το κάθε γκρουπ. Ποιά διαφορά στα σκορ θα ήταν αξιόλογη ψυχολογικά και θαάξιζε νατηνανιχνεύσουμε; 38

Το Παράδοξο του Kaplan (1964) «Από τη μια πλευρά, το δείγμα για να μας είναι χρήσιμο θα πρέπει να είναι πραγματικά αντιπροσωπευτικό του πληθυσμού. Από την άλλη πλευρά, αν γνωρίζουμε ότι ένα δείγμα είναι αντιπροσωπευτικό, σημαίνει ότι γνωρίζουμε και τα χαρακτηριστικά του πληθυσμού, και μπορούμε να κρίνουμε αν αυτά εκφράζονται στο δείγμα. Αλλά σε αυτή την περίπτωση δεν χρειαζόμαστε το δείγμα» 39

Η Κανονική Κατανομή 40

Κατανομές μεταβλητών Κύρτωση (Kurtosis): Ο βαθμός συγκέντρωσης των τιμών γύρω από το κέντρο της κατανομής α) Λεπτόκυρτη κατανομή: Συμμετρική καμπύλη που χαρακτηρίζεται από τη συγκέντρωση των τιμών στο κέντρο της κατανομής β) Μεσόκυρτη κατανομή: Συμμετρική καμπύλη που έχει τη μορφή της κανονικής κατανομής γ) Πλατύκυρτη κατανομή: Συμμετρική καμπύλη που χαρακτηρίζεται από μικρό βαθμό συγκέντρωσης γύρω από το κέντρο της κατανομής

Κατανομές μεταβλητών Συμμετρική κατανομή: η συγκέντρωση των τιμών γύρω από το μέσο της κατανομής είναι συμμετρική Ισοϋψής κατανομή: Κατανομή, η συχνότητα των τιμών της οποίας είναι ίση σε όλο το μήκος της κλίμακας μέτρησης (α) Δικόρυφη κατανομή: Κατανομή με δύο δεσπόζουσες τιμές (β & γ)

Κατανομές μεταβλητών Ασύμμετρη κατανομή (skewed distribution): Μη συμμετρική κατανομή, στην οποία το σημείο συγκέντρωσης των περισσότερων τιμών βρίσκεται δεξιά ή αριστερά στον άξονα των τιμών Ασύμμετρη αριστερά (positively skewed): οι μεγάλες συχνότητες συγκεντρώνονται στο αριστερό άκρο της κατανομής (που αντιστοιχεί στις χαμηλότερες τιμές της κλίμακας μέτρησης) και ταυτόχρονα οι συχνότητες στο δεξιό άκρο είναι λιγότερες (γ) Ασύμμετρη δεξιά κατανομή (negatively skewed): το σημείο συγκέντρωσης των τιμών της κατανομής βρίσκεται δεξιά στον οριζόντιο άξονα (α & β)

Η Κανονική Κατανομή Συμμετρική κωδωνοειδής κατανομή με συγκεκριμένα χαρακτηριστικά ØΟι δύο παράμετροι από τις οποίες εξαρτάται είναι η μέση τιμή μ και η τυπική απόκλιση σ.

Η Κανονική Κατανομή Συμμετρική κωδωνοειδής κατανομή με συγκεκριμένα χαρακτηριστικά ØΗ τιμή της μ προσδιορίζει τη θέση της κατανομής στον άξονα των Χ και η τιμή της σ τη μορφή που έχει η καμπύλη της.

Η Κανονική Κατανομή 46

Κανονική κατανομή του δείκτη νοημοσύνης Ιδιότητες Κανονικής Κατανομής 1. Η επικρατούσα τιμή, η διάμεσος και ο μέσος όρος συμπίπτουν 2. Εκτείνεται συμμετρικά σε κάθε πλευρά του μέσου όρου

Κανονική κατανομή του δείκτη νοημοσύνης 3. Το σχήματης κανονικής κατανομής έχει τις εξής ιδιότητες: α) Το πιο απότομο σημείο της καμπύλης βρίσκεται σε απόσταση μιας τυπικής απόκλισης εκατέρωθεν του μέσου όρου β) Σε απόσταση 3 τυπικών αποκλίσεων από το μέσο όρο η κλίση είναι σχεδόν οριζόντια, πολύ κοντά στο μηδέν 48

Κανονική κατανομή του δείκτη νοημοσύνης 4. Το ποσοστό της περιοχής που περιλαμβάνεται μεταξύ του μέσου όρου και: ±1 τυπική απόκλιση είναι περίπου 0,68 ή 68% ±2 τυπικές αποκλίσεις είναι περίπου 0,95 ή 95% ±3 τυπικές αποκλίσεις είναι περίπου 0,997 ή 99,7% 49

Οι τυπικές τιμές (Z-scores) - Το πηλίκο της απόκλισης μιας τιμής προς την τυπική απόκλιση ονομάζεται μετατροπή σε τυπικές τιμές ή z-τιμές (standardised values or z-scores). z = ( X X ) σ - Οι τυπικές τιμές εκφράζουν την απόσταση (απόκλιση) μιας τιμής από τον μέσο όρο σε τυπικές αποκλίσεις (και όχι στην αρχική μονάδα μέτρησης). Πόσες τυπικές αποκλίσεις πάνω ή κάτω από το μέσο όρο βρίσκεται η αντίστοιχη αρχική τιμή.

Οι τυπικές τιμές (Z-scores) Ø Όταν οι τυπικές τιμές είναι θετικές, αυτό σημαίνει ότι η αρχική τιμή είναι μεγαλύτερη από τον μέσο όρο, ενώ όταν οι z-τιμές έχουν αρνητικό πρόσημο, τότε αυτό σημαίνει ότι η αρχική τιμή είναι μικρότερη απότον μέσο όρο. Ø Αυτό που μας προσφέρουν οι z-τιμές είναι η δυνατότητα σύγκρισης (ως προς την απόστασή τους από το μέσο όρο της κατανομής τους) διάφορων τιμών που δεν προέρχονται από την ίδια κατανομή. Κι αυτό γιατί οι z-τιμές εκφράζονται σε μονάδες τυπικής απόκλισης, και είναι ανεξάρτητες από την αρχική μονάδα μέτρησης. Ποιά τιμή απείχε περισσότερο από τον μέσο όρο της κατανομής της;. Με τις τυπικές τιμές μπορούμε να συγκρίνουμεαπευθείας ή να κάνουμε αλγεβρικές πράξεις. 51

Οι τυπικές τιμές (Z-scores) Χαρακτηριστικά τυπικών τιµών: 1.Η κατανοµή των τυπικών τιµών έχει ίδιο σχήµα µε αυτό της αρχικής κατανοµής (η θέση των τιµών είναι ίδια). 2.Ο µέσος όρος της τυπικής κατανοµής είναι πάντα 0 και η τυπική απόκλισή της είναι πάντα 1. 3.Οι τυπικές τιµές εκφράζονται σε αριθµούς χωρίς µονάδες (ή σε µονάδες τυπικής απόκλισης). 4.Το µέγεθος της τυπικής τιµής µιας αρχικής τιµής µας δίνει άµεσα µία εικόνα για τη θέση της στην κατανοµή (πόσο µακριά είναι από τον µέσο όρο). 52

Η Τυπική Κανονική Κατανομή Περιοχές μεταξύ των διαστημάτων που ορίζονται από τυπικές αποκλίσεις

Η Κανονική Κατανομή είναι πολύ χρήσιμη διότι: 1.Πολλές μεταβλητές στο χώρο των κοινωνικων επιστημών θεωρείται ότι σχηματίζουν κανονική κατανομή στον πληθυσμό. 2. Τα περισσότερα και πιο ισχυρά στατιστικά κριτήρια (τεστ) που χρησιμοποιούμε προϋποθέτουν ότι οι μετρήσεις του πληθυσμού ακολουθούνκανονική κατανομή. 3. Η κανονική κατανομή έχει χαρακτηριστικά με βάση τα οποία μπορούμε να εξάγουμε ορισμένασυμπεράσματα γιαδιαστήματατιμών της μεταβλητής. 4. Αν πάρουμε έναν άπειρο αριθμό δειγμάτων του υπό μελέτη πληθυσμού και σχηματίσουμε μία κατανομή των μέσων όρων τους, αυτή ονομάζεται δειγματοληπτική κατανομή του μέσου όρου (mean sampling distribution). Θεωρείται ότι κάτω από ορισμένες προϋποθέσεις θα έχει περίπου κανονική μορφή. 54

Άσκηση Κατανόησης: Σε μια έρευνα μετρήθηκε ο δείκτης νοημοσύνης 2000 αποφοίτων υποχρεωτικής εκπαίδευσης με μέσο όρο 100 και τυπική απόκλιση 15. Αν η μεταβλητήακολουθείτην κανονική κατανομή: α) Πόσοι απόφοιτοι έχουν IQ από 85 έως 115 (κατά προσέγγιση) Μετατρέπουμε τις αρχικές τιμές σε τυπικές τιμές: z z ( X X ) σ (85 100) 15 1 = = = ( X X ) σ (115 100) 15 2 = = = 1 1 55 Γνωρίζουμε ότι σε μια κανονική κατανομή το 68% των τιμών βρίσκεται ανάμεσα σε -1 και +1 τυπική απόκλιση. Άρα 2000 x 0,68 = 1360 περίπου απόφοιτοι αναμένεται να έχουν IQ από 85 έως 115.

Άσκηση Κατανόησης: Σε μια έρευνα μετρήθηκε ο δείκτης νοημοσύνης 2000 αποφοίτων υποχρεωτικής εκπαίδευσης με μέσο όρο 100 και τυπική απόκλιση 15. Αν η μεταβλητήακολουθείτην κανονική κατανομή: β) Πόσοι απόφοιτοι έχουν IQ κάτω από 70 έως 130 (κατά προσέγγιση) Μετατρέπουμε τις αρχικές τιμές σε τυπικές τιμές: z z ( X X ) σ (70 100) 15 1 = = = ( X X ) σ (130 100) 15 2 = = = 2 2 56 Γνωρίζουμε ότι σε μια κανονική κατανομή το 95% των τιμών βρίσκεται ανάμεσα σε -2 και +2 τυπικές αποκλίσεις. Άρα 2000 x 0,95 = 1900 περίπου απόφοιτοι αναμένεται να έχουν IQ από 70 έως 130.

Άσκηση Κατανόησης: Σε μια έρευνα μετρήθηκε ο δείκτης νοημοσύνης 2000 αποφοίτων υποχρεωτικής εκπαίδευσης με μέσο όρο 100 και τυπική απόκλιση 15. Αν η μεταβλητήακολουθείτην κανονική κατανομή: γ) Ένας από τους συμμετέχοντες διατυμπανίζει ότι έχει IQ πάνω από 145. Ποιά η πιθανότητα να λέει την αλήθεια; Μετατρέπουμε την αρχικήτιμή σε τυπική: z = ( X X σ ) = (145 100) 15 = 3 Γνωρίζουμε ότι σε μια κανονική κατανομή το 99,7% των τιμών βρίσκεται ανάμεσα σε - 3 και +3 τυπικές αποκλίσεις. Άρα μόνο το 0,3 / 2 = 0,15% θα έχει IQ > 145 (πολύ μικρή πιθανότητα). 57

Υπολογισμός της περιοχής μεταξύ δύο τιμών Υπολογίζουμε αρχικά τις τυπικές τιμές και στη συνέχεια βρίσκουμε τις περιοχές από τον πίνακα της τυπικής κανονικής κατανομής.

Ο Πίνακας της Τυπικής Κανονικής Κατανομής 59

Αναζήτηση στον Πίνακα της Τυπικής Κανονικής Κατανομής Π.χ. Έστω ότι θέλω να βρω P(z < 1.25) Από τον Πίνακα βρίσκω ότι P(z < 1.25) = 0.8944 ή 89,44% 60

Η Τυπική Κανονική Κατανομή

Εκτιμητική 62

Στατιστικά: Είναι οι δείκτες που περιγράφουν ένα δείγμα π.χ. δειγματικός μέσος όρος, δειγματική διακύμανση, s 2 aναλογία P Παράμετροι: Είναι οι δείκτες που περιγράφουνέναν πληθυσμό π.χ. πληθυσμιακός μέσος όρος μ, πληθυσμιακή διακύμανση, σ 2 αναλογία π Ν = το μέγεθος του πληθυσμού n = το μέγεθος του δείγματος Βασικές Έννοιες - Συμβολισμοί Επαγωγική Στατιστική: Εκτιμητική Έλεγχος Υποθέσεων x

Επαγωγική Στατιστική Περιλαμβάνει: Εκτιμητική: Ο προσδιορισμός (εκτίμηση) των χαρακτηριστικών παραμέτρων ενός πληθυσμού από τα στατιστικά ενός επιλεγμένου δείγματός. Ελέγχους Υποθέσεων για μία ή περισσότερες παραμέτρους ενός πληθυσμού με βάσητα στατιστικά ενόςδείγματος. Η μεγάλη συνεισφορά της είναι ότι επιτρέπει στον ερευνητή να καθορίσει με σχετική ακρίβεια την πιθανότητα σφάλματος που περιέχεται στα συμπεράσματα τα οποία διατυπώνει μετά τη στατιστική ανάλυση. 64

Στατιστική Συμπερασματολογία - Στην εκπαιδευτική και κοινωνική έρευνα παίρνουμε συνήθως ένα ή περισσότερα δείγματα από κάποιον πληθυσμό στόχο για να εξηγήσουμε φαινόμενα σε επίπεδο πληθυσμού. - Στόχος μας είναι η εκτίμηση παραμέτρων του πληθυσμού και στηρίζεται σε πληροφορίες που εκμαιεύουμε από ένα δείγμα του. Τέτοιες πληροφορίες είναι μεταξύ άλλων ο μέσος όρος μιας ή περισσοτέρων μεταβλητών και οιδιακυμάνσεις τους. - Δυστυχώς ο υπολογισμός των παραμέτρων του πληθυσμού από τους στατιστικούς δείκτες κάποιου δείγματος δεν είναι απόλυτα ακριβής (εμπεριέχει αναπόφευκτα ένα βαθμό σφάλματος). - Η συνεισφορά της Επαγωγικής Στατιστικής είναι η δυνατότητα που παρέχει στον ερευνητή να καθορίσει με σχετική ακρίβεια την πιθανότητα σφάλματος η οποία περιέχεται στα συμπεράσματα που διατυπώνει μετά τη στατιστική ανάλυση. 65

Στατιστική Συμπερασματολογία Ας υποθέσουμε ότι θέλουμε να μελετήσουμε την αναγνωστική ικανότητα του συνόλου των μαθητών της Ε Δημοτικού. Για το σκοπό αυτό, επιλέγουμε ένα τεστ αναγνωστικής ικανότητας και το χορηγούμε στην ομάδα μαθητών την οποία μας ενδιαφέρει να μελετήσουμε. Ας υποθέσουμε ότι ο (άγνωστος σε εμάς) μέσος όρος του πληθυσμού είναιμ=65 και η (άγνωστη) τυπική απόκλισησ=5,6. Αν επιλέξουμε μέσω τυχαίας δειγματοληψίας διάφορα δείγματα μαθητών από τον πληθυσμό, κανένα από αυτά δεν θα έχει τα χαρακτηριστικά του (σφάλμα δειγματοληψίας à πρόβλημα στη γενίκευση των συμπερασμάτων μιας έρευνας). 66

Το Κεντρικό Οριακό Θεώρημα Abraham de Moivre (1733), Pierre-Simon Laplave (1812), Lyapunov (1901) Κυρίαρχο ρόλο στην αντιμετώπιση του σφάλματος δειγματοληψίας παίζει το Κεντρικό Οριακό Θεώρημα (Central Limit Theorem): Αν επιλέξουμε με τυχαία δειγματοληψία πολλά, μεγάλα και ίσα μεταξύ τους δείγματα από ένα πληθυσμό, η κατανομή των μέσων όρων τους θα είναι μία Κανονική Κατανομή. Συνεπώς, ο μέσος όρος των δειγματικών μέσων όρων θα είναι ίδιος με το μέσο όρο του πληθυσμού. Αυτή η κατανομή των δειγματικών μέσων όρων ονομάζεται δειγματοληπτική κατανομή.

Η Δειγματοληπτική Κατανομή X1 X 2 X3 X 4 X5

Η Δειγματοληπτική Κατανομή Η κατανομή των μέσων όρων όλων των πιθανών (άπειρων) δειγμάτωνενός πληθυσμού. Έχει τη μορφή Kανονικής Kατανομής, συνεπώς, ο μέσος όρος της θα πρέπει να είναι ίδιος με τον μέσο όρο του πληθυσμού, και η τυπική απόκλισή της αντιστοιχεί στο σφάλμα δειγματοληψίας (τυπικό σφάλμα) Στην πραγματικότητα, είναι αδύνατον να κατασκευάσουμε τη δειγματοληπτική κατανομή, καθώς υπάρχει θεωρητικά άπειρος αριθμός δειγμάτων που μπορούν να εξαγχθούν από ένα πληθυσμό (υπάρχουν όμωςτύποι εκτίμησήςτης). Μέσω της δειγματοληπτικής κατανομής, χρησιμοποιώντας τους στατιστικούς δείκτες του δείγματος μπορούμε να κάνουμε εκτιμήσεις για τις αντίστοιχες παραμέτρους του πληθυσμού (πχ. μέσο όρο) 69

Η Δειγματοληπτική Κατανομή Επειδή η δειγματοληπτική κατανομή ακολουθεί την κανονική κατανομή, γνωρίζουμε ότι το 68,26% των τιμών βρίσκεται μέσα στο διάστημα που ορίζεται από ±1 τυπική απόκλιση από τον πληθυσμιακό μέσο όρο (z= ± 1). Άρα η πιθανότητα ο μέσος όρος του δείγματος να βρίσκεται στο διάστημα που ορίζεται από μία τυπική απόκλιση πάνω και μία τυπική απόκλιση κάτω από τονπληθυσμιακό μέσο όρο είναι 68,26%. Κατά τον ίδιο τρόπο, η πιθανότητα ο μέσος όρος του δείγματος να βρίσκεται στο διάστημα που ορίζεται περίπου από ±2 τυπικές αποκλίσεις (για την ακρίβεια ± 1,96) είναι 95% (z= ±1,96) και στο διάστημα που ορίζεται από ±3 τυπικές αποκλίσεις, το 99,7% (z = ±3). Έτσι, αν υπολογίσουμε την τυπική απόκλιση της δειγματοληπτικής κατανομής των μέσων όρων, είμαστε σε θέση να υπολογίσουμε με σχετική βεβαιότητα πόσο μακριά από το μέσο όρο του πληθυσμού βρίσκεται ο μέσος όρος του δείγματόςμας. 70

Υπολογισμός Σφάλματος Δειγματοληψίας Η τυπική απόκλιση μιας τέτοιας κατανομής ονομάζεται τυπικό σφάλμα (standard error) της κατανομής, συμβολίζεται με σ X και αντανακλά τη μεταβλητότητα που μπορεί να έχουν οι τιμές του μέσου όρου, όταν επαναλάβουμε την έρευνα με διαφορετικάδείγματα. Το τυπικό σφάλμα μπορεί να βρεθεί διαιρώντας την πληθυσμιακή τυπική απόκλιση με την τετραγωνική ρίζα του μεγέθους του δείγματος. Είναι μια εκτίμηση της τυπικής απόκλισης του δειγματικού από τον πληθυσμιακό μέσο. ΑΛΛΑ: Ο πληθυσμιακός μέσος όρο (και η πληθ. διακύμανση) στο χώρο των Κοινωνικών Επιστημών είναι συνήθως ΑΓΝΩΣΤΟΙ. 71

Διάστημα Εμπιστοσύνης του Πληθυσμιακού Μέσου (1) Υποθέστε ότι οι παρακάτω τιμές μιας τυχαίας μεταβλητής Υ έχουν επιλεγεί τυχαία από έναν πληθυσμό: Y = 50, 45, 59, 48, 50, 58, 49, 48, 54, 44. Αν υποθέσουμε ότι δεν υπάρχει συστηματικό σφάλμα κατά τη δειγματοληψία, ο μέσος όρος του δείγματος είναι μια αμερόληπτη εκτιμήτρια του πληθυσμιακού μέσου όρου από τον οποίο προέρχεται το δείγμα. Ωστόσο αυτή η σημειακή εκτίμηση του πληθυσμιακού μέσου όρου είναι σχεδόν απίθανο να είναι ακριβής (πρόκειται για εκτίμηση). Μπορεί ο πληθ. μέσος να είναι λίγο μεγαλύτερος ή λίγο μικρότερος αλλά πόσο; Μπορεί να είναι 51; 55; 62; 49; 42; 35; Η ερώτηση μπορεί να απαντηθεί αν υπολογίσουμε ένα διάστημα το οποίο, με μεγάλη βεβαιότητα, θα περιέχει τον πληθυσμιακό μέσο όρο. Δεν μπορούμε φυσικά να είμαστε απόλυτα βέβαιοι. 72

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (2) -Η επιθυμητή πιθανότητα ονομάζεται επίπεδο εμπιστοσύνης και προκαθορίζεται από τον ερευνητή (κατά παράδοση 95%). Με βάση τη δειγματοληπτική κατανομή, η πιθανότητα ο πληθυσμιακός μέσος να αποκλίνει σε μονάδες τυπικού σφάλματος από το μέσο όρο του δείγματος: 68,26% +/- 1 τυπικό σφάλμα 95% +/- 1,96 τυπικά σφάλματα 99% +/- 2,58 τυπικά σφάλματα 99,73% +/- 3 τυπικά σφάλματα -Το αντίστοιχο διάστημα που προκύπτει το ονομάζουμε διάστημα εμπιστοσύνης (ConfindenceInterval - CI). 73

Ένα παράδειγμα Πως όμως θα υπολογίσουμε το τυπικό σφάλμα με άγνωστη πληθ. διακύμανση; Με την προϋπόθεση ότι ο πληθυσμός είναι Kανονικός μπορούμε να χρησιμοποιήσουμε στη θέση της τη δειγματική διακύμαση (άρα και τυπ. απόκλιση, s: 74

Ένα άλλο παράδειγμα Να υπολογιστεί το 99% διάστημα εμπιστοσύνης του μέσου όρου του πληθυσμού, από ένα δείγμα n = 100 με μέσο όρο Χ = 15 και τυπική απόκλιση s = 3. 75

Ένα τρίτο παράδειγμα Χ 76

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (3) 1. Τι θα συμβεί στο διάστημα εμπιστοσύνης αν αυξηθεί το μέγεθος του δείγματος; 2. Τι θα συμβεί στο διάστημα εμπιστοσύνης αν αυξηθεί το επίπεδο εμπιστοσύνης (π.χ. από 95% σε 99%); 77

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (4) Τι πληροφορίες μας δίνει π.χ. ένα 95% διάστημα εμπιστοσύνης: Με 95% πιθανότητα το διάστημα εμπιστοσύνης που υπολογίσαμε θα περιέχει τον πληθυσμιακό μέσο όρο. Αν πάρουμε 100 τυχαία δείγματα από τον ίδιο πληθυσμό, τις 95 φορές θα βρούμε τον πληθυσμιακό μέσο κάπου μέσα στο διάστημα που βρήκαμε. Αν πάρουμε πάρα πολλά τυχαία δείγματα από τον ίδιο πληθυσμό και υπολογίσουμε τα 95% διαστήματα εμπιστοσύνης, τότε το 95% αυτών των διάστημάτων θα περιλαμβάνουν τον πληθ. μέσο, ενώ το 5% όχι. Κάτι πιο πρακτικό: Το διάστημα εμπιστοσύνης είναι ένα εύρος από πιθανές τιμές που μπορεί να έχει ο πληθυσμιακός μέσος όρος, μ. 78 Τιμές εκτός αυτού του διαστήματος είναι σχετκά απίθανες. Cumming and Finch (2005)

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (5) ΠΡΟΣΟΧΗ σε δύο συχνές παρανοήσεις (ακόμη και σε βιβλία Στατιστικής): Παρανόηση 1: Το 95% των δειγματικώνμέσων όρων θα βρίσκεταιμέσα στο διάστημα εμπιστοσύνης. Αυτό είναι λάθος διότι στη συγκεκριμένη περίπτωση το διάστημα εμπιστοσύνης αναφέρεται στον πληθυσμιακό μέσο, όχι στον δειγματικό. 79

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (6) ΠΡΟΣΟΧΗ σε δύο συχνές παρανοήσεις (ακόμη και σε βιβλία Στατιστικής): Παρανόηση 2: Υπάρχει 95% πιθανότητα ο πληθυσμιακός μέσος όρος να βρίσκεται στο διάστημα εμπιστοσύνης. Αντικρουόμενα ευρύματα: Ο μέσος όρος δεν μπορεί να βρίσκεται με 95% πιθανότητα μεταξύ 46,9 και 54,1, αλλά και με 95% πιθανότητα μεταξύ 43,7 και 53,5! Το σωστό και όχι διφορούμενο είναι να ισχυριστούμε ότι με 95% πιθανότητα το πρώτο διάστημα θα περιλαμβάνει τον μέσο όρο και με 95% πιθανότητα το δεύτερο διάστημα περιλαμβάνει τον μέσο όρο. 80

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (7) Διαστήματα εμπιστοσύνης για 11 τυχαία δείγματα από έναν πληθυσμό με μέσο όρο 50.

Διάγραμμα μέσων όρων με 95%CI για την επίδοση στα Μαθηματικά (μέσω του Chart Builder του SPSS) n = 4627 n = 100 82

Διάγραμμα σφαλμάτων (Error Bar) με 95%CI (n = 100) Graphs à Legacy Dialogs à Error Bar

Διάστημα Εμπιστοσύνης Πληθυσμιακού Μέσου (8) Αν το δείγμα είναι πολύ μικρό (n < 30) και η πληθ. διακύμανση άγνωστη τότε η δειγματοληπτική κατανομή αλλάζει: όπου t είναι η κατανομή t του Student. Η κατανομή αυτή εξαρτάται επιπλέον από τους βαθμούς ελευθερίας (degrees of freedom - df), όπου df = n 1. 84

Διάστημα Εμπιστοσύνης για την Αναλογία P του πληθυσμού (1) Στην περίπτωση της αναλογίας η δειγματοληπτική κατανομή είναι επίσης Κανονική με μέσο όρο π και διακύμανση π(1-π)/n (για n > 30). Η δειγματική αναλογία είναι P. Στην περίπτωση που ο μέσος όρος και η διακύμανση του πληθυσμού είναι άγνωστοι, το τυπικό σφάλμα δίνεται από τον τύπο: Και η εκτίμηση του διαστήματος εμπιστοσύνης της πληθυσμιακής αναλογίας θα δίνεται από: 85

Διάστημα Εμπιστοσύνης για την Αναλογία P του πληθυσμού (2) Έρευνα σε τυχαίο δείγμα 50 φοιτητών Παιδαγωγικών Τμημάτων έδειξε ότι οι 17 από αυτούς έχουν ψηφίσει ΣΥΡΙΖΑ στις τελευταίες εκλογές. Η αναλογία των φοιτητών που έχουν ψηφίζει ΣΥΡΙΖΑ στον πληθυσμό είναι άγνωστη. Ζητείται με βάση το δείγμα να εκτιμηθεί το διάστημα μέσα στο οποίο θα βρίσκεται η αναλογία αυτή με πιθανότητα 95%. Έχουμε: Άρα με πιθανότητα 95% η πληθυσμιακή αναλογία θα βρίσκεται μεταξύ 22% και 48%. Άσκηση: Ποιο θα ήταν το διάστημα εμπιστοσύνης αν διπλασιάζαμε το μέγεθος του δείγματος; 86

87

88