5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

Σχετικά έγγραφα
3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

2. ΑΠΛΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Simple Random Sampling)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική Συμπερασματολογία

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Δειγματοληψία στην Ερευνα. Ετος

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

Δείγμα & Δειγματοληψία στην Έρευνα ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (#252) Θυμηθείτε. Γιατί δειγματοληψία; Δειγματοληψία

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ. Ματσάγκος Ιωάννης-Μαθηματικός

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

X = = 81 9 = 9

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ

Εισαγωγή στην κοινωνική έρευνα. Earl Babbie. Κεφάλαιο 6. Δειγματοληψία 6-1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Δειγματοληπτική μονάδα Μονάδα έρευνας είναι το ιδιωτικό νοικοκυριό και όλα τα μέλη του.

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων ΙΙ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 3 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Δειγµατοληψια. Καθηγητής Α. Καρασαββόγλου Επίκουρος Καθηγητής Π. Δελιάς

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Εισαγωγικές Έννοιες ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών Πόρων

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Τρόποι και μέθοδοι δειγματοληψίας

Εκτίμηση Διαστήματος. Χ. Εμμανουηλίδης, 1. Στατιστική ΙI. Εκτίμηση Διαστήματος Εμπιστοσύνης για τον Μέσο

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Στατιστική ΙΙ Ενότητα 2: ειγµατοληψία

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Επιλογή Δείγματος. Απόστολος Βανταράκης Αναπλ. Καθηγητής Ιατρικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

5. Έλεγχοι Υποθέσεων

7. ΣΥΓΚΡΙΣΗ ΚΑΙ ΣΥΝ ΙΑΣΜΟΣ ΤΩΝ

Στατιστική Συμπερασματολογία

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Στατιστική Συμπερασματολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

Στατιστική. Εκτιμητική

Είδη Μεταβλητών. κλίµακα µέτρησης

Γ. Πειραματισμός - Βιομετρία

Δειγματικές Κατανομές

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

Ερευνητική υπόθεση. Η ερευνητική υπόθεση αναφέρεται σε μια συγκεκριμένη πρόβλεψη σχετικά με τη σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές.

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Κεφάλαιο 5 Συστηματική Δειγματοληψία (ΣυΔ)

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Μέθοδοι Γεωργοοικονομικής & Κοινωνιολογικής Έρευνας

Διαστήματα Εμπιστοσύνης

Στατιστική Επιχειρήσεων Ι

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Δασική Δειγματοληψία

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Στατιστική Επιχειρήσεων ΙΙ

3. Κατανομές πιθανότητας

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Έρευνα Μάρκετινγκ Ενότητα 4

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Γ. Πειραματισμός Βιομετρία

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΠΙΘΑΝΟΤΗΤΕΣ Δειγματικός Χώρος. Ενδεχόμενα {,,..., }.

Μέθοδος μέγιστης πιθανοφάνειας

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

3.ΑΠΛΗ ΤΥΧΑΙΑ ΕΙΓΜΑΤΟΛΗΨΙΑ (SIMPLE RANDOM SAMPLING)

Εκτιμήτριες. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Ασκήσεις για ΑΕΙ και ΤΕΙ. Kglykos.gr. σε Εκτιμήτριες. μέθοδος ροπών και μέγιστης πιθανοφάνειας

Σκοπός του μαθήματος

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Σεμινάριο ΕΚΠ65 ιπλωματικές Εργασίες Αθήνα, 11 Οκτωβρίου 2009

Στατιστική Επιχειρήσεων ΙΙ

Ανάλυση και Σχεδιασμός Μεταφορών Ι Δειγματοληψία - Μέθοδοι συλλογής στοιχείων

7.2 ΜΕΘΟΔΟΙ ΜΟΝΟΤΟΝΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (Monotone Regression)

Transcript:

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling) Συχνά, είναι ταχύτερη και ευκολότερη η επιλογή των μονάδων του πληθυσμού, αν αυτή γίνεται από κάποιο κατάλογο ξεκινώντας από κάποιο τυχαίο αρχικό σημείο και επιλέγοντας μια μονάδα κάθε k (k>0) μονάδες μέχρι να κατασκευασθεί το δείγμα με το δοθέν μέγεθος. Για παράδειγμα, αν πρόκειται να επιλεγούν 1000 καρτέλες από έναν φοριαμό που περιέχει 10000 καρτέλες, είναι ταχύτερο να επιλεγεί ένας τυχαίος αριθμός μεταξύ 1 και 10 και να περιληφθεί στο δείγμα η καρτέλα που αντιστοιχεί σ αυτόν τον αριθμό καθώς και κάθε δέκατη καρτέλα από εκεί και πέρα, από το να επιλεγούν 1000 τυχαίοι αριθμοί και να περιληφθούν οι καρτέλες που αντιστοιχούν σε αυτούς. Η δειγματοληπτική αυτή τεχνική, η οποία εισάγει ένα συστηματικό στοιχείο στην διαδικασία επιλογής των μονάδων του πληθυσμού, είναι μια μορφή δειγματοληπτικής τεχνικής που είναι γνωστή ως συστηματική δειγματοληψία (systematic sampling). 5.1 Περιγραφή της Διαδικασίας Λήψης ενός Συστηματικού Δείγματος Έστω ότι οι μονάδες ενός πληθυσμού μεγέθους Ν είναι αριθμημένες από το 1 μέχρι το Ν. Έστω k ένας θετικός ακέραιος. Για την επιλογή ενός 1-ανά-k συστηματικού δείγματος μεγέθους n, διαλέγουμε τυχαία μια μονάδα από τις k πρώτες μονάδες και περιλαμβάνουμε στο δείγμα αυτήν και κάθε μονάδα του πληθυσμού που απέχει από αυτήν κατά κάποιο πολλαπλάσιο του k. Η επιλογή της πρώτης μονάδας καθορίζει ολόκληρο το δείγμα. Για παράδειγμα, αν ο πληθυσμός 102

αποτελείται από τις τιμές y 1, y 2,, y N και από τις πρώτες k μονάδες του επιλεγεί η k 0, τότε το δείγμα θα αποτελείται από τις μονάδες y, y, y,..., y k0 k0+ k k0+ 2k k 0+ (n 1)k. Ορισμός: Ένα δείγμα μεγέθους n ονομάζεται 1-ανά-k συστηματικό δείγμα, αν περιλαμβάνει κάθε k μονάδα του πληθυσμού με αρχικό σημείο επιλεγόμενο τυχαία από τις πρώτες k μονάδες του πληθυσμού. Αν οι μονάδες του πληθυσμού εμφανίζονται με τυχαία σειρά στην λίστα από την οποία επιλέγουμε το δείγμα, τότε αυτό ονομάζεται ψευδοτυχαίο δείγμα (pseudorandom sample). Παραλλαγές της συστηματικής δειγματοληψίας μπορούν να ορισθούν με βάση διαφορετικές διαδικασίες επιλογής του αρχικού σημείου. Για παράδειγμα, είναι δυνατόν το αρχικό σημείο να είναι η μονάδα του πληθυσμού με δείκτη (k + 1) / 2, αν ο k είναι περιττός k / 2 ή (k + 2) / 2, διαφορετικά. Δηλαδή, αντί να ξεκινήσουμε από μια τυχαία μονάδα, ξεκινούμε από το κεντρικό σημείο (ή από ένα σημείο κοντά στο κέντρο) του στρώματος των πρώτων k μονάδων του πληθυσμού. Επειδή το μέγεθος Ν του πληθυσμού δεν είναι εν γένει πολλαπλάσιο του k, διαφορετικά συστηματικά δείγματα από τον ίδιο πληθυσμό ενδέχεται να έχουν διαφορετικό μέγεθος. Αν, για παράδειγμα, Ν=17, k=5 τα δυνατά 1-ανά-5 συστηματικά δείγματα είναι τα εξής πέντε: 1 2 3 4 5 y 1 y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y 10 y 11 y 12 y 13 y 14 y 15 y 16 y 17 Για την αποφυγή αυτού του προβλήματος και την επίτευξη σταθερού δειγματικού μεγέθους, χρησιμοποιείται η εξής μέθοδος: 103

Τα Ν στοιχεία του πληθυσμού θεωρούνται τοποθετημένα στην περιφέρεια ενός κύκλου. Έστω k ο πλησιέστερος προς τον λόγο N/n ακέραιος. Ένα στοιχείο από τα Ν επιλέγεται τυχαία ως αρχικό σημείο και περιλαμβάνεται στο δείγμα μαζί με όλα τα στοιχεία πάνω στην περιφέρεια του κύκλου, που απέχουν από το αρχικό κατά πολλαπλάσια του k, καθώς αυτή διατρέχεται κατά την φορά των δεικτών του ρολογιού. Αυτό συνεχίζεται μέχρι να επιτευχθεί το επιθυμητό δειγματικό μέγεθος. Ουσιαστικά, η διαδικασία αυτή ισοδυναμεί με την διαδικασία που επιλέγει στο δείγμα την μονάδα y i N, αν i>n. Επιπλέον, είναι εύκολο να διαπιστωθεί ότι η μέθοδος αυτή εξασφαλίζει την ίδια πιθανότητα επιλογής σε κάθε μονάδα του πληθυσμού και συνεπώς οδηγεί σε αμερόληπτες εκτιμήσεις της μέσης τιμής του πληθυσμού. Επομένως, αν Ν=10 και n=4, ακολουθώντας την τεχνική αυτή τα δυνατά 1-ανά-3 συστηματικά δείγματα μεγέθους 4 (k=n/n=10/4=2.5 3) είναι τα εξής: 1 2 3 4 5 6 7 8 9 10 y 1 y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y 10 y 4 y 5 y 6 y 7 y 8 y 9 y 10 y 1 y 2 y 3 y 7 y 8 y 9 y 10 y 1 y 2 y 3 y 4 y 5 y 6 y 10 y 1 y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 Όπως αναφέρθηκε προηγουμένως, ένα από τα προφανή πλεονεκτήματα της μεθόδου αυτής είναι η ταχύτητα. Επιπλέον, διαισθητικά φαίνεται να είναι ακριβέστερη από την απλή τυχαία δειγματοληψία. Στην πραγματικότητα, στρωματοποιεί τον πληθυσμό σε n στρώματα που αποτελούνται από τις πρώτες k μονάδες, τις δεύτερες k μονάδες κ.ο.κ. Αναμένεται, επομένως, ότι ένα συστηματικό τυχαίο δείγμα θα έχει την ίδια περίπου ακρίβεια με ένα στρωματοποιημένο τυχαίο δείγμα με n i =1, i=1,2,,n. Η διαφορά βρίσκεται στο ότι, στο συστηματικό δείγμα, οι μονάδες έχουν την ίδια σχετική θέση στο 104

στρώμα, ενώ, στο στρωματοποιημένο τυχαίο δείγμα, η θέση των μονάδων στο στρώμα καθορίζεται τυχαία. Είναι, λοιπόν, το συστηματικό δείγμα πιο ομοιόμορφα κατανεμημένο στον πληθυσμό και αυτό συμβάλλει στο να παρέχει πολύ συχνά ακριβέστερες εκτιμήσεις από ένα στρωματοποιημένο τυχαίο δείγμα. Υπάρχουν όμως και κίνδυνοι στην χρησιμοποίηση συστηματικής δειγματοληψίας. Οι πιο σημαντικοί αναφέρονται στην περίπτωση περιοδικότητας στις τιμές των μονάδων του πληθυσμού, όσον αφορά την σειρά εμφάνισής τους στην λίστα, αν το k είναι ίσο με την περίοδο ή ένα πολλαπλάσιό της. Για παράδειγμα, μια συστηματική επιλογή μονάδων από μια περιοδική λίστα οικοδομικών τετραγώνων μιας πόλης μπορεί να οδηγήσει σ ένα δείγμα που περιέχει τετράγωνα που ανήκουν σε μια γραμμή και επομένως σε αύξηση του σφάλματος των εκτιμητριών. Στην πράξη, είναι ασφαλής η χρησιμοποίηση της συστηματικής δειγματοληψίας, αν δεν υπάρχουν ενδείξεις περιοδικότητας. Βέβαια, αυτό δεν είναι εύκολο να ελεγχθεί. Ο κίνδυνος, όμως, εσφαλμένης χρησιμοποίησης της μεθόδου μπορεί να ελαττωθεί, αν το δείγμα είναι αποτέλεσμα ενός αριθμού συστηματικών επιλογών από διαφορετικά στρώματα. 5.2 Η Διασπορά της Εκτιμήτριας του Μέσου Είναι προφανές ότι, αν N=nk, τα k δυνατά 1-ανά-k συστηματικά δείγματα είναι οι στήλες του πίνακα 5.2.1. Από τον πίνακα αυτό, έυκολα μπορεί να δει κανείς ότι με την συστηματική δειγματοληψία, ο πληθυσμός χωρίζεται σε k σύνθετες μονάδες, και η διαδικασία επιλογής ενός συστηματικού δείγματος ισοδυναμεί με την διαδικασία τυχαίας επιλογής μιας σύνθετης μονάδας. Επομένως, ένα 1-ανά-k συστηματικό τυχαίο δείγμα n μονάδων από ένα πληθυσμό μεγέθους N=nk, είναι ένα απλό τυχαίο δείγμα μιας σύνθετης μονάδας από τον πληθυσμό με (σύνθετες) μονάδες τις k στήλες του πίνακα 5.2.1. 105

Πίνακας 5.2.1 Σύνθεση των k δυνατών συστηματικών δειγμάτων μεγέθους n από ένα πληθυσμό μεγέθους N=nk Δείγμα 1 2... i... k Y 1 y 2... y i... y k Y k+1 y k+2... y k+i... y 2k.............................. Y (n-1)k+1 Y (n-1)k+2... y (n-1)k+i... y nk Η διαίρεση του αρχικού πληθυσμού των Ν=nk μονάδων σε k ομάδες έχει ως αποτέλεσμα την δυνατότητα έκφρασης της διασποράς σ 2 του πληθυσμού μέσω της διασποράς μεταξύ των k ομάδων και της διασποράς μέσα στις ομάδες. Αυτό γίνεται ευκολότερα αντιληπτό, αν το j στοιχείο του i συστηματικού δείγματος συμβολισθεί με y ij. (Συγκεκριμένα, y ij =y (j-1)k+i ). Τότε, αν μ είναι η μέση τιμή του πληθυσμού (i) και X n ο μέσος του i δείγματος, ισχύει ότι 2 k n ij 2 i= 1j= 1 k k n (i) 2 (i) 2 = n (X n μ ) + (yij X n ) i= 1 i= 1j= 1 (N 1) σ = (y μ ) = (προσθαφαιρώντας το (i) X n ) =. (5.2.1) Αλλά, επειδή, κάθε ένα από τα k συστηματικά δείγματα συνεισφέρει n 1 βαθμούς ελευθερίας, ο δεύτερος προσθετέος είναι ίσος με k(n 1)σ 2 w, όπου 106

k n 2 1 (i) 2 w (yij X n ) i 1j 1 σ = (5.2.2) k(n 1) = = είναι η διασπορά μεταξύ μονάδων του πληθυσμού που ανήκουν στο ίδιο * συστηματικό δείγμα. Επίσης, αν X n συμβολίζει τον μέσο ενός συστηματικού δείγματος, το άθροισμα στον πρώτο προσθετέο της (5.2.1) 2 είναι ίσο με kσ, αφού X * n k k σ 2 (i) (i) 2 (i) 2 * = 1 1 [Xn E(X n )] (X n ) X n k = k μ i= 1 i= 1. (5.2.3) Είναι, δηλαδή, ο πρώτος προσθετέος ανάλογος της διασποράς μεταξύ των συστηματικών δειγμάτων. Τότε, μπορεί να αποδειχθεί το εξής θεώρημα. * Θεώρημα 5.2.1: Η διασπορά του μέσου X n ενός 1-ανά-k συστηματικού δείγματος μεγέθους n από ένα πληθυσμό N=nk μονάδων δίνεται από τον τύπο 2 2 2 σ * = [(N 1) σ k(n 1) σ W] N. (5.2.4) X n Απόδειξη: Προφανώς η (5.2.1) ισοδυναμεί με την σχέση 2 2 2 * W X n (N 1) σ = nkσ + k(n 1) σ, η οποία οδηγεί στην (5.2.4). 107

Πόρισμα: O μέσος ακριβέστερος από τον μέσο μεγέθους τότε και μόνο τότε αν σ 2 2 W >σ. Απόδειξη: Ισχύει ότι ότι * X n ενός συστηματικού δείγματος είναι X n ενός απλού τυχαίου δείγματος του ίδιου 2 σ n V(X n ) = 1. Τότε, από την (5.2.4), ισχύει n N * V(X n ) < V(X n ) 2 N 1 2 k(n 1) 2 N n σ σ σ W < N N N n 2 N n 2 2 k(n 1) σ W > N 1 σ k(n 1) σ, ο.ε.δ. N Δηλαδή, η συστηματική δειγματοληψία οδηγεί σε μικρότερο τυπικό σφάλμα, αν η διασπορά μέσα στο δείγμα είναι μεγαλύτερη από την διασπορά ολόκληρου του πληθυσμού. Επομένως, μεγαλύτερη ακρίβεια επιτυγχάνεται, αν οι μονάδες του δείγματος έχουν μεγαλύτερη ετερογένεια σε σχέση με αυτήν που έχουν οι μονάδες όλου του πληθυσμού. Παρατήρηση: Είναι προφανές ότι στην περίπτωση εκτίμησης του ποσοστού p των μονάδων του πληθυσμού που ανήκουν σε μια κατηγορία Α, εφαρμόζεται η παραπάνω θεωρία, αν η παράμετρος μ αντικατασταθεί από την παράμετρο p και ο μέσος X (i) n αντικατασταθεί από την στατιστική συνάρτηση pˆ (i), όπου pˆ (i) είναι το ποσοστό των μονάδων του i συστηματικού δείγματος που ανήκουν στην κατηγορία Α. Είναι προφανές ότι ο πληθυσμός θα αποτελείται από μονάδες της μορφής 108

y ij 1, αν η j μοναδα του i δειγματος ανηκει στην Α = 0, διαφορετικα. Παράδειγμα: Ένας πληθυσμός 360 νοικοκυριών μιας συνοικίας με μικτό πληθυσμό (αριθμημένων από το 1 έως το 360) έχει καταγραφεί σε έναν κατάλογο κατά αλφαβητική σειρά ως προς το επίθετο του αρχηγού του νοικοκυριού. Τα νοικοκυριά των οποίων ο αρχηγός είναι μη λευκός, εμφανίζονται με τους εξής αύξοντες αριθμούς. 28, 31-33, 36-41, 44, 45, 47, 55, 56, 58, 58, 68, 69, 82, 83, 85, 86, 89-94, 98, 99, 101, 107-110, 114, 154, 156, 178, 223, 224, 296, 298-300, 302-304, 306-323, 325-331, 333, 335-339, 341, 342. Να συγκριθεί η ακρίβεια ενός συστηματικού δείγματος, που περιλαμβάνει ένα άτομο ανά 8 άτομα του πληθυσμού, με την ακρίβεια ενός απλού τυχαίου δείγματος του ίδιου μεγέθους, αν υποτεθεί ότι θέλουμε να εκτιμήσουμε το ποσοστό των νοικοκυριών με μη λευκούς αρχηγούς. Λύση: N=360, k=8. Άρα, n=n/k=360/8=45. Επομένως, υπάρχουν 8 δυνατά 1-ανά-8 συστηματικά δείγματα μεγέθους 45. Έστω 1, αν το j νοικοκυριο του i δειγματος y ij = εχει μη λευκο αρχηγο 0, διαφορετικα. Με την βοήθεια του πίνακα 5.2.1, είναι εύκολο να δει κανείς ότι οι 45 αριθμοί yij, i=1, 2,, 8 των νοικοκυριών με μη λευκό αρχηγό για τα j1 = διάφορα δυνατά δείγματα είναι 109

110 Δείγμα i 1 2 3 4 5 6 7 8 Σύνολο 45 yij 7 13 10 10 12 9 10 10 81 j1 = Έστω ˆp* η εκτιμήτρια του p από ένα συστηματικό τυχαίο δείγμα. Τότε, από την (5.2.3), έχουμε k 1 (i) 2 V(p*) ˆ = (pˆ p), k i = 1 όπου 45 (i) ˆp = yij 45, i = 1, 2,, k j1 = και k n 8 45 81 p = yij N = yij 360 = = 0.225. 360 i= 1j= 1 i= 1j= 1 Δηλαδή, τελικά, V( ˆp*) = 0.001412. Για την εκτιμήτρια pˆ βασισμένη σε ένα απλό τυχαίο δείγμα μεγέθους 45, έχουμε N n p(1 p) 360 45 (0.225)(0.775) V(p) ˆ = = = 0.00340. n N 1 45 359 Είναι, δηλαδή, η τιμή της διασποράς της ˆp* ίση με το 41.53% της τιμής της διασποράς της pˆ. Παρατήρηση: Η συστηματική δειγματοληψία χρησιμοποιείται συχνά λόγω της απλότητάς της, σε πληθυσμούς, στους οποίους η αρίθμηση των μονάδων είναι τυχαία. Αυτό συμβαίνει, για παράδειγμα, στις περιπτώσεις

δειγματοληψίας από ένα αρχείο ονομάτων, τα οποία εμφανίζονται κατά αλφαβητική σειρά, με την προϋπόθεση ότι το χαρακτηριστικό που μελετάται δεν σχετίζεται με το επίθετο των συγκεκριμένων ατόμων. Στην περίπτωση αυτή, δεν θα υπάρχει τάση ή στρωματοποίηση ως προς τις τιμές y i των μονάδων του πληθυσμού καθώς θα διατρέχεται το αρχείο και δεν θα υπάρχει συσχέτιση μεταξύ γειτονικών τιμών. Επομένως, αναμένεται ότι η συστηματική δειγματοληψία θα είναι ισοδύναμη με την απλή τυχαία δειγματοληψία και θα οδηγεί στην ίδια διασπορά, οποτεδήποτε ο πληθυσμός έχει τυχαία διάταξη, με την έννοια της τυχαίας αρίθμησης των μονάδων που τον απαρτίζουν. Για οποιονδήποτε συγκεκριμένο πεπερασμένο πληθυσμό και για οποιεσδήποτε τιμές του n και k, αυτό δεν αληθεύει ακριβώς. Ο λόγος είναι ότι η διασπορά της εκτιμήτριας στην περίπτωση της συστηματικής δειγματοληψίας, η οποία βασίζεται μόνο σε k βαθμούς ελευθερίας, συμπεριφέρεται μάλλον ανορθόδοξα, όταν η τιμή του k είναι μικρή και, επομένως, ενδέχεται να υπερβαίνει ή να είναι μικρότερη από την διασπορά της εκτιμήτριας στην περίπτωση της απλής τυχαίας δειγματοληψίας. Μπορεί, όμως, να αποδειχθεί ότι, κατά μέσο όρο, οι δύο διασπορές ταυτίζονται. Συγκεκριμένα, αποδεικνύεται ότι E(V S )=V R, όπου V S και V R συμβολίζουν τις διασπορές της εκτιμήτριας στην περίπτωση συστηματικής και απλής τυχαίας δειγματοληψίας, αντίστοιχα. 111