3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)



Σχετικά έγγραφα
6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

2. ΑΠΛΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Simple Random Sampling)

Δειγματοληψία στην Ερευνα. Ετος

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Συμπερασματολογία

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Στατιστική Επιχειρήσεων ΙΙ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

4.ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Εισαγωγή στην Εκτιμητική

Διαστήματα Εμπιστοσύνης

Στατιστική Επιχειρήσεων ΙΙ

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ

ΒΕΛΤΙΣΤΟ ΜΕΓΕΘΟΣ ΔΕΙΓΜΑΤΟΣ

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου

cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ)

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

5 o Μάθημα Έλεγχοι Υποθέσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Είδη Μεταβλητών. κλίµακα µέτρησης

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Στατιστική. Εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 3 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

3. Κατανομές πιθανότητας

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Εισαγωγικές Έννοιες ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών Πόρων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Εκτίμηση Διαστήματος. Χ. Εμμανουηλίδης, 1. Στατιστική ΙI. Εκτίμηση Διαστήματος Εμπιστοσύνης για τον Μέσο

X = = 81 9 = 9

Εισαγωγή στην Ανάλυση Δεδομένων

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

στατιστική θεωρεία της δειγµατοληψίας

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ερευνητική υπόθεση. Η ερευνητική υπόθεση αναφέρεται σε μια συγκεκριμένη πρόβλεψη σχετικά με τη σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές.

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ. Ματσάγκος Ιωάννης-Μαθηματικός

Ενδεικτικές ασκήσεις ΔΙΠ 50

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

Εισόδημα Κατανάλωση

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Δειγµατοληψια. Καθηγητής Α. Καρασαββόγλου Επίκουρος Καθηγητής Π. Δελιάς

Στατιστική Επιχειρήσεων ΙΙ

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

Transcript:

3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί το μέγεθος του δείγματος Αυτός δεν είναι και ο μοναδικός τρόπος Είναι δυνατόν να αυξηθεί η ακρίβεια των εκτιμήσεων με την γνώση επιπρόσθετων πληροφοριών για την δομή του πληθυσμού Ενδέχεται για παράδειγμα, ο πληθυσμός να μπορεί να θεωρηθεί ως αποτελούμενος από υποπληθυσμούς μέσα στους οποίους να υπάρχει μεγαλύτερη ομοιογένεια ως προς κάποιο χαρακτηριστικό από ό,τι σε ολόκληρο τον πληθυσμό Αν λοιπόν, με κάποιο δειγματοληπτικό σχήμα, αντιπροσωπευθούν κατάλληλα όλοι οι υποπληθυσμοί στο δείγμα, τότε είναι δυνατόν να επιτύχουμε μικρότερη διασπορά για τις εκτιμήσεις των παραμέτρων του πληθυσμού από αυτή που έχουμε από ένα απλό τυχαίο δείγμα του ίδιου μεγέθους που δεν λαβαίνει υπ όψη την δυνατότητα διάκρισης του πληθυσμού σε υποπληθυσμούς Ορισμός 3: Έστω πληθυσμός μεγέθους Ν και έστω ότι αυτός μπορεί να διαιρεθεί σε εσωτερικά ομοιογενείς υποπληθυσμούς μεγέθους Ν, Ν,, Ν Αν αυτοί είναι ξένοι μεταξύ τους ώστε να ισχύει ότι + + + =, οι υποπληθυσμοί αυτοί ονομάζονται στρώματα (strata) Ορισμός 3: Έστω ότι από κάθε ένα από τα στρώματα ενός πληθυσμού επιλέγεται ένα απλό τυχαίο δείγμα μεγέθους, =,,, ανεξάρτητα από τα άλλα Το δείγμα μεγέθους = + + + που προκύπτει από την ένωση των ανεξαρτήτων απλών τυχαίων δειγμάτων ονομάζεται στρωματοποιημένο τυχαίο δείγμα (stratfed radom sample) και η 73

διαδικασία επιλογής του ονομάζεται στρωματοποιημένη τυχαία δειγματοληψία (stratfed radom samplg) Οι παράγραφοι που ακολουθούν ασχολούνται με τις ιδιότητες των εκτιμητριών των διαφόρων παραμέτρων του πληθυσμού και την καλύτερη δυνατή επιλογή των τιμών των μεγεθών,,, των υποδειγμάτων για την επίτευξη μέγιστης ακρίβειας 3 Εκτίμηση Μέσης Τιμής Στρωματοποιημένου Πληθυσμού Σύμφωνα με τους ορισμούς 3 και 3, τα δεδομένα του προβλήματος συνοψίζονται στον πίνακα 3 Πίνακας 3 Στρώμα Μέγεθος στρώματος Πληθυσμός Μέση τιμή Διασπορά Μέγεθος απλού τυχ δείγματος Ν μ σ Ν μ σ Ν μ σ Ν μ σ Δείγμα Μέσος X X X X Διασπορά σ σ σ σ 74

() () Εδώ X = X j, =,,,, όπου X j είναι η j μονάδα του j = δείγματος Είναι προφανές ότι η μέση τιμή μ του πληθυσμού και οι μέσες τιμές μ, μ,, μ των υποπληθυσμών συνδέονται με την σχέση μ= μ (3) = Τα αντίστοιχα δειγματικά μεγέθη συνδέονται με μια παρόμοια σχέση: = X = X, όπου X είναι ο μέσος του συνολικού δείγματος Στην πράξη όμως, η στατιστική συνάρτηση που χρησιμοποιείται ως εκτιμήτρια του μ δεν είναι η X, αλλά η = ˆμ = X, (3) στην οποία οι μέσοι των δειγμάτων από τα διάφορα στρώματα σταθμίζονται με τους συντελεστές βαρύτητας /, =,,, των στρωμάτων Προφανώς, ˆμ X = αν =, =,,, 75

ή, ισοδύναμα, αν = f = f, =,,, Δηλαδή, οι δυο στατιστικές συναρτήσεις συμπίπτουν αν όλα τα δείγματα εκπροσωπούν το ίδιο ποσοστό μονάδων των αντίστοιχων στρωμάτων Θεώρημα 3: Η στατιστική συνάρτηση μˆ είναι αμερόληπτη εκτιμήτρια της μέσης τιμής μ του πληθυσμού και ισχύει ότι Απόδειξη: Αμεροληψία: Ισχύει εδώ ότι ˆ σ V( μ ) = (33) = E( μ ˆ ) = E(X ) = Αλλά, οι στατιστικές συναρτήσεις X, X,, X ως μέσοι απλών τυχαίων δειγμάτων είναι αμερόληπτες εκτιμήτριες των μέσων τιμών μ, μ,, μ αντίστοιχα των (υπο)πληθυσμών, από τους οποίους τα δείγματα αυτά επελέγησαν Άρα, ( ) E X = μ και, επομένως, E( μ ˆ ) = μ =μ = 76

Η τελευταία σχέση αποδεικνύει ότι η του μ Ισχύει επίσης ότι μˆ είναι αμερόληπτη εκτιμήτρια = V( μ ˆ ) = V X = V(X ) + jcov(x X ) j = < j Αλλά, Cov(X,X ) 0 j =, αφού τα απλά τυχαία δείγματα είναι αμοιβαία ανεξάρτητα Άρα, ισχύει η σχέση V( μ ˆ ) = V(X ), = η οποία οδηγεί στην (33) και ολοκληρώνει την απόδειξη του θεωρήματος () Έστω y j η j μονάδα του πληθυσμού που ανήκει στο στρώμα Τότε ισχύει το εξής πόρισμα Πόρισμα: Η στατιστική συνάρτηση Yˆ st = μˆ (34) είναι αμερόληπτη εκτιμήτρια του συνολικού μεγέθους y και ισχύει ότι () yj = j= = 77

ˆ σ V(Y st ) = (35) = Απόδειξη: Ισχύει προφανώς ότι () y= yj = μ = μ = j= = Επομένως, ˆ st ˆ E(Y ) = E( μ ) = μ= y και V(Y ˆ st ) = V( μ ˆ ) Η σχέση αυτή σε συνδυασμό με την (33) οδηγεί στην (35) Επειδή από κάθε στρώμα επιλέγεται ένα απλό τυχαίο δείγμα, έπεται ότι η στατιστική συνάρτηση () = j j = S (X X ) είναι αμερόληπτη εκτιμήτρια της διασποράς σ του στρώματος (Εδώ, () X j είναι η j παρατήρηση του δείγματος) Κατά συνέπεια, ισχύει το εξής θεώρημα Θεώρημα 3: Η στατιστική συνάρτηση S = ˆμ = S είναι αμερόληπτη εκτιμήτρια της V( μˆ ) 78

Παρατήρηση: Προφανώς, μια αμερόληπτη εκτιμήτρια της είναι η ˆμ S V Ŷ st () Μπορεί να αποδειχθεί, κάτω από την υπόθεση ότι η X j είναι κανονική τυχαία μεταβλητή, ότι η κατανομή της στατιστικής συνάρτησης ˆ μˆ ( μ μ) S είναι κατά προσέγγιση η t με e βαθμούς ελευθερίας, όπου e είναι μια τιμή μεταξύ του m{ -,, -} και του Συνήθως, η τιμή του e που χρησιμοποιείται είναι η 4 g S e = gs = = ( ) =, (36) όπου g = ( - )/, =,,, Επομένως, ένα 00(-α)% διάστημα εμπιστοσύνης για την παράμετρο μ έχει άκρα ˆμ ± t S (37) e, α/ μˆ Παράδειγμα: Έστω ένας πληθυσμός μεγέθους 000, ο οποίος είναι κατά το 60% αγροτικός Για να εκτιμηθεί το μέσο μηνιαίο εισόδημα (σε εκατοντάδες ευρώ) επελέγη ένα στρωματοποιημένο τυχαίο δείγμα μεγέθους 5 το οποίο οδήγησε στα αποτελέσματα που δίνονται στη συνέχεια Να κατασκευασθεί ένα 95% διάστημα εμπιστοσύνης για το πραγματικό μέσο εισόδημα του πληθυσμού Αγροτικό Τμήμα Μη αγροτικό Τμήμα 0 0 5 6 79

Λύση: Έστω () X j = η j παρατήρηση του στρώματος X = ο μέσος του στρώματος S = η διασπορά του στρώματος Τότε, Επομένως, 3 () = X j j = 3 =, () = X j j = = 8 μˆ = (06) + 8(04) = 04, 3 () j j = () = j = + = j = S = (X X ) = ( + 3 + ) = 7, S (X X ) ( 3 ) 0 Κατά συνέπεια, (06)(7) + (04)(0) 5 S ˆ = 63 μ =, 5 000 οπότε S μ ˆ = 8 Άρα τα άκρα του 95% διαστήματος εμπιστοσύνης είναι 08 ± t (8), e, 0975 80

4 g όπου S ( e = ( gs ), ) g =, =, = = Εδώ, ( ) ( )[( ) ( )] 06(06 0003) g = = = = 940 000003 και 04(04 000) g = = 7960 00000 Άρα, ( gs ) = (6380), = g S = 988968 = και, επομένως, e = 708 3 Κατά συνέπεια, το 95% διάστημα εμπιστοσύνης για το πραγματικό μέσο εισόδημα του πληθυσμού ορίζεται από τα άκρα 08± t 3,0975 (8), όπου t 3,0975 = 38 Δηλαδή, τελικά, τα άκρα του ζητούμενου διαστήματος είναι 08±4073 Άρα, με πιθανότητα ίση με 95%, το πραγματικό μέσο μηνιαίο εισόδημα είναι μεταξύ 67,70 και 487,30 ευρώ 8

3 Επιλογή των,,, Το πρόβλημα που συνδέεται άμεσα με την τεχνική της στρωματοποιημένης δειγματοληψίας είναι ο καταμερισμός του συνολικού δειγματικού μεγέθους στα διαθέσιμα στρώματα, δηλαδή ο καθορισμός των τιμών των μεγεθών,,, των απλών τυχαίων δειγμάτων Αν το δειγματοληπτικό κόστος ανά μονάδα είναι το ίδιο σε όλα τα στρώματα και οι διασπορές των στρωμάτων δεν διαφέρουν σημαντικά, τα μεγέθη,,, συνηθίζεται να επιλέγονται έτσι ώστε =, =,,, Ο σχεδιασμός αυτός είναι γνωστός ως αναλογικός καταμερισμός του (proportoal allocato) και η δειγματοληπτική τεχνική ονομάζεται αναλογική στρωματοποιημένη τυχαία δειγματοληψία (proportoal stratfed radom samplg) Στην περίπτωση αυτή, =, =,,,, (3) δηλαδή, το μέγεθος του δείγματος από ένα στρώμα είναι ανάλογο του ποσοστού των μονάδων του πληθυσμού που το στρώμα εκπροσωπεί Υπάρχουν, όμως, περιπτώσεις όπου οι τιμές του πληθυσμού έχουν μεγαλύτερη διακύμανση σε μερικά στρώματα από ό,τι σε άλλα Διαφέρουν δηλαδή σημαντικά οι διασπορές των στρωμάτων Επομένως, για να αντιπροσωπευθούν επαρκώς τα στρώματα αυτά στο δείγμα, θα πρέπει ο λόγος να είναι ανάλογος της τυπικής απόκλισης σ του στρώματος Αυτό σημαίνει ότι στρώματα με μεγαλύτερη διακύμανση από άλλα πρέπει να εκπροσωπούνται από μεγαλύτερο τμήμα του 8

δείγματος, για να αυξηθεί η ακρίβεια των εκτιμήσεων Υποθέτοντας ότι το δειγματοληπτικό κόστος ανά μονάδα είναι το ίδιο για όλα τα στρώματα, αποδεικνύεται ότι η V( μ ˆ ) γίνεται ελάχιστη αν τα,,, επιλεγούν έτσι ώστε σ =, =,,, (3) j σj j = Ο σχεδιασμός αυτός είναι γνωστός ως βέλτιστος καταμερισμός του με σταθερό κόστος ανά δειγματοληπτική μονάδα (optmum allocato wth costat cost per ut) ή καταμερισμός κατά eyma (eyma allocato) Αν το δειγματοληπτικό κόστος ανά μονάδα διαφέρει από στρώμα σε στρώμα, τότε είναι φυσικό να προσπαθήσει ο ερευνητής να αυξήσει την ακρίβεια των εκτιμήσεών του επιλέγοντας τα, αντιστρόφως ανάλογα των c, =,,, Έστω ότι το συνολικό κόστος c μιας δειγματοληψίας είναι συνάρτηση των c, =,,,, δηλαδή, έστω ότι c= c0 + c, c 0 > 0 = Τότε, αποδεικνύεται ότι αν το κόστος c έχει μια δοθείσα τιμή, οι τιμές των που ελαχιστοποιούν την διασπορά V( μ ˆ ) δίνονται από τον τύπο σ c =, =,,, (34) j σj cj j = 83

Οι τιμές (34) ελαχιστοποιούν επίσης το κόστος εάν η διασπορά V( μ ˆ ) έχει μια δοθείσα τιμή Ο παραπάνω καταμερισμός του ονομάζεται βέλτιστος καταμερισμός (optmum allocato) Η σχέση (34) υπονοεί ότι το μέγεθος του απλού τυχαίου δείγματος, που επιλέγεται από ένα στρώμα, πρέπει να είναι μεγαλύτερο από τα μεγέθη των δειγμάτων άλλων στρωμάτων, αν το μέγεθος του στρώματος είναι μεγαλύτερο, η διασπορά του στρώματος είναι μεγαλύτερη και το κόστος ανά μονάδα του στρώματος είναι χαμηλότερο Παρατήρηση : Η (34) οδηγεί στην (3) αν c =c, =,,,, δηλαδή, αν υπάρχει ομοιόμορφο κόστος Επίσης, η (34) οδηγεί στην (3), αν, εκτός από ομοιόμορφο κόστος, υπάρχει και ομοιόμορφη διακύμανση στις τιμές των μονάδων των διαφόρων στρωμάτων, δηλαδή, αν c =c και σ = σ0, =,,, Παρατήρηση : Στην περίπτωση (34) είναι δυνατόν το μέγεθος του συνολικού δείγματος να μην είναι προκαθορισμένο Αυτό μπορεί να καθορισθεί με την βοήθεια της συνάρτησης κόστους, αν το συνολικό κόστος c έχει μια δοθείσα τιμή Πράγματι, αντικαθιστώντας τις τιμές των, όπως αυτές δίνονται από την (34) στην (33) και λύνοντας ως προς, έχουμε (c c ) σ / c 0 = = σ / c = Στην περίπτωση που η επιθυμητή τιμή της V( μ ˆ ) είναι V, αντικαθιστώντας τις τιμές των από την (34) στην (33) και λύνοντας ως προς, έχουμε 84

σ c σ c = = = V σ + = Παράδειγμα: Έστω ότι σε κάποιο επάγγελμα, οι μηνιαίοι βασικοί μισθοί ανδρών γυναικών σε εκατοντάδες ευρώ είναι οι εξής: Κατηγορία 3 4 5 6 7 Αποδοχές (z ) 0 5 0 5 30 35 40 Άνδρες (α ) 0 0 00 00 400 00 00 Γυναίκες (γ ) 500 500 500 0 0 0 0 (α) Να υπολογισθεί ο μέσος βασικός μισθός του πληθυσμού αυτού (β) Να εκτιμηθεί το σφάλμα που ένας ερευνητής θα κάνει αν προσπαθήσει να εκτιμήσει τον μέσο βασικό μισθό με βάση ένα δείγμα μεγέθους =5 χρησιμοποιώντας () απλή τυχαία δειγματοληψία, () αναλογική στρωματοποιημένη τυχαία δειγματοληψία, () βέλτιστη στρωματοποιημένη τυχαία δειγματοληψία Λύση: (α) Υπάρχουν δυο στρώματα μεγέθους Ν = και Ν = Σγ = 500 Αν μ είναι η μέση τιμή του στρώματος, τότε 7 α = 000 = Αλλά, μ = (Ν μ + Ν μ )/Ν 85

Άρα, μ = μ = μ = 7 αz/ = 30, = 7 γz/ = 5 και Ν = Ν + Ν = 500 = (β) () Αγνοώντας την διαίρεση του πληθυσμού σε δυο στρώματα, έστω υ = α + γ Τότε, η χρησιμοποιούμενη εκτιμήτρια X της μέσης τιμής μ του πληθυσμού έχει διασπορά όπου Δηλαδή, σ σ = X, 7 7 σ = { υz ( υz ) } ( ) = 7603 = 7603 5 σ = 30 X = σ X = 735 5 500 () = (/) = 0 = (/) = 5 Η χρησιμοποιούμενη εκτιμήτρια είναι η ˆμ = X = Άρα, 86

Αλλά, σ ˆμ ( ˆ σ = V μ ) = = 7 7 σ = { αz ( αz ) = = 7 7 σ = { γz ( γz ) = = σ = 087 σ ˆμ μˆ = 0934 / } / ( -) = 3003 / } / ( -) = 667 () = σ / (Ν σ + Ν σ ) = 8, = σ / (Ν σ + Ν σ ) = 39 3 σ ˆμ = 0854, σμ ˆ = 094 Παρατήρηση: Και στις δύο περιπτώσεις της στρωματοποιημένης δειγματοληψίας, η διασπορά της εκτίμησης της παραμέτρου μ είναι ίση με το 30% περίπου της διασποράς της εκτίμησης, στην οποία οδηγούμεθα με απλή τυχαία δειγματοληψία 33 Σχετική Ακρίβεια Στρωματοποιημένης Τυχαίας Δειγματοληψίας και Απλής Τυχαίας Δειγματοληψίας Η στρωματοποίηση έχει εν γένει ως αποτέλεσμα μικρότερη διασπορά για την εκτιμήτρια της μέσης τιμής του πληθυσμού Δεν είναι, όμως, αληθές ότι οποιοδήποτε στρωματοποιημένο δείγμα δίνει μικρότερη διασπορά από ένα απλό τυχαίο δείγμα Αν οι τιμές των 87

,,, απέχουν πολύ από αυτές του βέλτιστου καταμερισμού, τότε η εκτίμηση της μέσης τιμής μπορεί να έχει μεγαλύτερη διασπορά Έστω V A( μ ˆ ) και V B( μ ˆ ) η διασπορά της εκτιμήτριας μˆ της μέσης τιμής μ στην περίπτωση αναλογικής στρωματοποιημένης δειγματοληψίας και βέλτιστης στρωματοποιημένης δειγματοληψίας, αντίστοιχα Έστω X ο μέσος ενός απλού τυχαίου δείγματος μεγέθους Τότε, ισχύει το εξής θεώρημα Θεώρημα 33: Αν το μέγεθος του δείγματος είναι δεδομένο και στις εκφράσεις των V( X ), V A( μ ˆ ) και V B( μ ˆ ) όροι ως προς /Ν είναι αμελητέοι (και επομένως όροι ως προς /Ν είναι αμελητέοι), ισχύει ότι V B( μ ˆ ) V A( μ ˆ ) V( X ) Απόδειξη: Ισχύει ότι σ V( X ) =, (33) ( /)σ V ( ) = A μˆ = ( /)σ ( /)σ = = =, (33) ( ( ) σ) ( ) σ V B( μ ˆ ) = = = (333) 88

Οι δυο τελευταίες σχέσεις προκύπτουν από την (35) σε συνδυασμό με την (3) και (3) αντίστοιχα Θα δειχθεί ότι σ ( ) σ = Πράγματι, ( ) j (j) (y ) j = = j j (j) = (y μ j) + ( μj μ) j= = j= = = (j ) σ j + j( μj μ) j = j = (προσθαφαιρώντας το μ j ) σ = μ = Διαιρώντας και τα δυο μέλη με Ν και αγνοώντας τους όρους ως προς /Ν και ως προς /Ν (οι οποίοι είναι αμελητέοι), έχουμε σ = (j ) σ j + (j )( μj μ) j = j = Επειδή ο δεύτερος προσθετέος είναι μη αρνητική ποσότητα, έπεται ότι σ (j ) σj j = Άρα, από τις σχέσεις (33) και (33), προκύπτει ότι V( X ) V A( μ ˆ ) Επιπλέον, είναι προφανές ότι 89

V A( μˆ) V B( μ ˆ) = ( ) σ ( ) σ = = = σ σ 0 = = Άρα, V A( μ ˆ ) V B( μ ˆ ) και, επομένως, αποδείχθηκε το θεώρημα 34 Το μέγεθος του Δείγματος Στην παράγραφο 3 αντιμετωπίσθηκε μια μορφή του προβλήματος καθορισμού του κατάλληλου μεγέθους του συνολικού δείγματος στις περιπτώσεις προκαθορισμένου συνολικού κόστους και προκαθορισμένης διασποράς της εκτιμήτριας μˆ (Παρατήρηση ) Γενικότερα, έστω ότι απαιτείται ένα στρωματοποιημένο τυχαίο δείγμα μεγέθους του οποίου το 00W % των μονάδων θα προέρχεται από το στρώμα, =,,, Έστω, δηλαδή, ότι το καταμερίζεται σύμφωνα με την σχέση = W, =,,,, W = (34) = Το πρόβλημα είναι ο προσδιορισμός της τιμής του που εξασφαλίζει μια δοθείσα τιμή V για την διασπορά της εκτιμήτριας μˆ Πρέπει δηλαδή το να καθορισθεί έτσι ώστε ή, ισοδύναμα, έτσι ώστε V( ˆμ ) = V (34) 90

σ = V = Η τελευταία σχέση σε συνδυασμό με την (34) γράφεται ( ) σ ( ) σ = V W = = Λύνοντας ως προς, έχουμε 0 =, (343) + ( ) σ (V) = όπου ( ) σ 0 = (344) V W = Συνήθως, το μέγεθος του απαιτούμενου συνολικού δείγματος καθορίζεται με βάση τον βαθμό εμπιστοσύνης, με την οποία η εκτίμηση ˆμ της μέσης τιμής μ δεν απέχει από την μ περισσότερο από μια δοθείσα τιμή e Δηλαδή, το πρόβλημα, όπως και στην απλή τυχαία δειγματοληψία, μπορεί να διατυπωθεί ως εξής: Ποιό είναι το μέγεθος του στρωματοποιημένου τυχαίου δείγματος που απαιτείται ώστε ( ) P μˆ μ e = α ; (345) Η (345) είναι ισοδύναμη με την 9

μˆ μ e P = α V( μˆ) V( μˆ) e V( μˆ ) = z α (346) Αλλά, ˆ σ V( μ ) = = (από την (34)) = ( /)σ = ( /) σ W = = (347) Αντικαθιστώντας στην (346) την τιμή της V( μˆ ) από την (347) και λύνοντας ως προς, έχουμε όπου = 0 0, (348) + z ( ) σ /(e ) α = α σ e W = z ( ) = (349) Στην πράξη, η τιμή του καθορίζεται και στις δυο περιπτώσεις ως εξής: (344) η (349), αν 0/ 005 = (343) η (348), αν 0/ > 005 9

Παράδειγμα: Στο παράδειγμα της παραγράφου 3, ποιο είναι το μέγεθος του δείγματος που απαιτείται, ώστε, με πιθανότητα 95%, η εκτίμηση της μέσης τιμής του πληθυσμού να μην διαφέρει από την πραγματική τιμή περισσότερο από () στην περίπτωση αναλογικού καταμερισμού και () στην περίπτωση βέλτιστου καταμερισμού; Λύση: e=, -α=095 Άρα, z 0975 =96 και, επομένως, από τις σχέσεις (349) και (348), έχουμε (04) (300) (06) (667) 0 = (96) + W W 845 305 = + W W και 0 = = (96) + [(04)(300) + (06)(667)] 500 = 0 0338 Κατά συνέπεια, () 04, = W = = 0 = 8454, 06, = οπότε (επειδή 0 /=003<005), = 0 85 () σ 047, = W = = 0 = 875 σ + σ 053, = 93

και, άρα, 83 35 Εκτίμηση Ποσοστών () Έστω Ν Α ο αριθμός των μονάδων του στρώματος του πληθυσμού που ανήκουν σε μια κατηγορία Α και Χ () ο αριθμός των αντίστοιχων μονάδων του απλού τυχαίου δείγματος Τότε, το ποσοστό p των μονάδων του πληθυσμού που ανήκουν στην κατηγορία Α είναι ίσο με p () = A = = ( )p, = όπου () p A = = ποσοστό των μονάδων του στρώματος που ανήκουν στην κατηγορία Α Θεώρημα 35: Η στατιστική συνάρτηση όπου p ˆ = ( / ) pˆ, (35) = () X ˆp =, (35) είναι αμερόληπτη εκτιμήτρια της παραμέτρου p και ισχύει ότι 94

p ( p ) ˆ V(p) = = (353) Απόδειξη: Η αμεροληψία είναι προφανής Για την απόδειξη της (353), αρκεί να παρατηρηθεί ότι όπου ˆ V(p) = V(p ˆ) =, p( p) V(p ˆ ) = (354) Μια αμερόληπτη εκτιμήτρια της V( pˆ ) είναι η στατιστική συνάρτηση p ˆ( p ˆ) S = ˆp = (355) Για τον υπολογισμό των και τον καθορισμό του συνολικού δειγματικού μεγέθους, ισχύουν οι τύποι της προηγούμενης παραγράφου, όπου ο παράγοντας σ αντικαθίσταται από την V( p ˆ ), όπως αυτή δίνεται από την (354) Παρατήρηση: Αν σε μια δειγματοληπτική έρευνα ενδιαφερόμαστε να κάνουμε συγκρίσεις μεταξύ διαφορετικών στρωμάτων, οι κανόνες για τον καταμερισμό του είναι διαφορετικοί Αν, για παράδειγμα, ο πληθυσμός αποτελείται από δυο μόνο στρώματα και θέλουμε να συγκρίνουμε τις μέσες τιμές μ, μ των στρωμάτων αυτών, τότε μια λογική επιλογή θα ήταν να διαλέξουμε τα και έτσι ώστε να 95

ελαχιστοποιείται η VX ( X ) Τότε, με την υπόθεση μιας γραμμικής συνάρτησης κόστους c=c 0 +c +c, οι τιμές των και, που ελαχιστοποιούν την V X X για σταθερό c, είναι σ / c =, =, σ / c + σ / c (Για τον καθορισμό των αγνοήθηκε η διόρθωση πεπερασμένου πληθυσμού) Όταν ο αριθμός των στρωμάτων είναι μεγαλύτερος του, ο βέλτιστος καταμερισμός εξαρτάται από την ακρίβεια που απαιτεί ο ερευνητής για τις διάφορες συγκρίσεις ΑΣΚΗΣΕΙΣ Ένας πληθυσμός μεγέθους Ν=6 αποτελείται από τα στρώματα {0,,} και {4,6,} Ένα δείγμα μεγέθους =4 πρόκειται να επιλεγεί (α) Να δειχθεί ότι ο βέλτιστος καταμερισμός του οδηγεί σε υποδείγματα μεγέθους =, =3 (β) Να εκτιμηθεί η μέση τιμή του πληθυσμού για κάθε δυνατό στρωματοποιημένο δείγμα μεγέθους 4 και να εκτιμηθεί το τυπικό σφάλμα των εκτιμητριών Ο παρακάτω πίνακας δείχνει τους αριθμούς των κατοίκων 64 Αμερικανικών πόλεων το 930 που ήταν 5ες έως 68ες κατά σειρά μεγέθους στις ΗΠΑ το 90 Οι πόλεις είναι χωρισμένες σε δυο στρώματα 6 και 48 πόλεων Ο συνολικός αριθμός των κατοίκων των 64 πόλεων κατά το έτος 930 πρόκειται να εκτιμηθεί με ένα τυχαίο δείγμα μεγέθους 4 Να υπολογισθεί το τυπικό σφάλμα της εκτίμησης στις εξής περιπτώσεις: () Απλή τυχαία δειγματοληψία, 96

() στρωματοποιημένη αναλογική δειγματοληψία και (3) στρωματοποιημένη δειγματοληψία με μονάδες από κάθε στρώμα Στρώμα Πληθυσμός 900 8 78 805 670 38 573 634 578 487 44 45 459 464 400 366 364 37 38 30 88 9 53 9 308 7 84 55 70 4 95 60 09 83 63 53 3 60 0 47 9 64 43 69 39 70 50 43 3 5 3 54 40 9 30 7 00 07 4 63 6 34 3 Για να εκτιμηθεί το συνολικό απόθεμα ελαστικών που έχουν οι πελάτες μιας εταιρείας, η εταιρεία ελαστικών κάνει μια στρωματοποιημένη δειγματοληψία από τον πληθυσμό των πελατών της Η στρωματοποίηση γίνεται σύμφωνα με το απόθεμα που οι πελάτες είχαν την προηγούμενη χρονιά Ένα δείγμα μεγέθους =000 έδωσε τα αποτελέσματα που δίνονται στην συνέχεια Στρώμα Πληθυσμός Αριθμός πελατών / Δείγμα (αναλογικός καταμερισμός) Μέσο Απόθεμα X 4000 00 00 05 600 0000 050 500 80 500 3 5400 07 70 70 500 4 600 003 30 390 5600 (α) Να εκτιμηθεί το μέσο απόθεμα και, επομένως, το συνολικό απόθεμα (β) Να εκτιμηθούν τα, αν γίνει βέλτιστος καταμερισμός του σˆ 97

(γ) Να εκτιμηθεί η διασπορά της εκτιμήτριας του μέσου αποθέματος στις περιπτώσεις () αναλογικού καταμερισμού, () βέλτιστου καταμερισμού και () απλού τυχαίου δείγματος (δ) Να κατασκευασθούν 95% διαστήματα εμπιστοσύνης για τις τρεις περιπτώσεις της προηγούμενης ερώτησης 4 Ένας ερευνητής προτείνει να χρησιμοποιήσει στρωματοποίηση ενός πληθυσμού σε δυο στρώματα και για αυτό προτείνει την επιλογή ενός στρωματοποιημένου τυχαίου δείγματος Ο ερευνητής περιμένει ότι το κόστος του θα είναι της μορφής c0 + c Οι εκ των προτέρων = εκτιμήσεις του για τα δυο στρώματα είναι οι εξής: 98 Στρώμα Ν / σ c 04 0 4 06 0 9 (α) Να υπολογισθούν οι τιμές των / που ελαχιστοποιούν το συνολικό κόστος για μια δοθείσα τιμή της V( μˆ ) (β) Αγνοώντας την διόρθωση πεπερασμένου πληθυσμού, να υπολογισθεί πόσο μεγάλο πρέπει να είναι το μέγεθος του στρωματοποιημένου δείγματος, ώστε V( μˆ ) = 5 Σε ένα εργοστάσιο, 6% των εργαζομένων είναι ειδικευμένοι ή ανειδίκευτοι εργάτες, 3% ειδικευμένες ή ανειδίκευτες εργάτριες και 7% επόπτες Η διοίκηση του εργοστασίου έχει εξασφαλίσει για τους εργαζομένους την δυνατότητα χρήσης ενός γειτονικού αθλητικού κέντρου και επιθυμεί να εκτιμήσει το ποσοστό των εργαζομένων, που κάνουν χρήση του κέντρου αυτού με βάση ένα δείγμα 400 εργαζομένων Πρόχειρες εκτιμήσεις δείχνουν ότι τα ποσοστά είναι 40-45%, 0-5% και -75% για τις τρεις παραπάνω κατηγορίες (α) Πώς θα καταμερισθεί το δείγμα;

(β) Αν οι πραγματικές τιμές των ποσοστών των εργαζομένων που κάνουν χρήση του κέντρου είναι 48%, % και 4% αντίστοιχα, ποιο θα είναι το τυπικό σφάλμα της εκτιμήτριας του p; 99