Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 21 ου Πανελληνίου Συνεδρίου Στατιστικής (2008), σελ 123-130 Ο ΡΟΛΟΣ ΤΗΣ ΣΤΑΘΜΙΣΗΣ ΣΤΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ* Χ. ΔΑΜΙΑΝΟΥ 1, Ε. ΣΙΟΛΟΥ 2 Μαθηματικό Τμήμα Πανεπιστημίου Αθηνών 1 cdaman@math.uoa.gr, 2 esolou@yahoo.gr ΠΕΡΙΛΗΨΗ Ο ρόλος των δειγματικών βαρών στις δειγματοληπτικές έρευνες καθώς και ο τρόπος καθορισμού τους είναι ένα θέμα το οποίο απασχολεί τους στατιστικούς τα τελευταία χρόνια. Στην παρούσα εργασία γίνεται μια αναφορά στους λόγους οι οποίοι μας οδηγούν στη χρήση των δειγματικών βαρών, στις βασικές μεθόδους στάθμισης και εκτιμήτριες. Δίνεται επίσης μια εφαρμογή για την εξέταση της επίδρασης των δειγματοληπτικών σχεδίων χωρίς στάθμιση και με στάθμιση χρησιμοποιώντας εκ των υστέρων στρωματοποίηση και την τεχνική Bootstrap. 1. ΕΙΣΑΓΩΓΗ Ένα σημαντικό πρόβλημα στη στατιστική είναι η επιλογή δειγμάτων από πληθυσμούς με σκοπό την εκτίμηση παραμέτρων των πληθυσμών. Υπάρχουν πολλές μέθοδοι συλλογής δειγμάτων. Σκοπός κάθε μεθόδου είναι η επιλογή δείγματος που να α- ντιπροσωπεύει τον πληθυσμό με τον καλύτερο δυνατό τρόπο. Μια από τις σημαντικότερες προϋποθέσεις για το σχεδιασμό μιας δειγματοληπτικής έρευνας είναι ο όσο το δυνατό πληρέστερος καθορισμός του πληθυσμού στόχου (target populaton) και στη συνέχεια του δειγματοληπτικού πλαισίου (samplng frame) στον οποίο θα βασιστεί η δειγματοληψία. Ο ακριβής προσδιορισμός του πλαισίου παίζει σημαντικό ρόλο στο σχεδιασμό μιας έρευνας διότι: Καθορίζει πόσο καλά καλύπτεται ο πληθυσμός. Επηρεάζει τη μέθοδο συλλογής της πληροφορίας. Επιδρά στην αποτελεσματικότητα επιλογής του δείγματος. Σύμφωνα με τους Lessler and Kalsbeek (1992, pp.48-51), υπάρχουν τέσσερις κατηγορίες λαθών σ ένα πλαίσιο: Undercoverage: υπάρχουν ελλείπουσες μονάδες. Overcoverage: συμπεριλαμβάνονται μονάδες που δεν ανήκουν στον πληθυσμόστόχο. Υπάρχουν διπλοεγγεγραμμένοι ή περισσότερες φορές. Υπάρχουν λάθη σε βασικές πληροφορίες των μονάδων π.χ. στο φύλο, μόρφωση, περιοχή κ.τ.λ * Εργασία με υποστήριξη του ΕΛΚΕ του Πανεπιστημίου Αθηνών με Κ.Α. 70/4/5625. - 123 -
Είναι συνηθισμένο κατά την ολοκλήρωση μιας έρευνας να διαπιστώνουμε για το δείγμα που έχουμε συγκεντρώσει ότι δεν έχει την ίδια κατανομή με τον πληθυσμό για τον οποίο διενεργήσαμε την έρευνα. Είναι λοιπόν πιθανό οι εκτιμήσεις που θα κάνουμε να ενέχουν κάποιο είδος μεροληψίας το οποίο θα μπορούσαμε να αποφύγουμε σταθμίζοντας κατάλληλα το δείγμα, διότι με τη στάθμιση των δεδομένων μας καταφέρνουμε να μεγεθύνουμε το δείγμα στο μέγεθος του πληθυσμού και να το προσαρμόσουμε στην κατανομή του πληθυσμού. Για τη διόρθωση της μεροληψίας που πιθανό να ενέχουν διάφορες εκτιμήσεις και για τη βελτίωση της αποτελεσματικότητας των εκτιμητριών σε δειγματοληπτικές έ- ρευνες, συνήθεις πρακτικές είναι (μεταξύ άλλων): Η στάθμιση. Η εκ των υστέρων στρωματοποίηση. Οι σταθμισμένες εκτιμήτριες είναι συνήθως ασυμπτωτικά αμερόληπτες και έχουν μεγαλύτερη διασπορά ενώ οι μη-σταθμισμένες εκτιμήτριες είναι συνήθως μεροληπτικές αλλά έχουν μικρότερη διασπορά. Σύμφωνα με τους Korn and Graubard (1995), γενικά υπάρχει ένα «σημείο ανταλλαγής» (trade off) μεταξύ της (δυνητικής) μεροληψίας και της διασποράς που εμφανίζονται λόγω της στάθμισης. Πόσο, δηλαδή, είμαστε διατεθειμένοι να «θυσιάσουμε» αμεροληψία για να «κερδίσουμε» διασπορά. Συχνά οδηγούμαστε στο να σταθμίζουμε τα δεδομένα μας για τους παρακάτω λόγους: Εξ αιτίας της μεθόδου που χρησιμοποιήθηκε για τη συλλογή του δείγματος. Λόγω της μη-απόκρισης και της ελλιπούς κάλυψης του πληθυσμού. Για άλλους λόγους. 2. ΔΙΕΝΕΞΕΙΣ ΣΤΑΤΙΣΤΙΚΩΝ Ο Andre Gelman καθηγητής στατιστικής και πολιτικών επιστημών του Πανεπιστημίου Κολούμπια σε ένα πρόσφατο άρθρο του που δημοσιεύθηκε στο Statstcal Scence, 22(2), pp 153-164 και με τίτλο «Struggles th Survey Weghtng and Regresson Modelng» ξεκινά γράφοντας ότι το «survey eghtng s a mess» και στη συνέχεια παρουσιάζει την πολυπλοκότητα του προβλήματος. Αναφέρει δηλαδή ότι η στάθμιση είναι ένα αδιέξοδο διότι τα δειγματικά βάρη δεν είναι πάντα ξεκάθαρο πως πρέπει να χρησιμοποιούνται για την εκτίμηση οτιδήποτε πιο περίπλοκου από το δειγματικό μέσο. Σε αντίθεση με ότι υιοθετείται από πολλούς στατιστικούς, τα δειγματικά βάρη, γενικά, δεν είναι ίσα με τον αντίστροφο της πιθανότητας επιλογής στο δείγμα, αλλά συνήθως είναι βασισμένα σε ένα συνδυασμό του υπολογισμού των πιθανοτήτων και της προσαρμογής ως προς τη μη απόκριση. Σε αντίστοιχα σχόλιά τους επί του άρθρου διάφοροι ερευνητές υποστηρίζουν ή διαφωνούν με τις θέσεις του Gelman, για παράδειγμα: - 124 -
Οι Bell, R. μέλος του στατιστικού τμήματος ερευνών (AT&T Labs-Research, Ne ersey) και Cohen, M. υποστηρίζουν ότι η στάθμιση προσφέρει πολλά πρακτικά οφέλη όπως η δυνατότητα χρήσης καθιερωμένων λογισμικών, η αποφυγή της χρήσης μοντέλων με πολλές αλληλεπιδράσεις κάθε φορά που χρειάζεται να εκτιμηθεί και το πιο απλό μοντέλο παλινδρόμησης, κ.α. Ο Pfeffermann, D. (καθηγητής του τμήματος στατιστικής της Ιερουσαλήμ και στο Πανεπιστήμιο του Southampton) παρατηρεί ότι ο τρόπος με τον οποίο πρέπει να σταθμίζουμε τα δεδομένα μας ώστε να εκτιμήσουμε μετρήσιμες πληθυσμιακές ποσότητες που μας ενδιαφέρουν όπως είναι οι μέσοι είναι ένα πολύ βασικό πρόβλημα των δειγματοληπτικών ερευνών. Ο Lttle, R. (καθηγητής του τμήματος βιοστατιστικής του Πανεπιστημίου Μίσιγκαν) εκφράζει την άποψη ότι τα δειγματικά βάρη που ορίζονται ως ο αντίστροφος της πιθανότητας επιλογής μιας μονάδας στο δείγμα, παίζουν σπουδαίο ρόλο στην εξαγωγή συμπερασμάτων. Τα δειγματικά βάρη εμφανίζονται στο πλαίσιο συγκεκριμένων μοντέλων πρόβλεψης, οπότε οι προσεγγίσεις μπορούν να διασταυρωθούν. Ο Lohr, S. (καθηγητής στατιστικής του Πανεπιστημίου της Αριζόνα) παρουσιάζει ορισμένες ιδιότητες που επιθυμούμε να έχουν τα δειγματικά βάρη, όπως για παράδειγμα: Να μειώνουν το μέσο τετραγωνικό σφάλμα των εκτιμητριών. Η ιδιότητα διόρθωσης των μετρήσεων. Και προτείνει κάθε φορά που σκοπεύουμε να χρησιμοποιήσουμε βάρη να προσδιορίζουμε εκ των προτέρων ποια ιδιότητα θέλουμε να έχουν και να χρησιμοποιούμε την αντίστοιχη μέθοδο για την δημιουργία τους. Οι Bredt,. (καθηγητής στατιστικής του Πανεπιστημίου Κολοράντο) και Opsomer,. (καθηγητής στατιστικής του Πανεπιστημίου Ioa) επιχειρηματολογούν ότι οι αναλύσεις που χρησιμοποιούν σταθμίσεις προσφέρουν κάποια σαφή πλεονεκτήματα και μπορούν στην πραγματικότητα να μειώσουν την πολυπλοκότητα της ανάλυσης, σε ορισμένες περιπτώσεις, τουλάχιστον. Τέλος, προτρέπουν τους στατιστικούς ερευνητές που δημιουργούν τα δειγματικά βάρη να το κάνουν με διαφανή τρόπο ώστε να μην αφήνουν περιθώρια στους στατιστικούς αναλυτές να τα αμφισβητούν. 3. ΒΑΣΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΘΟΡΙΣΜΟΥ ΔΕΙΓΜΑΤΙΚΩΝ ΒΑΡΩΝ Εξ ορισμού το δειγματικό βάρος d (όπου το d αναφέρεται στο δείγμα) για μία δειγματοληπτική μονάδα είναι ο αριθμός των μονάδων του πληθυσμού που αντιπροσωπεύει κάθε μονάδα του δείγματος και ισούται με το αντίστροφο της πιθανότητας επιλογής, p, αυτής της μονάδας στο δείγμα. Πρέπει να τονίσουμε πως όταν πρόκειται για πολυσταδιακά ή πολυφασικά δειγματοληπτικά σχέδια η πιθανότητα εκλογής στο δείγμα μιας μονάδας του πληθυσμού είναι το γινόμενο των επιμέρους πιθανοτήτων επιλογής σε κάθε στάδιο ή φάση, μιας μονάδας, στο δείγμα. Έτσι, για ένα δείγμα το οποίο συλλέγεται με δισταδιακή δειγματοληψία όπου p 1 : είναι η πιθανότητα επιλογής μιας μονάδας στο δείγμα στο πρώτο στάδιο και - 125 -
p 2 : είναι η πιθανότητα επιλογής μιας μονάδας στο δείγμα στο δεύτερο στάδιο τότε το δειγματικό βάρος για τις μονάδες του δείγματος είναι ίσο με: (1/ p ) (1/ p ) d 1 2 Όταν τα δειγματικά βάρη είναι ίδια για όλες τις μονάδες του δείγματος, τα δειγματοληπτικά σχέδια, ονομάζονται αυτοσταθμιζόμενα (self-eghtng). Για παράδειγμα: Τα δειγματοληπτικά σχέδια με ατδ, ατδε και συστηματική δειγματοληψία είναι αυτοσταθμιζόμενα, διότι κάθε μονάδα του πληθυσμού (μεγέθους Ν) έχει πιθανότητα επιλογής στο δείγμα n / N. Στη δισταδιακή κατά συστάδες δειγματοληψία με πιθανότητες επιλογής ανάλογες των μεγεθών ( M ) των συστάδων, όταν κατά το πρώτο στάδιο επιλέγονται n συστάδες και στη συνέχεια σταθερό πλήθος β m / n στοιχείων με ατδ (ή συστηματική) από κάθε συστάδα όπου m το τελικό μέγεθος δείγματος τότε η πιθανότητα επιλογής στο δείγμα οποιασδήποτε μονάδας του πληθυσμού είναι nm ( / M)( / M) n / M m/ M=σταθερό, δηλαδή αυτοσταθμιζόμενη. 4. ΣΤΑΘΜΙΣΗ ΚΑΤΑ ΤΟ ΣΧΕΔΙΑΣΜΟ ΚΑΙ ΕΚ ΤΩΝ ΥΣΤΕΡΩΝ ΣΤΡΩΜΑΤΟΠΟΙΗΣΗ Στις περισσότερες εφαρμογές στάθμισης σε δειγματοληπτικές έρευνες χρησιμοποιούνται δύο είδη στάθμισης (Lu and Gelman (2003)). Βάρη ανάλογα της αντίστροφης πιθανότητας: Τα βάρη είναι γνωστά πριν τη διεξαγωγή της έρευνας (κατά τον σχεδιασμό της έρευνας) Χρησιμοποιούνται για τη διόρθωση άνισων πιθανοτήτων επιλογής Ενίοτε καθορίζονται από τον ερευνητή π.χ. σε σχήματα με πιθανότητα ανάλογη του μεγέθους Εκ των υστέρων στρωματοποίηση: Τα βάρη καθορίζονται μετά τη διεξαγωγή της έρευνας (μετά τη συλλογή των δεδομένων) Χρησιμοποιούνται για τη διόρθωση γνωστών διαφορών μεταξύ πληθυσμού και δείγματος. Το δειγματικό βάρος που προσαρμόζει τα δεδομένα μας ως προς τη μη-απόκριση στα αυτοσταθμιζόμενα δειγματοληπτικά σχέδια είναι : ( n/ n ) nr d r όπου n : είναι το μέγεθος του δείγματος και n r : είναι ο αριθμός των ατόμων του δείγματος που αποκρίθηκαν στην έρευνα. Το δειγματικό βάρος που προσαρμόζει τα δεδομένα μας όταν χρησιμοποιούμε την εκ των υστέρων στρωματοποίηση είναι : - 126 -
( N / N ) pst όπου Ν: είναι ο αριθμός των μονάδων του πληθυσμού στο εκ των υστέρων στρώμα και N : είναι ο εκτιμώμενος αριθμός των μονάδων του πληθυσμού στο εκ των υστέρων στρώμα. 5. ΕΚΤΙΜΗΣΗ ΔΙΑΣΠΟΡΑΣ ΣΤΑΘΜΙΚΩΝ ΕΚΤΙΜΗΤΡΙΩΝ Παρόλο που οι παραπάνω μέθοδοι στάθμισης χρησιμοποιούνται ευρέως, είναι δύ- Γενικά οι διασπορές αυτών των εκτιμητριών εξαρτώνται από τη μέθοδο που χρησι- σκολο να υπολογιστούν οι δειγματικές διασπορές για τις σταθμισμένες εκτιμήτριες. μοποιείται για τη στάθμιση των δεδομένων και όχι από την αριθμητική τιμή των δειγματικών βαρών. Για παράδειγμα: Έστω ότι ένας πληθυσμός ο οποίος χωρίζεται σε στρώματα χρησιμοποιώντας εκ των προτέρων ή εκ των υστέρων στρωματοποίηση με N στοιχεία σε κάθε στρώμα στον πληθυσμού, 1,2,..., και με n στοιχεία στο κάθε στρώμα στο δείγμα, 1,2,..., Έστω επίσης ότι οι τιμές ενός χαρα κτηριστικού y συμβολίζονται με Y στον πληθυ- Όπου N N και 1 n. 1 n σμό 1,2,..., N και y στο δείγμα, πληθυσμιακός μέσος, όπου W N N. / nr 1,..., n και έστω Y 1 Y W Y ο N 1 1 Έστω p η πιθανότητα ε πιλογής κάθε μονάδας του πληθυσμού στο στρώμα, να επιλεγεί στο δείγμα. Η πιθανότητα αυτή μπορεί να είναι γνωστή (κατά το σχεδιασμό της έρευνας) ή άγνωστη όταν έχουμε μη-ανταπόκριση οπότε πρέπει να εκτιμηθεί. Ενδιαφερόμαστε για εκτιμήτριες της μορφής Εάν Y y y, τότε Y W 1 Y και τα βάρη W εξαρτώνται μόνο από τα n και N και όχι από τα n n / 1 1 1 Y y W y y όπου / ( ) W() n είναι το βάρος των στοιχείων/μονάδων στο στρώμα.. - 127 -
Στην περίπτωση της αντίστροφης-πιθανότητας n / p W για 1,2,..., και n / p 1 1 1/ p n / p για 1,2,..., n. Στην περίπτωση της εκ των υστέρων στρωματοποίησης W N / N για 1,2,..., και N / Nn ( ) για 1,2,..., n. () Επειδή στην εκ των υστέρων στρωματοποίηση τα n είναι τυχαίες μεταβλητές, εμφανίζεται το πρόβλημα της εκτίμησης της διασπορ άς της y. Επειδή (βλ. Holt and Smth (1979), Δαμιανού (2007 p. 182)), ι 2 S ω ι ω 2 V ( y E W V WY ) E[ V ( y n ] V[ E( y n )] = ε + = 1 n κε ϊ κλ ϊϋ λ= 1 ϋ και αναπτύσσοντας κατά Taylor, έχουμε 1 f 2 1 f 2 V ( y) W S (1 W ) S 2 n n 2 1 1 όπου f = n/ N και S η διασπορά στο στρώμα. Για την εκτίμηση τ ης διασποράς V y ) έχουν προταθεί πολλές τεχνικές μεταξύ ( των οποίων και οι παρακάτω: Υποθέτοντας ότι η επιλογή του δείγματος γίνεται με α.τ.δ. και ότι το άθροισμα των δειγματικών βαρών ισούται με τη μονάδα ( = 1), τότε η εκτιμήτρια της διασποράς V ( y ) γίνεται (βλ. Lu and Gelman ((2003), p. 139) ζ n φζ n φ 2 2 V( y )» ( y- y ) ηε χηε θ ψθ ψ χ = 1 = 1 Υποθέτοντας τα βάρη να είναι αντίστροφα της πιθανότητας επιλογής, τότε n ε = 1 n 2 2 = HT = ε - = 1 V( y ) V ( y ) ( y y ) Χρησιμοποιώντας τη μέθοδο (αλγόριθμο) BWO (Wthout Replacement Bootstrap), του Stter (1992) B 1 * * 2 V Bo ot ( y) = ε ( yb - y) - 1 B b= 1-128 -
όπου * * * 1, y2,..., yb y τα αντίγραφα bootstrap, 1 B * = ε και Β ο αριθμός των B b = 1 y y b επαναλήψεων. 6. ΕΦΑΡΜΟΓΗ Δημιουργήσαμε με τη βοήθεια ενός προγράμματος που φτιάξαμε στο stata, ένα προσομοιωμένο σύνολο δεδομένων χρησιμοποιώντας τη λογαριθμοκανονική κατανομή με μέσο 10 και διασπορά 100. Ο πληθυσμός τον οποίο δημιουργήσαμε αποτελείται από 1000 παρατηρήσεις τις οποίες αφού τις ταξινομήσαμε σε αύξουσα σειρά τις χωρίσαμε σε 5 στρώματα έτσι ώστε τα δεδομένα να είναι όσο το δυνατόν πιο ομοιογενή σε κάθε στρώμα. Οπότε το πρώτο στρώμα αποτελείται από 180 παρατηρήσεις, το δεύτερο από 210, το τρίτο από 250, το τέταρτο από 160 και το πέμπτο και τελευταίο στρώμα από 200 παρατηρήσεις. Από τον συνολικό πληθυσμό μεγέθους Ν=1000 έχουμε πάρει δείγματα μεγέθους n=50 (5%), n=100 (10%) και n=200 (20%) και για καθένα από αυτά πήραμε Β=100 και Β=200 αντίγραφα bootstrap. Οι εκτιμήσεις της πληθυσμιακής μέσης τιμής και τα αντίστοιχα τυπικά σφάλματα χρησιμοποιώντας σταθμισμένη και μη σταθμισμένη ανάλυση δίνονται στον παρακάτω Πίνακα 1. Έπειτα για κάθε δείγμα υπολογίσαμε την επίδραση του σχεδίου με το σταθμισμένο μέσο έναντι του σχεδίου με το μη σταθμισμένο μέσο (deff1) και την επίδραση του σχεδίου (deff2) όπως δίνονται από τους τύπους: deff 1 = V ( y )/ Var( y), deff 2 = V ( y )/ Var ( y). Στον πίνακα δίνονται οι μέσες τιμές των deff1 για τα αντίστοιχα αντίγραφα bootstrap. Υπολογίσαμε επίσης το δεσμευμένο μέσο τετραγωνικό σφάλμα της σταθμισμένης εκτιμήτριας του μέσου όπως δίνεται από τον παρακάτω τύπο (βλ. Δαμιανού (2006), σ.186 ): n n s N n MSE( y n) ( ) (1 ) { y ( )} 5 2 5 2 2 1 n N n 1 N n 2 όπου n το μέγεθος του δείγματος, s η δειγματική διασπορά και μέσος του στρώματος, αντίστοιχα, =1, 2, 3, 4, 5. y ο δειγματικός Όπως παρατηρούμε από τον πίνακα, οι εκτιμήσεις της πραγματικής μέσης τιμής (9,92) είναι ελάχιστα καλύτερες στη σταθμισμένη εκτίμηση και για Β=200 αντίγραφα bootstrap. Tα τυπικά σφάλματα μειώνονται όσο το μέγεθος δείγματος μεγαλώνει. Το τυπικό σφάλμα της εκτιμήτριας με σταθμισμένη μέθοδο χρησιμοποιώντας Β=200 αντίγραφα bootstraps ελαττώνεται σημαντικά σε αντίθεση με τα Β=100 αντίγραφα. Οι επιδράσεις των δειγματοληπτικών σχεδίων με τους σταθμισμένους μέσους έναντι - 129 -
του μη σταθμισμένου μέσου παραμένει περίπου η ίδια για τα διάφορα δείγματα που έχουν επιλεγεί. για διά- Πίνακας 1. Εκτίμηση πληθυσμιακού μέσου και τυπικού σφάλματος φορα n και Β με στάθμιση ( y) και χωρίς στάθμιση ( y ). Μη Σταθμισμένη ανάλυση Σταθμισμένη Εκ των υστέρων Μέθοδος ανάλυση στρωματοποίηση Bootstrap n B y S.E. ( SE..) y SE. ( y ) SE. ( y ) M SE E(deff1) deff2 50 100 9,74 1,310 9,84 0,719 0,755 105,74 0,29 0,36 100 100 10,01 0,992 9,87 0,556 0,855 202,09 0,31 0,35 200 100 10,06 0,728 9,96 0,405 0,829 104,76 0,31 0,33 50 200 9,87 1,380 9,97 0,818 0,537 421,77 0,33 0,45 100 200 9,94 1,005 9,95 0,592 0,538 3,87 0,34 0,40 200 200 9,97 0,724 9,93 0,409 0,493 53,24 0,31 0,34 ABSTRACT The role of eghts n samplng research as ell as the ay of ther applcaton s a subect hch occupes statstcans over the last years. In the present ork e menton the reasons hch lead us to the use of eghts n the basc methods of evaluaton and estmaton. An applcaton of re-eghtng procedures usng post-stratfcaton and the Wthout Replacement Bootstrap algorthm s also gven. ΑΝΑΦΟΡΕΣ Δαμιανού, Χ. (2007). Μεθοδολογία δειγματοληψίας τεχνικές και εφαρμογές. Εκδόσεις σοφία, Θεσσαλονίκη. Gelman, A. (2007) Struggles th survey eghtng and regresson modelng, Statstcal Scence, (th dscusson), 22 (2), pp 153-164. Holt, D. and Smth, T.M.F. (1979). Post stratfcaton. ournal of the Royal Stat. Soc. Ser. A-Stat. Soc., 142, pp 36-46. Korn, E. and Graubard, B. (1995) Examples of dfferng eghted and uneghted estmates from a sample survey. Amercan Statstcan, 49(3), pp 291-295. Lessler,.T. and Kalsbeek, W.D. (1992). Nonsamplng errors n surveys. ohn Wley & Sons, Ne York. Lu, H. and Gelman, A. (2003). A method for estmatng samplng varances for surveys th eghtng, poststratfcaton, and rakng. ournal of Offcal Statstcs 19, (2). pp 133-151. Stter, R.R.(1992). Comparng three Bootstrap methods for survey data. The Canadan ournal of Statstcs, 20 (2), pp 135-154. - 130 -