Περιεχόμενα της Ενότητας Στατιστική ΙI Ενότητα 1: Δειγματοληψία και Κατανομές Δειγματοληψίας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 1. ειγµατοληψία Πιθανοτικές και µη πιθανοτικές µέθοδοι 2. Εκτιµητές, σηµειακές εκτιµήσεις, σφάλµα δειγµατοληψίας 3. Κατανοµές ειγµατοληψίας (µέσου, αναλογίας) 4. Περιγραφή της σχέσης Κατανοµών Πληθυσµού και Κατανοµών ειγµατοληψίας 5. Ιδιότητες σηµειακών εκτιµητών 6. Κεντρικό Οριακό Θεώρημα 7. Επίλυση Προβληµάτων Κατανοµών ειγµατοληψίας Χ. Εμμανουηλίδης, cemman@econ.auth.gr 1 Δειγματοληψία Δειγματοληψία ειγµατοληψία: Η διαδικασία επιλογής δείγµατος από έναν πληθυσµό. Στόχος είναι η εκτίµηση των τιµών παραµέτρων του πληθυσµού (π.χ. µέση τιµή, αναλογία, διακύµανση). Απαραίτητη γιατί συνήθως δεν είναι δυνατό να γίνουν µετρήσεις σε όλα τα στοιχεία (µονάδες) ενός πληθυσµού. Ο πληθυσµός µπορεί να είναι άπειρος ή πολύ µεγάλου µεγέθους Ο πληθυσµός µπορεί να είναι θεωρητικός (π.χ. οι µονάδες που τον απαρτίζουν είναι µέρος µιας διαδικασίας σε εξέλιξη) Περιορισµοί χρόνου και οικονοµικού κόστους Η µέτρηση µπορεί να συνεπάγεται καταστροφή των µονάδων Δειγματοληψία Τα δείγµατα επιλέγονται από έναν πληθυσµό στατιστικών µονάδων µε χρήση ενός δειγµατικού πλαισίου, δηλαδή µιας λίστας συστηµατικής καταγραφής των µονάδων που απαρτίζουν τον πληθυσµό, π.χ. δίνοντας έναν αριθµό (από1 έως Ν) σε κάθε µονάδα. ύο τύποι δειγµάτων: Πιθανοτικά (ή τυχαία) δείγµατα: οι δειγµατικές µονάδες επιλέγονται µε χρήση ενός µοντέλου πιθανότητας, π.χ. µε έναν πίνακα τυχαίων αριθµών που προκύπτουν από µια οµοιόµορφη κατανοµή πιθανότητας Μη πιθανοτικά δείγµατα: τα δείγµατα επιλέγονται µε µη τυχαίο τρόπο είγµατα ευκολίας: επιλογή µε βάση την ευκολία προσέγγισης των δειγµατικών µονάδων είγµατα που επιλέγονται µε βάση την κρίση του αναλυτή Τυχαία Δειγματοληψία Συνηθέστερα είδη τυχαίας δειγματοληψίας Απλή τυχαία δειγµατοληψία Σ ή δ λ ψί Συστηµατική δειγµατοληψία Στρωµατοποιηµένη δειγµατοληψία ειγµατοληψία κατά συστάδες Χ. Εμμανουηλίδης, cemman@econ.auth.gr 1
Χ. Εμμανουηλίδης, cemman@econ.auth.gr 2
Χ. Εμμανουηλίδης, cemman@econ.auth.gr 3
Χ. Εμμανουηλίδης, cemman@econ.auth.gr 4
Παράμετροι και Εκτιμητές Χ. Εμμανουηλίδης, cemman@econ.auth.gr 5
Σημειακή Εκτίμηση και Σφάλμα Δειγματοληψίας Παράδειγμα: Εισοδήματα Δύο τρόποι για να λάβουμε τις πληροφορίες αυτές. Α φή 250 ζ έ Απογραφή και των 250 εργαζομένων Επιλογή τυχαίου δείγματος εργαζομένων με μέγεθος n (έστω n=30) Χ. Εμμανουηλίδης, cemman@econ.auth.gr 6
Χ. Εμμανουηλίδης, cemman@econ.auth.gr 7
s p Κατανομές Δειγματοληψίας (μια τιμή της Χ για καθεμιά από τις 4 ημέρες) N i i1 2.5 N i1 i 2 1.12 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 8
1η 2η Παρατήρηση Παρ. 1 2 3 4 1 1,1 1,2 1,3 1,4 2 2,1 2,2 2,3 2,4 3 3,1 3,2 3,3 3,4 4 4,1 4,2 4,3 4,4 1η 2η Παρατήρηση Παρ. 1 2 3 4 1 1,1 1,2 1,3 1,4 2 2,1 2,2 2,3 2,4 3 3,1 3,2 3,3 3,4 4 4,1 4,2 4,3 4,4 1η 2η Παρατήρηση Παρ. 1 2 3 4 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 1η 2η Παρατήρηση Παρ. 1 2 3 4 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 N 16 N i i1 10 1.0 1.5... 4.0 40 2.5 16 N i1 i 2 12.5 12.5... 4 2.5 2 2 2 16 0.79 Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) 2.5 1.12 2.5 0.79 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 9
Κεντρικό Οριακό Θεώρημα Κ.Ο.Θ.: Αν οι Χ 1, Χ 2,,Χ n είναι ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με μέση τιμή μ και πεπερασμένη διακύμανση σ 2, και n S είναι το άθροισμάτους και i i1 S ο αριθμητικός τους μέσος, n τότε όσο αυξάνει ο αριθμός n των τ.μ. Χ 2 S ~ N n, n 2 ~ N, n Κεντρικό Οριακό Θεώρημα Παρατηρείστε ότι η κατανομή του μέσου προσεγγίζει την κανονική κατανομή όσο το πλήθος n των ανεξάρτητων και ισόνομων μεταβλητών Χ αυξάνει, ανεξάρτητα από την κατανομή της Χ. Πρακτικά, για τον μέσο, αρκεί n 30 Κεντρικό Οριακό Θεώρημα Σημασία του Κ.Ο.Θ. Ανεξάρτητα από την κατανομή των ανεξάρτητων και ισόνομων τ.μ. Χ i, το άθροισμα και ο αριθμητικός τους μέσος ακολουθούν την κανονική κατανομή ασυμπτωτικά, δηλαδή όσο αυξάνει το πλήθος τους. Το ΚΟΘ εξηγεί: το ότι πολλές τυχαίες μεταβλητές ακολουθούν στην πράξη την κανονική κατανομή το ότι σημαντικές κατανομές μπορούν να προσεγγιστούν από την κανονική κατανομή την ευρύτατη χρήση της κανονικής κατανομής στη δειγματοληψία την ευρύτατη χρήση της κανονικής κατανομής στην στατιστική συμπερασματολογία. Κατανομή Δειγματοληψίας του Μέσου ( ) Nn n N 1 n ( Nn) ( N1) Χ. Εμμανουηλίδης, cemman@econ.auth.gr 10
80 14.6 n 30 14 14.6 E 990 14 14.6 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 11
E E 990 8.0 14.6 80 8.0 n 100 E 990 8.0 Επίλυση 7.8 8 Άνω όριο z 0.50 n 2 25 8.2 8 Κάτω όριο z 0.50 n 2 25 Κατανομή Τυποιημένη Δειγματοληψίας Κανονική Κατανομή =.4 = 1 0.3830 7.8 8 8.2 -.50 0.50 Z Χ. Εμμανουηλίδης, cemman@econ.auth.gr 12
Κατανομή Δειγματοληψίας της Αναλογίας pˆ ( pˆ ) p ˆ p pˆ p 1 p Nn n N1 p 1 p n ( Nn) ( N1) Χ. Εμμανουηλίδης, cemman@econ.auth.gr 13
Ιδιότητες Σημειακών Εκτιμητών Χ. Εμμανουηλίδης, cemman@econ.auth.gr 14
Μέσος πληθυσμού Μέσος πληθυσμού Τέλος Ενότητας Στατιστική Ι, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης, cemman@econ.auth.gr 89 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 15