Εισαγωγή στην Εκτιμητική
Πληθυσμός Εκτίμηση παραμέτρου πληθυσμού μ, σ 2, σ, p Δείγμα Υπολογισμός στατιστικού Ερώτηματα: Πόσο κοντά στην πραγματική τιμή της παραμέτρου του πληθυσμού βρίσκεται η εκτίμηση του δείγματος (στατιστικό); Ποιο είναι το μέγεθος του σφάλματος; x, s 2, s, p Υπάρχει υπερεκτίμηση ή υποεκτίμηση της άγνωστης παραμέτρου του πληθυσμού;
Πληθυσμός κ δείγματα μεγέθους n μ χ 1 χ 2 χ 4 χ κ χ 3 Η κατανομή των μέσων αριθμητικών των κ δειγμάτων αποτελεί την κατανομή δειγματοληψίας των δειγματικών μέσων. Όσο αυξάνει το μέγεθος n η κατανομή αυτή προσεγγίζει την κανονική κατανομή με μέση τιμή Ε(x) και τυπική απόκλιση ** Συνήθως το σ είναι άγνωστο και αντικαθίσταται από το s σ x (τυπικό σφάλμα του μέσου) Κεντρικό οριακό θεώρημα : Όποια και αν είναι η κατανομή του πληθυσμού ως προς την μεταβλητή x οι δειγματικοί μέσοι ακολουθούν την κανονική κατανομή. n
Επιγραμματικά: Ο πληθυσμός είναι κανονικός -- Η κατανομή δειγματοληψίας του μέσου είναι κανονική ανεξάρτητα από το μέγεθος του δείγματος. Η κατανομή του πληθυσμού είναι περίπου συμμετρική -- Η κατανομή δειγματοληψίας του μέσου προσεγγίζει την κανονική κατανομή για δείγματα μεγέθους τουλάχιστον 15 παρατηρήσεων (n > 15). Ανεξάρτητα από την κατανομή του πληθυσμού -- Η κατανομή δειγματοληψίας του μέσου προσεγγίζει την κανονική κατανομή για δείγματα μεγέθους τουλάχιστον 30 παρατηρήσεων (n > 30).
Παρaδείγματα Οι βαθμοί των εξετάσεων κατανέμονται κανονικά με μέση τιμή μ = 5 και τυπική απόκλιση σ = 1. Ποια είναι η πιθανότητα ένας φοιτητής να πάρει βαθμό μεγαλύτερο από 6.5; Η μέση βαθμολογία μιας τάξης 20 φοιτητών να είναι μεγαλύτερη από 6.5; 6.5 5 P ( x 6.5) P ( z ) P ( z 1.5) 1 P ( z 1.5) 0.0668 6.68% 1 6.5 5 P ( x 6.5) P ( z ) P ( z 6.7) 1 P ( z 6.7) 1/ 20 Ένα εξάρτημα ιατρικού μηχανήματος έχει κατά μέσο όρο 500 ώρες διάρκεια λειτουργίας με τυπική απόκλιση 200 ώρες. Αν ελέγξουμε ένα δείγμα από 16 εξαρτήματα, ποια είναι η πιθανότητα η μέση τιμή της διάρκειας λειτουργίας του δείγματος να είναι μικρότερη από 460 ώρες; x N (500,50), / n 200/ 4 50 460 500 P ( x 460) P ( z ) P ( z 0.8) 0.2119 21.19% 50
Κατανομή δειγματοληψίας ποσοστού (ή αναλογίας) Έστω p η αναλογία ή ποσοστό «επιτυχιών» στον πληθυσμό και p η αναλογία των επιτυχιών στο δείγμα π.χ. αναλογία ή ποσοστό των ατόμων που δηλώνουν προτίμηση για ένα προϊόν. Η αναλογία (ή ποσοστό) μεταβάλλεται σε κάθε δείγμα και αποτελεί τυχαία μεταβλητή της οποίας η κατανομή είναι διωνυμική. Όταν το μέγεθος του δείγματος αυξάνει (n>30) η κατανομή πιθανότητας του p προσεγγίζει την κανονική και ισχύει: (1 ) p' N p, p p n Σ ένα πληθυσμό το 40% ψηφίζει το κόμμα Α και το 60% το κόμμα Β. Ποια είναι η πιθανότητα σε τυχαίο δείγμα 100 ατόμων η πλειοψηφία να ψηφίζει το κόμμα Α. 0.4 0.5 P ( p' 0.5) P ( z ) P ( z 2) 1 P ( z 2) 0.023 (0.4x 0.6)/100
Διαστήματα εμπιστοσύνης Έστω θ η τιμή μιας παραμέτρου του πληθυσμού. Με βάση τα δεδομένα ενός δείγματος προσδιορίζεται ένα διάστημα (z 1, z 2 ) το οποίο περιέχει την παράμετρο θ που θέλουμε να εκτιμήσουμε με μια καθορισμένη εκ των προτέρων πιθανότητα, δηλαδή P(z 1 <θ<z 2 ) = 1-α. Διάστημα Εμπιστοσύνης (Confidence Interval): το διάστημα (z 1, z 2 ) Όρια εμπιστοσύνης του διαστήματος (Confidence limits): τα z 1, z 2 Επίπεδο εμπιστοσύνης (level of confidence): η πιθανότητα 1-α Επίπεδο σημαντικότητας (Significance level): το α
Διαστήματα εμπιστοσύνης της μέσης τιμής Περίπτωση που η διακύμανση σ 2 είναι γνωστή x z, x z n a /2 a /2 n z a/2 : η κριτική τιμή της τυποποιημένης κανονικής κατανομής που αντιστοιχεί σε επίπεδο σημαντικότητας α. P x za /2 x za /2 1 a n n π.χ. αν α=0.05, η πιθανότητα το διάστημα εμπιστοσύνης να περιέχει την άγνωστη μέση τιμή είναι 0.95 z z 1.96 και z z 1.96 0.05/2 0.025 1 0.05/2 0.975
1-α α/2 α/2
Παράδειγμα Μία εταιρία κατασκευής ιατρικών παρασκευασμάτων παίρνει δείγμα για την ζήτηση των παρασκευασμάτων της κατά την διάρκεια 25 εβδομάδων που θεωρούνται οι σημαντικότερες για τις πωλήσεις της: 235 374 309 499 253 421 361 514 462 369 394 439 348 344 330 261 374 302 466 535 386 316 296 332 334 Είναι γνωστό ότι η τυπική απόκλιση της ζήτησης κατά την περίοδο αυτή είναι 75 παρασκευάσματα. Θέλουμε να εκτιμήσουμε την μέση τιμή της ζήτησης με 95% εμπιστοσύνη με σκοπό να εκτιμήσουμε επίπεδα αποθεμάτων.
Η καταγεγραμμένη ζήτηση των 25 εβδομάδων αποτελεί ένα δείγμα της ζήτησης. Η παράμετρος που πρέπει να εκτιμηθεί είναι η μέση τιμή του πληθυσμού: μ Από τα δεδομένα x 370.16 Επομένως Τα κάτω και άνω όρια εμπιστοσύνης είναι 340.76 and 399.56
Το εύρος ενός διαστήματος εμπιστοσύνης εξαρτάται από το επιπέδου εμπιστοσύνης, την τυπική απόκλιση του πληθυσμού, και το μέγεθος του δείγματος.