ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ Κεφάλαιο 12 Εκτίμηση των παραμέτρων ενός πληθυσμού Copyright 2009 Cengage Learning
Εκτιμητική σχετικά με έναν πληθυσμό Πληθυσμός Δείγμα Συμπέρασμα Παράμετρος Στατιστική Θα αναπτύξουμε τεχνικές προκειμένου να εκτιμηθούν ελεγχθούν πληθυσμιακοί παράμετροι: Πληθυσμιακός μέσος αριθμητικός Πληθυσμιακή αναλογία p Copyright 2009 Cengage Learning 12.2
Εκτιμητική όταν η διακύμανση σ είναι άγνωστη Στα προηγούμενα κεφάλαια είδαμε τρόπους εκτίμησης & ελέγχου του μέσου ενός πληθυσμού όταν η διακύμανσή του & η τυπική απόκλισή του ήταν γνωστή. Συγκεκριμένα τόσο ο εκτιμητής διαστήματος όσο και ο έλεγχος υπόθεσης υπολογίστηκαν από τον τύπο: Αλλά πόσο ρεαλιστικό είναι να γνωρίζουμε την πληθυσμιακή διακύμανση? Η απάντηση είναι ΟΧΙ! Για το λόγο αυτό, χρησιμοποιούμε τον στατιστικό έλεγχο Student t, που δίνεται από τον τύπο: Copyright 2009 Cengage Learning 12.3
Εκτιμητική όταν η διακύμανση σ είναι άγνωστη Όταν σ άγνωστη τότε χρησιμοποιούμε τον σημειακό εκτιμητή της s και ο z- έλεγχος αντικαθίσταται από τον t-έλεγχο, που ακολουθεί την κατανομή student t με ν = n-1 βαθμούς ελευθερίας. Ανάλογα ο εκτιμητής διαστήματος εμπιστοσύνης του πληθυσμιακού μέσου μ δίνεται από τον τύπο: x t / 2 s n Copyright 2009 Cengage Learning 12.4
Έλεγχος μ όταν σ άγνωστο 1.Έλεγχος υποθέσεων. Όταν η πληθυσμιακή τυπική απόκλιση είναι άγνωστη και ο πληθυσμός ακολουθεί την κανονική κατανομή, ο έλεγχος υποθέσεων για τον πληθυσμιακό μέσο μ υπολογίζεται από τον τύπο: και ακολουθεί την κατανομή student t με ν = n-1 βαθμούς ελευθερίας 2.Εκτιμητής διαστήματος εμπιστοσύνης. Όταν η πληθυσμιακή τυπική απόκλιση είναι άγνωστη και ο πληθυσμός ακολουθεί την κανονική κατανομή, ο εκτιμητής διαστήματος του πληθυσμιακού μέσου μ υπολογίζεται από τον τύπο: Copyright 2009 Cengage Learning 12.5
Έλεγχος και Διαστήματα Εμπιστοσύνης όταν τυπική απόκλιση γνωστή ή άγνωστη Έλεγχος υπόθεσης για τον μέσο πληθυσμού, όταν η τυπική απόκλιση είναι γνωστή z x n Έλεγχος υπόθεσης για τον μέσο πληθυσμού, όταν η τυπική απόκλιση είναι άγνωστη t x s n Εκτιμητής διαστήματος εμπιστοσύνης του μέσου όταν η τυπική απόκλιση είναι γνωστή x z 2 n Εκτιμητής διαστήματος εμπιστοσύνης για τον μέσο πληθυσμού, όταν η τυπική απόκλιση είναι άγνωστη x t 2 s n Copyright 2009 Cengage Learning 12.6
Παράδειγμα 12.1 Στο κοντινό μέλλον όλες οι χώρες θα χρειαστεί να λάβουν μέτρα για την προστασία του περιβάλλοντος. Πιθανές δράσεις ο περιορισμός της κατανάλωσης ενέργειας και η ανακύκλωση, Σήμερα τα περισσότερα προϊόντα που παράγονται από ανακυκλωμένα υλικά είναι σημαντικά ακριβότερα σε σχέση με αυτά που κατασκευάζονται με παραδοσιακές τεχνικές. Copyright 2009 Cengage Learning 12.7
Παράδειγμα 12.1 Οι εφημερίδες αποτελούν εξαίρεση. Είναι επικερδές η ανακύκλωση εφημερίδων. Η σημαντικότερη πηγή κόστους στην ανακύκλωση εφημερίδων αποτελεί η συλλογή τους από τα νοικοκυριά και τελευταίως έχουν εμφανιστεί αρκετές εταιρίες που δραστηριοποιούνται στον τομέα αυτό. Ο οικονομικός αναλυτής μιας τέτοιας εταιρίας υπολόγισε ότι για να είναι κερδοφόρα μια τέτοια δράση θα πρέπει η μέση εβδομαδιαία ποσότητα να είναι μεγαλύτερη από 2 λίβρες (0,9 kg) ανά νοικοκυριό. Copyright 2009 Cengage Learning 12.8
Παράδειγμα 12.1 Έτσι στα πλαίσια της μελέτης σκοπιμότητας για την κατασκευή ενός νέου κέντρου συλλογής η εταιρία επέλεξε ένα τυχαίο δείγμα 148 νοικοκυριών της περιοχής και κατέγραψε το βάρος (σε λίβρες) των εφημερίδων που απέρριψε κάθε νοικοκυριό του δείγματος κατά την διάρκεια μιας εβδομάδας. Xm12-01* Μπορούμε από τα στοιχεία να συμπεράνουμε ότι το σχεδιαζόμενο νέο κέντρο συλλογής εφημερίδων για ανακύκλωση θα είναι κερδοφόρο. Copyright 2009 Cengage Learning 12.9
Παράδειγμα 12.1 ΚΑΘΟΡΙΣΜΟΣ Το ζητούμενο είναι ο έλεγχος μια υπόθεσης για τον μέσο του βάρους των εφημερίδων που μπορεί να ανακυκλώσουν τα νοικοκυριά της περιοχής. Έτσι η υπό έλεγχο παράμετρος είναι ο πληθυσμιακός μέσος μ Θέλουμε να γνωρίσουμε εάν υπάρχει επαρκείς αποδείξεις για να συμπεράνουμε ότι ο μέσος είναι μεγαλύτερος του 2. Συνεπώς, H 1 : µ > 2 Η μηδενική υπόθεση ως συνήθως: H 0 : µ = 2 Copyright 2009 Cengage Learning 12.10
Παράδειγμα 12.1 ΚΑΘΟΡΙΣΜΟΣ Επειδή η τυπική απόκλιση σ του πληθυσμού είναι άγνωστη θα χρησιμοποιηθεί ο έλεγχος t : x t s / n ν = n 1=148-1=147 Επειδή η εναλλακτική υπόθεση είναι: H 1 : µ > 2 Η περιοχή απόρριψης γίνεται για α=0,01: t t t.01,148 t.01, 150, 2.351 Example 12.1 Manual Calculations Copyright 2009 Cengage Learning 12.11
Παράδειγμα 12.1 ΚΑΘΟΡΙΣΜΟΣ Υπολογισμοί: x n 2,5 0,7... 2,6 148 3,1 322,7 148 i i 1 n x 2,18 = 0,962 & = 0,981 t x s / n 2,18 0,981/ 2 148 2,24 Copyright 2009 Cengage Learning 12.12
Παράδειγμα 12.1 ΥΠΟΛΟΓΙΣΜΟΣ Click Add-Ins, Data Analysis Plus, t-test: Mean Copyright 2009 Cengage Learning 12.13
Παράδειγμα 12.1 ΥΠΟΛΟΓΙΣΜΟΣ 1 2 3 4 5 6 7 8 9 10 11 12 A B C D t-test: Mean Newspaper Mean 2.18 Standard Deviation 0.98 Hypothesized Mean 2 df 147 t Stat 2.24 P(T<=t) one-tail 0.0134 t Critical one-tail 1.6553 P(T<=t) two-tail 0.0268 t Critical : two-tail 1.9762 : Copyright 2009 Cengage Learning 12.14
Παράδειγμα 12.1 ΕΡΜΗΝΕΙΑ Η τιμή του στατιστικού ελέγχου t = 2.24 και η αντίστοιχη p- τιμή είναι.0134. Συνεπώς δεν υπάρχουν επαρκείς αποδείξεις ώστε να συμπεράνουμε ότι το μέσο βάρος των εφημερίδων προς απόρριψη είναι μεγαλύτερο των 2.0 λιβρών. Παρατηρήστε ότι υπάρχει κάποια ένδειξη, η p-τιμή είναι 0.0134. Ωστόσο, επειδή θέλαμε να είμαστε πολύ σίγουροι για το συμπέρασμα ορίστηκε ως α = 0,01 Έτσι, δεν καταλήγουμε στο συμπέρασμα ότι το εργοστάσιο ανακύκλωσης θα ήταν κερδοφόρο. Copyright 2009 Cengage Learning 12.15
Παράδειγμα 12.2 To 2004 (το πιο πρόσφατο έτος για το οποίο υπάρχουν στοιχεία) υποβλήθηκαν στις Η.Π.Α. 130.134.000 φορολογικές δηλώσεις. Η υπηρεσία φορολογικών ελέγχων ΙRS (Internal Revenue Service) πραγματοποίησε έλεγχο στο 0.77% των δηλώσεων (1.008.000 δηλώσεις). Σε πολλές περιπτώσεις διαπιστώθηκαν λάθη και βεβαιώθηκαν πρόσθετοι φόροι. Για να εκτιμήσει τη μέση απώλεια φόρων από λάθη στις φορολογικές δηλώσεις, το υπουργείο οικονομικών επέλεξε ένα τυχαίο δείγμα δηλώσεων και κατέγραψε το ποσό του βεβαιωμένου πρόσθετου φόρου. Xm12-02 Να εκτιμηθεί με στάθμη εμπιστοσύνης 95% ο μέσος πρόσθετος φόρος των 1.008.000 ελεγμένων δηλώσεων. Copyright 2009 Cengage Learning 12.16
Παράδειγμα 12.2 ΚΑΘΟΡΙΣΜΟΣ Σκοπός είναι η περιγραφή του πληθυσμού των ποσών του πρόσθετου βεβαιωμένου φόρου που καταγράφησαν. Τα δεδομένα είναι συνεχή. Η παράμετρος που πρέπει να εκτιμηθεί είναι ο μέσος πρόσθετος φόρος. Ο εκτιμητής του διαστήματος εμπιστοσύνης είναι Copyright 2009 Cengage Learning 12.17
Παράδειγμα 12.2 Για χειροκίνητους υπολογισμούς επιλέξτε Example 12.2 manual calculations Για το Excel δείτε την επόμενη διαφάνεια. ΥΠΟΛΟΓΙΣΜΟΣ Copyright 2009 Cengage Learning 12.18
Παράδειγμα 12.2 ΥΠΟΛΟΓΙΣΜΟΣ Επιλέξτε Add-Ins, Data Analysis Plus, t-estimate: Mean Copyright 2009 Cengage Learning 12.19
Παράδειγμα 12.2 ΥΠΟΛΟΓΙΣΜΟΣ 1 2 3 4 5 6 7 A B C D t-estimate: Mean Taxes Mean 6001 Standard Deviation 2864 LCL 5611 UCL 6392 Copyright 2009 Cengage Learning 12.20
Παράδειγμα 12.2 ΕΡΜΗΝΕΙΑ Εκτιμούμε ότι ο μέσος πρόσθετος φόρος που βεβαιώθηκε είναι μεταξύ $5,611 και $6,392. Μπορούμε να χρησιμοποιήσουμε αυτή την εκτίμηση για να δούμε αν η IRS επέλεξε τις δηλώσεις που έπρεπε να ελεγχθούν. Copyright 2009 Cengage Learning 12.21
Έλεγχος Απαιτούμενων Συνθηκών Η κατανομή Student t είναι εύρωστη (robust), που σημαίνει ότι αν ο πληθυσμός είναι μη κανονικός, τα αποτελέσματα του ελέγχου υποθέσεων και του εκτιμητή διαστήματος εμπιστοσύνης παραμένουν έγκυρα δεδομένου ότι ο πληθυσμός δεν παρουσιάζει ακραίες αποκλίσεις από την κανονική κατανομή. Για να ελέγξουμε αυτή την προϋπόθεση, σχεδιάζουμε ένα ιστόγραμμα των δεδομένων και βλέπουμε κατά πόσο το αποτέλεσμα έχει «σχήμα καμπάνας». Αν ένα ιστόγραμμα παρουσιάζει εξαιρετική ασυμμετρία (όπως στη περίπτωση της εκθετικής κατανομής), μπορούμε να πούμε ότι παρουσιάζει «ακραίες αποκλίσεις» από την κανονική κατανομή, οπότε ο έλεγχος δεν είναι έγκυρος. Copyright 2009 Cengage Learning 12.22
Frequency Ιστόγραμμα για το Παράδειγμα 12.1 Histogram: Example 12.1 60 40 20 0 0.8 1.6 2.4 3.2 4 4.8 Newspaper Copyright 2009 Cengage Learning 12.23
Frequency Ιστόγραμμα για το Παράδειγμα 12.2 80 60 40 20 0 Taxes Copyright 2009 Cengage Learning 12.24
Αθροισμα Πεπερασμένου Πληθυσμού Οι μέθοδοι που έχουμε γνωρίσει μέχρι στιγμής ισχύουν για πληθυσμούς απείρου μεγέθους. Στην πράξη βέβαια οι πληθυσμοί είναι πεπερασμένοι. Όταν ο πληθυσμός είναι μικρός πρέπει να χρησιμοποιήσουμε τον διορθωτικό παράγοντα πεπερασμένου πληθυσμού που είδαμε στο Κεφάλαιο 9. Αν το μέγεθος του πληθυσμού είναι σχετικά μεγάλο μπορούμε να αγνοήσουμε τον διορθωτικό παράγοντα. Ένας πληθυσμός θεωρείται μεγάλος όταν είναι τουλάχιστον εικοσαπλάσιος από το μέγεθος του δείγματος. Copyright 2009 Cengage Learning 12.25
Άθροισμα Πεπερασμένου Πληθυσμού Σε έναν πεπερασμένο πληθυσμό μπορούμε να χρησιμοποιήσουμε τον εκτιμητή διαστήματος εμπιστοσύνης του μέσου για να υπολογίσουμε έναν εκτιμητή διαστήματος εμπιστοσύνης για το άθροισμα όλων των τιμών του πληθυσμού. Για να εκτιμήσουμε το άθροισμα πολλαπλασιάζουμε τον εκτιμητή του μέσου επί το μέγεθος του πληθυσμού. Οπότε, ο εκτιμητής διαστήματος εμπιστοσύνης του αθροίσματος είναι : N / 2 x t s n Copyright 2009 Cengage Learning 12.26
Άθροισμα Πεπερασμένου Πληθυσμού Για παράδειγμα, ένα δείγμα 500 νοικοκυριών (σε μια πόλη με 1.000.000 νοικοκυριά) δίνει εκτιμητή ενός 95% διαστήματος εμπιστοσύνης ότι τα μέσα έξοδα του νοικοκυριού για γλυκά στη γιορτή του Halloween είναι μεταξύ $20 και $30. Μπορούμε να εκτιμήσουμε το άθροισμα των ποσών που ξοδεύτηκαν στην πόλη κάνοντας τον πολλαπλασιασμό που αναφέραμε νωρίτερα: Έτσι βρίσκουμε ότι το άθροισμα είναι μεταξύ $20 εκατομμυρίων και $30 εκατομμυρίων. Copyright 2009 Cengage Learning 12.27
Κατανόηση των Στατιστικών Εννοιών Ο έλεγχος t όπως και ο έλεγχος z μετράει τη διαφορά ανάμεσα στον δειγματικό μέσο και τον υποθετικό μέσο του πληθυσμού ως αριθμό τυπικών σφαλμάτων. Ωστόσο, όταν η τυπική απόκλιση του πληθυσμού είναι άγνωστη το τυπικό σφάλμα υπολογίζεται ωε εξής : s / n Copyright 2009 Cengage Learning 12.28
Κατανόηση των Στατιστικών Εννοιών Κατά την παρουσίαση της κατανομής Student t στην Ενότητα 8.4 είδαμε ότι η καμπύλη της έχει μεγαλύτερο εύρος από αυτή της κανονικής κατανομής. Η εξήγηση είναι απλή. Η μόνη μεταβλητή στον έλεγχο z είναι ο δειγματικός μέσος, ο οποίος ποικίλει από δείγμα σε δείγμα. Copyright 2009 Cengage Learning 12.29
Κατανόηση των Στατιστικών Εννοιών Ο έλεγχος t έχει δύο μεταβλητές, τον μέσο και την τυπική απόκλιση του δείγματος, που και οι δύο ποικίλουν από δείγμα σε δείγμα. Εξ αιτίας αυτού, ο έλεγχος t παρουσιάζει μεγαλύτερη μεταβλητότητα. Copyright 2009 Cengage Learning 12.30
Εντοπισμός παραγόντων Παράγοντες που προσδιορίζουν τον t-έλεγχο και τον εκτιμητή του μ : Copyright 2009 Cengage Learning 12.31