ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

Σχετικά έγγραφα
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

Κεφάλαιο 12 Εκτίμηση των Παραμέτρων ενός Πληθυσμού

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Μηχανική Μάθηση Hypothesis Testing

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 13. Συμπεράσματα για τη σύγκριση δύο πληθυσμών

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 1 Τι είναι η Στατιστική;

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

Κεφάλαιο 13 Σύγκριση των Παραμέτρων Δύο Πληθυσμών

Θέματα Στατιστικής στη γλώσσα R

Section 8.3 Trigonometric Equations

Math 6 SL Probability Distributions Practice Test Mark Scheme

The challenges of non-stable predicates

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

5.4 The Poisson Distribution.

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Finite Field Problems: Solutions

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

t-distribution t a (ν) s N μ = where X s s x = ν 2 FD ν 1 FD a/2 a/2 t-distribution normal distribution for ν>120

Section 9.2 Polar Equations and Graphs

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Κεφάλαιο Ένα Τι είναι η Στατιστική;

4.6 Autoregressive Moving Average Model ARMA(1,1)

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

2 Composition. Invertible Mappings

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

Other Test Constructions: Likelihood Ratio & Bayes Tests

Εισαγωγή στην Εκτιμητική

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.

Statistics & Research methods. Athanasios Papaioannou University of Thessaly Dept. of PE & Sport Science

Problem Set 3: Solutions

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας»

Statistical Inference I Locally most powerful tests

The Simply Typed Lambda Calculus

Concrete Mathematics Exercises from 30 September 2016

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

HISTOGRAMS AND PERCENTILES What is the 25 th percentile of a histogram? What is the 50 th percentile for the cigarette histogram?

Homework 3 Solutions

6.3 Forecasting ARMA processes

Section 7.6 Double and Half Angle Formulas

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Lecture 34 Bootstrap confidence intervals

derivation of the Laplacian from rectangular to spherical coordinates

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων

EE512: Error Control Coding

Δεδομένα (data) και Στατιστική (Statistics)

Statistics 104: Quantitative Methods for Economics Formula and Theorem Review

Queensland University of Technology Transport Data Analysis and Modeling Methodologies

Επιµέλεια: Χρυσάνθη Παπαθανασοπούλου

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

PARTIAL NOTES for 6.1 Trigonometric Identities

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?

Solution Series 9. i=1 x i and i=1 x i.

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

Εισαγωγή στην Ανάλυση Δεδομένων

ST5224: Advanced Statistical Theory II

Example Sheet 3 Solutions

Repeated measures Επαναληπτικές μετρήσεις

( ) 2 and compare to M.

ΠΕΡΙΕΧΟΜΕΝΑ. Μάρκετινγκ Αθλητικών Τουριστικών Προορισμών 1

Instruction Execution Times

Solutions to Exercise Sheet 5

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΒΑΛΕΝΤΙΝΑ ΠΑΠΑΔΟΠΟΥΛΟΥ Α.Μ.: 09/061. Υπεύθυνος Καθηγητής: Σάββας Μακρίδης

Πτυχιακή Εργασία. Παραδοσιακά Προϊόντα Διατροφική Αξία και η Πιστοποίηση τους

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

Εγκατάσταση λογισμικού και αναβάθμιση συσκευής Device software installation and software upgrade

7 Present PERFECT Simple. 8 Present PERFECT Continuous. 9 Past PERFECT Simple. 10 Past PERFECT Continuous. 11 Future PERFECT Simple

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11

Areas and Lengths in Polar Coordinates

TMA4115 Matematikk 3

«ΑΓΡΟΤΟΥΡΙΣΜΟΣ ΚΑΙ ΤΟΠΙΚΗ ΑΝΑΠΤΥΞΗ: Ο ΡΟΛΟΣ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΩΝ ΓΥΝΑΙΚΕΙΩΝ ΣΥΝΕΤΑΙΡΙΣΜΩΝ»

Approximation of distance between locations on earth given by latitude and longitude

Areas and Lengths in Polar Coordinates

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

ΣΧΕΔΙΑΣΜΟΣ ΕΠΙΓΕΙΟΥ ΣΥΣΤΗΜΑΤΟΣ ΑΛΥΣΟΚΙΝΗΣΗΣ ΓΙΑ ΜΕΤΑΦΟΡΑ ΤΡΟΛΕΪ

CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS

Strain gauge and rosettes

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Block Ciphers Modes. Ramki Thurimella

forms This gives Remark 1. How to remember the above formulas: Substituting these into the equation we obtain with

Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού)

ΠΑΡΑΜΕΤΡΟΙ ΕΠΗΡΕΑΣΜΟΥ ΤΗΣ ΑΝΑΓΝΩΣΗΣ- ΑΠΟΚΩΔΙΚΟΠΟΙΗΣΗΣ ΤΗΣ BRAILLE ΑΠΟ ΑΤΟΜΑ ΜΕ ΤΥΦΛΩΣΗ

CE 530 Molecular Simulation

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

Partial Differential Equations in Biology The boundary element method. March 26, 2013

[1] P Q. Fig. 3.1

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Transcript:

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ Κεφάλαιο 12 Εκτίμηση των παραμέτρων ενός πληθυσμού Copyright 2009 Cengage Learning

Εκτιμητική σχετικά με έναν πληθυσμό Πληθυσμός Δείγμα Συμπέρασμα Παράμετρος Στατιστική Θα αναπτύξουμε τεχνικές προκειμένου να εκτιμηθούν ελεγχθούν πληθυσμιακοί παράμετροι: Πληθυσμιακός μέσος αριθμητικός Πληθυσμιακή αναλογία p Copyright 2009 Cengage Learning 12.2

Εκτιμητική όταν η διακύμανση σ είναι άγνωστη Στα προηγούμενα κεφάλαια είδαμε τρόπους εκτίμησης & ελέγχου του μέσου ενός πληθυσμού όταν η διακύμανσή του & η τυπική απόκλισή του ήταν γνωστή. Συγκεκριμένα τόσο ο εκτιμητής διαστήματος όσο και ο έλεγχος υπόθεσης υπολογίστηκαν από τον τύπο: Αλλά πόσο ρεαλιστικό είναι να γνωρίζουμε την πληθυσμιακή διακύμανση? Η απάντηση είναι ΟΧΙ! Για το λόγο αυτό, χρησιμοποιούμε τον στατιστικό έλεγχο Student t, που δίνεται από τον τύπο: Copyright 2009 Cengage Learning 12.3

Εκτιμητική όταν η διακύμανση σ είναι άγνωστη Όταν σ άγνωστη τότε χρησιμοποιούμε τον σημειακό εκτιμητή της s και ο z- έλεγχος αντικαθίσταται από τον t-έλεγχο, που ακολουθεί την κατανομή student t με ν = n-1 βαθμούς ελευθερίας. Ανάλογα ο εκτιμητής διαστήματος εμπιστοσύνης του πληθυσμιακού μέσου μ δίνεται από τον τύπο: x t / 2 s n Copyright 2009 Cengage Learning 12.4

Έλεγχος μ όταν σ άγνωστο 1.Έλεγχος υποθέσεων. Όταν η πληθυσμιακή τυπική απόκλιση είναι άγνωστη και ο πληθυσμός ακολουθεί την κανονική κατανομή, ο έλεγχος υποθέσεων για τον πληθυσμιακό μέσο μ υπολογίζεται από τον τύπο: και ακολουθεί την κατανομή student t με ν = n-1 βαθμούς ελευθερίας 2.Εκτιμητής διαστήματος εμπιστοσύνης. Όταν η πληθυσμιακή τυπική απόκλιση είναι άγνωστη και ο πληθυσμός ακολουθεί την κανονική κατανομή, ο εκτιμητής διαστήματος του πληθυσμιακού μέσου μ υπολογίζεται από τον τύπο: Copyright 2009 Cengage Learning 12.5

Παράδειγμα 12.1 Στο κοντινό μέλλον όλες οι χώρες θα χρειαστεί να λάβουν μέτρα για την προστασία του περιβάλλοντος. Πιθανές δράσεις ο περιορισμός της κατανάλωσης ενέργειας και η ανακύκλωση, Σήμερα τα περισσότερα προϊόντα που παράγονται από ανακυκλωμένα υλικά είναι σημαντικά ακριβότερα σε σχέση με αυτά που κατασκευάζονται με παραδοσιακές τεχνικές. Copyright 2009 Cengage Learning 12.6

Παράδειγμα 12.1 Οι εφημερίδες αποτελούν εξαίρεση. Είναι επικερδές η ανακύκλωση εφημερίδων. Η σημαντικότερη πηγή κόστους στην ανακύκλωση εφημερίδων αποτελεί η συλλογή τους από τα νοικοκυριά και τελευταίως έχουν εμφανιστεί αρκετές εταιρίες που δραστηριοποιούνται στον τομέα αυτό. Ο οικονομικός αναλυτής μιας τέτοιας εταιρίας υπολόγισε ότι για να είναι κερδοφόρα μια τέτοια δράση θα πρέπει η μέση εβδομαδιαία ποσότητα να είναι μεγαλύτερη από 2 λίβρες (0,9 kg) ανά νοικοκυριό. Copyright 2009 Cengage Learning 12.7

Παράδειγμα 12.1 Έτσι στα πλαίσια της μελέτης σκοπιμότητας για την κατασκευή ενός νέου κέντρου συλλογής η εταιρία επέλεξε ένα τυχαίο δείγμα 148 νοικοκυριών της περιοχής και κατέγραψε το βάρος (σε λίβρες) των εφημερίδων που απέρριψε κάθε νοικοκυριό του δείγματος κατά την διάρκεια μιας εβδομάδας. Xm12-01* Μπορούμε από τα στοιχεία να συμπεράνουμε ότι το σχεδιαζόμενο νέο κέντρο συλλογής εφημερίδων για ανακύκλωση θα είναι κερδοφόρο. Copyright 2009 Cengage Learning 12.8

Παράδειγμα 12.1 ΚΑΘΟΡΙΣΜΟΣ Το ζητούμενο είναι ο έλεγχος μια υπόθεσης για τον μέσο του βάρους των εφημερίδων που μπορεί να ανακυκλώσουν τα νοικοκυριά της περιοχής. Έτσι η υπό έλεγχο παράμετρος είναι ο πληθυσμιακός μέσος μ Θέλουμε να γνωρίσουμε εάν υπάρχει επαρκείς αποδείξεις για να συμπεράνουμε ότι ο μέσος είναι μεγαλύτερος του 2. Συνεπώς, H 1 : µ > 2 Η μηδενική υπόθεση ως συνήθως: H 0 : µ = 2 Copyright 2009 Cengage Learning 12.9

Παράδειγμα 12.1 ΚΑΘΟΡΙΣΜΟΣ Επειδή η τυπική απόκλιση σ του πληθυσμού είναι άγνωστη θα χρησιμοποιηθεί ο έλεγχος t : x t s / n ν = n 1=148-1=147 Επειδή η εναλλακτική υπόθεση είναι: H 1 : µ > 2 Η περιοχή απόρριψης γίνεται για α=0,01: t t t.01,148 t.01, 150, 2.351 Example 12.1 Manual Calculations Copyright 2009 Cengage Learning 12.10

Παράδειγμα 12.1 ΚΑΘΟΡΙΣΜΟΣ Υπολογισμοί: x n 2,5 0,7... 2,6 148 3,1 322,7 148 i i1 n x 2,18 = 0,962 & = 0,981 t x s / n 2,18 0,981/ 2 148 2,24 Copyright 2009 Cengage Learning 12.11

Παράδειγμα 12.1 ΥΠΟΛΟΓΙΣΜΟΣ Click Add-Ins, Data Analysis Plus, t-test: Mean Copyright 2009 Cengage Learning 12.12

Παράδειγμα 12.1 ΥΠΟΛΟΓΙΣΜΟΣ 1 2 3 4 5 6 7 8 9 10 11 12 A B C D t-test: Mean Newspaper Mean 2.18 Standard Deviation 0.98 Hypothesized Mean 2 df 147 t Stat 2.24 P(T<=t) one-tail 0.0134 t Critical one-tail 1.6553 P(T<=t) two-tail 0.0268 t Critical : two-tail 1.9762 : Copyright 2009 Cengage Learning 12.13

Παράδειγμα 12.1 ΕΡΜΗΝΕΙΑ Η τιμή του στατιστικού ελέγχου t = 2.24 και η αντίστοιχη p- τιμή είναι.0134. Συνεπώς δεν υπάρχουν επαρκείς αποδείξεις ώστε να συμπεράνουμε ότι το μέσο βάρος των εφημερίδων προς απόρριψη είναι μεγαλύτερο των 2.0 λιβρών. Παρατηρήστε ότι υπάρχει κάποια ένδειξη, η p-τιμή είναι 0.0134. Ωστόσο, επειδή θέλαμε να είμαστε πολύ σίγουροι για το συμπέρασμα ορίστηκε ως α = 0,01 Έτσι, δεν καταλήγουμε στο συμπέρασμα ότι το εργοστάσιο ανακύκλωσης θα ήταν κερδοφόρο. Copyright 2009 Cengage Learning 12.14

Παράδειγμα 12.2 In 2004 (the latest year reported) 130,134,000 tax returns were files in the United States. The Internal Revenue Service (IRS) examined 0.77% or 1,008,000 of them to determine if they were correctly done. To determine how well the auditors are performing a random sample of these returns was drawn and the additional tax was reported. Xm12-02 Estimate with 95% confidence the mean additional income tax collected from the 1,008,000 files audited. Copyright 2009 Cengage Learning 12.15

Example 12.2 IDENTIFY The objective is to describe the population of additional tax collected. The data are interval. The parameter to be estimated is the mean additional tax. The confidence interval estimator is Copyright 2009 Cengage Learning 12.16

Example 12.2 For manual calculations click Example 12.2 manual calculations For Excel skip to next slide. COMPUTE Copyright 2009 Cengage Learning 12.17

Example 12.2 COMPUTE Click Add-Ins, Data Analysis Plus, t-estimate: Mean Copyright 2009 Cengage Learning 12.18

Example 12.2 COMPUTE 1 2 3 4 5 6 7 A B C D t-estimate: Mean Taxes Mean 6001 Standard Deviation 2864 LCL 5611 UCL 6392 Copyright 2009 Cengage Learning 12.19

Example 12.2 INTERPRET We estimate that the mean additional tax collected lies between $5,611 and $6,392. We can use this estimate to help decide whether the IRS is auditing the individuals who should be audited. Copyright 2009 Cengage Learning 12.20

Check Required Conditions The Student t distribution is robust, which means that if the population is nonnormal, the results of the t-test and confidence interval estimate are still valid provided that the population is not extremely nonnormal. To check this requirement, draw a histogram of the data and see how bell shaped the resulting figure is. If a histogram is extremely skewed (say in the case of an exponential distribution), that could be considered extremely nonnormal and hence t-statistics would be not be valid in this case. Copyright 2009 Cengage Learning 12.21

Frequency Histogram for Example 12.1 Histogram: Example 12.1 60 40 20 0 0.8 1.6 2.4 3.2 4 4.8 Newspaper Copyright 2009 Cengage Learning 12.22

Frequency Histogram for Example 12.2 80 60 40 20 0 Taxes Copyright 2009 Cengage Learning 12.23

Εντοπισμός παραγόντων Παράγοντες που προσδιορίζουν τον t-έλεγχο και τον εκτιμητή του μ : Copyright 2009 Cengage Learning 12.24

Εκτιμητική: Πληθυσμιακή Αναλογία Όταν τα δεδομένα είναι ονομαστικά, καταμετρούμε τον αριθμό των εμφανίσεων της κάθε τιμής και υπολογίζουμε τις αναλογίες. Έτσι, η παράμετρος που μας ενδιαφέρει για να περιγράψουμε ένα πληθυσμό ονομαστικών δεδομένων είναι η πληθυσμιακή αναλογία p. Η παράμετρος αυτή βασίζεται στο δυωνυμικό πείραμα. Ο στατιστικός δείκτης που χρησιμοποιείται για την εκτίμηση και τον έλεγχο μιας αναλογίας ορίζεται ως: Όπου p-καπελάκι (hat) ( ) είναι η αναλογία του δείγματος με x αριθμό επιτυχιών σε ένα δείγμα μεγέθους n. Copyright 2009 Cengage Learning 12.25

Εκτιμητική: Πληθυσμιακή Αναλογία Όταν np και n(1 p) είναι ταυτόχρονα μεγαλύτερα του 5, η κατανομή του δείγματος του είναι κατά προσέγγιση κανονική με μέσο: Τυπική απόκλιση: Και τυποποιημένο έλεγχο: Copyright 2009 Cengage Learning 12.26

Εκτιμητική: Πληθυσμιακή Αναλογία 1. Έλεγχος για μια αναλογία πληθυσμού Ο έλεγχος υπόθεσης που χρησιμοποιούμε για μια αναλογία p ενός πληθυσμού είναι: 2. Εκτιμητής διαστήματος εμπιστοσύνης για μια αναλογία πληθυσμού Ο εκτιμητής διαστήματος εμπιστοσύνης α για μια αναλογία πληθυσμού υπολογίζεται ως: (και για τα δύο απαιτείται ότι np>5 και n(1 p)>5) Copyright 2009 Cengage Learning 12.27

Παράδειγμα 12.5 Στις Αμερικάνικες προεδρικές εκλογές υπάρχουν δύο μόνο υποψήφιοι και αυτός που κερδίζει την πλειοψηφία σε μια πολιτεία κερδίζει το σύνολο των εκλεκτόρων της πολιτείας αυτής. Στην πράξη, αυτό σημαίνει ότι είτε ο Δημοκρατικός ή ο Ρεπουμπλικάνος υποψήφιος θα κερδίσει. Υποθέστε oτι τα αποτελέσματα της δημοσκόπησης εξόδου (exit poll) καταγράφηκαν και κωδικοποιήθηκαν ως 1 = Δημοκρατικός υποψήφιος 2 = Ρεπουμπλικάνος υποψήφιος. Οι κάλπες κλείνουν στις 8:00 μ.μ.. Μπορεί ο τηλεοπτικός σταθμός που παρήγγειλε την δημοσκόπηση εξόδου με βάση τα δεδομένα να αναγγείλει στις 8,01 ότι ο Ρεπουμπλικάνος υποψήφιος θα κερδίσει? Xm12-05* Copyright 2009 Cengage Learning 12.28

Παράδειγμα 12.5 Το πρόβλημα είναι η περιγραφή του πληθυσμού των ψήφων σε μια πολιτεία. Τα δεδομένα είναι ονομαστικά. Η παράμετρος που ελέγχεται είναι η αναλογία ενός εκ των υποψηφίων έστω του Ρεπουμπλικάνου υποψηφίου. Για να μπορεί ο τηλεοπτικός σταθμός να αναγγείλει τον Ρεπουμπλικάνο υποψήφιο ως νικητή θα πρέπει να ελέγξει την υπόθεση H 1 : p >.50 Και ως εκ τούτου η μηδενική υπόθεση γίνεται: H 0 : p =.50 ΚΑΘΟΡΙΣΜΟΣ Copyright 2009 Cengage Learning 12.29

Παράδειγμα 12.5 ΚΑΘΟΡΙΣΜΟΣ Η κατανομή είναι κατά προσέγγιση η τυποποιημένη κανονικής κατανομή με επίπεδο σημαντικότητας 5%. Επομένως z z z 1,645 0.05 και x pˆ n 407 765 0,532 Ο στατιστικός έλεγχος είναι: z pˆ p p(1 p) / n 0,532 0,5 0,5(1 0,5) / 765 1,77 Example 12.5 Manual calculations Για υπολογισμούς μέσω excel δείτε την συνέχεια: Copyright 2009 Cengage Learning 12.30

Παράδειγμα 12.5 ΥΠΟΛΟΓΙΣΜΟΣ Click Add-Ins, Data Analysis Plus, z-test: Proportion Copyright 2009 Cengage Learning 12.31

Παράδειγμα 12.5 ΥΠΟΛΟΓΙΣΜΟΣ 1 2 3 4 5 6 7 8 9 10 11 A B C D z-test: Proportion Votes Sample Proportion 0.532 Observations 765 Hypothesized Proportion 0.5 z Stat 1.77 P(Z<=z) one-tail 0.0382 z Critical one-tail 1.6449 P(Z<=z) two-tail 0.0764 z Critical two-tail 1.96 Copyright 2009 Cengage Learning 12.32

Παράδειγμα 12.5 ΕΡΜΗΝΕΙΑ Σε επίπεδο σημαντικότητας 5% μπορούμε να απορρίψουμε την μηδενική υπόθεση και να συμπεράνουμε ότι υπάρχουν επαρκείς αποδείξεις που δείχνουν ότι ο Ρεπουμπλικάνος υποψήφιος θα κερδίσει την πολιτεία. Ωστόσο, αυτό είναι η σωστή απόφαση; Όσοι γνωρίζουν Αγγλικά μπορούν να δουν στην συνέχεια τι πραγματικά συνέβη. Copyright 2009 Cengage Learning 12.33

Παράδειγμα 12.5 INTERPRET One of the key issues to consider here is the cost of Type I and Type II errors. A Type I error occurs if we conclude that the Republican will win when in fact he has lost. Copyright 2009 Cengage Learning 12.34

Παράδειγμα 12.5 INTERPRET Such an error would mean that a network would announce at 8:01 P.M. that the Republican has won and then later in the evening would have to admit to a mistake. If a particular network were the only one that made this error it would cast doubt on their integrity and possibly affect the number of viewers. Copyright 2009 Cengage Learning 12.35

Παράδειγμα 12.5 INTERPRET This is exactly what happened on the evening of the U. S. presidential elections in November 2000. Shortly after the polls closed at 8:00 P.M. all the networks declared that the Democratic candidate Albert Gore would win in the state of Florida. A couple of hours later, the networks admitted that a mistake had been made and the Republican candidate George W. Bush had won. Copyright 2009 Cengage Learning 12.36

Παράδειγμα 12.5 INTERPRET Several hours later they again admitted a mistake and finally declared the race too close to call. Fortunately for each network all the networks made the same mistake. However, if one network had not done this it would have developed a better track record, which could have been used in future advertisements for news shows and likely drawn more viewers. Considering the costs of Type I and II errors it would have been better to use a 1%significance level. Copyright 2009 Cengage Learning 12.37

Selecting the Sample Size When we introduced the sample size selection method to estimate a mean in Section 10.3, we pointed out that the sample size depends on the confidence level and the bound on the error of estimation that the statistics practitioner is willing to tolerate. When the parameter to be estimated is a proportion the bound on the error of estimation is B z / 2 pˆ(1 n pˆ) Copyright 2009 Cengage Learning 12.38

Selecting the Sample Size Solving for n we produce the required sample size to estimate p and where B is the bound on the error of Estimation n z / 2 pˆ(1 B pˆ) 2 Unfortunately we do not know the value of pˆ. Copyright 2009 Cengage Learning 12.39

Selecting the Sample Size Two methods in each case we choose a value for solve the equation for n. then Method 1 : no knowledge of even a rough value of is a worst case scenario so we substitute =.50. This Method 2 : we have some idea about the value of a better scenario and we substitute in our estimated. This is value. Copyright 2009 Cengage Learning 12.40

Selecting the Sample Size Method 1 :: no knowledge of value of, use 50%: Method 2 :: some idea about a possible value, say 20%: Thus, we can sample fewer people if we already have a reasonable estimate of the population proportion before starting. Copyright 2009 Cengage Learning 12.41

Εντοπισμός παραγόντων Παράγοντες που προσδιορίζουν τον z-έλεγχο και τον εκτιμητή διαστήματος του p: Copyright 2009 Cengage Learning 12.42

Διάγραμμα ροής μεθοδολογιών κεφαλαίου Περιγραφή του πληθυσμού Τύπος δεδομένων? Συνεχή Ονομαστικά Τύπος περιγραφικών μέτρων? z έλεγχος & εκτίμηση αναλογίας p Κεντρικής Θέσης t έλεγχος & εκτίμηση u. Μεταβλητότητας X 2 Χ 2 έλεγχος & εκτίμηση d Copyright 2009 Cengage Learning 12.43