ιαστήµατα Εµπιστοσύνης

Σχετικά έγγραφα
1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

στατιστική θεωρεία της δειγµατοληψίας

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

ΑΣΚΗΣΕΙΣ ΣΤΑ ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

Επανάληψη ελέγχων υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Στατιστική Συμπερασματολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στην Εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

Απλή Γραμμική Παλινδρόμηση II

3. Κατανομές πιθανότητας

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Το Κεντρικό Οριακό Θεώρημα

Σηµειώσεις στις σειρές

Εργάτης Μηχάνηµα τύπου Α Μηχάνηµα τύπου Β

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Είδη Μεταβλητών. κλίµακα µέτρησης

Το Κεντρικό Οριακό Θεώρημα

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Κεϕάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. {x 1,..., x n } της X από ένα δείγµα µεγέθους n. Τότε η σηµειακή εκτίµηση της θ δίνεται

Κανόνες παραγώγισης ( )

Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. ˆθ παίρνει διαφορετικές τιµές, δηλαδή η ˆθ είναι η ίδια τ.µ. µε κάποια κατανοµή κι έχει µέση

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΑΣΚΗΣΕΙΣ ΣΤΟΥΣ ΕΛΕΓΧΟΥΣ ΥΠΟΘΕΣΕΩΝ

Το Κεντρικό Οριακό Θεώρημα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Διαστήματα Εμπιστοσύνης

2.3. Ασκήσεις σχ. βιβλίου σελίδας Α ΟΜΑ ΑΣ

Στατιστική Επιχειρήσεων ΙΙ

Θέμα: ΑΣΚΗΣΕΙΣ ΣΤΑ ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΑ 10,12 KELLER

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Εισόδημα Κατανάλωση

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

2. Στοιχεία Πολυδιάστατων Κατανοµών

ΣΑΣΙΣΙΚΗ. Ακαδ. Έτος Βασίλης ΚΟΤΣΡΑ. Διδάσκων: Διδάσκων επί Συμβάσει Π.Δ 407/80.

x y max(x))

Κεφάλαιο 6 Παράγωγος

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

5. Έλεγχοι Υποθέσεων

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

15, 11, 10, 10, 14, 16, 19, 18, 13, 17

9. Παλινδρόμηση και Συσχέτιση

Εκτίμηση Διαστήματος. Χ. Εμμανουηλίδης, 1. Στατιστική ΙI. Εκτίμηση Διαστήματος Εμπιστοσύνης για τον Μέσο

Transcript:

ιαστήµατα Εµπιστοσύνης Ορισµοί: ιάστηµα Εµπιστοσύνης (Cofidece Iterval): Είναι ένα διάστηµα που βασίζεται σε παρατηρήσεις ενός δείγµατος και είναι καθορισµένο µε τέτοιο τρόπο ώστε να υπάρχει µια συγκεκριµένη πιθανότητα ότι θα περιέχει την άγνωστη πραγµατική τιµή µιας παραµέτρου. Για παράδειγµα, συνηθίζεται ο καθορισµός διαστηµάτων εµπιστοσύνης που έχουν 95% ή 99% πιθανότητα να περιέχουν την πραγµατική τιµή. Επίπεδο Εµπιστοσύνης (Cofidece Level): Είναι ο βαθµός εµπιστοσύνης που συσχετίζεται µε ένα διάστηµα εµπιστοσύνης, δηλαδή η πιθανότητα ότι το διάστηµα περιέχει την πραγµατική τιµή της παραµέτρου. Επίπεδο Σηµαντικότητας (Level of Sigificace): Ισούται µε 1-Επίπεδο Εµπιστοσύνης. Εισαγωγή Εξετάστε τις παρακάτω περιπτώσεις: x = 550 Είναι µόνο µια τιµή που δίνει πολύ µικρή πληροφόρηση για τις πραγµατικές ιδιότητες του πληθυσµού και ποιο είναι το διάστηµα µέσα από το οποίο λαµβάνει τιµές. Είµαστε 99% «σίγουροι» ότι το µ ανήκει στο διάστηµα [449,551] Είναι διάστηµα που τοποθετεί τον πληθυσµιακό µέσο µε µεγάλη πιθανότητα. Είµαστε 90% «σίγουροι» ότι το µ ανήκει σε αυτό το διάστηµα [400,700] Είναι ένα διάστηµα εµπιστοσύνης που τοποθετεί τον πληθυσµιακό µέσο µε σχετικά µικρή πιθανότητα Με βάση τη Επαγωγική Στατιστική µπορούµε να κατασκευάσουµε ένα διάστηµα το οποίο θα µας επιτρέψει να συµπεράνουµε, µε ένα επιθυµητό επίπεδο εµπιστοσύνης, ότι η τιµή της άγνωστης παραµέτρου θα βρίσκεται µέσα στα όρια του και του οποίου το εύρος θα αντανακλά την ακρίβεια της εκτιµήσεως. Έτσι, από δύο διαστήµατα για µία παράµετρο τα οποία κατασκευάζονται µε τον ίδιο ακριβώς τρόπο, αλλά µε διαφορετικό µέγεθος δείγµατος, το διάστηµα που κατασκευάζεται µε το µεγαλύτερο δείγµα θα έχει µικρότερο εύρος. ηλαδή σε αντίθεση µε την περίπτωση της σηµειακής εκτιµήσεως η οποία δεν αντανακλά την ακρίβεια της, στην περίπτωση της εκτιµήσεως διαστήµατος η ακρίβεια αντανακλάται στο εύρος του διαστήµατος. Τιµόθεος Αγγελίδης 1

Θα κατασκευάσουµε διαστήµατα εµπιστοσύνης για διάφορες παραµέτρους του πληθυσµού. Σε όλες τις περιπτώσεις, το συµπέρασµα θα είναι µία πρόταση της µορφής: «Το 100(1-α)% διάστηµα εµπιστοσύνης για την παράµετρο είναι» Στην πρόταση αυτή, οι αριθµοί a και b είναι το κατώτερο και το ανώτερο όριο του διαστήµατος, ενώ ο αριθµός 100(1-α)%, όπου 0<=1-α<=1 ονοµάζεται επίπεδο εµπιστοσύνης, ενώ ο αριθµός α ονοµάζεται επίπεδο σηµαντικότητας. Αν υποθέσουµε ότι η πιθανότητα να περιέχεται η απόκλιση ανάµεσα σε δύο όρια και είναι 1-α, µπορούµε να γράψουµε Τα δύο όρια και, γράφονται ως συνάρτηση του α, γιατί εξαρτώνται από αυτά. Για την ευκολότερη αποµνηµόνευση της µορφής των περισσότερων από τα διαστήµατα εµπιστοσύνης που θα κατασκευάσουµε, θα δώσουµε τώρα µία γενική µορφή, η οποία ισχύει για όλα τα διαστήµατα που θα κατασκευάσουµε παρακάτω, εκτός από το διάστηµα εµπιστοσύνης για τη διακύµανση του πληθυσµού. Η γενική µορφή είναι: όπου είναι η τιµή της παραµέτρου η οποία είναι άγνωστη και την οποία θέλουµε να εκτιµήσουµε, είναι η εκτίµηση που προήλθε από ένα τυχαίο δείγµα, η κατάλληλη κρίσιµη τιµή (critical value) από τους πίνακες της Ζ ή της t κατανοµής και τυπικό σφάλµα (stadard error) του εκτιµητή. 1. ιαστήµατα Εµπιστοσύνης για το ενός πληθυσµού Όταν θέλουµε να κατασκευάσουµε ένα διάστηµα εµπιστοσύνης για το µέσο το ενός πληθυσµού, θέτουµε ή αν η είναι άγνωστη. Η κρίσιµη τιµή θα είναι εκτός από την εξής περίπτωση: όταν η διακύµανση του πληθυσµού είναι άγνωστη και ταυτόχρονα το µέγεθος είναι µικρό. Τότε µε την προϋπόθεση όµως ότι το δείγµα προέρχεται από κανονικό πληθυσµό. Θα εξετάσουµε περιπτώσεις (α) <30 και (β) >=30. 1.1 ιαστήµατα Εµπιστοσύνης για το όταν Τιµόθεος Αγγελίδης

Η τιµή του είναι γνωστή και ο πληθυσµός που προέρχεται ο πληθυσµός είναι κανονικός Η τιµή του είναι άγνωστη και ο πληθυσµός που προέρχεται ο πληθυσµός είναι κανονικός 1.1.1 ιαστήµατα Εµπιστοσύνης για το όταν, η τιµή του είναι γνωστή και ο πληθυσµός που προέρχεται ο πληθυσµός είναι κανονικός Εφόσον η κατανοµή του πληθυσµού υποτίθεται ότι είναι, έπεται ότι. Εποµένως: Η προηγούµενη σχέση µας δίνει την ιδέα να ξεκινήσουµε την κατασκευή διαστηµάτων εµπιστοσύνης από την παρακάτω σχέση: και να φτάσουµε σε µια εξίσωση της παρακάτω µορφής: όπου και είναι τυχαίες µεταβλητές και η διαφορά θα πρέπει να είναι η ελάχιστη δυνατή. Για οποιαδήποτε δύο τιµές και για τις οποίες ισχύει ότι ισχύει (δείτε το επόµενο σχήµα): Τιµόθεος Αγγελίδης 3

0. 4 S a m p l i g D i s t r i b u t i o of the Mea 0. 3 95 x) f( 0. 0. 1.5.5 0. 0 µ 1. 96 σ µ +1. 96 σ x x.5% είναι εκτός του κάτω διαστήµατος x x x x x x x.5% είναι εκτός του άνω διαστήµατος x Και εποµένως ισχύει ότι 95% ανήκουν στο διάστηµα Το επίπεδο σηµαντικότητας το εκλέγουµε αυθαίρετα. Συνηθίζεται να χρησιµοποιούµε τις τιµές 0.95 ή 0.99. Από τους πίνακες της κανονικής κατανοµής ότι για έχουµε: και για Τιµόθεος Αγγελίδης 4

Συνεπώς τα 95% όρια εµπιστοσύνης της µέσης τιµής είναι,ενώ τα αντίστοιχα 99% είναι Ερµηνεία: Με βάση το διάστηµα εµπιστοσύνης που υπολογίσθηκε, η µέση τιµή της τυχαίας µεταβλητής περιέχεται στο διάστηµα µε πιθανότητα. Το οποίο ουσιαστικά σηµαίνει ότι σε µια µακριά σειρά δειγµάτων που λαµβάνονται από τον πληθυσµό, αν υπολογίσουµε για καθένα από αυτά την και το αντίστοιχο διάστηµα εµπιστοσύνης,, τα από αυτά που περιέχουν τη. Παρατηρήσεις: 1. Αν όλα τα άλλα δεδοµένα παραµένουν ακριβώς τα ίδια, το 90% διάστηµα εµπιστοσύνης θα είναι στενότερο από το 95% διάστηµα. Το «κόστος» αυτό θα έπρεπε να το αναµένουµε, εφόσον θέλουµε να κερδίσουµε 5% επιπλέον εµπιστοσύνη το διάστηµά να περιέχει την τιµή του S t a d a r d N o r m al Distrib uti o Sta d a r d N o r m a l Distri b uti o 0. 4 0.4 0. 3 0.3 z ) f( 0. z ) f( 0. 0. 1 0.1 0. 0-5 - 4-3 - - 1 0 Z 1 3 4 5 0.0-5 -4-3 - - 1 0 Z 1 3 4 5 80% Cofidece Iterval: x ±1. 8 σ 95% Cofidece Iterval: x ±1. 96 σ. Πέρα από το επίπεδο εµπιστοσύνης 100(1-α)%, οι άλλοι δύο παράγοντες που επηρεάζουν το εύρος του διαστήµατος είναι η τυπική απόκλιση του πληθυσµού και το µέγεθος του δείγµατος. Με δεδοµένο το επίπεδο εµπιστοσύνης και µέγεθος δείγµατος, όσο µικρότερη είναι η τιµή του τόσο στενότερο γίνεται το Τιµόθεος Αγγελίδης 5

διάστηµα εµπιστοσύνης, γιατί µικρότερη τυπική απόκλιση σηµαίνει λιγότερη αβεβαιότητα στην εκτίµηση του µέσου. 3. Τέλος, µε δεδοµένα τα και, όσο µεγαλύτερο το, τόσο στενότερο γίνεται το διάστηµα εµπιστοσύνης, γιατί µεγαλύτερο δείγµα σηµαίνει επίσης λιγότερη αβεβαιότητα στην εκτίµηση του µέσου. S a m p l i g D i s t r i b u t i o o f t h e M e a S am p lig D is trib ut i o o f t h e M e a 0. 4 0.9 0. 3 0.8 0.7 x) f( 0. 0. 1 x) f( 0.6 0.5 0.4 0.3 0. 0. 0 0.1 0.0 95% Cofidece Iterval: =0 x 95%Cofidece Iterval: =40 x Υποθέστε ότι η ετήσια αποταµίευση µίας κατηγορίας νοικοκυριών µε ορισµένο επίπεδο εισοδήµατος είναι µία τυχαία µεταβλητή, Χ, η οποία ακολουθεί την κανονική κατανοµή µε τυπική απόκλιση. Έστω ότι ένα τυχαίο δείγµα νοικοκυριών της κατηγορίας αυτής µε µέσο. Να κατασκευαστεί ένα 90% διάστηµα εµπιστοσύνης για τη µέση ετήσια αποταµίευση. Παράδειγµα Ένα ζυθοποιείο ξέρει ότι η ποσότητα µπύρας σε ένα κουτί ακολουθεί µια κανονική κατανοµή µε τυπική απόκλιση 0, ουγκιές. Παίρνοντας ένα τυχαίο δείγµα 5 κουτιών κατασκευάσθηκε ένα διάστηµα εµπιστοσύνης για το µέσο του πληθυσµού ως εξής: 11,98 < µ < 1, 1. Ποιο είναι το επίπεδο εµπιστοσύνης του παραπάνω διαστήµατος; Τιµόθεος Αγγελίδης 6

Έχουµε κανονικό πληθυσµό και γνωστή διακύµανση, το (1-α)% Ε για το µέσο δίνεται από, 0, 0, X zα / < µ < X + z. Το εύρος του διαστήµατος είναι 0, α / 5 5 z α /, 5 Λύνοντας, 1,1 11,98 = α / 0, 5 0,14 5 z, έχουµε z α / = = 1, 75. Χρησιµοποιούµε το 0, πίνακα της Ν(0,1) και το επίπεδο εµπιστοσύνης είναι 91,98%( 1 (1 Φ(1,75)) ) 1.1. ιαστήµατα Εµπιστοσύνης για το όταν, η τιµή του είναι άγνωστη και ο πληθυσµός που προέρχεται ο πληθυσµός είναι κανονικός Πως θα αλλάξουν οι υπολογισµοί του διαστήµατος εµπιστοσύνης, όταν συνεχίσουµε να υποθέτουµε ότι ο πληθυσµός είναι κανονικός, αλλά εγκαταλείψουµε την υπόθεση ότι η διακύµανση του είναι γνωστή; Στην περίπτωση που η διακύµανση είναι άγνωστη και το µέγεθος του δείγµατος είναι µικρό, τότε η µεταβλητή κατανέµεται µε βάση τη Studet-t κατανοµή µε βαθµού ελευθερίας. Το διάστηµα εµπιστοσύνης υπολογίζεται όπως ακριβώς στη περίπτωση και εποµένως τα όρια του διαστήµατος ισούνται µε Τιµόθεος Αγγελίδης 7

Τυπική =0 = 10 Η t έχει µορφή καµπάνας (bell-shaped) είναι συµµετρική και η µορφή της καθορίζεται από τους βαθµούς ελευθερίας (degree of freedoms, df). Η µέση τιµή της είναι is 0. Για df >, η διακύµανση της t ισούται µε df/(df-). Η ποσότητα αυτή είναι µεγαλύτερη από 1, αλλά, στο όριο, προσεγγίζει την µονάδα. Η t έχει πιο παχές ουρές (flatter) από την αντίστοιχη της κανονικής. Ενσωµατώνει πιο πολλές ακραίες τιµές Η t κατανοµή προσεγγίζει την κανονική καθώς αυξάνονται οι βαθµοί ελευθερίας. Όταν η τυπική απόκλιση δεν είναι γνωστή, κάτω από την υπόθεση της κανονικότητας του πληθυσµού, πρέπει να χρησιµοποιείται η t κατανοµή µε -1 βαθµούς ελευθερίας. Υποθέστε ότι η ετήσια αποταµίευση µίας κατηγορίας νοικοκυριών µε ορισµένο επίπεδο εισοδήµατος είναι µία τυχαία µεταβλητή, Χ, η οποία ακολουθεί την κανονική κατανοµή Τιµόθεος Αγγελίδης 8

µε τυπική απόκλιση. Έστω ότι ένα τυχαίο δείγµα νοικοκυριών της κατηγορίας αυτής µε µέσο. Να κατασκευαστεί ένα 90% διάστηµα εµπιστοσύνης για τη µέση ετήσια αποταµίευση. : Παρατηρούµε ότι το διάστηµα αυτό είναι ευρύτερο απ ότι αυτό του προηγούµενου παραδείγµατος γεγονός το οποίο αντανακλά την αβεβαιότητά µας για την αληθινή τιµή της διακυµάνσεως και το οποίο µας ανάγκασε να χρησιµοποιήσουµε την κατανοµή αντί της. Ένας χρηµατιστηριακός αναλυτής θέλει να εκτιµήσει την µέση απόδοση µιας µετοχής. Χρησιµοποίησε ένα τυχαίο δείγµα 15 ηµερών για να υπολογίσει τον ετησιοποιηµένο µέσο όρο και s = 3.5%. Θεωρώντας ότι ο πληθυσµός κατανέµεται κανονικά, υπολογίστε το 95% διάστηµα εµπιστοσύνης για την µέση απόδοση της µετοχής. Παράδειγµα Τιµόθεος Αγγελίδης 9

Το περιεχόµενο 7 όµοιων κιβωτίων είναι 9.8 10. 10.4 9.8 10.0 10. 9.6 Να βρεθεί το 95% διάστηµα εµπιστοσύνης της µέσης τιµής όλων των κιβωτίων, υποθέτοντας ότι η κατανοµή του βάρους τους προσεγγίζει ικανοποιητικά την κανονική κατανοµής. : Από τα στοιχεία του δείγµατος υπολογίζουµε τη µέση τιµή και την τυπική απόκλιση. Εποµένως, Η κατανάλωση βενζίνης για ένα τυχαίο δείγµα 6 αυτοκίνητων δίνεται πιο κάτω: 18,6 18,4 19, 0,8 19,4 0,5. Να κατασκευάσετε ένα 90% διάστηµα εµπιστοσύνης για την µέση κατανάλωση στο πληθυσµό κάτω από την υπόθεση ότι η κατανοµή του πληθυσµού είναι κανονική. Πρέπει να υπολογίσουµε το µέσο και την διακύµανση του δείγµατος. 1 X = 6 S S X X X i = 19,48 1 ( X i X ) = 1 = 1,06 = 1,1 Επειδή έχουµε κανονικό πληθυσµό µε άγνωστη διακύµανση το.ε. δίνεται από, t 1, α / SX t X < µ < X + 18,61 < µ < 0,35 S 1, α / X (µε X = 19,48 SX = 1,06 = 6 α = 0,10 t 1, α / =, 015 ) Τιµόθεος Αγγελίδης 10

1. ιαστήµατα Εµπιστοσύνης για το όταν. Στα προηγούµενα παραδείγµατα είχαµε υποθέσει ότι η κατανοµή του πληθυσµού είναι κανονική. Σε µια συγκεκριµένη εφαρµογή, ωστόσο, µπορεί να υπάρχουν ενδείξεις ότι η υπόθεση αυτή δεν ισχύει. Αν όµως το µέγεθος του δείγµατος είναι «µεγάλο» τότε µπορούµε να χρησιµοποιήσουµε το Κεντρικό Οριακό Θεώρηµα και να κατασκευάσουµε ένα διάστηµα εµπιστοσύνης, όπως στις προηγούµενες περιπτώσεις. ηλαδή, η µέση τιµή της κατανοµής της µέσης τιµής των δειγµάτων, που προέρχονται από τον πληθυσµό που εκφράζεται από την µεταβλητή είναι η και η τυπική απόκλιση της είναι η. Η µεταβλητή κατανέµεται ως ανεξάρτητα από το πώς κατανέµεται η τυχαία µεταβλητή αρκεί το δείγµα να είναι µεγάλο., δηλαδή να είναι. Συγκεκριµένα, τα διαστήµατα εµπιστοσύνης για γνωστή και άγνωστη διακύµανση είναι: Υποθέστε ότι η ετήσια αποταµίευση µίας κατηγορίας νοικοκυριών µε ορισµένο επίπεδο εισοδήµατος είναι µία τυχαία µεταβλητή, Χ, η οποία ακολουθεί την κανονική κατανοµή µε τυπική απόκλιση. Έστω ότι ένα τυχαίο δείγµα νοικοκυριών της κατηγορίας αυτής µε µέσο. Να κατασκευαστεί ένα 90% διάστηµα εµπιστοσύνης για τη µέση ετήσια αποταµίευση. : Παράδειγµα Ένας οικονοµολόγος θέλει να ελέγξει το µέσο ύψος καταθέσεων σε µια περιοχή. Συλλέγει ένα τυχαίο δείγµα 100 λογαριασµών µε µέση τιµή $357.60 και τυπική απόκλιση s = $140.00. Κατασκευάστε το 95% διάστηµα εµπιστοσύνης Τιµόθεος Αγγελίδης 11

. ιαστήµατα εµπιστοσύνης για την αναλογία, υποθέτοντας «µεγάλο» δείγµα Έστω ότι έχουµε ένα δείγµα ανεξάρτητων Beroulli δοκιµών και θέλουµε να κατασκευάσουµε ένα διάστηµα εµπιστοσύνης για την στον πληθυσµό. Υποθέτουµε ότι το µέγεθος του δείγµατος είναι µεγάλο και ισχύουν οι παρακάτω προϋποθέσεις: όπου είναι η αναλογία στο δείγµα. Η εκτιµήτρια της πιθανότητας της διωνυµικής κατανοµής είναι η αναλογία των επιτυχιών που παρατηρούµε στις ανεξάρτητες διαδοχικές δοκιµές, δηλαδή. Η εκτιµήτρια είναι τυχαία µεταβλητή. Η µέση τιµή και η µεταβλητότητα της είναι αντίστοιχα. Σας συνέπεια, το επίπεδο εµπιστοσύνης του διαστήµατος θα είναι µια προσέγγιση του πραγµατικού, αλλά αυτή η προσέγγιση θα καλυτερεύει καθώς αυξάνει το µέγεθος του δείγµατος. Το τελικό διάστηµα θα είναι Ας σηµειωθεί ότι στη γενική περίπτωση Έστω ότι από ένα τυχαίο δείγµα ψηφοφόρων που ρωτήθηκαν για µία συγκεκριµένη πολιτική της κυβερνήσεως, οι 90 διαφωνούν. Να κατασκευασθεί ένα 99% διάστηµα εµπιστοσύνης για την αναλογία του εκλογικού σώµατος που διαφωνεί µε τη συγκεκριµένη πολιτική. : Υπολογίζουµε. Επίσης ισχύει: και, οπότε το ζητούµενο διάστηµα θα είναι Τιµόθεος Αγγελίδης 1

Μία θερµική κατεργασία βρέθηκε αποτελεσµατική 16 φορές σε σύνολο 35 εφαρµογών. Να βρεθεί το 99% διάστηµα εµπιστοσύνης της πιθανότητας ότι µια κατεργασία θα είναι αποτελεσµατική. : Το µέγεθος του δείγµατος είναι 35 και η εκτίµηση της έχει τιµή. Τα όρια εµπιστοσύνης είναι: Παράδειγµα Ένας στέλεχος του marketig θέλει να εκτιµήσει το ποσοστό που ανήκει σε ξένες εταιρείες στην Αµερικάνικη αγορά. Επιλέχθηκε ένα δείγµα 100 καταναλωτών και καταγράφθηκε ότι 34 χρησιµοποιούν ξένα προϊόντα. Κατασκευάστε το 95% διάστηµα εµπιστοσύνης. Εποµένως, µε 95% πιθανότητα το ποσοστό των Αµερικάνων που προτιµούν ξένα προϊόντα κυµαίνεται από 4.7% µέχρι 43.8% της αγοράς. Παράδειγµα Παίρνουµε ένα τυχαίο δείγµα 745 ατόµων που είχαν αποκτήσει βίντεο κάµερα για τουλάχιστον 1 µήνες και λιγότερο από 4 µήνες. Από τα µέλη του δείγµατος, 31 δήλωσαν ότι µετά από την αγορά της βίντεο κάµερας πηγαίνουν λιγότερο συχνά στο Κινηµατογράφο. Να κατασκευάσετε ένα 95% διάστηµα εµπιστοσύνης για την αναλογία στο πληθυσµό. Έχουµε µεγάλο δείγµα οπότε χρησιµοποιούµε την κανονική κατανοµή. pˆ(1 pˆ) p zα / 0,395 < p < 0,467 < p < pˆ + z ˆ α / pˆ(1 pˆ) όπου Τιµόθεος Αγγελίδης 13

31 pˆ = 0,43 745 = 745 α = 0,05 z α / = 1,96.1 Μειώνοντας το εύρος του διαστήµατος. Η αξία της πληροφορίας. Το εύρος του διαστήµατος εµπιστοσύνης µπορεί να µειωθεί αν: µειωθεί το επίπεδο εµπιστοσύνης, ή αυξάνοντας το µέγεθος του δείγµατος Αν στο προηγούµενο παράδειγµα κατασκευάσουµε το 90% διάστηµα εµπιστοσύνης, τότε: Αν στο προηγούµενο παράδειγµα επιλέγαµε ένα δείγµα 00 καταναλωτών, τότε: 3. ιαστήµατα εµπιστοσύνης για τη διαφορά δύο µέσων Έστω ότι έχουµε δύο τυχαίες µεταβλητές, και, και θέλουµε να κατασκευάσουµε ένα διάστηµα εµπιστοσύνης για τη διαφορά των µέσων του,. Στη διάθεσή µας, έχουµε ένα δείγµα από κάθε πληθυσµό µεγέθους και, αντίστοιχα. Το πρώτο πράγµα που µας ενδιαφέρει να διαπιστώσουµε εδώ είναι αν δείγµατα είναι εξαρτηµένα ή ανεξάρτητα. 3.1 Εξαρτηµένα δείγµατα Η εκτίµηση της διαφοράς µεταξύ δύο διαδοχικών τιµών των ίδιων παρατηρήσεων είναι µια συνηθισµένη ανάλυση στις επιχειρηµατικές δραστηριότητες. Για παράδειγµα, διαφορές στις καταµετρήσεις των απογραφών, µέτρηση ικανοποίησης ενός καταναλωτή πριν και µετά την εφαρµογή νέου τρόπου εξυπηρέτησης, µέτρηση έντασης γνώµης πριν και µετά την εκστρατεία ενηµέρωσης κλπ. Έτσι το δείγµα αποτελείται από οµάδες παρατηρήσεων. Την πρώτη πριν από την εφαρµογή και τη δεύτερη µετά την εφαρµογή της µεθόδου. Στην περίπτωση που τα δύο δείγµατα έχουν το ίδιο µέγεθος και είναι εξαρτηµένα µεταξύ τους, προχωρούµε στην κατασκευή µιας νέας µεταβλητής Τιµόθεος Αγγελίδης 14

και στην συνέχεια υπολογίζουµε το διάστηµα εµπιστοσύνης µε βάση την προηγούµενη ανάλυση. Με βάση τη γενική σχέση κατασκευής διαστηµάτων εµπιστοσύνης, ισχύει: και ή ανάλογα µε το µέγεθος του δείγµατος. Ο παρακάτω πίνακας παρουσιάζει στοιχεία για την παραγωγικότητα επτά εργατών µίας εταιρείας πριν και µετά την εισαγωγή µίας νέας µεθόδου παραγωγής. Υποθέτοντας ότι οι δύο πληθυσµοί είναι κανονικοί, να κατασκευασθεί ένα 95% διάστηµα εµπιστοσύνης για τη µέση διαφορά. Έχει αυξηθεί η µέση παραγωγικότητα των εργατών της εταιρείας µε τη νέα µέθοδο παραγωγής; Εργάτης Α Β Γ Ε ΣΤ Ζ Χ=Παραγωγικότητα 4 3 6 5 4 5 3 Πριν Υ=Παραγωγικότητα 5 5 6 6 5 5 5 Μετά ιαφορά 1 0 1 1 0 : Εκτιµούµαι =1 και. Επειδή έχουµε µικρό δείγµα και άγνωστη διακύµανση, θα χρησιµοποιήσουµε την Studet-t κατανοµή. Εποµένως, το ζητούµενο διάστηµα εµπιστοσύνης: Επειδή το διάστηµα αυτό περιλαµβάνει µόνο θετικούς αριθµούς, η εκτίµηση αυτή µας οδηγεί στο συµπέρασµα ότι η µέση παραγωγικότητα των εργατών της εταιρείας έχει πράγµατι αυξηθεί µε τη νέα µέθοδο παραγωγής. Τιµόθεος Αγγελίδης 15

Ένας µεταπτυχιακός φοιτητής ενδιαφέρεται να εκτιµήσει το µέσο επίπεδο της συνολικής αύξησης των µισθών των υπαλλήλων από την ηµέρα πρόσληψης τους έως σήµερα. Έτσι, ρώτησε τους 40 υπαλλήλους του τυχαίου δείγµατος που επέλεξε να του πουν ποιος ήταν ο αρχικός τους µισθός όταν προσλήφθηκαν. Από τα 40 ζεύγη παρατηρήσεων και υπολόγισε τη µέση διαφορά: και την τυπική απόκλιση των διαφορών Εποµένως, η µέση αύξηση των µισθών µε πιθανότητα 95% στο διάστηµα: του πληθυσµού των εργαζοµένων βρίσκεται 3. Ανεξάρτητα δείγµατα Ας υποθέσουµε τώρα ότι τα δύο δείγµατά µας µπορούν να θεωρηθούν ανεξάρτητα. Στην περίπτωση αυτή, δεν είναι απαραίτητο να υποθέσουµε ότι. Θα διακρίνουµε δύο περιπτώσεις: 1. και τα δύο δείγµατα είναι µικρά. και τα δύο δείγµατα είναι µεγάλα 3..1 Μικρά δείγµατα Σε αυτή την περίπτωση, είναι απαραίτητο να υποθέσουµε ότι και οι δύο πληθυσµοί είναι κανονικοί. Θα διακρίνουµε υποπεριπτώσεις: 1. Οι διακυµάνσεις των πληθυσµών. Οι διακυµάνσεις είναι άγνωστες. 3..1.1 Οι διακυµάνσεις θεωρούνται γνωστές Έστω και δύο τυχαία δείγµατα µεγέθους αντίστοιχα από δύο ανεξάρτητους κανονικούς πληθυσµούς και. Έστω ότι είναι γνωστά µεγέθη. Ενδιαφερόµαστε να κατασκευάσουµε ένα διάστηµα εµπιστοσύνης για τη διαφορά. Τιµόθεος Αγγελίδης 16

Όπως είναι γνωστό, µια σηµειακή εκτιµήτρια για τη διαφορά είναι το, όπου και είναι οι δειγµατικοί µέσοι των δειγµάτων. εδοµένου ότι: και εποµένως το 100(1-α)% διάστηµα εµπιστοσύνης για το είναι το Έστω ότι οι σ ένα τεστ ξένης γλώσσας ακολουθούν την κανονική κατανοµή. Να κατασκευασθεί ένα 99% διάστηµα εµπιστοσύνης για τη διαφορά στη µέση βαθµολογία µεταξύ εξεταζοµένων από δύο χώρες Α και Β, υποθέτοντας ότι και ότι µε βάση δύο δείγµατα µεγέθους από τις χώρες Α και Β υπολογίσθηκε ότι. : Υπολογίζουµε και και εποµένως το ζητούµενο διάστηµα εµπιστοσύνης είναι: Παράδειγµα Ακολουθεί ένα σύνολο εσόδων από πωλήσεις (σε χιλιάδες φύλλα) µιας εφηµερίδας σε δύο γειτονικές πόλεις για µια περίοδο λίγων ηµερών: Πόλη Α: 5,13, 14, 19, 3, 30, 35, 9, 8, 17, 17, 16, 13, 18, 0 Πόλη Β: 10,1, 15, 13, 7, 6, 11, 5, 9, 14, 15, 18, 17, 16, 1, 1, 10, 11, 13, 14 Να κατασκευάσετε ένα 99% διάστηµα εµπιστοσύνης της διαφοράς των µέσων εάν οι αρχικοί πληθυσµοί είναι κανονικοί και σ 40, σ = 14.. A = B Έχουµε κανονικοί πληθυσµοί, µικρά δείγµατα, γνωστές διακυµάνσεις. Τιµόθεος Αγγελίδης 17

X X X = 1,13 = 15 = 1 = 0 X α = 0,01 z A B A B A α / = Τότε, X A B X = 9,13,58 4,40 < µ B A z µ α / B σ A A < 13,86 σ + B B < µ A µ B < X A 3..1. Οι διακυµάνσεις θεωρούνται άγνωστες αλλά ίσες Υποθέτουµε και πάλι ότι, και είναι ανεξάρτητες. Τότε: X B + z α / σ A A σ + B B Υποθέτουµε ότι. Έστω ότι και οι µεροληπτικές διασπορές των δύο δειγµάτων αντίστοιχα (οι αµερόληπτες ορίζονται ω; ισχύει ότι: ). Λόγω της ανεξαρτησίας οθέντος ότι και είναι ανεξάρτητες ισχύει ότι: όπου δηλαδή: Τιµόθεος Αγγελίδης 18

και εποµένως το 100(1-α)% διάστηµα εµπιστοσύνης για το είναι: Παρατήρηση: 1. Η διασπορά ονοµάζεται σταθµισµένη διασπορά (pooled variace). Χρησιµοποιείται δε γιατί έχουµε δύο ανεξάρτητες εκτιµήσεις που προέρχονται από δύο διαφορετικά δείγµατα για την ίδια ποσότητα. Είναι φυσικό να κάνουµε χρήση και των δύο αυτών εκτιµήσεων λαµβάνοντας υπόψη µας (και δίνοντας την αντίστοιχη βαρύτητα) στην ποιότητα της καθεµιάς από αυτές (δηλαδή στο πόσο ακριβής είναι η καθεµιά από αυτές µε βάση το µέγεθος του δείγµατος από το έχει προέλθει).. Είναι δυνατόν να αποδειχθεί, είτε µαθηµατικά είτε µε βάση προσοµοιώσεις, ότι η σταθµική εκτιµήτρια της κοινής διασποράς είναι µια αµερόληπτη εκτιµήτρια του. Έστω ότι δεν γνωρίζουµε τις τιµές, αλλά ο στατιστικός έλεγχος της υποθέσεως ότι καταλήγει στην µη απόρριψη της. Έστω ότι οι δειγµατικές διακυµάνσεις είναι. Να κατασκευασθεί πάλι ένα 99% διάστηµα για τη διαφορά. : Εποµένως, το ζητούµενο διάστηµα εµπιστοσύνης είναι: 3..1.3 Περίπτωση άγνωστων άνισων διακυµάνσεων Αν έχουµε λόγους να πιστεύουµε ότι οι διακυµάνσεις των δύο πληθυσµών απέχουν πολύ από το να είναι ίσες, θα πρέπει το διάστηµα εµπιστοσύνης υπολογίζεται ως: Τιµόθεος Αγγελίδης 19

3.. Μεγάλα δείγµατα Όταν τα δείγµατα είναι µεγάλα, δεν είναι απαραίτητο οι κατανοµές των δύο πληθυσµών να είναι κανονικές. Με βάση το Κεντρικό Οριακό Θεώρηµα, θα µπορούσαµε να χρησιµοποιήσουµε τη κατανοµή. Το 100(1-α)% διάστηµα εµπιστοσύνης ισούται µε ή ισοδύναµα µε τις αµερόληπτες εκτιµήτριες των διασπορών Παράδειγµα Προκειµένου να βρεθεί η διαφορά του βάρους µεταξύ των σπουδαστών της Ανώτατης Εµπορικής και του Πανεπιστήµιο Πειραιώς, έχει ληφθεί από την πρώτη δείγµα 1 =100 σπουδαστών και από τη δεύτερη =50 σπουδαστών. Από τα δείγµατα αυτά προέκυψε: X 1 = 7 kgr για τους σπουδαστές της Εµπορικής X = 70 kgr για τους σπουδαστές του Πανεπ. Πειραιώς. Αν Θεωρηθεί γνωστό ότι η κατανοµή των βαρών στις δυο Σχολές είναι κανονικές και ότι σ = 100, σ 81, ζητείται το διάστηµα εµπιστοσύνης της διαφοράς των µέσων 1 = µ 1 µ σε επίπεδο σηµαντικότητας 5%. Το Ε δίνεται από X X 1 z α / σ 1 1 σ + < µ µ 1 < X 1 X + z α / σ 1 1 σ + 1,0 < µ 1 µ <,80 Τιµόθεος Αγγελίδης 0

όπου 1, 96 z. α / = 4. ιαστήµατα εµπιστοσύνης για τη διαφορά αναλογιών. Έστω ότι έχουµε δύο πληθυσµούς µε πιθανότητες επιτυχίας και και θέλουµε να κατασκευάσουµε ένα 100(1-α)% διάστηµα εµπιστοσύνης για τη διαφορά. Υποθέτουµε ότι τα µεγέθη των δειγµάτων είναι µεγάλα. Το τυπικό σφάλµα ισούται µε και εποµένως το ζητούµενο 100(1-α)% διάστηµα, που ισχύει προσεγγιστικά είναι: Να κατασκευασθεί ένα 95% διάστηµα για τη διαφορά µεταξύ των αναλογιών των οπαδών ενός συγκεκριµένου πολιτικού κόµµατος µεταξύ Αθήνας και Θεσσαλονίκης, αν δύο ανεξάρτητα δείγµατα µεγέθους Αθηναίων και =100 Θεσσαλονικέων ψηφοφόρων έδωσαν. και εποµένως το διάστηµα είναι το. Επιλέγουµε δύο δείγµατα από εξαρτήµατα που έχουν παραχθεί από την χρησιµοποιούµενη και τη νέα διαδικασία παραγωγής. Αν βρήκαµε 75 ελαττωµατικά σε δείγµα 1500 από τα παραχθέντα µε την υφιστάµενη διαδικασία και 80 ελαττωµατικά σε δείγµα 000 από τα παραχθέντα µε τη νέα διαδικασία, να βρεθεί το 90% διάστηµα εµπιστοσύνης της διαφοράς των αναλογιών των ελαττωµατικών των δύο διαδικασιών. Έστω ότι είναι οι πραγµατικές αναλογίες των ελαττωµατικών µε τη υφιστάµενη διαδικασία και τη νέα διαδικασία αντίστοιχα. Συνεπώς, έχουµε Τιµόθεος Αγγελίδης 1

και και η σηµειακή εκτίµηση της διαφοράς των. Το διάστηµα εµπιστοσύνης είναι: Επειδή το διάστηµα εµπιστοσύνης περιέχει την τιµή 0, δεν υπάρχει λόγος για να πιστέψουµε ότι η νέα παραγωγική διαδικασία προκαλεί σηµαντική µείωση του ποσοστού των ελαττωµατικών σε σχέση µε την υφιστάµενη διαδικασία παραγωγής. 5. ιάστηµα εµπιστοσύνης για τη διακύµανση ενός κανονικού πληθυσµού. Το διάστηµα εµπιστοσύνης για τη διακύµανση ενός πληθυσµού δεν έχει τη γενική µορφή που έχουµε ήδη περιγράψει. Απαραίτητη προϋπόθεση είναι ότι ο πληθυσµός κατανέµεται κανονικά για να χρησιµοποιήσουµε το θεώρηµα:, όπου είναι η µεταβλητότητα του δείγµατος. Η κατανοµή είναι ασυµµετρική και γι αυτό λέµε ότι, για παράδειγµα, τα 95% όρια εµπιστοσύνης καθορίζεται από δύο τιµές και, όπως φαίνεται από το επόµενο γράφηµα. Οι τιµές και εξαρτώνται από τους βαθµούς ελευθερίας από τους οποίους εξαρτάται οπωσδήποτε και η µορφή της κατανοµής. Χαρακτηριστικά της κατανοµής Η χ µεταβλητή δεν µπορεί να λάβει αρνητικές τιµές, εποµένως το κάτω όριο της είναι το µηδέν. Η χ µεταβλητή είναι δεξιά ασύµµετρη. Η χ µεταβλητή προσεγγίζει την κανονική όταν αυξάνονται οι βαθµοί ελευθερίας. Τιµόθεος Αγγελίδης

Για την κατασκευή του διαστήµατος, θεωρούµε: οπότε το 100(1-α)% διάστηµα εµπιστοσύνης για τη διακύµανση είναι Το 100(1-α)% διάστηµα εµπιστοσύνης για την τυπική απόκλιση πάρουµε τη θετική τετραγωνική ρίζα και των τριών µελών της ανισότητας. προκύπτει αν Τιµόθεος Αγγελίδης 3

Έστω ότι για µία συγκεκριµένη κυβερνητική πολιτική λέγεται ότι υπάρχει µεγάλη διάσταση απόψεων στο εκλογικό σώµα και ότι µία εφηµερίδα αποφασίζει να εκτιµήσει αυτή τη διάσταση εκτιµώντας τη τυπική απόκλιση του πληθυσµού. Για το σκοπό αυτό επιλέγει τυχαία 5 ψηφοφόρους και τους ζητά να βαθµολογήσουν την κυβέρνηση για τη συγκεκριµένη πολιτική της. Αν η τυπική απόκλιση στο δείγµα είναι 4 και αν υποτεθεί ότι οι βαθµοί αυτοί ακολουθούν την κανονική κατανοµή, να κατασκευάσετε ένα 95% διάστηµα εµπιστοσύνης για την παράµετρο. και. Αντικαθιστώντας στο διάστηµα, παίρνουµε το ακόλουθο 95% διάστηµα εµπιστοσύνης για τη διακύµανση: Συνεπώς το 95% διάστηµα εµπιστοσύνης για την τυπική απόκλιση είναι Παράδειγµα Για να ελέγξουµε το σηµείο τήξης του σιδήρου που προµηθεύεται µια χαλυβουργική µετρήσαµε τις παρακάτω θερµοκρασίες τήξης µε ένα τυχαίο δείγµα: 1493, 1519, 1518, 151, 151, 1514, 1489, 1508, 1508, 1494. Αν οι θερµοκρασίες τήξης ακολουθούν κανονική κατανοµή, να εκτιµηθεί το 95% διάστηµα εµπιστοσύνης της µεταβλητότητας της θερµοκρασίας τήξης. : Εποµένως, Οι βαθµοί ελευθερίας είναι και προκύπτει. Τιµόθεος Αγγελίδης 4

Παράδειγµα Ένα µηχάνηµα, δηµιουργεί κουτιά καφέ. Αν το µέσο µέγεθος είναι διαφορετικό από το αναµενόµενο, µπορεί να ρυθµιστεί και να διορθωθεί αυτόµατα. Ωστόσο, αν η διακύµανση του µεγέθους είναι πολύ υψηλή, τότε θα πρέπει να επισκευαστεί. Ένα τυχαίο δείγµα 30 κουτιών επιλέχθηκε και υπολογίσθηκε ότι = 18540. Κατασκευάστε το 95% διάστηµα εµπιστοσύνης του. Παράδειγµα Έστω ότι από έναν κανονικό πληθυσµό έχει ληφθεί δείγµα 4 µονάδων και οι συγκεκριµένες παρατηρήσεις είναι: 50, 60, 48, 74. Αν ο µέσος του πληθυσµού είναι µ=50, ζητείται να εκτιµηθεί το 95% διάστηµα εµπιστοσύνης της διακύµανσης. Το διάστηµα της διακύµανσης δίνεται από, ( x i µ ) ( x < σ < χ χ, α / 39,5 < σ < 916,7 i µ ),1 α / όπου α 0,05 χ = 11,14 χ 0, 48. Σηµειώστε ότι οι βαθµοί ελευθερίας είναι 4 = 4, α / 4,1 α / = και όχι 3 επειδή χρησιµοποιούµε µ και όχι X στον τύπο της διακύµανσης του δείγµατος. 6. Προσδιορισµός του µεγέθους του δείγµατος Η εκτίµηση του διαστήµατος εµπιστοσύνης οδηγούν σε ένα κοινό συµπέρασµα: ότι η ακρίβεια της εκτίµησης εξαρτάται από το µέγεθος του δείγµατος. Η ακρίβεια της εκτίµησης αυξάνεται όταν αυξάνεται το µέγεθος του δείγµατος. Έτσι, ο ερευνητής θέλει να γνωρίζει, πριν διεξάγει την έρευνα, ποια θα είναι η ακρίβεια των εκτιµήσεων του. Τιµόθεος Αγγελίδης 5

Συγκεκριµένα, το πρόβληµα που συναντούµε στην πράξη, σε σχέση µε το µέγεθος του δείγµατος, είναι να καθορίσουµε το µέγεθος του δείγµατος που θα χρησιµοποιήσουµε για να εκτιµήσουµε µια άγνωστη παράµετρο. Το µέγεθος του δείγµατος που πρέπει να χρησιµοποιήσουµε για να εκτιµήσουµε την άγνωστη παράµετρο, έστω µπορούµε να το υπολογίσουµε µόνο όταν: 1. Γνωρίζουµε την κατανοµή της εκτιµήτριας της παραµέτρου.. Καθορίζουµε το επιτρεπόµενο µέγεθος του σφάλµατος εκτίµησης, δηλαδή τη διαφορά 3. Καθορίζουµε την πιθανότητα 1-α, δηλαδή ο συντελεστή εµπιστοσύνης, µε την οποία δεχόµαστε να συµβαίνει το συγκεκριµένο σφάλµα εκτίµησης Άρα, πρέπει να γνωρίζουµε την κατανοµή της και να καθορίσουµε τα και 1-α της σχέσης 6.1 Προσδιορισµός του µεγέθους του δείγµατος () διάστηµα εµπιστοσύνης για το µέσο. Για να καταλάβουµε πώς µπορούµε να προσδιορίσουµε το µέγεθος του δείγµατος που απαιτείται για να πετύχουµε την επιθυµητή ακρίβεια στο διάστηµα εµπιστοσύνης του µέσου, θα ανατρέξουµε στη σχέση που δίνει το κριτήριο της τυποποιηµένης κανονικής κατανοµής: όπου είναι η τιµή του κριτηρίου που αντιστοιχεί σε επίπεδο εµπιστοσύνης. Από την παραπάνω σχέση έχουµε Τιµόθεος Αγγελίδης 6

Η τιµή του είναι θετική ή αρνητική ανάλογα µε το πρόσηµο του σφάλµατος. Αν συµβολίσουµε µε τη διαφορά, τότε η επιθυµητή ακρίβεια της εκτίµησης του διαστήµατος εµπιστοσύνης εκφράζεται ως. Το ονοµάζεται δειγµατοληπτικό σφάλµα (samplig error) και ο ερευνητής ορίζει τη µέγιστη τιµή που επιθυµεί να έχει το σε συγκεκριµένο επίπεδο εµπιστοσύνης. Συνεπώς ισχύει ότι Έτσι, για να προσδιορίσουµε το µέγεθος του δείγµατος πληροφορίες: 1. Την επιθυµητή ακρίβεια. Το επίπεδο εµπιστοσύνης 1-α που ορίζει την τιµή, χρειαζόµαστε τις εξής 3. Μία εκτίµηση της τυπικής απόκλισης του πληθυσµού. Το επίµαχο σηµείο στην πρακτική εφαρµογή της σχέσης είναι η εκτίµηση της. Συνήθως, δεν υπάρχουν σχετικά στοιχεία, άλλωστε για αυτόν το λόγο κάνουµε και την έρευνα. ύο είναι οι λύσεις που εφαρµόζονται στην πράξη. 1. Είτε χρησιµοποιούµε κάποια εκτίµηση της από παλαιότερη έρευαν. Είτε διεξάγουµε πρώτα µια µικρής κλίµακας έρευνα, που ονοµάζεται πιλοτική έρευνα (pilot survey) µε σκοπό να εκτιµήσουµε την άγνωστη από την τιµή της τυπικής απόκλισης του δείγµατος. Ο διευθυντής Marketig µιας εταιρείας κινητής τηλεφωνίας θέλει να εκτιµήσει τη µέση διάρκεια των συνδιαλέξεων συγκεκριµένης οµάδας συνδροµητών (π.χ. ελεύθεροι επαγγελµατίες ηλικίας 5-30 ετών) µε απώτερο σκοπό την προώθηση ενός νέου είδους συµβολαίου κινητής τηλεφωνίας για νέους επαγγελµατίες. Η επιθυµητή ακρίβεια της εκτίµησης του διαστήµατος εµπιστοσύνης του µέσου είναι δευτερόλεπτα σε Τιµόθεος Αγγελίδης 7

επίπεδο σηµαντικότητας 95%. Παλαιότερη έρευνα µε παρόµοιο αντικείµενο, αλλά για άλλη κατηγορία συνδροµητών, είχε δώσει εκτίµηση της τυπικής απόκλισης δευτερόλεπτα. Τι µέγεθος δείγµατος χρειάζεται για να έχουµε την επιθυµητή ακρίβεια; : Παράδειγµα Ένας ερευνητής θέλει να πραγµατοποιήσει έρευνα για το µέσο ποσό που ξοδεύουν οι επισκέπτες µιας περιοχής. Ποιο θα είναι το µέγεθος του δείγµατος, ώστε η επιθυµητή ακρίβεια του 95% διαστήµατος να είναι $10, δεδοµένου ότι ; : Παράδειγµα Επιθυµούµε να εκτιµήσουµε το µέσο βάρος των παραγοµένων πεπονιών σε µια πειραµατική καλλιέργεια. Ποιο πρέπει να είναι το απαιτούµενο µέγεθος του τυχαίο δείγµατος, ώστε µε πιθανότητα 99% το δειγµατοληπτικό σφάλµα (το ανώτατο όριο σφάλµατος της εκτιµήσεως) να είναι µικρότερο του 1 κιλό όταν η διακύµανση είναι σ =4. Έχουµε α =,01 z α / =, 58. Το σφάλµα ε=1, τότε λύνοντας δηλαδή =7. 0 z / σ = έχουµε =6,6 ε α 6. Προσδιορισµός του µεγέθους του δείγµατος () διάστηµα εµπιστοσύνης για το πληθυσµιακή αναλογία. Με ανάλογο τρόπο εκτιµούµε και το µέγεθος του δείγµατος που απαιτείται για να εκτιµήσουµε το άγνωστο εµφάνισης ενός ποιοτικού χαρακτηριστικού στον πληθυσµό. Το επιθυµητό δειγµατοληπτικό σφάλµα ισούται µε: και εποµένως: Τιµόθεος Αγγελίδης 8

Όπως και προηγουµένως για να προσδιορίσουµε το µέγεθος του δείγµατος χρειαζόµαστε τις εξής πληροφορίες: 1. Την επιθυµητή ακρίβεια. Το επίπεδο εµπιστοσύνης 1-α που ορίζει την τιµή 3. Μία εκτίµηση του πιθανού ποσοστού. Το δύσκολο σηµείο στην πρακτική εφαρµογή της σχέση είναι η εκτίµηση του. ύο είναι οι λύσεις που εφαρµόζονται στην πράξη: 1. Είτε διεξάγουµε µια πιλοτική έρευνα µε σκοπό να εκτιµήσουµε το ποσοστό. Είτε υποθέτουµε (προσωρινά) ότι. Σε αυτή την περίπτωση το γινόµενο έχει τη µέγιστη τιµή που σηµαίνει ότι σύµφωνα µε τη σχέση θα εκτιµήσουµε το µέγιστο µέγεθος δείγµατος που θα εξασφαλίσει µέγεθος σφάλµατος µικρότερο ή το πολύ ίσο µε Ο διευθυντής marketig της εταιρείας κινητής τηλεφωνίας θέλει εκτός της µέσης διάρκειας, να εκτιµήσει και το ποσοστό των συνδιαλέξεων που αφορούν επαγγελµατικές µόνο κλίσεις. Η επιθυµητή ακρίβεια της εκτίµησης του διαστήµατος εµπιστοσύνης του ποσοστού είναι σε επίπεδο εµπιστοσύνης 95%. Τι µέγεθος δείγµατος χρειάζεται για να έχουµε την επιθυµητή ακρίβεια; Θεωρούµε, αρχικά τουλάχιστον, ότι και εποµένως Εποµένως, µε βάση την προσωρινή τιµή του απαιτείται έρευνα µε µέγεθος δείγµατος παρατηρήσεων, για να εξασφαλίσουµε ακρίβεια µε Τιµόθεος Αγγελίδης 9

. Ας υποθέσουµε ότι µετά την ολοκλήρωση της έρευνας προέκυψε ότι το ποσοστό επαγγελµατικών κλήσεων. Αυτό σηµαίνει ότι η ακρίβεια του διαστήµατος εµπιστοσύνης είναι: δηλαδή το δειγµατικό σφάλµα είναι µικρότερο από αυτό που επιθυµούσε ο διευθυντής. Αντίθετα, εάν ήταν γνωστό, π.χ. από προηγούµενη έρευνα ότι το ποσοστό των επαγγελµατικών κλήσεων είναι περίπου 0.8, τότε το απαιτούµενο µέγεθος του δείγµατος θα ήταν Αυτό σηµαίνει ότι ο διευθυντής θα είχε την επιθυµητή ακρίβεια του µε σηµαντικά µικρότερο κόστος έρευνας. Γι αυτό το λόγο συνηθίζεται να επανεκτιµούµε το µέγεθος του δείγµατος, αφού η έρευνα έχει προχωρήσει και έχει προκύψει αξιόπιστη εκτίµηση του σε µια προσπάθεια περιορισµού του κόστους. Παράδειγµα Κατασκευαστές αυτοκινήτων θέλουν να υπολογίσουν το ποσοστό των καταναλωτών που ενδιαφέρονται για ένα µοντέλο. Επιθυµούν να εκτιµήσουν την αναλογία του πληθυσµού µέσα σε ένα διάστηµα 0.01 για 99% διάστηµα εµπιστοσύνης. Η αναλογία είναι 0.5 (µε βάση τα αρχεία των εταιρειών). Τιµόθεος Αγγελίδης 30