Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σχετικά έγγραφα
Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Διαστήματα Εμπιστοσύνης

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Εισαγωγή στην Εκτιμητική

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Στατιστική Συμπερασματολογία

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων ΙΙ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

X = = 81 9 = 9

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Δειγματοληψία στην Ερευνα. Ετος

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εκτίμηση Διαστήματος. Χ. Εμμανουηλίδης, 1. Στατιστική ΙI. Εκτίμηση Διαστήματος Εμπιστοσύνης για τον Μέσο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

Δειγματικές Κατανομές

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. Κατανομές πιθανότητας

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

5. Έλεγχοι Υποθέσεων

Μαθηματικά Και Στατιστική Στη Βιολογία

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος Υποθέσεων (Hypothesis Testing)

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική. Εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστική Επιχειρήσεων ΙΙ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Εφαρμοσμένη Στατιστική

Στατιστική Συμπερασματολογία

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική ΙΙ-Διαστήματα Εμπιστοσύνης Ι (εκδ. 1.1)

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Είδη Μεταβλητών. κλίµακα µέτρησης

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

7. Εκτιμήσεις Τιμων Δεικτων

Εισαγωγή στη θεωρία ακραίων τιμών

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Κεφάλαιο 11 Εισαγωγή στον Έλεγχο Υποθέσεων

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Transcript:

Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv

Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης

Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία, αποτελείται από όλες εκείνες τις μεθόδους που μας επιτρέπουν να εξάγουμε συμπεράσματα για τον πληθυσμό και να λαμβάνουμε αποφάσεις. Αυτές οι μέθοδοι, xρησιμοποιούν την πληροφορία που περιέχεται σε ένα δείγμα που λαμβάνεται από τον πληθυσμό για να εξάγουν συμπεράσματα. Η Στατιστική Συμπερασματολογία μπορεί να χωριστεί σε δύο κύριους κλάδους. o Εκτίμηση Παραμέτρων (Parameter Estimation) Σημειακές Εκτιμήσεις (Point Estimates) Διαστήματα Εμπιστοσύνης (Confidence Intervals) o Έλεγχοι Υποθέσεων (Hypothesis Testing) 3

Σημειακή Εκτίμηση (Point Estimate) Σημειακή εκτίμηση μιας παραμέρου του πληθυσμού, ονομάζεται η μοναδική τιμή ˆ που παράγεται από ένα δείγμα με τη βοήθεια του κατάλληλου στατιστικού (statistic) (ή σημειακού εκτιμητή (point estimator) ) Για παράδειγμα, έστω η τυχαία μεταβλητή X, η οποία ακολουθεί Κανονική Κατανομή με άγνωστη μέση τιμή. Η συνάρτηση δειγματικού μέσου, που δίνεται από τον τύπο 1 2 n n είναι ο σημειακός εκτιμητής, της παραμέτρου. Όταν αντικαταστήσουμε στον παραπάνω τύπο τις τιμές από ένα δείγμα, η δειγματική μέση τιμή X που προκύπτει θα είναι μία σημειακή εκτίμηση της παραμέτρου. ˆ X Σημειακή Εκτίμηση της παραμέτρου 4

Παράμετροι Πληθυσμού Η μέση τιμή, ενός πληθυσμού Σημειακές Εκτιμήσεις Ο δειγματικός μέσος X x x x ˆ X 1 2 n n Η διασπορά 2, ενός πληθυσμού Η δειγματική διασπορά ˆ n 2 2 1 2 s X i X n 1 i 1 2 s Η αναλογία (ποσοστό) p των ατόμων ενός πληθυσμού που ανήκουν σε μία κατηγορία. Η δειγματική αναλογία x pˆ n όπου x το πλήθος παρατηρήσεων σε ένα δείγμα μεγέθους n, που ανήκουν στην κατηγορία. Παράμετροι πληθυσμού και οι σημειακές τους εκτιμήσεις 5

Παράμετροι Πληθυσμού Σημειακές Εκτιμήσεις Η διαφορά των μέσων τιμών δύο πληθυσμών 1 2 Η διαφορά ανάμεσα στους δειγματικούς μέσους δύο τυχαίων ανεξάρτητων δειγμάτων X X ή ˆ ˆ 1 2 1 2 Η διαφορά της αναλογίας ανάμεσα σε δύο πληθυσμούς p p 1 2 Η διαφορά ανάμεσα σε δύο δειγματικές αναλογίες που υπολογίζονται από δύο τυχαία ανεξάρτητα δείγματα x1 x2 ή pˆ pˆ 1 2 n n 1 2 Παράμετροι του πληθυσμού και οι σημειακές τους εκτιμήσεις 6

Πλεονεκτήματα Μειονεκτήματα των Σημειακών Εκτιμητών Οι σημειακοί εκτιμητές κατασκευάζονται με τέτοιο τρόπο ώστε να ικανοποιούν συγκεκριμένες ιδιότητες, όπως η αμεροληψία, η συνέπεια και η αποτελεσματικότητα. Έτσι εξασφαλίζεται ότι η σημειακή εκτίμηση που παράγουν, είναι η βέλτιστη εκτίμηση της παραμέτρου που θα μπορούσαμε να πάρουμε από το μοναδικό δείγμα που διαθέτουμε. Παρόλα αυτά, οι σημειακές εκτιμήσεις παρουσιάζουν κάποια μειονεκτήματα. 1) Στην πραγματικότητα, μια σημειακή εκτίμηση είναι πάντα εσφαλμένη. Είναι, δηλαδή, απίθανο να πετύχουμε ακριβώς τον στόχο. 2) Δεν γνωρίζουμε πόσο κοντά στην πραγματική τιμή της παραμέτρου βρίσκεται η σημειακή μας εκτίμηση. 3) Δεν μας δίνουν πληροφορίες για την επίδραση του μεγέθους του δείγματος στην εκτίμηση της παραμέτρου. 7

Διαστήματα Εμπιστοσύνης (Confidence Intervals) Το Διάστημα Εμπιστοσύνης μιας παραμέτρου, είναι ένα διάστημα τιμών LU,, για το οποίο η πιθανότητα να περιέχει (να έχει εντοπίσει) την πραγματική τιμή της παραμέτρου είναι αυξημένη και ίση με μια δεδομένη τιμή 1 α. Δηλαδή Καθώς το διάστημα εμπιστοσύνης μιας παραμέτρου κατασκευάζεται από τον σημειακό της εκτιμητή, λαμβάνει υπόψη του την κατανομή δειγματοληψίας του εκτιμητή και αντανακλά τις συνέπειες του μεγέθους το δείγματος. Τα άκρα ενός διαστήματος εμπιστοσύνης είναι τυχαίες μεταβλητές. Αυτό σημαίνει ότι διαφορετικά δείγματα του ίδιου μεγέθους θα δώσουν διαφορετικά διαστήματα εμπιστοσύνης, κάποια από τα οποία θα έχουν αποτύχει να εντοπίσουν την τιμή της παραμέτρου στον πληθυσμό. 8

Διαστήματα Εμπιστοσύνης Συμβολισμοί και Ερμηνεία Η πιθανότητα (1 α) το διάστημα εμπιστοσύνης να περιέχει την πραγματική τιμή της παραμέτρου στον πληθυσμό, ονομάζεται συντελεστής (ή επίπεδο) εμπιστοσύνης (confidence coefficient / level). Τότε, η πιθανότητα α δεν είναι τίποτα άλλο παρά η πιθανότητα σφάλματος, δηλαδή η πιθανότητα το διάστημα εμπιστοσύνης να μην περιέχει την πραγματική τιμή της παραμέτρου. Ονομάζουμε αυτή την πιθανότητα επίπεδο σημαντικότητας (significance level). Ονομάζουμε ένα διάστημα εμπιστοσύνης από τον συντελεστή εμπιστοσύνης του. Για παράδειγμα, όταν λέμε 95% δ.ε., αυτό σημαίνει ότι η πιθανότητα το διάστημα εμπιστοσύνης να περιέχει την πραγματική τιμή της παραμέτρου είναι 95% (1 α = 0.95) Το εύρος ενός διαστήματος εμπιστοσύνης εξαρτάται από το συντελεστή εμπιστοσύνης, το μέγεθος του δείγματος και το τυπικό σφάλμα της σημειακής εκτίμησης. Το εύρος αυξάνεται όταν αυξάνεται το τυπικό σφάλμα της εκτιμήτριας ή ο συντελεστής εμπιστοσύνης, ενώ μειώνεται όταν αυξάνει το μέγεθος του δείγματος. 9

Διάστημα Εμπιστοσύνης για τη μέση τιμή ενός πληθυσμού Επιλογή μεγέθους δείγματος

100(1 α )% Διάστημα Εμπιστοσύνης του μέσου μ όταν η Διασπορά σ 2 είναι γνωστή Πληθυσμός Κανονικός και δείγμα οποιουδήποτε μεγέθους ή Πληθυσμός μη Κανονικός και μεγάλο δείγμα (n > 30) όπου: Το επίπεδο σημαντικότητας Το μέγεθος του δείγματος Ο δειγματικός μέσος Η διασπορά στον πληθυσμό Τιμές που βρίσκονται από τον πίνακα της Κανονικής Κατανομής και τη σχέση 11

Παράδειγμα 1 Λύση 12

100(1 α )% Διάστημα Εμπιστοσύνης του μέσου μ όταν η Διασπορά σ 2 είναι άγνωστη Πληθυσμός Κανονικός όπου: Η δειγματική τυπική απόκλιση τιμή από τον πίνακα της Κατανομής t - Student Όταν έχουμε μεγάλο δείγμα (n > 30), τότε η τιμή μπορεί να αντικατασταθεί από την τιμή 13

n 1 Πίνακας της Κατανομής t - Student 14

Παράδειγμα 2 Λύση 15

Σημαντική Παρατήρηση Η πιθανότητα σφάλματος, είναι η πιθανότητα το διάστημα εμπιστοσύνης που εκτιμήσαμε να μην περιέχει την πραγματική τιμή της παραμέτρου, και όχι η πιθανότητα η πραγματική τιμή της παραμέτρου να μην περιέχεται στο διάστημα εμπιστοσύνης!!! Παρόλο που φαίνεται ότι οι παραπάνω δύο εκφράσεις αναφέρονται στο ίδιο γεγονός, για τη Θεωρία των Πιθανοτήτων και τη Στατιστική έχουν μία σημαντική διαφορά. Η πραγματική τιμή της παρμέτρου είναι μοναδική και βρίσκεται σε συγκεκριμένο σταθερό σημείο. Το ερώτημα, λοιπόν, είναι εάν το διάστημα εμπιστοσύνης που εκτιμούμε έχει καταφέρει να «κλείσει» μέσα στα όριά του, αυτό το σημείο. Η πιθανότητα σφάλματος χαρακτηρίζει το διάστημα εμπιστοσύνης και όχι την παράμετρο. Με άλλα λόγια, είναι η πιθανότητα το διάστημα εμπιστοσύνης που εκτιμούμε να αποτύχει, τελικά, στο σκοπό του. 16

Επιλογή του συντελεστή εμπιστοσύνης. Στο παράδειγμα 2, επιλέξαμε συντελεστή εμπιστοσύνης 90% για την εκτίμηση του διαστήματος εμπιστοσύνης, το οποίο βρέθηκε (4934.263, 5065.738) Τί θα γινόταν, αν επιλέγαμε έναν πολύ μεγαλύτερο συντελεστή εμπιστοσύνης, για παράδειγμα 99%; Το μόνο που θα άλλαζε, θα ήταν η τιμή t ;n1 η οποία τώρα θα 2 ήταν μεγαλύτερη από πρίν. t t 2. 947 αντί t t 1. 753 ; 16 1 0. 005; 15 ; 161 0. 05; 15 0. 01 0. 10 2 2 Αυτό θα είχε σαν αποτέλεσμα να πάρουμε ένα διάστημα εμπιστοσύνης το οποίο θα ήταν μεγαλύτερο από το προηγούμενο. Δηλαδή το (4906.363, 5093.638) αντί του (4934.263, 5065.738) Και αυτό συμβαίνει πάντα. Για δεδομένο μέγεθος δείγματος και για την ίδια διασπορά, το μόνο που καταφέρνουμε όταν επιλέγουμε μεγαλύτερους συντελεστές εμπιστοσύνης, είναι να εκτιμούμε μεγαλύτερα διαστήματα. Στην πράξη όμως, ένα μεγάλο διάστημα εμπιστοσύνης μπορεί να μην έχει καμία χρησιμότητα. 17

Επιλογή του συντελεστή εμπιστοσύνης Επιθυμούμε ακρίβεια στις εκτιμήσεις μας. Όταν το διάστημα εμπιστοσύνης μεγαλώνει, η ακρίβεια χάνεται. Και μαζί της ο στόχος. Κατασκευάσαμε διαστήματα εμπιστοσύνης, για να μπορούμε να πούμε κάτι καλύτερο, π.χ. από το ότι «το μέσο ύψος των καταθέσεων όψεως είναι περίπου 5000». Κατασκευάσαμε διαστήματα εμπιστοσύνης, ακριβώς για να προσδιορίσουμε, να «ποσοτικοποιήσουμε», να δώσουμε νόημα σε αυτό το «περίπου». Θέλουμε να έχουμε διαστήματα αρκετά μικρά, ώστε να ικανοποιούν την ανάγκη μας για ακρίβεια, και ταυτόχρονα να έχουν έναν υψηλό συντελεστή εμπιστοσύνης. Αυτά όμως τα δύο κριτήρια βρίσκονται σε σύγκρουση. Στην πράξη, οι ποιό συνηθισμένες επιλογές συντελεστή εμπιστοσύνης είναι 0.90 (α = 0.10) και 0.95 (α = 0.05) 18

Επιλογή μεγέθους δείγματος Ένας δεύτερος τρόπος για πετύχουμε την επιθυμητή ακρίβεια είναι να επιλέξουμε ένα δείγμα μεγάθους n, που να είναι ικανό να μας δώσει ένα διάστημα εμπιστοσύνης συγκεκριμένου μήκους με προκαθορισμένο συντελεστή εμπιστοσύνης. Το μήκος του διαστήματος εμπιστοσύνης είναι 2Z 2 n Ονομάζουμε σφάλμα εκτίμησης την απόσταση της μέσης τιμής στον πληθυσμό από το δειγματικό μέσο. Δηλαδή την ποσότητα e X. Η μέγιστη τιμή που μπορεί να πάρει το σφάλμα εκτίμησης είναι Z, 2 n δηλαδή ίση με το μισό του μήκους του διαστήματος εμπιστοσύνης. Από τη στιγμή που το σφάλμα εκτίμησης και το μήκος του διαστήματος εμπιστοσύνης συνδέονται, μπορούμε, μέσω του σφάλματος εκτίμησης να ελέγξουμε το μήκος του διαστήματος και επομένως την ακρίβεια της πρόβλεψης. 19

Επιλογή μεγέθους δείγματος Από τη σχέση e Z, λύνοντας ως προς το μέγεθος του δείγματος n, 2 n παίρνουμε Z n 2 e Η τελευταία σχέση μας λέει ότι: Για επιλεγμένες τιμές σφάλματος και συντελεστή εμπιστοσύνης, αρκεί να πάρουμε δείγμα μεγέθους n για να εκτιμήσουμε διάστημα εμπιστοσύνης με επιθυμητή ακρίβεια. 2 Επειδή τις περισσότερες φορές η τυπική απόκλιση δεν είναι γνωστή, χρησιμοποιείται η εκτίμησή της. s στον πληθυσμό Εάν ο πληθυσμός από τον οποίο επιλέγουμε το δείγμα είναι πεπεραμένος, το μέγεθος του δείγματος προσδιορίζεται από τη σχέση nn n* n N 1, όπου Ν το μέγεθος του πληθυσμού. 20

Παράδειγμα 3 Έστω ότι θέλουμε να εκτιμήσουμε το μέσο χρόνο συναρμολόγησης των κινητών τηλεφώνων του παραδείγματος 1, με συντελεστή εμπιστοσύνης 95% και σφάλμα εκτίμησης 1 min. Τότε θα πρέπει να επιλέξουμε δείγμα μεγέθους 2 2 Z Z0. 05 Z 2 2 2 2 0. 025 1. 965 n. e e e 96 04 1 Εάν για μέγεθος δείγματος n = 96 εκτιμήσουμε ξανά το διάστημα εμπιστοσύνης για το μέσο χρόνο συναρμολόγησης των κινητών τηλεφώνων θα βρούμε (19.000 min, 21.000 min) Το μήκος (ακρίβεια) αυτού του διαστήματος είναι 2 min και είναι, πράγματι, το διπλάσιο του επιλεγμένου σφάλματος εκτίμησης που ήταν 1 min. 21

Διάστημα Εμπιστοσύνης για την Αναλογία σε έναν πληθυσμό Επιλογή μεγέθους δείγματος

Διάστημα Εμπιστοσύνης Μεγάλου Δείγματος για την αναλογία p, σε έναν πληθυσμό Πολλές φορές ενδιαφερόμαστε για την αναλογία (ή το ποσοστό) των ατόμων ή των αντικειμένων ενός πληθυσμού που ανήκουν σε μία κατηγορία. Για παράδειγμα, το ποσοστό των ατόμων που προτιμούν κάποιο προϊόν, ή το ποσοστό των ελαττωματικών αντικειμένων σε μία γραμμή παραγωγής. Ο σημειακός εκτιμητής για το ποσοστό p της αναλογίας στον πληθυσμό είναι ˆ x p n όπου, n το μέγεθος του δείγματος και x το πλήθος των ατόμων στο δείγμα που ανήκουν στην κατηγορία που μας ενδιαφέρει. Αποδεικνύεται ότι για μεγάλα δείγματα η κατανομή δειγματοληψίας της αναλογίας ˆp προσεγγίζει την Κανονική Κατανομή. pˆ p 1 p pˆ p N p, n p1 p N 01, n 2 23

100(1 α )% Διάστημα Εμπιστοσύνης για την αναλογία p στον πληθυσμό και επιλογή μεγέθους δείγματος. όταν Για την επιλογή του μεγέθους του δείγματος, χρησιμοποιείται ο οι τύποι ή nn n*, για πληθυσμό πεπερασμένου μεγέθους N n N 1 Επειδή η αναλογία p είναι κατά κανόνα άγνωστη, στον υπολογισμό του μεγέθους δείγματος χρησιμοποιούμε είτε μια προγενέστερη εκτίμηση της αναλογίας p, είτε δίνουμε την τιμή p = 0.5. 24

Παράδειγμα 3 Μια εταιρεία καλλυντικών, ενδιαφέρεται να εκτιμήσει το ποσοστό των γυναικών που χρησιμοποιούν την κρέμα προσώπου Α. Από ένα δείγμα 50 γυναικών, οι 26 απάντησαν θετικά. Έτσι, για τον υπολογισμό του 95% δ.ε. για την αναλογία στον πληθυσμό έχουμε: Επομένως, με πιθανότητα σφάλματος α = 0.05, γνωρίζουμε ότι το ποσοστό των γυναικών που χρησιμοποιούν την κρέμα προσώπου Α, βρίσκεται εντός των ορίων 13.68% και 38.32%. Παρατηρούμε ότι το μήκος αυτού του διαστήματος είναι πολύ μεγάλο. Εάν η εταιρεία επιθυμεί να υπολογίσει το δ.ε. εμπιστοσύνης με ακρίβεια 5% τότε θα πρέπει να πάρει ένα δείγμα, μεγέθους 25