ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Σχετικά έγγραφα
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Διαστήματα Εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Στατιστική Συμπερασματολογία

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Δειγματοληψία στην Ερευνα. Ετος

Στατιστική Επιχειρήσεων ΙΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

Εκτίμηση Διαστήματος. Χ. Εμμανουηλίδης, 1. Στατιστική ΙI. Εκτίμηση Διαστήματος Εμπιστοσύνης για τον Μέσο

Το Κεντρικό Οριακό Θεώρημα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Απλή Γραμμική Παλινδρόμηση II

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Σημειακή εκτίμηση και εκτίμηση με διάστημα Παραδείγματα. 12 η Διάλεξη

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Το Κεντρικό Οριακό Θεώρημα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Στατιστική Επιχειρήσεων ΙΙ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

5. Έλεγχοι Υποθέσεων

Το Κεντρικό Οριακό Θεώρημα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Γ. Πειραματισμός - Βιομετρία

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Εισόδημα Κατανάλωση

Στατιστική ΙΙ-Διαστήματα Εμπιστοσύνης Ι (εκδ. 1.1)

Χ. Εμμανουηλίδης, 1

5 o Μάθημα Έλεγχοι Υποθέσεων

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστική Ι. Ενότητα 3: Στατιστική Ι (3/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Δειγματικές Κατανομές

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Στατιστική Επιχειρήσεων ΙΙ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

21/11/2016. Στατιστική Ι. 8 η Διάλεξη (Κεντρικό Οριακό Θεώρημα)

Στατιστικός έλεγχος υποθέσεων (Μέρος 2 ο ) 3/3/2017

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Transcript:

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΥΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ 1. Ένας από τους σημαντικούς σκοπούς της Στατιστικής είναι η εκτίμηση των παραμέτρων που χαρακτηρίζουν την κατανομή ενός πληθυσμού σχετικά με την μεταβλητή που εξετάζουμε.. Σε πολλές περιπτώσεις, οι τιμές των παραμέτρων (μέση τιμή, τυπική απόκλιση, αναλογία) για τον πληθυσμό είναι άγνωστες. 3. Χρησιμοποιώντας ένα αντιπροσωπευτικό δείγμα, μπορούμε να εκτιμήσουμε τις τιμές των παραμέτρων. 4. Δεδομένου ότι η εκτίμηση βασίζεται σε υπό σύνολο του πληθυσμού, δεν αποτελεί ακριβές υπολογισμός. Υπάρχει επομένως σφάλμα εκτίμησης. 5. Όμως υπάρχουν μεθόδους με βάση τις οποίες μπορούμε να ελέγξουμε σε ποιο βαθμό το σφάλμα περιορίζεται προκειμένου να κάνουμε γενικεύσεις για όλο τον πληθυσμό. Η συμπερασματική Στατιστική αποτελείται από εκείνες τις μεθόδους που μας επιτρέπουν να διατυπώσουμε συμπεράσματα για όλο τον πληθυσμό με βάση όμως τα δεδομένα που προέρχονται από το δείγμα.

Η ΛΟΓΙΚΗ ΤΗΣ ΣΥΜΠΕΡΑΣΜΑΤΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΛΗΘΥΣΜΟΣ Χαρακτηριστικά του πληθυσμού: Γνωστά; ΝΑΙ ΌΧΙ Τυχαία μεταβλητή Χ: όλες οι τιμές γνωστές Δείγμα Δειγματικές Τιμές Χ1, Χ,,Χ μ σ Χ s 3

Συμπερασματική Στατιστική: Σημειακοί εκτιμητές Εκτίμηση κατά διάστημα Έλεγχος Υποθέσεων Γραμμική Παλινδρόμηση 4

ΣΗΜΕΙΑΚΟΙ ΕΚΤΙΜΗΤΕΣ Η δειγματική μέση τιμή X (η οποία υπολογίζεται με βάση τα δεδομένα του δείγματος) αποτελεί μια εκτίμηση της μέσης τιμής μ του πληθυσμού. Η δειγματική διακύμανση s (βάσει των δεδομένων του δείγματος) αποτελεί μια εκτίμηση της διακύμανσης σ του πληθυσμού. Οι δειγματικές τιμές Χ και s διαφέρουν από δείγμα σε δείγμα. Κατά συνέπεια, υπάρχει σχετική αβεβαιότητα όσον αφορά την αξιοπιστία της δειγματικής εκτίμησης. Όμως από τις δειγματικές τιμές, μπορούμε να βρούμε διαστήματα μέσα στα οποία βρίσκεται με συγκεκριμένο ποσοστό βεβαιότητας (π.χ. 95%) η μέση τιμή μ, η τυπική απόκλιση σ του πληθυσμού όπως και άλλοι παράμετροι (αναλογία: ποσοστό ατόμων). 5

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Οποιοδήποτε διάστημα επεκτείνεται ομοιόμορφα δεξιά και αριστερά από την παράμετρο που εξετάζουμε (μέση τιμή μ, τυπική απόκλιση σ κ.ά.) ονομάζεται διάστημα εμπιστοσύνης (Δ.Ε.). Η εύρεση του διαστήματος εμπιστοσύνης μιας παραμέτρου a) γίνεται με τη βοήθεια ενός γνωστού στατιστικού που περιέχει την εκτιμώμενη (από το δείγμα) παραμέτρου. Ο γνωστός αυτός στατιστικός ακολουθεί συστηματικά μια γνωστή κατανομή (όπως π.χ. η Κανονική Κατανομή, η Διωνυμική). b) Βασίζεται στο επίπεδο εμπιστοσύνης (1-α)% που επιλεγεί ο ίδιος ο ερευνητής (π.χ. 95%). Το επίπεδο εμπιστοσύνης αντανακλά το ποσοστό των παρατηρήσεων της μεταβλητής Χ που ανήκουν στο διάστημα εμπιστοσύνης. Κατά συνέπεια, το ποσοστό των τιμών της μεταβλητής Χ που βρίσκονται εκτός του διαστήματος εμπιστοσύνης, συμβολίζεται με α και ονομάζεται επίπεδο σημαντικότητας (σφάλμα, ρίσκο). Επιλέγοντας 95% επίπεδο εμπιστοσύνης (βεβαιότητα) δεχόμαστε 5% σφάλμα στην εκτίμηση της παραμέτρου. 6

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Το ακριβές (1-α)% Δ.Ε. της μέσης τιμής είναι: z a. d Όπου: Για το 95% Δ.Ε., α = 5% (0,05) και z α = 1,96 (σύμφωνα με το Πίνακα της Κανονικής Κατανομής). = μέγεθος δείγματος ( > 30) σ. d = ακριβές τυπικό σφάλμα με d = 1 N u = z a. σ. d= ΑΚΡΙΒΕΣ Σφάλμα Δειγματοληψίας 7

ΒΑΣΙΚΕΣ ΠΡΟΥΠΟΘΕΣΕΙΣ Η μεταβλητή Χ σε επίπεδο πληθυσμού χαρακτηρίζεται από την μέση τιμή: μ και την τυπική απόκλιση: σ Αν το δείγμα είναι αρκετά μεγάλο και αντιπροσωπευτικό, τότε η εκτίμηση της μέσης τιμής με βάση τα δεδομένα του δείγματος βασίζεται στην Κανονική Κατανομή: X N(, ) Όταν η μέση τιμή μ και η τυπική απόκλιση σ του πληθυσμού δεν είναι γνωστές (πιο πιθανό σενάριο), τότε για την εύρεση του διαστήματος εμπιστοσύνης: (α) χρησιμοποιούμε τις σημειακές εκτιμήσεις: X και s του δείγματος. (β) υπολογίζουμε συστηματικά το (1-α)% Δ.Ε. της μέσης τιμής 8

ΜΕΓΕΘΟΣ ΔΕΙΓΜΑΤΟΣ ΚΑΙ Δ.Ε. ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ (1-α)% Δ.Ε. = z a. d και d 1 N Μέγεθος δείγματος: > 30 Χρήση της Κανονικής Κατανομής α = 5% (1-α) = 95% z α = 1,96 α = 1% (1-α) = 99% z α =,576 Μέγεθος δείγματος: 30 Χρήση της Κατανομής Studet α = 5% (1-α) = 95% α = 1% (1-α) = 99% z α = t(-1; a/) Βλέπε πίνακα Studet 9

Πως χρησιμοποιούμε τον Πίνακα Studet? Για =0 και σφάλμα α = 5% α/ =,5% = 0.05 t(-1, 0.05) = t(19, 0.05) =.093 Για =5 και σφάλμα α = 1% α/ = 0.5% = 0.005 t(-1, 0.005) = t(4, 0.05) =.797 10

Πως χρησιμοποιούμε τον Πίνακα Studet? Για > 30 ( ) όπως π.χ. = 31 Παρατηρούμε ότι: Αν α/ = 0.05 δηλαδή α = 0.05 (5%), t(-1, 0.05) = t(30, 0.05) = t(, 0.05) = 1.96 Αν α/ = 0.005 δηλαδή α = 0.01 (1%), t(-1, 0.005) = t(30, 0.005) = t(, 0.005) =.576 11

Παραδείγματα εκτίμησης κατά διάστημα της μέσης τιμής. 1

ΠΑΡΑΔΕΙΓΜΑ 1 Παράδειγμα 1: Μια δειγματοληπτική έρευνα σε 00 νοικοκυριά ενός Δήμου όπου συνολικά κατοικούν 000 νοικοκυριά έδωσε τα ακόλουθα αποτελέσματα: κατά μέσο όρο, το μηνιαίο εισόδημα ανέρχεται σε 1100 με διασπορά = 547600. 1. Δώστε (α) το 95% διάστημα εμπιστοσύνης και (β) το 99% διάστημα εμπιστοσύνης για το μέσο εισόδημα. Συμπέρασμα.. Η ίδια έρευνα επαναλήφθηκε ένα χρόνο μετά την 1 η έρευνα. Τα αποτελέσματα της νέας έρευνας έδειξαν ότι, το μέσο εισόδημα = 1050 με διασπορά = 608400. Δώστε το 95% και 99% Δ.Ε. για το μέσο εισόδημα. Συμπέρασμα. Τι γνωρίζουμε; Από τα δεδομένα, έχουμε = 00 και N= 000 /Ν = 0,1 d= 1-0,1 = 0,9 Από το δείγμα, έχουμε X 1000, 547600 740 740 1.α 95% Δ.Ε. : z a d 1100 1,96 0,9 1100 97,30 00 = 00 > 30 z α = 1,96 Το εύρος του Δ.Ε. = x 97,30 = 194,6 To εύρος σε σχέση με τη μέση τιμή = 194,6 / 1100 18% της μέσης τιμής (περιορισμένο εύρος), το μέσο εισόδημα κυμαίνεται μεταξύ: 100,7 μ 1197,3 13

ΠΑΡΑΔΕΙΓΜΑ 1 1.β 99% Δ.Ε. : z a d 740 1100,576 0,9 1100 17,87 00 = 00 > 30 z α =,576 (βλέπε πίνακα) Το εύρος του Δ.Ε. = x 17,87 = 55,74 To εύρος σε σχέση με τη μέση τιμή = 55,74 / 1100 3% της μέσης τιμής (και εδώ έχουμε περιορισμένο εύρος), μπορούμε να στηρίξουμε ότι το μέσο εισόδημα των κατοίκων του Δήμου κυμαίνεται μεταξύ: 97,13 μ 17,87.. Ένα χρόνο μετά, έχουμε: X 1050, 608400 780 α/ 95% Δ.Ε. : z a d 780 1050 1,96 0,9 1050 10,56 00 Το εύρος του Δ.Ε. = x 10,56 = 05,1 To εύρος σε σχέση με τη μέση τιμή = 05,1 / 1050 0% της μέσης τιμής (περιορισμένο εύρος), μέσο εισόδημα των κατοίκων του Δήμου κυμαίνεται μεταξύ: 947,54 μ 115,56. β/ Για το 99% Δ.Ε., το μέσο εισόδημα κυμαίνεται μεταξύ : 915,1 μ 1184,79 και το εύρος του αντιστοιχεί περίπου στο 6% της μέσης τιμής. 14

ΠΑΡΑΔΕΙΓΜΑ Παράδειγμα : Μια δειγματοληπτική έρευνα σε 50 καταστήματα της χώρας έδειξε ότι η μέση τιμή ενός προϊόντος ανέρχεται σε 1,5 με διασπορά = 0,5. Δώστε (α) το 95% διάστημα εμπιστοσύνης και (β) το 98% διάστημα εμπιστοσύνης για τη μέση τιμή του προϊόντος. Συμπέρασμα. Τι γνωρίζουμε; Ν άγνωστο όμως πολύ μεγάλο (καταστήματα της χώρας): /N d =1 Από το δείγμα έχουμε : X 1,5, 0,5 0,5 0,05 α/ 95% Δ.Ε. : z a 1,5 1,96 1,5 0,13 50 = 50 > 30 z α = 1,96 Το εύρος του Δ.Ε. = 0,6 είναι περιορισμένο Με 5% σφάλματος, μπορούμε να πούμε ότι τα καταστήματα εφαρμόζουν κοινή πολιτική ως προς τη τιμή του προϊόντος. 0,05 β/ 98% Δ.Ε.: z a 1,5,36 1,5 0,1. 50 Είναι φανερό ότι και με % σφάλμα, το εύρος δεν είναι τόσο μικρό. 15

Διάστημα εμπιστοσύνης της αναλογίας. 16

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΤΗΣ ΑΝΑΛΟΓΙΑΣ: p Σε αρκετές περιπτώσεις, τα μεγέθη που εξετάζουμε εκφράζονται σε ποσοστά όπου p = ποσοστό ατόμων με συγκεκριμένο χαρακτήρα (ή απλή αναλογία). Όπως και για την μέση τιμή, μπορούμε να υπολογίσουμε τα όρια ακρίβειας του ποσοστού, δηλαδή να εκτιμήσουμε παρόμοιο διάστημα εμπιστοσύνης. Παράδειγμα: Μια έρευνα σε ένα δείγμα 00 ατόμων έδωσε τα ακόλουθα αποτελέσματα σχετικά με το κάπνισμα. Καπνιστές Αριθμός ατόμων Αναλογία Ναι 10 0.6 Όχι 80 0.4 Το ποσοστό ατόμων που καπνίζουν = 60% (p = 0.6) και το αντίστοιχο για τους μη καπνιστές είναι 40% (q = 1-p = 0.4). Το ζήτημα είναι το ακόλουθο: σε ποιο βαθμό μπορούμε να γενικεύσουμε το αποτέλεσμα αυτό στο συνολικό πληθυσμό; Μπορούμε, βάσει των αποτελεσμάτων της έρευνας να θεωρήσουμε ότι, το 60% του πληθυσμού είναι καπνιστές; 17

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΤΗΣ ΑΝΑΛΟΓΙΑΣ: p Για να γενικεύσουμε με σημαντικό βαθμό βεβαιότητας, το αποτέλεσμα της έρευνας, θα πρέπει να βρούμε το Δ.Ε. Έστω : Ν = μέγεθος πληθυσμού = μέγεθος του δείγματος p = αναλογία ατόμων (με βάση το δείγμα) που έχουν το χαρακτηριστικό και q = 1 - p Γνωρίζουμε επίσης ότι η αναλογία p ακολουθεί κατανομή Berouilli όπου: μ = p σ = p.q = p.(1-p) σ = p.q Επομένως το (1-α)% Δ.Ε. για το ποσοστό δίνεται από: pq p(1 p) p za. d p za. d p za. d 1 N Και pq τυπικό σφάλμα του ποσοστού p d Προσοχή Αν μικρό, τότε παίρνουμε t(-1, a/) Βλέπε πίνακα 18

Παραδείγματα εκτίμησης κατά διάστημα της αναλογίας. 6

ΠΑΡΑΔΕΙΓΜΑ 3 Παράδειγμα 3: Μια δειγματοληπτική έρευνα σε 5 φοιτητές της Θεσσαλίας έδειξε ότι: (α) το ενοίκιο που πληρώνουν, ανέρχεται κατά μέσο όρο στα 10 με τυπική απόκλιση = 65. (β) 0 από αυτούς δεν είναι καθόλου ικανοποιημένοι με το ενοίκιο που πληρώνουν. 1. Δώστε το 95% διάστημα εμπιστοσύνης για το μέσο ενοίκιο. Συμπέρασμα. Δώστε το 95% Δ.Ε. για το ποσοστό των μη ικανοποιημένων φοιτητών. Τι γνωρίζουμε; Ν άγνωστο όμως μεγάλο (Φοιτητές της Θεσσαλίας): /N d =1 = 5 < 30, θα πρέπει να χρησιμοποιούμε τον συντελεστή t(-1; α/). Για 95% Δ.Ε., α = 5% (ο,ο5) α/ = 0,05 Από τον πίνακα του Studet, βρίσκουμε την τιμή του t(4; 0,05)=,064 (γραμμή 4 και στήλη α/ =0.05) 1. 95% Δ.Ε. : 65 t( 1; a / ) 10,064 10 6,83 5 Το μέσο ενοίκιο κυμαίνεται μεταξύ: 183,17 μ 36,83. Το εύρος ξεπερνά τα 50 (6% της μέσης τιμής), μπορεί να θεωρηθεί σχετικά μεγάλο για το προϋπολογισμό ενός φοιτητή. 0

ΠΑΡΑΔΕΙΓΜΑ 3. Για να βρούμε το 95% Δ.Ε. για το ποσοστό των μη ικανοποιημένων φοιτητών, χρησιμοποιούμε το ποσοστό (αναλογία) που προέκυψε από το δείγμα. Γνωρίζουμε από την έρευνα σε δείγμα 5 φοιτητών, ότι 0 στους 5 δεν είναι ικανοποιημένοι. Επομένως η αναλογία είναι p =0,8 και κατά συνέπεια q= 0,. = 5 < 30, θα πρέπει να χρησιμοποιούμε τον συντελεστή t(-1; α/) =,064. 95% Δ.Ε. για την αναλογία δίνεται από: pq p t( 1; a / ). d Όπως αναφέρθηκε στο 1 ο ερώτημα, = 5 d=1 95% Δ.Ε. : pq 0,8 0, p t( 1; a / ) 0,8,064 0,8 0,17 0,63 p 0,97 5 Το διάστημα είναι ιδιαίτερα μεγάλο. Η εκτίμηση της αναλογίας δεν είναι στατιστικά ικανοποιητική και αυτό οφείλεται στο πολύ μικρό μέγεθος του δείγματος που δεν επιτρέπει αξιόπιστο συμπέρασμα. 1

Διάστημα εμπιστοσύνης για: (α) τη διαφορά των μέσων τιμών δύο δειγμάτων, (β) τη διαφορά των αναλογίων σε δύο δείγματα.

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΤΗ ΔΙΑΦΟΡΑ ΤΩΝ ΜΕΣΩΝ ΤΙΜΩΝ ΔΕΙΓΜΑΤΩΝ 1 ο δείγμα ο δείγμα Μέγεθος δείγματος 1 Μέση τιμή Διασπορά X 1 X s 1 s 1 η περίπτωση: τα δύο δείγματα είναι μεγάλα ( 1 30 & 30) Το Δ.Ε. για τη διαφορά των μέσων τιμών = s1 ( X1 X ) za. 1 s η περίπτωση: τα δύο δείγματα είναι μικρά (ή τουλάχιστον ένα από τα δύο) Το Δ.Ε. για τη διαφορά των μέσων τιμών = ( X 1 X ) t( v, a / ). s. 1 1 1 όπου ν= ( 1 + ) και s ( 1 1) s1 ( 1) s 1 3

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΤΗ ΔΙΑΦΟΡΑ ΤΩΝ ΑΝΑΛΟΓΙΩΝ ΣΕ ΔΕΙΓΜΑΤΑ 1 ο δείγμα ο δείγμα Μέγεθος δείγματος 1 Ποσοστό p 1 (q 1 ) p (q ) 1 η περίπτωση: τα δύο δείγματα είναι μεγάλα ( 1 30 & 30) Το Δ.Ε. για τη διαφορά των ποσοστών = ( p q 1 1 p1 p) za. 1 pq η περίπτωση: τα δύο δείγματα είναι μικρά (ή τουλάχιστον ένα από τα δύο) Το Δ.Ε. για τη διαφορά των ποσοστών = ( p 1 p) t(, a / ). p1q 1 1 pq όπου ν= ( 1 + ) 4

ΠΑΡΑΔΕΙΓΜΑ 4 Παράδειγμα 4: Μια δειγματοληπτική έρευνα σε 50 άνδρες και 50 γυναίκες έδειξε ότι, (α) η μέση ηλικία των ανδρών = 5 με διασπορά 16 ενώ η μέση ηλικία των γυναικών = 55 με διασπορά = 9 (β) το 60% των ανδρών καπνίζουν έναντι του 50% για τις γυναίκες 1. Δώστε το 95% διάστημα εμπιστοσύνης για τη διαφορά των μέσων ηλικιών. Συμπέρασμα.. Δώστε το 95% διάστημα εμπιστοσύνης για τη διαφορά των ποσοστών των καπνιστών. Συμπέρασμα. Άνδρες Γυναίκες Μέγεθος δείγματος 50 50 Μέση ηλικία 5 55 Διασπορά 16 9 Τα δύο δείγματα > 30 s1 95%..: ( X1 X ) za. 1 s 16 9 95%..: (555) 1.96. 31,39 4,39 X X 50 50 1 Εφόσον το Δ.Ε. δεν περιλαμβάνει την τιμή 0 και η διαφορά είναι συστηματικά αρνητική, μπορούμε να πούμε ότι, υπάρχει πραγματική διαφορά μεταξύ των ανδρών και των γυναικών ως προς την ηλικία τους. 1,61 5

ΠΑΡΑΔΕΙΓΜΑ 4 Για το 95% Δ.Ε. της διαφοράς των ποσοστών καπνιστών και δεδομένου ότι τα δύο δείγματα > 30, έχουμε τα ακόλουθα: Άνδρες Γυναίκες Μέγεθος δείγματος 50 50 p (% καπνιστών) 0,6 0,5 q(% μη καπνιστών) 0,4 0,5 95% Δ.Ε.: ( p q 1 1 p1 p) za. 1 pq 0,6 0,4 0,5 0,5 95%..: (0,6 0,5) 1.96. 0,10 0,19 0,09 p p 50 50 1 0,9 Tο Δ.Ε. περιλαμβάνει την τιμή 0, δηλαδή η διαφορά μπορεί να είναι και αρνητική και θετική! Αυτό δεν γίνεται και κατά συνέπεια, η διαφορά δεν είναι στατιστικά σημαντική. 6

ΕΡΕΥΝΑ ΣΕ ΦΟΙΤΗΤΕΣ Μια δειγματοληπτική έρευνα σε 69 φοιτητές του ΤΜΧΠΠΑ και του ΤΠΜ του Πανεπιστημίου Θεσσαλίας έδωσε τα ακόλουθα αποτελέσματα, σχετικά με την πρόθεσή τους να φύγουν στο εξωτερικό: Τμήμα Θέλουν να φύγουν Δεν θέλουν να φύγουν Σύνολο ΤΜΧΠΠΑ 18 40 ΤΠΜ 1 8 9 Σύνολο 43 6 69 1. Δώστε το 95% και 99% Δ.Ε. για το ποσοστό φοιτητών που σκέφτονται να φύγουν στο εξωτερικό. Συμπέρασμα.. Δώστε το 95% Δ.Ε. για τη διαφορά μεταξύ των δύο τμημάτων του ποσοστού των φοιτητών που σκέφτονται να φύγουν; Είναι σημαντική η διαφορά; 7

ΕΡΕΥΝΑ ΣΕ ΦΟΙΤΗΤΕΣ Για τον υπολογισμό των Δ.Ε., θα πρέπει να υπολογίσουμε τα σχετικά ποσοστά των φοιτητών που θέλουν να φύγουν (p) και των υπόλοιπων (q=1-p): Τμήμα Θέλουν να φύγουν Δεν θέλουν να φύγουν Σύνολο ΤΜΧΠΠΑ 55,0 45,0 100,0 ΤΠΜ 7,4 7,6 100,0 Σύνολο 6,3 37,7 100,0 (1.) 95% Δ.Ε. για το ποσοστό φοιτητών που σκέφτονται να φύγουν στο εξωτερικό. To 6,3% των 69 φοιτητών που εξετάζουμε θέλουν να φύγουν: p = 6,3 & q= 37,7. = 69 > 30 z a = 1,96 για 95% Δ.Ε. και z a =,576 για 99% Δ.Ε. Θεωρούμε ότι, /N 0 d 1 pq 6,3 37,7 69 95%.. p z. 6,3 1,96 6,3 11,4 50,9 < p < 73,7 a pq 6,3 37,7 99%.. p za. 6,3,576 6,3 15,0 69 47,3 < p < 77,3 Συμπέρασμα: Τα Δ.Ε. αναδεικνύουν με 95% βεβαιότητας ότι τουλάχιστον το 50% των φοιτητών θέλουν να φύγουν ή με 99% βεβαιότητας, τουλάχιστον 47%! 8

(.) 95% Δ.Ε. για τη διαφορά των ποσοστών μεταξύ των τμημάτων. Τι γνωρίζουμε; Τμήμα p q ΤΜΧΠΠΑ 40 55,0 45,0 ΤΠΜ 9 < 30 7,4 7,6 ΕΡΕΥΝΑ ΣΕ ΦΟΙΤΗΤΕΣ Για ένα από τα δύο δείγματα, < 30, επομένως το 95% της διαφοράς των ποσοστών δίνεται από: p1q1 pq 95%.. p1 p t(, a / ) Όπου ν = 1 + = 40 + 9 = 67. O πίνακας δεν μας δίνει ν = 67 κατά προσέγγιση, παίρνουμε ν = 60 που είναι πιο κοντά από το ν = 10. Για 95% Δ.Ε., t(60, 0,05) =,000 1 95% Δ.Ε. = 7,4 7,6 9 55,0 45,0 40 7,4 55,0 17,4 68,9 61,9 17,4, 9 - -5,5 p1 p 40,3 Το Δ.Ε. είναι μεγάλο και περιλαμβάνει το 0!!! Τα δύο ποσοστά παρουσιάζουν διαφορά η οποία είναι απόλυτα τυχαία και όχι αντιπροσωπευτική. Δεν μπορούμε να πούμε ότι, υπάρχει στατιστικά σημαντική διαφορά. 9

Σχέση μεταξύ σφάλματος εκτίμησης και μεγέθους δείγματος 30

Σφάλμα εκτίμησης - Μέγεθος δείγματος Η μέση τιμή όπως και η αναλογία που «υπολογίζουμε» με βάση τα δεδομένα του δείγματος αποτελούν εκτιμήσεις για το πληθυσμό και περιλαμβάνουν σφάλμα δειγματοληψίας. [Α] z a. d [Β] pq p za. d U U U = σφάλμα δειγματοληψίας = σφάλμα εκτίμησης και υπολογίζεται με τα δεδομένα του δείγματος. 31

Σφάλμα εκτίμησης - Μέγεθος δείγματος [Α] U z a d : 1 η περίπτωση βασισμένη στη μέση τιμή και διασπορά μιας επιλεγμένης μεταβλητής Σε περίπτωση που /Ν 0 U z a z a U Αν θέλουμε μικρό σφάλμα δειγματοληψίας, θα πρέπει να επιλέγουμε σχετικά μεγάλο μέγεθος δείγματος, ειδικά όταν γνωρίζουμε ότι ο πληθυσμός που μελετάμε παρουσιάζει σημαντική διασπορά ή / και ανισότητες. 3

[Β] pq U za. Σφάλμα εκτίμησης - Μέγεθος δείγματος d Σε περίπτωση που /Ν 0 : η Περίπτωση βασισμένη σε μια αναλόγια του πληθυσμού. U όπου p = ποσοστό του πληθυσμού που έχει το χαρακτηριστικό που εξετάζουμε. z Αν p γνωστό (π.χ. Γνωρίζουμε ότι, το ποσοστό ανεργίας στην Ελλάδα είναι της τάξης του 8% σύμφωνα με τα δεδομένα της Eurostat), τότε μπορούμε να υπολογίσουμε τον «κατάλληλο» μέγεθος δείγματος για a pq z a pq U (α) ένα επιλεγμένο επίπεδο εμπιστοσύνης (1-α)% και ταυτόχρονα Ο ερευνητής επιλέγει (β) ένα συγκεκριμένο και επιλεγμένο σφάλμα εκτίμησης U% 33

Παράδειγμα: Σφάλμα εκτίμησης - Μέγεθος δείγματος Ορισμός του κατάλληλου Μεγέθους δείγματος για μια έρευνα που θα αφορούσε τον κίνδυνο ανεργίας για τον Οικονομικά ενεργό πληθυσμό της Ελλάδας, δεδομένου ότι, το ποσοστό ανεργίας = 8%. Διαδικασία: (α) επιλογή του επιπέδου εμπιστοσύνης: (1-α)% = 95% z a = 1,96 (β) επιλογή του σφάλματος εκτίμησης : U =??? : εξετάζουμε διάφορα εναλλακτικά επίπεδα U 1,96 0,80,7 0,80,7 0, 7745 1,96 U U U Στρογγυλοποίηση 10% 0,1 77,45 77 5% 0,05 309,8 310 1% 0,01 7744,7 7745 34

Σφάλμα εκτίμησης - Μέγεθος δείγματος (γ) Σύγκριση με εναλλακτικά επίπεδα τόσο για το επίπεδο εμπιστοσύνης όσο και για το σφάλμα εκτίμησης (1-a)% = 99% z a =,58 U,58 0,80,7 0,80,7 1, 3419,58 U U U (1-α)% = 95% z a = 1,96 (1-α)% = 99% z a =,58 Στρογγυλοποίηση Στρογγυλοποίηση 10% 0,1 77,45 77 134, 134 5% 0,05 309,8 310 536,8 537 1% 0,01 7744,7 7745 13419,3 13419 (δ) Απόφαση: εξαρτάται σε σημαντικό βαθμό από το κόστος εφαρμογής της έρευνας πεδίου. Π.χ. αν το κόστος ανά ερωτηματολόγιο = 5 και ο προϋπολογισμός μας δεν ξεπέρνα τα 1600, τότε δεν μπορούμε να επιλέξουμε πάνω από 30 ερωτηματολόγια = 310 35

Σφάλμα εκτίμησης - Μέγεθος δείγματος Τι γίνεται αν το ποσοστό p δεν είναι γνωστό; Σε αυτή την περίπτωση, επιλέγουμε συστηματικά p = 50% (0,5) διότι η αναλογία αυτή οδηγεί στο μέγιστο σφάλμα εκτίμησης. p q p.q 0,5 0,5 0,5 0,4 0,6 0,4 0,3 0,7 0,1 0, 0,8 0,16 0,1 0,9 0,09 36