Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών



Σχετικά έγγραφα
ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 3: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (3/4) Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 3: Στατιστική Ι (3/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 5: Θεωρητικές Κατανομές Πιθανότητας. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

Στατιστική Επιχειρήσεων ΙΙ

Εισαγωγή στην Εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Στατιστική Επιχειρήσεων Ι

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 1: Εκτιμητές και Ιδιότητες. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Ι. Ενότητα 6: Kατανομή Poisson. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

3. Κατανομές πιθανότητας

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Στατιστική Ι. Ενότητα 3: Πιθανότητες. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Θεωρία Πιθανοτήτων & Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

X = = 81 9 = 9

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Δειγματικές Κατανομές

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Διαστήματα Εμπιστοσύνης

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μαθηματικά Και Στατιστική Στη Βιολογία

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ερευνητική υπόθεση. Η ερευνητική υπόθεση αναφέρεται σε μια συγκεκριμένη πρόβλεψη σχετικά με τη σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές.

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Γ. Πειραματισμός - Βιομετρία

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Εισαγωγικές Έννοιες ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών Πόρων

Οικονομετρία Ι. Ενότητα 5: Ανάλυση της Διακύμανσης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Μαθηματικά. Ενότητα 3: Εξισώσεις και Ανισώσεις 1 ου βαθμού. Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

Μαθηματικά. Ενότητα 2: Δεκαδικοί αριθμοί, κλάσματα, δυνάμεις, ρίζες και ποσοστά. Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

Θεωρία Πιθανοτήτων & Στατιστική

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική Συμπερασματολογία

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Μαθηματικά. Ενότητα 3: Ολοκληρωτικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Εφαρμοσμένη Στατιστική

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

Ενδεικτικές ασκήσεις ΔΙΠ 50

Δειγματοληψία στην Ερευνα. Ετος

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Οικονομετρία Ι. Ενότητα 6: Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Εφαρμοσμένη Στατιστική

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Μέθοδοι Γεωργοοικονομικής & Κοινωνιολογικής Έρευνας

Μαθηματικά. Ενότητα 12: Ακρότατα Συνάρτησης Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

Το Κεντρικό Οριακό Θεώρημα

Στατιστική. 5 ο Μάθημα: Βασικές Έννοιες Εκτιμητικής. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Transcript:

Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Δυτικής Μακεδονίας» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Σκοποί ενότητας 8 Να κατανοήσουν οι φοιτητές έννοιες όπως η Δειγματοληψία και κατανομή Δειγματοληψίας. Παράλληλα θα πρέπει οι φοιτητές να κατανοήσουν έννοιες όπως Κεντρικό Οριακό Θεώρημα και Διαστήματα Εμπιστοσύνης. 4

Περιεχόμενα ενότητας Δειγματοληψία. Κατανομή Δειγματοληψίας. Το Κεντρικό Οριακό Θεώρημα. Διάστημα Εμπιστοσύνης. Διάστημα Εμπιστοσύνης Μέσου. 5

Επαγωγική Στατιστική (1/3) Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό φυσικά εμπεριέχει ένα βαθμό αβεβαιότητας, Πόσο μπορούμε να εμπιστευτούμε ότι ένα αποτέλεσμα που προκύπτει από το δείγμα είναι έγκυρο και για τον πληθυσμό. Οι τεχνικές της επαγωγικής στατιστικής μετρούν αυτή ακριβώς τη στατιστική αβεβαιότητα. 6

Επαγωγική Στατιστική (2/3) Δύο είναι οι κυριότερες διαδικασίες της επαγωγικής στατιστικής: Η εκτίμηση. Ο έλεγχος υποθέσεων. Εάν το δείγμα είναι καλό και αξιόπιστο τότε θα μας οδηγήσει σε σωστά συμπεράσματα για τον πληθυσμό. Εάν ο δείγμα είναι ακατάλληλο τότε θα βγάλουμε λανθασμένα συμπεράσματα. Ακόμα και εάν χρησιμοποιήσουμε τα πλέον εξεζητημένα και πολύπλοκα μεθοδολογικά εργαλεία. 7

Επαγωγική Στατιστική (3/3) Πολλές στατιστικές έρευνες έχουν αποτύχει παταγωδώς γιατί το δείγμα που επιλέχθηκε δεν ήταν καλό. Το μυστικό πίσω από την επιλογή του καλού δείγματος βρίσκεται στις λέξεις αντιπροσωπευτικό και τυχαίο. Η με συστηματικό τρόπο, είτε θετικό είτε αρνητικό, μονομερής αντιμετώπιση κάποιων ατόμων ή πραγμάτων ονομάζεται μεροληψία. 8

Δειγματοληψία (1/7) Η διαδικασία δημιουργίας ενός ή περισσοτέρων δειγμάτων λέγεται δειγματοληψία. Υπάρχουν διάφορες μέθοδοι δειγματοληψίας για τη συγκρότηση του τυχαίου δείγματος οι οποίες χρησιμοποιούνται κατά περίπτωση. Στη τυχαία δειγματοληψία κάθε μέλος του πληθυσμού έχει μία μη μηδενική πιθανότητα. 9

Δειγματοληψία (2/7) Όλα τα μέλη του πληθυσμού έχουν ίση πιθανότητα επιλογής στο δείγμα, Ενώ δεν υπάρχει επανάθεση, δηλαδή κάθε μέλος μπορεί να εμφανιστεί μόνο μία φορά στο δείγμα. Η πιθανότητα επιλογής ενός μέλους είναι ανεξάρτητη από την πιθανότητα επιλογής κάποιου άλλου μέλους. Στη συστηματική τυχαία δειγματοληψία τα μέλη του πληθυσμού δεν έχουν ίση πιθανότητα επιλογής στο δείγμα, Καθώς η επιλογή ενός μέλους εξαρτάται από την επιλογή του προηγούμενου. 10

Η επιλογή γίνεται ως εξής: Δειγματοληψία (3/7) Εάν θέλουμε δείγμα 100 από πληθυσμό 1000: o Τότε παίρνουμε το πρώτο μέλος τυχαία από τη θέση 1 έως 10. o Για παράδειγμα το νούμερο 3 και στη συνέχεια επιλέγουμε κάθε 10ο επόμενο μέλος, το νούμερο 13, 23, 33, κλπ. 11

Δειγματοληψία (4/7) Στη στρωματοποιημένη τυχαία δειγματοληψία διαιρούμε τον πληθυσμό σε στρώματα. Ομάδες του πληθυσμού που έχουν ένα ή περισσότερα κοινά χαρακτηριστικά. Τα στρώματα πρέπει να είναι αμοιβαία αποκλειόμενα. Ένα άτομο μπορεί να ανήκει σε ένα μόνο στρώμα. Σε κάθε στρώμα κάνουμε απλή τυχαία δειγματοληψία. Συνήθως κάθε στρώμα έχει τόσα μέλη στο δείγμα όση είναι και η αναλογία στον πληθυσμό. 12

Δειγματοληψία (5/7) Για παράδειγμα, σε ένα γκάλοπ για τις εκλογές θα πρέπει να έχουμε στο δείγμα μας αναλογίες: Στον τόπο διαμονής. Στο φύλο. Στο έτος ηλικίας. Στο μορφωτικό επίπεδο, κλπ. Ίδιες με το γενικό πληθυσμό. 13

Δειγματοληψία (6/7) Εάν μια μεγάλη εταιρεία απασχολεί 45% αποφοίτους Λυκείου, 30% αποφοίτους ΑΕΙ και 25% με μεταπτυχιακό και πάρουμε δείγμα υπαλλήλων θα πρέπει να τηρηθεί η αναλογία αυτή. Στη δειγματοληψία σωρού ο πληθυσμός διαιρείται σε υποπληθυσμούς (clusters). Το δείγμα προκύπτει από κάποιον υπο-πληθυσμό. Για παράδειγμα, για να πάρουμε δείγμα νοσηλευτών από όλα τα νοσοκομεία της χώρας. 14

Δειγματοληψία (7/7) Πρώτα παίρνουμε ένα δείγμα νοσοκομείων. Στη συνέχεια επιλέγουμε με κάποια μέθοδο νοσηλευτές μόνο από τα νοσοκομεία του δείγματος νοσοκομείων. Εάν κάνουμε έρευνα ανάμεσα σε καταναλωτές που ψωνίζουν σε ένα μεγάλο εμπορικό κέντρο: Μπορεί να πάρουμε ως δείγμα τυχαία κάποια καταστήματα και να περιλάβουμε μόνο τους πελάτες αυτών των καταστημάτων. 15

1.Κατανομή Δειγματοληψίας (1/2) Διάγραμμα 1. 1.Κατανομή Δειγματοληψίας (1/2) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 16

1.Κατανομή Δειγματοληψίας (2/2) Πίνακας 1.(Προηγούμενη Διαφάνεια). Τιμές x i και f i. Κατανομή είναι η καταγραφή ή το διάγραμμα ή η συνάρτηση όλων των πιθανών τιμών που παίρνει η τυχαία μεταβλητή. Κατανομή πληθυσμού είναι η κατανομή της συχνότητας όλων των τιμών που λαμβάνει μια μεταβλητή σε ένα πληθυσμό (ή πιθανές τιμές). Κατανομή δείγματος μεγέθους n είναι η κατανομή της συχνότητας των τιμών ενός δείγματος μεγέθους n. 17

2.Κατανομή Δειγματοληψίας H κατανομή των δειγματικών μέσων από όλα τα δυνατά δείγματα μεγέθους n ενός πληθυσμού μεγέθους Ν. Ο μέσος όρος των δειγματικών μέσων ή αλλιώς της νέας κατανομής των δειγματικών μέσων είναι: μ x = 1 m x i = μ. Ο μέσος όρος όλων των μέσων όρων των δειγμάτων που προκύπτουν από έναν πληθυσμό είναι ίσος με το μέσο όρο του πληθυσμού. 18

3.Κατανομή Δειγματοληψίας (1/2) Η διακύμανση της κατανομής δειγματοληψίας είναι: V x = σ2 n. Επομένως, η τυπική απόκλιση του x είναι: σ x = σ n.. 19

3.Κατανομή Δειγματοληψίας (2/2) Η τυπική απόκλιση του μέσου εκφράζει τη μέση απόσταση του δειγματικού μέσου από το μέσο του πληθυσμού. Λέγεται τυπικό σφάλμα και συμβολίζεται με SE (από τις λέξεις Standard Error). Δηλαδή: SE = σ n. 20

4.Κατανομή Δειγματοληψίας (1/2) Το τυπικό σφάλμα υπάρχει γιατί οι δειγματικοί μέσοι δεν συμπίπτουν με το μέσο του πληθυσμού. Το τυπικό σφάλμα δείχνει ποιος είναι ο μέσος όρος της απόκλισης των μέσων όρων των δειγμάτων από το μέσο του πληθυσμού. 21

4.Κατανομή Δειγματοληψίας (2/2) Όσο αυξάνει το μέγεθος του δείγματος τόσο μειώνεται η τιμή του τυπικού σφάλματος: Τόσο πιο κοντά στον πραγματικό μέσο όρο του πληθυσμού θα είναι ο τυπικός δειγματικός μέσος. Αυτό είναι φυσικό, όσο πιο πολλά στοιχεία έχουμε (μεγάλο μέγεθος δείγματος), τόσο περισσότερο θα προσεγγίζουμε την πραγματική παράμετρο του πληθυσμού. 22

5.Κατανομή Δειγματοληψίας (1/2) Όσο μεγαλύτερο το δείγμα τόσο μεγαλύτερη η προσέγγιση του μέσου του πληθυσμού. Όμως, προσέξτε ότι το μέγεθος του δείγματος είναι στον παρονομαστή του τυπικού σφάλματος σε τετραγωνική ρίζα. Έστω n=100. SE = σ 100 = 1 10 σ = 0,1σ. 23

5.Κατανομή Δειγματοληψίας Ενώ n=400. (2/2) SE = σ 400 = 1 20 σ = 0,05σ. Δηλαδή, χρειάστηκε να τετραπλασιάσουμε το δείγμα για να διπλασιάσουμε την ακρίβεια: Να μειώσουμε το τυπικό σφάλμα. 24

6.Κατανομή Δειγματοληψίας (1/2) Διάγραμμα 2. 6.Κατανομές διαφορετικής διακύμανσης με ίδιο μέσο (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 25

6.Κατανομή Δειγματοληψίας (2/2) Σχήμα 1.(Προηγούμενη Διαφάνεια). Κατανομές διαφορετικής διακύμανσης με ίδιο μέσο. H διακύμανση του δειγματικού μέσου γίνεται όλο και μικρότερη όσο μεγαλώνει το δείγμα. Όσο μικρότερη είναι η δειγματική διακύμανση Τόσο μικρότερη θα είναι και η πιθανότητα να βρεθούμε μακριά από τον πραγματικό μέσο. Στην κατανομή με τη μεγάλη διακύμανση υπάρχουν δειγματικοί μέσοι που απέχουν περισσότερο από την πραγματική παράμετρο. 26

7.Κατανομή Δειγματοληψίας (1/2) Σε πολλές έρευνες η αύξηση του μεγέθους του δείγματος είναι είτε πολύ δαπανηρή υπόθεση ή ακόμα και αδύνατη. Γιατί οι εταιρείες δημοσκοπήσεων δεν αυξάνουν το μέγεθος του δείγματος; 27

7.Κατανομή Δειγματοληψίας (2/2) Μα γιατί εάν η απόσταση των κομμάτων είναι 1%: o Τότε θα πρέπει να κατεβεί το τυπικό σφάλμα πολύ κάτω από 1% για να είναι τα αποτελέσματα που δίνει το γκάλοπ αξιοποιήσιμα. o Για να μικραίνει όμως τόσο πολύ το τυπικό σφάλμα θα πρέπει να αυξηθεί το μέγεθος του δείγματος τόσο πολύ που καθίσταται απαγορευτικό από πλευράς κόστους. 28

8.Κατανομή Δειγματοληψίας Παράδειγμα: Έστω ότι: (1/2) Ο πληθυσμός Α είναι όλοι οι εισακτέοι στην Ανώτατη εκπαίδευση για το έτος 2014. Ο πληθυσμός Β είναι οι εισακτέοι στην Φιλοσοφική Σχολή Αθηνών την ίδια χρονιά. Αναζητούμε το μέσο όρο της βαθμολογίας και παίρνουμε ένα δείγμα από τον κάθε πληθυσμό. 29

8.Κατανομή Δειγματοληψίας (2/2) Η μεταβλητότητα στους δύο πληθυσμούς είναι πολύ διαφορετική. Στον πληθυσμό Α η τυπική απόκλιση μπορεί να είναι 4.000 ή 5.000 μονάδες. o Ενώ στον πληθυσμό Β, εάν υποθέσουμε ότι η βάση εισαγωγής στην Φιλοσοφική Σχολή Αθηνών είναι 18.500, η τυπική απόκλιση είναι κάπου 200 μονάδες. 30

9.Κατανομή Δειγματοληψίας (1/2) Επομένως, δυο είναι οι παράγοντες που παίζουν ρόλο στην καλύτερη προσέγγιση της πραγματικής τιμής: Το μέγεθος του δείγματος. Η διασπορά του γεννήτορα πληθυσμού: o Var(x) = SE = σ n. 31

9.Κατανομή Δειγματοληψίας (2/2) Αν ο πληθυσμός από το οποίο πήραμε το δείγμα είναι πεπερασμένος, τότε η διακύμανση θα είναι : N n N 1. σ x = σ n Παρόλα αυτά στις πρακτικές εφαρμογές χρησιμοποιείται ο τύπος : Var(x) = σ2 n. 32

Παράδειγμα 1 (1/5) Έστω ένας πληθυσμός με δεδομένα: 1, 2, 3, 4, 5, 6, 7, 8. Ο μέσος αυτού του πληθυσμού είναι: μ = 1 Ν ι=1 x i = 1+2+3+4+5+6+7+8 8 Η διακύμανση είναι: = 4,5. σ 2 = 1 Ν ι=1 Ν (x i μ) 2 = 5,25. Παρακάτω λαμβάνουμε όλα τα δυνατά δείγματα (με επανατοποθέτηση) μεγέθους n=2. 33

Παράδειγμα 1 (2/5) Διάγραμμα 3. Παράδειγμα 1 (2/5) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 34

Παράδειγμα 1 (3/5) Πίνακας 2.(Προηγούμενη Διαφάνεια). Δυνατά δείγματα με επανατοποθέτηση μεγέθους n=2 του πληθυσμού με δεδομένα 1,2,3,4,5,6,7,8. 35

Παράδειγμα 1 (4/5) Διάγραμμα 4. Παράδειγμα 1 (4/5) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960- 93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 36

Παράδειγμα 1 (5/5) Πίνακας 3.(Προηγούμενη Διαφάνεια). Τιμές x i, f i και x i f i. μ x = 1 f i f i x i = 288 64 V x = σ2 n = 5,25 2 = 2,625. Var(x) = SE = 1,62. = 4,5 = μ. 37

Το Κεντρικό Οριακό Θεώρημα (1/6) Ανεξαρτήτως της κατανομής του γεννήτορα πληθυσμού, οι κατανομές των δειγματικών μέσων μεγέθους n>30 ακολουθούν προσεγγιστικά την κανονική κατανομή. Η κατανομή του γεννήτορα πληθυσμού μπορεί να είναι πολύ διαφορετική από την κανονική, δύναται να είναι ακόμη και διακριτή. Όσο μεγαλώνει το μέγεθος του δείγματος τόσο η κατανομή δειγματοληψίας προσεγγίζει καλύτερα την κανονική κατανομή. Ο μέσος της κατανομής των δειγματικών και διακύμανση. 38

Το Κεντρικό Οριακό Θεώρημα (2/6) Ο μέσος της κατανομής των δειγματικών μέσων είναι ο μέσος του πληθυσμού: μ x = μ. η τυπική απόκλιση είναι: σ x = σ n. Μπορούμε να τυποποιήσουμε την μεταβλητή του δειγματικού μέσου: Ζ = x μ σ/ n.. 39

Το Κεντρικό Οριακό Θεώρημα (3/6) Διάγραμμα 5. Το Κεντρικό Οριακό Θεώρημα (3/6) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 40

Το Κεντρικό Οριακό Θεώρημα (4/6) Σχήμα 2.(Προηγούμενη Διαφάνεια). Κατανομές δειγματικών μέσων για διάφορα n κανονικού και μη κανονικού πληθυσμού. 41

Το Κεντρικό Οριακό Θεώρημα (5/6) Διάγραμμα 6. Το κεντρικό οριακό Θεώρημα (5/6) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 42

Το Κεντρικό Οριακό Θεώρημα (6/6) Σχήμα 3.(Προηγούμενη Διαφάνεια). Τιμές κατανομής μ x σ x, μ x, μ x + σ x. 43

Παράδειγμα 2 (1/8) Παράδειγμα: Το κόστος των κατοικιών σε μία πόλη κατανέμεται κανονικά με μέσο 170.000 ευρώ και τυπική απόκλιση 40.000 ευρώ. Λαμβάνουμε δείγμα 100 κατοικιών. Να υπολογιστεί η πιθανότητα η μέση τιμή του δείγματος να είναι μεγαλύτερη από 175.000 ευρώ. 44

Απάντηση: Παράδειγμα 2 (2/8) Αφού η κατανομή του πληθυσμού είναι κανονική και το οποιοδήποτε δείγμα θα έχει κανονική κατανομή. Το τυπικό σφάλμα του μέσου θα είναι: σ x = σ σ n x = 40,000 = 40,000 100 10 = 4,000. 45

Αναζητούμε την πιθανότητα: P x > 175.000. Z x = x μ σ x. P Ζ > 175,000 170,000 4,000 Παράδειγμα 2 (3/8) = P Ζ > 5,000 4,000 = P Ζ > 1,25. P Ζ > 1,25 = 1 P Ζ < 1,25 = 1 0,8944 = 0,1056. Δηλαδή η πιθανότητα ο μέσος του δείγματος να είναι μεγαλύτερος από 175.000 ευρώ είναι 10,56%. 46

Παράδειγμα 2 (4/8) Το κόστος των κατοικιών σε μία πόλη κατανέμεται κανονικά με μέσο 170.000 ευρώ και τυπική απόκλιση 40.000 ευρώ. Να υπολογιστεί η πιθανότητα η μέση τιμή του δείγματος των κατοικιών να είναι ανάμεσα σε 165.000 και 175.000 ευρώ, καθώς επίσης και η πιθανότητα η τιμή μιας κατοικίας να είναι ανάμεσα τα ίδια όρια. 47

Παράδειγμα 2 (5/8) Θα υπολογίσουμε την πιθανότητα. Θα πρέπει να βρούμε καταρχήν τις τιμές z: P 165,000 x 175,000, Z x = x μ σ x. P 165,000 170,000 4,000 Ζ 175,000 170,000 4,000. 48

Παράδειγμα 2 (6/8) P 5,000 Ζ 5,000 4,000 4,000 = P 1,25 Ζ 1,25. P Ζ 1,25 P Ζ 1,25 = 0,8944 0,1056 = 0,7888. Δηλαδή η πιθανότητα ο μέσος του δείγματος να είναι ανάμεσα σε 165.000 και 175.000 ευρώ είναι 78,88%. Θα υπολογίσουμε τώρα τις τιμές για μια μεμονωμένη παρατήρηση (κατοικία) δίχως τη χρήση του Κεντρικού Οριακού Θεωρήματος. 49

Παράδειγμα 2 (7/8) Θα υπολογίσουμε τώρα τις τιμές για μια μεμονωμένη παρατήρηση (κατοικία) δίχως τη χρήση του Κεντρικού Οριακού Θεωρήματος: P 165,000 x 175,000, Z x = x μ σ x. P 165,000 170,000 40,000 P 5,000 40,000 Ζ 5,000 40,000 Ζ 175,000 170,000 40,000. = P 0,125 Ζ 0,125. P Ζ 0,125 P Ζ 0,125 = 0,5495 0,4505 = 0,099. 50

Παράδειγμα 2 (8/8) Δηλαδή η πιθανότητα η τιμή μιας κατοικίας να είναι ανάμεσα σε 165.000 και 175.000 ευρώ είναι 9,9%. Με άλλα λόγια είμαστε περισσότερο βέβαιοι ότι το διάστημα 165.000 με 175.000 περιλαμβάνει το δειγματικό μέσο, παρά μια μεμονωμένη τιμή. Εφόσον ο μέσος 170.000 βρίσκεται στο εν λόγω διάστημα συμπεραίνουμε ότι: Ο δειγματικός μέσος προσεγγίζει καλύτερα το μέσο του πληθυσμού σε σχέση με μία μεμονωμένη τιμή της κατανομής. 51

Παράδειγμα 3 (1/2) Το μέσο εισόδημα στη Κοζάνη είναι 15.000 ευρώ με τυπική απόκλιση 5.000 ευρώ. Η κατανομή του εισοδήματος είναι άγνωστη. Εάν πάρουμε ένα δείγμα 35 κατοίκων της Κοζάνης ποια είναι η πιθανότητα το μέσο εισόδημα του δείγματος να είναι κάτω από 13.000 ευρώ; Κάτω από 10.000 ευρώ; Για το ίδιο δείγμα, ποια είναι η πιθανότητα το μέσο εισόδημα του δείγματος να είναι ανάμεσα σε 14.000 και 17.000 ευρώ; 52

Παράδειγμα 3 (2/2) Εάν πάρουμε δείγμα 70 ατόμων, ποια είναι η πιθανότητα το μέσο εισόδημα του νέου δείγματος να είναι ανάμεσα σε 14.000 και 17.000 ευρώ; Η κατανομή του πληθυσμού είναι άγνωστη, όμως το δείγμα είναι μεγαλύτερο από 30 άτομα και επομένως σύμφωνα με το Κεντρικό Οριακό Θεώρημα η κατανομή δειγματοληψίας του μέσου μπορεί να προσεγγιστεί με την κανονική κατανομή. Z x = x μ σ x. 53

1.Διάστημα Εμπιστοσύνης Μέσου (1/2) Με τον όρο παράμετρος νοείται μια ποσότητα, ένας αριθμός, που χαρακτηρίζει έναν πληθυσμό. Για παράδειγμα, ο μέσος όρος και η τυπική απόκλιση είναι παράμετροι: Είναι κάποια συγκεκριμένα νούμερα, που χαρακτηρίζουν έναν πληθυσμό. 54

1.Διάστημα Εμπιστοσύνης Μέσου (2/2) Για παράδειγμα, ο μέσος όρος και η τυπική απόκλιση είναι παράμετροι (συνέχεια): Ο μέσος μας δείχνει πού βρίσκεται το κέντρο του πληθυσμού. Ενώ η τυπική απόκλιση μας δείχνει ποια είναι η μέση απόσταση που έχουν από το μέσο τα μέλη του πληθυσμού. 55

2.Διάστημα Εμπιστοσύνης Μέσου Με τον όρο εκτιμητής (estimator) νοείται ένας κανόνας, μια διαδικασία εκτίμησης μιας άγνωστης παραμέτρου: Μία συνάρτηση τιμών ενός τυχαίου δείγματος. Η οποία μπορεί να χρησιμοποιηθεί για την εκτίμηση της αντίστοιχης παραμέτρου στον πληθυσμό. Ο εκτιμητής είναι τυχαία μεταβλητή, με την έννοια ότι για κάθε δείγμα μπορεί να παράγει διαφορετικά αποτελέσματα. Η τιμή που παίρνει ο εκτιμητής σε κάποια συγκεκριμένη περίπτωση λέγεται εκτίμηση (estimation). 56

3.Διάστημα Εμπιστοσύνης Μέσου (1/2) Ένας εκτιμητής μπορεί να δώσει μια: Καλή εκτίμηση. Μια τιμή για την παράμετρο η οποία δεν διαφέρει πολύ από την πραγματική τιμή του πληθυσμού. Ή μια κακή εκτίμηση. Δηλαδή μία τιμή που διαφέρει σημαντικά από την πραγματική τιμή του πληθυσμού. 57

3.Διάστημα Εμπιστοσύνης Μέσου (2/2) Η εκτίμηση λέγεται επίσης και στατιστική (statistic). Επίσης με τον όρο στατιστική μπορεί να εννοούμε το σύνολο των τεχνικών και των διαδικασιών που αφορούν στην ανάλυση δεδομένων, στην παρουσίαση των δεδομένων, στη διαδικασία λήψης αποφάσεων. 58

4.Διάστημα Εμπιστοσύνης Μέσου Ο αριθμός των ανεξάρτητων πληροφοριών για να εκτιμήσουμε μια παράμετρο λέγεται βαθμοί ελευθερίας (degrees of freedom). Σε γενικές γραμμές, οι βαθμοί ελευθερίας σε μια εκτίμηση είναι: Ο αριθμός των δεδομένων που περιέχονται στο δείγμα μείον τον αριθμό των εκτιμήσεων για παραμέτρους. Που υπολογίζονται σε ενδιάμεσα στάδια στη διαδικασία εκτίμησης της παραμέτρου. 59

5.Διάστημα Εμπιστοσύνης Για παράδειγμα: Μέσου Στον τύπο της διακύμανσης του δείγματος έχουμε n-1 βαθμούς ελευθερίας. s 2 = f i(x i x) 2. n 1 Προκύπτει από τον αριθμό των μελών του δείγματος μείον τον αριθμό των παραμέτρων που χρησιμοποιούνται στη διαδικασία της εκτίμησης. Χρησιμοποιείται μία παράμετρος, ο δειγματικός μέσος που είναι εκτίμηση του. 60

6.Διάστημα Εμπιστοσύνης Μέσου (1/2) Ένας άλλος τρόπος για να αντιληφθούμε την έννοια των βαθμών ελευθερίας είναι ο εξής: Ας υποθέσουμε ότι πρέπει να επιλέξουμε δέκα αριθμούς οι οποίοι πρέπει να δίνουν άθροισμα 100. Οι εννιά από τους αριθμούς αυτούς μπορεί να είναι οποιοιδήποτε: 61

6.Διάστημα Εμπιστοσύνης Μέσου (2/2) Όμως ο δέκατος θα πρέπει να είναι αυτός που αθροιζόμενο με τους άλλους εννιά θα δώσει αποτέλεσμα 20. Επομένως, είμαστε ελεύθεροι να επιλέξουμε εννιά αριθμούς, και άρα έχουμε εννιά βαθμούς ελευθερίας. 62

7.Διάστημα Εμπιστοσύνης Μέσου (1/2) Η τιμή του εκτιμητή στο δείγμα ονομάζεται εκτίμηση σημείου (point estimation), ή σημειακή εκτίμηση. Για παράδειγμα, ο μέσος ενός δείγματος είναι μια εκτίμηση του μέσου του πληθυσμού. Από ένα άλλο δείγμα μπορεί να προκύψει ένας άλλος δειγματικός μέσος, ο οποίος πιθανότατα θα διαφέρει από τον πρώτο. 63

7.Διάστημα Εμπιστοσύνης Μέσου (2/2) Γενικώς, οι απόλυτες διαφορές μεταξύ των εκτιμητών και των παραμέτρων του πληθυσμού ονομάζονται δειγματικά σφάλματα. Στην περίπτωση του δειγματικού μέσου το σφάλμα ορίζεται ως εξής: E = x μ. 64

8.Διάστημα Εμπιστοσύνης Μέσου (1/2) Στην επαγωγική στατιστική δύναται να υπολογίσουμε την πιθανότητα σφάλματος: Εφόσον εκτιμήσουμε ένα διάστημα στο οποίο θα βρίσκεται η πραγματική παράμετρος του πληθυσμού με ορισμένη πιθανότητα. Τα άκρα του διαστήματος δημιουργούν ένα διάστημα εμπιστοσύνης (confidence interval), μέσα στο οποίο είμαστε πεπεισμένοι ότι με πιθανότητα. 65

8.Διάστημα Εμπιστοσύνης Μέσου (2/2) Για παράδειγμα 95% βρίσκεται η τιμή της παραμέτρου του πληθυσμού. Όσο μεγαλύτερο το εύρος του διαστήματος εμπιστοσύνης, τόσο μεγαλώνει η πιθανότητα η παράμετρος να βρίσκεται μέσα στο διάστημα. 66

9.Διάστημα Εμπιστοσύνης Μέσου (1/2) Προσθέτοντας και αφαιρώντας τυπικά σφάλματα στην εκτίμηση της παραμέτρου: Για παράδειγμα στο δειγματικό μέσο, δημιουργούμε διαστήματα τιμών τα οποία καλύπτουν την τιμή της παραμέτρου του πληθυσμού. Είμαστε όμως 100% σίγουροι γι αυτό; Για να είμαστε 100% σίγουροι ότι ο μέσος του πληθυσμού καλύπτεται από το διάστημα που έχουμε κατασκευάσει θα πρέπει το διάστημα αυτό να είναι ένα πολύ μεγάλο διάστημα. 67

9.Διάστημα Εμπιστοσύνης Μέσου (2/2) Με άλλα λόγια, θα πρέπει στο δειγματικό μέσο να προσθέσουμε και να αφαιρέσουμε έναν πολύ μεγάλο αριθμό. Ένα πολύ μεγάλο διάστημα μας είναι άχρηστο. Για παράδειγμα, το να πούμε ότι ένα κόμμα στις εκλογές θα πάρει 40% συν ή πλην 60%, δηλαδή ανάμεσα στο 0% και στο 100% προφανώς είναι μια άχρηστη πληροφορία. 68

10.Διάστημα Εμπιστοσύνης Μέσου (1/2) Η μείωση του διαστήματος το οποίο καλύπτει την πραγματική τιμή του πληθυσμού δημιουργεί και μείωση του επιπέδου βεβαιότητας. Συχνά το επίπεδο βεβαιότητας προκαθορίζεται σε 90%, 95% ή 99% και δημιουργούνται έτσι τα ανάλογα διαστήματα εμπιστοσύνης. Αν αφαιρέσουμε τη μονάδα από το επίπεδο βεβαιότητας, τότε προκύπτει το επίπεδο σημαντικότητας α. 69

10.Διάστημα Εμπιστοσύνης Μέσου (2/2) Πιθανότητα να διαπράξουμε λάθος. Εάν μια τυχαία μεταβλητή κατανέμεται κανονικά με μέσο μ και τυπική απόκλιση σ. τότε η κατανομή δειγματοληψίας του μέσου x είναι η κανονική κατανομή με μέσο μ και τυπικό σφάλμα σ n.. 70

11.Διάστημα Εμπιστοσύνης Μέσου Γνωρίζουμε ότι σε μια τυπική κανονική κατανομή ισχύει: P( 1,96 Z 1,96)=0,95. P( 1,96 x μ σ/ n 1,96)=0,95. P( 1,96 σ n x μ 1,96 σ n )=0,95. P( x 1,96 σ n μ x + 1,96 σ n )=0,95. P(x 1,96 σ n μ x + 1,96 σ n )=0,95. 71

12.Διάστημα Εμπιστοσύνης Μέσου (1/2) Βλέποντας την κατανομή του δειγματικού μέσου μπορούμε να έχουμε συμπεράσματα για το τυχόν σφάλμα εκτίμησης. Χρησιμοποιώντας του πίνακες της τυποποιημένης κανονικής κατανομής, μπορεί να διαπιστωθεί ότι το 95 % των τιμών μιας κανονικά κατανεμημένης τυχαίας μεταβλητής βρίσκεται μεταξύ (- 1,96, +1,96) τυπικών αποκλίσεων από το μέσο μ. 72

12.Διάστημα Εμπιστοσύνης Μέσου (2/2) Άρα το 95 % των δειγματικών μέσων θα πρέπει να βρίσκεται μεταξύ +- 1,96 τυπικών αποκλίσεων από το μέσο μ. Αν εκτίνουμε τον δειγματικό μέσο +- 1,96 τυπικές αποκλίσεις τότε θα είμαστε κατά 95 % βέβαιοι ότι ο πραγματικός μέσος θα βρίσκεται σ αυτό το διάστημα. 73

13.Διάστημα Εμπιστοσύνης Μέσου Με α είναι το Επίπεδο Σημαντικότητας: Συμβολίζεται διεθνώς με το α. Είναι η πιθανότητα η τιμή του μέσου μ του πληθυσμού να βρίσκεται εκτός του παρακάτω διαστήματος. Με το γράμμα Ζ συμβολίζουμε τα όρια μιας τυποποιημένης κανονικής κατανομής: x σ n Z a 2 μ x + σ Z a. n 2 74

14.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 7. 14.Διάστημα Εμπιστοσύνης Μέσου (1/2)(Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 75

14.Διάστημα Εμπιστοσύνης Μέσου (2/2) Σχήμα 4.(Προηγούμενη Διαφάνεια). Κατανομή και διάστημα εμπιστοσύνης μέσου. x σ n Z a 2 μ x + σ Z a. n 2 76

15.Διάστημα Εμπιστοσύνης Μέσου Διάστημα εμπιστοσύνης για τον μέσο μ του πληθυσμού όταν ακολουθεί την κανονική κατανομή με μέγεθος δείγματος n > 30 και η σ2 του πληθυσμού γνωστή. Παράδειγμα: Σε ένα τυχαίο δείγμα n = 55 μαθητών το μέσο βάρος έχει υπολογιστεί ίσο με 70 κιλά. Αν η τυπική απόκλιση του πληθυσμού είναι γνωστή και ίση με 12 κιλά, να βρεθεί το διάστημα εμπιστοσύνης για το μέσο βάρος του πληθυσμού με πιθανότητα 95 %. 77

16.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 8. 16.Διάστημα Εμπιστοσύνης Μέσου (1/2)(Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 78

16.Διάστημα Εμπιστοσύνης Μέσου (2/2) Πίνακας 4(α). (Προηγούμενη Διαφάνεια). Πίνακας αθροιστικής κατανομής. α = 0,05 α/2 = 0,025. 1 α/2 = 1 0,025 = 0,975. x σ n Z a 2 μ x + σ Z a. n 2 70 12 55 1,96 μ 70 + 12 55 1,96. 66,83 μ 73,17. 79

17.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάστημα εμπιστοσύνης για τον μέσο μ του πληθυσμού όταν ακολουθεί την κανονική κατανομή με μέγεθος δείγματος n> 30 και η σ2 του πληθυσμού άγνωστη. Παράδειγμα Η μέση τιμή σε ένα τυχαίο δείγμα 80 παρατηρήσεων είναι 30 και δειγματική τυπική απόκλιση 10. Να βρεθεί 90 % διάστημα εμπιστοσύνης για τον μέσο μ του πληθυσμού. 80

17.Διάστημα Εμπιστοσύνης Μέσου (2/2) Να βρεθεί 95 % διάστημα εμπιστοσύνης για τον μέσο μ του πληθυσμού. Να βρεθεί 99 % διάστημα εμπιστοσύνης για τον μέσο μ του πληθυσμού. 81

18.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 9. 18.Διάστημα Εμπιστοσύνης Μέσου (1/2)(Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 82

18.Διάστημα Εμπιστοσύνης Μέσου (2/2) Πίνακας 4(β).(Προηγούμενη Διαφάνεια). Πίνακας αθροιστικής κατανομής. α = 0,10 α/2 = 0,05 1 α/2 = 1 0,05 = 0,95. Ζα/2 = 1,645. x S n Z a 2 μ x + S Z a. n 2 140 10 80 1,645 μ 140 + 10 80 1,645. 138,16 μ 141,84. 83

19.Διάστημα Εμπιστοσύνης Παράδειγμα. Μέσου Σε ένα δείγμα 100 μαθητών ενός Σχολείου και ο μέσος όρος διαβάσματος είναι πέντε ώρες την ημέρα με τυπική απόκλιση 2 ώρες. Ποιό είναι το 95% διάστημα εμπιστοσύνης για τις ώρες που διαβάζουν κατά μέσο όρο την ημέρα οι μαθητές όλου του Σχολείου; Ποιό είναι το 97% διάστημα εμπιστοσύνης; 84

20.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 10. 20.Διάστημα Εμπιστοσύνης Μέσου (1/2)(Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 85

20.Διάστημα Εμπιστοσύνης Μέσου (2/2) Σχήμα 5.(Προηγούμενη Διαφάνεια). Διάστημα εμπιστοσύνης μέσου μεγάλων και μικρών δειγμάτων κανονικών ή μη κανονικών πληθυσμών. 86

21.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 11. 21.Διάστημα Εμπιστοσύνης Μέσου (1/2) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 87

21.Διάστημα Εμπιστοσύνης Μέσου (2/2) Πίνακας 5.(Προηγούμενη Διαφάνεια). Ηλικία παικτών ομάδας ποδοσφαίρου. Διάστημα εμπιστοσύνης για τον μέσο μ του πληθυσμού όταν ακολουθεί την κανονική κατανομή με μέγεθος δείγματος n < 30 και η σ2 του πληθυσμού άγνωστη. Παράδειγμα: Σε ένα δείγμα μιας ομάδας ποδοσφαίρου (της βασικής ενδεκάδας), η ηλικία των παικτών δίνεται στον παρακάτω πίνακα. Να βρεθεί το 95% διάστημα εμπιστοσύνης για το σύνολο των ομάδων του πρωταθλήματος. 88

22.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 12. 22.Διάστημα Εμπιστοσύνης Μέσου (1/2)(Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 89

22.Διάστημα Εμπιστοσύνης Μέσου (2/2) Πίνακας 6. (Προηγούμενη Διαφάνεια). Πίνακας αθροιστικής κατανομής. n = 6 α = 0,05 α/2 = 0,25 1 0,05 = 0,95. Ζα/2 = 2,228. x S n t a 2 μ x + S t a. n 2 90

23.Διάστημα Εμπιστοσύνης Μέσου (1/2) Διάγραμμα 13. 23.Διάστημα Εμπιστοσύνης Μέσου (1/2) (Πηγή: Συγγραφείς: Νίκος Σαριαννίδης, Γιώργος Κοντέος. Έκδοση: 1η/2012.ISBN: 978-960-93-3977-3 Διαθέτης (Εκδότης): ΓΕΩΡΓΙΟΣ ΚΟΝΤΕΟΣ). 91

23.Διάστημα Εμπιστοσύνης Μέσου (2/2) Πίνακας 6. (Προηγούμενη Διαφάνεια). Πίνακας αθροιστικής κατανομής. s = s 2 = 10,23 = 3,198 και x = 1 n 1 6 x S n t a 2 x i x = 26,64. μ x + S n t a 2. x i x = 26,64 3,198 3,198 2,228 μ 26,64 + 2,228 11 11 24,49 μ 28,79. 92

Τέλος Ενότητας