Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο TEI Δυτικής Μακεδονίας και στην Ανώτατη Εκκλησιαστική Ακαδημία Θεσσαλονίκης» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Σκοποί ενότητας Ανάλυση ορισμών: Κατανομή t Student. Έλεγχοι Στατιστικών Υποθέσεων-Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως. Έλεγχος της διαφοράς δυο μέσων. Κατανομή δειγματοληψίας διαφοράς δύο μέσων δειγμάτων. Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών. Έλεγχος Υποθέσεων. 4
Περιεχόμενα ενότητας (1 από 2) Κατανομή t Student. Έλεγχοι Στατιστικών Υποθέσεων. Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως. Έλεγχος της διαφοράς δυο μέσων. 5
Περιεχόμενα ενότητας (2 από 2) Κατανομή δειγματοληψίας διαφοράς δύο μέσων δειγμάτων. Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών. Έλεγχος Υποθέσεων. 6
Κατανομή t Student (1 από 7) Σε πολλές εφαρμογές που οι δειγματικοί μέσοι χρησιμοποιούνται για την εκτίμηση των αντίστοιχων πληθυσμιακών μέσων, η τιμή της πληθυσμιακής διακυμάνσεως δεν είναι γνωστή. Μπορούμε, όμως, να πάρουμε μια εκτίμηση S 2 της σ 2 από τα δεδομένα του δείγματος που μας δίνουν την τιμήν του δειγματικού μέσου Χ. Εάν το δείγμα είναι μεγέθους <n>, η εκτίμηση S 2 βασίζεται επί (n-1) βαθμών ελευθερίας. H κατανομή που θα μας βοηθήσει στην εκτίμηση του πληθυσμιακού μέσου είναι η t. 7
Κατανομή t Student (2 από 7) Σχήμα 1: Κατανομή t Student. Πηγή: Διδάσκων (2015). 8
Κατανομή t Student (3 από 7) Η κατανομή t είναι συμμετρική περί τον μέσο. Για μεγάλα δείγματα, πρακτικά, ταυτίζεται με την κανονική με μ = Ο και σ=1. Για μικρά δείγματα κάτω των 30 μονάδων η διάκρισης γίνεται προφανής. Ειδικότερα, ενώ υπάρχει μία μόνο τυπική κανονική κατανομή, υπάρχει μία οικογένεια κατανομών t, όπως φαίνεται στο παρακάτω σχήμα. 9
Κατανομή t Student (4 από 7) Εκ της μελέτης του σχήματος προκύπτει ότι για δείγμα μικρού μεγέθους η κατανομή t διαφέρει σημαντικά από την κανονική, αλλά καθώς το δείγμα αυξάνει, αυτή προσεγγίζει την κανονική. Η κατανομή t είναι πινακοποιημένη όχι σύμφωνα με το μέγεθος του δείγματος <n> αλλά βάσει του παρανομαστή της δειγματικής διακυμάνσεως S 2, που ονομάζεται «βαθμοί ελευθερίας». 10
Κατανομή t Student (5 από 7) Για παράδειγμα, για ένα δείγμα μεγέθους η = 3 οι βαθμοί ελευθερίας είναι, β.ε. = n 1= 3 1= 2. Από τον Πίνακα βρίσκουμε ότι η κριτική τιμή t που αφήνει πιθανότητα 2,5% στην άνω (δεξιά) ουρά είναι t 0,025 = 4,3. Λόγω της συμμετρίας: Ρ [-4,30<t<4,30] = 0,95 Πίνακας 1: Δεδομένα άσκησης. Πηγή: Διδάσκων (2015). 11
Κατανομή t Student (6 από 7) Όταν η διακύμανση σ 2 είναι γνωστή, τα όρια του διαστήματος εμπιστοσύνης με πιθανότητα 95%, είναι: Όταν αντί της σ 2 χρησιμοποιήσουμε την S 2, η μόνη αλλαγή που επιβάλλεται είναι η αντικατάσταση του αριθμού 1,96 με έναν άλλο αριθμό που συμβολίζουμε t 0,05. 12
Κατανομή t Student (7 από 7) Όταν έχουμε β.ε =, t 0,025 = 1,96. Με β.ε = 40, t 0,05 αυξάνεται σε 2,021, με 20 β.ε γίνεται 2,086 και συνεχίζει να αυξάνει σταθερά καθώς ο αριθμός των β.ε. μειώνεται. Πίνακας 2: Δεδομένα άσκησης. Πηγή: Διδάσκων (2015). df 0,1 0,05 0,025 0,01 0,005 0,0005 1 3.078 6.314 12.706 31.821 63.657 636.619 10 1.372 1.812 2.228 2.764 3.169 4.587 20 1.325 1.725 2.086 2.528 2.845 3.850 40 1.303 1.684 2.021 2.423 2.704 3.551 1.282 1.645 1.960 2.326 2.576 3.291 13
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου, ορίζονται δυο υποθέσεις: Η μηδενική υπόθεση Η ο και η εναλλακτική Η 1. Η εκλογή της Η 0 και της Η 1 γίνεται σύμφωνα με τον παρακάτω ισχυρισμό: Όταν κάνουμε μια έρευνα και προσπαθούμε να αποδείξουμε κάποιον ισχυρισμό στηριζόμενοι σε κάποιες παρατηρήσεις, τότε την άρνηση αυτού του ισχυρισμού λαμβάνουμε σαν Ηο και τον ίδιο ισχυρισμό σαν H 1. 14
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ (1 από 5) Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας παραμέτρου ενός δείγματος και της αντίστοιχης του πληθυσμού είναι: Στατιστικά ασήμαντη. Οφείλεται στα τυχαία σφάλματα της δειγματοληψίας. Aν δεν υπήρχαν τα σφάλματα της δειγματοληψίας, οι δύο παράμετροι θα ήταν ίσες και η διαφορά τους θα ήταν μηδέν. Π.x.: Η 0 :μ = μ 0 15
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ (2 από 5) Η άλλη υπόθεση ονομάζεται Εναλλακτική Υπόθεση και συμβολίζεται με το Η 1. Υποθέτουμε ότι η παράμετρος του πληθυσμού έχει διαφορετική τιμή από την υποθετική τιμή. Η εμφανιζόμενη διαφορά είναι στατιστικά σημαντική και δεν οφείλεται στα τυχαία σφάλματα της δειγματοληψίας. Π.χ. Η 1 :μ μ 0. 16
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ (3 από 5) Η αποδοχή ή η απόρριψη μιας στατιστικής υποθέσεως -και ειδικά της υποθέσεως Η 0 -γίνεται με μια ορισμένη πιθανότητα να διαπράξουμε σφάλμα. Κατά τον έλεγχο μιας στατιστικής υποθέσεως είναι ενδεχόμενο να διαπράξουμε δύο βασικά σφάλματα: α) Σφάλμα Τύπου Ι. Αν η ελεγχόμενη υπόθεση Η 0 είναι σωστή και το κριτήριο ελέγχου την απορρίψει σαν λανθασμένη. Η πιθανότητα διαπράξεως Σφάλματος Τύπου Ι: Ονομάζεται Επίπεδο Σημαντικότητας και συμβολίζεται διεθνώς με το γράμμα α. Δηλ. η πιθανότητα απορρίψεως μιας σωστής υποθέσεως Η 0. 17
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ β) Σφάλμα Τύπου II. (4 από 5) Αν η ελεγχόμενη υπόθεση Η 0 είναι λανθασμένη και το κριτήριο ελέγχου την δεχθεί σαν σωστή, τότε διαπράττουμε Σφάλμα Τύπου II. Η πιθανότητα διαπράξεως Σφάλματος Τύπου II συμβολίζεται με το β. Στην πράξη, τα εφαρμοζόμενα κριτήρια ελέγχου πρέπει να ελαχιστοποιούν τις πιθανότητες εμφανίσεως σφαλμάτων και των δύο τύπων. 18
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ (5 από 5) Συνήθως, προσπαθούμε να αποφύγουμε Σφάλμα Τύπου Ι. Δηλαδή να απορρίψουμε σωστή υπόθεση Ηο. Για να το επιτύχουμε: Προκαθορίζουμε την πιθανότητα να διαπράξουμε Σφάλμα Τύπου Ι σε ορισμένο Επίπεδο Σημαντικότητας α. Συνήθως είναι το α = 0,05 (5%) ή α =0,01 (1%). Αν π.χ. προκαθορίσουμε α =0,05 και απορρίψουμε την Η 0 με βεβαιότητα 95%. Τότε σε 100 όμοιες περιπτώσεις μόνο σε 5 είναι δυνατόν να κάνουμε λάθος. Δηλαδή να είναι σωστή η υπόθεση και εμείς να την απορρίψουμε. 19
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως(1 από 7) Συνήθως σ έναν έλεγχο υπόθεσης σαν Ηο θέτουμε την ισότητα της παραμέτρου με κάποια γνωστή τιμή και σαν εναλλακτική. Την αύξηση της τιμής αν ισχυριζόμαστε ότι αυξάνει η τιμή της παραμέτρου ή Τη μείωση της τιμής αν ισχυριζόμαστε ότι ελαττώνεται η τιμή της παραμέτρου ελαττώνεται ή Απλώς την διαφοροποίηση της τιμής αν ισχυριζόμαστε ότι η τιμή της παραμέτρου άλλαξε. 20
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως (2 από 7) Έστω ότι θέλουμε να ελέγξουμε την υπόθεση ότι ο μέσος μ ενός πληθυσμού είναι ίσος με μ 0. Παίρνουμε τυχαίο δείγμα n μονάδων και υπολογίζουμε το μέσο ( ) του δείγματος. Η διαδικασία για τον έλεγχο μιας στατιστικής υποθέσεως ακολουθεί τα εξής στάδια: 1) Θέτουμε τις υποθέσεις Η 0 και Η 1 : Η 0 :μ = μ 0, Η 1 :μ μ 0 Καθορίζουμε το επίπεδο σημαντικότητας α = 0,01 ή α=0,05 ή α = 0,10. Δίπλευρο κριτήριο ελέγχου. 21
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως (3 από 7) 2) Εφαρμόζουμε το κατάλληλο στατιστικό κριτήριο ελέγχου, από το οποίο προκύπτει μια συγκεκριμένη τιμή. Αν το δείγμα είναι πολυπληθές (n > 30), τότε χρησιμοποιούμε το εξής κριτήριο: Με βάση το επίπεδο σημαντικότητας βρίσκουμε τις κριτικές τιμές της τυποποιημένης μεταβλητής Ζ πάνω στην Τυποποιημένη Κανονική Καμπύλη. Καθορίζουμε τις περιοχές αποδοχής και απορρίψεως της υποθέσεως Η 0. 22
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως (4 από 7) Συγκρίνουμε την τιμή της Ζ που βρέθηκε από το κριτήριο ελέγχου με τις κριτικές τιμές Ζ α/2. Αν η τιμή Ζ του κριτηρίου ικανοποιεί τις ανισότητες: Z< -Ζ α/2 ή Z> Ζ α/2. Τότε απορρίπτουμε την υπόθεση Η 0. Σχήμα 2: Στατιστική Υπόθεση. Πηγή: Διδάσκων (2015). 23
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως (5 από 7) Αν όμως η τιμή Ζ του κριτηρίου ικανοποιεί τη διπλή ανισότητα: -Ζ α/2 <Z< Ζ α/2. Τότε αποδεχόμαστε την υπόθεση Η 0. Σχήμα 3: Στατιστική Υπόθεση. Πηγή: Διδάσκων (2015). 24
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως(6 από 7) Στο δίπλευρο κριτήριο ελέγχου, το επίπεδο σημαντικότητας α ισοκατανέμεται. Μονόπλευρο test: Σε ορισμένες περιπτώσεις ενδιαφερόμαστε αν μια στατιστική παράμετρος (π.χ. ο μέσος) είναι μικρότερη ή μεγαλύτερη από μια συγκεκριμένη τιμή (έστω μ 0 ). Στις περιπτώσεις αυτές, οι ελεγχόμενες υποθέσεις είναι: Η ο : μ=μ 0. Η 1 : μ<μ 0 ή Η ο : μ=μ 0. Η 1 : μ>μ 0. 25
Διαδικασία ελέγχου μιας Στατιστικής Υποθέσεως(7 από 7) Οι δειγματικοί μέσοι ακολουθούν την κανονική κατανομή. Ο μέσος τους είναι ο μέσος του πληθυσμού ζητούμενο. Η απόσταση των δειγματικών μέσων από το μέσο τους εξαρτάται από τυπική απόκλιση που έχουν δηλαδή: Άρα αν ο δειγματικός μέσος που έχουμε διαφέρει σημαντικά από αυτόν που υποθέτουμε ως πραγματικός μέσος του πληθυσμού τότε απορρίπτουμε την υπόθεση. 26
Άσκηση 1 (1 από 4) Από έναν πληθυσμό πήραμε ένα δείγμα n=50, το οποίο έσωσε μέσο όρο 28 και διακύμανση 34. Μπορούμε να υποστηρίζουμε ότι ο μέσος όρος του πληθυσμού απ όπου προήλθε το δείγμα είναι ίσος με 32 με α=0,05. Λύση. n=50>30. H 0 :μ=32. Η 1 :μ 32. 27
Άσκηση 1 (2 από 4) Γνωρίζουμε ότι η μεταβλητή: Η διαφορά του δειγματικού μέσου από τον υποστηριζόμενο πληθυσμιακό μέσο είναι ικανή για να μας πείσει ότι τελικά ο πληθυσμιακός μέσος δεν είναι 32. α=0,05 είναι η πιθανότητα ο δειγματικός μέσος να βρεθεί στην περιοχή αυτή της τυποποιημένης κανονικής κατανομής ή αλλιώς: Είναι η πιθανότητα να απορρίψουμε την βασική υπόθεση ενώ αυτή είναι σωστή. 28
Άσκηση 1 (3 από 4) α=0,05 α/2=0,025 0,5-0,025=0,475 Ζ α/2 =1,96 Ζ * <-Ζ α/2 =-4,88<-1,96 Απορρίπτεται η βασική υπόθεση μ=32. 29
Άσκηση 1 (4 από 4) Σχήμα 4: Δεδομένα παραδείγματος. Πηγή: Διδάσκων (2015). 30
Άσκηση 2 (1 από 2) Το όριο αντοχής ενός τύπου καλωδίου έχει μέση τιμή 1800 κιλά και τυπική απόκλιση 100 κιλά. Η εταιρία που φτιάχνει τα καλώδια ισχυρίζεται ότι μια βελτίωση στη μέθοδο κατασκευής αύξησε το όριο αντοχής. Για να επαληθεύσουμε, δοκιμάζουμε 50 νέα καλώδια. Εάν το μέσο όριο αντοχής τους βρέθηκε 1850 κιλά, είναι σωστός ο ισχυρισμός της εταιρίας σε επίπεδο σημαντικότητας 0,01; 31
Άσκηση 2 (2 από 2) n=50>30 Μονόπλευρο test. H 0 :μ=1800 Η 1 :μ>1800 α=0,01 0,5-0,01 =0,49 Ζ α =2,33. Πίνακας 3: Κανονικής z. Πηγή: Διδάσκων (2015) Ζ * >Ζ α =3,55>2,33. Απορρίπτεται η βασική υπόθεση μ=1800. 32
Άσκηση 3 (1 από 2) Ένα τοπικό περιοδικό αποφάσισε να κάνει έρευνα για την ποιότητα του φαγητού των εστιατορίων της Κοζάνης. Η άριστη ποιότητα βαθμολογείται με 10 ενώ ποιοτικά θεωρούνται τα εστιατόρια με βαθμολογία πάνω από 7. Ένα δείγμα 12 φοιτητών επιλέχθηκε να ρωτηθεί για το εστιατόριο «ΑΑΑ» και έδωσαν τις εξής απαντήσεις. 7,8,10,8,6,9,6,7,7,8,9,8. Ο δειγματικός μέσος είναι 7,75 και η τυπική απόκλιση 1,215. Εάν υποθέσουμε ότι η κατανομή του πληθυσμού ακολουθεί προσεγγιστικά την κανονική κατανομή, μπορούμε να θεωρήσουμε ότι το εστιατόριο «ΑΑΑ» παρέχει ποιοτικό φαγητό. α=0,05. 33
Άσκηση 3 (2 από 2) n=12<30 Κατανομή t εφόσον ο πληθυσμός ακολουθεί την κανονική κατανομή. Μονόπλευρο test: H 0 :μ<7. Η 1 :μ> 7. α=0,05 t n-1 =t 12-1 =t 11. t 0,05 =1,796. t * >t α =2,14>1,796. Απορρίπτεται η βασική υπόθεση μ=7. Μικρά δείγματα κατανομή t. Πίνακας 4: Κατανομή t. Πηγή: Διδάσκων (2015). 34
Έλεγχος της διαφοράς δυο μέσων (1 από 14) 1. Όταν τα δείγματα είναι μεγάλα και ανεξάρτητα: Γνωστές οι διακυμάνσεις σ 12 και σ 22. Υποθέτουμε ότι επιλέγουμε τυχαία δυο δείγματα με μεγέθη n 1, n 2 >30 αντίστοιχα,από δυο πληθυσμούς. Αν τα μεγέθη των δειγμάτων είναι αρκετά μεγάλα (n 1, n 2 > 30), τότε η κατανομή δειγματοληψίας της διαφοράς θα είναι κανονική. Ο έλεγχος στην περίπτωση αυτή γίνεται με: 35
Έλεγχος της διαφοράς δυο μέσων (2 από 14) Έστω ότι επιθυμούμε να ελέγξουμε την υπόθεση ότι τα δυο δείγματα προέρχονται από πληθυσμούς με ίσους μέσους. Ο έλεγχος γίνεται με Η 0 : μ 1 = μ 2, Η 1 :μ 1 μ 2 είναι ισοδύναμος με Η 0 : μ 1 - μ 2 =0 Η 1 :μ 1 - μ 2 0. 36
Έλεγχος της διαφοράς δυο μέσων Από δυο πληθυσμούς επιλέξαμε τυχαία δυο ανεξάρτητα δείγματα μεγέθους n 1 =100 και n 2 =100 αντίστοιχα. Αν οι διακυμάνσεις των δυο πληθυσμών είναι σ 12 =400 και σ 22 =900 και οι δειγματικοί μέσοι 493 και 517 αντίστοιχα. Να ελεγχθεί αν οι δυο πληθυσμοί έχουν ίσες μέσες τιμές με α=0,05 Η 0 : μ 1 = μ 2, Η 1 :μ 1 μ 2 σ 12 =400 σ 22 =900 (3 από 14) Η τυχαία μεταβλητή ακολουθεί την Ν(0,1) Η τυπική απόκλιση είναι ίση: 37
Έλεγχος της διαφοράς δυο μέσων (4 από 14) Η 0 : μ 1 = μ 2, Η 1 :μ 1 μ 2 σ 12 =400 σ 22 =900 α=0,05 α/2=0,025 0,5-0,025=0,475 Ζ α/2 =1,96 Διάστημα αποδοχής: -Ζ α/2 <Ζ< Ζ α/2-1,96<ζ< 1,96 Πίνακας 5: Κατανομής z. Πηγή: Διδάσκων (2015). 38
Έλεγχος της διαφοράς δυο μέσων (5 από 14) Αν το τεστ ήταν μονόπλευρο δηλαδή: Η 0 : μ 1 > μ 2 ή μ 1 - μ 2 >0 Η 1 :μ 1 < μ 2 ή μ 1 - μ 2 <0 σ 12 =400 σ 22 =900 α=0,05 0,5-0,05=0,45 Ζ α =1,645 Διάστημα αποδοχής -Ζ α <Ζ -1,645<Ζ Πίνακας 6: Κατανομής z. Πηγή: Διδάσκων (2015). 39
Έλεγχος της διαφοράς δυο μέσων (6 από 14) Αν οι διακυμάνσεις σ 12 και σ 2 2 είναι άγνωστες τότες τις εκτιμούμε από το δείγμα. Ο έλεγχος γίνεται από την παρακάτω συνάρτηση. 40
Έλεγχος της διαφοράς δυο μέσων (7 από 14) Ελήφθησαν δυο ανεξάρτητα δείγματα n 1 =64 και n 2 =32 με διακυμάνσεις S 12 =49 S 22 =36 και μέσους Ποια η πιθανότητα η διαφορά των μέσων του πληθυσμού να είναι μεγαλύτερη ή ίση με 3; Θα ελέγξουμε την υπόθεση Η 0 : μ 1 - μ 2 > 3. Η 1 :μ 1 < μ 2 41
Έλεγχος της διαφοράς δυο μέσων (8 από 14) Ανεξάρτητα δείγματα n 1 =64 και n 2 =32 με διακυμάνσεις S 12 =49 S 22 =36 και μέσους: Ποια η πιθανότητα η διαφορά των μέσων του πληθυσμού να είναι μεγαλύτερη ή ίση με 3; Θα ελέγξουμε την υπόθεση: Η 0 : μ 1 - μ 2 > 3 Η 1 :μ 1 < μ 2 Αν επιθυμούμε βεβαιότητα πάνω από 23,27 % τότε θα πρέπει να απορρίψουμε την βασική υπόθεση. Υπενθυμίζουμε ότι συνήθως επιζητούμε βεβαιότητα πάνω από 90 % γεγονός που συνεπάγεται την απόρριψη της Η 0. 42
Έλεγχος της διαφοράς δυο μέσων (9 από 14) 1. Όταν τα δείγματα είναι μικρά και ανεξάρτητα. Με την υπόθεση ότι οι πληθυσμοί είναι κανονικοί και οι διακυμάνσεις των πληθυσμών ίσες σ 12 = σ 2 2. Εκτιμούμε την κοινή διακύμανση από τον τύπο: Επομένως η διακύμανση της διαφοράς των μέσων θα είναι ίση: 43
Έλεγχος της διαφοράς δυο μέσων (10 από 14) 1. Όταν τα δείγματα είναι μικρά και ανεξάρτητα Με την υπόθεση ότι οι οι πληθυσμοί είναι κανονικοί και οι διακυμάνσεις των πληθυσμών ίσες σ 12 = σ 22. Ο έλεγχος γίνεται με την στατιστικό μέτρο t. 44
Έλεγχος της διαφοράς δυο μέσων (11 από 14) Τα δεδομένα δυο ανεξάρτητων δειγμάτων που έχουν επιλεγεί από δυο πληθυσμών που κατανέμονται κανονικά ως προς την μεταβλητή Χ είναι: n 1 =10 και n 2 =8. S 12 =1,7 S 22 =2,2. Να ελεγχθεί σε επίπεδο σημαντικότητας α=0,05 η ισότητα των μέσων των δυο πληθυσμών. Η 0 : μ 1 = μ 2, Η 1 :μ 1 μ 2. 45
Έλεγχος της διαφοράς δυο μέσων (12 από 14) n 1 =10 και n 2 =8. S 12 =1,7 S 22 =2,2 Να ελεγχθεί σε επίπεδο σημαντικότητας α=0,05 η ισότητα των μέσων των δυο πληθυσμών. Η 0 : μ 1 = μ 2 ή μ 1 - μ 2 =0 Η 1 :μ 1 μ 2. α=0,05 =>α/2=0,025 t n-1 =t 18-2 =t 16 46
Έλεγχος της διαφοράς δυο μέσων (13 από 14) Πίνακας 7: Δεδομένα άσκησης. Πηγή: Διδάσκων (2015). 47
Έλεγχος της διαφοράς δυο μέσων (14 από 14) Δεν εξετάζονται οι κάτωθι περιπτώσεις (Εκτός ύλης). Τα δείγματα να προέρχονται από τον ίδιο πληθυσμό. Τα δείγματα να προέρχονται από πληθυσμούς μικρούς όμως κανονικούς και με άνισες διακυμάνσεις. Στην περίπτωση αυτή πάλι χρησιμοποιείται το στατιστικό μέτρο t όμως με βαθμούς ελευθερίας: Αν τα δείγματα είναι μικρά και δεν γνωρίζουμε την κατανομή τότε ο έλεγχος μπορεί να γίνει με μη παραμετρικές μεθόδους (Anderson: Statistics for business and economics). 48
Κατανομή δειγματοληψίας διαφ. δύο μέσων δειγμάτων (1 από 4) Έστω δύο άπειροι πληθυσμοί, οι οποίοι έχουν: μέσους μ 1 και μ 2 και Τυπικές αποκλίσεις σ 1 και σ 2. Αν πάρουμε όλα τα δυνατά ζεύγη δειγμάτων n 1, n 2, και από κάθε ζεύγος δείγματος υπολογίσουμε τους μέσους: χ1, χ 2 στη συνέχεια πάρουμε τη διαφορά της, τότε θα προκύψουν τόσες διαφορές όσα και τα ζεύγη των δειγμάτων. 49
Κατανομή δειγματοληψίας διαφ. δύο μέσων δειγμάτων (2 από 4) 2. Η μέση τιμή των διαφορών συμπίπτει με τη διαφορά των μέσων μ 1 - μ 2 των πληθυσμών από τους οποίους έχουν ληφθεί τα δείγματα. 50
Κατανομή δειγματοληψίας διαφ. δύο μέσων δειγμάτων (3 από 4) 3. Η διακύμανση της κατανομής δειγματοληψίας της διαφοράς των μέσων των δύο δειγμάτων υπολογίζονται ως εξής: α) Αν οι διακυμάνσεις σ 12 και σ 22 των πληθυσμών είναι γνωστές, τότε η διακύμανση είναι: β) Αν οι διακυμάνσεις σ 12 και σ 22 των πληθυσμών είναι άγνωστες, τότε τις αντικαθιστούμε με τις αμερόληπτες εκτιμήσεις S 12 και S 22 των δειγμάτων, οπότε : 51
Κατανομή δειγματοληψίας διαφ. δύο μέσων δειγμάτων (4 από 4) γ. Αν τα δείγματα προέρχονται από τον ίδιο πληθυσμό ή από όμοιους πληθυσμούς τότε έχουν την ίδια διακύμανση. Αν δεν την έχουμε διαθέσιμη την εκτιμούμε με τον τύπο: Η διακύμανση της κατανομής δειγματοληψίας των μέσων των δειγμάτων θα είναι: 52
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (1 από 7) Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών όταν τα δείγματα είναι μεγάλα n 1, n 2 >30 και οι διακυμάνσεις είναι γνωστές. Το διάστημα εμπιστοσύνης εντός του οποίου αναμένεται ότι θα βρίσκεται η διαφορά μ 1 μ 2 με πιθανότητα ή επίπεδο εμπιστοσύνης 1 - α είναι: 53
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (2 από 7) Έστω δείγμα n 1 =150 με μέση τιμή και δείγμα n 2 =200 με μέση τιμή. Αν οι τυπικές αποκλίσεις του πληθυσμού είναι γνωστές και ίσες με σ 1 =120 και σ 2 =80 να βρεθεί ένα διάστημα εμπιστοσύνης 95 % για την διαφορά των μέσων του πληθυσμού. α=0,05 α/2=0,025 => 0,5-0,025=0,475 Ζ α/2 =1,96 54
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (3 από 7) θεωρούμε ηλεκτρικούς λαμπτήρες δυο διαφορετικών κατασκευαστών Α και Β. Παίρνουμε για το σκοπό αυτό 100 λαμπτήρες από κάθε κατασκευαστή. Βρίσκουμε ότι το δείγμα των λαμπτήρων του κατασκευαστή Α έχει μέση διάρκεια ζωής 1020 ώρες και τυπική απόκλιση 90 ώρες, το δείγμα λαμπτήρων του κατασκευαστή Β έχει μέση διάρκεια ζωής 980 ώρες και τυπική απόκλιση 100 ώρες. Να βρεθεί ένα διάστημα εμπιστοσύνης 90 % για την διαφορά των μέσων του πληθυσμού. 55
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (4 από 7) Με βάση τα στοιχεία του πιο κάτω πίνακα για δυο τυχαία δείγματα από δυο πληθυσμούς να υπολογιστούν. Να βρεθεί ένα διάστημα εμπιστοσύνης 90 % για την διαφορά των μέσων του πληθυσμού. Πίνακας 8: Δείγματος 1 και 2. Πηγή: Διδάσκων (2015). 56
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (5 από 7) Με βάση τα στοιχεία του πιο κάτω πίνακα για δυο τυχαία δείγματα από δυο πληθυσμούς να υπολογιστούν Να βρεθεί ένα διάστημα εμπιστοσύνης 90 % για την διαφορά των μέσων του πληθυσμού. 57
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (6 από 7) Πίνακας 9: Δείγματος 1 και 2 - επίπεδο εμπιστοσύνης. Πηγή: Διδάσκων (2015). 58
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών (7 από 7) Σταθμισμένη διασπορά (pooled variance). Χρησιμοποιείται γιατί έχουμε δύο ανεξάρτητες εκτιμήσεις που προέρχονται από δύο διαφορετικά δείγματα για την ίδια ποσότητα το σ 2. Κάνουμε χρήση και των δύο αυτών εκτιμήσεων λαμβάνοντας δίνοντας όμως την αντίστοιχη βαρύτητα μέγεθος της καθεμιάς. 59
Διακύμανση Όταν n<30, η διακύμανση είναι άγνωστη και η κατανομή κανονική χρησιμοποιούμε την t κατανομή με n-1 βαθμούς ελευθερίας. Όσο περισσότερους βαθμούς ελευθερίας έχουμε τόσο περισσότερο προσεγγίζεται η κανονική κατανομή. Αν n<30, και η κατανομή άγνωστη τότε δεν μπορούμε να βγάλουμε ασφαλές συμπέρασμα αν δύναται μεγαλώνουμε το δείγμα. 60
Δειγματικοί μέσοι Οι δειγματικοί μέσοι ακολουθούν την κανονική κατανομή. Ο μέσος τους είναι ο μέσος του πληθυσμού - ζητούμενο Η απόσταση των δειγματικών μέσων από το μέσο τους εξαρτάται από τυπική απόκλιση που έχουν δηλαδή Άρα αν ο δειγματικός μέσος που έχουμε διαφέρει σημαντικά από αυτόν που υποθέτουμε ως πραγματικός μέσος του πληθυσμού τότε απορρίπτουμε την υπόθεση. 61
Έλεγχος Υποθέσεων (1 από 2) Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης. Κατά την εκτέλεση ενός στατιστικού ελέγχου, ορίζονται δυο υποθέσεις: Η μηδενική υπόθεση Η ο και η εναλλακτική Η 1. Η εκλογή της Η 0 και της Η 1 γίνεται σύμφωνα με τον παρακάτω ισχυρισμό: όταν κάνουμε μια έρευνα και προσπαθούμε να αποδείξουμε κάποιον ισχυρισμό στηριζόμενοι σε κάποιες παρατηρήσεις, τότε την άρνηση αυτού του ισχυρισμού λαμβάνουμε σαν Η ο και τον ίδιο ισχυρισμό σαν H 1. 62
Έλεγχος Υποθέσεων (2 από 2) Συνήθως σ έναν έλεγχο υπόθεσης σαν Ηο θέτουμε την ισότητα της παραμέτρου με κάποια γνωστή τιμή και σαν εναλλακτική. Την αύξηση της τιμής αν ισχυριζόμαστε ότι αυξάνει η τιμή της παραμέτρου ή Τη μείωση της τιμής αν ισχυριζόμαστε ότι ελαττώνεται η τιμή της παραμέτρου ελαττώνεται ή Απλώς την διαφοροποίηση της τιμής αν ισχυριζόμαστε ότι η τιμή της παραμέτρου άλλαξε. 63
ΑΣΚΗΣΗ (1 από 3) Από έναν πληθυσμό πήραμε ένα δείγμα n=50, το οποίο έσωσε μέσο όρο 28 και διακύμανση 34. Μπορούμε να υποστηρίζουμε ότι ο μέσος όρος του πληθυσμού απ όπου προήλθε το δείγμα είναι ίσος με 32 με α=0,05. Λύση. n=50>30. H 0 :μ=32. Η 1 :μ 32. 64
ΑΣΚΗΣΗ (2 από 3) Γνωρίζουμε ότι η μεταβλητή: Η διαφορά του δειγματικού μέσου από τον υποστηριζόμενο πληθυσμιακό μέσο είναι ικανή για να μας πείσει ότι τελικά ο πληθυσμιακός μέσος δεν είναι 32. α=0,05 είναι η πιθανότητα ο δειγματικός μέσος να βρεθεί στην περιοχή αυτή της τυποποιημένης κανονικής κατανομής ή αλλιώς: Είναι η πιθανότητα να απορρίψουμε την βασική υπόθεση ενώ αυτή είναι σωστή. 65
ΑΣΚΗΣΗ (3 από 3) α=0,05 α/2=0,025 1-α/2=1-0,025=0,975. Ζ α/2 =1,96. Ζ * <-Ζ α/2 =-4,88<-1,96. Απορρίπτεται η βασική υπόθεση μ=32. Πίνακας 10: Δεδομενα Άσκησης. Πηγή: Διδάσκων (2015). 66
Σημείωμα Αναφοράς Copyright ΤΕΙ Δυτικής Μακεδονίας, Νικόλαος Σαριαννίδης. «Στατιστική Ι». Έκδοση: 1.0. Κοζάνη 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: 67
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο. που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο. που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο. Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 68
Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς. το Σημείωμα Αδειοδότησης. τη δήλωση Διατήρησης Σημειωμάτων. το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει). μαζί με τους συνοδευόμενους υπερσυνδέσμους. 69