ΤΕΙ ΑΘΗΝΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΩΝ ΕΑΡΙΝΟ ΕΞΑΜΗΝΟ 4-5 ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ (Hypothesis Testig) Ο έλεγχος υποθέσεων και η εκτίμηση είναι οι δύο βασικοί πόλοι της στατιστικής συμπερασματολογίας Ο έλεγχος υποθέσεων έχει σαν αποτέλεσμα μια απόφαση για την τιμή μιας παραμέτρου ενός στατιστικού πληθυσμού, συνήθως του μέσου μ, της διακύμανσης σ, ή της αναλογίας p Βασικοί ορισμοί του ελέγχου υποθέσεων Υπόθεση είναι μια δήλωση για έναν ή περισσότερους πληθυσμούς ή τις παραμέτρους τους Σε έναν έλεγχο υποθέσεων έχουμε την αντιπαραβολή δύο υποθέσεων, της μηδενικής υπόθεσης και της εναλλακτικής υπόθεσης Η μηδενική υπόθεση (ull hypothesis, H ) είναι η υπόθεση που θέλουμε να ελέγξουμε για την ορθότητά της Η εναλλακτική υπόθεση (alterative hypothesis, H ) είναι η υπόθεση η οποία είναι στη διάθεσή μας όταν απορρίπτεται η μηδενική υπόθεση Παράδειγμα Μια εταιρεία κατασκευής ρουλεμάν αυτοκινήτων ισχυρίζεται ότι η μέση διάμετρος του ρουλεμάν είναι cm Μηδενική υπόθεση H : µ = cm Εναλλακτική υπόθεση H : µ cm ) Δήλωση των υποθέσεων Το συμπέρασμα που θέλω να έχω τίθεται πάντα σαν εναλλακτική Ο έλεγχος της μορφής H : µ = µ H: µ µ λέγεται δύο διευθύνσεων (two sie) ή δικατάληκτος Οι έλεγχοι της μορφής H : µ µ H : µ µ ή H: µ < µ H: µ > µ λέγονται μιας διεύθυνσης ή μονοκατάληκτοι ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του Το στατιστικό του ελέγχου είναι μια συνάρτηση των δεδομένων, της οποίας η τιμή χρησιμεύει για την απόρριψη ή μη της μηδενικής υπόθεσης Γενικά, η μορφή του στατιστικού του ελέγχου είναι η ακόλουθη:
ΣΤΑΤΙΣΤΙΚΟ = ( ΔΕΙΓΜΑΤΙΚΟ ΣΤΑΤΙΣΤΙΚΟ) ( ΥΠΟΤΙΘΕΜΕΝΗ ΤΙΜΗ ΠΑΡΑΜΕΤΡΟΥ) ( ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ ΣΤΑΤΙΣΤΙΚΟΥ) Πχ αν έχουμε κανονική κατανομή το στατιστικό θα είναι Ζ= ενώ αν έχουμε σ κατανομή Stuet θα είναι t = s Σε έναν έλεγχο υποθέσεων μπορούμε να έχουμε τα ακόλουθα: ΠΙΘΑΝΗ ΑΠΟΦΑΣΗ ΠΙΘΑΝΗ ΚΑΤΑΣΤΑΣΗ H ΑΛΗΘΗΣ ΨΕΥΔΗΣ ΜΗ ΑΠΟΡΡΙΨΗ H ΑΠΟΡΡΙΨΗ H ΣΩΣΤΗ ΑΠΟΦΑΣΗ ΜΗ ΣΩΣΤΗ ΑΠΟΦΑΣΗ (ΣΦΑΛΜΑ ΤΥΠΟΥ ΙΙ) ΜΗ ΣΩΣΤΗ ΑΠΟΦΑΣΗ (ΣΦΑΛΜΑ ΤΥΠΟΥ Ι) ΣΩΣΤΗ ΑΠΟΦΑΣΗ Το επίπεδο σημαντικότητας (α) ορίζεται ως η πιθανότητα απόρριψης της μηδενικής απόφασης δεδομένου ότι αυτή είναι αληθής Συνήθως επιλέγουμε α=%, ή α=% Για να καθορίσουμε τον κανόνα απόφασης θεωρούμε την κατανομή του στατιστικού ελέγχου Περιοχή απόρριψης της μηδενικής υπόθεσης H είναι το σύνολο όλων των τιμών του στατιστικού για τις οποίες η μηδενική υπόθεση θα απορριφθεί Περιοχή αποδοχής της μηδενικής υπόθεσης H είναι το σύνολο όλων των τιμών του στατιστικού για τις οποίες η μηδενική υπόθεση δεν θα απορριφθεί Κριτική τιμή είναι η τιμή που χωρίζει τους δύο χώρους Στο στάδιο αυτό συλλέγονται τα δεδομένα και η τιμή του στατιστικού του ελέγχου Εφαρμόζουμε τον κανόνα απόφασης στο στάδιο 4, παρατηρώντας αν η τιμή του στατιστικού είναι μεγαλύτερη ή μικρότερη της κριτικής τιμής και ανάλογα απορρίπτουμε ή δεν απορρίπτουμε την μηδενική υπόθεση H Αν απορρίψουμε τη μηδενική υπόθεση συμπεραίνουμε ότι η εναλλακτική είναι αληθής Αν δεν απορρίψουμε τη μηδενική υπόθεση συμπεραίνουμε ότι η μηδενική υπόθεση μπορεί να είναι αληθής
ΠΕΡΙΠΤΩΣΕΙΣ Περίπτωση : έλεγχος υπόθεσης για το μέσο πληθυσμού που ακολουθεί την κανονική κατανομή και η διακύμανση του πληθυσμού είναι γνωστή Παράδειγμα Ένας κοινωνιολόγος έχει αναλάβει μια μελέτη με αντικείμενο τους υπαλλήλους ενός μεγάλου οργανισμού με κάποιο φυσικό ελάττωμα Ο κοινωνιολόγος ισχυρίζεται ότι ο μέσος όρος του πληθυσμού μιας τυχαίας μεταβλητής που ονομάζει κοινωνικότητα είναι μεγαλύτερος του 8 Ο πληθυσμός των τιμών της κοινωνικότητας έχει τυπική απόκλιση Εκλέγεται ένα τυχαίο δείγμα υπαλλήλων με κάποιο φυσικό ελάττωμα και η μέση τιμή της κοινωνικότητας είναι Χ= 8, 65 Ζητείται να ελεγχθεί αν το δείγμα αυτό ισχυροποιεί τη γνώμη του κοινωνιολόγου ότι η κοινωνικότητα είναι μεγαλύτερη του 8 σε επίπεδο σημαντικότητας ) Δήλωση των υποθέσεων H : µ 8 H : µ > 8 ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του Το στατιστικό του ελέγχου είναι Ζ= σ Ισχύει και η κριτική τιμή είναι Ζ a =,645 Αν η τιμή του στατιστικού Ζ>,645 τότε απορρίπτουμε την H 8, 65 8 Ζ= = =,737 σ Επειδή Ζ=,737 < Ζ a =,645 δεν απορρίπτουμε την H Άρα, η μηδενική υπόθεση ότι η μέση τιμή του πληθυσμού των τιμών της κοινωνικότητας είναι 8 μπορεί να είναι αληθής Περίπτωση : έλεγχος υπόθεσης για το μέσο πληθυσμού που ακολουθεί την κανονική κατανομή και η διακύμανση του πληθυσμού είναι άγνωστη Παράδειγμα Ο διευθυντής παραγωγής ενός εργοστασίου διάλεξε 6 οδηγούς να οδηγήσουν ένα αυτοκίνητο που μόλις παρήγαγε το εργοστάσιο, από την πόλη Α στην πόλη Β, για να ελέγξει πόσα χιλιόμετρα τρέχει με ένα λίτρο βενζίνη Η τυχαία μεταβλητή που ενδιέφερε ήταν ο αριθμός Χ των χιλιομέτρων που έτρεξε κάθε αυτοκίνητο με λίτρο βενζίνης Η μέση τιμή του δείγματος είναι Χ= 9,5και η τυπική απόκλιση είναι 3
s=,7 Ο διευθυντής θέλει να κάνει μια διαφήμιση του νέου αυτοκινήτου με το σχόλιο ότι μπορεί να τρέξει κατά μέσο όρο χιλιόμετρα ανά λίτρο Να βρεθεί αν ο ισχυρισμός του υποστηρίζεται από τα δεδομένα σε επίπεδο σημαντικότητας ) Δήλωση των υποθέσεων H : µ H : µ < ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του Το στατιστικό του ελέγχου είναι t = s Ισχύει και η κριτική τιμή είναι t, a = t6,,5 =,5 Αν η τιμή του στατιστικού t<-,5 τότε απορρίπτουμε την H 9,5 t = = =,96 s, 7 6 Επειδή t=-,96 > -,5 δεν απορρίπτουμε την H Άρα, τα δεδομένα στηρίζουν τον ισχυρισμό ότι το αυτοκίνητο καταναλώνει λίτρο βενζίνης στα χιλιόμετρα Σχέση μεταξύ ελέγχου υποθέσεων και διαστημάτων εμπιστοσύνης (-α)% διάστημα εμπιστοσύνης του μέσου μ: σε συνεχή δειγματοληψία από ένα πληθυσμό με κανονική κατανομή, το (-α)% όλων των διαστημάτων που κατασκευάζονται από τυχαία δείγματα μεγέθους, θα περιέχουν την παράμετρο μ του πληθυσμού H : µ = µ Υποθέτουμε ότι έχουμε τον ακόλουθο έλεγχο υπόθεσης: για κάποιο H: µ µ επίπεδο σημαντικότητας α Αντί να ακολουθήσουμε τη διαδικασία των 7 σταδίων του ελέγχου υποθέσεων, μπορούμε να κατασκευάσουμε το (-α)% διάστημα εμπιστοσύνης του μέσου μ Αν η τιμή µ περιέχεται στο διάστημα αυτό, δεν απορρίπτουμε την υπόθεση H Αν η τιμή µ δεν περιέχεται στο διάστημα αυτό, απορρίπτουμε την υπόθεση H Διάστημα εμπιστοσύνης: X ΚΡΙΤΙΚΗ ( ΤΙΜΗ ) ± s 4
ΤΕΙ ΑΘΗΝΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΩΝ ΕΑΡΙΝΟ ΕΞΑΜΗΝΟ 4-5 ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ (Hypothesis Testig) Περίπτωση 3: έλεγχος υπόθεσης για το μέσο πληθυσμού που δεν ακολουθεί την κανονική κατανομή και το μέγεθος του δείγματος είναι τουλάχιστον 3 ( 3 ) Σε αυτή την περίπτωση, σύμφωνα με το Κεντρικό Οριακό Θεώρημα, θα ισχύει ότι το στατιστικό ακολουθεί ασυμπτωτικά την τυποποιημένη κανονική κατανομή s N (,) Επομένως θα χρησιμοποιούμε την κριτική τιμή που δίνεται από τον πίνακα της τυποποιημένης κανονικής κατανομής, z a Παράδειγμα Μια φαρμακευτική εταιρεία παρασκευάζει ένα ειδικό φάρμακο το οποίο πουλάει σε μικρά μπουκάλια των 64 κυβικών εκατοστών το καθένα Η αυτόματη μηχανή που γεμίζει τα μπουκάλια μπορεί να παρουσιάσει ένα ελάττωμα και να γεμίσει ένα μπουκάλι περισσότερου ή λιγότερου όγκου από 64 κυβικά εκατοστά Ο διευθυντής παραγωγής συλλέγει ένα δείγμα μπουκαλιών γεμισμένων με φάρμακο Ο μέσος όγκος του φαρμάκου στα μπουκάλια είναι 64, κυβικά εκατοστά και η δειγματική τυπική απόκλιση είναι,5 κυβικά εκατοστά Ζητείται να ελεγχθεί σε επίπεδο σημαντικότητας 5% αν ο μέσος όγκος του φαρμάκου στα μπουκάλια διαφέρει από 64 κυβικά εκατοστά ) Δήλωση των υποθέσεων H : µ = 64 H : µ 64 ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του Το στατιστικό του ελέγχου είναι z = και ακολουθεί ασυμπτωτικά την s κανονική κατανομή γιατί το μέγεθος του δείγματος είναι τουλάχιστον 3 Ισχύει και η κριτική τιμή είναι za = z,5 =, 96 Αν η τιμή του στατιστικού z > z,5 =, 96 z < ή z>,96 τότε απορρίπτουμε την H 5
64, 64 z = = =, 4 s,5 Επειδή z =, 4 > z,5 =,96 απορρίπτουμε την H σε επίπεδο σημαντικότητας 5% Η αυτόματη μηχανή γεμίσματος των μπουκαλιών με φάρμακο παρουσιάζει πράγματι ελάττωμα και δεν γεμίζει τα μπουκάλια με φάρμακο όγκου ίσου με 64 κυβικά εκατοστά ΕΦΑΡΜΟΓΕΣ Εφαρμογή : Θεωρείστε το δείγμα των 3 ατόμων που έχει εισαχθεί προς επεξεργασία στο SPSS με τα αντίστοιχα δεδομένα Να ελεγχθεί σε επίπεδο σημαντικότητας αν το μέσο ύψος του πληθυσμού διαφέρει από 6 εκατοστά ) Δήλωση των υποθέσεων H : µ = 6 H : µ 6 ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του Το στατιστικό του ελέγχου είναι t = Το SPSS θα μας δίνει πάντα το t-test s Να σημειωθεί όμως, ότι όταν το μέγεθος του δείγματος είναι τουλάχιστον 3, οι κριτικές τιμές της κατανομής stuet προσεγγίζουν τις κριτικές τιμές της τυποποιημένης κανονικής N (,) Ισχύει και η κριτική τιμή είναι t, a/ = t3,,5 =,4 Αν η τιμή του στατιστικού t > t3,,5 =,4 t < ή t>,4 τότε απορρίπτουμε την H 7, 8 6 t = = = 4, 5 s 3, 68 3 Επειδή t = 4, 5 > t3,,5 =,4 απορρίπτουμε την H σε επίπεδο σημαντικότητας 5% Εναλλακτικά, θα μπορούσαμε να χρησιμοποιήσουμε το p-value (probability value) και να το συγκρίνουμε με το επίπεδο σημαντικότητας Συγκεκριμένα, p-value του ελέγχου λέγεται το ελάχιστο επίπεδο σημαντικότητας α για το οποίο απορρίπτεται η μηδενική υπόθεση H Δηλαδή, στο συγκεκριμένο έλεγχο έχουμε p value = P ( t > 4, 5) + P ( t < 4, 5) Αν το p-value είναι μικρότερο του επιπέδου σημαντικότητας του ελέγχου τότε απορρίπτουμε τη μηδενική υπόθεση H με 6
πιθανότητα το πολύ ίση με P ( p value) = Το p-value δίνεται από το στατιστικό πακέτο Άρα, τα δεδομένα δεν στηρίζουν τον ισχυρισμό ότι το μέσο ύψος του πληθυσμού είναι 6 εκατοστά Εναλλακτικά: θα μπορούσε να γίνει ο έλεγχος εξετάζοντας το -α = 95% διάστημα εμπιστοσύνης της μεταβλητής ύψος Αν η τιμή που μας ενδιαφέρει (6) δεν βρίσκεται στο 95% διάστημα εμπιστοσύνης τότε απορρίπτουμε την H Εφαρμογή : Θεωρείστε το δείγμα των 3 ατόμων που έχει εισαχθεί προς επεξεργασία στο SPSS με τα αντίστοιχα δεδομένα Να ελεγχθεί σε επίπεδο σημαντικότητας αν η μέση ηλικία του πληθυσμού διαφέρει από 3 έτη ) Δήλωση των υποθέσεων H : µ = 3 H : µ 3 ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του Το στατιστικό του ελέγχου είναι t = Το SPSS θα μας δίνει πάντα το t-test s Να σημειωθεί όμως, ότι όταν το μέγεθος του δείγματος είναι τουλάχιστον 3, οι κριτικές τιμές της κατανομής stuet προσεγγίζουν τις κριτικές τιμές της τυποποιημένης κανονικής N (,) Ισχύει και η κριτική τιμή είναι t, a/ = t3,,5 =,4 Αν η τιμή του στατιστικού t > t3,,5 =,4 t < ή t>,4 τότε απορρίπτουμε την H,9 3 t = = = 5,7 s, 69 3 Επειδή t = 5,7 > t3,,5 =,4 απορρίπτουμε την H σε επίπεδο σημαντικότητας 5% Εναλλακτικά, θα μπορούσαμε να χρησιμοποιήσουμε το p-value (probability value) και να το συγκρίνουμε με το επίπεδο σημαντικότητας Συγκεκριμένα, p-value του ελέγχου λέγεται το ελάχιστο επίπεδο σημαντικότητας α για το οποίο απορρίπτεται η μηδενική υπόθεση H Δηλαδή, στο συγκεκριμένο έλεγχο έχουμε p value = P ( t > 5,7) + P ( t < 5,7) Αν το p-value είναι μικρότερο του επιπέδου σημαντικότητας του ελέγχου τότε απορρίπτουμε τη μηδενική υπόθεση H με 7
πιθανότητα το πολύ ίση με P ( p value) = Το p-value δίνεται από το στατιστικό πακέτο Άρα, τα δεδομένα δεν στηρίζουν τον ισχυρισμό ότι η μέση ηλικία του πληθυσμού είναι 3 έτη Εναλλακτικά: θα μπορούσε να γίνει ο έλεγχος εξετάζοντας το -α = 95% διάστημα εμπιστοσύνης της μεταβλητής ηλικία Αν η τιμή που μας ενδιαφέρει (3) δεν βρίσκεται στο 95% διάστημα εμπιστοσύνης τότε απορρίπτουμε την H ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΔΙΑΦΟΡΑ ΤΩΝ ΜΕΣΩΝ ΔΥΟ ΠΛΗΘΥΣΜΩΝ ΠΟΥ ΑΚΟΛΟΥΘΟΥΝ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Περίπτωση: Οι διακυμάνσεις των δύο πληθυσμών είναι άγνωστες αλλά ίσες και τα δείγματα από τους δύο πληθυσμούς είναι ανεξάρτητα Στην περίπτωση αυτή το ακόλουθο στατιστικό είναι το κατάλληλο: ( Χ Χ) ( µ µ ) ( ) ( ) s + s t = όπου s p = sp s p + + Το παραπάνω στατιστικό ακολουθεί την κατανομή stuet (t) με + βαθμούς ελευθερίας ΕΦΑΡΜΟΓΕΣ Εφαρμογή : Θεωρείστε το δείγμα των 3 ατόμων που έχει εισαχθεί προς επεξεργασία στο SPSS με τα αντίστοιχα δεδομένα Να ελεγχθεί σε επίπεδο σημαντικότητας αν το μέσο ύψος των ανδρών (πληθυσμός ) διαφέρει από εκείνο των γυναικών (πληθυσμός ) Πριν προχωρήσουμε στα βασικά στάδια του ελέγχου, θα πρέπει να ελέγξουμε αν οι διακυμάνσεις των δύο πληθυσμών είναι ίσες Δηλαδή να διεξάγουμε τον ακόλουθο έλεγχο: H : σ = σ H: σ σ Ο έλεγχος γίνεται με το Levee s test Το SPSS δίνει το αποτέλεσμα του ελέγχου Με βάση το αποτέλεσμα του ελέγχου συνεχίζουμε στα βασικά στάδια του ελέγχου που μας ενδιαφέρει ) Δήλωση των υποθέσεων H : µ = µ H : µ µ 8
ΤΕΙ ΑΘΗΝΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΩΝ ΕΑΡΙΝΟ ΕΞΑΜΗΝΟ 4-5 ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΔΙΑΦΟΡΑ ΤΩΝ ΜΕΣΩΝ ΔΥΟ ΠΛΗΘΥΣΜΩΝ ΠΟΥ ΑΚΟΛΟΥΘΟΥΝ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Περίπτωση: Οι διακυμάνσεις των δύο πληθυσμών είναι άγνωστες αλλά ίσες και τα δείγματα από τους δύο πληθυσμούς είναι ανεξάρτητα Στην περίπτωση αυτή το ακόλουθο στατιστικό είναι το κατάλληλο: ( Χ Χ) ( µ µ ) ( ) ( ) s + s t = όπου s p = sp s p + + Το παραπάνω στατιστικό ακολουθεί την κατανομή stuet (t) με + βαθμούς ελευθερίας ΕΦΑΡΜΟΓΕΣ Εφαρμογή (Εφαρμογή 3, σελ 56, Στατιστική Επιχειρήσεων ΙΙ) : Στο μάθημα οικονομίας του πρώτου έτους, μερικοί σπουδαστές υποστηρίζουν ότι οι άνδρες έχουν μεγαλύτερη γνώση του Χρηματιστηρίου από τις γυναίκες Ο καθηγητής δίνει μια σειρά ερωτήσεων για την μέτρηση του βαθμού γνώσης του Χρηματιστηρίου σε δύο ανεξάρτητα τυχαία δείγματα από 5 άνδρες και 5 γυναίκες αντίστοιχα Τα αποτελέσματα για τους άνδρες είναι: Χ = 69,8, s = 8, 79, = 5 και για τις γυναίκες αντίστοιχα: Χ = 68,53, s = 8,5, = 5 Τα δύο δείγματα είναι ανεξάρτητα και μάλιστα προέρχονται από κανονικούς πληθυσμούς με ίσες διακυμάνσεις Μπορεί κάποιος να συμπεράνει από τα αποτελέσματα ότι η γνώση του Χρηματιστηρίου μεταξύ ανδρών και γυναικών διαφέρει σε επίπεδο σημαντικότητας ; Από τα δεδομένα έχουμε ότι οι διακυμάνσεις είναι άγνωστες αλλά ίσες Οπότε στην εξέταση του θεωρητικού μέρους του μαθήματος θα πηγαίναμε κατευθείαν στα 7 στάδια του ελέγχου Στο εργαστηριακό μέρος θα πρέπει να ελέγξουμε αν οι διακυμάνσεις των δύο πληθυσμών είναι ίσες Δηλαδή να διεξάγουμε τον ακόλουθο έλεγχο: H : σ = σ H: σ σ Ο έλεγχος γίνεται με το Levee s test Το SPSS δίνει το αποτέλεσμα του ελέγχου Με βάση το αποτέλεσμα του ελέγχου συνεχίζουμε στα βασικά στάδια του ελέγχου που μας ενδιαφέρει 9
) Δήλωση των υποθέσεων H : µ = µ H : µ µ ) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του ( Χ Χ) ( µ µ ) Το στατιστικό του ελέγχου είναι t = όπου sp sp + ( ) ( ) s + s sp = Το στατιστικό ακολουθεί την κατανομή stuet (t) με + + βαθμούς ελευθερίας Ισχύει και η κριτική τιμή είναι t +, a/ = t8,,5 =, 48 Αν η τιμή του στατιστικού t > t8,,5 =,48 t < ή t>,48 τότε απορρίπτουμε την H ( ) ( ) 5 8, 79 + 5 8,5 s p = = 34, 77 5 + 5 ( 69,8 68,53) ( ) t = =,88 34, 77 34, 77 + 5 5 Επειδή t =,88 < t8,,5 =, 48 αποδεχόμαστε την H σε επίπεδο σημαντικότητας 5% Εναλλακτικά, θα μπορούσαμε να χρησιμοποιήσουμε το p-value (probability value) και να το συγκρίνουμε με το επίπεδο σημαντικότητας p value = P t >,88 + P t <,88 =,85 > α =, 5 ( ) ( ) Επομένως οι άνδρες και οι γυναίκες σπουδαστές έχουν τον ίδιο βαθμό γνώσης του χρηματιστηρίου σε επίπεδο σημαντικότητας
Περίπτωση: Υποθέτουμε ότι έχουμε έναν πληθυσμό διαφορών i = x i xi όπου x i και x i είναι τιμές μιας τυχαίας μεταβλητής που λαμβάνονται πριν και μετά από ένα ορισμένο γεγονός ή που συσχετίζονται ως προς ένα χαρακτηριστικό Σε αυτή την περίπτωση ενδιαφερόμαστε να ελέγξουμε αν υπάρχει διαφορά μεταξύ των τιμών της μεταβλητής που λαμβάνονται πριν και μετά το συγκεκριμένο γεγονός Θέλουμε να διεξάγουμε τον ακόλουθο έλεγχο υποθέσεων: H : µ = µ H : µ µ Αν ο πληθυσμός των διαφορών ακολουθεί την κανονική κατανομή τότε το στατιστικό µ i i= του ελέγχου είναι t = όπου = Το στατιστικό ακολουθεί την s κατανομή stuet (t) με βαθμούς ελευθερίας Εφαρμογή (Παράδειγμα 37, σελ 4, Στατιστική Επιχειρήσεων) : Η υπηρεσία αστικών συγκοινωνιών μιας πόλης έκανε μια μελέτη για να διαπιστώσει αν ο φωτισμός των δρόμων τη νύχτα συντελεί στη μείωση των αυτοκινητιστικών δυστυχημάτων Ο ακόλουθος πίνακας δείχνει το μέσο ετήσιο αριθμό των δυστυχημάτων σε σημεία της πόλης, ένα χρόνο πριν, και ένα χρόνο μετά την εγκατάσταση νυχτερινού φωτισμού ΘΕΣΗ Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ ΔΥΣΤΥΧΗΜΑΤΑ ΠΡΙΝ ΔΥΣΤΥΧΗΜΑΤΑ ΜΕΤΑ 8 5 4 6 3 4 3 6 6 9 5 3 4 4 3 5 4 3 Είναι τα δεδομένα αυτά ισχυρή ένδειξη ότι ο νυχτερινός φωτισμός συντελεί στη μείωση των δυστυχημάτων σε επίπεδο σημαντικότητας ; Εφαρμόζουμε τον έλεγχο των συσχετισμένων διαφορών, αφού υποθέσουμε ότι ο πληθυσμός των διαφορών ακολουθεί την κανονική κατανομή Οι διαφορές i υπολογίζονται ως εξής: ΔΙΑΦΟΡΕΣ ( i ) 3 9 3 3 - - 6 i i= Η μέση τιμή των διαφορών είναι = =,5 και η τυπική απόκλιση s =,779 ) Δήλωση των υποθέσεων H : µ = H : µ
) Προσδιορισμός του στατιστικού του ελέγχου και της κατανομής του µ Το στατιστικό του ελέγχου είναι t = και ακολουθεί την κατανομή stuet (t) s με βαθμούς ελευθερίας Ισχύει και η κριτική τιμή είναι t, a/ = t,,5 =, Αν η τιμή του στατιστικού t > t,,5 =, t < ή t>, τότε απορρίπτουμε την H µ,5 t = = = 3,6 s, 779 Επειδή t = 3,6 > t,,5 =, απορρίπτουμε την H σε επίπεδο σημαντικότητας 5% Εναλλακτικά, θα μπορούσαμε να χρησιμοποιήσουμε το p-value (probability value) και να το συγκρίνουμε με το επίπεδο σημαντικότητας Επομένως υπάρχει ισχυρή στατιστικά ένδειξη σε επίπεδο σημαντικότητας ότι ο νυχτερινός φωτισμός των δρόμων συνετέλεσα στη μείωση των αυτοκινητιστικών δυστυχημάτων