ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθηγητής Ι. Μητρόπουλος TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE DEPARTMENT: BUSINESS ADMINISTRATION (PATRAS) Address: M. Alexandrou 1, 263 34 PATRA Greece Tel.:+2610 369213,Fax:+2610 396184, email: mitro@teipat.gr Professor J. Mitropoulos Θέµα: Έλεγχος υποθέσεων και εκτιµητής διαστήµατος εµπιστοσύνης για τη διασπορά και την αναλογία (ποσοστό) ενός δείγµατος Επιµέλεια: Χρυσάνθη Παπαθανασοπούλου Ηµεροµηνία: 16/01/2017 1
Άσκηση: Έλεγχος υποθέσεων και εκτιµητής διαστήµατος εµπιστοσύνης για την διασπορά ενός δείγµατος. Μετά από πολλά χρόνια διδασκαλίας ένας καθηγητής στατιστικής υπολόγισε ότι οι βαθμοί των φοιτητών στην τελική εξέταση του μαθήματος του έχουν διασπορά σ 2 =250. Πρόσφατα έκανε μερικές αλλαγές στον τρόπο εξέτασης και επιθυμεί να ελέγξει αν η διασπορά έχει μειωθεί ως συνέπεια του νέου τρόπου εξέτασης. Στον παρακάτω πίνακα έχουν καταγραφεί οι βαθμοί ενός τυχαίου δείγματος φοιτητών. Μπορούμε από τα δεδομένα να συμπεράνουμε με στάθμη σημαντικότητας 10% ότι η διασπορά έχει μειωθεί; 57 92 99 73 62 64 75 70 88 60 Επίλυση: Η παράμετρος που μας ενδιαφέρει είναι η διασπορά του πληθυσμού και σύμφωνα με την εκφώνηση, η υπόθεση που θέλει να ελέγξει ο καθηγητής μπορεί να διατυπωθεί ως εξής: Η 0 : σ 2 =250 κατά Η 1 : σ 2 <250 Ο έλεγχος που θα χρησιμοποιηθεί είναι ο Χ 2. Υπολογίζουμε: Χ! = 57 + 92 +. +88 + 60 = 740 Χ 2 = (!!!)!!!! X!! = 57! + 92! + + 88! + 60! = 56652 όπου υπολογίζεται η διασπορά του δείγματος ως εξής: s! = X!!!! X! 740 n 56652 = 10 = n 1 10 1 = 1892 = 210,22 9 56652 547600 10 9 = 56652 54760 9 2
Στην συνέχεια υπολογίζεται η τιμή του ελέγχου: Χ 2 = (!!!)!!!! =!"!!!"#,!!!"# =!!"#,!!!"# =7,568 Υπολογίζεται η περιοχή απόρριψης: Χ!!!! < Χ!!!,!!! = Χ!!!.!,!"!! = Χ!.!,! = από τους πίνακες της κατανομής Χ! = 4,17 Τέλος ελέγχουμε αν η τιμή του ελέγχου βρίσκεται στην περιοχή απόρριψης. Διαπιστώνουμε ότι η τιμή Χ 2 =7,568 δεν είναι μικρότερη του 4,17 άρα δεν βρίσκεται στην περιοχή απόρριψης, συνεπώς δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Ερμηνεία: Το αποτέλεσμα δείχνει ότι δεν υπάρχουν αρκετά στατιστικά στοιχεία που να μας κάνουν να συμπεράνουμε ότι η διασπορά έχει μειωθεί ως συνέπεια του νέου τρόπου εξέτασης. Σημαντικές Επισημάνσεις: 1. Για τον υπολογισμό της τιμής του ελέγχου Χ 2 = (!!!)!!!!, όπου σ 2 αντικαθιστούμε την τιμή της Η 0 (δηλαδή σ 2 =250). 2. Η περιοχή απόρριψης σχετίζεται με την φορά της Η 1, δηλαδή: a. Αν ο έλεγχος ήταν Η 1 : σ 2 >250 η περιοχή απόρριψης θα ήταν: Χ! > Χ!,!!! b. Αν ο έλεγχος ήταν Η 1 : σ 2 250 η περιοχή απόρριψης θα ήταν: Χ! < Χ!!!!,!!! ή Χ! > Χ!!,!!! 3
Εκτιµητής διάστηµατος εµπιστοσύνης για την διασπορά του πληθυσµού: Να εκτιμήσετε με στάθμη εμπιστοσύνης 90% τη διασπορά του πληθυσμού, δηλαδή τη διασπορά των βαθμών των φοιτητών στην τελική εξέταση του μαθήματος. Επίλυση: α=10/100= 0,1, άρα α/2=0,05 και 1- α/2=1-0,05=0,95 LCL=!!!!!!. (!"!!)!"#,!!!!,!!!!! =!"#!,!"!,!",!!",! =111,95!!!!! UCL=! =!"#!,!"!!!!!,!!!!! =!"#!,!"!.!",!!,!! =586,16 Διαπιστώνουμε ότι η διασπορά των βαθμών των φοιτητών στην τελική εξέταση του μαθήματος είναι μεταξύ 111,95 και 586,16 με στάθμη εμπιστοσύνης 90%. 4
Άσκηση: Έλεγχος υποθέσεων και εκτιµητής διαστήµατος εµπιστοσύνης για την αναλογία (ποσοστό) ενός δείγµατος. Σε κάποιες πολιτείες ο νόμος απαιτεί από τους οδηγούς να έχουν αναμμένα τα φώτα του αυτοκινήτου όταν οδηγούν με βροχή. Ένας τροχονόμος πιστεύει ότι οι οδηγοί που συμμορφώνονται στον νόμο αυτό είναι λιγότεροι από 25%. Για να ελέγξει αυτή την υπόθεση επιλέγει ένα τυχαίο δείγμα 200 διερχόμενων αυτοκινήτων μια βροχερή μέρα και διαπιστώνει ότι 41 από αυτά έχουν αναμμένα φώτα. Να ελέγξετε με στάθμη σημαντικότητας 10% αν η υπόθεση του τροχονόμου είναι ορθή. Θεωρία: Γνωρίζουμε ότι αν τα δεδομένα είναι ονομαστικά το μόνο που μπορούμε να κάνουμε για να περιγράψουμε έναν πληθυσμό είναι να μετρήσουμε πόσες φορές εμφανίζεται κάθε τιμή. Οι αριθμοί αυτοί ονομάζονται συχνότητες και από αυτές υπολογίζονται οι σχετικές συχνότητες. Σε έναν μεγάλο πληθυσμό η αντίστοιχη έννοια της σχετικής συχνότητας είναι η αναλογία του πληθυσμού, που συμβολίζεται ως p και είναι η παράμετρος που περιγράφει ένα πληθυσμό ονομαστικών δεδομένων. Σε αντίθεση με το διωνυμικό πείραμα, όπου σε κάθε προσπάθεια υπάρχουν δυο μόνο δυνατά αποτελέσματα, μια ονομαστική μεταβλητή έχει περισσότερες από δυο τιμές. Στην πράξη όμως ενδιαφερόμαστε για μια μόνο τιμή (ή ομάδα τιμών) την οποία ονομάζουμε «επιτυχία» ενώ όλες τις άλλες τιμές τις ονομάζουμε «αποτυχία». Με τον τρόπο αυτό, κάθε ονομαστική μεταβλητή μπορεί να θεωρηθεί ότι έχει δυο μόνο δυνατά αποτελέσματα. Για παράδειγμα, μια έρευνα που καταγράφει τις προτιμήσεις των καταναλωτών θα θεωρεί ως «επιτυχία» την μάρκα της επιχείρησης που έχει παραγγείλει την έρευνα. Όμοια, μια πολιτική δημοσκόπηση θα θεωρεί ως «επιτυχία» την προτίμηση των ψηφοφόρων σε έναν από τους υποψηφίους (πιθανό- τατα του κόμματος που έχει παραγγείλει την έρευνα). 5
Επίλυση: Τα δεδομένα είναι ονομαστικά, καθώς οι τιμές της μεταβλητής που εξετάζει ο τροχονόμος (Μεταβλητή: Αναμμένα φώτα) είναι «ΝΑΙ», «ΟΧΙ». Η υπόθεση του τροχονόμου που πρέπει να ελεγχθεί είναι: Η 0 : p=0,25 κατά Η 1 : p<0,25 Ο έλεγχος που θα χρησιμοποιηθεί είναι ο Z: Η αναλογία στο δείγμα είναι: z = p p p(1 p) n p = x n όπου x είναι ο αριθμός των επιτυχιών στο δείγμα (εδώ x = 41) και n είναι το μέγεθος του δείγματος εδώ n=200. Άρα: p = x n = 41 200 = 0,205 και όπου p αντικαθιστούμε την τιμή της Η 0 (δηλαδή p=0,25). Άρα: z = p p p(1 p) n = 0,205 0,25 0,25(1 0,25) 200 = 0,045 0,031 = 1,452 = 0,045 0,25 0,75 200 = 0,045 = 0,045 0,1875 0,0009375 200 Ο έλεγχος ακολουθεί κατά προσέγγιση την τυποποιημένη κανονική κατανομή οπότε σύμφωνα και με την φορά της εναλλακτικής υπόθεσης η περιοχή απόρριψης θα είναι: Ζ<- Ζ α, όπου α= 0,1, άρα: Ζ<- Ζ 0,10 = - 1,285 6
Υπολογισμός Ζ 0,10 και - Ζ 0,10 : Το ζητούμενο είναι η τιμή Ζ 0,10. Ρ(Ζ> Ζ 0,10 ) = 0,10 1 - Ρ(Ζ< Ζ 0,10 ) = 0,10 Ρ(Ζ< Ζ 0,10 ) =1-0,10 Ρ(Ζ< Ζ 0,10 ) =0,90 Αν ανατρέξουμε στον πίνακα της τυποποιημένης κανονικής κατανομής διαπιστώνουμε ότι η τιμή 0,90 δεν υπάρχει και ότι οι πλησιέστερες τιμές είναι 0,8997 για Ζ=1,28 και 0,9015 για Ζ=1,29 αντίστοιχα. Έτσι, μπορούμε να προ- σεγγίσουμε τη ζητούμενη τιμή στο μέσον των δυο πλησιέστερων: Άρα: Ζ 0,10 = 1,28!1,29 2 = 1,285 Λόγω συμμετρίας της τυποποιημένης κανονικής κατανομής: - Ζ 0,10= - 1,285 Τέλος ελέγχουμε αν η τιμή του ελέγχου βρίσκεται στην περιοχή απόρριψης. Διαπιστώνουμε ότι η τιμή z = 1,452 είναι μικρότερη του - 1,285 άρα βρίσκεται στην περιοχή απόρριψης, συνεπώς μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Ερμηνεία: Το αποτέλεσμα δείχνει ότι υπάρχουν αρκετά στατιστικά στοιχεία που να μας κάνουν να συμπεράνουμε ότι οι οδηγοί που συμμορφώνονται στον νόμο αυτό είναι λιγότεροι από 25%. Σημαντικές Επισημάνσεις: 1. Για τον υπολογισμό της τιμής του ελέγχου z =!!!!(!!!)!, όπου p αντικαθιστούμε την τιμή της Η 0 (δηλαδή εδώ p=0,25). 2. Η περιοχή απόρριψης σχετίζεται με την φορά της Η 1, δηλαδή: a. Αν ο έλεγχος ήταν Η 1 : p>0,25 η περιοχή απόρριψης θα ήταν: Ζ>Ζ α b. Αν ο έλεγχος ήταν p 0,25 η περιοχή απόρριψης θα ήταν: Ζ>Ζ α/2 ή Ζ<- Ζ α/2, δηλαδή Ζ > Ζ α/2 7
Εκτιµητής διάστηµατος εµπιστοσύνης για µία αναλογία ενός πληθυσµού: Να εκτιμήσετε με στάθμη εμπιστοσύνης 90% το ποσοστό των οδηγών που συμμορφώνονται στον νόμο. Επίλυση: Η στάθμη εμπιστοσύνης είναι 1- α=0,90 συνεπώς α=0,10 και όπως έχουμε δει: Ζ α/2 =Ζ 0,10/2 = Ζ 0,05 = 1,645. Συνεπώς ο εκτιμητής διαστήματος εμπιστοσύνης 90% υπολογίζεται από τον τύπο: p ± Z!/! p(1 p) n με την προϋπόθεση ότι n p>5 και n (1 p)>5 Άρα: p ± Z!/! p(1 p) n = 0,205 ± 1,645 0,205 1 0,205 200 = 0,205 ± 1,645 0,163 200 = 0,205 ± 1,645 0,000815 = 0,205 ± 1,645 0,0285 = 0,205 ± 0,047 LCL=0,205-0,047= 0,158 UCL= 0,205+0,047=0,252 Ερμηνεία: Σύμφωνα με τα αποτελέσματα που υπολογίστηκαν το ποσοστό των οδηγών που συμμορφώνονται στον νόμο βρίσκεται μεταξύ 15,8% και 25,2%. 8
Εφαρµογή υπολογισµού εκτιµητή διαστήµατος εµπιστοσύνης για τον συνολικό αριθµό ενός πληθυσµού: Κατάτµηση της αγοράς: (Keller- κεφ. 12.4). Ο όρος μαζικό μάρκετινγκ (mass marketing) αναφέρεται στη μαζική παραγωγή και προώθηση ενός ενιαίου προϊόντος για το σύνολο της αγοράς. Το μαζικό μάρκετινγκ είναι ιδιαίτερα αποτελεσματικό για είδη πρώτης ανάγκης, όπως η βενζίνη, που είναι δύσκολο να διαφοροποιηθούν από τον ανταγωνισμό παρά μόνο μέσα από την τιμή και τη διαθεσιμότητα. Σε όλες τις άλλες περιπτώσεις όμως το μαζικό μάρκετινγκ έχει δώσει τη θέση του στο στοχευμένο μάρκετινγκ (target marketing), που απευθύνεται στις ανάγκες ενός ιδιαίτερου τμήματος της αγοράς. Για παράδειγμα, η γνωστή εταιρία αναψυκτικών Coca Cola έχει περάσει από το μαζικό στο στοχευμένο μάρκετινγκ, δημιουργώντας παραλλαγές του αναψυκτικού όπως με λιγότερες θερμίδες ή χωρίς καφεΐνη. Κάθε προϊόν απευθύνεται σε διαφορετικό τμήμα της αγοράς. Επειδή υπάρχουν πολλοί τρόποι για την κατάτμηση μιας αγοράς, οι επιχειρήσεις εξετάζουν διάφορες μεταβλητές (ή χαρακτηριστικά) που μπορούν να οριοθετήσουν ένα νέο τμήμα για ένα ειδικό προϊόν. Η έρευνα αγοράς συγκεντρώνει δεδομένα για τις μεταβλητές αυτές και στη συνέχεια η στατιστική χρησιμοποιεί τα δεδομένα για τον ορισμό των τμημάτων. Το σύνολο των καταναλωτών ενός προϊόντος χωρίζεται σε ομάδες, έτσι ώστε τα μέλη κάθε ομάδας να εμφανίζουν κοινή συμπεριφορά ενώ τα μέλη διαφορετικών ομάδων να εμφανίζουν διαφορετική συμπεριφορά ως προς κάποιο χαρακτηριστικό. Η μέθοδος της κατάτμησης της αγοράς προήλθε από τη διαπίστωση ότι σπάνια ένα προϊόν μπορεί να ικανοποιήσει τις ανάγκες και τις επιθυμίες όλων των καταναλωτών. Μετά τον ορισμό των τμημάτων, η επιχείρηση μπορεί να χρησιμοποιήσει τις τέσσερις συνιστώσες της προώθησης ενός προϊόντος (προϊόν, τιμή, δημοσιότητα, χώρος) για να απευθυνθεί σε κάθε ομάδα με τον πιο αποτελεσματικό τρόπο. Για παράδειγμα, η αυτοκινητοβιομηχανία θα μπορούσε να χρησιμοποιήσει για τη διαφοροποίηση μοντέλων το επίπεδο εκπαίδευσης των πελατών, καθώς είναι πιθανό οι απόφοιτοι πανεπιστημίων να επιλέγουν αυτοκίνητο με κριτήρια που διαφέρουν από αυτά των αποφοίτων λυκείου, αλλά στην πραγματικότητα είναι πιο πιθανό το επίπεδο εισοδήματος να καθορίζει πιο αποφασιστικά το είδος των αυτοκινήτων που επιλέγει κάθε πελάτης. Η στατιστική μπορεί να βοηθήσει τις 9
επιχειρήσεις να αναγνωρίσουν ποια μεταβλητή είναι η καταλληλότερη για την κατάτμηση της αγοράς σε σχέση με ένα προϊόν, αλλά οι μέθοδοι που απαιτούνται είναι εξειδικευμένες και ξεφεύγουν από το επίπεδο του παρόντος βιβλίου. Για να καθορίσει την κερδοφορία ενός στοχευμένου προϊόντος, μια επιχείρηση πρέπει να γνωρίζει το μέγεθος του αντίστοιχου τμήματος της αγοράς. Υπάρχουν τμήματα αγοράς που δεν δικαιολογούν την επένδυση σε ένα εξειδικευμένο προϊόν, είτε επειδή οι αναμενόμενες πωλήσεις είναι πολύ χαμηλές είτε επειδή το κόστος εξυπηρέτησης είναι πολύ υψηλό. Ανάλογα με το είδος της μεταβλητής, το μέγεθος ενός τμήματος της αγοράς μπορεί να υπολογιστεί με διάφορους τρόπους. Για παράδειγμα, τα δεδομένα της τελευταίας απογραφής δίνουν άμεσες και ακριβείς πληροφορίες για την κατάτμηση της αγοράς με βάση ηλικιακά ή γεωγραφικά χαρακτηριστικά. Από την άλλη πλευρά, υπάρχουν μεταβλητές που απαιτούν την πραγματοποίηση έρευνας αγοράς και τη χρήση επαγωγικής στατιστικής για την εκτίμηση του συνολικού αριθμού των ατόμων που έχουν ένα συγκεκριμένο χαρακτηριστικό. Όπως είδαμε στην ενότητα 12.3, ο εκτιμητής διαστήματος εμπιστοσύνης για τον συνολικό αριθμό επιτυχιών σε έναν μεγάλο πεπερασμένο πληθυσμό δίνεται από τον τύπο: Ν (p ± Z!! p 1 p n ) 10
Κατάτµηση της αγοράς δηµητριακών (Keller Παράδειγµα 12-06) Ένας παραγωγός δημητριακών χρησιμοποιεί ως μεταβλητή για τη διαφοροποίηση των προϊόντων του τον βαθμό ευαισθητοποίησης των καταναλωτών σε θέματα υγείας και δίαιτας. Έτσι οι καταναλωτές χωρίζονται σε τέσσερις ομάδες, που έχουν κωδικοποιηθεί ως εξής: Κωδικός Χαρακτηριστικό 1 Ενδιαφέρονται για υγιεινή διατροφή 2 Ενδιαφέρονται για απώλεια βάρους 3 Ελέγχουν τη διατροφή τους λόγω προβλήματος υγείας 4 Αδιάφοροι Για να εκτιμήσει το μέγεθος των ομάδων ο παραγωγός πραγματοποιεί τακτικά έρευνες και κατατάσσει τα μέλη του δείγματος σε μια από τις τέσσερις ομάδες ανάλογα με τις απαντήσεις που δίνουν σε ένα ερωτηματολόγιο. Σε μια πρόσφατη έρευνα το μέγεθος του δείγματος ήταν 1.250 άτομα ηλικίας 20 και άνω. Σύμφωνα με την τελευταία απογραφή ο συνολικός αριθμός των αμερικανών 20 ετών και άνω είναι 194.506.000. Να εκτιμήσετε με στάθμη εμπιστοσύνης 95% τον συνολικό αριθμό των αμερικανών 20 ετών και άνω που ενδιαφέρονται για υγιεινή διατροφή. Λύση Το ζητούμενο είναι η περιγραφή του πληθυσμού των ενηλίκων αμερικανών. Τα δεδομένα είναι ονομαστικά, κατά συνέπεια η παράμετρος που πρέπει να υπολογιστεί είναι η αναλογία p των ενηλίκων αμερικανών που σύμφωνα με το ερωτηματολόγιο κατατάσσουν τον εαυτό τους σε αυτούς που ενδιαφέρονται για υγιεινή διατροφή. Ο εκτιμητής διαστήματος εμπιστοσύνης που θα χρησιμοποιήσουμε, και από τον οποίο θα εκτιμήσουμε το μέγεθος του τμήματος της αγοράς, είναι: p ± Z!! p 1 p n 11
Αν θέλουμε να υπολογίσουμε χειρόγραφα την αναλογία, πρέπει πρώτα να μετρήσουμε τον αριθμό των επιτυχιών (τιμή μεταβλητής=1) στο αρχείο των δεδο- μένων. Δίνεται ότι x =269. Έτσι έχουμε: p = x n = 269 1250 = 0,2152 Η στάθμη εμπιστοσύνης είναι 1- α=0,95 ή α=0,05 και έτσι είναι Ζ α/2 =Ζ 0,025 =1,96. Συνεπώς ο εκτιμητής διαστήματος εμπιστοσύνης 95% είναι: 0,2152 ± 1,96 0,2152(1 0,2152) 1250 = 0,2152 ± 0,0228 άρα: LCL=0,1924 UCL=0,2380 Ερμηνεία Σύμφωνα με τα αποτελέσματα που υπολογίστηκαν με όλους τους παραπάνω τρόπους, η αναλογία των ενήλικων αμερικανών της πρώτης ομάδας, δηλαδή αυτών που ενδιαφέρονται για υγιεινή διατροφή, βρίσκεται μεταξύ 19,24% και 23,80%. Αν πολλαπλασιάσουμε τα ποσοστά αυτά επί τον συνολικό αριθμό των αμερικανών 20 ετών και άνω, που σύμφωνα με την τελευταία απογραφή είναι 194.506.000, μπορούμε να βρούμε έναν εκτιμητή διαστήματος εμπιστοσύνης 95% για τον συνολικό αριθμό των ενηλίκων αμερικανών της ομάδας 1: LCL=0,1924 194.506.000= 37.422954 UCL=0,2380 194.506.000= 46.292.428 Τυπολόγιο καθώς και οι πίνακες των κατανοµών υπάρχουν αναρτηµένα στο e- class του µαθήµατος 12