Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Σχετικά έγγραφα
Θέμα: ΑΣΚΗΣΕΙΣ ΣΤΑ ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΑ 10,12 KELLER

Επιµέλεια: Χρυσάνθη Παπαθανασοπούλου

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

Θέμα: Ενδεικτικό Θέμα εξετάσεων: Μέτρα θέσης Παλινδρόμηση

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Θέμα: Ασκήσεις για εύρεση ολικής, συνδυασμένης και δεσμευμένης πιθανότητας. Βιβλίο Keller Κεφάλαιο 6

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εισαγωγή στην Εκτιμητική

Θέμα: ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Κεφάλαιο 11 Εισαγωγή στον Έλεγχο Υποθέσεων

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

Στατιστική Συμπερασματολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Θέμα: ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΠΙΘΑΝΟΤΗΤΕΣ (Συνδυασμένη, ολική και δεσμευμένη) ΚΕΦΑΛΑΙΟ 6 KELLER

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

X = = 81 9 = 9

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

5. Έλεγχοι Υποθέσεων

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ενδεικτικές ασκήσεις ΔΙΠ 50

3. Κατανομές πιθανότητας

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Γ. Πειραματισμός - Βιομετρία

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Το Κεντρικό Οριακό Θεώρημα

Δειγματοληπτικές κατανομές

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Θέμα: ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΙΣ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΚΕΦΑΛΑΙΟ 7 ΒΙΒΛΙΟ KELLER

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Εισόδημα Κατανάλωση

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Το Κεντρικό Οριακό Θεώρημα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

Έλεγχοι Υποθέσεων. Χρήση της Στατιστικής. Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-2

Διαστήματα Εμπιστοσύνης

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

Εισαγωγή στην Ανάλυση Δεδομένων

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

Στατιστικός έλεγχος υποθέσεων (Μέρος 2 ο ) 3/3/2017

5 o Μάθημα Έλεγχοι Υποθέσεων

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ

Transcript:

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθ η γη τ ής Ι. Μ ητ ρ όπουλ ος TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE DEPARTMENT: BUSINESS ADMINISTRATION (PATRAS) Address: M. Alexandrou 1, 263 34 PATRA Greece Tel.:+2610 369213,Fax:+2610 396184, email: mitro@teipat.gr Profe ss or J. Mi tr opou l os Θέμα: Έλεγχοι υποθέσεων για το μέσο Επιμέλεια: Χρυσάνθη Παπαθανασοπούλου Ημερομηνία: 01/12/2015 1

Έλεγχος για πληθυσμιακούς μέσους Όταν η μηδενική υπόθεση αφορά έναν πληθυσμιακό μέσο, η στατιστική συνάρτηση ελέγχου μπορεί να είναι είτε η Ζ είτε η t. Υπάρχουν δυο περιπτώσεις που χρησιμοποιείται η Ζ. Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός. 2. Η σ είναι γνωστή και το μέγεθος του δείγματος είναι τουλάχιστον 30. (Ο πληθυσμός δεν χρειάζεται, να είναι κανονικός). Συνάρτηση ελέγχου Ζ: Όταν η τυπική απόκλιση σ του πληθυσμού γνωστή και ο πληθυσμός έχει κανονική κατανομή, ο έλεγχος υποθέσεων για τον μέσο μ του πληθυσμού υπολογίζεται από τον τύπο: Εκτιμητής διαστήματος εμπιστοσύνης για τον μέσο του πληθυσμού: Όταν η τυπική απόκλιση σ του πληθυσμού γνωστή και ο πληθυσμός έχει κανονική κατανομή, ο εκτιμητής διαστήματος εμπιστοσύνης (confidence interval estimator) του μέσου μ του πληθυσμού είναι το διάστημα τιμών: Η πιθανότητα 1-α ονομάζεται στάθμη εμπιστοσύνης (confidence level). Οι όροι ονομάζονται κατώτερο όριο εμπιστοσύνης (lower confidence level LCL) και ανώτερο όριο εμπιστοσύνης (upper confidence level UCL) αντίστοιχα. Συχνά ο εκτιμητής διαστήματος εμπιστοσύνης εκφράζεται με την μορφή: 2

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η t: Ο πληθυσμός είναι κανονικός και η σ είναι άγνωστη αλλά η δειγματική τυπική απόκλιση s είναι γνωστή. Συνάρτηση ελέγχου : Όταν η τυπική απόκλιση σ του πληθυσμού είναι άγνωστη και ο πληθυσμός έχει κανονική κατανομή, ο έλεγχος υποθέσεων για τον μέσο μ του πληθυσμού υπολογίζεται από τον τύπο: και ακολουθεί την κατανομή student t με ν=η-1 βαθμούς ελευθερίας. Εκτιμητής διαστήματος εμπιστοσύνης για τον μέσο του πληθυσμού: Όταν η τυπική απόκλιση σ του πληθυσμού είναι άγνωστη και ο πληθυσμός έχει κανονική κατανομή, ο εκτιμητής διαστήματος εμπιστοσύνης του μέσου μ του πληθυσμού υπολογίζεται από τον τύπο: με ν=η-1 βαθμούς ελευθερίας. Περιπτώσεις που δεν καλύπτονται από τις στατιστικές συναρτήσεις ελέγχου Ζ και t: 1. Ο πληθυσμός δεν είναι κανονικός και η σ είναι άγνωστη. (Πολλοί στατιστικοί θα αποδέχονταν έναν t έλεγχο αν το μέγεθος του δείγματος ήταν "αρκετά μεγάλο. Το μέγεθος είναι αρκ ετά μεγάλο αν είναι τουλάχιστον 30 στην περίπτω ση που οι πληθυσμοί πιστεύεται ότι δεν είναι πολύ ασύμμετροι. Αν είναι, γνωστά ότι ο πληθυσμός είναι πολύ ασύμμετρος, τότε το μέγεθος θα πρέπει να είναι αντιστοίχως μεγαλύτερο). 2. Ο πληθυσμός δεν είναι κανονικός και το μέγεθος του δείγματος 3

είναι μικρότερο του 30. 3. Ο πληθυσμός είναι κανονικός και η σ άγνωστη. Είναι γνωστός μόνο ο δειγματικός μέσος και όχι η δειγματική τυπική απόκλιση S. Τα δειγματικά δεδομένα επίσης δεν είναι, γνωστά και συνεπώς το S δεν μπορεί να υπολογιστεί. (Προφανώς, αυτή η περίπτωση είναι σπάνια). Κατηγορίες ελέγχου: 4

Έλεγχος του μέσου ενός πληθυσμού όταν η τυπική απόκλιση είναι γνωστή (συνάρτηση ελέγχου Z) Άσκηση: Ένας φοιτητής διοίκησης επιχειρήσεων ισχυρίζεται ότι ο μέ σος φοιτητής MBA είναι υποχρεωμένος να ετοιμάζει περισσότερες από 5 εργασίες την εβδομάδα. Για να ελέγξει τον ισχυρισμό αυτόν ένας καθηγη τής στατιστικής επέλεξε ένα τυχαίο δείγμα 10 φοιτητών MBA και τους ρώτησε πόσες εργασίες πρέπει να ετοιμάζουν ανά εβδομάδα. Οι απαντήσεις δίνονται στον παρακάτω πίνακα: 2 7 4 8 9 5 11 3 7 4 Μπορεί ο καθηγητής να συμπεράνει με στάθμη σημαντικότητας 5% αν ο ισχυρισμός είναι αληθής, αν είναι γνωστό ότι ο αριθμός των εργασιών ανά εβδομάδα έχει κανονική κατανομή με τυπική απόκλιση σ=1,5; Α. Επίλυση με τυποποιημένο στατιστικό έλεγχο (standardized test statistic) Σύμφωνα με το ερώτημα της άσκησης ο έλεγχος υποθέσεων που πρέπει να γίνει είναι: H 0 : µ = 5 κατά της H 1 : µ > 5 Στην συγκεκριμένη άσκηση η σ είναι γνωστή (σ=1,5) και ο πληθυσμός κανονικός, άρα σύμφωνα με τα παραπάνω, η στατιστική συνάρτηση ελέγχου που πρέπει να χρησιμοποιηθεί είναι η Ζ. 5

Ο τύπος υπολογισμού του Ζ είναι: Όπου: :ο μέσος του δείγματός (πρέπει να υπολογιστεί), : η τιμή που ελέγχεται στην H 0, μ= 5 : η τυπική απόκλιση του πληθυσμού, σ=1,5 : το μέγεθος του δείγματος, Άρα το Ζ είναι: Η περιοχή απόρριψης είναι: * 6

* Υπολογισμός του Ζ 0,05 Το ζητούμενο είναι η τιμή Ζ 0,05. Στην παρακάτω εικόνα φαίνεται η ανάλυση των διαστημάτων, που οδηγεί στον εξής υπολογισμό: Ρ(Ζ> Ζ 0,05 ) = 0,05 1 - Ρ(Ζ< Ζ 0,05 ) = 0,05 Ρ(Ζ< Ζ 0,05 ) =1-0,05 Ρ(Ζ< Ζ 0,05 ) =0,95 Αν ανατρέξουμε στον πίνακα της τυποποιημένης κανονικής κατανομής διαπιστώνουμε ότι η τιμή 0,9500 δεν υπάρχει και ότι οι πλησιέστερες τιμές είναι 0,9495 για Ζ=1,64 και 0,9505 για Ζ=1,65 αντίστοιχα. Έτσι, μπορούμε να προσεγγίσουμε τη ζητούμενη τιμή στο μέσον των δυο πλησιέστερων: Άρα: Ζ 0,05 = = 1,645 7

Αθροιστικές πιθανότητες τυποποιημένης κανονικής κατανομής Ρ(-οο < Ζ < z) ο z z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0.5557 0,5596 0,5636 0.5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517.0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0.7088 0.7123 0.7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0.7734 0,7764 ),7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0.8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0.8289 0,8315 0,8340 0.8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0.8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0.9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 8

Επειδή η τιμή =2,11 είναι μεγαλύτερη από την =1,645 πρέπει να απορρίψουμε τη μηδενική υπόθεση και να συμπεράνουμε ότι υπάρχουν αρκετά στατιστικά στοιχεία που στηρίζουν την εναλλακτική υπόθεση, ότι ο μέσος του πληθυσμού είναι μεγαλύτερος από 5. Όταν η μηδενική υπόθεση απορρίπτεται, ο έλεγχος λέγεται ότι είναι στατιστικά σημαντικός (statistically significant). Έτσι, μπορούμε να πούμε ότι: ο έλεγχος [της υπόθεσης ότι ο μέσος φοιτητής MBA είναι υποχρεωμένος να ετοιμάζει περισσότερες από 5 εργασίες την εβδομάδα] ήταν στατιστικά σημαντικός με στάθμη σημαντικότητας 5%. 9

Β. Επίλυση με του υπολογισμό της τιμής p: Τιμή p (p-value) είναι η δεσμευμένη πιθανότητα να πάρει ο έλεγχος μια τιμή σαν αυτή που έχει υπολογιστεί από το δείγμα, με δεδομένη την αλήθεια της μηδενικής υπόθεσης. Η τιμή p ενός ελέγχου υπόθεσης αποτελεί μια πολύτιμη πληροφορία, ε- πειδή είναι ένα μέτρο της στατιστικής βαρύτητας των στοιχείων που στηρίζουν την εναλλακτική υπόθεση. Στη συγκεκριμένη άσκηση, η τιμή p είναι η πιθανότητα, σε έναν πληθυσμό με μέσο 5 (του ελέγχου) και τυπική απόκλιση 1,5, ένα δείγμα μεγέθους 10 να έχει μέσο 6 ή μεγαλύτερο: p-τιμή = 2,11 10

Η παραπάνω πιθανότητα μπορεί να υπολογιστεί ως εξής: P(Z > 2,11) = 1 P(Z < 2,11) = 1 0,9826* = 0, 017 * Όπου ο υπολογισμός της πιθανότητας P(Z < 2,11) παρουσιάζεται στον παρακάτω πίνακα της τυποποιημένης κανονικής κατανομής: 11

Αθροιστικές πιθανότητες τυποποιημένης κανονικής κατανομής Ρ(-οο < Ζ < z) ο z z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0.5557 0,5596 0,5636 0.5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517.0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0.7088 0.7123 0.7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0.7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0.8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0.8289 0,8315 0,8340 0.8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0.8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0.9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0.9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0.9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 12

Ερμηνεία της τιμής p: p < 0,01: υπάρχει συντριπτική απόδειξη (overwhelming evidence) υπέρ της εναλλακτικής υπόθεσης, ή ο έλεγχος έχει στατιστικά πολύ σημαντικός (highly significant). 0,01 <p<0,05: υπάρχει ισχυρή απόδειξη (strong evidence) υπέρ της εναλλακτικής υπόθεσης, ή ο έλεγχος είναι στατιστικά σημαντικός (significant). 0,05<p<0,10: p>0,10: υπάρχει ασθενής απόδειξη (weak evidence) υπέρ της εναλλακτικής υπόθεσης, ή ο έλεγχος είναι στατιστικά μη σημαντικός (not significant). δεν υπάρχει απόδειξη (no evidence) υπέρ της εναλλακτικής υπόθεσης. Στην συγκεκριμένη άσκηση επειδή p=0,017<0,05 υπάρχει ισχυρή απόδειξη (strong evidence) υπέρ της εναλλακτικής υπόθεσης, ή ο έλεγχος είναι στατιστικά σημαντικός (significant). Έτσι, μπορούμε να πούμε ότι: ο έλεγχος [της υπόθεσης ότι ο μέσος φοιτητής MBA είναι υποχρεωμένος να ετοιμάζει περισσότερες από 5 εργασίες την εβδομάδα] ήταν στατιστικά σημαντικός με στάθμη σημαντικότητας 5%. 13

Όπως βλέπουμε όποια και από τις δύο μεθόδους και να χρησιμοποιήσουμε: τυποποιημένο στατιστικό έλεγχο (περιοχή απόρριψης) ή τιμή p, το αποτέλεσμα του ελέγχου θα είναι τι ίδιο. Τιμή p και περιοχή απόρριψης: Τόσο η μέθοδος της περιοχής απόρριψης όσο και αυτή της τιμής p μπορεί να χρησιμοποιηθεί για την υποστήριξη του ίδιου τύπου αποφάσεων. Αρχικά καθορίζεται η στάθμη σημαντικότητας α, ανάλογα με τις ανάγκες του προβλήματος και τη βαρύτητα της απόφασης που πρέπει να ληφθεί. Στη συνέχεια υπολογίζεται η περιοχή απόρριψης και εξετάζεται αν ο έλεγχος (π.χ. ο μέσος του δείγματος) βρίσκεται στην περιοχή απόρριψης, οπότε και απορρίπτεται η μηδενική υπόθεση. Στη μέθοδο της τιμής p υπολογίζεται η τιμή p η οποία συγκρίνεται απευθείας με την επιλεγμένη στάθμη σημαντικότητας: Εάν η p-τιμή είναι μικρότερη του α, κρίνουμε ότι η p-τιμή είναι αρκετά μικρή και απορρίπτουμε τη μηδενική υπόθεση Εάν η p-τιμή είναι μεγαλύτερη του α, δεν απορρίπτουμε τη μηδενική υπόθεση Υπολογισμός Όπως είδαμε, υπάρχουν δύο τρόποι για τη λύση στατιστικών προβλημάτων. Αν επιλέξουμε τον χειρόγραφο υπολογισμό, είναι προτιμότερη η μέθοδος της περιοχής απόρριψης. Για τον υπολογισμό μπορούν να χρησιμοποιηθούν έτοιμοι πίνακες πιθανοτήτων. Όταν ο έλεγχος είναι ο μέσος του δείγματος μπορούμε επίσης να υπολογίσουμε την τιμή p χειρόγραφα. Αν όμως η άσκηση απαιτεί να χρησιμοποιήσουμε στατιστικούς δείκτες που δεν έχουν κανονική κατανομή, είναι αδύνατο να υπολογιστεί χειρόγραφα η τιμή p. Εκεί θα περιοριστούμε στη μέθοδο της περιοχής απόρριψης. 14

Στην συνέχεια θα προσαρμόσουμε την εκφώνηση της παραπάνω άσκησης προκειμένου να επιλύσουμε και του άλλους δύο τύπους ελέγχων: Μονόπλευρο αριστερού άκρου και δίπλευρου ελέγχου. Άσκηση: Ένας φοιτητής διοίκησης επιχειρήσεων ισχυρίζεται ότι ο μέ σος φοιτητής MBA είναι υποχρεωμένος να ετοιμάζει λιγότερες από 5 εργασίες την εβδομάδα. Για να ελέγξει τον ισχυρισμό αυτόν ένας καθηγη τής στατιστικής επέλεξε ένα τυχαίο δείγμα 10 φοιτητών MBA και τους ρώτησε πόσες εργασίες πρέπει να ετοιμάζουν ανά εβδομάδα. Οι απαντήσεις δίνονται στον παρακάτω πίνακα: 2 7 4 8 9 5 11 3 7 4 Μπορεί ο καθηγητής να συμπεράνει με στάθμη σημαντικότητας 5% αν ο ισχυρισμός είναι αληθής, αν είναι γνωστό ότι ο αριθμός των εργασιών ανά εβδομάδα έχει κανονική κατανομή με τυπική απόκλιση σ=1,5; Α. Επίλυση με τυποποιημένο στατιστικό έλεγχο (standardized test statistic) Σύμφωνα με την διατύπωση του ισχυρισμού στο ερώτημα της άσκησης ο έλεγχος υποθέσεων που πρέπει να γίνει τώρα είναι: H 0 : µ = 5 κατά της H 1 : µ < 5 15

Το Ζ υπολογίζεται όπως παραπάνω: Τώρα αλλάζει η περιοχή απόρριψης που είναι : * Παρατηρήστε ότι το σύμβολο της ανισότητας (μικρότερο) είναι το ίδιο με αυτό που υπάρχει στην εναλλακτική υπόθεση. Επίσης παρατηρήστε το αρνητικό πρόσημο, δείχνει ότι η περιο χή απόρριψης βρίσκεται στο αριστερό άκρο της τυποποιημένης κανονικής κατανομής, όπ ου η τυποποιημένη κανονική τυχαία μεταβλητή έχει αρνητικές τιμές. 16

* Υπολογισμός του Ζ 0,05 Επειδή η καμπύλη της τυποποιημένης κανονικής κατανομής είναι συμμετρική ως προς το 0, το ζητούμενο, όπως φαίνεται στην παρακάτω εικόνα, είναι η τιμή - Ζ 0,05 Παραπάνω από τους πίνακες της τυποποιημένης κανονικής κατανομής υπολογίσαμε ότι Ζ 0,05 =1,645. Έτσι είναι: - Ζ 0,05 = - 1,645 Άρα, η περιοχή απόρριψης είναι: < - 1,645 Επειδή η τιμή =2,11 δεν είναι μικρότερη από την = -1,645 (δηλαδή δεν βρίσκεται στην περιοχή απόρριψης) δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει ότι δεν υπάρχουν αρκετά στατιστικά στοιχεία που στηρίζουν την εναλλακτική υπόθεση, ότι ο μέσος του πληθυσμού είναι μικρότερος από 5. Β. Επίλυση με του υπολογισμό της τιμής p: Στον τύπο αυτό του ελέγχου υποθέσεων, όπου ενδιαφερόμαστε μόνο για τιμές στο αριστερό άκρο της κατανομής, υπολογίζουμε απευθείας την τιμή p ως, όπου είναι η τιμή του ελέγχου. Συνεπώς υπολογίζουμε την τιμή p ως: (για τον υπολογισμό της πιθανότητας βλέπε πίνακα τυποποιημένης κανονικής κατανομής σελ.12) 17

Επειδή p=0,9826>0,05 (και συγκεκριμένα p=0,9826>0,10) δεν υπάρχει απόδειξη υπέρ της εναλλακτικής υπόθεσης, ή ο έλεγχος είναι στατιστικά μη σημαντικός (significant). Έτσι, μπορούμε να πούμε ότι: ο έλεγχος [της υπόθεσης ότι ο μέσος φοιτητής MBA είναι υποχρεωμένος να ετοιμάζει λιγότερες από 5 εργασίες την εβδομάδα] ήταν στατιστικά μη σημαντικός με στάθμη σημαντικότητας 5%. 18

Άσκηση: Ένας φοιτητής διοίκησης επιχειρήσεων ισχυρίζεται ότι ο μέ σος φοιτητής MBA δεν ετοιμάζει 5 εργασίες την εβδομάδα. Για να ελέγξει τον ισχυρισμό αυτόν ένας καθηγη τής στατιστικής επέλεξε ένα τυχαίο δείγμα 10 φοιτητών MBA και τους ρώτησε πόσες εργασίες να ετοιμάζουν ανά εβδομάδα. Οι απαντήσεις δίνονται στον παρακάτω πίνακα: 2 7 4 8 9 5 11 3 7 4 Μπορεί ο καθηγητής να συμπεράνει με στάθμη σημαντικότητας 5% αν ο ισχυρισμός είναι αληθής, αν είναι γνωστό ότι ο αριθμός των εργασιών ανά εβδομάδα έχει κανονική κατανομή με τυπική απόκλιση σ=1,5; Α. Επίλυση με τυποποιημένο στατιστικό έλεγχο (standardized test statistic) Σύμφωνα με την διατύπωση του ισχυρισμού στο ερώτημα της άσκησης ο έλεγχος υποθέσεων που πρέπει να γίνει τώρα είναι: H 0 : µ = 5 κατά της H 1 : µ 5 19

Το Ζ υπολογίζεται όπως παραπάνω: Η διαφορά σε σχέση με τα προηγούμενα παραδείγματα είναι ότι η μηδενική υπόθεση απορρίπτεται αν ο μέσος είναι είτε μεγαλύτερος είτε μικρότερος από τον υπάρχοντα, δηλαδή υπάρχει περιοχή απόρριψης και στα δυο άκρα της κατανομής: ή Στα μαθηματικά αυτό συμβολίζεται ως: Επειδή α=0,05 θα είναι α/2=0,025, οπότε θα πρέπει να υπολογίσουμε το: = =1,96* * Υπολογισμός του Ζ 0,025 Το ζητούμενο είναι η τιμή Ζ 0,025. Στην παρακάτω εικόνα φαίνεται η ανάλυση των διαστημάτων, που οδηγεί στον εξής υπολογισμό: Ρ(Ζ> Ζ 0,025 ) = 0,025 1 - Ρ(Ζ< Ζ 0,025 ) = 0,025 Ρ(Ζ< Ζ 0,025 ) =1-0,025 Ρ(Ζ< Ζ 0,025 ) =0,975. Εάν κάνουμε αντίστροφη αναζήτηση στον Πίνακα, για το 0,975, θα βρούμε την αντίστοιχη τιμή z A = 1.96. Άρα λέμε ότι: Ζ.025 = 1.96 20

Αθροιστικές πιθανότητες τυποποιημένης κανονικής κατανομής Ρ(-οο < Ζ < z) ο z z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0.5557 0,5596 0,5636 0.5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517.0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0.7088 0.7123 0.7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0.7734 0,7764 ),7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0.8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0.8289 0,8315 0,8340 0.8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0.8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0.9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0.9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0.9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 21

Επειδή η καμπύλη της τυποποιημένης κανονικής κατανομής είναι συμμετρική ως προς το 0, να θυμίσουμε ότι - Ζ.025 = - 1.96 ( Συνέχεια της άσκησης) Η περιοχή απόρριψης θα αποτελείται από τα δυο διαστήματα τιμών: ή Επειδή το είναι μεγαλύτερο από το 1,96, απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. 22

Β. Επίλυση με του υπολογισμό της τιμής p: Η τιμή p υπολογίζεται ως το άθροισμα των πιθανοτήτων των δυο διαστημάτων: Ρ( < ) + Ρ( > ) = Ρ( <-2,11) + Ρ( >2,11), όπου η = τιμή του ελέγχου (1) Όπως γνωρίζουμε η κανονική κατανομή είναι συμμετρική οπότε: Ρ( <-2,11) = 1- Ρ( <2,11) (2) Ρ( >2,11) = 1- Ρ( <2,11) (3) Άρα η (1) διαμορφώνεται από την (2) και (3): Ρ( <-2,11) + Ρ( >2,11)= 1- Ρ( <2,11) +1- Ρ( <2,11) = 2-2 Ρ( <2,11)= 2[1- Ρ( <2,11)]= 2(1-0,9826)=0,035 Παρατηρήστε ότι επειδή τα διαστήματα στα δυο άκρα της κατανομής είναι συμμετρικά, θα μπορούσαμε απλά να πολλαπλασιάσουμε την πιθανότητα του ενός διαστήματος επί 2. Γενικά η τιμή p ενός ελέγχου δυο άκρων υπολογίζεται ως: p-value = 2Ρ( > ) = 2Ρ( > 2,11 ) = 2 Ρ( >2,11)= 2[1- Ρ( <2,11)]= 2(1-0,9826)= 0,035 όπου είναι η πραγματική τιμή του ελέγχου και είναι η απόλυτη τιμή της. 23

Αθροιστικές πιθανότητες τυποποιημένης κανονικής κατανομής Ρ(-οο < Ζ < z) ο z z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0.5557 0,5596 0,5636 0.5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517.0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0.7088 0.7123 0.7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0.7734 0,7764 ),7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0.8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0.8289 0,8315 0,8340 0.8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0.8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0.9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0.9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0.9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 24

Εκτιμητής διαστήματος εμπιστοσύνης για τον μέσο του πληθυσμού: Όταν η τυπική απόκλιση σ του πληθυσμού γνωστή και ο πληθυσμός έχει κανονική κατανομή, ο εκτιμητής διαστήματος εμπιστοσύνης (confidence interval estimator) του μέσου μ του πληθυσμού είναι το διάστημα τιμών: Η πιθανότητα 1-α ονομάζεται στάθμη εμπιστοσύνης (confidence level). Οι όροι ονομάζονται κατώτερο όριο εμπιστοσύνης (lower confidence level LCL) και ανώτερο όριο εμπιστοσύνης (upper confidence level UCL) αντίστοιχα. Συχνά ο εκτιμητής διαστήματος εμπιστοσύνης εκφράζεται με την μορφή: Υπολογισμός διαστήματος εμπιστοσύνης Στην παραπάνω άσκηση θα υπολογίσουμε το διάστημα εμπιστοσύνης για τον μέσο αριθμό εργασιών που ένας φοιτητής είναι υποχρεωμένος να ετοιμάζει ανά εβδομάδα, με στάθμη εμπιστοσύνης 95%, αφού η στάθμη σημαντικότητας είναι α=5% : Για τον υπολογισμό θα χρησιμοποιήσουμε τον τύπο: Από την άσκηση έχουμε υπολογίσει: :ο μέσος του δείγματός (πρέπει να υπολογιστεί), : η τυπική απόκλιση του πληθυσμού, σ=1,5 : το μέγεθος του δείγματος, 25

= =1,96* (βλέπε για υπολογισμό, σελ 20-21) Αν αντικαταστήσουμε όλα τα παραπάνω στον τύπο βρίσκουμε ότι ο εκτιμητής διαστήματος εμπιστοσύνης 95% είναι: Συνεπώς τα δύο όρια εμπιστοσύνης είναι: LCL=6-0,930=5,07 UCL=6+0,930=6,93 Ερμηνεία: Εκτιμούμε ότι ο μέσος αριθμός εργασιών που ένας φοιτητής είναι υποχρεωμένος να ετοιμάζει ανά εβδομάδα είναι μεταξύ 5,07 και 6,93 και η εκτίμηση αυτή έχει πιθανότητα 95% να είναι σωστή. Αυτό σημαίνει ότι αν επιλέξουμε επανειλημμένα δείγματα μεγέθους 10, στο 95% των περιπτώσεων ο μέσος του δείγματος θα απέχει λιγότερο του 0,93 από τον μέσο του πληθυσμού. 26

Έλεγχος του μέσου ενός πληθυσμού όταν η τυπική απόκλιση είναι άγνωστη (συνάρτηση ελέγχου t) Στις προηγούμενες ασκήσεις είδαμε τρόπους εκτίμησης του μέσου ενός πληθυσμού όταν η τυπική απόκλιση είναι γνωστή όπου ο έλεγχος μιας υπόθεσης υπολογίστηκε από τον τύπο: όπου η τυπική απόκλιση σ θεωρείται ως δεδομένη. Όμως μια πιο ρεαλιστική προσέγγιση είναι αυτή που δέχεται ότι η τυπική απόκλιση όπως και ο μέσος είναι άγνωστες παράμετροι, και κατά συνέπεια δεν μπορεί να χρησιμοποιηθεί η προηγούμενη κατανομή δειγματοληψίας. Αντίθετα, στη θέση της τυπικής απόκλισης σ του πληθυσμού, στον παραπάνω τύπο θα χρησιμοποιηθεί η τυπική απόκλιση s του δείγματος. Το αποτέλεσμα: ονομάζεται στατιστικό μέγεθος t επειδή όταν η κατανομή του πληθυσμού είναι κανονική η τιμή t ακολουθεί την κατανομή student t. Ο αριθμός των βαθμών ελευθερίας της κατανομής είναι ν=η-1. Έλεγχος υποθέσεων: Όταν η τυπική απόκλιση σ του πληθυσμού είναι άγνωστη και ο πληθυσμός έχει κανονική κατανομή, ο έλεγχος υποθέσεων για τον μέσο μ του πληθυσμού υπολογίζεται από τον τύπο: και ακολουθεί την κατανομή student t με ν=η-1 βαθμούς ελευθερίας. Κατανόηση των στατιστικών εννοιών Βαθμοί ελευθερίας 27

Παραπάνω αναφέρθηκε ο όρος βαθμοί ελευθερίας, για τον οποίο καλό είναι να δώσουμε μια εξήγηση της σημασίας του. Η κατανομή student t χρησιμοποιείται για την εκτίμηση του μέσου του πληθυσμού όταν η τυπική απόκλιση είναι άγνωστη. Για τον σκοπό αυτό υπολογίζεται η διασπορά του δείγματος με τη βοήθεια του τύπου: Για τον υπολογισμό του πρέπει πρώτα να υπολογίσουμε τον μέσο του δείγματος. Θυμηθείτε ότι οι κατανομές δειγματοληψίας παράγονται με την επανειλημμένη επιλογή δειγμάτων από τον ίδιο πληθυσμό. Αν έχουμε υπολογίσει τον μέσο και στη συνέχεια θέλουμε να επιλέξουμε ένα δείγμα μεγέθους n, έχουμε απόλυτη ελευθερία για την επιλογή των πρώτων n-1 στοιχείων του δείγματος, αλλά το τελευταίο πρέπει να επιλεγεί έτσι ώστε ο μέσος να μείνει αμετάβλητος. Για παράδειγμα, αν υποθέσουμε ότι n=3 και =10, και έχουμε επιλέξει Χ 1 =6, Χ 2 =8, τότε το Χ 3 δεν μπορεί να είναι οποιοδήποτε στοιχείο, αλλά μόνο Χ 3 =16, ώστε για το δείγμα των τριών στοιχείων να είναι =10. Συνεπώς, αν και το δείγμα έχει τρία στοιχεία μπορούμε να επιλέξουμε ελεύθερα μόνο τα δυο, δηλαδή έχουμε n-1 =2 βαθμούς ελευθερίας. Όπως λέγεται, ένας βαθμός ελευθερίας χάνεται επειδή το δείγμα πρέπει να συμφωνεί με τον υπολογισμένο μέσο. Παρατηρήστε ότι ο παρονομαστής του παραπάνω τύπου είναι n 1, δηλαδή το πλήθος των βαθμών ελευθερίας. 28

Άσκηση: Τα πανεπιστημιακά βιβλιοπωλεία διαθέτουν βιβλία που χρησιμοποιούνται από τους φοιτητές στα διάφορα μαθήματα. Στην αρχή κάθε εξαμήνου προμηθεύονται αρκετά αντίτυπα για να καλύψουν την προβλεπόμενη ζήτηση και στο τέλος του εξαμήνου επιστρέφουν στους εκδότες τα αντίτυπα που δεν διατέθηκαν. Ένα βιβλιοπωλείο επιθυμεί να κρατήσει το ποσοστό των επιστροφών όσο το δυνατόν χαμηλότερα, με μέσο όρο που δεν θα ξεπερνά το 10%. Για τον σκοπό αυτό επέλεξε ένα τυχαίο δείγμα 10 βιβλίων και κατέγραψε το ποσοστό των επιστροφών στο τέλος ενός εξαμήνου. 4 15 11 7 5 9 4 3 5 8 Μπορούμε από τα δεδομένα να συμπεράνουμε με στάθμη σημαντικότητας 5% ότι το μέσο ποσοστό επιστροφών είναι μικρότερο του 10%; (Θεωρήστε ότι η τυχαία μεταβλητή έχει κανονική κατανομή). Επίλυση: Το ζητούμενο είναι ο έλεγχος μιας υπόθεσης για τον μέσο του ποσοστού επιστροφών των βιβλίων. Σύμφωνα με το ζητούμενο της άσκησης, η εναλλακτική υπόθεση διατυπώνεται ως: H 1 : µ < 10 και η μηδενική ως συνήθως είναι H 0 : µ = 10. Δηλαδή θα γίνει ο εξής έλεγχος υποθέσεων: H 0 : µ = 10 κατά της H 1 : µ < 10 (Μονόπλευρος αριστερού άκρου) Επειδή η τυπική απόκλιση του πληθυσμού δεν είναι γνωστή, θα υπολογίσουμε τον έλεγχο t: για v=n 1 βαθμούς ελευθερίας. Για να υπολογίσουμε τον έλεγχο t θα πρέπει να βρούμε τον μέσο και την τυπική απόκλιση του δείγματος. Από τον παραπάνω πίνακα έχουμε: 29

Για τον υπολογισμό της τυπικής απόκλισης του δείγματος θα υπολογίσουμε πρώτα την διασπορά του δείγματος με τον παρακάτω τύπο: ή Όπου: =5041, και Για το υπολογισμό της διασποράς μπορούμε να δημιουργούμε τον παρακάτω πίνακα με τους υπολογισμούς που συμπεριλαμβάνονται στους τύπους: X i X i - (X i - ) 2 X i 2 4 7,1-3,1 9,61 16 15 7,1 7,9 62,41 225 11 7,1 3,9 15,21 121 7 7,1-0,1 0,01 49 5 7,1-2,1 4,41 25 9 7,1 1,9 3,61 81 4 7,1-3,1 9,61 16 3 7,1-4,1 16,81 9 5 7,1-2,1 4,41 25 8 7,1 0,9 0,81 64 ΣΎΝΟΛΟ 71 126,9 631 30

ή Συνεπώς η τυπική απόκλιση του δείγματος είναι: Ως μέσος του πληθυσμού θα χρησιμοποιηθεί η τιμή της μηδενικής υπόθεσης μ=5. Αντικαθιστώντας όλους αυτούς τους αριθμούς βρίσκουμε τον έλεγχο t: Η περιοχή απόρριψης θα είναι: Από τον πίνακα της κατανομής t βρίσκουμε την παραπάνω τιμή =1, 83 3 31

Η τιμή t του ελέγχου είναι t=-2,442 συνεπώς βρίσκεται στην περιοχή απόρριψης και έτσι μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει, ότι από τα δεδομένα μπορούμε να συμπεράνουμε ότι το μέσο ποσοστό επιστροφών είναι μικρότερο του 10%. Στην συνέχεια θα προσαρμόσουμε την εκφώνηση της παραπάνω άσκησης προκειμένου να επιλύσουμε και του άλλους δύο τύπους ελέγχων: Μονόπλευρο δεξιού άκρου και δίπλευρου ελέγχου. 32

Άσκηση: Τα πανεπιστημιακά βιβλιοπωλεία διαθέτουν βιβλία που χρησιμοποιούνται από τους φοιτητές στα διάφορα μαθήματα. Στην αρχή κάθε εξαμήνου προμηθεύονται αρκετά αντίτυπα για να καλύψουν την προβλεπόμενη ζήτηση και στο τέλος του εξαμήνου επιστρέφουν στους εκδότες τα αντίτυπα που δεν διατέθηκαν. Ένα βιβλιοπωλείο επιθυμεί να κρατήσει το ποσοστό των επιστροφών όσο το δυνατόν χαμηλότερα, με μέσο όρο που δεν θα ξεπερνά το 10%. Για τον σκοπό αυτό επέλεξε ένα τυχαίο δείγμα 10 βιβλίων και κατέγραψε το ποσοστό των επιστροφών στο τέλος ενός εξαμήνου. 4 15 11 7 5 9 4 3 5 8 Μπορούμε από τα δεδομένα να συμπεράνουμε με στάθμη σημαντικότητας 5% ότι το μέσο ποσοστό επιστροφών είναι μεγαλύτερο του 10%; (Θεωρήστε ότι η τυχαία μεταβλητή έχει κανονική κατανομή). Επίλυση: Το ζητούμενο είναι ο έλεγχος μιας υπόθεσης για τον μέσο του ποσοστού επιστροφών των βιβλίων. Σύμφωνα με το ζητούμενο της άσκησης, η εναλλακτική υπόθεση διατυπώνεται ως: H 1 : µ > 10 και η μηδενική ως συνήθως είναι H 0 : µ = 10. Δηλαδή θα γίνει ο εξής έλεγχος υποθέσεων: H 0 : µ = 10 κατά της H 1 : µ > 10 (Μονόπλευρος δεξιού άκρου) Το t υπολογίζεται όπως παραπάνω: Τώρα αλλάζει η περιοχή απόρριψης που είναι: Παρατηρήστε ότι το σύμβολο της ανισότητας (μεγαλύτερο) είναι το ίδιο με αυτό που υπάρχει στην εναλλακτική υπόθεση. Από τον πίνακα της κατανομής t βρίσκουμε την παραπάνω τιμή =1, 83 3 33

Η τιμή t του ελέγχου είναι t=-2,442 συνεπώς δεν βρίσκεται στην περιοχή απόρριψης και έτσι δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει, ότι από τα δεδομένα δεν μπορούμε να συμπεράνουμε ότι το μέσο ποσοστό επιστροφών είναι μεγαλύτερο του 10%. 34

Άσκηση: Τα πανεπιστημιακά βιβλιοπωλεία διαθέτουν βιβλία που χρησιμοποιούνται από τους φοιτητές στα διάφορα μαθήματα. Στην αρχή κάθε εξαμήνου προμηθεύονται αρκετά αντίτυπα για να καλύψουν την προβλεπόμενη ζήτηση και στο τέλος του εξαμήνου επιστρέφουν στους εκδότες τα αντίτυπα που δεν διατέθηκαν. Ένα βιβλιοπωλείο επιθυμεί να κρατήσει το ποσοστό των επιστροφών όσο το δυνατόν χαμηλότερα, με μέσο όρο που δεν θα ξεπερνά το 10%. Για τον σκοπό αυτό επέλεξε ένα τυχαίο δείγμα 10 βιβλίων και κατέγραψε το ποσοστό των επιστροφών στο τέλος ενός εξαμήνου. 4 15 11 7 5 9 4 3 5 8 Μπορούμε από τα δεδομένα να συμπεράνουμε με στάθμη σημαντικότητας 5% ότι το μέσο ποσοστό επιστροφών δεν είναι 10%; (Θεωρήστε ότι η τυχαία μεταβλητή έχει κανονική κατανομή). Επίλυση: Το ζητούμενο είναι ο έλεγχος μιας υπόθεσης για τον μέσο του ποσοστού επιστροφών των βιβλίων. Σύμφωνα με το ζητούμενο της άσκησης, η εναλλακτική υπόθεση διατυπώνεται ως: H 1 : µ 10 και η μηδενική ως συνήθως είναι H 0 : µ = 10. Δηλαδή θα γίνει ο εξής έλεγχος υποθέσεων: H 0 : µ = 10 κατά της H 1 : µ 10 (Δίπλευρος έλεγχος) Το t υπολογίζεται όπως παραπάνω: Η διαφορά σε σχέση με τα προηγούμενα παραδείγματα είναι ότι η μηδενική υπόθεση απορρίπτεται αν ο μέσος είναι είτε μεγαλύτερος είτε μικρότερος από τον υπάρχοντα, δηλαδή υπάρχει περιοχή απόρριψης και στα δυο άκρα της κατανομής: ή Στα μαθηματικά αυτό συμβολίζεται ως: 35

Επειδή α=0,05 θα είναι α/2=0.025, οπότε θα πρέπει να υπολογίσουμε το: = Από τον πίνακα της κατανομής t βρίσκουμε την παραπάνω τιμή =2,262 Η περιοχή απόρριψης θα αποτελείται από τα δυο διαστήματα τιμών: ή Η τιμή t του ελέγχου είναι t=-2,442 συνεπώς βρίσκεται στην περιοχή απόρριψης και έτσι μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει, ότι από τα δεδομένα μπορούμε να συμπεράνουμε ότι το μέσο ποσοστό επιστροφών δεν είναι 10%. 36

Εκτιμητής διαστήματος εμπιστοσύνης για τον μέσο του πληθυσμού: Όταν η τυπική απόκλιση σ του πληθυσμού είναι άγνωστη και ο πληθυσμός έχει κανονική κατανομή, ο εκτιμητής διαστήματος εμπιστοσύνης του μέσου μ του πληθυσμού υπολογίζεται από τον τύπο: με ν=η-1 βαθμούς ελευθερίας. Υπολογισμός διαστήματος εμπιστοσύνης Στην παραπάνω άσκηση θα υπολογίσουμε το διάστημα εμπιστοσύνης για το μέσο ποσοστό επιστροφών, με στάθμη εμπιστοσύνης 95%, αφού η στάθμη σημαντικότητας είναι α=5%: Για τον υπολογισμό θα χρησιμοποιήσουμε τον τύπο: Από την άσκηση έχουμε υπολογίσει: =3,755 =2,262 Αν αντικαταστήσουμε όλα τα παραπάνω στον τύπο βρίσκουμε ότι ο εκτιμητής διαστήματος εμπιστοσύνης 95% είναι: Συνεπώς τα δύο όρια εμπιστοσύνης είναι: LCL=7,1-2,686=4,414 UCL=7,1+2,686=9,786 37

Έλεγχος για τη διαφορά μεταξύ δύο πληθυσμιακών μέσων χρησιμοποιώντας ανεξάρτητα δείγματα Για να εκτιμήσουμε ή να ελέγξουμε τη διαφορά μεταξύ των μέσων δυο πληθυσμών, πρέπει να επιλέξουμε τυχαία δείγματα από τους δυο πληθυσμούς. Αρχικά θα συζητήσουμε την περίπτωση όπου τα δείγματα είναι ανεξάρτητα. Δυο τυχαία δείγματα σε δυο πληθυσμούς λέγονται ανεξάρτητα, όταν η επιλογή του ενός δεν εξαρτάται με κανένα τρόπο από την επιλογή του άλλου. Η διαδικασία της δειγματοληψίας φαίνεται στην παρακά τω εικόνα. Παρατηρήστε ότι τα μεγέθη των δειγμάτων θεωρούνται διαφορετικά, n 1 για τον πρώτο πληθυσμό και n 2 για τον δεύτερο. Για κάθε δείγμα υπολογίζουμε τον μέσο και τη διασπορά. 38

Περιπτώσεις στις οποίες η στατιστική συνάρτηση ελέγχου είναι η t: Και οι δυο πληθυσμοί είναι κανονικά κατανεμημένοι, οι πληθυσμιακές τυπικές αποκλίσεις σ 1 και σ 2 είναι άγνωστες, αλλά οι δειγματικές τυπικές αποκλίσεις s 1 και s 2 είναι γνωστές. Στην περίπτωση που τα σ 1 και σ 2 μπορεί να υποτεθεί ότι είναι ίσα (αν και άγνωστα), το t υπολογίζεται χρησιμοποιώντας τον τύπο: Έλεγχος υποθέσεων όταν τα σ 1 και σ 1 μπορεί να υποτεθεί ότι είναι ίσα (αν και άγνωστα): με ν= + βαθμούς ελευθερίας όπου: Η ποσότητα ονομάζεται σταθμισμένος εκτιμητής διασποράς (pooled variance estimator) και χρησιμοποιεί ως συντελεστές στάθμισης τους βαθμούς ελευθερίας των δυο δειγμάτων. Ο υπολογισμός αυτός γίνεται δυνατός χάρη στην προϋπόθεση ότι οι διασπορές των δυο πληθυσμών είναι ίσες. Ο σταθμισμένος εκτ ιμητής διασποράς δίνει καλύτερες εκτ ιμή - σεις επειδή συνδυάζει τα δυο δείγματα. Ο παραπάνω έλεγχος ακολουθεί την κατανομή student t με ν= + βαθμούς ελευθερίας, με την προϋπόθεση ότι οι δυο πληθυσμοί έχουν κανονική κατανομή. Από το στοιχείο αυτό βρίσκουμε, με τους συνηθισμένους μαθηματικούς υπολογισμούς, τον εκτιμητή διαστήματος εμπιστοσύνης: 39

Εκτιμητής διαστήματος εμπιστοσύνης για τη διαφορά των μέσων δύο πληθυσμών με ίσες διασπορές είναι: με ν= + βαθμούς ελευθερίας. Άσκηση: Μία έρευνα επέλεξε ένα τυχαίο δείγμα 8 κατόχων ψηφιακών και 8 κατόχων συμβατικών φωτογραφικών μηχανών και κατέγραψε τον αριθμό των φωτογραφιών που έδωσαν για εκτύπωση μέσα σε ένα μήνα, όπως φαίνεται στον παρακάτω πίνακα: Ψηφιακή 15 12 23 31 20 14 12 19 Συμβατική 0 24 36 24 0 48 0 0 Μπορούμε από τα δεδομένα να συμπεράνουμε, με στάθμη σημαντικότητας 5%, ότι ο μέσος αριθμός εκτυπώσεων διαφέρει ανάμεσα στους δύο πληθυσμούς. Θεωρείστε ότι οι δύο πληθυσμοί είναι κανονικά κατανεμημένοι και ότι έχουν ίσες διασπορές. Επίλυση: Θα πρέπει να ελέγξουμε μια υπόθεση για τη διαφορά των μέσων των δύο πληθυσμών. Έστω: μ 1 : ο μέσος των εκτυπώσεων του πληθυσμού των κατόχων ψηφιακών μηχανών, και μ 2 : ο μέσος των εκτυπώσεων του πληθυσμού των κατόχων συμβατικών μηχανών σύμφωνα με την εκφώνηση της άσκησης ο έλεγχος υποθέσεων που πρέπει γίνει είναι: 40

H 0 : μ 1 - μ 2 =0 κατά της H 1 : μ 1 - μ 2 0 Από τα δεδομένα υπολογίζουμε: 16,5 Για το υπολογισμό της διασποράς της μεταβλητής Χ 1 μπορούμε να δημιουργούμε τον παρακάτω πίνακα με τους υπολογισμούς που συμπεριλαμβάνονται στους τύπους: X i X i - (X i - ) 2 X i 2 15 18,25-3,25 10,56 225 12 18,25-6,25 39,06 144 23 18,25 4,75 22,56 529 31 18,25 12,75 162,56 961 20 18,25 1,75 3,06 400 14 18,25-4,25 18,06 196 12 18,25-6,25 39,06 144 19 18,25 0,75 0,56 361 ΣΎΝΟΛΟ 146 295,50 2960 41

Για το υπολογισμό της διασποράς της μεταβλητής Χ 2 μπορούμε να δημιουργούμε τον παρακάτω πίνακα με τους υπολογισμούς που συμπεριλαμβάνονται στους τύπους: X i X i - (X i - ) 2 X i 2 0 16,5-16,5 272,25 0 24 16,5 7,5 56,25 576 36 16,5 19,5 380,25 1296 24 16,5 7,5 56,25 576 0 16,5-16,5 272,25 0 48 16,5 31,5 992,25 2304 0 16,5-16,5 272,25 0 0 16,5-16,5 272,25 0 ΣΎΝΟΛΟ 132 2574 4752 Ο σταθμισμένος εκτιμητής διασποράς είναι: Ο αριθμός των βαθμών ελευθερίας είναι: ν= + Ο έλεγχος είναι: 42

όπου από την μηδενική υπόθεση θέτουμε H 0 : μ 1 - μ 2 =0 Από την κατανομή δειγματοληψίας student η περιοχή απόρριψης είναι: ή Στα μαθηματικά αυτό συμβολίζεται ως: Επειδή α=0,05 θα είναι α/2=0.025, οπότε θα πρέπει να υπολογίσουμε το: = Από τον πίνακα της κατανομής t βρίσκουμε την παραπάνω τιμή =2,145 43

Η περιοχή απόρριψης θα αποτελείται από τα δυο διαστήματα τιμών: ή Η τιμή t του ελέγχου είναι t=0,244 συνεπώς δεν βρίσκεται στην περιοχή απόρριψης και έτσι δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει, ότι από τα δεδομένα μπορούμε να συμπεράνουμε ότι ο μέσος αριθμός εκτυπώσεων δεν διαφέρει ανάμεσα στους δύο πληθυσμούς. 44

Εκτιμητής διαστήματος εμπιστοσύνης Εκτός από τον έλεγχο υπόθεσης σχετικά με την διαφορά των μέσων, μπορούμε επίσης να υπολογίσουμε έναν εκτιμητή διαστήματος εμπιστοσύνης για την διαφορά αυτή, για στάθμη εμπιστοσύνης 95%. Εκτιμητής διαστήματος εμπιστοσύνης για τη διαφορά των μέσων δύο πληθυσμών με ίσες διασπορές είναι: με ν= + βαθμούς ελευθερίας. Όπως υπολογίσαμε και παραπάνω (σελ 43-44): =2,145. Άρα το διάστημα εμπιστοσύνης για την διαφορά των μέσων εκτυπώσεων των δύο πληθυσμών είναι: Το κάτω και άνω όριο του διαστήματος είναι: LCL:-13,605 UCL:17,105 45

Στην συνέχεια θα προσαρμόσουμε την εκφώνηση της παραπάνω άσκησης προκειμένου να επιλύσουμε και του άλλους δύο τύπους ελέγχων: Μονόπλευρο δεξιού άκρου και Μονόπλευρο αριστερού άκρου. Άσκηση: Μία έρευνα επέλεξε ένα τυχαίο δείγμα 8 κατόχων ψηφιακών και 8 κατόχων συμβατικών φωτογραφικών μηχανών και κατέγραψε τον αριθμό των φωτογραφιών που έδωσαν για εκτύπωση μέσα σε ένα μήνα, όπως φαίνεται στον παρακάτω πίνακα: Ψηφιακή 15 12 23 31 20 14 12 19 Συμβατική 0 24 36 24 0 48 0 0 Μπορούμε από τα δεδομένα να συμπεράνουμε, με στάθμη σημαντικότητας 5%, ότι ο μέσος αριθμός εκτυπώσεων των κατόχων ψηφιακών μηχανών είναι μεγαλύτερος από το μέσο αριθμό των κατόχων συμβατικών μηχανών; Θεωρείστε ότι οι δύο πληθυσμοί είναι κανονικά κατανεμημένοι και ότι έχουν ίσες διασπορές. Επίλυση: Θα πρέπει να ελέγξουμε μια υπόθεση για τη διαφορά των μέσων των δύο πληθυσμών. Έστω: μ 1 : ο μέσος των εκτυπώσεων του πληθυσμού των κατόχων ψηφιακών μηχανών, και μ 2 : ο μέσος των εκτυπώσεων του πληθυσμού των κατόχων συμβατικών μηχανών σύμφωνα με την εκφώνηση της άσκησης ο έλεγχος υπ οθέσεων που πρέπει γίνει είναι: H 0 : μ 1 - μ 2 =0 κατά της H 1 : μ 1 - μ 2 > 0 Από τα δεδομένα έχουμε υπολογίσει: 46

Τον σταθμισμένο εκτιμητή διασποράς: Ο αριθμός των βαθμών ελευθερίας είναι: ν= + Ο έλεγχος είναι: Τώρα αλλάζει η περιοχή απόρριψης που από την κατανομή δειγματοληψίας student η περιοχή απόρριψης είναι: Από τον πίνακα της κατανομής t βρίσκουμε την παραπάνω τιμή =1,761 47

Η τιμή t του ελέγχου είναι t=0,244 συνεπώς δεν βρίσκεται στην περιοχή απόρριψης και έτσι δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει, ότι από τα δεδομένα δεν μπορούμε να συμπεράνουμε ότι ο μέσος αριθμός εκτυπώσεων των κατόχων ψηφιακών μηχανών είναι μεγαλύτερος από το μέσο αριθμό των κατόχων συμβατικών μηχανών. 48

Άσκηση: Μία έρευνα επέλεξε ένα τυχαίο δείγμα 8 κατόχων ψηφιακών και 8 κατόχων συμβατικών φωτογραφικών μηχανών και κατέγραψε τον αριθμό των φωτογραφιών που έδωσαν για εκτύπωση μέσα σε ένα μήνα, όπως φαίνεται στον παρακάτω πίνακα: Ψηφιακή 15 12 23 31 20 14 12 19 Συμβατική 0 24 36 24 0 48 0 0 Μπορούμε από τα δεδομένα να συμπεράνουμε, με στάθμη σημαντικότητας 5%, ότι ο μέσος αριθμός εκτυπώσεων των κατόχων ψηφιακών μηχανών είναι μικρότερος από το μέσο αριθμό των κατόχων συμβατικών μηχανών; Θεωρείστε ότι οι δύο πληθυσμοί είναι κανονικά κατανεμημένοι και ότι έχουν ίσες διασπορές. Επίλυση: Θα πρέπει να ελέγξουμε μια υπόθεση για τη διαφορά των μέσων των δύο πληθυσμών. Έστω: μ 1 : ο μέσος των εκτυπώσεων του πληθυσμού των κατόχων ψηφιακών μηχανών, και μ 2 : ο μέσος των εκτυπώσεων του πληθυσμού των κατόχων συμβατικών μηχανών σύμφωνα με την εκφώνηση της άσκησης ο έλεγχος υπ οθέσεων που πρέπει γίνει είναι: H 0 : μ 1 - μ 2 =0 κατά της H 1 : μ 1 - μ 2 < 0 Από τα δεδομένα έχουμε υπολογίσει: 49

Τον σταθμισμένο εκτιμητή διασποράς: Ο αριθμός των βαθμών ελευθερίας είναι: ν= + Ο έλεγχος είναι: Αλλάζει η περιοχή απόρριψης που από την κατανομή δειγματοληψίας student η περιοχή απόρριψης είναι: Η περιοχή απόρριψης θα είναι: Από τον πίνακα της κατανομής t βρίσκουμε την παραπάνω τιμή =1,761 (σελ.47) Η τιμή t του ελέγχου είναι t=0,244 συνεπώς δεν βρίσκεται στην περιοχή απόρριψης και έτσι δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Αυτό σημαίνει, ότι από τα δεδομένα δεν μπορούμε να συμπεράνουμε ότι ο μέσος αριθμός εκτυπώσεων των κατόχων ψηφιακών μηχανών είναι μικρότερος από το μέσο αριθμό των κατόχων συμβατικών μηχανών. 50