ΠΑΝΕΠΙΣΗΜΙΟ ΑΙΓΑΙΟΤ ΧΟΛΗ ΕΠΙΣΗΜΩΝ ΣΗ ΔΙΟΙΚΗΗ ΣΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑ ΚΑΙ ΔΙΟΙΚΗΗ ΣΑΣΙΣΙΚΗ Ακαδ. Έτος -3 Διδάσκων: Βασίλης ΚΟΤΣΡΑ Διδάσκων επί Συμβάσει Π.Δ 47/8 v.kouras@fμe.aegea.gr Σηλ: 735457
Διωνυμικό p Ένας ακόμα σημαντικός έλεγχος είναι αυτός για το διωνυμικό p Έστω ότι γίνονται ανεξάρτητες δοκιμές Beroul με πιθανότητα επιτυχίας p και έστω Χ ο αριθμός των επιτυχιών. Δηλαδή η τ.μ. Χ~Β(,p) Ο καλύτερος εκτιμητής για το p είναι ο ο οποίος είναι αμερόληπτος αφού έχει τυπικό σφάλμα το οποίο εκτιμάται με pˆ ˆ pˆ p E pˆ p/ pˆ pˆ pˆ / E / p/ p / Από το ΚΟΘ η Χ~Ν(p,p(-p)) γεγονός που οδηγεί στην χρήση της στατιστικής συνάρτησης για ελέγχους που αφορούν το διωνυμικό p pˆ p p Z p p / p p
Διωνυμικό p a) Η : p p έναντι Η : p > p κρίσιμη περιοχή R z, δηλαδή p p p z b) Η : p p έναντι Η : p < p p κρίσιμη περιοχή R, z a δηλαδή p p z c) Η : p = μ έναντι Η : p p κρίσιμη περιοχή, z z R / a / a, δηλαδή p p p z /
Διωνυμικό p Παράδειγμα : Πριν από τις δημοτικές εκλογές ο Α υποψήφιος σε μια μεγάλη πόλη, παρήγγειλε μια δημοσκόπηση η οποία έδειξε ότι από τους ερωτηθέντες οι 6 θα τον ψηφίσουν. Να ελεγχθεί σε επίπεδο σημαντικότητας α =.5 η υπόθεση να μην να εκλεγεί ο Α. Για να εκλεγεί θα πρέπει το ποσοστό του p να είναι πάνω από 5%. Έστω ότι αν ο Χ ψηφοφόρος ψήφισε τον Α τότε Χ = διαφορετικά Χ =, ακολουθεί δηλαδή την διωνυμική κατανομή. Έλεγχος Η : p p =.5 έναντι Η : p > p =.5
Διωνυμικό p τατιστική συνάρτηση ελέγχου Z p pˆ p 6. 5 / p /. 5. 5.. 5 Κρίσιμη περιοχή z, z,. C. a 5 645, υμπερασματολογία : z,. Z a 645, και άρα απορρίπτω την Η Άρα είμαστε κατά τουλάχιστον 95% βέβαιοι ότι θα εκλεγεί
Διαφορά μέσων μ -μ Έχουμε δύο πληθυσμούς με μέσες τιμές μ και μ και τυπικές αποκλίσεις σ και σ και θέλουμε να ελέγξουμε υποθέσεις σχετικές με τις μέσες τιμές τους π.χ. αν είναι ίσες ή αν κάποια είναι μεγαλύτερη και ποια Βασιζόμαστε λοιπόν σε ένα δείγμα από τον κάθε πληθυσμό Σημαντικό ρόλο παίζουν οι διασπορές των πληθυσμών Για τα δείγματα μπορούμε να γνωρίζουμε τους δειγματικούς μέσους, Αν δεν γνωρίζουμε τις διασπορές των δύο πληθυσμών τις εκτιμούμε με, Αν οι διασπορές είναι άγνωστες αλλά ίσες: η κοινή τους διασπορά είναι p
Διαφορά μέσων μ -μ Α. Κανονικοί πληθυσμοί, γνωστές διασπορές Στατιστική συνάρτηση ελέγχου () Η : μ - μ = μ έναντι Η : μ - μ μ Απόρριψη Η () z z a z x x ~ N(), Η : μ - μ = μ έναντι Η : μ - μ < μ Απόρριψη Η z z () Η : μ - μ = μ έναντι Η : μ - μ > μ Απόρριψη Η z z
Διαφορά μέσων μ -μ Β. Κανονικοί πληθυσμοί, άγνωστες διασπορές και ίσες Στατιστική συνάρτηση ελέγχου () Η : μ - μ = μ έναντι Η : μ - μ μ Απόρριψη Η () Η : μ - μ = μ έναντι Η : μ - μ < μ x p x a, ~ Απόρριψη Η, a () Η : μ - μ = μ έναντι Η : μ - μ > μ Απόρριψη Η, a
Διαφορά μέσων μ -μ Γ. Κανονικοί πληθυσμοί, άγνωστες διασπορές και άνισες Στατιστική συνάρτηση ελέγχου () Απόρριψη Η () Απόρριψη Η () Απόρριψη Η ~ x x, a Η : μ - μ = μ έναντι Η : μ - μ μ Η : μ - μ = μ έναντι Η : μ - μ < μ Η : μ - μ = μ έναντι Η : μ - μ > μ a, a,
Διαφορά μέσων μ -μ Γ. Μεγάλα Δείγματα ( > 3) Στατιστική συνάρτηση ελέγχου () Η : μ - μ = μ έναντι Η : μ - μ μ Απόρριψη Η z z z a x x x x ) Η : μ - μ = μ έναντι Η : μ - μ < μ z s s Απόρριψη Η z z ) Η : μ - μ = μ έναντι Η : μ - μ > μ Απόρριψη Η z z
Διαφορά μέσων μ -μ Δ. Ζευγάρια Υπάρχουν περιπτώσεις στις οποίες τα δυο δείγματα που θέλουμε να συγκρίνουμε δεν είναι ανεξάρτητα μεταξύ τους, αλλά είτε εξαρτώνται οι οι τιμές του ενός από τις τιμές του άλλου, είτε πρόκειται για επαναλαμβανόμενη μέτρηση.. Έστω λοιπόν δύο σειρές μετρήσεων: Χ, Χ,, Χ και Υ, Υ,, Υ. Εφόσον τα δείγματα δεν είναι ανεξάρτητα, στην ουσία έχουμε ζευγάρια παρατηρήσεων (,Y ), =,,,. Στην συνέχεια φτιάχνουμε τις διαφορές τους D = Y, =,,,, οπότε πλέον δουλεύουμε με αυτές, και αντιμετωπίζουμε το πρόβλημα σαν περίπτωση ενός δείγματος. Η σ.σ. ελέγχου είναι η T D D D ~
Διαφορά μέσων μ -μ () Η : μ D = μ - μ = μ έναντι Η : μ D = μ - μ μ Απόρριψη Η () T a, Η : μ D = μ - μ = μ έναντι Η : μ D = μ - μ < μ Απόρριψη Η T, a () Η : μ D = μ - μ = μ έναντι Η : μ D = μ - μ > μ Απόρριψη Η T, a
Διαφορά μέσων μ -μ Παράδειγμα : Δύο ανεξάρτητες ομάδες παιδιών και αποτελούνται από παιδιά η κάθε μια. Τα παιδιά της ομάδας προέρχονται από υπερτασικούς γονείς ενώ της από γονείς με κανονική πίεση. Η συστολική πίεση του αίματος μετριέται για κάθε παιδί των δύο ομάδων και έχουμε τα ακόλουθα αποτελέσματα: Ομάδα 96 6 9 Ομάδα 4 88 98 96 96 96 9 Με επίπεδο σημαντικότητας α = 5% να ελεγχθεί αν υπάρχει διαφορά μεταξύ της μέσης πίεσης μ παιδιών από υπερτασικούς γονείς και της μέσης πίεσης μ παιδιών από γονείς με κανονική συστολική πίεση.
Διαφορά μέσων μ -μ Άγνωστες διασπορές 97 9 88 4 58 9.. 7 5 3..
Διαφορά μέσων μ -μ Έλεγχος: Η : μ - μ = έναντι Η : μ - μ τατιστική συνάρτηση ελέγχου: x x 58. 97. ~. 7. 7 Απόρριψη Η αν:,..,,, a 8,. 975,.,., υμπερασματολογία:,7 απορρίπτω Η 8 975
Διασπορά σ Η στατιστική υπόθεση για τη διασπορά σ είναι όπως και για τη μέση τιμή, δηλαδή Η : σ = σ με κατάλληλη εναλλακτική υπόθεση Η ανάλογα αν ο έλεγχος είναι δίπλευρος ή μονόπλευρος Η στατιστική q του ελέγχου είναι q ή () Η : σ = σ έναντι Η : σ σ χ s ~ Απόρριψη Η q, / ή q, / () Η : σ = σ έναντι Η : σ < σ Απόρριψη Η q, () Η : σ = σ έναντι Η : σ > σ Απόρριψη Η q,
Διασπορά σ Παράδειγμα 3: Ο κατασκευαστής ενός οργάνου ακριβείας ισχυρίζεται ότι η τυπική απόκλιση των μετρήσεων που γίνονται με το όργανο είναι σ =. Αν σε ένα πείραμα πάρουμε τις μετρήσεις 4. 5.3.3 αληθεύει ο ισχυρισμός του κατασκευαστή σε επίπεδο σημαντικότητας 5%; 4. 5. 3. 3 3 6. 6 4. 6. 6 5. 3 6. 6. 3 6. 6. 57 Έλεγχος: Η : σ = έναντι Η : σ
Διασπορά σ τατιστική συνάρτηση ελέγχου: s. 57 q ~ 5. 85 4 Απόρριψη Η αν: q.,. 5 ή q, 975 q 7. 378ή q. 56 υμπερασματολογία: 5.85 < 7.378 απορρίπτω Η