ΣτατιστικήΙΙ- Ελεγχοι X 2 (εκδ. 1.2) Γεώργιος Κ. Τσιώτας Τμήμα Οικονομικών Επιστημών Σχολή Κοινωνικών Επιστημών Πανεπιστήμιο Κρήτης 20 Μαΐου 2017
Περιγραφή 1 2
Ορισμός Ο Ελεγχος προσαρμογής εξετάζει την υπόθεση εάν μια κατανομή συχνοτήτων προέρχεται από μια συγκεκριμένη θεωρητική κατανομή. Οέλεγχος Συμφωναμετην H 0 υπόθεσηέχουμεπροσαρμογήτωνδεδομένωνμαςστη θεωρητικήκατανομή,ένωσυμφωναμετην H 1 υπόθεσηδενέχουμε.βάσει της H 0 υπόθεσηςθαέχουμε: X 2 H 0 = q (f i ˆf i ) 2 i=1 ˆfi χ 2 q k 1, όπου ˆf i ηεκτιμώμενησυχνότηταβασισμένηστηνσχέση ˆfi = n p i όπου p i ησυνάρτηση(πυκνότητας)πιθανότηταςτηςθεωρητικ ςκατανομής που εξετάζουμε. βεαμερ-τυ-λογ
Οέλεγχος(συν.) Η X 2 H 0 θακατανέμεταιωςμια X 2 κατανομήμε q k 1βαθμούςελευθερίας (q οι τάξεις και k ο αριθμός των παραμέτρων της κατανομής). Επειδή έχουμε μονόπλευροέλεγχοδεξιάςεναλλακτικής,οκανόναςαποδοχήςτης H 0 ορίζεται ως: X 2 H 0 χ 2 q k 1. Για ομοιόμορφη κατανομή έχουμε k = 0, για Διωνυμική και Poisson κατανομήέχουμε k = 1,ενώγιαΚανονικήκατανομήέχουμε k = 2.
Παράδειγμα: Ομοιόμορφης κατανομής Εξετάστηκε προιόν ηλιακής προστασίας αναφορικά με τον αριθμό ικανοποιητικών αποτελεσμάτων του σε τέσσερεις τυπους δέρματικής απόχρωσης:α,β, Γκαι.Ναελέγξετεστατιστικάεάνηεμφάνιση ικανοποιητικών αποτελεσμάτων είναι ανεξάρτητη του τύπου του δέρματος που εφαρμόζεται(υποθέσατε σφάλμα α = 5%). Α Β Γ f i 128 86 74 112
Λύση Δεδομένουτουδείγματος N = 128+ 86+74+112 = 400,ορίζουμεως ˆfi = N p i = 400 1/4 = 100γιακάθετάξηόπου p i = 1/4ηθεωρητική πιθανότητα στην περίπτωση της ομοιόμορφης κατανομής(σημ: εάν η εμφάνιση ικανοποιητικών αποτελεσμάτων είναι ανεξάρτητη του τύπου του δέρματος ολα τα ενδεχόμενα είναι ισοπίθανα). Α Β Γ p i 1/4 1/4 1/4 1/4
Λύση(συν.) Ετσι, έχουμε ότι: X 2 H 0 = 4 (f i ˆf i ) 2 i=1 ˆfi χ 2 4 0 1, = (128 100)2 100 + (86 100)2 100 = = 18 > χ 2 3, 95% = 7, 815 + (74 100)2 100 + (112 100)2 100 Λόγωτουανωτέρουαποτελέσματοςαπορρίπτωτην H 0 υπόθεση.επομένωςο τύπος του δέρματος παίζει ρόλο στην εμφάνιση ικανοποιητικών αποτελεσμάτων.
Ορισμός Ο έλεγχος ανεξαρτησίας εξετάζει την υπόθεση ότι μια μεταβλητή είναι ανεξάρτητη από μια άλλη(δηλ.y και X είναι ανεξάρτητες). Οέλεγχος Δεδομένου πίνακα συχνοτήτων για Y και X μεταβλητές, Y X x 1 x i x n y 1 f 1,1 f i,1 f n,1 f,1. y j f 1,j f i,j f n,j f,j. y m f 1,m f i,m f,m f,m f 1, f i, f n, N
Οέλεγχος(συν.)...για να έχουμε ανεξαρτησία θα πρέπει να ισχύει σε όρους πιθανοτήτων ότι: p i,j = p i p j ή ή f i,j N = f i N fj N f i,j = 1 N f i f j, γιακάθετιμήτων iκαι j.συμφωναμετην H 0 υπόθεσηπερίανεξαρτησίαςθα έχουμε: n m XH 2 (f i,j ˆf i,j ) 2 0 = χ 2 (n 1) (m 1), i=1 j=1 όπου ˆf i,j ηεκτιμώμενεςσυχνότητεςείναιβασισμένεςστησχέση ˆfi,j ˆfi,j = 1 N f i f j. βεαμερ-τυ-λογ
Οέλεγχος(συν.) Η X 2 H 0 θακατανέμεταιωςμια X 2 κατανομήμε (n 1) (m 1)βαθμούς ελευθερίας(nοιτάξειςτης Xκαι mοιαντίστοιχεςτης Y).Επειδήέχουμε μονόπλευροέλεγχοδεξιάςεναλλακτικής,οκανόναςαποδοχήςτης H 0 ορίζεται ως: X 2 H 0 χ 2 (n 1) (m 1). Σημείωση Ο εν λόγω έλεγχος μπορεί να πάρει τη μορφή ελέγχου ισότητας ποσοστών για τις δυο αυτές μεταβλητές.
Παράδειγμα: Ανεξαρτησία μεταβλητών εθνικότητας επισκεπτών και ημερήσια κατανάλωση Εξετάστηκε η ημερήσια κατανάλωση σε τρείς τυπους προιόντων: Α, Β, Γ ξένων επισκεπτών στη χώρα μας από τρεις διαφορετικές χώρες. Δίδεται ο πιο κάτω πίνακας συχνοτήτων. Να πραγματοποιηθεί έλεγχος ανεξαρτησίας των 2 αυτών μεταβλητών(υποθέσατε σφάλμα α = 5%). Α Β Γ Σύνολο ΧώραΙ 120 30 50 200 ΧώραΙΙ 10 75 15 100 ΧώραΙΙΙ 10 30 60 100 Σύνολο 140 135 125 400
Λύση Πρώτα ας καθορίσουμε τον έλεγχο: H 0 :Οιτρείςεθνικέςομάδεςδενδιαφοροποιούνταιστηνκαταναλωση3προιόντων H 1 :Οιτρείςεθνικέςομάδεςδιαφοροποιούνταιστηνκαταναλωση3προιόντων Δεδομένουτουδείγματος N = 400,ορίζουμεως ˆf i,j = 1 f N i, f,j τις εκτιμώμενεςσυχνότητες. Ετσι,γιαπαράδειγμα ˆf 1,1 = 1 140 200 = 70 400 κ.ο.κ.. Από τους υπολογισμούς έχουμε τον πιο κάτω πίνακα εκτιμωμένων συχνοτήτων: Α Β Γ Σύνολο ΧώραΙ 70 67,5 62,5 200 ΧώραΙΙ 35 33,75 31,25 100 ΧώραΙΙΙ 35 33,75 31,25 100 Σύνολο 140 135 125 400
Λύση(συν.) Ετσι, έχουμε ότι: X 2 H 0 = 3 3 (f i,j ˆf i,j ) 2 i=1 j=1 ˆfi,j χ 2 2 2, = (120 70)2 70 + (10 35)2 35 = = 180, 395 > χ 2 4, 95% = 9, 488 + + (60 31, 25)2 31, 25 Λόγωτουανωτέρουαποτελέσματοςαπορρίπτωτην H 0 υπόθεση.επομένωςη ημερήσια κατανάλωση ξένων επισκεπτών στη χώρα μας δεν είναι ανεξάρτητη από τον τύπο των προιόντων που καταναλώνονται. Τί θα σήμαινε αυτό για σας εάν σχεδιάζατε την προώθηση προιόντων σε ξένους επισκέπτες;