ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)



Σχετικά έγγραφα
Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστική Επιχειρήσεων ΙΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Μέθοδος μέγιστης πιθανοφάνειας

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Εισαγωγή στην Εκτιμητική

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Στατιστικός έλεγχος υποθέσεων (Μέρος 2 ο ) 3/3/2017

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Μέθοδος μέγιστης πιθανοφάνειας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

Στατιστικοί έλεγχοι του Χ 2

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Αναλυτική Στατιστική

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Επιµέλεια: Χρυσάνθη Παπαθανασοπούλου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Δειγματικές Κατανομές

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

3. Κατανομές πιθανότητας

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική

Ορισμός και Ιδιότητες

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός - Βιομετρία

Στατιστική. Εκτιμητική

5. Έλεγχοι Υποθέσεων

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

5 o Μάθημα Έλεγχοι Υποθέσεων

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΦΟΡΑ ΕΡΕΥΝΑΣ ΕΙΑΣ. January 1. Ανάλυση έτους 2012

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

1 x-μ - 2 σ. e σ 2π. f(x) =

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Τυχαία μεταβλητή είναι μία συνάρτηση ή ένας κανόνας που αντιστοιχίζει ένα αριθμό σε κάθε αποτέλεσμα ενός πειράματος.

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Transcript:

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για το σχήμα της κατανομής των πληθυσμών είτε για τις παραμέτρους της κατανομής. Δοκιμασίες που δεν περιλαμβάνουν κάποιες από τις παραπάνω υποθέσεις λέγονται μη παραμετρικές (nnparamtrc) και χαρακτηρίζονται από ορισμένα πλεονεκτήματα όπως: (α) Δεν απαιτείται η επαλήθευση της καταλληλότητας κάποιας υπόθεσης. (β) Για μικρά δείγματα οι δοκιμασίες οδηγούν σε ακριβή συμπεράσματα και όχι σε προσεγγίσεις. (γ) Τα δεδομένα που χρησιμοποιούνται είναι συχνότητες (cunts) και όχι μετρήσεις (masurmnts). Στο κεφάλαιο αυτό θα παρουσιάσουμε δύο μη παραμετρικές δοκιμασίες οι οποίες βασίζονται σε μία κατανομή που συμβολίζεται με το ελληνικό γράμμα χ (ch-squar). Η πρώτη είναι η δοκιμασία καλής προσαρμογής (gdnssf-ft tst) κατά την οποία υποθέτουμε ότι τα δεδομένα προέρχονται από μια πλήρως προσδιορισμένη κατανομή. Η δεύτερη είναι η δοκιμασία της ανεξαρτησίας (tst f ndpndnc) σύμφωνα με την οποία για κατηγορικά δεδομένα που ταξινομούνται με βάση δύο χαρακτηριστικά, ενδιαφερόμαστε να μάθουμε αν τα χαρακτηριστικά αυτά είναι ανεξάρτητα. Γενικότερα όμως θα διαπιστώσουμε ότι και η δεύτερη δοκιμασία ανήκει στην κατηγορία των δοκιμασιών καλής προσαρμογής υπό την έννοια ότι δοκιμάζουμε την καλή προσαρμογή των παρατηρούμενων συχνοτήτων σε σχέση με τις (αναμενόμενες) συχνότητες που προκύπτουν κάτω από μια συγκεκριμένη μηδενική υπόθεση. Αν και η κατανομή χ μελετήθηκε για πρώτη φορά τον 9 ο αιώνα από διαφορετικούς και ανεξάρτητους επιστήμονες, εκείνος που την πρότεινε για την επίλυση των προβλημάτων καλής προσαρμογής ήταν ο άγγλος στατιστικός και ιδρυτής της Βιομετρίας Karl Parsn (857-96).. Γέννεση της κατανομής χ Η τυχαία μεταβλητή χ προέρχεται από τον μετασχηματισμό μιας κανονικής τυχαίας μεταβλητής όπως παρακάτω. Αν Y είναι μία τυχαία μεταβλητή από την κανονική κατανομή Ν(μ,σ ) (μέση τιμή μ και διακύμανση σ ) τότε η τυποποιημένη μεταβλητή Y μ Z = σ ακολουθεί την κανονική κατανομή Ν(0,), ενώ η τυχαία μεταβλητή Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) Y μ χ () = = Z σ ακολουθεί μια νέα κατανομή που λέγεται χ με βαθμό ελευθερίας. Αν και Y είναι δύο ανεξάρτητες τυχαίες μεταβλητές από την κανονική Y κατανομή Ν(μ,σ ), τότε η τυχαία μεταβλητή χ μ μ () Y Y = + = Z + Z σ σ ακολουθεί την κατανομή χ με βαθμούς ελευθερίας (πλήθος ανεξαρτήτων προσθετέων στο άθροισμα). Τέλος αν Y, Y,..., Y είναι ανεξάρτητες τυχαίες μεταβλητές από την κανονική κατανομή Ν(μ,σ ), τότε η τυχαία μεταβλητή Y μ Y μ Y μ Z Z χ ( ) = + +... + = + +... + Z σ σ σ ακολουθεί την κατανομή χ με βαθμούς ελευθερίας. Η οικογένεια των κατανομών χ ( ) είναι μονόκορφη και ασύμμετρη προς τα δεξιά, όπως προκύπτει από το διάγραμμα, με συνάρτηση πυκνότητας πιθανότητας f x = x x>! ( /) ( x/) ( ), 0 / όπου =.788 και = βαθμοί ελευθερίας. Αποδεικνύεται ότι η αναμενόμενη τιμή της χ ( ) είναι και η διακύμανση. Η κορυφή της κατανομής είναι ( ) για και 0 για =. Οι καμπύλες των κατανομών είναι παρόμοιες για =, και διαφέρουν από τις υπόλοιπες καμπύλες της οικογένειας για >. ΔΙΑΓΡΑΜΜΑ Κατανομές χ (), χ () και χ (9) Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) Ένα ακόμη βασικό χαρακτηριστικό της κατανομής χ είναι ότι το άθροισμα δύο η περισσοτέρων ανεξαρτήτων χ ακολουθεί επίσης την κατανομή χ. Τα άνω 00α εκατοστιαία σημεία σημεία με την ιδιότητα χ ( ) α της κατανομής χ ( ), δηλαδή τα PX ( χ ( ) α ) > = α δίνονται από στατιστικούς πίνακες η από το Mntab.. Δοκιμασία καλής προσαρμογής Στη δοκιμασία καλής προσαρμογής (gdnss-f-ft) υποθέτουμε ότι τα δεδομένα προέρχονται από μια πλήρως προσδιορισμένη κατανομή. Η δοκιμασία αυτή χρησιμοποιείται σε προβλήματα έρευνας αγοράς προκειμένου να προσδιορίσουμε είτε την προτίμηση κάποιων προϊόντων από τους εν δυνάμει καταναλωτές είτε αν το μερίδιο αγοράς κάποιων προϊόντων έχει μεταβληθεί. Στη γενική περίπτωση υποθέτουμε ότι έχουμε ένα τυχαίο δείγμα με N παρατηρήσεις οι οποίες κατατάσσονται σε κατηγορίες και συμβολίζουμε με f, f,..., f τις παρατηρούμενες συχνότητες, έτσι ώστε Για να δοκιμάσουμε τη μηδενική υπόθεση f = N. () = 0 : Οι πιθανότητες των κατηγοριών,,..., είναι π, π,..., π με =, π = υπολογίζουμε το αναμενόμενο πλήθος των παρατηρήσεων που θα βρεθούν στην κατηγορία κάτω από την που είναι έτσι ώστε 0 f = Nπ, =,,..., () f Nπ N = = = = = π = N. Αν οι παρατηρούμενες συχνότητες f, f,..., f είναι κοντά στις αναμενόμενες f, f,..., f, τότε η μηδενική υπόθεση είναι αληθινή. Ένα μέτρο της απόκλισης μεταξύ των παρατηρούμενων και αναμενόμενων συχνοτήτων δίνεται από το στατιστικό 0 ( f f ) χ = () f = Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) που ακολουθεί την κατανομή χ με ( ) βαθμούς ελευθερίας. Η αφαίρεση της μονάδας από τους βαθμούς ελευθερίας επιβάλλεται από τον δεσμό () σύμφωνα με τον οποία όταν προσδιοριστούν οι συχνότητες στις ( ) κατηγορίες η συχνότητα της τελευταίας κατηγορίας προσδιορίζεται από τη σχέση (). Αν δεν υπάρχουν διαφορές μεταξύ των f και f τότε χ = 0. Καθώς οι διαφορές μεγαλώνουν μεγαλώνει και το χ. Κατά συνέπεια η δοκιμασία καλής προσαρμογής είναι πάντοτε μονόπλευρη όπου η δεξιά ουρά της κατανομής χ ( ) προσδιορίζει την περιοχή απόρριψης της δοκιμασίας. Για συγκεκριμένο επίπεδο σημαντικότητας α δεν μπορούμε να αποδεχθούμε την όταν 0 όπου χ ( ) χ > χ ( ) χ ( ) είναι το άνω 00α εκατοστιαίο σημείο της κατανομής α για το οποίο ισχύει α P( χ > χ ( ) α ) = α. Τέλος αξίζει να σημειωθεί ότι ενώ η κατανομή χ ( ) είναι συνεχής, ο υπολογισμός του στατιστικού χ γίνεται με διακριτά δεδομένα. Το γεγονός αυτό δεν έχει ιδιαίτερη σημασία όταν τιμές των αναμενόμενων συχνοτήτων είναι f 5. Στην περίπτωση που υπάρχουν κατηγορίες για τις οποίες ισχύει f 5 τότε αυτές θα πρέπει να συγχωνευτούν με τις διπλανές έτσι ώστε να ικανοποιηθεί η συνθήκη f 5. Οι βαθμοί ελευθερίας του στατιστικού χ που προκύπτει υπολογίζονται με βάση το νέο αριθμό των κατηγοριών. Εναλλακτικά μπορούμε να αυξήσουμε το μέγεθος του δείγματος έως ότου γίνουν αποδεκτά όλα τα f. Παράδειγμα Μία ασφαλιστική εταιρεία προσφέρει τρία διαφορετικά ασφαλιστικά προϊόντα, και A, για τα οποία πιστεύει ότι έχουν την ίδια A A αποδοχή από το καταναλωτικό κοινό. Από ένα τυχαίο δείγμα 60 πελατών προέκυψε ότι 0 προτίμησαν το προϊόν, 9 το και το A. Να A A διερευνηθεί η ορθότητα του ισχυρισμού της ασφαλιστικής εταιρείας. Για το παράδειγμα έχουμε την μηδενική υπόθεση : Οι πιθανότητες πώλησης των προϊόντων, και A είναι ίσες 0 A A με εναλλακτική Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 4

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) : Οι πιθανότητες πώλησης των προϊόντων, και A δεν είναι ίσες A A Στον πίνακα υπάρχουν οι παρατηρούμενες και αναμενόμενες συχνότητες (που υπολογίστηκαν από τη σχέση ()) από τις οποίες έχουμε ότι ΠΙΝΑΚΑΣ Συχνότητες A A A Σύνολο Παρατηρούμενες f 0 9 60 Αναμενόμενες f 0 0 0 60 Πωλήσεις των ασφαλιστικών προϊόντων (0 0) (9 0) ( 0) χ = + + =. 0 0 0 και ακολουθεί την κατανομή χ (). Για επίπεδο σημαντικότητας α = 0.05 έχουμε ότι χ () = 5.99. Επειδή 0.05 χ =. > 5.99 = χ () 0.05 δεν μπορούμε να αποδεχθούμε την 0 με βάση τα δεδομένα του δείγματος. Παράδειγμα Υποθέτουμε τώρα ότι η ασφαλιστική εταιρεία πιστεύει ότι το μερίδιο αγοράς τριών προϊόντων, και A, είναι 50%, 0% και 0% αντίστοιχα. Από ένα τυχαίο δείγμα 60 πελατών προέκυψε ότι 8 προτίμησαν το προϊόν, 8 το και 4 το A. Να διερευνηθεί η ορθότητα του A A ισχυρισμού της ασφαλιστικής εταιρείας. A A Για το παράδειγμα έχουμε την μηδενική υπόθεση 0 : Οι πιθανότητες πώλησης είναι π = 0.50, π = 0.0 και π = 0.0 με εναλλακτική : Για τις πιθανότητες πώλησης ισχύει π 0.50 η π 0.0 η π 0.0 Στον πίνακα υπάρχουν οι παρατηρούμενες και αναμενόμενες συχνότητες από τις οποίες έχουμε ότι ΠΙΝΑΚΑΣ Συχνότητες A A A Σύνολο Παρατηρούμενες f 8 8 4 60 Αναμενόμενες f 0 8 60 Πωλήσεις των ασφαλιστικών προϊόντων Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 5

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) (8 0) (8 ) (4 8) χ = + + =.47 0 8 και ακολουθεί την κατανομή επειδή χ (). Για επίπεδο σημαντικότητας α = 0.05 χ =.47 < 5.99 = χ () 0.05 δεν μπορούμε να απορρίψουμε την 0 με βάση τα δεδομένα του δείγματος. 4. Δοκιμασία ανεξαρτησίας σε πίνακες συνάφειας Η δοκιμασία χ μπορεί να επεκταθεί για την αντιμετώπιση προβλημάτων στα οποία οι παρατηρήσεις ενός δείγματος μεγέθους N μπορούν να κατηγοριοποιηθούν σύμφωνα με δύο χαρακτηριστικά A και B. Η μηδενική υπόθεση που δοκιμάζεται είναι 0 : Τα χαρακτηριστικά A και B του πληθυσμού είναι ανεξάρτητα με εναλλακτική : Τα χαρακτηριστικά A και B του πληθυσμού δεν είναι ανεξάρτητα. Υποθέτουμε ότι υπάρχουν r κατηγορίες A, A,..., Ar για το χαρακτηριστικό A και c κατηγορίες B, B,..., B c για το χαρακτηριστικό B έτσι ώστε να υπάρχουν συνολικά r c κατηγορίες (κελιά). Το πλήθος των παρατηρήσεων του δείγματος που ανήκει στην κατηγορία A και στην κατηγορία B συμβολίζεται με j f. Η πινακοποίηση αυτή καλείται r c πίνακας συνάφειας (cntngncy tabl). Συμβολίζουμε επίσης με f, f,..., f r τα αθροίσματα των γραμμών και f, f,..., f τα αθροίσματα των στηλών του πίνακα. Για να δοκιμάσουμε με c την ανεξαρτησία των δύο χαρακτηριστικών, θα πρέπει πρώτα να υπολογίσουμε τον πίνακα των αναμενόμενων συχνοτήτων κάτω από την μηδενική υπόθεση. Στη συνέχεια υπολογίζουμε το στατιστικό χ με βάση 0 τις παρατηρούμενες και αναμενόμενες συχνότητες από κάθε κελί. Κάτω από την 0 ότι τα χαρακτηριστικά A και B είναι ανεξάρτητα, ισχύει PA ( B) = PAPB) ( ) (. (4) j j Επειδή τα PA ( ) και PB ( j ) είναι άγνωστα μπορούν να εκτιμηθούν από το δείγμα με j Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 6

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) f f j PA ( ) = και PB ( j ) =. N N Τότε η αναμενόμενη συχνότητα των παρατηρήσεων στο κελί ( A, B j ) είναι το γινόμενο της από κοινού πιθανότητας (4) επί το μέγεθος του δείγματος Ο τύπος για το στατιστικό χ είναι f f j f f j f = j P( A ) P( Bj ) N = N N N = N. (5) ( f f ) χ = (6) r c j j = j= fj που έχει ( r )( c ) βαθμούς ελευθερίας. Παράδειγμα Υποθέτουμε ότι η ασφαλιστική εταιρεία προσφέρει τρία ασφαλιστικά προϊόντα, και A μέσω υποκαταστημάτων που βρίσκονται A A σε τρεις διαφορετικές περιοχές B, B και B της χώρας. Από ένα τυχαίο δείγμα 50 πελατών προέκυψε ο παρακάτω πίνακας συνάφειας. ΠΙΝΑΚΑΣ Συχνότητες B B B Σύνολο A 5 5 5 75 A 5 5 A 0 0 5 Σύνολο 60 5 8 50 Παρατηρούμενες πωλήσεις των ασφαλιστικών προϊόντων Να διερευνηθεί αν οι πωλήσεις είναι ανεξάρτητες από την περιοχή της χώρας. Θα δοκιμάσουμε τις υποθέσεις με εναλλακτική 0 : Οι πωλήσεις είναι ανεξάρτητες από την περιοχή : Οι πωλήσεις δεν είναι ανεξάρτητες από την περιοχή Στη συνέχεια από τη σχέση (5) υπολογίζουμε τον πίνακα των αναμενόμενων συχνοτήτων που είναι Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 7

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) Συχνότητες ΠΙΝΑΚΑΣ 4 B B B Σύνολο A 0.0 6.0 9.0 75.0 A 9. 8.0 5.8.0 A 0.8 8.0. 5.0 Σύνολο 60.0 5.0 8.0 50.0 Αναμενόμενες πωλήσεις των ασφαλιστικών προϊόντων Για παράδειγμα η αναμενόμενη συχνότητα του κελιού (,) είναι f f 5 75 f = = = 6.0. N 50 Από τους πίνακες και 4 το στατιστικό (5 0) (5 6) (5 9) (0.) χ = + + +... + =.6 0 6 9. ακολουθεί την κατανομή χ (4). Για επίπεδο σημαντικότητας α = 0.0 έχουμε ότι χ (4) =.. Επειδή 0.0 χ =.6 >. = χ (4) 0.0 δεν μπορούμε να αποδεχθούμε την με βάση τα δεδομένα του δείγματος. Συνεπώς οι πωλήσεις εξαρτώνται από την περιοχή της χώρας. 0 Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 8

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) 5. Ασκήσεις. Μια εταιρεία υπολογιστών κατασκευάζει φορητά PC s από 4 γραμμές παραγωγής Α, Β, Γ και Δ. Η εταιρεία πιστεύει ότι από το σύνολο των ελαττωματικών PC s ένα ποσοστό 0% προέρχεται από τη γραμμή Α, ένα ποσοστό 0% από τη γραμμή Β, ένα ποσοστό 40% από τη γραμμή Γ και ένα ποσοστό 0% από τη Δ. Σε ένα δείγμα 00 ελαττωματικών μηχανών, η κατανομή των συχνοτήτων είναι όπως παρακάτω: Κατανομή ελαττωματικών PC s Γραμμή Α Β Γ Δ Σύνολο παραγωγής Συχνότητες 8 5 74 46 00 (α) (β) Να υπολογίσετε τις αναμενόμενες συχνότητες κάτω από την υπόθεση ότι το ποσοστό των ελαττωματικών PC s από τις 4 γραμμές παραγωγής είναι 0%, 0%, 40% και 0% αντίστοιχα. Να δοκιμάσετε σε επίπεδο σημαντικότητας 5% την υπόθεση ότι το ποσοστό των ελαττωματικών PC s από τις 4 γραμμές παραγωγής είναι 0%, 0%, 40% και 0% αντίστοιχα.. Σε μια βιομηχανία καταγράφηκαν κατά τη διάρκεια ενός έτους οι ημέρες της εβδομάδας που προτιμούν να απουσιάζουν οι υπάλληλοι. Από ένα δείγμα 50 απουσιών προέκυψε η παρακάτω κατανομή Κατανομή απουσιών Ημέρα της Δευτέρα Τρίτη Τετάρτη Πέμπτη Παρασκευή Σύνολο εβδομάδας Συχνότητες 56 44 4 47 60 50 (α) (β) Να υπολογίσετε τις αναμενόμενες συχνότητες κάτω από την υπόθεση ότι οι απουσίες γίνονται ομοιόμορφα όλες τις ημέρες της εβδομάδας. Να δοκιμάσετε σε επίπεδο σημαντικότητας 5% την υπόθεση ότι οι απουσίες γίνονται ομοιόμορφα όλες τις ημέρες της εβδομάδας.. Προκειμένου να διερευνηθούν οι προτιμήσεις των τηλεθεατών σε σχέση με την δημόσια και την ιδιωτική τηλεόραση, έγινε μία δημοσκόπιση σε ένα δείγμα 00 οικογενειών από όλη τη χώρα που χαρακτηρίστηκαν εκ των προτέρων σαν τακτικοί τηλεθεατές. Στον παρακάτω πίνακα δίνονται οι προτιμήσεις τους μαζί με την περιοχή στην οποία κατοικούν. Κατανομή τηλεοπτικών προτιμήσεων Βορράς Ανατολή Νότος Δύση Κρατική TV 5 5 Ιδιωτική TV 9 9 8 5 Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 9

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) (α) (β) Να υπολογίσετε τις αναμενόμενες συχνότητες κάτω από την υπόθεση ότι η τηλεοπτική προτίμηση είναι ανεξάρτητη από την περιοχή προέλευσης. Να δοκιμάσετε σε επίπεδο σημαντικότητας 5% την υπόθεση ότι η τηλεοπτική προτίμηση είναι ανεξάρτητη από την περιοχή προέλευσης. 4. Σε ένα δείγμα 800 φοιτητών (αγόρια και κορίτσια) που ρωτήθηκαν πως πάνε συνήθως από το σπίτι στο πανεπιστήμιο καταγράφηκαν τα παρακάτω αποτελέσματα: Κατανομή μέσων μεταφοράς Οδικώς Ποδήλατο ΙΧ - ΤΑΧΙ Λεοφωρείο Φοιτητής 9 06 94 Φοιτήτρια 8 84 88 06 (α) (β) Να υπολογίσετε τις αναμενόμενες συχνότητες κάτω από την υπόθεση ότι η επιλογή του μέσου μεταφοράς είναι ανεξάρτητη από το φύλο. Να δοκιμάσετε σε επίπεδο σημαντικότητας 5% την υπόθεση ότι η επιλογή του μέσου μεταφοράς είναι ανεξάρτητη από το φύλο. Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής 0

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) 6. Δοκιμασίες χ με το Mntab (α) Δοκιμασία καλής προσαρμογής Το Mntab δεν έχει δική του εντολή για να κάνει την δοκιμασία της καλής προσαρμογής, αλλά μπορούμε να αναπτύξουμε εμείς μια διαδικασία για τον υπολογισμό των αναμενόμενων τιμών και του στατιστικού χ. Στο Wrsht θα πρέπει να υπάρχουν η κατηγορική μεταβλητή με τις κατηγορίες, οι παρατηρούμενες συχνότητες και οι πιθανότητες όπως προσδιορίζονται από την μηδενική υπόθεση. Για το παράδειγμα τα δεδομένα είναι όπως παρακάτω: Με τη βοήθεια της εντολής Calc Calculatr μπορούμε να υπολογίσουμε τις αναμενόμενες συχνότητες και το στατιστικό χ. Όπως φαίνεται από τα πλαίσια διαλόγου αρχικά υπολογίζουμε το άθροισμα (Σύνολο) των παρατηρουμένων συχνοτήτων και κατόπιν τις αναμενόμενες συχνότητες σαν γινόμενο (Σύνολο) επί (Πιθανότητες). Κατόπιν υπολογίζουμε τις διαφορές μεταξύ των παρατηρούμενων και των αναμενόμενων συχνοτήτων και στη συνέχεια τα κλάσματα του στατιστικού χ. Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) Στο τέλος αθροίζουμε τα κλάσματα για να πάρουμε την τιμή του χ. Με τη βοήθεια της εντολής Data Dsplay Data παίρνουμε τα αποτελέσματα στο Sssn Wndw. (β) Δοκιμασία ανεξαρτησίας Για να κάνουμε τη δοκιμασία της ανεξαρτησίας το Wrsht θα πρέπει να περιέχει δύο κατηγορικές μεταβλητές με τις κατηγορίες καθώς και τις παρατηρούμενες συχνότητες. Για τα δεδομένα της άσκησης 4: Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής

ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Από τη γραμμή μενού επιλέγουμε Stat Tabls Ch-squar Tst.. Στο πλαίσιο διαλόγου Ch-squar Tst (Tabl n Wrs ) προσδιορίζουμε τις στήλες του πίνακα συνάφειας.. Τα αποτελέσματα εμφανίζονται στο Sssn Wndw. Δρ. Ιωάννης Ι.Γεροντίδης, Αναπληρωτής Καθηγητής