5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

Σχετικά έγγραφα
6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

3.4.1 Ο Συντελεστής ρ του Spearman

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ΠΑΡΑΡΤΗΜΑ. Πίνακας 9. Ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Π Α Ρ Α Ρ Τ Η Μ Α. Πίνακας 9. p ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Μέρος IV. Ελεγχοι Υποθέσεων (Hypothesis Testing)

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Γ. Πειραματισμός - Βιομετρία

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστική Επιχειρήσεων ΙΙ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Συμπερασματολογία

Έλεγχος Υποθέσεων (Hypothesis Testing)

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

Εφαρμοσμένη Στατιστική

Στατιστική Συμπερασματολογία

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

5. Έλεγχοι Υποθέσεων

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Στατιστικός έλεγχος υποθέσεων (Μέρος 2 ο ) 3/3/2017

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Αναλυτική Στατιστική

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Στατιστική Συμπερασματολογία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

Μαθηματικά Και Στατιστική Στη Βιολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Στατιστικοί Ελεγχοι. t - Έλεγχος για τον μέσο μ ενός πληθυσμού. t-έλεγχος για την σύγκριση των μέσων δύο πληθυσμών

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

8. Ελεγχος Υποθεσεων. Μαθηματικά και Στατιστικη στην Βιολογια ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (1 ο ) Τμημα Βιολογιας Αριστοτελειο Πανεπιστημιο Θεσσαλονικης

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

5 o Μάθημα Έλεγχοι Υποθέσεων

ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Κεφάλαιο 11 Εισαγωγή στον Έλεγχο Υποθέσεων

Έλεγχοι Υποθέσεων. Χρήση της Στατιστικής. Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-2

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΑΤΙΣΤΙΚΗΣ ΣΤΗΝ ΒΙΟΪΑΤΡΙΚΗ ΚΑΙ ΕΠΙΔΗΜΙΟΛΟΓΙΚΗ ΕΡΕΥΝΑ

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

Δειγματοληπτικές κατανομές

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Ενδεικτικές ασκήσεις ΔΙΠ 50

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

09_Μη παραμετρικοί έλεγχοι υποθέσεων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Transcript:

5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι οι αντίστοιχες άγνωστες συναρτήσεις κατανομής των τυχαίων μεταβλητών και. Οι υποθέσεις που ενδιαφερόμαστε να ελέγξουμε έχουν μία από τις εξής τρεις μορφές: Α. (Αμφίπλευρη εναλλακτική υπόθεση) Η 0 : F () = F (), για κάθε (, ) Η : F () F (), για τουλάχιστον ένα (, ). Η εναλλακτική υπόθεση της περίπτωσης αυτής διατυπώνεται συχνά ως εξής: "τα τείνουν να είναι μικρότερα από τα ". Είναι, δηλαδή, η μορφή αυτής της εναλλακτικής υπόθεσης γενικότερη από κάποια εναλλακτική η οποία θα έλεγε ότι τα Χ και διαφέρουν μόνο κατά μία παράμετρο θέσης (μέση τιμή ή διάμεσο). Β. (Μονόπλευρη εναλλακτική υπόθεση) Η 0 : F () = F (), για κάθε (, ) Η : F () > F (), για τουλάχιστον ένα (, ). Γ. (Μονόπλευρη εναλλακτική υπόθεση) Η 0 : F () = F (), για κάθε (, ) Η : F () < F (), για τουλάχιστον ένα (, ). Η περίπτωση Β είναι κατάλληλη για προβλήματα όπου έχει έννοια να ελέγξουμε αν τα Χ είναι μετατοπισμένα προς τα αριστερά των (αν τα Χ τείνουν να είναι μικρότερα από τα ). Αντίστοιχα,

η περίπτωση Γ είναι κατάλληλη για τα προβλήματα στα οποία επιθυμούμε να ελέγξουμε αν τα Χ είναι μετατοπισμένα προς τα δεξιά των (δηλαδή αν τα Χ τείνουν να είναι μεγαλύτερα από τα ). Όπως και στην περίπτωση του ελέγχου Kolmogorov, είναι φυσικό η στατιστική συνάρτηση για τον έλεγχο των παραπάνω υποθέσεων να βασίζεται στις εμπειρικές κατανομές των δύο δειγμάτων παρατηρήσεων. Έστω S () η εμπειρική συνάρτηση κατανομής βασισμένη στο τυχαίο δείγμα, 2,..., n και έστω S (y) η εμπειρική συνάρτηση κατανομής βασισμένη στο δεύτερο τυχαίο δείγμα, 2,..., m. Η στατιστική συνάρτηση ελέγχου ορίζεται διαφορετικά για κάθε ένα από τα τρία διαφορετικά σύνολα υποθέσεων: Α. (Αμφίπλευρος έλεγχος): Η φυσική επιλογή στατιστικής συνάρτησης είναι η μέγιστη κατακόρυφη απόσταση μεταξύ των δύο εμπειρικών συναρτήσεων κατανομής: T () S () = sup S. Β. (Μονόπλευρος έλεγχος): Ως ελεγχοσυνάρτηση για τον έλεγχο των υποθέσεων της μορφής Β, ορίζεται η μέγιστη κατακόρυφη απόσταση που επιτυγχάνεται από την S () υπεράνω της S (). Δηλαδή, T = sup [ S () S () ] Γ. (Μονόπλευρος έλεγχος): Για τον μονόπλευρο έλεγχο της περίπτωσης Γ, η ελεγχοσυνάρτηση ορίζεται ως η μέγιστη κατακόρυφη απόσταση που επιτυγχάνεται από την S () υπεράνω της S (). Δηλαδή, [ S () S () ] Τ = sup.. 2

Είναι προφανές ότι και στις τρεις περιπτώσεις εναλλακτικών υποθέσεων, μεγάλες τιμές της ελεγχοσυνάρτησης αποτελούν ένδειξη εναντίον της μηδενικής υπόθεσης. Επομένως, ο κανόνας απόφασης έχει την εξής μορφή: Η μηδενική υπόθεση Η 0 απορρίπτεται σε επίπεδο σημαντικότητας α, αν η τιμή της κατάλληλης στατιστικής συνάρτησης ( T, T ή Τ ) υπερβαίνει το ( α)-ποσοστιαίο σημείο της κατανομής της, όπως αυτό δίνεται από τον πίνακα 20 του παραρτήματος, για n=m ή από τον πίνακα 2, για n m. Προσεγγίσεις των ποσοστιαίων σημείων της κατανομής της στατιστικής συνάρτησης Smirnov δίνονται στο τέλος του πίνακα για τιμές του μεγέθους του δείγματος που δεν καλύπτονται από αυτόν. Παράδειγμα 5..: Ένα τυχαίο δείγμα μεγέθους 9, Χ, Χ 2,..., Χ 9 επιλέγεται από ένα πληθυσμό. Ένα άλλο τυχαίο δείγμα μεγέθους 5,, 2,..., 5 επιλέγεται ανεξάρτητα από το πρώτο δείγμα από έναν δεύτερο πληθυσμό. Η μηδενική υπόθεση είναι ότι οι δύο πληθυσμοί έχουν την ίδια συνάρτηση κατανομής. Δηλαδή, αν οι αντίστοιχες συναρτήσεις κατανομής συμβολίζονται με F (), (, ) και F (y), y (, ), τότε η μηδενική υπόθεση μπορεί να γραφεί με την μορφή Η 0 : F () = F (), για κάθε (, ). Η εναλλακτική υπόθεση μπορεί να διατυπωθεί με την μορφή Η : F () F (), για τουλάχιστον μία τιμή του. Για την ευχερέστερη διεξαγωγή του ελέγχου, τα δύο δείγματα διατάσσονται κατά αύξουσα σειρά μεγέθους, ως εάν αποτελούσαν ένα ενιαίο δείγμα. Ο πίνακας που ακολουθεί περιέχει τις τιμές των δύο 3

αυτών δειγμάτων διατεταγμένες κατά αύξουσα σειρά μεγέθους μαζί με τις τιμές της διαφοράς S () S () των εμπειρικών συναρτήσεων κατανομής. i i S () S () i i S () S () 5.2 0 /5 = /5 9.8 5/9 8/5 = /45 5.7 0 2/5 = 2/5 9.9 6/9 8/5 = 2/5 5.9 0 3/5 = /5 0. 7/9 8/5 = /45 6.5 0 4/5 = 4/5 0.6 8/9 8/5 = 6/45 6.8 0 5/5 = /3 0.8 8/9 9/5 = 3/45 7.6 /9 5/5 = 2/9.2 9/5 = 2/5 8.2 /9 6/5 = 3/45.3 0/5 = /3 8.4 2/9 6/5 = 8/45.5 /5 = 4/5 8.6 3/9 6/5 = /5 2.3 2/5 = /5 8.7 4/9 6/5 = 2/45 2.5 3/5 = 2/5 9. 4/9 7/5 = /45 3.4 4/5 = /5 9.3 5/9 7/5 = 4/45 4.6 = 0 Η κατάλληλη ελεγχοσυνάρτηση για τον έλεγχο των παραπάνω υποθέσεων είναι η () S () T = sup S. Από τον παραπάνω πίνακα, προκύπτει ότι η μεγαλύτερη τιμή της στατιστικής συνάρτησης Τ επιτυγχάνεται στην τιμή.2. Είναι δηλαδή 4

T = = sup S S () S () (.2 ) S (.2 ) = 2/5 = 0.4. Η τιμή 0.4 της στατιστικής συνάρτησης Τ μπορούσε επίσης να προσδιορισθεί γραφικά με την κατασκευή της γραφικής παράστασης των εμπειρικών συναρτήσεων κατανομής των δύο δειγμάτων. Από τα γραφήματα των συναρτήσεων αυτών, εύκολα μπορεί να δει κανείς ότι η διαφορά S () S () αλλάζει τιμή μόνο στις παρατηρούμενες τιμές των Χ i, i =, 2,..., 9 ή των i, i =, 2,...,5. Αυτός είναι και ο λόγος για τον οποίο αρκεί να υπολογίσουμε την διαφορά S () S () μόνο στις παρατηρηθείσες τιμές του δείγματος, όπως κάναμε στον παραπάνω πίνακα. Από τον πίνακα 2 του παραρτήματος βλέπουμε ότι το 0.95-ποσοστιαίο σημείο της κατανομής της στατιστικής συνάρτησης Τ, για τον αμφίπλευρο έλεγχο και για n=9=n και m=5=ν 2, είναι w 0.95 = 8/5. Για τα δεδομένα του προβλήματός μας, η τιμή της στατιστικής συνάρτησης Τ είναι τ = 2/5 < w 0.95. Επομένως, η μηδενική υπόθεση Η 0 δεν απορρίπτεται σε επίπεδο σημαντικότητας α=0.05. Από τον πίνακα, μπορεί εύκολα να διαπιστωθεί ότι το κρίσιμο επίπεδο αˆ είναι ελαφρώς μεγαλύτερο από 0.20. Αν, για τα δεδομένα του προβλήματός μας ήταν περισσότερο κατάλληλος ένας μονόπλευρος έλεγχος αντί του αμφίπλευρου που 5

εξετάσαμε, η στατιστική συνάρτηση για την περίπτωση Β των υποθέσεων έχει τιμή T = sup [S () S ()] = 2/5 = 0.4 Αντίστοιχα, για την περίπτωση Γ των υποθέσεων, η κατάλληλη στατιστική συνάρτηση έχει τιμή Τ = sup[s () S ()] = /3 = 0.333. Δηλαδή, στην περίπτωση Β, η τιμή της στατιστικής συνάρτησης Τ είναι η μέγιστη κατακόρυφη απόσταση της S () υπεράνω της S (y) και την αναζητούμε μεταξύ των θετικών διαφορών, ενώ στην περίπτωση Γ η τιμή της στατιστικής συνάρτησης Τ είναι η μέγιστη κατακόρυφη απόσταση της S () κάτω από την S (y) και την αναζητούμε μεταξύ των αρνητικών διαφορών. Τα κρίσιμα επίπεδα και για τους δύο μονόπλευρους ελέγχους εύκολα διαπιστώνονται ότι είναι μεγαλύτερα από 0.0. Παράδειγμα 5..2: Ας υποθέσουμε ότι ενδιαφερόμαστε να ελέγξουμε την υπόθεση ότι ο πληθυσμός των βιβλίων στατιστικού περιεχομένου στα ράφια της βιβλιοθήκης του Σκωτσέτζου Καθηγητή του παραδείγματος 3.3. διαφέρει από αυτόν των βιβλίων γενικού ενδιαφέροντος ως προς τον αριθμό σελίδων, με βάση τα ανεξάρτητα τυχαία δείγματα των 2 βιβλίων στατιστικής και των 6 βιβλίων γενικού ενδιαφέροντος που επέλεξε. Οι αριθμοί των σελίδων των βιβλίων αυτών που κατεγράφησαν δίνονται, για ευκολία, στον πίνακα που ακολουθεί κατά αύξουσα σειρά τάξης μεγέθους. 6

Αριθμός σελίδων Βιβλία Στατιστικού Περιεχομένου 26 42 56 228 245 246 370 49 433 454 478 503 Βιβλία Γενικού 29 39 60 78 82 2 25 70 92 224 263 275 Ενδιαφέροντος 276 286 369 756 Με βάση τα στοιχεία του πίνακα αυτού, θα μπορούσε να συμπεράνει κανείς ότι υπάρχουν ενδείξεις ότι τα δύο τυχαία δείγματα βιβλίων προήλθαν από πληθυσμούς που διαφέρουν ως προς τον αριθμό σελίδων; Λύση: Ακολουθώντας τα ίδια βήματα που ακολουθήσαμε στο προηγούμενο παράδειγμα, κατασκευάζουμε τον πίνακα 5... Από τον πίνακα, προκύπτει ότι η τιμή της στατιστικής συνάρτησης Τ είναι 0.4375 και παρατηρείται στην τιμή 369 του δείγματος των αριθμών των σελίδων των βιβλίων γενικού ενδιαφέροντος, δηλαδή T = = sup S S () S () ( 369 ) S ( 369 ) = 0.4375 Από τον πίνακα 2 του παραρτήματος βλέπουμε ότι το 0.95 ποσοστιαίο σημείο της κατανομής της στατιστικής συνάρτησης Τ, για τον αμφίπλευρο έλεγχο και για n=2=n και m=6=ν 2, είναι w 0.95 = 23/48 = 0.4792. Επομένως, σε επίπεδο σημαντικότητας 5% δεν απορρίπτεται η μηδενική υπόθεση ταυτοτικής ισότητας των συναρτήσεων κατανομών των αριθμών των σελίδων των δύο πληθυσμών βιβλίων. 7

Πίνακας 5.. Αριθμοί σελίδων βιβλίων γενικού ενδιαφέροντος και στατιστικού περιεχομένου Αριθμός βιβλίων w i Γενικού ενδιαφέροντος Στατιστικής S (w i ) S (w i ) S (w i ) S (w i ) 29 0.0625 0 0.0625 39 0.250 0 0.250 60 0.875 0 0.875 78 0.2500 0 0.2500 82 0.325 0 0.325 2 0.3750 0 0.3750 25 0.4375 0 0.4375 26 0.4375 0.0833 0.3542 42 0.4375 0.667 0.2708 56 0.4375 0.2500 0.875 70 0.5000 0.2500 0.2500 92 0.5625 0.2500 0.325 224 0.6250 0.2500 0.3750 228 0.6250 0.3333 0.297 245 0.6250 0.467 0.2083 246 0.6250 0.5000 0.250 263 0.6875 0.5000 0.875 275 0.7500 0.5000 0.2500 276 0.825 0.5000 0.325 286 0.8750 0.5000 0.3750 369 0.9375 0.5000 0.4375 370 0.9375 0.5833 0.3542 49 0.9375 0.6667 0.2708 433 0.9375 0.7500 0.875 454 0.9375 0.8333 0.042 478 0.9375 0.967 0.0208 503 0.9375.0000 0.0625 756.0000.0000 0.0000 8

Σημείωση: Ας σημειωθεί ότι, για την εφαρμογή του ελέγχου αυτού, τα δεδομένα θα πρέπει να βρίσκονται σε διατεταγμένη κλίμακα τουλάχιστον. Ο έλεγχος Smirnov είναι ακριβής στην περίπτωση που οι τυχαίες μεταβλητές είναι συνεχείς. Αν οι τυχαίες μεταβλητές είναι διακριτές, τότε ο έλεγχος εξακολουθεί να ισχύει, αλλά είναι περισσότερο συντηρητικός. Παρατήρηση: Αν και δεν είναι προφανές, οι στατιστικές συναρτήσεις Τ, Τ και Τ, εξαρτώνται μόνο από την τάξη των μεταβλητών και στο διατεταγμένο ενιαίο δείγμα των και και, για τον υπολογισμό τους, δεν απαιτείται γνώση των αριθμητικών τιμών των παρατηρήσεων. Για την καλύτερη κατανόηση του γεγονότος αυτού, ας υποθέσουμε ότι υπάρχουν τρεις τιμές Χ και δύο τιμές. Υπάρχουν τότε 5 = 0 2 δυνατές τοποθετήσεις των στοιχείων του ενιαίου δείγματος. Ο πίνακας που ακολουθεί συνοψίζει τις δυνατές αυτές τοποθετήσεις μαζί με τις τιμές των στατιστικών συναρτήσεων Τ, Τ και Τ που αντιστοιχούν σ αυτές. Διάταξη T Τ Τ Διάταξη T Τ Τ <<<< 0 <<<< /3 /3 /3 <<<< 2/3 2/3 0 <<<< /2 /6 /2 <<<< /2 /2 /6 <<<< 2/3 /3 2/3 <<<< /2 /2 /2 <<<< 2/3 0 2/3 <<<< 2/3 2/3 /3 <<<< 0 Αν η μηδενική υπόθεση στον αμφίπλευρο έλεγχο είναι αληθής, οι δύο συναρτήσεις κατανομής ταυτίζονται και οι δυνατές 9

τοποθετήσεις είναι ισοπίθανες κάτω από την υπόθεση ότι οι τυχαίες μεταβλητές είναι συνεχείς. Επομένως, στον αμφίπλευρο έλεγχο, η πιθανότητα κάθε μιας τοποθέτησης είναι: m. 5 0 n n = = 3 Επομένως, συνάγονται οι εξής κατανομές πιθανότητας για τις στατιστικές συναρτήσεις Τ, Τ και Τ : ( T = 3) = /0 ( T = 0) = / 5 ( T = 0) ( T = 2) = 3/0 ( T = 5) = /0 ( T = 5) ( T = 2 3) = 2 / 5 ( T = 3) (T = ) = /5 (T (T ( T = 2) ( T = 2 3) = / 5 ( T = 2 3) = / ( T = ) = /0 ( T = ) = /0. = / 5 = / 2) = / 5 = / 5 = /0 = /3) = /5 = / 5 Το γεγονός ότι οι κατανομές των στατιστικών συναρτήσεων 5 Τ και Τ ταυτίζονται για n=3 και m=2, δεν είναι συμπτωματικό. Οι κατανομές αυτές ταυτίζονται για όλες τις τιμές των n και m. Ομως, η τεχνική εξοικονόμησης χώρου η οποία χρησιμοποιήθηκε στην παρουσίαση των ποσοστιαίων σημείων των πινάκων 20 και 2 του παραρτήματος, σύμφωνα με την οποία το ( α)-ποσοστιαίο σημείο της στατιστικής συνάρτησης T στον αμφίπλευρο έλεγχο ταυτίζεται με το ( α/2)-ποσοστιαίο σημείο της στατιστικής συνάρτησης Τ στον μονόπλευρο έλεγχο, ισχύει μόνο όταν το επίπεδο σημαντικότητας α είναι μικρό. Ας σημειωθεί, για παράδειγμα, ότι στην περίπτωση αυτή των πέντε τιμών, (T ) = 2 ( αˆ ) και (T 2/3) = 2 ( Τ 2/3), 0

αλλά (T /2) 2 ( Τ /2). Η μηδενική κατανομή (δηλαδή, η κατανομή όταν η υπόθεση Η 0 αληθεύει) στους μονόπλευρους ελέγχους προσδιορίζεται με τον ίδιο τρόπο, γιατί κάτω από τη μονόπλευρη μηδενική υπόθεση, το μέγεθος της κρίσιμης περιοχής είναι μέγιστο όταν F () = F (), για κάθε.