Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας

Σχετικά έγγραφα
ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

Εισαγωγή στην Ανάλυση Δεδομένων

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

5. Έλεγχοι Υποθέσεων

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

Αναλυτική Στατιστική

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Στατιστική Επιχειρήσεων ΙΙ

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

1991 US Social Survey.sav

Γ. Πειραματισμός - Βιομετρία

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισόδημα Κατανάλωση

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Είδη Μεταβλητών. κλίµακα µέτρησης

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Στατιστική Συμπερασματολογία

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΔΙΕΡΕΥΝΗΣΗ ΚΛΙΜΑΤΙΚΩΝ ΑΛΛΑΓΩΝ ΓΙΑ ΤΟ ΝΗΣΙ ΤΗΣ ΝΑΞΟΥ

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

T-tests One Way Anova

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Έλεγχοι Υποθέσεων. Χρήση της Στατιστικής. Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-2

Έλεγχος υποθέσεων Ι z-test & t-test

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Κεφάλαιο 4. Περιγραφική Στατιστική - Γραφήματα. Σύνοψη. Προαπαιτούμενη γνώση. 4.1 Βασικές Έννοιες και Ορισμοί

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Μαθηματικά Και Στατιστική Στη Βιολογία

Διάλεξη 1 Βασικές έννοιες

Περιεχόμενα. Πρόλογος... 15

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ενότητα 2 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Transcript:

Κεφάλαιο 5 Σύνοψη Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας Βασικές έννοιες και ορισμοί του ελέγχου υποθέσεων, γραφικοί έλεγχοι κανονικότητας μέσω των ιστογραμμάτων (διαδρομές Analyze > Descriptive Statistics > Frequencies > Charts, επιλέγοντας την παράμετρο Show normal curve on Histogram, Analyze Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Histogram, Graphs > Legacy Dialogs > Histogram), των P-P plots (διαδρομές Analyze > Descriptive Statistics > P-P Plots, Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests), των Q-Q Plots (διαδρομές Analyze > Descriptive Statistics > Q-Q Plots, Analyze > Descriptive Statistics > Explore > Plots). Στατιστικοί έλεγχοι κανονικότητας α) One-Sample Kolmogorov-Smirnov (K-S) Test (μέσω των διαδρομών Analyze > Descriptive Statistics > Explore > Plots επιλέγοντας την παράμετρο Normality plots with tests και Analyze > Nonparametric tests > Legacy Dialogs > 1 sample K-S), β) Shapiro-Wilk Τest μέσω της διαδρομής Analyze > Descriptive Statistics > Explore > Plots επιλέγοντας την παράμετρο Normality plots with tests). Προαπαιτούμενη γνώση Καλύτερη κατανόηση του κεφαλαίου προκύπτει αν ο αναγνώστης έχει καλή θεωρητική γνώση της κανονικής κατανομής. Τα εγχειρίδια που παρουσιάζουν με πληρότητα την ύλη του συγκεκριμένου κεφαλαίου είναι αυτά που αναφέρθηκαν στο κεφάλαιο 3. 5.1 Εισαγωγή Στατιστική Συμπερασματολογία είναι ο κλάδος της Στατιστικής που έχει ως σκοπό τη εξαγωγή νόμων, κανόνων και συμπερασμάτων τα οποία ξεπερνούν το επίπεδο των παρατηρήσεων, και γενικεύονται στο σύνολο του πληθυσμού. Γενίκευση κάνουμε όταν ξεκινώντας από την πληροφορία που δίνει ένα ή περισσότερα αντιπροσωπευτικά δείγματα από κάποιον πληθυσμό, διατυπώνουμε μια πρόταση-υπόθεση (στατιστική υπόθεση) για τον πληθυσμό. Έτσι στο παρόν κεφάλαιο, αφήνουμε κατά μέρος την περιγραφική στατιστική ανάλυση και μπαίνουμε στον χώρο της συμπερασματολογίας (επαγωγής). Προσοχή: Για να ισχύει η γενίκευση θα πρέπει το δείγμα στο οποίο θα βασιστούμε για την εξαγωγή συμπερασμάτων, να είναι όσο το δυνατόν πιο αντιπροσωπευτικό του πληθυσμού που μελετάμε και φυσικά να ισχύουν οι προϋποθέσεις εφαρμογής της εκάστοτε μεθοδολογίας. 5.2 Βασικές Έννοιες και Ορισμοί Η στατιστική υπόθεση (statistical hypothesis) μπορεί να είναι μια οποιαδήποτε «στατιστική» πρόταση (για περιγραφικά μέτρα, κατανομές πληθυσμών, στοχαστικές διαδικασίες, κ.λπ.) την ορθότητα ή μη της οποίας θέλουμε να εξετάσουμε με βάση τις παρατηρήσεις που διαθέτουμε. Έστω ότι μελετάμε μια παράμετρο θ για την οποία υποθέτουμε ότι μπορεί να λάβει μια συγκεκριμένη τιμή. Αυτή την υπόθεση την ονομάζουμε μηδενική υπόθεση (null hypothesis) και τη συμβολίζουμε με H 0. Έτσι στο παράδειγμά μας η μηδενική υπόθεση διαμορφώνεται ως H 0:θ = θ 0. Σε περίπτωση που η H 0 απορριφθεί τότε θεωρούμε ότι ισχύει η εναλλακτική υπόθεση (alternative hypothesis), η οποία συμβολίζεται ως H 1 και η οποία δύναται να λάβει μια από τις ακόλουθες μορφές: H 1 : θ θ 0, η παράμετρος να είναι διάφορη από την τιμή θ 0 (δίπλευρος έλεγχος).

Η 1:θ < θ 0, η παράμετρος να είναι μικρότερη από την τιμή θ 0 (μονόπλευρος έλεγχος). Η 1:θ > θ 0, η παράμετρος να είναι μεγαλύτερη από την τιμή θ 0 (μονόπλευρος έλεγχος). Η επιλογή μονόπλευρου ή δίπλευρου ελέγχου εξαρτάται από το αντικείμενο που μελετάμε. Τιμές της παραμέτρου θ «κοντά» στη θ 0 υποστηρίζουν την ορθότητα της H 0, ενώ τιμές της παραμέτρου θ «μακριά» από τη θ 0 δεν την υποστηρίζουν. Έτσι, χωρίζουμε τις δυνατές τιμές της παραμέτρου θ σε αυτές για τις οποίες η H 0 απορρίπτεται, και αυτές για τις οποίες δεν μπορούμε να απορρίψουμε την H 0. Η περιοχή όπου η H 0 απορρίπτεται ονομάζεται περιοχή απόρριψης (rejection region) και συμβολίζεται με R. Η απόφαση για την απόρριψη ή μη της H 0 γίνεται βάση πιθανοτήτων γι αυτόν τον λόγο ορίζουμε επίπεδο εμπιστοσύνης (1-α) για την απόφαση ελέγχου. Το α λέγεται επίπεδο σημαντικότητας (significance level) και καθορίζει τη διαχωριστική γραμμή μεταξύ των περιοχών απόρριψης ή μη. Όταν το α μικραίνει, μικραίνει και η περιοχή απόρριψης R. Η πιο συνήθης τιμή για το α είναι α = 5%. Το επίπεδο σημαντικότητας που υπολογίζεται από τα δεδομένα μας και το οποίο συγκρίνουμε με το οριζόμενο επίπεδο σημαντικότητας α ονομάζεται p-value. Εικόνα 5.1: Έλεγχοι Υποθέσεων για τη μέση τιμή ενός πληθυσμού. Δεξιά και αριστερά είναι οι μονόπλευροι έλεγχοι Με βάση την H 0 προσδιορίζουμε τη «στατιστική ελέγχου» (test statistic) της εκάστοτε υπόθεσης μας. Οι στατιστικοί έλεγχοι διακρίνονται σε δύο κατηγορίες: τους παραμετρικούς, που βασίζονται σε ελεγχοσυναρτήσεις με γνωστή κατανομή, και τους μη παραμετρικούς που βασίζονται σε άλλες ιδιότητες της παραμέτρου. Προσοχή: Οι παραμετρικοί έλεγχοι υποθέσεων βασίζονται σε γνωστές κατανομές, οι οποίες φέρουν τις ιδιότητες της κανονικής κατανομής, συνεπώς για να αποφανθούμε εάν θα χρησιμοποιηθεί παραμετρικός ή μη παραμετρικός έλεγχος, αρχικά εξετάζουμε αν οι παρατηρήσεις μας ακολουθούν κανονική κατανομή. Συνοπτικά τα στάδια ενός στατιστικού ελέγχου είναι: Ορίζεται η μηδενική υπόθεση H 0. Ορίζεται η εναλλακτική υπόθεση H 1. Ορίζεται το επίπεδο σημαντικότητας α. Επιλέγεται η κατάλληλη ελεγχοσυνάρτηση. Ορίζεται η περιοχή απόρριψης R της H 0. Σε έναν έλεγχο υπόθεσης υπάρχει περίπτωση να γίνουν δύο ειδών σφάλματα. 1. Ως Σφάλμα Τύπου Ι ορίζεται η πιθανότητα απόρριψης της μηδενικής υπόθεσης H 0, ενώ αυτή είναι σωστή. Η πιθανότητα του σφάλματος Τύπου Ι συμβολίζεται με α. α = P [απόρριψη της H 0 H 0 είναι σωστή] Εξίσωση 5.1 2. Ως Σφάλμα Τύπου ΙΙ ορίζεται η πιθανότητα αποδοχής της μηδενικής υπόθεσης H 0, ενώ αυτή

είναι λανθασμένη. Η πιθανότητα του σφάλματος Τύπου ΙΙ συμβολίζεται με β. β = P [αποδοχή της H 0 H 0 είναι λάθος] Εξίσωση 5.2 Ισχύς (power) ενός στατιστικού ελέγχου ονομάζεται η πιθανότητα απόρριψης της H 0, ενώ είναι πράγματι ψευδής, δηλ. είναι η πιθανότητα να αποφύγουμε ένα σφάλμα Τύπου ΙΙ. γ = 1 - β = P[απόρριψη της H 0 H 0 είναι λάθος] Εξίσωση 5.3 Επίπεδο σημαντικότητας ενός ελέγχου ονομάζεται η πιθανότητα να παρατηρηθεί μια τιμή του στατιστικού μεγαλύτερη από αυτήν που έδωσε το δείγμα των παρατηρήσεων. 5.3 Γραφικοί Έλεγχοι Κανονικότητας p-value = P[T(Y) πιο ακραία από την T(Y obs) θ, H 0] Εξίσωση 5.4 Για να αποφασιστεί εάν θα χρησιμοποιηθεί παραμετρικός ή μη παραμετρικός έλεγχος, αρχικά εξετάζουμε αν οι παρατηρήσεις μας ακολουθούν κανονική κατανομή. Ο έλεγχος κανονικότητας δύναται να πραγματοποιηθεί είτε γραφικά είτε μέσω στατιστικών ελέγχων. Η υπόθεση που εξετάζεται είναι εάν η κατανομή των δεδομένων είναι η κανονική κατανομή, ή όχι: H f x N H f x N 2 o : ( ) = ( µσ, ) 2 1 : ( ) ( µσ, ) Εξισώσεις 5.5 Γραφικά, ο έλεγχος κανονικότητας πραγματοποιείται με τη χρήση ιστογράμματος, ή διαγραμμάτων P-P και Q-Q plots. Αναλυτικότερα: 5.3.1 Ιστογράμματα Η παραγωγή ιστογραμμάτων έχει ήδη αναλυθεί σε προηγούμενες παραγράφους, μέσω των επιλογών: 5.3.2 P-P Plots Analyze > Descriptive Statistics > Frequencies > Charts, επιλέγοντας την παράμετρο Show normal curve on Histogram. Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Histogram. Graphs > Legacy Dialogs > Histogram. Η δυνατότητα προσφέρεται από τις επιλογές: Analyze > Descriptive Statistics > P-P Plots. Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής.

Το P-P plot (probability-probability plot or percent-percent plot) είναι ένα γράφημα πιθανότητας για την αξιολόγηση του πόσο στενά συμφωνούν δύο σύνολα δεδομένων, βασιζόμενες στις αθροιστικές τους συναρτήσεις κατανομής. Από το γράφημα εξετάζουμε εάν τα δεδομένα μας συμπίπτουν ή τείνουν στην ευθεία γραμμή του γραφήματος. Εάν τα σημεία τείνουν προς την ευθεία γραμμή συνεπάγεται ότι τα δεδομένα ακολουθούν την κατανομή που έχει οριστεί στο Test Distribution. Στο πλαίσιο Variables επιλέγουμε τις μεταβλητές που θα εξεταστούν ως προς την κανονικότητά τους, επιλέγοντας στο πεδίο Test Distribution την κανονική (Normal) κατανομή. Η επιλογή της κανονικής κατανομής είναι η προκαθορισμένη επιλογή της εφαρμογής, ωστόσο παρέχονται και πολλές άλλες γνωστές κατανομές όπως: οι Student, Pareto, Weibull, Uniform κ.ά. Εικόνα 5.2: To menu P-P plot Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε ένα γράφημα για κάθε μεταβλητή. Εικόνα 5.3: Αποτελέσματα από την εντολή P-P plot

5.3.3 Q-Q Plots Η δυνατότητα προσφέρεται από τις επιλογές: Analyze > Descriptive Statistics > Q-Q Plots. Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής. Ένα Q-Q plot (το «Q» προέρχεται από την λέξη quantile) είναι ένα γράφημα πιθανότητας για τη γραφική σύγκριση δύο κατανομών πιθανότητας, απεικονίζοντας τα ποσοστημόρια της μιας σε σχέση με την άλλη. Το γράφημα Q-Q χρησιμοποιείται για να συγκρίνουμε τα σχήματα των συναρτήσεων κατανομής, παρέχοντας μια γραφική άποψη για το πώς ιδιότητες, όπως η θέση, η κλίμακα και η ασυμμετρία είναι παρόμοιες ή διαφορετικές στις δύο κατανομές. Επίσης, χρησιμοποιείται για να συγκρίνει τις συλλογές δεδομένων ή θεωρητικές κατανομές. Η χρήση του γραφήματος για τη σύγκριση δύο δειγμάτων δεδομένων μπορεί να θεωρηθεί ως μια μη-παραμετρική προσέγγιση για τη σύγκριση των κατανομών τους. Γενικότερα η χρήση γραφημάτων Q-Q είναι μια πιο ισχυρή προσέγγιση από την κοινή τεχνική της σύγκρισης των ιστογραμμάτων των δύο δειγμάτων. Εάν οι δύο κατανομές είναι ίσες, τότε τα σημεία του Q-Q plot θα βρίσκονται στην ευθεία y = x. Εάν οι κατανομές έχουν γραμμική σχέση, τα σημεία του γραφήματος θα βρίσκονται περίπου σε μια γραμμή, αλλά όχι κατ' ανάγκη στην ευθεία y = x. Γενικότερα τα γραφήματα Q-Q είναι συχνά τοξοειδούς ή «S» μορφής, υποδεικνύοντας ότι η μία από τις κατανομές είναι πιο ασύμμετρη από την άλλη. Εικόνα 5.4: To menu Q-Q plot Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε ένα γράφημα για κάθε μεταβλητή.

Εικόνα 5.5: Αποτελέσματα από την εντολή Q-Q plot 5.4 Στατιστικοί Έλεγχοι Κανονικότητας Για να αποφασιστεί αν θα χρησιμοποιηθεί παραμετρικός ή μη παραμετρικός έλεγχος, αρχικά εξετάζουμε την κανονικότητα των παρατηρήσεών μας. Οι στατιστικοί έλεγχοι που παρέχονται για τον έλεγχο της κανονικότητας είναι αυτοί των Kolmogorov-Smirnov και των Shapiro-Wilk. Η υπόθεση που εξετάζεται είναι αν η κατανομή των δεδομένων είναι η κανονική κατανομή, ή όχι. 5.4.1 One-Sample Kolmogorov-Smirnov (K-S) Test Η δυνατότητα προσφέρεται από τις επιλογές : Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests. Analyze > Nonparametric tests > Legacy Dialogs > 1 sample K-S, με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής. To κριτήριο Κ-S είναι ένας μη παραμετρικός έλεγχος που χρησιμοποιείται για να εξετάσει την καλή προσαρμογή ενός τυχαίου δείγματος σε μία δεδομένη κατανομή, και βασίζεται στη διαφορά της εμπειρικής συνάρτησης κατανομής που προέρχεται από το δείγμα, και της αναμενόμενης συνάρτησης κατανομής υπό την υπόθεση της κανονικότητας, ή της οποιαδήποτε μηδενικής υπόθεσης H 0 η οποία μπορεί να είναι Κανονική, Ομοιόμορφη, Poisson ή Εxponential. Υποθέσεις του κριτηρίου: Το κριτήριο Kolmogorov-Smirnov υποθέτει ότι οι παράμετροι της υπό έλεγχο κατανομής προσδιορίζονται εκ των προτέρων. Αυτή η προσέγγιση υπολογίζει τις παραμέτρους από το δείγμα. Για κάθε κατανομή οι παράμετροι που εκτιμώνται είναι: Κατανομή Κανονική κατανομή Ομοιόμορφη κατανομή Poisson και Exponential κατανομή Παράμετρος Η δειγματική μέση τιμή και η δειγματική τυπική απόκλιση Το εύρος (ελάχιστη και μέγιστη τιμή) Η δειγματική μέση τιμή Πίνακας 5.1: Πίνακας που δείχνει τη σχέση κατανομής-παραμέτρου

Εικόνα 5.6: To menu One-Sample Kolmogorov-Smirnov Test Στο πλαίσιο Test Variables List ορίζονται οι μεταβλητές για τις οποίες θα υπολογιστεί το κριτήριο κανονικότητας. Το κριτήριο υπολογίζεται ξεχωριστά για κάθε μεταβλητή. Στο πλαίσιο Test Distribution επιλέγεται η κατανομή σύγκρισης. Οι δυνατές επιλογές είναι: Normal, Poisson, Uniform, Exponential. Από το πλήκτρο Exact επιλέγοντας την παράμετρο Monte Carlo ζητάμε από την εφαρμογή να χρησιμοποιήσει την τεχνική της προσομοίωσης για τον έλεγχο της κανονικότητας, όπου διεξάγει 10.000 (προκαθορισμένη τιμή) ελέγχους κανονικότητας και για κάθε έναν υπολογίζει το p-value. Στο τέλος εμφανίζει τον μέσο όρο αυτών των 10.000 p-values και ένα 99% δ.ε. γι αυτόν. Ωστόσο, η συνήθης επιλογή είναι η προκαθορισμένη Asymptotic only. Εικόνα 5.7: To menu One-Sample Kolmogorov-Smirnov Tes -Options Από το πλήκτρο Options παρέχεται η δυνατότητα εξαγωγής περιγραφικών μέτρων, τα ποσοστημόρια της κάθε μεταβλητής, και η διαχείριση των ελλειπουσών τιμών. Τα περιγραφικά μέτρα που παράγονται είναι η μέση τιμή, η τυπική απόκλιση, η ελάχιστη και η μέγιστη παρατήρηση και το πλήθος των έγκυρων παρατηρήσεων. Από τα ποσοστημόρια απεικονίζονται το 25 ο, το 50 ο, και το 75 ο ποσοστημόριο, δηλ. το 1 ο, 2 ο (διάμεσος) και 3 ο τεταρτημόριο.

Εικόνα 5.8: To menu One-Sample Kolmogorov-Smirnov Test-Options Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε τους ακόλουθους πίνακες. Εικόνα 5.9: Περιγραφικά μέτρα από την εντολή One-Sample Kolmogorov-Smirnov Test Εικόνα 5.10: Αποτελέσματα από την εντολή One-Sample Kolmogorov-Smirnov Test Από τα αποτελέσματά μας διαπιστώνουμε ότι η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 5%, συνεπώς η μεταβλητή δεν ακολουθεί κανονική κατανομή. 5.4.2 Shapiro-Wilk Τest Η δυνατότητα προσφέρεται από την επιλογή Analyze > Descriptive Statistics > Explore > Plots επιλέγοντας την παράμετρο Normality plots with tests, με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής. Το κριτήριο Shapiro-Wilk είναι ένας ακόμα πολύ γνωστός μη παραμετρικός έλεγχος για το αν οι παρατηρήσεις μίας μεταβλητής προέρχεται από κανονική κατανομή. Επιλέγοντας την παράμετρο Normality plots with tests, όταν οι τιμές της μεταβλητής είναι σταθμισμένες και οι τιμές των σταθμίσεων είναι μη ακέραιες, τότε το κριτήριο των Shapiro-Wilk

υπολογίζεται όταν το σταθμισμένο (weighted) μέγεθος του δείγματος είναι μεταξύ 3-50. Εάν οι τιμές της μεταβλητής δεν είναι σταθμισμένες ή οι σταθμίσεις είναι ακέραιες τιμές, τότε το κριτήριο υπολογίζεται για μέγεθος δείγματος μεταξύ 3 και 5.000. Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε τον ακόλουθο πίνακα: Εικόνα 5.11: Αποτελέσματα από την εντολή Explore-Normality plots with tests Από τα αποτελέσματα διαπιστώνουμε, ομοίως με τον προηγούμενο έλεγχο, ότι η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 5%, συνεπώς η μεταβλητή δεν ακολουθεί κανονική κατανομή.

Βιβλιογραφικές Αναφορές Κεφαλαίου Ελληνόγλωσσες Howitt, D., Cramer, D. (Επιμέλεια: Σ. Κοντάκος) (2011). Στατιστική με το SPSS 16.0. Αθήνα: Εκδόσεις Κλειδάριθμος. Ξενόγλωσσες Carver, R. & Nash, J. (2011). Doing Data Analysis with SPSS: Version 18.0. 5 th Edition Easton Cengage Learning. Coakes, S. J. & Steed, L. G. (1999). SPSS: Analysis without anguish: Versions 7.0, 7.5, 8.0 for Windows. Bresbane: Jacaranda Wiley. Field, A. (2013). Discovering statistics using IBM SPSS statistics. London:Sage. Huber, P. J. (1973). Robust regression: asymptotics, conjectures and Monte Carlo. The Annals of Statistics, pp. 799-821. Marques de Sa, J. P. (2007). Applied Statistics Using SPSS. STATISTICA, MATLAB and R, 2 nd Edition, Porto: Universitado de Porto Norusis Marija, J. (2002). SPSS 11.0 Guide to data analysis. Upper Saddle River New Jersey: Prentice Hall.