Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας

Κεφάλαιο 5 Σύνοψη Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας Βασικές έννοιες και ορισμοί του ελέγχου υποθέσεων, γραφικοί έλεγχοι κανονικότητας μέσω των ιστογραμμάτων (διαδρομές Analyze > Descriptive Statistics > Frequencies > Charts, επιλέγοντας την παράμετρο Show normal curve on Histogram, Analyze Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Histogram, Graphs > Legacy Dialogs > Histogram), των P-P plots (διαδρομές Analyze > Descriptive Statistics > P-P Plots, Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests), των Q-Q Plots (διαδρομές Analyze > Descriptive Statistics > Q-Q Plots, Analyze > Descriptive Statistics > Explore > Plots). Στατιστικοί έλεγχοι κανονικότητας α) One-Sample Kolmogorov-Smirnov (K-S) Test (μέσω των διαδρομών Analyze > Descriptive Statistics > Explore > Plots επιλέγοντας την παράμετρο Normality plots with tests και Analyze > Nonparametric tests > Legacy Dialogs > 1 sample K-S), β) Shapiro-Wilk Τest μέσω της διαδρομής Analyze > Descriptive Statistics > Explore > Plots επιλέγοντας την παράμετρο Normality plots with tests). Προαπαιτούμενη γνώση Καλύτερη κατανόηση του κεφαλαίου προκύπτει αν ο αναγνώστης έχει καλή θεωρητική γνώση της κανονικής κατανομής. Τα εγχειρίδια που παρουσιάζουν με πληρότητα την ύλη του συγκεκριμένου κεφαλαίου είναι αυτά που αναφέρθηκαν στο κεφάλαιο 3. 5.1 Εισαγωγή Στατιστική Συμπερασματολογία είναι ο κλάδος της Στατιστικής που έχει ως σκοπό τη εξαγωγή νόμων, κανόνων και συμπερασμάτων τα οποία ξεπερνούν το επίπεδο των παρατηρήσεων, και γενικεύονται στο σύνολο του πληθυσμού. Γενίκευση κάνουμε όταν ξεκινώντας από την πληροφορία που δίνει ένα ή περισσότερα αντιπροσωπευτικά δείγματα από κάποιον πληθυσμό, διατυπώνουμε μια πρόταση-υπόθεση (στατιστική υπόθεση) για τον πληθυσμό. Έτσι στο παρόν κεφάλαιο, αφήνουμε κατά μέρος την περιγραφική στατιστική ανάλυση και μπαίνουμε στον χώρο της συμπερασματολογίας (επαγωγής). Προσοχή: Για να ισχύει η γενίκευση θα πρέπει το δείγμα στο οποίο θα βασιστούμε για την εξαγωγή συμπερασμάτων, να είναι όσο το δυνατόν πιο αντιπροσωπευτικό του πληθυσμού που μελετάμε και φυσικά να ισχύουν οι προϋποθέσεις εφαρμογής της εκάστοτε μεθοδολογίας. 5.2 Βασικές Έννοιες και Ορισμοί Η στατιστική υπόθεση (statistical hypothesis) μπορεί να είναι μια οποιαδήποτε «στατιστική» πρόταση (για περιγραφικά μέτρα, κατανομές πληθυσμών, στοχαστικές διαδικασίες, κ.λπ.) την ορθότητα ή μη της οποίας θέλουμε να εξετάσουμε με βάση τις παρατηρήσεις που διαθέτουμε. Έστω ότι μελετάμε μια παράμετρο θ για την οποία υποθέτουμε ότι μπορεί να λάβει μια συγκεκριμένη τιμή. Αυτή την υπόθεση την ονομάζουμε μηδενική υπόθεση (null hypothesis) και τη συμβολίζουμε με H 0. Έτσι στο παράδειγμά μας η μηδενική υπόθεση διαμορφώνεται ως H 0:θ = θ 0. Σε περίπτωση που η H 0 απορριφθεί τότε θεωρούμε ότι ισχύει η εναλλακτική υπόθεση (alternative hypothesis), η οποία συμβολίζεται ως H 1 και η οποία δύναται να λάβει μια από τις ακόλουθες μορφές: H 1 : θ θ 0, η παράμετρος να είναι διάφορη από την τιμή θ 0 (δίπλευρος έλεγχος).

Η 1:θ < θ 0, η παράμετρος να είναι μικρότερη από την τιμή θ 0 (μονόπλευρος έλεγχος). Η 1:θ > θ 0, η παράμετρος να είναι μεγαλύτερη από την τιμή θ 0 (μονόπλευρος έλεγχος). Η επιλογή μονόπλευρου ή δίπλευρου ελέγχου εξαρτάται από το αντικείμενο που μελετάμε. Τιμές της παραμέτρου θ «κοντά» στη θ 0 υποστηρίζουν την ορθότητα της H 0, ενώ τιμές της παραμέτρου θ «μακριά» από τη θ 0 δεν την υποστηρίζουν. Έτσι, χωρίζουμε τις δυνατές τιμές της παραμέτρου θ σε αυτές για τις οποίες η H 0 απορρίπτεται, και αυτές για τις οποίες δεν μπορούμε να απορρίψουμε την H 0. Η περιοχή όπου η H 0 απορρίπτεται ονομάζεται περιοχή απόρριψης (rejection region) και συμβολίζεται με R. Η απόφαση για την απόρριψη ή μη της H 0 γίνεται βάση πιθανοτήτων γι αυτόν τον λόγο ορίζουμε επίπεδο εμπιστοσύνης (1-α) για την απόφαση ελέγχου. Το α λέγεται επίπεδο σημαντικότητας (significance level) και καθορίζει τη διαχωριστική γραμμή μεταξύ των περιοχών απόρριψης ή μη. Όταν το α μικραίνει, μικραίνει και η περιοχή απόρριψης R. Η πιο συνήθης τιμή για το α είναι α = 5%. Το επίπεδο σημαντικότητας που υπολογίζεται από τα δεδομένα μας και το οποίο συγκρίνουμε με το οριζόμενο επίπεδο σημαντικότητας α ονομάζεται p-value. Εικόνα 5.1: Έλεγχοι Υποθέσεων για τη μέση τιμή ενός πληθυσμού. Δεξιά και αριστερά είναι οι μονόπλευροι έλεγχοι Με βάση την H 0 προσδιορίζουμε τη «στατιστική ελέγχου» (test statistic) της εκάστοτε υπόθεσης μας. Οι στατιστικοί έλεγχοι διακρίνονται σε δύο κατηγορίες: τους παραμετρικούς, που βασίζονται σε ελεγχοσυναρτήσεις με γνωστή κατανομή, και τους μη παραμετρικούς που βασίζονται σε άλλες ιδιότητες της παραμέτρου. Προσοχή: Οι παραμετρικοί έλεγχοι υποθέσεων βασίζονται σε γνωστές κατανομές, οι οποίες φέρουν τις ιδιότητες της κανονικής κατανομής, συνεπώς για να αποφανθούμε εάν θα χρησιμοποιηθεί παραμετρικός ή μη παραμετρικός έλεγχος, αρχικά εξετάζουμε αν οι παρατηρήσεις μας ακολουθούν κανονική κατανομή. Συνοπτικά τα στάδια ενός στατιστικού ελέγχου είναι: Ορίζεται η μηδενική υπόθεση H 0. Ορίζεται η εναλλακτική υπόθεση H 1. Ορίζεται το επίπεδο σημαντικότητας α. Επιλέγεται η κατάλληλη ελεγχοσυνάρτηση. Ορίζεται η περιοχή απόρριψης R της H 0. Σε έναν έλεγχο υπόθεσης υπάρχει περίπτωση να γίνουν δύο ειδών σφάλματα. 1. Ως Σφάλμα Τύπου Ι ορίζεται η πιθανότητα απόρριψης της μηδενικής υπόθεσης H 0, ενώ αυτή είναι σωστή. Η πιθανότητα του σφάλματος Τύπου Ι συμβολίζεται με α. α = P [απόρριψη της H 0 H 0 είναι σωστή] Εξίσωση 5.1 2. Ως Σφάλμα Τύπου ΙΙ ορίζεται η πιθανότητα αποδοχής της μηδενικής υπόθεσης H 0, ενώ αυτή

είναι λανθασμένη. Η πιθανότητα του σφάλματος Τύπου ΙΙ συμβολίζεται με β. β = P [αποδοχή της H 0 H 0 είναι λάθος] Εξίσωση 5.2 Ισχύς (power) ενός στατιστικού ελέγχου ονομάζεται η πιθανότητα απόρριψης της H 0, ενώ είναι πράγματι ψευδής, δηλ. είναι η πιθανότητα να αποφύγουμε ένα σφάλμα Τύπου ΙΙ. γ = 1 - β = P[απόρριψη της H 0 H 0 είναι λάθος] Εξίσωση 5.3 Επίπεδο σημαντικότητας ενός ελέγχου ονομάζεται η πιθανότητα να παρατηρηθεί μια τιμή του στατιστικού μεγαλύτερη από αυτήν που έδωσε το δείγμα των παρατηρήσεων. 5.3 Γραφικοί Έλεγχοι Κανονικότητας p-value = P[T(Y) πιο ακραία από την T(Y obs) θ, H 0] Εξίσωση 5.4 Για να αποφασιστεί εάν θα χρησιμοποιηθεί παραμετρικός ή μη παραμετρικός έλεγχος, αρχικά εξετάζουμε αν οι παρατηρήσεις μας ακολουθούν κανονική κατανομή. Ο έλεγχος κανονικότητας δύναται να πραγματοποιηθεί είτε γραφικά είτε μέσω στατιστικών ελέγχων. Η υπόθεση που εξετάζεται είναι εάν η κατανομή των δεδομένων είναι η κανονική κατανομή, ή όχι: H f x N H f x N 2 o : ( ) = ( µσ, ) 2 1 : ( ) ( µσ, ) Εξισώσεις 5.5 Γραφικά, ο έλεγχος κανονικότητας πραγματοποιείται με τη χρήση ιστογράμματος, ή διαγραμμάτων P-P και Q-Q plots. Αναλυτικότερα: 5.3.1 Ιστογράμματα Η παραγωγή ιστογραμμάτων έχει ήδη αναλυθεί σε προηγούμενες παραγράφους, μέσω των επιλογών: 5.3.2 P-P Plots Analyze > Descriptive Statistics > Frequencies > Charts, επιλέγοντας την παράμετρο Show normal curve on Histogram. Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Histogram. Graphs > Legacy Dialogs > Histogram. Η δυνατότητα προσφέρεται από τις επιλογές: Analyze > Descriptive Statistics > P-P Plots. Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής.

Το P-P plot (probability-probability plot or percent-percent plot) είναι ένα γράφημα πιθανότητας για την αξιολόγηση του πόσο στενά συμφωνούν δύο σύνολα δεδομένων, βασιζόμενες στις αθροιστικές τους συναρτήσεις κατανομής. Από το γράφημα εξετάζουμε εάν τα δεδομένα μας συμπίπτουν ή τείνουν στην ευθεία γραμμή του γραφήματος. Εάν τα σημεία τείνουν προς την ευθεία γραμμή συνεπάγεται ότι τα δεδομένα ακολουθούν την κατανομή που έχει οριστεί στο Test Distribution. Στο πλαίσιο Variables επιλέγουμε τις μεταβλητές που θα εξεταστούν ως προς την κανονικότητά τους, επιλέγοντας στο πεδίο Test Distribution την κανονική (Normal) κατανομή. Η επιλογή της κανονικής κατανομής είναι η προκαθορισμένη επιλογή της εφαρμογής, ωστόσο παρέχονται και πολλές άλλες γνωστές κατανομές όπως: οι Student, Pareto, Weibull, Uniform κ.ά. Εικόνα 5.2: To menu P-P plot Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε ένα γράφημα για κάθε μεταβλητή. Εικόνα 5.3: Αποτελέσματα από την εντολή P-P plot

5.3.3 Q-Q Plots Η δυνατότητα προσφέρεται από τις επιλογές: Analyze > Descriptive Statistics > Q-Q Plots. Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής. Ένα Q-Q plot (το «Q» προέρχεται από την λέξη quantile) είναι ένα γράφημα πιθανότητας για τη γραφική σύγκριση δύο κατανομών πιθανότητας, απεικονίζοντας τα ποσοστημόρια της μιας σε σχέση με την άλλη. Το γράφημα Q-Q χρησιμοποιείται για να συγκρίνουμε τα σχήματα των συναρτήσεων κατανομής, παρέχοντας μια γραφική άποψη για το πώς ιδιότητες, όπως η θέση, η κλίμακα και η ασυμμετρία είναι παρόμοιες ή διαφορετικές στις δύο κατανομές. Επίσης, χρησιμοποιείται για να συγκρίνει τις συλλογές δεδομένων ή θεωρητικές κατανομές. Η χρήση του γραφήματος για τη σύγκριση δύο δειγμάτων δεδομένων μπορεί να θεωρηθεί ως μια μη-παραμετρική προσέγγιση για τη σύγκριση των κατανομών τους. Γενικότερα η χρήση γραφημάτων Q-Q είναι μια πιο ισχυρή προσέγγιση από την κοινή τεχνική της σύγκρισης των ιστογραμμάτων των δύο δειγμάτων. Εάν οι δύο κατανομές είναι ίσες, τότε τα σημεία του Q-Q plot θα βρίσκονται στην ευθεία y = x. Εάν οι κατανομές έχουν γραμμική σχέση, τα σημεία του γραφήματος θα βρίσκονται περίπου σε μια γραμμή, αλλά όχι κατ' ανάγκη στην ευθεία y = x. Γενικότερα τα γραφήματα Q-Q είναι συχνά τοξοειδούς ή «S» μορφής, υποδεικνύοντας ότι η μία από τις κατανομές είναι πιο ασύμμετρη από την άλλη. Εικόνα 5.4: To menu Q-Q plot Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε ένα γράφημα για κάθε μεταβλητή.

Εικόνα 5.5: Αποτελέσματα από την εντολή Q-Q plot 5.4 Στατιστικοί Έλεγχοι Κανονικότητας Για να αποφασιστεί αν θα χρησιμοποιηθεί παραμετρικός ή μη παραμετρικός έλεγχος, αρχικά εξετάζουμε την κανονικότητα των παρατηρήσεών μας. Οι στατιστικοί έλεγχοι που παρέχονται για τον έλεγχο της κανονικότητας είναι αυτοί των Kolmogorov-Smirnov και των Shapiro-Wilk. Η υπόθεση που εξετάζεται είναι αν η κατανομή των δεδομένων είναι η κανονική κατανομή, ή όχι. 5.4.1 One-Sample Kolmogorov-Smirnov (K-S) Test Η δυνατότητα προσφέρεται από τις επιλογές : Analyze > Descriptive Statistics > Explore > Plots, επιλέγοντας την παράμετρο Normality plots with tests. Analyze > Nonparametric tests > Legacy Dialogs > 1 sample K-S, με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής. To κριτήριο Κ-S είναι ένας μη παραμετρικός έλεγχος που χρησιμοποιείται για να εξετάσει την καλή προσαρμογή ενός τυχαίου δείγματος σε μία δεδομένη κατανομή, και βασίζεται στη διαφορά της εμπειρικής συνάρτησης κατανομής που προέρχεται από το δείγμα, και της αναμενόμενης συνάρτησης κατανομής υπό την υπόθεση της κανονικότητας, ή της οποιαδήποτε μηδενικής υπόθεσης H 0 η οποία μπορεί να είναι Κανονική, Ομοιόμορφη, Poisson ή Εxponential. Υποθέσεις του κριτηρίου: Το κριτήριο Kolmogorov-Smirnov υποθέτει ότι οι παράμετροι της υπό έλεγχο κατανομής προσδιορίζονται εκ των προτέρων. Αυτή η προσέγγιση υπολογίζει τις παραμέτρους από το δείγμα. Για κάθε κατανομή οι παράμετροι που εκτιμώνται είναι: Κατανομή Κανονική κατανομή Ομοιόμορφη κατανομή Poisson και Exponential κατανομή Παράμετρος Η δειγματική μέση τιμή και η δειγματική τυπική απόκλιση Το εύρος (ελάχιστη και μέγιστη τιμή) Η δειγματική μέση τιμή Πίνακας 5.1: Πίνακας που δείχνει τη σχέση κατανομής-παραμέτρου

Εικόνα 5.6: To menu One-Sample Kolmogorov-Smirnov Test Στο πλαίσιο Test Variables List ορίζονται οι μεταβλητές για τις οποίες θα υπολογιστεί το κριτήριο κανονικότητας. Το κριτήριο υπολογίζεται ξεχωριστά για κάθε μεταβλητή. Στο πλαίσιο Test Distribution επιλέγεται η κατανομή σύγκρισης. Οι δυνατές επιλογές είναι: Normal, Poisson, Uniform, Exponential. Από το πλήκτρο Exact επιλέγοντας την παράμετρο Monte Carlo ζητάμε από την εφαρμογή να χρησιμοποιήσει την τεχνική της προσομοίωσης για τον έλεγχο της κανονικότητας, όπου διεξάγει 10.000 (προκαθορισμένη τιμή) ελέγχους κανονικότητας και για κάθε έναν υπολογίζει το p-value. Στο τέλος εμφανίζει τον μέσο όρο αυτών των 10.000 p-values και ένα 99% δ.ε. γι αυτόν. Ωστόσο, η συνήθης επιλογή είναι η προκαθορισμένη Asymptotic only. Εικόνα 5.7: To menu One-Sample Kolmogorov-Smirnov Tes -Options Από το πλήκτρο Options παρέχεται η δυνατότητα εξαγωγής περιγραφικών μέτρων, τα ποσοστημόρια της κάθε μεταβλητής, και η διαχείριση των ελλειπουσών τιμών. Τα περιγραφικά μέτρα που παράγονται είναι η μέση τιμή, η τυπική απόκλιση, η ελάχιστη και η μέγιστη παρατήρηση και το πλήθος των έγκυρων παρατηρήσεων. Από τα ποσοστημόρια απεικονίζονται το 25 ο, το 50 ο, και το 75 ο ποσοστημόριο, δηλ. το 1 ο, 2 ο (διάμεσος) και 3 ο τεταρτημόριο.

Εικόνα 5.8: To menu One-Sample Kolmogorov-Smirnov Test-Options Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε τους ακόλουθους πίνακες. Εικόνα 5.9: Περιγραφικά μέτρα από την εντολή One-Sample Kolmogorov-Smirnov Test Εικόνα 5.10: Αποτελέσματα από την εντολή One-Sample Kolmogorov-Smirnov Test Από τα αποτελέσματά μας διαπιστώνουμε ότι η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 5%, συνεπώς η μεταβλητή δεν ακολουθεί κανονική κατανομή. 5.4.2 Shapiro-Wilk Τest Η δυνατότητα προσφέρεται από την επιλογή Analyze > Descriptive Statistics > Explore > Plots επιλέγοντας την παράμετρο Normality plots with tests, με σκοπό τον έλεγχο κανονικότητας μιας ποσοτικής μεταβλητής. Το κριτήριο Shapiro-Wilk είναι ένας ακόμα πολύ γνωστός μη παραμετρικός έλεγχος για το αν οι παρατηρήσεις μίας μεταβλητής προέρχεται από κανονική κατανομή. Επιλέγοντας την παράμετρο Normality plots with tests, όταν οι τιμές της μεταβλητής είναι σταθμισμένες και οι τιμές των σταθμίσεων είναι μη ακέραιες, τότε το κριτήριο των Shapiro-Wilk

υπολογίζεται όταν το σταθμισμένο (weighted) μέγεθος του δείγματος είναι μεταξύ 3-50. Εάν οι τιμές της μεταβλητής δεν είναι σταθμισμένες ή οι σταθμίσεις είναι ακέραιες τιμές, τότε το κριτήριο υπολογίζεται για μέγεθος δείγματος μεταξύ 3 και 5.000. Η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε τον ακόλουθο πίνακα: Εικόνα 5.11: Αποτελέσματα από την εντολή Explore-Normality plots with tests Από τα αποτελέσματα διαπιστώνουμε, ομοίως με τον προηγούμενο έλεγχο, ότι η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 5%, συνεπώς η μεταβλητή δεν ακολουθεί κανονική κατανομή.

Βιβλιογραφικές Αναφορές Κεφαλαίου Ελληνόγλωσσες Howitt, D., Cramer, D. (Επιμέλεια: Σ. Κοντάκος) (2011). Στατιστική με το SPSS 16.0. Αθήνα: Εκδόσεις Κλειδάριθμος. Ξενόγλωσσες Carver, R. & Nash, J. (2011). Doing Data Analysis with SPSS: Version 18.0. 5 th Edition Easton Cengage Learning. Coakes, S. J. & Steed, L. G. (1999). SPSS: Analysis without anguish: Versions 7.0, 7.5, 8.0 for Windows. Bresbane: Jacaranda Wiley. Field, A. (2013). Discovering statistics using IBM SPSS statistics. London:Sage. Huber, P. J. (1973). Robust regression: asymptotics, conjectures and Monte Carlo. The Annals of Statistics, pp. 799-821. Marques de Sa, J. P. (2007). Applied Statistics Using SPSS. STATISTICA, MATLAB and R, 2 nd Edition, Porto: Universitado de Porto Norusis Marija, J. (2002). SPSS 11.0 Guide to data analysis. Upper Saddle River New Jersey: Prentice Hall.