Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Σχετικά έγγραφα
Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

Στατιστική. 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

Μη Παραµετρικοί Έλεγχοι

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

1. Hasil Pengukuran Kadar TNF-α. DATA PENGAMATAN ABSORBANSI STANDAR TNF α PADA PANJANG GELOMBANG 450 nm

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

τατιστική στην Εκπαίδευση II

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Επαγωγική Στατιστική

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Στατιστικές Υποθέσεις

1991 US Social Survey.sav

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα


Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ο),,),--,ο< $ι ιι!η ι ηι ι ιι ιι t (t-test): ι ι η ι ι. $ι ι η ι ι ι 2 x s ι ι η η ιη ι η η SE x

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Στατιστικοί έλεγχοι του Χ 2

Μη Παραµετρικά Κριτήρια. Παραµετρικά Κριτήρια

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square)

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

τατιστική στην Εκπαίδευση II

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ ΤΜΗΜΑ ΛΟΓΟΘΕΡΑΠΕΙΑΣ. Μεγγίσογλου Ευθυμία Ξενογιώργη Αικατερίνη Σβολιανίτη Χριστίνα

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Τμήμα Λογιστικής και Χρηματοοικονομικής. Δρ. Αγγελίδης Π. Βασίλειος

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ. Στατιστική. 7 ο Μάθημα: Ο Έλεγχος Χ 2. Γεώργιος Μενεξές Τμήμα Γεωπονίας

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

ΑΝΑΦΟΡΑ ΕΡΕΥΝΑΣ ΕΙΑΣ. January 1. Ανάλυση έτους 2012

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Σπουδαστές Γιαννουλάκης Αντρέας Α.Μ Τσουρουνάκης 'Αγγελος Α.Μ Μουτουσίδου Πόπη Α.Μ Εισηγητής: Ταφιάδης Χρ.

Αναλυτική Στατιστική

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Τι κάνουμε μετά τη συλλογή των δεδομένων

Εισαγωγή στη Στατιστική

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

Ενότητα 6 η :Επαγωγική Στατιστική Ι. Ανάλυση δύο μεταβλητών. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

09_Μη παραμετρικοί έλεγχοι υποθέσεων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

Κεφάλαιο 7. Επαγωγική Στατιστική

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

«ΘΥΜΑΤΟΠΟΙΗΣΗ ΚΑΙ ΦΟΒΟΣ ΤΟΥ ΕΓΚΛΗΜΑΤΟΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ»

$ι ιι η ι ι!η ηι ι ANOVA. To ANOVA ι ι ι η η η ιη (Analysis of Variance). * ι! ι ι ι ι ι η ιη. ;, ι ι ι! η ιι ηιη ι ι!η ι η η ιη ι ι η ι η.

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 3. Στατιστική Συµπερασµατολογία για ποιοτικές µεταβλητές

T-tests One Way Anova

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Λυμένες Ασκήσεις για το μάθημα:

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Transcript:

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2. Μη Παραμετρικοί Έλεγχοι Παραμετρικοί είναι οι κλασικοί έλεγχοι υποθέσεων της Στατιστικής οι οποίοι διεξάγονται κάτω από κάποιες προϋποθέσεις για τις παραμέτρους του πληθυσμού από τους οποίους λαμβάνονται τα δεδομένα, π.χ. Κανονικότητα, ισότητα διασπορών κ.α. Οι παραμετρικοί έλεγχοι δεν μπορούν να εφαρμοστούν όταν τα δεδομένα μας είναι διατακτικά (π.χ. χρήση κλίμακας Likert) ή όταν είναι ποσοτικά αλλά έχουμε παραβίαση των βασικών υποθέσεων ή πολύ μικρά δείγματα. Σε αυτές τις περιπτώσεις χρησιμοποιούμε τους ονομαζόμενους μή παραμετρικούς ελέγχους. Στην πραγματικότητα, αυτό που ελέγχουν οι μη παραμετρικές μέθοδοι είναι εάν οι κατανομές των πληθυσμών από τις οποίες προέρχονται τα δεδομένα είναι ίδιες. Για παράδειγμα, στην περίπτωση 2 πληθυσμών, οι υποθέσεις μας είναι οι εξής: : Οι κατανομές των δύο πληθυσμών ΔΕΝ ΕΙΝΑΙ ΔΙΑΦΟΡΕΤΙΚΕΣ : Οι κατανομές των δύο πληθυσμών είναι διαφορετικές Ίδιες κατανομές όμως, σημαίνει ίδιο σχήμα, ίδιο κέντρο και ίδια έκταση. Ως κεντρική θέση στα διατακτικά δεδομένα χρησιμοποιείται η διάμεσος, ενώ για τα ποσοτικά δεδομένα μπορεί να είναι η διάμεσος ή η μέση τιμή. Έτσι, η μη απόρριψη της παραπάνω μηδενικής υπόθεσης οδηγεί και στη μη απόρριψη της μηδενικής υπόθεσης για τον αμφίπλευρο έλεγχο : : Οι κεντρικές θέσεις των δύο πληθυσμών ΔΕΝ ΕΙΝΑΙ ΔΙΑΦΟΡΕΤΙΚΕΣ Οι κεντρικές θέσεις των δύο πληθυσμών είναι διαφορετικές Στην περίπτωση που η μηδενική υπόθεση απορρίπτεται, γνωρίζουμε ότι οι πληθυσμοί δεν έχουν την ίδια κατανομή, αλλά δεν γνωρίζουμε κάτι για τη θέση των κέντρων τους, καθώς είναι δυνατόν πληθυσμοί με διαφορετική κατανομή να έχουν την ίδια κεντρική θέση. Όμως, εάν από τις γραφικές παραστάσεις προκύπτει ότι οι κατανομές έχουν το ίδιο σχήμα, τότε οι μη παραμετρικοί έλεγχοι για τη σύγκριση των κατανομών μπορούν να χρησιμοποιηθούν και ως έλεγχοι για τη σύγκριση των κεντρικών τους θέσεων (διαμέσου ή μέσης τιμής). Οι έλεγχοι μπορεί να είναι αμφίπλευροι, όπως ο παραπάνω, ή μονόπλευροι. : Η κεντρική θέση του πληθυσμού είναι μικρότερη της κεντρικής θέσης του πληθυσμού 2 ή : Η κεντρική θέση του πληθυσμού είναι μεγαλύτερη κεντρικής θέσης του πληθυσμού 2

2 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2. Έλεγχος U των Mann Whitney (Αθροίσματα Βαθμίδων) Είναι ο αντίστοιχος μή παραμετρικός έλεγχος του t test για ανεξάρτητα δείγματα. Ο έλεγχος Mann Whitney δεν διεξάγεται πάνω στις αρχικές τιμές των δεδομένων μας, αλλά πάνω στις βαθμίδες τους. Δηλαδή στην τάξη που λαμβάνουν οι παρατηρήσεις όταν όλες διαταχθούν σε μία αύξουσα σειρά. Ένας αναλυτής μέτρησε την καθυστέρηση (σε min) των πτήσεων μιας αεροπορικής εταιρείας από την Αθήνα προς τη Θεσσαλονίκη, και από την Αθήνα προς τη Ρόδο, και πήρε τα παρακάτω αποτελέσματα. Προς Θεσσαλονίκη 6,5 7, 8,9 9,7 2,5 Προς Ρόδο,7 2,5 7,2,5,7,2 Για την απόδοση των βαθμίδων, όλα τα δεδομένα διατάσσονται σε αύξουσα σειρά και κάθε μια λαμβάνει την τάξη της. Προς Θεσσαλονίκη Προς Ρόδο Βαθμίδες,7 2,5 2 6,5 3 7, 4 7,2 5 8,9 6 9,7 7,5 8,7 9,2 2,5 Θεσσαλονίκη Ρόδος Πλήθος Άθροισμα Βαθμίδων Μέσο Άθροισμα Βαθμίδων 3 5 w 25 8 9 3 62. 5 35 6 w2 3 4 6 7 35 5. 83 6 Το στατιστικό U των Mann Whitney είναι ένα μέτρο της διαφοράς για το μέσο άθροισμα των βαθμίδων και όχι για την διαφορά των μέσων τιμών των πληθυσμών. Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 3 Στο παραπάνω πίνακα παρατηρούμε ότι το μέσο άθροισμα των βαθμίδων για το αεροδρόμιο της Θεσσαλονίκης είναι μεγαλύτερο από το μέσο άθροισμα των βαθμίδων για το αεροδρόμιο της Ρόδου. Με τη χρήση του Mann Whitney test θα ελέγξουμε εάν αυτή η διαφορά είναι στατιστικά σημαντική. Αποτελέσματα με το SPSS και ερμηνεία : Οι κατανομές των δύο πληθυσμών δεν είναι διαφορετικές : Οι κατανομές των δύο πληθυσμών είναι διαφορετικές Mann-Whitney Test Ranks AIRPORT N Mean Rank Sum of Ranks (ΘΕΣΣΑΛΟΝΙΚΗ) 5 6,2 3, TIME 2 (ΡΟΔΟΣ) 6 5,83 35, Total Test Statistics c TIMEΣ Mann-Whitney U 4, Wilcoxon W 35, Z -,83 Asymp. Sig. (2-tailed),855 Exact Sig. [2*(-tailed Sig.)],93 a Monte Carlo Sig. (2-tailed) Sig.,93 b 99% Confidence Interval Lower Bound,924 Upper Bound,937 Monte Carlo Sig. (-tailed) Sig.,465 b 99% Confidence Interval Lower Bound,452 Upper Bound,478 a. Not corrected for ties. b. Based on sampled tables with starting seed 2. c. Grouping Variable: AIRPORT Η τιμή του Στατιστικού Mann Whitney U, είναι 4, Σημειώσεις Στατιστικής

4 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Για το επίπεδο σημαντικότητας, κοιτάζουμε τα Asymp. Sig. (2-tailed) =,855 και Monte Carlo Sig. (2-tailed) =,93. Και στις δύο περιπτώσεις, Sig. >.5 και συνεπώς, η μηδενική υπόθεση δεν απορρίπτεται. Επομένως, δεχόμαστε ότι οι κατανομές των πληθυσμών από τις οποίες προέρχονται τα δείγματα είναι ίδιες. Τότε, γνωρίζουμε επίσης ότι δεν υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στους μέσους χρόνους καθυστέρησης προς τους δύο προορισμούς. Παράδειγμα Μία διαφημιστική εταιρεία θέλει να ελέγξει αν η αποδοχή μιας διαφήμισης που ετοιμάζει για ένα προϊόν έχει ή όχι ίδια απήχηση στους άνδρες και στις γυναίκες. Για το σκοπό αυτό επέλεξε τυχαία άνδρες και γυναίκες και τους ζήτησε να χαρακτηρίσουν το δοκιμαστικό. Τα αποτελέσματα που πήρε είναι τα παρακάτω Γυναίκες 2 3 2 3 4 2 Άνδρες 2 3 4 3 4 2 3 4 Κακή, 2 Μέτρια, 3 Καλή, 4 Πολύ Καλή Η εξαρτημένη μεταβλητή είναι Θα την ονομάσουμε GRADE. Y : Βαθμολογία, και είναι μία διατακτική μεταβλητή. Η ανεξάρτητη μεταβλητή είναι επίπεδα. Θα την ονομάσουμε GENDER X : Φύλο, και είναι μία ονομαστική μεταβλητή με 2 Αποτελέσματα με το SPSS και ερμηνεία : Η απήχηση της διαφήμισης δεν είναι διαφορετική ανάμεσα στους άνδρες και στις γυναίκες : Η απήχηση της διαφήμισης είναι διαφορετική, ανάμεσα στους άνδρες και στις γυναίκες Mann-Whitney Test Ranks GENDER N Mean Rank Sum of Ranks Γυναίκα 8, 8, GRADE Άνδρας 3, 3, Total 2 Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 5 Test Statistics c GRADE Mann-Whitney U 25, Wilcoxon W 8, Z -,965 Asymp. Sig. (2-tailed),49 Exact Sig. [2*(-tailed Sig.)],43 a Monte Carlo Sig. (2-tailed) Sig.,65 b 99% Confidence Interval Lower Bound,59 Upper Bound,72 Monte Carlo Sig. (-tailed) Sig.,35 b 99% Confidence Interval Lower Bound,3 Upper Bound,39 a. Not corrected for ties. b. Based on sampled tables with starting seed 299883525. c. Grouping Variable: GENDER Στον πίνακα Ranks, παρατηρούμε ότι το μέσο άθροισμα των βαθμίδων στις γυναίκες είναι μικρότερο από το μέσο άθροισμα των βαθμίδων στους άνδρες. Η τιμή του στατιστικού Mann Whitney U, είναι 25 Asymp. Sig. (2-tailed) =,49 <.5 και συνεπώς, η μηδενική υπόθεση απορρίπτεται. Επομένως, η αποδοχή της διαφήμισης φαίνεται να είναι διαφορετική ανάμεσα στους άνδρες και τις γυναίκες. Σημειώσεις Στατιστικής

6 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2.2 Έλεγχος Wilcoxon (Προσημικός) Είναι ο αντίστοιχος μή παραμετρικός έλεγχος του t test για εξαρτημένα δείγματα. Για την εφαρμογή του ελέγχου Wilcoxon, θα πρέπει η εξαρτημένη μεταβλητή να διατακτική (για παράδειγμα κλίμακας Likert) ή συνεχής. Η ανεξάρτητη μεταβλητή θα πρέπει να αποτελείται από δύο σχετιζόμενες ομάδες ή ζεύγη. Τέλος, η κατανομή μεταξύ των διαφορών ανάμεσα στις τιμές των δύο ομάδων θα πρέπει να είναι συμμετρική. Παράδειγμα 2 Ένας οινοπαραγωγός ζήτησε από 5 ειδικούς να δοκιμάσουν και να βαθμολογήσουν δύο νέα κρασιά που παρήγαγε. Τα αποτελέσματα της δοκιμασίας ήταν τα εξής: Ειδικοί ος 2 ος 3 ος 4 ος 5 ος Κρασί 4 6 6 7 7,5 Κρασί 2 4,5 6,5 8 6 9,5 Η εξαρτημένη μεταβλητή είναι μεταβλητή. Η ανεξάρτητη μεταβλητή είναι Θα την ονομάσουμε WINE. Y :Βαθμολογία ειδικού, και είναι μία συνεχής X :Είδος κρασιού, και είναι ονομαστική με δύο επίπεδα. Αποτελέσματα με το SPSS και ερμηνεία : Οι κατανομές των δύο πληθυσμών δεν είναι διαφορετικές : Οι κατανομές των δύο πληθυσμών είναι διαφορετικές Wilcoxon Signed Ranks Test Ranks N Mean Rank Sum of Ranks Negative Ranks a 3, 3, Positive Ranks 4 b 3, 2, Wine2 - Wine Ties c Total 5 a. Wine2 < Wine b. Wine2 > Wine c. Wine2 = Wine Στον πίνακα Ranks παρατηρούμε ότι το μέσο άθροισμα των βαθμίδων με αρνητικό πρόσημο (περιπτώσεις όπου το ο κρασί υπερτερεί του 2 ου ) είναι ίσο με το μέσο άθροισμα των βαθμίδων με θετικό πρόσημο (περιπτώσεις όπου το 2 ο κρασί υπερτερεί του ου ) Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 7 Επομένως δεν περιμένουμε διαφορά, για την ποιότητα των 2 κρασιών. Test Statistics b,c Wine2 - Wine Z -,24 a Asymp. Sig. (2-tailed),225 Monte Carlo Sig. (2-tailed) Sig.,37 99% Confidence Interval Lower Bound,35 Upper Bound,329 Monte Carlo Sig. (-tailed) Sig.,52 99% Confidence Interval Lower Bound,43 Upper Bound,6 a. Based on negative ranks. b. Wilcoxon Signed Ranks Test c. Based on sampled tables with starting seed 34643744. Πράγματι, στον πίνακα Statistics βλέπουμε Asymp. Sig. (2-tailed) =,225 >,5 και Monte Carlo Sig. (2-tailed) =,37 >,5, και η μηδενική υπόθεση δεν απορρίπτεται. Επομένως, δεν υπάρχει διαφορά στην κρίση των ειδικών για τα δύο κρασιά. Σημειώσεις Στατιστικής

8 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2.3 Έλεγχος Kruskal - Wallis Είναι ο αντίστοιχος μη παραμετρικός έλεγχος της Ανάλυσης Διασποράς (ANOVA). Χρησιμοποιείται όταν τα δεδομένα είναι διατακτικά ή ποσοτικά για τα οποία παραβιάζεται η υπόθεση της Κανονικότητας, ή όταν το πλήθος των παρατηρήσεων είναι πολύ μικρό. Στόχος του ελέγχου είναι να διαπιστωθεί εάν υπάρχουν στατιστικά σημαντικές διαφορές ανάμεσα σε δύο ή περισσότερες ομάδες μιας ανεξάρτητης μεταβλητής, για μία συνεχή ή διατακτική εξαρτημένη μεταβλητή. Παράδειγμα 3 Ένας αναλυτής στη βιομηχανία εκδόσεων θέλει να διερευνήσει εάν το κόστος διαφήμισης σε εφημερίδα ενός δεδομένου μεγέθους είναι περίπου το ίδιο σε τέσσερις μεγάλες ομάδες εφημερίδων. Έχουν επιλεγεί τυχαία δείγματα επτά εφημερίδων από κάθε ομάδα και έχει καταγραφεί το κόστος διαφήμισης. Τα δεδομένα δίνονται παρακάτω (σε δολάρια). Πιστεύετε ότι υπάρχουν διαφορές στην τιμή μιας διαφήμισης μεταξύ των τεσσάρων ομάδων; Ομάδα Α 57 65 5 45 7 62 48 Ομάδα Β 72 8 64 55 9 38 75 Ομάδα C 35 42 58 59 46 6 6 Ομάδα D 73 85 92 68 82 94 66 (Amir Aczel, Jayavel Sounderpandian, Στατιστική σκέψη στον κόσμο των επιχειρήσεων, Broken Hill Publishers LTD, 23.) Λύση Η εξαρτημένη μεταβλητή μας είναι : Κόστος διαφήμισης (σε $), και είναι μία ποσοτική συνεχής μεταβλητή. Η ανεξάρτητη μεταβλητή είναι μεταβλητή, με τέσσερα επίπεδα (Α, Β, C, D) X : Μέγεθος εφημερίδας και είναι μία ονομαστική Θέλουμε να ελέγξουμε, εάν οι τιμές της εξαρτημένης μεταβλητής διαφοροποιούνται στα 4 επίπεδα της ανεξάρτητης μεταβλητής ή, με άλλα λόγια, εάν ο παράγοντας μέγεθος εφημερίδας επιδρά πάνω στο κόστος της διαφήμισης. COST: Κόστος διαφήμισης GROUP: Μέγεθος εφημερίδας (Α =, Β = 2, C = 3, D = 4) ΠΡΟΧΩΡΗΣΤΕ ΣΤΗ ΣΕΛΙΔΑ Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 9 ΠΑΡΑΤΗΡΗΣΗ: Γραφικές Παραστάσεις Στατιστικά Κανονικότητα Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk GROUP Statistic df Sig. Statistic df Sig.,9 7,2 *,946 7,694 COST 2,66 7,2 *,97 7,93 3,32 7,52,844 7,8 4,62 7,2 *,92 7,472 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. Σημειώσεις Στατιστικής

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Η μηδενική υπόθεση για την Κανονικότητα των Πληθυσμών, δεν απορρίπτεται σε κανένα από τα επίπεδα της ανεξάρτητης μεταβλητής COST. Θα μπορούσαμε στην περίπτωση αυτή να προχωρήσουμε και σε ανάλυση της διακύμανσης (ANOVA). Κοιτάζοντας όμως τα ιστογράμματα των συχνοτήτων παρατηρούμε ότι η προσαρμογή τους στην Κανονική καμπύλη δεν είναι ιδιαίτερα ικανοποιητική, με εξαίρεση την περίπτωση Group B. Την ίδια εικόνα παρουσιάζουν και τα θηκογράμματα, ενώ στον πίνακα των στατιστικών παρατηρούμε ασυμμετρία σε όλες τις περιπτώσεις, και επίσης παρατηρούνται διαφορές στις τυπικές αποκλίσεις (και συνεπώς στις διασπορές) Descriptives Group A Group B Group C Group D Mean 56,743 67,857 5,574 8, Median 57, 68,2857 58, 82, St. Dev 9,424 7,33425,4383,2398 Skewness,37 -,683 -,76 -,35 Kurtosis -,636,262 -,372 -,852 Στις περιπτώσεις που τα μεγέθη των δειγμάτων είναι μικρά, όπως εδώ, είναι ίσως προτιμότερο να προχωράμε σε μη παραμετρικούς ελέγχους. Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 : Οι κατανομές των τεσσάρων πληθυσμών είναι ίδιες : Οι κατανομές των τεσσάρων πληθυσμών ΔΕΝ είναι όλες ίδιες μεταξύ τους Καθώς, η εξαρτημένη μεταβλητή μας είναι ποσοτική οι παραπάνω υποθέσεις μπορούν να διατυπωθούν και ως : Δεν υπάρχει διαφορά μεταξύ των τεσσάρων μεγεθών εφημερίφας, ως προς το κόστος διαφήμισης : Υπάρχει διαφορά σε τουλάχιστον ένα ζεύγος μεγεθών εφημερίδας, ως προς το κόστος διαφήμισης Kruskal-Wallis Test Ranks GROUP N Mean Rank 7,7 2 7 6,57 COST 3 7 7,86 4 7 22,86 Total 28 Στον πίνακα Ranks παρατηρούμε ότι το μεγαλύτερο μέσο όρο βαθμίδων έχουν οι εφημερίδες της ομάδας D(= 4), και ακολουθούν οι εφημερίδες της ομάδας Β (=2), της ομάδας Α(=) και τέλος της ομάδας C(=3) Test Statistics b,c COST Chi-Square 3,76 df 3 Asymp. Sig.,3 Monte Carlo Sig. Sig., a 99% Confidence Interval Lower Bound, Upper Bound, a. Based on sampled tables with starting seed 2. b. Kruskal Wallis Test c. Grouping Variable: GROUP Σημειώσεις Στατιστικής

2 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Επειδή Asymp. Sig. =.3 <.5, η μηδενική υπόθεση απορρίπτεται και γίνεται δεκτή η εναλλακτική. Επομένως, υπάρχει διαφορά στο κόστος διαφήμισης μεταξύ των τεσσάρων μεγεθών, δηλαδή ο παράγοντας μέγεθος φαίνεται να επηρεάζει το κόστος της διαφήμισης. Στο ίδιο συμπέρασμα καταλήγουμε και στην περίπτωση που χρησιμοποιήσουμε τη μέθοδο Monte Carlo, καθώς Monte Carlo Sig. =. <.5 Παράδειγμα 4 Μία διαφημιστική εταιρεία θέλει να ελέγξει αν η αποδοχή μιας διαφήμισης που ετοιμάζει για ένα προϊόν έχει ή όχι ίδια σε διαφορετικές ηλικιακές ομάδες. Για το σκοπό αυτό επέλεξε τυχαία 5 άτομα από κάθε ηλικιακή ομάδα και τους ζήτησε να χαρακτηρίσουν το δοκιμαστικό. Τα αποτελέσματα που πήρε είναι τα παρακάτω Ηλικία 5-24 2 25-34 3 4 2 3 35-44 4 3 2 3 2 Κακή, 2 Μέτρια, 3 Καλή, 4 Πολύ Καλή Η εξαρτημένη μεταβλητή είναι Θα την ονομάσουμε GRADE. Η ανεξάρτητη μεταβλητή είναι επίπεδα. Θα την ονομάσουμε AGE (:5-24, 2:25 34, 3:35 44) Y : Βαθμολογία, και είναι μία διατακτική μεταβλητή. X :Ηλικία, και είναι μία ονομαστική μεταβλητή με 3 Αποτελέσματα με το SPSS και ερμηνεία : Η απήχηση της διαφήμισης είναι ίδια σε όλες τις ομάδες : Η απήχηση της διαφήμισης ΔΕΝ είναι ίδια σε όλες τις ομάδες Kruskal-Wallis Test Ranks AGE N Mean Rank 5 3,9 GRAGE 2 5 9,6 3 5,5 Total 5 Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 3 Στον πίνακα Ranks παρατηρούμε ότι το μεγαλύτερο μέσο όρο βαθμίδων έχουμε στην 3 η ηλικιακή ομάδα (35 44), ακολουθεί η 2 η ηλικιακή ομάδα (25 34) και τέλος η η ηλικιακή ομάδα (5 24). Test Statistics b,c GRAGE Chi-Square 6,9 df 2 Asymp. Sig.,32 Monte Carlo Sig. Sig.,3 a 99% Confidence Interval Lower Bound,25 Upper Bound,34 a. Based on sampled tables with starting seed 62438734. b. Kruskal Wallis Test c. Grouping Variable: AGE Επειδή Asymp. Sig. =.32 <.5, η μηδενική υπόθεση απορρίπτεται και γίνεται δεκτή η εναλλακτική. Επομένως, υπάρχει διαφορά ανάμεσα στις ηλικιακές ομάδες, δηλαδή, ο παράγοντας ηλικία φαίνεται να είναι καθοριστικός για την αποδοχή μιας διαφήμισης. Στο ίδιο συμπέρασμα καταλήγουμε και στην περίπτωση που χρησιμοποιήσουμε τη μέθοδο Monte Carlo, καθώς Monte Carlo Sig. =.3 <.5 Παράδειγμα 5 Σύμφωνα με το Mediaweek υπάρχουν τρεις μέθοδοι διαφήμισης στον Παγκόσμιο Ιστό. Η μέθοδος είναι η προβολή διαφημίσεων στους χρήστες που έκαναν κλικ σε ένα εικονίδιο για τη διαφήμιση. Η μέθοδος 2 είναι η προβολή διαφημίσεων μέσω των επισκέψεων στη σελίδα της εταιρίας. Η μέθοδος 3 χρησιμοποιεί για τη διαφήμιση ιστοσελίδες με ειδικά στοχευμένο περιεχόμενο. Για κάθε μέθοδο μετρήθηκε η ανταπόκριση των καταναλωτών, δηλαδή το πλήθος των ατόμων που ανταποκρίθηκαν σε κάθε μέθοδο και έκανα τελικά μια αγορά, λαμβάνοντας ένα τυχαίο δείγμα 9 ημερών για κάθε μέθοδο. Ο στόχος της μελέτης ήταν να ελεγχθεί εάν ο παράγοντας μέθοδος διαφήμισης επιδρά στην ανταπόκριση των καταναλωτών. Σημειώσεις Στατιστικής

4 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Αποτελέσματα με το SPSS και ερμηνεία Kruskal-Wallis Test Ranks ΜΕΘΟΔΟΣ N Mean Rank 9 3,89 ΑΝΤΑΠΟΚΡΙΣΗ ΚΑΤΑΝΑΛΩΤΩΝ 2 9 6,22 3 9 2,89 Total 27 Η εξαρτημένη μεταβλητή είναι Y : Ανταπόκριση καταναλωτών, και είναι μία ποσοτική μεταβλητή. Ονομάζεται ΑΝΤΑΠΟΚΡΙΣΗ ΚΑΤΑΝΑΛΩΤΩΝ. Η ανεξάρτητη μεταβλητή είναι X :Μέθοδος, και είναι μία ονομαστική μεταβλητή με 3 επίπεδα. : Προβολή διαφημίσεων στους χρήστες που έκαναν κλικ σε ένα εικονίδιο για τη διαφήμιση 2: Προβολή διαφημίσεων μέσω των επισκέψεων στη σελίδα της εταιρίας. 3: Διαφήμιση με ιστοσελίδες ειδικά στοχευόμενου περιεχομένου. Στον πίνακα Ranks, παρατηρούμε ότι το μεγαλύτερο μέσο όρο βαθμίδων εμφανίζει μέθοδος 3, ακολουθεί η μέθοδος και τέλος η μέθοδος 2. Test Statistics b,c ΑΝΤΑΠΟΚΡΙΣΗ ΚΑΤΑΝΑΛΩΤΩΝ Chi-Square 7,534 df 2 Asymp. Sig., Monte Carlo Sig. Sig., a 99% Confidence Interval Lower Bound, a. Based on sampled tables with starting seed 2. b. Kruskal Wallis Test c. Grouping Variable: ΜΕΘΟΔΟΣ ΚΑΤΑΝΑΛΩΤΩΝ Upper Bound, : Η ανταπόκριση των καταναλωτών είναι ίδια για τις τρεις μεθόδους διαφήμισης : Η ανταπόκριση των καταναλωτών ΔΕΝ είναι ίδια για τις τρεις μεθόδους διαφήμισης Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 5 Επειδή Asymp. Sig. =. <.5, η μηδενική υπόθεση απορρίπτεται και γίνεται δεκτή η εναλλακτική. Επομένως, υπάρχει διαφορά μεταξύ των μεθόδων, δηλαδή, η μέθοδος διαφήμισης φαίνεται να επηρεάζει την ανταπόκριση των καταναλωτών. Στο ίδιο συμπέρασμα καταλήγουμε και στην περίπτωση που χρησιμοποιήσουμε τη μέθοδο Monte Carlo, καθώς Monte Carlo Sig. =. <.5 Σημειώσεις Στατιστικής

6 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 2. Η Δοκιμασία Χ 2 2. Πίνακες Συνάφειας Ένας πίνακας συνάφειας περιγράφει τη σχέση ανάμεσα σε δύο κατηγορικές μεταβλητές X και Y που έχουν k και l επίπεδα, αντίστοιχα. Για παράδειγμα, στον παρακάτω πίνακα συνάφειας οι μεταβλητές μας είναι: X : Ηλικιακή Ομάδα και έχει k 3 επίπεδα 35, 355, 5 Y : Προτιμώμενο Μέσο Μαζικής Ενημέρωσης και έχει l 5 επίπεδα (Τοπικό κανάλι, Εθνικό κανάλι, Ραδιόφωνο, Εφημερίδα, Internet ) Ηλικιακή Ομάδα ΜΜΕ <35 35-5 >5 Τοπικό κανάλι 3 6 9 Εθνικό κανάλι 2 3 8 43 Ραδιόφωνο 8 4 9 3 Εφημερίδα 5 7 22 Internet 2 2 3 35 48 52 5 5 Προέκυψε από μία έρευνα στην οποία 5 τυχαία επιλεγμένα άτομα απάντησαν στην ερώτηση «ποιό ΜΜΕ προτιμάτε συνήθως για την ενημέρωσή σας;» Στον πίνακα συνάφειας οι απαντήσεις εισάγονται κατά ηλικιακή ομάδα και κατά ΜΜΕ. Τα δεδομένα μιας γραμμής, μας δείχνουν πώς κατανέμονται στις ηλικιακές ομάδες τα άτομα που απάντησαν ότι προτιμούν για την ενημέρωσή τους ένα συγκεκριμένο ΜΜΕ. Στο περιθώριο της γραμμής σημειώνεται το άθροισμα που μας δείχνει τον συνολικό αριθμό των ατόμων που δήλωσαν ότι προτιμούν το συγκεκριμένο ΜΜΕ. Έτσι, στη 2 η δεύτερη γραμμή, βλέπουμε ότι: 43 από τα 5 άτομα που ρωτήθηκαν, απάντησαν ότι προτιμούν για την ενημέρωσή τους Εθνικό κανάλι. Από τα 43 άτομα που απάντησαν ότι προτιμούν για την ενημέρωσή τους το Εθνικό κανάλι, τα 2 ανήκουν στην ηλικιακή ομάδα κάτω των 35, τα 3 στην ηλικιακή ομάδα 35 52 και τέλος 8 ανήκουν στην ηλικιακή ομάδα άνω των 5. Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 7 Αντίστοιχα, τα δεδομένα μιας στήλης, μας δείχνουν πώς κατανέμονται τα άτομα μιας ηλικιακής ομάδας, ως προς την προτίμησή τους στα ΜΜΕ. Το άθροισμα στο περιθώριο της στήλης, μας δείχνει πόσα από τα άτομα που ερωτήθηκαν ανήκουν στη συγκεκριμένη ηλικιακή ομάδα. Έτσι, στη 2 η στήλη, βλέπουμε ότι: 52 από τα 5 άτομα που ρωτήθηκαν, ανήκαν στην ηλικιακή ομάδα 35 5. Από τα 52 άτομα που ανήκουν στη ηλικιακή ομάδα 35 5, τα 6 απάντησαν ότι προτιμούν για την ενημέρωσή τους τοπικό κανάλι, τα 3 ότι προτιμούν εθνικό κανάλι, τα 4 προτιμούν ραδιοφωνικό σταθμό, 7 εφημερίδα και, τέλος 2 απάντησαν ότι για την ενημέρωσή τους προτιμούν το Internet. Τέλος, στη διασταύρωση της 2 ης στήλης και της 2 η γραμμής, βλέπουμε το πλήθος των ατόμων που ανήκουν στην ηλικιακή ομάδα 35 5 και προτιμούν για την ενημέρωσή τους Εθνικό κανάλι (δηλαδή 3 από τα 5). 2.2 Η δοκιμασία Χ 2 ως έλεγχος ανεξαρτησίας Στόχος της έρευνας είναι να διαπιστώσουμε εάν υπάρχει σχέση ανάμεσα στην ηλικιακή ομάδα και την προτίμηση του ΜΜΕ. Ή, με άλλα λόγια, εάν η μεταβλητή (παράγοντας) ηλικιακή ομάδα επηρεάζει την προτίμηση για την επιλογή ΜΜΕ. Ο στατιστικός έλεγχος που χρησιμοποιούμε για να δούμε αν υπάρχει σχέση ανάμεσα σε δύο κατηγορικές μεταβλητές (χαρακτηριστικά) ενός πληθυσμού είναι η δοκιμασία X 2 για τον έλεγχο ανεξαρτησίας. Οι υποθέσεις έχουν την εξής μορφή: : Οι κατηγορικές μεταβλητές είναι ανεξάρτητες : Οι κατηγορικές μεαβλητές δεν είναι ανεξάρτητες Απόρριψη της μηδενικής υπόθεσης σημαίνει ότι υπάρχουν σημαντικές ενδείξεις ότι οι δύο μεταβλητές σχετίζονται μεταξύ τους. Η μη απόρριψη της μηδενικής σημαίνει ότι δεν υπάρχουν σημαντικές ενδείξεις για τη σχέση των δύο μεταβλητών. Έτσι, οι υποθέσεις μας μπορούν να διατυπωθούν και ως: : : Δεν υπάρχει σχέση ανάμεσα στις δύο κατηγορικές μεταβλητές Υπάρχει σχέση ανάμεσα στις κατηγορικές μεταβλητές Σημειώσεις Στατιστικής

8 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Αποτελέσματα με το SPSS και ερμηνεία Οι μεταβλητές μας είναι: MME για το προτιμώμενο Μέσο Μαζικής Ενημέρωσης (: Τοπικό κανάλι, 2 : Εθνικό κανάλι, 3: Ραδιόφωνο, 4: Εφημερίδα, 5 : Internet) HLIKIA για την Ηλικιακή Ομάδα ( : <35, 2 :35 5, 3: >5) COUNT για τις παρατηρούμενες συχνότητες : Οι μεταβλητές "Ηλικιακή ομάδα" και "Προτίμηση ΜΜΕ" είναι ανεξάρτητες : Οι μεταβλητές "Ηλικιακή ομάδα" και "Προτίμηση ΜΜΕ" δεν είναι ανεξάρτητες MME * HLIKIA Crosstabulation HLIKIA 2 3 Total Count 3 6 9 Expected Count 6, 6,6 6,3 9, % within MME 5,8% 3,6% 52,6%,% Count 2 3 8 43 2 Expected Count 3,8 4,9 4,3 43, MME Total 3 4 5 % within MME 27,9% 3,2% 4,9%,% Count 8 4 9 3 Expected Count 9,9,7,3 3, % within MME 25,8% 45,2% 29,%,% Count 5 7 22 Expected Count 7, 7,6 7,3 22, % within MME 22,7% 3,8% 45,5%,% Count 2 2 3 35 Expected Count,2 2,,7 35, % within MME 57,% 34,3% 8,6%,% Count 48 52 5 5 Expected Count 48, 52, 5, 5, % within MME 32,% 34,7% 33,3%,% Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 9 Πίνακας MME * HLIKIA Crosstabulation Στα κελιά των γραμμών Count αναγράφονται οι παρατηρούμενες συχνότητες. Είναι, δηλαδή, τα στοιχεία του πίνακα συνάφειας. Στα κελιά των γραμμών Expected Count αναγράφονται οι αναμενόμενες συχνότητες. Αυτές είναι οι συχνότητες που θα έπρεπε να υπάρχουν στον πίνακα συνάφειας για να χαρακτηριστούν οι μεταβλητές Ηλικιακή Ομάδα και Προτιμώμενο ΜΜΕ ως ανεξάρτητες. Η διαδικασία Χ 2 βασίζεται στη σύγκριση ανάμεσα στις παρατηρούμενες και τις αναμενόμενες συχνότητες. Προφανώς, εάν δεν υπάρχει σημαντική διαφορά ανάμεσά τους οι μεταβλητές θα χαρακτηριστούν ως ανεξάρτητες, διαφορετικά θα δεχτούμε ότι είναι εξαρτημένες. Παρατηρούμε ότι σε αρκετές περιπτώσεις η αποστάσεις ανάμεσα στις παρατηρούμενες και τις αναμενόμενες συχνότητες είναι αρκετά μεγάλες. Στα κελιά των γραμμών % within MME εμφανίζονται τα ποσοστά των ατόμων που ανήκουν σε μια ηλικιακή ομάδα, με την προϋπόθεση ότι αυτά δείχνουν προτίμηση στο συγκεκριμένο ΜΜΕ. Είναι, με άλλα λόγια, η ερμηνεία του πίνακα συνάφειας κατά γραμμές. Για παράδειγμα, από τα άτομα που προτιμούν για την ενημέρωσή τους Εθνικό κανάλι το 52,6% είναι ηλικίας άνω των 5 ετών. Πίνακας Chi-Square Tests Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 2,637 a 8,6 Likelihood Ratio 22,97 8,3 Linear-by-Linear Association 3,, N of Valid Cases 5 a. cells (,%) have expected count less than 5. The minimum expected count is 6,8. ΣΗΜΑΝΤΙΚΗ ΠΑΡΑΤΗΡΗΣΗ: Για να είναι έγκυρο το αποτέλεσμα της διαδικασίας Χ 2, πρέπει το ποσοστό των κελιών με αναμενόμενες συχνότητες κάτω του 5, να είναι μικρότερο από 2% Η σημείωση a. cells (,%) have expected count less than 5. The minimum expected count is 6,8. που βρίσκεται κάτω από τον πίνακα μας πληροφορεί ότι το ποσοστό των κελιών με αναμενόμενη συχνότητα μικρότερη του 5, είναι %. Σημειώσεις Στατιστικής

2 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Επομένως, το συμπέρασμα του ελέγχου για την ανεξαρτησία των μεταβλητών είναι έγκυρο. Η τιμή του στατιστικού Pearson Chi-Square είναι 2,637, ενώ για το επίπεδο σημαντικότητας έχουμε Asymp. Sig. (2-sided) =,6 <,5 και η μηδενική υπόθεση απορρίπτεται. Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι μεταβλητές «Ηλικιακή Ομάδα» και «Προτιμώμενο ΜΜΕ» δεν είναι ανεξάρτητες και, συνεπώς, ο παράγοντας ηλικία φαίνεται να επηρεάζει την προτίμηση για την επιλογή ΜΜΕ. Παράδειγμα 6 Μια μεγάλη εταιρεία ενδιαφέρεται να διαπιστώσει εάν υπάρχει σχέση ανάμεσα στο χρόνο μετακίνησης των εργαζομένων της και στα προβλήματα που αυτοί εμφανίζουν στη δουλειά και συνδέονται με τα επίπεδα άγχους. Από μία μελέτη σε 6 υπαλλήλους πήρε τα παρακάτω αποτελέσματα. Χρόνος μετακίνησης Επίπεδο Άγχους Κάτω από 5 min 5 min 45 min Πάνω από 45 min Υψηλό 9 7 8 44 Μέτριο 5 8 6 9 Χαμηλό 8 28 7 53 32 53 3 6 Οι μεταβλητές μας είναι: TIME για το χρόνο μετακίνησης (: κάτω από 5min, 2 : 5 min 45 min, 3: πάνω από 45 min) STRESS για το επίπεδο άγχους ( : Υψηλό, 2 :Μέτριο, 3: Πάνω από 45) COUNT για τις παρατηρούμενες συχνότητες Υποθέσεις : Οι μεταβλητές "Χρόνος μετακίνησης" και "Επίπεδο άγχους" είναι ανεξάρτητες : Οι μεταβλητές "Χρόνος μετακίνησης" και "Επίπεδο άγχους" δεν είναι ανεξάρτητες Μαρίνα Σύρπη

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 2 STRESS * TIME Crosstabulation STRESS Total 2 3 TIME 2 3 Total Count 9 7 8 44 Expected Count 2, 2,,8 44, % within STRESS 2,5% 38,6% 4,9%,% Count 5 8 6 9 Expected Count 5,2 8,7 5, 9, % within STRESS 26,3% 42,% 3,6%,% Count 8 28 7 53 Expected Count 4,6 24,2 4,2 53, % within STRESS 34,% 52,8% 3,2%,% Count 32 53 3 6 Expected Count 32, 53, 3, 6, % within STRESS 27,6% 45,7% 26,7%,% Από τους υπαλλήλους που εμφανίζουν υψηλό επίπεδο άγχους, το 2,5% αποτελούν αυτοί που έχουν χρόνο μετακίνησης μικρότερο από 5 min, το 38,6% αποτελούν αυτοί που έχουν χρόνο μετακίνησης 5min 45 min και τέλος το 4,9% αποτελούν αυτοί που έχουν χρόνο μετακίνησης μεγαλύτερο από 45 min. Από τους υπαλλήλους που εμφανίζουν μέτριο επίπεδο άγχους, το 26,3% αποτελούν αυτοί που έχουν χρόνο μετακίνησης μικρότερο από 5 min, το 42,% αποτελούν αυτοί που έχουν χρόνο μετακίνησης 5min 45 min και τέλος το 3,6% αποτελούν αυτοί που έχουν χρόνο μετακίνησης μεγαλύτερο από 45 min Από τους υπαλλήλους που εμφανίζουν χαμηλό επίπεδο άγχους, το 34% αποτελούν αυτοί που έχουν χρόνο μετακίνησης μικρότερο από 5 min, το 52,8% αποτελούν αυτοί που έχουν χρόνο μετακίνησης 5min 45 min και τέλος το 3,2% αποτελούν αυτοί που έχουν χρόνο μετακίνησης μεγαλύτερο από 45 min. Σε κάποιες περιπτώσεις οι αποστάσεις των παρατηρούμενων από τις αναμενόμενες συχνότητες είναι μεγάλες, αλλά αυτές δεν είναι πολλές. Σημειώσεις Στατιστικής

22 Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 9,83 a 4,43 Likelihood Ratio,28 4,37 Linear-by-Linear Association 7,524,6 N of Valid Cases 6 a. cells (,%) have expected count less than 5. The minimum expected count is 5,8. Παρατηρούμε ότι το ποσοστό των κελιών με συχνότητα μικτότερη του 5 είναι % < 2% και επομένως τα αποτελέσματα της δοκιμασίας είναι έγκυρα. Η τιμή του στατιστικού Pearson Chi-Square είναι 9.83, ενώ για το επίπεδο σημαντικότητας έχουμε Asymp. Sig. (2-sided) =,43 <,5 και η μηδενική υπόθεση απορρίπτεται. Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι μεταβλητές «Χρόνος μετακίνησης» και «Επίπεδο άγχους» δεν είναι ανεξάρτητες και, συνεπώς, ο παράγοντας χρόνος μετακίνησης φαίνεται να επηρεάζει το επίπεδο του άγχους. 2.3 Η δοκιμασία Χ 2 ως έλεγχος ομοιογένειας Η δοκιμασία 2 X μπορεί να χρησιμοποιηθεί και ως έλεγχος για την ομοιογένεια των πληθυσμών. Στην περίπτωση αυτή η υποθέσεις έχουν την εξής μορφή : Οι πληθυσμοί είναι ομοιογενείς : Οι πληθυσμοί δεν είναι ομοιογενείς Έτσι, για την περίπτωση του ου παραδείγματος, οι υποθέσεις θα εξειδικεύονταν ως εξής: : Οι ηλικιακοί πληθυσμοί είναι ομοιογενείς, ως προς την προτίμησή τους στην επιλογή ΜΜΕ : Οι πληθυσμοί δεν είναι ομοιογενείς, ως προς την προτίμησή τους στην επιλογή ΜΜΕ Η διαδικασία είναι η ίδια με την περίπτωση της δοκιμασίας για την ανεξαρτησία, και η απόρριψη της μηδενικής υπόθεσης μας οδηγεί στο εξής συμπέρασμα: Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι «Ηλικιακές Ομάδες» δεν είναι ομοιογενείς ως προς την επιλογή ΜΜΕ, και, συνεπώς, ο παράγοντας ηλικία φαίνεται να επηρεάζει την προτίμηση για την επιλογή ΜΜΕ. Μαρίνα Σύρπη