Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Σχετικά έγγραφα
Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

τατιστική στην Εκπαίδευση II

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

1. Hasil Pengukuran Kadar TNF-α. DATA PENGAMATAN ABSORBANSI STANDAR TNF α PADA PANJANG GELOMBANG 450 nm

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ο),,),--,ο< $ι ιι!η ι ηι ι ιι ιι t (t-test): ι ι η ι ι. $ι ι η ι ι ι 2 x s ι ι η η ιη ι η η SE x

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Λυμένες Ασκήσεις για το μάθημα:

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

1991 US Social Survey.sav

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

Εισαγωγή στην Ανάλυση Διακύμανσης

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Επαγωγική Στατιστική

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

τατιστική στην Εκπαίδευση II

Τμήμα Λογιστικής και Χρηματοοικονομικής. Δρ. Αγγελίδης Π. Βασίλειος

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εισαγωγή στην Ανάλυση Δεδομένων

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

Τι κάνουμε μετά τη συλλογή των δεδομένων

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Στατιστική. 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Στατιστικές Υποθέσεις

$ι ιι η ι ι!η ηι ι ANOVA. To ANOVA ι ι ι η η η ιη (Analysis of Variance). * ι! ι ι ι ι ι η ιη. ;, ι ι ι! η ιι ηιη ι ι!η ι η η ιη ι ι η ι η.

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

T-tests One Way Anova

Statistics. hrs1 Number of hours worked last week. educ Highest year of school completed. sibs NUMBER OF BROTHERS AND SISTERS. N Valid


Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Έλεγχος Υποθέσεων Εφαρμογές

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Αναλυτική Στατιστική

Στατιστικοί έλεγχοι του Χ 2

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Transcript:

Βοήθημα Εξετάσεων Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

2 1. Περιγραφική Στατιστική Θα δίνονται το ιστόγραμμα των σχετικών συχνοτήτων και τα στατιστικά. 1. Να μπορείτε να εξάγετε τα συμπεράσματα για την Ασυμμετρία και την Κύρτωση της Κατανομής, κάνοντας χρήση των κριτηρίων: Συμμετρία Διαφορετικά, Αν 2 se.. έχουμε συμμετρική Κατανομή για 0 η Κατανομή εμφανίζει θετική ασυμμετρία για 0 η Κατανομή εμφανίζει αρνητική ασυμμετρία Κύρτωση Διαφορετικά, Αν 2 se.. έχουμε μεσόκυρτη Κατανομή για 0 η Κατανομή χαρακτηρίζεται ως λεπτόκυρτη για 0 η Κατανομή χαρακτηρίζεται ως πλατύκυρτη. 2. Να μπορείτε να εξάγετε το συμπέρασμα για την Κανονικότητα της κατανομής, κάνοντας χρήση των παρακάτω: Μια κατανομή που είναι συμμετρική και μεσόκυρτη μπορεί να χαρακτηριστεί ως Κανονική. Επομένως, για να θεωρήσουμε κανονικότητα, θα πρέπει: και s e 2 s. e. 2.. Έλεγχος Υπόθεσης για την Κανονικότητα της Κατανομής 0 1 : Τα δεδομένα προέρχονται από Κανονικό Πληθυσμό : Τα δεδομένα ΔΕΝ προέρχονται από Κανονικό Πληθυσμό Για, n 50 χρησιμοποιούμε το στατιστικό Shapiro Wilk Για, n 50 χρησιμοποιούμε το στατιστικό Kolmogorov Smirnov 3. Να γνωρίζετε την παρουσίαση των μέτρων Κεντρικής Τάσης, των τεταρτημορίων και την αξιολόγηση του συντελεστή μεταβλητότητας. Διαβάστε τα Λυμένα Παραδείγματα της ενότητας «Διερευνητική Ανάλυση Δεδομένων» Μαρίνα Σύρπη

Συχνότητες (πλήθος χωρών) 3 ΘΕΜΑ: Διερευνητική Ανάλυση Δεδομένων Παρακάτω βλέπετε τα ιστογράμματα των συχνοτήτων καθώς και στατιστικά, για το ποσοστό των οργανικών καλλιεργειών, στις 28 χώρες της Ε.Ε. (ΠΗΓΗ: EUROSTAT, 2014) 10 9 5 3 0% 4% 8% 12% 16% 20% 1 Ποσοστό οργανικών καλλιεργειών (επί του συνόλου των καλλιεργούμενων εκτάσεων) Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. ΠΟΣΟΣΤΟ ΟΡΓΑΝΙΚΩΝ ΚΑΛΛΙΕΡΓΕΙΩΝ 0,178 28 0,023 0,905 28 0,015 a. Lilliefors Significance Correction Σημειώσεις Στατιστικής

4 Statistics ΠΟΣΟΣΤΟ ΟΡΓΑΝΙΚΩΝ ΚΑΛΛΙΕΡΓΕΙΩΝ N Valid 28 Missing 0 Mean 6,79 Std. Error of Mean 0,94 Median 5,53 Mode 0,31 Std. Deviation 4,98 Variance 24,76 Skewness 1,04 Std. Error of Skewness 0,44 Kurtosis 0,42 Std. Error of Kurtosis 0,86 Range 18,96 Minimum 0,31 Maximum 19,27 Sum 189,53 Percentiles 25 Q 1 3,15 50 Q 2 5,52 Θηκόγραμμα 75 Q 3 9,44 ( α ) Διατυπώστε το συμπέρασμά σας για την κανονικότητα της κατανομής του ποσοστού των οργανικών καλλιεργειών στις χώρες της EU-28, χρησιμοποιώντας τον κατάλληλο έλεγχο υπόθεσης. ( β ) Διατυπώστε το συμπέρασμά σας για την συμμετρία της κατανομής του ποσοστού των οργανικών καλλιεργειών στις χώρες της EU-28. ( γ ) Παρουσιάστε τα μέτρα κεντρικής τάσης. ( δ ) Για την Ελλάδα, το ποσοστό των οργανικών καλλιεργειών είναι 5,3%. Πώς θα το χαρακτηρίζατε και για ποιους λόγους; Μαρίνα Σύρπη

5 2. Διαστήματα Εμπιστοσύνης για τη μέση τιμή ενός πληθυσμού ΟΧΙ υπολογισμούς διαστημάτων εμπιστοσύνης ΜΟΝΟΝ ΤΗΝ ΕΡΜΗΝΕΙΑ/ ΠΑΡΟΥΣΙΑΣΗ. ΟΧΙ υπολογισμούς για την επιλογή μεγέθους δείγματος. Για τα παραδείγματα 1, 2 και 3 που υπάρχουν στην ενότητα «Διαστήματα Εμπιστοσύνης_Ασκήσεις» Διαβάστε προσεκτικά τις εκφωνήσεις και τα ερωτήματα (εκτός από αυτά που αναφέρονται στον υπολογισμό μεγέθους δείγματος). Στη συνέχεια, βρείτε στις λύσεις τα εκτιμημένα διαστήματα και διαβάστε προσεκτικά την ερμηνεία/παρουσίασή τους. 3. Έλεγχοι Υποθέσεων για τη μέση τιμή ενός πληθυσμού Να κατανοήσετε καλά τη διαδικασία των ελέγχων Υποθέσεων. Να μπορείτε να διατυπώνετε την Μηδενική και την Εναλλακτική Υπόθεση. Να μπορείτε να διατυπώνεται σωστά τα συμπεράσματα. ΟΧΙ υπολογισμούς ΟΧΙ τύπους. Τα αποτελέσματα θα δίνονται και οι έλεγχοι θα διεξάγονται με τη χρήση της τιμής p value: Ως επίπεδο σημαντικότητας θα λαμβάνεται το 0, 05 - εκτός αν ορίζεται διαφορετικά. Επομένως, για τη διεξαγωγή των Ελέγχων Υπόθεσης εκτελούμε τα παρακάτω βήματα: 1. Ορισμός της Μηδενικής Υπόθεσης 0 και της Εναλλακτικής Υπόθεσης 1. 2. Υπολογισμός της τιμής p- value Για αμφίπλευρο έλεγχο p- value Sig. 2 tailed Για μονόπλευρο έλεγχο 3. Κανόνας Απόφασης Αν p-value Sig. 2 tailed p- value 2 τότε, σε επίπεδο σημαντικότητας η 0 απορρίπτεται. 4. Διατύπωση του Συμπεράσματος Η τιμή p, είναι επίσης ένα μέτρο για το πόσο ισχυρή είναι η απόρριψη της μηδενικής υπόθεσης. Όσο ποιό μικρή είναι η p value, τόσο ισχυρότερες είναι οι ενδείξεις κατά της 0 και υπέρ της 1 Η απόρριψη της 0 χαρακτηρίζεται: Πάρα πολύ ισχυρή όταν p 0. 001 Πολύ ισχυρή όταν 0. 001 p 0. 01 Ισχυρή όταν 0. 01 p 0. 05 Ασθενής όταν 0. 05 p 0. 10 (στην περίπτωση που επιλέγεται 0.10 ) Σημειώσεις Στατιστικής

6 Για παράδειγμα, έστω ότι για κάποιον έλεγχο υπόθεσης, προκύπτει p value 0. 028 Καθώς 0. 01 p value 0. 028 0. 05 χαρακτηρίζουμε την απόρριψη της μηδενικής υπόθεσης 0 ως ισχυρή και αυτό σημαίνει ότι τα στοιχεία που στηρίζουν την αλήθεια της Εναλλακτικής Υπόθεσης είναι σημαντικά. Παραδείγματα 2 έως 5 της Ενότητας «Έλεγχοι Υποθέσεων» Λύση με SPSS ΟΧΙ τους υπολογισμούς για τα διαστήματα εμπιστοσύνης στις εξετάσεις τα άκρα των διαστημάτων (Lower Upper) θα δίνονται υπολογισμένα. ΠΑΡΑΤΗΡΗΣΗ: Όταν έχουμε μικρά δείγματα, n 30 πριν τον έλεγχο των υποθέσεων πρέπει να γίνεται πάντα έλεγχος κανονικότητας θα υπάρχει ο πίνακας TEST OF NORMALITY. Παράδειγμα 6 της Ενότητας «Έλεγχοι Υποθέσεων» ΛΥΜΕΝΗ ΑΣΚΗΣΗ 1: Διάστημα Εμπιστοσύνης & Έλεγχος για τη μέση τιμή ενός πληθυσμού Η αντικαπνιστική νομοθεσία υποχρεώνει τους καπνιστές που εργάζονται σε χώρους γραφείων να κάνουν διαλείμματα και να πηγαίνουν σε περιορισμένους χώρους όπου επιτρέπεται το κάπνισμα, για να ικανοποιήσουν αυτή την ανάγκη τους. Από παλαιότερες μελέτες, γνωρίζουμε ότι οι καπνιστές χάνουν κατά μέσο όρο 32 λεπτά την ημέρα για τέτοια διαλείμματα. Για να μειωθεί αυτός ο χρόνος πολλά κτίρια γραφείων δημιούργησαν χώρους καπνιστών με ισχυρούς εξαερισμούς. Σε ένα τέτοιο κτίριο επιλέχθηκε ένα τυχαίο δείγμα 110 καπνιστών και καταγράφηκε ο χρόνος που βρέθηκαν μακριά από τη θέση τους στη διάρκεια μιας ημέρας. ( α ) Να διατυπώσετε το συμπέρασμά σας για το διάστημα εμπιστοσύνης του μέσου χρόνου που χάνεται λόγω καπνίσματος, μετά τη δημιουργία χώρων καπνιστών. ( β ) Να ελέγξετε μετά τη δημιουργία του χώρου καπνιστών, υπήρξε μείωση του μέσου χρόνου που χάνεται λόγω καπνίσματος. One-Sample Statistics N Mean Std. Deviation Std. Error Mean Minutes 110 29,92 5,709,544 One-Sample Test Test Value = 32 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval Lower Upper Minutes -3,825 109,000-2,082 28,84 31 Μαρίνα Σύρπη

7 ( α ) Με πιθανότητα σφάλματος 0,05, εκτιμούμε ότι μετά τη δημιουργία χώρων καπνιστών, ο μέσος χρόνος που χάνεται λόγω καπνίσματος βρίσκεται εντός των ορίων 28,84 min και 31 min. ( β ) n 110 30, μεγάλο δείγμα και δεν απαιτείται Έλεγχος Κανονικότητας. Από τον πίνακα των στατιστικών παρατηρούμε ότι, μετά τη δημιουργία των χώρων με ισχυρούς εξαερισμούς, ο μέσος χρόνος 29,92 min, και επομένως φαίνεται να έχει μειωθεί. 0 1 : 32 : 32, που χάνουν οι καπνιστές εκτιμάται σε Sig. 2-tailed 0 000 p value 0, 000 0, 05 και η μηδενική υπόθεση απορρίπτεται. 2 2 Για επίπεδο σημαντικότητας 0,05, συμπεραίνουμε ότι ο μέσος χρόνος που χάνουν τώρα οι καπνιστές, στατιστικά, είναι σημαντικά μικρότερος από 32 min. Επομένως, η δημιουργία χώρων καπνιστών με ισχυρούς εξαερισμούς συνέβαλλε στη μείωση του μέσου χρόνου που χάνεται λόγω καπνίσματος. ΘΕΜΑ: Διάστημα Εμπιστοσύνης & Έλεγχος για τη μέση τιμή ενός πληθυσμού Δημοσιογράφος του LifeStyle, θέλησε να ελέγξει εάν η μέση ηλικία των δισεκατομμυριούχων είναι μικρότερη από τα 60 έτη. Για το σκοπό αυτό επέλεξε ένα τυχαίο δείγμα 34 δισεκατομμυριούχων από την λίστα Forbes. Παρακάτω βλέπετε τα αποτελέσματα του ελέγχου. One-Sample Statistics N Mean Std. Deviation Std. Error Mean ΗΛΙΚΙΑ 34 59,79 12,586 2,159 t df Sig. (2-tailed) One-Sample Test Test Value = 60 Mean Difference 95% Confidence Interval Lower Upper ΗΛΙΚΙΑ -0,095 33 0,925-0,206 55,4 64,19 ( α ) Να διατυπώσετε το συμπέρασμα για το διάστημα εμπιστοσύνης της μέσης ηλικίας των δισεκατομμυριούχων. ( β ) Να διατυπώσετε τις υποθέσεις και τα συμπεράσματα του ελέγχου υπόθεσης για τη μέση ηλικία των δισεκατομμυριούχων. Σημειώσεις Στατιστικής

8 4. Συγκρίσεις πληθυσμών 4.1 Σύγκριση των μέσων τιμών 1 και 2 δύο πληθυσμών Δείγματα Ανεξάρτητα Ακολουθείται διαδικασία παρόμοια με εκείνην των Ελέγχων Υπόθεσης για τη μέση τιμή ενός πληθυσμού που περιγράφεται παραπάνω. ΠΑΡΑΤΗΡΗΣΗ: Πριν τον έλεγχο υποθέσεων προηγούνται τα εξής: 1) Έλεγχος για την Κανονικότητα των πληθυσμών ΟΤΑΝ ΔΕΝ ΜΑΣ ΔΙΝΟΝΤΑΙ ΣΤΟΙΧΕΙΑ ΓΙΑ ΤΗΝ ΚΑΝΟΝΙΚΟΤΗΤΑ. 2) Έλεγχος για την ισότητα των διασπορών των πληθυσμών. Παραδείγματα 1, 2, 3 της Ενότητας «ANOVA» ΛΥΜΕΝΗ ΑΣΚΗΣΗ 2 : Σύγκριση Πληθυσμών Δείγματα Ανεξάρτητα Τί συμβαίνει σε μία οικογενειακή επιχείρηση όταν ο ιδρυτής αποσυρθεί και αναλάβει κάποιος άλλος; Είναι καλύτερα αν ο νέος διευθυντής είναι κάποιο από τα παιδιά του αρχικού, ή αν αναλάβει κάποιος ξένος; Μια έρευνα επέλεξε ένα τυχαίο δείγμα 140 οικογενειακών επιχειρήσεων, στις οποίες αποσύρθηκε ο αρχικός διευθυντής και κατέγραψε την ποσοστιαία μεταβολή του συνολικού ενεργητικού ένα χρόνο μετά την αλλαγή διευθυντή, σε σύγκριση με ένα χρόνο πριν. Παρακάτω βλέπετε τα αποτελέσματα του ελέγχου. Μπορούμε να συμπεράνουμε ότι η πορεία της επιχείρησης είναι διαφορετική για τα δύο είδη διευθυντών; Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. ΠΑΙΔΙ,076 42,200 *,980 42,648 ΞΕΝΟΣ,080 98,200 *,985 42,852 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. Group Statistics Διευθυντής N Mean Std. Deviation Std. Error Mean Μεταβολή Ενεργητικού ΠΑΙΔΙ 42 -,1000 1,94614,30030 ΞΕΝΟΣ 98 1,2359 2,83457,28633 Μαρίνα Σύρπη

9 Independent Samples Test Levene's Test for Equality of Variances Equal variances assumed Μεταβολή Ενεργητικού t-test for Equality of Means F Sig. t df Sig. (2-tailed) 6,871,010-2,783 138,006-3,220 110,749,002 Equal variances not assumed Επειδή οι διασπορές των πληθυσμών είναι άγνωστες, πρέπει απαιτείται έλεγχος για την κανονικότητα των πληθυσμών. 0 : Τα δεδομένα προέρχονται από Κανονικό Πληθυσμό 1 : Τα δεδομένα ΔΕΝ προέρχονται από Κανονικό Πληθυσμό Για την περίπτωση που ο νέος διευθυντής είναι κάποιο παιδί έχουμε n 42 50 επομένως Sig. 0.648 0.05 (από Shapiro-Wilk), και για την περίπτωση που ο νέος διευθυντής είναι κάποιος ξένος έχουμε n 98 50, επομένως Sig. 0.200 0.05 (από Kolmogorov- Smirnov). Συνεπώς η 0 δεν απορρίπτεται σε καμία από τις δύο περιπτώσεις και θεωρούμε Κανονικότητα των Πληθυσμών. Στον πίνακα των στατιστικών, παρατηρούμε ότι στην περίπτωση που ο νέος διευθυντής είναι κάποιο από τα παιδιά, η μέση ποσοστιαία μεταβολή του ενεργητικού είναι αρνητική (-0,1 %) ενώ στην περίπτωση που ο νέος διευθυντής είναι ξένος η μέση μεταβολή είναι θετική (1,23%) Έλεγχος για την ισότητα των διασπορών 0 : Διασπορές ίσες 1 : Διασπορές άνισες Sig. 0.01 0.05 (από Levene's Test for Equality of Variances) και η μηδενική υπόθεση απορρίπτεται. Επομένως θεωρούμε ότι οι διασπορές των δύο πληθυσμών είναι άνισες. Έλεγχος για τη διαφορά των μέσων τιμών 0 : 1 2 1 : 1 2 p value Sig.(2 tailed ) 0.002 0.05, και η μηδενική υπόθεση απορρίπτεται. Σημειώσεις Στατιστικής

10 Σε επίπεδο σημαντικότητας α = 0.05, συμπεραίνουμε ότι η μέση μεταβολή του ενεργητικού, στατιστικά, είναι σημαντικά διαφορετική στις δύο περιπτώσεις. Επομένως, μπορούμε να ισχυριστούμε ότι η πορεία της επιχείρησης είναι διαφορετική για τα δύο είδη των διευθυντών. ΘΕΜΑ: Σύγκριση Πληθυσμών Δείγματα Ανεξάρτητα Γενικά πιστεύεται ότι οι πωλητές που εργάζονται με προμήθεια είναι αποδοτικότεροι από αυτούς που εργάζονται με σταθερό μισθό. Υπάρχει όμως και η αντίθετη γνώμη, σύμφωνα με την οποία, οι πωλητές που εργάζονται με προμήθεια γίνονται τόσο πιεστικοί που οι πελάτες εκνευρίζονται και τελικά δεν αγοράζουν. Μία έρευνα επέλεξε ένα τυχαίο δείγμα 180 πωλητών σε καταστήματα λιανικής πώλησης ρουχισμού, από τους οποίους 90 εργάζονται με σταθερό μισθό και 90 με προμήθεια, και κατέγραψε τις συνολικές πωλήσεις καθενός στη διάρκεια ενός έτους. Παρακάτω βλέπετε τα αποτελέσματα του ελέγχου. Θεωρώντας κανονική κατανομή και για τις δύο κατηγορίες πωλητών, μπορούμε να συμπεράνουμε ότι οι πωλητές που εργάζονται με προμήθεια παρουσιάζουν υψηλότερες πωλήσεις από αυτούς που εργάζονται με σταθερό μισθό; Group Statistics ΜΙΣΘΟΣ ΠΩΛΗΤΩΝ N Mean Std. Deviation Std. Error Mean ΠΩΛΗΣΕΙΣ (σε /έτος) 1: Με προμήθεια 90 63562,91 10755,325 1133,711 2: Σταθερός 90 60245,10 10505,814 1107,410 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means ΠΩΛΗΣΕΙΣ (σε /έτος) Equal variances assumed Equal variances not assumed F Sig. t df Sig. (2-tailed) 0,036 0,851-2,093 178 0,038-2,093 177,902 0,038 Μαρίνα Σύρπη

11 4.2 Σύγκριση των μέσων τιμών 1 και 2 δύο πληθυσμών Ζευγαρωτές Παρατηρήσεις Παράδειγμα 6 Ζευγαρωτές Παρατηρήσεις της Ενότητας «ANOVA» ΛΥΜΕΝΗ ΑΣΚΗΣΗ 3 : Σύγκριση Πληθυσμών Ζευγαρωτές Παρατηρήσεις Μια έρευνα σχετικά με το φύλο και τις επαγγελματικές προσφορές που δέχονται οι απόφοιτοι MBA επέλεξε 25 ζεύγη αποφοίτων. Σε κάθε ζεύγος υπήρχε ένας άνδρας και μία γυναίκα, που δεν διέφεραν ως προς την ηλικία, τη μέση βαθμολογία, το αντικείμενο σπουδών και την προηγούμενη εργασιακή εμπειρία, και καταγράφηκε η υψηλότερη προσφορά (σε χιλιάδες δολάρια) που δέχτηκε ο καθένας. Με την προϋπόθεση ότι οι πληθυσμοί ακολουθούν την Κανονική κατανομή, να ελέγξετε εάν το φύλο επηρεάζει το ύψος των προσφορών. Pair 1 Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Γυναίκες 55,68 25 10,278 2,056 Άνδρες 56,40 25 10,805 2,161 Paired Samples Correlations N Correlation Sig. Pair 1 Γυναίκες & Άνδρες 25,955,000 Mean Std. Deviation Paired Samples Test Paired Differences Std. Error Mean 95% Confidence Interval of the Difference Lower Upper t df Sig. (2-tailed) Pair 1 Γυναίκες - Άνδρες -,720 3,195 0,639-2,039 6,822-1,127 24,271 Από τον πίνακα των στατιστικών, παρατηρούμε ότι το μέσο ύψος των προσφορών για τις γυναίκες είναι χαμηλότερο από το αντίστοιχο των ανδρών. Ο συντελεστής συσχέτισης είναι 0,995 0,4, επομένως μπορούμε να προχωρήσουμε στον έλεγχο για τη σύγκριση των μέσων τιμών. : 0 1 2 1 : 1 2 p value Sig.(2 tailed ) 0.271 0.05, και η μηδενική υπόθεση δεν απορρίπτεται. Σημειώσεις Στατιστικής

12 Σε επίπεδο σημαντικότητας α = 0.05, συμπεραίνουμε ότι το μέσο ύψος προσφορών, στατιστικά, δεν είναι σημαντικά διαφορετικό ανάμεσα στους άνδρες και τις γυναίκες. Επομένως, το φύλο δεν φαίνεται να επηρεάζει το ύψος των προσφορών. ΘΕΜΑ: Σύγκριση Πληθυσμών Ζευγαρωτές Παρατηρήσεις Μια μεγάλη επιχείρηση εξετάζει την καθιέρωση ενός προγράμματος φυσικής άσκησης μετά το γεύμα, ώστε να βελτιωθεί η υγεία των εργαζομένων και να μειωθούν οι απουσίες και οι ιατρικές δαπάνες. Έτσι, καθιέρωσε πειραματικά το πρόγραμμα σε ένα τμήμα και κατέγραψε τις ιατρικές δαπάνες κάθε μήνα, για ένα χρόνο πριν και ένα χρόνο μετά την εφαρμογή του προγράμματος. Παρακάτω βλέπετε τα αποτελέσματα της έρευνας. Με την προϋπόθεση ότι οι πληθυσμοί ακολουθούν την κανονική κατανομή, να ελέγξετε εάν το πρόγραμμα της φυσικής άσκησης μετά το φαγητό επηρεάζει το ύψος των ιατρικών δαπανών. ΣΗΜΕΙΩΣΗ: Μπορείτε να επιλέξετε είτε αμφίπλευρο είτε μονόπλευρο έλεγχο. Επιβράβευση 5 μονάδων, εάν αιτιολογήσετε την επιλογή του ελέγχου. Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Ιατρικές δαπάνες (χιλ. /μήνα) 1: ΠΡΙΝ 46,58 12 16,670 4,812 2: ΜΕΤΑ 43,50 12 18,618 5,375 Paired Samples Correlations N Correlation Sig. Ιατρικές δαπάνες (χιλ. /μήνα) ΠΡΙΝ & ΜΕΤΑ 12 0,950 0,000 Paired Samples Test Paired Differences Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper t df Sig. (2-tailed) Pair 1 ΠΡΙΝ & ΜΕΤΑ 3,083 5,885 1,699-0,656 0,599 1,815 11 0,097 Μαρίνα Σύρπη

13 4.3 Ανάλυση της Διασποράς (ANOVA) Χρησιμοποιείται για την σύγκριση των μέσων τιμών, όταν οι πληθυσμοί μας είναι περισσότεροι από 2. 0 : 1 2 3 1 : Δεν είναι όλα τα j ίσα μεταξύ τους, j 1, 2, 3 Διαβάστε την εκφώνηση του εισαγωγικού παραδείγματος, και τη λύση του στις σελίδες 17 20. Παράδειγμα 6, σελίδα 21 Άσκηση στη σελίδα 26 ΑΣΚΗΣΗ 4 : ANOVA Μία έρευνα του Πανεπιστημίου Columbia κατέγραψε πόσες φορές στη διάρκεια μια διάλεξης» οι καθηγητές τριών τμημάτων έλεγαν «ααα..» ή «εεε» για να καλύψουν κενά στο λόγο τους (πηγή: περιοδικό Report no Business, Αύγουστος 1991). Τα δεδομένα καταγράφηκαν από 100 διαλέξεις κάθε τμήματος. Με την προϋπόθεση της Κανονικότητας των πληθυσμών, αν δεχτούμε ότι όσο περισσότερα κενά κάνει ο ομιλητής τόσο ποιο βαρετή είναι μια διάλεξη, μπορούμε από τα δεδομένα να συμπεράνουμε ότι οι καθηγητές κάποιου από τα τρία τμήματα είναι ποιο βαρετοί από τους άλλους; AaaEee N Mean Std. Deviation Descriptives Std. Error 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound English 100 5,81 2,493,249 5,32 6,30 0 11 Mathematics 100 5,30 2,013,201 4,90 5,70 0 9 Political Sciense 100 5,33 1,975,197 4,94 5,72 0 9 Total 300 5,48 2,178,126 5,23 5,73 0 11 Test of Homogeneity of Variances AaaEee Levene Statistic df1 df2 Sig. 2,952 2 297,061 Σημειώσεις Στατιστικής

14 ANOVA AaaEee Sum of Squares df Mean Square F Sig. Between Groups 16,380 2 8,190 3,734,048 Within Groups 1402,500 297 4,722 Total 1418,880 299 Multiple Comparisons AaaEee Bonferroni (I) ΜΑΘΗΜΑ (J) ΜΑΘΗΜΑ Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound English - 1 Mathematics - 2 Political Sciense - 3 Mathematics,510,307,0358 -,23 1,25 Political Sciense,480,307,0433 -,26 1,22 English -,510,307,0358-1,25,23 Political Sciense -,030,307 1,000 -,77,71 Mathematics -,480,307 1,000-1,22,26 English,030,307,0433 -,71,77 Μαρίνα Σύρπη

15 ΘΕΜΑ : ANOVA Μια εταιρεία πρόκειται να εισάγει ένα νέο προϊόν στην αγορά και πρέπει να αποφασίσει για την τιμή. Ο διευθυντής μάρκετινγκ γνωρίζει ότι η τιμή θα πρέπει να είναι κοντά στα 10, αλλά θέλει να εξετάσει ποιές θα είναι οι συνέπειες στις πωλήσεις αν η τιμή γίνει λίγο μικρότερη ή λίγο μεγαλύτερη. Για το λόγο αυτό επέλεξε 60 καταστήματα μιας γνωστής αλυσίδας, που βρίσκονται σε παρόμοιες οικιστικές περιοχές, και τα χώρισε σε τρεις ομάδες: Στην πρώτη ομάδα διέθεσε δοκιμαστικά το προϊόν προς 9, στην δεύτερη προς 10 και στην τρίτη προς 11. Στο τέλος της δοκιμαστικής περιόδου καταγράφηκαν οι πωλήσεις σε κάθε κατάστημα. Στη συνέχεια, και με την προϋπόθεση ότι οι πωλήσεις ακολουθούν την κανονική κατανομή και στις τρεις περιπτώσεις, διεξήγαγε ANOVA κατά έναν παράγοντα, για να ελέγξει εάν οι πωλήσεις ανάμεσα στις τρεις ομάδες είναι ίδιες. Παρακάτω βλέπετε τα αποτελέσματα της ανάλυσης. Ποιά τιμή θα προτείνατε για το προϊόν, και για ποιους λόγους; ΠΩΛΗΣΕΙΣ (πλήθος συσκευασιών του προϊόντος) N Mean Std. Deviation Std. Error Descriptives 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound 1:ΤΙΜΗ_ 9 20 153,60 25,578 5,719 141,63 165,57 110 197 2:ΤΙΜΗ_ 10 20 151,50 30,398 6,797 137,27 165,73 91 210 3:ΤΙΜΗ_ 11 20 133,25 25,037 5,598 121,53 144,97 96 176 Total 60 146,12 28,197 3,640 138,83 153,40 91 210 Test of Homogeneity of Variances ΠΩΛΗΣΕΙΣ (πλήθος συσκευασιών) Levene Statistic df1 df2 Sig. 0,345 2 57 0,710 ANOVA ΠΩΛΗΣΕΙΣ (πλήθος συσκευασιών) Sum of Squares df Mean Square F Sig. Between Groups 5010,633 2 2505,317 3,408 0,040 Within Groups 41897,550 57 735,045 Total 46908,183 59 Σημειώσεις Στατιστικής

16 Multiple Comparisons ΠΩΛΗΣΕΙΣ (πλήθος συσκευασιών) LSD (I) ΤΙΜΗ (J) ΤΙΜΗ Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 9 10 11 10 2,100 8,573 0,807-15,07 19,27 11 20,350 * 8,573 0,021 3,18 37,52 9-2,100 8,573 0,807-19,27 15,07 11 18,250 * 8,573 0,038 1,08 35,42 9-20,350 * 8,573 0,021-37,52-3,18 10-18,250 * 8,573 0,038-35,42-1,08 *. The mean difference is significant at the 0.05 level. ΔΙΑΒΑΣΤΕ ΑΦΟΥ ΤΕΛΕΙΩΣΕΤΕ ΤΗ ΛΥΣΗ ΤΗΣ ΑΣΚΗΣΗΣ και ΜΟΝΟΝ αν θέλετε να κερδίσετε 5 + 5 επιπλέον μονάδες Υποθέτω, ότι καταλήξατε στην πρότασή σας ακολουθώντας «πιστά την Στατιστική», δηλαδή συγκρίνοντας το μέσο πλήθος των πωλήσεων για τις τρεις περιπτώσεις. Για την Στατιστική, η απόφαση είναι μάλλον προφανής. Θα αλλάζατε για κάποιον λόγο την απόφασή σας, και ποιός θα ήταν αυτός ; Πώς θα χρησιμοποιούσατε τη Στατιστική, για να επιβεβαιώσετε τη νέα σας απόφαση; Μαρίνα Σύρπη

17 5. Μη Παραμετρικοί Έλεγχοι Χρησιμοποιούνται όταν τα δεδομένα μας είναι διατακτικά (π.χ. χρήση κλίμακας Likert) ή όταν είναι ποσοτικά αλλά έχουμε παραβίαση των βασικών υποθέσεων (π.χ. Κανονικότητα) ή πολύ μικρά δείγματα. Έλεγχος Kruskal - Wallis Είναι ο αντίστοιχος μη παραμετρικός έλεγχος της Ανάλυσης Διασποράς (ANOVA). Χρησιμοποιείται όταν τα δεδομένα είναι διατακτικά ή ποσοτικά για τα οποία παραβιάζεται η υπόθεση της Κανονικότητας, ή όταν το πλήθος των παρατηρήσεων είναι πολύ μικρό. Στόχος του ελέγχου είναι να διαπιστωθεί εάν υπάρχουν στατιστικά σημαντικές διαφορές ανάμεσα σε δύο ή περισσότερες ομάδες μιας ανεξάρτητης μεταβλητής, για μία συνεχή ή διατακτική εξαρτημένη μεταβλητή. Παράδειγμα 3 Διαβάστε την εκφώνηση και την αρχή της λύσης, στη σελίδα 8. Προχωρήστε στη σελίδα 11. Παραδείγματα 4, 5 Όπως είναι. Σημειώσεις Στατιστικής

18 6. Η δοκιμασία Χ 2 ως έλεγχος ανεξαρτησίας Ο στατιστικός έλεγχος που χρησιμοποιούμε για να δούμε αν υπάρχει σχέση ανάμεσα σε δύο κατηγορικές μεταβλητές (χαρακτηριστικά) ενός πληθυσμού είναι η δοκιμασία X 2 για τον έλεγχο ανεξαρτησίας. Οι υποθέσεις έχουν την εξής μορφή: 0 : Οι κατηγορικές μεταβλητές είναι ανεξάρτητες : Οι κατηγορικές μεαβλητές δεν είναι ανεξάρτητες 1 Απόρριψη της μηδενικής υπόθεσης σημαίνει ότι υπάρχουν σημαντικές ενδείξεις ότι οι δύο μεταβλητές σχετίζονται μεταξύ τους. Η μη απόρριψη της μηδενικής σημαίνει ότι δεν υπάρχουν σημαντικές ενδείξεις για τη σχέση των δύο μεταβλητών. Έτσι, οι υποθέσεις μας μπορούν να διατυπωθούν και ως: 0 1 : : Δεν υπάρχει σχέση ανάμεσα στις δύο κατηγορικές μεταβλητές Υπάρχει σχέση ανάμεσα στις κατηγορικές μεταβλητές Παράδειγμα 150 τυχαία επιλεγμένα άτομα από τρεις ηλικιακές ομάδες απάντησαν στην ερώτηση «ποιό ΜΜΕ προτιμάτε συνήθως για την ενημέρωσή σας;» Τα αποτελέσματα παρουσιάζονται στον παρακάτω πίνακα συνάφειας. Ηλικιακή Ομάδα ΜΜΕ <35 35-50 >50 Τοπικό κανάλι 3 6 10 19 Εθνικό κανάλι 12 13 18 43 Ραδιόφωνο 8 14 9 31 Εφημερίδα 5 7 10 22 Internet 20 12 3 35 48 52 50 150 Στόχος της έρευνας είναι να διαπιστώσουμε εάν υπάρχει σχέση ανάμεσα στην ηλικιακή ομάδα και την προτίμηση του ΜΜΕ. Ή, με άλλα λόγια, εάν η μεταβλητή (παράγοντας) ηλικιακή ομάδα επηρεάζει την προτίμηση για την επιλογή ΜΜΕ. Μαρίνα Σύρπη

19 Αποτελέσματα με το SPSS και ερμηνεία Οι μεταβλητές μας είναι: MME για το προτιμώμενο Μέσο Μαζικής Ενημέρωσης (1: Τοπικό κανάλι, 2 : Εθνικό κανάλι, 3: Ραδιόφωνο, 4: Εφημερίδα, 5 : Internet) HLIKIA για την Ηλικιακή Ομάδα (1 : <35, 2 :35 50, 3: >50) COUNT για τις παρατηρούμενες συχνότητες 0 1 : Οι μεταβλητές "Ηλικιακή ομάδα" και "Προτίμηση ΜΜΕ" είναι ανεξάρτητες : Οι μεταβλητές "Ηλικιακή ομάδα" και "Προτίμηση ΜΜΕ" δεν είναι ανεξάρτητες MME * HLIKIA Crosstabulation HLIKIA 1 2 3 Total Count 3 6 10 19 1 Expected Count 6,1 6,6 6,3 19,0 % within MME 15,8% 31,6% 52,6% 100,0% Count 12 13 18 43 2 Expected Count 13,8 14,9 14,3 43,0 MME Total 3 4 5 % within MME 27,9% 30,2% 41,9% 100,0% Count 8 14 9 31 Expected Count 9,9 10,7 10,3 31,0 % within MME 25,8% 45,2% 29,0% 100,0% Count 5 7 10 22 Expected Count 7,0 7,6 7,3 22,0 % within MME 22,7% 31,8% 45,5% 100,0% Count 20 12 3 35 Expected Count 11,2 12,1 11,7 35,0 % within MME 57,1% 34,3% 8,6% 100,0% Count 48 52 50 150 Expected Count 48,0 52,0 50,0 150,0 % within MME 32,0% 34,7% 33,3% 100,0% Σημειώσεις Στατιστικής

20 Πίνακας MME * HLIKIA Crosstabulation Στα κελιά των γραμμών Count αναγράφονται οι παρατηρούμενες συχνότητες. Είναι, δηλαδή, τα στοιχεία του πίνακα συνάφειας. Στα κελιά των γραμμών Expected Count αναγράφονται οι αναμενόμενες συχνότητες. Αυτές είναι οι συχνότητες που θα έπρεπε να υπάρχουν στον πίνακα συνάφειας για να χαρακτηριστούν οι μεταβλητές Ηλικιακή Ομάδα και Προτιμώμενο ΜΜΕ ως ανεξάρτητες. Σε αρκετά ζεύγη παρατηρούμενων και αναμενόμενων συχνοτήτων εμφανίζονται σημαντικές διαφορές. Πίνακας Chi-Square Tests Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 21,637 a 8,006 Likelihood Ratio 22,971 8,003 Linear-by-Linear Association 13,110 1,000 N of Valid Cases 150 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,08. Η τιμή του στατιστικού Pearson Chi-Square είναι 21,637, ενώ για το επίπεδο σημαντικότητας έχουμε Asymp. Sig. (2-sided) = 0,006 < 0,05 και η μηδενική υπόθεση απορρίπτεται. Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι μεταβλητές «Ηλικιακή Ομάδα» και «Προτιμώμενο ΜΜΕ» δεν είναι ανεξάρτητες και, συνεπώς, ο παράγοντας ηλικία φαίνεται να επηρεάζει την προτίμηση για την επιλογή ΜΜΕ. ΣΗΜΑΝΤΙΚΗ ΠΑΡΑΤΗΡΗΣΗ: Για να είναι έγκυρο το αποτέλεσμα της διαδικασίας Χ 2, πρέπει το ποσοστό των κελιών με αναμενόμενες συχνότητες κάτω του 5, να είναι μικρότερο από 20% Η σημείωση a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,08. που βρίσκεται κάτω από τον πίνακα μας πληροφορεί ότι το ποσοστό των κελιών με αναμενόμενη συχνότητα μικρότερη του 5, είναι 0%. Επομένως, το συμπέρασμα του ελέγχου για την ανεξαρτησία των μεταβλητών είναι έγκυρο. Μαρίνα Σύρπη

21 Παράδειγμα 2 Μια μεγάλη εταιρεία ενδιαφέρεται να διαπιστώσει εάν υπάρχει σχέση ανάμεσα στο χρόνο μετακίνησης των εργαζομένων της και στα προβλήματα που αυτοί εμφανίζουν στη δουλειά και συνδέονται με τα επίπεδα άγχους. Από μία μελέτη σε 116 υπαλλήλους πήρε τα παρακάτω αποτελέσματα. Χρόνος μετακίνησης Επίπεδο Άγχους Κάτω από 15 min 15 min 45 min Πάνω από 45 min Υψηλό 9 17 18 44 Μέτριο 5 8 6 19 Χαμηλό 18 28 7 53 32 53 31 116 Οι μεταβλητές μας είναι: TIME για το χρόνο μετακίνησης (1: κάτω από 15min, 2 : 15 min 45 min, 3: πάνω από 45 min) STRESS για το επίπεδο άγχους (1 : Υψηλό, 2 :Μέτριο, 3: Πάνω από 45) COUNT για τις παρατηρούμενες συχνότητες Υποθέσεις : Οι μεταβλητές "Χρόνος μετακίνησης" και "Επίπεδο άγχους" είναι ανεξάρτητες 0 1 : Οι μεταβλητές "Χρόνος μετακίνησης" και "Επίπεδο άγχους" δεν είναι ανεξάρτητες Σημειώσεις Στατιστικής

22 STRESS Total 1 2 3 STRESS * TIME Crosstabulation TIME 1 2 3 Total Count 9 17 18 44 Expected Count 12,1 20,1 11,8 44,0 % within STRESS 20,5% 38,6% 40,9% 100,0% Count 5 8 6 19 Expected Count 5,2 8,7 5,1 19,0 % within STRESS 26,3% 42,1% 31,6% 100,0% Count 18 28 7 53 Expected Count 14,6 24,2 14,2 53,0 % within STRESS 34,0% 52,8% 13,2% 100,0% Count 32 53 31 116 Expected Count 32,0 53,0 31,0 116,0 % within STRESS 27,6% 45,7% 26,7% 100,0% Σε κάποιες περιπτώσεις οι αποστάσεις των παρατηρούμενων από τις αναμενόμενες συχνότητες είναι μεγάλες, αλλά αυτές δεν είναι πολλές. Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 9,831 a 4,043 Likelihood Ratio 10,218 4,037 Linear-by-Linear Association N of Valid Cases 116 7,524 1,006 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,08. Παρατηρούμε ότι το ποσοστό των κελιών με συχνότητα μικτότερη του 5 είναι 0% < 20% και επομένως τα αποτελέσματα της δοκιμασίας είναι έγκυρα. Η τιμή του στατιστικού Pearson Chi-Square είναι 9.831, ενώ για το επίπεδο σημαντικότητας έχουμε Asymp. Sig. (2-sided) = 0,043 < 0,05 και η μηδενική υπόθεση απορρίπτεται. Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι μεταβλητές «Χρόνος μετακίνησης» και «Επίπεδο άγχους» δεν είναι ανεξάρτητες και, συνεπώς, ο παράγοντας χρόνος μετακίνησης φαίνεται να επηρεάζει το επίπεδο του άγχους. Μαρίνα Σύρπη