Επαγωγική Στατιστική

Σχετικά έγγραφα
Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

τατιστική στην Εκπαίδευση II

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Τμήμα Λογιστικής και Χρηματοοικονομικής. Δρ. Αγγελίδης Π. Βασίλειος

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Εισαγωγή στην Ανάλυση Δεδομένων

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Αναλυτική Στατιστική

Στατιστικές Υποθέσεις

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

τατιστική στην Εκπαίδευση II

Στατιστική. 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

1991 US Social Survey.sav

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Λυμένες Ασκήσεις για το μάθημα:

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Κεφάλαιο 7. Επαγωγική Στατιστική

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

χ 2 test ανεξαρτησίας

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ο),,),--,ο< $ι ιι!η ι ηι ι ιι ιι t (t-test): ι ι η ι ι. $ι ι η ι ι ι 2 x s ι ι η η ιη ι η η SE x

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

T-tests One Way Anova

Εισόδημα Κατανάλωση

Μη Παραµετρικοί Έλεγχοι

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Εισαγωγή στη Στατιστική

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

Περιεχόμενα. Πρόλογος... 15

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ

Transcript:

Στατιστικό πακέτο SPSS Επαγωγική Στατιστική users.auth.gr/agpapana/spss_stat_inference.pdf Παπάνα Αγγελική, ρ. papanagel@yahoo.gr, agpapana@gen.auth.gr

Η επαγωγική στατιστική αποτελείται μία σειρά μεθόδων που χρησιμοποιούνται για την εξαγωγή συμπερασμάτων σχετικά με τα χαρακτηριστικά του πληθυσμού βασισμένα σε δεδομένα από το δείγμα. Οι ερευνητικές υποθέσεις αφορούν τον πληθυσμό που μελετά ο ερευνητής και σχεδόν πάντα αφορούν τον ισχυρισμό μίας διαφορετικότητας μεταξύ δύο ή περισσοτέρων ομάδων. Είναι ανέφικτο και δαπανηρό να ερευνήσουμε όλα τα άτομα από έναν μεγάλο πληθυσμό, γι αυτό και θέλουμε να κάνουμε εκτιμήσεις σχετικά με τον πληθυσμό από το δείγμα. Όμως τα συμπεράσματα που βγαίνουν δεν είναι πάντα αληθή. Για αυτό τον λόγο, κατασκευάζουμε στην επαγωγική στατιστική «μέτρα αξιοπιστίας», και υπολογίζουμε το επίπεδο εμπιστοσύνης και επίπεδο σημαντικότητας κάθε ελέγχου.

Παράδειγμα Σε μια μελέτη (Nature, Νοέμβριος 2007), ερευνήθηκε εάν τα νήπια λαμβάνουν υπόψη τις ενέργειες ενός ατόμου ώστε να τον αξιολογήσουν ως «καλό» ή «κακό». Σε 16 νήπια ηλικίας 10 μηνών, έδειξαν κάποιο βίντεο όπου ένας «ορειβάτης» προσπαθεί να ανέβει έναν λόφο αλλά δεν μπορεί. Κατόπιν παρουσιάστηκαν διαδοχικά δύο άλλα βίντεο για τον «ορειβάτη», όπου στo πρώτο ο ορειβάτης ωθήθηκε στην κορυφή του λόφου από ένα άλλο «καλό παιχνίδι», ενώ στο δεύτερο ο «ορειβάτης» ωθήθηκε πίσω, κάτω απότολόφο, από ένα άλλο «κακό παιχνίδι». Κατόπιν στο νήπιο παρουσιάστηκαν τα δύο παιχνίδια και του ζήτησαν να επιλέξει να παίξει με έναν από αυτά. Οι ερευνητές διαπίστωσαν ότι τα 14 από τα 16 νήπια επέλεξαν το «καλό παιχνίδι» έναντι του «κακού».

Θέλουμε να εξετάσουμε αν πράγματι τα νήπια έχουν κάποια προτίμηση στο «καλό παιχνίδι» ή αν το γεγονός ότι το επέλεξαν 14 στα 16 νήπια είναι τυχαίο. Αν πράγματι τα νήπια δεν παρουσιάζουν καμία προτίμηση μεταξύ του «καλού» και του «κακού» παιχνιδιού, είναι δυνατό τα 14 από τα 16 νήπια να επέλεξαν το «καλό» κατά τύχη; Είναι το αποτέλεσμα αυτό περίεργο ή είναι απλά μια ακραία περίπτωση; Η υπόθεση που θέλουμε να εξετάσουμε είναι εάν το αποτέλεσμα είναι περίεργο δεδομένου ότι τα νήπια δεν έχουν καμία πραγματική προτίμηση (μηδενική υπόθεση Η 0 ). Για να απαντήσουμε σε αυτήν την ερώτηση, θα «μιμηθούμε» την ίδια διαδικασία. ηλαδή θα επιλέξουμε άλλα 16 νήπια που θεωρούμε ότι θα δενέχουνκάποιαπροτίμηση, και θα δούμε πόσα θα επιλέξουν το «καλό» παιχνίδι. Την διαδικασία αυτή την επαναλαμβάνουμε πολλές φορές, π.χ. 1000 φορές (προσομοίωση). Εάν δούμε ότι πολύ σπάνια βλέπουμε 14 στα 16 παιδιά να επιλέγουν το «καλό παιχνίδι», αυτό είναι μια ισχυρή ένδειξη ότι τα νήπια έχουν κάποια πραγματική προτίμηση.

200 180 202 164 Number of repetitions 150 100 50 59 118 131 66 0 2 2 10 3 28 4 5 6 7 8 9 10 11 12 Number of choices for "helper" toy 19 16 13 4 14 1 15 Η ανάλυσή αυτή μας δείχνει ότι υπάρχει ισχυρή ένδειξη ότι τα νήπια έχουν κάποια προτίμηση στο «καλό παιχνίδι». Γιατί? Η ανάλυση προσομοίωσής μας δείχνει ότι σπάνια θα παίρναμε αποτελέσματα όπως στην πραγματική μελέτη εάν τα νήπια δεν είχαν πραγματικά καμία προτίμηση. Τα αποτελέσματα των ερευνητών δεν είναι σύμφωνα με τα αποτελέσματα της προσομοίωσης δηλ. με αυτά που θα αναμέναμε εάν οι επιλογές των νηπίων ακολουθούσαν την μηδενική μας υπόθεση. Άρα συμπεραίνουμε ότι οι επιλογές των νηπίων οδηγούνται από κάποια άλλη διαδικασία όπου υπάρχει προτίμηση στο «καλό παιχνίδι».

Το μακροπρόθεσμο ποσοστό των φορών που συμβαίνει ένα γεγονός αν θεωρηθεί ότι είναι μια τυχαία διαδικασία που επαναλαμβάνεται επανειλημμένα καλείται πιθανότητα του γεγονότος. Μπορούμε να προσεγγίσουμε μια πιθανότητα εμπειρικά με τη «προσομοίωση» της τυχαίας διαδικασίας κατά πολύ μεγάλο αριθμό επαναλήψεων, υπολογίζοντας το ποσοστό των φορών που το γεγονός συμβαίνει. H πιθανότητα ότι η τυχαία επιλογή παιχνιδιού θα παρήγαγε δεδομένα τόσο «ακραία» (ή και περισσότερο) όπως η πραγματική μελέτη καλείται p-τιμή (p-value). H p-τιμή δηλαδή δείχνει πόσο συχνά πετυχαίνουμε αποτελέσματα τόσο ακραία όσο τα πραγματικά στοιχεία. Μια μικρή p-τιμή δείχνει ότι τα παρατηρηθέντα στοιχεία είναι «περίεργο» να εμφανιστούν αν γίνεται τυχαία επιλογή, δηλαδή εάν το η μηδενική υπόθεση είναι αληθινή. Ένα τέτοιο αποτέλεσμα λέγεται ότι είναι στατιστικά σημαντικό, παρέχοντας αποδείξεις ενάντια στην Η 0. Όσο μικρότερη είναι η p-τιμή, τόσο ισχυρότερη απόδειξη υπάρχει ενάντια στην Η 0.

Το επίπεδο εμπιστοσύνης είναι το ποσοστό των φορών όπου μίαδιαδικασίαεκτίμησηςείναισωστή. Π.χ. Ένα επίπεδο εμπιστοσύνης της τάξης του 95% σημαίνει ότι τα αποτελέσματα της στατιστικής ανάλυσης θα είναι σωστά το 95% των φορών. Όταν ο στόχος της επαγωγικής στατιστικής είναι να εξάγουμε ένα συμπέρασμα σχετικά με τον πληθυσμό, το επίπεδο σημαντικότητας α μετράει πόσο συχνά το συμπέρασμα θα είναι εσφαλμένο μακροπρόθεσμα. Π.χ. ένα 5% επίπεδο σημαντικότητας σημαίνει ότι, μακροπρόθεσμα, αυτού του είδους το συμπέρασμα θα είναι λανθασμένο 5% των φορών. Η p-τιμή αποτελεί το ελάχιστο επίπεδο σημαντικότητας α, για το οποίο η μηδενική υπόθεση πρέπει να απορριφθεί χρησιμοποιώντας την τιμή που προκύπτει από τη στατιστική δοκιμή. Όταν η p-τιμή είναι μικρότερη από το α, η μηδενική υπόθεση πρέπει να απορριφθεί.

Στατιστικοί έλεγχοι Ο στατιστικός έλεγχος υποθέσεων είναι μια συμπερασματική διαδικασία και βρίσκει εφαρμογή σε στοχαστικά προβλήματα απόφασης μεταξύ δύο εναλλακτικών υποθέσεων. Αναζητούνται ισχυρές ενδείξεις για την αλήθεια ενός ισχυρισμού. Η μία υπόθεση ονομάζεται μηδενική υπόθεση και συμβολίζεται με H 0, και η άλλη ονομάζεται εναλλακτική υπόθεση και συμβολίζεται με H 1. Θέτουμε ως H 0 την υπόθεση για την οποία αμφιβάλουμε. π.χ. Έστω καπνοβιομηχανία παράγει έναν νέο τύπο τσιγάρων και ενδιαφέρεται να γνωρίζει τη μέση ποσότητα νικοτίνης που περιέχεται στα νέου τύπου τσιγάρα, ώστε η ποσότητα νικοτίνης να μην υπερβαίνει ένα μέγιστο επιτρεπτό όριο. Για το πρόβλημα αυτό πρέπει να γίνει κατάλληλος στατιστικός έλεγχος υποθέσεων ώστε να μπορεί να αποφασίσει μεταξύ των υποθέσεων: Η 0 : Η μέση ποσότητα νικοτίνης δεν υπερβαίνει το μέγιστο επιτρεπτό όριο. Η 1 : Η μέση ποσότητα νικοτίνης υπερβαίνει το μέγιστο επιτρεπτό όριο.

Εξετάζουμε αν ένα τυχαίο δείγμα που παίρνουμε από τον πληθυσμό δίνει ενδείξεις/ αποδείξεις υπέρ της απόρριψής της Η 0. ηλαδή, η H 0, απορρίπτεται ή δεν απορρίπτεται με βάση το τι παρατηρείται στο τυχαίο δείγμα που πήραμε από τον πληθυσμό. Υποθέτουμε ότι η H 0 είναι αληθής. Αν αυτό που παρατηρείται στο δείγμα είναι ακραίο/ σπάνιο, τότε αυτό που παρατηρείται στο δείγμα έχει πολύ μικρή πιθανότητα να συμβεί. Στην περίπτωση αυτή απορρίπτουμε την H 0. Σε αντίθετη περίπτωση, δηλαδή αν αυτό που παρατηρείται στο δείγμα δεν είναι ακραίο/ σπάνιο, τότε το δείγμα που πήραμε δε μας δίνει αρκετές ενδείξεις για την απόρριψη της H 0 και «αποτυγχάνουμε να την απορρίψουμε».

Συνιστώσες ενός στατιστικού ελέγχου 1) Ορίζουμε την αρχική υπόθεση, δηλ. την Η 0. 2) Ορίζουμε την εναλλακτική υπόθεση, δηλ. την Η 1 ( ίπλευρος ή μονόπλευρος έλεγχος) 3) Ορίζουμε το επίπεδο σημαντικότητας α 4) Εκτιμούμε την παράμετρο που μας ενδιαφέρει σε τυχαίο δείγμα του πληθυσμού (π.χ. την μέση τιμή). 5) Ορίζουμε μια κατάλληλη συνάρτηση ελέγχου της Η 0 6) Ορίζουμε τις κρίσιμες τιμές (χώρο απόρριψης της Η 0 ) 7) Ελέγχουμε εάν η τιμή τις συνάρτησης ελέγχου για το δείγμα μας εμπίπτει στο χώρο απόρριψης της Η 0.

Εφαρμόζοντας έναν στατιστικό έλεγχο, τότε ακριβώς ένα από τα παρακάτω μπορεί να συμβεί: (α) Η H 0 είναι πράγματι αληθής, και σωστά δεν απορρίφθηκε (β) Η H 0 δεν είναι πράγματι αληθής, και σωστά απορρίφθηκε (γ) Η H 0 είναι πράγματι αληθής, και λανθασμένα την απορρίψαμε. Αυτό το σφάλμα ονομάζεται σφάλμα τύπου Ι (type I error). (δ) Η H 0 δεν είναι πράγματι αληθής, και λανθασμένα δεν απορρίφτηκε. Αυτό το σφάλμα ονομάζεται σφάλμα τύπου ΙΙ (type II error). Το ανεκτό επίπεδο σφάλματος τύπου Ι που προκαθορίζουμε, συμβολίζεται με α και ονομάζεται επίπεδο σημαντικότητας (level of significance) του ελέγχου. Τότε το επίπεδο εμπιστοσύνης θα είναι 1 α. Η ισχύς μιας στατιστικής δοκιμής είναι η πιθανότητα της απόρριψης της H 0 όταν είναι ψευδής. H ισχύς ενός ελέγχου ισούται με 1-β, όπου β η πιθανότητα σφάλματος τύπου ΙΙ.

Τύποι μεταβλητών και κλίμακες μέτρησης τους Ποιοτικές Κατηγορίας ιάταξης ιαστήματος Αναλογίας μετρούν ποιοτικά χαρακτηριστικά μη διατάξιμα π.χ. χρώμα ματιών μετρούν ποιοτικά διατάξιμα δεδομένα και μεταβλητές των οποίων οι τιμές μπορούν να ιεραρχηθούν με βάση κάποιο κριτήριο π.χ. μορφωτικό επίπεδο Ποσοτικές αριθμητικά δεδομένα τα οποία ικανοποιούν και την ιδιότητα της διάταξης και απόστασης μεταξύ τους, π.χ. ύψος αριθμητικά δεδομένα τα οποία διαθέτουν μηδενικό σημείο αναφοράς, το αποτελεί μια πραγματική μετρήσιμη κατάσταση π.χ. τζίρος μιας επιχείρησης

Επιλογή στατιστικού ελέγχου ΣΤΟΧΟΣ Παραμετρικός Έλεγχος Προϋποθέσεις Εντολές SPSS Μη Παραμετρικός Έλεγχος Σύγκριση ενός Μέσου Όρου-με μια τιμή One Sample t-test Ανεξάρτητες Παρατηρήσεις Τυχαίο δείγμα Κανονική κατανομή Compare Means One-Sample t Test... Σύγκριση δύο Ομάδων (Μέσων Όρων) Independent Samples t-test Ανεξάρτητα Τυχαία δείγματα Κανονικές κατανομές Ομοιογένεια διασποράς Compare Means Independent Samples T-Test... Mann-Whitney U test Σύγκριση δύο Μετρήσεων ή δύο Μεταβλητών (Μέση Διαφορά) Paired Samples t-test Ανεξάρτητες Παρατηρήσεις Τυχαίο δείγμα Κανονική κατανομή Statistics Compare Means Paired-Samples ttest.. Wilcoxon Signed-rank test Σχέση μεταξύ δύο Ισοδιαστημικών Μεταβλητών t-test Τυχαίο δείγμα Γραμμική Σχέση Κανονική κατανομή Statistics Correlate Bivariate... Επίδραση μιας Ανεξάρτητης Μεταβλητής σε μια Εξαρτημένη t-test Τυχαίο δείγμα Γραμμική Σχέση Κανονική κατανομή Ομοιογένεια διασποράς Statistics Regression Linear...

ΣΤΟΧΟΣ Παραμετρικός Έλεγχος Προϋποθέσεις Εντολές SPSS Μη Παραμετρικός Έλεγχος Έλεγχος Ενός Ποσοστού z-test Ανεξάρτητες Παρατηρήσεις Τυχαίο δείγμα Κανονική κατανομή Compare Means Paired-Samples t Test.. Wilcoxon Signed-rank test Σύγκριση Δύο Ποσοστών z-test Ανεξάρτητες Παρατηρήσεις Τυχαίο δείγμα Κανονική κατανομή Compare Means Paired-Samples t Test.. Wilcoxon Signed-rank test Σύγκριση περισσοτέρων των δύο Ομάδων (Μέσων Όρων) ANOVA F-test Ανεξάρτητα Τυχαία δείγματα Κανονικές κατανομές Ομοιογένεια διασποράς Statistics Compare Means One-Way ANOVA.. Kruskal-Wallis H-test Σύγκριση Επαναλαμβανόμενων Μετρήσεων ANOVA F-test Ανεξάρτητες Παρατηρήσεις Τυχαίο δείγμα Κανονικές κατανομές Ομοιογένεια διασποράς Friedman Test Επίδραση πολλών Ανεξάρτητων Mεταβλητών σε μια Εξαρτημένη F-test Τυχαίο δείγμα Γραμμική Σχέση Ανεξάρτητες Παρατηρήσεις Κανονική κατανομή Ομοιογένεια διασποράς Statistics Regression Linear... Σχέση μεταξύ δύο Ονομαστικών ή Τακτικών Μεταβλητών Ανεξάρτητες Παρατηρήσεις Τυχαίο δείγμα Statistics Summarize Crosstabs... Chi-square χ 2

ιαδικασία ελέγχου κανονικότητας ερευνητικών δεδομένων με γραφήματα Ο λόγος που χρειαζόμαστε την κανονικότητα των δεδομένων, είναι για να έχουν ισχύ κάποιες στατιστικές τεχνικές όπως οι έλεγχοι υποθέσεων για τις μέσες τιμές, η γραμμική παλινδρόμηση, η ανάλυση διακύμανσης, κτλ. Όταν το ιστόγραμμα συχνοτήτων των ποσοτικών μεταβλητών έχει το σχήμα καμπάνας, τότε λέμε ότι τα δεδομένα ακολουθούν την κανονική κατανομή ή κατανέμονται κανονικά. Analyze Analyze Descriptive Statistics ή Descriptive Statistics P-P Plots Q-Q Plots Με αυτά τα γραφήματα ελέγχουμε οπτικά την ύπαρξη κανονικότητας στα δεδομένα. Όσο πιο κοντά στην ευθεία είναι τα σημεία του σχήματος τόσο πιο πολλές είναι οι ενδείξεις ότι τα δεδομένα ακολουθούν την κανονική κατανομή.

Output P-P Plot παρατηρούμενη αθροιστική συχνότητα (άξονας x) - υποτιθέμενη κανονική κατανομή (άξονας y) που ακολουθεί η μεταβλητή που εξετάζεται Q-Q Plot τα εκατοστημόρια της παρατηρούμενης μεταβλητής (άξονας χ) ως προς την αναμενόμενη κανονική κατανομή (άξονας y)

Τεστ κανονικότητας Kolmogorov-Smirnov Η 0 : Η κατανομή των δεδομένων δε διαφέρει από την κανονική κατανομή Η 1 : Η κατανομή των δεδομένων διαφέρει από την κανονική κατανομή Analyze Nonparametric Tests 1-Sample K-S Η επιλογή για τον έλεγχο κανονικότητας είναι προεπιλεγμένη (Normal). Options: μπορούμε να επιλέξουμε και την εμφάνιση ενός πίνακα με κάποια περιγραφικά μέτρα που αφορούν αυτές τις μεταβλητές. Exact: Asymptotic only (προεπιλογή). Monte Carlo (έλεγχος κανονικότητας με προσομοιώσεις).

Output Για τον έλεγχο της κανονικότητας μας ενδιαφέρει η τιμή: Asymp. Sig. (2-tailed) (δηλ. η p-τιμή του ελέγχου). One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) Mean Std. Deviation Absolute Positive Negative a. Test distribution is Normal. b. Calculated from data. Previous Education Experience Current Salary (years) (months) 475 475 475 $45,102.42 4,980 96,96 $1,943.558 1,9067 104,861,023,037,183,017,037,183 -,023 -,015 -,178,501,816 3,987,964,518,000 Αν η p-τιμή / Sig. < 0.05, τότε απορρίπτουμε την υπόθεση της κανονικότητας των δεδομένων.

Βασικοί στατιστικοί έλεγχοι 1. Έλεγχος ομοιογένειας μίας ποιοτικής μεταβλητής (Chi-Square). 2. Έλεγχοςμέσηςτιμήςενόςδείγματος(One Sample T-Test). 3. Έλεγχος ανεξαρτησίας των τιμών δύο ποιοτικών μεταβλητών (Chi-Square). 4. Έλεγχος ισότητας μέσων τιμών δύο ανεξάρτητων δειγμάτων (Independent Samples T-Test). 5. Έλεγχος ανεξαρτησίας μια ποσοτικής μεταβλητής κατηγοριοποιημένης με βάση της τιμές μιας ποιοτικής μεταβλητής (ANOVA). 6. Έλεγχος ισότητας μέσων τιμών δύο εξαρτημένων δειγμάτων (Paired Samples T-Test). Μη παραμετρικοί έλεγχοι ισότητας μέσων τιμών μεταβλητών χωρίς την υπόθεση της κανονικότητας των δεδομένων. 7. Μη παραμετρικός έλεγχος Wilcoxon 8. Μη παραμετρικός έλεγχος Mann-Whitney 9. Μη παραμετρικός έλεγχος McNemar 10. Μη παραμετρικός KRUSKAL-WALLIS

1. Έλεγχος ομοιογένειας μίας ποιοτικής μεταβλητής (Chi-Square). π.χ. Μια μηχανή παράγει κατά 80% άριστα, κατά 17% καλά, και κατά 3% ελαττωματικά κομμάτια ενός προϊόντος. Μετά από εκτενείς επισκευές, ένα δείγμα 200 κομματιών παρήγαγε 157 κομμάτια άριστα, 42 καλά, και 1 απ ελαττωματικό κομμάτι. Οι επισκευές έχουν αλλάξει τη φύση της παραγωγής της μηχανής; H 0 : Οι επισκευές δεν άλλαξαν την αναλογία παραγωγής της μηχανής. H 1 : Οι επισκευές άλλαξαν την αναλογία παραγωγής της μηχανής. ------------------------------------------------------------------------------------------------ Ανοίγουμε έναν νέο Data Editor, όπου δημιουργούμε 2 μεταβλητές. Στην 1η στήλη σημειώνουμε τις τιμές 1, 2, 3 που αντιστοιχούν στις τιμές της μεταβλητής που εξετάζουμε, στην 2η στήλη μεταφέρουμε τις συχνότητες που αντιστοιχούν στην κάθε μια τιμή της μεταβλητής. Επιλέγουμε από το μενού: Data Weight Cases..

Έπειτα επιλέγουμε: Analyze Nonparametric Tests Chi-Square Αναλόγως με την Η 0 επιλέγουμε : All categories equal ή σημειώνουμε στο Values τα ποσοστά που θα αναμέναμε για την κάθε τιμή της μεταβλητής.

Αν το Asymp. Sig < 0.05 τότε απορρίπτουμε την Η 0. Asymp. Sig= 0.0472 < 0.05, άρα απορρίπτουμε την Η 0, δηλαδή η αναλογία της παραγωγής της μηχανής δεν άλλαξε.

2. Έλεγχοςμέσηςτιμήςενόςδείγματος(One Sample T-Test). Σε πολλές περιπτώσεις επιθυμούμε να συγκρίνουμε την (άγνωστη) μέση τιμή ενός πληθυσμού με μία δεδομένη τιμή που την γνωρίζουμε π.χ. από εμπειρία ή από προηγούμενες μελέτες. π.χ. Για να επαληθεύσουμε τον ισχυρισμό της εταιρίας Όλυμπος ότι οι συσκευασίες γάλακτος περιέχουν 500gr πήραμε ένα δείγμα 10 συσκευασιών και βρήκαμε τα παρακάτω βάρη (σε gr): 490, 503, 499, 492, 500, 501, 489, 478, 498, 508. Γίνεται δεκτός ο ισχυρισμός της εταιρίας; Η 0 : Το μέσο βάρος της παραγωγής είναι ίσο με 500gr Η 1 : Το μέσο βάρος της παραγωγής είναι μικρότερο από 500gr

Analyze Compare Means One Sample T-Test Μεταφέρουμε στο πλαίσιο Test Variable(s) τη μεταβλητή της οποίας τη μέση τιμή θέλουμε να συγκρίνουμε με δεδομένη τιμή. Την τιμή για την οποία θα γίνει η σύγκριση εισάγουμε στη συνέχεια στη θέση Τest Value. Αν θέλουμε να τροποποιήσουμε τις αρχικές αυτές παραμέτρους, τότε ενεργοποιούμε τα OPTIONS. One-Sample Test Education (years) Test Value = 4 95% Confidence Interval of the Mean Difference t df Sig. (2-tailed) Difference Lower Upper 11,199 474,000,9797,808 1,152 Αν το Asymp. Sig < 0.05 τότε απορρίπτουμε την Η0.

3. Έλεγχος ανεξαρτησίας δύο ποιοτικών μεταβλητών (Chi-Square) π.χ. Μπορούμε να ισχυριστούμε ότι το θρήσκευμα ενός μαθητή έχει σχέση με την εμφάνιση μαθησιακών δυσκολιών; Η 0 : Το θρήσκευμα ενός μαθητή είναι ανεξάρτητο από την εμφάνιση μαθησιακών δυσκολιών. Η 1 : Η εμφάνιση μαθησιακών δυσκολιών σε ένα μαθητή εξαρτάται από το θρήσκευμα του. Analyze Descriptive Statistics Crosstabs Statistics Chi-Square religion * learning_difficulties Crosstabulation Count learning_difficulties yes no Total religion orthodox 9 40 49 katholic 18 49 67 muslim 20 56 76 other 3 5 8 Total 50 150 200

Pearson Chi-Square Likelihood Ratio N of Valid Cases a. Chi-Square Tests Asymp. Sig. Value df (2-sided) 1,767 a 2,413 1,854 2,396 200 0 cells (,0%) have expected count less than 5. The minimum expected count is 12,50. Αν η σημαντικότητα (Asymp. Sig.=0.413) του συντελεστή συσχέτισης Pearson είναι μικρότερη του 0.05, τότε η υπόθεση H 0 απορρίπτεται, και άρα οι δύο μεταβλητές είναι συσχετισμένες. Ένα σημείο που πρέπει να προσέξουμε στον έλεγχο, είναι το ποσοστό των κελιών με αναμενόμενη συχνότητα μικρότερη του 5. Αν το ποσοστό αυτό ξεπερνά το 20%, τότε ο έλεγχος που έχουμε εφαρμόσει δεν είναι αξιόπιστος και πρέπει να προχωρήσουμε σε σύμπτυξη κατηγοριών της μίας τουλάχιστον μεταβλητής και να επαναλάβουμε τον έλεγχο.

οκιμασία Fisher Αν οι ποιοτικές μεταβλητές είναι δίτιμες, τότε στον πίνακα Chi-Square tests εμφανίζεται κ το στατιστικό Fisher s exact test. Count learning_ difficulties Total learning_difficulties * new Crosstabulation yes no new orthodox non orthodox Total 9 41 50 40 110 150 49 151 200 Αν οι προϋποθέσεις εφαρμογής του Chi-Square test δεν ισχύουν το SPSS εμφανίζει σημείωση που το αναφέρει και τότε κοιτάζουμε το Fisher s exact test γιατασυμπεράσματαµας. Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 1,523 b 1,217 1,090 1,296 1,596 1,206 200 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),258,148 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 12 25

4. Έλεγχος ισότητας μέσων τιμών δύο ανεξάρτητων δειγμάτων (Independent Samples T-Test). Θέλουμε να ελέγξουμε αν δύο ομοειδείς ποσοτικές μεταβλητές, που προέρχονται από ανεξάρτητους μεταξύ τους πληθυσμούς, διαφέρουν κατά μέση τιμή. Αν δηλαδή, οι μέσες τιμές τους είναι ίσες ή διαφέρουν σημαντικά. Η0: Οι μέσες τιμές των δύο πληθυσμών δε διαφέρουν σημαντικά. Η1: Οι μέσες τιμές των δύο πληθυσμών διαφέρουν σημαντικά. π.χ. Θέλουμε να ελέγξουμε αν οι μαθητές της Β' Λυκείου είναι το ίδιο καλοί με τις μαθήτριες της Β' Λυκείου στο μάθημα των Μαθηματικών. όθηκε το ίδιο διαγώνισμα σε 17 μαθητές και 15 μαθήτριες και βρήκαμε τα παρακάτω στατιστικά: Μέση επίδοση αγοριών 13,2 με τυπική απόκλιση 3,1 Μέση επίδοση κοριτσιών 12,4 με τυπική απόκλιση 2,6. Είναι αρκετά τα δεδομένα για να ισχυριστούμε ότι τα αγόρια είναι καλύτερα από τα κορίτσια στα μαθηματικά; Η 0 : Η μέση επίδοση των αγοριών είναι ίση με των κοριτσιών στα Μαθηματικά. Η 1 : Η μέση επίδοση των αγοριών είναι διαφορετική από των κοριτσιών στα Μαθηματικά. Analyze Compare Means Independent Samples T-Test

Define groups... : προσδιορισμός των δύο ομάδων (ανεξάρτητων πληθυσμών), στις οποίες διαχωρίζει το αρχείο δεδομένων. Το παράθυρο εμφανίζεται για μεταβλητές που κωδικοποιήθηκαν με αριθμητικούς κωδικούς. Use specified values Είναι η εξ ορισμού επιλογή, σύμφωνα με την οποία εισάγουμε μία τιμή για το Group 1 και μία για το Group 2, που αντιστοιχούν στις δύο κατηγορίες της μεταβλητής που διαχωρίζει σε δύο ανεξάρτητους πληθυσμούς τα δεδομένα. Οι περιπτώσεις με άλλες τιμές αποκλείονται από την ανάλυση. Cut point Όλες οι περιπτώσεις με τιμές μεγαλύτερες ή ίσες της τιμής που ορίζουμε ως cut point ανήκουν στον ένα πληθυσμό, ενώ οι υπόλοιπες περιπτώσεις ανήκουν στον δεύτερο πληθυσμό.

Βαθμός Άλγεβρας Β' Λυκείου Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Difference Std. Error Difference Lower Upper,094,760 -,085 343,932 -,03,346 -,711,652 -,086 327,28,932 -,03,345 -,709,650 Γίνεται έλεγχος για τη σύγκριση των διασπορών των δειγμάτων: Levene's Test for Equality of Variances. Από τη σημαντικότητα αυτού του ελέγχου Sig. = 0.760 >0.05 συμπεραίνουμε ότι δεν υπάρχει σημαντική διαφορά στις διασπορές και επομένως μπορούμε να τις θεωρήσουμε ίσες. Επειδή η σημαντικότητα του ελέγχου είναι Sig = 0,932 > 0,05, αποτυγχάνουμε να απορρίψομε τη μηδενική υπόθεση και συμπεραίνουμε ότι δεν υπάρχει στατιστικά σημαντική διαφορά στο βαθμό Άλγεβρας μεταξύ αγοριών και κοριτσιών.

5. Έλεγχος ανεξαρτησίας μιας ποσοτικής μεταβλητής από της τιμές μιας ποιοτικής μεταβλητής (ANOVA). Η ανάλυση διακύμανσης με ένα παράγοντα (one way Analysis Of Variance) είναι παρόμοια με το t-test, αλλά επιτρέπει στον ερευνητή να συγκρίνει μέσους όρους από περισσότερα από δυο δείγματα (επίπεδα της ανεξάρτητης μεταβλητής). π.χ. Υπάρχει διαφορά στο Γενικό Βαθμό Β Λυκείου μεταξύ των μαθητών με ιαφορετικό Τόπο Κατοικίας. Ο Τόπος Κατοικίας έχει τρεις κατηγορίες: «Μητροπολιτική Περιοχή», «Πρωτεύουσα Νομού» και «ΧωριόήΜικρήΠόλη». Η 0 : οιμέσοιόροιτωνομάδωνδενδιαφέρουνμεταξύτους Η 1 : κάποιοι από τους μέσους όρους διαφέρουν μεταξύ τους Analyze Compare Means One-way ANOVA

Επιλέγουμε το κουμπί Post Hoc και στο πλαίσιο που ανοίγει επιλέγουμε έναν από τους ελέγχους Πολλαπλών Συγκρίσεων (Multiple Comparisons) που παρουσιάζονται. Ο πιο συνηθισμένος είναι o έλεγχος Bonferonni.

Γενικός Βαθμός Β' Λυκείου Between Groups Within Groups Total ANOVA Sum of Squares df Mean Square F Sig. 103,292 2 51,646 13,180,000 1485,072 379 3,918 1588,364 381 Επειδή Sig. = 0.000 < 0.05, απορρίπτουμε την Η 0 και συμπεραίνομε ότι υπάρχει στατιστικά σημαντική διαφορά στο Γενικό Βαθμό Β Λυκείου μεταξύ των μαθητών με διαφορετικό τόπο κατοικίας. Dependent Variable: Γενικός Βαθμός Β' Λυκείου Bonferroni Multiple Comparisons (I) Τόπος Κατοικίας Χωριό/Μικρή Πόλη Επαρχία Νομού Μητρ.Περιοχή (J) Τόπος Κατοικίας Επαρχία Νομού Μητρ. Περιοχή Χωριό/Μικρή Πόλη Μητρ. Περιοχή Χωριό/Μικρή Πόλη 95% Confidence Interval Mean Difference Std. Lower Upper (I-J) Error Sig. Bound Bound -1,5118*,30614,000-2,2480 -,7757 -,6711*,21928,007-1,1984 -,1438 1,5118*,30614,000,7757 2,2480,8407*,30710,019,1022 1,5792,6711*,21928,007,1438 1,1984 Από τις p-τιμές (Sig.<0.05) φαίνεται υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ όλων των ομάδων. Επαρχία Νομού *. The mean difference is significant at the.05 level. -,8407*,30710,019-1,5792 -,1022

6. Έλεγχος ισότητας μέσων τιμών δύο εξαρτημένων δειγμάτων (Paired Samples T-Test). Σε πολλές περιπτώσεις, ιδίως σε έρευνες όπου τα δεδομένα προέρχονται από «κλειστούς» και ελεγχόμενους πειραματισμούς, έχουμε αντί για ανεξάρτητα δείγματα, ζευγάρια παρατηρήσεων. π.χ. Σε ένα ιατρικό πείραμα, όπου ερευνούμε την επίδραση ενός νέου φαρμάκου που καταπολεμά την υπέρταση. Επιλέξουμε ένα δείγμα ασθενών και μετράμε την πίεσή τους πριν και μετά από τη λήψη του φαρμάκου. Στην περίπτωση αυτή έχουμε ζευγάρια από παρατηρήσεις πάνω στα ίδια άτομα του δείγματος. Statistics Compare Means Paired-Samples T-Test OPTIONS Η ανάλυση εκτελείται με εξ ορισμού παραμέτρους, όμως έχουμε τη δυνατότητα να τροποποιήσουμε τη στάθμη σημαντικότητας του ελέγχου, να διαχειρισθούμε τις ετικέτες των μεταβλητών καθώς και τις ελλειπούσες τιμές.

π.χ. Σύγκριση του μέσου μισθού των υπαλλήλων μιας επιχείρησης με τον μέσο αρχικό τους μισθό. Paired Samples Correlations Pair 1 Current Salary & Beginning Salary N Correlation Sig. 475 -,092,045 Στον παραπάνω πίνακα εξετάζετε η υπόθεση ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών. Το επίπεδο στατιστικής σημαντικότητας Sig = 0.045 < 0.05, άρα η Η 0 απορρίπτεται γεγονός που σημαίνει ότι ο συντελεστής γραμμικής συσχέτισης είναι στατιστικά σημαντικός, δηλαδή οι δύο μεταβλητές συσχετίζονται. Paired Samples Test Pair 1 Current Salary - Beginning Salary Mean Paired Differences 95% Confidence Interval of the Std. Error Difference Std. Deviation Mean Lower Upper t df Sig. (2-tailed) ********* $2,281.797 $104.696 ********* ********* 191,358 474,000 Αφού το Sig. = 0.000 < 0.05 συμπεραίνουμε ότι οι μέσοι μισθοί των υπαλλήλων διαφέρουν στατιστικά σημαντικά.

7. Μη παραμετρικός έλεγχος Wilcoxon Έλεγχος ισότητας μέσων τιμών δύο εξαρτημένων δειγμάτων αν δεν πληρείται η υπόθεση της κανονικότητας των δεδομένων. Analyze Nonparametric Tests 2 Related Samples Test Statistics b Z Asymp. Sig. (2-tailed) a. Based on positive ranks. Beginning Salary - Current Salary -18,885 a,000 b. Wilcoxon Signed Ranks Test Αποτελέσματα του ελέγχου Wilcoxon για ζεύγη παρατηρήσεων Η σημαντικότητα είναι μηδέν, οδηγώντας μας στο συμπέρασμα ότι οι μέσοι μισθοί διαφέρουν στατιστικά σημαντικά.

8. Μη παραμετρικός έλεγχος Man Whitney Το αντίστοιχο μη παραμετρικό ανάλογο του Independent Samples Τ test είναι το τεστ των Mann-Whitney-Wilcoxon. π.χ Θέλουμε να ελέγξουμε αν τα αυτοκίνητα δυο ηπείρων/ χωρών διαφέρουν ως προς το βάρος τους. Η 0 : Τα αυτοκίνητα των χωρών δε διαφέρουν ως προς το βάρος τους Η 1 : Τα αυτοκίνητα των δύο χωρών διαφέρουν ως προς το βάρος τους Analyze Nonparametric Tests 2 Independent Samples

Test Statistics a Vehicle Weight (lbs.) Mann-Whitney U 3049,500 Wilcoxon W 5750,500 Z -8,718 Asymp. Sig. (2-tailed),000 a. Grouping Variable: Country of Origin Η σημαντικότητα του ελέγχου είναι Sig. = 0.000 < 0.05. Επομένως απορρίπτουμε τη μηδενική υπόθεση, άρα το βάρος των αμερικάνικων και των ευρωπαϊκών αυτοκινήτων διαφέρει στατιστικά σημαντικά.

9. Μη παραμετρικός έλεγχος McNemar Εάν οι δύο μεταβλητές είναι δίτιμες (επιτυχία-αποτυχία) τότε είναι κατάλληλος ο έλεγχος Mc Nemar (έλεγχος αλλαγής μιας κατάστασης). Σύγκριση δύο ποιοτικών μεταβλητών σε δύο συσχετιζόμενα δείγματα. π.χ. Έστω ότι θέλουμε να διερευνήσουμε αν άλλαξε η συνήθεια των γυναικών ως προς την κατανάλωση αλκοόλ πριν και µετά τη δίαιτα. Analyze Descriptive Statistics Crosstabs Η0: η συχνότητα των γυναικών που καταναλώνουν αλκοόλ είναι η ίδια πριν και μετά τη δίαιτα. Η 1 : η συχνότητα των γυναικών που καταναλώνουν αλκοόλ διαφέρει πριν και μετά τη δίαιτα.

katanalwsi1 * katanalwsi2 Crosstabulation katanalwsi1 Total yes no Count Expected Count Count Expected Count Count Expected Count katanalwsi2 yes no Total 58 32 90 43,8 46,2 90,0 15 45 60 29,2 30,8 60,0 73 77 150 73,0 77,0 150,0 Chi-Square Tests Value McNemar Test N of Valid Cases 150 a. Binomial distribution used. Exact Sig. (2-sided),019 a Η σημαντικότητα του ελέγχου είναι Sig. = 0.019 < 0.05. Επομένως απορρίπτουμε τη μηδενική υπόθεση, άρα η συχνότητα των γυναικών που καταναλώνουν αλκοόλ είναι η ίδια πριν και µετά τη δίαιτα.

10. ΕΛΕΓΧΟΣ KRUSKAL-WALLIS ΟέλεγχοςKruskal-Wallis έχει να κάνει με τον έλεγχο ισότητας διαμέσων και όχι ισότητας μέσων. Στην ουσία αποτελεί μια μη παραμετρική εκδοχή της ανάλυσης διακύμανσης (ANOVA). Εφαρμόζεται μόνο στην περίπτωση που δεν ισχύει η κανονικότητα καταλοίπων. Analyze Nonparametric Tests K Independent samples. οι διάμεσοι δεν διαφέρουν

ιαστήματα εμπιστοσύνης Ηέκφραση(1-α)*100% διάστημα εμπιστοσύνης (confidence interval (CI)) σημαίνει: Αν πάρω 100 μετρήσεις τότε οι 95 ανήκουν σε αυτό το διάστημα Αν πάρω 100 δείγματα του πληθυσμού και υπολογίσω για αυτό την άγνωστη παράμετρο του πληθυσμού (π.χ. μέση τιμή) τότε τα 95 από αυτά θα μας δίνουν τιμή της παραμέτρου που να ανήκει σ αυτό το διάστημα, δηλ. από τα 100 δείγματα τα 95 θα μας δίνουν μέση τιμή που θα ανήκει σε αυτό το διάστημα. Για να κατασκευάσουμε ένα 95% διάστημα εμπιστοσύνης για τη μέση τιμή μίας μεταβλητής εργαζόμαστε ως εξής: Analyze Descriptive Statistics Explore

Συντελεστές συσχέτισης δυο μεταβλητών π.χ. το φύλο παίζει ρόλο στην στάση απέναντι στους Η/Υ Μελετώντας τη σχέση δυο μεταβλητών, η μια από τις δυο περιμένουμε να εξαρτάται (εξαρτημένη) από την άλλη (ανεξάρτητη) π.χ. το φύλο περιμένουμε να επηρεάζει τη στάση των φοιτητών απέναντι στους υπολογιστές και όχι βέβαια το ανάποδο. Άρα το φύλο θα είναι η ανεξάρτητη μεταβλητή και η στάση η εξαρτημένη. Πάντα η μηδενική υπόθεση αναφέρεται στη μη ύπαρξη σχέσης ανάμεσα στις μεταβλητές. Στον αντίποδα της υπάρχει η εναλλακτική υπόθεση που αναφέρεται στην ύπαρξη σχέσης (Η1). Πχ. Η 0 : δεν υπάρχει σχέση ανάμεσα στο φύλο και στη στάση απέναντι στους Η/Υ Η 1 : υπάρχει σχέση ανάμεσα στο φύλο και στη στάση απέναντι στους Η/Υ.

Α. ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΟΝΟΜΑΣΤΙΚΗΣ ΚΛΙΜΑΚΑΣ (nominal) Ένας από τους πολλούς συντελεστές που εμφανίζονται στη βιβλιογραφία είναι ο Cramers V. Η τιμή του συντελεστή αυτού (καθώς και όλων των άλλων που χρησιμοποιούνται για ονομαστικές μεταβλητές) κυμαίνεται από 0 έως 1: τιμές κοντά στο 1 να δηλώνουν υψηλό βαθμό συσχέτισης των δυο μεταβλητών τιμές κοντά στο 0 να δηλώνουν μη ύπαρξη σχέσης. Analyze Descriptive Statistics Crosstabs

Β. ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΙΑΤΑΞΗΣ (ordinal) Ένας από τους συντελεστές που χρησιμοποιούνται συνήθως είναι ο Gamma. Η τιμή του συντελεστή (καθώς και όλων των άλλων που χρησιμοποιούνται για ordinal μεταβλητές) είναι από -1 έως 1: τιμές κοντά στο απόλυτο 1 να δηλώνουν ισχυρή σχέση των δυο μεταβλητών τιμές κοντά στο 0 να δηλώνουν μη ύπαρξη σχέσης. Tο πρόσημο του συντελεστή δηλώνει και την κατεύθυνση της σχέσης (θετική ή αρνητική).

Γ.ΠΟΣΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ Όταν οι μεταβλητές είναι ποσοτικές ο κατάλληλος συντελεστής είναι ο συντελεστής συσχέτισης Pearson. Ο συντελεστής αυτός αναφέρεται μόνο στη γραμμική σχέση που μπορεί να εντοπίζεται ανάμεσα σε δυο ποσοτικές μεταβλητές. Παίρνει τιμές από -1 έως 1 και το πρόσημο του δηλώνει την κατεύθυνση της σχέσης. Analyze Correlate Bivariate Βλέπουμε ότι απορρίπτεται η μηδενική υπόθεση ότι δεν υπάρχει συσχέτιση μεταξύ των δύο μεταβλητών αφού p-value = 0.000 < 0.05. Αυτό μπορούμε να το καταλάβουμε και από την τιμή του συντελεστή Pearson που είναι 0,564.

Έλεγχος των δεδομένων για ελλείπουσες τιμές (missing values) Κάθε αρχείο με δεδομένα μπορεί να έχει ορισμένες (λίγες ή περισσότερες) ελλείπουσες τιμές. Το πρόβλημα είναι σημαντικό μόνο εφόσον οι τιμές αυτές δεν κατανέμονται μέσα στην κατανομή τυχαία. Συνιστάται το ποσοστό των ελλειπουσών τιμών να μην ξεπερνάει το 1% σε μια μεταβλητή. α τρόπος Μπορούμε να χρησιμοποιήσουμε την επιλογή: Transform Replace Missing Values : mean, median or linear interpolation. β τρόπος Analyze Missing Value Analysis Επιλέγουμε τις ποσοτικές και τις κατηγορικές μεταβλητές και τις τοποθετούμε στα κατάλληλα πλαίσια (επιλέγουμε τόσο τις μεταβλητές που έχουν ελλείπουσες τιμές και θέλουμε να τις συμπληρώσουμε όσο και εκείνες που θα χρησιμοποιήσουμε στη συνέχεια για τον υπολογισμό των τιμών των μεταβλητών με ελλείπουσες τιμές) Patterns Tabulated cases grouped by missing value patterns και Cases with Missing Values, sorted by missing value patterns

Το μέγεθος του δείγματος Οι ακόλουθες υποδείξεις στοχεύουν να απαντήσουν στο ερώτημα "πόσο μικρότερο θα μπορούσε να είναι το μέγεθος του δείγματος για να υπάρξει μια κάποια σταθερή αφετηρία;": Στις έρευνες που υπολογίζονται δείκτες συσχέτισης ή συνάφειας, οι 100 συμμετέχοντες είναι μια καλή αφετηρία. Καλό είναι να μην είναι λιγότεροι των 50 και ασφαλώς όχι λιγότεροι των 30. Στις έρευνες που συγκρίνονται οι μέσοι όροι ή οι τυπικές αποκλίσεις δύο ή περισσότερων ομάδων, οι 50 συμμετέχοντες για κάθε ομάδα είναι μια καλή βάση. Καλό είναι να μην είναι λιγότεροι από 30. Στις έρευνες που γίνεται χωρισμός των συμμετεχόντων σε επιμέρους ομάδες και συγκρίνονται οι ποσοστιαίες αναλογίες (με τη χρήση του κριτηρίου Χ 2 ), οαριθμόςσεκάθεκελί πρέπει να είναι περίπου 10. Προκειμένου να χρησιμοποιηθεί ένα παραμετρικό τεστ πρέπει το δείγμα να είναι σχετικά μεγάλο. Ένας πρακτικός κανόνας για το διαχωρισμό των δειγμάτων σε μεγάλα και μικρά είναι ο αριθμός 30.