Εισαγωγή στην Ανάλυση Δεδομένων

Σχετικά έγγραφα
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχόλη Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

Στατιστικοί έλεγχοι του Χ 2

Αναλυτική Στατιστική

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Διάλεξη 1 Βασικές έννοιες

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 4: ΠΑΡΑΓΩΓΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΙΚΤΩΝ

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχόλη Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

1991 US Social Survey.sav

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Δειγματοληπτικές κατανομές

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Εισόδημα Κατανάλωση

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Στατιστικές Υποθέσεις

Έλεγχος Υποθέσεων Εφαρμογές

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

Γ. Πειραματισμός - Βιομετρία

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Εισαγωγή στην Εκτιμητική

Έλεγχος υποθέσεων Ι z-test & t-test

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

ΜΕΘΟΔΟΙ ΕΛΕΓΧΟΥ ΑΚΡΙΒΕΙΑΣ (ACCURACY)

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

5 o Μάθημα Έλεγχοι Υποθέσεων

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

T-tests One Way Anova

Στατιστική Επιχειρήσεων ΙΙ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Δημήτρης Ιωαννίδης. Τμήμα Οικονομικών Επιστημών.

Transcript:

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης

Υπολογισμός του 95% Δ.Ε. Τα δεδομένα Το δείγμα αποτελείται από 15 άτομα για τα οποία γνωρίζουμε το μηνιαίο τους εισόδημα (ευρώ). Χρησιμοποιώντας τις εντολές του excel, μπορούμε να υπολογίσουμε την μέση τιμή, την τυπική απόκλιση, το τυπικό σφάλμα και κατά συνέπεια το 95% Δ.Ε. 95%. Ε. = Χ ± t (0,05; n 1) s = τυπικό σφάλµα n s n t (0,05; n 1) s n = ακριβές σφάλµα

Υπολογισμός του 95% Δ.Ε. Αποτελέσματα s F4 Τυπικό Σφάλµα = = n sqrt( F2) Ακριβές Σφάλµα = t(0,05;14) Ακριβές Σφάλµα = F8 F4 s n Διάστημα εμπιστοσύνης: Κάτω όριο = μέση τιμή Ακριβές Σφάλμα Άνω όριο = μέση τιμή + Ακριβές Σφάλμα

Αποτελέσματα με SPSS Analyze > Descriptive Statistics > Explore Επιλογή της μεταβλητής για ανάλυση: Income Το 95% Δ.Ε. : Κάτω όριο = 1037,87 Άνω όριο = 1922,13

Έλεγχος Υποθέσεων για την Μέση τιμή Υποθέσεις: H H 0 1 : X : X = µ µ ( µ = θεωρητική τιµ ή) Στατιστική Παράμετρος: X µ t = σ / n όταν σ είναι άγνωστη, παίρνουμε την τυπική απόκλιση s που υπολογίζουμε με βάση τα δεδομένα του δείγματος Η Στατιστική t ακολουθεί την κατανομή του t-student Απόφαση: Αν t t(0,05;n-1) Δεχόμαστε την υπόθεση Ηο Αν t > t(0,05;n-1) Η υπόθεση Ηο απορρίπτεται και επιλέγουμε Η1 Ισχύς του ελέγχου: p-value Η p-value μας δίνει το σφάλμα που κάνουμε για να απορρίψουμε την υπόθεση Ηο δηλαδή για να επιλέγουμε την υπόθεση Η1. Όταν p-value < 0,05 : το σφάλμα απόρριψης της Ηο είναι μικρό και αποδεκτό, κατά συνέπεια, επιλεγούμε την υπόθεση Η1.

Αποτελέσματα με SPSS Analyze > Compare Means > One-Sample T Test Επιλογή της μεταβλητής για ανάλυση (Test Variable): Income Επιλογή της τιμής για ελέγχου (Test Value) = 2000 Στατιστική παράμετρος: t = -2,523 P-value = 0,024 < 0,05 Ισχύει η Η1: η μέση τιμή του δείγματος διαφέρει από τα 2000 ευρώ

Στατιστικοί έλεγχοι Συνοπτική παρουσίαση

1. Διαδικασία εφαρμογής στατιστικού ελέγχου: Ο έλεγχος συγκρίνει δύο υποθέσεις: Ηο έναντι Η1 (εναλλακτική) Κάθε έλεγχος βασίζεται σε μια στατιστική παράμετρο η οποία προκύπτει από μια συγκεκριμένη θεωρητική κατανομή (Π.χ. ο έλεγχος της μέσης τιμής βασίζεται στην κατανομή του Student). Με βάση τα δεδομένα που εξετάζουμε, υπολογίζουμε την στατιστική παράμετρο σύμφωνα με τον ορισμό της. Η απόφαση - σχετικά με ποια από τις 2 υποθέσεις ισχύει (ποια υπόθεση επιλέγουμε) - εξαρτάται από: το (τους) βαθμό (ούς) ελευθερίας: ορισμένοι έλεγχοι όπως ο έλεγχος Fisher βασίζονται σε δυο βαθμούς ελευθέριας. Το επίπεδο σημαντικότητας (significance level): συνήθως παίρνουμε επίπεδο σημαντικότητας 5% που αντιστοιχεί στον μέγιστο σφάλμα που δεχόμαστε να κάνουμε. Αποτελεί «όριο». Σημαίνει ότι, θέλουμε η απόφαση μας να είναι τουλάχιστον βέβαιη κατά 95%. Ακόμα καλύτερα αν μπορούμε να έχουμε 99% βεβαιότητα (δηλαδή 1% σφάλματος). Η σύγκριση της τιμής της παραμέτρου που έχουμε υπολογίσει με την θεωρητική τιμή (σύμφωνα με τον πίνακα) μας επιτρέπει να επιλέξουμε ποια από τις δύο υποθέσεις ισχύει. Όμως αυτό σημαίνει ότι, πρέπει να έχουμε τους σχετικούς πίνακες. Ευτυχώς, όλα τα σύγχρονα λογισμικά υπολογίζουν έκτος από τη τιμή της παραμέτρου την p-value δηλαδή την ισχύ του ελέγχου. Η ισχύς του στατιστικού ελέγχου δεν είναι τίποτα άλλο από τον ελάχιστο σφάλμα που πρέπει να δεχόμαστε έτσι ώστε να επιλέξουμε την υπόθεση Η1 και κατά συνέπεια να απορρίψουμε την υπόθεση Ηο. Πρακτικά και αυτό ισχύει για οποιοδήποτε στατιστικό έλεγχο: όταν p-value 0.05 (5%) Δεχόμαστε την υπόθεση Η1: το σφάλμα για την επιλογή της υπόθεσης Η1 είναι μικρό. όταν p-value > 0.05 (5%) Δεχόμαστε την υπόθεση Ηο: το σφάλμα για την επιλογή της υπόθεσης Η1 θεωρείται μεγάλο.

2. Ορισμένοι συνηθισμένοι στατιστικοί έλεγχοι Έλεγχος της μέσης τιμής: σύγκριση της μέσης τιμής μιας μεταβλητής με μια γνωστή θεωρητική τιμή. Έλεγχοςδιαφοράς δύο μέσων τιμών: (α) Η H 0 1 : X = µ : X µ μ = θεωρητική τιμή σύγκριση της μέσης τιμής μιας μεταβλητής για δύο ανεξάρτητα δείγματα ή δύο ανεξάρτητες ομάδες πληθυσμού (π.χ. χώρες της ευρώ ζώνης και υπόλοιπες χώρες της Ε.Ε.) (β) Η H 0 1 : X : X a a = X X b b Δύο ομάδες πληθυσμού α και β για τις οποίες υπολογίσαμε την μέση τιμή σύγκριση της μέσης τιμής δύο μεταβλητών για ένα πληθυσμό: εξετάζουμε ζεύγη παρατηρήσεων Η H 0 1 : X : X 1 1 = X X 2 2 Χ1: πρώτη μεταβλητή, Χ2: δεύτερη μεταβλητή (Πχ. ΑΕΠκκ των 28 χώρων της Ε.Ε. το 2008 και ΑΕΠκκ των 28 χωρών της Ε.Ε. για το 2013) Έλεγχος συντελεστής συσχέτισης μεταξύ δύο μεταβλητών: ο συντελεστής είναι ή δεν είναι με στατιστικούς όρους διαφορετικός από μηδέν; Η H 0 1 : r : r X 1, X 2 X 1, X 2 = 0 0 Σε όλες τις περιπτώσεις, ισχύει ο ακόλουθος κανόνας: Όταν η p-value είναι μικρότερη από 5% (0,05), η υπόθεση Η ο απορρίπτεται και δεχόμαστε την Υπόθεση Η 1. Θεωρούμε ότι το μέγιστο αποδεκτό σφάλμα είναι 5%. Πρόκειται για προσωπική επιλογή του ερευνητή.

3. Πρώτο παράδειγμα [01]: One-Sample T Test Τα δεδομένα αφορούν τον αριθμό εργατικών ατυχημάτων. Πιο συγκεκριμένα, η μεταβλητή «ΑΤΥΧΗΜΑΤΑ» μας δίνει τον αριθμό ατυχημάτων στην Ελλάδα για 1000 απασχολουμένους ανά κατηγορία επαγγέλματος, κατά το έτος 2013 (Πηγή: ΕΛΣΤΑΤ, Ειδική έρευνα για τα εργατικά ατυχήματα, [Ad hoc, 2013]) Για 1000 υπάλληλους γραφείου, καταγράφτηκαν, περίπου 5 ατυχήματα, ενώ στους ειδικευμένους τεχνίτες, έχουμε πάνω από 49. Επίσης, σύμφωνα με την ΕΛΣΤΑΤ, για το σύνολο των απασχολουμένων, ανεξαρτήτως επαγγέλματος, ο αριθμός ατυχημάτων ανέρχεται σε 17,5 για 1000 απασχολουμένους. Η ερώτηση είναι επομένως η ακόλουθα: μπορούμε να θεωρήσουμε ότι, η μέση τιμή του δείκτη «αριθμός ατυχημάτων για 1000 εργαζομένους» δεν διαφέρει από τον μέσο αριθμό για το σύνολο των απασχολουμένων; Πρόκειται για έλεγχο μιας μέσης τιμής που συγκρίνουμε με τον μέσο αριθμό = 17,5. Η εφαρμογή με το SPSS είναι ιδιαίτερα απλή: Analyze > Compare Means > One-Sample T Test, επιλέγουμε την μεταβλητή ΑΤΥΧΗΜΑΤΑ ως Test Variable (s), και δίνουμε την τιμή για σύγκριση (test Value = 17,5).

3. Πρώτο παράδειγμα [02]: One-Sample T Test Εξετάζοντας τα αποτελέσματα του ελέγχου, παρατηρούμε ότι, η μέση τιμή της μεταβλητής ΑΤΥΧΗΜΑΤΑ_2013 = 20,52 με τυπική απόκλιση = 14,548. Η υπολογισμένη τιμή του t-student = 0,548 ενώ η p-value = 0,597 > 0,05 Κατά συνέπεια, το σφάλμα ξεπερνά κατά πολύ τον αποδεκτό όριο των 5% για να δεχόμαστε ότι, ισχύει η υπόθεση Η 1. Η διαφορά μεταξύ της μέσης τιμής (=20,52) και της τιμής ελέγχου (=18,0) που ανέρχεται σε 2,520 δεν είναι στατιστικά σημαντική (Ηο ισχύει). Τι ίδιο συμπέρασμα προκύπτει από το 95% Διάστημα εμπιστοσύνης. Όπως διαβάζουμε στο 2 ο πίνακα, με 95% επίπεδο εμπιστοσύνης, η διαφορά (Mean Difference) βρίσκεται μεταξύ -7,887 και +12,927. Το Δ.Ε. περιλαμβάνει την μηδενική τιμή και αυτό μας οδηγεί στο συμπέρασμα ότι, με στατιστικούς όρους, η διαφορά = 0.

4. Δεύτερο παράδειγμα [01]: Paired-Samples T Test Τα δεδομένα αφορούν τον ποσοστό ανεργίας κατά φύλο στην Ελλάδα για την περίοδο 2001-2014. Πρόκειται για το ετήσιο ποσοστό ανεργίας (Πηγή: ΕΛΣΤΑΤ, Έρευνα εργατικού δυναμικού) ΑΝΕΡΓΙΑ_Σ: Ποσοστό ανεργίας (σύνολο) ΑΝΕΓΡΙΑ_Α: Ποσοστό ανεργίας (άνδρες) ΑΝΕΡΓΙΑ_Γ: Ποσοστό ανεργίας (γυναίκες) Η ερώτηση είναι επομένως η ακόλουθα: μπορούμε να θεωρήσουμε ότι, το ποσοστό ανεργίας των ανδρών διαφέρει από τον αντίστοιχό ποσοστό για τις γυναίκες; Πρόκειται για έλεγχο δύο μέσων τιμών (ζεύγη παρατηρήσεων ανά έτος). Έχουμε δύο μεταβλητές που αναφέρονται στον ίδιο φαινόμενο (η ανεργία). Analyze > Compare Means > Paired-Samples T Test, επιλέγουμε τις μεταβλητές ΑΝΕΡΓΙΑ_Α & ΑΝΕΡΓΙΑ_Γ (Paired Variables). Με την ιδιά εντολή, μπορούμε να επιλέξουμε πάνω από ένα ζεύγος μεταβλητών.

4. Δεύτερο παράδειγμα [02]: Paired-Samples T Test Κατά μέσο όρο, το ποσοστό ανεργίας για τους άνδρες (για όλη την περίοδο ανάλυσης) ανέρχεται σε 10,8% (στρογγυλοποίηση) έναντι 18,4% για τις Γυναίκες, μια διαφορά της τάξης του 7,6. Η υπολογισμένη τιμή του t-student = -22,239 ενώ η p-value = 0,000 < 0,05. Η διαφορά που παρατηρήσαμε, επιβεβαιώνεται απόλυτα εφόσον η ισχύς του ελέγχου είναι ιδιαίτερα μεγάλη (μηδενικό σφάλμα, 100% βεβαιότητας). Αυτό σημαίνει ότι, η ανεργία πλήττει περισσότερο τις γυναίκες σε όλη την εξεταζόμενη περίοδο. Η διαφορά ΑΝΕΡΓΙΑ_Α ΑΝΕΡΓΙΑ_Γ = -7,65 με 95% Διάστημα Εμπιστοσύνης: (-8,39, - 6,91). Το Δ.Ε. δεν περιλαμβάνει την μηδενική τιμή και σύμφωνα με το Δ.Ε., η διαφορά είναι συστηματικά αρνητική, επιβεβαιώνοντας τον παραπάνω αποτέλεσμα. Το SPSS μας προσφέρει μια επιπρόσθετη πληροφορία σχετικά με τις δύο εξεταζόμενες μεταβλητές (η οποία όμως δεν αφορά τον έλεγχο των μέσων τιμών). Υπολογίζει τον συντελεστή συσχέτισης μεταξύ των δύο μεταβλητών (r= 0,986 με p- value=0,000). Διαχρονικά, έχουμε παρόμοια εξέλιξη του ποσοστού ανεργίας μεταξύ των ανδρών και των γυναικών.