Παραδείγµατα στατιστικής συµπερασµατολογίας µε ένα δείγµα Στα παραδείγµατα χρησιµοποιείται απλό τυχαίο δείγµα µεγέθους 1 από το αρχείο δεδοµένων 1991 US Social Survey.sav Το δείγµα λαµβάνεται µε την διαδικασία Data->Select Cases -> Random sample of cases -> Sample -> Exactly 1 from the first 1517 (N=1517 είναι το σύνολο των παρατηρήσεων του αρχείου). Χρησιµοποιούµε το δείγµα αυτό για να διεξάγουµε στατιστική συµπερασµατολογία (εκτίµηση διαστήµατος και έλεγχο υποθέσεων). ιαστήµατα εµπιστοσύνης για τον µέσο Προκειµένου να κατασκευάσουµε διαστήµατα εµπιστοσύνης για τον µέσο του πληθυσµού από τα στοιχεία ενός δείγµατος, στο SPSS ακολουθούµε την εξής διαδικασία: Βήµα 1 ο : ιαλέγουµε την ποσοτική µεταβλητή της οποίας θέλουµε να υπολογίσουµε το διάστηµα εµπιστοσύνης (πχ Age of Respondent) Επιλέγουµε τις εξής εντολές : Analyze > Descriptive Statistics > Explore Βήµα 2 ο : Στο νέο παράθυρο που ανοίγει, στο πεδίο µε όνοµα Dependent list εισάγουµε την µεταβλητή που µας ενδιαφέρει (Age of Respondent), είτε µε το βελάκι είτε µε διπλό κλίκ.
Βήµα 3 ο : Στο νέο παράθυρο που ανοίγει υπάρχει ήδη επιλεγµένη η επιλογή υπολογισµού των περιγραφικών στατιστικών (Descriptives) και το επίπεδο εµπιστοσύνης 95% για υπολογισµό του διαστήµατος εµπιστοσύνης του µέσου. Αν θέλουµε να κατασκευάσουµε διάστηµα για τον µέσο µε διαφορετικό επίπεδο εµπιστοσύνης (π.χ. 99%) αλλάζουµε απλά τον αριθµό (π.χ. από 95 σε 99). Με continue στο παραπάνω παράθυρο και OΚ στο παράθυρο του Βήµατος 2, παίρνουµε το εξής αποτέλεσµα (Output). Descriptives
Statistic Std. Error Mean 46,11 1,915 95% Confidence Interval for Mean Lower Bound 42,31 Upper Bound 49,91 5% Trimmed Mean 45,31 Median 4,5 Variance 366,766 Age of Respondent Std. Deviation 19,151 Minimum 2 Maximum 89 Range 69 Interquartile Range 3 Skewness,68,241 Kurtosis -,826,478 Το 95% διάστηµα εµπιστοσύνης για την µέση ηλικία του πληθυσµού από τον οποίο προήλθε το τυχαίο δείγµα των ερωτηθέντων είναι από 42.31 έως 49.91 έτη ιαστήµατα εµπιστοσύνης για την αναλογία ιάστηµα εµπιστοσύνης για την αναλογία των γυναικών στον πληθυσµό: µεταβλητή sex (=Male, 1= Female). Descriptives Statistic Std. Error Mean,61,49 95% Confidence Interval for Mean Lower Bound,51 Upper Bound,71 5% Trimmed Mean,62 Median 1, Variance,24 Respondent's Sex Std. Deviation,49 Minimum Maximum 1 Range 1 Interquartile Range 1 Skewness -,458,241 Kurtosis -1,827,478
Παρατήρηση 1. Για την κατασκευή.ε. για την αναλογία µε τη διαδικασία Explore, χρειάζεται η µεταβλητή να είναι δίτιµη µε τιµές {,1} Παρατήρηση 2. Το διάστηµα είναι έγκυρο αφού ισχύει η κανονική προσέγγιση: min{ npˆ, n(1 pˆ )} 5. Πράγµατι, 1(1.61) = 39> 5. Έλεγχος Υποθέσεων για τον µέσο Ως παράδειγµα, θα ελέγξουµε την υπόθεση ότι ο µέσος αριθµός συγγενών ανά άτοµο στον πληθυσµό ανέρχεται σε 3 σε επίπεδο σηµαντικότητας 5%. Η διαδικασία που θα ακολουθήσουµε είναι: Βήµα 1 ο : Πηγαίνουµε στο Analyze > Compare Means > 1 Sample T test. Βήµα 2 ο : Αφού εισάγουµε την µεταβλητή µας στο πεδίο του νέου παραθύρου που ανοίγει, γράφουµε τον αριθµό 3 στο πεδίο Value. Αυτός ο αριθµός δηλώνει την τιµή µε την οποία θα συγκρίνουµε τον µέσο του πληθυσµού της µεταβλητής που µας ενδιαφέρει.
Στην επιλογή Options, µας δίνεται η δυνατότητα να υπολογίσουµε αν το θέλουµε το 1(1- α)% διάστηµα εµπιστοσύνης για την διαφορά µ-µ (Difference), όπου µ ο άγνωστος πραγµατικός µέσος του πληθυσµού και µ η τιµή του µέσου στη µηδενική υπόθεση. Επιλέγοντας ΟΚ παίρνουµε το ακόλουθο αποτέλεσµα. One-Sample Statistics N Mean Std. Deviation Std. Error Mean Number of Brothers and Sisters 99 4,14 2,962,298 Παρατήρηση: n=99, x π = 4.14, s= 2.962, ˆ σ = s =.298 X n n=99 και όχι 1 γιατί υπάρχει µια απουσιάζουσα τιµή στη συγκεκριµένη µεταβλητή One-Sample Test Test Value = 3 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper Number of Brothers and Sisters 3,834 98, 1,141,55 1,73 Παρατηρούµε από τον πίνακα ότι η µηδενική υπόθεση απορρίπτεται αφού η τιµή πιθανότητας του ελέγχου (Sig. 2-tailed) είναι µικρότερη από το επίπεδο σηµαντικότητας (5%). Επίσης, η µέση δειγµατική διαφορά είναι ˆ µ µ = µ = 4.141 3= 1.141και συνεπώς το 95%.Ε. για την πραγµατική διαφορά µ-µ είναι s s ( xπ µ ) ± tn 1, a/2 = ( xπ µ ) ± t98,.25 = 1.141± 1.96.298 = (.55,1.73) n n Η τιµή δεν ανήκει στο 95% διάστηµα εµπιστοσύνης για τον µέσο, όπως αναµένεται, καθώς το διάστηµα εµπιστοσύνης είναι ισοδύναµο µε τον δίπλευρο έλεγχο για τον µέσο. x π Παρατήρηση. Αν ο έλεγχος που θα θέλαµε να διεξάγουµε ήταν µονόπλευρος, τότε η τιµή πιθανότητας του ελέγχου θα ήταν η µισή της τιµής πιθανότητας του δίπλευρου ελέγχου (δηλ. (Sig. 2-tailed)/2). Στο παράδειγµά µας,./2 =,. Συνεπώς, αν διεξήγαµε δεξιόπλευρο έλεγχο (καθώς x π > µ (4.141> 3) ), η µηδενική υπόθεση θα απορρίπτονταν για α=.5.
Έλεγχος υποθέσεων για την αναλογία Σε αυτόν τον έλεγχο χρησιµοποιούµε κάποια µεταβλητή η οποία παίρνει δύο τιµές (πχ φύλο). Όταν το δείγµα είναι µεγάλο, ο έλεγχος για την αναλογία µπορεί να διεξαχθεί µε την z- στατιστική. Το δείγµα θεωρείται µεγάλο όταν ισχύει η σχέση min{ np, n(1 p)} 5. Ως παράδειγµα, θα διεξαχθεί δίπλευρος έλεγχος για την αναλογία των γυναικών στον πληθυσµό (µεταβλητή sex, =Male, 1=Female) µε µηδενική υπόθεση H : p=.5 για επίπεδο σηµαντικότητας 5%. Το µέγεθος του δείγµατος είναι n=1, συνεπώς η συνθήκη min{ np, n(1 p )} 5ικανοποιείται, αφού np = 1.5= 5 > 5 Αν θέλουµε να διενεργήσουµε έλεγχο υποθέσεων για την αναλογία ακολουθούµε την εξής διαδικασία: Analyze > Non parametric tests > Binomial Αφού την επιλέξουµε ανοίγει ένα νέο παράθυρο, στο πεδίο του οποίου εισάγουµε την (δίτιµη) µεταβλητή που µας ενδιαφέρει (πχ Sex).
Στο πεδίο Test Proportion θέτουµε την τιµή µε την οποία ισούται η αναλογία στην µηδενική υπόθεση. Σαν προεπιλογή υπάρχει το.5 (5%). Για να πραγµατοποιήσουµε τον έλεγχο, θα πατήσουµε απλά ΟΚ. Το αποτέλεσµα που παίρνουµε είναι το ακόλουθο: Binomial Test Category N Observed Prop. Test Prop. Asymp. Sig. (2- tailed) Group 1 Female 61,61,5,25 a Respondent's Sex Group 2 Male 39,39 a. Based on Z Approximation. Total 1 1, Στον πίνακα αποτελεσµάτων αναφέρεται η δειγµατική αναλογία κάθε κατηγορίας για την δίτιµη µεταβλητή. Η υπόθεση ότι το ποσοστό των γυναικών στον πληθυσµό είναι 5% απορρίπτεται, αφού η τιµή πιθανότητας του ελέγχου (.27) είναι µικρότερη από το επίπεδο σηµαντικότητας 5%. Παρατήρηση 1. Η τιµή πιθανότητας στο µονόπλευρο έλεγχο είναι κι εδώ η µισή της τιµής πιθανότητας του δίπλευρου ελέγχου (Sig. (2-tailed) / 2). Στο παράδειγµά µας,.27/2 =.135. Συνεπώς, αν ο έλεγχος διατυπώνονταν ως δεξιόπλευρος η µηδενική υπόθεση θα απορρίπτονταν για α=.5. Παρατήρηση 2. Στην περίπτωση της αναλογίας, ο δίπλευρος έλεγχος µε το διάστηµα εµπιστοσύνης δεν είναι ισοδύναµοι. Συνεπώς δεν πρέπει να χρησιµοποιείτε το.ε. για να διεξάγετε δίπλευρο έλεγχο.