ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

Σχετικά έγγραφα
ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

1991 US Social Survey.sav

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 6. Συσχέτιση

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

ο),,),--,ο< $ι ιι!η ι ηι ι ιι ιι t (t-test): ι ι η ι ι. $ι ι η ι ι ι 2 x s ι ι η η ιη ι η η SE x

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Λυμένες Ασκήσεις για το μάθημα:

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

Εισαγωγή στην Ανάλυση Δεδομένων

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

τατιστική στην Εκπαίδευση II

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Τμήμα Λογιστικής και Χρηματοοικονομικής. Δρ. Αγγελίδης Π. Βασίλειος

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

Στατιστική. 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

UΟΙ ΑΠΟΦΟΙΤΟΙ ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

Επαγωγική Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Εισαγωγή στη Βιοστατιστική

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 12 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) [µέρος 2ο]

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Θέματα Στατιστικής στη γλώσσα R

Έλεγχος Υποθέσεων Εφαρμογές

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 3. Στατιστική Συµπερασµατολογία για ποιοτικές µεταβλητές

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Μη Παραµετρικοί Έλεγχοι

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές,

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Εισαγωγή στην Ανάλυση Διακύμανσης

2.1 Μεγάλο δείγµα: ο έλεγχος-ζ µιας οµάδας Υπολογισµός του Ε για µια µέση τιµή όταν το δείγµα είναι µικρό. 9

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

Μελέτη της αυτοδιαχείρισης του διαβήτη με την εφαρμογή ειδικού ερωτηματολογίου σε παιδιά και εφήβους με σακχαρώδη διαβήτη τύπου 1

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

ΣΥΣΧΕΤΙΣΗ ΕΠΙΠΕΔΩΝ ΒΙΤΑΜΙΝΗΣ D ΜΕ ΠΑΡΑΜΕΤΡΟΥΣ ΜΕΤΑΒΟΛΙΣΜΟΥ ΓΛΥΚΟΖΗΣ ΚΑΙ ΛΙΠΙΔΙΩΝ ΣΕ ΑΝΔΡΕΣ ΗΛΙΚΙΑΣ ΑΝΩ ΤΩΝ 65 ΕΤΩΝ.

3. Ανάλυση Ποσοτικών εδοµένων: Συγκρίσεις µεταξύ οµάδων

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows

Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα

Απλή Ευθύγραµµη Συµµεταβολή

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Εισαγωγή στη Βιοστατιστική

«Εμπειρική διερεύνηση αγοραστικής πρόθεσης καταναλωτών για προωθητικές ενέργειες σε προϊόντα καλλυντικών»


Στατιστική Επιχειρήσεων Ι

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Statistics. hrs1 Number of hours worked last week. educ Highest year of school completed. sibs NUMBER OF BROTHERS AND SISTERS. N Valid

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Transcript:

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

ιαστήµατα εµπιστοσύνης και έλεγχοι υποθέσεων για τη µέση τιµή Για µια ποσοτική µεταβλητή µας ενδιαφέρει για την (άγνωστη) µέση τιµή τηςστον πληθυσµό: Έλεγχος υπόθεσης Η 0 : µ=µ 0 Η 1 : µ µ 0 Εύρεση δ.ε. (π.χ. 90%, 95%, 99%) Χρησιµοποιούµε: x, s 2, n ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2

Παράδειγµα (hobbit restaurant) Από το δείγµα µας µπορούµε να ισχυριστούµε ότι οι άνθρωποι της περιοχής που µας ενδιαφέρει ξοδεύουν µηνιαία κατά µέσο όρο $200 για εστιατόρια; ήακριβέστερα: ο πραγµατικός µέσος όρος (µ) διαφέρει σηµαντικά από τα $200; Να βρεθούν τα 90%, 95%, 99% δ.ε. Για την πραγµατική µέση τιµή ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 3

Στατιστικά µέτρα δείγµατος (Frequencies) Statistics How many total dollars do you spend per month in restaurants (for your meals only)? N Mean Std. Error of Mean Median Std. Deviation Variance Minimum Maximum Valid Missing 400 0 $150.0525 $4.63531 $135.0000 $92.70629 8594,456 $5.00 $450.00 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 4

ιαδικασία One-sample T test Εκτέλεση του στατιστικού ελέγχου Student s t-test για ένα δείγµα ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 5

Ορισµός τιµής ελέγχου και επιπέδου εµπιστοσύνης H 0 : µ=200 Η 1 : µ 200 90% δ.ε. για το µ-200 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 6

Αποτελέσµατα One-Sample Test How many total dollars do you spend per month in restaurants (for your meals only)? t df Sig. (2-tailed) Test Value = 200 90% Confidence Interval of the Mean Difference Difference Lower Upper -10,775 399,000 -$49.94750 -$57.5897 -$42.3053 Επειδή sig = 0.000 <0.05 57.5897 µ 200 Απορρίπτεται η H 0 εχόµαστε την Η : µ 200 1 142.4103 µ 157. 6947 42.3053 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 7

Ερµηνεία αποτελεσµάτων Η (πραγµατική) µέση τιµή των χρηµάτων που διαθέτουν οι κάτοικοι τηςπεριοχήςγιαεστιατόριακάθεµήνα διαφέρει σηµαντικά από την τιµή ελέγχου ($200) Το 90% δ.ε. για τη µέση τιµή είναι ($142.41, $157.69) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 8

Συνήθως θέτουµε µ 0 =0 One-Sample Test How many total dollars do you spend per month in restaurants (for your meals only)? t df Sig. (2-tailed) Test Value = 0 90% Confidence Interval of the Mean Difference Difference Lower Upper 32,372 399,000 $150.0525 $142.4103 $157.6947 90% δ.ε. για το µ: ($142.41,$157.69) How many total dollars do you spend per month in restaurants (for your meals only)? One-Sample Test t df Sig. (2-tailed) Test Value = 0 95% Confidence Interval of the Mean Difference Difference Lower Upper 32,372 399,000 $150.0525 $140.9398 $159.1652 95% δ.ε. για το µ: ($140.94,$159.17) How many total dollars do you spend per month in restaurants (for your meals only)? One-Sample Test t df Sig. (2-tailed) Test Value = 0 99% Confidence Interval of the Mean Difference Difference Lower Upper 32,372 399,000 $150.0525 $138.0553 $162.0497 99% δ.ε. για το µ: ($138.06,$162.05) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 9

Συµπέρασµα Θέτοντας τιµή ελέγχου 0 και ορίζοντας το επίπεδο εµπιστοσύνης παίρνουµε το αντίστοιχο δ.ε. για το µ Απότοδ.ε. µπορούµε να ελέγξουµε καιτην υπόθεση που µας ενδιαφέρει Π.χ. Αφού το 99% δ.ε. δεν περιλαµβάνει το 200, µπορούµε νααπορρίψουµε τηνη 0 µε «σιγουριά» 99% Το εύρος των δ.ε. αυξάνει όσο αυξάνει και το επίπεδο εµπιστοσύνης ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 10

Εφαρµογές Να βρεθούν 95% και 99% δ.ε. για όλες τις ποσοτικές συνεχείς µεταβλητές των δεδοµένων avprice ηλικία (προκύπτει από τη yrborn) reincome ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 11

Σύγκριση µέσων τιµών 2 ανεξάρτητων δειγµάτων Για µια ποσοτική µεταβλητή σε δύο ανεξάρτητους πληθυσµούς µας ενδιαφέρει για τις (άγνωστες) µέσες τιµές τους: Έλεγχος υπόθεσης Η 0 : µ 1 =µ 2 Η 1 : µ 1 µ 2 Εύρεση δ.ε. για τη διαφορά µ 1 -µ 2 (90%, 95%, 99%) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 12

Παράδειγµα ιαφέρουν οι µέσες τιµές των µηνιαίων χρηµάτων που ξοδεύουν οι άντρες από αυτά που ξοδεύουν οι γυναίκες; Προσοχή! Απαιτείται ύπαρξη 2 µεταβλητών (στηλών): µια ποσοτική (αυτή που ενδιαφέρει να συγκρίνουµε) και µια κατηγορική (αυτή που ορίζει τους πληθυσµούς) Στο παράδειγµα θαχρησιµοποιηθούν οι totspent και gender ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 13

ιαδικασία: Independent-Samples T Test Εκτέλεση του στατιστικού ελέγχου Student s t-test για δύο ανεξάρτητα δείγµατα ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 14

ποσοτική µεταβλητή κατηγορική µεταβλητή τιµές που ορίζουν τους πληθυσµούς (οµάδες) ορισµός δ.ε. ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 15

Αποτελέσµατα - περιγραφικά Group Statistics How many total dollars do you spend per month in restaurants (for your meals only)? What is your gender? Male Female N Mean Std. Deviation Std. Error Mean 204 $154.1275 $96.82936 $6.77941 196 $145.8112 $88.25842 $6.30417 Περιγραφικά στατιστικά της ποσοτικής µεταβλητής στα δύο δείγµατα Είναι στατιστικά σηµαντική η διαφορά αυτή; ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 16

Αποτελέσµατα - συµπερασµατολογία Independent Samples Test How many total dollars do you spend per month in restaurants (for your meals only)? Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,565,453,897 398,370 $8.31623 $9.27476 -$9.91742 $26.54987,898 396,908,370 $8.31623 $9.25759 -$9.88382 $26.51627 1 ο βήµα: Είναι οι διασπορές των πληθυσµών ίσες; sig. =0.453>0.05 Οι διασπορές δεν έχουν διαφορά (θεωρούνται ίσες) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 17

Αποτελέσµατα - συµπερασµατολογία Independent Samples Test How many total dollars do you spend per month in restaurants (for your meals only)? Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,565,453,897 398,370 $8.31623 $9.27476 -$9.91742 $26.54987,898 396,908,370 $8.31623 $9.25759 -$9.88382 $26.51627 2 ο βήµα: Θεωρούµε το t-test για έλεγχο µέσων τιµών υποθέτοντας ίσες διασπορές sig. =0.370>0.05 Οι µέσες τιµές δεν έχουν διαφορά (θεωρούνται ίσες) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 18

Αποτελέσµατα - συµπερασµατολογία Independent Samples Test How many total dollars do you spend per month in restaurants (for your meals only)? Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,565,453,897 398,370 $8.31623 $9.27476 -$9.91742 $26.54987,898 396,908,370 $8.31623 $9.25759 -$9.88382 $26.51627 3 ο βήµα: Θεωρούµε το δ.ε. τηςδιαφοράςτων µέσων τιµών υποθέτοντας ίσες διασπορές 95% δ.ε. για τη διαφορά µ 1 -µ 2 : (-9.92, 26.55) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 19

Συµπεράσµατα Πρώτα εξετάζουµε ανείναιοι διασπορές των πληθυσµών ίσες Τα αποτελέσµατα κάτω από την υπόθεση ίσων διασπορών γενικά διαφέρουν από αυτά κάτω από την υπόθεση άνισων διασπορών Εδώ οι διασπορές µπορούν να θεωρηθούν ίσες ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 20

Συµπεράσµατα (συν.) Οι µέσες τιµές των χρηµάτων που ξοδεύουν οι άνδρες και οι γυναίκες δεν παρουσιάζουν στατιστικά σηµαντική διαφορά (µ 1 =µ 2 ) Το παραπάνω συµπέρασµα προκύπτει και από το 95% δ.ε. το οποίο περιέχει το 0 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 21

Σχετικές γραφικές παραστάσεις: Error Bars ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 22

Σχετικές γραφικές παραστάσεις: Error Bars δ.ε. για τη µέση τιµή κάθε φύλου ξεχωριστά: Παρόλο που για τους άνδρες φαίνονται υψηλότερες τιµές, η διαφορά δεν είναι στατιστικά σηµαντική (προσέξτε την επικάλυψη των 2 δ.ε.) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 23

Εφαρµογές Να γίνουν οι έλεγχοι για διαφορές των µέσων τιµών όλων των ποσοτικών συνεχών µεταβλητών των δεδοµένων (totspent, avprice,ηλικία,reincome) ανάµεσα σε 2 οµάδες που ορίζονται από δίτιµες κατηγορικές µεταβλητές (Yes/No) ή ακόµα και από άλλες κατηγορικές (π.χ. στην marital married/single) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 24

Σύγκριση µέσων τιµών 2 εξαρτηµένων δειγµάτων Για µια ποσοτική µεταβλητή (ή δύο παρόµοιες) που µετριέται στα ίδια ακριβώς άτοµα µας ενδιαφέρει για τις (άγνωστες) µέσες τιµές τους: Έλεγχος υπόθεσης Η 0 : µ 1 =µ 2 Η 1 : µ 1 µ 2 Εύρεση δ.ε. για τη διαφορά µ 1 -µ 2 (90%, 95%, 99%) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 25

Παράδειγµα ιαφέρουν οι µέσες τιµές των βαθµολογιών στις µεταβλητές variety και unusual; Οι µετρήσεις έχουν γίνει στα ίδια άτοµα (εποµένως αναφερόµαστε σε έναν πληθυσµό) Προσοχή! Η θεώρησητηςβαθµολογίας 1-5 ως ποσοτική συνεχής µεταβλητή γίνεται για τις ανάγκες του παραδείγµατος. Για αυτές τις µεταβλητές καλύτεροι οι µηπαραµετρικοί έλεγχοι Απαραίτητηηύπαρξητωνδύοµεταβλητών σε δύο διαφορετικές στήλες ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 26

ΗδιαδικασίαPaired-Samples T Test ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 27

Αποτελέσµατα αρχικά στατιστικά Paired Samples Statistics Pair 1 Prefer Large Variety of Entrees Prefer Unusual Entrees Mean N Std. Deviation Std. Error Mean 2,48 400 1,466,073 2,41 400 1,550,077 Paired Samples Correlations ηδιαφοράδε φαίνεται µεγάλη (πρέπει να επιβεβαιωθεί µε t- test) Pair 1 Prefer Large Variety of Entrees & Prefer Unusual Entrees N Correlation Sig. 400,831,000 ησυσχέτισηείναισηµαντική (sig=0.000 <0.05) ικαιολογείται η χρήση Paired t-test. ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 28

Αποτελέσµατα paired t-test Paired Samples Test Pair 1 Prefer Large Variety of Entrees - Prefer Unusual Entrees Mean Std. Deviation Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Lower Upper t df Sig. (2-tailed),070,882,044 -,017,157 1,588 399,113 95% δ.ε. για τη διαφορά µ 1 -µ 2 : (-0.017, 0.157) sig. =0.113>0.05 Οι µέσες τιµές δεν έχουν διαφορά (θεωρούνται ίσες) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 29

Συµπεράσµατα Οι µέσες τιµές των βαθµολογιών που δίνουν τα ίδια άτοµα σε 2 διαφορετικές ερωτήσεις δεν παρουσιάζουν στατιστικά σηµαντική διαφορά (µ 1 =µ 2 ) Το παραπάνω συµπέρασµα προκύπτει και από το 95% δ.ε. το οποίο περιέχει το 0 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 30

Εφαρµογές Να γίνουν παρόµοιοι έλεγχοι και για άλλα ζευγάρια βαθµολογιών: water-simple water-jazz. ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 31