ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης"

Transcript

1 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

2 Περιεχόμενα Έλεγχος κανονικότητας P-P Plot και Q-Q Plot Τεστ Κανονικότητας Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Τεστ ανεξαρτησίας Βασικές έννοιες θεωρίας ελέγχων υποθέσεων Στατιστική Επαγωγή Διαστήματα Εμπιστοσύνης Έλεγχοι Τ-Test Έλεγχος της μέσης τιμής Παραμετρικό/Μη Παραμετρικό Τεστ Σύγκριση των μέσων τιμών μίας μεταβλητής - Παραμετρικό /Μη Παραμετρικό Τεστ Σύγκριση των μέσων τιμών δύο εξαρτημένων δειγμάτων. Παραμετρικό /Μη Παραμετρικό Τεστ Συντελεστές γραμμικής συσχέτισης Έλεγχος F Ανάλυση διακύμανσης (διασποράς) κατά ένα παράγοντα (One-way Anova) Έλεγχος χ 2 Σύγκριση δύο ποιοτικών μεταβλητών (ανεξάρτητα / εξαρτημένα δείγματα) Διαστήματα Εμπιστοσύνης Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 2

3 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Αναφέρθηκε στο προηγούμενο μάθημα ότι όταν το ιστόγραμμα συχνοτήτων των ποσοτικών μεταβλητών έχει το σχήμα καμπάνας, τότε λέμε ότι τα δεδομένα ακολουθούν την κανονική κατανομή ή κατανέμονται κανονικά. Το ιστόγραμμα όμως δεν είναι ικανό να μας απαντήσει στη ερώτηση αν είναι κανονικά τα δεδομένα ή αν προέρχονται από μία κανονική κατανομή με ένα μέσο και μία διακύμανση. Ένα από τα πιο σημαντικά προβλήματα στην στατιστική είναι η διερεύνηση της πληροφορίας η οποία σχετίζεται με την μορφή της κατανομής από την οποία προέρχεται ένα τυχαίο δείγμα. Οι περισσότεροι έλεγχοι γίνονται με την προϋπόθεση ότι (υπό την Η 0 ) το τυχαίο δείγμα προέρχεται από μια συγκεκριμένη κατανομή. Μια τέτοια περίπτωση είναι τα t-tests που θα εξετάσουμε στη συνέχεια και τα οποία, ιδιαίτερα για μικρά δείγματα, προϋποθέτουν ότι το δείγμα προέρχεται από κανονικής κατανομής πληθυσμό. Εάν το τυχαίο δείγμα δεν προέρχεται από την κατανομή κάτω από την οποία έχει κατασκευασθεί κάποιος έλεγχος τότε προφανώς το αντίστοιχο p-value που λαμβάνεται δεν είναι ακριβές. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 3

4 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Συνεπώς είναι αρκετά χρήσιμη η δυνατότητα να ελέγχουμε αν κάποια δεδομένα προέρχονται από μια συγκεκριμένη κατανομή ή όχι. Έλεγχοι αυτής της μορφής καλούνται «έλεγχοι καλής προσαρμογής» των δεδομένων σε μια συγκεκριμένη κατανομή και έχουν προταθεί αρκετοί. Για τον έλεγχο αν τα δεδομένα ακολουθούν την κανονική κατανομή αρχικά μπορούμε να κατασκευάσουμε δύο γραφήματα με το SPSS, το P-P Plot και το Q-Q Plot (Επιλέγοντας Analyze Descriptive Statistics P-P Plots ή Q-Q Plots). Με αυτά τα γραφήματα ελέγχουμε οπτικά την ύπαρξη κανονικότητας στα δεδομένα. Όσο πιο κοντά στην ευθεία είναι τα σημεία του σχήματος τόσο πιο πολλές είναι οι ενδείξεις ότι τα δεδομένα ακολουθούν την κανονική κατανομή. Το μάτι όμως πάλι μπορεί να πέσει έξω και να ξεγελαστούμε. Για αυτό το λόγο καταφεύγουμε σε τεστ κανονικότητας για να απαντήσουμε στην προηγούμενη ερώτηση. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 4

5 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Ο έλεγχος κανονικότητας υπάγεται σε μία ευρύτερη οικογένεια ελέγχων, τη λεγόμενη «έλεγχοι υποθέσεων». Όταν ακούμε για ελέγχους υποθέσεων μας έρχονται πολλά πράγματα στο μυαλό. Κάποια από αυτά είναι η μηδενική υπόθεση (Null Hypothesis ή H 0 ), η εναλλακτική υπόθεση (Alternative Hypothesis ή H 1 ), το επίπεδο στατιστικής σημαντικότητας (α) και το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας (p-value ή Significance). Οι υποθέσεις αυτές είναι της ακόλουθης μορφής: Η 0 : Η κατανομή των δεδομένων δε διαφέρει από την κανονική κατανομή Η 1 : Η κατανομή των δεδομένων διαφέρει από την κανονική κατανομή Για τη διεξαγωγή των ελέγχων υποθέσεων χρησιμοποιούνται κάποιοι μαθηματικοί τύποι, που καλούνται ελεγχοσυναρτήσεις. Με βάση το αποτέλεσμα τους οδηγούμαστε στο συμπέρασμα ότι η μηδενική υπόθεση απορρίπτεται ή όχι. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 5

6 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Η μηδενική υπόθεση στην συγκεκριμένη περίπτωση την οποία θέλουμε να ελέγξουμε είναι ότι τα δεδομένα ακολουθούν την κανονική ή ότι προέρχονται από ένα πληθυσμό που ακολουθεί την κανονική κατανομή. Η εναλλακτική είναι ότι τα δεδομένα δεν ακολουθούν την κανονική κατανομή. Το επίπεδο στατιστικής σημαντικότητας ορίζεται συνήθως ίσο με 0,05 ή 5%. Το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας ορίζεται ως η πιθανότητα η τιμή του ελέγχου (ελεγχοσυνάρτησης) να πάρει μία τιμή τόσο ακραία ή περισσότερο ακραία από αυτή που πήρε στο συγκεκριμένο δείγμα κάτω από τη μηδενική υπόθεση. Αν η p-value είναι μικρότερη του 0,05, τότε λέμε ότι η μηδενική υπόθεση απορρίπτεται. Αν η p-value είναι μεγαλύτερη ή ίση του 0,05, τότε λέμε ότι η μηδενική υπόθεση δεν απορρίπτεται. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 6

7 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Για τους ελέγχους καλής προσαρμογής αρχικά θα εξετάσουμε: κάποιους «εμπειρικούς» ελέγχους οι οποίοι γίνονται μέσω κάποιων γραφημάτων (P-P και Q-Q plots) έτσι ώστε να πάρουμε μια πρώτη εποπτική εικόνα για τα δεδομένα (τα γραφήματα αυτά δεν οδηγούν με σχετική «ασφάλεια» σε κάποια απόφαση) ενώ στη συνέχεια θα περάσουμε στους πιο σημαντικούς ελέγχους καλής προσαρμογής: το χι-τετράγωνο τεστ καλής προσαρμογής και το Kolmogorv- Smirnov τεστ. Τέλος, ένα ενδιαφέρον παρεμφερές πρόβλημα αφορά δύο δείγματα και τον έλεγχο της υπόθεσης ότι τα δείγματα αυτά προέρχονται από τον ίδιο πληθυσμό (δηλαδή από την ίδια κατανομή). Για τον έλεγχο αυτό θα παρουσιαστούν τρία μη παραμετρικά τεστ: το Kolmogorov- Smirnov για δυο δείγματα, το το Wald-Wolfowitz τέστ των ροών και το Mann-Whitney U τέστ Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 7

8 P-P Plot και Q-Q Plot Τα P-P Plot και Q-Q plot (probability-probability plot και Quantile-Quantile plot) είναι δύο γραφήματα τα οποία μας βοηθούν να ελέγξουμε αν κάποια δεδομένα προέρχονται από κάποια συγκεκριμένη κατανομή (π.χ. κανονική). Και στα δύο γραφήματα, αν τα σημεία που εμφανίζονται βρίσκονται «κοντά» στη διαγώνιο (και «τυχαία» γύρω από αυτήν) τότε μπορεί να θεωρηθεί ότι τα δεδομένα προέρχονται από μία κατανομή (π.χ. κανονική) ο έλεγχος μέσω των παραπάνω γραφημάτων δεν μπορεί να είναι αξιόπιστος διότι δεν βασίζεται σε κάποιο στατιστικό κριτήριο που μας οδηγεί σε σωστή απόφαση π.χ. στο 1 a % των περιπτώσεων. Συνήθως γίνεται για να πάρουμε μια πρώτη εποπτική εικόνα και για να δούμε αν υπάρχουν κάποιες έκτροπες, σε σχέση με τις αναμενόμενες υπό την F 0, παρατηρήσεις. Είναι προφανές ότι, εκτός της κανονικής, μπορούμε γραφικά να ελέγξουμε την καλή προσαρμογή των δεδομένων και σε άλλες κατανομές (αλλάζουμε την Test distribution).. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 8

9 Παράδειγμα P-P Plot Να ελεγχθεί γραφικά (μέσω P-P plot ή Q-Q plot) αν οι παρατηρήσεις του δείκτη χοληστερίνης (μεταβλητή chol) προέρχονται από την κανονική κατανομή (αρχείο test1) Στο SPSS από το μενού analyze/descriptive statistics επιλέγουμε P-P plot Για μέτρια ή μεγάλα δείγματα δεν υπάρχει ουσιαστική διαφορά οποιαδήποτε proportion estimation formula και αν επιλέξουμε για μικρά όμως δείγματα καλύτερα να επιλέξουμε την Van der Waerden s κάποιοι άλλοι ερευνητές παραθέτοντας κάποια δικαιολόγηση έχουν προτείνει την (Blom s) ή κάποια άλλη Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 9

10 Αποτελέσματα P-P Plot Φαίνεται ότι τα 60 σημεία του επιπέδου δεν «απέχουν» πολύ από την διαγώνιο, ούτε φαίνονται κάποιες «έκτροπες» παρατηρήσεις. Επομένως, τουλάχιστον γραφικά, δεν φαίνεται να υπάρχει επαρκής λόγος ώστε να μην θεωρήσουμε τα δεδομένα ως κανονικά (για να είμαστε πιο ακριβείς θα πρέπει να προχωρήσουμε και σε έλεγχο με δεδομένο ε.σ. a, π.χ. χ 2 ή K-S που θα εξετάσουμε παρακάτω). Αξίζει να παρατηρήσουμε ότι αν υπήρχαν κάποιες έκτροπες παρατηρήσεις (παρατηρήσεις αρκετά «απομακρυσμένες» από την διαγώνιο) τότε θα έπρεπε αυτές να επανεξεταστούν λεπτομερέστερα ώστε να βεβαιωθούμε ότι δεν ισχύουν κάποιες ειδικές συνθήκες για αυτές ή ότι δεν έχουν περαστεί λάθος στο SPSS. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 10

11 Παράδειγμα P-P Plot Να ελεγχθεί γραφικά (μέσω Q-Q plot) αν οι παρατηρήσεις του δείκτη χοληστερίνης (μεταβλητή chol) προέρχονται από την κανονική κατανομή (αρχείο test1). Στο SPSS από το μενού analyze/descriptive statistics επιλέγουμε Q-Q Αυτό το εμπειρικό τεστ είναι ισοδύναμο με το προηγούμενο και επομένως τα αποτελέσματα είναι τα ίδια. Και εδώ φαίνεται ότι όλα τα σημεία του επιπέδου δεν «απέχουν» πολύ από την διαγώνιο και επομένως δεν υπάρχει επαρκής λόγος ώστε απορρίψουμε ότι τα δεδομένα είναι κανονικά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 11

12 Τεστ Κανονικότητας Για να ελέγξουμε αν η κατανομή μιας μεταβλητής είναι συμβατή µε την κανονική εφαρμόζουμε το test Kolmogorov-Smirnov. H 0 (Μηδενική υπόθεση): Η υπό έλεγχο κατανομή, δε διαφέρει από την κανονική κατανομή έναντι της H 1 (Εναλλακτικής υπόθεσης): Η υπό έλεγχο κατανομή διαφέρει από την κανονική κατανομή. Για την εκτέλεση του τεστ κανονικότητας με το SPSS : πατάμε Analyze Non parametric tests One sample K-S Βάζουμε στο test variable list τις μεταβλητές που θέλουμε να ελέγξουμε την κανονικότητα τους, Τσεκάρουμε Normal και ΟΚ Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 12

13 Τεστ Κανονικότητας - Αποτελέσματα One-Sample Kolmogorov-Smirnov Test chol N 60 Normal Parameters a Mean 240,0833 Std. Deviation 48,72729 Most Extreme Differences Absolute,099 Positive,083 Negative -,099 Kolmogorov-Smirnov Z,770 Asymp. Sig. (2-tailed),593 a. Test distribution is Normal. Η υπόθεση την οποία θέλουμε να ελέγξουμε είναι ότι οι μεταβλητές ακολουθούν την κανονική κατανομή. Από ότι φαίνεται για δεν έχουμε εκλιπούσες τιμές. Εμφανίζονται επίσης ο μέσος και η τυπική απόκλιση για κάθε μεταβλητή. Για τον έλεγχο της κανονικότητας μας ενδιαφέρουν η τιμή της Asymp. Sig. (2-tailed). Το τεστ των Kolmogorov-Smirnov είναι ένα απλά μία τιμή p-value που υπολογίζεται με μία ελαχιστοσυνάρτηση. Παρατηρούμε ότι η τιμή p-value είναι 0,593 και όπως αναφέραμε προηγουμένως αν η p-value είναι μεγαλύτερη από το 0,05, τότε δεν απορρίπτουμε την υπόθεση της κανονικότητας των δεδομένων. Άρα η υπόθεση ότι οι μετρήσεις που αφορούν την μέτρηση της χοληστερίνης κατανέμονται κανονικά δεν απορρίπτεται σε επίπεδο στατιστικής σημαντικότητας α=0,05 ή α=5%. Ειδάλλως, μπορούμε να πούμε ότι υπάρχουν ενδείξεις ότι αυτές οι μετρήσεις ακολουθούν την κανονική κατανομή. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 13

14 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Στην προσπάθεια να εκτιμήσουμε την πραγματική τιμή του μέσου, χρησιμοποιούμε το μέσο ενός δείγματος. Στη συνέχεια κατασκευάζουμε ένα 95% διάστημα εμπιστοσύνης με βάση ένα μαθηματικό τύπο, ο οποίος είναι στην ουσία 2 τυπικά σφάλματα αριστερά και δεξιά της τιμής του μέσου που βρήκαμε για το δείγμα. Αν επαναλάβουμε τη δειγματοληψία ν φορές θα εκτιμήσουμε ν διαφορετικούς μέσους και προφανώς ν διαφορετικά (πολλά θα είναι αλληλοεπικαλυπτόμενα) διαστήματα εμπιστοσύνης. Αυτό που θέλουμε είναι ότι στο 95% των ν περιπτώσεων τα διαστήματα εμπιστοσύνης που υπολογίσαμε θα έχουν περικλείσει, ή πιάσει, ή χτυπήσει την τιμή του πραγματικού μέσου. Επομένως, αν για παράδειγμα παίρναμε κάθε φορά 100 δείγματα από έναν πληθυσμό και κατασκευάζαμε 100 διαστήματα εμπιστοσύνης για τη μέση τιμή μίας μεταβλητής και επαναλαμβάναμε τη διαδικασία άπειρες τιμές, κατά μέσο όρο στο 95% των περιπτώσεων θα είχαμε φτιάξει διαστήματα εμπιστοσύνης που θα είχαν πιάσει τον πραγματικό μέσο του πληθυσμού. Το 95% θα το ονομάζουμε βαθμό ή επίπεδο εμπιστοσύνης. Το υπόλοιπο 5% είναι αυτό που έχουμε ήδη ορίσει επίπεδο στατιστικής σημαντικότητας. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 14

15 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Για να κατασκευάσουμε ένα 95% διάστημα εμπιστοσύνης για τη μέση τιμή μίας μεταβλητής εργαζόμαστε ως εξής: πατάμε Analyze Descriptive Statistics Explore Από την επιλογή Plots μπορούμε να επιλέξουμε αν θέλουμε να εμφανιστεί ένα ιστόγραμμα των ή της μεταβλητής που θα περάσουμε στο άνω λευκό κουτάκι (Dependent List:) ακόμη και ένα τεστ κανονικότητας. Από την επιλογή Statistics μπορούμε να επιλέξουμε διάφορα περιγραφικά στατιστικά καθώς και το διάστημα εμπιστοσύνης Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 15

16 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Descriptives Statistic Std. Error Mean 240,0833 6, % Confidence Interval Lower Bound 227,4957 for Mean Upper Bound 252,6709 5% Trimmed Mean 238,3889 Median 233,0000 Variance 2374,349 Std. Deviation 48,72729 Minimum 161,00 Maximum 355,00 Range 194,00 Interquartile Range 84,25 Skewness,363,309 Kurtosis -,539,608 Ο πίνακας περιέχει τα περιγραφικά μέτρα στα οποία έχουμε ήδη αναφερθεί μαζί με λίγα ακόμα για τα οποία δεν έχουμε μιλήσει. Η μεταβλητή επιλέχθηκε τυχαία. Η πρώτη γραμμή του πίνακα περιέχει τη μέση τιμή για τις τιμές αυτής της μεταβλητής. Οι επόμενες δύο τιμές είναι το κάτω και το άνω άκρο του 95% διαστήματος εμπιστοσύνης για τον πραγματικό μέσο του πληθυσμού. Η επόμενη γραμμή είναι ο μέσος των τιμών της μεταβλητής από την οποία έχουμε αφαιρέσει το 5% των μεγαλύτερων και μικρότερων τιμών. Το Interquartile range (ενδοτεταρτημοριακό εύρος) είναι η διαφορά μεταξύ τρίτου και πρώτου τεταρτημόριου. Σε αυτό το εύρος βρίσκεται το 50% των κεντρικών παρατηρήσεων της μεταβλητής. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 16

17 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk chol Statistic df Sig. Statistic df Sig.,099 60,200 *,966 60,091 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 17

18 Έλεγχος ανεξαρτησίας Ένας άλλος χρήσιμος έλεγχος είναι ο έλεγχος που βασίζεται στα λεγόμενα runs, δηλαδή τις μεταβολές προσήμου της σειράς. Ο έλεγχος είναι διαθέσιμος στο μενού Analyze Non parametric tests Runs. Για να ελέγξουμε τις τιμές της χολυστερίνης για τυχαιότητα χρησιμοποιούμε τις επιλογές αυτές και έχουμε την ακόλουθη οθόνη. Runs Test chol Test Value a 240,0833 Cases < Test Value 33 Cases >= Test Value 27 Total Cases 60 Number of Runs 4 Z -7,025 Asymp. Sig. (2-tailed),000 a. Mean Ο έλεγχος αυτός είναι έλεγχος Z. Η τιμή της στατιστικής είναι 7,025 και έχει πιθανότητα 0,000. Αυτό σημαίνει ότι σε επίπεδο σημαντικότητας 5% (αλλά και 1%) μπορούμε να απορρίψουμε την υπόθεση ότι η σειρά είναι τυχαία. Και αυτό μπορούμε να το δούμε και στα δεδομένα τα οποία είναι ταξινομξμένα κατά αύξουσα σειρά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 18

19 Ξέρω στατιστική σημαίνει ότι γνωρίζω.. ποιο στατιστικό είναι κατάλληλο για κάθε ερευνητική ερώτηση, πώς να υπολογίσω το στατιστικό αυτό και πώς να το ερμηνεύσω H επιλογή του κατάλληλου στατιστικού είναι ένα από τα σημαντικότερα βήματα στην διαδικασία της εκπαιδευτικής έρευνας και της στατιστικής ανάλυσης Για την επιλογή του κατάλληλου στατιστικού χρησιμοποιούμε δύο γενικά κριτήρια: Το λόγο (σκοπό) για τον οποίο χρειαζόμαστε το στατιστικό η περιγραφή μεταβλητών ή σχέσεων μεταξύ μεταβλητών, με τα οποία ασχολείται η Περιγραφική Στατιστική και η γενίκευση από το δείγμα στον πληθυσμό, με την οποία ασχολείται η επαγωγική Την κλίμακα (επίπεδο) μέτρησης των μεταβλητών Ονομαστική, Τακτική, Ισοδιαστημική, Αναλογική Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 19

20 Στατιστική Επαγωγή Ο απώτερος σκοπός της στατιστικής ανάλυσης είναι να μας βοηθήσει να περιγράψομε τον πληθυσμό. Όταν όμως τα μόνα διαθέσιμα στοιχεία είναι από ένα δείγμα, ο πληθυσμός δεν μπορεί να περιγραφεί άμεσα. Αυτό που μπορούμε να κάνομε σε τέτοιες περιπτώσεις είναι να υπολογίσομε τα στατιστικά του δείγματος (περιγραφικά ή εξηγητικά) και από αυτά δι' επαγωγής να βγάλομε συμπεράσματα για τον πληθυσμό ή να προσεγγίσομε τις παραμέτρους του. Τα στατιστικά και οι τεχνικές που χρησιμοποιούνται για να κάνομε γενικεύσεις από το δείγμα στον πληθυσμό λέγονται Επαγωγικά Στατιστικά. Οι επαγωγές που ενδιαφέρουν τους ερευνητές στις κοινωνικές επιστήμες και την εκπαίδευση είναι δύο ειδών. Τα Διαστήματα Εμπιστοσύνης (Confidence Intervals) και Ο Έλεγχος Υποθέσεων (Hypothesis Testing) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 20

21 Τα Διαστήματα Εμπιστοσύνης Έχουμε τα παρακάτω ερωτήματα: Ποιο είναι το εκπαιδευτικό επίπεδο των Ελλήνων; Ποια είναι η διαφορά μεταξύ αγοριών και κοριτσιών στην επίδοση τους στα μαθήματα; Ποια είναι η σχέση μεταξύ του κοινωνικοοικονομικού επιπέδου της οικογένειας και της επίδοσης των μαθητών; Η λογική των διαστημάτων εμπιστοσύνης είναι αρκετά απλή: βασισμένοι στα στατιστικά του δείγματος και στη θεωρία των πιθανοτήτων φτιάχνομε διαστήματα τιμών μέσα στα οποία θα πέφτουν οι αντίστοιχες παράμετροι με κάποια δεδομένη πιθανότητα (συνήθως 95%). Αυτή την πιθανότητα ονομάζομε «εμπιστοσύνη» (confidence). Για παράδειγμα, αν στο δείγμα μιας δημοσκόπησης 32% των ερωτηθέντων έχει απαντήσει ότι σκοπεύει να ψηφίσει ΠΑΣΟΚ στις επόμενες εκλογές, μπορούμε να πούμε ότι με πιθανότητα 95% το ποσοστό του πληθυσμού που σκοπεύει να ψηφίσει ΠΑΣΟΚ είναι 32% ± 3% ή 29-35%. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 21

22 Ο έλεγχος υποθέσεων Έχουμε τα παρακάτω ερωτήματα: Είναι το εκπαιδευτικό επίπεδο των Ελλήνων (δηλ. ο μέσος όρος) διαφορετικό από το μέσο όρο των κρατών της Ευρωπαϊκής Ένωσης; Υπάρχει καμιά διαφορά μεταξύ αγοριών και κοριτσιών στην επίδοση τους στα γλωσσικά μαθήματα; Υπάρχει καμιά διαφορά στη μαθητική επίδοση στο δημοτικό μεταξύ αυτών που ζουν στις διάφορες γεωγραφικές περιοχές της χώρας; Οιυποθέσεις : Το εκπαιδευτικό επίπεδο των Ελλήνων δεν είναι διαφορετικό από το μέσο όρο των κρατών της Ευρωπαϊκής Ένωσης. Δεν υπάρχει καμιά διαφορά μεταξύ αγοριών και κοριτσιών στην επίδοση τους στα γλωσσικά μαθήματα. Δεν υπάρχει καμιά διαφορά στη μαθητική επίδοση στο δημοτικό μεταξύ αυτών που ζουν στις διάφορες γεωγραφικές περιοχές της χώρας. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 22

23 Ο έλεγχος υποθέσεων Oι έλεγχοι υποθέσεων προσπαθούν να απαντήσουν σε ερωτήσεις του τύπου «υπάρχει διαφορά;», «υπάρχει σχέση;», «υπάρχει επίδραση;» κ.τ.λ.. Όλοι οι έλεγχοι ακολουθούν περίπου την ίδια διαδικασία και λογική. Όλοι αρχίζουν με μιαν υπόθεση, ότι στον πληθυσμό δεν υπάρχει σχέση, διαφορά, επίδραση κ.τ.λ.. Η υπόθεση αυτή είναι γνωστή ως μηδενική υπόθεση, γιατί συνήθως υποθέτομε ότι οι σχέσεις, οι διαφορές και επιδράσεις είναι μηδενικές. Για να ελέγξομε τις υποθέσεις αυτές, συλλέγομε δεδομένα από ένα δείγμα πιθανοτήτων και υπολογίζομε τη διαφορά, σχέση επίδραση κ.τ.λ.. Αν στο δείγμα βρούμε ότι μας υπάρχει διαφορά, επίδραση ή σχέση (και συνήθως κάτι υπάρχει), δύο τινα μπορεί να συμβαίνουν: Είτε ισχύει η μηδενική μας υπόθεση και βρήκαμε τη διαφορά κατά τύχη (κατά σύμπτωση, κατά λάθος), Είτε δεν τη βρήκαμε κατά τύχη και άρα δεν ισχύει η μηδενική μας υπόθεση. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 23

24 Ο έλεγχος υποθέσεων Για να αποφανθούμε περί του τι ισχύει εξετάζομε την πιθανότητα να έχομε βρει τη διαφορά αυτή κατά τύχη. Υπολογίζομε, δηλαδή, την πιθανότητα να προέρχεται το δείγμα από έναν πληθυσμό όπου ισχύει η μηδενική υπόθεση (η πιθανότητα αυτή συμβολίζεται με ένα p). Αν η πιθανότητα αυτή είναι μικρή, συμπεραίνομε ότι το δείγμα μας δεν προέρχεται από τέτοιο πληθυσμό, αλλά από έναν άλλο, στον οποίο δεν ισχύει η μηδενική υπόθεση. Αν, με άλλα λόγια, με βάση τα δεδομένα, η μηδενική υπόθεση φαντάζει απίθανη, την απορρίπτομε και συμπεραίνομε ότι υπάρχει σχέση, διαφορά ή επίδραση στον πληθυσμό. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 24

25 Ο έλεγχος υποθέσεων Για να αποφασίσομε αν απορρίπτεται η μηδενική υπόθεση πρέπει : να γνωρίζομε πώς να υπολογίσομε το p (την πιθανότητα να έχομε βρει κάτι κατά λάθος) και να αποφασίσομε πότε θα λέμε η πιθανότητα αυτή είναι πολύ μικρή (ώστε να λέμε ότι αυτό που βρήκαμε δεν είναι κατά λάθος και άρα δεν ισχύει η μηδενική υπόθεση). Το πρώτο θα το δούμε παρακάτω για διάφορες περιπτώσεις. Το δεύτερο καθορίζεται a priori, μάλλον «αυθαίρετα», και είναι γνωστό ως επίπεδο στατιστικής σημαντικότητας (συμβολίζεται με ένα α - άλφα). Η λογική τελειώνει κάπως έτσι: Αν p α απορρίπτομε τη μηδενική υπόθεση και αποφαινόμαστε ότι υπάρχει στατιστικά σημαντική διαφορά. Αν p > α αποτυγχάνομε να απορρίψομε τη μηδενική υπόθεση και αποφαινόμαστε ότι δεν υπάρχει στατιστικά σημαντική διαφορά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 25

26 Ο έλεγχος υποθέσεων Απορρίπτουμε την Η 0 όταν p τιμή < α. Για να είμαστε σε θέση να αξιολογήσουμε πόσο αξιόπιστη είναι η p-τιμή που θα βρούμε, πρώτα πρέπει να ελέγξουμε αν ο πληθυσμός μας είναι κανονικός. Σε περίπτωση που δεν είναι, θα πρέπει να αξιολογήσουμε αν απέχει πολύ ή όχι. Επίσης, θα λάβουμε υπ όψιν και το μέγεθος του δείγματος. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 26

27 Ο έλεγχος υποθέσεων Γενικά, τις πιθανότητες p μπορούμε να τις βρούμε, αν γνωρίζομε: Τη δειγματoληπτική κατανομή (sampling distribution) ενός στατιστικού (ενός οποιουδήποτε στατιστικού, και τις πιθανότητες που αντιστοιχούν στις διάφορες τιμές αυτής της κατανομής. Κάτω από ορισμένες προϋποθέσεις, οι πληροφορίες αυτές υπάρχουν σε πίνακες για τα περισσότερα στατιστικά. Η κατανομή και ο πίνακας που χρησιμοποιούμε εξαρτάται από το στατιστικό που θέλομε να ελέγξομε. Έτσι, χρησιμοποιούμε άλλη κατανομή (και άλλο πίνακα) όταν θέλομε να ελέγξομε τη διαφορά μεταξύ πολλών μέσων όρων και άλλη όταν θέλομε να ελέγξομε το συντελεστή παλινδρόμησης. Τα κυριότερα στατιστικά που χρησιμοποιούνται στην εκπαίδευση και τις κοινωνικές επιστήμες ακολουθούν, εκτός από την κανονική (z), και τις παρακάτω κατανομές: Κατανομή t (t Distribution) Κατανομή F (F Distribution) Κατανομή χ 2 (CHI SQUARE Distribution ) Από την κατανομή που ακολουθούν τα διάφορα στατιστικά, παίρνουν την ονομασία τους και οι έλεγχοι στατιστικής σημαντικότητας που χρησιμοποιούνται για τα στατιστικά αυτά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 27

28 Έλεγχος της μέσης τιμής Παραμετρικό Τεστ Έλεγχος της μέσης τιμής μίας ποσοτικής μεταβλητής (έλεγχος µ=µ 0 ) Πολλές φορές θέλουμε να ελέγξουμε, αν η μέση τιμή μίας μεταβλητής είναι (στατιστικά) ίση µε έναν συγκεκριμένο αριθμό. Για παράδειγμα, αν ο μέσος όρος του ύψους ενός τυχαίου δείγματος 60 ανδρών μ είναι ίσος με μ 0 =174 εκατοστά (test2) Η 0 : Μηδενική υπόθεση µ=µ 0 έναντι της Η α : Εναλλακτικής υπόθεσης µ µ 0 Η κατάλληλη δοκιμασία σε αυτή την περίπτωση είναι το One sample t-test, όταν ισχύει η προϋπόθεση της κανονικότητας της μεταβλητής µας. SPSS: Analyze Compare Means One sample t test και δηλώνουμε την τιμή ελέγχου µ 0 (test value). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 28

29 Αποτελέσματα One-Sample Statistics N Mean Std. Deviation Std. Error Mean ypsos ,6683 3,01749,38956 One-Sample Test Ο πρώτος πίνακας περιέχει την τιμή του μέσου, της τυπικής απόκλισης, της τυπικής απόκλισης του μέσου (τυπικό σφάλμα του μέσου) και το μέγεθος του δείγματος Test Value = % Confidence Interval of the Difference t df Sig. (2-tailed) Mean Difference Lower Upper ypsos 1,716 59,091, ,1112 1,4478 Η πρώτη στήλη του πίνακα περιέχει την ονομασία της μεταβλητής, Η δεύτερη στήλη περιέχει την τιμή του t (1,716) τεστ για αυτή τη μεταβλητή, η οποία χρησιμοποιήθηκε για να υπολογιστεί η p-value (0,091) (Sig. (2-tailed)). Η στήλη δίπλα από την p-value περιέχει τη διαφορά ανάμεσα στην τιμή της μηδενικής υπόθεσης (174) και στη μέση τιμή της μεταβλητής. Οι επόμενες δύο στήλες περιέχουν ένα 95% διάστημα εμπιστοσύνης για αυτή τη διαφορά. Το επίπεδο στατιστικής σημαντικότητας είναι ίσο με 0,091. Εφόσον είναι μεγαλύτερο του 0,05, καταλήγουμε στο συμπέρασμα ότι δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση ότι ο πραγματικός μέσος είναι ίσος με 174. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 29

30 Σταδιακή ανάλυση Ερευνητικό ερώτημα: «Ο μέσος όρος του ύψους ενός δείγματος 60 ανδρών διαφέρει από 174 εκατοστά (μ 0)» ΒΗΜΑ 1 ο : Γράφουμε τη μηδενική υπόθεση, η οποία είναι αντίθετη με το ερευνητικό ερώτημα: Η 0 : μ = μ 0 ή Η 0 : μ - μ 0 =0 Όπου μ, ο μέσος όρος του δείγματος και μ 0 ο αριθμός που θέλουμε να ερευνήσουμε αν διαφέρει από τον μέσο όρο. ΒΗΜΑ 2 ο : Γράφουμε την εναλλακτική υπόθεση, η οποία είναι αντίθετη με τη μηδενική και περίπου ίδια με το ερευνητικό ερώτημα: Η a : μ μ 0 ή Η a : μ - μ 0 0 ΒΗΜΑ 3ο: Ορίζουμε το επίπεδο στατιστικής σημαντικότητας (α): α = 0,05 ΒΗΜΑ 4 ο : Βρίσκουμε την πιθανότητα (p) να είναι ο μέσος του δείγματος να είναι διαφορετικός από την ελεγχόμενη τιμή, «κατά λάθος» ΒΗΜΑ 5 ο : Συγκρίνομε την πιθανότητα p με το α. Αν p > α αποτυγχάνομε να απορρίψομε τη μηδενική υπόθεση και συμπεραίνομε ότι δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ του μέσου όρου και της συγκρινόμενης τιμής Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 30

31 Έλεγχος της μέσης τιμής - Μη παραμετρικό Τεστ Το αντίστοιχο μη παραμετρικό τεστ καλείται έλεγχος των προσημασμένων τάξεων μεγέθους του Wilcoxon για τη διάμεσο ενός πληθυσμού. Επειδή βασίζεται στις τάξεις μεγέθους των παρατηρήσεων και όχι στις παρατηρήσεις αυτές κάθε αυτές δε χρειάζεται καμία προϋπόθεση ως προς την κατανομή των παρατηρήσεων. Αυτό ισχύει για όλα τα μη παραμετρικά τεστ που θα δούμε. Ο έλεγχος όμως εδώ βασίζεται στη διάμεσο και όχι στο μέσο του δείγματος. Αυτό βέβαια δε σημαίνει ότι αυτού του είδους τα τεστ είναι χαμηλότερης αξιοπιστίας σε σύγκριση με τα παραμετρικά. Απεναντίας, σε πολλές περιπτώσεις είναι πιο ισχυρά. Γενικά όμως η ισχύς τους πλησιάζει πάρα πολύ των ισχύ των κλασικών παραμετρικών τεστ. Αυτός είναι και ο λόγος που η μόνη προϋπόθεση που χρειάζεται είναι η συμμετρία της κατανομής. Ένα πλεονέκτημα όμως των μη παραμετρικών ελέγχων που θα εξεταστούν είναι ότι εφαρμόζονται και στις περιπτώσεις που οι μεταβλητές είναι ποιοτικές διατεταγμένης κλίμακας (καλό, καλύτερο, πολύ καλό). Σε αυτήν την περίπτωση οι μέθοδοι ελέγχων υποθέσεων που θα δούμε είναι από τις πιο ισχυρές μεθόδους που υπάρχουν Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 31

32 Έλεγχος της μέσης τιμής - Μη παραμετρικό Τεστ Ο έλεγχος όμως αυτός δεν προσφέρεται από το SPSS μέσω του μενού επιλογών, για αυτό θα πρέπει να γίνει μία διεργασία πρώτα. Η διεργασία έχει ως εξής: θα περάσουμε σε μία νέα στήλη την τιμή την οποία θέλουμε να ελέγξουμε τόσες φορές, όσες και οι παρατηρήσεις της μεταβλητής στην οποία θέλουμε να κάνουμε τον έλεγχο υπόθεσης. Επομένως θέλοντας να ελέγξουμε με ένα μη παραμετρικό τεστ αν ο μέσος όρος του ύψους ενός τυχαίου δείγματος 60 ανδρών μ είναι ίσος με μ 0 =174 εκατοστά στο αρχείο test2 θα προσθέσουμε μια νέα μεταβλητή (π.χ. Diam) που θα περιέχει την τιμή 174, 60 φορές, όσες δηλαδή είναι και οι παρατηρήσεις του δείγματος υπό εξέταση Επιλέγουμε από το μενού εντολών τα εξής: Analyze Nonparamteric Tests 2 Related Samples Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 32

33 Αποτελέσματα Η επιλογή Options μας επιτρέπει να εμφανίσουμε και κάποια περιγραφικά μέτρα. Η μία μεταβλητή θα είναι η στήλη της οποίας τη διάμεσο ελέγχουμε και η άλλη μεταβλητή η στήλη με την τιμή την οποία ελέγχουμε (174 για το παράδειγμα) Από τα αποτελέσματα του ελέγχου μας ενδιαφέρει Test Statistics b diam - ypsos Z -1,684 a Asymp. Sig. (2-tailed),092 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test κυρίως η γραμμή της Asymp. Sig. (2-tailed). Η τιμή p-value που υπολογίζεται μέσω του τεστ είναι 0,092. Αφού είναι μεγαλύτερη του 0,05, οδηγούμαστε στο συμπέρασμα ότι δεν μπορούμε να απορρίψουμε την μηδενική υπόθεση. Δηλαδή η διάμεσος του δείγματος δεν διαφέρει στατιστικά σημαντικά από την τιμή που ελέγξαμε (174). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 33

34 Σύγκριση των μέσων τιμών μίας μεταβλητής Παραμετρικό Τεστ Σύγκριση των μέσων τιμών μίας μεταβλητής σε δύο ανεξάρτητα δείγματα (έλεγχος µ 1 =µ 2 ) Πολλές φορές θέλουμε να ελέγξουμε, αν η μέση τιμή μιας ποσοτικής μεταβλητής διαφέρει σε δύο ανεξάρτητα δείγματα. Για παράδειγμα, αν το μέσο ύψος του δείγματος των 60 ανδρών (test2) του προηγούμενου παραδείγματος διαφέρει από το μέσο ύψος ενός νέου δείγματος 40 γυναικών (test 3). Μηδενική υπόθεση: µ 1 =µ 2 έναντι της Εναλλακτικής υπόθεσης: µ 1 µ 2 Η κατάλληλη δοκιμασία σε αυτή την περίπτωση είναι το Independent Samples t-test, αρκεί να ισχύουν οι προϋποθέσεις: Α) και οι δυο να κατανέμονται κανονικά Β) οι διασπορές τους να µην απέχουν πολύ. Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουμε σε µη παραμετρικό τεστ. SPSS: Analyze Compare Means Independent Samples t-test και δηλώνουμε την μεταβλητή που ξεχωρίζει τα δύο ανεξάρτητα δείγματα (grouping variable) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 34

35 Διαδικασία Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 35

36 Αποτελέσματα Group Statistics sex N Mean Std. Deviation Std. Error Mean ypsos man ,6683 3,01749,38956 woman ,3200 3,38179,53471 Ο πρώτος πίνακας περιέχει κάποια περιγραφικά μέτρα για τα δύο δείγματα. Ο δεύτερος πίνακας είναι αυτός που μας ενδιαφέρει. Το t τεστ έχει δύο κατευθύνσεις. Η μία κατεύθυνση είναι αυτή που δεν μπορούμε να υποθέσουμε ότι οι διακυμάνσεις των δύο δειγμάτων είναι περίπου ίσες και αυτή που μπορούμε να υποθέσουμε ότι είναι ίσες. Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means ypsos Equal variances assumed Equal variances not assumed F Sig. t df Sig. (2- tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper,320,573-2,555 98,012-1,65167, , , ,497 77,041,015-1,65167, , ,33434 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 36

37 Αποτελέσματα ypsos Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances Independent Samples Test F Sig. t df Sig. (2- tailed) t-test for Equality of Means Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper,320,573-2,555 98,012-1,65167, , , ,497 77,041,015-1,65167, , ,33434 Το τεστ του Levene ελέγχει την υπόθεση της ισότητας των δύο διακυμάνσεων και υπολογίζει μία p-value. Αν η p-value είναι μικρότερη του 0,05, απορρίπτεται η υπόθεση της ισότητας των διακυμάνσεων. Στην αντίθετη περίπτωση δεν απορρίπτεται. Επομένως, ανάλογα με την p-value (Sig.) του τεστ του Levene, κοιτάζουμε την πρώτη ή τη δεύτερη γραμμή αποτελεσμάτων. Στην προκειμένη περίπτωση η p-value είναι μεγαλύτερη του 0,05, άρα μπορούμε να υποθέσουμε ισότητα των δύο διακυμάνσεων. Επομένως θα κοιτάξω τη πρώτη γραμμή αποτελεσμάτων του πίνακα. Συνεχίζουμε λοιπόν με την πρώτη γραμμή της ανάλυσης που αφορά equal variances και έχουμε σύμφωνα με το p-value την απόρριψη της Η 0 : μ1 μ2 = 0 σε ε.σ. a = 0,05 (0,012 < 0,05). Δηλαδή φαίνεται ότι υπάρχει στατιστικά σημαντική διαφορά στα μέσα ύψη των δυο πληθυσμών. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 37

38 Σταδιακή ανάλυση Ερευνητικό ερώτημα: «Υπάρχει διαφορά στο ύψος μεταξύ των ανδρών και των γυναικών του δείγματος» ΒΗΜΑ 1 ο : Γράφουμε τη μηδενική υπόθεση, η οποία είναι αντίθετη με το ερευνητικό ερώτημα: Η 0 : μ α = μ γ ή Η 0 : μ α - μ γ =0 Όπου μ α, ο μέσος όρος του ύψους των ανδρών και μ γ ο μέσος όρος του ύψους των γυναικών ΒΗΜΑ 2 ο : Γράφουμε την εναλλακτική υπόθεση, η οποία είναι αντίθετη με τη μηδενική και περίπου ίδια με το ερευνητικό ερώτημα: Η a : μ α μ γ ή Η a : μ α - μ γ 0 ΒΗΜΑ 3ο: Ορίζουμε το επίπεδο στατιστικής σημαντικότητας (α): α = 0,05 ΒΗΜΑ 4 ο : Βρίσκουμε την πιθανότητα (p) να είναι ο μέσος του δείγματος να είναι διαφορετικός από την ελεγχόμενη τιμή, «κατά λάθος» ΒΗΜΑ 5 ο : Συγκρίνομε την πιθανότητα p με το α. Αν p > α αποτυγχάνομε να απορρίψομε τη μηδενική υπόθεση και συμπεραίνομε ότι δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των συγκρινόμενων μέσων όρων. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 38

39 Σύγκριση των μέσων τιμών μίας μεταβλητής Μη Παραμετρικό Τεστ Το αντίστοιχο μη παραμετρικό ανάλογο του t τεστ είναι το τεστ των Mann-Whitney- Wilcoxon. Η διαδικασία την οποία πρέπει να κάνουμε για εκτελέσουμε αυτό το μη παραμετρικό τεστ είναι ίδια με προηγουμένως (συνένωση των δύο μεταβλητών σε μία στήλη κ.λ.π.). Οι υποθέσεις σε αυτήν την περίπτωση ορίζονται ως εξής: Η 0 : Οι άνδρες και οι γυναίκες δεν διαφέρουν ως προς το ύψος τους Η 1 : Οι άνδρες και οι γυναίκες διαφέρουν ως προς το ύψος τους Επιλέγουμε Analyze Nonparametric Tests 2 Independent Samples Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 39

40 Αποτελέσματα Test Statistics a ypsos Mann-Whitney U 818,500 Wilcoxon W 2648,500 Z -2,685 Asymp. Sig. (2-tailed),007 a. Grouping Variable: sex Μας ενδιαφέρει κυρίως η γραμμή της Asymp. Sig. (2-tailed). Η τιμή p-value που υπολογίζεται μέσω του τεστ είναι 0,007. Αφού είναι μικρότερη του 0,05 οδηγούμαστε στο συμπέρασμα ότι μπορούμε να απορρίψουμε την μηδενική υπόθεση. Δηλαδή ότι ο μέσος όρος του ύψους των ανδρών διαφέρει με στατιστικά σημαντικό τρόπο από τον μέσο όρο του ύψους των γυναικών Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 40

41 Σύγκριση των μέσων τιμών δύο εξαρτημένων δειγμάτων Παραμετρικό Τεστ Είδαμε πως να κάνουμε έλεγχο υποθέσεων για δύο ανεξάρτητα δείγματα. Τι γίνεται όμως όταν τα δύο δείγματα δεν είναι, ή δεν μπορούμε να υποθέσουμε ότι είναι ανεξάρτητα; Την απάντηση τη δίνουν το t τεστ για ζεύγη παρατηρήσεων και ο έλεγχος των προσημασμένων τάξεων μεγέθους του Wilcoxon για δείγμα ζευγών παρατηρήσεων. Κλασικό παράδειγμα εφαρμογής των δύο αυτών τεστ είναι στην ιατρική, όταν έχουμε μετρήσεις για κάποια άτομα πριν και μετά από μία δίαιτα και ενδιαφερόμαστε να δούμε κατά πόσο ήταν αποτελεσματική η δίαιτα ή όχι. Και τις δύο φορές μετρήσαμε το βάρος των ίδιων ατόμων. Άρα γίνεται σαφές ότι τα μεγέθη των δύο δειγμάτων πρέπει να είναι απαραίτητα ίσα. Παράδειγμα : Για τον έλεγχο της αποτελεσματικότητας ενός σκευάσματος που καταπολεμά την παχυσαρκία, χορηγήθηκε συγκεκριμένη ποσότητά του σε 20 κατάλληλα πειραματόζωα. Σε καθένα από αυτά καταγράφηκε το βάρος του αμέσως πριν και μια εβδομάδα μετά την χορήγηση του σκευάσματος (test5). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 41

42 Διαδικασία Αποτελέσματα Για το t τεστ εργαζόμαστε ως εξής: επιλέγουμε Analyze Compare Means Paired - Samples T Test Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 prin 80, , ,23107 meta 79, , ,12201 Ο πρώτος πίνακας (Paired Samples Statistics) περιέχει το μέγεθος των δειγμάτων, τους μέσους, τις τυπικές αποκλίσεις των μέσων και τις τυπικές αποκλίσεις κάθε δείγματος. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 42

43 Διαδικασία Αποτελέσματα Paired Samples Correlations N Correlation Sig. Pair 1 prin & meta 20,824,000 Τα δεδομένα που χρησιμοποιήθηκαν στο παράδειγμα προέρχονται από μέτρηση του βάρους 20 πειραματόζωων που χρησιμοποιήθηκαν για τον έλεγχο της αποτελεσματικότητας ενός σκευάσματος που καταπολεμά την παχυσαρκία πριν και μετά την χορήγηση του. Πρόκειται δηλαδή για τα ίδια πειραματόζωα γεγονός που είναι εύλογο να υποθέσουμε εξάρτηση μεταξύ των δύο μετρήσεων του βάρους. Ο πίνακας (Paired Samples Correlations) επιβεβαιώνει την υπόθεση αυτή. Ο συντελεστής γραμμικής συσχέτισης που υπολογίστηκε έχει υψηλή τιμή, φανερώνοντας υψηλή γραμμική συσχέτιση μεταξύ των δύο μετρήσεων. Το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας για τον έλεγχο της υπόθεσης ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ των δύο μετρήσεων βάρους είναι ίσο με 0, γεγονός που σημαίνει ότι ο συντελεστής γραμμικής συσχέτισης είναι στατιστικά σημαντικός Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 43

44 Διαδικασία Αποτελέσματα Η τελευταία στήλη του παραπάνω πίνακα περιέχει το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας, το οποίο είναι ίσο με 0,02 Αφού είναι μικρότερο του 0,05 συμπεραίνουμε ότι οι μέσοι των δύο μετρήσεων του βάρους πριν και μετά την χορήγηση του σκευάσματος διαφέρουν με στατιστικά σημαντικό τρόπο. Επομένων το σκεύασμα έφερε τα επιδιωκόμενα αποτελέσματα. Paired Samples Test Paired Differences Std. Std. Error 95% Confidence Interval of the Difference Mean Deviation Mean Lower Upper t df Sig. (2-tailed) Pair 1 prin - meta 1,78 3,15,70548, , ,530 19,020 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 44

45 Σύγκριση των μέσων τιμών δύο εξαρτημένων δειγμάτων Μη Παραμετρικό Τεστ Το t τεστ όμως προϋποθέτει κανονικότητα των δεδομένων αν και αυτό το πρόβλημα μπορεί να ξεπεραστεί. Το αντίστοιχο μη παραμετρικό τεστ του Wilcoxon εκτελείται στο SPSS επιλέγοντας τα εξής: Analyze Nonparametric Tests 2 Related Samples Test Statistics b meta - prin Z -2,278 a Asymp. Sig. (2-tailed),023 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test Μας ενδιαφέρει κυρίως η γραμμή της Asymp. Sig. (2-tailed). Η τιμή p-value που υπολογίζεται μέσω του τεστ είναι 0,023. Αφού είναι μικρότερητου 0,05, οδηγούμαστε στο συμπέρασμα ότι μπορούμε να απορρίψουμε την μηδενική υπόθεση. Δηλαδή συμπεραίνουμε ότι οι μέσοι των δύο μετρήσεων του βάρους πριν και μετά την χορήγηση του σκευάσματος διαφέρουν με στατιστικά σημαντικό τρόπο Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 45

46 Συντελεστές γραμμικής συσχέτισης Οι συντελεστές που θα εξετάσουμε αναφέρονται στη γραμμικής φύσεως σχέση που μπορεί να συνδέει τις δύο μεταβλητές. Οι τιμές που μπορεί να πάρει ένας συντελεστής συσχέτισης είναι από -1 έως +1. Αρνητικές τιμές του συντελεστή γραμμικής συσχέτισης δύο μεταβλητών σημαίνει ότι έχουμε την ύπαρξη αρνητικής γραμμικής συσχέτισης. Δηλαδή, οι μεγαλύτερες τιμές της μίας μεταβλητής τείνουν να αντιστοιχούν στις μικρότερες τιμές της άλλης μεταβλητής. Θετικές τιμές του συντελεστή γραμμικής συσχέτισης είναι ένδειξη θετικής γραμμικής συσχέτισης μεταξύ των δύο μεταβλητών. Δηλαδή, οι μεγαλύτερες τιμές της μίας μεταβλητής τείνουν να αντιστοιχούν στις μεγαλύτερες τιμές της άλλη μεταβλητής. Τιμές κοντά στο μηδέν αποτελούν ένδειξη ότι δεν υπάρχει στατιστικά σημαντική γραμμική συσχέτιση μεταξύ των δύο μεταβλητών. Όσο πιο μεγάλες είναι οι τιμές του συντελεστή, ή όσο πιο κοντά βρίσκονται στη μονάδα (σε απόλυτη τιμή πάντα), τόσο πιο ισχυρή είναι η γραμμική συσχέτιση μεταξύ τους. Οι πιο γνωστοί συντελεστές γραμμικής συσχέτισης είναι οι συντελεστές του Pearson, του Spearman και του Kendall. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 46

47 Συντελεστές γραμμικής συσχέτισης Η μηδενική και η εναλλακτική υπόθεση εδώ είναι οι εξής: Η 0 : ρ=0 ή δεν υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών Η1: ρ 0 ή υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών Ο συντελεστής συσχέτισης του Pearson χρειάζεται την υπόθεση της κανονικότητας των δεδομένων, σε αντίθεση με τους άλλους δύο που δεν χρειάζονται την υπόθεση της κανονικότητας των δεδομένων. Βέβαια, για μεγάλα δείγματα, μεγέθους 30 παρατηρήσεων και πάνω και όσο το μέγεθος του δείγματος μεγαλώνει η θεωρία μας λέει ότι οι τιμές των συντελεστών πλησιάζουν η μία την άλλη. Η κύρια διαφορά των συντελεστών είναι ότι ο συντελεστής του Pearson υπολογίζεται με βάση τα δεδομένα, ενώ οι άλλοι δύο υπολογίζονται με βάση τις τάξεις μεγέθους των δεδομένων. Ειδικότερα, ο συντελεστής του Spearman είναι ο συντελεστής του Pearson στην ουσία υπολογισμένος για τις τάξεις μεγέθους των δεδομένων. Το γεγονός λοιπόν ότι οι συντελεστές του Spearman και του Kendall υπολογίζονται με βάση τις τάξεις μεγέθους των δεδομένων είναι που επιτρέπει την ελευθερία ως προς τη μη ικανοποίηση της κανονικότητας των μεταβλητών. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 47

48 Συντελεστές γραμμικής συσχέτισης Για να υπολογίσουμε τους τρεις αυτούς συντελεστές συσχέτισης στο SPSS επιλέγουμε τα εξής: Analyze Correlate Bivariate Στο κουτάκι variables πρέπει να περάσουμε τουλάχιστον δύο μεταβλητές, διότι οι συντελεστές συσχέτιση υπολογίζονται για ζεύγη μεταβλητών. Οπότε αν περάσουμε περισσότερες από δύο μεταβλητές, θα υπολογιστούν οι συντελεστές γραμμικής συσχέτισης για όλα τα ζεύγη των μεταβλητών. Βλέπουμε ότι μόνο ο συντελεστής του Pearson είναι επιλεγμένος. Αν θέλουμε να εμφανιστούν και οι άλλοι δύο συντελεστές απλά τους επιλέγουμε. Η επιλογή Options μας δίνει τη δυνατότητα εμφάνισης των μέσων, των τυπικών αποκλίσεων και των πληθών των τιμών για κάθε μεταβλητή. Παρατηρήστε ότι στο κάτω αριστερό μέρος του παραθύρου είναι επιλεγμένη μία επιλογή (Flag significant correlations). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 48

49 Συντελεστές γραμμικής συσχέτισης - Αποτελέσματα Correlations chol drug chol Pearson Correlation 1,000,354 ** Sig. (2-tailed),006 N drug Pearson Correlation,354 ** 1,000 Sig. (2-tailed),006 N **. Correlation is significant at the 0.01 level (2-tailed). Correlations chol drug Spearman's rho chol Correlation Coefficient 1,000,357 ** Sig. (2-tailed).,005 N drug Correlation Coefficient,357 ** 1,000 Sig. (2-tailed),005. N **. Correlation is significant at the 0.01 level (2-tailed). Βλέπουμε ότι για όλες τις τιμές των συντελεστών γραμμικής συσχέτισης υπάρχουν δύο αστεράκια. Αυτό γίνεται μέσω της επιλογής Flag significant correlations. Κάτω από κάθε τιμή του συντελεστή συσχέτισης εμφανίζεται μία p-value (Sig. (2-tailed)). Η p-value που έχει υπολογιστεί για κάθε συντελεστή ξεχωριστά και αναφέρεται στον έλεγχο της υπόθεσης ότι στο συγκεκριμένο ζεύγος μεταβλητών δεν υπάρχει γραμμική συσχέτιση. Αφού το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας είναι μικρότερο του 0,05, συμπεραίνουμε ότι αυτή η υπόθεση απορρίπτεται σε α=0,05. Άρα υπάρχει στατιστικά σημαντική γραμμική συσχέτιση μεταξύ του ζεύγους. Στην περίπτωση που η p-value είναι μικρότερη του 0,01, τότε ο συντελεστής συσχέτισης εμφανίζεται με δύο αστεράκια αντί για μόνο ένα. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 49

50 Συντελεστές γραμμικής συσχέτισης - Αποτελέσματα Σε αυτό το σημείο καλό θα ήταν να αναφέρουμε ότι ο συντελεστής του Kendall μπορεί να χρησιμοποιηθεί και στην περίπτωση που έχουμε κατηγορικές μεταβλητές οι οποίες όμως είναι υποχρεωτικά σε κλίμακα διάταξης. Είναι δηλαδή διατακτικές κατηγορικές μεταβλητές. Ακόμα να αναφέρουμε ότι με το συντελεστή γραμμικής συσχέτισης ελέγχουμε αν σε ένα ζεύγος μεταβλητών υπάρχει γραμμική συσχέτιση μόνο. Δηλαδή μπορεί να υπάρχει συσχέτιση μεταξύ των δύο μεταβλητών, αλλά όχι γραμμικής φύσεως. Σε αυτήν την περίπτωση αυτή η σχέση που συνδέει τις δύο μεταβλητές δεν μπορεί να ανιχνευτεί με το συντελεστή γραμμικής συσχέτισης. Οπότε προσοχή στην ερμηνεία που δίνουμε στο συντελεστή συσχέτισης. Να υπενθυμίσουμε επίσης ότι η λογική με την οποία απορρίπτουμε ή όχι μία υπόθεση είναι πάντα η ίδια. Αν το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας είναι μικρότερο του 0,05 η υπόθεση απορρίπτεται. Στην αντίθετη περίπτωση δεν απορρίπτεται Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 50

51 Έλεγχος F Ο έλεγχος F χρησιμοποιείται για τα στατιστικά των οποίων η δειγματοληπτική κατανομή ακολουθεί την κατανομή F. Η ανάλυση διακύμανσης χρησιμοποιείται επίσης για να εξεταστεί η υπόθεση ότι οι μέσοι όροι μιας μέτρησης (εξαρτημένη μεταβλητή, ποσοτική) δεν διαφέρουν μεταξύ ομάδων που δημιουργεί μια ανεξάρτητη μεταβλητή (ποιοτική). Η ανάλυση αυτή είναι κατ ουσία μία επέκταση του τεστ ανεξαρτησίας αφού συμπεριλαμβάνει στην ανάλυση περισσότερες των δύο ομάδες τις τιμές της ανεξάρτητης μεταβλητής. Τα στατιστικά τα οποία ακολουθούν την κατανομή F και θα παρουσιασθούν εδώ είναι: Η διαφορά μεταξύ περισσοτέρων των δύο αριθμητικών μέσων Η διαφορά μεταξύ πολλαπλών μετρήσεων Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 51

52 Η Διαδικασία του Ελέγχου Στατιστικής Σημαντικότητας της Διαφοράς Μεταξύ Πολλών Αριθμητικών Μέσων (Ομάδων) Έλεγχος F (ANOVA) Το ερευνητικό ερώτημα: «Υπάρχει διαφορά στην μέτρηση της χοληστερίνης μεταξύ του δείγματος που λαμβάνουν διαφορετική ποσότητα φαρμάκου (η δοσολογία φαρμάκου χωρίζει το δείγμα σε πέντε κατηγορίες). ΒΗΜΑ 1 ο : Γράφουμε τη μηδενική υπόθεση η οποία είναι αντίθετη με το ερευνητικό ερώτημα: Η 0 : μ 0 = μ 1 = μ 2 = μ 3 = μ 4 (δεν υπάρχει διαφορά) όπου μ 0 : ο μέσος όρος των ανθρώπων που λαμβάνουν καθόλου φάρμακο, μ 1 : ο μέσος όρος που λαμβάνουν λίγο φάρμακο, μ 2, μ 3, μ 4 ΒΗΜΑ 2 ο : Γράφομε την εναλλακτική υπόθεση, η οποία είναι αντίθετη με τη μηδενική και περίπου ίδια με το ερευνητικό ερώτημα: Η a : μ 0 = μ 1 = μ 2 = μ 3 = μ 4 δεν ισχύει (υπάρχει διαφορά) ΒΗΜΑ 3 ο : Ορίζομε το επίπεδο στατιστικής σημαντικότητας (α): α = 0,05 ΒΗΜΑ 4 ο : Βρίσκομε την πιθανότητα (p) να υπάρχει διαφορά, «κατά λάθος». ΒΗΜΑ 5 ο : Συγκρίνομε την πιθανότητα p με το α. Αν p < α απορρίπτουμε τη μηδενική υπόθεση και συμπεραίνομε ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των μέσων ορών Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 52

53 Ανάλυση διακύμανσης (διασποράς) κατά ένα παράγοντα (One-way Anova). Από τα μενού analyze, compare means και One-Way ANOVA. Στη θέση factor ο χρήστης τοποθετεί την ανεξάρτητη χωρίς να χρειάζεται ο ορισμός των τιμών των ομάδων. ANOVA chol Sum of Squares Df Mean Square F Sig. Between Groups 17624, ,685 2,686,055 Within Groups , ,831 Total , Η πρώτη στήλη του πίνακα (Sum of Squares) αναφέρεται στο άθροισμα τετραγώνων μεταξύ των ομάδων, στο άθροισμα τετραγώνων εντός των ομάδων και τέλος στο σύνολο των ανωτέρω. Στη δεύτερη στήλη εμφανίζονται βαθμοί ελευθερίας μεταξύ των ομάδων (k-1) δηλαδή εδώ 2, οι βαθμοί ελευθερίας για το σύνολο των παρατηρήσεων (cases) και τέλος οι βαθμοί ελευθερίας που αντιστοιχούν στην μεταβλητότητα εντός των ομάδων. Στη τρίτη στήλη εμφανίζονται τα μέσα τετράγωνα (mean square) που προέρχονται από διαιρέσεις των αθροισμάτων τετραγώνων με τους βαθμούς ελευθερίας και η διαίρεση των οποίων δίνει το στατιστικό F με το επίπεδο σημαντικότητας στην τελευταία στήλη. Στην προκειμένη περίπτωση δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων (p>0,05). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 53

54 One-way Anova Η ανάλυση αυτή μας δίνει μια γενική αλλά όχι πλήρη απάντηση. Η στατιστική σημαντικότητα μέχρι εδώ υποδηλώνει ότι δεν υπάρχουν στατιστικά σημαντικές διαφορές αλλά δεν μας λέει ούτε πόσες ούτε ποιες διαφορές δεν είναι στατιστικά σημαντικές. Για να πάρομε τις λεπτομερείς αυτές πληροφορίες πρέπει να κάνουμε ένα ακόμη βήμα. Πριν πατήσομε OK στο προηγούμενο πλαίσιο διαλόγου, πατούμε το κουμπί Post Hoc και στο πλαίσιο που ανοίγει επιλέγομε έναν από τους ελέγχους Πολλαπλών Συγκρίσεων (Multiple Comparisons) που παρουσιάζονται, όπως φαίνεται στην παρακάτω εικόνα. Εδώ επιλέγουμε τον έλεγχο Bonferonni Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 54

55 One-way Anova - Αποτελέσματα Chol Bonferroni Multiple Comparisons (I) drug (J) drug Mean Dif Std. Error Sig. καθόλου ελάχιστη 95% Confidence Interval Lower Bound Upper Bound ελάχιστη -17, , ,000-61, ,5194 μικρή -29, ,09530,661-78, ,1203 μέτρια -45,71373 * 16,56580,047-91,0248 -,4026 καθόλου 17, , ,000-26, ,2252 μικρή -12, , ,000-61, ,4732 μέτρια -28, ,56580,555-73, ,9503 καθόλου 29, ,09530,661-20, ,8690 μικρή ελάχιστη 12, , ,000-37, ,5160 μέτρια -16, , ,000-67, ,4350 καθόλου 45,71373 * 16,56580,047, ,0248 μέτρια ελάχιστη 28, ,56580,555-16, ,6719 μικρή 16, , ,000-34, ,1138 *. The mean difference is significant at the 0.05 level. Όπως φαίνεται στον πίνακα (από τις τιμές των p) υπάρχουν στατιστικά σημαντικές διαφορές μόνο μεταξύ της ομάδας που παίρνει καθόλου δόση φαρμάκου και της ομάδας που παίρνει μέτρια δόση φαρμάκου ενώ μεταξύ των υπόλοιπων ομάδων δεν υπάρχουν στατιστικά σημαντικές διαφορές. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 55

56 Έλεγχος χ2 Ο έλεγχος που χρησιμοποιείται για τις σχέσεις μεταξύ δύο ή περισσότερων ονομαστικών ή και τακτικών μεταβλητών είναι γνωστός ως έλεγχος χ 2 (Chi Square). Αν και υπάρχουν επί μέρους στατιστικοί έλεγχοι για τα διάφορα μέτρα συνάφειας, ο έλεγχος χ 2 είναι ένας γενικός έλεγχος που μπορεί να χρησιμοποιηθεί για όλες τις περιπτώσεις που μπορούμε να φτιάξομε ένα πίνακα διμεταβλητών συχνοτήτων (CROSS-TABS), δηλαδή για όλες σχεδόν τις συνάφειες μη ισοδιαστημικών μεταβλητών. Η απαιτούμενη κλίμακα μέτρησης των μεταβλητών είναι η ονομαστική, παρόλο που και μεταβλητές με διατακτική κλίμακα μπορούν να χρησιμοποιηθούν. Ο Χ 2 έλεγχος ανεξαρτησίας χρησιμοποιείται για τον έλεγχο της υπόθεσης ότι δύο κατηγορικές μεταβλητές είναι ανεξάρτητες μεταξύ τους. Οι κατηγορικές μεταβλητές μπορούν να έχουν οσαδήποτε επίπεδα (ή κατηγορίες), αρκεί βέβαια η κάθε μία να έχει τουλάχιστον δύο επίπεδα. Το SPSS, όταν υπολογίζομε τους συντελεστές συσχετισμού (φ, λ κ.ά.), δίνει και το p που αντιστοιχεί στο καθένα στην τελευταία στήλη κάτω από την ένδειξη Approximate Significance. Για τον έλεγχο στατιστικής σημαντικότητας του κάθε συντελεστή, δεν έχομε παρά να συγκρίνομε το p με το α. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 56

57 Παράδειγμα Έχουμε ταξινομήσει ένα δείγμα 419 γυναικών ανάλογα με το αν πάσχουν από κατάθλιψη και αν είχαν κάποια τραυματική εμπειρία στη ζωή τους. Το ερώτημα είναι αν υπάρχει εξάρτηση μεταξύ της τραυματικής εμπειρίας και της κατάθλιψης. Κατάθλιψη Τραυματική Εμπειρία Όχι (0) Ναι (1) Σύνολο Όχι (0) Ναι (1) Σύνολο Η μηδενική υπόθεση είναι πάντα αυτή που δεν υποθέτει εξάρτηση (υποθέτει ανεξαρτησία μεταξύ των μεταβλητών). Η προϋπόθεση που απαιτείται από τον Χ 2 έλεγχο ανεξαρτησίας είναι οι συχνότητες των κελιών να είναι τουλάχιστον ίσες με 5. To SPSS χρησιμοποιεί το άλλο είδος υπόθεσης που θέλει τις αναμενόμενες συχνότητες των κελιών να είναι τουλάχιστον ίσες με 5. Ένα αποδεκτό ποσοστό κελιών που θα έχουν συχνότητες μικρότερες του 5 είναι το 25%, δηλαδή το πολύ ένα στα τέσσερα κελιά να έχει μία τιμή μικρότερη του 5 χωρίς να μειώνεται σημαντικά η αποτελεσματικότητα του τεστ. Αυτό ισχύει βέβαια και για πίνακες που έχουν περισσότερα κελιά. Αν αυτή η υπόθεση δεν ικανοποιείται, τότε κοιτάζουμε την p-value που υπολογίζεται με βάση το ακριβές τεστ του Fisher Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 57

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Άσκηση 1 η Ένας παραγωγός σταφυλιών ισχυρίζεται ότι τα κιβώτια σταφυλιών που συσκευάζει

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα ΚΕΦΑΛΑΙΟ ΕΚΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Στο κεφάλαιο αυτό θα ασχοληθούμε με τον έλεγχο της υπόθεσης της ισότητα δύο μέσων τιμών με εξαρτημένα δείγματα. Εξαρτημένα

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα) Όταν απαιτείται ο έλεγχος της ύπαρξης στατιστικά σημαντικών

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο ανεξάρτητα δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,..., Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ )

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,...,Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ ) S σ Τ ( Χ,Y)

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ. ΣΤ. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (ANALYSIS OF VARIANCE - ANOVA) ΣΤ 1. Ανάλυση ιασποράς κατά µία κατεύθυνση. Όπως έχουµε δει στη παράγραφο Β 2, όταν θέλουµε να ελέγξουµε, αν η µέση τιµή µιας ποσοτικής µεταβλητής διαφέρει

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ ΕΚΤΟ

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2010-2011 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.sch.gr/abouras

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Σε ορισμένες περιπτώσεις απαιτείται ο έλεγχος της ύπαρξης στατιστικά

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα Θέλοντας να εξετάσουμε τις μέσες τιμές δύο πληθυσμών πρέπει να διακρίνουμε κατά τα γνωστά από τη θεωρία δύο περιπτώσεις

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο δειγμάτων, που διαχωρίζονται βάσει δύο ανεξάρτητων παραγόντων (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς περισσότερους

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ

Διαβάστε περισσότερα

1991 US Social Survey.sav

1991 US Social Survey.sav Παραδείγµατα στατιστικής συµπερασµατολογίας µε ένα δείγµα Στα παραδείγµατα χρησιµοποιείται απλό τυχαίο δείγµα µεγέθους 1 από το αρχείο δεδοµένων 1991 US Social Survey.sav Το δείγµα λαµβάνεται µε την διαδικασία

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα) Όπως αναφέρθηκε στο προηγούμενο κεφάλαιο σε ορισμένες

Διαβάστε περισσότερα

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 4ο Κατανομές Στατιστικών Συναρτήσεων Δείγμα από κανονική κατανομή Έστω Χ= Χ Χ Χ τ.δ. από Ν µσ τότε ( 1,,..., n) (, ) Τ Χ Χ Ν Τ Χ σ σ Χ Τ Χ n Χ S µ S µ 1( ) = (0,1), ( ) = ( n 1)

Διαβάστε περισσότερα

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής Κεφάλαιο 3: Ανάλυση μιας μεταβλητής Γενικά Στο Κεφάλαιο αυτό θα παρουσιάσουμε κάποιες μεθόδους της Περιγραφικής Στατιστικής και της Στατιστικής Συμπερασματολογίας που αφορούν στην ανάλυση μιας μεταβλητής.

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ

Διαβάστε περισσότερα

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ ΚΕΦΑΛΑΙΟ ΤΕΤΑΡΤΟ Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή Έστω ένα τυχαίο δείγμα X,, 1 X n μεγέθους n από έναν πληθυσμό με μέση τιμή μ 2 και διακύμανση σ, άγνωστη.

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Περιεχόμενα Εισαγωγή Το πρόβλημα - Συντελεστής συσχέτισης Μοντέλο απλής γραμμικής παλινδρόμησης

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS Πανεπιστήμιο Θεσσαλίας-Τμήμα Πολιτικών Μηχανικών Εργαστήριο Κυκλοφορίας, Μεταφορών και Διαχείρισης Εφοδιαστικής Αλυσίδας Αντικείμενα διάλεξης Σύντομη εισαγωγή

Διαβάστε περισσότερα

Λυμένες Ασκήσεις για το μάθημα:

Λυμένες Ασκήσεις για το μάθημα: Λυμένες Ασκήσεις για το μάθημα: ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ ΚΩΝΣΤΑΝΤΙΝΟΣ ΖΑΦΕΙΡΟΠΟΥΛΟΣ Τμήμα: ΔΙΕΘΝΩΝ ΚΑΙ ΕΥΡΩΠΑΪΚΩΝ ΣΠΟΥΔΩΝ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δειγμάτων, που διαχωρίζονται βάσει ενός επαναλαμβανόμενου και ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για εξαρτημένα δείγματα ως προς δύο παράγοντες,

Διαβάστε περισσότερα

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στην Ανάλυση Ερευνητικών Δεδομένων στις Κοινωνικές Επιστήμες Με χρήση των λογισμικών IBM/SPSS και LISREL Ενότητα 5 η : Επαγωγική

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο εξαρτημένων δειγμάτων, που διαχωρίζονται βάσει ενός επαναλαμβανόμενου παράγοντα (Ανάλυση διακύμανσης για εξαρτημένα δείγματα ως

Διαβάστε περισσότερα

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Κεφάλαιο 14 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 1 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Παραµετρικό στατιστικό κριτήριο για τη µελέτη της επίδρασης µιας ανεξάρτητης µεταβλητής στην εξαρτηµένη Λογική παρόµοια

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Περιεχόμενα 1. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ...

Διαβάστε περισσότερα

Επαγωγική Στατιστική

Επαγωγική Στατιστική Στατιστικό πακέτο SPSS Επαγωγική Στατιστική users.auth.gr/agpapana/spss_stat_inference.pdf Παπάνα Αγγελική, ρ. papanagel@yahoo.gr, agpapana@gen.auth.gr Η επαγωγική στατιστική αποτελείται μία σειρά μεθόδων

Διαβάστε περισσότερα

T-tests One Way Anova

T-tests One Way Anova William S. Gosset Student s t Sir Ronald Fisher T-tests One Way Anova ΣΤΑΤΙΣΤΙΚΗ Νίκος Ζουρμπάνος Ρούσσος, Π.Λ., & Τσαούσης, Γ. (2002). Στατιστική εφαρμοσμένη στις κοινωνικές επιστήμες. Αθήνα: Ελληνικά

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Πολλαπλή Παλινδρόμηση Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Ανάλυση Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης Υπολογισμός

Διαβάστε περισσότερα

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στην Ανάλυση Ερευνητικών Δεδομένων στις Κοινωνικές Επιστήμες Με χρήση των λογισμικών IBM/SPSS και LISREL Ενότητα 3 η : Περιγραφική

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Περιλαμβάνει ένα σύνολο αριθμητικών και γραφικών μεθόδων, που μας επιτρέπουν να αποκτήσουμε μια πρώτη εικόνα για την κατανομή των τιμών της μεταβλητής

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στην Ανάλυση Ερευνητικών Δεδομένων στις Κοινωνικές Επιστήμες Με χρήση των λογισμικών IBM/SPSS και LISREL Ενότητα 7 η : Ανάλυση

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Στόχοι του κεφαλαίου Εξοικείωση με το περιβάλλον του SPSS Εξοικείωση με τις διαδικασίες περιγραφικής ανάλυσης μιας μεταβλητής Εξοικείωση με τη

Διαβάστε περισσότερα

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος Ανάλυση ποσοτικών δεδομένων ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος Εισαγωγή στη στατιστική Στατιστική: σύνολο αρχών και μεθοδολογιών που χρησιμοποιούνται για:

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα

Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα ΚΕΦΑΛΑΙΟ ΕΒΔΟΜΟ Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα Έστω Y,, j1 Yjn, j το πλήθος j = 1,..., k, k 2 τυχαία ανεξάρτητα δείγματα j μεγέθους n j από έναν

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4Β: Έλεγχοι Κανονικότητας Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Άδειες

Διαβάστε περισσότερα

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης ιαστήµατα εµπιστοσύνης και έλεγχοι υποθέσεων για τη µέση τιµή Για µια ποσοτική µεταβλητή

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ) Σε ορισμένες περιπτώσεις απαιτείται ο έλεγχος της ύπαρξης

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΕΦΑΛΑΙΟ 19 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Όταν ενδιαφερόμαστε να συγκρίνουμε δύο πληθυσμούς, η φυσιολογική προσέγγιση είναι να προσπαθήσουμε να συγκρίνουμε

Διαβάστε περισσότερα

$ι ιι η ι ι!η ηι ι ANOVA. To ANOVA ι ι ι η η η ιη (Analysis of Variance). * ι! ι ι ι ι ι η ιη. ;, ι ι ι! η ιι ηιη ι ι!η ι η η ιη ι ι η ι η.

$ι ιι η ι ι!η ηι ι ANOVA. To ANOVA ι ι ι η η η ιη (Analysis of Variance). * ι! ι ι ι ι ι η ιη. ;, ι ι ι! η ιι ηιη ι ι!η ι η η ιη ι ι η ι η. η &, 7!# v # $ι ιι η ι ι!η ηι ι ANOVA. To ANOVA ι ι ι η η η ιη (Analysis of Variance). * ι! ι ι ι ι ι η ιη. ;, ι ι ι! η ιι ηιη ι ι!η ι η η ιη ι ι η ι η. - ι% ιι* ι' F ι ι ι% MS F MS between within MS MS

Διαβάστε περισσότερα

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ Να δοθούν οι βασικές αρχές των µη παραµετρικών ελέγχων (non-parametric tests). Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη παραµετρικοί έλεγχοι Να αναπτυχθεί η µεθοδολογία των

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 8 ο 8.1 Συντελεστές συσχέτισης: 8.1.1 Συσχέτιση Pearson, και ρ του Spearman 8.1.2 Υπολογισµός του συντελεστή

Διαβάστε περισσότερα

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Σύνολα Δεδομένων - Είδη Ποσοτικής Έρευνας: Παράλογες Ιδέες Γονέων (Δειγματοληπτική)

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΙΧ Οικονομετρικά Πρότυπα Διαφάνεια 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών

Διαβάστε περισσότερα

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

έρευνας και στατιστική» παραμετρικές συγκρίσεις» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ «Μεθοδολογία έρευνας και στατιστική» Μάθημα μεταπτυχιακού κύκλου σπουδών Διάλεξη: «Μη παραμετρικές συγκρίσεις» ΔΙΔΑΣΚΩΝ: Δρ. Αθανάσιος

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο Παράδειγμα 1 Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος Υ (σε κιλά) από το delicatessen μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος (σε ευρώ ανά κιλό) για μια ορισμένη χρονική

Διαβάστε περισσότερα

τατιστική στην Εκπαίδευση II

τατιστική στην Εκπαίδευση II ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΣΙΑ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ τατιστική στην Εκπαίδευση II Λφση επαναληπτικής άσκησης Διδάσκων: Μιχάλης Λιναρδάκης ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ Άδειες Χρήσης Το

Διαβάστε περισσότερα

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά 1. Ιστόγραμμα Δεδομένα από το αρχείο Data_for_SPSS.xls Αλλαγή σε Variable View (Κάτω αριστερά) και μετονομασία της μεταβλητής σε NormData, Type: numeric και Measure: scale Αλλαγή πάλι σε Data View. Graphs

Διαβάστε περισσότερα

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Νίκος Καλογερόπουλος 2014 Τι είναι έρευνα στην στατιστική Αρχική παρατήρηση: κάτι που πρέπει να διευκρινιστεί Κάθε χρόνο υπόσχομαι στον εαυτό μου ότι

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

Στατιστική. 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Στατιστική. 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Στατιστική 9 ο Μάθημα: Εφαρμογές Στατιστικής ΙΙ: Στατιστικοί Έλεγχοι Γεώργιος Μενεξές Τμήμα Γεωπονίας Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ Παιδαγωγικά II Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ Άδεια Χρήσης Το παρόν υλικό υπόκειται σε άδειες χρήσης Creative Commons

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Διακύμανσης

Εισαγωγή στην Ανάλυση Διακύμανσης Εισαγωγή στην Ανάλυση Διακύμανσης 1 Η Ανάλυση Διακύμανσης Από τα πιο συχνά χρησιμοποιούμενα στατιστικά κριτήρια στην κοινωνική έρευνα Γιατί; 1. Ενώ αναφέρεται σε διαφορές μέσων όρων, όπως και το κριτήριο

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA) ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 8. Ανάλυση διασποράς (ANOVA) Γενικά Επέκταση της σύγκρισης µέσων τιµών µεταβλητής ανάµεσα σε 2 δείγµατα (οµάδες ήστάθµες): Σύγκριση πολλών δειγµάτων (K>2) µαζί Σχέση ανάµεσα σε µια ποσοτική

Διαβάστε περισσότερα

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ Κωνσταντίνος Ζαφειρόπουλος Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Μακεδονίας Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t Κεφάλαιο 12 Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t 1 Πώς δημιουργήθηκε W. S. Gosset (1908) Χημικός στη βιομηχανία Μπύρας Guiness Σύγκριση διαφόρων δειγμάτων μπύρας Δημοσίευση αποτελεσμάτων ως Student

Διαβάστε περισσότερα

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Πως μπορούμε να συγκρίνουμε μεταβλητές μεταξύ τους? Διαφορά συγκρίνοντας το μέσο μιας μεταβλητής (λόγος ή διάστημα) στις ομάδες πχ. t-test

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 5 ο 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES 5000 Daily calorie

Διαβάστε περισσότερα

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΙΑTΡΙΚΗ ΣΧΟΛΗ Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ Έλενα Κριτσέλη, MPH PhD Επιστημονικός Συνεργάτης Επιδημιολόγος Χρόνιων Παθήσεων, Α Πανεπιστημιακή Παιδιατρική

Διαβάστε περισσότερα

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα: ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, 6-5-0 Άσκηση 8. Δίνονται οι παρακάτω 0 παρατηρήσεις (πίνακας Α) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Υ μέσω των ανεξάρτητων μεταβλητών

Διαβάστε περισσότερα

Κεφάλαιο 7. Επαγωγική Στατιστική

Κεφάλαιο 7. Επαγωγική Στατιστική Κεφάλαιο 7. Επαγωγική Στατιστική Σύνοψη Στο προηγούμενο κεφάλαιο ασχοληθήκαμε με την περιγραφική στατιστική, δηλαδή την εφαρμογή της στατιστικής στην οργάνωση, παρουσίαση και περιγραφή των αποτελεσμάτων

Διαβάστε περισσότερα

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις: Άσκηση. Δίνονται οι παρακάτω παρατηρήσεις: X X X X Y 7 50 6 7 6 6 96 7 0 5 55 9 5 59 6 8 8 5 0 59 7 7 8 8 5 5 0 7 69 9 6 6 7 6 9 5 7 6 8 5 6 69 8 0 50 66 0 0 50 8 59 76 8 7 60 7 87 6 5 7 88 9 8 50 0 5

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας Επικοινωνία: Πτέρυγα 4, Τοµέας Κοινωνικής Ιατρικής Εργαστήριο Βιοστατιστικής Τηλ. 4613 e-mail: biostats@med.uoc.gr thalegak@med.uoc.gr

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙO 5 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ Στο προηγούμενο κεφάλαιο εξετάσαμε διάφορες μορφές ελέγχου της υπόθεσης ότι ένα δείγμα παρατηρήσεων προέρχεται από κάποια συγκεκριμένη κατανομή. Στην

Διαβάστε περισσότερα

Ιωάννης Ντζούφρας. Ενότητα 4 Συγκρίσεις για 1 & 2 είγματα. (II) Έλεγχοι υποθέσεων για 2 εξαρτημένα δείγματα. Ανάλυση εδομένων ιαφάνεια 4-30

Ιωάννης Ντζούφρας. Ενότητα 4 Συγκρίσεις για 1 & 2 είγματα. (II) Έλεγχοι υποθέσεων για 2 εξαρτημένα δείγματα. Ανάλυση εδομένων ιαφάνεια 4-30 Ιωάννης Ντζούφρας Ενότητα 4 Συγκρίσεις για 1 & 2 είγματα (II) Έλεγχοι υποθέσεων για 2 εξαρτημένα Ανάλυση εδομένων ιαφάνεια 4-30 Έστωότιέχουμεμετρήσειςγιαταίδιαάτομα Σε 2 παρόμοιες μεταβλητές (π.χ. Με ίδιες

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική ΚΕΦΑΛΑΙΟ ΔΕΥΤΕΡΟ Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική Το πρώτο βήμα στην ανάλυση ενός συνόλου δεδομένων, που αποτελούν μετρήσεις ενός δείγματος είναι η παρουσίαση και σύνοψη των πληροφοριών

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Μηχανικών Πληροφορικής (ΤΕ) Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

Διαβάστε περισσότερα

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία. . ΣΤΑΤΙΣΤΙΚΗ ΣΥΣΧΕΤΙΣΗ. Υπολογισµός συντελεστών συσχέτισης Προκειµένου να ελέγξουµε την ύπαρξη γραµµικής σχέσης µεταξύ δύο ποσοτικών µεταβλητών, χρησιµοποιούµε συνήθως τον παραµετρικό συντελεστή συσχέτισης

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Στατιστική Ι Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Παρασκευή, 30 Νοεμβρίου 2012 Στατιστική Ι Έννοιες - Κλειδιά Μεταβλητότητα Εύρος (range) Εκατοστημόρια

Διαβάστε περισσότερα

Τι κάνουμε μετά τη συλλογή των δεδομένων

Τι κάνουμε μετά τη συλλογή των δεδομένων Περιεχόμενα Τι κάνουμε μετά τη συλλογή των δεδομένων... 2 Χρήση λογισμικού... 3 Παραμετρικός ή μη παραμετρικός έλεγχος;... 15 Παραμετρικοί έλεγχοι... 15 Μη παραμετρικοί έλεγχοι... 20 Ποιο έλεγχο να επιλέξουμε...

Διαβάστε περισσότερα

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Κλωνάρης Στάθης ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Μέχρι τώρα ασχοληθήκαμε με τις τεχνικές εκτίμησης παραμέτρων για ένα πληθυσμό όπως: τον Μέσο µ και το ποσοστό p Θα συνεχίσουμε

Διαβάστε περισσότερα

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών. Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών. Η μέση τιμή ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Ένα Ερευνητικό Παράδειγμα Σκοπός της έρευνας ήταν να διαπιστωθεί εάν ο τρόπος αντίδρασης μιας γυναίκας απέναντι σε φαινόμενα

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, -- Άσκηση. Δίνονται τα παρακάτω δεδομένα 5 7 8 9 5 X 8 5 5 5 9 7 Y. 5.. 7..7.7.9.. 5.... 8.. α) Να γίνει το διάγραμμα διασποράς β) εξετάστε τα μοντέλα Υ = β + β Χ + ε, (linear),

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 6Γ: κατά Ζεύγη t test Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Άδειες Χρήσης

Διαβάστε περισσότερα

Μη Παραµετρικοί Έλεγχοι

Μη Παραµετρικοί Έλεγχοι Μη Παραµετρικοί Έλεγχοι Επιστηµονική Επιµέλεια: ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας Εργαστήριο Γεωργίας Viola adorata Καταρχήν Μη Παραµετρικοί Έλεγχοι εν απαιτούν κανονικότητα

Διαβάστε περισσότερα

τατιστική στην Εκπαίδευση II

τατιστική στην Εκπαίδευση II ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΣΙΑ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ τατιστική στην Εκπαίδευση II Επαναληπτικζς ασκήσεις Διδάσκων: Μιχάλης Λιναρδάκης ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

τατιςτική ςτην Εκπαίδευςη II

τατιςτική ςτην Εκπαίδευςη II ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΣΙΑ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ τατιςτική ςτην Εκπαίδευςη II Αρχείο αποτελεςμάτων Διδάσκων: Μιχάλης Λιναρδάκης ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στην Ανάλυση Ερευνητικών Δεδομένων στις Κοινωνικές Επιστήμες Με χρήση των λογισμικών IBM/SPSS και LISREL Ενότητα 4 η : Ανάλυση

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα