ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης"

Transcript

1 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

2 Περιεχόμενα Έλεγχος κανονικότητας P-P Plot και Q-Q Plot Τεστ Κανονικότητας Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Τεστ ανεξαρτησίας Βασικές έννοιες θεωρίας ελέγχων υποθέσεων Στατιστική Επαγωγή Διαστήματα Εμπιστοσύνης Έλεγχοι Τ-Test Έλεγχος της μέσης τιμής Παραμετρικό/Μη Παραμετρικό Τεστ Σύγκριση των μέσων τιμών μίας μεταβλητής - Παραμετρικό /Μη Παραμετρικό Τεστ Σύγκριση των μέσων τιμών δύο εξαρτημένων δειγμάτων. Παραμετρικό /Μη Παραμετρικό Τεστ Συντελεστές γραμμικής συσχέτισης Έλεγχος F Ανάλυση διακύμανσης (διασποράς) κατά ένα παράγοντα (One-way Anova) Έλεγχος χ 2 Σύγκριση δύο ποιοτικών μεταβλητών (ανεξάρτητα / εξαρτημένα δείγματα) Διαστήματα Εμπιστοσύνης Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 2

3 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Αναφέρθηκε στο προηγούμενο μάθημα ότι όταν το ιστόγραμμα συχνοτήτων των ποσοτικών μεταβλητών έχει το σχήμα καμπάνας, τότε λέμε ότι τα δεδομένα ακολουθούν την κανονική κατανομή ή κατανέμονται κανονικά. Το ιστόγραμμα όμως δεν είναι ικανό να μας απαντήσει στη ερώτηση αν είναι κανονικά τα δεδομένα ή αν προέρχονται από μία κανονική κατανομή με ένα μέσο και μία διακύμανση. Ένα από τα πιο σημαντικά προβλήματα στην στατιστική είναι η διερεύνηση της πληροφορίας η οποία σχετίζεται με την μορφή της κατανομής από την οποία προέρχεται ένα τυχαίο δείγμα. Οι περισσότεροι έλεγχοι γίνονται με την προϋπόθεση ότι (υπό την Η 0 ) το τυχαίο δείγμα προέρχεται από μια συγκεκριμένη κατανομή. Μια τέτοια περίπτωση είναι τα t-tests που θα εξετάσουμε στη συνέχεια και τα οποία, ιδιαίτερα για μικρά δείγματα, προϋποθέτουν ότι το δείγμα προέρχεται από κανονικής κατανομής πληθυσμό. Εάν το τυχαίο δείγμα δεν προέρχεται από την κατανομή κάτω από την οποία έχει κατασκευασθεί κάποιος έλεγχος τότε προφανώς το αντίστοιχο p-value που λαμβάνεται δεν είναι ακριβές. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 3

4 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Συνεπώς είναι αρκετά χρήσιμη η δυνατότητα να ελέγχουμε αν κάποια δεδομένα προέρχονται από μια συγκεκριμένη κατανομή ή όχι. Έλεγχοι αυτής της μορφής καλούνται «έλεγχοι καλής προσαρμογής» των δεδομένων σε μια συγκεκριμένη κατανομή και έχουν προταθεί αρκετοί. Για τον έλεγχο αν τα δεδομένα ακολουθούν την κανονική κατανομή αρχικά μπορούμε να κατασκευάσουμε δύο γραφήματα με το SPSS, το P-P Plot και το Q-Q Plot (Επιλέγοντας Analyze Descriptive Statistics P-P Plots ή Q-Q Plots). Με αυτά τα γραφήματα ελέγχουμε οπτικά την ύπαρξη κανονικότητας στα δεδομένα. Όσο πιο κοντά στην ευθεία είναι τα σημεία του σχήματος τόσο πιο πολλές είναι οι ενδείξεις ότι τα δεδομένα ακολουθούν την κανονική κατανομή. Το μάτι όμως πάλι μπορεί να πέσει έξω και να ξεγελαστούμε. Για αυτό το λόγο καταφεύγουμε σε τεστ κανονικότητας για να απαντήσουμε στην προηγούμενη ερώτηση. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 4

5 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Ο έλεγχος κανονικότητας υπάγεται σε μία ευρύτερη οικογένεια ελέγχων, τη λεγόμενη «έλεγχοι υποθέσεων». Όταν ακούμε για ελέγχους υποθέσεων μας έρχονται πολλά πράγματα στο μυαλό. Κάποια από αυτά είναι η μηδενική υπόθεση (Null Hypothesis ή H 0 ), η εναλλακτική υπόθεση (Alternative Hypothesis ή H 1 ), το επίπεδο στατιστικής σημαντικότητας (α) και το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας (p-value ή Significance). Οι υποθέσεις αυτές είναι της ακόλουθης μορφής: Η 0 : Η κατανομή των δεδομένων δε διαφέρει από την κανονική κατανομή Η 1 : Η κατανομή των δεδομένων διαφέρει από την κανονική κατανομή Για τη διεξαγωγή των ελέγχων υποθέσεων χρησιμοποιούνται κάποιοι μαθηματικοί τύποι, που καλούνται ελεγχοσυναρτήσεις. Με βάση το αποτέλεσμα τους οδηγούμαστε στο συμπέρασμα ότι η μηδενική υπόθεση απορρίπτεται ή όχι. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 5

6 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Η μηδενική υπόθεση στην συγκεκριμένη περίπτωση την οποία θέλουμε να ελέγξουμε είναι ότι τα δεδομένα ακολουθούν την κανονική ή ότι προέρχονται από ένα πληθυσμό που ακολουθεί την κανονική κατανομή. Η εναλλακτική είναι ότι τα δεδομένα δεν ακολουθούν την κανονική κατανομή. Το επίπεδο στατιστικής σημαντικότητας ορίζεται συνήθως ίσο με 0,05 ή 5%. Το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας ορίζεται ως η πιθανότητα η τιμή του ελέγχου (ελεγχοσυνάρτησης) να πάρει μία τιμή τόσο ακραία ή περισσότερο ακραία από αυτή που πήρε στο συγκεκριμένο δείγμα κάτω από τη μηδενική υπόθεση. Αν η p-value είναι μικρότερη του 0,05, τότε λέμε ότι η μηδενική υπόθεση απορρίπτεται. Αν η p-value είναι μεγαλύτερη ή ίση του 0,05, τότε λέμε ότι η μηδενική υπόθεση δεν απορρίπτεται. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 6

7 Έλεγχος κανονικότητας και διαστήματα εμπιστοσύνης Για τους ελέγχους καλής προσαρμογής αρχικά θα εξετάσουμε: κάποιους «εμπειρικούς» ελέγχους οι οποίοι γίνονται μέσω κάποιων γραφημάτων (P-P και Q-Q plots) έτσι ώστε να πάρουμε μια πρώτη εποπτική εικόνα για τα δεδομένα (τα γραφήματα αυτά δεν οδηγούν με σχετική «ασφάλεια» σε κάποια απόφαση) ενώ στη συνέχεια θα περάσουμε στους πιο σημαντικούς ελέγχους καλής προσαρμογής: το χι-τετράγωνο τεστ καλής προσαρμογής και το Kolmogorv- Smirnov τεστ. Τέλος, ένα ενδιαφέρον παρεμφερές πρόβλημα αφορά δύο δείγματα και τον έλεγχο της υπόθεσης ότι τα δείγματα αυτά προέρχονται από τον ίδιο πληθυσμό (δηλαδή από την ίδια κατανομή). Για τον έλεγχο αυτό θα παρουσιαστούν τρία μη παραμετρικά τεστ: το Kolmogorov- Smirnov για δυο δείγματα, το το Wald-Wolfowitz τέστ των ροών και το Mann-Whitney U τέστ Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 7

8 P-P Plot και Q-Q Plot Τα P-P Plot και Q-Q plot (probability-probability plot και Quantile-Quantile plot) είναι δύο γραφήματα τα οποία μας βοηθούν να ελέγξουμε αν κάποια δεδομένα προέρχονται από κάποια συγκεκριμένη κατανομή (π.χ. κανονική). Και στα δύο γραφήματα, αν τα σημεία που εμφανίζονται βρίσκονται «κοντά» στη διαγώνιο (και «τυχαία» γύρω από αυτήν) τότε μπορεί να θεωρηθεί ότι τα δεδομένα προέρχονται από μία κατανομή (π.χ. κανονική) ο έλεγχος μέσω των παραπάνω γραφημάτων δεν μπορεί να είναι αξιόπιστος διότι δεν βασίζεται σε κάποιο στατιστικό κριτήριο που μας οδηγεί σε σωστή απόφαση π.χ. στο 1 a % των περιπτώσεων. Συνήθως γίνεται για να πάρουμε μια πρώτη εποπτική εικόνα και για να δούμε αν υπάρχουν κάποιες έκτροπες, σε σχέση με τις αναμενόμενες υπό την F 0, παρατηρήσεις. Είναι προφανές ότι, εκτός της κανονικής, μπορούμε γραφικά να ελέγξουμε την καλή προσαρμογή των δεδομένων και σε άλλες κατανομές (αλλάζουμε την Test distribution).. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 8

9 Παράδειγμα P-P Plot Να ελεγχθεί γραφικά (μέσω P-P plot ή Q-Q plot) αν οι παρατηρήσεις του δείκτη χοληστερίνης (μεταβλητή chol) προέρχονται από την κανονική κατανομή (αρχείο test1) Στο SPSS από το μενού analyze/descriptive statistics επιλέγουμε P-P plot Για μέτρια ή μεγάλα δείγματα δεν υπάρχει ουσιαστική διαφορά οποιαδήποτε proportion estimation formula και αν επιλέξουμε για μικρά όμως δείγματα καλύτερα να επιλέξουμε την Van der Waerden s κάποιοι άλλοι ερευνητές παραθέτοντας κάποια δικαιολόγηση έχουν προτείνει την (Blom s) ή κάποια άλλη Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 9

10 Αποτελέσματα P-P Plot Φαίνεται ότι τα 60 σημεία του επιπέδου δεν «απέχουν» πολύ από την διαγώνιο, ούτε φαίνονται κάποιες «έκτροπες» παρατηρήσεις. Επομένως, τουλάχιστον γραφικά, δεν φαίνεται να υπάρχει επαρκής λόγος ώστε να μην θεωρήσουμε τα δεδομένα ως κανονικά (για να είμαστε πιο ακριβείς θα πρέπει να προχωρήσουμε και σε έλεγχο με δεδομένο ε.σ. a, π.χ. χ 2 ή K-S που θα εξετάσουμε παρακάτω). Αξίζει να παρατηρήσουμε ότι αν υπήρχαν κάποιες έκτροπες παρατηρήσεις (παρατηρήσεις αρκετά «απομακρυσμένες» από την διαγώνιο) τότε θα έπρεπε αυτές να επανεξεταστούν λεπτομερέστερα ώστε να βεβαιωθούμε ότι δεν ισχύουν κάποιες ειδικές συνθήκες για αυτές ή ότι δεν έχουν περαστεί λάθος στο SPSS. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 10

11 Παράδειγμα P-P Plot Να ελεγχθεί γραφικά (μέσω Q-Q plot) αν οι παρατηρήσεις του δείκτη χοληστερίνης (μεταβλητή chol) προέρχονται από την κανονική κατανομή (αρχείο test1). Στο SPSS από το μενού analyze/descriptive statistics επιλέγουμε Q-Q Αυτό το εμπειρικό τεστ είναι ισοδύναμο με το προηγούμενο και επομένως τα αποτελέσματα είναι τα ίδια. Και εδώ φαίνεται ότι όλα τα σημεία του επιπέδου δεν «απέχουν» πολύ από την διαγώνιο και επομένως δεν υπάρχει επαρκής λόγος ώστε απορρίψουμε ότι τα δεδομένα είναι κανονικά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 11

12 Τεστ Κανονικότητας Για να ελέγξουμε αν η κατανομή μιας μεταβλητής είναι συμβατή µε την κανονική εφαρμόζουμε το test Kolmogorov-Smirnov. H 0 (Μηδενική υπόθεση): Η υπό έλεγχο κατανομή, δε διαφέρει από την κανονική κατανομή έναντι της H 1 (Εναλλακτικής υπόθεσης): Η υπό έλεγχο κατανομή διαφέρει από την κανονική κατανομή. Για την εκτέλεση του τεστ κανονικότητας με το SPSS : πατάμε Analyze Non parametric tests One sample K-S Βάζουμε στο test variable list τις μεταβλητές που θέλουμε να ελέγξουμε την κανονικότητα τους, Τσεκάρουμε Normal και ΟΚ Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 12

13 Τεστ Κανονικότητας - Αποτελέσματα One-Sample Kolmogorov-Smirnov Test chol N 60 Normal Parameters a Mean 240,0833 Std. Deviation 48,72729 Most Extreme Differences Absolute,099 Positive,083 Negative -,099 Kolmogorov-Smirnov Z,770 Asymp. Sig. (2-tailed),593 a. Test distribution is Normal. Η υπόθεση την οποία θέλουμε να ελέγξουμε είναι ότι οι μεταβλητές ακολουθούν την κανονική κατανομή. Από ότι φαίνεται για δεν έχουμε εκλιπούσες τιμές. Εμφανίζονται επίσης ο μέσος και η τυπική απόκλιση για κάθε μεταβλητή. Για τον έλεγχο της κανονικότητας μας ενδιαφέρουν η τιμή της Asymp. Sig. (2-tailed). Το τεστ των Kolmogorov-Smirnov είναι ένα απλά μία τιμή p-value που υπολογίζεται με μία ελαχιστοσυνάρτηση. Παρατηρούμε ότι η τιμή p-value είναι 0,593 και όπως αναφέραμε προηγουμένως αν η p-value είναι μεγαλύτερη από το 0,05, τότε δεν απορρίπτουμε την υπόθεση της κανονικότητας των δεδομένων. Άρα η υπόθεση ότι οι μετρήσεις που αφορούν την μέτρηση της χοληστερίνης κατανέμονται κανονικά δεν απορρίπτεται σε επίπεδο στατιστικής σημαντικότητας α=0,05 ή α=5%. Ειδάλλως, μπορούμε να πούμε ότι υπάρχουν ενδείξεις ότι αυτές οι μετρήσεις ακολουθούν την κανονική κατανομή. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 13

14 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Στην προσπάθεια να εκτιμήσουμε την πραγματική τιμή του μέσου, χρησιμοποιούμε το μέσο ενός δείγματος. Στη συνέχεια κατασκευάζουμε ένα 95% διάστημα εμπιστοσύνης με βάση ένα μαθηματικό τύπο, ο οποίος είναι στην ουσία 2 τυπικά σφάλματα αριστερά και δεξιά της τιμής του μέσου που βρήκαμε για το δείγμα. Αν επαναλάβουμε τη δειγματοληψία ν φορές θα εκτιμήσουμε ν διαφορετικούς μέσους και προφανώς ν διαφορετικά (πολλά θα είναι αλληλοεπικαλυπτόμενα) διαστήματα εμπιστοσύνης. Αυτό που θέλουμε είναι ότι στο 95% των ν περιπτώσεων τα διαστήματα εμπιστοσύνης που υπολογίσαμε θα έχουν περικλείσει, ή πιάσει, ή χτυπήσει την τιμή του πραγματικού μέσου. Επομένως, αν για παράδειγμα παίρναμε κάθε φορά 100 δείγματα από έναν πληθυσμό και κατασκευάζαμε 100 διαστήματα εμπιστοσύνης για τη μέση τιμή μίας μεταβλητής και επαναλαμβάναμε τη διαδικασία άπειρες τιμές, κατά μέσο όρο στο 95% των περιπτώσεων θα είχαμε φτιάξει διαστήματα εμπιστοσύνης που θα είχαν πιάσει τον πραγματικό μέσο του πληθυσμού. Το 95% θα το ονομάζουμε βαθμό ή επίπεδο εμπιστοσύνης. Το υπόλοιπο 5% είναι αυτό που έχουμε ήδη ορίσει επίπεδο στατιστικής σημαντικότητας. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 14

15 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Για να κατασκευάσουμε ένα 95% διάστημα εμπιστοσύνης για τη μέση τιμή μίας μεταβλητής εργαζόμαστε ως εξής: πατάμε Analyze Descriptive Statistics Explore Από την επιλογή Plots μπορούμε να επιλέξουμε αν θέλουμε να εμφανιστεί ένα ιστόγραμμα των ή της μεταβλητής που θα περάσουμε στο άνω λευκό κουτάκι (Dependent List:) ακόμη και ένα τεστ κανονικότητας. Από την επιλογή Statistics μπορούμε να επιλέξουμε διάφορα περιγραφικά στατιστικά καθώς και το διάστημα εμπιστοσύνης Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 15

16 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Descriptives Statistic Std. Error Mean 240,0833 6, % Confidence Interval Lower Bound 227,4957 for Mean Upper Bound 252,6709 5% Trimmed Mean 238,3889 Median 233,0000 Variance 2374,349 Std. Deviation 48,72729 Minimum 161,00 Maximum 355,00 Range 194,00 Interquartile Range 84,25 Skewness,363,309 Kurtosis -,539,608 Ο πίνακας περιέχει τα περιγραφικά μέτρα στα οποία έχουμε ήδη αναφερθεί μαζί με λίγα ακόμα για τα οποία δεν έχουμε μιλήσει. Η μεταβλητή επιλέχθηκε τυχαία. Η πρώτη γραμμή του πίνακα περιέχει τη μέση τιμή για τις τιμές αυτής της μεταβλητής. Οι επόμενες δύο τιμές είναι το κάτω και το άνω άκρο του 95% διαστήματος εμπιστοσύνης για τον πραγματικό μέσο του πληθυσμού. Η επόμενη γραμμή είναι ο μέσος των τιμών της μεταβλητής από την οποία έχουμε αφαιρέσει το 5% των μεγαλύτερων και μικρότερων τιμών. Το Interquartile range (ενδοτεταρτημοριακό εύρος) είναι η διαφορά μεταξύ τρίτου και πρώτου τεταρτημόριου. Σε αυτό το εύρος βρίσκεται το 50% των κεντρικών παρατηρήσεων της μεταβλητής. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 16

17 Τεστ Κανονικότητας Διαστήματα Εμπιστοσύνης Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk chol Statistic df Sig. Statistic df Sig.,099 60,200 *,966 60,091 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 17

18 Έλεγχος ανεξαρτησίας Ένας άλλος χρήσιμος έλεγχος είναι ο έλεγχος που βασίζεται στα λεγόμενα runs, δηλαδή τις μεταβολές προσήμου της σειράς. Ο έλεγχος είναι διαθέσιμος στο μενού Analyze Non parametric tests Runs. Για να ελέγξουμε τις τιμές της χολυστερίνης για τυχαιότητα χρησιμοποιούμε τις επιλογές αυτές και έχουμε την ακόλουθη οθόνη. Runs Test chol Test Value a 240,0833 Cases < Test Value 33 Cases >= Test Value 27 Total Cases 60 Number of Runs 4 Z -7,025 Asymp. Sig. (2-tailed),000 a. Mean Ο έλεγχος αυτός είναι έλεγχος Z. Η τιμή της στατιστικής είναι 7,025 και έχει πιθανότητα 0,000. Αυτό σημαίνει ότι σε επίπεδο σημαντικότητας 5% (αλλά και 1%) μπορούμε να απορρίψουμε την υπόθεση ότι η σειρά είναι τυχαία. Και αυτό μπορούμε να το δούμε και στα δεδομένα τα οποία είναι ταξινομξμένα κατά αύξουσα σειρά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 18

19 Ξέρω στατιστική σημαίνει ότι γνωρίζω.. ποιο στατιστικό είναι κατάλληλο για κάθε ερευνητική ερώτηση, πώς να υπολογίσω το στατιστικό αυτό και πώς να το ερμηνεύσω H επιλογή του κατάλληλου στατιστικού είναι ένα από τα σημαντικότερα βήματα στην διαδικασία της εκπαιδευτικής έρευνας και της στατιστικής ανάλυσης Για την επιλογή του κατάλληλου στατιστικού χρησιμοποιούμε δύο γενικά κριτήρια: Το λόγο (σκοπό) για τον οποίο χρειαζόμαστε το στατιστικό η περιγραφή μεταβλητών ή σχέσεων μεταξύ μεταβλητών, με τα οποία ασχολείται η Περιγραφική Στατιστική και η γενίκευση από το δείγμα στον πληθυσμό, με την οποία ασχολείται η επαγωγική Την κλίμακα (επίπεδο) μέτρησης των μεταβλητών Ονομαστική, Τακτική, Ισοδιαστημική, Αναλογική Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 19

20 Στατιστική Επαγωγή Ο απώτερος σκοπός της στατιστικής ανάλυσης είναι να μας βοηθήσει να περιγράψομε τον πληθυσμό. Όταν όμως τα μόνα διαθέσιμα στοιχεία είναι από ένα δείγμα, ο πληθυσμός δεν μπορεί να περιγραφεί άμεσα. Αυτό που μπορούμε να κάνομε σε τέτοιες περιπτώσεις είναι να υπολογίσομε τα στατιστικά του δείγματος (περιγραφικά ή εξηγητικά) και από αυτά δι' επαγωγής να βγάλομε συμπεράσματα για τον πληθυσμό ή να προσεγγίσομε τις παραμέτρους του. Τα στατιστικά και οι τεχνικές που χρησιμοποιούνται για να κάνομε γενικεύσεις από το δείγμα στον πληθυσμό λέγονται Επαγωγικά Στατιστικά. Οι επαγωγές που ενδιαφέρουν τους ερευνητές στις κοινωνικές επιστήμες και την εκπαίδευση είναι δύο ειδών. Τα Διαστήματα Εμπιστοσύνης (Confidence Intervals) και Ο Έλεγχος Υποθέσεων (Hypothesis Testing) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 20

21 Τα Διαστήματα Εμπιστοσύνης Έχουμε τα παρακάτω ερωτήματα: Ποιο είναι το εκπαιδευτικό επίπεδο των Ελλήνων; Ποια είναι η διαφορά μεταξύ αγοριών και κοριτσιών στην επίδοση τους στα μαθήματα; Ποια είναι η σχέση μεταξύ του κοινωνικοοικονομικού επιπέδου της οικογένειας και της επίδοσης των μαθητών; Η λογική των διαστημάτων εμπιστοσύνης είναι αρκετά απλή: βασισμένοι στα στατιστικά του δείγματος και στη θεωρία των πιθανοτήτων φτιάχνομε διαστήματα τιμών μέσα στα οποία θα πέφτουν οι αντίστοιχες παράμετροι με κάποια δεδομένη πιθανότητα (συνήθως 95%). Αυτή την πιθανότητα ονομάζομε «εμπιστοσύνη» (confidence). Για παράδειγμα, αν στο δείγμα μιας δημοσκόπησης 32% των ερωτηθέντων έχει απαντήσει ότι σκοπεύει να ψηφίσει ΠΑΣΟΚ στις επόμενες εκλογές, μπορούμε να πούμε ότι με πιθανότητα 95% το ποσοστό του πληθυσμού που σκοπεύει να ψηφίσει ΠΑΣΟΚ είναι 32% ± 3% ή 29-35%. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 21

22 Ο έλεγχος υποθέσεων Έχουμε τα παρακάτω ερωτήματα: Είναι το εκπαιδευτικό επίπεδο των Ελλήνων (δηλ. ο μέσος όρος) διαφορετικό από το μέσο όρο των κρατών της Ευρωπαϊκής Ένωσης; Υπάρχει καμιά διαφορά μεταξύ αγοριών και κοριτσιών στην επίδοση τους στα γλωσσικά μαθήματα; Υπάρχει καμιά διαφορά στη μαθητική επίδοση στο δημοτικό μεταξύ αυτών που ζουν στις διάφορες γεωγραφικές περιοχές της χώρας; Οιυποθέσεις : Το εκπαιδευτικό επίπεδο των Ελλήνων δεν είναι διαφορετικό από το μέσο όρο των κρατών της Ευρωπαϊκής Ένωσης. Δεν υπάρχει καμιά διαφορά μεταξύ αγοριών και κοριτσιών στην επίδοση τους στα γλωσσικά μαθήματα. Δεν υπάρχει καμιά διαφορά στη μαθητική επίδοση στο δημοτικό μεταξύ αυτών που ζουν στις διάφορες γεωγραφικές περιοχές της χώρας. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 22

23 Ο έλεγχος υποθέσεων Oι έλεγχοι υποθέσεων προσπαθούν να απαντήσουν σε ερωτήσεις του τύπου «υπάρχει διαφορά;», «υπάρχει σχέση;», «υπάρχει επίδραση;» κ.τ.λ.. Όλοι οι έλεγχοι ακολουθούν περίπου την ίδια διαδικασία και λογική. Όλοι αρχίζουν με μιαν υπόθεση, ότι στον πληθυσμό δεν υπάρχει σχέση, διαφορά, επίδραση κ.τ.λ.. Η υπόθεση αυτή είναι γνωστή ως μηδενική υπόθεση, γιατί συνήθως υποθέτομε ότι οι σχέσεις, οι διαφορές και επιδράσεις είναι μηδενικές. Για να ελέγξομε τις υποθέσεις αυτές, συλλέγομε δεδομένα από ένα δείγμα πιθανοτήτων και υπολογίζομε τη διαφορά, σχέση επίδραση κ.τ.λ.. Αν στο δείγμα βρούμε ότι μας υπάρχει διαφορά, επίδραση ή σχέση (και συνήθως κάτι υπάρχει), δύο τινα μπορεί να συμβαίνουν: Είτε ισχύει η μηδενική μας υπόθεση και βρήκαμε τη διαφορά κατά τύχη (κατά σύμπτωση, κατά λάθος), Είτε δεν τη βρήκαμε κατά τύχη και άρα δεν ισχύει η μηδενική μας υπόθεση. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 23

24 Ο έλεγχος υποθέσεων Για να αποφανθούμε περί του τι ισχύει εξετάζομε την πιθανότητα να έχομε βρει τη διαφορά αυτή κατά τύχη. Υπολογίζομε, δηλαδή, την πιθανότητα να προέρχεται το δείγμα από έναν πληθυσμό όπου ισχύει η μηδενική υπόθεση (η πιθανότητα αυτή συμβολίζεται με ένα p). Αν η πιθανότητα αυτή είναι μικρή, συμπεραίνομε ότι το δείγμα μας δεν προέρχεται από τέτοιο πληθυσμό, αλλά από έναν άλλο, στον οποίο δεν ισχύει η μηδενική υπόθεση. Αν, με άλλα λόγια, με βάση τα δεδομένα, η μηδενική υπόθεση φαντάζει απίθανη, την απορρίπτομε και συμπεραίνομε ότι υπάρχει σχέση, διαφορά ή επίδραση στον πληθυσμό. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 24

25 Ο έλεγχος υποθέσεων Για να αποφασίσομε αν απορρίπτεται η μηδενική υπόθεση πρέπει : να γνωρίζομε πώς να υπολογίσομε το p (την πιθανότητα να έχομε βρει κάτι κατά λάθος) και να αποφασίσομε πότε θα λέμε η πιθανότητα αυτή είναι πολύ μικρή (ώστε να λέμε ότι αυτό που βρήκαμε δεν είναι κατά λάθος και άρα δεν ισχύει η μηδενική υπόθεση). Το πρώτο θα το δούμε παρακάτω για διάφορες περιπτώσεις. Το δεύτερο καθορίζεται a priori, μάλλον «αυθαίρετα», και είναι γνωστό ως επίπεδο στατιστικής σημαντικότητας (συμβολίζεται με ένα α - άλφα). Η λογική τελειώνει κάπως έτσι: Αν p α απορρίπτομε τη μηδενική υπόθεση και αποφαινόμαστε ότι υπάρχει στατιστικά σημαντική διαφορά. Αν p > α αποτυγχάνομε να απορρίψομε τη μηδενική υπόθεση και αποφαινόμαστε ότι δεν υπάρχει στατιστικά σημαντική διαφορά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 25

26 Ο έλεγχος υποθέσεων Απορρίπτουμε την Η 0 όταν p τιμή < α. Για να είμαστε σε θέση να αξιολογήσουμε πόσο αξιόπιστη είναι η p-τιμή που θα βρούμε, πρώτα πρέπει να ελέγξουμε αν ο πληθυσμός μας είναι κανονικός. Σε περίπτωση που δεν είναι, θα πρέπει να αξιολογήσουμε αν απέχει πολύ ή όχι. Επίσης, θα λάβουμε υπ όψιν και το μέγεθος του δείγματος. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 26

27 Ο έλεγχος υποθέσεων Γενικά, τις πιθανότητες p μπορούμε να τις βρούμε, αν γνωρίζομε: Τη δειγματoληπτική κατανομή (sampling distribution) ενός στατιστικού (ενός οποιουδήποτε στατιστικού, και τις πιθανότητες που αντιστοιχούν στις διάφορες τιμές αυτής της κατανομής. Κάτω από ορισμένες προϋποθέσεις, οι πληροφορίες αυτές υπάρχουν σε πίνακες για τα περισσότερα στατιστικά. Η κατανομή και ο πίνακας που χρησιμοποιούμε εξαρτάται από το στατιστικό που θέλομε να ελέγξομε. Έτσι, χρησιμοποιούμε άλλη κατανομή (και άλλο πίνακα) όταν θέλομε να ελέγξομε τη διαφορά μεταξύ πολλών μέσων όρων και άλλη όταν θέλομε να ελέγξομε το συντελεστή παλινδρόμησης. Τα κυριότερα στατιστικά που χρησιμοποιούνται στην εκπαίδευση και τις κοινωνικές επιστήμες ακολουθούν, εκτός από την κανονική (z), και τις παρακάτω κατανομές: Κατανομή t (t Distribution) Κατανομή F (F Distribution) Κατανομή χ 2 (CHI SQUARE Distribution ) Από την κατανομή που ακολουθούν τα διάφορα στατιστικά, παίρνουν την ονομασία τους και οι έλεγχοι στατιστικής σημαντικότητας που χρησιμοποιούνται για τα στατιστικά αυτά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 27

28 Έλεγχος της μέσης τιμής Παραμετρικό Τεστ Έλεγχος της μέσης τιμής μίας ποσοτικής μεταβλητής (έλεγχος µ=µ 0 ) Πολλές φορές θέλουμε να ελέγξουμε, αν η μέση τιμή μίας μεταβλητής είναι (στατιστικά) ίση µε έναν συγκεκριμένο αριθμό. Για παράδειγμα, αν ο μέσος όρος του ύψους ενός τυχαίου δείγματος 60 ανδρών μ είναι ίσος με μ 0 =174 εκατοστά (test2) Η 0 : Μηδενική υπόθεση µ=µ 0 έναντι της Η α : Εναλλακτικής υπόθεσης µ µ 0 Η κατάλληλη δοκιμασία σε αυτή την περίπτωση είναι το One sample t-test, όταν ισχύει η προϋπόθεση της κανονικότητας της μεταβλητής µας. SPSS: Analyze Compare Means One sample t test και δηλώνουμε την τιμή ελέγχου µ 0 (test value). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 28

29 Αποτελέσματα One-Sample Statistics N Mean Std. Deviation Std. Error Mean ypsos ,6683 3,01749,38956 One-Sample Test Ο πρώτος πίνακας περιέχει την τιμή του μέσου, της τυπικής απόκλισης, της τυπικής απόκλισης του μέσου (τυπικό σφάλμα του μέσου) και το μέγεθος του δείγματος Test Value = % Confidence Interval of the Difference t df Sig. (2-tailed) Mean Difference Lower Upper ypsos 1,716 59,091, ,1112 1,4478 Η πρώτη στήλη του πίνακα περιέχει την ονομασία της μεταβλητής, Η δεύτερη στήλη περιέχει την τιμή του t (1,716) τεστ για αυτή τη μεταβλητή, η οποία χρησιμοποιήθηκε για να υπολογιστεί η p-value (0,091) (Sig. (2-tailed)). Η στήλη δίπλα από την p-value περιέχει τη διαφορά ανάμεσα στην τιμή της μηδενικής υπόθεσης (174) και στη μέση τιμή της μεταβλητής. Οι επόμενες δύο στήλες περιέχουν ένα 95% διάστημα εμπιστοσύνης για αυτή τη διαφορά. Το επίπεδο στατιστικής σημαντικότητας είναι ίσο με 0,091. Εφόσον είναι μεγαλύτερο του 0,05, καταλήγουμε στο συμπέρασμα ότι δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση ότι ο πραγματικός μέσος είναι ίσος με 174. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 29

30 Σταδιακή ανάλυση Ερευνητικό ερώτημα: «Ο μέσος όρος του ύψους ενός δείγματος 60 ανδρών διαφέρει από 174 εκατοστά (μ 0)» ΒΗΜΑ 1 ο : Γράφουμε τη μηδενική υπόθεση, η οποία είναι αντίθετη με το ερευνητικό ερώτημα: Η 0 : μ = μ 0 ή Η 0 : μ - μ 0 =0 Όπου μ, ο μέσος όρος του δείγματος και μ 0 ο αριθμός που θέλουμε να ερευνήσουμε αν διαφέρει από τον μέσο όρο. ΒΗΜΑ 2 ο : Γράφουμε την εναλλακτική υπόθεση, η οποία είναι αντίθετη με τη μηδενική και περίπου ίδια με το ερευνητικό ερώτημα: Η a : μ μ 0 ή Η a : μ - μ 0 0 ΒΗΜΑ 3ο: Ορίζουμε το επίπεδο στατιστικής σημαντικότητας (α): α = 0,05 ΒΗΜΑ 4 ο : Βρίσκουμε την πιθανότητα (p) να είναι ο μέσος του δείγματος να είναι διαφορετικός από την ελεγχόμενη τιμή, «κατά λάθος» ΒΗΜΑ 5 ο : Συγκρίνομε την πιθανότητα p με το α. Αν p > α αποτυγχάνομε να απορρίψομε τη μηδενική υπόθεση και συμπεραίνομε ότι δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ του μέσου όρου και της συγκρινόμενης τιμής Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 30

31 Έλεγχος της μέσης τιμής - Μη παραμετρικό Τεστ Το αντίστοιχο μη παραμετρικό τεστ καλείται έλεγχος των προσημασμένων τάξεων μεγέθους του Wilcoxon για τη διάμεσο ενός πληθυσμού. Επειδή βασίζεται στις τάξεις μεγέθους των παρατηρήσεων και όχι στις παρατηρήσεις αυτές κάθε αυτές δε χρειάζεται καμία προϋπόθεση ως προς την κατανομή των παρατηρήσεων. Αυτό ισχύει για όλα τα μη παραμετρικά τεστ που θα δούμε. Ο έλεγχος όμως εδώ βασίζεται στη διάμεσο και όχι στο μέσο του δείγματος. Αυτό βέβαια δε σημαίνει ότι αυτού του είδους τα τεστ είναι χαμηλότερης αξιοπιστίας σε σύγκριση με τα παραμετρικά. Απεναντίας, σε πολλές περιπτώσεις είναι πιο ισχυρά. Γενικά όμως η ισχύς τους πλησιάζει πάρα πολύ των ισχύ των κλασικών παραμετρικών τεστ. Αυτός είναι και ο λόγος που η μόνη προϋπόθεση που χρειάζεται είναι η συμμετρία της κατανομής. Ένα πλεονέκτημα όμως των μη παραμετρικών ελέγχων που θα εξεταστούν είναι ότι εφαρμόζονται και στις περιπτώσεις που οι μεταβλητές είναι ποιοτικές διατεταγμένης κλίμακας (καλό, καλύτερο, πολύ καλό). Σε αυτήν την περίπτωση οι μέθοδοι ελέγχων υποθέσεων που θα δούμε είναι από τις πιο ισχυρές μεθόδους που υπάρχουν Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 31

32 Έλεγχος της μέσης τιμής - Μη παραμετρικό Τεστ Ο έλεγχος όμως αυτός δεν προσφέρεται από το SPSS μέσω του μενού επιλογών, για αυτό θα πρέπει να γίνει μία διεργασία πρώτα. Η διεργασία έχει ως εξής: θα περάσουμε σε μία νέα στήλη την τιμή την οποία θέλουμε να ελέγξουμε τόσες φορές, όσες και οι παρατηρήσεις της μεταβλητής στην οποία θέλουμε να κάνουμε τον έλεγχο υπόθεσης. Επομένως θέλοντας να ελέγξουμε με ένα μη παραμετρικό τεστ αν ο μέσος όρος του ύψους ενός τυχαίου δείγματος 60 ανδρών μ είναι ίσος με μ 0 =174 εκατοστά στο αρχείο test2 θα προσθέσουμε μια νέα μεταβλητή (π.χ. Diam) που θα περιέχει την τιμή 174, 60 φορές, όσες δηλαδή είναι και οι παρατηρήσεις του δείγματος υπό εξέταση Επιλέγουμε από το μενού εντολών τα εξής: Analyze Nonparamteric Tests 2 Related Samples Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 32

33 Αποτελέσματα Η επιλογή Options μας επιτρέπει να εμφανίσουμε και κάποια περιγραφικά μέτρα. Η μία μεταβλητή θα είναι η στήλη της οποίας τη διάμεσο ελέγχουμε και η άλλη μεταβλητή η στήλη με την τιμή την οποία ελέγχουμε (174 για το παράδειγμα) Από τα αποτελέσματα του ελέγχου μας ενδιαφέρει Test Statistics b diam - ypsos Z -1,684 a Asymp. Sig. (2-tailed),092 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test κυρίως η γραμμή της Asymp. Sig. (2-tailed). Η τιμή p-value που υπολογίζεται μέσω του τεστ είναι 0,092. Αφού είναι μεγαλύτερη του 0,05, οδηγούμαστε στο συμπέρασμα ότι δεν μπορούμε να απορρίψουμε την μηδενική υπόθεση. Δηλαδή η διάμεσος του δείγματος δεν διαφέρει στατιστικά σημαντικά από την τιμή που ελέγξαμε (174). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 33

34 Σύγκριση των μέσων τιμών μίας μεταβλητής Παραμετρικό Τεστ Σύγκριση των μέσων τιμών μίας μεταβλητής σε δύο ανεξάρτητα δείγματα (έλεγχος µ 1 =µ 2 ) Πολλές φορές θέλουμε να ελέγξουμε, αν η μέση τιμή μιας ποσοτικής μεταβλητής διαφέρει σε δύο ανεξάρτητα δείγματα. Για παράδειγμα, αν το μέσο ύψος του δείγματος των 60 ανδρών (test2) του προηγούμενου παραδείγματος διαφέρει από το μέσο ύψος ενός νέου δείγματος 40 γυναικών (test 3). Μηδενική υπόθεση: µ 1 =µ 2 έναντι της Εναλλακτικής υπόθεσης: µ 1 µ 2 Η κατάλληλη δοκιμασία σε αυτή την περίπτωση είναι το Independent Samples t-test, αρκεί να ισχύουν οι προϋποθέσεις: Α) και οι δυο να κατανέμονται κανονικά Β) οι διασπορές τους να µην απέχουν πολύ. Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουμε σε µη παραμετρικό τεστ. SPSS: Analyze Compare Means Independent Samples t-test και δηλώνουμε την μεταβλητή που ξεχωρίζει τα δύο ανεξάρτητα δείγματα (grouping variable) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 34

35 Διαδικασία Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 35

36 Αποτελέσματα Group Statistics sex N Mean Std. Deviation Std. Error Mean ypsos man ,6683 3,01749,38956 woman ,3200 3,38179,53471 Ο πρώτος πίνακας περιέχει κάποια περιγραφικά μέτρα για τα δύο δείγματα. Ο δεύτερος πίνακας είναι αυτός που μας ενδιαφέρει. Το t τεστ έχει δύο κατευθύνσεις. Η μία κατεύθυνση είναι αυτή που δεν μπορούμε να υποθέσουμε ότι οι διακυμάνσεις των δύο δειγμάτων είναι περίπου ίσες και αυτή που μπορούμε να υποθέσουμε ότι είναι ίσες. Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means ypsos Equal variances assumed Equal variances not assumed F Sig. t df Sig. (2- tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper,320,573-2,555 98,012-1,65167, , , ,497 77,041,015-1,65167, , ,33434 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 36

37 Αποτελέσματα ypsos Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances Independent Samples Test F Sig. t df Sig. (2- tailed) t-test for Equality of Means Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper,320,573-2,555 98,012-1,65167, , , ,497 77,041,015-1,65167, , ,33434 Το τεστ του Levene ελέγχει την υπόθεση της ισότητας των δύο διακυμάνσεων και υπολογίζει μία p-value. Αν η p-value είναι μικρότερη του 0,05, απορρίπτεται η υπόθεση της ισότητας των διακυμάνσεων. Στην αντίθετη περίπτωση δεν απορρίπτεται. Επομένως, ανάλογα με την p-value (Sig.) του τεστ του Levene, κοιτάζουμε την πρώτη ή τη δεύτερη γραμμή αποτελεσμάτων. Στην προκειμένη περίπτωση η p-value είναι μεγαλύτερη του 0,05, άρα μπορούμε να υποθέσουμε ισότητα των δύο διακυμάνσεων. Επομένως θα κοιτάξω τη πρώτη γραμμή αποτελεσμάτων του πίνακα. Συνεχίζουμε λοιπόν με την πρώτη γραμμή της ανάλυσης που αφορά equal variances και έχουμε σύμφωνα με το p-value την απόρριψη της Η 0 : μ1 μ2 = 0 σε ε.σ. a = 0,05 (0,012 < 0,05). Δηλαδή φαίνεται ότι υπάρχει στατιστικά σημαντική διαφορά στα μέσα ύψη των δυο πληθυσμών. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 37

38 Σταδιακή ανάλυση Ερευνητικό ερώτημα: «Υπάρχει διαφορά στο ύψος μεταξύ των ανδρών και των γυναικών του δείγματος» ΒΗΜΑ 1 ο : Γράφουμε τη μηδενική υπόθεση, η οποία είναι αντίθετη με το ερευνητικό ερώτημα: Η 0 : μ α = μ γ ή Η 0 : μ α - μ γ =0 Όπου μ α, ο μέσος όρος του ύψους των ανδρών και μ γ ο μέσος όρος του ύψους των γυναικών ΒΗΜΑ 2 ο : Γράφουμε την εναλλακτική υπόθεση, η οποία είναι αντίθετη με τη μηδενική και περίπου ίδια με το ερευνητικό ερώτημα: Η a : μ α μ γ ή Η a : μ α - μ γ 0 ΒΗΜΑ 3ο: Ορίζουμε το επίπεδο στατιστικής σημαντικότητας (α): α = 0,05 ΒΗΜΑ 4 ο : Βρίσκουμε την πιθανότητα (p) να είναι ο μέσος του δείγματος να είναι διαφορετικός από την ελεγχόμενη τιμή, «κατά λάθος» ΒΗΜΑ 5 ο : Συγκρίνομε την πιθανότητα p με το α. Αν p > α αποτυγχάνομε να απορρίψομε τη μηδενική υπόθεση και συμπεραίνομε ότι δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των συγκρινόμενων μέσων όρων. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 38

39 Σύγκριση των μέσων τιμών μίας μεταβλητής Μη Παραμετρικό Τεστ Το αντίστοιχο μη παραμετρικό ανάλογο του t τεστ είναι το τεστ των Mann-Whitney- Wilcoxon. Η διαδικασία την οποία πρέπει να κάνουμε για εκτελέσουμε αυτό το μη παραμετρικό τεστ είναι ίδια με προηγουμένως (συνένωση των δύο μεταβλητών σε μία στήλη κ.λ.π.). Οι υποθέσεις σε αυτήν την περίπτωση ορίζονται ως εξής: Η 0 : Οι άνδρες και οι γυναίκες δεν διαφέρουν ως προς το ύψος τους Η 1 : Οι άνδρες και οι γυναίκες διαφέρουν ως προς το ύψος τους Επιλέγουμε Analyze Nonparametric Tests 2 Independent Samples Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 39

40 Αποτελέσματα Test Statistics a ypsos Mann-Whitney U 818,500 Wilcoxon W 2648,500 Z -2,685 Asymp. Sig. (2-tailed),007 a. Grouping Variable: sex Μας ενδιαφέρει κυρίως η γραμμή της Asymp. Sig. (2-tailed). Η τιμή p-value που υπολογίζεται μέσω του τεστ είναι 0,007. Αφού είναι μικρότερη του 0,05 οδηγούμαστε στο συμπέρασμα ότι μπορούμε να απορρίψουμε την μηδενική υπόθεση. Δηλαδή ότι ο μέσος όρος του ύψους των ανδρών διαφέρει με στατιστικά σημαντικό τρόπο από τον μέσο όρο του ύψους των γυναικών Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 40

41 Σύγκριση των μέσων τιμών δύο εξαρτημένων δειγμάτων Παραμετρικό Τεστ Είδαμε πως να κάνουμε έλεγχο υποθέσεων για δύο ανεξάρτητα δείγματα. Τι γίνεται όμως όταν τα δύο δείγματα δεν είναι, ή δεν μπορούμε να υποθέσουμε ότι είναι ανεξάρτητα; Την απάντηση τη δίνουν το t τεστ για ζεύγη παρατηρήσεων και ο έλεγχος των προσημασμένων τάξεων μεγέθους του Wilcoxon για δείγμα ζευγών παρατηρήσεων. Κλασικό παράδειγμα εφαρμογής των δύο αυτών τεστ είναι στην ιατρική, όταν έχουμε μετρήσεις για κάποια άτομα πριν και μετά από μία δίαιτα και ενδιαφερόμαστε να δούμε κατά πόσο ήταν αποτελεσματική η δίαιτα ή όχι. Και τις δύο φορές μετρήσαμε το βάρος των ίδιων ατόμων. Άρα γίνεται σαφές ότι τα μεγέθη των δύο δειγμάτων πρέπει να είναι απαραίτητα ίσα. Παράδειγμα : Για τον έλεγχο της αποτελεσματικότητας ενός σκευάσματος που καταπολεμά την παχυσαρκία, χορηγήθηκε συγκεκριμένη ποσότητά του σε 20 κατάλληλα πειραματόζωα. Σε καθένα από αυτά καταγράφηκε το βάρος του αμέσως πριν και μια εβδομάδα μετά την χορήγηση του σκευάσματος (test5). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 41

42 Διαδικασία Αποτελέσματα Για το t τεστ εργαζόμαστε ως εξής: επιλέγουμε Analyze Compare Means Paired - Samples T Test Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 prin 80, , ,23107 meta 79, , ,12201 Ο πρώτος πίνακας (Paired Samples Statistics) περιέχει το μέγεθος των δειγμάτων, τους μέσους, τις τυπικές αποκλίσεις των μέσων και τις τυπικές αποκλίσεις κάθε δείγματος. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 42

43 Διαδικασία Αποτελέσματα Paired Samples Correlations N Correlation Sig. Pair 1 prin & meta 20,824,000 Τα δεδομένα που χρησιμοποιήθηκαν στο παράδειγμα προέρχονται από μέτρηση του βάρους 20 πειραματόζωων που χρησιμοποιήθηκαν για τον έλεγχο της αποτελεσματικότητας ενός σκευάσματος που καταπολεμά την παχυσαρκία πριν και μετά την χορήγηση του. Πρόκειται δηλαδή για τα ίδια πειραματόζωα γεγονός που είναι εύλογο να υποθέσουμε εξάρτηση μεταξύ των δύο μετρήσεων του βάρους. Ο πίνακας (Paired Samples Correlations) επιβεβαιώνει την υπόθεση αυτή. Ο συντελεστής γραμμικής συσχέτισης που υπολογίστηκε έχει υψηλή τιμή, φανερώνοντας υψηλή γραμμική συσχέτιση μεταξύ των δύο μετρήσεων. Το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας για τον έλεγχο της υπόθεσης ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ των δύο μετρήσεων βάρους είναι ίσο με 0, γεγονός που σημαίνει ότι ο συντελεστής γραμμικής συσχέτισης είναι στατιστικά σημαντικός Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 43

44 Διαδικασία Αποτελέσματα Η τελευταία στήλη του παραπάνω πίνακα περιέχει το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας, το οποίο είναι ίσο με 0,02 Αφού είναι μικρότερο του 0,05 συμπεραίνουμε ότι οι μέσοι των δύο μετρήσεων του βάρους πριν και μετά την χορήγηση του σκευάσματος διαφέρουν με στατιστικά σημαντικό τρόπο. Επομένων το σκεύασμα έφερε τα επιδιωκόμενα αποτελέσματα. Paired Samples Test Paired Differences Std. Std. Error 95% Confidence Interval of the Difference Mean Deviation Mean Lower Upper t df Sig. (2-tailed) Pair 1 prin - meta 1,78 3,15,70548, , ,530 19,020 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 44

45 Σύγκριση των μέσων τιμών δύο εξαρτημένων δειγμάτων Μη Παραμετρικό Τεστ Το t τεστ όμως προϋποθέτει κανονικότητα των δεδομένων αν και αυτό το πρόβλημα μπορεί να ξεπεραστεί. Το αντίστοιχο μη παραμετρικό τεστ του Wilcoxon εκτελείται στο SPSS επιλέγοντας τα εξής: Analyze Nonparametric Tests 2 Related Samples Test Statistics b meta - prin Z -2,278 a Asymp. Sig. (2-tailed),023 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test Μας ενδιαφέρει κυρίως η γραμμή της Asymp. Sig. (2-tailed). Η τιμή p-value που υπολογίζεται μέσω του τεστ είναι 0,023. Αφού είναι μικρότερητου 0,05, οδηγούμαστε στο συμπέρασμα ότι μπορούμε να απορρίψουμε την μηδενική υπόθεση. Δηλαδή συμπεραίνουμε ότι οι μέσοι των δύο μετρήσεων του βάρους πριν και μετά την χορήγηση του σκευάσματος διαφέρουν με στατιστικά σημαντικό τρόπο Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 45

46 Συντελεστές γραμμικής συσχέτισης Οι συντελεστές που θα εξετάσουμε αναφέρονται στη γραμμικής φύσεως σχέση που μπορεί να συνδέει τις δύο μεταβλητές. Οι τιμές που μπορεί να πάρει ένας συντελεστής συσχέτισης είναι από -1 έως +1. Αρνητικές τιμές του συντελεστή γραμμικής συσχέτισης δύο μεταβλητών σημαίνει ότι έχουμε την ύπαρξη αρνητικής γραμμικής συσχέτισης. Δηλαδή, οι μεγαλύτερες τιμές της μίας μεταβλητής τείνουν να αντιστοιχούν στις μικρότερες τιμές της άλλης μεταβλητής. Θετικές τιμές του συντελεστή γραμμικής συσχέτισης είναι ένδειξη θετικής γραμμικής συσχέτισης μεταξύ των δύο μεταβλητών. Δηλαδή, οι μεγαλύτερες τιμές της μίας μεταβλητής τείνουν να αντιστοιχούν στις μεγαλύτερες τιμές της άλλη μεταβλητής. Τιμές κοντά στο μηδέν αποτελούν ένδειξη ότι δεν υπάρχει στατιστικά σημαντική γραμμική συσχέτιση μεταξύ των δύο μεταβλητών. Όσο πιο μεγάλες είναι οι τιμές του συντελεστή, ή όσο πιο κοντά βρίσκονται στη μονάδα (σε απόλυτη τιμή πάντα), τόσο πιο ισχυρή είναι η γραμμική συσχέτιση μεταξύ τους. Οι πιο γνωστοί συντελεστές γραμμικής συσχέτισης είναι οι συντελεστές του Pearson, του Spearman και του Kendall. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 46

47 Συντελεστές γραμμικής συσχέτισης Η μηδενική και η εναλλακτική υπόθεση εδώ είναι οι εξής: Η 0 : ρ=0 ή δεν υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών Η1: ρ 0 ή υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών Ο συντελεστής συσχέτισης του Pearson χρειάζεται την υπόθεση της κανονικότητας των δεδομένων, σε αντίθεση με τους άλλους δύο που δεν χρειάζονται την υπόθεση της κανονικότητας των δεδομένων. Βέβαια, για μεγάλα δείγματα, μεγέθους 30 παρατηρήσεων και πάνω και όσο το μέγεθος του δείγματος μεγαλώνει η θεωρία μας λέει ότι οι τιμές των συντελεστών πλησιάζουν η μία την άλλη. Η κύρια διαφορά των συντελεστών είναι ότι ο συντελεστής του Pearson υπολογίζεται με βάση τα δεδομένα, ενώ οι άλλοι δύο υπολογίζονται με βάση τις τάξεις μεγέθους των δεδομένων. Ειδικότερα, ο συντελεστής του Spearman είναι ο συντελεστής του Pearson στην ουσία υπολογισμένος για τις τάξεις μεγέθους των δεδομένων. Το γεγονός λοιπόν ότι οι συντελεστές του Spearman και του Kendall υπολογίζονται με βάση τις τάξεις μεγέθους των δεδομένων είναι που επιτρέπει την ελευθερία ως προς τη μη ικανοποίηση της κανονικότητας των μεταβλητών. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 47

48 Συντελεστές γραμμικής συσχέτισης Για να υπολογίσουμε τους τρεις αυτούς συντελεστές συσχέτισης στο SPSS επιλέγουμε τα εξής: Analyze Correlate Bivariate Στο κουτάκι variables πρέπει να περάσουμε τουλάχιστον δύο μεταβλητές, διότι οι συντελεστές συσχέτιση υπολογίζονται για ζεύγη μεταβλητών. Οπότε αν περάσουμε περισσότερες από δύο μεταβλητές, θα υπολογιστούν οι συντελεστές γραμμικής συσχέτισης για όλα τα ζεύγη των μεταβλητών. Βλέπουμε ότι μόνο ο συντελεστής του Pearson είναι επιλεγμένος. Αν θέλουμε να εμφανιστούν και οι άλλοι δύο συντελεστές απλά τους επιλέγουμε. Η επιλογή Options μας δίνει τη δυνατότητα εμφάνισης των μέσων, των τυπικών αποκλίσεων και των πληθών των τιμών για κάθε μεταβλητή. Παρατηρήστε ότι στο κάτω αριστερό μέρος του παραθύρου είναι επιλεγμένη μία επιλογή (Flag significant correlations). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 48

49 Συντελεστές γραμμικής συσχέτισης - Αποτελέσματα Correlations chol drug chol Pearson Correlation 1,000,354 ** Sig. (2-tailed),006 N drug Pearson Correlation,354 ** 1,000 Sig. (2-tailed),006 N **. Correlation is significant at the 0.01 level (2-tailed). Correlations chol drug Spearman's rho chol Correlation Coefficient 1,000,357 ** Sig. (2-tailed).,005 N drug Correlation Coefficient,357 ** 1,000 Sig. (2-tailed),005. N **. Correlation is significant at the 0.01 level (2-tailed). Βλέπουμε ότι για όλες τις τιμές των συντελεστών γραμμικής συσχέτισης υπάρχουν δύο αστεράκια. Αυτό γίνεται μέσω της επιλογής Flag significant correlations. Κάτω από κάθε τιμή του συντελεστή συσχέτισης εμφανίζεται μία p-value (Sig. (2-tailed)). Η p-value που έχει υπολογιστεί για κάθε συντελεστή ξεχωριστά και αναφέρεται στον έλεγχο της υπόθεσης ότι στο συγκεκριμένο ζεύγος μεταβλητών δεν υπάρχει γραμμική συσχέτιση. Αφού το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας είναι μικρότερο του 0,05, συμπεραίνουμε ότι αυτή η υπόθεση απορρίπτεται σε α=0,05. Άρα υπάρχει στατιστικά σημαντική γραμμική συσχέτιση μεταξύ του ζεύγους. Στην περίπτωση που η p-value είναι μικρότερη του 0,01, τότε ο συντελεστής συσχέτισης εμφανίζεται με δύο αστεράκια αντί για μόνο ένα. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 49

50 Συντελεστές γραμμικής συσχέτισης - Αποτελέσματα Σε αυτό το σημείο καλό θα ήταν να αναφέρουμε ότι ο συντελεστής του Kendall μπορεί να χρησιμοποιηθεί και στην περίπτωση που έχουμε κατηγορικές μεταβλητές οι οποίες όμως είναι υποχρεωτικά σε κλίμακα διάταξης. Είναι δηλαδή διατακτικές κατηγορικές μεταβλητές. Ακόμα να αναφέρουμε ότι με το συντελεστή γραμμικής συσχέτισης ελέγχουμε αν σε ένα ζεύγος μεταβλητών υπάρχει γραμμική συσχέτιση μόνο. Δηλαδή μπορεί να υπάρχει συσχέτιση μεταξύ των δύο μεταβλητών, αλλά όχι γραμμικής φύσεως. Σε αυτήν την περίπτωση αυτή η σχέση που συνδέει τις δύο μεταβλητές δεν μπορεί να ανιχνευτεί με το συντελεστή γραμμικής συσχέτισης. Οπότε προσοχή στην ερμηνεία που δίνουμε στο συντελεστή συσχέτισης. Να υπενθυμίσουμε επίσης ότι η λογική με την οποία απορρίπτουμε ή όχι μία υπόθεση είναι πάντα η ίδια. Αν το παρατηρηθέν επίπεδο στατιστικής σημαντικότητας είναι μικρότερο του 0,05 η υπόθεση απορρίπτεται. Στην αντίθετη περίπτωση δεν απορρίπτεται Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 50

51 Έλεγχος F Ο έλεγχος F χρησιμοποιείται για τα στατιστικά των οποίων η δειγματοληπτική κατανομή ακολουθεί την κατανομή F. Η ανάλυση διακύμανσης χρησιμοποιείται επίσης για να εξεταστεί η υπόθεση ότι οι μέσοι όροι μιας μέτρησης (εξαρτημένη μεταβλητή, ποσοτική) δεν διαφέρουν μεταξύ ομάδων που δημιουργεί μια ανεξάρτητη μεταβλητή (ποιοτική). Η ανάλυση αυτή είναι κατ ουσία μία επέκταση του τεστ ανεξαρτησίας αφού συμπεριλαμβάνει στην ανάλυση περισσότερες των δύο ομάδες τις τιμές της ανεξάρτητης μεταβλητής. Τα στατιστικά τα οποία ακολουθούν την κατανομή F και θα παρουσιασθούν εδώ είναι: Η διαφορά μεταξύ περισσοτέρων των δύο αριθμητικών μέσων Η διαφορά μεταξύ πολλαπλών μετρήσεων Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 51

52 Η Διαδικασία του Ελέγχου Στατιστικής Σημαντικότητας της Διαφοράς Μεταξύ Πολλών Αριθμητικών Μέσων (Ομάδων) Έλεγχος F (ANOVA) Το ερευνητικό ερώτημα: «Υπάρχει διαφορά στην μέτρηση της χοληστερίνης μεταξύ του δείγματος που λαμβάνουν διαφορετική ποσότητα φαρμάκου (η δοσολογία φαρμάκου χωρίζει το δείγμα σε πέντε κατηγορίες). ΒΗΜΑ 1 ο : Γράφουμε τη μηδενική υπόθεση η οποία είναι αντίθετη με το ερευνητικό ερώτημα: Η 0 : μ 0 = μ 1 = μ 2 = μ 3 = μ 4 (δεν υπάρχει διαφορά) όπου μ 0 : ο μέσος όρος των ανθρώπων που λαμβάνουν καθόλου φάρμακο, μ 1 : ο μέσος όρος που λαμβάνουν λίγο φάρμακο, μ 2, μ 3, μ 4 ΒΗΜΑ 2 ο : Γράφομε την εναλλακτική υπόθεση, η οποία είναι αντίθετη με τη μηδενική και περίπου ίδια με το ερευνητικό ερώτημα: Η a : μ 0 = μ 1 = μ 2 = μ 3 = μ 4 δεν ισχύει (υπάρχει διαφορά) ΒΗΜΑ 3 ο : Ορίζομε το επίπεδο στατιστικής σημαντικότητας (α): α = 0,05 ΒΗΜΑ 4 ο : Βρίσκομε την πιθανότητα (p) να υπάρχει διαφορά, «κατά λάθος». ΒΗΜΑ 5 ο : Συγκρίνομε την πιθανότητα p με το α. Αν p < α απορρίπτουμε τη μηδενική υπόθεση και συμπεραίνομε ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των μέσων ορών Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 52

53 Ανάλυση διακύμανσης (διασποράς) κατά ένα παράγοντα (One-way Anova). Από τα μενού analyze, compare means και One-Way ANOVA. Στη θέση factor ο χρήστης τοποθετεί την ανεξάρτητη χωρίς να χρειάζεται ο ορισμός των τιμών των ομάδων. ANOVA chol Sum of Squares Df Mean Square F Sig. Between Groups 17624, ,685 2,686,055 Within Groups , ,831 Total , Η πρώτη στήλη του πίνακα (Sum of Squares) αναφέρεται στο άθροισμα τετραγώνων μεταξύ των ομάδων, στο άθροισμα τετραγώνων εντός των ομάδων και τέλος στο σύνολο των ανωτέρω. Στη δεύτερη στήλη εμφανίζονται βαθμοί ελευθερίας μεταξύ των ομάδων (k-1) δηλαδή εδώ 2, οι βαθμοί ελευθερίας για το σύνολο των παρατηρήσεων (cases) και τέλος οι βαθμοί ελευθερίας που αντιστοιχούν στην μεταβλητότητα εντός των ομάδων. Στη τρίτη στήλη εμφανίζονται τα μέσα τετράγωνα (mean square) που προέρχονται από διαιρέσεις των αθροισμάτων τετραγώνων με τους βαθμούς ελευθερίας και η διαίρεση των οποίων δίνει το στατιστικό F με το επίπεδο σημαντικότητας στην τελευταία στήλη. Στην προκειμένη περίπτωση δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων (p>0,05). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 53

54 One-way Anova Η ανάλυση αυτή μας δίνει μια γενική αλλά όχι πλήρη απάντηση. Η στατιστική σημαντικότητα μέχρι εδώ υποδηλώνει ότι δεν υπάρχουν στατιστικά σημαντικές διαφορές αλλά δεν μας λέει ούτε πόσες ούτε ποιες διαφορές δεν είναι στατιστικά σημαντικές. Για να πάρομε τις λεπτομερείς αυτές πληροφορίες πρέπει να κάνουμε ένα ακόμη βήμα. Πριν πατήσομε OK στο προηγούμενο πλαίσιο διαλόγου, πατούμε το κουμπί Post Hoc και στο πλαίσιο που ανοίγει επιλέγομε έναν από τους ελέγχους Πολλαπλών Συγκρίσεων (Multiple Comparisons) που παρουσιάζονται, όπως φαίνεται στην παρακάτω εικόνα. Εδώ επιλέγουμε τον έλεγχο Bonferonni Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 54

55 One-way Anova - Αποτελέσματα Chol Bonferroni Multiple Comparisons (I) drug (J) drug Mean Dif Std. Error Sig. καθόλου ελάχιστη 95% Confidence Interval Lower Bound Upper Bound ελάχιστη -17, , ,000-61, ,5194 μικρή -29, ,09530,661-78, ,1203 μέτρια -45,71373 * 16,56580,047-91,0248 -,4026 καθόλου 17, , ,000-26, ,2252 μικρή -12, , ,000-61, ,4732 μέτρια -28, ,56580,555-73, ,9503 καθόλου 29, ,09530,661-20, ,8690 μικρή ελάχιστη 12, , ,000-37, ,5160 μέτρια -16, , ,000-67, ,4350 καθόλου 45,71373 * 16,56580,047, ,0248 μέτρια ελάχιστη 28, ,56580,555-16, ,6719 μικρή 16, , ,000-34, ,1138 *. The mean difference is significant at the 0.05 level. Όπως φαίνεται στον πίνακα (από τις τιμές των p) υπάρχουν στατιστικά σημαντικές διαφορές μόνο μεταξύ της ομάδας που παίρνει καθόλου δόση φαρμάκου και της ομάδας που παίρνει μέτρια δόση φαρμάκου ενώ μεταξύ των υπόλοιπων ομάδων δεν υπάρχουν στατιστικά σημαντικές διαφορές. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 55

56 Έλεγχος χ2 Ο έλεγχος που χρησιμοποιείται για τις σχέσεις μεταξύ δύο ή περισσότερων ονομαστικών ή και τακτικών μεταβλητών είναι γνωστός ως έλεγχος χ 2 (Chi Square). Αν και υπάρχουν επί μέρους στατιστικοί έλεγχοι για τα διάφορα μέτρα συνάφειας, ο έλεγχος χ 2 είναι ένας γενικός έλεγχος που μπορεί να χρησιμοποιηθεί για όλες τις περιπτώσεις που μπορούμε να φτιάξομε ένα πίνακα διμεταβλητών συχνοτήτων (CROSS-TABS), δηλαδή για όλες σχεδόν τις συνάφειες μη ισοδιαστημικών μεταβλητών. Η απαιτούμενη κλίμακα μέτρησης των μεταβλητών είναι η ονομαστική, παρόλο που και μεταβλητές με διατακτική κλίμακα μπορούν να χρησιμοποιηθούν. Ο Χ 2 έλεγχος ανεξαρτησίας χρησιμοποιείται για τον έλεγχο της υπόθεσης ότι δύο κατηγορικές μεταβλητές είναι ανεξάρτητες μεταξύ τους. Οι κατηγορικές μεταβλητές μπορούν να έχουν οσαδήποτε επίπεδα (ή κατηγορίες), αρκεί βέβαια η κάθε μία να έχει τουλάχιστον δύο επίπεδα. Το SPSS, όταν υπολογίζομε τους συντελεστές συσχετισμού (φ, λ κ.ά.), δίνει και το p που αντιστοιχεί στο καθένα στην τελευταία στήλη κάτω από την ένδειξη Approximate Significance. Για τον έλεγχο στατιστικής σημαντικότητας του κάθε συντελεστή, δεν έχομε παρά να συγκρίνομε το p με το α. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 56

57 Παράδειγμα Έχουμε ταξινομήσει ένα δείγμα 419 γυναικών ανάλογα με το αν πάσχουν από κατάθλιψη και αν είχαν κάποια τραυματική εμπειρία στη ζωή τους. Το ερώτημα είναι αν υπάρχει εξάρτηση μεταξύ της τραυματικής εμπειρίας και της κατάθλιψης. Κατάθλιψη Τραυματική Εμπειρία Όχι (0) Ναι (1) Σύνολο Όχι (0) Ναι (1) Σύνολο Η μηδενική υπόθεση είναι πάντα αυτή που δεν υποθέτει εξάρτηση (υποθέτει ανεξαρτησία μεταξύ των μεταβλητών). Η προϋπόθεση που απαιτείται από τον Χ 2 έλεγχο ανεξαρτησίας είναι οι συχνότητες των κελιών να είναι τουλάχιστον ίσες με 5. To SPSS χρησιμοποιεί το άλλο είδος υπόθεσης που θέλει τις αναμενόμενες συχνότητες των κελιών να είναι τουλάχιστον ίσες με 5. Ένα αποδεκτό ποσοστό κελιών που θα έχουν συχνότητες μικρότερες του 5 είναι το 25%, δηλαδή το πολύ ένα στα τέσσερα κελιά να έχει μία τιμή μικρότερη του 5 χωρίς να μειώνεται σημαντικά η αποτελεσματικότητα του τεστ. Αυτό ισχύει βέβαια και για πίνακες που έχουν περισσότερα κελιά. Αν αυτή η υπόθεση δεν ικανοποιείται, τότε κοιτάζουμε την p-value που υπολογίζεται με βάση το ακριβές τεστ του Fisher Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 57

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ. ΣΤ. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (ANALYSIS OF VARIANCE - ANOVA) ΣΤ 1. Ανάλυση ιασποράς κατά µία κατεύθυνση. Όπως έχουµε δει στη παράγραφο Β 2, όταν θέλουµε να ελέγξουµε, αν η µέση τιµή µιας ποσοτικής µεταβλητής διαφέρει

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Περιεχόμενα 1. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ...

Διαβάστε περισσότερα

T-tests One Way Anova

T-tests One Way Anova William S. Gosset Student s t Sir Ronald Fisher T-tests One Way Anova ΣΤΑΤΙΣΤΙΚΗ Νίκος Ζουρμπάνος Ρούσσος, Π.Λ., & Τσαούσης, Γ. (2002). Στατιστική εφαρμοσμένη στις κοινωνικές επιστήμες. Αθήνα: Ελληνικά

Διαβάστε περισσότερα

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ Να δοθούν οι βασικές αρχές των µη παραµετρικών ελέγχων (non-parametric tests). Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη παραµετρικοί έλεγχοι Να αναπτυχθεί η µεθοδολογία των

Διαβάστε περισσότερα

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Σύνολα Δεδομένων - Είδη Ποσοτικής Έρευνας: Παράλογες Ιδέες Γονέων (Δειγματοληπτική)

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΕΦΑΛΑΙΟ 19 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Όταν ενδιαφερόμαστε να συγκρίνουμε δύο πληθυσμούς, η φυσιολογική προσέγγιση είναι να προσπαθήσουμε να συγκρίνουμε

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 8 ο 8.1 Συντελεστές συσχέτισης: 8.1.1 Συσχέτιση Pearson, και ρ του Spearman 8.1.2 Υπολογισµός του συντελεστή

Διαβάστε περισσότερα

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

έρευνας και στατιστική» παραμετρικές συγκρίσεις» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ «Μεθοδολογία έρευνας και στατιστική» Μάθημα μεταπτυχιακού κύκλου σπουδών Διάλεξη: «Μη παραμετρικές συγκρίσεις» ΔΙΔΑΣΚΩΝ: Δρ. Αθανάσιος

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Διακύμανσης

Εισαγωγή στην Ανάλυση Διακύμανσης Εισαγωγή στην Ανάλυση Διακύμανσης 1 Η Ανάλυση Διακύμανσης Από τα πιο συχνά χρησιμοποιούμενα στατιστικά κριτήρια στην κοινωνική έρευνα Γιατί; 1. Ενώ αναφέρεται σε διαφορές μέσων όρων, όπως και το κριτήριο

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ Κωνσταντίνος Ζαφειρόπουλος Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Μακεδονίας Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA) ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 8. Ανάλυση διασποράς (ANOVA) Γενικά Επέκταση της σύγκρισης µέσων τιµών µεταβλητής ανάµεσα σε 2 δείγµατα (οµάδες ήστάθµες): Σύγκριση πολλών δειγµάτων (K>2) µαζί Σχέση ανάµεσα σε µια ποσοτική

Διαβάστε περισσότερα

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Πως μπορούμε να συγκρίνουμε μεταβλητές μεταξύ τους? Διαφορά συγκρίνοντας το μέσο μιας μεταβλητής (λόγος ή διάστημα) στις ομάδες πχ. t-test

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙO 5 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ Στο προηγούμενο κεφάλαιο εξετάσαμε διάφορες μορφές ελέγχου της υπόθεσης ότι ένα δείγμα παρατηρήσεων προέρχεται από κάποια συγκεκριμένη κατανομή. Στην

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας Επικοινωνία: Πτέρυγα 4, Τοµέας Κοινωνικής Ιατρικής Εργαστήριο Βιοστατιστικής Τηλ. 4613 e-mail: biostats@med.uoc.gr thalegak@med.uoc.gr

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Μηχανικών Πληροφορικής (ΤΕ) Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

Διαβάστε περισσότερα

Μη Παραµετρικοί Έλεγχοι

Μη Παραµετρικοί Έλεγχοι Μη Παραµετρικοί Έλεγχοι Επιστηµονική Επιµέλεια: ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας Εργαστήριο Γεωργίας Viola adorata Καταρχήν Μη Παραµετρικοί Έλεγχοι εν απαιτούν κανονικότητα

Διαβάστε περισσότερα

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία. . ΣΤΑΤΙΣΤΙΚΗ ΣΥΣΧΕΤΙΣΗ. Υπολογισµός συντελεστών συσχέτισης Προκειµένου να ελέγξουµε την ύπαρξη γραµµικής σχέσης µεταξύ δύο ποσοτικών µεταβλητών, χρησιµοποιούµε συνήθως τον παραµετρικό συντελεστή συσχέτισης

Διαβάστε περισσότερα

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική ΚΕΦΑΛΑΙΟ ΔΕΥΤΕΡΟ Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική Το πρώτο βήμα στην ανάλυση ενός συνόλου δεδομένων, που αποτελούν μετρήσεις ενός δείγματος είναι η παρουσίαση και σύνοψη των πληροφοριών

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Ένα Ερευνητικό Παράδειγμα Σκοπός της έρευνας ήταν να διαπιστωθεί εάν ο τρόπος αντίδρασης μιας γυναίκας απέναντι σε φαινόμενα

Διαβάστε περισσότερα

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Στατιστική Ι Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Παρασκευή, 30 Νοεμβρίου 2012 Στατιστική Ι Έννοιες - Κλειδιά Μεταβλητότητα Εύρος (range) Εκατοστημόρια

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Στόχοι: (a) να δοθεί µια εισαγωγή στη θεωρία της στατιστικής συµπερασµατολογίας ελέγχων υποθέσεων, (b) να παρουσιάσει τις βασικές εφαρµογές αυτών των ελέγχων: µέσης τιµής, ποσοστού

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Στατιστικοί Έλεγχοι Υποθέσεων Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Τι θέλουμε να συγκρίνουμε; Δύο δείγματα Μέση αρτηριακή πίεση σε δύο ομάδες Πιθανότητα θανάτου με δύο διαφορετικά

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Μη Παραµετρικά Κριτήρια. Παραµετρικά Κριτήρια

Μη Παραµετρικά Κριτήρια. Παραµετρικά Κριτήρια Κεφάλαιο 7 Μη Παραµετρικά Κριτήρια Παραµετρικά Κριτήρια Τα παραµετρικά κριτήρια είναι στατιστικά κριτήρια που απαιτούν την ικανοποίηση συγκεκριµένων προϋποθέσεων είτε αναφορικά µε συγκεκριµένες παραµέτρους

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση!

Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση! Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση! ΘΕΜΑ ο [Μονάδες 20] Ερώτημα i (4 μονάδες). Για να κάνουμε τους υπολογισμούς που χρειάζονται

Διαβάστε περισσότερα

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F Άσκηση 0, σελ. 9 από το βιβλίο «Μοντέλα Αξιοπιστίας και Επιβίωσης» της Χ. Καρώνη (i) Αρχικά, εισάγουμε τα δεδομένα στο minitab δημιουργώντας δύο μεταβλητές: τη x για τον άτυπο όγκο και την y για τον τυπικό

Διαβάστε περισσότερα

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) 5 H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) Περίληψη Σκοπός του κεφαλαίου είναι η εφαρμογή της ανάλυσης συσχέτισης (Pearson r) μέσω του PASW. H ανάλυση συσχέτισης Pearson r χρησιμοποιείται για να εξεταστεί η

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

= p 20 1 p 18. 1 p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

= p 20 1 p 18. 1 p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι Άσκηση 1 i) Σε κάθε παρατήρηση περιλαμβάνεται ένας έλεγχος (ο τελευταίος) κατά τον οποίο εμφανίστηκε το πρώτο ελαττωματικό της παραγωγικής διαδικασίας. Επομένως, ο αριθμός ελέγχων που έγιναν πριν εμφανιστεί

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

6.4. LOGLINEAR 90 8.5 (MANOVA) 121

6.4. LOGLINEAR 90 8.5 (MANOVA) 121 Φ Γ SPSS Dr. υ υ α α Θ α 2012 2 1. Γ SPSS 19.0 1.1 Φ Γ SPSS 4 1.2 Φ Γ 7 1.3 9 1.4 Φ 10 1.5 Pτ ΘHKH IAΓPAΦH 16 1.6 16 1.7 17 1.8 20 1.9 22 1.10 Γ 23 1.11 Γ Φ 25 1.12 Γ 27 1.13 Θ 28 2. Γ Φ 2.1 Θ, Γ, Γ 29

Διαβάστε περισσότερα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΟ 13 ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Στις προηγούμενες ενότητες ασχοληθήκαμε με μεθόδους που οδηγούν σε εκτιμήτριες των τιμών μιας ή και περισσοτέρων αγνώστων παραμέτρων. Αυτό έγινε με την κατασκευή

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p ΑΣΚΗΣΗ 1 ΣΕΜΦΕ 14-15 i. Έστω yi ο αριθμός των προσπαθειών κάθε μαθητή μέχρι να πετύχει τρίποντο. Ο αριθμός των προσπαθειών πριν ο μαθητής να πετύχει τρίποντο θα είναι xi = yi - 1, i = 1,,18. 2 2 3 2 1

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Μέρος 1 Εισαγωγή στο SPSS 37. 1 Βασικές αρχές καταχώρισης δεδομένων και στατιστικής ανάλυσης με το SPSS 39

Μέρος 1 Εισαγωγή στο SPSS 37. 1 Βασικές αρχές καταχώρισης δεδομένων και στατιστικής ανάλυσης με το SPSS 39 41 Περιεχόμενα Ξενάγηση στο βιβλίο 25 Ξενάγηση στο συνοδευτικό CD 27 Εισαγωγή 29 Ευχαριστίες 33 Οι βασικές διαφορές μεταξύ του SPSS 16 και των προηγούμενων εκδόσεων 35 Μέρος 1 Εισαγωγή στο SPSS 37 1 Βασικές

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 24 Μεθοδολογία Επιστηµονικής Έρευνας & Στατιστική Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Όπως ακριβώς συνέβη και στο κριτήριο t, τα δεδοµένα µας θα πρέπει να έχουν οµαδοποιηθεί χρησιµοποιώντας µια αντίστοιχη

Διαβάστε περισσότερα

Στατιστικό κριτήριο χ 2

Στατιστικό κριτήριο χ 2 18 Μεθοδολογία Επιστηµονικής Έρευνας & Στατιστική Στατιστικό κριτήριο χ 2 Ο υπολογισµός του κριτηρίου χ 2 γίνεται µέσω του µενού [Statistics => Summarize => Crosstabs...]. Κατά τη συγκεκριµένη διαδικασία

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows

Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Φιλοσοφίας, Παιδαγωγικής και Ψυχολογίας Τομέας Ψυχολογίας Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows Επιμέλεια: Λέκτορας Βασίλης

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA) ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA). Εισαγωγή Η ανάλυση της διακύμανσης (ANalysis Of VAriance ANOVA) είναι μια στατιστική μεθόδος με την οποία η μεταβλητότητα που υπάρχει σ ένα σύνολο δεδομένων διασπάται στις

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Ο παρακάτω πίνακας παρουσιάζει θανάτους από καρδιακή ανεπάρκεια ανάμεσα σε άνδρες γιατρούς οι οποίοι έχουν κατηγοριοποιηθεί κατά ηλικία

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21 Πίνακας Περιεχομένων Πρόλογος... 17 ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21 (Basic Sampling Techniques and Questionnaire Analysis using

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ 9 ο ΜΑΘΗΜΑ ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ Πότε κάνουμε ομαδοποίηση των παρατηρήσεων; Όταν το πλήθος των τιμών μιας μεταβλητής είναι αρκετά μεγάλο κάνουμε ομαδοποίηση των παρατηρήσεων. Αυτό συμβαίνει είτε

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Κεφάλαιο 17. Σύγκριση συχνοτήτων κατηγοριών: Το στατιστικό κριτήριο χ 2 17.1. ΠΡΟΫΠΟΘΕΣΕΙΣ ΓΙΑ ΤΗ ΧΡΗΣΗ ΤΟΥ ΚΡΙΤΗΡΙΟΥ 17.2.

Κεφάλαιο 17. Σύγκριση συχνοτήτων κατηγοριών: Το στατιστικό κριτήριο χ 2 17.1. ΠΡΟΫΠΟΘΕΣΕΙΣ ΓΙΑ ΤΗ ΧΡΗΣΗ ΤΟΥ ΚΡΙΤΗΡΙΟΥ 17.2. Κεφάλαιο 17 Σύγκριση συχνοτήτων κατηγοριών: Το στατιστικό κριτήριο χ 2 17.1. ΠΡΟΫΠΟΘΕΣΕΙΣ ΓΙΑ ΤΗ ΧΡΗΣΗ ΤΟΥ ΚΡΙΤΗΡΙΟΥ 17.2. ΕΙΣΑΓΩΓΗ 17.3. ΤΟ χ 2 ΓΙΑ ΜΙΑ ΠΟΙΟΤΙΚΗ ΜΕΤΑΒΛΗΤΗ 17.3.1. Ένα ερευνητικό παράδειγμα

Διαβάστε περισσότερα

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας Κεφάλαιο 5 Οι δείκτες διασποράς 1 Ένα παράδειγµα εργασίας Ένας καθηγητής µαθηµατικών έδωσε σε δύο τµήµατα µιας τάξης του σχολείου του το ίδιο τεστ. Η επίδοση των µαθητών του κάθε τµήµατος (όπως µετρήθηκε

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς Διασπορά Μέτρηση Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες έχουν μέση βαθμολογία 6. συνέχεια

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Πολλαπλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 7 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Πολλαπλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 7 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 12β ΕΡΓΑΣΤΗΡΙΟ 4β ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΜΕ ΤΗΝ ΧΡΗΣΗ SPSS

Διαβάστε περισσότερα

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ). Δισδιάστατη ανάλυση Πίνακες διπλής εισόδου Σε πολλές περιπτώσεις μελετάμε περισσότερες από μία μεταβλητές ταυτόχρονα. Π.χ. μία έρευνα που έγινε σε ένα δείγμα 58 ατόμων περιείχε τις ερωτήσεις «ποια είναι

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... v

Περιεχόμενα. Πρόλογος... v Περιεχόμενα Πρόλογος... v 1 Χρήση της έκδοσης 10 του SPSS για Windows και καταχώριση δεδομένων... 1 2 Περιγραφή μεταβλητών: πίνακες και γραφήματα... 19 3 Περιγραφή μεταβλητών αριθμητικά: μέσοι όροι, διακύμανση,

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ

Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Στον πίνακα που ακολουθεί δίδονται οι επιδόσεις 30 ατόμων σε ένα ψυχομετρικό test, που προσήλθαν ως υποψήφιοι για πρόσληψη σε τραπεζικό οργανισμό. Οι επιδόσεις αυτές συνοδεύονται και από το φύλο κάθε ατόμου,

Διαβάστε περισσότερα

Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων. Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή

Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων. Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή Δεκέμβριος 2011 Στόχος Έρευνας H βιτρίνα των καταστημάτων αποτελεί

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 9 ο 9.1 ηµιουργία µοντέλων πρόβλεψης 9.2 Απλή Γραµµική Παλινδρόµηση 9.3 Αναλυτικά για το ιάγραµµα ιασποράς

Διαβάστε περισσότερα

Μάθηµα 3 ο. Περιγραφική Στατιστική

Μάθηµα 3 ο. Περιγραφική Στατιστική Μάθηµα 3 ο Περιγραφική Στατιστική ΗΣτατιστικήείναι Μια τυποποιηµένη σειρά αναλυτικών µεθόδων, οι οποίες χρησιµοποιούνται από τον εκάστοτε ερευνητή για την ανάλυση των διαθέσιµων δεδοµένων. Υπάρχουν δύο

Διαβάστε περισσότερα

ΆΣΚΗΣΗ 1 Η διάμεσος τιμή της ηλικίας των Ελλήνων το 1990 ήταν 30 έτη. Το 2001, η διάμεσος τιμή ήταν 33,1 (Πηγή:Ε.Σ.Υ.Ε.).

ΆΣΚΗΣΗ 1 Η διάμεσος τιμή της ηλικίας των Ελλήνων το 1990 ήταν 30 έτη. Το 2001, η διάμεσος τιμή ήταν 33,1 (Πηγή:Ε.Σ.Υ.Ε.). ΛΥΜΕΝΕΣ ΣΚΗΣΕΙΣ ΆΣΚΗΣΗ 1 Η διάμεσος τιμή της ηλικίας των Ελλήνων το 1990 ήταν 30 έτη. Το 2001, η διάμεσος τιμή ήταν 33,1 (Πηγή:Ε.Σ.Υ.Ε.). a. Τι μπορεί να συνέβη όταν η διάμεσος αυξήθηκε; Το γεγονός ότι

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ ΕΡΓΑΣΤΗΡΙΟ PASW 18 Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 2011 2012 ΕΠΙΧ

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 7. Παλινδρόµηση Γενικά Επέκταση της έννοιας της συσχέτισης: Πώς µπορούµε να προβλέπουµε τη µια µεταβλητή από την άλλη; Απλή παλινδρόµηση (simple regression): Κατασκευή µοντέλου πρόβλεψης

Διαβάστε περισσότερα

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ 1o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ: ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Email: gvasil@math.auth.gr Ιστοσελίδες Μαθήματος: users.auth.gr/gvasil

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΕΡΕΥΝΑ ΑΓΟΡΑΣ ΣΕ ΞΕΝΟΔΟΧΕΙΑ ΤΗΣ ΚΡΗΤΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΑΠΌ ΣΑΛΟΥΣΤΡΟΥ ΑΝΤΙΓΟΝΗ ΣΥΓΛΕΤΟΥ ΕΛΕΝΗ

ΕΡΕΥΝΑ ΑΓΟΡΑΣ ΣΕ ΞΕΝΟΔΟΧΕΙΑ ΤΗΣ ΚΡΗΤΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΑΠΌ ΣΑΛΟΥΣΤΡΟΥ ΑΝΤΙΓΟΝΗ ΣΥΓΛΕΤΟΥ ΕΛΕΝΗ ΕΡΕΥΝΑ ΑΓΟΡΑΣ ΣΕ ΞΕΝΟΔΟΧΕΙΑ ΤΗΣ ΚΡΗΤΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΑΠΌ ΣΑΛΟΥΣΤΡΟΥ ΑΝΤΙΓΟΝΗ ΣΥΓΛΕΤΟΥ ΕΛΕΝΗ ΑΝΑΓΚΗ ΔΗΜΙΟΥΡΓΙΑΣ ΤΗΣ ΕΡΕΥΝΑΣ Μελέτη ποιοτικών χαρακτηριστικών ξενοδοχείων Συμβουλευτικές υπηρεσίες από εσωτερικούς

Διαβάστε περισσότερα

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑΠΡΟΤΥΠΑΜΑΘΗΜΑ4ο-5ο-6 ο (β) ΠΟΛΛΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ- ΕΡΓΑΣΤΗΡΙΟ PASW 18 Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 2011-2012 ΕΠΙΧ

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα