Στατιστικές μέθοδοι ανάλυσης δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Στατιστικές μέθοδοι ανάλυσης δεδομένων"

Transcript

1 ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(5): Στατιστικές μέθοδοι ανάλυσης δεδομένων 1. Εισαγωγή 2. Επίπεδο στατιστικής σημαντικότητας 3. Είδη δεδομένων 3.1. Ονομαστικά δεδομένα 3.2. Διατάξιμα δεδομένα 3.3. Δεδομένα διαστηματικής κλίμακας 3.4. Δεδομένα κλίμακας λόγου 3.5. Συνεχή και ασυνεχή δεδομένα 4. Αριθμητικά περιληπτικά μέτρα 5. Στατιστικές μέθοδοι ανάλυσης 5.1. Ποσοτικές μεταβλητές Παραμετρικές μέθοδοι Μη παραμετρικές μέθοδοι 5.2. Διατάξιμες μεταβλητές 5.3. Ονομαστικές μεταβλητές 6. Συσχέτιση 7. Γραμμική παλινδρόμηση 8. Λογιστική παλινδρόμηση 9. Ανάλυση επιβίωσης 10. Συμπεράσματα Copyright Athens Medical Society ARCHIVES OF HELLENIC MEDICINE: ISSN ARCHIVES OF HELLENIC MEDICINE 2009, 26(5): Π. Γαλάνης... Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας, Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών, Αθήνα Statistical methods of data analysis Λέξεις ευρετηρίου Ανάλυση δεδομένων Ανάλυση επιβίωσης Γραμμική παλινδρόμηση Λογιστική παλινδρόμηση Παραμετρικές μέθοδοι Abstract at the end of the article Υποβλήθηκε Εγκρίθηκε ΕΙΣΑΓΩΓΗ Το αντικείμενο των επιδημιολογικών μελετών είναι μια συνάρτηση συχνότητας (occurrence function) και πιο συγκεκριμένα ένα μέτρο σχέσης* (measure of association) που ποσοτικοποιεί τη σχέση μεταξύ του μελετώμενου προσδιοριστή** και της έκβασης.*** Προκειμένου να διαπιστωθεί αν η σχέση αυτή είναι στατιστικά σημαντική χρησιμοποιούνται οι έλεγχοι της στατιστικής σημαντικότητας (statistical significance tests) ή στατιστικοί έλεγχοι ή στατιστικές δοκιμασίες. 1 8 Οι έλεγχοι της στατιστικής σημαντικότητας (ΕΣΣ) χρησιμοποιούνται για τον έλεγχο της επιστημονικής υπόθεσης, που περιλαμβάνει δύο είδη υποθέσεων, τη μηδενική υπόθεση (null hypothesis) και την εναλλακτική (alternative). 1,3,4,8 Σημειώνεται ότι η επιστημονική υπόθεση αποτελεί καταφατική αποφαντική πρόταση και εισάγει μια νέα πληροφορία, ενώ η μηδενική ή η άκυρη υπόθεση δεν αποτελεί καν επιστημονική πρόταση, καθώς δεν υποστηρίζει το διαψεύσιμο * Τα μέτρα σχέσης που μπορούν να υπολογιστούν σε μια επιδημιολογική μελέτη είναι η διαφορά ή ο λόγος των μέτρων συχνότητας, το αποδοτέο κλάσμα στους εκτεθειμένους ή στο σύνολο του πληθυσμού, ο λόγος των οτζ και οι συντελεστές παλινδρόμησης. 1 ισχυρισμό για την ύπαρξη σχέσης μεταξύ προσδιοριστή και έκβασης και γι αυτό καλείται συχνά και υπόθεση της ** Παράγοντας κινδύνου (risk factor) ή έκθεση (exposure) ή προσδιοριστής (determinant), όπως τελικά επικράτησε να λέγεται σήμερα, είναι το χαρακτηριστικό συγγενές, περιβαλλοντικό ή συμπεριφοράς των ατόμων από το οποίο εξαρτάται (σχετίζεται ή συναρτάται) η συχνότητα εμφάνισης της μελετώμενης έκβασης (η οποία στην αιτιογνωστική επιδημιολογία είναι η εμφάνιση της πάθησης). 1,4,8 Ο προσδιοριστής της συχνότητας εμφάνισης μιας έκβασης περιλαμβάνει δύο κατηγορίες, την ενδεικτική κατηγορία (index category) και την κατηγορία αναφοράς (reference category). Η επιλογή της κατηγορίας αναφοράς του προσδιοριστή είναι μείζονος σημασίας στο σχεδιασμό της μελέτης. Είναι κρίσιμης σημασίας να γίνει αντιληπτό ότι η κατηγορία αναφοράς δεν είναι συμφυές χαρακτηριστικό του προσδιοριστή, αλλά αποτέλεσμα επιλογής του ερευνητή, άρα συνέπεια του σχεδιασμού της μελέτης. Από την επιλογή της κατηγορίας αναφοράς εξαρτάται η ερμηνεία των αποτελεσμάτων μιας μελέτης. Για παράδειγμα, προσδιοριστής της συχνότητας εμφάνισης της νεφρικής πάθησης δεν είναι η αρτηριακή υπέρταση, αλλά η αρτηριακή πίεση. Η αρτηριακή υπέρταση είναι μια κατηγορία και συνήθως η ενδεικτική κατηγορία του προσδιοριστή, στην οποία μελετάται η συχνότητα εμφάνισης της νεφρικής πάθησης σε σχέση πάντοτε με τη συχνότητα εμφάνισής της στην κατηγορία αναφοράς, στην προκειμένη περίπτωση στην κατηγορία των ατόμων που δεν έχουν αρτηριακή υπέρταση. *** Ο όρος έκβαση στην επιδημιολογία χρησιμοποιείται για να δηλώσει άλλοτε την εμφάνιση μιας πάθησης (health outcome) και άλλοτε την ίαση ή το θάνατο ή την εμφάνιση καταλοίπων από μια πάθηση (illness outcome).

2 700 Π. Γαλάνης μη διαφοράς και διατυπώνεται με σκοπό να απορριφθεί. Η συμπληρωματική έννοια της μηδενικής υπόθεσης καλείται εναλλακτική υπόθεση και υποστηρίζει ότι υπάρχει σχέση μεταξύ προσδιοριστή και έκβασης. Η εναλλακτική υπόθεση μπορεί να είναι «μονής κατεύθυνσης» (one-sided), υποστηρίζοντας ότι υπάρχει συγκεκριμένη σχέση είτε θετική είτε αρνητική μεταξύ προσδιοριστή και έκβασης, ή «διπλής κατεύθυνσης» (two-sided), υποστηρίζοντας την ύπαρξη σχέσης χωρίς όμως να καθορίζεται εάν είναι θετική ή αρνητική. Εάν είναι σαφές, πριν από τη διεξαγωγή μιας μελέτης, ότι υπάρχει θετική ή αρνητική σχέση μεταξύ προσδιοριστή και έκβασης, τότε η εναλλακτική υπόθεση μπορεί να είναι «μονής κατεύθυνσης». Αν μια μελέτη, π.χ., διερευνά τη σχέση μεταξύ καπνισματικής συνήθειας (προσδιοριστή) και συχνότητας εμφάνισης καρκίνου του πνεύμονα (έκβασης), τότε η εναλλακτική υπόθεση μπορεί να είναι μονής κατεύθυνσης, δηλαδή ότι το κάπνισμα αυξάνει τη συχνότητα εμφάνισης του καρκίνου του πνεύμονα. Αντιθέτως, εάν πριν από τη διεξαγωγή μιας μελέτης δεν είναι σαφής η σχέση μεταξύ προσδιοριστή και έκβασης, τότε η εναλλακτική υπόθεση είναι «διπλής κατεύθυνσης», γεγονός που συμβαίνει στην πλειονότητα των επιδημιολογικών μελετών. Με τους ελέγχους στατιστικής σημαντικότητας ελέγχεται η μηδενική υπόθεση και είτε απορρίπτεται είτε όχι. Σε καμιά περίπτωση όμως τα δεδομένα μιας μελέτης δεν μπορούν να προσφέρουν απόδειξη ότι η μηδενική υπόθεση είναι αληθής. Αν δεν απορριφθεί η μηδενική υπόθεση, τότε υποστηρίζεται ότι τα δεδομένα στα οποία στηρίζεται ο έλεγχος, δηλαδή τα δεδομένα της μελέτης, δεν επαρκούν για την απόρριψή της. Τονίζεται και πάλι ότι ο στατιστικός έλεγχος των υποθέσεων δεν οδηγεί στην απόδειξη της υπόθεσης, αλλά απλά παρέχει την πληροφορία εάν τα διαθέσιμα δεδομένα στηρίζουν την υπόθεση. Όταν η μηδενική υπόθεση δεν απορρίπτεται, δεν σημαίνει ότι είναι και αληθινή. Αντιθέτως, η απόρριψη της μηδενικής υπόθεσης σημαίνει ότι, σύμφωνα με τα δεδομένα μιας συγκεκριμένης μελέτης, υπάρχει σχέση μεταξύ προσδιοριστή και συχνότητας εμφάνισης της έκβασης. Σε μια μελέτη που διερευνά τη σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της συχνότητας εμφάνισης όγκου στον εγκέφαλο, η μηδενική υπόθεση υποστηρίζει ότι δεν υπάρχει σχέση μεταξύ προσδιοριστή και έκβασης, ενώ η εναλλακτική υπόθεση «διπλής κατεύθυνσης» υποστηρίζει την ύπαρξη σχέσης. Ανάλογα με το είδος των δεδομένων της μελέτης πραγματοποιείται ο κατάλληλος ΕΣΣ και απορρίπτεται ή όχι η μηδενική υπόθεση. Αν απορριφθεί η μηδενική υπόθεση, τότε σύμφωνα με τα δεδομένα της μελέτης αυτής υπάρχει σχέση μεταξύ της χρήσης κινητών και της συχνότητας εμφάνισης όγκου στον εγκέφαλο. Αντιθέτως, αν δεν απορριφθεί η μηδενική υπόθεση, τότε δεν σημαίνει ότι δεν υπάρχει σχέση μεταξύ της χρήσης κινητών και της συχνότητας εμφάνισης όγκου στον εγκέφαλο. Απλά σημαίνει ότι τα δεδομένα της μελέτης αυτής δεν προσέφεραν ένδειξη για την απόρριψη της μηδενικής υπόθεσης. Είναι πολύ πιθανό μια άλλη μελέτη να καταλήξει στο συμπέρασμα ότι υπάρχει σχέση. Προφανώς, όσο περισσότερες μελέτες απορρίψουν τη συγκεκριμένη μηδενική υπόθεση τόσο μεγαλύτερη ένδειξη υπάρχει ότι η χρήση κινητών τηλεφώνων σχετίζεται με τη συχνότητα εμφάνισης όγκου στον εγκέφαλο. Δεν είναι όμως δυνατόν να επαληθευτεί* η αιτιακή σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της συχνότητας εμφάνισης όγκου στον εγκέφαλο. Η μη απόρριψη, εξάλλου, της μηδενικής υπόθεσης σε μια μελέτη δεν σημαίνει ότι είναι αληθής και ότι δεν υπάρχει σχέση ανάμεσα στο μελετώμενο προσδιοριστή και τη συχνότητα εμφάνισης της έκβασης. 2. ΕΠΙΠΕΔΟ ΣΤΑΤΙΣΤΙΚΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ Το ερώτημα που γεννιέται είναι πώς μπορεί να απορριφθεί η μηδενική υπόθεση με τη χρήση του κατάλληλου στατιστικού ελέγχου της υπόθεσης. Για το σκοπό αυτό χρησιμοποιείται το παρατηρούμενο επίπεδο στατιστικής σημαντικότητας (τιμή p), που υπολογίζεται με τη χρήση του κατάλληλου στατιστικού μοντέλου ανάλογα με τα δεδομένα μιας μελέτης και το οποίο συγκρίνεται με ένα προκαθορισμένο επίπεδο στατιστικής σημαντικότητας (τιμή α). Το προκαθορισμένο επίπεδο σημαντικότητας καθορίζεται αυθαίρετα από τον ερευνητή και συνήθως λαμβάνει την τιμή 0,05 ή σπανιότερα την τιμή 0,10 ή την τιμή 0,01. 1,3,4,8 10 Η τιμή p υπολογίζεται σε σχέση με τη μηδενική υπόθεση, σύμφωνα με την οποία δεν υπάρχει σχέση μεταξύ προσδιοριστή και συχνότητας εμφάνισης της έκβασης. 1,3,4,8 Η τιμή p είναι η πιθανότητα, με δεδομένο ότι η μηδενική υπόθεση είναι αληθής, τα δεδομένα μιας μελέτης να παρουσιάσουν μια σχέση μεταξύ προσδιοριστή και συχνότητας εμφάνισης της έκβασης τόσο ακραία ή πιο ακραία από αυτήν που πραγματικά λαμβάνεται. Παραδείγματος χάρη, μια μελέτη διερευνά τη σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της συχνότητας εμφάνισης όγκου στον εγκέφαλο και υπολογίζεται ότι ο λόγος των επιπτώσεων-πυκνοτήτων είναι ίσος με 2,5. Η μηδενική υπόθεση είναι ότι δεν υπάρχει σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της * Ο όρος verification αποδίδεται με τον όρο επαλήθευση, ενώ ο όρος confirmation αποδίδεται με τον όρο επιβεβαίωση ή επικύρωση. Τέλος, ο όρος support αποδίδεται με τον όρο στήριξη.

3 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 701 συχνότητας εμφάνισης όγκου στον εγκέφαλο, οπότε ο λόγος των επιπτώσεων-πυκνοτήτων σε μια τέτοια περίπτωση είναι ίσος με τη μονάδα. Ανάλογα με τα δεδομένα της μελέτης χρησιμοποιείται το κατάλληλο στατιστικό μοντέλο για τον έλεγχο της μηδενικής υπόθεσης, οπότε προκύπτει μια τιμή p. Αυτή η τιμή p είναι η πιθανότητα, με δεδομένο ότι ο λόγος των επιπτώσεων-πυκνοτήτων είναι ίσος με τη μονάδα, μια μελέτη να δώσει λόγο των επιπτώσεων-πυκνοτήτων 2,5. Πρέπει να τονιστεί ότι η τιμή p δεν είναι η πιθανότητα ότι η μηδενική υπόθεση είναι αληθής. Η τιμή p υπολογίζεται με την προϋπόθεση ότι η μηδενική υπόθεση είναι αληθής. Όπως προαναφέρθηκε, για τον έλεγχο της μηδενικής υπόθεσης συγκρίνεται η τιμή p με την τιμή α, η οποία είναι αυθαίρετη και καθορίζεται από τον ερευνητή. Εάν η τιμή p, που προκύπτει από τα δεδομένα μιας μελέτης, είναι μικρότερη από την τιμή α, τότε απορρίπτεται η μηδενική υπόθεση, ενώ αν η τιμή p είναι μεγαλύτερη από την τιμή α, τότε δεν απορρίπτεται η μηδενική υπόθεση, αλλά και ούτε επιβεβαιώνεται. Εάν η τιμή α καθοριστεί ως 0,05, τότε οποιαδήποτε τιμή p η οποία είναι <0,05 οδηγεί στην απόρριψη της μηδενικής υπόθεσης. Μια τιμή p ίση με 0,07 οδηγεί στην απόρριψη της μηδενικής υπόθεσης όταν η τιμή α είναι 0,10, ενώ οδηγεί στη μη απόρριψη της μηδενικής όταν η τιμή α είναι 0,05. Έτσι, η ίδια τιμή p μπορεί να οδηγήσει σε ακριβώς αντίθετα συμπεράσματα ανάλογα με την τιμή α, οπότε γίνεται αντιληπτό ότι η χρήση των ελέγχων της στατιστικής σημαντικότητας και των παρατηρούμενων επιπέδων σημαντικότητας (τιμές p) για την εξαγωγή συμπερασμάτων είναι εξαιρετικά επισφαλής. Ακόμη και αν η τιμή p είναι μικρότερη από την τιμή α, αυτό δεν σημαίνει ότι η μηδενική υπόθεση δεν αποτελεί την πλέον λογική εξήγηση για τα δεδομένα μιας μελέτης. Συχνά, δεν αναφέρεται καν η ακριβής τιμή p, παρά μόνο αν η τιμή αυτή είναι μεγαλύτερη ή μικρότερη από την τιμή α. Δεν υπάρχει κανένας λόγος βέβαια ένα συνεχές μέτρο, όπως είναι η τιμή p, να μετατρέπεται σε διχοτόμο, επειδή έτσι χάνεται πολύτιμη πληροφορία. Όταν η τιμή α καθορίζεται ως 0,05, τότε τιμές p ίσες με 0,001 ή 0,049 οδηγούν σε απόρριψη της μηδενικής υπόθεσης. Είναι όμως πολύ μεγάλη η διαφορά ανάμεσα σε μια τιμή p ίση με 0,001 και μια τιμή p ίση με 0,049. Για το λόγο αυτόν πρέπει να αναφέρεται η ακριβής τιμή p και όχι απλά αν είναι μεγαλύτερη ή μικρότερη από την τιμή α. Μολονότι ακόμη και σήμερα πολλοί χρησιμοποιούν τους ελέγχους της στατιστικής σημαντικότητας και τις τιμές p για την εξαγωγή συμπερασμάτων,* είναι φανερό ότι οι * Μια μελέτη δεν επιτρέπει την εξαγωγή συμπερασμάτων, παρέχοντας μόνο ένδειξη (evidence) ενάντια της υπόθεσης. τιμές p αποτελούν απλά ένα συνεχές μέτρο της συμβατότητας μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης. Αυθαίρετο κριτήριο της συμβατότητας αυτής αποτελεί η τιμή α που καθορίζεται από τον ερευνητή. Έτσι, αν η τιμή α καθοριστεί ως 0,05, τότε οποιαδήποτε τιμή p <0,05 υποδηλώνει μικρή συμβατότητα της μηδενικής υπόθεσης με τα δεδομένα μιας μελέτης. Όσο μικρότερη δηλαδή είναι η τιμή p τόσο μικρότερη είναι η συμβατότητα μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης. Συμπερασματικά, η χρήση των τιμών p για την εξαγωγή ασφαλών συμπερασμάτων σχετικά με τον έλεγχο των επιστημονικών υποθέσεων είναι εξαιρετικά επισφαλής. Η τιμή p που προκύπτει σε μια μελέτη δεν πρέπει να αποτελεί κριτήριο για το αν μια μηδενική υπόθεση είναι αληθής ή όχι, καθώς απαιτείται η διεξαγωγή πολλών μελετών και η σύγκριση των αποτελεσμάτων που προκύπτουν με την εφαρμογή της μετα-ανάλυσης. Η τιμή p είναι απλά ένα μέτρο της συμβατότητας μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης και χρησιμοποιείται για την απόρριψη ή όχι της μηδενικής υπόθεσης. 11 Βέβαια, η μη απόρριψη της μηδενικής υπόθεσης δεν σημαίνει ότι είναι αληθής, αλλά ότι τα δεδομένα μιας μελέτης δεν προσφέρουν αρκετή απόδειξη για την απόρριψή της. Η τιμή p παρουσιάζει ένα σημαντικό μειονέκτημα, καθώς δεν εκφράζει το μέγεθος της σχέσης μεταξύ του προσδιοριστή και της συχνότητας εμφάνισης της έκβασης και την ακρίβεια απουσία τυχαίου σφάλματος με την οποία μετράται η σχέση αυτή. Για την καλύτερη ερμηνεία των δεδομένων μιας μελέτης είναι εξαιρετικά σημαντικό να διαχωρίζεται η πληροφορία για το μέγεθος της σχέσης αναφέροντας την τιμή του μέτρου σχέσης και η πληροφορία για την ακρίβεια της μελέτης αναφέροντας το κατάλληλο διάστημα εμπιστοσύνης. Αξίζει να αναφερθεί ότι στην εφαρμογή της τεχνικής του ελέγχου των υποθέσεων υπάρχουν δύο τύποι σφάλματος. 4 7 Το πρώτο ονομάζεται σφάλμα τύπου Ι (type I error) και είναι επίσης γνωστό ως σφάλμα απόρριψης (rejection error) ή, αλλιώς, σφάλμα α (α error). Ένα σφάλμα τύπου Ι συμβαίνει όταν απορρίπτεται η μηδενική υπόθεση, ενώ είναι αληθής. Η πιθανότητα να διαπραχθεί ένα σφάλμα τύπου Ι καθορίζεται από το προκαθορισμένο επίπεδο σημαντικότητας του ελέγχου (τιμή α). Εάν πραγματοποιηθούν κατ επανάληψη έλεγχοι της υπόθεσης διατηρώντας το επίπεδο σημαντικότητας στο 0,05, θα απορριφθεί λανθασμένα η μηδενική υπόθεση, ενώ είναι αληθής, 5 φορές στους 100 ΕΣΣ. Σε ορισμένες περιπτώσεις επιλέγεται η πιθανότητα 0,01, οπότε με τον τρόπο αυτόν απορρίπτεται λανθασμένα η μηδενική υπόθεση, ενώ είναι αληθής, μόνο μία φορά στους 100 ΕΣΣ. Ο δεύτερος τύπος σφάλματος που μπορεί να διαπραχθεί κατά την εφαρμογή ενός ελέγχου υπόθεσης είναι το σφάλμα τύπου ΙΙ (type II error), που είναι επίσης γνωστό ως σφάλμα αποδοχής (acceptance error) ή, αλλιώς, σφάλ-

4 702 Π. Γαλάνης μα β (β error). Ένα σφάλμα τύπου ΙΙ συμβαίνει όταν δεν απορρίπτεται η μηδενική υπόθεση, ενώ δεν είναι αληθής. Παραδείγματος χάρη, εάν β=0,10, τότε η πιθανότητα μη απόρριψης της μηδενικής υπόθεσης, ενώ δεν είναι αληθής, είναι 0,10 ή 10%. Εάν το β είναι η πιθανότητα να διαπραχθεί ένα σφάλμα τύπου ΙΙ, τότε (1 β) ονομάζεται στατιστική ισχύς (statistical power) του ελέγχου της υπόθεσης. Η ισχύς είναι η πιθανότητα να απορριφθεί η μηδενική υπόθεση, ενώ δεν είναι αληθής. Με άλλη διατύπωση, είναι η πιθανότητα να αποφευχθεί ένα σφάλμα τύπου ΙΙ. Επίσης, η ισχύς μπορεί να θεωρηθεί ως η πιθανότητα μια συγκεκριμένη μελέτη να διακρίνει μια απόκλιση από τη μηδενική υπόθεση δεδομένου ότι αυτή υπάρχει. Το συνηθέστερο σφάλμα είναι να θεωρείται μια θεωρία (υπόθεση) ως αληθής, ενώ δεν είναι, και σπανιότερα το αντίθετο. Γενικά, οι ερευνητές προσπαθούν να σχεδιάσουν ΕΣΣ που έχουν υψηλή ισχύ. Δεν αρκεί να υπάρχει μικρή πιθανότητα να απορριφθεί η μηδενική υπόθεση όταν αληθεύει. Πρέπει να υπάρχει μεγάλη πιθανότητα να απορριφθεί η μηδενική υπόθεση όταν δεν είναι αληθής. Ένας τρόπος αύξησης της ισχύος ενός ελέγχου είναι η αύξηση της τιμής α. Αύξηση της τιμής α προκαλεί αύξηση του σφάλματος τύπου Ι, αλλά συγχρόνως μείωση του σφάλματος τύπου ΙΙ. Αντιθέτως, μείωση της τιμής α προκαλεί μείωση του σφάλματος τύπου Ι και αύξηση του σφάλματος τύπου ΙΙ. Για το λόγο αυτόν, ο σχεδιασμός μιας μελέτης απαιτεί ιδιαίτερη προσοχή και ιδιαίτερα όσον αφορά στον προκαθορισμό της τιμής α. 3. ΕΙΔΗ ΔΕΔΟΜΕΝΩΝ Ο εμπειρικός καθορισμός των τιμών μιας αριθμητικής συνάρτησης ή, αλλιώς, μιας ποσοτικής έννοιας ονομάζεται μέτρηση. Ο όρος μέτρηση όμως χρησιμοποιείται συχνά και με ευρύτερη έννοια, περιλαμβάνοντας και την κατανομή των αντικειμένων μιας κατηγορίας σε τάξεις (ποιοτικές έννοιες). Ουσιαστικά, με τη διαδικασία της μέτρησης επιτυγχάνεται η συστηματική απόδοση αριθμών στα αντικείμενα και τις ιδιότητές τους, με αποτέλεσμα να διευκολύνεται σημαντικά η χρήση των μαθηματικών μεθόδων στη μελέτη και την περιγραφή των αντικειμένων και των σχέσεών τους. * Δεδομένα (data) ή εμπειρικά δεδομένα (empirical data), με την έννοια ότι υπάρχουν ανεξάρτητα από τη νόηση, δεν υφίστανται. Ουσιαστικά, αποτελούν παρατηρήσεις (observations) νοητικά φορτισμένες. Αυτό εξάλλου διακρίνει τις παρατηρήσεις από τις εντυπώσεις (impressions). Διακρίνονται διάφορα είδη ή επίπεδα μέτρησης με τη χρήση των ίδιων όρων και για τα δεδομένα* που αντιστοιχούν σε κάθε επίπεδο. Τα διάφορα αυτά είδη δεδομένων διαφέρουν τόσο στην ερμηνεία των αριθμητικών τιμών που χρησιμοποιούνται όσο και στον ΕΣΣ που επιλέγεται ως ο κατάλληλος για τη στατιστική ανάλυση. Οι μεταβλητές και κατ επέκταση και τα δεδομένα ανάλογα με τα μαθηματικά τους χαρακτηριστικά διακρίνονται σε ποιοτικές (qualitative) και ποσοτικές (quantitative), με τις πρώτες να διακρίνονται σε ονομαστικές και διατάξιμες και τις δεύτερες σε μεταβλητές διαστηματικής κλίμακας και μεταβλητές κλίμακας λόγου. 4 7, Ονομαστικά δεδομένα Τα ονομαστικά δεδομένα (nominal data) αποτελούν την απλούστερη και περισσότερο συνηθισμένη μορφή δεδομένων. Στην περίπτωση αυτή, τα αντικείμενα μιας ορισμένης κατηγορίας διασπώνται και εντάσσονται σε διάφορες ομάδες με τους αριθμούς να αποτελούν ουσιαστικά ονόματα ή χαρακτηρισμούς τάξεων και χωρίς να έχουν αριθμητικό νόημα. Για να είναι επιστημονικώς χρήσιμα τα δεδομένα ονομαστικής κλίμακας θα πρέπει (α) οι τάξεις να μην έχουν κοινά στοιχεία, δηλαδή να έχουν σαφώς προσδιορισμένο πλάτος, ώστε να αποκλείεται να ανήκει ένα στοιχείο σε περισσότερες από μία τάξεις και (β) η κατανομή των τάξεων να εξαντλεί την περιοχή όπου αναλύεται. Σημειώνεται ότι οι μεταβλητές (ο αγγλικός όρος είναι variate και όχι variable) δεν υπάρχουν στη φύση και αποτελούν στατιστικές έννοιες που σχεδιάζονται από τους ερευνητές, ενώ ως δεδομένα νοούνται οι τιμές που λαμβάνει μια μεταβλητή κατά τη μέτρησή της. Το φύλο, για παράδειγμα, δεν είναι μεταβλητή. Στην περίπτωση δημιουργίας μιας μεταβλητής για το φύλο, οι άνδρες μπορούν να λάβουν την τιμή 0 και οι γυναίκες την τιμή 1. Οι τιμές αυτές 0 και 1 δεν έχουν αριθμητικό νόημα και βεβαίως δεν αποτελούν τη μοναδική επιλογή. Είναι δυνατόν οι άνδρες να λάβουν την τιμή 1 και οι γυναίκες την τιμή 2 χωρίς να επηρεαστεί η ανάλυση** των δεδομένων. Παρόμοιο παράδειγμα αποτελεί η ομάδα αίματος, με τα άτομα, π.χ., της ομάδας ** Ο όρος «ανάλυση δεδομένων» περιλαμβάνει (α) τα περιγραφικά στατιστικά μέτρα (descriptive statistics) που συνοψίζουν τα δεδομένα και (β) τα διαλογισμικά στατιστικά μέτρα (inferential statistics) που χρησιμοποιούνται στα στατιστικά υποδείγματα ή, αλλιώς, μοντέλα αναφορικά με την εξαγωγή συμπερασμάτων για τα αντικείμενα μιας μελέτης, που είναι, ουσιαστικά, η παράμετρος που ενδιαφέρει τους ερευνητές. Πρέπει να σημειωθεί ότι ο όρος «ανάλυση δεδομένων» (data analysis) είναι εσφαλμένος εννοιολογικά, καθώς οι παρατηρήσεις δεν είναι δεδομένα και η επεξεργασία των παρατηρήσεων, οι οποίες θεωρητικά είναι φορτισμένες, αποτελεί σύνθεση και όχι ανάλυση. Στην ουσία, η «ανάλυση των δεδομένων» είναι το σύνολο της ένδειξης (evidence) που η εμπειρική έρευνα παράγει για τον έλεγχο της υπόθεσης. Τα «δεδομένα» αποτελούν το μέσο επιλογής του κατάλληλου μαθηματικού υποδείγματος, δηλαδή του υποδείγματος που ταιριάζει καλύτερα στα δεδομένα.

5 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 703 Α να λαμβάνουν την τιμή 1, τα άτομα της ομάδας Β την τιμή 2, τα άτομα της ομάδας ΑΒ την τιμή 3 και τα άτομα της ομάδας Ο την τιμή 4. Οι συμβολισμοί των διαφόρων ομάδων με αριθμούς διευκολύνει σημαντικά τη διαχείρισή τους με τη χρήση των ηλεκτρονικών υπολογιστών κατά την ανάλυση των δεδομένων. Τα δεδομένα ονομαστικής κλίμακας είναι γνωστά και ως κατηγορικά δεδομένα (categorical data), καθώς με τις μετρήσεις ένα ορισμένο αντικείμενο συνδέεται με μια ορισμένη κατηγορία ή τάξη (π.χ. άνδρας ή γυναίκα). Όταν τα δεδομένα ονομαστικής κλίμακας μπορούν να λάβουν μόνο μία από δύο συγκεκριμένες τιμές, όπως άνδρες και γυναίκες, τότε ονομάζονται διχότομα ή δυαδικά (dichotomous, binary). Τα διχότομα δεδομένα για παράδειγμα, η εμφάνιση ή όχι μιας πάθησης, θετικό ή αρνητικό αποτέλεσμα μιας εργαστηριακής δοκιμασίας κ.ά. χρησιμοποιούνται συχνά στις επιστήμες υγείας και γι αυτό έχουν αναπτυχθεί ιδιαίτερες μέθοδοι ανάλυσης, όπως π.χ. η λογιστική παλινδρόμηση Διατάξιμα δεδομένα Τα διατάξιμα δεδομένα (ordinal data) είναι εκείνα στα οποία η σειρά ή, αλλιώς, η διάταξη μεταξύ των διαφόρων κατηγοριών έχει σημασία, έτσι ώστε οι μεγαλύτερες αριθμητικές τιμές να αντιπροσωπεύουν την παρουσία ενός χαρακτηριστικού σε μεγαλύτερο βαθμό και οι μικρότερες την παρουσία του ίδιου χαρακτηριστικού σε μικρότερο βαθμό. Στην περίπτωση αυτή, τα αντικείμενα μιας ορισμένης κατηγορίας όχι μόνο διασπώνται και εντάσσονται σε διάφορες κατηγορίες ή τάξεις, αλλά είναι δυνατή και η διάταξη των τάξεων αυτών με τρόπο που επιτρέπει τις μεταξύ τους συγκρίσεις. Χαρακτηριστικό παράδειγμα διατάξιμης μεταβλητής στις επιστήμες υγείας αποτελεί ο βαθμός εγκαύματος, που λαμβάνει συνήθως τιμές 1 4, με τις υψηλότερες τιμές να αντιπροσωπεύουν σοβαρότερη μορφή εγκαύματος. Ένα άλλο παράδειγμα αποτελεί η ταξινόμηση των τραυματισμών σύμφωνα με το επίπεδο σοβαρότητάς τους, με τη μεταβλητή αυτή να λαμβάνει, π.χ., τιμές 1 4, όπου 1 αντιστοιχεί σε ελαφρύ τραυματισμό, 2 σε μέτριο, 3 σε σοβαρό και 4 σε θανατηφόρο. Και στις δύο περιπτώσεις η διάταξη των τάξεων ή κατηγοριών πραγματοποιείται λογικά, αλλά δεν είναι δυνατόν να ποσοτικοποιηθεί η διαφορά μεταξύ των κατηγοριών και να καθοριστεί αν η διαφορά, για παράδειγμα, μεταξύ εγκαυμάτων πρώτου και δεύτερου βαθμού είναι ίδια με τη διαφορά μεταξύ εγκαυμάτων τρίτου και τέταρτου βαθμού. Ιδιαίτερη κατηγορία διατάξιμων δεδομένων αποτελούν τα διατεταγμένα δεδομένα (ranked data), στα οποία οι παρατηρήσεις τοποθετούνται στη σειρά από τη μεγαλύτερη στη μικρότερη ή και αντίστροφα και στη συνέχεια αντικαθίστανται από αριθμούς που αντιστοιχούν στη θέση κάθε παρατήρησης στην ακολουθία. Ως παραδείγματα αναφέρονται η διάταξη των πολιτειών των ΗΠΑ με βάση τον πληθυσμό ή την έκτασή τους, καθώς και η διάταξη των αιτιών θανάτου με βάση τον αριθμό θανάτων που προκαλούν. Σημειώνεται ότι στην περίπτωση των διατάξιμων δεδομένων ως μέτρο κεντρικής τάσης χρησιμοποιείται η διάμεσος και όχι ο μέσος Δεδομένα διαστηματικής κλίμακας Στα δεδομένα διαστηματικής κλίμακας (interval scale data) έχει σημασία τόσο η διάταξη όσο και το μέγεθος, με τους αριθμούς να αντιπροσωπεύουν πραγματικές μετρήσιμες ποσότητες και όχι ονόματα ή χαρακτηρισμούς τάξεων. Τα διαστήματα που χωρίζουν τη μια τιμή της μεταβλητής από την άλλη έχουν διαφορετική βαρύτητα στα διάφορα σημεία της κλίμακας. Χαρακτηριστικό παράδειγμα της κατηγορίας αυτής αποτελεί η κλίμακα μέτρησης της έντασης των σεισμών ή, αλλιώς, κλίμακα Ρίχτερ, στην οποία οι τιμές της μεταβλητής μπορεί να απέχουν μεταξύ τους κατά ίση αριθμητική διαφορά, αλλά αυτό δεν συνεπάγεται κιόλας ότι οι διαφορές αυτές είναι ισοδύναμες. Στην περίπτωση της κλίμακας Ρίχτερ, η διαφορά της έντασης μεταξύ δύο σεισμών 4 και 5 βαθμών της κλίμακας Ρίχτερ δεν είναι ισοδύναμη με τη διαφορά μεταξύ δύο σεισμών 7 και 8 βαθμών της κλίμακας Ρίχτερ. Τα δεδομένα διαστηματικής κλίμακας είναι μαθηματικά αξιοποιήσιμα, αλλά δεν υφίσταται η σχέση του πολλαπλασιασμού μεταξύ των τιμών τους. Έτσι, έχει νόημα ότι ένας σεισμός 8 βαθμών της κλίμακας Ρίχτερ είναι ισχυρότερος από ένα σεισμό 4 βαθμών της κλίμακας Ρίχτερ, αλλά όχι ότι ο πρώτος είναι δύο φορές ισχυρότερος από το δεύτερο. Σημειώνεται ότι στην πράξη τα δεδομένα διαστηματικής κλίμακας χρησιμοποιούνται ελάχιστα Δεδομένα κλίμακας λόγου Τα δεδομένα κλίμακας λόγου (ratio scale data) υπερέχουν έναντι των δεδομένων διαστηματικής κλίμακας στο γεγονός ότι διαθέτουν ένα φυσικό μηδενικό σημείο έναρξης της μέτρησης. Οι περισσότερες μεταβλητές όπως το βάρος, το ύψος, η ηλικία, το εισόδημα, οι δαπάνες υγείας κ.ά. ανήκουν στην κατηγορία αυτή. Με τα δεδομένα κλίμακας λόγου είναι δυνατή η πρόσθεση, η αφαίρεση, ο πολλαπλασιασμός και η διαίρεση των δεδομένων. Παραδείγματος χάρη, ένα άτομο με ετήσιο εισόδημα ίσο με

6 704 Π. Γαλάνης ευρώ έχει διπλάσιο εισόδημα από ένα άτομο με ετήσιο εισόδημα ίσο με ευρώ. Επιπλέον, ένα άτομο βάρους 100 kg είναι δύο φορές βαρύτερο από ένα άτομο βάρους 50 kg. Σημειώνεται ότι τα δεδομένα των ευρύτατα χρησιμοποιούμενων κλιμάκων Likert, μολονότι είναι διατάξιμα, σε αρκετές περιπτώσεις αντιμετωπίζονται ως δεδομένα κλίμακας λόγου διευκολύνοντας σημαντικά τη στατιστική ανάλυση. Από στατιστική άποψη, η προσέγγιση αυτή δεν είναι η πλέον ενδεδειγμένη, αλλά εφόσον επιλεγεί πρέπει να αναφέρονται με σαφήνεια τα κριτήρια και οι προϋποθέσεις εφαρμογής της Συνεχή και ασυνεχή δεδομένα Σε αρκετές περιπτώσεις, τα ποσοτικά δεδομένα διακρίνονται σε συνεχή (continuous) και διακριτά ή ασυνεχή (discrete). Η διαφορά τους έγκειται στο γεγονός ότι τα ασυνεχή δεδομένα περιορίζονται στο να λαμβάνουν μόνο ακέραιες τιμές, οι οποίες διαφέρουν μεταξύ τους κατά συγκεκριμένες ποσότητες, ενώ τα συνεχή δεδομένα μπορούν να λάβουν οποιαδήποτε τιμή, ακόμη και δεκαδική. Τα περισσότερα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου αποτελούν συνεχή δεδομένα, γεγονός που διευκολύνει σημαντικά τη στατιστική ανάλυση. Παραδείγματα ασυνεχών μεταβλητών αποτελούν ο αριθμός των τροχαίων ατυχημάτων, ο αριθμός των γεννήσεων μιας γυναίκας και ο αριθμός των νέων περιπτώσεων μιας πάθησης που καταγράφηκαν σε μια χώρα σ ένα συγκεκριμένο χρονικό διάστημα, ενώ παραδείγματα συνεχών μεταβλητών αποτελούν το βάρος, το ύψος, η ηλικία, το εισόδημα, ο χρόνος, η θερμοκρασία, η αρτηριακή πίεση κ.ά. Σημειώνεται ότι σε ορισμένες περιπτώσεις οι συνεχείς μεταβλητές μετατρέπονται σε διατάξιμες εφόσον απαιτείται μικρότερος βαθμός λεπτομέρειας. Ανάλογα με το δείκτη μάζας σώματος, π.χ., τα άτομα μπορούν να ταξινομηθούν σε αδύνατα, φυσιολογικά, υπέρβαρα ή παχύσαρκα. 4. ΑΡΙΘΜΗΤΙΚΑ ΠΕΡΙΛΗΠΤΙΚΑ ΜΕΤΡΑ Τα αριθμητικά περιληπτικά μέτρα διακρίνονται στα μέτρα θέσης ή κεντρικής τάσης, που περιλαμβάνουν (α) τη μέση τιμή ή μέσο (mean), (β) τη διάμεσο (median) και (γ) την επικρατούσα τιμή (mode), και στα μέτρα μεταβλητότητας ή διασποράς, που περιλαμβάνουν (α) το εύρος (range), (β) το ενδοτεταρτημοριακό εύρος (interquartile range), (γ) τη διασπορά (variance), (δ) την τυπική απόκλιση (standard deviation) και (ε) το συντελεστή μεταβλητότητας (coefficient of variance). 5,6 Ο μέσος χρησιμοποιείται ως περιληπτικό μέτρο για συνεχή και ασυνεχή δεδομένα, ενώ επηρεάζεται σημαντικά από την ύπαρξη ακραίων τιμών. Η διάμεσος επηρεάζεται σε πολύ μικρότερο βαθμό από τις ακραίες τιμές σε σχέση με το μέσο και χρησιμοποιείται τόσο για συνεχή και ασυνεχή δεδομένα όσο και για διατάξιμα. Όταν η κατανομή μιας ομάδας δεδομένων είναι συμμετρική (ή, αλλιώς, κανονική), τότε ο μέσος αποτελεί το καλύτερο μέτρο κεντρικής τάσης, ενώ όταν η κατανομή παρουσιάζει ασυμμετρία ενδείκνυται η χρήση της διαμέσου. Στην περίπτωση δεδομένων που ακολουθούν την κανονική κατανομή, ως το πλέον κατάλληλο μέτρο εκτίμησης της μεταβλητότητας θεωρείται η τυπική απόκλιση, ενώ το ενδοτεταρτημοριακό εύρος αποτελεί το αντίστοιχο μέτρο στην περίπτωση δεδομένων που δεν ακολουθούν την κανονική κατανομή. 5. ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ Τα τελευταία χρόνια, η ευρεία χρήση των ηλεκτρονικών υπολογιστών και των στατιστικών προγραμμάτων, όπως SPSS (SPSS Inc, Chicago, Illinois, USA), STATA (Stata Corp LP, Texas, USA), SAS (SAS Institute Inc, North Carolina, USA), Statgraphics (Statpoint Inc, Virginia, USA), Statistica (Statsoft Inc, Tulsa, USA) κ.λπ., έχει διευκολύνει σημαντικά την ανάλυση δεδομένων ακόμη και για εκείνους που δεν είναι ιδιαίτερα εξοικειωμένοι με τις έννοιες της στατιστικής. Για το λόγο αυτόν κρίθηκε σκόπιμο να μην αναλυθούν οι μαθηματικές ισότητες που χρησιμοποιούνται στις διάφορες στατιστικές μεθόδους παρά μόνο να δημιουργηθεί ένας συνοπτικός και χρηστικός οδηγός ανάλυσης δεδομένων, χωρίς βέβαια να εξαντλείται το πολυδιάστατο αυτό θέμα. Στους πίνακες 1 και 2 παρουσιάζονται συνοπτικά οι στατιστικές μέθοδοι που χρησιμοποιούνται συχνότερα στις επιστήμες υγείας ανάλογα με το είδος και τον αριθμό των μεταβλητών. 2, Ποσοτικές μεταβλητές Στην περίπτωση των ποσοτικών μεταβλητών απαιτείται καταρχήν η διεξαγωγή ελέγχου κανονικότητας, όπου στην πλειονότητα των περιπτώσεων είναι ο έλεγχος Kolmogorov- Smirnov. 2,5 7 Σημειώνεται ότι στην περίπτωση όπου ο αριθμός των παρατηρήσεων είναι μικρός, συνιστάται η εφαρμογή του ελέγχου κανονικότητας Shapiro-Wilk. Με τους ελέγχους κανονικότητας εκτιμάται εάν η κατανομή των πληθυσμών από τους οποίους προέρχονται τα δεδομένα των «δειγμάτων» είναι η κανονική κατανομή ή αν την προσεγγίζει. Παραδείγματος χάρη, εάν το αντικείμενο μιας μελέτης είναι η σύγκριση του αναστήματος των αγοριών σε σχέση με εκείνο των κοριτσιών, τότε το πρώτο βήμα είναι να ελεγχθεί αν η κατανομή των πληθυσμών των αγοριών και των κοριτσιών από τους οποίους προέρχονται τα μελετώμενα

7 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 705 Πίνακας 1. Στατιστικές μέθοδοι ανάλυσης δεδομένων στην περίπτωση μιας εξαρτημένης και μιας ανεξάρτητης μεταβλητής. Εξαρτημένη μεταβλητή Ανεξάρτητη μεταβλητή Κατανομή πληθυσμών «Δείγματα» Μέθοδος Διχοτόμος Ποιοτική, ποσοτική Κανονική Ανεξάρτητα Απλή λογιστική παλινδρόμηση Ονομαστική Ονομαστική Ανεξάρτητα Έλεγχος x 2, ακριβής έλεγχος του Fisher Ονομαστική Ονομαστική Ανά ζεύγη Έλεγχος του McNemar Ποσοτική Διχοτόμος Κανονική Ανεξάρτητα Έλεγχος t για ανεξάρτητα «δείγματα» Ποσοτική Διχοτόμος Κανονική Ανά ζεύγη Έλεγχος t για «δείγματα» ανά ζεύγη Ποσοτική Ονομαστική (>2 κατηγορίες) Κανονική Ανεξάρτητα Ανάλυση διασποράς μίας κατεύθυνσης Ποσοτική Ονομαστική (>2 κατηγορίες) Κανονική Ανά ζεύγη Ανάλυση διασποράς για επαναλαμβανόμενες μετρήσεις Ποσοτική, διατάξιμη Διχοτόμος Μη κανονική Ανεξάρτητα Έλεγχος Mann-Whitney U Ποσοτική, διατάξιμη Διχοτόμος Μη κανονική Ανά ζεύγη Έλεγχος προσημασμένης διάταξης του Wilcoxon, έλεγχος προσήμου Ποσοτική, διατάξιμη Ονομαστική (>2 κατηγορίες) Μη κανονική Ανεξάρτητα Έλεγχος Kruskall-Wallis, έλεγχος διαμέσου Ποσοτική, διατάξιμη Ονομαστική (>2 κατηγορίες) Μη κανονική Ανά ζεύγη Έλεγχος Friedman, έλεγχος Kendall s W Ποσοτική Ποσοτική Κανονική Ανεξάρτητα Απλή γραμμική παλινδρόμηση Ποσοτική (χρόνος επιβίωσης) Διχοτόμος Μη κανονική Ανεξάρτητα Έλεγχος log-rank Πίνακας 2. Στατιστικές μέθοδοι ανάλυσης δεδομένων στην περίπτωση μιας εξαρτημένης και περισσοτέρων από μία ανεξάρτητων μεταβλητών. Εξαρτημένη μεταβλητή Ανεξάρτητη μεταβλητή Κατανομή πληθυσμών «Δείγματα» Μέθοδος Διχοτόμος Ποιοτικές, ποσοτικές Κανονική Ανεξάρτητα Πολλαπλή λογιστική παλινδρόμηση Ποσοτική Ονομαστικές Κανονική Ανεξάρτητα Πολυμεταβλητή ανάλυση διασποράς Ποσοτική Ποσοτικές Κανονική Ανεξάρτητα Ανάλυση συνδιασποράς Ποσοτική Ποιοτικές, ποσοτικές Κανονική Ανεξάρτητα Πολυμεταβλητή ανάλυση συνδιασποράς Ποσοτική Ποιοτικές, ποσοτικές Κανονική Ανεξάρτητα Πολλαπλή γραμμική παλινδρόμηση Ποσοτική (χρόνος επιβίωσης) Ποιοτικές, ποσοτικές Μη κανονική Ανεξάρτητα Μοντέλο αναλογικών κινδύνων του Cox «δείγματα» είναι η κανονική κατανομή ή όχι. Στην περίπτωση αυτή, απαιτείται η διεξαγωγή δύο ελέγχων κανονικότητας, τόσο δηλαδή για τον πληθυσμό των αγοριών όσο και για τον πληθυσμό των κοριτσιών. Εάν η σύγκριση, εξάλλου, αφορά στο βάρος κοριτσιών που γυμνάζονται 0 ώρες/ εβδομάδα, 1 7 ώρες/εβδομάδα ή >7 ώρες/εβδομάδα, τότε απαιτούνται τρεις έλεγχοι κανονικότητας για τους τρεις αυτούς διαφορετικούς πληθυσμούς κοριτσιών. Στην περίπτωση όπου η κατανομή των πληθυσμών από τους οποίους προέρχονται τα μελετώμενα «δείγματα» είναι η κανονική κατανομή (normal distribution), τότε χρησιμοποιούνται οι παραμετρικές μέθοδοι (parametric methods), ενώ στην περίπτωση που δεν είναι η κανονική κατανομή χρησιμοποιούνται οι μη παραμετρικές μέθοδοι. 2,5 7 Το σημαντικότερο πλεονέκτημα των μη παραμετρικών μεθόδων είναι ότι μπορούν να εφαρμοστούν στην περίπτωση όπου η κατανομή των πληθυσμών δεν είναι η κανονική κατανομή. Επιπλέον, στις μη παραμετρικές μεθόδους χρησιμοποιούνται οι διατάξεις των παρατηρήσεων και όχι οι πραγματικές τιμές των παρατηρήσεων, με αποτέλεσμα να είναι δυνατή η εφαρμογή τους και στην περίπτωση «δειγμάτων» με μικρό αριθμό παρατηρήσεων. Η χρήση, εξάλλου, των διατάξεων δίνει τη δυνατότητα εφαρμογής των μη παραμετρικών μεθόδων και στην περίπτωση διατάξιμων δεδομένων και όχι μόνο ποσοτικών. Επίσης, οι μη παραμετρικές μέθοδοι είναι λιγότερο ευαίσθητες στο σφάλμα μέτρησης εξαιτίας της χρήσης των διατάξεων. Οι μη παραμετρικές μέθοδοι, ωστόσο, παρουσιάζουν και ορισμένα μειονεκτήματα έναντι των αντίστοιχων παραμετρικών, όπως μικρότερη στατιστική ισχύ, λιγότερο ειδικές υποθέσεις και μη χρήση όλης της πληροφορίας που είναι γνωστή για μια κατανομή, καθώς χρησιμοποιούνται οι διατάξεις των παρατηρήσεων και όχι οι πραγματικές τους τιμές. Τέλος, στην περίπτωση των παραμετρικών μεθόδων, για τον έλεγχο της μηδενικής υπόθεσης χρησιμοποιούνται οι μέσες τιμές και η μεταβλητότητα των

8 706 Π. Γαλάνης παρατηρήσεων εκτιμάται με τη χρήση της τυπικής απόκλισης, ενώ στην περίπτωση των μη παραμετρικών μεθόδων χρησιμοποιούνται οι διάμεσοι και το ενδοτεταρτημοριακό εύρος, αντίστοιχα Παραμετρικές μέθοδοι. Στην περίπτωση όπου τα «δείγματα» είναι δύο και ανεξάρτητα μεταξύ τους για παράδειγμα, σύγκριση του αναστήματος μεταξύ αγοριών και κοριτσιών χρησιμοποιείται ο στατιστικός έλεγχος t για ανεξάρτητα «δείγματα» (independent samples t-test). 2,5 7 Στην περίπτωση όπου τα «δείγματα» είναι δύο, αλλά ανά ζεύγη, οπότε για κάθε παρατήρηση στην πρώτη ομάδα υπάρχει μια αντίστοιχη παρατήρηση στη δεύτερη ομάδα, χρησιμοποιείται ο έλεγχος t για «δείγματα» ανά ζεύγη (paired samples t-test). Ως παραδείγματα στην κατηγορία αυτή αναφέρονται η σύγκριση της συστολικής πίεσης πριν και μετά από τη χορήγηση ενός φαρμάκου σε μια ομάδα πασχόντων και η σύγκριση των γνώσεων σχετικά με τις μεταμοσχεύσεις ιστών και οργάνων πριν και μετά από την εφαρμογή ενός εκπαιδευτικού προγράμματος σε μια ομάδα φοιτητών. Στους δύο αυτούς ελέγχους t, η μηδενική υπόθεση που ελέγχεται είναι ότι οι μέσες τιμές της ποσοτικής μεταβλητής στους δύο πληθυσμούς από τους οποίους προέρχονται τα μελετώμενα «δείγματα» είναι ίσες. Έτσι, υπολογίζονται η τιμή p, η διαφορά μεταξύ των μέσων των δύο «δειγμάτων» και το 95% διάστημα εμπιστοσύνης για τη διαφορά αυτή. Όπως προαναφέρθηκε, όταν η τιμή p είναι μικρότερη από την τιμή α, η οποία συνήθως ορίζεται στο επίπεδο του 0,05, τότε απορρίπτεται η μηδενική υπόθεση και η διαφορά μεταξύ των μέσων των δύο πληθυσμών είναι στατιστικώς σημαντική. Σημειώνεται ότι όταν το διάστημα εμπιστοσύνης δεν περιλαμβάνει την τιμή 0, τότε η διαφορά μεταξύ των δύο μέσων είναι στατιστικώς σημαντική. Το διάστημα εμπιστοσύνης όμως δεν πρέπει να χρησιμοποιείται μόνο για τον έλεγχο της μηδενικής υπόθεσης, αλλά κυρίως για την εκτίμηση του τυχαίου σφάλματος σε μια μέτρηση. Έτσι, τα μικρά διαστήματα εμπιστοσύνης υποδηλώνουν μικρότερο τυχαίο σφάλμα και μεγαλύτερη ακρίβεια, ενώ τα μεγάλα διαστήματα εμπιστοσύνης υποδηλώνουν μεγαλύτερο τυχαίο σφάλμα και μικρότερη ακρίβεια. Σε μια μελέτη, π.χ., βρέθηκε ότι το μέσο ανάστημα του «δείγματος» των κοριτσιών ήταν 164 cm, το μέσο ανάστημα του «δείγματος» των αγοριών ήταν 172 cm, η διαφορά μεταξύ των μέσων αναστημάτων ήταν 8 cm, το 95% διάστημα εμπιστοσύνης για τη διαφορά αυτή ήταν 6,6 9,3 cm και η τιμή p του ελέγχου t για ανεξάρτητα «δείγματα» ήταν <0,001. Με βάση τα αποτελέσματα της ανάλυσης των δεδομένων των δύο «δειγμάτων» προέκυψε ότι το μέσο ανάστημα του πληθυσμού των αγοριών ήταν μεγαλύτερο από εκείνο του πληθυσμού των κοριτσιών και μάλιστα η σχέση αυτή ήταν και στατιστικώς σημαντική. Για τη σύγκριση των μέσων τιμών περισσοτέρων από δύο πληθυσμών χρησιμοποιείται η ανάλυση διασποράς μίας κατεύθυνσης (one-way analysis of variance, ANOVA). Στην περίπτωση, παραδείγματος χάρη, όπου συγκρίνονται οι μέσοι τριών πληθυσμών, η μηδενική υπόθεση είναι ότι οι μέσοι των τριών πληθυσμών από τους οποίους προέρχονται οι παρατηρήσεις των αντίστοιχων τριών «δειγμάτων» είναι ίσοι μεταξύ τους. Η ανάλυση διασποράς μπορεί να ελέγξει τη μηδενική αυτή υπόθεση, αλλά για να πραγματοποιηθούν ανά δύο συγκρίσεις μεταξύ των μέσων χωρίς να αυξηθεί το σφάλμα τύπου Ι απαιτείται επιπλέον η εφαρμογή μιας post hoc μεθόδου πολλαπλής σύγκρισης. Συνήθως εφαρμόζεται το κριτήριο του Bonferroni (για μέχρι 10 συγκρίσεις) και σπανιότερα το κριτήριο του Tukey ή του Scheffe. Με τον τρόπο αυτόν επιτυγχάνεται η διεξαγωγή πολλαπλών συγκρίσεων χωρίς αύξηση του σφάλματος τύπου Ι. Όταν η εξαρτημένη μεταβλητή είναι ποσοτική μεταβλητή που ακολουθεί την κανονική κατανομή π.χ. δείκτης μάζας σώματος και οι ανεξάρτητες μεταβλητές είναι δύο ή περισσότερες ποιοτικές μεταβλητές (για παράδειγμα, φύλο, φυσική άσκηση ή όχι, κατανάλωση οινοπνεύματος ή όχι κ.λπ.), τότε χρησιμοποιείται η πολυμεταβλητή ανάλυση διασποράς (multivariate analysis of variance, MANOVA), ενώ όταν οι ανεξάρτητες μεταβλητές είναι δύο ή περισσότερες ποσοτικές μεταβλητές (π.χ. ηλικία, ώρες άθλησης, αριθμός τσιγάρων κ.ά.), τότε χρησιμοποιείται η ανάλυση συνδιασποράς (analysis of covariance, ANCOVA). Η πολυμεταβλητή ανάλυση διασποράς χρησιμοποιείται λιγότερο συχνά και στην περίπτωση περισσοτέρων από μίας συσχετιζόμενων εξαρτημένων μεταβλητών αποβλέποντας στην πραγματοποίηση ενός μόνο στατιστικού ελέγχου για το σύνολο αυτό των μεταβλητών αντί της διεξαγωγής πολλαπλών ξεχωριστών ελέγχων. Τέλος, όταν οι ανεξάρτητες μεταβλητές (ποιοτικές και ποσοτικές) είναι δύο ή περισσότερες, τότε χρησιμοποιείται η πολυμεταβλητή ανάλυση συνδιασποράς (multivariate analysis of covariance, MANCOVA). Στην περίπτωση της σύγκρισης μέσων τιμών περισσοτέρων από δύο πληθυσμών ανά ζεύγη χρησιμοποιείται η ανάλυση διασποράς μίας κατεύθυνσης για επαναλαμβανόμενες μετρήσεις (repeated measures one-way analysis of variance). Χαρακτηριστικό παράδειγμα της κατηγορίας αυτής αποτελεί η σύγκριση των μέσων τιμών μιας ποσοτικής μεταβλητής σε περισσότερες από δύο χρονικές στιγμές. Η εκτίμηση, για παράδειγμα, της αποτελεσματικότητας μιας δίαιτας σ ένα μελετώμενο πληθυσμό 50 γυναικών πραγματοποιείται με τη σύγκριση του μέσου βάρους αυτών των γυναικών ένα μήνα, 2 μήνες και 3 μήνες μετά από την έναρξη της δίαιτας. Δηλαδή, πρόκειται για τρία «δείγματα» με επαναλαμβανόμενες μετρήσεις του βάρους. Τα «δείγματα» αυτά αποτελούνται από τις ίδιες, 50 γυναίκες, σε διαφορετικές όμως χρονικές στιγμές Μη παραμετρικές μέθοδοι. Όπως προαναφέρθηκε,

9 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 707 στην περίπτωση όπου η κατανομή των πληθυσμών από τους οποίους προέρχονται τα μελετώμενα «δείγματα» δεν είναι η κανονική κατανομή, τότε χρησιμοποιούνται οι μη παραμετρικές μέθοδοι, στις οποίες λαμβάνονται υπόψη οι διατάξεις των παρατηρήσεων και όχι οι πραγματικές τιμές των παρατηρήσεων, με αποτέλεσμα να είναι δυνατή η εφαρμογή τους και στην περίπτωση «δειγμάτων» με μικρό αριθμό παρατηρήσεων. 2,5 7 Στις μη παραμετρικές μεθόδους, η μηδενική υπόθεση δεν αφορά στη σύγκριση των μέσων τιμών των πληθυσμών από τους οποίους προέρχονται τα «δείγματα», αλλά στη σύγκριση των διαμέσων. Στην περίπτωση όπου τα «δείγματα» είναι δύο και ανεξάρτητα μεταξύ τους χρησιμοποιείται ο στατιστικός έλεγχος Mann-Whitney U ή, αλλιώς, έλεγχος αθροίσματος διατάξεων του Wilcoxon (Wilcoxon rank-sum test) ή, αλλιώς, έλεγχος Mann-Whitney-Wilcoxon. Στην περίπτωση όπου τα «δείγματα» είναι δύο, αλλά ανά ζεύγη, οπότε για κάθε παρατήρηση στην πρώτη ομάδα υπάρχει μια αντίστοιχη παρατήρηση στη δεύτερη ομάδα, χρησιμοποιείται ο έλεγχος προσημασμένης διάταξης του Wilcoxon (Wilcoxon signed-ranked test) ή ο έλεγχος προσήμου (sign test). Στην περίπτωση όπου τα «δείγματα» είναι περισσότερα από δύο και ανεξάρτητα μεταξύ τους χρησιμοποιείται ο έλεγχος Kruskal-Wallis ή ο έλεγχος της διαμέσου (median test), ενώ στην περίπτωση όπου τα «δείγματα» είναι περισσότερα από δύο και ανά ζεύγη χρησιμοποιείται ο έλεγχος Friedman ή ο έλεγχος Kendall s W ή ο έλεγχος Cochran Διατάξιμες μεταβλητές Όπως προαναφέρθηκε, η χρήση των διατάξεων στις μη παραμετρικές μεθόδους παρέχει τη δυνατότητα εφαρμογής τους και στην περίπτωση διατάξιμων δεδομένων και όχι μόνο ποσοτικών. Έτσι, οι στατιστικές μέθοδοι για την ανάλυση διατάξιμων δεδομένων είναι οι μη παραμετρικές μέθοδοι που χρησιμοποιούνται στην περίπτωση των ποσοτικών δεδομένων Ονομαστικές μεταβλητές Στην περίπτωση όπου τα «δείγματα» είναι ανεξάρτητα μεταξύ τους χρησιμοποιείται ο έλεγχος x 2 (chi-square test), ενώ όταν οι παρατηρήσεις των «δειγμάτων» είναι ανά ζεύγη χρησιμοποιείται ο έλεγχος του McNemar. 2,5 7 Με τους ελέγχους x 2 και McNemar συγκρίνονται οι συχνότητες (ή τα ποσοστά) στις διάφορες κατηγορίες των ονομαστικών μεταβλητών. Παραδείγματος χάρη, η διερεύνηση της σχέσης μεταξύ του φύλου και της συχνότητας εμφάνισης καρδιαγγειακών παθήσεων μπορεί να πραγματοποιηθεί με τον έλεγχο x 2, χωρίς όμως ο έλεγχος αυτός να αποτελεί και τη μοναδική επιλογή. Έτσι, στο συγκεκριμένο παράδειγμα, όπου η εξαρτημένη μεταβλητή εμφάνιση ή όχι καρδιαγγειακών παθήσεων είναι διχοτόμος, προτιμάται η εφαρμογή της λογιστικής παλινδρόμησης και όχι του ελέγχου x 2. Ορισμένοι προτείνουν να χρησιμοποιείται ο έλεγχος x 2 με διόρθωση συνέχειας (continuity correction) ή, αλλιώς, με διόρθωση του Yates (Yates correction), επιτυγχάνοντας έτσι τη μείωση του σφάλματος τύπου Ι, αυξάνοντας όμως ταυτόχρονα την πιθανότητα του σφάλματος τύπου ΙΙ. Όταν διερευνάται η σχέση μεταξύ δύο διχοτόμων μεταβλητών και ο συνολικός αριθμός των παρατηρήσεων είναι μικρός (<20 παρατηρήσεις), τότε αντί του ελέγχου x 2 χρησιμοποιείται ο ακριβής έλεγχος του Fisher (Fisher s exact test). Ένα δεύτερο κριτήριο εφαρμογής του ελέγχου Fisher είναι η ύπαρξη έστω και μίας αναμενόμενης τιμής (expected value) <10 σε ένα από τα τέσσερα κελιά του 2 2 πίνακα συνάφειας (contingency table) που δημιουργείται με βάση τις παρατηρούμενες τιμές (observed values). 6. ΣΥΣΧΕΤΙΣΗ Το είδος και το μέγεθος της γραμμικής σχέσης μεταξύ δύο ποσοτικών μεταβλητών που ακολουθούν την κανονική κατανομή εκτιμάται με το συντελεστή συσχέτισης του Pearson (Pearson s coefficient of correlation), ενώ όταν έστω και μία από τις δύο ποσοτικές μεταβλητές δεν ακολουθεί την κανονική κατανομή, τότε χρησιμοποιείται ο συντελεστής συσχέτισης διατάξεων του Spearman (Spearman s rank correlation coefficient). 2,5 7 Επιπλέον, ο συντελεστής συσχέτισης διατάξεων του Spearman χρησιμοποιείται και στην περίπτωση όπου η μία ή και οι δύο μεταβλητές είναι σε διατεταγμένη κλίμακα. Ο συντελεστής συσχέτισης του Pearson συμβολίζεται με p όταν αφορά σε ολόκληρο τον πληθυσμό και με r όταν υπολογίζεται για ένα συγκεκριμένο «δείγμα» (αποτελώντας έτσι εκτίμηση για τον πληθυσμό από τον οποίο προέρχεται το «δείγμα»). Ο συντελεστής συσχέτισης του Pearson δεν έχει μονάδες μέτρησης και λαμβάνει τιμές από -1 έως +1. Οι τιμές -1 έως +1 συμβαίνουν όταν υπάρχει μια τέλεια (αρνητική ή θετική, αντίστοιχα) γραμμική σχέση μεταξύ των δύο μεταβλητών. Όταν ο συντελεστής συσχέτισης λαμβάνει την τιμή 0 σημαίνει ότι δεν υπάρχει γραμμική σχέση μεταξύ των δύο μεταβλητών, αλλά δεν αποκλείεται η ύπαρξη μιας άλλης μη γραμμικής σχέσης. Εάν το μέγεθος της μιας μεταβλητής τείνει να αυξάνεται όπως αυξάνεται το μέγεθος και της άλλης μεταβλητής, τότε υπάρχει θετική συσχέτιση (positive correlation) μεταξύ των δύο μεταβλητών και ο συντελεστής συσχέτισης είναι >0. Αντίθετα, εάν το μέγεθος της μιας μεταβλητής τείνει να αυξάνεται

10 708 Π. Γαλάνης όπως ελαττώνεται το μέγεθος της άλλης μεταβλητής, τότε υπάρχει αρνητική συσχέτιση (negative correlation) μεταξύ των δύο μεταβλητών και ο συντελεστής συσχέτισης είναι <0. Ο συντελεστής συσχέτισης του Pearson παρουσιάζει ορισμένα μειονεκτήματα, καθώς (α) ποσοτικοποιεί τη σχέση μεταξύ δύο μεταβλητών μόνο στην περίπτωση κατά την οποία η σχέση αυτή είναι γραμμική, (β) είναι πολύ ευαίσθητος σε ακραίες τιμές και η ύπαρξή τους σε αρκετές περιπτώσεις οδηγεί σε λανθασμένα συμπεράσματα, (γ) η εκτιμηθείσα συσχέτιση δεν μπορεί να επεκταθεί πέρα από το παρατηρούμενο εύρος των μεταβλητών και (δ) η ύπαρξη μιας ισχυρής συσχέτισης μεταξύ δύο μεταβλητών δεν υποδηλώνει απαραίτητα και την ύπαρξη μιας σχέσης μεταξύ αιτίας και έκβασης. Ο συντελεστής συσχέτισης διατάξεων του Spearman όταν υπολογίζεται σε «δείγματα» συμβολίζεται με r s και λαμβάνει τιμές από -1 έως +1, με την ερμηνεία να είναι ίδια με εκείνη στην περίπτωση του συντελεστή συσχέτισης του Pearson. Ο συντελεστής συσχέτισης διατάξεων του Spearman είναι πολύ λιγότερο ευαίσθητος σε ακραίες τιμές από το συντελεστή συσχέτισης του Pearson και μπορεί να χρησιμοποιηθεί όταν η μία ή και οι δύο μεταβλητές είναι σε διατεταγμένη κλίμακα, αλλά επειδή ως μη παραμετρική μέθοδος χρησιμοποιεί τις διατάξεις και όχι τις παρατηρούμενες τιμές, δεν λαμβάνει υπόψη όλη την πληροφορία που είναι γνωστή για μια κατανομή. 7. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜhΣΗ Η απλή γραμμική παλινδρόμηση (simple linear regression), καθώς και η ανάλυση συσχέτισης, αποτελεί μια μέθοδο διερεύνησης της φύσης της σχέσης μεταξύ δύο ποσοτικών μεταβλητών που ακολουθούν την κανονική κατανομή. 4,8,13,14 Η σημαντικότερη διαφορά ανάμεσα στην ανάλυση παλινδρόμησης και την ανάλυση συσχέτισης είναι ότι η πρώτη παρέχει τη δυνατότητα να διερευνηθεί η αλλαγή σε μια ποσοτική μεταβλητή, που ονομάζεται εξαρτημένη μεταβλητή (dependent variate) ή, αλλιώς, απόκριση (response), η οποία οφείλεται σε μια δεδομένη αλλαγή στη δεύτερη ποσοτική μεταβλητή, γνωστή ως ανεξάρτητη μεταβλητή (independent variate) ή, αλλιώς, επεξηγηματική μεταβλητή (explanatory variate). Η ανάλυση συσχέτισης δεν έχει τη δυνατότητα να πραγματοποιήσει τη διαφοροποίηση αυτή αντιμετωπίζοντας συμμετρικά τις δύο ποσοτικές μεταβλητές, όπως προαναφέρθηκε εκτενώς. Η ανάλυση παλινδρόμησης αποβλέπει στην πρόβλεψη ή την εκτίμηση της τιμής της εξαρτημένης μεταβλητής που αντιστοιχεί σε μια συγκεκριμένη τιμή της επεξηγηματικής μεταβλητής. Για παράδειγμα, η απλή γραμμική παλινδρόμηση μπορεί να χρησιμοποιηθεί προκειμένου να διερευνηθεί εάν η συχνότητα εμφάνισης καρκίνου του πνεύμονα εξαρτάται από τον ημερήσιο αριθμό τσιγάρων. Στην απλή γραμμική παλινδρόμηση, η σχέση μεταξύ των δύο μεταβλητών περιγράφεται από μια ευθεία γραμμή σύμφωνα με την ακόλουθη ισότητα: Y=Α 0+Α 1Χ 1+ε (1) Στην ισότητα 1, το Y είναι η εξαρτημένη μεταβλητή της απλής γραμμικής παλινδρόμησης, ενώ το Χ 1 είναι η ανεξάρτητη μεταβλητή. Ουσιαστικά, το Y αντιστοιχεί στη μελετώμενη έκβαση, ενώ το Χ 1 αντιστοιχεί στο μελετώμενο προσδιοριστή. Το Α 0 είναι η σταθερά της απλής γραμμικής παλινδρόμησης και είναι η μέση τιμή που λαμβάνει η μεταβλητή Y όταν η μεταβλητή Χ 1 ισούται με 0. Το Α 1 περιγράφει την κλίση της ευθείας γραμμής που συσχετίζει το Χ 1 με το Y. Το Α 1 είναι ο αριθμός των μονάδων που μεταβάλλεται το Y κάθε φορά που η τιμή του Χ 1 μεταβάλλεται κατά μία μονάδα. Το ε είναι το τυχαίο σφάλμα που αντιπροσωπεύει την τυχαία απόκλιση από την αναμενόμενη τιμή της εξαρτημένης μεταβλητής Y. Η μέση τιμή του τυχαίου σφάλματος γενικά θεωρείται ίση με 0. Οι τιμές των Α 0 και Α 1 κυμαίνονται θεωρητικά από - έως +. Η ισότητα 1 χρησιμοποιείται στην περίπτωση της απλής γραμμικής παλινδρόμησης, επειδή υπάρχει μόνο μία ανεξάρτητη μεταβλητή. Το μοντέλο, ωστόσο, της γραμμικής παλινδρόμησης μπορεί να επεκταθεί, περιλαμβάνοντας περισσότερες από μία ανεξάρτητες μεταβλητές (ποσοτικές ή ποιοτικές), οπότε προκύπτει το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης: Y=Α 0+Α 1Χ 1+Α 2Χ 2+Α 3Χ (2) Το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης (multiple linear regression) και γενικότερα τα μοντέλα που περιλαμβάνουν περισσότερες από μία ανεξάρτητες μεταβλητές ταυτόχρονα χρησιμοποιούνται για την εξουδετέρωση των συγχυτών. Στα πολυμεταβλητά μαθηματικά μοντέλα περιλαμβάνονται περισσότεροι από δύο προσδιοριστές, με το αποτέλεσμα του καθενός να μη συγχέεται από τη δράση των υπολοίπων, καθιστώντας έτσι τα μοντέλα αυτά ιδανικά για την εξουδετέρωση των συγχυτών μιας μελέτης. Παραδείγματος χάρη, εάν διερευνάται η σχέση μεταξύ της συχνότητας εμφάνισης καρκίνου του πνεύμονα και του ημερήσιου αριθμού τσιγάρων, της ημερήσιας κατανάλωσης οινοπνεύματος και του φύλου, τότε το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης θα περιλαμβάνει τρεις ανεξάρτητες μεταβλητές. Οι τρεις αυτές μεταβλητές συσχετίζονται μεταξύ τους, οπότε αναμένεται καθένα από τα τρία αυτά χαρακτηριστικά να είναι συγχυτής της σχέσης του άλλου με την εξαρτημένη μεταβλητή, που στη συγκεκριμένη περίπτωση είναι η συχνότητα εμφάνισης

11 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 709 καρκίνου του πνεύμονα. Στο συγκεκριμένο παράδειγμα, η εφαρμογή της ισότητας 2 περιλαμβάνει τρεις προσδιοριστές, τον ημερήσιο αριθμό τσιγάρων (Χ 1), την ημερήσια κατανάλωση οινοπνεύματος (Χ 2) και το φύλο (Χ 3), οπότε υπολογίζονται τρεις συντελεστές, Α 1, Α 2 και Α 3, αντίστοιχα. Οι συντελεστές Α 1, Α 2 και Α 3 εκτιμούν το αποτέλεσμα της δράσης του καπνίσματος, του οινοπνεύματος και του φύλου, αντίστοιχα, εξουδετερώνοντας ταυτόχρονα τη σύγχυση που ενδεχομένως υπάρχει στη σχέση μεταξύ της ενδεικτικής κατηγορίας του κάθε προσδιοριστή ξεχωριστά και της συχνότητας εμφάνισης του καρκίνου του πνεύμονα. Μαθηματικά, τουλάχιστον, δεν υπάρχει περιορισμός στον αριθμό των ανεξάρτητων μεταβλητών που μπορούν να χρησιμοποιηθούν στην πολλαπλή γραμμική παλινδρόμηση, αν και μικρός αριθμός δεδομένων επιτρέπει να χρησιμοποιούνται λίγες μόνο ανεξάρτητες μεταβλητές. Ορισμένοι ερευνητές θεωρούν ότι για κάθε ανεξάρτητη μεταβλητή πρέπει να υπάρχουν τουλάχιστον 10 παρατηρήσεις στο μελετώμενο «δείγμα», δηλαδή στην περίπτωση πέντε ανεξάρτητων μεταβλητών θα πρέπει να υπάρχουν τουλάχιστον 50 παρατηρήσεις, ενώ ορισμένοι άλλοι θεωρούν ότι για κάθε ανεξάρτητη μεταβλητή θα πρέπει να υπάρχουν τουλάχιστον 40 παρατηρήσεις. 8. ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Όταν η εξαρτημένη μεταβλητή δεν είναι ποσοτική αλλά διχοτόμος (όπως π.χ. η εμφάνιση ή όχι μιας πάθησης), οπότε μπορεί να λάβει μόνο δύο πιθανές τιμές, τότε χρησιμοποιείται η λογιστική παλινδρόμηση (logistic regression). 1,4,8,15,16 Στην περίπτωση της απλής λογιστικής παλινδρόμησης ισχύει η εξής ισότητα: Y In [ ] = Α 0+Α 1Χ 1 (3) 1 Y Προφανώς, όπως και σε άλλα γραμμικά μοντέλα, είναι δυνατόν να συμπεριληφθούν περισσότερες από μία ανεξάρτητες μεταβλητές (ποσοτικές ή ποιοτικές), οπότε προκύπτει το μοντέλο της πολλαπλής λογιστικής παλινδρόμησης: Y In [ ] = Α 0+Α 1Χ 1+Α 2Χ 2+Α 3Χ (3) 1 Y Στις ισότητες 3 και 4, το Υ είναι η πιθανότητα εμφάνισης της μελετώμενης έκβασης. Έτσι, η λογιστική παλινδρόμηση χρησιμοποιείται για την εκτίμηση της πιθανότητας εμφάνισης μιας έκβασης με βάση την ύπαρξη διαφόρων προσδιοριστών. Σημειώνεται ότι στη λογιστική παλινδρόμηση ο αντιλογάριθμος (e A1 ) του συντελεστή παλινδρόμησης (A 1) μιας διχοτόμου ή, αλλιώς, ενδεικτικής ανεξάρτητης μεταβλητής (Χ 1) αποτελεί εκτίμηση του λόγου των odds στους εκτεθειμένους σε σχέση με τους μη εκτεθειμένους. 9. ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ Σε ορισμένες περιπτώσεις, η εξαρτημένη μεταβλητή είναι το χρονικό διάστημα ανάμεσα σε ένα συμβατικό χρονικό σημείο έναρξης της μέτρησης για παράδειγμα, η στιγμή της διάγνωσης, η πραγματοποίηση μιας χειρουργικής επέμβασης, η έναρξη μιας φαρμακευτικής αγωγής, η μεταμόσχευση ενός μοσχεύματος κ.ά. και την εμφάνιση της μελετώμενης έκβασης. Στις μελέτες όπου διεξάγεται ανάλυση επιβίωσης, οι συμμετέχοντες είναι ήδη πάσχοντες, οπότε η μελετώμενη έκβαση δεν είναι η εμφάνιση μιας πάθησης, αλλά ο θάνατος, η ίαση, η εμφάνιση καταλοίπων, η διασπορά ενός καρκίνου, η απόρριψη ενός μοσχεύματος, η εμφάνιση μιας λοίμωξης κ.ά. Το χρονικό διάστημα ανάμεσα στο συμβατικό χρονικό σημείο έναρξης της μέτρησης και την εμφάνιση της μελετώμενης έκβασης ονομάζεται χρόνος επιβίωσης (survival time). Μολονότι τα δεδομένα είναι ποσοτικά, οι κατανομές των χρόνων επιβίωσης σε ελάχιστες μόνο περιπτώσεις ακολουθούν την κανονική κατανομή, τείνοντας να έχουν δεξιά ασυμμετρία. Στην πλειοψηφία των περιπτώσεων όπου διεξάγεται ανάλυση επιβίωσης, η μελετώμενη έκβαση δεν εμφανίζεται σε όλους τους συμμετέχοντες. Έτσι, η ανάλυση των δεδομένων πραγματοποιείται χωρίς να έχει συμβεί η μελετώμενη έκβαση σε όλους τους πάσχοντες. Υπάρχουν, εξάλλου, και πάσχοντες που αποτελούν τις απώλειες μιας μελέτης γιατί χάθηκε η επικοινωνία μαζί τους είτε λόγω μετακίνησής τους πριν από την ολοκλήρωση της μελέτης είτε λόγω άρνησής τους να συμμετάσχουν έως την ολοκλήρωση της μελέτης. Η ελλιπής παρατήρηση ενός συμμετέχοντα έως την εμφάνιση της μελετώμενης έκβασης είναι γνωστή ως «περικεκομμένη» (censored). Η ύπαρξη «περικεκομμένων» παρατηρήσεων διαφοροποιεί σημαντικά την ανάλυση δεδομένων που αφορά στην επιβίωση. Η ανάλυση επιβίωσης (survival analysis) 1,4 8,17 αποβλέπει κυρίως στη δημιουργία των κλινικών πινάκων επιβίωσης, που χρησιμοποιούνται για την εκτίμηση της πρόγνωσης σε παθήσεις οι οποίες δυνητικά είναι θανατηφόρες και έχουν σχετικά μεγάλη χρονική διάρκεια, ιδιαίτερα στις κακοήθεις νεοπλασίες. Οι κλινικοί πίνακες επιβίωσης χρησιμοποιούνται ευρύτατα στις κλινικές δοκιμές (clinical trials), οι οποίες έχουν ως σκοπό να διαπιστώσουν αν μια θεραπευτική παρέμβαση είναι αποδοτικότερη έναντι μιας άλλης. Δύο ομάδες πασχόντων, π.χ., που προέκυψαν έπειτα από τυχαιοποίηση, δέχονται μόσχευμα νεφρού και η μια ομάδα λαμβάνει τη φαρμακευτική αγωγή Α, ενώ η άλλη ομάδα λαμβάνει τη φαρμακευτική αγωγή Β. Σκοπός της μελέτης αυτής είναι η διαπίστωση της αποδοτικότερης φαρμακευτικής αγωγής. Στην περίπτωση αυτή, η μελετώμενη έκβαση είναι η απόρριψη του νεφρικού μοσχεύ-

12 710 Π. Γαλάνης Statistical methods of data analysis P. GALANIS Center for Health Services, Management and Evaluation, Department of Nursing, University of Athens, Athens, Greece Archives of Hellenic Medicine 2009, 26(5): Measures of association are the object of epidemiologic studies and are used to quantify the relation between the determinant under study and the outcome, while statistical significance tests are used to identify statistically sigματος. Για την πραγματοποίηση της σύγκρισης απαιτείται να κατασκευαστούν οι κλινικοί πίνακες επιβίωσης για τις δύο ομάδες πασχόντων και να συγκριθούν οι αντίστοιχες καμπύλες επιβίωσης (survival curves). Για τη σύγκριση δύο καμπυλών επιβίωσης, και κατ επέκταση δύο θεραπευτικών παρεμβάσεων, χρησιμοποιείται, συνήθως, ο στατιστικός έλεγχος log-rank. Οι κλινικοί πίνακες επιβίωσης κατασκευάζονται είτε με την εφαρμογή της ασφαλιστικής μεθόδου (actuarial method) 18 είτε με την εφαρμογή της μεθόδου Kaplan-Meier. 19 Η χρήση της ασφαλιστικής μεθόδου δεν είναι δυνατή όταν ο αριθμός των συμμετεχόντων σε μια μελέτη είναι μικρός, όταν τα επιμέρους χρονικά διαστήματα στα οποία χωρίζεται ο συνολικός χρόνος διεξαγωγής της μελέτης είναι σχετικά μεγάλα, όταν οι απώλειες είναι πολλές και όταν δεν είναι λογικό να θεωρηθεί ότι οι απώλειες κατανέμονται ομοιόμορφα σε ένα δεδομένο χρονικό διάστημα. Στις περιπτώσεις αυτές είναι απαραίτητη η εφαρμογή της μεθόδου Kaplan-Meier. Η μέθοδος Kaplan-Meier είναι παρόμοια με την ασφαλιστική, αλλά διαφέρει στο ότι δεν απαιτείται να χωριστεί ο συνολικός χρόνος σε ενδιάμεσα χρονικά διαστήματα. Για το λόγο αυτόν, η μέθοδος Kaplan-Meier είναι κατάλληλη, κυρίως, για μελέτες με μικρό αριθμό πασχόντων. Η μέθοδος Kaplan-Meier απαιτεί λιγότερο πολύπλοκους υπολογισμούς από την ασφαλιστική, κυρίως επειδή η εκτίμηση της επιβίωσης πραγματοποιείται κάθε φορά που ένας πάσχοντας εμφανίζει τη μελετώμενη έκβαση και όχι σε συγκεκριμένα χρονικά διαστήματα, όπως συμβαίνει στην ασφαλιστική. Η μέθοδος Kaplan-Meier, σε αντίθεση με την ασφαλιστική, δεν λαμβάνει υπόψη της κατά τους υπολογισμούς τις απώλειες της μελέτης. Το μοντέλο αναλογικών κινδύνων του Cox (Cox s proportional hazards model) ή απλούστερα το μοντέλο του Cox αποτελεί μια γενικότερη μέθοδο ανάλυσης της επιβίωσης, στην οποία ενδεχομένως να συμπεριλαμβάνονται περισσότεροι από ένας προσδιοριστές και όχι μόνο το είδος της θεραπευτικής παρέμβασης. 10. ΣΥΜΠΕΡΑΣΜΑΤΑ Ο κατάλληλος μεθοδολογικός σχεδιασμός και ο περιορισμός στο μεγαλύτερο δυνατό βαθμό του τυχαίου και του συστηματικού σφάλματος και ιδιαίτερα των συγχυτών αποτελούν το πρώτο και πλέον καθοριστικό βήμα στη διεξαγωγή μιας μελέτης και την εξαγωγή ασφαλών συμπερασμάτων. Εξίσου σημαντική βεβαίως είναι και η στατιστική επεξεργασία των δεδομένων με την επιλογή της κατάλληλης μεθόδου ανάλογα με το είδος τόσο της ερευνητικής υπόθεσης όσο και των δεδομένων. Σημειώνεται ότι η ύπαρξη των πολυμεταβλητών μαθηματικών μοντέλων επιτρέπει την εξουδετέρωση έως ένα βαθμό της σύγχυσης που προκαλείται από διάφορα χαρακτηριστικά, αρκεί ο αριθμός των παρατηρήσεων να είναι επαρκώς μεγάλος. Η γνώση του σχεδιασμού μιας μελέτης και δευτερευόντως της ανάλυσης των δεδομένων είναι ζητήματα πρωταρχικής σημασίας για τους επιστήμονες υγείας. Και αν σωστά θεωρηθεί ότι η ανάλυση των δεδομένων μπορεί να αποτελέσει αντικείμενο και των στατιστικών, τότε σίγουρα ο ερευνητικός σχεδιασμός αποτελεί αντικείμενο των επιστημόνων υγείας. Σε αρκετές περιπτώσεις, η παρουσίαση των αποτελεσμάτων περιορίζεται στην αναφορά των παρατηρούμενων επιπέδων στατιστικής σημαντικότητας (τιμές p) αγνοώντας τον καθοριστικό ρόλο που παίζει η παράθεση των διαστημάτων εμπιστοσύνης στην ερμηνεία του τυχαίου σφάλματος. Επιπλέον, οι τιμές p δεν προσδιορίζουν το μέγεθος της σχέσης ανάμεσα στο μελετώμενο προσδιοριστή και την έκβαση, αποτελώντας απλά ένα μέτρο της συμβατότητας μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης. Τα μέτρα σχέσης είναι εκείνα που καθορίζουν το μέγεθος της σχέσης μεταξύ προσδιοριστή και έκβασης και γι αυτό πρέπει να καθορίζεται με σαφήνεια ο τρόπος υπολογισμού τους. ABSTRACT

13 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 711 nificant relationships between these two variates. Statistical analysis of data is achieved using a variety of methods. Choice of the appropriate method depends on the scientific hypothesis and the kind of data. Data commonly are distinguished into qualitative (nominal and ordinal data) and quantitative (interval scale and ratio scale data). Concerning quantitative variates which follow a normal distribution, parametric methods should be applied. The independent samples t-test is used to determine whether two population means are significantly different, but for this to apply, the distribution of both populations must be normal and the two samples must not be related to each other. One-way analysis of variance is employed to determine whether more than two population means are different. Paired samples t-test and repeated measures of one-way analysis of variance are the appropriate tests when the samples (two or more than two respectively) are related to each other. Multivariate mathematical models are used to evaluate the effect of one or more characteristics while simultaneously controlling for possible confounding effects of other characteristics. In a multivariate model, the inclusion of several variates results in each term being unconfounded by the other terms. In epidemiology, the most frequently used multivariate models are the multiple linear and the logistic regression models. The outcome (or dependent variate) in linear regression is a quantitative variate, while in logistic regression it is a dichotomous variate. Key words: Data analysis, Linear regression, Logistic regression, Parametric methods, Survival analysis Βιβλιογραφία 1. Σπάρος Λ, Γαλάνης Π. Δοκίμια επιδημιολογίας. Εκδόσεις Παρισιάνου, Αθήνα, Τριχόπουλος Δ, Τζώνου Α, Κατσουγιάννη Κ. Βιοστατιστική. Εκδόσεις Παρισιάνου, Αθήνα, Γαλάνης Π, Σπάρος Λ. Ανάλυση δεδομένων: Μη μπαγιεσιανή προσέγγιση. Αρχ Ελλ Ιατρ 2005, 22: Rothman KJ, Greenland S, Lash TL. Modern epidemiology. 3rd ed. Lippincott Williams & Wilkins, Philadelphia, Boslaugh S, Watters P. Statistics in a nutshell. O Reilly Media Inc, Cambridge, Dawson B, Trapp R. Basic and clinical biostatistics. 4th ed. Mc- Graw-Hill, New York, Foster J, Barkus E, Yavorsky C. Understanding and using advanced statistics. SAGE Publications, London, Rothman KJ. Epidemiology. An introduction. Oxford University Press, New York, Goodman S. P values, hypothesis tests, and likelihood: Implications for epidemiology of a neglected historical debate. Am J Epidemiol 1993, 137: Goodman S. A comment on replication, p-values and evidence. Stat Med 1992, 11: Goodman S, Royall R. Evidence and scientific research. Am J Public Health 1988, 78: Γέμτος Π. Μεθοδολογία των κοινωνικών επιστημών. Μεταθεωρία και ιδεολογική κριτική των επιστημών του ανθρώπου. 3η έκδοση, 2ος τόμος. Εκδόσεις Παπαζήση, Αθήνα, 1987: Strike P. Statistical methods in laboratory medicine. Butterworth Heinemann, Cambridge, Miettinen OS. Theoretical epidemiology. Principles of occurrence research in medicine. John Wiley & Sons, New York, Bland M. An introduction to medical statistics. 2nd ed. Oxford Medical Publications, Oxford, Hosmer D, Lemeshow S. Applied logistic regression. John Wiley & Sons, New York, Γαλάνης Π, Σπάρος Λ. Κλινικοί πίνακες επιβίωσης. Αρχ Ελλ Ιατρ 2006, 23: Andersen P, Keiding N. Survival analysis, overview. In: Armitage P, Colton T (eds) Encyclopaedia of biostatistics. John Wiley & Sons, New York, 1998: Borgan Ø. Kaplan-Meier estimator. In: Armitage P, Colton T (eds) Encyclopaedia of biostatistics. John Wiley & Sons, New York, 1998: Corresponding author: P. Galanis, 14 Dikis street, GR Athens, Greece xxxxxxxxxxxxx

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ Να δοθούν οι βασικές αρχές των µη παραµετρικών ελέγχων (non-parametric tests). Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη παραµετρικοί έλεγχοι Να αναπτυχθεί η µεθοδολογία των

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων

Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων Copyright Athens Medical Society www.mednet.gr/archives ARCHIVES OF HELLENIC MEDICINE: ISSN 11-05-3992 APPLIED MEDICAL RESEARCH Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων 1. Εισαγωγή 2. Μεταβλητές

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων

Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων xxxxxxxx ΝΟΣΗΛΕΥΤΙΚΗ 2010, 49(1): 11 25 NOSILEFTIKI 2010, 49(1): 11 25 Γ Ε Ν Ι ΚΟ ΑΡΘΡΟ GENERAL ARTICLE Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων Πέτρος

Διαβάστε περισσότερα

T-tests One Way Anova

T-tests One Way Anova William S. Gosset Student s t Sir Ronald Fisher T-tests One Way Anova ΣΤΑΤΙΣΤΙΚΗ Νίκος Ζουρμπάνος Ρούσσος, Π.Λ., & Τσαούσης, Γ. (2002). Στατιστική εφαρμοσμένη στις κοινωνικές επιστήμες. Αθήνα: Ελληνικά

Διαβάστε περισσότερα

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Στατιστικοί Έλεγχοι Υποθέσεων Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Τι θέλουμε να συγκρίνουμε; Δύο δείγματα Μέση αρτηριακή πίεση σε δύο ομάδες Πιθανότητα θανάτου με δύο διαφορετικά

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς Διασπορά Μέτρηση Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες έχουν μέση βαθμολογία 6. συνέχεια

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21 Πίνακας Περιεχομένων Πρόλογος... 17 ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21 (Basic Sampling Techniques and Questionnaire Analysis using

Διαβάστε περισσότερα

Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων

Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(3):407-422 Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων 1. Εισαγωγή 2. Μαθηματικά μοντέλα 3. Παλινδρόμηση 3.1.

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Ένα Ερευνητικό Παράδειγμα Σκοπός της έρευνας ήταν να διαπιστωθεί εάν ο τρόπος αντίδρασης μιας γυναίκας απέναντι σε φαινόμενα

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Ιστορικό, πορεία και εξέλιξη μίας μελέτης Στατιστική ανάλυση των δεδομένων. Σ. Μακρυγιάννης, Γ.Ν Πειραιά«Τζάνειο»

Ιστορικό, πορεία και εξέλιξη μίας μελέτης Στατιστική ανάλυση των δεδομένων. Σ. Μακρυγιάννης, Γ.Ν Πειραιά«Τζάνειο» Ιστορικό, πορεία και εξέλιξη μίας μελέτης Στατιστική ανάλυση των δεδομένων Σ. Μακρυγιάννης, Γ.Ν Πειραιά«Τζάνειο» William Osler, ιατρός, φιλόσοφος, ιστορικός, συγγραφέας If it were not for the great variability

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

έρευνας και στατιστική» παραμετρικές συγκρίσεις» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ «Μεθοδολογία έρευνας και στατιστική» Μάθημα μεταπτυχιακού κύκλου σπουδών Διάλεξη: «Μη παραμετρικές συγκρίσεις» ΔΙΔΑΣΚΩΝ: Δρ. Αθανάσιος

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2 ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ Μ. ΑΡΒΑΝΙΤΙΔΟΥ- ΒΑΓΙΩΝΑ ΚΑΘΗΓΗΤΡΙΑ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ Μ. ΑΡΒΑΝΙΤΙΔΟΥ- ΒΑΓΙΩΝΑ ΚΑΘΗΓΗΤΡΙΑ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ Μ. ΑΡΒΑΝΙΤΙΔΟΥ- ΒΑΓΙΩΝΑ ΚΑΘΗΓΗΤΡΙΑ ΚΛΙΝΙΚΑ ΣΗΜΑΝΤΙΚΟ ΕΥΡΗΜΑ VS ΣΤΑΤΙΣΤΙΚΑ ΣΗΜΑΝΤΙΚΟ ΕΥΡΗΜΑ Ι 1. Η στατιστική σημαντικότητα αντανακλά την επίδραση

Διαβάστε περισσότερα

Συστηματική ανασκόπηση και μετα-ανάλυση

Συστηματική ανασκόπηση και μετα-ανάλυση ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(6):826-841 Συστηματική ανασκόπηση και μετα-ανάλυση 1. Εισαγωγή 2. Συστηματική ανασκόπηση 2.1. Διατύπωση επιστημονικής

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΛΟΓΙΑ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΛΟΓΙΑ Εξάμηνο Υ/Ε Ώρες Θεωρίας Ώρες Ασκήσης Διδακτικές μονάδες ECTS A Υ 3 3 4 6 Διδάσκουσα Μ. Αλεξίου Χατζάκη, Επίκ. Καθηγήτρια Γεν. Βιολογίας. Aντικειμενικοί στόχοι του μαθήματος Οι στόχοι

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA) ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA). Εισαγωγή Η ανάλυση της διακύμανσης (ANalysis Of VAriance ANOVA) είναι μια στατιστική μεθόδος με την οποία η μεταβλητότητα που υπάρχει σ ένα σύνολο δεδομένων διασπάται στις

Διαβάστε περισσότερα

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Ο έλεγχος της ενότητας αυτής αποτελεί μία επέκταση του μονόπλευρου ελέγχου Smirnov στην περίπτωση περισσοτέρων από δύο δειγμάτων. Ο έλεγχος αυτός

Διαβάστε περισσότερα

Μελέτες ασθενών-μαρτύρων

Μελέτες ασθενών-μαρτύρων Μελέτες ασθενών-μαρτύρων Η πρώτη ΜΑΜ δημοσιεύθηκε το 1920 και αφορούσε τη σχέση καπνιστικής συνήθειας και επιθηλιώματος των χειλιών (μορφή καρκίνου του δέρματος) Το 1950, δημοσιεύθηκαν οι πρώτες 4 μελέτες

Διαβάστε περισσότερα

Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη 2013-2014

Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη 2013-2014 Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη 2013-2014 Περιγραφική και Επαγωγική Στατιστική Η περιγραφική στατιστική

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

Μη Παραµετρικοί Έλεγχοι

Μη Παραµετρικοί Έλεγχοι Μη Παραµετρικοί Έλεγχοι Επιστηµονική Επιµέλεια: ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας Εργαστήριο Γεωργίας Viola adorata Καταρχήν Μη Παραµετρικοί Έλεγχοι εν απαιτούν κανονικότητα

Διαβάστε περισσότερα

Μέρος 1 Εισαγωγή στο SPSS 37. 1 Βασικές αρχές καταχώρισης δεδομένων και στατιστικής ανάλυσης με το SPSS 39

Μέρος 1 Εισαγωγή στο SPSS 37. 1 Βασικές αρχές καταχώρισης δεδομένων και στατιστικής ανάλυσης με το SPSS 39 41 Περιεχόμενα Ξενάγηση στο βιβλίο 25 Ξενάγηση στο συνοδευτικό CD 27 Εισαγωγή 29 Ευχαριστίες 33 Οι βασικές διαφορές μεταξύ του SPSS 16 και των προηγούμενων εκδόσεων 35 Μέρος 1 Εισαγωγή στο SPSS 37 1 Βασικές

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑ 1 ο Τα δεδομένα της στήλης Grade (Αρχείο Excel, Φύλλο Ask1) αναφέρονται στη βαθμολογία 63 φοιτητών που έλαβαν μέρος σε

Διαβάστε περισσότερα

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Εισαγωγή στην Κανονική Κατανομή Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Ένα πρόβλημα Πρόβλημα: Ένας μαθητής είχε επίδοση στο τεστ Μαθηματικών 18 και στο τεστ

Διαβάστε περισσότερα

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) 5 H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) Περίληψη Σκοπός του κεφαλαίου είναι η εφαρμογή της ανάλυσης συσχέτισης (Pearson r) μέσω του PASW. H ανάλυση συσχέτισης Pearson r χρησιμοποιείται για να εξεταστεί η

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F Άσκηση 0, σελ. 9 από το βιβλίο «Μοντέλα Αξιοπιστίας και Επιβίωσης» της Χ. Καρώνη (i) Αρχικά, εισάγουμε τα δεδομένα στο minitab δημιουργώντας δύο μεταβλητές: τη x για τον άτυπο όγκο και την y για τον τυπικό

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Στατιστική Ι Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Παρασκευή, 30 Νοεμβρίου 2012 Στατιστική Ι Έννοιες - Κλειδιά Μεταβλητότητα Εύρος (range) Εκατοστημόρια

Διαβάστε περισσότερα

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Πως μπορούμε να συγκρίνουμε μεταβλητές μεταξύ τους? Διαφορά συγκρίνοντας το μέσο μιας μεταβλητής (λόγος ή διάστημα) στις ομάδες πχ. t-test

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Μάθηµα 3 ο. Περιγραφική Στατιστική

Μάθηµα 3 ο. Περιγραφική Στατιστική Μάθηµα 3 ο Περιγραφική Στατιστική ΗΣτατιστικήείναι Μια τυποποιηµένη σειρά αναλυτικών µεθόδων, οι οποίες χρησιµοποιούνται από τον εκάστοτε ερευνητή για την ανάλυση των διαθέσιµων δεδοµένων. Υπάρχουν δύο

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΘΗΝΑ, 2001 Π Ε Ρ Ι Ε Χ Ο Μ Ε Ν Α ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ iii ix ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ 1 1.1

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ ΕΡΓΑΣΤΗΡΙΟ PASW 18 Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 2011 2012 ΕΠΙΧ

Διαβάστε περισσότερα

Περιγραφική Στατιστική. Ακαδ. Έτος 2012-2013 1 ο εξάμηνο. Κ. Πολίτης

Περιγραφική Στατιστική. Ακαδ. Έτος 2012-2013 1 ο εξάμηνο. Κ. Πολίτης Περιγραφική Στατιστική Ακαδ. Έτος 2012-2013 1 ο εξάμηνο Κ. Πολίτης 1 2 Η στατιστική ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση πληροφοριών. Οι πληροφορίες αυτές, πολύ συχνά αριθμητικές,

Διαβάστε περισσότερα

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Σύνολα Δεδομένων - Είδη Ποσοτικής Έρευνας: Παράλογες Ιδέες Γονέων (Δειγματοληπτική)

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή 4.3.3 Ο Έλεγχος των Shapro-Wlk για την Κανονική Κατανομή Ένας άλλος πολύ γνωστός έλεγχος καλής προσαρμογής για την κανονική κατανομή, ο οποίος μπορεί να χρησιμοποιηθεί στην θέση του ελέγχου Lllefors, είναι

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Περιγραφικοί παράµετροι ή περιγραφικά µέτρα Τα περιγραφικά µέτρα διακρίνονται σε: µέτρα θέσης των στατιστικών δεδο- µένων ή παράµετροι κεντρικής τάσης µέτρα διασποράς µέτρα ή συντελεστές

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ 1. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ 1. Σφάλματα Κάθε μέτρηση ενός φυσικού μεγέθους χαρακτηρίζεται από μία αβεβαιότητα που ονομάζουμε σφάλμα, το οποίο αναγράφεται με τη μορφή Τιμή ± αβεβαιότητα π.χ έστω ότι σε ένα πείραμα

Διαβάστε περισσότερα

Στατιστική. Βασικές έννοιες

Στατιστική. Βασικές έννοιες Στατιστική Βασικές έννοιες Τι είναι Στατιστική; ή μήπως είναι: Στατιστική είναι ο κλάδος των εφαρμοσμένων επιστημών, η οποία βασίζεται σ ένα σύνολο αρχών και μεθοδολογιών που έχουν σκοπό: Το σχεδιασμό

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ-13 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 2010-11 Τρίτη Γραπτή Εργασία στη Στατιστική Γενικές οδηγίες

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙO 5 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ Στο προηγούμενο κεφάλαιο εξετάσαμε διάφορες μορφές ελέγχου της υπόθεσης ότι ένα δείγμα παρατηρήσεων προέρχεται από κάποια συγκεκριμένη κατανομή. Στην

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ. ΣΤ. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (ANALYSIS OF VARIANCE - ANOVA) ΣΤ 1. Ανάλυση ιασποράς κατά µία κατεύθυνση. Όπως έχουµε δει στη παράγραφο Β 2, όταν θέλουµε να ελέγξουµε, αν η µέση τιµή µιας ποσοτικής µεταβλητής διαφέρει

Διαβάστε περισσότερα

Μεθοδολογίες Αξιοποίησης Δεδομένων

Μεθοδολογίες Αξιοποίησης Δεδομένων Μεθοδολογίες Αξιοποίησης Δεδομένων Βλάχος Σ. Ιωάννης Λέκτορας 407/80, Ιατρικής Σχολής Πανεπιστημίου Αθηνών Εργαστήριο Πειραματικής Χειρουργικής και Χειρουργικής Ερεύνης «Ν.Σ. Σ Χρηστέας» Στάδια Αξιοποίησης

Διαβάστε περισσότερα

Εφαρμογές της Στατιστικής στα ερευνητικά άρθρα

Εφαρμογές της Στατιστικής στα ερευνητικά άρθρα Copyright Athens Medical Society www.mednet.gr/archives ARCHIVES OF HELLENIC MEDICINE: ISSN 11-05-3992 APPLIED MEDICAL RESEARCH Εφαρμογές της Στατιστικής στα ερευνητικά άρθρα 1. Εισαγωγή 2. Μέθοδοι 2.1.

Διαβάστε περισσότερα