Στατιστικές μέθοδοι ανάλυσης δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Στατιστικές μέθοδοι ανάλυσης δεδομένων"

Transcript

1 ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(5): Στατιστικές μέθοδοι ανάλυσης δεδομένων 1. Εισαγωγή 2. Επίπεδο στατιστικής σημαντικότητας 3. Είδη δεδομένων 3.1. Ονομαστικά δεδομένα 3.2. Διατάξιμα δεδομένα 3.3. Δεδομένα διαστηματικής κλίμακας 3.4. Δεδομένα κλίμακας λόγου 3.5. Συνεχή και ασυνεχή δεδομένα 4. Αριθμητικά περιληπτικά μέτρα 5. Στατιστικές μέθοδοι ανάλυσης 5.1. Ποσοτικές μεταβλητές Παραμετρικές μέθοδοι Μη παραμετρικές μέθοδοι 5.2. Διατάξιμες μεταβλητές 5.3. Ονομαστικές μεταβλητές 6. Συσχέτιση 7. Γραμμική παλινδρόμηση 8. Λογιστική παλινδρόμηση 9. Ανάλυση επιβίωσης 10. Συμπεράσματα Copyright Athens Medical Society ARCHIVES OF HELLENIC MEDICINE: ISSN ARCHIVES OF HELLENIC MEDICINE 2009, 26(5): Π. Γαλάνης... Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας, Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών, Αθήνα Statistical methods of data analysis Λέξεις ευρετηρίου Ανάλυση δεδομένων Ανάλυση επιβίωσης Γραμμική παλινδρόμηση Λογιστική παλινδρόμηση Παραμετρικές μέθοδοι Abstract at the end of the article Υποβλήθηκε Εγκρίθηκε ΕΙΣΑΓΩΓΗ Το αντικείμενο των επιδημιολογικών μελετών είναι μια συνάρτηση συχνότητας (occurrence function) και πιο συγκεκριμένα ένα μέτρο σχέσης* (measure of association) που ποσοτικοποιεί τη σχέση μεταξύ του μελετώμενου προσδιοριστή** και της έκβασης.*** Προκειμένου να διαπιστωθεί αν η σχέση αυτή είναι στατιστικά σημαντική χρησιμοποιούνται οι έλεγχοι της στατιστικής σημαντικότητας (statistical significance tests) ή στατιστικοί έλεγχοι ή στατιστικές δοκιμασίες. 1 8 Οι έλεγχοι της στατιστικής σημαντικότητας (ΕΣΣ) χρησιμοποιούνται για τον έλεγχο της επιστημονικής υπόθεσης, που περιλαμβάνει δύο είδη υποθέσεων, τη μηδενική υπόθεση (null hypothesis) και την εναλλακτική (alternative). 1,3,4,8 Σημειώνεται ότι η επιστημονική υπόθεση αποτελεί καταφατική αποφαντική πρόταση και εισάγει μια νέα πληροφορία, ενώ η μηδενική ή η άκυρη υπόθεση δεν αποτελεί καν επιστημονική πρόταση, καθώς δεν υποστηρίζει το διαψεύσιμο * Τα μέτρα σχέσης που μπορούν να υπολογιστούν σε μια επιδημιολογική μελέτη είναι η διαφορά ή ο λόγος των μέτρων συχνότητας, το αποδοτέο κλάσμα στους εκτεθειμένους ή στο σύνολο του πληθυσμού, ο λόγος των οτζ και οι συντελεστές παλινδρόμησης. 1 ισχυρισμό για την ύπαρξη σχέσης μεταξύ προσδιοριστή και έκβασης και γι αυτό καλείται συχνά και υπόθεση της ** Παράγοντας κινδύνου (risk factor) ή έκθεση (exposure) ή προσδιοριστής (determinant), όπως τελικά επικράτησε να λέγεται σήμερα, είναι το χαρακτηριστικό συγγενές, περιβαλλοντικό ή συμπεριφοράς των ατόμων από το οποίο εξαρτάται (σχετίζεται ή συναρτάται) η συχνότητα εμφάνισης της μελετώμενης έκβασης (η οποία στην αιτιογνωστική επιδημιολογία είναι η εμφάνιση της πάθησης). 1,4,8 Ο προσδιοριστής της συχνότητας εμφάνισης μιας έκβασης περιλαμβάνει δύο κατηγορίες, την ενδεικτική κατηγορία (index category) και την κατηγορία αναφοράς (reference category). Η επιλογή της κατηγορίας αναφοράς του προσδιοριστή είναι μείζονος σημασίας στο σχεδιασμό της μελέτης. Είναι κρίσιμης σημασίας να γίνει αντιληπτό ότι η κατηγορία αναφοράς δεν είναι συμφυές χαρακτηριστικό του προσδιοριστή, αλλά αποτέλεσμα επιλογής του ερευνητή, άρα συνέπεια του σχεδιασμού της μελέτης. Από την επιλογή της κατηγορίας αναφοράς εξαρτάται η ερμηνεία των αποτελεσμάτων μιας μελέτης. Για παράδειγμα, προσδιοριστής της συχνότητας εμφάνισης της νεφρικής πάθησης δεν είναι η αρτηριακή υπέρταση, αλλά η αρτηριακή πίεση. Η αρτηριακή υπέρταση είναι μια κατηγορία και συνήθως η ενδεικτική κατηγορία του προσδιοριστή, στην οποία μελετάται η συχνότητα εμφάνισης της νεφρικής πάθησης σε σχέση πάντοτε με τη συχνότητα εμφάνισής της στην κατηγορία αναφοράς, στην προκειμένη περίπτωση στην κατηγορία των ατόμων που δεν έχουν αρτηριακή υπέρταση. *** Ο όρος έκβαση στην επιδημιολογία χρησιμοποιείται για να δηλώσει άλλοτε την εμφάνιση μιας πάθησης (health outcome) και άλλοτε την ίαση ή το θάνατο ή την εμφάνιση καταλοίπων από μια πάθηση (illness outcome).

2 700 Π. Γαλάνης μη διαφοράς και διατυπώνεται με σκοπό να απορριφθεί. Η συμπληρωματική έννοια της μηδενικής υπόθεσης καλείται εναλλακτική υπόθεση και υποστηρίζει ότι υπάρχει σχέση μεταξύ προσδιοριστή και έκβασης. Η εναλλακτική υπόθεση μπορεί να είναι «μονής κατεύθυνσης» (one-sided), υποστηρίζοντας ότι υπάρχει συγκεκριμένη σχέση είτε θετική είτε αρνητική μεταξύ προσδιοριστή και έκβασης, ή «διπλής κατεύθυνσης» (two-sided), υποστηρίζοντας την ύπαρξη σχέσης χωρίς όμως να καθορίζεται εάν είναι θετική ή αρνητική. Εάν είναι σαφές, πριν από τη διεξαγωγή μιας μελέτης, ότι υπάρχει θετική ή αρνητική σχέση μεταξύ προσδιοριστή και έκβασης, τότε η εναλλακτική υπόθεση μπορεί να είναι «μονής κατεύθυνσης». Αν μια μελέτη, π.χ., διερευνά τη σχέση μεταξύ καπνισματικής συνήθειας (προσδιοριστή) και συχνότητας εμφάνισης καρκίνου του πνεύμονα (έκβασης), τότε η εναλλακτική υπόθεση μπορεί να είναι μονής κατεύθυνσης, δηλαδή ότι το κάπνισμα αυξάνει τη συχνότητα εμφάνισης του καρκίνου του πνεύμονα. Αντιθέτως, εάν πριν από τη διεξαγωγή μιας μελέτης δεν είναι σαφής η σχέση μεταξύ προσδιοριστή και έκβασης, τότε η εναλλακτική υπόθεση είναι «διπλής κατεύθυνσης», γεγονός που συμβαίνει στην πλειονότητα των επιδημιολογικών μελετών. Με τους ελέγχους στατιστικής σημαντικότητας ελέγχεται η μηδενική υπόθεση και είτε απορρίπτεται είτε όχι. Σε καμιά περίπτωση όμως τα δεδομένα μιας μελέτης δεν μπορούν να προσφέρουν απόδειξη ότι η μηδενική υπόθεση είναι αληθής. Αν δεν απορριφθεί η μηδενική υπόθεση, τότε υποστηρίζεται ότι τα δεδομένα στα οποία στηρίζεται ο έλεγχος, δηλαδή τα δεδομένα της μελέτης, δεν επαρκούν για την απόρριψή της. Τονίζεται και πάλι ότι ο στατιστικός έλεγχος των υποθέσεων δεν οδηγεί στην απόδειξη της υπόθεσης, αλλά απλά παρέχει την πληροφορία εάν τα διαθέσιμα δεδομένα στηρίζουν την υπόθεση. Όταν η μηδενική υπόθεση δεν απορρίπτεται, δεν σημαίνει ότι είναι και αληθινή. Αντιθέτως, η απόρριψη της μηδενικής υπόθεσης σημαίνει ότι, σύμφωνα με τα δεδομένα μιας συγκεκριμένης μελέτης, υπάρχει σχέση μεταξύ προσδιοριστή και συχνότητας εμφάνισης της έκβασης. Σε μια μελέτη που διερευνά τη σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της συχνότητας εμφάνισης όγκου στον εγκέφαλο, η μηδενική υπόθεση υποστηρίζει ότι δεν υπάρχει σχέση μεταξύ προσδιοριστή και έκβασης, ενώ η εναλλακτική υπόθεση «διπλής κατεύθυνσης» υποστηρίζει την ύπαρξη σχέσης. Ανάλογα με το είδος των δεδομένων της μελέτης πραγματοποιείται ο κατάλληλος ΕΣΣ και απορρίπτεται ή όχι η μηδενική υπόθεση. Αν απορριφθεί η μηδενική υπόθεση, τότε σύμφωνα με τα δεδομένα της μελέτης αυτής υπάρχει σχέση μεταξύ της χρήσης κινητών και της συχνότητας εμφάνισης όγκου στον εγκέφαλο. Αντιθέτως, αν δεν απορριφθεί η μηδενική υπόθεση, τότε δεν σημαίνει ότι δεν υπάρχει σχέση μεταξύ της χρήσης κινητών και της συχνότητας εμφάνισης όγκου στον εγκέφαλο. Απλά σημαίνει ότι τα δεδομένα της μελέτης αυτής δεν προσέφεραν ένδειξη για την απόρριψη της μηδενικής υπόθεσης. Είναι πολύ πιθανό μια άλλη μελέτη να καταλήξει στο συμπέρασμα ότι υπάρχει σχέση. Προφανώς, όσο περισσότερες μελέτες απορρίψουν τη συγκεκριμένη μηδενική υπόθεση τόσο μεγαλύτερη ένδειξη υπάρχει ότι η χρήση κινητών τηλεφώνων σχετίζεται με τη συχνότητα εμφάνισης όγκου στον εγκέφαλο. Δεν είναι όμως δυνατόν να επαληθευτεί* η αιτιακή σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της συχνότητας εμφάνισης όγκου στον εγκέφαλο. Η μη απόρριψη, εξάλλου, της μηδενικής υπόθεσης σε μια μελέτη δεν σημαίνει ότι είναι αληθής και ότι δεν υπάρχει σχέση ανάμεσα στο μελετώμενο προσδιοριστή και τη συχνότητα εμφάνισης της έκβασης. 2. ΕΠΙΠΕΔΟ ΣΤΑΤΙΣΤΙΚΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ Το ερώτημα που γεννιέται είναι πώς μπορεί να απορριφθεί η μηδενική υπόθεση με τη χρήση του κατάλληλου στατιστικού ελέγχου της υπόθεσης. Για το σκοπό αυτό χρησιμοποιείται το παρατηρούμενο επίπεδο στατιστικής σημαντικότητας (τιμή p), που υπολογίζεται με τη χρήση του κατάλληλου στατιστικού μοντέλου ανάλογα με τα δεδομένα μιας μελέτης και το οποίο συγκρίνεται με ένα προκαθορισμένο επίπεδο στατιστικής σημαντικότητας (τιμή α). Το προκαθορισμένο επίπεδο σημαντικότητας καθορίζεται αυθαίρετα από τον ερευνητή και συνήθως λαμβάνει την τιμή 0,05 ή σπανιότερα την τιμή 0,10 ή την τιμή 0,01. 1,3,4,8 10 Η τιμή p υπολογίζεται σε σχέση με τη μηδενική υπόθεση, σύμφωνα με την οποία δεν υπάρχει σχέση μεταξύ προσδιοριστή και συχνότητας εμφάνισης της έκβασης. 1,3,4,8 Η τιμή p είναι η πιθανότητα, με δεδομένο ότι η μηδενική υπόθεση είναι αληθής, τα δεδομένα μιας μελέτης να παρουσιάσουν μια σχέση μεταξύ προσδιοριστή και συχνότητας εμφάνισης της έκβασης τόσο ακραία ή πιο ακραία από αυτήν που πραγματικά λαμβάνεται. Παραδείγματος χάρη, μια μελέτη διερευνά τη σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της συχνότητας εμφάνισης όγκου στον εγκέφαλο και υπολογίζεται ότι ο λόγος των επιπτώσεων-πυκνοτήτων είναι ίσος με 2,5. Η μηδενική υπόθεση είναι ότι δεν υπάρχει σχέση μεταξύ της χρήσης κινητών τηλεφώνων και της * Ο όρος verification αποδίδεται με τον όρο επαλήθευση, ενώ ο όρος confirmation αποδίδεται με τον όρο επιβεβαίωση ή επικύρωση. Τέλος, ο όρος support αποδίδεται με τον όρο στήριξη.

3 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 701 συχνότητας εμφάνισης όγκου στον εγκέφαλο, οπότε ο λόγος των επιπτώσεων-πυκνοτήτων σε μια τέτοια περίπτωση είναι ίσος με τη μονάδα. Ανάλογα με τα δεδομένα της μελέτης χρησιμοποιείται το κατάλληλο στατιστικό μοντέλο για τον έλεγχο της μηδενικής υπόθεσης, οπότε προκύπτει μια τιμή p. Αυτή η τιμή p είναι η πιθανότητα, με δεδομένο ότι ο λόγος των επιπτώσεων-πυκνοτήτων είναι ίσος με τη μονάδα, μια μελέτη να δώσει λόγο των επιπτώσεων-πυκνοτήτων 2,5. Πρέπει να τονιστεί ότι η τιμή p δεν είναι η πιθανότητα ότι η μηδενική υπόθεση είναι αληθής. Η τιμή p υπολογίζεται με την προϋπόθεση ότι η μηδενική υπόθεση είναι αληθής. Όπως προαναφέρθηκε, για τον έλεγχο της μηδενικής υπόθεσης συγκρίνεται η τιμή p με την τιμή α, η οποία είναι αυθαίρετη και καθορίζεται από τον ερευνητή. Εάν η τιμή p, που προκύπτει από τα δεδομένα μιας μελέτης, είναι μικρότερη από την τιμή α, τότε απορρίπτεται η μηδενική υπόθεση, ενώ αν η τιμή p είναι μεγαλύτερη από την τιμή α, τότε δεν απορρίπτεται η μηδενική υπόθεση, αλλά και ούτε επιβεβαιώνεται. Εάν η τιμή α καθοριστεί ως 0,05, τότε οποιαδήποτε τιμή p η οποία είναι <0,05 οδηγεί στην απόρριψη της μηδενικής υπόθεσης. Μια τιμή p ίση με 0,07 οδηγεί στην απόρριψη της μηδενικής υπόθεσης όταν η τιμή α είναι 0,10, ενώ οδηγεί στη μη απόρριψη της μηδενικής όταν η τιμή α είναι 0,05. Έτσι, η ίδια τιμή p μπορεί να οδηγήσει σε ακριβώς αντίθετα συμπεράσματα ανάλογα με την τιμή α, οπότε γίνεται αντιληπτό ότι η χρήση των ελέγχων της στατιστικής σημαντικότητας και των παρατηρούμενων επιπέδων σημαντικότητας (τιμές p) για την εξαγωγή συμπερασμάτων είναι εξαιρετικά επισφαλής. Ακόμη και αν η τιμή p είναι μικρότερη από την τιμή α, αυτό δεν σημαίνει ότι η μηδενική υπόθεση δεν αποτελεί την πλέον λογική εξήγηση για τα δεδομένα μιας μελέτης. Συχνά, δεν αναφέρεται καν η ακριβής τιμή p, παρά μόνο αν η τιμή αυτή είναι μεγαλύτερη ή μικρότερη από την τιμή α. Δεν υπάρχει κανένας λόγος βέβαια ένα συνεχές μέτρο, όπως είναι η τιμή p, να μετατρέπεται σε διχοτόμο, επειδή έτσι χάνεται πολύτιμη πληροφορία. Όταν η τιμή α καθορίζεται ως 0,05, τότε τιμές p ίσες με 0,001 ή 0,049 οδηγούν σε απόρριψη της μηδενικής υπόθεσης. Είναι όμως πολύ μεγάλη η διαφορά ανάμεσα σε μια τιμή p ίση με 0,001 και μια τιμή p ίση με 0,049. Για το λόγο αυτόν πρέπει να αναφέρεται η ακριβής τιμή p και όχι απλά αν είναι μεγαλύτερη ή μικρότερη από την τιμή α. Μολονότι ακόμη και σήμερα πολλοί χρησιμοποιούν τους ελέγχους της στατιστικής σημαντικότητας και τις τιμές p για την εξαγωγή συμπερασμάτων,* είναι φανερό ότι οι * Μια μελέτη δεν επιτρέπει την εξαγωγή συμπερασμάτων, παρέχοντας μόνο ένδειξη (evidence) ενάντια της υπόθεσης. τιμές p αποτελούν απλά ένα συνεχές μέτρο της συμβατότητας μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης. Αυθαίρετο κριτήριο της συμβατότητας αυτής αποτελεί η τιμή α που καθορίζεται από τον ερευνητή. Έτσι, αν η τιμή α καθοριστεί ως 0,05, τότε οποιαδήποτε τιμή p <0,05 υποδηλώνει μικρή συμβατότητα της μηδενικής υπόθεσης με τα δεδομένα μιας μελέτης. Όσο μικρότερη δηλαδή είναι η τιμή p τόσο μικρότερη είναι η συμβατότητα μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης. Συμπερασματικά, η χρήση των τιμών p για την εξαγωγή ασφαλών συμπερασμάτων σχετικά με τον έλεγχο των επιστημονικών υποθέσεων είναι εξαιρετικά επισφαλής. Η τιμή p που προκύπτει σε μια μελέτη δεν πρέπει να αποτελεί κριτήριο για το αν μια μηδενική υπόθεση είναι αληθής ή όχι, καθώς απαιτείται η διεξαγωγή πολλών μελετών και η σύγκριση των αποτελεσμάτων που προκύπτουν με την εφαρμογή της μετα-ανάλυσης. Η τιμή p είναι απλά ένα μέτρο της συμβατότητας μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης και χρησιμοποιείται για την απόρριψη ή όχι της μηδενικής υπόθεσης. 11 Βέβαια, η μη απόρριψη της μηδενικής υπόθεσης δεν σημαίνει ότι είναι αληθής, αλλά ότι τα δεδομένα μιας μελέτης δεν προσφέρουν αρκετή απόδειξη για την απόρριψή της. Η τιμή p παρουσιάζει ένα σημαντικό μειονέκτημα, καθώς δεν εκφράζει το μέγεθος της σχέσης μεταξύ του προσδιοριστή και της συχνότητας εμφάνισης της έκβασης και την ακρίβεια απουσία τυχαίου σφάλματος με την οποία μετράται η σχέση αυτή. Για την καλύτερη ερμηνεία των δεδομένων μιας μελέτης είναι εξαιρετικά σημαντικό να διαχωρίζεται η πληροφορία για το μέγεθος της σχέσης αναφέροντας την τιμή του μέτρου σχέσης και η πληροφορία για την ακρίβεια της μελέτης αναφέροντας το κατάλληλο διάστημα εμπιστοσύνης. Αξίζει να αναφερθεί ότι στην εφαρμογή της τεχνικής του ελέγχου των υποθέσεων υπάρχουν δύο τύποι σφάλματος. 4 7 Το πρώτο ονομάζεται σφάλμα τύπου Ι (type I error) και είναι επίσης γνωστό ως σφάλμα απόρριψης (rejection error) ή, αλλιώς, σφάλμα α (α error). Ένα σφάλμα τύπου Ι συμβαίνει όταν απορρίπτεται η μηδενική υπόθεση, ενώ είναι αληθής. Η πιθανότητα να διαπραχθεί ένα σφάλμα τύπου Ι καθορίζεται από το προκαθορισμένο επίπεδο σημαντικότητας του ελέγχου (τιμή α). Εάν πραγματοποιηθούν κατ επανάληψη έλεγχοι της υπόθεσης διατηρώντας το επίπεδο σημαντικότητας στο 0,05, θα απορριφθεί λανθασμένα η μηδενική υπόθεση, ενώ είναι αληθής, 5 φορές στους 100 ΕΣΣ. Σε ορισμένες περιπτώσεις επιλέγεται η πιθανότητα 0,01, οπότε με τον τρόπο αυτόν απορρίπτεται λανθασμένα η μηδενική υπόθεση, ενώ είναι αληθής, μόνο μία φορά στους 100 ΕΣΣ. Ο δεύτερος τύπος σφάλματος που μπορεί να διαπραχθεί κατά την εφαρμογή ενός ελέγχου υπόθεσης είναι το σφάλμα τύπου ΙΙ (type II error), που είναι επίσης γνωστό ως σφάλμα αποδοχής (acceptance error) ή, αλλιώς, σφάλ-

4 702 Π. Γαλάνης μα β (β error). Ένα σφάλμα τύπου ΙΙ συμβαίνει όταν δεν απορρίπτεται η μηδενική υπόθεση, ενώ δεν είναι αληθής. Παραδείγματος χάρη, εάν β=0,10, τότε η πιθανότητα μη απόρριψης της μηδενικής υπόθεσης, ενώ δεν είναι αληθής, είναι 0,10 ή 10%. Εάν το β είναι η πιθανότητα να διαπραχθεί ένα σφάλμα τύπου ΙΙ, τότε (1 β) ονομάζεται στατιστική ισχύς (statistical power) του ελέγχου της υπόθεσης. Η ισχύς είναι η πιθανότητα να απορριφθεί η μηδενική υπόθεση, ενώ δεν είναι αληθής. Με άλλη διατύπωση, είναι η πιθανότητα να αποφευχθεί ένα σφάλμα τύπου ΙΙ. Επίσης, η ισχύς μπορεί να θεωρηθεί ως η πιθανότητα μια συγκεκριμένη μελέτη να διακρίνει μια απόκλιση από τη μηδενική υπόθεση δεδομένου ότι αυτή υπάρχει. Το συνηθέστερο σφάλμα είναι να θεωρείται μια θεωρία (υπόθεση) ως αληθής, ενώ δεν είναι, και σπανιότερα το αντίθετο. Γενικά, οι ερευνητές προσπαθούν να σχεδιάσουν ΕΣΣ που έχουν υψηλή ισχύ. Δεν αρκεί να υπάρχει μικρή πιθανότητα να απορριφθεί η μηδενική υπόθεση όταν αληθεύει. Πρέπει να υπάρχει μεγάλη πιθανότητα να απορριφθεί η μηδενική υπόθεση όταν δεν είναι αληθής. Ένας τρόπος αύξησης της ισχύος ενός ελέγχου είναι η αύξηση της τιμής α. Αύξηση της τιμής α προκαλεί αύξηση του σφάλματος τύπου Ι, αλλά συγχρόνως μείωση του σφάλματος τύπου ΙΙ. Αντιθέτως, μείωση της τιμής α προκαλεί μείωση του σφάλματος τύπου Ι και αύξηση του σφάλματος τύπου ΙΙ. Για το λόγο αυτόν, ο σχεδιασμός μιας μελέτης απαιτεί ιδιαίτερη προσοχή και ιδιαίτερα όσον αφορά στον προκαθορισμό της τιμής α. 3. ΕΙΔΗ ΔΕΔΟΜΕΝΩΝ Ο εμπειρικός καθορισμός των τιμών μιας αριθμητικής συνάρτησης ή, αλλιώς, μιας ποσοτικής έννοιας ονομάζεται μέτρηση. Ο όρος μέτρηση όμως χρησιμοποιείται συχνά και με ευρύτερη έννοια, περιλαμβάνοντας και την κατανομή των αντικειμένων μιας κατηγορίας σε τάξεις (ποιοτικές έννοιες). Ουσιαστικά, με τη διαδικασία της μέτρησης επιτυγχάνεται η συστηματική απόδοση αριθμών στα αντικείμενα και τις ιδιότητές τους, με αποτέλεσμα να διευκολύνεται σημαντικά η χρήση των μαθηματικών μεθόδων στη μελέτη και την περιγραφή των αντικειμένων και των σχέσεών τους. * Δεδομένα (data) ή εμπειρικά δεδομένα (empirical data), με την έννοια ότι υπάρχουν ανεξάρτητα από τη νόηση, δεν υφίστανται. Ουσιαστικά, αποτελούν παρατηρήσεις (observations) νοητικά φορτισμένες. Αυτό εξάλλου διακρίνει τις παρατηρήσεις από τις εντυπώσεις (impressions). Διακρίνονται διάφορα είδη ή επίπεδα μέτρησης με τη χρήση των ίδιων όρων και για τα δεδομένα* που αντιστοιχούν σε κάθε επίπεδο. Τα διάφορα αυτά είδη δεδομένων διαφέρουν τόσο στην ερμηνεία των αριθμητικών τιμών που χρησιμοποιούνται όσο και στον ΕΣΣ που επιλέγεται ως ο κατάλληλος για τη στατιστική ανάλυση. Οι μεταβλητές και κατ επέκταση και τα δεδομένα ανάλογα με τα μαθηματικά τους χαρακτηριστικά διακρίνονται σε ποιοτικές (qualitative) και ποσοτικές (quantitative), με τις πρώτες να διακρίνονται σε ονομαστικές και διατάξιμες και τις δεύτερες σε μεταβλητές διαστηματικής κλίμακας και μεταβλητές κλίμακας λόγου. 4 7, Ονομαστικά δεδομένα Τα ονομαστικά δεδομένα (nominal data) αποτελούν την απλούστερη και περισσότερο συνηθισμένη μορφή δεδομένων. Στην περίπτωση αυτή, τα αντικείμενα μιας ορισμένης κατηγορίας διασπώνται και εντάσσονται σε διάφορες ομάδες με τους αριθμούς να αποτελούν ουσιαστικά ονόματα ή χαρακτηρισμούς τάξεων και χωρίς να έχουν αριθμητικό νόημα. Για να είναι επιστημονικώς χρήσιμα τα δεδομένα ονομαστικής κλίμακας θα πρέπει (α) οι τάξεις να μην έχουν κοινά στοιχεία, δηλαδή να έχουν σαφώς προσδιορισμένο πλάτος, ώστε να αποκλείεται να ανήκει ένα στοιχείο σε περισσότερες από μία τάξεις και (β) η κατανομή των τάξεων να εξαντλεί την περιοχή όπου αναλύεται. Σημειώνεται ότι οι μεταβλητές (ο αγγλικός όρος είναι variate και όχι variable) δεν υπάρχουν στη φύση και αποτελούν στατιστικές έννοιες που σχεδιάζονται από τους ερευνητές, ενώ ως δεδομένα νοούνται οι τιμές που λαμβάνει μια μεταβλητή κατά τη μέτρησή της. Το φύλο, για παράδειγμα, δεν είναι μεταβλητή. Στην περίπτωση δημιουργίας μιας μεταβλητής για το φύλο, οι άνδρες μπορούν να λάβουν την τιμή 0 και οι γυναίκες την τιμή 1. Οι τιμές αυτές 0 και 1 δεν έχουν αριθμητικό νόημα και βεβαίως δεν αποτελούν τη μοναδική επιλογή. Είναι δυνατόν οι άνδρες να λάβουν την τιμή 1 και οι γυναίκες την τιμή 2 χωρίς να επηρεαστεί η ανάλυση** των δεδομένων. Παρόμοιο παράδειγμα αποτελεί η ομάδα αίματος, με τα άτομα, π.χ., της ομάδας ** Ο όρος «ανάλυση δεδομένων» περιλαμβάνει (α) τα περιγραφικά στατιστικά μέτρα (descriptive statistics) που συνοψίζουν τα δεδομένα και (β) τα διαλογισμικά στατιστικά μέτρα (inferential statistics) που χρησιμοποιούνται στα στατιστικά υποδείγματα ή, αλλιώς, μοντέλα αναφορικά με την εξαγωγή συμπερασμάτων για τα αντικείμενα μιας μελέτης, που είναι, ουσιαστικά, η παράμετρος που ενδιαφέρει τους ερευνητές. Πρέπει να σημειωθεί ότι ο όρος «ανάλυση δεδομένων» (data analysis) είναι εσφαλμένος εννοιολογικά, καθώς οι παρατηρήσεις δεν είναι δεδομένα και η επεξεργασία των παρατηρήσεων, οι οποίες θεωρητικά είναι φορτισμένες, αποτελεί σύνθεση και όχι ανάλυση. Στην ουσία, η «ανάλυση των δεδομένων» είναι το σύνολο της ένδειξης (evidence) που η εμπειρική έρευνα παράγει για τον έλεγχο της υπόθεσης. Τα «δεδομένα» αποτελούν το μέσο επιλογής του κατάλληλου μαθηματικού υποδείγματος, δηλαδή του υποδείγματος που ταιριάζει καλύτερα στα δεδομένα.

5 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 703 Α να λαμβάνουν την τιμή 1, τα άτομα της ομάδας Β την τιμή 2, τα άτομα της ομάδας ΑΒ την τιμή 3 και τα άτομα της ομάδας Ο την τιμή 4. Οι συμβολισμοί των διαφόρων ομάδων με αριθμούς διευκολύνει σημαντικά τη διαχείρισή τους με τη χρήση των ηλεκτρονικών υπολογιστών κατά την ανάλυση των δεδομένων. Τα δεδομένα ονομαστικής κλίμακας είναι γνωστά και ως κατηγορικά δεδομένα (categorical data), καθώς με τις μετρήσεις ένα ορισμένο αντικείμενο συνδέεται με μια ορισμένη κατηγορία ή τάξη (π.χ. άνδρας ή γυναίκα). Όταν τα δεδομένα ονομαστικής κλίμακας μπορούν να λάβουν μόνο μία από δύο συγκεκριμένες τιμές, όπως άνδρες και γυναίκες, τότε ονομάζονται διχότομα ή δυαδικά (dichotomous, binary). Τα διχότομα δεδομένα για παράδειγμα, η εμφάνιση ή όχι μιας πάθησης, θετικό ή αρνητικό αποτέλεσμα μιας εργαστηριακής δοκιμασίας κ.ά. χρησιμοποιούνται συχνά στις επιστήμες υγείας και γι αυτό έχουν αναπτυχθεί ιδιαίτερες μέθοδοι ανάλυσης, όπως π.χ. η λογιστική παλινδρόμηση Διατάξιμα δεδομένα Τα διατάξιμα δεδομένα (ordinal data) είναι εκείνα στα οποία η σειρά ή, αλλιώς, η διάταξη μεταξύ των διαφόρων κατηγοριών έχει σημασία, έτσι ώστε οι μεγαλύτερες αριθμητικές τιμές να αντιπροσωπεύουν την παρουσία ενός χαρακτηριστικού σε μεγαλύτερο βαθμό και οι μικρότερες την παρουσία του ίδιου χαρακτηριστικού σε μικρότερο βαθμό. Στην περίπτωση αυτή, τα αντικείμενα μιας ορισμένης κατηγορίας όχι μόνο διασπώνται και εντάσσονται σε διάφορες κατηγορίες ή τάξεις, αλλά είναι δυνατή και η διάταξη των τάξεων αυτών με τρόπο που επιτρέπει τις μεταξύ τους συγκρίσεις. Χαρακτηριστικό παράδειγμα διατάξιμης μεταβλητής στις επιστήμες υγείας αποτελεί ο βαθμός εγκαύματος, που λαμβάνει συνήθως τιμές 1 4, με τις υψηλότερες τιμές να αντιπροσωπεύουν σοβαρότερη μορφή εγκαύματος. Ένα άλλο παράδειγμα αποτελεί η ταξινόμηση των τραυματισμών σύμφωνα με το επίπεδο σοβαρότητάς τους, με τη μεταβλητή αυτή να λαμβάνει, π.χ., τιμές 1 4, όπου 1 αντιστοιχεί σε ελαφρύ τραυματισμό, 2 σε μέτριο, 3 σε σοβαρό και 4 σε θανατηφόρο. Και στις δύο περιπτώσεις η διάταξη των τάξεων ή κατηγοριών πραγματοποιείται λογικά, αλλά δεν είναι δυνατόν να ποσοτικοποιηθεί η διαφορά μεταξύ των κατηγοριών και να καθοριστεί αν η διαφορά, για παράδειγμα, μεταξύ εγκαυμάτων πρώτου και δεύτερου βαθμού είναι ίδια με τη διαφορά μεταξύ εγκαυμάτων τρίτου και τέταρτου βαθμού. Ιδιαίτερη κατηγορία διατάξιμων δεδομένων αποτελούν τα διατεταγμένα δεδομένα (ranked data), στα οποία οι παρατηρήσεις τοποθετούνται στη σειρά από τη μεγαλύτερη στη μικρότερη ή και αντίστροφα και στη συνέχεια αντικαθίστανται από αριθμούς που αντιστοιχούν στη θέση κάθε παρατήρησης στην ακολουθία. Ως παραδείγματα αναφέρονται η διάταξη των πολιτειών των ΗΠΑ με βάση τον πληθυσμό ή την έκτασή τους, καθώς και η διάταξη των αιτιών θανάτου με βάση τον αριθμό θανάτων που προκαλούν. Σημειώνεται ότι στην περίπτωση των διατάξιμων δεδομένων ως μέτρο κεντρικής τάσης χρησιμοποιείται η διάμεσος και όχι ο μέσος Δεδομένα διαστηματικής κλίμακας Στα δεδομένα διαστηματικής κλίμακας (interval scale data) έχει σημασία τόσο η διάταξη όσο και το μέγεθος, με τους αριθμούς να αντιπροσωπεύουν πραγματικές μετρήσιμες ποσότητες και όχι ονόματα ή χαρακτηρισμούς τάξεων. Τα διαστήματα που χωρίζουν τη μια τιμή της μεταβλητής από την άλλη έχουν διαφορετική βαρύτητα στα διάφορα σημεία της κλίμακας. Χαρακτηριστικό παράδειγμα της κατηγορίας αυτής αποτελεί η κλίμακα μέτρησης της έντασης των σεισμών ή, αλλιώς, κλίμακα Ρίχτερ, στην οποία οι τιμές της μεταβλητής μπορεί να απέχουν μεταξύ τους κατά ίση αριθμητική διαφορά, αλλά αυτό δεν συνεπάγεται κιόλας ότι οι διαφορές αυτές είναι ισοδύναμες. Στην περίπτωση της κλίμακας Ρίχτερ, η διαφορά της έντασης μεταξύ δύο σεισμών 4 και 5 βαθμών της κλίμακας Ρίχτερ δεν είναι ισοδύναμη με τη διαφορά μεταξύ δύο σεισμών 7 και 8 βαθμών της κλίμακας Ρίχτερ. Τα δεδομένα διαστηματικής κλίμακας είναι μαθηματικά αξιοποιήσιμα, αλλά δεν υφίσταται η σχέση του πολλαπλασιασμού μεταξύ των τιμών τους. Έτσι, έχει νόημα ότι ένας σεισμός 8 βαθμών της κλίμακας Ρίχτερ είναι ισχυρότερος από ένα σεισμό 4 βαθμών της κλίμακας Ρίχτερ, αλλά όχι ότι ο πρώτος είναι δύο φορές ισχυρότερος από το δεύτερο. Σημειώνεται ότι στην πράξη τα δεδομένα διαστηματικής κλίμακας χρησιμοποιούνται ελάχιστα Δεδομένα κλίμακας λόγου Τα δεδομένα κλίμακας λόγου (ratio scale data) υπερέχουν έναντι των δεδομένων διαστηματικής κλίμακας στο γεγονός ότι διαθέτουν ένα φυσικό μηδενικό σημείο έναρξης της μέτρησης. Οι περισσότερες μεταβλητές όπως το βάρος, το ύψος, η ηλικία, το εισόδημα, οι δαπάνες υγείας κ.ά. ανήκουν στην κατηγορία αυτή. Με τα δεδομένα κλίμακας λόγου είναι δυνατή η πρόσθεση, η αφαίρεση, ο πολλαπλασιασμός και η διαίρεση των δεδομένων. Παραδείγματος χάρη, ένα άτομο με ετήσιο εισόδημα ίσο με

6 704 Π. Γαλάνης ευρώ έχει διπλάσιο εισόδημα από ένα άτομο με ετήσιο εισόδημα ίσο με ευρώ. Επιπλέον, ένα άτομο βάρους 100 kg είναι δύο φορές βαρύτερο από ένα άτομο βάρους 50 kg. Σημειώνεται ότι τα δεδομένα των ευρύτατα χρησιμοποιούμενων κλιμάκων Likert, μολονότι είναι διατάξιμα, σε αρκετές περιπτώσεις αντιμετωπίζονται ως δεδομένα κλίμακας λόγου διευκολύνοντας σημαντικά τη στατιστική ανάλυση. Από στατιστική άποψη, η προσέγγιση αυτή δεν είναι η πλέον ενδεδειγμένη, αλλά εφόσον επιλεγεί πρέπει να αναφέρονται με σαφήνεια τα κριτήρια και οι προϋποθέσεις εφαρμογής της Συνεχή και ασυνεχή δεδομένα Σε αρκετές περιπτώσεις, τα ποσοτικά δεδομένα διακρίνονται σε συνεχή (continuous) και διακριτά ή ασυνεχή (discrete). Η διαφορά τους έγκειται στο γεγονός ότι τα ασυνεχή δεδομένα περιορίζονται στο να λαμβάνουν μόνο ακέραιες τιμές, οι οποίες διαφέρουν μεταξύ τους κατά συγκεκριμένες ποσότητες, ενώ τα συνεχή δεδομένα μπορούν να λάβουν οποιαδήποτε τιμή, ακόμη και δεκαδική. Τα περισσότερα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου αποτελούν συνεχή δεδομένα, γεγονός που διευκολύνει σημαντικά τη στατιστική ανάλυση. Παραδείγματα ασυνεχών μεταβλητών αποτελούν ο αριθμός των τροχαίων ατυχημάτων, ο αριθμός των γεννήσεων μιας γυναίκας και ο αριθμός των νέων περιπτώσεων μιας πάθησης που καταγράφηκαν σε μια χώρα σ ένα συγκεκριμένο χρονικό διάστημα, ενώ παραδείγματα συνεχών μεταβλητών αποτελούν το βάρος, το ύψος, η ηλικία, το εισόδημα, ο χρόνος, η θερμοκρασία, η αρτηριακή πίεση κ.ά. Σημειώνεται ότι σε ορισμένες περιπτώσεις οι συνεχείς μεταβλητές μετατρέπονται σε διατάξιμες εφόσον απαιτείται μικρότερος βαθμός λεπτομέρειας. Ανάλογα με το δείκτη μάζας σώματος, π.χ., τα άτομα μπορούν να ταξινομηθούν σε αδύνατα, φυσιολογικά, υπέρβαρα ή παχύσαρκα. 4. ΑΡΙΘΜΗΤΙΚΑ ΠΕΡΙΛΗΠΤΙΚΑ ΜΕΤΡΑ Τα αριθμητικά περιληπτικά μέτρα διακρίνονται στα μέτρα θέσης ή κεντρικής τάσης, που περιλαμβάνουν (α) τη μέση τιμή ή μέσο (mean), (β) τη διάμεσο (median) και (γ) την επικρατούσα τιμή (mode), και στα μέτρα μεταβλητότητας ή διασποράς, που περιλαμβάνουν (α) το εύρος (range), (β) το ενδοτεταρτημοριακό εύρος (interquartile range), (γ) τη διασπορά (variance), (δ) την τυπική απόκλιση (standard deviation) και (ε) το συντελεστή μεταβλητότητας (coefficient of variance). 5,6 Ο μέσος χρησιμοποιείται ως περιληπτικό μέτρο για συνεχή και ασυνεχή δεδομένα, ενώ επηρεάζεται σημαντικά από την ύπαρξη ακραίων τιμών. Η διάμεσος επηρεάζεται σε πολύ μικρότερο βαθμό από τις ακραίες τιμές σε σχέση με το μέσο και χρησιμοποιείται τόσο για συνεχή και ασυνεχή δεδομένα όσο και για διατάξιμα. Όταν η κατανομή μιας ομάδας δεδομένων είναι συμμετρική (ή, αλλιώς, κανονική), τότε ο μέσος αποτελεί το καλύτερο μέτρο κεντρικής τάσης, ενώ όταν η κατανομή παρουσιάζει ασυμμετρία ενδείκνυται η χρήση της διαμέσου. Στην περίπτωση δεδομένων που ακολουθούν την κανονική κατανομή, ως το πλέον κατάλληλο μέτρο εκτίμησης της μεταβλητότητας θεωρείται η τυπική απόκλιση, ενώ το ενδοτεταρτημοριακό εύρος αποτελεί το αντίστοιχο μέτρο στην περίπτωση δεδομένων που δεν ακολουθούν την κανονική κατανομή. 5. ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ Τα τελευταία χρόνια, η ευρεία χρήση των ηλεκτρονικών υπολογιστών και των στατιστικών προγραμμάτων, όπως SPSS (SPSS Inc, Chicago, Illinois, USA), STATA (Stata Corp LP, Texas, USA), SAS (SAS Institute Inc, North Carolina, USA), Statgraphics (Statpoint Inc, Virginia, USA), Statistica (Statsoft Inc, Tulsa, USA) κ.λπ., έχει διευκολύνει σημαντικά την ανάλυση δεδομένων ακόμη και για εκείνους που δεν είναι ιδιαίτερα εξοικειωμένοι με τις έννοιες της στατιστικής. Για το λόγο αυτόν κρίθηκε σκόπιμο να μην αναλυθούν οι μαθηματικές ισότητες που χρησιμοποιούνται στις διάφορες στατιστικές μεθόδους παρά μόνο να δημιουργηθεί ένας συνοπτικός και χρηστικός οδηγός ανάλυσης δεδομένων, χωρίς βέβαια να εξαντλείται το πολυδιάστατο αυτό θέμα. Στους πίνακες 1 και 2 παρουσιάζονται συνοπτικά οι στατιστικές μέθοδοι που χρησιμοποιούνται συχνότερα στις επιστήμες υγείας ανάλογα με το είδος και τον αριθμό των μεταβλητών. 2, Ποσοτικές μεταβλητές Στην περίπτωση των ποσοτικών μεταβλητών απαιτείται καταρχήν η διεξαγωγή ελέγχου κανονικότητας, όπου στην πλειονότητα των περιπτώσεων είναι ο έλεγχος Kolmogorov- Smirnov. 2,5 7 Σημειώνεται ότι στην περίπτωση όπου ο αριθμός των παρατηρήσεων είναι μικρός, συνιστάται η εφαρμογή του ελέγχου κανονικότητας Shapiro-Wilk. Με τους ελέγχους κανονικότητας εκτιμάται εάν η κατανομή των πληθυσμών από τους οποίους προέρχονται τα δεδομένα των «δειγμάτων» είναι η κανονική κατανομή ή αν την προσεγγίζει. Παραδείγματος χάρη, εάν το αντικείμενο μιας μελέτης είναι η σύγκριση του αναστήματος των αγοριών σε σχέση με εκείνο των κοριτσιών, τότε το πρώτο βήμα είναι να ελεγχθεί αν η κατανομή των πληθυσμών των αγοριών και των κοριτσιών από τους οποίους προέρχονται τα μελετώμενα

7 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 705 Πίνακας 1. Στατιστικές μέθοδοι ανάλυσης δεδομένων στην περίπτωση μιας εξαρτημένης και μιας ανεξάρτητης μεταβλητής. Εξαρτημένη μεταβλητή Ανεξάρτητη μεταβλητή Κατανομή πληθυσμών «Δείγματα» Μέθοδος Διχοτόμος Ποιοτική, ποσοτική Κανονική Ανεξάρτητα Απλή λογιστική παλινδρόμηση Ονομαστική Ονομαστική Ανεξάρτητα Έλεγχος x 2, ακριβής έλεγχος του Fisher Ονομαστική Ονομαστική Ανά ζεύγη Έλεγχος του McNemar Ποσοτική Διχοτόμος Κανονική Ανεξάρτητα Έλεγχος t για ανεξάρτητα «δείγματα» Ποσοτική Διχοτόμος Κανονική Ανά ζεύγη Έλεγχος t για «δείγματα» ανά ζεύγη Ποσοτική Ονομαστική (>2 κατηγορίες) Κανονική Ανεξάρτητα Ανάλυση διασποράς μίας κατεύθυνσης Ποσοτική Ονομαστική (>2 κατηγορίες) Κανονική Ανά ζεύγη Ανάλυση διασποράς για επαναλαμβανόμενες μετρήσεις Ποσοτική, διατάξιμη Διχοτόμος Μη κανονική Ανεξάρτητα Έλεγχος Mann-Whitney U Ποσοτική, διατάξιμη Διχοτόμος Μη κανονική Ανά ζεύγη Έλεγχος προσημασμένης διάταξης του Wilcoxon, έλεγχος προσήμου Ποσοτική, διατάξιμη Ονομαστική (>2 κατηγορίες) Μη κανονική Ανεξάρτητα Έλεγχος Kruskall-Wallis, έλεγχος διαμέσου Ποσοτική, διατάξιμη Ονομαστική (>2 κατηγορίες) Μη κανονική Ανά ζεύγη Έλεγχος Friedman, έλεγχος Kendall s W Ποσοτική Ποσοτική Κανονική Ανεξάρτητα Απλή γραμμική παλινδρόμηση Ποσοτική (χρόνος επιβίωσης) Διχοτόμος Μη κανονική Ανεξάρτητα Έλεγχος log-rank Πίνακας 2. Στατιστικές μέθοδοι ανάλυσης δεδομένων στην περίπτωση μιας εξαρτημένης και περισσοτέρων από μία ανεξάρτητων μεταβλητών. Εξαρτημένη μεταβλητή Ανεξάρτητη μεταβλητή Κατανομή πληθυσμών «Δείγματα» Μέθοδος Διχοτόμος Ποιοτικές, ποσοτικές Κανονική Ανεξάρτητα Πολλαπλή λογιστική παλινδρόμηση Ποσοτική Ονομαστικές Κανονική Ανεξάρτητα Πολυμεταβλητή ανάλυση διασποράς Ποσοτική Ποσοτικές Κανονική Ανεξάρτητα Ανάλυση συνδιασποράς Ποσοτική Ποιοτικές, ποσοτικές Κανονική Ανεξάρτητα Πολυμεταβλητή ανάλυση συνδιασποράς Ποσοτική Ποιοτικές, ποσοτικές Κανονική Ανεξάρτητα Πολλαπλή γραμμική παλινδρόμηση Ποσοτική (χρόνος επιβίωσης) Ποιοτικές, ποσοτικές Μη κανονική Ανεξάρτητα Μοντέλο αναλογικών κινδύνων του Cox «δείγματα» είναι η κανονική κατανομή ή όχι. Στην περίπτωση αυτή, απαιτείται η διεξαγωγή δύο ελέγχων κανονικότητας, τόσο δηλαδή για τον πληθυσμό των αγοριών όσο και για τον πληθυσμό των κοριτσιών. Εάν η σύγκριση, εξάλλου, αφορά στο βάρος κοριτσιών που γυμνάζονται 0 ώρες/ εβδομάδα, 1 7 ώρες/εβδομάδα ή >7 ώρες/εβδομάδα, τότε απαιτούνται τρεις έλεγχοι κανονικότητας για τους τρεις αυτούς διαφορετικούς πληθυσμούς κοριτσιών. Στην περίπτωση όπου η κατανομή των πληθυσμών από τους οποίους προέρχονται τα μελετώμενα «δείγματα» είναι η κανονική κατανομή (normal distribution), τότε χρησιμοποιούνται οι παραμετρικές μέθοδοι (parametric methods), ενώ στην περίπτωση που δεν είναι η κανονική κατανομή χρησιμοποιούνται οι μη παραμετρικές μέθοδοι. 2,5 7 Το σημαντικότερο πλεονέκτημα των μη παραμετρικών μεθόδων είναι ότι μπορούν να εφαρμοστούν στην περίπτωση όπου η κατανομή των πληθυσμών δεν είναι η κανονική κατανομή. Επιπλέον, στις μη παραμετρικές μεθόδους χρησιμοποιούνται οι διατάξεις των παρατηρήσεων και όχι οι πραγματικές τιμές των παρατηρήσεων, με αποτέλεσμα να είναι δυνατή η εφαρμογή τους και στην περίπτωση «δειγμάτων» με μικρό αριθμό παρατηρήσεων. Η χρήση, εξάλλου, των διατάξεων δίνει τη δυνατότητα εφαρμογής των μη παραμετρικών μεθόδων και στην περίπτωση διατάξιμων δεδομένων και όχι μόνο ποσοτικών. Επίσης, οι μη παραμετρικές μέθοδοι είναι λιγότερο ευαίσθητες στο σφάλμα μέτρησης εξαιτίας της χρήσης των διατάξεων. Οι μη παραμετρικές μέθοδοι, ωστόσο, παρουσιάζουν και ορισμένα μειονεκτήματα έναντι των αντίστοιχων παραμετρικών, όπως μικρότερη στατιστική ισχύ, λιγότερο ειδικές υποθέσεις και μη χρήση όλης της πληροφορίας που είναι γνωστή για μια κατανομή, καθώς χρησιμοποιούνται οι διατάξεις των παρατηρήσεων και όχι οι πραγματικές τους τιμές. Τέλος, στην περίπτωση των παραμετρικών μεθόδων, για τον έλεγχο της μηδενικής υπόθεσης χρησιμοποιούνται οι μέσες τιμές και η μεταβλητότητα των

8 706 Π. Γαλάνης παρατηρήσεων εκτιμάται με τη χρήση της τυπικής απόκλισης, ενώ στην περίπτωση των μη παραμετρικών μεθόδων χρησιμοποιούνται οι διάμεσοι και το ενδοτεταρτημοριακό εύρος, αντίστοιχα Παραμετρικές μέθοδοι. Στην περίπτωση όπου τα «δείγματα» είναι δύο και ανεξάρτητα μεταξύ τους για παράδειγμα, σύγκριση του αναστήματος μεταξύ αγοριών και κοριτσιών χρησιμοποιείται ο στατιστικός έλεγχος t για ανεξάρτητα «δείγματα» (independent samples t-test). 2,5 7 Στην περίπτωση όπου τα «δείγματα» είναι δύο, αλλά ανά ζεύγη, οπότε για κάθε παρατήρηση στην πρώτη ομάδα υπάρχει μια αντίστοιχη παρατήρηση στη δεύτερη ομάδα, χρησιμοποιείται ο έλεγχος t για «δείγματα» ανά ζεύγη (paired samples t-test). Ως παραδείγματα στην κατηγορία αυτή αναφέρονται η σύγκριση της συστολικής πίεσης πριν και μετά από τη χορήγηση ενός φαρμάκου σε μια ομάδα πασχόντων και η σύγκριση των γνώσεων σχετικά με τις μεταμοσχεύσεις ιστών και οργάνων πριν και μετά από την εφαρμογή ενός εκπαιδευτικού προγράμματος σε μια ομάδα φοιτητών. Στους δύο αυτούς ελέγχους t, η μηδενική υπόθεση που ελέγχεται είναι ότι οι μέσες τιμές της ποσοτικής μεταβλητής στους δύο πληθυσμούς από τους οποίους προέρχονται τα μελετώμενα «δείγματα» είναι ίσες. Έτσι, υπολογίζονται η τιμή p, η διαφορά μεταξύ των μέσων των δύο «δειγμάτων» και το 95% διάστημα εμπιστοσύνης για τη διαφορά αυτή. Όπως προαναφέρθηκε, όταν η τιμή p είναι μικρότερη από την τιμή α, η οποία συνήθως ορίζεται στο επίπεδο του 0,05, τότε απορρίπτεται η μηδενική υπόθεση και η διαφορά μεταξύ των μέσων των δύο πληθυσμών είναι στατιστικώς σημαντική. Σημειώνεται ότι όταν το διάστημα εμπιστοσύνης δεν περιλαμβάνει την τιμή 0, τότε η διαφορά μεταξύ των δύο μέσων είναι στατιστικώς σημαντική. Το διάστημα εμπιστοσύνης όμως δεν πρέπει να χρησιμοποιείται μόνο για τον έλεγχο της μηδενικής υπόθεσης, αλλά κυρίως για την εκτίμηση του τυχαίου σφάλματος σε μια μέτρηση. Έτσι, τα μικρά διαστήματα εμπιστοσύνης υποδηλώνουν μικρότερο τυχαίο σφάλμα και μεγαλύτερη ακρίβεια, ενώ τα μεγάλα διαστήματα εμπιστοσύνης υποδηλώνουν μεγαλύτερο τυχαίο σφάλμα και μικρότερη ακρίβεια. Σε μια μελέτη, π.χ., βρέθηκε ότι το μέσο ανάστημα του «δείγματος» των κοριτσιών ήταν 164 cm, το μέσο ανάστημα του «δείγματος» των αγοριών ήταν 172 cm, η διαφορά μεταξύ των μέσων αναστημάτων ήταν 8 cm, το 95% διάστημα εμπιστοσύνης για τη διαφορά αυτή ήταν 6,6 9,3 cm και η τιμή p του ελέγχου t για ανεξάρτητα «δείγματα» ήταν <0,001. Με βάση τα αποτελέσματα της ανάλυσης των δεδομένων των δύο «δειγμάτων» προέκυψε ότι το μέσο ανάστημα του πληθυσμού των αγοριών ήταν μεγαλύτερο από εκείνο του πληθυσμού των κοριτσιών και μάλιστα η σχέση αυτή ήταν και στατιστικώς σημαντική. Για τη σύγκριση των μέσων τιμών περισσοτέρων από δύο πληθυσμών χρησιμοποιείται η ανάλυση διασποράς μίας κατεύθυνσης (one-way analysis of variance, ANOVA). Στην περίπτωση, παραδείγματος χάρη, όπου συγκρίνονται οι μέσοι τριών πληθυσμών, η μηδενική υπόθεση είναι ότι οι μέσοι των τριών πληθυσμών από τους οποίους προέρχονται οι παρατηρήσεις των αντίστοιχων τριών «δειγμάτων» είναι ίσοι μεταξύ τους. Η ανάλυση διασποράς μπορεί να ελέγξει τη μηδενική αυτή υπόθεση, αλλά για να πραγματοποιηθούν ανά δύο συγκρίσεις μεταξύ των μέσων χωρίς να αυξηθεί το σφάλμα τύπου Ι απαιτείται επιπλέον η εφαρμογή μιας post hoc μεθόδου πολλαπλής σύγκρισης. Συνήθως εφαρμόζεται το κριτήριο του Bonferroni (για μέχρι 10 συγκρίσεις) και σπανιότερα το κριτήριο του Tukey ή του Scheffe. Με τον τρόπο αυτόν επιτυγχάνεται η διεξαγωγή πολλαπλών συγκρίσεων χωρίς αύξηση του σφάλματος τύπου Ι. Όταν η εξαρτημένη μεταβλητή είναι ποσοτική μεταβλητή που ακολουθεί την κανονική κατανομή π.χ. δείκτης μάζας σώματος και οι ανεξάρτητες μεταβλητές είναι δύο ή περισσότερες ποιοτικές μεταβλητές (για παράδειγμα, φύλο, φυσική άσκηση ή όχι, κατανάλωση οινοπνεύματος ή όχι κ.λπ.), τότε χρησιμοποιείται η πολυμεταβλητή ανάλυση διασποράς (multivariate analysis of variance, MANOVA), ενώ όταν οι ανεξάρτητες μεταβλητές είναι δύο ή περισσότερες ποσοτικές μεταβλητές (π.χ. ηλικία, ώρες άθλησης, αριθμός τσιγάρων κ.ά.), τότε χρησιμοποιείται η ανάλυση συνδιασποράς (analysis of covariance, ANCOVA). Η πολυμεταβλητή ανάλυση διασποράς χρησιμοποιείται λιγότερο συχνά και στην περίπτωση περισσοτέρων από μίας συσχετιζόμενων εξαρτημένων μεταβλητών αποβλέποντας στην πραγματοποίηση ενός μόνο στατιστικού ελέγχου για το σύνολο αυτό των μεταβλητών αντί της διεξαγωγής πολλαπλών ξεχωριστών ελέγχων. Τέλος, όταν οι ανεξάρτητες μεταβλητές (ποιοτικές και ποσοτικές) είναι δύο ή περισσότερες, τότε χρησιμοποιείται η πολυμεταβλητή ανάλυση συνδιασποράς (multivariate analysis of covariance, MANCOVA). Στην περίπτωση της σύγκρισης μέσων τιμών περισσοτέρων από δύο πληθυσμών ανά ζεύγη χρησιμοποιείται η ανάλυση διασποράς μίας κατεύθυνσης για επαναλαμβανόμενες μετρήσεις (repeated measures one-way analysis of variance). Χαρακτηριστικό παράδειγμα της κατηγορίας αυτής αποτελεί η σύγκριση των μέσων τιμών μιας ποσοτικής μεταβλητής σε περισσότερες από δύο χρονικές στιγμές. Η εκτίμηση, για παράδειγμα, της αποτελεσματικότητας μιας δίαιτας σ ένα μελετώμενο πληθυσμό 50 γυναικών πραγματοποιείται με τη σύγκριση του μέσου βάρους αυτών των γυναικών ένα μήνα, 2 μήνες και 3 μήνες μετά από την έναρξη της δίαιτας. Δηλαδή, πρόκειται για τρία «δείγματα» με επαναλαμβανόμενες μετρήσεις του βάρους. Τα «δείγματα» αυτά αποτελούνται από τις ίδιες, 50 γυναίκες, σε διαφορετικές όμως χρονικές στιγμές Μη παραμετρικές μέθοδοι. Όπως προαναφέρθηκε,

9 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 707 στην περίπτωση όπου η κατανομή των πληθυσμών από τους οποίους προέρχονται τα μελετώμενα «δείγματα» δεν είναι η κανονική κατανομή, τότε χρησιμοποιούνται οι μη παραμετρικές μέθοδοι, στις οποίες λαμβάνονται υπόψη οι διατάξεις των παρατηρήσεων και όχι οι πραγματικές τιμές των παρατηρήσεων, με αποτέλεσμα να είναι δυνατή η εφαρμογή τους και στην περίπτωση «δειγμάτων» με μικρό αριθμό παρατηρήσεων. 2,5 7 Στις μη παραμετρικές μεθόδους, η μηδενική υπόθεση δεν αφορά στη σύγκριση των μέσων τιμών των πληθυσμών από τους οποίους προέρχονται τα «δείγματα», αλλά στη σύγκριση των διαμέσων. Στην περίπτωση όπου τα «δείγματα» είναι δύο και ανεξάρτητα μεταξύ τους χρησιμοποιείται ο στατιστικός έλεγχος Mann-Whitney U ή, αλλιώς, έλεγχος αθροίσματος διατάξεων του Wilcoxon (Wilcoxon rank-sum test) ή, αλλιώς, έλεγχος Mann-Whitney-Wilcoxon. Στην περίπτωση όπου τα «δείγματα» είναι δύο, αλλά ανά ζεύγη, οπότε για κάθε παρατήρηση στην πρώτη ομάδα υπάρχει μια αντίστοιχη παρατήρηση στη δεύτερη ομάδα, χρησιμοποιείται ο έλεγχος προσημασμένης διάταξης του Wilcoxon (Wilcoxon signed-ranked test) ή ο έλεγχος προσήμου (sign test). Στην περίπτωση όπου τα «δείγματα» είναι περισσότερα από δύο και ανεξάρτητα μεταξύ τους χρησιμοποιείται ο έλεγχος Kruskal-Wallis ή ο έλεγχος της διαμέσου (median test), ενώ στην περίπτωση όπου τα «δείγματα» είναι περισσότερα από δύο και ανά ζεύγη χρησιμοποιείται ο έλεγχος Friedman ή ο έλεγχος Kendall s W ή ο έλεγχος Cochran Διατάξιμες μεταβλητές Όπως προαναφέρθηκε, η χρήση των διατάξεων στις μη παραμετρικές μεθόδους παρέχει τη δυνατότητα εφαρμογής τους και στην περίπτωση διατάξιμων δεδομένων και όχι μόνο ποσοτικών. Έτσι, οι στατιστικές μέθοδοι για την ανάλυση διατάξιμων δεδομένων είναι οι μη παραμετρικές μέθοδοι που χρησιμοποιούνται στην περίπτωση των ποσοτικών δεδομένων Ονομαστικές μεταβλητές Στην περίπτωση όπου τα «δείγματα» είναι ανεξάρτητα μεταξύ τους χρησιμοποιείται ο έλεγχος x 2 (chi-square test), ενώ όταν οι παρατηρήσεις των «δειγμάτων» είναι ανά ζεύγη χρησιμοποιείται ο έλεγχος του McNemar. 2,5 7 Με τους ελέγχους x 2 και McNemar συγκρίνονται οι συχνότητες (ή τα ποσοστά) στις διάφορες κατηγορίες των ονομαστικών μεταβλητών. Παραδείγματος χάρη, η διερεύνηση της σχέσης μεταξύ του φύλου και της συχνότητας εμφάνισης καρδιαγγειακών παθήσεων μπορεί να πραγματοποιηθεί με τον έλεγχο x 2, χωρίς όμως ο έλεγχος αυτός να αποτελεί και τη μοναδική επιλογή. Έτσι, στο συγκεκριμένο παράδειγμα, όπου η εξαρτημένη μεταβλητή εμφάνιση ή όχι καρδιαγγειακών παθήσεων είναι διχοτόμος, προτιμάται η εφαρμογή της λογιστικής παλινδρόμησης και όχι του ελέγχου x 2. Ορισμένοι προτείνουν να χρησιμοποιείται ο έλεγχος x 2 με διόρθωση συνέχειας (continuity correction) ή, αλλιώς, με διόρθωση του Yates (Yates correction), επιτυγχάνοντας έτσι τη μείωση του σφάλματος τύπου Ι, αυξάνοντας όμως ταυτόχρονα την πιθανότητα του σφάλματος τύπου ΙΙ. Όταν διερευνάται η σχέση μεταξύ δύο διχοτόμων μεταβλητών και ο συνολικός αριθμός των παρατηρήσεων είναι μικρός (<20 παρατηρήσεις), τότε αντί του ελέγχου x 2 χρησιμοποιείται ο ακριβής έλεγχος του Fisher (Fisher s exact test). Ένα δεύτερο κριτήριο εφαρμογής του ελέγχου Fisher είναι η ύπαρξη έστω και μίας αναμενόμενης τιμής (expected value) <10 σε ένα από τα τέσσερα κελιά του 2 2 πίνακα συνάφειας (contingency table) που δημιουργείται με βάση τις παρατηρούμενες τιμές (observed values). 6. ΣΥΣΧΕΤΙΣΗ Το είδος και το μέγεθος της γραμμικής σχέσης μεταξύ δύο ποσοτικών μεταβλητών που ακολουθούν την κανονική κατανομή εκτιμάται με το συντελεστή συσχέτισης του Pearson (Pearson s coefficient of correlation), ενώ όταν έστω και μία από τις δύο ποσοτικές μεταβλητές δεν ακολουθεί την κανονική κατανομή, τότε χρησιμοποιείται ο συντελεστής συσχέτισης διατάξεων του Spearman (Spearman s rank correlation coefficient). 2,5 7 Επιπλέον, ο συντελεστής συσχέτισης διατάξεων του Spearman χρησιμοποιείται και στην περίπτωση όπου η μία ή και οι δύο μεταβλητές είναι σε διατεταγμένη κλίμακα. Ο συντελεστής συσχέτισης του Pearson συμβολίζεται με p όταν αφορά σε ολόκληρο τον πληθυσμό και με r όταν υπολογίζεται για ένα συγκεκριμένο «δείγμα» (αποτελώντας έτσι εκτίμηση για τον πληθυσμό από τον οποίο προέρχεται το «δείγμα»). Ο συντελεστής συσχέτισης του Pearson δεν έχει μονάδες μέτρησης και λαμβάνει τιμές από -1 έως +1. Οι τιμές -1 έως +1 συμβαίνουν όταν υπάρχει μια τέλεια (αρνητική ή θετική, αντίστοιχα) γραμμική σχέση μεταξύ των δύο μεταβλητών. Όταν ο συντελεστής συσχέτισης λαμβάνει την τιμή 0 σημαίνει ότι δεν υπάρχει γραμμική σχέση μεταξύ των δύο μεταβλητών, αλλά δεν αποκλείεται η ύπαρξη μιας άλλης μη γραμμικής σχέσης. Εάν το μέγεθος της μιας μεταβλητής τείνει να αυξάνεται όπως αυξάνεται το μέγεθος και της άλλης μεταβλητής, τότε υπάρχει θετική συσχέτιση (positive correlation) μεταξύ των δύο μεταβλητών και ο συντελεστής συσχέτισης είναι >0. Αντίθετα, εάν το μέγεθος της μιας μεταβλητής τείνει να αυξάνεται

10 708 Π. Γαλάνης όπως ελαττώνεται το μέγεθος της άλλης μεταβλητής, τότε υπάρχει αρνητική συσχέτιση (negative correlation) μεταξύ των δύο μεταβλητών και ο συντελεστής συσχέτισης είναι <0. Ο συντελεστής συσχέτισης του Pearson παρουσιάζει ορισμένα μειονεκτήματα, καθώς (α) ποσοτικοποιεί τη σχέση μεταξύ δύο μεταβλητών μόνο στην περίπτωση κατά την οποία η σχέση αυτή είναι γραμμική, (β) είναι πολύ ευαίσθητος σε ακραίες τιμές και η ύπαρξή τους σε αρκετές περιπτώσεις οδηγεί σε λανθασμένα συμπεράσματα, (γ) η εκτιμηθείσα συσχέτιση δεν μπορεί να επεκταθεί πέρα από το παρατηρούμενο εύρος των μεταβλητών και (δ) η ύπαρξη μιας ισχυρής συσχέτισης μεταξύ δύο μεταβλητών δεν υποδηλώνει απαραίτητα και την ύπαρξη μιας σχέσης μεταξύ αιτίας και έκβασης. Ο συντελεστής συσχέτισης διατάξεων του Spearman όταν υπολογίζεται σε «δείγματα» συμβολίζεται με r s και λαμβάνει τιμές από -1 έως +1, με την ερμηνεία να είναι ίδια με εκείνη στην περίπτωση του συντελεστή συσχέτισης του Pearson. Ο συντελεστής συσχέτισης διατάξεων του Spearman είναι πολύ λιγότερο ευαίσθητος σε ακραίες τιμές από το συντελεστή συσχέτισης του Pearson και μπορεί να χρησιμοποιηθεί όταν η μία ή και οι δύο μεταβλητές είναι σε διατεταγμένη κλίμακα, αλλά επειδή ως μη παραμετρική μέθοδος χρησιμοποιεί τις διατάξεις και όχι τις παρατηρούμενες τιμές, δεν λαμβάνει υπόψη όλη την πληροφορία που είναι γνωστή για μια κατανομή. 7. ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜhΣΗ Η απλή γραμμική παλινδρόμηση (simple linear regression), καθώς και η ανάλυση συσχέτισης, αποτελεί μια μέθοδο διερεύνησης της φύσης της σχέσης μεταξύ δύο ποσοτικών μεταβλητών που ακολουθούν την κανονική κατανομή. 4,8,13,14 Η σημαντικότερη διαφορά ανάμεσα στην ανάλυση παλινδρόμησης και την ανάλυση συσχέτισης είναι ότι η πρώτη παρέχει τη δυνατότητα να διερευνηθεί η αλλαγή σε μια ποσοτική μεταβλητή, που ονομάζεται εξαρτημένη μεταβλητή (dependent variate) ή, αλλιώς, απόκριση (response), η οποία οφείλεται σε μια δεδομένη αλλαγή στη δεύτερη ποσοτική μεταβλητή, γνωστή ως ανεξάρτητη μεταβλητή (independent variate) ή, αλλιώς, επεξηγηματική μεταβλητή (explanatory variate). Η ανάλυση συσχέτισης δεν έχει τη δυνατότητα να πραγματοποιήσει τη διαφοροποίηση αυτή αντιμετωπίζοντας συμμετρικά τις δύο ποσοτικές μεταβλητές, όπως προαναφέρθηκε εκτενώς. Η ανάλυση παλινδρόμησης αποβλέπει στην πρόβλεψη ή την εκτίμηση της τιμής της εξαρτημένης μεταβλητής που αντιστοιχεί σε μια συγκεκριμένη τιμή της επεξηγηματικής μεταβλητής. Για παράδειγμα, η απλή γραμμική παλινδρόμηση μπορεί να χρησιμοποιηθεί προκειμένου να διερευνηθεί εάν η συχνότητα εμφάνισης καρκίνου του πνεύμονα εξαρτάται από τον ημερήσιο αριθμό τσιγάρων. Στην απλή γραμμική παλινδρόμηση, η σχέση μεταξύ των δύο μεταβλητών περιγράφεται από μια ευθεία γραμμή σύμφωνα με την ακόλουθη ισότητα: Y=Α 0+Α 1Χ 1+ε (1) Στην ισότητα 1, το Y είναι η εξαρτημένη μεταβλητή της απλής γραμμικής παλινδρόμησης, ενώ το Χ 1 είναι η ανεξάρτητη μεταβλητή. Ουσιαστικά, το Y αντιστοιχεί στη μελετώμενη έκβαση, ενώ το Χ 1 αντιστοιχεί στο μελετώμενο προσδιοριστή. Το Α 0 είναι η σταθερά της απλής γραμμικής παλινδρόμησης και είναι η μέση τιμή που λαμβάνει η μεταβλητή Y όταν η μεταβλητή Χ 1 ισούται με 0. Το Α 1 περιγράφει την κλίση της ευθείας γραμμής που συσχετίζει το Χ 1 με το Y. Το Α 1 είναι ο αριθμός των μονάδων που μεταβάλλεται το Y κάθε φορά που η τιμή του Χ 1 μεταβάλλεται κατά μία μονάδα. Το ε είναι το τυχαίο σφάλμα που αντιπροσωπεύει την τυχαία απόκλιση από την αναμενόμενη τιμή της εξαρτημένης μεταβλητής Y. Η μέση τιμή του τυχαίου σφάλματος γενικά θεωρείται ίση με 0. Οι τιμές των Α 0 και Α 1 κυμαίνονται θεωρητικά από - έως +. Η ισότητα 1 χρησιμοποιείται στην περίπτωση της απλής γραμμικής παλινδρόμησης, επειδή υπάρχει μόνο μία ανεξάρτητη μεταβλητή. Το μοντέλο, ωστόσο, της γραμμικής παλινδρόμησης μπορεί να επεκταθεί, περιλαμβάνοντας περισσότερες από μία ανεξάρτητες μεταβλητές (ποσοτικές ή ποιοτικές), οπότε προκύπτει το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης: Y=Α 0+Α 1Χ 1+Α 2Χ 2+Α 3Χ (2) Το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης (multiple linear regression) και γενικότερα τα μοντέλα που περιλαμβάνουν περισσότερες από μία ανεξάρτητες μεταβλητές ταυτόχρονα χρησιμοποιούνται για την εξουδετέρωση των συγχυτών. Στα πολυμεταβλητά μαθηματικά μοντέλα περιλαμβάνονται περισσότεροι από δύο προσδιοριστές, με το αποτέλεσμα του καθενός να μη συγχέεται από τη δράση των υπολοίπων, καθιστώντας έτσι τα μοντέλα αυτά ιδανικά για την εξουδετέρωση των συγχυτών μιας μελέτης. Παραδείγματος χάρη, εάν διερευνάται η σχέση μεταξύ της συχνότητας εμφάνισης καρκίνου του πνεύμονα και του ημερήσιου αριθμού τσιγάρων, της ημερήσιας κατανάλωσης οινοπνεύματος και του φύλου, τότε το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης θα περιλαμβάνει τρεις ανεξάρτητες μεταβλητές. Οι τρεις αυτές μεταβλητές συσχετίζονται μεταξύ τους, οπότε αναμένεται καθένα από τα τρία αυτά χαρακτηριστικά να είναι συγχυτής της σχέσης του άλλου με την εξαρτημένη μεταβλητή, που στη συγκεκριμένη περίπτωση είναι η συχνότητα εμφάνισης

11 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 709 καρκίνου του πνεύμονα. Στο συγκεκριμένο παράδειγμα, η εφαρμογή της ισότητας 2 περιλαμβάνει τρεις προσδιοριστές, τον ημερήσιο αριθμό τσιγάρων (Χ 1), την ημερήσια κατανάλωση οινοπνεύματος (Χ 2) και το φύλο (Χ 3), οπότε υπολογίζονται τρεις συντελεστές, Α 1, Α 2 και Α 3, αντίστοιχα. Οι συντελεστές Α 1, Α 2 και Α 3 εκτιμούν το αποτέλεσμα της δράσης του καπνίσματος, του οινοπνεύματος και του φύλου, αντίστοιχα, εξουδετερώνοντας ταυτόχρονα τη σύγχυση που ενδεχομένως υπάρχει στη σχέση μεταξύ της ενδεικτικής κατηγορίας του κάθε προσδιοριστή ξεχωριστά και της συχνότητας εμφάνισης του καρκίνου του πνεύμονα. Μαθηματικά, τουλάχιστον, δεν υπάρχει περιορισμός στον αριθμό των ανεξάρτητων μεταβλητών που μπορούν να χρησιμοποιηθούν στην πολλαπλή γραμμική παλινδρόμηση, αν και μικρός αριθμός δεδομένων επιτρέπει να χρησιμοποιούνται λίγες μόνο ανεξάρτητες μεταβλητές. Ορισμένοι ερευνητές θεωρούν ότι για κάθε ανεξάρτητη μεταβλητή πρέπει να υπάρχουν τουλάχιστον 10 παρατηρήσεις στο μελετώμενο «δείγμα», δηλαδή στην περίπτωση πέντε ανεξάρτητων μεταβλητών θα πρέπει να υπάρχουν τουλάχιστον 50 παρατηρήσεις, ενώ ορισμένοι άλλοι θεωρούν ότι για κάθε ανεξάρτητη μεταβλητή θα πρέπει να υπάρχουν τουλάχιστον 40 παρατηρήσεις. 8. ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Όταν η εξαρτημένη μεταβλητή δεν είναι ποσοτική αλλά διχοτόμος (όπως π.χ. η εμφάνιση ή όχι μιας πάθησης), οπότε μπορεί να λάβει μόνο δύο πιθανές τιμές, τότε χρησιμοποιείται η λογιστική παλινδρόμηση (logistic regression). 1,4,8,15,16 Στην περίπτωση της απλής λογιστικής παλινδρόμησης ισχύει η εξής ισότητα: Y In [ ] = Α 0+Α 1Χ 1 (3) 1 Y Προφανώς, όπως και σε άλλα γραμμικά μοντέλα, είναι δυνατόν να συμπεριληφθούν περισσότερες από μία ανεξάρτητες μεταβλητές (ποσοτικές ή ποιοτικές), οπότε προκύπτει το μοντέλο της πολλαπλής λογιστικής παλινδρόμησης: Y In [ ] = Α 0+Α 1Χ 1+Α 2Χ 2+Α 3Χ (3) 1 Y Στις ισότητες 3 και 4, το Υ είναι η πιθανότητα εμφάνισης της μελετώμενης έκβασης. Έτσι, η λογιστική παλινδρόμηση χρησιμοποιείται για την εκτίμηση της πιθανότητας εμφάνισης μιας έκβασης με βάση την ύπαρξη διαφόρων προσδιοριστών. Σημειώνεται ότι στη λογιστική παλινδρόμηση ο αντιλογάριθμος (e A1 ) του συντελεστή παλινδρόμησης (A 1) μιας διχοτόμου ή, αλλιώς, ενδεικτικής ανεξάρτητης μεταβλητής (Χ 1) αποτελεί εκτίμηση του λόγου των odds στους εκτεθειμένους σε σχέση με τους μη εκτεθειμένους. 9. ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ Σε ορισμένες περιπτώσεις, η εξαρτημένη μεταβλητή είναι το χρονικό διάστημα ανάμεσα σε ένα συμβατικό χρονικό σημείο έναρξης της μέτρησης για παράδειγμα, η στιγμή της διάγνωσης, η πραγματοποίηση μιας χειρουργικής επέμβασης, η έναρξη μιας φαρμακευτικής αγωγής, η μεταμόσχευση ενός μοσχεύματος κ.ά. και την εμφάνιση της μελετώμενης έκβασης. Στις μελέτες όπου διεξάγεται ανάλυση επιβίωσης, οι συμμετέχοντες είναι ήδη πάσχοντες, οπότε η μελετώμενη έκβαση δεν είναι η εμφάνιση μιας πάθησης, αλλά ο θάνατος, η ίαση, η εμφάνιση καταλοίπων, η διασπορά ενός καρκίνου, η απόρριψη ενός μοσχεύματος, η εμφάνιση μιας λοίμωξης κ.ά. Το χρονικό διάστημα ανάμεσα στο συμβατικό χρονικό σημείο έναρξης της μέτρησης και την εμφάνιση της μελετώμενης έκβασης ονομάζεται χρόνος επιβίωσης (survival time). Μολονότι τα δεδομένα είναι ποσοτικά, οι κατανομές των χρόνων επιβίωσης σε ελάχιστες μόνο περιπτώσεις ακολουθούν την κανονική κατανομή, τείνοντας να έχουν δεξιά ασυμμετρία. Στην πλειοψηφία των περιπτώσεων όπου διεξάγεται ανάλυση επιβίωσης, η μελετώμενη έκβαση δεν εμφανίζεται σε όλους τους συμμετέχοντες. Έτσι, η ανάλυση των δεδομένων πραγματοποιείται χωρίς να έχει συμβεί η μελετώμενη έκβαση σε όλους τους πάσχοντες. Υπάρχουν, εξάλλου, και πάσχοντες που αποτελούν τις απώλειες μιας μελέτης γιατί χάθηκε η επικοινωνία μαζί τους είτε λόγω μετακίνησής τους πριν από την ολοκλήρωση της μελέτης είτε λόγω άρνησής τους να συμμετάσχουν έως την ολοκλήρωση της μελέτης. Η ελλιπής παρατήρηση ενός συμμετέχοντα έως την εμφάνιση της μελετώμενης έκβασης είναι γνωστή ως «περικεκομμένη» (censored). Η ύπαρξη «περικεκομμένων» παρατηρήσεων διαφοροποιεί σημαντικά την ανάλυση δεδομένων που αφορά στην επιβίωση. Η ανάλυση επιβίωσης (survival analysis) 1,4 8,17 αποβλέπει κυρίως στη δημιουργία των κλινικών πινάκων επιβίωσης, που χρησιμοποιούνται για την εκτίμηση της πρόγνωσης σε παθήσεις οι οποίες δυνητικά είναι θανατηφόρες και έχουν σχετικά μεγάλη χρονική διάρκεια, ιδιαίτερα στις κακοήθεις νεοπλασίες. Οι κλινικοί πίνακες επιβίωσης χρησιμοποιούνται ευρύτατα στις κλινικές δοκιμές (clinical trials), οι οποίες έχουν ως σκοπό να διαπιστώσουν αν μια θεραπευτική παρέμβαση είναι αποδοτικότερη έναντι μιας άλλης. Δύο ομάδες πασχόντων, π.χ., που προέκυψαν έπειτα από τυχαιοποίηση, δέχονται μόσχευμα νεφρού και η μια ομάδα λαμβάνει τη φαρμακευτική αγωγή Α, ενώ η άλλη ομάδα λαμβάνει τη φαρμακευτική αγωγή Β. Σκοπός της μελέτης αυτής είναι η διαπίστωση της αποδοτικότερης φαρμακευτικής αγωγής. Στην περίπτωση αυτή, η μελετώμενη έκβαση είναι η απόρριψη του νεφρικού μοσχεύ-

12 710 Π. Γαλάνης Statistical methods of data analysis P. GALANIS Center for Health Services, Management and Evaluation, Department of Nursing, University of Athens, Athens, Greece Archives of Hellenic Medicine 2009, 26(5): Measures of association are the object of epidemiologic studies and are used to quantify the relation between the determinant under study and the outcome, while statistical significance tests are used to identify statistically sigματος. Για την πραγματοποίηση της σύγκρισης απαιτείται να κατασκευαστούν οι κλινικοί πίνακες επιβίωσης για τις δύο ομάδες πασχόντων και να συγκριθούν οι αντίστοιχες καμπύλες επιβίωσης (survival curves). Για τη σύγκριση δύο καμπυλών επιβίωσης, και κατ επέκταση δύο θεραπευτικών παρεμβάσεων, χρησιμοποιείται, συνήθως, ο στατιστικός έλεγχος log-rank. Οι κλινικοί πίνακες επιβίωσης κατασκευάζονται είτε με την εφαρμογή της ασφαλιστικής μεθόδου (actuarial method) 18 είτε με την εφαρμογή της μεθόδου Kaplan-Meier. 19 Η χρήση της ασφαλιστικής μεθόδου δεν είναι δυνατή όταν ο αριθμός των συμμετεχόντων σε μια μελέτη είναι μικρός, όταν τα επιμέρους χρονικά διαστήματα στα οποία χωρίζεται ο συνολικός χρόνος διεξαγωγής της μελέτης είναι σχετικά μεγάλα, όταν οι απώλειες είναι πολλές και όταν δεν είναι λογικό να θεωρηθεί ότι οι απώλειες κατανέμονται ομοιόμορφα σε ένα δεδομένο χρονικό διάστημα. Στις περιπτώσεις αυτές είναι απαραίτητη η εφαρμογή της μεθόδου Kaplan-Meier. Η μέθοδος Kaplan-Meier είναι παρόμοια με την ασφαλιστική, αλλά διαφέρει στο ότι δεν απαιτείται να χωριστεί ο συνολικός χρόνος σε ενδιάμεσα χρονικά διαστήματα. Για το λόγο αυτόν, η μέθοδος Kaplan-Meier είναι κατάλληλη, κυρίως, για μελέτες με μικρό αριθμό πασχόντων. Η μέθοδος Kaplan-Meier απαιτεί λιγότερο πολύπλοκους υπολογισμούς από την ασφαλιστική, κυρίως επειδή η εκτίμηση της επιβίωσης πραγματοποιείται κάθε φορά που ένας πάσχοντας εμφανίζει τη μελετώμενη έκβαση και όχι σε συγκεκριμένα χρονικά διαστήματα, όπως συμβαίνει στην ασφαλιστική. Η μέθοδος Kaplan-Meier, σε αντίθεση με την ασφαλιστική, δεν λαμβάνει υπόψη της κατά τους υπολογισμούς τις απώλειες της μελέτης. Το μοντέλο αναλογικών κινδύνων του Cox (Cox s proportional hazards model) ή απλούστερα το μοντέλο του Cox αποτελεί μια γενικότερη μέθοδο ανάλυσης της επιβίωσης, στην οποία ενδεχομένως να συμπεριλαμβάνονται περισσότεροι από ένας προσδιοριστές και όχι μόνο το είδος της θεραπευτικής παρέμβασης. 10. ΣΥΜΠΕΡΑΣΜΑΤΑ Ο κατάλληλος μεθοδολογικός σχεδιασμός και ο περιορισμός στο μεγαλύτερο δυνατό βαθμό του τυχαίου και του συστηματικού σφάλματος και ιδιαίτερα των συγχυτών αποτελούν το πρώτο και πλέον καθοριστικό βήμα στη διεξαγωγή μιας μελέτης και την εξαγωγή ασφαλών συμπερασμάτων. Εξίσου σημαντική βεβαίως είναι και η στατιστική επεξεργασία των δεδομένων με την επιλογή της κατάλληλης μεθόδου ανάλογα με το είδος τόσο της ερευνητικής υπόθεσης όσο και των δεδομένων. Σημειώνεται ότι η ύπαρξη των πολυμεταβλητών μαθηματικών μοντέλων επιτρέπει την εξουδετέρωση έως ένα βαθμό της σύγχυσης που προκαλείται από διάφορα χαρακτηριστικά, αρκεί ο αριθμός των παρατηρήσεων να είναι επαρκώς μεγάλος. Η γνώση του σχεδιασμού μιας μελέτης και δευτερευόντως της ανάλυσης των δεδομένων είναι ζητήματα πρωταρχικής σημασίας για τους επιστήμονες υγείας. Και αν σωστά θεωρηθεί ότι η ανάλυση των δεδομένων μπορεί να αποτελέσει αντικείμενο και των στατιστικών, τότε σίγουρα ο ερευνητικός σχεδιασμός αποτελεί αντικείμενο των επιστημόνων υγείας. Σε αρκετές περιπτώσεις, η παρουσίαση των αποτελεσμάτων περιορίζεται στην αναφορά των παρατηρούμενων επιπέδων στατιστικής σημαντικότητας (τιμές p) αγνοώντας τον καθοριστικό ρόλο που παίζει η παράθεση των διαστημάτων εμπιστοσύνης στην ερμηνεία του τυχαίου σφάλματος. Επιπλέον, οι τιμές p δεν προσδιορίζουν το μέγεθος της σχέσης ανάμεσα στο μελετώμενο προσδιοριστή και την έκβαση, αποτελώντας απλά ένα μέτρο της συμβατότητας μεταξύ της μηδενικής υπόθεσης και των δεδομένων μιας μελέτης. Τα μέτρα σχέσης είναι εκείνα που καθορίζουν το μέγεθος της σχέσης μεταξύ προσδιοριστή και έκβασης και γι αυτό πρέπει να καθορίζεται με σαφήνεια ο τρόπος υπολογισμού τους. ABSTRACT

13 ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ 711 nificant relationships between these two variates. Statistical analysis of data is achieved using a variety of methods. Choice of the appropriate method depends on the scientific hypothesis and the kind of data. Data commonly are distinguished into qualitative (nominal and ordinal data) and quantitative (interval scale and ratio scale data). Concerning quantitative variates which follow a normal distribution, parametric methods should be applied. The independent samples t-test is used to determine whether two population means are significantly different, but for this to apply, the distribution of both populations must be normal and the two samples must not be related to each other. One-way analysis of variance is employed to determine whether more than two population means are different. Paired samples t-test and repeated measures of one-way analysis of variance are the appropriate tests when the samples (two or more than two respectively) are related to each other. Multivariate mathematical models are used to evaluate the effect of one or more characteristics while simultaneously controlling for possible confounding effects of other characteristics. In a multivariate model, the inclusion of several variates results in each term being unconfounded by the other terms. In epidemiology, the most frequently used multivariate models are the multiple linear and the logistic regression models. The outcome (or dependent variate) in linear regression is a quantitative variate, while in logistic regression it is a dichotomous variate. Key words: Data analysis, Linear regression, Logistic regression, Parametric methods, Survival analysis Βιβλιογραφία 1. Σπάρος Λ, Γαλάνης Π. Δοκίμια επιδημιολογίας. Εκδόσεις Παρισιάνου, Αθήνα, Τριχόπουλος Δ, Τζώνου Α, Κατσουγιάννη Κ. Βιοστατιστική. Εκδόσεις Παρισιάνου, Αθήνα, Γαλάνης Π, Σπάρος Λ. Ανάλυση δεδομένων: Μη μπαγιεσιανή προσέγγιση. Αρχ Ελλ Ιατρ 2005, 22: Rothman KJ, Greenland S, Lash TL. Modern epidemiology. 3rd ed. Lippincott Williams & Wilkins, Philadelphia, Boslaugh S, Watters P. Statistics in a nutshell. O Reilly Media Inc, Cambridge, Dawson B, Trapp R. Basic and clinical biostatistics. 4th ed. Mc- Graw-Hill, New York, Foster J, Barkus E, Yavorsky C. Understanding and using advanced statistics. SAGE Publications, London, Rothman KJ. Epidemiology. An introduction. Oxford University Press, New York, Goodman S. P values, hypothesis tests, and likelihood: Implications for epidemiology of a neglected historical debate. Am J Epidemiol 1993, 137: Goodman S. A comment on replication, p-values and evidence. Stat Med 1992, 11: Goodman S, Royall R. Evidence and scientific research. Am J Public Health 1988, 78: Γέμτος Π. Μεθοδολογία των κοινωνικών επιστημών. Μεταθεωρία και ιδεολογική κριτική των επιστημών του ανθρώπου. 3η έκδοση, 2ος τόμος. Εκδόσεις Παπαζήση, Αθήνα, 1987: Strike P. Statistical methods in laboratory medicine. Butterworth Heinemann, Cambridge, Miettinen OS. Theoretical epidemiology. Principles of occurrence research in medicine. John Wiley & Sons, New York, Bland M. An introduction to medical statistics. 2nd ed. Oxford Medical Publications, Oxford, Hosmer D, Lemeshow S. Applied logistic regression. John Wiley & Sons, New York, Γαλάνης Π, Σπάρος Λ. Κλινικοί πίνακες επιβίωσης. Αρχ Ελλ Ιατρ 2006, 23: Andersen P, Keiding N. Survival analysis, overview. In: Armitage P, Colton T (eds) Encyclopaedia of biostatistics. John Wiley & Sons, New York, 1998: Borgan Ø. Kaplan-Meier estimator. In: Armitage P, Colton T (eds) Encyclopaedia of biostatistics. John Wiley & Sons, New York, 1998: Corresponding author: P. Galanis, 14 Dikis street, GR Athens, Greece pegalan@nurs.uoa.gr... xxxxxxxxxxxxx

Λειτουργικός ορισμός των μεταβλητών

Λειτουργικός ορισμός των μεταβλητών Λειτουργικός ορισμός των μεταβλητών Σύμφωνα με μελέτη του 2000 στις ΗΠΑ, 4.000.000 έφηβοι ήταν καπνιστές Τι σημαίνει «έφηβος»;;; Τι σημαίνει «καπνιστής»;;; Λειτουργικός ορισμός των μεταβλητών Στη συγκεκριμένη

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΙΑTΡΙΚΗ ΣΧΟΛΗ Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ Έλενα Κριτσέλη, MPH PhD Επιστημονικός Συνεργάτης Επιδημιολόγος Χρόνιων Παθήσεων, Α Πανεπιστημιακή Παιδιατρική

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική Ενότητα 3: Έλεγχοι υποθέσεων - Διαστήματα εμπιστοσύνης Δρ.Ευσταθία Παπαγεωργίου, Αναπληρώτρια Καθηγήτρια Οι ερευνητικές υποθέσεις Στην έρευνα ελέγχουμε

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας. ΚΕΦΑΛΑΙΟ 1 Εισαγωγή Η Μεθοδολογία της Έρευνας (research methodology) είναι η επιστήμη που αφορά τη μεθοδολογία πραγματοποίησης μελετών με συστηματικό, επιστημονικό και λογικό τρόπο, με σκοπό την παραγωγή

Διαβάστε περισσότερα

Αντικείμενο των επιδημιολογικών μελετών

Αντικείμενο των επιδημιολογικών μελετών Αντικείμενο των επιδημιολογικών μελετών Εάν το αντικείμενο μιας μελέτης είναι ο υπολογισμός του λόγου των επιπτώσεων-πυκνοτήτων του καρκίνου του πνεύμονα στους καπνιστές σε σχέση με τους μη καπνιστές,

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 2: Έλεγχοι Υποθέσεων

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Καθορισμός ερευνητικής υπόθεσης Κριτήρια ένταξης και αποκλεισμού

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας Σκοπός του μαθήματος Κατανόηση βασικών εννοιών της στατιστικής Δυνατότητα δημιουργίας βάσης

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Νίκος Καλογερόπουλος 2014 Τι είναι έρευνα στην στατιστική Αρχική παρατήρηση: κάτι που πρέπει να διευκρινιστεί Κάθε χρόνο υπόσχομαι στον εαυτό μου ότι

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος Ανάλυση ποσοτικών δεδομένων ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος Εισαγωγή στη στατιστική Στατιστική: σύνολο αρχών και μεθοδολογιών που χρησιμοποιούνται για:

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ Να δοθούν οι βασικές αρχές των µη παραµετρικών ελέγχων (non-parametric tests). Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη παραµετρικοί έλεγχοι Να αναπτυχθεί η µεθοδολογία των

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS Πανεπιστήμιο Θεσσαλίας-Τμήμα Πολιτικών Μηχανικών Εργαστήριο Κυκλοφορίας, Μεταφορών και Διαχείρισης Εφοδιαστικής Αλυσίδας Αντικείμενα διάλεξης Σύντομη εισαγωγή

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ Το ενδιαφέρον επικεντρώνεται πάντα στον πληθυσμό Το δείγμα χρησιμεύει για εξαγωγή συμπερασμάτων για τον πληθυσμό π.χ. το ετήσιο εισόδημα των κατοίκων μιας περιοχής Τα στατιστικά

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μη παραμετρικοί στατιστικοί έλεγχοι Καθηγητής ΔΠΘ Κων/νος Τσαγκαράκης Δευτέρα 6 Μαρτίου 13:00-16:00 Ώρα για εξ αποστάσεως συνεργασία Τρίτη 7 Μαρτίου 12:00-14:00

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Περιλαμβάνει ένα σύνολο αριθμητικών και γραφικών μεθόδων, που μας επιτρέπουν να αποκτήσουμε μια πρώτη εικόνα για την κατανομή των τιμών της μεταβλητής

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ Ενότητα # 7: Δειγματοληψία Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων Ασκήσεις Εξετάσεων Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων ΑΣΚΗΣΗ 1: Έλεγχος για τη μέση τιμή ενός πληθυσμού Η αντικαπνιστική νομοθεσία υποχρεώνει τους καπνιστές που εργάζονται σε

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

Προσδιοριστής (determinant) Συνώνυμα

Προσδιοριστής (determinant) Συνώνυμα Προσδιοριστής Το χαρακτηριστικό (συγγενές, περιβαλλοντικό ή συμπεριφοράς) των ατόμων από το οποίο εξαρτάται η συχνότητα εμφάνισης της μελετώμενης έκβασης Προσδιοριστής (determinant) Συνώνυμα Έκθεση Μελετώμενος

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Ανάλυση Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης Υπολογισμός

Διαβάστε περισσότερα

Προσδιοριστής (determinant) Συνώνυμα

Προσδιοριστής (determinant) Συνώνυμα Προσδιοριστής Το χαρακτηριστικό (συγγενές, περιβαλλοντικό ή συμπεριφοράς) των ατόμων από το οποίο εξαρτάται η συχνότητα εμφάνισης της μελετώμενης έκβασης Προσδιοριστής (determinant) Συνώνυμα Έκθεση Μελετώμενος

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018 ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ Αντώνης Κ. Τραυλός (B.A., M.A., Ph.D.) Καθηγητής ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ Σχολή Επιστημών Ανθρώπινης Κίνησης και Ποιότητας Ζωής Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού Στατιστική?????

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ Στατιστικά περιγραφικά μέτρα Τα στατιστικά περιγραφικά μέτρα είναι αντιπροσωπευτικές τιμές οι οποίες περιγράφουν με τρόπο ποσοτικό την κατανομή μιας μεταβλητής. Λειτουργούν

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ Θα δούμε ένα παράδειγμα από 141 νεογνά που εγχειρίστηκαν σε ένα νοσοκομείο (surgery.sav). Οι παράμετροι που καταγράφηκαν είναι οι εξής: Κωδικός νεογνού (ID), Φύλο Νεογνού

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Στατιστικές Υποθέσεις

Στατιστικές Υποθέσεις Τμήμα Λογιστικής και Χρηματοοικονομικής 1 Στατιστικές Υποθέσεις Δρ. Αγγελίδης Π. Βασίλειος 2 Εισαγωγή Ίσως το σπουδαιότερο μέρος της Στατιστικής επιστήμης. Εξαγωγή συμπερασμάτων για τις τιμές των παραμέτρων

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2010-2011 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.sch.gr/abouras

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Χειμερινό εξάμηνο 2010-2011 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Περιγραφική Στατιστική Ι users.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής

Διαβάστε περισσότερα

ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ. ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ. Στατιστική με το SPSS Ως επιστήμονες, χρειαζόμαστε τη Στατιστική για 2 κυρίους λόγους: 1. Για

Διαβάστε περισσότερα

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Περιλαμβάνει ένα σύνολο αριθμητικών και γραφικών μεθόδων, που μας επιτρέπουν να αποκτήσουμε μια πρώτη εικόνα για την κατανομή των τιμών της μεταβλητής

Διαβάστε περισσότερα

T-tests One Way Anova

T-tests One Way Anova William S. Gosset Student s t Sir Ronald Fisher T-tests One Way Anova ΣΤΑΤΙΣΤΙΚΗ Νίκος Ζουρμπάνος Ρούσσος, Π.Λ., & Τσαούσης, Γ. (2002). Στατιστική εφαρμοσμένη στις κοινωνικές επιστήμες. Αθήνα: Ελληνικά

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Σχέση μεταξύ εμβολίων και αυτισμού Θέση ύπνου των βρεφών και συχνότητα εμφάνισης του

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Ενότητα 3 Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Εκτός από τις μέσες τιμές, τυπικές αποκλίσεις κλπ, θέλουμε να βρούμε κατά πόσον αυτές οι παρατηρούμενες τάσεις εξαρτώνται από συγκεκριμένες συνθήκες ή προϋποθέσεις.

Διαβάστε περισσότερα

Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων

Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(3):407-422 Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων 1. Εισαγωγή 2. Μαθηματικά μοντέλα 3. Παλινδρόμηση 3.1.

Διαβάστε περισσότερα

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ Παιδαγωγικά II Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ Άδεια Χρήσης Το παρόν υλικό υπόκειται σε άδειες χρήσης Creative Commons

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

τα πάντα είναι σχετικά

τα πάντα είναι σχετικά τα πάντα είναι σχετικά Συνολικά λίτρα κατανάλωσης μπύρας, το 2010 (απόλυτες συχνότητες) Σειρά κατάταξης Χώρα Λίτρα κατανάλωσης μπύρας (x 10 6 ) 1 Κίνα 44.683 2 ΗΠΑ 24.138 5 Γερμανία 8.787 16 Τσεχία 1.708

Διαβάστε περισσότερα

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών τα πάντα είναι σχετικά Συνολικά λίτρα κατανάλωσης μπύρας,

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Σε ορισμένες περιπτώσεις απαιτείται ο έλεγχος της ύπαρξης στατιστικά

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων

Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων xxxxxxxx ΝΟΣΗΛΕΥΤΙΚΗ 2010, 49(1): 11 25 NOSILEFTIKI 2010, 49(1): 11 25 Γ Ε Ν Ι ΚΟ ΑΡΘΡΟ GENERAL ARTICLE Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων Πέτρος

Διαβάστε περισσότερα

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς Διασπορά Μέτρηση Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες έχουν μέση βαθμολογία 6. συνέχεια

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα ΚΕΦΑΛΑΙΟ ΕΚΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Στο κεφάλαιο αυτό θα ασχοληθούμε με τον έλεγχο της υπόθεσης της ισότητα δύο μέσων τιμών με εξαρτημένα δείγματα. Εξαρτημένα

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές ο Φυλλάδιο Ασκήσεων Εφαρμογές 2 ο Φυλλάδιο Ασκήσεων Εφαρμογή 1 ΣΥΓΚΡΙΣΗ ΤΗΣ ΗΛΙΚΙΑΣ ΤΩΝ ΕΡΓΑΖΟΜΕΝΩΝ ΣΕ ΔΥΟ ΕΠΙΧΕΙΡΗΣΕΙΣ Παρακάτω βλέπουμε τα ιστογράμματα και τα πολύγωνα των σχετικών (%) και σχετικών αθροιστικών

Διαβάστε περισσότερα

Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων

Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων Copyright Athens Medical Society www.mednet.gr/archives ARCHIVES OF HELLENIC MEDICINE: ISSN 11-05-3992 APPLIED MEDICAL RESEARCH Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων 1. Εισαγωγή 2. Μεταβλητές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Ένα Ερευνητικό Παράδειγμα Σκοπός της έρευνας ήταν να διαπιστωθεί εάν ο τρόπος αντίδρασης μιας γυναίκας απέναντι σε φαινόμενα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 2. ΜΕΤΑΒΛΗΤΕΣ -ΣΧΕΣΕΙΣ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ Όλες οι έρευνες αναφέρονται σε μεταβλητές

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Στατιστικοί Έλεγχοι Υποθέσεων Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Τι θέλουμε να συγκρίνουμε; Δύο δείγματα Μέση αρτηριακή πίεση σε δύο ομάδες Πιθανότητα θανάτου με δύο διαφορετικά

Διαβάστε περισσότερα

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας Εργαστήριο Υγιεινής Επιδημιολογίας και Ιατρικής Στατιστικής Ιατρική Σχολή, Πανεπιστήμιο Αθηνών Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας Δ. Παρασκευής Εργαστήριο Υγιεινής Επιδημιολογίας και

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Χειμερινό εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Μέτρα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ ΚΕΦΑΛΑΙΟ 16 ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ Η ερευνητική πρακτική έχει δείξει ότι όταν υπάρχει σοβαρή παραβίαση (violation) της παραδοχής τής κανονικότητας (assumption of normality) ή και της παραδοχής τής

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα