Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων"

Transcript

1 ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(3): Πολυμεταβλητή ανάλυση επιδημιολογικών δεδομένων 1. Εισαγωγή 2. Μαθηματικά μοντέλα 3. Παλινδρόμηση 3.1. Απλή γραμμική παλινδρόμηση 3.2. Πολλαπλή γραμμική παλινδρόμηση 3.3. Μετασχηματισμός του μοντέλου της γραμμικής παλινδρόμησης 4. Λογιστική παλινδρόμηση 5. Επιλογή του κατάλληλου μοντέλου 6. Εκτίμηση του κινδύνου 7. Κατασκευή πολυμεταβλητών μοντέλων στην αιτιολογική έρευνα 7.1. «Κατασκευή των μεταβλητών» 7.2. Εφαρμογή της διαστρωματικής ανάλυσης 7.3. Επιλογή των συγχυτών 7.4. Εκτίμηση της σχέσης μεταξύ προσδιοριστή και πάθησης 7.5. Εκτίμηση της συνεπίδρασης 8. Σύνοψη Copyright Athens Medical Society ARCHIVES OF HELLENIC MEDICINE: ISSN ARCHIVES OF HELLENIC MEDICINE 2009, 26(3): Π. Γαλάνης... Eργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας, Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών, Αθήνα Multivariate analysis of epidemiological data Λέξεις ευρετηρίου Διαστρωματική ανάλυση Λογιστική παλινδρόμηση Παλινδρόμηση Πολυμεταβλητή ανάλυση Abstract at the end of the article Υποβλήθηκε Εγκρίθηκε ΕΙΣΑΓΩΓΗ Η μέθοδος της πολυμεταβλητής ανάλυσης* (multivariate analysis) αρχικά δημιουργεί την εντύπωση ότι πρόκειται για την πλέον ελκυστική μέθοδο ανάλυσης των δεδομένων μιας επιδημιολογικής μελέτης, καθώς επιτρέπει τόσο την εξουδετέρωση των συγχυτών όσο και την εκτίμηση των αλληλεπιδράσεων ή καλύτερα συνεπιδράσεων μεταξύ των ενδεικτικών κατηγοριών των προσδιοριστών και μάλιστα με σημαντική στατιστική αποτελεσματικότητα. Ο ηλεκτρονικός υπολογιστής πραγματοποιεί όλους τους απαραίτητους υπολογισμούς και εξάγει τα αποτελέσματα ταχύτατα. Μάλιστα, η ταχύτητα επεξεργασίας των δεδομέ- * Ο όρος «ανάλυση δεδομένων» περιλαμβάνει (α) τα περιγραφικά στατιστικά μέτρα (descriptive statistics) που συνοψίζουν τα δεδομένα και (β) τα διαλογισμικά στατιστικά μέτρα (inferential statistics), τα οποία χρησιμοποιούνται στα στατιστικά υποδείγματα ή μοντέλα για την εξαγωγή συμπερασμάτων για τα αντικείμενα μιας μελέτης, που είναι, ουσιαστικά, η παράμετρος που ενδιαφέρει τους ερευνητές. Πρέπει να σημειωθεί ότι ο όρος «ανάλυση δεδομένων» (data analysis) είναι εσφαλμένος εννοιολογικά, αφού οι παρατηρήσεις δεν είναι δεδομένα και η επεξεργασία των παρατηρήσεων που είναι θεωρητικά φορτισμένες αποτελεί σύνθεση και όχι ανάλυση. Στην ουσία, η «ανάλυση των δεδομένων» είναι το σύνολο της ένδειξης (evidence), όπου η εμπειρική έρευνα παράγει για τον έλεγχο της υπόθεσης. Τα «δεδομένα» αποτελούν το μέσο επιλογής του κατάλληλου μαθηματικού υποδείγματος, δηλαδή του υποδείγματος που ταιριάζει καλύτερα στα δεδομένα. νων και εξαγωγής των αποτελεσμάτων, συγκρινόμενη με τη μακροχρόνια και την επίμονη προσπάθεια συλλογής των δεδομένων, προκαλεί σε αρκετές περιπτώσεις απογοήτευση στους ερευνητές. Όσο χρήσιμη και αποτελεσματική, πάντως, και αν είναι η πολυμεταβλητή ανάλυση, δεν αποτελεί «στατιστική πανάκεια». Το μεγαλύτερο μειονέκτημά της είναι ότι εισάγει εμπόδια, ενίοτε ανυπέρβλητα, ανάμεσα στον ερευνητή και τα «δεδομένα». Άλλες μέθοδοι ανάλυσης, όπως π.χ. η διαστρωματική ανάλυση, παρέχουν τη δυνατότητα εύκολης κατανόησης του τρόπου κατανομής των δεδομένων, οπότε μπορεί να γίνουν αντιληπτά εύκολα και άμεσα τυχόν μειονεκτήματα ή ελλείψεις. Μια τέτοια περίπτωση, για παράδειγμα, είναι η ύπαρξη μικρού αριθμού δεδομένων σε ορισμένα στρώματα, γεγονός που μειώνει την εγκυρότητα μιας μελέτης. Η πολυμεταβλητή ανάλυση δεν επιτρέπει την άμεση επαφή του ερευνητή με τα δεδομένα μιας μελέτης, ενώ τα αποτελέσματα δεν γίνονται άμεσα και εύκολα κατανοητά από τους αναγνώστες, καθώς οι περισσότεροι δεν είναι εξοικειωμένοι με τα μαθηματικά μοντέλα που χρησιμοποιούνται. Έτσι, τόσο οι αναγνώστες όσο και οι ίδιοι οι ερευνητές αντιλαμβάνονται ευκολότερα και σαφέστερα την κατανομή των δεδομένων όταν αυτά παρουσιάζονται με τη μορφή συχνοτήτων σε πίνακες (tabular analysis), όπως συμβαίνει στην περίπτωση της διαστρωματικής ανάλυσης.

2 408 Π. Γαλάνης Η ραγδαία ανάπτυξη των ηλεκτρονικών υπολογιστών και των στατιστικών προγραμμάτων είχε ως αποτέλεσμα την ευρεία χρήση της πολυμεταβλητής ανάλυσης ακόμη και στις περιπτώσεις εκείνες στις οποίες η χρήση άλλων μεθόδων (όπως π.χ. της διαστρωματικής ανάλυσης) είναι περισσότερο αποδοτική και ωφέλιμη. Υπάρχουν περιπτώσεις, εξάλλου, στις οποίες εφαρμόζονται αρκετά πολυμεταβλητά μοντέλα για την ανάλυση των δεδομένων, ενώ αρκούν μόλις ένα ή δύο μοντέλα. Τονίζεται ότι είναι προτιμότερο να εφαρμόζεται αρχικά η μέθοδος της διαστρωματικής ανάλυσης, εφόσον βεβαίως είναι δυνατή, επειδή παρέχει, τόσο στους ερευνητές όσο και στους αναγνώστες, τη δυνατότητα αμεσότερης επαφής με τα δεδομένα. Αναμφίβολα, η πολυμεταβλητή ανάλυση είναι εξαιρετικά χρήσιμη για την ανάλυση δεδομένων, όταν η εφαρμογή της διαστρωματικής ανάλυσης 1 12 είναι πρακτικά αδύνατη. Η εφαρμογή της διαστρωματικής ανάλυσης εξαρτάται από τον αριθμό των στρωμάτων στα οποία στρωματοποιούνται τα δεδομένα μιας μελέτης. Πιο συγκεκριμένα, αν τα στρώματα που δημιουργούνται είναι πάρα πολλά, οπότε ο αριθμός των δεδομένων σε ορισμένα στρώματα είναι πολύ μικρός, τότε η διαστρωματική ανάλυση δεν είναι αποτελεσματική και τα αποτελέσματα που προκύπτουν δεν είναι έγκυρα. Η πολυμεταβλητή ανάλυση είναι μια μέθοδος με την οποία επιτυγχάνεται το κριτήριο της εγκυρότητας, καθώς χρησιμοποιείται ένα μαθηματικό μοντέλο που επιτρέπει στα δεδομένα να είναι περισσότερο αποτελεσματικά για την εκτίμηση πολλών χαρακτηριστικών (ή μεταβλητών) ταυτόχρονα. Όσες λιγότερες προϋποθέσεις απαιτεί η εφαρμογή ενός μαθηματικού μοντέλου τόσο μεγαλύτερη εγκυρότητα παρέχει η πολυμεταβλητή ανάλυση. Είναι προτιμότερο, πάντως, να συνδυάζεται η διαστρωματική ανάλυση με την πολυμεταβλητή ακόμη και όταν ελέγχονται πολλές μεταβλητές* ταυτόχρονα. Στην περίπτωση αυτή, αρχικά, θα πρέπει να εφαρμόζεται η διαστρωματική ανάλυση για τον έλεγχο των πιο σημαντικών μεταβλητών και στη συνέχεια η πολυμεταβλητή για τον έλεγχο όλων των μεταβλητών. 8,9 Η διαδικασία αυτή είναι χρονοβόρα και σε ορισμένες περιπτώσεις επίπονη, αλλά δεν αποτελεί σπατάλη χρόνου, καθώς προσφέρει πολύτιμα συμπεράσματα. Η πολυμεταβλητή ανάλυση,** με την ευρεία έννοια, αφορά σε κάθε ανάλυση δεδομένων που λαμβάνει υπόψη της ένα μεγάλο αριθμό μεταβλητών. Σε κάθε περίπτωση, * Τονίζεται ότι οι μεταβλητές δεν υπάρχουν στη φύση, αλλά είναι στατιστικές έννοιες και σχεδιάζονται από τον ερευνητή. Το φύλο, για παράδειγμα, δεν είναι μεταβλητή, αλλά μετατρέπεται σε μεταβλητή Χ και οι πραγματοποιήσεις του είναι οι αριθμοί 1 (για τους άνδρες) και 0 (για τις γυναίκες). Πρέπει να σημειωθεί, εξάλλου, ότι ο αγγλικός όρος για τη μεταβλητή είναι variate και όχι variable. ** Ο όρος multivariate analysis αποδίδεται ορθά με τον όρο «πολυμεταβλητή ανάλυση» και όχι με τον όρο «πολυπαραγοντική ανάλυση». χρησιμοποιείται ένα μαθηματικό μοντέλο για να ερμηνευτεί η συσχέτιση μεταξύ των μεταβλητών μιας μελέτης. Οι «ισότητες πιθανοφάνειας» (likelihood equations) που χρησιμοποιούνται για την εκτίμηση των επιδημιολογικών μέτρων σχέσης*** με ταυτόχρονο έλεγχο των συγχυτών αποτελούν χαρακτηριστικό παράδειγμα μαθηματικού μοντέλου που χρησιμοποιεί η πολυμεταβλητή ανάλυση. 8 Αρκετά άλλα πολυμεταβλητά μαθηματικά μοντέλα χρησιμοποιούνται σε συγκεκριμένες περιπτώσεις. Για παράδειγμα, η «ανάλυση παραγόντων» (factor analysis) χρησιμοποιείται για τη μετατροπή ενός μεγάλου αριθμού προβλεπτικών**** μεταβλητών σε ένα μικρότερο αριθμό «παραγόντων» που αντιπροσωπεύει συσχετισμένες υποομάδες από την αρχική «αυθεντική» ομάδα των μεταβλητών. Επιπλέον, η «ανάλυση χρονικών σειρών» (time series analysis) είναι μια μέθοδος που χρησιμοποιείται για την εκτίμηση της σχέσης μεταξύ μεταβλητών, ενώ παράλληλα λαμβάνει υπόψη της τη μεταβλητότητα που οφείλεται στο χρόνο και τη συσχέτιση μεταξύ επιλεγμένων μεταβλητών. Στην επιδημιολογία, η πολυμεταβλητή ανάλυση που παρουσιάζει το μεγαλύτερο ενδιαφέρον και τις περισσότερες εφαρμογές είναι η πολυμεταβλητή (multivariate) ή πολλαπλή ανάλυση παλινδρόμησης (multiple regression analysis). 2. ΜΑΘΗΜΑΤΙΚΑ ΜΟΝΤΕΛΑ Στην εικόνα 1 φαίνεται η σχέση μεταξύ της προτυπο- *** Τα μέτρα αποτελέσματος (effect measures) υπολογίζονται στις περιπτώσεις εκείνες κατά τις οποίες η έκθεση και η μη έκθεση στην ενδεικτική κατηγορία ενός προσδιοριστή αφορούν στον ίδιο πληθυσμό. Τα μέτρα αποτελέσματος εκτιμούν την αιτιακή σχέση μεταξύ της ενδεικτικής κατηγορίας του προσδιοριστή και της συχνότητας εμφάνισης της πάθησης. Αντιθέτως, τα μέτρα σχέσης (measures of association) υπολογίζονται στις περιπτώσεις εκείνες κατά τις οποίες η έκθεση και η μη έκθεση στην ενδεικτική κατηγορία ενός προσδιοριστή αφορούν σε δύο διαφορετικούς πληθυσμούς. Επιπλέον, εκτιμούν την πιθανολογική σχέση μεταξύ της ενδεικτικής κατηγορίας ενός προσδιοριστή και της συχνότητας εμφάνισης της πάθησης. Ο υπολογισμός των μέτρων αποτελέσματος απαιτεί τα μελετώμενα άτομα να βρίσκονται ταυτόχρονα τόσο στην εκτεθειμένη όσο και στη μη εκτεθειμένη ομάδα. Αυτό βεβαίως είναι αδύνατο και γι αυτό σε μια μελέτη υπολογίζονται πάντοτε τα μέτρα σχέσης. **** Οι προβλεπτικές (predictors) μεταβλητές ονομάζονται και ανεξάρτητες (independents) ή απαντητικές (responses) ή εξηγητικές (explanatory) μεταβλητές. Πρέπει, πάντως, να σημειωθεί ότι οι στατιστικοί δεν προτιμούν τους όρους «εξαρτημένες» και «ανεξάρτητες» μεταβλητές, έτσι ώστε να αποφεύγεται η σύγχυση με τους αντίστοιχους όρους της θεωρίας των πιθανοτήτων (θεωρία της στατιστικής ανεξαρτησίας), 13,14 όπου δύο (π.χ. Α και Β) ενδεχόμενα (events) είναι ανεξάρτητα όταν (α) η πιθανότητα πραγματοποίησης του Α δεν επηρεάζεται από την πληροφορία ότι έχει ήδη πραγματοποιηθεί το Β, δηλαδή P(A/B)=P(A) και (β) η πιθανότητα πραγματοποίησης του Β δεν επηρεάζεται από την πληροφορία ότι έχει ήδη πραγματοποιηθεί το Α, δηλαδή P(Β/Α)=P(B). Οι όροι «εξαρτημένες» και «ανεξάρτητες» μεταβλητές, όπως χαρακτηριστικά αναφέρει ο Strike, είναι ένα «παλιό ρούχο» ή, αλλιώς, αποφόρι προερχόμενο από τη γεωμετρία, που δεν πρέπει να χρησιμοποιείται.

3 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 409 ποιημένης κατά ηλικία θνησιμότητας από καρκίνο του λάρυγγα και του αριθμού των τσιγάρων που καταναλώνονται καθημερινά. 15 Η ευθεία γραμμή στην εικόνα 1 αποτελεί παράδειγμα ενός απλού μαθηματικού μοντέλου. Πρόκειται για μοντέλο, καθώς χρησιμοποιείται η μαθηματική ισότητα της ευθείας γραμμής που αντιστοιχεί στα δεδομένα της μελέτης για να περιγραφεί η σχέση μεταξύ των δύο μεταβλητών του γραφήματος, δηλαδή του αριθμού των τσιγάρων και της θνησιμότητας από καρκίνο του λάρυγγα. Στην επιδημιολογία, τα μαθηματικά μοντέλα χρησιμοποιούνται για διάφορους σκοπούς, κυριότεροι από τους οποίους είναι η πρόβλεψη και η εξουδετέρωση των συγχυτών. 9 Τα προβλεπτικά μοντέλα χρησιμοποιούνται για την πρόβλεψη ή, με άλλη διατύπωση, την αποτίμηση του κινδύνου* (risk assessment) και στηρίζονται στην πληροφορία που προέρχεται από προβλεπτικούς προσδιοριστές** ή αλλιώς παράγοντες κινδύνου. Έτσι, ένα μαθηματικό προβλεπτικό μοντέλο εξάγει μια μαθηματική ισότητα που στη συνέχεια χρησιμοποιείται για να εκτιμηθεί, π.χ., ο κίνδυνος ενός ατόμου να εμφανίσει έμφραγμα του μυοκαρδίου στα επόμενα 10 έτη με βάση την ηλικία, το φύλο, το ιατρικό ιστορικό, την αρτηριακή πίεση, το ιστορικό καπνισματικής συνήθειας, το βάρος, το ύψος, τη σωματική άσκηση και το οικογενειακό ιστορικό του ατόμου. Οι τιμές για τον καθέναν από τους προβλεπτικούς αυτούς προσδιοριστές είναι δυνατόν να εισέλθουν σε μια μαθηματική ισότητα που προβλέπει τον κίνδυνο εμφάνισης εμφράγματος του μυοκαρδίου με βάση το συνδυασμό όλων αυτών των προσδιοριστών. Το μοντέλο πρέπει να περιλαμβάνει όρους για όλους τους μελετώμενους προσδιοριστές. Η επιδημιολογική έρευνα, πάντως, εστιάζεται όχι τόσο στην αποτίμηση του κινδύνου για συγκεκριμένα άτομα (περιγραφικές σχέσεις), αλλά κυρίως στην αναζήτηση του Θάνατοι από καρκίνο του λάρυγγα/ ανθρωπο-έτη Ημερήσιος αριθμός τσιγάρων Εικόνα 1. Προτυποποιημένη, ως προς την ηλικία, θνησιμότητα από καρκίνο του λάρυγγα σε σχέση με τον ημερήσιο αριθμό τσιγάρων. 10 αιτιακού ρόλου συγκεκριμένων προσδιοριστών (αιτιακές σχέσεις) στην πρόκληση μιας πάθησης. 9 Στην αιτιολογική έρευνα, τα μαθηματικά μοντέλα χρησιμοποιούνται για να εκτιμηθεί ο αιτιολογικός ρόλος ενός προσδιοριστή με ταυτόχρονη εξουδετέρωση των πιθανών συγχυτών. Η χρήση των πολυμεταβλητών μοντέλων στην αιτιολογική έρευνα διαφέρει σημαντικά από τη χρήση των αντίστοιχων μοντέλων για την εκτίμηση του κινδύνου σε συγκεκριμένα άτομα και γι αυτό σε καθεμιά περίπτωση η κατασκευή του κατάλληλου μοντέλου απαιτεί ορισμένες προϋποθέσεις. Αρκετές φορές, δυστυχώς, δεν διαχωρίζεται η χρήση των πολυμεταβλητών μοντέλων για την εκτίμηση του κινδύνου σε συγκεκριμένα άτομα από τη χρήση των αντίστοιχων μοντέλων στην αιτιολογική έρευνα. 3. ΠΑΛΙΝΔΡΟΜΗΣΗ Ο όρος regression (παλινδρόμηση) εισήχθη το 1877 από τον Francis Galton*** ( ) στην προσπάθειά * Η έννοια του κινδύνου συνδέεται άμεσα με την έννοια της επίπτωσηςποσοστού. 8 11,16,17 Με τον όρο κίνδυνος νοείται η επίπτωση-ποσοστό σε επίπεδο ατόμου. Ο κίνδυνος (risk) ορίζεται ως η πιθανότητα ενός ατόμου να εμφανίσει ένα ανεπιθύμητο συμβάν (έναρξη πάθησης ή θάνατος) σε ένα συγκεκριμένο χρονικό διάστημα. Η επίπτωση-ποσοστό είναι εμπειρικό ή θεωρητικό μέτρο συχνότητας, ενώ ο κίνδυνος είναι θεωρητικό μέτρο και το μέγεθός του δεν υπολογίζεται, αλλά έχει a priori μια συγκεκριμένη, αλλά άγνωστη τιμή. Η τιμή αυτή εκτιμάται με βάση τα εμπειρικά μέτρα συχνότητας που διαπιστώνονται σε έναν ορισμένο τομέα. Εάν η εγχειρητική θνητότητα μιας πάθησης, για παράδειγμα, είναι 30%, τότε ο κίνδυνος ενός ατόμου να πεθάνει κατά τη διάρκεια της εγχείρησης είναι 0,30 πριν και μετά από την εγχείρηση, αδιακρίτως έκβασης. ** Παράγοντας κινδύνου (risk factor) ή έκθεση (exposure) ή προσδιοριστής (determinant), όπως τελικά επικράτησε να λέγεται σήμερα, είναι το χαρακτηριστικό των ατόμων από το οποίο εξαρτάται (σχετίζεται ή συναρτάται) η συχνότητα της μελετώμενης έκβασης. 5,11,17,18 Ο προσδιοριστής της συχνότητας μιας μελετώμενης έκβασης περιλαμβάνει δύο κατηγορίες, την ενδεικτική κατηγορία (index category) και την κατηγορία αναφοράς (reference category). Η επιλογή της κατηγορίας αναφοράς του προσδιοριστή είναι μείζονος σημασίας στο σχεδιασμό της μελέτης. Είναι κρίσιμης σημασίας να γίνει αντιληπτό ότι η κατηγορία αναφοράς δεν είναι συμφυές χαρακτηριστικό του προσδιοριστή, αλλά αποτέλεσμα εκλογής του ερευνητή, άρα συνέπεια του σχεδιασμού της μελέτης. Από την επιλογή της κατηγορίας αναφοράς εξαρτάται η ερμηνεία των αποτελεσμάτων μιας μελέτης. Για παράδειγμα, προσδιοριστής της συχνότητας της νεφρικής πάθησης δεν είναι η αρτηριακή υπέρταση, αλλά η αρτηριακή πίεση. Η αρτηριακή υπέρταση είναι μια κατηγορία και συνήθως η ενδεικτική κατηγορία του προσδιοριστή, στην οποία μελετάται η συχνότητα της νεφρικής πάθησης, σε σχέση πάντοτε με τη συχνότητα της νεφρικής πάθησης στην κατηγορία αναφοράς, εν προκειμένω στην κατηγορία των ατόμων που δεν έχουν αρτηριακή πίεση. *** Ο Francis Galton το 1885 προέβη στην εξήγηση του όρου regression, στηριζόμενος στις αρχές της κανονικής κατανομής. Στην προσπάθειά του αυτή σημαντική ήταν η συμβολή του Hamilton Dickson, καθηγητή μαθηματικών στο Cambridge. Ο Galton το 1889 εξέδωσε το natural inheritance συμπεριλαμβάνοντας την εξήγησή του για τον όρο regression. 19 Ο Galton θεωρείται ως ο θεμελιωτής της βιομετρίας και σε συνεργασία με τους Pearson, Edgeworth και Fisher συνέβαλε σημαντικά στην πρόοδο των μαθηματικών και της στατιστικής. Αν και ολοκλήρωσε τις σπουδές του στην Ιατρική, δεν την άσκησε ποτέ, προτιμώντας τα μαθηματικά και τη βιομετρία και εκδίδοντας μάλιστα, το 1901, σε συνεργασία με τους Pearson και Weldon το περιοδικό Biometrika.

4 410 Π. Γαλάνης του να ερμηνεύσει τη σχέση του ύψους μεταξύ γονιών και παιδιών. Διαπίστωσε ότι γονείς υψηλού αναστήματος συνήθως αποκτούν παιδιά υψηλού αναστήματος, αλλά το μέσο ύψος των παιδιών αυτών τείνει να είναι μικρότερο από το μέσο ύψος των γονιών τους, πλησιάζοντας μάλιστα το μέσο ύψος του πληθυσμού υπό παρακολούθηση. Επιπλέον, διαπίστωσε ότι οι γονείς μικρού αναστήματος αποκτούν, συνήθως, παιδιά μικρού αναστήματος, αλλά το μέσο ύψος των παιδιών αυτών τείνει να είναι μεγαλύτερο από το μέσο ύψος των γονιών τους πλησιάζοντας το μέσο ύψος του πληθυσμού υπό παρακολούθηση. Ο Galton όρισε το φαινόμενο αυτό ως «παλινδρόμηση προς τη μετριότητα» ( regression towards mediocrity ), ενώ σήμερα οι στατιστικοί το ονομάζουν «παλινδρόμηση προς τη μέση τιμή» ( regression towards the mean ). 13,19 Πρέπει, πάντως, να σημειωθεί ότι σήμερα η χρήση του όρου «παλινδρόμηση» στη στατιστική θεωρείται ως «ιστορική ανωμαλία» που δημιουργεί σύγχυση. Όπως προαναφέρθηκε, στην ανάλυση δεδομένων ο όρος «παλινδρόμηση» (regression*) σήμαινε αρχικά την παλινδρόμηση προς τη μέση τιμή, οπότε τα «μοντέλα παλινδρόμησης» (regression models) και η «ανάλυση παλινδρόμησης» (regression analysis) αναφέρονται στη σχέση μεταξύ μιας εξαρτημένης παραμέτρου (π.χ. του μέσου μιας ποσότητας) και ενός συνόλου ποσοτικών ανεξάρτητων μεταβλητών (προσδιοριστών). 18 Αντιθέτως, στην «ανάλυση διασποράς» (analysis of variates) οι ανεξάρτητες μεταβλητές είναι ενδεικτικές** μεταβλητές (indicator variables), ενώ στην «ανάλυση συνδιασποράς» (analysis of covariance) οι ανεξάρτητες μεταβλητές είναι τόσο ποσοτικές όσο και ενδεικτικές. Σήμερα, πάντως, ο όρος «παλινδρόμηση» αναφέρεται στη σχέση μιας παραμέτρου*** με ένα σύνολο προσδιοριστών ανεξάρτητα από τη φύση τους. Ένα μοντέλο παλινδρόμησης θεωρείται γραμμικό (linear) όταν είναι της μορφής: P=A 0+ Σi A ix i * Ο όρος regression σε ορισμένες περιπτώσεις αποδίδεται με τον όρο «εξάρτηση». 20 ** Πρέπει να σημειωθεί ότι στην περίπτωση των ενδεικτικών μεταβλητών, τόσο η έκβαση (εξαρτημένη μεταβλητή) όσο και οι προσδιοριστές (ανεξάρτητες μεταβλητές) δεν αποτελούν στατιστικές ποσότητες, δεν αποτελούν δηλαδή μεταβλητές. Στατιστικά, ωστόσο, αναπαρίστανται (εκφράζονται ή δηλώνονται) με τη μορφή μεταβλητών, κάτι που αποτελεί επιλογή του ερευνητή. Η εμφάνιση ή μη μιας πάθησης, π.χ., δεν αποτελεί μεταβλητή, αλλά εκφράζεται με τη μορφή μιας ενδεικτικής μεταβλητής όπου η εμφάνιση ή μη της πάθησης δηλώνεται με αριθμούς, συνήθως 1 και 0, αντίστοιχα. Στη συνέχεια, αναφέρεται αναλυτικά ο τρόπος με τον οποίο λαμβάνονται υπόψη σε ένα μαθηματικό υπόδειγμα (ή μοντέλο) οι μεταβλητές που έχουν τουλάχιστον τρεις κατηγορίες (π.χ. η ομάδα αίματος). *** Στην επιδημιολογία, παράμετροι δεν είναι οι μεταβλητές (π.χ. Χ 1, Χ 2... Χ n), αλλά οι συντελεστές παλινδρόμησης (Α 0, Α 1, Α 2...Α n). Στην παραπάνω ισότητα, η τιμή της εξαρτημένης παραμέτρου P θεωρείται ως γραμμικός συνδυασμός των ανεξάρτητων συντελεστών Α 0, Α 1, Α Απλή γραμμική παλινδρόμηση Το βασικό μαθηματικό μοντέλο που περιγράφει τη σχέση μεταξύ δύο μεταβλητών είναι η ευθεία γραμμή. 8 Το γραμμικό μοντέλο για δύο μεταβλητές αποτελεί τη βάση για τη δημιουργία πιο σύνθετων μοντέλων μεταξύ περισσότερων μεταβλητών. Στην εικόνα 1, τα δεδομένα αναπαριστούν (δηλώνουν ή εκφράζουν) μια σχεδόν τέλεια γραμμική σχέση μεταξύ του αριθμού των τσιγάρων που καταναλώνονται καθημερινά και της προτυποποιημένης για την ηλικία θνησιμότητας από καρκίνο του λάρυγγα. 9 Σπάνια, πάντως, τα δεδομένα μιας επιδημιολογικής μελέτης αναπαριστούν μια τόσο εντυπωσιακή γραμμική σχέση. Η ευθεία γραμμή που δημιουργείται διαμέσου των σημείων που αντιστοιχούν στα δεδομένα μιας μελέτης ονομάζεται γραμμή παλινδρόμησης (regression line) και εκτιμά τις μέσες τιμές για τη μεταβλητή στον κάθετο άξονα (y) σύμφωνα με τις τιμές της μεταβλητής στον οριζόντιο άξονα (x). Στην περίπτωση αυτή, το μαθηματικό μοντέλο που χρησιμοποιείται είναι η απλή γραμμική παλινδρόμηση (simple linear regression), καθώς η σχέση μεταξύ των δύο μεταβλητών περιγράφεται από μια ευθεία γραμμή σύμφωνα με την ακόλουθη ισότητα: 8,9,13,19,21 Y = Α 0 + Α 1Χ 1 + ε (1) Στην ισότητα 1, το Y είναι η εξαρτημένη μεταβλητή της απλής γραμμικής παλινδρόμησης, ενώ το Χ 1 είναι η ανεξάρτητη μεταβλητή. Ουσιαστικά, το Y αντιστοιχεί στη μελετώμενη έκβαση, ενώ το Χ 1 αντιστοιχεί στο μελετώμενο προσδιοριστή. Το Α 0 είναι η σταθερά της απλής γραμμικής παλινδρόμησης και είναι η μέση τιμή που λαμβάνει η μεταβλητή Y, όταν η μεταβλητή Χ 1 ισούται με 0. Το Α 1 περιγράφει την κλίση της ευθείας γραμμής που συσχετίζει το Χ 1 με το Y. Το Α 1 είναι ο αριθμός των μονάδων που μεταβάλλεται το Y κάθε φορά που η τιμή του Χ 1 μεταβάλλεται κατά μία μονάδα. Το ε είναι το τυχαίο σφάλμα που αντιπροσωπεύει την τυχαία απόκλιση από την αναμενόμενη τιμή της εξαρτημένης μεταβλητής Y. Η μέση τιμή του τυχαίου σφάλματος, γενικά, θεωρείται ίση με 0. Οι τιμές των Α 0 και Α 1 κυμαίνονται θεωρητικά από - έως +. Στην εικόνα 2 απεικονίζεται η απλή γραμμική σχέση μεταξύ δύο οποιωνδήποτε μεταβλητών Χ 1 και Y. Όπως προαναφέρθηκε, είναι σπάνιο η πραγματική σχέση μεταξύ δύο μεταβλητών να είναι τελείως γραμμική. Η υπόθεση που ισχύει για την εφαρμογή ενός μαθηματικού μοντέλου σε μια ανάλυση είναι ότι το μοντέλο αυτό

5 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 411 Εικόνα 2. Γραφική αναπαράσταση της απλής γραμμικής σχέσης μεταξύ δύο μεταβλητών Χ 1 και Υ. αποτελεί μια απλοποιημένη περιγραφή της σχέσης μεταξύ δύο μεταβλητών και δεν συμμορφώνεται αναγκαστικά με την πραγματική τους σχέση. Προσεγγίζει, ωστόσο, αρκετά την πραγματική σχέση μεταξύ των δύο μεταβλητών, με αποτέλεσμα να δικαιολογείται η χρήση του. Αποκλίσεις των δεδομένων από το εφαρμοζόμενο μαθηματικό μοντέλο απεικονίζουν την ασυμφωνία μεταξύ του μοντέλου και της φύσης, καθώς επίσης και πηγές ανακρίβειας στη συλλογή των πληροφοριών. Επιλέγεται ένα μοντέλο που, λογικά, ταιριάζει όσο το δυνατόν περισσότερο με τα δεδομένα, έτσι ώστε το μεγαλύτερο μέρος της απόκλισης των δεδομένων από το μοντέλο αυτό να οφείλεται στην ανακρίβεια που προέρχεται από τα ίδια τα δεδομένα και όχι στην ακαταλληλότητα του μοντέλου. Στην εικόνα 1, το Y αναπαριστά την προτυποποιημένη για την ηλικία θνησιμότητα από καρκίνο του λάρυγγα, ενώ το Χ 1 αναπαριστά τον αριθμό των τσιγάρων που καταναλώνονται καθημερινά. Η ισότητα για τη γραμμή παλινδρόμησης της εικόνας 1 είναι Y=1,15+0,282Χ 1. Οι τιμές αυτές αναφέρονται σε θανάτους από καρκίνο του λάρυγγα ανά ανθρωπο-έτη παρακολούθησης. Η σταθερά (Α 0=1,15) δηλώνει τον αριθμό των θανάτων από καρκίνο του λάρυγγα που θα συνέβαιναν ανά ανθρωπο-έτη σε περίπτωση απουσίας του καπνίσματος. Έτσι, για τους μη καπνιστές, η θνησιμότητα από καρκίνο του λάρυγγα, σύμφωνα με το μοντέλο αυτό της απλής γραμμικής παλινδρόμησης, είναι 1,15 θάνατοι ανά ανθρωπο-έτη. Σύμφωνα με τα δεδομένα της μελέτης, η αντίστοιχη θνησιμότητα για τους μη καπνιστές βρέθηκε ίση με 0,6 θανάτους ανά ανθρωπο-έτη. Επομένως, 0,6 θάνατοι η πραγματική για τους θνησιμότητα( ανθρωπο-έτη ) μη καπνιστές είναι λίγο μικρότερη από την αντίστοιχη 1,15 θάνατοι θνησιμότητα που υπολογίζεται ( ανθρωπο-έτη ) με το εφαρμοζόμενο μοντέλο της απλής γραμμικής παλινδρόμησης. Το γεγονός αυτό οφείλεται στο ότι η ευθεία γραμμή της εικόνας 1 εκτιμάται έπειτα από το συνδυασμό και των πέντε σημείων που αντιστοιχούν στα δεδομένα της μελέτης και όχι μόνο από το σημείο που αντιστοιχεί στην απουσία του καπνίσματος. Η κλίση της γραμμής παλινδρόμησης ισούται με 0,282, που σημαίνει ότι ο αριθμός των θανάτων ανά ανθρωπο-έτη αυξάνεται κατά 0,282 για κάθε επιπλέον τσιγάρο που καταναλώνεται καθημερινά. Έτσι, για εκείνους που καπνίζουν καθημερινά 50 τσιγάρα η θνησιμότητα από καρκίνο του λάρυγγα ισούται με 1,15+0,282 50=15,2 θανάτους ανά ανθρωπο-έτη. Με την προϋπόθεση ότι έχουν εξουδετερωθεί οι συγχυτές,* καθώς και τα υπόλοιπα συστηματικά σφάλματα της μελέτης, η τιμή ή, αλλιώς, το μέγεθος της κλίσης (Α 1=0,282) ποσοτικοποιεί το αποτέλεσμα του καπνίσματος στη θνησιμότητα από καρκίνο του λάρυγγα. Η ισότητα για τη γραμμή παλινδρόμησης (Y=1,15+0,282Χ 1), εξάλλου, παρέχει τη δυνατότητα εκτίμησης των λόγων θνησιμοτήτων σε διαφορετικά επίπεδα καπνισματικής συνήθειας. Για παράδειγμα, για εκείνους που καταναλώνουν καθημερινά 50 τσιγάρα η θνησιμότητα από καρκίνο 15,2 θάνατοι του λάρυγγα είναι. Συγκρίνοντας ανθρωπο-έτη τη θνησιμότητα αυτή με τη θνησιμότητα για τους μη 1,15 θάνατοι καπνιστές, προκύπτει ότι ο λόγος ( ανθρωπο-έτη) των θνησιμοτήτων για εκείνους που καπνίζουν καθημερινά 50 τσιγάρα σε σχέση με εκείνους που δεν καπνίζουν είναι 15,2 = 13,3. Έτσι, η καπνισματική συνήθεια αποτελεί 1,15 προσδιοριστή της συχνότητας του θανάτου από καρκίνο του λάρυγγα. * Ο συγχυτής (confounder) 1,2,4,5,8 12,18,22 είναι το χαρακτηριστικό εκείνο που (α) σχετίζεται με τη συχνότητα εμφάνισης της πάθησης, αποτελώντας έτσι εξωγενή προσδιοριστή της συχνότητας εμφάνισης της πάθησης, (β) σχετίζεται με το μελετώμενο προσδιοριστή, ανισοκατανέμεται δηλαδή στις δύο κατηγορίες του προσδιοριστή και (γ) δεν αποτελεί αποτέλεσμα του μελετώμενου προσδιοριστή. Οι εξωγενείς προσδιοριστές (extraneous determinants) ονομάζονται δυνητικοί συγχυτές (potential confounders), καθώς σχετίζονται με τη συχνότητα εμφάνισης της μελετώμενης πάθησης. Όταν οι εξωγενείς αυτοί προσδιοριστές ανισοκατανέμονται κιόλας στις κατηγορίες του μελετώμενου προσδιοριστή, τότε ονομάζονται πραγματικοί συγχυτές (actual confounders). Οι συγχυτές είναι συστηματικά σφάλματα που μπορούν, εφόσον διαπιστωθούν, να εξουδετερωθούν (ή ελεγχθούν) κατά την ανάλυση των δεδομένων, κάτι που δεν μπορεί να γίνει στα συστηματικά σφάλματα επιλογής ή πληροφορίας.

6 412 Π. Γαλάνης Πολλαπλή γραμμική παλινδρόμηση Η ισότητα 1 χρησιμοποιείται στην περίπτωση της απλής γραμμικής παλινδρόμησης επειδή υπάρχει μόνο μία ανεξάρτητη μεταβλητή. Το μοντέλο, ωστόσο, της γραμμικής παλινδρόμησης μπορεί να επεκταθεί, περιλαμβάνοντας περισσότερες από μία ανεξάρτητες μεταβλητές, οπότε προκύπτει το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης: 8,9,13,19,21 Y = Α 0 + Α 1Χ 1 + Α 2Χ 2 + Α 3Χ (2) Το μοντέλο της πολλαπλής γραμμικής παλινδρόμησης, το οποίο στη στατιστική ονομάζεται γενικό γραμμικό μοντέλο (general linear model), και γενικότερα τα μοντέλα που περιλαμβάνουν περισσότερες από μία ανεξάρτητες μεταβλητές ταυτόχρονα, χρησιμοποιούνται για την εξουδετέρωση των συγχυτών αντί της διαστρωματικής ανάλυσης. Στα πολυμεταβλητά μαθηματικά μοντέλα περιλαμβάνονται αρκετοί προσδιοριστές, αλλά το αποτέλεσμα του καθενός δεν συγχέεται από τη δράση των υπολοίπων και γι αυτό τα μοντέλα αυτά είναι ιδανικά για την εξουδετέρωση των συγχυτών μιας μελέτης όταν, βεβαίως, δεν είναι δυνατή η εφαρμογή της διαστρωματικής ανάλυσης. Η ισότητα 2 αντιστοιχεί και πάλι σε μια ευθεία γραμμή, αλλά η γραμμή αυτή διαγράφει στο χώρο ένα διάστημα με περισσότερες από δύο διαστάσεις, καθώς σε κάθε μεταβλητή αντιστοιχεί μία διάσταση. Το Y αναπαριστά τη θνησιμότητα από καρκίνο του λάρυγγα, ενώ υπάρχουν δύο ανεξάρτητες μεταβλητές Χ 1 και Χ 2 στο μοντέλο της πολλαπλής γραμμικής παλινδρόμησης. Το Χ 1 είναι ο αριθμός των τσιγάρων που καταναλώνονται καθημερινά, ενώ το Χ 2 είναι τα γραμμάρια οινοπνεύματος που καταναλώνονται καθημερινά. Η κατανάλωση ή μη οινοπνεύματος είναι, επίσης, προσδιοριστής της συχνότητας του θανάτου από καρκίνο του λάρυγγα. Όταν υπάρχουν δύο ανεξάρτητες μεταβλητές και μία εξαρτημένη, τότε απαιτείται η τρισδιάστατη απεικόνιση των δεδομένων στο χώρο, καθώς απαιτούνται δύο διαστάσεις για τις δύο ανεξάρτητες μεταβλητές και μία διάσταση για την εξαρτημένη μεταβλητή. Η καπνισματική συνήθεια και η κατανάλωση ή μη οινοπνεύματος συσχετίζονται μεταξύ τους, οπότε αναμένεται καθένα από τα δύο αυτά χαρακτηριστικά να είναι συγχυτής της σχέσης του άλλου με τη μελετώμενη έκβαση, όπου στη συγκεκριμένη περίπτωση είναι ο θάνατος από καρκίνο του λάρυγγα. Η διαστρωματική ανάλυση αποτελεί την καλύτερη μέθοδο εξουδετέρωσης της σύγχυσης όταν ο αριθμός των πιθανών συγχυτών είναι μικρός, αλλά μπορεί να χρησιμοποιηθεί και η πολλαπλή γραμμική παλινδρόμηση, οπότε εφαρμόζεται η ισότητα 2. Στο συγκεκριμένο παράδειγμα, η εφαρμογή της ισότητας 2 περιλαμβάνει δύο προσδιοριστές (ή αλλιώς προβλεπτικούς δείκτες), την καπνισματική συνήθεια (Χ 1) και την κατανάλωση ή μη οινοπνεύματος (Χ 2), οπότε υπολογίζονται δύο συντελεστές, Α 1 και Α 2, αντίστοιχα. Οι συντελεστές Α 1 και Α 2 εκτιμούν το αποτέλεσμα της δράσης του καπνίσματος και του οινοπνεύματος, αντίστοιχα, εξουδετερώνοντας ταυτόχρονα τη σύγχυση που τυχόν υπάρχει στη σχέση μεταξύ της ενδεικτικής κατηγορίας του κάθε προσδιοριστή ξεχωριστά και της συχνότητας του θανάτου από καρκίνο του λάρυγγα. Μαθηματικά, τουλάχιστον, δεν υπάρχει περιορισμός στον αριθμό των ανεξάρτητων μεταβλητών που μπορούν να χρησιμοποιηθούν στην πολλαπλή γραμμική παλινδρόμηση, αν και μικρός αριθμός δεδομένων επιτρέπει να χρησιμοποιηθούν λίγες μόνο ανεξάρτητες μεταβλητές Μετασχηματισμός του μοντέλου της γραμμικής παλινδρόμησης Μαθηματικά, η εξαρτημένη μεταβλητή σε ένα μοντέλο παλινδρόμησης μπορεί να λάβει οποιαδήποτε τιμή. Στην επιδημιολογία, ωστόσο, η εξαρτημένη μεταβλητή σε αρκετές περιπτώσεις περιορίζεται σε ορισμένες μόνο τιμές. Αν η εξαρτημένη μεταβλητή, π.χ., είναι η αρτηριακή πίεση, τότε μπορεί να λάβει μόνο θετικές τιμές. Στην περίπτωση που η εξαρτημένη μεταβλητή είναι η συχνότητα εμφάνισης μιας πάθησης, τότε η μελετώμενη έκβαση μπορεί είτε να εμφανιστεί είτε όχι, οπότε η μεταβλητή λαμβάνει τιμές 1 και 0, αντίστοιχα. Συνήθως, η εμφάνιση της μελετώμενης έκβασης, όταν η μεταβλητή είναι ενδεικτική, ονομάζεται «επιτυχία» και συμβολίζεται με 1, ενώ η μη εμφάνιση της μελετώμενης έκβασης ονομάζεται «αποτυχία» και συμβολίζεται με 0. Στις περιπτώσεις αυτές απαιτείται ο μετασχηματισμός του μοντέλου της γραμμικής παλινδρόμησης, έτσι ώστε η εξαρτημένη μεταβλητή να λαμβάνει τιμές που είναι δυνατές. Στην εικόνα 1, π.χ., η σταθερά (Α 0) της ευθείας γραμμής είναι 1,15 θάνατοι ανά ανθρωπο-έτη, αλλά αν τα δεδομένα της μελέτης ήταν λίγο διαφορετικά, τότε η ευθεία γραμμή της γραμμικής παλινδρόμησης θα μπορούσε να κινηθεί στον άξονα των y σε μια τιμή <0. Στην περίπτωση αυτή η θνησιμότητα για τους μη καπνιστές θα ήταν αρνητική, κάτι που είναι αδύνατο. Το μοντέλο της γραμμικής παλινδρόμησης επιτρέπει στην εξαρτημένη μεταβλητή να λάβει οποιαδήποτε τιμή. Είναι εφικτός, πάντως, ο μετασχηματισμός του μοντέλου της γραμμικής παλινδρόμησης, έτσι ώστε η εξαρτημένη μεταβλητή να λαμβάνει μόνο θετικές τιμές. Ένας τρόπος για να επιτευχθεί αυτό είναι η προσαρμογή της ευθείας γραμμής στο λογάριθμο της θνησιμότητας από καρκίνο του λάρυγγα παρά στη θνησιμότητα: ln(y) = Α 0 + Α 1Χ 1 + Α 2Χ 2 (3)

7 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 413 Ο ln(y) είναι ο φυσικός λογάριθμος του Y. Στην ισότητα 3, τόσο το αριστερό όσο και το δεξιό μέρος της ισότητας μπορούν να λάβουν τιμές από - έως +. Το Y, ωστόσο, μπορεί να λάβει μόνο θετικές τιμές, καθώς δεν υφίσταται ο λογάριθμος αρνητικών αριθμών. Η ισότητα 3 επιλύεται ως προς Y, λαμβάνοντας τον αντιλογάριθμο και των δύο μελών: Υ=e A0+A1X1+A2X2 (4) Η ισότητα 4 επιτρέπει στο Y να λάβει μόνο θετικές τιμές. Πρέπει, πάντως, να σημειωθεί ότι για να επιτευχθεί η διευκόλυνση αυτή δεν χρησιμοποιείται, πλέον, ένα απλό γραμμικό μοντέλο, αλλά ένα εκθετικό μοντέλο, όπως φαίνεται στην ισότητα 4. Η χρησιμοποίηση ενός εκθετικού μοντέλου αντί ενός γραμμικού έχει ως αποτέλεσμα και τη διαφορετική ερμηνεία των συντελεστών του μοντέλου. Στην εικόνα 1, η κλίση της ευθείας γραμμής, ο συντελεστής δηλαδή της απλής γραμμικής παλινδρόμησης, ισούται με 0,282 θανάτους ανά ανθρωπο-έτη και είναι ένα απόλυτο μέτρο της αύξησης της θνησιμότητας από καρκίνο του λάρυγγα για κάθε επιπλέον τσιγάρο που καταναλώνεται καθημερινά. Εάν το μοντέλο της απλής γραμμικής παλινδρόμησης εφαρμοστεί στην περίπτωση όπου η μελετώμενη έκβαση είναι ενδεικτική, με την τιμή Χ=0 να αντιστοιχεί στους μη εκτεθειμένους (ή, αλλιώς, στην κατηγορία αναφοράς του μελετώμενου προσδιοριστή) και την τιμή Χ=1 να αντιστοιχεί στους εκτεθειμένους (ή, αλλιώς, στην ενδεικτική κατηγορία), τότε ο συντελεστής Α 1 αντιστοιχεί στη διαφορά συχνοτήτων μεταξύ εκτεθειμένων και μη εκτεθειμένων: Εκτεθειμένοι: Y e=α 0+Α 1Χ 1=Α 0+Α 11=Α 0+Α 1 Μη εκτεθειμένοι: Y 0=Α 0+Α 1Χ 1=Α 0+Α 10=Α 0 Διαφορά συχνοτήτων: Y e Y 0=Α 0+Α 1 Α 0=Α 1 Εάν η ισότητα για τους μη εκτεθειμένους (όταν Χ=0) αφαιρεθεί από την ισότητα για τους εκτεθειμένους (όταν Χ=1), τότε ο συντελεστής Α 1 ισούται με τη διαφορά των συχνοτήτων μεταξύ εκτεθειμένων και μη εκτεθειμένων. Έτσι, χωρίς τον οποιοδήποτε μετασχηματισμό, ο συντελεστής της απλής γραμμικής παλινδρόμησης μπορεί να ερμηνευτεί ως η διαφορά των συχνοτήτων μεταξύ εκτεθειμένων και μη εκτεθειμένων. Εάν χρησιμοποιηθεί, ωστόσο, ο λογαριθμικός μετασχηματισμός που φαίνεται στις ισότητες 3 και 4, τότε ο συντελεστής Α 1 στο εκθετικό μοντέλο που προκύπτει δεν ερμηνεύεται ως διαφορά συχνοτήτων: Εκτεθειμένοι: ln(y e)=α 0+Α 1Χ 1=Α 0+Α 11=Α 0+Α 1 Μη εκτεθειμένοι: ln(y 0)=Α 0+Α 1Χ 1=Α 0+Α 10=Α 0 Διαφορά συχνοτήτων: ln(y e) ln(y 0)=Α 0+Α 1 Α 0=Α 1 Λόγος συχνοτήτων: Y e Y 0 = e A1 Έτσι, στην περίπτωση του εκθετικού μοντέλου, ο αντιλογάριθμος του συντελεστή Α 1 που λαμβάνεται όταν υψωθεί η σταθερά e στη δύναμη του συντελεστή Α 1 ισούται με το λόγο των συχνοτήτων στους εκτεθειμένους σε σχέση με τους μη εκτεθειμένους. Φαίνεται, λοιπόν, ότι ο μετασχηματισμός του γραμμικού μοντέλου της απλής γραμμικής παλινδρόμησης σε εκθετικό μοντέλο έχει ως συνέπεια όχι μόνο την αποφυγή των αρνητικών τιμών της εξαρτημένης μεταβλητής, αλλά και τη διαφορετική ερμηνεία του συντελεστή παλινδρόμησης. Χωρίς το μετασχηματισμό του γραμμικού μοντέλου, ο συντελεστής παλινδρόμησης εκτιμά διαφορές συχνοτήτων, ενώ με το μετασχηματισμό σε εκθετικό μοντέλο εκτιμά λόγους συχνοτήτων. 4. ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Στην περίπτωση του γραμμικού μοντέλου της απλής γραμμικής παλινδρόμησης, η εξαρτημένη μεταβλητή μπορεί, θεωρητικά, να λάβει τιμές από το - έως το +, ενώ όταν το μοντέλο αυτό μετασχηματιστεί σε εκθετικό, η εξαρτημένη μεταβλητή μπορεί να λάβει τιμές από 0 έως +. Έτσι, το μετασχηματισμένο μοντέλο της γραμμικής παλινδρόμησης μπορεί να χρησιμοποιηθεί όταν η εξαρτημένη * Η επίπτωση-πυκνότητα (incidence-density) 5,8 11,16,23 είναι ένα μέτρο συχνότητας που ποσοτικοποιεί την εμφάνιση ενός συμβάντος με τάξη αναφοράς μια πεπερασμένη ποσότητα πληθυσμο-χρόνου (populationtime). Ο ιδιόμορφος αυτός χρόνος, δηλαδή ο πληθυσμο-χρόνος (που δεν είναι ημερολογιακός ή ηλικιακός), προκύπτει κατά την κίνηση ενός πληθυσμού (ανοικτού ή κλειστού) στον ημερολογιακό χρόνο και συνίσταται από άπειρο αριθμό προσωπο-στιγμών. Αποτελεί το άθροισμα των χρονικών περιόδων παρακολούθησης των μελών του πληθυσμού. Με δεδομένο ότι τάξη αναφοράς σε αυτό το μέτρο συχνότητας είναι ο πληθυσμο-χρόνος, η συχνότητα αφορά μόνο στην εμφάνιση συμβάντων και όχι καταστάσεων. Η επίπτωση-πυκνότητα δεν είναι καθαρός αριθμός, αλλά έχει αφενός αριθμητική τιμή και αφετέρου μονάδα μέτρησης που είναι το αντίστροφο του χρόνου [π.χ. (έτη) -1 ]. ** Η επίπτωση-ποσοστό (incidence proportion) 8 11,16,23 είναι το ποσοστό των προσωπο-στιγμών στην αρχή της παρακολούθησης (Τ 0=επιστημονικός χρόνος) που εμφάνισε τις περιπτώσεις πάθησης κατά τη διάρκεια μιας ορισμένης χρονικής περιόδου. Ο όρος προσωπο-στιγμή (person-moment ή instance) εισήχθη για να δηλώσει την ύπαρξη ενός συγκεκριμένου προσώπου σε μια συγκεκριμένη χρονική στιγμή σε ένα συγκεκριμένο τόπο. Οι περιπτώσεις της πάθησης της οποίας μελετάται η συχνότητα, είναι συμβάντα που παρατηρούνται κατά τη διάρκεια μιας περιόδου παρακολούθησης και ονομάζονται συμβάντα περιόδου (period events). Η επίπτωσηποσοστό εφαρμόζεται μόνο σε κλειστούς πληθυσμούς και εφόσον ο αριθμός των συμβάντων περιόδου δεν είναι σχετικά μεγάλος. Αυτό το μέτρο συχνότητας έχει νόημα εφόσον η διάρκεια παρακολούθησης εμπεριέχεται στην έννοια της επίπτωσης-ποσοστού, όπως η βρεφική ή η νεογνική νοσηρότητα, αλλιώς θα πρέπει να εκφράζεται με σαφήνεια.

8 414 Π. Γαλάνης μεταβλητή είναι συχνότητα (επίπτωση-πυκνότητα*), καθώς η συχνότητα λαμβάνει τιμές από 0 έως +. Το μοντέλο αυτό, ωστόσο, δεν μπορεί να χρησιμοποιηθεί όταν η εξαρτημένη μεταβλητή είναι ποσοστό (επίπτωση-ποσοστό** ή επιπολασμός***), καθώς το ποσοστό (proportion, P) μπορεί να λάβει τιμές από 0 1. Για κάθε ευθεία γραμμή ενός γραμμικού μοντέλου, στο οποίο η κλίση δεν ισούται με 0, η εξαρτημένη μεταβλητή Y μπορεί να λάβει τιμές από - έως + και όχι από 0 1. Επομένως, ένα γραμμικό μοντέλο, χωρίς τον απαιτούμενο μετασχηματισμό, μπορεί να οδηγήσει σε τιμές κινδύνου για ένα άτομο είτε αρνητικές είτε >1. Ο συνηθέστερος μετασχηματισμός που πραγματοποιείται, με σκοπό οι προβλεπόμενες τιμές κινδύνου για ένα άτομο να κυμαίνονται στο επιτρεπτό εύρος (0 1), είναι το μοντέλο της λογιστικής παλινδρόμησης. Είναι ευκολότερο να αντιληφθεί κάποιος το λογιστικό μετασχηματισμό εάν σκεφθεί ότι πραγματοποιούνται δύο διαδοχικοί μετασχηματισμοί. Ο πρώτος μετασχηματισμός επιτρέπει τη μετατροπή του ποσοστού σε ένα μέτρο, η τιμή του οποίου κυμαίνεται από 0 έως + και όχι από 0 1, όπως συμβαίνει με το ποσοστό. Ο μετασχηματισμός αυτός επιτυγχάνεται, λαμβάνοντας το λόγο συμπληρωματικών πιθανοτήτων (odds***) του ποσοστού ( P και όχι 1 P ) το ποσοστό αυτό καθεαυτό. Όταν η τιμή του ποσοστού πλησιάζει το 0, τότε η τιμή της ποσότητας σχεδόν ταυτίζεται με την τιμή του ποσοστού, ενώ όταν η τιμή του ποσοστού πλησιάζει το 1, τότε ο παρονομαστής της ποσότητας P 1 P P 1 P πλησιάζει το 0, οπότε η τιμή της ποσότητας προσεγγίζει το +. Ο δεύτερος μετασχηματισμός μετατρέπει το λόγο των συμπληρωματικών πιθανοτήτων του ποσοστού σε ένα μέτρο, η τιμή του οποίου κυμαίνεται από 0 1. Ο μετασχηματισμός αυτός είναι ίδιος με εκείνον ** Όταν η συχνότητα της μελετώμενης πάθησης δεν αφορά σε ενάρξεις του νοσήματος (νέες περιπτώσεις), που αποτελούν σημεία στο χρόνο (συμβάντα), αλλά σε καταστάσεις που έχουν διάρκεια, τότε το μέτρο συχνότητας ονομάζεται επιπολασμός και είναι ποσοστό που προκύπτει από ένα κοινό κλάσμα, το οποίο αριθμητή έχει τις υπάρχουσες (νέες και παλαιές) περιπτώσεις πάθησης και παρονομαστή (τάξη αναφοράς) μια σειρά προσωπο-στιγμών. 8 11,16 Η βάση μελέτης στην περίπτωση αυτή είναι η τομή ενός πληθυσμού και ο υπολογισμός γίνεται σε μια ορισμένη στιγμή του ημερολογιακού χρόνου. Ο επιπολασμός μιας πάθησης αντιστοιχεί στο ποσοστό του πληθυσμού που έχει την πάθηση σε ένα ορισμένο σημείο στο χρόνο. ** Το odds 11,16 μιας πιθανότητας είναι ο λόγος των συμπληρωματικών πιθανοτήτων, οπότε εάν η πιθανότητα εμφάνισης ενός ενδεχομένου συμβολιστεί με p και η πιθανότητα μη εμφάνισης με (1 p), τότε το p odds υπέρ του ενδεχομένου είναι ως προς 1. 1 p που πραγματοποιήθηκε στην περίπτωση των συχνοτήτων, οπότε λαμβάνεται ο λογάριθμος του λόγου των συμπληρωματικών πιθανοτήτων. Το μέτρο που προκύπτει, έπειτα και από τους δύο μετασχηματισμούς, είναι ο In [ P 1 P ] και ονομάζεται λότζιτ (logit). Επομένως, το logit είναι ο λογάριθμος του λόγου των συμπληρωματικών πιθανοτήτων. Ο μετασχηματισμός αυτός που περιλαμβάνει τα δύο παραπάνω βήματα ονομάζεται λογιστικός μετασχηματισμός. Το λογιστικό μοντέλο είναι εκείνο στο οποίο το logit είναι η εξαρτημένη μεταβλητή μιας ισότητας που αντιστοιχεί σε μια ευθεία γραμμή, της ισότητας δηλαδή 1: In ( P = A0 + A1X1 (5) 1 P ) Η ισότητα 5 αντιστοιχεί σ ένα μοντέλο παλινδρόμησης, στο οποίο η εξαρτημένη μεταβλητή είναι ποσοστό. Εφόσον η εξαρτημένη μεταβλητή Υ είναι ποσοστό, η ισότητα 5 μπορεί να λάβει και την παρακάτω μορφή: In ( Y = A0 + A1X1 (6) 1 Y ) Η ισότητα 6 είναι το μοντέλο της απλής λογιστικής παλινδρόμησης, καθώς περιλαμβάνει μόνο μία ανεξάρτητη μεταβλητή (Χ 1). Προφανώς, όπως και σε άλλα γραμμικά μοντέλα, είναι δυνατόν να συμπεριληφθούν περισσότερες από μία ανεξάρτητες μεταβλητές (Χ 1, Χ 2, Χ 3...), οπότε προκύπτει το μοντέλο της πολλαπλής λογιστικής παλινδρόμησης: In ( Y = A0 + A1X1 + A2X2 + A3X (7) 1 Y ) Σύμφωνα με τον ορισμό του logit, η τιμή του Υ κυμαίνεται πάντοτε από 0 1, χωρίς να έχει σημασία η τιμή που λαμβάνει το δεξιό μέλος της ισότητας 6. Το γεγονός αυτό αποτελεί και το κύριο πλεονέκτημα της λογιστικής παλινδρόμησης, καθώς μπορεί να χρησιμοποιηθεί όταν η εξαρτημένη μεταβλητή μετράται ως ποσοστό. Ιδιαίτερα σημαντική είναι η ερμηνεία των συντελεστών της λογιστικής παλινδρόμησης (logistic regression). Όταν η εξαρτημένη μεταβλητή Χ 1 είναι ενδεικτική (Χ 1=1 για τους εκτεθειμένους και Χ 1=0 για τους μη εκτεθειμένους), τότε ο συντελεστής A 1 ισούται με το λόγο των logits των εκτεθειμένων σε σχέση με τους μη εκτεθειμένους: In( P1 1 P 1 ) ( In P0 1 P 0 ) In( P1 = 1 P 1 P 0 )= 1 P 0 P1 (1 P0) = A1 (8) In[ P 0 (1 P 1) ]

9 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 415 Έτσι, στη λογιστική παλινδρόμηση, ο αντιλογάριθμος (e A1 ) του συντελεστή παλινδρόμησης (A 1) μιας ενδεικτικής ανεξάρτητης μεταβλητής (Χ 1) αποτελεί εκτίμηση του λόγου των odds στους εκτεθειμένους σε σχέση με τους μη εκτεθειμένους: P1 (1 P0) e A1 = P 0 (1 P 1) (9) Το μοντέλο της λογιστικής παλινδρόμησης παρέχει εκτιμήσεις του λόγου των odds και γι αυτό χρησιμοποιείται συχνά στις μελέτες «ασθενών-μαρτύρων», καθώς και στις μελέτες όπου χρησιμοποιούνται δεδομένα επιπολασμού για τον υπολογισμό των κατάλληλων επιδημιολογικών μέτρων σχέσης. Ένας περιορισμός της πολλαπλής λογιστικής παλινδρόμησης που δεν πρέπει να αγνοείται είναι η πολλαπλασιαστική σχέση των ανεξάρτητων μεταβλητών μεταξύ τους. 8 Καθώς η συνεισφορά κάθε ανεξάρτητης μεταβλητής στο συνολικό αποτέλεσμα είναι ο λογάριθμος του λόγου των odds, οι διάφορες ανεξάρτητες μεταβλητές στο μοντέλο της πολλαπλής λογιστικής παλινδρόμησης έχουν μια πολλαπλασιαστική σχέση μεταξύ τους αναφορικά με τη συχνότητα εμφάνισης της μελετώμενης έκβασης. Η πολλαπλασιαστική αυτή σχέση ισοδυναμεί με την υπόθεση ότι το υπολογιζόμενο μέτρο σχέσης είναι σταθερό στα επιμέρους στρώματα που δημιουργούνται με βάση τους πιθανούς συγχυτές. Η υπόθεση αυτή, που συνιστά και προϋπόθεση για την εφαρμογή της διαστρωματικής ανάλυσης, δεν αποτελεί ιδιαίτερο πρόβλημα, αλλά πρέπει να σημειωθεί ότι, σε αντίθεση με τη διαστρωμάτωση, το μοντέλο της λογιστικής παλινδρόμησης δεν επιτρέπει άμεση και εύκολη εκτίμηση του αν ισχύει η ομοιομορφία του μέτρου σχέσης στα επιμέρους στρώματα. Είναι δυνατόν, πάντως, να ελεγχθεί η υπόθεση της πολλαπλασιαστικής σχέσης μεταξύ των ανεξάρτητων μεταβλητών, εξετάζοντας το μέγεθος των συντελεστών για τους όρους εκείνους που αντιστοιχούν στο αποτέλεσμα της αλληλεπίδρασης μεταξύ δύο ανεξάρτητων μεταβλητών. Η χρήση του γενικού μοντέλου σχετικού κινδύνου του Thomas παρέχει τη δυνατότητα άμεσου ελέγχου της πολλαπλασιαστικότητας. 24 Ανεξάρτητα, πάντως, από το αν η υπόθεση της πολλαπλασιαστικότητας αντιστοιχεί σε μια κατάλληλη μαθηματική περιγραφή των δεδομένων, η εκτίμηση της βιολογικής σε αντίθεση με τη στατιστική αλληλεπίδρασης ή, καλύτερα, βιολογικής συνεπίδρασης 6,8,10,11 μεταξύ των ενδεικτικών κατηγοριών των προσδιοριστών ή αλλιώς μεταξύ των συνιστωσών αιτιών γίνεται ιδιαίτερα πολύπλοκη εξαιτίας της πολλαπλασιαστικής φύσης του μοντέλου της λογιστικής παλινδρόμησης. 8,25 5. ΕΠΙΛΟΓΗ ΤΟΥ ΚΑΤΑΛΛΗΛΟΥ ΜΟΝΤΕΛΟΥ Από μαθηματικής πλευράς, τα πλεονεκτήματα των παραπάνω μετασχηματισμών του γραμμικού μοντέλου εξισώνονται με τη μαθηματική συμπεριφορά των υπολογιζόμενων μέτρων, εξασφαλίζοντας ότι οι ατομικές εκτιμήσεις που προκύπτουν από τα μαθηματικά μοντέλα κυμαίνονται εντός των επιτρεπόμενων αριθμητικών ορίων. 8 Από πρακτική άποψη, ωστόσο, οι μαθηματικοί μετασχηματισμοί υποδηλώνουν το μέτρο σχέσης που εκτιμάται από τους συντελεστές του χρησιμοποιούμενου μοντέλου. Εάν τα δεδομένα μιας μελέτης αφορούν σε κινδύνους και αντικείμενο είναι η εκτίμηση της διαφοράς των κινδύνων, τότε το μοντέλο της λογιστικής παλινδρόμησης δεν είναι κατάλληλο, καθώς εκτιμά λόγους συμπληρωματικών πιθανοτήτων. Όταν όμως αντικείμενο είναι η εκτίμηση του κινδύνου εμφάνισης μιας πάθησης σ ένα άτομο, τότε το πλέον κατάλληλο μοντέλο είναι εκείνο της λογιστικής παλινδρόμησης. Και αυτό γιατί ο κίνδυνος είναι πιθανότητα, οπότε δεν μπορεί να λάβει αρνητικές τιμές ή τιμές >1, κάτι που επιτυγχάνεται με την εφαρμογή του μοντέλου της λογιστικής παλινδρόμησης. Εάν το αντικείμενο μιας μελέτης, εξάλλου, είναι η εκτίμηση του συνολικού αποτελέσματος ενός προσδιοριστή, με βάση το συντελεστή παλινδρόμησης, τότε το ενδιαφέρον επικεντρώνεται, κυρίως, στο μέτρο σχέσης που εκτιμά το κάθε μοντέλο και λιγότερο στο αν όλες οι ατομικές εκτιμήσεις λαμβάνουν τιμές εντός των επιτρεπόμενων ορίων. Έτσι, σε αρκετές επιδημιολογικές μελέτες, η επιλογή του μοντέλου στηρίζεται ουσιαστικά στο υπολογιζόμενο μέτρο σχέσης. Στον πίνακα 1 8 αναφέρεται η εμφάνιση ή μη μιας πάθησης σε 5 έτη και η ηλικία του ατόμου κατά την έναρξη της πενταετούς παρακολούθησης. Παρακολουθούνται 20 άτομα για 5 έτη και εμφανίζουν ή όχι τη μελετώμενη πάθηση. Τα δεδομένα της μελέτης αυτής απεικονίζονται στο διάγραμμα σημείων δύο κατευθύνσεων (scatter plot) της εικόνας 3. Σε ένα διάγραμμα σημείων δύο κατευθύνσεων, όταν η εξαρτημένη μεταβλητή είναι ενδεικτική, λαμβάνει τιμές είτε 1 (όταν εμφανίζεται η μελετώμενη έκβαση) είτε 0 (όταν δεν εμφανίζεται η μελετώμενη έκβαση), οπότε όλες οι παρατηρήσεις στον κάθετο άξονα πρέπει να «συμπίπτουν» στο 1 ή στο 0, αντίστοιχα. Στην εικόνα 3, εξάλλου, απεικονίζεται η γραμμή παλινδρόμησης και η αντίστοιχη ισότητα για τα δεδομένα του πίνακα 1 όταν εφαρμόζεται το μοντέλο της απλής γραμμικής παλινδρόμησης με εξαρτημένη μεταβλητή τον κίνδυνο εμφάνισης της πάθησης και ανεξάρτητη μεταβλητή την ηλικία. Η σταθερά (A 0 0,45) της γραμμικής παλινδρόμησης είναι η εκτιμώμενη τιμή του κινδύνου για εκείνους που έχουν ηλικία 0 έτη. Η τιμή της

10 416 Π. Γαλάνης Πίνακας 1. Εμφάνιση ή μη μιας πάθησης στη διάρκεια 5 ετών σε 20 άτομα. 2 Άτομο Ηλικία (έτη) Πάθηση 1 18 Όχι 2 21 Όχι 3 22 Όχι 4 25 Όχι 5 26 Όχι 6 28 Όχι 7 33 Όχι 8 34 Όχι 9 35 Όχι Όχι Ναι Ναι Όχι Ναι Όχι Ναι Ναι Ναι Ναι Ναι Οι μη αποδεκτές αυτές τιμές, ωστόσο, του κινδύνου είναι δυνατόν να αποφευχθούν αν αντί του γραμμικού μοντέλου της εικόνας 3 χρησιμοποιηθεί το λογιστικό μοντέλο της εικόνας 4. Το σιγμοειδές σχήμα στην εικόνα 4 είναι χαρακτηριστικό της καμπύλης της λογιστικής παλινδρόμησης. Το σιγμοειδές αυτό σχήμα διατηρεί την τιμή του κινδύνου εντός των επιτρεπόμενων ορίων (0 1) για κάθε ηλικία, αποφεύγοντας έτσι τις μη αποδεκτές τιμές που προέρχονται από το γραμμικό μοντέλο της εικόνας 3. Συγκρίνοντας το γραμμικό μοντέλο με το λογιστικό προκύπτει ότι το λογιστικό είναι καταλληλότερο όταν το υπολογιζόμενο μέτρο συχνότητας είναι ο κίνδυνος. Το παράδειγμα, όμως, του πίνακα 1 υποδηλώνει ότι το λογιστικό μοντέλο δεν είναι πάντοτε το πλέον κατάλληλο. Πιο συγκεκριμένα, ο συντελεστής παλινδρόμησης της ηλικίας, στο γραμμικό μοντέλο της εικόνας 3, ερμηνεύεται ως η διαφορά κινδύνων για κάθε επιπλέον ηλικιακό έτος. Ο συντελεστής παλινδρόμησης της ηλικίας υποδηλώνει ότι ο κίνδυνος αυξάνει κατά 2% για κάθε επιπλέον ηλικιακό έτος. Στην πραγματικότητα, πάντως, δεν αναμένεται η ευθεία γραμμή της εικόνας 3 να προσαρμόζεται με τον καλύτερο δυνατό τρόπο στα δεδομένα της μελέτης, εκτός από την κεντρική περιοχή του γραφήματος. Επιπλέον, για την κεντρική αυτή περιοχή, η ευθεία γραμμή παρέχει έναν απλό και χρήσιμο τρόπο για την εκτίμηση της διαφοράς των κινδύνων για κάθε επιπλέον ηλικιακό έτος. Αντιθέτως, το λογιστικό μοντέλο της εικόνας 4 δεν επιτρέπει την εκτίμηση της διαφοράς των κινδύνων, αλλά την εκτίμηση του λόγου των odds που σχετίζεται με την αύξηση της ηλικίας κατά ένα έτος. Ο λόγος αυτός ισούται με τον αντιλογάριθμο του συντελεστή παλινδρόμησης της ηλικίας στο λογιστικό Κίνδυνος Ηλικία (έτη) Κίνδυνος Εικόνα 3. Διάγραμμα σημείων δύο κατευθύνσεων για τα δεδομένα του πίνακα 1, όπου απεικονίζεται η ευθεία γραμμή της απλής γραμμικής παλινδρόμησης. σταθεράς όμως είναι αρνητική, κάτι που είναι αδύνατο. Ουσιαστικά, με βάση το γραμμικό μοντέλο, η τιμή του κινδύνου είναι αρνητική για τα άτομα ηλικίας <24 ετών και >1 για τα άτομα ηλικίας >74 ετών. Ηλικία (έτη) Εικόνα 4. Διάγραμμα σημείων δύο κατευθύνσεων για τα δεδομένα του πίνακα 1, όπου απεικονίζεται η καμπύλη της απλής λογιστικής παλινδρόμησης.

11 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 417 μοντέλο που είναι e 0,144 =1,15. Έτσι, η επιλογή του μοντέλου εξαρτάται σε σημαντικό βαθμό από το μέτρο σχέσης που επιθυμεί ο ερευνητής να υπολογίσει. Το λογιστικό μοντέλο χρησιμοποιείται όταν το αντικείμενο της μελέτης είναι η εκτίμηση του λόγου των κινδύνων, ενώ το γραμμικό μοντέλο χρησιμοποιείται όταν το αντικείμενο είναι η εκτίμηση της διαφοράς των κινδύνων. Όπως προαναφέρθηκε, η λογιστική παλινδρόμηση είναι ιδιαίτερα χρήσιμη στις μελέτες «ασθενών-μαρτύρων», επειδή ο υπολογιζόμενος λόγος των odds, που είναι ουσιαστικά ο λόγος των οιονεί επιπτώσεων-πυκνοτήτων, μπορεί να χρησιμοποιηθεί για την εκτίμηση του πραγματικού λόγου των επιπτώσεων-πυκνοτήτων. 6. ΕΚΤΙΜΗΣΗ ΤΟΥ ΚΙΝΔΥΝΟΥ Αρκετές είναι οι περιπτώσεις εκείνες, στις οποίες κατασκευάζονται μοντέλα με σκοπό την εκτίμηση του κινδύνου εμφάνισης μιας έκβασης σε κάθε μελετώμενο άτομο ξεχωριστά. Οι Murabito et al 26 κατέληξαν σε ένα μοντέλο πολλαπλής λογιστικής παλινδρόμησης που εκτιμούσε τον κίνδυνο εμφάνισης διαλείπουσας χωλότητας σε χρονικό διάστημα 4 ετών. Το λογιστικό αυτό μοντέλο φαίνεται στον πίνακα 2 και περιγράφεται από την ισότητα 7. Λύνοντας την ισότητα 7 ως προς την εξαρτημένη μεταβλητή προκύπτουν τα εξής: Y= ea1+a1x1+a2x2+a3x e A1+A1X1+A2X2+A3X3+... (10) Πίνακας 2. Μοντέλο πολυμεταβλητής λογιστικής παλινδρόμησης για την εκτίμηση του κινδύνου εμφάνισης διαλείπουσας χωλότητας σε χρονικό διάστημα 4 ετών. 8 Προβλεπτικοί προσδιοριστές Συντελεστής Σταθερά (α) -8,915 Φύλο (γυναίκα=0, άνδρας=1) 0,503 Ηλικία 0,037 Αρτηριακή πίεση Φυσιολογική 0,000 Υψηλή φυσιολογική 0,262 Υπέρταση σταδίου 1 0,407 Υπέρταση σταδίου 2+ 0,798 Διαβήτης 0,950 Τσιγάρα/ημέρα 0,031 Χοληστερόλη (mg/dl) 0,005 Στεφανιαία νόσος (όχι=0, ναι=1) 0,994 Έτσι, χρησιμοποιώντας την ισότητα 10 είναι εύκολο να υπολογιστεί ο κίνδυνος εμφάνισης διαλείπουσας χωλότητας σε ένα συγκεκριμένο άτομο σε χρονικό διάστημα 4 ετών. Εάν π.χ. ένας άνδρας είναι 70 ετών, μη καπνιστής, με φυσιολογική αρτηριακή πίεση, διαβητικός, πάσχει από στεφανιαία νόσο και το επίπεδο χοληστερόλης είναι ίσο με 250 mg/dl, τότε, με βάση την ισότητα 10, ο κίνδυνος να εμφανίσει διαλείπουσα χωλότητα σε διάστημα 4 ετών ισούται με: Y = κίνδυνος= e-8,915+0,503.1=0, , , , , , e -8,915+0,503.1=0, , , , , ,994.1 = = e-2,628 = 0,067-2,628 1+e Άρα, ο κίνδυνος εμφάνισης διαλείπουσας χωλότητας στο χρονικό διάστημα των 4 ετών για το συγκεκριμένο άνδρα είναι 6,7%. Εάν ο άνδρας αυτός είχε υπέρταση σταδίου 2, αντί για φυσιολογική αρτηριακή πίεση, τότε ο κίνδυνος εμφάνισης διαλείπουσας χωλότητας θα ήταν 13,8%. Το μοντέλο της πολλαπλής λογιστικής παλινδρόμησης του πίνακα 2 χρησιμοποιείται για την εκτίμηση του κινδύνου σε κάθε άτομο ξεχωριστά, λαμβάνοντας υπόψη τα ιδιαίτερα χαρακτηριστικά του. Για την εκτίμηση του κινδύνου δεν είναι απαραίτητο όλοι οι προβλεπτικοί προσδιοριστές του πίνακα 2 να σχετίζονται αιτιακά με τη μελετώμενη έκβαση, με την εμφάνιση δηλαδή διαλείπουσας χωλότητας. Στο μοντέλο του πίνακα 2 ορισμένοι από τους προβλεπτικούς προσδιοριστές δεν μπορούν να θεωρηθούν ως αιτίες. Η ηλικία και η στεφανιαία νόσος, για παράδειγμα, θεωρούνται μη αιτιακοί προβλεπτικοί προσδιοριστές της διαλείπουσας χωλότητας, αλλά αποτελούν και οι δύο σημαντικούς προβλεπτικούς προσδιοριστές για την εκτίμηση του κινδύνου εμφάνισης της μελετώμενης πάθησης. Για το λόγο αυτόν περιλαμβάνονται στο προβλεπτικό μοντέλο της πολλαπλής λογιστικής παλινδρόμησης. Άλλοι προβλεπτικοί προσδιοριστές, όπως το κάπνισμα, η αρτηριακή πίεση και ο διαβήτης, μπορεί να αποτελούν αιτίες της διαλείπουσας χωλότητας. 7. ΚΑΤΑΣΚΕΥΗ ΠΟΛΥΜΕΤΑΒΛΗΤΩΝ ΜΟΝΤΕΛΩΝ ΣΤΗΝ ΑΙΤΙΟΛΟΓΙΚΗ ΕΡΕΥΝΑ Στην επιδημιολογία, τα πολυμεταβλητά μοντέλα κατασκευάζονται, συνήθως, για την εκτίμηση των επιδημιολογικών μέτρων σχέσης με ταυτόχρονη εξουδετέρωση των συγχυτών, ενώ χρησιμοποιούνται και για την εκτίμηση της αλληλεπίδρασης, είτε στατιστικής είτε βιολογικής. 8,9 Η εξαρτημένη μεταβλητή είναι, συνήθως, ενδεικτική για παράδειγμα η εμφάνιση ή μη μιας πάθησης οπότε λαμβάνει τιμές 0 1. Με 1 συμβολίζεται, συνήθως, η εμφάνιση της μελετώμενης έκβασης και με 0 η μη εμφάνισή της. Ο μελετώμενος προσδιοριστής και όλοι οι πιθανοί συγχυτές περιλαμβάνονται στο μοντέλο ως ανεξάρτητες, ή προβλεπτι-

12 418 Π. Γαλάνης κές, μεταβλητές. Αν και η κατασκευή ενός πολυμεταβλητού μοντέλου απαιτεί ιδιαίτερη ανάλυση, στη συνέχεια θα γίνει αναφορά στα σημαντικότερα σημεία «Κατασκευή των μεταβλητών» Στην ανάλυση των επιδημιολογικών δεδομένων, μια μεταβλητή δεν είναι απαραίτητο να αντιστοιχεί σε έναν απλό όρο σε ένα πολυμεταβλητό μοντέλο. Για κάθε μεταβλητή απαιτείται ένας τουλάχιστον όρος ή και περισσότεροι. 8 Ο απλούστερος τύπος μεταβλητών είναι οι ενδεικτικές (π.χ. το φύλο) που έχουν μόνο δύο κατηγορίες (άνδρες και γυναίκες). Μια τέτοια μεταβλητή περιλαμβάνεται στο πολυμεταβλητό μοντέλο ως ένας απλός όρος. Οι τιμές 0 και 1 αντιστοιχούν στις δύο κατηγορίες του χαρακτηριστικού και αποτελούν την αριθμητική απεικόνιση της μεταβλητής «φύλο» στο πολυμεταβλητό μοντέλο. Στην περίπτωση των μεταβλητών που έχουν τουλάχιστον τρεις κατηγορίες (όπως για παράδειγμα η ομάδα αίματος ενός ατόμου, που μπορεί να είναι Α, Β, ΑΒ ή Ο) δεν μπορούν να δοθούν αριθμητικές τιμές στις τέσσερις κατηγορίες και να περιληφθεί η μεταβλητή «ομάδα αίματος» ως ένας απλός όρος. Και αυτό επειδή οι τέσσερις κατηγορίες δεν αναπαριστούν ποσοτικές πλευρές ενός απλού μέτρου, οπότε ένας και μόνο όρος δεν επιτρέπει την πλήρη περιγραφή του αποτελέσματος μιας μεταβλητής. Όταν μια μεταβλητή έχει τέσσερις κατηγορίες, όπως η ομάδα αίματος, τότε απαιτούνται τρεις όροι στο πολυμεταβλητό μοντέλο. Μία από τις τέσσερις κατηγορίες, π.χ. η ομάδα αίματος Ο, επιλέγεται ως κατηγορία αναφοράς (reference category). Οι τρεις όροι στο μοντέλο δηλώνουν την παρουσία μίας από τις υπόλοιπες τρεις ομάδες αίματος, Α, Β ή ΑΒ. Οι τρεις όροι που δηλώνουν τη μεταβλητή «ομάδα αίματος» συμβολίζονται με Χ 1, Χ 2 και Χ 3. Το Χ 1 αναπαριστά την ομάδα αίματος Α, το Χ 2 την ομάδα αίματος Β και το Χ 3 την ομάδα αίματος ΑΒ. Εάν ένα άτομο ανήκει στην ομάδα αίματος Ο, δηλαδή στην κατηγορία αναφοράς, τότε οι όροι Χ 1, Χ 2 και Χ 3 λαμβάνουν την τιμή Ο. Εάν ένα άτομο ανήκει στην ομάδα αίματος Α, τότε ο όρος Χ 1 λαμβάνει την τιμή 1 και οι όροι Χ 2 και Χ 3 λαμβάνουν την τιμή Ο κ.λπ. Οι συντελεστές παλινδρόμησης του εφαρμοζόμενου μοντέλου για τους όρους Χ 1, Χ 2 και Χ 3 αντιστοιχούν στα μέτρα σχέσης των ομάδων αίματος Α, Β και ΑΒ ως προς την ομάδα αίματος Ο. Δεν έχει ιδιαίτερη σημασία, συνήθως, ποια κατηγορία επιλέγεται ως κατηγορία αναφοράς. Είναι προτιμότερο, πάντως, να επιλέγεται η κατηγορία εκείνη που έχει τα περισσότερα άτομα, οπότε αυξάνεται η στατιστική σταθερότητα των συντελεστών παλινδρόμησης ενός μοντέλου. Εάν η μεταβλητή έχει μια «φυσική» κατηγορία αναφοράς, τότε πρέπει να επιλέγεται η κατηγορία αυτή ως κατηγορία αναφοράς, ακόμη και αν δεν έχει τα περισσότερα άτομα. Έτσι, σε μια μελέτη εκτίμησης του κινδύνου από τη συμμετοχή σε διάφορες αθλητικές δραστηριότητες, εκείνα τα άτομα που δεν συμμετέχουν στις δραστηριότητες αυτές αποτελούν τη «φυσική» κατηγορία αναφοράς, ανεξάρτητα από τον αριθμό των ατόμων σε κάθε κατηγορία. Γενικά, εάν μια μεταβλητή έχει n κατηγορίες, τότε απαιτούνται n 1 όροι σε ένα μοντέλο για να περιγραφεί το αποτέλεσμα καθεμιάς από τις n 1 κατηγορίες της μεταβλητής σε σχέση με την κατηγορία αναφοράς. Εάν περιλαμβάνονται όροι και για τις n κατηγορίες, τότε το μοντέλο εμφανίζει πλεονασμό και είναι αδύνατη η επίλυση του συστήματος των εξισώσεων που προκύπτει χωρίς την προσθήκη επιπλέον μαθηματικών προϋποθέσεων. Οι κατηγορίες μιας μεταβλητής μπορούν να θεωρηθούν ως μια ομάδα μεταβλητών και το αποτέλεσμα της καθεμιάς εκτιμάται ξεχωριστά σε σχέση με μια αυθαίρετα επιλεγμένη κατηγορία αναφοράς. Οι κατηγορίες πρέπει να είναι αμοιβαία αποκλειόμενες και το σύνολό τους να καλύπτει το δειγματικό χώρο. Ανεξάρτητα από τη φύση του μελετώμενου προσδιοριστή, αρχικά πρέπει να εκτιμηθεί το είδος της καμπύλης που συσχετίζει το μελετώμενο προσδιοριστή με το υπολογιζόμενο μέτρο σχέσης. Για παράδειγμα, στη λογιστική παλινδρόμηση όταν ο μελετώμενος προσδιοριστής είναι μια συνεχής μεταβλητή, τότε πρέπει οπωσδήποτε να σχετίζεται εκθετικά με το λόγο των odds. Ένας απλός τρόπος να επιλυθεί το πρόβλημα που αφορά στις συνεχείς μεταβλητές είναι να πραγματοποιηθεί η κατηγοριοποίησή τους, οπότε στη συνέχεια λαμβάνονται υπόψη ως κατηγορικές μεταβλητές. Στην περίπτωση αυτή, είναι δυνατόν να συμπεριληφθούν περισσότεροι από ένας όροι στο πολυμεταβλητό μοντέλο. Έτσι, αν η συνεχής μεταβλητή είναι η ημερήσια κατανάλωση τσιγάρων, τότε μπορούν να δημιουργηθούν, για παράδειγμα, τέσσερις κατηγορίες: 0 τσιγάρα/ημέρα (μη καπνιστές), 1 20 τσιγάρα/ημέρα, τσιγάρα/ημέρα και >40 τσιγάρα/ημέρα. Με τον τρόπο αυτόν, η συνεχής μεταβλητή «ημερήσια κατανάλωση τσιγάρων» μετατρέπεται σε μια μεταβλητή με τέσσερις κατηγορίες. Είναι προφανές ότι η κατηγοριοποίηση και ο αριθμός των κατηγοριών αποτελούν αυθαίρετες επιλογές του ερευνητή. Θεωρώντας ως κατηγορία αναφοράς τους μη καπνιστές και συμβολίζοντας την κατηγορία αυτή με 0, οι υπόλοιπες κατηγορίες συμβολίζονται με 1, 2 και 3, αντίστοιχα, οπότε στη συνέχεια εφαρμόζεται η μεθοδολογία που προαναφέρθηκε εκτενώς για τις μεταβλητές που έχουν τουλάχιστον τρεις κατηγορίες Εφαρμογή της διαστρωματικής ανάλυσης Πριν από την κατασκευή ενός πολυμεταβλητού μοντέλου

13 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 419 απαιτείται η διαστρωματική ανάλυση των δεδομένων. 1 5,7 9,11 Το σημαντικότερο πλεονέκτημα της πολυμεταβλητής ανάλυσης είναι η ταυτόχρονη εξουδετέρωση της συγχυτικής δράσης πολλών χαρακτηριστικών. Η διαστρωματική ανάλυση, αντίθετα, επιτρέπει την ταυτόχρονη εξουδετέρωση μικρού αριθμού συγχυτών. Ακόμη, πάντως, και όταν οι συγχυτές είναι πολλοί, απαιτείται η εφαρμογή της διαστρωματικής ανάλυσης για δύο, τουλάχιστον, χαρακτηριστικά που θεωρείται ότι προκαλούν το μεγαλύτερο ποσοστό της σύγχυσης Επιλογή των συγχυτών Αρχικά, αναλύεται η σχέση κάθε εξωγενούς προσδιοριστή (ή δυνητικού συγχυτή) ξεχωριστά με τη μελετώμενη έκβαση και με βάση τη στατιστική σημαντικότητα επιλέγεται, τελικά, ένα σύνολο δυνητικών συγχυτών. Έπειτα κατασκευάζεται ένα μοντέλο με τη διαδοχική προσθήκη ενός δυνητικού συγχυτή κάθε φορά. Μετά την προσθήκη ενός δυνητικού συγχυτή εξετάζεται ο βαθμός της μεταβολής του συντελεστή παλινδρόμησης του μελετώμενου προσδιοριστή. Εάν ο συντελεστής παλινδρόμησης του προσδιοριστή μεταβληθεί σημαντικά (οι περισσότεροι θεωρούν σημαντική μια μεταβολή της τάξης του 10%), τότε ο δυνητικός συγχυτής προστίθεται στο μοντέλο ως πραγματικός συγχυτής. Η επιλογή των συγχυτών με τον τρόπο αυτόν προϋποθέτει ότι ο προσδιοριστής εισάγεται στο μοντέλο ως ένας απλός όρος. Εάν, για παράδειγμα, ο προσδιοριστής είναι η ημερήσια κατανάλωση τσιγάρων, τότε πρέπει να εισαχθεί στο μοντέλο ένας απλός όρος, ο οποίος ποσοτικοποιεί την κατανάλωση τσιγάρων, και όχι περισσότεροι του ενός όροι για διάφορα επίπεδα κατανάλωσης τσιγάρων. Στην πολυμεταβλητή ανάλυση είναι ιδιαίτερα συχνή η χρήση των «μοντέλων διαδοχικών σταδίων» (stepwise models). Η διαδοχική δημιουργία ενός πολυμεταβλητού μοντέλου χρησιμοποιεί έναν αλγόριθμο, ο οποίος αυτόματα επιλέγει τους όρους που περιλαμβάνονται στο τελικό μοντέλο. Η επιλογή των όρων με βάση τον αλγόριθμο στηρίζεται, ουσιαστικά, στο επίπεδο της στατιστικής σημαντικότητας του συντελεστή παλινδρόμησης του κάθε όρου ξεχωριστά. Η προσέγγιση των διαδοχικών σταδίων, πάντως, είναι περισσότερο λογικό να χρησιμοποιείται για τη δημιουργία ενός προβλεπτικού μοντέλου παρά ενός αιτιακού. Ο στατιστικός έλεγχος δεν επιτρέπει να εκτιμηθεί ξεχωριστά το μέγεθος μιας σχέσης και η ακρίβεια μιας εκτίμησης, καθώς αναμειγνύει τις δύο αυτές έννοιες. Δεν συνιστάται η χρήση των επιπέδων της στατιστικής σημαντικότητας για την εισαγωγή των συγχυτών σε ένα μοντέλο είτε χρησιμοποιείται ένας λογάριθμος διαδοχικών σταδίων είτε όχι. Και αυτό γιατί ο βαθμός της σύγχυσης εξαρτάται από δύο σχέσεις, τη σχέση μεταξύ του δυνητικού συγχυτή και του μελετώμενου προσδιοριστή και τη σχέση μεταξύ του δυνητικού συγχυτή και της μελετώμενης έκβασης, ενώ ο συντελεστής παλινδρόμησης, ο οποίος ελέγχεται για σημαντικότητα σε ένα μοντέλο διαδοχικών σταδίων, εκτιμά τη σχέση μόνο μεταξύ του δυνητικού συγχυτή και της μελετώμενης έκβασης και αγνοεί τη σχέση μεταξύ του δυνητικού συγχυτή και του μελετώμενου προσδιοριστή. Έτσι, με τον τρόπο αυτόν μπορεί να συμπεριληφθούν στο πολυμεταβλητό μοντέλο συγχυτές που στην πραγματικότητα δεν είναι, ενώ μπορεί να μη συμπεριληφθούν συγχυτές οι οποίοι στην πραγματικότητα είναι, αλλά η σχέση τους με τη μελετώμενη έκβαση δεν είναι στατιστικά σημαντική Εκτίμηση της σχέσης μεταξύ προσδιοριστή και πάθησης Εάν ο μελετώμενος προσδιοριστής είναι ενδεικτική μεταβλητή, τότε, μετά από την προσθήκη των συγχυτών στο πολυμεταβλητό μοντέλο, είναι δυνατή η απευθείας εκτίμηση του αποτελέσματος του προσδιοριστή από το συντελεστή του όρου του προσδιοριστή. Εάν όμως ο προσδιοριστής είναι συνεχής μεταβλητή, όπως π.χ. ο αριθμός των τσιγάρων που καταναλώνονται καθημερινά, τότε ο όρος που αφορά στον προσδιοριστή πρέπει να καθοριστεί εκ νέου, έπειτα από την προσθήκη των συγχυτών στο μοντέλο. Ο λόγος για τον οποίο απαιτείται ο επανακαθορισμός του όρου που αφορά στον προσδιοριστή είναι ότι ο απλός όρος του προσδιοριστή που υπήρχε στο μοντέλο για την εκτίμηση της σύγχυσης δεν αποκαλύπτει την καμπύλη που σχετίζει την πάθηση με τον προσδιοριστή όταν ο μελετώμενος προσδιοριστής είναι συνεχής μεταβλητή. Εάν το εφαρμοζόμενο μοντέλο περιλαμβάνει λογαριθμικό μετασχηματισμό, όπως η πλειονότητα των μοντέλων που χρησιμοποιούνται στην ανάλυση των επιδημιολογικών δεδομένων, τότε ένας απλός όρος για μια συνεχή μεταβλητή (το μελετώμενο προσδιοριστή) μπορεί να περιοριστεί μαθηματικά ώστε να λάβει την καμπύλη που υπαγορεύει το μαθηματικό μοντέλο. Σε ένα μοντέλο λογιστικής παλινδρόμησης, ο συντελεστής του προσδιοριστή είναι ο λογάριθμος του λόγου των odds για κάθε μονάδα μεταβολής στη μεταβλητή που αφορά στον προσδιοριστή. Εάν ο προσδιοριστής είναι ο αριθμός των τσιγάρων που καταναλώνονται καθημερινά, τότε ο συντελεστής ενός απλού όρου που αντιστοιχεί στην ημερήσια κατανάλωση τσιγάρων ισούται με το λογάριθμο του λόγου των odds για κάθε επιπλέον τσιγάρο που καταναλώνεται. Επειδή υπάρχει μόνο ένας απλός όρος, το μοντέλο υπαγορεύει ότι το αποτέλεσμα του κάθε τσιγάρου πολλαπλασιάζει το λόγο των odds με μια σταθερή ποσότητα. Το αποτέλεσμα

14 420 Π. Γαλάνης είναι μια εκθετική καμπύλη μεταξύ της πάθησης και του μελετώμενου προσδιοριστή που εκφράζεται μέσω του λόγου των odds (εικ. 5). Η εκθετική αυτή καμπύλη προσαρμόζει τα δεδομένα της μελέτης, ανεξάρτητα από την πραγματική καμπύλη που σχετίζει την πάθηση με τον προσδιοριστή, εφόσον η μεταβλητή που αφορά στον προσδιοριστή είναι συνεχής και περιορίζεται σε έναν απλό όρο σε ένα μοντέλο που χρησιμοποιεί λογαριθμικό μετασχηματισμό. Στα γραμμικά μοντέλα, μια γραμμική σχέση και όχι μια εκθετική μπορεί να αποτελέσει την καλύτερη λύση. Το πρόβλημα υπάρχει στις περιπτώσεις εκείνες, στις οποίες η πραγματική σχέση που ορίζεται από τη φύση δεν αντιστοιχεί στη σχέση που ορίζεται από την καμπύλη του εφαρμοζόμενου μοντέλου. Είναι ανάγκη η καμπύλη που σχετίζει την πάθηση με τον προσδιοριστή να μην υπαγορεύεται από το μαθηματικό μοντέλο, αλλά από τα υπάρχοντα δεδομένα. Για να επιτευχθεί αυτό, απαιτείται ο ερευνητής να καθορίσει εκ νέου τον όρο του προσδιοριστή στο μοντέλο. Η συνηθέστερη μέθοδος είναι να κατηγοριοποιηθεί ο προσδιοριστής και να αποδοθούν ξεχωριστοί όροι σε κάθε κατηγορία του προσδιοριστή, εκτός από μια αυθαίρετα επιλεγμένη κατηγορία που αποτελεί την κατηγορία αναφοράς. Για παράδειγμα, η κατανάλωση τσιγάρων μπορεί να κατηγοριοποιηθεί στις εξής κατηγορίες: 0 τσιγάρα/ημέρα (μη καπνιστές), 1 9 τσιγάρα/ημέρα, τσιγάρα/ημέρα κ.λπ. Στο μοντέλο θα υπάρχει ένας ξεχωριστός όρος για κάθε κατηγορία, εκτός από την κατηγορία των μη καπνιστών (0 τσιγάρα/ ημέρα), που αποτελεί την κατηγορία αναφοράς. Η μεταβλητή που αντιστοιχεί σε κάθε όρο είναι πλέον ενδεικτική, φανερώνοντας απλά την κατηγορία στην οποία ανήκει ένα άτομο. Έτσι, ένα άτομο θα έχει την τιμή 1 για την κατηγορία στην οποία ανήκει και την τιμή 0 για όλες τις υπόλοιπες κατηγορίες, ενώ ένας μη καπνιστής θα έχει την τιμή 0 για όλες τις κατηγορίες. Οι συντελεστές παλινδρόμησης που προκύπτουν, αποδίδουν το ξεχωριστό αποτέλεσμα για κάθε επίπεδο του καπνίσματος που καθορίζεται από τα δεδομένα και όχι από τις μαθηματικές ιδιότητες του εφαρμοζόμενου μοντέλου Εκτίμηση της συνεπίδρασης Για την κατάλληλη εκτίμηση της αλληλεπίδρασης ή, καλύτερα, της συνεπίδρασης μεταξύ των ενδεικτικών κατηγοριών δύο προσδιοριστών απαιτείται να καθοριστούν εκ νέου οι δύο προσδιοριστές και να δημιουργηθεί μια νέα σύνθετη μεταβλητή που να αφορά σε ένα νέο προσδιοριστή. Για δύο ενδεικτικούς προσδιοριστές Α και Β, η νέα σύνθετη μεταβλητή θα πρέπει να έχει τέσσερις κατηγορίες: (α) μη έκθεση στους Α και Β, (β) έκθεση στον Α και όχι στο Β, (γ) έκθεση στο Β και όχι στον Α, (δ) ταυτόχρονη έκθεση και στον Α και στο Β. Κάθε άτομο θα ανήκει σε μία από τις κατηγορίες που προκύπτουν από την κοινή έκθεση και στους δύο προσδιοριστές Α και Β. Χρησιμοποιώντας ως κατηγορία αναφοράς τη μη έκθεση στους Α και Β, το μαθηματικό μοντέλο παρέχει εκτιμήσεις του σχετικού αποτελέσματος για καθεμιά από τις άλλες τρεις κατηγορίες. Η μέθοδος αυτή επιτρέπει τη χρήση του πολυμεταβλητού μοντέλου για την εκτίμηση των αποκλίσεων από το προσθετικό μοντέλο (additive model) χωρίς να επιβάλλει την πολλαπλασιαστική σχέση που υπαγορεύεται από το χρησιμοποιούμενο μοντέλο ΣΥΝΟΨΗ Λόγος των odds Προσδιοριστής Εικόνα 5. Διάγραμμα λογιστικής παλινδρόμησης που απεικονίζει τη θετική σχέση μεταξύ πάθησης και προσδιοριστή, εφόσον ο προσδιοριστής είναι συνεχής μεταβλητή. Το κυριότερο πλεονέκτημα των πολυμεταβλητών μαθηματικών μοντέλων στην ανάλυση των επιδημιολογικών δεδομένων είναι η ευκολία με την οποία εξουδετερώνουν πολλούς συγχυτές ταυτόχρονα. Η ένταξη πολλών μεταβλητών σε ένα πολυμεταβλητό μοντέλο επιτρέπει το αποτέλεσμα της κάθε μεταβλητής να μη συγχέεται από τη δράση των υπόλοιπων μεταβλητών. Με τον τρόπο αυτόν επιτυγχάνεται η εξουδετέρωση της σύγχυσης που προκαλείται από πολλά χαρακτηριστικά ταυτόχρονα, κάτι ανέφικτο με τη μέθοδο της διαστρωματικής ανάλυσης. Εάν υπάρχουν, για παράδειγμα, 5 συγχυτές και καθένας έχει 3 κατηγορίες, τότε με την εφαρμογή της διαστρωμάτωσης προκύπτουν =243 στρώματα. Όταν ο αριθμός των στρωμάτων είναι τόσο μεγάλος, τότε ο αριθμός των δεδομένων σε ορισμένα στρώματα ενδεχομένως να είναι πολύ μικρός, οπότε η χρήση της διαστρωματικής ανάλυσης

15 ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΑΝΑΛΥΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 421 οδηγεί σε μη έγκυρα συμπεράσματα. Στην περίπτωση αυτή είναι προτιμότερη η χρήση της πολυμεταβλητής ανάλυσης. Η διαστρωματική ανάλυση, πάντως, χρησιμοποιείται για έναν ή δύο, τουλάχιστον, συγχυτές που θεωρούνται οι σημαντικότεροι. Πρέπει να σημειωθεί, εξάλλου, ότι η πολυμεταβλητή ανάλυση είναι περισσότερο ευαίσθητη στο σφάλμα σε σχέση με τη διαστρωματική. Η διαστρωματική ανάλυση παρουσιάζει ορισμένα πλεονεκτήματα έναντι της πολυμεταβλητής. Πιο συγκεκριμένα, με τη διαστρωματική ανάλυση, τόσο ο ερευνητής όσο και οι αναγνώστες αντιλαμβάνονται εύκολα και άμεσα την κατανομή των δεδομένων με βάση τις σημαντικότερες, τουλάχιστον, μεταβλητές, εφόσον βεβαίως τα στρωματοποιημένα δεδομένα παρουσιάζονται γραπτώς. Στην πολυμεταβλητή ανάλυση δεν συμβαίνει κάτι αντίστοιχο, με αποτέλεσμα οι αναγνώστες και σε αρκετές περιπτώσεις και οι ίδιοι οι ερευνητές να έχουν περιορισμένες γνώσεις όσον αφορά στην κατανομή των δεδομένων. Για το λόγο αυτόν η πολυμεταβλητή ανάλυση συνιστάται ως συμπλήρωμα της διαστρωματικής, η οποία πρέπει να είναι το πρωταρχικό εργαλείο στην ανάλυση των επιδημιολογικών δεδομένων. Ακόμη και όταν οι πιθανοί συγχυτές μιας μελέτης είναι αρκετοί, απαιτείται η εφαρμογή της διαστρωματικής ανάλυσης για τους δύο, τουλάχιστον, σημαντικότερους συγχυτές, οι οποίοι συνήθως είναι το φύλο και η ηλικία. Δυστυχώς, όμως, αρκετοί ερευνητές εστιάζονται μόνο στην εφαρμογή της πολυμεταβλητής ανάλυσης, αδιαφορώντας έτσι για τη χρησιμότητα της διαστρωματικής. Στις περισσότερες περιπτώσεις, μάλιστα, οι αναγνώστες έχουν στη διάθεσή τους μόνο τους συντελεστές παλινδρόμησης του πολυμεταβλητού μοντέλου, γεγονός που δεν επιτρέπει την εξαγωγή ασφαλών συμπερασμάτων. Συμπερασματικά, η πολυμεταβλητή ανάλυση είναι εξαιρετικά χρήσιμη μόνον όταν χρησιμοποιείται ως συμπλήρωμα της διαστρωματικής και όχι ως πρωταρχικό εργαλείο για την ανάλυση επιδημιολογικών δεδομένων. ABSTRACT Multivariate analysis of epidemiological data P. Galanis Center for Health Services Management and Evaluation, Department of Nursing, University of Athens, Athens, Greece Archives of Hellenic Medicine 2009, 26(3): In epidemiology, mathematical models are used for various purposes. The two primary purposes are prediction and control for confounding. Prediction models are used to estimate risk based on information from risk predictors. In contrast to the goal of risk prediction for specific individuals, much epidemiologic research is aimed at learning about the causal role of specific characteristics (or determinants) for disease. In causal research, multivariate mathematical models are used to evaluate the causal role of one or more characteristics while simultaneously controlling for possible confounding effects of other characteristics. In a multivariate model, the inclusion of several variates results in each item being unconfounded by the other items. This is an easy and efficient approach to controlling confounding by several variates at once, something that might be difficult to achieve through a stratified analysis. However, with stratified analysis, both the investigator and the readers (when the stratified data are presented in a paper) are aware of the distribution of the data according to the key study variates. For this reason, a multivariate analysis should be used as a supplement to a stratified analysis, rather than as the primary analytical tool. In epidemiology, the most frequently used models are the general linear model and the logistic regression model. The outcome (or dependent variate) in the general linear model is continuous, while in logistic regression it is the indicator variate. Key words: Logistic regression, Multivariate analysis, Regression, Stratified analysis Βιβλιογραφία 1. ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Διαστρωματική ανάλυση δεδομένων. Αρχ Ελλ Ιατρ 2005, 21: ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Τροποποίηση του μέτρου αποτελέσματος και σύγχυση στην εφαρμοσμένη ιατρική έρευνα. Αρχ Ελλ Ιατρ 2005, 22: ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Στατιστική αλληλεπίδραση και τροποποίηση του μέτρου αποτελέσματος. Αρχ Ελλ Ιατρ 2005, 21:

16 422 Π. Γαλάνης 4. AΗLBOM A, NORELL S. Εισαγωγή στη σύγχρονη επιδημιολογία. Ιατρικές Εκδόσεις Λίτσας, Αθήνα, ΣΠΑΡΟΣ Λ, ΓΑΛΑΝΗΣ Π, ΖΑΧΟΣ Ι, ΤΣΙΛΙΔΗΣ Κ. Επιδημιολογία Ι. Εκδόσεις ΒΗΤΑ, Αθήνα, ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Βιολογική και στατιστική αλληλεπίδραση. Αρχ Ελλ Ιατρ 2004, 21: ΓΑΛΑΝΗΣ Π. Αλληλεπίδραση παραγόντων κινδύνου στην επιδημιολογία. Μεταπτυχιακή διπλωματική εργασία, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών, Τμήμα Νοσηλευτικής, Αθήνα, ROTHMAN KJ. Modern epidemiology. 1st ed. Little, Brown & Co, Boston, Rothman KJ. Epidemiology: An introduction. Oxford University Press, New York, ROTHMAN KJ, GREENLAND S. Modern epidemiology. 2nd ed. Lippincott Williams & Wilkins, Philadelphia, ΣΠΑΡΟΣ Λ, ΓΑΛΑΝΗΣ Π. Δοκίμια επιδημιολογίας. Εκδόσεις Παρισιάνου, Αθήνα, ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Διαστρωμάτωση επιδημιολογικών δεδομένων. Αρχ Ελλ Ιατρ 2006, 23: STRIKE PW. Statistical methods in laboratory medicine. Butterworth Heinemann, Cambridge, BLAND M. An introduction to medical statistics. 2nd ed. Oxford Medical Publications, Oxford, ROTHMAN KJ, CANN CI, FLANDERS D, FRIED MP. Epidemiology of laryngeal cancer. Epidemiol Rev 1980, 2: ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Μέτρα συχνότητας των νοσημάτων. Αρχ Ελλ Ιατρ 2005, 22: ΣΠΑΡΟΣ Λ. Μετα-επιδημιολογία. Εκδόσεις ΒΗΤΑ, Αθήνα, Miettinen OS. Theoretical epidemiology. Principles of occurrence research in medicine. John Wiley & Sons, New York, GALTON F. Natural inheritance. McMillan, London, ΤΡΙΧΟΠΟΥΛΟΣ Δ. Γενική και κλινική επιδημιολογία. Εγχειρίδιο επιδημιολογίας και αρχών κλινικής έρευνας. Εκδόσεις Παρισιάνου, Αθήνα, ΔΡΑΚΑΤΟΣ ΚΓ. Στατιστική. 2η έκδοση. Εκδόσεις Παπαζήση, Αθήνα, ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Συστηματικά σφάλματα στις επιδημιολογικές μελέτες. Αρχ Ελλ Ιατρ 2007, 24: ΓΑΛΑΝΗΣ Π, ΣΠΑΡΟΣ Λ. Στατιστικά μοντέλα για την ανάλυση των επιδημιολογικών δεδομένων. Αρχ Ελλ Ιατρ 2006, 23: THOMAS DC. General relative risk models for survival time and matched case-control analysis. Biometrics 1981, 37: GREENLAND S. Limitations of the logistic analysis of epidemiologic data. Am J Epidemiol 1979, 110: MURABITO JM, D AGOSTINO RB, SIBERSHATZ H, WILSON WF. Intermittent claudication. A risk profile from the Framingham Heart Study. Circulation 1997, 96: ASSMAN SF, HOSMER DW, LEMESHOW S, MUNDT KA. Confidence intervals for measures of interaction. Epidemiology 1996, 7: Corresponding author: P. Galanis, 14 Dikis street, GR Athens, Greece xxxxxxxxxxxxx

Αντικείμενο των επιδημιολογικών μελετών

Αντικείμενο των επιδημιολογικών μελετών Αντικείμενο των επιδημιολογικών μελετών Ο μεγάλος δρόμος για την εύρεση αιτιακών σχέσεων είναι γεμάτος σφάλματα Αιτιακή σχέση Τυχαίο σφάλμα Συγχυτές Συστηματικό σφάλμα επιλογής Συστηματικό σφάλμα Συστηματικό

Διαβάστε περισσότερα

Προσδιοριστής (determinant) Συνώνυμα

Προσδιοριστής (determinant) Συνώνυμα Προσδιοριστής Το χαρακτηριστικό (συγγενές, περιβαλλοντικό ή συμπεριφοράς) των ατόμων από το οποίο εξαρτάται η συχνότητα εμφάνισης της μελετώμενης έκβασης Προσδιοριστής (determinant) Συνώνυμα Έκθεση Μελετώμενος

Διαβάστε περισσότερα

Λειτουργικός ορισμός των μεταβλητών

Λειτουργικός ορισμός των μεταβλητών Λειτουργικός ορισμός των μεταβλητών Σύμφωνα με μελέτη του 2000 στις ΗΠΑ, 4.000.000 έφηβοι ήταν καπνιστές Τι σημαίνει «έφηβος»;;; Τι σημαίνει «καπνιστής»;;; Λειτουργικός ορισμός των μεταβλητών Στη συγκεκριμένη

Διαβάστε περισσότερα

τα πάντα είναι σχετικά

τα πάντα είναι σχετικά τα πάντα είναι σχετικά Συνολικά λίτρα κατανάλωσης μπύρας, το 2010 (απόλυτες συχνότητες) Σειρά κατάταξης Χώρα Λίτρα κατανάλωσης μπύρας (x 10 6 ) 1 Κίνα 44.683 2 ΗΠΑ 24.138 5 Γερμανία 8.787 16 Τσεχία 1.708

Διαβάστε περισσότερα

Αντικείμενο των επιδημιολογικών μελετών

Αντικείμενο των επιδημιολογικών μελετών Αντικείμενο των επιδημιολογικών μελετών Αντικείμενο των αιτιογνωστικών μελετών Είναι το τελικό αποτέλεσμα μιας αιτιογνωστικής μελέτης και πιο συγκεκριμένα το είδος και η ποσότητα της εμπειρικής πληροφορίας

Διαβάστε περισσότερα

Μελέτες ασθενών-μαρτύρων

Μελέτες ασθενών-μαρτύρων Μελέτες ασθενών-μαρτύρων Η πρώτη ΜΑΜ δημοσιεύθηκε το 1920 και αφορούσε τη σχέση καπνιστικής συνήθειας και επιθηλιώματος των χειλιών (μορφή καρκίνου του δέρματος) Το 1950, δημοσιεύθηκαν οι πρώτες 4 μελέτες

Διαβάστε περισσότερα

Κλινική Επιδηµιολογία

Κλινική Επιδηµιολογία Κλινική Επιδηµιολογία Ρυθµιστικοί παράγοντες Συγχυτικοί παράγοντες Ενδιάµεσοι παράγοντες Πρέπει να πιστέψουµε τις µετρήσεις µας; Κάπνισµα Καρκίνος Πνεύµονα OR = 9.1 Πραγµατική σχέση αιτιολογική µη-αιτιολογική

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

(Confounders) Δύο κύρια θέματα. Θα πρέπει να πιστέψω το αποτέλεσμα της μελέτης μου; Συγχυτικοί και τροποποιητικοί παράγοντες

(Confounders) Δύο κύρια θέματα. Θα πρέπει να πιστέψω το αποτέλεσμα της μελέτης μου; Συγχυτικοί και τροποποιητικοί παράγοντες Θα πρέπει να πιστέψω το αποτέλεσμα της μελέτης μου; Συγχυτικοί και τροποποιητικοί παράγοντες Κάπνισμα = 11,6 Καρκίνος παγκρέατος Πρόγραμμα εκπαίδευσης στην επιδημιολογική επιτήρηση και διερεύνηση επιδημιών

Διαβάστε περισσότερα

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Σχέση μεταξύ εμβολίων και αυτισμού Θέση ύπνου των βρεφών και συχνότητα εμφάνισης του

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε;

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε; Ερώτηση Σε μια συγχρονική μελέτη μετρήθηκε ο δείκτης μάζας σώματος 5000 αγοριών και 5500 κοριτσιών ηλικίας 14-17 ετών. Το 15% των αγοριών και το 8% των κοριτσιών ήταν υπέρβαρα. Ποιο μέτρο συχνότητας υπολογίστηκε;

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας. ΚΕΦΑΛΑΙΟ 1 Εισαγωγή Η Μεθοδολογία της Έρευνας (research methodology) είναι η επιστήμη που αφορά τη μεθοδολογία πραγματοποίησης μελετών με συστηματικό, επιστημονικό και λογικό τρόπο, με σκοπό την παραγωγή

Διαβάστε περισσότερα

Αντικείμενο των επιδημιολογικών μελετών

Αντικείμενο των επιδημιολογικών μελετών Αντικείμενο των επιδημιολογικών μελετών Εάν το αντικείμενο μιας μελέτης είναι ο υπολογισμός του λόγου των επιπτώσεων-πυκνοτήτων του καρκίνου του πνεύμονα στους καπνιστές σε σχέση με τους μη καπνιστές,

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

Μελέτες κοόρτης ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH. ... Π. Γαλάνης

Μελέτες κοόρτης ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH. ... Π. Γαλάνης ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2011, 28(1):111-126 Μελέτες κοόρτης 1. Εισαγωγή 2. Σχεδιασμός 3. Προοπτικές μελέτες κοόρτης 4. Αναδρομικές μελέτες κοόρτης

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100 Ποσοτικές Μέθοδοι Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR 50100 Απλή Παλινδρόμηση Η διερεύνηση του τρόπου συμπεριφοράς

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε;

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε; Σε μια συγχρονική μελέτη μετρήθηκε ο δείκτης μάζας σώματος 5000 αγοριών και 5500 κοριτσιών ηλικίας 14-17 ετών. Το 15% των αγοριών και το 8% των κοριτσιών ήταν υπέρβαρα. Ποιο μέτρο συχνότητας υπολογίστηκε;

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

Μέτρα συχνότητας στις επιδημιολογικές μελέτες

Μέτρα συχνότητας στις επιδημιολογικές μελέτες APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2014, 31(6):735-747 Μέτρα συχνότητας στις επιδημιολογικές μελέτες 1. Εισαγωγή 2. Προσδιοριστής 3. Δημογραφικοί πληθυσμοί 4. Μέτρα συχνότητας 4.1. Εμπειρικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Συστηματική ανασκόπηση και μετα-ανάλυση

Συστηματική ανασκόπηση και μετα-ανάλυση ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(6):826-841 Συστηματική ανασκόπηση και μετα-ανάλυση 1. Εισαγωγή 2. Συστηματική ανασκόπηση 2.1. Διατύπωση επιστημονικής

Διαβάστε περισσότερα

Λύση. Επίπτωση-πυκνότητα κ+ =ID κ+ 0,05 (έτη) -1. Επίπτωση-πυκνότητα κ- =ID κ- 0,01 (έτη) -1. ID κ+ - ID κ- 0,05-0,01=0,04 (έτη) -1

Λύση. Επίπτωση-πυκνότητα κ+ =ID κ+ 0,05 (έτη) -1. Επίπτωση-πυκνότητα κ- =ID κ- 0,01 (έτη) -1. ID κ+ - ID κ- 0,05-0,01=0,04 (έτη) -1 Άσκηση Σ έναν μελετώμενο πληθυσμό καπνιστών και μη καπνιστών διερευνήθηκε η σχέση μεταξύ καπνιστικής συνήθειας και συχνότητας εμφάνισης καρκίνου του πνεύμονα. Η επίπτωση-πυκνότητα μεταξύ των καπνιστών

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΙΑTΡΙΚΗ ΣΧΟΛΗ Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ Έλενα Κριτσέλη, MPH PhD Επιστημονικός Συνεργάτης Επιδημιολόγος Χρόνιων Παθήσεων, Α Πανεπιστημιακή Παιδιατρική

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ποιοι από τους παρακάτω πληθυσμούς είναι κλειστοί ή ανοιχτοί και γιατί;

Ποιοι από τους παρακάτω πληθυσμούς είναι κλειστοί ή ανοιχτοί και γιατί; Άσκηση Ποιοι από τους παρακάτω πληθυσμούς είναι κλειστοί ή ανοιχτοί και γιατί; 1. Οι κάτοικοι της Ελλάδας, το 2010 2. Οι ασθενείς με σακχαρώδη διαβήτη τύπου 2 3. Οι νοσηλευθέντες σε ένα νοσοκομείο το 2012

Διαβάστε περισσότερα

Άσκηση. Καπνιστές Ναι Όχι Σύνολο Ανθρωπο-έτη παρακολούθησης Περιπτώσεις εμφράγματος

Άσκηση. Καπνιστές Ναι Όχι Σύνολο Ανθρωπο-έτη παρακολούθησης Περιπτώσεις εμφράγματος Σ έναν μελετώμενο πληθυσμό καπνιστών και μη καπνιστών διερευνήθηκε η σχέση μεταξύ καπνιστικής συνήθειας και συχνότητας εμφάνισης καρκίνου του πνεύμονα. Η επίπτωση-πυκνότητα μεταξύ των καπνιστών ήταν 0,05

Διαβάστε περισσότερα

Μελέτες «ασθενών-μαρτύρων»

Μελέτες «ασθενών-μαρτύρων» APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2012, 29(2):240-257 Μελέτες «ασθενών-μαρτύρων» 1. Εισαγωγή 2. Πληθυσμός-πηγή και μελετώμενος πληθυσμός 2.1. Πρωτογενής και δευτερογενής ορισμός του πληθυσμού-πηγή

Διαβάστε περισσότερα

Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων

Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων Copyright Athens Medical Society www.mednet.gr/archives ARCHIVES OF HELLENIC MEDICINE: ISSN 11-05-3992 APPLIED MEDICAL RESEARCH Μονομεταβλητή ανάλυση επιδημιολογικών δεδομένων 1. Εισαγωγή 2. Μεταβλητές

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Τροποποιητές - Διαστρωμάτωση

Τροποποιητές - Διαστρωμάτωση DEPARTMENT OF HYGIENE AND EPIDEMIOLOGY Τροποποιητές - Διαστρωμάτωση Κώστας Τσιλίδης, tsilidi@cc.uoi.gr http://users.uoi.gr/tsilidi/teaching Ιωαννίδης: κεφάλαιο 7: 118-120, κεφάλαιο 9: 139-143 Ahlbom: κεφάλαιο

Διαβάστε περισσότερα

Στατιστικές μέθοδοι ανάλυσης δεδομένων

Στατιστικές μέθοδοι ανάλυσης δεδομένων ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(5):699-711 Στατιστικές μέθοδοι ανάλυσης δεδομένων 1. Εισαγωγή 2. Επίπεδο στατιστικής σημαντικότητας 3. Είδη δεδομένων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα

Διαβάστε περισσότερα

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Κλινική Επιδηµιολογία. Μέτρα κινδύνου Αιτιολογική συσχέτιση

Κλινική Επιδηµιολογία. Μέτρα κινδύνου Αιτιολογική συσχέτιση Κλινική Επιδηµιολογία Μέτρα κινδύνου Αιτιολογική συσχέτιση Μέτρα κινδύνου Αιτιολογική συσχέτιση Σύγκριση µεταξύ διαφορετικών πληθυσµών ως προς την έκθεση (exposure) Σύγκριση της κατανοµής της συχνότητας

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Μέτρα σχέσης. Ιωάννα Τζουλάκη Λέκτορας Επιδημιολογίας Υγιεινή και Επιδημιολογία

Μέτρα σχέσης. Ιωάννα Τζουλάκη Λέκτορας Επιδημιολογίας Υγιεινή και Επιδημιολογία Μέτρα σχέσης Ιωάννα Τζουλάκη Λέκτορας Επιδημιολογίας Υγιεινή και Επιδημιολογία Στο τέλος...(learning outcomes) Να γνωρίζετε τα κυριότερα μέτρα σχέσης που χρησιμοποιούνται για μετρήσουμε μια συσχέτηση μεταξύ

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Μη γραµµικά υποδείγµατα παλινδρόµησης Έστω µία συνάρτηση f = f(x 1,..., X K ) των µεταβλητών X 1,...,

Διαβάστε περισσότερα

Τεκµηριωµένη Ιατρική 2011-12 ΒΛΑΒΗ. Βασίλης Κ. Λιακόπουλος Λέκτορας Νεφρολογίας ΑΠΘ

Τεκµηριωµένη Ιατρική 2011-12 ΒΛΑΒΗ. Βασίλης Κ. Λιακόπουλος Λέκτορας Νεφρολογίας ΑΠΘ Τεκµηριωµένη Ιατρική 2011-12 ΒΛΑΒΗ Βασίλης Κ. Λιακόπουλος Λέκτορας Νεφρολογίας ΑΠΘ Αναλογία Λόγος Πηλίκο Αναλογία Proportion Αναλογία (Proportion) Ο αριθµητής ΣΥΜΠΕΡΙΛΑΜΒΑΝΕΤΑΙ ΑΠΑΡΑΙΤΗΤΩΣ στον παρανοµαστή

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 8 : Παραγοντική Ανάλυση Αντιστοιχιών. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης

Διαβάστε περισσότερα

Γιατί διεξάγεται μια μελέτη;;;

Γιατί διεξάγεται μια μελέτη;;; Γιατί διεξάγεται μια μελέτη;;; Διερεύνηση ενός νέου ερευνητικού ερωτήματος ή, αλλιώς, μιας νέας ερευνητικής υπόθεσης Διερεύνηση μιας υπάρχουσας ερευνητικής υπόθεσης, βελτιώνοντας όμως την ακρίβεια και

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων

Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων xxxxxxxx ΝΟΣΗΛΕΥΤΙΚΗ 2010, 49(1): 11 25 NOSILEFTIKI 2010, 49(1): 11 25 Γ Ε Ν Ι ΚΟ ΑΡΘΡΟ GENERAL ARTICLE Αποχαιρετώντας τις Τιμές p και Καλωσορίζοντας τα Διαστήματα Εμπιστοσύνης στην Ανάλυση Δεδομένων Πέτρος

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή 1. Γενικά... 25 2. Έννοια και Είδη Μεταβλητών... 26 3. Κλίμακες Μέτρησης Μεταβλητών... 29 3.1 Ονομαστική κλίμακα... 30 3.2. Τακτική κλίμακα... 31 3.3 Κλίμακα ισοδιαστημάτων... 34 3.4

Διαβάστε περισσότερα

Εναλλακτικά του πειράματος

Εναλλακτικά του πειράματος Θετική και δεοντολογική προσέγγιση Διάλεξη 2 Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; Η θετική ανάλυση εξετάζει τι υπάρχει και ποιες οι συνέπειες μιας πολιτικής, χωρίς

Διαβάστε περισσότερα

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου ΠΡΟΛΟΓΟΣ Η γραμμική παλινδρόμηση χρησιμοποιείται για την μελέτη των σχέσεων μεταξύ μετρήσιμων μεταβλητών. Γενικότερα, η γραμμική στατιστική συμπερασματολογία αποτελεί ένα ευρύ πεδίο της στατιστικής ανάλυσης

Διαβάστε περισσότερα

Σχεδιασμός και Διεξαγωγή Πειραμάτων

Σχεδιασμός και Διεξαγωγή Πειραμάτων Σχεδιασμός και Διεξαγωγή Πειραμάτων Πρώτο στάδιο: λειτουργικοί ορισμοί της ανεξάρτητης και της εξαρτημένης μεταβλητής Επιλογή της ανεξάρτητης μεταβλητής Επιλέγουμε μια ανεξάρτητη μεταβλητή (ΑΜ), την οποία

Διαβάστε περισσότερα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής στην Προσχολική Ηλικία Περιεχόμενα ενότητας Παρουσιάζονται οι βασικές

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ ΕΡΓΑΣΤΗΡΙΟ PASW 18 Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 2011 2012 ΕΠΙΧ

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Ποιοι από τους παρακάτω πληθυσμούς είναι κλειστοί ή ανοιχτοί και γιατί;

Ποιοι από τους παρακάτω πληθυσμούς είναι κλειστοί ή ανοιχτοί και γιατί; Ποιοι από τους παρακάτω πληθυσμούς είναι κλειστοί ή ανοιχτοί και γιατί; 1. Οι κάτοικοι της Ελλάδας, το 2010 2. Οι ασθενείς με σακχαρώδη διαβήτη τύπου 2 3. Οι νοσηλευθέντες σε ένα νοσοκομείο το 2012 4.

Διαβάστε περισσότερα

Αναγκαίος αριθμός πασχόντων στις τυχαιοποιημένες κλινικές δοκιμές

Αναγκαίος αριθμός πασχόντων στις τυχαιοποιημένες κλινικές δοκιμές ΕΦΑΡΜΟΣΜΕΝΗ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ APPLIED MEDICAL RESEARCH ÁÑ ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 2009, 26(4):544-557 Αναγκαίος αριθμός πασχόντων στις τυχαιοποιημένες κλινικές δοκιμές 1. Εισαγωγή 2. Τυχαιοποιημένες κλινικές

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΑΓΓΕΙΟΧΕΙΡΟΥΡΓΙΚΗ ΚΛΙΝΙΚΗ Δ/ΝΤΗΣ: ΚΑΘΗΓΗΤΗΣ Α.Ν. ΚΑΤΣΑΜΟΥΡΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΑΓΓΕΙΟΧΕΙΡΟΥΡΓΙΚΗ ΚΛΙΝΙΚΗ Δ/ΝΤΗΣ: ΚΑΘΗΓΗΤΗΣ Α.Ν. ΚΑΤΣΑΜΟΥΡΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΑΓΓΕΙΟΧΕΙΡΟΥΡΓΙΚΗ ΚΛΙΝΙΚΗ Δ/ΝΤΗΣ: ΚΑΘΗΓΗΤΗΣ Α.Ν. ΚΑΤΣΑΜΟΥΡΗΣ ΚΛΙΝΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΙΚΗ ΜΕΛΕΤΗ ΤΗΣ ΕΞΕΛΙΞΗΣ ΤΗΣ ΑΙΜΟΔΥΝΑΜΙΚΗΣ ΣΥΜΠΕΡΙΦΟΡΑΣ ΤΩΝ ΑΝΕΥΡΥΣΜΑΤΩΝ

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Άσκηση 1: Μια τράπεζα ενδιαφέρεται να μελετήσει την αποταμιευτική συμπεριφορά των πελατών της. Θεωρείται ως δεδομένο ότι η ετήσια αποταμίευση των πελατών της

Διαβάστε περισσότερα

Διάλεξη 2. Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; Ράπανος-Καπλάνογλου 2016/7

Διάλεξη 2. Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; Ράπανος-Καπλάνογλου 2016/7 Διάλεξη 2 Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; 1 Ράπανος-Καπλάνογλου 2016/7 Θετική και δεοντολογική προσέγγιση Η θετική ανάλυση εξετάζει τι υπάρχει και ποιες οι συνέπειες

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 6: Συσχέτιση και παλινδρόμηση εμπειρική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης

Διαβάστε περισσότερα

Επαγγελματική Επιδημιολογία

Επαγγελματική Επιδημιολογία Επαγγελματική Επιδημιολογία Η επιδημιολογία είναι η επιστήμη, που μελετά τη συχνότητα των νοσημάτων σε ανθρώπινους πληθυσμούς και διερευνά τους αιτιολογικούς παράγοντες και τους παράγοντες πρόγνωσης. Η

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΑ» και «ΝΕΚΑ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΑ» και «ΝΕΚΑ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΑ» και «ΝΕΚΑ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ Εισαγωγή: 3 η Άσκηση: 15/12/2016 Για την ανάλυση της σημασίας

Διαβάστε περισσότερα

Εργαστήριο Δημογραφικών & Κοινωνικών Αναλύσεων

Εργαστήριο Δημογραφικών & Κοινωνικών Αναλύσεων ΥΠΟΔΕΙΓΜΑΤΑ ΣΤΑΣΙΜΟΥ ΚΑΙ ΣΤΑΘΕΡΟΥ ΠΛΗΘΥΣΜΟΥ (ΕΛΕΥΘΕΡΙΑ ΑΝΔΡΟΥΛΑΚΗ) Η εξέταση των πολύπλοκων δεσμών που συνδέουν τα δημογραφικά φαινόμενα με τους πληθυσμούς από τους οποίους προέρχονται και τους οποίους

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Β.δ Επιλογή των κατάλληλων εμπειρικών ερευνητικών μεθόδων

Β.δ Επιλογή των κατάλληλων εμπειρικών ερευνητικών μεθόδων Β.δ Επιλογή των κατάλληλων εμπειρικών ερευνητικών μεθόδων Νίκος Ναγόπουλος Για τη διεξαγωγή της κοινωνικής έρευνας χρησιμοποιούνται ποσοτικές ή/και ποιοτικές μέθοδοι που έχουν τις δικές τους τεχνικές και

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ SPSS

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

Aιτιότητα. Ιωάννα Τζουλάκη

Aιτιότητα. Ιωάννα Τζουλάκη Aιτιότητα Ιωάννα Τζουλάκη Αιτιότητα Αναλυτική επιδημιολογία: έλεγχο υποθέσεων Συσχέτιση έκθεσης σε κάποιο παράγοντα και εμφάνιση της νόσου Συσχέτιση (στατιστική) δεν συνεπάγεται την σχέση αίτιου αποτελέσματος

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 9 : Περιγραφή του ελέγχου Χ 2 Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών

Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών Μελέτες ασθενών-μαρτύρων (case-control studies) Πρόγραμμα εκπαίδευσης στην επιδημιολογική επιτήρηση και διερεύνηση επιδημιών ΕΣΔΥ ΚΕΕΛΠΝΟ, 2010

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

Κλινικές δοκιμές APPLIED MEDICAL RESEARCH ... ... Π. Γαλάνης. Clinical trials

Κλινικές δοκιμές APPLIED MEDICAL RESEARCH ... ... Π. Γαλάνης. Clinical trials Copyright Athens Medical Society www.mednet.gr/archives ARCHIVES OF HELLENIC MEDICINE: ISSN 11-05-3992 APPLIED MEDICAL RESEARCH Κλινικές δοκιμές 1. Εισαγωγή 2. Πειραματικές μελέτες 3. Κλινικές δοκιμές

Διαβάστε περισσότερα