ΙΜΕΤΑΒΛΗΤΑ ΜΟΝΤΕΛΑ ΓΙΑ ΙΑΧΡΟΝΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΕΙΚΤΩΝ ΤΗΣ HIV-1 ΛΟΙΜΩΞΗΣ, ΠΑΡΟΥΣΙΑ ΕΝΟΣ ΜΗ-ΑΓΝΟΗΣΙΜΟΥ ΜΗΧΑΝΙΣΜΟΥ ΠΑΡΑΓΩΓΗΣ ΕΛΛΕΙΠΟΥΣΩΝ ΜΕΤΡΗΣΕΩΝ

Σχετικά έγγραφα
Μακροχρόνια εξέλιξη του λόγου CD4/CD8 σε HIV οροθετικούς υπό συνδυασμένη αντριρετροϊκή αγωγή

ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ

Σύγκριση HIV-1 Οροθετικών ανάλογα με χώρα προέλευσης: Διαχρονικές τάσεις και χαρακτηριστικά

Ελλείπουσες τιμές λόγω περικοπής μετρήσεων σε διαχρονικά συνεχή δεδομένα: χρήση μοντέλων για πληροφοριακή περικοπή όταν η αποκοπή είναι αγνοήσιμη.

Q- ΔΙΑΓΡΑΜΜΑΤΑ ΓΙΑ ΤΗΝ ΠΑΡΑΜΕΤΡΟ p ΤΗΣ ΔΙΩΝΥΜΙΚΗΣ ΚΑΤΑΝΟΜΗΣ

Στατιστική. Εκτιμητική

Στατιστική Συμπερασματολογία

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

ΑΚΡΙΒΕΙΑ ΕΝΟΣ ΔΙΤΙΜΟΥ ΔΙΑΓΝΩΣΤΙΚΟΥ ΕΛΕΓΧΟΥ ΠΟΥ ΕΞΑΡΤΑΤΑΙ ΑΠΟ ΤΟ ΧΡΟΝΟ

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΑΞΙΟΛΟΓΗΣΗ ΜΕΘΟΔΩΝ ΣΥΓΚΡΙΣΗΣ ΥΠΟΚΕΙΜΕΝΩΝ ΚΑΜΠΥΛΩΝ ΕΠΙΒΙΩΣΗΣ ΣΕ ΔΕΔΟΜΕΝΑ ΜΕ ΤΥΧΑΙΑ ΑΠΟΚΟΠΗ

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

(X1 X 2 ) 2}. ( ) f 1 (x i ; θ) = θ x i. (1 θ) n x i. x i log. i=1. i=1 t2 i

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέθοδος μέγιστης πιθανοφάνειας

Ρυθµός ιστολογικής εξέλιξης χρόνιας ηπατίτιδας C και ευαίσθητεςυποοµάδες ασθενών

HMY 795: Αναγνώριση Προτύπων

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Generalized Linear Model [GLM]

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Λογαριθµιστική εξάρτηση

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

A(θ) = n log θ B(x ) = 0. T (x ) = x i. Γ(n)θ n =

ΤΟ ΟΜΟΓΕΝΕΣ MΑΡΚΟΒΙΑΝΟ ΣΥΣΤΗΜΑ ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ ΜΕ ΠΕΠΕΡΑΣΜΕΝΗ ΧΩΡΗΤΙΚΟΤΗΤΑ ΣΕ ΜΙΑ ΚΑΤΑΣΤΑΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Στατιστική Συμπερασματολογία

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Εργαστηριακή Διάγνωση της HIV λοίμωξης. Δρ. Μαρία Κοτσιανοπούλου Βιολόγος Υπεύθυνη Εργαστηριού Κέντρου Αναφοράς AIDS, ΕΣΔΥ

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΜΕΤΑΦΟΡΩΝ ΚΑΙ ΣΥΓΚΟΙΝΩΝΙΑΚΗΣ ΥΠΟ ΟΜΗΣ

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

Αναλυτική Στατιστική

1.4 Λύσεις αντιστρόφων προβλημάτων.

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

HMY 799 1: Αναγνώριση Συστημάτων

Πανεπιστήμιο Πελοποννήσου

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Γ. Πειραματισμός Βιομετρία

8. ΕΠΕΞΕΡΓΑΣΊΑ ΣΗΜΆΤΩΝ. ICA: συναρτήσεις κόστους & εφαρμογές

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 )

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΤΑΞΙΝΟΜΙΚΗ ΑΝΑΛΥΣΗ ΓΙΑ ΕΞΑ ΙΑΣΤΑΤΗ ΙΩΝΥΜΙΚΗ ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΑΚΤΙΝΟ ΙΑΓΝΩΣΤΙΚΗ ΤΗΣ ΠΝΕΥΜΟΝΟΚΟΝΙΑΣΗΣ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

Ορισμός επιδημιολογίας

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 13 Μαρτίου /31

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

Διάστημα εμπιστοσύνης της μέσης τιμής

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης

Εισαγωγή. Ο επιπολασμός της αντοχής σε NNRTIs σε μη θεραπεμένους ασθενείς κατά το διάστημα στην Ν. Ελλάδα, έχει εκτιμηθεί σε 15.

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

Εφαρμοσμένη Στατιστική

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Α1 ΚΑΙ Β ΣΟΤ HIV-1 ΣΗΝ ΕΛΛΑΔΑ: ΕΚΣΙΜΗΗ ΣΟΠΙΚΨΝ ΔΙΚΣΤΨΝ ΚΑΙ ΦΑΡΑΚΣΗΡΙΜΟ ΣΟΤ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Αλγόριθµοι Εκτίµησης Καθυστέρησης και

Εισαγωγή στη Στατιστική

Profile Analysis Ανάλυση προφίλ

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

8.1 The Nature of Heteroskedasticity 8.2 Using the Least Squares Estimator 8.3 The Generalized Least Squares Estimator 8.

Εισόδημα Κατανάλωση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μάστερ στην Εφαρµοσµένη Στατιστική

2. Missing Data mechanisms

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΙΕΡΕΥΝΗΣΗ ΤΗΣ ΑΚΡΙΒΕΙΑΣ ΤΩΝ ΗΜΟΓΡΑΦΙΚΩΝ Ε ΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact

Δίκτυα μετάδοσης αντοχής Δ. Παρασκευής

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Transcript:

Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 17 ου Πανελληνίου Συνεδρίου Στατιστικής (2004), σελ. 349-357 ΙΜΕΤΑΒΛΗΤΑ ΜΟΝΤΕΛΑ ΓΙΑ ΙΑΧΡΟΝΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΕΙΚΤΩΝ ΤΗΣ HIV-1 ΛΟΙΜΩΞΗΣ, ΠΑΡΟΥΣΙΑ ΕΝΟΣ ΜΗ-ΑΓΝΟΗΣΙΜΟΥ ΜΗΧΑΝΙΣΜΟΥ ΠΑΡΑΓΩΓΗΣ ΕΛΛΕΙΠΟΥΣΩΝ ΜΕΤΡΗΣΕΩΝ Νίκος Πανταζής, Γιώτα Τουλούµη Ιατρική Σχολή Πανεπιστηµίου Αθηνών, Εργαστήριο Υγιεινής και Επιδηµιολογίας. ΠΕΡΙΛΗΨΗ Σε µελέτες µε διαχρονικές µετρήσεις αναπληρωτών δεικτών, ένα ιδιαίτερα σηµαντικό και συχνό στατιστικό πρόβληµα είναι ο µεγάλος αριθµός ελλειπουσών τιµών. Μέθοδοι που βασίζονται σε εκτιµητές µέγιστης πιθανοφάνειας, έχει αποδειχθεί ότι δίνουν αµερόληπτες εκτιµήσεις µόνο όταν ο µηχανισµός παραγωγής ελλειπουσών τιµών είναι τυχαίος. Σε αντίθετη περίπτωση, αµερόληπτες εκτιµήσεις του ρυθµού µεταβολής των επιπέδων των δεικτών λαµβάνονται από ταυτόχρονη µοντελοποίηση τόσο των µετρήσεων που παρατηρήθηκαν όσο και του µηχανισµού περικοπής τους. Ένα τέτοιο µοντέλο έχει προταθεί από τους Touloum et al. (1999) το οποίο συνδυάζει ένα γραµµικό µοντέλο τυχαίων επιδράσεων για την εξέλιξη των επιπέδων ενός µόνο δείκτη µε ένα κανονικό σε λογαριθµική κλίµακα µοντέλο επιβίωσης για το µηχανισµό περικοπής τους. Στην εργασία αυτή επεκτείνουµε το µοντέλο αυτό στην ανάλυση διµεταβλητών δεδοµένων, στην ανάλυση δηλαδή δύο δεικτών ταυτόχρονα, µε παράλληλη διόρθωση για τον µη αγνοήσιµο µηχανισµό περικοπής των τιµών τους. 1. ΕΙΣΑΓΩΓΗ Πολλές επιδηµιολογικές µελέτες περιλαµβάνουν επαναλαµβανόµενες µετρήσεις δεικτών που σχετίζονται ισχυρά µε την εξέλιξη της υπό µελέτη νόσου. Ένα συχνό και ιδιαίτερα σηµαντικό πρόβληµα σε τέτοιες µελέτες, είναι η παρουσία 349

ελλειπουσών τιµών. Για την ανάλυση τέτοιου τύπου δεδοµένων υπάρχουν αρκετές µέθοδοι αρκεί ο τρόπος εµφάνισης ελλειπουσών τιµών να είναι τυχαίος. Ακολουθώντας την ορολογία που εισήγαγαν οι Lttle και Rubn (1987) τα ελλιπή δεδοµένα µπορούν να χαρακτηριστούν ως: α) «πλήρως τυχαία» (MCAR) όταν η πιθανότητα εµφάνισής τους δεν εξαρτάται από το διάνυσµα τιµών της εξαρτηµένης Y, β) «τυχαία» (MAR) όταν η πιθανότητα εµφάνισής τους εξαρτάται µόνο από το παρατηρηθέν τµήµα του διανύσµατος τιµών της εξαρτηµένης Υ 0 και γ) «µη-αγνοήσιµα» (MNI) όταν η πιθανότητα εµφάνισής τους εξαρτάται από µη παρατηρηθείσες ποσότητες. Έχει δειχθεί ότι (Lard, 1988) µέθοδοι βασισµένες σε µέγιστη πιθανοφάνεια δίνουν ασυµπτωτικά αµερόληπτες εκτιµήσεις µόνο όταν οι ελλείπουσες τιµές είναι MCAR ή MAR. Σε αντίθετη περίπτωση χρειάζεται να εφαρµοστούν µοντέλα που λαµβάνουν υπόψη τους ταυτόχρονα τόσο τις παρατηρηθείσες τιµές όσο και το µηχανισµό περικοπής τους. O Shluhter (1992) πρότεινε ένα κανονικό σε λογαριθµική κλίµακα (lognormal) µοντέλο για το µηχανισµό πρόωρης διακοπής των µετρήσεων συνδυασµένο µε ένα γραµµικό µοντέλο τυχαίων επιδράσεων για τις επαναλαµβανόµενες µετρήσεις ενώ οι Touloum et al. (1999) πρότειναν ένα παρόµοιο µοντέλο ( Jont multvarate random effets JMRE) µε υπολογιστικά απλούστερη διαδικασία εκτίµησης. Στις προαναφερθείσες εργασίες τα µοντέλα επικεντρώνονταν στην ανάλυση επαναλαµβανόµενων µετρήσεων ενός µόνο δείκτη. Στην κλινική πρακτική όµως, είναι συνηθισµένο να συλλέγονται δεδοµένα για περισσότερους του ενός δείκτες. Στην παρούσα εργασία επεκτείνουµε το JMRE, από µοντέλο για ανάλυση µονοµεταβλητών σε µοντέλο ανάλυσης διµεταβλητών διαχρονικών δεδοµένων. Το προτεινόµενο µοντέλο επιτρέπει επίσης µη γραµµική διαχρονική εξέλιξη των επιπέδων ενός από τους δύο δείκτες. 2. Ε ΟΜΕΝΑ - ΜΕΛΕΤΗ CASCADE Οι δύο πιο συχνά χρησιµοποιούµενοι δείκτες για τη µελέτη της πορείας της HIV- 1 λοίµωξης είναι ο απόλυτος αριθµός των CD4 λεµφοκυττάρων και το ιϊκό φορτίο HIV-RNA. Στο πλαίσιο της διεθνούς πολυκεντρικής µελέτης CASCADE συλλέγονται δεδοµένα από επαναλαµβανόµενες µετρήσεις αυτών των δύο δεικτών για πάνω από 8000 άτοµα µε γνωστή ηµεροµηνία µόλυνσης. Στη συγκεκριµένη εργασία εξαιρέθηκαν µετρήσεις δεικτών που έγιναν µετά την ανάπτυξη AIDS ή την έναρξη αντιρετροϊκής θεραπεία καθώς και οι δύο αυτοί παράγοντες επηρεάζουν την διαχρονική εξέλιξη των δεικτών. Η περικοπή µετρήσεων εξαιτίας τερµατισµού της µελέτης είναι πιο πιθανό να είναι εντελώς τυχαία ( MCAR ) ενώ η περικοπή λόγω έναρξης αντιρετροϊκής θεραπείας τυχαία 350

( MAR ) καθώς οι ιατρικές αποφάσεις σχετικά µε την έναρξή της βασίζονται σε ήδη παρατηρηθείσες τιµές αυτών ακριβώς των δύο δεικτών. Αντίθετα, είναι πολύ πιθανό, η περικοπή µετρήσεων που σχετίζεται µε την εξέλιξη της νόσου (AIDS ή θάνατος) να είναι µη αγνοήσιµη. Στην παρούσα εργασία συµπεριλήφθησαν άτοµα µε τουλάχιστον δύο µετρήσεις και στους δύο δείκτες δίνοντας έτσι τελικά ένα δείγµα 1531 ατόµων µε περίοδο παρακολούθησης έως και 20 έτη. 3. ΤΟ ΙΜΕΤΑΒΛΗΤΟ JMRE ΜΟΝΤΕΛΟ T r r r r T Έστω Y = ( Y 1, Y2,..., Y ) και Y ( n = Y 1, Y2,..., Y r ) τα διανύσµατα των n επαναλαµβανόµενων µετρήσεων για τον πρώτο (CD4 λεµφοκύτταρα) και τον δεύτερο (ιϊκό φορτίο) δείκτη για το οστό r άτοµο (=1,2,,m). Έστω X και X οι r πίνακες σχεδιασµού που αντιστοιχούν στις σταθερές επιδράσεις ( b, b ) των δύο r δεικτών και Z, Z οι αντίστοιχοι πίνακες σχεδιασµού για τις τυχαίες επιδράσεις r ( β, β ). Υποθέτουµε ότι ισχύει το ακόλουθο διµεταβλητό γραµµικό µικτό µοντέλο για τις διαχρονικές µετρήσεις των δύο δεικτών: Y X 0 b Z 0 β e r = r r + + r r r Y 0 X b 0 Z β e r όπου e και e είναι τα εντός-του-ατόµου υπόλοιπα, τα οποία υποθέτουµε ότι είναι µεταξύ τους ανεξάρτητα και ακολουθούν πολυδιάστατη κανονική κατανοµή µε 2 2 r µέσο το 0 και πίνακες διασποράς-συνδιασποράς σ I n και σ I r n αντίστοιχα. r Επιπλέον υποθέτουµε ότι οι τυχαίες επιδράσεις β, β ακολουθούν από κοινού την πολυδιάστατη κανονική κατανοµή µε µέσο το 0 και πίνακα διασποράςσυνδιασποράς: Σ r, Σ = r r Σ Για κάθε άτοµο, ορίζουµε T s τον πραγµατικό χρόνο επιβίωσης (δηλαδή το χρόνο από τη στιγµή της µόλυνσης έως την ανάπτυξη AIDS ή θάνατο) και C το χρόνο περικοπής. Τα παρατηρηθέντα δεδοµένα επιβίωσης αποτελούνται από το χρόνο T mn( s = T, C) και µια δίτιµη µεταβλητή δ η οποία έχει την τιµή 1 αν s s T = T και 0 όταν T < T. Οι χρόνοι επιβίωσης θεωρείται ότι περιγράφονται από ένα lognormal µοντέλο της µορφής: log( T s ) t t t = Xb + e όπου X t ο πίνακας 2 t t σχεδιασµού και e ~ N(0, σ ). Προκειµένου να επιτρέψουµε µη-αγνοήσιµη περικοπή µετρήσεων των δύο δεικτών υποθέτουµε ότι: Σ 351

β 0 Σ jont r jont = N nt β β 0, Σ όπου Σ = Σ Σ t e 0 σ σ jo r r 2 t rt t Τα διανύσµατα σ t rt και σ περιλαµβάνουν τις συνδιασπορές των τυχαίων επιδράσεων του κάθε δείκτη µε τα υπόλοιπα του µοντέλου επιβίωσης. ιαδικασία εκτίµησης Το µοντέλο µπορεί να γραφεί ως: Y = X b + Z β + e jo nt jo nt jo nt jo nt jo nt όπου T T jont r s T =,,ln( T ) jont Y Y Y, r t,, jont r b = b b b, e,,0 = e e, T T T T σ T T T X jont X 0 0 r = 0 X 0 και T T T t 0 0 X Z jont Z 0 0 r = 0 Z 0 T T 1 0 0 Για µη περικοµµένα δεδοµένα επιβίωσης, όλες οι παράµετροι του µοντέλου µπορούν να εκτιµηθούν µέσω της Restrted Iteratve Generalzed Least Squares µεθόδου (RIGLS) (Goldsten, 1995) ενώ σε περίπτωση που υπάρχουν περικοµµένοι χρόνοι επιβίωσης η εκτίµηση µπορεί να γίνει µέσω ενός συνδυασµού της µεθόδου RIGLS και του E-M αλγορίθµου. Πιο συγκεκριµένα µετά από κάθε επανάληψη του RIGLS αλγόριθµου, οι περικοµµένοι χρόνοι επιβίωσης και τα αντίστοιχα στοιχεία του πίνακα µε τα γινόµενα των υπολοίπων, αντικαθίστανται µε τις υπό συνθήκη αναµενόµενες τιµές τους (Ε-βήµα) µε δεδοµένες τις παρατηρηθείσες τιµές και τις τρέχουσες εκτιµήσεις και στη συνέχεια ανανεώνουµε τις εκτιµήσεις µέσω της επόµενης RIGLS επανάληψης (Μ-βήµα). Η εκτίµηση των υπό συνθήκη αναµενόµενων τιµών βασίζεται σε ιδιότητες της πολυδιάστατης κανονικής κατανοµής και της περικοµµένης (trunated) κανονικής κατανοµής (Johnson και Kotz, 1970). Μετά από αρχική διερευνητική ανάλυση των δεδοµένων για τον αριθµό των CD4 λεµφοκυττάρων επιλέχθηκε ένα γραµµικό µοντέλο τυχαίων επιδράσεων (τυχαία σταθερά-random nterept b 0 και τυχαία κλίση-random slope b 1 ) µετά από µετασχηµατισµό τους σε κλίµακα τετραγωνικής ρίζας. Αντίθετα, για τη διαχρονική εξέλιξη των επιπέδων του ιϊκού φορτίου, η οποία ήταν διφασική (ταχεία πτώση για τον πρώτο χρόνο ακολουθούµενη από αργή γραµµική αύξηση 352

στη συνέχεια) χρησιµοποιήσαµε ένα µη γραµµικό µοντέλο τυχαίων επιδράσεων της µορφής: log ( Y ) = b + β + ( b + β ) tme + b exp( b tme ) + e r r r r r r r r 10 j 0 0 1 1 j 2 3 j j όπου tme j είναι ο j στός χρόνος µέτρησης του στού ατόµου. Η µέση διαχρονική εξέλιξη που προβλέπει ένα τέτοιο µοντέλο φαίνεται στο Σχήµα 1. Το συγκεκριµένο µοντέλο ενσωµατώθηκε στο βασικό JMRE µοντέλο και η διαδικασία εκτίµησης τροποποιήθηκε περαιτέρω µε τη βοήθεια µιας µεθόδου lnearzaton βασισµένης σε ανάπτυξη κατά Taylor πρώτου βαθµού (MCullagh και Nelder, 1989). 4. ΜΕΛΕΤΗ ΠΡΟΣΟΜΟΙΩΣΗΣ Το διµεταβλητό JMRE µοντέλο αξιολογήθηκε και συγκρίθηκε µε άλλα απλούστερα µοντέλα (δύο µονοµεταβλητά JMRE, δυο µονοµεταβλητά και ένα διµεταβλητό µοντέλο τυχαίων επιδράσεων) µέσω προσοµοιώσεων. Τα προσοµοιωµένα δεδοµένα δηµιουργήθηκαν µε βάση το διµεταβλητό JMRE µοντέλο όπως αυτό περιγράφηκε στην ενότητα 3 και µε παραµέτρους των οποίων οι τιµές εκλέχθηκαν µε βάση εκτιµήσεις από την εφαρµογή του µοντέλου σε πραγµατικά δεδοµένα. Συνολικά δηµιουργήθηκαν 500 προσοµοιωµένα σύνολα δεδοµένων µε 200 άτοµα το καθένα και µετρήσεις των δύο δεικτών ανά τρίµηνο. Τα αποτελέσµατα σχετικά µε τις σταθερές επιδράσεις φαίνονται στον Πίνακα 1. Όπως φαίνεται από τα αποτελέσµατα αυτά το διµεταβλητό JMRE µοντέλο δίνει εκτιµήσεις µε αµελητέα µεροληψία ακολουθούµενο από τα δύο µονοµεταβλητά JMRE µοντέλα. Αντίθετα η ανάλυση µε µοντέλα που δεν λάµβαναν υπόψη τους τη µη-αγνοήσιµη περικοπή των δεδοµένων (µονοµεταβλητά ή διµεταβλητό µοντέλο τυχαίων επιδράσεων) οι εκτιµήσεις των παραµέτρων που εξέφραζαν ρυθµό µεταβολής των επιπέδων των δεικτών παρουσίασαν σηµαντική µεροληψία. Αντίστοιχα αποτελέσµατα παρουσιάστηκαν για τις εκτιµήσεις των τυχαίων επιδράσεων µε αυτές του διµεταβλητού JMRE µοντέλου να παρουσιάζουν µεροληψία από -3.6% έως 10.8%. Η σχετική µεροληψία έφτανε έως και το ±30% στις άλλες τρεις προσεγγίσεις. 5. ΕΦΑΡΜΟΓΗ ΣΕ Ε ΟΜΕΝΑ ΑΠΟ ΤΗ ΜΕΛΕΤΗ CASCADE Το διµεταβλητό JMRE µοντέλο εφαρµόστηκε στα δεδοµένα του CASCADE. Έλεγχοι πηλίκου πιθανοφανειών έδωσαν πολύ σηµαντικά αποτελέσµατα (p<0.001) για τις συνδιασπορές των υπολοίπων του µοντέλου επιβίωσης µε τις τυχαίες επιδράσεις και των δύο δεικτών υποδεικνύοντας την ύπαρξη ενός µη 353

αγνοήσιµου µηχανισµού περικοπής δεδοµένων. Τα βασικά ευρήµατα αφορούσαν διαφορές στα αρχικά επίπεδα και στο ρυθµό µεταβολής των δεικτών ανάλογα µε τον τρόπο µετάδοσης της µόλυνσης, το φύλο και την ηλικία (Σχήµα 2). Οι διαφορές στα αποτελέσµατα του διµεταβλητού JMRE µοντέλου µε αυτά που πήραµε από ανάλυση µε µονοµεταβλητά JMRE µοντέλα και διµεταβλητό ή µονοµεταβλητά µοντέλα τυχαίων επιδράσεων ήταν σε αντίστοιχη κατεύθυνση µε αυτή που παρατηρήθηκε στη µελέτη προσοµοίωσης µε το διµεταβλητό JMRE µοντέλο να εκτιµά υψηλότερους ρυθµούς τόσο για τη µείωση των CD4 λεµφοκυττάρων όσο και για την αύξηση του ιϊκού φορτίου. Επιπλέον τα τυπικά σφάλµατα ήταν µικρότερα για την πλειοψηφία των παραµέτρων στο διµεταβλητό JMRE µοντέλο. Γραφικοί έλεγχοι των υποθέσεων του µοντέλου δεν κατέδειξαν εµφανείς παραβιάσεις τους. 6. ΣΥΖΗΤΗΣΗ ΣΥΜΠΕΡΑΣΜΑΤΑ Στην εργασία αυτή προτάθηκε ένα µοντέλο για διαχρονικές µετρήσεις ποσοτικών δεικτών υποκείµενων σε µη αγνοήσιµη περικοπή δεδοµένων. Το µοντέλο αυτό επεκτείνει το αντίστοιχο µονοµεταβλητό που έχει προταθεί από τους Touloum et al. (1999) σε διµεταβλητά δεδοµένα και παράλληλα επιτρέπει µη γραµµική εξέλιξη για τον ένα από τους δύο δείκτες. Τα αποτελέσµατα από τις µελέτες προσοµοίωσης έδειξαν ότι τα δύο µονοµεταβλητά και ακόµα περισσότερο το διµεταβλητό JMRE µοντέλο µειώνουν κατά πολύ τη µεροληψία που παρουσιάζεται σε τέτοιες περιπτώσεις όταν η ανάλυση γίνεται µέσω συµβατικών µοντέλων τυχαίων επιδράσεων. Ένα άλλο σηµαντικό πλεονέκτηµα του συγκεκριµένου µοντέλου είναι ότι επιτρέπει την εκτίµηση της συσχέτισης µεταξύ των τιµών των δύο δεικτών και της διαχρονικής εξέλιξης της συσχέτισης αυτής. Παράλληλα το µη γραµµικό µοντέλο που χρησιµοποιήθηκε για την περιγραφή των µετρήσεων του ιϊκού φορτίου επιτρέπει άµεσες εκτιµήσεις για ποσότητες όπως ο χρόνος από την µόλυνση µέχρι το σηµείο που τα επίπεδα του ιϊκού φορτίου φθάνουν τις ελάχιστες τιµές τους. Ένα σηµείο το οποίο χρήζει περαιτέρω διερεύνησης στο διµεταβλητό JMRE µοντέλο όπως και σε όλα τα πλήρως παραµετρικά µοντέλα είναι η ευαισθησία του κάτω από παραβιάσεις των υποθέσεών του. Είναι σηµαντικό ότι σε µελέτες προσοµοίωσης το διµεταβλητό JMRE µοντέλο δεν έδειξε ιδιαίτερα ευαίσθητο σε παραβιάσεις της υπόθεσης για την υπό συνθήκη ανεξαρτησία των δύο δεικτών. Θα πρέπει να αναφερθεί όµως ότι ο έλεγχος των υποθέσεων τέτοιων µοντέλων µε περισσότερα του ενός επίπεδα και ιδιαίτερα µε µη αγνοήσιµη περικοπή δεδοµένων είναι ιδιαίτερα δύσκολος και απαιτεί ιδιαίτερη προσοχή. 354

ABSTRACT The man statstal problem n many epdemologal studes whh nvolve repeated measurements of surrogate markers, s the frequent ourrene of mssng data. Standard lkelhood based approahes lke the lnear random effets (RE) model fal to gve unbased estmates when data are non-gnorably mssng. In HIV-1 nfeton, two markers whh have been wdely used to trak dsease progresson are CD4 ell ounts and HIV-RNA vrus load levels. Repeated measurements of these markers tend to be nformatvely ensored whh s a speal ase of non-gnorable mssngness. In suh ases, one needs to apply methods jontly modellng the observed data and the mssngness proess. Touloum et al. (1999) have proposed a model termed Jont Multvarate Random Effets (JMRE) whh ombnes a lnear RE model for the underlyng pattern of the marker wth a log-normal survval model for the drop out proess. In ths paper we extend the JMRE model to smultaneously model the CD4 and vrus load data whle adjustng for nformatve drop-outs due to dsease progresson or death. ΑΝΑΦΟΡΕΣ Goldsten, H. (1995). Multlevel statstal models, Edward Arnold, London. Johnson, N.L. and S. Kotz (1970). Contnuous Unvarate Dstrbutons-1. Wley, New York. Lard, N. M. (1988). Mssng data n longtudnal-studes. Stat Med 7, 305-315. Lttle, R.J.A. and D.B. Rubn (1987). Statstal analyss wth mssng data. Wley, New York. MCullagh, P. and J.A. Nelder (1989). Generalzed Lnear Models, Chapman & Hall. Shluhter, M. D. (1992). Methods for the analyss of nformatvely ensored longtudnal data. Stat Med 11, 1861-1870. Touloum, G., S. J. Pook, A. G. Babker, and J. H. Darbyshre (1999). Estmaton and omparson of rates of hange n longtudnal studes wth nformatve drop-outs. Stat Med 18, 1215-1233. 355

Πίνακας 1. Αποτελέσµατα µελέτης προσοµοίωσης: εκτιµήσεις και % σχετική µεροληψία α) ιµεταβλητό JMRE, β) Ανεξάρτητα µονοµεταβλητά RE, γ) ιµεταβλητό RE και δ) Ανεξάρτητα µονοµεταβλητά JMRE. ιµεταβλητό Ανεξάρτητα ιµεταβλητό Ανεξάρτητα JMRE RE RE JMRE Εκτίµηση Εκτίµηση Εκτίµηση Εκτίµηση Παράµετροι Πραγµατικές Τιµές (%Bas) (%Bas) (%Bas) (%Bas) CD4 σταθερά 25.72 25.702 25.605 25.631 25.671 (ells/µl) 1/2 (-0.07) (-0.45) (-0.34) (-0.19) CD4 κλίση -1.131-1.119-0.998-1.032-1.09 (ells/µl) 1/2 /έτος (1.06) (11.73) 8.74 3.66 HIV-RNA «σταθερά» 3.874 3.876 3.89 3.885 3.88 log 10 (opes/ml) (0.06) (0.41) 0.28-0.16 HIV-RNA τελική κλίση 0.077 0.075 0.06 0.063 0.071 log 10 (opes/ml) / έτος (-2.77) (-21.57) (-17.88) (-7.39) HIV-RNA *3 b 2 1.13 1.129 1.116 1.121 1.125 log 10 (opes/ml) (-0.08) (-1.24) (-0.84) (-0.42) HIV-RNA *4 b 3 4 4.008 4.073 4.038 4.029 (έτος -1 ) (0.20) (1.83) 0.94 (0.73) Log (Χρόνος Επιβίωσης) 2.3 2.305 2.248 *1 Log(έτος) (0.23) (2.27) *1 2.280 *2 (-0.85) *2 *1 Αποτελέσµατα από το CD4 JMRE model; *2 Αποτελέσµατα από το JMRE για ιϊκό φορτίο; *3 Προστιθέµενο στο HIV-RNA σταθερά δίνει τα αρχικά επίπεδα ιϊκού φορτίου; *4 Καθορίζει το ρυθµό της αρχικής εκθετικής µείωσης του ιϊκού φορτίου 356

Σχήµα 1. Μη-γραµµικό µοντέλο τυχαίων επιδράσεων για τη διαχρονική εξέλιξη των επιπέδων του ιϊκού φορτίου HIV-RNA. log ( Y r ) = b r + β r + ( b r + β r ) tme + b r exp( b r tme ) + e r 10 j 0 0 1 1 j 2 3 j j Χρόνος από µόλυνση (έτη) Σχήµα 2. Μέση διαχρονική εξέλιξη αριθµού CD4 λεµφοκυττάρων (α, β) και λογαριθµισµένων επιπέδων ιϊκού φορτίου ανάλογα µε τρόπο µετάδοσης, φύλο και ηλικία κατά τη µόλυνση. Αποτελέσµατα εφαρµογής του διµεταβλητού JMRE µοντέλου στα δεδοµένα του CASCADE (ΧΕΝ: χρήστες ενδοφλέβιων ναρκωτικών) Αριθµός CD4 λεµφοκυττάρων/µl α) ΧΕΝ (Γυναίκες) β) Ετεροφ. (Γυναίκες) ΧΕΝ (Άνδρες) Οµοφυλόφιλοι Ετεροφ. (Άνδρες) γ) δ) Ιϊκό φορτίο (log 10 opes/ml) Χρόνος από µόλυνση (έτη) Χρόνος από µόλυνση (έτη) 357