διαγνωστικούς ελέγχους MCMC diagnostics CODA

Σχετικά έγγραφα
Μαρκοβιανές Αλυσίδες

Παράδειγμα. Για τα ΝΒ10 δεδομένα έχουμε το μοντέλο:

WinBUGS. Το BUGS (Bayesian inference Using Gibbs Sampling) είναι ένα ελεύθερο λογισµικό στο διαδίκτυο (

Χρονολογικές Σειρές (Time Series) Lecture notes Φ.Κουντούρη 2008

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής

Bayesian Biostatistics Using BUGS

2. ΕΠΙΛΟΓΗ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ. ΕΡΓΑΣΤΗΡΙΟ ΤΕΧΝΙΚΩΝ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΠΕΜΠΤΟ-ΑΥTOΠΑΛΙΝΔΡΟΜΑ ΥΠΟΔΕΙΓΜΑΤΑ(AR(p))

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Παράδειγμα. Στις χρονοσειρές σημαντικό ρόλο παίζει η αυτοσυσχέτιση: η αυτοσυσχέτιση. (lag k) ισούται με όπου γ

4. ΕΠΙΛΟΓΗ ΤΗΣ ΜΕΘΟΔΟΥ ΠΡΟΒΛΕΨΗΣ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 3

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Πολυτεχνείο Κρήτης Σχολή Ηλεκτρονικών Μηχανικών Και Μηχανικών Η/Υ. ΠΛΗ 513 Αυτόνομοι Πράκτορες

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Analyze/Forecasting/Create Models

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Description of the PX-HC algorithm

SPSS Statistical Package for the Social Sciences

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

1991 US Social Survey.sav

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΤΕΧΝΙΚΩΝ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΑΥΤΟΣΥΣΧΕΤΙΣΗ (AUTOCORRELATION)

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

5.1 logistic regresssion Chris Parrish July 3, 2016

Supplementary Appendix

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 3ο

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΚΕΦΑΛΑΙΟ 5. Matlab GUI για FWSVM και Global SVM

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΜΑΘΗΜΑ 2 ο. ΗχρήσητουπακέτουEviews (Using Eviews econometric package)

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

Χρονικές σειρές 8 Ο μάθημα: Μοντέλα κινητού μέσου

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL

1. Ποιες είναι οι διαφορές μεταξύ αυτοπαλίνδρομων υποδειγμάτων (AR) και υποδειγμάτων κινητού μέσου (MA);

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών. Χρόνου (Ι)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

Ανάλυση Χρονοσειρών. Κεφάλαιο Ανάλυση Χρονοσειρών

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Χρονοσειρές Μάθημα 2. Μη-στασιμότητα. Τάση? Εποχικότητα / περιοδικότητα? Ασταθή διασπορά? Αυτοσυσχέτιση?

SMPcache. Ένα εργαλείο για προσομοίωση-οπτικοποίηση κρυφής μνήμης (Cache)

Οικονομετρία Ι. Ενότητα 10: Διαγνωστικοί Έλεγχοι. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

2. Με το εικονίδιο συντόμευσης στην επιφάνεια εργασίας των Windows.

5.6 evaluating, checking, comparing Chris Parrish July 3, 2016

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 4, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 3

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Εισαγωγή στην Αριθμητική Ανάλυση

Οικονομικές εφαρμογές υπολογιστικών πακέτων. Στοχαστικά υποδείγματα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

ΕΠΕΞΕΡΓΑΣΙΑ ΒΙΝΤΕΟ ΜΕ ΤΟ ΠΡΟΓΡΑΜΜΑ VSDC FREE VIDEO EDITOR

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Μάθημα 2: Mη-στάσιμη χρονοσειρά, έλεγχος μοναδιαίας ρίζας και έλεγχος ανεξαρτησίας

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ MSc Τραπεζικής & Χρηματοοικονομικής

Περιγραφή των εργαλείων ρουτινών του στατιστικού

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΧΡΟΝΟΣΕΙΡΕΣ & ΠΡΟΒΛΕΨΕΙΣ-ΜΕΡΟΣ 7 ΕΛΕΓΧΟΙ. (TEST: Unit Root-Cointegration )

Repeated measures Επαναληπτικές μετρήσεις

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Λυμένες Ασκήσεις για το μάθημα:

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

τατιςτική ςτην Εκπαίδευςη II

6. ΕΠΙΣΚΟΠΗΣΗ ΤΟΥ ΧΑΡΤΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Transcript:

MCMC DIAGNOSTICS Πόσο πρέπει να περιμένουμε για να επιτευχθεί η στασιμότητα; Πόσο μεγάλο πρέπει να είναι το m (μετά την στασιμότητα για πόσο πρέπει να τρέξεις την αλυσίδα σου); Από που να ξεκινήσεις; Για να βεβαιωθούμε για όλα τα παραπάνω ερωτήματα χρησιμοποιούμαι διαγνωστικούς ελέγχους (MCMC diagnostics). Τέσσερις από τους πιο γνωστούς διαγνωστικούς ελέγχους μπορούν να εφαρμοστούν στα MCMC δεδομένα με την βοήθεια της R βιβλιοθήκης CODA. Ας τους εφαρμόσουμε πάνω στο τελευταίο παράδειγμα με τα NB10 δεδομένα.

CODA Αφού τρέξουμε το WinBUGS, πηγαίνουμε στο Sample Monitor Tool (Επιλέγοντας το Samples από το μενού Inference ), βάζουμε * στο node, για να επιλέξουμε όλες τις παραμέτρους, και επιλέγουμε το κουτί CODA. Δύο παράθυρα εμφανίζονται, ένα με όλες τις προσομοιωμένες τιμές για κάθε παράμετρο, και ένα που επεξηγεί ποιες τιμές αναφέρονται σε ποιες παραμέτρους. Επιλέγουμε το κάθε ένα παράθυρο χωριστά και το αποθηκεύουμε σαν.txt αρχείο, από το Save As στο μενού File. Εν συνεχεία αλλάζουμε τις καταλήξεις στα δύο αρχεία, το μεν με τις προσομοιωμένες τιμές σε.out και το επεξηγηματικό σε.ind. Ας υποθέσουμε λοιπόν ότι έχουμε τα αρχεία extendmore.out και extendmore.ind Ανοίγουμε την R και μεταφερόμαστε στον φάκελο που σώσαμε τα δύο αρχεία. Εγκαθιστούμε τις βιβλιοθήκες CODA και Lattice (install packages) και εν συνεχεία τις φορτώνουμε (load packages).

CODA > codamenu() CODA startup menu 1: Read BUGS output files 2: Use an mcmc object 3: Quit Selection: 1 Enter CODA index file name (or a blank line to exit) 1: extendmore.ind Enter CODA output file names, separated by return key (leave a blank line when you have finished) 1: extendmore.out 2: Abstracting mu... 40000 valid values Abstracting nu... 40000 valid values Abstracting sigma... 40000 valid values Abstracting y.new... 40000 valid values Checking effective sample size...ok CODA Main Menu 1: Output Analysis 2: Diagnostics 3: List/Change Options 4: Quit Selection: 2

CODA CODA Diagnostics Menu 1: Geweke 2: Gelman and Rubin 3: Raftery and Lewis 4: Heidelberger and Welch 5: Autocorrelations 6: Cross-Correlations 7: List/Change Options 8: Return to Main Menu

Geweke Ο Geweke (1992) πρότεινε έναν απλό διαγνωστικό έλεγχο, στηριζόμενος σε απλές ιδέες χρονοσειρών. ΑνσκεφτούμεκάθεστήληαπόταMCMC δεδομένα ως μία χρονοσειρά, τότε είναι λογικό πως αν η αλυσίδα έχει συγκλίνει στην στάσιμη κατανομή, οι μέσοι των πρώτων 10% (π.χ.) και τελευταίων 50% (π.χ.) των παρατηρήσεων πρέπει να είναι σχεδόν ίσοι. Άρα μπορούμε να προβούμε σε ένα z- test για να ελέγξουμε αυτήν την ισότητα. Αν για κάποια παράμετρο η απόλυτη τιμή του z-score είναι πολύ μεγαλύτερη από το 2, τότε αυτό είναι μια ένδειξη ότι η αλυσίδα δεν έχει συγκλίνει και θα πρέπει να αυξηθεί η περίοδος burn-in.

Geweke GEWEKE CONVERGENCE DIAGNOSTIC (Z-score) ============================== Iterations used = 1001:41000 Thinning interval = 1 Sample size per chain = 40000 $extendmore.out Fraction in 1st window = 0.1 Fraction in 2nd window = 0.5 mu nu sigma y.new 0.22074-0.51724-0.05966 0.39525 Geweke plots menu 1: Change window size 2: Plot Z-scores 3: Change number of bins for plot 4: Return to Diagnostics Menu

Geweke

Gelman and Rubin Οι Gelman and Rubin (1992), πρότειναν έναν έλεγχο που κοιτά για πολυκόρυφη εκ των υστέρων κατανομή. Αν η εκ των υστέρων κατανομή έχει 2 κορυφές, την μία μακριά από την άλλη και ξεκινήσεις την αλυσίδα από τιμές κοντά στην μία μόνο κορυφή μπορεί να μην επισκεφτείς ποτέ την άλλη. Η ιδέα λοιπόν είναι να τρέξεις την αλυσίδα 2 ή περισσότερες φορές από διαφορετικές αρχικές τιμές και να ελέγξεις αν οι αλυσίδες συγκλίνουν στο ίδιο σημείο. Η μέθοδος βασίζεται στην σύγκριση των ανάμεσα των αλυσίδων (within) και μεταξύ των αλυσίδες (between) διασπορών (ANOVA) για κάθε παράμετρο. Η σύγκριση αυτή γίνεται για να εκτιμήσουμε τον παράγοντα κατά τον οποίο η παράμετρος μεταβλητότητας της περιθώριας εκ των υστέρων κατανομής για την κάθε παράμετρο μπορεί να μειωθεί (shrink factor παράγων συρρίκνωσης) αν η αλυσίδα έτρεχε για άπειρο χρόνο. Ως αποτέλεσμα παίρνουμε τα 50% και 97.5% ποσοστιαία σημεία της κατανομής των παραγόντων συρρίκνωσης. Τιμές κοντά στο 1 δηλώνουν μικρή ένδειξη διαφοροποίησης μεταξύ των κατανομών στις οποίες οι αλυσίδες συγκλίνουν.

Gelman and Rubin GELMAN AND RUBIN DIAGNOSTIC =========================== Iterations used = 1001:41000 Thinning interval = 1 Sample size per chain = 40000 Potential scale reduction factors: Point est. 97.5% quantile mu 1.00 1.00 nu 1.00 1.00 sigma 1.00 1.00 y.new 1.01 1.01 Multivariate psrf 1 Gelman & Rubin menu 1: Shrink Factor Plots 2: Change bin size for shrink plot 3: Return to Diagnostics Menu

Gelman and Rubin

Raftery and Lewis Οι Raftery and Lewis (1992), πρότειναν έναν έλεγχο που απαντάει στο ερώτημα πόσο μεγάλα πρέπει να είναι τα b και m. Η απάντηση του ερωτήματος εξαρτάται άμεσα από το πόσο ακριβείς θέλουμε οι περιγραφικοί στατιστικοί δείκτες της εκ των υστέρων κατανομής να είναι. 1. Ποια ποσοστιαία σημεία των περιθωρίων εκ των υστέρων μας ενδιαφέρουν; (συνήθως 2.5% και 97.5%) 2. Τι MCMC ακρίβεια; (συνήθως 0.005) 3. Με ποια ελάχιστη πιθανότητα θέλουμε να επιτύχουμε την παραπάνω ακρίβεια; (συνήθως 0.95)

Raftery and Lewis Ως αποτελέσματα του ελέγχου έχουμε τα ακόλουθα: 1. Ένα προβλεπόμενο διάστημα αραίωσης (thinning interval). Όταν η αλυσίδα δεν αναμιγνύεται σωστά, συνήθως έχουμε μεγάλες θετικές αυτοσυσχετίσεις, π.χ. το μ 1000 έχει υψηλή εξάρτηση από το μ 999, μ 998, κλπ. Με άλλα λόγια οι τυχαίες τιμές κατά την διαδικασία προσομοίωσης δεν κινούνται γύρω από τον παραμετρικό χώρο γρήγορα. Ένας τρόπος επίλυσης αυτού του προβλήματος είναι να τρέξουμε την αλυσίδα για μεγαλύτερο διάστημα και να κατοχυρώνουμε κάθε κ επανάληψη (thinning interval). (Μόνο στο παλιό CODA) 2. Προτεινόμενο επιπλέον burn-in. 3. Προτεινόμενος συνολικός αριθμός επαναλήψεων Ν (συμπεριλαμβανομένου του burn-in). 4. Ένα κάτω όριο του συνολικού αριθμού επαναλήψεων N min (αν οι τιμές ήταν IID). 5. Ο λόγος I=N/N min (dependent factor), τιμές κοντά στο 1 δηλώνουν καλή μίξη, ενώ τιμές μεγαλύτερες του 5 συνήθως υποδηλώνουν πρόβλημα.

Raftery and Lewis RAFTERY AND LEWIS CONVERGENCE DIAGNOSTIC ================================== Iterations used = 1001:41000 Thinning interval = 1 Sample size per chain = 40000 $extendmore.out Quantile (q) = 0.025 Accuracy (r) = +/- 0.005 Probability (s) = 0.95 Burn-in Total Lower bound Dependence (M) (N) (Nmin) factor (I) mu 3 6218 3746 1.66 nu 9 12579 3746 3.36 sigma 9 13440 3746 3.59 y.new 2 3850 3746 1.03 1: Change parameters 2: Return to diagnostics menu

Heidelberger and Welch Οι Heidelberger and Welch (1983), πρότειναν έναν διαγνωστικό έλεγχο που χρησιμοποιεί το Cramer-von-Mises τεστ για στασιμότητα. Το CODA επίσης εφαρμόζει το half-width τεστ, το οποίο προσπαθεί να αποφανθεί αν με συγκεκριμένη ακρίβεια μπορούμε να εκτιμήσουμε τους εκ των υστέρων μέσους.

Heidelberger and Welch HEIDELBERGER AND WELCH STATIONARITY AND INTERVAL HALFWIDTH TESTS ======================================================== Iterations used = 1001:41000 Thinning interval = 1 Sample size per chain = 40000 Precision of halfwidth test = 0.1 $extendmore.out Stationarity start p-value test iteration mu passed 1 0.704 nu passed 1 0.783 sigma passed 1 0.443 y.new passed 1 0.241 Halfwidth Mean Halfwidth test mu passed 404.29 0.00627 nu passed 3.63 0.04512 sigma passed 3.86 0.01261 y.new passed 404.30 0.10553 1: Change precision 2: Return to diagnostics menu

Autocorrelations AUTOCORRELATIONS WITHIN EACH CHAIN: ============================== Iterations used = 1001:41000 Thinning interval = 1 Sample size per chain = 40000 $extendmore.out,, mu mu nu sigma y.new Lag 0 1.00000 0.06661 0.06035 0.03869 Lag 1 0.32200 0.06608 0.06023 0.01277 Lag 5 0.00159 0.04092 0.02698-0.00186 Lag 10 0.00402 0.02491 0.02840-0.00429 Lag 50 0.00377-0.00564 0.00483-0.00718

Autocorrelations,, nu mu nu sigma y.new Lag 0 0.0666 1.00000 0.51619 0.00234 Lag 1 0.0618 0.83617 0.51917 0.00298 Lag 5 0.0296 0.44756 0.30549-0.00168 Lag 10 0.0189 0.21468 0.14458-0.00799 Lag 50-0.0104 0.00158 0.00186-0.00049,, sigma,, y.new mu nu sigma y.new Lag 0 0.038686 0.002343-2.13e-03 1.00000 Lag 1 0.021490 0.002859 4.30e-04 0.00116 Lag 5 0.000316 0.001636-7.48e-03 0.00396 Lag 10 0.005483 0.002913-5.80e-03 0.00166 Lag 50 0.007340 0.000822 6.24e-05-0.00432 mu nu sigma y.new Lag 0 0.060349 0.51619 1.00000-0.002128 Lag 1 0.058392 0.51838 0.60252 0.004562 Lag 5 0.024566 0.31298 0.23634-0.005980 Lag 10 0.016039 0.15780 0.11083-0.002247 Lag 50-0.000554 0.00862-0.00481-0.000639

Autocorrelations

Cross-Correlations mu nu sigma y.new mu 1.0000 0.06661 0.06035 0.03869 nu 0.0666 1.00000 0.51619 0.00234 sigma 0.0603 0.51619 1.00000-0.00213 y.new 0.0387 0.00234-0.00213 1.00000

Cross-Correlations

Output Analysis To CODA τέλος μπορεί να μας δώσει και διάφορα γραφήματα ή περιγραφικά μέτρα των προσομοιωμένων τιμών τα οποία είναι ανάλογα με αυτά που μας δίνει και το WinBUGS.

Back to Autocorrelations * θ t Η χρονοσειρά καλείτε αυτοπαλινδρομική ανέλιξη τάξεως p (autoregressive process of order p - AR p ) αν: θ =αθ +... +α θ + e * * * t 1 t 1 p t p t σ 2. e με e t μία IID ανέλιξη μέσου 0 και διασποράς Η μερική συνάρτηση αυτοσυσχέτισης (partial autocorrelation function - PACF) υπολογίζει την * * συσχέτιση μεταξύ θ t και θ και μας βοηθάει να t + k προσδιορίσουμε την τάξη p. Για μία AR p η PACF στις υστερήσεις 1,..,p θα είναι σημαντικά διάφορη του 0, και κοντά στο 0 για υστερήσεις >p. Για το ν στο παράδειγμα μας μπορούμε να θεωρήσουμε ότι πρόκειται για AR 1 ανέλιξη με πρώτης τάξης αυτοσυσχέτιση περίπου r 1 = 0.836.

MCMC Accuracy Ας υποθέσουμε ότι είναι μια στάσιμη χρονοσειρά με μέσο μ θ και διασπορά σ 2 θ. Αν η παραπάνω χρονοσειρά είναι AR 1 με πρώτης τάξης αυτοσυσχέτιση ρ 1, μπορεί να αποδειχτεί ότι 2 * σ 1 1 V( ) θ +ρ θ =. m 1 ρ1 Άρα άμα θέλουμε να εκτιμήσουμε το μέσο μιας ποσότητας θ, με συγκεκριμένη ακρίβεια Τ, πρέπει ο αριθμός των επαναλήψεων m να ικανοποιεί την σχέση: * θ t 2 * σˆ 1+ ρ ˆ ˆ ˆ 1 σ 1+ρ1 θ θ SE( θ ) = Τ m. m 1 ˆ ˆ ρ1 T 1 ρ1

MCMC Accuracy Παρατηρούμε ότι για ρ1 1 έχουμε m. Για το ν για παράδειγμα έχουμε ˆρ 1 = r 1 και η δειγματική διασπορά είναι 1.161. Αν θέλουμε το Τ = 0.01 τότε: 2 1.161 1+ 0.836 m 150000. 0.01 1 0.836