ΧΩΡΙΚΑ ΚΡΥΜΜΕΝΑ ΜΑΡΚΟΒΙΑΝΑ ΜΟΝΤΕΛΑ POISSON, ΜΕ ΕΦΑΡΜΟΓΗ ΣΤΗ ΧΑΡΤΟΓΡΑΦΗΣΗ ΑΣΘΕΝΕΙΩΝ



Σχετικά έγγραφα
Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 5 ΕΠΙΛΟΓΗ ΧΩΡΙΚΩΝ ΟΝΤΟΤΗΤΩΝ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 7 ΧΩΡΙΚΕΣ ΑΝΑΛΥΣΕΙΣ

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 2 Η ΧΑΡΤΟΓΡΑΦΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ ΧΡΗΣΗ ΣΥΜΒΟΛΩΝ

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 1 ΞΕΚΙΝΩΝΤΑΣ ΜΕ ΤΟ ARCGIS - ΤΟ ARCMAP

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Δομές δεδομένων και ψηφιακή αναπαράσταση χωρικών φαινομένων

Μη μετρούμενες λεκάνες απορροής: Διερεύνηση στη λεκάνη του Πηνειού Θεσσαλίας, στη θέση Σαρακίνα

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 4 ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΠΙΝΑΚΕΣ

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 6 ΧΑΡΤΟΓΡΑΦΩΝΤΑΣ ΔΕΔΟΜΕΝΑ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Κεφάλαιο Τοπολογικές απεικονίσεις Αζιμουθιακή ισόχρονη απεικόνιση

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

Δειγματοληψία στην Ερευνα. Ετος

ΕΛΤΙΟ ΤΥΠΟΥ. Προσδόκιµο Ζωής και Υγείας 2012

Το Κεντρικό Οριακό Θεώρημα

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

ΕΦΑΡΜΟΓΕΣ ΓΕΩΓΡΑΦΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΩΝ ΣΤΗ ΔΙΑΧΕΙΡΙΣΗ ΔΕΔΟΜΕΝΩΝ ΕΡΓΑΣΤΗΡΙΩΝ ΕΛΕΓΧΟΥ ΠΟΙΟΤΗΤΑΣ ΝΕΡΩΝ

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Κωδικός μαθήματος: (ώρες):

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Το Κεντρικό Οριακό Θεώρημα

ΘΕΜΑ: «Χωρική κατανομή και Γεωστατιστική ανάλυση δεδομένων εντομολογικών προσβολών»

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Γεωγραφικά Συστήματα Πληροφοριών Τριμεταβλητές παράμετροι

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Ανάπτυξη Μοντέλου Εκτίμησης της Ποιότητας του Χάρτη

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Πολυτεχνείο Κρήτης Σχολή Ηλεκτρονικών Μηχανικών Και Μηχανικών Η/Υ. ΠΛΗ 513 Αυτόνομοι Πράκτορες

Μαρκοβιανές Αλυσίδες

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Μοντελοποίηση, Ανάλυση και Σχεδιασμός Στοχαστικών Συστημάτων

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΜΙΑ ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΤΩΝ ΜΑΘΗΤΩΝ ΕΝΟΣ ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ 2000 ΩΣ ΤΟ 2013.

Το Κεντρικό Οριακό Θεώρημα

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

Study of urban housing development projects: The general planning of Alexandria City

8ο Πανελλήνιο Συμποσιο Ωκεανογραφίας & Αλιείας 637

EM Baum-Welch. Step by Step the Baum-Welch Algorithm and its Application 2. HMM Baum-Welch. Baum-Welch. Baum-Welch Baum-Welch.

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Δειγματικές Κατανομές

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Επιµέλεια: Χρυσάνθη Παπαθανασοπούλου

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Μοντέλο πρόβλεψης αγοραίων αξιών ακινήτων βάσει των μεθόδων OLS και GWR με χρήση GIS Η περίπτωση του Δήμου Θεσσαλονίκης

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

ΠΩΣ ΕΠΗΡΕΑΖΕΙ Η ΜΕΡΑ ΤΗΣ ΕΒΔΟΜΑΔΑΣ ΤΙΣ ΑΠΟΔΟΣΕΙΣ ΤΩΝ ΜΕΤΟΧΩΝ ΠΡΙΝ ΚΑΙ ΜΕΤΑ ΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ

Επιδημιολογία. Ενότητα 1η: Εισαγωγή Ορισμοί, Αιτιολογία των Νοσημάτων. Προσπάθεια λογικής εξήγησης της εμφάνισης νόσου.

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 9 ΔΙΑΧΕΙΡΙΣΗ ΨΗΦΙΔΩΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Αρχές χαρτογραφικού γραφισμού (συμβατικές οπτικές μεταβλητές - δυναμικές οπτικές μεταβλητές) Βύρωνας Νάκος Καθηγητής Ε.Μ.Π. -

Η γεφύρωση της οικονομικής θεωρίας και της εφαρμοσμένης οικονομικής ανάλυσης: η χρησιμότητα μίας ενημερωμένης οικονομικής Βιβλιοθήκης

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Μεθοδολογία της έρευνας και Ιατρική στατιστική

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΑΓΡΟΝΟΜΩΝ ΚΑΙ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ. Σπύρος Τσιπίδης. Περίληψη διατριβής

3. Κατανομές πιθανότητας

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΡΟΛΟΓΟΣ...xi ΟΙ ΣΥΓΓΡΑΦΕΙΣ ΤΟΥ ΒΙΒΛΙΟΥ...xv ΚΕΦΑΛΑΙΟ 1 ΞΕΚΙΝΩΝΤΑΣ ΜΕ ΤΟ ARCGIS - ΤΟ ARCMAP... 1

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS)

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

HMY 220: Σήματα και Συστήματα Ι

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

ΚΑΤΑΣΚΕΥΗ ΠΙΝΑΚΩΝ ΚΑΙ ΣΧΗΜΑΤΩΝ ΣΤΟ ΔΟΚΙΜΙΟ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: Μερικές χρήσιμες(;) υποδείξεις. Βασίλης Παυλόπουλος

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

HMY 795: Αναγνώριση Προτύπων

Γεωργικός Πειραματισμός 1o Εργαστήριο «Διαδικασία της Τυχαιοποίησης»

Ανάλυση και Σχεδιασμός Μεταφορών Ι Δειγματοληψία - Μέθοδοι συλλογής στοιχείων

Transcript:

ΧΩΡΙΚΑ ΚΡΥΜΜΕΝΑ ΜΑΡΚΟΒΙΑΝΑ ΜΟΝΤΕΛΑ POISSON, ΜΕ ΕΦΑΡΜΟΓΗ ΣΤΗ ΧΑΡΤΟΓΡΑΦΗΣΗ ΑΣΘΕΝΕΙΩΝ Ανδρεόπουλος, Παναγιώτης 1,* 1 Υποψήφιος διδάκτωρ, Χαροκόπειο Πανεπιστήμιο, Τμήμα Γεωγραφίας, Ελ. Βενιζέλου 70, Καλλιθέα Αθήνα 17671, Τηλ. 6979241663, Email: pandreop@hua.gr Περίληψη: Στην παρούσα εργασία, γίνεται μία παρουσίαση της Μπεϋζιανής Συμπερασματολογίας για Χωρικά Κρυμμένα Μαρκοβιανά Μοντέλα Poisson διακριτού χρόνου και πεπερασμένου χώρου καταστάσεων, με εφαρμογή στη Χωρική Στατιστική και συγκεκριμένα στη Χαρτογράφηση Ασθενειών. Το θέμα προσεγγίζεται από στατιστικά μοντέλα όπως η μίξη Poisson κατανομών, η τεχνική αύξησης δεδομένων και ο αλγόριθμος Gibbs που αποτελεί μέρος της οικογένειας των MCMC αλγορίθμων. Το κύριο θέμα της εργασίας αυτής, συνδέει τις παραπάνω στατιστικές μεθόδους και τις εφαρμόζει στη Χαρτογράφηση Ασθενειών. Η μεθοδολογία, στηρίζεται αρχικά σε ένα μοντέλο προσομοίωσης. Το μοντέλο αυτό είναι σε θέση να προβλέψει μία νόσο, καθώς και τις πιθανότητες εξάπλωσής της στις γειτονικές περιοχές χωρίζοντας σε αντίστοιχες ζώνες επικινδυνότητας. Εν συνεχεία, λαμβάνοντας πραγματικά δεδομένα-κρούσματα θανάτων από καρκίνο της στοματικής κοιλότητας στην ευρύτερη περιοχή της Γαλλίας και με τη βοήθεια του μοντέλου αυτού καταμερίζουμε τα 94 Γαλλικά διαμερίσματα σε ζώνες επικινδυνότητας ως προς τη νόσο αυτή. Λέξεις Κλειδιά: Χαρτογράφηση Ασθενειών, Μπεϋζιανή Στατιστική, Προσομοίωση, Μοντέλα Potts, Χωρική Ανάλυση SPATIAL HIDDEN MARKOV MODELS POISSON, WITH APPLICATION IN DISEASE MAPPING Andreopoulos, Panagiotis 1,* 1 Phd Student,Harokopio University, Department of Geography, El. Venizelou 70, Kallithea Athens 17671, Tel. +30 6979241663, Email: pandreop@hua.gr Abstract In this diploma thesis, it is presented the Bayesian Inference for Spatial Hidden Markov Models Poisson in discrete time and finite state space, applying in Spatial Statistics and Disease Mapping. This subject has to do with statistical models like the mixing of Poisson allocations, the technical data augmentation and the description of algorithm Gibbs which is part of the MCMC algorithm family. The main part of this diploma thesis link the above statistical methods and apply them in Disease Mapping. Initially, methodology based on a simulation model. By this model, we can predict a disease and the possibilities of spreading to neighboring areas, having hazard zoning. Moreover, having veritably data cases of deaths from cancer of the oral cavity in the wider region of France and with the help of this model, we allocate 94 French departments in hazard zones for this disease. Key words: Disease Mapping, Bayesian Inference, Simulation, Potts models, Spatial statistic 1

1. Εισαγωγή Το άρθρο αυτό εστιάζεται στη Χωρική Στατιστική και πώς αυτή εφαρμόζεται στη Χαρτογράφηση Ασθενειών. Περιλαμβάνει στατιστικές τεχνικές που μελετούν οντότητες οι οποίες περιγράφουν τοπολογικές, γεωμετρικές ή γεωγραφικές ιδιότητες. Επίσης περιγράφονται τεχνικές που εφαρμόζονται σε δομές στην ανθρώπινη κλίμακα, κυρίως στην ανάλυση γεωγραφικών δεδομένων - τομέας όπου και θα αναπτύξουμε - και για να περιγράψουν δεδομένα της γεωστατιστικής. Κατά την ανάλυση το πρόβλημα που καλούμαστε να ξεπεράσουμε είναι το πρόβλημα του ορισμού της χωρικής θέσης των φορέων που μελετώνται. Για παράδειγμα, μία μελέτη σχετικά με την υγεία του ανθρώπου, θα μπορούσε να περιγράψει τη χωρική θέση των ανθρώπων στο χώρο σε σχέση με ένα σημείο, το σημείο αυτό θα μπορούσε να απεικονίζει τα μέρη όπου ζουν, ή όπου εργάζονται και ενώνοντας τα σημεία αυτά με μία γραμμή θα μπορούσαν να περιγραφούν τα εβδομαδιαία ταξίδια τους. Κάθε επιλογή οδηγεί σε διαφορετικές τεχνικές ανάλυσης οι οποίες καταλήγουν στα ανάλογα συμπεράσματα. Η χωρική στατιστική μπορεί ίσως να θεωρηθεί ότι έχει προκύψει από τις πρώτες απόπειρες χαρτογράφησης και αποτύπωσης γεγονότων σε πολλούς τομείς, οι οποίοι με τη σειρά τους συνέβαλαν στην περεταίρω εξέλιξή της. Για παράδειγμα, η Βιολογία χρησιμοποιώντας τη χωρική στατιστική, συνέβαλε με τη βοτανική στις μελέτες της παγκόσμιας κατανομής των φυτών, στις τοπικές παραγωγικές μονάδες, στις μετακινήσεις των ζώων, στις μελέτες βλάστησης και κυρίως στη μελέτη της δυναμικής του πληθυσμού ανά περιοχή. Η επιδημιολογία χαρτογράφησε και μελέτησε τις ασθένειες και ιδίως ο John Snow με το έργο του, σχήμα 1, γύρω από τη χαρτογράφηση σχετικά με το ξέσπασμα της χολέρας συνέβαλε στην εξάπλωση της στατιστικής στην καθημερινότητα. Σχήμα 1. Ο χάρτης από το Δρ John Snow του Λονδίνου, όπου δείχνει συστάδες των κρουσμάτων χολέρας στην ευρεία περίοδο του 1854 -ξέσπασμα χολέρας. Αυτή ήταν μία από τις πρώτες χρήσεις της χαρτογραφίας με βάση τη χωρική ανάλυση. Στο παρόν άρθρο, εφαρμόζεται η μέθοδος της Χωρικής δειγματοληψίας για τα δεδομένα μας. Όπου Χωρική δειγματοληψία είναι ο καθορισμός ενός περιορισμένου αριθμού θέσεων στο χώρο για τη μέτρηση φαινομένων που αποτελούν αντικείμενο της εξάρτησης και της ετερογένειας. Προσπαθώντας έτσι, να προβλέψουμε και να αποτυπώσουμε μέσω ενός μοντέλου προσομοίωσης τις πιθανότητες εξάπλωσης μιας νόσου στις γειτονικές περιοχές, χωρίζοντας παράλληλα τις περιοχές αυτές σε ζώνες επικινδυνότητας. Τα πληθυσμιακά δεδομένα που αναλύονται στο άρθρο αυτό, προέρχονται από την Στατιστική Υπηρεσία της Γαλλίας και αφορούν τα στοιχεία της απογραφής πληθυσμού της Γαλλίας το 1991. Η Χωρική ανάλυση των δεδομένων αυτών, αφορά τον καταμερισμό σε ζώνες επικινδυνότητας των 94 γαλλικών διαμερισμάτων, με τη βοήθεια ενός δείκτη θνησιμότητας (Peter J. Green and Sylvia Richardson, American Statistical Association 2002). Με τη βοήθεια του κώδικα Matlab εξάγονται τα αποτελέσματα για τα ίδια δεδομένα. Στη συνέχεια, λαμβάνοντας πραγματικά δεδομένα-κρούσματα θανάτων από καρκίνο της στοματικής κοιλότητας στην ευρύτερη περιοχή της Γαλλίας και με τη 2

βοήθεια του μοντέλου αυτού παρουσιάζουμε/απεικονίζουμε τα 94 Γαλλικά διαμερίσματα σε ζώνες επικινδυνότητας ως προς τη νόσο αυτή. Στα επόμενα κεφάλαια παρουσιάζονται αναλυτικά τα δεδομένα και η μεθοδολογία που χρησιμοποιήθηκε στο παρόν άρθρο. Τέλος, παρουσιάζονται και κάποια συμπεράσματα. 2. Τα «κρυμμένα» Μαρκοβιανά Μοντέλα (HMMs) στη Χαρτογράφηση ασθενειών Τα «κρυμμένα» Μαρκοβιανά Μοντέλα, είναι το είδος του στατιστικού προτύπου που χρησιμοποιούμε για να μοντελοποιήσουμε το πρόβλημά μας. Η μοντελοποίηση με βάση τα Κρυμμένα Μαρκοβιανά Μοντέλα (HMMs) είναι μία ισχυρή στατιστική τεχνική, κατάλληλη για τη μοντελοποίηση ακολουθιακών δεδομένων (sequential data), η οποία έχει αντικρύσει μεγάλο εύρος εφαρμογής στις περιοχές του γραπτού και προφορικού λόγου, καθώς και σε εφαρμογές μηχανικής μετάφρασης. Το πεδίο εφαρμογής του προτύπου αυτού στη Χαρτογράφηση ασθενειών είναι το κομμάτι που και μελετάται στο παρόν άρθρο. Εξετάζοντας το «κρυμμένο» Μαρκοβιανό Μοντέλο διακριτού χρόνου και πεπερασμένου χώρου καταστάσεων και θεωρώντας, t=1,2, μία ομογενή Μαρκοβιανή αλυσίδα διακριτού χρόνου, πεπερασμένου χώρου καταστάσεων, με πίνακα πιθανοτήτων μετάβασης 1 ης τάξης, όπου και με στάσιμη κατανομή. Έστω ακόμα μία στοχαστική διαδικασία διακριτού χρόνου, δηλαδή t=1,2, που εξαρτάται από την παραπάνω Μαρκοβιανή αλυσίδα με κάποιο μηχανισμό, ο οποίος θα μπορούσε να γραφεί ως για t=1,2, (1) Οι δύο παραπάνω στοχαστικές διαδικασίες «δουλεύουν» ταυτόχρονα. Είναι δηλαδή μία διπλά στοχαστική διαδικασία, η πραγματοποίηση της οποίας σχήμα 2, παρουσιάζεται ως εξής: Σχήμα 2. Γραφική απεικόνιση ενός κρυμμένου Μαρκοβιανού μοντέλου διακριτού χρόνου πεπερασμένου χρόνου καταστάσεων Το σύστημα αυτό, που περιλαμβάνει μία τέτοια στοχαστική διαδικασία, που δεν είναι παρατηρήσιμη (είναι κρυφή), αλλά παράγει μία παρατηρήσιμη ακολουθία εξόδων, λέγεται κρυμμένο Μαρκοβιανό μοντέλο, διακριτού χρόνου πεπερασμένου χώρου καταστάσεων (Discrete- Time State-Space Hidden Markov Model). Έτσι, ενώ σε ένα απλό Μαρκοβιανό μοντέλο άγνωστες είναι οι πιθανότητες μετάβασης, σε ένα κρυμμένο Μαρκοβιανό μοντέλο είναι άγνωστες και οι καταστάσεις. Δηλαδή, έχουμε παρατηρήσεις (γνωστές σε μας) οι οποίες παράγονται σε διακριτό χρόνο και εξαρτώνται από τις καταστάσεις (άγνωστες σε μας) μιας Μαρκοβιανής αλυσίδας. Τα δεδομένα που χρησιμοποιούμε για την μοντελοποίηση του προβλήματος της Χαρτογράφησης ασθενειών, ακολουθούν μίξη Poisson κατανομών. Εξηγώντας με ένα πολύ απλό παράδειγμα, έστω η Μαρκοβιανή αλυσίδα για t=1,2,,t με χώρο καταστάσεων, στάσιμη κατανομή και πίνακα πιθανοτήτων μετάβασης 1 ης τάξης με (2) Αν η ακολουθεί την, κάτι που συμβαίνει με πιθανότητα, για και τότε έχουμε ένα Κρυμμένο Μαρκοβιανό μοντέλο. 3

Αφήνοντας για λίγο το Μαθηματικό κομμάτι του παρόντος άρθρου και περνώντας στο πεδίο της Χαρτογράφησης ασθενειών, παρατηρούμε τα τελευταία κυρίως χρόνια μία έκρηξη επιστημονικού ενδιαφέροντος στη διεθνή κυρίως βιβλιογραφία (Goodchild, (1985), Tomlin, (1990)), αλλά και στην ελληνική (Κουτσόπουλος (2002)) γύρω από το θέμα αυτό. Η Χαρτογράφηση ασθενειών, περιλαμβάνει χωρικά στοιχεία και μεθόδους που κυμαίνονται από την απλή απεικόνιση ως τις προηγμένες στατιστικές. Η μελέτη της γεωγραφίας των ασθενειών διατυπώνεται στενά ως ένα πεδίο της ιατρικής ή της γεωγραφίας, όπου και στα δύο θεμέλιο λίθο αποτελεί η Στατιστική Ανάλυση. Στην πραγματικότητα, η «χαρτογράφηση ασθενειών» είναι ένα πολυδιάστατο γνωστικό αντικείμενο που προσεγγίζει την κατεύθυνση της κατανόησης των μηχανισμών μέσω των οποίων συνδέονται τα προβλήματα της ανθρώπινης υγείας στο χώρο. Η «χαρτογράφηση ασθενειών», απεικονίζει τα αποτελέσματα των ερευνών για την ανθρώπινη υγεία σε χάρτες, οι οποίοι αφορούν σε μία ειδική κατηγορία θεματικών χαρτογραφικών απεικονίσεων. Ένας παράγοντας, που εξειδικεύει τις μεθόδους της χαρτογράφησης στην ιατρική γεωγραφία, είναι οι ιδιαιτερότητες, που άπτονται στην προσέγγιση της σχέσης γεωγραφικός χώρος και ανθρώπινη υγεία (Medical Geography, Gesler 1986). Τα Συστήματα Γεωγραφικών Πληροφοριών (Σ.Γ.Π. - Geographic Information System, GIS), αποτελούν ένα ισχυρό εργαλείο για τη μελέτη της χαρτογράφησης ασθενειών. Πιο απλά, τα GIS, είναι ένα ολοκληρωμένο σύστημα συλλογής, αποθήκευσης, διαχείρισης, ανάλυσης και απόδοσης πληροφορίας σχετικής με φαινόμενα που εξελίσσονται στο χώρο (Goodchild, 2011). Στο σχήμα 3, φαίνεται ο τρόπος απεικόνισης των διαφόρων επιπέδων για να παραχθεί το τελικό αποτέλεσμα της μελέτης. Σχήμα 3. Χαρτογραφικά επίπεδα Τελικό αποτέλεσμα απεικόνισης πριν την οποιαδήποτε ανάλυση. Το επίπεδο πελάτες (customers) περιέχει σημεία, το επίπεδο "δρόμοι" (streets) περιέχει γραμμές και το επίπεδο "δέματα" (parcels) περιέχει πολύγωνα. Όλα αυτά είναι διανυσματικά στρώματα. Από την άλλη πλευρά, τα στρώματα "υψόμετρο" (elevation) και "χρήση γης" (land use) είναι στρώματα σε πλέγμα και προέρχονται από την επεξεργασία εικόνων τηλεπισκόπισης. Ουσιαστικά, ο ερευνητής προσθέτει ότι είδος πληροφορίας επιθυμεί, όπως επίπτωση, συχνότητα μιας ασθένειας και οποιοδήποτε επιδημιολογικό δείκτη ή μέτρο κρίνεται απαραίτητο για την απεικόνιση, συσχέτιση και ευρύτερη ανάλυση. 3. Μεθοδολογία Περνώντας τώρα στην εφαρμογή των «κρυμμένων» Μαρκοβιανών Μοντέλων στη Χαρτογράφηση ασθενειών, όταν οι πληροφορίες μας προέρχονται από Poisson δεδομένα. Για τη μελέτη και ανάγνωση ενός πίνακα, μιας χωρικής περιοχής, χρησιμοποιούνται τα Potts models. Είναι ένα μαθηματικό εργαλείο παρουσίασης μελέτης δεδομένων, για πολυσύνθετα χωρικά συστήματα, βασισμένο στις κοντινότερες αλληλεπιδράσεις γειτόνων. Το μοντέλο Potts είναι σε θέση να ερευνήσει πώς τα εσωτερικά στοιχεία μιας ομάδας (αναφερόμαστε κυρίως σε ομάδες στο χώρο π.χ. γεωγραφικά διαμερίσματα, κτιριακές εγκαταστάσεις κλπ) αντιδρούν με τον έναν ή τον άλλον τρόπο, βασισμένο σε ορισμένα χαρακτηριστικά που κάθε στοιχείο έχει. Η δομή των 4

μοντέλων Potts δίνει τη δυνατότητα της έρευνας των εσωτερικών στοιχείων ενός σύνθετου προβλήματος γειτνίασης και τη δυνατότητα να προβλέψουμε πώς αυτά θα αλληλεπιδράσουν μεταξύ τους, ώστε εντέλει να μπορέσουμε να καθορίσουμε τη γενική συμπεριφορά της ομάδας - γειτονιάς. Δηλαδή, το μοντέλο μελετά τα μικροσκοπικά εσωτερικά στοιχεία και με βάση τις αλληλεπιδράσεις τους, μας δίνει μια πιθανή μακροσκοπική έκβαση που μπορεί να παρατηρηθεί με την πάροδο του χρόνου. 3.1 Επιλογή του Χωρικού μοντέλου Οι μετρήσεις μας, που είναι το πλήθος των κρουσμάτων γύρω από μία ασθένεια για μία συγκεκριμένη περιοχή, θεωρούμε ότι είναι τυχαία μεταβλητή που ακολουθεί κατανομή Poisson. Το συμπέρασμα που θα προκύψει από την επεξεργασία, εκτελείται μέσα σε ένα Μπεϋζιανό πλαίσιο εφαρμογής, με βάση τη μέθοδο Markov Chain Monte Carlo. Η μελέτη μας εστιάζεται σε επιδημιολογικές εφαρμογές, πάνω σε δεδομένα για μία σπάνια μορφή καρκίνου στη Γαλλία. Στην έρευνά μας ενδιαφερόμαστε για τα χαρακτηριστικά γνωρίσματα των Κρυφών Μαρκοβιανών Μοντέλων και πως αυτά υιοθετούνται στον τομέα της χαρτογράφησης ασθενειών. Οδηγός για την έρευνά μας αυτή ήταν το επιστημονικό άρθρο των Peter J. Green και Sylvia Richardson που δημοσιεύθηκε το 2002 από την Αμερικάνικη Στατιστική Υπηρεσία, με τίτλο: «Hidden Markov Models and Disease Mapping» για την ευρύτερη περιοχή της Γαλλίας. Στην ανάπτυξη της Μπεϋζιανής προσέγγισής μας, εξετάζουμε ένα μοντέλο Poisson στην απλή μορφή: για (3) όπου, ο δείκτης της κάθε περιοχής, είναι το παρατηρούμενο πλήθος επιπτώσεων ή θανάτων ασθενειών στην περιοχή, είναι μία σταθερά, που καθορίζει το μέγεθος πληθυσμών και είναι μια τιμή σχετική με τη μεταβλητή κινδύνου, όπου είναι και ο κύριος στόχος του συμπεράσματός μας (ζητούμενο). Χρησιμοποιώντας τον όρο «κίνδυνος» αναφερόμαστε στο ρυθμό γεγονότων κρουσμάτων ανά πληθυσμιακή μονάδα. Στη συνέχεια, εξετάζουμε τα για της σχέσης (3) και τι επίδραση μπορεί να έχει αυτό στα αποτελέσματα των Poisson δεδομένων. Τα ακολουθούν μίξη Poisson, ενώ τα παίρνουν τιμές από ένα πεπερασμένο σύνολο όπως στη μίξη Poisson κατανομών. Όμως εδώ, η Κρυμμένη διαδικασία που καθορίζει από ποια συνιστώσα έρχεται κάθε περιοχή, ακολουθεί το μοντέλο Potts και έτσι οι είναι οι κρυφές μεταβλητές της κατανομής που λαμβάνουν τιμές, όπου k τα διαφορετικά τμήματα επικινδυνότητας. Ακολουθούμε δηλαδή τη μέθοδο της αύξησης δεδομένων (data augmentation). Επισημαίνεται ότι οι ιδιαιτερότητες της εκ των προτέρων δεν επιβάλλονται στην εκ των υστέρων συμπερασματολογία μας, υπό την έννοια ότι οποιοδήποτε μοντέλο μπορεί να μας παρέχει μία ομαλή εκτίμηση κινδύνου. Βασικό στοιχείο της προσέγγισής μας βρίσκεται στην εκτίμηση των Κρυμμένων μεταβλητών της, που υποδεικνύει από ποια συνιστώσα της μίξης (δηλαδή από ποιο βαθμό επικινδυνότητας) προέρχεται η κάθε περιοχή. Τα διαμορφώνονται με την από κοινού κατανομή, ως εξής: Όπου παράμετρος που θεωρούμε σταθερή. Παίρνει τιμές, όσο πιο κοντά στο 0, τόσο μεγαλύτερος ο βαθμός εξάρτησης. όπου (4) και, είναι δύο περιοχές που όταν συνδέονται με τις σχέσεις με ή τότε θα τις λέμε γειτονικές 5

Τελικά, η από κοινού κατανομή μας, δίνεται ως ακολούθως: (6) όπου σταθερό σταθερό για (5) και το ζητούμενο. Χρησιμοποιώντας τις MCMC μεθόδους, κάνουμε Μπεϋζιανή συμπερασματολογία για τα Χωρικά Κρυμμένα Μαρκοβιανά μοντέλα Poisson, όπου προσομοιώνουμε ακολουθιακά και επαναληπτικά τις ποσότητες λ και z. Τα z από την από κοινού posterior και τα λ χρησιμοποιώντας βήμα Metropolis-Hasting. Τελικώς, η πιθανότητα αποδοχής για τη συμπλήρωση όλων των ανανεώσεων, διαμορφώνεται από την εκ των προτέρων αναλογία (7) Και εφαρμόζοντας μετασχηματισμό λογαρίθμου, λαμβάνουμε τελικώς:. (8) 3.2 Εφαρμογή σε Προσομοιωμένα δεδομένα Στο κομμάτι αυτό, ερευνούμε τα ιδιαίτερα χαρακτηριστικά γνωρίσματα του μοντέλου μας και της απόδοσής του. Για το σκοπό αυτό, χρησιμοποιούμε το χωρικό σχεδιάγραμμα των 94 γαλλικών διαμερισμάτων στο σύνολο της ηπειρωτικής χώρας. Για να εξετάσουμε τα διαφορετικά χαρακτηριστικά του μοντέλου μας, παράγουμε τρία σύνολα δεδομένων που αντιστοιχούν στα αντιπαραβαλλόμενα γεωγραφικά χαρακτηριστικά γνωρίσματα, υπό τους προσομοιωμένους κινδύνους. Ειδικότερα, ως «Block4» αναφέρεται η χωρική δομή όπου η μεταβλητή λαμβάνει τιμή γενικά, ενώ τέσσερις ομάδες περιοχών λαμβάνουν τιμή του ίση με 1.5. Αυτές οι τέσσερις ομάδες περιοχών αποτελούνται από μία ενιαία πληθυσμιακά περιοχή, από μία ομάδα πέντε αγροτικών διαμερισμάτων και από δύο περιοχές εκ των οποίων η μία είναι στο βορρά και η άλλη στο νότο (σχήμα 4). Ως «Βορράς Νότος» αναφέρεται η χωρική δομή όπου η μεταβλητή που λαμβάνει τιμή περιορίζεται στις περιοχές του βόρειου τμήματος της Γαλλίας, ενώ για τις περιοχές του νότιου τμήματος η μεταβλητή λαμβάνει τιμή (σχήμα 5). Τέλος, χωρίζουμε την ευρύτερη περιοχή της Γαλλίας σε τρεις οριζόντιες ζώνες επικινδυνότητας, όπου η μεταβλητή που λαμβάνει τιμή περιορίζεται στο βόρειο τμήμα, η μεταβλητή που λαμβάνει τιμή περιορίζεται στο κεντρικό τμήμα και η μεταβλητή που λαμβάνει τιμή περιορίζεται στο νότιο τμήμα (3 η ζώνη). 6

Σχήμα 4. «Block4», Peter J. Green and Richardson 2002 Σχήμα 5. «Βορράς Νότος», παρούσα μελέτη Στα παραπάνω σχήματα 4 και 5 απεικονίζεται η κατανομή των τιμών του στην περιοχή της Γαλλίας σύμφωνα με τις τιμές που προαναφέραμε. Φαίνονται καθαρά και τα 94 γεωγραφικά διαμερίσματα, ενώ οι αποχρώσεις του γκρι και του μαύρου δείχνουν με λεπτομέρεια τις διαβαθμίσεις των τιμών του. Όλα τα αποτελέσματα αντιστοιχούν σε τρέξιμο 100.000 κύκλων του αλγορίθμου όταν και. Η απόδοση της μίξης ήταν ικανοποιητική, με τα ποσοστά περίπου 10% αποδοχής, εκτός από περιπτώσεις όπου τα στοιχεία υποστηρίζουν ένα χαμηλό αριθμό δεδομένων. Το κύριο ενδιαφέρον μας είναι στη χωρική μεταβλητή με βάση τις εκ των υστέρων πιθανότητες. Η κεντρική ιδέα της προσομοίωσης ήταν για τα συγκεκριμένα και και έχοντας τους συντελεστές πληθυσμού για κάθε περιοχή, να προσομοιώσουμε τα για της κάθε περιοχής, δηλαδή τις παρατηρούμενες τιμές κρουσμάτων, από την κατανομή, όπου τα παρατηρούμενα SMRs θα δίνονται από το πηλίκο. Για το σχήμα «Block4»: Με χρήση κώδικα Matlab λαμβάνουμε όλα τα ακόλουθα αποτελέσματα: παίρνουμε μία εκ των υστέρων μέση τιμή για το με τυπική απόκλιση και για το με τυπική απόκλιση 0.0942, αντίστοιχα. Οι 83 από τις 94 περιοχές που εξετάσαμε κατατάχθηκαν στην πρώτη κατηγορία με και οι υπόλοιπες στη δεύτερη με. Το συμπέρασμα αυτό προέκυψε από τον πίνακα των που λάβαμε κατά την εφαρμογή του αλγορίθμου. Δηλαδή το ποσοστό κατανομής των είναι υπέρ του, όπως και αναμενόταν. Το χρονόγραμμα για τον διαχωρισμό των λ στο δείγμα των 94 περιοχών απεικονίζεται στο σχήμα 7. Για το σχήμα «Βορράς Νότος»: Παίρνουμε μία εκ των υστέρων μέση τιμή για το με τυπική απόκλιση και για το με τυπική απόκλιση 0.0347, αντίστοιχα. Οι 49 από τις 94 περιοχές που εξετάσαμε κατατάχθηκαν στην πρώτη κατηγορία με (Βορράς) και οι υπόλοιπες στη δεύτερη με (Νότος). Το συμπέρασμα αυτό προέκυψε από τον πίνακα των που λάβαμε κατά την εφαρμογή του αλγορίθμου, όπου το ποσοστό κατανομής των είναι υπέρ του.το αντίστοιχο χρονόγραμμα για τον διαχωρισμό των λ στο δείγμα των 94 περιοχών απεικονίζεται στο σχήμα 8. Για το σχήμα των «τριών ζωνών»: Παίρνουμε μία εκ των υστέρων μέση τιμή για το λ με τυπική απόκλιση, για το με τυπική απόκλιση 0.0652 και για το με τυπική απόκλιση 0.0436, αντίστοιχα. Θεωρώντας αυτή τη φορά ότι το. Οι 53 από τις 94 περιοχές που εξετάσαμε κατατάχθηκαν στην πρώτη κατηγορία με (Βορράς), οι 10 από τις 94 στη δεύτερη κατηγορία (Κεντρικό τμήμα) και οι υπόλοιπες στην τρίτη με (Νότος). Το 7

συμπέρασμα αυτό προέκυψε από τον πίνακα των που λάβαμε κατά την εφαρμογή του αλγορίθμου. Ομοίως, το χρονόγραμμα για τον διαχωρισμό των λ στο δείγμα των 94 περιοχών, φαίνεται στο σχήμα 9. 2 1.8 1.6 1.4 1.2 1 0.8 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Σχήμα 7. Το χρονόγραμμα από τις εκ των υστέρων τιμές των (με μπλέ) και (με πράσινο). Ακολουθούν τα χρονογράμματα από τις εκ των υστέρων τιμές των λ (με μπλέ) και λ (με πράσινο) στο σχήμα 8 και τα χρονογράμματα από τις εκ των υστέρων τιμές των λ (με μπλέ), λ (με πράσινο) και λ (με κόκκινο), στο σχήμα 9. 2 1.8 1.6 1.4 1.2 1 0.8 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Σχήμα 8. Το χρονόγραμμα από τις εκ των υστέρων τιμές των (με μπλέ) και (με πράσινο). 8

1.7 1.6 1.5 1.4 1.3 1.2 1.1 1 0.9 0.8 0.7 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Σχήμα 9. Το χρονόγραμμα από τις εκ των υστέρων τιμές των (με μπλέ), (με πράσινο) και (με κόκκινο) 3.3 Εφαρμογή σε Πραγματικά δεδομένα Τα δεδομένα μας, προέρχονται από παρατηρήσεις κρούσματα θανάτων από καρκίνο της στοματικής κοιλότητας και η ερευνά μας εστιάζεται στην ευρύτερη περιοχή της Γαλλίας. Τα αποτελέσματά μας αντιστοιχούν σε ένα τρέξιμο 100.000 κύκλων του αλγορίθμου μας όταν το (όπου το πλήθος των κατηγοριών που χωρίζουμε το δείγμα μας, ανάλογα με το βαθμό επικινδυνότητας). Μετά από έναν ικανό αριθμό επαναλήψεων παίρνουμε μία εκ των υστέρων μέση τιμή για το και για το, αντίστοιχα. Εξετάζοντας για ορισμένες περιοχές της Γαλλίας μπορούμε να προβλέψουμε, με βάση τα παραπάνω στοιχεία, σε τι βαθμό επικινδυνότητας μπορούμε να την κατατάξουμε. Επιλέγουμε τυχαία την περιοχή Indre - et - Loir της Γαλλίας και λαμβάνουμε το παρακάτω ιστόγραμμα, σχήμα 10, όπου μπορούμε να συμπεράνουμε ότι από τις 10.000 φορές τρεξίματος του αλγορίθμου μας, τις 6480 φορές ( ) κατατάχθηκε στη δεύτερη κατηγορία επικινδυνότητας, ( ) με τον υψηλό συντελεστή. Αποτέλεσμα που μας δείχνει ότι η περιοχή αυτή παρουσιάζει γενικά υψηλό συντελεστή θνησιμότητας. Ομοίως εξετάζουμε και την περιοχή Aveyron, σχήμα 11, δείχνοντας ότι σε αυτή την περιοχή ο λόγος θνησιμότητας είναι χαμηλός. Με τον ίδιο τρόπο ελέγχουμε όλα τα γεωγραφικά διαμερίσματα της Γαλλίας. 4500 4000 3500 3000 2500 2000 1500 1000 500 0 0.7 0.8 0.9 1 1.1 1.2 Σχήμα 10. Υψηλός συντελεστής θνησιμότητας 9

3500 3000 2500 2000 1500 1000 500 0 0.7 0.8 0.9 1 1.1 1.2 Σχήμα 11. Ο λόγος θνησιμότητας είναι χαμηλός Τα όσα συμπεράσματα παρουσιάσαμε παραπάνω, μπορούν πολύ εύκολα να διευρυνθούν αν αυξήσουμε τις κατηγορίες που κατατάσσουμε το λόγο θνησιμότητας. Εξετάζοντας την περίπτωση που το, τα αποτελέσματά μας, αντιστοιχούν σε ένα τρέξιμο 100.000 κύκλων του αλγορίθμου. Μετά δηλαδή από έναν ικανό αριθμό επαναλήψεων παίρνουμε μία εκ των υστέρων μέση τιμή για τα, και αντίστοιχα. Αν τώρα επιλέξουμε μία άλλη περιοχή, για παράδειγμα την Yonne, σχήμα 12, παρατηρούμε ότι ο λόγος θνησιμότητας για τον καρκίνο της στοματικής κοιλότητας «μοιράζεται» και στις τρεις κατηγορίες, με μία τάση μετακίνησης στη 2 η κατηγορία επικινδυνότητας, σε ποσοστό 6000 5000 4000 Bin Count: 5.33e+003 Bin Center: 1.9 Bin Edges: [1.8, 2] 3000 2000 1000 Bin Count: 8 Bin Center: 1.1 Bin Edges: [-Inf, 1.2] 0 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 Σχήμα 12. Οριακή κατάταξη λόγου θνησιμότητας στη δεύτερη κατηγορία 4. Συμπεράσματα Από την παραπάνω ανάλυση, σε προσομοιωμένα και σε πραγματικά δεδομένα, γίνεται σαφές ότι το ναι μεν δείχνει την «επικινδυνότητα» μιας περιοχής από μόνο του δε μας εξασφαλίζει όμως αναλογικά το πλήθος των παρατηρήσεων/αναμενόμενα κρούσματα για την περιοχή αυτή. Δηλαδή την πρόβλεψη πως όσο μεγαλύτερη είναι η τιμή του τόσο πιο μεγάλη θα είναι και η τιμή του πλήθους των κρουσμάτων της περιοχής, αν και σε πρώτη ανάγνωση προς τα εκεί οδηγείται ο ερευνητής. Αλλά αντίθετα, ο συνδυασμός του με τα (όπου ο συντελεστής αναλογίας πληθυσμού) μας δίνουν τελικά τη ζητούμενη πρόβλεψη. Συγκεκριμένα το γινόμενο μας δίνει τον ρυθμό εμφάνισης κρουσμάτων μέσω της Poisson κατανομής και από εκεί εξάγονται τα διάφορα συμπεράσματά μας. Το αξιοσημείωτο είναι, πως θα μπορούσαμε να έχουμε χαμηλό συντελεστή για μια περιοχή, αλλά η αναλογία πληθυσμού ( ) για τη συγκεκριμένη περιοχή να είναι αρκετά μεγάλη με αποτέλεσμα το γινόμενο των δύο τιμών και τελικώς ο ρυθμός Poisson να μας δώσουν ένα πλήθος κρουσμάτων αρκετά μεγαλύτερο από μία άλλη περιοχή σύγκρισης που θα συνέβαινε το αντίστροφο (υψηλό και χαμηλή αναλογία πληθυσμού ). Παρόλα αυτά, στη χωρική στατιστική και πιο ρεαλιστικά στην καθημερινότητά μας, ένας υψηλός δείκτης θνησιμότητας σε μία γεωγραφική περιοχή δε θεωρείται καθόλου αμελητέος παράγοντας. 10

Έχει επιπτώσεις σε διάφορους κοινωνικούς, οικονομικούς και τεχνικούς τομείς, που χρήζουν ιδιαίτερης προσοχής από τους διάφορους φορείς που δραστηριοποιούνται στην κάθε περιοχή που εξετάζεται. Kοιτώντας τα διάφορα στοιχεία από το Εθνικό Σύστημα Υγείας της Γαλλίας (με την αρίθμηση των γεωγραφικών διαμερισμάτων της να χρονολογείται από το 1990), τα βασικά συμπεράσματα που προέκυψαν έδειξαν ότι οι δείκτες θνησιμότητας παρουσίασαν μία αυξητική τάση από τη στιγμή που άρχισαν εσωτερικές μεταναστεύσεις των κατοίκων από τις μεγάλες πόλεις στις μικρότερες (για ανεύρεση εργασίας) -όπου υπήρχαν εργοστάσια- λόγω του κορεσμού σε εργασίες που έχει αγγίξει τις μεγαλουπόλεις. Το αξιοσημείωτο είναι ότι για πολλές δεκαετίες θεωρούνταν υπεύθυνοι για την έξαρση των ασθενειών τα εξωτερικά μεταναστευτικά ρεύματα που εισέρχονταν στη χώρα. Τώρα όμως διαπιστώνουμε ότι και η εσωτερική μετανάστευση επηρεάζει τους δείκτες. 5. Βιβλιογραφία Ελληνική Απεικονίσεις χαρτών, Ινστιτούτα Γεωγραφικής Ανάλυσης & Μελέτης Γαλλίας (5/2007). Κουτσόπουλος, Κ. (2002), Γεωγραφικά συστήματα πληροφοριών & ανάλυση χώρου, Εκδόσεις Παπασωτηρίου, Αθήνα. Νάκος, Β. (2006), Στατιστικά Δείγματα και Χαρτομετρία, Εθνικό Μετσόβιο Πολυτεχνείο, Αθήνα Παπαϊωάννου Τ. (1997), Θεωρία Πιθανοτήτων και Στατιστικής, Ιωάννινα. Τσάτσαρης, Α. και Ι. Κάτσιος, Μ. Δημητράκης, Ρ. Ντούβαλη, Γεωγραφικός χώρος & Ασθένειες (Έρευνες Διατριβές). Διεθνής Administration territorial de la France (2009). Baum (1972), The Forward Backward Algorithm, Volume 3, Issue 6, pp: 369-373. Bernado, J.M. and Smith, A.F.M. (1994). Bayesian Theory, Wiley, Chichester. Bernardinelli, L. (1995) Statistics in Medecine, American Journal of Epidemiology (Disease Mapping), Volume 14, Issue 21-22, pp. 2411-2431. Diggle, P.J., Spatial Analyses of Spatial Point Patterns, Journal of the Royal Statistical Society 1996, Spatial Statistic, Professor of Statistics Lancaster University. Ferrnhead, P. and Meligkotsidou, L. (2004). Exact filtering for partially observed continuous time models. Journal of the Royal Statistical Society, series B. Gelman et al. (1995) & Carlin and Louis (1996), Practical applications on MCMC, Volume 60, Series B, pp: 176-195. Gesler (1986), Medical Geography, Volume 23, Issue 10, pp: 963-973 Goodchild (1985), Geographic Information System (GIS), Volume 6, pp: 31-45. Green, P. J. and S. Richardson (2002), Hidden Markov Models and Disease Mapping, American Statistical Association. Greenwood and Yule (1920), "The Statistics of Anti-Typhoid and Anti-Cholera Inoculations, and the Interpretation of such Statistics in General", Proceedings of the Royal Society of Medicine (Epidemiology). Graham J. Upton & Bernard Fingelton: Spatial Data Analysis by Example Volume 1: Point Pattern and Quantitative Data. John Wiley & Sons, New York. 1985. Meligkotsidou Loukia, Bayesian Inference, Athens 2008, (in greek). National Center for Geographic Information and Analysis, 1990 Scott, S.L. (2002) Bayesian Methods for Hidden Markov Models: Recursive computing in the 21 th century. Snow, J. (1978), Public health research, Volume 47, No 9, pp: 1181-1188 Koutsourelis, A., Bayesian Inference for Hidden Markov Models with Applications in Financial Econometrics, Lancaster 2006. Tomlin, (1990) Geographic Information systems and cartographic modeling, Volume 6, Issue 1, pp: 31-45 11