ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΥΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 3 ΧΡΗΣΗ ΠΡΟΓΡΑΜΜΑΤΟΣ MSBNx ΓΙΑ ΤΗ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΥΓΕΙΑΣ ΜΕ ΙΚΤΥΑ BAYES ΕΠΙΜΕΛΕΙΑ: ΗΛΙΑΣ ΖΑΦΕΙΡΟΠΟΥΛΟΣ 1
Σκοπός της συγκεκριµένης εργαστηριακής άσκησης είναι η παρουσίαση σύγχρονων µεθόδων µοντελοποίησης πληροφοριακών συστηµάτων υγείας µε χρήση πιθανοτικών µοντέλων, όπως είναι τα δίκτυα Bayes. Για την ανάπτυξη των µοντέλων θα χρησιµοποιηθεί το λογισµικό MSBNx, που έχει αναπτυχθεί από τη Microsoft και διατίθεται στο διαδίκτυο δωρεάν για εκπαιδευτικούς σκοπούς. Το πρόγραµµα αυτό περιλαµβάνει ένα µεγάλο αριθµό µεθόδων και δυνατοτήτων ανάπτυξης µοντέλων, χρησιµοποιώντας ένα εύχρηστο και λειτουργικό περιβάλλον εργασίας. Κατά τη διάρκεια της παρούσας εργαστηριακής άσκησης θα παρουσιαστούν συνοπτικά οι βασικότερες λειτουργίες του προγράµµατος MSBNx, αναπτύσσοντας πιθανοτικά µοντέλα δικτύων Bayes σε Πληροφοριακά Συστήµατα Υγείας. Εισαγωγή-Γενικά Χαρακτηριστικά Προγράµµατος Το λογισµικό MSBNx βρίσκεται στο διαδίκτυο στην ηλεκτρονική διεύθυνση: http://research.microsoft.com/adapt/msbnx/ Με την εγκατάσταση του προγράµµατος, η εκκίνηση γίνεται επιλέγοντας Εναρξη>Προγράµµατα>MSBNx Ας περιεργαστούµε ένα υπάρχον δίκτυο Bayes για να αντιληφθούµε τις βασικές λειτουργίες του προγράµµατος. Επιλέγουµε File>Open και στο φάκελο MSBNx>Samples>Networks το αρχείο cancer.xbn. Παρατηρούµε το µοντέλο που εικονίζεται και προσπαθούµε να εκτιµήσουµε τις µεταβλητές και αλληλεξαρτήσεις που εικονίζονται. 2
Στη µεταβλητή a κάνουµε δεξί κλικ και επιλέγουµε States & Properties. Παρατηρούµε ότι η µεταβλητή a έχει ως περιγραφή «Μεταστατικό καρκίνο». Η µεταβλητή αυτή έχει 2 πιθανές καταστάσεις («υπάρχει», «δεν υπάρχει»). 1) Στην αναφορά που θα παραδώσετε συµπεριλάβετε screenshots όπως το παραπάνω από τις υπόλοιπες µεταβλητές του δικτύου. Στη συνέχεια, σχεδιάστε απλά (πχ µε το Word) το δίκτυο γράφοντας εντός των κόµβων τις περιγραφές των µεταβλητών. Στη συνέχεια επιλέγουµε τη µεταβλητή a και επιλέγουµε το πλήκτρο µε τις µπάρες 3
Τότε εµφανίζεται το ακόλουθο παράθυρο µε τις πιθανότητες εµφάνισης των δύο καταστάσεων της µεταβλητής a (0,2 και 0,8 για τις καταστάσεις «υπάρχει», «δεν υπάρχει» αντίστοιχα). 2) Συµπεριλάβετε στην αναφορά screenshots όπως το παραπάνω από τις αντίστοιχες οθόνες για τις υπόλοιπες µεταβλητές του δικτύου. Χαρακτηρίστε ποιες είναι οι µεταβλητές «γονείς» και «παιδιά» και σχολιάστε τους πίνακες πιθανοτήτων. Υπολογισµοί: Εκ των προτέρων και εκ των υστέρων πιθανότητες Για την εκτέλεση των υπολογισµών επιλέγουµε το κουµπί Σ από τη γραµµή εργαλείων 4
Τσεκάροντας τα κουτιά των µεταβλητών εµφανίζονται δεξιά οι τιµές των εκ των προτέρων πιθανοτήτων όλων των µεταβλητών µε λεζάντες τις περιγραφές των µεταβλητών. Ας επηρεάσουµε λίγο τις πιθανότητες του µεταστατικού καρκίνου να δούµε πως θα επηρεαστούν οι υπόλοιπες πιθανότητες. Πηγαίνοντας πίσω στο δίκτυο από το µενού Window > Belief Network επιλέγουµε τη µεταβλητή a,κατόπιν το κουµπί µε τις µπάρες, επιλέγουµε την τιµή του present από 0,2 σε 0,5 και κλικάρουµε δίπλα την τιµή του absent η οποία µεταβάλλεται αυτόµατα σε 0,5 ώστε το άθροισµα να ισούται µε ένα. 5
Παρατηρούµε ότι κάποιες µεταβλητές µεταβλήθηκαν σηµαντικά κάποιες άλλες όχι. Για παράδειγµα, η σχετική µεταβολή που επιβάλλαµε εµείς στη µεταβλητή a (µεταστατικό καρκίνο) είναι κατά απόλυτη τιµή : (τιµή πριν)-(τιµή µετά) /τιµή πριν δηλαδή, 0,2-0,5 /0,2=150%, ενώ η αντίστοιχη µεταβολή της µεταβλητής b είναι 0.32-0,5 /0,32=56,25%. 3) Μεταβάλετε την πιθανότητα της µεταβλητής a να είναι present σε 0,35 και υπολογίστε τις νέες τιµές των µεταβλητών του δικτύου. Συµπεριλάβετε το screenshot των αποτελεσµάτων και υπολογίστε για κάθε µεταβλητή την σχετική µεταβολή της πιθανότητας της κατάστασης present. Ας εισάγουµε τώρα κάποια «γνώση» στο δίκτυο Bayes και να δούµε πως µεταβάλλονται οι πιθανότητες των καταστάσεων για τις µεταβλητές. Έστω ότι γνωρίζουµε την εµφάνιση papilledema (τύπος οιδήµατος), οπότε επιλέγουµε το Σ από τη γραµµή εργαλείων για να µεταβούµε στο παράθυρο υπολογισµού, κάνουµε δεξί κλικ επάνω στη µεταβλητή e και επιλέγουµε present. Τότε, εµφανίζεται η πληροφορία αυτή στην οθόνη και υπολογίζονται πλέον οι δεσµευµένες πιθανότητες των µεταβλητών, που είναι εν γένει ελαφρώς αυξηµένη σε όλες τις µεταβλητές. 6
Μάλιστα, επιλέγοντας την καρτέλα bar έχουµε µία γραφική απεικόνιση των τιµών και εισάγοντας επιπλέον γνώση στο δίκτυο (πχ θεωρώντας εµφάνιση όγκου) παρατηρούµε τη µεταβολή των πιθανοτήτων. 7
ηµιουργία νέου δικτύου Bayes Έστω ότι θέλουµε να µοντελοποιήσουµε µία απλή διάταξη επικοινωνίας client-server (µε δυνατότητα επιλογής ασύρµατης ή ενσύρµατης µετάδοσης) για την καταγραφή και άντληση δεδοµένων. Έχοντας εντοπίσει τους παράγοντες ( µε δύο καταστάσεις «επιτυχία» - «αποτυχία») που επηρεάζουν την επιτυχή επικοινωνία, τους απεικονίζουµε στο ακόλουθο σχηµατικό διάγραµµα. Θεωρούµε ότι η επιτυχής επικοινωνία ΚΑΙ η επιτυχής λειτουργία server ΚΑΙ η επιτυχής λειτουργία του client είναι απαραίτητα για την επιτυχή λειτουργία του συστήµατος. Αντίθετα, η επιτυχής επικοινωνία απαιτεί ΕΙΤΕ την επιτυχία της ενσύρµατης ΕΙΤΕ την επιτυχία της ασύρµατης επικοινωνίας. Οι προηγούµενες αλληλεξαρτήσεις αιτίας-αποτελέσµατος καθορίζουν το σχηµατισµό των πινάκων δεσµευµένων πιθανοτήτων για τις µεταβλητές «παιδιά» (που εικονίζονται µε σκιασµένο κόµβο στο δίκτυο bayes). wired wireless Comm. Server Client System Για να δηµιουργήσουµε το παραπάνω δίκτυο, επιλέγουµε File>New>Empty Model και στον άδειο καµβά που δηµιουργείται κάνουµε δεξί κλικ και επιλέγουµε add node. 8
Συµπληρώνουµε το όνοµα wired και πατάµε enter οπότε εισάγεται ο κόµβος. Με δεξί κλικ και επιλογή states and properties συµπληρώνουµε στις δύο καταστάσεις success και failure. Στη φάση αυτή αποθηκεύουµε το αρχείο στο φάκελο samples µε το όνοµα net1. Οµοίως εισάγουµε και τους υπόλοιπους κόµβους του δικτύου µε τις ίδιες καταστάσεις, και καταλήγουµε στο ακόλουθο παράθυρο. 9
Για το σχηµατισµό της σχέσης Comm.-->System, κρατάµε το κουµπί CTRL πατηµένο και µε το mouse σχηµατίζουµε µία γραµµή από το κέντρο του κόµβου Comm έως στο κέντρο του κόµβου System οπότε σχηµατίζεται η επιθυµητή σχέση. Εάν επιθυµούµε τη διαγραφή µίας σχέσης, κάνουµε δεξί κλικ πάνω στο βέλος της σχέσης και επιλέγουµε delete arc. Με τον ίδιο τρόπο σχηµατίζουµε όλες τις υπόλοιπες σχέσεις και προκύπτει το ακόλουθο δίκτυο. Θα συµπληρώσουµε τους πίνακες δεσµευµένων πιθανοτήτων. Επιλέγουµε τον κόµβο Comm και πατάµε το κουµπί µε τις µπάρες. Αφού αρκεί η επιτυχής λειτουργία ασύρµατης ή ενσύρµατης ζεύξης για την επιτυχή επικοινωνία client server ο πίνακας δεσµευµένων πιθανοτήτων της µεταβλητής Comm έχει την ακόλουθη µορφή 10
Αντίστοιχα στην περίπτωση του συστήµατος πρέπει ο client, ο server και η επικοινωνία να λειτουργούν ΟΛΑ επιτυχώς ώστε να έχει επιτυχή λειτουργία το σύστηµα, οπότε ο πίνακας δεσµευµένων πιθανοτήτων είναι ο ακόλουθος. Για τις βασικές µεταβλητές του δικτύου, οι αδέσµευτες πιθανότητες των καταστάσεων εισάγονται επιλέγοντας πρώτα τον κόµβο και στη συνέχεια πατώντας το πλήκτρο µε τις µπάρες. Ενδεικτικά, στο σύστηµα θα χρησιµοποιηθούν οι ακόλουθες πιθανότητες αποτυχίας για τις µεταβλητές του δικτύου: Wired 0,005, Wireless 0,007, Server 0,003, Client 0,01 Αντίστοιχα οι τιµές των πιθανοτήτων επιτυχίας υπολογίζονται αυτόµατα από το πρόγραµµα. Επιλέγοντας το πλήκτρο Σ από τη γραµµή εργαλείων, εµφανίζεται το παράθυρο µε τους υπολογισµούς των εκ των προτέρων πιθανοτήτων των µεταβλητών. 11
Παρατηρούµε ότι η πιθανότητα επιτυχίας της µεταβλητής Comm είναι 1. Αυτό οφείλεται σε µειωµένη ακρίβεια των αριθµών που µπορεί να αυξηθεί επιλέγοντας στην αριστερή πλευρά δεξί κλικ> probability format>0.000000 ώστε να αυξηθεί η ακρίβεια. 4) Υπολογίσατε τις εκ των υστέρων πιθανότητες των µεταβλητών στα ακόλουθα 2 σενάρια i) αποτυχία συστήµατος ii) αποτυχία συστήµατος και επιτυχία client iii) αποτυχία συστήµατος και επιτυχία client και server. Συµπεριλάβετε τα 3 screenshot των αποτελεσµάτων και σχολιάστε σχετικά τα αποτελέσµατα όσον αφορά τα πιο πιθανά γεγονότα δεδοµένου την εµφάνιση των σεναρίων. Με βάση τις παραπάνω δυνατότητες του προγράµµατος MSBNx που παρουσιάστηκαν, υλοποιήσατε την ακόλουθη µοντελοποίηση 5) ίνεται το πληροφοριακό σύστηµα υγείας, µε το γενικό λειτουργικό διάγραµµα που εικονίζεται ακολούθως. 12
Το πληροφοριακό σύστηµα (µεταβλητή system ) περιλαµβάνει το πληροφοριακό κέντρο δεδοµένων (µεταβλητή IS Pesy ), µε τον αντίστοιχο εξυπηρετητή (µεταβλητή IS_Server_Pesy ), την εφαρµογή αναφορών στατιστικών (µεταβλητή Reporting_Appl ) την εφαρµογή υγειονοµικού χάρτη (µεταβλητή H_Map ), το ολοκληρωµένο πληροφοριακό σύστηµα (µεταβλητή IIS ). Για την επιτυχή λειτουργία του πληροφοριακού κέντρου δεδοµένων αλλά και του πληροφοριακού συστήµατος απαιτείται η επιτυχής λειτουργία κάθε µίας εφαρµογής που τα επηρεάζουν. Επίσης, το πληροφοριακό σύστηµα υγείας περιλαµβάνει την εποπτεία ενός νοσοκοµείου (µεταβλητή Hosp1 ) µέσω επικοινωνιακής σύνδεσης, το οποίο για την επιτυχή λειτουργία του απαιτεί την επιτυχή λειτουργία κάθε µίας από τις βασικές υπηρεσίες του, 13
που είναι οι κλινικές (µεταβλητή clinics1 ), τα εργαστήρια ( µεταβλητή labs1 ), ο εξυπηρετητής του πληροφοριακού συστήµατος του νοσοκοµείου (µεταβλητή IS_server1 ), ο εξυπηρετητής του πληροφοριακού συστήµατος των εργαστηρίων (µεταβλητή Lab_server1 ). Το πληροφοριακό σύστηµα υγείας επικοινωνεί µε 5 κέντρα υγείας και θεωρείται επιτυχηµένη συνολικά η επικοινωνία µε αυτά (µεταβλητή ΚΥ_all ) όταν 3 από τα 5 έχουν επιτυχηµένη επικοινωνία αλλά απαιτείται πάντα το ΚΥ4 να έχει επιτυχηµένη επικοινωνία, λόγω ειδικής σηµαντικότητας που δίνεται σε αυτό το κέντρο υγείας. Πιο συγκεκριµένα το µοντέλο δικτύου Bayes του πληροφοριακού συστήµατος φαίνεται στην ακόλουθη εικόνα. Οι πιθανότητες αποτυχίας των βασικών υπηρεσιών του πληροφοριακού συστήµατος υγείας δίνονται στον ακόλουθο πίνακα Μεταβλητή Πιθαν. αποτυχίας Μεταβλητή Πιθαν. αποτυχίας Labs1 0,0001 IIS 0,0001 Clinics1 0,0002 H_map 0,0001 IS_Server1 0,000125 KY1,KY2 0,0005 Lab_Server1 0,000125 KY3 0,0002 Reporting_Appl 0,0002 KY4 0,000125 I_Server_Pesy 0,00005 KY5 0,0001 Απαντήστε στα ακόλουθα ζητήµατα: Ι) Μοντελοποιήστε το σύστηµα στο πρόγραµµα MSBNx, υλοποιώντας κατάλληλα τους πίνακες δεσµευµένων πιθανοτήτων σύµφωνα µε τις λειτουργικές απαιτήσεις που περιγράφηκαν. Εισάγετε τα screenshots των πινάκων δεσµευµένων πιθανοτήτων των µεταβλητών ΚΥ_all, system. ΙΙ) Υπολογίστε τις εκ των προτέρων πιθανότητες επιτυχίας και αποτυχίας λειτουργία των µεταβλητών του συστήµατος. Εισάγετε το screenshot µε τις υπολογισµένες πιθανότητες. Σχολιάστε σχετικά τα αποτελέσµατα όσον αφορά τα πιο πιθανά γεγονότα. ΙΙΙ) Υπολογίσατε τις δεσµευµένες πιθανότητες όλων των µεταβλητών και εισάγετε τα αντίστοιχα screenshot στις ακόλουθες περιπτώσεις: α) αποτυχία του συστήµατος β) αποτυχία του συστήµατος και επιτυχή λειτουργία των κλινικών συστήµατος γ) αποτυχία του συστήµατος και επιτυχή λειτουργία του κέντρου υγείας 4. Σχολιάστε σχετικά τα αποτελέσµατα όσον αφορά τα πιο πιθανά γεγονότα δεδοµένου την εµφάνιση των σεναρίων. 14