Κατηγοροποίηση μαγνητικών τομογραφιών με DSPs



Σχετικά έγγραφα
ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΕΦΑΑ, Κομοτηνής. Λειτουργική ανατομική των κάτω άκρων - Ισχίο

Γαλανοπούλου Αγγελική

Αναγνώριση Προτύπων Ι

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ο Πρόσθιος Χιαστός Σύνδεσμος του Γόνατος και η Συνδεσμοπλαστική

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

HMY 795: Αναγνώριση Προτύπων

ΚΛΙΝΙΚΗ ΕΞΕΤΑΣΗ ΓΟΝΑΤΟΣ

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Αναγνώριση Προτύπων Ι

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

HMY 795: Αναγνώριση Προτύπων

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Μαθηματική Εισαγωγή Συναρτήσεις

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Κάτω Άκρο. 1. Κνήµη. Β. Διαµερίσµατα της Κνήµης

Ανατομική του Γόνατος Παθολογία και Χειρουργική των Συνδέσμων. Δρ. Χρήστος Κ. Γιαννακόπουλος Ορθοπαιδικός Χειρουργός

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μαθηματική Εισαγωγή Συναρτήσεις

HMY 795: Αναγνώριση Προτύπων

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

Οι Μηνίσκοι του Γόνατος και η Αρθροσκοπική Mηνισκεκτομή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

8. Σύνθεση και ανάλυση δυνάμεων

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Αριθμητική Ανάλυση και Εφαρμογές

Μεθοδολογίες παρεµβολής σε DTM.

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Digital Image Processing

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

HMY 795: Αναγνώριση Προτύπων

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

Ο ΣΚΕΛΕΤΟΣ ΤΗΣ ΣΠΟΝΔΥΛΙΚΗΣ ΣΤΗΛΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

E [ -x ^2 z] = E[x z]

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

ΑΠΟΚΑΤΑΣΤΑΣΗ ΡΗΞΗΣ ΠΡΟΣΘΙΟΥ ΧΙΑΣΤΟΥ ΣΥΝΔΕΣΜΟΥ

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

ΚΑΤΩ ΑΚΡΟ. Βάσιου Αικ. Επίκουρη Καθηγήτρια Ανατοµίας. Ιατρικό Τµήµα. Πανεπιστήµιο Θεσσαλίας. Wednesday, January 15, 14

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Φυσική για Μηχανικούς

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

ΔΙΑΝΥΣΜΑΤΙΚΕΣ ΣΥΝΑΡΤΗΣΕΙΣ

Φυσική Β Γυμνασίου - Κεφάλαιο 2: Κινήσεις ΚΕΦΑΛΑΙΟ 2: ΚΙΝΗΣΕΙΣ. Φυσική Β Γυμνασίου

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Φυσική για Μηχανικούς

Αναδρομή Ανάλυση Αλγορίθμων

Εισόδημα Κατανάλωση

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΚΑΚΩΣΕΙΣ ΜΑΛΑΚΩΝ ΜΟΡΙΩΝ ΤΟΥ ΓΟΝΑΤΟΣ

Κάτω Άκρο Οι Χώρες του Μηρού

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

1η ΠΑΡΟΥΣΙΑΣΗ. Ηλεκτρικά πεδία

ΑΞΟΝΙΚΗ ΤΟΜΟΓΡΑΦΙΑ. Ευάγγελος Παντελής Επ. Καθ. Ιατρικής Φυσικής Εργαστήριο Ιατρικής Φυσικής Ιατρική Σχολή Αθηνών

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

Φυσική για Μηχανικούς

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

4.3. Γραµµικοί ταξινοµητές

HMY 795: Αναγνώριση Προτύπων

Τυχαία μεταβλητή (τ.μ.)

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #8: Βελτιστοποίηση Συστημάτων Ασαφούς Λογικής. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

Το μοντέλο Perceptron

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Να υπολογίζουμε τους τριγωνομετρικούς αριθμούς οξείας γωνίας. Τη γωνία σε κανονική θέση και τους τριγωνομετρικούς αριθμούς γωνίας σε κανονική θέση.

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα


ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

5 ΛΥΚΕΙΟ ΧΑΛΑΝΔΡΙΟΥ ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΗ ΒΙΟΛΟΓΙΑ. H άρθρωση του ώμου

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Transcript:

Μεταπτυχιακή Εργασία Κατηγοροποίηση μαγνητικών τομογραφιών με DSPs Τσάμπρας Λάμπρος Α.Μ. 147 Επιβλέπων: Ε. Ζυγούρης Αναπληρωτής Καθηγητής ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΠΑΤΡΑ, ΙΟΥΛΙΟΣ 2014

Ειδική Επιστημονική Εργασία Κατηγοροποίηση μαγνητικών τομογραφιών με DSPs Τσάμπρας Λάμπρος Εγκρίθηκε από την τριμελή εξεταστική επιτροπή την 25/9/2014 στα πλαίσια του ΔΠΜΣ Ηλεκτρονική και Επεξεργασία της Πληροφορίας Ευάγγελος Ζυγούρης Αναπληρωτής Καθηγητής Τμήμα Φυσικής Γεώργιος Οικονόμου Καθηγητής Τμήμα Φυσικής Σπυρίδων Φωτόπουλος Καθηγητής Τμήμα Φυσικής Παν/μιο Πατρών Παν/μιο Πατρών Παν/μιο Πατρών Πάτρα, Σεπτέμβριος 2014

Αφιέρωση Στους Μαρία, Γιάννη, Κωνσταντίνο, Νικήτα, Παναγιώτα.

i Περίληψη Είναι ενδιαφέρουσα αλλά συνάμα δύσκολη η ανάλυση ιατρικών εικόνων, επειδή υπάρχουν πολύ μικρές διακυμάνσεις και μεγάλος όγκος δεδομένων για επεξεργασία. Είναι αρκετά δύσκολο να αναπτυχθεί ένα αυτοματοποιημένο σύστημα αναγνώρισης, το οποίο θα μπορούσε να επεξεργάζεται μεγάλο όγκο πληροφοριών των ασθενών και να παρέχει μια σωστή εκτίμηση. Στην ιατρική, η συμβατική διαγνωστική μέθοδος για εικόνες MR γονάτου για αναγνώριση ανωμαλιών, είναι από την επίβλεψη έμπειρων ιατρών. Η τεχνική της ασαφούς λογικής είναι πιο ακριβής, αλλά αυτό εξαρτάται πλήρως από τη γνώση των εμπειρογνωμόνων, η οποία μπορεί να μην είναι πάντα διαθέσιμη. Στη παρούσα εργασία, τμηματοποιούμε την MR εικόνα του γονάτου με την τεχνική Mean Shift, αναγνωρίζουμε τα κύρια μέρη με τη βοήθεια των ΗΜRF και τέλος εκπαιδεύουμε ταξινομητή ANFIS. Η απόδοση του ταξινομητή ANFIS αξιολογήθηκε όσον αφορά την απόδοση της εκαπαίδευσης και της ακρίβειας ταξινόμησης. Επιβεβαιώθηκε ότι ο ταξινομητής είχε μεγάλη ακρίβεια στην ανίχνευση ανωμαλιών στις ακτινογραφίες Στην εργασία αυτή περιγράφεται η προτεινόμενη στρατηγική για την διάγνωση ανωμαλιών στις εικόνες μαγνητικής τομογραφίας γόνατος.

ii

iii Abstract It is a challenging task to analyze medical images because there are very minute variations & larger data set for analysis. It is a quite difficult to develop an automated recognition system which could process on a large information of patient and provide a correct estimation. The conventional method in medicine for knee MR images classification and diseases detection is by human inspection. Fuzzy logic technique is more accurate but it fully depends on expert knowledge, which may not always available. Here we extract the feature using Mean Shift segmentation and region recognition with HMRF and after that training using the ANFIS tool. The performance of the ANFIS classifier was evaluated in terms of training performance and classification accuracy. Here the result confirmed that the proposed ANFIS classifier with high accuracy in detecting the knee diseases. This work describes the proposed strategy to medical image classification of patient s MRI scan images of the knee. Keywords: ANFIS, knee diseases, MRI images, knee MRI, Neuro fuzzy logic, Mean shift, HMM, turbopixel, HMRF-EM, genetic algorithms.

iv

v Ευχαριστίες Θα ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή κ. Ζυγούρη Ευάγγελο, όχι μόνο για τη συνεργασία που είχαμε κατά τη διάρκεια της εκπόνησης αυτής της εργασίας, αλλά και για την υπομονή που έδειξε σε εμένα, αφού χωρίς αυτόν δεν θα είχε καν ολοκληρωθεί η παρούσα. Ωφείλω να ευχαριστήσω επίσης, τον καθηγητή Ιατρικής του Πανεπιστημιακού Νοσοκομείου του Ρίου κ. Γκλιάτη Ιωάννη για την βοήθεια που μου προσέφερε όπως και το ΟΛΥΜΠΙΟ ΘΕΡΑΠΕΥΤΗΡΙΟ και ειδικά τον κ. Σπύρο Σκιαδόπουλο, Ακτινοφυσικό, για την απόκτηση του υλικού πάνω στην οποία βασίστηκε η εργασία αυτή.

vi

vii Κατάλογος εικόνων σχημάτων - πινάκων Εικόνα 1.1 Πρόπλασμα γόνατος...6 Εικόνα 1.2 Προσθιοπίσθια σταθερότητα του γόνατος Οι χιαστοί σύνδεσμοι...7 Εικόνα 1.3 Μέρη Γονάτου...9 Εικόνα 1.4 Προσανατολισμός χιαστών συνδέσμων...10 Εικόνα 1.5 Κάκωση πρόσθιου χιαστού...11 Εικόνα 1.6 Ρήξη χιαστού...11 Εικόνα 1.7 Ρήξη ΠΧΣ κατά την προσγείωση...11 Εικόνα 1.8 Ιατρικό μηχάνημα μαγνητικών τομογραφιών γόνατος...12 Εικόνα 1.9 Διαδικασία λήψης τομογραφίας...12 Εικόνα 1.10 Υπάρχουν 3 κατευθύνσεις στη λήψη σειράς εικόνων (εγκάρσια, οβελιαία, στεφανιαία)...13 Εικόνα 1.11 Για τον πίσω χιαστό μας ενδιαφέρει η οβελιαία (sagital)...13 Εικόνα 1.12 Φυσιολογικός πρόσθιος χιαστός - Πρόσθιος χιαστός με ρήξη...14 Εικόνα 1.13 Φυσιολογικός πίσω χιαστός Ρήξη πίσω χιαστού...14 Εικόνα 2.1 Παράδειγμα χώρου χαρακτηριστικών...18 Εικόνα 2.2 Συναρτήσεις πυρήνα και ιδιότητες...20 Εικόνα 2.3 Αντιστοίχιση πυκνότητας σημείων σε pdf...21 Σχήμα 2.1 Διαισθητική περιγραφή αλγορίθμου μέσης μετατόπισης...22 Σχήμα 2.2 Ομαδοποίηση σημείων που οδηγούν στην ίδια κορυφή...22 Σχήμα 2.3 Παράδειγμα ομαδοποίησης...23 Εικόνα 2.4 α)η τομογραφία β)φιλτράρισμα με μέση μετατόπιση...23 Εικόνα 2.5 Τομογραφία χωρισμένη σε υπερεικονοστοιχεία α)απευθείας β) αφού φιλτραριστεί με μέση μετατόπιση...24 Σχήμα 3.1 Διάγραμμα Markov με 3 καταστάσεις...27 Σχήμα 3.2 Κρυφό μοντέλο Markov...29 Σχήμα 3.3 Απεικόνιση κρυφών ετικετών σε εικονοστοιχεία...31 Εικόνα 3.1 Βελτίωση των κατανομών κατά την εκτέλεση του αλγορίθμου...32 Εικόνα 3.2 Εφαρμογή του αλγορίθμου HMRF - EM...33 Εικόνα 3.3 Εφαρμογή στην περιοχή του πίσω χιαστού...33 Σχήμα 4.1 Μηχανισμός συμπερασμού του ANFIS...36 Σχήμα 4.2 Αρχιτεκτονική του ANFIS...36 Πίνακας 4.1 Τρόπος εκπαίδευσης του ANFIS...39 Εικόνα 5.1 Παράδειγμα εφαρμογής υπερεικονοστοιχείων...42 Σχήμα 5.1: Σχηματική αναπαράσταση ενός γράφου...43 Εικόνα 5.2 Εφαρμογή του αλγορίθμου Turbopixel...45 Εικόνα 5.3 Τμήμα της τομογραφίας που δείχνει τα υπερεικονοστοιχεία με αύξοντα αριθμό που προήλθαν από εφαρμογή του αλγορίθμου Turbopixel...46 Εικόνα 6.1 Αναπαράσταση λειτουργίας ΓΑ...52 Εικόνα 7.1 Η πλατφόρμα ανάπτυξης DM 6437 EVM Da Vinci...54 Σχήμα 7.1 Το διάγραμμα τμημάτων της DM 6437...55 Σχήμα 7.2 Προτεινόμενη μέθοδος διάγνωσης...57 Εικόνα 7.2 Εκπαίδευση του συστήματος...58 Εικόνα 7.3 Επιλογή 17 τομογραφιών δεξιού γόνατος...59 Εικόνα 7.4 Εστίαση στη περιοχή ς του πίσω χιαστού...59 Εικόνα 7.5 Φιλτράρισμα με mean shift...59

viii Εικόνα 7.6 Χωρίσμός σε υπερεικονοστοιχεία...60 Εικόνα 7.7 Αντικατάσταση των υπερεικονοστοιχείων με το μέσο όρο φωτεινότητας...60 Εικόνα 7.8 Εφαρμογή του αλγόριθμου HMRF-EM...60 Εικόνα 7.9 Απομόνωση τον πίσω χιαστό...60 Εικόνα 7.10 Λάθη για τα δύο χαρακτηριστικά...62 Εικόνα 7.11 Λάθη για ένα μόνο χαρακτηριστικό...62

ix Κατάλογος περιεχομένων Εισαγωγή...1 Κεφάλαιο 1...5 Μαγνητικές τομογραφίες γόνατος...5 1.1 Γενικά για την άρθρωση...5 1.2 Σύνδεσμοι...6 1.3 Οι χιαστοί σύνδεσμοι...7 1.4 Προσανατολισμός των χιαστών συνδέσμων...10 1.5 Μηχανισμοί κάκωσης...11 1.6 Απεικονιστικές εξετάσεις...12 Κεφάλαιο 2...15 Kατάτμηση εικόνας MRI βασισμένη σε Mean-Shift-τμηματοποίηση δεδομένων..15 2.1 Εισαγωγή...15 2.2 Η διαδικασία Μέσης Μετατόπισης (Mean-Shift)...20 2.3 Εφαρμογή στην παρούσα εργασία...23 Κεφάλαιο 3...25 Κρυμμένα μοντέλα Markov (ΗΜΜ)...25 3.1 Εισαγωγή...25 3.2 Αλυσίδες Markov...26 3.3 Ορισµός του κρυφού μοντέλου Markov (ΗΜΜ)...27 3.4 Τρία ϐασικά προβλήµατα...29 3.5 Μοντέλο κρυφών τυχαίων πεδίων Markov (HMRF)...30 3.6 Αλγόριθμος ΕΜ (Expectation Maximization - μεγιστοποίηση αναμονής)...30 Κρυμμένα μοντέλα Markov (ΗΜΜ) 31...27 3.6.1 ΑΛΓΟΡΙΘΜΟΣ ΕΜ...31 3.7 Εφαρμογή στην παρούσα εργασία...32 Κεφάλαιο 4...34 Το νευρωνικό δίκτυο ANFIS...35 4.1 Εισαγωγή...35 4.2 Aρχιτεκτονική...35 Το νευρωνικό δίκτυο ANFIS...37 4.3 Εκπαίδευση...39 4.4 Εφαρμογή στην παρούσα εργασία...40 Κεφάλαιο 5...41 Yπερ-εικονοστοιχεία (superpixels)...41 5.1 Εισαγωγή...41 5.2 Μέθοδοι για τον Υπολογισμό των Υπερ-εικονοστοιχείων...42 5.2.1 Πιθανοτικά Όρια Περιοχών...42 5.2.2 Αλγόριθμος Ν-Cut...42 Yπερ-εικονοστοιχεία (superpixels)...43 5.2.3 Αλγόριθμος Turbopixel...44 5.3 Εφαρμογή στην παρούσα εργασία...46 Κεφάλαιο 6...47 Επιλογή χαρακτηριστικών και Γενετικοί Αλγόριθμοι...47 6.1 Επιλογή χαρακτηριστικών...47 6.2 Γενετικοί Αλγόριθμοι...48 6.2.1 Εισαγωγή-Βιολογική προσέγγιση...48 6.2.2 Επιλογή χαρακτηριστικών και Γενετικοί Αλγόριθμοι...49 6.3 Εφαρμογή στην παρούσα εργασία...52

x Κεφάλαιο 7...53 Προτεινόμενη μέθοδος υλοποίησης σε DSP...53 7.1 Χαρακτηριστικά του DSP DM6437 EVM...53 7.2 Ανάπτυξη εφαρμογών με χρήση Simulink...56 7.3 Προτεινόμενη μεθοδολογία...59 7.4 Πειραματικά δεδομένα...59 Προτεινόμενη μέθοδος υλοποίησης σε DSP...63 Συμπεράσματα - Προτάσεις...65 ΠΑΡΑΡΤΗΜΑ 1 Δεδομένα ασθενών...69 ΠΑΡΑΡΤΗΜΑ 2. Ο κώδικας σε Matlab...71

Εισαγωγή Τα τελευταία χρόνια, η αυτόματη τμηματοποίηση της εικόνας αρχίζει να παίζει μεγάλο ρόλο στην ιατρική απεικόνιση. Εικόνες χωρισμένες σε τμήματα (ιστούς ή όργανα) χρησιμοποιούνται για διάγνωση, εντοπισμό της παθολογίας, μελέτη της ανατομίας, σχεδιασμό θεραπείας, εγχειρίσεις βοηθούμενες από υπολογιστή. Η δυσκολία έγκειται στην μεταβλητότητα των σχημάτων, και στην μεταβαλλόμενη ποιότητα της εικόνας από θόρυβο, παραμορφώσεις δειγματοληψίας, που εξαιτίας τους δεν μπορούμε να εφαρμόσουμε κλασσικές τεχνικές όπως ανίχνευση ακμών ή κατωφλιοποίηση. Έχουν προταθεί άλλες τεχνικές όπως μοντέλα παραμόρφωσης [11] [13], ενεργά περιγράμματα [13], προτεραιότητα σχήματος[10], άτλαντες οργάνων[8], ενεργά σχήματα[10], σχήματα περιεχομένου[10],νευρωνικά δίκτυα[12], ταίριασμα μοντέλου[8][12], markov τυχαία πεδία[9][12]. Αυτές οι μέθοδοι είναι πολύ αργές, πρώτον γιατί εξετάζουν την εικόνα σε επίπεδο εικονοστοιχείου, δεύτερον γιατί βασίζονται στην επανάληψη. Από την ανθρώπινη εμπειρία παρατηρούμε, ότι εμείς δεν τμηματοποιούμε μια εικόνα σε επίπεδο pixel και εκτελούμε τους υπολογισμούς πολύ πιο γρήγορα. Αυτό μας οδηγεί στο συμπέρασμα ότι πρέπει να μειώσουμε τον όγκο των υπολογισμών και να εισαγάγουμε την παράλληλη επεξεργασία. Ιδανικός τρόπος για να κατανείμουμε τον φόρτο σε πολλούς επεξεργαστές είναι οι συστοιχίες επεξεργαστών ψηφιακού σήματος (DSPs), που μία εκδοχή τους μας οδηγεί στα νευρωνικά δίκτυα που έχουν εγγενώς την παραλληλία και την απλότητα της επεξεργαστικής μονάδας. Πρόσφατα (Αύγουστος 2014)[17] το ερευνητικό τμήμα της IBM ανακοίνωσε ότι δημιούργησε επεξεργαστή νευρωνικών δικτύων χαμηλής κατανάλωσης (70 mw) με 1 εκατομύριο νευρώνες, δυνατότητα 256 εκατομμυρίων συνάψεων οργανωμένους σε 4096 πυρήνες νευροσυνάψεων. Γίνεται έτσι ελκυστικός o

Εισαγωγή 2 τρόπος, να υοθετηθούν αλγόριθμοι για νευρωνικά δίκτυα και να προσαρμοστούν κάποιοι άλλοι να τρέξουν σε αυτά, ώστε να επιτευχθεί το ζητούμενο. Μπορούν να σχηματιστούν και συστοιχίες τέτοιων επεξεργαστών που θα εκτελεί παράλληλα το δικό του αλγόριθμο ο καθένας με σαφή αποτελέσματα τη ταχύτητα, την ευελιξία, την αξιοπιστία, το κόστος, την απλότητα και την μυστικότητα. Στη παρούσα εργασία διερευνήθηκε η δυνατότητα να συνεργαστούν διάφοροι αλγόριθμοι, ώστε να δούμε τις δυνατότητές τους για τον σκοπό αυτό. Σημαντικό ρόλο στην τμηματοποίηση ιατρικών εικόνων, κατά την αναγνώριση ιστών ή οργάνων, παίζει και το τι υπάρχει γύρω τους. Από όλους τους πιθανούς συνδυασμούς πρέπει να βρεθεί ο πιο ισχυρός. Αυτό το πρόβλημα προσεγγίζουν τα τυχαία πεδία Markov, που μπορούν να λειτουργήσουν σε πολλά επίπεδα συνεργαζόμενα με τους άλλους αλγόριθμους. Τελικός στόχος παραμένει, όχι μόνο να δημιουργηθούν ή να προσαρμοστούν αλγόριθμοι για νευρωνικά δίκτυα, αλλά να εκμεταλλευτούμε την δυνατότητα εκπαίδευσης που έχουν, ώστε ανάλογα με το πρόβλημα να βρίσκουν μόνοι τους τη βέλτιστη λύση, απλώς εκπαιδεύοντάς τους με κάποια βάση δεδομένων ιατρικών εικόνων που έχει χαρακτηριστεί από ειδικούς, αλλά και μια βάση τεχνικών εξαγωγής χαρακτηριστικών που καλύπτει τις περιπτώσεις βλαβών στις ιατρικές εικόνες. Στην εργασία αυτή, πήραμε σειρά τομογραφιών από το ΟΛΥΜΠΙΟ θεραπευτήριο, και αφού απομονώσαμε 17 τομογραφίες δεξιού γόνατος για τη βλάβη του πίσω χιαστού, εφαρμόσαμε προεργασία σε αυτές ώστε να πάρουμε κάποια χαρακτηριστικά. Εκπαιδεύσαμε το σύστημα με τις μισές και το ελέγξαμε με τις άλλες μισές. Το αποτέλεσμα έδειξε ικανοποιητική λειτουργία και μεγάλο βαθμό ακρίβειας. Η εργασία αυτή διαρθρώνεται ώς εξής: Στο πρώτο κεφάλαιο αναφέρεται στην ιατρική οπτική για την απεικόνιση της συγκεκριμένης βλάβης. Στο δεύτερο κεφάλαιο αναλύουμε την τεχνική μέσης μετατόπισης για φιλτράρισμα ή ομαδοποίηση. Στο τρίτο κεφάλαιο εξετάσουμε τα τυχαία πεδία markov και το πως βοηθούν στην υπό συνθήκες κατωφλιοποίηση της εικόνας. Στο τέταρτο κεφάλαιο περιγράφουμε το νευρωνικό δίκτυο ANFIS που αποτελεί την καρδιά του προτεινόμενου τρόπου ανάλυσης. Στο πέμπτο κεφάλαιο αναφερόμαστε στα υπερεικονοστοιχεία και το πως αυτά μειώνουν το φορτίο των υπολογισμών και επιτρέπουν σε διαφορετικούς αλγόριθμους να τρέξουν σε πραγματικό χρόνο (για τα δεδομένα μιας μαγνητικής τομογραφίας). Στο έκτο κεφάλαιο μιλάμε για τους γενετικούς αλγόριθμους και την επιλογή χαρακτηριστικών, βασικό εργαλείο ώστε το σύστημα κατά την διάρκεια της εκπαίδευσης να βρίσκει την βέλτιστη λύση από την υπάρχουσα γνώση, βασιζόμενο σε μια βάση δεδομένων

3 Εισαγωγή χαρακτηριστικών και τους αντίστοιχους αλγόριθμους υλοποίησής τους, που με γενετικό αλγόριθμο να διαπιστώνει ποιοί από αυτούς είναι κατάλληλοι σε κάθε συγκεκριμένη διάγνωση. Στο έβδομο κεφάλαιο παρουσιάζεται η πλατφόρμα κλασικού DSP στην οποία δοκιμάσαμε να τρέξουμε τους αλγόριθμους για να δούμε χρόνους εκτέλεσης από την προτεινόμενη μέθοδο. Κατόπιν διατυπώνουμε τα συμπεράσματα και σκέψεις για εργασίες στο μέλλον. Τέλος δίνουμε σε παραρτήματα τα στοιχεία των τομογραφιών από το ΟΛΥΜΠΙΟ θεραπευτήριο και τον κώδικα σε Matlab.

Εισαγωγή 4

Κεφάλαιο 1 Μαγνητικές τομογραφίες γόνατος 1.1 Γενικά για την άρθρωση Η διάρθρωση του γόνατος είναι η μεγαλύτερη άρθρωση του σώματος. Είναι μια σύνθετη τροχογίγγλυμη άρθρωση που αποτελείται από δύο απλούστερες, την κνημομηριαία και την επιγονατιδομηριαία, οι οποίες περιβάλλονται από κοινό αρθρικό θύλακο. Η περόνη δε συμμετέχει στην άρθρωση. Η επιγονατιδομηριαία διάρθρωση έχει ως αρθρικές επιφάνειες τη μηριαία τροχιλία και την αρθρική επιφάνεια της επιγονατίδας. Η κνημομηριαία διάρθρωση έχει ως αρθρικές επιφάνειες την κάτω επιφάνεια των μηριαίων κονδύλων και τις κνημιαίες γλήνες1. Ανάμεσα τους παρεμβάλλονται οι δύο διάρθριοι μηνίσκοι, έσωκαι έξω. Η παρουσία των μηνίσκων διαιρεί την κνημομηριαία άρθρωση σε άνω (μηνισκομηριαία) και κάτω (μηνισκοκνημιαία). Στην άνω γίνεται η κάμψη και η έκταση της κνήμης (γωνιώδης διάρθρωση) και στην κάτω η στροφή της κνήμης προς τα έσω και προς τα έξω όταν το γόνυ βρίσκεται σε κάμψη (τροχοειδής διάρθρωση).

Μαγνητικές τομογραφίες γόνατος 6 Εικόνα 1.1 Πρόπλασμα γόνατος 1.2 Σύνδεσμοι Ο σχετικά χαλαρός αρθρικός θύλακος ενισχύεται από τους ακόλουθους συνδέσμους: Επιγονατιδικός σύνδεσμος. Αποτελεί συνέχεια του τένοντα του τετρακεφάλου από την επιγονατίδα στο κνημιαίο κύρτωμα. Ο έξω και ο έσω καθεκτικός σύνδεσμος της επιγονατίδας. Παριστάνουν προσεκβολές του τένοντα του τετρακεφάλου και φέρονται προς την κνήμη όπου καταφύονται στα πλάγια του κνημιαίου κυρτώματος. Ο έξω και ο έσω πλάγιος σύνδεσμος. Ο έσω πλάγιος είναι πεπλατυσμένος, τριγωνικού σχήματος σύνδεσμος που φέρεται από το έσω υπερκονδύλιο κύρτωμα προς την έσω επιφάνεια της κνήμης ενώ συμφύεται κατά την πορεία του με τον έσω μηνίσκο και τον αρθρικό θύλακο. Ο έξω πλάγιος είναι σχοινοειδής και φέρεται από το έξω υπερκονδύλιο κύρτωμα προς την κεφαλή της περόνης. Δεν συμφύεται με τον αρθρικό θύλακο και τον έξω μηνίσκο. Ο λοξός ιγνυακός παριστάνει λοξή προσεκβολή του τένοντα του ημιϋμενώδους και ενισχύει από πίσω τον αρθρικό θύλακο. Ο τοξοειδής ιγνυακός ενισχύει επίσης από πίσω τον αρθρικό θύλακο και έρχεται σε στενή σχέση με τον ιγνυακό μυ. Οι χιαστοί σύνδεσμοι.

Κεφάλαιο 1 7 1.3 Οι χιαστοί σύνδεσμοι Είναι δυο ισχυρότατοι σύνδεσμοι, ο πρόσθιος και ο οπίσθιος. Χρησιμεύουν κυρίως στο να συγκρατούν τα οστά σε επαφή κατά τις στροφικές κινήσεις με το γόνατο σε κάμψη, οπότε και χαλαρώνουν οι πλάγιοι σύνδεσμοι. Ο πρόσθιος χιαστός σύνδεσμος (ΠΧΣ) εκφύεται από τον πρόσθιο μεσογλήνιο βόθρο, φέρεται προς τα άνω, έξω και πίσω και αφού χιασθεί με τον οπίσθιο χιαστό καταφύεται στη μεσοκονδύλια επιφάνεια του έξω μηριαίου κονδύλου. Ο οπίσθιος χιαστός σύνδεσμος (ΟΧΣ) εκφύεται από τον οπίσθιο μεσογλήνιο βόθρο, φέρεται προς τα εμπρός, άνω και έσω και αφού χιασθεί μετά του ΠΧΣ καταφύεται στη μεσοκονδύλια επιφάνεια του έσω μηριαίου κονδύλου. Είναι ισχυρότερος από τον ΠΧΣ. Εικόνα 1.2 Προσθιοπίσθια σταθερότητα του γόνατος Οι χιαστοί σύνδεσμοι

Μαγνητικές τομογραφίες γόνατος 8 Η προσθιοπίσθια σταθερότητα του γόνατος διασφαλίζεται κυρίως από τους χιαστούς συνδέσμους. Οι χιαστοί σύνδεσμοι βρίσκονται στο κέντρο της άρθρωσης και εμπεριέχονται κατά μεγάλο μέρος μέσα στη μεσοκονδύλια εντομή. Ο πρόσθιος χιαστός σύνδεσμος προσφύεται στον πρόσθιο μεσογλήνιο βόθρο της κνήμης κατά μήκος του χείλους του έσω κονδύλου και μεταξύ της πρόσφυσης του προσθίου κέρατος του έσω μηνίσκου προς τα εμπρός και της πρόσφυσης του έξω μηνίσκου προς τα πίσω. Πορεύεται λοξά προς τα άνω και έξω και προσφύεται επάνω σε μία στενή εντομή στην έσω επιφάνεια του έξω μηριαίου κονδύλου η οποία εκτείνεται κάθετα προς τα πάνω και κατά μήκος του χείλους του αρθρικού χόνδρου. Ο σύνδεσμος έχει μία περισσότερο πρόσθια πρόσφυση στην κνήμη και μία περισσότερο έξω πρόσφυση στο μηριαίο οστό απ' ότι ο οπίσθιος χιαστός σύνδεσμος, έτσι το όνομα πρόσθιο-εξωτερικός σύνδεσμος είναι πιο κατάλληλο. Αποτελείται από τρεις δεσμίδες: Την πρόσθια-έσω δεσμίδα, την επιμηκέστερη, την πιο επιπολής και την περισσότερο ευάλωτη σε τραυματισμούς. την οπίσθια-έξω δεσμίδα η οποία βρίσκεται βαθύτερα από την προηγούμενη και παραμένει ανεπηρέαστη στις μερικές ρήξεις του συνδέσμου τη διάμεση δεσμίδα Ως σύνολο, ο σύνδεσμος είναι περιελιγμένος γύρω από τον εαυτό του έτσι ώστε οι περισσότερο πρόσθιες κνημιαίες ίνες του να προσφύονται στο μηριαίο οστό όσο γίνεται πιο μπροστά και κάτω και οι περισσότερο οπίσθιες κνημιαίες ίνες του να προσφύονται όσο γίνεται πιο πάνω στο μηριαίο οστό. Σαν αποτέλεσμα οι ίνες ποικίλουν σε μήκος το οποίο εξαρτάται από τη θέση τους και το μέσο μήκος τους ποικίλλει από 1,85 μέχρι 3,35 cm. Στο βάθος της μεσοκονδύλιας εντομής πίσω από τον πρόσθιο χιαστό σύνδεσμο βρίσκεται ο οπίσθιος χιαστός σύνδεσμος. Αυτός προσφύεται στο οπίσθιο τμήμα του οπίσθιου μεσογλήνιου βόθρου της κνήμης, υπερκαλύπτοντας το οπίσθιο χείλος της άνω επιφάνειας της κνήμης. Ο σύνδεσμος πορεύεται λοξά προς τα έσω, εμπρός και πάνω και προσφύεται στο βάθος της μεσοκονδύλιας εντομής καθώς και σε ένα σημείο στο χείλος της έξω επιφάνειας του έσω μηριαίου κονδύλου κατά μήκος του χείλους του αρθρικού χόνδρου. Για το λόγο αυτό, αυτός ο σύνδεσμος έχει μια περισσότερο οπίσθια πρόσφυση στην κνήμη και μία περισσότερο έσω πρόσφυση στο μηριαίο οστό απ' ότι ο πρόσθιος χιαστός, έτσι το πιο κατάλληλο όνομα, είναι οπισθιο-εσωτερικός σύνδεσμος. Περιλαμβάνει τέσσερις δεσμίδες: Την οπίσθια-έξω δεσμίδα, η οποία προσφύεται πιο πίσω στην κνήμη και πιο έξω στο μηριαίο οστό,

Κεφάλαιο 1 9 την πρόσθια-έσω δεσμίδα, η οποία προσφύεται πιο μπροστά στην κνήμη και πιο έσω στο μηριαίο οστό, την πρόσθια δεσμίδα του Humphrey, η οποία συχνά λείπει, και -- το μηνίσκο-μηριαίο σύνδεσμο του Wrisberg, ο οποίος προσφύεται στο οπίσθιο κέρας του έξω μηνίσκου, προσκολλάται (συνήθως) στην οπίσθια επιφάνεια του κύριου συνδέσμου και συμπορεύεται με αυτόν προς μία κοινή πρόσφυση στην έξω επιφάνεια του έσω μηριαίου κονδύλου. Οι χιαστοί σύνδεσμοι εφάπτονται μεταξύ τους στα κεντρικά τους τμήματα, με τον πρόσθιο να πορεύεται εξωτερικά του οπίσθιου συνδέσμου. Δεν βρίσκονται ελεύθεροι μέσα στην αρθρική κοιλότητα αλλά επενδύονται από αρθρικό υμένα και έχουν σημαντικές σχέσεις με τον αρθρικό θύλακο. Εικόνα 1.3 Μέρη Γονάτου

Μαγνητικές τομογραφίες γόνατος 10 1.4 Προσανατολισμός των χιαστών συνδέσμων Παρατηρώντας με προοπτική, οι σύνδεσμοι αυτοί φαίνονται να χιάζονται στο χώρο. Στο οβελιαίο επίπεδο χιάζονται, και ο πρόσθιος χιαστός σύνδεσμος πορεύεται λοξά προς τα πάνω και εμπρός. Αυτοί επίσης χιάζονται στο μετωπιαίο επίπεδο καθώς οι κνημιαίες τους προσφύσεις βρίσκονται πάνω στον οβελιαίο άξονα της άρθρωσης ενώ οι μηριαίες τους προσφύσεις απέχουν 1.7 cm. Έτσι ο οπίσθιος χιαστός σύνδεσμος πορεύεται λοξά προς τα πάνω και έσω και ο πρόσθιος χιαστός λοξά προς τα πάνω και έξω. Στο οριζόντιο επίπεδο, αυτοί διατρέχουν παράλληλα ο ένας τον άλλο και εφάπτονται στα αξονικά τους τμήματα. Οι χιαστοί όχι μόνο χιάζονται μεταξύ τους στο χώρο, αλλά επίσης και με το σύστοιχο πλάγιο σύνδεσμο του γόνατος: έτσι ο πρόσθιος χιαστός και ο έξω πλάγιος σύνδεσμος του γόνατος χιάζονται μεταξύ τους ενώ αντίστοιχα ο οπίσθιος χιαστός χιάζεται με τον έσω πλάγιο σύνδεσμο. Για το λόγο αυτό κάθε ένας από αυτούς τους συνδέσμους μεταβάλλεται με τον παρακείμενο του αν ληφθεί υπόψη η λοξή πορεία του (όταν η σειρά είναι έσω-εξωτερικά ή έξω-εσωτερικά). Οι χιαστοί σύνδεσμοι δεν έχουν την ίδια γωνία κλίσης. Έτσι στην πλήρη έκταση ο πρόσθιος χιαστός είναι περισσότερο κάθετος ενώ ο οπίσθιος χιαστός είναι περισσότερο οριζόντιος. Οι μηριαίες προσφύσεις τους δείχνουν μία παρόμοια διαφορά: Ότι η πρόσφυση του οπίσθιου χιαστού συνδέσμου είναι οριζόντια ενώ αυτή του πρόσθιου χιαστού είναι κάθετη. Όταν το γόνατο βρίσκεται σε κάμψη ο οπίσθιος χιαστός, ο οποίος επικάθεται οριζόντια κατά τη διάρκεια της έκτασης, εγείρεται κάθετα, σαρώνοντας μια γωνία 60 σε σχέση με την κνήμη, ενώ ο πρόσθιος χιαστός ανυψώνεται μόνο πολύ ελαφρά. Εικόνα 1.4 Προσανατολισμός χιαστών συνδέσμων

Κεφάλαιο 1 11 1.5 Μηχανισμοί κάκωσης Εικόνα 1.5 Κάκωση πρόσθιου χιαστού Εικόνα 1.6 Ρήξη χιαστού Εικόνα 1.7 Ρήξη ΠΧΣ κατά την προσγείωση

Μαγνητικές τομογραφίες γόνατος 12 1.6 Απεικονιστικές εξετάσεις Μεγάλης σημασίας είναι οι απλές ακτινογραφίες με τις οποίες πρέπει να αποκλειστούν κατάγματα του γόνατος (αλλά και αποσπαστικά κατάγματα στην έκφυση του συνδέσμου). Παρότι συνήθως δεν είναι απαραίτητη για τη διάγνωση, η μαγνητική τομογραφία (MRI) είναι χρήσιμη καθώς παρουσιάζει ακρίβεια μεγαλύτερη του 95% στη διάγνωση της ρήξης του πρόσθιου χιαστού συνδέσμου. Επίσης είναι εξαιρετικά χρήσιμη στην αναζήτηση για συνοδές βλάβες. Άλλη απεικονιστική εξέταση είναι η αρθροσκόπηση του γόνατος η οποία εκτός από διαγνωστική έχει και θεραπευτική αξία για την αποκατάσταση της συνδεσμικής βλάβης. Εικόνα 1.8 Ιατρικό μηχάνημα μαγνητικών τομογραφιών γόνατος Εικόνα 1.9 Διαδικασία λήψης τομογραφίας.

13 Κεφάλαιο 1 Εικόνα 1.10 Υπάρχουν 3 κατευθύνσεις στη λήψη σειράς εικόνων (εγκάρσια, οβελιαία, στεφανιαία) Εικόνα 1.11 Για τον πίσω χιαστό μας ενδιαφέρει η οβελιαία (sagital)

Μαγνητικές τομογραφίες γόνατος 14 Εικόνα 1.12 Ενδιάμεσες εικόνες της οβελιαίας σειράς που δείχνουν α) φυσιολογικό και β) πρόσθιο χιαστό με ρήξη Εικόνα 1.13 Ενδιάμεσες εικόνες της οβελιαίας σειράς που δείχνουν α) φυσιολογικό και β) πίσω χιαστό με ρήξη

Κεφάλαιο 2 Kατάτμηση εικόνας MRI βασισμένη σε Mean-Shift-τμηματοποίηση δεδομένων 2.1 Εισαγωγή Ο σκοπός της κατάτμησης σε μια εικόνα, είναι να ομαδοποιήσει τα εικονοστοιχεία αυτής σε συνιστώσες περιοχές που χρήζουν περισσότερης προσοχής (ανάλυσης), π.χ. περιοχές που αντιστοιχούν σε ξεχωριστές επιφάνειες, οντότητες,, ή διακριτές περιοχές οντοτήτων. Λογικά μία περιοχή που αποτελεί ενδιαφέρον έρευνας, αναμένεται να έχει ομοιογενή χαρακτηριστικά όπως ένταση, υφή κ.α. Η κατάτμηση θα μπορούσε να χρησιμοποιηθεί για αναγνώριση αντικειμένων, περίφραξη οριοθέτηση ή υπολογισμό συγκεκριμένων φαινομένων, συμπίεση εικόνας ή και επεξεργασία, βελτιστοποίηση προσπέλασης ενός αλγορίθμου σε μια βάση δεδομένων εικόνων, κτλ. Οι εργασίες χαμηλού-επιπέδου υπολογιστικής όρασης είναι αρκετά δύσκολες. Πολύ εύκολα μπορούν να αποκομισθούν λανθασμένα αποτελέσματα από τη στιγμή που οι χρησιμοποιούμενες τεχνικές στηρίζονται σε σωστές «προβλέψεις» (guessing) των τιμών των παραμέτρων ρύθμισης από το χρήστη. Για να βελτιωθεί η επίδοση, η εκτέλεση εργασιών χαμηλού-επιπέδου πρέπει να καθορίζεται από το είδος της εργασίας (task-driven), να υποστηρίζεται δηλαδή από ανεξάρτητες πληροφορίες υψηλού επιπέδου. Αυτή η προσέγγιση ωστόσο απαιτεί ότι πρώτον, το στάδιο χαμηλού-

Κεφάλαιο 2 16 επιπέδου παρέχει μια αρκετά αξιόπιστη αναπαράσταση της εισόδου καθώς και ότι η διαδικασία εξαγωγής χαρακτηριστικών ελέγχεται μόνο από πολύ λίγες παραμέτρους ρύθμισης. Η ανάλυση που βασίζεται στο χώρο χαρακτηριστικών της εικόνας (feature space) είναι ένα παράδειγμα το οποίο μπορεί να επιτύχει τους στόχους που τέθηκαν παραπάνω. Ο χώρος χαρακτηριστικών είναι μια σχεδίαση της εισόδου η οποία λαμβάνεται μέσα από την επεξεργασία των δεδομένων σε μικρά υποσύνολα κάθε φορά. Για κάθε υποσύνολο, μια παραμετρική αναπαράσταση του χαρακτηριστικού που μας ενδιαφέρει λαμβάνεται και το αποτέλεσμα απεικονίζεται σε ένα σημείο στον πολυδιάστατο χώρο της παραμέτρου. Με την ολοκλήρωση της επεξεργασίας ολόκληρης της εισόδου, σημαντικά χαρακτηριστικά αντιστοιχούν στις πυκνότερες περιοχές του χώρου των χαρακτηριστικών, π.χ. σε κλάσεις (clusters), και ο στόχος της ανάλυσης είναι η απεικόνιση αυτών των κλάσεων. Έτσι, θα μπορούσαμε να χρησιμοποιήσουμε τον ορισμό ότι ανάλυση του χώρου των χαρακτηριστικών είναι η διαδικασία ανάκτησης των κέντρων των περιοχών με μεγάλη πυκνότητα, δηλαδή οι αναπαραστάσεις των σημαντικών χαρακτηριστικών της εικόνας. Το περιεχόμενο ενός συνεχούς χώρου χαρακτηριστικών μπορεί να μοντελοποιηθεί σαν ένα δείγμα από μια πολυδιάστατη, με πολλές κορυφές (multimodal), κατανομή πιθανότητας. Για πραγματικές εικόνες όμως ο αριθμός των κορυφών (modes) μπορεί να είναι πολύ μεγάλος, της τάξεως χαρακτηριστικών των δεκάδων εξαρτάται από ή την εκατοντάδων. Η εφαρμογή. Τα φύση του υποσύνολα χώρου που χρησιμοποιούνται στη σχεδίαση μπορούν να αποτελούνται ακόμα και από μοναδικά εικονοστοιχεία, όπως συμβαίνει κατά την αναπαράσταση της εικόνας στο χρωματικό χώρο. Τόσο τα πλεονεκτήματα όσο και τα μειονεκτήματα του παραδείγματος του χώρου χαρακτηριστικών προκύπτουν από τη γενική φύση της αναπαράστασης της εισόδου. Από τη μία πλευρά, όλες οι αποδείξεις της παρουσίας ενός σημαντικού χαρακτηριστικού συγκεντρώνονται μαζί, παρέχοντας μια άριστη αντοχή απέναντι στο θόρυβο ο οποίος μπορεί να καταστήσει τις τοπικές αποφάσεις αναξιόπιστες. Από την άλλη πλευρά, χαρακτηριστικά με μικρότερη συμμετοχή στο χώρο των χαρακτηριστικών μπορεί να μην ανιχνευθούν, ακόμα κι αν είναι αξιοπρόσεκτα για την εργασία η οποία εκτελείται. Αυτό το μειονέκτημα ωστόσο, μπορεί να αποφευχθεί σημαντικά είτε αυξάνοντας το χώρο των χαρακτηριστικών με πρόσθετες (χωρικές) παραμέτρους από το χώρο εισόδου, είτε με τη μετέπειτα επεξεργασία του χώρου της εισόδου η οποία να οδηγείται από τα αποτελέσματα της ανάλυσης του χώρου των χαρακτηριστικών (feature space).

17 Kατάτμηση εικόνας MRI βασισμένη σε Mean-Shift-τμηματοποίηση δεδομένων Η ανάλυση του χώρου των χαρακτηριστικών εξαρτάται, καθαρά, από την εφαρμογή. Παρόλο που υπάρχει μια πληθώρα δημοσιευμένων τεχνικών ομαδοποίησης (clustering techniques), οι περισσότερες από αυτές δεν επαρκούν για την ανάλυση χώρων χαρακτηριστικών που αντλούνται από πραγματικά δεδομένα. Μέθοδοι οι οποίες στηρίζονται σε μια a priori γνώση του αριθμού των κλάσεων (clusters) που υπάρχουν (συμπεριλαμβανομένων και αυτών που χρησιμοποιούν βελτιστοποίηση ενός γενικού κριτηρίου για να βρουν αυτόν τον αριθμό), καθώς και μέθοδοι οι οποίες αναμφίβολα υποθέτουν το ίδιο σχήμα (συνήθως ελλειπτικό) για όλες τις κλάσεις του χώρου, δεν είναι ικανές να χειριστούν την πολυπλοκότητα ενός πραγματικού χώρου χαρακτηριστικών. Για να μπορέσει κανείς να αποκαλύψει ένα μεγάλο αριθμό σημαντικών χαρακτηριστικών, το πρόβλημα της ανάλυσης του χώρου των χαρακτηριστικών πρέπει να λυθεί σε γενικότερο πλαίσιο. Στις διεργασίες ανάλυσης μιας εικόνας, τα δεδομένα προς ανάλυση προέρχονται από το πεδίο της εικόνας, δηλαδή τα διανύσματα των χαρακτηριστικών ικανοποιούν επιπλέον, χωρικούς περιορισμούς. Αν και αυτοί οι περιορισμοί χρησιμοποιούνται πράγματι στις σύγχρονες τεχνικές, ο ρόλος τους περιορίζεται κυρίως στην εξουδετέρωση των λαθών στην κατανομή των χαρακτηριστικών που συμβαίνουν κατά τη διάρκεια της ανεξάρτητης ανάλυσης του χώρου των χαρακτηριστικών. Για να είναι εύρωστη και δυναμική (robust), η ανάλυση του χώρου των χαρακτηριστικών πρέπει να εκμεταλλεύεται πλήρως την πληροφορία του πεδίου της εικόνας. Σαν συνέπεια του αυξημένου ρόλου της πληροφορίας του πεδίου της εικόνας, ο φόρτος στην ανάλυση του χώρου των χαρακτηριστικών μπορεί να μειωθεί. Αρχικά πρέπει να εξαχθούν όλα τα σημαντικά χαρακτηριστικά και μόνο μετά από αυτό προσδιορίζονται οι κλάσεις που περιέχουν τις περιπτώσεις αυτών των χαρακτηριστικών. Όπως αναφέραμε και παραπάνω, σημαντικά χαρακτηριστικά αντιστοιχούν σε περιοχές μεγάλης πυκνότητας και για να προσδιορίσουμε αυτές τις περιοχές πρέπει να χρησιμοποιηθεί ένα παράθυρο αναζήτησης. Ο αριθμός των παραμέτρων που προσδιορίζουν το σχήμα και το μέγεθος του παραθύρου πρέπει να είναι ελάχιστος κι έτσι, όποτε είναι δυνατόν, ο χώρος χαρακτηριστικών πρέπει να είναι ισότροπος. Ένας χώρος είναι ισότροπος αν η απόσταση ανάμεσα σε δύο σημεία είναι ανεξάρτητη της θέσης του ζεύγους των σημείων. Στο Σχήμα 2.1 φαίνεται ένα τυπικό παράδειγμα. Η έγχρωμη εικόνα του Σχήματος 2.1a απεικονίζεται στον τρισδιάστατο L*u*v* χρωματικό χώρο.

Κεφάλαιο 2 18 Εικόνα 2.1 Παράδειγμα του χώρου χαρακτηριστικών α) Μια 400x276 έγχρωμη εικόνα, β) Ο αντίστοιχος χρωματικός χώρος με 110.400 σημεία πληροφορίας Αυθαίρετα δομημένοι χώροι χαρακτηριστικών μπορούν να αναλυθούν μόνο με μη-παραμετρικές μεθόδους μια και αυτές δε χρησιμοποιούν υποθέσεις. Αναρίθμητες μη-παραμετρικές μέθοδοι ομαδοποίησης περιγράφονται στη βιβλιογραφία και μπορούν να ταξινομηθούν σε δύο μεγάλες κλάσεις: ιεραρχική ομαδοποίηση και υπολογισμός πυκνότητας. Οι τεχνικές ιεραρχικής ομαδοποίησης είτε συναθροίζουν είτε διαχωρίζουν τα δεδομένα που βασίζονται σε κάποιο μέτρο προσέγγισης. Οι ιεραρχικές μέθοδοι τείνουν να είναι υπολογιστικά ακριβές και ο ορισμός σημαντικού κριτηρίου διακοπής (stopping criterion) για τη συγχώνευση ή διαίρεση των δεδομένων δεν είναι ακριβής. Η λογική πίσω από τη μη-παραμετρική προσέγγιση ομαδοποίησης που βασίζεται στον υπολογισμό πυκνότητας είναι ότι ο χώρος χαρακτηριστικών μπορεί να θεωρηθεί ως η εμπειρική συνάρτηση πυκνότητας πιθανότητας (p.d.f.) της παραμέτρου που αναπαρίσταται. Έτσι, οι πυκνές περιοχές στο χώρο των χαρακτηριστικών αντιστοιχούν σε τοπικά μέγιστα της p.d.f., δηλαδή στις κορυφές της άγνωστης πυκνότητας. Μόλις καθοριστεί το σημείο της κορυφής, η κλάση που σχετίζεται με αυτό απεικονίζεται βασισμένη στην τοπική δομή του χώρου των χαρακτηριστικών.

Kατάτμηση εικόνας MRI βασισμένη σε Mean-Shift-τμηματοποίηση δεδομένων 19 Για τον υπολογισμό της πυκνότητας πιθανότητας, υπάρχουν διάφορες μηπαραμετρικές τεχνικές: το πολυδιάστατο ιστόγραμμα, η μέθοδος του «κοντινότερου γείτονα» (nearest neighbor) και ο υπολογισμός με τη χρήση συναρτήσεων πυρήνα. Για χώρους χαρακτηριστικών μεγάλων διαστάσεων, τα πολυδιάστατα ιστογράμματα είναι λιγότερο χρήσιμα λόγω του εκθετικά αυξανόμενου αριθμού των κουτιών (bins) ανάλογα με τη διάσταση του χώρου. Η μέθοδος του κοντινότερου γείτονα είναι επιρρεπής στον τοπικό θόρυβο (γεγονός που καθιστά την ακριβή ανίχνευση των κορυφών δύσκολη). Για μικρά και μεσαία μεγέθη δεδομένων, ο υπολογισμός με τη χρήση συναρτήσεων πυρήνα είναι μια καλή και πρακτική επιλογή: είναι απλή, και για συναρτήσεις πυρήνα που ικανοποιούν κάποιες συνθήκες, ο υπολογισμός είναι ασυμπτωτικά ακριβής και σταθερός ως προς την έννοια του ελαχίστου τετραγώνου, και ομοιόμορφα κατανεμημένος ως προς την πιθανότητα. Η προσέγγισή μας για την ανίχνευση των κορυφών και την ομαδοποίηση βασίζεται στη διαδικασία Mean Shift (Μέση Μετατόπιση), η οποία στηρίζεται στην ιδέα της συσχέτισης κάθε σημείου του χώρου των χαρακτηριστικών με όμοιά του. Μια υπολογιστική μονάδα που βασίζεται στη διαδικασία mean shift, είναι ένα εξαιρετικά ευέλικτο εργαλείο για την ανάλυση του χώρου των χαρακτηριστικών και μπορεί να παρέχει αξιόπιστες λύσεις για πολλές εργασίες της όρασης 2.2 Η διαδικασία Μέσης Μετατόπισης (Mean-Shift) Μια τεχνική για την αποκάλυψη των σημαντικών χαρακτηριστικών της εικόνας παρουσιάζεται στη συνέχεια. Η τεχνική βασίζεται στον αλγόριθμο mean shift, μια απλή μη-παραμετρική εργασία για τον υπολογισμό των κλίσεων της πυκνότητας. Οι Fukunaga και Hostetler που πρώτοι την εισήγαγαν, στην προσέγγισή τους θεωρούν ότι τα ίδια τα αντικείμενα μπορούν να κινούνται στο χώρο και τελικά να συγκεντρώνονται σε έναν αριθμό κορυφών (tight clumps). Ο αλγόριθμος λειτουργεί με επαναληπτικό τρόπο.

Κεφάλαιο 2 20 Ο υπολογισμός της πυκνότητας με τη χρήση πυρήνων (kernel density estimation) (γνωστός στη βιβλιογραφία της αναγνώρισης προτύπων και ως τεχνική Parzen παραθύρων) είναι η πιο γνωστή μέθοδος υπολογισμού πυκνότητας. Μία συνήθως Εικόνα 2.2 Συναρτήσεις πυρήνα και ιδιότητες χρησιμοποιούμενη συνάρτηση πυρήνα είναι η πολυδιάστατη κανονική. Από τη στιγμή που ο d-διάστατος χώρος χαρακτηριστικών μπορεί να θεωρηθεί εμπειρικά, ως η συνάρτηση πυκνότητας πιθανότητας f(x) με τα τοπικά μέγιστα να αντιστοιχούν στις πυκνές περιοχές του χώρου, μπορούμε να βρούμε τα κέντρα κάθε κλάσης ελέγχοντας τα διανύσματα που ικανοποιούν την κλίση και κρατώντας μόνο τα τοπικά μέγιστα. Έτσι, το πρώτο βήμα στην ανάλυση του χώρου των χαρακτηριστικών με πυκνότητα f(x) είναι να βρούμε τις κορυφές (modes) αυτής της πυκνότητας και η διαδικασία mean shift αποτελεί έναν «κομψό» τρόπο να προσδιορίσουμε αυτούς τους μηδενισμούς της κλίσης χωρίς να υπολογίσουμε την πυκνότητα. Εικόνα 2.3 Αντιστοίχιση πυκνότητας σημείων σε pdf

Kατάτμηση εικόνας MRI βασισμένη σε Mean-Shift-τμηματοποίηση δεδομένων 21 Διαισθητικά, ο σκοπός του αλγορίθμου είναι να βρεθεί η πυκνότερη περιοχή. Όλα τα εικονοστοιχεία που μας οδηγούν στην ίδια κορυφή, ομαδοποιούνται σε ένα τμήμα της εικόνας. Σχήμα 2.1 Διαισθητική περιγραφή αλγορίθμου μέσης μετατόπισης Σχήμα 2.2 Ομαδοποίηση σημείων που οδηγούν στην ίδια κορυφή

Κεφάλαιο 2 22 Σχήμα 2.3 Παράδειγμα ομαδοποίησης Η βέλτιστη ακτίνα του παραθύρου σάρωσης θα μπορούσε να προκύψει με γενετικό αλγόριθμο από την εκπαίδευση πάνω στις χαρακτηρισμένες τομογραφίες. 2.3 Εφαρμογή στην παρούσα εργασία Χρησιμοποιούμε τον αλγόριθμο μέσης μετατόπισης, κατά την τμηματοποίηση των τομογραφιών, στο στάδιο μετά την εύρεση του σημείου ενδιαφέροντος και πριν την δημιουργία των υπερεικονοστοιχείων.

Kατάτμηση εικόνας MRI βασισμένη σε Mean-Shift-τμηματοποίηση δεδομένων Εικόνα 2.4 α) Η τομογραφία, β) Φιλτράρισμα με μέση μετατόπιση Εικόνα 2.5 Τομογραφία χωρισμένη σε υπερεικονοστοιχεία α) απευθείας, β) αφού φιλτραριστεί με μέση μετατόπιση Τα πλεονεκτήματα εφαρμογής του αλγορίθμου μέσης μετατόπισης είναι: Εξάλειψη του θορύβου Τετραγωνισμένες περιοχές όπου υπάρχει ίδια φωτεινότητα (καλύτερη αντιστοίχηση υπερεικονοστοιχείων σε 2 διαστάσεις) Ομαλότερα περιγράμματα των εικονοστοιχείων 23

24 Κεφάλαιο 2

Κεφάλαιο 3 Κρυμμένα μοντέλα Markov (ΗΜΜ) 3.1 Εισαγωγή Από την επινόησή τους στα τέλη του 1960 και µετά, τα HMM όσο πάνε και χρησιµοποιούνται περισσότερο σε διάφορους επιστηµονικούς τοµείς, όπως την υπολογιστική τεχνολογία, την αναγνώριση οµιλίας και την αναγνώριση προτύπων. Η µοντελοποίησή τους ϐασίζεται σε µαθηµατικές αρχές της ϑεωρίας πιθανοτήτων, της ϑεωρία πληροφοριών και των πεπερασµένων αυτοµάτων. Τα ΗΜΜ έχουν τα παρακάτω πλεονεκτήµατα: Εχουν πλούσια µαθηµατική δοµή µε αποτέλεσµα να ϐρίσκουν χρήση σε ένα µεγάλο εύρος εφαρµογών. Μπορούν να µοντελοποιήσουν µη στατικά σήµατα (όπως είναι οι εικόνες). ιαθέτουν αποδοτικούς αλγόριθµους εκπαίδευσης και δοκιµής (µε µικρή υπολογιστική πολυπλοκότητα) µε αποτέλεσµα να είναι ιδανικοί για real time εφαρµογές που ασχολούνται µε µεγάλα ποσά δεδοµένων (σε αντίθεση µε τα ΑΝΝ που συχνά κατηγορούνται για την αργή εκπαιδευσιµότητά τους). Εκπαιδεύονται αυτόµατα. Στην πράξη, δουλεύουν πολύ καλά.

26 Κεφάλαιο 3 3.2 Αλυσίδες Markov Προκειµένου να οριστούν τα HMM αρχικά είναι αναγκαίο να ορίσουµε τις αλυσίδες Markov. Εστω ότι {S0,S1,...,St,...} είναι η ακολουθία διακριτών τυχαίων µεταβλητών οι οποίες παίρνουν τιµές σε ένα πεπερασµένο αλφάβητο S = {1,2,,N}. Αυτές οι τυχαίες μεταβλητές λέµε ότι σχηµατίζουν µία αλυσίδα Markov όταν ισχύει: P(Si = si S0 = s0,...,si 1 = si 1 ) = P(Si = si Si 1 = si 1 ) i > 0 όπου si S.Αυτή η ιδιότητα ονοµάζεται ιδιότητα Markov και δηλώνει ότι η δεσµευµένη πιθανότητα ενός γεγονότος εξαρτάται µόνο από το προηγούµενο γεγονός και όχι από αυτά πριν από αυτό. Μία αλυσίδα Markov δηλαδή είναι µία τυχαία διαδικασία η οποία έχει το ελάχιστο ποσό µνήµης. Η έξοδος της διαδικασίας ή κοινώς οι παρατηρήσεις είναι το σετ των καταστάσεων σε κάθε χρονική στιγµή, όπου κάθε κατάσταση ανταποκρίνεται σε ένα ϕυσικό (παρατηρήσιµο) γεγονός το οποίο ανήκει στο αλφάβητο S. Τα στοιχεία του S ονοµάζονται καταστάσεις. Ετσι, αν S(t) = j η διαδικασία Markov λέγεται ότι είναι στην κατάσταση j τη χρονική στιγµή t. Αφού η διαδικασία περιοδικά κινείται από τη µία κατάσταση στην άλλη, οι δεσµευµένες πιθανότητες aij = P(St = j St 1 = i) i,j S καλούνται πιθανότητες µετάβασης. Οι πιθανότητες a ij µπορούν ϐολικά να αναπαρασταϑούν ως ένας πίνακας µετάβασης όπου N είναι ο αριθµός των καταστάσεων ή εναλλακτικά το µέγεθος του αλφάβητου S. Η i γραµµή του A είναι στην πραγµατικότητα η δεσµευµένη πυκνότητα πιθανότητας του St, δεδοµένου ότι St 1 = i. Εποµένως, σύµφωνα µε τον ορισµό της συνάρτησης πιθανότητας ϑα πρέπει να ισχύουν οι περιορισµοί: Κάθε γραµµή του πίνακα έχει άθροισµα ένα και όλα τα στοιχεία του είναι µεγαλύτερα ή ίσα του µηδενός. Για να ορίσουµε πλήρως ένα µοντέλο Markov, είναι απαραίτητη άλλη µία παράµετρος: η κατανοµή των αρχικών καταστάσεων. Η κατανοµή των αρχικών καταστάσεων Π καθορίζει, για όλες τις καταστάσεις, την πιθανότητα η διαδικασία να αρχίζει από αυτήν την κατάσταση: πi = P(S0 = i) i S

Κρυμμένα μοντέλα Markov (ΗΜΜ) 27 Π = (π1,π2,...,πn ). Συνοψίζοντας, ένα µοντέλο Markov χαρακτηρίζεται από τον πίνακα κατανοµής αρχικών καταστάσεων Π και τον πίνακα µετάβασης των καταστάσεων A και συµβολίζεται ως λ = (Π,A). Ο χώρος των καταστάσεων S δεν χρειάζεται να αναφερθεί, γιατί υπονοείται από οποιαδήποτε από τις δύο αυτές παραµέτρους. Το µοντέλο παράγει σαν έξοδό του την ακολουθία των καταστάσεων από την οποία διέρχεται. Για την αναπαράσταση των µοντέλων Markov χρησιµοποιούνται διαγράµµατα. Σχήμα 3.1 Διάγραμμα Markov με 3 καταστάσεις 3.3 Ορισµός του κρυφού μοντέλου Markov (ΗΜΜ) Οι αλυσίδες Markov είναι κατάλληλες µόνο για πολύ απλές εφαρµογές αφού µία δεδοµένη κατάσταση πάντα παράγει την ίδια έξοδο. Αυτό είναι πολύ περιοριστικό για τα περισσότερα πρακτικά προβλήµατα και για το λόγο αυτό χρησιµοποιούνται τα κρυµµέναµοντέλα Markov (Hidden Markov Models ΗΜΜ). Ενα ΗΜΜ χαρακτηρίζεται όπως και οι αλυσίδες Markov από τον πίνακα κατανοµής αρχικών καταστάσεων Π και τον πίνακα µετάβασης των καταστάσεων A. Επειδή όµως το αλφάβητο εξόδου δεν επιβάλλεται πλέον να είναι το ίδιο µε το αλφάβητο

28 Κεφάλαιο 3 καταστάσεων, το ΗΜΜ χαρακτηρίζεται και από µία ακόµα παράµετρο, τον πίνακα κατανοµής πιθανότητας των συµβόλων παρατήρησης B. Ο πίνακας κατανοµής πιθανότητας των συµβόλων παρατήρησης καθορίζει, για κάθε κατάσταση, µία κατανοµή πιθανότητας πάνω στο αλφάβητο εξόδου. Αν υποθέσουµε ένα αλφάβητο εξόδου O = {1,2,,M}, τότε προκύπτει ο παρακάτω πίνακας µε N γραµµές και M στήλες, όπου b i(k) είναι η πιθανότητα του συµβόλου k να εκπέµπεται από την κατάσταση i, δηλάδή bi(k) = P(Ot = k St = i) i S, j O, t > 0 Ο πίνακας κατανοµής πιθανότητας των συµβόλων παρατήρησης B, όπως και ο πίνακας µετάβασης καταστάσεων A, είναι ένας στοχαστικός πίνακας. Εποµένως, ϑα ισχύουν και για αυτόν οι παρακάτω περιορισµοί: δηλαδή ότι κάθε γραµµή του πίνακα B έχει άθροισµα ένα και όλα τα στοιχεία του είναι µεγαλύτερα ή ίσα του µηδενός. Τέλος, προκειµένου να απλουστέυσουµε τα HMMs, ϑα υποθέσουµε ότι τα παρατηρήσιµα σύµβολα είναι στατιστικά ανεξάρτητα µεταξύ τους, δεδοµένης της ακολουθίας καταστάσεων. Αυτό σηµαίνει ότι η επιλογή του συµβόλου που ϑα παραχθεί προσδιορίζεται αποκλειστικά από την πιθανότητα κατανοµής στην παρούσα κατάσταση. Τα προηγούµενα σύµβολα που παράχθηκαν δεν έχουν καµία επίδραση. ηλαδή, συνοψίζοντας, ένα ΗΜΜ αποτελείται από µία αλυσίδα Markov µε ένα πεπερασµένο αριθµό καταστάσεων και ένα σετ από κατανοµές πιθανοτήτων, κάθε µία από τις οποίες σχετίζεται µε την αντίστοιχη κατάσταση. Σε διακριτά διαστήµατα χρόνου, η αλυσίδα Markov αλλάζει κατάσταση σύµφωνα µε τον πίνακα µετάβασης καταστάσεων A. Στη συνέχεια, µία παρατήρηση o O παράγεται σύµφωνα µε την κατανοµή πιθανότητας της νέας κατάστασης. Τα ΗΜΜ, αντίστοιχα µε τις αλυσίδες Markov, συµβολίζονται ως λ = (Π,A,B) και µπορούν να αναπαρασταθούν όπως στο σχήµα:

Κρυμμένα μοντέλα Markov (ΗΜΜ) 29 Σχήμα 3.2 Κρυφό μοντέλο Markov Ενας εξωτερικός παρατηρητής µπορεί µόνο να δει τις παραγόµενες παρατηρήσεις, όχι τις καταστάσεις από τις οποίες προέρχονται. Επειδή τα ίδια σύµβολα µπορούν να παραχθούν από οποιοδήποτε αριθµό καταστάσεων, δεν είναι γενικά πιθανό να υπολογίσουµε µε απόλυτη ϐεβαιότητα την ακολουθία των καταστάσεων από τις παρατηρήσεις. Με λίγα λόγια, η ακολουθία καταστάσεων είναι κρυµµένη, γεγονός από το οποίο προκύπτει και η ονοµασία των µοντέλων. Μπορούμε να παρατηρήσουμε, ότι την έννοια αυτή την είχε εισαγάγει πρώτος ο Πλάτωνας με το σπήλαιό του. Από τις σκιές που βλέπει στο τοίχο ο παρατηρητής, μπορεί να πιθανολογήσει ποιοι τις δημιουργούν και τι περίπου κάνουν. 3.4 Τρία ϐασικά προβλήµατα εδοµένης της µορφής των ΗΜΜ υπάρχουν τρία ϐασικά προβλήµατα που πρέπει να λυθούν έτσι ώστε το µοντέλο να είναι χρήσιµο σε πραγµατικές εφαρµογές. Τα προβλήµατα αυτά είναι τα ακόλουθα: 1. Εκτίµηση, ή ο υπολογισµός της δεσµευµένης πιθανότητας P( Παρατηρήσεις Μοντέλο ). Αυτό µας επιτρέπει να υπολογίσουµε πόσο καλά ένα ΗΜΜ µοντελοποιεί µία δεδοµένη παρατηρήσιµη ακολουθία. Αυτό που µας απασχολεί εδώ είναι το να ϐρούµε έναν αλγόριθµο µε µικρή υπολογιστική πολυπλοκότητα. Ενας τέτοιος αλγόριθµος είναι ο αλγόριθµος forward.

30 Κεφάλαιο 3 2. Αποκωδικοποίηση, ή η εύρεση της ακολουθίας των κρυφών καταστάσεων που ανταποκρίνεται καλύτερα στην παρατηρήσιµη ακολουθία. Επειδή υπάρχουν πολλές ακολουθίες οι οποίες παράγουν τα ίδια παρατηρήσιµα διανύσµατα, στις περισσότερες περιπτώσεις δεν υπάρχει σωστή λύση. Εποµένως, πρέπει να επιλεγεί κάποιο κριτήριο ϐελτιστοποίησης (optimality criterion). Το κριτήριο που χρησιµοποιείται ευρύτερα είναι να ϐρούµε ένα µονοπάτι διαµέσου του µοντέλου το οποίο µεγιστοποιεί την πιθανότητα P( Μονοπάτι Παρατηρήσεις,Μοντέλο ). Ο αλγόριθµος Viterbi ϐρίσκει ένα τέτοιο µονοπάτι. 3. Εκπαίδευση, ή η εύρεση των τιµών των παραµέτρων του µοντέλου λ = (Π,A,B) οι οποίες καθορίζουν το πιο πιθανό µοντέλο το οποίο να παράγει τη δεδοµένη ακολουθία δεδοµένων εκπαίδευσης. Με λίγα λόγια, στόχος είναι να δηµιουργήσουµε ένα µοντέλο το οποίο προσαρµόζει (fits) τα δεδοµένα εκπαίδευσης µε τον καλύτερο τρόπο. Αν και δεν υπάρχει αναλυτικός τρόπος επίλυσης του προβλήµατος αυτού, υπάρχει ένας επαναληπτικός αλγόριθµος ο οποίος κάνει πολύ καλές προσεγγίσεις. 3.5 Μοντέλο κρυφών τυχαίων πεδίων Markov (HMRF) Το μοντέλο κρυφών τυχαίων πεδίων Markov (HMRF), αναπαριστά μια στοχαστική διαδικασία δημιουργούμενη από ένα μοντέλο τυχαίων πεδίων του Markov (MRF), που η σειρά καταστάσεων (ετικέτες της εικόνας ή περιοχές που αναπαριστούν όργανα στην τομογραφία) δεν μπορούν να παρατηρηθούν άμεσα αλλά έμμεσα μέσω των χαρακτηριστικών των (υπερ)εικονοστοιχείων. Η βασική ιδέα είναι ότι μπορούμε να περιγράψουμε ένα εικονοστοιχείο, αξιοποιώντας την πληροφορία της γειτονιάς του. Τότε, η υφή μπορεί να αναπαρασταθεί χρησιμοποιώντας την από κοινού κατανομή των τιμών φωτεινότητας πάνω σε εξαιρετικά συμπαγείς γειτονιές των εικονοστοιχείων. Ετσι ομαδοποιούμε τα εικονοστοιχεία που χαρακτηρίζονται από παρόμοια υφή. Συνήθως για εικόνες, η γειτονιά του στοιχείου ορίζεται από τα 4 πλαϊνά του. 3.6 Αλγόριθμος ΕΜ (Expectation Maximization - μεγιστοποίηση αναμονής) Θα χρησιμοποιήσουμε τον αλγόριθμο ΕΜ (Expectation Maximization -μεγιστοποίηση αναμονής) ώστε να υπολογίσουμε τις παραμέτρους του μοντέλου όπως και την πιο πιθανή αντιστοίχηση εικονοστοιχείων ετικετών.

Κρυμμένα μοντέλα Markov (ΗΜΜ) 31 Σχήμα 3.3 Απεικόνιση κρυφών ετικετών σε εικονοστοιχεία Υποθέτουμε σύνολο δεδομένων που περιέχει δύο είδη χαρακτηριστικών: τα Χ που είναι γνωστά (τα (υπερ)εικονοστοιχεία) και τα Ζ που είναι άγνωστα (οι ετικέτες κατηγοριοποίησης) Ο ΕΜ είναι γενική μέθοδος για την εκτίμηση της μέγιστης πιθανότητας όταν λείπουν δεδομένα ή εμπεριέχουν θόρυβο. 3.6.1 ΑΛΓΟΡΙΘΜΟΣ ΕΜ Δοθείσης μιας από κοινού κατανομής p(x,ζ θ) πάνω στις παρατηρημένες μεταβλητές Χ και κρυφές μεταβλητές Ζ, που κυριαρχούνται από παραμέτρους θ, ο στόχος μας είναι η μεγιστοποίηση της συνάρτησης πιθανοφάνειας p(x θ) όσον αφορά το θ. 1. Επέλεξε μία αρχικοποίηση για τις παραμέτρους θold 2. Βήμα E: Υπολόγισε το p(z X, θold) 3. Βήμα Μ: Υπολόγισε το θnew το οποίο δίνεται από θnew = arg_max(q(θ,θold) όπου Q(θ; θold) =Σp(Z X, θold) ln p(x,z θ) 4. Έλεγξε για σύγκλιση είτε της log πιθανοφάνειας είτε τιμών παραμέτρων. Αν το κριτήριο σύγκλισης δεν ικανοποιείται, τότε θold = θnew και μπορείς να επανέλθεις στο βήμα 2.

32 Κεφάλαιο 3 Κατά την Ε λειτουργία τα χαρακτηριστικά Ζ διώχνονται με ολοκλήρωση Κατά την Μ λειτουργία υπολογίζονται οι τιμές των παραμέτρων που μεγιστοποιούν την αναμενόμενη τιμή. Αφού το Ζ είναι άγνωστο, μεγιστοποιούμε τη λογαριθμική συνάρτηση πιθανότητας για όλες τις πιθανές τιμές του Ζ Εικόνα 3.1 Βελτίωση των κατανομών κατά την εκτέλεση του αλγορίθμου Διαισθητικά, ξεκινάμε από ένα τυχαίο σημείο εκκίνησης, είτε από μία επιλογή παραμέτρων είτε από κάποια αρχική ανάθεση στις κρυμμένες μεταβλητές. Αν υποθέσουμε ότι ξεκινάμε με το πρώτο,με ανάθεση παραμέτρων, τότε χρησιμοποιούμε τις τρέχουσες παραμέτρους για να ολοκληρώσουμε τα δεδομένα, χρησιμοποιώντας πιθανοτική inference. Μετά, αντιμετωπίζουμε τα ολοκληρωμένα δεδομένα σαν να τα είχαμε παρατηρήσει και μαθαίνουμε ένα νέο σύνολο παραμέτρων. Η ακολουθία των βημάτων E και Μ δίνει σε κάθε επανάληψη νέες παραμέτρους που έχουν απαραίτητα καλύτερη πιθανοφάνεια από αυτές της προηγούμενης επανάληψης. 3.7 Εφαρμογή στην παρούσα εργασία Έχοντας χωρίσει την τομογραφία σε υπερεικονοστοιχεία, τα αντικαθιστούμε με τη μέση τιμή της φωτεινότητας του καθενός και εφαρμόζουμε την διαδικασία HMRFEM ώστε να διαχωρίσουμε το υπόβαθρο από το προσκήνιο που εμπεριέχονται τα τμήματα που μας ενδιαφέρουν (Τα κόκαλα και ο πίσω χιαστός). Βασιζόμαστε στο

Κρυμμένα μοντέλα Markov (ΗΜΜ) 33 γεγονός ότι η πιθανότητα να ανήκει σε ένα ιστό το υπερεικονοστοιχείο εξαρτάται ισχυρά από τα διπλανά του. Επίσης δεδομένου της κατανομής των υπερεικονοστοιχείων, υπολογίζουμε την πιο ισχυρή (πιθανοτικά) αντιστοίχιση για το ποιά ανήκουν στους ιστούς που μας ενδιαφέρουν και ποιά όχι. Εικόνα 3.2 Εφαρμογή του αλγορίθμου HMRF EM Εικόνα 3.3 Εφαρμογή στην περιοχή του πίσω χιαστού

34 Κεφάλαιο 3

Κεφάλαιο 4 Το νευρωνικό δίκτυο ANFIS 4.1 Εισαγωγή Το ακρωνύµιο ANFIS προέρχεται από τις λέξεις Adaptive Neuro Fuzzy Inference System (Προσαρµοστικό Νευρωνικό Συγκεχυµένο Συµπερασµατικό Σύστηµα). Χρησιµοποιώντας ένα δεδοµένο σύνολο στοιχείων εισόδου/εξόδου, η λειτουργία anfis της εργαλειοθήκης του Matlab κατασκευάζει ένα συγκεχυµένο σύστηµα συµπερασµού (FIS), του οποίου οι παράµετροι των συµµετοχικών συναρτήσεων συντονίζονται (ρυθµίζονται) χρησιµοποιώντας είτε έναν αλγόριθµο πίσω (ανάστροφης) διάδοσης από µόνο του, ή σε συνδυασµό µε τη µέθοδο των ελαχίστων τετραγώνων. Αυτό επιτρέπει τα συγκεχυµένα συστήµατα να µάθουν από τα δεδοµένα που αυτά διαµορφώνουν. 4.2 Aρχιτεκτονική Στην ενότητα αυτή θα δούμε την αρχιτεκτονική του anfis ώστε να κατανοήσουμε τη λειτουργία του, δηλαδή το πώς εισέρχονται οι παράμετροι του ασαφούς μοντέλου στο νευρωνικό δίκτυο και υφίστανται τη βελτιστοποίηση. Υποθέτουμε πως έχουμε ένα ασαφές σύστημα με δύο εισόδους x και y και μία έξοδο f. Το σύνολο των κανόνων για ένα μοντέλο TSK, με δύο ασαφείς if-then κανόνες είναι:

Κεφάλαιο 4 36 Rule1: IF x is A1 AND y is B1, THEN f1 = p1x + q1y +r1 Rule2: IF x is A2 AND y is B2, THEN f2 = p2x + q2y +r2 Στα παρακάτω σχήματα παρουσιάζεται ο μηχανισμός συμπερασμού του μοντέλου TSK και η αντίστοιχη αρχιτεκτονική του anfis, όπου οι κόμβοι ενός στρώματος έχουν ίδιες συναρτήσεις συμμετοχής. Υπενθυμίζουμε πως οι έξοδοι των κόμβων στο πέρασμα προς τα εμπρός προχωρούν ως το στρώμα 4, και οι παράμετροι του τμήματος απόδοσης βελτιστοποιούνται από τη μέθοδο ελαχίστων τετραγώνων. Στο πέρασμα προς τα πίσω, τα σφάλματα οδηγούνται προς τα πίσω και οι παράμετροι του τμήματος υπόθεσης αλλάζουν τιμή μέσω της μεθόδου GD. Η βελτιστοποίηση των γραμμικών παραμέτρων γίνεται με σταθερές (fixed) τις μη γραμμικές παραμέτρους. Σχήμα 4.1 Μηχανισμός συμπερασμού του ANFIS Σχήμα 4.2 Αρχιτεκτονική του ANFIS

Το νευρωνικό δίκτυο ANFIS 37 Η έξοδος f δίνεται: που είναι γραμμική ως προς τις παραμέτρους του τμήματος απόδοσης κανόνων. Παρακάτω περιγράφεται αναλυτικά η λειτουργία κάθε στρώματος του anfis. Στρώμα 1: Κάθε κόμβος σε αυτό το επίπεδο είναι ένας προσαρμοζόμενος (adaptive) κόμβος με συνάρτηση κόμβου: όπου το x(ή y) είναι η είσοδος στον κόμβο i και Ai(ή Bi-2) είναι ένας λεκτικός όρος που συνδέεται με αυτόν τον κόμβο. Δηλαδή, το O1,i είναι ο βαθμός εκπλήρωσης ενός ασαφούς συνόλου Α ή Β και προσδιορίζει τον βαθμό στον οποίο η δοσμένη είσοδος ικανοποιεί κάποιο λεκτικό όρο. Η συνάρτηση συμμετοχής μπορεί να είναι οποιαδήποτε κατάλληλα παραμετροποιημένη συνάρτηση, όπως η γενικευμένη συνάρτηση bell ή η Gaussian, Καθώς η τιμές των παραμέτρων αλλάζουν, οι αρχικές συναρτήσεις συμμετοχής μεταβάλλονται και αλλάζουν μορφή, ώστε να προσαρμοστούν στις ανάγκες του συστήματος. Οι παράμετροι σε αυτό το στρώμα αναφέρονται ως παράμετροι του τμήματος υποθέσεις κανόνων και είναι μη γραμμικές. Στρώμα 2: Κάθε κόμβος σ αυτό το στρώμα είναι αμετάβλητος και η έξοδός του είναι το γινόμενο όλων των εισερχόμενων σημάτων: Κάθε κόμβος αντιπροσωπεύει το βαθμό εκπλήρωσης κάθε κανόνα. Εδώ χρησιμοποιείται το ασαφές AND και εκτός από τον πολλαπλασιασμό μπορεί να χρησιμοποιηθεί οποιοσδήποτε T- norm τελεστής, σαν τη συνάρτηση του κόμβου αυτού. Στρώμα 3: Σ αυτό το επίπεδο κάθε κόμβος είναι επίσης αμετάβλητος. Ο i-οστός κόμβος υπολογίζει το λόγο βαθμού εκπλήρωσης του i-οστού κανόνα προς το άθροισμα των βαθμών εκπλήρωσης όλων των κανόνων:

38 Κεφάλαιο 4 Οι έξοδοι αυτού του στρώματος ονομάζονται κανονικοποιημένοι βαθμοί εκπλήρωσης Στρώμα 4: Εδώ οι κόμβοι είναι προσαρμοζόμενοι, όπως στο πρώτο στρώμα, με μία συνάρτηση: Όπου wl είναι ο κανονικοποιημένος βαθμός εκπλήρωσης από το τρίτο στρώμα και (pi,qi,ri) είναι το σετ παραμέτρων αυτού του κόμβου. Οι παράμετροι αυτού του κόμβου αναφέρονται ως παράμετροι του τμήματος απόδοσης των ασαφών κανόνων. Στρώμα 5: Ο μοναδικός κόμβος στο τελευταίο στρώμα είναι αμετάβλητος και υπολογίζει την συνολική έξοδο σαν το άθροισμα όλων των εισερχόμενων σημάτων: Το μοντέλο που κατασκευάστηκε είναι λειτουργικά ισοδύναμο με το μοντέλο των TakakiSugeno. 4.4 Η συνάρτηση του MATLAB anfis Ο αλγόριθμος ANFIS υλοποιείται μέσω της συνάρτησης anfis του MATLAB. Ο χρήστης έχει τη δυνατότητα να εισάγει στον αλγόριθμο το μοντέλο που έχει δημιουργήσει με τη συνάρτηση genfis2. Επίσης, η συνάρτηση επιτρέπει στο χρήστη να ορίσει τις παραμέτρους της. Οι παράμετροι αυτές είναι: Ο αριθμός των εποχών εκπαίδευσης Η ελάχιστη τιμή του σφάλματος Το βήμα εκμάθησης Ο συντελεστής αύξησης του βήματος Ο συντελεστής μείωσης του βήματος

Το νευρωνικό δίκτυο ANFIS 39 Οι συντελεστές αύξησης και μείωσης του βήματος καθορίζουν το πόσο γρήγορα θα εκπαιδευτεί το δίκτυό μας. Το βήμα μειώνεται με πολλαπλασιασμό με το συντελεστή μείωσης, αν το σφάλμα υποστεί δύο φορές διαδοχικά το συνδυασμό μίας αύξησης και μίας μείωσης, και αυξάνεται με πολλαπλασιασμό με το συντελεστή αύξησης, αν το σφάλμα μειωθεί τέσσερις συνεχόμενες φορές. 4.3 Εκπαίδευση To ANFIS χρησιµοποιεί δύο αλγόριθµους για να πραγµατοποιήσει νευρωνική προσαρµογή, τον αλγόριθµο πίσω (ανάστροφης) διάδοσης και τον αλγόριθµο υβριδικής εκµάθησης. Ο αλγόριθµος υβριδικής εκµάθησης είναι ένας συνδυασµός του αλγόριθµου (ανάστροφης) πίσω διάδοσης και της µεθόδου των ελαχίστων τετραγώνων. Πιο συγκεκριµένα, στο εµπρόσθιο πέρασµα του αλγόριθµου υβριδικής εκµάθησης, οι έξοδοι στους κόµβους πάνε µπροστά µέχρι το επίπεδο 4 και οι επακόλουθες παράµετροι προσδιορίζονται µε τη µέθοδο των ελαχίστων τετραγώνων. Στο οπισθοδροµικό πέρασµα, τα σήµατα σφαλµάτων διαδίδονται προς τα πίσω και οι παράµετροι προϋποθέσεων ενηµερώνονται από το διάνυσµα κλίσης. Ο ακόλουθος πίνακας συνοψίζει τις δραστηριότητας σε κάθε πέρασµα. Πίνακας 4.1 Τρόπος εκπαίδευσης ANFIS Παρόλο που το ANFIS µας επιτρέπει να χρησιµοποιήσουµε οποιονδήποτε από τους δύο αλγόριθµους, υπάρχει µία κλίση προς τον αλγόριθµο υβριδικής εκµάθησης, αφού αυτή η µέθοδος επίλυσης συγκλίνει ταχύτερα, γιατί µειώνει τις διαστάσεις του διαστήµατος αναζήτησης της αυθεντικής, θεωρητικής µεθόδου πίσω διάδοσης.

Κεφάλαιο 4 40 4.4 Εφαρμογή στην παρούσα εργασία Μετά την εξαγωγή των χαρακτηριστικών του πίσω χιαστού από τις τομογραφίες, κατασκευάζεται σύστημα ANFIS από τις μισές από αυτές και μετά από την εκπαίδευση, ελέγχεται από τις άλλες μισές τομογραφίες. Έχοντας χαρακτηρίσει αυτές από ειδικό, επαληθεύουμε τον βαθμό ακρίβειας της λειτουργίας του συστήματος που προτείνουμε.

Κεφάλαιο 5 Yπερ-εικονοστοιχεία (superpixels) 5.1 Εισαγωγή Τα υπερ-εικονοστοιχεία (super-pixels) αποτελούν μία βασική έννοια που έχει απασχολήσει έντονα την επιστημονική κοινότητα. Ως υπερ-εικονοστοιχείο ορίζεται ένα σύνολο από κάποια εικονοστοιχεία μιας εικόνας που είναι γειτονικά μεταξύ τους και μοιάζουν σε κάποια χαρακτηριστικά τους - όπως για παράδειγμα στη φωτεινότητα, το χρώμα και την υφή τους. Ένα εικονοστοιχείο δεν μπορεί να ανήκει σε πολλά υπερεικονοστοιχεία ταυτόχρονα, πράγμα το οποίο σημαίνει ότι τα υπερ-εικονοστοιχεία δεν είναι επικαλυπτόμενα μεταξύ τους και η ένωση όλων των τμημάτων αυτών, μας δίνει ολόκληρη την εικόνα. Έτσι, τα εικονοστοιχεία μιας εικόνας μπορούν να ομαδοποιηθούν, έτσι ώστε τα pixels μιας ομάδας (ενός super-pixel), να είναι όμοια μεταξύ τους σε κάποια ή σε όλα τα χαρακτηριστικά που αναφέραμε παραπάνω. Τα υπερ-εικονοστοιχεία τελικά, χωρίζουν την εικόνα μας σε περιοχές στις οποίες τα όρια των «αντικειμένων» συμπίπτουν με τα υπερ-εικονοστοιχεία, υπερεικονοστοιχεία. αλλά ένα αντικείμενο αποτελείται από πολλά

Κεφάλαιο 5 42 Εικόνα 5.1 Παράδειγμα εφαρμογής υπερεικονοστοιχείων Τα πλεονεκτήματα των υπερεικονοστοιχείων είναι ότι : είναι ανεξάρτητα της ανάλυσης, Επιτρέπουν την εφαρμογή πολλών αλγορίθμων, αφού μειώνεται σημαντικά ο χρόνος υπολογισμών 5.2 Μέθοδοι για τον Υπολογισμό των Υπερ-εικονοστοιχείων 5.2.1 Πιθανοτικά Όρια Περιοχών H μέθοδος των πιθανοτικών ορίων περιοχών (Probabilistic Boundary) έχει στόχο να υπολογίζει όρια σε φυσικές εικόνες, χρησιμοποιώντας κάποιες τοπικές μετρήσεις. Τα χαρακτηριστικά που χρησιμοποιούνται είναι η φωτεινότητα, το χρώμα και την υφή. Για να συνδυάσουμε την πληροφορία που προκύπτει από τα παραπάνω χαρακτηριστικά, εκπαιδεύουμε έναν ταξινομητή χρησιμοποιώντας σαν γενικευμένη αλήθεια (ground truth) τμηματοποιήσεις μιας εικόνας από διάφορους ανθρώπους. Το αποτέλεσμα που θα πάρουμε σαν έξοδο από αυτό τον ταξινομητή, μας δίνει την πιθανότητα να έχουμε όριο στο συγκεκριμένο σημείο και με τη συγκεκριμένη κατεύθυνση του ορίου. 5.2.2 Αλγόριθμος Ν-Cut Μία πολύ σημαντική τεχνική για τη λύση του προβλήματος της τμηματοποίησης μιας εικόνας αποτελεί η αντιμετώπισή του ως πρόβλημα διάσπασης ή σύνδεσης γράφου. Γράφος G, είναι ένα σύνολο το οποίο αποτελείται από κορυφές V και ακμές Ε, δηλαδή G= {V,E}. Κάθε ακμή ενώνει ένα ζεύγος κορυφών. Δύο κορυφές ενός γράφου ενώνονται όταν υπάρχει μια σειρά ακμών με αφετηρία τη μία κορυφή του γράφου και τέλος την άλλη. Σε

Yπερ-εικονοστοιχεία (superpixels) 43 κάθε ακμή ενός ζεύγους κορυφών vi, vj αντιστοιχεί μια αριθμητική τιμή W(i,j) που ονομάζεται βάρος του γράφου και υποδηλώνει την ομοιότητα των κορυφών i, j. Σχήμα 5.1 Σχηματική αναπαράσταση ενός γράφου Στο πρόβλημα τμηματοποίησης εικόνας με γράφο, τα εικονοστοιχεία της εικόνας αποτελούν τις κορυφές του γράφου και κάθε ακμή (μη κατευθυνόμενη), έχει βάρος το οποίο όσο μεγαλύτερο είναι, τόσο μεγαλύτερη ομοιότητα έχουν τα δύο εικονοστοιχεία που συνδέει. Κάθε κόμβος του γράφου μπορεί να αποτελείται από πολλά εικονοστοιχεία τα οποία αποτελούν μια περιοχή της εικόνας. Τα τμήματα αυτά ονομάζονται συνεκτικά (connected components). Σε μια τέτοια αντιμετώπιση του προβλήματος της τμηματοποίησης μιας εικόνας ο στόχος είναι η διάσπαση του γράφου σε τόσα συνεκτικά τμήματα όσα είναι και τα φυσικά αντικείμενα της εικόνας. Εάν ο γράφος διασπαστεί στις ακμές όπου η τιμή του βάρους είναι μικρή, τότε τα συνεκτικά τμήματα που δημιουργούνται αποτελούνται από κόμβους με μεγάλη ομοιότητα. Ο αλγόριθμος που χρησιμοποιείται κατά βάση για την κατάτμηση της εικόνας είναι ο Ncut. Η μέθοδος αυτή, μετρά την ανομοιότητα μεταξύ δύο διαφορετικών ομάδων, καθώς επίσης και την ομοιότητα των κόμβων (εικονοστοιχείων) που βρίσκονται στην ίδια ομάδα. Ένας γράφος G= {V,E} μπορεί να χωριστεί σε δύο μη συνεκτικά σύνολα Α, Β, αφαιρώντας απλά τις ακμές που συνδέουν τα δύο σύνολα. Ο βαθμός ανομοιότητας μεταξύ των δύο συνόλων μπορεί να υπολογιστεί ως το συνολικό βάρος των ακμών που αφαιρέθηκαν. Στη θεωρία των γράφων, αυτό ονομάζεται cut. Δηλαδή το cut(a,b) είναι το άθροισμα των βαρών όλων των ακμών του V, που έχουν έναν κόμβο στο Α και έναν κόμβο στο Β. Η βέλτιστη κατάτμηση ενός γράφου σε δύο υπογράφους είναι αυτή που ελαχιστοποιεί την τιμή της ποσότητας cut. Υπάρχουν όμως περιπτώσεις που η ελαχιστοποίηση του κριτηρίου αυτού δε συντελεί σε μια «καλή» τμηματοποίηση γιατί είναι δυνατό να απομονωθούν στο ελάχιστο κάποιοι κόμβοι του γράφου. Πιο αναλυτικά, η ελαχιστοποίηση του κριτηρίου επιτυγχάνεται με τη διάσπαση μικρών συνόλων από απομονωμένους κόμβους του γράφου. Εξ ορισμού η τιμή του cut(a,b) μεταβάλλεται ανάλογα με τον αριθμό των ακμών ανάμεσα στα δύο μέρη όπου

Κεφάλαιο 5 44 πραγματοποιήθηκε η διάσπαση, εάν υποθέσουμε ότι το βάρος των ακμών είναι αντιστρόφως ανάλογο με την απόσταση των δύο κόμβων, τότε με τη διάσπαση του n1 ή n2 το κριτήριο έχει πολύ μικρή τιμή, ενώ αν η διάσπαση πραγματοποιούνταν σε κάποιο άλλο πιθανό σημείο όπως φαίνεται στο σχήμα, το αποτέλεσμα είναι αντιπροσωπευτικό χωρίς να ελαχιστοποιείται το κριτήριο. Στην περίπτωση του αλγορίθμου Ncut αντί να κοιτάμε την τιμή του συνολικού βάρους που συνδέει τις ακμές των δύο ομάδων, το μέτρο που χρησιμοποιούμε υπολογίζει το κόστος ως το άθροισμα των παρακάτω κλασμάτων, το οποίο κανονικοποιεί την τιμή του cut(a,b). Η τιμή της συνάρτησης κόστους (Ncut) είναι μικρή αν η περικοπή χωρίζει δύο συστατικά που έχουν λίγες ακμές χαμηλού βάρους μεταξύ τους και πολλές εσωτερικές ακμές μεγάλου βάρους. Ως εκ τούτου, τα δύο κριτήρια χωρισμάτων που επιδιώκουμε στον αλγόριθμο ομαδοποίησής μας, ελαχιστοποιεί την αποσύνδεση μεταξύ των ομάδων και μεγιστοποιεί την ένωση μέσα στις ομάδες. Ο αλγόριθμος Ncut λειτουργεί ως εξής: Θεωρεί τη συνολική σύνδεση από τον κόμβο i σε όλους τους άλλους κόμβους, για την αρχική εικόνα, φτιάχνουμε ένα γράφο βαρών. Θεωρούμε κάθε εικονοστοιχείο ως έναν κόμβο και ενώνουμε κάθε κόμβο με όλους τους υπόλοιπους. Η ακμή μεταξύ δύο κόμβων θα έχει βάρος ανάλογα με την ομοιότητα αυτών των κόμβων. Όσο μεγαλύτερη είναι η ομοιότητα, τόσο μεγαλύτερο θα είναι και το βάρος της σύνδεσης. Όμοιοι κοντινοί κόμβοι, έχουν μεγάλο βάρος ακμής. Με τον παραπάνω τρόπο, σχηματίζεται ο τετραγωνικός πίνακας βαρών W. Λύνοντας το πρόβλημα ιδιοτιμών όπου δηλαδή ελαχιστοποιώντας την ποσότητα Ncut, βρίσκουμε τις k μικρότερες ιδιοτιμές, και στη συνέχεια τα k μικρότερα ιδιοδιανύσματα που αντιστοιχούν σε αυτές τις ιδιοτιμές. Εφαρμόζουμε κάποιον αλγόριθμο ομαδοποίησης (για παράδειγμα τον αλγόριθμο Κμέσων) στα Κ ιδιοδιανύσματα που βρήκαμε έτσι ώστε να κόψουμε το γράφο, και έτσι παίρνουμε Κ διαφορετικές ομάδες. 5.2.3 Αλγόριθμος Turbopixel Είσοδος : Εικόνα I, αριθμός υπερεικονοστοιχείων K Έξοδος : Ορια υπερεικονοστοιχείων B 1. 2. 3. 4. 5. Θέσε Κ περιοχές σχήματος τετραγώνου στην εικόνα I Ανασύνταξε τα κέντρα μακριά από περιοχές με υψηλή κλίση Θέσε όλα τα κέντρα σημαδεμένα Θέσε Ψ0 την ευκλείδια απόσταση από τις σημαδεμένες περιοχές τιθέμενα_εικονοστοιχεία=σx,y[ψ0(x,y)>=0];

Yπερ-εικονοστοιχεία (superpixels) 6. Υπολόγισε την συγγένεια των εικονοστοιχείων φ(x,y); 7. n=0; 8. Όσο αλλαγή στα τιθέμενα_εικονοστοιχεία είναι μεγάλη κάνε 9. Υπολόγισε την ταχύτητα της εικόνας SI; 10. Υπολόγισε την ταχύτητα ορίων SB; 11. S=SI*SB; 12. Επέκτεινε τη ταχύτητα S σε μια στενή ζώνη κοντά στο 0 του Ψn; 13. Υπολόγισε Ψn+1 βάσει της Ψn μέσα στη στενή ζώνη 14. n=n+1; 15. τιθέμενα_εικονοστοιχεία=σx,y[ψ0(x,y)>=0] 16. B = ομογενής σκελετός του Ψn 17. Επέστρεψε B οπου: Εικόνα 5.2 Εφαρμογή του αλγορίθμου Turbopixel. 45

Κεφάλαιο 5 46 5.3 Εφαρμογή στην παρούσα εργασία Μετά την εστίαση στην τομογραφία στην περιοχή του πίσω χιαστού, χωρίζουμε το τμήμα αυτό σε υπερεικονοστοιχεία ώστε να μειώσουμε τον όγκο υπολογισμών για την εφαρμογή των αλγορίθμων που ακολουθούν. Εικόνα 5.3 Τμήμα της τομογραφίας που δείχνει τα υπερεικονοστοιχεία με αύξοντα αριθμό που προήλθαν από εφαρμογή του αλγορίθμου Turbopixel.

Κεφάλαιο 6 Επιλογή χαρακτηριστικών και Γενετικοί Αλγόριθμοι. 6.1 Επιλογή χαρακτηριστικών Στον πραγματικό κόσμο πολλές φορές τα σύνολα δεδομένων περιέχουν δεκάδες χαρακτηριστικά και άρα είμαστε αναγκασμένοι να διαθέτουμε και έναν μεγάλο αριθμό παραδειγμάτων. Αυτό δεν είναι εφικτό ούτε επιθυμητό τις περισσότερες φορές να γίνει. Στην πλειοψηφία των περιπτώσεων όπου μικρό από το σύνολο των χαρακτηριστικών παίζουν βαρύνοντα ρόλο, πρέπει να απομονωθούν ώστε τα νευρωνικά συστήματα που θα προκύψουν να έχουν την μικρότερη δυνατή πολυπλοκότητα χωρίς να χάνουν όμως σε απόδοση. Στον τομέα της υπολογιστικής όρασης και ειδικότερα στην αναγνώριση αντικειμένων η πιο δημοφιλής τεχνικής εξαγωγής χαρακτηριστικών είναι η μέθοδος Ανάλυσης Κυρίων Συνιστωσών (Principal Component Analysis - PCA). Αποτελεί μια μη επιβλεπόμενη τεχνική και ανήκει στην κατηγορία των μεθόδων γραμμικού μετασχηματισμού δεδομένων σε ένα χώρο χαμηλότερης διάστασης. Οι Sirovich και Kirby εισήγαγαν πρώτοι τη μέθοδο PCA στο πεδίο της αναγνώρισης εικόνων Οι παραπάνω μέθοδοι σε γενικές γραμμές δεν χρησιμοποιούν κάποιο αποτελεσματικό σχήμα επιλογής ενός κατάλληλου υποσυνόλου χαρακτηριστικών και λειτουργούν περισσότερο σαν μέθοδοι ταξινόμησης και όχι σαν μέθοδοι που απορρίπτουν περιττά και άχρηστα χαρακτηριστικά. Ειδικότερα, παρουσιάζουν

48 Κεφάλαιο 6 προβληματική συμπεριφορά όταν τα διαθέσιμα δεδομένα είναι περιορισμένα και ο αριθμός των χαρακτηριστικών αρκετά μεγάλος. Για το σκοπό αυτό συνήθως χρησιμοποιούνται σε συνδυασμό με κάποιες άλλες τεχνικές επιλογής χαρακτηριστικών όπως για παράδειγμα τους γενετικούς Αλγορίθμους.Το πρόβλημα της επιλογής χαρακτηριστικών από μια άποψη μπορεί να χαρακτηριστεί και πρόβλημα βελτιστοποίησης αφού αναζητείται το βέλτιστο υποσύνολο χαρακτηριστικών σε σχέση με κάποιο κριτήριο αξιολόγησης, όπως η απόδοση ενός ταξινομητή ή μια άλλη συνάρτηση αξιολόγησης. 6.2 Γενετικοί Αλγόριθμοι 6.2.1 Εισαγωγή-Βιολογική προσέγγιση Οι Γενετικοί αλγόριθμοι (ΓΑ) είναι μέλη της κατηγορίας των εξελικτικών αλγορίθμων. Οι εξελικτικοί αλγόριθμοι βασίζονται στην αρχή της φυσικής εξέλιξης δηλαδή της επιβίωσης των ισχυρότερων. Σε αντίθεση με τις κλασικές μεθόδους αναζήτησης, δε χρησιμοποιούν μοναδικό σημείο αναζήτησης (single-point search), αλλά ένα πληθυσμό σημείων που ονομάζονται άτομα (individuals). Κάθε άτομο αντιπροσωπεύει μία πιθανή λύση για το σχεδιαστικό πρόβλημα. Στους αλγόριθμους αυτούς, ο πληθυσμός εξελίσσεται προς συνεχώς καλύτερες περιοχές του χώρου αναζήτησης, χρησιμοποιώντας τεχνικές όπως είναι η επιλογή, η διασταύρωση και η μετάλλαξη. Η μοντελοποίηση των Γενετικών αλγόριθμων είναι εμπνευσμένη από τη θεωρία της εξέλιξης των ειδών και βασίζεται στους μηχανισμούς της βιολογικής αναπαραγωγής που συναντώνται στη φύση. Η θεωρία αυτή όπως διατυπώθηκε και αναπτύχθηκε από το Δαρβίνο κατάφερε μετά από την πάροδο αρκετών χρόνων να γίνει αποδεκτή δίνοντας μια νέα γνώση στον τρόπο με τον οποίο εξελίσσονται οι ζωντανοί οργανισμοί. Ο Κάρολος Ροβέρτος Δαρβίνος (1809-1882) ήταν Βρετανός φυσιοδίφης, συλλέκτης και γεωλόγος, ο οποίος έμεινε διάσημος στην ιστορία, ως ο θεμελιωτής της θεωρίας της εξέλιξης, καθώς και ως εισηγητής του μηχανισμού της φυσικής επιλογής (natural selection). Σε ένα συνεχώς μεταβαλλόμενο περιβάλλον με δυσκολίες, εμπόδια και περιορισμένους πόρους οι ζωντανοί οργανισμοί καλούνται να επιζήσουν και να πολλαπλασιαστούν. Έχοντας ως μοναδικό στόχο την επιβίωση και την αναπαραγωγή οι οργανισμοί εξελίσσονται τόσο σε ατομικό αλλά και συνεργατικό επίπεδο. Σύμφωνα με τη θεωρία του Δαρβίνου, η εξέλιξη είναι αποτέλεσμα του αγώνα των ειδών για επιβίωση. Η μετέπειτα διατύπωση από τον Mendel των νόμων της κληρονομικότητας, της ανακάλυψης της έννοιας των γονιδίων τα οποία ναι μεν διατηρούν τα χαρακτηριστικά των προγόνων τους, αλλά έχουν τη δυνατότητα να μεταλλάσσονται, έδωσε την δυνατότητα να καταλάβουμε καλύτερα τη αρχική θεωρία του Δαρβίνου. Ο

Επιλογή χαρακτηριστικών και Γενετικοί Αλγόριθμοι. 49 Γκρέγκορ Γιόχαν Μέντελ (1822-1884) ήταν ένας Αυστριακός μοναχός, γνωστός για τις μελέτες που πραγματοποίησε σχετικά με τους μηχανισμούς της κληρονομικότητας χαρακτηριστικών στα φυτά. Συχνά αναφέρεται και ως ο πατέρας της Γενετικής, λόγω της σημασίας που είχαν οι νόμοι της Μεντελικής κληρονομικότητας για τη μελέτη της κληρονομικότητας στα υπόλοιπα είδη, συμπεριλαμβανομένου και του ανθρώπου. Οι ΓΑ βασίζουν τη λειτουργία τους στην παραπάνω εξελικτική διαδικασία και στηρίζουν την εύρεση λύσεων στην επιβίωση του ικανότερου, των χρωμοσωμικών ανακατατάξεων και των γονιδιακών αλλαγών. Κάθε μεταβολή που προκαλείται σε ένα πληθυσμό προσαρμόζεται καλύτερα ή χειρότερα στις συνθήκες του περιβάλλοντος. Αν προσαρμόζεται καλύτερα τότε οι πρόγονοι εξαφανίζονται και τη θέση τους παίρνουν οι επίγονοι. Αν η μεταβολή προσαρμόζεται χειρότερα, τότε οδηγεί σε θάνατο (απόρριψη). Η ορολογία για την περιγραφή των δομικών τους στοιχείων είναι δανεισμένη από το χώρο της γενετικής. Συγκεκριμένα οι ΓΑ αναφέρονται στην έννοια του πληθυσμού ο οποίος αποτελείται από άτομα (individuals) ή γενότυπους. Κάθε άτομο αποτελείται από χρωμοσώματα. Στους ΓΑ αλγόριθμους τα άτομα αποτελούνται από ένα χρωμόσωμα και οι δύο έννοιες συνήθως ταυτίζονται Τα άτομα αποτελούν τις υποψήφιες λύσεις για το πρόβλημα που εξετάζεται. Η δομή των ατόμων περιγράφεται σαν μια διατεταγμένη γραμμική ακολουθία γονιδίων τα οποία ορίζουν τα γενετικά χαρακτηριστικά. Μέσω των γονιδίων γίνεται η μεταβίβαση των χαρακτηριστικών ενός ατόμου στους απογόνους του. Για την αναπαράσταση της πληροφορίας των ατόμων χρησιμοποιείται κατά κύρια βάση η δυαδική αναπαράσταση. Το χρωμόσωμα αποτελεί ουσιαστικά μια υποψήφια λύση του προβλήματος και κωδικοποιείται τις περισσότερες φορές ως μια ακολουθία από δυαδικά ψηφία. Τα γονίδια αντιστοιχούν είτε σε μεμονωμένα δυαδικά ψηφία είτε σε μια ομάδα δυαδικών ψηφίων αν ορίζεται έτσι η κωδικοποίηση των μεταβλητών του προβλήματος. Η απεικόνιση της υποψήφιας λύσης, γίνεται μέσω του φαινότυπου ο οποίος αποτελεί την πραγματική αναπαράσταση της υποψήφιας λύσης στο χώρο αναζήτησης και προκύπτει μέσω της αποκωδικοποίησης της δυαδικής συμβολοσειράς του ατόμου. Ο φαινότυπος ουσιαστικά δείχνει αυτό που βλέπουμε ως αποτέλεσμα και με βάση την τιμή του γίνεται η αξιολόγηση των υποψήφιων λύσεων. 6.2.2 Επιλογή χαρακτηριστικών και Γενετικοί Αλγόριθμοι Οι ΓΑ αποτελούν μια στοχαστική μέθοδο καθολικής βελτιστοποίησης με δυνατότητες παράλληλης επεξεργασίας ενός πληθυσμού υποψήφιων λύσεων (σημεία αναζήτησης). Χρησιμοποιούν πιθανοθεωρητικούς - στοχαστικούς κανόνες αναζήτησης όχι με την αυστηρή έννοια αφού η αναπαραγωγή των λύσεων εκτός της τυχαιότητας βασίζεται και στα αποτελέσματα της αξιολόγησης των λύσεων δηλαδή

50 Κεφάλαιο 6 το πόσο καλή είναι μια λύση και με βάση και αυτό το κριτήριο θα παραμένει και θα εξελιχθεί μέσα σε ένα πληθυσμό. Στο πρόβλημα της επιλογής χαρακτηριστικών τα μέλη του πληθυσμού είναι τα υποσύνολα χαρακτηριστικών (υποψήφιες λύσεις) που αναπαρίστανται από δυαδικά διανύσματα. Η επεξεργασία των υποψηφίων λύσεων λαμβάνει χώρα σε διακριτές φάσεις που ονομάζονται γενιές. Σε κάθε γενιά τα υποψήφια υποσύνολα χαρακτηριστικών αξιολογούνται βάση μιας αντικειμενικής συνάρτησης αξιολόγησης και οι πιο εύρωστες λύσεις επιλέγονται για αναπαραγωγή. Η αναπαραγωγή πραγματοποιείται διασταυρώνοντας χαρακτηριστικά (features) από διαφορετικούς υποσύνολα χαρακτηριστικών, ώστε να παραχθούν νέα υποσύνολα (children). Τα νέα υποσύνολα εισέρχονται στη συνέχεια στον πληθυσμό και η διαδικασία επαναλαμβάνεται ακολουθώντας ένα εξελικτικό μοτίβο (δαρβινικό περιβάλλον). Η καθολικά βέλτιστη μέθοδος βελτιστοποίησης και κατά συνέπεια και μια μέθοδος επιλογής χαρακτηριστικών θα πρέπει να συνδυάζει τα δύο ακόλουθα θεμελιώδη χαρακτηριστικά επίδοσης: αποτελεσματικότητα (effectiveness), δηλαδή υψηλή αξιοπιστία εντοπισμού (ή προσέγγισης) του καθολικού ακροτάτου της συνάρτησης ή αντίστοιχα του καθολικά βέλτιστου υποσυνόλων χαρακτηριστικών και, αποδοτικότητα (efficiency), δηλαδή υψηλή ταχύτητα σύγκλισης (εγγυημένος εντοπισμός του καθολικά βέλτιστου με εύλογο πλήθος δοκιμών). Τα χαρακτηριστικά αυτά πολλές φορές είναι αντικρουόμενα αφού τεχνικές συστηματικής αναζήτησης προσεγγίζουν το καθολικό βέλτιστο με ακρίβεια, αλλά ταυτόχρονα απαιτούν και υψηλό υπολογιστικό κόστος, ενώ οι γρήγορες τεχνικές άμεσης αναζήτησης εγκλωβίζονται εύκολα σε τοπικά ακρότατα. Τα εξελικτικά σχήματα βελτιστοποίησης και κατά συνέπεια και οι ΓΑ δείχνουν να υπερτερούν, στις περισσότερες κατηγορίες προβλημάτων βελτιστοποίησης. Μειονέκτημά τους, είναι η ύπαρξη αρκετών παραμέτρων εισόδου, που επηρεάζουν σημαντικά την επίδοση των αλγορίθμων (π.χ. μέγεθος πληθυσμού), ο ορισμός των οποίων απαιτεί πολλαπλούς πειραματικούς ελέγχους με διαφορετικές συνθήκες εκκίνησης. Οι σημαντικότεροι λόγοι χρησιμοποίησης των ΓΑ στο πρόβλημα της επιλογής χαρακτηριστικών είναι οι ακόλουθοι: Πραγματοποιούν ταυτόχρονη εξερεύνηση σε πολλά διαφορετικά υποσύνολα (σημεία του χώρου αναζήτησης) και επομένως η εξαγωγή βέλτιστων λύσεων προκύπτει μέσα από ένα πλήθος διαφορετικών υποσυνόλων χαρακτηριστικών. Για την εύρεση ενός καθολικά βέλτιστου υποσυνόλου χαρακτηριστικών οι ΓΑ ξεφεύγουν ως ένα βαθμό από τον εγκλωβισμό τους σε τοπικά βέλτιστα υποσύνολα χαρακτηριστικών. Αυτό γίνεται συνδυάζοντας υποσύνολα χαρακτηριστικών και δημιουργώντας παράλληλα νέα μέσω των διαδικασιών αναπαραγωγής του πληθυσμού. Έτσι προηγούμενες λύσεις που στην ουσία ενδεχομένως να είχαν εγκλωβίσει τον αλγόριθμο σε περιοχές τοπικών βέλτιστων απομακρύνονται.

Επιλογή χαρακτηριστικών και Γενετικοί Αλγόριθμοι. 51 Δουλεύουν με μια κωδικοποίηση των δεδομένων του προβλήματος και όχι με τα ίδια τα δεδομένα. Απαιτούν τη γνώση μόνο της αντικειμενικής συνάρτησης αξιολόγησης των υποσύνολων των χαρακτηριστικών. Μπορούν να συνδυαστούν με κάποια τοπική μέθοδος αναζήτησης αυξάνοντας την αποτελεσματικότητα και την αποδοτικότητα τους σε δύσκολα υπολογιστικά προβλήματα όπου η διάσταση του χώρου αναζήτησης είναι μεγάλη. Οι ΓΑ ως μέθοδοι επιλογής χαρακτηριστικών χρησιμοποιήθηκαν για πρώτη φορά το 1989 [18] και τα τελευταία χρόνια χρησιμοποιούνται ευρέως σε προβλήματα μείωσης της διάστασης στο χώρο της Μηχανικής Μάθησης. Στον τομέα της υπολογιστικής όρασης χρησιμοποιούνται συνήθως σε συνδυασμό με μεθόδους εξαγωγής χαρακτηριστικών όπως η PCΑ, όπου ο γενετικός αλγόριθμος επιλέγει το βέλτιστο υποσύνολο ιδιοδιανυσμάτων που προέκυψαν από τη μέθοδο PCA. 6.2.3 Δομή και Λειτουργία Γενετικού Αλγορίθμου Σε γενικές γραμμές η λειτουργία ενός ΓΑ καθορίζεται από τα ακόλουθα απλά βήματα: 1. Τυχαία αρχικοποίηση των μελών του αρχικού πληθυσμού. 2. Αξιολόγηση κάθε μέλους με βάση τη δοθείσα συνάρτηση αξιολόγησης καταλληλότητας. 3. Εφαρμογή της διαδικασίας της επιλογής για κάθε μέλος του τρέχοντος πληθυσμού. Άτομα με μεγάλη τιμή στη συνάρτηση καταλληλότητας έχουν μεγαλύτερη πιθανότητα να επιλεγούν. 4. Εφαρμογή της διαδικασίας της διασταύρωσης για κάποια μέλη του πληθυσμού με βάση την καθορισμένη πιθανότητα διασταύρωσης. 5. Εφαρμογή της διαδικασίας της μετάλλαξης για κάποια γονίδια των μελών του πληθυσμού με βάση την καθορισμένη πιθανότητα μετάλλαξης. 6. Επιστροφή στο βήμα 2 και έλεγχος κριτηρίου τερματισμού. Εάν δεν ικανοποιείται το κριτήριο τερματισμού η διαδικασία επαναλαμβάνεται από το βήμα 2. Στο σχήμα αποτυπώνονται διαγραμματικά τα παραπάνω βήματα:

52 Κεφάλαιο 6 Σχήμα 6.1 Αναπαράσταση λειτουργίας ΓΑ. 6.3 Εφαρμογή στην παρούσα εργασία Εχοντας εξάγει κάποια χαρακτηριστικά του πίσω χιαστού (επιφάνεια και τομή με δεξιά διαγώνιο στην περίπτωσή μας), ελέγχουμε την απόδοση του ANFIS για κάθε συνδυασμό των δύο αυτών χαρακτηριστικών. Επιλέγουμε και υοθετούμε αυτόν με τη μεγαλύτερη απόδοση. Έτσι δείχνουμε ότι υπάρχει η δυνατότητα να βρίσκουμε τη βέλτιστη λύση, διερευνώντας συνδυασμούς χαρακτηριστικών αλλά και παραμέτρων ή και τεχνικών. Δηλαδή το σύστημα μπορεί να κάνει έρευνα μόνο του.

Κεφάλαιο 7 Προτεινόμενη μέθοδος υλοποίησης σε DSP 7.1 Χαρακτηριστικά του DSP DM6437 EVM Η οικογένεια TMS320C64x + DSPs (συμπεριλαμβανομένης της συσκευής MS320DM6437) είναι η υψηλότερης απόδοσης σταθερής υποδιαστολής γενιά DSP της πλατφόρμας TMS320C6000 DSP. Η συσκευή DM6437 βασίζεται στην τρίτης γενιάς υψηλής απόδοσης, προηγμένης αρχιτεκτονικής VELOCITI very-long-instruction-word (VLIW) που αναπτύχθηκε από την Texas Instruments (TI), καθιστώντας αυτά τα DSPs μια εξαιρετική επιλογή για εφαρμογές ψηφιακών μέσων. Οι συσκευές C64x + είναι σε επίπεδο υποστήριξης κώδικα συμβατές με προηγούμενες συσκευές που αποτελούν μέρος της οικογένειας C6000 DSP.

Κεφάλαιο 7 54 Εικόνα 7.1 Η πλατφόρμα ανάπτυξης DM 6437 EVM Da Vinci Με απόδοση έως 5600 εκατομμύρια εντολές ανά δευτερόλεπτο (MIPS) σε συχνότητα ρολογιού 700 MHz, η οικογένεια C64x + προσφέρει λύσεις σε προκλήσεις προγραμματισμού υψηλής απόδοσης. Ο πυρήνας του επεξεργαστή DSP C64x + DSP έχει 64 γενικής χρήσης καταχωρητές μήκους λέξης 32-bit και οκτώ ανεξάρτητες λειτουργικές μονάδες. Επίσης διαθέτει δύο πολλαπλασιαστές που υποστηρίζουν 32-bit αποτελέσματα και έξι αριθμητικές και λογικές μονάδες (ALUs). Το είδος των εντολών που περιλαμβάνουν οι οκτώ λειτουργικές μονάδες επιτρέπουν την αύξηση της απόδοσης σε βίντεο και γενικές εφαρμογές απεικόνισης. Ο πυρήνας του DSP μπορεί να εκτελέσει τέσσερις 16-bit εντολές (πολλαπλασιασμών συσσώρευσης) σε έναν μόνο κύκλο, και να υποστηρίξει συνολικά 2.800 εκατομμύρια τέτοιου είδους εντολών ανά δευτερόλεπτο. Εναλλακτικά ο πυρήνας του DSP μπορεί να εκτελέσει οκτώ 8-bit εντολές (πολλαπλασιασμών συσσώρευσης) ανά κύκλο για συνολικά 5600 εντολές ανά δευτερόλεπτο. Επίσης, ο DM6437 υποστηρίζει υλικό ειδικών εφαρμογών, on-chip μνήμη, και επιπλέον on-chip περιφερειακά, παρόμοια με τις άλλες συσκευές της πλατφόρμας C6000 DSP. Ο πυρήνας DM6437 χρησιμοποιεί δύο επιπέδων cache-based αρχιτεκτονική. Το πρώτο επίπεδο μνήμης προγράμματος - cache (L1P) αποτελείται από μια μνήμη 256K-bit αποθηκευτικού χώρου που μπορεί να διαμορφωθεί ως αντιστοιχισμένη μνήμη (mapped memory) ή κρυφή μνήμη άμεσης αντιστοίχησης (direct mapped cache). Το δεύτερο επίπεδο της μνήμης - cache (L2) αποτελείται από έναν χώρο μνήμης 1M-bit που διαμοιράζεται μεταξύ του χώρου προγράμματος και του χώρου δεδομένων. Η μνήμη L2 μπορεί να χρησιμοποιηθεί είτε ως αντιστοιχισμένη μνήμη, είτε ως cache μνήμη, ή συνδυασμός και των δύο. Ως διεπαφή ανάμεσα στο χρήστη που εισάγει τις πληροφορίες και το Back-End κομμάτι που πραγματοποιεί video επεξεργασία, βρίσκεται το Front-End (VPFE) το οποίο υποστηρίζει και διαθέτει ένα σύνολο από μονάδες. Πιο αναλυτικά αποτελείται από ένα ελεγκτή CCD (CCDC), ένα σύστημα προεπισκόπησης (Previewer), μία μονάδα παραγωγής ιστογράμματος, μία μονάδα αυτόματης έκθεσης και εστίασης (H3A) και έναν Resizer. Ο CCDC διασυνδέεται με τους κοινούς αποκωδικοποιητές βίντεο, αισθητήρες CMOS, και συσκευές Charge Coupled Devices (CCDs).

Προτεινόμενη μέθοδος υλοποίησης σε DSP 55 Ο Previewer είναι μία μονάδα επεξεργασίας εικόνας πραγματικού χρόνου που παίρνει δεδομένα εικονοληψίας από ένα CMOS αισθητήρα CCD και το μετατρέπει από το πρότυπο RGB στο YUV422. Οι μονάδες ιστογράμματος (H3A) παρέχουν στατιστικές πληροφορίες σχετικά με τα δεδομένα χρώματος που διατίθενται προς χρήση από τον DM6437. Επίσης, ο Resizer αποδέχεται τα εικονοστοιχεία και είναι υπεύθυνο για την αλλαγή του μεγέθους της συνολικής εικόνας τόσο σε οριζόντιες όσο και σε κάθετες διαστάσεις. Το Back-End (VPBE) κομμάτι επεξεργασίας video αντίστοιχα, αποτελείται από μια μονάδα On-Screen Display Engine (OSD) που είναι σε θέση να χειρίζεται 2 ξεχωριστά παράθυρα video και έναν κωδικοποιητή βίντεο (VENC). Ο κωδικοποιητής βίντεο (VENC) παρέχει τέσσερις αναλογικές DACs υπο-μονάδες που λειτουργούν στα 54 MHz, παρέχοντας ένα μέσο για σύνθεση βίντεο διαμόρφωσης NTSC / PAL και S-Video. Επίσης η VENC παρέχει έως και 24 bits ψηφιακής εξόδου για τη διασύνδεση με συσκευές τύπου RGB888 Το σετ των περιφερειακών περιλαμβάνει 2 θύρες ρύθμισης βίντεο οι οποίες διαχειρίζονται δεδομένα εισόδου / εξόδου. Η ταχύτητα των θυρών φτάνει αντίστοιχα τα 10/100 Mb/s Ethernet MAC (EMAC). Επιπροσθέτως περιλαμβάνει ένα ολοκληρωμένο κύκλωμα διεπαφής (I2C), δύο πολυκάναλες ρυθμιζόμενες σειριακές θύρες (McBSPs), μία πολυκαναλική σειριακή θύρα ήχου (McASP0),2 χρονιστές γενικής χρήσης των 64bit που χρησιμοποιούνται ως 2 ανεξάρτητοι χρονιστές των 32-bit, 1 64-bit watchdog timer, μία 16-bit host-port interface (HPI) θύρα διασύνδεσης και 111-pins εξωτερικής διασύνδεσης γενικής χρήσης εισόδου / εξόδου (GPIO) με προγραμματιζόμενη λογική interrupt / event. Επίσης διαθέτει 2 UARTs με hardware handshaking support σε μία από αυτές, τρείς εξόδους περιφερειακών pulse width modulator (PWM), ένα controller area network (CAN) και μία περιφερειακή θύρα PCI στα 33 MHz. Επιπλέον διαθέτει δύο glueless εξωτερικές διασυνδέσεις μνήμης από τις οποίες η μία λειτουργεί ως ασύγχρονη (EMIFA) για πιο αργές μνήμες / περιφερειακά και η δεύτερη ως μία διεπαφή υψηλότερης ταχύτητας, προορισμένη για διασυνδέσεις σύγχρονων μνημών όπως η DDR2. Σχήμα 7.1 Το διάγραμμα τμημάτων της DM6437

Κεφάλαιο 7 56 Η τεχνολογία DaVinci που υποστηρίζει ένας μεγάλος αριθμός DSPs της Texas Instruments στηρίζεται στη φιλοσοφία ενσωμάτωσης στο chip ενός πυρήνα επεξεργαστή γενικού σκοπού μαζί με τον DSP πυρήνα. Έτσι ο επεξεργαστής γενικού σκοπού αναλαμβάνει τις διαδικασίες ελέγχου περιφερειακών και μνήμης, παρέχοντας περισσότερη ευχέρεια στον DSP να απασχολείται με την επεξεργασία των σημάτων video και ήχου. 7.2 Ανάπτυξη εφαρμογών με χρήση Simulink Ο κώδικας υλοποίησης της εργασίας σε Matlab, μπορεί να κατέβει στην πλατφόρμα DM6437 με τη βοήθεια της Simulink η οποία έχει τα κατάλληλα blocks ώστε να ενσωματώσει τις συναρτήσεις μας, μαζί με τα μπλόκ εισόδου εξόδου από τον DSP. Πλεονεκτήματα Εύκολη και γρήγορη ανάπτυξη πολύπλοκων αλγορίθμων και διαχείριση των περιφερειακών Το μεγαλύτερο μέρος του χρόνου ανάπτυξης αφιερώνεται στο αλγοριθμικό κομμάτι των εφαρμογών Μειονεκτήματα Παραγωγή μη βέλτιστου C κώδικα Οι εφαρμογές παρουσιάζουν μειωμένη απόδοση κατά την εκτέλεση Εγινε προσπάθεια να τρέξει και στον DSP ο αλγόριθμος, ώστε να συγκριθούν οι χρόνοι με τον προσωπικό υπολογιστή. (8πύρηνος AMD FX8320 3.5GHZ 8GB RAM )

Προτεινόμενη μέθοδος υλοποίησης σε DSP 7.3 Προτεινόμενη μεθοδολογία Σχήμα 7.2 Προτεινόμενη μέθοδος διάγνωσης 57

Κεφάλαιο 7 58 Εικόνα 7.2 Εκπαίδευση του συστήματος Η εισαγωγή των χαρακτηρισμένων τομογραφιών, εκπαιδεύουν το νευρωνικό σύστημα ώστε να μπορεί να χαρακτηρίσει άγνωστες τομογραφίες ικανοποιητικά.

Προτεινόμενη μέθοδος υλοποίησης σε DSP 7.4 Πειραματικά δεδομένα. Από το Ολύμπιο θεραπευτήριο πήραμε τις σειρές τομοφραφιών που δίνονται στο παράρτημα 1. Στις παρακάτω εικόνες δίνουμε τα στάδια επεξεργασίας ώστε να μπορέσουμε να εκπαιδεύσουμε το σύστημα να κάνει διάγνωση. Εικόνα 7.3 Τομογραφίες δεξιού γόνατος. Εικόνα 7.4 Η περιοχή ενδιαφέροντος του πίσω χιαστού. Εικόνα 7.5 Φιλτράρισμα με mean shift. 59

Κεφάλαιο 7 60 Εικόνα 7.6 Χωρίσμός σε υπερεικονοστοιχεία. Εικόνα 7.7 Αντικατάσταση των υπερεικονοστοιχείων με το μέσο όρο φωτεινότητας Εικόνα 7.8 Εφαρμογή του αλγόριθμου HMRF-EM

Προτεινόμενη μέθοδος υλοποίησης σε DSP Εικόνα 7.9 Απομόνωση του πίσω χιαστού Επιλέξαμε 17 τομογραφίες δεξιού γόνατος. Εστιάσαμε στη περιοχή ενδιαφέροντος του πίσω χιαστού. Φιλτράραμε με mean shift. Χωρίσαμε σε υπερεικονοστοιχεία. Αντικαταστήσαμε τα υπερεικονοστοιχεία με το μέσο όρο φωτεινότητας. Εφαρμόσαμε τον αλγόριθμο HMRF-EM ώστε να τμηματοποιήσουμε την εικόνα σε δύο επίπεδα. Απομονώσαμε τον πίσω χιαστό και επιλέξαμε ως χαρακτηριστικά την επιφάνειά του και την τομή του με τη δεξιά διαγώνια. Κανονικοποιήσαμε τα 2 αυτά χαρακτηριστικά στο 0..1 και επισυνάψαμε την γνώμη του ειδικού για το αν είναι κανονικός ο πίσω χιαστός (1) ή όχι (0). Επιφάνεια Τομή 0,47 0,51 0,43 0,40 0,49 0,37 0,89 1 0,35 0,20 0,60 0,48 0,64 0,74 0,18 0 0,90 0,71 0,32 0,45 0,84 0,54 0,41 0,25 0,79 0,60 0,29 0,37 1 0,85 0,61 0,48 0,41 0,14 Φυσιολ. 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 Πίνακας 7.1 Πίνακας τιμών των δύο χαρακτηριστικών και χαρακτηρισμός της τομογραφίας. 61

Κεφάλαιο 7 62 Δημιουργήσαμε και εκπαιδεύσαμε το νευρωνικό δίκτυο με αυτά τα δεδομένα αφού τα χωρίσαμε σε 2 ομάδες: Η μία για εκπαίδευση και η άλλη για έλεγχο. Ο γενετικός αλγόριθμος δοκίμασε το κάθε χαρακτηριστικό ξεχωριστά και μαζί ώστε να κρίνει πότε έχουμε μεγαλύτερη ακρίβεια. Βλέπουμε στο παρακάτω σχήμα την διακύμανση λάθους στην εκπαίδευση (μπλέ γραμμή). Το λάθος ελέγχου (πράσινη γραμμή) είναι της τάξης 12 x 10Ε-06 Εικόνα 7.10 Λάθη για τα δύο χαρακτηριστικά Εικόνα 7.11 Λάθη για ένα μόνο χαρακτηριστικό Συμπεραίνουμε ότι χρησιμοποιώντας και τα δύο χαρακτηριστικά σαν είσοδο για να εκπαιδεύσουμε το ANFIS, δίνουν μικρότερα λάθη κατά τον έλεγχο, άρα είναι