ΘΕΜΑ: Ανάλυση εικόνων από γαστροσκοπική κάψουλα για την εξαγωγή διαγνωστικής πληροφορίας με χρήση μεθόδων υφής



Σχετικά έγγραφα
Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Digital Image Processing

Επεξεργασία Εικόνων από Ασύρματη Ενδοσκόπηση

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Ιατρική Πληροφορική. Δρ. Π. ΑΣΒΕΣΤΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ Τ.Ε.

Γνωστική Ψυχολογία Ι (ΨΧ32)

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Συστήματα συντεταγμένων

2 Η ΠΡΟΟΔΟΣ. Ενδεικτικές λύσεις κάποιων προβλημάτων. Τα νούμερα στις ασκήσεις είναι ΤΥΧΑΙΑ και ΟΧΙ αυτά της εξέταση

Συνέντευξη με τον Παθολόγο - Ογκολόγο, Στυλιανό Γιασσά

Επεξεργασία Χαρτογραφικής Εικόνας

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης

Φυσική για Μηχανικούς

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

Φυσική για Μηχανικούς

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

2.0 ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ-ΟΡΟΛΟΓΙΕΣ

MPEG-7 : Περιγραφή πολυμεσικού περιεχομένου

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Παρουσίαση Νο. 5 Βελτίωση εικόνας

ΔΗΜΟΣΙΑ ΔΙΑΒΟΥΛΕΥΣΗ ΤΕΧΝΙΚΩΝ ΠΡΟΔΙΑΓΡΑΦΩΝ ΠΡΟΜΗΘΕΙΑΣ ΔΥΟ (2) ΕΝΔΟΣΚΟΠΙΩΝ (CPV ) (ΠΠΥΥ 2014)(ΚΑΕ 7127)

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή διατριβή

Δυσκοίλιο, θεωρούμε ένα άτομο όταν εμφανίζει δύο τουλάχιστον από τα παρακάτω προβλήματα για 3 ή περισσότερους μήνες:

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Εισαγωγή στην επιστήμη των υπολογιστών

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

Σημαντικές χρονολογίες στην εξέλιξη της Υπολογιστικής Τομογραφίας

ΤΕΚΜΗΡΙΩΣΗ ΙΦΝΕ ΕΝΔΕΙΞΕΙΣ ΚΑΙ ΕΡΜΗΝΕΙΑ ΤΗΣ ΕΝΔΟΣΚΟΠΙΚΗΣ ΚΑΨΟΥΛΑΣ. Νίκος Βιάζης Β Γαστρεντερολογικό Τμήμα Γ.Ν.Α. «Ο Ευαγγελισμός»

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ. Διάθλαση μέσω πρίσματος - Φασματοσκοπικά χαρακτηριστικά πρίσματος.

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας

ΕΡΓΑΣΤΗΡΙΟ ΠΟΛΥΜΕΣΩΝ ΚΑΙ ΓΡΑΦΙΚΩΝ

ΑΚΤΙΝΟΣΚΟΠΗΣΗ. Ευάγγελος Παντελής Επ. Καθ. Ιατρικής Φυσικής Εργαστήριο Ιατρικής Φυσικής Ιατρική Σχολή Αθηνών.

Αναγνώριση Προτύπων Ι

ισδιάστατοι μετασχηματισμοί ΚΕΦΑΛΑΙΟ 4: ισδιάστατοι γεωμετρικοί μετασχηματισμοί

DIP_04 Σημειακή επεξεργασία. ΤΕΙ Κρήτης

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

Α.Τ.Ε.Ι. Ηρακλείου Ψηφιακή Επεξεργασία Εικόνας ιδάσκων: Βασίλειος Γαργανουράκης. Ανθρώπινη Όραση - Χρωµατικά Μοντέλα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Π Ρ Ο Κ Η Ρ Υ Σ Ο Υ Μ Ε

Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ. Εργαστήριο 8 ο. Αποδιαμόρφωση PAM-PPM με προσαρμοσμένα φίλτρα

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

ΠΡΟΛΗΨΗ ΤΟΥ ΚΑΡΚΙΝΟΥ ΤΟΥ ΠΑΧΕΟΣ ΕΝΤΕΡΟΥ

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

ΤΜΗΜΑ: ΟΙΚΟΝΟΜΙΚO ΓΡΑΦΕΙΟ: ΠΡΟΜΗΘΕΙΩΝ Ταχ. Δ/νση: Αφεντούλη και Ζαννή Πληροφορίες: ΚΑΡΔΑΣΗ ΑΡΓΥΡΩ Τηλέφωνο: Φαξ:

Δυαδικό Σύστημα Αρίθμησης

ΠΟΣΟΤΙΚΗ ΓΕΝΕΤΙΚΗ 03. ΜΕΣΗ ΤΙΜΗ & ΔΙΑΚΥΜΑΝΣΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Πανεπιστήμιο Θεσσαλίας. Πολυτεχνική Σχολή ΘΕΜΑΤΙΚΗ : ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ ιάθλαση µέσω πρίσµατος Φασµατοσκοπικά χαρακτηριστικά πρίσµατος

Εφαρμοσμένη Οπτική. Γεωμετρική Οπτική

ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ ΤΗΣ ΟΠΗΣ ΩΣ ΒΑΣΙΚΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΤΟΥ ΣΧΗΜΑΤΟΣ

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Επεμβατική Ακτινολογία: Η εναλλακτική σου στη χειρουργική

Τα οφέλη της λαπαροσκοπικής χολοκυστεκτομής στην πράξη - Ο Δρόμος για την Θεραπεία Δευτέρα, 27 Δεκέμβριος :17

ΕΡΓΑΣΤΗΡΙΟ 3 ΟΡΓΑΝΑ ΚΑΙ ΥΛΙΚΑ ΑΕΡΟΦΩΤΟΓΡΑΦΗΣΗΣ. 1. Εξέδρες για αεροφωτογράφηση

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ

ΟΔΟΝΤΙΑΤΡΙΚΗ ΑΚΤΙΝΟΓΡΑΦΙΑ

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Μελέτη προβλημάτων ΠΗΙ λόγω λειτουργίας βοηθητικών προωστήριων μηχανισμών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

πάχος 0 πλάτος 2a μήκος

ΕΘΝΙΚΗ ΕΠΙΤΡΟΠΗ ΠΡΟΛΗΨΗΣ ΚΑΡΚΙΝΟΥ ΠΑΧΕΟΣ ΕΝΤΕΡΟΥ ΠΡΟΛΗΨΗ ΤΟΥ ΚΑΡΚΙΝΟΥ ΤΟΥ ΠΑΧΕΟΣ ΕΝΤΕΡΟΥ

ΑΣΚΗΣΕΙΣ ΥΠΟΛΟΓΙΣΜΟΥ ΜΑΖΑΣ ΘΕΣΗΣ ΚΕΝΤΡΟΥ ΜΑΖΑΣ ΡΟΠΗΣ ΑΔΡΑΝΕΙΑΣ ΣΩΜΑΤΩΝ

ΚΕΦΑΛΑΙΟ 3 ο 3.1 ΑΝΑΛΥΣΗ ΒΑΘΜΟΛΟΓΙΑΣ Μαθήµατα γενικής παιδείας Ιστορία. Α. Σύνολο νοµού Αργολίδας

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΕΝΔΟΣΚΟΠΙΚΟΥ ΕΞΟΠΛΙΣΜΟΥ

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης

Εισαγωγή στις Ηλεκτρικές Μετρήσεις

1 η ΣΕΙΡΑ ΑΣΚΗΣΕΩΝ. / 2. Οι όροι Eb. και Ec

Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες

Γραφικά με υπολογιστές. Διδάσκων: Φοίβος Μυλωνάς. Διαλέξεις #11-#12

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΟΠΤΙΚΗΣ ΤΟΜΟΓΡΑΦΙΑΣ ΣΥΝΟΧΗΣ-OCT ΜΕ ΨΗΦΙΑΚΗ ΑΓΓΕΙΟΓΡΑΦΙΑ

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 11 η : θεωρία Χρώματος & Επεξεργασία Έγχρωμων Εικόνων

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Αξιοποίηση Φυσικών Αντιοξειδωτικών στην Εκτροφή των Αγροτικών

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ

ΒΙΟΜΗΧΑΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ

(Computed Tomography, CT)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Διαταραχές του στομάχου.

Ραδιομετρική Ενίσχυση - Χωρική Επεξεργασία Δορυφορικών Εικόνων

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΟΝΟΜΑ: ΚΑΤΣΙΜΕΡΟΥ ΧΡΙΣΤΙΝΑ ΑΕΜ : 5762 ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: Ανάλυση εικόνων από γαστροσκοπική κάψουλα για την εξαγωγή διαγνωστικής πληροφορίας με χρήση μεθόδων υφής Επιβλέποντες: Λεόντιος Χατζηλεοντιάδης Βασίλειος Χαρίσης ΘΕΣΣΑΛΟΝΙΚΗ 2011 1

Ευχαριστίες Ευχαριστώ τον κ. Λεόντιο Χατζηλεοντιάδη για τη συνεργασία και την ευκαιρία μου έδωσε να ασχοληθώ με αυτό το θέμα. Επίσης το Βασίλη Χαρίση, μεταπτυχιακό φοιτητή, για τη βοήθεια που μου πρόσφερε στη διάρκεια εκπόνησης της εργασίας. Τέλος ένα θερμό ευχαριστώ στην οικογένειά μου που με στηρίζει σε όλα τα χρόνια των σπουδών μου. 2

Περιεχόμενα Ευχαριστίες... 2 ΚΕΦΑΛΑΙΟ 1... 4 1.1Εισαγωγή... 5 1.2 Φυσιολογία του εντέρου... 6 1.3 Το πρόβλημα του έλκους... 6 1.4 Είδη απεικονιστικών μεθόδων... 7 1.5 Γαστρεντερική ενδοσκόπηση-ασύρματη Κάψουλα... 9 1.6 State-of-the-art.... 13 ΚΕΦΑΛΑΙΟ 2... 15 2.1 Ανάλυση υφής... 15 2.2 Φάσμα υφής (Texture Unit)... 26 2.3 Τοπικό δυαδικό πρότυπο (LBP)... 22 2.3.1 Επεκτάσεις του LBP... 23 2.3.2 Σύγκριση LBP και TU... 28 ΚΕΦΑΛΑΙΟ 3... 29 3.1 Περιστροφή χρώματος... 29 ΚΕΦΑΛΑΙΟ 4... 35 4.1 Πειραματικά δεδομένα... 35 4.2 Εφαρμογή Φάσματος Υφής.... 39 4.2.1 Στατιστικά χαρακτηριστικά... 39 4.2.2 Χαρακτηριστικά φάσματος υφής (BWS,GS,DD,Orientational features,cs)... 43 4.3 Εφαρμογή LBP... 45 4.4 Εφαρμογή περιστροφής χρώματος... 49 ΚΕΦΑΛΑΙΟ 5... 53 5.1 Συμπεράσματα... 53 5.2 Μελλοντική εργασία... 54 3

Κεφάλαιο 1 1.1 Εισαγωγή Το λεπτό έντερο είναι το δυσκολότερο μέρος του πεπτικού σωλήνα για εξέταση, και κατά συνέπεια, για διάγνωση των παθήσεων και των καταστάσεων που το αφορούν. Οι δυσκολίες προκύπτουν κυρίως από το μεγάλο μήκος του και τις πολλές περιελίξεις εντός της κοιλιακής κοιλότητας. Οι συμβατικές μέθοδοι ενδοσκόπησης είναι επεμβατικές και προκαλούν δυσφορία στον ασθενή, ενώ δεν καταφέρνουν να προσπελάσουν το μεσαίο τμήμα του λεπτού εντέρου. Τα τελευταία 25 χρόνια η ιατρική κοινότητα έγινε μάρτυρας μιας αλματώδους ανάπτυξης της τεχνολογίας στις ενδοσκοπήσεις του πεπτικού συστήματος. Η αντικατάσταση των ινοενδοσκοπίων από βιντεοσκόπια, η ανάπτυξη της ενδοσκοπικής υπερηχοτομογραφίας και της θεραπευτικής ενδοσκόπησης, η εφαρμογή της χρωμοενδοσκόπησης και η ανακάλυψη της βιντεοκάψουλας είναι η σημερινή εικόνα της σύγχρονης Γαστρεντερολογίας. Η ανακάλυψη της ασύρματης βιντεοκάψουλας αποτελεί σήμερα τη σημαντικότερη εξέλιξη των τελευταίων ετών στις απεικονιστικές μεθόδους, διότι καθιστά την ενδοσκόπηση μία μη επεμβατική, ανώδυνη και αποτελεσματική μέθοδο, που μπορεί να εφαρμοστεί ακόμη και σε επιβαρυμένους ηλικιωμένους ασθενείς με καρδιοαναπνευστικά προβλήματα. Μεγάλο πλεονέκτημα της μεθόδου είναι η δυνατότητα εξέτασης ολόκληρου του λεπτού εντέρου, ακόμη και του μεσαίου τμήματος, που ήταν απροσπέλαστο με τις κλασικές ενδοσκοπικές μεθόδους. Δε θα ήταν υπερβολή να πούμε ότι με τη νέα τεχνολογία η ενδοσκόπηση του λεπτού εντέρου αποτελεί ίσως την πιο εύκολη και ανώδυνη εξέταση που μπορεί να υποστεί ένας ασθενής. Σκοπός της παρούσας εργασίας είναι η ανάλυση των εικόνων του λεπτού εντέρου, που παράγει η ασύρματη κάψουλα, η μελέτη τους και η επεξεργασία τους ώστε να εξαχθούν περιοχές ενδιαφέροντος με υποψία παθολογικής κατάστασης έλκους. Για την ανάλυση χρησιμοποιείται ένας συνδυασμός μια σειράς από μεθόδους υφής, που εφαρμόζονται σε εικόνες σε κλίμακα του γκρι, και μιας «χρωματικής» για την αξιοποίηση της πληροφορίας χρώματος που είναι σημαντική στη διάγνωση έλκους, όπως θα φανεί παρακάτω. 4

1.2 Φυσιολογία του εντέρου Ο γαστρεντερικός σωλήνας (GIΤ) ή πεπτικός σωλήνας είναι ένας ελικοειδής σωληνοειδής διάδρομος που έχει αφετηρία τη στοματική κοιλότητα και καταλήγει στον πρωκτό. Το σύνολο τον οργάνων που τον αποτελούν δέχεται την τροφή, την αφομοιώνει με σκοπό την παραγωγή ενέργειας και θρεπτικών συστατικών και αποβάλλει τα υπολείμματα. Επομένως, οι κύριες λειτουργίες του GIT είναι η κατάποση, η πέψη, η απορρόφηση και η αφόδευση. Σε ένα μέσο ενήλικα άντρα το μήκος του GIT είναι περίπου 6.5 μέτρα και αποτελείται από τον άνω και κάτω γαστρεντερικό σωλήνα. Ο άνω GIT αποτελείται από: Τη στοματική κοιλότητα και τον φάρυγγα που υποδέχονται την τροφή Τον οισοφάγο,που είναι ένας λεπτός μυώδης σωλήνας που οδηγεί την τροφή από την στοματοφαρυγγική κοιλότητα στο στομάχι Το στομάχι που αποτελεί το κύριο όργανο επεξεργασίας της τροφής Ο κάτω GIT αποτελείται από: Το λεπτό έντερο όπου κυρίως γίνεται η απορρόφηση της τροφής Το παχύ έντερο που φιλοξενεί τα άχρηστα υπολείμματα της τροφής Τον πρωκτό από όπου γίνεται η αφόδευση Η αρχική μοίρα του λεπτού εντέρου λέγεται δωδεκαδάκτυλο, ενώ το αρχικό τμήμα του δωδεκαδάκτυλου σχηματίζει το βολβό, που είναι και η συνηθέστερη θέση ανάπτυξης έλκους. Το τοίχωμα του οισοφάγου, του στομάχου και του εντέρου αποτελείται από 3 στοιβάδες ιστών (χιτώνες) οι οποίες από έξω προς τα μέσα είναι: Ο ορογόνος χιτώνας Η μυϊκή στοιβάδα (serosa) η οποία αναδεύει και παράλληλα προωθεί την τροφή με μυικές συσπάσεις (περισταλτισμός). Η βλεννογόνος (mucosa) που εκκρίνει υγρά (στο στομάχι και το έντερο), και ένζυμα που είναι απαραίτητα για την πέψη της τροφής. Προσεκβολές της βλεννογόνου είναι οι λάχνες. Εικόνα 1.1 Ιστολογία του λεπτού εντέρου 5

Εικ 1.3 Στομάχι και δωδεκαδάκτυλο Εικόνα 1.2 Γαστρεντερικός σωλήνας 1.3 Το πρόβλημα του έλκους Έλκος ονομάζεται οποιαδήποτε εσωτερική ή εξωτερική πληγή. Ο όρος χρησιμοποιείται κυρίως για ανοιχτές πληγές του στομάχου και του δωδεκαδάκτυλου. Πρόκειται για μία διάβρωση της βλεννογόνου του στομάχου ή της άνω μοίρας του δωδεκαδάκτυλου (βολβού), που ανάλογα με το βάθος της καθορίζει τη σοβαρότητα της πάθησης. Η παθογένεια της νόσου δεν έχει διευκρινιστεί πλήρως και μπορεί να οφείλεται σε παράγοντες περιβαλλοντικούς (φάρμακα-ιδιαίτερα μη στεροειδή αντιφλεγμονώδη, κάπνισμα, αλκοόλ), γενετικούς, μικροβιακούς κ.ά. Το χαρακτηριστικό σύμπτωμα 6

είναι ο πόνος που εντοπίζεται στη μεσότητα του άνω μέρους της κοιλιακής χώρας (επιγάστριο) και εμφανίζεται χαρακτηριστικά πριν τα γεύματα. Παρόλα αυτά μόνο το 5-10% εκδηλώνει συμπτώματα της νόσου. Το έλκος είναι μία από τις πιο συχνές παθήσεις, αφού προσβάλει περίπου το 25% των ανδρών και το 15% των γυναικών, όπως αποδεικνύεται από ουλές που βρίσκονται στο στομάχι και το δωδεκαδάκτυλο σε νεκροτομικό υλικό. Το δωδεκαδακτυλικό έλκος είναι 2-3 φορές πιο συχνό από το έλκος του στομάχου και 2-3 φορές πιο συχνό στους άνδρες από ότι στις γυναίκες. Στην πλειονότητα των περιπτώσεων τα έλκη από μόνα τους ή μετά από θεραπεία επουλώνονται αλλά σπανιότερα είναι δυνατόν να υποτροπιάσουν και να παρουσιάσουν σοβαρές επιπλοκές, όπως γαστρορραγία, διάτρηση ή πυλωρική στένωση. Από τις παραπάνω σοβαρότερη είναι η διάτρηση που μπορεί να οδηγήσει ακόμα και στο θάνατο. Εικ.1.4 Εικόνες έλκους από ενδοσκοπική κάψουλα Pillcam SB 1.4 Είδη απεικονιστικών μεθόδων Οι απεικονιστικές μέθοδοι χωρίζονται σε 2 κατηγορίες, τις ακτινολογικές και τις ενδοσκοπικές. Στις ακτινολογικές εντάσσονται η ακτινογραφία κοιλίας, η διάβαση λεπτού εντέρου και η εντερόκλυση. Η ακτινογραφία κοιλίας είναι μια απλή αλλά ωστόσο σημαντική εξέταση στη διερεύνηση και τη διάγνωση των νόσων του λεπτού εντέρου. Κυρίως μελετάται η 7

κατανομή του αέρα στις εντερικές έλικες. Απαιτείται προσεκτική μελέτη της απλής ακτινογραφίας και η σημασία της δε θα πρέπει να παραγνωρίζεται. Η διάβαση του λεπτού εντέρου γίνεται με τη χορήγηση βαρίου από το στόμα σε επαρκή ποσότητα, ώστε με τη βοήθεια του περισταλτισμού να σκιαγραφηθούν βαθμιαία οι έλικες του λεπτού εντέρου. Είναι μια εξέταση που γίνεται εύκολα σε οποιοδήποτε ακτινολογικό εργαστήριο, δεν ταλαιπωρεί τον ασθενή και στερείται παρενεργειών. Εάν γίνει με σωστή τεχνική παρέχει σημαντικές πληροφορίες για τις περισσότερες παθήσεις του λεπτού εντέρου που αφορούν το βλεννογόνο ή το τοίχωμα του εντέρου. Εντούτοις, δεν μπορεί να αναδείξει επίπεδες βλάβες, όπως οι αγγειοδυσπλασίες. Η εντερόκλυση είναι μια μέθοδος κατά την οποία εισάγεται σκιαγραφική ουσία κατευθείαν στο λεπτό έντερο με τη βοήθεια καθετήρα. Ο καθετήρας εισάγεται από το στόμα προς το στομάχι και το τέλος της αγκύλης του δωδεκαδακτύλου ή την αρχή 3 της νήστιδας. Δια του καθετήρα εισάγεται βάριο 700-800 cm πυκνότητας 25%. Η μέθοδος υπερέχει έναντι των άλλων ακτινολογικών εξετάσεων επειδή η πλήρωση του εντέρου δεν εξαρτάται από την κένωση του στομάχου ή την ταχύτητα διέλευσης του βαρίου. Η ακρίβειά της είναι καλύτερη σε περιπτώσεις αιμορραγίας, αλλά μικρή στη διάγνωση αγγειοδυσπλασιών. Στις ενδοσκοπικές εξετάσεις εντάσσονται η Sonde εντεροσκόπηση, η Push εντεροσκόπηση και η εντεροσκόπηση double-balloon. Η Sonde εντεροσκόπηση ήταν η πρώτη μέθοδος επιτυχούς ελέγχου ολόκληρου του λεπτού εντέρου. Το SIF-SW εντεροσκόπιο (Olympus corporation), που χρησιμοποιείται στη μέθοδο, με προσοφθάλμιο φακό έχει μήκος 256 cm, διάμετρο 5 mm και γωνία όρασης 120 μοίρες. Στην άκρη του ενδοσκοπίου υπάρχει μπαλόνι που φουσκώνεται, ώστε με τον περισταλτισμό του λεπτού εντέρου, το όργανο να προωθείται προς τον τελικό ειλεό. Το ενδοσκόπιο εισάγεται από τη μύτη εντός του στομάχου και υποβοηθάται με ένα άλλο ενδοσκόπιο (εντεροσκόπιο ή κολονοσκόπιο), που εισάγεται από το στόμα. Ο ακτινοσκοπικός έλεγχος είναι απαραίτητος για την παρακολούθηση της καθόδου του εντεροσκοπίου προς τον τελικό ειλεό. Η επισκόπηση του βλεννογόνου γίνεται κατά τη φάση της απόσυρσης του οργάνου και όχι κατά τη φάση της παθητικής καθόδου του. Παρόλο τον αρχικό ενθουσιασμό, οι πιθανότητες ελέγχου ολόκληρου του λεπτού εντέρου με τη μέθοδο αυτή ανέρχονται σε 70-80%, με μέσο χρόνο εξέτασης να κυμαίνεται μεταξύ 6-8 ωρών. Η χρήση της μεθόδου ενδείκνυται κυρίως για την εξέταση ασθενών με αδιευκρίνιστης αιτιολογίας απώλεια αίματος από το πεπτικό. Στην push εντεροσκόπηση απαιτείται η από του στόματος είσοδος ενός μακρού ενδοσκοπίου με τον ασθενή να βρίσκεται σε καταστολή και αναλγησία. Το εντεροσκόπιο που χρησιμοποιείται συχνά (SIF-10, Olympus Corporation) έχει εξωτερική διάμετρο 11.3mm, κανάλι βιοψίας 2.8mm και συνολικό μήκος 200cm. Με τη βοήθεια ενός προστατευτικού σωλήνα, διαδοχικές αγκιστρώσεις και αποσύρσεις, αλλαγές της θέσης του ασθενούς, πίεση στην κοιλιά και επαναπροωθήσεις επιτυγχάνεται η ενδοσκόπηση. Το μεγάλο πλεονέκτημα της προωθητικής ενδοσκόπησης είναι η δυνατότητα λήψης βιοψιών, καυτηριασμού βλαβών και 8

πολυεκτομής. Η χρήση της μεθόδου ενδείκνυται κυρίως για την εξέταση ασθενών με αδιευκρίνιστης αιτιολογίας απώλεια αίματος από το πεπτικό. Η εντεροσκόπηση double balloon είναι μία νέας γενιάς εντεροσκόπηση, στην οποία η είσοδος του ενδοσκοπίου γίνεται και από το στόμα και από το ορθό και η επισκόπηση ολόκληρου του λεπτού εντέρου είναι εφικτή αν χρησιμοποιηθούν και οι δύο οδοί. Η μέθοδος βασίζεται σε δύο μπαλόνια, ένα στην άκρη του ενδοσκοπίου και ένα στην άκρη του μαλακού προστατευτικού σωλήνα, με τον οποίο γίνεται η διείσδυση χωρίς να δημιουργούνται περιελίξεις. Η εξέταση διενεργείται υπό καταστολή. Η διαγνωστική ικανότητα της ανέρχεται στο 76%. Όσον αφορά τα τεχνικά χαρακτηριστικά, πρόκειται για ένα λεπτό ενδοσκόπιο διαμέτρου 8.5mm, πρόσθιας όρασης, με πεδίο όρασης 120 μοίρες, μήκους 200-230cm, ενώ ο προστατευτικός σωλήνας έχει μήκος 145 cm και εξωτερική διάμετρο 12.2mm. Ιδιαίτερο πλεονέκτημα αυτής της νέας μεθόδου είναι η δυνατότητα πραγματοποίησης των περισσότερων επεμβατικών πράξεων αποφεύγοντας τη διενέργεια χειρουργικής επέμβασης. Εικ.1.5 Εικόνες από ενδοσκόπηση double-balloon από το λεπτό έντερο.στα αριστερά φυσιολογική εικόνα,στα δεξιά εικόνα πολύποδα 1.5 Γαστρεντερική ενδοσκόπηση-ασύρματη κάψουλα Η εντεροσκόπηση με ασύρματη κάψουλα αποτελεί το νέο επίτευγμα της ιατρικής τεχνολογίας, που ήρθε να συμπληρώσει τον μέχρι σήμερα ακτινολογικό και ενδοσκοπικό έλεγχο του λεπτού εντέρου. Χρησιμοποιήθηκε για πρώτη φορά σε ασθενή το 1999, στην Ελλάδα εφαρμόστηκε για πρώτη φορά σε Δημόσιο Νοσοκομείο τον Ιούλιο του 2002, και διαδίδεται ολοένα και περισσότερο. Η ασύρματη ενδοσκόπηση με κάψουλα Pillcam SB είναι μια ανώδυνη μέθοδος, που επιτρέπει την ενδοσκοπική απεικόνιση ολόκληρου του μήκους του λεπτού εντέρου χωρίς να απαιτείται καταστολή του ασθενή ή εμφύσηση αέρα (κάτι που είναι ιδιαίτερα επώδυνο για τον ασθενή). Η κάψουλα χρησιμοποιεί τον φυσικό περισταλτισμό του εντέρου για την προώθησή της, ενώ φωτογραφίζει συνεχώς και μεταδίδει τις εικόνες μέσω ραδιοκυμάτων σε ειδικούς σένσορες, που βρίσκονται 9

προσκολλημένοι στο σώμα του ασθενή και συνδέονται με το μηχάνημα καταγραφής. Μετά από περίπου οκτώ ώρες, αφού έχει διασχίσει ολόκληρο το γαστρεντερικό σωλήνα, αποβάλλεται με τις κενώσεις και ο ασθενής επιστρέφει τον καταγραφέα και το σύστημα καταγραφής στην κλινική, όπου επεξεργάζονται τα ψηφιακά δεδομένα από ειδικό λογισμικό. Εικ.1.6 Πραγματικό μέγεθος ασύρματης κάψουλας Pillcam SB (SB: Small Bowel) Εικ.1.7 Set εξέτασης GIVEN.Η κάψουλα Pillcam SB στέλνει τα δεδομένα σε ειδικούς αισθητήρες που εφαρμόζονται στο κοιλιακό τοίχωμα του ασθενούς. Οι αισθητήρες συνδέονται με τον ειδικό καταγραφέα δεδομένων, που τοποθετείται στην ειδική ζώνη και ο οποίος αποθηκεύει τα δεδομένα. Το σύστημα ασύρματης εντεροσκόπησης Pillcam SB της GIVEN Imaging Ltd. αποτελείται από τα εξής μέρη: Την ασύρματη κάψουλα Pillcam SB Το σύστημα ψηφιακής καταγραφής δεδομένων Το λογισμικό RAPID που βρίσκεται εγκατεστημένο σε ειδικό υπολογιστή 10

Ασύρματη κάψουλα Pillcam SB Οι διαστάσεις της κάψουλας είναι οι εξής: μήκος 27 mm, πλάτος 11 mm και βάρος 3.7g Τα κύρια στοιχεία της κάψουλας είναι: Ο οπτικός θόλος, με σχήμα που εμποδίζει το φως να αντανακλάται από την πηγή φωτισμού και να φτάνει στο σύστημα αγωγής της εικόνας. Ο θόλος αυτοκαθαρίζεται από το βλεννογόνο του εντέρου. Ο φακός (μικρής εστίασης, ασφαιρικός φακός) Οι 2 πηγές φωτισμού (παράγουν λευκό LED φως) Το σύστημα αγωγής εικόνας (CMOS microchip). Λαμβάνει 2 εικόνες/sec. Οι μπαταρίες οξειδίου σιδήρου. Ο αναμεταδότης (ASIC) Η κεραία εκπομπής (RF Antena) Εικ.1.8 Tα μέρη της κάψουλας Pillcam SB Σύστημα ψηφιακής καταγραφής δεδομένων Το set λήψης δεδομένων αποτελείται από τους 8 ειδικούς σένσορες (Sensor array) που τοποθετούνται στο κοιλιακό τοίχωμα και συνδέονται με τον καταγραφέα δεδομένων (data recorder). Ολόκληρο το σύστημα τοποθετείται σε ζώνη που συνδέεται με εξωτερική μπαταρία διάρκειας 8-9 ωρών. Λογισμικό επεξεργασίας δεδομένων Η επισκόπηση των εικόνων σε μορφή video γίνεται μετά τη φόρτωση των δεδομένων στον υπολογιστή, που είναι εφοδιασμένος με το λογισμικό RAPID (το πιο γνωστό λογισμικό επισκόπησης στην αγορά). Σήμερα η φόρτωση διαρκεί περίπου 20 λεπτά και αποτελείται από 55.000-60.000 εικόνες υψηλής ευκρίνειας, που απεικονίζουν τη διαδρομή της κάψουλας στο λεπτό έντερο. Στο παράθυρο του λογισμικού, 11

εμφανίζεται εκτός από το video, τα αποθηκευμένα ευρήματα, ο χρόνος διάβασης του λεπτού εντέρου, και ο εντοπισμός της κάψουλας μέσα σε ένα εικονικό λεπτό έντερο. Κατά τη διάρκεια της επισκόπησης, ο γιατρός μπορεί να αποθηκεύει τυχόν ευρήματα και να τα επεξεργαστεί σε δεύτερο χρόνο. Εικ.1.9 Εικόνες από ασύρματη μικροκάψουλα Α. Ενεργή αιμορραγία Β. Έλκος και νόσος του Crohn Γ.Όγκος του λεπτού εντέρου Δ. Πολλαπλή αγγειοδυσπλασία Μελέτη των δεδομένων καταγραφής Ο χρόνος που απαιτείται για τη μελέτη των δεδομένων καταγραφής της ασύρματης κάψουλας είναι εξαιρετικά σημαντικός και πιθανά αποτελεί έναν από τους λόγους περιορισμού της ευρύτερης χρήσης της. Η διάρκεια καταγραφής είναι 8 ώρες. Οι εικόνες λαμβάνονται με ταχύτητα 2 ανά δευτερόλεπτο και θα πρέπει, όπως προαναφέρθηκε, να μελετηθούν 55.000 εικόνες περίπου σε κάθε εξέταση. Διάφορες εκδοχές λογισμικών, με γνωστότερο αυτό της GIVEN IMAGING, παρέχουν τη δυνατότητα μελέτης των εικόνων με ταχύτητα από 5 ως 25εικόνες/sec. Ωστόσο σαν ένας λογικός συμβιβασμός ανάμεσα στη συντομία και την ασφάλεια στην εξαγωγή συμπεράσματος, το International Conference of Capsule Endoscopy 2002 όρισε ότι η ταχύτητα των 15εικόνων/sec είναι αποδεκτή για τη μελέτη της καταγραφής. 12

Με την παραπάνω ταχύτητα και την ταυτόχρονη απεικόνιση 2 εικόνων στην οθόνη, ο χρόνος της εξέτασης κυμαίνεται από 45 ως 120 min. H μελέτη της καταγραφής προϋποθέτει τη συνεχή εγρήγορση και συγκέντρωση του γιατρού, επειδή ένα παθολογικό εύρημα μπορεί να εμφανίζεται μόνο σε μία εικόνα. Επιπλέον είναι δυνατό κάποιες ανωμαλίες να μην μπορούν να διακριθούν με το μάτι εξαιτίας του μεγέθους τους ή της κατανομής τους. Η αναπόσπαστη προσοχή αποτελεί έναν ιδιαίτερα δύσκολο στόχο για τον παρατηρητή, όταν τα οπτικά ερεθίσματα είναι συνεχόμενα και η εξέταση τόσο μακρά σε διάρκεια. 1.6 State-of-the-art. Το παραπάνω μειονέκτημα της ενδοσκόπησης με ασύρματη κάψουλα, η δύσκολη και χρονοβόρα επισκόπηση των βίντεο, στάθηκε για πολλούς το κίνητρο να αναπτύξουν μεθόδους για αυτοματοποιημένη διάγνωση παθολογιών του εντέρου και να μειώσουν έτσι το φόρτο των γαστρεντερολόγων. Η εταιρεία Given, που πρώτη ανέπτυξε εμπορικά αυτόν τον τρόπο ενδοσκόπησης, έχει ενσωματώσει στο λογισμικό της, Rapid Reader, τη δυνατότητα ανίχνευσης ενεργού αιμορραγίας και προσδιορισμού της θέσης της κάψουλας, οπότε και μπορεί να εντοπιστεί αυτόματα αυτή η βλάβη. Παρόλα αυτά η ευαισθησία και η ειδικότητα του συστήματος αναφέρθηκαν να είναι μόλις 21,5% και 41,8% αντίστοιχα. Οι Jean-Michel Cauvin etal δημιούργησαν έναν έξυπνο άτλαντα με ενδοσκοπικά ευρήματα που χρησιμοποιούνται σαν αναφορά για μια αυτοματοποιημένη διάγνωση. Η μέθοδος τους βασίζεται σε μια μετρική ομοιότητας (similarity metric) που εκτιμά το βαθμό ομοιότητας του δείγματος υπό εξέταση και των ευρημάτων του άτλαντα. Για τον αλγόριθμο ταξινόμησης χρησιμοποιούν τρεις περιγραφείς, την ανατομική θέση, το σχήμα και το χρώμα. Οι J. Berens, M. Mackiewicz, and D. Bell πρότειναν μία μέθοδο που χρησιμοποιεί την κατανομή χρώματος για να διακρίνει τον όγκο στο στομάχι, στο λεπτό και το παχύ έντερο και τα αποτελέσματά τους έδειξαν ότι τα χρωματικά χαρακτηριστικά μπορούν να διαχωρίσουν τους όγκους. Οι Vilarino, Spyridonos etal ασχολήθηκαν με την ανίχνευση και απόρριψη εικόνων μη χρήσιμων για την εξέταση, συγκεκριμένα αυτών που απεικόνιζαν εντερικά υγρά. Με εργαλεία τους τα φίλτρα Gabor, ανέπτυξαν αλγόριθμο που εντοπίζει την υφή φυσαλίδων, που δημιουργούνται από την τυρβώδη κίνηση των υγρών, μειώνοντας έτσι τον χρόνο επισκόπησης μέχρι και 46%. Οι Coimbra και Cunha εκμεταλλεύτηκαν τα χαρακτηριστικά του προτύπου MPEG-7, για την εξαγωγή παθολογικών χαρακτηριστικών. Το MPEG-7 χρησιμοποιεί μια σειρά από οπτικούς περιγραφείς, όπως η δομή του χρώματος (color structure), η ομοιογενής υφή (homogeneous texture) και το τοπικό ιστόγραμμα (local edge histogram) για την ταξινόμηση του περιεχομένου του βίντεο. Συγκρίνοντας τις τιμές των περιγραφέων της υπό εξέταση εικόνας και της αναφοράς, εξήγαγαν παθολογίες όπως αιμορραγία, 13

έλκη και πολύποδες. Βασισμένοι στα αποτελέσματά τους, οι ίδιοι πρότειναν αργότερα δύο προσεγγίσεις για την κατάτμηση του γαστρεντερικού σωλήνα σε τέσσερις βασικές τοπογραφικές ζώνες, τον οισοφάγο, το στομάχι, το λεπτό και το παχύ έντερο. Με τη βοήθεια του HSΙ χώρου χρώματος και του αλγορίθμου Watershed, οι Dhandra etal επιχείρησαν να επεξεργαστούν τις εικόνες και να αναγνωρίσουν ανωμαλίες. Το δείγμα των εικόνων υπόκειται μετατροπή σε HSI (hue/saturation/intensity), smoothing και φιλτράρισμα, εφαρμόζεται κατάτμηση μέσω του αλγορίθμου watershed και στη συνέχεια μετρώνται οι περιοχές της εικόνας μετά την κατάτμηση. Αν ξεπερνούν μια τιμή κατωφλίου, αυτό είναι ένδειξη παθολογικής κατάστασης. Χρησιμοποιώντας τον ίδιο ίδιο χρωματικό χώρο HSI, οι Baopu Li και Max Q.-H. Meng ανέπτυξαν μία μέθοδο χρωματικής υφής για την διάγνωση αιμορραγίας. Στη συνέχεια αναπτύσσεται μία διαφορετική προσέγγιση αυτοματοποιημένης διάγνωσης του έλκους. Το τελευταίο επιλέχθηκε λόγω του γεγονότος ότι αποτελεί ένα από τα πιο συνηθισμένα ευρήματα στη γαστρεντερολογία. Συνδέεται με πολλές ασθένειες, όπως η νόσος του Crohn και η ελκώδης νηστεοειλίτιδα. Θα πρέπει βέβαια να σημειωθεί ότι η μέθοδος που αναπτύσσεται στην εργασία αναφέρεται αποκλειστικά στη διάκριση έλκους από υγιείς εικόνες και δε λαμβάνει υπόψη άλλες παθογένειες. Εικ.1.10 Ο άτλας της εταιρείας GIVEN παρέχει ένα σύνολο εικόνων αναφοράς σύμφωνα με την CEST (Capsule Endoscopy Standard Terminology) 14

Κεφάλαιο 2 2.1 Ανάλυση υφής Η ανάλυση υφής είναι μία από τις πιο σημαντικές τεχνικές που χρησιμοποιείται στην ψηφιακή επεξεργασία εικόνας και την αναγνώριση προτύπων. Η χρησιμότητά της οφείλεται στο γεγονός ότι μπορεί να παράσχει πληροφορίες σχετικά με τη κατανομή και τις χωρικές ιδιότητες δομικών στοιχείων της εικόνας. Τέτοιες πληροφορίες υφής είναι συμπληρωματικές στην πολυφασματική (multispectral) ανάλυση των εικόνων και πολλές φορές αποτελούν το μοναδικό τρόπο για την κατάτμηση μιας ψηφιακής εικόνας. Στην ανάλυση υφής το πρώτο και πιο σημαντικό ζήτημα είναι η εξαγωγή χαρακτηριστικών υφής, που να ενσωματώνουν αποτελεσματικά πληροφορίες σχετικά με τα στοιχεία υφής της πρωτότυπης εικόνας. Αυτά τα χαρακτηριστικά μπορούν μετά να χρησιμοποιηθούν για την περιγραφή και την ταξινόμηση εικόνων διαφορετικής υφής χρησιμοποιώντας κάποιον αλγόριθμο ταξινόμησης. Παρά τη σπουδαιότητα και τη συνεχή χρήση της στην επεξεργασία εικόνας, δεν υπάρχει μια επίσημη προσέγγιση ή ακριβής ορισμός της υφής. Γενικά είναι ένα μέτρο της τραχύτητας, της ομαλότητας και της κανονικότητας μιας εικόνας. Οι τεχνικές προσέγγισης της υφής, ως επί το πλείστον, είναι ad hoc. Θα μπορούσαμε να τις ομαδοποιήσουμε σε δύο γενικευμένες κατηγορίες: α) στατιστικές (statistical): η εικόνα θεωρείται ως μια διδιάσταστη στοχαστική διαδικασία κι επομένως περιγράφεται από τις στατιστικές της ιδιότητες. Η υφή μιας εικόνας προσδιορίζεται από τις τιμές έντασης του γκρι των εικονοστοιχείων και τη θέση τους στο χώρο, ενώ οι εξαρτήσεις ανάμεσα στα εικονοστοιχεία θεωρούνται ότι είναι κυρίως τοπικής κλίμακας (αν δε συμβαίνει αυτό η εικόνα είναι απλός θόρυβος). Τα πιο συνηθισμένα χαρακτηριστικά που χρησιμοποιούνται προκύπτουν από τους πίνακες σύμπτωσης (co-occurrence matrix) και τη συνάρτηση αυτοσυσχέτισης (autocorrelation function). (β) δομικές (structural): η εικόνα θεωρείται ως η επανάληψη κάποιων θεμελιακών στοιχείων (primitives), δηλαδή ενός συνδεδεμένου συνόλου εικονοστοιχείων που έχουν μια κοινή ιδιότητα. Ένα τέτοιο παράδειγμα δομικών στοιχείων είναι το μέγιστο σύνολο εικονοστοιχείων που έχουν την ίδια ένταση στην κλίμακα του γκρι ή που οι ακμές τους έχουν την ίδια κατεύθυνση. Μόλις κατασκευαστούν τα δομικά στοιχεία, προσδιορίζονται τα τοπολογικά δεδομένα, από τα οποία μπορούμε να επιλέξουμε μια απλή χωρική σχέση, όπως αν τα δομικά στοιχεία εφάπτονται ή είναι κοντά, και μετράμε πόσα δομικά στοιχεία του κάθε είδους υπάρχουν στη συγκεκριμένη χωρική 15

σχέση. Τα πλεονεκτήματα της δομικής προσέγγισης είναι ότι δίνει έμφαση στο σχήμα των δομικών στοιχείων, αλλά με το μειονέκτημα ότι εφαρμόζεται καλά μόνο σε μακρο-υφές με ξεκάθαρη δομή. Πρόσφατα προτάθηκαν άλλες δύο μέθοδοι προσέγγισης υφής: το φάσμα υφής και το τοπικό δυαδικό πρότυπο, που θα αναλυθούν αμέσως παρακάτω. 2.2.Φάσμα υφής (Texture Spectrum) Οι He και Wang πρότειναν την προσέγγιση του φάσματος υφής (Texture Spectrum) για την ανάλυση της υφής μιας εικόνας. Πρόκειται ουσιαστικά για ένα συνδυασμό δομικής, καθώς εντοπίζει πρότυπα, και στατιστικής, εφόσον χρησιμοποιεί στατιστικά χαρακτηριστικά, μεθόδου ανάλυσης υφής που εφαρμόζεται τοπικά στην εικόνα. Η τοπική πληροφορία υφής για κάθε εικονοστοιχείο και την άμεση γειτονιά του αναπαρίσταται από την αντίστοιχη μονάδα υφής (texture unit). Έτσι το συνολικό φάσμα υφής (texture spectrum) της εικόνας απαρτίζεται από τις μονάδες υφής που αντιστοιχούν σε όλα τα εικονοστοιχεία της και χαρακτηρίζει την ολική υφή της. Από το φάσμα υφής στη συνέχεια εξάγονται κάποια χαρακτηριστικά που θα καταστήσουν δυνατή την ταξινόμηση των εικόνων. Η διαδικασία απεικονίζεται σχηματικά παρακάτω: Υπολογισμός του φάσματος υφής Εξαγωγή χαρακτηριστικών Ταξινόμηση 16

Α) Υπολογισμός μονάδας υφής και φάσματος υφής Η βασική ιδέα είναι ότι μια εικόνα υφής μπορεί να θεωρηθεί ως ένα σύνολο θεμελιωδών μικρότερων μονάδων, των μονάδων υφής, που προσδιορίζουν την τοπική υφή για ένα δεδομένο εικονοστοιχείο και τη γειτονιά του. Σε μια ψηφιακή εικόνα, που αναπαρίσταται ως ένας δισδιάστατος πίνακας, κάθε εικονοστοιχείο περιβάλλεται από οκτώ γειτονικά εικονοστοιχεία. Η τοπική πληροφορία υφής για ένα εικονοστοιχείο μπορεί να εξαχθεί από μια γειτονιά 3x3 εικονοστοιχείων, που αντιπροσωπεύει τη στοιχειώδη γειτονιά. Θεωρούμε το σύνολο των σημείων μιας γειτονιάς 3x3 : V { V V V } 0, 1,..., 8 V η τιμή έντασης του κεντρικού εικονοστοιχείου και V{ i 1, 2,...,8} η, όπου 0, τιμή έντασης του γειτονικού εικονοστοιχείου i. Τότε ορίζουμε μονάδα υφής:, όπου ο πίνακας Ε δίνεται από τον τύπο: TU { E, E,..., E } 1 2 8 V V 0 αν i 0 i Ei { 1 αν Vi V0, i =1:8 (2.1) V V 2 αν i 0 Ο τρόπος υπολογισμού απεικονίζεται στην Εικ. 2.1. Καθώς κάθε στοιχείο της μονάδας υφής μπορεί να πάρει μία από τις 3 τιμές {0,1,2}, συνολικά υπάρχουν 3 8 =6561 πιθανές μονάδες υφής, δηλαδή 6561 πιθανά πρότυπα για την περιγραφή της εικόνας. Ένας τρόπος για να χαρακτηρίσουμε την κάθε μονάδα υφής είναι να αντιστοιχίσουμε σε αυτήν τον αριθμό μονάδας υφής που δίνεται από τον τύπο: N TU 8 i1 17 E i 1 3 i (2.2)

Εικ.2.1 Τρόπος υπολογισμού της μονάδας υφής TU Ακόμη, τα οκτώ στοιχεία μπορούν να ταξινομηθούν διαφορετικά. Ο νέος αριθμός μονάδας υφής θα προκύψει από την ολίσθηση των ψηφίων του τριαδικού κατά τη φορά των δεικτών του ρολογιού. Συνολικά μπορούν να πραγματοποιηθούν οκτώ ολισθήσεις, όπως γίνεται εύκολα κατανοητό από την Εικ. 2.2. a b c h d g f e Εικ.2.2 Οκτώ ωρολογιακά διαδοχικοί τρόποι τοποθέτησης στη σειρά των οκτώ στοιχείων της μονάδας υφής Το σύνολο των 6561 μονάδων υφής περιγράφει την τοπική υφή ενός δεδομένου εικονοστοιχείου, δηλαδή τις σχετικές εντάσεις ανάμεσα στο κεντρικό εικονοστοιχείο και τα γειτονικά του. Έτσι η στατιστική ανάλυση της συχνότητας εμφάνισης όλων των μονάδων υφής στην εικόνα αποκαλύπτει ευρύτερες πληροφορίες υφής. Ονομάζουμε φάσμα υφής την κατανομή συχνότητας εμφάνισης των μονάδων υφής, με την τετμημένη να δείχνει τον αριθμο μονάδας υφής (1:6561) και την τεταγμένη τη συχνότητα εμφάνισής της. Θα πρέπει να σημειωθεί ότι ο τρόπος αρίθμησης των στοιχείων στη μονάδα υφής μπορεί να μεταβάλει τις σχετικές θέσεις τους στο φάσμα υφής αλλά όχι τη συχνότητα εμφάνισής τους. 18

Χαρακτηριστικά υφής Βασισμένοι στην ιδέα του φάσματος υφής μπορούμε να ορίσουμε τα ακόλουθα χαρακτηριστικά: Α. Συμμετρία άσπρου-μαύρου (BWS): BWS 3279 Si ( ) S(3281 i) Si () i0 i0 1 100 6560, i 0,1,2,..,6560 (2.3),όπου Si () η συχνότητα εμφάνισης της μονάδας υφής i στο φάσμα υφής. Οι τιμές της BWS κανονικοποιούνται από 0 ως 100 και μετρούν τη συμμετρία ανάμεσα στο δεξί και το αριστερό κομμάτι του φάσματος υφής με τον άξονα συμμετρίας στο i=3280. Μεγάλη τιμή της ΣΑΜ αποκαλύπτει ότι αν αντιστρέψουμε τις τιμές έντασης της αρχικής εικόνας (ισοδύναμο με το να αλλάξουμε την τιμή 0 με 2 και αντίστροφα στη μονάδα υφής), το φάσμα υφής θα παραμείνει περίπου το ίδιο. Επίσης θα πρέπει να σημειωθεί ότι η ΣΑΜ δεν εξαρτάται από τη σειρά αρίθμησης στη μονάδα υφής, γιατί ο τρόπος αρίθμησης αλλάζει τις σχετικές θέσεις των μονάδων υφής ταυτόχρονα στα θετικά και αρνητικά τμήματα του φάσματος υφής. Β. Γεωμετρική συμμετρία (GG): 6560 S () i S () i 1 GG 4 j j4 i0 1 100 6560 4 j1 2 SJ ( i) i0 i 0,1,2,..,6560 (2.4),όπου Sj () i η συχνότητα εμφάνισης της μονάδας υφής i με τον τρόπο αρίθμησης j Οι τιμές της ΓΣ κανονικοποιούνται από 0 ως 100 κι εξετάζουν τη συμμετρία ανάμεσα στα φάσματα υφής με τρόπο αρίθμησης a-e, b-f, c-g, d-h (όπως απεικονίζονται στην 19

Εικ. 2.2). Μεγάλη τιμή της ΓΣ δείχνει ότι αν περιστρέψουμε την εικόνα κατά 180 ο θα προκύψει περίπου το ίδιο φάσμα υφής. Έτσι, η ΓΣ μπορεί να μας δώσει πληροφορίες σχετικά με τη σχηματική κανονικότητα της εικόνας. Γ. Βαθμός κατεύθυνσης (DD): 6560 S () i S () i 1 DD 3 4 m n i0 1 100 6560 6 m1nm1 2 Sm( i) i0, i 0,1,2,..,6560 (2.5) Οι τιμές του ΒΚ κανονικοποιούνται από το 0 ως το 100, και εξετάζουν το βαθμό της γραμμικής δομής μέσα σε μια εικόνα. Ο ΒΚ είναι ευαίσθητος στις μεταβολές προσανατολισμού των δομικών στοιχείων της εικόνας. Συνεπώς μεγάλη τιμή του ΒΚ φανερώνει ότι κυριαρχούν οι γραμμικές δομές. Τα παραπάνω χαρακτηριστικά βασίζονται στη γεωμετρική εμφάνιση του φάσματος υφής, μετρώντας τη μακρο-υφή της εικόνας. Επίσης δεν εξαρτώνται από τον τρόπο αρίθμησης στη μονάδα υφής κι επομένως καλούνται ανεξάρτητα από τον προσανατολισμό (orientation invariant). Δ. Χαρακτηριστικά εξαρτώμενα από τον προσανατολισμό Για τα οκτώ στοιχεία της μονάδας υφής, αν υποθέσουμε ότι Ea Eb Ec και Ef Eg Eh, μπορούμε να θεωρήσουμε ότι η εικόνα έχει μια γραμμική οριζόντια μικρο-δομή (η έννοια του οριζόντιου είναι σχετική κι έχει να κάνει με την αρίθμηση την εικονοστοιχείων στη μονάδα υφής που επιλέγουμε. Συνήθως βέβαια χρησιμοποιούμε τη βασική μονάδα υφής με την αρίθμηση α της Εικ.2.2, οπότε επιβεβαιώνεται ο χαρακτηρισμός «οριζόντια»). Για να μετρήσουμε αυτήν την ιδιότητα, ορίζουμε την μικρο-οριζόντια δομή ως εξής: 6560 MHS S() i HM () i, i 0,1,2,..,6560 I 0 (2.6),με το HM () i να υπολογίζεται από τη σχέση: HM() i Pabc (,, ) P( f, gh, ) (2.7),όπου Pabc (,, ) αντιστοιχεί στο πλήθος των στοιχείων που έχουν την ίδια τιμή στα E, E και a b E c. 20

Μεγάλη τιμή του MHS δηλώνει ότι η εικόνα έχει ισχυρή οριζόντια μικρο-δομή. Αντίστοιχα αναπτύσσονται και τα άλλα μέτρα μικρο-δομής: Κάθετη: 6560 MVS S() i VM () i, VM () i P( a, d, f ) P( c, e, h) I 0 (2.8) Διαγώνιος 1: 6560 MDS1 S( i) DM1( i), DM1( i) P( d, a, b) P( g, h, e) I 0 (2.9) Διαγώνιος 2 : 6560 MDS2 S( i) DM 2( i), DM2( i) P( b, c, e) P( d, f, g) I 0 (2.10) Τα μέτρα Ρ αποτελούν ουσιαστικά μέτρα της σχέσης των οκτώ στοιχείων σε μια μονάδα υφής. Πολλαπλασιάζοντας τα μέτρα αυτά με συντελεστή βάρους τη συχνότητα εμφάνισης της κάθε μονάδας υφής στο φάσμα μετράμε τον προσανατολισμό μιας εικόνας. Ε. Κεντρική συμμετρία(cs) 6560 CS S() i K() i, i 0,1,2,..,6560 I 0 2 (2.11),με Ki () να ισούται με το πλήθος των ζευγών που έχουν ίδια τιμή στα στοιχεία ( Ea, Eh),( Eb, Eg),( Ec, Ef) και ( EE e, d). Προφανώς το μέτρο αυτό είναι ανεξάρτητο από τον προσανατολισμό και εντάσσεται στην κατηγορία των τριών πρώτων μέτρων. ΣΤ. Στατιστικά χαρακτηριστικά Εξάγονται από τη στατιστική ανάλυση του φάσματος υφής της εικόνας. Εστιάζουμε στα έξι στατιστικά μέτρα (μέση τιμή, τυπική απόκλιση, λοξότητα, κύρτωση, εντροπία, ενέργεια) για κάθε ένα από τα κανάλια RGB. Σαν επέκταση του αρχικού TU μπορούμε να προχωρήσουμε σε μεγαλύτερες γειτονιές εικονοστοιχείων, δηλαδή γειτονιές RxR (R>3). Το κεντρικό εικονοστοιχείο είναι τοποθετημένο στο κέντρο του τετραγώνου πλευράς R, ενώ τα γειτονικά σημεία 21

εξακολουθούν να είναι οκτώ και τοποθετημένα στις κορυφές και τα μέσα των πλευρών του τετραγώνου. Τα αποτελέσματα εφαρμογής της μονάδας TU βρίσκονται στο 4ο κεφάλαιο. 2.3. LBP (Τοπικό δυαδικό πρότυπο) Το LBP είναι ένας τελεστής που δίνει επίσης μια εικόνα της υφής σε μια τοπική «γειτονιά». Θα μπορούσε να θεωρηθεί ότι ενοποιεί τη στατιστική και δομική προσέγγιση της υφής. H εφαρμογή του τελεστή είναι αρκετά απλή και στηρίζεται στην ακόλουθη λογική: ορίζουμε μια κυκλική γειτονιά ακτίνας 1 γύρω από ένα εικονοστοιχείο. Η διαφορά της τιμής έντασης του κεντρικού εικονοστοιχείου με τις εντάσεις των γειτονικών του μπαίνει σαν όρισμα στη βηματική συνάρτηση, που δίνει νέες τιμές για τα εικονοστοιχεία 0 ή 1. Οι τιμές έντασης στην κατωφλιωμένη γειτονιά πολλαπλασιάζονται με ένα συντελεστή βάρους ίσο με μια δύναμη του 2, που αντιστοιχεί σε κάθε εικονοστοιχείο ανάλογα με τη θέση του, σύμφωνα με την Εικ.2.3. Τέλος αθροίζονται τα αποτελέσματα δίνοντας έτσι τον αριθμό LBP της γειτονιάς. Το LBP μιας γειτονιάς που έχει μέγεθος 3x3 παράγει 2 8 =256 διαφορετικά πρότυπα υφής. Εικ.2.3 Τρόπος υπολογισμού του κώδικα LBP 22

2.3.1 Επεκτάσεις του LBP LBP πολλαπλής διακριτικής ικανότητας (Multiresolutional LBP) Στην επέκτασή του ο τελεστής LBP θα μπορούσε να χρησιμοποιηθεί για πολυδιακριτική (multiresolutional) ανάλυση μίας εικόνας, αυξομειώνοντας την ακτίνα και το πλήθος των σημείων της γειτονιάς (γωνιακή κατάτμηση του χώρου), και ανεξάρτητη από την κατεύθυνση, δεδομένου ότι η γειτονιά είναι κυκλικά συμμετρική γύρω από κάθε εικονοστοιχείο, όπως φαίνεται στην Εικ.2.4. Τα παραπάνω συνοψίζονται σε έναν τύπο ως εξής: P1 LBP s( g g ) 2 PR, p c p0 p (2.12),όπου sx ( ) η βηματική συνάρτηση, g c η ένταση του κεντρικού εικονοστοιχείου και g p η ένταση των γειτονικών (p={1,2,..,ρ-1}), που βρίσκονται σε ακτίνα R από το κεντρικό. Είναι προφανές ότι οι παράμετροι R (ακτίνα) και Ρ (πλήθος εικονοστοιχείων γειτονιάς) δεν είναι ανεξάρτητες η μία από την άλλη. Για παράδειγμα σε μία γειτονιά 3x3 υπάρχουν 8 γειτονικά εικονοστοιχεία και συνεπώς με επιλογή Ρ μεγαλύτερο του οκτώ θα προέκυπτε πολλή περιττή πληροφορία. Εικ.2.4 Κυκλικά συμμετρικά γειτονικά σύνολα. Τα δείγματα που δεν συμπίπτουν ακριβώς με τα pixels παίρνονται με διγραμμική παρεμβολή 23

Στην πράξη, χαρακτηριστικά που υπολογίζονται σε μία τοπική γειτονιά 3x3 δεν μπορούν να ενσωματώσουν δομές μεγαλύτερης κλίμακας, που μπορεί να κυριαρχούν στην εικόνα. Ωστόσο οι προσκείμενες γειτονιές δεν είναι απόλυτα ανεξάρτητες μεταξύ τους, με αποτέλεσμα ουσιαστικά η γειτονιά στην οποία υπολογίζονται τα δυαδικά πρότυπα να είναι λίγο μεγαλύτερη. Παρόλα αυτά ο τελεστής LBP PR,, με R=1, είναι λιγότερο ανθεκτικός σε τοπικές μεταβολές της υφής που μπορεί να προκύψουν από ανομοιόμορφο φωτισμό ή από μικρά στίγματα, όπως είναι οι φυσαλίδες, που συναντώνται πολύ συχνά στις ενδοσκοπικές εικόνες και δυσκολεύουν την αυτοματοποιημένη διάγνωση. Στην Εικ. 2.7 μπορούμε να δούμε τι αποτέλεσμα έχει η εφαρμογή του τελεστή LBP PR, στην εικόνα της Lena για διάφορους συνδυασμούς ακτίνας και πλήθους σημείων. Σε κάθε εικονοστοιχείο λοιπόν αντιστοιχίζεται ένας αριθμός που περιγράφει τη γειτονιά του. Έτσι εντοπίζονται σχήματα, όπως κηλίδες, ακμές και γωνίες. Από αυτήν τη σκοπιά μπορούμε να πούμε πως το LBP αποτελεί μία δομική προσέγγιση της υφής (Εικ.2.5). Αφού υπολογιστούν οι αριθμοί που αντιστοιχίζονται με τον τελεστή σε κάθε εικονοστοιχείο, σχηματίζεται το ιστόγραμμα κατανομής τους, από όπου και εξάγονται έξι βασικά στατιστικά δεδομένα (μέση τιμή, τυπική απόκλιση, κύρτωση, λοξότητα, εντροπία, ενέργεια). Έτσι η μέθοδος συνδυάζει, όπως αναφέρθηκε αρχικά, τη στατιστική με τη δομική ανάλυση της υφής. LBP Ανεξάρτητο περιστροφής (Rotation Invariant) Για να εξασφαλίσουμε την ανεξαρτησία των δυαδικών προτύπων της εικόνας μετά την εφαρμογή του LBP από την επιλογή του σημείου αναφοράς εισάγουμε την έννοια του LBP ανεξάρτητου περιστροφής : LBP min( ROR( LBP, i)), i {0,1,.., P 1} ri PR, Pr, (2.13),όπου η συνάρτηση ROR( x, i ) εκτελεί κυκλική ολίσθηση του Ρ-ψήφιου δυαδικού αριθμού (P-bit) προς τα δεξιά i φορές. Με συντομία, ο κώδικας για ανεξαρτησία περιστροφής παράγεται από ολίσθηση του δυαδικού αριθμού που παράγεται από τον αρχικό κώδικα LBP μέχρι την εύρεση της ελάχιστης τιμής του. Αυτό σημαίνει ότι όλες οι δυαδικές τιμές 1:2 P επιστρέφουν σε μια τιμή αναφοράς. Έτσι ομαδοποιούνται 24

Εικ.2.5 Μικρο-δομές που εντοπίζει ο LBP όλες οι «περιστραμμένες» εκδοχές ενός δυαδικού αριθμού σε μία, και από σχηματικής σκοπιάς ομαδοποιούνται πολλά πρότυπα σε λιγότερα πρότυπα ανεξάρτητα της περιστροφής που αντιστοιχούν σε συγκεκριμένα μικροχαρακτηριστικά της εικόνας. Στην Εικ.2.6 δίνονται σχηματικά παραδείγματα για το πώς αντιστοιχίζονται τα δυαδικά πρότυπα σε ένα ανεξάρτητο περιστροφής. Τα δύο πρώτα παραμένουν αμετάβλητα από περιστροφές λόγω απόλυτης κυκλικής συμμετρίας, συνεπώς δεν μπορούν να υπάρξουν άλλα δυαδικά πρότυπα που να δίνουν τον ίδιο αριθμό LBP. Το τρίτο είναι ενδιαφέρον από την άποψη ότι μπορεί να δώσει μόνο δύο διαφορετικά πρότυπα.τα υπόλοιπα τρία έχουν συνολικά εφτά περιστραμμένες εκδοχές το καθένα, από τις οποίες απεικονίζονται οι δύο. Συνολικά, για πλήθος γειτονικών στοιχείων ίσο με 8, τα αρχικά 2 8 =256 διαφορετικά δυαδικά πρότυπα συνοψίζονται σε 36, δίνοντας έτσι ένα συνοπτικότερο ιστόγραμμα LBP με 36 στήλες. Εικ.2.6 Γειτονιές περιστραμμένες στη μικρότερη τιμή τους 25

Ομοιόμορφο LBP (Uniform LBP) Έχει παρατηρηθεί ότι κάποια τοπικά δυαδικά πρότυπα αποτελούν θεμελιώδεις ιδιότητες της εικόνας, με την έννοια ότι καταλαμβάνουν τη συντριπτική πλειοψηφία των προτύπων. Τα θεμελιώδη αυτά πρότυπα ονομάζονται ομοιόμορφα (uniform) και είναι εκείνα που περιλαμβάνουν λιγότερες από δύο μεταβάσεις bit από 0 σε 1 ή αντίστροφα. Στην Εικ.2.5 όλα τα πρότυπα που απεικονόζονται είναι ομοιόμορφα, ενώ στην Εικ. 2.6 βρίσκουμε μη ομοιόμορφα πρότυπα στην τρίτη και πέμπτη στήλη. Ο μαθηματικός ορισμός της ομοιομορφίας μιας γειτονιάς G δίνεται από το μέτρο U, που ορίζεται : UG ( ) sg ( g ) s( g g ) s( g g ) s( g g ) P1 p p1 c 0 c p c p1 c p1 (2.14) Μια γειτονιά θεωρείται ομοιόμορφη αν UG ( P ) 2. Ο συνολικός αριθμός ομοιόμορφων προτύπων είναι P( P1) 2. Στην περίπτωση που οι τιμές αντιστοιχίζονται και στη μικρότερη περιστραμμένη τιμή τους (ανεξάρτητη περιστροφής) το σύνολο των προτύπων είναι P 1. Ο συνδυασμός τους ονομάζεται LBP ομοιόμορφος ανεξάρτητος περιστροφής. Ο μαθηματικός ορισμός των παραπάνω είναι: LBP ={ riu2 PR, P1 p0 P 1 sg ( g), UG ( ) 2 p c p, αλλιώς (2.15) riu 2 Πρακτικά ο κώδικας LBP PR, υλοποιείται με έναν πίνακα που μετατρέπει τις τιμές riu 2 του αρχικού LBP στις αντίστοιχες LBP PR,. Για πολύ μεγάλες τιμές του Ρ (πλήθος των γειτονικών σημείων), αυξάνεται και το μέγεθος του πίνακα μετατροπής, αφού πρέπει να αντιστοιχηθούν 2 P τιμές στις αντίστοιχες ομοιόμορφες ανεξάρτητες περιστροφής. Για λόγους πολυπλοκότητας και ταχύτητας λοιπόν, πρέπει να μπαίνει ένα άνω όριο στην επιλογή του πλήθους των σημείων. 26

Εικ.2.7 1)αρχική εικόνα, 2) R=1, Ν=8, 3)R=2.5, Ν=12 4)R=4, N=16 27

2.3.2 Σύγκριση LBP και TU Σύμφωνα με όσα περιγράφηκαν παραπάνω διαπιστώνουμε ότι η μέθοδος μονάδας υφής (Texture Unit) και του τοπικού δυαδικού προτύπου (LBP) παρουσιάζουν πολλές ομοιότητες. Και στις δύο η πληροφορία συλλέγεται από μία γειτονιά γύρω από ένα κεντρικό εικονοστοιχείο. Η διαφορά είναι ότι στην περίπτωση της TU η πληροφορία χωρίζεται σε τρία επίπεδα ανάλογα με την ένταση του κεντρικού εικονοστοιχείου, ενώ στο LBP χωρίζεται σε δύο επίπεδα. Αυτή η διαφορά καθορίζει και τα βασικά μειονεκτήματα της μεθόδου TU σε σχέση με το LBP. Είναι από τη μία πιο λεπτομερής άρα και πιο ευαίσθητη σε μικρές ανομοιογένειες και μονοτονικές μεταβολές του γκρι, κάτι που δε συμβαίνει τόσο έντονα στο LBP. Σημαντική διαφορά εντοπίζεται και στο πλήθος προτύπων που παράγει ο κάθε τελεστής. Στη μέθοδο TU δημιουργούνται 3 8 =6561 πρότυπα, ενώ στο LBP 2 8 =256, που γίνονται ακόμα λιγότερα με την εφαρμογή του LBP riu2. (Ακόμη και στην περίπτωση που χρησιμοποιήσουμε περισσότερα σημεία στο LBP riu2 προκύπτουν λιγότερα πρότυπα, για παράδειγμα με Ν=16 παίρνουμε συνολικά 18 πρότυπα). Το μέγεθος των διανυσμάτων ταξινόμησης είναι καθοριστικό του χρόνου που απαιτείται για την ταξινόμηση κι ένα ακόμη σημαντικό πλεονέκτημα του LBP. 28

Κεφάλαιο 3 3.1 Περιστροφή χρώματος Οι εικόνες που προέρχονται από τη ενδοσκοπική κάψουλα χρησιμοποιούνται για τη διάγνωση πολλών ασθενειών που σχετίζονται με το γαστρεντερικό σύστημα. Όταν λοιπόν γίνεται αυτοματοποιημένη διάγνωση θα πρέπει να ληφθούν υπόψη όλες οι πιθανές ασθένειες που σχετίζονται με αυτό. Διαφορετικές ασθένειες έχουν διαφορετικά συμπτώματα με διαφορετικές ιδιότητες, όπως το σχήμα, το μέγεθος και το χρώμα. Χαρακτηριστικό παράδειγμα είναι η διάκριση της αιμορραγίας από το έλκος (στη μία περίπτωση υπάρχουν υψηλές τιμές έντασης στην κόκκινη ζώνη του RGB, ενώ στη δεύτερη περίπτωση υψηλές τιμές στην πράσινη). Η ανάλυση υφής, τόσο γενικά οσο και στις μεθόδους που περιγράφηκαν παραπάνω, δε λαμβάνει υπόψη το χρώμα παρά μόνο την ένταση στην κλίμακα του γκρι σε κάθε ένα χρωματικό κανάλι. Τη σημασία του χρώματος στην εξαγωγή διαγνωστικής πληροφορίας από τις ενδοσκοπικές εικόνες αναγνώρισαν πολλοί ερευνητές. Οι Amit Jain και Glenn Healey πρότειναν ένα μοντέλο αναπαράστασης χρωματικής υφής με ομοχρωματικά και αντίθετα χαρακτηριστικά υπολογισμένα από την έξοδο φίλτρων Gabor. Οι Coimbra και Cunha εκμεταλλεύτηκαν μια σειρά από οπτικούς περιγραφείς που χρησιμοποιεί ο MPEG-7, όπως η δομή του χρώματος (color structure), η ομοιογενής υφή (homogeneous texture) και το τοπικό ιστόγραμμα (local edge histogram) για τη διάγνωση παθολογιών, όπως αιμορραγία, έλκη και πολύποδες. Βασισμένοι στα αποτελέσματά τους, οι ίδιοι πρότειναν αργότερα δύο προσεγγίσεις για την κατάτμηση του γαστρεντερικού σωλήνα σε τέσσερις βασικές τοπογραφικές ζώνες, τον οισοφάγο, το στομάχι, το λεπτό και το παχύ έντερο χρησιμοποιώντας μηχανές υποστήριξης διανυσμάτων (SVMs). Οι S.A Karkanis, D.K Iakovidis, D.E Maroulis, D.A Karras, M. Tzivras χρησιμοποίησαν τη συμμεταβλητότητα κυματιδίων χρώματος (CWC) για τον εντοπισμό και την αναγνώριση όγκων. Επιπλέον οι Baopu Li και Max Q.-H. Meng χρησιμοποίησαν χρωματικές ροπές (chrominance moments) ως χρωματικό μέρος των χαρακτηριστικών υφής. Οι χρωματικές αυτές ροπές προκύπτουν από τα πολυώνυμα Chebyshev με χρωματική πληροφορία από το χώρο HSI. Είναι φανερό ότι διαφορετικά προβλήματα και διαφορετικές παθολογίες περιγράφονται καλύτερα σε διαφορετικούς χρωματικούς χώρους. Συνεπώς ένας τρόπος για να εκμεταλλευτούμε την πληροφορία του χρώματος σε κάθε μία ξεχωριστή περίπτωση είναι να προσαρμόσουμε σε αυτήν έναν ιδιαίτερο χρωματικό χώρο που να αξιοποιεί βέλτιστα τη χρωματική πληροφορία. Έτσι, για παράδειγμα, στην περίπτωση διάγνωσης έλκους μπορούμε να μετασχηματίσουμε την εικόνα με τέτοιον τρόπο ώστε να αυξηθεί η προβολή των χρωματικών χαρακτηριστικών των 29

συμπτωμάτων έλκους στο πράσινο κανάλι του RGB. Ο μετασχηματισμός αυτός είναι μια περιστροφή του χρωματικού χώρου RGB. Ας θεωρήσουμε ένα τυχαίο εικονοστοιχείο x που ανήκει στο χώρο RGB. Η αναπαράσταση του x θα είναι: x (, rgb, ) (3.1),με r, g και b την κόκκινη, πράσινη και μπλε συνιστώσα του αντίστοιχα. Αν περιστρέψουμε αυτό το εικονοστοιχείο, τότε θα προκύψει το x ' σε μία νέα θέση του χρωματικού χώρου RGB και θα είναι:, με r ', ορίζεται ως: και x' R x ( r', g ', b') (3.2) rgb g ' και b ' τις νέες του συντεταγμένες και R rgb τον πίνακα περιστροφής που Rrgb Rr Rg Rb (3.3) 1 0 0 Rr 0 cosa sina 0 sin a cos a (3.4) R g cosb 0 sin b 0 1 1 sin b 0 cosb (3.5) cos c sin c 0 Rc sin c cos c 0 0 0 1 (3.6),όπου a, b και c γωνίες περιστροφής γύρω από τον κόκκινο, πράσινο και μπλε άξονα αντίστοιχα. Εφαρμόζοντας την (3.2) σε όλα τα εικονοστοιχεία της εικόνας παίρνουμε: 30

IRot Rrgb Iorig (3.7), όπου I Rot είναι η περιστραμμένη εικόνα και I orig η αρχική. max Στη συνέχεια υπολογίζουμε το μέγιστο I Rot και το ελάχιστο μετασχηματισμένης εικόνας και την κανονικοποιούμε: min I Rot της I norm min IRot I Rot 255 max min IRot IRot (3.8) Μετά τον υπολογισμό της περιστραμμένης χρωματικά εικόνας εφαρμόζουμε μία από τις μεθόδους ανάλυσης υφής που αναπτύχθηκαν παραπάνω (φάσμα υφής TU ή τοπικό δυαδικό πρότυπο LBP- αυτή που δίνει τα καλύτερα αποτελέσματα), για την εξαγωγή χαρακτηριστικών και την ταξινόμηση. Οι γωνίες a, b και c επιλέγονται πειραματικά και προφανώς επιλέγουμε εκείνες που δίνουν καλύτερα αποτελέσματα ταξινόμησης από τις μεθόδους που εφαρμόστηκαν απευθείας στις αρχικές εικόνες. Η διαδικασία σχηματικά απεικονίζεται παρακάτω: Περιστροφή χρώματος εικόνας Εφαρμογή LBP Ταξινόμηση 31

Βέβαια θα πρέπει να λάβουμε υπόψη το γεγονός ότι το χρώμα είναι στενά συνδεδεμένο με τη φωτεινότητα. Στις ενδοσκοπικές εικόνες από την κάψουλα υπάρχουν έντονες μεταβολές φωτεινότητας που μπορεί να οφείλονται σε διάφορους παράγοντες, όπως η κίνηση και η εστίαση της κάμερας, ή λιγότερο σε μικρές μεταβολές της φωτεινότητας μέσα στο γαστρεντερικό σωλήνα. Δε θα πρέπει λοιπόν να αγνοήσουμε τον ανομοιογενή φωτισμό, στον οποίο είναι ιδιαίτερα ευαίσθητα τα χρωματικά χαρακτηριστικά. Επιπλέον, το πράσινο στοιχείο μπορεί να εμφανίζεται και σε υγιείς εικόνες, λόγω των γαστρικών υγρών που εκκρίνονται από το στομάχι. Τέλος, ακόμη και τα συμπτώματα της ίδιας παθολογίας εμφανίζουν μεταβολές ως προς το σχήμα ή το χρώμα κι έτσι μπορεί να μην εμφανίζεται έντονα το πράσινο σε εικόνες με έλκος. Εκεί είναι που επεμβαίνει η ανάλυση υφής για να δώσει περισσότερα χαρακτηριστικά και να βοηθήσει στην ταξινόμηση. Στις Εικ. 3.1 και Εικ. 3.2 βλέπουμε πώς επιδρά μία καλή και μία κακή αντίστοιχα χρωματική περιστροφή σε μια τυπική εικόνα έλκους. Στην Εικ. 3.1 ενισχύεται γενικά το πράσινο, άλλες φορές περισσότερο κι άλλες λιγότερο σε σχέση με τη βάση της εικόνας. Στην Εικ. 3.2 αντίθετα μειώνεται η ένταση του πράσινου και το εύρος τιμών της εικόνας στην πράσινη ζώνη, με αποτέλεσμα να χάνεται σχεδόν το έλκος μέσα στη βάση. Γενικά είναι αρκετά δύσκολο να καταλάβουμε με το μάτι ποιες γωνίες περιστροφής δίνουν τα καλύτερα αποτελέσματα ταξινόμησης. Η απλή παρατήρηση μπορεί να μας δώσει μια ιδέα απλά για τις γωνίες περιστροφής που θα δοκιμάσουμε. Ένας τρόπος για να καταλάβουμε ότι επιλέξαμε σωστές γωνίες είναι να δούμε αν αυξάνεται το εύρος τιμών στο πράσινο στην περιστραμμένη χρωματικά εικόνα σε σχέση με την αρχική. Ένας άλλος τρόπος είναι να εξετάσουμε και να συγκρίνουμε τα μέγιστα στην πράσινη ζώνη των περιστραμμένων (κανονικοποιημένων) χρωματικά εικόνων, υγιών και με έλκος. Αν τα μέγιστα στις εικόνες με έλκος είναι μεγαλύτερα από τα μέγιστα στις υγιείς και διαχωρίζονται ικανοποιητικά σημαίνει ότι κινούμαστε στη σωστή κατεύθυνση. Τέλος, πρέπει να αναφερθεί ότι έγινε επιλογή να μεγιστοποιηθεί η προβολή των χαρακτηριστικών του έλκους στην πράσινη ζώνη του RGB. Αν είχαμε επιλέξει την κόκκινη ή την μπλε θα καταλήγαμε σε άλλες γωνίες. 32

ulcer original Irot Irot(:,:,2) Ulcer original Irot Irot(:,:,2) Ulcer original Irot Irot(:,:,2) Εικ.3.1 Περιστροφή χρώματος σε τυπική εικόνα έλκους. Καλές επιλογές γωνιών περιστροφής 33

ulcer original Irot Irot(:,:,2) Ulcer original Irot Irot(:,:,2) ulcer original Irot Irot(:,:,2) Εικ.3.2 Περιστροφή χρώματος σε τυπική εικόνα έλκους. Κακές επιλογές γωνιών περιστροφής 34

Κεφάλαιο 4 4.1.Πειραματικά δεδομένα Στην εργασία χρησιμοποιήθηκαν ως δείγμα 87 υγιείς εικόνες και 87 με έλκος, παρμένες από βίντεο της ασύρματης κάμερας μέσα στη γαστροσκοπική κάψουλα, χωρίς όμως να είναι διαδοχικές και από τον ίδιο ασθενή, και διεγνωσμένες από γαστρεντερολόγους. Οι εικόνες είναι εστιασμένες στην περιοχή ενδιαφέροντος και άνισου μεγέθους, και είναι σε μορφή RGB(στο Matlab αναπαρίστανται ως τρισδιάστατοι πίνακες, με την τρίτη διάσταση να δίνει την κόκκινη, πράσινη και μπλε συνιστώσα με τη σειρά που αναφέρονται). Γενικά οι ενδοσκοπικές εικόνες από την κάψουλα παρουσιάζουν μεγάλη μεταβλητότητα στα χρώματα και σκοτεινές περιοχές λόγω ανομοιογενούς φωτισμού και διαφορετικής εστίασης της κάμερας. Μπορεί επίσης να εμφανίζονται φυσαλίδες από τα γαστρικά υγρά στο στομάχι. (Οι εικόνες που χρησιμοποιήθηκαν στη συγκεκριμένη εργασία προέρχονται από το στομάχι ή το άνω τμήμα του λεπτού εντέρου, οπότε δεν περιέχουν ίχνη από κόπρανα). Δεν εφαρμόστηκε παρόλα αυτά κάποια διαδικασία αποθορυβοποίησης, γιατί οι αλγόριθμοι που χρησιμοποιήθηκαν εφαρμόζονται απευθείας στα δεδομένα. Η επεξεργασία έγινε στο Matlab 2010b. Για την ταξινόμηση χρησιμοποιήθηκαν δύο είδη ταξινομητών: 1.Ταξινομητής SVM (Μηχανές διανυσμάτων υποστήριξης) με συνάρτηση πυρήνα rbf (Radial Gaussian Basis Function) και παράμετρο κλιμάκωσης σίγμα=2. 2. Ο ταξινομητής του Matlab, που εισάγεται με την εντολή classify. O τύπος της διακρίνουσας συνάρτησης είναι quadratic, δηλαδή ταξινομητής με εκτίμηση συμμεταβλητότητας των χαρακτηριστικών (naive Bayes classifier). Ο ταξινομητής αυτός είναι σημαντικά πιο γρήγορος από τον SVM. Για την ταξινόμηση τα δεδομένα χωρίστηκαν ψευδοτυχαία με την εντολή του Matlab crossvalind σε δύο ομάδες, την ομάδα εκπαίδευσης (training) και την ομάδα δοκιμής (sample), σε ποσοστά 90% και 10% αντίστοιχα του συνολικού πλήθους δεδομένων. Επειδή η εντολή crossvalind επιλέγει ψευδοτυχαία τα δεδομένα για κάθε μία κατηγορία, επαναλαμβάνουμε τη διαδικασία πολλές φορές, ώστε τα αποτελέσματα 35

της ταξινόμησης να μη διαφέρουν μέχρι το δεύτερο δεκαδικό ψηφίο(200 επαναλήψεις κρίνονται αρκετές). Για να αξιολογηθούν οι επιδόσεις της κάθε μεθόδου χρησιμοποιήθηκαν κάποιοι διαδεδομένοι ιατρικοί στατιστικοί δείκτες, η ακρίβεια (accuracy), η ευαισθησία (sensitivity) και η ειδικότητα (specificity). Τα μεγέθη αυτά ορίζονται ως εξής: TN TN accuracy= TN TP FN FP TP sensitivity= TP FN TN specificity= TN FP,όπου ΤΝ είναι το σύνολο των σωστά ταξινομημένων αρνητικών δεδομένων (υγιών εικόνων), ΤΡ το σύνολο των σωστά ταξινομημένων θετικών δεδομένων (εικόνων με έλκος), ενώ FN είναι το σύνολο των λανθασμένα ταξινομημένων θετικών εικόνων ως αρνητικές και FP το αντίστροφο. Στην περίπτωση της χρήσης ενός ταξινομητή για τη διάγνωση μίας παθολογίας είναι φανερό ότι είναι προτιμότερο να αναγνωριστούν κάποιες υγιείς εικόνες σαν ασθενείς παρά το αντίστροφο. Έτσι δίνουμε έμφαση στην τιμή της ευαισθησίας σε σχέση με την τιμή της ειδικότητας. Για την αξιολόγηση της κάθε μεθόδου πρέπει να λάβουμε υπόψη, εκτός από τα τρία παραπάνω μέτρα, την ταχύτητά της, δεδομένου ότι στόχος είναι να προκύπτει μια αυτοματοποιημένη διαδικασία διάγνωσης όσο το δυνατόν πιο γρήγορη. Οι παράγοντες που συνεισφέρουν στη μεγάλη ταχύτητα είναι το μικρό πλήθος διανυσμάτων ταξινόμησης, και το μικρό μέγεθός τους. Παρακάτω απεικονίζονται κάποια παραδείγματα εικόνων, που χρησιμοποιήθηκαν στην επεξεργασία. Το έλκος γενικά διακρίνεται από το πρασινωπό χρώμα του. Όπως γίνεται φανερό σε άλλες εικόνες είναι ευδιάκριτη η ύπαρξη έλκους, ενώ σε άλλες όχι. Αντίστοιχα οι υγιείς εικόνες έχουν ένα ομοιόμορφο κοκκινωπό χρώμα, που αντιστοιχεί στο χρώμα του λεπτού εντέρου, σε αρκετές όμως υπάρχουν διακυμάνσεις χρώματος, σκούρες περιοχές ή ακόμα και μεγάλες μαύρες περιοχές λόγω του ανομοιόμορφου φωτισμού που αναφέρθηκε. Σε μερικές ακραίες περιπτώσεις είναι δύσκολο και χρειάζεται ιδιαίτερη προσοχή για να διαχωριστεί με το μάτι μια υγιής εικόνα από μία με έλκος. Όλα αυτά δυσκολεύουν ιδιαίτερα τη διαδικασία ταξινόμησης. 36

Εικ.4.1 Υγιείς εικόνες. Η πρώτη είναι πρότυπη και οι υπόλοιπες εμφανίζουν αποκλίσεις 37

. Εικ.4.2 Εικόνες με έλκος 38

4.2. Εφαρμογή φάσματος υφής 4.2.1 Στατιστικά χαρακτηριστικά φάσματος υφής (Texture Unit) Η επεξεργασία έγινε ξεχωριστά για κάθε κανάλι χρώματος, δηλαδή για κάθε εικόνα υπολογίστηκαν τρία φάσματα υφής. Παρακάτω απεικονίζονται δύο τυπικές εικόνες, μία υγιής και μία με έλκος, ενώ στην Εικ. 4.4 απεικονίζονται δύο μη τυπικές από κάθε μία κατηγορία αντίστοιχα. Εικ.4.3 Αριστερά Υγιής,δεξιά έλκος Εικ.4.4 Αριστερά Υγιής,δεξιά έλκος 39

0.04 Normal 0.1 Ulcer 0.02 0.05 0.04 0.02 0.04 0.02 0 0 2000 4000 6000 8000 r 0 0 2000 4000 6000 8000 g 0 0 2000 4000 6000 8000 b 0 0 2000 4000 6000 8000 r 0.1 0.05 0 0 2000 4000 6000 8000 g 0.1 0.05 0 0 2000 4000 6000 8000 b Εικ.4.5 Κανονικοποιημένα ιστογράμματα υφής μίας τυπικής υγιούς εικόνας και μίας τυπικής εικόνας με έλκος αντίστοιχα Τα κανονικοποιημένα ιστογράμματα υφής του πρώτου ζεύγους εικόνων απεικονίζονται στην Εικ. 4.5 και του δεύτερου στην Εικ. 4.6. Από τα ιστογράμματα δεν μπορούμε να βγάλουμε κάποια σαφή συμπεράσματα. Το μοναδικό εμφανές είναι ότι γενικά διατηρείται η ίδια μορφή στα ιστογράμματα της ίδιας εικόνας στα τρία κανάλια χρώματος, με την έννοια ότι παρατηρούνται στις ίδιες τετμημένες τοπικά μέγιστα ή ελάχιστα. Αυτό είναι αναμενόμενο σε φυσικές εικόνες. Ένα ακόμη συμπέρασμα είναι ότι γενικά θα περιμέναμε στις υγιείς εικόνες να συγκεντρώνονται περισσότερες τιμές γύρω από την τιμή 3280 (που δηλώνει ομοιογένεια έντασης γύρω από το κεντρικό εικονοστοιχείο), κάτι το οποίο δεν ισχύει προφανώς λόγω της ανομοιογένειας του φωτισμού. Αυτό επιβεβαιώνει αυτό που αναφέρθηκε προηγουμένως ότι η μέθοδος TU δεν παρουσιάζει ανοσία στις μονοτονικές μεταβολές της έντασης του γκρι. Γίνεται αντιληπτό ότι μέσα στο δείγμα των εικόνων που αναλύονται υπάρχει ένα σημαντικό ποσοστό μη τυπικών εικόνων από κάθε κατηγορία που δυσχεραίνει τη σωστή ταξινόμηση. Με μια ματιά τα φάσματα υφής των δύο μη τυπικών εικόνων τις κατατάσσουν στην αντίθετη κατηγορία. 40