Αναγνώριση κακοήθων νεοπλασιών σε εικόνες κυτταρικής βιοψίας

Σχετικά έγγραφα
Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

ΣΤΟΙΧΕΙΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΙΑΤΡΙΚΩΝ ΕΙΚΟΝΩΝ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Κατάτµηση εικόνας σε οµοιόµορφες περιοχές

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

Digital Image Processing

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Παρουσίαση Νο. 5 Βελτίωση εικόνας

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης

Ανάλυση και επεξεργασία εικόνων DICOM με τη χρήση Matlab

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

ΚΕΣ 03: Αναγνώριση Προτύπων και Ανάλυση Εικόνας. KEΣ 03 Αναγνώριση Προτύπων και Ανάλυση Εικόνας. Κατάτµηση Εικόνων:

Digital Image Processing

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Αναγνώριση Προτύπων Ι

DIP_04 Σημειακή επεξεργασία. ΤΕΙ Κρήτης

ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

Μέθοδοι Αναπαράστασης Περιοχών

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Επεξεργασία Χαρτογραφικής Εικόνας

ΑΝΤΩΝΙΟΣ ΛΥΡΩΝΗΣ ΧΑΝΙΑ Σκοπός Εργασίας Εντοπισμός πλίνθων σε σειρά ορθοφωτογραφιών και εξαγωγή δισδιάστατης αποτύπωσης των τειχών.

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

DIP_05 Τµηµατοποίηση εικόνας. ΤΕΙ Κρήτης

ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ

2.0 ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ-ΟΡΟΛΟΓΙΕΣ

Βέλτιστα Ψηφιακά Φίλτρα: Φίλτρα Wiener, Ευθεία και αντίστροφη γραµµική πρόβλεψη

6-Aνίχνευση. Ακμών - Περιγράμματος

ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ ΜΕ ΙΣΤΟΓΡΑΜΜΑ

Εργασίες στο µάθηµα Ψηφιακής Επεξεργασίας και Αναγνώρισης Εγγράφων

Digital Image Processing

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

4.3. Γραµµικοί ταξινοµητές

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

DIP_04 Βελτιστοποίηση εικόνας. ΤΕΙ Κρήτης

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

DIP_01 Εισαγωγήστην ψηφιακήεικόνα. ΤΕΙ Κρήτης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Εισαγωγή στην επιστήµη των υπολογιστών ΑΡΙΘΜΗΤΙΚΑ ΣΥΣΤΗΜΑΤΑ

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Ψηφιακή Επεξεργασία Εικόνας

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας

(Computed Tomography, CT)

Απεικόνιση Υφής. Μέρος Α Υφή σε Πολύγωνα

ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ

Επεξεργασία Χαρτογραφικής Εικόνας

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ

Ομαδοποίηση ΙΙ (Clustering)

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Αριθμητική Ανάλυση & Εφαρμογές

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

Ενότητα 3: Μετασχηµατισµοί Έντασης & Χωρικό Φιλτράρισµα

Advances in Digital Imaging and Computer Vision

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Digital Image Processing

Ζητήματα ηήμ με τα δεδομένα

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2015 ΕΚΦΩΝΗΣΕΙΣ

Α.Τ.Ε.Ι. Ηρακλείου Ψηφιακή Επεξεργασία Εικόνας ιδάσκων: Βασίλειος Γαργανουράκης. Ανθρώπινη Όραση - Χρωµατικά Μοντέλα

Έγχρωµο και Ασπρόµαυρο Φως

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή διατριβή

Ιατρικά Ηλεκτρονικά. Χρήσιμοι Σύνδεσμοι. ΙΑΤΡΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ - ΔΙΑΛΕΞΗ 5α. Σημειώσεις μαθήματος: E mail:

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ. Εργαστήριο 8 ο. Αποδιαμόρφωση PAM-PPM με προσαρμοσμένα φίλτρα

Εργασία επεξεργασίας εικόνων, που αναπαριστούν τομή εγκεφάλου και τομή αδένα προστάτη

Μεθοδολογίες παρεµβολής σε DTM.

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Βέλτιστη παρεμβολή και πρόγνωση άγνωστης συνάρτησης με τη μέθοδο της σημειακής προσαρμογής

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP)

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 30 ΜΑΪΟΥ 2014

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Transcript:

Τµήµα Μηχανικών Υπολογιστών και Πληροφορικής ιατµηµατικό µεταπτυχιακό πρόγραµµα σπουδών Συστήµατα Επεξεργασίας Σήµατος και Εικόνας ιπλωµατική εργασία Αναγνώριση κακοήθων νεοπλασιών σε εικόνες κυτταρικής βιοψίας Στριφτάρας Χρήστος Επιβλέπων καθηγητής ερµατάς Ευάγγελος Τριµελής επιτροπή : ερµατάς Ε. Μπερµπερίδης Κ. Φακωτάκης Ν.

- 2 -

Περίληψη Σκοπός της παρούσας διπλωµατικής εργασίας είναι η υλοποίηση ενός αποτελεσµατικού αλγορίθµου ικανού να επεξεργάζεται οποιεσδήποτε βιοψίες κυττάρων που εµπεριέχουν κακοήθεις νεοπλασίες και να τις αναγνωρίζει. Η επεξεργασία γίνεται κυρίως χρησιµοποιώντας τις χρωµατικές ιδιότητες των υπό εξέταση εικόνων. Το αρχικό δείγµα διέρχεται από αρκετά στάδια επεξεργασίας κατά τα οποία αλλάζει τόσο η µορφή του όσο και η χρωµατική του δοµή. Αρχικός σκοπός είναι η µετατροπή της αρχικής εικόνας σε µορφή που θα επιτρέπει µε σαφήνεια την επεξεργασία της. Ο αλγόριθµος που υλοποιήθηκε είναι φιλικός προς τον χρήστη και δίνει την δυνατότητα σε κάθε βήµα να επιλέγει οποιαδήποτε τιµή της παραµέτρου εάν δεν επιθυµεί να ακολουθήσει τις προεπιλεγµένες τιµές. Aim of present diplomatic work is the implementation of a robust algorithm capable to process any pigmentation biopsies of cells that include malignant neoplasm and finally to recognize them. The process mainly takes place by using the chromatic attributes of the pictures. The initial sample goes through from enough stages at which stage we change both the form and the chromatic structure. Initial aim is the transformation of the initial picture in a form that will allow with clarity the process. The algorithm that was implemented is friendly to the user and it gives the possibility in each step of selecting any price of parameter or if it does not wish it to follow the preselected prices. Ευχαριστώ πολύ για την αµέριστη συµπαράσταση τους την οικογένεια µου, καθώς και τον καθηγητή µου, Ευάγγελο ερµατά, για την απεριόριστη κατανόηση και βοήθειά του στην προσπάθεια ολοκλήρωσης της παρούσης εργασίας. - 3 -

- 4 -

Πίνακας Περιεχοµένων. Εισαγωγή 7. Η εισαγωγή της τεχνολογίας στη απεικόνιση ιατρικών εικόνων 7.2 Αυτόµατη αναγνώριση καρκίνου : γενική διαδικασία 7 2. Ψηφιακή επεξεργασία ιατρικής εικόνας µε Matlab 9 2. Οι τύποι εικόνων και η δοµή τους στην πλατφόρµα Matlab 9 2.. Έγχρωµες (RGB) εικόνες 9 2..2 Ενδεικτικές (indexed) εικόνες 0 2..3 Ασπρόµαυρες (grayscale) εικόνες 2..4 υαδικές (binary) εικόνες 2 2.2 Προεπεξεργασία της εικόνας 2 2.3 Σηµειακή επεξεργασία. Ιστόγραµµα 4 2.4 Χωρικά φίλτρα 5 2.4. Φίλτρο µέσης τιµης (average filter) 5 2.4.2 Φίλτρο ενδιάµεσης τιµης (median filter) 6 2.4.3 Φίλτρο παραγώγισης (sharpening) 7 2.5 Κατάτµηση και διαχωρισµός δεδοµένων 8 2.5. Ανίχνευση άκµων 9 2.5.2 Κατωφλίωση 20 2.5.3 ιαχωρισµός περιοχών 2 2.5.4 Ενεργά περιγράµµατα 2 2.5..5 Τµηµατοποίηση µε χρήση τεχνικών ταξινόµησης 23 2.5.5. Αλγόριθµος των Κ-µέσων 24 2.5.5.2 Ασαφής αλγόριθµος των Κ-µέσων 24 2.6 Μορφολογικοί τελεστές 25 2.6. Erosion (διάβρωση) 26 2.6.2 Dilation (διαστολή) 26 2.6.3 Opening (άνοιγµα) 27 2.6.4 Closing (κλείσιµο) 27 3. Επιλογή χαρακτηριστικών γνωρισµάτων 29 3. Μορφολογικά χαρακτηριστικά 29 3.2 Χαρακτηριστικά γνωρίσµατα υφής 3 3.3 Τοπολογικά χαρακτηριστικά 33 4. Εφαρµογή: Υλοποίηση αλγορίθµου ανίχνευσης καρκινικών περιοχών σε έγχρωµες βιοψίες 35 4. Μετατροπή / επεξεργασία αρχικής εικόνας 37 4.2 Εξοµάλυνση εικόνας / απαλοιφή ακµών 38 4.3 Μείωση αριθµού χρωµάτων 39 4.4 Μετατροπή εικόνας σε gray scale image 42 4.5 Επιλογή κατωφλίου 42 4.6 Απαλοιφή περιοχών µε τοπολογικά κριτήρια 43 4.7 Συµπεράσµατα-τελικά αποτελέσµατα 59 5. Παράρτηµα 62 6. Βιβλιογραφία - 5 -

- 6 -

Κεφάλαιο ο Εισαγωγή Στην σηµερινή εποχή, ο καρκίνος αποτελεί ένα σηµαντικό πρόβληµα υγείας. Στις Ηνωµένες Πολιτείες, είναι δεύτερη κύρια αιτία του θανάτου. Περίπου ένας από κάθε δύο άνδρες και µία από κάθε τρεις γυναίκες προσβάλλονται από καρκίνο κατά τη διάρκεια της ζωής τους. Επιπλέον, ο κίνδυνος του καρκίνου έχει αυξηθεί περαιτέρω λόγω της αλλαγής στις συνήθειες των ανθρώπων στον αιώνα µας όπως η αύξηση στη χρήση καπνών, η επιδείνωση των διαιτητικών συνηθειών, και η έλλειψη δραστηριότητας. Ευτυχώς, οι πρόσφατες πρόοδοι στην ιατρική έχουν αυξήσει σηµαντικά τη δυνατότητα διάγνωσης και πρόληψης του καρκίνου. Εντούτοις, η πιθανότητα ίασης από τον καρκίνο αυξάνεται κυρίως µε την έγκαιρη διάγνωσή της Εποµένως, είναι κρίσιµο να ανιχνεύσουµε τον καρκίνο, να διακρίνουµε τις καρκινικές δοµές από τις καλοήθεις και υγιείς και να προσδιορίσουµε το επίπεδο κακοήθειας του.. Η εισαγωγή της τεχνολογίας στη απεικόνιση ιατρικών εικόνων Παραδοσιακά, οι παθολόγοι χρησιµοποιούν τις ιστοπαθολογικές εικόνες των δειγµάτων βιοψιών των ασθενών τους, τις εξετάζουν κάτω από ένα µικροσκόπιο, και εξάγουν τα συµπεράσµατα τους βασισµένοι κυρίως στην προσωπική τους εµπειρία. Εξετάζοντας τέτοιες εικόνες, ένας παθολόγος αξιολογεί τις αποκλίσεις στις δοµές κυττάρων ή/και την αλλαγή στη κατανοµή των κυττάρων στον υπό εξέταση ιστό. Εντούτοις, αυτή η κρίση είναι υποκειµενική και δεν µπορεί να θεωρηθεί γενικευµένη µεθοδολογία που θα εξυπηρετήσει γενικευµένους ελέγχους. Για να παρακάµφθει αυτό το πρόβληµα και να βελτιωθεί η αξιοπιστία της διάγνωσης καρκίνου, είναι σηµαντικό να αναπτυχθούν τα υπολογιστικά εργαλεία για την αυτοµατοποιηµένη διάγνωση καρκίνου. Τέτοια αυτοµατοποιηµένη διάγνωση καρκίνου διευκολύνει και µπορεί να βοηθήσει συµπληρωµατικά, αν όχι κυρίαρχα και ανεξάρτητα, σε αυτή ενός παθολόγου, που εκφράζει µια προσωπική άποψη για τους ασθενείς. Κατά τη διάρκεια των τελευταίων δύο δεκαετιών, ένα µεγάλο τµήµα της ερευνητικής εργασίας έχει συγκεντρωθεί στην αυτοµατοποιηµένη διάγνωση του καρκίνου. Το γεγονός αυτό οφείλεται στο ότι η αυτοµατοποιηµένη διάγνωση καρκίνου µπορεί να επιφέρει πολλά θετικά αποτελέσµατα κυρίως σε µεγάλης κλίµακας χρήση στην προηγµένη θεραπεία καρκίνου και εν µέρει επειδή η ίδια η αυτοµατοποιηµένη διάγνωση καρκίνου δεν είναι ένας απλός στόχος, αντίθετα περιέχει διάφορες προκλήσεις που πρέπει να υπερνικηθούν..2 Αυτόµατη αναγνώριση καρκίνου : γενική διαδικασία Η Αυτόµατη αναγνώριση καρκίνου έγκειται στην επεξεργασία και την παρατήρηση των εικόνων που µπορούν να αποδείξουν την ύπαρξη καρκίνου και γενικά κακοηθειών. Τέτοιες εικόνες µπορεί να αποτελούνται από λεπτοµερείς αναπαραστάσεις των κυττάρων µέσα από µικροσκόπια ή από βιοψίες και γενικότερα εικόνες του ιστού, ή ακόµα και εικόνες µε τη µορφή της ακτινογραφίας που είναι πολύ κοινές, όπως η µαστογραφία. Υπάρχουν πάρα πολλοί ερευνητές σε όλο τον κόσµο που έχουν εργαστεί πάνω σε αυτά τα δεδοµένα και έχουν αναπτυχθεί δεκάδες - 7 -

µεθοδολογίες που δίνουν περισσότερο ή λιγότερο αξιόπιστα αποτελέσµατα. Ανάλογα µε το είδος της εικόνας που επεξεργάζεται ο κάθε ερευνητής ποικίλει και η µεθοδολογία που χρησιµοποιεί Η διαδικασία της αυτόµατης διάγνωσης του καρκίνου θα µπορούσε να αποδοθεί σχηµατικά µε το παρακάτω σχήµα στο οποίο φαίνονται οι διαδικασίες που πρέπει γενικά να ακολουθηθούν. Εικόνα. Τοπολογικό διάγραµµα διαδικασίας αναγνώρισης καρκίνου - 8 -

Κεφάλαιο 2 ο Ψηφιακή επεξεργασία εικόνας µε Matlab Για να επεξεργαστεί ένας ηλεκτρονικός υπολογιστής µια εικόνα θα πρέπει αυτή να είναι ψηφιοποιηµένη, δηλαδή να αποτελεί ένα σύνολο διακριτών στοιχείων. Τα στοιχεία αυτά λέγονται εικονοστοιχεία (pixels). Ουσιαστικά µία ψηφιακή εικόνα είναι ένας πίνακας µικρών ορθογωνίων, όπου η τιµή του καθενός αντιπροσωπεύει το χρώµα του. Για µία γκρι αποχρώσεων εικόνα, η τιµή του εικονοστοιχείου αντιπροσωπεύει τη διαβάθµιση του γκρι. Ο πιο διαδεδοµένος τύπος εικονοστοιχείου είναι το byte, το οποίο είναι ένας αριθµός αποθηκευµένος ως 8-bit ακέραιος µε τιµές από 0-255. Το µηδέν αντιστοιχεί στο µαύρο και το 255 στο λευκό. Για την αναπαράσταση έγχρωµων εικόνων (RGB) το κάθε εικονοστοιχείο αντιπροσωπεύεται από 3 συνισταµένες, το κόκκινο (Red), το πράσινο (Green) και το µπλε (Blue). Η τιµή του κάθε εικονοστοιχείου εποµένως είναι ένα διάνυσµα των τιµών των 3 χρωµάτων. Η ψηφιακή επεξεργασία µιας ιατρικής εικόνας εξυπηρετεί στην ανάδειξη πληροφορίας η οποία είναι κλινικά χρήσιµη και αθέατη διά γυµνού οφθαλµού. 2. Οι τύποι εικόνων και η δοµή τους στην πλατφόρµα Matlab εξής Οι τύποι της εικόνας που επεξεργάζεται και υποστηρίζει το Matlab είναι οι Έγχρωµες (RGB) εικόνες Ενδεικτικές (indexed) εικόνες Ασπρόµαυρες (grayscale) εικόνες υαδικές (binary) εικόνες 2.. Έγχρωµες (RGB) εικόνες Μια RGB εικόνα, αποθηκεύεται στο Matlab σαν ένας πίνακας δεδοµένων ΜxΝx3 ο οποίος καθορίζει τα κόκκινα, πράσινα και µπλε χρωµατιστά στοιχεία κάθε ανεξάρτητου εικονοστοιχείου. Οι RGB εικόνες δεν χρησιµοποιούν χάρτη χρωµάτων (color map). Το χρώµα του κάθε εικονοστοιχείου καθορίζεται από τον συνδυασµό των κόκκινων, πράσινων και µπλε εντάσεων. Ένας RGB Matlab πίνακας µπορεί να είναι κλάσης double, uint8 ή uint6. Σε ένα πίνακα κλάσης double κάθε χρώµα είναι µια τιµή στον πίνακα µεταξύ 0 και. Ένα εικονοστοιχείο του οποίου το χρώµα έχει τιµή (0,0,0) αντιπροσωπεύει το µαύρο ενώ ένα εικονοστοιχείο το οποίο έχει τιµή µέσα στον πίνακα (,,) αντιπροσωπεύει το λευκό. Τα στοιχεία των τριών χρωµάτων για κάθε εικονοστοιχείο αποθηκεύονται στις τρεις διαστάσεις του πίνακα. - 9 -

Εικόνα 2. RGB απεικόνιση 2..2 Ενδεικτικές (indexed) εικόνες Μια indexed εικόνα αποτελείται από ένα πίνακα δεδοµένων Χ, και ένα πίνακα χρωµάτων (color map). Ο πίνακας χρωµάτων είναι m x 3 διαστάσεων, κλάσης double ο οποίος περιέχει κινητής υποδιαστολής (floating-point) τιµές εύρους [0,] και υπάρχει αποθηκευµένος µέσα στο Matlab. Κάθε µια από της γραµµές του πίνακα χρωµάτων καθορίζει τα κόκκινα, πράσινα και µπλε συστατικά κάθε χρώµατος αντίστοιχα. Μια ενδεικτική εικόνα χρησιµοποιεί απευθείας αντιστοίχηση των τιµών του εικονοστοιχείου στις τιµές του πίνακα χρωµάτων. Το χρώµα κάθε εικονοστοιχείου της εικόνας καθορίζεται χρησιµοποιώντας την ανταποκρινόµενη τιµή του Χ σαν ένδειξη στον πίνακα χρωµάτων. Η τιµή δείχνει την πρώτη γραµµή του πίνακα χρωµάτων, η 2 την δεύτερη κ.ο.κ. - 0 -

Εικόνα 3. Ιndexed απεικόνιση 2..3 Ασπρόµαυρες (grayscale) εικόνες Μια ασπρόµαυρη εικόνα (εικόνα έντασης) είναι ένας πίνακας δεδοµένων Ι του οποίου οι τιµές αναπαριστούν την ένταση του φωτός. Το Matlab αποθηκεύει µια εικόνα έντασης σε ένα απλό πίνακα, του οποίου κάθε στοιχείο αναφέρεται σε ένα και µοναδικό εικονοστοιχείο. Ο πίνακας µπορεί να είναι κλάσης double, uint8 ή uint6. Τα στοιχεία του πίνακα αναπαριστούν διάφορες εντάσεις του φωτός (επίπεδα του γκρι) όπου η ένταση 0 αναπαριστά το µαύρο και η ένταση, 255 ή 65535 αντίστοιχα αναπαριστά το λευκό. Εικόνα 4. Ασπρόµαυρη (αποχρώσεις του γκρι) απεικόνιση - -

2..4 υαδικές (binary) εικόνες Σε µια δυαδική εικόνα κάθε εικονοστοιχείο αντιστοιχεί σε µια από τις δυο διακριτές τιµές (0 για το µαύρο ή για το άσπρο). Βασικά αυτές οι δυο τιµές αναφέρονται σε on ή off. Μια δυαδική εικόνα αποθηκεύεται σαν ένα δισδιάστατο πίνακα µηδενικών (off pixels) και µονάδων (on pixels). Μια δυαδική εικόνα µπορεί να θεωρηθεί σαν ένα ειδικό είδος ασπρόµαυρης (grayscale) εικόνας η οποία όµως περιέχει µόνο µαύρο και άσπρο. Εικόνα 5. υαδική απεικόνιση (µόνο άσπρο και µαύρο) 2.2 Προεπεξεργασία της εικόνας Οι ιατρικές εικόνες περιέχουν συνήθως υψίσυχνο θόρυβο, που οφείλεται σε εξωγενή φαινόµενα κατά την εξέταση του ασθενούς (πχ. ηλεκτροµαγνητικά πεδία στο χώρο, κίνηση ασθενούς, αναπνοή) ή/και θόρυβο κατά την επεξεργασία και αποθήκευση των αποτελεσµάτων (πχ. θόρυβος εξαιτίας του συστήµατος δειγµατοληψίας ή εξαιτίας του καναλιού µετάδοσης). Ο θόρυβος αυτός είναι ανεπιθύµητος και απαιτείται η αφαίρεσή του, χωρίς όµως την απώλεια σηµαντικής ανατοµικής ή λειτουργικής πληροφορίας που εµπεριέχεται στην εικόνα. Για τη µείωση του θορύβου, την εξοµάλυνση και γενικά τη βελτίωση της ποιότητας της εικόνας χρησιµοποιούνται τεχνικές που αποσκοπούν στην παραγωγή εικόνας καταλληλότερης από την αρχική. Είναι σηµαντικό να τονιστεί ότι η βελτίωση της εικόνας αναφέρεται και εξαρτάται από την εκάστοτε εφαρµογή και καθορίζεται από αυτή. Για τη µείωση του θορύβου και γενικότερα για τη βελτίωση της ποιότητας των εικόνων, χρησιµοποιούνται συνήθως οι παρακάτω τεχνικές: τεχνικές που επεξεργάζονται την εικόνα στο πεδίο της συχνότητας και εκµεταλλεύονται το φάσµα της εικόνας, τεχνικές που επεξεργάζονται την εικόνα στο πεδίο του χώρου και εκµεταλλεύονται τις γεωµετρικές ιδιότητες της εικόνας - 2 -

τεχνικές που εκµεταλλεύονται το συσχετισµό της πληροφορίας από εικόνα σε εικόνα, όπως κατά τη λήψη video (επέκταση στο χρόνο), ή σε ένα σύνολο τοµών του ίδιου ασθενή (επέκταση στο χώρο). Στη συνέχεια παρουσιάζονται διάφορες τεχνικές που χρησιµοποιούνται συχνά για τη βελτίωση της ποιότητας ιατρικών εικόνων. Αυτές βασίζονται είτε σε σηµειακή επεξεργασία (point processing) και χρησιµοποιούν µόνο τη χρωµατική πυκνότητα µεµονωµένων στοιχείων εικόνας, ή στη χρήση κατάλληλων χωρικών φίλτρων. Η πρώτη κύρια διαδικασία είναι η προεπεξεργασία της εικόνας που θα µελετηθεί. Στο πρώτο σκέλος της η προεπεξεργασία αναφέρεται στην όσο το δυνατόν αποτελεσµατικότερη απαλοιφή του θορύβου που υπάρχει στην εικόνα. Η πιο συνηθισµένη µέθοδος είναι η κατωφλίωση της εικόνας έτσι ώστε να διαχωριστεί όσο είναι εφικτό το υπόβαθρο της εικόνας από τις περιοχές ενδιαφέροντος. Η κατωφλίωση συνήθως γίνεται µε επεξεργασία του ιστογράµµατος της εικόνας. Έπειτα συνήθως ακολουθεί κάποιο φιλτράρισµα, µε διάφορα φίλτρα που υπάρχουν για την επεξεργασία και βελτιστοποίηση της εικόνας. Ένας ακόµη τρόπος για την απαλοιφή του θορύβου είναι η χρήση µαθηµατικών µορφολογικών µοντέλων όπως είναι οι τελεστές διάβρωσης (erosion) και διαστολής (dilation) οι οποίο αποτελούν βασικές δοµές που συνθέτουν ή αποδοµούν την εικόνα µε βάση κάποιες σχέσεις που τους διέπουν. Στην περίπτωση που η εικόνα αποτελείται από κύτταρα µεγενθυµένα σε βαθµό ικανοποιητικό για επεξεργασία και η µέθοδος που θα χρησιµοποιηθεί έγκειται στην αυτή κάθε αυτή επεξεργασία του κυττάρου τότε το επόµενο σηµαντικό βήµα είναι η κατάτµηση της εικόνας και ο διαχωρισµός των κυττάρων τόσο µεταξύ τους όσο και από το υπόβαθρο της εικόνας. Είναι αυτό που ονoµάζεται διαχωρισµός κυττάρων (cell segmentation). Γενικά υπάρχουν δυο κυρίαρχες προσεγγίσεις για τον διαχωρισµό αυτό: η βασισµένη στην περιοχή προσέγγιση και η βασισµένη στα όρια προσέγγιση. Η πρώτη (ή όπως ονοµάζεται στη διεθνή βιβλιογραφία region-based approach) βασίζεται στον υπολογισµό της ιδιότητας του εικονοστοιχείου (pixel) να ανήκει στο κύτταρο ή όχι. Αυτό µπορεί να γίνει µε την χρήση ενός κατωφλίου. υστυχώς, ενώ αυτό µπορεί να διαχωρίσει το κύτταρο από το υπόβαθρο της εικόνας, δεν µπορεί όµως να διακρίνει κύτταρα που επικαλύπτουν το ένα το άλλο. Μια λύση σε αυτό το πρόβληµα είναι η χρήση µορφολογικών µαθηµατικών στοιχείων. Μια άλλη προσέγγιση στο θέµα είναι να εκπαιδευθεί ένας αλγόριθµο ο οποίος να αναγνωρίζει ποια εικονοστοιχεία ανήκουν στο κύτταρο και ποια όχι. Τέτοιοι αλγόριθµοι εκµεταλλεύονται τα χαρακτηριστικά γνωρίσµατα που µπορούν να εξαχθούν από ένα εικονοστοιχείο όπως για παράδειγµα η χρωµατική πληροφορία που µπορεί να χρησιµοποιηθεί στον αλγόριθµο k-means και έτσι να διακρίνει τα κύτταρα µέσα σε µια εικόνα. Επιπλέον οι συναρτήσεις αυτοσυσχέτισης των εικονοστοιχείων µπορούν να εξάγουν χαρακτηριστικά γνωρίσµατα τους τα οποία θα χρησιµοποιηθούν για τον διαχωρισµό των κυττάρων µέσα στην εικόνα (ουσιαστικά να εξαχθούν οι υποπεριοχές (clusters) της εικόνας) όπως γίνεται µε ταξινοµητές ελάχιστης απόστασης. Η κύρια δεύτερη µέθοδος είναι η βασισµένη στα όρια προσέγγιση (boundarybased approach). Αυτή η µέθοδος είναι ουσιαστικά χειροκίνητη και απαιτεί από τον ερευνητή να επιλέξει ένα αριθµό εικονοστοιχείων της υπό κατάτµηση περιοχής και έπειτα να εφαρµόσει κάποια τεχνική καταγραφής των ορίων της περιοχής έτσι ώστε τελικά να την αποκόψει από την υπόλοιπη εικόνα. υστυχώς αυτή η τεχνική - 3 -

χρειάζεται την διεργασία από τον ανθρώπινο παράγοντα και ενώ µπορεί να δώσει πολύ καλά αποτελέσµατα για περιορισµένο αριθµό κατατµήσεων, για γενική χρήση είναι πρακτικά αδύνατη. Βέβαια πρέπει να τονιστεί ότι η µέθοδος που θα εφαρµοστεί για να κατατµήθει η εικόνα εξαρτάται από το τι είδους χαρακτηριστικά θέλουµε να εξαχθούν από την εκάστοτε εικόνα. Έτσι αν θέλουµε να εξαχθούν µορφολογικά χαρακτηριστικά του κυττάρου πρέπει η κατάτµηση και η περιγραφή των ορίων του κυττάρου να είναι πολύ ακριβής (και εδώ πλεονεκτεί η boundary-based approach) ενώ αν µας ενδιαφέρουν τοπολογικά στοιχεία της εικόνας, για παράδειγµα η πυκνότητα των κυττάρων στην εικόνα, τότε δεν είναι ανάγκη να έχουµε το ακριβές περίγραµµα του κυττάρου και µας συµφέρει η βασισµένη στα όρια προσέγγιση. 2.3 Σηµειακή επεξεργασία. Ιστόγραµµα Τυπικές τεχνικές βελτίωσης της ποιότητας ιατρικών εικόνων µε βάση σηµειακή επεξεργασία είναι οι τεχνικές επεξεργασίας του ιστογράµµατος της εικόνας. Το ιστόγραµµα µιας εικόνας µε χρωµατική ένταση στο διάστηµα [0,L-] είναι µια διακριτή συνάρτηση p r (r k )=nk/n, όπου r k είναι η k-τάξης χρωµατική πυκνότητα, n k είναι το πλήθος των εικονοστοιχείων σε αυτή τη χρωµατική πυκνότητα, n είναι το συνολικό πλήθος εικονοστοιχείων και k=0,,2.,l-. Εποµένως η συνάρτηση p r (r k ) αποτελεί µια εκτίµηση της πιθανότητας εµφάνισης της χρωµατικής πυκνότητας µε τιµή r k. Το γράφηµα αυτής της συνάρτησης παρέχει γενικές πληροφορίες για τη µορφή της εικόνας, όπως το δυναµικό εύρος και η αντίθεση της εικόνας (σκοτεινή, φωτεινή, υψηλής ή χαµηλής αντίθεσης). Η µορφή του ιστογράµµατος της εικόνας παρέχει σηµαντική πληροφορία για τη δυνατότητα ενίσχυσης της αντίθεσης της εικόνας. Η εµφάνιση της εικόνας είναι δυνατό να αλλάξει σηµαντικά µε την εφαρµογή κατάλληλου µετασχηµατισµού που µεταβάλλει τη συνάρτηση πυκνότητας πιθανότητας των χρωµατικών πυκνοτήτων (ιστόγραµµα της εικόνας). Η πιο σηµαντική τεχνική αυτής της κατηγορίας ονοµάζεται εξισορρόπηση ή γραµµικοποίηση ιστογράµµατος και αναφέρεται στην εφαρµογή µετασχηµατισµού της µορφής k k n j j sk = T ( rk ) = = pr ( rj ) j= 0 n j= 0 που παράγει επίπεδο s k για κάθε τιµή εικονοστοιχείου r k. Το αποτέλεσµα του παραπάνω µετασχηµατισµού είναι µια εικόνα µε οµοιόµορφη κατανοµή χρωµατικών πυκνοτήτων. Ο µετασχηµατισµός αυτό ισοδυναµεί µε αύξηση του δυναµικού εύρους των εικονοστοιχείων και µπορεί να προκαλέσει σηµαντική µεταβολή στην εµφάνιση της εικόνας όπως φαίνεται και στο παρακάτω σχήµα - 4 -

Εικόνα 6. Ιστόγραµµα και εξισωµένο ιστόγραµµα 2.4 Χωρικά Φίλτρα Για τη βελτίωση ιατρικών εικόνων χρησιµοποιούνται ευρύτατα τα λεγόµενα χωρικά (γραµµικά ή µη γραµµικά) φίλτρα (spatial filters). Τυπικό γραµµικό φίλτρο για την εξάλειψη προσθετικού θορύβου είναι το φίλτρο µέσης τιµής (ή µέσου όρου), ενώ ένα από τα πιο σηµαντικά µη γραµµικά φίλτρα είναι το φίλτρο ενδιάµεσης τιµής. Επιπλέον στην κατηγορία των χωρικών φίλτρων περιλαµβάνονται και τα φίλτρα παραγώγισης (sharpening filters) που έχουν την ιδιότητα να προκαλούν όξυνση των λεπτοµερειών της εικόνας. 2.4. Φίλτρο Μέσης Τιµής (Average Filter) Κατά το φιλτράρισµα µιας εικόνας, η νέα τιµή χρωµατικής πυκνότητας που αντιστοιχεί σε κάθε εικονοστοιχείο της είναι η τιµή µίας συνάρτησης µε µεταβλητές τις τιµές που αντιστοιχούν σε στοιχεία που βρίσκονται µέσα σε µία περιοχή (παράθυρο) µε κέντρο το θεωρούµενο στοιχείο. Οι τελεστές που χρησιµοποιούνται είναι κυρίως ευρετικοί (heuristics) και έχουν απλή µορφή ώστε να επιτρέπουν τη γρήγορη επεξεργασία της εικόνας. Στα γραµµικά φίλτρα, η συνάρτηση αυτή είναι ένας γραµµικός συνδυασµός των τιµών των στοιχείων του παραθύρου. Έστω ότι έχουµε ένα παράθυρο µε - 5 -

διαστάσεις (2κ+) x (2κ+). Τότε η νέα εικόνα g(x,y) θα προκύπτει από την αρχική f(x,y) ως εξής: g (x i, y i ) =Σ λx j y j * f (x j, y j ) για κάθε x j, y j στο διάστηµα [x i - k, x i + k] και [y i - k, y i + k], αντίστοιχα. Τα λ x j y j στην παραπάνω σχέση είναι σταθερές που δρουν ως βάρη στο γραµµικό συνδυασµό και εξαρτώνται από τη θέση των x j και y j µέσα στο παράθυρο. Οι συντελεστές βάρους στο φίλτρο µέσης τιµής είναι όλοι ίσοι µε: λx j y j = / Μ, όπου Μ το πλήθος των στοιχείων του παραθύρου. Εποµένως, η σχέση που δίνει τη νέα εικόνα είναι: g(x i, y i ) = ( / M) * Σ f(x j, y j ) για κάθε x j, y j στο διάστηµα [x i -k, x i +k] και [y i -k, y i +k], αντίστοιχα. Η εφαρµογή του φίλτρου µέσου όρου συχνά θολώνει τις ακµές. Το φαινόµενο αυτό αντιµετωπίζεται µε χρήση διαδικασίας κατωφλίωσης. Συγκεκριµένα, αρχικά υπολογίζεται, όπως προηγουµένως, ο µέσος όρος των τιµών των στοιχείων του παραθύρου. Στη συνέχεια, υπολογίζεται ξανά ο µέσος όρος µόνο για τα στοιχεία των οποίων οι τιµές απέχουν το πολύ κατά Τ (όπου Τ ένα προκαθορισµένο κατώφλι χρωµατικής έντασης) από τον αρχικό µέσο όρο. Ο νέος µέσος όρος που προκύπτει µε τον τρόπο αυτόν χρησιµοποιείται ως η νέα τιµή του στοιχείου που αποτελεί το κέντρο του παραθύρου. Μια άλλη τεχνική κατωφλίωσης βασίζεται στη σύγκριση του µέσου όρου µε την αρχική τιµή του στοιχείου. Αν η διαφορά των δύο τιµών είναι µικρότερη από ένα προκαθορισµένο κατώφλι Τ, η αρχική τιµή παραµένει αµετάβλητη, διαφορετικά το στοιχείο παίρνει τιµή ίση µε το µέσο όρο. 2.4.2 Φίλτρο Ενδιάµεσης Τιµής (Median Filter) Οι γραµµικές µέθοδοι φιλτραρίσµατος δεν µπορούν να εξοµαλύνουν το θόρυβο µιας εικόνας χωρίς ταυτόχρονα να θολώσουν τις ακµές και άλλες οξείες λεπτοµέρειες, όπως θα ήταν επιθυµητό. Το πρόβληµα αυτό αντιµετωπίζεται µε την εφαρµογή µη γραµµικής επεξεργασίας. Τα µη γραµµικά φίλτρα δρουν σε περιοχές γύρω από το κάθε εικονοστοιχείο και οι νέες τιµές των εικονοστοιχείων της εικόνας προκύπτουν από έναν µη γραµµικό συνδυασµό των αρχικών τιµών. Οι πιο ενδεικτικές µη γραµµικές σχέσεις είναι η ενδιάµεση τιµή και η µέγιστη τιµή. Ένα µη γραµµικό φίλτρο, που χρησιµοποιείται πολύ συχνά για εξοµάλυνση εικόνας µε αρκετά ικανοποιητικά αποτελέσµατα, είναι το φίλτρο ενδιάµεσης τιµής (Median Filter).Το φίλτρο αυτό είναι ιδιαίτερα αποτελεσµατικό σε περιπτώσεις ύπαρξης έντονου υψίσυχνου θορύβου. Συγκεκριµένα, η αρχική τιµή ενός εικονοστοιχείου αντικαθίσταται από την ενδιάµεση τιµή των εικονοστοιχείων ενός παραθύρου µε κέντρο το εικονοστοιχείο αυτό. Για την εύρεση της ενδιάµεσης τιµής, για ένα σύνολο εικονοστοιχείων, πραγµατοποιείται προηγουµένως ταξινόµηση των τιµών των εικονοστοιχείων του παραθύρου, από τη µικρότερη προς τη µεγαλύτερη ή αντίστροφα. Σηµειώνεται ότι αν N εικονοστοιχεία έχουν την ίδια τιµή αυτή θα συµµετέχει N φορές στην ταξινόµηση. Σε ένα φίλτρο µε διαστάσεις (2κ+)x(2κ+), η ενδιάµεση τιµή είναι η τιµή που θα βρίσκεται στην παρακάτω θέση του συνόλου των ταξινοµηµένων τιµών: ( / 2) x {(2κ+) x (2κ+) + } = ( / 2) x (4κ2 + 4κ + 2) = 2κ(κ+) + Το πλεονέκτηµα του συγκεκριµένου φίλτρου είναι ότι δηµιουργεί διακριτές περιοχές ενδιαφέροντος και η µετάβαση από τη µια περιοχή στην άλλη γίνεται απότοµα, µε αποτέλεσµα η ακµή να µη θολώνεται. Επίσης, τα αποτελέσµατα µπορούν να βελτιωθούν σηµαντικά µε επαναληπτική εφαρµογή του φίλτρου. - 6 -

- 7 - Αντίθετα, αν το φίλτρο µέσου όρου χρησιµοποιηθεί επαναληπτικά, η τελική εικόνα που θα προκύψει θα είναι θολή. Το µειονέκτηµα του φίλτρου ενδιάµεσης τιµής είναι ότι σε περιπτώσεις υψηλού θορύβου, το φίλτρο ανιχνεύει εσφαλµένα µη υπαρκτές ακµές, που αντιστοιχούν σε θόρυβο, οι οποίες βέβαια µπορούν στη συνέχεια να αποµακρυνθούν µε χρήση κατωφλίωσης. 2.4.3 Φίλτρα παραγώγισης (Sharpening) H άθροιση των τιµών των εικονοστοιχείων όπως για παράδειγµα µε το φίλτρο µέσης τιµής, οδηγεί σε θόλωση των λεπτοµερειών της εικόνας. Αφού η άθροιση είναι ανάλογη µε τη διαδικασία της ολοκλήρωσης, η παραγώγιση θα έχει αντίθετο αποτέλεσµα, ενισχύοντας τις λεπτοµέρειες της εικόνας. Τα φίλτρα παραγώγισης έχουν ως στόχο την έµφαση σε λεπτοµέρειες της εικόνας ή τη βελτίωση λεπτοµερειών που έχουν θολωθεί είτε κατά λάθος ή σαν συνέπεια συγκεκριµένων µεθόδων συλλογής των δεδοµένων. Ο πιο συνηθισµένος τύπος παραγώγισης σε εφαρµογές επεξεργασίας εικόνας είναι το διάνυσµα της κλίσης. Η κλίση µιας ψηφιακής εικόνας f(x,y) ορίζεται από το διάνυσµα = = y f x f G G y x f y x ), ( Το µέτρο αυτού του διανύσµατος είναι + = 2 2 y f x f f και η κατεύθυνσή του ως προς τον άξονα x είναι ) ( tan ), ( x y G G y x a = Το διάνυσµα κλίσης αποτελεί τη βάση για διαφόρων ειδών προσεγγίσεις στην παραγώγιση εικόνας. Αν θεωρήσουµε την περιοχή της εικόνας που αντιστοιχεί στον παρακάτω πίνακα, όπου z-z9 δηλώνουν τις τιµές των χρωµατικών εντάσεων, οι µερικές παράγωγοι ως προς x και y στο σηµείο z 5 µπορούν να προσεγγιστούν µε διάφορους τρόπους τελεστής Roberts : 6 8 5 9 z z G z z G y x = = τελεστής Prewitt ) ( ) ( ) ( ) ( 7 4 9 6 3 3 2 9 8 7 z z z z z z G z z z z z z G y x + + + + = + + + + = τελεστής Sobel ) 2 ( ) 2 ( ) 2 ( ) 2 ( 7 4 9 6 3 3 2 9 8 7 z z z z z z G z z z z z z G y x + + + + = + + + + =

- 8 - Η εφαρµογή των παραπάνω τελεστών ισοδυναµεί µε συνέλιξη της εικόνας µε αντίστοιχες µάσκες.. 0 0 0 0 roberts Pr ewitt 0 0 0 0 0 0. Sobel 0 2 0 2 0 2 0 0 0 2 2.5 Κατάτµηση και διαχωρισµός δεδοµένων Η τµηµατοποίηση της βιοϊατρικής εικόνας αναφέρεται στην εξαγωγή της χρήσιµης ή της απαιτούµενης πληροφορίας από µια εικόνα ή ένα σύνολο εικόνων µε σκοπό: α) τη βελτίωση της απεικόνισης περιοχών, β) την έµφαση σε συγκεκριµένα χαρακτηριστικά της εικόνας, που είναι χρήσιµα για ανίχνευση, εκτίµηση, κατάταξη και αναγνώριση αντικειµένων από δισδιάστατες ή τρισδιάστατες εικόνες (η εκτίµηση των παραµέτρων ενός αντικειµένου, όπως το µέγεθος ή η επιφάνειά του, µπορεί να προηγείται ή να έπεται της ανίχνευσης του αντικειµένου) γ) τη χρησιµοποίηση µετασχηµατισµών (πχ. µετατόπισης, περιστροφής) για καλύτερη απεικόνιση και στη συνέχεια εκτίµηση του αντικειµένου. Οι κυριότεροι αλγόριθµοι κατάτµησης µονοχρωµατικών εικόνων βασίζονται σε µια από τις δύο βασικές ιδιότητες της τιµής του επιπέδου του γκρι χρώµατος των εικονοστοιχείων της εικόνας: την ασυνέχεια και την οµοιότητα. Στην πρώτη κατηγορία τεχνικών, η προσέγγιση βασίζεται στη διαµέριση της εικόνας µε βάση απότοµες αλλαγές στα επίπεδα του γκρι. Η πιο ενδιαφέρουσα τεχνική αυτής της κατηγορίας αναφέρεται στην ανίχνευση ακµών της εικόνας. Οι κυριότερες προσεγγίσεις στη δεύτερη κατηγορία τεχνικών βασίζονται σε τεχνικές κατωφλίωσης, αύξησης µεγέθους περιοχών, διαχωρισµού και συνένωσης περιοχών. Υπάρχουν και πιο εξελιγµένες τεχνικές τµηµατοποίησης, όπως αυτές που βασίζονται σε ενεργά περιγράµµατα και σε τεχνικές ταξινόµησης. 9 8 7 6 5 4 3 2 z z z z z z z z z

2.5. Ανίχνευση ακµών Ως ακµή ορίζεται το όριο µεταξύ περιοχών µε σχετικά διακριτές τιµές χρωµατικών πυκνοτήτων. Υποθέτουµε ότι οι περιοχές είναι αρκετά οµοιογενείς ώστε η µεταβολή των χρωµατικών πυκνοτήτων να είναι αρκετή για τον προσδιορισµό της µετάβασης µεταξύ περιοχών. Αν δεν ικανοποιείται αυτή η υπόθεση, τότε οι τεχνικές κατωφλίωσης και διαχωρισµού περιοχών, που παρουσιάζονται στις Παρ. 2.5.2 και 2.5.3. είναι καταλληλότερες. Υπάρχουν τρεις τύποι ακµών: απότοµη ακµή, οµαλή ακµή και ακµή τύπου κορυφής. Οι αντίστοιχες µορφές µεταβολής χρωµατικών πυκνοτήτων φαίνονται στο παρακάτω σχήµα. Εικόνα 7. Μεταβολή χρωµατικών πυκνοτήτων Η βασική ιδέα πίσω από όλες τις µεθόδους ανίχνευσης ακµών είναι ο υπολογισµός ενός τελεστή τοπικής παραγώγου. Η πρώτη παράγωγος σε οποιοδήποτε σηµείο της εικόνας υπολογίζεται µε τη βοήθεια του µέτρου του διανύσµατος της κλίσης και η δεύτερη παράγωγος υπολογίζεται µε χρήση του τελεστή Laplace. Ένα στοιχείο εικόνας ανήκει στο περίγραµµα µιας δοµής αν η δισδιάστατη πρώτη ή δεύτερη παράγωγός του είναι µεγαλύτερη από κάποιο προκαθορισµένο κατώφλι. Μια ευρύτατα χρησιµοποιούµενη µέθοδος ανίχνευσης ακµών βασίζεται στη χρήση της κλίσης της εικόνας που υπολογίζεται µε τη βοήθεια των µερικών παραγώγων πρώτης τάξης σε κάθε θέση εικονοστοιχείου εικόνας. Όπως αναφέρθηκε προηγουµένως, οι παράγωγοι αυτές µπορούν να υλοποιηθούν ψηφιακά µε διάφορους τρόπους. Ωστόσο,οι τελεστές Sobel παρέχουν το πλεονέκτηµα της ταυτόχρονης διαφόρισης και εξοµάλυνσης. Επειδή οι παράγωγοι ενισχύουν το θόρυβο, η εξοµάλυνση που επιτυγχάνεται µε χρήση των τελεστών Sobel είναι ιδιαίτερα σηµαντική. Οι µέθοδοι αυτές βασίζονται στην παρατήρηση ότι στην περιοχή των ορίων των αντικειµένων, το πλάτος της κλίσης των χρωµατικών πυκνοτήτων έχει πολύ υψηλότερη τιµή από ό,τι µακριά από τα όρια. Κατά συνέπεια, το σύνολο των εικονοστοιχείων ενός οργάνου στα οποία το πλάτος της κλίσης έχει σηµαντική τιµή, αναπαριστούν το σύνολο των εικονοστοιχείων του ζητούµενου περιγράµµατος του οργάνου. υστυχώς όµως, στην πράξη, το σύνολο των εικονοστοιχείων που προσδιορίζεται µε αυτό τον τρόπο περιλαµβάνει και άλλα στοιχεία που δεν ανήκουν στη δοµή ενώ µπορεί να αποτύχει ακόµη και στην ανίχνευση εικονοστοιχείων που ανήκουν στη δοµή. Για την αντιµετώπιση αυτού του προβλήµατος, έχει αναπτυχθεί µια σειρά τεχνικών βελτιστοποίησης για την ελαχιστοποίηση των εικονοστοιχείων - 9 -

του περιγράµµατος που λείπουν και των εικονοστοιχείων που δεν ανήκουν στο περίγραµµα. Μια τέτοια προσέγγιση έγκειται στην απόδοση µίας τιµής κόστους σε κάθε υποψήφιο εικονοστοιχείο του περιγράµµατος και την ανίχνευση του συνόλου εκείνου των εικονοστοιχείων που ελαχιστοποιούν αυτό το κόστος για να αποτελέσουν ετσι το τελικό περίγραµµα. 2.5.2 Κατωφλίωση Μία από τις βασικές τεχνικές τµηµατοποίησης εικόνων είναι η κατωφλίωση. Η κατωφλίωση µε βάση κάποιο χαρακτηριστικό της εικόνας, όπως για παράδειγµα το επίπεδο χρωµατικών πυκνοτήτων, είναι µία πολύ σηµαντική τεχνική της επεξεργασίας και ανάλυσης εικόνων, καθώς συχνά αποτελεί το πρώτο βήµα για ανίχνευση - προσδιορισµό αντικειµένων. Πρέπει να αναφερθεί ότι το πρόβληµα της τµηµατοποίησης µπορεί να είναι πολύ σύνθετο, λόγω των φαινοµένων ύπαρξης θορύβου, σκιών ή άλλων γεωµετρικών παραµορφώσεων. Η κατωφλίωση µπορεί να θεωρηθεί ως µια διαδικασία που περιλαµβάνει ελέγχους και σύγκριση κάποια ιδιότητας των εικονοστοιχείων, όπως της τιµής της χρωµατικής πυκνότητας, της υφής κ.ά, µε µια συνάρτηση κατωφλίου Τ της µορφής T = T[ x, y, p( x, y), f ( x, y)) ] όπου f (x,y) είναι η συνάρτηση χρωµατικής πυκνότητας (ή υφής) στο σηµείο (x,y) και p(x,y) εκφράζει κάποια τοπική ιδιότητα του σηµείου αυτού, οπως για παράδειγµα τη µέση τιµή της χρωµατικής πυκνότητας σε µια περιοχή µε κέντρο το σηµείο (x,y). Η κατωφλίωση µπορεί να βασίζεται στη χρήση σταθερού κατωφλίου Τ για όλη την εικόνα (ολική κατωφλίωση) ή προσαρµοστικού κατωφλίου, του οποίου η τιµή εξαρτάται από τις τοπικές ιδιότητες της εικόνας (προσαρµοστική κατωφλίωση). Έχουν προταθεί διάφορες τεχνικές για την επιλογή του κατωφλίου, καµία όµως δεν εξασφαλίζει γενική αποτελεσµατικότητα. Συνήθως η επιλογή κατωφλίου εµπλέκει ανάλυση του ιστογράµµατος της εικόνας. Για παράδειγµα η µέση χρωµατική πυκνότητα µπορεί να χρησιµοποιηθεί ως τιµή κατωφλίου. Αν η κατωφλίωση γίνεται µε βάση την τιµή του κάθε εικονοστοιχείου, µπορεί να υλοποιηθεί είτε ακολουθιακά, µε τη συνήθη σάρωση της εικόνας σε γραµµές (raster scan), ή παράλληλα, όπου η επεξεργασία κάθε εικονοστοιχείου γίνεται ανεξάρτητα από τα υπόλοιπα, µε αποτέλεσµα την επιτάχυνση της εκτέλεσης. Κατά τη διαδικασία κατωφλίωσης τα εικονοστοιχεία κατατάσσονται σε δύο κατηγορίες και δηµιουργείται µια δυαδική εικόνα. Η διαδικασία ατωφλίωσης µε σταθερή τιµή κατωφλίου T για όλη την εικόνα f(x,y) εκφράζεται από τις σχέσεις κανονική κατωφλίωση :, f ( x, y) > T g( x, y) = 0, f ( x, y) T αντίστροφη κατωφλίωση:, f ( x, y) T g( x, y) = 0, f ( x, y) > T Μια παραλλαγή της παραπάνω διαδικασίας µε χρήση απλού κατωφλίου, αποτελεί η χρήση δύο κατωφλίων Τ και Τ2 που ορίζουν ένα εύρος τιµών κατά τη διαδικασία της κατωφλίωσης, η οποία εκφράζεται από τη σχέση - 20 -

διπλή κατωφλίωση : 0, f ( x, y) T g ( x, y) =, T f ( x, y) T2 0, f ( x, y) > T2 Η προσαρµοστική κατωφλίωση που είναι γνωστή και ως τοπική ή κατά περιοχές κατωφλίωση, χρησιµοποιεί περισσότερες της µίας τιµές κατωφλίων. Εφαρµόζεται όταν το επίπεδο της έντασης του υποβάθρου δεν είναι σταθερό και το αντικείµενο παρουσιάζει µεταβολές µέσα στην εικόνα. Εξετάζει τις σχέσεις γειτονικών εικονοστοιχείων εικόνας και προσαρµόζει το κατώφλι σύµφωνα µε τη στατιστική πυκνοτήτων σε διάφορες περιοχές. 2.5.3 ιαχωρισµός Περιοχών Εκτός από την εύρεση των ορίων των περιοχών µε βάση ασυνέχειες της έντασης, ή µε κατωφλίωση µε βάση την κατανοµή των χρωµατικών πυκνοτήτων των εικονοστοιχείων, υπάρχει µια σηµαντική κατηγορία τεχνικών τµηµατοποίησης που έχει σαν στόχο τον απευθείας διαχωρισµό των περιοχών. Μία αντιπροσωπευτική τεχνική αυτής της κατηγορίας είναι η αύξηση µεγέθους περιοχών (region growing). Σύµφωνα µε την τεχνική αυτή, η εικόνα διαιρείται σε πολλές µικρές περιοχές, κάθε µία από τις οποίες αρχικά µπορεί να αποτελείται από ένα µόνο εικονοστοιχείο. Στη συνέχεια ταξινοµούνται στην ίδια περιοχή όσα γειτονικά εικονοστοιχεία έχουν την ίδια ή πολύ κοντινή τιµή κάποιας ιδιότητας (π.χ. χρωµατικής πυκνότητας, υφής) και ελέγχονται τα όρια των περιοχών που δηµιουργήθηκαν, όπως και η διαφορά τιµών εκατέρωθεν των ορίων, συγκρίνοντας τα µε κάποιο κατώφλι. Οι περιοχές που αντιστοιχούν σε µεγάλες µεταβολές διατηρούνται αµετάβλητες, ενώ αυτές που αντιστοιχούν σε µικρότερες ενώνονται σε µεγαλύτερες περιοχές (merging).η διαδικασία αυτή επαναλαµβάνεται µέχρι την εξάλειψη ασθενών µεταβολών ανάµεσα στις περιοχές, µε βάση κάποιο προκαθορισµένο κατώφλι. Μια παραλλαγή αυτού του αλγορίθµου τµηµατοποίησης βασίζεται στην ανάπτυξη περιοχών µε εκκίνηση από καθορισµένο αρχικό σηµείο. Συγκεκριµένα, ο χρήστης επιλέγει ένα αρχικό σηµείο από το οποίο αρχίζει η ανάπτυξη της περιοχής, καθώς και ένα κατώφλι οµοιότητας που καθορίζει τη µέγιστη επιτρεπόµενη διαφορά χρωµατικής πυκνότητας (ή υφής) µεταξύ εικονοστοιχείων που ανήκουν στην περιοχή. Ο αλγόριθµος εξετάζει τα γειτονικά εικονοστοιχεία και αν πληρούν το κριτήριο οµοιότητας εισάγονται στην περιοχή ενδιαφέροντος. Η διαδικασία αυτή επαναλαµβάνεται για κάθε νέο εισερχόµενο στην περιοχή εικονοστοιχείο µέχρι να µην µπορεί να βρεθεί άλλο εικονοστοιχείο που να πληρεί τελικά το κριτήριο οµοιότητας. 2.5.4 Ενεργά Περιγράµµατα Αποτελεί µια από τις πιο εξελιγµένες τεχνικές που αναπτύχθηκαν τα τελευταία δέκα χρόνια και έχουν ως στόχο τη βελτίωση της ακρίβειας του προσδιορισµού της αρχικής εκτίµησης του περιγράµµατος µιας δοµής. Οι µέθοδοι αυτές συνήθως αποδίδονται µε τους όρους ενεργά περιγράµµατα (active contour), ενεργές επιφάνειες, και παραµορφώσιµα περιγράµµατα. Η βασική ιδέα αυτών των - 2 -

µεθόδων στηρίζεται στον αρχικό προσδιορισµό ενός προσεγγιστικού περιγράµµατος της δοµής ενδιαφέροντος. Στη συνέχεια, το περίγραµµα αυτό παραµορφώνεται µε αλγοριθµική µέθοδο έτσι ώστε να προσεγγίσει µε µεγαλύτερη ακρίβεια τις πραγµατικές ακµές της δοµής. Στο περίγραµµα εφαρµόζεται και µηχανικό µοντέλο ελαστικότητας ώστε να διατηρεί κάποια µορφή συνοχής και οµαλότητας, ενώ εξασκούνται και κάποιες δυνάµεις από τα ζητούµενα χαρακτηριστικά στοιχεία της εικόνας που στη συγκεκριµένη περίπτωση είναι οι ακµές της. Η τελική µορφή του περιγράµµατος λαµβάνεται ελαχιστοποιώντας κάποια συνάρτηση ενέργειας, η οποία περιλαµβάνει µια εσωτερική και µια εξωτερική συνιστώσα. Η εσωτερική συνιστώσα ελέγχει την οµαλότητα και τη συνέχεια της µορφής του περιγράµµατος. Η εξωτερική συνιστώσα έλκει το περίγραµµα προς τις πραγµατικές ακµές του αντικειµένου. Το περίγραµµα περιγράφεται µε τη µορφή παραµετρικής καµπύλης στις δύο διαστάσεις v ( s) = [ x( s), y( s) ] όπου η παράµετρος s αντιπροσωπεύει το µήκος του τόξου. Η συνάρτηση ενέργειας ορίζεται από την παρακάτω σχεση: E ext { E [ v s) ] E [ v( s ]} = int ( + ) ds 0 όπου Eint και Eext είναι οι συνιστώσες εσωτερικής και εξωτερικής ενέργειας αντίστοιχα. Για τον προσδιορισµό του περιγράµµατος ελαχιστοποιείται η ενέργεια. Οι διάφορες παραλλαγές των µεθόδων αυτής της κατηγορίας σχετίζονται µε τον τρόπο προσδιορισµού του αρχικού περιγράµµατος, µε τον τελεστή ανίχνευσης ακµών που χρησιµοποιείται, µε τον τρόπο ορισµού των Eint και Eext και µε τον τρόπο που υπολογίζεται το ελάχιστο της ενέργειας. Συνήθως, η Eint περιλαµβάνει όρους που εξοµαλύνουν την ελαστικότητα και τη συνέχεια του περιγράµµατος και η Eext αποτελείται από όρους που εξισορροπούν τις δυνάµεις της εικόνας και τους περιορισµούς που τίθενται από τη φύση του προβλήµατος. Επειδή είναι δύσκολο να εξασφαλιστεί ότι η διαδικασία βελτιστοποίησης µπορεί να υπολογίσει το ολικό ελάχιστο της ενέργειας, συνήθως υπολογίζεται η µορφή του περιγράµµατος που αντιστοιχεί σε κάποιο τοπικό ελάχιστο. Αυτό το αποτέλεσµα δεν είναι πάντα το επιθυµητό. Οι πιο σηµαντικές απαιτήσεις είναι α) η ακρίβεια, δηλ. το περίγραµµα που ανιχνεύεται να αντιστοιχεί στο πραγµατικό, β) η ευστάθεια, δηλ. νέα εφαρµογή της µεθόδου να οδηγεί στην ανίχνευση του ίδιου περιγράµµατος και γ) η αποτελεσµατικότητα, δηλ. πόσο βελτιώνεται το αποτέλεσµα σε σχέση µε τον ορισµό του περιγράµµατος από το χρήστη. Στο επόµενο σχήµα, φαίνεται η τµηµατοποίηση της καρδιακής κοιλίας µε χρήση ενεργού περιγράµµατος. - 22 -

Εικόνα 8. Τµηµατοποίηση καρδιακής κοιλίας µε χρήση ενεργών περιγραµµάτων. Κατά σειρά α) αρχικοποίηση β)ενδιάµεσο αποτέλεσµα γ)τελικό αποτέλεσµα 2.5.5 Τµηµατοποίηση µε χρήση Τεχνικών Ταξινόµησης Με τη διαδικασία ταξινόµησης επιτυγχάνεται η µείωση της ποσότητας των δεδοµένων, οµαδοποιώντας δεδοµένα µε κοινά χαρακτηριστικά. Τέτοιες οµαδοποιήσεις διευκολύνουν τον ανθρώπινο εγκέφαλο να επεξεργαστεί την παρεχόµενη πληροφορία µε τρόπο πιο αποτελεσµατικό και ακριβή. Η οµαδοποίηση στο χώρο των χαρακτηριστικών των δεδοµένων πραγµατοποιείται αυτόµατα µε χρήση αλγορίθµων ταξινόµησης (classification). Οι αλγόριθµοι ταξινόµησης µπορούν να διακριθούν σε δυο βασικούς τύπους: τους ιεραρχικούς και τους διαµεριστικούς. Οι ιεραρχικοί αλγόριθµοι αρχικοποιούνται µε τυχαίο προσδιορισµό των κατηγοριών (κλάσεων) και αναπτύσσονται διασπώντας µεγάλες µη οµογενείς κατηγορίες ή αντίθετα ενώνοντας µικρές κατηγορίες µε µεγάλη οµοιότητα. Οι διαµεριστικοί αλγόριθµοι επιχειρούν να διαιρέσουν άµεσα τα δεδοµένα σε ένα σύνολο διακριτών κατηγοριών, ελαχιστοποιώντας ένα µέτρο ανοµοιότητας µεταξύ δεδοµένων που ανήκουν στην ίδια κατηγορία και µεγιστοποιώντας το µέτρο αυτό για δεδοµένα που ανήκουν σε διαφορετικές κατηγορίες. Θεωρούµε το πρόβληµα της ταξινόµησης ενός συνόλου διανυσµάτων x ij x, x,... x ), i,... N ( 2 M = σε Κ κατηγορίες. Το κέντρο κάθε κατηγορίας, δηλ. ο αριθµητικός µέσος των διανυσµάτων που έχουν αποδοθεί σε αυτή, συµβολίζεται µε r m κ, k =,... K Στην ανάλυση που ακολουθεί θεωρούµε ότι το διάνυσµα x r i αποτελείται από τη χρωµατική τιµή ενός εικονοστοιχείου καθώς και τις χρωµατικές τιµές των γειτονικών του εικονοστοιχείων, που περιλαµβάνονται σε µια περιοχή διαστάσεων 3 3 3. Ανάλογα µε τη φύση των δεδοµένων µπορεί να απαιτηθεί η χρήση πιο εξεζητηµένων διανυσµάτων χαρακτηριστικών που περιλαµβάνουν για παράδειγµα πληροφορία υφής (texture). - 23 -

2.5.5. Αλγόριθµος των Κ Μέσων Ο αλγόριθµος των Κ-Μέσων (Κ-Means, KM) εξελίσσεται ελαχιστοποιώντας την ακόλουθη ποσότητα N r r 2 E = x i m ) i= ( κ Όπου m r κείναι το κέντρο της κατηγορίας που είναι πιο κοντά στο διάνυσµα δεδοµένων x r i. H υλοποίηση του αλγορίθµου µε τη µορφή ψευδοκώδικα παρουσιάζεται στη συνέχεια: t = 0 Αρχικοποίηση των κέντρων των κατηγοριών k=, K µε τυχαία κέντρα m k (0) Επανάληψη { } µέχρι Για τα κέντρα mk (t) όλων των κατηγοριών { Εντοπισµός των διανυσµάτων δεδοµένων των οποίων η Ευκλείδεια απόσταση από το mk (t) είναι ελάχιστη το m k ( t+) παίρνει τιµή ίση µε το νέο κέντρο βάρους του x k } t = t+ x k (, n k : πλήθος διανυσµάτων που ανήκουν στην k- κατηγορία n m k t+ ) = k m ( t ) m ( t) error για όλες τις κατηγορίες k k k 2.5.5.2 Ασαφής αλγόριθµος των Κ Μέσων Ο ασαφής αλγόριθµος των Κ-Μέσων (Fuzzy K-Means, FΚΜ) αποτελεί µια παραλλαγή του αλγορίθµου ΚΜ, στον οποίο εισάγεται ασάφεια µε τη µορφή κάποιας συνάρτησης υποψηφιότητας (candidature function). Η συνάρτηση υποψηφιότητας καθορίζει την πιθανότητα µε την οποία κάθε στοιχείο του τρισδιάστατου συνόλου δεδοµένων µπορεί να ανήκει σε κάποια κατηγορία. Ο αλγόριθµος FKM και οι παραλλαγές του έχουν χρησιµοποιηθεί σε διάφορα προβλήµατα ταξινόµησης προτύπων. Αν υποτεθεί η ύπαρξη ενός συνόλου Ν διανυσµάτων δεδοµένων x i, i=,... N που δεν έχουν ακόµα αποδοθεί σε κάποια κατηγορία και πρέπει να ταξινοµηθούν σε Κ κατηγορίες, µια συνάρτηση υποψηφιότητας u µπορεί να οριστεί µε τη µορφή: u : ( k, x) [ 0,] - 24 -

όπου k Kείναι ένας ακέραιος δείκτης που αντιστοιχεί σε κάποια κατηγορία. Η συνάρτηση υποψηφιότητας αποδίδει σε κάποιο διάνυσµα δεδοµένων µια τιµή πιθανότητας u kx, 0 u kx, η οποία δείχνει την πιθανότητα να ανήκει το διάνυσµα x r i στην κατηγορία k. H συνάρτηση υποψηφιότητας υλοποιείται υπολογιστικά ως ένας δισδιάστατος πίνακας, ο πρώτος δείκτης του οποίου αντιστοιχεί στην κατηγορία ενώ ο δεύτερος στο διάνυσµα δεδοµένων. Για να συµφωνεί η συνάρτηση υποψηφιότητας µε το µαθηµατικό ορισµό της πιθανότητας πρέπει να ισχύει ο ακόλουθος περιορισµός: N i= u ki =, k =,...K Ο αλγόριθµος FKM εξελίσσεται ελαχιστοποιώντας την ακόλουθη ποσότητα: K N p r r 2 E = u x m ) k= i= ki ( i κ όπου ο εκθέτης p είναι πραγµατικός αριθµός, < p και ρυθµίζει το βαθµό ασάφειας της διαδικασίας τµηµατοποίησης. Ο αλγόριθµος FKM µπορεί να περιγραφεί µε τη µορφή ψευδοκώδικα ως ακολούθως: t = 0 Τυχαία αρχικοποίηση του πίνακα πιθανοτήτων µ Επανάληψη { Υπολογισµός των κέντρων των κατηγοριών µε χρήση του τύπου } µέχρι N p uki xi i= m k ( t) =, k =,... K N p u i= ki Υπολογισµός των νέων τιµών u: = K xi m u kt j= xi m t = t+ j k 2 p m ( t ) m ( t) errork ήk u ( t) u ( t) i i ki ki error 2.6 Μορφολογικοί τελεστές Οι µορφολογικοί τελεστές εφαρµόζονται για την επεξεργασία δυαδικών ή γκρι αποχρώσεων εικόνων βασισµένοι στη γεωµετρία. Αυτοί οι τελεστές παίρνουν µια εικόνα ως είσοδο, εφαρµόζουν σε αυτήν έναν τελεστή, και επιστρέφουν την επεξεργασµένη εικόνα ιδίων διαστάσεων µε την αρχική. Η τιµή κάθε εικονοστοιχείου - 25 -

της εικόνας εξόδου βασίζεται στη σχέση του εικονοστοιχείου εισόδου και του γειτονικού του. Ένα ουσιαστικό µέρος των µορφολογικών τελεστών είναι το δοµικό στοιχείο (structure element). Αυτό µπορεί να είναι αυθαίρετου σχήµατος και µεγέθους. Οι µορφολογικοί τελεστές επεξεργάζονται µια εικόνα εφαρµόζοντας το δοµικό στοιχείο στην εικόνα αυτή και χρησιµοποιώντας έναν τελεστή (τοµή, ένωση, κ.λπ.). Οι βασικοί µορφολογικοί τελεστές είναι οι erosion (διάβρωση), dilation (διαστολή), opening (άνοιγµα) και closing (κλείσιµο). Στα παρακάτω δείγµατα το δοµικό στοιχείο είναι ένα τετράγωνο 3x3. 2.6. Erosion (διάβρωση) H βασική επίδραση αυτού του τελεστή πάνω στην εικόνα είναι να διαβρώνει τα σύνορα της περιοχής των εικονοστοιχείων που βρίσκονται στο προσκήνιο (π.χ. λευκά). Εικόνα 9. Εφαρµογή τελεστή διάβρωσης 2.6.2 Dilation (διαστολή) H βασική επίδραση πάνω στην εικόνα είναι η διεύρυνση των συνόρων των περιοχών των εικονοστοιχείων που βρίσκονται στο προσκήνιο (π.χ. λευκά). Εικόνα 0. Εφαρµογή τελεστή διαστολής - 26 -

2.6.3 Opening (άνοιγµα) Το άνοιγµα (opening) είναι µία erosion διαδικασία η οποία ακολουθείται από µία dilation διαδικασία. 2.6.4 Closing (κλείσιµο) Το κλείσιµο (closing) δηµιουργείται από µία dilation διαδικασία η οποία ακολουθείται από µία erosion διαδικασία. - 27 -

- 28 -

Κεφάλαιο 3 ο Επιλογή χαρακτηριστικών γνωρισµάτων Μετά την προεπεξεργασία της εικόνας ακολουθεί το σηµαντικό κοµµάτι της εξαγωγής των χαρακτηριστικών από την εικόνα που θα επιτρέψουν να γίνει αργότερα η διάγνωση. Η αυτόµατη διάγνωση καρκίνου στηρίζεται στον εντοπισµό (Ι) των αποκλίσεων στις δοµές των κυττάρων (cell-level), και (II) των αλλαγών στη κατανοµή των κυττάρων µέσα στον ιστό (tissue-level). Τα χαρακτηριστικά γνωρίσµατα εξάγονται για να ποσοτικοποιηθούν αυτές τις αλλαγές σε µια δεδοµένη εικόνα ιστού. Για να µετρηθούν οι αποκλίσεις σε εικόνα επιπέδου tissue-level µπορούν να χρησιµοποιηθούν µορφολογικά χαρακτηριστικά ή χαρακτηριστικά βασισµένα στην υφή της εικόνας ή βασισµένα στην ένταση του χρώµατος. Στην εξαγωγή τέτοιων ειδών χαρακτηριστικών γνωρισµάτων στο celllevel, οι ακριβείς θέσεις των κυττάρων πρέπει να καθοριστούν εκ των προτέρων. Αντίθετα, για να µετρηθούν οι αλλαγές σε εικόνα της µορφής tissue-level, χαρακτηριστικά που εξάγονται από την υφή ή από την τοπολογία είναι αυτά που προσφέρουν πληροφορίες. Η χρήση αυτών των χαρακτηριστικών γνωρισµάτων σε εικόνες που απεικονίζουν ιστό δεν απαιτεί πάντα την κατάτµηση κυττάρων. Ακόµα κι αν η κατάτµηση είναι απαραίτητη, ο καθορισµός των θέσεων των κυττάρων είναι συνήθως ικανοποιητικός ακόµα και αν είναι κάπως πιο γενικός. (π.χ., τοπολογική εξαγωγή χαρακτηριστικών). Προκειµένου να εξαχθούν τα χαρακτηριστικά γνωρίσµατα, υπάρχουν δύο διαφορετικοί τύποι πληροφοριών διαθέσιµοι στην εικόνα: (Ι) η ένταση του φωτός, των χρωµάτων αν πρόκειται για έγχρωµη εικόνα, των εικονοστοιχείων και (II) η χωρική αλληλεξάρτησή τους. Αν και όλες οι µέθοδοι εξαγωγής χαρακτηριστικών γνωρισµάτων χρησιµοποιούν τις πληροφορίες για τις τιµές έντασης, µόνο µερικοί χρησιµοποιούν τη χωρική εξάρτηση µεταξύ τους. Γενικά τα χαρακτηριστικά µπορούν να χωρισθούν στις παρακάτω κύριες κατηγόριες: µορφολογικά, υφής και τοπολογικά, τα οποία έχουν διαφορετική ερµηνεία και χρήση. Στις επόµενες τρεις παραγράφους θα αναφερθούν τα σηµαντικότερα χαρακτηριστικά 3. Μορφολογικά χαρακτηριστικά Τα µορφολογικά χαρακτηριστικά παρέχουν πληροφορίες για την µορφή και το µέγεθος του κυττάρου. Το µέγεθος εκφράζεται κυρίως απο την περίµετρο, την ακτίνα και το εµβαδόν του κυττάρου. Αν υποθέσουµε ότι το S=(s, s 2 s n ) είναι το σύνολο των εικονοστοιχείων που αποτελούν το όριο ενός κυττάρου και C είναι το κεντρικό εικονοστοιχείο αυτού του ορίου τότε τα χαρακτηριστικά που αναφέραµε ορίζονται ως εξής: Η ακτίνα r ορίζεται ως η µέση τιµή των αποστάσεων µεταξύ όλων των οριακών εικονοστοιχείων από το κεντρικό n i = i = r n s C - 29 -

Το εµβαδόν ορίζεται ως ο αριθµός των εικονοστοιχείων που περικλείονται από τα όρια του κυττάρου Η περίµετρος Ρ ορίζεται ως το άθροισµα των αποστάσεων µεταξύ των συνεχόµενων οριακών εικονοστοιχείων P = s n ns + si si + i= Επιπρόσθετα, η µορφή του σχήµατος του κυττάρου περιγράφεται κυρίως από µετρικές όπως η πυκνότητα (compactness) η στρογγυλότητα (roundness), η οµαλότητα (smoothness), οι δυο κύριοι άξονες, η συµµετρία, η περίµετρος και η κοιλότητα (κοίλο ή κυρτό) (concavity) Η πυκνότητα ορίζεται ως ο λόγος του τετράγωνου της περιµέτρου προς το εµβαδόν Η στρογγυλότητα είναι η πυκνότητα διαιρουµένη µε 4π Η οµαλότητα του ορίου,του περιγράµµατος, του κυττάρου είναι το άθροισµα των οµαλοτητων για όλα τα εικονοστοιχεία του ορίου. Η οµαλότητα ενός εικονοστοιχείου είναι η διαφορά µεταξύ της ακτίνας του συγκεκριµένου εικονοστοιχείου µε το κέντρο και της µέσης τιµής των ακτινών που το περιβάλλουν Ο κύριος άξονας είναι η µεγαλύτερη χορδή που περνά από το κέντρο και ο ελάσσων άξονας είναι η κάθετη χορδή στον κύριο άξονα που περνά από το κέντρο Η συµµετρία ποσοτικοποιείται µετρώντας την διαφορά µήκους µεταξύ των 2 µερών, που ορίζονται από την τοµή της γραµµής αυτής που είναι κάθετη στον κύριο άξονα µε τον κύριο άξονα. Η καµπυλότητα κρίνεται αν ενώσουµε µε χορδές σηµεία της περιφέρεια, µη διαδοχικά, και εξετάσουµε αν τα υπόλοιπα εικονοστοιχεία που αποτελούν το όριο βρίσκονται εντός ή εκτός των χορδών αυτών. Τα παραπάνω φαίνονται αρκετά εύγλωττα στις τρεις εικόνες που ακολουθούν. Εικόνα. α) κύριος και ελλάσων άξονας β) συµµετρία γ) καµπυλότητα Πρέπει να τονισθεί ότι ανάλογα µε τον κάθε ερευνητή χρησιµοποιούνται και αλλά χαρακτηριστικά που µπορούν να είναι ανεξάρτητα ή να αποτελούνται από συνδυασµό αυτών ή από αλλά παρεµφερή. - 30 -

3.2 Χαρακτηριστικά γνωρίσµατα υφής Αν θέλαµε να δώσουµε ένα ορισµό στο τι είναι η υφή σε µια εικόνα θα λέγαµε ότι η υφή είναι ένα σύνολο απο εικονοστοιχεία τα οποία εµφανίζονται περιοδικά στην εικόνα. Αυτή παρέχει πληροφορία για την µεταβολή στην ένταση µιας επιφάνειας ποσοτικοποιώντας χαρακτηριστικά όπως η οµαλότητα, η τραχύτητα και η κανονικότητα. Ένα κύριο εργαλείο για την εξαγωγή τέτοιων χαρακτηριστικών είναι ο πίνακας συνύπαρξης (co-occurrence matrix). Ο πίνακας συνύπαρξης υπολογίζει τα διάφορα χαρακτηριστικά της υφής όπως η εντροπία, η ενέργεια, η οµοιογένεια, η συσχέτιση, το κοντράστ και η πρώτης τάξης ροπή κάνοντας χρήση της χωρικής εξάρτησης µεταξύ των τιµών του επιπέδου του γκρι για κάθε εικονοστοιχείο. Σε εικόνες επιπέδου κυττάρου τα χαρακτηριστικά που εξάγονται από τους πίνακες αυτούς υπολογίζονται για κάθε κύτταρο ή ακόµα και περιοχή του κυττάρου ξεχωριστά, σε αντίθεση µε εικόνες επιπέδου ιστού όπου τα χαρακτηριστικά αφορούν όλη την εικόνα του ιστού ή υποπεριοχές της. Το σετ χαρακτηριστικών που εξάγεται απο την κάθε υποπεριοχή µπορεί να συνδυαστεί µε αλλά για να χρησιµοποιηθεί σε όλη την εικόνα ή και να χρησιµοποιηθεί ακόµα και απευθείας. Σε κάποιες µελέτες τέτοια χαρακτηριστικά από υποπεριοχές τετραγωνικές χρησιµοποιήθηκαν για να διαχωρισθούν περιοχές που απεικόνιζαν κύτταρα από το υπόλοιπο περιβάλλον και να γίνει έτσι ένα είδος κατάτµησης. Ένας ακόµη τρόπος να εξαχθούν χαρακτηριστικά από µια εικόνα είναι η επεξεργασία µε τον µετασχηµατισµό wavelet, ένα πολύ γνωστό και ευρέως χρησιµοποιηµένο µαθηµατικό µοντέλο. Για παράδειγµα µπορούν να υπολογιστούν οι wavelet µετασχηµατισµοί της εικόνας περνώντας την µέσα από κάποια φίλτρα και να χρησιµοποιηθεί η ενέργεια των φιλτραρισµένων εικόνων ως χαρακτηριστικό υφής. Επιπλέον ένας τρόπος για να συγκεντρωθούν πληροφορίες για την εικόνα είναι να µελετηθεί το ιστόγραµµα της, το οποίο αποτελεί µια στατιστική απεικόνιση της επιφανειακής έντασης της εικόνας όπως αναφέρθηκε σε προηγούµενη παράγραφο. Τα χαρακτηριστικά που µπορούν να εξαχθούν από την επεξεργασία του ιστογράµµατος µιας εικόνας είναι κυρίως αυτά που αναφέρονται παρακάτω. Συνήθως πρόκειται για γκρι επιπέδου (gray level) εικόνες όποτε το p(i) αναφέρεται στην κατανοµή πιθανότητας των τιµών έντασης ι αφού ορίζεται ως h(i)/m*n όπου το h(i) είναι ο αριθµός των εικονοστοιχείων που έχουν την τιµή ι και M,N οι διαστάσεις της εικόνας και το G είναι ο αριθµός των επιπέδων του γκρι στην εικόνα. Αντίστοιχα βέβαια µπορεί να εφαρµοστεί για τις τρεις συνιστώσες RGB µιας έγχρωµης εικόνας. µέση τιµή µ = G i= 0 διασπορά σ = G i= 0 ip( i) ( i µ ) ασυµµετρία µ 2 p( i) G 3 3 3 = σ ( i µ ) p( i) i= 0-3 -

κύρτωση µ ενέργεια G 4 4 4 = σ ( i µ ) p( i) i= 0 E = G i= 0 εντροπία H = [ p( i) ] G i= 0 2 p i)log [ p( i)] ( 2 Το κύριο χαρακτηριστικό που διακρίνει τις παραπάνω τιµές είναι η απλότητα τους τόσο στην εξαγωγή τους όσο και στην χρήση τους. υστυχώς όµως αυτά τα γνωρίσµατα δεν είναι ικανά από µόνα τους να χαρακτηρίσουν µια εικόνα και για αυτό λόγο χρησιµοποιείται ο πίνακας co-occurrence ο οποίος αποτελεί το κυριότερο εργαλείο πλέον στην επεξεργασία της εικόνας (GLCM=Grey Level Coocurrence Matrix). Αιτία αυτού είναι η διαπίστωση ότι καµία εικόνα δεν µπορεί να διακριθεί απο µια άλλη αν δεν διαφέρουν στις στατιστικές δεύτερης τάξης τους. Ο πίνακας αυτός τις στατιστικές αυτές εκφράζει και για αυτό είναι τόσο χρήσιµος. Ο πίνακας αυτός ορίζεται ως εξής για µια γκρι επιπέδων εικόνα: δοσµένης µιας εικόνας f(x,y) µε G διακριτά επίπεδα του γκρι ο πίνακας co-occurrence h d,θ (i,j) παίρνει για όρισµα του σε κάθε θέση (i,j) τον αριθµό των επαναλήψεων εµφανίσεως της σχέσης f(x α,y α )=i- και f(x β,y β )=j- µε την προϋπόθεση όµως ότι (x β,y β )=(x α +dcosθ,y α +dsinθ). Αυτός ο πίνακας ουσιαστικά υποδηλώνει την συσχέτιση που έχουν οι τιµές των εικονοστοιχείων για ορισµένη διεύθυνση και απόσταση. Για την απόσταση d µπορούν να επιλεχθούν οποιεσδήποτε τιµές (,2,..) ενώ για την γωνία θ επιλέγονται οι 0 ο, 45 ο,90 ο, 35 ο. Για παράδειγµα αν η εικόνα είναι διαστάσεων 4χ4 µε τέσσερα επίπεδα γκρι, έστω η επόµενη 0 0 0 0 0 2 2 2 2 2 3 3 τότε ο πίνακας GLCM για d=,θ=0 ο είναι ο παρακάτω 2 2 0 0 2 0 0 0 0 3 0 0 0 Ο πίνακας GLCM θα είναι διαστάσεων GxG όπου G ο αριθµός των γκρι επιπέδων της εικόνας που στην περίπτωση αυτή είναι 4 Από τον πίνακα αυτό λοιπόν, έστω h(i,j), εξάγουµε πολύ χρήσιµα χαρακτηριστικά όπως είναι - 32 -