Βουτσκοπούλου Ευαγγελία



Σχετικά έγγραφα
Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

Digital Image Processing

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

DIP_05 Τµηµατοποίηση εικόνας. ΤΕΙ Κρήτης

DIP_04 Σημειακή επεξεργασία. ΤΕΙ Κρήτης

Κατάτµηση εικόνας σε οµοιόµορφες περιοχές

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Τηλεπισκόπηση - Φωτοερμηνεία

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ραδιομετρική Ενίσχυση - Χωρική Επεξεργασία Δορυφορικών Εικόνων

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Πανεπιστήμιο Θεσσαλίας. Πολυτεχνική Σχολή ΘΕΜΑΤΙΚΗ : ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή

Ιατρική Πληροφορική. Δρ. Π. ΑΣΒΕΣΤΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ Τ.Ε.

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 11 η : θεωρία Χρώματος & Επεξεργασία Έγχρωμων Εικόνων

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας

ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ

Ανάλυση και επεξεργασία εικόνων DICOM με τη χρήση Matlab

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

DIP_01 Εισαγωγήστην ψηφιακήεικόνα. ΤΕΙ Κρήτης

2.0 ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ-ΟΡΟΛΟΓΙΕΣ

Ψηφιακή Επεξεργασία Εικόνων

Ψηφιακή Επεξεργασία Εικόνας

Παρουσίαση Νο. 5 Βελτίωση εικόνας

Αναγνώριση Προτύπων Ι

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1

ΚΕΣ 03: Αναγνώριση Προτύπων και Ανάλυση Εικόνας. KEΣ 03 Αναγνώριση Προτύπων και Ανάλυση Εικόνας. Κατάτµηση Εικόνων:

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Α.Τ.Ε.Ι. Ηρακλείου Ψηφιακή Επεξεργασία Εικόνας ιδάσκων: Βασίλειος Γαργανουράκης. Ανθρώπινη Όραση - Χρωµατικά Μοντέλα

Εισαγωγή στην επιστήμη των υπολογιστών

Ψηφιακή Επεξεργασία Εικόνας

Επεξεργασία Χαρτογραφικής Εικόνας

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

6-Aνίχνευση. Ακμών - Περιγράμματος

Αριθμητική Ανάλυση & Εφαρμογές

Οδηγίες σχεδίασης στο περιβάλλον Blender

Έγχρωµο και Ασπρόµαυρο Φως

ΑΡΧΕΣ ΤΗΛΕΠΙΣΚΟΠΗΣΗΣ (Y2204) Βασιλάκης Εµµανουήλ Λέκτορας Τηλεανίχνευσης

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Group (JPEG) το 1992.

Γραφικά Ι. Ενότητα 1: Εισαγωγή. Θεοχάρης Θεοχάρης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής και Τηλεπικοινωνιών

ΠΑΡΑΔΕΙΓΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΓΡΑΦΗΜΑΤΟΣ ΣΤΟ MICROSOFT EXCEL 2003

5ο Μάθημα Αλγόριθμοι Σχεδίασης Βασικών Σχημάτων

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

1 ο Εργαστήριο Συντεταγμένες, Χρώματα, Σχήματα

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Ψηφιακή Ανάλυση Εικόνας. Ψηφιακή Ανάλυση Εικόνας

Ασκήσεις Επεξεργασίας Εικόνας

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Γνωστική Ψυχολογία Ι (ΨΧ32)

Μάθημα: Μηχανική Όραση

Επεξεργασία Χαρτογραφικής Εικόνας

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ

Ψηφιακή Επεξεργασία Εικόνας

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods)

Σημαντικές χρονολογίες στην εξέλιξη της Υπολογιστικής Τομογραφίας

Ενότητα 3: Μετασχηµατισµοί Έντασης & Χωρικό Φιλτράρισµα

Τι θα απαντούσατε αλήθεια στην ίδια ερώτηση για την περίπτωση της επόμενης εικόνας;

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013

Εισαγωγή Ασπρόμαυρο Halftoning γάμμα Φως/Χρώμα Χρωματικά Μοντέλα Άλλα. 6ο Μάθημα Χρώμα. Γραφικα. Ευάγγελος Σπύρου

Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕ ΙΣΤΟΓΡΑΜΜΑ ΔΠΜΣ ΗΕΠ 1/46

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Ανάκτηση πολυμεσικού περιεχομένου

Γραφικά & Οπτικοποίηση. Κεφάλαιο 1. Εισαγωγή. Γραφικά & Οπτικοπίηση: Αρχές & Αλγόριθμοι Κεφάλαιο 1

ΜΕΤΡΩΝΤΑΣ ΤΟΝ ΠΛΑΝΗΤΗ ΓΗ

Συστήματα Πολυμέσων. Ενότητα 4: Θεωρία Χρώματος. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Digital Image Processing

Advances in Digital Imaging and Computer Vision

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Photoshop CS6. Πλάνο Μαθημάτων. 1. Εισαγωγή στη Χρωματική Θεωρία, την Ψηφιακή εικόνα και Γνωριμία με το Περιβάλλον του

Ευαιθησιομετρία Sensitometry ΑΚΤΙΝΟΛΟΓΙΑ Ι-6

Τηλεπισκόπηση. Ψηφιακή Ανάλυση Εικόνας Η ΒΕΛΤΙΩΣΗ εικόνας

ΑΝΤΩΝΙΟΣ ΛΥΡΩΝΗΣ ΧΑΝΙΑ Σκοπός Εργασίας Εντοπισμός πλίνθων σε σειρά ορθοφωτογραφιών και εξαγωγή δισδιάστατης αποτύπωσης των τειχών.

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Εικόνες και Πολυµεσικές Εφαρµογές. Ψηφιακή Επεξεργασία Εικόνας.

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Transcript:

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΑΝΑΠΤΥΞΗ ΑΛΓΟΡΙΘΜΩΝ ΓΙΑ ΤΜΗΜΑΤΟΠΟΙΗΣΗ (SEGMENTATION) ΨΗΦΙΑΚΗΣ ΕΙΚΟΝΑΣ ΚΑΙ ΥΛΟΠΟΙΗΣΗ ΤΟΥΣ ΣΕ ΠΕΡΙΒΑΛΛΟΝ MATLAB Από τη σπουδάστρια Βουτσκοπούλου Ευαγγελία Α.Ε.Μ: 612 Επιβλέπων Καθηγητής Γκούμας Στέφανος ΚΑΒΑΛΑ Οκτώβριος 2006

ΠΕΡΙΕΧΟΜΕΝΑ Αντί του προλόγου.1 Κεφάλαιο 1: ΕΙΣΑΓΩΓΗ 1.1 Εισαγωγή..2 1.2 Τι είναι ψηφιακή εικόνα...3 1.2.1 Είδη ψηφιακών εικόνων 3 1.3 Πλήθος bits που απαιτούνται για την αποθήκευση μιας εικόνας.4 1.4 Αντίληψη και αναπαράσταση του φωτός-χρώματος 5 Κεφάλαιο 2: ΑΝΑΛΥΣΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΨΗΦΙΑΚΗΣ ΕΙΚΟΝΑΣ 2.1 Ανάλυση εικόνας..7 2.1.1 Βήματα για την ανάλυση της εικόνας...7 2.2 Επεξεργασία ψηφιακής εικόνας...12 2.2.1 Βασικές έννοιες της επεξεργασίας ψηφιακής εικόνας..... 14 2.2.1.1 Image Enhancement. 16 2.2.1.2 Image Segmentation (Τμηματοποίηση)...16 2.2.1.3 Image Measurements....17 2.2.1.4 Medical Image Fusion.. 17 Κεφάλαιο 3: ΤΜΗΜΑΤΟΠΟΙΗΣΗ ΕΙΚΟΝΑΣ 3.1 Τμηματοποίηση εικόνας.19 3.2 Μέθοδοι τμηματοποίησης εικόνας.....22 3.2.1 Ανίχνευση ακμών (Edge detection).22 3.2.1.1 Κριτήρια σωστής ανίχνευσης... 25 3.2.1.2 Ανίχνευση ακμών με χρήση της ανάλυσης κυματιδίων...25 3.2.2 Κατωφλίωση (Thresholding) και Πολυκατωφλίωση (Multilevel Thresholding)...27 3.2.3 Quadtree Decomposition.28 Κεφάλαιο 4: ΙΣΤΟΓΡΑΜΜΑΤΑ ΚΑΙ ΤΕΧΝΙΚΕΣ ΕΝΙΣΧΥΣΗΣ ΕΙΚΟΝΑΣ 1

4.1 Ιστογράμματα και εξισορρόπηση ιστογράμματος (histogram equalization).......30 4.1.1 Βελτίωση της αντίθεσης..30 4.1.2 Παραδείγματα Ισοστάθμισης-εξίσωσης ιστογράμματος με τη χρήση του MATLAB.. 31 4.2 Τεχνικές ενίσχυσης εικόνων... 32 Κεφάλαιο 5: ΕΙΣΑΓΩΓΗ ΣΤΟ MATLAB 5.1 Εισαγωγή στο πρόγραμμα MATLAB 36 5.2 Μέθοδοι τμηματοποίησης εικόνων και υλοποίησή τους...39 5.2.1 edge detection..39 5.2.2 threshold.. 45 5.2.3 quadtree decomposition...49 Κεφάλαιο 6: ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ 6.1 Εισαγωγή 51 6.2 Τμηματοποίηση και Ταξινόμιση/Κατηγοριοποίηση (Segmentation and Classification) 51 Συμπεράσματα 54 Βιβλιογραφία...56 Πηγές πληροφόρησης.57 2

Αντί του Προλόγου Μια εικόνα αξίζει όσο 1000 λέξεις, λέει μια παλιά κινέζικη παροιμία και ο καθένας μας γνωρίζει πόσο ευκολότερα κατανοήσιμη είναι μια εικόνα από την περιγραφή με κείμενο. Από τους φυσιολόγους, η παροιμία αυτή επαληθεύεται, θεωρώντας ότι ένας άνθρωπος μπορεί να κατανοήσει 600-1200 λέξεις γραπτού κειμένου το λεπτό και υποθέτοντας ότι κάθε λέξη αποτελείται από 4 γράμματα και κάθε γράμμα περιέχει 7 bits πληροφορίας, εύκολα αποδεικνύεται το αληθές της παροιμίας. Η τεχνολογία και επιστήμη των γραφικών με Η/Υ, γνωστή και ως γραφική (computer graphics), αποτελεί ένα από τους δυναμικότερους και ταχύτατα αναπτυσσόμενους κλάδους της πληροφορικής. Σύμφωνα μάλιστα με πρόσφατες ανακοινώσεις, στις ΗΠΑ, η σχετική τεχνολογία μαζί με τις επιστήμες επεκτάσεις της, π.χ. GIS, AM/FM, ψηφιακές τεκμηριώσεις χώρου, κ.λ.π., απορροφά το 37,8% του σχετικού προϋπολογισμού εφαρμογών και έρευνας πληροφορικής. Στην Ελλάδα, τα τελευταία δέκα χρόνια, τα γραφικά με Η/Υ καταξιώθηκαν ως μάθημα και διδάσκονται πλέον σε όλα τα τμήματα πληροφορικής, γραφιστικής και ηλεκτρονικής σχεδίασης σε προπτυχιακό επίπεδο. Επίσης, στα πλαίσια αρκετών ελληνικών μεταπτυχιακών τμημάτων, η επιστήμη των γραφικών διδάσκεται είτε αυτόνομα, είτε στα πλαίσια γενικότερων ενοτήτων που στηρίζονται στη γραφική (π.χ. GIS). Παρ όλη την ανάπτυξη της τεχνολογίας και επιστήμης των γραφικών με Η/Υ, καθώς και το μεγάλο εύρος των εφαρμογών που αυτά εμπλέκονται, είναι εμφανής η έλλειψη ενός ελληνικού συγγράμματος που θα καλύπτει, τόσο τη θεωρητική υποδομή, όσο και την αλγοριθμική υποστήριξη των εφαρμογών και επεκτάσεων της επιστήμης. Η υπάρχουσα ελληνική βιβλιογραφία, δυστυχώς, προσεγγίζει το θέμα περισσότερο με την οπτική της χρήσης των συστημάτων στα πλαίσια ψυχαγωγικών δραστηριοτήτων και λιγότερο ως επιστήμη με κανόνες, περιορισμούς και προοπτικές. 3

1.1 Εισαγωγή Η Ψηφιακή Επεξεργασία Εικόνας (Digital Image Processing - DIP) αποτελεί έναν σημαντικό κλάδο της Πληροφορικής, ο οποίος βρίσκει εφαρμογή σε πολυάριθμους και ποικίλους τομείς των ανθρωπίνων δραστηριοτήτων, επιστημονικούς και μη, όπως είναι η Ρομποτική, η Τεχνητή Νοημοσύνη, τα Νευρωνικά Δίκτυα, η Ιατρική, η Αστρονομία, τα Γεωγραφικά Συστήματα Πληροφοριών, η Βιομηχανία, η Ασφάλεια διαφόρων εγκαταστάσεων και συστημάτων, ο Στρατός, ο Κινηματογράφος. Η ανάγκη επεξεργασίας και ερμηνείας οπτικής πληροφορίας παρουσιάζεται σε ολοένα και περισσότερες εφαρμογές κάθε είδους (συστήματα επισκόπησης, ρομποτικά συστήματα, πολυμέσα, τηλεματική, ηλεκτρονικές βιβλιοθήκες, ψηφιακή τηλεόραση, τηλεδιασκέψεις κλπ). Σε άλλες εφαρμογές η προς επεξεργασία πληροφορία δεν είναι από τη φύση της οπτική (δηλ. στο ορατό φάσμα) αλλά σκοπίμως οπτικοποιείται διότι με τον τρόπο αυτό καθίσταται ευκολότερη η ερμηνεία της (π.χ. διάφορες κατηγορίες ιατρικών εικόνων, συστήματα πολυφασματικής απεικόνισης κλπ). Σε πολλές από τις παραπάνω εφαρμογές η ψηφιακή επεξεργασία εικόνας είναι το πρώτο και ιδιαίτερα βασικό στάδιο. Από την αποτελεσματικότητά του εξαρτάται η επιτυχία του επόμενου σταδίου που είναι η ανάλυση εικόνας, η οποία σε αρκετές περιπτώσεις είναι ταυτόσημη με την λεγόμενη Τεχνητή Όραση. ψηφιακή επεξεργασία και ανάλυση εικόνας, έχει σχέση αλληλεπίδρασης με διάφορες άλλες περιοχές της επιστήμης και της τεχνολογίας των υπολογιστών, όπως την ψηφιακή επεξεργασία σήματος, την αναγνώριση προτύπων, την τεχνητή νοημοσύνη, την γραφική, τις δομές δεδομένων, τα πολυμεσικά συστήματα, τις τηλεπικοινωνίες κλπ. Η παρακολούθηση του εν λόγω μεταπτυχιακού μαθήματος απαιτεί βασικές γνώσεις σημάτων και συστημάτων καθώς και σχετικό μαθηματικό υπόβαθρο σε περιοχές όπως γραμμική άλγεβρα και στοχαστικές διαδικασίες. Υπάρχει μία πληθώρα ερευνητικών κέντρων DIP ανά τον κόσμο, καθένα από τα οποία είναι εξειδικευμένο σε κάποιον από τους παραπάνω τομείς και προσπαθεί μέσω της έρευνας, της ανάλυσης και του πειραματισμού να χρησιμοποιήσει τις δυνατότητες που προσφέρει η DIP έτσι, ώστε να βελτιώσει εφαρμογές, να επιλύσει προβλήματα, να αυτοματοποιήσει ενέργειες. Όλα αυτά καθιστούν την DIP ένα πολύτιμο εργαλείο, που συμβάλλει, μαζί με πλήθος άλλων, στην ολοκληρωμένη ανάπτυξη διαφόρων ανθρωπίνων εγχειρημάτων. Η 4

Στην παρούσα εργασία, αναφέρονται ενδεικτικά κάποιες περιπτώσεις εφαρμογής της DIP σε ορισμένα project τα οποία μπορούν να αναπτυχθούν σε πανεπιστημιακά ερευνητικά κέντρα, αλλά και σε ερασιτεχνικό επίπεδο. 1.2 Τι είναι ψηφιακή εικόνα; Με τον όρο ψηφιακή εικόνα, εννοούμε την μετάβαση από τον αναλογικό κόσμο στον ψηφιακό, δηλαδή τη μετατροπή των αναλογικών σημάτων σε ψηφιακά. Έτσι, μια πραγματική εικόνα μεταφέρεται στον ψηφιακό κόσμο με τη μορφή διακεκριμένου σήματος που έχει τη μορφή ψηφιακών πινάκων. Μια ψηφιακή εικόνα μπορεί να είναι δυαδική (binary images), μονοχρωματική αποχρώσεων του γκρι (gray-level ή grayscale images) ή έγχρωμη (color image). Η απλούστερη μορφή μιας εικόνας, είναι η δυαδική μορφή. Μια δυαδική εικόνα, έχει μόνο δυο στάθμες φωτεινότητας που συνήθως είναι το μαύρο και το άσπρο. Το μαύρο αντιστοιχεί στην τιμή 0 και το άσπρο στην τιμή 1 (ή σε αντίστοιχη με grayscale εικόνες στην τιμή 255). Μια δυαδική εικόνα, επίσης, καταλαμβάνει μικρότερη μνήμη και η επεξεργασία της απαιτεί μικρότερο υπολογιστικό κόστος. Σε δυαδική μορφή μπορούν να απεικονισθούν σημαντικές πληροφορίες, όπως είναι το εμβαδόν και η θέση αντικειμένων, η μορφή αντικειμένων κ.α. Οι έγχρωμες εικόνες, αποτελούν το μέσο για την απεικόνιση του πραγματικού κόσμου. Μια έγχρωμη ψηφιακή εικόνα, αποτελείται από τρεις gray-level εικόνες. Δηλαδή, το χρώμα κάθε εικονοστοιχείου, έχει τρεις συνιστώσες, οι οποίες αντιστοιχούν στις γκρι αποχρώσεις των αντίστοιχων εικονοστοιχείων των τριών γκρι εικόνων. [2] 1.2.1 Είδη ψηφιακών εικόνων Υπάρχουν τρία είδη ψηφιακών εικόνων που χαρακτηρίζονται από το πλήθος των χρωμάτων που περιέχουν. Χωρίζονται λοιπόν: Στις δυαδικές εικόνες (binary images), έχω μόνο δύο αποχρώσεις: μαύρα (0) και λευκά (1) pixels. Κάθε εικονοστοιχείο δηλαδή, μπορεί να χρωματιστεί με ένα από τα δυο χρώματα (μαύρο ή άσπρο), όπως επίσης απαιτείται ένα bit πληροφορίας, π.χ. με τιμή 0 για το μαύρο και 1 για το άσπρο. Στις εικόνες αποχρώσεων του γκρι (gray-level ή gray-scale images), έχω 2 8 =256 αποχρώσεις του γκρι. Από αυτές τις αποχρώσεις, συνήθως λαμβάνονται 256 5

αντιπροσωπευτικές, οι οποίες κωδικοποιούνται με τιμές από 0,1,2,,255. Η απόχρωση κάθε εικονοστοιχείου, απαιτεί πληροφορία 8 bit. Στις έγχρωμες εικόνες (color images), έχω 2 8 διαφορετικές αποχρώσεις του κόκκινου, 2 8 διαφορετικές αποχρώσεις του πράσινου και 2 8 διαφορετικές αποχρώσεις του μπλε (Red,Green, Blue:RGB). Δηλαδή, για κάθε ένα από αυτά τα τρία χρώματα, λαμβάνονται 256 αποχρώσεις, δηλαδή πληροφορία 8 bit. Συνεπώς, κάθε εικονοστοιχείο της έγχρωμης εικόνας, απαιτεί 24 bit. 1.3 Πλήθος bits που απαιτούνται για την αποθήκευση μιας εικόνας Μια εικόνα N x M διαστάσεων και πλήθους αποχρώσεων G = 2 m, απαιτεί b = N x M x m bits για να αποθηκευτεί. Το m ονομάζεται και βάθος bit (bit depth) ή βάθος χρώματος (color depth) και εκφράζει πόση χρωματική πληροφορία έχει η εικόνα για εμφάνιση ή εκτύπωση. Μεγαλύτερο βάθος bit, σημαίνει περισσότερες διαθέσιμες αποχρώσεις που αποδίδονται με μεγαλύτερη ακρίβεια στις ψηφιακές εικόνες. Προφανώς, μια έγχρωμη εικόνα απαιτεί τριπλάσιο αριθμό bits από μια gray-scale εικόνα. [2] Παρακάτω, παραθέτουμε τον πίνακα 1, ο οποίος μας δείχνει τον απαιτούμενο αριθμό bits μιας εικόνας. α/α Τύπος εικόνας N M m bits 8-bit bytes 1 δυαδική 100 100 1 10.000 1.250 2 αποχρώσεων του γκρι 100 100 8 80.000 10.000 3 έγχρωμη 100 100 24 240.000 30.000 4 δυαδική 256 256 1 65.536 8.192 5 αποχρώσεων του γκρι 256 256 8 524.288 65.536 6 έγχρωμη 256 256 24 1.572.864 196.608 7 δυαδική 512 512 1 262.144 32.768 8 αποχρώσεων του γκρι 512 512 8 2.097.152 262.144 9 έγχρωμη 512 512 24 6.291.456 786.432 Πίνακας 1: Απαιτούμενος αριθμός bits μιας εικόνας 6

1.4 Αντίληψη και αναπαράσταση του φωτός-χρώματος Το φως είναι ηλεκτρομαγνητική ακτινοβολία και το μέγεθος που τη χαρακτηρίζει είναι η ισχύς c(x,y,t,λ) watts. Εάν θεωρήσουμε x,y,t σταθερά, τότε η ισχύς c είναι συνάρτηση μόνο του μήκους κύματος λ:c(λ). Η κατανομή αυτής της ισχύος, c(λ), είναι η αποκλειστική αιτία της δημιουργίας ενός συγκεκριμένου χρώματος. Αριστερά, φαίνεται το ηλεκτρομαγνητικό φάσμα. Δεξιά, σε μεγέθυνση, η ορατή περιοχή. Ακτινοβολία c(λ) Ένταση - φωτεινότητα σχετική φωτεινή απόδοση υ(λ) (relative luminous efficiency) Από την υ(λ), η φωτεινότητα I υπολογίζεται ως το κύκλωμα: που είναι η ένταση gray scale. 7

Το χρωματικό φως, εκτείνεται στο ηλεκτρομαγνητικό φάσμα περίπου από 400 μέχρι 700 nm. Οι τρεις βασικές ποσότητες που χρησιμοποιούνται για να περιγράψουν την ποιότητα της πηγής χρωματικού φωτός είναι η ακτινοβολία (radiance), η φωτεινότητα (luminance) και η λαμπρότητα (brightness). [2] Εξαιτίας της δομής του ανθρώπινου ματιού, όλα τα χρώματα θεωρούνται συνδυασμοί των τριών βασικών χρωμάτων (primary colors): του κόκκινου (R), του πράσινου (G) και του μπλε (B). [2] Τα διάφορα τμήματα της εικόνας, ταξινομούνται σύμφωνα με τα χρώματα που έχουν. Ο RGB χρωματικός χώρος. Το σημείο (0,0,0), αντιστοιχεί στο απόλυτο μαύρο και το (1,1,1) στο λευκό. Τα σημεία της κυρίας διαγωνίου, αντιστοιχούν σε αποχρώσεις του γκρίζου. 8

2.1 Ανάλυση και επεξεργασία ψηφιακής εικόνας Η ανάλυση εικόνας, χρησιμοποιείται για την ποσοτικοποίηση των χαρακτηριστικών τα οποία βρίσκονται σε διασπορά (σκόρπια) ώστε να προσδιοριστεί εάν και σε τι βαθμό διασποράς είναι ομογενείς ή ανομοιογενείς. Στην ανάλυση εικόνας, η τμηματοποίηση είναι μέρος μιας ψηφιακής εικόνας μέσα σε πολλαπλά πεδία (τμήματα pixel). Σκοπός της τμηματοποίησης είναι να εντοπίσει αντικείμενα τα οποία μας ενδιαφέρουν. Δυστυχώς, πολλοί σημαντικοί αλγόριθμοι είναι αρκετά απλοί ώστε να λύσουν αυτό το πρόβλημα επακριβώς: αντισταθμίζουν για τον συγκεκριμένο περιορισμό με την προβλεψιμότητα, την γενικότητα και την αποδοτικότητά τους. [14] 2.1.1 Βήματα για την Ανάλυση εικόνας Η Επεξεργασία Εικόνας, εφαρμόζεται σύμφωνα με τα παρακάτω βήματα: Βήμα 1 ο _ Thresholding. Είναι μια λειτουργία στη οποία μια grayscale εικόνα μετατρέπεται σε binary. Αυτό γίνεται για να απλοποιηθεί η εικόνα και στη συνέχεια να επεξεργαστεί. Η μετατροπή μιας εικόνας σε binary, γίνεται καθορίζοντας αρχικά ένα threshold level και αλλάζοντας έπειτα όλα τα pixel με grey level κάτω από το threshold level σε 0 (μαύρο) και τα υπόλοιπα με gray level ίσο ή μεγαλύτερο σε 255 (άσπρο). Το threshold level μπορεί να βρεθεί είτε με μαθηματικές μεθόδους (Automatic thresholding), είτε μελετώντας την εικόνα και το ιστόγραμμά της (Manual thresholding). [8] Δύο τύποι λαθών μπορούν να γίνουν όταν επιλέγεται το threshold level: Τύπος 1: Να μη συμπεριλαμβάνονται στη νέα εικόνα όλα τα επιθυμητά pixel. [8] Τύπος 2: Κάποια από τα pixel που περιλαμβάνονται στη νέα εικόνα δεν έπρεπε να υπήρχαν. [8] Πριν επιλεγεί το threshold level θα πρέπει να αποφασιστεί ποιο είδος λάθους είναι το πιο αποδεκτό. Στα διάφορα project προτιμούνται λάθη τύπου 2 και χρησιμοποιείται automatic thresholding, σύμφωνα με το οποίο το threshold level ως εξής: μια εικόνα αποτελείται συχνά από δύο μέρη, το αντικείμενο και το background. Το grey level 9

του αντικειμένου κατανέμεται από μια στατιστική κατανομή ενώ το grey level του background από μία άλλη. [8] Αυτό μπορούμε να το δούμε ως δύο peaks του ιστογράμματος, το μέσο των οποίων ορίζεται ως threshold level. Αυτό υλοποιείται με τις παρακάτω εξισώσεις: Για το grey level: Για τον αριθμό των pixels με gray level g λιγότερο: Για το μέσο gray level: Από τις εξισώσεις αυτές, προκύπτει το γράφημα που εικονίζεται παρακάτω. Συνεπώς threshold level = 86, επειδή είναι το μέγιστο. Το αποτέλεσμα του thresholding εικονίζεται παρακάτω, όπου από την ακατέργαστη PGM εικόνα προκύπτει η binary εικόνα στα δεξιά. 10

Βήμα 2 ο Αφαίρεση περιγράμματος. Στη συνέχεια όλα τα pixel που βρίσκονται στο περίγραμμα της εικόνας αλλάζουν το χρώμα τους στο χρώμα του background, γίνονται δηλαδή άσπρα. Με τον τρόπο αυτό, εξασφαλίζουμε την αποφυγή προβλημάτων όταν αργότερα εφαρμοστούν μάσκες, λαμβάνοντας υπ όψιν ότι με τη διαδικασία αυτή δε χάνεται ιδιαίτερα σημαντική πληροφορία. Βήμα 3 ο Component labeling. Διαιρεί την binary εικόνα στα αντικείμενα που την αποτελούν. Έτσι, είναι δυνατόν να επιλέξουμε μεταξύ αντικειμένων διαφορετικού μεγέθους. Κάτι τέτοιο υλοποιείται σε πολλά project, όπου μετά το component labeling βρίσκουμε το μεγαλύτερο τμήμα στην εικόνα, υποθέτουμε ότι αυτό είναι το μονοπάτι και μετατρέπουμε τα pixel με διαφορετική ετικέτα από αυτή του μονοπατιού, στο χρώμα του background. Τα αντικείμενα στα οποία δίνεται η ίδια ετικέτα, είναι συνδεδεμένα. Υπάρχουν δύο διαφορετικοί ορισμοί για τη σύνδεση: Four connectedness = δύο pixel συνδέονται μόνο εάν έχουν κοινό όριο, όπως φαίνεται στην αριστερή εικόνα, και Eight connectedness = τα pixels συνδέονται εάν ακουμπούν οι γωνίες της, όπως φαίνεται στη δεξιά εικόνα. Όταν αποφασίζεται ποιός τύπος σύνδεσης θα χρησιμοποιηθεί, μπορεί να αρχίσει η διαδικασία της ετικετοποίησης. Η διαδικασία αυτή είναι μια επαναληπτική διαδικασία στην οποία ερευνάται κάθε pixel. Εάν το pixel έχει διαφορετικό χρώμα από το χρώμα του background, του δίνεται μια ετικέτα με έναν αριθμό. Πριν να γίνει αυτό, ερευνώνται τα γειτονικά pixel και αν ένα από αυτά έχει ήδη ετικέτα και συνδέεται με το pixel σύμφωνα με τον τύπο που καθορίστηκε, η ίδια ετικέτα δίνεται και στο pixel που ερευνάται. Το αποτέλεσμα είναι μια ετικέτα για κάθε αντικείμενο της εικόνας, όπως φαίνεται στο σχήμα. Βήμα 4 ο Skeletonization. Είναι η λειτουργία κατά την οποία βρίσκεται ο μεσαίος άξονας των γραμμών ή των αντικειμένων στην εικόνα. Αυτό σημαίνει ότι μια γραμμή 11

που είναι αρκετά pixel παχιά, ελαττώνεται σε γραμμή πάχους ενός μόνο pixel. Ο τρόπος με τον οποίο συνδέονται τα pixel στο σκελετό εξαρτάται από τον τύπο σύνδεσης που επιλέγεται για τη σκελετοποίηση. Παραδείγματα σκελετοποίησης φαίνονται στην εικόνα. Ένα πρόβλημα είναι ότι η διαδικασία της σκελετοποίησης μπορεί να επηρεαστεί από θόρυβο, όπως φαίνεται στα σχήματα που βρίσκονται στα δεξιά της εικόνας. Η σκελετοποίηση ενός αντικειμένου, είναι μια διαδικασία στην οποία το εξωτερικό layer του απομακρύνεται με μια επαναλαμβανόμενη διαδικασία. Αυτό ονομάζεται thinning και εξηγείται αναλυτικά παρακάτω. Βήμα 5 ο Thinning είναι μια διαδικασία στην οποία αφαιρείται το εξωτερικό layer ενός αντικειμένου, εφαρμόζοντας μάσκες σε όλα τα pixel στην επιφάνειά του. Αν η μάσκα ταιριάζει, το pixel στο κέντρο της διαγράφεται και η διαδικασία συνεχίζεται μέχρις ότου δοκιμαστούν όλα τα pixel. Παρακάτω εικονίζονται οι μάσκες που χρησιμοποιούνται για thinning σε four connectedness. Τα μαύρα pixel είναι οι περιοχές του αντικειμένου, τα ανοιχτά γκρι έχουν το χρώμα του background και τα σκούρα γκρι είναι pixel, το χρώμα των οποίων δεν ενδιαφέρει. Για eight connectedness εφαρμόζονται ανάλογες μάσκες. Το αποτέλεσμα του thinning φαίνεται παρακάτω: 12

Μια εικόνα μετά το thinning έχει συχνά κάποια κλαδιά από pixel, λόγω θορύβου. Αυτά αφαιρούνται με τη διαδικασία pruning. Βήμα 6 ο Pruning είναι μια επαναληπτική διαδικασία για την αφαίρεση των κλάδων όπως σκελετού σε μια εικόνα, κατά την οποία αφαιρείται το ακριανό pixel του κάθε κλάδου σε κάθε επανάληψη. Η διαδικασία αυτή σταματάει όταν δε μπορούν πια να γίνουν άλλες αλλαγές στην εικόνα. Ένα παράδειγμα φαίνεται παρακάτω: Η διαδικασία pruning, γίνεται χρησιμοποιώντας μάσκες που εφαρμόζονται στην εικόνα. Υπάρχουν πάλι 2 σετ από μάσκες, ένα για four connectedness και ένα για eight connectedness. Εδώ, χρησιμοποιούνται οι μάσκες που φαίνονται στο σχήμα (για four connectedness). Αποτέλεσμα του pruning όπως εικόνας που προέκυψε παραπάνω με thinning: 13

Προγραμματιστικά η επεξεργασία εικόνας οργανώνεται σύμφωνα με το παρακάτω διάγραμμα: 2.2 Επεξεργασία Ψηφιακής Εικόνας Ο όρος «ψηφιακή επεξεργασία εικόνας» (digital image processing), αναφέρεται στη χρήση ενός υπολογιστή, με σκοπό την διαχείριση δεδομένων εικόνας, τα οποία έχουν αποθηκευτεί σε ψηφιακή μορφή (digital format). Μια ψηφιακή εικόνα, αποθηκεύεται ως δυο διαστάσεων πλέγμα (array ή grid) μικρών περιοχών, τα οποία ονομάζουμε εικονοστοιχεία (pixels). Κάθε εικονοστοιχείο, αντιστοιχεί χωρικά σε μια περιοχή της εικόνας. Κάτω από ιδεατές συνθήκες, μια ψηφιοποιημένη εικόνα μπορεί απευθείας να χωριστεί στα δυο (μετατροπή σε ασπρόμαυρη) και η καταμέτρηση να αποκτήσει τα επιθυμητά χαρακτηριστικά. Ωστόσο, το ανεπαρκές κοντράστ, τα τεχνουργήματα και/ ή οι διαστρεβλώσεις, πολύ συχνά, αποτρέπουν την άμεση ανάλυση των χαρακτηριστικών (της εικόνας). Η επεξεργασία της εικόνας, μπορεί να χρησιμοποιηθεί στην περίπτωση αυτή, για την αντιστάθμιση της πληθώρας των ελαττωμάτων στην εικόνα, καθιστώντας γρήγορη άλλα και ακριβής την ανάλυση των χαρακτηριστικών που την ενδιαφέρουν. 14

Το γκρι-επίπεδο της επεξεργασίας εικόνας, συχνά χρησιμοποιείται για να βελτιώσει τα χαρακτηριστικά της εικόνας, είτε για οπτικούς σκοπούς είτε για μεταγενέστερες τροποποιήσεις. Η ταχεία αύξηση των αλγορίθμων, μπορεί να χρησιμοποιηθεί σε πραγματικό χρόνο με την έλευση των υπολογιστών χαμηλού κόστους αλλά υψηλών επιδόσεων. Διόρθωση Σκίασης. Τα ελαττώματα της εικόνας, τα οποία οφείλονται σε ανόμοιο ( επίπεδο ) φωτισμού ή σε τεχνουργήματα, θα πρέπει να λαμβάνονται υπόψη κατά την διάρκεια της επεξεργασίας εικόνας. Η διόρθωση της σκίασης, χρησιμοποιείται όταν ένα μεγάλο κομμάτι της εικόνας είναι πιο σκοτεινό ή πιο φωτεινό από την εναπομείνασα εικόνα, το οποίο οφείλεται, για παράδειγμα, σε λάθος τοποθέτηση της πηγής του φωτός ή στην χρήση χαμηλής ποιότητας οπτικών μέσων στο σύστημα. Αυτές οι σχετικές διαφορές μεταξύ των χαρακτηριστικών που τις ενδιαφέρουν και στο φόντο, είναι συνήθως οι ίδιες, αλλά τα χαρακτηριστικά σε μια περιοχή / πεδίο της εικόνας έχουν διαφορετικό επίπεδο του γκρι από τον ίδιο τύπο χαρακτηριστικών σε ένα άλλο κομμάτι ( της εικόνας ). Οι βασικές μέθοδοι που χρησιμοποιούνται στην διόρθωση της σκίασης, βασίζονται στην αναγωγή του φόντου της εικόνας είτε μιας πραγματικής ή μιας τεχνητής και στο ταίριασμα των γειτονικών pixel. [1] Μια αναφορά σε μια εικόνα χωρίς χαρακτηριστικά, απαιτεί την απόκτηση μιας εικόνας που χρησιμοποιεί τις ίδιες συνθήκες φωτεινότητας αλλά χωρίς τα χαρακτηριστικά που την ενδιαφέρουν. Η εικόνα οδηγός τότε, αφαιρείται ή χωρίζεται ( ανάλογα με την αντίδραση του φωτεινότητας ) από την σκιασμένη εικόνα στο επίπεδο του φόντου. Αν τώρα η εικόνα οδηγός δεν μπορεί να αποκτηθεί, είναι ορισμένες φορές δυνατόν να δημιουργήσουμε μια τεχνητή εικόνα οδηγό χρησιμοποιώντας μια σταδιακή βαθμίδα επεξεργασίας ( η οποία θα πραγματευτεί αργότερα ) έτσι ώστε να έχουμε συρρίκνωση χαρακτηριστικών και να τα αναμείξουμε στο φόντο. (Εικόνα 2.2.1). Το ταίριασμα των γειτονικών pixel μπορεί επίσης να χρησιμοποιηθεί για να δημιουργήσουμε ένα τεχνητό φόντο μιας εικόνας που όμως είναι δύσκολο να παραχθεί αν τα χαρακτηριστικά είναι διαφορετικά, αλλά και αν τα χαρακτηριστικά μοιραστούν ομοιόμορφα. [1] Κάθε μεθοδολογία διόρθωσης της σκίασης, έχει τα δικά της πλεονεκτήματα αλλά και όρια, τα οποία συνήθως βασίζονται στον τύπο της εικόνας και στον φωτισμό που χρησιμοποιείται σε αυτήν. Τα εμπορικά συστήματα χρησιμοποιούν συνήθως μια 15

συγκεκριμένη μέθοδο διόρθωσης της σκίασης, η οποία αναβαθμίζεται για το συγκεκριμένο σύστημα, αλλά μπορεί να εξαρτάται και από το πόσο εύκολα η εικόνα οδηγός μπορεί να αποκτηθεί ή από τον βαθμό της παραλλαγής στην εικόνα. [1] (α) (β) Εικόνα 2.2.1 (γ) (δ) Η σειρά αξιολόγησης της επεξεργασίας, χρησιμοποιείται για τη δημιουργία μιας ψευδοτυχαίας (pseudoreference) εικόνας. (α) Εικόνα χωρίς κάποια χαρακτηριστικά στο φωτεινό μονοπάτι, δείχνοντας τα σκονισμένα κομμάτια από τις σκούρες περιοχές στις πιο φωτεινές, πηγαίνοντας από πιο ψηλά αριστερά στα πιο χαμηλά δεξιά. (β) Η ίδια εικόνα μετά την διόρθωση σκίασης. (γ) Εικόνα από μέρη χωρίς διόρθωση σκίασης. (δ) Η ίδια εικόνα μετά την διόρθωση σκίασης, δείχνοντας ομοιόμορφα την φωτεινότητα ολόκληρης της εικόνας. [1] 2.2.1 Βασικές έννοιες της ψηφιακής επεξεργασίας εικόνας Η επεξεργασία των ψηφιακών εικόνων (digital image processing) αποσκοπεί στη βελτίωση της εμφάνισής της για την καλύτερη παρατήρησή της από τον άνθρωπο ή στην προετοιμασία της για την αυτόματη αναγνώριση και τη μέτρηση των χαρακτηριστικών δομών που υπάρχουν σε αυτές. 16

Για λόγους ευκολίας, ας θεωρήσουμε μια μονόχρωμη εικόνα. Ο όρος της αναφέρεται σε μια δισδιάστατη συνάρτηση f(x,y), όπου τα x και y αντιπροσωπεύουν χωρικές συντεταγμένες και η τιμή της f σε κάθε σημείο (x,y), είναι ανάλογη της φωτεινότητας (brightness) της εικόνας στο συγκεκριμένο σημείο. Ισοδύναμος του όρου φωτεινότητα είναι και ο όρος διαβάθμιση του γκρι (gray level), o οποίος συναντάται αρκετά συχνά στη βιβλιογραφία. [8] [13] Μια ψηφιακή εικόνα είναι μια εικόνα f(x,y), η οποία έχει διακριτοποιηθεί τόσο στις χωρικές συντεταγμένες όσο και στη φωτεινότητα. Η ψηφιακή εικόνα μπορεί να θεωρηθεί ως πίνακας, οι γραμμές και οι στήλες του οποίου δηλώνουν τις χωρικές συντεταγμένες x και y, ενώ οι αντίστοιχες τιμές αντιπρoσωπεύουν τη φωτεινότητα f. Τα στοιχεία του παραπάνω πίνακα ονομάζονται στοιχεία εικόνας (picture elements) ή πιο σύντομα pixels. Το μέγεθος της ψηφιακής εικόνας πίνακα, ποικίλλει ανάλογα με την εφαρμογή. Ωστόσο, για τις διαστάσεις του πίνακα. είναι προτιμότερο να χρησιμοποιούνται ακέραιες δυνάμεις του 2. Για παράδειγμα, ένα τυπικό μέγεθος ισοδύναμο σε ποιότητα με μονόχρωμη εικόνα τηλεόρασης είναι πίνακας 512x512 με 128 διαβαθμίσεις του γκρι (gray level). [8] [13] Στην περίπτωση έγχρωμων εικόνων, η συνάρτηση f μπορεί να θεωρηθεί διάνυσμα με τρεις συνιστώσες. Οι τρεις συνιστώσες αφορούν τρία διαφορετικά βασικά χρώματα, από τον συνδυασμό των οποίων προκύπτει το ακριβές χρώμα σε κάθε σημείο (x,y). Για την επιλογή των τριών βασικών χρωμάτων, υπάρχουν διάφορα πρότυπα. Το περισσότερο διαδεδομένο πρότυπο είναι το RGB (Red-Green-Blue), στο οποίο βασικά χρώματα είναι το κόκκινο, το πράσινο και το μπλε, και με το οποίο ασχοληθήκαμε στο Κεφάλαιο 1. Το δυναμικό εύρος μιας εικόνας (dynamic image range) χαρακτηρίζει τον αριθμό των διαβαθμίσεων της έντασης που υπάρχουν σε αυτήν. Ο ακριβής προσδιορισμός των συνόρων ανάμεσα σε περιοχές διαφορετικών διαβαθμίσεων για τη βελτίωση της παρουσίασης της εικόνας και των παρεχόμενων πληροφοριών, απαιτεί pixels μικρού μεγέθους και μεγάλου εύρους απεικόνισης (display range) (αριθμός των διαβαθμίσεων που μπορούν να παρουσιασθούν ταυτόχρονα στην οθόνη). Όταν το δυναμικό εύρος υπερβαίνει το εύρος απεικόνισης, χρησιμοποιείται άλλος κατάλληλος μετασχηματισμός για τη συμπίεση (υποβάθμιση) (compression) των δεδομένων της εικόνας πριν την παρουσίασή της. 17

2.2.1.1 Image Enhancement. Oνομάζεται η κατηγορία των μεθόδων μετασχηματισμού που χρησιμοποιούνται για την αύξηση της ορατότητας (visibility) μιας περιοχής ή μιας δομής της εικόνας, έτσι ώστε να είναι εγκυρότερες οι εξαγόμενες πληροφορίες και ευκολότερη η εφαρμογή άλλων τεχνικών. Οι μέθοδοι αυτές κατατάσσονται σε τρεις ομάδες: spatial domain methods (μετασχηματισμοί στο πεδίο χώρου τιμών των pixels), frequency domain methods (μετασχηματισμοί στο πεδίο συχνότητας) και μέθοδοι που συνδυάζουν στοιχεία των δύο προηγούμενων ομάδων. Contrast Enhancement: Καλείται η διαδικασία αύξησης της αντίθεσης της εικόνας (contrast) μέσω του μετασχηματισμού των τιμών της έντασης των pixels που τελικά εμφανίζονται στην εικόνα βάσει μιας συνάρτησης μεταφοράς. Η λογαριθμική καμπύλη (logarithmic or squared root curve) συμπιέζει την παρουσιαζόμενη ένταση στο φωτεινό άκρο της κλίμακας, ενώ την επεκτείνει στο σκοτεινό άκρο. Η αντίστροφη λογαριθμική (inverse log or square curve) έχει το αντίθετο αποτέλεσμα. Η bell curve συμπιέζει τις ενδιάμεσες διαβαθμίσεις του γκρι και διευρύνει την κλίμακα στα δύο άκρα, ενώ η inverse curve παράγει την αρνητική εικόνα. Στην κατηγορία αυτή περιλαμβάνεται και η contrast expansion, που επεκτείνει το αρχικό δυναμικό εύρος της εικόνας σε ολόκληρο το εύρος απεικόνισης. Histogram Equalization: Η τεχνική αυτή χρησιμοποιεί το ιστόγραμμα της έντασης της εικόνας, και μεταβάλει τις τιμές των pixels, έτσι ώστε κάθε pixel να διατηρεί τη σειρά του (φωτεινότερο ή σκοτεινότερο από άλλα), ενώ παράλληλα κάθε δυνατή τιμή της έντασης να παρουσιάζεται από τον ίδιο αριθμό pixels. Filtering: Ο πολλαπλασιασμός του μετασχηματισμού Fourier της εικόνας με μια κατάλληλη συνάρτηση μεταφοράς (filter), απομακρύνει τις αντίστοιχες συχνότητες μειώνοντας ή μηδενίζοντας το πλάτος της, αλλά διατηρώντας την πληροφορία σχετικά με τη φάση της. Ο αντίστροφος μετασχηματισμός Fourier παράγει τη βελτιωμένη εικόνα. Η συμπίεση των υψηλών ή των χαμηλών συχνοτήτων μπορεί να προκαλέσει blurring ή sharpening αντίστοιχα. 2.2.1.2 Image Segmentation (Τμηματοποίηση). Συνίσταται στη διαίρεση της εικόνας σε περιοχές που αντιστοιχούν στις δομικές μονάδες (περιοχές) για την καλύτερη ανάλυσή της. Οι αλγόριθμοι που εφαρμόζονται, στηρίζονται στην 18

ασυνέχεια-απότομη μεταβολή των τιμών των pixels (ανίχνευση μεμονωμένων σημείων, γραμμών ή ακμών) ή στην ομοιότητά τους (thresholding, region growing, region splitting and merging). Thesholding: Άλλος απλός τρόπος εφαρμογής του, είναι ο καθορισμός μιας κλίμακας τιμών των pixels στην αρχική εικόνα, ο προσδιορισμός των pixels που ανήκουν σε αυτήν και η τοποθέτηση των υπολοίπων στο background. Η δημιουργηθείσα εικόνα παρουσιάζεται συνήθως με τη χρήση άσπρου-μαύρου ή δύο άλλων χρωμάτων. Άλλες εφαρμογές είναι οι multilevel thresholding, thresholding from texture, multiple thresholding criretia etc. Region Growing: Είναι μια διαδικασία που ομαδοποιεί pixels σε μεγαλύτερες περιοχές. Η πιο απλή εκδοχή της, είναι η pixel aggregation, η οποία ξεκινά με μια ομάδα «σπόρων» (seeds) και προσδιορίζει μια περιοχή προσαρτώντας σε κάθε «σπόρο» εκείνα τα γειτονικά pixels που έχουν παρόμοιες ιδιότητες (διαβάθμιση του γκρι, χρώμα, υφή). Θεμελιώδεις δυσκολίες της τεχνικής αυτής, όπως είναι η επιλογή των αρχικών «σπόρων» και των κριτηρίων ομοιότητας καθώς και η διαμόρφωση του stopping rule με τη χρήση εννοιών όπως το μέγεθος και το σχήμα της περιοχής, η ομοιότητα του υπό εξέταση pixel με την ήδη δημιουργηθείσα περιοχή κ.ά. 2.2.1.3 Image Measurements. Οι μετρήσεις που μπορούν να πραγματοποιηθούν σε χαρακτηριστικά της εικόνας με διάφορες τεχνικές χωρίζονται σε τέσσερις ομάδες: φωτεινότητα, θέση, μέγεθος και σχήμα. Η δυνατότητα μεγέθυνσης τμήματος της εικόνας μπορεί να αποδειχθεί χρήσιμη, ειδικά σε εικόνες κακής διακριτικής ικανότητας. Τα αποτελέσματα αυτών των τεχνικών χρησιμοποιούνται συχνά για στατιστική ανάλυση ή γραφικές παραστάσεις. 2.2.1.4 Medical Image Fusion. Η κλινική διάγνωση όπως και ο σχεδιασμός και η εφαρμογή της θεραπείας, επιτυγχάνονται συχνά με τη χρήση διαφορετικών απεικονιστικών τεχνικών που προσφέρουν συμπληρωματικές πληροφορίες. Ειδικότερα, το SPECT (Single Photon Emission Tomography), το PET (Positron Emission Tomography) και το MRS (Magnetic Resonance Spectroscopy) παρέχουν πληροφορίες σχετικές με τη λειτουργία των οργάνων, αλλά περιέχουν περιορισμένη ανατομική πληροφορία. Το αντίθετο συμβαίνει με τη Μαγνητική Τομογραφία, τις 19

τεχνικές των Υπερήχων και την Υπολογιστική Τομογραφία Ακτίνων Χ. Η σύντηξη επομένως δύο ή περισσότερων εικόνων διαφορετικών απεικονιστικών τεχνικών, οδηγεί στη δημιουργία μιας εικόνας που προσφέρει μια ολοκληρωμένη αντίληψη της κατάστασης της υπό εξέταση δομής και διευκολύνει τη διάγνωση και την αξιολόγηση των κλινικών ευρημάτων. [16] Η συλλογή των δεδομένων των διαφορετικών απεικονιστικών τεχνικών, πρέπει να γίνεται υπό κάποιες-ίδιες συνθήκες, δηλαδή: ίδια τοποθέτηση του ασθενούς σε σχέση με το σύστημα συντεταγμένων κάθε συσκευής, ανάκτηση αντίστοιχων τομών ίδιου πάχους και μεσοδιαστήματος, ίδια ανάλυση (resolution) και κλίμακα (scaling) των εικόνων κ.ά. Δεδομένης της δυσκολίας πλήρωσης αυτών των προϋποθέσεων, έχουν αναπτυχθεί Αλγόριθμοι Ευθυγράμμισης Εικόνων (Image Registration Algorithms) που στοχεύουν στην αντιμετώπιση πιθανών αποκλίσεων. Οι αλγόριθμοι αυτοί, απαιτούν τη γνώση αντίστοιχων σημείων ή ανατομικών δομών, που ανιχνεύονται με αυτόματες ή ημιαυτόματες τεχνικές ή ορίζονται από τον χρήστη, και αποτελούν τη βάση για τον προσδιορισμό του κατάλληλου μετασχηματισμού που συνδέει τα καρτεσιανά συστήματα συντεταγμένων των απεικονιστικών τεχνικών. Στη συνέχεια πραγματοποιείται η σύντηξη των ιατρικών εικόνων με τη χρήση διαφόρων αλγορίθμων τόσο του μέσου όρου (Average), όσο και των σύγχρονων κυματιδίων (Wavelets), έτσι ώστε να διατηρηθεί η σημαντική διαγνωστική πληροφορία που περιέχουν. [5] [16] 20

3.1 Τμηματοποίηση εικόνας Τμηματοποίηση Εικόνας (image segmentation), είναι η διαδικασία με την οποία διαχωρίζεται μια εικόνα σε κατάλληλες περιοχές ή αντικείμενα ή αλλιώς, είναι η εξαγωγή επιλεγμένων περιοχών ενδιαφέροντος από μια εικόνα, χρησιμοποιώντας αυτόματες ή χειρονακτικές τεχνικές. Η τμηματοποίηση εικόνας, είναι από τα σπουδαιότερα θέματα στην ψηφιακή επεξεργασία εικόνων. Συνήθως αποτελεί απαραίτητη προϋπόθεση ο προσδιορισμός των περιοχών ή των αντικειμένων που μια εικόνα περιέχει για παραπέρα επεξεργασία, ανάλυση ή αναγνώριση. Για παράδειγμα, στην περιοχή όπως Οπτική Αναγνώριση Χαρακτήρων (Optical Character Recognition OCR), η τμηματοποίηση και ο διαχωρισμός των χαρακτήρων, είναι απαραίτητο στάδιο προεπεξεργασίας. [2] Κάμερα Προεπεξεργασία εικόνας Τμηματοποίηση εικόνας Εξαγωγή χαρακτηριστικών Ταξινόμηση C1 C2 C3 Για την τμηματοποίηση των εικόνων, έχουν αναπτυχθεί πολλές τεχνικές. Δεν υπάρχει όμως γενική μέθοδος και σταθερές προδιαγραφές που να καθορίζουν την ποιότητα και την αποτελεσματικότητα των τεχνικών αυτών. Ανάλογα με την 21

εφαρμογή, πρέπει να επιλέγεται και η κατάλληλη τεχνική τμηματοποίησης. Ο Haralick και ο Shapiro πρότειναν ότι για να είναι καλή μια μέθοδος τμηματοποίησης πρέπει: Οι περιοχές που διαχωρίζει να είναι ομοιόμορφες και ομογενείς σε σχέση με κάποιο χαρακτηριστικό, όπως για παράδειγμα τα επίπεδα του γκρι. Το εσωτερικό των περιοχών πρέπει να είναι απλό, χωρίς για παράδειγμα πολλές μικρές οπές. Γειτονικές περιοχές πρέπει να έχουν σαφώς διαφορετικές τιμές για το χαρακτηριστικό με το οποίο έγινε ο διαχωρισμός. Τα όρια των περιοχών πρέπει να είναι απλά, όχι απότομα, και ακριβή. [2] Υπάρχουν 3 περιοχές της πληροφορικής που ασχολούνται με εικόνες: i) Τα γραφικά (computer graphics) δημιουργούν εικόνες από ένα μοντέλο. Το μοντέλο αυτό, για παράδειγμα, μπορεί να αποτελείται από την περιγραφή ενός φανταστικού κόσμου με πολυγωνικές επιφάνειες. ii) Η τεχνητή όραση (computer vision) είναι η αντίστροφη διαδικασία και ασχολείται με την εξαγωγή χρήσιμων πληροφοριών (μοντέλου) από δισδιάστατες προβολές (π.χ. φωτογραφίες) μιας σκηνής. Η τεχνητή όραση, προσπαθεί να απαντήσει σε ερωτήσεις τύπου, πού βρίσκεται ένας δρόμος σε μια αεροφωτογραφία; Ή υπάρχει κάποιος άνθρωπος μέσα σε αυτή την εικόνα;. iii) Η επεξεργασία εικόνων (image processing) περιλαμβάνει μεθόδους για τη βελτίωση των δεδομένων μιας εικόνας (π.χ. διόρθωση σφαλμάτων που προέκυψαν κατά τη φωτογράφηση όπως σφάλμα φακών, σφάλμα φωτισμού) ή για την υλοποίησή τους Μοντέλο (Πληροφορίες για περιεχόμενο εικόνας) Γραφικά Τεχνητή Όραση Εικόνα Επεξεργασία Εικόνων (π.χ. μείωση των χρησιμοποιούμενων χρωμάτων). Η τμηματοποίηση μιας εικόνας, είναι στην πράξη η ταξινόμηση του κάθε pixel σε ένα τμήμα της εικόνας. Αν ο στόχος είναι η αναγνώριση των μαύρων χαρακτήρων πάνω σε ένα γκρι φόντο, τα pixel μπορούν να ταξινομηθούν σαν να ανήκουν στο φόντο ή να ανήκουν στους χαρακτήρες: η εικόνα είναι συγκροτημένη από πεδία, τα 22

οποία είναι μόνο δυο ευκρινείς πεδία από τιμές του γκρι, σκούρο κείμενο ή φωτεινότερο φόντο. Το γκρι επιπέδου (greylevel) ιστόγραμμα, δηλαδή, η πιθανότητα των τιμών του γκρι, έχει δυο αυτόνομες κορυφές. Σε κάθε περίπτωση, η τμηματοποίηση, για παράδειγμα η επιλογή του γκρι επιπέδου κατωφλίου ως τις αυτόνομες άκρες/κορυφές, είναι συνηθισμένα. Η ίδια τεχνική θα μπορούσε να χρησιμοποιηθεί εάν υπήρχαν περισσότερες από δυο ξεκάθαρα αυτόνομες κορυφές. Δυστυχώς, οι κορυφές του σήματος και του φόντου είναι συνήθως όχι τόσο τέλεια αυτόνομες, και η επιλογή του κατωφλίου είναι προβληματική. Ένα τυπικό ιστόγραμμα, αλλά με κορυφές οι οποίες δεν είναι αυτόνομες, δείχνεται στο σχήμα 3.1.1: Σχήμα 3.1.1 Υπάρχει μια ποικιλία τεχνικών για αυτόματη επιλογή κατωφλίου. Σε πολλές περιπτώσεις, η τμηματοποίηση πάνω σε μια βάση μόνο από τιμές του γκρι, δεν είναι αποτελεσματική. Άλλα χαρακτηριστικά, όπως χρώμα, συνολική δομή, προσαρμογή κ.τ.λ., μπορούν να τοποθετηθούν για χρήση. Αυτό, δημιουργεί μια χαρτογράφηση ενός pixel σε κάποιο σημείο ενός n-διαστατικού χώρου του χαρακτηριστικού, το οποίο ορίζεται από το διάνυσμα της τιμής του κάθε χαρακτηριστικού. Το πρόβλημα είναι να περιορίσει/μειώσει το πεδίο του χαρακτηριστικού σε αυτόνομες ομάδες (clusters), ένας γενικός τύπος προβλήματος, τον οποίο επεξηγούμε με το ακόλουθο παράδει γμα: 23

Τα δυο μισά από την αυθεντική εικόνα περιέχουν κορυφές τυχαίου ύψους, αλλά διαφορετικού σχήματος: στο κάτω μισό, οι άκρες είναι πιο απότομες απ ότι στο πάνω μισό. Το greylevel ιστόγραμμα μιας αυθεντικής (original) εικόνας είναι ξεκάθαρα δυο μορφών. Δημιουργούμε δυο διαφορετικά μορφολογικά χαρακτηριστικά, και τα δείχνουμε στα παραπάνω σχήματα feature 1 και feature 2. Τώρα εισάγουμε, για όλα τα pixels, τις τιμές γκρι του χαρακτηριστικού 1 (feature 1), αντιθέτως με τις τιμές γκρι του χαρακτηριστικού 2 (feature 2) σε ένα δυδιαστατικού ιστογράμματος ( feature space ). 3.2 Μέθοδοι τμηματοποίησης εικόνας Υπάρχουν 3 μέθοδοι τμηματοποίησης εικόνας: - η ανίχνευση ακμών (Edge Detection), - η κατωφλίωση (Thresholding)και πολυκατωφλίωση (Multilevel Thresholding) και τέλος, - το Quadtree Decomposition. 3.2.1 Edge detection Στην Όραση Υπολογιστών και την Επεξεργασία Εικόνας, η εξαγωγή ακμών είναι μια διαδικασία, η οποία πραγματεύεται τις ασυνέχειες στα φωτομετρικά, γεωμετρικά και φυσικά χαρακτηριστικά των αντικειμένων μιας εικόνας (ακμές). Ακμή ή περίγραμμα (edge) σε μια εικόνα x ij, ορίζεται ως το σύνολο των σημείων στη θέση i,j της εικόνας, όπου παρατηρείται μια σημαντική αλλαγή της έντασης ή του χρώματος της εικόνας. Το μέγεθος της μεταβολής αυτής, αποτελεί το ύψος της ακμής ή καλύτερα, ακμή, μπορεί να θεωρηθεί μια καμπύλη, στις δυο πλευρές της οποίας υπάρχουν σημαντικές διαφορές που αφορούν τις εντάσεις φωτεινότητας ή ακόμη ένα ή και περισσότερα χαρακτηριστικά του χώρου. Ένας αντιπροσωπευτικός, βέλτιστος αλγόριθμος ακμών, είναι ο αλγόριθμος Canny. Στον αλγόριθμο Canny, χρησιμοποιείται η πρώτη παράγωγος της συνάρτησης GAUSS, η οποία θεωρείται βέλτιστο φίλτρο ομαλοποίησης πριν την παραγώγιση. Για την εξασφάλιση συνεκτικών ακμών, χρησιμοποιείται η μέθοδος της αποκοπής των μη-μεγίστων εικονοστοιχείων, κατά την οποία το κεντρικό εικονοστοιχείο θα πρέπει να παρουσιάσει μεγαλύτερη τιμή του μέτρου της κλίσης από τα γειτονικά του 24

εικονοστοιχεία κατά τη διεύθυνση της κλίσης. Τέλος, εφαρμόζεται η μέθοδος κατωφλίωσης με χρήση υστέρησης αντί την επιλογή μιας τιμής κατωφλίου το οποίο θα εφαρμοσθεί σε όλη την εικόνα. Τα γραμμικά φίλτρα κατεύθυνσης, δύνανται να ενισχύσουν μόνο τις γραμμικές και όχι τις καμπυλόγραμμες ακμές, ενώ τα φίλτρα παραγώγισης παράγουν χάρτες ακμών, ακολουθώντας τη διαδικασία κατωφλίωσης, με αποτέλεσμα να αναπαριστούν ακμές με πάχος μεγαλύτερο του κάθε εικονοστοιχείου. Συνεπώς, η κατωφλίωση πρέπει να συνοδεύεται από διαδικασία λέπτυνσης των ακμών. Η επιλογή των βέλτιστων αλγορίθμων εξαγωγής ακμών, προέκυψε από τους παρακάτω λόγους: 1) την αύξηση του λόγου του σήματος προς θόρυβο με την απομάκρυνση των εσφαλμένων ακμών, 2) την επιτυχή ανίχνευση της ακμής, τη σωστή θέση της ακμής και τη μοναδικότητα της απόκρισης κάθε ακμής, και 3) την εξαγωγή και των καμπυλόγραμμων ακμών, εκτός των γραμμικών, με καλή συνεκτικότητα και μήκος ακμής. Οι ακμές, χαρακτηρίζουν τα όρια και συνεπώς είναι ένα πρόβλημα υψηλής σπουδαιότητας στην επεξεργασία εικόνας. Οι ακμές στις εικόνες, είναι περιοχές οι οποίες έχουν μεγάλη σφοδρότητα αντίθεσης ένα άλμα στην σφοδρότητα από ένα pixel στο άλλο. Η ακμή, ανιχνεύει μια εικόνα σημαντικά περιορίζοντας το σύνολο των δεδομένων και φίλτρων εκτός των άχρηστων πληροφοριών, εφόσον εξοικονομεί τα σημαντικά δομικά αγαθά σε μια εικόνα. Υπάρχουν πολλοί τρόποι για να διεκπεραιωθεί η ανίχνευση ακμών. Εν τούτοις, η πλειοψηφία των διαφόρων μεθόδων μπορούν να χωριστούν σε δυο κατηγορίες, αυτή της βαθμωτής μεταβολής (gradient) και του Laplace. Η μέθοδος της βαθμωτής μεταβολής, ανιχνεύει τις ακμές ψάχνοντας το μέγιστο και το ελάχιστο στην πρώτη παράγωγο της εικόνας. Η μέθοδος του Laplace, ψάχνει για zero crossings στην δεύτερη παράγωγο της εικόνας για να βρεί ακμές. Μια ακμή, έχει μονο-διαστατική δομή του κεκλιμένου επιπέδου και υπολογίζει την παράγωγο της εικόνας, η οποία μπορεί να τονίσει την τοποθεσία του. Θεωρούμε ότι έχουμε το ακόλουθο σήμα, με μια ακμή δείχνοντας την παρακάτω ένταση: 25

Αν πάρουμε το κεκλιμένο επίπεδο αυτού του σήματος, (το οποίο, σε μια διάσταση, είναι μόνο η πρώτη παράγωγος σε σχέση με το t) παίρνουμε τα ακόλουθα: Ξεκάθαρα, η παράγωγος δείχνει ένα μέγιστο, εγκατεστημένο στο κέντρο της ακμής στο αυθεντικό σήμα. Αυτή η μέθοδος του εντοπισμού μιας ακμής, είναι χαρακτηριστικό του gradient filter οικογένειας της ανίχνευσης ακμών, περιλαμβάνοντας και τη μέθοδο του Sobel. Μία τοποθεσία του pixel, είναι μία τοποθεσία ακμής, αν η τιμή του επιπέδου υπερβαίνει κάποια κατώφλια. Όπως αναφέρθηκε προηγουμένως, οι ακμές μπορούν να έχουν υψηλότερες τιμές έντασης των pixel από αυτές που τις πλαισιώνουν. Έτσι, σε ένα σετ κατωφλίων, μπορεί κανείς να συγκρίνει την τιμή της μεταβολής στην τιμή κατωφλίου και να ανιχνεύσει μια ακμή κάθε φορά που το κατώφλι υπερβαίνει (την τιμή). Επιπλέον, όταν η πρώτη παράγωγος βρίσκεται στο μέγιστο, η δεύτερη παράγωγος είναι μηδενική. Σαν αποτέλεσμα, κάποια άλλη εναλλακτική λύση για την ανίχνευση της τοποθεσίας μιας ακμής, είναι να εντοπίσουμε τα μηδενικά στη δεύτερη παράγωγο. Αυτή η μέθοδος, είναι γνωστή ως Laplacian και η δεύτερη παράγωγος του σήματος δείχνεται παρακάτω: Η ανίχνευση ακμών είναι πολύ σημαντική για την ψηφιακή επεξεργασία εικόνας, διότι με όπως ακμές μπορούμε να περιγράψουμε, να προσδιορίσουμε, να αναπαραστήσουμε και να αναγνωρίσουμε αντικείμενα που περιέχονται σε ψηφιακές εικόνες. 26

3.2.1.1 Κριτήρια σωστής ανίχνευσης Τα σφάλματα στην ανίχνευση ακμών είναι τα εξής: Παράλειψη σημείων ακμής Λανθασμένη αναγνώριση σημείων που δεν είναι πραγματικές ακμές Μετατόπιση σημείων ακμής Σχήμα 3.2.1.1 (α) τμήμα εικόνας με ακμή, (β) ιδανική ανίχνευση ακμής, (γ) ένα σημείο το οποίο δεν ανιχνεύτηκε, (δ) ανίχνευση σημείων ακμής με μετατόπιση 3.2.1.2 Ανίχνευση ακμών με χρήση της ανάλυσης κυματιδίων Οι ακμές εμφανίζονται σε διάφορες κλίμακες και με διαφορετική ένταση στις απεικονίσεις. Η ανάλυση κυματιδίων είναι κατάλληλη για ανίχνευση ακμών, καθώς αποτελεί ανάλυση πολλαπλών κλιμάκων (multiscale), και τοπική ανάλυση. [5] Η ανάλυση κυματιδίων (Wavelet Analysis), αποτελεί ένα νέο ερευνητικό πεδίο και προέκυψε ως εξέλιξη της ανάλυσης Fourier. Αντί των ημιτονοειδών και συνημιτοειδών συναρτήσεων, χρησιμοποιεί άλλες συναρτήσεις (κυματίδια), τα οποία ικανοποιούν ορισμένες μαθηματικές συνθήκες και με χρήση της επίθεσης συναρτήσεων, αναπαριστά σήματα και εικόνες. Υιοθετεί μια πρότυπη συνάρτηση, το μητρικό κυματίδιο (mother wavelet), και πραγματοποιεί την ανάλυση με μετατιθέμενες (αλλαγή θέσης) και διασταλμένες (αλλαγή κλίμακας) μορφές του μητρικού κυματιδίου. Πρόκειται για τοπική ανάλυση και ανάλυση πολλαπλών κλιμάκων (multiresolution). Σε αντίθεση με την ανάλυση Fourier, διατηρεί τη χωρική πληροφορία και είναι κατάλληλη για την προσέγγιση δεδομένων με απότομες αλλαγές-ασυνέχειες. Επιπλέον, ως ανάλυση πολλαπλών κλιμάκων, επεξεργάζεται δεδομένα σε διαφορετικές κλίμακες. [5] Παρακάτω, γίνεται λόγος για ανίχνευση ακμών με πολλαπλασιασμό κλιμάκων, όπου συνδυάζονται ως συνάρτηση γινομένου οι συνιστώσες της 27

ανάλυσης κυματιδίων (υψηλών συχνοτήτων) δύο γειτονικών κλιμάκων και κατόπιν οι ακμές εντοπίζονται ως τα τοπικά μέγιστα μετά από κατωφλίωση. Το σχήμα πολλαπλασιασμού κλιμάκων, εφαρμόσθηκε ικανοποιητικά για ανίχνευση ακμών σε εικόνες Radar και Aster (οι οποίες περιλαμβάνουν θόρυβο). Στην εικόνα, παρουσιάζεται ένα μικρό κομμάτι εικόνας Aster (έγχρωμο σύνθετο) της θαλάσσιας περιοχής της Χαλκίδας, όπου καταγράφονται τα θαλάσσια ρεύματα. Η εικόνα 4, παρουσιάζει τμήμα εικόνας Radar, η οποία απεικονίζει περιοχή της Αττικής (με θάλασσα και στεριά). Η ανίχνευση ακμών σε μικρές κλίμακες κυματιδίων (μεγάλη γεωγραφική κλίμακα-ανάλυση), επηρεάζεται από τον θόρυβο (εικόνα 2 και εικόνα 5). Παρατηρήθηκε, ότι αυξάνοντας το κατώφλι, μειώνεται ο θόρυβος αλλά χάνονται και κάποιες σημαντικές ακμές. Σε αντίθεση με το προηγούμενο, σε μεγαλύτερες κλίμακες (μικρότερη ανάλυση), οι ακμές προσδιορίζονται αρκετά καλά, χωρίς να επηρεάζονται από τον θόρυβο (εικόνα 3 και εικόνα 6). Επιπλέον, ο προσδιορισμός της θέσης των ακμών, είναι αρκετά καλός και δεν επηρεάζεται από την αλλαγή κλίμακας, διότι αντλείται πληροφορία από δύο κλίμακες. Εικόνα 1: Τμήμα εικόνας Aster (έγχρωμο-σύνθετο) Εικόνα 2: Ανίχνευση ακμών στην εικόνα (κλίμακες 1-2) Εικόνα 3: Ανίχνευση ακμών στην εικόνα (κλίμακες 2-3) Εικόνα 4: Τμήμα εικόνας Radar Εικόνα 5: Ανίχνευση ακμών στην εικόνα (κλίμακες 1-2) Εικόνα 6: Ανίχνευση ακμών στην εικόνα (κλίμακες 2-3) 28

3.2.2 Κατωφλίωση (Thresholding) και Πολυκατωφλίωση (Multilevel-thresholding) Η εύρεση κατωφλίων (Thresholds), είναι μια από τις ισχυρότερες τεχνικές για την τμηματοποίηση εικόνων που απεικονίζονται με αποχρώσεις του γκρι. Η τεχνική αυτή αποτελεί την απλούστερη προσέγγιση στο θέμα της αυτόματης τμηματοποίησης μιας εικόνας. Αποδίδει ικανοποιητικά σε εικόνες που περιέχουν ένα ή περισσότερα αντικείμενα σε κάποιο φόντο (background). Η τεχνική βασίζεται στο γεγονός ότι οι τιμές των pixels που ανήκουν στα αντικείμενα, διαφέρουν σημαντικά από τις τιμές των pixels που ανήκουν στο φόντο. Επιλέγοντας συνεπώς ένα εύρος για τις τιμές που ανήκουν σε κάποιο αντικείμενο, είμαστε σε θέση να το διαχωρίσουμε από το φόντο. Η τεχνική αυτή, χρησιμοποιείται για τη μετατροπή μιας εικόνας σε δυαδική. Η πληροφορία για τις τιμές που πρέπει να επιλεχθούν, μπορεί να δοθεί από το ιστόγραμμα της εικόνας. Η ύπαρξη ενός ή περισσοτέρων αντικειμένων, αντιστοιχεί στην ύπαρξη κορυφών στο ιστόγραμμα. Συνεπώς, επιλέγοντας τα όρια των κορυφών, μπορούμε να βρούμε το εύρος των τιμών των pixels που ανήκουν σε κάποιο αντικείμενο. [2] Η προσέγγιση αυτή, δίνει ικανοποιητικά αποτελέσματα σε περιπτώσεις όπως αυτές των εικόνων κειμένου, όπου ως γνωστό, η εικόνα περιέχει μόνο δύο κύριες αποχρώσεις του γκρί (π.χ. άσπρο, μαύρο). Συνεπώς, οι μέθοδοι κατωφλίου, πρέπει να εφαρμόζονται σε εικόνες όπου είναι ξεκάθαρη η διαφορά μεταξύ των αποχρώσεων του προσκηνίου (foreground) με το παρασκήνιο (background). Για την τμηματοποίηση περίπλοκων εικόνων, είναι αναγκαία η χρήση τεχνικών επιλογής κατωφλίων για πολλά επίπεδα (multilevel Thresholding). Υπάρχουν πάρα πολλές δυσκολίες όσον αφορά την επιλογή κάποιου κατωφλίου σε εικόνες με πολλά αντικείμενα, οι οποίες (δυσκολίες) οφείλονται κυρίως στις κατανομές των αποχρώσεων, στα μικρά και αλληλοεπικαλυπτόμενα αντικείμενα. [2] Αρκετές τεχνικές έχουν προταθεί για την αντιμετώπιση των δυσκολιών που προαναφέρθηκαν. Οι περισσότερες από αυτές, βασίζονται στην ταύτιση των ακμών (edge matching) και την ταξινόμηση. Αρχικά, όλες οι τεχνικές, ταξινομούν τα εικονοστοιχεία σε αυτά που ανήκουν σε ακμές και μη. Ακολούθως, για την εξαγωγή ακμών των κατωφλίων, χρησιμοποιούνται υπολογιστικά δαπανηρές, επαναληπτικές διαδικασίες. Σε κάθε επανάληψη, οι τιμές των κατωφλίων τροποποιούνται με σκοπό την ικανοποίηση των χαρακτηριστικών συνθηκών που αφορούν τις ακμές. [2] 29

Μια τεχνική πολυκατωφλίωσης, πρέπει να είναι γενική και απλή, να μην περιορίζεται από τη μορφή του ιστογράμματος και αν είναι δυνατόν, να αξιοποιεί και πρόσθετες πληροφορίες και όχι μόνο τις φωτεινότητες της εικόνας. [2] Ας πάρουμε για παράδειγμα μια δερματολογική εικόνα. Στην περίπτωση αυτή το ζητούμενο είναι η διάκριση της δερματολογικής βλάβης (αντικείμενο) από το φόντο (υγιές δέρμα). Εικόνα 3.2.2.1 Εικόνα 3.2.2.2 Στην εικόνα 3.2.2.1 φαίνεται η δερματολογική βλάβη και στην εικόνα 3.2.2.2 το ιστόγραμμα της εικόνας για την έντασή της. Η ένταση ορίζεται ως Ι = (R + G + B) / 3, όπου R, G, B, οι τιμές για τα τρία χρωματικά κανάλια. Όπως φαίνεται από το ιστόγραμμα, υπάρχουν τέσσερις κορυφές που αντιστοιχούν σε τέσσερις ομάδες pixels. Προφανώς, μία από τις συγκεκριμένες ομάδες, αφορά την περιοχή ενδιαφέροντος, δηλαδή τη δερματολογική αλλοίωση. [16] 3.2.3 Quadtree Decomposition Η Quadtree decomposition είναι μια τεχνική ανάλυσης, η οποία περιλαμβάνει υποδιαιρέσεις της εικόνας μέσα σε blocks, τα οποία είναι περισσότερο ομογενή απ ότι η ίδια η εικόνα. Αυτή η τεχνική αποκαλύπτει πληροφορίες όσον αφορά τη δομή της εικόνας. Είναι όμως πολύ χρήσιμη, όπως το πρώτο βήμα σε προσαρμόσιμους αλγόριθμους συμπίεσης. Μπορείς να παρουσιάσεις quadtree decomposition χρησιμοποιώντας την συνάρτηση qtdecomp. Αυτή η συνάρτηση λειτουργεί διαχωρίζοντας μια square εικόνα σε τέσσερα (4) ίσα square blocks, και μετά εξετάζει κάθε block για να δει αν βρίσκει κάποιο κριτήριο ομοιογένειας (π.χ., αν όλα τα pixel στο block είναι μέσα σε συγκεκριμένη δυναμική περιοχή). Αν κάποιο block συναντήσει / βρει το κριτήριο, τότε δεν είναι χωρισμένο περαιτέρω. Αν δεν βρει το 30

κριτήριο, τότε είναι υποδιαιρούμενο ξανά σε τέσσερα (4) blocks, και το κριτήριο εξέτασης, είναι εφαρμοσμένο σε αυτά τα block. Αυτή η διαδικασία είναι επαναλαμβανόμενη μέχρις ότου κάθε block να βρει το κριτήριο. Το αποτέλεσμα μπορεί να έχει blocks από αρκετά διαφορετικά μεγέθη. Για παράδειγμα, υποθέτουμε ότι χρειαζόμαστε να παρουσιάσουμε quadtree decomposition σε μια εικόνα έντασης 128-by-128. Το πρώτο βήμα είναι να διαιρέσουμε την εικόνα σε τέσσερα 64-by-64 blocks. Τότε, μπορούμε να εφαρμόσουμε το κριτήριο εξέτασης σε κάθε block για παράδειγμα, το κριτήριο μπορεί να γίνει μέγιστο max(block(:)) - min(block(:)) <= 0.2. Αν ένα από τα block συναντήσει αυτό το κριτήριο, δεν διαιρείται περισσότερο είναι 64-by-64 στην τελική διάσπαση. Αν ένα block δεν συναντήσει το κριτήριο, τότε αυτό διαιρείται σε τέσσερα 32-by-32 blocks, και το κριτήριο εξέτασης είναι τότε εφαρμοσμένο σε καθένα από αυτά τα blocks. Τα block που αποτυγχάνουν να συναντήσουν το κριτήριο, χωρίζονται τότε σε τέσσερα 16-by-16 blocks, και συνεχίζουν έτσι, έως ότου όλα τα block να περάσουν. Κάποια από αυτά τα block μπορεί να είναι τόσο μικρά όσο 1-by-1, εκτός αν τα ορίσεις διαφορετικά. Σημείωση: Η τιμή κατωφλίωσης είναι καθορισμένη σαν μία τιμή ανάμεσα στο 0 και το 1. 31

4.1 Ιστογράμματα και εξισορρόπηση ιστογράμματος (histogram equalization) Το ιστόγραμμα μιας εικόνας αποχρώσεων του γκρι (gray-scale), είναι ένα γράφημα, το οποίο έχει στον οριζόντιο άξονα τις φωτεινότητες από 0 (μαύρο) μέχρι 255 (άσπρο) και στον κατακόρυφο άξονα, το πλήθος των εικονοστοιχείων (pixel) που έχει κάθε φωτεινότητα. Ο κατακόρυφος άξονας μπορεί να κανονικοποιηθεί με βάση τη μέγιστη τιμή του ιστογράμματος. Στην περίπτωση που η μέγιστη τιμή αντιστοιχεί με το 1, τότε το ιστόγραμμα μας δίνει ουσιαστικά την κατανομή πυκνότηταςπιθανότητας των επιπέδων του γκρι στην εικόνα. Το ιστόγραμμα, περιέχει σημαντικές πληροφορίες για την εικόνα, όπως για την φωτεινότητά της, σε ποια επίπεδα εμφανίζονται τα περισσότερα ή τα λιγότερα εικονοστοιχεία, οι μέγιστες και οι ελάχιστες τιμές, κ.α. Για τον λόγο αυτό, είναι ένα από τα σημαντικότερα εργαλεία για την επεξεργασία ψηφιακών εικόνων. Μπορεί να χρησιμοποιηθεί για τη βελτιστοποίηση της εικόνας, την τροποποίηση των χαρακτηριστικών της (μέθοδος κατωφλίωσης), την μετατροπή της εικόνας σε μια άλλη με λιγότερες αποχρώσεις (μέθοδος clustering), κ.α. Η μέθοδος της εξισορρόπησης ιστογράμματος, είναι μια τεχνική βελτιστοποίησης εικόνας, η οποία πραγματοποιείται τροποποιώντας το ιστόγραμμα, κατανέμοντας ομοιόμορφα τις φωτεινότητες συνήθως προκύπτει μία εικόνα αυξημένης αντίθεσης. 4.1.1 Βελτίωση της αντίθεσης Οι τεχνικές βελτίωσης της αντίθεσης, είναι οι πλέον συνήθεις για τις ψηφιακές εικόνες. Ερμηνεύοντας ένα ιστόγραμμα, μπορούμε να παρατηρήσουμε την αποτύπωση των εικονοστοιχείων σε μια εικόνα, που έχουν τιμές από 0 εώς 255, λαμβάνοντας υπόψη ότι τα συστήματα είναι 8 bits, και τα οποία αντιστοιχούν σε 256 διαβαθμίσεις του γκρι. 32

4.1.2 Παραδείγματα Ισοστάθμισης-εξίσωσης ιστογράμματος με τη χρήση του MATLAB Το πρώτο σχήμα (α), παρουσιάζει την αρχική εικόνα. Στο σχήμα (β), φαίνεται το ιστόγραμμα της αρχικής εικόνας, όπου οι τιμές των pixels* είναι συγκεντρωμένες στο πρώτο μισό του ιστογράμματος. Στο σχήμα (γ), φαίνεται η επεξεργασμένη εικόνα (μετά την ισοστάθμιση του ιστογράμματός της), και τέλος Στο τελευταίο σχήμα (δ), φαίνεται το ισοσταθμισμένο ιστόγραμμα, όπου παρατηρούμε πως οι τιμές των pixels είναι ομοιόμορφα κατανεμημένες σε όλο το ιστόγραμμα. (α) (β) (γ) Σχήμα 4.1.2.1 (δ) *Οι τιμές των pixels στα ιστογράμματα είναι κανονικοποιημένες στη μονάδα. 33

Όπως επίσης, το παρακάτω παράδειγμα: I = imread('ngc4024m.tif'); level = [ ]; BW1 = edge(i,'sobel'); BW2 = edge(i,'canny'); figure, imhist(i) figure, imhist(bw1) figure, imhist(bw2) Σχήμα 4.1.2.2 (α) (β) Στο σχήμα (α) παρατηρούμε την αρχική εικόνα και στο σχήμα (β) το ιστόγραμμά της. 4.2 Τεχνικές ενίσχυσης των εικόνων -Φίλτρα Πρόκειται για τεχνικές, οι οποίες δίνουν έμφαση στην επιλεκτική πληροφόρηση. Τα φίλτρα, είναι πίνακες m x n (μάσκες), οι οποίες εφαρμόζονται στην εικόνα με σκοπό να δώσουμε έμφαση ή να απαλύνουμε ορισμένα χαρακτηριστικά της. Τα φίλτρα διακρίνονται σε χωρικά και φασματικά. Σε αντίθεση με τα φασματικά φίλτρα τα οποία βοηθούν στην συγκράτηση ή την διέλευση της ενέργειας από τις διάφορες φασματικές περιοχές τα χωρικά φίλτρα, τονίζουν ή αποδυναμώνουν τα δεδομένα της εικόνας για διάφορες χωρικές συχνότητες. Χωρικά φίλτρα Τα χωρικά φίλτρα, είναι μια τοπική πράξη, κατά την οποία οι τιμές των εικονοστοιχείων της αρχικής εικόνας τροποποιούνται στην ενισχυμένη εικόνα με βάση τις τιμές του γκρι των γειτονικών τους εικονοστοιχείων. 34

Τα χωρικά φίλτρα (Spatial filtering), αποτελούν μια ψηφιακή επεξεργασία, η οποία χρησιμοποιείται για να ενισχύσει την εμφάνιση μιας εικόνας (πιο συγκεκριμένα, μιας δορυφορικής εικόνας). Τα φίλτρα αυτά, έχουν σχεδιαστεί για να τονίζουν ή να εξομαλύνουν συγκεκριμένα χαρακτηριστικά μιας εικόνας, βασισμένα στη χωρική συχνότητα (Spatial frequency). Η χωρική συχνότητα, σχετίζεται με την υφή της εικόνας (image texture) και αναφέρεται στη συχνότητα μεταβολής των τόνων οι οποίοι εμφανίζονται σε μια εικόνα. Περιοχές τραχιάς υφής, είναι οι περιοχές όπου ο τόνος μεταβάλλεται απότομα εντός μιας μικρής περιοχής της εικόνας και έχει υψηλές «χωρικές συχνότητες», ενώ «ομαλές περιοχές», είναι αυτές οι οποίες δείχνουν μικρή διακύμανση του τόνου κι έχουν μικρή χωρική συχνότητα. Μια συνήθης διαδικασία εφαρμογής φίλτρου, περιλαμβάνει την μετακίνηση ενός «παραθύρου», το οποίο αποτελείται από μερικά εικονοστοιχεία (pixels) με διαστάσεις 3x3 ή 5x5 ή 7x7 κ.τ.λ. πάνω από κάθε εικονοστοιχείο της εικόνας. Με τον τρόπο αυτό, εφαρμόζεται ένας μαθηματικός υπολογισμός, χρησιμοποιώντας τις τιμές κάθε εικονοστοιχείου Σχήμα 4.2.1 Διαδικασία εφαρμογής ενός φίλτρου 3x3 στα εικονοστοιχεία μιας εικόνας. κάτω από το «παράθυρο» και αντικαθιστώντας το κεντρικό εικονοστοιχείο με μια νέα τιμή. Το παράθυρο μετακινείται κατά μήκος γραμμών και στηλών ένα εικονοστοιχείο την φορά και ο υπολογισμός επαναλαμβάνεται έως ότου ολόκληρη η αρχική εικόνα «φιλτραριστεί». Το αποτέλεσμα της διαδικασίας αυτής, είναι η δημιουργία (παραγωγή) μιας καινούργιας εικόνας. Μεταβάλλοντας τον υπολογισμό, ο οποίος εκτελείται κάθε φορά, τα φίλτρα μπορούν να σχεδιαστούν ανάλογα με το αν θέλουμε να ενισχύσουμε ή να εξομαλύνουμε διάφορα χαρακτηριστικά της εικόνας. 35

Διακρίνονται σε: Φίλτρα εξομάλυνσης ή χαμηλοδιαβατά φίλτρα (low-pass filters, φίλτρα χαμηλής συχνότητας). Τα φίλτρα αυτά, μειώνουν τον θόρυβο της εικόνας, απαλείφουν τις λεπτομέρειες και προκαλούν μια «θόλωση» της εικόνας. [15] Υψιπερατά φίλτρα (high-pass filters, φίλτρα υψηλής συχνότητας). Τα φίλτρα αυτά, τονίζουν τις χωρικές λεπτομέρειες και αποδυναμώνουν τις γενικές πληροφορίες οι οποίες συνδέονται με χαμηλές συχνότητες. Υψιπερατά φίλτρα, είναι τα φίλτρα ενίσχυσης των ακμών (sharpen edges). Η χρήση των φίλτρων αυτών, αποσκοπεί στην αποτύπωση γραμμικών χαρακτηριστικών ή ακμών και περιγραμμάτων των εικόνων.[15] Ένα χαμηλής συχνότητας φίλτρο, (low-pass filter), έχει σχεδιαστεί για να δίνει έμφαση σε μεγαλύτερες, ομοιογενείς περιοχές παρόμοιου τόνου και να μειώνει την μικρότερη πληροφορία της εικόνας. Επιπλέον, τα χαμηλοδιαβατά φίλτρα, εξομαλύνουν την εμφάνιση της εικόνας. Τα υψηλής συχνότητας φίλτρα, (high-pass filters), κάνουν το αντίθετο και μας εξυπηρετούν σε περίπτωση που θέλουμε να «οξύνουμε» την εμφάνιση μιας εικόνας. Η εφαρμογή ενός υψιλοδιαβατού φίλτρου (high-pass filter), αρχικά περιλαμβάνει την εφαρμογή ενός χαμηλής συχνότητας φίλτρου στην εικόνα, κατόπιν αφαιρεί το αποτέλεσμα από την αρχική εικόνα και αφήνει με αυτόν τον τρόπο μόνο τις υψηλές συχνότητας πληροφορίες της εικόνας. Σχήμα 4.2.2 36

Τα φίλτρα κατευθυντικότητας (Directional), ή τα φίλτρα ανίχνευσης των ακμών (edge detection filters), σχεδιάζονται για να ενισχύσουν γραμμικά στοιχεία, όπως από τις παραπάνω εικόνες δρόμοι, ρήγματα, κ.τλ. Αυτά τα φίλτρα, μπορούν επίσης να σχεδιαστούν για να ενισχύσουν χαρακτηριστικά τα οποία έχουν συγκεκριμένη διεύθυνση στο χώρο. Τα φίλτρα αυτά, είναι ιδιαίτερα χρήσιμα σε γεωλογικές εφαρμογές, όπως για παράδειγμα είναι η ανίχνευση γραμμικών γεωλογικών δομών. [15] Σχήμα 4.2.3 Δορυφορική εικόνα για το νοτιοανατολικό τμήμα της Λέσβου 37

παράθυρο: 5.1 Εισαγωγή στο πρόγραμμα MATLAB Ανοίγοντας την εφαρμογή MATLAB, μας ανοίγει το παρακάτω-κεντρικό Για να ξεκινήσουμε, ανοίγουμε τη Βοήθεια από το μενού Help MATLAB Help ή 38

από τη συντόμευση πατώντας το ερωτηματικό (?). Από το παράθυρο της Βοήθειας, μπορούμε πολύ εύκολα να διαλέξουμε οποιαδήποτε μέθοδο θέλουμε και να δημιουργήσουμε το ίδιο εύκολα κάποιον κώδικα τον οποίο θα τρέξουμε στη συνέχεια. Στη συνέχεια ανοίγουμε ένα καινούργιο M-αρχείο (αρχείο Matlab) για να γράψουμε 39

τον κώδικά μας, είτε από το μενού File New M-file, είτε τοποθετώντας το ποντίκι μας πάνω στη συντόμευση (στο εικονίδιο με το λευκό έγγραφο). Πάνω, βλέπουμε το καινούργιο M-αρχείο και κάτω τον κώδικα που δημιουργήσαμε. Για να δούμε αν δουλεύει σωστά το πρόγραμμα, πρώτα το αποθηκεύουμε ( ) στο Work (Workspace) του MATLAB με κατάληξη.m (*.m) και στη συνέχεια το 40

τρέχουμε ( ). Αν όλα είναι σωστά, τότε μας εμφανίζει τα επιθυμητά σχήματα, αλλιώς μας βγάζει ένα μήνυμα με κόκκινα γράμματα στο κεντρικό παράθυρο για τυχόν σφάλματά μας και σε ποιο σημείο αυτά βρίσκονται, με σκοπό να τα διορθώσουμε. 5.2 Μέθοδοι τμηματοποίησης εικόνων και υλοποίησής τους Παρακάτω, αφού τρέξουμε τα προγράμματα στο MATLAB, βλέπουμε πώς λειτουργεί η κάθε μέθοδος και συγκρίνουμε τις μεθόδους μεταξύ τους. Έχουμε λοιπόν: 5.2.1 :edge detection Μπορούμε να χρησιμοποιήσουμε αυτή την συνάρτηση για να ανιχνεύσουμε ακμές, οι οποίες είναι αυτές οι θέσεις σε μια εικόνα οι οποίες αντιστοιχούν στα όρια του αντικειμένου. Για να βρει ακμές, αυτή η συνάρτηση κοιτάει για θέσεις στην εικόνα στις οποίες η ένταση αλλάζει γρήγορα, χρησιμοποιώντας ένα από τα παρακάτω δύο κριτήρια: 1. Θέσεις στις οποίες η πρώτη παράγωγος της έντασης είναι μεγαλύτερη σε μέγεθος απ ότι κάποιο κατώφλι 2. Θέσεις στις οποίες η δεύτερη παράγωγος της έντασης έχει zerocrossing Οι ακμές παρέχουν έναν αριθμό από εκτιμητές παραγώγων, κάθε μια από τις οποίες εκτελεί έναν από τους παραπάνω ορισμούς. Για κάποιους από αυτούς τους εκτιμητές, μπορούμε να ορίσουμε αν η λειτουργία μπορεί να είναι ευπαθής σε οριζόντιες ή κάθετες ακμές, ή και στις δύο. Η ανίχνευση ακμών υποστηρίζει έξι (6) διαφορετικές μεθόδους ανίχνευσηςακμών: Την μέθοδο Sobel, η οποία βρίσκει ακμές χρησιμοποιώντας τη διαδικασία προσέγγισης του Sobel σε μια παράγωγο. Επιστρέφει ακμές σε όσα σημεία το gradient του I είναι μέγιστο. Την μέθοδο Prewitt, η οποία βρίσκει ακμές χρησιμοποιώντας τη μέθοδο προσέγγισης Prewitt σε μια παράγωγο. Επιστρέφει ακμές σε όσα σημεία το gradient του I είναι ελάχιστο. 41

Την μέθοδο Roberts, η οποία βρίσκει ακμές χρησιμοποιώντας τη μέθοδο προσέγγισης Roberts σε μια παράγωγο. Επιστρέφει ακμές σε όσα σημεία το gradient του I είναι μέγιστο. Την μέθοδο Laplace, η οποία βρίσκει ακμές ψάχνοντας για zero crossings εφόσον φιλτράρει το I με το Laplacian of Gaussian φίλτρο. Tην μέθοδο zero-cross, η οποία βρίσκει ακμές ψάχνοντας για zero crossings εφόσον φιλτράρει το I με ένα φίλτρο που εμείς θα καθορίσουμε. Την μέθοδο Canny, η οποία βρίσκει ακμές ψάχνοντας για τοπικό μέγιστο του gradient του I. Το gradient υπολογίζεται, χρησιμοποιώντας την παράγωγο του Gaussian φίλτρου. Η μέθοδος χρησιμοποιεί δύο κατώφλια, για την ανίχνευση δυνατών και αδύναμων ακμών, και περιλαμβάνουν τις αδύναμες ακμές στην έξοδο, μόνο αν αυτές είναι συνδεδεμένες με δυνατές ακμές. Αυτή η μέθοδος, συνεπώς, είναι η λιγότερο αρεστή από τις άλλες μεθόδους. [10] Ο αλγόριθμος εξαγωγής ακμών του Canny, δεν είναι μια απλή τεχνική για τη βέλτιστη εξαγωγή ακμών. Στην πραγματικότητα, είναι μια βέλτιστη τεχνική ανίχνευσης και δημιουργίας ακμών. Τα κριτήρια στα οποία βασίζεται η ανάπτυξή της, είναι τα ακόλουθα: (α) Σωστή ανίχνευση: Να ανιχνεύονται με μεγάλη πιθανότητα ακμές όταν αυτές πραγματικά υπάρχουν, αλλά και να μην αναγνωρίζονται ως σημεία ακμών, σημεία που δεν ανήκουν σε ακμές. (β) Εντοπισμός θέσης: Οι ακμές που ανιχνεύονται, να είναι στη σωστή χωρικά θέση, πολύ κοντά προς τις πραγματικές ακμές. (γ) Μοναδική απόκριση σε κάθε ακμή: Το κριτήριο αυτό, απαιτεί τον αποκλεισμό της πιθανότητας μία πραγματική ακμή να δώσει περισσότερες από μία ακμές ως απόκριση. Αν και το κριτήριο αυτό ουσιαστικά υπερκαλύπτεται από το πρώτο, περιλαμβάνεται χωριστά, καθώς η μαθηματική περιγραφή του πρώτου κριτηρίου δεν αποκλείει αυτήν την περίπτωση. [12] 42

Έχουμε λοιπόν: I = imread('ngc4024m.tif'); imshow(i) BW1 = edge(i,'sobel'); BW2 = edge(i,'canny'); imshow(bw1) figure, imshow(bw2) Όπου: BW = edge(i,'sobel') καθορίζει την μέθοδο Sobel. Η μέθοδος Sobel, βρίσκει ακμές χρησιμοποιώντας τη διαδικασία προσέγγισης Sobel στην παράγωγο. Αυτή γυρνάει ακμές στα σημεία τα οποία το gradient του I είναι μέγιστο. BW = edge(i,'canny') καθορίζει την μέθοδο Canny. Η πιο δυνατή μέθοδος ανίχνευσης ακμών, είναι η μέθοδος Canny. Η μέθοδος Canny διαφέρει από τις άλλες μεθόδους, διότι χρησιμοποιεί δυο διαφορετικά κατώφλια (ανιχνεύει δυνατές και αδύναμες ακμές) και περιλαμβάνει τις αδύναμες ακμές στην έξοδο (output) μόνο αν αυτές είναι συνδεδεμένες με δυνατές ακμές. Τρέχοντας το πρόγραμμα, παίρνουμε το παρακάτω αποτέλεσμα: Σχήμα 5.2.1.1 Σχήμα 5.2.1.2 43

Σύγκριση των παραπάνω αποτελεσμάτων: Στο σχήμα 5.2.1.1, βλέπουμε μόνο τις δυνατές ακμές, ενώ στο σχήμα 5.2.1.2 (με την μέθοδο Canny), έχουμε καλύτερα αποτελέσματα από τη μέθοδο Sobel, διότι όπως είπαμε, χρησιμοποιεί δυο διαφορετικά κατώφλια και αυτό έχει ως αποτέλεσμα να μας δείχνει και τις δυνατές και τις αδύναμες ακμές. Παρακάτω, φτιάχνουμε ακόμη ένα κώδικα, συγκρίνοντας αυτή τη φορά- δύο άλλες μεθόδους: I = imread('ngc4024m.tif'); BW1 = edge(i,'roberts'); BW2 = edge(i,'prewitt'); imshow(bw1) figure, imshow(bw2) Σχήμα 5.2.1.3 Σχήμα 5.2.1.4 44

Σύγκριση των παραπάνω αποτελεσμάτων: Τα σχήματα 5.2.1.3 και 5.2.1.4, δεν έχουν κάποια ουσιαστική διαφορά. Θα μπορούσαμε να πούμε ότι δεν έχουν σχεδόν καθόλου διαφορά μεταξύ τους. Παρακάτω, ας πάρουμε μία άλλη μέθοδο: I = imread('ngc4024m.tif'); imshow (I) level = [ ]; BW1 = edge(i,'sobel'); BW2 = edge(i,'canny'); BW3 = edge(i,'sobel',level); figure, imshow(bw1) figure, imshow(bw2) figure, imshow(bw3) Σχήμα 5.2.1.5 Σχήμα 5.2.1.6 Σχήμα 5.2.1.7 Σχήμα 5.2.1.8 45

Σύγκριση των παραπάνω αποτελεσμάτων: Στο σχήμα 5.2.1.5, βλέπουμε την αρχική εικόνα αυτοτελή. Στο σχήμα 5.2.1.6, με τη μέθοδο Sobel, βλέπουμε μόνο τις δυνατές ακμές. Στο σχήμα 5.2.1.7, με τη μέθοδο Canny- η οποία έχει και καλύτερα αποτελέσματα- βλέπουμε όλες τις ακμές ( δυνατες και αδύναμες ), ενώ στο σχήμα 5.2.1.8, με τη μέθοδο Sobel-level, έχουμε παρόμοια αποτελέσματα με το σχήμα 5.2.1.6. Μπορούμε να πάρουμε όλες τις μεθόδους και τοποθετώντας τη μια δίπλα στην άλλη, να τις συγκρίνουμε μεταξύ τους. Έχουμε: (α) Αρχική εικόνα (β) Μέθοδος Sobel (γ) Μέθοδος Prewitt (δ) Μέθοδος Roberts (ε) Μέθοδος Zero-cross (στ) Μέθοδος Canny 46

5.2.2: Threhold Υπάρχουν 2 μέθοδοι Threshold. Για λόγους ευκολίας, τη μια μέθοδο την ονομάζουμε Threshold1 και την άλλη Threshold2. Έχουμε λοιπόν: Threshold1 A=imread('lena512.bmp'); level = graythresh(a) bw = im2bw(a,level); figure, imshow(bw) όπου: graythresh Υπολογίζουμε μια γενική εικόνα κατωφλίου χρησιμοποιώντας την μέθοδο Otsu's 1. Συντακτικό level = graythresh(i) Περιγραφή level = graythresh(i) υπολογίζει ένα γενικό (επίπεδο) κατωφλίου, το οποίο μπορεί να χρησιμοποιηθεί για να μετατρέψει μια εικόνα έντασης μέσω του im2bw. Το level είναι μια τιμή κανονικοποιημένης έντασης, το οποίο έγκειται στην περιοχή [0, 1]. Η συνάρτηση graythresh, χρησιμοποιεί την μέθοδο Otsu's, η οποία διαλέγει το κατώφλι ώστε να ελαχιστοποιεί την intraclass variance των μαύρων και λευκών pixel. Πολυδιάστατοι πίνακες, μετατρέπονται αυτόματα σε δισδιάστατους πίνακες χρησιμοποιώντας αναδιοργάνωση. Η συνάρτηση Graythresh, αναγνωρίζει κάθε μημηδενικό imaginary μέρος του I. 1 Η μέθοδος Otsu s είναι μια από τις καλύτερες τεχνικές εύρεσης κατωφλίου. Χρησιμοποιεί την computer vision για τη δημιουργία κατωφλίου. Το κριτήριο το οποίο χρησιμοποιείται στη μέθοδο του Otsu για τον προσδιορισμό του βέλτιστου κατωφλίου, είναι η μεγιστοποίηση της διαχωριστικότητας μεταξύ των σκοτεινών και των φωτεινών περιοχών. Αν κάθε pixel p μιας εικόνας προσδιορίσει ένα interest score, f(p), τότε ο Otsu δημιούργησε ένα ιστόγραμμα από f σε όλη την εικόνα και διαλέγει ένα κατώφλι ώστε να μεγιστοποιήσει την between-class διακύμανση. [9] 47

Class Support Η εικόνα εισόδου (input image) I, μπορεί να γίνει of class uint8, uint16, ή διπλό. Το επίπεδο επιστρεφόμενης τιμής είναι ένα διπλός αριθμός (scalar). im2bw Περιγραφή Το im2bw παράγει διαδικές εικόνες από πίνακες / καταλόγους (indexed), ένταση, ή RGB εικόνες. Για να γίνει αυτό, μετατρέπει την εικόνα εισόδου σε grayscale format, και μετά μετατρέπει αυτή την grayscale εικόνα σε δυαδική μέσω του thresholding. Η δυαδική εικόνα εξόδου BW έχει τιμή από 0 (μαύρα) για όλα τα pixel στην εικόνα εισόδου με φωτεινότητα μικρότερη από το level και 1 (άσπρα) για όλα τα άλλα pixel. Το BW = im2bw(i,level) μετατρέπει την εικόνα έντασης I σε μαύρη και άσπρη. Τρέχοντας το πρόγραμμα, παίρνουμε το αποτέλεσμα που ακολουθεί: Σχήμα 5.2.2.1 Σχήμα 5.2.2.2 Στο σχήμα 5.2.2.1, έχουμε την αρχική εικόνα, ενώ στο σχήμα 5.2.2.2, παίρνουμε το αποτέλεσμα της εικόνας. 48

Τρέχουμε το ίδιο πρόγραμμα, βάζοντας άλλη εικόνα. Έτσι, έχουμε: A=imread('ngc4024m.tif'); level = graythresh(a) bw = im2bw(a,level); figure, imshow(bw) Σχήμα 5.2.2.3 Σχήμα 5.2.2.4 Στο σχήμα 5.2.2.3, έχουμε την αρχική εικόνα, ενώ στο σχήμα 5.2.2.4, έχουμε το αποτέλεσμά της. Threshold2 I = imread('ngc4024m.tif'); X = grayslice(i,16); imshow(i) figure, imshow(x,jet(16)) grayslice Δημιουργεί indexed εικόνα από εικόνα έντασης, χρησιμοποιώντας πολυεπίπεδο Thresholding. Συντακτικό X = grayslice(i,n) X = grayslice(i,v) 49