ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Δ. Χαάλαπος Π. Στουθόπουλος Καθηγητής ΣΕΡΡΕΣ, ΔΕΚΕΜΒΡΙΟΣ 9
ΠΕΡΙΕΧΟΜΕΝΑ. Κεφάλαιο Εισαγωγή και οισοί. Είδη ψηφιακών εικόνων.. Βασικές έννοιες.3 Ιστόγαα. Κεφάλαιο Επεξεγασίες σε δυαδικές εικόνες.. Κέντο βάος αντικειένου.. Κωδικοποίηση δυαδικής εικόνας κατά ήκος διαδοής..3. Συνδεδεένα στοιχεία..4. Κωδικοποίηση αλυσίδας.5. Ο ετασχηατισός του Houh. 3. Κεφάλαιο 3 Επεξεγασίες σε εικόνες αποχώσεων του γκι 3.. Βελτίωση εικόνων 3... Εξοάλυνση 3... Εξισοόπηση ιστογάατος 3.. Κατωφλίωση 3.. Κατωφλίωση ε βάση τη διασποά 3.. Κατωφλίωση ε βάση την εντοπία 3..3 Πολυκατωφλίωση ε χήση νευωνικού δικτύου 3.3. Κωδικοποίηση εικόνων αποχώσεων του γκι 3.3. Κωδικοποίηση Huffman 3.3. Κωδικοποίηση LZW 3.3.3 Κωδικοποίηση Δ-διακιτού ετασχηατισό συνηιτόνου 3.4. Ανίχνευση ακών 3.4. Ανίχνευση ακών ε την χήση πώτων πααγώγων 3.4. Ανίχνευση ακών ε την χήση του τελεστή Laplace 3.5 Μεταβολή εγέθους Παεβολή τιών 4. Κεφάλαιο 4 - Μοφολογία ψηφιακών δυαδικών εικόνων 4.: Μεταφοά (Translation) 4.: Ανάκλαση (Reflection) 4.3: Συπλήωα (Complement) 4.4: Τοή (Intersection) 4.5: Ένωση (Union) 4.6: Διαφοά (Difference)
4.7: Διαστολή (Dilation) 4.8: Διάβωση (Erosion) 4.9: Άνοιγα (Openin) 4.: Κλείσιο (Closin). 4.: Εφαογές Πααδείγατα 3
ΚΕΦΑΛΑΙΟ Εισαγωγή και οισοί Η ψηφιακή επεξεγασία εικόνας (ΨΕΕ) αποτελεί έναν ευύ επιστηονικό κλάδο που αναπτύχθηκε ε την αγδαία εξέλιξη των υπολογιστών. Ο όος εικόνα χησιοποιείται ευύτεα από την απλή απεικόνιση ενός σκηνικού και πειλαβάνει την αποτύπωση κάθε είδους πληοφοιών. Τα υπεηχογαφήατα, οι αγνητικές τοογαφίες, οι δουφοικές φωτογαφίες κ.α. ποούν να επεξεγαστούν ως ψηφιακές εικόνες. Οι στόχοι της ΨΕΕ είναι οι εξής: ) Η ψηφιοποίηση και κωδικοποίηση εικόνων ε σκοπό την αποθήκευση, ετάδοση και εκτύπωσή τους. ) Η βελτίωση και η αποκατάσταση των εικόνων ε σκοπό την καλύτεη απεικόνισή τους. 3) Η ανάλυση και κατανόηση των εικόνων Η ΨΕΕ συνεγάζεται ε τους παακάτω επιστηονικούς κλάδους: ) Ψηφιακή Επεξεγασία Σηάτων (ΨΕΣ) ) Ροποτική όαση 3) Τεχνητή Νοηοσύνη 4) Αναγνώιση Ποτύπων 5) Νευωνικά Δίκτυα 6) Ασαφής Λογική 7) Κωδικοποίηση 8) Γαφικά Η/Υ 4
Η ψηφιακή εικόνα είναι ένα πεπεασένο σύνολο πειοχών όπου κάθε πειοχή είναι χωατισένη ε χώα που ποέχεται από ένα πεπεασένο σύνολο χωάτων. Στις πεισσότεες των πειπτώσεων, ια ψηφιακή εικόνα είναι ένα οθογώνιο, διαιεένο ε γαές και στήλες σε οθογώνιες πειοχές που κάθε ία έχει συγκεκιένο χώα. Μια τέτοια πειοχή ονοάζεται στοιχείο της εικόνας ή εικονοστοιχείο. Στην αγγλική λέγεται pixel ή pel, όος ο οποίος ποέχεται από τη σύντηση των λέξεων picture element. Από τα πααπάνω καταλαβαίνουε πως ια ψηφιακή εικόνα είναι ένα διδιάστατο ψηφιακό σήα. Αν κάθε χώα κωδικοποιηθεί ε έναν αιθό τότε η οθογώνια ψηφιακή εικόνα πειγάφεται από έναν πίνακα αιθών J K, όπου J το πλήθος των γαών και K το πλήθος των στηλών της ψηφιακής εικόνας. Η τιή I(j,k) ε k,,.k- και j,,.j- είναι ο κωδικός του χώατος της ψηφιακής εικόνας. Η ετατοπή ιας εικόνας σε ψηφιακή οφή ουσιαστικά είναι η ετατοπή ενός δισδιάστατου αναλογικού σήατος σε ψηφιακό και απαιτεί τις διαδικασίες της δειγατοληψίας και του κβαντισού.. Είδη ψηφιακών εικόνων Υπάχουν τία είδη ψηφιακών εικόνων που χαακτηίζονται από το πλήθος των χωάτων που πειέχουν: ) Δυαδικές εικόνες (binary imaes): Κάθε εικονοστοιχείο των εικόνων ποεί να χωατιστεί ε ένα από δύο χώατα.(συνήθως άσπο ή αύο). Για κάθε εικονοστοιχείο απαιτείται ένα bit πληοφοίας, π.χ. ε τιή ηδέν () για το αύο και ένα () για λευκό. Οι εικόνες των εγγάφων που αποτελούνται όνο από το χώα του χατιού και της ελάνης αναπαίστανται σε δυαδική ψηφιακή οφή. ) Εικόνες αποχώσεων του γκι (ray level imaes): Κάθε εικονοστοιχείο των εικόνων ποεί να χωατιστεί ε ία από τις αποχώσεις του γκι οι οποίες ξεκινούν από το αύο και καταλήγουν στο λευκό. Από αυτές τις αποχώσεις συνήθως λαβάνονται 56 αντιποσωπευτικές που κωδικοποιούνται ε τιές,,.55. Η απόχωση κάθε εικονοστοιχείου ποφανώς απαιτεί πληοφοία ενός byte. 3) Έγχωες εικόνες (color imaes) στις οποίες κάθε εικονοστοιχείο χωατίζεται ε χώατα που ποέχονται από την ανάειξη των αποχώσεων του κόκκινου, πάσινου και πλε (RGB). Για κάθε ένα από τα τία αυτά χώατα λαβάνονται 56 αποχώσεις δηλαδή πληοφοία του ενός byte. Συνεπώς κάθε εικονοστοιχείο της έγχωης εικόνας, απαιτεί 3 bytes. 5
. Βασικές έννοιες Το σύνολο των χωάτων που ποούν να χησιοποιηθούν για τον χωατισό των εικονοστοιχείων της εικόνας λέγεται χωατική παλέτα. Εάν C είναι το πλήθος των χωάτων, τότε για την κωδικοποίησή τους απαιτούνται Β bits και ισχύουν οι σχέσεις C B Blo C Το Β ονοάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει Κ στήλες και J γαές τότε για την απεικόνισή της απαιτούνται J K B bits. Ο Πιν... παουσιάζει ενδεικτικές τιές των πααπάνω εγεθών. Είδος εικόνας J K B Bits bytes Δυαδική 5 Αποχώσεων του γκι 8 8 Έγχωη RGB 4 4 3 Δυαδική 5 5 5488 65536 Αποχώσεων του γκι 5 5 8 975 644 Έγχωη RGB 5 5 4 69456 78643 Πίνακας... Ευκίνεια της εικόνας είναι το πλήθος των εικονοστοιχείων ανά ονάδα επιφάνειας και καθοίζει πόσο λεπτοεής είναι η ψηφιακή αναπαάσταση της εικόνας. Η ευκίνεια Ε ιας εικόνας διαστάσεων J K και εβαδού Α δίνεται από την σχέση J K E (..) A και ετιέται σε πλήθος εικονοστοιχείων ανά ονάδα επιφάνειας π.χ. pixels/mm ή dpi ( dots per inch : κουκίδες ανά ίντσα). Η ευκίνεια εξατάται τόσο από το πλήθος των εικονοστοιχείων όσο και από τις φυσικές διαστάσεις της εικόνας. Μια οάδα γειτονικών εικονοστοιχείων λέγεται γειτονιά. Σε ια γειτονιά S M N ε Μ γαές και Ν στήλες ιας εικόνας διαστάσεων J K υπάχει ένα κεντικό εικονοστοιχείο (j c,k c ) όταν Μ, Ν είναι πειττοί αιθοί. Η θέση των εικονοστοιχείων της S αναφέονται συχνά, σχετικά ε την θέση του κεντικού εικονοστοιχείου της. Η πιο συνήθης γειτονιά είναι τιών (3) γαών και τιών (3) στηλών και λέγεται γειτονιά 3 3. Στο Σχ... φαίνονται 3 3 και 5 5 γειτονιές. 6
Γειτονιά 3 3 Γειτονιά 5 5 Σχήα..: Γειτονιές 3 3 και 5 5 ε τα κεντικά τους εικονοστοιχεία. Σε κάθε εικονοστοιχείο ιας γειτονιάς ε Μ γαές και Ν στήλες όπου Μ και N πειττοί ακέαιοι, ποούε να αντιστοιχίσουε έναν συντελεστή w(m,n), m-(m- )/,,(M-)/, n-(n-)/,...,(n-)/ στην γαή r (Μ-)/m, r M, και στην στήλη c(ν-)/n, c...n, Ονοάζουε άσκα W τον πίνακα S ε στοιχεία τις τιές τις άσκας σύφωνα ε την σχέση s rc w(m,n). Για παάδειγα για ΝΜ3 ο πίνακας S είναι w(-,-) w(-,) w(-,) w(,-) w(,) w(,) w(,-) w(,) w(,) Οι συντελεστές της άσκας και οι τιές φωτεινότητας των εικονοστοιχείων ποούν να επλακούν σε χήσιους υπολογισούς για την επεξεγασία της εικόνας. Ο συνηθέστεος υπολογισός δίνεται από την σχέση όπου (j,k) εικονοστοιχείο της εικόνας Ι. w( m, n) I( j m, k A ( j, k) n) m n Στο παακάτω σχήα δίνονται άσκες 3 3 και η εφαογή τους σε ία 3 3 πειοχή εικονοστοιχείων. 7
4 5 4 /9 4 5 4 5 5 4 5 4 4 5 4 5 5 9 9.4.4 4 5 4 /7.64 8 4 5.4.4 4 5 5.4 4 5.4 4 4 8 5.4 4 5.4 5 7.64 38 Σχήα... Αν (j c,k c ) είναι το κεντικό εικονοστοιχείο της γειτονιάς S της εικόνας Ι J K η τιή Α ποεί να αποδοθεί ως τιή φωτεινότητας του εικονοστοιχείου (j c,k c ) ιας νέας εικόνας Ι J K. Αν αυτό εφαοσθεί για όλες τις γειτονιές της εικόνας Ι, τότε λέε ότι η νέα εικόνα Ι ποέκυψε από το φιλτάισα της Ι ε την άσκα W. Αν πειγάψουε ια τέτοια πάξη ε όους της ψηφιακής επεξεγασίας σήατος τότε η εφαογή της άσκας W σε όλα τα εικονοστοιχεία της εικόνας ισοδυναεί ε την έξοδο ενός γαικού και ανεξάτητου από την ετατόπιση (LTI) συστήατος ε απόκιση κουστικής διέγεσης της οφής w( m, n) ( j m, k h ( j, k) δ n) m n h w(,) w(,) w(,-) w(,) w(,) w(,-) w(-,) w(-,) w(-,-) και θα δίνεται από τη σχέση I I**h.3. Ιστόγαα Αν η ψηφιακή εικόνα αποτελείται από αποχώσεις του γκι ποούε να δηιουγήσουε την κατανοή του πλήθους των εικονοστοιχείων που έχουν την ίδια τιή 8
απόχωσης για κάθε απόχωση. Η κατανοή αυτή λέγεται ιστόγαα των αποχώσεων της εικόνας και δίνεται αθηατικά απο την σχέση h( ) (.3.) I ( j, k ) όπου,,..g-, G το πλήθος των αποχώσεων, j,...,j-, k,...,k-, J το πλήθος των γαών, K το πλήθος των στηλών της εικόνας, I(j,k) η τιή της φωτεινότητας στο σηείο (j,k) και h() το πλήθος των εικονοστοιχείων ε απόχωση. Το ιστόγαα δηλαδή ας πληοφοεί πόσα εικονοστοιχεία υπάχουν ε συγκεκιένη τιή απόχωσης. Η συνάτηση H h( ) (.3.) h( ) ( ) G λέγεται κανονικοποιηένο ιστόγαα και δίνει την πιθανότητα ένα τυχαίο εικονοστοιχείο της εικόνας να έχει απόχωση. 9
ΚΕΦΑΛΑΙΟ ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΕ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ. Κέντο βάους αντικειένου. Μία ψηφιακή δυαδική εικόνα ε J γαές και K στήλες παιστάνεται ε έναν πίνακα Ι J K και κάθε στοιχείο Ι jk, j,...,j-, k,...,k- παίνει τιή ηδέν () ή ένα (). Αν η εικόνα αναπαιστά ένα αντικείενο τότε το πλήθος των εικονοστοιχείων του αντικειένου που έχουν τιή δίνεται από την σχέση N J K I jk j k Το κέντο βάους του αντικειένου βίσκεται στην θέση ( j, k) της εικόνας σύφωνα ε τις σχέσεις k j J K j k J K j k N N k I j I jk jk,. Κωδικοποίηση δυαδικής εικόνας κατά ήκος διαδοής Μία δυαδική εικόνα ποεί να κωδικοποιηθεί ε κατάλληλο αλγόιθο ώστε να ελαττωθεί η απαιτούενη ποσότητα πληοφοίας για την αποθήκευση ή την ετάδοσή της και να διευκολυνθεί η αναγνώιση του πειεχοένου της. Ένας τέτοιος αλγόιθος είναι η κωδικοποίηση κατά ήκος διαδοής ( RLE:Run Lenht Ecodin). Σύφωνα ε αυτόν ονοάζουε συστοιχία ία οάδα από διαδοχικά εικονοστοιχεία ε την ίδια τιή (όλα ή όλα ) και το πλήθος των εικονοστοιχείων ως ήκος της συστοιχίας. Διατέχουε κάθε σειά της εικόνας και γάφουε την θέση του πώτου εικονοστοιχείου και το ήκος κάθε
συστοιχίας από ή εναλλακτικά την θέση του πώτου και του τελευταίου εικονοστοιχείου κάθε συστοιχίας. Μία άλλη ποσέγγιση είναι να γάψουε το ήκος των διαδοχικών συστοιχειών από και δεχόενοι ότι η πώτη συστοιχία αποτελείται πάντα από έστω και ηδενικού ήκους. Στο Σχ... που ακολουθεί φαίνεται η κωδικοποίηση των τιών πώτων γαών ιας δυαδικής εικόνας ε τους τόπους που αναφέθηκαν. (,3),(7,) (5,),(9,) (,5),(7,3) (,),(8,9) (5,6),(9,) (,4),(7,9) 3,4,,,5,,, 5,,3, Σχήα....3 Συνδεδεένα στοιχεία. Θεωούε ένα σύνολο S εικονοστοιχείων ιας δυαδικής εικόνας ε την ίδια τιή ( ή ). Δύο εικονοστοιχεία και που ανήκουν στο S ονοάζονται συνδεδεένα όταν υπάχει διαδοή από εικονοστοιχεία του S που οδηγεί από το στο. Ένα σύνολο εικονοστοιχείων λέγεται συνδεδεένο συστατικό (connected component) όταν όλα τα εικονοστοιχεία του είναι εταξύ τους συνδεδένα. Στο ακόλουθο Σχ..3. φαίνεται ένα συνδεδεένο και ένα η συνδεδεένο συστατικό δυαδικής εικόνας.
(α) Συνδεένο συστατικό (β) Μη συνδεδεένο συστατικό Σχήα.3..4 Κωδικοποίηση αλυσίδας. Με την κωδικοποίηση αλυσίδας κωδικοποιούε το πείγαα ενός αντικειένου της εικόνας που είναι συνδεδεένο. Για τον σκοπό αυτό καθοίζουε και κωδικοποιούε της διευθύνσεις που ξεκινούν από το κεντικό εικονοστοιχείο και καταλήγουν στα γειτονικά του σε ια 3 3 γειτονιά. όπως φαίνεται στο Σχ..4. 3 4 5 6 7 Σχήα.4.. Ακολούθως ξεκινώντας από οποιοδήποτε εικονοστοιχείο του εξωτεικού πειγάατος του αντικειένου (συνήθως το πάνω αιστεό εικονοστοιχείο) διατέχουε το πείγαα γάφοντας τον κωδικό της σχετικής διεύθυνσης κάθε εικονοστοιχείου ε το επόενό του. Στο Σχ..4. δείχνεται η εφαογή της κωδικοποίησης αλυσίδας. Εκκίνηση από (,),,,,, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4,, 3,,,,,. Σχήα.4.
.5 Ο ετασχηατισός του Houh Συχνά οι ψηφιακές εικόνες πειέχουν γαές που ανήκουν σε σχήατα, τεχνικά σχέδια, γαφήατα, σειές κειένου ή άλλες αναπααστάσεις. Σε πολλές εφαογές είναι επιθυητή η εύεση της θέσης και η αναγνώιση της οφής των γαών (π.χ. ευθύγαα τήατα, τόξα). Τέτοιες εφαογές είναι: η διανυσατική κωδικοποίηση τυπωένων τεχνικών σχεδίων που ψηφιοποιήθηκαν από σαωτές (scanners), η εύεση πειοχών κειένου σε έγγαφα, ο ποσδιοισός της υφής, βιοηχανικές εφαογές κατασκευών και οποτικής κ.α. Ο ετασχηατισός του Houh (HT: Houh Transform) καταδεικνύει την ύπαξη ευθειών σε ια εικόνα και αποτελεί την βάση πολλών τεχνικών για τον ποσδιοισό ευθυγάων τηάτων, καπυλών και οφών που αναλύονται ανάλογα. Ο HT ποτάθηκε από τον Paul Houh το 96 ως έος της κατασκευής ιας συσκευής ανίχνευσης της κίνησης σωατιδίων υψηλής ενέγειας και στόχευε στην αυτοατοποίηση και αντικατάσταση της οπτικής διαδικασίας που απαιτούσε πολλές ανθωποώες. Ο αχικός αλγόιθος εξελίχθηκε και η σηεινή διατύπωση του είναι η ακόλουθη. Κάθε ευθεία (ε) του κατεσιανού επιπέδου Π xy πειγάφεται από την πολική της εξίσωση x συνθ y ηθ όπου (x,y) σηείο της ευθείας και, θ οι πολικές της παάετοι (Σχ..5.(α)). y (ε) A Μ(θ,) Ο θ (α) x Σχ..5. θ (β) 3
y ε ε ε ν K max max φ x φ-π/ φ φπ/ (α) Σχήα.5.. (β) Το είναι το ήκος του ευθύγαου τήατος ΟΑ, ( ε) 4 ΟΑ και θ η γωνία που σχηατίζει το ΟΑ ε τον άξονα Οχ. Ισχύει ότι και π θ < π. Θεωούε το επίπεδο Π θ όπου στον κάθετο άξονα σηειώνουε τις τιές του και στον οιζόντιο τις τιές του θ. Οι πολικές παάετοι (θ,) της ευθείας (ε) καθοίζουν ένα σηείο Μ(θ,) στο επίπεδο Π θ (Σχ..5..(β)) Με τον τόπο αυτό η ευθεία (ε) του επιπέδου Π xy αντιστοιχίζεται (ετασχηατίζεται) ε την χήση της πολικής της εξίσωσης σε ένα σηείο του επιπέδου Π θ. Ισοδύναα κάθε σηείο Μ(θ,) του επιπέδου Π θ οίζει ια ευθεία ε xcosθ yηθ στο επίπεδο Π xy. Από ένα σηείο Κ(x κ,y κ ) του επιπέδου Π xy διέχονται άπειες ευθείες (ε ν ), ν, που ικανοποιούν την σχέση ν x κ συνθ ν y κ ηθ ν (Σχ..5.(α)). Οι τιές ν και θ ν των εταβλητών και θ ανήκουν στην καπύλη x κ συνθ y κ ηθ του επιπέδου Π θ. Η καπύλη είναι ηιτονοειδής (Σχ..5.(β)), όπως δείχνεται ακολούθως. Έστω φ η γωνία χοκ. Ισχύει ότι y κ π εφφ x κ yκσφφ yκεφ( φ) x κ π η( φ) y κ συνθ yκηθ π συν( φ) yκ π η( θ φ) ηφ Αν x κ και y κ είναι θετικά ( ο τετατηόιο) και επειδή έπεται ότι
π φ (α) π π φ θ φ, (β) η εγαλύτεη τιή του ποκύπτει για θφ και είναι x y (γ) max κ κ Ο αναλυτικός υπολογισός όλων των δυνατών τιών των και θ των ευθειών που οίζουν ανά δύο τα σηεία της εικόνας και η εύεση κοινών τιών είναι επίπονος και πακτικά ασύφοος. Για αυτό ακολουθούε το ακόλουθο σκεπτικό. Έστω τία τουλάχιστον συνευθειακά σηεία στο επίπεδο Π xy ε τις αντίστοιχες καπύλες των ευθειών που διέχονται από αυτά (Σχ..5.3(α)). Οι καπύλες αυτές τένονται σε σηείο Μ ε (θ ε, ε ) ε θ ε και ε τις πολικές πααέτους της ευθείας που διέχεται από αυτά (Σχ..5.3(β)). Άα αν κατασκευάσουε τις καπύλες του επιπέδου Π θ για όλα τα σηεία του επιπέδου Π xy τα σηεία τοής τους έχουν συντεταγένες τις πολικές πααέτους των ευθειών που οίζουν τα σηεία αυτά. Ποφανώς, όσες καπύλες διέχονται από ένα σηείο τοής στο Π θ, τόσα σηεία του Π xy ανήκουν στην ευθεία που οίζεται από το σηείο τοής. y (,) (ε) (,.5) O(,) τοξεφ() (,) x Σχ..5.(α). 5
Πογαατιστικά και υπολογιστικά η έθοδος ποεί να εφαοσθεί ε τεχνικές όπως η ακόλουθη. Οίζεται ένας δισδιάστατος πίνακα H Μ Χ Ν που κβαντίζει το επίπεδο Π θ σε Μ γαές και Ν στήλες ε ηδενικές αχικές τιές. Η ψηφιακή εικόνα ε πίνακα Ι J x K τοποθετείται στο ο τετατηόιο. Οι συντεταγένες ενός εικονοστοιχείου P(k,j) ε I(k,j) θα είναι x P k, y P J-j. Επειδή η εικόνα βίσκεται στο ο τετατηόιο το διάστηα εταβολής της γωνίας θ ποεί να παίνει τιές από π/ έως π. Με βήα 3π Δθ Ν κάθε δείκτης ν,,ν αντιστοιχίζεται στο διάστηα [θ ν, θνδθ), θ ν -π/(ν-)δθ. Με βήα Κ J Δ M κάθε δείκτης,,μ αντιστοιχίζεται στο διάστηα [(-)Δ, Δ). Για εκείνα τα ν που ισχύει π Σχ..5.(β). π yp φ, φ τοξεφ( ) x φ θν P 6
υπολογίζεται η τιή x P συνθ ν y P ηθ ν και ο δείκτης του διαστήατος που ανήκει το. Η τιή Η(,ν) αυξάνεται κατά ένα. Η διαδικασία επαναλαβάνεται για όλα τα εικονοστοιχεία της εικόνας. Μετά το τέλος της διαδικασίας οι υψηλές τιές του πίνακα Η ποσδιοίζουν τις πολικές πααέτους ευθειών της εικόνας. Συγκεκιένα αν Η(,ν) έχει υψηλή τιή ισχύει ότι Δθ π Δθ θ θν νδθ, Δ Δ Δ 7
ΚΕΦΑΛΑΙΟ 3 ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΕ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ 3. Βελτίωση εικόνων. 3.. Εξοάλυνση Με κατάλληλες τεχνικές είναι δυνατή η βελτίωση της οπτικής εφάνισης ιας εικόνας ώστε να είναι καλύτεα αντιληπτή από τον άνθωπο ή κατάλληλη για πεαιτέω επεξεγασία. Συχνά στις εικόνες εφανίζονται ικοκουκίδες που οφείλονται σε τυχαίους παάγοντες (θόυβος). Το φίλτο της έσης τιής (median filter) είναι ια απλή τεχνική εξάλειψης και εξοάλυνσης του θούβου αυτού από ψηφιακές εικόνες αποχώσεων του γκι. Σύφωνα ε την τεχνική αυτή από την αχική εικόνα Ι παάγεται ία νέα εικόνα Ι ιδίων διαστάσεων κάθε εικονοστοιχείο (j,k) της οποίας έχει φωτεινότητα Ι (j,k) που είναι η έση τιή των τιών φωτεινότητας ιας γειτονιάς του εικονοστοιχείου (j,k) της εικόνας Ι. Αν για παάδειγα κάθε πειοχή S είναι 3 3 τότε το Ι (j c,k c ) δίνεται από την σχέση M N I j m, k n m n I jk (3...) 9 Με άλλα λόγια η εικόνα Ι είναι το αποτέλεσα του φιλταίσατος της αχικής εικόνας Ι ε την άσκα W. 9 8
Ειναι δυνατόν να χησιοποιηθούν και άλλες άσκες για την εξοάλυνση ιας εικόνας όπως για παάδειγα η W 6 4. Μάσκες 5 5 ή εγαλύτεες εξοαλύνουν ακόα πεισσότεο την εικόνα. Η άσκα W G, Ν x Ν ε συντελεστές που δίνονται από τις σχέσεις w ε G ( j, k) ( N ) / G( j, k) ( N ) / j k ( N ) / ( N ) / j k σ ( j, k) e G( j, k) G πσ λέγεται άσκα Gauss ή φίλτο Gauss (Gaussian filter) και χησιοποιείται ευέως για την εξοάλυνση της εικόνας. Οι τιές της για Ν3 και σ, είναι.75.38.75.38.4.38.75.38.75 Οι άσκες που πειγάψαε αποτελούν γαικά συστήατα που λειτουγούν ως κατωδιαβατά φίλτα. Ως εκ τούτου επηεάζουν τις τιές των πειοχών της εικόνας που εφανίζονται απότοες εταβολές τους (ακές). Μια άλλη έθοδος εξοάλυνσης είναι το φίλτο της ενδιάεσης τιής. Σύφωνα ε την τεχνική αυτή οι τιές των εικονοστοιχείων ιας γειτονιάς ταξινοούνται και η τιή του εικοστοιχείου Ι (j,k) είναι η εσαία από τις τιές των εικονοστοιχείων της γειτονιάς του Ι(j,k). Στο Σχ.3.. που ακολουθεί φαίνονται οι τιές που ποκύπτουν από την εξοάλυνση ενός έους ιας εικόνας α) ε το φίλτο της έσης τιής και β) ε το φίλτο της ενδιάεσης τιής. 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 9
5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 Τιές φωτεινότητας της αχικής εικόνας. 5 5 5 5 5 5 5 8 94 5 73 5 5 6 56 86 3 5 5 89 56 86 47 5 5 94 5 9 5 5 7 84 7 89 5 5 3 6 6 5 5 5 5 5 5 5 Οι τιές φωτεινότητας ετά από εξοάλυνση ε το φίλτο της έσης τιής. 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 Οι τιές φωτεινότητας ετά από εξοάλυνση ε το φίλτο της ενδιάεσης τιής. Σχήα 3...
Με την εξοάλυνση γενικά αβλύνονται οι ακές της εικόνας. Το φίλτο της έσης τιής αποακύνει τον θόυβο χωίς να επηεάσει ιδιαίτεα τις ακές της εικόνας. Το φίλτο της ενδιάεσης τιής αποακύνει τον θόυβο και εξοαλύνει τις ακές της εικόνας. 3... Εξισοόπηση του ιστογάατος Η διάκιση γειτονικών πειοχών σε εικόνες αποχώσεων του γκι, είναι δύσκολη όταν η διαφοά τιών των αποχώσεων είναι ική. Η αύξηση των χωατικών αντιθέσεων ιας εικόνας διευκολύνει την διάκιση των πειοχών αυτών. Μια τεχνική για την επίτευξη αυτού του σκοπού είναι η εξισοόπηση του ιστογάατος της εικόνας (Historam equalization). Σύφωνα ε αυτήν οι τιές των αποχώσεων των εικονοστοιχείων εταβάλλονται έτσι ώστε να αυξηθεί η αντίθεση εταξύ των πειοχών ε διαδοχικές τιές αποχώσεων ανάλογα ε το ποσοστό του πλήθους των εικονοστοιχείων τους. Συγκεκιένα, αν G είναι το πλήθος όλων των αποχώσεων της παλέτας του γκι, h() το κανονικοποιηένο ιστόγαα της αχικής εικόνας Ι KXJ,,,,G- και P() η συνάτηση αθοιστικής πιθανότητας του, ποκύπτει ία νέα εικόνα Ι ίδιων διαστάσεων ε τη Ι, κάθε εικονοστοιχείο (k,j) της οποίας έχει απόχωση I (k,j) [(G-)P(I(k,j)]. Με άλλα λόγια κάθε τιής ιας απόχωση της αχικής εικόνας αντικαθίσταται από ια τιή [(G-)P()]. Υπενθυίζεται ότι για την P() ισχύουν οι σχέσεις P( ) h( i) άα και P() P(-) h(). (3...) i Παάδειγα: Έστω ο ακόλουθος πίνακας τιών των αποχώσεων του γκι ιας ψηφιοποιηένης εικόνας: 4 4 4 4 4 5 5 5 5 6 7 7 7 Οι αποχώσεις ποκύπτουν σύφωνα ε τους ακόλουθους υπολογισούς: H() h() P() /5 /5 55*/5 34 4 5 5/5 7/5 55*7/5 9 5 4 4/5 /5 55*/5 87 6 /5 /5 55*/5 4 7 3 3/5 5/5 55*5/5 55
Στο Σχ.3... δείχνονται τα ιστογάατα h() και h( ). 6 6 5 5 4 4 3 3 6 3 46 6 76 9 6 36 5 66 8 96 6 4 6 3 46 6 76 9 6 36 5 66 8 96 6 4 Το ιστόγαα h() Σχήα 3... Το ιστόγαα h( ) Στο Σχ.3... φαίνεται η εφαογή της εξισοόπησης του ιστογάατος στην εικόνα ε τις πιπειές Σχήα 3...
3. Κατωφλίωση Συχνά τα εικονοστοιχεία ενός αντικειένου ιας εικόνας παίνουν τιές σε ένα ικό διάστηα αποχώσεων. Αυτό οδηγεί συνήθως στη δηιουγία ενός τοπικού έγιστου στην πειοχή του ιστογάατος της εικόνας. Η εύεση τέτοιων τοπικών εγίστων διευκολύνει τον εντοπισό των αντικειένων της εικόνας και την απόδοσή της ε λιγότεες κύιες αποχώσεις. Παακάτω θα πειγάψουε διάφοες τεχνικές για τον καθοισό τιών του πεδίου των αποχώσεων εταξύ των οποίων εφανίζονται τοπικά έγιστα του ιστογάατος. Οι τιές αυτές λέγονται κατώφλια. Για την ετατοπή ιας εικόνας αποχώσεων του γκι σε δυαδική είναι επιθυητός ο ποσδιοισός των κύιων αποχώσεών της. Με τον τόπο αυτό οι αποχώσεις της εικόνας χωίζονται σε κλάσεις C, C που κάθε ια αποτελείται από τις αποχώσεις που βίσκονται πιο κοντά σε ια από τις κύιες αποχώσεις. Ο διαχωισός αυτός ισοδυναεί ε την εύεση ιας τιής κατωφλιού Τ για την οποία θα ισχύει C C αν αν T < T (3..) Ακολούθως από την αχική εικόνα I ποκύπτει η δυαδική εικόνα I κάθε εικονοστοιχείο της οποίας δίνεται από τη σχέση I jk αν αν I jk I jk C C ( ( I jk I jk < T) T) 3.. Κατωφλίωση ε βάση τη διασποά (3..) Μια έθοδος για την εύεση της τιής κατωφλίου Τ είναι η έθοδος του Οtsu. Σύφωνα ε αυτήν η τιή Τ πέπει να είναι τέτοια ώστε η συνολική εσωτεική διασποά σ w εντός των κλάσεων να είναι ελάχιστη και η συνολική διασποά σ b εταξύ των κλάσεων έγιστη. Σύφωνα ε την έθοδο δηιουγούε το κανονικοποιηένο ιστόγαα h() της εικόνας). Η συνάτηση h() δίνει την πιθανότητα να έχει ένα τυχαίο εικονοστοιχείο της εικόνας απόχωση. 3
Έστω Τ ια τιή κατωφλιού που διαχωίζει τις αποχώσεις σε δύο κλάσεις C (<T) και C (T ). Η πιθανότητα ένα τυχαίο εικονοστοιχείο να έχει απόχωση της κλάσεως C είναι p και δίνεται από τη σχέση T p h( ) (3...) όοια για την κλάση C είναι p και δίνεται από τη σχέση G p h( ) (3...) T Είναι ποφανές ότι ισχύει p p. (3...3) Η έση τιή της πώτης κλάσης είναι T h( ) p (3...4) Η έση τιή της δεύτεης κλάσης είναι και ισούται ε Η συνολική έση τιή δίνεται από τη σχέση G h( ) T (3...5) p G h( ) (3...6) Από τις τείς ποηγούενες σχέσεις εύκολα αποδεικνύεται η σχέση p p (3...7) Η διασποά της πώτης κλάσης δίνεται από τη σχέση σ (3...8) Τ ( ) h( ) P και η διασποά της δεύτεης κλάσης είναι H συνολική διασποά σ είναι G ( ) H ( ) P T σ (3...9) G σ ( ) h( ) (3...) Η συνολική εσωτεική διασποά των κλάσεων οίζεται από τη σχέση 4
σ w pσ p σ (3...) Η συνολική διασποά εταξύ των κλάσεων οίζεται από τη σχέση σ b p( ) p ( ) p p ( ) (3...) Αναζητούε τώα την κατάλληλη τιή του Τ ώστε η σ w να είναι ελάχιστη και σ b έγιστη. Πος τούτο θεωούε το πηλίκο σ λ (3...3) σ και ζητάε την τιή του Τ για την οποία το λ εγιστοποιείται. Για να ειωθούν οι υπολογισοί θεωούε τις σχέσεις b w λ σ b λ σ w σ b λ σ λ σ σ σ w σ b b (3...4) H σχέση σ σ w σ b αποδεικνύεται στο παάτηα Α. Επειδή το σ είναι ανεξάτητο του Τ και η συνάτηση λ/(λ) είναι αύξουσα συνεπάγεται πως για να είναι το λ έγιστο ακεί να είναι το σ b έγιστο. Με τον τόπο αυτό η τελικά η κατάλληλη τιή του κατωφλίου Τ είναι εκείνη που εγιστοποιεί την ποσότητα p ( ) σ b (3...5) p ΠΑΡΑΔΕΙΓΜΑ 3... Δίνεται ο πίνακας ψηφιακής εικόνας αποχώσεων του γκι. Ποια η τιή κατωφλίωσης της ε τη έθοδο της διασποάς; 88 88 88 88 88 ΛΥΣΗ: 5
H() h() 88 5..4.8 8.3 88 5 8 4.8 5 T ( ) σ b 88 88, 936 (88 5,)/,696,4,6,6 384 (88 5, )/,688,4,6,,68 4894 Η έγιστη τιή του σ b ποκύπτει για Τ που αποτελεί σύφωνα ε τη έθοδο η καλλίτεη τιή για την κατωφλίωση 3... Κατωφλίωση ε βάση την εντοπία Μια διαφοετική ποσέγγιση για την εύεση κατάλληλης τιής κατωφλίου Τ βασίζεται στην έννοια της εντοπίας. Σύφωνα ε την εκδοχή που παουσίασε ο Kapur, η τιή Τ χωίζει το κανονικοποιηένο ιστόγαα h() σε δυο κλάσεις c και c. Η πώτη κλάση ποεί να θεωηθεί ως πηγή πληοφοίας ε σύβολα, Τ- και αντίστοιχες πιθανότητες όπου h() () (3...) Ρ T Ρ h() (3...) Η έση πληοφοία (εντοπία) που ποκύπτει της c είναι T T h() h() E lo( ) lo( Ρ ) h() lo(h()) (3...3) Ρ Ρ Ρ Όοια η έση πληοφοία που ποκύπτει από την c είναι 55 h() h() Ε lo, Ρ Ρ T Ρ Ρ 55 lo( Ρ ) h() lo(h()) Ρ Ρ (3...4) 6
Ζητείται η πώτη κλάση που θα αντιστοιχηθεί στην τιή και η δεύτεη που θα αντιστοιχηθεί στο να ποσφέουν συνολικά την εγαλύτεη δυνατή έση πληοφοία. Δηλαδή η ζητούενη τιή του κατωφλίου Τα είναι εκείνη για την οποία Ε (Τ)Ε (Τ) γίνεται έγιστο. 3..3. Πολυκατωφλίωση ε χήση νευωνικού δικτύου Εάν κάθε αντικείενο της εικόνας αποτελείται από ία κύια και κάποιες πααπλήσιες αποχώσεις του γκι, τότε δηιουγείται η συσσώευση των τιών του ιστογάατος σε συγκεκιένες πειοχές. Η επιλογή πολλαπλών κατωφλίων ποεί να θεωηθεί ως ένα πόβληα εύεσης τιών T( k ), k,,...,j ε σκοπό το ετασχηατισό της αχικής εικόνας ε L αποχώσεις του γκι σε ια νέα ε J αποχώσεις. Ειδικότεα για T()<T()< <T(J-), τότε η νέα εικόνα οίζεται ως G( ) αν f( x, y) T( ) G( ) αν T( ) < f( x, y) T( ) I( x, y). (3..3.). G( J ) αν T( J ) < f( x, y) όπου G ία συνάτηση τιών των επιπέδων του γκι. Μία τεχνική πολλαπλών κατωφλίων που βασίζεται στο ιστόγαα πέπει να πετυχαίνει έναν ικανοποιητικό διαχωισό των διαφόων πειοχών του ιστογάατος. Οι έθοδοι της διασποάς και της εντοπίας είναι δυνατόν να εφαοσθούν και στην επίλυση του ποβλήατος της πολυκατωφλίωσης, έχουν όως εγάλο υπολογιστικό κόστος. Μία αποτελεσατική ποσέγγιση είναι να θεωήσουε την εύεση πολλαπλών κατωφλίων ως πόβληα εύεσης κλάσεων (clusterin problem). Ένα κατάλληλο νευωνικό δίκτυο ποεί να λύσει αποτελεσατικά ποβλήατα εύεσης κλάσεων. Είναι γνωστό ότι ο κύιος σκοπός ενός νευωνικού δικτύου Kohonen για την δηιουγία ενός αυτόογανούενου πίνακα απεικόνισης χαακτηιστικών (SOFM: Self Oranized Feature Map) είναι η αντιποσώπευση ενός πολυπληθούς συνόλου διανυσάτων εισόδου ε ένα ολιγοελέστεο σύνολο πωτοτύπων ανυσάτων ώστε να επιτευχθεί ια καλή ποσέγγιση του αχικού χώου εισόδου που να ικανοποιεί τα κύια στατιστικά χαακτηιστικά του. Θεωούε ένα δίκτυο ε νευώνες (κόβους) όπως στο Σχ.3..3. 7
w w I x w j- y w j- I(x,y) w j w j Γειτονιά του j νευώνα για d(t) w j w J- Σχήα 3..3. Συγκοτείται το σύνολο εκπαίδευσης του ΑΠΑΧ από τις τιές των αποχώσεων των εικονοστοιχείων της εικόνας. Θεωούε τη εταβλητή επανάληψης t που παίνει ακέαιες τιές από έχι ία ποκαθοισένη τελική τιή Τ (π.χ. Τ.). Θεωούε τη εταβλητή του υθού εκάθησης α(t). Θεωούε το ήκος d(t) που οίζει ια υποπειοχή (γειτονιά) στην διάταξη των νευώνων. Έστω w j το βάος της σύναψης εταξύ του j νευώνα του επιπέδου ανταγωνισού και της εισόδου του. Εκτελούνται τα παακάτω βήατα: Βήα. Αχικοποιούνται (t) τα βάη των συνάψεων w j () ε τυχαίες τιές από 55. Βήα. Αχικοποιείται η α() ε ια εγάλη τιή, συνήθως εταξύ. και.5. Βήα 3. Αχικοποιείται η d() ε την τιή J/, που είναι ίση ε το ισό του εύους του κανάβου. 8
Βήα 4. Επιλέγεται τιή απόχωσης Ι(x,y) ενός τυχαίου εικονοστοιχείου από το σύνολο εκπαίδευσης. Βήα 5. Υπολογίζεται η έξοδος o j (t) κάθε νευώνα από τη σχέση o ( t) I( x, y) w ( t). (3..3.) j j Βήα 6. Ο νευώνας c ανακηύσσεται νικητής εάν ικανοποιείται η συνθήκη o c (t) min{o ξ (t)}. (3..3.3) Εάν οι έξοδοι δύο νευώνων είναι ίσες, τότε κατά σύβαση επιλέγεται αυτός ε το ικότεο δείκτη. Βήα 7. Tα βάη w j των συνάψεων ανανεώνονται σύφωνα ε τις παακάτω σχέσεις Δw j α(t) (I( x, y) w j ( t)) αν αν j Nc j Ν c (3..3.4) w j (t)w j (t)δw j (t) (3..3.5) όπου N c το σύνολο των δεικτών των νευώνων που βίσκονται έσα στην γειτονιά του νικητή νευώνα και πλευά d(t). Βήα 8. Αυξάνεται η εταβλητή επανάληψης κατά ένα και αποδίδονται νέες τιές στις εταβλητές α(t), d(t) σύφωνα ε τις σχέσεις: t at ( ) a( )( ) (3..3.6) T t d( t) d( )( ) (3..3.7) T Τα βήατα 4 έως 8 επαναλαβάνονται έως ότου η εταβλητή t πάει τη έγιστη τελική τιή Τ. Είναι φανεό πως οι εταβλητές α(t) και d(t) συγκλίνουν στο ηδέν καθώς η t τείνει στην τιή Τ. Μετά την εκπαίδευση κάθε άνυσα εισόδου του ΑΠΑΧ αποδίδεται στον νικητή νευώνα. Κάθε νευώνας του επιπέδου εξόδου αντιποσωπεύει ία οάδα ποτύπων (cluster). Πότυπα ε εγάλη οοιότητα αντιποσωπεύονται από τον ίδιο νευώνα. Ο χάτης χαακτηιστικών του Kohonen ογανώνει τους νευώνες του επιπέδου ανταγωνισού ε τέτοιο τόπο ώστε οι οοιότητες εταξύ των ποτύπων να απεικονίζονται ε σχέσεις γειτνίασης επάνω στον κάναβο του επιπέδου ανταγωνισού Στο Σχ. 3..3. φαίνεται η αχική εικόνα στην οποία θα εφαοσθεί πολυκατωφλίωση και στο Σχ. 3..3.. 9
Σχήα 3..3.. h(l) 7 33 49 65 8 97 3 9 45 6 77 93 9 5 4 l Σχήα 3..3.. Το ιστόγαα της εικόνας του Σχ. 3..3.. 3
Μετά την εκπαίδευση ενός ΝΔ Kohonen για την πολυκατωφλίωση των νευώνων ποκύπτουν οι τιές των βαών που αναγάφονται στον Πιν. 3..3. και οι τιές των κατωφλίων του Πιν.3..3.. Οι τιές αυτές αποτελούν ουσιαστικά ένα ικότεο πλήθος αποχώσεων για την απόδοση της αχικής εικόνας. W w W w 3 W 4 W 5 W 6 w 7 69 53 8 3 4 46 Πίνακας 3..3.: Οι τιές των συντελεστών του ΝΔ ετά την εκπαίδευση. T T T T 3 T 4 T 5 T 6 9 3 76 9 4 35 43 Πίνακας 3..3.. Οι τιές των κατωφλίων. Στον Πιν. 3..3.3 φαίνονται οι τιές των κατωφλίων για διαφοετικό πλήθος (J) νευώνων του νευωνικού δικτύου J T T T T 3 T 4 64 3 5 7 4 6 79 9 5 6 78 4 37 6 97 43 9 5 39 Πίνακας 3..3.3. Οι τιές των κατωφλίων για J,,6. 3
h (w j ) h (w ) j w j t t t w j J J3 h (w j ) h (w j ) w j t t t w j t t t t 3 J4 J5 Σχήα 3..3.3. Τα ιστογάατα και οι αντίστοιχες τιές κατωφλίων για διαφοετικές τιές του J.
Πλήθος αποχώσεων Πλήθος αποχώσεων 3 Πλήθος αποχώσεων 3 Πλήθος αποχώσεων 4 Σχήα 3..3.4:Οι εικόνες που ποέκυψαν από την πολυκατωφλίωση της εικόνας του Σχ.3..3. για διαφοετικό πλήθος κατωφλίων και αποχώσεων. 34
Η βέλτιστη τιή του J για ένα δεδοένο σύνολο τιών {,,J max } ελαχιστοποιεί το σφάλα ποσαογής εταξύ των συνατήσεων H( l ) και H J ( l ). Η συνάτηση H( l ) υπολογίζεται από τη σχέση h( l ) H( l ) L (3..3.8) h( l ) l L και είναι συνάτηση πυκνότητας πιθανότητας επειδή H( l ). l Η πιθανότητα f j εφάνισης της κλάσης C j, η έση τιή j της κλάσης και η διασποά της σ j δίνονται αντίστοιχα από τις σχέσεις f j Pr ( C j) h( l ) (3..3.9) C j j C j C j lh( l) h( l) (3..3.) ( l ) j h( l) C j σ j (3..3.) h( l) C j Η συνάτηση ποσαογής H J ( l ) είναι το άθοισα H J J ( ) f j H j( l ) j l (3..3.) όπου ( l j) h j ( l ) exp (3..3.3) σ j π σ j Μποεί να δειχθεί εύκολα ότι η h (l) είναι επίσης συνάτηση πυκνότητας πιθανότητας. Το σφάλα ποσαογής J e J για ένα πλήθος κλάσεων J οίζεται ως e L J h J l [ h( ) ( l) ] l (3..3.4) 35
και υπολογίζεται για J,,J max. Η τιή J o είναι βέλτιστη όταν το αντίστοιχο σφάλα ποσαογής e J o ικανοποιεί τη συνθήκη e J o minimum{ e J } (3..3.5) Ο Πίν. 3..3.3 δείχνει τις τιές του e J για J,,6. Η ικότεη από αυτές τις τιές ποκύπτει για J3 και θεωείται ότι είναι η βέλτιστη τιή J o. Όπως ποεί να παατηηθεί από το ιστόγαα h( l ) (Σχ. 3..3.3), αυτή η τιή είναι κατάλληλη επειδή αντιστοιχεί στο πλήθος των σηαντικών υψωάτων του ιστογάατος. 3.3 Κωδικοποίηση εικόνων αποχώσεων του γκι Για την αναπαάσταση ια ψηφιακής εικόνας J γαών και Κ στηλών ε βάθος χώατος (bit) Β bits απαιτούνται J K B bits. H κωδικοποίηση ιας συγκεκιένης ψηφιακής εικόνας ε τέτοιο τόπο δεν είναι η πλέον κατάλληλη όταν ενδιαφέει το πλήθος των bits που δαπανώνται. Αυτό συχνά συβαίνει σε πειπτώσεις ετάδοσης ή αποθήκευσης της εικόνας. Με τον όο συπίεση της εικόνας αναφεόαστε σε ένα πλήθος τεχνικών που στοχεύουν στην είωση του πλήθους των bits που απαιτούνται για την κωδικοποίηση της εικόνας. Οι τεχνικές αυτές διακίνονται σ αυτές που επιτέπουν απώλεια πληοφοίας και αυτές που δεν επιτέπουν. Στην πώτη πείπτωση η πληοφοία που χάνεται δεν θα πέπει να είναι ζωτικής σηασίας για τον παατηητή της εικόνας. Ακολούθως θα πειγαφούν αλγόιθοι συπίεσης ψηφιακών εικόνων αποχώσεων του γκι. 3.3. Κωδικοποίηση Huffman Σύφωνα ε την τεχνική αυτή κωδικοποιούε τις αποχώσεις του γκί ιας συγκεκιένης εικόνας ε κωδικές λέξεις εταβλητού ήκους. Μια απόχωση που εφανίζεται συχνά (ε εγάλη πιθανότητα) στην εικόνα κωδικοποιείται ε λέξη ήκους ικότεου από άλλες αποχώσεις που εφανίζονται σπανιότεα. Το κανονικοποιηένο ιστόγαα h() των αποχώσεων της ψηφιακής εικόνας παέχει τις τιές της πιθανότητας εφάνισης p() των τιών της εταβλητής των αποχώσεων της εικόνας διότι p()h(). Αν l() είναι το ήκος της κωδικής λέξης της απόχωσης και G το πλήθος των αποχώσεων, τότε το έσο ήκος του κώδικα που απαιτείται για την εικόνα είναι 36
G G l p( ) l( ) h( ) l( ) (3.3..) Ένας κατάλληλος ευκινής, ονοσήαντος και στιγιαία αποκωδικοποιήσιος κώδικας που ελαχιστοποιεί το έσο ήκος είναι ο κώδικας Huffman. Αν η εικόνα κωδικοποιηθεί σύφωνα ε αυτόν η τιή του σύφωνα ε την θεωία της πληοφοίας θα ικανοποιεί τη σχέση H ( G) l H ( G) (3.3..) Όπου Η(G) η εντοπία της εικόνας αν την θεωήσουε ως πηγή πληοφοίας που δίνεται από την σχέση G G H ( G) p( )lo p( ) h( )lo h( ) (3.3..3) Ο εύεση του κώδικα Huffman για ια συγκεκιένη εικόνα γίνεται ε την δηιουγία ενός δυαδικού δένδου. Τα φύλλα του δένδου είναι οι τιές των αποχώσεων ε τις αντίστοιχες πιθανότητες εφάνισης τους στην εικόνα. Τα φύλλα συνενώνονται σε δυαδικούς κόβους. Σε κάθε κόβο αντιστοιχίζεται το άθοισα των πιθανοτήτων εφάνισης των παιδιών του. Ο πώτος κόβος δηιουγείται από τη συνένωση των δύο αποχώσεων (φύλλα) ε τις ικότεες πιθανότητες. Κάθε επόενος κόβος έχει δύο παιδιά που επιλέγονται από φύλλα ή διαθέσιους κόβους που δεν ενώθηκαν και έχουν τις ικότεες πιθανότητες εφάνισης.. Στο ακόλουθο παάδειγα παουσιάζεται εφαογή της κωδικοποίησης σε ια εικόνα αποχώσεων του γκι διαστάσεων 4 5. 5 5 5 5 5 5 8 8 8 8 8 37
G H() h().4.4 5.8 8 4.6 7.8 5 5. 5. 5.8.4.6.3.6 G 5 8 5 Κωδικός Για την εικόνα του πααδείγατος απαιτούνται 5 5 44 37 5 5 54 bits αντί των 5 375 bits που απαιτούνται για κωδικές λέξεις σταθεού ήκους τιών bits (3[lo 7]). Το έσος ήκος κωδικολέξης l 54 / 5. 6 και το ποσοστό συπίεσης είναι (75-54)/75%8% 3.3. Κωδικοποίηση LZW Με την τεχνική LZW (Lebel Ziv Welch) επιδιώκεται η κωδικοποίηση ακολουθιών από διαδοχικές τιές εικονοστοιχείων. Πος τούτο για συγκεκιένη εικόνα δηιουγείται ένα ευετήιο των ακολουθιών και των κωδικών τους. Για παάδειγα αν η ακολουθία τιών - 3-3 ( Χ 8 4 bits) κωδικοποιηθεί ε τον κωδικό 4 (9 bits) και επαναλαβάνεται 3 φοές στην εικόνα υπάχει ένα όφελος 3 Χ 5 45 bits. Συνήθως στο ευετήιο έχουν τοποθετηθεί ήδη οι 56 τιές των αποχώσεων του γκι στις θέσεις-κωδικούς από -55. Η εικόνα ποσπελαύνεται από πάνω πος τα κάτω και από αιστεά πος τα δεξιά. Εάν ία ακολουθία τιών διαδοχικών εικονοστοιχείων υπάχει στο ευετήιο αυτή αυξάνεται ε την τιή του επόενου εικονοστοιχείου και η νέα ακολουθία αναζητάται στο ευετήιο. Αν ία ακολουθία ε Ν τιές δεν βεθεί στο ευετήιο, τότε αυτή καταχωείται α αυτό και στην έξοδο του κωδικοποιητή τίθεται ο κωδικός της ακολουθίας των πώτων N- τιών. Στο παακάτω παάδειγα φαίνεται η πααπάνω διαδικασία για ια ική εικόνα 4Χ4. 38
3 3 3 3 3 3 3 3 Τιή Έξοδος Ευετήιο Ακολουθία τιών επόενου κωδικοποιητή εικ/χείου Κωδικός Ακολουθία 56: 3 57: 3 3 3 3 58: 3 3 3 3 59: 3 3 56 6: 3 3 3 3 3 58 6: 3 3 3 3 3 6 6: 3 3 3 3 59 63: 3 3 3 3 57 64: 3 3 3 3 Είναι σηαντικό να αναφέουε ότι κατά την αποκωδικόποιηση των τιών του συπιεσένου αχείου δεν είναι απααίτητη η γνώση του ευετηίου και ως εκ τούτου δεν είναι αναγκαία η επισύναψή του. Το ευετήιο δηιουγείται στον αποκωδικοποιητή από τις τιές που αποκωδικοποιούνται ε τον ίδιο τόπο που δηιουγήθηκε στην φάση της κωδικοποίησης. Ακολούθως παουσιάζεται η διαδικασία αποκωδικόποιησης των τιών που δηιουγήθηκαν κατά την φάση κωδικοποίησης του ποηγούενου πααδείγατος. 39
Έίσοδος αποκωδικοποιητή Έξοδος κωδικο-ποιητή Ευετήιο Κωδικός Ακολουθία 3 3 3 3 56 56: 57: 3 58: 3 3 58 3 3 6 59: 3 6: 3 3 59 3 57 3 3 3 3.3.3 Κωδικοποίηση Δ-διακιτού ετασχηατισό συνηιτόνου Από όσα αναφέθηκαν ποηγουένως η διαδικασία της κωδικοποίησης σχετιζόταν άεσα ε τις τιές των εικονοστοιχείων της εικόνας. Στην ενότητα αυτή θα δούε τον ετασχηατισό του διδιάστατου ψηφιακού σήατος ε την εύεση των ποβολών του (συντελεστών) σε ία οθοκανονική βάση, πιν ακολουθήσει η διαδικασία κωδικοποίησης Ο διδιάστατος ετασχηατισός συνηιτόνου (D-DCT: Discrete Cosine Transform) αποτελεί την βάση για συπίεση η δυαδικών εικόνων ε αποδεκτή απώλεια πληοφοίας. Η τυποποίηση JPEG βασίζεται στις πώτες εκδόσεις της στον D-DCT. Θα αχίσουε την παουσίαση του ετασχηατισού από την ονοδιάστατη εκδοχή του. Οι σχέσεις π k (3.3.3.) N Ν N ( n), ( n) cos( k(n )) 4
για k..n- και n,..,ν- είναι ένας πυήνας (kernel) δηιουγίας οθοκανονικών διανυσάτων για κάθε τιή του Ν. Οι συντελεστές c k για ένα διακιτό σήα x(n) πεπεασένου ήκους Ν (δηλαδή οι ποβολές του x στα k ) ποκύπτουν από τη σχέση: N c x[n] N, N π c k cos( k (n )) x[n] (3.3.3.) n Ν n N Η σχέση αυτή αποτελεί τον ονοδιάστατο διακιτό ετασχηατισό συνηιτόνου (D-DCT: Discrete Cosine Transform). Οι τιές x(n) (δηλαδή το x) ποκύπτουν από τη σχέση x( n) c π ck cos( k(n )) N Ν N N k (3.3.3.) Η σχέση αυτή αποτελεί τον αντίστοφο διακιτό ετασχηατισό του συνηιτόνου. Στο Σχ. 3.3.3. δείχνονται τα ανύσατα βάσης του DCT για Ν8. Σχήα 3.3.3. 4
Παάδειγα 3.3.3. Για Ν3 τα ανύσατα [ ], [ ], [ ] 3 3 3 6 3 6 ποήλθαν από τις σχέσεις π k για k..n- και n,..,ν- N Ν N ( n), ( n) cos( k(n )) Και αποτελούν ία οθοκανονική βάση και το σήα x[, 3, ] Τ ποβάλλεται σ αυτά ε ποβολές που δίνουν οι συντελεστές c 3, /, 6 /. Για n,, x[n] 3 [ n ] / [ ] n 6 / [ n] c c Παάδειγα 3.3.3. Για x[, 3,, -] Τ η τιή Ν4 και για n,,,3 τα ανύσατα βάσης είναι: [n] Ή [.5,.5,.5,.5] T [n] π cos( (n )) Ν N Ή [.65,.7, -.7, -.65] T π ( n) cos( (n )) N Ή [.5, -.5,.5, -.5] T π 3 ( n) cos( 3 (n )) N Ή 3 [.7, -.65..65, -.7] T Οι συντελεστές c k είναι τα στοιχεία του πίνακα.5.65 C G T x.5.7.5.5.7.7.5.5.65.65.5.65.5 3.7.5.58.5. οι συντελεστές c k ποκύπτουν όοια και από τις (3.3..) Το σήα ανακτάται από τις σχέσεις (3.3..) ή από τον πίνακα 4
.5.5 x G C.5.5.65.7..7.65.5.5.5.5.7.5.65.58.65.5.7. Στο Σχ. 3.3.3. δείχνονται τα ανύσατα βάσης του DCT για Ν4, οι συντελεστές c k του DCT του σήατος x[, 3,, -] και η ανάλυση του στις τέσσεις συνιστώσες c k k. Κάθε τιή του x[n] είναι x[n],5 [n],58 [n]-,5 [n]-, 3 [n]. 3. 43
x[, 3,, ],5 [n] [n],58 [n] [n] -,5 [n] [n] -, 3 [n] 3 [n] Σχήα 3.3.3. 44
45 Για διακιτά σήατα δύο διαστάσεων ε ήκη Ν, Ν τα ανύσατα βάσης για n,..,n -, n,..,n -, k,..,n -, k,..,n - είναι: ) ( ) ( ), ( n n n n k k k k ήτοι (3.3.3.3) Για ένα δισδιάστατο διακιτό σήα x(n,n ) ε ήκη Ν, Ν, οι ποβολές του στα πααπάνω οθοκανονικά ανύσατα βάσης είναι: N n N n ] n, x[n N N c ) N ) (n πk cos( ] n, x[n N N c N n N n k ) N ) (n πk cos( ] n, x[n N N c N n N n k ) N ) (n πk cos( ) N ) (n πk cos( ] n, x[n N N c N n N n k k για k,k. (3.3.3.4) Οι πααπάνω σχέσεις αποτελούν τον δισδιάστατο (Δ) διακιτό ετασχηατισό συνηιτόνου (D-DCT: Discrete Cosine Transform). Το σήα x[n,n ] ανακτάται σύφωνα ε τη σχέση: ), ( ), ( N n N n k k k k n n c n n x (3.3.3.5) που είναι ο αντίστοφος δισδιάστατος (Δ) διακιτός ετασχηατισός συνηιτόνου. ) ) ( πk cos( ) ) ( πk cos( ), ( ), ) ( πk cos( ), ( ), ) ( πk cos( ), (, ), ( k k k k N n N N n N n n N n N N n n N n N N n n N N n n
Είναι ποφανές από τα πααπάνω αν Μ Ν είναι τα εικονοστοιχεία της εικόνας τότε Μ Ν θα είναι και όλοι οι συντελεστές του D-DCT αυτής. Για παάδειγα για ία εικόνα 8 8, ο ετασχηατισός οδηγεί στον υπολογισό 8 8 συντελεστών (ποβολών) για κάθε ία από τις 8 8 διακιτές διδιάστατες ακολουθίες βάσης. Κάθε ακολουθία της βάσης έχει τιές που δίνονται από τις (3.3.3.3) που αν παασταθούν ε τόνους του γκι ποκύπτουν οι εικόνες του Σχ.3.3.3.3. Σχήα 3.3.3.3 Μετασχηατισοί των οποίων η βάση ικανοποιεί την (3.3.3.) λέγονται διαχωίσιοι και οι υπολογισοί τους ποούν να αναχθούν σε υπολογισούς των ονοδιάστατων εκφάσεών τους. Η εφαογή του D-DCT στην συπίεση εικόνων αποχώσεων του γκι σύφωνα ε την τυποποίηση JPEG (Join Photoraphic Experts Group) ακολουθεί τα ακόλουθα γενικά βήατα: Η εικόνα χωίζεται σε η επικαλυπτόενα τήατα 8 8 εικονοστοιχείων. Οι τιές των εικονοστοιχείων ετατέπονται από το διάστηα [, L -] στο διάστηα [- L-, L- -] ε την αφαίεση από κάθε τιή του αιθού L-, όπου L το βάθος χώατος της εικόνας (bits/pel). Για κάθε τήα υπολογίζονται οι συντελεστές του D-DCT. Ακολούθως οι τιές κβαντίζονται και τελικά Κωδικοποιούνται κατά Huffman. Στο Σχ. 3.3.3.4 η αχική εικόνα 56 56 pels χωίζεται σε τήατα των 8 8 pels και σε κάθε ένα από αυτά εφαόζεται ο D-DCT, ακολούθως ε χήση όνο των 8 συντελεστών αναδηιουγείται η εικόνα ε σφάλα όπως φαίνεται στο σχήα. 46
Σχήα 3.3.3.4 47
3.4 Ανίχνευση ακών. Σε ια εικόνα αποχώσεων του γκι υπάχουν πειοχές εικονοστοιχείων ε απότοη αύξηση της φωτεινότητας. Οι πειοχές αυτές βίσκονται στα όια των τηάτων της εικόνας που έχουν σηαντικά διαφοετικές αποχώσεις. Η ανίχνευση των οίων αυτών λέγεται ποσδιοισός των ακών της εικόνας (ede detection). Με άλλα λόγια ακή είναι ια καπύλη επί της εικόνας της οποίας οι δυο πλευές παουσιάζουν σηαντικές διαφοές της φωτεινότητας ή ενδεχοένως και άλλων χαακτηιστικών τους όπως η πυκνότητας και η υφή. Η ανίχνευση ακών είναι ια από τις διαδικασίες ανάλυσης εικόνας που χησιοποιούνται ευύτατα και οι αλγόιθοι που υπάχουν στην βιβλιογαφία για την ανίχνευση και βελτίωση τους είναι ίσως οι πεισσότεοι από αυτούς άλλων διαδικασιών ανάλυσης εικόνας. Μια ακή είναι το όιο ενός εικονιζόενου αντικειένου και του φόντου η το όιο εταξύ επικαλυπτόενων αντικειένων (Σχ. 3.4.). Σχήα 3.4. Αυτό σηαίνει ότι αν βεθούν ε ακίβεια οι ακές σε ια εικόνα τότε θα εντοπισθούν τα αντικείενα της εικόνας και είναι δυνατόν να ποσδιοισθούν χαακτηιστικά όπως το εβαδόν, η πείετος ή το σχήα τους. Η ανίχνευση ακών είναι εξαιετικά χήσιη εγασία στην ανάλυση των εικόνων διότι έσω αυτής ποσδιοίζονται τα πειγάατα των αντικειένων της εικόνας και αποτελεί ένα αχικό στάδιο τεχνικών τηατοποίησης της εικόνας. Για τους λόγους αυτούς η εύεση ακών είναι βασικό εγαλείο για τον ποσδιοισό και την ταξινόηση των αντικειένων που είναι βασικοί στόχοι της ηχανικής όασης. Γενικό αθηατικό οντέλο οισού και ανίχνευσης των ακών δεν υπάχει αλλά γίνεται ανάλογα ε το πεδίο εφαογής, επιλογή από ένα πλήθος οντέλων και τεχνικών για την 48
ανίχνευση τους. Στο Σχ.3.4. φαίνεται η εταβολή της φωτεινότητας κατά δεδοένη διεύθυνση, ακών διαφοετικού τύπου ως πος το ύψος, την κλίση και το πλάτος τους. θ πλάτος Μηδενικό επίπεδο (α) Κλιακωτό x Μηδενικό επίπεδο (β) Βηατικό x Εύος Μηδενικό επίπεδο Μηδενικό επίπεδο x (γ) Γαικό (δ) Τύπου οοφής Σχήα 3.4.: Μονοδιάστατα συνεχή οντέλα ακών. x Από αθηατική άποψη αν f(x,y) η συνάτηση της φωτεινότητας της εικόνας (x, y συνεχείς εταβλητές - συντεταγένες σηείου του επιπέδου της εικόνας), η εταβολή της ως πος ία κατεύθυνση εκφάζεται από την παάγωγο της κατά κατεύθυνση. Ως εκ τούτου η εύεση των ακών ποεί να βασισθεί στην χήση των πααγώγων της εικόνας. Στο Σχ. 3.4.3 φαίνονται οι γαφικές πααστάσεις της φωτεινότητας, της πώτης και της δεύτεης πααγώγου της ως πος την x κατεύθυνση. 49
(α) (δ) (β) (ε) (γ) (στ) Σχήα 3.4.3 Αν το σηείο x είναι σηείο ακής, η φωτεινότητα παουσιάζει έγιστη εταβολή στο x και συνεπώς η πώτη παάγωγος έχει ακότατη τιή ενώ η δεύτεη παάγωγος ηδενίζεται. Ακολούθως θα δούε την χήση των πααγώγων ως βάση για την ανίχνευση των ακών. 3.4. Ανίχνευση ακών ε την χήση των πώτων πααγώγων Αν f(x,y) δισδιάστατη συνάτηση των συνεχών ανεξάτητων εταβλητών x, y, f ( x, y) D f : R f x R, οι εικοί της παάγωγοι f/ x, f/ y οίζουν τον πίνακα f y Αν θεωήσουε οθογώνιους άξονες x x, y y ε αντίστοιχα οναδιαία διανύσατα το διάνυσα κλίσης (radient) της f συβολίζεται 5 f και δίνεται από τη σχέση f r f r f ux u y x y Αν κινηθούε κατά την διεύθυνση που οίζει η γωνία φ που δίνεται από σχέση f φ τοξεφ x f x η εταβολή της f(x,y) είναι έγιστη και το έτο της εταβολής δίνεται από τη σχέση f f f ( x, y) x y u r x και u r y,
Μια ψηφιακή εικόνα δεν είναι συνάτηση συνεχών εταβλητών και ως εκ τούτου αντί των εικών πααγώγων υπολογίζουε τις εικές διαφοές της απόχωσης ενός εικονοστοιχείου και των γειτονικών του κατά την οιζόντια και κάθετη κατεύθυνση της εικόνας. Αν Ι ο πίνακας ιας ψηφιακής εικόνας, οι εικές εταβολές της φωτεινότητας στο σηείο (k, j) ποούν να οισθούν εναλλακτικά από τα παακάτω ζεύγη σχέσεων: D k (k, j) I(k, j) - I(k-, j) D j (k, j) I(k, j) - I(k, j-) ή D k (k, j) I(k, j) - I(k-, j) D j (k, j) I(k, j) - I(k, j-) Αν D(k, j)[ D k (k, j), D j (k, j)], η διεύθυνση και το πλάτος της κλίσης ποούν να οισθούν σύφωνα ε τα ποηγούενα από τις σχέσεις D φ ( k, j) τοξεφ D j k ( k, j) ( k, j) D(k, j) D k ( k, j) D j ( k, j ) Τα πααπάνω ποούν να εκφασθούν και ε την χήση ασκών όπως ακολούθως - - - - Η χήση των εικών διαφοών ποεί να θεωηθεί η είσοδος των τιών των γαών ή των στηλών της εικόνας σε ένα σύστηα γαικό, ανεξάτητο από ετατόπιση (LTI) που οίζεται από τη σχέση y(n) x(n)-x(n-) ή y(n) x(n)-x(n-) H κουστική απόκιση θα είναι τότε h(n) δ(n)-δ(n-) ή h(n) δ(n)-δ(n-) ή ε οφή πίνακα 5
h[, -] ή h[,, -] Η εική διαφοά y(n) στο σηείο n που είναι σηείο ιας γαής ή στήλης της εικόνας θα δίνεται ο από την συνέλιξη x(n)*h(n) δηλαδή την εφαογή των αντίστοιχων ασκών. Τα συστήατα αυτά λειτουγούν ως φίλτα στο πεδίο της συχνότητας. Στο σχήα 3.4.4 δείχνονται τα διαγάατα πλάτους των αποκίσεων συχνότητας των πααπάνω συστηάτων. Πόκειται για ένα ανωδιαβατό και ένα ζωνοπεατό φίλτο αντίστοιχα. Σχήα 3.4.4 Ο εντοπισός των σηείων των ακών ποεί να βασισθεί στην εύεση υψηλών τιών του πίνακα ε στοιχεία τις τιές D(k, j). Υψηλές είναι οι τιές που είναι εγαλύτεες από ία καθοισένη τιή κατωφλίου Τ. Συνεπώς στη θέση (k, j) υπάχει σηείο ακής εάν D(k, j) >Τ. Μία πώτη ποσέγγιση για την επιλογή ιας καθολικής τιής κατωφλίου ποεί να βασισθεί στον έσο όο των τιών D(k, j). Η επιλογή της κατάλληλης τιής κατωφλίου είναι κίσιη. Συχνά η εταβολή του φωτισού, η εταβολή της απόχωσης του αντικειένου ή του παασκηνίου, απαιτούν την χήση διαφοετικών τοπικών τιών κατωφλίων. Αν εφαόσουε όλες τις πααπάνω άσκες σε ία εικόνα 3Χ3, και αντιστοιχίσουε το άθοισα των αποτελεσάτων στο κεντικό εικονοστοιχείο, θα ποκύψουν για κάθε κατεύθυνση αντίστοιχα οι τιές S S k j I I ή ε την οφή άσκας (k,j ) (k,j ) I I (k,j) (k,j) I I (k,j) (k,j) I I (k,j ) (k,j) I I (k,j) (k,j) I I (k,j ) (k,j ) - - - - S k /4 - S j /4-5
Η άσκα αυτή λέγεται ανιχνευτής ακών του Sobel (Sobel ede detector) και λειτουγεί ως διάνυσα (S k, S j ) ε τις οικίες τιές κατεύθυνσης και πλάτους. Πολλές άσκες έχουν ποταθεί από τους εευνητές για την ανίχνευση ακών βασισένες σε διαφοετικές ποσεγγίσεις για την εξυπηέτηση διαφόων ιδιαιτεοτήτων των εικόνων. Οι πλέον σηαντικοί είναι των Prewitt - - - - P k /3 - P j /3 - R k Roberts - - R j F k Frei - Chen - - - - - F j - Σε κάθε πείπτωση από την αχική εικόνα παάγεται ένας πίνακας τιών του έτου ή της κλίσης σε κάθε εικονοστοιχείο της εικόνας. Ακολούθως ία τιή κατωφλίου καθοίζει εκείνα τα εικονοστοιχεία που αντιστοιχούν σε ακές και παάγουν την δυαδική εικόνα των ακών. Η επιλογή της κατάλληλης τιής κατωφλίου είναι ένα επιπόσθετο πόβληα. Η εταβολή του φωτισού, η εταβολή της απόχωσης του αντικειένου ή του παασκηνίου, απαιτούν την χήση διαφοετικών τοπικών τιών κατωφλίων. ΠΑΡΑΔΕΙΓΜΑ: Δίνεται ο ακόλουθος πίνακας ψηφιακής εικόνας. Ι 3 3 4 4 3 3 3 53
Να ανιχνευθούν οι ακές του ε την κλίση που καθοίζουν οι άσκες a) h - h - b) του Sobel - - - S k - S j - - - a) D k (k, j) ε εφαογή της h D j (k, j) ε εφαογή της h 9-8 9-9 9 4 - -9 9-8 3 3-9 -3 - - D(k, j) Οι ακές για D(k, j) 9 4.4 34.54 8.46 3.6 9 4.4 9 9 5 9 4.4 5 9.55 8 54
b) Για τη άσκα του Sobel D k (k, j) ε εφαογή της S k D j (k, j) ε εφαογή της S j 3 8-4 - -6 3 34 8 8 4 4 - -34-4 8 /4 3 46-38 -3, /4-9 -8-9 3 4 7-34 - -9 - -9-8 - 3 8 3 - -6-3 -4-5 -8-8 /4 D(k, j) 33. 45. 46.7 84.5. 4. 4.9 8.84 44.45 33.4 3.8 493.96 9.55 38. 3. 58. 474.3 98.33 44.45 33.4 4.43 33.5 5.79 84.5. Οι ακές για D(k, j) 75 3.4. Ανίχνευση ακών ε την χήση του τελεστή Laplace Η εύεση των πειοχών που το έτο της κλίσης (άνυσα πώτων εικών πααγώγων) έχει τοπικά εγάλες τιές ποεί βασισθεί στην εύεση πειοχών όπου η δεύτεες εικές παάγωγοι της συνάτησης της εικόνας ηδενίζονται. Σε ία ψηφιακή εικόνα η δεύτεη παάγωγος κατά την οιζόντια διεύθυνση βασίζεται στην διπλή διαδοχική εφαογή του f (x, y) τελεστή Κ. Συγκεκιένα η αντικαθίσταται από την διαφοά x K (k,j)- K (k,j) I(k,j)-I(k,j)-( I(k,j)-I(k-,j)) I(k,j)-I(k,j)I(k-,j) f (x, y) Όοια η y αντικαθίσταται από την διαφοά J (k,j)- J (k,j) I(k,j)-I(k,j)-( I(k,j)-I(k,j-)) I(k,j)-I(k,j)I(k,j-) Μποούε να εφαόσουε τα πααπάνω σε ία άσκα 3 Χ 3 ε τιές 55
-4 Η άσκα αυτή είναι ία έκφαση του τελεστή Laplace ιας συνάτησης f(x,y) f (x, y) f (x, y) x f (x, y) y στο πίνακα Ι(k,j). Οι ακές βίσκονται στα σηεία ε τιή ηδέν και εκατέωθεν των οποίων υπάχουν ετεόσηες τιές. Επειδή ια ψηφιακή εικόνα αποτελείται από δείγατα τιών, η ια ηδενική τιή της Ι(j,k) πέφτει σπάνια σε συγκεκιένο εικονοστοιχείο. Εκείνο που συβαίνει κυίως είναι σε δύο γειτονικές, οιζόντια ή κάθετα θέσεις, να εφανίζονται ετεόσηες τιές. Ένας απλός τόπος να παάγουε την εικόνα των ακών είναι θεωούε σηείο ακής κάθε στοιχείο Ι(j,k) όταν Ι(j,k) Ι(j,k) < ή Ι(j,k) Ι(j,k) < ή Ι(j,k) και Ι(j,k-) Ι(j,k) < ή Ι(j-,k) Ι(j,k) < Η ύπαξη ακών δεν εξετάζεται στα εξωτεικά στοιχεία της εικόνας Για παάδειγα ε την εφαογή των ανωτέω οι ακές της εικόνας Ι είναι τα σηεία ε την τιή στο πίνακα Α. - 8 8 - - 8-8 -8 8 - Ι Ι 8-8 -7 8-8 -7 8 - - - 8 - - Α. 56
Η χήση του τελεστή Laplace πλεονεκτεί, διότι εντοπίζονται τα τοπικά έγιστα της πώτης πααγώγου και ποκύπτουν λεπτές ακές. Μειονεκτεί όως, διότι παουσιάζει ευαισθησία στο θόυβο και στις ικές αυξοειώσεις της έντασης της φωτεινότητας. Για το λόγο αυτό εφαόζεται σε συνδυασό ε τον, τεχνικές τοπικής διασποάς και τεχνικές αφαίεσης θούβου. Για την αφαίεση του θούβου χησιοποιείται ευύτατα η άσκα εξοάλυνσης του Gauss. Στην εικόνα που ποκύπτει από την εξοάλυνση εφαόζεται η άσκα Laplace. Επειδή οι δύο άσκες είναι γαικά συστήατα ανεξάτητα από την ετατόπιση ε κουστικές αποκίσεις h G και h L αντίστοιχα η τελική έξοδος θα ποκύπτει από την διαδοχική εφαογή του δισδιάστατου συνελικτικού αθοίσατος σύφωνα ε την σχέση I h ( h I) ( h h ) I L G L G Την άσκα που αντιστοιχεί σε ένα σύστηα ε κουστική απόκιση h L h ονοάζουε G άσκα LoG και αποτελεί την διακιτή έκδοση εφαογής του τελεστή Laplace σε δισδιάστατη Gaussian συνάτηση. Ακολούθως φαίνονται οι τιές ιας άσκας Lo 5 X 5 W LoG.75.38.75.75 -.58 -.4 -.58.75.38 -.4 -.34 -.4.38.75 -.58 -.4 -.58.75.75.38.75 Στην γενική πείπτωση η εφαογή του τελεστή Laplace στην δισδιάστατη Gaussian συνάτηση G πσ x y σ ( x, y) e ικανοποιεί την σχέση x y σ ( G x, y) e 4 πσ x y ( σ ) Με βάση όσα αναπτύχθηκαν πααπάνω έχουν ποταθεί τεχνικές ανίχνευσης των ακών που αντιετωπίζουν ποβλήατα όπως του θούβου, της εταβολής του φωτισού, της συνέχειας των ακών κ.α. Από τις πλέον επιτυχηένες και διαδεδοένες είναι ο ανιχνευτής ακών του Canny (Canny ede detector). 57
3.5 Μεταβολή εγέθους Παεβολή τιών Η σίκυνση, η εγέθυνση, η πειστοφή και άλλοι ετασχηατισοί της εικόνας απαιτούν τον υπολογισό της φωτεινότητας σε σηεία άλλα από αυτά που οίζει ο αχικός κάναβος των συντεταγένων (k,j). Οι συνηθέστεες έθοδοι που χησιοποιούνται για το σκοπό αυτό είναι: - του κοντινότεου γείτονα (nearest neihbor) - της δι-γαικής παεβολής (bi-linear interpolation) - της δι-κυβικής παεβολής (bi-cubic interpolation) Σύφωνα ε την έθοδο του κοντινότεου γείτονα η τιή στην θέση (x,y) είναι ίση ε την τιή του κοντινότεου πος αυτήν εικονοστοιχείου. Για παάδειγα στο σχήα 3.5.. η τιή της φωτεινότητας στη θέση (x,y) είναι Ι(x,y) I(k,j). Ι(k,j)a Ι(k,j)b y x Ι(k,j)d Ι(k,j)c Σχήα 3.5. Στην έθοδο της δι-γαικής παεβολής υπολογίζεται η εξίσωση της ευθείας που διέχεται από τα σηεία Ι(k,j) και I(k,j). Η εξίσωση της οιζόντιας αυτής ευθείας είναι: Ι(x,j) ax (b-a) Όοια η εξίσωση της ευθείας που διέχεται από τα σηεία Ι(k,j) και I(k,j) θα είναι Ι(x,j) dx (c-d) Η εξίσωση της ευθείας που διέχεται από τα σηεία I(x,j) και Ι(x,j) είναι: Ι(x,y) I(x,j)y [I(x,j)-I(x,j)]a(b-a) x(d-a) yx y (ca-d-b) Το αποτέλεσα δεν αλλάζει αν η παεβολή ξεκινήσει από τις κάθετες ευθείες. 58