Aνάλυση Eικόνας και Aναγνώριση Προτύπων Σηµείωση Το ΕΑΠ είναι υπεύθυνο για την επιµέλεια έκδοσης και την ανάπτυξη των κειµένων σύµφωνα µε τη Μεθοδολογία της εξ Αποστάσεως Εκπαίδευσης. Για την επιστηµονική αρτιότητα και πληρότητα των συγγραµ- µάτων την αποκλειστική ευθύνη φέρουν οι συγγραφείς, κριτικοί αναγνώστες και ακαδηµαϊκοί υπεύθυνοι που ανέλαβαν το έργο αυτό.
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Σχολή Θετικών Επιστηµών και Τεχνολογίας Πρόγραµµα Σπουδών ΠΛΗΡΟΦΟΡΙΚΗ Θεµατική Eνότητα ΣHMATA KAI EΠEΞEPΓAΣIA EIKONAΣ Tόµος Γ' Aνάλυση Eικόνας και Aναγνώριση Προτύπων EΜΜΑΝΟΥΗΛ ΣΑΓΚΡΙΩΤΗΣ Eπίκ. Kαθηγητής Tµ. Πληροφορικής Πανεπιστηµίου Aθηνών ΣΕΡΓΙΟΣ ΘΕΟ ΩΡΙ ΗΣ Kαθηγητής Tµ. Πληροφορικής Πανεπιστηµίου Aθηνών ΠATPA 2003
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Σχολή Θετικών Επιστηµών και Τεχνολογίας Πρόγραµµα Σπουδών ΠΛHPOΦOPIKH Θεµατική Ενότητα ΣHMATA KAI EΠEΞEPΓAΣIA EIKONAΣ Τόµος Γ' Aνάλυση Eικόνας και Aναγνώριση Προτύπων Συγγραφή EΜΜΑΝΟΥΗΛ ΣΑΓΚΡΙΩΤΗΣ Eπίκ. Kαθηγητής Tµ. Πληροφορικής Πανεπιστηµίου Aθηνών ΣΕΡΓΙΟΣ ΘΕΟ ΩΡΙ ΗΣ Kαθηγητής Tµ. Πληροφορικής Πανεπιστηµίου Aθηνών Κριτική Ανάγνωση BAΣIΛEIOΣ MEPTZIOΣ Kαθηγητής Tµήµατος Hλεκτρολόγων Mηχανικών και Mηχανικών Yπολογιστών ΠΘ Ακαδηµαϊκός Υπεύθυνος για την επιστηµονική επιµέλεια του τόµου ΣΕΡΓΙΟΣ ΘΕΟ ΩΡΙ ΗΣ Kαθηγητής Tµήµατος Πληροφορικής Πανεπιστηµίου Aθηνών Επιµέλεια στη µέθοδο της εκπαίδευσης από απόσταση ΠETPOΣ ΓANOΣ Γλωσσική Επιµέλεια EΛENH KOYTΣOΣΠYPOY Τεχνική Επιµέλεια, Καλλιτεχνική Επιµέλεια, Σελιδοποίηση TYPORAMA Συντονισµός ανάπτυξης εκπαιδευτικού υλικού και γενική επιµέλεια των εκδόσεων ΟΜΑ Α ΕΚΤΕΛΕΣΗΣ ΕΡΓΟΥ ΕΑΠ / 1997 2003 ISBN: 960 538 225 3 Kωδικός Έκδοσης: ΠΛH 44/3 Copyright 2003 για την Ελλάδα και όλο τον κόσµο ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Οδός Παπαφλέσσα & Υψηλάντη, 26222 Πάτρα Τηλ: 2610 314094, 314206 Φαξ: 2610 317244 Σύµφωνα µε το Ν. 2121/1993, απαγορεύεται η συνολική ή αποσπασµατική αναδηµοσίευση του βιβλίου αυτού ή η αναπαραγωγή του µε οποιοδήποτε µέσο χωρίς την άδεια του εκδότη.
ÂÚÈÂ fiìâó K º π 1 Ó ÁÓÒÚÈÛË appleúôù appleˆó Î È Ë Ó Ï ÛË ÂÈÎfiÓ Eισαγωγικές παρατηρήσεις... 15 1.1 Η εικόνα, ο άνθρωπος και ο υπολογιστής... 17 1.1.1 Η αυτόµατη ανάλυση της εικόνας από τον υπολογιστή... 17 1.1.2 Σε τι υπερέχει και σε τι υστερεί ο υπολογιστής... 17 1.1.3 ιαχείριση της εικόνας από το υπολογιστικό σύστηµα... 18 1.2 Τα συστήµατα οπτικής αναγνώρισης... 19 1.2.1 Εφαρµογές των συστηµάτων οπτικής αναγνώρισης... 20 1.3 Μέθοδοι και τεχνικές της ανάλυσης εικόνας και της αναγνώρισης προτύπων... 22 1.3.1 Aνάλυση εικόνας... 22 1.3.2 Aναγνώριση προτύπων και τεχνικές ταξινόµησης... 23 Σύνοψη... 26 Bιβλιογραφία κεφαλαίου... 27 K º π 2 H ËÊÈ Î ÂÈÎfiÓ Î È Ë È Â ÚËÛ ÙË applefi ÙÔÓ appleôïôáèûù Eισαγωγικές παρατηρήσεις... 29 2.1 Εικόνα: Ένα σηµείο δύο ή τριών διαστάσεων... 31 2.2 Η ειγµατοληψία της αναλογικής εικόνας... 33 2.3 Κβάντιση και κωδικοποίηση των δειγµάτων της εικόνας... 38 2.3.1 Η διαδικασία της κβάντισης... 38 2.3.2 Η κωδικοποίηση των κβαντισµένων δειγµάτων... 40 2.3.3 Yποβάθµιση της εικόνας κατά την κβάντιση... 41 2.3.4 Mονόχρωµες εικόνες... 42
6 ANA Y H EIKONA KAI ANA NøPI H POTY øn 2.4 H ανακατασκευή της εικόνας... 44 Σύνοψη... 48 Bιβλιογραφία κεφαλαίου... 49 K º π 3 Â ÓÈÎ ÂÏÙ ˆÛË ÙË ÂÈÎfiÓ Eισαγωγικές παρατηρήσεις... 51 3.1 Aιτίες υποβάθµισης και τεχνικές βελτίωσης της εικόνας... 53 3.2 Tεχνικές τόνωσης της αντίθεσης... 55 3.2.1 Iστόγραµµα εικόνας... 55 3.2.2 Τροποποίηση ιστογράµµατος... 56 3.2.2α Ολίσθηση του ιστογράµµατος... 57 3.2.2β ιάταση του ιστογράµµατος... 58 3.2.2γ Ολίσθηση τµήµατος του ιστογράµµατος... 58 3.2.2δ Ισοστάθµιση ιστογράµµατος... 60 3.3 Tεχνικές µείωσης του θορύβου... 65 3.3.1 Λευκός προσθετικός θόρυβος και το φίλτρο κινουµένου µέσου... 65 3.3.2 Φίλτρο µεσαίου και κρουστικός θόρυβος... 68 3.4 Τόνωση των ακµών... 69 3.4.1 Μείξη της εικόνας µε την παράγωγό της για την τόνωση των ακµών... 70 Σύνοψη... 73 Bιβλιογραφία κεφαλαίου... 74 K º π 4 Â ÓÈÎ Î Ù ÙÌËÛË ÙË ÂÈÎfiÓ Eισαγωγικές παρατηρήσεις... 75
EPIEXOMENA 7 4.1 Τεχνικές κατωφλίωσης... 77 4.1.1 Κατωφλίωση µε χρήση καθολικού κατωφλίου... 77 4.1.2 ιόρθωση της φωτεινότητας εικόνας... 78 4.1.2α Φωτισµός και ανακλαστικότητα... 79 4.1.2β Προσδιορισµός του φωτισµού σκηνής και διόρθωση της φωτεινότητας της εικόνας... 80 4.1.3 Προσαρµοζόµενο κατώφλιο και άλλες τεχνικές κατωφλίωσης... 80 4.2 Τεχνικές ανίχνευσης ακµών... 83 4.2.1 Η παραγώγηση πραγµατικής συνάρτησης µε δύο µεταβλητές... 83 4.2.1α Μερικές παράγωγοι και η κλίση... 84 4.2.1β Παράγωγος κατά κατεύθυνση... 84 4.2.2 Παραγώγηση της φωτεινότητας της ψηφιακής εικόνας... 85 4.2.2α Η µάσκα διαφόρισης και η συσχέτιση... 86 4.2.3 Οι τελεστές κλίσης και οι τελεστές προσανατολισµού... 89 4.2.3α Ανίχνευση ακµών µε τελεστές κλίσης... 90 4.2.3β Ανίχνευση ακµών µε τελεστές προσανατολισµού... 94 4.3 Εντοπισµός περιγράµµατος περιοχής εικόνας... 96 4.3.1 Εντοπισµός περιγράµµατος σε περιοχή µονόχρωµης εικόνας... 97 Σύνοψη... 99 Bιβλιογραφία κεφαλαίου... 100 K º π 5 Ó apple Ú ÛÙ ÛË Î È appleâúèáú Ê appleâúèáú ÌÌ ÙÔ Eισαγωγικές παρατηρήσεις... 101 5.1 Ο κώδικας αλύσσου... 103 5.2 Αναπαράσταση του περιγράµµατος µε πολυγωνική γραµµή... 107 5.2.1 Προσδιορισµός του πολυγώνου προσέγγισης µε διαδοχικές υποδιαιρέσεις του περιγράµµατος... 108
8 ANA Y H EIKONA KAI ANA NøPI H POTY øn 5.3 Η υπογραφή του περιγράµµατος... 110 5.3.1 Σχέση µήκους και γωνίας επιβατικής ακτίνας των σηµείων του περιγράµµατος... 110 5.3.2 Το ιστόγραµµα κλίσεων... 113 5.4 Ο διακριτός µετασχηµατισµός Fourier του περιγράµµατος... 114 Σύνοψη... 117 Bιβλιογραφία κεφαλαίου... 118 K º π 6 ÂÚÈÁÚ ÊÔÓÙ ÛÙÔÈ Â ÙÔ ÂÛˆÙÂÚÈÎÔ appleâúèô ÂÈÎfiÓ Eισαγωγικές παρατηρήσεις... 119 6.1 Yφή του εσωτερικού περιοχής... 121 6.1.1 Μέθοδος περιγραφής βασισµένη σε ιστογράµµατα... 121 6.1.1α Οι Ροπές του Ιστογράµµατος... 122 6.1.1β Πίνακες συνεµφάνισης... 124 6.1.2 Φασµατική µέθοδος περιγραφής... 127 6.2 Οι Ροπές µιας περιοχής... 129 6.2.1 Ροπές, κεντρικές ροπές και κανονικοποιηµένες ροπές... 129 6.2.2 Οι Ροπές του Hu... 130 6.2.3 Στροφορµές και κύριοι άξονες... 133 Σύνοψη... 135 Bιβλιογραφία κεφαλαίου... 137 K º π 7 Bayesian TaÍÈÓÔÌËÙ Eισαγωγικές παρατηρήσεις... 139 7.1 Βασικά στάδια σχεδιασµού συστήµατος ταξινόµησης... 141 7.1.1 Στάδιο δηµιουργίας και επιλογής ουσιωδών χαρακτηριστικών... 141
EPIEXOMENA 9 7.1.2 Στάδιο σχεδίασης του ταξινοµητή... 142 7.2 Ταξινοµητές Bayes... 142 7.3 Συναρτήσεις διάκρισης Eπιφάνειες διάκρισης Eπιφάνειες απόφασης Tαξινοµητής ελάχιστης απόστασης... 147 7.4 Παράθυρα Parzen... 153 7.5 Yπολογισµός πυκνότητας πιθανότητας από τους k πλησιέστερους γείτονες... 157 7.6 Tαξινοµητές πλησιέστερης γειτνίασης... 159 Σύνοψη... 162 Bιβλιογραφία κεφαλαίου... 162 K º π 8 T ÍÈÓÔÌËÙ NÂ ÚˆÓÈÎÒÓ ÈÎÙ ˆÓ Eισαγωγικές παρατηρήσεις... 163 8.1 Ο αλγόριθµος Perceptron... 165 8.1.1 Η αρχιτεκτονική Perceptron... 169 8.2 Μη γραµµικά διαχωρίσιµα προβλήµατα... 170 8.2.1 Προβλήµατα Perceptrons 2 στρωµάτων... 170 8.2.2 ιαχωριστική ικανότητα των Perceptrons δύο στρωµάτων... 174 8.2.3 Perceptrons 3 στρωµάτων... 175 8.2.4 Ο αλγόριθµος οπισθοδροµικής διάδοσης... 178 Σύνοψη... 181 Bιβλιογραφία κεφαλαίου... 181 Aπαντήσεις Aσκήσεων Aυτοαξιολόγησης... 183
ÚfiÏÔÁÔ Στο βιβλίο αυτό περιλαµβάνονται στοιχεία από τη θεωρία της Ανάλυσης Εικόνας και της Αναγνώρισης Προτύπων. Οι περιοχές αυτές της επιστήµης βρίσκονται σε άµεση συγγένεια µε την επεξεργασία σήµατος και εφαρµογές τους εντοπίζονται σε τοµείς της επιστήµης, όπως Ροµποτική, Αναγνώριση χαρακτήρων κειµένου (OCR), Ιατρική Πληροφορική, κ.λ.π. Εφαρµογές τους συναντάµε πλέον στο γραφείο, στο πολυκατάστηµα, στο ιατρείο, στις οδικές αρτηρίες, στη βιοµηχανία και σε κάθε τοµέα ανθρώπινης δραστηριότητας. Για όλους τους πιο πάνω λόγους νοµίζουµε ότι ο νέος επιστήµονας που έχει αποφασίσει να ασχοληθεί µε την πληροφορική, είναι απαραίτητο να διδαχθεί τουλάχιστόν ένα εξαµηνιαίο µάθηµα που θα του δώσει τις βασικές αρχές από την Ανάλυση Εικόνας και την Αναγνώριση Προτύπων. Για τους ίδιους λόγους, το µάθηµα αυτό έχει συµπεριληφθεί στην ενότητα της Πληροφορικής του Ανοικτού Πανεπιστηµίου και το βιβλίο που έχετε στα χέρια σας προσπαθεί να καλύψει την αντίστοιχη ύλη. Σαν βιβλίο το οποίο, κατ αρχήν, απευθύνεται σε σπουδαστές που έχουν περιορισµένες δυνατότητες άµεσης επικοινωνίας µε τους δασκάλους τους, ο καθορισµός του όγκου του καθώς και η επιλογή και η ανάπτυξη της ύλης του έγινε µε βάση τους ειδικούς κανόνες, που πρέπει να ακολουθούνται όταν το έντυπο προορίζεται για εκπαίδευση από απόσταση. Κάθε κεφάλαιο περιέχει ένα σηµαντικό αριθµό από παραδείγµατα καθώς και ασκήσεις, η λύση των οποίων βρίσκεται γραµµένη στο τέλος του κεφαλαίου. Ο αναγνώστης πρέπει να επιλύει την κάθε άσκηση στο σηµείο του κειµένου που τη συναντά, δηλαδή αµέσως µετά τη µελέτη του αντίστοιχου τµή- µατος της ύλης. Στη συνέχεια, πρέπει να ελέγχει την απάντησή του µελετώντας την λύση που υπάρχει στο τέλος του αντίστοιχου κεφαλαίου και στην περίπτωση που διαπιστώσει ότι κάποιες απαντήσεις του είναι εσφαλµένες, να ακολουθεί τις υποδείξεις που δίνονται για συµπληρωµατική µελέτη. Συµβουλεύουµε τον αναγνώστη να ακολουθήσει σχολαστικά την πιο πάνω διαδικασία ώστε να υπάρξει ταχεία κατανόηση και εµπέδωση της υπό µελέτη ύλης. Καταβλήθηκε ιδιαίτερη προσπάθεια να περιοριστούν στο δυνατό οι προαπαιτούµενες πανεπιστηµιακές γνώσεις που πρέπει να έχει ο σπουδαστής για να µπορεί να µελετήσει µε ευχέρεια το βιβλίο ακόµη και αν επιλέξει το µάθηµα στα πρώτα έτη των σπουδών του. Τα µαθηµατικά που προαπαιτούνται καλύπτονται στο µεγαλύτερο µέρος τους από τα µαθηµατικά λυκείου της θετικής κατεύθυνσης. Επιπλέον αυτών, ο σπουδαστής θα χρειαστεί να έχει µελετήσει στοιχεία στατιστικής και ειδικότερα στατιστικές κατανοµές. Είναι γνωστό ότι στα πρώτα χρόνια σπουδών, ακόµη
12 ANA Y H EIKONA KAI ANA NøPI H POTY øn και για το σπουδαστή της πληροφορικής, η εικόνα είναι γνωστή µόνο σαν στοιχείο των κειµένων του, δεν έχει ακόµα συνειδητοποιήσει ότι πρόκειται για ένα σήµα και πολύ περισσότερο δεν έχει τη δυνατότητα να επιδρά σ αυτήν. Για το λόγο αυτό περιλάβαµε στην ύλη ενότητες σχετικές µε τη δηµιουργία και τη διαχείριση της ψηφιακής εικόνας από τον υπολογιστή παρουσιάζοντας πολύ σύντοµα τη διαδικασία της δειγµατοληψίας και πιο αναλυτικά την κβάντιση καθώς και στοιχεία από την ανακατασκευή της εικόνας από την οθόνη του υπολογιστή. Ένα µεγάλο µέρος των ασκήσεων του βιβλίου αυτού, αυτές που περιέχουν σηµαντικό όγκο υπολογισµών, παρουσιάζονται ως να έχουν λυθεί µε µολύβι και χαρτί. Η έκταση των απαιτούµενων υπολογισµών είναι τέτοια ώστε αν χρειαστεί µπορεί να πραγµατοποιηθεί µε αυτό τον τρόπο. Εµείς όµως συµβουλεύουµε τους σπουδαστές να κατασκευάζουν προγράµµατα και να χρησιµοποιούν τον υπολογιστή για την το πραγµατοποίηση των πράξεων. Για το σκοπό αυτό µπορεί να χρησιµοποιηθεί οποιαδήποτε προγραµµατιστική γλώσσα γνωρίζουν καλλίτερα, αν και πιστεύουµε ότι η χρήση µιας εξελιγµένης γλώσσας, όπως για παράδειγµα το MATLAB, θα τους απαλλάξει από µακροχρόνιο γράψιµο εντολών και την αντίστοιχη διαδικασία ανίχνευσης και διόρθωσης σφαλµάτων (debugging). Το βιβλίο αποτελείται από οκτώ κεφάλαια. Στο πρώτο από αυτά γίνεται προσπάθεια να δοθεί συνοπτικά η ύλη που περιέχεται σε όλο το βιβλίο. Αν και γνωρίζουµε ότι αυτό θα δηµιουργήσει κάποιες δυσκολίες στον αναγνώστη, πιστεύουµε ότι είναι απαραίτητο, ώστε να αποκτήσει µια γενική άποψη ολόκληρου του αντικειµένου πριν από την αναλυτική παράθεση των επί µέρους εννοιών. Στο δεύτερο και τρίτο κεφάλαιο γίνεται µια προσπάθεια να παρουσιάσουµε στον αναγνώστη τις απαραίτητες γνώσεις για τη διακίνηση της ψηφιακής εικόνας µε τον υπολογιστή και τις στοιχειώδης τεχνικές επεξεργασίας της. Θεωρήθηκε σκόπιµο να συµπεριληφθούν τα θέµατα αυτά ώστε να υπάρξει σχετική αυτοδυναµία του βιβλίου, πολύ περισσότερο που αυτό απευθύνεται σε φοιτητές που κατά τεκµήριο δεν έχουν χειριστεί την εικόνα ως σήµα. Στα τέταρτο, πέµπτο και έκτο κεφάλαια παρουσιάζονται µέθοδοι της ανάλυσης εικόνας οι οποίες αποσκοπούν στην ανάδειξη ουσιωδών χαρακτηριστικών περιγράµµατος και περιοχής εικόνας. Πιο αναλυτικά, στο τέταρτο κεφάλαιο γίνεται η παρουσίαση µερικών από τις πιο κλασικές µεθόδους κατάτµησης της εικόνας. Σ αυτό παρουσιάζονται τεχνικές κατωφλίωσης και ανάδειξης ακµών. Στο πέµπτο και έκτο κεφάλαιο παρουσιάζονται τα σχήµατα αναπαράστασης και τα στοιχεία περιγραφής του περιγράµµατος και του εσωτερικού µιας περιοχής εικόνας αντίστοιχα. Τέλος,
PO O O 13 στα κεφάλαια επτά και οχτώ δίνονται οι πιο βασικές τεχνικές ταξινόµησης µε επίβλεψη. Στο πρώτο από αυτά περιγράφονται τεχνικές που στηρίζονται κυρίως στην ελαχιστοποίηση του σφάλµατος ενώ στο τελευταίο γίνεται αναφορά στα νευρωνικά δίκτυα και στους τρόπους επίλυσης προβληµάτων ταξινόµησης µε αυτά. Αισθανόµαστε υποχρέωση να ευχαριστήσουµε τον Κριτικό Αναγνώστη καθηγητή Μέρτζιο Βασίλειο, καθώς και τα µέλη της Οµάδας Εκτέλεσης Έργου του Ελληνικού Ανοικτού Πανεπιστηµίου, οι οποίοι παρακολούθησαν από κοντά τη συγγραφή ολόκληρου του βιβλίου. Οι παρατηρήσεις τους βοήθησαν στη διαµόρφωση του τελικού ύφους και της µορφής του βιβλίου αυτού. Επίσης, πρέπει να ευχαριστήσουµε τους συντονιστές του προγράµµατος της Πληροφορικής, ρ Χρήστο Παναγιωτακόπουλο και κυρία ήµητρα Παρασκευοπούλου για την άψογη συνεργασία που είχαµε. Τελειώνοντας θέλουµε να ευχαριστήσουµε τους υποψήφιους διδάκτορες Γιάννη Κοψίνη και Κώστα Παναγιωτόπουλο για τη βοήθεια που πρόσφεραν στην κατασκευή των σχηµάτων, καθώς και τις χρήσιµες παρατηρήσεις που έκαναν διαβάζοντας τα χειρόγραφα κατά τη διάρκεια της συγγραφής του βιβλίου.