ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ. ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια στ

Σχετικά έγγραφα
DIP_05 Τµηµατοποίηση εικόνας. ΤΕΙ Κρήτης

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης

ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Αναγνώριση Προτύπων Ι

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Το μοντέλο Perceptron

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Συμπίεση Δεδομένων

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Περιεχόµενα. xii. Κεφάλαιο 1: Εισαγωγή. Κεφάλαιο 2: Επεξεργασία δυαδικών εικόνων

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

4.3. Γραµµικοί ταξινοµητές

Κατάτµηση εικόνας σε οµοιόµορφες περιοχές

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Επιλογή χαρακτηριστικών

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακή Εικόνα. Αντίληψη χρωμάτων Συστήματα χρωμάτων Κβαντισμός χρωμάτων

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

DIP_04 Σημειακή επεξεργασία. ΤΕΙ Κρήτης

ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Συμπίεση Πολυμεσικών Δεδομένων

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

Digital Image Processing

Ψηφιακή Επεξεργασία Εικόνας

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Χαρακτηρισµός Νεοπλασµάτων στη Μαστογραφία από το Σχήµα της Παρυφής µε χρήση Νευρωνικών ικτύων

Αναγνώριση Προτύπων Ι

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Υπολογιστική Νοημοσύνη. Μάθημα 10: Ομαδοποίηση με Ανταγωνιστική Μάθηση - Δίκτυα Kohonen

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

ΔΕΟ13 - Επαναληπτικές Εξετάσεις 2010 Λύσεις

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

6. Στατιστικές μέθοδοι εκπαίδευσης

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Γραµµικοί Ταξινοµητές

Τηλεπισκόπηση. Κ. Ποϊραζίδης ΨΗΦΙΑΚΗ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ 18/6/2016

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Εκπαίδευση ΤΝΔ με ελαχιστοποίηση του τετραγωνικού σφάλματος εκπαίδευσης. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν.

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP)

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

DIP_01 Εισαγωγήστην ψηφιακήεικόνα. ΤΕΙ Κρήτης

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Βέλτιστη παρεμβολή και πρόγνωση άγνωστης συνάρτησης με τη μέθοδο της σημειακής προσαρμογής

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods)

Μέθοδοι πολυδιάστατης ελαχιστοποίησης

ΔΙΚΤΥO RBF. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

HMY 795: Αναγνώριση Προτύπων

Μορφές των χωρικών δεδομένων

Το Πολυεπίπεδο Perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Τμηματοποίηση με χρήση τυχαίων πεδίων Markov. Κοινή ιδιότητα σημείων τμήματος Εισαγωγή χωρικής πληροφορίας Εξομάλυνση πεδίου κατατάξεων

Πανεπιστήμιο Θεσσαλίας. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Χωροταξίας Πολεοδομίας και Περιφερειακής Ανάπτυξης

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Εισαγωγή στη Στατιστική

Νευρωνικά ίκτυα και Εξελικτικός

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ: ΑΝΙΧΝΕΥΣΗ ΣΦΑΛΜΑΤΩΝ ΣΕ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής

Ψηφιακή Επεξεργασία Εικόνας

2.1 ΕΙΣΑΓΩΓΗ ΤΟ ΦΩΣ ΘΕΜΕΛΙΩΔΗ ΣΤΟΙΧΕΙΑ ΧΡΩΜΑΤΟΣ 2.5

Επαναληπτικές μέθοδοι

Απαλλακτική Εργασία Γραφικά & Εικονική Πραγματικότητα. Παπαπαύλου Χρήστος ΑΜ: 6609

Transcript:

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΥΠΟΕΡΓΟ 3 ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΥΠΕΥΘΥΝΟΣ ΧΑΡΑΛΑΜΠΟΣ ΣΤΡΟΥΘΟΠΟΥΛΟΣ - ΚΑΘΗΓΗΤΗΣ ΑΝΑΠΤΥΞΗ ΤΕΧΝΙΚΗΣ ΜΕΙΩΣΗΣ ΤΩΝ ΧΡΩΜΑΤΩΝ ΕΙΚΟΝΑΣ ΑΝΑΛΥΣΗ ΜΕΘΟΔΩΝ ΠΑΚΕΤΟ ΕΡΓΑΣΙΑΣ 1

ΠΕΡΙΛΗΨΗ Στο συγκεκριμένο ερευνητικό πρόγραμμα θα αναπτυχθεί μια τεχνική ανάλυσης της δομής έγχρωμων ψηφιακών εγγράφων. Η συγκεκριμένη διαδικασία, η οποία στην ουσία έχει ως στόχο τον εντοπισμό των περιοχών κειμένου της αρχικής εικόνας, αποτελεί απαραίτητο στάδιο προ-επεξεργασίας στις περισσότερες εφαρμογές επεξεργασίας ψηφιακών εγγράφων. Σε μεικτού τύπου έγχρωμα έγγραφα η απεικόνιση του κειμένου, των γραφικών σχημάτων και των εικόνων πετυχαίνεται με την χρήση χιλιάδων διαφορετικών χρωμάτων. Τις περισσότερες μάλιστα φορές οι περιοχές του κειμένου, των γραφικών σχημάτων και των εικόνων ενός εγγράφου δεν είναι σαφώς διαχωρισμένες μεταξύ τους. Η μείωση των χρωμάτων της αρχικής εικόνας είναι ένα στάδιο απαραίτητο για την απλοποίηση της όλης διαδικασίας ανάλυσης της δομής ενός έγχρωμου ψηφιακού εγγράφου. Η αρχική έγχρωμη εικόνα θα κβαντίζεται με βέλτιστο τρόπο σε ένα μικρό αριθμό αντιπροσωπευτικών χρωμάτων. Ο αριθμός των κύριων χρωμάτων, στα οποία μπορεί να μειωθεί η αρχική εικόνα χωρίς να χαθεί κάποια σημαντική πληροφορία, θα εξάγεται μετά από επεξεργασία του ιστογράμματος της αρχικής εικόνας. Στα πλαίσια του παρόντος παραδοτέου υποβάλλονται : (α) Περιγραφή τεχνικών που έχουν αναπτυχθεί για τη μείωση των χρωμάτων μιας εικόνας. (β) Η πρώτη μορφή του προγράμματος για τη μείωση των χρωμάτων της αρχικής εικόνας.

Περιγραφή τεχνικών Μείωσης των Χρωμάτων Σε αντίθεση με τις εικόνες αποχρώσεων του γκρι όπου χρειάζονται μόλις 256 επίπεδα για την περιγραφή των πιθανών αποχρώσεων τους (8 bit), στις έγχρωμες εικόνες, το κάθε εικονοστοιχείο περιγράφεται από ένα διάνυσμα, διάστασης που εξαρτάται από το χρωματικό μοντέλο που χρησιμοποιείται. Στην απλούστερη περίπτωση, του χρωματικού μοντέλου RGB, έχουμε τριών διαστάσεων διανύσματα με 8 bits πληροφορία για το κάθε κανάλι, δηλαδή συνολικά απαιτούνται 24 bits ανά εικονοστοιχείο για την περιγραφή όλων των χρωμάτων. Συναντάται λοιπόν αντικειμενική δυσκολία στην άντληση της χρήσιμης πληροφορίας καθώς το πλήθος των δυνατών χρωμάτων και συνδυασμών των εικονοστοιχείων στην εικόνα είναι τεράστιο. Η μείωση των χρωμάτων στις έγχρωμες εικόνες αποτελεί πολλές φορές προϋπόθεση για την άντληση της πληροφορίας που αυτές περιέχουν. Οι πιο κοινές τεχνικές μείωσης χρωμάτων σε ψηφιακές εικόνες, είναι η κβάντωση των χρωμάτων τους (color quantization) και η πολυκατωφλίωση. Η κβάντωση χρωμάτων είναι η διαδικασία εκείνη που εφαρμόζεται σε ψηφιακές έγχρωμες εικόνες κατά την οποία μειώνεται ο αριθμός των χρωμάτων µε τη μικρότερη δυνατή παραμόρφωσή τους. Χρώματα τα οποία είναι όμοια ομαδοποιούνται και αντικαθιστούνται από ένα µόνο «κβαντισμένο» χρώμα. Γενικά ένα αλγόριθμος μείωσης χρωμάτων σε εικόνες αποτελείται από δύο στάδια: 1. Τη δημιουργία της παλέτας των χρωμάτων µε τα οποία θα αναπαρασταθεί η αρχική εικόνα. 2. Την απεικόνιση των εικονοστοιχείων της εικόνας, την απόδοση τους δηλαδή σε ένα από τα χρώματα της παλέτας και την αντικατάσταση της χρωματικής τους πληροφορίας από αυτό. Οι περισσότερες, ευρέως γνωστές, τεχνικές μείωσης χρωμάτων έχουν ως σκοπό την ελαχιστοποίηση της διαφοράς μεταξύ της αρχικής και τελικής κβαντισμένης εικόνας ως προς κάποια μέτρηση σφάλματος, όπως για παράδειγμα το μέσο τετραγωνικό σφάλμα. Επίσης, για τη βελτίωση των αποτελεσμάτων κβαντισμού, χρησιμοποιούνται χρωματικοί χώροι γραμμικοί ως προς την ανθρώπινη αίσθηση, όπως τα μοντέλα CIE-L*u*v* και CIE L*a*b*. Όμως, ο στόχος της ελαχιστοποίησης

του μέσου τετραγωνικού σφάλματος μεταξύ της αρχικής και κβαντισμένης εικόνας, από μόνο του, δεν εγγυάται το καλύτερο αποτέλεσμα, καθώς μικρές απομακρυσμένες συγκεντρώσεις χρωμάτων πολύ συχνά περιγράφουν σημαντική πληροφορία της εικόνας. Θεωρώντας ότι κάθε κλάση περιγράφεται μόνον από το κέντρο της, το πρόβλημα της μείωσης των χρωμάτων απλοποιείται σημαντικά. Στην περίπτωση αυτή ουσιαστικά ζητείται η εύρεση μιας παλέτας χρωμάτων, λίγων εγγραφών, για τη βέλτιστη περιγραφή της αρχικής εικόνας με μειωμένο αριθμό χρωμάτων. Πάλι όμως υπάρχει το πρόβλημα της εύρεσης του πλήθους των εγγραφών της παλέτας που απαιτούνται για την περιγραφή της αρχικής εικόνας. Επιθυμητό είναι λοιπόν οι αλγόριθμοι κβαντισμού των χρωμάτων να ενσωματώνουν κάποιον μηχανισμό ανίχνευσης του κύριου αριθμού των χρωματικών αποχρώσεων. Η ποιότητα λοιπόν της κβαντισμένης εικόνας καθορίζεται από την «ευφυΐα» του εφαρμοζόμενου αλγόριθμου και της ικανότητας αυτού στην ανίχνευση όλων των σημαντικών κλάσεων. Η εκτίμηση των αποχρώσεων σε μια εικόνα μπορεί να γίνει με τον υπολογισμό των κύριων κορυφών στο ιστόγραμμα των φωτεινοτήτων μιας εικόνας [ATSPA02]. Η μέθοδος «τεθλασμένης γραμμής», η μέθοδος «εξομάλυνσης με κβαντισμό του ιστογράμματος σε ομοιόμορφα κατανεμημένες κλάσεις» και η μέθοδος «εξομάλυνσης με κβαντισμό του ιστογράμματος χρησιμοποιώντας τον ταξινομητή Kohonen SOFM» (με δύο τρόπους εκπαίδευσης), είναι οι τεχνικές οι οποίες θα υλοποιηθούν και θα συγκριθούν για να επιλεγεί η καλύτερη. Η εκτίμηση του αριθμού των κύριων χρωμάτων σε έγχρωμες εικόνες [ATSPA03] γίνεται κατασκευάζοντας τα ιστογράμματα κατά μήκος της πρώτης και δεύτερης κύριας συνιστώσας του χώρου των χρωμάτων της εικόνας και αθροίζοντας τις κορυφές που ανιχνεύονται. Για την μείωση των αποχρώσεων σε γκρι ή έγχρωμες εικόνες έχουν ακολουθηθεί διάφορες μεθοδολογίες. Η πιο συχνή αντιμετώπιση για τη μείωση των διαβαθμίσεων του γκρι είναι η πολυκατωφλίωση του ιστογράμματος των εικόνων. Το ιστόγραμμα μιας γκρι εικόνας είναι η γραφική παράσταση της πιθανότητας εμφάνισης κάθε φωτεινότητας. Στις τεχνικές πολυκατωφλίωσης ζητούμενο είναι ο διαχωρισμός των κύριων κλάσεων της εικόνας μέσω ενός κατάλληλου πλήθους κατωφλίων, που οριοθετούν τις κλάσεις. Σε όλες τις τεχνικές πολυκατωφλίωσης, θεωρείται ότι ο διαχωρισμός των κύριων κλάσεων-αντικειμένων της εικόνας, μπορεί

να γίνει μόνο από την πληροφορία που προσφέρει το ιστόγραμμα φωτεινοτήτων με τις κύριες κλάσεις να εμφανίζονται με μορφή κάποιας συγκέντρωσης στο ιστόγραμμα [KIIL86]. Η παραπάνω όμως θεώρηση δεν ισχύει σε περιπτώσεις φυσικών εικόνων, όπου τα αντικείμενα έχουν συνήθως πολύπλοκες υφές και σε εικόνες με κακώς φωτισμένα αντικείμενα, με αποτέλεσμα οι τεχνικές που χρησιμοποιούν μόνο την πληροφορία του ιστογράμματος φωτεινοτήτων να μην έχουν πάντα ικανοποιητικά αποτελέσματα. Επίσης σε εικόνες πολλών αντικειμένων υπάρχει η αντικειμενική δυσκολία της σωστής επιλογής της θέσης των κατωφλίων, κυρίως σε περιπτώσεις επικάλυψης των φωτεινοτήτων των αντικειμένων. Οι περισσότερες από τις τεχνικές πολυκατωφλίωσης συγκλίνουν ακολουθώντας κάποια κριτήρια βελτιστοποίησης. Οι μέθοδοι των Otsu [OTSU79] και η επέκταση της Reddi κ.α [RERU84] μεγιστοποιούν τη διαχωριστικότητα των κλάσεων στη κβαντισμένη εικόνα. Στην πρώτη μέθοδο βρίσκεται μόνο ένα κατώφλι που ορίζει δύο κλάσεις, ενώ στη δεύτερη βρίσκονται περισσότερα κατώφλια. Στη μέθοδο του Otsu για κάθε πιθανό κατώφλι υπολογίζονται τα κέντρα των κλάσεων της «δεξιάς» και της «αριστερής» κλάσης φωτεινοτήτων και επιλέγεται το κατώφλι εκείνο όπου η μεταβλητότητα των φωτεινοτήτων στην κβαντισμένη εικόνα που θα προέκυπτε μεγιστοποιείται. Στη μέθοδο των Reddi κ.α τα κατώφλια βρίσκονται εφαρμόζοντας μια επαναληπτική διαδικασία σύγκλισης. Στη μέθοδος του Kapur κ.α [KASA85] τα κατώφλια επιλέγονται ώστε να μεγιστοποιείται το άθροισμα της ποσότηταςπληροφορίας (εντροπίας) που περιέχει κάθε κλάση που παράγεται. Η μέθοδος είναι υπερβολικά αργή καθώς δεν υπάρχει επαναληπτική μέθοδος σύγκλισης που να ελαχιστοποιεί την παραπάνω ποσότητα, συνεπώς η λύση βρίσκεται εξαντλώντας όλες τις δυνατές περιπτώσεις. Η μέθοδο του Carlotto [CARL87] καθορίζει τις θέσεις των κατωφλίων αξιοποιώντας την πληροφορία των θέσεων μετάβασης από το μηδέν της δεύτερης παράγωγου του ιστογράμματος, η μέθοδος αυτή λειτουργεί σωστά κυρίως στις περιπτώσεις που το ιστόγραμμα θεωρείται συνάθροιση κανονικών κατανομών. Η μέθοδος του Papamarkos κ.α [PAGA94] ανιχνεύει τους λόφους του ιστογράμματος προσεγγίζοντας το ιστόγραμμα με ρητές συναρτήσεις, χρησιμοποιώντας γραμμικό προγραμματισμό. Η μέθοδος αυτή χρησιμοποιεί την μέθοδο Hill Clustering των Tsai, and Chen [TSCH84] που βρίσκει κατά προσέγγιση τις θέσεις των κύριων κορυφών του ιστογράμματος με μια τεχνική επαναληπτικής ταξινόμησης των φωτεινοτήτων στους λόφους. Ως είσοδο απαιτεί μόνο τον μέγιστο επιθυμητό αριθμό των κορυφών

που μπορεί να ανιχνεύσει. Η τελευταία μέθοδος μπορεί να λειτουργήσει και ως μέθοδος ανίχνευσης του πλήθους των κορυφών σε ιστογράμματα φωτεινοτήτων. Οι τεχνικές για την μείωση των αποχρώσεων σε έγχρωμες εικόνες μπορούν να χωριστούν σε δύο κύριες κατηγορίες. Στην πρώτη κατηγορία μεθόδων ο χρωματικός χώρος διασπάται διαδοχικά σε ορθογώνια παραλληλεπίπεδα τμήματα μέχρι να επιτευχθεί ο επιθυμητός αριθμός κλάσεων ταξινόμησης. Κύριο χαρακτηριστικό αυτής της κατηγορίας είναι ότι το πρόβλημα μείωσης των χρωμάτων δεν αντιμετωπίζεται ως πρόβλημα βέλτιστης ταξινόμησης διανυσμάτων. Οι μέθοδοι Median Cut [HECK82] και Variance Based [WAWO88], [WAPR90] ανήκουν σε αυτή την κατηγορία. Στην πρώτη μέθοδο ο χρωματικός χώρος RGB διασπάται αρχικά σε δύο κλάσεις κυβικού σχήματος με ίσο πλήθος εικονοστοιχείων, που περικλείουν ακριβώς τα δεδομένα. Το επίπεδο διάσπασης επιλέγεται να είναι κάθετο στον άξονα του κύβου με την μεγαλύτερη διάσταση. Επιλέγεται η κλάση κόμβος με την μεγαλύτερη πλευρά και διασπάται πάλι σε δύο κυβικού σχήματος ισόποσα μέρη. Η διαδικασία επαναλαμβάνεται μέχρι ο τελικός αριθμός κλάσεων να φτάσει τον επιθυμητό αριθμό τελικών χρωμάτων. Στη δεύτερη μέθοδο η διάσπαση των κύβων γίνεται ώστε να ελαχιστοποιείται το άθροισμα των διασπορών των δεδομένων στους νέους όγκους που προκύπτουν. Επίσης, κάθε φορά επιλέγεται να διασπαστεί ο κύβος εκείνος με το μέγιστο σφάλμα κβαντισμού, κάτι που βελτιώνει σημαντικά το αποτέλεσμα. Μια βελτίωση των μεθόδων διάσπασης του χρωματικού χώρου προτάθηκε από τον WU [WU1992] όπου χρησιμοποιώντας την ανάλυση κύριων συνιστωσών των δεδομένων βρίσκει την κατεύθυνση εκείνη στην οποία γίνονται οι διασπάσεις του χώρου των δεδομένων. Στην ίδια κατηγορία τεχνικών ανήκει και η μέθοδο Octree [ASHD94], στην οποία ακολουθείται η αντίστροφη πορεία, δηλαδή συγχώνευση περιοχών κυβικού σχήματος μέχρι να επιτευχθεί ο επιθυμητός αριθμός χρωμάτων. Σύμφωνα με την κωδικοποίηση των χρωμάτων στον RGB χρωματικό χώρο (8 bit για κάθε κανάλι) συνδυάζοντας το πλέον σημαντικό bit και από τα τρία κανάλια ο χώρος χωρίζεται σε 8 κύβους. Όμοια, λαμβάνοντας υπόψη και το επόμενο σημαντικό bit, ο κάθε κύβος χωρίζεται σε άλλους 8 κύβους. Συνεχίζοντας μέχρι και το λιγότερο σημαντικό bit σχηματίζεται μια δομή δέντρου του οποίου οι κόμβοι εκφράζουν τους κύβους και τα φύλα εκφράζουν τα χρώματα της εικόνας. Κάθε κόμβος χαρακτηρίζεται από τον

αριθμό των εικονοστοιχείων που διέρχονται από αυτόν μέχρι να καταλήξουν σε κάποιο φύλο-χρώμα. Τα φύλα των κόμβων, με τους μικρότερους αριθμούς διελεύσεων, συγχωνεύονται και ο αντίστοιχος κόμβος μετατρέπεται σε φύλο. Η διαδικασία επαναλαμβάνεται μέχρι την επίτευξη του επιθυμητού αριθμού χρωμάτων. Το κύριο πρόβλημα όλων των παραπάνω μεθόδων είναι ότι αξιοποιούν μόνο την χρωματική πληροφορία των δεδομένων αγνοώντας την διάταξη των εικονοστοιχείων στην εικόνα. Επίσης, τα όρια των κλάσεων συνήθως σχηματίζουν ορθογώνια παραλληλεπίπεδα, κάτι που δεν αποτελεί προσέγγιση της πραγματικότητας. Στη δεύτερη κύρια κατηγορία τεχνικών για την μείωση των αποχρώσεων σε έγχρωμες εικόνες εφαρμόζεται διαφορετική μεθοδολογία που επιτρέπει την αντιμετώπιση των παραπάνω προβλημάτων. Για κάθε εικονοστοιχείο θεωρείται ένα διάνυσμα που περιγράφει το χρώμα αυτού και το πρόβλημα μείωσης των χρωμάτων αντιμετωπίζεται ως πρόβλημα βέλτιστης ταξινόμησης διανυσμάτων. Σε περιπτώσεις εικόνων φυσικού χρώματος και γενικότερα στην πλειοψηφία των περιπτώσεων δεν υπάρχει πληροφορία τόσο για το πλήθος των κλάσεων ταξινόμησης όσο και για τις ίδιες τις κλάσεις. Για την αντιμετώπιση του παραπάνω προβλήματος χρειάζονται ικανοί αυτο-οργανούμενοι ταξινομητές, ενώ και εδώ είναι χρήσιμη η εύρεση τρόπων εκτίμησης του πλήθους των κύριων χρωμάτων - κλάσεων. Μια πολύ γνωστή μέθοδο ταξινόμησης διανυσμάτων είναι η μέθοδος Generalized LIoyd Algorithm (GLA) [LIBU80]. Η μέθοδος αυτή απαιτεί ως είσοδο μόνον τον αριθμό των κλάσεων ταξινόμησης και κάποιο κριτήριο σύγκλισης. Στην εκκίνηση του αλγόριθμου αρχικοποιούνται οι κλάσεις ταξινόμησης με τυχαίες τιμές από το σύνολο των δεδομένων. Αρχικά, το σύνολο των διανυσμάτων εισόδου ταξινομούνται στο σύνολο των κλάσεων. Στη συνέχεια αναπροσαρμόζονται τα κέντρα των κλάσεων παίρνοντας την τιμή του κέντρου βάρους των διανυσμάτων που ανήκουν σε αυτά. Η διαδικασία επαναλαμβάνεται μέχρι τη σύγκλιση. Η μέθοδος αυτή αν και έχει το πλεονέκτημα της εύκολης υλοποίησης και των λιγοστών παραμέτρων, μειονεκτεί ως προς την ευαισθησία της στο να συγκλίνει σε τοπικά ελάχιστα, καθώς οι αρχικές τιμές των κέντρων των κλάσεων είναι κρίσιμες. Ένα από τα αίτια του παραπάνω μειονεκτήματος είναι ότι σε όλη την διάρκεια της εκπαίδευσης τα όρια των κλάσεων είναι σαφή (crisp) και δεν υπάρχει κάποια

αλληλεπίδραση μεταξύ των κλάσεων που να μετριάζει την επίδραση του θορύβου κατά την διάρκεια της σύγκλισης. Τα τεχνητά νευρωνικά δίκτυα είναι μια πολύ δημοφιλής προσέγγιση για την κατασκευή αποδοτικών ταξινομητών διανυσμάτων. Τα αυτο-οργανούμενα νευρωνικά δίκτυα είναι η κατάλληλη προσέγγιση για τη μείωση των αποχρώσεων σε έγχρωμες ή γκρι εικόνες. Ένας πολύ γνωστός και αποδοτικός αυτο-οργανούμενος νευρωνικός ταξινομητής είναι ο αυτο-οργανούμενος πίνακας απεικόνισης χαρακτηριστικών του Kohonen (Kohonen Self Organized Feature Map SOFM) [KOHO90], [KOHO97]. Η κύρια λειτουργία του ταξινομητή αυτού, είναι η απεικόνιση διανυσμάτων αυθαίρετης διάστασης σε ένα ή δύο διαστάσεων διακριτό πίνακα χαρακτηριστικών, προκαθορισμένων διαστάσεων. Σε κάθε διακριτή θέση του πίνακα απεικόνισης αντιστοιχεί και ένας νευρώνας-κλάση, καθιστώντας προκαθορισμένες τις σχέσεις γειτνίασης μεταξύ των κλάσεων. Η εκπαίδευση γίνεται ως ακολούθως: για κάθε διάνυσμα εισόδου βρίσκεται η κοντινότερη κλάση νευρώνας και αναπροσαρμόζεται το κέντρο της ώστε να πλησιάσει το διάνυσμα εισόδου. Εκτός από την αναπροσαρμογή της κοντινότερης κλάσης αναπροσαρμόζονται και οι γειτονικές κλάσεις αντίστοιχα. Η ένταση αυτής της αναπροσαρμογής αλλά και το εύρος της γειτονιάς κάθε κλάσης είναι συνάρτηση του αριθμού των επαναλήψεων από την αρχή της εκπαίδευσης, και αρχικά έχουν μεγάλη τιμή ενώ στη συνέχεια μειώνονται στην ελάχιστη τιμή τους. Αν και η παραπάνω μεθοδολογία έχει ως αποτέλεσμα την εξάρτηση από τη σειρά εισαγωγής των διανυσμάτων, καθιστά δυνατό τον έλεγχο της σύγκλισης ως προς τη διάρκεια του, και συμβάλει στη σταθεροποίηση των κέντρων των κλάσεων. Ένα επιπλέον χαρακτηριστικό του ταξινομητή αυτού είναι ότι ενώ οι αρχικά τα όρια των κλάσεων είναι ασαφή, μετά από προκαθορισμένο αριθμό επαναλήψεων οι κλάσεις γίνονται σαφείς. Συγκριτικά λοιπόν ως προς τη προηγούμενη μέθοδο GLA, μπορεί να θεωρηθεί ότι ο ταξινομητής Kohonen SOFM έχει ένα πρόσθετο αρχικό στάδιο αρχικοποίησης των κέντρων των κλάσεων, μάλιστα με αρχικά μεγάλο εύρος γειτονιάς, τόσο ώστε για κάθε διάνυσμα εισόδου να αναπροσαρμόζονται όλες οι κλάσεις, οι αρχικές τιμές των κέντρων των κλάσεων δεν έχουν καμία σημασία καθώς όλες συγκλίνουν στο κέντρο βάρους των δεδομένων. Επίσης, η υλοποίηση του ταξινομητή είναι αρκετά απλή.

Υπάρχουν διάφορες εφαρμογές μείωσης των αποχρώσεων ή τμηματοποίησης εικόνων όπου χρησιμοποιείται ο ταξινομητής Kohonen SOFM. Σύμφωνα με την προσέγγιση του Dekker [DEKK94] το νευρωνικό δίκτυο εκπαιδεύεται με όλα τα διανύσματα που περιγράφουν τα χρώματα των εικονοστοιχείων χρησιμοποιώντας την νόρμα Manhattan για την μέτρηση αποστάσεων. Για την εύρεση της κλάσης που θα ταξινομηθεί ένα διάνυσμα εισόδου δεν χρησιμοποιείται το κριτήριο της ελάχιστης απόστασης από τα κέντρα των κλάσεων αλλά ένα κριτήριο που λαμβάνει υπόψη και την συχνότητα με την οποία μια κλάση επιλέγεται για αναπροσαρμογή ώστε να παράγονται γενικά κλάσεις με όμοιο αριθμό διανυσμάτων να ανήκουν σε αυτές. Σύμφωνα με την προσέγγιση του Huang κ.α [HUCH02] προτείνεται μια δύο σταδίων τμηματοποίηση έγχρωμων εικόνων που οδηγεί σε γενικά συμπαγείς κλάσεις. Αρχικά με τη βοήθεια του ταξινομητή Kohonen SOFM βρίσκεται μια χρωματική παλέτα με μειωμένο αριθμό εγγραφών. Στη συνέχεια για κάθε χρώμα της παλέτας παράγεται ένα χαρακτηριστικό διάνυσμα, τα στοιχεία του οποίου εκφράζουν την «απόσταση» των εικονοστοιχείων της κλάσης από τα υπόλοιπα εικονοστοιχεία των άλλων κλάσεων (στον χώρο της εικόνας). Το σύνολο των χαρακτηριστικών διανυσμάτων εκπαιδεύει ένα νέο ταξινομητή Kohonen SOFM με πολύ μικρότερο αριθμό τελικών κλάσεων. Αξιοποιώντας στατιστικά χαρακτηριστικά, όπως η διασπορά των διανυσμάτων στις νέες κλάσεις, τελικά καθορίζεται ποιες από τις αρχικές χρωματικές κλάσεις πρέπει να ενωθούν, σχηματίζοντας τελικά συμπαγείς περιοχές στην εικόνα. Πρόσφατα οι Ashikur και άλλοι [ASRA03] πρότειναν έναν νευρωνικό ταξινομητή που αποτελείται από τον συνδυασμό του ταξινομητή Kohonen SOFM και ενός νευρωνικού δικτύου με επιτήρηση, του Supervised Counter Propagation Network. Το τελευταίο τοποθετείται στην έξοδο του πρώτου και αναλαμβάνει να βρίσκει κατά τη διάρκεια της εκπαίδευσης τα κέντρα βάρους των κλάσεων που ορίζουν οι νευρώνες εξόδου του Kohonen SOFM βελτιώνοντας την απόδοση του τελευταίου. Ένας επίσης γνωστός και αποδοτικός αυτο-οργανούμενος νευρωνικός ταξινομητής με ιδιαίτερα χαρακτηριστικά είναι το αυτο-οργανούμενο νευρωνικό αέριο (Growing Neural Gas GNG). Σε αντίθεση με τον ταξινομητή Kohonen SOFM, ο GNG ξεκινάει αρχικά με δύο μόνο νευρώνες και κατά την διάρκεια της εκπαίδευσης παρεμβάλλονται νέοι μεταξύ του ζεύγους των νευρώνων που χαρακτηρίζονται από το μεγαλύτερο σφάλμα μέτρησης. Το δίκτυο σταματάει να μεγαλώνει όταν ο αριθμός των κλάσεων φτάσει τον μέγιστο προκαθορισμένο αριθμό.

Ιδιαίτερα χαρακτηριστικά του ταξινομητή αυτού είναι ότι οι σχέσεις γειτνίασης μεταξύ των κλάσεων καθορίζονται δυναμικά και περιγράφονται με πλευρικές συνδέσεις μεταξύ των νευρώνων, τα κέντρα των κλάσεων και οι πλευρικές συνδέσεις αποτελούν σε όλη την διάρκεια της εκπαίδευσης μια καλή περιγραφή του χώρου των δεδομένων, ενώ περιγράφουν με βέλτιστο τρόπο την τοπολογία αυτών, τέλος η πλαστικότητα των κλάσεων (δηλαδή η ικανότητα τους να προσαρμόζονται στα δεδομένα) είναι ίδια σε όλη την διάρκεια της εκπαίδευσης. Το τελευταίο χαρακτηριστικό μπορεί να θεωρηθεί και ως μειονέκτημα καθώς η υπέρμετρη πλαστικότητα εμποδίζει την σύγκλιση των κλάσεων. Όμοια με τον ταξινομητή Kohonen SOFM για κάθε διάνυσμα εισόδου αναπροσαρμόζεται η κοντινότερη κλάση και οι γειτονικές της, καθιστώντας τα όρια αυτών ασαφή. Σε αντίθεση με τον Kohonen SOFM αυτό συμβαίνει σε όλη την διάρκεια της εκπαίδευσης. Επίσης ο ταξινομητής Kohonen SOFM είναι πολύ πιο αργός από τον GNG καθώς (α) σε όλη την διάρκεια της εκπαίδευσης ο αριθμός των νευρώνων είναι ίσος με τον μέγιστο προκαθορισμένο αριθμό και κάθε φορά που εισάγεται ένα διάνυσμα πρέπει να ελεγχθούν όλοι οι νευρώνες, (β) το εύρος της γειτονιάς στον Kohonen SOFM είναι αρχικά πολύ μεγάλο οπότε για κάθε διάνυσμα εισόδου εκτός από την πλησιέστερη κλάση προσαρμόζεται και μεγάλο πλήθος γειτονικών, ενώ στον GNG γειτονικοί νευρώνες είναι μόνο οι άμεσα συνδεδεμένοι. Η ανάλυση κλάσεων, δηλαδή η διαδικασία εύρεσης δομών στα δεδομένα και ο διαχωρισμός αυτών σε ομάδες που καλούνται κλάσεις, χρησιμοποιείται στις περισσότερες τεχνικές που αναφέρθηκαν μέχρι τώρα. Σχεδόν πάντα, για κάποια από αυτά τα δεδομένα δεν είμαστε σίγουροι για τη σωστή απόδοσή τους σε μια ομάδα και κάποια αβεβαιότητα είναι αναπόφευκτη. Για το λόγο αυτό η πρωτοποριακή εργασία του Zadeh [ZADE65] και η εισαγωγή των ασαφών συνόλων (fuzzy sets) µας δίδει ένα εργαλείο για να περιγράψουμε την αβεβαιότητα µε μαθηματικούς όρους. Η ασαφής ανάλυση των δεδομένων σε κλάσεις (fuzzy cluster analysis) επιτρέπει αποτελεσματικές αποδόσεις ασαφών δεδομένων σε κλάσεις και υπολογίζει βαθμούς συμμετοχής σε κάθε κλάση. Σε αυτή την κατηγορία της ασαφούς λογικής, ίσως από τους πιο γνωστούς ταξινομητές διανυσμάτων είναι ο Fuzzy C Mean (FCM) [BEZD81]. Αυτός ο ταξινομητής βασίζει την λειτουργία του στις αρχές της ασαφούς λογικής και μπορεί

να θεωρηθεί η εξέλιξη του GLA που περιγράφηκε παραπάνω. Ο αλγόριθμος FCM απαιτεί σαν είσοδο τον αριθμό των κλάσεων ταξινόμησης, ένα κριτήριο σύγκλισης και ένα συντελεστή που καθορίζει την ασάφεια μεταξύ των κλάσεων. Σε αντίθεση με την μέθοδο GLA κάθε διάνυσμα εισόδου ανήκει σε όλες τις κλάσεις με διαφορετικό όμως βαθμό. Το άθροισμα των βαθμών συμμετοχής ενός διανύσματος σε όλες τις κλάσεις είναι πάντα μονάδα. Σε αντίθεση με τους ταξινομητές Kohonen SOFM και GNG, που ο χρήστης ρυθμίζει το συντελεστή για την ένταση αναπροσαρμογής των κλάσεων και το βαθμό επιρροής των γειτονικών κλάσεων, ο αλγόριθμος FCM χρησιμοποιώντας τους βαθμούς συμμετοχής προσδιορίζει με αυτόματο τρόπο τις παραπάνω ποσότητες για κάθε κλάση. Πριν την έναρξη της εκπαίδευσης αρχικοποιούνται οι κλάσεις ταξινόμησης των διανυσμάτων. Για κάθε διάνυσμα εισόδου υπολογίζεται ο βαθμός συμμετοχής για όλες τις κλάσεις, όταν αυτό γίνει για όλα τα διανύσματα, τα κέντρα των κλάσεων αναπροσαρμόζονται, λαμβάνοντας υπόψη τους βαθμούς συμμετοχής των διανυσμάτων. Τα παραπάνω επαναλαμβάνονται μέχρι την σύγκλιση. Όπως είναι φανερό, η μέθοδος FCM είναι πιο αργή σε σχέση με όλες τις προηγούμενες, καθώς ο αριθμός των κλάσεων είναι πάντα σταθερός, για κάθε διάνυσμα εισόδου υπολογίζονται οι βαθμοί συμμετοχής για όλες τις κλάσεις, ο υπολογισμός των βαθμών συμμετοχής έχει πολύπλοκες πράξεις, και τέλος για την αναπροσαρμογή των κλάσεων λαμβάνονται υπόψη οι βαθμοί συμμετοχής όλων των διανυσμάτων οι οποίοι πρέπει να αποθηκεύονται σε προσωρινή μνήμη. Επίσης, καθώς το άθροισμα των βαθμών συμμετοχής ενός διανύσματος για όλες τις κλάσεις πρέπει να είναι πάντα μονάδα (συσχετισμένοι βαθμοί συμμετοχής), ακόμα και τα πολύ απομακρυσμένα, από όλες τις κλάσεις, διανύσματα δίνουν μεγάλους βαθμούς συμμετοχής κάτι που δεν είναι σωστό καθώς προσεγγίζεται ο θόρυβος. Επιπλέον, ο ταξινομητής FCM δεν ανιχνεύει την τοπολογία των δεδομένων όπως ο GNG. Από την άλλη μεριά καθώς τα όρια των κλάσεων είναι ασαφή και υπάρχει αλληλεπίδραση μεταξύ τους, ο FCM έχει λιγότερες πιθανότητες να συγκλίνει σε τοπικό ελάχιστο, σε σχέση τουλάχιστον με τον GLA, ενώ για μικρό συντελεστή ασάφειας (περίπου 1,5 με 1,2) συγκλίνει σε πολύ καλά αποτελέσματα. Συμπερασματικά και μετά την ανάλυση που έγινε στις τεχνικές εύρεσης κλάσεων, μπορούμε να τις διαχωρίσουμε σε τρεις κύριες κατηγορίες : 1. Τεχνικές αυστηρής (hard) λογικής, οι οποίες αποδίδουν ένα στοιχείο σε µία µόνο κλάση.

2. Τεχνικές ασαφούς (fuzzy) λογικής, οι οποίες αποδίδουν για κάθε στοιχείο βαθμό συμμετοχής σε κάθε µία από τις κλάσεις. 3. Υβριδικές τεχνικές, οι οποίες συνδυάζουν τις παραπάνω δύο κατηγορίες όπως οι neuro-fuzzy τεχνικές που είναι συνδυασμός νευρωνικών δικτύων και αλγορίθμων ασαφούς λογικής. Στα σχήματα που ακολουθούν δίνονται μια σειρά από παραδείγματα μείωσης των αποχρώσεων έγχρωμων εικόνων με τη χρήση επιλεγμένων τεχνικών. Στα σχήματα (α) φαίνονται οι αρχικές έγχρωμες εικόνες (24 bit). Τα χρώματα της πρώτης εικόνας μειώνονται στα τέσσερα, ενώ της δεύτερης στα οκτώ. Οι τεχνικές που εφαρμόστηκαν και στις δύο εικόνες είναι κατά σειρά του Dekker (σχ. β), του ταξινομητή του Kohonen (σχ. γ), η Median Cut (σχ. δ) και του Wu (σχ. ε). Μετά από μια συγκριτική μελέτη των τεχνικών εκτίμησης αλλά και αυτών της μείωσης των χρωμάτων έγχρωμων εικόνων, αποφασίστηκε στο επόμενο διάστημα, ως μια πρώτη προσέγγιση, να συνδυαστούν η μέθοδος της «τεθλασμένης γραμμής» (για την εκτίμηση των βασικών χρωμάτων) και ο αυτοοργανούμενος νευρωνικός ταξινομητής του Kohonen (για τη μείωση των χρωμάτων). Ο αριθμός των νευρώνων εξόδου του νευρωνικού δικτύου, θα υπολογίζονται από τη μέθοδο της «τεθλασμένης γραμμής», η οποία θα εφαρμόζεται αρχικά στο gray-scale ιστόγραμμα της αρχικής εικόνας.

(α) Αρχικές Εικόνες

(β) Μείωση των χρωμάτων με τη χρήση της τεχνικής του Dekker

(γ) Μείωση των χρωμάτων με τη χρήση του ταξινομητή του Kohonen

(δ) Μείωση των χρωμάτων με τη χρήση της τεχνικής Median Cut

(ε) Μείωση των χρωμάτων με τη χρήση της τεχνικής του Wu

Βιβλιογραφία [ASHD94] [ASRA03] [ATSPA02] I. Ashdown, "Octree color quantization", from the book: Radiosity-A Programmer's Perspective, Wiley, New York, 1994. A.K.M. Ashikur Rahman and C.M. Rahman, A new approach for compressing color images using neural network, CIMCA 2003, Processing of CIMCA 2003, pp. 12-14, Vienna, Austria, 2003. A. Atsalakis, N. Papamarkos and I. Andreadis, "On estimation of the number of image principal colors and color reduction through selforganized neural networks", Int. Journal of Imaging Systems and Technology, vol. 12, Issue 3, pp. 117-127, 2002. [ATSPA03] A. Atsalakis, N. Papamarkos, N. Kroupis, D. Soudris, A Color Quantization Technique Based On Image Decomposition And Its Hardware Implementation IEE Proceedings Vision, Image and Signal Processing, έχει γίνει δεκτό για δημοσίευση. [BEZD81] [CARL87] [DEKK94] [HECK82] [HUCH02] [KASA85] J.C. Bezdek, Pattern recognition with fuzzy objective function algorithms, Plenum, New York, 1981. M. J. Carlotto, Histogram analysis using scale-space approach, IEEE Trans. Pattern Anal. Mach. Intell., vol. 9, no 1, pp. 121 129, 1987. A.H. Dekker, "Kohonen neural networks for optimal color quantization", Network: Computation in Neural Systems, vol. 5, pp. 351-367, 1994. P. Heckbert, "Color image quantization for frame buffer display", Computer & Graphics, vol. 16, pp. 297-307, 1982. Hui-Yu Huang, Yung-Sheng Chen, Wen-Hsing Hsu, Color image segmentation using a self-organized map algorithm, Journal of Electronic Imaging, vol. 11, no. 2, pp. 136-148, 2002. J.N. Kapur, P. K. Sahoo, and A. K.Wong, A new method for graylevel picture thresholding using the entropy of the histogram, Comput. Vision Graphics Image Process, vol 29, pp. 273 285, 1985.

[KIIL86] J. Kittler and J. Illingworth, Minimum error thresholding, Pattern Recognition, vol. 19, pp. 41 47, 1986. [KOHO90] T. Kohonen, "The self-organizing map," Proceedings of IEEE vol. 78, no. 9, pp.1464-1480, 1990. [KOHO97] [LIBU80] [PAGA94] [RERU84] [OTSU79] [TSCH84] [WAPR90] T. Kohonen, Self-Organizing Maps, 2nd Edition, Springer Verlag, Berlin, 1997. Y. Linde, A. Buzo and R.M. Gray, "An algorithm for vector quantizer design", IEEE Transactions on Communications, vol. 28, pp. 84-95, 1980. N. Papamarkos and B. Gatos, A new approach for multithreshold selection, CVGIP: Graph. Models Image Process.vol 56, pp. 357 370, 1994. S.S. Reddi, S. F. Rudin, and H. R. Keshavan, An optimal multiple threshold scheme for image segmentation, IEEE Trans. Systems Man Cybernet, vol. 14, no. 4, pp. 661-665, 1984. N. Otsu, A threshold selection method from gray-level histograms, IEEE Trans. Systems Man Cybernet., vol 9, no 1, pp. 62-69, 1979. D. Tsai and Y. Chen, A fast histogram-clustering approach for multilevel thresholding, Pattern Recognition Lett., vol. 13, pp. 46-67, 1984. S.J. Wan, P. Prusinkiewicz and S.K.M. Wong, "Variance based color image quantization for frame buffer display", Color Research and Application, vol. 15, no. 1, pp. 52-58, 1990. [WAWO88] S.Wan, S.Wong, and P.Prusinkiewicz, An Algorithm for Multidimentional Data Clustering, ACM Trans. Math. Softw., vol. 14 no. 2, pp. 153-162, June 1988. [WU1992] X. Wu, Color quantization by dynamic programming and principal analysis, ACM Transactions on Graphics, vol. 11, no. 4, pp. 384 372, 1992. [ZADE65] L.A.Zadeh, Fuzzy Sets, Information and Control 8, pp. 338-353, 1965.