ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ & ΕΠΙΚΟΙΝΩΝΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΕΞΥΠΝΩΝ ΠΟΛΥΜΕΣΩΝ & ΕΙΚΟΝΙΚΗΣ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑΣ

Σχετικά έγγραφα
Συστήματα Πολυμέσων. Ενότητα 4: Θεωρία Χρώματος. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 11 η : θεωρία Χρώματος & Επεξεργασία Έγχρωμων Εικόνων

Μελέτη χαρτογραφικής οπτικοποίησης χρονικά μεταβαλλόμενων κλιματικών δεδομένων του Ελλαδικού χώρου για άτομα με δυσχρωματοψία.

Εισαγωγή σε οπτική και μικροσκοπία

Επεξεργασία Χαρτογραφικής Εικόνας

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή

Έγχρωµο και Ασπρόµαυρο Φως

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Γνωστική Ψυχολογία Ι (ΨΧ32)

Ηχρήση του χρώµατος στους χάρτες

Εφαρμογές Πληροφορικής

2.0 ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ-ΟΡΟΛΟΓΙΕΣ

Βίντεο και κινούµενα σχέδια

ΌΡΑΣΗ. Εργασία Β Τετράμηνου Τεχνολογία Επικοινωνιών Μαρία Κόντη

ΦΩΤΟΡΕΑΛΙΣΜΟΣ & ΚΙΝΗΣΗ (ΘΕΩΡΙΑ)

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακή Εικόνα. Αντίληψη χρωμάτων Συστήματα χρωμάτων Κβαντισμός χρωμάτων

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Πόσες λέξεις αξίζει µια εικόνα; Εικόνα

Δx

ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Σχεδίαση με Ηλεκτρονικούς Υπολογιστές

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Φυσική των οφθαλμών και της όρασης. Κική Θεοδώρου

Οδηγός ποιότητας χρωμάτων

Εισαγωγή Ασπρόμαυρο Halftoning γάμμα Φως/Χρώμα Χρωματικά Μοντέλα Άλλα. 6ο Μάθημα Χρώμα. Γραφικα. Ευάγγελος Σπύρου

Χρώµατα! τεχνολογία Οι Card χρωµατικοί splitter v3 χώροι και η τηλεόραση. Οι χρωµατικοί χώροι και η τηλεόραση

Α.Τ.Ε.Ι. Ηρακλείου Ψηφιακή Επεξεργασία Εικόνας ιδάσκων: Βασίλειος Γαργανουράκης. Ανθρώπινη Όραση - Χρωµατικά Μοντέλα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Τεχνολογία Πολυμέσων. Ενότητα # 5: Εικόνα Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Γεώργιος Φίλιππας 23/8/2015

ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ ΤΟ ΦΩΣ

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ

Παρουσίαση Νο. 4 Ψηφιακή Καταγραφή Εικόνας

ΕΡΩΤΗΣΕΙΣ ΣΤΗ ΘΕΩΡΙΑ ΧΡΩΜΑΤΩΝ

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ ΤΕΛΟΣ 1ΗΣ ΣΕΛΙΔΑΣ

Επεξεργασία Χαρτογραφικής Εικόνας

5 Σχετικιστική μάζα. Στο Σ Πριν Μετά. Στο Σ

ΠΑΡΑΤΗΡΗΣΗ ΣΥΝΕΧΩΝ ΦΑΣΜΑΤΩΝ ΕΚΠΟΜΠΗΣ & ΑΠΟΡΡΟΦΗΣΗΣ ΣΤΕΡΕΟΥ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Φωτοτεχνία. Ενότητα 1: Εισαγωγή στη Φωτομετρία

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

«Το χρώμα είναι το πλήκτρο. Το μάτι είναι το σφυρί. Η ψυχή είναι το πιάνο με τις πολλές χορδές»

Τι θα προτιμούσατε; Γνωστική Ψυχολογία Ι (ΨΧ32) 25/4/2012. Διάλεξη 5 Όραση και οπτική αντίληψη. Πέτρος Ρούσσος. Να περιγράψετε τι βλέπετε στην εικόνα;

ΕΡΓΑΣΤΗΡΙΟ ΑΤΟΜΙΚΗΣ ΦΥΣΙΚΗΣ

Αναγνώριση Προτύπων Ι

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

Φύλλο Εργασίας. Σύνθεση χρωμάτων

ΠΡΟΤΥΠΟ ΠΕΙΡΑΜΑΤΙΚΟ ΛΥΚΕΙΟ ΕΥΑΓΓΕΛΙΚΗΣ ΣΧΟΛΗΣ ΣΜΥΡΝΗΣ

ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ

Οδηγός ποιότητας χρωμάτων

1) Η εξάρτηση του δείκτη διάθλασης n από το μήκος κύματος για το κρύσταλλο του ιωδιούχου ρουβιδίου (RbI) παρουσιάζεται στο παρακάτω σχήμα.

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Οδηγίες σχεδίασης στο περιβάλλον Blender

Η χρήση του χρώµατος στη χαρτογραφία και στα ΣΓΠ

Φασματοφωτομετρία. Φασματοφωτομετρία είναι η τεχνική στην οποία χρησιμοποιείται φως για τη μέτρηση της συγκέντρωσης χημικών ουσιών.

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

ΜΕΤΡΗΣΗ ΤΗΣ ΣΤΑΘΕΡΑΣ ΤΟΥ PLANCK

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ 1 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ

Ψηφιακή Επεξεργασία Εικόνων

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

4.3. Γραµµικοί ταξινοµητές

TFT TV. Τι είναι οι TFT και πως λειτουργούν;

ΤΕΧΝΟΛΟΓΙΑ ΠΑΡΑΓΩΓΗΣ Ι ΕΡΓΑΣΤΗΡΙΟ-2 Υ: ΜΗ ΚΑΤΑΣΤΡΟΦΙΚΟΙ ΕΛΕΓΧΟΙ

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΠΟΥ ΔΙΑΔΙΔΕΤΑΙ ΤΟ ΦΩΣ

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Θεμελιώδη μεγέθη και νόμοι της φωτομετρίας και πρότυπα για έργα φωτισμού οδών, εξωτερικών χώρων και σηράγγων

8 o ΓΕ.Λ. ΠΑΤΡΑΣ Η ΕΠΙΚΟΙΝΩΝΙΑ ΤΟΥ ΧΡΩΜΑΤΟΣ EΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ - ΤΑΞΗ Α - ΤΜΗΜΑ 1 ΘΕΜΑ: Σταμπουλή Ιωάννα. Υπεύθυνη Εκπαιδευτικός:

Θοδωρής Μπεχλιβάνης Αναστασία Συμεωνίδου Κατερίνα Παπά

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Όλα τα θέματα των εξετάσεων έως και το 2014 σε συμβολή, στάσιμα, ηλεκτρομαγνητικά κύματα, ανάκλαση - διάθλαση Η/Μ ΚΥΜΑΤΑ. Ερωτήσεις Πολλαπλής επιλογής

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται

Χημεία Γ Λυκείου Θετικής Κατεύθυνσης

Σχεδίαση Διαφανειών. Πρακτικός Οδηγός. Μιχαηλίδη Αφροδίτη

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

ΗΛΕΚΤΡΟΝΙΑΚΗ ΔΟΜΗ ΤΩΝ ΑΤΟΜΩΝ ΚΑΙ ΠΕΡΙΟΔΙΚΟΣ ΠΙΝΑΚΑΣ

ΔΙΑΓΩΝΙΣΜΑ ΦΥΣΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Β και Γ ΛΥΚΕΙΟΥ.

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) +

Γραμμικός Προγραμματισμός Μέθοδος Simplex

ΤΕΧΝΟΛΟΓΙΑ ΜΗ ΚΑΤΑΣΤΡΟΦΙΚΟΥ ΕΛΕΓΧΟΥ 4 ο ΜΑΘΗΜΑ ΘΕΩΡΙΑ 2017

Τηλεπισκόπηση. Ψηφιακή Ανάλυση Εικόνας Η ΒΕΛΤΙΩΣΗ εικόνας

5. Η ΕΙΚΟΝΑ ΣΤΑ ΠΟΛΥΜΕΣΑ

ΗΛΕΚΤΡΟΝΙΑΚΗ ΔΟΜΗ ΤΩΝ ΑΤΟΜΩΝ Η ΔΟΜΗ ΤΟΥ ΑΤΟΜΟΥ II. ΤΟ ΦΩΣ ΜΟΝΤΕΛΟ ΤΟΥ BOHR Ν. ΜΠΕΚΙΑΡΗΣ

θεωρία χρώματος & χρωματικά μοντέλα 11/4/2016 Λήδα Στάμου Χαρτογραφία Ι 1

Εργαστηριακή άσκηση L0: Ασφάλεια και προστασία από ακτινοβολία Laser. Σύγκριση έντασης ακτινοβολίας Laser με συμβατικές πηγές φωτός

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017

Ραδιομετρία. Φωτομετρία

ETY-202. Εκπομπή και απορρόφηση ακτινοβολίας ETY-202 ΎΛΗ & ΦΩΣ 12. ΎΛΗ & ΦΩΣ. Στέλιος Τζωρτζάκης 21/12/2012

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 5 ΣΕΛΙΔΕΣ

προς τα θετικά του x άξονα. Ως κύμα η ηλεκτρομαγνητική ακτινοβολία (άρα και το φως) ικανοποιούν τη βασική εξίσωση των κυμάτων, δηλαδή: c = λf (1)

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

1ο Κριτήριο Αξιολόγησης ΦΥΣΗ ΤΟΥ ΦΩΤΟΣ-ΑΝΑΚΛΑΣΗ, ΙΑΘΛΑΣΗ- ΕΙΚΤΗΣ ΙΑΘΛΑΣΗΣ

Ομαδοποίηση ΙΙ (Clustering)

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ...σελ. 3. ΕΙΣΑΓΩΓΗ...σελ. 4

ΕΡΓΑΣΤΗΡΙΟ ΦΥΣΙΚΗΣ ΧΗΜΕΙΑΣ ΤΜΗΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ Φασματοφωτομετρία

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ & ΕΠΙΚΟΙΝΩΝΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΕΞΥΠΝΩΝ ΠΟΛΥΜΕΣΩΝ & ΕΙΚΟΝΙΚΗΣ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑΣ Προσαρμογή Χρωμάτων σε Ψηφιακούς Πίνακες Τέχνης για τη Βελτίωση της Οπτικής Αντίληψης Ατόμων με Αχρωματοψία: Χρήση Τεχνικών Ασαφούς Κβάντισης Διανύσματος ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΑΤΡΙΒΗ ΣΤΟΝ ΤΟΜΕΑ ΕΙΔΙΚΕΥΣΗΣ: ΨΗΦΙΑΚΗ ΣΧΕΔΙΑΣΗ ΠΟΛΙΤΙΣΜΙΚΩΝ ΠΡΟΪΝΤΩΝ του ΔΟΛΙΩΤΗ ΠΑΥΛΟΥ Επιβλέπων: ΓΕΩΡΓΙΟΣ ΤΣΕΚΟΥΡΑΣ, Επίκουρος Καθηγητής ΙΟΥΝΙΟΣ 2008, ΜΥΤΙΛΗΝΗ

... the only people for me are the mad ones, the ones who are mad to live, mad to talk, mad to be saved, desirous of everything at the same time, the ones who never yawn or say a commonplace thing; but, BURN, BURN, BURN, BURN... like, fabulous yellow Roman candles... exploding like spiders across the stars... and in the middle you see blue center-light pop; and everybody goes "awwww".... Jack Kerouac

Περιεχόμενα ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ... 3 1 ΚΩΔΙΚΟΠΟΙΗΣΗ ΧΡΩΜΑΤΟΣ & ΔΙΑΤΑΡΑΧΕΣ... 9 ΧΡΩΜΑΤΙΚΗΣ ΟΡΑΣΗΣ... 9 1.1 Ανθρώπινη αντίληψη φωτός και χρώματος... 9 1.2 Διαταραχές έγχρωμης ανθρώπινης όρασης - Πρωτανοπία... 12 1.3 Χρωματικά μοντέλα και ο χρωματικός χώρος RGB... 16 1.3.1 Προσθετικό μοντέλο (RGB)... 16 1.3.2 Aφαιρετικό μοντέλο (CMY)... 19 1.3.3 Χρωματικό μοντέλο HSB... 20 1.4 Απεικόνιση έγχρωμης ψηφιακής εικόνας στο χώρο RGB... 21 2 ΑΣΑΦΗΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ... 22 2.1 Εισαγωγή... 22 2.2 Ασαφής λογική (fuzzy logic)... 25 2.3 Ο αλγόριθμος των Ασαφών c-μέσων (fuzzy C-Means)... 32 2.4 Βέλτιστη ομαδοποίηση με χρήση του fuzzy C-means αλγορίθμου... 35 3 ΠΡΟΤΕΙΝΟΜΕΝΗ ΜΕΘΟΔΟΣ... 39 3.1 Προσομοίωση πρωτανοπικής όρασης με ψηφιακή επεξεργασία εικόνας... 39 3.2 Δαλτόνιση Εικόνας (Image Daltonization)... 41 3.3 Κβάντιση Χρωμάτων... 45 3.4 Έλεγχος Χρωματικής Ομοιότητας (Colour Checking Module)... 46 3.5 Προτεινόμενος Aλγόριθμος, επιλογή παραμέτρων δαλτόνισης... 48 4 ΠΕΙΡΑΜΑΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ-ΑΠΟΤΕΛΕΣΜΑΤΑ... 54 5 ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ-ΣΥΜΠΕΡΑΣΜΑΤΑ... 60 ΠΑΡΑΡΤΗΜΑ Α... 62 ΒΙΒΛΙΟΓΡΑΦΙΑ... 68

Εισαγωγή ΕΙΣΑΓΩΓΗ Η ελαττωματική οπτική αντίληψη χρώματος είναι ένα σύνηθες φαινόμενο αφού περίπου το 8%-12% του ανδρικού και το 0.5% του γυναικείου πληθυσμού της Ευρώπης παρουσιάζει σε κάποιο βαθμό μία από τις διάφορες μορφές χρωματικής διαταραχής στην όραση. Αν και δεν υπάρχει γνωστή ιατρική μέθοδος που να διορθώνει αυτήν την βλάβη της ανθρώπινης όρασης, δεν θεωρείται ότι άτομα που παρουσιάζουν τέτοιου είδους διαταραχές υποφέρουν από κάποια σοβαρής μορφής δυσλειτουργία. Εντούτοις υπάρχουν περιπτώσεις στις καθημερινές δραστηριότητες αυτών των ανθρώπων που η σύγχυση των χρωμάτων μπορεί να γίνει από ενοχλητική (π.χ. ανάγνωση ιστοσελίδων) έως επικίνδυνη (π.χ. οδική σήμανση). Κατά συνέπεια υπάρχει έντονο ερευνητικό ενδιαφέρον γύρω από το φαινόμενο της προβληματικής αντίληψης χρωμάτων με αποτέλεσμα να έχουν αναπτυχθεί διάφορες τεχνικές και αλγόριθμοι που προσομοιώνουν ψηφιακά αυτού του είδους την ελαττωματική όραση. Επιπλέον έχουν προταθεί μέθοδοι βελτίωσης (daltonization techniques) της χρωματικής πληροφορίας ψηφιακών εικόνων προκειμένου να μειώνεται σε ορισμένες περιπτώσεις η χρωματική σύγχυση. Σκοπός της παρούσας μεταπτυχιακής διατριβής είναι η μελέτη αλγορίθμων ασαφούς συσταδοποίησης (fuzzy clustering) δεδομένων και η εφαρμογή τους στην ψηφιακή επεξεργασία έγχρωμων εικόνων (colour quantization, image segmentation). Παράλληλα μελετούνται μέθοδοι προσαρμογής χρώματος σε ψηφιακές εικόνες για την βελτίωση της οπτικής αντίληψης ατόμων που «πάσχουν» από πρωτανοπία (μία από τις κατηγορίες ανώμαλης χρωματικής όρασης). Στη συνέχεια προτείνεται μία νέα μέθοδος που μπορεί να υπολογίζει αυτόματα τις κατάλληλες παραμέτρους προσαρμογής των έγχρωμων ψηφιακών εικόνων. Προκειμένου να επιτευχθεί αυτό, πρώτα υλοποιείται μία ομαδοποίηση όλων των εικονοστοιχείων (pixels) σε συστάδες (clusters) και έπειτα ακολουθεί ένας διαχωρισμός των χρωματικών συστάδων (ή αλλιώς κλάσεων) της εικόνας σε δύο βασικές κατηγορίες. Στην πρώτη κατηγορία υπάρχει ορθή οπτική αντίληψη των συγκεκριμένων χρωμάτων και δεν απαιτείται η βελτίωση αυτών, ενώ στη δεύτερη κατατάσσονται αυτά που συγχέονται από κάποιον που «πάσχει» από πρωτανοπία. Τα χρώματα που πρέπει να βελτιωθούν προσαρμόζονται με βάση τις αρχικοποιημένες παραμέτρους προσαρμογής και ακολούθως γίνεται ένας έλεγχος (colour 3

Εισαγωγή checking module) για το αν υπάρχει ταύτιση με κάποια από τις χρωματικές συστάδες της προαναφερθείσας πρώτης κατηγορίας. Αν υπάρχει χρωματική ταύτιση, τότε οι παράμετροι προσαρμογής αλλάζουν επαναληπτικά μέχρι να διαφοροποιηθούν εντελώς οι περιοχές χρώματος. Η καινοτομία της μεθόδου που προτείνεται σε αυτή την εργασία έγκειται στη σημαντική ελαχιστοποίηση του υπολογιστικού κόστους για την υλοποίηση του τελικού αλγορίθμου, καθότι με τη χρήση κατάλληλης τεχνικής ασαφούς συσταδοποίησης δεδομένων (fuzzy c-means) ομαδοποιούνται τα εικονοστοιχεία της ψηφιακής εικόνας σε χρωματικές συστάδες, με αποτέλεσμα να μειώνεται αισθητά ο αριθμός των επαναλήψεων που τροποποιούν σταδιακά τις καθοριστικές παραμέτρους προσαρμογής. Στο τέλος παρουσιάζονται αρκετά αποτελέσματα από τις εργαστηριακές προσομοιώσεις καθώς και συγκριτικά παραδείγματα ψηφιακών πινάκων ζωγραφικής και έργων τέχνης, στα οποία εφαρμόστηκε ο αλγόριθμος. Οι ψηφιακοί πίνακες τέχνης παρουσιάζουν μεγάλη χρωματική ποικιλία καθώς και αλληλεπικαλυπτόμενες χρωματικές περιοχές. Τα δύο αυτά χαρακτηριστικά τους καθιστούν πολύ δύσκολα επεξεργάσιμους σε αλγοριθμικό, επίπεδο λόγω της αυξημένης στατιστικής αλληλοσυσχέτισης (cross-correlation). Κατά συνέπεια αποτελούν ιδανική εφαρμογή για τον έλεγχο της αξιοπιστίας του προτεινόμενου αλγορίθμου επεξεργασίας έγχρωμης εικόνας, ο οποίος περιγράφεται στο παρόν κείμενο. Παράλληλα τεκμηριώνεται και η αποδοτικότητά του, πάντα σε σύγκριση με προηγούμενες αντίστοιχες μεθόδους προσαρμογής χρώματος. Είναι σημαντικό το γεγονός ότι η προτεινόμενη μέθοδος με μία μικρή παραμετροποίηση μπορεί να εφαρμοστεί και σε άλλες περιπτώσεις χρωματικής διαταραχής όρασης, όπως στη συχνά εμφανιζόμενη δευτερανοπία, περισσότερη γνωστή και με τον όρο δαλτονισμός. Κλείνοντας αναλύονται τα χρήσιμα συμπεράσματα που προκύπτουν από την παραπάνω μελέτη ενώ επίσης προτείνονται μελλοντικές βελτιώσεις και ιδέες για περαιτέρω έρευνα. Πιο συγκεκριμένα, περιθώρια βελτίωσης υπάρχουν τόσο στην προτεινόμενη μέθοδο ασαφούς συσταδοποίησης δεδομένων που οδηγεί στη μείωση χρώματος της ψηφιακής εικόνας όσο και στο τμήμα του αλγορίθμου που κατηγοριοποιεί τις χρωματικές συστάδες ανάλογα με το αν προκαλούν σύγχυση σε κάποιον που «πάσχει» από πρωτανοπία η όχι. 4

Εισαγωγή Παρακάτω ακολουθεί μία σύντομη περιγραφή για το κάθε κεφάλαιο της διατριβής ξεχωριστά. Στο εισαγωγικό 1 ο κεφάλαιο γίνεται μία ανάλυση σχετικά με την αντίληψη του φωτός και των χρωμάτων από το ανθρώπινο μάτι, ενώ επίσης περιγράφονται συνοπτικά οι βασικές κατηγορίες ανώμαλης χρωματικής όρασης. Υπάρχει επίσης μία σύντομη αναφορά σε μοντέλα χρωματικών χώρων καθώς και η περιγραφή του τρόπου με τον οποίο κωδικοποιείται το χρώμα σε αυτά. Βασισμένη σε αυτή τη λογική, γίνεται και η χαρτογράφηση (ή αλλιώς απεικόνιση) μίας ολόκληρης έγχρωμης ψηφιακής εικόνας στον τρισδιάστατο χρωματικό χώρο RGB. Το ορατό φάσμα φωτός που μπορεί να αντιληφθεί το ανθρώπινο μάτι έχει μήκος κύματος που κυμαίνεται από 400nm έως 700nm. Κάθε μήκος κύματος συμβολίζει και μία διαφορετική περιοχή χρώματος. Όταν μία ποσότητα φωτός εισέρχεται στο ανθρώπινο μάτι καταλήγει στον αμφιβληστροειδή χιτώνα, όπου υπάρχουν τοποθετημένοι ειδικοί νευρώνες με την ονομασία φωτοϋποδοχείς (photo-receptors). Οι φωτοϋποδοχείς αποτελούνται από κύτταρα που ονομάζονται κωνία, τα οποία με τη σειρά τους περιέχουν φωτοευαίσθητες χρωστικές ουσίες (photo-pigments) που ουσιαστικά είναι υπεύθυνες για την αντίληψη των χρωμάτων. Υπάρχουν τρία είδη κωνικών κυττάρων: S, M, και L που είναι ευαίσθητα αντίστοιχα σε μικρά, μεσαία και μεγάλα μήκη κύματος και είναι υπεύθυνα για την απορρόφηση του μπλε, πράσινου και κόκκινου χρώματος. Κάθε κωνίο απορροφά και στέλνει μέσω του οπτικού νεύρου, εκείνη την ποσότητα ενέργειας φωτός που μπορεί να δει. Το σήμα ερμηνεύεται στον εγκέφαλο και δημιουργείται η αντίληψη του χρώματος. Όταν κάποιο από αυτά τα κωνία απουσιάζει ή όταν παρατηρείται απόκλιση από το φυσιολογικό φάσμα απορρόφησης τότε δημιουργείται ανωμαλία στην οπτική αντίληψη του χρώματος. Η πρωτανοπία που θα μας απασχολήσει στην παρούσα διατριβή παρατηρείται όταν απουσιάζει το L κωνίο. Περιγράψαμε με ποιο τρόπο το χρώμα αναλύεται σε τρεις συνιστώσες και πως ουσιαστικά κάθε φάσμα μπορεί να παρασταθεί με τρία σήματα Αυτό το φαινόμενο είναι ευρύτερα γνωστό ως τριχρωμία και έχει άμεση εφαρμογή στη ψηφιακή απεικόνιση έγχρωμων εικόνων. Τα χρωματικά μοντέλα βασισμένα σε αυτή τη φιλοσοφία, (όπως το RGB προσθετικό μοντέλο) έχουν αναπτυχθεί για την περιγραφή των χρωμάτων με μαθηματική μορφή, κατάλληλη για την επεξεργασία τους από ψηφιακά μέσα. Επιπλέον κάθε εικόνα αποτελείται από εικονοστοιχεία, το καθένα από τα οποία απαιτεί τρεις συνιστώσες (διάνυσμα τριών 5

Εισαγωγή διαστάσεων) για να αναπαρασταθεί σε οποιοδήποτε χρωματικό χώρο. Μία εικόνα λοιπόν στον χώρο RGB είναι δυνατόν να αναπαρασταθεί με ένα νέφος σημείων. Αυτή η θεώρηση είναι καθοριστικής σημασίας και θα μας ακολουθεί σε όλο το υπόλοιπο της παρούσας εργασίας. Στο 2 ο Κεφάλαιο γίνεται μία επισκόπηση γνωστών μεθόδων ταξινόμησης δεδομένων και εύρεσης συστάδων (κλάσεων) αυτών, όπως η fuzzy C-means. Η τεχνική αυτή βασίζεται στην ασαφή λογική,η οποία επίσης αναλύεται συνοπτικά σε αυτό το κεφαλαίο. Όπως αναφέρθηκε πριν, τα εικονοστοιχεία αναπαρίστανται ως διανύσματα τριών διαστάσεων σε κάποιο χρωματικό χώρο και μία εικόνα κατ επέκταση είναι ένα νέφος σημείων σε αυτόν τον τρισδιάστατο χώρο. Σκοπός μας είναι να διαχωρίσουμε αυτό το νέφος σημείων σε ομάδες με τον καλύτερο δυνατό τρόπο και να αποδώσουμε στο τέλος της διαδικασίας σε κάθε σημείο τις συντεταγμένες του κέντρου της ομάδας στην οποία αυτό ανήκει, πετυχαίνοντας έτσι την περιγραφή της εικόνας με λιγότερα σημεία δηλαδή με λιγότερα χρώματα (κβάντιση χρώματος-colour quantization). Αυτή η οικογένεια αλγορίθμων ταξινόμησης δεδομένων αποτελεί ανεξάρτητο τομέα έρευνας και δεν αφορά αποκλειστικά την ψηφιακή επεξεργασία εικόνας. Έχει εφαρμογές σε διάφορα ερευνητικά πεδία όπως: αναγνώριση προτύπων, εξόρυξη γνώσης από τον παγκόσμιο ιστό ή από πολυμεσικό περιεχόμενο κ.α. Για να γίνει ο διαχωρισμός των δεδομένων σε συστάδες (κλάσεις) πρέπει να ικανοποιούνται δύο σημαντικά κριτήρια: Ομοιογένεια μέσα στις συστάδες, δηλαδή δεδομένα που ανήκουν σε μία συστάδα να είναι όσο το δυνατόν πιο όμοια μεταξύ τους. Ανομοιογένεια ανάμεσα στις συστάδες, δηλαδή δεδομένα που ανήκουν σε διαφορετικές συστάδες να είναι όσο το δυνατόν πιο ανόμοια μεταξύ τους. Αυτό που μένει να ορίσουμε είναι η έννοια της ομοιότητας μεταξύ δύο δεδομένων (διανυσμάτων τριών συνιστωσών στην περίπτωσή μας). Ένα κλασικό κριτήριο (για τη μέτρηση της ομοιότητας) που χρησιμοποιείται συνήθως είναι η ευκλείδεια απόσταση. Βέβαια υπάρχουν και άλλα κριτήρια που προτείνονται στη διεθνή βιβλιογραφία και η κατάλληλη επιλογή αυτών, ανάλογα με την περίπτωση, αποτελεί ξεχωριστό πεδίο έρευνας το οποίο όμως ξεφεύγει από τους σκοπούς της παρούσας διατριβής. Ένα άλλο 6

Εισαγωγή σημαντικό ζήτημα είναι αν κατά τη διαδικασία της ταξινόμησης ένα διανυσματικό δεδομένο θα ανήκει σε μία μόνο συστάδα (αυστηρή -hard- λογική) ή θα μπορεί να ανήκει σε πολλές συστάδες (ασαφής-fuzzy- λογική).στην δεύτερη περίπτωση για κάθε δεδομένο αποδίδεται ένας βαθμός συμμετοχής στις διάφορες συστάδες. Υπάρχουν και υβριδικές τεχνικές που είναι ένας συνδυασμός hard και fuzzy λογικής. Το πρόβλημα της βέλτιστης επιλογής (optimal clustering) του συνολικού αριθμού των συστάδων στις οποίες ομαδοποιούνται τελικά τα δεδομένα μας, αποτελεί άλλο ένα σημαντικό πεδίο έρευνας το οποίο αναλύεται πριν κλείσει αυτό το κεφάλαιο. Στο 3 ο κεφάλαιο περιγράφεται αναλυτικά η προτεινόμενη μέθοδος που έχει σαν στόχο την προσαρμογή χρωμάτων σε ψηφιακούς πίνακες ζωγραφικής για τη βελτίωση της οπτικής αντίληψης ατόμων με πρωτανοπία. Το πρώτο βήμα είναι να χωρίσουμε τα εικονοστοιχεία μίας εικόνας σε συστάδες, σύμφωνα με τις μεθόδους που αναλύθηκαν στο 2 ο Κεφάλαιο. Κάθε συστάδα περιγράφεται από ένα κεντρικό διάνυσμα τριών τιμών που στην ουσία συμβολίζει και ένα χρώμα RGB. Για κάθε τριάδα τιμών R, G, B μπορούμε να υπολογίσουμε τις αντίστοιχες τιμές R p, G p, B p τις οποίες αντιλαμβάνεται ένας πρωτανοπικός. Με αυτό τον τρόπο ουσιαστικά προσομοιώνουμε την πρωτανοπική όραση. Υπολογίζουμε τη διαφορά Error={R-R p, G-G p, B-B p} καθώς και μία τιμή για το κατώφλι θ (threshold) και στη συνέχεια μέσω μίας συνθήκης ελέγχου Error>θ*{R, G, B} διαχωρίζουμε τα χρώματα σε δύο κατηγορίες. Στην πρώτη κατηγορία υπάρχει ορθή οπτική αντίληψη των συγκεκριμένων χρωμάτων και δεν απαιτείται η βελτίωση αυτών, ενώ στη δεύτερη κατατάσσονται αυτά που συγχέονται από κάποιον που «πάσχει» από πρωτανοπία. Τα χρώματα που πρέπει να βελτιωθούν προσαρμόζονται με βάση κάποιες αρχικοποιημένες παραμέτρους μετατροπής και ακολούθως γίνεται ένας έλεγχος (colour checking module) αν υπάρχει ταύτιση με κάποια από τις χρωματικές συστάδες της προαναφερθείσας πρώτης κατηγορίας. Αν υπάρχει χρωματική ταύτιση, τότε οι παράμετροι προσαρμογής αλλάζουν επαναληπτικά μέχρι να διαφοροποιηθούν εντελώς οι περιοχές χρώματος και να πάψει να υπάρχει χρωματική σύγχυση. 7

Εισαγωγή Στο 4 ο κεφάλαιο παρουσιάζονται αρκετά αποτελέσματα από τις εργαστηριακές προσομοιώσεις καθώς και συγκριτικά παραδείγματα-εικόνες από την εφαρμογή του αλγορίθμου σε ψηφιακούς πίνακες ζωγραφικής και έργα τέχνης. Με αυτόν τον τρόπο τεκμηριώνεται η αποτελεσματικότητα και η αποδοτικότητα της προτεινόμενης μεθόδου, πάντα και σε σύγκριση με προηγούμενες αντίστοιχες τεχνικές προσαρμογής χρώματος. Ο προγραμματισμός όλων των αλγορίθμων και οι προσομοιώσεις έγιναν σε περιβάλλον MATLAB 7.0.1 Στο 5 ο κεφάλαιο αναλύονται τα χρήσιμα συμπεράσματα που προκύπτουν από την παραπάνω μελέτη ενώ επίσης προτείνονται μελλοντικές βελτιώσεις και ιδέες για περαιτέρω έρευνα. Πιο συγκεκριμένα, περιθώρια βελτίωσης υπάρχουν τόσο στην προτεινόμενη μέθοδο ασαφούς συσταδοποίησης δεδομένων που οδηγεί στη μείωση χρώματος της ψηφιακής εικόνας όσο και στο τμήμα του αλγορίθμου που υπολογίζει το βέλτιστο αριθμό των συστάδων (optimal clustering). Συγκεκριμένα, παρατηρήθηκε ότι ενώ το optimal clustering λειτουργεί αποτελεσματικά για εικόνες με ευδιάκριτες και λίγες στον αριθμό χρωματικές περιοχές, όταν αυξάνει η πολυπλοκότητα της χρωματικής κατανομής τότε τα αποτελέσματα δεν είναι ικανοποιητικά. Επίσης βελτίωση απαιτείται στο τμήμα του αλγορίθμου που κατηγοριοποιεί τις χρωματικές συστάδες ανάλογα με το αν προκαλούν σύγχυση σε κάποιον που «πάσχει» από πρωτανοπία η όχι. 8

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης 1 ΚΩΔΙΚΟΠΟΙΗΣΗ ΧΡΩΜΑΤΟΣ & ΔΙΑΤΑΡΑΧΕΣ ΧΡΩΜΑΤΙΚΗΣ ΟΡΑΣΗΣ 1.1 Ανθρώπινη αντίληψη φωτός και χρώματος Το φως νοούμενο σαν ηλεκτρομαγνητική ακτινοβολία μπορεί να αναλυθεί σε ένα φάσμα διαφορετικών συχνοτήτων. Το ηλεκτρομαγνητικό φάσμα περιλαμβάνει ακτινοβολίες που μετρούνται από χιλιοστά του δισεκατομμυριοστού του μέτρου (πχ. ακτίνες γ) μέχρι χιλιόμετρα (πχ. Ακτινοβολίες ραδιοφωνικών και τηλεοπτικών εκπομπών). Το ορατό φάσμα φωτός που μπορεί να αντιληφθεί το ανθρώπινο μάτι έχει μήκος κύματος που κυμαίνεται από 400nm έως 700nm, όπως φαίνεται και στην παρακάτω εικόνα 1.1. Παρατηρούμε ότι κάθε μήκος κύματος συμβολίζει και μία διαφορετική περιοχή χρώματος. Τα ορατά μήκη κύματος ποικίλουν από το ιώδες ως το κόκκινο. Μεγαλύτερο από το ορατό μήκος είναι το υπέρυθρο φως ενώ περιοχές με μικρότερες τιμές ανήκουν στο υπεριώδες. Όταν στο μάτι του ανθρώπου προσπέσουν δύο ακτινοβολίες με διαφορετικά μήκη κύματος η ανθρώπινη όραση συνθέτει τα χρώματα δημιουργώντας καινούργια. Έτσι για παράδειγμα αν μία φωτεινή πηγή μάς φαίνεται ότι εκπέμπει κίτρινο χρώμα μπορεί αυτή να έχει μήκη κύματος στην περιοχή από 560 nm έως 590 nm ή να εκπέμπει ταυτόχρονα κόκκινες και πράσινες ακτινοβολίες που όταν συντίθενται μας δίνουν κίτρινο χρώμα. Για τη δημιουργία των χρωμάτων δεν μας είναι απαραίτητα όλα τα μήκη κύματος του ορατού φωτός αλλά μόνο ορισμένα από αυτά. Με άλλα λόγια στηριζόμενοι σε κάποια χρώματα τα οποία ονομάζουμε βασικά ή πρωτογενή μπορούμε να συνθέσουμε τα υπόλοιπα. Εικόνα 1.1- ηλεκτρομαγνητικό φάσμα και η ορατή περιοχή του 9

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης Βέβαια η αντίληψη του χρώματος από τον ανθρώπινο εγκέφαλο είναι σαφώς μία αρκετά πιο πολύπλοκη διαδικασία. Όταν μία ποσότητα φωτός εισέρχεται στο ανθρώπινο μάτι καταλήγει στον αμφιβληστροειδή χιτώνα. Εκεί υπάρχουν τα κύτταρα που ονομάζονται φωτοϋποδοχείς (photo-receptors) ή φωτοαισθητήρες (photo- sensors) (εικόνα 1.2). Οι φωτοϋποδοχείς περιλαμβάνουν δύο τύπους κυττάρων τα κωνία και τα ραβδία. Τα ραβδία είναι υπεύθυνα για την αντίληψη του αμυδρού φωτός ενώ τα κωνία (ή κωνικά κύτταρα) για την αντίληψη των χρωμάτων. Υπάρχουν τρία είδη κωνικών κυττάρων: S-κωνία: είναι ευαίσθητα σε φωτόνια μικρού μήκους κύματος και παρουσιάζουν μέγιστη ευαισθησία σε μήκος κύματος περίπου 4.200 Å=(angstrom) ή αλλιώς420 nm. Είναι ευαίσθητα στο μπλε φως. Μ-κωνία: είναι ευαίσθητα σε φωτόνια μεσαίου μήκους κύματος και παρουσιάζουν μέγιστη ευαισθησία σε μήκος κύματος περίπου 5.300 Å (530 nm). Είναι ευαίσθητα στο πράσινο φως. L-κωνία: είναι ευαίσθητα σε φωτόνια μεγάλου μήκους κύματος και παρουσιάζουν μέγιστη ευαισθησία σε μήκος κύματος περίπου 5.600 Å (560 nm). Είναι ευαίσθητα στο κόκκινο φως. Εικόνα 1.2- Ανατομία του ανθρώπινου ματιού Η ευαισθησία των κωνίων σε διαφορετικά μήκη κύματος οφείλεται σε φωτοευαίσθητες χρωστικές ουσίες τις φωτοψίνες (photo pigments) οι οποίες περιέχουν κάποιες πρωτεΐνες που ονομάζονται οψίνες. Κάθε είδος κωνίου περιέχει διαφορετικές 10

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης φωτοψίνες. Κατά συνέπεια απορροφά και στέλνει μέσω του οπτικού νεύρου, εκείνη την ποσότητα ενέργειας φωτός που μπορεί να δει. Το σήμα ερμηνεύεται στον εγκέφαλο και δημιουργείται η αντίληψη του χρώματος. Κάθε χρώμα που αντιλαμβανόμαστε οφείλεται στους συνδυασμούς των σημάτων που δίνουν οι φωτοϋποδοχείς. Έτσι, τα βασικά στοιχεία τα οποία αντιλαμβάνεται το ανθρώπινο μάτι, είναι εντάσεις των Κόκκινο Πράσινο και Μπλε, σε μία πολύπλοκη διαδικασία σύνθεσης. Η αίσθησή μας για το χρώμα είναι μία αυτοματοποιημένη ερμηνευτική αντίδραση του ανθρώπινου εγκεφάλου στο μήκος κύματος της ηλεκτρομαγνητικής ακτινοβολίας και όχι κάποια εξωτερική ουσία. Δεδομένου ότι το φάσμα φωτός «αποκωδικοποιείται» σε τρεις τιμές (μία για κάθε κώνο) είναι αυτές οι τιμές που αντιλαμβανόμαστε τελικά και όχι το φάσμα αυτό καθαυτό. (εικόνα 1.3) Εικόνα 1.3- Στάδια αντίληψης χρώματος Περιγράφηκε παραπάνω ο τρόπος με τον οποίο το χρώμα αναλύεται σε τρεις συνιστώσες και πως ουσιαστικά κάθε φάσμα μπορεί να παρασταθεί με τρία σήματα, τα οποία στη συνέχεια μεταβιβάζονται στον ανθρώπινο εγκέφαλο μέσω των οπτικών νεύρων. Αυτό το φαινόμενο είναι ευρύτερα γνωστό και ως τριχρωμία. Το ότι το χρώμα κωδικοποιείται με τρία διαφορετικά σήματα το συναντά συχνά κανείς στις επιστήμες και τις κατασκευές που έχουν σχέση με ψηφιακή επεξεργασία εικόνων. Κατά συνέπεια από εδώ είναι εμπνευσμένη και η φιλοσοφία με την οποία η ψηφιακή αναπαράσταση των έγχρωμων εικονοστοιχείων (pixels) στην οθόνη ενός ηλεκτρονικού υπολογιστή, βασίζεται στις τρεις τιμές R(red), G(green), B(blue). 11

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης 1.2 Διαταραχές έγχρωμης ανθρώπινης όρασης - Πρωτανοπία Αν και η τριχρωματική όραση, η παρουσία δηλαδή τριών διαφορετικών τύπων κωνίων με διαφορετικές φωτοχρωστικές ουσίες, αποτελεί τον φυσιολογικό τύπο έγχρωμης όρασης, ένα σημαντικό ποσοστό των ανθρώπων παρουσιάζει κάποιο βαθμό ανεπάρκειας στην αντίληψη των χρωμάτων. Ενδεικτικά αναφέρουμε ότι περίπου το 8%- 12% του ανδρικού και το 0.5% του γυναικείου πληθυσμού της Ευρώπης παρουσιάζει σε κάποιο βαθμό μία από τις διάφορες μορφές δυσχρωματοψίας. Εδώ πρέπει να τονίσουμε ότι για τη συνέχεια της παρούσας διατριβής θα υιοθετηθεί ο όρος «δυσχρωματοψία», για να υποδηλώσει γενικά κάθε μορφής χρωματική διαταραχή στην ανθρώπινη όραση. Αυτό γίνεται γιατί υπάρχει μία σύγχυση στην οφθαλμολογική και στην οπτομετρική ελληνική κοινότητα σχετικά με τον γενικό ορισμό αυτών των διαταραχών. Η χρήση του όρου "αχρωματοψία" πιθανώς να οδηγεί στο λανθασμένο συμπέρασμα ότι οι "πάσχοντες" δεν αντιλαμβάνονται καθόλου χρώματα. Αντιθέτως, οι περισσότεροι από αυτούς αντιλαμβάνονται μεγάλο εύρος χρωμάτων, και μάλιστα έχουν την ικανότητα να διακρίνουν αποχρώσεις που δεν "βλέπουν" οι άνθρωποι με φυσιολογική όραση. Επιπλέον, χρήσιμο θα ήταν να αποσαφηνίσουμε και την έννοια του όρου «δαλτονισμός». Πρωτοεμφανίστηκε προς τιμή του Άγγλου χημικού John Dalton,όπου το 1798 δημοσιεύει μία σημαντική μελέτη σχετικά με προβλήματα στην χρωματική όραση και αρχικά υποδήλωνε κάθε είδους δυσχρωματοψία. Πλέον ο όρος δαλτονισμός έχει καθιερωθεί ως συνώνυμο της δευτερανοπίας, μία συγκεκριμένη διαταραχή που θα αναλυθεί παρακάτω. Οι διάφορες μορφές ελαττωματικής χρωματικής όρασης που υπάρχουν περιγράφονται στη συνέχεια, ενώ στην εικόνα 1.4 απεικονίζονται τα ποσοστά εμφάνισής τους σε αντρικό και γυναικείο πληθυσμό. Ανώμαλη Τριχρωματική: εδώ υπάρχουν και οι τρεις τύποι κωνίων αλλά το πρόβλημα εντοπίζεται σε κάποια από τις αντίστοιχες φωτοχρωστικές ουσίες, η οποία θα παρουσιάζει φάσμα απορρόφησης διαφορετικό από το κανονικό. Όταν το φάσμα απορρόφησης της χρωστικής ουσίας μακρών κυμάτων (L) είναι ανώμαλο ή ανεπαρκές ο όρος πρωτανομαλία χρησιμοποιείται. Σε αυτή την περίπτωση το φάσμα απορρόφησης της χρωστικής (L) είναι μετατοπισμένο σε μικρότερα μήκη κύματος, πιο κοντά στην (Μ). Παρόμοια 12

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης ορολογία χρησιμοποιείται για τις άλλες δύο κατηγορίες «διαταραχών». Δευτερανομαλία έχουμε όταν οι φωτοχρωστικές των κωνίων Μ είναι ελαττωματικές (μετατοπισμένες σε μεγαλύτερα μήκη κύματος) και τριτανομαλία έχουμε όταν οι φωτοχρωστικές των κωνίων S είναι ελαττωματικές (πολύ πιο σπάνια περίπτωση) Διχρωματική: εδώ υπάρχει η απώλεια ενός από τους τύπους των κωνίων. Αυτού του είδους διαταραχή είναι και η συνηθέστερη περίπτωση, όπως εμφανίζεται σε ορισμένες κληρονομικές διαταραχές. Μειώνει την αντίληψη της έγχρωμης όρασης σε δύο διαστάσεις, οδηγώντας στον διχρωματισμό. Ανάλογα με το ποιος τύπος κωνίου απουσιάζει δημιουργούνται τρεις υποκατηγορίες. Η πρώτη υποκατηγορία (με αυθαίρετη σειρά προτεραιότητας) είναι η πρωτανοπία. Εδώ παρατηρείται απουσία του L κωνίου και όπως είναι γνωστό περιέχει φωτοποϋδοχείς οι οποίοι απορροφούν περιοχή φάσματος που αντιστοιχεί στο κόκκινο χρώμα. Δευτερανοπία είναι η δεύτερη υποκατηγορία και εδώ παρατηρείται η απουσία του Μ κωνίου, υπεύθυνο για την αντίληψη περιοχής φάσματος που αντιστοιχεί στο πράσινο. Τριτανοπία, που είναι και η πιο σπάνια περίπτωση, έχουμε όταν απουσιάζει το S κωνίο. Μονοχρωματική: εδώ παρατηρείται η απώλεια δύο τύπων κωνίων, πολύ σπάνια περίπτωση, οδηγεί στην μονοχρωματική όραση, ενώ η απώλεια και των τριών τύπων κωνίων (που καλείται "ράβδιο-μονοχρωματική όραση") εξαφανίζει την αντίληψη χρωμάτων και ως κατάληξη η όραση περιορίζεται στην λειτουργία των ραβδίων. Εικόνα 1.4- Ποσοστά εμφάνισης χρωματικών ανωμαλιών όρασης 13

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης Παρακάτω ακολουθούν κάποιες συγκριτικές εικόνες προκειμένου να γίνουν ακόμα πιο κατανοητές οι προηγούμενες έννοιες και κατηγοριοποιήσεις Τα χρώματα του ουράνιου τόξου υπό φυσιολογική όραση Τα χρώματα του ουράνιου τόξου υπό όραση με πρωτανοπία Τα χρώματα του ουράνιου τόξου υπό όραση με δευτερανοπία Τα χρώματα του ουράνιου τόξου υπό όραση με τριτανοπία Εικόνα 1.5- Χρωματικές διαταραχές όρασης και αντίληψη χρωμάτων Στην παρούσα εργασία θα εστιάσουμε σε μία συγκεκριμένη κατηγορία ανώμαλης χρωματικής όρασης, την πρωτανοπία. 14

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης Η αντίληψη των χρωμάτων αποτελεί μία σημαντική λειτουργία της ανθρώπινης όρασης, δεδομένου ότι διευκολύνει στην αντίληψη και στην αναγνώριση εικόνων και αντικειμένων. Επιπλέον, παρέχει μία αίσθηση στην οπτική μας εμπειρία που, θεμελιώδης για την αντίληψή μας για τον κόσμο. Αυτό μπορεί να γίνει αντιληπτό και από τα τυχόν προβλήματα που ανακύπτουν στις καθημερινές δραστηριότητες ατόμων που παρουσιάζουν κάποια ανωμαλία στην χρωματική όραση. Τα προβλήματα αυτά ποικίλουν από απλώς ενοχλητικά (π.χ. ανάγνωση ιστοσελίδων, επιλογή ρουχισμού, μαγείρεμα) έως άκρως επικίνδυνα (π.χ. οδική σήμανση). Εντούτοις, εάν τα παραπάνω είναι αληθινά, τότε παραμένει η απορία γιατί ένα μεγάλο ποσοστό του πληθυσμού παρουσιάζει ελαττωματική αντίληψη των χρωμάτων. Είναι πιθανόν, τα άτομα με διχρωματική όραση ή ανώμαλη τριχρωματική όραση να έχουν την ικανότητα να διακρίνουν κάποια χρωματικά-παραλλαγμένα αντικείμενα, τα οποία δεν είναι διακριτά σε εκείνους με φυσιολογική έγχρωμη όραση. Έχει διατυπωθεί από ορισμένους ερευνητές ότι σε χρονικές περιόδους που ο «ανεφοδιασμός» των τροφίμων ήταν δυσχερής, οι άνθρωποι με διχρωματική όραση είχαν εξελικτικό πλεονέκτημα να εντοπίσουν την τροφή τους σε ορισμένα περιβάλλοντα (π.χ. διάφορα φρούτα ή ζώα που μπορούσαν να παραλλαχθούν ανάμεσα σε πυκνές φυλλωσιές από τους ανθρώπους με φυσιολογική όραση) και να επιβιώσουν. Παρά την τεράστια σημασία της και τις μακροχρόνιες έρευνες που σχετίζονταν με την αντίληψη των χρωμάτων, υπάρχει ακόμα σημαντικό πεδίο έρευνας όσο αφορά τους φυσιολογικούς μηχανισμούς που αποτελούν την βάση της χρωματικής αντίληψης και τους παράγοντες που οδήγησαν στην εξέλιξή της. 15

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης 1.3 Χρωματικά μοντέλα και ο χρωματικός χώρος RGB Τα χρωματικά μοντέλα που θα αναλυθούν παρακάτω έχουν αναπτυχθεί για την περιγραφή των χρωμάτων με μαθηματική μορφή, κατάλληλη για την επεξεργασία τους από ψηφιακά μέσα. Μία ψηφιακή εικόνα είναι ένα «ψηφιδωτό» στοιχειωδών σημείων τα οποία διαθέτουν την απαραίτητη πληροφορία φωτεινότητας και χρώματος ώστε συνολικά να μπορούν να δημιουργήσουν στον παρατηρητή την αίσθηση της εικόνας. Τα στοιχειώδη αυτά σημεία ονομάζονται εικονοστοιχεία (pixels), το καθένα από τα οποία είναι ομοιογενές και απαιτεί τρεις συνιστώσες για να αναπαρασταθεί σε οποιοδήποτε χρωματικό χώρο, γιατί με τρεις συνιστώσες φιλτράρεται και το φάσμα του φωτός από το ανθρώπινο μάτι.. Τα παρακάτω μοντέλα αφορούν αυτήν την κωδικοποίηση του χρώματος ενός εικονοστοιχείου. 1.3.1 Προσθετικό μοντέλο (RGB) Το προσθετικό μοντέλο RGB βασίζεται στην τριχρωματική θεωρία «tristimulus» του Young & Helmholtz, που υποστηρίχθηκε και από πειράματα του Maxwell. Το μοντέλο αυτό υποστηρίζει ότι κάθε χρώμα δημιουργείται από την ανάμιξη των τριών πρωτευόντων χρωμάτων σε ποικίλες αναλογίες και εντάσεις. Τα τρία βασικά χρώματα είναι: κόκκινο, πράσινο και μπλε (red, green, blue) εικόνα 1.6 Εικόνα 1.6- Μοντέλο RGB Ο χώρος RGB είναι ευρύτερα γνωστός γιατί είναι ο χώρος που χρησιμοποιείται από τις συσκευές που εκπέμπουν φως όπως είναι οι οθόνες των υπολογιστών. Με τα βασικά 16

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης αυτά χρώματα κωδικοποιεί όλα τα χρώματα που μπορεί να εμφανιστούν σε μία οθόνη υπολογιστή. (εικόνα 1.7) Εικόνα 1.7- Κάθε εικονοστοιχείο κωδικοποιείται με τρεις τιμές RGB Στην 8bit (2 8 =256) μορφή του χρωματικού αυτού μοντέλου κάθε χρώμα μπορεί να παρασταθεί με μία τριάδα αριθμών (που στην ουσία αποτελεί διάνυσμα στον τρισδιάστατο χώρο) από 0 έως 255. Το μοντέλο βασίζεται στο γεγονός ότι όταν μία οθόνη δεν εκπέμπει φως εμφανίζεται μαύρη. Τα υπόλοιπα χρώματα δημιουργούνται με υπέρθεση των τριών βασικών με συγκεκριμένη αναλογία. Τα βασικά, τα δευτερογενή χρώματα και μερικά παραδείγματα δίνονται παρακάτω στην 8bit αυτή έκδοση του μοντέλου: Στο μαύρο υπάρχει έλλειψη όλων των χρωμάτων (0,0,0). Το λευκό προκύπτει από το συνδυασμό και των τριών βασικών χρωμάτων σε ίση ποσότητα (256,256,256). Τα χρώματα κόκκινο (256,0,0), πράσινο (0,256,0) και μπλε (0,0,256) θεωρούνται τα βασικά χρώματα από τα οποία προκύπτουν όλα τα άλλα με συνδυασμό αυτών. Το κίτρινο (256,256,0) προκύπτει με συνδυασμό πράσινου και κόκκινου και δεν περιέχει μπλε. (δευτερογενές χρώμα) Το κυανό (0,256,256) προκύπτει με συνδυασμό πράσινου μπλε και δεν περιέχει κόκκινο. (δευτερογενές χρώμα) 17

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης Το μοβ (magenta) (256,0,256) προκύπτει με συνδυασμό κόκκινου μπλε και δεν περιέχει πράσινο. (δευτερογενές χρώμα) Το μοντέλο RGB μπορεί να παρασταθεί και με έναν κύβο χρωμάτων σε ένα καρτεσιανό σύστημα τριών αξόνων, όπως φαίνεται και στην παρακάτω εικόνα 1.8. Στην αρχή των αξόνων είναι η κορυφή του κύβου που αντιστοιχεί στο μαύρο χρώμα, ενώ στις κορυφές του κύβου που βρίσκονται πάνω στους άξονες βρίσκονται τα βασικά χρώματα (Κόκκινο, Πράσινο, Μπλε). Τα δευτερογενή χρώματα βρίσκονται στις τρεις κορυφές του κύβου που βρίσκονται απέναντι από τα αντίστοιχα βασικά χρώματα και στην κορυφή απέναντι από το μαύρο βρίσκεται το λευκό. Κάθε χρώμα στο σύστημα αυτό προσδιορίζεται από ένα σημείο στον κύβο με τρεις συντεταγμένες. Στη διαγώνιο μεταξύ μαύρου και λευκού βρίσκονται όλες οι αποχρώσεις του γκρι. Στην 16bit μορφή της μεθόδου τα δυνατά χρώματα είναι 2 16 =65536 αντί 2 8 =256 του 8bit. Εικόνα 1.8-Τρισδιάστατη αναπαράσταση χώρου RGB με 8bit ανά χρώμα Ο RGB χρωματικός χώρος παρέχει έτσι μία μεγάλη ευκολία κατά την επεξεργασία των ψηφιακών εικόνων γιατί το αποτέλεσμα της επεξεργασίας απεικονίζεται απευθείας στην οθόνη χωρίς να χρειάζεται κάποια άλλη μετατροπή. 18

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης 1.3.2 Aφαιρετικό μοντέλο (CMY) Ενώ το μοντέλο RGB προϋποθέτει την ύπαρξη μιας πηγής φωτός για τη δημιουργία χρώματος, το μοντέλο CMY (εικόνα 1.9) βασίζεται στην απορροφητική ικανότητα της τυπωμένης μελάνης. Αποτελείται από τα συμπληρωματικά χρώματα Κυανό, Ματζέντα και Κίτρινο (Cyan, Magenta, Yellow). Εικόνα 1.9- Μοντέλο CMY Μερικοί δυνατοί χρωματικοί συνδυασμοί που προκύπτουν με βάση το παραπάνω μοντέλο είναι οι εξής: Κίτρινο + Ματζέντα = Κόκκινο Κίτρινο + Κυανό = Πράσινο Κυανό + Ματζέντα = Μπλε Κυανό Ματζέντα + Κίτρινο = Μαύρο Θεωρητικά αν κάνουμε την εξής πρόσθεση100%κόκκινο + 100%Πράσινο + 100%Μπλε το αναμενόμενο αποτέλεσμα θα ήταν Μαύρο. Βέβαια κάτι τέτοιο δε συμβαίνει στην πραγματικότητα όπου το τελικό χρώμα που λαμβάνουμε είναι ένα σκούρο καφέ: 100%Κόκκινο + 100%Πράσινο + 100%Μπλε = σκούρο καφέ. Τα μελάνια όμως από τη φύση τους δεν μπορούν να αποδώσουν συγκεκριμένα μήκη κύματος χρώματα (όπως τα εικονοστοιχεία (pixels) μίας οθόνης) αλλά μία ευρεία περιοχή του χρωματικού φάσματος. Το αποτέλεσμα είναι συνδυασμός των τριών βασικών χρωμάτων 19

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης να δίνει ένα καφετί χρώμα αντί για το μαύρο. Για το λόγο αυτό προστέθηκε στο μοντέλο CMY και το μαύρο μελάνι με αποτέλεσμα να προκύψει το χρωματικό μοντέλο CMYK (Cyan Magenta Yellow Black). Πρακτικά στην εκτύπωση δεν χρησιμοποιείται σήμερα το CMY μοντέλο αλλά το CMYK. Το μοντέλο CMY μπορεί να παρασταθεί όπως και το RGB με ένα κύβο σε ένα καρτεσιανό σύστημα αξόνων με το λευκό χρώμα στην αρχή των αξόνων και τα βασικά χρώματα πάνω στους άξονες. 1.3.3 Χρωματικό μοντέλο HSB Το χρωματικό μοντέλο HSB αναλύει το χρώμα σε τρεις παραμέτρους: Χροιά (Ηue), δηλαδή θέση στον χρωματικό κύκλο (τιμές από 0-360) Κορεσμός (Saturation), δηλαδή ένταση του χρώματος, με τιμές από 0-100%. Ελάχιστος κορεσμός ισοδυναμεί με ασπρόμαυρη b&w εικόνα. Επίσης ο κορεσμός αναφέρεται στο πόσο μακριά είναι ένα χρώμα από ένα γκρι ίδιας έντασης Φωτεινότητα (Brightness), δηλαδή ένταση της λαμπρότητας του χρώματος, με τιμές από 0-100%. Ελάχιστη φωτεινότητα (minimum brightness) ασπρόμαυρη b&w εικόνα Επιτρέπει 3,564,000 διαφορετικά χρώματα συν 101 διαβαθμίσεις του γκρι. Εικόνα 1.10- Χρωματικό μοντέλο HSB 20

Κεφάλαιο 1 ο Κωδικοποίηση χρώματος και διαταραχές χρωματικής όρασης 1.4 Απεικόνιση έγχρωμης ψηφιακής εικόνας στο χώρο RGB Παραπάνω, αναλύθηκε ο τρόπος με τον οποίο ένα εικονοστοιχείο μπορεί να αναπαρασταθεί ως ένα διάνυσμα τριών τιμών σε ένα τρισδιάστατο χρωματικό χώρο. Με την ίδια ακριβώς λογική μπορεί να γίνει η και απεικόνιση μίας ολόκληρης ψηφιακής εικόνας σε κάποιον αντίστοιχο χρωματικό χώρο. Το αποτέλεσμα θα είναι ένα νέφος σημείων, όπως φαίνεται παρακάτω στην περίπτωση για τον RGB χρωματικό χώρο, (εικόνα 1.11). Εικόνα 1.11-Απεικόνιση ψηφιακής εικόνας στον RGB χρωματικό χώρο Ένας από τους στόχους αυτής της διπλωματικής διατριβής, είναι η ταξινόμηση αυτών των σημείων του νέφους σε συστάδες με τον βέλτιστο τρόπο, πετυχαίνοντας τελικά την περιγραφή της εικόνας με λιγότερα σημεία (τα κέντρα των συστάδων), δηλαδή με λιγότερα χρώματα. Η διαδικασία αυτή ονομάζεται κβάντιση χρώματος (colour quantization). 21

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 2 ΑΣΑΦΗΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ 2.1 Εισαγωγή Μία έγχρωμη ψηφιακή εικόνα είναι δυνατόν να αποτελείται από εκατομμύρια διαφορετικά χρώματα καθότι αν για παράδειγμα έχουμε μία εικόνα των 24-bit στον RGB χρωματικό χώρο, το σύνολο των συνδυασμών που προκύπτουν ισούται με 2 24. Επίσης οι έγχρωμες εικόνες αποτελούν ένα μεγάλο ποσοστό του συνολικού όγκου πληροφορίας που διακινείται στο διαδίκτυο και που γενικότερα χρησιμοποιείται από τις σύγχρονες ψηφιακές τεχνολογίες. Κατά συνέπεια είναι επιτακτική η ανάγκη για μείωση της χρωματικής πληροφορίας, εξασφαλίζοντας παράλληλα την ποιότητα εμφάνισης της τελικής εικόνας, δηλαδή πετυχαίνοντας τη μικρότερη δυνατή παραμόρφωση. Η μείωση χρωμάτων των ψηφιακών εικόνων σχετίζεται άμεσα με τα εξής: παρουσίαση και εκτύπωση εικόνων με λιγότερο αριθμό χρωμάτων συμπίεση του μεγέθους των εικόνων. ταχύτερη μετάδοσή τους. τμηματοποίηση των εικόνων (image segmentation) Οι πιο βασικές τεχνικές μείωσης χρωμάτων είναι η κβάντιση χρωμάτων (color quantization) και η πολυκατωφλίωση. Η μείωση χρωμάτων μπορεί να αναλυθεί συνοπτικά σε δύο διακριτά στάδια: την ομαδοποίηση του συνόλου των εικονοστοιχείων σε συστάδες χρωμάτων. Κάθε εικονοστοιχείο θα πρέπει να ανήκει σε μία συστάδα η οποία περιγράφεται με ένα κεντρικό διάνυσμα (χρώμα). την ανακατασκευή της τελικής εικόνας, αντικαθιστώντας κάθε εικονοστοιχείο με το αντίστοιχο κεντρικό διάνυσμα της συστάδας στην οποία ανήκει. 22

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων Η κβάντιση χρωμάτων κατατάσσεται σε μία ευρύτερη κατηγορία αλγορίθμων ταξινόμησης δεδομένων, η οποία αποτελεί ανεξάρτητο τομέα έρευνας και δεν αφορά αποκλειστικά την ψηφιακή επεξεργασία εικόνας. Έχει εφαρμογές σε διάφορα ερευνητικά πεδία όπως: αναγνώριση προτύπων, εξόρυξη γνώσης από τον παγκόσμιο ιστό ή από πολυμεσικό περιεχόμενο κ.α. Με την ταξινόμηση δεδομένων σε συστάδες ή αλλιώς ανάλυση συστάδων (cluster analysis), ουσιαστικά έχουμε σαν στόχο να διαχωρίσουμε με βέλτιστο τρόπο ένα αρχικό σύνολο δεδομένων σε συστάδες, εικόνα 2.1. Εικόνα 2.1- Ταξινόμηση δεδομένων σε συστάδες Θέλοντας να το επιτύχουμε αυτό με τον βέλτιστο τρόπο, αναγκαστικά πρέπει να υιοθετήσουμε κάποια κριτήρια και παραδοχές, οι οποίες θα αναλυθούν με λεπτομέρεια στις επόμενες υποενότητες. Η βασικότερη εκ των παραδοχών, μας επιβάλλει να εξασφαλίσουμε την μέγιστη ομοιότητα μεταξύ δεδομένων που ανήκουν στην ίδια συστάδα και τη μέγιστη διαφορετικότητα μεταξύ αυτών που ανήκουν σε διαφορετικές συστάδες, (Bezdek and Pal, 1992)[14]. Επίσης άλλο ένα σημαντικό ζήτημα αποτελεί το αν είναι επιτρεπτή η παράλληλη συμμετοχή ενός δεδομένου σε πολλές συστάδες ή όχι. Αν ένα δεδομένο μπορεί να ανήκει σε μία μόνο συστάδα, τότε υιοθετείται μία αυστηρή (hard) λογική ενώ στην αντίθετη περίπτωση υιοθετείται μία ασαφής (fuzzy) λογική, η οποία επιλύει πολλά από τα προβλήματα της ταξινόμησης δεδομένων. Έτσι, σύμφωνα με την προηγούμενη ανάλυση οι τεχνικές εύρεσης συστάδων μπορούν να χωριστούν στις εξής κατηγορίες: 23

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων Τεχνικές αυστηρής (hard) λογικής, οι οποίες αποδίδουν ένα στοιχείο σε μία μόνο συστάδα. Τεχνικές ασαφούς (fuzzy) λογικής, οι οποίες αποδίδουν για κάθε στοιχείο βαθμό συμμετοχής σε κάθε μία από τις συστάδες. Υβριδικές τεχνικές, οι οποίες συνδυάζουν τις παραπάνω δύο κατηγορίες. Παρακάτω, στις επόμενες υποενότητες ακολουθεί μία λεπτομερής ανάλυση της ασαφούς λογικής και της ασαφούς συσταδοποίησης δεδομένων. Παράλληλα παρουσιάζεται και η πιο διαδεδομένη τεχνική εύρεσης συστάδων, o αλγόριθμος των ασαφών c-μέσων ( fuzzy c-means). 24

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 2.2 Ασαφής λογική (fuzzy logic) Όπως αναφέραμε και στην εισαγωγή, στην ανάλυση συστάδων μπορεί να υιοθετηθεί μία αυστηρή (hard) και μία ασαφής (fuzzy) λογική. Το βασικό δομικό στοιχείο της ασαφούς λογικής είναι το ασαφές σύνολο (Zadeh, 1965) [15]. Η κύρια διαφορά μεταξύ του κλασσικού ή διακριτού (crisp set) και του ασαφούς (fuzzy set) συνόλου είναι ότι η συνάρτηση συμμετοχής του πρώτου παίρνει τις τιμές 0 ή 1, ενώ του δευτέρου ανήκει στο κλειστό διάστημα [0, +1]. Συνεπώς, η ασαφής λογική είναι μία επέκταση της κλασσικής λογικής, η οποία περιέχει δύο λογικές τιμές (αληθής και ψευδής) (Klir, 1995) [16]. Παρακάτω ακολουθούν δύο γενικοί ορισμοί, οι οποίοι προσδιορίζουν τη δομή του διακριτού και του ασαφούς συνόλου: Ορισμός 2.1: Έστω U το πεδίο ορισμού της μεταβλητής x. Ένα διακριτό (κλασσικό) σύνολο Α ορισμένο στο U χαρακτηρίζεται από την παρακάτω συνάρτηση συμμετοχής των στοιχείων του, 1, αν x A μ Α ( x ) = με μ Α : U {0, 1} (2.2-1) 0, αλλιως & Ορισμός 2.2: Έστω U το πεδίο ορισμού της μεταβλητής x. Ένα ασαφές σύνολο Α ορισμένο στο U χαρακτηρίζεται από την παρακάτω συνάρτηση συμμετοχής των στοιχείων του, f ( x) [ 0, 1], αν x A μ Α( x ) = με μ Α : U [0, 1] (2.2-2) 0, aλλιως & Ενώ η αυστηρή λογική είναι κατάλληλη για περιγραφή και επίλυση θεμάτων που ανήκουν στην επιστήμη των Μαθηματικών, η θεωρία της ασαφούς λογικής αναπτύχθηκε από την ανάγκη να εκφράσουμε πραγματικά γεγονότα με πιο ρεαλιστικό τρόπο, χωρίς να λαμβάνουμε υπόψη διακριτούς περιορισμούς. Για παράδειγμα, έστω ότι θέλουμε να 25

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων κατατάξουμε όλα τα σημεία των κύκλων σε δύο διαφορετικές ομάδες με βάση την απόσταση από τα κέντρα τους. Στην εικόνα 2.2 απεικονίζονται δύο αλληλεπικαλυπτόμενοι κύκλοι C 1, C 2 και δύο σημεία τομής αυτών X 1, X 2. Σύμφωνα με την αυστηρή θεώρηση θα έπρεπε να κατατάξουμε τα δύο αυτά σημεία σε έναν μόνο από τους δύο κύκλους, κάτι που φυσικά δεν ισχύει στην πραγματικότητα. Το ίδιο φυσικά θα ισχύει και για κάθε άλλο σημείο (X 3, X 4, X 5 ) που θα ισαπέχει από τα κέντρα των κύκλων. Για να περιγραφεί πιο αποδοτικά αυτή η περίπτωση, πρέπει να υιοθετηθεί η ασαφής λογική, σύμφωνα με την οποία επιτρέπεται ένα σημείο να ανήκει ταυτόχρονα σε δύο ομάδες ή και περισσότερες ομάδες. Εικόνα 2.2- Ομαδοποίηση των σημείων δύο αλληλεπικαλυπτομένων κύκλων Ένα από τα βασικά προβλήματα στον σχεδιασμό ασαφών συστημάτων είναι ο προσδιορισμός των συναρτήσεων συμμετοχής. Οι πιο διαδεδομένες συναρτήσεις συμμετοχής (εικόνα 2.3) είναι η τριγωνική, η τραπεζοειδής, και η γκαουσσιανή (Klir, 1995) [16], οι οποίες αναλύονται στην συνέχεια: Τριγωνική Συνάρτηση Συμμετοχής Η τριγωνική συνάρτηση συμμετοχής δίνεται από την παρακάτω σχέση, 0, αν x < a x a, αν a x < b b a μ( x) = x c, αν b x < c c b 0, αν x c (2.2-3) 26

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων μ() x μ() x 1 1 x a b c a b c d x ( α ) ( β) μ() x 1 3σ/ 2 c () γ x Εικόνα 2.3: Ασαφή σύνολα με: (α) τριγωνική, (β) τραπεζοειδή και (γ) γκαουσσιανή συνάρτηση συμμετοχής. Όπως φαίνεται στο σχήμα 2.3(α), το κέντρο του τριγώνου είναι το σημείο b στο οποίο αντιστοιχεί ο μέγιστος βαθμός συμμετοχής, και τα σημεία a, c είναι τα ακραία σημεία της βάσης του τριγωνικού συνόλου. Τραπεζοειδής Συνάρτηση Συμμετοχής Η τραπεζοειδής συνάρτηση συμμετοχής ορίζεται ως εξής: 27

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 0, αν x < a x a, αν a x < b b a μ( x) = 1, αν b x < c (2.2-4) x d, αν c x< d d c 0, αν x d Διαγραμματικά, η τραπεζοειδής συνάρτηση συμμετοχής φαίνεται στο σχήμα 2.3(β) Γκαουσσιανή Συνάρτηση Συμμετοχής Η γκαουσσιανή συνάρτηση συμμετοχής δίνεται από την παρακάτω σχέση 2 ( c x) μ( x ) = exp[ ] (2.2-5) 2 σ Το σχήμα 2.3(γ) παρουσιάζει τη δομή της συνάρτησης συμμετοχής. Οι περισσότερες τεχνικές ομαδοποίησης λαμβάνουν ως δεδομένη την μορφή των συναρτήσεων συμμετοχής και αυτό οφείλεται στο γεγονός ότι θεωρούν πως υπάρχει διαθέσιμη κάποια ελάχιστη πληροφορία για το πραγματικό σύστημα. Στις περιπτώσεις όμως που το πραγματικό σύστημα είναι εντελώς άγνωστο ( μαύρο κουτί ) το ποσοστό επιτυχίας των μεθόδων αυτών μειώνεται αρκετά. Αυτό το πρόβλημα αντιμετωπίζεται με την χρήση της θεωρίας ασαφούς ομαδοποίησης (fuzzy clustering analysis) ενός συνόλου δεδομένων σε ασαφείς υποομάδες (fuzzy clusters) (Dunn, 1973, Bezdek and Pal, 1992). Ο παρακάτω ορισμός δίνει πιο αναλυτικά την έννοια του ασαφούς C- διαμερισμού ενός χώρου δεδομένων (Pal and Bezdek, 1995). Ορισμός 2.3: Έστω ένα σύνολο (χώρος) διανυσμάτων X = x, x,..., x } με T m x k = [ xk1, xk 2,..., xkm ] R ( 1 k N ) { 1 2 N και C ασαφή υποσύνολα ορισμένα στο Χ με 2 C N. Αν η συνάρτηση συμμετοχής του k-οστού διανύσματος στο i ( 1 i C) ασαφές υποσύνολο είναι μ = μ x ), τότε τα C ασαφή υποσύνολα ορίζουν έναν ik i ( k ασαφή C- διαμερισμό του συνόλου Χ όταν ικανοποιούνται οι παρακάτω συνθήκες: 28

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 0 μ 1, i k (2.2-6α) C i= 1 ik, μ = 1, k (2..2-6β) N ik 0< μ < n, i (2..2-6γ) k= 1 ik Για να κατανοήσουμε πως διαφοροποιείται και τι επιπλέον προσθέτει ο προηγούμενος ορισμός σε σχέση με την πιο γενική διατύπωση του ορισμού 2.2, ας θυμηθούμε το παράδειγμα της εικόνας 2.2. Θα περίμενε κάποιος πως οι βαθμοί συμμετοχής για τα σημεία που βρίσκονται κοντά στους κύκλους C 1, C 2 να είναι μεγαλύτεροι από τους βαθμούς συμμετοχής για τα σημεία που είναι τοποθετημένα πιο μακριά από τους κύκλους. Όμως λόγω της συνθήκης 2.2-6β και δεδομένου ότι κάθε σημείο ισαπέχει από τους δύο κύκλους, τελικά προκύπτει ότι όλοι οι βαθμοί συμμετοχής μ ik θα ισούνται με 0,5. Επίσης στην παρακάτω εικόνα 2.4 απεικονίζονται άλλοι δύο κύκλοι C 1, C 2 και τρία σημεία X 1, X 2, X 3 έξω από αυτούς. Εικόνα 2.4- Ασαφής ομαδοποίηση σημείων Εκ πρώτης όψεως θα υποθέταμε ότι βαθμός συμμετοχής στον C 1 για το Χ 1 θα είχε την ίδια τιμή με το X 2, μιας και ισαπέχουν από το κέντρο του C 1. Όμως, το σημείο Χ 2, δεδομένου ότι ισαπέχει από τους δύο κύκλους θα έχει βαθμούς συμμετοχής ίσους με 0,5 για κάθε κύκλο. Το σημείο Χ 1 είναι πιο κοντά στον κύκλο C 1 από ότι στον C 2 και επομένως ο βαθμός συμμετοχής στον C 1 θα ξεπερνάει το 0,5. Κατά συνέπεια απορρίπτεται η αρχική μας υπόθεση. Από την άλλη, δημιουργείται η ψευδής εντύπωση 29

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων ότι το Χ 2 είναι πιο κοντά στον C 1 από ότι το Χ 1. Το συμπέρασμα είναι ότι η συνάρτηση συμμετοχής δε μπορεί να είναι το μοναδικό κριτήριο για τη συμμετοχή ενός δεδομένου σε μία συστάδα. Τα C ασαφή υποσύνολα του παραπάνω ορισμού 2.3 ονομάζονται ασαφείς υποομάδες (fuzzy clusters). Δοσμένου ενός συνόλου στοιχείων, το πρόβλημα του διαμερισμού αυτού του συνόλου σε ασαφείς υποομάδες είναι να ανιχνεύσει τις υποομάδες εκείνες για τις οποίες ισχύουν τα παρακάτω (Bezdek and Pal, 1992): (α) Τα στοιχεία που ανήκουν στην ίδια υποομάδα να είναι όσο το δυνατό όμοια μεταξύ τους. (β) Τα στοιχεία που ανήκουν σε διαφορετικές υποομάδες να είναι όσο τον δυνατό διαφορετικά μεταξύ τους. Ο αριθμός των υποομάδων μπορεί να είναι γνωστός εκ των προτέρων ή να εξαχθεί από φυσικούς περιορισμούς. Η ομοιότητα μεταξύ των στοιχείων που ανήκουν στην ίδια υποομάδα εκφράζεται με την ελαχιστοποίηση μιας αντικειμενικής συνάρτησης (κριτήριο βελτιστοποίησης), η οποία εμπεριέχει μία συνάρτηση απόστασης (distance function) (Tamura et al.,1971, Geva et al., 2000). Μία συνηθισμένη μετρική για την απόσταση δεδομένων είναι η Ευκλείδεια απόσταση. Παρ όλα αυτά η κατάλληλη επιλογή μετρικής ανάλογα με την κάθε περίπτωση αποτελεί ολόκληρο πεδίο έρευνας. Η ομοιότητα των στοιχείων μιας υποομάδας ανάγεται στο πρόβλημα της ελαχιστοποίησης των αποστάσεων μεταξύ των στοιχείων που συμμετέχουν σε μία υποομάδα. Αντίστοιχα η διαφορά μεταξύ στοιχείων διαφορετικών υποομάδων αναφέρεται στην μεγιστοποίηση των αποστάσεων μεταξύ αυτών των υποομάδων. Ένα από τα βασικά προβλήματα που έχουν να αντιμετωπίσουν οι αλγόριθμοι ανάλυσης συστάδων είναι η μεγάλη εξάρτηση από την επιλογή των αρχικών τιμών τόσο για τον αριθμό των συστάδων όσο και για τα αντίστοιχα κέντρα. Αν δεν επιλέξουμε προσεκτικά τις αρχικές τιμές για τις παραπάνω σχεδιαστικές παραμέτρους τότε η εφαρμογή αλγόριθμων όπως ο c-means θα οδηγήσει σε τοπικό ελάχιστο. Αυτό οφείλεται στο γεγονός ότι υπάρχει περίπτωση πολλά κέντρα συστάδων να μην κινηθούν καθόλου κατά την διάρκεια εκτέλεσης του αλγόριθμου και συνεπώς στο τέλος πολύ λίγα δεδομένα 30

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων να αντιστοιχηθούν σε αυτά. Η αιτία είναι ότι οι παραπάνω αλγόριθμοι βασίζονται στην στρατηγική ο νικητής τα παίρνει όλα (winner takes all). Η χρήση μεθόδων ασαφούς λογικής μπορεί να βοηθήσει προς αυτή τη κατεύθυνση για τους παρακάτω λόγους (Klir, 1995 [16], Pedrycz, 1984 [17], Pedrycz, 1993 [18]): Η ασαφής λογική παρέχει τεχνικές αξιόπιστης μοντελοποίησης της αβεβαιότητας που υπάρχει σε ένα σύνολο δεδομένων Η ασαφής λογική μπορεί να ελαχιστοποιήσει την εξάρτηση των αλγόριθμων συσταδοποίησης από την αρχικοποίηση των σχεδιαστικών της παραμέτρων γιατί βασίζεται σε πράες υπολογιστικές τεχνικές (soft computing techniques), οι οποίες μειώνουν την επίδραση της στρατηγικής ο νικητής τα παίρνει όλα Η μείωση της επίδρασης της στρατηγικής ο νικητής τα παίρνει όλα οφείλεται κυρίως στο γεγονός ότι, με βάση την ασαφή λογική, τα διανυσματικά δεδομένα δεν ανήκουν μόνο σε μία συστάδα αλλά σε πολλές με διαφορετικούς βαθμούς συμμετοχής. Αυτό πρακτικά σημαίνει ότι όλα τα κέντρα θα κινηθούν (φυσικά με διαφορετικούς ρυθμούς) για να κερδίσουν δεδομένα (Bezdek and Pal, 1992) [14]. Άρα το τελικό αποτέλεσμα θα είναι πιο αξιόπιστο από τις κλασσικές μεθόδους ανάλυσης συστάδων. Επίσης, η χρήση ασαφούς λογικής παρέχει το πλεονέκτημα ότι μπορεί να προσδιορίσει έναν ασαφή διαμερισμό (fuzzy partition) ενός συνόλου δεδομένων σε ασαφείς συστάδες (fuzzy clusters) με αυτόματο τρόπο γιατί στηρίζεται σε αυτοδιδασκόμενους μηχανισμούς (Gustafson et al., 1979). Οι μηχανισμοί αυτοί βασίζονται στην εκπλήρωση κάποιων κριτηρίων ή παραδοχών. Ο διαμερισμός (partition) που τελικά προκύπτει έχει ελεύθερη δομή, πράγμα που καθιστά την μεταχείριση της κάθε μεταβλητής πάρα πολύ εύκολη (Gomez-Skarmeta et al., 1999). 31

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 2.3 Ο αλγόριθμος των Ασαφών c-μέσων (fuzzy C-Means) Η πιο διαδεδομένη μέθοδος ασαφούς ανάλυσης συστάδων είναι ο αλγόριθμος των Ασαφών c-μέσων ή αλλιώς Fuzzy c-means (FcM) Bezdek, 1973) [13] Ο αλγόριθμος των C-ασαφών υποομάδων επιλύει το πρόβλημα της ελαχιστοποίησης των αποστάσεων μέσα σε μία υποομάδα και της μεγιστοποίησης των αποστάσεων μεταξύ των υποομάδων με βάση το παρακάτω κριτήριο βελτιστοποίησης (Bezdek, 1973 [13], Bezdek and Pal, 1992 [14]), J w = C N i= 1 k = 1 w 2 μ ( x v ) (2.3-1) ik k i όπου, μ ik είναι η συνάρτηση συμμετοχής του κ-οστού δεδομένου στην i-οστή συστάδα, w [ 1, ) είναι η παράμετρος ασαφοποίησης και v = v,..., v ] ( 1 i C) i [ i1, vi2 im T είναι το διάνυσμα που αντιστοιχεί στο κεντρικό σημείο της i υποομάδας. Το κριτήριο J w βελτιστοποιείται ως προς τις παραμέτρους μ ik και v i. Πιο συγκεκριμένα η προσέγγιση έχει ως εξής: Για σταθερές τιμές των μ, οι τιμές των v οι οποίες ελαχιστοποιούν το J δίνονται από την εξίσωση (Bezdek, 1974)[20], ik i w N w μik x k k = 1 v i = N (2.3-2) μ k = 1 w ik Για σταθερές τιμές των v, η ελαχιστοποίηση του J ως προς τις i w μ ik είναι ένα πρόβλημα βελτιστοποίησης υπό συνθήκη. Η συνθήκη που πρέπει να ικανοποιείται από τις μ ik δίνεται από τον ορισμό του ασαφούς C-διαμερισμού και είναι η εξίσωση (2.2-6β). Χρησιμοποιώντας την μέθοδο βελτιστοποίησης κατά Lagrange, οι τιμές των οποίες ελαχιστοποιούν το 1974)[20], J w μ ik οι και ικανοποιούν την συνθήκη (2.2-6β) είναι (Bezdek, 32

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 1 μ = (2.3-3) ik C l= 1 x x k k v i v l 2 w 1 Με βάση την παραπάνω ανάλυση ο αλγόριθμος των C-ασαφών υποομάδων διατυπώνεται ως εξής: Αλγόριθμος Fuzzy c-means Έστω ένα σύνολο διανυσματικών δεδομένων X = x, x,..., x } με { 1 2 N ( 1 k N ), τα οποία θέλουμε να ομαδοποιήσουμε σε ασαφείς υποομάδες. x k R m Βήμα 1. Επιλογή του αριθμού C των ασαφών υποομάδων, της παραμέτρου w και των αρχικών τιμών για τα διανύσματα v 1, v2,..., v C. Βήμα 2. Χρήση της εξίσωσης (2.4-3) για τον υπολογισμό των συναρτήσεων συμμετοχής μ ( 1 i C, 1 k N ). ik Βήμα 3. Με βάση την εξίσωση (2.4-2) γίνεται προσδιορισμός των νέων τιμών για τα new new 1, 2 new N κέντρα των ασαφών υποομάδων v v,..., v. Βήμα 4. Αν max{ v i i new 2 v }<ε τότε ο αλγόριθμος σταματάει, αλλιώς θέτει i new v i = v i και η ροή του πηγαίνει στο βήμα 2. Ο παραπάνω αλγόριθμος είναι μία επαναληπτική διαδικασία κατά Picard και όπως έχει αποδειχθεί (Bezdek,1980, Bezdek et al.,1989) πάντα συγκλίνει. Έχει όμως το μειονέκτημα ότι για διαφορετικές αρχικές τιμές μπορεί να οδηγήσει σε διαφορετικά τοπικά ελάχιστα (Zahid et al.,1999, Kothari at al.,1999). Παρόλα αυτά, είναι ο πιο διαδεδομένος αλγόριθμος στην θεωρία της ασαφούς ομαδοποίησης δεδομένων γιατί συγκλίνει πολύ εύκολα, είναι απλός και οι μέχρι τώρα εφαρμογές έχουν δείξει ότι μπορεί 33

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων να πετύχει πολύ ικανοποιητικά αποτελέσματα. Τέλος πρέπει να σημειωθεί ότι ο αλγόριθμος των C-ασαφών υποομάδων έχει ισχύ για C 2 (Dunn,1973) Η ασάφεια του παραπάνω αλγόριθμου ελέγχεται από την παράμετρο m. Μέχρι στιγμής, δεν υπάρχουν αξιόπιστες διαδικασίες για να αποφασίσουν την επιλογή της σωστής τιμής γι αυτή την παράμετρο. Όταν το m προσεγγίζει τη μονάδα το τελευταίο διαμέρισμα είναι σχεδόν ένα κοφτό λήψης αποφάσεων αποτέλεσμα. Από την άλλη πλευρά, αν το m παίρνει μεγάλες τιμές τότε οι βαθμοί συμμετοχής του κάθε διανύσματος εκπαίδευσης τείνουν να προσεγγίσουν το 1/c. Σε αυτή την περίπτωση όλα τα κέντρα συστάδων θα τραβηχτούν προς τα διανυσματικά δεδομένα πολύ αργά. 34

Κεφάλαιο 2 ο Ασαφής συσταδοποίηση δεδομένων 2.4 Βέλτιστη ομαδοποίηση με χρήση του fuzzy C-means αλγορίθμου Όπως προαναφέρθηκε, ο αλγόριθμος των C-ασαφών υποομάδων (fuzzy C-means) αναφέρεται στον προσδιορισμό του καλύτερου συνδυασμού υποομάδων με κριτήριο την ελαχιστοποίηση των αποστάσεων μέσα στις υποομάδες και την μεγιστοποίηση των αποστάσεων μεταξύ των υποομάδων, όταν ο αριθμός C των ασαφών υποομάδων είναι γνωστός. Σε αντίθεση μ αυτό, το πρόβλημα στο οποίο αναφέρεται η βέλτιστη ασαφής ομαδοποίηση (optimal clustering) είναι ο προσδιορισμός του αριθμού C των ασαφών υποομάδων ο οποίος δίνει τον καλύτερο ασαφή C-διαμερισμό του συνόλου των δεδομένων, με βάση τον αλγόριθμο των C-ασαφών υποομάδων (Windham,1982, Gath et al.,1989). Και εδώ, η έννοια του καλύτερου ασαφή C-διαμερισμού αναφέρεται στην επιλογή εκείνου του συνδυασμού υποομάδων, ο οποίος πετυχαίνει την ελαχιστοποίηση των αποστάσεων μέσα στις υποομάδες και την μεγιστοποίηση των αποστάσεων μεταξύ των ομάδων. Για να αντιμετωπιστεί το πρόβλημα έχει αναπτυχθεί ένας αριθμός κριτηρίων, τα οποία χρησιμοποιούν την μέθοδο της δοκιμής-σφάλματος για να προσδιορίσουν τον βέλτιστο αριθμό των ασαφών υποομάδων (Razaee et al.,1998). Η εικόνα 2.5 παριστάνει διαγραμματικά αυτή την διαδικασία για ένα τυχαίο κριτήριο S. Αρχή C = 2 C = C+1 Εφαρμογή του αλγόριθμου των C-ασαφών υποομάδων Όχι Το κριτήριο S έχει την μικρότερη τιμή; Ναί Τέλος Εικόνα 2.5-Διάγραμμα ροής για τον υπολογισμό του βέλτιστου αριθμού ασαφών υποομάδων 35