Συστήματα αναζήτησης με βάση την εικόνα Συγγραφέας: Κουταλά Ματίνα Καθηγητής: Στυλιαράς Γιώργος ΓΤΠ61 ΠΛΗΡΟΦΟΡΙΚΗ-ΠΟΛΥΜΕΣΑ ΕΑΠ 2012-13
1 εικόνα = 1000 λέξεις
Εισαγωγή Τα συστήματα αναζήτησης εικόνων, έχουν γνωρίσει μεγάλη άνθιση τα τελευταία χρόνια, καθώς με το ολοένα και μεγαλύτερο μγ ενδιαφέρον φρ που δίνεται στο ιαδίκτυο, ο αριθμός των εικόνων που υπάρχουν, αλλά και η ανάγκη γρήγορης και αποδοτικής ανάκτησής τους αυξάνεται διαρκώς. Εικόνα: Retrieval System
Βασικές έννοιες Γενικός ορισμός: εικόνα < αρχαία ελληνική εἰκών < εἴκω (μοιάζω) 1. δισδιάστατη εμφάνιση ή αναπαράσταση με τεχνικά μέσα πραγματικού αντικειμένου 2. γενική, λιτή, αλλά ουσιαστική και πιστή αναπαράσταση ή η εμφάνιση μιας κατάστασης 3. εμφάνιση αντικειμένου ή γεγονότος ή φωτογραφίας με ηλεκτρονικά μέσα(ψηφιακή) 4. το είδωλο ατόμου ή αντικειμένου 5. ομοιότητα προς άλλον
Βασικές έννοιες Η Αυτόματη Ανάκτηση Εικόνων (ΑΑΕ) (αγγλ.: Content-based image retrieval (CBIR)) είναι η εφαρμογή τεχνικών υπολογιστικής όρασης με σκοπό την επίλυση του προβλήματος της ανάκτησης εικόνων, δηλαδή δή την αναζήτηση ψηφιακών εικόνων σε μεγάλες βάσεις δεδομένων.
Συστήματα αναζήτησης Η ανάγκη αναζήτησης και ανάκτησης εικόνων οδήγησε στη δημιουργία συστημάτων ανάκτησης ψηφιακών εικόνων. Τα συστήματα αυτά ψάχνουν με βάση: το context=tag της εικόνας (τα σημαινόμενασυμφραζόμενα) την περιγραφή της εικόνας σχόλια άλλων χρηστών λεζάντα (caption) λέξεις κλειδιά (keywords) Τα τελευταία χρόνια αναπτύχθηκε ένας νέος τρόπος αναζήτησης: το content=περιεχόμενο=χρώμα, υφή και σχήματα μιας εικόνας
Αναζήτηση εικόνας βάσει κειμένου (text based image retrieval) γίνεται με λέξεις κλειδιά που περιγράφουν την εικόνα με λεζάντα, ενσωματωμένο κείμενο. Τα συστήματα αυτά χρησιμοποιούν τη διαχείριση βάσεων δεδομένων (database management) ένας άλλος τρόπος είναι η εύρεση με μεταδεδομένα (metadata) πχ. ημερομηνία δημιουργίας εικόνας, ποιος τη δημιούργησε,το φορμά της εικόνας κτλ. Το μειονέκτημα αυτής της μεθόδου είναι ότι είναι δύσκολη και χρονοβόρα μέθοδος. Εικόνα: Text Based Image Retrieval
Αναζήτηση εικόνας βάσει περιεχομένου (content based image retrieval) γίνεται βάσει ιστογράμματος χρώματος(color histogram),το οποίο μετρά τη ένταση των 3 χρωμάτων rgb(=red,green,blue) βάσει σχήματος, το ιστόγραμμα μετρά τα οριακά χαρακτηριστικά(γραμμές, καμπύλες κτλ) της εικόνας ή και τα σχήματα μέσα στην εικόνα βάσει υφής με τρεις τρόπους: α. πιθανολογικά, β. φασματικά και γ. διαρθρωτικά Εικόνα: Content based Image Retrieval
Υπάρχοντα συστήματα ανάκτησης εικόνας a. QBIC (Query by Image Content) Σύστημα βασισμένο στο περιεχόμενο. Η έρευνα αφορά σκίτσα-εικόνες-ζωγραφιές με υφή με βάσει την τραχύτητα-αντίθεση και κατεύθυνση b. VisualSeek VisualSEEK είναι ένα σύστημα που βασίζεται στο περιεχόμενο της εικόνας και χρησιμοποιεί σύνολα χρώματος με χαμηλό κόστος αναζήτησης c. VIRAGE Virage είναι ένα σύστημα που βασίζεται στο περιεχόμενο της εικόνας και χρησιμοποιεί χαρακτηριστικά όπως χρώμα σύνθεση layout και υφή. d. MARS MARS είναι ένα σύστημα που επικεντρώνεται στην οργάνωση οπτικών χαρακτηριστικών της εικόνας αντί να επικεντρώνεται σε ένα χαρακτηριστικό όπως χρώμα κτλ. Εικόνα: Architecture of an Image Retrieval System
Τάσεις και βελτιώσεις 1. Η σχέση εικόνας και κειμένου μπορεί να βελτιωθεί περισσότερο με τη χρήση γλωσσικού ευρετηρίου 2. Κάποια concept ή ιστορίες να είναι χαρτογραφημένα με την κάθε εικόνα ώστε η εύρεση να είναι πιο εύκολη 3. Ανθρώπινη διάδραση 4 Μηχανές αναζήτησης εικόνων στον ιστό 4. Μηχανές αναζήτησης εικόνων στον ιστό (Web Oriented Engines)
Ηλεκτρονική βιβλιογραφία Βικιλεξικό: Εικόνα Wikipedia: Image retrieval Wikiversity: Image Retrieval and Its Needs Βικιπαίδεια: Αυτόματη ανάκτηση εικόνων «Σύστημα Αναζήτησης Εικόνων», Κτιστάκης ημήτριος Εικόνες: Retrieval System Text Based Image Retrieval Content based Image Retrieval Architecture of an Image Retrieval System