Τεχνητή Νοημοσύνη ΙΙ. Ενότητα 3: Αντίληψη. Μουστάκας Κωνσταντίνος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Σχετικά έγγραφα
Τεχνητή Νοημοσύνη ΙΙ. Ενότητα 2: Αντίληψη. Μουστάκας Κωνσταντίνος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Κβαντική Επεξεργασία Πληροφορίας

Κβαντική Επεξεργασία Πληροφορίας

Κβαντική Επεξεργασία Πληροφορίας

Κβαντική Επεξεργασία Πληροφορίας

Τεχνητή Νοημοσύνη ΙΙ. Εργαστηριακή Άσκηση 2. Μουστάκας Κωνσταντίνος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

1 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Τεχνητή Νοημοσύνη ΙΙ. Εργαστηριακή Άσκηση 3. Μουστάκας Κωνσταντίνος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Εισαγωγή στους Υπολογιστές

Εισαγωγή στους Αλγορίθμους

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εισαγωγή στους Αλγορίθμους

Χωρικές σχέσεις και Γεωμετρικές Έννοιες στην Προσχολική Εκπαίδευση

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Βέλτιστος Έλεγχος Συστημάτων

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Ψηφιακή Επεξεργασία Εικόνων

Εισαγωγή στους Αλγορίθμους

Διοικητική Λογιστική

Ψηφιακή Επεξεργασία Εικόνων

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Ενδεικτικές λύσεις ασκήσεων διαχείρισης έργου υπό συνθήκες αβεβαιότητας

Τεχνητή Νοημοσύνη ΙΙ. Εργαστηριακή Άσκηση 4. Μουστάκας Κωνσταντίνος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 2: Περιγραφική στατιστική

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Μηχανολογικό Σχέδιο Ι

Αρχιτεκτονική και Οπτική Επικοινωνία 1 - Αναπαραστάσεις

Έλεγχος και Διασφάλιση Ποιότητας Ενότητα 4: Μελέτη ISO Κουππάρης Μιχαήλ Τμήμα Χημείας Εργαστήριο Αναλυτικής Χημείας

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Β. Διαφορικός Λογισμός

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Εισαγωγή στους Η/Υ. Ενότητα 2β: Αντίστροφο Πρόβλημα. Δημήτρης Σαραβάνος, Καθηγητής Πολυτεχνική Σχολή Τμήμα Μηχανολόγων & Αεροναυπηγών Μηχανικών

Βέλτιστος Έλεγχος Συστημάτων

Συστήματα Επικοινωνιών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Ψηφιακή Επεξεργασία Εικόνων

Αερισμός. Ενότητα 1: Αερισμός και αιμάτωση. Κωνσταντίνος Σπυρόπουλος, Καθηγητής Σχολή Επιστημών Υγείας Τμήμα Ιατρικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Μυελού των Οστών Ενότητα #1: Ερωτήσεις κατανόησης και αυτόαξιολόγησης

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εφαρμογές των Τεχνολογιών της Πληροφορίας και των Επικοινωνιών στη διδασκαλία και τη μάθηση

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Συστήματα Επικοινωνιών

Τεχνητή Νοημοσύνη Ι. Ενότητα 7:Προτασιακή Λογική. Πέππας Παύλος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Συστήματα Επικοινωνιών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Θέματα υπολογισμού στον πολιτισμό

Σχεδίαση και Ανάλυση Αλγορίθμων Ενότητα 4: ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΕΔΟΜΕΝΩΝ - ΔΕΝΤΡΑ

Εισαγωγή στους Υπολογιστές

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 10 η : Ανάλυση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Εισαγωγή στους Αλγορίθμους Ενότητα 10η Άσκηση Αλγόριθμος Dijkstra

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Δυναμική και Έλεγχος E-L Ηλεκτρομηχανικών Συστημάτων

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εισαγωγή στους Υπολογιστές

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Κβαντική Επεξεργασία Πληροφορίας

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Επεξεργασία Στοχαστικών Σημάτων

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Γενικά Μαθηματικά Ι. Ενότητα 17: Αριθμητική Ολοκλήρωση, Υπολογισμός Μήκους Καμπύλης Λουκάς Βλάχος Τμήμα Φυσικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Διδακτική των εικαστικών τεχνών Ενότητα 3

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού Υπέρθερμου Ατμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Θέματα υπολογισμού στον πολιτισμό

Ψηφιακή Λογική Σχεδίαση

Δυναμική και Έλεγχος E-L Ηλεκτρομηχανικών Συστημάτων

Διδακτική των εικαστικών τεχνών Ενότητα 2

Διδακτική των εικαστικών τεχνών Ενότητα 2

Βέλτιστος Έλεγχος Συστημάτων

Διδακτική των εικαστικών τεχνών Ενότητα 2

Διδακτική των εικαστικών τεχνών Ενότητα 2

Δυναμική και Έλεγχος E-L Ηλεκτρομηχανικών Συστημάτων

Βέλτιστος Έλεγχος Συστημάτων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 3: Εφαρμογές Δικτυωτής Ανάλυσης (2 ο Μέρος)

Βέλτιστος Έλεγχος Συστημάτων

Γραφικά Ι. Ενότητα 1: Εισαγωγή. Θεοχάρης Θεοχάρης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής και Τηλεπικοινωνιών

Εφαρμογές των Τεχνολογιών της Πληροφορίας και των Επικοινωνιών στη διδασκαλία και τη μάθηση

Βάσεις Περιβαλλοντικών Δεδομένων

Εφαρμοσμένη Βελτιστοποίηση

Διοίκηση Επιχειρήσεων

Διοικητική Λογιστική

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών Ενότητα 2: ΣΥΓΚΕΝΤΡΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΜΑΡΚΕΤΙΝΓΚ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση

Εισαγωγή στους Υπολογιστές

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Transcript:

Τεχνητή Νοημοσύνη ΙΙ Ενότητα 3: Αντίληψη Μουστάκας Κωνσταντίνος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Σκοποί ενότητας Αντίληψη 2

Περιεχόμενα ενότητας Αντίληψη 3

Αντίληψη

Τεχνητή Νοημοσύνη ΙΙ Αντίληψη (2)

Ανίχνευση ακμών Στόχος: Ανίχνευση απότομων αλλαγών (ασυνέχειες) σε μία εικόνα Γενικά, η σημασιολογική πληροφορία αλλά και το σχήμα των αντικειμένων κωδικοποιείται στις ακμές Πιο συμπαγής αναπαράσταση από ότι τα εικονοστοιχεία Ιδανικό: Σκαρίφημα σχεδιαστή (και αυτός βασίζεται σε λογική αντικειμένου) 6

Τι μας χρειάζονται οι ακμές; Εξαγωγή πληροφορίας, αναγνώριση αντικειμένων Εξαγωγή γεωμετρίας και σημείου παρατήρησης Vanishing line Vanishing point Κατακόρυφο vanishing point (στο άπειρο) Vanishing point 7

Από που προέρχονται οι ακμές; Ασυνέχεια κάθετου Διανύσματος επιφάνειας Ασυνέχεια βάθους Ασυνέχεια χρώματος επιφανείας Ασυνέχεια φωτισμού Οι ακμές οφείλονται σε πολλούς παράγοντες 8

Ακμές σε μεγέθυνση 9

Ακμές σε μεγέθυνση 10

Ακμές σε μεγέθυνση 11

Ακμές σε μεγέθυνση 12

Χαρακτηρισμός ακμών Μία ακμή είναι μία περιοχή της εικόνας με απότομη μεταβολή συνάρτηση της φωτεινότητας συνάρτησης εικόνα (οριζόντια κατεύθυνση) φωτεινότητας πρώτη παράγωγος οι ακμές αντιστοιχούν σε ακρότατα της παραγώγου 13

Προφίλ φωτεινότητας 14

Με λίγο Gaussian θόρυβο Παράγωγος 15

Αποτέλεσμα του θορύβου Έστω μία ακμή ή στήλη της εικόνας Η απεικόνιση της φωτεινότητας ως συνάρτηση της θέσης δίνει ένα σήμα Που είναι η ακμή; 16

Αποτέλεσμα του θορύβου Τα φίλτρα διαφορών επηρεάζονται πολύ από το θόρυβο Ο θόρυβος στις εικόνες έχει ως αποτέλεσμα εικονοστοιχεία τα οποία φαίνονται πολύ διαφορετικά από τους γείτονές τους Γενικά, όσο μεγαλύτερος ο θόρυβος τόσο μεγαλύτερη η απόκρισή του στο φίλτρο διαφορών Οπότε? 17

Λύση: εξομάλυνση f g f * g d dx ( f g) Ψάχνουμε για ακμές, στις κορυφές του ( f g) d dx 18

Θεώρημα παραγώγησης συνέλιξης Παραγώγιση συνέλιξης, η συνέλιξη είναι προσεταιριστική: d d ( f g) f g dx dx Οπότε: f d dx g f d dx g 19

Παράγωγος Gaussian φίλτρου * [1-1] = 20

Εξομάλυνση και contrast 1 pixel 3 pixels 7 pixels Η εξομαλυμένη παράγωγος αφαιρεί το θόρυβο αλλά θολώνει τις ακμές. Μπορούν ακόμα να βρεθούν ακμές σε διάφορες κλίμακες. Πώς; 21

Σχεδιασμός ενός ανιχνευτή ακμών Κριτήρια ενός καλού ανιχνευτή: Σωστή ανίχνευση: ο ιδανικός ανιχνευτής πρέπει να βρίσκει όλες τις πραγματικές ακμές αγνοώντας το θόρυβο Σωστή χωροθέτηση Οι ακμές που ανιχνεύονται πρέπει να είναι όσο πιο κοντά γίνεται στις πραγματικές ακμές Ο ανιχνευτής πρέπει να επιστρέφει μόνο ένα σημείο για κάθε σημείο της ακμής Κλειδιά ανίχνευσης ακμών Διαφορές στο χρώμα, στη φωτεινότητα, ή στην υφή κατά μήκος του ορίου Συνέχεια και κλειστές καμπύλες Σημασιολογική γνώση 22

Ανιχνευτής ακμών Canny Ίσως ο πιο ευρέως χρησιμοποιούμενος ανιχνευτής στην υπολογιστική όραση Θεωρητικό μοντέλο: ανίχνευση ακμών υπό προσθετικό Gaussian θόρυβο Ο Canny έδειξε ότι η πρώτη παράγωγος του Gaussian φίλτρου προσεγγίζει τον τελεστή που βελτιστοποιεί το γινόμενο signal-to-noise ratio και χωροθέτησης J. Canny, A Computational Approach To Edge Detection, IEEE Trans. Pattern Analysis and Machine Intelligence, 8:679-714, 1986. 23

Παράδειγμα αρχική εικόνα (Lena) 24

Παράγωγος Gaussian φίλτρου x-κατεύθυνση y-κατεύθυνση 25

Υπολογισμός παραγώγων (DoG) X-Derivative of Gaussian Y-Derivative of Gaussian Πλάτος Gradient 26

Επιρροή του αρχική Canny με Canny με Η επιλογή του εξαρτάται από την επιθυμητή συμπεριφορά μεγάλο ανιχνεύει ακμές μεγάλης κλίμακας μικρό ανιχνεύει λεπτές ακμές 27

Εύρεση ευθείας γραμμής Μία λύση: δοκιμή πολλών ευθειών και έλεγχος για το από πόσα σημεία διέρχεται Ο μετασχηματισμός Hough παρέχει ένα «γρήγορο» τρόπο για να γίνει αυτό 28

Αναπαράσταση παραμετρικού χώρου Μία ευθεία στην εικόνα αντιστοιχεί σε ένα σημείο στο χώρο Hough Εικόνα Παραμετρικός χώρος Hough 29

Αναπαράσταση παραμετρικού χώρου Σε τι αντιστοιχίζεται ένα σημείο (x 0, y 0 ) της εικόνας στο χώρο Hough; Εικόνα Παραμετρικός χώρος Hough 30

Αναπαράσταση παραμετρικού χώρου Σε τι αντιστοιχίζεται ένα σημείο (x 0, y 0 ) της εικόνας στο χώρο Hough; Απάντηση: οι λύσεις της b = x 0 m + y 0 Αυτό είναι μία ευθεία στο χώρο Hough Εικόνα Παραμετρικός χώρος Hough 31

Αναπαράσταση παραμετρικού χώρου Που είναι η ευθεία που περιέχει τα σημεία (x 0, y 0 ) και (x 1, y 1 ); Εικόνα Παραμετρικός χώρος Hough (x 1, y 1 ) (x 0, y 0 ) b = x 1 m + y 1 32

Αναπαράσταση παραμετρικού χώρου Που είναι η ευθεία που περιέχει τα σημεία (x 0, y 0 ) και (x 1, y 1 ); Είναι η τομή των ευθειών b = x 0 m + y 0 και b = x 1 m + y 1 Εικόνα Παραμετρικός χώρος Hough (x 1, y 1 ) (x 0, y 0 ) b = x 1 m + y 1 33

Περιγραφή μετασχηματισμού Hough 1. Δημιουργία ενός πλέγματος παραμέτρων 2. Κάθε σημείο «ψηφίζει» για ένα σύνολο παραμέτρων αυξάνοντας τις τιμές τους στο πλέγμα 3. Εύρεση μεγίστου ή τοπικών μεγίστων στο πλέγμα 34

Γενικά: Μετασχηματισμός Hough Διακριτοποίηση παραμετρικού χώρου σε κελιά Για κάθε χαρακτηριστικό σημείο της εικόνας, αύξηση ψήφων κάθε κελιού κατά ένα, εάν θα μπορούσε να είχε δημιουργήσει το σημείο αυτό Εύρεση κελιών με τις περισσότερες ψήφους Εικόνα Παραμετρικός χώρος Hough P.V.C. Hough, Machine Analysis of Bubble Chamber Pictures, Proc. Int. Conf. High Energy Accelerators and Instrumentation, 1959 35

Αναπαράσταση παραμετρικού χώρου Προβλήματα με το χώρο (m,b): Μη φραγμένος παραμετρικός χώρος Οι κάθετες ευθείες απαιτούν άπειρη τιμή για το m 36

Αναπαράσταση παραμετρικού χώρου Προβλήματα με το χώρο (m,b): Μη φραγμένος παραμετρικός χώρος Οι κάθετες ευθείες απαιτούν άπειρη τιμή για το m Εναλλακτική: πολική αναπαράσταση xcos ysin Κάθε σημείο προσθέτει ένα ημίτονο στον παραμετρικό χώρο 37 (, )

Περιγραφή αλγορίθμου Αρχικοποίηση συσσωρευτή H στο μηδέν for κάθε σημείο (x,y) της εικόνας for θ = 0 to 180 ρ = x cos θ + y sin θ H(θ, ρ) = H(θ, ρ) + 1 end end Εύρεση των τιμών του (θ, ρ) όπου ο H(θ, ρ) παρουσιάζει τοπικό μέγιστο Η ανιχνευθείσα ευθεία στην εικόνα δίνεται από τον εξής τύπο ρ = x cos θ + y sin θ ρ θ 38

Απεικόνιση χαρακτηριστικά ψήφοι 39

Άλλα σχήματα Τετράγωνο Κύκλος 40

Πολλές ευθείες 41

Περίπλοκη εικόνα 42

Αποτέλεσμα θορύβου χαρακτηριστικά votes 43

Αποτέλεσμα θορύβου χαρακτηριστικά ψήφοι Ο εντοπισμός του μεγίστου γίνεται δύσκολος 44

Τυχαία σημεία χαρακτηριστικά ψήφοι Ομοιόμορφος θόρυβος μπορεί να οδηγήσει σε 46 τυχαία μέγιστα στον πίνακα Η

Χειρισμός θορύβου Επιλογή ενός «σωστού» πλέγματος/διακριτοποίηση Πολύ αραιό: πολλές ψήφοι παράγονται όταν πολλές διαφορετικές ευθείες αντιστοιχούν στο ίδιο κελί Πολύ πυκνό: χάνονται ευθείες γιατί πολλά σημεία που δεν είναι ακριβώς συνευθειακά «ψηφίζουν» για διαφορετικά κελιά Συσχέτιση με γειτονικά κελιά (εξομάλυνση κελιών του συσσωρευτή) Αποφυγή χρήσης άσχετων χαρακτηριστικών Χρήση μόνο των σημείων ακμών με σημαντικό πλάτος της κλίσης 48

Αναγνώριση αντικειμένων 49

Πόσες κατηγορίες αντικειμένων υπάρχουν; 50

51

Ζώα Φυτά Αντικείμενα Άψυχα.. Σπονδυλωτά Φυσικά Τεχνητά Θυλαστικά Πουλιά Τίγρη Σκύλος Πέρδικα Κάμερα 52

Εργασίες αναγνώρισης 53

Κατηγοριοποίηση σκηνής Εξωτερική/εσωτερική Πόλη/δάσος... 54

Περιγραφή εικόνας / μεταδεδομένα δρόμος άνθρωποι κτίρια βουνό τουρισμός σύνεφα τούβλα 55

Αναγνώριση αντικειμένων εντοπισμός πεζών 56

Αντικείμενα εικόνας ουρανός βουνό κτίριο δέντρο ταμπέλα κτίριο λάμπα άνθρωποι κατάστημα 57

Κατανόηση σκηνής; 58

Μοντελοποίηση μεταβλητότητας Μεταβλητότητα: Θέση κάμερας Φωτισμός Σχήμα Αυτό-μεταβλητότητα; 59

Αυτο-μεταβλητότητα 60

Κατηγοριοποίηση εικόνας Εικόνες εκπαίδευσης Εκπαίδευση Ground truth Χαρακτηριστικά Εικόνας Εκπαίδευση ταξινομητή Ταξινο μητής 61

Κατηγοριοποίηση εικόνας Εικόνες εκπαίδευσης Εκπαίδευση Ground truth Χαρακτηριστικά Εικόνας Εκπαίδευση ταξινομητή Ταξινο μητής Χαρακτηριστικά Εικόνας Έλεγχος Ταξινομητής Πρόβλεψη Εξωτερικός Εικόνα ελέγχου 62

Χαρακτηριστικά εικόνας Εικόνες εκπαίδευσης Εκπαίδευση Ground truth Χαρακτηριστικά Εικόνας Εκπαίδευση ταξινομητή Ταξινο μητής 63

Αναπαράσταση εικόνας Πρότυπα Φωτεινότητα, κλίσεις, κλπ. Ιστογράμματα Χρώμα, υφή, περιγραφείς SIFT, κλπ. 64

Αναπαράσταση εικόνας : Ιστόγραμμα Ολικό ιστόγραμμα Αναπαριστά κατανομή χαρακτηριστικών Χρώμα, υφή, βάθος, Space Shuttle Cargo Bay 65

Αναπαράσταση εικόνας : Ιστόγραμμα Ιστόγραμμα: Πιθανότητα ή πλήθος σημείων σε κάθε κελί Κοινό ιστόγραμμα Απαιτεί πολλά δεδομένα Απώλεια ανάλυσης για να μην υπάρχουν κενά κελιά 66

Αναπαράσταση εικόνας : Ιστόγραμμα Ομαδοποίηση EASE Truss Assembly Χρήση των ίδιων κέντρων ομάδων για όλες τις εικόνες Space Shuttle Cargo Bay 67

Αποστάσεις ιστογραμμάτων K histint( h, h ) 1 min h ( m), h ( m) i j i j m 1 Τομή ιστογραμμάτων (απαιτεί κανονικοποίηση) 2 ( h, h ) i j K 1 [ hi( m) hj( m)] 2 h ( m) h ( m) m 1 i j Chi-squared απόσταση ιστογραμμάτων 2 Εκτός από όμοιο χρώμα τι άλλο παρατηρείτε;;; Αυτοκίνητα που βρέθηκαν με ιστογράμματα χρώματος και απόσταση chi-squ 68

Ιστογράμματα: Υλοποίηση Διακριτοποίηση/κβαντισμός Πλέγμα: γρήγορο αλλά εφαρμόσιμο μόνο σε λίγες διαστάσεις Ομαδοποίηση: αργό αλλά κατάλληλο και για πολλές διαστάσεις Λίγα κελιά Λίγα δεδομένα Αραιή αναπαράσταση Πολλά κελιά Πολλά δεδομένα Λεπτομέρεια Απόσταση/Matching Η τομή ιστογραμμάτων ή η ευκλείδια απόσταση είναι γρήγορες μέθοδοι Η Chi-squared πολλές φορές αποδίδει καλύτερα Η απόσταση Earth mover s είναι αποτελεσματική όταν γειτονικά κελιά αφορούν όμοιες τιμές (παράδειγμα) 69

Ιστογράμματα σε τι; Χρώμα L*a*b* χρωματικός χώρος HSV χρωματικός χώρος Υφή (τράπεζες φίλτρων ή κλίσεις σε περιοχές) 70

Ιστογράμματα σε τι; Ιστογράμματα προσανατολισμένων κλίσεων SIFT Lowe IJCV 2004 71

Διάνυσμα SIFT 4x4 πίνακας ιστογραμμάτων προσανατολισμού κλίσεων Όχι ακριβώς ιστόγραμμα, στάθμιση βάσει πλάτους 8 κατευθύνσεις x 4x4 πίνακας = 128 διαστάσεις Κίνητρο: μικρή ευαισθησία σε θέση/ προσανατολισμό παράδειγμα 2x2 του πίνακα 4x4 72

Διάνυσμα SIFT Υπολογίζεται σε περιστραμένες και κλιμακωμένες εκδόσεις του παραθύρου ανάλογα με τον υπολογισμό προσανατολισμού και κλίμακας Επαναδειγματοληψία του παραθύρου Βάσει κλίσεων σταθμισμένων μέσω Gaussian παραθύρου 73

Ομαλότητα Gaussian στάθμιση Τρι-γραμμική παρεμβολή 74

Μείωση επίδρασης φωτισμού 128-διάστατο διάνυσμα κανονικοποιημένο στο 1 Φράγμα στο πλάτος της κλίσης για την αποφυγή μεγάλης επιροής μεγάλων κλίσεων 75

Τοπικοί περιγραφείς Αρίθμηση του αριθμού σημείων σε κάθε κελί, π.χ.: Count = 4... Count = 10 Log-polar διακριτοποίηση: μεγάλη ακρίβεια σε γειτονικά σημεία, ευελιξία στα απομακρυσμένα. Belongie & Malik, ICCV 2001 76

Τοπικοί περιγραφείς: Σχήμα 77

Τέλος Ενότητας

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στo πλαίσιo του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Αθηνών» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 79

ΣΗΜΕΙΏΜΑΤΑ 80

Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.0. Έχουν προηγηθεί οι κάτωθι εκδόσεις: Έκδοση 1.0. διαθέσιμη εδώ. 81

Σημείωμα Αναφοράς Copyright Πανεπιστήμιο Πατρών, Φακωτάκης Νίκος, Μουστάκας Κωνσταντίνος, Πέππας Παύλος, Σγάρμπας Κυριάκος. «Τεχνητή Νοημοσύνη ΙΙ, Αντίληψη». Έκδοση: 1.0. Πάτρα 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: https://eclass.upatras.gr/modules/course_metadata/opencourses.php?fc=15 82

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 83

Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους. 84

Σημείωμα Χρήσης Έργων Τρίτων Το Έργο αυτό κάνει χρήση των ακόλουθων έργων: Εικόνες/Σχήματα/Διαγράμματα/Φωτογραφίες Η διάλεξη είναι εμπνευσμένη και έχει χρησιμοποιηθεί εκπαιδευτικό και πολυμεσικό υλικό από τις διαλέξεις του James Hays του «Brown University, Computer Science Department» και του αντίστοιχου μαθήματος «CS 143 Introduction to Computer Vision» (http://cs.brown.edu/courses/cs143/).