Εντοπισμός αντικειμένου σε εικόνα

Σχετικά έγγραφα
Μέθοδοι Αναπαράστασης Περιγραµµάτων

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

HMY 795: Αναγνώριση Προτύπων

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου

ΤΗΛΕΠΙΣΚΟΠΗΣΗ. Γραµµικοί Μετασχηµατισµοί (Linear Transformations) Τονισµός χαρακτηριστικών εικόνας (image enhancement)

ΕΙ ΙΚΑ ΚΕΦΑΛΑΙΑ ΑΠΟ ΤΗ ΘΕΩΡΙΑ ΑΝΑΛΥΣΗΣ ΕΙΚΟΝΑΣ (ΓΙΑ ΤΗΝ ΑΝΑ ΕΙΞΗ ΟΥΣΙΩ ΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΕΙΚΟΝΑΣ) ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 4, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 2

Γεωμετρικοί μετασχηματιμοί εικόνας

Α.Τ.Ε.Ι. ΜΑΚΕΔΟΝΙΑΣ Τμήμα πληροφορικής και επικοινωνιών. Συμπίεση ψηφιακών εικόνων με ανάλυση κύριων συνιστωσών και χρήση νευρωνικού δικτύου.

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

Μέση Τιµή. Έστω Χ τ.µ. και f Χ (x) ησ.π. ήσ.π.π. της Χ Μέση ή αναµενόµενη τιµή της Χ είναι ο αριθµός: αν η Χ είναι διακριτή, και αν η Χ είναι συνεχής.

ΚΕΦ.6:ΤΕΤΡΑΓΩΝΙΚΕΣ ΜΟΡΦΕΣ. ΣΥΜΜΕΤΡΙΚΟΙ ΠΙΝΑΚΕΣ

Συμπίεση Πολυμεσικών Δεδομένων

Ζητήματα ηήμ με τα δεδομένα

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

7. ΕΠΕΞΕΡΓΑΣΊΑ ΣΗΜΆΤΩΝ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Ακαδημαϊκό Έτος Παρουσίαση Νο. 2. Δισδιάστατα Σήματα και Συστήματα #1

Kεφάλαιο 4. Συστήματα διαφορικών εξισώσεων. F : : F = F r, όπου r xy

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 3. Δισδιάστατα σήματα και συστήματα #2

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας

Εφαρμοσμένα Μαθηματικά ΙΙ

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

Digital Image Processing

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ταξινόμηση καμπυλών και επιφανειών με τη βοήθεια των τετραγωνικών μορφών.

E[ (x- ) ]= trace[(x-x)(x- ) ]

Εφαρμοσμένα Μαθηματικά ΙΙ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Digital Image Processing

HMY 795: Αναγνώριση Προτύπων

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

Συμπίεση Δεδομένων

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών

Συμπίεση Δεδομένων

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Ακαδημαϊκό Έτος Παρουσίαση Νο. 2. Δισδιάστατα Σήματα και Συστήματα #1

ΟΡΙΣΜΟΣ ΤΟΥ ΠΙΝΑΚΑ ΣΥΝΔΙΑΣΠΟΡΑΣ (Covariance Matrix)ΕΙΚΟΝΑΣ. Έστω ότι κάθε pixel της εικόνας έχει φωτεινότητα a i, i=1,2,...,ν

E [ -x ^2 z] = E[x z]

Συμπίεση Δεδομένων

Βαθμονόμηση κάμερας Camera Calibration. Κ Δελήμπασης 1

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Νοέμβριος 2005 Σ. Φωτόπουλος ΨΕΕ κεφ.4 ΑΝΙΧΝΕΥΣΗ ΑΚΜΩΝ ΔΠΜΣ ΗΕΠ 1/53

Digital Image Processing

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Δ10. Συμπίεση Δεδομένων

Στατιστική περιγραφή τουπεδίουβαρύτητας

Παραδείγματα Ιδιοτιμές Ιδιοδιανύσματα

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

Θέση και Προσανατολισμός

Στοχαστικά Σήματα και Τηλεπικοινωνιές

Συμπίεση Πληροφορίας Πλαισίου με Ανάλυση Κύριων Συνιστωσών

Kεφάλαιο 4. Συστήµατα διαφορικών εξισώσεων.

Ανάκτηση πολυμεσικού περιεχομένου

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Ψηφιακή Επεξεργασία Εικόνας

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Ψηφιακές Τηλεπικοινωνίες. Βέλτιστος Δέκτης

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

1.4 Λύσεις αντιστρόφων προβλημάτων.

Απλή Παλινδρόμηση και Συσχέτιση

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο

Θέμα 1. με επαυξημένο 0 1 1/ 2. πίνακα. και κλιμακωτή μορφή αυτού

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Ανακατασκευή εικόνας από προβολές

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Ψηφιακή Επεξεργασία Εικόνας

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

ΚΑΤΑΣΤΡΩΣΗ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ ΠΟΛΥΒΑΘΜΙΩΝ ΣΥΣΤΗΜΑΤΩΝ 55

3. Γραμμικά Συστήματα

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

Μέθοδοι Αναπαράστασης Περιοχών

, και. είναι σταθερές (χρονικά αμετάβλητες), προκύπτει το χρονικά αμετάβλητο φίλτρο Kalman (Time Invariant Kalman Filter):

Ψηφιακές Τηλεπικοινωνίες. Δισδιάστατες Κυματομορφές Σήματος

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 2 η : Δισδιάστατα Σήματα & Συστήματα Μέρος 2

9. Ανάλυση κυρίων συνιστωσών *Principal Component Analysis)

ΠΡΟΒΛΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ

Digital Image Processing

Advances in Digital Imaging and Computer Vision

Μετασχηµατισµοί 2 &3

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 3 η Ημερομηνία Αποστολής στον Φοιτητή: 7 Ιανουαρίου 2008

ΕΠΕΞΕΡΓΑΣΙΑ & ΑΝΑΛΥΣΗ ΙΑΤΡΙΚΩΝ ΣΗΜΑΤΩΝ

Transcript:

Εντοπισμός αντικειμένου σε εικόνα Μάθημα: Υπολογιστική όραση Κ. Δελήμπασης 1

Περιγραφείς σχημάτων Αναγνώριση αντικειμένων με χρήση ροπών Περιγραφείς Fourier Στατιστική διακύμανση σχημάτων Αναζήτηση σε εικόνα τυχαίου σχήματος Ο μετασχηματισμός απόστασης 2

Αναγνώριση αντικειμένων με χρήση ροπών Moment Image descriptors Εισήχθηκαν από τον Hu(1962), με ευρεία εφαρμογή Περιγράφουν σχήματα με μικρό πλήθος περιγραφέων Η υπολογιστική πολυππλοκότητα αυξάνει όσο αυξάνει η τάξη της ροπής. Μη ορθογώνιες ροπές Αλλες ορθογώνιες ροπές: Legendre moments, geometrical moments, Zernike moments, pseudo-zernike moments and Orthogonal Fourier-Mellin moments are evaluated 11/04

Ορισμός Ροπές τάξης p+q μίας 2D συνάρτησης f(x,y) με πεδίο ορισμού D: M pq = D (, ) (, ) p x y f x y dxdy Οι ροπές υπάρχουν αρκεί το Dνα είναι φραγμένο pq Αν p pq (x,y)=x p y p,τότε προκύπτουν οι γεωμετρικές ροπές M pq = D (, ) p q x y f x y dxdy Τα μονώνυμα αποτελούν τις συναρτήσεις βάσης. Αν η ταξη είναι n=p+q: p+q n, πλήθους (n+1)(n+2)/2. 11/04

Κεντρικές ροπές: αμετάβλητες κατά την μετατόπιση (translation invariant) M µ pq = = = M x y p q 10 01 ( x x) ( y y) f ( x, y), x, y M M 00 00 Ροπές αματάβλητες κατά την αλλαγή κλίμακας (scale invariant) η pq µ pq p + q =, γ = + 1 µ 2 γ 0 0

Ροπές Hu (1962) αμετάβλητες (invariant) σε affine μετασχηματισμούς ϕ = η + η 1 20 02 ( ) 2 2 2 = 20+ 02 + 4η 11 ϕ η η ( 3 ) ( 3 ) 2 2 ϕ = η η + η η 3 30 12 21 03 ( ) ( η η ) ϕ = η + η + + 4 30 12 21 03 ( 3 )( ) ( ) 3( ) 2 2 ϕ 5 = η 03 η 12 η 30 + η 12 η 03 + η 12 η 21 + η 03 + ( 3η + η )( η + η ) 3( η + η ) ( η + η ) 2 2 2 21 03 21 03 30 12 21 03 ( ) ( ) ( ) 2 2 ϕ 6 = η 2 0 η 0 2 η 3 0 + η 1 2 η 2 1 + η 0 3 + 4η η η η η ( + )( + ) 1 1 3 0 1 2 2 1 0 3

Πίνακας ροπών 2 ης τάξης Εστω σύνολο μη-μηδενικών pixelμίας εικόνας (πλήρες δυαδικο αντικείμενο, ή περίγραμμα) N N 2 ( xi µ x) ( xi µ x)( yi µ y) i= 1 i= 1 N N ( xi µ x)( yi µ y) ( yi µ y) i= 1 i= 1 2

Περιγραφείς Fourier (Fourier Descriptors -FD) Iσχυρή µέθοδος περιγραφής περιγραµµάτων και εξαγωγής χαρακτηριστικών των αντικειµένων Έστω ότι η καµπύλη του σχήµατος αντιστοιχεί στο όριο ενός αντικειµένου. Ξεκινώντας από ένα αρχικό σηµείο Α, µε ωρολογιακή φορά παίρνουµε µια ακολουθία σηµείων (x n, y n ), n=0,1,,n-1, µε Ν το πλήθος των εικονοστοιχείων του ορίου. 8

Ορισµός FDs Εστω η µιγαδική ακολουθία: z(n)=x(n)+jy(n), n=0,1,,n-1 Από τον ορισµό του διακριτού µετασχηµατισµού Fourier (DFT) της z(n) : N 1 j2πkn a( k) = z( n) exp n= 0 N Με τον αντίστροφο DFT (IDFT) ανακατασκευάζεται η z(n) : z( n) = 1 N N 1 k=0 a( k)exp( j2πkn ) N 9

Οι μιγαδικοί συντελεστές α(k) καλούνται περιγραφείς Fourier (Fourier Descriptors FD). Για ομαλά σχήματα, η περισσότερη πληροφορία του σχήματος είναι αποθηκευμένη στις χαμηλότερες αρμονικές Όσους περισσότερους συντελεστές χρησιμοποιούμε, τόσο καλύτερη είναι η προσέγγιση και η αναπαράσταση/ ανακατασκευή της καμπύλης. Η σύγκριση δύο σχημάτων για τα οποία έχουν προσδιοριστεί οι FDs μπορεί να γίνει με την άμεση σύγκριση των FDs, αφού ληφθεί υπόψη η αμεταβλητότητα / συμμεταβλητότητα ως προς γεωμετρικούς μετασχηματίσμούς και αρίθμηση. 10

Αµεταβλητότητα / Συµµεταβλητότητα Invariance / covariance Αν κάποια καμπύλη μετατεθεί κατά x 0,y 0 τότε οι FDs παραμένουν ίδιοι, εκτός της μηδενικής αρμονικής Αλλαγή κλίμακας του περιγράμματος συνεπάγεται ίδια αλλαγή κλίμακας των FDs. Αν τα FDs κανονικοποιηθούν με τα μέτρα τους α(k)/ α(k) γίνονται ανεξάρτητα της αλλαγής κλίμακας Περιστροφή κατά γωνία θ του περιγράμματος: a k a k e jθ. Αλλαγή της αρίθμησης των σημείων: a k a k exp(2πkn 0 /N). 11

500 450 400 350 300 250 200 150 100 50 0 0 100 200 300 400 500 Αρχικό περίγραμμα, Περίγραμμα με 5 συντελεστές 500 450 400 350 300 250 200 150 100 50 0 0 100 200 300 400 500 Αρχικό περίγραμμα, Περίγραμμα με 8 συντελεστές 12

Στατιστική διακύμανση σχημάτων Συχνά τα αντικείμενα ενδιαφέροντος παρουσιάζουν μεταβολές στο σχήμα τους, πχ ίδια ανατομική δομήμεταξύ διαφορετικών ανθρώπων. Active Shape models ASM: βασίζεται σε Principal Component Analysis -PCA, για να εκπαιδεύσει ένα σύστημα ώστε να παράγει στατιστικά πιθανά σχήματα, δεδομένου ενός συνόλου σχημάτων (αντικειμένων ίδιου τύπου) 13

Στατιστικές έννοιες Μέση τιμή µ Χ =E(X): 1 n µ x = E( X) = i x i Διασπορά σ ( [ ] ) [ ] 2 1 2 2 2 2 2 x = E X E X = E X E X = xi xi n i i Συμμεταβλητότητα ((συνδιακύμανση ή συνδιασπορά)2 μεταβλητών, Χ, Υ: 1 Cov X Y E X Y x y N N 1 (, ) = ( µ x)( µ y) = ( i µ x)( i µ y) Σημ. Το (1/Ν) μπορεί να αντικατασταθεί από 1/(Ν-1), αν θεωρούμε ότι τα διαθέσιμα είναι μέρος του συνόλου των σημείων του αντικείμένου i= 1 14

Συσχέτιση δύο μεταβλητών Συνδιασπορά >0 οι 2 μεταβλητές συσχετισμένες: Όταν αυξάνει η μία, αυξάνει και η άλλη Συνδιασπορά <0 οι 2 μεταβλητές συσχετισμένες: Όταν αυξάνει (μειώνεται) η μία, μειώνεται (αυξάνει) και η άλλη Συντελεστής συσχετισης: κανονικοποιούμε τη συνδιασπορά με τις αποκλίσεις των 2 μεταβλητών ρ xy (, ) E ( X x)( Y y) Cov X Y µ µ = = σ σ σ σ x y x y 15

Πίνακας συμμεταβλητότητας(συνδιακύμανση ή συνδιασπορά) δύο μεταβλητών Χ, Υ με Ν τιμές έκαστη: Αν µ Χ, µ Υ οι μέσες τιμές,τότε ορίζεται ο συμμετρικός πίνακας 2x2: x1 µ x y1 µ y x1 µ x x2 µ x xn µ x x2 µ x y2 µ L y C = y µ y µ L y µ 1 y 2 y n y xn µ x yn µ y N N 2 ( xi µ x) ( xi µ x)( yi µ y) i= 1 i= 1 = 2 N N ( xi µ x)( yi µ y) ( yi µ y) i= 1 i= 1 Αν ο πίνακας είναι διαγώνιος οι Χ, Υασυσχέτιστες 16

Συνδιακύμανση σχημάτων ίδιου αντικειμένου Εστω Ναντικείμενα, κάθε ένα από τα οποία έχει Dσημεία περιγράμματος i,, k {( k k x )} i yi = 1,2,..., D = 1,2,..., N Τα βήματα που ακολουθούν εφαρμόζονται είτε ξεχωριστά για τις Χκαι Υσυντεταγμένες, είτε ταυτόχρονα, θεωρώντας ένα διάνυσμα μήκους 2D(x πρώτα και y μετά) 17

Εστω p k k k T k = 1,2,..., D = xi, yi,2n 1, i= 1,2,..., N Μεταφέρουμε το σύστημα συντεταγμένων κάθε αντικειμένου στο κέντρο μάζας του x k, y k Κατασκευάζουμε τον πίνακα p k k k k = x x, y y,2n 1 k i i [ ] P= p, p,..., p,2n D 1 2 D T ( ) T 18

Παράδειγμα Σύνολο περιγραμμάτων ενός αντικειμένου με μεταβολή στο σχήμα 500 450 400 350 300 250 250 200 150 100 50 0-50 -100-150 200 150 100 50 0 0 100 200 300 400 500 Παράδειγμα: Κ=9 περιγράμματα χεριών, με Ν=72 σημεία το κάθε ένα -200-300 -200-100 0 100 200 300 Τα περιγράμματα σε βαρυκεντρικές συντεταγμένες 19

Υπολογισμός μέσου σχήματος D 1 p= pk,2n 1 D k = 1 250 200 150 100 50 0-50 -100-150 -200-300 -200-100 0 100 200 3 20

Κατασκευάζεται πίνακαςp, διάστασης 2N D. Ο πίνακας Μ=P P Τ (2N 2Ν) δείχνει τη συμμεταβλητότητα των αντίστοιχων σημείων, μεταξύ των διαφορετικών χεριών Ο πίνακας Μ=P P Τ (2N 2Ν) θα έχει rank(μ)=2n, <=> D>2N, Αλλιώς, rank(μ)=d 0 50 100 150 200 250 Διαφορετικές θέσεις του σημείου 12 για 10 περιγράμματα χεριών 21

Συμπίεση πληροφορίας σχήματος με χρήση του ASM ΕστωΛ=(λ 1, λ 2,..., λ 2Ν ) με μήκος 2Νκαι Qο πίνακας που οι στήλες του είναι τα ιδιοδιανύσματα του Μ, σε φθίνουσα διάταξη των ιδιοτιμών του [ ] Q= v, v,..., v,2n 2 N, 1 2 2N ιδιοτιµές του M: d d... d 1 2 2N Για κάθε τυχαίο σχήμα q, υπάρχουν Λ=(λ 1, λ 2,..., λ 2Ν ), ώστε ναμπορεί να γραφεί ώς T [ λ λ λ ] q= p+ M,,...,,2N 1= p+ M Λ 1 2 2N T 22

Εστω ότι δεν χρησιμοποιούμε όλες τις ιδιοτιμές, αλλά τις Τ μεγαλύτερες, όπου T d > 0.9 Εστω ότι ο Qπεριέχει τα ιδιοδιανύσματα με τις Τιδιοτιμές 2N i i= 1 i= 1 [ ] Q= v, v,..., v,2 N T, 1 2 T T ιδιοτιµές του M: d d... d... d d i 1 2 T 2N 23

Τώρα, ένα τυχαίο σχήμα q, περιγράφεται από Ταριθμούς Λ=(λ 1, λ 2,..., λ Τ ), ώς q= p+ M Λ Λ = 2N T 2T 1 [,,..., ] 1 2 Για να καλύπτουμε το 98%της μεταβολής του σχήματος, επιλέγουμε λi di 3 di, di 3 d + i, i T Αντίστροφα, δοθέντος του q, τα Λυπολογίζονται (διότι Μ Τ Μ=Ι) T Λ= M q p, λ λ λ T ( ) T 24

Συμπέρασμα Η περισσότερη πληροφορια του σχήματος υπάρχει συγκεντρωμένη στα ιδιοδυανύσματα του Μ που έχουν τις Τ μεγαλύτερες ιδιοτιμές Κάθε ιδιοδιάνυσμα «αποτυπώνει» ένα τρόπομεταβολής (mode of variation) Για ομαλά σχήματα, Ν<<Τ, περιγράφουμε ένα σχήμα με πολύ λιγότερους αριθμούς από τις συντεταγμένες των σημείων του Μπορούμε να κατασκευάσουμε καινούργια σχήματα επιλέγοντας (λ 1, λ 2,..., λ Τ ), 25

300 250 200 150 100 50 0-50 -100-150 -200-300 -200-100 0 100 200 300 Μεταβολή σχήματος που κωδικοποιείται από το 1 ο ιδιοδιάνυσμα 26

250 200 150 100 50 0-50 -100-150 -200-300 -200-100 0 100 200 300 Μεταβολή σχήματος που κωδικοποιείται από το 2 ο ιδιοδιάνυσμα 27

250 200 150 100 50 0-50 -100-150 -200-300 -200-100 0 100 200 300 Μεταβολή σχήματος που κωδικοποιείται από το 3 ο ιδιοδιάνυσμα 28

Αναζήτηση σε εικόνα τυχαίου σχήματος με μετατόπιση, αλλαγή κλίμακας και περιστροφή Κατασκευή του τυχαίου σχήματος με χρήση ASM(Τ παράμετροι) Περιστροφή, αλλαγή κλίμακας και μετατώπιση(περίπτωση 2D: 1 + 2 + 2=5 παράμετροι) Υπολογισμός παραμέτρων με βελτιστοποίηση μιάς συνάρτησης (ταιριάσματος, ή λάθους) Μία πρακτική προσέγγιση: Μετασχηματισμός απόστασης / Chamfer matching 29

Chamfer Matching: Εντοπισμός αντικειμένου σε εικόνα Εστω ότι αναζητούμε ένα αντικείμενο (πχ παλάμη) σε μία εικόνα. Υπολογίζουμε τις ακμές της εικόνας Θεωρούμε ότι το αντικείμενο ανιχνεύεται όταν το περίγραμμα του βρίσκεται πολύ κοντά σε ακμές της εικόνας Για το λόγο αυτό χρησιμοποιείται ο Μετασχηματισμός Απόστασης (Distance Transform) 30

Συνάρτηση σφάλματος εντοπισμού αντικειμένου Εστω τα σημεία ενός αντικειμένου ( ) x, y, i= 1,2,..., N i i Αν BWη δυαδική εικόνα ακμών της εικόνας Ικαι D=DT(I)ο μετασχ απόστασης Η συνάρτηση σφάλματος εντοπισμού του αντικειμένου μπορεί να οριστεί: err N 1 = D x y N i = 1 (, ) i i 31

Δυαδικές εικόνες: Μετασχηματισμός Απόστασης (Distance Transform) Έστωδυαδική εικόνα I(i,j)η οποία περιέχει pixelακμών με τιμή 0 (ενώ τιμή υποβάθρου θεωρείται η μεγιστη (big_valueπχ 255). Σε περίπτωση που η εικόνα ακμών είναι δυαδική με τιμή 1 (ακμή) και 0 (υπόβαθρο), κάνουμε τον απαραίτητο μετασχηματισμό. Ο DTπαράγει μία εικόνα της οποίας το κάθε pixelπεριέχει την απόσταση του από το κοντινότερο pixel ακμών. Ο DTείναι χρήσιμος για την ταύτιση αντικειμένων με ψηφιακές εικόνες. Αφελής (naïve)προσέγγιση : Υπολογισμός απόστασης κάθε pixel μη-υποβάθρου από κάθε κάθε pixel υποβάθρου: Brute force DT: O(N 2 ) 11/04

Παρουσιάζονται 2 αλγόριθμοι: 1. Μη βέλτιστος (χρειάζεται πολλαπλά περάσματα της εικόνας και δεν υπολογίζει ευκλίδεια απόσταση), παρουσιάζεται λόγω απλότητας. 2. Βέλτιστος, 2 διπλά περάσματα, Ο(Ν) 33

Αλγόριθμος με πολλαπλά περάσματα της εικόνας Αλγόριθµος Μετασχηµατισµού απόστασης Manhattan Εισοδος: Ι εικόνα ακµών (δυαδική) Εξοδος: D εικόνα απόστασης (ακέραιες τιµές) Αρχικοποίηση: για κάθε pixel p, D(p)=big_value k=0 while (υπάρχουν pixel p µε D(p)=big_value) k=k+1; Για κάθε pixel p της εικόνας Αν D(p)==big_value (pixel υποβάθρου) Για κάθε ένα από τους 4 γείτονες n του p Αν D(n)==k-1 then D(p)=I(n)+1; end end end end

Παράδειγμα εφαρμογής του αλγόριθμου DT Εστω η εικόνα Ι: 1 2 3 4 1 1 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 1 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 0 255 255 255 1 0 1 255 255 1 0 1 2 255 1 0 1 2 3 2 255 255 255 255 2 1 255 255 255 2 1 2 255 2 2 1 2 3 2 3 255 255 255 255 3 255 255 255 1 3 2 255 2 1 3 2 3 2 1 4 255 255 255 0 4 255 255 1 0 4 255 2 1 0 4 3 2 1 0 Αρχικοποίηση D (big_value=255) Εικόνα Dμετά το 1 ο βήμα (k=1). Εικόνα Dμετά το 2 ο βήμα (k=2). Εικόνα Dμετά το 3 ο βήμα (k=3).

Εφαρμογή του αλγόριθμου DT 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 2 4 6 1 2 3 4 5 6 7

Distance Transform Αλγόριθμος: Sequential Euclidian 4-point 2 διπλά περάσματα, Ευκλείδια απόσταση Επιπλέον, μπορεί να επιστρέψει το κοντινότερο pixelακμής για κάθε pixel της εικόνας Αρχικοποίηση: για κάθε pixel p, D(p)=big_value Επίσης θεωρούμε οτι ισχύει big_value+1 big_value 37

Raw-wise, Forward Raw-wise, Backward 1. Για i=1:n 1. Για j=2:m D(i,j)=min(D ij,d i,j-1 +1,D i-1,j +1) 2. Για j=m-1:1 2. Για i=n-1:1 1. Για j=2:m D(i,j)=min(D ij,d i,j+1 +1) D(i,j)=min(D ij,d i,j+1 +1,D i+1,j +1) 2. Για j=m-1:1 Forward Column-wise, Backward Forward Column-wise, Backward D(i,j)=min(min(D ij,d i,j+1 +1) (i-1,j) (i,j-1) (i,j) Mask 1 (i,j) (i,j+1) Mask 2 (i,j) (i,j+1) (i+1,j) Mask 3 (i,j-1) (i,j) Mask 4 38

Για την ευρεση του κοντινότερου Pixel ακμής για κάθε pixel της εικόνας: Τηρούμε 2 πίνακες, διάστασης ίσης με την αρχική P i, P j : parent γραμμή i,στήλη j, για κάθε (i,j) P i, P j : Αρχικοποιούνται με NIL (πχ. -1) Σε κάθε επανάληψη που ενημερωνεται η απόσταση του (i,j), γίνεται αντίστοιχη ενημέρωση των. 39

Image moments, Fourier Descriptors: Gonzalez, Woods, Digital Image Processing, κεφ. 11. Distance Transform, Αρχικό paper: Borgefors, Gunilla. "Hierarchical chamfer matching: A parametric edge matching algorithm." IEEE Transactions on PAMI 10.6 (1988): 849-865. Tutorial with many algorithmic variations (eg. 4SSEDT) https://pdfs.semanticscholar.org/494f/6e6637b035308238b29323149 739b0a7e502.pdf, (p11) ASM Αρχικό paper T. Cootes,et al (1995). "Active shape models -their training and application". Computer Vision and Image Understanding(61): 38 59 http://personalpages.manchester.ac.uk/staff/timothy.f.cootes/pap ers/cootes_cviu95.pdf Tutorial: http://www2.compute.dtu.dk/courses/02511/docs/asm_overview.pdf 40