ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Σχολή Ηλεκτρολόγων Μηχ/κών & Μηχ/κών Υπολογιστών ΟΡΑΣΗ ΥΠΟΛΟΓΙΣΤΩΝ 2009: ΘΕΜΑΤΑ ΕΡΓΑΣΙΩΝ ΚΑΙ ΔΙΠΛΩΜΑΤΙΚΩΝ Κάθε εργασία (project) αφορά ένα μόνο θέμα, όπως έχει αναπτυχθεί σε μια κύρια δημοσίευση, την οποία σας δίνομε αρχικά. (Μπορείτε να βρείτε τα σχετικά άρθρα για τις εργασίες στην ιστοσελίδα του μαθήματος Ο.Υ.) Για μερικά θέματα που δεν δίνονται αντίστοιχες δημοσιεύσεις, σχετικές αναφορές μπορούν να βρεθούν από το βιβλίο της ΟΥ ή από το διαδίκτυο. Η εργασία μπορεί να εστιασθεί είτε σε ένα θεωρητικό θέμα από την δημοσίεση, είτε στην υλοποίηση του κύριου αλγορίθμου (και πειραματισμό με λίγες εικόνες), ή και στα δύο. Στην ακόλουθη λίστα με θέματα εργασιών σας δίνομε μερικές θεωρητικές επιλογές (Θ) ή/και υπολογιστική υλοποίηση (Υ). Η εργασία είναι προαιρετική και θα αντιστοιχεί στο 20% του τελικού βαθμού του μαθήματος. Παραδοτέα: Στο τέλος της 2 ης εξεταστικής περιόδου. Υπολογιστική: τυπωμένη περιληπτική περιγραφή, αντίγραφα κώδικα υλοποίησης & εικόνων πειραμάτων. Θεωρητική: τυπωμένη εργασία με την θεωρητική ανάλυση. Οροι: Η εργασία (project) πρέπει να: Είναι Ατομική. Αποτελεί ένα νέο έργο που δεν έχει γίνει πλήρως ή εν μέρει στα πλαίσια άλλου μαθήματος, ή της διατριβής του/της ΥΔ, ή κάποιου ερευνητικού προγράμματος. Εαν ο/η ΥΔ χρησιμοποιήσει κείμενα, ή δεδομένα ή κώδικα από τέτοιες προηγούμενες πηγές, πρέπει να το δηλώσει καθαρά και να αναφέρει ποια είναι η νέα συνεισφορά στην εργασία του μαθήματος όρασης υπολογιστών. Δεν επιτρέπεται η αντιγραφή κειμένων από άλλες πηγές, π.χ. βιβλία, άρθρα, Internet websites. Εαν χρησιμοποιήσετε Σχήματα/Πίνακες/Δεδομένα από άλλες πηγές, πρέπει να δώσετε την αναφορά στην πηγή αυτή. Σημείωση: Τα θέματα με (*) έχουν προοπτική να συνεχιστούν για Διπλωματικη. Πληροφορίες: maragos@cs.ntua.gr Λίστα Θεμάτων και Δημοσιεύσεων για εργασίες στην Ο.Υ. F: Εξαγωγή Χαρακτηριστικών (Feature Extraction) για Ο.Υ. (*) F1. SIFT - Scale-Invariant Feature Transform: D. Lowe, Distinctive Image Features from Scale- Invariant Keypoints, Int l Journal of Comp. Vision, 60(2):91-110, 2004. Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) F2. KLT: Kanade-Lucas-Tomasi Feature Tracker: J. Shi and C. Tomasi, Good Features to Track, IEEE Conference on Computer Vision and Pattern Recognition, pages 593-600, 1994. Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) F3. Ανίχνευση Ακμών, Περιγραμμάτων και Χαρακτηριστικών με Ισοϋψείς καμπύλες και Gestalt/Στατιστικούς νόμους: A. Desolneux, L. Moisan and J-M. Morel, Edge Detection by Helmholtz Principle, Int l J. Comp. Vision, 14: 271-284, 2001.
Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες, για την εύρεση του περιγράμματος ενός ή περισσότερων αντικειμένων. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; A: Μη-γραμμική Ανάλυση Γκρίζων και Εγχρωμων Εικόνων (*) Α1. Χωρικά-προσαρμοζόμενα μη-γραμμικά γεωμετρικά φίλτρα εικόνων: J. Debayle and J-C. Pinoli, General Adaptive Neighborhood Image Processing: Part I (Introduction and Theoretical Aspects) and Part II (Practical Application Examples), Journal of Math. Imaging and Vision, 25: 245 284, 2006. Υ. Να υλοποιήστε μια μέθοδο του άρθρου αυτού για προσαρμοστικά φίλτρα. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) Α2. A. Hanbury and J. Serra, Color Image Analysis in 3D Polar Coordinates, Proc. DAGM-2003. Υ. Να υλοποιήστε τις βελτιώσεις χρωματικού χώρου του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες έγχρωμες εικόνες. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) I1. I: Ταχεις Αλγόριθμοι/Αρχιτεκτονικές Υλοποίησης 2Δ/3Δ Γραμμικών ή Μορφολογικών Φίλτρων Εικόνων Υ. Ταχεις Αλγόριθμοι/Αρχιτεκτονικές Υλοποίησης 2Δ/3Δ Gabor φίλτρων και αντίστοιχων συστοιχιών για εξαγωγή χαρακτηριστικών για κάποια κατηγορία προβλημάτων ΟΥ. (*) I2. Υ. Ταχεις Αλγόριθμοι/Αρχιτεκτονικές Υλοποίησης 2Δ/3Δ Μορφολογικών ή Lattice φίλτρων και αντίστοιχων συστημάτων για εξαγωγή χαρακτηριστικών για κάποια κατηγορία προβλημάτων ΟΥ. Π.χ. υλοποίηση με Επιπεδοσύνολα και υπέρθεση κατωφλίου. C: Πολυκλιμακωτή Ανάλυση Σχήματος με Καμπυλότητα C1. Gaussian Curvature Scale-Space: F. Mokhtarian and A. Mackworth, A Theory of Multiscale, Curvature-based Shape Representation for Planar Curves, IEEE Trans. PAMI, vol.12, p.789-805, Aug. 1992. Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες εικόνες σχημάτων. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) C2. Μη-γραμμικός Curvature Scale-Space: A.C. Jalba, M.H. F. Wilkinson, and J.B.T. M. Roerdink, Shape Representation and Recognition Through Morphological Curvature Scale Spaces, IEEE Trans. Image Processing, vol.15, pp.331-341, Feb. 2006. Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού (μόνο για υπολογισμό του μη-γραμμικού πολυκλιμακωτού χώρου καμπυλότητας). Εφαρμόστε τον αλγόριθμό σας σε διάφορες εικόνες σχημάτων. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; E: Μέθοδοι Μερικών Διαφορικών Εξισώσεων (ΜΔΕ) για Image Enhancement
(*) Ε1. F. Catte, P.L. Lions, J.M. Morel, T. Coll, Image Selective Smoothing and Edge Detection by Nonlinear Diffusion, SIAM Journal Numer. Anal., 29(1):182-193, 1992. ( Σημείωση: Μπορείτε να μην δώσετε ιδιαίτερο βάρος στις ενότητες 2. Consistency of the model: Existence and uniqueness results και 3. An iterative scheme which converges to the solution of (2.1) ). Θ. Γιατί η μέθοδος του παραπάνω άρθρου δίνει καλύτερα αποτελέσματα από την απλή γραμμική διάχυση θερμότητας; Σε τι χρησιμεύει η συνέλιξη με τον γκαουσσιανό πυρήνα G σ που υπάρχει στην ΜΔΕ του μοντέλου; Υ1. Να υλοποιήσετε την μέθοδο αυτή. Για την διακριτοποίηση της ΜΔΕ, μπορείτε να χρησιμοποιήσετε (i) το implicit σχήμα που δίνεται στο άρθρο ή (ii) το αντίστοιχο explicit σχήμα (το δεξιό μέλος της ΜΔΕ υπολογίζεται όλο από την u n και η u n+1 εμφανίζεται μόνο στο αριστερό μέλος), στο οποίο δεν χρειάζεται αντιστροφή μήτρας, αλλά το χρονικό βήμα Δt πρέπει να κρατηθεί αρκετά μικρό (π.χ. Δt=0.2). Για την συνάρτηση g(s), που καθορίζει την ένταση της διάχυσης, επιλέξτε την: g(s)=1/(1+(s/θ) 2 ), όπου Θ είναι μία παράμετρος κατωφλίου (βλ. ενότητα 4.2 του άρθρου). Υ2. Εφαρμόστε την υλοποίησή σας σε διάφορες εικόνες γκρίζας κλίμακας με θόρυβο. Κάθε φορά, θεωρείστε σαν τελική έξοδο του αλγορίθμου την εικόνα για εκείνο το t που σας φαίνεται οπτικά καλύτερη. Σχολιάστε τα αποτελέσματα. Πώς συμπεριφέρεται η μέθοδος σε περιοχές εικόνων με έντονη υφή; Εξηγείστε με συντομία το φαινόμενο αυτό και θεωρητικά. (*) Ε2. L. Rudin, S. Osher, E. Fatemi, Nonlinear Total Variation based Noise Removal Algorithms, Physica D, 60:259-268, 1992. Θ. Γιατί η ελαχιστοποίηση της Total Variation είναι πιο αποτελεσματική από την ελαχιστοποίηση του (2.2); Πώς η μέθοδος του παραπάνω άρθρου καταφέρνει να απομακρύνει το θόρυβο και να συντηρήσει τις ακμές; Διαλέξτε ένα από τα ακόλουθα 2 σύνολα ερωτήσεων: Υ1. Να υλοποιήσετε την μέθοδο αυτή, βασιζόμενοι στην αριθμητική προσέγγιση που δίνεται στο άρθρο. Η έξοδος του μοντέλου δίνεται από την κατάσταση ισορροπίας της ΜΔΕ, επομένως χρειάζεται ένα κριτήριο σύγκλισης, όπως η rms τιμή της διαφοράς της τρέχουσας εικόνας από την εικόνα της προηγούμενης επανάληψης. Εφαρμόστε την υλοποίησή σας σε διάφορες εικόνες γκρίζας κλίμακας με θόρυβο. Σχολιάστε τα αποτελέσματα. Πώς συμπεριφέρεται η μέθοδος σε περιοχές εικόνων με έντονη υφή; Εξηγείστε με συντομία το φαινόμενο αυτό και θεωρητικά. ή Υ2. Χρησιμοποιώντας τις Euler-Lagrange εξισώσεις (βλ. π.χ. παρ.17.5 του βιβλίου της Όρασης) και ροή ταχύτερης καθόδου (gradient descent), να υπολογίσετε αναλυτικά την ΜΔΕ που προκύπτει από την ελαχιστοποίηση της παρακάτω γενίκευσης της Total Variation: (χωρίς να θεωρήσετε κάποιους περιορισμούς για την u(x,y) ). Προσπαθήστε να εκφράσετε την προκύπτουσα ΜΔΕ σε μία μορφή που να αναδεικνύει τη σύνδεσή της με το μοντέλο των Perona Malik (βλ. παρ. 11.3 του βιβλίου της Όρασης). Αναλύστε τη σύνδεση αυτή. Επίσης, τι προκύπτει στις ειδικές περιπτώσεις όπου φ(s)=s και φ(s)=s 2 ; (*) Ε3. J. Weickert, Multiscale Texture Enhancement, Computer Analysis of Images and Patterns, LNCS, Springer, 1995. Θ. Τι επιτυγχάνεται με τον τανυστή (tensor) διάχυσης το οποίο δεν μπορεί να επιτευχθεί με εναν απλό συντελεστή διάχυσης; Αντίστοιχα, τι επιπλέον πληροφορία παρέχει ο δομικός τανυστής (structure tensor) σε σχέση με τη νόρμα της κλίσης της εικόνας;
Υ1. Να υλοποιήσετε την μέθοδο του άρθρου αυτού. Μπορείτε να βασιστείτε σε μία από τις μεθόδους που αναφέρονται στο παρακάτω άρθρο: o J. Weickert, H. Scharr, A Scheme for Coherence-Enhancing Diffusion Filtering with Optimized Rotation Invariance, Journal of Visual Communication and Image Representation, 13:103 118, 2002. Για παράδειγμα, μια επιλογή είναι το κλασσικό explicit σχήμα και η διακριτοποίηση όπως περιγράφονται από την εικόνα 1(a) του άρθρου αυτού. Επίσης, μπορείτε να χρησιμοποιήσετε τον αλγόριθμο που προτείνεται σε αυτό το άρθρο, ο οποίος προσφέρει καλύτερη ακρίβεια. Υ2. Εφαρμόστε την υλοποίησή σας σε διάφορες εικόνες γκρίζας κλίμακας με θόρυβο ή και χωρίς. Κάθε φορά, θεωρείστε σαν τελική έξοδο του αλγορίθμου την εικόνα για εκείνο το t που σας φαίνεται οπτικά καλύτερη. Σχολιάστε τα αποτελέσματα. Πώς εξηγείτε το ότι η μέθοδος δίνει ένα ιμπρεσσιονιστικό στυλ στα αποτελέσματα; Υ3. (Προαιρετικά) Γενικεύστε τον αλγόριθμό σας στην περίπτωση έγχρωμων εικόνων, βασιζόμενοι στο παρακάτω άρθρο: o J. Weickert, Coherence-enhancing diffusion of colour images, 7th National Symposium on Pattern Recognition and Image Analysis, 1997. και εφαρμόστε τον σε διάφορες έγχρωμες εικόνες. Σχολιάστε τα νέα αποτελέσματα. S: Κατάτμηση Εικόνων S1. Πολυκλιμακωτή Κατάτμηση Εικόνων με μεθόδους Watershed και Γράφους: [R1] F. Meyer and P. Maragos, "Multiscale Morphological Segmentations Based on Watershed, Flooding, and Eikonal PDE'', Proceedings of International Conference on Scale-Space Theories in Computer Vision (SCALE-SPACE'99), Corfu, Greece, Sep. 1999; Lectures Notes on Computer Science 1682, pp.351-362, Springer-Verlag. Υ. Να υλοποιήστε την απλή μέθοδο Watershed κατάτμησης χρησιμοποιώντας τα μη-γραμμικά συστήματα για αυτόματη εξαγωγή σημαδευτών όπως και στην 3 η Εργ. Ασκηση της ΟΥ-2008 και εφαρμόσετε την σε κατάτμηση βιοϊατρικών εικόνων. Επεκτείνετε την μέθοδο για πολυκλιμακωτή κατάτμηση χρησιμοποιώντας Γράφους όπως στο άρθρο [R1]. Θ(*)/Υ(*). Γενικεύσετε την μέθοδο στο [R1] χρησιμοποιώντας γενικευμένες αποστάσεις σε γράφους και πολλαπλά οπτικά κριτήρια. S2. V. Caselles, R. Kimmel, G. Sapiro, Geodesic Active Contours, Int. Journal of Comp. Vision, 22(1):61-79, 1997. Θ1. Τι διαφορά έχει η γεωδαισική από την συνηθισμένη ευκλείδεια απόσταση και γιατί είναι κατάλληλη για το πρόβλημα της κατάτμησης; Θ2. Ποιες είναι οι δυνάμεις που ασκούνται στην εξελισσόμενη καμπύλη στο μοντέλο που προτείνεται και τι επίδραση έχει η καθεμία από αυτές; Θ3. Πώς γίνεται η υλοποίηση της εξέλιξης της καμπύλης με επιπεδοσύνολα (level sets) και τι πλεονεκτήματα προσφέρει μία τέτοια υλοποίηση; Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες, για την εύρεση του περιγράμματος ενός ή περισσότερων αντικειμένων. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) S3. N. Paragios and R. Deriche, Geodesic Active Regions and Level Set Methods for Supervised Texture Segmentation, Int l Journal of Comp. Vision, 46(3):223-247, 2002.
Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες, για την εύρεση του περιγράμματος ενός ή περισσότερων αντικειμένων. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; (*) S4. Αλγόριθμοι για Κατάτμηση εικόνων σε πολλαπλές κλίμακες με Γράφους: J. Shi and J. Malik, Normalized Cuts and Image Segmentation, IEEE Trans. Pattern Anal. & Mach. Intelligence, vol.22, pp.888-905, Aug. 2000, Υ. Να υλοποιήστε τη μέθοδο του άρθρου αυτού. Εφαρμόστε τον αλγόριθμό σας σε διάφορες γκρίζες εικόνες, για την εύρεση του περιγράμματος ενός ή περισσότερων αντικειμένων. Σχολιάστε τα αποτελέσματα. Σε ποιες περιπτώσεις η μέθοδος δεν δίνει επιθυμητά αποτελέσματα και γιατί; Q: Οπτική Αντίληψη & Προσοχή, Ποιότητα Εικόνων Q1. Ποσοτική εκτίμηση της οπτικής ποιότητας εικόνων (σύμφωνα με την ανθρώπινη αντίληψη) χρησιμοποιώντας τον Δείκτη Δομικής Ομοιότητας (Structural Similarity Index): Ζ. Wang, A.C. Bovik, H.R. Sheikh and E.P. Simoncelli, "Image Quality Assessment: From Error Visibility to Structural Similarity", IEEE Trans. on Image Processing, 13(4), 2002. Υ. Γενικεύστε την μέθοδο αυτή, βρίσκοντας τις τιμές για τον Μέσο δείκτη Δομικής Ομοιότητας (Mean Structural Similarity index - MSSIM) για κάθε ζεύγος αντίστοιχων εξόδων μίας συστοιχίας φίλτρων Gabor (Gabor filterbank), η οποία εφαρμόζεται στις δύο εικόνες υπό σύγκριση (π.χ. σε μία καθαρή εικόνα και κάποια θορυβώδη εκδοχή της). Βρείτε κάποιον τρόπο ώστε αυτές οι τιμές του MSSIM να συνδυαστούν κατάλληλα ώστε να δώσουν έναν τελικό δείκτη ποιότητας. Για τον υπολογισμό του MSSIM, μπορείτε να χρησιμοποιήσετε τον Matlab κώδικα των συγγραφέων (δίνεται σχετικός σύνδεσμος μέσα στο άρθρο). (*) Θ. (για διπλωματική μόνο). Χρησιμοποιώντας το Gabor filterbank όπως παραπάνω, αναπτύξτε ένα νέο δείκτη οπτικής ποιότητας, αξιοποιώντας την Teager ενέργεια υφής, όπως αυτή εφαρμόζεται στις εξόδους των φίλτρων. Q2. Ποιότητα Εικόνων μελετώντας τη Φάση τους: [R1] G. Blanchet, L. Moisan and B. Rouge, Measuring the Global Phase Coherence of an Image, Proc. IEEE International Conf. Image Processing (ICIP) 2008. Υ. Υλοποιήστε τη μέθοδο υπολογισμού του μετρικού βασισμένη στη νόρμα Ολικής Μεταβολής (TV) και συγκρίνεται με το MSSIM για διαφορετικές κατηγορίες εικόνων. Πως αποκρίνονται τα δύο μετρικά για εικόνες με διαφορετικά χαρακτηριστικά (μακροδομές, υφή κ.λπ.)? Διερευνήστε το ρόλο της φάσης σε θέματα ποιότητας και αισθητικής εικόνων. Q2. Μοντέλα Οπτικής Προσοχής και Αντίληψης: [R1] L. Itti and C. Koch, Computational Modeling of Visual Attention, Nature Reviews Neuroscience, 2(4), 2001. [R2] O. Ben-Shahar, B. J. Scholl, S. W. Zucker, Attention, segregation, and textons: Bridging the gap between object-based attention and texton-based segregation, Vision Research, 47, 845 860, 2007. Θ. Γενικεύστε τη μέθοδο Itti-Koch [R1] εισάγοντας μετρήσεις και περιγραφείς υφής (π.χ. textons, filterbanks, AM-FM μοντέλα, ενεργειακές μετρήσεις κ.α.). G: Επίλυση Προβλημάτων Όρασης με Γράφους G1. Υλοποίηση με Γράφους μη-γραμμικών αντικειμενοστραφών (μορφολογικών) φίλτρων για απλοποίηση εικόνων: [R1] P. Salembier, A. Oliveras and L. Garrido, "Antiextensive Connected Operators for Image and Sequence Processing", IEEE Trans. Image Processing, 7(4): 555 570, 1998. [R2] P. Salembier and J. Serra, Flat Zones filtering, Connected operators and filters by Reconstruction, IEEE Trans. Image Processing, 3: 1153 1160, 1995.
[R3] F. Meyer, Graph based Levelings, Proc. ISMM 2007. Υ. Υλοποίηση αντικειμενοστραφών (μορφολογικών) φίλτρων, όπως φίλτρα ιδιοτήτων ή φίλτρα ανακατασκευής που επεξεργάζονται ολόκληρες περιοχές/αντικείμενα (Flat Zones) της εικόνας όπως στο [R2] αντί μεμονωμένα pixels, με δομές αλγορίθμους γράφων & δένδρων όπως στο [R1]. (*) G2. Y. Boykov, O. Veksler, R. Zabih, "Fast approximate Energy Minimization via Graph Cuts", IEEE Trans. on Pattern Analysis and Machine Intelligence, 23(11):1222 1239, 2001. Y. Υλοποίηση ενός αλγορίθμου κατάτμησης εικόνας με την μέθοδο του άρθρου αυτού, δηλ. ελαχιστοποίησης κάποιας ενέργειας πάνω σε γράφους. Θ. Θεωρητική διερεύνηση του γενικού πλαισίου επίλυσης προβλημάτων όρασης με ελαχιστοποίηση ενεργειακών συναρτησιακών πάνω σε γράφους. FR: Ανάλυση Σχήματος ή Υφής με Fractals FR1(*). Ανάλυση ή Σύνθεση Φρακταλ Εικονων με ντετερμινιστικά ή στατιστικά μοντέλα απο φρακταλ γεωμετρια : [R1] B. Mandelbrot, Fractal Geometry of Nature, 1982. [R2] M. Banrsley, Fractals Everywhere (or Superfractals). Υ, Θ(*). FR2(*). Περιγραφείς Υφής με φράκταλ χαρακτηριστικά, αμετάβλητα σε 3Δ μετασχηματισμούς: [R1]Y. Xu, H. Ji, C. Fermuller, Viewpoint Invariant Texture Description Using Fractal Analysis, Int l Journal of Comp. Vision, 83:85-100, 2009. [R2] M. Varma and R. Gharg, Locally Invariant Fractal Features for Statistical Texture Classification, IEEE Proc. Intl. Conf. Computer Vision (ICCV), 2007. Y. Υλοποίηση μιας εκ των δύο μεθόδων εξαγωγής φράκταλ χαρακτηριστικών. (*) Εφαρμογή σε στατιστικές μεθόδους ταξινόμηση υφής σε μεγάλες βάσεις δεδομένων αναφοράς. FR3(*). Εφαρμογή του FR1 ή FR2 σε Βιοϊατρικές Εικόνες. Υ, Θ(*). MG: Γεωμετρία Πολλαπλών Εικόνων και Στερέοψη MG1. Ενα θεμα Στερέοψης και 3Δ Ανακατασκευής χρησιμοποιώντας γεωμετρία πολλαπλών όψεων: [R1] Faugeras and Luong 2001. [R2] Hartley and Zisserman 2003. Υ. Υλοποίηση κάποιου αλγορίθμου ή εφαρμογής. Θ(*). Θεωρητική διερεύνηση κάποιου σχετικού υπολογιστική αρχαιολογία. προβλήματος και εφαρμογη σε βιοϊατρική ή T: Ανάλυση Υφής: Περιγραφές, Διαχωρισμός T1(*). Σημεία ενδιαφέροντος και Περιγραφείς Υφής. [R1] J. Zhang, M. Marszałek, and C. Lazebnik, S. Schmid, Local features and kernels for classification of texture and object categories: a comprehensive study, IJCV, 2007. Υ. Υλοποίηση μιας εκ των μεθόδων που αναφέρονται στην υφή.
Y. Επέκταση για πολυκαναλικά χαρακτηριστικά υφής και αναγνώριση με μεθόδους bag-οf-words. Υ. Ανιχνευτές σημείων ενδιαφέροντος υφής για την εξαγωγή περιγραφών. Συγκρίσεις. Τ2. Διαχωρισμός Υφής με Μεταβολικά Σχήματα u+v και Gabor φίλτρα. [R1] J.-F. Aujol, G. Gilboa, T. Chan and S. Osher, Structure-Texture Decomposition by a TV-Gabor Model, Proc. VLSM 2005, LNCS 3752, pp. 85 96, 2005. [R2] J.-F. Aujol, G. Gilboa, T. Chan and S. Osher, Structure-Texture Image Decomposition Modeling, Algorithms and Parameter Selection, International Journal of Computer Vision 67(1), 111 136, 2006. Y. Υλοποίηση μεταβολικού σχήματος με PDE s διαχωρισμού εικόνων σε συνιστώσες γεωμετρίας και υφής (u+v) χρησιμοποιώντας πρότερη πληροφορία από ανάλυση με Gabor φίλτρα. Θ(*). Θεωρητική διερεύνηση κατάλληλων μαθηματικών χώρων και νορμών (L1,L2,Linf ) ή αποστάσεων για την περιγραφή πολυδιάστατων σχέσεων ομοιότητας χαρακτηριστικών. Θ. Ρύθμιση των παραμέτρων του μοντέλου και διερεύνηση της κλίμακας του διαχωρισμού. Τ3. Κατηγοριοποίηση Υφής Ανάλυση σε Πολλαπλές κλίμακες (Filterbanks, Wavelets) [R1] T. Randen and J. H. Husoy. Filtering for texture classifcation. IEEE Trans. Pattern Anal. Machine Intell., 21(4):291-310, April 1999. [R2] S. E. Grigorescu, N. Petkov, and P. Kruizinga. Comparison of texture features based on Gabor Filters. IEEE Trans. Image Proc., 11(10):1160-1167, Oct.2002. Y. Σχεδιασμός ενός filterbank από Gabor φίλτρα. Ανακατασκευή και βελτιστοποίηση της. Υ. Σύγκριση 2 διαφορετικών μεθόδων πολυκαναλικής ανάλυσης για ταξινόμηση [R1]. Y. Σύγκριση 2 διαφρετικών χαρακτηριστικών πολυκαναλικής ανάλυσης για ταξινόμηση [R2]. Τ4. Ανακατασκευή της φάσης AM-FM συνιστωσών υφής. [R1] A. Aggrawal, R. Chellapa and R. Raskar, An Algebraic Approach to Surface Reconstruction from Gradient Fields, ICCV 2005. Υ. Υλοποίηση μιας μεταβολικής μεθόδου εξαγωγής του πεδίου από το διάνυσμα κλίσης του (Heightfrom-Gradient). V. Όραση για Ανάλυση Βίντεο και Περίληψη Ταινιών (Movie Summarization) V1. Χαρακτηριστικά Οπτικής Προσοχής και Χρονική Σημαντικότητα (Saliency) Βίντεο: [R1] Y. Ma, X. Hua, L. Lu and H.-J. Zhang, A Generic Framework of User Attention Model and Its Application in Video Summarization, IEEE Trans. on Multimedia, 7(5), 2005. [R2] G. Evangelopoulos, A. Zlatintsi, G. Skoumas, K. Rapantzikos, A. Potamianos, P. Maragos and Y. Avrithis, Video Event Detection and Summarization Using Audio, Visual and Text Saliency, Proc. of Int l Conference on Acoustics, Speech and Signal Processing (ICASSP-2009). Υ. Υλοποιήστε και συγκρίνετε μεθόδους fusion τέτοιων χαρακτηριστικών. Θ(*). Διερευνήστε το ρόλο διαφορετικών οπτικών χαρακτηριστικών και τη σημασία τους για την εξαγωγή καμπυλών σημαντικότητας (saliency) της πληροφορίας του video. Ε(*). Υποκειμενικές και αντικειμενικές εκτιμήσεις αποδοτικότητας με βάση δεδομένα ταινιών με επισημείωση. V2 (*). Spatiotemporal Motion Filters for Scene/Shot Detection or Camera Modeling: [R1] P. Bouthemy, M. Gelgon, F. Ganansia, A unified approach to shot change detection and camera motion characterization IEEE Trans. Circuits and Systems for Video Technology, 9(7): 1030-1044,1999. [R2] Edward H. Adelson and James R. Bergen, Spatiotemporal energy models for the perception of motion, JOSA A, 2(2), pp. 284-299 (Θ),(Υ) Διερευνήστε τρόπους εξαγωγής πληροφορίας για τη δομή (σκηνές, λήψεις) ή το είδος γυρίσματος (camera motion), π.χ. [R1] χρησιμοποιώντας χωρο-χρονικά φίλτρα για ανίχνευση κίνησης [R2].
P: Inpainting-Ενδοσυμπληρωση, Υπολογιστικη Φωτογραφια P1. Abstraction και cartooning εικόνων [R1] Winnemoller, Olsher and Gooch, Real-time video abstraction, SIGGRAPH06. [R2] A. Santella and D. DeCarlo, Visual Interest and NPR: an Evaluation and Manifesto, Proc. of the 3rd international symposium on Non-photorealistic animation and rendering (Υ) Υλοποιήστε το σύστημα [R1](βασισμένο σε απλοποίηση της εικόνας, απομάκρυνση της υφής, επεξεργασία του χρώματος και ανίχνευση ακμών) κάνοντας παραλλαγές σε ένα ή περισσότερα από τα ενδιάμεσα στάδια. Συγκρίνετε ποιοτικά τα αποτελέσματα σε εικόνες αναφοράς και εικόνες από φυσικές σκηνές. (Υ*) Ανάπτυξη νέων μεθόδων και πιθανές εφαρμογές τους σε προβλήματα Όρασης Υπολογιστών. Υποκειμενική αξιολόγηση από παρατηρητές και σχέσεις με την οπτική αντίληψη και την προσοχή [R2]. P2. Μεταφορά φωτογραφικού στυλ και μη-φωτορεαλιστική απόδοση (Non-photorealistic rendering) [R1] S. Bae, S. Paris, F. Durand, Two-scale Tone Management for Photographic Look, SIGGRAPH 2006. [R2] A. Orzan, A. Bousseau, P. Barla and J. Thollot, Structure-preserving manipulation of photographs, non-photorealistic Rendering 2007. (Υ) Υλοποιήστε ένα από τα συστήματα κάνοντας παραλλαγές σε ένα ή περισσότερα από τα ενδιάμεσα στάδια τους (χρώμα, εξαγωγή υφής, εξαγωγή δομής, ακμές). Συγκρίνεται ποιοτικά τα αποτελέσματα σε εικόνες αναφοράς και εικόνες από γνωστά ή ιστορικά φωτογραφικά στυλ. P3. Poisson Διόρθωση εικόνων [R1] P. Perez, M. Gangnet and A. Blake, Poisson Image Editing, SIGGRAPH 2003. (Υ) Υλοποιήστε και πειραματιστείτε με διάφορους τρόπους διόρθωσης εικόνων βασισμένους στην επίλυση της Διαφορικής Εξίσωσης Poisson (ενδοσυμπλήρωση, παρεμβολή, cloning, seamless stitching εικόνων κ.λπ.). (Υ*) Πιθανές επεκτάσεις με διαφορικές εξισώσεις ανώτερης τάξης. (*)Ο: Scene recognition/object recognition (Θ,Υ *) Ανάπτυξη μεθοδολογίας κατάτμησης ή αναγνώρισης σκηνών/αντικειμένων, με βάση επεκτάσεις ή ιδέες που μπορεί να προκύψουν από κάποια σχετική προηγούμενη κατηγορία, με σκοπό τη συμμετοχή στο Διαγωνισμό «PASCAL Visual Object Classes Recognition Challenge 2009». Για 20 τάξεις αντικειμένων οι συμμετέχοντες υποβάλλουν νέους αλγορίθμους σε θέματα αναγνώρισης, κατάτμησης, ταξινόμησης ή ανίχνευσης των αντικειμένων. Η συμμετοχή εξασφαλίζει δεδομένα, συγκρίσεις με πρωτοπόρες ερευνητικές ομάδες παγκόσμια και την ευκαιρία για δημοσιεύσεις στα βασικά συνέδρια της Όρασης Υπολογιστών. Περισσότερες πληροφορίες: http://pascallin.ecs.soton.ac.uk/challenges/voc/voc2009/index.html