Διπλωματική εργασία με την Ομάδα Κατανόησης Πολυμέσων Ακαδημαϊκό έτος (1 η διανομή)

Σχετικά έγγραφα
3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΠΜΣ «ΠΛΗΡΟΦΟΡΙΚΗ & ΕΠΙΚΟΙΝΩΝΙΕΣ» OSWINDS RESEARCH GROUP

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΠΜΣ «ΠΛΗΡΟΦΟΡΙΚΗ & ΕΠΙΚΟΙΝΩΝΙΕς» OSWINDS RESEARCH GROUP

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΥΡΕΣΗ ΤΟΥ ΔΙΑΝΥΣΜΑΤΟΣ ΘΕΣΗΣ ΚΙΝΟΥΜΕΝΟΥ ΡΟΜΠΟΤ ΜΕ ΜΟΝΟΦΘΑΛΜΟ ΣΥΣΤΗΜΑ ΟΡΑΣΗΣ

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017

Ημερίδα διάχυσης αποτελεσμάτων έργου Ιωάννινα, 14/10/2015

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

Legal use of personal data to fight telecom fraud

[1] DNA ATM [2] c 2013 Information Processing Society of Japan. Gait motion descriptors. Osaka University 2. Drexel University a)

Παραδόσεις 4. Δεν υφίστανται προϋποθέσεις. Ελληνικά / Αγγλικά

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

Ανάκτηση πολυμεσικού περιεχομένου

Εισαγωγικά για την αναγνώριση έκφρασης προσώπου (Facial Expression Recognition)

Πανεπιστήμιο Κύπρου. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (ΗΜΜΥ)

ΤΕΛΙΚΕΣ ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ (6 Μονάδες ECTS)- Ακαδημαϊκό Έτος

of Cognition, Brain, and Language, Spain.

The Greek Data Protection Act: The IT Professional s Perspective

Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence)

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ ΑΘΗΝΑ Ε - ΜΑΙL : mkap@aueb.gr ΤΗΛ: , ΚΑΠΕΤΗΣ ΧΡΥΣΟΣΤΟΜΟΣ. Βιογραφικό Σημείωμα

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

Στην Εποχή των Μεγάλων Δεδοµένων (Big Data)

ΓΙΑΝΝΟΥΛΑ Σ. ΦΛΩΡΟΥ Ι ΑΚΤΟΡΑΣ ΤΟΥ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕ ΟΝΙΑΣ ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

HOSVD. Higher Order Data Classification Method with Autocorrelation Matrix Correcting on HOSVD. Junichi MORIGAKI and Kaoru KATAYAMA

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

BΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ.

Εργαστήριο Ιατρικής Φυσικής

Πληροφοριακά Συστήματα Διοίκησης

Επικοινωνιών στην Εκπαίδευση. Τεχνολογίες Πληροφορίας & (ΤΠΕ-Ε)

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

Area Location and Recognition of Video Text Based on Depth Learning Method

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

ΤΕΧΝΙΚΕΣ ΚΑΤΑΓΡΑΦΗΣ ΣΥΝΑΙΣΘΗΜΑΤΩΝ (EMOTIONS) ΑΠΟ ΤΗ ΧΡΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ. Ελένη Καλκοπούλου. στα πλαίσια του μαθήματος Πολυμέσα (ΓΤΠ61)

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Μηχανουργική Τεχνολογία ΙΙ

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)


From Secure e-computing to Trusted u-computing. Dimitris Gritzalis

DECO DECoration Ontology

ΑΝΙΧΝΕΥΣΗ ΦΩΤΙΑΣ. Χαοτικό φαινόμενο, με ακανόνιστο σχήμα Βασικό χαρακτηριστικό της φωτιάς είναι το χρώμα

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Τμήμα Μαθηματικών Π.Μ.Σ. Θεωρητικής Πληροφορικής και Θεωρίας Συστημάτων και Ελέγχου

Διαδραστική τέχνη και υπολογιστική όραση. Θοδωρής Παπαθεοδώρου Ανωτάτη Σχολή Καλών Τεχνών

Indoor Augmented Reality Guide for Mediterranean College. Φώτης Παπαχρήστος

Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο

Random Forests Leo. Hitoshi Habe 1

Towards a more Secure Cyberspace

Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική

Δημήτριος Τζανάκης Βασίλειος Βασιλάκης

Αξιολόγηση µεθόδων σύνθεσης εικόνων. Β. Τσαγκάρης και Β. Αναστασόπουλος

Anomaly Detection with Neighborhood Preservation Principle

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Security and Privacy: From Empiricism to Interdisciplinarity. Dimitris Gritzalis

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΣΥΜΠΙΕΣΗ ΚΑΙ ΜΕΤΑΔΟΣΗ ΠΟΛΥΜΕΣΩΝ. Εισαγωγή. Κλήμης Νταλιάνης Λέκτορας ΠΔ 407/80

ΠΑΝΕΠΙΤΗΜΙΟ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Ψηφιακά Mέσα Υπολογιστική Νοημοσύνη

ΕΠΛ202:'Η'επιστημονική'δημοσίευση

Secure Cyberspace: New Defense Capabilities

Τοποθέτηση τοπωνυµίων και άλλων στοιχείων ονοµατολογίας στους χάρτες

Βιοϊατρική τεχνολογία

Vol. 31,No JOURNAL OF CHINA UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

ΠΡΟΣΚΛΗΣΗ ΕΚΔΗΛΩΣΗΣ ΕΝΔΙΑΦΕΡΟΝΤΟΣ (Για υποβολή πρότασης σύναψης σύμβασης μίσθωσης έργου ιδιωτικού δικαίου)

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία

Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. Φωτεινή Α. Παπαδοπούλου Επίκουρη Καθηγήτρια. Διεύθυνση:

Ειδικές Επιστηµονικές Εργασίες

Toward a SPARQL Query Execution Mechanism using Dynamic Mapping Adaptation -A Preliminary Report- Takuya Adachi 1 Naoki Fukuta 2.

substructure similarity search using features in graph databases

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Εφαρμοσμένος & Υπολογιστικός Ηλεκτρομαγνητισμός Ηλ. Αιθ. 012, 013. Στοχαστικά Συστήματα & Επικοινωνίες Ηλ. Αμφ.

Critical Infrastructures: The Nervous System of every Welfare State. G. Stergiopoulos, D. Gritzalis

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ερευνητική+Ομάδα+Τεχνολογιών+ Διαδικτύου+

Online Social Networks: Posts that can save lives. Dimitris Gritzalis, Sotiria Giannitsari, Dimitris Tsagkarakis, Despina Mentzelioti April 2016

Ψηφιακή Επεξεργασία Εικόνας

No. 7 Modular Machine Tool & Automatic Manufacturing Technique. Jul TH166 TG659 A

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Στοχαστικά Συστήματα & Επικοινωνίες Ηλ. Αμφ. 1, 2 Ηλ. Αιθ. 001, 002. Γλώσσες Προγραμματισμού Ι Ηλ. Αμφ.

Αποτύπωση Απόψεων Μαθητών και Έλεγχος Επίδρασης στην Επίδοση τους από τη Χρήση Διαδικτυακού Εργαλείου Αξιολόγησης

ΠΡΟΓΡΑΜΜΑ ΕΠΑΝΑΛΗΠΤΙΚΩΝ ΕΞΕΤΑΣΕΩΝ

ΨΗΦΙΑΚΟΣ ΓΡΑΜΜΑΤΙΣΜΟΣ

1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] , 2 : X X 1 X 2 ;

CorV CVAC. CorV TU317. 1

Αποτυπώςεισ & Τεκμηρίωςη Αντικειμζνων

using advanced personalized patient models and advanced interventions»

Δ3.4. Μια Δημοσίευση σε έγκυρο περιοδικό και δυο Ανακοινώσεις Δημοσιεύσεις στα Πρακτικά Διεθνών Συνεδρίων


Πρόγραμμα Μεταπτυχιακών Σπουδών στην Πληροφορική (ΠΜΣ) Τμήμα Πληροφορικής ΑΠΘ

Γεωργία Ακριβείας στην Αμπελοκαλλιέργεια Βελτίωση ποιότητας και μείωση εισροών


Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τεχνολογία στην Εκπαίδευση Εισαγωγή. Χαρίκλεια Τσαλαπάτα 24/9/2012

Ανάκτηση Πληροφορίας

Στοχαστικά Σήματα και Τηλεπικοινωνιές

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Προηγµένη ιασύνδεση µε τοπεριβάλλον

ιαφάνειες μαθήματος "Φωτογραμμετρία ΙΙΙ" (0) Γ. Καρράς_12/2011

Detection and Recognition of Traffic Signal Using Machine Learning

Transcript:

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Τομέας Ηλεκτρονικής και Υπολογιστών Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών Ομάδα Κατανόησης Πολυμέσων Αναπληρωτής Καθηγητής Αναστάσιος Ντελόπουλος Τηλ.: 2310 99 6272 e-mail: adelo@eng.auth.gr 54 124 Θεσσαλονίκη Διπλωματική εργασία με την Ομάδα Κατανόησης Πολυμέσων Ακαδημαϊκό έτος 2020-21 (1 η διανομή) Προτείνονται τα παρακάτω θέματα διπλωματικών εργασιών για το τρέχον ακαδημαϊκό έτος και ορίζοντα ολοκλήρωσης άνοιξη 2021. Η συνάντηση για την παρουσίαση των θεμάτων και την εκδήλωση ενδιαφέροντος θα πραγματοποιηθεί τη Δευτέρα 19.10.20 στις 20:00-21:00. Anastasios Ntelopoulos is inviting you to a scheduled Zoom meeting. https://authgr.zoom.us/j/96118942178?pwd=q2nwbezxdzzvekiwvdfct0parensqt09 Φιλικά, Κυριακή, 11 Οκτωβρίου 2020 Αναστάσιος Ντελόπουλος

Αναγνώριση δραστηριοτήτων του ανθρώπου από δεδομένα GPS Η παρακολούθηση της κινητικότητας του ανθρώπου είναι διαδεδομένη χάρη στους αισθητήρες GPS που υπάρχουν διαθέσιμοι στα κινητά τηλέφωνα. Το σήμα GPS μπορεί να αξιοποιηθεί ώστε να εντοπίζουμε ποιες τοποθεσίες επισκέφθηκε ο άνθρωπος με υψηλή ακρίβεια. Όμως, πέρα από τα σημεία επίσκεψης, υπάρχει και η ανάγκη να κατανοήσουμε γιατί κάποιος χρήστης πραγματοποίησε μία μετάβαση, για παράδειγμα την κατηγορία της δραστηριότητας (εργασία, διασκέδαση, μικροδουλειές κτλ). Στόχος της διπλωματικής είναι να αναπτυχθεί μία μέθοδος για την επεξεργασία χωροχρονικών δεδομένων τοποθεσίας GPS, στην οποία οι μεταβάσεις του ανθρώπου αναπαρίστανται με τη μορφή κατευθυντικών γράφων. Οι γράφοι θα αποτελούν είσοδο σε δίκτυα τύπου Graph Convolutional Networks (CGN) που θα εκπαιδεύονται για κάθε άνθρωπο. Στόχος των εκπαιδευμένων GCN είναι η πρόβλεψη της δραστηριότητας που θα εκτελέσει ο άνθρωπος όταν παρατηρείται μία νέα μετάβαση. Η διπλωματική θα εξετάσει μεθοδολογίες για την εκπαίδευση των δικτύων GCN. Martin, Henry, et al. "Graph convolutional neural networks for human activity purpose imputation." NIPS spatiotemporal workshop at the 32nd Annual conference on neural information processing systems (NIPS 2018). 2018. Απαιτούμενες γνώσεις: - Καλή γνώση Python - Καλή γνώση στην περιοχή της μηχανικής μάθησης - Καλή γνώση κάποιου Deep Learning framework (Tensorflow/Keras/PyTorch) Ιωάννης Σαράφης, (sarafis@mug.ee.auth.gr)

Αλγόριθμοι σύντηξης (fusion) αδρανειακών και βίντεο δεδομένων με στόχο την μοντελοποίηση της ανθρώπινης διατροφικής συμπεριφοράς. Η αυτόματη αναγνώριση λήψης τροφής είναι ένα πρόβλημα που έχει απασχολήσει την ερευνητική κοινότητα τα τελευταία χρόνια λόγω των πολλαπλών ιατρικών εφαρμογών. Πολλές μελέτες έχουν ασχοληθεί με την αναγνώριση λήψης τροφής χρησιμοποιώντας δεδομένα που προέρχονται από μία πηγή πληροφορίας (π.χ., κάμερα, smart-glasses, smartwatches ή μικρόφωνα). Ο συνδυασμός πληροφορίας από διαφορετικές πηγές ενεργεί ευεργετικά σε περιπτώσεις που υπάρχει παρουσία θορύβου σε μία από τις πηγές ή οι συνθήκες καταγραφής δεν είναι ιδανικές (π.χ. χαμηλός φωτισμός). Η παρούσα διπλωματική έχει ως αντικείμενο την ανάπτυξη deep learning αλγορίθμων και του πειραματικού πλαισίου που θα σχετίζεται με την σύντηξη (fusion) της πληροφορίας Video και IMU (από smartwatch) με στόχο την αποτελεσματική μοντελοποίηση της ανθρώπινης διατροφικής συμπεριφοράς. [1] Kyritsis, K., Diou, C., & Delopoulos, A. (2020). A Data Driven End-to-end Approach for Inthe-wild Monitoring of Eating Behavior Using Smartwatches. IEEE Journal of Biomedical and Health Informatics. [2] Rouast, P. V., & Adam, M. T. (2019). Learning deep representations for video-based intake gesture detection. IEEE Journal of Biomedical and Health Informatics, 24(6), 1727-1737. [3] Rouast, P. V., Heydarian, H., Adam, M. T., & Rollo, M. E. (2020). OREBA: A Dataset for Objectively Recognizing Eating Behaviour and Associated Intake. arxiv preprint arxiv:2007.15831. [4] The Food Intake Cycle (FIC) Dataset, available online: https://mug.ee.auth.gr/intake-cycledetection/ Προαπαιτούμενες γνώσεις: - Πολύ καλή γνώση Python και κάποιου Deep Learning framework (Tensorflow/Keras/PyTorch, etc.) - Πολύ καλή γνώση αρχών μηχανικής μάθησης και ψηφιακής επεξεργασίας σήματος - Εμπειρία σε περιβάλλον Linux και εργασία σε απομακρυσμένα μηχανήματα (over SSH) Ντίνος Κυρίτσης, (kokirits@mug.ee.auth.gr)

Ανάπτυξη και διερεύνηση τεχνικών για την εύρωστη εκπαίδευση νευρωνικών δικτύων παρουσία θορύβου ετικετών. Ο θόρυβος ετικετών είναι ένα πρόβλημα που συναντάται πολύ συχνά σε πρακτικά προβλήματα ταξινόμησης/παλινδρόμησης. Ως εκ τούτου, έχει μελετηθεί εκτενώς από την ερευνητική κοινότητα, κυρίως όμως για δεδομένα τύπου εικόνας. Η δε ανάπτυξη αποτελεσματικών, εύχρηστων και υπολογιστικά απλών μεθόδων, που να είναι εφαρμόσιμες σε πληθώρα διαφορετικών τύπων και σετ δεδομένων, παραμένει ένα ανοιχτό πρόβλημα. Η παρούσα διπλωματική θα έχει ως αντικείμενο τη διερεύνηση ή και την ανάπτυξη τεχνικών βαθιάς μάθησης, ανθεκτικών στο θόρυβο ετικετών. Στο πλαίσιο αυτό, θα χρησιμοποιηθούν και ενδεχομένως θα επεκταθούν πρόσφατα ερευνητικά αποτελέσματα από προηγούμενες διπλωματικές στο ίδιο αντικέιμενο [1], ενώ θα γίνει προσπάθεια επέκτασής τους και σε δεδομένα άλλων τύπων, π.χ. επιταχυνσιομετρικά. [1] Σιώμος Βασίλειος. Recon: Ensembles of Networks Fine-tuned on Randomly Sampled Subsets Combat Label Noise, https://ikee.lib.auth.gr/record/320384/?ln=en [2] S. Guo, W. Huang, H. Zhang, C. Zhuang, D. Dong, M. R. Scott, and D. Huang, Curriculumnet: Weakly supervised learning from large-scale web images, (ECCV), September 2018. [3] X. Yu, B. Han, J. Yao, G. Niu, I. W. Tsang, and M. Sugiyama, How does disagreement help generalization against label corruption? in Proceedings of the 36th ICML, vol. 97, 2019, pp. 7164 7173. Aπαιτούμενες γνώσεις: - Πολύ καλή γνώση Python - Πολύ καλή γνώση κάποιου Deep Learning framework (Tensorflow/Keras/PyTorch, etc.) - Πολύ καλή γνώση γενικών αρχών μηχανικής μάθησης. Αλέξανδρος Παπαδόπουλος, (alpapado@mug.ee.auth.gr)

Εκπαίδευση μοντέλων υπολογισμού του βάθους από έγχρωμες μονοσκοπικές εικόνες. Εφαρμογής σε εικόνες φαγητού. Ο υπολογισμός του βάθους από μία RGB εικόνα υπερβαίνει τις μεθόδους της στερεοσκοπικής όρασης εκμεταλλευόμενος την υποκείμενη σύνδεση του βάθους με το πως φαίνεται η υφή των αντικειμένων από διαφορετικές αποστάσεις. Η εκπαίδευση μοντέλων πρόβλεψης του βάθους από την υφή και το χρώμα απαιτεί τυπικά τη χρήση μεγάλου συνόλου δεδομένων με RGB-D εικόνες. Έχει προταθεί εναλλακτικά η χρήση κατά την εκπαίδευση (1) στερεοσκοπικών ζευγών, (2) ακολουθιών εικόνων (βίντεο) σε συνδυασμό με τεχνικές αυτοεκπαίδευσης. Η παρούσα διπλωματική θα έχει ως αντικείμενο τη διερεύνηση ή και την ανάπτυξη τεχνικών βαθιάς μάθησης με αυτοεκπαίδευση και τη χρήση εικονοσειρών. Η εκπαίδευση θα γίνει σε σύνολα δεδομένων που απεικονίζουν σερβιρισμένα φαγητά. [1] Godard, C., Aodha, O.M., Firman, M., Brostow, G., Digging into self-supervised monocular depth estimation, (2019) Proceedings of the IEEE International Conference on Computer Vision, 2019-October, art. no. 9009796, pp. 3827-3837. [2] Luo, C., Yang, Z., Wang, P., Wang, Y., Xu, W., Nevatia, R., Yuille, A., Every Pixel Counts ++: Joint Learning of Geometry and Motion with 3D Holistic Understanding, (2020) IEEE Transactions on Pattern Analysis and Machine Intelligence, 42 (10), art. no. 8769907, pp. 2624-2641. Aπαιτούμενες γνώσεις: - Πολύ καλή γνώση Python - Πολύ καλή γνώση κάποιου Deep Learning framework (Tensorflow/Keras/PyTorch, etc.) - Πολύ καλή γνώση γενικών αρχών μηχανικής μάθησης. Υπεύθυνος: Α. Ντελόπουλος, (antelopo@ece.auth.gr)