Προπτυχιακές και μεταπτυχιακές εργασίες Σεπτέμβριος 2008



Σχετικά έγγραφα
µεθόδων αυτών, είναι απαραίτητη η δηµιουργία αντιπροσωπευτικού δείγµατος του Ιστού. Στόχος της εργασίας είναι η υλοποίηση και αξιολόγηση µεθόδων δειγµ

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

Ανάκτηση Πληροφορίας

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Ψηφιακά Mέσα Υπολογιστική Νοημοσύνη

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Διπλωματικές των κ. Ι. Βλαχάβα και Ν. Βασιλειάδη

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ»

ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εξόρυξη Γνώσης από εδοµένα (data mining)

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

215 Μηχανικών Η/Υ και Πληροφορικής Πάτρας

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Τεχνικές Εξόρυξης Δεδομένων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Πληροφορική 2. Τεχνητή νοημοσύνη

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Π3.4.1: Κατάλογος Γλωσσικών Τεχνολογιών (ΓΤ) Ε.Κ.Ε.Φ.Ε. «Δημόκριτος»

1. ΓΕΝΙΚΟΙ ΚΑΝΟΝΕΣ ΚΑΙ ΠΡΟΥΠΟΘΕΣΕΙΣ ΛΗΨΗΣ ΠΤΥΧΙΟΥ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΔΙΑΔΙΚΤΥΟ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

ΚΑΙΝΟΤΟΜΕΣ ΛΥΣΕΙΣ ΕΚΠΑΙΔΕΥΣΗΣ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗΣ ΟΔΗΓΟΣ E-LEARNING

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση. Κορφιάτης Γιώργος ιπλωµατική Εργασία

ΠΛΗΡΟΦΟΡΙΚΗ Γ ΤΑΞΗΣ ΓΕΛ ΚΛΕΙΩ ΣΓΟΥΡΟΠΟΥΛΟΥ. ΣΥΓΧΡΟΝΑ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ Αντικειμενοστραφής Προγραμματισμός

Θέματα Ατομικής Διπλωματικής Εργασίας - DRAFT Ακαδημαϊκό Έτος 2015/2016. Γεωργία Καπιτσάκη (Λέκτορας)

ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Στοχεύοντας στην ανάπτυξη της Υπολογιστικής Σκέψης. Α. Γόγουλου Τμήμα Πληροφορικής & Τηλεπικοινωνιών, ΕΚΠΑ

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Η διάρκεια πραγματοποίησης της ανοιχτής εκπαιδευτικής πρακτικής ήταν 2 διδακτικές ώρες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Π ε ρ ι ε χ ό μ ε ν α

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Τεχνητή Νοημοσύνη ( )

Δελτίο Τύπου. Αλληλεπίδραση εργαζόμενων με βιομηχανικά συστήματα εν ώρα εργασίας με χρήση μη παρεμβατικών εργαλείων συλλογής δεδομένων

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΚΑΙ ΕΦΑΡΜΟΣΜΕΝΩΝ ΕΠΙΣΤΗΜΩΝ

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Το Μέλλον για τα Συστήματα Διαχείρισης Ακτινολογικής Εικόνας (PACS)

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

Integrated Project. Ambient Intelligence System of Agents for Knowledgebased and Integrated Services for Mobility Impaired users

ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ

Ραγδαία τεχνολογική εξέλιξη

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Τμήμα Πληροφορικής. Σχολή Τεχνολογικών Εφαρμογών. Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

723 Τεχνολογίας Πληροφορικής και Τηλεπικοινωνιών ΤΕΙ Λάρισας

Συστήματα αναγνώρισης ομιλίας και χρήση τους. Αναστάσιος Φραντζής

Αν σας ενδιαφέρει κάποιο θέμα, δείτε τη σχετική βιβλιογραφία και στείλτε μου για να συναντηθούμε και να το συζητήσουμε.

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ

ΠΡΟΓΡΑΜΜΑ ΓΑΛΛΙΚΩΝ ΣΠΟΥΔΩΝ ΓΑΛ 102 Προφορικός λόγος 6 ΓΑΛ 103 Γραπτός λόγος I 6 ΓΑΛ 170 e-french 6 ΓΑΛ Μάθημα περιορισμένης επιλογής 6

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ

Εννοιολογική Ομοιογένεια

Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΠΜΣ 513 ΤΕΧΝΟΛΟΓΙΑ ΗΛΕΚΤΡΟΝ ΙΚΟΥ ΕΜΠΟΡΙΟΥ ΥΠΟΧΡΕΩΤΙΚΗ ΕΡΓΑΣΙΑ 2015

Τεχνολογία Ηλεκτρονικού Εμπορίου

Αναζητήσεις στο Διαδίκτυο

ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος

Ανάπτυξη & Σχεδίαση Λογισμικού (ΗΥ420)

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

Κεφ. 2 Θέματα Θεωρητικής Επιστήμης Υπολογιστών. Κοντογιάννης Βασίλειος ΠΕ19

Περιεχόμενα ΕΝΟΤΗΤΑ I. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Πρόλογος 15

Σχεδιασµός Ανάπτυξη Οντολογίας

Εκπαίδευση Ενηλίκων: Εμπειρίες και Δράσεις ΑΘΗΝΑ, Δευτέρα 12 Οκτωβρίου 2015

Ανάκτηση πολυμεσικού περιεχομένου

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

Εξ αποστάσεως υποστήριξη του έργου των Εκπαιδευτικών μέσω των δικτύων και εργαλείων της Πληροφορικής

Transcript:

ΕΚΕΦΕ «Δημόκριτος» Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Τεχνολογίας Γνώσεων και Λογισμικού Προπτυχιακές και μεταπτυχιακές εργασίες Σεπτέμβριος 2008 Το Εργαστήριο Τεχνολογίας Γνώσεων και Λογισμικού του ΕΚΕΦΕ «Δημόκριτος» προσφέρει τις παρακάτω εργασίες, οι οποίες είναι χωρισμένες σε θεματικές ενότητες, σύμφωνα με τις Δράσεις του Εργαστηρίου. Οι περιγραφές των εργασιών συμπεριλαμβάνουν τα ονόματα των ερευνητών που είναι υπεύθυνοι για την επίβλεψη και την εσωτερική αξιολόγησή τους. Όλες οι εργασίες θα εκπονηθούν σε συνεργασία με μέλη ΔΕΠ ΑΕΙ και ΤΕΙ. ΔΡΑΣΗ 1. Συστήματα Εξαγωγής Πληροφορίας και Εξόρυξης Γνώσης Στόχος είναι η έρευνα και ανάπτυξη σε θέματα φιλτραρίσματος και εξαγωγής πληροφορίας από βάσεις κειμένων (information filtering and extraction) καθώς και σε θέματα εξόρυξης γνώσης από βάσεις κειμένων ή δεδομένων (text mining or data mining). Για την επίτευξη του στόχου αυτού αξιοποιούνται μέθοδοι, τεχνικές και εργαλεία από τις τεχνολογίες Επεξεργασίας Φυσικής Γλώσσας, Εξόρυξης Γνώσης, και Μηχανικής Μάθησης. 1.1 Μηχανική μάθηση ταξινομητών από ταξινομημένα και μη ταξινομημένα δεδομένα εκπαίδευσης σε περιπτώσεις ανισο-κατανεμημένων κατηγοριών. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης. Περιγραφή: Δύο βασικά προβλήματα στην εκπαίδευση ταξινομητών, ιδιαίτερα σε εφαρμογές ταξινόμησης περιεχομένου, είναι (α) η ακραία ανισοκατανομή των κατηγοριών, συνήθως εις βάρος της ενδιαφέρουσας κατηγορίας, και (β) η ύπαρξη λίγων κατανεμημένων παραδειγμάτων και πολλών μη-κατανεμημένων. Για την αντιμετώπιση αυτού του προβλήματος έχει αναπτυχθεί στο εργαστήριο μέθοδος μηχανικής μάθησης που εστιάζει στην κατηγορία που μας ενδιαφέρει και προσπαθεί να εκτιμήσει την κατηγορία των μηκατανεμημένων παραδειγμάτων. Στα πλαίσια αυτής της εργασίας θα υλοποιηθούν και θα αξιολογηθούν βελτιώσεις της υπάρχουσας μεθόδου, σε δεδομένα ιατρικής διάγνωσης και ταξινόμησης περιεχομένου. Επιβλέπων Ερευνητής: 1.2 Μηχανική μάθηση ακολουθιακών ταξινομητών με βάση απλούς ταξινομητές δεδομένων Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης. Περιγραφή: Η ταξινόμηση ακολουθιακών δεδομένων, όπως κείμενα, ηχητικά σήματα, χρονοσειρές, έχει αντιμετωπιστεί κυρίως με ειδικά παραγωγικά μοντέλα (generative models), όπως τα Μαρκοβιανά, στη βιβλιογραφία. Πρόσφατα έχουν όμως προταθεί και μέθοδοι που μαθαίνουν μοντέλα δεσμευμένων πιθανοτήτων, όπως κάνουν και οι απλοί ταξινομητές, π.χ. Conditional Random Fields (CRFs). Στα πλαίσια της εργασίας θα μελετηθεί η δυνατότητα γενίκευσης αυτών των μοντέλων, ώστε να ενσωματώνουν γνωστές μεθόδους μάθησης ταξινομητών. Στόχος της εργασίας είναι η υλοποίηση μίας πρώτης τέτοιας μεθόδου και η σύγκρισή της με τα CRFs. Επιβλέπων Ερευνητής:

1.3 Σύστημα ενημέρωσης και ανάλυσης δικτύου βιβλιογραφικών αναφορών από τον Ιστό με τεχνικές εξαγωγής πληροφορίας και ταιριάσματος όμοιων εγγραφών. Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού, κατά προτίμηση σε Java και διαχείρισης βάσεων δεδομένων. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας ή/και διαδικτυακού προγραμματισμού. Περιγραφή: Τα κοινωνικά δίκτυα (social networks) είναι μία από τις πιο ενδιαφέρουσες εφαρμογές για την εξαγωγή πληροφορίας και την εξόρυξη γνώσης. Το δίκτυο των βιβλιογραφικών αναφορών είναι ένα τυπικό παράδειγμα κοινωνικού δικτύου με ενδιαφέροντα χαρακτηριστικά. Στο εργαστήριο έχει αναπτυχθεί σύστημα ενημέρωσης ενός τέτοιου δικτύου με εξαγωγή πληροφορίας από το διαδίκτυο. Στόχος της εργασίας είναι η βελτίωση και επέκταση του συστήματος με νέες μεθόδους εξαγωγής πληροφορίας και ανάλυσης του δικτύου που προκύπτει. Η εξαγωγή πληροφορίας εφαρμόζεται στα αποτελέσματα γνωστών βιβλιογραφικών βάσεων, καθώς και μηχανών αναζήτησης. Η ανάλυση του κοινωνικού δικτύου γίνεται με μεθόδους εξόρυξης γνώσης. Σημαντικό ρόλο στη διαδικασία παίζει το ταίριασμα όμοιων εγγραφών (record linkage), που ανακτώνται από διαφορετικές πηγές. Επιβλέπων Ερευνητής: 1.4 Επέκταση πύλης ενημέρωσης με μεθόδους αυτόματης συντήρησης των κανόνων εξαγωγής πληροφορίας από τις ειδησεογραφικές πηγές. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας ή/και διαδικτυακού προγραμματισμού. Περιγραφή: Στο Εργαστήριο έχει αναπτυχθεί μία εξατομικευμένη πύλη ενημέρωσης από τον Παγκόσμιο Ιστό η οποία συλλέγει ειδήσεις από διάφορες πηγές και τις παρέχει εξατομικευμένα στους χρήστες της. Για το σκοπό αυτό, η πύλη χρησιμοποιεί κανόνες εξαγωγής της πληροφορίας από της πηγές. Οι κανόνες αυτοί υλοποιούνται ως κανονικές εκφράσεις, ο οποίες εφαρμόζονται στο κείμενο των ιστοσελίδων και εξάγουν την ενδιαφέρουσα πληροφορία, π.χ. τον τίτλο της είδησης. Ένα από τα βασικά προβλήματα είναι η συντήρηση αυτών των κανόνων για πολλές πηγές οι οποίες μεταβάλουν τον τρόπο παρουσίασης της πληροφορίας στον χρόνο. Στόχος της εργασίας είναι η ανάπτυξη μεθόδων αυτόματου εντοπισμού αυτών των αλλαγών και ενημέρωσης των κανόνων εξαγωγής πληροφορίας με μεθόδους μηχανικής μάθησης. Δημήτριος Βογιατζής, τηλ. 210-6503158, email: dimitrv@iit.demoktritos.gr 1.5 Μέθοδοι μείωσης μεγέθους γράφου ν-γραμμάτων με βάση τη χρησιμότητα Επίπεδο: Μεταπτυχιακό. Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Περιγραφή: Στο Εργαστήριο έχουμε αναπτύξει μία μέθοδο αναπαράστασης κειμένων με γράφους ν- γραμμάτων. Η αναπαράσταση αυτή, αν και πλούσια σε πληροφορία, έχει την αδυναμία του μεγάλου μεγέθους, που αυξάνει την πολυπλοκότητα εφαρμογής αλγορίθμων πάνω της. Σκοπός της εργασίας είναι να μελετηθούν μέθοδοι μείωσης του μεγέθους του γράφου, αντίστοιχες αυτών που χρησιμοποιούνται σε διανυσματικές αναπαραστάσεις κειμένων (π.χ. PageRank, PCA), με παράλληλη διατήρηση της ωφέλιμης πληροφορίας.

1.6 Κατηγοριοποίηση εγγράφων με χρήση γράφου ν-γραμμάτων. Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Γνώσεις αντικειμενοστραφούς προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Περιγραφή: Η κατηγοριοποίηση εγγράφων ως πρόβλημα συναντάται σε πληθώρα εφαρμογών, από μηχανές αναζήτησης μέχρι ηλεκτρονικές βιβλιοθήκες και εφαρμογές ηλεκτρονικού ταχυδρομείου. Στα πλαίσια της εργασίας επιδιώκουμε να μελετήσουμε και αναπτύξουμε τη χρήση της αναπαράστασης γράφου ν-γραμμάτων χαρακτήρων και αντιστοίχων αλγορίθμων, με σκοπό την εφαρμογή τους στην κατηγοριοποίηση εγγράφων σε πολλαπλές κατηγορίες πιθανώς και με λίγα ή άνισα δείγματα ανά κατηγορία. Οι μέθοδοι που θα αναπτυχθούν θα συγκριθούν πειραματικά με υπάρχουσες μεθόδους που στηρίζονται στη διανυσματική αναπαράσταση των εγγράφων. 1.7 Μάθηση κανόνων ταύτισης όμοιων εγγραφών. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Στο εργαστήριο έχει υλοποιηθεί πειραματική πλατφόρμα σύγκρισης όμοιων εγγραφών σε βάσεις. Η πλατφόρμα περιλαμβάνει ποικιλία μετρικών απόστασης μεταξύ λέξεων (π.χ. απόσταση Levenshtein), κάποιες από τις οποίες βασίζονται σε μορφολογικά και άλλες σε σημασιολογικά χαρακτηριστικά. Στόχος της εργασίας είναι η ανάπτυξη μεθόδων μάθησης για τον συνδυασμό των αποτελεσμάτων σύγκρισης των διαφόρων πεδίων μίας εγγραφής με στόχο την λήψη της τελικής απόφασης σχετικά με το αν δύο εγγραφές είναι όμοιες ή όχι. Συνήθεις τομείς εφαρμογής αυτών των μεθόδων είναι η αποσαφήνιση νοήματος λέξεων (word sense disambiguation), η ταυτοποίηση υπηρεσιών νοημόνων πρακτόρων και η ταύτισης όμοιων εγγραφών σε συστήματα ολοκλήρωσης πληροφορίας (information integration) στον Ιστό. Επίσης, θα δοκιμαστεί μία νέα οικογένεια μεθόδων ασαφούς ταύτισης συμβολοσειρών (fuzzy string matching) βασισμένη σε γράφους ν-γραμμάτων. 1.8 Αυτόματη δημιουργία επερωτήσεων για την ανάκτηση παραδειγμάτων από τον Ιστό, με στόχο την εκπαίδευση ταξινομητών ιστοσελίδων ακολουθώντας διαδικασία ενεργής μάθησης. Απαιτούμενα προσόντα: Πολύ καλές γνώσεις προγραμματισμού, κατά προτίμηση σε Java. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Η δημιουργία αποδοτικών ταξινομητών κειμένου με χρήση μηχανικής μάθησης, στηρίζεται στη σωστή επιλογή δεδομένων εκπαίδευσης, δηλαδή κειμένων. Στο Εργαστήριο έχει αναπτυχθεί μέθοδος δημιουργίας και εμπλουτισμού των δεδομένων εκπαίδευσης για ταξινομητές εγγράφων, ανακτώντας κατάλληλα παραδείγματα από τον Ιστό. Η μέθοδος αυτή ακολουθεί τη διαδικασία ενεργής μάθησης (active learning) σε συνδυασμό με τον σχηματισμό επερωτήσεων για μηχανές αναζήτησης. Στόχος της εργασίας

είναι η αυτοματοποίηση της δημιουργίας των επερωτήσεων προς τις μηχανές αναζήτησης και η αξιολόγηση διάφορων προσεγγίσεων σε αυτό το πρόβλημα. Κώστας Χανδρινός, email: chandrinos@gmail.com 1.9 Μέθοδοι εκτίμησης της άποψης που εκφράζει ένα κείμενο για συγκεκριμένες οντότητες. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Στο Εργαστήριο έχει αναπτυχθεί μία μέθοδος εκτίμησης της άποψης που εκφράζεται για συγκεκριμένες οντότητες σε ένα κείμενο, π.χ. η άποψη που εκφράζεται για τους συντελεστές μίας ταινίας σε μία κριτική. Η μέθοδος αυτή στηρίζεται σε γλωσσικά χαρακτηριστικά του κειμένου και μηχανική μάθηση. Στόχος της εργασίας είναι η επέκταση αυτής της μεθόδου με νέες μεθόδους εξαγωγής πληροφορίας που επίσης αναπτύσσονται στο εργαστήριο. Η νέα βελτιωμένη μέθοδος θα αξιολογηθεί σε δεδομένα που έχουν συλλεχθεί για κριτικές ταινιών. Κώστας Χανδρινός, email: chandrinos@gmail.com 1.10 Μάθηση μοντέλου πρόβλεψης της δημοτικότητας μίας κριτικής Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Όλο και πιο συχνά στο διαδίκτυο οι χρήστες αξιολογούν προϊόντα και δημοσιεύουν την άποψή τους. Επιπλέον, η άποψή τους αξιολογείται από άλλους χρήστες. Αντικείμενο αυτής της εργασίας είναι η μάθηση των χαρακτηριστικών και κανόνων που προκαλούν τη δημοτικότητα μία δημόσιας κριτικής και ενός κριτή αντίστοιχα. Για το σκοπό αυτό, θα χρησιμοποιηθούν χαρακτηριστικά που σχετίζονται τόσο με το περιεχόμενο της κριτικής (εξαγωγή πληροφορίας από κείμενο) όσο και με τις συνθήκες στις οποίες δημοσιεύθηκε. Ως περίπτωση μελέτης θα εξετασθούν οι κριτικές ταινιών που υπάρχουν σε μεγάλους σχετικούς ιστοτόπους. Κώστας Χανδρινός, email: chandrinos@gmail.com 1.11 Σύστημα φιλτραρίσματος ανεπιθύμητων ηλεκτρονικών μηνυμάτων για ομάδες χρηστών με χρήση μηχανικής μάθησης. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης. Περιγραφή: Η ανεπιθύμητη ηλεκτρονική αλληλογραφία (spam filtering) έχει γίνει ένα από τα σημαντικότερα προβλήματα που σχετίζονται με τη χρήση του Διαδικτύου. Η εκπαίδευση ταξινομητών των μηνυμάτων (φίλτρων) με χρήση μηχανικής μάθησης έχει οδηγήσει πρόσφατα σε μερική αντιμετώπιση του προβλήματος. Στο Εργαστήριο έχει αναπτυχθεί σύστημα εκπαίδευσης φίλτρων για ανεπιθύμητη αλληλογραφία, το οποίο χρησιμοποιεί για την εκπαίδευση ένα σώμα ανεπιθύμητων μηνυμάτων και τα κανονικά μηνύματα που λαμβάνει ένας χρήστης ή μία ομάδα χρηστών. Στόχος της εργασίας είναι η βελτίωση της μεθόδου κατασκευής φίλτρων για ομάδες χρηστών, π.χ. τα μέλη του Εργαστηρίου. Η νέα

μέθοδος θα εφαρμόζει μία νέα προσέγγιση στον τρόπου που λαμβάνονται υπόψη τα φίλτρα «συναδέλφων» από το ατομικό φίλτρο του κάθε χρήστη. Άρης Κοσμόπουλος, τηλ. 21-06503216, email: akosmo@iit.demokritos.gr 1.12 Μέθοδος επαυξητικής και ενεργής μάθησης για φίλτρα ανεπιθύμητων ηλεκτρονικών μηνυμάτων. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης. Περιγραφή: Τα εκπαιδευόμενα φίλτρα ανεπιθύμητης ηλεκτρονικής αλληλογραφίας (spam filtering) χρειάζεται να βελτιώνονται συνεχώς κατά τη χρήση τους, προσαρμοζόμενα στις ιδιαιτερότητες του χρήστη αλλά και στη συνεχώς μεταβαλλόμενη φύση των ανεπιθύμητων μηνυμάτων. Γι αυτό το λόγο απαιτείται η ανάπτυξη μεθόδων επαυξητικής μάθησης (incremental learning), οι οποίες ταυτόχρονα δεν θα απαιτούν σημαντική επίβλεψη από τον χρήστη, ώστε να μην τον/την επιβαρύνουν. Γι αυτό το σκοπό μελετούνται στη βιβλιογραφία μέθοδοι ενεργής μάθησης (active learning). Το Σύστημα φιλτραρίσματος ανεπιθύμητης αλληλογραφίας που έχει αναπτυχθεί στο Εργαστήριο επεκτάθηκε πρόσφατα με μία μέθοδο ενεργής μάθησης. Στα πλαίσια της εργασίας, η μέθοδος αυτή θα βελτιωθεί και θα συνδυαστεί με δυνατότητες επαυξητικής μάθησης. Η βελτιωμένη έκδοση του συστήματος θα ελεγχθεί σε δεδομένα αξιολόγησης που έχουν συλλεχθεί στο Εργαστήριο, αλλά και αυτά που έχουν χρησιμοποιηθεί για διαγωνισμούς σε διεθνή συνέδρια. Άρης Κοσμόπουλος, τηλ. 21-06503216, email: akosmo@iit.demokritos.gr 1.13 Εντοπισμός και παρακολούθηση θεμάτων συζήτησης σε blogs, με βάση εξελισσόμενες οντολογίες Απαιτούμενα προσόντα: Καλές γνώσεις προγραμματισμού και διαχείρισης βάσεων δεδομένων. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο αναπτύσσει μεθόδους και εργαλεία για τον εμπλουτισμό οντολογιών με νέα αντικείμενα (στιγμιότυπα υπαρχόντων κατηγοριών/εννοιών της οντολογίας). Επιπλέον υπάρχει σημαντική ερευνητική δραστηριότητα διεθνώς για τον εντοπισμό νέων θεμάτων συζήτησης και την παρακολούθηση υπαρχόντων σε ροές κειμένων, όπως τα ειδησεογραφικά άρθρα και τα μηνύματα σε blogs. Στόχος της παρούσας εργασίας είναι η ανάπτυξη μεθόδων που θα εντοπίζουν και θα παρακολουθούν θέματα συζήτησης σε blogs, με βάση τα αντικείμενα και τις έννοιες μιας οντολογίας, καθώς και ο εμπλουτισμός της οντολογίας με νέα αντικείμενα που εμφανίζονται είτε στα ίδια τα κείμενα είτε σε ημιδομημένες πηγές στον Ιστό, δηλαδή σε σχετικά Web sites. Κώστας Χανδρινός, email: chandrinos@gmail.com 1.14 Εξαγωγή πληροφορίας από έγγραφα μέσω επαγωγικής εξαγωγής γραμματικών ανεξάρτητων από συμφραζόμενα (context-free grammars) Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού, κατά προτίμηση σε C/C++, Tcl. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας.

Περιγραφή: Το Εργαστήριο έχει αναπτύξει έναν αλγόριθμο επαγωγικής εξαγωγής γραμματικών ανεξάρτητων από συμφραζόμενα. Σκοπός της εργασίας αυτής είναι η αξιολόγηση του αλγορίθμου αυτού στην εργασία της εξαγωγής πληροφορίας από κείμενα της Ελληνικής και της Αγγλικής γλώσσας καθώς και η σύγκριτική αξιολόγηση του αλγορίθμου με έτοιμα συστήματα που βασίζονται σε άλλες τεχνικές μηχανικής μάθησης. Γεώργιος Πετάσης, email: petasis@iit.demokritos.gr 1.15 Ανάπτυξη συντακτικού αναλυτή γραμματικών ανεξάρτητων από συμφραζόμενα (context-free grammars), σε συνδυασμό με μεθόδους μάθησης τέτοιων γραμματικών Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού, κατά προτίμηση σε C/C++, Tcl. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο έχει αναπτύξει έναν αλγόριθμο επαγωγικής εξαγωγής γραμματικών ανεξάρτητων από συμφραζόμενα. Κατά την εφαρμογή του αλγορίθμου αυτού σε διάφορα προβλήματα, προκύπτουν σημαντικές δυσκολίες εξαιτίας της ακαταλληλότητας των υπαρχόντων συντακτικών αναλυτών ή/και της υπολογιστικής τους πολυπλοκότητας. Σκοπός της εργασίας αυτής είναι η ανάπτυξη ενός συντακτικού αναλυτή προσαρμοσμένου στις ανάγκες των μεθόδων μάθησης γραμματικών και ο συνδυασμός των δύο μεθόδων σε ένα κοινό σύστημα. Το σύστημα αυτό θα αξιολογηθεί σε εφαρμογές επεξεργασίας φυσικής γλώσσας που μελετώνται στο εργαστήριο. Γεώργιος Πετάσης, email: petasis@iit.demokritos.gr 1.16 Ταίριασμα ονομάτων οντοτήτων μεταξύ τους και με αναφορικές εκφράσεις σε έγγραφα Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού, κατά προτίμηση σε C/C++, Tcl. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο αναπτύσσει εργαλεία για την αναγνώριση και ταξινόμηση ονομάτων οντοτήτων (πρόσωπα, τοποθεσίες, χρονικές και αριθμητικές εκφράσεις) σε κείμενα. Πολύ συχνά όμως στο ίδιο κείμενο διαφορετικά ονόματα μπορεί να αντιστοιχούν στην ίδια οντότητα (π.χ. Γιάννης Παπαδόπουλος, Γ. Παπαδόπουλος, Ιωάννης Παπαδόπουλος), καθιστώντας απαραίτητο το ταίριασμα των ονομάτων αυτών σε εφαρμογές εξαγωγής πληροφορίας όπου απαιτείται ο εντοπισμός όλων των πληροφοριών που αφορούν μια συγκεκριμένη οντότητα. Πολύ συχνά επίσης μία οντότητα αναφέρεται στο κείμενο χρησιμοποιώντας αναφορικές εκφράσεις (π.χ. ο αθλητής αυτός, αυτός) απαιτώντας την επίλυση των αναφορών αυτών ταιριάζοντας τις με το όνομα της οντότητας το οποίο είχε εισαχθεί νωρίτερα στο έγγραφο. Σκοπός της εργασίας αυτής είναι η χρήση και επέκταση υπαρχόντων αλγορίθμων ταιριάσματος ονομάτων και επίλυσης αναφορών αξιοποιώντας λεξική, συντακτική και σημασιολογική πληροφορία. Οι αλγόριθμοι θα εφαρμοστούν και αξιολογηθούν σε σώματα κειμένων που διαθέτει το Εργαστήριο. Παυλίνα Φράγκου, email: fragou@iit.demokritos.gr Βαγγέλης Καρκαλέτσης, τηλ. 210-6503197, e-mail: vangelis@iit.demokritos.gr 1.17 Εφαρμογή τεχνικών αλλαγής θέματος σε έγγραφα (κείμενα, ιστοσελίδες) Απαιτούμενα προσόντα: Πολύ καλές γνώσεις προγραμματισμού, κατά προτίμηση σε C/C++, Tcl. Επιθυμητά προσόντα: Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας, οικειότητα με τεχνικές Τεχνητής Νοημοσύνης.

Περιγραφή: Οι τεχνικές αλλαγής θέματος (topic change identification) βοηθούν στην εύρεση των διαφορετικών θεμάτων τα οποία εμφανίζονται μέσα σε ένα κείμενο. Η εν λόγω εύρεση είναι δυνατό να βασίζεται τόσο στην οπτική αναπαράσταση της εκάστοτε ιστοσελίδας όσο και σε επιπλέον πληροφορία που σχετίζεται με το περιεχόμενο αυτής. Τμήματα κειμένου τα οποία αναφέρονται στο ίδιο θέμα είναι πιθανό να αναφέρονται στις ίδιες οντότητες (named entities) ή/και έννοιες (concepts). Μια τέτοια πληροφορία μπορεί να αξιοποιηθεί κατά τη διαδικασία της εξαγωγής πληροφορίας (information extraction), όπου μας ενδιαφέρει η εύρεση και εξαγωγή των σχέσεων μεταξύ οντοτήτων οι οποίες εμφανίζονται στα κείμενα. Στόχος της εργασίας είναι η εξέταση και συνδυασμός τμηματοποίησης κειμένων βάση της οπτικής τους αναπαράστασης σε συνδυασμό με τεχνικές εξαγωγής σχέσεων από κείμενα και ιστοσελίδες βάσει του περιεχόμενού τους με όσο το δυνατό αυτόματο τρόπο. Παυλίνα Φράγκου, email: fragou@iit.demokritos.gr Βαγγέλης Καρκαλέτσης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr 1.18 Συνδυασμός μετα-δεδομένων που περιγράφουν το περιεχόμενο ιστο-σελίδων Απαιτούμενα προσόντα: Πολύ καλές γνώσεις προγραμματισμού, κατά προτίμηση σε Java. Επιθυμητά προσόντα: Γνώσεις τεχνολογιών διαδικτύου, γλωσσικής τεχνολογίας. Περιγραφή: Με την εκρηκτική ανάπτυξη του Παγκόσμιου ιστού πρακτικά ο κάθε χρήστης έχει τη δυνατότητα να αναρτήσει εκεί περιεχόμενο με βάση τις γνώσεις και τα ενδιαφέροντά του. Η επισημείωση (annotation) αυτού του περιεχομένου με επιπλέον δεδομένα (μετα-δεδομένα), όπως για παράδειγμα, για τον συγγραφέα του περιεχομένου, τη θεματική κατηγορία του περιεχομένου, τις κατηγορίες χρηστών στις οποίες απευθύνεται, κ.ά, μπορεί να διευκολύνει σημαντικά την αναζήτηση πληροφορίας, και αποτέλεσε το κίνητρο για την προώθηση της τεχνολογίας του σημασιολογικού Ιστού (semantic web). Τα μετα-δεδομένα αυτά όμως μπορούν να αξιοποιηθούν μόνο αν έχουν δημιουργηθεί σύμφωνα με ένα συγκεκριμένο φορμαλισμό αναγνωρίσιμο από μηχανές αναζήτησης. Για το σκοπό αυτό το World Wide Web Consortium (W3C) δημιούργησε πρόσφατα την ομάδα εργασίας POWDER με σκοπό τον ορισμό ενός κοινού πρωτοκόλλου για την περιγραφή των πόρων του Ιστού (web resources). Σε αυτή την ομάδα εργασίας συμμετέχει ενεργά και το Εργαστήριο. Μέσω του κοινού αυτού φορμαλισμού διαφορετικοί χρήστες θα είναι σε θέση να περιγράφουν με μετα-δεδομένα το περιεχόμενο της ίδιας ιστο-σελίδας (π.χ. εκφράζοντας απόψεις για το περιεχόμενο μιας ιστο-σελίδας με θέματα υγείας). Στόχος αυτής της εργασίας είναι η δημιουργία μιας εφαρμογής που θα συνδυάζει μετα-δεδομένα από διαφορετικούς χρήστες έτσι ώστε να παρουσιάζει μια ολοκληρωμένη εικόνα στον χρήστη που ενδιαφέρεται να μάθει τις απόψεις των άλλων χρηστών για το ίδιο περιεχόμενο. Βαγγέλης Καρκαλέτσης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr Κώστας Σταματάκης, email: kstam@iit.demokritos.gr 1.19 Αναγνώριση γραμματικών φαινομένων από κείμενα με χρήση γράφων Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Περιγραφή: Επειδή η γλώσσα προϋπήρξε της γραμματικής και του συντακτικού, μέχρι σήμερα οι περισσότερες αναπαραστάσεις γραμματικής είναι προσεγγίσεις της πραγματικότητας. Στα πλαίσια της εργασίας αυτής μελετάμε το πώς γραμματικά φαινόμενα αναπαρίστανται σε γράφους ν-γραμμάτων διαφορετικών μηκών. Επίσης, ελέγχουμε την εντοπισιμότητα γραμματικών φαινομένων με μελέτη του αντιστοίχου γράφου.

Βαγγέλης Καρκαλέτσης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr 1.20 Αναπαράσταση και αναγνώριση θέματος με χρήση γράφου ν-γραμμάτων Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Περιγραφή: Στην αναπαράσταση και ανάλυση κειμένου είναι ενδιαφέρον να εντοπίσει κανείς τα θέματα του κειμένου (topics), πού αυτά εντοπίζονται στο κείμενο (topic detection) και ποια η αναπαράστασή τους. Επίσης, είναι χρήσιμο να εντοπίζονται τα σημεία αλλαγής θέματος (topic shift). Όλα αυτά βοηθούν στην ταξινόμηση κειμένων βάσει θέματος. Στόχος της εργασίας είναι να μελετηθεί πώς μπορούν να αναπαρασταθούν θέματα με χρήση γράφου ν-γραμμάτων και πώς εντοπίζονται οι αλλαγές θέματος σε ένα κείμενο με βάση την ίδια αναπαράσταση. Βαγγέλης Καρκαλέτσης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr 1.21 Μη-εποπτευόμενη εξόρυξη πληροφορίας από κείμενα σε διαφορετικά επίπεδα ανάλυσης, με χρήση γράφων. Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Γνώσεις αντικειμενοστραφούς προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Γνώσεις νευρωνικών δικτύων. Περιγραφή: Ο τομέας της μη-εποπτευόμενης εξόρυξης γνώσης εδώ και χρόνια στοχεύει στην εξαγωγή προφανών και μη-προφανών κομματιών πληροφορίας (όρων, οντοτήτων, σχέσεων και συσχετίσεων), με σκοπό την αποτελεσματικότερη ανάλυση του πολύ μεγάλου όγκου πληροφορίας που υπάρχει διαθέσιμος στις σύγχρονες πηγές. Στα πλαίσια αυτής της εργασίας, στόχος είναι να χρησιμοποιηθεί αναπαράσταση γράφου για να μοντελοποιήσει δεδομένα κειμένων που παραδοσιακά αναπαρίστανται ως διανύσματα και να μελετηθούν αλγόριθμοι που θα μπορέσουν να χρησιμοποιήσουν την αναπαράσταση αυτή για αποτελεσματική μη-εποπτευόμενη εξαγωγή γνώσης. 1.22 Αναγνώριση σύνθετων γλωσσικών φαινομένων ως ιεραρχικές δομές στοιχειωδών γράφων. Επίπεδο: Μεταπτυχιακό. Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Γνώσεις αντικειμενοστραφούς προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Εξοικείωση με νευρωνικά δίκτυα. Περιγραφή: Η αναγνώριση του γραπτού λόγου σύμφωνα με τις νευρεπιστήμες στηρίζεται σε ασαφή (fuzzy) αναγνώριση σε διαφορετικά επίπεδα (γράμμα, λέξη, πρόταση, κτλ.). Σκοπός της εργασίας είναι να διατυπωθεί και μελετηθεί μία διαδικασία ανάλυσης κειμένων, που να μοντελοποιεί το κείμενο ως ιεραρχία γράφων από το γράμμα εώς το κείμενο, με σκοπό την ανάθεση εννοιών σε διαφορετικά επίπεδα ανάλυσης. Θα ελεγχθούν ως μέθοδοι αναπαράστασης γράφοι, ομαδοποιημένοι με αυτο-οργανονώμενα νευρωνικά δίκτυα.

1.23 Επέκταση επερωτήσεων με χρήση εξελιγμένων τεχνικών σημασιολογικής ανάλυσης ερωτημάτων Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης, εξοικείωση με γράφους και αλγορίθμους σε γράφους. Περιγραφή: Στα πλαίσια σύγχρονων εργαλείων ανάκτησης πληροφορίας, όπως οι μηχανές αναζήτησης, είναι συχνό ο χρήστης να υποβοηθείται στις αναζητήσεις του με χρήση συνωνύμων λέξεων με αυτές που βάζει στο ερώτημα. Συχνά όμως η χρήση λέξεων σε αλλαγμένη μορφή ή η έλλειψη γλωσσολογικών εργαλείων δυσκολεύει τον εντοπισμό συνωνύμων. Στα πλαίσια της εργασίας, προσπαθούμε να δούμε πώς μπορούμε να χρησιμοποιήσουμε μία δομή που έχει αναπτυχθεί στα πλαίσια του εργαστηρίου που ονομάζεται «εννοιολογικό ευρετήριο», ώστε να αποφευχθούν τα παραπάνω προβλήματα. Το εννοιολογικό ευρετήριο μπορεί να συνδυάσει πληροφορίες τμήματος λέξεων για να αποδώσει έννοιες σε φράσεις ή και προτάσεις. Βαγγέλης Καρκαλέτσης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr 1.24 Μηχανική μάθηση μοντέλων κατηγοριοποίησης κυρίων ονομάτων Επίπεδο: Προπτυχιακό ή Μεταπτυχιακό. Απαιτούμενα προσόντα: Γνώσεις Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης και Γλωσσικής Τεχνολογίας Περιγραφή: Εφαρμογή μεθόδου μηχανικής μάθησης στο πρόβλημα της αναγνώρισης της γλώσσας ενός κυρίου ονόματος (όνομα προσώπου ή τοπωνύμιο) με βάση φωνολογικά και μορφολογικά χαρακτηριστικά του ίδιου του ονόματος, χωρίς αναφορά στα συμφραζόμενα. Η εργασία περιλαμβάνει την σύγκριση διαφόρων μεθοδολογιών για την επιλογή της καταλληλότερης, την εκτέλεση πειραμάτων, και την εξαγωγή συμπερασμάτων. Στασινός Κωνσταντόπουλος, τηλ. 210-6503162, e-mail: konstant@iit.demokritos.gr Βαγγέλης Καρκαλέτσης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr

ΔΡΑΣΗ 2. Φιλικά Συστήματα Πληροφορικής Στόχος είναι η έρευνα και ανάπτυξη στις παρακάτω περιοχές: ανάλυση της χρήσης υπηρεσιών παροχής πληροφορίας (π.χ. Web-sites, news-filtering services, digital libraries), με στόχο τη διάθεση πληροφορίας στο χρήστη σύμφωνα με τις ανάγκες και τα ενδιαφέροντά του. διαλογικά συστήματα (dialogue systems), δηλαδή συστήματα που επιτρέπουν την επικοινωνία του χρήστη με Η/Υ ή άλλες συσκευές, με χρήση φυσικής γλώσσας (προφορικοί ή γραπτοί διάλογοι). Για την επίτευξη του στόχου αυτού αξιοποιούνται μέθοδοι, τεχνικές και εργαλεία από τις τεχνολογίες Επεξεργασίας Φυσικής Γλώσσας, Μοντελοποίησης Χρηστών, Λογισμικού και Μηχανικής Μάθησης. 2.1 Τεχνικές εξόρυξης γνώσης για την μοντελοποίηση χρηστών Απαιτούμενα προσόντα: Πολύ καλές γνώσεις προγραμματισμού, κατά προτίμηση σε Java. Επιθυμητά προσόντα: Γνώσεις εξόρυξης γνώσης ή/και αλληλεπίδρασης ανθρώπου-μηχανής. Περιγραφή: Οι τεχνικές εξόρυξης γνώσης δίνουν τη δυνατότητα αυτόματης κατασκευής και δυναμικής ενημέρωσης μοντέλων χρηστών, τα οποία αποτελούν την βάση για την εξατομίκευση των Διαδυκτυακών υπηρεσιών. Στο Εργαστήριο έχει αναπτυχθεί ένας εξυπηρετητής εξατομίκευσης (personalization server) γενικής χρήσης. Σκοπός της εργασίας είναι η επέκταση των δυνατοτήτων του εξυπηρετητή εξατομίκευσης με νέες μεθόδους εξόρυξης γνώσης από δεδομένα χρήσης του Παγκόσμιου Ιστού. Δημήτριος Βογιατζής, τηλ. 210-6503158, email: dimitrv@iit.demoktritos.gr 2.2 Σύστημα εξατομικευμένης πλοήγησης στον Ιστό με την βοήθεια καταλόγων του Ιστού. Επιθυμητά προσόντα: Γνώσεις εξόρυξης γνώσης ή/και αλληλεπίδρασης ανθρώπου-μηχανής. Περιγραφή: Η πλοήγηση ενός χρήστη σε έναν ιστιακό τόπο ή γενικότερα στον Ιστό καταγράφεται ως ακολουθία επερωτήσεων από τους εξυπηρετητές που παρέχουν το περιεχόμενο. Αυτή η ακολουθία είναι ιδιαίτερα χρήσιμη για τη μοντελοποίηση της συμπεριφοράς των χρηστών στον Ιστό. Στο Εργαστήριο έχουν αναπτυχθεί μέθοδοι μοντελοποίησης της συμπεριφορά των χρηστών και δημιουργίας εξατομικευμένων καταλόγων Ιστών (Web directories), που κατηγοριοποιούν το περιεχόμενο που υπάρχει στον Ιστό και το οποίο ανακτούν οι χρήστες. Στα πλαίσια της εργασίας θα υλοποιηθεί σύστημα εξατομίκευσης της πλοήγησης των χρηστών, με βάση τα αποτελέσματα της μοντελοποίησης και θα ελεγχθεί από ένα σύνολο πραγματικών χρηστών, με στόχο την αξιολόγηση των μεθόδων μοντελοποίησης. Δημήτρης Πιερράκος, email: dpie@iit.demokritos.gr 2.3 Εκμάθηση γραμματικών από δεδομένα χρήσης του Παγκόσμιου Ιστού, με τη βοήθεια καταλόγων του Ιστού. Επιθυμητά προσόντα: Γνώσεις εξόρυξης γνώσης ή/και αλληλεπίδρασης ανθρώπου-μηχανής. Περιγραφή: Η πλοήγηση ενός χρήστη σε έναν ιστιακό τόπο ή γενικότερα στον Ιστό καταγράφεται ως ακολουθία επερωτήσεων από τους εξυπηρετητές που παρέχουν το περιεχόμενο. Αυτή η ακολουθία είναι ιδιαίτερα χρήσιμη για τη μοντελοποίηση της συμπεριφοράς των χρηστών στον Ιστό. Στο Εργαστήριο έχει αναπτυχθεί μία μέθοδος που μοντελοποιεί τη συμπεριφορά των χρηστών με γραμματικές, τις οποίες μαθαίνει από τα δεδομένα που συλλέγουν οι εξυπηρετητές. Στα πλαίσια της εργασίας θα βελτιωθεί αυτή η μέθοδος χρησιμοποιώντας καταλόγους του Ιστού (Web directories) ως κατηγοριοποίηση του περιεχομένου

που υπάρχει στον Ιστό και το οποίο ανακτούν οι χρήστες. Δημήτρης Πιερράκος, email: dpie@iit.demokritos.gr 2.4. Βελτίωση συστημάτων συστάσεων (recommender systems) με ανακάλυψη κοινοτήτων εμπίστων χρηστών Επιθυμητά προσόντα: Γνώσεις εξόρυξης γνώσης ή/και αλληλεπίδρασης ανθρώπου-μηχανής Περιγραφή: Τα συστήματα συστάσεων (ΣΣ) χρησιμοποιούνται ευρέως (δες το Amazon) προκειμένου να βοηθήσουν τους χρήστες να βρουν χρήσιμες πληροφορίες μέσα από ένα κυκεώνα δεδομένων. Ένα τέτοιο σύστημα συνήθως προτείνει στο χρήστη κάποιες πληροφορίες που πιθανότατα τον ενδιαφέρουν. Η λειτουργία τους βασίζεται στην ιστορία αλληλεπίδρασης του χρήστη αλλά και στην ομοιότητα του χρήστη με άλλους χρήστες. Ανακύπτει όμως ένα προβλήματα που αφορά σε καινούργιους χρήστες, για τους οποίους δεν υπάρχουν επαρκείς πληροφορίες προκειμένου να γίνουν συστάσεις. Ένα άλλο πρόβλημα αφορά στην επεξήγηση του τρόπου δημιουργίας της σύστασης, ώστε οι χρήστες να αποκτήσουν εμπιστοσύνη στο σύστημα. Τα δύο παραπάνω θέματα, τα οποία αποτελούν και το κεντρικό θέμα της προτεινόμενης εργασίας, αναμένεται να αντιμετωπιστούν μέσω της δημιουργίας κοινότητας εμπίστων χρηστών. H πειραματική ανάπτυξη του συστήματος θα γίνει στον Personalisation Server, που έχει αναπτύξει το εργαστήριο και διευκολύνει στην αποθήκευση προφίλ των χρηστών. Μία πιθανή επέκταση της εργασίας αφορά στην υποστήριξη χρηστών με κινητές συσκευές τύπου PDA/smart phone. Δημήτριος Βογιατζής, email: dimitrv@iit.demokritos.gr Γεώργιος Παλιούρας, τηλ. 21-06503158, email: paliourg@iit.demokritos.gr 2.5 Διαχείριση διαλόγου σε ένα διαλογικό σύστημα με τρόπο που διευκολύνει την προσαρμογή σε νέες θεματικές περιοχές Επιθυμητά προσόντα: Γνώσεις γλωσσικής τεχνολογίας ή/και διαλογικών συστημάτων. Περιγραφή: Τα τελευταία χρόνια έχει σημειωθεί σημαντική πρόοδος στον τομέα των διαλογικών συστημάτων (ΔΣ - dialogue systems) με γραπτούς και προφορικούς διαλόγους. Ένα σύνηθες διαλογικό σύστημα περιλαμβάνει γλωσσικά εργαλεία για κατανόηση της απαίτησης του χρήστη (από πιο απλά που αφορούν τον εντοπισμό λέξεων-κλειδιών έως πιο σύνθετα που αναλύουν συντακτικά, σημασιολογικά και πραγματολογικά τις ερωτήσεις/διευκρινίσεις του χρήστη), εργαλεία για τη διαχείριση του διαλόγου που αξιοποιούν ένα διαλογικό μοντέλο για την αναπαράσταση και αποθήκευση των σταδίων του διαλόγου, και εργαλεία για την παραγωγή των αποκρίσεων του συστήματος. Στο Εργαστήριο αναπτύχθηκε πρόσφατα η πρώτη έκδοση ενός διαλογικού συστήματος όπου το διαλογικό μοντέλο αναπαριστάνεται από ένα γράφο καταστάσεων. Στόχος της εργασίας είναι η επέκταση του εργαλείου διαχείρισης του διαλόγου έτσι ώστε να διευκολύνεται η προσαρμογή του διαλογικού συστήματος σε μια νέα θεματική περιοχή. Επιβλέπων Ερευνητής: Βαγγέλης Καρκαλέτσης, τηλ. 210-6503197, e-mail: vangelis@iit.demokritos.gr 2.6 Βελτίωση αναγνώρισης συναισθημάτων μέσω συνέργειας ομιλίας και κειμένου Απαιτούμενα προσόντα: Kαλές γνώσεις προγραμματισμού, κατά προτίμηση σε Matlab ή Java. Επιθυμητά προσόντα: Γνώσεις Επεξεργασίας φυσικής γλώσσας, Μηχανικής μάθησης. Περιγραφή: Η επικοινωνία των ανθρώπων με τους υπολογιστές θα καθίσταται περισσότερη φυσική και ευφυής, όσο οι υπολογιστές θα μπορούν να αναγνωρίζουν κάποια ανθρώπινα συναισθήματα. Υπάρχει πάντα ένα μεγάλο

ποσό πληροφορίας το οποίο οι άνθρωποι μεταδίδουν με το χρωματισμό της φωνής αλλά και άλλους τρόπους. Τα πεδίο της αναγνώρισης συναισθημάτων, με βάση το ακουστικό σήμα, έχει εξερευνηθεί σε ένα βαθμό. Στόχος της παρούσας εργασίας είναι να συνδυαστεί η επεξεργασία του σήματος με την επεξεργασία κειμένου (που αφορά στα λεχθέντα του χρήστη), ώστε να βελτιωθεί η ποιότητα αναγνώρισης συναισθημάτων. Τα πειράματα μπορούν να γίνουν με δεδομένα που έχει συλλέξει το εργαστήριο αλλά και με άλλα των οποίων επιτρέπεται η δημόσια χρήση. Δημήτριος Βογιατζής, τηλ. 210-6503158, email: dimitrv@iit.demoktritos.gr Βαγγέλης Καρκαλέτσης, τηλ. 210-6503197, email: vangelis@iit.demokritos.gr

ΔΡΑΣΗ 3. Τεχνολογία Γνώσεων Στόχος της δράσης είναι η έρευνα και ανάπτυξη σε θέματα αναπαράστασης και διαχείρισης γνώσεων. 3.1 Ανάπτυξη συστήματος αναγνώρισης γεγονότων από δεδομένα. Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις αναπαράστασης γνώσης και συμπερασμού. Περιγραφή: Τα συστήματα αναγνώρισης συμβολικών γεγονότων/συμπεριφορών από δεδομένα έχουν μελετηθεί και αναπτυχθεί σε διάφορα ερευνητικά πεδία, όπως αυτά της Τεχνητής Νοημοσύνης, των Κατανεμημένων Συστημάτων και της Τεχνολογίας Λογισμικού. Για παράδειγμα, έχουν αναπτυχθεί συστήματα που επιβλέπουν την λειτουργία κατανεμημένων συστημάτων και αναγνωρίζουν ενδιαφέρουσες συμπεριφορές που λαμβάνουν χώρα, όπως επιθέσεις που αποσκοπούν στην άρνηση παροχής υπηρεσιών (denial of service attacks). Στο πλαίσιο της εργασίας θα αναπτυχθεί βάση γνώσης με ορισμούς ενδιαφερουσών συμπεριφορών οι οποίοι θα εκφράζονται με τη χρήση ενός φορμαλισμού Τεχνητής Νοημοσύνης. Επιπλέον, θα αναπτυχθεί αλγόριθμος αναγνώρισης ενδιαφερουσών συμπεριφορών. Το τελικό σύστημα θα χρησιμοποιηθεί σε δεδομένα παρακολούθησης δημοσίων χώρων με video (για την αναγνώριση γεγονότων/συμπεριφορών όπως κλοπή, βανδαλισμός, κλπ.), παρακολούθησης κατανεμημένων συστημάτων (για την αναγνώριση γεγονότων όπως denial of service attack, κλπ.), ή ακουστικού σήματος που αφορούν τραγούδια της καμπούρας της φάλαινας (για την αναγνώριση τραγουδιών φάλαινας). Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr Γιώργος Παλιούρας, τηλ. 210-6503158, email: paliourg@iit.demokritos.gr 3.2 Κατάτμηση χρονικά μεταβαλλόμενων δεδομένων (σημάτων) και αναγνώριση των γεγονότων που προκύπτουν, με χρήση χρονικών οντολογιών Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις αναπαράστασης γνώσης και επεξεργασίας σήματος. Περιγραφή: Στην αναγνώριση γεγονότων από σήματα, με χρήση οντολογιών, η διαδικασία ξεκινά με την ανάλυση του σήματος. Σ αυτή τη φάση χρειάζεται να γίνει κατάτμηση του σήματος σε βασικές μονάδες και χαρακτηρισμός των μονάδων ως γεγονότα χαμηλού επιπέδου. Η σειρά αυτών των γεγονότων με τις χρονικές παραμέτρους τους τοποθετούνται στην οντολογία ως στιγμιότυπα κλάσεων και κατόπιν με τη βοήθεια μεθόδων συμπερασμού, αναγνωρίζονται επιπλέον γεγονότα υψηλότερου επιπέδου. Στα πλαίσια της εργασίας θα αναπτυχθούν μέθοδοι κατάτμησης σημάτων και αναγνώρισης γεγονότων. Οι μέθοδοι θα εφαρμοστούν σε ηχοδιαγράμματα (sonograms) που καταγράφουν τραγούδια της καμπούρας φάλαινας, για τα οποία έχουμε δημιουργήσει και την αντίστοιχη οντολογία. Γιώργος Παλιούρας, τηλ. 210-6503158, email: paliourg@iit.demokritos.gr Βασίλης Γάτος, τηλ. 210-6503183, email: bgat@iit.demokritos.gr 3.3 Μέθοδοι βελτίωσης χρονικών οντολογιών για αναγνώριση γεγονότων από δεδομένα. Επιθυμητά προσόντα: Γνώσεις αναπαράστασης γνώσης και συμπερασμού. Περιγραφή: Στην πλειοψηφία τους οι οντολογίες που χρησιμοποιούνται στην πράξη περιορίζονται σε ιεραρχικές δομές εννοιών, με ελάχιστες μη-ιεραρχικές σχέσεις μεταξύ τους. Υπάρχει όμως έντονη ανάγκη αναπαράστασης λιγότερο στατικής γνώσης, όπως χρονικές σχέσεις που χαρακτηρίζουν διαδικασίες και γεγονότα. Στα πλαίσια της εργασίας θα υλοποιηθούν υπάρχουσες μέθοδοι αναγνώρισης γεγονότων και

βελτίωσης της οντολογίας γεγονότων με βάση ένα μικρό σύνολο επισημειωμένων δεδομένων. Το τελικό σύστημα θα αξιολογηθεί σε δεδομένα ακουστικού σήματος που αφορούν τραγούδια της καμπούρας φάλαινας. Γιώργος Παλιούρας, τηλ. 210-6503158, email: paliourg@iit.demokritos.gr Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr 3.4 Μέθοδος μετασχηματισμού OWL οντολογίας σε Bayes δίκτυο. Επίπεδο: Προπτυχιακό. Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού σε Java. Επιθυμητά προσόντα: XML, OWL. Περιγραφή: Οι οντολογίες και τα Bayesian δίκτυα αποτελούν μοντέλα για αναπαράσταση ενός τμήματος του κόσμου που μας ενδιαφέρει ή κάποιου προβλήματος. Ταυτόχρονα έχουν και αρκετές διαφορές, όπως τον τύπο των σχέσεων που μοντελοποιούν μεταξύ εννοιών ή μεταβλητών. Αντικείμενο της εργασίας είναι ο αυτόματος μετασχηματισμός οντολογιών σε Bayesian δίκτυα. Η εργασία περιλαμβάνει τη μελέτη κάποιων βασικών προσεγγίσεων για το σκοπό αυτό καθώς επίσης και την υλοποίηση ενός συστήματος για τον εν λόγω μετασχηματισμό. Σε ερευνητικό επίπεδο, στόχος είναι να εξαχθούν κάποια συμπεράσματα για το κατά πόσο διατηρείται η εκφραστικότητα και η σημασιολογία της γλώσσας ορισμού οντολογιών OWL κατά το μετασχηματισμό της οντολογίας σε Bayesian δίκτυο. Ηλίας Ζαβιτσάνος, τηλ. 210-6503216, email: izavits@iit.demokritos.gr Γιώργος Παλιούρας, τηλ. 210-6503158, email: paliourg@iit.demokritos.gr 3.5 Σύγκριση μεθοδολογιών για την αναπαράσταση κανόνων κατανεμημένων και πολυπρακτορικών συστημάτων. Απαιτούμενα προσόντα: Οικειότητα με τεχνικές Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Οικειότητα με τεχνικές αναπαράστασης γνώσης και συμπερασμού. Περιγραφή: Ένα από τα προβλήματα που σχετίζονται με τα κατανεμημένα συστήματα, όπως συστήματα Peer-to-Peer, Grid, και Ad Hoc Networks, είναι η διαχείριση πρόσβασης στους πόρους (shared resources) ενός συστήματος, όπως κύκλοι CPU και αποθηκευτικοί χώροι, οι οποίοι δεν είναι υπό τον έλεγχο ενός κεντρικού διαχειριστή. Σε αυτά τα συστήματα, πράκτορες, ανθρώπινοι ή υπολογιστικοί, αλληλεπιδρούν δημιουργώντας ένα Εικονικό Οργανισμό (Virtual Organisation), ο οποίος διέπεται από ένα σύνολο κανόνων (policies) που καθορίζουν τους τρόπους με τους οποίους ένα μέλος του Εικονικού Οργανισμού μπορεί να έχει πρόσβαση στους πόρους. Μεταξύ άλλων, οι κανόνες Εικονικών Οργανισμών έχουν διατυπωθεί με: (i) Γλώσσες Δράσης από τον τομέα της Τεχνητής Νοημοσύνης (π.χ. Λογισμός Καταστάσεων (Situation Calculus), Λογισμός Γεγονότων (Event Calculus), γλώσσα δράσης C+, γλώσσα δράσης E), και (ii) Οντολογίες και Περιγραφική Λογική (Description Logics). Ο σκοπός της διπλωματικής είναι η σύγκριση αυτών των δύο τύπων φορμαλισμών για τη διατύπωση κανόνων κατανεμημένων συστημάτων. Ενδεικτικά θέματα προς έρευνα είναι: Μπορεί ο κάθε φορμαλισμός να εκφράσει τις χρονικές σχέσεις αυτών των δυναμικών συστημάτων; Υποστηρίζει ο κάθε φορμαλισμός το εύρος των ειδών συμπερασματολογίας (reasoning tasks) που θέλουμε να εφαρμόσουμε σε διατυπώσεις κανόνων κατανεμημένων συστημάτων (π.χ. να υπολογίσουμε ανά πάσα χρονική στιγμή αν είναι επιτρεπτή η πρόσβαση σε έναν πόρο, αν είναι υποχρεωμένος ο τοπικός διαχειριστής του πόρου να παρέχει πρόσβαση στον πόρο, ποιες είναι οι ποινές που σχετίζονται με τη μη εφαρμογή ορισμένων κανόνων, κλπ); Επιβλέπων Ερευνητής: Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr

3.6 Δυναμικές προδιαγραφές πολυ-πρακτορικών συστημάτων. Απαιτούμενα προσόντα: Οικειότητα με τεχνικές Τεχνητής Νοημοσύνης. Επιθυμητά προσόντα: Οικειότητα με τεχνικές αναπαράστασης γνώσης και συμπερασμού. Περιγραφή: Στο εργαστήριο έχουμε αναπτύξει ένα πλαίσιο για δυναμικές προδιαγραφές πολυπρακτορικών συστημάτων. Σε αυτό το πλαίσιο, η προδιαγραφή ενός συστήματος αναπτύσσεται πριν από την έναρξη της λειτουργίας του (design-time specification). Επιπλέον, υπάρχει η δυνατότητα αλλαγής της προδιαγραφής ενός συστήματος κατά τη διάρκεια της λειτουργίας του (run-time modification). Για παράδειγμα, μπορεί οι πράκτορες μίας δημοπρασίας να αλλάξουν κατά τη διάρκεια της δημοπρασίας τον αριθμό γύρων προσφοράς (bidding rounds), τον τύπο προσφοράς (π.χ. αλλαγή από ανοιχτές προσφορές σε εμπιστευτικές προσφορές), κλπ. Σε αυτή την εργασία θα υλοποιηθεί μία πλατφόρμα αξιολόγησης των δυναμικών προδιαγραφών ενός πολυ-πρακτορικού συστήματος. Π.χ., η πλατφόρμα αυτή θα υπολογίζει, μεταξύ άλλων: την απόσταση που έχει η προδιαγραφή μία συγκεκριμένη χρονική στιγμή από μία ιδανική προδιαγραφή (π.χ. μία προδιαγραφή που επιθυμεί ο σχεδιαστής του πολυ-πρακτορικού συστήματος), το χρονικό διάστημα που πέρασε μέχρι η προδιαγραφή ενός συστήματος να γίνει ιδανική, το χρονικό διάστημα κατά το οποίο η προδιαγραφή ενός συστήματος ήταν σε κοντινή απόσταση από την ιδανική προδιαγραφή. Επιβλέπων Ερευνητής: Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr 3.7 Μηχανική Μάθηση Προγραμμάτων Λογικών Περιγραφής Απαιτούμενα προσόντα: Γνώσεις Υπολογιστικής Λογικής και Προγραμματισμού σε Prolog. Επιθυμητά προσόντα: Γνώσεις Μηχανικής Μάθησης και Επαγωγικού Λογικού Προγραμματισμού. Περιγραφή: Οι Λογικές Περιγραφής (Description Logics) είναι μια οικογένεια λογικών πρώτης τάξης με εφαρμογές στη Διαχείριση Γνώσης και τον Σημασιολογικό Ιστό. Καθώς παρουσιάζουν κάποιες ιδιαιτερότητες σε σχέση με την Λογική Horn που αποτελεί το σύνηθες πεδίο του Επαγωγικού Λογικού Προγραμματισμού, το μοντέλο του τελευταίου θα πρέπει να διαμορφωθεί για να βρει εφαρμογή στην μηχανική μάθηση προγραμμάτων Λογικών Περιγραφής. Στο Εργαστήριο έχουμε ξεκινήσει έρευνα προς αυτή την κατεύθυνση. Στόχος της εργασίας είναι η ανάπτυξη και ο έλεγχος κάποιων από τις μεθόδους μηχανικής μάθησης που προκύπτουν από αυτή την προσπάθεια. Στασινός Κωνσταντόπουλος, τηλ. 210-6503162, e-mail: konstant@iit.demokritos.gr Γιώργος Παλιούρας, τηλ. 210-6503158, email: paliourg@iit.demokritos.gr 3.8 Mεθοδολογίες δομημένης αναπαράστασης κειμένου και εφαρμογές στην τεχνολογία γνώσεων. Επίπεδο: Μεταπτυχιακό. Επιθυμητά προσόντα: Γνώσεις δομών δεδομένων, μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Για την αναπαράσταση κειμένων χρησιμοποιούνται συχνά δομημένες μέθοδοι, όπως ιεραρχικές ή γραφικές αναπαραστάσεις. Σκοπός της εργασίας είναι να αξιολογηθεί η χρησιμότητα των παραπάνω αναπαραστάσεων στο πλαίσιο της εξαγωγής γνώσης από κείμενα, αλλά και της χρησιμοποίησής τους για τον εμπλουτισμό μίας οντολογίας που να περιγράφει τη σημασιολογία του κειμένου. Βαγγέλης Καρκαλέτσης, τηλ. 210-6503197, e-mail: vangelis@iit.demokritos.gr

3.9 Σχεδιασμός και ανάπτυξη οντολογιών πεδίου ευημερίας (well being domain ontologies) και χρησιμοποίησή τους για τη διάταξη των διαφόρων υποσυστημάτων και τεχνολογιών toy συστήματος Υποβοηθούμενης Διαβίωσης με Ευφυείς Τεχνολογίες (Ambient Assisted Living) AMIE. Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις αναπαράστασης γνώσης, γνώσεις περιρρέουσας ευφυΐας (ambient intelligence). Περιγραφή: Στόχος του ΑΜΙΕ είναι να συνδυάσει ευφυείς τεχνολογίες για την στήριξη της όσο το δυνατόν ανεξάρτητης διαβίωσης των ηλικιωμένων ή των ατόμων με ειδικές ανάγκες στο σπίτι τους. Ανάμεσα στα άλλα ερευνητικά θέματα, θα εξετασθούν όλες οι απόψεις αλληλεπίδρασης μεταξύ του χρήστη και του συστήματος καθώς και η δυνατότητα αυτόματης πρόσθεσης πληροφοριών στο σύστημα. Με αυτόν το τρόπο, θα είναι δυνατόν να γίνεται εργονομικός σχεδιασμός πολύμορφων επιφανειών αλληλεπίδρασης (τηλεόραση, υπολογιστής, κινητό ή σταθερό τηλέφωνο κτλ.), συγχώνευση των ετερογενών μορφών πληροφορορίας και επιλογή περιεχομένου αλληλεπίδρασης βασισμένη στις προτιμήσεις, το προφίλ, τους περιορισμούς και τη κατάσταση του χρήστη. Με αυτό τον τρόπο, το σύστημα θα παρέχει την καλύτερη δυνατή υποβοήθηση απευθυνόμενη στις ιδιαίτερες ανάγκες και συνθήκες του κάθε χρήστη. Ο στόχος της εργασίας θα είναι η ανάπτυξη οντολογιών πεδίου (domain ontologies) σχετικών με την ευημερία των ατόμων (well being) καθώς και η δημιουργία νέων οντολογιών όπου χρειάζεται. Κατόπιν, οι οντολογίες αυτές θα χρησιμοποιηθούν για την ανανέωση των σχετικών πληροφοριών που θα λαμβάνονται από διάφορα μέρη του ΑΜΙΕ (αισθητήρες, αποτελέσματα αλληλεπίδρασης χρήστη συστήματος, ιατρικά στοιχεία κτλ.) που θα γίνεται σε πραγματικό χρόνο και για τη αυτόματη λήψη αποφάσεων σχετικά με ποιες είναι οι παρούσες χρονικές ανάγκες του κάθε χρήστη. Για παράδειγμα, αυτόματος συναγερμός για την παροχή βοήθειας σε ηλικιωμένο που έχει πέσει και δεν μπορεί να σηκωθεί, υποστήριξη μνήμης σε περιπτώσεις που η γεροντική άνοια ή η νόσος Αlzeheimer εξελίσσεται, αποφυγή κατάθλιψης με τους κατάλληλους κοινωνικούς ερεθισμούς κτλ. Βαγγέλης Καρκαλέτσης, τηλ. 210-6503197, e-mail: vangelis@iit.demokritos.gr Άννα Σαχινοπούλου, e-mail: Anna.Sachinopoulou@vtt.fi 3.10 Σχεδιασμός, ανάπτυξη και χρήση οντολογιών για την κοινοποίηση εμπειριών (experience sharing) σε διάφορες κοινότητες και ομάδες κατά ένα ασφαλή και νόμιμο τρόπο. Απαιτούμενα προσόντα: Γνώσεις προγραμματισμού. Επιθυμητά προσόντα: Γνώσεις αναπαράστασης γνώσης, γνώσεις περιρρέουσας ευφυΐας (ambient intelligence). Περιγραφή: Στα πλαίσια του έργου Expeshare (Enable virtual communities to share media experiences in their personal devices legally and securely), η κεντρική ιδέα είναι να δοθεί η δυνατότητα στους χρήστες να μοιραστούν το περιεχόμενο των πολυμέσων τους που βρίσκεται στις προσωπικές τους συσκευές (κινητά τηλέφωνα ή υπολογιστές) με διαφορετικές κοινωνικές ομάδες (οικογένεια, φίλοι, συνάδελφοι, άνθρωποι που συμμετέχουν στην ίδια εκδήλωση) είτε αυτό είναι εμπορικό, είτε ιδιωτικό (το έχουν παράγει οι ίδιοι). Οι οντολογίες χρησιμοποιούνται για να περιγράψουν το περιεχόμενο των πολυμέσων και να επαυξήσουν τα μετα-δεδομένα τους (metadata), για να ορίσουν διάφορες καταστάσεις καθώς και τα διάφορα προφίλ των χρηστών. Επίσης χρησιμοποιούνται στην γρήγορη και ευφυή εύρεση επιθυμητών αντικειμένων (Intellgent retrieval of multimedia). Αυτή η εργασία αποσκοπεί στο σχεδιασμό και στη δημιουργία των κατάλληλων οντολογιών (π.χ. Μουσική οντολογία), στην ανανέωση και στον εμπλουτισμό αυτών των οντολογιών (ontology population and ontology enrichment) καθώς και στη χρήση τους για τον ορισμό των διαφόρων κοινωνικών ομάδων με τις οποίες ο χρήστης θα θελήσει να μοιραστεί τις εμπειρίες του. Βαγγέλης Καρκαλέτσης, τηλ. 210-6503197, e-mail: vangelis@iit.demokritos.gr Άννα Σαχινοπούλου, e-mail: Anna.Sachinopoulou@vtt.fi