µεθόδων αυτών, είναι απαραίτητη η δηµιουργία αντιπροσωπευτικού δείγµατος του Ιστού. Στόχος της εργασίας είναι η υλοποίηση και αξιολόγηση µεθόδων δειγµ

Σχετικά έγγραφα
Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

Προπτυχιακές και μεταπτυχιακές εργασίες Σεπτέμβριος 2008

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Ανάκτηση Πληροφορίας

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Εξόρυξη Γνώσης από εδοµένα (data mining)

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση. Κορφιάτης Γιώργος ιπλωµατική Εργασία

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

Πληροφορική 2. Τεχνητή νοημοσύνη

ιπλωµατική εργασία: Νικόλαος Ματάνας Επιβλέπων Καθηγήτρια: Μπούσιου έσποινα

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

6 ο Πακέτο Εργασίας «Ψηφιακή Βάση ιαχείρισης Γεωγνώσης (e-repository of Geoscience Content)»

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΠΡΟΓΡΑΜΜΑ ΓΑΛΛΙΚΩΝ ΣΠΟΥΔΩΝ ΓΑΛ 102 Προφορικός λόγος 6 ΓΑΛ 103 Γραπτός λόγος I 6 ΓΑΛ 170 e-french 6 ΓΑΛ Μάθημα περιορισμένης επιλογής 6

Ψηφιακά Mέσα Υπολογιστική Νοημοσύνη

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Τμήμα Πληροφορικής. Σχολή Τεχνολογικών Εφαρμογών. Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης

ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS)

ΠΜΣ 513 ΤΕΧΝΟΛΟΓΙΑ ΗΛΕΚΤΡΟΝ ΙΚΟΥ ΕΜΠΟΡΙΟΥ ΥΠΟΧΡΕΩΤΙΚΗ ΕΡΓΑΣΙΑ 2015

Αν σας ενδιαφέρει κάποιο θέμα, δείτε τη σχετική βιβλιογραφία και στείλτε μου για να συναντηθούμε και να το συζητήσουμε.

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Α ΤΑΞΗ. 1 η ΕΝΟΤΗΤΑ: Γνωρίζω τον υπολογιστή. Θα παρουσιαστεί µε τρόπο απλό και κατανοητό,

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2

Διπλωματικές των κ. Ι. Βλαχάβα και Ν. Βασιλειάδη

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

Πρόλογος των Συγγραφέων

215 Μηχανικών Η/Υ και Πληροφορικής Πάτρας

Τεχνητή Νοημοσύνη ( )

Γιάννης Θεοδωρίδης. Εργαστήριο Πληροφοριακών Συστηµάτων.

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Περιεχόµενα. ΜΕΡΟΣ Α: Επίλυση Προβληµάτων... 17

Επιµέλεια Θοδωρής Πιερράτος

Ανάπτυξη Εφαρµογών σε Προγραµµατιστικό Περιβάλλον

Περίληψη ιπλωµατικής Εργασίας

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΚΕΝΤΡΟ ΥΠΟΣΤΗΡΙΞΗΣ ΕΦΑΡΜΟΓΩΝ ΛΟΓΙΣΜΙΚΟΥ. Μιχάλης Κεφαλάς, ΑΤΕΙ Θεσσαλονίκης

Integrated Project. Ambient Intelligence System of Agents for Knowledgebased and Integrated Services for Mobility Impaired users

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Σχεδιασµός Ανάπτυξη Οντολογίας

ΠΛΗΡΟΦΟΡΙΑΚΑ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΓΙΑ ΤΗΝ ΕΠΙΜΟΡΦΩΣΗ ΤΩΝ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΕΙ ΙΚΟ ΜΕΡΟΣ: ΚΛΑ ΟΣ ΠΕ02 (78 ώρες)

Επικοινωνία Ανθρώπου Υπολογιστή. Α1. Εισαγωγή στην ΕΑΥ και γενικές πληροφορίες για το µάθηµα

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

ΕΙ ΙΚΑ ΚΕΦΑΛΑΙΑ ΧΑΡΤΟΓΡΑΦΙΑΣ ΧΑΡΤΟΓΡΑΦΙΑ ΧΑΡΤΗΣ ΧΡΗΣΗ ΗΜΙΟΥΡΓΙΑ. β. φιλιππακοπουλου 1

Πρώτο Κεφάλαιο Φάσεις & Μοντέλα ένταξης των ΤΠΕ στην Εκπαίδευση Εκπαιδευτική Τεχνολογία: η προϊστορία της πληροφορικής στην εκπαίδευση 14

Τμήμα Μηχανικών Πληροφορικής & Υπολογιστών

Περιεχόµενα. Πληροφοριακά Συστήµατα: Κατηγορίες και Κύκλος Ζωής. Π.Σ. ιαχείρισης Πράξεων. Π.Σ. ιοίκησης. Κατηγορίες Π.Σ. Ο κύκλος ζωής Π.Σ.

Ερευνητική υπόθεση. Η ερευνητική υπόθεση αναφέρεται σε μια συγκεκριμένη πρόβλεψη σχετικά με τη σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές.

2. Μελέτη της επίδρασης των δημογραφικών, κοινωνικών και οικονομικών παραγόντων στις επιδόσεις των μαθητών στην ΕΕ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Εισαγωγή. Χαράλαμπος Καραγιαννίδης. Διάλεξη 1. Εφαρμογές ΤΠ στην ΕΕΑ & Διδακτική της Πληροφορικής.

ΠΕΡΙΦΕΡΕΙΑΚΟΣ ΠΟΛΟΣ ΚΑΙΝΟΤΟΜΙΑΣ ΥΤΙΚΗΣ ΕΛΛΑ ΑΣ

ΚΕΦΑΛΑΙΟ 9 ΕΛΕΓΧΟΣ ΙΑ ΙΚΑΣΙΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΤΩΝ ΣΧΕ ΙΩΝ ΡΑΣΗΣ

Επαναληπτικές Ασκήσεις. Κάτια Κερμανίδου

ΑΔΑ: 4ΑΡΟ46941Δ-Ε. Συνολικός Προϋπολογισμός Έργου : ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΙΑ ΙΚΤΥΟ 137/

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Ειδικής Υποδομής Υποχρεωτικό

Περιεχόµενα. Ανασκόπηση - Ορισµοί. Ο κύκλος ανάπτυξης προγράµµατος. Γλώσσες Προγραµµατισµού Ασκήσεις

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΔΙΑΔΙΚΤΥΟ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Αναλυτικές λειτουργίες ΣΓΠ

Eκπαίδευση Εκπαιδευτών Ενηλίκων & Δία Βίου Μάθηση

υπηρεσιες προστιθέμενης αξίας Υπηρεσίες προστιθέμενης αξίας

... Τεχνολογία Επικοινωνιών Τεχνολογικής Κατεύθυνσης

Μαλούτα Θεανώ Σελίδα 1

Εκδήλωση ενδιαφέροντος

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία. Εργαστήριο 4 ο : MATLAB

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Ανάλυση Απαιτήσεων Απαιτήσεις Λογισµικού

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ. Τμήμα Μηχανικών Οικονομίας και Διοίκησης ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ ΓΕ0175 ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ 9

Γλώσσες υψηλού επιπέδου Περιέχουν περισσότερες εντολές για την εκτέλεση πολύπλοκων εργασιών Τα προγράµµατα µεταφράζονται σε γλώσσα µηχανής είτε από το

Transcript:

ΕΚΕΦΕ «ηµόκριτος» Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Τεχνολογίας Γνώσεων και Λογισµικού Προπτυχιακές και µεταπτυχιακές εργασίες Σεπτέµβριος 2006 Το Εργαστήριο Τεχνολογίας Γνώσεων και Λογισµικού του ΕΚΕΦΕ «ηµόκριτος» προσφέρει τις παρακάτω εργασίες, οι οποίες είναι χωρισµένες σε θεµατικές ενότητες, σύµφωνα µε τις ράσεις του Εργαστηρίου. Οι περιγραφές των εργασιών συµπεριλαµβάνουν τα ονόµατα των ερευνητών που είναι υπεύθυνοι για την επίβλεψη και την εσωτερική αξιολόγησή τους. Όλες οι εργασίες θα εκπονηθούν σε συνεργασία µε µέλη ΕΠ ΑΕΙ και ΤΕΙ. ΡΑΣΗ 1. Συστήµατα Εξαγωγής Πληροφορίας και Εξόρυξης Γνώσης Στόχος είναι η έρευνα και ανάπτυξη σε θέµατα φιλτραρίσµατος και εξαγωγής πληροφορίας από βάσεις κειµένων (information filtering and extraction) καθώς και σε θέµατα εξόρυξης γνώσης από βάσεις κειµένων ή δεδοµένων (text mining or data mining). Για την επίτευξη του στόχου αυτού αξιοποιούνται µέθοδοι, τεχνικές και εργαλεία από τις τεχνολογίες Επεξεργασίας Φυσικής Γλώσσας, Εξόρυξης Γνώσης, και Μηχανικής Μάθησης. 1.1 Αυτόµατη δηµιουργία επερωτήσεων για την ανάκτηση παραδειγµάτων από τον Ιστό, µε στόχο την εκπαίδευση ταξινοµητών ιστοσελίδων ακολουθώντας διαδικασία ενεργής µάθησης. Απαιτούµενα προσόντα: Πολύ καλές γνώσεις προγραµµατισµού, κατά προτίµηση σε Java. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Η δηµιουργία αποδοτικών ταξινοµητών κειµένου µε χρήση µηχανικής µάθησης, στηρίζεται στη σωστή επιλογή δεδοµένων εκπαίδευσης, δηλαδή κειµένων. Στο Εργαστήριο έχει αναπτυχθεί µέθοδος δηµιουργίας και εµπλουτισµού των δεδοµένων εκπαίδευσης για ταξινοµητές εγγράφων, ανακτώντας κατάλληλα παραδείγµατα από τον Ιστό. Η µέθοδος αυτή ακολουθεί τη διαδικασία ενεργής µάθησης (active learning) σε συνδυασµό µε τον σχηµατισµό επερωτήσεων για µηχανές αναζήτησης. Στόχος της εργασίας είναι η αυτοµατοποίηση της δηµιουργίας των επερωτήσεων προς τις µηχανές αναζήτησης και η αξιολόγηση διάφορων προσεγγίσεων σε αυτό το πρόβληµα. 1.2 Μέθοδοι δειγµατοληψίας του Ιστού µε στόχο την αξιολόγηση µεθόδων εστιασµένης αναζήτησης στον Ιστό. Απαιτούµενα προσόντα: Πολύ καλή γνώση προγραµµατισµού, κατά προτίµηση σε Java. Επιθυµητά προσόντα: Γνώσεις στατιστικής ή/και διαδικτυακού προγραµµατισµού. Περιγραφή: Οι µέθοδοι εστιασµένης αναζήτησης (focused crawling) στοχεύουν στη γρήγορη και αποτελεσµατική ανάκτηση πληροφοριών γύρω από ένα θέµα από το χάος του Ιστού. Στο Εργαστήριο έχουν αναπτυχθεί µέθοδοι εκπαίδευσης µηχανών εστιασµένης αναζήτησης µε χρήση τεχνικών ενισχυτικής µάθησης (reinforcement learning). Για την αξιολόγηση των

µεθόδων αυτών, είναι απαραίτητη η δηµιουργία αντιπροσωπευτικού δείγµατος του Ιστού. Στόχος της εργασίας είναι η υλοποίηση και αξιολόγηση µεθόδων δειγµατοληψίας του Ιστού που σέβονται τους περιορισµούς του συγκεκριµένου προβλήµατος και συλλέγουν το απαιτούµενο αντιπροσωπευτικό δείγµα. 1.3 Σύστηµα φιλτραρίσµατος ανεπιθύµητων ηλεκτρονικών µηνυµάτων για οµάδες χρηστών µε χρήση µηχανικής µάθησης. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης. Περιγραφή: Η ανεπιθύµητη ηλεκτρονική αλληλογραφία (spam filtering) έχει γίνει ένα από τα σηµαντικότερα προβλήµατα που σχετίζονται µε τη χρήση του ιαδικτύου. Η εκπαίδευση ταξινοµητών των µηνυµάτων (φίλτρων) µε χρήση µηχανικής µάθησης έχει οδηγήσει πρόσφατα σε µερική λύση του προβλήµατος. Στο Εργαστήριο έχει αναπτυχθεί σύστηµα εκπαίδευσης φίλτρων για ανεπιθύµητη αλληλογραφία, το οποίο χρησιµοποιεί για την εκπαίδευση ένα σώµα ανεπιθύµητων µηνυµάτων και τα κανονικά µηνύµατα που λαµβάνει ένας χρήστης. Στόχος της εργασίας είναι η επέκταση και αξιολόγηση του συστήµατος στην κατασκευή φίλτρων για οµάδες χρηστών, π.χ. τα µέλη του Εργαστηρίου. Η νέα µέθοδος θα στηρίζεται στην αξιοποίηση ελεύθερα διαθέσιµων ηλεκτρονικών µηνυµάτων, των οποίων γνωρίζουµε την κατηγορία (επιθυµητά ή ανεπιθύµητα), καθώς και των προσωπικών µηνυµάτων των χρηστών, των οποίων δεν γνωρίζουµε την κατηγορία, δηλ. δεν απαιτείται από τον χρήστη να κατατάξει τα µηνύµατα. 1.4 Μηχανική µάθηση ταξινοµητών από ταξινοµηµένα και µη ταξινοµηµένα δεδοµένα εκπαίδευσης σε περιπτώσεις ανισοκατανεµηµένων κατηγοριών. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης. Περιγραφή: ύο βασικά προβλήµατα στην εκπαίδευση ταξινοµητών, ιδιαίτερα σε εφαρµογές ταξινόµησης περιεχοµένου, είναι (α) η ακραία ανισοκατανοµή των κατηγοριών, συνήθως εις βάρος της ενδιαφέρουσας κατηγορίας, και (β) η ύπαρξη λίγων κατανεµηµένων παραδειγµάτων και πολλών µη-κατανεµηµένων. Για την αντιµετώπιση αυτού του προβλήµατος έχει αναπτυχθεί στο εργαστήριο µέθοδος µηχανικής µάθησης που εστιάζει στην κατηγορία που µας ενδιαφέρει και προσπαθεί να εκτιµήσει την κατηγορία των µη-κατανεµηµένων παραδειγµάτων. Στα πλαίσια αυτής της εργασίας θα υλοποιηθούν και θα αξιολογηθούν βελτιώσεις της υπάρχουσας µεθόδου, σε δεδοµένα ιατρικής διάγνωσης και ταξινόµησης περιεχοµένου. 1.5 Σύστηµα ενηµέρωσης δικτύου βιβλιογραφικών αναφορών από τον Ιστό µε τεχνικές εξαγωγής πληροφορίας και ταιριάσµατος όµοιων εγγραφών. Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού, κατά προτίµηση σε Java και βάσεων δεδοµένων. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας ή/και

διαδικτυακού προγραµµατισµού. Περιγραφή: Τα κοινωνικά δίκτυα (social networks) είναι µία από τις πιο ενδιαφέρουσες εφαρµογές για την εξαγωγή πληροφορίας και την εξόρυξη γνώσης. Το δίκτυο των βιβλιογραφικών αναφορών είναι ένα τυπικό παράδειγµα κοινωνικού δικτύου µε ενδιαφέροντα χαρακτηριστικά. Στόχος της εργασίας είναι η χρήση µεθόδων εξαγωγής πληροφορίας για την ενηµέρωση ενός τέτοιου δικτύου αναφορών. Η εξαγωγή πληροφορίας θα εφαρµόζεται στα αποτελέσµατα γνωστών βιβλιογραφικών βάσεων, καθώς και µηχανών αναζήτησης. Σηµαντικό ρόλο στη διαδικασία παίζει το ταίριασµα όµοιων εγγραφών (record linkage), που ανακτώνται από διαφορετικές πηγές. 1.6 Επέκταση πύλης ενηµέρωσης µε µεθόδους αυτόµατης συντήρησης των κανόνων εξαγωγής πληροφορίας από τις ειδησεογραφικές πηγές. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας ή/και διαδικτυακού προγραµµατισµού. Περιγραφή: Στο Εργαστήριο έχει αναπτυχθεί µία εξατοµικευµένη πύλη ενηµέρωσης από τον Παγκόσµιο Ιστό η οποία συλλέγει ειδήσεις από διάφορες πηγές και της παρέχει εξατοµικευµένα στους χρήστες της. Για το σκοπό αυτό, η πύλη χρησιµοποιεί κανόνες εξαγωγής της πληροφορίας από της πηγές. Οι κανόνες αυτοί υλοποιούνται ως κανονικές εκφράσεις, ο οποίες εφαρµόζονται στο κείµενο των ιστοσελίδων και εξάγουν την ενδιαφέρουσα πληροφορία, π.χ. τον τίτλο της είδησης. Ένα από τα βασικά προβλήµατα είναι η συντήρηση αυτών των κανόνων για πολλές πηγές οι οποίες µεταβάλουν τον τρόπο παρουσίασης της πληροφορίας στον χρόνο. Στόχος της εργασίας είναι η ανάπτυξη µεθόδων αυτόµατου εντοπισµού αυτών των αλλαγών και ενηµέρωσης των κανόνων εξαγωγής πληροφορίας µε µεθόδους µηχανικής µάθησης. 1.7 Μέθοδοι εκτίµησης της άποψης που εκφράζει ένα κείµενο για συγκεκριµένες οντότητες. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Στο Εργαστήριο έχει αναπτυχθεί µία µέθοδος ταξινόµησης κειµένων µε βάση την άποψη (sentiment) που εκφράζουν. Η µέθοδος αυτή στηρίζεται σε γλωσσικά χαρακτηριστικά του κειµένου και µηχανική µάθηση. Πέρα όµως από την εκτίµηση της άποψης που εκφράζει ένα κείµενο, πολλές φορές µας ενδιαφέρει η άποψη που εκφράζει το κείµενο για συγκεκριµένες οντότητες, η οποία µπορεί να είναι διαφορετική, π.χ. µία κριτική ταινίας µπορεί να είναι θετική για την ταινία, αλλά αρνητική για κάποιους ηθοποιούς ή το αντίστροφο. Στόχος της εργασίας είναι η ανάπτυξη µεθόδου η οποία θα στοχεύει στην εκτίµηση της άποψης για συγκεκριµένες οντότητες. Για το σκοπό αυτό, πέραν της µηχανικής µάθησης, θα χρησιµοποιηθούν και µέθοδοι εξαγωγής πληροφορίας για τον εντοπισµό των οντοτήτων.

1.8 Μηχανική Μάθηση Μορφολογικών Κανόνων Απαιτούµενα προσόντα: Γνώσεις Τεχνητής Νοηµοσύνης. Επιθυµητά προσόντα: Γνώσεις Μηχανικής Μάθησης και Γλωσσικής Τεχνολογίας. Περιγραφή: Χρήση µεθόδου Μηχανικής Μάθησης για την δηµιουργία part-of-speech tagger για την Ελληνική γλώσσα. ίνεται έµφαση στην εφαρµογή µεθοδολογίας εκµάθησης των κανόνων συγκεκριµένης γλώσσας λαµβάνοντας υπ' όψιν γενικούς µορφολογικούς κανόνες. Η διπλωµατική θα βασιστεί σε υπάρχον ελληνικό corpus και σε δουλειά που έχει γίνει για part-of-speech tagging σε άλλες γλώσσες (π.χ. Brill tagger) αλλά και στα ελληνικά. Στασινός Κωνσταντόπουλος, τηλ. 210-6503162, e-mail: konstant@iit.demokritos.gr 1.9. Μηχανική Μάθηση Φωνοτακτικών και Γραφοτακτικών Κανόνων Απαιτούµενα προσόντα: Γνώσεις Τεχνητής Νοηµοσύνης. Επιθυµητά προσόντα: Γνώσεις Μηχανικής Μάθησης και Γλωσσικής Τεχνολογίας. Περιγραφή: Χρήση µεθόδου Μηχανικής Μάθησης για την δηµιουργία φωνοτακτικού µοντέλου της ελληνικής. Το φωνοτακτικό µοντέλο µίας γλώσσας διαχωρίζει τις συµβολοσειρές που δεν απαντώνται στην ελληνική γλώσσα σε τυχαία κενά (εν δυνάµει λέξεις που απλώς τυχαίνει να µην είναι υπαρκές, π.χ. πράπει ) και συστηµατικά κενά (συµβολοσειρές που δεν θα µπορούσαν ποτέ να είναι λέξεις, π.χ. πρπει ). Πιθανώς να διερευνηθεί και (ή µόνο το) γραφοτακτικό µοντέλο, το οποίο εφαρµόζεται στην ορθογραφική (και όχι την φωνολογική) αναπαράσταση των λέξεων. Στασινός Κωνσταντόπουλος, τηλ. 210-6503162, e-mail: konstant@iit.demokritos.gr 1.10 Αναγνώριση, ταξινόµηση και κανονικοποίηση ονοµάτων οντοτήτων σε έγγραφα Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού, κατά προτίµηση σε C/C++, Tcl. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο αναπτύσσει εργαλεία για την αναγνώριση και ταξινόµηση ονοµάτων οντοτήτων (πρόσωπα, τοποθεσίες, χρονικές και αριθµητικές εκφράσεις) σε κείµενα της Ελληνικής και της Αγγλικής γλώσσας τα οποία βασίζονται σε τεχνικές µηχανικής µάθησης. Η προσαρµογή των εργαλείων σε νέες θεµατικές περιοχές απαιτεί την εκπαίδευση τους σε έγγραφα της κάθε περιοχής και την τροποποίηση της αναπαράστασης των παραδειγµάτων εκµάθησης λόγω των ιδιαιτεροτήτων της θεµατικής περιοχής. Σκοπός της εργασίας αυτής είναι η συγκριτική µελέτη διαφόρων τεχνικών µηχανικής µάθησης και τεχνικών συνδυασµού τους και διαφόρων αναπαραστάσεων, η επιλογή των καλύτερων και η ενσωµάτωσή τους στο εργαλείο αναγνώρισης, ταξινόµησης και κανονικοποίησης ονοµάτων. Παυλίνα Φράγκου, τηλ. 210 6503204, email: fragou@iit.demokritos.gr 1.11 Αναγνώριση σηµασιολογικών σχέσεων σε έγγραφα µε χρήση οντολογιών

Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού, κατά προτίµηση σε C/C++, Tcl. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο αναπτύσσει εργαλεία εξαγωγής πληροφορίας για την αναγνώριση σηµασιολογικών σχέσεων σε κείµενα (π.χ. ότι η εταιρία Χ είναι αγοραστής της εταιρίας Υ σε ένα γεγονός εξαγοράς). Σκοπός της εργασίας αυτής είναι η µελέτη διάφορων τεχνικών αναγνώρισης σηµασιολογικών σχέσεων σε έγγραφα µιας θεµατικής περιοχής αξιοποιώντας µια υπάρχουσα οντολογία για την περιοχή. Με βάση τα αποτελέσµατα της µελέτης αυτής θα υλοποιηθεί εργαλείο που θα βασίζεται σε τεχνικές συλλογιστικής (reasoning techniques) µε χρήση της οντολογίας, για την αναγνώριση σηµασιολογικών σχέσεων. Το εργαλείο θα αξιολογηθεί σε ήδη επισηµειωµένα σώµατα κειµένων που διαθέτει το Εργαστήριο. Παυλίνα Φράγκου, τηλ. 210 6503204, email: fragou@iit.demokritos.gr 1.12 Εφαρµογή τεχνικών Τµηµατοποίησης Κειµένων σε έγγραφα (κείµενα, ιστοσελίδες) µε στόχο την βελτιστοποίηση της αυτόµατης εξαγωγής σχέσεων Απαιτούµενα προσόντα: Πολύ καλές γνώσεις προγραµµατισµού, κατά προτίµηση σε C/C++, Tcl. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας, οικειότητα µε τεχνικές Τεχνητής Νοηµοσύνης. Περιγραφή: Οι τεχνικές Τµηµατοποίησης Κειµένων βοηθούν στην εύρεση των διαφορετικών θεµάτων τα οποία εµφανίζονται µέσα σε ένα κείµενο. Η εν λόγω εύρεση συνοδεύεται µε την πληροφορία της θέσης στην οποία πραγµατοποιείται η αλλαγή θεµατικής κατηγορίας µέσα σε αυτό. Τµήµατα κειµένου τα οποία αναφέρονται στο ίδιο θέµα είναι πιθανό να αναφέρονται στις ίδιες οντότητες (named entities) ή/και έννοιες (concepts). Μια τέτοια πληροφορία δύναται να είναι ευεργετική κατά τη διαδικασία της εξαγωγής πληροφορίας (information extraction), όπου µας ενδιαφέρει η εύρεση και εξαγωγή των σχέσεων µεταξύ οντοτήτων οι οποίες εµφανίζονται στα κείµενα. Στόχος της εργασίας είναι η εξέταση και ενσωµάτωση τεχνικών τµηµατοποίησης κειµένων σε τεχνικές εξαγωγής σχέσεων από κείµενα και ιστοσελίδες. Φράγκου Παυλίνα, τηλ. 21-06503204, email: fragou@iit.demokritos.gr Καρκαλέτσης Βαγγέλης τηλ. 21-06503197 email: vangelis@iit.demokritos.gr 1.13 Εξαγωγή πληροφορίας από κείµενα µε χρήση µεθόδων µηχανικής µετα-µάθησης. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο έχει ερευνητική δραστηριότητα στην κατεύθυνση της αυτόµατης κατασκευής κανόνων εξαγωγής πληροφορίας από κείµενα µε µεθόδους µηχανικής µάθησης. Στα πλαίσια αυτής της προσπάθειας, ιδιαιτέρα αποτελεσµατικός αποδείχθηκε ο συνδυασµός διαφορετικών συστηµάτων εξαγωγής πληροφορίας µε µεθόδους µετα-µάθησης, δηλαδή µεθόδους που παράγουν κανόνες συνδυασµού αποτελεσµάτων. Στόχος της εργασίας είναι η ανάπτυξη µίας νέας τέτοιας µεθόδου και ο έλεγχός της σε πραγµατικά δεδοµένα.

1.14 Αξιολόγηση µετρικών µορφολογικής και εννοιολογικής απόστασης λέξεων και η εφαρµογή τους στην ταύτιση όµοιων εγγραφών. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Στην υπάρχουσα βιβλιογραφία παρουσίαζονται διάφορες µετρικές απόστασης µεταξύ λέξεων (π.χ. απόσταση Levenshtein), κάποιες από τις οποίες βασίζονται σε µορφολογικά και άλλες σε σηµασιολογικά χαρακτηριστικά. Σκοπός της εργασίας είναι η υλοποίηση και αξιολόγηση των µετρικών αυτών σε συνήθεις τοµείς εφαρµογής, όπως η αποσαφήνιση νοήµατος λέξεων (word sense disambiguation), η ταυτοποίηση υπηρεσιών νοηµόνων πρακτόρων και η ταύτισης όµοιων εγγραφών σε συστήµατα ολοκλήρωσης πληροφορίας (information integration) στον Ιστό. Γιώργος Γιαννακόπουλος τηλ. 21-06503216, email: ggianna@iit.demokritos.gr ΡΑΣΗ 2. Φιλικά Συστήµατα Πληροφορικής Στόχος είναι η έρευνα και ανάπτυξη στις παρακάτω περιοχές: ανάλυση της χρήσης υπηρεσιών παροχής πληροφορίας (π.χ. Web-sites, news-filtering services, digital libraries), µε στόχο τη διάθεση πληροφορίας στο χρήστη σύµφωνα µε τις ανάγκες και τα ενδιαφέροντά του. διαλογικά συστήµατα (dialogue systems), δηλαδή συστήµατα που επιτρέπουν την επικοινωνία του χρήστη µε Η/Υ ή άλλες συσκευές, µε χρήση φυσικής γλώσσας (προφορικοί ή γραπτοί διάλογοι). Για την επίτευξη του στόχου αυτού αξιοποιούνται µέθοδοι, τεχνικές και εργαλεία από τις τεχνολογίες Επεξεργασίας Φυσικής Γλώσσας, Μοντελοποίησης Χρηστών, Λογισµικού και Μηχανικής Μάθησης. 2.1 Τεχνικές εξόρυξης γνώσης για την µοντελοποίηση χρηστών Απαιτούµενα προσόντα: Πολύ καλές γνώσεις προγραµµατισµού, κατά προτίµηση σε Java. Επιθυµητά προσόντα: Γνώσεις εξόρυξης γνώσης ή/και αλληλεπίδρασης ανθρώπου-µηχανής. Περιγραφή: Οι τεχνικές εξόρυξης γνώσης δίνουν τη δυνατότητα αυτόµατης κατασκευής και δυναµικής ενηµέρωσης µοντέλων χρηστών, τα οποία αποτελούν την βάση για την εξατοµίκευση των ιαδυκτυακών υπηρεσιών. Στο Εργαστήριο έχει αναπτυχθεί ένας εξυπηρετητής εξατοµίκευσης (personalization server) γενικής χρήσης. Σκοπός της εργασίας είναι η επέκταση των δυνατοτήτων του εξυπηρετητή εξατοµίκευσης µε νέες µεθόδους εξόρυξης γνώσης από δεδοµένα χρήσης του Παγκόσµιου Ιστού. 2.2 Εκµάθηση γραµµατικών από δεδοµένα χρήσης του Παγκόσµιου Ιστού, µε τη βοήθεια καταλόγων του Ιστού. Επιθυµητά προσόντα: Γνώσεις εξόρυξης γνώσης ή/και αλληλεπίδρασης ανθρώπου-µηχανής. Περιγραφή: Η πλοήγηση ενός χρήστη σε έναν ιστιακό τόπο ή γενικότερα στον Ιστό

καταγράφεται ως ακολουθία επερωτήσεων από τους εξυπηρετητές που παρέχουν το περιεχόµενο. Αυτή η ακολουθία είναι ιδιαίτερα χρήσιµη για τη µοντελοποίηση της συµπεριφοράς των χρηστών στον Ιστό. Στο Εργαστήριο έχει αναπτυχθεί µία µέθοδος που µοντελοποιεί τη συµπεριφορά των χρηστών µε γραµµατικές, τις οποίες µαθαίνει από τα δεδοµένα που συλλέγουν οι εξυπηρετητές. Στα πλαίσια της εργασίας θα βελτιωθεί αυτή η µέθοδος χρησιµοποιώντας καταλόγους του Ιστού (Web directories) ως κατηγοριοποίηση του περιεχοµένου που υπάρχει στον Ιστό και το οποίο ανακτούν οι χρήστες. 2.3. Μοντελοποίηση Ενδιαφέροντος (Ψυχαγωγίας) Παιδιού µε Χρήση Μηχανικής Μάθησης Επίπεδο: Mεταπτυχιακό. Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού, κατά προτίµηση σε Java, C/C++. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης. Περιγραφή: Η παρούσα εργασία στηρίζεται στην ανάλυση δεδοµένων αλληλεπίδρασης ανθρώπου-µηχανής (παιδιού-παιχνιδιού) καταγεγραµµένα από πειράµατα σε διαδραστικές παιδικές χαρές µεικτής πραγµατικότητας. Τα δεδοµένα περιλαµβάνουν ενδείξεις φυσιολογίας και απαντήσεις σε ερωτηµατολόγια ενδιαφέροντος (τι βρίσκουν ενδιαφέρον τα παιδιά στο παιχνίδι). Τα δεδοµένα αυτά θα αναλυθούν µε δύο διαφορετικές τεχνικές µηχανικής µάθησης (supervised machine learning) για τη δηµιουργία µοντέλων ενδιαφέροντος για τους παίκτες. Τα παραγόµενα µοντέλα θα πρέπει να δέχονται ως είσοδο δεδοµένα από την αλληλεπίδραση παιδιού-παιχνιδιού και τις ενδείξεις φυσιολογίας του παιδιού και να συµπεραίνουν τον βαθµό ψυχαγωγίας του παιδιού σε πραγµατικό χρόνο. Γιώργος Γιαννακάκης, τηλ 210-4973184, email: georgios@mip.sdu.dk 2.4. Μοντελοποίηση Τύπου και Ενδιαφέροντος (Ψυχαγωγίας) Παιδιού µε Χρήση Μηχανικής Μάθησης Επίπεδο: Mεταπτυχιακό. Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού, κατά προτίµηση σε Java, C/C++. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης. Περιγραφή: Η παρούσα εργασία στηρίζεται στην ανάλυση δεδοµένων αλληλεπίδρασης ανθρώπου-µηχανής (παιδιού-παιχνιδιού) καταγεγραµµένα από πειράµατα σε διαδραστικές παιδικές χαρές µεικτής πραγµατικότητας. Τα δεδοµένα περιλαµβάνουν ενδείξεις φυσιολογίας και απαντήσεις σε ερωτηµατολόγια ενδιαφέροντος (τι βρίσκουν ενδιαφέρον τα παιδιά στο παιχνίδι). Τα δεδοµένα αυτά θα αναλυθούν µε µεθόδους µηχανικής µάθησης για τη δηµιουργία ενός µοντέλου για τύπους παικτών (unsupervised machine learning) και ενός µοντέλου ενδιαφέροντος για τους παίκτες (supervised learning). Τα παραγόµενα µοντέλα θα πρέπει να δέχονται ως είσοδο δεδοµένα από την αλληλεπίδραση παιδιού-παιχνιδιού και τις ενδείξεις φυσιολογίας του παιδιού και να συµπεραίνουν τον βαθµό ψυχαγωγίας του παιδιού σε πραγµατικό χρόνο. Γιώργος Γιαννακάκης, τηλ 210-4973184, email: georgios@mip.sdu.dk

2.5. Μοντελοποίηση συµπεριφοράς παιδιών σε παιχνίδια µεικτής πραγµατικότητας µε χρήση πιθανοτικών γραµµατικών Επίπεδο: Mεταπτυχιακό. Επιθυµητά προσόντα: Γνώσεις µηχανικής µάθησης. Περιγραφή: Η παρούσα εργασία στηρίζεται στην ανάλυση δεδοµένων αλληλεπίδρασης ανθρώπου-µηχανής (παιδιού-παιχνιδιού) καταγεγραµµένα από πειράµατα σε διαδραστικές παιδικές χαρές µεικτής πραγµατικότητας. Τα δεδοµένα περιλαµβάνουν καταγεγραµµένα παιχνίδια (υπό µορφή σειράς ενεργειών) και απαντήσεις σε ερωτηµατολόγια ενδιαφέροντος (τι βρίσκουν ενδιαφέρον τα παιδιά στο παιχνίδι). Στόχος της εργασίας είναι η ανάλυση των δεδοµένων µε µεθόδους επαγωγικής κατασκευής πιθανοτικών γραµµατικών που έχουν υλοποιηθεί στο Εργαστήριο µε στόχο τη δηµιουργία µοντέλων ικανοποίησης (ψυχαγωγίας) των παικτών. Γιώργος Γιαννακάκης, τηλ 210-4973184, email: georgios@mip.sdu.dk 2.6 ιαλογικά Συστήµατα Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού, κατά προτίµηση σε Java ή Tcl/Tk. Επιθυµητά προσόντα: Γνώσεις γλωσσικής τεχνολογίας ή/και διαλογικών συστηµάτων. Περιγραφή: Τα τελευταία χρόνια έχει σηµειωθεί σηµαντική πρόοδος στον τοµέα των διαλογικών συστηµάτων ( Σ - dialogue systems) µε γραπτούς και προφορικούς διαλόγους. Ένα σύνηθες διαλογικό σύστηµα (θεωρούµε ότι έχει προηγηθεί αναγνώριση φωνής σε περίπτωση προφορικών διαλόγων) περιλαµβάνει γλωσσικά εργαλεία για κατανόηση της απαίτησης του χρήστη (από πιο απλά που αφορούν τον εντοπισµό λέξεων-κλειδιών έως πιο σύνθετα που αναλύουν συντακτικά, σηµασιολογικά και πραγµατολογικά τις ερωτήσεις/διευκρινίσεις του χρήστη), εργαλεία για τη διαχείριση του διαλόγου που αξιοποιούν ένα διαλογικό µοντέλο για την αναπαράσταση και αποθήκευση των σταδίων του διαλόγου, και εργαλεία για την παραγωγή των αποκρίσεων του συστήµατος. Στόχος της προτεινόµενης εργασίας είναι η χρήση υπαρχόντων εργαλείων για τη δηµιουργία ενός διαλογικού συστήµατος για µια εφαρµογή στην Ελληνική γλώσσα.

ΡΑΣΗ 3. Τεχνολογία Γνώσεων Στόχος της δράσης είναι η έρευνα και ανάπτυξη σε θέµατα αναπαράστασης και διαχείρισης γνώσεων. 3.1 Μέθοδοι βελτίωσης χρονικών οντολογιών για αναγνώριση γεγονότων από δεδοµένα. Επιθυµητά προσόντα: Γνώσεις αναπαράστασης γνώσης και συµπερασµού. Περιγραφή: Στην πλειοψηφία τους οι οντολογίες που χρησιµοποιούνται στην πράξη περιορίζονται σε ιεραρχικές δοµές εννοιών, µε ελάχιστες µη-ιεραρχικές σχέσεις µεταξύ τους. Υπάρχει όµως έντονη ανάγκη αναπαράστασης λιγότερο στατικής γνώσης, όπως χρονικές σχέσεις που χαρακτηρίζουν διαδικασίες και γεγονότα. Στα πλαίσια της εργασίας θα δηµιουργηθεί οντολογία για την αναπαράσταση γεγονότων και θα υλοποιηθεί σύστηµα αναγνώρισης γεγονότων µε βάση την οντολογία. Επίσης, θα υλοποιηθούν µέθοδοι βελτίωσης της οντολογίας µε βάση ένα µικρό σύνολο επισηµειωµένων δεδοµένων. Το τελικό σύστηµα θα αξιολογηθεί σε δεδοµένα ακουστικού σήµατος που αφορούν τραγούδια της καµπούρας φάλαινας. Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr 3.2 Μέθοδος µετασχηµατισµού OWL οντολογίας σε Bayes δίκτυο. Επίπεδο: Προπτυχιακό. Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού σε Java. Επιθυµητά προσόντα: XML, OWL. Περιγραφή: Οι οντολογίες και τα Bayesian δίκτυα αποτελούν µοντέλα για αναπαράσταση ενός τµήµατος του κόσµου που µας ενδιαφέρει ή κάποιου προβλήµατος. Ταυτόχρονα έχουν και αρκετές διαφορές, όπως τον τύπο των σχέσεων που µοντελοποιούν µεταξύ εννοιών ή µεταβλητών. Αντικείµενο της εργασίας είναι ο αυτόµατος µετασχηµατισµός οντολογιών σε Bayesian δίκτυα. Η εργασία περιλαµβάνει τη µελέτη κάποιων βασικών προσεγγίσεων για το σκοπό αυτό καθώς επίσης και την υλοποίηση ενός συστήµατος για τον εν λόγω µετασχηµατισµό. Σε ερευνητικό επίπεδο, στόχος είναι να εξαχθούν κάποια συµπεράσµατα για το κατά πόσο διατηρείται η εκφραστικότητα και η σηµασιολογία της γλώσσας ορισµού οντολογιών OWL κατά το µετασχηµατισµό της οντολογίας σε Bayesian δίκτυο. Ηλίας Ζαβιτσάνος, τηλ. 210-6503216, email: izavits@iit.demokritos.gr 3.3 Μέθοδοι µάθησης της δοµής και των παραµέτρων ενός Bayes δικτύου. Επίπεδο: Προπτυχιακό. Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού σε Java. Επιθυµητά προσόντα: Θεωρία πιθανοτήτων, Bayesian δίκτυα. Περιγραφή: Τα Bayesian δίκτυα είναι πιθανοτικά µοντέλα που επιτρέπουν την γραφική αναπαράσταση ενός προβλήµατος. Η κατασκευή των µοντέλων αυτών αποτελείται από δύο διαδικασίες, όχι απαραίτητα ανεξάρτητες µεταξύ τους: κατασκευή της δοµής του δικτύου,

δηλαδή του γράφου, και συµπλήρωση των πιθανοτήτων µετάβασης µεταξύ των κόµβων. Σκοπός της εργασίας είναι να υλοποιηθεί µία πλατφόρµα µάθησης της δοµής Bayesian δικτύων που θα κάνει χρήση των υπαρχόντων αλγορίθµων µάθησης. Κατόπιν, θα γίνει αξιολόγηση των αλγορίθµων µε πειράµατα που θα εκτελεστούν από διαθέσιµα δεδοµένα και θα εξαχθούν συµπεράσµατα σχετικά µε την αποτελεσµατικότητα των διαφόρων µεθόδων. Ηλίας Ζαβιτσάνος, τηλ. 210-6503216, email: izavits@iit.demokritos.gr 3.4 Σύγκριση µεθοδολογιών για την αναπαράσταση χωροχρονικών χαρακτηριστικών υπολογιστικών συστηµάτων. Απαιτούµενα προσόντα: Οικειότητα µε τεχνικές Τεχνητής Νοηµοσύνης. Επιθυµητά προσόντα: Οικειότητα µε τεχνικές αναπαράστασης γνώσης και συµπερασµού. Περιγραφή: H αναπαράσταση χωρικής και χρονικής γνώσης (spatial and temporal knowledge representation) αποτελεί ενα βασικό αντικείµενο έρευνας στον τοµέα της τεχνητής νοηµοσύνης. Ενδεικτικά παραδείγµατα αποτελούν η έρευνα σε ποιοτικό συµπερασµό χωρικών σχέσεων (qualitative spatial reasoning) και η έρευνα σε γλώσσες δράσης για χρονικό συµπερασµό (action languages), οπως π.χ. ο Λογισµός Καταστάσεων (Situation Calculus) και ο Λογισµός Γεγονότων (Event Calculus). Πρόσφατα, µε την εξέλιξη του Σηµασιολογικού Ιστού, οι χωρικές και χρονικές σχέσεις εκφράζονται στα πλαίσια, µεταξύ άλλων, Οντολογιών αναπαράστασης γεγονότων (Event Ontologies), Οντολογιών αναπαράστασης xωρικών σχέσεων (Spatial Ontologies), Οντολογιών αναπαράστασης χρονικών σχέσεων (Temporal Ontologies), και Χρονικής Περιγραφικής Λογικής (Temporal Description Logics). Ο στόχος της διπλωµατικής εργασίας είναι η σύγκριση παραδοσιακών µεθόδων για αναπαράσταση χωροχρονικής γνώσης µε µεθόδους βασισµένες σε οντολογίες και περιγραφική λογική. Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr 3.5 Σύγκριση µεθοδολογιών για την αναπαράσταση κανόνων κατανεµηµένων και πολυπρακτορικών συστηµάτων. Απαιτούµενα προσόντα: Οικειότητα µε τεχνικές Τεχνητής Νοηµοσύνης. Επιθυµητά προσόντα: Οικειότητα µε τεχνικές αναπαράστασης γνώσης και συµπερασµού. Περιγραφή: Ένα απο τα προβλήµατα που σχετίζονται µε τα κατανεµηµένα υπολογιστικά συστήµατα, όπως συστήµατα Peer-to-Peer, Grid, και Ad Hoc Networks, είναι η διαχείριση πρόσβασης στους πόρους (shared resources) ενός συστήµατος, όπως κύκλοι CPU και αποθηκευτικοί χώροι, οι οποίοι δεν είναι υπο τον έλεγχο ενός κεντρικού διαχειριστή. Σε αυτά τα συστήµατα, πράκτορες, ανθρώπινοι ή υπολογιστικοί, αλληλεπιδρούν δηµιουργώντας ενα Εικονικό Οργανισµό (Virtual Organisation), ο οποίος διέπεται απο ενα σέτ κανόνων (policies) που καθορίζουν τους τρόπους µε τους οποίους ενα µέλος του Εικονικού Οργανισµού µπορεί να έχει πρόσβαση στους πόρους. Μεταξύ άλλων, οι κανόνες Εικονικών Οργανισµών έχουν διατυπωθεί µε: (i) Γλώσσες ράσης απο τον τοµέα της Τεχνητής Νοηµοσύνης (π.χ. Λογισµός Καταστάσεων (Situation Calculus), Λογισµός Γεγονότων (Event Calculus), γλώσσα δράσης C+, γλώσσα δράσης E), και (ii) Οντολογίες και Περιγραφική Λογική (Description Logics). Ο σκοπός της διπλωµατικής είναι η σύγκριση αυτών των δύο τύπων φορµαλισµών για τη διατύπωση κανόνων κατανεµηµένων συστηµάτων. Ενδεικτικά θέµατα προς έρευνα είναι:

Μπορεί ο κάθε φορµαλισµός να εκφράσει τις χρονικές σχέσεις αυτών των δυναµικών συστηµάτων; Υποστηρίζει ο κάθε φορµαλισµος το εύρος των ειδών συµπερασµατολογίας (reasoning tasks) που θέλουµε να εφαρµόσουµε σε διατυπώσεις κανόνων κατανεµηµένων συστηµάτων (π.χ. να υπολογίσουµε ανα πάσα χρονική στιγµή αν είναι επιτρεπτή η πρόσβαση σε ενα πόρο, αν είναι υποχρεωµένος ο τοπικός διαχειριστής του πόρου να παρέχει πρόσβαση στον πόρο, ποιές είναι οι ποινές που σχετίζονται µε την µη εφαρµογή ορισµένων κανόνων, κλπ); Αλέξανδρος Αρτίκης, τηλ. 210-6503217, email: a.artikis@iit.demokritos.gr 3.6 Μηχανική Μάθηση Προγραµµάτων Λογικών Περιγραφής Απαιτούµενα προσόντα: Γνώσεις Υπολογιστικής Λογικής και Προγραµµατισµού σε Prolog. Επιθυµητά προσόντα: Γνώσεις Μηχανικής Μάθησης και Επαγωγικού Λογικού Προγραµµατισµού. Περιγραφή: Οι Λογικές Περιγραφής (Description Logics) είναι µια οικογένεια λογικών πρώτης τάξης µε εφαρµογές στη ιαχείριση Γνώσης και τον Σηµασιολογικό Ιστό. Καθώς παρουσιάζουν κάποιες ιδιαιτερότητες σε σχέση µε την Λογική Horn που αποτελεί το σύνηθες πεδίο του Επαγωγικού Λογικού Προγραµµατισµού, το µοντέλο του τελευταίου θα πρέπει να διαµορφωθεί για να βρει εφαρµογή στην µηχανική µάθηση προγραµµάτων Λογικών Περιγραφής. Στο Εργαστήριο έχουµε ξεκινήσει έρευνα προς αυτή την κατεύθυνση. Στόχος της εργασίας είναι η ανάπτυξη και ο έλεγχος κάποιων από τις µεθόδους µηχανικής µάθησης που προκύπτουν από αυτή την προσπάθεια. Στασινός Κωνσταντόπουλος, τηλ. 210-6503162, e-mail: konstant@iit.demokritos.gr 3.7 Υποστήριξη διαχείρισης οντολογιών µέσω της πλατφόρµας γλωσσικής τεχνολογίας Ellogon Απαιτούµενα προσόντα: Γνώσεις προγραµµατισµού σε Tcl/Tk ή C/C++ Επιθυµητά προσόντα: Γνώσεις διαχείρισης οντολογιών και/ή γλωσσικής τεχνολογίας. Περιγραφή: Το Εργαστήριο έχει αναπτύξει την πλατφόρµα γλωσσικής τεχνολογίας Ellogon (http://www.ellogon.org ) µε στόχο να παρέχει την απαραίτητη υποδοµή για την υποστήριξη ανάπτυξης γλωσσικών εργαλείων (π.χ. µορφολογικοί αναλυτές, συντακτικοί αναλυτές), γλωσσικών πόρων (λεξικά, γραµµατικές), εφαρµογών γλωσσικής τεχνολογίας (π.χ. ταξινόµηση κειµένων, εξαγωγή πληροφορίας, παραγωγή περιλήψεων). Επειδή πολλές εφαρµογές γλωσσικής τεχνολογίας χρησιµοποιούν οντολογίες για την αναπαράσταση των εννοιών µιας θεµατικής περιοχής και των βασικών σχέσεων που τις διέπουν (π.χ. σε µια εφαρµογή εξαγωγής πληροφορίας από ιστοσελίδες µε προσφορές εργασίας η οντολογία περιέχει έννοιες όπως εταιρεία, τοποθεσία, αντικείµενο εργασίας, κλπ.) είναι πολύ χρήσιµη η δυνατότητα άµεσης διαχείρισης οντολογιών από µία πλατφόρµα όπως το Ellogon. Σκοπός της εργασίας αυτής είναι η διασύνδεση του Ellogon µε υπάρχοντα συστήµατα διαχείρισης οντολογιών έτσι ώστε µέσω του Ellogon ο χρήστης να µπορεί να αξιοποιεί τα εργαλεία που παρέχουν αυτά τα συστήµατα σύµφωνα και µε τις ανάγκες των εφαρµογών γλωσσικής τεχνολογίας που αναπτύσσει στο Ellogon.

3.8 Mεθοδολογίες δοµηµένης αναπαράστασης κειµένου και εφαρµογές στην τεχνολογία γνώσεων. Επίπεδο: Μεταπτυχιακό. Επιθυµητά προσόντα: Γνώσεις δοµών δεδοµένων, µηχανικής µάθησης ή/και γλωσσικής τεχνολογίας. Περιγραφή: Για την αναπαράσταση κειµένων χρησιµοποιούνται συχνά δοµηµένες µέθοδοι, όπως ιεραρχικές ή γραφικές αναπαραστάσεις. Σκοπός της εργασίας είναι να αξιολογηθεί η χρησιµότητα των παραπάνω αναπαραστάσεων στο πλαίσιο της εξαγωγής γνώσης από κείµενα, αλλά και της χρησιµοποίησής τους για τον εµπλουτισµό µίας οντολογίας που να περιγράφει τη σηµασιολογία του κειµένου. Γιώργος Γιαννακόπουλος τηλ. 21-06503216, email: ggianna@iit.demokritos.gr