ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΓΛΩΣΣΩΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ & ΤΕΧΝΟΛΟΓΙΑΣ ΛΟΓΙΣΜΙΚΟΥ ιπλωµατικές 2011-2012 των κ.κ. Βλαχάβα, Βασιλειάδη, Βράκα και Τσουµάκα Θέµατα κ. Ι. Βλαχάβα 1. Πρόβλεψη Σηµείων Συρραφής σε Βιολογικές Αλληλουχίες Αντικείµενο της Μοριακής Βιολογίας είναι η µελέτη της δοµής και της λειτουργίας των βιολογικών µακροµορίων, όπως του DNA, του RNA, των πρωτεϊνών κ.α. Τα µόρια αυτά αποτελούνται από µικρότερα µόρια τα οποία, ενωµένα µεταξύ τους, δηµιουργούν µια αλληλουχία. Οι αλληλουχίες αυτές αποτελούν ένα µεγάλο µέρος των διαθέσιµων βιολογικών δεδοµένων που απαιτούν τη χρήση υπολογιστικών µεθόδων για την ανάλυσή τους. Παρά την ταχύτατη εξέλιξη που γνωρίζει η έρευνα στη συγκεκριµένη περιοχή, η διαθέσιµη γνώση παραµένει περιορισµένη. Κατά συνέπεια, η χρήση τεχνικών που θα συµβάλλουν στην ανάλυση των δεδοµένων αυτών κρίνεται απαραίτητη. Το DNA κωδικοποιεί τα µόρια των πρωτεϊνών που είναι υπεύθυνα για τη δοµή και τη λειτουργία των οργανισµών. Κατά τη διαδικασία της ροής της γενετικής πληροφορίας από το DNA στις πρωτεΐνες λαµβάνουν µέρος κάποιες διαδικασίες. Μία από αυτές περιλαµβάνει την αποµάκρυνση των τµηµάτων των αλληλουχιών που περιέχουν «άχρηστη» πληροφορία και τη συρραφή των υπόλοιπων τµηµάτων. Η συγκεκριµένη διαδικασία συνδέεται µε τον καρκίνο. Σκοπός της διπλωµατικής εργασίας είναι να µελετηθεί η συγκεκριµένη περιοχή και να εφαρµοστούν διάφορες τεχνικές για την πρόβλεψη των σηµείων συρραφής σε ένα σύνολο βιολογικών αλληλουχιών. Για το σκοπό αυτό θα µελετηθεί η σχετική βιβλιογραφία και θα σχεδιαστούν και εκτελεστούν πειράµατα σε συγκεκριµένο σύνολο δεδοµένων. 2. Εφαρµογή Τεχνικών Μηχανικής Μάθησης σε Ηλεκτρονικά Παιχνίδια Σκοπός της διπλωµατικής είναι η επιτυχής εφαρµογή τεχνικών Μηχανικής Μάθησης, σε ένα ηλ. παιχνίδι. Συγκεκριµένα, θα υλοποιηθεί ευφυής πράκτορας για το ηλ. παιχνίδι Super Mario Bros που θα έχει επιπλέον την δυνατότητα µεταφοράς γνώσης από κάθε πίστα του παιχνιδιού στην επόµενη. Το περιβάλλον του πράκτορα θα βασιστεί σε έτοιµη υλοποίηση του πεδίου Super Mario Bros (http://2009.rl-competition.org/mario.php). Επιτυχή αποτελέσµατα από την παραπάνω υλοποίηση µπορεί να οδηγήσουν σε υποβολή εργασίας σε συνέδριο ή περιοδικού του χώρου. Απαιτούµενα Προσόντα: γνώσεις προγραµµατισµού σε Java ή C/C++
Θέµατα κ. Ν. Βασιλειάδη 3. Ανάπτυξη ιεπαφής µε Πράκτορα Σηµασιολογικού Ιστού σε Φυσική Γλώσσα Σκοπός της εργασίας είναι η ανάπτυξη µιας διεπαφής ιστού (Web interface) η οποία θα βασίζεται σε φυσική γλώσσα (αγγλικά) για την επικοινωνία και τον χειρισµό ενός Πράκτορα Σηµασιολογικού Ιστού, ο οποίος θα µπορεί να επικοινωνεί µε το πρωτότυπο σύστηµα οργάνωσης συνεδρίων Symposium Planner (http://ruleml.org/symposiumplanner/). Το σύστηµα αυτό αποτελεί µια ενδεικτική εφαρµογή µιας ανοιχτής αρχιτεκτονικής διασύνδεσης πρακτόρων του Σηµασιολογικού Ιστού (Rule Responder - http://ruleml.org/ruleresponder/), η οποία στηρίζει την ανταλλαγή µηνυµάτων, ερωτηµάτων, πληροφοριών και γνώσης µεταξύ των πρακτόρων στην διαδικτυακή γλώσσα κανόνων RuleML (http://ruleml.org). Η διεπαφή που θα αναπτυχθεί θα επιτρέψει την διατύπωση ερωτηµάτων σε φυσική γλώσσα από κάποιο φυσικό πρόσωπο προς τους πράκτορες που είναι επιφορτισµένοι να συνδράµουν τους διοργανωτές του συνεδρίου, προκειµένου να αντλήσουν πληροφορίες σχετικές µε το συνέδριο ή να επιλύσουν κάποιο πρόβληµα σχετικό µε το συνέδριο. Η εφαρµογή υφίσταται ήδη στη διεύθυνση http://ruleml.org/ruleml-2010/ruleresponder/ruleresponder.htm και σκοπός της διεπαφής θα είναι η µετατροπή των ερωτηµάτων φυσικής γλώσσας σε ερωτήµατα στη γλώσσα RuleML, όπως αυτά που υπάρχουν ήδη στην παραπάνω σελίδα. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: Java, Attempto Controlled English (ACE) 4. Σηµασιολογική ιαχείριση και Αναζήτηση Αρχείων Σκοπός της εργασίας είναι η ανάπτυξη µιας εφαρµογής ιστού (Web application) για τη σηµασιολογική διαχείριση διαφόρων αρχείων που θα «ανεβάζουν» οι χρήστες, π.χ. αρχεία εικόνας, µουσικής, Word, Excel, PDF κτλ. Η σηµασιολογική διαχείριση των αρχείων θα επιτυγχάνεται µε την κατάταξη των αρχείων σε έννοιες οντολογιών (OWL, RDF) και τη χρήση συστηµάτων συλλογιστικής για τη διαχείριση της σηµασιολογίας. Οι χρήστες θα πρέπει να είναι σε θέση να αναζητήσουν αρχεία βάσει της σηµασιολογίας τους, εκτελώντας σηµασιολογικά ερωτήµατα µε τη γλώσσα ερωτηµάτων SPARQL. Η εργασία απευθύνεται σε ένα άτοµο. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: Πολύ καλή γνώσης κάποιας τεχνολογίας ανάπτυξης εφαρµογών ιστού κατά προτίµηση σε Java (JSF, GWT), Protégé για την ανάπτυξη των οντολογιών, χρήση συστήµατος συλλογιστικής για οντολογίες (Pellet, Jena), εξοικείωση µε τη γλώσσα ερωτηµάτων SPARQL. 5. Μετατροπή κανόνων RIF-PRD σε κανόνες COOL στο σύστηµα CLIPS Η RIF-PRD είναι µια προσπάθεια προτυποποίησης των γλωσσών κανόνων παραγωγής στο Σηµασιολογικό Ιστό µε τη χρήση XML. Ο σκοπός της διπλωµατικής είναι η ανάπτυξη µιας διαδικασίας µετατροπής κανόνων RIF-PRD σε κανόνες του συστήµατος παραγωγής CLIPS, οι οποίοι θα κάνουν χρήση της αντικειµενοστραφούς γλώσσας COOL. Η εργασία απαιτεί τη µελέτη όλων των δοµών / συναρτήσεων που υποστηρίζονται από την RIF-PRD και την αντιστοίχισή τους (εάν και εφόσον είναι δυνατή) σε κατάλληλες δοµές / συναρτήσεις της γλώσσας κανόνων του CLIPS/COOL. Η εργασία απευθύνεται σε ένα άτοµο. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: XSLT για τον ορισµό της διαδικασίας µετατροπής, XML editor (π.χ. Altova XML Spy) για τη δηµιουργία του XSLT αρχείου, CLIPS για την εκτέλεση των προγραµµάτων κανόνων.
6. Ανάπτυξη Μοντέλου ιαχείρισης Εµπιστοσύνης βασισµένου στην αναιρέσιµη λογική Η σηµαντική ανάπτυξη πολύ-πρακτορικών συστηµάτων (MAS) στο Σηµασιολογικό Ιστό (Semantic Web) έχει καταστήσει αναγκαία την ανάπτυξη µηχανισµών εµπιστοσύνης (trust) που θα διέπουν τις συναλλαγές µεταξύ των ευφυών πρακτόρων. Στόχος της εργασίας είναι η ανάπτυξη ενός νέου µοντέλου εµπιστοσύνης που θα βασίζεται στη χρήση κανόνων αναιρέσιµης λογικής (Defeasible Logic). Η αναιρέσιµη λογική είναι µία προσέγγιση βασισµένη σε κανόνες και έχει τις ρίζες της στο Λογικό Προγραµµατισµό. Ουσιαστικά, είναι µία προσπάθεια χειρισµού ελλιπούς και ασυνεπούς γνώσης. Η βασική ιδέα των συστηµάτων αυτών ήταν η δυνατότητα χειρισµού επιπρόσθετων χαρακτηριστικών όπως η επιβολή προτεραιότητας στην εκτέλεση κανόνων, η κληρονοµικότητα και οι εξαιρέσεις. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: Java, Defeasible logic. ( εν απαιτείται γνώση ευφυών πρακτόρων) 7. ιαπραγµάτευση ebusiness/ecommerce Συµβολαίων µέσω Ανταλλαγής Κανόνων ανάµεσα σε Ευφυείς Πράκτορες στο Σηµασιολογικό Ιστό Με την ανάπτυξη του Σηµασιολογικού Ιστού (Semantic Web), οι γλώσσες κανόνων (rulelanguages) και τα συστήµατα κανόνων (rule-based systems) αποτελούν σηµαντικό τοµέα έρευνας. Στόχος της εργασίας είναι η γενικότερη µελέτη του χώρου των ebusiness/ecommerce συµβολαίων και η υλοποίηση ενός επιλεγµένου σεναρίου διαπραγµάτευσης βασισµένου σε ένα πρότυπο (πέντε - σταδίων) διαπραγµάτευσης που έχει µελετηθεί από την ερευνητική οµάδα LPIS. Συγκεκριµένα στην υλοποίηση θα ακολουθηθεί η προτεινόµενη µεθοδολογία διεξαγωγής της διαπραγµάτευσης, έτσι ώστε τα δύο µέρη να διαπραγµατευτούν την προµήθεια και την πώληση αντίστοιχα ενός αριθµού προϊόντων. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: RuleML, XML, RDF. 8. Αναπαράσταση Πρωτοκόλλων Αλληλεπίδρασης Πρακτόρων της FIPA στην Πρότυπη Γλώσσα Ανταλλαγής Κανόνων Reaction-RuleML Η FIPA (Foundation for Intelligent Physical Agents) είναι ο οργανισµός προτυποποίησης για τους πράκτορες και την τεχνολογία τους και η Reaction-RuleML (XML-serialized) είναι µια γενική γλώσσα ενεργών κανόνων και κανόνων παραγωγής, που έχει ως σκοπό την προτυποποίηση και την ανταλλαγή των κανόνων στον παγκόσµιο ιστό. Στόχος της εργασίας είναι κατ αρχήν η µελέτη της γλώσσας Reaction-RuleML και ορισµένων πρωτοκόλλων αλληλεπίδρασης πρακτόρων που έχουν προτυποποιηθεί από την FIPA και στη συνέχεια η µετατροπή των πρωτοκόλλων αυτών σε σύνολα (προγράµµατα) κανόνων της γλώσσας Reaction-RuleML. Τα πρωτόκολλα αυτά ενδέχεται να δοκιµασθούν σε σενάρια αλληλεπίδρασης πάνω σε µία καινοτόµα πλατφόρµα ανάπτυξης ευφυών πρακτόρων που έχει αναπτυχθεί από την ερευνητική οµάδα LPIS. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: Reaction-RuleML, προαιρετικά πλατφόρµα EMERALD. 9. Γραφικό περιβάλλον συγγραφής κανόνων Jess µε ενσωµάτωση δοµών της γλώσσας ACL Η γλώσσα Jess (Clips-like rule language) είναι µια ισχυρή γλώσσα κανόνων και η ACL (Agent Communication Language) είναι µια πρότυπη γλώσσα επικοινωνίας για τα συστήµατα πολλαπλών πρακτόρων. Στόχος της εργασίας είναι κατ αρχήν η µελέτη ενός υποσυνόλου των χαρακτηριστικών των γλωσσών Jess και ACL και στη συνέχεια η υλοποίηση ενός γραφικού περιβάλλοντος συγγραφής κανόνων JESS µε δυνατότητα αποστολής µηνυµάτων ACL, στο
σύστηµα πολλαπλών πρακτόρων (π. χ. JADE). Συγκεκριµένα, θα πρέπει κατά τη συγγραφή κανόνων στη γλώσσα Jess να δίνεται η δυνατότητα ενσωµάτωσης συγκεκριµένων χαρακτηριστικών της γλώσσας ACL εκφρασµένων σε Jess. Για το σκοπό αυτό είναι πιθανή η επέκταση του JessDE, γραφικού περιβάλλοντος συγγραφής κανόνων Jess, το οποίο παρέχεται ως plugin του IDE Eclipse. Εργαλεία / Τεχνολογίες που θα χρησιµοποιηθούν: Jess, JAVA. Θέµατα κ. Γ. Τσουµάκα 10. Υλοποίηση και συγκριτική πειραµατική αξιολόγηση επαυξητικών αλγορίθµων κατηγοριοποίησης δεδοµένων πολλαπλών ετικετών (incremental multi-label classification) Η ανάπτυξη αλγορίθµων κατηγοριοποίησης δεδοµένων τα οποία µπορεί να ανήκουν ταυτόχρονα σε παραπάνω από µία κατηγορίες έχει γνωρίσει εξαιρετική άνθηση τα τελευταία χρόνια εξαιτίας της πληθώρας των εφαρµογών που έχουν να κάνουν µε την αυτόµατη επισήµανση δεδοµένων πολλαπλών ετικετών όπως εικόνες, ειδησεογραφικά άρθρα, µουσικά κοµµάτια κ.α. Στην παρούσα διπλωµατική θα εστιάσουµε σε αλγορίθµους µάθησης πολλαπλών ετικετών οι οποίοι θα έχουν τη δυνατότητα να διαχειριστούν πολύ µεγάλο όγκο δεδοµένων, να παράγουν προβλέψεις σε πραγµατικό χρόνο και να προσαρµόζονται σε τυχόν αλλαγές της κατανοµής των δεδοµένων. Ιδιαίτερο βάρος θα δοθεί στην υλοποίηση ή/και επέκταση αλγορίθµων από τη διεθνή βιβλιογραφία και την πειραµατική τους αξιολόγηση. Η διπλωµατική αναµένεται να οδηγήσει σε δηµοσίευση. Απαραίτητα προσόντα: Καλή γνώση Java, Αγγλικών. Επιθυµητά προσόντα: Γνώση του weka. 11. Αυτόµατος Χαρακτηρισµός Τραγουδιών βάσει Στίχων και Ακουστικών εδοµένων Η παρούσα διπλωµατική στοχεύει στην ανάπτυξη ενός συστήµατος αυτόµατης ταξινόµησης τραγουδιών, βάσει τόσο του στίχου τους όσο και µουσικών χαρακτηριστικών τους. Θα διεξαχθεί έρευνα κυρίως για τον καλύτερο δυνατό συνδυασµό των δύο αυτών διαφορετικών ειδών πληροφορίας (modalities), ενώ άλλα θέµατα που µπορούν να µας απασχολήσουν είναι η αξιοποίηση πιθανών συσχετίσεων µεταξύ των χαρακτηρισµών (ετικετών) των τραγουδιών και η καλή κλιµάκωση της εκπαίδευσης/χρήσης του συστήµατος σε µεγάλα σύνολα τραγουδιών και χαρακτηρισµών. 12. Εξόρυξη γνώµης (opinion mining) από κριτικές προϊόντων σε καταστήµατα ηλεκτρονικού εµπορίου. Η παρούσα διπλωµατική στοχεύει στην ανάπτυξη µίας καινοτόµας εφαρµογής η οποία θα έχει τη δυνατότητα εξόρυξης γνώµης από κριτικές προϊόντων. Συγκεκριµένα θα µελετηθεί η βασισµένη στα χαρακτηριστικά εξόρυξη γνώµης (feature/aspect-based opinion mining) η οποία αφορά την αναγνώριση απόψεων ή συναισθηµάτων τα οποία εκφράζονται για συγκεκριµένες πτυχές-χαρακτηριστικά ενός αντικειµένου-προϊόντος, π.χ. την οθόνη ενός κινητού τηλεφώνου. Ιδιαίτερο βάρος θα δοθεί στην υλοποίηση ή/και επέκταση ενός αλγορίθµου από τη διεθνή βιβλιογραφία και η ενσωµάτωσή του στην εφαρµογή. Απαραίτητα προσόντα: Πολύ καλή γνώση Java. Επιθυµητά προσόντα: Γνώση SWING.
Θέµατα κ.. Βράκα 13. Ανάπτυξη Γραφικού Εργαλείου Απεικόνισης και Συγγραφής Προβληµάτων Ιεραρχικού Σχεδιασµού ικτύων ιεργασιών (HTN) Η διπλωµατική εργασία περιλαµβάνει την µελέτη του συστήµατος VLEPPO και την επέκταση του σε προβλήµατα Ιεραρχικού Σχεδιασµού ικτύων ιεργασιών (Hierarchical Task Network Planning). Το εργαλείο που θα αναπτυχθεί θα πρέπει να δίνει στον χρήστη τη δυνατότητα γραφικής απεικόνισης προβληµάτων σχεδιασµού (HTN), τη σύνθεση νέων προβληµάτων, χρησιµοποιώντας έτοιµα συστατικά και παλιά προβλήµατα, καθώς και την επίλυση τους χρησιµοποιώντας κάποιον εξωτερικό HTN σχεδιαστή. Απαιτείται γνώση των αρχών του Σχεδιασµού Ενεργειών και καλή γνώση της γλώσσας προγραµµατισµού Java. 14. Ανάπτυξη Γραφικού Εργαλείου Συγγραφής Μεταδεδοµένων για Υπηρεσίες του Παγκόσµιου Ιστού (Web Services) σε OWL-S Η διπλωµατική εργασία περιλαµβάνει την ανάπτυξη ενός γραφικού, φιλικού προς τον χρήστη, εργαλείου συγγραφής αρχείων µε µεταδεδοµένα που να περιγράφουν την λειτουργία υπηρεσιών του παγκοσµίου ιστού. Το εργαλείο θα πρέπει να επιτρέπει στον χρήστη να δηµιουργεί περιγραφές σε OWL-S, που αποτελεί τη γλώσσα περιγραφής υπηρεσιών ιστού. Το εργαλείο θα πρέπει να δίνει τη δυνατότητα στο χρήστη να επιλέγει στοιχεία από έτοιµες οντολογίες γραµµένες σε γλώσσα OWL, µε γραφικό τρόπο. Θα πρέπει να µελετηθεί η δυνατότητα ανάπτυξης του εργαλείου ως πρόσθετο συστατικό στο σύστηµα Protégé. Απαιτούνται γνώση των αρχών του Σχεδιασµού Ενεργειών και του Σηµασιολογικού Ιστού και καλή γνώση της γλώσσας προγραµµατισµού Java. Η διπλωµατική εργασία θα συνεπιβλέπεται από τον κ. Νικόλαο Βασιλειάδη. 15. Ανάπτυξη ιαδικτυακής Εφαρµογής Σύνθεσης Εκπαιδευτικών Προγραµµάτων Η διπλωµατική εργασία περιλαµβάνει την ανάπτυξη ενός γραφικού, φιλικού προς τον χρήστη συστήµατος διαχείρισης µεταδεδοµένων για εκπαιδευτικό υλικό και αυτοµατοποιηµένης σύνθεσης εκπαιδευτικών προγραµµάτων. Η εφαρµογή θα πρέπει να υποστηρίζει τις δυνατότητες προσθήκης: α) µεταδεδοµένων για εκπαιδευτικό υλικό (IMS Learning Object Metadata), β) Προφίλ χρηστών (εκπαιδευόµενων) µε τις προσωπικές τους ρυθµίσεις, δυνατότητες, επιθυµίες (IMS Learner Information Package), επιλογής εκπαιδευτικών στόχων από µία ταξονοµία αντικειµένων και σύνθεσης εκπαιδευτικών προγραµµάτων, µέσω έτοιµων συστηµάτων σχεδιασµού ενεργειών. Απαιτούνται γνώση των αρχών του Σχεδιασµού Ενεργειών, και καλή γνώση της γλώσσας προγραµµατισµού Java. 16. Ανάπτυξη Εφαρµογής Παράλληλου Προγραµµατισµού για εκτέλεση στους επεξεργαστές καρτών γραφικών Η διπλωµατική εργασία περιλαµβάνει την µελέτη αξιοποίησης των µονάδων επεξεργασίας των σύγχρονων καρτών γραφικών (Graphics Processing Units), για την ανάπτυξη παράλληλων αλγορίθµων. Οι σύγχρονες κάρτες γραφικών περιλαµβάνουν έναν µεγάλο αριθµό από επεξεργαστές που µπορούν να εκτελούν παράλληλα σύνολα εντολών πάνω σε δεδοµένα, σύµφωνα µε την αρχιτεκτονική SIMD. Στα πλαίσια της διπλωµατικής θα πρέπει να µελετηθούν οι τρόποι αξιοποίησης των GPU για την ανάπτυξη παράλληλων προγραµµάτων. Πέρα από την καταγραφή των δυνατοτήτων και των περιορισµών θα πρέπει να υλοποιηθεί και ένας παράλληλος αλγόριθµος (πιθανότητα αναζήτησης), ώστε να µελετηθεί και πειραµατικά το κέρδος από την αξιοποίηση των GPU. Απαιτείται πολύ καλή γνώση προγραµµατισµού σε C, C++ ή JAVA.
17. Ανάπτυξη Εργαλείου Συγγραφής (Editor) αρχείων PDDL Η πτυχιακή εργασία περιλαµβάνει την ανάπτυξη ενός εργαλείου συγγραφής (editor) για τη γλώσσα PDDL (Planning Domain Definition Language), που χρησιµοποιείται στο Σχεδιασµό Ενεργειών. Το εργαλείο θα πρέπει να δίνει στον χρήστη τη δυνατότητα συγγραφής νέων αρχείων πεδίου και προβληµάτων, προσφέροντας του ευκολίες, όπως το keyword highlighting, την αναγνώριση δοµών, την αυτόµατη συµπλήρωση, την επικύρωση της ορθότητας κ.α. Απαιτείται καλό υπόβαθρο γνώσεων σε ΤΝ και πολύ καλή γνώση προγραµµατισµού σε JAVA. Οι ενδιαφερόµενοι µπορούν να επικοινωνούν µε τoν αντίστοιχο διδάσκοντα. Περισσότερες λεπτοµέρειες για τα ερευνητικά ενδιαφέροντα των οµάδων ευφυών συστηµάτων και επεξεργασίας γνώσης (ISKP) και µηχανικής µάθησης και ανακάλυψης γνώσης (MLKD) θα βρείτε στις διευθύνσεις http://iskp.csd.auth.gr και http://mlkd.csd.auth.gr αντίστοιχα.