ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΓΛΩΣΣΩΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ & ΤΕΧΝΟΛΟΓΙΑΣ ΛΟΓΙΣΜΙΚΟΥ Διπλωματικές 2006-2007 των κ. Ι. Βλαχάβα και Ν. Βασιλειάδη Επιβλέπων: Ι. Βλαχάβας 1. Ανακάλυψη γνώσης στον τομέα του αθλητισμού Ο στόχος αυτής της διπλωματικής εργασίας είναι η ανάπτυξη μια εφαρμογής σε Java, η οποία θα υποστηρίζει μία από τις παρακάτω δραστηριότητες: α) Ανάλυση στατιστικών δεδομένων από διεξαχθέντες αγώνες ενός αθλητικού συλλόγου, με στόχο την υποβοήθηση προπονητή (επιλογή συστήματος ή στρατηγικής, εντοπισμός αποδοτικών και προβληματικών συνθέσεων, πρόβλεψη στρατηγικής αντιπάλου, επιλογή αποδοτικών και προβληματικών θέσεων των αθλητών). β) Ανάλυση δεδομένων σχετικά με τις πωλήσεις (αριθμός εισιτηρίων, στοιχεία αγοραστών, κτλ) και την στρατηγική διαφήμισης ενός αθλητικού συλλόγου, με στόχο την αύξηση των πωλήσεων εισιτηρίων. Ο φοιτητής/ρια θα ασχοληθεί με: α) την ανάγνωση της βιβλιογραφίας σχετικά με την εφαρμογή τεχνικών μηχανικής μάθησης και ανακάλυψης γνώσης στον τομέα του ομαδικού αθλητισμού από πηγές που θα του/της δοθούν αλλά και θα βρει ο ίδιος / η ίδια, β) την εύρεση ή συλλογή κατάλληλων δεδομένων που αφορούν τις παραπάνω δραστηριότητες, γ) την ανάπτυξη μιας εφαρμογής μέσω της οποίας ο χρήστης (προπονητής, υπεύθυνος διαφημιστικού), θα μπορεί να εισάγει δεδομένα και να βλέπει τα αποτελέσματα της ανάλυσης. Η εφαρμογή θα χρησιμοποιεί έτοιμους αλγορίθμους μάθησης από την βιβλιοθήκη WEKA και επομένως δεν απαιτείται η υλοποίηση αλγορίθμων μάθησης. 2. Αυτόματη κατηγοριοποίηση κειμένων με χρήση τεχνικών μηχανικής μάθησης Στις μέρες μας έχει διαπιστωθεί ότι η μεγαλύτερη ποσότητα πληροφορίας βρίσκεται σε μορφή κειμένου. Σε αυτό συνετέλεσε φυσικά η ραγδαία ανάπτυξη του παγκόσμιου ιστού. Δημιουργήθηκε έτσι η απαίτηση για ανάπτυξη νέων, «έξυπνων» τεχνικών που θα βοηθήσουν στη διαχείριση και την ανακάλυψη γνώσης από όλη αυτή τη πληροφορία. Η μηχανική μάθηση έχει συμβάλει στη λύση του προβλήματος προσφέροντας εφαρμογές όπως η αυτόματη κατηγοριοποίηση κειμένων, η ιεραρχική ομαδοποίηση σελίδων του διαδικτύου, ο διαχωρισμός των spam μηνυμάτων κ.α. Στόχος της διπλωματικής είναι η εκτενής αξιολόγηση τεχνικών κατηγοριοποίησης κειμένων. Για το σκοπό αυτό, απαραίτητο είναι το βήμα της κατασκευής συνόλων δεδομένων (datasets) από διάφορες συλλογές κειμένων. Η προ-επεξεργασία αυτή είναι αναγκαία για τη μετατροπή της απλής, αδόμητης, μορφής ενός κειμένου σε μία πιο «κατανοητή», δομημένη, μορφή για τους αλγορίθμους της μηχανικής μάθησης..
3. Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αντικείμενο της Μοριακής Βιολογίας είναι η μελέτη της δομής και της λειτουργίας των βιολογικών μακρομορίων, όπως του DNA, του RNA και των πρωτεϊνών. Τα μόρια αυτά αποτελούνται από μικρότερα μόρια τα οποία, ενωμένα μεταξύ τους, δημιουργούν αλληλουχίες. Οι αλληλουχίες αυτές αποτελούν ένα μεγάλο μέρος των διαθέσιμων βιολογικών δεδομένων που απαιτούν τη χρήση υπολογιστικών μεθόδων για την ανάλυσή τους. Ένα από τα κρισιμότερα προβλήματα είναι ο εντοπισμός των γονιδίων στις αλληλουχίες αυτές. Ο προσδιορισμός των γονιδίων ωστόσο απαιτεί τον ακριβή προσδιορισμό κάποιων λειτουργικών περιοχών (τμημάτων στις αλληλουχίες), οπότε το αρχικό πρόβλημα μπορεί να υποδιαιρεθεί σε επιμέρους προβλήματα. Σκοπός της διπλωματικής εργασίας είναι: α) Η μελέτη του παραπάνω προβλήματος. Ο φοιτητής/ρια θα χρησιμοποιήσει υλικό που θα του δοθεί αλλά θα αναζητήσει και ο ίδιος/ίδια. β) Η εφαρμογή τεχνικών ανακάλυψης γνώσης σε σύνολο βιολογικών αλληλουχιών και η καταγραφή-σχολιασμός των αποτελεσμάτων. Απαιτήσεις: Ικανοποιητική γνώση της αγγλικής γλώσσας 4. Σύστημα Ανάλυσης Βιολογικών Αλληλουχιών Έπειτα από την ολοκλήρωση μεγάλων ερευνητικών προγραμμάτων (π.χ. Πρόγραμμα Αποκρυπτογράφησης Ανθρώπινου Γονιδιώματος) υπάρχει διαθέσιμη μία πληθώρα δεδομένων. Η χρήση τεχνικών για την ανάλυση αυτών των δεδομένων (π.χ. βιολογικών αλληλουχιών) κρίνεται απαραίτητη. Η εργασία περιλαμβάνει την ανάπτυξη συστήματος με γραφικό περιβάλλον διασύνδεσης για την εφαρμογή μεθόδων μηχανικής μάθησης και ανακάλυψης γνώσης από βιολογικές αλληλουχίες. Η υλοποίηση του συστήματος θα γίνει σε Java, ώστε να είναι δυνατή η ενσωμάτωση έτοιμων βιβλιοθηκών αλγορίθμων όπως του Weka. Σκοπός της εργασίας είναι να υλοποιηθεί ένα μέρος από τις βασικές λειτουργίες του συστήματος στις οποίες περιλαμβάνεται: H μετατροπή των διαθέσιμων δεδομένων (αλληλουχιών) στην κατάλληλη μορφή για να είναι δυνατή η επεξεργασία τους από το σύστημα. Η επιλογή πληθώρας παραμέτρων και αλγορίθμων, οι οποίοι θα ενσωματωθούν από έτοιμες βιβλιοθήκες, για την εκτέλεση πειραμάτων. Η επεξεργασία και ερμηνεία των πειραματικών αποτελεσμάτων. Η αξιοποίηση των τεχνολογιών Grid (http://www.hellasgrid.gr/). Η εργασία θα βασιστεί και θα επεκτείνει υπάρχοντα κώδικα γραμμένο σε Java. 5. Ανάπτυξη πλατφόρμας για τη συλλογή ιστοσελίδων από τον παγκόσμιο ιστό Η εργασία έχει ως στόχο την ανάπτυξη λογισμικού για τη συλλογή και επεξεργασία ιστοσελίδων από τον παγκόσμιο ιστό. Στόχος είναι η κατασκευή συνόλου δεδομένων για συγκεκριμένες θεματικές περιοχές (π.χ. ποδόσφαιρο, μουσική) και η περαιτέρω επεξεργασία τους όπως καθαρισμός των ιστοσελίδων από μη ενεργούς συνδέσμους, αφαίρεση μή html ιστοσελίδων, εξαγωγή του κειμένου και η αναπαράστασή τους στο διανυσματικό μοντελοχώρο (vector space model). Η εφαρμογή θα χρησιμοποιεί έτοιμους αλγορίθμους μάθησης από την βιβλιοθήκη WEKA καθώς και συναρτήσεις απο το API του Google.
6. Τρισδιάστατο Περιβάλλον Απεικόνισης και Δημιουργίας Προβλημάτων Σχεδιασμού Ενεργειών Δημιουργία μιας εφαρμογής με τρισδιάστατα γραφικά για την απεικόνιση και την σύνθεση νέων προβλημάτων Σχεδιασμού Ενεργειών, συγκεκριμένης οικογένειας προβλημάτων (π.χ. λαβύρινθος). Η εφαρμογή θα δίνει τη δυνατότητα στον χρήστη να συνθέτει νέα προβλήματα με εύχρηστο γραφικό τρόπο και στη συνέχεια θα καλεί ένα εξωτερικό σύστημα σχεδιασμού ώστε να πάρει τη λύση και να την αναπαραστήσει μέσω animation. Η εργασία περιλαμβάνει χρήση των βιβλιοθηκών Java3D. 7. Έρευνα και Συγκριτική Μελέτη Συστημάτων Σχεδιασμού Η διπλωματική εργασία περιλαμβάνει την συλλογή και την κατηγοριοποίηση των σύγχρονων συστημάτων σχεδιασμού, που έλαβαν μέρος στους διεθνείς διαγωνισμούς σχεδιασμού και την ποιοτική τους σύγκριση με βάση τα χαρακτηριστικά και τις δυνατότητες τους. Σε δεύτερη φάση θα γίνει ποσοτική σύγκριση χρησιμοποιώντας μια δεξαμενή προβλημάτων από διάφορα πεδία που χρησιμοποιήθηκαν ως πλατφόρμα δοκιμών στους διαγωνισμούς. Η διπλωματική εργασία πιθανώς να οδηγήσει σε δημοσίευση σε συνέδριο του χώρου. Επιβλέπων: Ν. Βασιλειάδης 8. Ανάπτυξη διαδικτυακής εφαρμογής για καταχώρηση εκπαιδευτικών μεταδεδομένων Η ανάπτυξη διαδικτυακών εφαρμογών για υποστήριξη εκπαιδευτικών δραστηριοτήτων (e- Learning) απαιτεί συστηματική περιγραφή του ηλεκτρονικού εκπαιδευτικού υλικού με χρήση μεταδεδομένων (metadata). Σκοπός της εργασίας είναι η ανάπτυξη μιας δυναμικής ιστοσελίδας/φόρμας που να επιτρέπει την καταχώρηση μεταδεδομένων που να πληρούν τις προδιαγραφές μεταδεδομένων LOM, για μαθησιακά αντικείμενα (LOM - Learning Object Metadata). Τα μεταδεδομένα θα αποθηκεύονται σε σχεσιακή βάση δεδομένων. Εμπλεκόμενες τεχνολογίες: LOM, DHTML, JavaScript, ASP/VBScript. Script. 9. Ανάπτυξη διαδικτυακής υπηρεσίας για φιλτράρισμα βιβλιογραφικών αναφορών Οι υπηρεσίες εύρεσης βιβλιογραφικών αναφορών είναι ιδιαίτερα δημοφιλείς, κάτι που αποδεικνύεται και από την ύπαρξη εξειδικευμένων ιστοχώρων όπως τα "Google Scholar", "IEEE Xplore", "DBLP Bibliography Server", κτλ. Η εργασία αφορά την ανάπτυξη εφαρμογής που θα επιτρέπει σε κάποιον την υποβολή ερωτήσεων στην υπηρεσία "Google Scholar", την λήψη των αποτελεσμάτων και το φιλτράρισμα αυτών ώστε να απομείνουν μόνο οι αναφορές (citations) τρίτων σε εργασίες αυτού που υποβάλλει ερώτηση. Θα γίνει χρήση των προγραμματιστικών διεπαφών (APIs - Application Programming Interfaces) του Google. ή.net. 10. Δυναμικό Σύστημα Ασφάλειας για Ιατρικά Περιβάλλοντα βασισμένο στη Γνώση Υλοποίηση δυναμικής πρόσβασης χρηστών σε ιατρικά πληροφοριακά συστήματα μέσω ενός βασισμένου στη γνώση συστήματος. Το σύστημα γνώσης εξασφαλίζει τη δυναμικότητα του μοντέλου πρόσβασης, δηλαδή την ακριβή αλλά όχι προδιαγεγραμμένη απόδοση δικαιωμάτων χρήσης βάσει του πλαισίου εργασίας του χρήστη. Η εργασία αυτή περιλαμβάνει προγραμματισμό στο εργαλείο τεχνολογίας γνώσης Flex και στην γλώσσα LPA-Prolog και αποτελεί επέκταση ήδη υπάρχοντος συστήματος που υλοποιεί την εισαγωγή του χρήστη στο σύστημα και τον καθορισμό του ρόλου και του πλαισίου εργασίας του. Απαιτήσεις: Προγραμματισμός σε Flex, LPA-Prolog
11. Γραφικό Περιβάλλον Οπτικής Απεικόνισης Οντολογιών RDF Schema στο Σημασιολογικό Ιστό Ο Σημασιολογικός Ιστός (Semantic Web - SW) είναι ένα αναπτυσσόμενο πεδίο έρευνας με κύριο σκοπό τη βελτίωση του σημερινού Παγκόσμιου Ιστού (World Wide Web WWW). Οι οντολογίες αποτελούν βασικό εργαλείο του Σημασιολογικού Ιστού και περιγράφουν οντότητες, ιδιότητες αυτών και συσχετίσεις μεταξύ τους. Στόχος της εργασίας αυτής είναι η ανάπτυξη ενός γραφικού περιβάλλοντος, το οποίο θα αναπαριστά οντολογίες με οπτικό τρόπο. Πιο συγκεκριμένα, το σύστημα θα πρέπει να έχει τη δυνατότητα να «φορτώνει» μια οντολογία RDF Schema στη μνήμη και στη συνέχεια να την αναπαριστά γραφικά (με δένδρα απεικόνισης/γράφους/εικονίδια). Η γλώσσα προγραμματισμού θα είναι η Java και θα χρησιμοποιηθούν κομμάτια κώδικα προηγούμενης διπλωματικής εργασίας. Επίσης, θα γίνει εκτενής χρήση του πακέτου Jena, το οποίο αποτελείται από βιβλιοθήκες Java για το περιβάλλον του Σημασιολογικού Ιστού. 12. Γραφικό Περιβάλλον Οπτικής Σύνθεσης Βάσεων Κανόνων για το Σημασιολογικό Ιστό Οι βάσεις κανόνων (rule bases) περιγράφουν τη λογική κάποιου πεδίου (domain) και παίζουν σημαντικό ρόλο στην ανάπτυξη του Σημασιολογικού Ιστού. Η διπλωματική αυτή έχει ως στόχο την υλοποίηση ενός γραφικού περιβάλλοντος, το οποίο θα επιτρέπει τη σύνθεση μιας βάσης κανόνων με οπτικό τρόπο. Πιο συγκεκριμένα, το σύστημα θα πρέπει να δίνει τη δυνατότητα στο χρήστη να μοντελοποιεί μια βάση κανόνων χρησιμοποιώντας εύχρηστα οπτικά βοηθήματα (εικονίδια/σχήματα κ.ά.) και στη συνέχεια να εξάγει τη βάση αυτή σε γλώσσα RuleML. Η γλώσσα προγραμματισμού θα είναι η Java και η υλοποίηση θα βασισθεί σε υπάρχοντα κομμάτια κώδικα.. 13. Γραφικό Περιβάλλον Σύνθεσης Διαδικτυακών Υπηρεσιών Οι Διαδικτυακές Υπηρεσίες (Web Services) είναι υπηρεσίες διαθέσιμες στο διαδίκτυο οι οποίες μπορούν να κληθούν στέλνοντας κατάλληλα μηνύματα και να επικοινωνούν μεταξύ τους ώστε να δημιουργηθεί μια πιο σύνθετη υπηρεσία. Σκοπός της διπλωματικής είναι η ανάπτυξη ενός γραφικού εργαλείου για τη σύνθεση Διαδικτυακών Υπηρεσιών (Web Service Composition). Ο σκοπός του εργαλείου είναι να διευκολυνθεί η σύνθεση πολλών τέτοιων υπηρεσιών μέσω ενός γραφικού περιβάλλοντος, στο οποίο θα παρουσιάζονται οι διαθέσιμες υπηρεσίες στο χρήστη και αυτός θα μπορεί να διαλέγει τις κατάλληλες που θα τον εξυπηρετούν καθώς και τη σειρά με την οποία θα πρέπει να κληθούν. Στο τέλος, το ολοκληρωμένο πλάνο θα πρέπει να εκτελείται και να επιστρέφεται το αποτέλεσμα στο χρήστη. Απαιτήσεις: Προγραμματισμός σε Visual Studio.Net (C++) ή Java. 14. Σύστημα Γνώσης για Διάγνωση Βλαβών Φυσικού Συστήματος με τη χρήση της Συλλογιστικής των Μοντέλων Στόχος της εργασίας είναι η ανάπτυξη ενός συστήματος γνώσης, το οποίο θα επιτρέπει το σχεδιασμό ενός μοντέλου λειτουργίας ενός φυσικού συστήματος (π.χ. μηχανής) με γραφικό τρόπο, καθώς επίσης και τη διάγνωση ενδεχόμενων βλαβών σε αυτό. Ο χρήστης θα μπορεί να σχεδιάζει γραφικά ένα αφηρημένο μοντέλο του φυσικού συστήματος, να καθορίζει τις παραμέτρους λειτουργίας και δυσλειτουργίας του, καθώς επίσης και τις παρατηρούμενες τιμές εισόδου/εξόδου από τα διάφορα εξαρτήματα του μοντέλου, ώστε να είναι δυνατή η διάγνωση ενδεχόμενων δυσλειτουργιών του φυσικού συστήματος. Η εργασία αποτελείται από 2 κύρια μέρη: 1. Την υλοποίηση σε Java ενός γραφικού περιβάλλοντος σχεδιασμού αφηρημένων δισδιάστατων μοντέλων φυσικών συστημάτων, και 2. Την υλοποίηση σε CLIPS συστήματος γνώσης για τη διάγνωση των βλαβών με τη χρήση της Συλλογιστικής των Μοντέλων. και CLIPS.
15. Μετάφραση Κανόνων RuleML σε Κανόνες CLIPS Η RuleML είναι μία Γλώσσα Σήμανσης αλλά και αναπαράστασης Κανόνων στο Διαδίκτυο σε μορφή XML. Υπάρχουν πολλές μορφές κανόνων RuleML, μεταξύ των οποίων οι συμπερασματικοί κανόνες και οι κανόνες παραγωγής. Σκοπός της διπλωματικής είναι η ανάπτυξη ενός συστήματος μετάφρασης κάποιων μορφών RuleML κανόνων σε κανόνες CLIPS (με τη χρήση XSLT εγγράφων), οι οποίοι θα μπορούν να εκτελεστούν από το σύστημα CLIPS και να επιστρέψουν αποτελέσματα στο διαδίκτυο, υπό την μορφή RuleML/XML ή TXT σε ένα αρχείο. Θα αναπτυχθεί επίσης κάποιο interface στο οποίο θα αυτοματοποιείται η όλη διαδικασία είτε τοπικά σε Java είτε μέσω browser σε Javascript ή PHP. Απαιτήσεις: Προγραμματισμός σε XSLT και Java/Javascript ή PHP. 16. Επέκταση συστήματος εξατομικευμένης ενημέρωσης με δυνατότητες επικοινωνίας μέσω κινητού τηλεφώνου Παράλληλα με τη ραγδαία ανάπτυξη του παγκόσμιου ιστού ιδιαίτερο προβληματισμό προκάλεσε το φαινόμενο του πληροφοριακού υπερκορεσμού (Information Overload). Στο εργαστήριο έχει αναπτυχθεί σύστημα εξατομικευμένης ενημέρωσης για δημοσίευση νέων άρθρων και ειδήσεων με σκοπό την αντιμετώπιση του παραπάνω προβλήματος. Με το σύστημα PersoNews (http://news.csd.auth.gr), ο χρήστης εισάγει τα ενδιαφέροντά του και ενημερώνεται ηλεκτρονικά για νέες δημοσιεύσεις σχετικές με αυτά. Ο χρήστης μπορεί να «εκπαιδεύσει» το σύστημα σημειώνοντας άρθρα που δε ταυτίζονται με τα ενδιαφέροντά του. Για το σκοπό αυτό χρησιμοποιούνται τεχνικές από το πεδίο της μηχανικής μάθησης. Στόχος της διπλωματικής είναι η επέκταση του συστήματος με δυνατότητα ενημέρωσης του χρήστη και αλληλεπίδρασης με το σύστημα μέσω κινητού τηλεφώνου. Πιο συγκεκριμένα, θα επιδιωχθεί η υλοποίηση της κατάλληλης υποδομής για την αποστολή και λήψη μηνυμάτων (SMS-Server) καθώς και η μελέτη τρόπων ελαχιστοποίησης κόστους επικοινωνίας Απαιτήσεις: Προγραμματισμός σε PHP. Οι ενδιαφερόμενοι καλούνται να επικοινωνήσουν με τον κ. Βλαχάβα ή τον κ. Βασιλειάδη, ανάλογα με το θέμα, μέχρι την Δευτέρα 16 Οκτωβρίου 2006, προσκομίζοντας: σύντομο βιογραφικό σημείωμα, απλή φωτοτυπία αναλυτικής βαθμολογίας, και φωτοτυπία του πάσο ή της 1ης σελίδας του βιβλιαρίου σπουδών. Περισσότερες λεπτομέρειες για τα ερευνητικά ενδιαφέροντα της ερευνητικής ομάδας Λογικού Προγραμματισμού & Ευφυών Συστημάτων (LPIS): http://lpis.csd.auth.gr