Πτυχιακές και Διπλωματικές Εργασίες για τους προπτυχιακούς και μεταπτυχιακούς φοιτητές του Τμήματος Πληροφορικής και Τηλεπικοινωνιών Ακαδημαϊκό Έτος 2008-2009 Αναπληρωτής Καθηγητής Μανόλης Κουμπαράκης http://www.di.uoa.gr/~koubarak Τμήμα Πληροφορικής και Τηλεπικοινωνιών ΕΚΠΑ Σημειώσεις για τους φοιτητές: Τα θέματα είναι κοινά για διπλωματικές και πτυχιακές, αλλά οι απαιτήσεις διαφέρουν ανάλογα με το θέμα και το επίπεδο σπουδών του φοιτητή/φοιτήτριας (προπτυχιακό/μεταπτυχιακό). Μερικά θέματα είναι περισσότερο κατάλληλα για πτυχιακή, ενώ άλλα είναι περισσότερο κατάλληλα για διπλωματική. Γενικά, στην περίπτωση των πτυχιακών (προπτυχιακοί φοιτητές), η έμφαση θα είναι κυρίως στην κατανόηση και υλοποίηση αλγορίθμων που έχουν αναπτυχθεί από την ομάδα μου ή άλλους ερευνητές, και είναι δημοσιευμένοι στη βιβλιογραφία. Στην περίπτωση των διπλωματικών (μεταπτυχιακοί φοιτητές), θα δίνεται έμφαση και στην επιστημονική συνεισφορά και πρωτοτυπία της εργασίας. Όλες οι πτυχιακές μπορούν να ανατεθούν και σε ομάδα φοιτητών με κατάλληλη τροποποίηση των απαιτήσεων. Οι διπλωματικές είναι μόνο για ένα φοιτητή ή φοιτήτρια. Όπου αναφέρονται σχετικές περιοχές/μαθήματα, η πληροφορία είναι ενδεικτική. Στην πράξη κάποια μαθήματα θα αποδειχθούν πολύ χρήσιμα για την εργασία σας και κάποια άλλα λιγότερο. Όμως, αν στα μαθήματα που αναφέρω έχετε πάρει χαμηλούς βαθμούς (ή δεν σας ενδιαφέρουν), μάλλον η αντίστοιχη εργασία δεν είναι για σας! Όλες οι εργασίες επικεντρώνονται σε θέματα που είναι στην αιχμή της έρευνας και της τεχνολογίας στις αντίστοιχες θεματικές περιοχές. Συνεπώς, οι πτυχιακές είναι κατάλληλες σαν πρώτο βήμα για την μελλοντική εκπόνηση διπλωματικής, και οι διπλωματικές σαν πρώτο βήμα για την μελλοντική εκπόνηση διδακτορικού σε σχετικό αντικείμενο. Αν σας ενδιαφέρει κάποιο θέμα, δείτε τη σχετική βιβλιογραφία και στείλτε μου e-mail για να συναντηθούμε και να το συζητήσουμε. Προτεινόμενα Θέματα: 1. Sensor Internet/Web/Grid ή Δίκτυα αισθητήρων όλου του κόσμου ενωθείτε! 1 Τα δίκτυα αισθητήρων (sensor networks) έχουν γίνει ευρέως διαθέσιμα τα τελευταία χρόνια και χρησιμοποιούνται με επιτυχία σε διάφορους τομείς (π.χ., περιβάλλον, γεωργία, υγεία, μεταφορές, δημόσια ασφάλεια κλπ.). Στο άμεσο μέλλον θα έχουμε στη διάθεση μας διάφορα δίκτυα αισθητήρων τα οποία έχουν αναπτυχθεί από ανεξάρτητες οντότητες και τα οποία θα μας παρέχουν ένα ανεξάντλητο πλούτο δεδομένων. Η ενοποίηση αυτών των δικτύων με υπάρχουσες 1 Επέκταση του συνθήματος του Παναγιώτη Τσακαλίδη από τη ομιλία του «Σύγκλιση Τηλεπικοινωνιών και Πληροφορικής: Συνδέοντας το Φυσικό Κόσμο με Ασύρματα Δίκτυα Αισθητήρων» (http://www.ics.forth.gr/~tsakalid/ppub.html).
πηγές πληροφορίας ή υπηρεσίες διαθέσιμες στο Διαδίκτυο και τον Παγκόσμιο Ιστό θα μας δώσει την δυνατότητα να αναπτύξουμε πρωτοποριακές εφαρμογές που είναι πολύ δύσκολο ή αδύνατο να υλοποιηθούν σήμερα. Αυτό είναι το όραμα της περιοχής του Διαδικτύου Αισθητήρων (Sensor Internet) ή του Παγκόσμιου Ιστού Αισθητήρων (Sensor Web) ή του Πλέγματος Αισθητήρων (Sensor Grid) όπως έχoυν ονομαστεί οι σχετικές πρόσφατες ερευνητικές προσπάθειες (δείτε για παράδειγμα τα συστήματα IrisNet (http://www.intel-iris.net/), HourGlass (http://www.eecs.harvard.edu/~syrah/hourglass/index.shtml) or Global Sensor Netowrks ( http://lsirpeople.epfl.ch/salehi/papers/lsir-report-2006-001.pdf). Πιστεύω ότι μπορούμε να ανταποκριθούμε αποτελεσματικά στην ερευνητική πρόκληση που περιγράφηκε παραπάνω με το πάντρεμα των τεχνολογιών των Δικτύων Αισθητήρων και του Σημασιολογικού Ιστού (Semantic Web), με τελικό στόχο την ανάπτυξη ενός Σημασιολογικού Ιστού Αισθητήρων (Semantic Sensor Web). Η βασική υπόθεση μας είναι ότι οι τεχνολογίες που έχουν αναπτυχθεί τα τελευταία χρόνια για τον Σημασιολογικό Ιστό (technologies for managing metadata, ontologies, rules etc.) μπορούν να χρησιμοποιηθούν με επιτυχία και στο Σημασιολογικό Ιστό Αισθητήρων για την επισημείωση (annotation) αισθητήρων, δικτύων αισθητήρων, δεδομένων και υπηρεσιών ώστε να έχουμε μεγαλύτερη διαλειτουργικότητα μεταξύ δικτύων αισθητήρων και άλλων εφαρμογών, και για να διευκολύνουμε τη σύνθεση νέων υπηρεσιών και την εύκολη ανάπτυξη mash-ups κλπ. Ένα πρόσφατο άρθρο για την περιοχή του Semantic Sensor Web είναι το εξής http://knoesis1.wright.edu/library/resource.php?id=00311. Η περιοχή αυτή θα απασχολήσει την ομάδα μου για τα επόμενα 2-3 χρόνια και υπάρχουν πτυχιακές/διπλωματικές (και διδακτορικές διατριβές!) στα ακόλουθα θέματα: Ανάπτυξη οντολογιών για την περιγραφή δικτύων αισθητήρων. Επέκταση του μοντέλου RDF (http://www.w3.org/rdf/) με τις έννοιες του χώρου και χρόνου ώστε να μπορεί να χρησιμοποιηθεί για αναπαράσταση χωρικών και χρονικών μεταδεδομένων (ας ονομάσουμε αυτό το νέο μοντέλο strdf). Το μοντέλο strdf είναι απαραίτητο στο Σημασιολογικό Πλέγμα Δικτύων Αισθητήρων ώστε να μπορούμε να αναπαραστήσουμε τη θέση ενός αισθητήρα, το χρόνο κατά τον οποίο είναι ενεργός, την τροχιά ενός κινούμενου αισθητήρα κλπ. Ανάπτυξη γλώσσας επερωτήσεων βασισμένης στη SPARQL (http://www.w3.org/tr/rdfsparql-query/) για το μοντέλο strdf (ας την ονομάσουμε stsparql). Ανάπτυξη και υλοποίηση κατάλληλων δομών δευτερεύουσας μνήμης για την αποθήκευση χωροχρονικών δεδομένων του μοντέλου strdf. Ανάπτυξη τεχνικών για την αποτίμηση και τη βελτιστοποίηση ερωτήσεων της γλώσσας stsparql. Επέκταση του συστήματος ομοτίμων κόμβων Atlas ώστε να υποστηρίζει το μοντέλο strdf και τη γλώσσα επερωτήσεων stsparql. Περιβάλλοντα για γρήγορη ανάπτυξη mash-ups βασιζόμενα σε τεχνολογίες του Σημασιολογικού Ιστού. 2. SenseWeb/SensorMap To SenseWeb/SensorMap (http://research.microsoft.com/nec/senseweb/) είναι ένα ερευνητικό portal της Microsoft Research το οποίο επιτρέπει στους χρήστες του να κάνουν επερωτήσεις σε δεδομένα πραγματικού χρόνου που προέρχονται από αισθητήρες χρησιμοποιώντας διεπαφές χάρτη όπως Windows Live Local (http://maps.live.com/) ή Google Maps (http://maps.google.com/). Οι χρήστες μπορούν εύκολα να δημοσιεύουν δεδομένα πραγματικού χρόνου στο portal χρησιμοποιώντας Web service interfaces.
Υπάρχουν διάφορα ενδιαφέροντα προβλήματα που σχετίζονται με το παραπάνω portal και μπορούν να αποτελέσουν το θέμα πτυχιακών ή διπλωματικών: Ανάπτυξη περιβαλλοντολογικών εφαρμογών στο SenseWeb/SensorMap με με έμφαση στον Ελληνικό χώρο (πτυχιακές). Επανασχεδιασμός/επεκτάσεις του SenseWeb/SensorMap με σημασιολογική πληροφορία ώστε να να έχουμε ένα Semantic Sensor Web όπως το οραματίζονται οι συγγραφείς του άρθρου http://en.wikipedia.org/wiki/semantic_sensor_web (διπλωματικές). Σχετικά μαθήματα: Τεχνολογίες Διαδικτύου, Τεχνολογίες Γνώσεων, Βάσεις Δεδομένων 3. Αποτίμηση ερωτήσεων εκφρασμένων σε SPARQL στο σύστημα Atlas. Η εργασία θα επικεντρωθεί στην υλοποίηση αλγορίθμων για την αποτίμηση ερωτήσεων εκφρασμένων σε SPARQL (http://www.w3.org/tr/rdf-sparql-query/) στο σύστημα ομοτίμων κόμβων Atlas. Πληροφορίες για το σύστημα Atlas που υλοποιείται από την ομάδα μας τα τελευταία χρόνια μπορείτε να βρείτε στον ιστότοπο http://atlas.di.uoa.gr. Επειδή το σύστημα Atlas έχει αναπτυχθεί πάνω από τον DHT (κατανεμημένο πίνακα κατακερματισμού - distributed hash table) Bamboo (http://bamboo-dht.org/), οι φοιτητές θα χρειαστεί πρώτα να μάθουν καλά το σύστημα Bamboo. Σχετικά μαθήματα: Βάσεις Δεδομένων, Τεχνολογίες Γνώσεων, Δίκτυα Υπολογιστών, 4. Υλοποίηση του συστήματος Atlas χρησιμοποιώντας το DHT Pastry. Η εργασία θα επικεντρωθεί στην υλοποίηση αλγορίθμων για επεξεργασία επερωτήσεων στο σύστημα Atlas χρησιμοποιώντας το DHT Pastry. Το σύστημα Atlas έχει υλοποιηθεί από την ομάδα μας χρησιμοποιώντας το DHT Bamboo και σκοπεύουμε να αναπτύξουμε υλοποιήσεις και για άλλα DHTs. Πληροφορίες για το σύστημα Atlas μπορείτε να βρείτε στον ιστότοπο http://atlas.di.uoa.gr. Σχετικά μαθήματα: Βάσεις Δεδομένων, Δίκτυα Υπολογιστών, Τεχνολογίες Γνώσεων, 5. Υλοποίηση του συστήματος Atlas χρησιμοποιώντας το DHT Pastry - Aλγόριθμοι για συνεχείς επερωτήσεις. Η εργασία θα επικεντρωθεί στην υλοποίηση αλγορίθμων επεξεργασίας συνεχών επερωτήσεων (continuous queries) του συστήματος Atlas χρησιμοποιώντας το DHT Pastry. Το σύστημα Atlas έχει υλοποιηθεί από την ομάδα μας χρησιμοποιώντας το DHT Bamboo και σκοπεύουμε να αναπτύξουμε υλοποιήσεις και για άλλα DHTs. Πληροφορίες για το σύστημα Atlas μπορείτε να βρείτε στον ιστότοπο http://atlas.di.uoa.gr.
Σχετικά μαθήματα: Βάσεις Δεδομένων, Δίκτυα Υπολογιστών, Τεχνολογίες Γνώσεων, 6. Κατανεμημένες αρχιτεκτονικές ομοτίμων για ψηφιακές βιβλιοθήκες (P2P architectures for distributed digital libraries). Στις εργασίες http://www.di.uoa.gr/~koubarak/publications/ecdl05-tik.pdf και http://www.di.uoa.gr/~koubarak/publications/sigir05-tik.pdf παρουσιάζεται μια αρχιτεκτονική ομοτίμων (P2P architecture) για ψηφιακές βιβλιοθήκες. Στην ομάδα μου έχουμε ήδη αναπτύξει μια υλοποίηση σε Java της παραπάνω αρχιτεκτονικής πάνω από το DHT Pastry (http://research.microsoft.com/~antr/pastry/default.htm) αντί του Chord που αναφέρεται στις εργασίες. Ο σκοπός της εργασίας θα είναι να επεκτείνει την παρούσα υλοποίηση με νέα χαρακτηριστικά, και να την συγκρίνει με το σύστημα MAPS που δίνει μια εναλλακτική προσέγγιση στο ίδιο πρόβλημα βασισμένη σε προσεγγιστικούς αλγόριθμους. Το σύστημα MAPS περιγράφεται στη δημοσίευση http://cgi.di.uoa.gr/~koubarak/publications/wise08.pdf. Σχετικά μαθήματα: Βάσεις Δεδομένων, Ανάκτηση Πληροφορίας, Δίκτυα Υπολογιστών, 7. Υλοποίηση κεντρικοποιημένου συστήματος Δημοσιεύσεων/Συνδρομών (Publish/subscribe) για το RDF. Η εργασία θα επικεντρωθεί στην υλοποίηση σε Java ενός συστήματος Δημοσιεύσεων/Συνδρομών στο οποίο οι δημοσιεύσεις είναι RDF αρχεία και οι συνδρομές εκφράζονται στην γλώσσα επερωτήσεων SPARQL (http://www.w3.org/tr/rdf-sparqlquery/). Ένα σχετικό σύστημα και η χρήση του για την υλοποίηση RSS feeds περιγράφεται στο άρθρο http://www.sciencedirect.com/science?_ob=articleurl&_udi=b758f-4hcmsnd- 1&_user=275166&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C000059642& _version=1&_urlversion=0&_userid=275166&md5=c274e5acbb2b14878f6fd358471389fc. Η συνεισφορά της πτυχιακής/διπλωματικής θα είναι να υλοποιήσει αλγόριθμους που βελτιώνουν ή επεκτείνουν τους αλγόριθμους του παραπάνω άρθρου ιδιαίτερα όσον αφορά πληροφορία κειμένου. Σχετικά μαθήματα: Βάσεις Δεδομένων 8. Υλοποίηση κατανεμημένου συστήματος Δημοσιεύσεων/Συνδρομών (Publish/subscribe) για την XML. Η εργασία θα επικεντρωθεί στην υλοποίηση σε Java ενός κατανεμημένου συστήματος Δημοσιεύσεων/Συνδρομών (Publish/subscribe) για την XML πάνω από ένα DHT. Οι
αλγόριθμοι που θα υλοποιηθούν έχουν σχεδιαστεί και περιγράφονται στο άρθρο http://cgi.di.uoa.gr/~koubarak/publications/miliaraki08.pdf. Για την υλοποίηση θα χρησιμοποιηθεί το το DHT Pastry (http://research.microsoft.com/~antr/pastry/default.htm). Σχετικά μαθήματα: Βάσεις Δεδομένων, Δίκτυα Υπολογιστών, 9. Επεξεργασία συνεχών σχεσιακών ερωτήσεων (continuous relational queries) πάνω από DHTs Μελετούμε θέματα υλοποίησης κατανεμημένων βάσεων δεδομένων με χρήση DHTs. Η βασική ερώτηση που θα απαντηθεί είναι η εξής: Πως αποθηκεύουμε σχεσιακά δεδομένα σε ένα DHT και πως επεξεργαζόμαστε ερωτήσεις SQL που απευθύνονται σ αυτά τα δεδομένα; Η εργασία αυτή θα επικεντρωθεί στην υλοποίηση επιλεγμένων τεχνικών επεξεργασίας SQL ερωτήσεων πάνω από ένα DHT (π.χ., το Pastry), όπως αυτές δίνονται στα παρακάτω άρθρα: http://cgi.di.uoa.gr/~koubarak/publications/icde.pdf http://cgi.di.uoa.gr/~koubarak/publications/continuousmultiwayjoinsindhts.pdf Σχετικά μαθήματα: Βάσεις Δεδομένων, Δίκτυα Υπολογιστών, 10. Δηλωτικές Γλώσσες Προγραμματισμού και Επερωτήσεων με Εφαρμογές στα Δίκτυα Υπολογιστών Δηλωτικές γλώσσες προγραμματισμού όπως η Prolog και γλώσσες επερωτήσεων σε σχεσιακά συστήματα δεδομένων όπως η Datalog, έχουν βρει πρόσφατα εφαρμογές στην γρήγορη ανάπτυξη (rapid prototyping) πρωτοκόλλων για δίκτυα υπολογιστών και δίκτυα επικάλυψης (overlay networks). Δύο πρόσφατα ερευνητικά έργα στη περιοχή είναι το P2 (http://p2.cs.berkeley.edu/) και το DSN (http://db.cs.berkeley.edu/dsn2/). Η παρούσα διπλωματική θα επικεντρωθεί στην ανάπτυξη και τη σύγκριση πρωτοκόλλων για δίκτυα επικάλυψης χρησιμοποιώντας δηλωτικές γλώσσες προγραμματισμού. Σχετικά μαθήματα: Τεχνητή Νοημοσύνη, Λογικός Προγραμματισμός, Τεχνολογίες Γνώσεων, Βάσεις Δεδομένων, Δίκτυα Υπολογιστών,, Prolog 11. Ανάκτηση και ενοποίηση πληροφορίας από επιστημονικές ψηφιακές βιβλιοθήκες διαθέσιμες στον Παγκόσμιο Ιστό. Σήμερα στον Παγκόσμιο Ιστό υπάρχουν διάφορες πηγές και ψηφιακές βιβλιοθήκες που διαθέτουν επιστημονικά άρθρα και σχετικές πληροφορίες (π.χ., Google Scholar http://scholar.google.com/, CiteSeer http://citeseer.ist.psu.edu/, etc.)
Η εργασία θα επικεντρωθεί σε συγκεκριμένα προβλήματα ανάκτησης και ενοποίησης πληροφορίας από πηγές όπως αυτές που αναφέρθηκαν παραπάνω (Παράδειγμα: ανάπτυξη ενός συστήματος το οποίο θα δίνει τις αναφορές στα άρθρα ενός συγγραφέα, ενοποιώντας πληροφορίες από όσο το δυνατόν περισσότερες διαθέσιμες πηγές). Σχετικά μαθήματα: Τεχνολογίες Διαδικτύου, Βάσεις Δεδομένων 12. Ανάκτηση πληροφοριών για υπηρεσίες του Παγκόσμιου Ιστού (Web services) Σήμερα στον Παγκόσμιο Ιστό είναι διαθέσιμες πολλές χρήσιμες υπηρεσίες που προσφέρονται ηλεκτρονικά (π.χ., αγορά βιβλίων, αγορά εισιτηρίων, ενοικίαση αυτοκινήτων κλπ.). Ένα πρόβλημα που προκύπτει από την ύπαρξη πολλών τέτοιων υπηρεσιών είναι η ανακάλυψη τους. Πως βρίσκουμε ότι υπάρχει μια υπηρεσία που μας ενδιαφέρει; Πως μπορούμε να πληροφορηθούμε σχετικά με μια υπηρεσία που μόλις έγινε διαθέσιμη; Η εργασία αυτή μελετάει το πρόβλημα της σχεδίασης και υλοποίησης ενός καταλόγου που περιέχει σημασιολογικές περιγραφές υπηρεσιών εκφρασμένων στη γλώσσα OWL-S. Ένα σχετικό σύστημα matchmaker περιγράφεται στο παρακάτω άρθρο: http://www.sciencedirect.com/science?_ob=articleurl&_udi=b758f-4b4x4hf- 4&_user=275166&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C0000 59642&_version=1&_urlVersion=0&_userid=275166&md5=56c62ea7af1344d3af9f 72d37bc775af. Η εργασία μπορεί να επικεντρωθεί στην υλοποίηση του κεντρικοποιημένου συστήματος που περιγράφεται στο παραπάνω άρθρο ή να προτείνει μια κατανεμημένη υλοποίηση του βασισμένη σε ιδέες από DHTs. Επίσης μας ενδιαφέρει ιδιαίτερα το πρόβλημα της ανάκτησης πληροφοριών για γεωγραφικές υπηρεσίες του Παγκόσμιου Ιστού που περιγράφονται χρησιμοποιώντας τεχνολογίες που βασίζονται στη σημασιολογία (π.χ., οντολογίες). Για περισσότερες πληροφορίες γι αυτή την περιοχή, μπορείτε να δείτε την διδακτορική διατριβή της Eva Klien: http://ifgiweb.uni-muenster.de/~klien/publications/klien_phdthesis_full.pdf Σχετικά μαθήματα: Τεχνολογίες Διαδικτύου, Βάσεις Δεδομένων, Δίκτυα Υπολογιστών, Τεχνολογίες Γνώσεων