Γ' ΚΟΙΝΟΤΙΚΟ ΠΛΑΙΣΙΟ ΣΤΗΡΙΞΗΣ 2000-2006 ΕΡΓΟΥ ΕΝΔΙΑΜΕΣΗ X ΤΕΛΙΚΗ Τίτλος Υποέργου : Διαχείριση δεδομένων για υπηρεσίες εντοπισμού κινούμενων αντικειμένων Α/Α ΕΚΘΕΣΗΣ: Κωδικός υποέργου : 03ΕΔ291 Μέτρο : 8.3 Εργο/Δράση : 03ΕΔ... Αρμόδια Διεύθυνση ΓΓΕΤ : ΔΙΕΥΘΥΝΣΗ ΥΠΟΣΤΗΡΙΞΗΣ ΕΡΕΥΝΗΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑΤΩΝ 1
1. ΣΤΟΙΧΕΙΑ ΥΠΟΕΡΓΟΥ 1.1. Τίτλος υποέργου Διαχείριση δεδομένων για υπηρεσίες εντοπισμού κινούμενων αντικειμένων 1.2. Επιστημονικός Υπεύθυνος Υποέργου Ονοματεπώνυμο Τιμολέων Σελλής Φορέας: Θέση: Διεύθυνση: Εθνικό Μετσόβιο Πολυτεχνείο (Ε.Μ.Π.), Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Καθηγητής Ε.Μ.Π. Τηλ.: 210 772 1601 E-mail: Ηρώων Πολυτεχνείου 9, Πολυτεχνειούπολη Ζωγράφου Ταχ. Κωδ.: 15773 timos@dblab.ece.ntua.gr 1.3. Ανάδοχος Επωνυμία: Διεύθυνση: Τηλ.: 210 772 2050 E-mail: Εθνικό Μετσόβιο Πολυτεχνείο Ηρώων Πολυτεχνείου 9, Πολυτεχνειούπολη Ζωγράφου Ταχ. Κωδ.: 15780 gpolyzos@central.ntua.gr 1.4. Διάρκεια υποέργου: Μήνες Προβλεπόμενη (αρχική σύμβαση και τροποποιήσεις αυτής) : 36 Ημερομηνία έναρξης : 1/12/05 Ημερομηνία λήξης : 30/11/08 Χρονική παράταση (συνολικά σε σχέση με την αρχική σύμβαση) : - 1.5. Απόφαση έγκρισης εκτέλεσης υποέργου και τροποποιήσεις αυτής ΑΡ. ΠΡΩΤΟΚΟΛΛΟΥ ΗΜΕΡΟΜΗΝΙΑ ΑΙΤΙΑ ΤΡΟΠΟΠΟΙΗΣΗΣ ΑΡΧΙΚΗ ΑΠΟΦΑΣΗ 10537 10/7/05 1 Η ΤΡΟΠΟΠ. ΑΠΟΦΑΣΗ 11116 3/11/06 Αλλαγή υποψήφιου διδάκτορα 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 1
2. ΦΥΣΙΚΟ ΑΝΤΙΚΕΙΜΕΝΟ 2.1. Περίληψη πραγματοποιηθεισών εργασιών Παρουσιάζεται συνοπτικά το φυσικό αντικείμενο του έργου όπως διαμορφώθηκε με τη μέχρι τώρα υλοποίηση του. Στο πλαίσιο της τελικής έκθεσης αναφέρεται και η επίτευξη ή μή του τελικού στόχου του έργου. Αρχικά διερευνήσαμε την τρέχουσα πρακτική και έρευνα για τα προβλήματα που εμφανίζονται στις διαχείριση δεδομένων για υπηρεσίες εντοπισμού κινουμένων αντικειμένων. Από την ανάλυση και διερεύνηση των απαιτήσεων διαχείρισης δεδομένων για δυναμικά περιβάλλοντα (όπως αυτά των κινουμένων αντικειμένων) προκύπτει ότι βασικός στόχος είναι η μελέτη και η υλοποίηση τεχνικών για την αποδοτική διαχείριση πληροφοριών σε δίκτυα μεγάλης κλίμακας. Η προσέγγιση που προτείνουμε στην αντιμετώπιση του προβλήματος διαρθρώνεται σε δύο κύριους άξονες στην συγκεντρωτική και την αποκεντρωμένη προσέγγιση. Στη συγκεντρωτική προσέγγιση, όλη η πληροφορία θεωρείται ότι εποπτεύεται από έναν κεντρικό σταθμό, στον οποίο αποστέλλουν και από τον οποίο λαμβάνουν δεδομένα οι χρήστες. Στην περίπτωση της αποκεντρωμένης προσέγγιση, θεωρούμε ότι συγκροτείται ένα δίκτυο ομοτίμων, όπου τα μέλη είναι αρμόδια να χειριστούν την πληροφορία που συλλέγεται και έτοιμα να την χορηγήσουν σε άλλους όταν χρειαστεί. Με βάση τις παραπάνω προσεγγίσεις εξετάσαμε (α) το μοντέλο δεδομένων, (β) το πλαίσιο ανάπτυξης λογισμικού, (γ) τις γλώσσες ερωταποκρίσεων και (δ) τη διαχείριση ερωτημάτων. Μοντέλο δεδομένων. Στη συγκεντρωτική θεώρηση το μοντέλο των σχεσιακών ρευμάτων δεδομένων, σύμφωνα με το οποίο τα δεδομένα ρέουν με μεγάλους ρυθμούς από τις πηγές παραγωγής τους, κρίθηκε ως το καταλληλότερο. Στην περίπτωση της αποκεντρωμένης αρχιτεκτονικής, καθορίσαμε το μοντέλο δεδομένων και ερωτήσεων που είναι κατάλληλο για συστήματα ομοτίμων. Το ενδιαφέρον μας επικεντρώθηκε τόσο στα συστήματα ομότιμων βάσεων που διαχειρίζονται ετερογενή δομημένα δεδομένα, όσο και στα συστήματα ομοτίμων που διαχειρίζονται αδόμητη πληροφορία με έμφαση στα χωρικά δεδομένα. Το πλαίσιο ανάπτυξης λογισμικού. Για την κατανόηση των απαιτήσεων των υπηρεσιών εντοπισμού κινούμενων αντικειμένων πραγματοποιήσαμε μία διεξοδική σύγκριση των κυριοτέρων ερευνητικών πρωτοτύπων για διαχείριση ρευμάτων δεδομένων. Όπως φάνηκε στην μελέτη σχετικά με την συγκεντρωτική θεώρηση, η υλοποίηση των πρωτοτύπων εμφανίζει κάποιους περιορισμούς που αναπόφευκτα δυσχεραίνουν την διατύπωση σύνθετων ερωτημάτων, όπως τα χωροχρονικά. Όσον αφορά στην αποκεντρωμένη θεώρηση, παρατηρήσαμε ότι ο πειραματισμός με τέτοια δίκτυα δεν είναι εύκολος γιατί είναι αδύνατον να υλοποιηθεί σε ερευνητικό περιβάλλον ένα τέτοιο δίκτυο στις πραγματικές του διαστάσεις. Για το λόγο αυτό η πειραματική μελέτη αυτών των συστημάτων γίνεται με αντίστοιχες προσομοιώσεις. Γλώσσες ερωταποκρίσεων. Για τη συγκεντρωτική αρχιτεκτονική, διαμορφώσαμε μία άλγεβρα περιγραφής ρευμάτων δεδομένων κινούμενων αντικειμένων, βασισμένη στον προσδιορισμό κατάλληλου τύπου παραθύρων, που αποσπούν από το αχανές ρεύμα δεδομένων έναν αριθμό στοιχείων. Σε ότι αφορά την αποκεντρωμένη αρχιτεκτονική, μελετήσαμε την έκφραση ερωτημάτων διαρκείας σε ένα σύστημα ομοτίμων με τη χρήση κανόνων, ώστε μια βάση που συμμετέχει σε ένα δίκτυο ομοτίμων να μπορεί να τους χρησιμοποιήσει για να ενημερώνεται αυτόματα για αλλαγές στις γειτονικές βάσεις. Διαχείριση ερωτημάτων. Σε συγκεντρωτικά περιβάλλοντα για την αποδοτική τήρηση των δεδομένων από τα κινούμενα αντικείμενα προτείναμε προσεγγιστικούς αλγορίθμους που στηρίζονται στην τεχνική της δειγματοληψίας των θέσεων των αντικειμένων. Επειδή πολλές φορές δεν είναι δυνατή η ακριβής αποτίμηση των ερωτημάτων διαρκείας δημιουργήσαμε μία νέα δομή για την αποδοτική κατασκευή περιλήψεων πολυδιάστατων ρευμάτων δεδομένων. Ακόμα σε περιβάλλοντα ρευμάτων δεδομένων, λόγω της πολλαπλότητας και των πιθανών ομοιοτήτων μεταξύ των ερωτημάτων έχει ιδιαίτερη σημασία η ουσιαστική βελτίωση των επιδόσεων της συντελούμενης επεξεργασίας. Εξετάσαμε διεξοδικά τη μέθοδο περίληψης με βάση τον μετασχηματισμό κυματιδίων. Προτείναμε αλγορίθμους που μας επέτρεπαν να διαχειριστούμε ρεύματα δεδομένων και να βρούμε την κατάλληλα ισορροπία ανάμεσα στο απαιτούμενο χώρο και χρόνο κατασκευής. Στα αποκεντρωμένα περιβάλλοντα, εστιάσαμε στο πρόβλημα της μείωσης ή αλλοίωσης της πληροφορίας που εκφράζεται από μια ερώτηση όταν αυτή μεταγράφεται στο μονοπάτι κατά το οποίο διαδίδεται. Προτείναμε μια τεχνική που χρησιμοποιεί την κανονική ροή των ερωτήσεων στο σύστημα για να ανακαλύψει 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 2
απομακρυσμένους ομότιμους κόμβους με χρήσιμη πληροφορία. Στη συνέχεια ομαδοποιούμε κόμβους του δικτύου που περιέχουν δεδομένα με παραπλήσια ή επικαλυπτόμενη σημασιολογία. Επιπρόσθετα, μελετήσαμε δομημένα συστημάτων ομοτίμων τα οποία διαχειρίζονται χωρική πληροφορία. Για το σκοπό αυτό, αναπτύξαμε μια τεχνική δεικτοδότησης και δρομολόγησης χωρικών δεδομένων, που θα είναι κατάλληλη για εφαρμογές που διαχειρίζονται χωρικά δεδομένα ποικίλου μεγέθους. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 3
2.2. Αναλυτική Περιγραφή των Ενοτήτων Εργασιών (Ε.Ε.) που υλοποιήθηκαν Δώσατε αναλυτική περιγραφή κάθε Ε.Ε. που υλοποιήθηκε μέχρι σήμερα (μεθοδολογία που ακολουθήθηκε, περιγραφή, πειράματα-δοκιμές, αποτελέσματα, τελικό χρονοδιάγραμμα υλοποίησης Ε.Ε., εμπλεκόμενοι φορείς και η συμβολή τους, παραδοτέα, πραγματικό κόστος παραδοτέου). ΠΡΟΣΟΧΗ: Η περιγραφή των Ε.Ε. να γίνει με σαφήνεια και να επικεντρωθεί στις πραγματοποιηθείσες εργασίες και τα αποτελέσματα χωρίς να περιλαμβάνει βιβλιογραφικές αναφορές και αναφορές στη διεθνή εμπειρία. Να αναφερθούν και να αιτιολογηθούν οι αποκλίσεις από τα συμβατικά στοιχεία. Συμπλήρωσατε όσες σελίδες κρίνονται απαραίτητες Η συστηματική προσέγγιση που ακολουθήσαμε στο έργο αυτό είναι η πάγια μεθοδολογία που ακολουθείται σε πολλά όμοια έργα (βασικής έρευνας) διεθνώς, σεβόμενοι την επιστημονική δεοντολογία. Το έργο εξελίσσεται σε τέσσερις κύριες φάσεις. Τη χρονική στιγμή που συντάχθηκε η παρούσα έκθεση έχουν ολοκληρωθεί οι δυο πρώτες φάσεις του έργου και η τρίτη φάση βρίσκεται σε εξέλιξη. Φάση 1. Διερεύνηση σχετικών μεθοδολογιών και τεχνικών. Σ' αυτή την πρώτη φάση, διερευνάται διεξοδικά η τρέχουσα πρακτική και έρευνα για τα προβλήματα που εμφανίζονται στις διαχείριση δεδομένων για υπηρεσίες εντοπισμού κινουμένων αντικειμένων. Η φάση αυτή περιλαμβάνει τα πακέτα εργασίας ΠΕ1 και ΠΕ2. Τα αποτελέσματα της διερεύνησης παρουσιάζονται αναλυτικά στο πρώτο παραδοτέο με τίτλο «Απαιτήσεις διαχείρισης δεδομένων». Φάση 2. Μοντελοποίηση δεδομένων και γλώσσα ερωταποκρίσεων. Στην δεύτερη φάση, προσδιορίζεται το κατάλληλο μοντέλο για την αναπαράσταση των δυναμικών δεδομένων (π.χ., χωρικών, χρονικών και χωροχρονικών δεδομένων), με άξονα δύο αρχιτεκτονικές προσεγγίσεις (συγκεντρωτική-αποκεντρωμένη), συνυπολογίζοντας την πολυδιάστατη δομή των δεδομένων. Η φάση αυτή περιλαμβάνει τα πακέτα εργασίας ΠΕ3 ως και ΠΕ5. Τα αποτελέσματα της δεύτερη φάσης παρουσιάζονται αναλυτικά στο δεύτερο παραδοτέο με τίτλο «Μοντέλα αναπαράστασης δεδομένων και γλώσσες ερωταποκρίσεων» (Παράρτημα Β). Φάση 3. Επεξεργασία και αποτίμηση ερωτημάτων σε δυναμικά περιβάλλοντα. Ο κύριος όγκος του έργου συγκεντρώνεται σ αυτό το στάδιο. Ο βασικός σκοπός της τρίτης φάσης είναι η επίλυση των ερευνητικών προβλημάτων, μέσω του διαχωρισμού τους σε δύο παράλληλους άξονες. Αυτό είναι αναγκαίο, λόγω της ετερογένειας των ζητημάτων ανάλογα με την αρχιτεκτονική (συγκεντρωτική ή αποκεντρωμένη). Η φάση αυτή περιλαμβάνει τα πακέτα εργασίας ΠΕ6 ως και ΠΕ11. Τα συμπεράσματα της διερεύνησης θα περιγραφούν στο τρίτο παραδοτέο «Επεξεργασία και αποτίμηση ερωτημάτων σε δυναμικά περιβάλλοντα αντικειμένων» (Παράρτημα Γ). Φάση 4. Αξιολόγηση αποτελεσμάτων. Στην τελευταία φάση του έργου θα γίνει η τελική αξιολόγηση της διερεύνησης, βάσει των συμπερασμάτων της συγκριτικής μελέτης των δύο αρχιτεκτονικών προσεγγίσεων και δοκιμών τους σε πραγματικά δεδομένα. Καθεμιά από τις τέσσερις κύριες φάσεις του έργου διαρθρώνεται σε επιμέρους πακέτα εργασίας, τα οποία εμφανίζουν μεταξύ τους χρονική αλληλουχία. Σε συγκεκριμένες περιπτώσεις, υπάρχουν πακέτα εργασίας με χρονική επικάλυψη με γνώμονα τη συνάφεια και την αναμενόμενη αλληλεπίδραση των εργασιών. ΦΑΣΗ 1 (ΠΕ1, ΠΕ2) (ΠΕ1) Πακέτο Εργασίας 1 Περιγραφή: Ενημέρωση και διαμόρφωση πλαισίου έρευνας. Στόχος: Καταγραφή και συντονισμένη επισκόπηση της σχετικής διεθνούς βιβλιογραφίας. Έναρξη: αρχή του έργου Πέρας: τέλος 2 ου μήνα (διάρκεια: 2 μήνες) Στα πλαίσια του ΠΕ1 πραγματοποιήσαμε μία διεξοδική επισκόπηση της σχετικής με το έργο διεθνούς βιβλιογραφίας. Να σημειώσουμε ότι το αντικείμενο της διαχείριση δεδομένων για 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 4
υπηρεσίες εντοπισμού κινούμενων αντικειμένων άπτεται πολλών επιμέρους ερευνητικών περιοχών της διαχείρισης δεδομένων και κατά συνέπεια η επισκόπηση χωρίστηκε στις ακόλουθες αυτοτελείς ενότητες: ρεύματα δεδομένων, συστήματα κινούμενων αντικειμένων, επεξεργασία ερωτημάτων διαρκείας σε κινούμενα αντικείμενα, προσεγγιστικές μέθοδοι για ρεύματα δεδομένων, συστήματα ομοτίμων, συστήματα δημοσιοποίησης/συνδρομής, υπηρεσίες εντοπισμού, δομημένα δεδομένα σε συστήματα ομοτίμων και ενεργοί μηχανισμοί. (ΠΕ2) Πακέτο Εργασίας 2 Περιγραφή: Ανάλυση απαιτήσεων διαχείρισης δεδομένων για δυναμικά περιβάλλοντα ρευμάτων δεδομένων. Στόχος: Μελέτη των απαιτήσεων της διαχείρισης δεδομένων που συλλέγονται ή διακινούνται σε δυναμικά περιβάλλοντα, π.χ., μεταξύ (κινούμενων ή ακίνητων) αντικειμένων. Έναρξη: αρχή 3 ου μήνα Πέρας: τέλος 4 ου μήνα (διάρκεια: 2 μήνες) Από την ανάλυση και διερεύνηση των απαιτήσεων διαχείρισης δεδομένων για δυναμικά περιβάλλοντα προκύπτει ότι βασικός στόχος είναι η μελέτη και η υλοποίηση τεχνικών για την αποδοτική διαχείριση πληροφοριών σε δίκτυα μεγάλης κλίμακας και όπου οι πληροφορίες εξαρτώνται από απρόβλεπτες μεταβολές στη θέση κινουμένων αντικειμένων. Στον όρο διαχείριση περιλαμβάνονται μέθοδοι τόσο για την αποθήκευση όσο και την αναζήτηση των δεδομένων που κρατούνται στο δίκτυο, όπως, π.χ., η αποθήκευση και η αναζήτηση στοιχείων που είτε αφορούν τις θέσεις των αντικειμένων στο χώρο και το χρόνο (δηλαδή συντεταγμένες σε κάποιο σύστημα αναφοράς) είτε αναφέρονται σε δεδομένα που συλλέγονται ή διακινούνται κατά τη διάρκεια της κίνησης (λ.χ., μετρήσεις θερμοκρασίας ή ταχύτητας). Η προσέγγιση που προτείνουμε στην αντιμετώπιση του προβλήματος διαρθρώνεται σε δύο κύριους άξονες: Συγκεντρωτικό περιβάλλον. Όλη η πληροφορία θεωρείται ότι εποπτεύεται από έναν κεντρικό σταθμό, στον οποίο αποστέλλουν και από τον οποίο λαμβάνουν δεδομένα οι χρήστες. Ο όγκος της διακινούμενης πληροφορίας λαμβάνει τότε τη μορφή ταχύτατων, χρονικά ευμετάβλητων και πιθανόν ανεξάντλητων ρευμάτων δεδομένων (data streams) από πολλαπλές πηγές. Ο κεντρικός εξυπηρετητής (server) αναλαμβάνει να αποθηκεύσει τα στοιχεία σε ειδικές δομές αποθήκευσης (συνήθως στην κύρια μνήμη), με στόχο να δοθούν έγκαιρες και έγκυρες απαντήσεις σε ερωτήματα διαρκείας (continuous queries) που υποβάλλονται από τους χρήστες. Αποκεντρωμένο περιβάλλον. Στην περίπτωση αυτή, συγκροτείται ένα δίκτυο ομοτίμων, όπου τα μέλη είναι αρμόδια να χειριστούν την πληροφορία που συλλέγεται και έτοιμα να την χορηγήσουν σε άλλους όταν χρειαστεί. Αυτό δημιουργεί την ανάγκη δρομολόγησης δεδομένων και ερωτημάτων των χρηστών, όπως και κατανομής της επεξεργασίας τους μεταξύ των μελών του δικτύου. Παραδοτέο Τα αποτελέσματα της πρώτης φάσης του έργου παρουσιάζονται αναλυτικά στο πρώτο παραδοτέο που έχει τίτλο «Απαιτήσεις διαχείρισης δεδομένων» (Παράρτημα Β). 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 5
ΦΑΣΗ 2 (ΠΕ3, ΠΕ4, ΠΕ5) (ΠΕ3) Πακέτο Εργασίας 3 Περιγραφή: Διαμόρφωση μοντέλου αναπαράστασης δεδομένων. Στόχος: Διερεύνηση της καταλληλότητας διαφόρων μοντέλων (λ.χ. σχεσιακό, XML) για την αποθήκευση των δεδομένων, τόσο από τη σκοπιά των ρευμάτων δεδομένων, όσο και από εκείνη των δικτύων ομοτίμων. Έναρξη: αρχή 5 ου μήνα Πέρας: τέλος 8 ου μήνα (διάρκεια: 4 μήνες) Στο ΠΕ3 μελετήθηκαν μοντέλα κατάλληλα για την αποθήκευση των δεδομένων. Στην συγκεντρωτική θεώρηση το μοντέλο των σχεσιακών ρευμάτων δεδομένων, σύμφωνα με το οποίο τα δεδομένα ρέουν με μεγάλους ρυθμούς από τις πηγές παραγωγής τους, κρίθηκε ως το καταλληλότερο. Επιγραμματικά, αναφέρουμε τρία χαρακτηριστικά του μοντέλου αυτού. Το πρώτο έγκειται στην ανάγκη για συνεχή επεξεργασία και ανάλυση των δεδομένων καθώς αυτά δημιουργούνται. Το δεύτερο αφορά στον τεράστιο όγκο δεδομένων που παράγονται. Είναι σύνηθες σε πολλές εφαρμογές να παράγονται GB πληροφορίας ανά δευτερόλεπτο με αποτέλεσμα να καθιστούν δύσκολη αν όχι αδύνατη την αποθήκευση τους. Τέλος, σε πολλές εφαρμογές ενδιαφέρουν περισσότερο τα αποτελέσματα των ερωτήσεων παρά τα δεδομένα καθαυτά. Στην περίπτωση της αποκεντρωμένης αρχιτεκτονικής, καθορίσαμε το μοντέλο δεδομένων και ερωτήσεων που είναι κατάλληλο για συστήματα ομοτίμων. Το ενδιαφέρον μας επικεντρώθηκε τόσο στα συστήματα ομότιμων βάσεων που διαχειρίζονται ετερογενή δομημένα δεδομένα [KTS06, KKZ+06], όσο και στα συστήματα ομοτίμων που διαχειρίζονται αδόμητη (αρχεία) πληροφορία με έμφαση στα χωρικά δεδομένα [KSS07]. Θεωρήσαμε ότι στην αρχιτεκτονική κάθε ομότιμου υπάρχει ένα στρώμα που είναι αρμόδιο για τη δημιουργία και τη συντήρηση των αντιστοιχήσεων των τοπικών σχημάτων κατά τη διάρκεια της καθιέρωσης των γειτνιάσεων. Επιπλέον, κάθε κόμβος διαθέτει έναν μηχανισμό μετάφρασης των εισερχόμενων ερωτήσεων στο τοπικό του σχήμα, αλλά και έναν μηχανισμό ταιριάσματος των ερωτήσεων με το σχήμα του. Τέλος, όσον αφορά τα δομημένα δεδομένα, υιοθετήσαμε το σχεσιακό μοντέλο. Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στα [KTS06, KKZ+06, KSS07]. (ΠΕ4) Πακέτο Εργασίας 4 Περιγραφή: Θεμελίωση πλαισίου ανάπτυξης λογισμικού. Στόχος: Επιλογή κατάλληλου συστήματος πλαισίου ανάπτυξης, τόσο για τη συγκεντρωτική όσο και την αποκεντρωμένη περίπτωση. Έναρξη: αρχή 8 ου μήνα Πέρας: τέλος 10 ου μήνα (διάρκεια: 3 μήνες) Στο ΠΕ4 πραγματοποιήσαμε μία σύγκριση των κυριοτέρων ερευνητικών πρωτοτύπων για διαχείριση ρευμάτων δεδομένων. Στην εργασία [PS04] ερευνήσαμε πως διατυπώνονται ερωτήματα σχετικά με υπηρεσίες εντοπισμού κινουμένων αντικειμένων στις γλώσσες CQL και StreaQuel. Όπως φάνηκε στην μελέτη, η υλοποίηση των παραπάνω γλωσσών εμφανίζει κάποιους περιορισμούς που αναπόφευκτα δυσχεραίνουν την διατύπωση σύνθετων ερωτημάτων, όπως τα χωροχρονικά. Ενώ η εκφραστικότητα τους μπορεί να θεωρηθεί ικανοποιητική για ερωτήματα βάσει συντεταγμένων, δεν είναι εύκολα εφικτή η διατύπωση σύνθετων χωρικών κατηγορημάτων (λ.χ., εισέρχεται, εξέρχεται, διασχίζει,...) ή συναρτήσεων (απόσταση, ταχύτητα κλπ.). Για συστήματα διαχείρισης μεγάλου πλήθους κινούμενων αντικειμένων, τέτοιες ελλείψεις επηρεάζουν δραστικά την αποτελεσματικότητα της επεξεργασίας. Επιπλέον, η απουσία υποστήριξης συναρτήσεων ορισμένων από το χρήστη, συνθηκών κατά την ομαδοποίηση στοιχείων ή ένθετων υποερωτημάτων, αφήνει μικρά περιθώρια έκφρασης ερωτημάτων με περιεκτικό τρόπο. Ωστόσο, οι παρεχόμενοι τύποι παραθύρων της CQL προσφέρουν περισσότερες δυνατότητες διαχείρισης πλειάδων απ αυτές του TelegraphCQ, όπου υπάρχουν μόνο χρονικά κυλιόμενα παράθυρα. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 6
Ωστόσο, φαίνεται ότι τα περιθώρια επεξεργασίας και βελτιστοποίησης χωροχρονικών ερωτημάτων είναι μάλλον περιορισμένα, ιδίως όταν αυτά αναφέρονται στην τοπολογία ή στις τροχιές των αντικειμένων. Είναι εμφανές ότι κάποιοι ακριβοί χωρικοί τελεστές (λ.χ. χωρική σύνδεση) επενεργούν στο μηχανισμό επεξεργασίας των πλειάδων και δυσχεραίνουν την απόκριση στα ερωτήματα. Ενδεχομένως, γι αυτόν τον λόγο έχει νόημα η προσθήκη και χωρικών παραθύρων, εκτός από τα υφιστάμενα χρονικά παράθυρα και τα παράθυρα πλειάδων, ώστε να είναι δυνατόν να δηλωθούν περιοχές ενδιαφέροντος για μεγαλύτερο έλεγχο στην χωρική πτυχή των στοιχείων. Κάτι τέτοιο εκτιμάται ότι μπορεί να περιορίσει και τον επεξεργαστικό φόρτο, εφόσον η αποτίμηση των σχετικών ερωτημάτων διαρκείας θα αφορά μόνο τα αμέσως εμπλεκόμενα αντικείμενα. Όσον αφορά στην αποκεντρωμένη θεώρηση, να σημειώσουμε ότι τα συστήματα ομοτίμων είναι δίκτυα που το μέγεθός τους εξαρτάται από τη χρηστικότητά τους. Τα συστήματα ομότιμων βάσεων είναι της τάξης των 100-1000 κόμβων [KTS06], ενώ τα συστήματα ομότιμων που διαχειρίζονται αρχεία (π.χ. μουσικά αρχεία, εικόνες κλπ) είναι της τάξης των 10.000 κόμβων [KSS07]. Σε κάθε περίπτωση ο πειραματισμός με τέτοια δίκτυα δεν είναι εύκολος γιατί είναι αδύνατον να υλοποιηθεί σε ερευνητικό περιβάλλον ένα τέτοιο δίκτυο στις πραγματικές του διαστάσεις. Για το λόγω αυτό η πειραματική μελέτη αυτών των συστημάτων γίνεται με αντίστοιχες προσομοιώσεις, οι οποίες είναι εφικτό να υλοποιηθούν σε μικρό κόστος τόσο όσον αφορά το χρόνο όσο και το ανθρώπινο δυναμικό. Δυστυχώς, δεν υπάρχουν τέτοιες προσομοιώσεις που να αποτελούν σημεία αναφοράς και που να παρέχονται στο ευρύ ερευνητικό κοινό για προσαρμογή και πειραματισμό. Για το λόγο αυτό, αναπτύξαμε τους δικούς μας προσομοιωτές, για όλα τα συστήματα που θα αναπτύξουμε στα πλαίσια αυτής της εργασίας. Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στα [PS04, KTS06, KSS07]. (ΠΕ5) Πακέτο Εργασίας 5 Περιγραφή: Διαμόρφωση γλώσσας ερωταποκρίσεων. Στόχος: Διαμόρφωση άλγεβρας για ρεύματα δεδομένων κινούμενων αντικειμένων. Επέκταση κανόνων για την έκφραση ερωτημάτων διαρκείας σε συστήματα ομοτίμων. Έναρξη: αρχή 11 ου μήνα Πέρας: τέλος 12 ου μήνα (διάρκεια: 2 μήνες) Στο ΠΕ5 διαμορφώσαμε μία άλγεβρα περιγραφής ρευμάτων δεδομένων κινούμενων αντικειμένων, η οποία παρουσιάζεται αναλυτικά στην εργασία [PS06]. Να παρατηρήσουμε ότι η χρονική εξέλιξη των ρευμάτων επιδρά καθοριστικά στην επεξεργασία τους, καθιστώντας επιτακτικό τον προσδιορισμό κατάλληλου τύπου παραθύρων. Διαισθητικά, ένα παράθυρο αποσπά από το αχανές ρεύμα δεδομένων έναν πιθανόν μεταβαλλόμενο αλλά πάντως πεπερασμένο αριθμό στοιχείων, δηλαδή εκείνα τα τμήματα του ρεύματος που θα χρησιμοποιηθούν κατόπιν στην αποτίμηση του ερωτήματος. Καθώς νέα στοιχεία ολοένα καταφθάνουν στο σύστημα επεξεργασίας, τα περιεχόμενα του παραθύρου αλλάζουν δυναμικά κατά τον τρόπο που προδιαγράφει ο τύπος του. Κατά συνέπεια, το ερώτημα διαρκείας υπολογίζεται επί ενός συνόλου ανανεούμενων πλειάδων, οπότε το σύστημα μπορεί να παρέχει στον χρήστη επίκαιρες απαντήσεις συνεχώς. Η χρήση των παραθυρικών δομών επιβάλλεται μεν από τη σημασιολογία των σχετικών ερωτημάτων διαρκείας, αλλά αιτιολογείται και για λόγους εξοικονόμησης πόρων του συστήματος της μνήμης, κατά κύριο λόγο. Εκ των πραγμάτων, είναι αδύνατον να αποθηκεύονται όλα τα περιεχόμενα του ρεύματος, αφενός μεν λόγω του αυξανόμενου όγκου τους, αφετέρου δε εξαιτίας της επιβάρυνσης που θα δημιουργούσαν τόσο συχνές δοσοληψίες (εισαγωγές, διαγραφές, ενημερώσεις) σ ένα τυπικό σύστημα βάσεων δεδομένων. Επιπλέον, η χρησιμότητα κάθε μεμονωμένης πλειάδας (λ.χ. μετρήσεις θερμοκρασίας ανά λεπτό) είναι πρακτικά αμελητέα ώστε να αξίζει να αποθηκευθεί σε τόσο μεγάλη λεπτομέρεια. Σε ότι αφορά την αποκεντρωμένη αρχιτεκτονική, μελετήσαμε την έκφραση ερωτημάτων διαρκείας σε ένα σύστημα ομοτίμων με τη χρήση κανόνων. Τα αποτελέσματα αυτής της μελέτης παρουσιάζονται αναλυτικά στις εργασίες μας [KKZ+06, ZMKK06]. Ένα δίκτυο από ομότιμες βάσεις διαφέρει από ένα συμβατικό σύστημα πολυ-βάσεων (multidatabase system) λόγω της υπόθεσης της απόλυτης έλλειψης κεντρικού σχήματος και ελέγχου, καθώς και της διαρκούς εξέλιξης του δικτύου ομοτίμων. Σε διάφορες εφαρμογές ομότιμων βάσεων, θα ήταν χρήσιμο οι 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 7
συμμετέχουσες βάσεις να μπορούν να ενημερώνονται αυτόματα για αλλαγές στα δεδομένα άλλων βάσεων που είναι σημασιολογικά όμοια με τα δικά τους. Σε μια κεντρικοποιημένη βάση τη λειτουργία αυτή υλοποιούν οι σκανδαλιστές (triggers). Στα πλαίσια αυτής της εργασίας μας ενδιαφέρει η προσαρμογή των κεντρικοποιημένων σκανδαλιστών ώστε μια βάση που συμμετέχει σε ένα δίκτυο ομοτίμων να μπορεί να τους χρησιμοποιήσει ώστε να ενημερώνεται αυτόματα για αλλαγές στην πληροφορία γειτονικών βάσεων. Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στα [PS06, KKZ+06, ZMKK06]. Παραδοτέο Τα αποτελέσματα της δεύτερης φάσης του έργου παρουσιάζονται αναλυτικά στο δεύτερο παραδοτέο που έχει τίτλο «Μοντέλο αναπαράστασης δεδομένων και γλώσσα ερωταποκρίσεων» (Παράρτημα Γ). ΦΑΣΗ 3 (ΠΕ6, ΠΕ7, ΠΕ8, ΠΕ9, ΠΕ10, ΠΕ11) (ΠΕ6) Πακέτο Εργασίας 6 Περιγραφή: Ανάπτυξη δομών τήρησης ρευμάτων δεδομένων. Στόχος: Υλοποίηση δομών τήρησης των δεδομένων που θα εισέρχονται από τις πηγές (τα κινούμενα αντικείμενα). Έναρξη: αρχή 13 ου μήνα Πέρας: τέλος 18 ου μήνα (διάρκεια: 6 μήνες) Στο ΠΕ6 εξετάστηκαν κατάλληλες δομές τήρησης των δεδομένων από τα κινούμενα αντικείμενα. Στην εργασία [PPS06a] προτείναμε δύο προσεγγιστικούς αλγορίθμους που στηρίζονται στην τεχνική της δειγματοληψίας (sampling) και πραγματοποιούν ένα μόνο πέρασμα (single-pass) από το ρεύμα των θέσεων των αντικειμένων. Ο πρώτος αλγόριθμος συγκρίνει την πορεία κάθε σημειακού αντικειμένου με προκαθορισμένα κατώφλια που αναφέρονται στην ταχύτητα και τον προσανατολισμό της κίνησης. Έτσι, αν το αντικείμενο ακολουθεί μια προβλέψιμη πορεία εντός των ορίων του κατωφλίου, δεν είναι απαραίτητο να κρατηθεί η τρέχουσα θέση του. Ο δεύτερος αλγόριθμος (STTrace) επιχειρεί να διατηρήσει κατά το δυνατόν το σχήμα της τροχιάς, ελέγχοντας το δείγμα βάσει της σύγχρονης Ευκλείδειας απόστασης μεταξύ τριών διαδοχικών θέσεων. Και οι δύο αλγόριθμοι εκμεταλλεύονται την χωρική τοπικότητα και την χρονική επικαιρότητα των καταγραφόμενων θέσεων προκειμένου να επιλέξουν τα δείγματα που θα αποτελέσουν την συμπιεσμένη τροχιά, λειτουργώντας επί της ουσίας ως "έξυπνοι" τελεστές αποβολής φόρτου, όπως καταδεικνύεται και πειραματικά. Να τονίσουμε ότι πολλές φορές δεν είναι δυνατή η ακριβής αποτίμηση των ερωτημάτων διαρκείας σε ρεύματα δεδομένων. Στη εργασία [CGS06] παρουσιάσαμε μία νέα δομή σκίτσων το group-count-sketch για την αποδοτική κατασκευή περιλήψεων κυματιδίων. Η τεχνική διαφοροποιείται από παλιότερες δουλειές σε δύο άξονες. Δουλεύει κατευθείαν πάνω στα μετασχηματισμένα δεδομένα και επιτρέπει την γρήγορη εύρεση των πιο σημαντικών συντελεστών. Το αποτέλεσμα είναι μια τεχνική που βελτιώνει την ταχύτητα με την οποία μπορούμε να επεξεργαστούμε ρεύματα δεδομένων. Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στα [PPS06a, CGS06]. (ΠΕ7) Πακέτο Εργασίας 7 Περιγραφή: Διαχείριση ερωτημάτων σε σύστημα ομοτίμων. Στόχος: Μεθοδολογία διαχείρισης των κανόνων ερωτημάτων σε ένα καθαρό ή υβριδικό σύστημα ομοτίμων. Έναρξη: αρχή 13 ου μήνα Πέρας: τέλος 18 ου μήνα (διάρκεια: 6 μήνες) Στο ΠΕ7 επικεντρώσαμε το ενδιαφέρον μας στο πρόβλημα της ετερογένειας σε συστήματα ομότιμων βάσεων εστιάζουμε στο πρόβλημα της μείωσης ή αλλοίωσης της πληροφορίας που εκφράζεται από μια ερώτηση όταν αυτή μεταγράφεται στο μονοπάτι κατά το οποίο διαδίδεται. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 8
Ως πρώτο βήμα για τη λύση αυτού του προβλήματος προτάθηκε μια τεχνική που χρησιμοποιεί την κανονική ροή των ερωτήσεων στο σύστημα για να ανακαλύψει απομακρυσμένους ομότιμους κόμβους με χρήσιμη πληροφορία, οι οποίοι είναι όμως συγκαλυμμένοι από άλλους φτωχούς σε σχετική πληροφορία [KTS06]. Το δεύτερο βήμα είναι ανάδειξη ομάδων κόμβων του δικτύου που περιέχουν δεδομένα με παραπλήσια ή επικαλυπτόμενη σημασιολογία. Αφού το πρώτο βήμα έχει εφαρμοστεί για αρκετό διάστημα στο δίκτυο, η συσταδοποίηση των κόμβων με αυτό το στόχο έχει ήδη πραγματοποιηθεί σε μεγάλο βαθμό. Κατά το δεύτερο βήμα λοιπόν οι συστάδες αυτές γίνονται επώνυμες ομάδες μέσα στο δίκτυο, οι οποίες έχουν κάποιον κόμβο που αρχικοποιεί τη διαδικασία της ομαδοποίησης, μια λίστα με τα νυν μέλη της καθώς και ένα αφηρημένο σχήμα βάσης που είναι αντιπροσωπευτικό της πλειοψηφίας των κοινών δεδομένων των μελών της ομάδας. Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στο [KTS06]. (ΠΕ8) Πακέτο Εργασίας 8 (σε εξέλιξη) Περιγραφή: Επεξεργασία ερωτημάτων σε ρεύματα δεδομένων. Στόχος: Ανάπτυξη τεχνικών και αλγόριθμων για την επεξεργασία των ερωτημάτων διαρκείας ρευμάτων δεδομένων. Έναρξη: αρχή 19 ου μήνα Πέρας: τέλος 26 ου μήνα (διάρκεια: 8 μήνες) Σε περιβάλλοντα ρευμάτων δεδομένων, λόγω της πολλαπλότητας και των πιθανών ομοιοτήτων μεταξύ των ερωτημάτων έχει ιδιαίτερη σημασία η ουσιαστική βελτίωση των επιδόσεων της συντελούμενης επεξεργασίας. Στην εργασία [S06] έγινε μία περιγραφή των κυριότερων ερευνητικών προβλημάτων που σχετίζονται με τις περιλήψεις μετασχηματισμού κυματιδίων. Οι περιλήψεις αυτές χρησιμοποιούνταν ευρέως για την παραγωγή γρήγορων προσεγγιστικών απαντήσεων σε σύνθετα ερωτήματα OLAP (συστήματα αναλυτικής επεξεργασίας). Τα τελευταία χρόνια έχει γίνει αρκετή δουλειά στην κατασκευή αλγορίθμων που να επιτρέπουν την κατασκευή περιλήψεων πάνω από δυναμικά ρεύματα δεδομένων. Μία συγκριτική μελέτη των υπαρχουσών τεχνικών περίληψης παρουσιάζεται στην εργασία [MSS06]. Στην εργασία [JSS05] εισήγαμε τις πράξεις shift και split, που λειτουργούν κατευθείαν πάνω σε μετασχηματισμένα δεδομένα. Οι πράξεις αυτές μας επέτρεπαν να διαχειριστούμε ρεύματα δεδομένων και να βρούμε την κατάλληλα ισορροπία ανάμεσα στο απαιτούμενο χώρο και χρόνο κατασκευής. Επιπλέον περιγράψαμε την επέκταση των πράξεων για πολυδιάστατα ρεύματα δεδομένα, όπως για παράδειγμα ρεύματα που περιέχουν χωρική και χρονική πληροφορία. Όταν οι διαθέσιμοι υπολογιστικοί πόροι είναι πολύ περιορισμένοι θα πρέπει να στραφούμε σε λύσεις που χρησιμοποιούν γρήγορες και μικρές δομές με πιθανοτικές εγγυήσεις, όπως τα σκίτσα. Στην εργασία [CGS06] κατασκευάζονται περιλήψεις κυματιδίων για πολυδιάστατα δεδομένα εκμεταλλευόμενοι μία καινοτόμα δομή, τα σκίτσα ομάδων (group-count-sketch). Ο αλγόριθμός μας διαθέτει μια σημαντικά μεγάλη σχεδιαστική ελευθερία ώστε παρέχει τη δυνατότητα προσαρμογής της τεχνικής στα ιδιαίτερα χαρακτηριστικά του τελικού συστήματος. Μία ενδιαφέρουσα τεχνική κατασκευής περιλήψεων έγκειται στην λύση του δυικού προβλήματος [MSS06]. Το ορθό πρόβλημα περιλήψεων είναι η εύρεση της βέλτιστης, ως προς το παραγόμενο σφάλμα, περίληψης δεδομένου του περιορισμού χώρου. Το δυικό πρόβλημα, αντίθετα, δεδομένου ενός μέγιστου επιτρεπόμενου σφάλματος παράγει τη βέλτιστη λύση από άποψη χώρου. Το πλεονέκτημα της εφαρμογής του δυικού προβλήματος για τη λύση του ορθού είναι η πιο αποτελεσματική παραγωγή της περίληψης. Σχετικά με τον απαιτούμενο χώρο που καταλαμβάνει μια περίληψη, κάναμε την παρατήρηση ότι πολύς χώρος δαπανάται άσκοπα στην δεικτοδότηση των περιλήψεων. Στην εργασία [SDS07] προτείνουμε μία νέα μέθοδο δεικτοδότησης περιλήψεων κυματιδίων που καταναλώνει λιγότερο χώρο προσφέροντας τις ίδιες εγγυήσεις ακρίβειας. Πρώτα εισάγουμε μία τεχνική δυναμικού προγραμματισμού που λύνει βέλτιστα το πρόβλημα. Στη συνέχεια παρουσιάζουμε έναν προσεγγιστικό αλγόριθμο του οποίου η ζητούμενη ακρίβεια δίνεται ως είσοδος, και τέλος έναν γρήγορο άπληστο αλγόριθμο που ενώ δεν παρέχει εγγυήσεις φαίνεται πειραματικά να αποδίδει εξίσου καλά με τον βέλτιστο. Να σημειώσουμε ότι στην εργασία παρουσιάζονται οι επεκτάσεις όλων των προτεινόμενων αλγορίθμων για την περίπτωση ρευμάτων δεδομένων. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 9
Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στα [S06, MSS06, JSS05, CGS06, SDS07]. (ΠΕ9) Πακέτο Εργασίας 9 (σε εξέλιξη) Περιγραφή: Δεικτοδότηση χωροχρονικών δεδομένων σε σύστημα ομοτίμων. Στόχος: Ανάπτυξη δομών και αλγορίθμων για την δεικτοδότηση χωροχρονικών δεδομένων σε σύστημα ομοτίμων. Έναρξη: αρχή 19 ου μήνα Πέρας: τέλος 26 ου μήνα (διάρκεια: 8 μήνες) Στο ΠΕ9 διεξάγουμε έρευνα στην περιοχή των δομημένων συστημάτων ομοτίμων τα οποία διαχειρίζονται πολυδιάστατη πληροφορία, περιορίζοντας το ενδιαφέρον μας συγκεκριμένα για χωρική πληροφορία. Στα πλαίσια αυτού του ενδιαφέροντος εργαζόμαστε για την ανάπτυξη μιας τεχνικής δεικτοδότησης και δρομολόγησης χωρικών δεδομένων, που θα είναι κατάλληλη για εφαρμογές που διαχειρίζονται χωρικά δεδομένα ποικίλου μεγέθους. Η τεχνική που αναπτύσσουμε εκμεταλλεύεται την υπάρχουσα εμπειρία στο πεδίο των κατανεμημένων τεχνικών κατάτμησης (DHTs) και εγγυάται την ανάκτηση κάθε χωρικής περιοχής που είναι αποθηκευμένη στο σύστημα με χαμηλά άνω όρια πολυπλοκότητας χώρου και χρόνου [KSS07]. Σημαντικό είναι να τονίσουμε ότι η τεχνική που αναπτύσσουμε διατηρεί την τοπικότητα (locality) των περιοχών: αυτό σημαίνει ότι εγγυάται εύκολη πρόσβαση για την ανάκτηση περιοχών ανάλογα με το πόσο δημοφιλείς είναι ή ανάλογα με την εγγύτητά τους στην περιοχή που αντιστοιχεί στον κόμβο που αρχικοποιεί την αναζήτηση (proximity). Επιπρόσθετα, πέραν της εγγύτητας, η τεχνική διατηρεί την κατευθυνσημότητα (directionality) του χώρου. Τέλος, η τεχνική διαχειρίζεται ακέραιες περιοχές διαφορετικών μεγεθών και αποφεύγει έτσι ένα μεγάλο μέρος των ερωτήσεων διακύμανσης (range queries). Τα παραπάνω αποτελέσματα έχουν παρουσιαστεί στο [KSS07]. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 10
2.3. Συνολικά αποτελέσματα και παραδοτέα του έργου Αναφέρονται α) τα αποτελέσματα τα οποία επιτεύχθηκαν στο πλαίσιο του έργου, β)η πιθανή μελλοντική αξιοποίηση τους και γ)κατάλογος των δημοσιεύσεων που αφορούν ερευνητικές δραστηριότητες στα πλαίσια του έργου. Είναι απαραίτητο η Ετήσια/Τελική Έκθεση Ολοκλήρωσης Έργου να συνοδεύεται από τα αντίστοιχα παραδοτέα του έργου που έχουν ολοκληρωθεί και είναι δυνατή η αποστολή τους στη ΓΓΕΤ. (1 αντίτυπο+ ηλ. μορφή) Αποτελέσματα τα οποία επιτεύχθηκαν στο πλαίσιο του έργου Όπως έχουμε ήδη αναφέρει η διαχείριση δεδομένων εντοπισμού κινουμένων εμπλέκει πολλές και ετερογενείς ερευνητικές περιοχές. Τα αποτελέσματα που επιτεύχθηκαν στο πλαίσιο του παρόντος έργου μπορούν να διακριθούν στις παρακάτω ενότητες. Ρεύματα δεδομένων Διαμορφώνουμε μία άλγεβρα για τη διατύπωση ερωτημάτων διαρκείας σε ρεύματα δεδομένων, στηριζόμενοι σε χρονικά και χωροχρονικά παράθυρα. Η θεωρητική τεκμηρίωση των προτάσεών μας δίνεται στις εργασίες [PS06, PS07]. Περιλήψεις ρευμάτων Πραγματοποιήσαμε μία εκτεταμένη αναλυτική και πειραματική σύγκριση μεταξύ των υπαρχουσών τεχνικών περίληψης κυματιδίων. Διαπιστώσαμε την καταλληλότητα των μεθόδων για της αναπαράσταση πολυδιάστατων ρευμάτων δεδομένων [S06, MSS06] Προτείναμε τεχνικές για την εύρεση της χρυσής τομής μεταξύ του απαιτούμενου χώρου και της αναμενόμενης χρονικής διάρκειας στη κατασκευή περιλήψεων κυματιδίων. Δείχνουμε, πειραματικά ότι οι μέθοδοι μας βελτιώνουν σημαντικά τις υπάρχουσες τεχνικές [JSS05, CGS06]. Προτείναμε τεχνικές που βελτιώνουν το μέγεθος των περιλήψεων κυματιδίων, επιτρέποντας την τήρηση περιλήψεων μεγαλύτερης ακρίβειας. Επίσης προτείνεται ένας αλγόριθμος που χρησιμοποιεί τη λύση του δυικού προβλήματος για να επιλύσει πιο γρήγορα το ορθό πρόβλημα. Διαπιστώνουμε ότι η χρήση των προτεινόμενων αλγορίθμων οδηγεί σε σημαντικά οφέλη σε σχέση με παραδοσιακές τεχνικές [KSM07, SDS07]. Διαχείριση κινούμενων αντικειμένων Προτείναμε μεθόδους για την προσεγγιστική τήρηση των τροχιών κινουμένων αντικειμένων με βάση μεθόδους δειγματοληψίας. Για να αναπαραστήσουμε το ιστορικό των τροχιών εισάγουμε την έννοια της αμνησιακής προσέγγισης. Η υλοποίηση των τεχνικών που προτείναμε και η εφαρμογή τους σε πραγματικά δεδομένα κινουμένων αντικειμένων ανέδειξε την καταλληλότητα τους [PS04, PPS06a, PPS06b, PPS07]. Προτείναμε τεχνικές για συσταδοποίηση ρευμάτων κινουμένων αντικειμένων με τη χρήση μία ολική διάταξης. Τα πειραματικά αποτελέσματα έδειξαν ότι οι τεχνικές μας είναι ιδιαίτερα αποτελεσματικές για ταχέως κινούμενα αντικείμενα [PSM07]. Ερωτήματα διαρκείας ομοτίμων Αναπτύξαμε αλγόριθμους και μεθοδολογίες για την υποστήριξη κατανεμημένους κανόνες της μορφής Γεγονός-Συνθήκη-Ενέργεια σε ένα περιβάλλοντα πολυβάσεων [ΚΚΜ], και περαιτέρω σε περιβάλλοντα ομοτίμων. Για τα τελευταία προτάθηκαν κατανεμημένοι σκανδαλιστές για διαχείριση των ομότιμων δεδομένων [ΚΚΖ+06]. Επίσης, προτείναμε την χρήση κανόνων της μορφής Γεγονός-Συνθήκη-Ενέργεια για την υλοποίηση κινούμενων πρακτόρων που αντιπροσωπεύουν ερωτήματα σε γρήγορα εξελισσόμενα καθαρά συστήματα ομοτίμων βάσεων [ΚΤ05]. Τέλος, σχεδιάσαμε έναν μηχανισμό μεταγραφής κανόνων της μορφής Γεγονός- Συνθήκη-Ενέργεια για συστήματα ομότιμων βάσεων [ΖΜΚ+06]. Διαχείριση δομημένων δεδομένων Μοντελοποιήσαμε τη διαχείριση δομημένων δεδομένων σε ένα σύστημα ομότιμων βάσεων [ΚΚΖ+06, KTS+06]. Εστιάζοντας στο κυριότερο πρόβλημα σε αυτό το πλαίσιο, δηλαδή την ετερογένεια των δεδομένων, προτείναμε μια μεθοδολογία για την ανακάλυψη ομοτίμων που έχουν χρήσιμη πληροφορία και την συσταδοποίηση των ομοτίμων ανάλογα με τις ανάγκες και τις παροχές τους σε πληροφορία [KTS+06]. Σε αυτό το πλαίσιο προτείναμε την 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 11
επαναχρησιμοποίηση των κλασσικών μεθοδολογιών μεταγραφής ερωτημάτων σε ομότιμες βάσεις [KS06]. Τέλος περιγράψαμε μια μεθοδολογία και τους αντίστοιχους αλγορίθμους για την σημασιολογική ομαδοποίηση των κοινωνικών δικτύων σε συστήματα ομότιμων βάσεων [KTS07]. Διαχείριση χωρικών δεδομένων Όσον αφορά τα συστήματα ομοτίμων αναπτύξαμε ένα πλαίσιο το οποίο μπορεί να διαχειριστεί χωρικά δεδομένα έτσι ώστε σε ένα δομημένο δίκτυο να εγγυόμαστε αποδοτική αναζήτηση της πληροφορίας [KSS07]. Το πλαίσιο αυτό συμπληρώθηκε με μια μελέτη για τις παραμέτρους ενός κατανεμημένου πλαισίου που διαχειρίζεται χωρικά δεδομένα [KS07]. Απόρρητο και ανωνυμία Προτείναμε δομές και μέθοδοι για την διασφάλιση απορρήτου και ανωνυμίας σε κατανεμημένες αρχιτεκτονικές. Αποδεικνύουμε ότι οι προτεινόμενες μέθοδοι προστατεύουν το απόρρητο και την ανωνυμία των χρηστών με εγγυημένα όρια [GKS07a, GKS07b]. Πιθανή μελλοντική αξιοποίηση τους Οι υπηρεσίες εντοπισμού καθώς και διαχείρισης δεδομένων σε τόσο σε συγκεντρωτικά όσο και σε κατανεμημένα και περιβάλλοντα που αποτελούνται από αυτόνομες πηγές έχουν ήδη περάσει από το ερευνητικό σε εμπορικό στάδιο. Η ευρύτατη διάδοση των συσκευών επικοινωνίας με δυνατότητες γεωγραφικού εντοπισμού δίνει την ευκαιρία σε πολλές εταιρείες και οργανισμούς να προσφέρουν πληθώρα νέων ηλεκτρονικών υπηρεσιών διευρύνοντας τους επιχειρηματικούς τους ορίζοντες. Η έρευνά μας στοχεύει στην προώθηση των παραπάνω τεχνολογιών. Τα αποτελέσματα της ερευνάς μας όσον αφορά τα ρεύματα δεδομένων μπορούν να αξιοποιηθούν άμεσα για την βελτιστοποίηση των εμπορικών υπηρεσιών εντοπισμού. Επίσης, τα αποτελέσματα της έρευνάς μας όσον αφορά τα δίκτυα ομοτίμων, στοχεύουν στην υλοποίηση εμπορικών συστημάτων που να διαχειρίζονται ετερογενή δομημένα δεδομένα έτσι ώστε να μπορούν να συμμετάσχουν στο σύστημα αυτόνομες βάσεις, κάτι το οποίο δεν συμβαίνει μέχρι τώρα. Τέλος η έρευνά μας σχετικά τη διαχείριση χωρικών δεδομένων σε συστήματα ομοτίμων, μπορεί να αξιοποιηθεί άμεσα στα εμπορικά συστήματα ομοτίμων έτσι ώστε αυτά να διαχειρίζονται πολυδιάστατη πληροφορία. Κατάλογος των δημοσιεύσεων CGS06 GKS07a GKS07b JSS05 KKM KKZ+06 G. Cormode, M. Garofalakis, D. Sacharidis, Fast Approximate Wavelet Tracking on Streams. In Proceedings of the 10th International Conference on Extending Database Technology (EDBT), Munich, Germany, March 26-31, 2006. G. Ghinita, P. Kalnis, S. Skiadopoulos. Prive: Anonymous Location-Based Queries in Distributed Mobile Systems. In Proceedings of the 16th international conference on World Wide Web (WWW), Banff, Alberta, Canada, May 8-12, 2007. G. Ghinita, P. Kalnis, S. Skiadopoulos. MobiHide: A Mobile Peer-to-Peer System for Anonymous Location-Based Queries. In Proceedings of the 10th International Symposium Advances in Spatial and Temporal Databases (SSTD), Boston, MA, USA, July 16-18, 2007. M. Jahangiri, D. Sacharidis, C. Shahabi, SHIFT-SPLIT: I/O Efficient Maintenance of Wavelet-Transformed Multidimensional Data. In Proceedings of the ACM SIGMOD International Conference on Management of Data (SIGMOD), Baltimore, Maryland, USA, June 14-16, 2005. V. Kantere, I. Kiringa, J.Mylopoulos. Supporting Distributed Event-Condition- Action Rules in a Multidatabase Environment. International Journal of Cooperative Information Systems.(To Appear) V. Kantere, I. Kiringa, Q. Zhou J.Mylopoulos, G. McArthur. Distributer Triggers for Peer Data Management. In Proceedings of the 14th International Conference on Cooperative Information Systems (CoopIS), Montpellier, France, November 1-3, 2006. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 12
KS06 KS07 KSM07 KSS07 KT05 KTS+06 KTS07 MSS06 PPS06a PPS06b PPS07 PS04 PS06 PS07 PSM07 V. Kantere, T. Sellis. Reusing Classical Query Rewriting in P2P Databases. In Proceedings of the 5th International Workshop on Databases, Information Systems and Peer-to-Peer Computing (DBISP2P), Seoul, South Korea, September 24, 2006. V. Kantere, T. Sellis. A Study for the Parameters of a Distributed Framework that Handles Spatial Areas. In Proceedings of the 10th International Symposium Advances in Spatial and Temporal Databases (SSTD), Boston, MA, USA, July 16-18, 2007. P. Karras, D. Sacharidis, N. Mamoulis, Exploiting Duality in Summarization with Deterministic Guarantees. In Proceedings of Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), San Jose, CA, USA, August 12-15, 2007. V. Kantere, T. Sellis, S. Skiadopoulos. Storing and Indexing Spatial data in P2P Systems, Technical Report TR-2006-5, Knowledge and Database Systems Lab, National Technical University of Athens, 2007 (submitted to an international journal). V. Kantere, A. Tsois. Using ECA Rules to Implement Mobile Query Agents for Fast-Evolving Pure P2P Database Systems. In Proceedings of the 6th International Conference on Mobile Data Management (MDM), Ayia Napa, Cyprus, May 9-13, 2005 V. Kantere, D. Tsoumakos, T. Sellis, N. Roussopoulos. GrouPeer: Dynamic Clustering of P2P Databases. Technical Report TR-2006-4, Knowledge and Database Systems Lab, National Technical University of Athens. 2006. V. Kantere, D. Tsoumakos, T. Sellis. Semantic Grouping of Social Networks in P2P Database Settings. Technical Report, 2007. M. Mathioudakis, D. Sacharidis, T. Sellis, A Study on Workload-Aware Wavelet Synopses. In Proceedings of ACM 9th International Workshop on Data Warehousing and OLAP (DOLAP), Arlington, Virginia, USA, November 10, 2006. M. Potamias, K. Patroumpas, T. Sellis. Sampling Trajectory Streams with Spatiotemporal Criteria. In Proceedings of the 18th International Conference on Scientific and Statistical Database Management (SSDBM), Vienna, Austria, 3-5 July, 2006. M. Potamias, K. Patroumpas, T. Sellis. Amnesic online synopses for moving objects. In Proceedings of the 2006 ACM CIKM International Conference on Information and Knowledge Management (CIKM), Arlington, Virginia, USA, November 6-11, 2006. M. Potamias, K. Patroumpas, T. Sellis. Online Amnesic Summarization of Streaming Locations. In Proceedings of the 10th International Symposium Advances in Spatial and Temporal Databases (SSTD), Boston, MA, USA, July 16-18, 2007. K. Patroumpas, T. Sellis. Managing Trajectories of Moving Objects as Data Streams. Ιn Proceedings of the Second Workshop on Spatio-Temporal Database Management (STDBM), Toronto, Canada, August, 2004. K. Patroumpas, T. Sellis. Window Specification over Data Streams. In Proceedings of the International Conference on Semantics of a Networked World (ICSNW), Munich, Germany, March 2006. K. Patroumpas, T. Sellis. Semantics of Spatially-aware Windows over Streaming Moving Objects. In Proceedings of the 8th International Conference on Mobile Data Management (MDM), Mannheim, Germany, May 7-11, 2007 S. Papadopoulos, D. Sacharidis, K. Mouratidis, Continuous Medoid Queries over Moving Objects. In Proceedings of the 10th International Symposium Advances in Spatial and Temporal Databases (SSTD), Boston, MA, USA, July 16-18, 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 13
S06 SDS07 2007. D. Sacharidis, Constructing Optimal Wavelet Synopses. In Proceedings of PhD Workshop of the 10th International Conference on Extending Database Technology (EDBT), Munich, Germany, March 26-31, 2006. D. Sacharidis, A. Deligiannakis, T. Sellis, Hierarchically Compressed Wavelet Synopses. Submitted for publication in the VLDB Journal, 2007. SGS+05 S. Skiadopoulos, C. Giannoukos, N. Sarkas, P. Vassiliadis, T. Sellis, M. Koubarakis. Computing and Managing Cardinal Direction Relations. IEEE Transaction on Knowledge and Date Engineering, 17(12):1610--1623, 2005. ZMK+06 D. Zhao, J. Mylopoulos, I. Kiringa, V. Kantere. An ECA Rule Rewriting Mechanism for Peer Data Management Systems. In Proceedings of the 10th International Conference on Extending Database Technology (EDBT), Munich, Germany, March 26-31, 2006. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 14
3. ΣΧΟΛΙΑ - ΠΡΟΒΛΗΜΑΤΑ - ΠΑΡΑΤΗΡΗΣΕΙΣ 3.1. Τεχνολογία / Τεχνογνωσία που αποκτήθηκε στα πλαίσια του έργου Σχετικά με την συγκεντρωτική θεώρηση, χρειάστηκε να μελετήσουμε διάφορα συστήματα ρευμάτων δεδομένων και να εξετάσουμε την δυνατότητα έκφρασης ερωτημάτων διαρκείας σε αυτά. Συγκεκριμένα, εξοικειωθήκαμε με τα συστήματα STREAM και TelegraphCQ και τις αντίστοιχες γλώσσες ερωτημάτων CQL και StreaQuel. Επίσης αποκτήσαμε την απαραίτητη τεχνογνωσία για την σχεδίαση και υλοποίηση εξειδικευμένων προσομοιωτών ώστε να ανταποκρίνονται στις απαιτήσεις διαχείρισης δεδομένων κινούμενων αντικειμένων. Για την έρευνα που πραγματοποιήσαμε στα πλαίσια των συστημάτων ομοτίμων χρειάστηκε να αποκτήσουμε τεχνογνωσία σχετικά με την απάντηση ερωτημάτων που τίθενται σε μια βάση αλλά και σχετικά με την αυτόματη ενημέρωση πεδίων σε μία βάση. Συγκεκριμένα, ασχοληθήκαμε εκτενώς με τους αλγορίθμους μεταγραφής ερωτημάτων από ένα τοπικό σχήμα βάσης σε ένα καθολικό μεσολαβούν σχήμα και το αντίθετο. Επίσης, μάθαμε με λεπτομέρεια τη λειτουργία των μηχανισμών σκανδαλιστών σε μια κεντρική βάση. Τέλος, εξοικειωθήκαμε με μια από τις κύριες προσομοιώσεις για την υλοποίηση δομημένων δικτύων ομοτίμων καθώς και με την διαδεδομένη πλατφόρμα προσομοίωσης για ασύρματα δίκτυα ns2. 3.2. Συνεργασία φορέων (οικονομικό και φυσικό αντικείμενο) Η συνεργασία των φορέων τόσο στο οικονομικό όσο και στο φυσικό αντικείμενο ήταν πολύ καλή. Το Ε.Μ.Π. έδωσε μεγάλη σημασία στην εκπαίδευση των υποψήφιων διδακτόρων και στην παραγωγή πρωτογενούς έρευνας. Το επιστημονικό πλαίσιο στο οποίο κινούνται οι διατριβές βρίσκεται διεθνώς στην πρώτη γραμμή των ερευνητικών αναζητήσεων ως προς το ζήτημα της διαχείρισης δεδομένων, τόσο από την σκοπιά των δικτύων ομοτίμων, όσο και σε σχέση με τα συστήματα ρευμάτων δεδομένων. Τα αποτελέσματα του ερευνητικού έργου ανακοινώθηκαν σε διεθνή συνέδρια και δημοσιεύθηκαν σε έγκριτα διεθνή περιοδικά. Επιπλέον, το Ε.Μ.Π. ενισχύει εμπράκτως την επαφή με τον κόσμο της αγοράς, διαμέσου της συνεργασίας του με εταιρείες που προωθούν τις νέες τεχνολογίες, όπως η ΕΜΦΑΣΙΣ Τηλεματική. Η ΕΜΦΑΣΙΣ Τηλεματική εστιάζει το ενδιαφέρον της στην ανίχνευση των νέων ερευνητικών ευρημάτων στον τομέα της διαχείρισης δεδομένων και στην προσπάθεια μεταφοράς τους σε εφαρμοσμένα συστήματα, κυρίως σε θέματα διαχείρισης στόλου οχημάτων και τηλεματικής. Η πρακτική υλοποίηση των αποτελεσμάτων της ερευνητικής προσπάθειας θα οδηγήσει σε βελτιωμένες μεθόδους και αλγορίθμους λογισμικού, καθώς και στην ανάπτυξη νέων προϊόντων και υπηρεσιών. Μια τέτοια εξέλιξη δεν μπορεί παρά να είναι ιδιαίτερα ευνοϊκή σε ό,τι αφορά την επέκταση των δραστηριοτήτων της εταιρείας σε άλλους τομείς (λ.χ. εφαρμογές σε μαζικές μεταφορές, αστικές συγκοινωνίες), καθώς και περαιτέρω δυνατότητες στρατηγικών ανοιγμάτων (λ.χ. συνεργασίες με εταιρείες παροχής δεδομένων ή χαρτών, τηλεπικοινωνίες κ.ά.), με υπολογίσιμα οικονομικά οφέλη. Επιπλέον, η ανταλλαγή απόψεων με την ερευνητική ομάδα έχει ευεργετική επίδραση στο επιστημονικό και τεχνικό προσωπικό της εταιρείας, ανοίγοντας τους γνωστικούς του ορίζοντες και παρέχοντας την ευκαιρία συνεχούς επιμόρφωσης σε ποικιλία τεχνικών και επιστημονικών ζητημάτων. 3.3. Αιτιολόγηση αποκλίσεων δαπανών ανά φορέα και κατηγορία δαπάνης σε σχέση με την αρχική πρόβλεψη Δεν υπάρχουν αποκλίσεις. 3.4. Λοιπές παρατηρήσεις Δεν υπάρχουν αποκλίσεις. 03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 15
03ΕΔ-291... ΚΩΔ. ΥΠΟΕΡΓΟΥ : 16