Παραδοτέο Π.4.3. Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων δεδομένων

Σχετικά έγγραφα
Παραδοτέο Π.4.2. Μέθοδοι για παραγωγή στατιστικών και συνόψεων δεδομένων

Παραδοτέο Π.1.3. Μηχανισμοί δεικτοδότησης μη-παραδοσιακών δεδομένων

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Παραδοτέο Π.4.1. Διαχείριση πληροφορίας σε μεγάλης κλίμακας πληροφορικά συστήματα

Παραδοτέο Π.5.1. Μοντελοποίηση της εξέλιξης υπερχώρων και οικοσυστημάτων πληροφορίας

Παραδοτέο Π.3.1. Διαχείριση δεδομένων συμπεριφοράς χρήστη

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 04/12/2014 Α.Π. : Προς: ΙΝ/ΤΟ ΠΛΗΡ/ΚΩΝ ΣΥΣ/ΤΩΝ&ΠΡΟΣ/ΣΗΣΕΡΕΥΝ/ΚΟ ΚΕΝΤΡΟ ΚΑΙΝ/ΜΙΑΣ&ΤΗΣ

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Παραδοτέο Π.5.2. Ρύθμιση της εξέλιξης υπερχώρων και οικοσυστημάτων πληροφορίας

Πίνακας περιεχοµένων

Παραδοτέο Π.2.3. Μηχανισμοί επερώτησης και ανάκτησης πληροφορίας

Παραδοτέο Π.2.2. Εξαγωγή δεδομένων, αντιστοίχιση τιμών και δομών, και ολοκλήρωση πληροφορίας

ΔΡΑΣΗ 2: Καταγραφή της υφιστάμενης κατάστασης των ελαιοτριβείων και των περιοχών διάθεσης αποβλήτων ελαιοτριβείων στην Κρήτη ΠΑΡΑΔΟΤΕΟ 2Γ:

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Detecting Duplicates over Distributed Data Sources. Δημήτρης Σουραβλιάς

Παραδοτέο Π.3.3. Σχεδίαση οικοσυστημάτων πληροφορίας γύρω από υπερχώρους δεδομένων

Παραδοτέο Π.3.2. Μοντελοποίηση χρήστη και διαχείριση προτιμήσεων

ΑΔΑ: Β4ΛΡ9-ΒΔΒ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Παραδοτέο Π6.1 Έκθεση με προτάσεις για την αξιοποίηση των αποτελεσμάτων του έργου

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

ΑΔΑ: Β4Λ59-0ΓΓ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Ίδρυμα Τεχνολογίας και Έρευνας Ινστιτούτο Πληροφορικής (ITE-ΙΠ)

Ερωτήσεις Χωροχρονικών. Προτύπων-Κινήσεων

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Τι είναι τα εξελιγμένα-έξυπνα δίκτυα-σκοπός του ΔΜΔΕ ΓΕΝΙΚΗ ΠΕΡΙΓΡΑΦΗ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 7022 Προς: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ 76 T.

14/10/2005. <id, ts, x, y> (online). (single-pass). Potamias-abstract.pdf

Εισαγωγή. Κατανεµηµένα Συστήµατα 01-1

Επερωτήσεις σύζευξης με κατάταξη

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΑΝΟΙΧΤΗ ΠΡΟΣΚΛΗΣΗ ΓΙΑ ΥΠΟΒΟΛΗ ΠΡΟΤΑΣΕΩΝ ΣΤΟ ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «Εκπαίδευση και Δια Βίου Μάθηση» ΘΑΛΗΣ

Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων

ΑΔΑ: Β49Ι9-8ΩΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 7015 Προς: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ 76 T.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Τεχνικές Εξόρυξης Δεδομένων

ΑΔΑ: Β41Ρ9-Ξ2Ξ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Τι προσφέρουν τα Τµήµατα Πληροφορικής. ... το Εργαστήριο Πληροφοριακών Συστηµάτων του Πα.Πει. Ερευνητικές δραστηριότητες σε GI Ενδεικτικές εργασίες

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 7043 Προς: ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΠΟΛΥΤΕΧΝΕΙΟΥΠΟΛΗ - ΚΟΥΝΟΥΠΙΔΙΑΝΑ T.

Κατανεμημένα Συστήματα: Θεωρία και Προγραμματισμός. Ενότητα # 1: Εισαγωγή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Περιγραφή Χρηματοδοτούμενων Ερευνητικών Έργων 1η Προκήρυξη Ερευνητικών Έργων ΕΛ.ΙΔ.Ε.Κ. για την ενίσχυση Μεταδιδακτόρων Ερευνητών/Τριών

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Θέμα: Ανάπτυξη Βασικής Πλατφόρμας για Υπηρεσίες με Βάση το Προφίλ και τη Θέση (Profile & Location Based Services)

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 6982 Προς: ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Σ.Π.Σ. ΒΑΣ.ΣΟΦΙΑΣ 12 T.

ΑΔΑ: Β4Λ59-ΤΗ6 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4ΛΔ9-ΞΒΣ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4139-ΖΘΥ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β41Ρ9-ΜΘ6 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

ΑΔΑ: Β41Δ9-ΝΓ9 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

h t t p s : / / k p p. c t i. g r

ιαδικτυακές Εξερευνήσεις (Ιστοεξερευνήσεις) (Web Quest) Μάθηση η βασισμένη σε Πηγές Resource-based Learning

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ ΜΑΘΗΜΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Β ΛΥΚΕΙΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Παραδοτέο Π.1.2. Τεχνικές ανάκτησης πληροφορίας από πηγές μηπαραδοσιακών

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΙΑΧΕΙΡΙΣΗ ΠΕΡΙΓΡΑΦΙΚΩΝ ΣΤΟΙΧΕΙΩΝ

Οι Τομείς (κατευθύνσεις ειδικότητας) του Τμήματος Πληροφορικής & Επικοινωνιών είναι:

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

ΑΔΑ: Β4ΛΔ9-ΧΙΜ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4ΩΚ9-Ν5Δ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ Εργ. Συστημάτων Βάσεων Γνώσεων & Δεδομένων LOCATION BASED SERVICES ΕΙΣΑΓΩΓΙΚΟ ΣΗΜΕΙΜΩΜΑ

Την Επιτροπή αποτελούν οι:

ΑΔΑ: Β49Ι9-ΤΒΑ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Σύβακας Σταύρος ΠΕ19,MSc. IT ΣΥΒΑΚΑΣ ΣΤΑΥΡΟΣ ΕΡΩΤΗΜΑΤΑ

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Οπτικοποίηση ρευµάτων τροχιάς κινούµενων αντικειµένων

ΠΡΟΣΚΛΗΣΗ ΕΚ ΗΛΩΣΗΣ ΕΝ ΙΑΦΕΡΟΝΤΟΣ ΓΙΑ ΥΠΟΒΟΛΗ ΠΡΟΤΑΣΗΣ ΠΡΟΣ ΣΥΝΑΨΗ ΣΥΜΒΑΣΗΣ ΑΝΑΘΕΣΗΣ ΕΡΓΟΥ

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud

Ε Ξ Α Γ Ω Γ H Γ Ε Ω Γ ΡΑ Φ Ι Κ H Σ Π Λ Η Ρ Ο Φ Ο Ρ Ί Α Σ Α Π O Η Μ Ι Δ Ο Μ Η Μ E Ν Ο Κ Ε I Μ Ε Ν Ο ( G E O P A R S I N G W E B P A G E S )

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

ANAΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ

ANAΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ

MY FLEET. Σύστημα Αδιάλειπτης Παρακολούθησης στόλου οχημάτων

Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΚΑΙ ΕΦΑΡΜΟΣΜΕΝΩΝ ΕΠΙΣΤΗΜΩΝ

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Μια μεθοδολογία αξιολόγησης της πανταχού πρόσβασης σε φυσικούς και ψηφιακούς χώρους πληροφόρησης

ΑΔΑ: Β41Δ9-ΡΛ3 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Transcript:

Έργο: Τίτλος Υποέργου: «ΘΑΛΗΣ: Ενίσχυση της Διεπιστημονικής ή και Διιδρυματικής έρευνας και καινοτομίας με δυνατότητα προσέλκυσης ερευνητών υψηλού επιπέδου από το εξωτερικό μέσω της διενέργειας βασικής και εφαρμοσμένης έρευνας αριστείας» «ΕΙΚΟΣ»: Θεωρητική και αλγοριθμική θεμελίωση για Προσωποκεντρικά Συνεργατικά Πληροφοριακά Συστήματα Παραδοτέο Π.4.3 Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων δεδομένων Σεπτέμβριος 2015

Δράση 4 Κατανεμημένες Υποδομές Αποθήκευσης, Προσπέλασης και Διαχείρισης Δεδομένων Ομάδα Ερ. Ομάδα 4 Έναρξη 01/06/2012 Λήξη 30/11/2015 Συντονιστής ΕΟ4 Παναγιώτης Τριανταφύλλου (Παν. Πατρών) Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων Υποδράση: ΥΔ 4.3 δεδομένων Παναγιώτης Τριανταφύλλου (Παν. Πατρών), Αντώνιος Δεληγιαννάκης (Πολυτεχνείο Συμμετέχοντες Μέλη ΚΕΟ Κρήτης), Βασίλειος Σαμολαδάς (Πολυτεχνείο Κρήτης), Ιωάννης Κωτίδης (ΟΠΑ) Δημήτρης Καραμπίνας (Παν. Πατρών), Δημήτρης Μπούσης (Παν. Πατρών), Κυριακή Παναγίδη (Παν. Πατρών), Δημήτρης Σαχαρίδης Μέλη ΟΕΣ (ΙΠΣΥ Ε.Κ. ΑΘΗΝΑ), Κωνσταντίνα Μακρυνιώτη (ΟΠΑ), Κωνσταντίνος Γεωργούλας (ΟΠΑ), Κωνσταντίνος Ζαγγανάς (ΙΠΣΥ Ε.Κ. ΑΘΗΝΑ), Γεώργιος Ζώης (ΟΠΑ) Η υποδράση ΥΔ 4.3 μελετάει κλιμακούμενες μεθόδους υπολογισμού της ομοιότητας σε υπερχώρους δεδομένων οι οποίες μπορούν να αξιοποιηθούν κατά την επεξεργασία σύνθετων δεδομένων ενός υπερχώρου. Συγκεκριμένα εξετάσαμε περιπτώσεις όπου η ομοιότητα ανάμεσα στους Σύντομη χρήστες ενός υπερχώρου αποτιμάται μέσω των Περιγραφή αποτελεσμάτων συναθροιστικών (αναλυτικών) ερωτημάτων. Επιπλέον εξετάσαμε περιπτώσεις όπου είναι επιθυμητός ο χωρο-χρονικός υπολογισμός της ομοιότητας μεταξύ των χρηστών, μέσω της παρακολούθησης των τροχιών κίνησης τους σε εφαρμογές κινητών αντικειμένων. Π.4.3 Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων Παραδοτέο δεδομένων

Τεχνική αναφορά που θα περιλαμβάνει τουλάχιστον 1 Στόχος στο Τ.Δ. δημοσίευση. Επίτευξη στόχου 100%

Περιεχόμενα 1 Εισαγωγή... 7 2 Διαμόρφωση ερευνητικού πλαισίου... 8 3 Αναλυτικά Αποτελέσματα... 9 3.1 Υπολογισμός ομοιότητας και έκτοπων τιμών σε ομαδοποιημένα δεδομένα... 9 3.2 Υπολογισμός ομοιότητας (εγγύτητας) κινούμενων αντικειμένων... 11 4 Ανακεφαλαίωση... 12

1 Εισαγωγή Βασικός στόχος του έργου ΕΙΚΟΣ είναι να προσφέρει τη μεθοδολογία, τη θεωρητική θεμελίωση, τις αλγοριθμικές τεχνικές και την αρχιτεκτονική του λογισμικού που απαιτείται ώστε τα πληροφοριακά συστήματα να μπορούν να προσφέρουν στους χρήστες αφενός την δυνατότητα εξατομίκευσης της παρεχόμενης πληροφορίας και αφετέρου τη δυνατότητα χρήσης ενσωματωμένων ετερογενών δεδομένων, ενδεχομένως διαφορετικής προέλευσης, με διαφανή τρόπο. Στα πλαίσια του έργου, η Δράση 4 με τίτλο «Κατανεμημένες Υποδομές Αποθήκευσης, Προσπέλασης και Διαχείρισης Δεδομένων» σκοπό έχει να παράσχει αρχιτεκτονικές και αλγορίθμους οι οποίοι είτε οι ίδιες θα παρέχουν τρόπους για την κατανεμημένη οργάνωση χώρων δεδομένων στα χαμηλότερα επίπεδα του συστήματος, είτε θα παρέχουν κατάλληλα στατιστικά στοιχεία (όπως συνόψεις δεδομένων που περιγράφουν το φόρτο του συστήματος, ή το ποια δεδομένα ζητούνται από ποιούς χρήστες, τι ρόλο παίζουν διάφοροι χρήστες, κλπ) που να υποβοηθούν την οργάνωση αυτή. Επιπλέον, στόχος είναι οι ίδιοι οι χρήστες να αναβαθμιστούν από απλοί καταναλωτές πληροφορίας σε πρωταγωνιστές που μέσω της συνεργατικότητάς τους να βοηθούν στην κατανόηση των δεδομένων, της σχέσης τους και στην εξατομίκευση των αποτελεσμάτων με βάση το ποιός ερωτά και την «κοινοτική σοφία» αναφορικά με τα περιεχόμενα του οικοσυστήματος. Η Δράση 4 οργανώνεται στις εξής υποδράσεις: ΥΔ 4.1 Διαχείριση πληροφορίας σε μεγάλης κλίμακας πληροφορικά συστήματα, ΥΔ 4.2 Μέθοδοι για παραγωγή στατιστικών και συνόψεων δεδομένων και ΥΔ 4.3 Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων δεδομένων. Το παρόν Παραδοτέο Π.4.3 περιλαμβάνει τα αποτελέσματα της υποδράσης ΥΔ 4.3. Στην ενότητα Error! Reference source not found. παρουσιάζουμε το ερευνητικό πλαίσιο του προβλήματος όπως αυτό διαμορφώθηκε κατά την εκτέλεση του έργου. Στην ενότητα 3 παρουσιάζουμε συνοπτικά τις τεχνικές και 7

αλγορίθμους οι οποίες προέκυψαν για την υλοποίηση των στόχων. Τέλος, ανακεφαλαιώνουμε τα αποτελέσματά μας στην ενότητα 4. 2 Διαμόρφωση ερευνητικού πλαισίου Η Δράση 4 «Κατανεμημένη Υποδομή για Αποθήκευση, Πρόσβαση και Διαχείριση Δεδομένων» απαντά στο ερώτημα: «Πώς αντιμετωπίζουμε την κλιμάκωση του συστήματος (σε αριθμό χρηστών, όγκο δεδομένων και μέγεθος κατανεμημένων υποδομών) μέσω κατανεμημένων τεχνικών;». Σκοπός είναι ο σχεδιασμός αρχιτεκτονικών, αλγορίθμων και υποβοηθητικών δομών δεδομένων (όπως συνόψεις και ευρετήρια) για την κατανεμημένη οργάνωση και επεξεργασία/επερώτηση των δεδομένων του υπερχώρου. Η υποδράση ΥΔ4.3 αφορά μεθόδους εύρεσης ομοιότητας χρηστών υπερχώρων δεδομένων. Στα πλαίσια της δράσης αυτής εξετάσαμε κλιμακούμενες μεθόδους υπολογισμού της ομοιότητας σε υπερχώρους δεδομένων οι οποίες μπορούν να αξιοποιηθούν κατά την επεξεργασία σύνθετων δεδομένων ενός υπερχώρου. Συγκεκριμένα εξετάσαμε περιπτώσεις όπου η ομοιότητα ανάμεσα στους χρήστες ενός υπερχώρου αποτιμάται μέσω των αποτελεσμάτων συναθροιστικών-αναλυτικών ερωτημάτων στα δεδομένα τους. Επιπλέον εξετάσαμε περιπτώσεις όπου είναι επιθυμητός ο χωρο-χρονικός υπολογισμός της ομοιότητας μεταξύ των χρηστών, μέσω της παρακολούθησης των τροχιών κίνησης τους σε εφαρμογές κινητών αντικειμένων. Για την πρώτη προσέγγιση, προτείναμε έναν καινοτόμο τρόπο εκτίμησης της ομοιότητας σε χρήστες υπερχώρων υψηλής διάστασης τα οποία προκύπτουν ως αποτέλεσμα συναθροίσεων κατά την ομαδοποίηση και ανάλυση των δεδομένων ενός υπερχώρου. Τέτοια παραδείγματα προκύπτουν κατά την ανάλυση δεδομένων σε αποθήκες δεδομένων. Χρησιμοποιήσαμε μια γνωστή τεχνική παραγωγής συνόψεων δεδομένων την οποία συνδυάσαμε με μια τεχνική κατακερματισμού δεδομένων έτσι ώστε να είναι δυνατή μια αρκετά ακριβής και σε μικρό χρόνο εκτίμηση της ομοιότητας σε μεγάλους υπερχώρους δεδομένων υψηλής διάστασης. Με τον τρόπο αυτό, δημιουργείται ένα σχήμα ευρετηρίασης των δεδομένων σε δύο επίπεδα και επιτυγχάνεται ο εντοπισμός ακραίων τιμών- 8

έκτοπων χρηστών (outliers). Η συγκεκριμένη διαδικασία βοηθά όλους τους χρήστες να αντιληφθούν πιθανές λανθασμένες εγγραφές δεδομένων στην αποθήκη δεδομένων και να επέμβουν διορθώνοντας και επαναφέροντας τις σωστές τιμές διατηρώντας την ακεραιότητα τους. Σχετικά με τη δεύτερη προσέγγιση, μελετήσαμε δύο προβλήματα ομοιότητας χρηστών με χωρο-χρονικά κριτήρια. Το πρώτο πρόβλημα το οποίο εξετάσαμε αφορά τον υπολογισμό της ομοιότητας σε εφαρμογές κινούμενων αντικειμένων. Σε αυτή την περίπτωση η ομοιότητα των χρηστών προκύπτει μέσω του υπολογισμού της εγγύτητας των τροχιών τους στο χώρο. Στα πλαίσια της ΥΔ 4.3 εξετάσαμε διαφορετικές μετρικές ομοιότητας βασισμένες στην αρχή του εγγύτερου γείτονα, και προτείνουμε αντίστοιχες αποτελεσματικές μεθόδους. Στο δεύτερο πρόβλημα εξετάσαμε μεθόδους αποτίμησης της ομοιότητας χρηστών με βάση την απόσταση των τροχιών τους από μερικά δοσμένα σταθερά σημεία ενδιαφέροντος. 3 Αναλυτικά Αποτελέσματα 3.1 Υπολογισμός ομοιότητας και έκτοπων τιμών σε ομαδοποιημένα δεδομένα Στα πλαίσια της υποδράσης ΥΔ 4.3 εξετάσαμε σύγχρονες τεχνικές οι οποίες μπορούν να χρησιμοποιηθούν για τον υπολογισμό της ομοιότητας ανάμεσα σε μεγάλα σύνολα δεδομένων υψηλής διάστασης. Χρησιμοποιήσαμε ένα από τα αποτελέσματα της υποδράσης ΥΔ 4.2, συγκεκριμένα την ανάπτυξη συνόψεων με τη χρήση κατακερματισμού ευαίσθητου στην ομοιότητα (Locality Sensitive Hashing - LSH). Στην συγκεκριμένη υποδράση δείξαμε ότι τέτοιες συνόψεις μπορούν να υπολογιστούν αποδοτικά σε υπερχώρους δεδομένων χρησιμοποιώντας σύγχρονες τεχνικές κατανεμημένης επεξεργασίας όπως οι διεργασίες MapReduce (βλ παραδοτέο Π4.2). Επιπρόσθετα, επιτρέπουν την αποτίμηση διαφορετικών μετρικών υπολογισμού της ομοιότητας (Ευκλείδεια, Jaccard, κα). 9

Σε αυτή την υποδράση μελετήσαμε πώς οι συγκεκριμένες τεχνικές μπορούν να επεκταθούν για την αποτίμηση της ομοιότητας ή, συμμετρικά, για τον υπολογισμό έκτοπων τιμών, σε δεδομένα υψηλής διάστασης τα οποία δημιουργούνται κατά την ανάλυση πρωτογενών δεδομένων σε υπερχώρους μέσω αναλυτικών επερωτήσεων. Παράδειγμα τέτοιων επερωτήσεων είναι ο τελεστής του κύβου σε αποθήκες δεδομένων. Ο υπολογισμός έκτοπων τιμών (outliers) στοχεύει στην εύρεση δεδομένων τα οποία διαφέρουν σημαντικά από τα υπόλοιπα δεδομένα του υπερχώρου. Αυτό μπορεί να οφείλεται σε σφάλματα απεικόνισης και επομένως η πληροφόρηση αυτή μπορεί να χρησιμοποιηθεί για την παρουσίαση ποιο αξιόπιστων αποτελεσμάτων στους χρήστες του υπερχώρου. Στη μελέτη μας σχεδιάσαμε ένα καινοτόμο σύστημα το οποίο επιτρέπει τον εντοπισμό ακραίων τιμών-έκτοπων (outliers) σε αποθήκες δεδομένων. Προτείναμε έναν νέο ορισμό ακραίων τιμών για αποτελέσματα συνάθροισης για να είναι δυνατή η διαχείριση μεγάλων υπερχώρων δεδομένων που είναι αρκετά συνηθισμένοι σε αποθήκες δεδομένων. Οι τεχνικές μας εκμεταλλεύονται ένα σχήμα ευρετηρίασης δεδομένων σε δύο επίπεδα. Το πρώτο επίπεδο βασίζεται στην τεχνική κατακερματισμού LSH και μας επιτρέπει να αντικαταστήσουμε τις ερωτήσεις εύρους (range queries) που δεν είναι αποδοτικές σε δεδομένα με πολλές διαστάσεις (dimensionality curse) με προσεγγιστικούς υπολογισμούς των κοντινότερων γειτόνων. Το δεύτερο επίπεδο ευρετηρίασης χρησιμοποιεί την τεχνική PAA (Piecewise Aggregate Appoximatiοn), η οποία μειώνει σημαντικά τις ανάγκες σε χώρο για την αποθήκευση των συνόψεων των δεδομένων. Η μέθοδός μας επιτρέπει τις σταδιακές ενημερώσεις των αναπαραστάσεωνσυνόψεων οι οποίες είναι απαραίτητες σε μεγάλου όγκου σύνολα δεδομένων που είναι συνηθισμένα σε αποθήκες δεδομένων. Τα αποτελέσματά μας έχουν δημοσιευτεί στο άρθρο [GeKo12]. 10

3.2 Υπολογισμός ομοιότητας (εγγύτητας) κινούμενων αντικειμένων 3.2.1 Ομοιότητα σε σχέση με κινούμενο αντικείμενο Η ανάλυση δεδομένων παρακολούθησης για διάφορους τύπους κινούμενων αντικειμένων είναι ένα ενδιαφέρον ερευνητικό πρόβλημα με πολλές πραγματικές εφαρμογές. Αρκετές εργασίες έχουν επικεντρωθεί στην συνεχή παρακολούθηση των πλησιέστερων γειτόνων ενός κινούμενου αντικειμένου, ενώ άλλες έχουν προτείνει μέτρα ομοιότητας για την εύρεση παρόμοιων τροχιών σε βάσεις δεδομένων που περιέχουν ιστορικά δεδομένα παρακολούθησης. Σε αυτό το έργο, εισάγουμε το πρόβλημα της συνεχούς παρακολούθησης πλησιέστερων τροχιών. Σε αντίθεση με άλλες παρόμοιες προσεγγίσεις, ενδιαφερόμαστε για την παρακολούθηση κινούμενων αντικειμένων, λαμβάνοντας υπόψη σε κάθε χρονόσημο όχι μόνο τις τρέχουσες θέσεις τους, αλλά και την πρόσφατη τροχιά τους σε ένα καθορισμένο παράθυρο χρόνου. Περιγράφουμε πρώτα ένα γενικό βασικό αλγόριθμο για το πρόβλημα αυτό, ο οποίος μπορεί να εφαρμοστεί για κάθε συναθροιστική συνάρτηση που χρησιμοποιείται για τον υπολογισμό αποστάσεων τροχιάς μεταξύ των αντικειμένων, και χωρίς περιορισμούς στην κίνηση των αντικειμένων. Χρησιμοποιώντας αυτό ως πλαίσιο, στη συνέχεια προτείνουμε ένα βελτιστοποιημένο αλγόριθμο για τις περιπτώσεις όπου η απόσταση μεταξύ δύο κινούμενων αντικειμένων σε ένα χρονικό παράθυρο ορίζεται από τη μέγιστη ή την ελάχιστη απόσταση τους σε όλα τα χρονόσημα. Στη συνέχεια προτείνουμε επιπλέον βελτιστοποιήσεις για την περίπτωση που υπάρχει ένα άνω φράγμα για τις ταχύτητες των αντικειμένων. Τέλος, αξιολογούμε την αποτελεσματικότητα των προτεινόμενων αλγορίθμων μας, με τη διεξαγωγή πειραμάτων σε τρεις πραγματικές βάσεις δεδομένων. Τα αποτελέσματά μας έχουν δημοσιευτεί στο άρθρο [SaSS14]. 3.2.2 Ομοιότητα σε σχέση με σταθερά σημεία αναφοράς Τα δεδομένα τροχιών αποτυπώνουν το ιστορικό κινούμενων αντικειμένων, όπως άτομα ή οχήματα. Με τη διάδοση του GPS και της τεχνολογίας εντοπισμού, 11

τεράστιοι όγκοι τροχιών παράγονται και συλλέγονται. Σε αυτό το πλαίσιο, εφαρμογές όπως η πρόταση διαδρομής και η εξόρυξη της συμπεριφορά ταξιδιού, απαιτούν την αποτελεσματική ανάκτηση τροχιών. Επομένως σε αυτή την εργασία, η ομοιότητα χρηστών του οικοσυστήματος ορίζεται με βάση την απόσταστη της τροχιάς τους από μερικά δοσμένα σταθερά σημεία. Στην συγκεκριμένη εργασία, οι χρήστες αναπαρίστανται από την τροχιά τους στο χώρο, η μετρική ομοιότητας είναι ως προς ένα δοσμένο σύνολο από σημεία στο χώρο. Αναζητούμε επομένως τους χρήστες που έχουν την μεγαλύτερη ομοιότητα με το δοσμένο σύνολο, και εξετάζουμε διάφορες τεχνικές δεικτοδότησης και υλοποίησης της αναζήτησης. Συγκεκριμένα, δεδομένων μια συλλογής τροχιών και ένα σύνολο σημείων επερώτησης, ο στόχος είναι να ανακτήσουμε τις k τροχιές που περνούν όσο το δυνατόν πλησιέστερα σε όλα τα σημεία του ερωτήματος. Εξελίσσουμε την τρέχουσα τεχνολογική κατάσταση, συνδυάζοντας τις υπάρχουσες προσεγγίσεις σε μια υβριδική μέθοδο. Επιπλέον προτείνουμε μια εναλλακτική, πιο αποτελεσματική προσέγγιση βασισμένη σε ερωτήσεις εύρους. Κατόπιν, προτείνουμε και μελετάμε μια πρακτική παραλλαγή της αναζήτησης με βάση την απόσταση που εισάγει και ένα όριο στην απόσταση, ώστε να λαμβάνει υπόψη τα χρονικά χαρακτηριστικά των τροχιών. Μέσα από μια εκτεταμένη πειραματική ανάλυση με πραγματικά δεδομένα τροχιών, δείχνουμε ότι η προσέγγιση που βασίζεται σε ερωτήσεις εύρους έχει καλύτερα επίδοση από τις προηγούμενες μεθόδους κατά τουλάχιστον μία τάξη μεγέθους. Τα αποτελέσματά μας έχουν δημοσιευτεί στο άρθρο [ShBSM15] το οποίο έλαβε βράβευση καλύτερης εργασίας (Best Paper Award). 4 Ανακεφαλαίωση Το παρόν παραδοτέο Π4.3 παρουσιάζει τα αποτελέσματα της υποδράσης ΥΔ4.3 του έργου ΕΙΚΟΣ. Ο στόχος της υποδράσης ΥΔ4.3 ήταν η ανάπτυξη τεχνικών αποτίμησης της ομοιότητας χρηστών σε υπερχώρους δεδομένων. Εξετάσαμε δύο διαφορετικές προσεγγίσεις υπολογισμού της ομοιότητας ανάμεσα στους χρήστες. 12

Η πρώτη χρησιμοποιεί συναρθοιστικά αποτελέσματα αναλυτικών ερωτημάτων και επιτρέπει τον υπολογισμό της ομοιότητας ανάμεσα σε χρήστες μέσω της γενικότερης συμπεριφοράς τους (όπως αυτή αποτυπώνεται μέσω της επιλογής των κατάλληλων συναθροιστικών ερωτημάτων). Οι προτεινόμενες τεχνικές αξιοποιούν αποτελέσματα της ΥΔ 4.2 και επιτρέπουν τον υπολογισμό της ομοιότητας μέσω σύγχρονων τεχνικών κατανεμημένης επεξεργασίας όπως το MapReduce. Η δεύτερη προσέγγιση αφορά τον υπολογισμό της ομοιότητας ανάμεσα σε χρήστες υπερχώρων λαμβάνοντας υπόψη χωρο-χρονική πληροφορία σε εφαρμογές κινούμενων αντικειμένων. Σε αυτή την περίπτωση η ομοιότητα προκύπτει μέσω του υπολογισμού της εγγύτητας των τροχιών των αντικειμένων στο χώρο είτε ως προς μια δοσμένη τροχιά είτε ως προς ένα δοσμένο σύνολο σταθερών σημείων. Στα πλαίσια της ΥΔ 4.3 εξετάσαμε διαφορετικές μετρικές ομοιότητας βασισμένες στην αρχή του εγγύτερου γείτονα, και προτείνουμε αντίστοιχες αποτελεσματικές μεθόδους υπολογισμού. Στα πλαίσια των ερευνητικών δραστηριοτήτων της υποδράσης Υ.Δ 4.3 προέκυψαν 3 δημοσιεύσεις (βλ. παρακάτω πίνακα). Σε αυτές παρουσιάζονται αναλυτικά οι αλγόριθμοι και τεχνικές και μελετάται πειραματικά η απόδοση τους. Δημοσιεύσεις [GeKo12] Konstantinos Georgoulas, Yannis Kotidis. Towards Enabling Outlier Detection in Large, High Dimensional Data Warehouses. SSDBM 2012: 591-594 [SaSS14] Dimitris Sacharidis, Dimitrios Skoutas, Georgios Skoumas. Continuous monitoring of nearest trajectories. SIGSPATIAL/GIS 2014: 361-370 [ShBSM15] Shuyao Qi, Panagiotis Bouros, Dimitris Sacharidis, Nikos Mamoulis. Efficient Point-based Trajectory Search. SSTD 2015 13

Παράρτημα 14