Παραδοτέο Π.1.3. Μηχανισμοί δεικτοδότησης μη-παραδοσιακών δεδομένων

Σχετικά έγγραφα
Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Παραδοτέο Π.5.1. Μοντελοποίηση της εξέλιξης υπερχώρων και οικοσυστημάτων πληροφορίας

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Παραδοτέο Π.3.1. Διαχείριση δεδομένων συμπεριφοράς χρήστη

Παραδοτέο Π.4.3. Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων δεδομένων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 04/12/2014 Α.Π. : Προς: ΙΝ/ΤΟ ΠΛΗΡ/ΚΩΝ ΣΥΣ/ΤΩΝ&ΠΡΟΣ/ΣΗΣΕΡΕΥΝ/ΚΟ ΚΕΝΤΡΟ ΚΑΙΝ/ΜΙΑΣ&ΤΗΣ

Παραδοτέο Π.2.2. Εξαγωγή δεδομένων, αντιστοίχιση τιμών και δομών, και ολοκλήρωση πληροφορίας

Παραδοτέο Π.5.2. Ρύθμιση της εξέλιξης υπερχώρων και οικοσυστημάτων πληροφορίας

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Παραδοτέο Π.1.2. Τεχνικές ανάκτησης πληροφορίας από πηγές μηπαραδοσιακών

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

Παραδοτέο Π.3.3. Σχεδίαση οικοσυστημάτων πληροφορίας γύρω από υπερχώρους δεδομένων

Παραδοτέο Π.2.3. Μηχανισμοί επερώτησης και ανάκτησης πληροφορίας

Παραδοτέο Π.3.2. Μοντελοποίηση χρήστη και διαχείριση προτιμήσεων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΑΔΑ: Β4ΛΡ9-ΒΔΒ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Παραδοτέο Π.1.1. Μοντελοποίηση μη-παραδοσιακών δεδομένων

ΑΝΟΙΧΤΗ ΠΡΟΣΚΛΗΣΗ ΓΙΑ ΥΠΟΒΟΛΗ ΠΡΟΤΑΣΕΩΝ ΣΤΟ ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «Εκπαίδευση και Δια Βίου Μάθηση» ΘΑΛΗΣ

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

ΑΔΑ: Β4Λ59-0ΓΓ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Ίδρυμα Τεχνολογίας και Έρευνας Ινστιτούτο Πληροφορικής (ITE-ΙΠ)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Ε.Κ. «Αθηνά» - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας των Επικοινωνιών και της Γνώσης / Ινστιτούτο Πληροφοριακών Συστημάτων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΔΡΑΣΗ 2: Καταγραφή της υφιστάμενης κατάστασης των ελαιοτριβείων και των περιοχών διάθεσης αποβλήτων ελαιοτριβείων στην Κρήτη ΠΑΡΑΔΟΤΕΟ 2Γ:

ΑΔΑ: Β41Ρ9-ΜΘ6 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4ΛΡ9-Θ9Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Οι Τομείς (κατευθύνσεις ειδικότητας) του Τμήματος Πληροφορικής & Επικοινωνιών είναι:

ΑΔΑ: Β4ΛΔ9-ΧΙΜ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 7043 Προς: ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΠΟΛΥΤΕΧΝΕΙΟΥΠΟΛΗ - ΚΟΥΝΟΥΠΙΔΙΑΝΑ T.

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΚΑΙ ΕΦΑΡΜΟΣΜΕΝΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΑΔΑ: Β41Ρ9-Ξ2Ξ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4ΓΘ9-3ΓΦ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4ΓΘ9-Δ03 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Software Production Company

ΑΔΑ: Β4ΛΡ9-1Κ5 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β41Δ9-ΝΓ9 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Την Επιτροπή αποτελούν οι:

Με FAX & Αθήνα, 15 Ιουλίου 2014 Α.Π

Διαφορές single-processor αρχιτεκτονικών και SoCs

Ο έξυπνος τρόπος Βελτίωσης Αποδοτικότητας και Αποτελεσματικότητας των Δήμων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 6982 Προς: ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Σ.Π.Σ. ΒΑΣ.ΣΟΦΙΑΣ 12 T.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

2018 / 19 ΜΕΤΑΠΤΥΧΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία

ΑΠΟΤΕΛΕΣΜΑΤΑ ΔΙΑΒΟΥΛΕΥΣΗΣ

Στο πλαίσιο των Αξόνων Προτεραιότητας:

ΑΔΑ: Β49Ι9-ΤΒΑ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Κεφάλαιο 5 ΔΙΑΣΦΑΛΙΣΗ ΠΟΙΟΤΗΤΑΣ ΚΑΙ ΔΙΑΦΑΝΕΙΑ

ANAΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Κέντρο Μεταφοράς Τεχνολογίας & Ανάπτυξης Πανεπιστήμιο Κρήτης Σεπτέμβριος 2010

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud

Διαχείριση Πολιτισμικών Δεδομένων

Εννοιολογική Ομοιογένεια

ΑΚΑΔΗΜΙΑ ΠΛΑΤΩΝΟΣ ΑΝΑΠΤΥΞΗ ΤΗΣ ΓΝΩΣΗΣ ΚΑΙ ΚΑΙΝΟΤΟΜΩΝ ΙΔΕΩΝ

ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΤΟΠΙΚΗ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗ ΑΝΑΠΤΥΞΗ ΚΑΙ ΑΥΤΟΔΙΟΙΚΗΣΗ» ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Βάσεις Δεδομένων Ενότητα 1

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

ΑΔΑ: Β4ΘΤ9-109 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Πτυχί ο στην Εφαρμοσμέ νη Πληροφορίκη

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΑΔΑ: Β4ΛΔ9-ΖΙΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Αναγκαιότητα - Χρησιμότητα

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

ΑΔΑ: Β4ΩΚ9-ΥΓ5 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Διαλειτουργικότητα αυξημένης παραγωγικότητας έλλειψη συνεργασίας

Παραδοτέο Π.4.2. Μέθοδοι για παραγωγή στατιστικών και συνόψεων δεδομένων

ΑΔΑ: Β4ΣΗ9-733 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β4Λ59-ΤΗ6 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΑΔΑ: Β41Ρ9-ΛΧ3 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΑΔΑ: Β4ΛΔ9-ΞΒΣ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 1: ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΜΕΘΟΔΟΥΣ ΕΡΕΥΝΑΣ - ΠΕΡΙΓΡΑΜΜΑ

ΑΔΑ: Β4ΩΚ9-ΕΙΓ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΑΔΑ: Β41Δ9-ΜΥΤ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

ΚΕΝΤΡΟ ΕΡΕΥΝΩΝ ΓΙΑ ΘΕΜΑΤΑ ΙΣΟΤΗΤΑΣ (Κ.Ε.Θ.Ι.)

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

METROPOLIS. Ένα περιβάλλον σχεδιασμού για ετερογενή συστήματα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΑΚΑΔΗΜΙΑ ΕΝΕΡΓΕΙΑΣ ΔΙΑΧΕΙΡΙΣΗ ΕΝΕΡΓΕΙΑΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ Α ΠΕΡΙΟΔΟΥ Διδάσκων: Ιωάννης Ψαρράς

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΚΤ και καινοτομία με ανοιχτά δεδομένα και APIs

ΑΔΑ: Β4169-Ψ1Κ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Transcript:

Έργο: Τίτλος Υποέργου: «ΘΑΛΗΣ: Ενίσχυση της Διεπιστημονικής ή και Διιδρυματικής έρευνας και καινοτομίας με δυνατότητα προσέλκυσης ερευνητών υψηλού επιπέδου από το εξωτερικό μέσω της διενέργειας βασικής και εφαρμοσμένης έρευνας αριστείας» «ΕΙΚΟΣ»: Θεωρητική και αλγοριθμική θεμελίωση για Προσωποκεντρικά Συνεργατικά Πληροφοριακά Συστήματα Παραδοτέο Π.1.3 Μηχανισμοί δεικτοδότησης μη-παραδοσιακών δεδομένων Σεπτέμβριος 2015

Δράση 1 Αναπαράσταση και ανάκτηση μη παραδοσιακών δεδομένων Ομάδα Ερ. Ομάδα 1 Έναρξη 01/02/2012 Λήξη 30/11/2015 Συντονιστής ΕΟ1 Δ. Πλεξουσάκης (Παν. Κρήτης) Υποδράση: ΥΔ 1.3 Μηχανισμοί δεικτοδότησης μη-παραδοσιακών δεδομένων Δ. Πλεξουσάκης (Παν. Κρήτης), Γ. Θεοδωρίδης Συμμετέχοντες Μέλη ΚΕΟ (Παν. Πειραιώς), Σ. Σκιαδόπουλος (Παν. Πελοποννήσου) Μέλη ΟΕΣ Ν. Πελέκης (Παν. Πειραιώς) Η Δράση 1 αποσκοπεί στον ορισμό μοντέλων αναπαράστασης για μη παραδοσιακούς τύπους δεδομένων που είναι πλούσια σε μεταδεδομένα, καθώς και στο σχεδιασμό μηχανισμών για την αυτόματη εξαγωγή της εν Σύντομη λόγω μετα-πληροφορίας για νέα δεδομένα. Στο πλαίσιο Περιγραφή αυτό η Υποδράση ΥΔ1.3 ερευνά το σχεδιασμό νέων τεχνικών ευρετηρίασης δεδομένων, που θα επιτρέψουν την αποδοτική ανάκτηση των δεδομένων με βάση την προαναφερθείσα μετα-πληροφορία. Π.1.3 Μηχανισμοί δεικτοδότησης μη-παραδοσιακών Παραδοτέο δεδομένων Τεχνική αναφορά που θα περιλαμβάνει τουλάχιστον 2 Στόχος στο Τ.Δ. δημοσιεύσεις. Επίτευξη στόχου 100%

Περιεχόμενα 1 Εισαγωγή... 7 1.1 Πλαίσιο έρευνας... 8 2 Δεικτοδότηση μεγάλων συμβολοσειρών... 8 3 Διαχείριση και ανάλυση σημασιολογικά εμπλουτισμένων βάσεων κινούμενων αντικειμένων... 9 4 Δημοσιεύσεις... 11

1 Εισαγωγή Ο βασικός στόχος του έργου ΕΙΚΟΣ είναι να προσφέρει τη μεθοδολογία, τη θεωρητική θεμελίωση, τις αλγοριθμικές τεχνικές και την αρχιτεκτονική του λογισμικού που απαιτείται ώστε τα πληροφοριακά συστήματα να μπορούν να προσφέρουν στους χρήστες αφενός την δυνατότητα εξατομίκευσης της παρεχόμενης πληροφορίας και αφετέρου τη δυνατότητα χρήσης ενσωματωμένων ετερογενών δεδομένων, ενδεχομένως διαφορετικής προέλευσης, με διαφανή τρόπο. Στα πλαίσια του έργου, η Δράση 1 «Αναπαράσταση και ανάκτηση μη παραδοσιακών δεδομένων» αποσκοπεί στον ορισμό μοντέλων αναπαράστασης για μη παραδοσιακούς τύπους δεδομένων που είναι πλούσια σε μεταδεδομένα, καθώς και στο σχεδιασμό μηχανισμών για την αυτόματη εξαγωγή της εν λόγω μετα-πληροφορίας για νέα δεδομένα. Τέλος αποσκοπεί στο σχεδιασμό νέων τεχνικών ευρετηρίασης των δεδομένων, που θα επιτρέψουν την αποδοτική ανάκτηση των δεδομένων με βάση την προαναφερθείσα μετα-πληροφορία. Η Δράση οργανώνεται σε τρεις θεμελιώδεις δράσεις, εκ των οποίων η πρώτη αφορά στη μοντελοποίηση μη-παραδοσιακών δεδομένων, η δεύτερη σε τεχνικές ανάκτησης πληροφορίας από πηγές μη-παραδοσιακών δεδομένων και η τρίτη σε μηχανισμούς δεικτοδότησης μη-παραδοσιακών δεδομένων. Το παρόν Παραδοτέο Π.1.3 περιλαμβάνει τα αποτελέσματα της υποδράσης ΥΔ1.3. Στην ενότητα 1 παρουσιάζουμε το γενικότερο πλαίσιο της έρευνας που διεξήχθηκε η οποία ακολούθησε δύο οδούς, η πρώτη από τις οποίες αφορά σε δεικτοδότηση μεγάλων συμβολοσειρών και η δεύτερη αυτή της διαχείρισης σημασιολογικά εμπλουτισμένων βάσεων κινούμενων αντικειμένων. Στις ενότητες 2 και 3 παρουσιάζουμε τα κύρια αποτελέσματα για αυτές τις δύο διαφορετικές προσεγγίσεις. 7

1.1 Πλαίσιο έρευνας Ο στόχος αυτής της εργασίας είναι να προτείνει νέους μηχανισμούς ευρετηρίασης για μη παραδοσιακούς τύπους δεδομένων. Οι μηχανισμοί ευρετηρίασης θα πρέπει να μπορούν στηρίξουν την ανάλυση χώρων δεδομένων (dataspaces), δηλαδή την επέκταση των υφιστάμενων τεχνικών ευρετηρίασης για να χειριστεί τις προκλήσεις που τίθενται από το νέο μοντέλο. Το μοντέλο dataspace μπορεί να χρησιμοποιεί τα υπάρχοντα σχήματα δεικτοδότησης, αλλά σε γενικές γραμμές οι νέες δομές δεικτοδότησης πρέπει να μπορούν να εφαρμοστούν για την αντιμετώπιση πολύπλοκων ερωτημάτων σε μη παραδοσιακούς τύπους δεδομένων. Τέλος, αποτελεί στόχο να ληφθεί υπόψιν η παρουσία μεγάλου όγκου πλούσιων μεταδεδομένων η οποία απαιτεί τη δημιουργία εξειδικευμένων δομών ευρετηρίασης που υποστηρίζουν ερωτήματα που περιλαμβάνουν δεδομένα και μεταδεδομένα για όλες τις πηγές που διατίθενται στο dataspace. Για την επίτευξη των παραπάνω στόχων η έρευνα στα πλαίσια του Π1.3 στόχευσε δύο πολύ συνήθεις μη παραδοσιακούς τύπους δεδομένων, αυτό των συμβολοσειρών και αυτό των σημασιολογικά εμπλουτισμένων δεδομένων κίνησης. Η πρώτη προσέγγιση αυτή μπορεί να μοντελοποιήσει πλήθος μηπαραδοσιακών δεδομένων όπως βιοιατρικά, χρονικά και συμπιεσμένα δεδομένα αλλά και δεδομένα κειμένου, τα οποία είναι συνήθεις πηγές δεδομένων σε χώρους δεδομένων. Ομοίως, η δεύτερη προσέγγιση μπορεί να εφαρμοστεί σε οποιαδήποτε εφαρμογή εμπλέκει χωρο-χρονικο-κειμενικά ακολουθιακά δεδομένα, όπως είναι τα δεδομένα που υπάρχουν σε κοινωνικά δίκτυα βάσει θέσης. Οι επόμενες δύο ενότητες παρουσιάζουν αναλυτικότερα τις δύο προαναφερθείσες προσεγγίσεις. 2 Δεικτοδότηση μεγάλων συμβολοσειρών Το suffix tree είναι μια δομή για την δεικτοδότηση συμβολοσειρών που χρησιμοποιείται σε πληθώρα εφαρμογών όπως η βιοιατρική, η ανάλυση χρονοσειρών, η ομαδοποίηση, η επεξεργασία κειμένου και η συμπίεση. Όμως 8

όταν η συμβολοσειρά και το suffix tree της είναι πολύ μεγάλα για να αποθηκευθούν στη μνήμη οι περισσότεροι αλγόριθμοι κατασκευής του suffix tree είναι μη αποδοτικοί. Στην έρευνα αυτή σχαδιάσαμε ένα αλγόριθμο κατασκευής με βάση το δίσκο που ονομάζεται ERA και μπορεί να διαχειριστεί αποδοτικά πολύ μεγαλές συμβολοσειρές. Ο ERA διαχωρίζει τη διαδικασία κατασκευής οριζόντια και κατακόρυφα και ελαχιστοποιεί το I/O προσαρμόζοντας δυναμικά τα οριζόντια τμήματα ανεξάρτητα από τα κατακόρυφα βασιζόμενος στο εξελισσόμενο σχήμα του δέντρου και την διαθέσιμη μνήμη. Όπου είναι δυνατό, ο ERΑ ομαδοποιεί τα κατακόρυφα τμήματα για να μειώσει τα I/O. Υλοποιήσαμε μια σειριακή έκδοση, μια παράλληλη (σε αρχιτεκτονική shared-memory/shared-disk) και μια παράλληλη (σε αρχιτεκτονική shared nothing). Η μέθοδός μας δεικτοδοτεί σε ένα κοινό οικιακό υπολογιστή με 1CPU μια συμβολοσειρά μεγέθους 3GB σε 19 λεπτά. Για σύγκριση, η προηγούμενη ταχύτερη μέθοδος χρειαζόταν 15 λεπτά στο υπερυπολογιστή IBM BlueGene που διαθέτει 1024CPUs. Η προσέγγιση αυτή μπορεί να μοντελοποιήσει πλήθος μη-παραδοσιακών δεδομένων όπως βιοιατρικά, χρονικά και συμπιεσμένα δεδομένα αλλά και δεδομένα κειμένου. Η παραπάνω έρευνα εντάσσεται στη Υπο-Δράση Π1.3 καθώς αφορά στην κατασκευή μηχανισμών δεικτοδότησης δεδομένων με αλφαριθμητική αναπαράσταση (string representation). Τα αποτελέσματά μας δημοσιεύθηκαν στο άρθρο [MASK11] που παρουσιάστηκε στο VLDB, το 2011. 3 Διαχείριση και ανάλυση σημασιολογικά εμπλουτισμένων βάσεων κινούμενων αντικειμένων Η έκρηξη διαθέσιμης πληροφορίας θέσης, συνδεδεμένη με επαγόμενη ή δηλούμενη (από τους χρήστες) σημασιολογία των αντίστοιχων τοποθεσιών, ήδη συνεισφέρει στην εποχή των μεγάλων δεδομένων, θέτοντας νέες προκλήσεις στην ερευνητική κοινότητα της διαχείρισης και εξόρυξης γνώσης από δεδομένα 9

κίνησης. Σε αυτή την εργασία, εμπνεόμενοι από πρόσφατες εξελίξεις στο πεδίο, παρουσιάζουμε ένα ενοποιημένο πλαίσιο εργασίας για τη διαχείριση και ανάλυση των «βημάτων» (LifeSteps) μας, δηλαδή, αντικειμένων δεδομένων τα οποία αναπαριστούν ταυτόχρονα τα πρωτογενή δεδομένα τροχιών κινούμενων αντικειμένων και την αντίστοιχη σημασιολογική πληροφορία τους. Ειδικότερα, παρέχουμε λύσεις για την ανάπτυξη πραγματικών, σημασιολογικά εμπλουτισμένων βάσεων κινούμενων αντικειμένων και συστημάτων αποθηκών δεδομένων, ενώ σχεδιάζουμε αντίστοιχους αλγορίθμους διαχείρισης επερωτήσεων. Η πειραματική μας μελέτη σε συνθετικά δεδομένα που διατηρούν συγχρονισμένα τα πρωτογενή δεδομένα (GPS log) με τη σημασιολογική πληροφορία (ημερολόγια κίνησης) επαληθεύει την αποτελεσματικότητα και αποδοτικότητα του προτεινόμενου πλαισίου εργασίας. Η έρευνα αυτή αποτελεί μία καινοτόμο πρόταση στη διαχείριση χωρο-χρονοκειμενικών ακολουθιακών δεδομένων, όπως μπορούν να θεωρηθούν ότι είναι οι σημασιολογικά εμπλουτισμένες τροχιές κινούμενων αντικειμένων. Προτείνεται ένα γενικού σκοπού πλαισίου εργασίας για τέτοιου τύπου μη-παραδοσιακά δεδομένα, το οποίο υποβοηθά την ανάπτυξη σημασιολογικά εμπλουτισμένων βάσεων κινούμενων αντικειμένων και συστημάτων αποθηκών δεδομένων. Αυτό επιτυγχάνεται με ειδικά σχεδιασμένους αλγορίθμους διαχείρισης επερωτήσεων (όπως χωρο-κειμενικά ερωτήματα εύρους ή ερωτήματα προτύπων) και διαδικασίες εξαγωγής-μεταμόρφωσης-φόρτωσης των πρωτογενών δεδομένων σε κατάλληλες αποθήκες δεδομένων, οι οποίες υποβοηθούνται από ειδικούς μηχανισμούς δεικτοδότησης για χωρο-χρονο-κειμενικά, ακολουθιακά δεδομένα. Τα αποτελέσματά μας δημοσιεύθηκαν στο άρθρο [PST15] που παρουσιάστηκε στο IEEE/ACM International Conference on Data Science and Advanced Analytics (IEEE DSAA'2015), το 2015. 10

4 Δημοσιεύσεις [MASK11] E. Mansour, A. Allam, S. Skiadopoulos, P. Kalnis: ERA: Efficient Serial and Parallel Suffix Tree Construction for Very Long Strings. PVLDB 5(1): 49-60, Istanbul, Turkey, 2011. [PST15] N. Pelekis, S. Sideridis, Y. Theodoridis: Hermes sem : a Semantic-aware Framework for the Management and Analysis of our LifeSteps, IEEE/ACM International Conference on Data Science and Advanced Analytics (IEEE DSAA'2015), Paris, France, 2015. 11

Παράρτημα 12