Παραδοτέο Π.1.1. Μοντελοποίηση μη-παραδοσιακών δεδομένων

Σχετικά έγγραφα
Παραδοτέο Π.1.3. Μηχανισμοί δεικτοδότησης μη-παραδοσιακών δεδομένων

Παραδοτέο Π.1.2. Τεχνικές ανάκτησης πληροφορίας από πηγές μηπαραδοσιακών

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Παραδοτέο Π.5.1. Μοντελοποίηση της εξέλιξης υπερχώρων και οικοσυστημάτων πληροφορίας

Παραδοτέο Π.4.3. Μέθοδοι εύρεσης ομοιότητας χρηστών υπερχώρων δεδομένων

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

Παραδοτέο Π.2.2. Εξαγωγή δεδομένων, αντιστοίχιση τιμών και δομών, και ολοκλήρωση πληροφορίας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 04/12/2014 Α.Π. : Προς: ΙΝ/ΤΟ ΠΛΗΡ/ΚΩΝ ΣΥΣ/ΤΩΝ&ΠΡΟΣ/ΣΗΣΕΡΕΥΝ/ΚΟ ΚΕΝΤΡΟ ΚΑΙΝ/ΜΙΑΣ&ΤΗΣ

Παραδοτέο Π.3.1. Διαχείριση δεδομένων συμπεριφοράς χρήστη

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Παραδοτέο Π.5.2. Ρύθμιση της εξέλιξης υπερχώρων και οικοσυστημάτων πληροφορίας

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» / ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Παραδοτέο Π.2.3. Μηχανισμοί επερώτησης και ανάκτησης πληροφορίας

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΠΟΛΥΜΕΣΑ- ΔΙΚΤΥΑ ΚΥΚΛΟΥ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΗΡΕΣΙΩΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται:

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Παραδοτέο Π.3.3. Σχεδίαση οικοσυστημάτων πληροφορίας γύρω από υπερχώρους δεδομένων

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

ΔΡΑΣΗ 2: Καταγραφή της υφιστάμενης κατάστασης των ελαιοτριβείων και των περιοχών διάθεσης αποβλήτων ελαιοτριβείων στην Κρήτη ΠΑΡΑΔΟΤΕΟ 2Γ:

Μοντέλα Κυβερνητικής Πληροφορίας

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Πληροφοριακά Συστήματα

Παραδοτέο Π.3.2. Μοντελοποίηση χρήστη και διαχείριση προτιμήσεων

RobotArmy Περίληψη έργου

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

ΑΔΑ: Β4ΩΚ9-Ν5Δ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΠΛΑΤΩΝΑΣ Έργο ΓΓΕΤ 1SME2009

Βάσεις Δεδομένων Ενότητα 1

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Την Επιτροπή αποτελούν οι:

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

Ίδρυμα Τεχνολογίας και Έρευνας Ινστιτούτο Πληροφορικής (ITE-ΙΠ)

ΙΝΤΡΑΚΟΜ Ανώνυμη Εταιρεία Τηλεπικοινωνιακών Λύσεων 19,7 χλμ. Λεωφ. Μαρκοπούλου, Παιανία Αττικής τ: f:

Εννοιολογική Ομοιογένεια

ΑΔΑ: Β4ΛΡ9-ΒΔΒ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

Επιστήμη της Πληροφορικής. Εργασία του μαθητή Δημήτρη Τσιαμπά του τμήματος Α4

Ανάπτυξη Μοντέλου Εκτίμησης της Ποιότητας του Χάρτη

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΑΓΡΟΝΟΜΩΝ ΚΑΙ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ. Σπύρος Τσιπίδης. Περίληψη διατριβής

SGA Διαχείριση Πρωτόκολλου

8ο Πανελλήνιο Συμποσιο Ωκεανογραφίας & Αλιείας 637

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Πληροφοριακά Συστήματα Διοίκησης Ενότητα 9: Διαχείριση Έργων (1ο Μέρος)

Ενότητα 1 ΓΕΝΙΚΕΣ ΑΡΧΕΣ ΣΧΕΔΙΑΣΜΟΥ [ΓΕΝΙΚΕΣ ΑΡΧΕΣ ΣΧΕΔΙΑΣΜΟΥ] 1.1. ΓΕΝΙΚΑ ΕΝΟΤΗΤΑ 1

Επιτροπή Συντονισμού της Ηλεκτρονικής Διακυβέρνησης

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ. Αθήνα, 06/05/2015 Α.Π. : 6982 Προς: ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Σ.Π.Σ. ΒΑΣ.ΣΟΦΙΑΣ 12 T.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Η Πληροφορική ως γνώση και εργαλείο για τον σύγχρονο μηχανικό. Νικόλαος Μήτρου Καθηγητής, ΕΜΠ

Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών

ΤΟ ΘΕΑΤΡΟ ΩΣ ΜΟΡΦΟΠΑΙΔΕΥΤΙΚΟ ΑΓΑΘΟ ΚΑΙ ΚΑΛΛΙΤΕΧΝΙΚΗ ΕΚΦΡΑΣΗ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ ΚΑΙ ΤΗΝ ΚΟΙΝΩΝΙΑ

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Υπηρεσίες Ψηφιακής Βιβλιοθήκης Ανοικτής Πρόσβασης Ε.Μ.Π.

Unified search of digital cultural content: Searching culture

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

HOBOS - Η ιπτάμενη τάξη

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 4: Διαχείριση Έργων

Software Production Company

2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 1 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Περίληψη Λαμπρόπουλος

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

Πίνακας περιεχοµένων

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Αν σας ενδιαφέρει κάποιο θέμα, δείτε τη σχετική βιβλιογραφία και στείλτε μου για να συναντηθούμε και να το συζητήσουμε.

4/2014 ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΥΔΡΟΛΗΨΙΕΣ ΑΤΤΙΚΗΣ ΑΠΟΚΕΝΤΡΩΜΕΝΗ ΔΙΟΙΚΗΣΗ ΑΤΤΙΚΗΣ ΔΙΕΥΘΥΝΣΗ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ

Προσωπικός Ηλεκτρονικός Φάκελος Υγείας: Ασθενοκεντρική Προσέγγιση, Βελτίωση της. Επικ. Καθηγήτρια Φλώρα Μαλαματένιου

Μέτρηση και Εκτίμηση Αβεβαιότητας Ηλεκτρομαγνητικού Πεδίου σε Σύγχρονα Συστήματα Ασύρματων Ευρυζωνικών Επικοινωνιών

Πολιτική Προστασίας Ιδιωτικότητας και Προσωπικών Δεδομένων στον Δήμο Καλαμαριάς. 2 Πολιτική Προστασίας Ιδιωτικότητας και Προσωπικών Δεδομένων

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

ΑΝΑΡΤΗΤΕΟ ΣΤΟ ΔΙΑΔΙΚΤΥΟ Χανιά, Αρ. Πρωτ.:6169 ΑΠΟΣΠΑΣΜΑ ΕΚ ΤΩΝ ΠΡΑΚΤΙΚΩΝ ΤΗΣ 317 ης ΣΥΝΕΔΡΙΑΣΗΣ

ΑΝΟΙΧΤΗ ΠΡΟΣΚΛΗΣΗ ΓΙΑ ΥΠΟΒΟΛΗ ΠΡΟΤΑΣΕΩΝ ΣΤΟ ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «Εκπαίδευση και Δια Βίου Μάθηση» ΘΑΛΗΣ

Ενιαία Αναζήτηση σε ψηφιακό πολιτιστικό περιεχόμενο

Αναγκαιότητα - Χρησιμότητα

Διδακτική της Πληροφορικής

Πολιτική για την Ιδιωτικότητα και την Προστασία των Προσωπικών Δεδομένων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

2018 / 19 ΜΕΤΑΠΤΥΧΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Οι Τομείς (κατευθύνσεις ειδικότητας) του Τμήματος Πληροφορικής & Επικοινωνιών είναι:

Θέματα διπλωματικών εργασιών έτους

Εφαρμογή Διαχείρισης Στόλου Οχημάτων «RouteΤracker»

Στο πλαίσιο των Αξόνων Προτεραιότητας:

Transcript:

Έργο: Τίτλος Υποέργου: «ΘΑΛΗΣ: Ενίσχυση της Διεπιστημονικής ή και Διιδρυματικής έρευνας και καινοτομίας με δυνατότητα προσέλκυσης ερευνητών υψηλού επιπέδου από το εξωτερικό μέσω της διενέργειας βασικής και εφαρμοσμένης έρευνας αριστείας» «ΕΙΚΟΣ»: Θεωρητική και αλγοριθμική θεμελίωση για Προσωποκεντρικά Συνεργατικά Πληροφοριακά Συστήματα Παραδοτέο Π.1.1 Μοντελοποίηση μη-παραδοσιακών δεδομένων Σεπτέμβριος 2015

Δράση 1 Αναπαράσταση και ενσωμάτωση μη-παραδοσιακών δεδομένων Ομάδα Ερ. Ομάδα 1 Έναρξη 01/02/2012 Λήξη 30/11/2015 Συντονιστής ΕΟ1 Δ. Πλεξουσάκης (Παν. Κρήτης) Υποδράση: ΥΔ 1.1 Μοντελοποίηση μη-παραδοσιακών δεδομένων Δ. Πλεξουσάκης (Παν. Κρήτης), Γ. Θεοδωρίδης Συμμετέχοντες Μέλη ΚΕΟ (Παν. Πειραιώς), Σ. Σκιαδόπουλος (Παν. Πελοποννήσου) Θ. Πάτκος (Παν. Κρήτης), Ν. Πελέκης (Παν. Πει Μέλη ΟΕΣ ραιώς), Ε. Ζερβάκης (Παν. Πελοποννήσου) Ο σκοπο ς της υποδρα σης Δ1.1 ει ναι να διερευνη σει, στο γενικο τερο πλαι σιο των οικοσυστημα των δεδομένων, μεθο δους για την κοινη αναπαρα σταση μη-παραδοσιακω ν δεδομε νων και μετα-δεδομε νων που προε ρχονται απο Σύντομη διαφορετικε ς πηγε ς (data streams, χωροχρονικα δεδομε να, Περιγραφή δεδομε να αισθητη ρων, επιστημονικα δεδομε να όπως ιατρικά και βιολογικά, δεδομένα ηλεκτρονικών αγορών, δεδομένα κοινωνικών δικτύων, δεδομένα από το Παγκόσμιο Ιστό) καθω ς και τρο πους συσχε τιση ς τους. Παραδοτέο Π.1.1 Μοντελοποίηση μη-παραδοσιακών δεδομένων Στόχος στο Τ.Δ. Τεχνική αναφορά που θα περιλαμβάνει τουλάχιστον 1 δημοσίευση. Επίτευξη στόχου 100%

Περιεχόμενα 1 Εισαγωγή... 5 1.1 Πλαίσιο έρευνας και στόχοι... 6 2 Μοντελοποίηση μη παραδοσιακών δεδομένων διαφόρων τύπων με στόχο την ιδιωτικότητα και την ανωνυμία... 8 2.1 Δεδομένα συνόλων και συναλλαγών... 8 2.2 Δεδομένα τροχιών... 10 3 Χωρο-χρονικά δεδομένα μελετημένα υπό το πρίσμα των αναγκών διαφορετικών εφαρμογών... 11

1 Εισαγωγή Ο βασικός στόχος του έργου ΕΙΚΟΣ είναι να προσφέρει τη μεθοδολογία, τη θεωρητική θεμελίωση, τις αλγοριθμικές τεχνικές και την αρχιτεκτονική του λογισμικού που απαιτείται ώστε τα πληροφοριακά συστήματα να μπορούν να προσφέρουν στους χρήστες αφενός την δυνατότητα εξατομίκευσης της παρεχόμενης πληροφορίας και αφετέρου τη δυνατότητα χρήσης ενσωματωμένων ετερογενών δεδομένων, ενδεχομένως διαφορετικής προέλευσης, με διαφανή τρόπο. Στo πλαίσιo του έργου, η Δράση 1 «Αναπαράσταση και ανάκτηση μη παραδοσιακών δεδομένων» αποσκοπεί στον ορισμό μοντέλων αναπαράστασης για μη παραδοσιακούς τύπους δεδομένων που είναι πλούσια σε μεταδεδομένα, καθώς και στο σχεδιασμό μηχανισμών για την αυτόματη εξαγωγή της εν λόγω μετα-πληροφορίας για νέα δεδομένα. Τέλος αποσκοπεί στο σχεδιασμό νέων τεχνικών ευρετηρίασης των δεδομένων, που θα επιτρέψουν την αποδοτική ανάκτηση των δεδομένων με βάση την προαναφερθείσα μετα-πληροφορία. Η Δράση οργανώνεται σε τρεις θεμελιώδεις δράσεις, εκ των οποίων η πρώτη αφορά στη μοντελοποίηση μη-παραδοσιακών δεδομένων, η δεύτερη σε τεχνικές ανάκτησης πληροφορίας από πηγές μη-παραδοσιακών δεδομένων και η τρίτη σε μηχανισμούς δεικτοδότησης μη-παραδοσιακών δεδομένων. Το παρόν Παραδοτέο Π.1.1 περιλαμβάνει τα αποτελέσματα της υποδράσης ΥΔ1.1. Στην ενότητα 1 παρουσιάζουμε το γενικότερο πλαίσιο του προβλήματος και την επισκόπιση των περιοχών που μελετήθηκαν. Στην ενότητα 2 αναλύονται οι ανάγκες μοντελοποίησης διαφορετικών πεδίων με έμφαση σε ευαίσθητα δεδομένα και τις μεθόδους ανωνυμίας που αναπτύχθηκαν. Στην ενότητα 3 η έμφαση δίνεται σε χωρο χρονικά δεδομένα τόσο με σκοπό τη διαχείριση ασάφειας όσο και με στόχο την παροχή διασύνδεσης διαφορετικών πηγών και σημασιολογικού εμπλουτισμού αυτών. 5

1.1 Πλαίσιο έρευνας και στόχοι Οι νέες προκλήσεις που ανακύπτουν μέσα στο γενικότερο πλαίσιο των οικοσυστημάτων δεδομένων περιλαμβάνουν την ικανότητα αναπαράστασης ετερογενών δεδομένων τα οποία προέρχονται από διαφορετικού τύπου πηγές (π.χ., δίκτυα αισθητήρων, εφαρμογές ηλεκτρονικών αγορών), βρίσκονται σε διαφορετικά επίπεδα αφαίρεσης (π.χ., raw sensor data, βιβλιογραφικά δεδομένα ή δεδομένα από κοινωνικά δίκτυα), παράγονται με ασύγχρονο τρόπο και σε μεταβαλλόμενους όγκους και ρυθμούς (π.χ., remote sensing applications, highthroughput scientific experiment data), είναι δομημένα, ημιδομημένα ή δεν ακολουθούν συγκεκριμένη δομή (π.χ., δεδομένα βάσεων δεδομένων, δεδομένα προερχόμενα από πηγές Web 2.0, δεδομένα από microarray experiments στη βιολογία), είναι στατικά ή δυναμικά (π.χ., χάρτες, δεδομένα αισθητήρων) και εξαρτώμενα από το χρόνο ή το χώρο (π.χ. ροές δεδομένων, γεωγραφικά δεδομένα). Επιπλέον, οι μέθοδοι αναπαράστασης πρέπει να συνοδεύονται από κατάλληλους μηχανισμούς που να υποστηρίζουν την εξέλιξη των δεδομένων και μεταδεδομένων καθώς και των ίδιων των σχημάτων αναπαράστασης. Η εξαγωγή αξίας από τα δεδομένα, προϋποθέτει επίσης σημασιολογικά εμπλουτισμένες περιγραφές των μεταδεδομένων ώστε να καθίσταται δυνατή η ολοκλήρωσή και η διασύνδεσή τους. Στόχος της έρευνας στο πλαίσιο της δράσης Δ1.1 και του παρόντος παραδοτέου ήταν να καλυφθεί ένα μεγάλο εύρος μη παραδοσιακών τύπων δεδομένων, να παρουσιαστούν δυνατότητες μοντελοποίησής τους, καθώς και να αναλυθούν οι απαιτήσεις που εισάγονται κατά την χρήση τους σε διαφορετικά πεδία. Η κατανόηση των χαρακτηριστικών και των απαιτήσεων αυτών τροφοδοτούν την έρευνα τόσο στις δύο υποδράσεις ΥΔ1.2 «Τεχνικές ανάκτησης πληροφορίας από πηγές μη-παραδοσιακών δεδομένων» και ΥΔ1.3 «Μηχανισμοί δεικτοδότησης μηπαραδοσιακών δεδομένων» που συμπληρώνουν τη Δράση 1 «Αναπαράσταση και ενσωμάτωση μη-παραδοσιακών δεδομένων» όσο και στο γενικότερο ερευνητικό αντικείμενο το έργου ΕΙΚΟΣ. Συγκεκριμένα, η ανάλυση των χαρακτηριστικών και απαιτήσεων με σκοπό τη μοντελοποίηση μη παραδοσιακών δεδομένων δομήθηκε σε τρεις κεντρικούς άξονες: τους τύπους των δεδομένων αυτών, τα πεδία εφαρμογής τους και τους 6

στόχους που χρειάζεται να εξυπηρετηθούν από τη μοντελοποίησή τους. Εξ αρχής απώτερος στόχος ήταν η όσο το δυνατόν ευρύτερη κάλυψη καθενός εκ των αξόνων αυτών, για τη καλύτερη κατανόηση των απαιτήσεων που υπεισέρχονται. Ο Πίνακας 1 συνοψίζει τις περιοχές που μελετήθηκαν στο πλαίσιο της ΥΔ1.1. περιγράφονται αναλυτικότερα στη συνέχεια του παρόντος παραδοτέου. Πίνακας 1 Συνοπτική Περιγραφή Περιοχών Μελέτης της ΥΔ1.1 Είδος Δεδομένων Πεδίο Εφαρμογής Στόχος Προσωπικά και Ιατρικά δεδομένα, Ανωνυμία ευαίσθητα δεδομένα συνόλων [TLMS12] δεδομένα ιστορικών, ημερολογίων πιστωτικών καρτών, επίσκεψης ιστοτόπων Χωρο-χρονικά δεδομένα [PDP14] Αρχαιολογία, γεωλογία, στρωματογραφία, Xρονική ασάφεια, συσχέτιση χωροχρονικών όγκων γεωγραφία Δεδομένα συναλλαγών Υγειονομική Aνωνυμία [PGLST14, PLGS13] περίθαλψη, μάρκετινγκ κ.α. Γεωγραφικά δεδομένα, συνδυασμένα με εικόνες κ άλλη πληροφορία Θαλάσσιοα βιολογία, ιχθυολογικά δεδομένα Διασύνδεση και σημασιολογικός εμπλουτισμός οικοσυστημάτων [TABM15] Δεδομένα τροχιών [PSLG14, PSLG13a, PSLG13b] Τεχνολογίες εντοπισμού θέσης Ιδιωτικότητα και ανωνυμία 7

2 Μοντελοποίηση ευαίσθητων και προσωπικών δεδομένων διαφόρων τύπων με στόχο την ιδιωτικότητα και την ανωνυμία Η μοντελοποίηση και διαχείριση ευαίσθητων δεδομένων αποτελούν κομβικές δραστηριότητες σε πλήθος εφαρμογών και αφορούν μη παραδοσιακά δεδομένα διαφόρων τύπων. Αρκετές από τις εργασίες που εκπονήθηκαν στο πλαίσιο της συγκεκριμένης δράσης επικεντρώθηκαν σε αυτό τον τύπο, προσεγγίζοντάς τον από ποικίλες σκοπιές. 2.1 Δεδομένα συνόλων και συναλλαγών Μη-παραδοσιακά δεδομένα συνόλων, όπως ιατρικά δεδομένα, ιστορικά, ημερολογία πιστωτικών καρτών και επίσκεψης ιστοτόπων, απαρτίζουν σημαντικό ποσοστό στο οικοσύστημα δεδομένων. Σε πολλές περιπτώσεις, τα διαθέσιμα δεδομένα περιέχουν ευαίσθητα προσωπικά δεδομένα (π.χ., ασθένειες, θεραπείες και αγορές χρηστών). Κατά συνέπεια, είναι πολύ σημαντική η δημοσίευση των δεδομένων αυτών με τρόπο που διασφαλίζει την ανωνυμία των εμπλεκομένων. Στην εργασία [TLMS12] παρουσιάστηκε μια πρωτοπόρα μέθοδος δημοσιοποίησης των παραπάνω δεδομένων συνόλου που αφενός εξασφαλίζει την ανωνυμία των χρηστών και αφετέρου διατηρεί την ποιότητα της ανάλυσης των δημοσιευμένων δεδομένων. Η συγκεκριμένη εργασία παρείχε μεθόδους προστασίας της ιδιωτικότητας κατά την δημοσίευση πολυδιάστατων δεδομένων. Οι υπάρχουσες μέθοδοι για την διασφάλιση της ανωνυμίας (α) προστατεύουν την ιδιωτικότητα γενικεύοντας ή διαγράφοντας δεδομένα ή προσθέτοντας θόρυβο και (β) θεωρούν την ξεκάθαρη διάκριση μεταξύ ευαίσθητων και μη-ευαίσθητων δεδομένων. Σε πολλές όμως εφαρμογές οι παραπάνω μέθοδοι δεν μπορούν να εφαρμοστούν. Οι μέθοδοι γενίκευσης και διαγραφής αφαιρούν σημαντική πληροφορία από τα δεδομένα. Επιπρόσθετα, τα σημερινά δεδομένα δεν μπορούν ξεκάθαρα να διαχωριστούν σε ευαίσθητα και μη, κάποια δεδομένα μπορεί να είναι ευαίσθητα για ένα χρήστη και μη-ευαίσθητα για κάποιον άλλο. Με βάση την παρατήρηση αυτή, παρουσάστηκε μια μέθοδος ανωνυμίας που την ονομάζουμε αποσυσχέτιση η 8

οποία διατηρεί τα αρχικά δεδομένα ανέπαφα αλλά αποκρύπτει την κοινή τους εμφάνιση. Η ανωνυμία εξασφαλίζεται αποσυσχετίζοντας εγγραφές που συμμετέχουν σε συνδυασμούς που μπορούν να αποκαλύψουν την ταυτότητα των χρηστών. Η μέθοδος που παρουσιάζουμε είναι η πρώτη που χρησιμοποιεί αποσυσχέτιση για την εξασφάλιση της ανωνυμίας. Η εργασία παρείχε τόσο την υλοποίηση την μεθόδου όσο και την πειραματική σύγκριση με αντίστοιχες μεθόδους γενίκευσης, διαγραφής και εισαγωγής θορύβου. Από διαφορετική σκοπιά, οι εργασίες [PGLST14, PLGS13] μελέτησαν τη δημοσίευση συνόλων δεδομένων με προσωπικά δεδομένα, τα οποία περιέχουν τόσο σχεσιακά όσο και δεδομένα συναλλαγών, και τα οποία είναι σημαντικά σε μια ευρεία γκάμα εφαρμογών, που εκτείνονται από την υγειονομική περίθαλψη ως και το μάρκετινγκ. Η διατήρηση την ιδιωτικότητας και της χρηστικότητας αυτών των συνόλων δεδομένων αποτελεί πρόκληση, καθώς απαιτεί (i) προστασία από κακόβουλους χρήστες, των οποίων η γνώση καλύπτει και τους δύο τύπους χαρακτηριστικών, και (ii) την ελαχιστοποίηση της συνολικής απώλειας πληροφορίας. Οι υπάρχουσες τεχνικές ανωνυμίας, δεν μπορούν να εφαρμοστούν σε τέτοια σύνολα δεδομένων, και το πρόβλημα δεν μπορεί να αντιμετωπιστεί με βάση τις δημοφιλείς, στρατηγικές βελτιστοποίησης πολλαπλών στόχων. Οι εργασίες που εκπονήθηκαν στο πλαίσιο της Δ1.1 κατάφεραν να προτείνουν την πρώτη προσέγγιση για την αντιμετώπιση του προβλήματος αυτού και να αναπτύξουν δύο πλαίσια ανωνυμοποίησης, με προκαθορισμένη απώλεια πληροφοριών στον ένα τύπο δεδομένων και ελάχιστη απώλεια πληροφορίας στον άλλο. Για την εφαρμογή κάθε πλαισίου, προτάθηκαν αλγορίθμοι ανωνυμοποίησης οι οποίοι διατηρούν αποτελεσματικά τη χρηστικότητα των δεδομένων, όπως επαληθεύεται και από εκτεταμένα πειράματα. Μάλιστα, αναπτύχθηκε το σύστημα SECRETA, ένα σύστημα για την ανάλυση της αποτελεσματικότητας και της αποδοτικότητας των διαφόρων αλγορίθμων ανωνυμίας. Το σύστημα αυτό επιτρέπει σε όσους επιθυμούν να διαμοιραστούν δεδομένα, να αξιολογήσουν έναν συγκεκριμένο αλγόριθμο, να συγκρίνουν πολλαπλούς αλγορίθμους, και να συνδυάσουν αλγορίθμους για την ανωνυμοποίηση συνόλων δεδομένων τα οποία περιέχουν σχεσιακά δεδομένα 9

και δεδομένα συναλλαγών. Η ανάλυση των αλγορίθμων γίνεται, με ένα διαδραστικό και προοδευτικό τρόπο, και τα αποτελέσματα, συμπεριλαμβανομένων των στατιστικών και διαφόρων δεικτών χρηστικότητας των δεδομένων, μπορούν να συνοψιστούν και να παρουσιαστούν γραφικά. 2.2 Δεδομένα τροχιών Η διάδοση των συσκευών με GPS (π.χ., smartphones και tablets) και κοινωνικών δικτύων βασισμένων στον διαμοιρασμό της θέσης των χρηστών έχει οδηγήσει σε σημαντική αύξηση των δεδομένων τροχιών. Η δημοσίευση των δεδομένων αυτών ανοίγει νέες κατευθύνσεις στην ανάλυση, μελέτη και κατανόηση της ανθρώπινης συμπεριφοράς. Ωστόσο, θα πρέπει να πραγματοποιείται με έναν τρόπο, ο οποίος να διαφυλάττει την ιδιωτικότητα, επειδή οι ταυτότητες των ατόμων, των οποίων η κίνηση καταγράφεται στις τροχιές, μπορεί να αποκαλυφθεί ακόμη και μετά την αφαίρεση προσδιοριστικών πληροφοριών. Οι υπάρχουσες προσεγγίσεις ανωνυμοποίησης των δεδομένων τροχιών προσφέρουν προστασία της ιδιωτικότητας, αλλά με υψηλό κόστος στην χρηστικότητα των δεδομένων, δεδομένου ότι είτε δεν παράγουν αληθή δεδομένα (μια σημαντική απαίτηση πολλών εφαρμογών), ή περιορίζονται από τους αλγόριθμους ανωνυμίας που χρησιμοποιούν. Ως επί το πλείστον, οι υπάρχουσες προσεγγίσεις, είτε περιορίζονται από το μοντέλο ανωνυμοποίησης το οποίο χρησιμοποιούν, ή επιφέρουν σημαντική, και συχνά περιττή, αλλοίωση των δεδομένων. Στις δημοσιεύσεις [PSLG13b, PSLG14], προτάθηκε μια νέα προσέγγιση που αντιμετωπίζει τις ανεπάρκειες αυτές, χρησιμοποιώντας το μοντέλο της k m - ανωνυμίας σε δεδομένα τροχιών. Για να υλοποιήσουμε την προσέγγισή μας, αναπτύξαμε τρεις αποδοτικούς και αποτελεσματικούς αλγόριθμους ανωνυμίας, οι οποίοι βασίζονται στην αρχή Apriori. Αυτοί οι αλγόριθμοι στοχεύουν στη διατήρηση διαφορετικών χαρακτηριστικών των δεδομένων, όπως η απόσταση μεταξύ σημείων, η σημασιολογική ομοιότητα, καθώς επίσης και στη διατήρηση διαφόρων κριτηρίων χρηστικότητας πουορόζονται από το χρήστη, τα οποία 10

πρέπει να πληρούνται για να διασφαλιστεί ότι τα δημοσιευμένα στοιχεία μπορούν να αναλυθούν ουσιαστικά. Τα εκτεταμένα πειράματα μας, χρησιμοποιώντας συνθετικά και πραγματικά δεδομένα, επαλήθευσαν ότι οι προτεινόμενοι αλγόριθμοι είναι αποδοτικοί και αποτελεσματικοί στη διατήρηση της χρηστικότητα των δεδομένων. Επιπρόσθετα, στην εργασία [PSLG13a] προτάθηκε ένα νέο πλαίσιο για την ανωνυμοποίηση δεδομένων τροχιών, το οποίο αποτρέπει την αποκάλυψη πληροφοριών τόσο για την ταυτότητα όσο και για τις ευαίσθητες περιοχές που επισκέφτηκε ο χρήστης, διατηρώντας παράλληλα την χρηστικότητα των δεδομένων. Το πλαίσιό μας περιλαμβάνει: (i) την επιλογή παρόμοιων τροχιών, με τη χρησιμοποίηση είτε ενός αλγορίθμου Ζ-ordering ή χρησιμοποιώντας προβολές δεδομένων στις συχνά εμφανιζόμενες υποτροχιές, (ii) την ομαδοποίηση των επιλεγμένων τροχιών σε προσεκτικά κατασκευασμένες ομάδες, και (iii) την ανωνυμοποίηση κάθε τέτοιας ομάδας ξεχωριστά. Αναπτύξαμε αλγορίθμους για την υλοποίηση του πλαισίου μας, οι οποίοι είναι αποτελεσματικοί και αποδοτικοί, όπως επαληθεύεται και από εκτεταμένα πειράματα. 3 Χωρο-χρονικά δεδομένα μελετημένα υπό το πρίσμα των αναγκών διαφορετικών εφαρμογών Τα χωρο-χρονικά δεδομένα αποτελούν σημαντικό όγκο πληροφορίας που απασχολεί μεγάλη ποικιλία εφαρμογών. Τα προβλήματα που εισάγονται αφορούν τόσο την ασάφεια της χωρο-χρονικής πληροφορίας όσο και την ανάγκη διασύνδεσης της από διαφορετικές πηγές και εμπλουτισμού της με σημασιολογικά μετα-δεδομένα. Σε αυτό το πλαίσιο, στο άρθρο [PDP14] μελετήθηκε και προτάθηκε μια μεθοδολογία για την μοντελοποίηση της έκτασης τετραδιάστατων οντοτήτων όπως οι χωρο-χρονικοί όγκοι χρησιμοποιώντας εμπειρικές αποδείξεις. Επίσης εμβαθύνει στην μοντελοποίηση της χρονικής ασάφειας και στην χρονική συσχέτιση χωρο-χρονικών όγκων. Πιο συγκεκριμένα, τα ασαφή χρονικά διαστήματα που περιγράφουν ένα γεγονός περιέχουν εσωτερικά και εξωτερικά 11

όρια. Τα επίπεδα που σχηματίζονται αντιπροσωπεύουν την γνώση μας για την κατάσταση του γεγονότος. Για παράδειγμα τα χρονικά σημεία ανάμεσα στα εσωτερικά όρια δηλώνουν την βεβαιότητα ότι το γεγονός είναι ενεργό, ενώ οι περιοχές ανάμεσα στα εξωτερικά και εσωτερικά όρια υποδηλώνουν την άγνοια και κατ επέκταση την ασάφεια. Η χρονική τοπολογία πάνω σε χωροχρονικούς όγκους προκύπτει μέσω των επιμέρους σχέσεων που σχηματίζονται στα κοινά χωρικά σημεία δύο όγκων. Η επικρατούσα σχέση από ένα σύνολο πιθανών επιμέρους, εξάγεται εφαρμόζοντας την ακόλουθη ιεραρχία: overlaps <= equals <= {starts, finishes} <= meets <= {before, during} (Allen s operators, η φορά του βέλους υποδεικνύει την πιο ισχυρή σχέση). Η συγκεκριμένη εργασία πρότεινε μία μεθοδολογία για την μοντελοποίηση της χρονικής ασάφειας και της χρονικής συσχέτισης χωρο-χρονικών όγκων δεδομένων (τετραδιάστατοι όγκοι). Εξέτασε τη χρονική τοπολογία των χωροχρονικών όγκων όπως αυτή σχηματίζεται από τις σχέσεις μεταξύ των κοινών χωρικών σημείων και προτείνει μια άλγεβρα για το χειρισμό των σχέσεων αυτών. Τέτοια δεδομένα προκύπτουν σε πολλούς επιστημονικούς τομείς (αρχαιολογία, γεωλογία, στρωματογραφία, γεωγραφία) και ο χειρισμός και η ολοκλήρωσή τους με άλλους τύπους δεδομένων δεν έχει μελετηθεί επαρκώς στη διεθνή βιβλιογραφία. Το αποτέλεσμα παρείχε μια τυπική θεμελίωση για την απάντηση ερωτημάτων που δεν μπορούν να απαντηθούν με παραδοσιακές τεχνικές. Σε ό,τι αφορά τις ανάγκες διασύνδεσης ετερογενών πηγών μη παραδοσιακών δεδομένων, μελετήθηκαν οι απαιτήσεις στον τομέα της θαλάσσιας βιολογίας, όπου τα προβλήματα έχουν εντοπιστεί είναι σαφή και καταγραφεί εδώ και καιρό. Δεδομένα που αφορούν τη θαλάσσια βιολογία σχετικά με ιχθυολογικά είδη (marine species data) βρίσκονται διασκορπισμένα σε πλήθος ετερογενών πηγών, βάσεων δεδομένων και θησαυρών όρων. Συχνά, η αναζήτηση όρων σχετικά με αυτά τα δεδομένα απαιτεί τη χρήση εντελώς διαφορετικών μεταξύ τους πρωτοκόλλων και μορφών, καθώς το εκάστοτε ινστιτούτο διατηρεί τη δική του βάση γνώσης με δεδομένα σε μη-επεξεργασμένη μορφή, ενώ η χρήση οντολογιών για την περιγραφή τους είναι αρκετά περιορισμένη. 12

Η εργασία [TABM15] περιγράφει την οντολογία MarineTLO, μια οντολογία υψηλού επιπέδου (top-level ontology) που ενοποιεί πληροφορία από πλήθος πηγών, όπως οι FLOD, ECOSCOPE, WoRMS, FishBase και DBpedia, με σκοπό τη δημιουργία ενός ενιαίου, συνεπούς και αξιόπιστου επιπέδου γνώσης που θα παρέχει σημασιολογική διαλειτουργικότητα πάνω σε δεδομένα θαλάσσιων ειδών. Περιγράφονται μοντέλα και μεθοδολογίες δημοσίευσης, πλοήγησης και επερωτήσεων πάνω σε αυτά τα δεδομένα μέσω ενός εκφραστικά πλούσιου εννοιολογικού μοντέλου, αποκρύπτοντας τις διαφορές, διατηρώντας ωστόσο τις απαραίτητες συνδέσεις με τις υποκείμενες πηγές γνώσεις. Στο πλαίσιο αυτό, η συγκεκριμένη εργασία πρότεινε μια πρωτότυπη οντολογία υψηλού επιπέδου, η οποία επιτρέπει τη διασύνδεση και τον εμπλουτισμό ιχθυολογικών δεδομένων που περιλαμβάνουν γεωγραφικά δεδομένα, εικόνες, πληροφορία σχετικά με οικοσυστήματα, κοινά και επιστημονικά ονόματα ειδών σε διάφορες γλώσσες κ.α., τα οποία βρίσκονται κατανεμημένα σε βάσεις τόσο σε δομημένη όσο και σε αδόμητη μορφή. Παρουσιάστηκε επίσης ένας τόπος αποθήκευσης, προσπέλασης και μετασχηματισμού της πληροφορίας που αξιοποιεί την οντολογία, λαμβάνοντας υπόψη μεταδεδομένα προέλευσης (provenance data). 13

Δημοσιεύσεις [TLMS12] M. Terrovitis, J. Liagouris, N. Mamoulis, and S. Skiadopoulos. Privacy preservation by disassociation. PVLDB, 5(10):944 955, 2012. [PSLG14] Giorgos Poulis, Spiros Skiadopoulos, Grigorios Loukides, Aris Gkoulalas-Divanis: Apriori-based algorithms for km-anonymizing trajectory data. Transactions on Data Privacy 7(2): 165-194 (2014) [PGLST14] Giorgos Poulis, Aris Gkoulalas-Divanis, Grigorios Loukides, Spiros Skiadopoulos, Christos Tryfonopoulos: SECRETA: A System for Evaluating and Comparing RElational and Transaction Anonymization algorithms. EDBT 2014: 620-623 [PSLG13a] Giorgos Poulis, Spiros Skiadopoulos, Grigorios Loukides, Aris Gkoulalas-Divanis: Select-Organize-Anonymize: A Framework for Trajectory Data Anonymization. ICDM Workshops 2013: 867-874 (PADM) [PSLG13b] Giorgos Poulis, Spiros Skiadopoulos, Grigorios Loukides, Aris Gkoulalas-Divanis: Distance-Based k^m-anonymization of Trajectory Data. MDM (2) 2013: 57-62 (PRISMO) [PLGS13] Giorgos Poulis, Grigorios Loukides, Aris Gkoulalas-Divanis, Spiros Skiadopoulos: Anonymizing Data with Relational and Transaction Attributes. ECML/PKDD (3) 2013: 353-369 [TABM15] Yannis Tzitzikas, Carlo Allocca, Chryssoula Bekiari, Yannis Marketakis, Pavlos Fafalios, Martin Doerr, Nikos Minadakis, Theodore Patkos and Leonardo Candella, Unifying Heterogeneous and Distributed Information about Marine Species through the Top Level Ontology MarineTLO, accepted for publication in the International Peer-Reviewed Journal Program: Electronic library and Information Systems, Special Issue on Application of Metadata and Semantics in Science, Emerald (2015) [PDP14] M. Papadakis, M. Doerr and D. Plexousakis, Fuzzy Times on Space- Time Volumes, in Proceedings for e-2014 (24th International Conference on E-Challenges), Belfast, N. Ireland, October 2014 14

15

Παράρτημα 16