ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ



Σχετικά έγγραφα
ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ,

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

Πίνακες. Ι.Ε.Κ ΓΛΥΦΑΔΑΣ Τεχνικός Τεχνολογίας Internet Αλγοριθμική Ι (Ε) Σχολ. Ετος A Εξάμηνο

Vodafone Business Connect

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Ημερομηνία Παράδοσης: 4/4/2013

Μια καλή επιλογή θα ήταν (χωρίζοντας τις λέξεις με παύλα -) ή

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

TUTORIAL VERSION: 1.0

Οδηγίες Χρήσεως Ψηφιακού Αποθετηρίου Ιστοριών στην Ελληνική Νοηματική Γλώσσα (ΕΝΓ)

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ

Διαχείριση Έργου Λογισμικού. Πασχαλίδης Παύλος ΤΕΙ ΘΕΣΣΑΛΙΑΣ

Δομές Δεδομένων. Ενότητα 11: Τεχνικές Κατακερματισμού. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής.

Software Evolution Monitor. Software Evolution Monitor (Requirements Definition) Έκδοση <1.0>

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Γενικό πλαίσιο. Software Evolution Monitor Requirements. Απόστολος Ζάρρας

Εκδήλωση ενδιαφέροντος

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Εαρινό Εξάμηνο

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Οδηγός Εγκατάστασης και Χρήσης του Arebas Easy

Οδηγός Ηλεκτρονικής Αίτησης

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

Σύστημα Αναθέσεων. Σχεδιασμός Υποσυστημάτων

Δομές Δεδομένων. Ενότητα 1 - Εισαγωγή. Χρήστος Γκουμόπουλος. Πανεπιστήμιο Αιγαίου Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων

ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Ο υπολογιστής ως υποστηρικτικό εργαλείο

Προτεινόμενες Διπλωματικές Εργασίες 2009

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

ΘΕΜΑΤΑ MSC, ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ΠΤΥΧΙΑΚΩΝ ΕΡΓΑΣΙΩΝ

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

12/5/18. συστημάτων. Το λογισµικό συστηµάτων. Κεφάλαιο 5

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Εισαγωγή στη Σχεδίαση Λογισμικού

Πετράκης Κώστας ΓΤΠ-61 Μάρτιος 2015

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

openlaws Αυτοματοποιημένη κωδικοποίηση της ελληνικής νομοθεσίας με NLP Θοδωρής Παπαδόπουλος

Κεφάλαιο 14: Συμβουλές προς έναν νέο προγραμματιστή

Δρομολόγηση (Routing)

Πτυχιακές εργασίες

Αγορά Πληροφορικής. Προϊόντα και Υπηρεσίες.

ΕΡΓΟ: Συγκριτική Μελέτη Λογισμικού Βιβλιοθηκών, Λογισμικού Εφαρμογών Ανοικτού Κώδικα και Βιομηχανικού Λογισμικού MIS:

Πανεπιστήμιο Πειραιώς Τμήμα : Οργάνωσης και Διοίκησης Επιχειρήσεων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

Εφαρμογές που χρησιμοποιούν το πρότυπο DCAT. Γιάννης Ξυδιάς

Τμήμα Πληροφορικής ΑΠΘ Τμήμα Οικονομικών Επιστημών ΑΠΘ

Υπηρεσίες Ιστού (Web Services) ΜΙΧΑΛΗΣ ΜΑΛΙΑΠΠΗΣ

Οδηγός Ηλεκτρονικής Αίτησης

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2013

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

2 ο Θερινό Σχολείο: ICT και Εφαρμογές»

Θέματα Ατομικής Διπλωματικής Εργασίας - DRAFT Ακαδημαϊκό Έτος 2015/2016. Γεωργία Καπιτσάκη (Λέκτορας)

Σχεδίαση και ανάπτυξη δραστηριοτήτων στο προγραμματιστικό περιβάλλον MicroWorlds Pro

ΑΠΟΤΕΛΕΣΜΑΤΑ ΙΑΒΟΥΛΕΥΣΗΣ

Περιεχόµενα Bc1.1.1 ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ ΕΠΙΠΕ ΟΥ 2 1 Περιγραφή Επιλογή εικτών Ανάκτηση δεδοµένων από δικτυακό τόπο Προετοιµασία ανάκτ

Εισαγωγή στην επιστήμη και την επιστημονική μέθοδο

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

4.1 Άνοιγμα υπάρχοντος βιβλίου εργασίας

Καλώς Ορίσατε στο CERN

ΙΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΡΕΥΝΑΣ (ITE)

ΕΚΤ και καινοτομία με ανοιχτά δεδομένα και APIs

Γνωριμία με το περιβάλλον

ΟΔΗΓΙΕΣ ΛΟΓΙΣΜΙΚΟΥ CLASSBOOK (διαδραστικού ClassBoard)

Οδηγός Εισαγωγή Χρηστών σε LDAP Server με χρήση. LdapAdmin TEMPLATE

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Έμπειρα Συστήματα. Εργαστήριο

Αγαπητέ κύριε Καρτσιώτη, αγαπητέ κύριε Καρούμπη, κυρίες και κύριοι,

Υπολογιστικής Σκέψης

Άσκηση 3. Έλεγχος ανατροφοδότησης κατάστασης dc κινητήρα. Έλεγχος ανατροφοδότησης κατάστασης

ΗΥ240: Δοµές Δεδοµένων Εαρινό Εξάµηνο Ακαδηµαϊκό Έτος 2017 Διδάσκουσα: Παναγιώτα Φατούρου Προγραµµατιστική Εργασία - 1 ο Μέρος

Ενότητα 3: ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ

Δημιουργώντας τον πίνακα διάστασης

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΗΥ240: Δομές Δεδομένων Εαρινό Εξάμηνο Ακαδημαϊκό Έτος 2017 Διδάσκουσα: Παναγιώτα Φατούρου Προγραμματιστική Εργασία - 2o Μέρος

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΡΟΣΟΜΟΙΩΣΗ ΔΙΕΡΓΑΣΙΩΝ ΧΡΗΣΙΜΟΠΟΙΩΝΤΑΣ ΤΟ ΛΟΓΙΣΜΙΚΟ EXTEND. 1 ο εργαστήριο Διοίκησης και Παραγωγής Έργων

Οι βασικές λειτουργίες (ή πράξεις) που γίνονται σε μια δομή δεδομένων είναι:

Ο ArcCatalog χρησιμοποιείται για την πλοήγηση / διαχείριση χωρικών δεδοµένων.

H SQL είναι η γλώσσα για όλα τα εμπορικά σχεσιακά συστήματα διαχείρισης βάσεων δεδομένων

Εφαρμογή Ηλεκτρονικής Υποβολής Δηλώσεων Ε9. Οδηγίες Χρήσης

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ GD2670

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 3. ΑΝΆΠΤΥΞΗ

Θέμα: Versioning σε γεωγραφικές βάσεις δεδομένων

Δομές Δεδομένων (Data Structures)

Οδηγίες Χρήσης της εφαρμογής Class-Web

Παναγιώτης Σωτηρόπουλος

Crowdsourcing, Eφαρμογές για τον εμπλουτισμό δημόσιου περιεχομένου Ανοιχτά δεδομένα - Η διάσταση της ανάπτυξης μέσα από ψηφιακή καινοτομία

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΓΕΝΙΚΩΝ ΧΡΗΣΤΩΝ

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Rational Unified Process. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική

Πληροφοριακά Συστήματα Διοίκησης. Διοικητική Επιστήμη και Λήψη Αποφάσεων

SUBVERSION. Διδάσκοντες: Π. Αγγελάτος, Δ. Ζήνδρος Επιμέλεια διαφανειών: Δ. Ζήνδρος Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Μοντελοποίηση Συστημάτων. Διαγράμματα Κλάσεων ClassDiagrams

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Transcript:

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ ΑΚ. ΕΤΟΣ 2013-2014 Π. ΒΑΣΙΛΕΙΑΔΗΣ http://www.cs.uoi.gr/~pvassil/courses/diplomatikes ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ 1. Μελέτη της Εξέλιξης Βάσεων Δεδομένων... 2 1.1. Εξόρυξη Προτύπων από τη Χρονογραμμή της Εξέλιξης Σχημάτων Βάσεων Δεδομένων... 4 1.2. Εξόρυξη Προτύπων από τον Παλμο των Αλλαγων της Εξέλιξης Σχημάτων Βάσεων Δεδομένων... 5 D:\Users\pvassil\COURSES\DIPLOMATIKES\OLD\2013-2014\2013-2014_DiplomaTopics_PV.docx 1

1. ΜΕΛΕΤΗ ΤΗΣ ΕΞΕΛΙΞΗΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Μια βάση δεδομένων, από τη στιγμή που θα δημιουργηθεί, αλλάζει εσωτερική δομή με το πέρασμα του χρόνου: νέοι πίνακες δημιουργούνται, παλαιοί καταστρέφονται, πεδία διαγράφονται, μετονομάζονται κλπ. Η διαδικασία αυτή ονομάζεται «εξέλιξη του σχήματος της βάσης δεδομένων» (schema evolution). Το εργαλείο Hecate [ https://github.com/giskou/hecate ] μπορεί να συγκρίνει δύο σχήματα και να βρει τις διαφορές τους (κίτρινο: updated attributes, red: deletions, green: insertions). Επιπλέον, υπάρχουν αρκετές συλλογές από εκδόσεις του σχήματος της ιδίας βάσης (παρακάτω ένα screenshot από τη βάση της Wikimedia). H Εκάτη μπορεί να ταξινομήσει τις επί μέρους εκδοχές του σχήματος και να τις συγκρίνει διαδοχικά. D:\Users\pvassil\COURSES\DIPLOMATIKES\OLD\2013-2014\2013-2014_DiplomaTopics_PV.docx 2

Έχουμε ήδη χρησιμοποιήσει την Εκάτη για να επεξεργαστούμε την εξέλιξη σχήματος διαφόρων βάσεων δεδομένων ανοιχτού λογισμικού, όπως για παράδειγμα, της βάσης της Wikimedia (της βάσης δεδομένων πίσω από τη Wikipedia), της βάσης του Atlas Trigger (του εργαλείου που διαχειρίζεται τα δεδομένα από το πείραμα Atlas για την ανεύρεση του μποζονίου του Χιγκς), της Ensembl (του εργαλείου για τη διαχείριση των δεδομένων του ανθρώπινου γονιδιώματος) και πολλών CMS s (opencart, coppermine, phpbb, typo3, ). Έχουμε επίσης συλλέξει την ιστορία από πολλά συστήματα ανοιχτού κώδικα που περιλαμβάνουν βάσεις δεδομένων και καταγράφουν και τις εκδοχές τους σε δημόσια αποθετήρια (κυρίως github, αλλά και svn) αλλά δεν την έχουμε επεξεργαστεί ακόμα. 100 80 Relations 60 40 20 0 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 400 350 300 250 200 150 Table Insertions Attribute Insertions Attribute Insertions w/table Table Deletions Attribute Deletions Attribute Deletions w/table Table Alteration Attribute Key Alterations Attribute Type Alterations 100 50 0 1 20 39 58 77 96 115 134 153 172 191 210 229 248 267 286 305 324 343 362 381 400 419 438 457 476 495 514 Στο παραπάνω σχήμα βλέπετε (α) το πώς εξελίχθηκε το μέγεθος του σχήματος της βάσης στο χρόνο και (β) τον παλμό των αλλαγών (το πώς διαρθρώθηκαν οι αλλαγές σε κάθε monitored version) για τη βάση Ensembl. Η έρευνα στην περιοχή αυτή είναι θεμελιώδους φύσεως και αφορά στο να κατανοήσουμε την ύπαρξη προτύπων (ή ακόμα καλύτερα νόμων) για το πώς εξελίσσονται οι βάσεις δεδομένων με την πάροδο του χρόνου. D:\Users\pvassil\COURSES\DIPLOMATIKES\OLD\2013-2014\2013-2014_DiplomaTopics_PV.docx 3

1.1. ΕΞΟΡΥΞΗ ΠΡΟΤΥΠΩΝ ΑΠΟ ΤΗ ΧΡΟΝΟΓΡΑΜΜΗ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΛΗΨΗ: Ο σκοπός της παρούσας εργασίας είναι η ανεύρεση επαναλαμβανόμενων προτύπων από τη χρονογραμμή της εξέλιξης των σχημάτων ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Ο πρώτος στόχος είναι να υλοποιηθούν αλγόριθμοι εξόρυξης προτύπων για να δούμε αν υπάρχουν πρότυπα συμπεριφοράς στη χρονογραμμή των σχημάτων. Τα πρότυπα θα αναζητηθούν με δύο τρόπους: (α) ανά dataset χωριστά, (β) σε όλα τα datasets, στις εξής κατηγορίες: - Βάση: μέγεθος σχήματος και ρυθμός ανάπτυξης - Πίνακας: μέγεθος πίνακα (αρ. πεδίων) Αν η απλή αναζήτηση δεν λειτουργήσει, θα δοκιμάσουμε να συμπτύξουμε το χρόνο (αντί να κοιτάμε τις αλλαγές για κάθε μία version, θα συμπτύξουμε πολλές versions μαζί με τρόπο που να είναι σημασιολογικά ευσταθής, πχ., versions που είναι πολύ κοντά στο χρόνο). Ο δεύτερος στόχος είναι να μπορούμε να ελέγξουμε, διαδραστικά αν ένα πρότυπο ισχύει. Επιπλέον απαιτήσεις: - Η υλοποίηση θα πρέπει να είναι γενική ώστε να δουλεύει με μια οποιαδήποτε timeline (καθώς στο μέλλον, μπορεί να χρειαστεί να αλλάξουμε τις χρονογραμμές). - Είναι επιθυμητό να υπάρχει API στην κεντρική μηχανή εξαγωγής προτύπων. - Αφού ανευρεθούν τα πρότυπα θα πρέπει (α) να οπτικοποιούνται και (β) να μπορούμε να δούμε όλες τις εμφανίσεις ενός pattern. Μπορείτε να βρείτε έτοιμο κώδικα και αλγόριθμο (αλλά όχι σε java) στο http://www.cs.unm.edu/~mueen/projects/moen/index.html ΕΠΙΠΕΔΟ: Διπλωματική εργασία (ατομική) ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ: Η δυσκολία έγκειται στο κομμάτι της τεχνολογίας λογισμικού, ώστε να φτιαχτεί το λογισμικό ως μια μηχανή υψηλής ποιότητας. Τα οφέλη για ένα φοιτητή είναι: (α) τεχνογνωσία σε μια προχωρημένη περιοχή, αυτή της εξόρυξης πληροφορίας (data mining), η οποία όλο και αποκτά νέα δυναμική (όσο τα δεδομένα αυξάνονται), (β) τεχνογνωσία σε θέματα εξέλιξης του σχήματος βάσεων δεδομένων, και (γ) πρακτική εμπειρία σε θέματα υλοποίησης αλγορίθμων, API, GUI σε Java. Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο στον προγραμματισμό και ενδιαφέροντα στις βάσεις δεδομένων, την εξόρυξη πληροφορίας και την τεχνολογία λογισμικού. D:\Users\pvassil\COURSES\DIPLOMATIKES\OLD\2013-2014\2013-2014_DiplomaTopics_PV.docx 4

1.2. ΕΞΟΡΥΞΗ ΠΡΟΤΥΠΩΝ ΑΠΟ ΤΟΝ ΠΑΛΜΟ ΤΩΝ ΑΛΛΑΓΩΝ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΛΗΨΗ: Ο σκοπός της παρούσας εργασίας είναι η ανεύρεση επαναλαμβανόμενων προτύπων από τον παλμό γεγονότων της εξέλιξης των σχημάτων ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Σε κάθε μετάβαση από μια εκδοχή σε μια άλλη, υπάρχει ένα διάνυσμα από αλλαγές (πόσα πεδία προστέθηκαν, πόσα αφαιρέθηκαν, κλπ). Ο πρώτος στόχος είναι να υλοποιηθούν αλγόριθμοι εξόρυξης προτύπων τύπου συχνών στοιχειοσυνόλων για να δούμε αν υπάρχουν πρότυπα συμπεριφοράς στον παλμό γεγονότων των σχημάτων. Τα πρότυπα θα αναζητηθούν με δύο τρόπους: (α) ανά dataset χωριστά, (β) σε όλα τα datasets, στις εξής κατηγορίες: - Αμιγώς ποσοτικά (με κάθε μετάβαση να περιγράφεται ωε ένα διάνυσμα τιμών) - Ως ποσοστά επί του μεγέθους του σχήματος Αν η απλή αναζήτηση δεν λειτουργήσει, έχουμε 2 εναλλακτικές διαδρομές: (α) να εξετάσουμε τα είδη των αλλαγών χωριστά αντί για όλα μαζί και (β) να δοκιμάσουμε να συμπτύξουμε το χρόνο (αντί να κοιτάμε τις αλλαγές για κάθε μία version, θα συμπτύξουμε πολλές versions μαζί με τρόπο που να είναι σημασιολογικά ευσταθής, πχ., versions που είναι πολύ κοντά στο χρόνο). Επιπλέον απαιτήσεις: - Η υλοποίηση θα πρέπει να είναι γενική ώστε να δουλεύει με μια οποιαδήποτε heartbeat (καθώς στο μέλλον, μπορεί να χρειαστεί να αλλάξουμε τα event breakdown). - Είναι επιθυμητό να υπάρχει API στην κεντρική μηχανή εξαγωγής προτύπων. - Αφού ανευρεθούν τα πρότυπα θα πρέπει (α) να οπτικοποιούνται και (β) να μπορούμε να δούμε όλες τις εμφανίσεις ενός pattern. ΕΠΙΠΕΔΟ: Διπλωματική εργασία (ατομική) ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ: Η δυσκολία έγκειται στο κομμάτι της τεχνολογίας λογισμικού, ώστε να φτιαχτεί το λογισμικό ως μια μηχανή υψηλής ποιότητας. Τα οφέλη για ένα φοιτητή είναι: (α) τεχνογνωσία σε μια προχωρημένη περιοχή, αυτή της εξόρυξης πληροφορίας (data mining), η οποία όλο και αποκτά νέα δυναμική (όσο τα δεδομένα αυξάνονται), (β) τεχνογνωσία σε θέματα εξέλιξης του σχήματος βάσεων δεδομένων, και (γ) πρακτική εμπειρία σε θέματα υλοποίησης αλγορίθμων, API, GUI σε Java. Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο στον προγραμματισμό και ενδιαφέροντα στις βάσεις δεδομένων, την εξόρυξη πληροφορίας και την τεχνολογία λογισμικού. D:\Users\pvassil\COURSES\DIPLOMATIKES\OLD\2013-2014\2013-2014_DiplomaTopics_PV.docx 5