Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)



Σχετικά έγγραφα
ΕΓΓΡΑΦΟ ΕΡΓΑΣΙΑΣ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΤΗΣ ΕΠΙΤΡΟΠΗΣ. Εκθεση χώρας - Κύπρος {COM(2015) 85 final}

ΕΛΤΙΟ Ε ΟΜΕΝΩΝ ΑΣΦΑΛΕΙΑΣ

Περιεχόµενα. 1. Γενικό πλαίσιο. 2. Η ΚΑΠ σήµερα. 3. Γιατί χρειαζόµαστε τη µεταρρύθµιση; 4. Νέοι στόχοι, µελλοντικά εργαλεία και πολιτικές επιλογές

Θεματική Ενότητα: ΠΑΙΔΕΙΑ ΠΟΛΙΤΙΣΜΟΣ - ΑΘΛΗΤΙΣΜΟΣ

Δασικά Οικοσυστήματα και Τεχνικά Έργα

ΕΣΩΤΕΡΙΚΟΙ ΚΑΝΟΝΙΣΜΟΙ ΙΟΙΚΗΤΙΚΗ ΙΑΡΘΡΩΣΗ


«Αναδιάρθρωση της καλλιέργειας του καπνού µε άλλες ανταγωνιστικές καλλιέργειες»

«Αναδιάρθρωση της καλλιέργειας του καπνού µε άλλες ανταγωνιστικές καλλιέργειες»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΝΑΥΤΙΛΙΑΣ ΚΑΙ ΕΠΙΧΕΙΡΗΜΑΤΙΚΩΝ ΥΠΗΡΕΣΙΩΝ

Σας πληροφορούμε ότι δημοσιεύθηκε ο νόμος 3861/2010 (ΦΕΚ112/Α / ) «Ενίσχυση της διαφάνειας με την υποχρεωτική

ΚΑΤΑΣΤΑΤΙΚΟ ΣΥΛΛΟΓΟΥ ΥΠΟΨΗΦΙΩΝ Ι ΑΚΤΟΡΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ ΟΙΚΟΝΟΜΙΚΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ

ΤΙΜΟΛΟΓΙΟ ΜΕΛΕΤΗΣ Τιµαριθµική 2012Γ

Αρµοδιότητες Αυτοτελούς Τµήµατος Δηµοτικής Αστυνοµίας

Μαρία-Στεφανία-Γιάννης 1 ο Πρότυπο Πειραματικό Δημοτικό Σχολείο Θεσσαλονίκης Ε2 Π.Τ.Δ.Ε.-Α.Π.Θ

Σεμινάριο με θέμα : Εθελοντισμός & Δικαιώματα Παιδιού

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΓΕΩΓΡΑΦΙΑΣ

ΤΙΜΟΛΟΓΙΟ ΜΕΛΕΤΗΣ ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙ ΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ «ΥΓΡΟΜΟΝΩΣΕΙΣ ΕΡΓΟ:

ΑΠΟΦΑΣΗ. Η Εθνική Επιτροπή Τηλεπικοινωνιών και Ταχυδρομείων (ΕΕΤΤ),

Δρ.ΠΟΛΥΚΑΡΠΟΣ ΕΥΡΙΠΙΔΟΥ

ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΝΟΜΟΣ ΠΕΛΛΑΣ ΗΜΟΣ Ε ΕΣΣΑΣ

Εργατικά ατυχήµατα στο δρόµο

ΟΣΤΑ & ΣΚΕΛΕΤΙΚΟ ΣΥΣΤΗΜΑ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΝΑΥΠΗΓΩΝ ΜΗΧ/ΓΩΝ ΜΗΧΑΝΙΚΩΝ. ΘΕΜΑ: Προστασία µε επιµεταλλώσεις. Σκαβάρας Παναγιώτης

Δευτέρα, 9 Απριλίου 2012 ΙΝΣΤΙΤΟΥΤΟ ΕΜΠΟΡΙΟΥ & ΥΠΗΡΕΣΙΩΝ ΠΕΤΡΑΚΗ 16 Τ.Κ ΑΘΗΝΑ ΤΗΛ.: FAX:

ΑΝΑΚΟΙΝΩΣΗ ΔΡΑΣΤΗΡΙΟΤΗΤΩΝ

Ειδικός Λογαριασµός Κονδυλίων Έρευνας ΙΤΣΑΚ Οδηγός Χρηµατοδότησης

δ ) Άρθρο 42β 5 : Αναµορφώσεις κονδυλίων προηγούµενης χρήσης για να καταστούν συγκρίσιµα µε τα αντίστοιχα κονδύλια της κλεισµένης χρήσης.

ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ

ΑΝΑΚΟΙΝΩΣΗ ΣΟΧ 3/2015 για τη σύναψη ΣΥΜΒΑΣΗΣ ΕΡΓΑΣΙΑΣ ΟΡΙΣΜΕΝΟΥ ΧΡΟΝΟΥ. Η Κοινωφελής ηµοτική Επιχείρηση ήµου Αµπελοκήπων-Μενεµένης

ΘΕΣΕΙΣ ΠΡΟΤΑΣΕΙΣ ΠΡΟΤΕΡΑΙΟΤΗΤΕΣ

Αθήνα, 10/12/2014 ΠΟΛ 1253/2014

Η Αγορά Ηλεκτρικής Ενέργειας στην Κύπρο έχει οργανωθεί σε τομείς που υπόκεινται στις ακόλουθες ρυθμίσεις:

ΤΙΜΟΛΟΓΙΟ Η/Μ ΕΡΓΑΣΙΩΝ

Φασίστες και αφεντικά στου πηγαδιού τον πάτο, ζήτω το παγκόσμιο προλεταριάτο.

Βασικές Έννοιες και Μέθοδοι της Οικονομικής Επιστήμης - Οικονομία (< οίκος + νέμω): Διαχείριση των Υποθέσεων ενός Νοικοκυριού - Γενικός Ορισμός: Μια

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ ΟΙΚΟΝΟΜΙΑΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Ο ΥΠΟΥΡΓΟΣ ΕΝΕΡΓΕΙΑΣ ΚΑΙ ΦΥΣΙΚΩΝ ΠΟΡΩΝ

Επιµορφωτικό Πρόγραµµα Ο.ΜΕ Ιανουαρίου 2006 Ν Α Υ Π Λ Ι Ο «Η ΕΞΕΛΙΞΗ ΣΤΙΣ ΕΥΡΩΠΑΪΚΕΣ ΕΡΓΑΣΙΑΚΕΣ ΣΧΕΣΕΙΣ - Ο ΡΟΛΟΣ ΤΟΥ ΚΟΙΝΩΝΙΚΟΥ ΙΑΛΟΓΟΥ»

ΚΑΤΑΣΤΑΤΙΚΟ ΚΕΝΤΡΟΥ ΝΕΟΤΗΤΑΣ. ΙΔΡΥΣΗ Ιδρύεται Κέντρο Νεότητας µε την επωνυµία «Κέντρο Νεότητας... µε έδρα...

Η ΦΟΡΟΛΟΓΙΑ ΜΕΤΑΒΙΒΑΣΗΣ ΠΛΟΙΩΝ

ΝΟΜΟΣ ΠΟΥ ΠΡΟΒΛΕΠΕΙ ΓΙΑ ΤΗΝ ΚΡΑΤΙΚΗ ΦΟΙΤΗΤΙΚΗ ΜΕΡΙΜΝΑ ΚΑΙ ΓΙΑ ΣΥΝΑΦΗ ΘΕΜΑΤΑ. Η Βουλή των Αντιπροσώπων ψηφίζει ως ακολούθως:

ΣΤΗΝ ΤΡΟΙΖΗΝΙΑ ΑΠΟ ΑΓ.ΕΛΕΝΗ ΕΩΣ ΤΟΝ ΚΟΜΒΟ ΚΑΛΛΟΝΗΣ ΚΑΙ ΣΤΗΝ ΠΑΡΑΛΙΑ ΤΟΥ ΑΡΤΙΜΟΥ. ΤΙΜΟΛΟΓΙΟ ΜΕΛΕΤΗΣ Τιμαριθμική 2012Α


ΤΙΜΟΛΟΓΙΟ ΜΕΛΕΤΗΣ ΓΕΝΙΚΟΙ ΟΡΟΙ

ΑΝΑΚΟΙΝΩΣΗ υπ' αριθµ. ΣΟΧ 1/2015 για τη σύναψη ΣΥΜΒΑΣΗΣ ΕΡΓΑΣΙΑΣ ΟΡΙΣΜΕΝΟΥ ΧΡΟΝΟΥ

Ειδικότητα: Ύφασµα Ένδυση

ΜΕΡΟΣ Ι ΤΙΤΛΟΣ Ι. Άρθρο Ι-1. Ίδρυση της Ένωσης. Άρθρο Ι-2. Οι αξίες της Ένωσης

ΧΕΙΜΕΡΙΝΟΣ ΤΟΥΡΙΣΜΟΣ ΣΤΗΝ ΕΛΛΑ Α

ΓΥΝΑΙΚΕΙΟΙ ΑΓΡΟΤΟΥΡΙΣΤΙΚΟΙ ΣΥΝΕΤΑΙΡΙΣΜΟΙ ΣΤΗΝ ΕΛΛΑ Α

ΙΟΙΚΗΣΗ Ε.Ο.Κ. ΑΡΘΡΟ 1

Αναλυτικό Πρόγραµµα Σπουδών του Μαθήµατος. Α Τάξη 1 ου Κύκλου Τ.Ε.Ε. 2 ώρες /εβδοµάδα. Αθήνα, Απρίλιος 2001

Κεφάλαιο Πέμπτο Εθνοπολιτισμική Ζωή και Εμπειρίες Ελληνικότητας των Ελληνοαυστραλών Εφήβων

ΛΥΚΕΙΟ ΑΓΙΑΣ ΦΥΛΑΞΕΩΣ ΣΧΟΛΙΚΗ ΧΡΟΝΙΑ ΛΕΜΕΣΟΣ ΓΡΑΠΤΕΣ ΠΡΟΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΙΟΥΝΙΟΥ Μάθηµα : ΦΥΣΙΟΓΝΩΣΤΙΚΑ Ηµεροµηνία : 04/6/2008

Αντωνία Αθανασοπούλου

Ο ΠΡΟΕ ΡΟΣ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΗΜΟΚΡΑΤΙΑΣ Εκδίδοµε τον ακόλουθο νόµο που ψήφισε η Βουλή:

ΕΝΕΡΓΕΙΑΚΑ ΦΥΤΑ. Ευκαιρία για την ελληνική γεωργία ; Γ. Ν. Σκαράκης Γεωπονικό Πανεπιστήµιο Αθηνών

ΑΠΑΝΤΗΣΕΙΣ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ 2014

EUROCORP ΑΝΩΝΥΜΟΣ ΕΤΑΙΡΕΙΑ ΠΑΡΟΧΗΣ ΕΠΕΝ ΥΤΙΚΩΝ ΥΠΗΡΕΣΙΩΝ

Η ΦΙΛΙΑ..!!! Η ΑΞΙΑ ΤΗΣ ΦΙΛΙΑΣ

Α Π Ο Φ Α Σ Η 4/459/ του ιοικητικού Συµβουλίου

1. Τα Ιατρικά Έξοδα που µπορεί να καταβάλει η Επιτροπή Ασθενειών που προκαλούνται από Πνευµονοκονίαση:

Άνω Άκρο (ΙΙ) Ι. Γενικά

ΠΡΑΚΤΙΚΑ ΙΗΜΕΡΙ ΑΣ-NATURA ΣΠΕΡΧΕΙΟΥ ΜΑΛΙΑΚΟΥ -04 ΘΕΜΑ: «ΕΜΠΕΙΡΙΑ ΚΑΙ ΠΡΟΟΠΤΙΚΗ ΣΤΗΝ NATURA ΣΠΕΡΧΕΙΟΥ ΜΑΛΙΑΚΟΥ»

ΣΥΝ ΕΣΜΟΣ ΙΑΙΤΗΤΩΝ ΚΑΛΑΘΟΣΦΑΙΡΙΣΗΣ ΚΡΗΤΗΣ

Παρασκευή, 25 Ιανουαρίου 2013 ΙΝΣΤΙΤΟΥΤΟ ΕΜΠΟΡΙΟΥ & ΥΠΗΡΕΣΙΩΝ ΠΕΤΡΑΚΗ 16 Τ.Κ ΑΘΗΝΑ ΤΗΛ.: FAX:

ΙΝΣΤΙΤΟΥΤΟ ΕΜΠΟΡΙΟΥ & ΥΠΗΡΕΣΙΩΝ ΠΕΤΡΑΚΗ 16 Τ.Κ ΑΘΗΝΑ ΤΗΛ.: FAX:

ΕΡΓΑΣΤΗΡΙΟ ΠΟΙΝΙΚΩΝ & ΕΓΚΛΗΜΑΤΟΛΟΓΙΚΩΝ ΕΡΕΥΝΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ ΔΙΕΥΘΥΝΤΗΣ: ΚΑΘΗΓΗΤΗΣ ΝΕΣΤΩΡ ΚΟΥΡΑΚΗΣ

ΠΕΤΕΠ ΠΡΟΣΩΡΙΝΕΣ ΕΘΝΙΚΕΣ ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ Υ.ΠΕ.ΧΩ..Ε.

ΚΕΦΑΛΑΙΟ 8 ΣΥΜΠΕΡΑΣΜΑΤΑ

Ο ΗΓΙΕΣ ΕΓΚΑΤΑΣΤΑΣΗΣ, ΛΕΙΤΟΥΡΓΙΑΣ ΚΑΙ ΣΥΝΤΗΡΗΣΗΣ

ΤΙΜΟΛΟΓΙΟ ΠΡΟΣΦΟΡΑΣ ΕΡΓΑΣΙΩΝ ΑΠΟΤΙΜΩΜΕΝΩΝ ΜΕ ΚΑΤ ΑΠΟΚΟΠΗ ΤΙΜΗΜΑΤΑ

«Παιχνίδι» Εικονικών Επιχειρήσεων: Εγχειρίδιο Χρήσης για τον Μαθητή

Μέθοδοι διαχωρισμού των συστατικών ενός ετερογενούς μείγματος

Κώδικας. ιαχείρισης του Συστήµατος. και. Συναλλαγών Ηλεκτρικής. Ενέργειας

Χρηματοδότηση των Συλλόγων στην εποχή της κρίσης

ΙΝΣΤΙΤΟΥΤΟ ΠΑΙΔΑΓΩΓΙΚΩΝ ΕΡΕΥΝΩΝ ΜΕΛΕΤΩΝ ΔΙΔΑΣΚΑΛΙΚΗΣ ΟΜΟΣΠΟΝΔΙΑΣ ΕΛΛΑΔΑΣ

στο σχέδιο νόµου «Ρύθµιση συνταξιοδοτικών θεµάτων του Δηµοσίου και άλλες διατάξεις» Επί του άρθρου 1 ΑΙΤΙΟΛΟΓΙΚΗ ΕΚΘΕΣΗ

ΕΡΕΥΝΑ ΚΑΤΑΝΑΛΩΤΗ ΑΡΩΜΑΤΙΚΩΝ & ΦΑΡΜΑΚΕΥΤΙΚΩΝ ΒΙΟΚΑΥΣΙΜΩΝ

Πίνακας Ευεργετών. Ελπίζουμε πως η συλλογική προσπάθεια των φοιτητών θα βοηθήσει το έργο της Εταιρείας Μελέτης Ελληνικής Διασποράς (E.M.E.ΔΙΑ).

ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Γ ΛΥΚΕΙΟΥ & ΕΠΑ.Λ. Β 14 ΜΑΪΟΥ 2011 ΑΠΑΝΤΗΣΕΙΣ ÍÔÁÂÏÓ ÁÈÇÍÁ

Ο ΙΑΜΑΤΙΚΟΣ ΤΟΥΡΙΣΜΟΣ & Η ΑΝΑΠΤΥΞΗ ΤΟΥ ΣΤΗΝ ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΣΑΝΤΟΡΙΝΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ FREDERICK

ΤΕΛΙΚΗ ΕΚΘΕΣΗ Τεύχος 9: Θεµατική Χαρτογράφηση

62 η ΣΥΝΟΔΟΣ ΠΡΥΤΑΝΕΩΝ & ΠΡΟΕΔΡΩΝ Δ.Ε. ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΩΝ

ΚΕΦ. 1 Η ΛΟΓΙΣΤΙΚΗ ΚΑΙ Η ΣΗΜΑΣΙΑ ΤΗΣ ΣΤΙΣ ΕΠΙΧΕΙΡΗΣΕΙΣ

ΕΓΚΥΚΛΙΟΣ 5 η. της χώρας. Κυρίες και Κύριοι συνάδελφοι,

ΚΩ ΙΚΑΣ ΕΟΝΤΟΛΟΓΙΑΣ ΤΗΣ ΕΤΑΙΡΕΙΑΣ ΜΕ ΤΗΝ ΕΠΩΝΥΜΙΑ «ΠΑΠΟΥΤΣΑΝΗΣ ΑΝΩΝΥΜΗ ΒΙΟΜΗΧΑΝΙΚΗ ΚΑΙ ΕΜΠΟΡΙΚΗ ΕΤΑΙΡΕΙΑ ΚΑΤΑΝΑΛΩΤΙΚΩΝ ΑΓΑΘΩΝ»

ΝΟΜΟΣ ΥΠ' ΑΡΙΘ Κώδικας Δικηγόρων

ΣΧΕΔΙΟ ΝΟΜΟΥ ΔΑΣΙΚΕΣ ΣΥΝΕΤΑΙΡΙΣΤΙΚΕΣ ΟΡΓΑΝΩΣΕΙΣ

ΤΟ ΝΕΡΟ ΜΕΣΑ ΑΠΟ ΤΙΣ ΠΗΓΕΣ-ΚΡΗΝΕΣ ΤΟΥ ΗΜΟΥ ΤΟΠΕΙΡΟΥ

Ε ΡΑ : Τ/ρχη Κωστάκη Ιωάννινα Αριθµός Μητρώου Α.Ε /42Β/86/1

Αναλυτικό Πρόγραµµα Σπουδών του Μαθήµατος. Α Τάξη 1 ου Κύκλου Τ.Ε.Ε. 3 ώρες /εβδοµάδα. Αθήνα, Απρίλιος 2001

Αρωματικά φυτά της Ελλάδας

Καθορισµός και διαχείριση διδακτέας ύλης των θετικών µαθηµάτων της Α Ηµερησίου Γενικού Λυκείου για το σχολικό έτος

Κύτταρο, η Θεµελιώδης Μονάδα της Ζωής

ΟΜΟΦΩΝΗ ΑΠΟΦΑΣΗ. -Συνημμένα 14 Ψηφίσματα: Ψήφισμα 1: Για τη Χρηματοδότηση των ΑΕΙ. Ψήφισμα 2: Θέματα Ανθρώπινου Δυναμικού

Πρώτη Έκθεση της Ελλάδας

Προδημοσιεύτηκαν τα τέσσερις πρώτα προγράμματα του νέου ΕΣΠΑ που αφορούν

Σχετικά: «Το αρίθμ.πρωτ. Φ.437/1/24654/ έγγραφό της Στρατολογικής Υπηρεσίας»

Transcript:

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εξόρυξη Χρονικής Γνώσης (temporal data mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db Περιεχόµενα Χρονολογικές σειρές (time series) Οµοιότητα Πρόβλεψη (πρόγνωση) µελλοντικών τιµών Χρονική ανάλυση καλαθιού αγορών Ανακάλυψη ακολουθιακών προτύπων (sequential patterns) Κανόνες συσχέτισης ακολουθιών (sequence association rules) Εξαρτήσεις τάσεων Επεισόδια (episodes) 2 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.1

Περιεχόµενα Χρονολογικές σειρές (time series) Οµοιότητα Πρόβλεψη (πρόγνωση) µελλοντικών τιµών Χρονική ανάλυση καλαθιού αγορών Ανακάλυψη ακολουθιακών προτύπων (sequential patterns) Κανόνες συσχέτισης ακολουθιών (sequence association rules) Εξαρτήσεις τάσεων Επεισόδια (episodes) 3 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Χρονολογικές σειρές (time series) Σύνολο τιµών χαρακτηριστικών στον άξονα του χρόνου { <t 1, a 1 >, <t 2, a 2 >,, <t n, a n > } Ανάλυση χρονολογικών σειρών: η ανακάλυψη προτύπων στις τιµές. Είδη προτύπων: Τάση : συστηµατική µη επαναλαµβανόµενη αλλαγή στο χρόνο (π.χ. σταθερή αύξηση) Κύκλος : επαναλαµβανόµενη συµπεριφορά Εποχιακό πρότυπο : παρόµοιες τιµές σε συγκεκριµένες περιόδους µέρα, µήνα, έτος κλπ. - του χρόνου Μη φυσιολογικά δεδοµένα (outliers) : στοιχεία που δεν µπορούν να κατηγοριοποιηθούν 4 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.2

Τεχνικές Ανάλυσης Χρονολογικών Σειρών Εξοµάλυνση (smoothing) Μια δηµοφιλής τεχνική: κινούµενος µέσος όρος των τιµών (moving average) Εφαρµογές: Ανακάλυψη τάσεων Εντοπισµός µη φυσιολογικών συµπεριφορών (outliers) 5 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Τεχνικές Ανάλυσης Χρονολογικών Σειρών Αυτο-συσχέτιση (autocorrelation) : συσχέτιση µεταξύ διαφορετικών υποακολουθιών της χρονολογικής σειράς Για ανακάλυψη κύκλων ή εποχιακών (π.χ. ετήσιων) προτύπων Χρονική υστέρηση (lag) Χρόνος µεταξύ συσχετισµένων υποσειρών. 6 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.3

Οµοιότητα (Similarity) sim(x,y) : οµοιότητα µεταξύ δύο χρονολογικών σειρών, X = <x 1, x 2,, x n > και Y = <y 1, y 2,, y m > Ζητήµατα: ιαφορά µήκους (στηγενικήπερίπτωση, n m) Κλίµακα (π.χ. Fahrenheit vs. Celsius) Παρουσία outliers (που δεν µπορούν να κατηγοριοποιηθούν) Παράδειγµα οµοιότητας: longest common subsequence LCS Εύρεση της µεγαλύτερης (δηλαδή, µετο µεγαλύτερο µήκος) κοινής υποακολουθίας. X = <10, 5, 6, 9, 22, 15, 4, 2> Y = < 6, 9, 10, 5, 6, 22, 15, 4, 2, 8> output = <22, 15, 4, 2> sim(x,y) = length(output) / max ( length(x), length(y) ) = 4/10 7 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Παράδειγµα οµοιότητας (;) 100 90 80 70 60 Παράδειγµα: µέση µηνιαία θερµοκρασία σε 2 πόλεις 50 40 30 20 10 Κι όµως, οι 2 σειρές είναι πρακτικά ταυτόσηµες! 0 F = C * 1.8 + 32 Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Celsius Fahrenheit 8 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.4

Οµοιότητα βασισµένη σε γραµµικό µετασχηµατισµό Ψάχνουµε για µια συνάρτηση γραµµικού µετασχηµατισµού f που να µετατρέπει µια τιµή της πρώτης σειράς (κοντά) σε µια τιµή της δεύτερης σειράς ε f Ανεκτή διαφορά στα αποτελέσµατα δ Επιτρεπόµενη διαφορά χρονικής τιµής 9 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Πρόβλεψη Πρόβλεψη (ή πρόγνωση) µελλοντικών τιµών µιας χρονικής σειράς Η παλινδρόµηση (regression) µπορεί να µην είναι αρκετή Στατιστικές Τεχνικές βασισµένες στη µέθοδο της αυτο-παλινδρόµησης (autoregression) παραδοχή: η νέατιµή εξαρτάται από τις προηγούµενες Given a time series X = <x 1, x 2,, x n >, a future value, x n+1, can be found using x n+1 = ξ + φ n x n + φ n-1 x n-1 + + φ 1 x 1 + ε n+1 where φ i are the autoregressive parameters and ε n+1 represents a random error 10 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.5

Περιεχόµενα Χρονολογικές σειρές (time series) Οµοιότητα Πρόβλεψη (πρόγνωση) µελλοντικών τιµών Χρονική ανάλυση καλαθιού αγορών Ανακάλυψη ακολουθιακών προτύπων (sequential patterns) Κανόνες συσχέτισης ακολουθιών (sequence association rules) Εξαρτήσεις τάσεων Επεισόδια (episodes) 11 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Ακολουθίες Ακολουθία (sequence) είναι µια διατεταγµένη λίστα από στοιχειοσύνολα (itemsets) Παρόµοια µε τη χρονολογική σειρά, µε τη µόνη διαφορά ότι µπορεί να περιέχει itemsets αντί τιµών Υπακολουθία (subsequence) T µιας ακολουθίας S είναι µια ακολουθία τέτοια ώστε για κάθε itemset που ανήκει στην T υπάρχει αντίστοιχο υπερσύνολο itemset που ανήκει στην S, στην ίδια διάταξη. Παράδειγµα: S = < {ABC}, {BDE}, {CD}, {ACE} > T= < {BD},{CE} > 12 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.6

Το πρόβληµα της εύρεσης κανόνων συσχέτισης ακολουθιών 13 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Αναλογίες µε το παραδοσιακό πρόβληµα παραδοσιακή ανάλυση Η βάση δεδοµένων: σύνολο από «καλάθια αγορών» Το εργαλείο: συχνά itemsets Τα πρότυπα που προκύπτουν: κανόνες συσχέτισης (µεταξύ itemsets) χρονική ανάλυση Η βάση δεδοµένων: ακολουθία από «καλάθια αγορών» Το εργαλείο: συχνές ακολουθίες από itemsets Τα πρότυπα που προκύπτουν: κανόνες συσχέτισης ακολουθιών (από itemsets) και πολλά άλλα... εξαρτήσεις τάσεων επεισόδια... 14 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.7

Παράδειγµα συχνής ακολουθίας Κατ αναλογία µε τασυχνά itemsets Αγορές που έγιναν από 3 πελάτες C 1, C 2, C 3 s(<{a}>) = 3/3 s(<{a}, {C}>) = 1/3 s(<{a}, {D}>) = 2/3 s(<{bc}, {D}>) = 2/3 s(<{ab}, {C}, {D}>) = 1/3 15 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης ικτυωτό πλέγµα (lattice) συχνών ακολουθιών Εµφανίζονται µόνο οι συχνές ακολουθίες του προηγούµενου παραδείγµατος µε support 2/3 Ιδιότητα συχνών ακολουθιών (frequent sequence property): κάθε υπακολουθία µιας συχνής ακολουθίας είναι συχνή! 16 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.8

SPADE Sequential Pattern Discovery using Equivalence classes (Ανακάλυψη ακολουθιακών προτύπων µε χρήση κλάσεων ισοδυναµίας) Αναγνωρίζει πρότυπα διασχίζοντας το lattice από πάνω προς τα κάτω. ιαιρεί το lattice σε κλάσεις ισοδυναµίας και κάνει αναζήτηση ξεχωριστά σε καθεµία. ID-List: Συσχετίζει πελάτες και συναλλαγές µε κάθε στοιχείο. 17 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Παράδειγµα SPADE ID-List για ακολουθίες µε µήκος 1: Το πλήθος εµφάνισης της ακολουθίας <{A}> είναι 3 Το πλήθος εµφάνισης της ακολουθίας <{A},{D}> είναι 2 18 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.9

Θ 1 Κλάσεις ισοδυναµίας 19 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Ο Αλγόριθµος SPADE 20 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.10

Κανόνες συσχέτισης ακολουθιών Sequence association rules: Κανόνες συσχέτισης που περιέχουν ακολουθίες Παραδείγµατα: <{A},{C}> <{A},{D}>; s = 1/3; c = 1 <{BC},{D}> <{A},{C}>; s = 1/3; c = 1/2 Υλοποίηση σε 2 βήµατα: 1. Εύρεση συχνών ακολουθιών, δηλαδή αυτών που ικανοποιούν το minimum support (π.χ. µε τον αλγόριθµο SPADE) 2. Συνδυάζοντας τις συχνές ακολουθίες, καταγραφή πιθανών κανόνων και εύρεση αυτών που ικανοποιούν το minimum confidence 21 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Εξαρτήσεις Τάσεων Εξάρτηση τάσης (trend dependency): κανόνας συσχέτισης X Y µεταξύ δύο χρονικών καταστάσεων I 1, I 2, µιας βάσης δεδοµένων, όπου X και Y είναι πρότυπα της µορφής (χαρακτηριστικό, τελεστής) Παράδειγµα: Στην πορεία του χρόνου, ο µισθός ενός υπαλλήλου ακολουθεί αυξητική τάση (SSN,=) (Salary, ) Support: το ποσοστό των πλειάδων του I 1 x I 2 που ικανοποιούν και τα δύο πρότυπα, X και Y Confidence: η αναλογία των πλειάδων του I 1 x I 2 που ικανοποιούν και τα δύο πρότυπα, X και Y, προς τις πλειάδες του I 1 x I 2 που ικανοποιούν το πρότυπο X 22 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.11

Παράδειγµα εξάρτησης τάσης (SSN,=) (Salary, ) Given two tuples t 1 I 1 and t 2 Ι 2, if t 1 (SSN) = t 2 (SSN) then t 1 (Salary) t 2 (Salary) Support=4/36; Confidence=4/5 Ι 1 Ι 2 23 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Επεισόδια (απλά) Επεισόδια (episodes): Συσχετίσεις µεταξύ δύο συµβάντων (events) όπου το ένα συνέβη µετά το άλλο µέσα σε ένα χρονικό παράθυρο (timeframe) µε συγκεκριµένη συχνότητα το συµβάν που προηγείται καλείται αίτιο (cause) και το συµβάν που έπεται καλείται αποτέλεσµα (effect) Χρονικό παράθυρο 1 ο συµβάν (Αίτιο) [3, 6] day 2 ο συµβάν (Αποτέλεσµα) A B ( f = 75% ) Συχνότητα Στο 75% των περιπτώσεων που συνέβη το A, ακολούθησε το B µέσα σε χρονικό διάστηµα 3 έως 6 ηµερών 24 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.12

Σύνθετα επεισόδια Σύνθετο επεισόδιο: αλυσίδα απλών επεισοδίων αναπαράσταση ως γράφος Παράδειγµα σύνθετου επεισοδίου (αλυσίδα απλών) [3, 6] day [0, 5] day [0, 1] week A B C D ( f = 75% ) κεφαλή της αλυσίδας Σχετική συχνότητα ως προς το συµβάν της κεφαλής Στο 75% των περιπτώσεων που συνέβη το A, ακολούθησε το B µέσα σε διάστηµα 3 έως 6 ηµερών, ακολουθούµενο από το C µέσα σε διάστηµα 5 ηµερών, ακολουθούµενο από το D µέσα σε διάστηµα 1 εβδοµάδας,... 25 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Εφαρµογές Χρονικά εξελισσόµενα δεδοµένα: π.χ. ανάλυση χρηµατιστηριακών δεδοµένων παρακολούθηση των µεταπτώσεων της αξίας των µετοχών ως συµβάντα στην πορεία του χρόνου Χωρο-χρονικά δεδοµένα: π.χ. ανάλυση σεισµικής δραστηριότητας πέρα από τη χρονική διάσταση (χρόνος εµφάνισης φαινοµένου), είναι κρίσιµη καιηχωρικήδιάσταση(επίκεντρο) εδοµένα συµβολοσειρών: π.χ. ακολουθίες DNA µια ακολουθία DNA µπορεί να θεωρηθεί ως ακολουθία καλαθιών συµβόλων 26 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης 8.13