Ειδικά Θζματα Βάςεων Δεδομζνων

Σχετικά έγγραφα
Βάςεισ Δεδομζνων Ι. Ενότητα 12: Κανονικοποίηςη. Δρ. Τςιμπίρθσ Αλκιβιάδθσ Τμιμα Μθχανικών Πλθροφορικισ ΤΕ

Ειδικά Θζματα Βάςεων Δεδομζνων

Βάςεισ Δεδομζνων Ι. Ενότητα 4: Μετατροπή ςχήματοσ Ο/Σ ςε ςχεςιακό. Δρ. Τςιμπίρθσ Αλκιβιάδθσ Τμιμα Μθχανικϊν Ρλθροφορικισ ΤΕ

Βάςεισ Δεδομζνων Ι. Ενότθτα 10: Συνακροιςτικζσ ςυναρτιςεισ. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικών Πλθροφορικισ ΣΕ

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΔΙΕΘΝΕΙΣ ΟΙΚΟΝΟΜΙΚΕΣ ΣΧΕΣΕΙΣ

Γενικά Μαθηματικά ΙΙ

Ειδικζσ Ναυπηγικζσ Καταςκευζσ και Ιςτιοφόρα κάφη (Ε)

Γενικά Μαθηματικά ΙΙ Αςκήςεισ 11 ησ Ενότητασ

Βάςεισ Δεδομζνων Ι. Ενότητα 7: Ειςαγωγή ςτην γλώςςα_sql. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικϊν Πλθροφορικισ ΣΕ

ΑΝΟΙΧΣΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΣΑ ΔΙΕΘΝΕΙΣ ΟΙΚΟΝΟΜΙΚΕΣ ΣΧΕΣΕΙΣ

ΑΝΟΙΧΣΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΣΑ ΔΙΕΘΝΕΙΣ ΟΙΚΟΝΟΜΙΚΕΣ ΣΧΕΣΕΙΣ

Βάςεισ Δεδομζνων Ι. Ενότθτα 11: SQL-Ερωτιματα Ομαδοποίθςθσ με υνζνωςθ Πινάκων. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικϊν Πλθροφορικισ ΣΕ

Καταςκευζσ Οπλιςμζνου Σκυροδζματοσ Ι

Καταςκευζσ Οπλιςμζνου Σκυροδζματοσ Ι

ΘΕΜΑΣΑ ΕΞΕΣΑΕΩΝ

Βάςεισ Δεδομζνων Λ. Ενότθτα 8: SQL Γλώςςα χειριςμοφ δεδομζνων. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικών Πλθροφορικισ ΣΕ

Γενικά Μαθηματικά ΙΙ

EMUNI A.U.Th. SUMMER SCHOOL

Ειςαγωγή ςτη διδακτική των γλωςςών

Ειδικά Θζματα Βάςεων Δεδομζνων

Τεχνικό Σχζδιο - CAD

Αποτυπώςεισ & Τεκμηρίωςη Αντικειμζνων

Aντιπτζριςη (ΕΠ027) Ενότητα 10

Αναπαράςταςθ Γνώςθσ ςτον Παγκόςμιο Ιςτό Ενότθτα 2: XML Δομθμζνα Ζγγραφα Ιςτοφ, Μζροσ 4 ο XPath

Οντοκεντρικόσ Προγραμματιςμόσ

Βάςεισ Δεδομζνων Ι. Ενότθτα 9: SQL-φηευξθ πινάκων. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικών Πλθροφορικισ ΣΕ

Ειδικά Θζματα Βάςεων Δεδομζνων

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΑΙΔΑΓΩΓΙΚΗΣ ΓΥΜΝΑΣΤΙΚΗΣ ΙΙ

Κοινωνική Δημογραφία

Aντιπτζριςη (ΕΠ027) Ενότητα 5

Γενικά Μαθηματικά ΙΙ

Βάςεισ Δεδομζνων Ι. Ενότητα 1: υςτήματα Βάςεων Δεδομζνων. Δρ. Τςιμπίρθσ Αλκιβιάδθσ Τμιμα Μθχανικϊν Πλθροφορικισ ΤΕ

Διαγλωςςική Επικοινωνία

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΑΙΔΑΓΩΓΙΚΗΣ ΓΥΜΝΑΣΤΙΚΗΣ ΙΙ

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΑΙΔΑΓΩΓΙΚΗΣ ΓΥΜΝΑΣΤΙΚΗΣ ΙΙ

Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων

Οντοκεντρικόσ Προγραμματιςμόσ

Αγροτική - Κοινοτική Ανάπτυξη

ΘΕΡΜΟΔΤΝΑΜΙΚΗ Ι. Ενότθτα 1: Βαςικά χαρακτθριςτικά τθσ Θερμοδυναμικισ. ογομϊν Μπογοςιάν Πολυτεχνικι χολι Σμιμα Χθμικϊν Μθχανικϊν

Ειδικά Θζματα Βάςεων Δεδομζνων

Παράγοντεσ υμμετοχήσ Ενηλίκων ςτην Εκπαίδευςη: Ζητήματα Κινητοποίηςησ και Πρόςβαςησ ςε Οργανωμζνεσ Εκπαιδευτικζσ Δραςτηριότητεσ

Τεχνολογία Περιβάλλοντοσ: Διαχείριςθ Υγρών Αποβλιτων Ενότθτα 9: Απολφμανςθ. Κορνάροσ Μιχαιλ Πολυτεχνικι Σχολι Τμιμα Χθμικών Μθχανικών

Πειραματικι Ψυχολογία (ΨΧ66)

Ενότθτα: Ανατομία Μεςοκωρακίου

Aντιπτζριςη (ΕΠ027) Ενότητα 6

Κλαςικι Ηλεκτροδυναμικι

Παράγοντεσ υμμετοχήσ Ενηλίκων ςτην Εκπαίδευςη: Ζητήματα Κινητοποίηςησ και Πρόςβαςησ ςε Οργανωμζνεσ Εκπαιδευτικζσ Δραςτηριότητεσ

Επιχειρηςιακή Έρευνα και εφαρμογζσ με την χρήςη του λογιςμικοφ R

Aντιπτζριςη (ΕΠ027) Ενότητα 9

Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων

Οντοκεντρικόσ Ρρογραμματιςμόσ

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΑΙΔΑΓΩΓΙΚΗΣ ΓΥΜΝΑΣΤΙΚΗΣ ΙΙ

Αγροτικι - Κοινοτικι Ανάπτυξθ

Εκκλθςιαςτικό Δίκαιο ΙΙΙ (Μεταπτυχιακό)

Aντιπτζριςθ (ΕΠ027) Ενότθτα 12

Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΑΙΔΑΓΩΓΙΚΗΣ ΓΥΜΝΑΣΤΙΚΗΣ ΙΙ

Βάςεισ Δεδομζνων Ι. Ενότθτα 3: Μετατροπι ςχιματοσ Ο/ ςε ςχεςιακό. Δρ. Τςιμπίρθσ Αλκιβιάδθσ Τμιμα Μθχανικϊν Ρλθροφορικισ ΤΕ

Βάςεισ Δεδομζνων Ι. Ενότθτα 2: χεδιαςμόσ Βάςθσ Δεδομζνων. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικϊν Πλθροφορικισ ΣΕ

ΔΙΔΑΚΣΙΚΗ ΣΗ ΠΑΙΔΑΓΩΓΙΚΗ ΓΤΜΝΑΣΙΚΗ ΙΙ

Ψθφιακά Ηλεκτρονικά. Ενότθτα 5 : Ανάλυςθ κυκλώματοσ με D και JK FLIP- FLOP Φώτιοσ Βαρτηιώτθσ

Αγροτικι - Κοινοτικι Ανάπτυξθ

Ειδικά Θζματα Βάςεων Δεδομζνων

Επιχειρηςιακή Ζρευνα και εφαρμογζσ με την χρήςη του λογιςμικοφ R

Διεπαφζσ Φορητών Συςκευών

Ειςαγωγή ςτη διδακτική των γλωςςών

Ειςαγωγή ςτη διδακτική των γλωςςών

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΔΙΕΘΝΕΙΣ ΟΙΚΟΝΟΜΙΚΕΣ ΣΧΕΣΕΙΣ

Ερωτήσεις επανάληψης. Ενδοκρινείς αδένες. Τμήμα Ιαηρικής Πανεπιζηήμιο Παηρών

Ειςαγωγι ςτισ Μεταφραςτικζσ Σπουδζσ

ΠΟΤΔΗ ΣΗ ΤΝΟΠΣΙΚΗ ΠΑΡΑΔΟΗ ΚΑΙ ΣΗΝ Q

Γενικά Μαθηματικά ΙΙ

Ελλθνικι Δθμοκρατία Σεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Ψθφιακά Ηλεκτρονικά. Ενότθτα 9 : Διαδικαςία φνκεςθσ Φϊτιοσ Βαρτηιϊτθσ

ΣΙΣΛΟ ΜΑΘΗΜΑΣΟ: ΠΕΡΙΒΑΛΛΟΝΣΙΚΗ ΗΘΙΚΗ ΧΕΔΙΑΓΡΑΜΜΑ ΜΑΘΗΜΑΣΟ ΟΝΟΜΑ ΚΑΘΗΓΗΣΗ: ΔΗΜΗΣΡΙΟ ΜΑΣΘΟΠΟΤΛΟ ΣΜΗΜΑ: Σμήμα Διαχείριςησ Περιβάλλοντοσ και Φυςικών

Μυκθτολογικζσ αςκζνειεσ δενδρωδϊν και αμπζλου

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΑΙΔΑΓΩΓΙΚΗΣ ΓΥΜΝΑΣΤΙΚΗΣ ΙΙ

ΘΕΡΜΟΔΤΝΑΜΙΚΗ Ι. Ενότθτα 3: Μθδενικόσ Νόμοσ - Ζργο. ογομϊν Μπογοςιάν Πολυτεχνικι χολι Σμιμα Χθμικϊν Μθχανικϊν

Διδακτικι τθσ Γλϊςςασ Ι

Επιχειρηςιακή Ζρευνα και εφαρμογζσ με την χρήςη του λογιςμικοφ R

ΘΕΡΜΟΔΤΝΑΜΙΚΘ IΙ. Ενότθτα 11: Διαλυτότθτα Ιδανικά διαλφματα ογομών Μπογοςιάν Πολυτεχνικι χολι Σμιμα Χθμικών Μθχανικών

ΘΕΡΜΟΔΤΝΑΜΙΚΗ IΙ. Ενότθτα 4: Χθμικζσ αντιδράςεισ αερίων τακερά Χθμικισ Ιςορροπίασ Πρότυπθ Ελεφκερθ Ενζργεια

Θέματα διπλωματικών εργαςιών ςτην ανάλυςη εικόνασ

Μυκθτολογικζσ αςκζνειεσ δενδρωδϊν και αμπζλου

ΘΕΟΛΟΓΙΑ ΚΑΙΝΗΣ ΔΙΑΘΗΚΗΣ

Διαγλωςςική Επικοινωνία

ΘΕΟΛΟΓΙΑ ΚΑΙΝΗΣ ΔΙΑΘΗΚΗΣ

Aντιπτζριςη (ΕΠ027) Ενότητα 2

ΕΤΦΤΗ ΕΛΕΓΧΟ. Κεφάλαιο 3 τοιχεία τησ Αςαφοφσ Λογικήσ

Ειςαγωγή ςτη διδακτική των γλωςςών

ΟΡΤΚΣΟΛΟΓΙΑ ΣΟΜΕΑ ΓΕΩΛΟΓΙΚΩΝ ΕΠΙΣΗΜΩΝ ΣΜΗΜΑ ΜΗΦΑΝΙΚΩΝ ΜΕΣΑΛΛΕΙΩΝ - ΜΕΣΑΛΛΟΤΡΓΩΝ

Επιχειρηςιακή Έρευνα και εφαρμογζσ με την χρήςη του λογιςμικοφ R

Αναπαράςταςθ Γνώςθσ ςτον Παγκόςμιο Ιςτό Ενότθτα 5: Κανόνεσ Λογικι και Συμπεραςμόσ

Ψθφιακι Επεξεργαςία ιματοσ

ΕΙΑΓΩΓΗ ΣΗ ΦΙΛΟΟΦΙΑ ΕΝΟΣΗΣΑ 6. ΕΠΙΧΕΙΡΗΜΑΣΟΛΟΓΙΑ ΚΑΙ ΛΟΓΙΚΗ

ΜΕΣΑΔΟΗ ΘΕΡΜΟΣΗΣΑ. Μιςθρλισ Δθμιτριοσ ΧΟΛΗ ΣΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΣΜΗΜΑ ΜΗΧΑΝΟΛΟΓΙΑ ΣΕ

Γενικά Μαθηματικά ΙΙ

Ελλθνικι Δθμοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Ψθφιακά Ηλεκτρονικά. Ενότθτα 13 : Άλλοι Μετρθτζσ Φϊτιοσ Βαρτηιϊτθσ

Ψθφιακά Ηλεκτρονικά. Ενότθτα 7 : Ελαχιςτοποίθςθ και κωδικοποίθςθ καταςτάςεων Φϊτιοσ Βαρτηιϊτθσ

Δείκτεσ Διαχείριςθ Μνιμθσ. Βαγγζλθσ Οικονόμου Διάλεξθ 8

Οντοκεντρικόσ Ρρογραμματιςμόσ

Transcript:

Ειδικά Θζματα Βάςεων Δεδομζνων Ενότητα 15: Εξόρυξη Δεδομζνων (Data Mining) Δρ. Τςιμπίρθσ Αλκιβιάδθσ Τμιμα Μθχανικϊν Πλθροφορικισ ΤΕ

Άδειεσ Χρήςησ Το παρόν εκπαιδευτικό υλικό υπόκειται ςε άδειεσ χριςθσ Creative Commons. Για εκπαιδευτικό υλικό, όπωσ εικόνεσ, που υπόκειται ςε άλλου τφπου άδειασ χριςθσ, θ άδεια χριςθσ αναφζρεται ρθτϊσ. 2

Χρηματοδότηςη Το παρόν εκπαιδευτικό υλικό ζχει αναπτυχκεί ςτα πλαίςια του εκπαιδευτικοφ ζργου του διδάςκοντα. Το ζργο «Ανοικτά Ακαδθμαϊκά Μακιματα ςτο ΤΕΙ Κεντρικισ Μακεδονίασ» ζχει χρθματοδοτιςει μόνο τθ αναδιαμόρφωςθ του εκπαιδευτικοφ υλικοφ. Το ζργο υλοποιείται ςτο πλαίςιο του Επιχειρθςιακοφ Προγράμματοσ «Εκπαίδευςθ και Δια Βίου Μάκθςθ» και ςυγχρθματοδοτείται από τθν Ευρωπαϊκι Ζνωςθ (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εκνικοφσ πόρουσ. 3

Ενότητα 15 Εξόρυξη Γνϊςησ (Data Mining) Δρ. Τςιμπίρθσ Αλκιβιάδθσ 4

Περιεχόμενα ενότητασ Εξόρυξθ Δεδομζνων (DATA MINING) KDD ΚΑΙ DATA MINING Μζκοδοι DATA MINING Συςταδοποίθςθ (CLUSTERING) Ιεραρχικό, Διαμεριςτικό ΚΑΙ Αςαφζσ CLUSTERING Διαμεριςτικοί Αλγόρικμοι K-means clustering 5

Σκοποί ενότητασ Ο όροσ εξόρυξθ δεδομζνων αναφζρεται ςτθν διαδικαςία ανάλυςθσ μεγάλων βάςεων δεδομζνων για εφρεςθ χριςιμων μοτίβων. Σχετίηεται με τθν ανακάλυψθ τθσ γνϊςθσ ςε βάςεισ δεδομζνων. Στθν ενότθτα αυτι γίνεται μια αναφορά ςε βαςικζσ τεχνικζσ εξόρυξθσ δεδομζνων όπωσ ςυςταδοποίθςθ, κατθγοριοποίθςθ, δζντρα αποφάςεων και κανόνεσ ςυςχζτιςθσ. Παρουςιάηονται ςτον ςπουδαςτι νζα επιςτθμονικά πεδία ερευνθτικισ και επαγγελματικισ δράςθσ και γίνεται επεξιγθςθ αντιπροςωπευτικϊν αλγορίκμων. 6

Ειςαγωγή ςτην KDD Στισ μζρεσ μασ και ςε ζνα πολφ μεγάλο εφροσ πεδίων θ ςυλλογι, καταγραφι και επεξεργαςία δεδομζνων γίνεται με δραματικοφσ ρυκμοφσ. Δθμιουργοφνται ςυνεχϊσ κεωρίεσ και εργαλεα τα οποία βοθκοφν ςτθν ςυλλογι χριςιμων πλθροφοριϊν από τα ολοζνα αυξανόμενα δεδομζνα. Αυτζσ οι κεωρίεσ και τα εργαλεία είναι το αντικείμενο τθσ Ανακάλυψθσ Γνϊςθσ ςε Βάςεισ Δεδομζνων γνωςτι και ωσ KDD (Knowledge Discovery in Databases). H KDD διαδικαςία αςχολείται με τθν δθμιουργία και μελζτθ μεκόδων και τεχνικϊν που εφαρμόηονται ςτα δεδομζνα με ςκοπό τθν εξαγωγι χριςιμων πλθροφοριϊν. 7

Χρήςη των τεχνικϊν KDD Marketing Επενδφςεισ (Investment) Fraud Detection Επικοινωνίεσ και Data Cleaning Ιατρικι 8

KDD - Data Mining Γενικά ο όροσ KDD αναφζρεται ςτθ ςυνολικι διαδικαςία τθν εφρεςθσ γνϊςθσ από ςφνολα δεδομζνων και ο όροσ Data Mining αναφζρεται ςε ζνα μζροσ αυτισ τθσ διαδικαςίασ. Data Mining είναι θ εφαρμογι ςυγκεκριμζνου αλγορίκμου για τθν εξαγωγι μοντζλου από τα δεδομζνα. Επιπλζον βιματα ςτθν KDD διαδικαςία είναι: προετοιμαςία των δεδομζνων, επιλογι δεδομζνων, κακαριςμόσ δεδομζνων (data cleaning), ενςωμάτωςθ κατάλλθλθσ γνϊςθσ και ςωςτι μετάφραςθ και μελζτθ των αποτελεςμάτων 9

KDD - Data Mining 10

Data Mining 11

Data Mining 12

Data Mining 13

Συςταδοποίηςη- κατηγοριοποίηςη Clustering (ςυςταδοποίηςη) To clustering είναι θ εργαςία του μεριςμοφ ενόσ ςυνόλου δεδομζνων ςε ομάδεσ ομοίων ςτοιχείων, clusters. Τα δεδομζνα ομαδοποιούνται ςε ςύνολα με βάςθ κάποιο κριτιριο ομοιότθτασ. Το clustering δεν βαςίηεται ςε προκακοριςμζνεσ κλάςεισ. Classification (κατηγοριοποίηςη) Η διαδικαςία κατθγοριοποίθςθσ των δεδομζνων ςε κάποια από τισ προκακοριςμζνεσ κλάςεισ. Συχνά θ διαδικαςία του classification περιγράφεται ςαν μία ςυνάρτθςθ μάκθςθσ (learning function), θ οποία ταξινομεί (classifies) κάκε αντικείμενο του ςυνόλου δεδομζνων ςε μία από τισ προκακοριςμζνεσ κατθγορίεσ. Η διαδικαςία του classification χαρακτθρίηεται από: Ζνα ςφνολο καλά οριςμζνων κατθγοριϊν, ζνα training set. Στόχοσ: Ο οριςμόσ ενόσ μοντζλου το οποίο μπορεί να κατθγοριοποιεί νζα δεδομζνα από ζνα test set 14

Kανόνεσ ςυςχζτιςησ - εκτίμηςη και πρόβλεψη Εξαγωγή κανόνων ςυςχζτιςησ (association rules extraction) Προςδιοριςμόσ και εξαγωγι των ςυςχετίςεων ι προτφπων τα οποία υπάρχουν ςε μία ςυλλογι αντικειμζνων. Τα πρότυπα μποροφν να εκφραςτοφν με κανόνεσ, των οποίων θ γενικι μορφι είναι If X then Y. Κριτιρια εγκυρότθτασ και ςθμαντικότθτασ κανόνων: support factor, confidence factor Estimation & prediction (εκτίμηςη και πρόβλεψη). Περιλαμβάνει τεχνικζσ εκτίμθςθσ και πρόβλεψθσ μελλοντικϊν τάςεων ι τιμϊν. Ο ςτόχοσ εδϊ είναι να καταςκευάςουμε ζνα μοντζλο που κα επιτρζπει τθν τιμι μιασ μεταβλθτισ να προβλεφκεί από τισ γνωςτζσ τιμζσ άλλων μεταβλθτϊν 15

Παλινδρόμηςη - Συνάθροιςη Regression (παλινδρόμηςη). Αντιςτοιχεί τα αντικείμενα από ζνα ςφνολο δεδομζνων ςτθν τιμι μίασ μεταβλθτισ πρόβλεψθσ Summarization (Συνάθροιςη) Περιλαμβάνει μεκόδουσ για τθν περιγραφι ενόσ υποςυνόλου δεδομζνων. Π.χ. θ εκτίμθςθ τθσ μζςθσ και τθσ τυπικισ απόκλιςθσ για όλα τα πεδία, reports, τεχνικζσ παρουςίαςθσ, τθν παραγωγι ςυνοπτικϊν κανόνων. 16

Clustering 17

X2 Clustering Cluster 1 A Cluster 3 F G D E Cluster 2 S I M I L A R I T Y B C X1 A B C D E F G Σημεία ζε ηρία clusters Δενδοδιάγραμμα ιεραρτίας 18

X2 K-means clustering 1. Επιλογι k κεντροειδϊν cluster τα οποία αποτελοφν και τα μόνα ςτοιχεία των k επελεγμζνων clusters. G F 2. Τοποκζτθςε κάκε ςτοιχείο ςτο πιο κοντινό cluster μετά από υπολογιςμό τθσ απόςταςθσ του ςθμείου από το κεντροειδζσ του cluster. 3. Υπολόγιςε το νζο κεντροειδζσ. C E D B A X1 Εσαιζθηζία ηοσ αλγορίθμοσ k-means ζηην αρτική επιλογή clusters. 4. Αν το κριτιριο τερματιςμοφ δεν ικανοποιείται πιγαινε ςτο βιμα 2. 19