Εξόρυξη Γνώσης - το εργαλείο WEKA



Σχετικά έγγραφα
Ανακάλυψη Γνώσης από εδοµένα και Εξόρυξη Γνώσης στο εργαλείο WEKA

Εξόρυξη Γνώσης από Δεδομένα

ΕΛΤΙΟ Ε ΟΜΕΝΩΝ ΑΣΦΑΛΕΙΑΣ

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Αποθήκες και Εξόρυξη Δεδομένων

Ταξινόμηση. Εισαγωγή. Ορισμός. Ορισμός. Τεχνικές Ταξινόμησης. Εισαγωγή

Αναλυτικό Πρόγραµµα Σπουδών του Μαθήµατος. Α Τάξη 1 ου Κύκλου Τ.Ε.Ε. 2 ώρες /εβδοµάδα. Αθήνα, Απρίλιος 2001


Ενότητα6. Μέθοδοι Κοστολόγησης. MBA Master in Business Administration Τµήµα: Οικονοµικών Επιστηµών. ιδάσκων: ρ. Γεώργιος ρογαλάς

4 Περίοδοι µε 3ωρα ιαγωνίσµατα ΕΚΤΟΣ ωραρίου διδασκαλίας!!! ΠΡΟΓΡΑΜΜΑ ΙΑΓΩΝΙΣΜΩΝ

«Αναδιάρθρωση της καλλιέργειας του καπνού µε άλλες ανταγωνιστικές καλλιέργειες»

ΓΥΝΑΙΚΕΙΟΙ ΑΓΡΟΤΟΥΡΙΣΤΙΚΟΙ ΣΥΝΕΤΑΙΡΙΣΜΟΙ ΣΤΗΝ ΕΛΛΑ Α

ΤΟ ΝΕΡΟ ΜΕΣΑ ΑΠΟ ΤΙΣ ΠΗΓΕΣ-ΚΡΗΝΕΣ ΤΟΥ ΗΜΟΥ ΤΟΠΕΙΡΟΥ

ΑΠΑΝΤΗΣΕΙΣ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ 2014

«Αναδιάρθρωση της καλλιέργειας του καπνού µε άλλες ανταγωνιστικές καλλιέργειες»

ΙΑ ΙΚΑΣΙΑ Σ ΕΠ ΠΟΛΙΤΙΚΗ ΠΡΟΜΗΘΕΙΩΝ ( Π.3.4.1) 1. ΣΚΟΠΟΣ

Σηµειώσεις στο ταξινοµούµε


ΕΡΕΥΝΑ ΚΑΤΑΝΑΛΩΤΗ ΑΡΩΜΑΤΙΚΩΝ & ΦΑΡΜΑΚΕΥΤΙΚΩΝ ΒΙΟΚΑΥΣΙΜΩΝ

: Aύξηση φόρου εισοδήµατος, και µείωση µισθών

Θεματική Ενότητα: ΠΑΙΔΕΙΑ ΠΟΛΙΤΙΣΜΟΣ - ΑΘΛΗΤΙΣΜΟΣ

ΙΕΘΝΗΣ ΣΥΜΒΑΣΗ ΕΡΓΑΣΙΑΣ 183 «για την αναθεώρηση της (αναθεωρηµένης) σύµβασης για την προστασία της µητρότητας,»

Εικονική Αναπαράσταση Νοηµατικής Γλώσσας στο ιαδίκτυο

ΕΝΗΜΕΡΩΣΗ ΓΙΑ ΤΗΝ ΨΩΡΙΑΣΗ ΣΤΟΥΣ ΗΜΟΥΣ ΝΑΥΠΛΙΕΩΝ ΚΑΙ ΠΕΙΡΑΙΑ 0.2%-4.8% του γενικού πληθυσµού προσβάλλεται από τη νόσο της Ψωρίασης

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΝΑΥΠΗΓΩΝ ΜΗΧ/ΓΩΝ ΜΗΧΑΝΙΚΩΝ. ΘΕΜΑ: Προστασία µε επιµεταλλώσεις. Σκαβάρας Παναγιώτης

ΠΕΡΙΛΗΨΕΙΣ ΕΡΓΑΣΙΩΝ 4 Ο ΦΟΙΤΗΤΙΚΟ ΣΥΝΕΔΡΙΟ ΕΕΕE ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ: ΕΥΚΑΙΡΙΕΣ ΚΑΙ ΠΡΟΚΛΗΣΕΙΣ ΜΕΣΑ ΣΤΗΝ ΚΡΙΣΗ ΔΙΟΡΓΑΝΩΣΗ

«Παιχνίδι» Εικονικών Επιχειρήσεων: Εγχειρίδιο Χρήσης για τον Μαθητή

ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ

Α. ΠΕΡΙΓΡΑΦΗ ΜΙΚΡΟΣΚΟΠΙΟΥ Ένα απλό σχολικό µικροσκόπιο αποτελείται από τρία βασικά συστήµατα, το οπτικό, το µηχανικό και το φωτιστικό.

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΚΑΚΟΠΟΙΗΜΕΝΟΙ ΑΝΗΛΙΚΟΙ: ΠΡΟΣΤΑΣΙΑ, ΦΟΡΕΙΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΥΡΩΠΑΪΚΗΣ ΕΝΩΣΗΣ»

ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ ΚΑΙ ΤΡΑΠΕΖΙΚΟ ΣΥΣΤΗΜΑ

/νση: ΧΑΡΑΚΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ Μ. Αλεξάνδρου 49, 66100, ράµα Τηλ&φαξ: , κιν.: info@akademia.

Μαρία-Στεφανία-Γιάννης 1 ο Πρότυπο Πειραματικό Δημοτικό Σχολείο Θεσσαλονίκης Ε2 Π.Τ.Δ.Ε.-Α.Π.Θ

ΙΑΧΕΙΡΙΣΗ ΙΣΤΟΤΟΠΟΥ (Οδηγίες χρήσης και λειτουργιών) Έκδοση /10/2008

ΘΕΜΑ: Διευκρινίσεις και οδηγίες για την επιστροφή ΦΠΑ σύμφωνα με την ΑΥΟ ΠΟΛ.1003/

Θέσεις της Α..Ε..Υ. «Νοµοσχέδιο για την Ηλεκτρονική ιακυβέρνηση»

Κεφάλαιο Πέμπτο Εθνοπολιτισμική Ζωή και Εμπειρίες Ελληνικότητας των Ελληνοαυστραλών Εφήβων

ΣΥΜΠΛΗΡΩΜΑ ΤΟΥ ΕΝΗΜΕΡΩΤΙΚΟΥ ΔΕΛΤΙΟΥ

Λευκωσία 23/10/2013. Αρχηγούς Κοµµάτων

ΠΕΤΕΠ ΠΡΟΣΩΡΙΝΕΣ ΕΘΝΙΚΕΣ ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ Υ.ΠΕ.ΧΩ..Ε.

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ ΟΙΚΟΝΟΜΙΑΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΕΙΣΑΓΩΓΗ. 1.1 Εισαγωγή

2. Τις διατάξεις της παρ. 2 του άρθρου 155 του Ν. 3463/2006 (ΦΕΚ Α' 114).

ΣΥΣΤΗΜΑ ΔΙΑΓΝΩΣΗΣ ΑΝΑΓΚΩΝ ΑΓΟΡΑΣ ΕΡΓΑΣΙΑΣ ΔΙΑΓΝΩΣΗ ΑΝΑΓΚΩΝ ΣΕ ΠΕΡΙΦΕΡΕΙΑΚΟ ΕΠΙΠΕΔΟ

Συµπεράσµατα από την ανάλυση συχνοτήτων στη Γεωµετρία Α Λυκείου. Για το 1 ο θέµα που αφορά τη θεωρία:

Βασικά σημεία διάλεξης

ΤΕΛΙΚΗ ΕΚΘΕΣΗ Τεύχος 9: Θεµατική Χαρτογράφηση

ΕΙΣΑΓΩΓΗ ΣΤΗ ΧΡΗΣΗ ΤΟΥ ΣΤΑΤΙΣΤΙΚΟΥ ΠΑΚΕΤΟΥ MINITAB 12.0

Μετάφραση των πρωτότυπων οδηγιών χρήσης. Εγγύηση 2 ετών W 670 GR

Εργαστηριακό Μάθημα 1

ΚΕΦΑΛΑΙΟ 8 ΣΥΜΠΕΡΑΣΜΑΤΑ

ΑΣΚΗΣΗ ΕΦΑΡΜΟΓΗ ΖΗΤΗΣΗΣ ΚΑΙ ΠΡΟΣΦΟΡΑΣ (ΦΟΡΟΛΟΓΙΑ ΚΑΙ ΚΟΙΝΩΝΙΚΟ ΚΟΣΤΟΣ)

14.00 µ.µ µ.µ. ένα (1) άτοµα (προετοιµασία παρασκευή) π.µ π.µ. δύο (2) άτοµα (προετοιµασία παρασκευή)

ΠΕΡΙΕΧΟΜΕΝΑ Α. ΕΝΑΡΞΗ ΕΡΓΩΝ

Ειδικότητα: Ύφασµα Ένδυση

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΓΕΩΓΡΑΦΙΑΣ

ΔΙΑΧΕΙΡΙΣΤΙΚΗ ΒΙ.ΠΑ. ΚΑΣΤΟΡΙΑΣ ΑΝΩΝΥΜΗ ΕΤΑΙΡΕΙΑ. Βάσει των Διεθνών Προτύπων Χρηματοοικονομικής Αναφοράς

ΑΝΑΚΟΙΝΩΣΗ ΣΟΧ 3/2015 για τη σύναψη ΣΥΜΒΑΣΗΣ ΕΡΓΑΣΙΑΣ ΟΡΙΣΜΕΝΟΥ ΧΡΟΝΟΥ. Η Κοινωφελής ηµοτική Επιχείρηση ήµου Αµπελοκήπων-Μενεµένης

Εξορθολογισμός Πειθαρχικού Δικαίου, Κινητικότητα & Επαναφορά Προσωπικού

ΣΥΛΛΟΓΙΚΗ ΣΥΜΒΑΣΗ ΕΡΓΑΣΙΑΣ. «Για τους όρους αµοιβής και εργασίας των καθηγητών ιδιωτικών τεχνικών και επαγγελµατικών εκπαιδευτηρίων όλης της χώρας»

Απομόνωση χλωροφύλλης

Εργαστήριο Δημογραφικών και Κοινωνικών Αναλύσεων, Πεδίον Άρεως, Βόλος, 38334,

ΕΣΩΤΕΡΙΚΟΙ ΚΑΝΟΝΙΣΜΟΙ ΙΟΙΚΗΤΙΚΗ ΙΑΡΘΡΩΣΗ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕ ΘΕΜΑ : «ΑΜΦΙΣΒΗΤΗΣΕΙΣ ΟΡΙΩΝ ΓΕΩΤΕΜΑΧΙΩΝ ΔΙΑΔΙΚΑΣΙΑ ΕΠΙΛΥΣΗΣ ΜΕΣΩ ΔΙΚΑΣΤΙΚΩΝ ΠΡΑΓΜΑΤΟΓΝΩΜΟΣΥΝΩΝ.»

Αντωνία Αθανασοπούλου

ΡΑΣΗ «ΗΜΙΟΥΡΓΙΑ ΚΑΙΝΟΤΟΜΙΚΩΝ ΣΥΣΤΑ ΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ - ΕΝΑ ΕΛΛΗΝΙΚΟ ΠΡΟΙΟΝ, ΜΙΑ ΑΓΟΡΑ: Ο ΠΛΑΝΗΤΗΣ» ΠΙΛΟΤΙΚΗ ΦΑΣΗ ΛΕΙΤΟΥΡΓΙΑΣ

ΤΙΜΟΛΟΓΙΟ ΜΕΛΕΤΗΣ Τιµαριθµική 2012Γ

Ταχ. /νση: Ερµού ΠΡΟΣ: Ως Πίνακας Αποδεκτών Ταχ. Κώδικας: Αθήνα Τηλέφωνο:

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΑΣ, ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑΣ ΚΑΙ ΝΑΥΤΙΛΙΑΣ

Πρόγραµµα Μεταπτυχιακών Σπουδών στη ιοίκηση Επιχειρήσεων. Μάθηµα: Λογιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ FREDERICK

Δρ.ΠΟΛΥΚΑΡΠΟΣ ΕΥΡΙΠΙΔΟΥ

(Πράξη κατάθεσης Υπουργείου Απασχόλησης και Κοινωνικής Προστασίας:ΠΚ 69/ )

ενεργοί πολίτες για τη Μήλο οι θέσεις μας Υποψηφιότητα Αντώνη Καβαλιέρου δημοτικές εκλογές

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

1. Τα Ιατρικά Έξοδα που µπορεί να καταβάλει η Επιτροπή Ασθενειών που προκαλούνται από Πνευµονοκονίαση:

Α.Τ.Ε.Ι. ΚΑΛΑΜΑΤΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ ΚΑΙ ΕΛΕΓΚΤΙΚΗΣ

Η ΦΙΛΙΑ..!!! Η ΑΞΙΑ ΤΗΣ ΦΙΛΙΑΣ

Καθορισµός και διαχείριση διδακτέας ύλης των θετικών µαθηµάτων της Α Ηµερησίου Γενικού Λυκείου για το σχολικό έτος

ΠΑΡΑΡΤΗΜΑ ΙΙ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΤΥΠΟΥ Α. Επωνυμία του πιστωτικού ιδρύματος για το οποίο συμπληρώνεται το παρόν ερωτηματολόγιο...

Παρασκευή 7 Μάιου 2004

ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΟ ΕΤΟΣ 2015 ΠΕΡΙΦΕΡΕΙΑ ΙΟΝΙΩΝ ΗΜΟΣ ΚΕΦΑΛΛΟΝΙΑΣ ΑΡΘ ΜΕΛΕΤΗΣ : 62 / ΜΕΛΕΤΗ

Μετακίνηση σε Κελιά-Γραµµές-Στήλες Πίνακας 1: Μετακίνηση µέσα σε Φύλλο Excel. Tab Μετακίνηση στο επόµενο κελί 1 προς τα δεξιά.

ΤΙΜΟΛΟΓΙΟ Η/Μ ΕΡΓΑΣΙΩΝ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Τα γνωστικά επίπεδα των επαγγελματιών υγείας Στην ανοσοποίηση κατά του ιού της γρίπης Σε δομές του νομού Λάρισας

VBA ΣΤΟ WORD. 1. Συχνά, όταν ήθελα να δώσω ένα φυλλάδιο εργασίας με ασκήσεις στους μαθητές έκανα το εξής: Version ΗΜΙΤΕΛΗΣ!!!!

Πλατφόρμα «Αίσωπος» Εγχειρίδιο Χρήσης Πλατφόρμας. Πλατφόρμα Ανάπτυξης / Σχεδίασης Ψηφιακών Διδακτικών Σεναρίων. Έκδοση 1.2 Αθήνα, Ιούνιος 2015

ΣΥΝΟΨΗ ΑΠΟΦΑΣΕΩΝ ΤΗΣ 32 ης ΣΥΝΕΔΡΙΑΣ ΤΗΣ ΣΥΓΚΛΗΤΟΥ ΤΟΥ ΤΕΧΝΟΛΟΓΙΚΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΥΠΡΟΥ ΠΟΥ ΠΡΑΓΜΑΤΟΠΟΙΗΘΗΚΕ ΤΗΝ ΤΕΤΑΡΤΗ 07 ΜΑΙΟΥ 2014 ΜΕΡΟΣ Α

Αναλυτικό Πρόγραµµα Σπουδών του Μαθήµατος. Α Τάξη 1 ου Κύκλου Τ.Ε.Ε. 3 ώρες /εβδοµάδα. Αθήνα, Απρίλιος 2001

ΙΙ, 3-4. Α. Ερωτήσεις ανοικτού τύπου ή ελεύθερης ανάπτυξης

«ΑΝΩ ΛΙΟΣΙΑ: ΤΟΠΙΚΗ ΙΣΤΟΡΙΑ, ΠΕΡΙΒΑΛΛΟΝ, ΠΡΟΚΛΗΣΕΙΣ, ΠΡΟΟΠΤΙΚΕΣ»

Η εξέλιξη της επιστηµονικής σκέψης και του πειραµατισµού στην Ελληνιστική

ΑΞΟΝΑΣ 4 ΤΟΠΙΚΟ ΠΡΟΓΡΑΜΜΑ ΠΡΟΣΕΓΓΙΣΗΣ LEADER ΤΗΣ ΟΤΔ «ΑΝΑΠΤΥΞΙΑΚΗ ΦΛΩΡΙΝΑΣ ΑΝΩΝΥΜΗ ΕΤΑΙΡΙΑ Αναπτυξιακή Ανώνυμη Εταιρεία Ο.Τ.Α.»

ΕΝΟΤΗΤΑ 5 ΠΡΟΣΘΕΣΗ ΚΑΙ ΑΦΑΙΡΕΣΗ ΑΡΙΘΜΩΝ ΜΕΧΡΙ ΤΟ 10

ΑΞΟΝΑΣ 4 ΤΟΠΙΚΟ ΠΡΟΓΡΑΜΜΑ ΠΡΟΣΕΓΓΙΣΗΣ LEADER ΤΗΣ ΑΝ.ΟΛ Α.Ε «ΑΝΑΠΤΥΞΙΑΚΗ ΟΛΥΜΠΙΑΣ Α.Α.Ε Ο.Τ.Α»

Επιµορφωτικό Πρόγραµµα Ο.ΜΕ Ιανουαρίου 2006 Ν Α Υ Π Λ Ι Ο «Η ΕΞΕΛΙΞΗ ΣΤΙΣ ΕΥΡΩΠΑΪΚΕΣ ΕΡΓΑΣΙΑΚΕΣ ΣΧΕΣΕΙΣ - Ο ΡΟΛΟΣ ΤΟΥ ΚΟΙΝΩΝΙΚΟΥ ΙΑΛΟΓΟΥ»

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Εργασία στο μάθημα: Διδακτική των Μαθηματικών

ΘΕΜΑ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: «Σύγχρονες τάσεις διεθνοποίησης της ποινικής καταστολής και προστασία των ανθρωπίνων δικαιωμάτων: Η περίπτωση Guadanamo»

Transcript:

Εξόρυξη Γνώσης - το εργαλείο WEKA Οµάδα ιαχείρισης εδοµένων, Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιώς (http:// http://isl.cs.unipi.gr/) Κοτσιφάκος Ευάγγελος ek@unipi.gr Νοέµβριος 2008

Ανακάλυψη και Εξόρυξη Γνώσης Η ανακάλυψη γνώσης από δεδοµένα (Knowledge Discovery in Data KDD) είναι η µη τετριµµένη διαδικασία εύρεσης έγκυρων, πρωτότυπων, πιθανώς χρήσιµων και οπωσδήποτε κατανοητών προτύπων (patterns) µέσα στα δεδοµένα Η εξόρυξη γνώσης από δεδοµένα (Data Mining) είναι η χρήση αλγορίθµων για την εξαγωγή των πληροφοριών και προτύπων που παράγονται µε τη διαδικασία KDD

ιαδικασία Εξόρυξης Γνώσης

Εργασίες εξόρυξης γνώσης Κανόνες Συσχέτισης Κατηγοριοποίηση / Πρόβλεψη έντρα απόφασης, νευρωνικά δίκτυα,, Bayesian κατηγοριοποίηση Συσταδοποίηση Ιεραρχικοί, διαµεραστικοί, µε βάση την πυκνότητα Yes NO Refund TaxInc No Single, Divorced MarSt < 80K > 80K Married NO NO YES

Κανόνες Συσχέτισης (Association rules) Ορισµός: X Y όπου X,Y I και X Y = ø Το X ονοµάζεται LHS (left-hand side) ή antecedent (προηγούµενο) ή head (κεφαλή) του κανόνα Το Y ονοµάζεται RHS (right-hand hand side) ή consequent (επακόλουθο) ή body (σώµα) του κανόνα Υποστήριξη (support) του AR (s)( X Y: το ποσοστό των δοσοληψιών που περιέχουν το X Y ή αλλιώς η πιθανότητα P(X Y) Εµπιστοσύνη (confidence) του AR (α)( X Y: η αναλογία του πλήθους των δοσοληψιών που περιέχουν το X Y ως προς το πλήθος των δοσοληψιών που περιέχουν το X. ή αλλιώς, η εξαρτηµένη πιθανότητα P(X Y Χ) = P(X Y) Y)/P(X)

Κατηγοριοποίηση (Classification) Ορισµός: Εκµάθηση µιας τεχνικής να προβλέπει την κλάση ενός στοιχείου επιλέγοντας από προκαθορισµένες τιµές Εποπτευόµενη µάθηση Επόπτευση: Τα δεδοµένα εκπαίδευσης συνοδεύονται από ετικέτες για την κλάση µε την οποία ανήκει το καθένα Τα νέα δεδοµένα κατηγοριοποιούνται µε βάση τη γνώση που µας παρέχουν τα δεδοµένα εκπαίδευσης

Συσταδοποίηση (Clustering) Ορισµός: Η εύρεση συστάδων για τις οποίες για κάθε εγγραφή που περιλαµβάνουν, η οµοιότητα µεταξύ αυτής και οποιασδήποτε εγγραφής από την ίδια συστάδα να είναι µεγαλύτερη από την οµοιότητα µεταξύ αυτής και οποιασδήποτε εγγραφής από άλλες συστάδες Μη εποπτευόµενη µάθηση ε γνωρίζουµε τις κλάση στην οποία ανήκουν τα δεδοµένα εκπαίδευσης Μας δίνεται ένα σύνολο µετρήσεων, παρατηρήσεων κλπ. µε στόχο να ανακαλύψουµε κλάσεις ή οµάδες µέσα στα δεδοµένα

WEKA data mining tool Applications Tools Visualization http://www.cs.waikato.ac.nz/ml/weka/ Version 3-5-63

WEKA applications Applications: : the main applications within WEKA. Explorer.. An environment for exploring data with WEKA (the rest of this documentation deals with this application in more detail). Experimenter.. An environment for performing experiments and conducting statistical tests between learning schemes. KnowledgeFlow.. This environment supports essentially the same functions as the Explorer but with a drag-and and-drop drop interface. One advantage is that it supports incremental learning. SimpleCLI.. Provides a simple command-line interface that allows direct execution of WEKA commands for operating systems that do not provide their own command line interface.

WEKA tools Tools: Other useful applications. ArffViewer: : An application for viewing ARFF files in spreadsheet format. SqlViewer: : represents an SQL worksheet, for querying databases via JDBC. EnsembleLibrary: : An interface for generating setups for Ensemble Selection (a contribution by Robert Jung and David Michael from Cornell University, Ithaca, NY, USA).

WEKA visualization Visualization Ways of visualizing data with WEKA Plot For plotting a 2D plot of a dataset. ROC Displays a previously saved ROC curve. TreeVisualizer For displaying directed graphs, e.g., a decision tree. GraphVisualizer Visualizes XML BIF or DOT format graphs, e.g., for Bayesian networks. BoundaryVisualizer Allows the visualization of classifier decision boundaries in two dimensions.

WEKA explorer 1. Preprocess.. Choose and modify the data being acted on. 2. Classify.. Train and test learning schemes that classify or perform regression. 3. Cluster.. Learn clusters for the data. 4. Associate.. Learn association rules for the data. 5. Select attributes.. Select the most relevant attributes in the data. 6. Visualize.. View an interactive 2D plot of the data.

WEKA explorer βασική οθόνη

WEKA explorer βασική οθόνη Open file... Brings up a dialog box allowing you to browse for the data file on the local file system. Open URL... Asks for a Uniform Resource Locator address for where the data is stored. Open DB... Reads data from a database. Generate... Enables you to generate artificial data from a variety of DataGenerators.

WEKA - preprocess Data Preprocess Input: Arff data format files CSV data format files Filters Nominal to string String to Nominal string to nominal Data Cleaner addcluster

WEKA - κατηγοριοποίηση

WEKA συσταδοποίηση

WEKA κανόνες συσχέτισης

WEKA file formats

WEKA arff file @relation weather.symbolic @attribute outlook {sunny, overcast, rainy} @attribute temperature {hot, mild, cool} @attribute humidity {high, normal} @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data sunny,hot,high,false,no sunny,hot,high,true,no overcast,hot,high,false,yes rainy,mild,high,false,yes.

WEKA - αλγόριθµοι Το WEKA υποστηρίζει ένα µεγάλο πλήθος αλγορίθµων για τις 3 κατηγορίες (συσχέτιση, κατηγοριοποίηση και συσταδοποίηση) µε πολλές παραµέτρους Μπορεί να υλοποιηθούν νέοι αλγόριθµοι και να ενσωµατωθούν εύκολα στο σύστηµα Μπορεί να γίνει µαζική επεξεργασία αρχείων µέσω της γραµµής εντολών.

WEKA - demo Άνοιγµα αρχείου µε EXCEL text editor Άνοιγµα αρχείου µε WEKA και µε CSV editor του WEKA. Επιλογή attributes από αρχική οθόνη Επεξήγηση βασικών στοιχείων αρχικής οθόνης Επιλογή φίλτρων (απλή αναφορά) και αλλαγή παραµέτρων τους

WEKA - demo Επιλογή Tabs για clusters, associations και classification Επιλογή αλγορίθµου (από τη λίστα) και έλεγχος παραµέτρων (αναφορικά µόνο) Τρόπος εκτέλεσης και έξοδος αποτελεσµάτων στο δεξί µέρος. Error log Εκτέλεση Κανόνων συσχέτισης µερικές φορές µε διαφορετικές παραµέτρους και attributes Capture output (από( δεξί µέρος της οθόνης)

WEKA - demo Επιλογή αλγορίθµου k-means (πχ) για clustering. Εκτέλεση αλγορίθµου output Εφαρµογή φίλτρου AddCluster στα δεδοµένα (από την αρχική οθόνη) Εξαγωγή αποτελεσµάτων από editor του WEKA