υποδείγματος για την αξιολόγηση αυτοκινήτων με τεχνικές Data Mining.»

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "υποδείγματος για την αξιολόγηση αυτοκινήτων με τεχνικές Data Mining.»"

Transcript

1 ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΙΔΙΚΕΥΣΗΣ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Διπλωματική εργασία με θέμα: «Ανάπτυξη υποδείγματος για την αξιολόγηση αυτοκινήτων με τεχνικές Data Mining.» Χριστοδούλου Κωνσταντίνος ΑΜ:13/07 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Σαμαράς Νικόλαος Θεσσαλονίκη ΟΚΤΩΒΡΙΟΣ 2008

2 Δομή της εργασίας (1/2) ΜΕΡΟΣ Ι Εξόρυξη γνώσης από δεδομένα 1.Data mining Εισαγωγή Δεδομένα που εφαρμόζεται το DM. H διαδικασία KDD. Επισκόπηση των εργασιών εξόρυξης δεδομένων 2.Δέντρα απόφασης Εισαγωγή Πλεονεκτήματα δέντρων απόφασης Training και Test Data Αλγόριθμοι δημιουργίας δέντρων απόφασης. Ο αλγόριθμος C4.5 Παράδειγμα εφαρμογής αλγορίθμου C4.5 2

3 Δομή της εργασίας (2/2) ΜΕΡΟΣ ΙΙ Αξιολόγηση αυτοκινήτων με δέντρα απόφασης 3. Περιγραφή του συνόλου δεδομένων (Dataset) 4. Στατιστική επεξεργασία δεδομένων. 5. Λογισμικά κατηγοριοποίησης / ανάπτυξης δέντρων απόφασης 6. Πειραματικό μέρος Ανάπτυξη σεναριών ΣενάριαμετηχρήσητουλογισμικούWeka ΣενάριαμετηχρήσητουλογισμικούMatLab. Εφαρμογή παρουσίασης των σεναρίων 7. Συμπεράσματα 3

4 Data Mining (1/5) Η εξόρυξη γνώσης από τα δεδομένα και όχι εξόρυξη δεδομένων (Data mining - όπως έχει επικρατήσει ) συνίσταται στην ανακάλυψη ενδιαφερόντων τάσεων ή προτύπων σχημάτων μέσα σε μεγάλα σύνολα δεδομένων, με σκοπό να καθοδηγήσει αποφάσεις σχετικές με μελλοντικές δραστηριότητες. Σύμφωνα με τον νόμο της πληροφορίας του Malthus Το νέο πληροφοριακό περιεχόμενο διπλασιάζεται κάθε χρόνο. Ο χρόνος που δαπανάται για την κατανάλωση πληροφοριών παραμένει σταθερός. Το κόστος αποθήκευσης και μετάδοσης των δεδομένων μειώνεται. Μόνο ένα μικρό ποσοστό(5-10%) των συλλεγόμενων δεδομένων τυγχάνει ανάλυσης. 4

5 Data Mining (2/5) Δεδομένα που εφαρμόζεται το DM Συναλλαγές επιχειρήσεων Επιστημονικά δεδομένα Δεδομένα συμπεριφοράς καταναλωτών. Δεδομένα που παράγονται από δορυφόρους Αρχεία κειμένου, memos και Δεδομένα διαδικτύου Τα δεδομένα προς εξόρυξη πληροφοριών μπορεί να έχουν τη μορφή: Αρχείων (text, binary ktl) Σχεσιακέςβάσειςδεδομένων Ετερογενής αποθήκες δεδομένων (σύνθετα σχήματα, 2D και 3D-cubes ) Αρχεία κινήσεων (transaction) Βάσεις πολυμέσων Τοπογραφικές βάσεις δεδομένων (χάρτες κτλ) Time-Series δεδομένα. 5

6 Data Mining (3/5) H διαδικασία KDD. Η ανακάλυψη γνώσης από μια βάση δεδομένων (Knowledge Discovery in Databases - KDD) αναφέρεται σε ολόκληρη την διαδικασία ανακάλυψης χρήσιμης πληροφορίας από μεγάλα σύνολα δεδομένων. Πρόκειται για μια διαλογική και επαναληπτική διαδικασία που αποτελείται από μια σειρά από τα ακόλουθα βήματα: 1. Την ανάπτυξη και κατανόηση της περιοχής της εφαρμογής 2. Την ολοκλήρωση των δεδομένων. 3. Τη δημιουργία του στόχου-συνόλου δεδομένων.. 4. Τον καθορισμό και την προ-επεξεργασία δεδομένων. 5. Τον μετασχηματισμό των δεδομένων. 6. Τηνεπιλογήτωνστόχωνκαιτωναλγορίθμων εξόρυξης δεδομένων. 7. Την εξόρυξη δεδομένων. 8. Την αξιολόγηση των προτύπων. 9. Τη σταθεροποίηση και παρουσίαση της γνώσης. 6

7 Data Mining (4/5) Επισκόπηση των εργασιών εξόρυξης δεδομένων Οι δύο βασικοί στόχοι της εξόρυξης δεδομένων (γνώσης) είναι η εφαρμογή τεχνικών περιγραφής και πρόβλεψης σε μεγάλα σύνολα δεδομένων. Η πρόβλεψη στοχεύει στον υπολογισμό της μελλοντικής αξίας ή στην πρόβλεψη της συμπεριφοράς κάποιων μεταβλητών που παρουσιάζουν ενδιαφέρον και οι οποίες βασίζονται στη συμπεριφορά άλλων μεταβλητών. Η περιγραφή επικεντρώνεται στην ανακάλυψη προτύπων και αναπαριστά τα δεδομένα μίας πολύπλοκης βάσης δεδομένων με ένα κατανοητό και αξιοποιήσιμο τρόπο. Εργασίες εξόρυξης δεδομένων Κατηγοριοποίηση. Συσταδοποίηση. Κανόνες συσχέτισης Απεικόνιση και μείωση των διαστάσεων Παλινδρόμηση Περιληπτική παρουσίαση πληροφορίας 7

8 Data Mining (5/5) Κατηγοριοποίηση. Η κατηγοριοποίηση (classification) αποτελεί μία από τις βασικές εργασίες (tasks) εξόρυξης δεδομένων. Βασίζεται στην εξέταση των χαρακτηριστικών ενός νέου αντικειμένου (μη κατηγοριοποιημένο) το οποίο με βάση τα χαρακτηριστικά αυτά αντιστοιχίζεται σε ένα προκαθορισμένο σύνολο κλάσεων. Υπάρχει ένας περιορισμένος αριθμός κατηγοριών και εμείς θα πρέπει να αναθέσουμε κάθε εγγραφή στην κατάλληλη κατηγορία. Για το σκοπό αυτό χρησιμοποιούνται κάποιες τεχνικές, τιςοποίεςμπορούμενα κατατάξουμε σε δύο κατηγορίες. Η πρώτηχρησιμοποιείδέντρα Αποφάσεων (Decision Trees) και η δεύτερη Νευρωνικά Δίκτυα (Neural Networks). Καιοιδύοστηρίζονταιστηνιδέατης«εκπαίδευσης» (training) με τη βοήθεια ενός υποσυνόλου δεδομένων που ονομάζεται σύνολο εκπαίδευσης (training set). To υποσύνολο αυτό επιλέγεται σαν αντιπροσωπευτικό δείγμα του συνολικού όγκου δεδομένων. 8

9 Δέντρα απόφασης (1/3) Patient ID Sore Εισαγωγή Throat Fever Training Data Set Swollen Congestion Headache Diagnosis Glands 1 Strep 2Τα δέντρα απόφασης είναι απλές δομές όπου οι μη-τερματικοί Allergy κόμβοι 3 αντιστοιχούν σε τεστ ενός ή περισσοτέρων Cold χαρακτηριστικών 4 εισόδου και οι τερματικοί κόμβοι (φύλλα) Strep σε αποφάσεις. 5 Cold 6 Τα δέντρα απόφασης είναι μια από τις ευρέως χρησιμοποιούμενες Allergy τεχνικές 7 για την κατηγοριοποίηση (classification) και την πρόβλεψη Strep Training Data Set (prediction). 8 Allergy 9 Κατασκευάζονται με βάση ένα σύνολο εκπαίδευσης προ- Cold κατηγοριοποιημένων 10 δεδομένων Cold Κάθε κόμβος του δέντρου αντιστοιχεί σε μια συνθήκη ενός Test Data Set χαρακτηριστικού. Patient IDΚάθε κλαδί Throat αντιστοιχεί Glands σε μια τιμή του χαρακτηριστικού που επιλέχθηκε από τον προηγούμενο κόμβο Sore Fever Swollen Congestion Κάθε φύλλο του δέντρου αντιστοιχεί σε μια κατηγορία στην οποία καταλήγει 13 ένα δείγμα διασχίζοντας διαδοχικούς κόμβους από τη Allergy ρίζα. Headache Πλεονεκτήματα δέντρων απόφασης Diagnosis Strep Cold Fever Swollen Glands Strep Throat Εύκολα να κατανοηθούν. Μπορούν να μεταφραστούν εύκολα σε σύνολο από κανόνες. Μπορούν να χρησιμοποιηθούν εύκολα σε πειράματα. Allergy Cold 9

10 Δέντρα απόφασης (2/3) Αλγόριθμοι δημιουργίας δέντρων απόφασης. Έχουν αναπτυχθεί και συνεχίζουν να αναπτύσσονται - πολλοί αλγόριθμοι με στόχο να βελτιώνουν την ακρίβεια των παραγομένων δέντρων απόφασης και να μειώνουν τον χρόνο δημιουργία τους.οι πιο γνωστοί είναι οι : ID3 C4.5 με νεότερες παραλλαγές SPRINT SLIQ CART RainForest Hunt s Algorithm (new) CLS (new) Γενικά οι περισσότεροι αλγόριθμοι έχουν δύο διακριτές φάσεις: Την φάση οικοδόμησης (building phase ) και τη φάση περικοπής (pruning phase). 10

11 Δέντρα απόφασης (3/3) Αλγόριθμοι δημιουργίας δέντρων απόφασης. Για την επιλογή του κριτηρίου ελέγχου για την κατηγοριοποίηση ενός συνόλου δεδομένων, οι διάφοροι αλγόριθμοι επιλέγουν διαφορετικούς δείκτες. Οι αλγόριθμοι ID3 και C4.5 βασίζονται σε μια στατιστική ιδιότητα καλούμενη ως κέρδος πληροφορίας (information gain ) προκειμένου να επιλέξουμε το χαρακτηριστικό που θα ελέγξουμε σε κάθε κόμβο του δέντρου. Οορισμόςτου μέτρου βασίζεται στην εντροπία, η οποία χαρακτηρίζει την καθαρότητα (purity) μια αφηρημένης επιλογής των δειγμάτων. Οι αλγόριθμοι όπως SLIQ και SPRINT επιλέγουν το χαρακτηριστικό που θα ελεγχθεί με βάση τον δείκτη GINI και όχι το μέτρο εντροπίας. Το καλύτερο γνώρισμα για τον έλεγχο (δηλαδή το γνώρισμα που δίνει την καλύτερη τμηματοποίηση ) δίνει την χαμηλότερη τιμή για τον δείκτη GINI. Υπάρχουν και άλλοι αλγόριθμοι (όπως μερικώς ο CLS) που επιλέγουν το χαρακτηριστικό που θα ελεγχθεί με βάση το κόστος λανθασμένης κατηγοριοποίησης (misclassification error cost). 11

12 Περιγραφή του συνόλου δεδομένων (Dataset) Υπάρχει ένα σύνολο δεδομένων που περιέχει πληροφορίες για 1728 αυτοκίνητα (Car Evaluation DataSet). Το κάθε αυτοκίνητο διαθέτει έξι χαρακτηριστικά (εισόδου) και πρέπει να κατηγοριοποιηθεί -μέσω ενός μοντέλου- ως προς ένα έβδομο (εξόδου) που αξιολογεί ποιοτικά το αυτοκίνητο. Σκοπός μας είναι να κατασκευάσουμε δέντρο απόφασης, που πραγματοποιεί κατηγοριοποίηση (classification), που να δέχεται τα χαρακτηριστικά εισόδου του κάθε αυτοκινήτου και να αποφαίνεται για την ποιοτική αξιολόγηση του. Χαρακτηριστικά εισόδου Χαρ/κό Περιγραφή Πιθανές τιμές buying Χαρακτηριστικό που προσδιορίζει την κατηγορία ύψους τιμής απόκτησης του αυτοκινήτου. vhigh, high, med, low. maint Χαρακτηριστικό που προσδιορίζει το κόστος συντήρησης (maintenance) του αυτοκινήτου. vhigh, high, med, low Doors Χαρακτηριστικό που προσδιορίζει αν το αυτοκίνητο είναι 2θυρο, 3θυρο ή 5θυρο και πάνω. 2, 3, 4, 5more. Persons Αριθμός χωρητικότητας σε επιβάτες του αυτοκινήτου 2, 4, more lug_boot Κατηγορία χωρητικότητας σε αποσκευές του αυτοκινήτου small, med, big Safety Δείκτης ασφάλειας του αυτοκινήτου. high, med, low Χαρακτηριστικό Εξόδου (Class Value) class Αξιολόγηση αυτοκινήτου Unacc- Unacceptable Acc-Acceptable Good -Good Vgood-very good 12

13 Στατιστική επεξεργασία δεδομένων Χαρακτηριστικά class (output) εισόδου - κατανομή τιμών Όλα τα χαρακτηριστικά που αποτελούν το Data Set είναι Categorical, δηλαδή το πεδίο τιμών τους αποτελείται από πεπερασμένες μητιμές συνεχής, μη unacc αριθμητικές accτιμές. good Αυτό λοιπόν vgood που θα αναλύσουμε παρακάτω είναι οι συχνότητα εμφάνισης πλήθος της 1210 κάθε τιμής 384 όλων των 65 χαρακτηριστικών 69 και η ανάλυση κάθε τιμής στην διαμόρφωση ποσοστό της τιμής 70,02% της μεταβλητής 22,22% 3,76% εξόδου class 3,99%. doors buiying maint persons lug_boot safety class class vgood τιμές low high 2big2 3med 4 good high 4small more low 5more vhigh 69 πλήθος ,99% 700 ποσοστό 33,33% 25% 25% 33,33% 3,76% 25% 33,33% 25% unacc acc good acc vgood ,22% 400 Κατανομή Κατανομή τιμών τιμών στη στη μεταβλητή μεταβλητή lug_boot persons safety doors buying maint high; 5more; vhigh; 432; big; 432; 2; 576; 576; 576; low ;; 432; 25% 25% 33,33% 33,33% 33,33% 2; 432; 25% 25% small; more; 576; 576; 33,33% 4; high; 432; 25% 432; low ; 576; 25% 33,33% 3; med; 432; 432; 25% med; med; 4; 576; 576; 576; 25% 33,33% 33,33% ανάλυση ανάλυση τιμών τιμών lug_boot persons safety doors buying maint στην στην μεταβλητή class unacc ,02% high big 2 low 2 med 3 med 4 high 4 small low5more vhigh unacc unacc acc acc good good vgood vgood unacc acc good vgood 13

14 Λογισμικά κατηγοριοποίησης / ανάπτυξης δέντρων απόφασης Το weka είναι αποτέλεσμα ακαδημαϊκής έρευνας και συγκεκριμένα προέρχεται από το πανεπιστήμιο του Waikato της Ν.Ζηλανδίας. Πρόκειται για μία συλλογή από αλγορίθμους μηχανικής μάθησης που μπορούν να εφαρμοστούν απ ευθείας στα δεδομένα ή δια μέσου κώδικα java του χρήστη. Το weka διαθέτει εργαλεία για προεπεξεργασία δεδομένων, classification, regression, clustering, association rules και visualization. DTREG To Dtreg είναι ένα δυναμικό λογισμικό ανάπτυξης μοντέλων time series analysis και πρόγνωσης για οικονομικά, ιατρικά και μετεωρολογικά δεδομένα. To rabit-i είναι λογισμικό που παρέχει λύσεις και υπηρεσίες στα πεδία ανάλυσης πρόγνωσης, data mining και text mining. Επικεντρώνεται κυρίως σε στα συστήματα ευφυούς ανάλυσης μεγάλης κλίμακας για παράδειγμα σε μεγάλο όγκο δεδομένων όπως βάσεις δεδομένων και μη δομημένα δεδομένα όπως κείμενα. Στην ομάδα λογισμικών rabit-i ανήκει και το λογισμικό Rabit-Miner. Το MatLab το γνωρίζουμε όλοι ως μια πλατφόρμα πάνω στην οποία αναπτύσσονται επιστημονικές εφαρμογές με την χρήση κατάλληλων βιβλιοθηκών για κάθε πεδίο. Έτσι και η κατηγοριοποίηση ή η ανάπτυξη δέντρων απόφασης γίνετε με την κλήση συναρτήσεων του τομέα Statistics toolbox. Αλλά λογισμικά Classification Tree in Excel (Ctree) CART - Salford Systems See5 and C5.0 - RULEQUEST RESEARCH AnswerTree SPSS XLSTAT 14

15 Πειραματικό μέρος Ανάπτυξη σεναριών (1/11) Σενάρια με τη χρήση του λογισμικού Weka - Σενάριο 1.1 Στο πρώτο σενάριο θα επιλέξουμε τον αλγόριθμο J48, ως δεδομένα εκπαίδευσης το 66% των στιγμιότυπων(1140) και ως δεδομένα εκπαίδευσης το υπόλοιπο 34% (588) Car Evaluation Test Dataset (588 Random Chosen ins) Weka Decision Tree Script 1 Car Evaluation Dataset (1728 ins) Car Evaluation Training Dataset (Remaining 1140 ins) Αποτελέσματα Μέγεθος δένδρου : 65 κόμβοι Αριθμός τελικών κόμβων (φύλων): 33 Μέγεθος test data : 588 στιγμιότυπα (34%) Κατηγοριοποίηση ορθή : 551 στιγμ (93,7%) Κατηγοριοποίηση λανθασμένη : 37 στ (6,3%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood

16 Πειραματικό μέρος Ανάπτυξη σεναρίων (2/11) Σενάρια με τη χρήση του λογισμικού Weka - Σενάριο 1.1 8fold - Cross validation method Στο δεύτερο σενάριο εκπαιδεύουμε το δέντρο Fold-1 (216 inst) Fold-2 (216 inst) Fold-1 (216 inst) Fold-2 (216 inst) Fold-1 (216 inst) Fold-2 (216 inst) Fold-1 (216 inst) Fold-2 (216 inst) απόφασης σύμφωνα με την μέθοδο cross Fold-3 (216 inst) Fold-4 (216 inst) Fold-5 (216 inst) Fold-3 (216 inst) Fold-4 (216 inst) Fold-5 (216 inst) Fold-3 (216 inst) Fold-4 (216 inst) Fold-5 (216 inst). Fold-3 (216 inst) Fold-4 (216 inst) Fold-5 (216 inst) validation. Fold-6 (216 inst) Fold-6 (216 inst) Fold-6 (216 inst) Fold-6 (216 inst) Fold-7 (216 inst) Fold-7 (216 inst) Fold-7 (216 inst) Fold-7 (216 inst) Fold-8 (216 inst) Fold-8 (216 inst) Fold-8 (216 inst) Fold-8 (216 inst) Weka Decision Tree Script 2 Training data Test data Αποτελέσματα Μέγεθος δένδρου : 65 κόμβοι Αριθμός τελικών κόμβων (φύλων): 33 Μέγεθος test data :Το σύνολο των εγγραφών 1728 στιγμιότυπα Κατηγοριοποίηση ορθή : 1661 στιγμιότυπα (96,12%) Κατηγοριοποίηση λανθασμένη : 67 στιγμιότυπα (3,88%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood

17 Πειραματικό μέρος Ανάπτυξη σεναρίων (3/11) Σενάρια με τη χρήση του λογισμικού MatLab - Σενάριο 2.1 Instances 5,6,11,12,17,18 Car Evaluation Test Dataset (576 ins). Instances 1,2,3,4,7,8,9,10,13. Classregtree function Car Evaluation Dataset (1728 ins) Training record Test record Car Evaluation Training Dataset (1152 ins) MatLab Decision Tree Script 1 Αποτελέσματα Μέγεθος δένδρου : 49 κόμβοι Αριθμός τελικών κόμβων (φύλων): 25 Μέγεθος test data : 576 στιγμιότυπα (33,33%) Κατηγοριοποίηση ορθή : 517 στιγμιότυπα (89,76%) Κατηγοριοποίηση λανθασμένη : 59 στιγμιότυπα (10,24%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood

18 Πειραματικό μέρος Ανάπτυξη σεναρίων (4/11) Σενάρια με τη χρήση του λογισμικού MatLab - Σενάριο 2.2 Η βασική ιδέα στο δεύτερο Car Evaluation Dataset (1728 ins) Car Evaluation Dataset (1728 ins) Car Evaluation Dataset (1728 ins) Car Evaluation Dataset (1728 ins) Car Evaluation Dataset (1728 ins) σενάριο είναι να εκπαιδεύσουμε 5 δέντρα απόφασης με αναλογία δεδομένων εκπαίδευσηςελέγχου 60%-40%, 65%-35%,70%-30% Test Dataset (40% -691 Random Chosen ins) Test Dataset (35% -605 Random Chosen ins) Test Dataset (30% -518 Random Chosen ins) Test Dataset (25% -432 Random Chosen ins) Test Dataset (20% -346 Random Chosen ins),75%-25% και 80%-20% και να επιλέξουμε το καλύτερο. Η επιλογή των Training Dataset (Remaining 60% 1037 ins) Training Dataset (Remaining 65% 1123 ins) Training Dataset (Remaining 70% 1210 ins) Training Dataset (Remaining 75% 1296 ins) Training Dataset (Remaining 80% 1382 ins) δεδομένων ελέγχου άρα και εκπαίδευσης γίνεται Classregtree function Classregtree function Classregtree function Classregtree function Classregtree function τυχαία και αντιπροσωπευτικό δέντρο του δεύτερου σεναρίου παίρνουμε αυτό που εξασφαλίζει την καλύτερη απόδοση στα δεδομένα Best test data Evaluation tree ελέγχου MatLab Decision Tree Script 2 18

19 Πειραματικό μέρος Ανάπτυξη σεναρίων (5/11) Σενάρια με τη χρήση του λογισμικού MatLab - Σενάριο 2.2 Μέγεθος Test data 20% 25% 30% 35% 40% Απόδοση 94,22% 97,69% 95,17% 94,21% 95,08% Για την δεδομένη εκτέλεση, καλύτερη απόδοση εμφανίζει το δέντρο απόφασης που εκπαιδεύτηκε με 75% τυχαίων εγγραφών και εμφανίζει τα παρακάτω χαρακτηριστικά. Αποτελέσματα Μέγεθος δένδρου : 71 κόμβοι Αριθμός τελικών κόμβων (φύλων): 36 Μέγεθος test data : 432 στιγμιότυπα (25%) Κατηγοριοποίηση ορθή : 422 στιγμιότυπα (97,69%) Κατηγοριοποίηση λανθασμένη : 10 στιγμιότυπα (2,31%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood

20 Πειραματικό μέρος Ανάπτυξη σεναρίων (7/11) Σενάρια με τη χρήση του λογισμικού MatLab - Σενάριο 2.3 Car Evaluation Dataset (1728 ins) Το τρίτο σενάριο υλοποιεί την μέθοδο cross-validation αφού περικόψει το αρχικό δέντρο που παράγεται από το σύνολο των δεδομένων εκπαίδευσης στο βέλτιστο επίπεδο κόστους. Fold-1 (172 inst) Fold-2 (172 inst).. Classregtree function [c,s,n,best] = test(t,'cross',ndata,nclass) 10fold - Cross validation method t Best Tree Pruning prune(t,'level',best); Fold-10 (172 inst) Car Evaluation Dataset (1728 ins) Αποτελέσματα Μέγεθος δένδρου : 57 κόμβοι Αριθμός τελικών κόμβων (φύλων): 29 Μέγεθος test data : Το σύνολο των εγγραφών 1728 στιγμιότυπα Κατηγοριοποίηση ορθή : 1670 στιγμιότυπα (96,64%) Κατηγοριοποίηση λανθασμένη : 58 στιγμιότυπα (3,36%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood Pruned t at best level MatLab Decision Tree Script 3 20

21 Πειραματικό μέρος Ανάπτυξη σεναρίων (8/11) Σενάρια με τη χρήση του λογισμικού MatLab - Σενάριο 2.4 start Car Evaluation Training Dataset Initial size (70% - Remaining 1210 ins) Classregtree function Temporary decision tree Train Decision Tree With New Dataset Test evaluation <0.998 no Car Evaluation Dataset (1728 ins) Car Evaluation Test Dataset Initial size (30% Random Chosen ins) yes Test next test istance Compare prediction with true class value Equal? no MatLab final Decision Tree Script 4 end Add misclassified test instance to training Dataset Remove misclassified test instance from test dataset Αποτελέσματα Μέγεθος δένδρου : 73 κόμβοι Αριθμός τελικών κόμβων (φύλων): 37 Μέγεθος test data : 491 στιγμιότυπα (28,41%) Κατηγοριοποίηση ορθή : 491 στιγμιότυπα (100%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood

22 Πειραματικό μέρος Ανάπτυξη σεναρίων (9/11) Σενάρια με τη χρήση του λογισμικού MatLab - Σενάριο 2.5 t(1).tree Σύνολο κόμβων τρέχοντος επιπέδου =[1] t(2).tree Training Dataset 70% Classregtree function Create next group of nodes datasets 1 DS1 Test Dataset (30%-Random Chosen ins) Calculate test data evaluation T(2).eval 1 Σύνολα κόμβων τρέχοντος επιπέδου =[ 1] και [2 3] 2 3 DS1 DS3 (persons!=2) Training Dataset 70% of each dataset Classregtree function t(3).tree Create next group of nodes datasets DS2 (persons==2) Test Dataset (30%-Random Chosen ins of each Dataset)) Calculate test data evaluation T(3).eval 1 Σύνολα κόμβων τρέχοντος επιπέδου =[ 1],[2 3] και [2,4 5] DS1 DS3 (persons!=2) DS5 (persons!=2) Safety!=1 DS4 (persons!=2) (safety==1) Training Dataset 70% of each dataset Test Dataset (30%-Random Chosen ins of each Dataset) Classregtree function Calculate test data evaluation T(4).eval t(4).tree Create next group of nodes datasets DS2 (persons==2) Continue 22

23 evaluation (test data ) at levels DataSets Of des tree 1 tree 2 tree 3 tree 4 tree 5 tree 6 tree 7 tree 8 1 0,9653 2,3 0,9606 0,9884 2,4,5 0,9699 0,978 0,9784 2,4,6,7 0,9421 0,963 0,9853 0,9925 2,4,8,9,10,11 0,9398 0,9734 0,9799 0,9919 0,9907 2,4,12,13,14,15,16,17,18,19 0,9745 0,9780 0,9815 0,9850 0,9894 0,9900 2,4,19,20,21,22,23,24,25,26,2 7,28,29,30,31,32,33 0,9560 0,9826 0,9861 0,9878 0,9917 0,9915 0,9927 2,4,19,28,31,33,34,35,36,37,3 8,39,40,41,42,43,44,45,46,47, 48,49,50,51,52,53,54,55 0,9421 0,9757 0,9769 0,9855 0,9921 0,9950 0, Αποτελέσματα Μέγεθος δένδρου : 167 κόμβοι Αριθμός τελικών κόμβων (φύλων): 84 Μέγεθος test data 1623 στιγμιότυπα Κατηγοριοποίηση ορθή : 1623 στιγμιότυπα (100%) Confusion Τιμές Πρόβλεψης Matrix Unacc Acc Good Vgood Πραγματικές τιμές Unacc Acc Good Vgood

24 Πειραματικό μέρος Ανάπτυξη σεναρίων (11/11) Εφαρμογή παρουσίασης των σεναρίων Για τις ανάγκες της εργασίας κατασκευάσαμε μια διαδραστική GUI εφαρμογή ηοποία: Καλεί τις συναρτήσεις υλοποίησης των δέντρων απόφασης των 5 σεναρίων. Αποθηκεύει τα δέντρα, στοιχεία απόδοσης και αξιολόγησης όλων των δέντρων σε μια κοινή δομή Περιλαμβάνει συναρτήσεις υπολογισμού και παρουσίασης των confusion matrices. Δίνει την δυνατότητα στο χρήστη να δει οπτικοποιημένο το κάθε δέντρο μαζί με τα στοιχεία απόδοσης του στα δεδομένα εκπαίδευσης και ελέγχου. Δίνει την δυνατότητα στο χρήστη να εισάγει τιμές για τα χαρακτηριστικά ενός αυτοκινήτου και του δίνει την πρόβλεψη για κάθε ένα από τα δέντρα απόφασης των 5 σεναρίων καθώς και την πραγματική τιμή εξόδου (αν υπάρχει αντίστοιχο στιγμιότυπο στο αρχείο των δεδομένων). Car evaluation (GUI form) cartree.m Auxiliaries functions Dtrees (stracture variable) CarDTree1StdInstTr2Of3 Function- script1 CarDTree2RndInstBestTrSize Function- script2 CreateCarDTrees (function) CarDTree3CrossValBestLevelPruned Function- script3 CarDTree4ReTrainWithMissClass Function- script4 CarDTree5ReBuildLevelByLevel Function- script5 24

25 Συμπεράσματα (1/2) Συγκεντρωτικός πίνακας αποτελεσμάτων για όλα τα σενάρια. Δέντρο απόφασης αριθμός κόμβων αριθμός φύλλων ποσοστό δεδομένων εκπαίδευσης weka % ποσοστό δεδομένων ελέγχου απόδοση δεδομένων εκπαίδευσης απόδοση δεδομένων ελέγχου weka % 100% 96,12% 96,12% matlab ,66% 33,33% 97,83% 89,76% matlab ,00% 25,00% 34% 93,7% 97,38% 97,69% matlab % 100% 96,64% 96,64% matlab ,59% 28,41% 96,45% 100% matlab % 93,34% 100% 100% confusion matrix (Test Data) Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood Unacc Acc Good Vgood

26 Συμπεράσματα (2/2) Το καλύτερο δέντρο απόφασης είναι αυτό του τέταρτου σεναρίου(2.4) γιατί εξασφαλίζει την απόλυτη απόδοση 100% των δεδομένων ελέγχου με μικρό σχετικά αριθμό κόμβων(73) αλλά και με σχετικά απλό τρόπο υλοποίησης. Στην ουσία του προβλήματος της ποιοτικής αξιολόγησης αυτοκινήτου οι περισσότερεςλύσειςπου παρουσιάστηκαν συνηγορούν στο ότι τα χαρακτηριστικά που θεωρούνται πιο σημαντικά είναι με την σειρά που αναφέρονται : Persons (ή Safety) Safety (ή Persons) Buying Maint Lug_boot Doors Ενώ ένα αυτοκίνητο για να χαρακτηριστεί καλό ή πολύ καλό πρέπει να : Μπορεί να μεταφέρει περισσότερους από δύο επιβάτες. Να παρέχει κάτι παραπάνω από την βασική ασφάλεια (low) Nα έχεικαλήτιμήαπόκτησης(low,med) Να έχει φθηνό κόστος συντήρησης Να έχει μεγάλο χώρο αποσκευών Να έχει περισσότερες από δύο πόρτες. 26

27 Σας ευχαριστώ για την προσοχή σας! 27

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα 6ο Πανελλήνιο Συνέδριο των Εκπαιδευτικών για τις ΤΠΕ «Αξιοποίηση των Τεχνολογιών της Πληροφορίας και της Επικοινωνίας στη Διδακτική Πράξη» Σύρος 6-8 Μαϊου 2011 Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M. 09470015 AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διδάσκων: Γιώργος Τζιραλής ΔΠΜΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Στάδιο 1 ο. Προεπισκόπηση-προεπεξεργασία δεδομένων: Δίδονται τα παρακάτω

Διαβάστε περισσότερα

Predicting the Choice of Contraceptive Method using Classification

Predicting the Choice of Contraceptive Method using Classification ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΣΣΑΛΟΝΙΚΗ Predicting the Choice of Contraceptive Method using Classification ΠΑΠΑΔΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Νικόλαος Σαμαράς ΕΞΕΤΑΣΤΗΣ:

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Αναπαράσταση των δεδομένων ως διανύσματα χαρακτηριστικών (feature vectors): Επιλογή ενός

Διαβάστε περισσότερα

ΣΥΓΚΡΙΣΗ ΔΙΑΦΟΡΕΤΙΚΩΝ ΛΟΓΙΣΜΙΚΩΝ ΚΑΘΟΔΗΓΟΥΜΕΝΗΣ ΕΚΜΑΘΗΣΗΣ

ΣΥΓΚΡΙΣΗ ΔΙΑΦΟΡΕΤΙΚΩΝ ΛΟΓΙΣΜΙΚΩΝ ΚΑΘΟΔΗΓΟΥΜΕΝΗΣ ΕΚΜΑΘΗΣΗΣ ΣΥΓΚΡΙΣΗ ΔΙΑΦΟΡΕΤΙΚΩΝ ΛΟΓΙΣΜΙΚΩΝ ΚΑΘΟΔΗΓΟΥΜΕΝΗΣ ΕΚΜΑΘΗΣΗΣ ΞΥΛΑΓΡΑ ΠΑΡΑΣΚΕΥΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Επιβλέπων Καθηγητής: Σαμαράς Νικόλαος(Επίκουρος Καθηγητής) Εξεταστής: Ευαγγελίδης Γεώργιος (Αναπληρωτής Καθηγητής)

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά Μάιος 2008 Τα δεδομένα που έχουμε προς επεξεργασία χωρίζονται σε τρία μέρη: 1. Τα δεδομένα εκπαίδευσης (training set) που αποτελούνται από 2528

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος Η παρούσα εργασία έγινε στα πλαίσια της εκπόνησης της διπλωματικής διατριβής

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Αποθήκες εδομένων και Εξόρυξη εδομένων: Αποθήκες εδομένων και Εξόρυξη εδομένων: Κατηγοριοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Ταξινόμηση. Εισαγωγή. Ορισμός. Ορισμός. Τεχνικές Ταξινόμησης. Εισαγωγή

Ταξινόμηση. Εισαγωγή. Ορισμός. Ορισμός. Τεχνικές Ταξινόμησης. Εισαγωγή 0 0 0 Εισαγωγή Ταξινόμηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μια ή περισσότερες προκαθορισμένες κατηγορίες (κλάσεις) Ταξινόμηση Οι διαφάνειες στηρίζονται στο P.-N. Tan,

Διαβάστε περισσότερα

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική Κατηγοριοποίηση Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης 2 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Μηχανική Μάθηση Η μηχανική μάθηση είναι μια περιοχή της τεχνητής νοημοσύνης η οποία αφορά

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ. Μοντέλο 3 Μ οοποοιοης. Αξιολόγηση αποτελεσμάτων συσταδοποίησης. Μπαμπαλιάρης Αθανάσιος.

ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ. Μοντέλο 3 Μ οοποοιοης. Αξιολόγηση αποτελεσμάτων συσταδοποίησης. Μπαμπαλιάρης Αθανάσιος. ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΊΔΡΥΜΑ ΚΑΒΑΛΑΣ Σχολή Διοίκησης & Οικονομίας ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ Νέα δεδομένα Μοντέλο 3 Μ οοποοιοης Σύνολο δεδομένων δοκιμής Αξιολόγηση αποτελεσμάτων συσταδοποίησης Ακρίβεια

Διαβάστε περισσότερα

«ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΤΟΝ ΠΙΣΤΩΤΙΚΟ ΚΙΝΔΥΝΟ ΜΕ ΤΟ ΛΟΓΙΣΜΙΚΟ ΕΞΟΡΥΞΗΣ STATISTICA DATA MINER»

«ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΤΟΝ ΠΙΣΤΩΤΙΚΟ ΚΙΝΔΥΝΟ ΜΕ ΤΟ ΛΟΓΙΣΜΙΚΟ ΕΞΟΡΥΞΗΣ STATISTICA DATA MINER» Τ.Ε.Ι ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ & ΘΡΑΚΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΤΟΝ ΠΙΣΤΩΤΙΚΟ ΚΙΝΔΥΝΟ ΜΕ ΤΟ ΛΟΓΙΣΜΙΚΟ ΕΞΟΡΥΞΗΣ STATISTICA DATA MINER»

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 5: Κατηγοριοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία

Διαβάστε περισσότερα

Ι. Preprocessing (Επεξεργασία train.arff):

Ι. Preprocessing (Επεξεργασία train.arff): Ονοματεπώνυμο: Κατερίνα Αργύρη Δ.Π.Μ.Σ: Εφαρμοσμένες Μαθηματικές Επιστήμες Ακαδ. Έτος: 2008-2009 1 Για την παρούσα εργασία διατίθενται τρία σύνολα δεδομένων: Δεδομένα Εκπαίδευσης (train set αρχείο train.arff):

Διαβάστε περισσότερα

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής Data Mining: Στοχεύοντας στους σωστούς πελάτες To CRM front-office πελατών Οι Προμηθευτές Οι Πελάτες ΟΟργανισμός Τροφοδότηση ενεργειών Μάρκετινγκ ΒΙ Απόταδεδομέναστηγνώση Επιχειρηματική Γνώση Επιχειρηματικοί

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Matlab GUI για FWSVM και Global SVM

ΚΕΦΑΛΑΙΟ 5. Matlab GUI για FWSVM και Global SVM ΚΕΦΑΛΑΙΟ 5 Matlab GUI για FWSVM και Global SVM Προκειμένου να γίνουν οι πειραματικές προσομοιώσεις του κεφαλαίου 4, αναπτύξαμε ένα γραφικό περιβάλλον (Graphical User Interface) που εξασφαλίζει την εύκολη

Διαβάστε περισσότερα

Αποθήκες και Εξόρυξη Δεδομένων

Αποθήκες και Εξόρυξη Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 2 Ο Εργαστήριο WEKA (CLASSIFICATION) Στουγιάννου Ελευθερία estoug@unipi.gr -2- Κατηγοριοποίηση Αποτελεί μια από τις βασικές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Αναζήτηση Γνώσης σε Βάσεις Δεδομένων

Αναζήτηση Γνώσης σε Βάσεις Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΔΙΟΙΚΗΣΗ» Αναζήτηση Γνώσης σε Βάσεις Δεδομένων Εξόρυξη Δεδομένων

Διαβάστε περισσότερα

Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.

Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου. Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.

Διαβάστε περισσότερα

ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ Μ.I.S ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ Μ.I.S ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ Μ.I.S ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: Αναζήτηση γνώσης σε Νοσοκομειακά Δεδομένα ΤΟΡΤΟΠΙΔΗΣ ΓΕΩΡΓΙΟΣ Μηχανικός Η/Υ & Πληροφορικής Επιβλέπων: ΒΛΑΧΑΒΑΣ Π. ΙΩΑΝΝΗΣ Καθηγητής Τμ. Πληροφορικής

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ DATA MINING ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ 1 ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Αφού δεν γνωρίζουμε κάποιο τρόπο για να επιλέξουμε εκ των προτέρων την πιο κατάλληλη και αποδοτική μέθοδο μάθησης

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Θ.Ε. ΠΛΗ31 (2004-5) ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ #3 Στόχος Στόχος αυτής της εργασίας είναι η απόκτηση δεξιοτήτων σε θέματα που αφορούν τα Τεχνητά Νευρωνικά Δίκτυα και ποιο συγκεκριμένα θέματα εκπαίδευσης και υλοποίησης.

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική Σχολή Θετικών Επιστημών Πανεπιστήμιο Θεσσαλίας ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Κατηγοριοποίηση Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Κατηγοριοποιητής K πλησιέστερων

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΕΓΚΡΙΣΗΣ ΠΙΣΤΩΤΙΚΗΣ ΚΑΡΤΑΣ ΑΠΟ ΙΣΤΟΡΙΚΑ ΔΕΔΟΜΕΝΑ

ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΕΓΚΡΙΣΗΣ ΠΙΣΤΩΤΙΚΗΣ ΚΑΡΤΑΣ ΑΠΟ ΙΣΤΟΡΙΚΑ ΔΕΔΟΜΕΝΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ & ΔΙΟΙΚΗΣΗ» ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΕΓΚΡΙΣΗΣ ΠΙΣΤΩΤΙΚΗΣ ΚΑΡΤΑΣ

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία. Εργαστήριο 4 ο : MATLAB

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία. Εργαστήριο 4 ο : MATLAB Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Ηλεκτρονική Υγεία Εργαστήριο 4 ο : MATLAB Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών Άδειες

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 11: Δημιουργία Βάσεων Κανόνων Από Δεδομένα- Εξαγωγή Κανόνων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων Από Δεδομένα-

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING)

ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) Των σπουδαστών Σκλαβενίτης Αργύρης (Α.Μ. 535) Στασινός

Διαβάστε περισσότερα

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Βασισμένο σε μια εργασία των Καζαρλή, Καλόμοιρου, Μαστοροκώστα, Μπαλουκτσή, Καλαϊτζή, Βαλαή, Πετρίδη Εισαγωγή Η Εξελικτική Υπολογιστική

Διαβάστε περισσότερα

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΚΕΦΑΛΑΙΑ 3 και 9 ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΕΣ Δεδομένα αφαιρετική αναπαράσταση της πραγματικότητας και συνεπώς μία απλοποιημένη όψη της δηλαδή.

Διαβάστε περισσότερα

Μπιτσάκη Αντωνία-Χρυσάνθη Ταουσάκος Θανάσης

Μπιτσάκη Αντωνία-Χρυσάνθη Ταουσάκος Θανάσης Μπιτσάκη Αντωνία-Χρυσάνθη Ταουσάκος Θανάσης Τι εννοούμε με τον όρο data mining. (ανακάλυψη patterns με τη χρήση διαφορετικών μεθόδων) Το σενάριο με το οποίο θα ασχοληθούμε (2 πλευρές με σκοπό την άντληση

Διαβάστε περισσότερα

4.4 Βάσεις Δεδομένων με πολλές Μεταβλητές

4.4 Βάσεις Δεδομένων με πολλές Μεταβλητές 4.4 Βάσεις Δεδομένων με πολλές Μεταβλητές Σε αυτή την ενότητα θα παρουσιάσουμε μερικά παραδείγματα με βάσεις δεδομένων που έχουν μονοδιάστατη έξοδο και πολυδιάστατη είσοδο. Οι βάσεις δεδομένων προέρχονται

Διαβάστε περισσότερα

Σκοπός του μαθήματος

Σκοπός του μαθήματος Σκοπός του μαθήματος Στο μάθημα αυτό γίνεται εφαρμογή, με τη βοήθεια του υπολογιστή και τη χρήση του στατιστικού προγράμματος S.P.S.S., της στατιστικής θεωρίας που αναπτύχθηκε στα μαθήματα «Εισαγωγή στη

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ Συνδυασμένη χρήση μοντέλων προσομοίωσης βελτιστοποίησης. Η μέθοδος του μητρώου μοναδιαίας απόκρισης Νικόλαος

Διαβάστε περισσότερα

Διπλωματική εργασία Θέμα: «Δημιουργία ευφυούς συστήματος για τη διαχείριση και διαλογή των ασθενών Τμήματος Επειγόντων Περιστατικών

Διπλωματική εργασία Θέμα: «Δημιουργία ευφυούς συστήματος για τη διαχείριση και διαλογή των ασθενών Τμήματος Επειγόντων Περιστατικών Διπλωματική εργασία Θέμα: «Δημιουργία ευφυούς συστήματος για τη διαχείριση και διαλογή των ασθενών Τμήματος Επειγόντων Περιστατικών Μεταπτυχιακός φοιτητής: Γεώργιος Κηπουργός Νοσηλευτής Τ.Ε Επιβλέπων καθηγητής:

Διαβάστε περισσότερα

Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006

Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006 Ταξινόμηση I Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006 Εισαγωγή Ταξινόμηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ. Predicting the Choice of Contraceptive Method using Classification ΠΑΠΑΔΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ. Predicting the Choice of Contraceptive Method using Classification ΠΑΠΑΔΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΣΣΑΛΟΝΙΚΗ Predicting the Choice of Contraceptive Method using Classification ΠΑΠΑΔΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ ΦΕΒΡΟΥΑΡΙΟΣ 2010 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Νικόλαος

Διαβάστε περισσότερα

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ 8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Στόχος του εργαστηρίου αυτού είναι να δείξει πώς τα εργαστήρια με τα δεδομένα της ICAP μπορούν να υλοποιηθούν χωρίς τη χρήση SQL Server, χρησιμοποιώντας μόνον Excel και Rapid

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ ΕΡΓΑΣΤΗΡΙΟ PASW 18 Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 2011 2012 ΕΠΙΧ

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Περιγραφική Στατιστική Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι Εργαστήριο 9 1. Να χρησιμοποιηθεί το αρχείο data_kids. Τα δεδομένα του προέρχονται από την έρευνα των Chase και Dummer (1992), μελέτησαν τον ρόλο των

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Η πληροφορία στη σύγχρονη επιχείρηση Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Πέραν του ανθρώπινου δυναμικού, η πληροφορία αποτελεί τον πλέον πολύτιμο

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

Παράλληλος προγραμματισμός περιστροφικών αλγορίθμων εξωτερικών σημείων τύπου simplex ΠΛΟΣΚΑΣ ΝΙΚΟΛΑΟΣ

Παράλληλος προγραμματισμός περιστροφικών αλγορίθμων εξωτερικών σημείων τύπου simplex ΠΛΟΣΚΑΣ ΝΙΚΟΛΑΟΣ Παράλληλος προγραμματισμός περιστροφικών αλγορίθμων εξωτερικών σημείων τύπου simplex ΠΛΟΣΚΑΣ ΝΙΚΟΛΑΟΣ Διπλωματική Εργασία Μεταπτυχιακού Προγράμματος στην Εφαρμοσμένη Πληροφορική Κατεύθυνση: Συστήματα Υπολογιστών

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. 4o Εργαστήριο Σ.Α.Ε

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. 4o Εργαστήριο Σ.Α.Ε ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα 4o Εργαστήριο Σ.Α.Ε Ενότητα : Μελέτη και Σχεδίαση Σ.Α.Ε Με χρήση του MATLAB Aναστασία Βελώνη Τμήμα Η.Υ.Σ Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ Δομή παρουσίασης Εισαγωγή Βασικές Έννοιες Σχετικές μελέτες Εφαρμογή Δεδομένων Συμπεράσματα Εισαγωγή Μελέτη και προσαρμογή των διάφορων

Διαβάστε περισσότερα

Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων

Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων Σημειώσεις στα πλαίσια του μαθήματος: Βελτιστοποίηση Συστημάτων Υδατικών Πόρων Υδροπληροφορική Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων Ανδρέας Ευστρατιάδης, Χρήστος Μακρόπουλος

Διαβάστε περισσότερα

Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων

Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων Σημειώσεις στα πλαίσια του μαθήματος: Βελτιστοποίηση Συστημάτων Υδατικών Πόρων Υδροπληροφορική Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων Ανδρέας Ευστρατιάδης, Χρήστος Μακρόπουλος

Διαβάστε περισσότερα

Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών Τομέας Ηλεκτρονικής και Υπολογιστών. ΤΗΜΜΥ Α.Π.Θ Πέμπτη 11 / 12 / 2014 ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών Τομέας Ηλεκτρονικής και Υπολογιστών. ΤΗΜΜΥ Α.Π.Θ Πέμπτη 11 / 12 / 2014 ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών Τομέας Ηλεκτρονικής και Υπολογιστών 5 o Εξάμηνο ΤΗΜΜΥ Α.Π.Θ 2014-2015 Πέμπτη 11 / 12 / 2014 ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ DS Gomoku Part 3 MinMax Algorithm (0,5 βαθμοί)

Διαβάστε περισσότερα

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Η συνολική εικόνα Τοπικές Βάσεις Βάσεις Κεντρικών Συστημάτων Βάσεις Τρίτων Ποιοτική Αναβάθμιση δεδομένων Λογισμικό Επικοινωνιών DATA WAREHOUSE Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Warehouse

Διαβάστε περισσότερα

Προτεινόμενες Διπλωματικές Εργασίες 2009

Προτεινόμενες Διπλωματικές Εργασίες 2009 Προτεινόμενες Διπλωματικές Εργασίες 2009 Αλγοριθμικές Διαδικασίες για Smart Energy Profiling μέσω Διαδικτύου με βάση τηλεμετρικά δίκτυα AMR και προχωρημένων αλγορίθμων Διαχείρισης Ενεργειακής Γνώσης Η

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage),

Διαβάστε περισσότερα

(classification) 2 ΠΑ.ΠΕΙ. ΓιάννηςΘεοδωρίδης 4.1

(classification) 2 ΠΑ.ΠΕΙ. ΓιάννηςΘεοδωρίδης 4.1 Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Κατηγοριοποίηση (classification) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων

Διαβάστε περισσότερα

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση Υπολογιστική Νοημοσύνη Μάθημα 9: Γενίκευση Υπερπροσαρμογή (Overfitting) Ένα από τα βασικά προβλήματα που μπορεί να εμφανιστεί κατά την εκπαίδευση νευρωνικών δικτύων είναι αυτό της υπερβολικής εκπαίδευσης.

Διαβάστε περισσότερα

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ Βασίλης Γ. Αγγέλης Δρ. Μηχανικός Η/Υ και Πληροφορικής Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ Μετατρέψτε τα δεδομένα σας σε κέρδος Αθήνα Κάθε γνήσιο αντίγραφο έχει την υπογραφή του συγγραφέα Έκδοση 1 η, Copyright 2007

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΕΝΑ ΦΛΟΚΑ Επίκουρος Καθηγήτρια Τµήµα Φυσικής, Τοµέας Φυσικής Περιβάλλοντος- Μετεωρολογίας ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Πληθυσµός Σύνολο ατόµων ή αντικειµένων στα οποία αναφέρονται

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΑΝΑΚΑΛΥΨΗΣ ΓΝΩΣΗΣ ΣΕ ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΤΑ ΟΠΟΙΑ ΑΞΙΟΛΟΓΟΥΝ ΤΗΝ ΠΟΙΟΤΗΤΑ ΠΑΡΟΧΗΣ ΥΠΗΡΕΣΙΩΝ

ΤΕΧΝΙΚΕΣ ΑΝΑΚΑΛΥΨΗΣ ΓΝΩΣΗΣ ΣΕ ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΤΑ ΟΠΟΙΑ ΑΞΙΟΛΟΓΟΥΝ ΤΗΝ ΠΟΙΟΤΗΤΑ ΠΑΡΟΧΗΣ ΥΠΗΡΕΣΙΩΝ ΤΕΧΝΙΚΕΣ ΑΝΑΚΑΛΥΨΗΣ ΓΝΩΣΗΣ ΣΕ ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΤΑ ΟΠΟΙΑ ΑΞΙΟΛΟΓΟΥΝ ΤΗΝ ΠΟΙΟΤΗΤΑ ΠΑΡΟΧΗΣ ΥΠΗΡΕΣΙΩΝ ΜΑΡΙΑ Γ. ΜΙΧΑΗΛΙ ΟΥ ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων Καθηγητής: ηµήτριος Α. έρβος Εξεταστές: Νικόλαος Σαµαράς

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services Γεράσιµος Μαρκέτος Οµάδα ιαχείρισης εδοµένων, Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιώς (http://isl.cs.unipi.gr/db) οµή παρουσίασης SQL Server 2005 Επιχειρηµατική

Διαβάστε περισσότερα

Έρευνα Μάρκετινγκ Ενότητα 5

Έρευνα Μάρκετινγκ Ενότητα 5 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ ME TH ΧΡΗΣΗ ΚΑΝΟΝΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΣΕ ΕΠΙΧΕΙΡΗΣΕΙΣ ΛΙΑΝΙΚΗΣ ΠΩΛΗΣΗΣ

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ ME TH ΧΡΗΣΗ ΚΑΝΟΝΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΣΕ ΕΠΙΧΕΙΡΗΣΕΙΣ ΛΙΑΝΙΚΗΣ ΠΩΛΗΣΗΣ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔAΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ ME TH ΧΡΗΣΗ ΚΑΝΟΝΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΣΕ ΕΠΙΧΕΙΡΗΣΕΙΣ ΛΙΑΝΙΚΗΣ ΠΩΛΗΣΗΣ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

ΤΕΙ ΗΠΕΙΡΟΥ MΗΝΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε. ΤΕΙ ΗΠΕΙΡΟΥ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ EΦΑΡΜΟΓΗ ΜΕΘΟΔΩΝ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΒΑΣΙΛΕΙΟΣ ΤΡΑΝΤΟΣ

ΤΕΙ ΗΠΕΙΡΟΥ MΗΝΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε. ΤΕΙ ΗΠΕΙΡΟΥ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ EΦΑΡΜΟΓΗ ΜΕΘΟΔΩΝ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΒΑΣΙΛΕΙΟΣ ΤΡΑΝΤΟΣ ΤΕΙ ΗΠΕΙΡΟΥ MΗΝΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε. ΤΕΙ ΗΠΕΙΡΟΥ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ EΦΑΡΜΟΓΗ ΜΕΘΟΔΩΝ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΒΑΣΙΛΕΙΟΣ ΤΡΑΝΤΟΣ Επιβλέπων: Δημήτριος Λιαροκάπης Καθηγητής Εφαρμογών Άρτα, Φεβρουάριος, 2018 IMPLEMENTATION

Διαβάστε περισσότερα

Πως μπορούν να χρησιμοποιηθούν ιστορικά δεδομένα για την κατασκευή

Πως μπορούν να χρησιμοποιηθούν ιστορικά δεδομένα για την κατασκευή ΜΕΡΟΣ Α ΕΙΣΑΓΩΓΗ ΚΕΦΑΛΑΙΟ 1 Εξόρυξη Δεδομένων 22 Η επανάσταση του ΚΡΙΟΥ 1.1 Εισαγωγή Το Data Mining αποτελεί μια νέα ερευνητική περιοχή, ραγδαία εξελισσόμενη, που είναι η τομή πολλών θεωριών και επιστημών,

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Εισαγωγή Στην πλειοψηφία των ορισμών για την ΤΝ, η δυνατότητα μάθησης / προσαρμογής

Διαβάστε περισσότερα

Big Data/Business Intelligence

Big Data/Business Intelligence Big Data/Business Intelligence 5 8 Φεβρουαρίου 2018 ΓΕΝΙΚΑ Το μάθημα αποτελείται από δύο ενότητες, η πρώτη σε Big Data και Data Analytics και η δεύτερη σε Business Intelligence. Η πρώτη ενότητα παρέχει

Διαβάστε περισσότερα

Μεταπτυχιακή Εργασία. Εξόρυξη γνώσης από ειδησεογραφικά δεδοµένα και συσχετισµός µε πραγµατικά γεγονότα

Μεταπτυχιακή Εργασία. Εξόρυξη γνώσης από ειδησεογραφικά δεδοµένα και συσχετισµός µε πραγµατικά γεγονότα ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ Μεταπτυχιακή Εργασία Εξόρυξη γνώσης από ειδησεογραφικά δεδοµένα και συσχετισµός µε πραγµατικά γεγονότα Ειρήνη Ντούτση Μηχανικός Η/Υ και Πληροφορικής

Διαβάστε περισσότερα

ΕΡΕΥΝΑ ΑΠΟΔΟΧΗΣ ΑΥΤΟΝΟΜΩΝ ΟΧΗΜΑΤΩΝ ΑΠΟ ΤΟΥΣ ΕΛΛΗΝΕΣ ΟΔΗΓΟΥΣ

ΕΡΕΥΝΑ ΑΠΟΔΟΧΗΣ ΑΥΤΟΝΟΜΩΝ ΟΧΗΜΑΤΩΝ ΑΠΟ ΤΟΥΣ ΕΛΛΗΝΕΣ ΟΔΗΓΟΥΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΜΕΤΑΦΟΡΩΝ ΚΑΙ ΣΥΓΚΟΙΝΩΝΙΑΚΗΣ ΥΠΟΔΟΜΗΣ ΕΡΕΥΝΑ ΑΠΟΔΟΧΗΣ ΑΥΤΟΝΟΜΩΝ ΟΧΗΜΑΤΩΝ ΑΠΟ ΤΟΥΣ ΕΛΛΗΝΕΣ ΟΔΗΓΟΥΣ Χαράλαμπος Σουρής Επιβλέπων: Γιώργος Γιαννής,

Διαβάστε περισσότερα

Βελτιστοποίηση κατανομής πόρων συντήρησης οδοστρωμάτων Πανεπιστήμιο Πατρών - Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών

Βελτιστοποίηση κατανομής πόρων συντήρησης οδοστρωμάτων Πανεπιστήμιο Πατρών - Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Βελτιστοποίηση κατανομής πόρων συντήρησης οδοστρωμάτων Πανεπιστήμιο Πατρών - Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Πάτρα 17 - Μαΐου - 2017 Παναγιώτης Τσίκας Σκοπός του προβλήματος Σκοπός του προβλήματος,

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική Θεσσαλονίκη, Σεπτέμβριος 2013 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017 Θέμα μεταπτυχιακής διατριβής: Λογισμικά μελέτης και σχεδίασης ρομποτικών συστημάτων - συγκρτική μελέτη και εφαρμογές. 1) Μελέτη των δημοφιλών λογισμικών σχεδίασης ρομποτικών συστημάτων VREP και ROS. 2)

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα