Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση
|
|
- Ευφημία Ακρίδας
- 8 χρόνια πριν
- Προβολές:
Transcript
1 Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση
2 Η πληροφορία στη σύγχρονη επιχείρηση Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Πέραν του ανθρώπινου δυναμικού, η πληροφορία αποτελεί τον πλέον πολύτιμο πόρο της σύγχρονης επιχείρησης Συνιστά επομένως καθοριστικό παράγοντα για την επίτευξη των επιχειρησιακών στόχων Διαχείριση γνώσης (knowledge management): η εκμετάλλευση και ανάπτυξη των γνωστικών κεφαλαίων μίας επιχείρησης με αντικείμενο την προαγωγή των αντικειμενικών της επιδιώξεων Τα πληροφοριακά συστήματα ERP ανταποκρίνονται στην απαίτηση συλλογής και επεξεργασίας των επιχειρησιακών δεδομένων Data warehouses 2
3 Τα επιχειρησιακά δεδομένα αφθονούν Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Cost Data Storage Communication of Data 1990 Time 2010 Data per day generated and collected (implicit) The data gap understood (explicit) 1990 Time 2010 Malthus Law of Information: Το νέο πληροφοριακό περιεχόμενο διπλασιάζεται κάθε χρόνο Ο χρόνος που δαπανάται για την κατανάλωση πληροφοριών παραμένει σταθερός 3
4 Τα δεδομένα αφθονούν Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Μόνο ένα μικρό ποσοστό (5 10%) των συλλεγόμενων δεδομένων τυγχάνει ανάλυσης Μία τυπική επιχειρησιακή βάση δεδομένων σήμερα περιέχει συχνά μεγάλο αριθμό εγγραφών ( ) δεδομένων πολλών διαστάσεων ( μεταβλητές) Τελικά: We are drowning in data, but starving for knowledge! Πώς μπορούν να εξερευνηθούν εκατομμύρια εγγραφών εκατοντάδων μεταβλητών, ώστε να ανακαλυφθούν πρότυπα (patterns)? 4
5 Από τα δεδομένα στην πληροφορία και τη γνώση Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα 5
6 Ορισμός Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Data mining: όρος που χρησιμοποιείται λανθασμένα για να περιγράψει το σύνολο της διαδικασίας εξόρυξης γνώσης από βάσεις δεδομένων (Knowledge Discovery in Databases) Ορισμός: The nontrivial extraction of implicit, previously unknown, and potentially useful information from data. Εναλλακτικά: Statistics at scale, speed and simplicity. Στο εξής, ορίζουμε: Εξόρυξη Πληροφορίας / Γνώσης από Δεδομένα Data Mining 6
7 Αφετηρία Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Data Artificial Intelligence Statistics & Machine Mining Learning Databases & Data Warehouses Το ερευνητικό πεδίο αποτελεί τομή μεθόδων και εργαλείων που πηγάζουν από Στατιστική Μηχανική Μάθηση Βάσεις & αποθήκες δεδομένων Αποτελεί σύγχρονη εξέλιξη, το πρώτο σχετικό συνέδριο πραγματοποιήθηκε το Πειραματική επιστήμη! 7
8 Πρότυπα Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Επομένως αναζητούνται αλγόριθμοι εντοπισμού προτύπων (patterns) και κανονικοτήτων σε δεδομένα Περιγραφή προτύπων Μαύρο κουτί: μη κατανοητοί μηχανισμοί Διαφανές κουτί: αποκαλύπτει τη δομή του προτύπου δομική περιγραφή Οι δομικές (structural) περιγραφές αναπαριστούν τα πρότυπα με σαφώς ορισμένο (ρητό, explicit) τρόπο, με σκοπό την Πρόβλεψη Κατανόηση και επεξήγηση μοντέλου πρόβλεψης 8
9 Case study: VISA VISA American Express Softmap Walmart Victoria Secret Απάτη κατά τη χρήση πιστωτικών καρτών 0,93% σε off line συναλλαγές 1,97% σε on line Κλασσικές στατιστικές μέθοδοι: 97 λανθασμένοι συναγερμοί για κάθε αληθή Ανάλυση δεδομένων συμπεριφοράς με τεχνικές μηχανικής μάθησης μείωση της αναλογίας λανθασμένων συναγερμών στους 10 ανά αληθή ελάττωση περιστατικών απάτης από 1576 σε 478, σε δείγμα 7 ευρωπαϊκών τραπεζών 9
10 Case study: American Express VISA American Express Softmap Walmart Victoria Secret Πρόβλημα: Παροχή δανείου Ερωτηματολόγιο για σχετικές οικονομικές και προσωπικές πληροφορίες Αποδοχή / απόρριψη αίτησης δανειοδότησης Συνήθεις στατιστικές τεχνικές καλύπτουν αποτελεσματικά το 90% των περιπτώσεων Οι υπόλοιπες ασαφείς περιπτώσεις αξιολογούνται από ειδικούς Ωστόσο το 50% των αποδεκτών ασαφών περιπτώσεων δεν αποπληρώνουν 1000 παραδείγματα εκπαίδευσης ασαφών περιπτώσεων 20 χαρακτηριστικά (ηλικία, οικογενειακή κατάσταση, διάρκεια εργασίας υπό τον ίδιο εργοδότη, άλλα δάνεια ) Οι κανόνες που προέκυψαν αποδείχθηκαν σωστοί στο 70% των περιπτώσεων 10
11 Case study: Softmap VISA American Express Softmap Walmart Victoria Secret Κορυφαία εταιρεία πωλήσεων PC & software στην Ιαπωνία Οι on line πωλήσεις εμφάνισαν συνεχή μείωση Αδυναμία προσαρμογής στις ειδικές ανάγκες του πελάτη; Ανάλυση χαρακτηριστικών 2 εκ. παλαιών πελατών & ανάπτυξη διαδικτυακού συστήματος υποβολής πρότασης μετά από ερωτηματολόγιο αύξηση επισκεψιμότητας ιστοσελίδας 67% τριπλασιασμός εσόδων ιστοσελίδας το έτος εισαγωγής του συστήματος 11
12 Case study: Walmart VISA American Express Softmap Walmart Victoria Secret Τεράστια βάση δεδομένων αγοραστικής συμπεριφοράς Η ανάλυση με μεθόδους μηχανικής μάθησης ανέδειξε συμπεράσματα της μορφής Οι πελάτες που αγοράζουν μπύρα συχνά προμηθεύονται και πίτσα Κάθε Πέμπτη, οι πελάτες που αγοράζουν μπύρα αγοράζουν επίσης πάνες Τέτοιες πληροφορίες έχουν δυνητικά μεγάλη προστιθέμενη αξία Αναδιάταξη προϊόντων, Διαχείριση αποθεμάτων Συνήθης εφαρμογή: Τα δεδομένα που αποκτώνται μέσω προσωπικών εκπτωτικών καρτών είναι συχνά μεγαλύτερης αξίας από την παρεχόμενη έκπτωση 12
13 Case study: Victoria Secret VISA American Express Softmap Walmart Victoria Secret Direct Marketing: Oι προσφορές προώθησης προϊόντος είναι συχνά κοστοβόρες και έχουν ένα πολύ χαμηλό αλλά ιδιαίτερα προσοδοφόρο ποσοστό απόκρισης Victoria Secret: φθίνουσα πορεία εσόδων από ταχυδρομική αποστολή καταλόγου Μετά από την ανάλυση δημογραφικών δεδομένων των πελατών της, η στόχευση εστιάστηκε σε διαφοροποιημένο υποσύνολο πελατών και προϊόντων Η πορεία των εσόδων αντιστράφηκε, ενώ παράλληλα το κόστος αποστολής μειώθηκε κατά 15% 13
14 Η μορφή των δεδομένων και η σημασία της Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Δεδομένα input Αλγόριθμοι Εξόρυξης Πληροφορίας Εξαγόμενα output Η κατανόηση της μορφής των δεδομένων και εξαγόμενων είναι ίσως περισσότερο σημαντική από τα ενδιάμεσα βήματα σε έναν αλγόριθμο εξόρυξης πληροφορίας 14
15 Συνιστώσες, Ορολογία Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Αντίληψη (concept): το αντικείμενο της μάθησης Στόχος: εύρεση κατανοητής και λειτουργικής περιγραφής ενός concept Υπόδειγμα (instance): το ξεχωριστό και ανεξάρτητο παράδειγμα (example) ενός concept Σημείωση: Περισσότερο σύνθετα σχήματα εισόδου είναι πιθανά Χαρακτηριστικό (attribute): η μετρήσιμη συνιστώσα ενός υποδείγματος Θα εστιάσουμε σε ονομαστικές και αριθμητικές συνιστώσες 15
16 Συνιστώσες, Παράδειγμα attributes Outlook Sunny Temperature 85 Humidity 85 Windy False Play No Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό instances Sunny Overcast Rainy True False False No Yes Yes Προπαρασκευή concept description: If outlook = sunny and humidity = high then play = no 16
17 Concept (Αντίληψη) Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Είδη μάθησης: Ταξινόμηση (classification): πρόβλεψη διακριτής κατηγορίας Συσχέτιση (association): εντοπισμός συσχετίσεων μεταξύ χαρακτηριστικών Ομαδοποίηση (clustering): ανάδειξη ομάδων όμοιων υποδειγμάτων Αριθμητική πρόβλεψη (numeric prediction): πρόβλεψη αριθμητικής ποσότητας Concept (αντίληψη): το αντικείμενο της μάθησης Περιγραφή αντίληψης (concept description): το προϊόν / σχήμα της μαθησιακής διαδικασίας 17
18 Ταξινόμηση (Classification) Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Ταξινόμηση υποδείγματος σε προκαθορισμένη τάξη (class) Για παράδειγμα: play/no play Μάθηση με επίβλεψη (supervised) Οι ομάδες ταξινόμησης είναι εκ των προτέρων γνωστές Το πραγματικό αποτέλεσμα κάθε υποδείγματος είναι επίσης γνωστό Ο βαθμός αξιοπιστίας μετριέται σε μη χρησιμοποιημένα για τη διαμόρφωση του concept description δεδομένα (test data) είτε υποκειμενικά, ανάλογα με το βαθμό αποδοχής της περιγραφής 18
19 Συσχέτιση (Association) Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Ανακάλυψη συσχετίσεων μεταξύ των διάφορων χαρακτηριστικών Διαφορές με τη μάθηση ταξινόμησης: Μπορεί να αναδείξουν τη συσχέτιση είτε να προβλέψουν την τιμή οποιουδήποτε χαρακτηριστικού και όχι μόνο της τάξης Συνδέουν πιθανόν περισσότερα από ένα χαρακτηριστικά κάθε φορά Επομένως, προκύπτουν πολλοί περισσότεροι κανόνες συσχέτισης από ότι κανόνες ταξινόμησης Άρα περιορισμοί κατά την αναζήτηση είναι αναγκαίοι, όπως ελάχιστη κάλυψη & ελάχιστη ακρίβεια 19
20 Ομαδοποίηση (Clustering) Εύρεση ομάδων αντικειμένων με υψηλό βαθμό ομοιότητας και εκχώρηση υποδειγμάτων στις ομάδες αυτές Χωρίς επίβλεψη (unsupervised) η τάξη του υποδείγματος δεν ανήκει σε γνωστό σύνολο Iris virginica Iris virginica Iris versicolor Iris versicolor Iris setosa Iris setosa Type Petal width Petal length Sepal width Sepal length 20 Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή
21 Αριθμητική πρόβλεψη (Numeric prediction) Όμοια με ταξινόμηση, αλλά τώρα η τάξη είναι αριθμητική Μάθηση με επίβλεψη (supervised) Η τιμή στόχος κάθε υποδείγματος είναι εκ των προτέρων γνωστή 40 False Normal Mild Rainy 55 False High Hot Overcast 0 True High Hot Sunny 5 False High Hot Sunny Play time Windy Humidity Temperature Outlook 21 Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή
22 Παράδειγμα (example) Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Υπόδειγμα (instance): ειδικός τύπος παραδείγματος Προς ταξινόμηση, συσχέτιση ή ομαδοποίηση Ιδιαίτερο & ανεξάρτητο παράδειγμα της αντίληψης προς εκμάθηση Χαρακτηρίζεται από προκαθορισμένο σύνολο χαρακτηριστικών Συνήθης μορφή δεδομένων προς εξόρυξη γνώσης: σύνολο υποδειγμάτων (dataset) Πίνακας υποδειγμάτων (instances) χαρακτηριστικών (attributes) (επίπεδο αρχείο, flat file) Μάλλον περιοριστική μορφή δεδομένων (καμία συσχέτιση μεταξύ των αντικειμένων) 22
23 Χαρακτηριστικό (attribute) Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Κάθε παράδειγμα αποτελείται από προκαθορισμένο σύνολο στοιχείων, τα οποία καλούνται χαρακτηριστικά (attributes) Στην πράξη, ο αριθμός των χαρακτηριστικών μπορεί να ποικίλει Επίσης, η ύπαρξη ενός χαρακτηριστικού μπορεί να εξαρτάται από την τιμή ενός άλλου Πιθανοί τύποι χαρακτηριστικών ( levels of measurement ): Ονομαστικά (nominal), τακτικά (ordinal), περιοδικά (interval) και αναλογικά (ratio) 23
24 Προπαρασκευή δεδομένων εισόδου Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Πρόβλημα01: διαφορετικές πηγές δεδομένων (για παράδειγμα, σε μία επιχείρηση, εγγραφές τμήματος πωλήσεων, λογιστηρίου, ) Διαφορές: τρόπος αποθήκευσης εγγραφών, παραδοχές, χρονικές περίοδοι, άθροιση δεδομένων, σφάλματα Τα δεδομένα πρέπει να συγκεντρωθούν σε ενιαίο σύνολο, με ενιαία λιτή δομή data warehouse: συνεπές σημείο πρόσβασης Κρίσιμος παράγοντας: τύπος και επίπεδο άθροισης δεδομένων Για παράδειγμα δεδομένα ανά συναλλαγή, ανά πελάτη, ανά ημέρα κτλ. Πρόβλημα02: ανακριβείς τιμές Πρόβλημα03: άγνωστες τιμές 24
25 Εξερεύνηση των δεδομένων Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Ορισμένα απλά εργαλεία οπτικοποίησης είναι πολύ χρήσιμα Ονομαστικά χαρακτηριστικά: ιστογράμματα (είναι η κατανομή συμβατή με τη γνώση πεδίου;) Αριθμητικά χαρακτηριστικά: γραφήματα (υπάρχουν εμφανείς τιμές προς εξαίρεση (outliers);) Διαγράμματα 2 & 3 διαστάσεων υποδεικνύουν εξαρτήσεις & αλληλοσυσχετίσεις Αναγκαία η γνώση των ειδικών Αχανής όγκος δεδομένων; Δειγματοληψία! 25
26 Προεπεξεργασία δεδομένων Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Ο μετασχηματισμός των δεδομένων σε μορφή κατάλληλη και αποδοτική για την επιλεγμένη μέθοδο μάθησης Σύνολο τεχνασμάτων που εφαρμόζονται με κύριο στόχο την αύξηση του βαθμού αξιοπιστίας Κάποιες φορές λειτουργούν, κάποιες όχι, και, μέχρι σήμερα, είναι δύσκολο να γνωρίζει κανείς εκ των προτέρων την αποτελεσματικότητά τους Καθώς ο πλέον αξιόπιστος οδηγός είναι η μέθοδος δοκιμής & σφάλματος ( trial & error ), η γνώση και κατανόηση των τεχνασμάτων αυτών είναι εξαιρετικά σημαντική 26
27 Τεχνοτροπίες προεπεξεργασίας δεδομένων Ορολογία Αντίληψη & είδη της Παράδειγμα Χαρακτηριστικό Προπαρασκευή Προεπιλογή χαρακτηριστικών (attributes) Κατά κανόνα, τα περισσότερα χαρακτηριστικά συχνά η συντριπτική πλειοψηφία τους είναι ευκρινώς μη συσχετιζόμενα ή περιττά αποκοπή Διακριτοποίηση χαρακτηριστικών Αναγκαία όταν κάποια χαρακτηριστικά είναι αριθμητικά αλλά ο επιλεγμένος αλγόριθμος μπορεί να χειριστεί μόνο ρητά (categorical) χαρακτηριστικά Μετασχηματισμός δεδομένων Μαθηματικοί μετασχηματισμοί, βασισμένοι στη γνώση πεδίου, λογικοί μετασχηματισμοί, αλλαγή δομής / μορφής δεδομένων Καθαρισμός δεδομένων Οπτικοποίηση και αυτοματοποιημένες μέθοδοι 27
28 Η μορφή των εξαγόμενων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης Πληροφορίας Εξαγόμενα output Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες Οι τεχνικές Μηχανικής Μάθησης παρέχουν διάφορες δομικές περιγραφές των εξαγόμενων Καθεμία από αυτές υπαγορεύει το είδος του αλγορίθμου που πρέπει να χρησιμοποιηθεί για το σχηματισμό της από τα δεδομένα 28
29 Εξαγόμενα: Απεικόνιση γνώσης Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες Πίνακες απόφασης (decision tables) Δένδρα απόφασης (decision trees) Κανόνες απόφασης (decision rules) Κανόνες συσχέτισης (association rules) Κανόνες με εξαιρέσεις (rules with exceptions) Κανόνες με συσχετίσεις (rules involving relations) Γραμμική παλινδρόμηση (linear regression) Δένδρα για αριθμητική πρόβλεψη (trees for numeric prediction) Απεικόνιση με βάση υποδείγματα (instance based representation) Ομάδες (clusters) 29
30 Decision tables Outlook Humidity Play Sunny Sunny High Normal No Yes Εξαγόμενων Πίνακες Overcast Overcast High Normal Yes Yes Δένδρα Κανόνες Παλινδρόμηση Ομάδες Rainy Rainy High Normal No No 30
31 Decision trees Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες 31
32 Classification rules Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες If outlook = sunny and humidity > 83 then play = no If outlook = rainy and windy = true then play = no If outlook = overcast then play = yes If humidity < 85 then play = yes If none of the above then play = yes 32
33 Association rules Εξαγόμενων Πίνακες Δένδρα Κανόνες If temperature = cool then humidity = normal If windy = false and play = no then outlook = sunny and humidity = high Συσχετίζουν τις τιμές των διάφορων attributes μεταξύ τους Παλινδρόμηση Ομάδες 33
34 Regression tree Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες 34
35 Instance based representation Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες 35
36 Clustering Εξαγόμενων Πίνακες Δένδρα Κανόνες Παλινδρόμηση Ομάδες 36
37 Αποτίμηση: το κλειδί της επιτυχίας Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Πλήθος μεθόδων εξαγωγής δομικών περιγραφών από δεδομένα Ποιες είναι οι βέλτιστες για συγκεκριμένο πρόβλημα; Απαιτείται συστηματική προσέγγιση για την αποτίμηση και τη σύγκριση αποδοτικότητας των περιγραφών αυτών Αναφέρεται ρητά ότι το σφάλμα στα δεδομένα εκπαίδευσης δεν αποτελεί αξιόπιστο δείκτη απόδοσης σε μελλοντικά δεδομένα Λύση: διάσπαση των δεδομένων σε σύνολο εκπαίδευσης (training set) και σύνολο ελέγχου (test set) Απαιτείται μεγάλος όγκος (ταξινομημένων) δεδομένων Ωστόσο, ο όγκος των δεδομένων είναι συνήθως περιορισμένος Αναγκαία η χρήση περισσότερο εκλεπτυσμένων τεχνικών 37
38 Εκπαίδευση & έλεγχος Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Μέτρο απόδοσης σε προβλήματα ταξινόμησης: τιμή σφάλματος (error rate) Επιτυχία (success): σωστή πρόβλεψη της τάξης του υποδείγματος Σφάλμα (error): λανθασμένη πρόβλεψη της τάξης του υποδείγματος Τιμή σφάλματος (error rate): αναλογία σφαλμάτων στο σύνολο των υποδειγμάτων Ωστόσο, ενδιαφέρει η πιθανή μελλοντική απόδοση σε νέα παραδείγματα και όχι η απόδοση στα ήδη δεδομένα υποδείγματα εκπαίδευσης Αποτελεί η τιμή σφάλματος σε ήδη γνωστά δεδομένα αξιόπιστη ένδειξη της τιμής σφάλματος σε νέα δεδομένα; 38
39 Εκπαίδευση & έλεγχος Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Η απάντηση συνιστά ένα ηχηρό ΟΧΙ στην περίπτωση που τα παλαιά αυτά δεδομένα έχουν χρησιμοποιηθεί στη διαμόρφωση του μοντέλου κατά τη διαδικασία εκπαίδευσης Καθώς η δομική περιγραφή έχει σχεδιαστεί με τρόπο ώστε να ελαχιστοποιεί το συγκεκριμένο σφάλμα, οποιαδήποτε εκτίμηση της αποδοτικότητάς της βασισμένη στα υποδείγματα αυτά αποτελεί αισιόδοξη, αν όχι ανέλπιστα αισιόδοξη εκτίμηση 39
40 Κριτήρια επιλογής μοντέλου Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Αποπειρώνται να επιτύχουν θετικό συμβιβασμό μεταξύ: Της πολυπλοκότητας του μοντέλου Της ακρίβειας των προβλέψεών του στα δεδομένα εκπαίδευσης Συλλογιστική: άρτιο θεωρείται το μοντέλο που αφενός είναι απλό και αφετέρου επιτυγχάνει υψηλή ακρίβεια στα διαθέσιμα δεδομένα Επίσης γνωστή και ως Ξυράφι του Όκκαμ (Occam s Razor): βέλτιστη είναι η μικρότερη θεωρία που περιγράφει όλες τις πληροφορίες Κατά τον Αλβέρτο Αϊνστάιν: Everything should be made as simple as possible, but no simpler. 40
41 Κομψότητα vs. σφάλμα Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Θεωρία Α: πολύ απλή, κομψή θεωρία που περιγράφει τα δεδομένα με σχεδόν απόλυτο τρόπο Θεωρία Β: σημαντικά περισσότερο πολύπλοκη θεωρία που περιγράφει τα δεδομένα χωρίς λάθη Η Θεωρία Α είναι προφανώς προτιμώμενη Κλασσικό παράδειγμα: οι τρεις νόμοι του Κέπλερ για την κίνηση των πλανητών Λιγότερο ακριβείς από την τελευταία βελτίωση του Κοπέρνικου στη θεωρία των επικύκλων του Πτολεμαίου 41
42 Πρώτα τα βασικά Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Πολύ συχνά, απλοί κανόνες επιτυγχάνουν μη αναμενόμενα υψηλή ακρίβεια Αίτιο η απλοϊκή δομή που συχνά υποβόσκει πίσω από πραγματικά σύνολα δεδομένων Σε κάθε περίπτωση, συνίσταται αρχικά ο πειραματισμός με τις πλέον απλές των μεθόδων The KISS principle: Keep It Simple, Stupid! 42
43 Μετα μαθησιακά σχήματα Αποτίμηση Εκπαίδευση Επιλογή Πρώτα τα βασικά Μετααλγόριθμοι Θεμελιώδης ιδέα: κατασκευή πολλών εμπειρογνωμόνων ( experts ), ανάδειξη πλειοψηφούσας γνώμης εμπειρογνώμονας : ένα μοντέλο που δημιουργήθηκε με τεχνικές μηχανική μάθησης Πλεονέκτημα: Συχνά βελτιώνει σημαντικά την προβλεπτική ικανότητα Μειονέκτημα: Τα εξαγόμενα είναι πολύ δύσκολο να αναλυθούν Σχήματα: Εμφωλίαση (bagging) Ενδυνάμωση (boosting) Συσσώρευση (stacking) Κώδικες διόρθωσης σφαλμάτων εξόδου (error correcting output codes) 43
44 Βιβλίο Βιβλίο WEKA.arff.xls σε.arff Data Mining, Practical Machine Learning Tools and Techniques, Witten & Frank, Morgan Kaufmann, Ιούνιος
45 Λογισμικό Βιβλίο WEKA.arff.xls σε.arff WEKA: Waikato Environment for Knowledge Analysis 45
46 Η τυποποίηση.arff Βιβλίο WEKA.arff.xls σε.arff % % ARFF file for weather data with some numeric features outlook {sunny, overcast, temperature humidity windy {true, play? {yes, sunny, 85, 85, false, no sunny, 80, 90, true, no overcast, 83, 86, false, yes... 46
47 Μετατροπή.xls σε.arff Βιβλίο WEKA.arff.xls σε.arff Έστω πίνακας σε αρχείο.xls Save as save as type name.csv Open name.csv με.txt editor, για παράδειγμα notepad Πρόσθεσε το όνομα του dataset τις πληροφορίες των χαρακτηριστικών μία σειρά για κάθε χαρακτηριστικό) και τη Save as type: all files & filename: dataset.arff 47
48 Επίδειξη Τρίτη 17 Ιουλίου, 35 C, 49 διαφάνειες μετά: Στην πράξη; Πώς τα εφαρμόζω όλα αυτά; 48
49 Τέλος 49
ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση
ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση Η μορφή των δεδομένων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης
Διαβάστε περισσότεραΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ
ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008
Διαβάστε περισσότερα«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα
«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο
Διαβάστε περισσότερα«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός
Διαβάστε περισσότεραΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη01Εισαγωγή
ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη01Εισαγωγή Η πληροφορία είναι ζωτική Τεχνητή Γονιμοποίηση Συλλογή ωαρίων Γονιμοποίηση με σπέρμα συντρόφου ή δότη Παράγονται
Διαβάστε περισσότεραΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ
ΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ Το dataset weather περιέχει 4 μεταβλητές (outlook, temperature, humidity, windy) και 14 καταχωρήσεις για το καθένα από αυτά. Με βάση αυτές εξετάζεται το γεγονός
Διαβάστε περισσότεραΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M. 09470015 AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διδάσκων: Γιώργος Τζιραλής ΔΠΜΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Στάδιο 1 ο. Προεπισκόπηση-προεπεξεργασία δεδομένων: Δίδονται τα παρακάτω
Διαβάστε περισσότεραΕξόρυξη Γνώσης από Βιολογικά εδομένα
Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά
Διαβάστε περισσότεραΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των
Διαβάστε περισσότεραΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο
Διαβάστε περισσότεραΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά
ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά Μάιος 2008 Τα δεδομένα που έχουμε προς επεξεργασία χωρίζονται σε τρία μέρη: 1. Τα δεδομένα εκπαίδευσης (training set) που αποτελούνται από 2528
Διαβάστε περισσότεραΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση
ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση Η μορφή των εξαγομένων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης
Διαβάστε περισσότεραΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ
Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:
Διαβάστε περισσότεραΑνακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα
6ο Πανελλήνιο Συνέδριο των Εκπαιδευτικών για τις ΤΠΕ «Αξιοποίηση των Τεχνολογιών της Πληροφορίας και της Επικοινωνίας στη Διδακτική Πράξη» Σύρος 6-8 Μαϊου 2011 Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά
Διαβάστε περισσότεραΚεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.
Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε
Διαβάστε περισσότεραΚατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική
Κατηγοριοποίηση Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης 2 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Μηχανική Μάθηση Η μηχανική μάθηση είναι μια περιοχή της τεχνητής νοημοσύνης η οποία αφορά
Διαβάστε περισσότεραΕξόρυξη Γνώσης - το εργαλείο WEKA
Εξόρυξη Γνώσης - το εργαλείο WEKA Οµάδα ιαχείρισης εδοµένων, Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιώς (http:// http://isl.cs.unipi.gr/) Κοτσιφάκος Ευάγγελος ek@unipi.gr Νοέµβριος 2008 Ανακάλυψη και Εξόρυξη
Διαβάστε περισσότεραΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική
ΕΕΟ 11 Η χρήση στατιστικών εργαλείων στην εκτιμητική 1. Εισαγωγή 2. Προϋποθέσεις χρήσης των Αυτοματοποιημένων Εκτιμητικών Μοντέλων (ΑΕΜ) 3. Περιορισμοί στη χρήση των ΑΕΜ εφόσον έχουν πληρωθεί οι προϋποθέσεις
Διαβάστε περισσότεραΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:
Διαβάστε περισσότεραΙ. Preprocessing (Επεξεργασία train.arff):
Ονοματεπώνυμο: Κατερίνα Αργύρη Δ.Π.Μ.Σ: Εφαρμοσμένες Μαθηματικές Επιστήμες Ακαδ. Έτος: 2008-2009 1 Για την παρούσα εργασία διατίθενται τρία σύνολα δεδομένων: Δεδομένα Εκπαίδευσης (train set αρχείο train.arff):
Διαβάστε περισσότεραΤεχνικές Εξόρυξης Δεδομένων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:
Διαβάστε περισσότεραΕυφυής Προγραμματισμός
Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων
Διαβάστε περισσότεραΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ
DATA MINING ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ 1 ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Αφού δεν γνωρίζουμε κάποιο τρόπο για να επιλέξουμε εκ των προτέρων την πιο κατάλληλη και αποδοτική μέθοδο μάθησης
Διαβάστε περισσότεραΈρευνα Μάρκετινγκ Ενότητα 5
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative
Διαβάστε περισσότεραΑνάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.
Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.
Διαβάστε περισσότεραΜεθοδολογίες Αξιοποίησης Δεδομένων
Μεθοδολογίες Αξιοποίησης Δεδομένων Βλάχος Σ. Ιωάννης Λέκτορας 407/80, Ιατρικής Σχολής Πανεπιστημίου Αθηνών Εργαστήριο Πειραματικής Χειρουργικής και Χειρουργικής Ερεύνης «Ν.Σ. Σ Χρηστέας» Στάδια Αξιοποίησης
Διαβάστε περισσότεραΤι είναι πληροφοριακό σύστημα
Τι είναι πληροφοριακό σύστημα Ένας ορισμός είναι ότι ένα πληροφοριακό σύστημα είναι ένα σύνολο αλληλοσυνδεόμενων μερών που συνεργάζονται για τη συλλογή, επεξεργασία, αποθήκευση και διάχυση πληροφοριών
Διαβάστε περισσότεραΑναγνώριση Προτύπων Ι
Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται
Διαβάστε περισσότεραΕνότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )
ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και
Διαβάστε περισσότεραΑποθήκες και Εξόρυξη Δεδομένων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 1 Ο Εργαστήριο Εισαγωγή στο WEKA (Preprocessing Select Attributes) Στουγιάννου Ελευθερία estoug@unipi.gr -2- ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή
Διαβάστε περισσότεραΠληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού
Πληροφοριακά Συστήματα Διοίκησης Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού Σημασία μοντέλου Το μοντέλο δημιουργεί μια λογική δομή μέσω της οποίας αποκτούμε μια χρήσιμη άποψη
Διαβάστε περισσότεραΣυστήματα Πληροφοριών Διοίκησης
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Συστήματα Πληροφοριών Διοίκησης Ενότητα 2: Γενική θεώρηση και κατάταξη συστημάτων πληροφοριών διοίκησης Διονύσιος Γιαννακόπουλος, Καθηγητής Τμήμα
Διαβάστε περισσότεραΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση
ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης
Διαβάστε περισσότερα8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ
8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Στόχος του εργαστηρίου αυτού είναι να δείξει πώς τα εργαστήρια με τα δεδομένα της ICAP μπορούν να υλοποιηθούν χωρίς τη χρήση SQL Server, χρησιμοποιώντας μόνον Excel και Rapid
Διαβάστε περισσότεραData Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής
Data Mining: Στοχεύοντας στους σωστούς πελάτες To CRM front-office πελατών Οι Προμηθευτές Οι Πελάτες ΟΟργανισμός Τροφοδότηση ενεργειών Μάρκετινγκ ΒΙ Απόταδεδομέναστηγνώση Επιχειρηματική Γνώση Επιχειρηματικοί
Διαβάστε περισσότεραΔιακριτικές Συναρτήσεις
Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New
Διαβάστε περισσότεραΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος
Διαβάστε περισσότεραΠεριεχόμενα. Πρόλογος... 15
Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...
Διαβάστε περισσότεραΑ. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα
Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων Παράδειγμα Μας δίνονται τα παρακάτω δεδομένα που αντιπροσωπεύουν τις τιμές πίεσης σε ατμόσφαιρες
Διαβάστε περισσότεραιατµηµατικό Μεταπτυχιακό Πρόγραµµα Σπουδών ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ιατµηµατικό Μεταπτυχιακό Πρόγραµµα Σπουδών ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Τελική Εργασία στο µάθηµα Αλγόριθµοι Εξόρυξης
Διαβάστε περισσότεραΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ ΔΕΔΟΜΕΝΑ ΔΕΔΟΜΕΝΑ ΠΛΗΡΟΦΟΡΙΑ ΑΡΙΘΜΟΙ ΣΥΜΒΟΛΑ - ΛΕΞΕΙΣ ΟΠΟΙΑΔΗΠΟΤΕ ΔΡΑΣΤΗΡΙΟΤΗΤΑ ΣΥΜΒΑΙΝΕΙ ΣΕ ΜΙΑ ΟΙΚΟΝΟΜΙΚΗ ΜΟΝΑΔΑ ΠΡΕΠΕΙ ΝΑ ΜΕΤΡΕΙΤΑΙ ΚΑΙ ΝΑ ΚΑΤΑΓΡΑΦΕΤΑΙ ΟΡΓΑΝΩΣΗ ΚΑΤΑΓΡΑΦΗΣ
Διαβάστε περισσότεραΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι
ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα
Διαβάστε περισσότεραΤεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας
Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.
Διαβάστε περισσότεραΔιπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»
Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία
Διαβάστε περισσότεραΠροεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη
Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης
Διαβάστε περισσότεραΕξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής
Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Τεχνολογίες Υποστήριξης Λήψης Διοικητικών Αποφάσεων OLTP (On Line Transaction Processing) Επιχειρηματικές Εφαρμογές (Σχεσιακές
Διαβάστε περισσότεραΜέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων
Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση
Διαβάστε περισσότεραΔέντρα Απόφασης (Decision(
Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα
Διαβάστε περισσότεραΕξόρυξη Γνώσης από Δεδομένα
Εξόρυξη Γνώσης από Δεδομένα Το εργαλείο WEKA Ομάδα ιαχείρισης εδομένων,, Τμήμα Πληροφορικής, Πανεπιστήμιο Πειραιώς http://infolab.cs.unipi.gr έσποινα Κοπανάκη (dkopanak@unipi.gr) Νοέμβριος 2009 Τα δεδομένα
Διαβάστε περισσότεραsquared error, Mean absolute error, Root mean squared error) µεγάλωσαν,
ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣ ΣΤΙΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΈΤΟΣ 2009 ΌΝΟΜΑ : ΚΑΤΣΑΒΡΙΑΣ ΕΥΑΓΓΕΛΟΣ Α.Μ. : 09480014 ΕΞΑΜΗΝΟ
Διαβάστε περισσότεραΕισαγωγή στα Πληροφοριακά Συστήματα
Εισαγωγή στα Πληροφοριακά Συστήματα Ενότητα 3: Η έννοια της ΠΛΗΡΟΦΟΡΙΑΣ - INFORMATION Κωνσταντίνος Ταραμπάνης Τμήμα Οργάνωσης & Διοίκησης Επιχειρήσεων ΕΙΣΑΓΩΓΗ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κωνσταντίνος Ταραμπάνης
Διαβάστε περισσότεραΒιοστατιστική ΒΙΟ-309
Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2013-2014 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητή: ένα χαρακτηριστικό ή ιδιότητα που μπορεί να πάρει διαφορετικές τιμές
Διαβάστε περισσότεραΕισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της
Διαβάστε περισσότεραΔιδάσκουσα: Χάλκου Χαρά,
Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών
Διαβάστε περισσότεραΣχεδίαση της Διεπαφής Ανθρώπου-Υπολογιστή
Ενότητα 8 Σχεδίαση της Διεπαφής Ανθρώπου-Υπολογιστή Πληροφοριακά Συστήματα Διοίκησης ΙI Νίκος Καρακαπιλίδης 8-1 Μαθησιακοί στόχοι Κατανόηση της διαδικασίας σχεδίασης διεπαφών ανθρώπου-υπολογιστή Εξοικείωση
Διαβάστε περισσότεραΣυνοπτικά περιεχόμενα
b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141
Διαβάστε περισσότεραΜια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με στόχο τη διαδικασία υποστήριξης λήψης αποφάσεων -
Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) Ορισμοί Data Warehouse 1. 2. Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με
Διαβάστε περισσότεραΣτοιχεία εισηγητή Ημερομηνία: 10/10/2017
Θέμα μεταπτυχιακής διατριβής: Λογισμικά μελέτης και σχεδίασης ρομποτικών συστημάτων - συγκρτική μελέτη και εφαρμογές. 1) Μελέτη των δημοφιλών λογισμικών σχεδίασης ρομποτικών συστημάτων VREP και ROS. 2)
Διαβάστε περισσότεραΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ
ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ Αστική Μη Κερδοσκοπική Εταιρεία- ISO 9001 Σαπφούς 3, 81100 Μυτιλήνη (1ος Όροφος) 2251054739 (09:00-14:30) academy@aigaion.org civilacademy.ucoz.org «ΠΡΟΓΡΑΜΜΑ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ
Διαβάστε περισσότεραΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών
44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.
Διαβάστε περισσότεραΑποθήκες και Εξόρυξη Δεδομένων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 2 Ο Εργαστήριο WEKA (CLASSIFICATION) Στουγιάννου Ελευθερία estoug@unipi.gr -2- Κατηγοριοποίηση Αποτελεί μια από τις βασικές
Διαβάστε περισσότεραΕισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων
Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί
Διαβάστε περισσότεραΠΡΟΛΟΓΟΣ ΕΛΛΗΝΙΚΗΣ ΕΚΔΟΣΗΣ... 15 ΕΙΣΑΓΩΓΗ... 17
ΠΡΟΛΟΓΟΣ ΕΛΛΗΝΙΚΗΣ ΕΚΔΟΣΗΣ... 15 ΕΙΣΑΓΩΓΗ... 17 1. ΟΡΓΑΝΩΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΠΟΤΕΛΕΣΜΑΤΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΜΕΙΩΣΗΣ ΚΟΣΤΟΥΣ... 19 Τι μπορεί να κάνει η Διοίκηση για τη μείωση του κόστους... 19 Ο συντονιστής
Διαβάστε περισσότεραΤεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.
Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των
Διαβάστε περισσότεραΗ συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός
Η συνολική εικόνα Τοπικές Βάσεις Βάσεις Κεντρικών Συστημάτων Βάσεις Τρίτων Ποιοτική Αναβάθμιση δεδομένων Λογισμικό Επικοινωνιών DATA WAREHOUSE Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Warehouse
Διαβάστε περισσότεραΤεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.
Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και
Διαβάστε περισσότεραΑποθήκες εδομένων και Εξόρυξη εδομένων:
Αποθήκες εδομένων και Εξόρυξη εδομένων: Κατηγοριοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν
Διαβάστε περισσότεραΑρχιτεκτονική Λογισμικού
Αρχιτεκτονική Λογισμικού περιεχόμενα παρουσίασης Τι είναι η αρχιτεκτονική λογισμικού Αρχιτεκτονική και απαιτήσεις Σενάρια ποιότητας Βήματα αρχιτεκτονικής σχεδίασης Αρχιτεκτονικά πρότυπα Διαστρωματωμένη
Διαβάστε περισσότεραΕλεγχος, Αξιοπιστία και Διασφάλιση Ποιότητας Λογισµικού Πολυπλοκότητα
Ελεγχος, Αξιοπιστία και Διασφάλιση Ποιότητας Λογισµικού Πολυπλοκότητα Τµήµα Διοίκησης Επιχειρήσεων Τει Δυτικής Ελλάδας Μεσολόγγι Δρ. Α. Στεφανή Διάλεξη 5 2 Εγκυροποίηση Λογισµικού Εγκυροποίηση Λογισµικού
Διαβάστε περισσότεραLOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης
Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός
Διαβάστε περισσότεραManaging Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business. e-mail: kyritsis@ist.edu.
Managing Information Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business e-mail: kyritsis@ist.edu.gr Διαχείριση Γνώσης Knowledge Management Learning Objectives Ποιοί
Διαβάστε περισσότεραΘεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας
A. Montgomery Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας Καρολίνα Δουλουγέρη, ΜSc Υποψ. Διαδάκτωρ Σήμερα Αναζήτηση βιβλιογραφίας Επιλογή μεθοδολογίας Ερευνητικός σχεδιασμός Εγκυρότητα και αξιοπιστία
Διαβάστε περισσότεραΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ
ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή
Διαβάστε περισσότεραΑλγόριθμοι Μηχανικής Μάθησης σε Πολυεπεξεργαστικά Περιβάλλοντα
Αλγόριθμοι Μηχανικής Μάθησης σε Πολυεπεξεργαστικά Περιβάλλοντα Στεργίου Κωνσταντίνος Α.Μ.496 Σχολή Θετικών Επιστημών - Τμήμα Μαθηματικών Μ.Π.Σ. Μαθηματικά και Σύγχρονες Εφαρμογές στα «Υπολογιστικά Μαθηματικά
Διαβάστε περισσότεραΕΠΛ 003.3: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Για οικονομολόγους
ΕΠΛ 003.3: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Για οικονομολόγους Στόχοι 1 Να εξετάσουμε γιατί η Πληροφορική είναι χρήσιμη στην οικονομική επιστήμη. Να μάθουμε πώς χρησιμοποιείται η Πληροφορική
Διαβάστε περισσότεραΠληροφοριακό Σύστημα Επιχειρηματικής Ευφυίας για την Oμαδοποίηση Πελατών Λιανικής
Πληροφοριακό Σύστημα Επιχειρηματικής Ευφυίας για την Oμαδοποίηση Πελατών Λιανικής Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Α Ρ Ι Σ Τ Ο Τ Ε Λ Ε Ι Ο Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Θ Ε Σ Σ Α Λ Ο Ν Ι Κ Η Σ Δομή Παρουσίασης
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη
Διαβάστε περισσότεραΜάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων
Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες
Διαβάστε περισσότεραΖητήματα ηήμ με τα δεδομένα
Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών
Διαβάστε περισσότεραΥπερπροσαρμογή (Overfitting) (1)
Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης
Διαβάστε περισσότεραΑποθήκες και Εξόρυξη Δεδομένων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 4 Ο Εργαστήριο WEKA (Association Rules) Στουγιάννου Ελευθερία estoug@unipi.gr -2- Κανόνες Συσχέτισης (Association Rules) Εύρεση
Διαβάστε περισσότεραΒιοστατιστική ΒΙΟ-309
Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό
Διαβάστε περισσότεραΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j
Πειραματικές Προσομοιώσεις ΚΕΦΑΛΑΙΟ 4 Όλες οι προσομοιώσεις έγιναν σε περιβάλλον Matlab. Για την υλοποίηση της μεθόδου ε-svm χρησιμοποιήθηκε το λογισμικό SVM-KM που αναπτύχθηκε στο Ecole d Ingenieur(e)s
Διαβάστε περισσότεραHMY 795: Αναγνώριση Προτύπων
HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.
Διαβάστε περισσότεραΜέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου
Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική
Διαβάστε περισσότεραΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης 1 ΕΙΣΑΓΩΓΗ (1) Ταξινόμηση ΠΣ ανάλογα με τις λειτουργίες που υποστηρίζουν: Συστήματα Επεξεργασίας Συναλλαγών ΣΕΣ (Transaction
Διαβάστε περισσότεραΕυφυής Προγραμματισμός
Ευφυής Προγραμματισμός Ενότητα 11: Δημιουργία Βάσεων Κανόνων Από Δεδομένα- Εξαγωγή Κανόνων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων Από Δεδομένα-
Διαβάστε περισσότεραΕΠΑΛΗΘΕΥΣΗ (VERIFICATION) ΚΑΙ ΕΓΚΥΡΟΠΟΙΗΣΗ (VALIDATION) ΒΚ
ΕΠΑΛΗΘΕΥΣΗ (VERIFICATION) ΚΑΙ ΕΓΚΥΡΟΠΟΙΗΣΗ (VALIDATION) ΒΚ Οι V&V αναφέρονται κυρίως τον έλεγχο λαθών (testing) ενός ΕΣΒΚ, δηλ. αν δίνονται σωστές λύσεις στα προβλήματα που διαπραγματεύεται. Αφορούν όμως
Διαβάστε περισσότεραΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING)
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) Των σπουδαστών Σκλαβενίτης Αργύρης (Α.Μ. 535) Στασινός
Διαβάστε περισσότεραΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams
ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς
Διαβάστε περισσότεραΑΝΑΛΥΣΗ ΠΡΟΤΙΜΗΣΕΩΝ ΓΙΑ ΤΗ ΧΡΗΣΗ ΣΥΣΤΗΜΑΤΟΣ ΕΝΟΙΚΙΑΖΟΜΕΝΩΝ ΠΟΔΗΛΑΤΩΝ ΣΤΟΝ ΔΗΜΟ ΑΘΗΝΑΙΩΝ
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών Τομέας Μεταφορών και Συγκοινωνιακής Υποδομής ΑΝΑΛΥΣΗ ΠΡΟΤΙΜΗΣΕΩΝ ΓΙΑ ΤΗ ΧΡΗΣΗ ΣΥΣΤΗΜΑΤΟΣ ΕΝΟΙΚΙΑΖΟΜΕΝΩΝ ΠΟΔΗΛΑΤΩΝ ΣΤΟΝ ΔΗΜΟ ΑΘΗΝΑΙΩΝ ΤΣΟΛΑΚΗ ΑΘΗΝΑ
Διαβάστε περισσότεραΤεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή
Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Ασάφεια (Fuzziness) Ποσοτικοποίηση της ποιοτικής πληροφορίας Οφείλεται κυρίως
Διαβάστε περισσότεραΣΥΜΠΕΡΙΦΟΡΑ ΚΑΤΑΝΑΛΩΤΗ
ΣΥΜΠΕΡΙΦΟΡΑ ΚΑΤΑΝΑΛΩΤΗ Δρ. Μάρκος Κουργιαντάκης Επίκουρος Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων ΤΕΙ Κρήτης Σύμβουλος Ηλεκτρονικού Επιχειρείν { mkourg@staff.teicrete.gr } Τμήμα Διοίκησης Επιχειρήσεων
Διαβάστε περισσότεραυποδείγματος για την αξιολόγηση αυτοκινήτων με τεχνικές Data Mining.»
ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΙΔΙΚΕΥΣΗΣ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Διπλωματική εργασία με θέμα: «Ανάπτυξη υποδείγματος για την αξιολόγηση αυτοκινήτων με
Διαβάστε περισσότεραΑποθήκες Δεδομένων και Εξόρυξη Δεδομένων
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 1: Εισαγωγή Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΕΠΛ 003.1: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Για διοικητικά στελέχη
ΕΠΛ 003.1: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Για διοικητικά στελέχη Στόχοι 1 Να εξετάσουμε γιατί η Πληροφορική είναι χρήσιμη στη διοίκηση επιχειρήσεων. Να μάθουμε πώς χρησιμοποιείται
Διαβάστε περισσότεραΕΠΙΔΡΩΝΤΕΣ ΠΑΡΑΓΟΝΤΕΣ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ ΜΑΡΚΕΤΙΝΓΚ
Η ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ ΜΑΡΚΕΤΙΝΓΚ Το Μάρκετινγκ αποτελεί μια βασική επιχειρηματική λειτουργία που έχει στόχο την ανάπτυξη, την οργάνωση και των έλεγχο ανταλλακτικών διαδικασιών μεταξύ της επιχείρησης και των
Διαβάστε περισσότεραΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ
ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ Δομή παρουσίασης Εισαγωγή Βασικές Έννοιες Σχετικές μελέτες Εφαρμογή Δεδομένων Συμπεράσματα Εισαγωγή Μελέτη και προσαρμογή των διάφορων
Διαβάστε περισσότεραΧαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος Η παρούσα εργασία έγινε στα πλαίσια της εκπόνησης της διπλωματικής διατριβής
Διαβάστε περισσότερα