Προοίμιο. Αντικειμενικοί Στόχοι

Σχετικά έγγραφα
ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΟΜΑΔΑ Λ. Αναστασίου Κωνσταντίνος Δεληγιάννη Ισαβέλλα Ζωγοπούλου Άννα Κουκάκης Γιώργος Σταθάκη Αρετιάννα

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

Αναλυτικό Πρόγραμμα Μαθηματικών

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ

Η διάρκεια πραγματοποίησης της ανοιχτής εκπαιδευτικής πρακτικής ήταν 2 διδακτικές ώρες

Ειδικής Υποδομής Υποχρεωτικό

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ GD2670

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Μαθήματα Ειδικής Υποδομής Υποχρεωτικά. Παραδόσεις 4. Βάσεις Δεδομένων Ι

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

3. Περιγράμματα Μαθημάτων Προγράμματος Σπουδών

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ. Τμήμα Μηχανικών Οικονομίας και Διοίκησης ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ ΓΕ0175 ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ 9

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Δομή του Προγράμματος Σπουδών

1.1 Εξόρυξη πληροφορίας: Ορισμός Τι μπορούν να μάθουν οι υπολογιστές 33 Τρεις θεωρήσεις για τις έννοιες 34 Καθοδηγούμενη εκμάθηση 36

Λογισμικό διδασκαλίας των μαθηματικών της Γ Τάξης Γυμνασίου

215 Μηχανικών Η/Υ και Πληροφορικής Πάτρας

Διδακτική Προγραμματισμού. Χαρίκλεια Τσαλαπάτα 20/2/2012

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Παραδόσεις 4. Δεν υφίστανται απαιτήσεις. Ελληνική/Αγγλική

Τμήμα Πληροφορικής & Τηλεπικοινωνιών Μεταπτυχιακό Πρόγραμμα Σπουδών Ακαδημαϊκό Έτος ΠΜΣ ΚΑΤΕΥΘΥΝΣΗ 6 η

ΑΝΑΚΟΙΝΩΣΗ. Ημερομηνίες Δηλώσεων Μαθημάτων Ανανέωσης εγγραφής

Πληροφορική (BSc & MSc)

Ειδικής Υποδομής Υποχρεωτικό

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Μαθήματα Ειδικής Υποδομής Υποχρεωτικά. Εργαστήριο 2 Παραδόσεις 3

Διδακτική της Πληροφορικής ΙΙ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Η έννοια της μεταβλητής και της λίστας με την βοήθεια του λογισμικού Scratch

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΣΗΣ-ΔΙΔΑΣΚΑΛΙΑΣ

Από τις διαλέξεις του μαθήματος του Α εξαμήνου σπουδών του Τμήματος. Κ. Παπαθεοδώρου, Αναπληρωτής Καθηγητής Οκτώβριος 2013

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ GD2680

Παραδείγματα Ερωτηματολογίων

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ. Τμήμα Μηχανικών Οικονομίας και Διοίκησης ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ ΓΕ0176 ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ 9.

Οδηγίες για αξιολόγηση στο πλαίσιο ομότιμης συνεργατικής μάθησης

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Σχολιάστε αν τα εκπαιδευτικά αντικείμενα (όπως: φύλλα διδασκαλίας, εργασίας. και αξιολόγησης μαθητών και υποστηρικτικό υλικό) καλύπτουν τους

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Τίτλος Πακέτου Certified Computer Expert-ACTA

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΜΟΝΑΔΑ ΔΙΑΣΦΑΛΙΣΗΣ ΤΗΣ ΠΟΙΟΤΗΤΑΣ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΤΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ «ΜΟ.ΔΙ.Π. ΤΟΥ Γ.Π.Α.

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Πίνακας Μαθησιακών Αποτελεσμάτων

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΕΠΙΜΟΡΦΩΤΙΚΗ ΗΜΕΡΙΔΑ «Η ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ ΣΥΜΦΩΝΑ ΜΕ ΤΑ ΝΕΑ ΠΡΟΓΡΑΜΜΑΤΑ ΣΠΟΥΔΩΝ»

ΠΛΑΤΦΟΡΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΒΙΝΤΕΟΔΙΑΛΕΞΕΩΝ ΔΗΛΟΣ delos.uoa.gr. Εγχειρίδιο Χρήσης Μελών ΔΕΠ

723 Τεχνολογίας Πληροφορικής και Τηλεπικοινωνιών ΤΕΙ Λάρισας

Προσφερόμενα Διπλώματα (Προσφερόμενοι Τίτλοι)

Eκπαίδευση Εκπαιδευτών Ενηλίκων & Δία Βίου Μάθηση

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ GD2520

Εισαγωγή στις δομές δεδομένων Στοίβα και Ουρά με τη βοήθεια του Scratch

Μάθημα: Διδακτική της Πληροφορικής. Περιγραφή μαθήματος. Διδάσκων: Παλαιγεωργίου Γ. Διαλέξεις: Παρασκευή 17:00-20:00

Το πρόγραμμα είναι εγκεκριμένο από το Υπουργείο Παιδείας και Θρησκευμάτων, Πολιτισμού και Αθλητισμού (Αρ / Ε5 ΦΕΚ 764/ ) και λειτουργεί

Πτυχί ο στην Εφαρμοσμέ νη Πληροφορίκη

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΦΥΣΙΚΑ Ε & Στ ΣΤΕΛΙΟΣ ΚΡΑΣΣΑΣ ΣΧΟΛΙΚΟΣ ΣΥΜΒΟΥΛΟΣ

Παραδόσεις 4 ΥΠΟΧΡΕΩΤΙΚΟ. Δεν υφίστανται προϋποθέσεις ΕΛΛΗΝΙΚΑ

Τμήμα Πληροφορικής ΑΠΘ Τμήμα Οικονομικών Επιστημών ΑΠΘ

Περιεχόμενα Παρουσίασης

ADVANCED TIMETABLE ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ - ΣΕΜΙΝΑΡΙΑ. Advanced Time Table - Σεμινάρια. Τι είναι τα σεμινάρια

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Εικόνα 1. Δείκτης Προόδου

4.2.1 Α εξάμηνο Β εξάμηνο Γ εξάμηνο 4.2. ΣΥΝΟΠΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΑΝΑ ΕΞΑΜΗΝΟ

Σημειώσεις στο μάθημα «Στοιχεία Προγραμματισμού σε Γραφικό Περιβάλλον»

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11

Το Επιχειρηματικό Σχέδιο - Ι

ΚΑΤΑΝΟΜΗ ΜΑΘΗΜΑΤΩΝ ΣΤΑ ΕΞΑΜΗΝΑ

Παιδαγωγικές δραστηριότητες μοντελοποίησης με χρήση ανοικτών υπολογιστικών περιβαλλόντων

ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΗ ΤΗΣ ΠΡΟΣΧΟΛΙΚΗΣ ΗΛΙΚΙΑΣ

Σχεδίαση και Ανάλυση Τοπικών Δικτύων Υπολογιστών

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΙΟΥΡΓΩΝΤΑΣ ΤΗΝ ΔΙΚΗ ΜΟΥ ΕΠΙΧΕΙΡΗΣΗ. Creating my own company

Μεταπτυχιακό στη Δημόσια Διοίκηση

Υποχρεωτικό Ειδικότητας

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Αντικείμενα 4 ου εργαστηρίου

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Γλώσσες & Τεχνικές 4 ο Εξάμηνο. - Ενότητα 1 - Δημοσθένης Σταμάτης

Πρόταση για Ανασχηματισμό του Προγράμματος Προπτυχιακών Σπουδών της ΣΗΜΜΥ

Ταξινόμηση, φίλτρα, γραφήματα στα υπολογιστικά φύλλα.

ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ 7ο. Παραδόσεις 1. Ασκήσεις Πράξης 1. Ελληνικά / Αγγλικά ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Οδηγίες για τη διδασκαλία µαθηµάτων Πληροφορικής του Ενιαίου Λυκείου

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ ΣΧΟΛΗ ΠΟΛΥΤΕΧΝΙΚΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ ΓΕ0102 ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ 2

Κεφάλαιο 16 Εφαρμογές Αυτοματισμού Γραφείου

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Σχόλια και υποδείξεις για το Σχέδιο Μαθήματος

Μαθηµατική. Μοντελοποίηση

ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΣΗΣ-ΔΙΔΑΣΚΑΛΙΑΣ

Πληροφορική 2. Τεχνητή νοημοσύνη

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΚΑΙ ΕΦΑΡΜΟΣΜΕΝΩΝ ΕΠΙΣΤΗΜΩΝ

Εφαρμογές Υπηρεσιών Νέφους

Transcript:

Προοίμιο Η εξόρυξη γνώσης (data mining) είναι η διαδικασία της ανεύρεσης χρήσιμων μοτίβων στα δεδομένα. Το αντικείμενο της εξόρυξης γνώσης είναι να χρησιμοποιήσει εντοπιζόμενα μοτίβα για να βοηθήσει στην επεξήγηση της τρέχουσας συμπεριφοράς ή να προβλέψει μελλοντικά ενδεχόμενα. Πολλές πλευρές της διαδικασίας εξόρυξης γνώσης μπορούν να μελετηθούν. Αυτές περιλαμβάνουν: Συλλογή και αποθήκευση δεδομένων Επιλογή και προετοιμασία δεδομένων Δημιουργία και έλεγχος μοντέλου Ερμηνεία και έλεγχος εγκυρότητας αποτελεσμάτων Εφαρμογή μοντέλου Ένα μόνο βιβλίο δεν μπορεί να επικεντρωθεί σε όλες τις περιοχές της διαδικασίας εξόρυξης γνώσης. Αν και παρέχουμε λεπτομέρειες για όλες τις πλευρές της εξόρυξης και της ανακάλυψης γνώσης, ο πρωταρχικός μας σκοπός είναι να επικεντρωθούμε στη δημιουργία και τον έλεγχο του μοντέλου, καθώς επίσης και στην ερμηνεία και στον έλεγχο εκγυρότητας των αποτελεσμάτων. Για να σας βοηθήσουμε να καταλάβετε καλύτερα τη διαδικασία της εξόρυξης γνώσης, σας παρέχουμε ένα εργαλείο εξόρυξης γνώσης με βάση το Microsoft Excel, το οποίο σας επιτρέπει να δημιουργήσετε και να ελέγξετε πειραματικά μοντέλα εξόρυξης γνώσης. Το Intelligent Data Analyzer (ida), ένα προϊόν της Information Acumen Corporation, παρέχει υποστήριξη στον επιχειρησιακό ή τεχνικό αναλυτή, προσφέροντας ένα οπτικό περιβάλλον εκμάθησης, μια ολοκληρωμένη ομάδα εργαλείων, και υποστήριξη της διαδικασίας εξόρυξης γνώσης. Αν και συνιστούμε το λογισμικό που παρέχεται, μπορείτε να επιλέξετε να το ενισχύσετε ή να χρησιμοποιήσετε ένα εναλλακτικό πακέτο λογισμικού. Τα μέρη του κειμένου που συνδέονται άμεσα με το συνοδευτικό λογισμικό είναι τα Κεφάλαια 4, 9, και η ενότητα 10 του κεφαλαίου 5. Αντικειμενικοί Στόχοι Συντάξαμε το κείμενο για να διευκολύνουμε τους παρακάτω σκοπούς εκμάθησης των σπουδαστών: Κατανόηση του τί είναι η εξόρυξη γνώσης και πώς μπορεί να χρησιμοποιηθεί για την επίλυση πραγματικών προβλημάτων. Αναγνώριση του εάν η λύση της εξόρυξης γνώσης είναι ένας εφικτός εναλλακτικός τρόπος για ένα συγκεκριμένο πρόβλημα. Χρήση της διαδικασίας ανακάλυψης γνώσης και σύνταξη αναφοράς σχετικής με τα αποτελέσματα μιας συνεδρίας εξόρυξης γνώσης. Εφαρμογή βασικών στατιστικών και μη στατιστικών τεχνικών για την αξιολόγηση των αποτελεσμάτων μιας συνεδρίας εξόρυξης γνώσης. Εντοπισμός διαφόρων στρατηγικών εξόρυξης γνώσης και κατανόηση του πότε η κάθε στρατηγική είναι κατάλληλη. Ανάπτυξη πλήρους κατανόησης του τρόπου με τον οποίο διάφορες τεχνικές εξόρυξης γνώσης δημιουργούν μοντέλα για την επίλυση προβλημάτων.

Ανάπτυξη γενικής γνώσης σχετικά με τη δομή των αποθηκών δεδομένων και του τρόπου με τον οποίο μια αποθήκη δεδομένων μπορεί να χρησιμοποιηθεί για τη βελτίωση των επιχειρηματικών ευκαιριών. Κατανόηση του τί είναι η απευθείας αναλυτική επεξεργασία (On-Line Analytical Processing OLAP) και πώς μπορεί να εφαρμοστεί στην ανάλυση δεδομένων. Κατανόηση του ότι τα έμπειρα συστήματα (expert systems) αντιπροσωπεύουν γενικά μοντέλα τα οποία εξομοιώνουν ανθρώπινες ενέργειες. Κατανόηση του τρόπου χρήσης ενός δένδρου στόχων για την υποβοήθηση της σχεδίασης ενός συστήματος που βασίζεται σε κανόνες. Αναγνώριση του ότι οι ευφυείς πράκτορες (intelligent agents) είναι προγράμματα υπολογιστών που έχουν τη δυνατότητα να μας βοηθήσουν σε κάθε εργασία. Κατανόηση των τύπων των προβλημάτων που μπορούν να επιλυθούν με το συνδυασμό προσέγγισης επίλυσης προβλήματος με έμπειρα συστήματα και στρατηγικής εξόρυξης γνώσης. Κατανόηση του τρόπου εφαρμογής του λογισμικού που συνοδεύει αυτό το κείμενο για την επίλυση πραγματικών προβλημάτων. Ακροατήριο-στόχος Συντάξαμε το μεγαλύτερο μέρος του υλικού γι αυτό το βιβλίο ενώ διδάσκαμε ένα εισαγωγικό μάθημα ενός εξαμήνου με αντικείμενο την εξόρυξη γνώσης για προπτυχιακούς σπουδαστές ειδικοτήτων πληροφορικής και επιχειρήσεων. Το μάθημα περιλαμβάνει επίσης ένα κεφάλαιο σχετικά με τα έμπειρα συστήματα που βασίζονται σε κανόνες και τους ευφυείς πράκτορες. Κατά τη σύνταξη αυτού του κειμένου, είχαμε τη σκέψη μας σε τρεις ομάδες ανθρώπων: Ακαδημαϊκούς οι οποίοι επιθυμούν να διδάξουν μια ενότητα, ένα εργαστήριο ή ένα ολόκληρο μάθημα σχετικά με την εξόρυξη γνώσης και τα ευφυή συστήματα. Σπουδαστές οι οποίοι θέλουν να μάθουν για την εξόρυξη γνώσης και επιθυμούν να αποκτήσουν εμπειρία με ένα εργαλείο εξόρυξης γνώσης. Επαγγελματίες των επιχειρήσεων οι οποίοι χρειάζεται να κατανοήσουν το πώς η εξόρυξη γνώσης και τα ευφυή συστήματα μπορούν να εφαρμοστούν για να τους βοηθήσουν στην επίλυση των επιχειρηματικών προβλημάτων τους. Χαρακτηριστικά των κεφαλαίων Ακολουθούμε την προσέγγιση ότι η δημιουργία μοντέλου είναι ταυτόχρονα τέχνη και επιστήμη, η οποία γίνεται καλύτερα κατανοητή από την πλευρά της εκμάθησης στην πράξη. Η άποψή μας υποστηρίζεται από πολλά χαρακτηριστικά τα οποία βρίσκονται στις σελίδες του κειμένου. Παρακάτω παρουσιάζεται μια σύντομη λίστα αυτών των χαρακτηριστικών. Απλά, λεπτομερή παραδείγματα. Καταργούμε το μεγαλύτερο μέρος του μυστηρίου που περιβάλλει την εξόρυξη γνώσης παρουσιάζοντας απλά, λεπτομερή παραδείγματα του τρόπου με τον οποίο οι διάφορες τεχνικές εξόρυξης γνώσης δημιουργούν τα μοντέλα τους. Εξαιτίας της εκπαιδευτικής του φύσης, το κείμενο είναι κατάλληλο σαν οδηγός αυτό-διδασκαλίας, καθώς επίσης και σαν κείμενο πανεπιστημιακού επιπέδου για ένα μάθημα σχετικά με την εξόρυξη και την ανακάλυψη γνώσης. Εκπαιδευτικό στυλ. Επιλεγμένες ενότητες των Κεφαλαίων 4, 5, 6, 7, 9 και 10 προσφέρουν εύκολους, βήμα προς βήμα οδηγούς για την εκτέλεση της ανάλυσης δεδομένων.

Συνεδρίες εξόρυξης γνώσης. Οι συνεδρίες εξόρυξης γνώσης επιτρέπουν στους σπουδαστές να δουλέψουν τα βήματα της διαδικασίας εξόρυξης γνώσης με το παρεχόμενο λογισμικό. Κάθε συνεδρία επισημαίνεται ιδιαιτέρως για εύκολη διάκριση από το κανονικό κείμενο. Συλλογή δεδομένων για εξόρυξη. Μια ποικιλία συλλογών δεδομένων από τους τομείς των επιχειρήσεων, της ιατρικής και της επιστήμης είναι έτοιμες για εξόρυξη. Χωριστά παράθυρα. Τα χωριστά παράθυρα εισάγουν τις συλλογές δεδομένων για την εξόρυξη, και δίνουν έμφαση σε σημαντικές πληροφορίες. Διαδικτυακοί τόποι για εξόρυξη γνώσης. Παρέχονται δεσμοί σε διάφορους διαδικτυακούς τόπους οι οποίοι περιέχουν ενδιαφέρουσες συλλογές δεδομένων. Εργαλεία ανάλυσης δεδομένων. Πολλά χρήσιμα εργαλεία ανάλυσης δεδομένων τα οποία υπάρχουν στο Excel καταδεικνύονται. Αυτά τα εργαλεία περιλαμβάνουν τη συνάρτηση (function) LINEST του Excel για την εκτέλεση ανάλυσης γραμμικής παλινδρόμησης (linear regression) και τους πίνακες περιστροφής (pivot tables) για τη σύνοψη και ανάλυση των δεδομένων. Ορισμοί όρων - κλειδιών. Κάθε κεφάλαιο εισάγει διαφόρους όρους - κλειδιά. Μια λίστα των ορισμών αυτών των όρων παρέχεται στο τέλος του κάθε κεφαλαίου. Ασκήσεις τέλους κεφαλαίου. Οι ασκήσεις τέλους κεφαλαίου ενισχύουν τις τεχνικές και τις αρχές που βρίσκονται μέσα σε κάθε κεφάλαιο. Οι ασκήσεις ομαδοποιούνται σε μια από τις τρεις κατηγορίες - ερωτήσεις ανασκόπησης, ερωτήσεις εξόρυξης γνώσης, και ερωτήσεις υπολογισμού. Ασκήσεις κατάλληλες για το εργαστήριο επισημαίνονται με αστερίσκο. Οι ερωτήσεις ανασκόπησης υποβάλουν βασικά ερωτήματα σχετικά με τις αρχές και τα περιεχόμενα που βρίσκονται σε κάθε κεφάλαιο. Οι ερωτήσεις είναι σχεδιασμένες για να βοηθήσουν να προσδιορισθεί εάν ο αναγνώστης κατάλαβε τα βασικά σημεία που δίνονται σε κάθε κεφάλαιο. Οι ερωτήσεις εξόρυξης γνώσης απαιτούν από το χρήστη να χρησιμοποιήσει ένα ή περισσότερα εργαλεία εξόρυξης γνώσης για να εκτελέσει συνεδρίες εξόρυξης γνώσης. Οι ερωτήσεις υπολογισμού έχουν μια μαθηματική γεύση από την άποψη ότι απαιτούν από τον αναγνώστη να εκτελέσει έναν ή περισσότερους υπολογισμούς. Πολλές από τις ερωτήσεις υπολογισμού είναι προκλήσεις για τον πιο προχωρημένο σπουδαστή. Περιεχόμενα κεφαλαίων Η ταξινόμηση των κεφαλαίων και ο διαχωρισμός του βιβλίου σε μέρη βασίζονται σε πολλά χρόνια εμπειρίας στη διδασκαλία μαθημάτων σχετικών με την εξόρυξη γνώσης και τα έμπειρα συστήματα. Το Μέρος Ι εισάγει υλικό το οποίο είναι βασικό για την κατανόηση της διαδικασίας εξόρυξης γνώσης. Η παρουσίαση είναι ανεπίσημη και εύκολη στην παρακολούθηση. Παρουσιάζονται βασικές αρχές, στρατηγικές, και τεχνικές εξόρυξης γνώσης. Οι σπουδαστές μαθαίνουν για τους τύπους των προβλημάτων που μπορούν να επιλυθούν με την εξόρυξη γνώσης και αποκτούν εμπειρία με το λογισμικό που συνοδεύει το κείμενο. Περιγράφονται πολλά πραγματικά παραδείγματα επιτυχημένων εφαρμογών εξόρυξης γνώσης. Αφού οι βασικές αρχές γίνουν κατανοητές, το Μέρος ΙΙ συγκεκριμενοποιεί την επίλυση προβλημάτων εξόρυξης γνώσης εισάγοντας το μοντέλο επεξεργασίας ανακάλυψης γνώσης στις βάσεις δεδομένων (knowledge discovery in databases KDD). Το μοντέλο επεξεργασίας KDD είναι η εφαρμογή της επιστημονικής μεθόδου στην εξόρυξη γνώσης. Επισημαίνεται το γεγονός ότι η προεπεξεργασία δεδομένων είναι ουσιαστική για την επιτυχή εξόρυξη γνώσης. Ιδιαίτερη προσοχή δίνεται στο χώρο της αποθήκης δεδομένων και στις τεχνικές αξιολόγησης της εξόρυξης γνώσης. Το Μέρος ΙΙΙ επεξηγεί λεπτομερώς διάφορες προχωρημένες μεθόδους εξόρυξης γνώσης. Περιγράφονται θέματα τρέχοντος ενδιαφέροντος, όπως η εκμάθηση των νευρωνικών δικτύων, η ανάλυση χρονικών σειρών, η λογιστική παλινδρόμηση, και η εξόρυξη γνώσης που βασίζεται στον

διαδίκτυο. Παρέρχεται επίσης ένα διδακτικό βοήθημα στη χρήση του λογισμικού νευρωνικών δικτύων ida. Αν κι η εξόρυξη γνώσης είναι μια κατάλληλη μέθοδος επίλυσης για πολλές εφαρμογές, υπάρχουν στιγμές που η προσέγγιση αυτή δεν είναι εφικτή. Ευτυχώς, όταν η εξόρυξη γνώσης δεν είναι μια εφαρμόσιμη επιλογή, μπορεί να είναι διαθέσιμες άλλες επιλογές για τη δημιουργία χρήσιμων μοντέλων λήψης αποφάσεων. Το Μέρος IV εξετάζει συστήματα βασισμένα σε κανόνες και ευφυείς πράκτορες σαν εναλλακτικές μεθόδους δημιουργίας μοντέλων, για να βοηθήσουν στη διαδικασία λήψης αποφάσεων. Ιδιαίτερη προσοχή δίνεται στο συνδυασμό αυτών των τεχνικών με την εξόρυξη γνώσης για την επίλυση σύνθετων προβλημάτων. Ακολουθεί μια σύντομη περιγραφή των περιεχομένων του κάθε κεφαλαίου του κειμένου. Μέρος I : Βασικά στοιχεία εξόρυξης γνώσης Το Κεφάλαιο 1 παρέχει μια ανασκόπηση όλων των πλευρών της διαδικασίας εξόρυξης γνώσης. Ιδιαίτερη έμφαση δίνεται στην υποβοήθηση του σπουδαστή να καθορίσει πότε η εξόρυξη γνώσης είναι η κατάλληλη στρατηγική επίλυσης προβλήματος. Το Κεφάλαιο 2 παρουσιάζει μια σύνοψη διαφόρων συνήθων στρατηγικών και τεχνικών εξόρυξης γνώσης. Περιγράφονται οι βασικές μέθοδοι αξιολόγησης του αποτελέσματος μιας περιόδου λειτουργίας εξόρυξης γνώσης. Το Κεφάλαιο 3 περιγράφει με λεπτομέρειες έναν αλγόριθμο δέντρου αποφάσεων, τον αλγόριθμο apriori για την παραγωγή συνδυαστικών κανόνων, τον αλγόριθμο K-Means μη καθοδηγούμενης συσταδοποίησης, και δύο γενετικές τεχνικές εκμάθησης. Παρέχονται εργαλεία για την υποβοήθηση καθορισμού των τεχνικών εξόρυξης γνώσης που θα πρέπει να χρησιμοποιηθούν για την επίλυση συγκεκριμένων προβλημάτων. Το Κεφάλαιο 4 παρουσιάζει ένα διδακτικό βοήθημα εισαγωγής στο πακέτο λογισμικού των εργαλείων εξόρυξης γνώσης. Περιγράφεται μια γενική μεθοδολογία για την εκτέλεση καθοδηγούμενης εκμάθησης και μη καθοδηγούμενης συσταδοποίησης. Μέρος ΙΙ : Εργαλεία για την ανακάλυψη γνώσης Το Κεφάλαιο 5 κάνει μια εισαγωγή στο μοντέλο επεξεργασίας KDD σαν μια επίσημη μεθοδολογία επίλυσης προβλημάτων με την εξόρυξη γνώσης. Μια απλοποιημένη προσαρμογή αυτού του μοντέλου χρησιμοποιείται για την επίλυση δύο προβλημάτων εξόρυξης γνώσης. Το Κεφάλαιο 6 προσφέρει μια εισαγωγή στη σχεδίαση αποθηκών δεδομένων και OLAP. Περιλαμβάνεται επίσης ένα διδακτικό βοήθημα στη χρήση πινάκων περιστροφής του Excel για την ανάλυση δεδομένων. Το Kεφάλαιο 7 περιγράφει επίσημες στατιστικές και μη στατιστικές μεθόδους για την αξιολόγηση του αποτελέσματος μιας συνεδρίας εξόρυξης γνώσης. Παρέχονται οδηγίες για τη χρήση του Excel στον υπολογισμό του συσχέτισης γνωρισμάτων και την εμφάνιση διαγραμμάτων διασποράς. Μέρος III : Προχωρημένες τεχνικές εξόρυξης γνώσης Το Κεφάλαιο 8 παρουσιάζει δύο δημοφιλή μοντέλα νευρωνικών δικτύων. Μια λεπτομερής επεξήγηση της εκπαίδευσης νευρωνικού δικτύου παρέχεται για τον αναγνώστη που δείχνει μεγαλύτερο ενδιαφέρον για τεχνικά θέματα. Το Κεφάλαιο 9 προσφέρει ένα διδακτικό βοήθημα σχετικά με την εφαρμογή των εργαλείων δημιουργίας νευρωνικών δικτύων του ida, για την επίλυση προβλημάτων εξόρυξης γνώσης. Περιγράφεται μια μέθοδος για τη χρήση καθοδηγούμενης εκμάθησης για την αξιολόγηση των αποτελεσμάτων μιας μη καθοδηγούμενης συσταδοποίησης νευρωνικού δικτύου.

Το Κεφάλαιο 10 περιγράφει λεπτομερώς πολλές στατιστικές τεχνικές, συμπεριλαμβανομένης της γραμμικής και λογιστικής παλινδρόμησης, του κατηγοριοποιητή Bayes, και τριών μη καθοδηγούμενων μεθόδων εξόρυξης γνώσης. Παρέχονται οδηγίες για τη χρήση της συνάρτησης LINEST του Excel για την εκτέλεση γραμμικής παλινδρόμησης. Το Κεφάλαιο 11 εισάγει τεχνικές για την εκτέλεση αναλύσεων χρονικών σειρών, εξόρυξης που βασίζεται στο διαδίκτυο, και εξόρυξης γνώσης κειμένου. Τα bagging και boosting περιγράφονται σαν μέθοδοι για τη βελτίωση της απόδοσης του μοντέλου. Μέρος IV : Ευφυή συστήματα Τα Κεφάλαια του Μέρους IV, καθώς επίσης και τα Παραρτήματα Γ, Δ και Ε, είναι αποθηκευμένα σαν αρχεία Adobe PDF στο CD που συνοδεύει το βιβλίο. Για να διαβάσετε αυτά τα αρχεία θα χρειαστεί να έχετε εγκατεστημένο στον υπολογιστή σας το Adobe Acrobat Reader. Για να κατεβάσετε ένα δωρεάν αντίγραφο του προγράμματος, επισκεφτείτε τον διαδικτυακό τόπο www.adobe.com. Το Κεφάλαιο 12 παρέχει μια εισαγωγή στην τεχνητή νοημοσύνη και στα συστήματα που βασίζονται σε κανόνες. Περιγράφεται μια γενική μεθοδολογία για τη χρήση δέντρων στόχων για τη δημιουργία συστημάτων που βασίζονται σε κανόνες. Το Κεφάλαιο 13 αποκαλύπτει πηγές αβεβαιότητας στα συστήματα που βασίζονται σε κανόνες. Η ασαφής λογική (fuzzy logic) και η συλλογιστική Bayes (Bayes reasoning) περιγράφονται σαν μέθοδοι συλλογιστικής για επισφαλείς πληροφορίες. Το Κεφάλαιο 14 κάνει μια εισαγωγή στους ευφυείς πράκτορες σαν προγράμματα υπολογιστή που έχουν τη δυνατότητα να μας βοηθήσουν σε κάθε εργασία. Περιγράφεται ένα μοντέλο για το συνδυασμό ευφυών πρακτόρων, εξόρυξης γνώσης, και έμπειρων συστημάτων για την επίλυση δύσκολων προβλημάτων. Συμπληρώματα κειμένου Κάθε αντίγραφο αυτού του βιβλίου συνοδεύεται από το πακέτο λογισμικού ida των εργαλείων εξόρυξης γνώσης, καθώς επίσης και από διάφορες συλλογές δεδομένων έτοιμων για εξόρυξη. Πρόσθετα συμπληρώματα έχουν σχεδιαστεί ειδικά για να τους καθηγητές του μαθήματος. Ακολουθεί μια σύντομη περιγραφή αυτών των συμπληρωμάτων. Το πακέτο λογισμικού ida Εμπειρική εκμάθηση απαιτείται για την ανάπτυξη των δεξιοτήτων που απαιτούνται για έναν ειδικό της εξόρυξης γνώσης. Το λογισμικό ida είναι σχεδιασμένο να δώσει στους σπουδαστές αυτή την εμπειρία της διαδικασίας εξόρυξης γνώσης. Το λογισμικό ida χρησιμοποιείται σε πολλά κεφάλαια για να καταδείξει πολλές σημαντικές αρχές της εξόρυξης γνώσης. Τα Κεφάλαια 4, 5, 7, 9, 10, 11, και 13 διαθέτουν διάφορες ασκήσεις τέλους κεφαλαίου σχεδιασμένες για το λογισμικό ida. Το ida αποτελείται από έναν προ-επεξεργαστή, μια γεννήτρια αναφορών (report generator), και τρία εργαλεία εξόρυξης γνώσης το ESX για καθοδηγούμενη εκμάθηση και μη καθοδηγούμενη συσταδοποίηση, ένα εργαλείο νευρωνικού δικτύου για τη δημιουργία μοντέλων καθοδηγούμενης οπισθοδιάδοσης και μη καθοδηγούμενων αυτό-οργανούμενων χαρτών, και μια γεννήτρια κανόνων παραγωγής. Επειδή το ida είναι πρόσθετο του Excel, η διεπαφή χρήστη είναι το Microsoft Excel. Επιλέξαμε το ida για την ευελιξία και την ευκολία χρήσης του. Το πακέτο συλλογής δεδομένων ida Διάφορες συλλογές δεδομένων συμπεριλαμβάνονται με το λογισμικό ida. Οι συλλογές δεδομένων προέρχονται από τρεις γενικές περιοχές εφαρμογών - επιχειρήσεις, ιατρική και υγεία, και επιστήμη. Όλες οι συλλογές δεδομένων είναι σε μορφή Excel και είναι έτοιμες για χρήση.

Οι συλλογές δεδομένων μπορούν να περιγραφούν σε πολλές διαστάσεις, συμπεριλαμβανομένου του αριθμού των στιγμιοτύπων δεδομένων, του αριθμού των γνωρισμάτων, της ποσότητας των χαμένων δεδομένων ή των δεδομένων με θόρυβο, του εάν οι ιδιότητες δεδομένων ορίζονται σαφώς, του εάν τα δεδομένα είναι κατηγοριακά (categorical), αριθμητικά (numeric), ή συνδυασμός των δύο τύπων δεδομένων, του εάν υπάρχουν καλά καθορισμένες κλάσεις στα δεδομένα, του εάν στα δεδομένα ενυπάρχει ένα στοιχείο χρόνου, του εάν τα γνωρίσματα εισόδου μπορούν να διακρίνουν μεταξύ γνωστών κλάσεων που περιέχονται στα δεδομένα, και εάν οι ιδιότητες εισόδου συσχετίζονται. Καθώς όλοι αυτοί οι ίδιοι παράγοντες επηρεάζουν τον τρόπο που εκτελείται η εξόρυξη γνώσης, οι συλλογές δεδομένων ida επιλέχθηκαν έτσι ώστε να παρέχουν μια ποικιλία μεταξύ αυτών των διαστάσεων. Οι συλλογές δεδομένων εξυπηρετούν επίσης πολλούς γενικούς σκοπούς. Ειδικότερα, οι συλλογές δεδομένων Παρέχουν στον αρχάριο σπουδαστή πειραματικά δεδομένα για να πειραματιστεί με τη διαδικασία εξόρυξης γνώσης, χωρίς να απαιτούν από αυτόν να ασχολείται με θέματα προ-επεξεργασίας δεδομένων. Δείχνουν τη μεγάλη έκταση του προβλήματος και τον τύπο των προβλημάτων που επιδέχονται λύση με τεχνικές εξόρυξης γνώσης. Επεξηγούν τα αποτελέσματα της εξόρυξης γνώσης. Καταδεικνύουν τη διαδικασία ανακάλυψης γνώσης. Αναγνωρίζουν ότι ο πειραματισμός με πολλές τεχνικές εξόρυξης γνώσης μπορεί να είναι απαραίτητος για τη δημιουργία ενός βέλτιστου μοντέλου για μια συγκεκριμένη συλλογή δεδομένων. Το παρακάτω είναι μια σύντομη περιγραφή των συλλογών δεδομένων που είναι μέρος του πακέτου λογισμικού. Η περιγραφή περιλαμβάνει μια σύντομη δήλωση ενός η περισσότερων χαρακτηριστικών της κάθε συλλογής δεδομένων. Εφαρμογές επιχειρήσεων Συλλογή δεδομένων προώθησης πιστωτικών καρτών (The Credit Card Promotion Dataset). Αυτή είναι μια υποθετική συλλογή δεδομένων που περιέχει πληροφορίες για κατόχους πιστωτικών καρτών οι οποίοι έχουν αποδεχθεί ή απορρίψει διάφορες διαφημιστικές προσφορές. Η συλλογή δεδομένων χρησιμοποιείται για να καταδείξει πολλές από τις τεχνικές εξόρυξης γνώσης που εξετάζονται στο κείμενο. Συλλογή δεδομένων ελέγχου φερεγγυότητας πιστωτικών καρτών (The Credit Card Screening Dataset). Αυτό το αρχείο περιέχει δεδομένα για άτομα που έχουν ζητήσει την έκδοση πιστωτικής κάρτας. Το γνώρισμα εξόδου δηλώνει εάν η αίτηση για πιστωτική κάρτα του ατόμου έγινε δεκτή ή απορρίφθηκε. Τα γνωρίσματα εισόδου έχουν αλλάξει σε σύμβολα χωρίς καμία σημασία, για να προστατευθεί η εμπιστευτικότητα των δεδομένων. Συλλογή δεδομένων κυνηγίου ελαφιών (The Deer Hunters Dataset). Αυτή η συλλογή δεδομένων τηρεί πληροφορίες σχετικές με ελαφοκυνηγούς οι οποίοι είναι πρόθυμοι ή απρόθυμοι να δαπανήσουν περισσότερα για το επόμενο κυνηγετικό τους ταξίδι. Διάφορα άσχετα γνωρίσματα εισόδου είναι παρόντα στα δεδομένα. Συλλογή δεδομένων χρηματιστηριακού δείκτη (The Stock Index Dataset). Τα δεδομένα είναι μια αναπαράσταση χρονικής σειράς της εβδομαδιαίας μέσης τιμής κλεισίματος του χρηματιστηρίου.

Ιατρική και υγεία Συλλογή δεδομένων καρδιοπαθών (The Cardiology Patient Dataset). Αυτή η συλλογή δεδομένων τηρεί ιατρικές πληροφορίες για δύο ομάδες ατόμων. Τα μέλη της πρώτης ομάδας έχουν υποστεί μια ή περισσότερες καρδιακές προσβολές. Τα μέλη της δεύτερης ομάδας δεν έχουν υποστεί καρδιακή προσβολή. Η συλλογή δεδομένων περιέχει μια καλή αναλογία κατηγοριακών και αριθμητικών γνωρισμάτων. Συλλογή δεδομένων παθήσεων σπονδυλικής στήλης (The Spine Clinic Dataset). Αυτή η συλλογή δεδομένων περιέχει ιατρικές πληροφορίες για άτομα που έχουν υποβληθεί σε εγχείρηση σπονδυλικής στήλης. Μερικά από αυτά τα άτομα έχουν επιστρέψει στην εργασία τους, ενώ άλλα όχι. Ένας σαφής ορισμός του μέσου του κάθε γνωρίσματος δεν δίνεται. Η συλλογή δεδομένων περιέχει αριθμητικά και κατηγοριακά δεδομένα. Επιστήμη Συλλογή δεδομένων εκρήξεων ακτινοβολίας Γάμα (The Gamma Ray Burst Dataset). Αυτή η συλλογή δεδομένων περιέχει καταγεγραμμένες πληροφορίες για συγκεκριμένες εκρήξεις ακτινοβολίας Γάμα. Οι εκρήξεις ακτινοβολίας Γάμα είναι σύντομες εκπομπές ακτινοβολίας Γάμα της οποίας η προέλευση βρίσκεται εκτός του ηλιακού μας συστήματος. Οι εκπομπές παρατηρήθηκαν από το Burst and Transient Source Experiment (BATSE) της NASA, μεταξύ Απριλίου του 1991 και Μαρτίου του 1993. Αν και οι αστρονόμοι συμφωνούν ότι οι κλάσεις των εκπομπών ακτινοβολίας Γάμα υπάρχουν, δεν συμφωνούν σε μια συγκεκριμένη δομή κλάσης. Συλλογή δεδομένων δορυφορικών εικόνων (The Landsat Image Dataset). Η συλλογή δεδομένων περιέχει εικονοστοιχεία που αντιπροσωπεύουν μια ψηφιακή δορυφορική εικόνα ενός τμήματος της επιφάνειας της γης. Κάθε στιγμιότυπο έχει ταξινομηθεί σε μια από 15 κατηγορίες. Εξαιτίας του μεγάλου αριθμού των επιμέρους κλάσεων, η ακρίβεια της κατηγοριοποίησης επηρεάζεται από ρυθμίσεις παραμέτρων που εξαρτώνται από το μοντέλο. Συλλογή δεδομένων μετρήσεων θερμοκρασιών (The Temperature Dataset). Αυτή η συλλογή δεδομένων παρέχει τον κανονικό μέσο όρο της ελάχιστης θερμοκρασίας του Ιανουαρίου σε βαθμούς Φαρενάιτ 56 πόλεων των ΗΠΑ. Παρέχονται επίσης οι τιμές του γεωγραφικού πλάτους και μήκους των πόλεων. Όλα τα γνωρίσματα είναι αριθμητικά. Διάφορα Συλλογή δεδομένων Τιτανικού (The Titanic Dataset). Αυτή η συλλογή δεδομένων περιέχει 2201 στιγμιότυπα. Το κάθε στιγμιότυπο περιγράφει γνωρίσματα ενός επιβάτη ή μέλους του πληρώματος του Τιτανικού. Το γνώρισμα εξόδου δηλώνει εάν ο επιβάτης ή το μέλος του πληρώματος επέζησε. Συμπληρώματα καθηγητή Τα παρακάτω συμπληρώματα παρέχονται για την υποβοήθηση του καθηγητή στην οργάνωση διαλέξεων και γραπτών εξετάσεων. Διαφάνειες PowerPoint. Κάθε εικόνα και πίνακας στο κείμενο είναι μέρος μιας παρουσίασης PowerPoint. Ερωτήσεις ελέγχου. Παρέχονται διάφορες ερωτήσεις ελέγχου για κάθε κεφάλαιο. Απαντήσεις σε επιλεγμένες ασκήσεις. Απαντήσεις δίνονται για τις περισσότερες ασκήσεις τέλους κεφαλαίου.

Πρόγραμμα οργάνωσης μαθήματος. Το πρόγραμμα οργάνωσης μαθήματος περιέχει ιδέες για τη μορφή της διάλεξης και σημεία για συζήτηση. Το πρόγραμμα οργάνωσης παρέχει επίσης προτάσεις για τη χρήση επιλεγμένων ασκήσεων τέλους κεφαλαίου για το εργαστήριο. Παρατηρήστε ότι αυτά τα συμπληρώματα είναι διαθέσιμα μόνο για καθηγητές με τα κατάλληλα προσόντα. Ελάτε σε επαφή με τον αντιπρόσωπο πωλήσεων της Addison-Wesley ή στείλτε ένα e-mail στην Computing@aw.com για πρόσβαση σ αυτό το υλικό. Προτεινόμενα περιγράμματα μαθήματος Για τον αναγνώστη που ενδιαφέρεται για τη βασική κατανόηση των πλεονεκτημάτων και περιορισμών της εξόρυξης γνώσης, προτείνουμε τη μελέτη των Κεφαλαίων 1, 2, 5 και 6. Για μια εμπειρία δοκιμών, συμπεριλάβετε και το Κεφάλαιο 4. Τα Μέρη I, II και III του κειμένου παρέχουν ύλη για ένα εισαγωγικό μάθημα στην εξόρυξη και την ανακάλυψη γνώσης. Συμπεριλαμβάνοντας την ύλη του Μέρους IV, το κείμενο μπορεί επίσης να χρησιμοποιηθεί για ένα συνδυασμένο μάθημα εξόρυξης γνώσης και έμπειρων συστημάτων, το οποίο δίνει έμφαση στην εξόρυξη και την ανακάλυψη γνώσης. Η γνώση που προαπαιτείται για κάποιον που χρησιμοποιεί αυτό το κείμενο είναι ελάχιστη. Μια βασική κατανόηση των λειτουργιών φύλλων εργασίας, βασικών στοιχείων στατιστικής, και βασικών στοιχείων άλγεβρας είναι χρήσιμη. Το Κεφάλαιο 1 παρέχει το ουσιαστικό πλαίσιο εργασίας για τα Κεφάλαια 2 μέχρι 14. Το Κεφάλαιο 2 παρέχει τις απαραίτητες πληροφορίες υποδομής για τα Κεφάλαια 3 μέχρι 11. Εάν θέλετε να δώσετε στους σπουδαστές μια άμεση εμπειρία εκμάθησης, το Κεφάλαιο 4 μπορεί να καλυφθεί, αφού ολοκληρωθεί το Κεφάλαιο 1. Αφού μελετηθούν τα Κεφάλαια 2 και 3, το μεγαλύτερο μέρος της ύλης των Κεφαλαίων 4 μέχρι 7 και 10 μέχρι 12 μπορεί να καλυφθεί με οποιαδήποτε σειρά. Το Κεφάλαιο 9 θα πρέπει να ακολουθεί το Κεφάλαιο 8, και τα Κεφάλαια 13 και 14 θα πρέπει να ακολουθούν το Κεφάλαιο 12. Το κείμενο είναι κατάλληλο για έναν προπτυχιακό σπουδαστή πληροφοριακών συστημάτων (MIS) ή επιστήμης υπολογιστών (CS). Μπορεί επίσης να παρέχει διδακτικό βοήθημα για ένα σπουδαστή που βρίσκεται στο πτυχίο, και ο οποίος επιθυμεί μια εργασιακή γνώση της εξόρυξης και ανακάλυψης γνώσης. Πιστεύουμε ότι το μεγαλύτερο μέρος του κειμένου μπορεί να καλυφθεί σ ένα μόνο εξάμηνο. Στη συνέχεια φαίνονται κάποιες επιλογές για τη δομή ενός μαθήματος. Βασικό μάθημα εξόρυξης γνώσης για προπτυχιακούς σπουδαστές πληροφοριακών συστημάτων (MIS). Καλύψτε τα Κεφάλαια 1 μέχρι 6 λεπτομερώς. Όμως, οι ενότητες 3.3 και 3.4 του Κεφαλαίου 3 μπορούν να παραληφθούν ή να καλυφθούν ακροθιγώς. Δαπανήστε αρκετό χρόνο στο Κεφάλαιο 4, έτσι ώστε οι σπουδαστές να αισθάνονται άνετα όταν δουλεύουν με τα εργαλεία λογισμικού του ida. Εάν οι σπουδαστές σας δεν διαθέτουν βασικά στοιχεία στατιστικής, το Κεφάλαιο 7 μπορεί να εξαιρεθεί ή να καλυφθεί ακροθιγώς. Εάν παραληφθεί το Κεφάλαιο 7, δαπανήστε πρόσθετο χρόνο στην ύλη της ενότητας 2.5 (αξιολόγηση απόδοσης). Οι σπουδαστές με τουλάχιστον ένα μάθημα επιχειρησιακής στατιστικής θα πρέπει να είναι σε θέση να χειριστούν την ύλη του Κεφαλαίου 7. Καλύψτε το Κεφάλαιο 8, αλλά κάντε την ενότητα 8.5 προαιρετική. Δαπανήστε αρκετό χρόνο στο Κεφάλαιο 9, το οποίο δείχνει στους σπουδαστές πως να χρησιμοποιούν τα εργαλεία λογισμικού νευρωνικών δικτύων ida. Το Κεφάλαιο 10 είναι προαιρετικό. Οι σπουδαστές με κάποια υποδομή στοιχείων στατιστικής, θα βρουν τη γραμμική και λογιστική παλινδρόμηση, καθώς επίσης και την ταξινόμηση Bayes, πολύ ενδιαφέρουσες. Για το Κεφάλαιο 11, όλοι οι σπουδαστές χρειάζονται κάποια στοιχεία ανάλυσης χρονικής σειράς, καθώς επίσης και στοιχεία εξόρυξης γνώσης που βασίζονται στο διαδίκτυο και σε κείμενο. Η ενότητα 11.4 είναι προαιρετική. Ανάλογα με το διαθέσιμο χρόνο, δαπανήστε μια ή δύο ημέρες για την εξέταση των συστημάτων που βασίζονται σε κανόνες (Κεφάλαιο 12).

Προπτυχιακό μάθημα MIS σχετικά με τα εφυή συστήματα και έμφαση στην εξόρυξη γνώσης Ακολουθήστε το πλάνο του μαθήματος εξόρυξης γνώσης για το προπτυχιακό MIS. Καλύψτε όλη την ύλη των Κεφαλαίων 12 μέχρι 14. Παραλείψτε τις προαναφερθείσες προαιρετικές ενότητες για να εξοικονομήσετε χρόνο για πρόσθετη ύλη. Εάν επιτρέπει ο χρόνος, συμπληρώστε τα Κεφάλαια 12 μέχρι 14 δίνοντας στους σπουδαστές εμπειρία μ ένα απλό εργαλείο δημιουργίας έμπειρου συστήματος που βασίζεται σε κανόνες. Βασικό μάθημα εξόρυξης γνώσης για προπτυχιακούς σπουδαστές επιστήμης υπολογιστών. Καλύψτε τα Κεφάλαια 1 μέχρι 5 λεπτομερώς. Δαπανήστε μια ή δύο ημέρες στην ύλη του Κεφαλαίου 6 για να δώσετε στους σπουδαστές μια βασική κατανόηση της σχεδίασης αποθήκης δεδομένων. Καλύψτε το μεγαλύτερο μέρος της ύλης των Κεφαλαίων 7 μέχρι 11. Εάν σας πιέζει ο χρόνος, ίσως θέλετε να περιορίσετε την κάλυψη των ενοτήτων 10.4, 10.5 και 11.4. Δαπανήστε τυχόν πρόσθετο χρόνο καλύπτοντας ύλη του Κεφαλαίου 12. Για ένα πιο ταχύρυθμο μάθημα, η ύλη Επιλογής Ιδιότητας Δέντρου Αποφάσεων (Παράρτημα Γ) και Στατιστική για Αξιολόγηση Απόδοσης (Παράρτημα Δ) μπορεί να καλυφθεί σαν μέρος του κανονικού μαθήματος. Ίσως θέλετε να ζητήσετε από τους σπουδαστές να πειραματιστούν με ένα ή περισσότερα εργαλεία εξόρυξης γνώσης ελεύθερης χρήσης που μπορούν να κατέβουν από τον διαδικτυακό τόπο www.kdnuggets.com. Προπτυχιακό μάθημα επιστήμης υπολογιστών σχετικά με τα εφυή συστήματα και έμφαση στην εξόρυξη γνώσης. Ακολουθήστε το πλάνο του μαθήματος εξόρυξης γνώσης για το προπτυχιακό της επιστήμης υπολογιστών. Επιπλέον, καλύψτε την ύλη των Κεφαλαίων 12 μέχρι 14. Εάν έχετε χρονικούς περιορισμούς, ίσως θέλετε να καλύψετε μόνο εκείνες τις ενότητες των Κεφαλαίων 10 και 11 που παρουσιάζουν ειδικό ενδιαφέρον. Ένα πλάνο είναι να καλύψετε τις ενότητες 10.1 και 10.2, και μια υπο-ενότητα της 10.4. Εάν σας επιτρέπει ο χρόνος, μπορείτε να συμπληρώσετε τα Κεφάλαια 12 μέχρι 14 προσφέροντας στους σπουδαστές εμπειρία μ ένα εργαλείο δημιουργίας έμπειρου συστήματος που βασίζεται σε κανόνες. Ίσως επίσης θέλετε να επιτρέψετε στους σπουδαστές να πειραματιστούν μ ένα ή περισσότερα εργαλεία εξόρυξης γνώσης ελεύθερης χρήσης που μπορούν να κατεβούν από τον διαδικτυακό τόπο www.kdnuggets.com. Σύντομο μάθημα εξόρυξης γνώσης Ο προπτυχιακός σπουδαστής ή σπουδαστής στο πτυχίο που ενδιαφέρεται για γρήγορη ανάπτυξη μιας εργασιακής γνώσης εξόρυξης γνώσης θα πρέπει να αφιερώσει χρόνο στα Κεφάλαια. 1, 2, 4, και 5. Μια εργασιακή γνώση νευρωνικών δικτύων μπορεί να αποκτηθεί με τη μελέτη του Κεφαλαίου 8 (ενότητες 8.1 μέχρι 8.4) και του Κεφαλαίου 9.

Ευχαριστίες Πολλοί άνθρωποι βοήθησαν να γίνει αυτό το βιβλίο πραγματικότητα. Είμαστε υποχρεωμένοι στους David Haglin και Jon Hakkila για την υποβολή κρίσιμων ερωτήσεων σε θέματα αξιολόγησης απόδοσης της εξόρυξης γνώσης. Είμαστε επίσης υποχρεωμένοι σ αυτούς τους ανθρώπους για την προ-επεξεργασία πολλών από τις συλλογές δεδομένων που συνοδεύουν το βιβλίο. Είμαστε υποχρεωμένοι στους Yifan Tang και Susan για την υποβοήθηση της κριτικής των κεφαλαίων του κειμένου. Θα θέλαμε να ευχαριστήσουμε όλους τους προπτυχιακούς σπουδαστές της επιστήμης υπολογιστών και επιχειρήσεων οι οποίοι δούλεψαν με τις εκτυπώσεις του υπό έκδοση βιβλίου μας. Ειδικές ευχαριστίες ανήκουν στην ομάδα προγραμματιστών της Information Acumen που αποτελείται από τους Russ Huguley, Jin Feng και Karl Gunderson. Θα θέλαμε επίσης να ευχαριστήσουμε το συντονιστή μας παραγωγής Keith Henry και όλους τους ανθρώπους στην Addison-Wesley για την αφοσίωσή τους στην έκδοση βιβλίων. Είμαστε βαθιά υποχρεωμένοι στον εκδότη μας.maite Suarez-Rivas. Τελικά, είμαστε υποχρεωμένοι στους παρακάτω επιβλέποντες του βιβλίου μας, των οποίων τα σχόλια βρήκαμε εποικοδομητικά και ιδιαίτερα χρήσιμα κατά τη διάρκεια της αναθεώρησης των χειρογράφων : Anath Gramma Purdue University John Keane Department of Computation, UMIST-UK Selwyn Piramuthu Decision and Information Sciences, University of Florida Mary Ann Robbert Bentley College Lynne Stokes Southern Methodist University Stuart A. Varden Pace University