ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση



Σχετικά έγγραφα
Κεφάλαιο 18. Μηχανική Μάθηση (Machine Learning) - 1 -

Μηχανική Μάθηση: γιατί;

Κεφάλαιο 18. Μηχανική Μάθηση (Machine Learning) Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΜΑΤΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ. Καραγιώργου Σοφία

Μηχανική Μάθηση. Η µηχανική µάθηση ως πρόβληµα αναζήτησης

Μηχανική Μάθηση. Η έννοια της µάθησης σε ένα γνωστικό σύστηµα µπορεί να συνδεθεί µε δύο βασικές ιδιότητες:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

4.3. Γραµµικοί ταξινοµητές

Αλγόριθµοι και Πολυπλοκότητα

Heapsort Using Multiple Heaps

Κεφάλαιο 7 : Είδη, Τεχνικές, και Περιβάλλοντα Προγραµµατισµού

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο 2. Α1. Ο αλγόριθμος είναι απαραίτητος μόνο για την επίλυση προβλημάτων πληροφορικής

Περιεχόμενα. Δομές δεδομένων. Τεχνικές σχεδίασης αλγορίθμων. Εισαγωγή στον προγραμματισμό. Υποπρογράμματα. Επαναληπτικά κριτήρια αξιολόγησης

ιαµέριση - Partitioning

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Θέματα Συστημάτων Πολυμέσων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find)

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΗΡΕΣΙΩΝ) Γ ΤΑΞΗΣ 2003

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Γ. Κορίλη Αλγόριθµοι ροµολόγησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΗΡΕΣΙΩΝ) Γ ΤΑΞΗΣ 2003

ΤΕΛΙΚΟ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη

Ασκήσεις μελέτης της 19 ης διάλεξης

του προγράμματος diagrama_rohs.zip )

Θεωρητικές Ασκήσεις. ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ. 1 ο Μέρος

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοηµοσύνη Ι» 7ο Φροντιστήριο 15/1/2008

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find)

Κεφάλαιο 5ο: Εντολές Επανάληψης

/5

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ ΚΕΦΑΛΑΙΟ 2 ο ΚΕΦΑΛΑΙΟ 7 ο ΕΡΩΤΗΣΕΙΣ ΓΕΝΙΚΑ ΠΕΡΙ ΑΛΓΟΡΙΘΜΩΝ

Συστήματα Πληροφοριών Διοίκησης Ενότητα 1: Η έννοια των Πληροφοριακών Συστημάτων

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1

Εισαγωγή στην επιστήµη των υπολογιστών ΑΡΙΘΜΗΤΙΚΑ ΣΥΣΤΗΜΑΤΑ

Συνδυαστική Βελτιστοποίηση Εισαγωγή στον γραμμικό προγραμματισμό (ΓΠ)

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Κατανεμημένα Συστήματα Ι

Μαθησιακές δυσκολίες ΙΙ. Παλαιγεωργίου Γιώργος Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών Τηλεπικοινωνιών και Δικτύων, Πανεπιστήμιο Θεσσαλίας

Μοντελοποίηση προβληµάτων

Δοµές Δεδοµένων. 2η Διάλεξη Αλγόριθµοι Ένωσης-Εύρεσης (Union-Find) Ε. Μαρκάκης. Βασίζεται στις διαφάνειες των R. Sedgewick K.

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e

Ασκήσεις μελέτης της 16 ης διάλεξης

Επιλογή και επανάληψη. Λογική έκφραση ή συνθήκη

Κεφάλαιο 8. Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής. Τεχνητή Νοηµοσύνη - Β' Έκδοση

4. Ο αισθητήρας (perceptron)

Ανάπτυξη εφαρµογών σε προγραµµατιστικό περιβάλλον (στοιχεία θεωρίας)

ΣΤΟΧΑΣΤΙΚΕΣ ΙΑ ΙΚΑΣΙΕΣ

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος

Αναγνώριση Προτύπων Ι

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

Επίλυση Γραµµικών Συστηµάτων

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΤΑΞΗ

2.2.5 ΑΝΑΠΑΡΑΣΤΑΣΗ ΑΛΓΟΡΙΘΜΟΥ

Κεφάλαια Εντολές επανάληψης. Τρεις εντολές επανάληψης. Επιλογή εντολής επανάληψης ΟΣΟ...ΕΠΑΝΑΛΑΒΕ. Σύνταξη στη ΓΛΩΣΣΑ

Τεχνολογία Πολυμέσων. Ενότητα # 7: Θεωρία πληροφορίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΚΕΦΑΛΑΙΟ 2 Βασικές έννοιες αλγορίθµων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ η Σειρά Ασκήσεων ΑΠΑΝΤΗΣΕΙΣ

Βασική Εφικτή Λύση. Βασική Εφικτή Λύση

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Προβλήματα, αλγόριθμοι, ψευδοκώδικας

Κατανεμημένα Συστήματα Ι

Αλγόριθμοι και Πολυπλοκότητα

περισσότερα από ένα παραδείγµατα εντολών της Στήλης Β).

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Πληροφορική 2. Τεχνητή νοημοσύνη

Αλγόριθµοι και Πολυπλοκότητα

Ο Αλγόριθµος της Simplex

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Οπτική αντίληψη. Μετά?..

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ. 1 ο ΚΕΦΑΛΑΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΔΙΔΑΚΤΙΚΗ της ΠΛΗΡΟΦΟΡΙΚΗΣ

οµή δικτύου ΣΧΗΜΑ 8.1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Transcript:

ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης ονοµάζεται γνωστικό σύστηµα (cognitive system). Η έννοια της µάθησης σε ένα γνωστικό σύστηµα όπως γίνεται αντιληπτή στην καθηµερινή ζωή, µπορεί να συνδεθεί µε δύο βασικές ιδιότητες: την ικανότητά του στην πρόσκτηση γνώσης κατά την αλληλεπίδρασή του µε το περιβάλλον, µέσα στο οποίο δραστηριοποιείται, και την ικανότητά του να βελτιώνει µε την επανάληψη τον τρόπο µε τον οποίο εκτελεί µία ενέργεια (και συνεπώς και την απόδοσή του). Έχουν προταθεί διάφοροι ορισµοί για τη µάθηση, όπως των: imon (1983), "η µάθηση σηµατοδοτεί προσαρµοστικές αλλαγές σε ένα σύστηµα µε την έννοια ότι αυτές του επιτρέπουν να κάνει την ίδια εργασία, ή εργασίες της ίδιας κατηγορίας, πιο αποδοτικά και αποτελεσµατικά την επόµενη φορά". Minsky (1985), "µάθηση είναι να κάνουµε χρήσιµες αλλαγές στο µυαλό µας". Michalski (1986), "µάθηση είναι η δηµιουργία ή η αλλαγή της αναπαράστασης των εµπειριών". Ένα σύστηµα µε δυνατότητα µάθησης µεταβάλλεται διαρκώς προς το "καλύτερο", όπως και αν αυτό ορίζεται, αναφορικά µε τις λειτουργίες που είναι σε θέση να εκτελέσει. Αυτό που είναι δύσκολο να προσδιοριστεί είναι η ακριβής φύση αυτών των αλλαγών καθώς και ο τρόπος µε τον οποίο αυτές µπορούν να αναπαρασταθούν. Στη γενικότερη περίπτωση, η µάθηση προσδιορίζεται ως πρόσκτηση επιπλέον γνώσης σε µία κατάλληλη αναπαράσταση. Ένα µη βιολογικό σύστηµα µε δυνατότητα µάθησης δοµεί ή µετασχηµατίζει, σε µια αυστηρά καθορισµένη γλώσσα αναπαράστασης, προτάσεις τις οποίες και αποθηκεύει για µελλοντική χρήση. ηλαδή, η βασική παραδοχή είναι ότι η λειτουργία του συστήµατος επιφέρει µεταβολές στη βάση γνώσης του. Η µάθηση µε βάση το παραπάνω πλαίσιο αφορά τα συστήµατα που ανήκουν στην συµβολική προσέγγιση της ΤΝ και δεν αποτελεί τη µόνη λύση. Για παράδειγµα, τα 335

336 Τεχνητή Νοηµοσύνη τεχνητά νευρωνικά δίκτυα που ανήκουν στη δεύτερη προσέγγιση της ΤΝ, τη µη συµβολική (ή συνδετική), έχουν δυνατότητα µάθησης µετασχηµατίζοντας την εσωτερική τους δοµή, παρά καταχωρώντας κατάλληλα αναπαριστάµενη γνώση. Η βελτίωση του τρόπου εκτέλεσης µιας ενέργειας µε την επανάληψη είναι κάτι εξίσου δύσκολο. Εκτός του ότι πρέπει να προσδιοριστούν µε ακρίβεια οι παράµετροι που περιγράφουν αυτή τη βελτίωση, µεγάλη προσοχή απαιτεί η επίδραση της µεταβολής αυτής στις υπόλοιπες ενέργειες που µπορεί να εκτελέσει το σύστηµα. Ορισµός µηχανικής µάθησης Ο άνθρωπος προσπαθεί να κατανοήσει το περιβάλλον του παρατηρώντας το και δηµιουργώντας µια απλοποιηµένη (αφαιρετική) εκδοχή του που ονοµάζεται µοντέλο (model). Η δηµιουργία ενός τέτοιου µοντέλου, ονοµάζεται επαγωγική µάθηση (inductive learning) ενώ η διαδικασία γενικότερα ονοµάζεται επαγωγή (induction). Επιπλέον ο άνθρωπος έχει τη δυνατότητα να οργανώνει και να συσχετίζει τις εµπειρίες και τις παραστάσεις του δηµιουργώντας νέες δοµές που ονοµάζονται πρότυπα (patterns). Η δηµιουργία µοντέλων ή προτύπων από ένα σύνολο δεδοµένων, από ένα υπολογιστικό σύστηµα, ονοµάζεται µηχανική µάθηση (machine learning). Έχουν προταθεί διάφοροι ορισµοί για τη µηχανική µάθηση, όπως των: Carbonell (1987), "... η µελέτη υπολογιστικών µεθόδων για την απόκτηση νέας γνώσης, νέων δεξιοτήτων και νέων τρόπων οργάνωσης της υπάρχουσας γνώσης". Mitchell (1997), "Ένα πρόγραµµα υπολογιστή θεωρείται ότι µαθαίνει από την εµπειρία E σε σχέση µε µια κατηγορία εργασιών Τ και µια µετρική απόδοσης P, αν η απόδοση του σε εργασίες της Τ, όπως µετριούνται από την P, βελτιώνονται µε την εµπειρία E". Witten & Frank (2000), "Κάτι µαθαίνει όταν αλλάζει τη συµπεριφορά του κατά τέτοιο τρόπο ώστε να αποδίδει καλύτερα στο µέλλον". Είδη µηχανικής µάθησης Έχουν αναπτυχθεί πολλές τεχνικές µηχανικής µάθησης οι οποίες χρησιµοποιούνται ανάλογα µε τη φύση του προβλήµατος και εµπίπτουν σε ένα από τα παρακάτω δυο είδη: µάθηση µε επίβλεψη (supervised learning) ή µάθηση µε παραδείγµατα (learning from examples), µάθηση χωρίς επίβλεψη (unsupervised learning) ή µάθηση από παρατήρηση (learning from observation). Στη µάθηση µε επίβλεψη το σύστηµα καλείται να "µάθει" µια έννοια ή συνάρτηση από ένα σύνολο δεδοµένων, η οποία αποτελεί περιγραφή ενός µοντέλου. Ονοµάζεται έτσι επειδή θεωρείται ότι υπάρχει κάποιος "επιβλέπων" ο οποίος παρέχει τη σωστή τιµή εξόδου της συνάρτησης, για τα δεδοµένα που εξετάζονται. Αντίθετα, στη µάθηση χωρίς επίβλεψη το σύστηµα πρέπει µόνο του να ανακαλύψει συσχετίσεις ή οµάδες σε ένα σύνολο δεδοµένων, δηµιουργώντας πρότυπα, χωρίς να είναι γνωστό αν υπάρχουν, πόσα και ποια είναι.

Κεφάλαιο 18: Μηχανική Μάθηση 343 µονοπατιών που καταλήγουν σε τερµατικούς κόµβους Φεύγει, να αποφασίσει για το ποια θα είναι η τακτική της εταιρίας αν θέλει να διατηρήσει τη συγκεκριµένη κατηγορία συνδροµητών. ιάρκεια (έτη) < 1 Παραµένει Είδος Συµβολαίου Μικρή Χρήση Άλλη Χρήση ιάρκεια < 1.2 ιάρκεια < 2 Φεύγει Παραµένει Παραµένει Φεύγει Σχήµα 18.4: Παράδειγµα δένδρου ταξινόµησης. Το δένδρο στο Σχήµα 18.4 µπορεί επίσης να παρασταθεί µε το ακόλουθο σύνολο κανόνων ταξινόµησης: if ιάρκεια<1 then Παραµένει if ιάρκεια>1 and Είδος_Συµβολαίου=Μικρή Χρήση and ιάρκεια<1.2 then Φεύγει if ιάρκεια>1 and Είδος_Συµβολαίου=Μικρή Χρήση and ιάρκεια>1.2 then Παραµένει if ιάρκεια>1 and Είδος_Συµβολαίου=Άλλη_Χρήση and ιάρκεια<2 then Παραµένει if ιάρκεια>1 and Είδος_Συµβολαίου=Άλλη Χρήση and ιάρκεια>2 then Φεύγει Οι παραπάνω κανόνες, µε τη χρήση του τελεστή OR, µπορεί να ενοποιηθούν σχηµατίζοντας τελικά τόσους κανόνες όσες είναι και οι διαθέσιµες κατηγορίες (στο συγκεκριµένο παράδειγµα δύο). Οι περισσότεροι αλγόριθµοι που έχουν αναπτυχθεί για µάθηση δένδρων ταξινό- µησης είναι παραλλαγές ενός βασικού αλγορίθµου. Παράδειγµα του βασικού αυτού αλγορίθµου αποτελούν ο αλγόριθµος ID3 και ο απόγονος του C4.5. Ο Αλγόριθµος ID3 Είναι ο πιο γνωστός αλγόριθµος µάθησης δένδρων ταξινόµησης. Σε αντίθεση µε τον αλγόριθµο απαλοιφής υποψηφίων, ο οποίος χρησιµοποιεί τα δεδοµένα εκπαίδευσης σταδιακά, ο ID3 απαιτεί από την αρχή το σύνολο των δεδοµένων εκπαίδευσης, κα-

Κεφάλαιο 18: Μηχανική Μάθηση 345 συνεχόµενων αριθµητικών τιµών, κτλ. Ο αλγόριθµος C4.5 αποτελεί µία από τις περισσότερο διαδεδοµένες βελτιώσεις του ID3. Εντροπία και κέρδος πληροφορίας Ένας από τους πιο διαδεδοµένους µηχανισµούς διαχωρισµού είναι αυτός της εντροπίας της πληροφορίας (information entropy) ο οποίος επιλέγει εκείνη την ανεξάρτητη µεταβλητή που οδηγεί σε περισσότερο συµπαγές δένδρο. Η τιµή της εντροπίας της πληροφορίας δίνεται από τη σχέση: E ( ) = p+ log2( p+ ) p log2( p ) όπου είναι το σύνολο των δεδοµένων εκπαίδευσης στο στάδιο (κόµβο) του διαχωρισµού, p + είναι το κλάσµα των θετικών παραδειγµάτων του και p - είναι το κλάσµα των αρνητικών παραδειγµάτων του. Γενικότερα, για c διαφορετικές κατηγορίες, η εντροπία ορίζεται από τη σχέση: E( ) = c i= 1 p i log ( p i 2 ) όπου p i το ποσοστό των παραδειγµάτων του που ανήκουν στην κατηγορία i. Η εντροπία της πληροφορίας µετρά ουσιαστικά την ανοµοιογένεια που υπάρχει στο αναφορικά µε την υπό εξέταση εξαρτηµένη µεταβλητή και έχει τις ρίζες της στη θεωρία πληροφοριών (information theory). Στην περίπτωση που έχουµε δυο κατηγορίες, η τιµή της είναι 0 αν όλα τα µέλη του ανήκουν στην ίδια κατηγορία και 1 αν τα µισά µέλη ανήκουν στην µια και τα άλλα µισά στην άλλη κατηγορία. Σε όλους δε τους υπολογισµούς, θεωρούµε την ποσότητα 0 log 2 (0) ίση µε µηδέν. Στην πράξη, χρησιµοποιείται το κέρδος πληροφορίας (information gain), Gain(,A) ή G(,A) που αναπαριστά τη µείωση της εντροπίας του συνόλου εκπαίδευσης αν επιλεγεί ως παράµετρος διαχωρισµού η µεταβλητή Α. Όταν µειώνεται η πληροφοριακή εντροπία, αυξάνεται η πυκνότητα πληροφορίας και άρα η περιγραφή γίνεται περισσότερο συµπαγής. Το κέρδος πληροφορίας δίνεται από τη σχέση: G (, A) = E( ) u E ( u Values( A) όπου E() είναι η εντροπία πληροφορίας του υπό εξέταση κόµβου, Α είναι η ανεξάρτητη µεταβλητή, µε τιµές Values(A), βάσει της οποίας επιχειρείται ο επόµενος διαχωρισµός, u είναι µία από τις δυνατές τιµές του Α, u είναι το πλήθος των εγγραφών µε Α=u και E( u ) η εντροπία πληροφορίας του υπό εξέταση κόµβου ως προς την τιµή Α=u. Ουσιαστικά, ο δεύτερος όρος είναι η εντροπία των παραδειγµάτων µετά το διαχωρισµό τους σύµφωνα µε την τιµή του χαρακτηριστικού Α και αποτελείται από το άθροισµα της εντροπίας για το κάθε σύνολο που προκύπτει µετά το διαχωρισµό. Παράδειγµα εκτέλεσης Για την καλύτερη κατανόηση των παραπάνω, δίνεται στη συνέχεια ο πρώτος κύκλος λειτουργίας του ID3 µε κριτήριο διαχωρισµού την εντροπία, για το σύνολο δεδοµένων εκπαίδευσης του προβλήµατος δανειοδότησης που παρουσιάστηκε στην προηγούµενη ενότητα (Πίνακας 18.1). Πρέπει να τονιστεί ότι σε κάθε κύκλο τα παραπάνω u)

Κεφάλαιο 18: Μηχανική Μάθηση 363 αριθµητικά χαρακτηριστικά θα πρέπει να οµογενοποιούνται ώστε η απόστασή τους να πέφτει µέσα στο διάστηµα [0,1]. Αν min και max είναι η ελάχιστη και µέγιστη τιµή ενός αριθµητικού χαρακτηριστικού, και x i είναι η τιµή του για κάποιο δεδοµένο, τότε η διαδικασία της οµογενοποίησης µετατρέπει την τιµή στο διάστηµα [0,1] µε τον τύπο: ' xi min x i = max min Αλγόριθµοι βασισµένοι σε διαχωρισµούς Ένας από τους πιο γνωστούς αλγόριθµους οµαδοποίησης αυτής της κατηγορίας είναι ο αλγόριθµος των Κ-µέσων (K-means). Ο αριθµός Κ των οµάδων καθορίζεται πριν την εκτέλεση του αλγορίθµου. Ο αλγόριθµος ξεκινά διαλέγοντας K τυχαία σηµεία από τα δεδοµένα ως τα κέντρα των οµάδων. Έπειτα αναθέτει κάθε σηµείο στην οµάδα της οποίας το κέντρο είναι πιο κοντά (µικρότερη απόσταση) σε αυτό το σηµείο. Στη συνέχεια, υπολογίζει για κάθε οµάδα το µέσο όρο όλων των σηµείων της (µέσο διάνυσµα) και ορίζει αυτό ως νέο κέντρο της. Τα δύο τελευταία βήµατα επαναλαµβάνονται για ένα προκαθορισµένο αριθµό βηµάτων ή µέχρι να µην υπάρχει αλλαγή στο διαχωρισµό των σηµείων σε οµάδες. Ο αλγόριθµος σε ψευδογλώσσα δίνεται στη συνέχεια. Αλγόριθµος Κ-µέσων είσοδος: Σύνολο δεδοµένων D = {x 1,, x n } Αριθµός Οµάδων k έξοδος: Οµάδες C i 1.//ανάθεση τυχαίων κέντρων για i= 1,,k κάνε: θεώρησε m i ως ένα τυχαίο στοιχείο από το D; 2.//οµαδοποίηση όσο υπάρχουν αλλαγές στις οµάδες Ci κάνε: 2α.//δηµιουργία οµάδων για i = 1,, k κάνε C i = {x D d(m i,x) d(m j,x) για όλα τα j = 1,,k, j k}; 2β.//υπολογισµός νέων κέντρων για i = 1,,k κάνε m i = το µέσο διάνυσµα των σηµείων που ανήκουν στην οµάδα C i ; Έστω ότι ο αλγόριθµος εκτελείται µε k=2 για τα επτά σηµεία που απεικονίζονται στο Σχήµα 18.9.α. Αρχικά, επιλέγονται δύο τυχαία σηµεία, έστω τα 3 και 4, ως κέντρα για τις δύο οµάδες Α και Β, αντίστοιχα. Στη συνέχεια, κάθε σηµείο ανατίθεται στην οµάδα στης οποίας το κέντρο είναι πιο κοντά, οπότε τα σηµεία 1, 2, 3 και 5 θα ανήκουν στην οµάδα Α ενώ τα σηµεία 4, 6 και 7 στην οµάδα Β. Έπειτα ξαναϋπολογίζονται τα κέντρα κάθε οµάδας και µε αυτόν τον τρόπο ολοκληρώνεται ένας κύκλος υπολογισµών. Τα νέα κέντρα απεικονίζονται στο Σχήµα 18.9.α µε ρόµβο.