Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Τεχνητή Νοημοσύνη. Ενότητα 7: Μηχανική μάθηση

Σχετικά έγγραφα
Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

Εισαγωγή στον δομημένο προγραμματισμό

Εισαγωγή στους Αλγορίθμους

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Μαθηματική Ανάλυση Ι

Εισαγωγή στην πληροφορική

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στους Αλγορίθμους

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 4: Εισαγωγή / Σύνολα

Εισαγωγή στους Αλγορίθμους

Μαθηματική Ανάλυση Ι

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών Ενότητα 2: ΣΥΓΚΕΝΤΡΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΜΑΡΚΕΤΙΝΓΚ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση

Μαθηματική Ανάλυση ΙI

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Δομές Δεδομένων Ενότητα 3

Μαθηματική Ανάλυση Ι

Ιστορία της μετάφρασης

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Μαθηματική Ανάλυση Ι

Εισαγωγή στους Αλγορίθμους Ενότητα 10η Άσκηση Αλγόριθμος Dijkstra

Διδακτική της Πληροφορικής

Εισαγωγή στην πληροφορική

Ψηφιακή Επεξεργασία Εικόνων

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Μηχανολογικό Σχέδιο Ι

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 7: Σχέσεις και Συναρτήσεις

Τεχνολογία και Καινοτομία - Οικονομική Επιστήμη και Επιχειρηματικότητα

Λογιστική Κόστους Ενότητα 10: Ασκήσεις Προτύπου Κόστους Αποκλίσεων.

Τεχνοοικονομική Μελέτη

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 6: Προτασιακός Λογισμός

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Έννοιες φυσικών επιστημών Ι και αναπαραστάσεις

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Διοικητική Λογιστική

Εφαρμογές της Πληροφορικής στην Εκπαίδευση

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Ήπιες και νέες μορφές ενέργειας

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Συστήματα Αναμονής. Ενότητα 3: Στοχαστικές Ανελίξεις. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Πληροφορική ΙΙ Θεματική Ενότητα 5

Βέλτιστος Έλεγχος Συστημάτων

Προγραμματισμός H/Y Ενότητα 2: Εντολές ελέγχου ροής. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εκκλησιαστικό Δίκαιο

Βάσεις Περιβαλλοντικών Δεδομένων

Τεχνολογία & Καινοτομία - Αρχές Βιομηχανικής Επιστήμης

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 1: Εκτιμητές και Ιδιότητες. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Αλγόριθμοι και πολυπλοκότητα Συγχωνευτική Ταξινόμηση

Μαθηματική Ανάλυση Ι

Δομές Δεδομένων Ενότητα 1

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανολόγων Μηχανικών. Χημεία. Ενότητα 9: Υβριδισμός. Τόλης Ευάγγελος

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Εκκλησιαστικό Δίκαιο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Έννοιες φυσικών επιστημών Ι και αναπαραστάσεις Ενότητα 4: Ανάδειξη των ι.μ. Μεθοδολογία Workshop.

Διδακτική Πληροφορικής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Ιστορία της μετάφρασης

Διδακτική Πληροφορικής

Έννοιες φυσικών επιστημών Ι και αναπαραστάσεις

Συστήματα Αναμονής. Ενότητα 4: Αλυσίδες Markov. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Κοινωνιολογία της Εκπαίδευσης

ΑΝΑΛΥΣΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΤΑΣΤΑΣΕΩΝ

Έννοιες φυσικών επιστημών Ι και αναπαραστάσεις

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Εισαγωγή στους Υπολογιστές

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανολόγων Μηχανικών. Χημεία. Ενότητα 6: Ομοιοπολικός δεσμός. Τόλης Ευάγγελος

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανολόγων Μηχανικών. Χημεία. Ενότητα 10: Θεωρία μοριακών τροχιακών. Τόλης Ευάγγελος

Τεχνοοικονομική Μελέτη

Διδακτική Πληροφορικής

Βάσεις Δεδομένων. Ενότητα 1: Εισαγωγή στις Βάσεις δεδομένων. Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών σπουδών

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Μαθηματική Ανάλυση ΙI

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού Υπέρθερμου Ατμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Διδακτική Πληροφορικής

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 2: Γραφήματα

Οικονομετρία Ι. Ενότητα 3: Θεώρημα των Gauss Markov. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Λογιστική Κόστους. Ενότητα 4: ΣΥΜΠΕΡΙΦΟΡΑ - ΦΥΣΗ ΚΟΣΤΟΥΣ. Μαυρίδης Δημήτριος Τμήμα Λογιστικής και Χρηματοοικονομικής

Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Κβαντική Επεξεργασία Πληροφορίας

Προγραμματισμός H/Y Ενότητα 5: Συναρτήσεις. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Transcript:

Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Τεχνητή Νοημοσύνη Ενότητα 7: Μηχανική μάθηση Αν. καθηγητής Στεργίου Κωνσταντίνος kstergiou@uowm.gr Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ψηφιακά Μαθήματα στο Πανεπιστήμιο Δυτικής Μακεδονίας» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Μηχανική Μάθηση (Machine Learning) (1/4) - - - + + - + + - + + - - - - - 4

Μηχανική Μάθηση (Machine Learning) (2/4) Μέχρι τώρα έχουμε υποθέσει ότι όλη η ευφυΐα ενός πράκτορα παρέχεται στον πράκτορα από τον σχεδιαστή του. Μετά ο πράκτορας εκμεταλλευόμενος την ευφυΐα που του δόθηκε προσπαθεί να επιτύχει τους στόχους του σε κάποιο περιβάλλον. Όταν όμως ο σχεδιαστής δεν έχει πλήρη γνώση του περιβάλλοντος στο οποίο θα λειτουργήσει ο πράκτορας τότε απαιτείται η δυνατότητα της μάθησης (learning): Ικανότητα πρόσκτησης επιπλέον γνώσης κατά την αλληλεπίδραση με το περιβάλλον. Ικανότητα βελτίωσης του τρόπου εκτέλεσης ενεργειών μέσω της επανάληψης. 5

Μηχανική Μάθηση (3/4) Μηχανική Μάθηση (machine learning) είναι ο τομέας της ΤΝ που ασχολείται με πράκτορες που μαθαίνουν από τις εμπειρίες τους. Βασική ιδέα: Ό,τι προσλαμβάνει ο πράκτορας από το περιβάλλον μπορεί να χρησιμοποιηθεί: Για να αποφασίσει τι ενέργειες θα κάνει για να λύσει ένα συγκεκριμένο πρόβλημα, ό,τι καλύψαμε μέχρι τώρα στο μάθημα, και για να μάθει να κάνει καλύτερες ενέργειες μελλοντικά. Η μάθηση είναι αποτέλεσμα της αλληλεπίδρασης του πράκτορα και του γύρω κόσμου. 6

Πράκτορας Μάθησης (Learning Agent) Ένας πράκτορας μάθησης (learning agent) μπορεί να χωριστεί σε τέσσερα συστατικά: Τμήμα Μάθησης: υπεύθυνο να βελτιώνει στη συμπεριφορά του πράκτορα. Τμήμα Απόδοσης: επιλέγει τις ενέργειες. Τμήμα Κριτικής: λέει στο τμήμα μάθησης πόσο καλά τα πάει ο πράκτορας σύμφωνα με κάποιο εξωτερικό κριτήριο απόδοσης. Γεννήτρια προβλημάτων: προτείνει ενέργειες που θα οδηγήσουν σε νέες και διδακτικές εμπειρίες. 7

Πράκτορας Μάθησης κριτήριο απόδοσης Κριτική αισθητήρες feedback μάθηση στόχων Μάθηση αλλαγές γνώση Απόδοση ΠΡΑΚΤΟΡΑΣ Γεννήτρια Προβλημάτων μηχανισμοί δράσης 8

Πράκτορας Μάθησης Παράδειγμα Ο αυτοματοποιημένος οδηγός ταξί: Το τμήμα απόδοσης περιλαμβάνει όλη τη γνώση και τις μεθόδους που διαθέτει ο πράκτορας για να επιλέγει τις ενέργειες οδήγησης. Το τμήμα μάθησης σχηματίζει στόχους μάθησης: μάθε καλύτερους κανόνες που περιγράφουν τις συνέπειες του φρεναρίσματος, μάθε τη γεωγραφία της περιοχής. Το τμήμα κριτικής παρατηρεί τον κόσμο και δίνει πληροφορίες στο τμήμα μάθησης: π.χ. παρατηρεί τις χειρονομίες άλλων οδηγών μετά από παραβίαση προτεραιότητας. Η γεννήτρια προβλημάτων προτείνει ενέργειες: πήγαινε από την λεωφόρο Χ αυτή τη φορά, να δούμε αν είναι πιο σύντομη. 9

Μηχανική Μάθηση (4/4) Έχουν προταθεί πολλές τεχνικές για την επίλυση προβλημάτων μηχανικής μάθησης. Δηλ. πολλές τεχνικές για την υλοποίηση του τμήματος μάθησης ενός πράκτορα μάθησης. Η διαφοροποίηση συνίσταται: Στον τρόπο με τον οποίο γίνεται η μάθηση: σε ποια στοιχεία του τμήματος απόδοσης επιδρά. Στον τρόπο αναπαράστασης της γνώσης. Στο feedback που είναι διαθέσιμο. Στην ύπαρξη ή όχι αρχικής γνώσης. 10

Μηχανική Μάθηση με Επίβλεψη Το τμήμα απόδοσης μπορεί να περιγραφεί μαθηματικά ως μια συνάρτηση. Π.χ: Πληροφορία για τον τρόπο που εξελίσσεται ο κόσμος μπορεί να περιγραφεί ως μια συνάρτηση από μια κατάσταση του κόσμου στην επόμενη κατάσταση του. Ένας στόχος μπορεί να περιγραφεί σαν μια συνάρτηση από μια κατάσταση σε μια Boolean τιμή (0 ή 1) αναλόγως με το αν η κατάσταση ικανοποιεί τον στόχο. Μπορούμε να δούμε τη διαδικασία μάθησης γενικά ως τη διαδικασία μάθησης της αναπαράστασης μιας συνάρτησης. 11

Επαγωγική Μάθηση (1/4) Επαγωγική Μάθηση (inductive learning) είναι η μάθηση μιας έννοιας (δηλ. μιας συνάρτησης) μέσω ενός συνόλου παραδειγμάτων. Ένα παράδειγμα είναι μια δυάδα (x, f(x)), όπου f είναι μια συνάρτηση, το x είναι η είσοδος, και το f(x) η έξοδος της συνάρτησης όταν εφαρμόζεται στο x. Με άλλα λόγια ο στόχος της επαγωγικής μάθησης είναι ο εξής: Δοθέντος ενός συνόλου παραδειγμάτων μιας συνάρτησης f, βρες μια συνάρτηση h που προσεγγίζει την f. Η συνάρτηση h ονομάζεται υπόθεση: Μια καλή υπόθεση θα πρέπει να γενικεύεται (δηλ. να προβλέπει σωστά παραδείγματα που δεν έχει εξετάσει ακόμα). Το πρόβλημα εύρεσης μια καλής υπόθεσης είναι δύσκολο 12

Επαγωγική Μάθηση Παράδειγμα Έχουμε 5 παραδείγματα (σημεία) και η πραγματική f είναι άγνωστη. Υπάρχουν πολλές επιλογές για την h. Ockham s razor: Η πιο πιθανή υπόθεση είναι η απλούστερη που είναι και συνεπής με όλες τις παρατηρήσεις. 13

Επαγωγική Μάθηση (2/4) Μια υπόθεση ονομάζεται συνεπής (consistent) όταν συμφωνεί με όλα τα δεδομένα. Για να βρούμε μια συνεπή υπόθεση πρέπει να ψάξουμε στο χώρο των πιθανών υποθέσεων: πως ορίζεται αυτός ο χώρος; πολύ μεγάλος χώρος υποθέσεων => πολύ μεγάλος χώρος αναζήτησης => υψηλή πολυπλοκότητα. αν ο χώρος αναζήτησης είναι μικρός υπάρχει περίπτωση να μην εμπεριέχει την λύση. ανέφικτο πρόβλημα. απαιτείται ισορροπία. 14

Επαγωγική Μάθηση (3/4) Ένας απλός αντιδραστικός πράκτορας μάθησης: global examples {} function Reflex-Performance-Element (percept) returns an action if (percept, a) in examples then return a else h Induce(examples) return h(percept) procedure Reflex-Learning-Element (percept, action) inputs: percept, feedback percept action, feedback action examples examples U {(percept, action)} 15

Επαγωγική Μάθηση (4/4) Πως αναπαριστάται η γνώση; Η επιλογή του τρόπου αναπαράστασης είναι η πιο σημαντική απόφαση που πρέπει να πάρει ο σχεδιαστής του συστήματος μάθησης. Επηρεάζει: αλγόριθμους μάθησης, απόδοση. Όπως στη συλλογιστική έτσι και στη μάθηση υπάρχει trade-off μεταξύ εκφραστικότητας της γλώσσας και απόδοσης. γλώσσες λογικής; 16

Δέντρα Απόφασης (1/5) Η επαγωγή με δέντρα απόφασης (decision trees) είναι μια από τις απλούστερες και πιο πετυχημένες μορφές αλγορίθμων μάθησης. Ένα δέντρο μάθησης παίρνει ως είσοδο ένα αντικείμενο ή μια κατάσταση που περιγράφονται από ένα σύνολο ιδιοτήτων και επιστρέφει μια ναι ή όχι απόφαση : τα δέντρα απόφασης αναπαριστούν Boolean συναρτήσεις, κάθε εσωτερικός κόμβος αντιστοιχεί σε τεστ της τιμής μιας από τις ιδιότητες. 17

Δέντρα Απόφασης Παράδειγμα (2/5) Το πρόβλημα ζητάει να αποφασίσουμε αν θα περιμένουμε για τραπέζι σε ένα restaurant. Στόχος είναι να μάθουμε τον ορισμό του κατηγορήματος WillWait, εκφρασμένο σαν δέντρο απόφασης. Έχουμε τα παρακάτω ορίσματα (attributes): Alternate: Bar: αν υπάρχει εναλλακτικό restaurant κοντά. αν υπάρχει χώρος αναμονής στο bar. Fri/Sat: αν είναι Παρασκευή ή Σάββατο. Hungry: αν πεινάμε. 18

Δέντρα Απόφασης Παράδειγμα (3/5) Patrons: πόσοι άλλοι είναι στο restaurant (None, Some, Full). Price: η τιμές όπου κυμαίνεται το restaurant. Raining: αν βρέχει έξω. Reservation: αν έχουμε κάνει κράτηση. Type: το είδος του restaurant (French, Italian, Chinese, Mexican). WaitEstimate: εκτίμηση για την ώρα αναμονής (0-10 λεπτά, 10-30, 30-60, >60). 19

Δέντρα Απόφασης Παράδειγμα (4/5) Patrons? None Some Full No Yes WaitEstimate? >60 30-60 10-30 0-10 No Alternate? Hungry? Yes No No No Yes No Yes Reservation? Fri/Sat? Yes Alternate? No Yes No Yes No Yes Yes Raining? Bar? Yes No Yes No Yes Yes Yes No Yes 20

Δέντρα Απόφασης (5/5) Πόσο εκφραστικά είναι τα δέντρα απόφασης; Κάθε δέντρο απόφαση μπορεί να περιγράψει μόνο ένα αντικείμενο. Μπορούν να εκφράσουν πλήρως την προτασιακή λογική: s WillWait(s) (P 1 (s) P 2 (s) P n (s)). Δε μπορούν να εκφράσουν πλήρως πιο περίπλοκες γλώσσες: π.χ. first order logic. r 2 Nearby(r 2,r) Price(r, p) Price(r 2,p 2 ) Cheaper(p 2,p) μπορεί να εκφραστεί με δέντρο απόφασης; 21

Εξαγωγή Δέντρων Απόφασης από Παραδείγματα (1/6) Ένα παράδειγμα περιγράφεται από τις τιμές των ορισμάτων και την τιμή που παίρνει το κατηγόρημα στόχου: Η τιμή του κατηγορήματος στόχου ονομάζεται κατηγοριοποίηση (classification) του παραδείγματος. Αν είναι true, το παράδειγμα είναι θετικό. Αν είναι false, το παράδειγμα είναι αρνητικό. Το πλήρες σύνολο παραδειγμάτων ονομάζεται σύνολο εκπαίδευσης (training set). 22

Εξαγωγή Δέντρων Απόφασης από Παραδείγματα (2/6) Example Alt Bar Fri/Sat Res Type Est X 1 Yes No No Yes French 0-10 Yes X 2 Yes No No No Chin 30-60 No X 3 No Yes No No Mex 0-10 Yes X 10 Yes Yes Yes Yes Italian 10-30 No X 11 No No No No Chin 0-10 No X 12 Yes Yes Yes No Mex 30-60 Yes Goal WillWait 23

Εξαγωγή Δέντρων Απόφασης από Παραδείγματα (3/6) Στόχος: Να κατασκευάσουμε ένα δέντρο απόφασης από τα παραδείγματα σύμφωνα με το οποίο να μπορούμε να κατηγοριοποιήσουμε μελλοντικά παραδείγματα. Εξαγωγή Προτύπων (pattern extraction). Ockham s razor: Η πιο πιθανή υπόθεση είναι η απλούστερη που είναι και συνεπής με όλες τις παρατηρήσεις. Εύρεση του μικρότερου δέντρου απόφασης intractable πρόβλημα! 24

Εξαγωγή Δέντρων Απόφασης από Παραδείγματα (4/6) + - Χ 1,Χ 3,Χ 4,Χ 6,Χ 8,Χ 12 Χ 2,Χ 5,Χ 7,Χ 9,Χ 10,Χ 11 + - Χ 1,Χ 3,Χ 4,Χ 6,Χ 8,Χ 12 Χ 2,Χ 5,Χ 7,Χ 9,Χ 10,Χ 11 Patrons? Type? + - None Some Full + Χ 1,Χ 3,Χ 6,Χ 8 Χ 7,Χ 11 - + - Χ 4,Χ 12 Χ 2,Χ 5,Χ 9,Χ 10 French Ita Chin + - Χ 1 + - Χ 5 Χ 6 Χ 10 + - Mex Χ 4,Χ 8 Χ 2,Χ 11 + - Χ 3,Χ 12 Χ 7,Χ 9 Hungry? Yes No + Χ 4,Χ 12 + - Χ 2,Χ 10 - Χ 5,Χ 9 25

Εξαγωγή Δέντρων Απόφασης από Παραδείγματα (5/6) Πως κατασκευάζουμε το δέντρο; Αν υπάρχουν θετικά και αρνητικά παραδείγματα, διάλεξε το καλύτερο χαρακτηριστικό για να τα ξεχωρίσεις. Αν όλα τα εναπομείναντα παραδείγματα είναι θετικά (ή αρνητικά), τελειώσαμε. Αν δεν έχουν μείνει παραδείγματα, επιστρέφουμε μια προκαθορισμένη τιμή. Αν δεν έχουν μείνει χαρακτηριστικά αλλά έχουν μείνει θετικά και αρνητικά παραδείγματα, έχουμε πρόβλημα! θόρυβος (noise) στα δεδομένα ή ανεπαρκή χαρακτηριστικά. 26

Εξαγωγή Δέντρων Απόφασης από Παραδείγματα (6/6) Το δέντρο είναι διαφορετικό από το αρχικό. Απέτυχε ο αλγόριθμος μάθησης; Patrons? None Some Full No Yes Hungry? Yes French Type? No Ita Chi No Fri/Sat? Mexican Yes No No Yes Yes 27

Αλγόριθμος Μάθησης Δέντρων Απόφασης (1/3) function Decision-Tree-Learning (examples,attributes,default) returns a decision tree inputs: examples, set of examples, attributes: set of attributes, default: default value for the goal predicate if examples is empty then return default else if all examples have the same classification then return the classification else if attributes is empty then return MajorityValue(examples) else best ChooseAttribute(attributes,examples) tree a new decision tree with root test best for each value v i of best do examples i {elements of examples with best = v i } subtree Decision-Tree-Learning(examples i, attributes-best, MajorityValue(examples)) add a branch to tree with label v i and subtree subtree end return tree 28

Αλγόριθμος Μάθησης Δέντρων Απόφασης (2/3) Ένας αλγόριθμος μάθησης είναι καλός αν παράγει υποθέσεις που προβλέπουν επιτυχώς την κατηγοριοποίηση καινούργιων παραδειγμάτων. Συνήθως, όσο περισσότερα παραδείγματα χρησιμοποιούνται για την παραγωγή μιας υπόθεσης τόσο πιο ακριβής είναι η υπόθεση στις προβλέψεις της. 29

Αλγόριθμος Μάθησης Δέντρων Απόφασης (3/3) Μεθοδολογία εκτίμησης προβλέψεων Συγκέντρωσε ένα μεγάλο σύνολο παραδειγμάτων. Χώρισε το σε δύο σύνολα: το σύνολο εκπαίδευσης και το σύνολο τεστ. Τρέξε τον αλγόριθμο μάθησης με το σύνολο εκπαίδευσης ως παραδείγματα για να παράγεις μια υπόθεση Η. Μέτρησε το ποσοστό των παραδειγμάτων στο σύνολο τεστ που κατηγοριοποιούνται σωστά από την Η. Επανέλαβε τα βήματα 1 ως 4 με διαφορετικά μεγέθη συνόλων εκπαίδευσης και διαφορετικά τυχαία επιλεγμένα σύνολα τεστ. 30

Επεκτάσεις των Δέντρων Απόφασης Η μάθηση με δέντρα απόφασης μπορεί να επεκταθεί σε μεγαλύτερη ποικιλία προβλημάτων: Άγνωστα δεδομένα (missing data): Όταν λείπουν τιμές για ορισμένα attributes. Ορίσματα με πολλαπλές τιμές (multivalued attributes): π.χ. Όταν κάθε παράδειγμα δίνει διαφορετική τιμή για το attribute. Ορίσματα με συνεχή πεδία τιμών (continuous-valued attributes): π.χ. Ύψος, Βάρος. 31

Τέλος Ενότητας 32

Σημείωμα Αναφοράς Copyright, Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών, Στεργίου Κωνσταντίνος. «Τεχνητή Νοημοσύνη». Έκδοση: 1.0. Κοζάνη 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: https: //eclass.uowm.gr/courses/icte103/ 33

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Όχι Παράγωγα Έργα Μη Εμπορική Χρήση 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] h t t p ://creativecommons.org/licenses/by-nc-nd/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό 34

Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους. 35

Σημείωμα Χρήσης Έργων Τρίτων Το Έργο αυτό κάνει χρήση των ακόλουθων έργων: Εικόνες/Σχήματα/Διαγράμματα/Φωτογραφίες Τεχνητή Νοημοσύνη, Μια σύγχρονη προσέγγιση, S. Russel, P. Norvig, Εκδόσεις Κλειδάριθμος 36