Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σχετικά έγγραφα
Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Ασκήσεις μελέτης της 16 ης διάλεξης

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Δέντρα Απόφασης (Decision(

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σχεδίαση Αλγορίθμων -Τμήμα Πληροφορικής ΑΠΘ - Εξάμηνο 4ο

Δυναμικές Δομές Δεδομένων Λίστες Δένδρα - Γράφοι

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 )

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

Παραδείγματα (2) Διανυσματικοί Χώροι

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Μέθοδος μέγιστης πιθανοφάνειας

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Στατιστική Επιχειρήσεων ΙΙ

auth Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ - Εξάμηνο 4ο

Σχεδίαση και Ανάλυση Αλγορίθμων

1η Σειρά Γραπτών Ασκήσεων

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Υπολογιστικά & Διακριτά Μαθηματικά

Συμπίεση Δεδομένων

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων

πάχος 0 πλάτος 2a μήκος

Εισαγωγή στην Ανάλυση Αλγορίθμων

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

Τηλεπικοινωνιακά Συστήματα ΙΙ

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Μαθηματική Εισαγωγή Συναρτήσεις

Μέθοδος μέγιστης πιθανοφάνειας

ΔΥΑΔΙΚΗ ΑΝΑΖΗΤΗΣΗ & ΤΑΞΙΝΟΜΗΣΗ ΜΕ ΣΥΓΧΩΝΕΥΣΗ

Θεωρία Λήψης Αποφάσεων

ΓΕΛ ΝΕΑΣ ΠΕΡΑΜΟΥ ΠΙΘΑΝΟΤΗΤΕΣ ΚΛΑΣΙΚΟΣ ΟΡΙΣΜΟΣ-ΛΟΓΙΣΜΟΣ. Στατιστική ομαλότητα ή Νόμος των μεγάλων αριθμών

Αλγόριθµοι και Πολυπλοκότητα

Ταξινόμηση κάδου και ταξινόμηση Ρίζας Bucket-Sort και Radix-Sort

Συνδυαστική Απαρίθμηση

Υπερπροσαρμογή (Overfitting) (1)

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON

Δομές Δεδομένων. Ενότητα 13: B-Δέντρα/AVL-Δέντρα. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής. Δομές Δεδομένων

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

Όρια Αλγόριθμων Ταξινόμησης. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Θεωρία Γραφημάτων 6η Διάλεξη

Εφαρμοσμένα Μαθηματικά ΙΙ 7ο Σετ Ασκήσεων (Λύσεις) Γραμμικά Συστήματα- Απαλοιφή Gauss Επιμέλεια: I. Λυχναρόπουλος

ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

Συνδυαστική Απαρίθμηση

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ

Επιλογή. Επιμέλεια διαφανειών: Δ. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Θεωρία Πληροφορίας. Διάλεξη 5: Διακριτή πηγή πληροφορίας με μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αλγόριθμοι Ταξινόμησης Μέρος 4

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Συνδυαστική Απαρίθμηση

Κεφάλαιο 5ο: Ακέραιος προγραμματισμός

Α Π Α Ν Τ Η Σ Ε Ι Σ - Υ Π Ο Δ Ε Ι Ξ Ε Ι Σ Σ Τ Ι Σ Ε Ρ Ω Τ Η Σ Ε Ι Σ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Δυναμικός Προγραμματισμός

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

Αλγόριθμοι για ανάθεση συχνοτήτων και έλεγχο αποδοχής κλήσεων σε κυψελικά ασύρματα δίκτυα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση

Ανάκτηση Πληροφορίας

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (Εξ. Ιουνίου - 02/07/08) ΕΠΙΛΕΓΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ

Το Πολυεπίπεδο Perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Ψηφιακές Τηλεπικοινωνίες. Πιθανότητα Σφάλματος για Δυαδική Διαμόρφωση

Δομές Δεδομένων και Αλγόριθμοι

Δίαυλος Πληροφορίας. Δρ. Α. Πολίτης

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 2 : Πληροφορία και Εντροπία Διάλεξη: Κώστας Μαλιάτσος Χρήστος Ξενάκης, Κώστας Μαλιάτσος

Δίαυλος Πληροφορίας. Η λειτουργία του περιγράφεται από:

ΟΜΟΣΠΟΝΔΙΑ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑΔΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2019 Β ΦΑΣΗ

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο Κάθε δομή μπορεί να χρησιμοποιηθεί σε οποιοδήποτε πρόβλημα ή εφαρμογή

Transcript:

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage), όπου οι κλάσεις απορρίπτονται διαδοχικά (sequentially), έως ότου φτάσουμε σε μια κλάση που θα είναι τελικά αποδεκτή Για το λόγο αυτό: Ο χώρος των χαρακτηριστικών τεμαχίζεται σε μοναδικές περιοχές με έναν ακολουθιακό τρόπο Με την άφιξη ενός διανύσματος χαρακτηριστικών, λαμβάνονται διαδοχικές αποφάσεις καταχώρησης χαρακτηριστικών σε συγκεκριμένες περιοχές, ακολουθώντας ένα μονοπάτι κόμβων (nodes) ενός κατάλληλα κατασκευασμένου δένδρου Η ακολουθία των αποφάσεων εφαρμόζεται (συνήθως) σε μεμονωμένα χαρακτηριστικά και οι ερωτήσεις που εξετάζονται σε κάθε κόμβο είναι του τύπου: είναι το χαρακτηριστικό x i a όπου α είναι ένα προεπιλεγμένο κατώφλι (επιλέγεται κατά τη διάρκεια της εκπαίδευσης)

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Τα παρακάτω σχήματα αντιστοιχούν σε τέτοιο παράδειγμα Τα δένδρα αυτού του τύπου είναι γνωστά ως Συνήθη Δυαδικά Δένδρα Ταξινόμησης (Ordinary Binary Classification Trees (OBCT)) Τα υπερπέπιπεδα απόφασης που διαιρούν το χώρο σε περιοχές, είναι παράλληλα στους άξονες του χώρου των δειγμάτων Άλλοι τύποι διαίρεσης του χώροι είναι επίσης δυνατοί, παρότι είναι λιγότερο δημοφιλείς

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Σχεδιαστικά στοιχεία που ορίζουν ένα δένδρο απόφασης Κάθε κόμβος, t, αντιστοιχεί σε ένα υποσύνολο Χ t X, όπου X είναι το σύνολο εκπαίδευσης Σε κάθε κόμβο, το αντίστοιχο σύνολο, X t διαιρείται σε δύο (δυαδική διαίρεση) ξένα μεταξύ τους υποσύνολααπογόνους X t,y and X t,n, ώστε X t,y X t,n = Ø X t,y X t,n = X t X t,y είναι το υποσύνολο του X t για το οποίο η απάντηση στην ερώτηση του κόμβου t είναι ΝΑΙ X t,n είναι το υποσύνολο που αντιστοιχεί στο ΟΧΙ Η διαίρεση αποφασίζεται με βάση την ερώτηση (query) που υιοθετείται Στόχος είναι το καθένα από τα σύνολα που θα προκύψουν, X t,y και X t,n, να είναι «καθαρότερα» (να περιέχουν δηλ το καθένα σημεία από λιγότερες κλάσεις) σε σχέση με το X t

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Προαπαιτούμενα για τη δημιουργία ενός δένδρου απόφασης Κριτήριο διαμερισμού: καθορίζει τη βέλτιστη δυνατή διαμέριση του X t στα X t,y και X t,n Κριτήριο τερματισμού-διαμέρισης (stop-splitting): ελέγχει την ανάπτυξη του δένδρου έως τους τερματικούς κόμβους (φύλλα leafs) Κανόνας καταχώρησης τερματικού κόμβου σε κατηγορία

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Σύνολο ερωτήσεων: Στα δένδρα OBCT το σύνολο των ερωτήσεων είναι του τύπου είναι ; x i a Η επιλογή του συγκεκριμένου χαρακτηριστικού x i και της τιμής του κατωφλίου α, για κάθε κόμβο t, είναι το αποτέλεσμα αναζήτησης, κατά την εκπαίδευση, ανάμεσα στα χαρακτηριστικά και ένα σύνολο από δυνατές τιμές κατωφλίου Ο τελικός συνδυασμός είναι αυτός που οδηγεί στη βέλτιστη τιμή ενός κατάλληλου κριτηρίου

Κριτήριο διαμερισμού: Η κύρια ιδέα πίσω από τη διαίρεση σε κάθε κόμβο είναι τα υποσύνολα-απόγονοι X t,y και X t,n που θα προκύψουν να παρουσιάζουν μεγαλύτερο βαθμό ομογενοποίησης ως προς τις κλάσεις, σε σχέση με αυτόν του X t Έτσι το κριτήριο που θα επιλεγεί θα πρέπει να είναι σε συμφωνία με αυτόν το στόχο Ένα συχνά χρησιμοποιούμενο κριτήριο είναι ο βαθμός μη-καθαρότητας ενός κόμβου (node impurity): και ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ i N t P M i= 1 ( ω t) log 2 P( t) I( t) = P ω ( ω t) i N N i t t i όπου είναι ο αριθμός των στοιχείων του συνόλου X t, τα οποία ανήκουν στην κλάση ω i Η μείωση της μη-καθαρότητας ενός κόμβου (decrease in node impurity) ορίζεται ως: I( t) = I( t) N N t, Υ t I( t Υ ) t N N t, N t I( t N )

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Κριτήριο διαμερισμού (συν): Ο στόχος είναι να επιλεγούν σε κάθε κόμβο εκείνοι οι παράμετροι (χαρακτηριστικό και κατώφλι), που οδηγούν σε μία διαίρεση, η οποία παρουσιάζει τη μεγαλύτερη δυνατή μείωση της μη-καθαρότητας Γιατί η μεγαλύτερη δυνατή μείωση; Παρατηρείστε ότι η μέγιστη τιμή για την I(t) λαμβάνεται όταν όλες οι κλάσεις είναι ισοπίθανες, δηλ όταν το X t παρουσιάζει τον ελάχιστο δυνατό βαθμό ομογενοποίησης

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Παράδειγμα: Έστω ένα παράδειγμα δύο κλάσεων με τα ακόλουθα πέντε σημεία: (1,10)-ω 1, (2,7) ω 2, (3,6) -ω 1, (4,8) ω 2, (5,9) ω 2 Για το σύνολο αυτό είναι: P(ω 1 )=2/5=04 και P(ω 2 )=3/5=06 Άρα η εντροπία του είναι Ι = - ( P(ω 1 ) log 2 P(ω 1 ) + P(ω 2 ) log 2 P(ω 2 ) ) = 09710 Υπολογισμός της μείωσης της εντροπίας για την 1 η συνιστώσα και τιμή 1 (x 1 1): PY(ω 1 )=1/1=1 και PY(ω 2 )=0/1=0 ΙY = - (PY(ω 1 ) log 2 PY(ω 1 ) + PY(ω 2 ) log 2 PY(ω 2 ) )= 0 PN(ω 1 )=1/4=025 και PN(ω 2 )=3/4=075 ΙN = - (PN(ω 1 ) log 2 PN(ω 1 ) + PN(ω 2 ) log 2 PN(ω 2 ) ) = 08113 ΔΙ=Ι-(1/5)ΙΥ (4/5)ΙΝ = 09710 02*0-08*08113 = 03219 Εργαζόμενοι ομοίως για τις υπόλοιπες περιπτώσεις έχουμε: x 1 1 2 3 4 5 ΔΙ 032 002 042 017 0 x 2 6 7 8 9 10 ΔΙ 0 002 032 002 032 Η μέγιστη μείωση στην εντροπία επιτυγχάνεται για το 1 ο Χαρακτηριστικό και τιμή κατωφλίου 3 Άρα ο κανόνας για τον πρώτο κόμβο είναι: x 1 3

ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Κανόνας τερματισμού διαμέρισης Υιοθέτησε ένα κατώφλι T και σταμάτα την περαιτέρω διαίρεση ενός κόμβου (δηλ καταχώρησέ τον σαν φύλλοτερματικό κόμβο), αν η μείωση της μη-καθαρότητας είναι μικρότερη από T Δηλ όταν ο κόμβος t είναι αρκετά καθαρός Κανόνας αντιστοίχισης σε κλάση: Καταχώρησε ένα φύλλο στην κλάση ω j, για την οποία: j = arg max P( ω t ) i i

Summary of an OBCT algorithmic scheme: 11

Παρατηρήσεις: ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Ένας κρίσιμος παράγοντας κατά τη φάση σχεδιασμού είναι το μέγεθος του δένδρου Συνήθως το δένδρο αναπτύσσεται έως ότου φτάσει σε μεγάλο μέγεθος και στη συνέχεια εφαρμόζονται διάφορες τεχνικές κλαδέματος (pruning) Τα δένδρα απόφασης ανήκουν στην κατηγορία των ασταθών (unstable) ταξινομητών Αυτό μπορεί να αντιμετωπιστεί με τεχνικές «μέσου όρου» ( averaging techniques) Πχ χρησιμοποιώντας τεχνικές bootstrapping στο X, κατασκευάζονται διάφορα δένδρα, T i, i=1, 2,, B Η απόφαση ταξινόμησης λαμβάνεται με βάση έναν κανόνα πλειοψηφίας (majority voting)

Example taken from http://wwwcsemsuedu/~cse802/decisiontreespdf 13

14

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Η βασική φιλοσοφία πίσω από το συνδυασμό διαφορετικών ταξινομητών βασίζεται στο γεγονός ότι ακόμα και ο «καλύτερος» ταξινομητής αποτυγχάνει σε μερικά διανύσματα όπου άλλοι ταξινομητές μπορεί να δώσουν σωστή ταξινόμηση Ο συνδυασμός ταξινομητών σκοπεύει στην εκμετάλλευση αυτής της συμπληρωματικής πληροφορίας (complementary information) που δίνεται από διάφορους ταξινομητές Έτσι κάποιος σχεδιάζει διαφορετικούς βέλτιστους ταξινομητές και στη συνέχεια συνδυάζει τα αποτελέσματα με βάση ένα συγκεκριμένο κανόνα Έστω ότι καθένας από τους, L ταξινομητές που σχεδιάστηκαν δίνει στην έξοδό του τις εκ των υστέρων πιθανότητας P( ω i x), i = 1, 2,, M

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Κανόνας γινομένου: Καταχώρησε το στην κλάση : x ω i P όπου ταξινομητή ( ω x) j k i = arg max k L j= 1 P j ( ω x) k είναι η αντίστοιχη εκ των υστέρων πιθανότητα του j th Κανόνας άθροισης: Καταχώρησε το στην κλάση : i = k x arg max L j= 1 P j ( ω x) k ω i

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Παράδειγμα: Έστω ένα πρόβλημα 3 κλάσεων, ω 1, ω 2, ω 3, με L=4 ταξινομητές Σχηματικά η ταξινόμηση ενός διανύσματος x σε μια από τις τρεις κλάσεις γίνεται ως εξής: x ω 1 ω 2 ω 3 Ταξ 1 P 1 (ω 1 x) P 1 (ω 2 x) P 1 (ω 3 x) Ταξ 2 P 2 (ω 1 x) P 2 (ω 2 x) P 2 (ω 3 x) Ταξ 3 P 3 (ω 1 x) P 3 (ω 2 x) P 3 (ω 3 x) Ταξ4 P 4 (ω 1 x) P 4 (ω 2 x) P 4 (ω 3 x) Γιν Π j P j (ω 1 x) Π j P j (ω 2 x) Π j P j (ω 3 x) Άθρ Σ j P j (ω 1 x) Σ j P j (ω 2 x) Σ j P j (ω 3 x) i: argmax k=1,2,3 Π j P j (ω k x) i: argmax k=1,2,3 Σ j P j (ω k x)

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Κανόνας πλειοψηφίας: Καταχώρησε το στην κλάση για την οποία υπάρχει ομοφωνία ή όταν τουλάχιστον l c από τους ταξινομητές συμφωνούν στην κλάση l c = L 2 L Διαφορετικά η απόφαση είναι απόρριψη (rejection), δηλ δεν λαμβάνεται καμία απόφαση Έτσι σωστή απόφαση λαμβάνεται όταν η πλειοψηφία των ταξινομητών συμφωνεί με τη σωστή κατηγορία και λάθος όταν η πλειοψηφία συμφωνεί με μία λάθος κατηγορία x + 1, L even + 1, L odd 2

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Εξαρτημένοι ή ανεξάρτητοι ταξινομητές; Παρότι δεν υπάρχουν γενικά θεωρητικά αποτελέσματα, το πείραμα έδειξε ότι όσο πιο ανεξάρτητοι είναι οι ταξινομητές ως προς τις αποφάσεις τους, τόσο πιο πολύ αναμένεται η λήψη βελτιωμένων αποτελεσμάτων μετά το συνδυασμό των επιμέρους αποφάσεων Ωστόσο, δεν υπάρχει εγγύηση ότι ο συνδυασμός ταξινομητών οδηγεί σε καλύτερη απόδοση συγκρινόμενος με την απόδοση του καλύτερου ανάμεσα στους ταξινομητές

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Προς την ανεξαρτησία: Πιθανά σενάρια Bootstrapping: Πρόκειται για μια δημοφιλή τεχνική συνδυασμού ασταθών ταξινομητών, όπως τα δένδρα απόφασης Πιο συγκεκριμένα, Παράγονται αρκετά σύνολα δεδομένων μέσω ομοιόμορφης δειγματοληψίας (uniform sampling) με επανατοποθέτηση από το διαθέσιμο σύνολο δεδομένων Με βάση κάθε σύνολο δεδομένων παράγεται και ένας ταξινομητής Η απόφαση καταχώρησης δεδομένου διανύσματος σε μια κλάση προκύπτει από το συνδυασμό (πχ με χρήση του κανόνα πλειοψηφίας) των αποφάσεων των μεμονομένων ταξινομητών Φάση εκπαίδευσης Φάση λειτουργίας Y Bootstrapping Y 1 Y 2 Εκπ/ση Ταξινομητής 1 Ταξινομητής 2 x Ταξινομητής 1 Ταξινομητής 2 Κανόνας ταξινόμησης Y B Ταξινομητής B Ταξινομητής B

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Προς την ανεξαρτησία: Πιθανά σενάρια Stacking: Εδώ χρησιμοποιείται ένας συνδυαστής-ταξινομητής που χρειάζεται και αυτός εκπαίδευση Πιο συγκεκριμένα έχουμε την ακόλουθη διαδικασία: Διαίρεσε το διαθέσιμο σύνολο δεδομένων Y σε δύο μέρη, Y 1 και Y 2 Εκπαίδευσε B μεμονωμένους ταξινομητές χρησιμοποιώντας το Y 1 Εφάρμοσε κάθε διάνυσμα του Y 2 στους Β ταξινομητές και σχημάτισε το B-διάστατο διάνυσμα με τις εξόδους των ταξινομητών (Έτσι, κάθε διάνυσμα του Y 2 αναπαρίσταται τώρα από το παραπάνω B-διάστατο διάνυσμα) Έστω Y 2 το νέο σύνολο Χρησιμοποιήσε το Y 2 για την εκπαίδευση του συνδυαστή-ταξινομητή Φάση εκπ/σης I Φάση εκπ/σης II Y 1 Εκπ/ση Ταξινομητής 1 Ταξινομητής 2 Ταξινομητής 1 Ταξινομητής 2 Y Y 2 2 Εκπ/ση Συνδυαστής- Ταξινομητής Ταξινομητής B Ταξινομητής B

ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Προς την ανεξαρτησία: Πιθανά σενάρια Χρήση διαφορετικών υποχώρων για την εκπαίδευση μεμονωμένων ταξινομητών: Εδώ, κάθε μεμονωμένος ταξινομητής εκπαιδεύεται σε διαφορετικό υπόχωρο του χώρου χαρακτηριστικών Δηλαδή, κάθε ταξινομητής εκπαιδεύεται χρησιμοποιώντας διαφορετικά χαρακτηριστικά των εμπλεκομένων οντοτήτων x x 1 x k x k+1 x m x m+1 x q x 1 x 11 x 1k x 1,k+1 x 1m x 1,m+1 x 1q x N x N1 x Nk x N,k+1 x Nm x N,m+1 x Nq Εκπ/ση Εκπ/ση Εκπ/ση Ταξινομητής 1 Ταξινομητής 2 Ταξινομητής B Συνδυαστικός κανόνας

Παρατηρήσεις: Random forests: Εδώ ένα σύνολο Β ταξινομητών δένδρων απόφασης δημιουργούνται με τέτοιο τρόπο ώστε αυτοί να είναι όσο το δυνατόν πιο ανεξάρτητοι Δοθέντος ενός συνόλου Ν l-διάστατων διανυσμάτων δεδομένων, Χ, έχουμε: Φάση δημιουργίας ταξινομητών (δένδρων απόφασης): - Δημιούργησε Β σύνολα δεδομένων, Χ 1,, Χ Β, μεγέθους Ν το καθένα μέσω τυχαίας δειγματοληψίας με επανατοποθέτηση από το Χ - Με βάση τα Χ 1,, Χ Β, δημιούργησε αντίστοιχα δένδρα απόφασης, Τ 1,, Τ Β Για τον καθορισμό του κανόνα ενός κόμβου σε καθένα από αυτά, εξέτασε μόνο λ(<<l) χαρακτηριστικά, τυχαία επιλεγμένα, από το σύνολο των χαρακτηριστικών - Δεν υπάρχει διαδικασία «κλαδέματος» Φάση λειτουργίας: Για δεδομένο x: ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ - Ταξινόμησέ το με βάση τα Τ 1,, Τ Β - Συνδύασε τα παραπάνω αποτελέσματα, ώστε να προκύψει η τελική ταξινόμηση για το x

Παρατηρήσεις: ΣΥΝΔΥΑΖΟΝΤΑΣ ΤΑΞΙΝΟΜΗΤΕΣ Οι κανόνες πλειοψηφίας και αθροίσματος συγκαταλέγονται ανάμεσα στα πιο δημοφιλή συνδυαστικά σχήματα Η εκπαίδευση των μεμονωμένων ταξινομητών σε διαφορετικούς υποχώρους του χώρου των χαρακτηριστικών φαίνεται να οδηγεί σε σημαντικά καλύτερα αποτελέσματα σε σχέση με την περίπτωση όπου οι ταξινομητές εκπαιδεύονται στον ίδιο υπόχωρο Εκτός από τους τρεις παραπάνω κανόνες, μπορούν να υιοθετηθούν και άλλοι όπως η τιμή της διαμέσου (Median value) των εξόδων των μεμονωμένων ταξινομητών Boosting προσέγγιση: Ένας «ισχυρός» ταξινομητής δημιουργείται με τη διαδοχική προσθήκη «ασθενών» (weak) ταξινομητών, οι οποίοι εκπαιδεύονται δίνοντας έμφαση στα σημεία που απέτυχε να ταξινομήσει σωστά ο συνδυασμός των προηγούμενων ασθενών ταξινομητών