Αναγνώριση Προτύπων. Σημερινό Μάθημα

Σχετικά έγγραφα
Επιλογή Χαρακτηριστικών Feature selection Αντικειμενική συνάρτηση Φίλτρα Wrappers Διαδικασία Αναζήτησης Σειριακοί αλγόριθμοι Εκθετικοί αλγόριθμοι

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αναγνώριση Προτύπων. Σήμερα! Λόγος Πιθανοφάνειας Πιθανότητα Λάθους Κόστος Ρίσκο Bayes Ελάχιστη πιθανότητα λάθους για πολλές κλάσεις

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αναγνώριση Προτύπων 1

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

{ i f i == 0 and p > 0

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Ο όρος εισήχθηκε το 1961 από τον Bellman Αναφέρεται στο πρόβλημα της ανάλυσης δεδομένων πολλών μεταβλητών καθώς αυξάνει η διάσταση.

Αναγνώριση Προτύπων. Σημερινό Μάθημα

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

ΣΧΟΛΙΚΟ ΕΤΟΣ ΕΥΘΥΓΡΑΜΜΗ ΟΜΑΛΗ ΚΙΝΗΣΗ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ A ΛΥΚΕΙΟΥ. Ονοματεπώνυμο Τμήμα

Εισαγωγικά. 1.1 Η σ-αλγεβρα ως πληροφορία

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

Οι γέφυρες του ποταμού... Pregel (Konigsberg)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Αλγόριθμοι & Βελτιστοποίηση

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

Συναρτήσεις. Σημερινό μάθημα

ΣΤΟ ΙΑΤΡΕΙΟ. Με την πιστοποίηση του αποκτά πρόσβαση στο περιβάλλον του ιατρού που παρέχει η εφαρμογή.

Συναρτήσεις & Κλάσεις

ΤΑΞΙΝΟΜΗΣΗ ΟΡΓΑΝΙΣΜΩΝ

τεσσάρων βάσεων δεδομένων που θα αντιστοιχούν στους συνδρομητές

ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Δήμος Σωτήριος Υ.Δ. Εργαστήριο Λογικής & Επιστήμης Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών Σ.Η.Μ.Μ.Υ. Ε.Μ.Π.

ΑΣΕΠ 2000 ΑΣΕΠ 2000 Εμπορική Τράπεζα 1983 Υπουργείο Κοιν. Υπηρ. 1983

Σχέσεις και ιδιότητές τους

Επίλυση ειδικών μορφών ΣΔΕ

5.1 Μετρήσιμες συναρτήσεις

Ψηφιακή Εικόνα. Σημερινό μάθημα!

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ Γ ΛΥΚΕΙΟΥ

HY 280. θεμελιακές έννοιες της επιστήμης του υπολογισμού ΑΣΚΗΣΕΙΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ. Γεώργιος Φρ.

Έννοια. Η αποδοχή της κληρονομίας αποτελεί δικαίωμα του κληρονόμου, άρα δεν

Φροντιστήριο 2: Ανάλυση Αλγόριθμου. Νικόλας Νικολάου ΕΠΛ432: Κατανεμημένοι Αλγόριθμοι 1 / 10

Ευρωπαϊκά παράγωγα Ευρωπαϊκά δικαιώματα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

Δ Ι Α Κ Ρ Ι Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α. 1η σειρά ασκήσεων

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

Pointers. Σημερινό Μάθημα! Χρήση pointer Τελεστής * Τελεστής & Γενικοί δείκτες Ανάκληση Δέσμευση μνήμης new / delete Pointer σε αντικείμενο 2

Τρίτη, 05 Ιουνίου 2001 ΤΕΧΝΟΛΟΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ Γ ΛΥΚΕΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

ΜΑΘΗΜΑ: ΠΟΛΙΤΙΚΗ ΟΙΚΟΝΟΜΙΑ-ΔΗΜΟΣΙΑ ΟΙΚΟΝΟΜΙΚΗ

έγγραφο σε κάθε διάσταση αντιστοιχούν στο πλήθος εμφανίσεων της λέξης (που αντιστοιχεί στη συγκεκριμένη διάσταση) εντός του εγγράφου.

Προτεινόμενα θέματα στο μάθημα. Αρχές Οικονομικής Θεωρίας ΟΜΑΔΑ Α. Στις προτάσεις από Α.1. μέχρι και Α10 να γράψετε στο τετράδιό σας τον αριθμό της

G περιέχει τουλάχιστον μία ακμή στο S. spanning tree στο γράφημα G.

Ο Ισχυρός Νόμος των Μεγάλων Αριθμών

Ανελίξεις σε συνεχή χρόνο

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ Η ΚΑΤΑΝΑΛΩΤΙΚΗ ΑΠΟΦΑΣΗ. Άσκηση με θέμα τη μεγιστοποίηση της χρησιμότητας του καταναλωτή

Μία χρονοσειρά (time serie) είναι μια ακολουθία

όπου ω j η κλάση j και x το διάνυσμα χαρακτηριστικών Ένας τυπικός κανόνας απόφασης είναι να επιλέγουμε την κλάση με τη μέγιστη P[ω j x]

«ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ»

Συμπεριφοριακή Επιχειρηματικότητα

2. Κατάθεσε κάποιος στην Εθνική Τράπεζα 4800 με επιτόκιο 3%. Μετά από πόσο χρόνο θα πάρει τόκο 60 ; α) 90 ημέρες β) 1,5 έτη γ) 5 μήνες δ) 24 μήνες

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΡΩΤΗΣΕΙΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

Το κράτος είναι φτιαγμένο για τον άνθρωπο και όχι ο άνθρωπος για το κράτος. A. Einstein Πηγή:

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εξαναγκασμένες ταλαντώσεις, Ιδιοτιμές με πολλαπλότητα, Εκθετικά πινάκων. 9 Απριλίου 2013, Βόλος

Εργαστηριακή Άσκηση Θερμομόρφωση (Thermoforming)

Επίλυση δικτύων διανομής

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

Εφαρμογές στην κίνηση Brown

Επιλέγοντας τις κατάλληλες γλάστρες

Εστω X σύνολο και A μια σ-άλγεβρα στο X. Ονομάζουμε το ζεύγος (X, A) μετρήσιμο χώρο.

ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

Η ανισότητα α β α±β α + β με α, β C και η χρήση της στην εύρεση ακροτάτων.

Eισηγητής: Μουσουλή Μαρία

ΣΥΝΟΛΑ (προσέξτε τα κοινά χαρακτηριστικά των παρακάτω προτάσεων) Οι άνθρωποι που σπουδάζουν ΤΠ&ΕΣ και βρίσκονται στην αίθουσα

602. Συναρτησιακή Ανάλυση. Υποδείξεις για τις Ασκήσεις

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

(3 ο ) Εξαντλητική αναζήτηση I: μεταθέσεις & υποσύνολα (4 o ) Εξαντλητική αναζήτηση II: συνδυασμοί, διατάξεις & διαμερίσεις

Χαρτοφυλάκια και arbitrage

17 Μαρτίου 2013, Βόλος

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Αντικειμενοστραφής. Προγραμματισμού

Η εξίσωση Black-Scholes

12/1/2006 Διακριτά Μαθηματικά. Ορισμός. Υπό γράφημα Τ γραφήματος Γ καλείται συνδετικό (ή επικαλύπτον)

Κατασκευή της κίνησης Brown και απλές ιδιότητες

Μητροπολιτικά Οπτικά Δίκτυα Εισαγωγή

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

ΔΙΚΑΙΩΜΑΤΑ ΠΡΟΣΟΡΜΙΣΗΣ, ΠΑΡΑΒΟΛΗΣ, ΠΡΥΜΝΟΔΕΤΗΣΗΣ ΚΑΙ ΕΛΛΙΜΕΝΙΣΜΟΥ ΣΚΑΦΩΝ ΣΕ ΘΑΛΑΣΣΙΕΣ ΠΕΡΙΟΧΕΣ. (ΛΙΜΑΝΙΑ κ.λπ.) ΤΟΠΙΚΗΣ ΑΡΜΟΔΙΟΤΗΤΑΣ ΛΙΜΕΝΙΚΩΝ

Παντού σε αυτό το κεφάλαιο, αν δεν αναφέρεται κάτι διαφορετικό, δουλεύουμε σε ένα χώρο πιθανότητας (Ω, F, P) και η G F είναι μια σ-άλγεβρα.

Μονάδες α. Να γράψετε στο τετράδιό σας τον παρακάτω πίνακα σωστά συµπληρωµένο.

Αναλυτικές ιδιότητες

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Γενικό Λύκειο Μαραθοκάμπου Σάμου. Άλγεβρα Β λυκείου. 13 Οκτώβρη 2016

Μεταγλωττιστές ΙΙ. Καταμερισμός καταχωρητών. Νικόλαος Καββαδίας Μεταγλωττιστές ΙΙ

Περιγραφή Περιγράμματος

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Τρίτη Γραπτή Εργασία στη Στατιστική

( ιμερείς) ΙΜΕΛΕΙΣ ΣΧΕΣΕΙΣ Α Β «απεικονίσεις»

1. Εστω ότι A, B, C είναι γενικοί 2 2 πίνακες, δηλαδή, a 21 a, και ανάλογα για τους B, C. Υπολογίστε τους πίνακες (A B) C και A (B C) και

ΜΑΘΗΜΑ: ΓΕΝΙΚΟ ΔΙΟΙΚΗΤΙΚΟ ΔΙΚΑΙΟ ΔΙΚΑΣΤΩΝ

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

ΘΕΜΑ: Aποτελεσματικότητα της νομισματικής και δημοσιονομικής πολιτικής σε μια ανοικτή οικονομία

Συναρτήσεις ΙΙ. Σημερινό μάθημα

Martingales. 3.1 Ορισμός και παραδείγματα

Κληρονομικότητα. Σήμερα! Κλάση Βάσης Παράγωγη κλάση Απλή κληρονομικότητα Protected δεδομένα Constructors & Destructors overloading

Transcript:

Αναγνώριση Προτύπων Σημερινό Μάθημα Επιλογή Χαρακτηριστικών Feature selection Αντικειμενική συνάρτηση Φίλτρα Wrappers Διαδικασία Αναζήτησης Σειριακοί αλγόριθμοι Εκθετικοί αλγόριθμοι Τυχαίοι αλγόριθμοι 1

Feature extraction vs. Feature selection Υπάρχουν δύο τρόποι να μειώσουμε τις διαστάσεις ενός διανύσματος (feature): Feature extraction (εξαγωγή χαρακτηριστικών): Μετασχηματισμός των υπαρχόντων δεδομένων σε χώρο μικρότερο διαστάσεων Feature selection (επιλογή χαρακτηριστικών): Επιλογή ενός υποσυνόλου των υπάρχοντων χαρακτηριστικών χωρίς μετασχηματισμό. Επιλογή Χαρακτηριστικών Feature selection Η Επιλογή χαρακτηριστικών αποκαλείται επίσης Feature Subset Selection (FSS) Αν και η FSS μπορεί να θεωρηθεί ως ειδική περίπτωση της εξαγωγής χαρακτηριστικών είναι πολύ διαφορετικό πρόβλημα Η FSS βλέπει το πρόβλημα της διαστατικότητας από άλλη άποψη Υπάρχει διαφορετικό σετ μεθοδολογιών για την FSS 2

Ορισμός Δεδομένου ενός σετ X Ν ={x i i=1 N}, επιλέξτε υποσύνολο Y M ={x i1, x i2,, x im }, με Μ<Νόπου βελτιστοποιεί μια αντικειμενική συνάρτηση J(Y), ιδανικά, την πιθανότητα σωστής ταξινόμησης (classification) Επιλογή Χαρακτηριστικών Η επιλογή χαρακτηριστικών είναι αναγκαία σε ορισμένες περιπτώσεις: Μπορεί η διαδικασία επίτευξης των χαρακτηριστικών να είναι ακριβή Μπορεί να θέλουμε να εξάγουμε κανόνες με νόημα Μπορεί τα αρχικά χαρακτηριστικά να μην είναι μετρήσιμα μεγέθη Επιπλέον λιγότερα χαρακτηριστικά σημαίνει Λιγότερες παράμετροι στην αναγνώριση Μειωμένη πολυπλοκότητα Καλύτερο υπολογιστικό χρόνο 3

Διαδικασία Αναζήτησης Διεξοδική αξιολόγηση των υποσυνόλων χαρακτηριστικών συμπεριλαμβάνει συνδυασμούς για σταθερή τιμή του M και 2 Ν συνδυασμούς αν πρέπει να υπολογίσουμε το Μ. Το νούμερο είναι ανέφικτο ακόμα και για μέτριες τιμές των Μ και Ν Για παράδειγμα για Μ=10 και Ν=20 έχουμε 1874756 υποσύνολα Για το λόγο αυτό απαιτείται μια διαδικασία να κατευθύνει το FSS σε όλους τους πιθανούς συνδυασμούς. Στρατηγική Αναζήτησης και Αντικειμενική συνάρτηση Η επιλογή υποσυνόλου χαρακτηριστικών απαιτεί: Μια διαδικασία αναζήτησης για την επιλογή υποψήφιων υποσυνόλων Μια αντικειμενική συνάρτηση για να αξιολογηθούν οι υποψήφιοι 4

Στρατηγική Αναζήτησης και Αντικειμενική συνάρτηση Αντικειμενική συνάρτηση Η αντικειμενική συνάρτηση αξιολογεί τα διάφορα υποσύνολα και επιστρέφει ένα μέτρο της καταλληλότητας τους. Υπάρχουν δύο κατηγορίες αντικειμενικών συναρτήσεων: Φίλτρα: Η αντικειμενική συνάρτηση αξιολογεί τα υποσύνολα από την περιεχόμενη πληροφορία, την απόσταση των κλάσεων και τη στατιστική ανεξαρτησία τους Wrappers: Η αντικειμενική συνάρτηση είναι μέθοδος αναγνώρισης προτύπων που αξιολογεί τα υποσύνολα βάσει της προβλεπόμενης ακρίβειας (τεστ). 5

Φίλτρα Μέτρα απόστασης ή διαχωριστικότητας: αυτές οι μέθοδοι χρησιμοποιούν μέτρα απόστασης για να μετρήσουν τη διαχωριστικότητα των κλάσεων π.χ. Ευκλείδεια απόσταση, S W & S B (LDA) Μέτρα συσχέτισης και πληροφορίας: Αυτές οι μέθοδοι βασίζονται στο σκεπτικό ότι καλά υποσύνολα χαρακτηριστικών περιλαμβάνουν χαρακτηριστικά υψηλά συσχετιζόμενα εντός της ίδιας κλάσης και λιγότερο συσχετιζόμενα με άλλες κλάσεις Φίλτρα vs. Wrappers Φίλτρα Πλεονεκτήματα Πλεονεκτήματα Γρήγορη Εκτέλεση: γιατί δεν περιλαμβάνουν επαναλήψεις Γενικότητα: γιατί δεν βασίζονται σε ένα συγκεκριμένο ταξινομητή (classifier) Μειονεκτήματα Τάση να επιλέγουν μεγάλα υποσύνολα 6

Φίλτρα vs. Wrappers Wrappers Πλεονεκτήματα Ακρίβεια: γιατί βασίζονται στην ιδιαίτερη αλληλεπίδραση μεταξύ του ταξινομητή και της βάσης δεδομένων Ικανότητα γενίκευσης: αποφεύγεται το overfitting εξαιτίας της χρήσης cross validation Μειονεκτήματα Αργή εκτέλεση: λόγω των επαναλήψεων και τον επανεκπαιδεύσεων που απαιτούνται Έλλειψη γενικότητας ως προς τη μέθοδο αναγνώρισης Στρατηγικές Αναζήτησης Υπάρχει μεγάλο πλήθος στρατηγικών αναζήτησης που χωρίζονται σε τρεις κατηγορίες: Σειριακοί αλγόριθμοι: προσθέτουν ή αφαιρούν χαρακτηριστικά σειριακά αλλά τείνουν να παγιδεύονται σε τοπικά ελάχιστα Εκθετικοί αλγόριθμοι: αποτιμούν ένα πλήθος υποσυνόλων που αυξάνει εκθετικά με τη διάσταση Τυχαίοι αλγόριθμοι: επιστρατεύουν το τυχαίο στο ψάξιμο τους για να αποφύγουν την παγίδευση σε τοπικά ελάχιστα 7

Απλός σειριακός αλγόριθμος επιλογής Μια τεχνική θα ήταν να εκτιμήσουμε το κάθε χαρακτηριστικό ξεχωριστά και να επιλέξουμε τα Μ καλύτερα Αυτή η στρατηγική θα δουλέψει σπάνια γιατί δεν εξετάζει την μεταξύ τους εξάρτηση των χαρακτηριστικών Απλός σειριακός αλγόριθμος επιλογής Παράδειγμα Έστω ένα πρόβλημα 4 διάστατο με 5 κλάσεις: Σκοπός είναι να επιλέξουμε το καλύτερο σετ 2 χαρακτηριστικών Μια λογική αντικειμενική συνάρτηση θα έδινε την εξής κατάταξη: J(x 1 )>J(x 2 ) J(x 3 )>J(x 4 ) όπου: το x 1 φαίνεται το καλύτερο χαρακτηριστικό λόγω του ότι διαχωρίζει τις ω 1, ω 2, ω 3 και {ω 4, ω 5 } Τα x 2 και x 3 έχουν παρόμοια συμπεριφορά ρ αφού διακρίνουν τις κλάσεις σε 3 ομάδες Το x 4 μπορεί μόνο να διακρίνει ω 4 από ω 5 Αν διακρίνουμε με το κριτήριο του αλγορίθμου θα έπρεπε να επιλέξουμε x 1 και x 2 ή x 3. Είναι φανερό όμως ότι η πιο σωστή επιλογή είναι {x 1, x 4 } 8

Sequential Forward Selection (SFS) Είναι ο πιο απλός σειριακός greedy αλγόριθμος Ξεκινώντας από ένα άδειο σετ χαρακτηριστικών, προσθέτει σειριακά τα χαρακτηριστικά που βελτιώνουν το αποτέλεσμα σε συνδυασμό με τα υπάρχοντα χαρακτηριστικά Sequential Forward Selection (SFS) Αλγόριθμος 1. Όρισε σετ Υ 0 ={ø} 2. Επέλεξε x + + : x = arg max[ J ( Y 3. Y k+1 =Y k +x +, k=k+1 x Y 4. Επανάληψη από βήμα 2 k k + x)] άδειο σετ γεμάτο σετ 9

Sequential Forward Selection (SFS) Ο SFS έχει καλύτερη απόδοση όταν είναι μικρό το πλήθος των βέλτιστων χαρακτηριστικών Στην αρχή του αλγορίθμου είναι πολλές οι πιθανές καταστάσεις που μπορούν να εξεταστούν Κοντά στο τέλος η επιλογές στενεύουν Το μεγαλύτερο μειονέκτημα του SFS είναι ότι δεν μπορεί να αφαιρέσει από το σετ χαρακτηριστικά που έχουν ήδη επιλεγεί. SFS Παράδειγμα Κάνετε SFS θεωρώντας την αντικειμενική συνάρτηση J(X): το x k γίνεται 1 όταν επιλέγεται το χαρακτηριστικό αλλιώς είναι 0. 10

Sequential Backward Selection (SBS) Η Προς τα πίσω Σειριακή Επιλογή λειτουργεί με τον αντίθετο τρόπο από την SFS Ξεκινώντας από το πλήρες σετ, αφαιρεί το χαρακτηριστικό με τη μικρότερη απόδοση στην αντικειμενική συνάρτηση Sequential Backward Selection (SBS) 1. Ξεκίνα με σετ Υ 0 =Χ 2. Αφαίρεσε x : 3. Y k+1 =Y k x, k=k+1 = arg max[ J ( Y 4. Επανέλαβε από βήμα 2 x x Y k k x)] άδειο σετ γεμάτο σετ 11

Sequential Backward Selection (SBS) H SBS δουλεύει καλά όταν το βέλτιστο υποσύνολο έχει πολλά features (τελειώνει γρηγορότερα), καθώς η SBS ξοδεύει περισσότερο χρόνο για να επισκεφτεί μεγάλα υποσύνολα. Το μεγαλύτερο μειονέκτημα είναι η ανικανότητα της SBS να επανεκτιμήσει feature που έχει απορρίψει. Plus L Minus R Selection (LRS) Είναι μια γενίκευση των SFS και SBS Αν L>R, η LRS ξεκινάει από άδειο σετ και επαναλαμβανόμενα προσθέτει L features και αφαιρεί R features Αν L<R, η LRS ξεκινάει από το γεμάτο σετ και επαναλαμβανόμενα αφαιρεί R features ενώ προσθέτει L features 12

Plus L Minus R Selection (LRS) 1. Αν L>R τότε ξεκίνα με Υ={ø} Αλλιώς ξεκίνα με Υ=Χ πήγαινε στο 3 2. Επανέλαβε L φορές x + = arg max[ J ( Y x Y + x)] Y k+1 =Y k +x +, kk1 k=k+1 3. Επανέλαβε R φορές x = arg max[ J ( Y x)] x Y Y k+1 =Y k x, k=k+1 4. Πήγαινε στο 2 k k k k άδειο σετ γεμάτο σετ Plus L Minus R Selection (LRS) Το LRS προσπαθεί να εξουδετερώσει τις αδυναμίες των SFS και SBS με επαναλήψεις των SFS και SBS με επαναλήψεις Το μεγαλύτερο του μειονέκτημα είναι ότι δεν υπάρχει τρόπος για να προβλεφθούν τα βέλτιστα L και R 13

Bidirectional Search (BDS) Η δικατευθυντήρια αναζήτηση είναι μια παράλληλη υλοποίηση των SFS και SBS Εκτελείται SFS για το άδειο σετ και SBS για το γεμάτο Για να εξασφαλίσουμε ότι δίνουν την ίδια λύση πρέπει να εξασφαλίσουμε ότι υπάρχει συμφωνία στις αφαιρέσεις του ενός και στις προσθήκες του άλλου. (έλεγχος σε κάθε προσθήκη ή διαγραφή) άδειο σετ γεμάτο σετ Bidirectional Search (BDS) 1. Ξεκίνησε SFS με Υ F ={ø} 2. Ξεκίνησε SBS με Υ B =X 3. 4. 5. Πήγαινε στο 3 14

Εκθετικοί αλγόριθμοι Branch and Bound (Β&Β) διακλάδωση και οριοθέτηση Approximate Monotonicity με Branch and Bound ΑΜΒ&Β Beam Αναζήτηση Branch and Bound Ο αλόγριθμος Branch and Bound εγγυάται την ανεύρεση του βέλτιστου υποσυνόλου χαρακτηριστικών υπό το πρίσμα της μονοτονικότητας Η μονοτονικότητα υποστηρίζει ότι η πρόσθεση χαρακτηριστικών μπορεί μόνο να αυξήσει την απόδοση της αντικειμενικής συνάρτησης: 15

Branch and Bound Ο αλγόριθμος αρχίζει από το πλήρες σετ και αφαιρεί χαρακτηριστικά. Κόμβοι που η αντικειμενική τους συνάρτηση είναι χαμηλότερη από την τρέχουσα δεν εξετάζονται καθώς σύμφωνα με την υπόθεση της μονοτονικότητας δεν αναμένεται να δώσουν καλύτερη λύση Branch and Bound Θεωρήστε το υποσύνολο M =N M features που έχει ήδη απορριφθεί έχει ήδη απορριφθεί Καθώς δεν υπάρχει καθορισμένη σειρά θεωρούμε i 1 <i 2 <...i M Για Ν=6 και Μ=2 έχουμε το δέντρο: 16

Branch and Bound Approximate Monotonicity με Β&Β Ο AMB&B είναι μια παραλλαγή του κλασσικού αλγορίθμου Β&Β Θεωρήστε ότι τρέχουμε τον Β&Β θέτοντας σαν κριτήριο ένα ποσοστό σφάλματος Ε(Υ)=τ αντί τα Μ χαρακτηριστικά Υπό τον AMB&B, ένα υποσύνολο Υ θα θεωρείται Εφικτό αν Ε(Υ) τ Εφικτό υπό συνθήκη εάν Ε(Υ) τ(1+δ) Ανέφικτο αν Ε(Υ)>τ(1+Δ) 17

Beam Αναζήτηση (ΒS) Οργανώνεται μια ουρά των καταστάσεων από το καλύτερο προς το χειρότερο Σε κάθε επανάληψη, ο BS αξιολογεί όλες τις πιθανές καταστάσεις που απορρέουν από την προσθήκη ενός feature στο υποσύνολο Αν το μέγεθος της ουράς τεθεί 1 ο BS συμπίπτει με τον SFS Beam Αναζήτηση (ΒS) Παράδειγμα Για 4 διάστατο χώρο και ουρά μεγέθους 3 ρ μ γ ς Δεν υπάρχει εγγύηση ότι θα βρεθεί το βέλτιστο 18

Τυχαίοι αλγόριθμοι Random Generation plus Sequential Selection (RGSS) Γενετικοί Αλγόριθμοι (GA) Random Generation plus Sequential Selection O RGSS είναι μια προσπάθεια εισαγωγής του «τυχαίου» στους αλγόριθμους SFS και SBS για να αποφύγουμε τα τοπικά ελάχιστα. 1. Επανέλαβε για αριθμό επαναλήψεων 2. Δημιούργησε τυχαίο υποσύνολο χαρακτηριστικών 3b.Εκτέλεσε SFS στο υποσύνολο 3c. Εκτέλεσε SBS στο υποσύνολο 19

Δομή Γενετικού Αλγόριθμου Κατά την διάρκεια της επαναληπτικής εκτέλεσης t, ο ΓA διατηρεί ένα πληθυσμό από πιθανά χαρακτηριστικά: t ( t) = { x x } P,..., Κάθε χαρακτηριστικό αξιολογείται και δίνει ένα μέτρο της καταλληλότητας του Δημιουργείται ένας νέος πληθυσμός από την επιλογή των πιο κατάλληλων στοιχείων Μερικά μέλη υφίστανται μετατροπές με μετάλλαξη (mutation) ή διασταύρωση (crossover) σχηματίζοντας νέες πιθανές λύσεις 1 t n Δομή Γενετικού Αλγόριθμου Η διασταύρωση συνδυάζει τα στοιχεία δύο χρωμοσωμάτων γονέων για να δημιουργήσει δύο νέους απογόνους ανταλλάσσοντας κομμάτια Η διασταύρωση εξυπηρετεί την ανταλλαγή πληροφοριών μεταξύ διαφορετικών πιθανών λύσεων Η μετάλλαξη αλλάζει αυθαίρετα ένα ή περισσότερα γονίδια ενός συγκεκριμένου χρωμοσώματος. Η μετάλλαξη εξυπηρετεί την εισαγωγή νέων πιθανών λύσεων 20

Δομή Γενετικού Αλγόριθμου Παράδειγμα έστω ότι οι γονείς αναπαριστώντα με διανύσματα πέντε διαστάσεων: (a 1,b 1,c 1,d 1,e 1 ) και (a 2,b 2,c 2,d 2,e 2 ) τότε οι απόγονοι με σημείο διασταύρωσης (crossover point) 2 είναι: (a 1,b 1,c 2,d 2,e 2 ) και (a 2,b 2,c 1,d 1,e 1 ) Δομή Γενετικού Αλγόριθμου Ένας ΓA αποτελείται από πέντε τμήματα: 1. Μια γενετική αναπαράσταση των πιθανών λύσεων 2. Ένα τρόπο δημιουργίας ενός αρχικού πληθυσμού των πιθανών λύσεων 3. Μια αντικειμενική συνάρτηση αξιολόγησης 4. Γενετικούς τελεστές που μετατρέπουν τη σύνθεση των παιδιών 5. Διάφορες παραμέτρους όπως μέγεθος πληθυσμού, πιθανότητες εφαρμογής των γενετικών τελεστών, κ.λπ. 21

BEGIN /* Γενετικός Αλγόριθμος */ Δημιουργία αρχικού πληθυσμού Υπολογισμός της αντικειμενικής συνάρτησης για κάθε άτομο WHILE NOT ολοκληρωμένος DO BEGIN /* Δημιουργία νέας γενιάς */ FOR μέγεθος πληθυσμού / 2 DO BEGIN Επιλογή δύο ατόμων από για ζευγάρωμα Συνδυασμός των δύο ατόμων και δημιουργία δύο νέων Εφαρμογή μετάλλαξης σε κάποια από τα νέα άτομα Ε ή έ ό έ ά Εισαγωγή των νέων ατόμων στην νέα γενιά END IF ο πληθυσμός συγκλίνει σε επιθυμητό βαθμό THEN ολοκληρωμένος := TRUE END END 22