Αναγνώριση Προτύπων (Pattern Recognition)

Σχετικά έγγραφα
4.3. Γραµµικοί ταξινοµητές

Γραµµικοί Ταξινοµητές

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Προσαρµοστικοί Αλγόριθµοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Ο αναδροµικός αλγόριθµος ελάχιστων τετραγώνων (RLS Recursive Least Squares)

Μέθοδοι πολυδιάστατης ελαχιστοποίησης

Το μοντέλο Perceptron

Κεφάλαιο 5: Γραμμικές Διακρίνουσες Συναρτήσεις 5.1 Εισαγωγή

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΚΕΦΑΛΑΙΟ 3 ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. nn n n

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ

Μη γραµµικοί ταξινοµητές Νευρωνικά ίκτυα

/5

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Θεωρία Λήψης Αποφάσεων

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

ΘΕΑΝΩ ΕΡΙΦΥΛΗ ΜΟΣΧΟΝΑ ΣΥΜΠΛΗΡΩΜΑΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Αναγνώριση Προτύπων Ι

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP)

Y Y ... y nx1. nx1

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

11. Η έννοια του διανύσµατος 22. Πρόσθεση & αφαίρεση διανυσµάτων 33. Βαθµωτός πολλαπλασιασµός 44. Συντεταγµένες 55. Εσωτερικό γινόµενο

EΦΑΡΜΟΓΕΣ ΤΗΣ ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ Γραµµική Εκτίµηση Τυχαίων Σηµάτων

EΦΑΡΜΟΓΕΣ ΤΗΣ ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ. Γραµµική Εκτίµηση Τυχαίων Σηµάτων

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]}

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Γραµµική Αλγεβρα. Ενότητα 2 : Επίλυση Γραµµικών Εξισώσεων. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Προβλήµατα Μεταφορών (Transportation)

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

1. Κινηµατική. x dt (1.1) η ταχύτητα είναι. και η επιτάχυνση ax = lim = =. (1.2) Ο δεύτερος νόµος του Νεύτωνα παίρνει τη µορφή: (1.

Εκπαίδευση ΤΝΔ με ελαχιστοποίηση του τετραγωνικού σφάλματος εκπαίδευσης. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν.

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ

ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ, , 3 ο ΕΞΑΜΗΝΟ ΑΠΑΝΤΗΣΕΙΣ ΕΡΓΑΣΙΑΣ #1: ΑΡΙΘΜΗΤΙΚΗ ΚΙΝΗΤΗΣ ΥΠΟ ΙΑΣΤΟΛΗΣ ΚΑΙ ΡΙΖΕΣ ΕΞΙΣΩΣΕΩΝ ΕΠΙΜΕΛΕΙΑ: Σ.

Βελτιστοποίηση Μη Γραµµικών Συναρτήσεων.

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017

Αναγνώριση Προτύπων Ι

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Ασκησεις - Φυλλαδιο 5

Non Linear Equations (2)

min f(x) x R n (1) x g (2)

ΠΛΗ 12- Σχέση ισοδυναμίας, γραμμικά συστήματα και απαλοιφή Gauss

όπου είναι γνήσια. ρητή συνάρτηση (δηλαδή ο βαθµός του πολυωνύµου υ ( x)

ΑΝΑΛΥΤΙΚΟ ΤΥΠΟΛΟΓΙΟ ΠΕΡΙΕΧΕΙ: ΤΥΠΟΥΣ ΜΕΘΟ ΟΛΟΓΙΑ ΠΑΡΑ ΕΙΓΜΑΤΑ. Τώρα τα κατάλαβα όλα...και τα θυµάµαι όλα!!!

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα

Στην ενότητα αυτή θα µελετηθούν τα εξής θέµατα:

Ορισµός: Μερική παράγωγος ως προς x (αντ. ως προς y) στο σηµείο x,y είναι η παράγωγος της f ως προς x στο x (αντ. ως προς y στο y ( + ) ( )

III.9 ΑΚΡΟΤΑΤΑ ΣΕ ΠΕΡΙΟΧΗ

ΛΥΣΕΙΣ 6 ης ΕΡΓΑΣΙΑΣ - ΠΛΗ 12,

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) +

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο

Βασικές αρχές εκπαίδευσης ΤΝΔ: το perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Αναγνώριση Προτύπων Ι

οµή δικτύου ΣΧΗΜΑ 8.1

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους.

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΘΕΩΡΙΑ ΑΠΟΘΕΜΑΤΩΝ. Ι. Προσδιοριστικά Μοντέλα αποθεµάτων

Επίλυση Γραµµικών Συστηµάτων

1 Το ϑεώρηµα του Rademacher

Κεφάλαιο 1. Αριθµητική ολοκλήρωση συνήθων διαφορικών εξισώσεων και συστηµάτων

KΕΦΑΛΑΙΟ 3. Πλεγµένες συναρτήσεις- Ανάπτυγµα Taylor-Aκρότατα

Κανόνες παραγώγισης ( )

II.6 ΙΣΟΣΤΑΘΜΙΚΕΣ. 1. Γραφήματα-Επιφάνειες: z= 2. Γραμμική προσέγγιση-εφαπτόμενο επίπεδο. 3. Ισοσταθμικές: f(x, y) = c

HMY 795: Αναγνώριση Προτύπων. Διαλέξεις 15-16

4. Ο αισθητήρας (perceptron)

KΕΦΑΛΑΙΟ 1 ΧΡΗΣΙΜΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΝΝΟΙΕΣ. { 1,2,3,..., n,...

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

Καµπύλες στον R. σ τελικό σηµείο της σ. Το σ. σ =. Η σ λέγεται διαφορίσιµη ( αντιστοίχως

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Kεφάλαιο 5. µετασχηµατισµού Laplace.

ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΕΙΡΩΝ ΚΑΝΟΝΙΚΟΤΗΤΑ

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

HMY 795: Αναγνώριση Προτύπων

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Ενότητα: Πράξεις επί Συνόλων και Σώµατα Αριθµών

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

3 η ΕΝΟΤΗΤΑ ΜΗ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΕΝΟΣ ΚΡΙΤΗΡΙΟΥ

Συμπίεση Δεδομένων

Transcript:

Αναγνώριση Προτύπων (Pern Recognon) Γραµµικές Συναρτήσεις ιάκρισης (Lner Dscrmnn Funcons) Π. Τσακαλίδης ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ

Γραµµικές Συναρτήσεις ιάκρισης Στόχος: Η σχεδίαση γραµµικών ως προς το διάνυσµα χαρακτηριστικών x συναρτήσεων διάκρισης που ορίζουν υπερεπίπεδα ως επιφάνειες απόφασης. Γιατί; Απλή µορφή, εύκολη υλοποίηση, βέλτιστες για Γκαουσσιανές σ.π.π. Πώς: ιατυπώνοντας το πρόβληµα εύρεσης των παραµέτρων (βαρών) ως πρόβληµα βελτιστοποίησης µιας συνάρτησης κριτηρίου (κόστους). Τι είναι η συνάρτηση κριτηρίου; Μια βαθµωτή συνάρτηση των βαρών που θα πρέπει να ελαχιστοποιηθεί, π.χ. η πιθανότητα λάθος ταξινόµησης κατά την εκπαίδευση. Είναι δύσκολο να επιτευχθεί; Ναί, γενικώς είναι δύσκολη η σχεδίαση ενός γραµµικού ταξινοµητή που να ελαχιστοποιεί το ρίσκο. Εποµένως; Χρησιµοποιούµε εναλλακτικά κριτήρια (απλές συναρτήσεις των βαρών) και επαναληπτικές µεθόδους βελτιστοποίησης (καθόδου κατά την κλίση του κριτηρίου grden descen).

Συναρτήσεις και Επιφάνειες ιάκρισης T g( x) w x + w ιάνυσµα βαρών (wegh vecor) Βάρος κατωφλίου (bs, hrehold wegh) Το διάνυσµα βαρών, w, καθορίζει τον προσανατολισµό του υπερεπιπέδου απόφασης και το βάρος κατωφλίου, w, καθορίζει τη σχετική θέση του ως προς την αρχή των αξόνων. g( x) w T x + w x w x + r, όπου r w p g ( x) w

ΗΠερίπτωση Πολλών Κλάσεων Γραµµική Μηχανή (lner mchne): x n ω αν g (x)>g j (x) Σύνορα Απόφασης: H j : g (x)g j (x) (w -w j ) x + (w -w j ) - τµήµα υπερεπιπέδου κάθετο στο διάνυσµα w -w j. Απόσταση του x από το H j : (g (x)-g j (x)) / w -w j Κυρτές περιοχές απόφασης. - σηµαντικές είναι οι διαφορές των διανυσµάτων βαρών.

Γραµµικά ιαχωρίσιµες Κλάσεις: ιανύσµατα και Περιοχές Λύσης x w, x x x x w w w w w d d T T g από H : απόσταση ) ( : H Κανονικοποίηση: αντικαθιστώντας όλα τα δείγµατα εκπαίδευσης της κλάσης ω µε τα αρνητικά τους, ζητούµε τα διαχωριστικά διανύσµατα (seprng vecors) που πρέπει να ικανοποιούν την σχέση: T > T > b T > Επαυξηµένα διανύσµατα χαρακτηριστικών και βαρών (Augmened Vecors):

ιαδικασίες Βελτιστοποίησης Πρόβληµα: Εύρεση του που ικανοποιεί το σύνολο των γραµµικών ανισοτήτων > για κάθε,,n. Πώς βρίσκουµε την κατάλληλη λύση; Ορίζουµε µια συνάρτηση κριτηρίου, J(), και την ελαχιστοποιούµε ώστε το να είναι ένα διάνυσµα λύσης. Με αυτό τον τρόπο µετασχηµατίζουµε το πρόβληµα της εξαντλητικής αναζήτησης σε πρόβληµα ελαχιστοποίησης µιας βαθµωτής συνάρτησης. Πώς ελαχιστοποιούµε την J(); Επιλέγουµε κάποιο αρχικό σηµείο και υπολογίζουµε την τιµή J( ). Υπολογίζουµε την κλίση στο J( ): J( ). Παίρνουµε το επόµενο σηµείο κινούµενοι στην κατεύθυνση αρνητικής κλίσης (seepes descen), - J( ), κατά µια ποσότητα η(), τον λεγόµενο ρυθµό µάθησης (lernng re) ήτοβήµα (sepsze).

Αλγόριθµος της Πιο Απότοµης Καθόδου (Seepes Descen) J() J( ) * Αλγόριθµος. Πιο Απότοµη Κάθοδος (Seepes Descen) begn nlze, hreshold θ, η()>, do + 3 -η() J() 4 unl η() J() < θ 5 reurn 6 end - J( * J( ) ) - J( ) * J( 3) Ζητήµατα: J ( + η Πώς επιλέγουµε την συνάρτηση κριτηρίου; Πώς επιλέγουµε τον ρυθµό µάθησης η(); Σύγκλιση σε τοπικό/ολικό ελάχιστο; Πόσο γρήγορα συγκλίνουµε, πόσο οµαλά; Πότε σταµατάµε; ) 3 η η

Αλγόριθµος Καθόδου Newon (Newon Descen) Αλγόριθµος. Κάθοδος Newon (Newon Descen) begn nlze, hreshold θ -H - J() 3 unl H - J() < θ 4 reurn 5 end + H J ( ) H [ J ] ( ) j Κόκκινο: Seepes Descen Μαύρο: Newon Descen Newon: µεγαλύτερη βελτίωση σε κάθε βήµα πληρώνοντας το υπολογιστικό κόστος της αντιστροφής του Hessn πίνακα H.

To Κριτήριο Percepron Ποια µπορεί να είναι η συνάρτηση κριτηρίου; Μία πρώτη επιλογή: Πλήθος των λάθος ταξινοµηµένων δειγµάτων εκπαίδευσης. Αλλά: Aυτή η συνάρτηση είναι ασυνεχής οπότε δεν είναι διαφόρισιµη. Μια καλύτερη επιλογή: Η συνάρτηση κριτηρίου percepron: J ( ) p ( ) Y όπου Y() είναι το σύνολο των δειγµάτων που δεν έχουν ταξινοµηθεί σωστά από το. Αν το Y() είναι κενό, τότε J p (). Αφού < όταν το δεν είναι σωστά ταξινοµηµένο, η J p () δεν είναι ποτέ αρνητική και µηδενίζεται όταν το είναι διάνυσµα λύσης. Γεωµετρικά, η J p () είναι ανάλογη του αθροίσµατος των αποστάσεων των λάθος ταξινοµηµένων δειγµάτων από το σύνορο απόφασης.

Ο Αλγόριθµος Bch Percepron Το διάνυσµα κλίσεων είναι: Αναδροµική σχέση: J p () J όπου Y είναι το σύνολο των δειγµάτων που έχουν ταξινοµηθεί λάθος από το. Το επόµενο διάνυσµα βάρους (δ.β.) προκύπτει ως το άθροισµα του τρέχοντος δ.β. και ενός πολλαπλασίου του αθροίσµατος των λάθος ταξινοµηµένων δειγµάτων. Αλγόριθµος 3. Bch Percepron p Y ( + ) ( ) + η( ) Y begn nlze, κριτήριο θ, η()>, do + 3 4 unl 5 reurn 6 end + η( ) Y Y η ( ) < θ

Βήµατα του Bch Percepron () Επιφάνεια συνάρτησης κόστους (γνωστή και ως επιφάνεια λάθους error surfce) Βάση της επιφάνειας λάθους

Τέσσερις Συναρτήσεις Κόστους Πλήθος εσφαλµένων ταξινοµήσεων Bd J ( ) p Κριτήριο Percepron ( ) Y Good! Συνολικό τετραγωνικό λάθος - Tol squre error (TSE) J q ( ) ( ) Y Beer* J r ( ) TSE wh mrgn Bes* ( b) Y * Αλλά θα µπορούσε να έχει µεγάλο υπολογιστικό κόστος

Fxed-Incremen Sngle-Smple Percepron Αντί να δοκιµάζουµε το διάνυσµα βαρών () σε όλα τα δείγµατα και να το διορθώνουµε βάσει του συνόλου Y των λάθος ταξινοµηµένων δειγµάτων, χρησιµοποιούµε τα δείγµατα ένα κάθε φορά και ανάλογα µε την ταξινόµηση του ανανεώνουµε ή όχι το διάνυσµα βαρών. Αν επιπλέον, χρησιµοποιήσουµε ένα σταθερό βήµα η(), τότε προκύπτει ο αλγόριθµος: Αλγόριθµος 4. Fxed-Incremen Sngle-Smple Percepron begn nlze, do (+) mod n 3 If s msclssfed b, hen + 4 unl ll perns properl clssfed 5 reurn 6 end Κυκλική Σειρά εδοµένων (µε πράσινο υποδηλώνονται τα λάθος ταξινοµηµένα δείγµατα): 3 4 3 4 3 4 3 3 4

Σύγκλιση Πεπερασµένος αριθµός βηµάτων,, για σύγλιση στη λύση : mx mn [ ] Ο παρονοµαστής δηλώνει ότι η δυσκολία στη σύγκλιση καθορίζεται από τα δείγµατα εκπαίδευσης τα οποία είναι σχεδόν κάθετα στο διάνυσµα λύσης : Γραµµικά διαχωρίσιµα προβλήµατα είναι δύσκολα επιλύσιµα όταν τα πρότυπα είναι σχεδόν οµοεπίπεδα.

Vrble-Incremen Percepron wh rgn Χρησιµοποιούµε τα δείγµατα ένα κάθε φορά και διορθώνουµε το διάνυσµα βαρών () όταν το εσωτερικό γινόµενό του µε το δείγµα είναι µικρότερο από κάποιο προκαθορισµένο θετικό όριο b: () < b. Αν επιπλέον, χρησιµοποιήσουµε ένα µεταβαλλόµενο βήµα η(), τότε προκύπτει ο αλγόριθµος: Αλγόριθµος 5. Vrble-Incremen Percepron w. rgn begn nlze, hreshold θ, mrgn b, η(), do (+) mod n 3 f <b, hen + η() 4 unl >b for ll 5 reurn 6 end Συνθήκες Σύγκλισης: η ( ), lm η( ) m m η ( ) ( ( )) m η, lm m m

Μέθοδοι Χαλάρωσης (Relxon Procedures) Συνάρτηση κριτηρίου: όπου Y() είναι το σύνολο των δειγµάτων για τα οποία <b. Αν το Y() είναι κενό, τότε J r (). Η J r () δεν είναι ποτέ αρνητική και µηδενίζεται αν και µόνο αν >b για όλα τα δείγµατα εκπαίδευσης. Το διάνυσµα κλίσεων είναι: Αναδροµική σχέση: ( ) Y ) ( b J r Y r r b J J ) ( + + b Y ) ( ) ( ) ( η

Bch Relxon wh rgn Αλγόριθµος 6. Bch Relxon wh rgn begn nlze, mrgn b, η(), do (+) mod n 3 Y {} 4 j 5 do j j+ 6 f <b, hen ppend j o Y 7 unl jn 8 + η( ) Y 9 unl Y {} reurn end b

Sngle-Smple Relxon wh rgn Αλγόριθµος 7. Sngle-Smple Relxon wh rgn begn nlze, mrgn b, η(), do (+) mod n 3 f <b, hen b + η( ) 4 unl >b for ll 5 reurn 6 end Σε κάθε βήµα, το διάνυσµα βαρών (), µετατοπίζεται προς το υπερεπίπεδο b κατά ένα ποσοστό, η(), της απόστασής του, r(), από αυτό. η()< underrelxon η()> overrelxon <η()< για σύγκλιση

Μέθοδοι Ελαχίστων Τετραγώνων (nmum Squre-Error SE) Στόχος: Καλή απόδοση τόσο στις γραµµικά διαχωρίσιµες όσο και στις µη γραµµικά διαχωρίσιµες περιπτώσεις. Πώς: Κριτήριο που περιλαµβάνει όλα τα πρότυπα. Επίσης, Πρίν: Βρες έτσι ώστε > για κάθε πρότυπο. Τώρα: Βρες έτσι ώστε b για κάθε πρότυπο.(b θετικές σταθερές). ηλαδή; Μετατρέπουµε το πρόβληµα επίλυσης ενός συνόλου γραµµικών ανισοτήτων σε πρόβληµα επίλυσης γραµµικών εξισώσεων. Συµβολισµοί: Πρόβληµα: Εύρεση έτσι ώστε: Yb. d d ˆ ιάνυσµα βαρών n d n Y ˆ Πίνακας Προτύπων n n b b b b ιάνυσµα θετικών παραµέτρων

Μέθοδοι Ελαχίστων Τετραγώνων (nmum Squre-Error SE) Συνήθως n>d+, περισσότερα πρότυπα από διαστάσεις σύστηµα υπερπροσδιορισµένο, δεν έχει ακριβή λύση. Εποµένως; Ελαχιστοποίηση του τετραγώνου του µήκους του διανύσµατος σφάλµατος, ey-b: Κλασσικό Πρόβληµα: ( ) J s ( ) Y b b n J ( ) Y Y s Y b Κανονικές Εξισώσεις Norml Equons Αν ο Υ Υ είναι οµαλός, ( ) Y Y Y b 443 ψευδοαντίστροφος

Wdrow-Hoff (Les-men squres-ls) H J s () µπορεί να ελαχιστοποιηθεί µέσω αναδροµικών αλγορίθµων που δεν απαιτούν την αντιστροφή πινάκων. ιάνυσµα κλίσεων: Βασική αναδροµική σχέση: J ( ) Y s ( Y b) Χρησιµοποιώντας ένα δείγµα σε κάθε βήµα, προκύπτει ο αλγόριθµος Wdrow-Hoff (LS): ( + ) ( ) + η( ) Y Αλγόριθµος 8. Wdrow-Hoff (LS) begn nlze, b, κριτήριο θ, η(), do (+) mod n 3 4 unl 5 reurn 6 end + η( ) ( b ) ( ) θ η ( ) < b ( b Y( ) )

Μέθοδος Ho-Kshp To percepron και οι τεχνικές χαλάρωσης βρίσκουν διαχωριστικά διανύσµατα βαρών αν τα δείγµατα είναι γραµµικά διαχωρίσιµα, αλλά δεν συγκλίνουν για µη διαχωρίσιµες κλάσεις. Οι τεχνικές ελαχίστων τετραγώνων δίνουν πάντα ένα διάνυσµα λύσης (αυτό που ελαχιστοποιεί το Y-b ) το οποίο όµως δεν είναι απαραίτητα διαχωριστικό στην διαχωρίσιµη περίπτωση. Ο αλγόριθµος Ho-Kshp λύνει αναδροµικά το εξής πρόβληµα ελαχιστοποίησης: mn,b J s (, b) Y b s.. Είναι ένας αλγόριθµος που φροντίζει ώστε το b να µην συγκλίνει στο, θέτοντας όλες τις θετικές συνιστώσες του διανύσµατος κλίσης b J s ίσες µε το µηδέν. b >

Αλγόριθµος Ho-Kshp Αλγόριθµος 9. Ho-Kshp begn nlze, b, η()<, hreshold b mn, mx do (+) mod n 3 e Y-b 4 e + (e+ e )/ 5 b b + η()e + 6 (Y Y) - Yb 7 f Abs(e)< b mn hen reurn, b nd ex 8 unl mx 9 prn No soluon found end

Πολλαπλές Κλάσεις οµή του Kesler Στόχος: Γραµµικός διαχωρισµός πολλαπλών κλάσεων: Αν ~ ω, τότε - j > για κάθε j,,c. Αυτό το σύστηµα των c- ανισοτήτων µπορεί να περιγραφεί ως εξής: Το διάνυσµα βαρών ταξινοµεί ορθά όλα τα c- πρότυπα η, η 3,..., η c : όπου: Γενικότερα: D d c ˆ αˆ D d c ˆ η c cd α ˆ ˆ η 3 η c,l, c j j,, ˆ K > η α οµή Kesler > η η α j j j όπου, ˆ j

Ταξινόµηση Πολλαπλών Κλάσεων Percepron Έστω,, n πρότυπα από c κλάσεις, γραµµικά διαχωρίσιµα. Έστω L µία γραµµική µηχανή (),, c (). Θέλουµε να κατασκευάσουµε µία ακολουθία γρ. µηχ. L,,L, που να συγκλίνει σε µία διαχωριστική µηχανή L. Έστω το -στό δείγµα που ζητά διόρθωση (σωστή ταξινόµηση). Αν ~ ω, σηµαίνει ότι υπάρχει τουλάχιστον ένα για το οποίο ι () < j (). Ο κανόνας διόρθωσης του L (percepron µε σταθερό µοναδιαίο βήµα) λέει: ηλαδή: ( ) ( ) ( ) ( ) ( ) ( ) + + j c j j η α η α η α α και µε όπου j j j l l l l j j + + + + και ) ( ) ( ) ( ) ( ) ( ) (