Αναγνώριση Προτύπων - Νευρωνικά ίκτυα



Σχετικά έγγραφα
4. Μέθοδοι αναγνώρισης ταξινοµητές µε επόπτη

4.3. Γραµµικοί ταξινοµητές

5. Μέθοδοι αναγνώρισης εκπαίδευση χωρίς επόπτη

οµή δικτύου ΣΧΗΜΑ 8.1

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

Τηλεπισκόπηση. Κ. Ποϊραζίδης ΨΗΦΙΑΚΗ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ 18/6/2016

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

/5

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

2.5 Η ΕΝΝΟΙΑ ΤΟΥ ΙΑΝΥΣΜΑΤΟΣ

Γραµµική Αλγεβρα. Ενότητα 1 : Εισαγωγή στη Γραµµική Αλγεβρα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Αλγόριθμος Ομαδοποίησης

Αναγνώριση Προτύπων Ι

ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ

11 Το ολοκλήρωµα Riemann

Ενότητα: Πράξεις επί Συνόλων και Σώµατα Αριθµών

[2] Υπολογιστικά συστήματα: Στρώματα. Τύποι δεδομένων. Μπιτ. επικοινωνία εφαρμογές λειτουργικό σύστημα προγράμματα υλικό

ΒΙΟΜΗΧΑΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Εύρεση ν-στού πρώτου αριθμού

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Αναπαράσταση δεδομένων

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]}

ΚΕΦΑΛΑΙΟ 5: Τανυστικά Γινόµενα

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Εκπαιδευτικός Οµιλος ΒΙΤΑΛΗ

Γραµµική Αλγεβρα Ι. Ενότητα: Εισαγωγικές Εννοιες. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

x 2 = x x 2 2. x 2 = u 2 + x 2 3 Χρησιµοποιώντας το συµβολισµό του ανάστροφου, αυτό γράφεται x 2 = x T x. = x T x.

Z U REC (cm) (V) i =log(z) y i =log(u REC ) x i x i y i 10 74,306 1,000 1,871 1,000 1, ,528 1,079 1,796 1,165 1, ,085 1,146 1,749

ΣΥΝΤΕΤΑΓΜΕΝΕΣ ΙΑΝΥΣΜΑΤΟΣ

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Κεφάλαιο 4 ιανυσµατικοί Χώροι

Εισαγωγή στα ψηφιακά Συστήµατα Μετρήσεων

ΚΕΦΑΛΑΙΟ 2: Ηµιαπλοί ακτύλιοι

Κεφάλαιο 4. Ευθέα γινόµενα οµάδων. 4.1 Ευθύ εξωτερικό γινόµενο οµάδων. i 1 G 1 G 1 G 2, g 1 (g 1, e 2 ), (4.1.1)

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών

Συνεχείς συναρτήσεις πολλών µεταβλητών. ε > υπάρχει ( ) ( )

Αυτοµατιµός Γραφείου. Τµήµα Διοίκησης Επιχειρήσεων ΑΤΕΙ- Δυτικής Ελλάδας Μεσολόγγι Δρ. Α. Στεφανή Διάλεξη 2η

ΕΝΝΟΙΑ ΤΟΥ ΙΑΝΥΣΜΑΤΟΣ

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

ΕΝΝΟΙΑ ΤΟΥ ΙΑΝΥΣΜΑΤΟΣ

Επιµέλεια Θοδωρής Πιερράτος

Οι πράξεις που χρειάζονται για την επίλυση αυτών των προβληµάτων (αφού είναι απλές) µπορούν να τεθούν σε µια σειρά και πάρουν µια αλγοριθµική µορφή.

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Ασκησεις - Φυλλαδιο 6

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος;

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 1 η Ηµεροµηνία Αποστολής στον Φοιτητή: 12 Οκτωβρίου 2007

1 ιαδικασία διαγωνιοποίησης

ΑΝΑΛΥΣΗ ΥΝΑΜΗΣ ΣΕ ΥΟ ΚΑΘΕΤΕΣ ΜΕΤΑΞΥ ΤΟΥΣ ΣΥΝΙΣΤΩΣΕΣ

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΧΑΡΤΟΓΡΑΦΗΣΗ ΦΥΣΙΚΩΝ ΠΟΡΩΝ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

5 Παράγωγος συνάρτησης

Εφαρμοσμένα Μαθηματικά ΙΙ Τελική Εξέταση Ι. Λυχναρόπουλος

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 8

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

Κεφάλαιο 3β. Ελεύθερα Πρότυπα (µέρος β)

Μορφές των χωρικών δεδομένων

Γραµµική Αλγεβρα. Ενότητα 4 : Ορθογωνιότητα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

{ } ΠΛΗ 12: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗ ΠΛΗΡΟΦΟΡΙΚΗ Ι 2 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ. Απαντήσεις. 1. (15 µονάδες)

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΜΑΘΗΜΑΤΙΚΑ Γ ΓΥΜΝΑΣΙΟΥ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

5.1 Θεωρητική εισαγωγή

Κατάτµηση εικόνας σε οµοιόµορφες περιοχές

Το άθροισµα των εισερχόµενων σηµάτων είναι:

1.4 Λύσεις αντιστρόφων προβλημάτων.

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Ασκησεις - Φυλλαδιο 5

Μπερδέματα πάνω στην κεντρομόλο και επιτρόχια επιτάχυνση.

z = c 1 x 1 + c 2 x c n x n

Κεφάλαιο 6. Πεπερασµένα παραγόµενες αβελιανές οµάδες. Z 4 = 1 και Z 2 Z 2.

Σχήµα 3.1: Εισαγωγή shift register σε βρόγχο for-loop.

Α.Τ.Ε.Ι. ΜΑΚΕΔΟΝΙΑΣ Τμήμα πληροφορικής και επικοινωνιών. Συμπίεση ψηφιακών εικόνων με ανάλυση κύριων συνιστωσών και χρήση νευρωνικού δικτύου.

KEΦΑΛΑΙΟ 5 ΨΗΦΙΑΚΑ ΚΡΥΠΤΟΣΥΣΤΗΜΑΤΑ

ΙΑΝΥΣΜΑΤΑ ΘΕΩΡΙΑ ΘΕΜΑΤΑ ΘΕΩΡΙΑΣ. Τι ονοµάζουµε διάνυσµα; αλφάβητου επιγραµµισµένα µε βέλος. για παράδειγµα, Τι ονοµάζουµε µέτρο διανύσµατος;

Γραµµική Αλγεβρα. Ενότητα 3 : ιανυσµατικοί Χώροι και Υπόχωροι. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Εφαρμογές Πληροφορικής

Κεφάλαιο M3. Διανύσµατα

Το μοντέλο Perceptron

Ο ΕΥΚΛΕΙ ΕΙΟΣ ΧΩΡΟΣ. Το εσωτερικό γινόµενο

Ο ΕΥΚΛΕΙ ΕΙΟΣ ΧΩΡΟΣ. Το εσωτερικό γινόµενο

Ο αλγόριθμος πρέπει να τηρεί κάποια κριτήρια

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

Γραµµική Αλγεβρα Ι. Ενότητα: Γραµµικές απεικονίσεις. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX

( ) Κλίση και επιφάνειες στάθµης µιας συνάρτησης. x + y + z = κ ορίζει την επιφάνεια µιας σφαίρας κέντρου ( ) κ > τότε η

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή

Δοµές Δεδοµένων και Αλγόριθµοι - Εισαγωγή

Γραµµική Αλγεβρα Ι. Ενότητα: ιανυσµατικοί χώροι. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

Η Ευκλείδεια διαίρεση

ΘΕΜΑΤΑ ΕΞΕΤΑΣΕΩΝ ΜΑΘΗΜΑΤΙΚΩΝ Ι Ι ΑΣΚΩΝ : ρ. Χρήστος Βοζίκης

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

Κεφάλαιο 7 Βάσεις και ιάσταση

Υπολογιστική Νοημοσύνη. Μάθημα 13: Αναδρομικά Δίκτυα - Recurrent Networks

Μαθηματικός Περιηγητής σχ. έτος

Transcript:

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ Αναγνώριση Προτύπων - Νευρωνικά ίκτυα ρ. Χαράλαµπος Π. Στρουθόπουλος Αναπληρωτής Καθηγητής Τοµέας Υπολογιστικών Τεχνικών & Συστηµάτων ΣΕΡΡΕΣ 003

ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή. Περιγραφή προτύπων και ορισµοί.1 ιανυσµατική περιγραφή 3. Βασικά µαθηµατικά µεγέθη, συµβολισµοί και σχέσεις 3.1 Πίνακας στήλης 3. Εσωτερικό γινόµενο 3.3 Στατιστικά χαρακτηριστικά του χώρου των προτύπων. 4. Μέθοδοι αναγνώρισης εκπαίδευση µε επόπτη 4.1 Αναγνώριση µε βάση τα κέντρα των κλάσεων. 4. Αναγνώριση µε γραµµικές διακριτικές συναρτήσεις. 4..1 Επαυξηµένα διανύσµατα 4.3 Γραµµικοί ταξινοµητές 4.4 Εκπαίδευση γραµµικών ταξινοµητών δυο κλάσεων 4.5 Γραµµικοί ταξινοµητές πολλών επιπέδων 4.6 Μη γραµµικοί ταξινοµητές Ν Back propagation 5. Μέθοδοι αναγνώρισης εκπαίδευση χωρίς επόπτη 5.1 Προσδιορισµός των συγκεντρώσεων µε την µέθοδο MAXIMIN. 5. Απεικόνιση αλυσίδας. 5.3 Νευρωνικό δίκτυο αυτο-οργανούµενου πίνακα Αναγνώριση Προτύπων-Νευρωνικά ίκτυα 1 Τµήµα Πληροφορικής & Επικοινωνιών

απεικόνισης χαρακτηριστικών. 6. Ανάλυση χαρακτηριστικών 6.1 Ανάλυση χαρακτηριστικών στην εκπαίδευση µε επόπτη 6. Ανάλυση χαρακτηριστικών στην εκπαίδευση χωρίς επόπτη Αναγνώριση Προτύπων-Νευρωνικά ίκτυα Τµήµα Πληροφορικής & Επικοινωνιών

1. Εισαγωγή Η λέξη αναγνώριση στην καθοµιλουµένη σηµαίνει την εύρεση της ταυτότητας ενός όντος (π.χ. ανθρώπου, ζώου, αντικειµένου, εικόνας ήχου, ιδέας, πρότασης κ.λ.π.) και χρησιµοποιείται συνήθως όταν η ταυτότητα αυτή δεν είναι άµεσα αντιληπτή. Σε τέτοιες περιπτώσεις µάλιστα η αναγνώριση βασίζεται σε ειδικά χαρακτηριστικά του όντος (π.χ. ο διαρρήκτης ήταν αριστερόχειρας). Με την λέξη ταυτότητα εννοούµε ένα σηµαντικό, µοναδικό ίσως χαρακτηριστικό του όντος που το ξεχωρίζει από τα υπόλοιπα ή το εντάσσει σε µια κατηγορία οµοειδών του (π.χ. οι πεζοί αναγνώρισαν πως το αυτοκίνητο που παραβίασε τον κόκκινο φωτεινό σηµατοδότη ήταν σπορ, ένας από αυτούς κατέγραψε τον αριθµό κυκλοφορίας του και η τροχαία εντόπισε, δηλαδή αναγνώρισε, τον παραβάτη). Η αναγνώριση είναι µια ικανότητα που έχουν κυρίως τα έµβια όντα και αποτελεί βασική λειτουργία της νοηµοσύνης. Οι «νοήµονες» µηχανές που θα διαδεχθούν τις «έξυπνες» θα πρέπει να διαθέτουν την ικανότητα της αναγνώρισης. Ένα ον θα το αποκαλούµε στο εξής και ως πρότυπο. Αναγνώριση Προτύπων (Pattern Recognition) είναι ο επιστηµονικός κλάδος που ασχολείται µε την εύρεση µεθόδων για την ταξινόµηση (classification) των όντων (προτύπων) σε κατηγορίες. Τις κατηγορίες αυτές θα τις ονοµάζουµε κλάσεις ή τάξεις (classes). Ένα σύνολο οµοίων προτύπων, όχι αναγκαστικά πανοµοιότυπων, ορίζει µία σύλληψη (concept). Τα νοήµονα έµβια παρατηρούν και µαθαίνουν τα όντα (πρότυπα) του περιβάλλοντος κόσµου και δηµιουργούν γι αυτά συλλήψεις. Για παράδειγµα το σύνολο των αλόγων που γνωρίσατε σας έµαθε την γενική σύλληψη (ιδέα) άλογο (κάντε συσχετισµούς µε τον κόσµο των ιδεών του Πλάτωνα). Στον χώρο των γραµµάτων της Ελληνικής γλώσσας υπάρχουν 4 συλλήψεις που είναι τα 4 γράµµατα της Ελληνικής αλφαβήτου. Κάθε γράµµα της Ελληνικής γλώσσας που γράφτηκε είναι ένα πρότυπο και αποτελεί µία πραγµατοποίηση ή συµβάν (event) µιας από τις 4 συλλήψεις. Για παράδειγµα οι µορφές Αναγνώριση Προτύπων-Νευρωνικά ίκτυα 1-1 Τµήµα Πληροφορικής & Επικοινωνιών

β β β β Β β β β Β δ δ δ δ δ δ αποτελούν συµβάντα (πρότυπα) των συλλήψεων των γραµµάτων ΒΗΤΑ και ΕΛΤΑ. Τα πρότυπα αυτά µπορεί να διαφέρουν στο µέγεθος, την γραµµατοσειρά, να είναι κεφαλαία ή µικρά, ή να έχουν µικροδιαφορές που δηµιουργήθηκαν κατά τη στιγµή της εκτύπωσης (θόρυβος). Είναι προφανές πως οι συλλήψεις και τα οικεία πρότυπά τους πρέπει να διαθέτουν χαρακτηριστικά που να τις διακρίνουν από άλλες συλλήψεις και πρότυπα. Η εύρεση και µέτρηση τέτοιων χαρακτηριστικών (features) των προτύπων είναι πρωταρχικής σηµασίας για την περιγραφή και την αναγνώρισή τους. Η αναγνώριση προτύπων από µηχανές µπορεί να αντικαταστήσει πληθώρα επίπονων ανθρώπινων εργασιών, να βελτιώσει το εργασιακό περιβάλλον και να αυξήσει την παραγωγικότητα. Για παράδειγµα η µετατροπή τυπωµένων εγγράφων σε ηλεκτρονική µορφή µε κωδικοποίηση κατά ASCII, µπορεί να γίνει από τον άνθρωπο δακτυλογράφο που διαβάζει το κείµενο, αναγνωρίζει τους χαρακτήρες και τους πληκτρολογεί, µπορεί όµως να γίνει και από µία µηχανή που θα σαρώνει- φωτογραφεί ψηφιακά (scanning) το έγγραφο υπό µορφή εικονοστοιχείων (pixels) στην µνήµη του υπολογιστή και µε κατάλληλο πρόγραµµα οπτικής αναγνώρισης χαρακτήρων (OCR: Optical Character Recofgnition) θα αναγνωρίζεται η ψηφιακή µορφή κάθε χαρακτήρα σύµφωνα µε το σύµβολο του ASCII που αντιστοιχεί στην σύλληψή του και θα του αποδίδεται ο αντίστοιχος κωδικός. Ένα σύστηµα (αλγόριθµος) που αναγνωρίζει πρότυπα λέγεται ταξινοµητής (classifier). Σε ένα ταξινοµητή επιτελούνται δύο κύριες εργασίες που είναι η εκπαίδευση (training) και η ταξινόµηση. Κατά την εκπαίδευση προσδιορίζονται οι κλάσεις ή οι συγκεντρώσεις των προτύπων και ρυθµίζονται κατάλληλα οι παράµετροι του συστήµατος ταξινόµησης µε βάση τις οποίες θα είναι αυτό ικανό να ταξινοµήσει τα πρότυπα σε σωστές κλάσεις. Με την ταξινόµηση αποδίδεται ένα πρότυπο σε µία κλάση ή σε µία συγκέντρωση. Συχνά, κατά την διαδικασία της εκπαίδευσης γίνονται ταξινοµήσεις σε αρχικές Αναγνώριση Προτύπων-Νευρωνικά ίκτυα 1- Τµήµα Πληροφορικής & Επικοινωνιών

υποθετικές κλάσεις µέχρι ο ταξινοµητής να προσδιορίσει ορθά τις κλάσεις ή τις συγκεντρώσεις των προτύπων µε βάση κάποιο κριτήριο ορθότητας. Τα πρότυπα που χρησιµοποιούνται για την εκπαίδευση του ταξινοµητή αποτελούν το σύνολο εκπαίδευσης (training set). Οι µέθοδοι εκπαίδευσης χωρίζονται σε δύο βασικές κατηγορίες: Α) Εκπαίδευση µε επόπτη (supervised learning) κατά την οποία είναι γνωστή η κλάση στην οποία ανήκει κάθε πρότυπο του συνόλου εκπαίδευσης και επιδιώκεται ο προσδιορισµός των κλάσεων. Β) Εκπαίδευση χωρίς επόπτη (unsupervised learning) κατά την οποία δεν είναι γνωστή η κλάση στην οποία ανήκει κάθε πρότυπο του συνόλου εκπαίδευσης και αναζητούνται βασικά οι συγκεντρώσεις των προτύπων (clustering). Προτιµότερο είναι η εκπαίδευση ενός ταξινοµητή να µην εκτελείται µόνο µία αρχική φορά, αλλά να επαναλαµβάνεται ώστε η µηχανή να προσαρµόζεται στις αλλαγές των προτύπων που ταξινοµεί. Οι ταξινοµητές είναι ουσιαστικά το αντικείµενο µε το οποίο θα ασχοληθούµε περαιτέρω και θα αναλυθούν διεξοδικά στα επόµενα κεφάλαια. Αναγνώριση Προτύπων-Νευρωνικά ίκτυα 1-3 Τµήµα Πληροφορικής & Επικοινωνιών

. Περιγραφή προτύπων και ορισµοί Θα αναφέρουµε παρακάτω δύο κυρίαρχες µεθόδους περιγραφής των προτύπων που είναι η διανυσµατική περιγραφή και η συντακτική περιγραφή..1. ιανυσµατική περιγραφή Για κάθε πρότυπο µετρούµε ένα πεπερασµένο πλήθος χαρακτηριστικών του (π.χ. βάρος, χρώµα, ύψος, πλάτος, µήκος). Για ένα ποιοτικό χαρακτηριστικό που δεν µετριέται άµεσα µε αριθµητικές τιµές όπως για παράδειγµα το χρώµα, χρησιµοποιούµε κάποια κωδικοποίηση που αντιστοιχεί αριθµούς στις διάφορες µορφές του (π.χ. 0 για το µαύρο, 1 για το µπλε, για το κόκκινο κ.λ.π.) Αν Ω είναι ένα σύνολο που αποτελείται από Κ το πλήθος πρότυπα Π κ, κ1,,3,...,κ, δηλαδή Ω{Π 1, Π, Π 3... Π κ,.. Π Κ } και µετρούµε Ν το πλήθος κοινά χαρακτηριστικά για κάθε πρότυπο, τότε το Π κ πρότυπο µπορεί να περιγραφεί από ένα διάνυσµα - πίνακα στήλης x κ σε ένα χώρο Ν διαστάσεων σύµφωνα µε την σχέση (.1.1) x κ x1κ x κ M x1κ x κ K x νκ K x x Νκ νκ M x Νκ Τ Κάθε πρότυπο θεωρείται ξεχωριστό από κάθε άλλο ακόµη και όταν όλες οι τιµές των αντίστοιχων χαρακτηριστικών τους είναι ίσες. ηλαδή το πρότυπο Π µ είναι άλλο στοιχείο του συνόλου Ω, από το πρότυπο Π λ αν και x µ x λ (µ, λ {1,,...,Κ}, και Π µ, Π λ Ω ). Ως εκ τούτου το Ω είναι σύνολο µε την µαθηµατική έννοια. Όλους τους πίνακες θα τους συµβολίζουµε µε παχιά γράµµατα. Αν Ν 3 τότε µπορούµε να παραστήσουµε τα διανύσµατα των προτύπων στον φυσικό χώρο. Ακολούθως θα δούµε ένα παράδειγµα προτύπων που είναι άτοµα για τα οποία µετράµε δύο χαρακτηριστικά που είναι το βάρος και το Αναγνώριση Προτύπων-Νευρωνικά ίκτυα -1 Τµήµα Πληροφορικής & Επικοινωνιών

ύψος. Οι τιµές των χαρακτηριστικών για όλα τα πρότυπα που µετρήθηκαν δείχνονται στο ακόλουθο πίνακα 1. Π (πρότυπο) Υ (ύψος σε εκ.) Β (βάρος σε κιλά) Π1 185 85 Π 185 8 Π3 18 115 Π4 180 80 Π5 178 78 Π6 175 11 Π7 171 114 Π8 160 58 Π9 160 55 Π10 155 6 Π11 150 85 Π1 150 8 Π13 145 84 Π14 143 80 Πίνακας.1-1 Τα αντίστοιχα διανύσµατα των προτύπων ως πίνακες στήλης όπως παρακάτω: x 1 185, x 185,,, 85 x 18 8 3 x 180 115 4 80 (.1.) x 178 5, x 175,,, 78 6 x 171 11 7 x 160 114 8 58 x 9 160,..., 55 x 14 143 80 Στο Σχ..1-1 που ακολουθεί φαίνονται τα σηµεία τέλους των διανυσµάτων που αντιστοιχούν σε κάθε πρότυπο. Αναγνώριση Προτύπων-Νευρωνικά ίκτυα - Τµήµα Πληροφορικής & Επικοινωνιών

140 10 100 80 60 40 0 0 0 50 100 150 00 Σχήµα.1-1 Έστω ότι επιθυµούµε να κατατάξουµε τα πρότυπα µας σε τάξεις ως εξής: Βαρείς αν Β>80, ελαφρούς αν Β 80, ψηλούς αν Υ>170 και κοντούς αν Υ 170. Παρατηρούµε ότι τα άκρα των διανυσµάτων των προτύπων συγκεντρώνονται σε οµάδες. Το γεγονός αυτό οφείλεται στο ότι τα όµοια πρότυπα γειτνιάζουν επειδή τα αντίστοιχα χαρακτηριστικά τους έχουν κοντινότερες τιµές (οµόλογες συντεταγµένες των ανυσµάτων τους) σε σχέση µε τις τιµές των χαρακτηριστικών των άλλων προτύπων. Για παράδειγµα η ευκλείδεια απόσταση D 1 των προτύπων Π 1, Π είναι (.1.3) D ( x x ) + ( x x ) (185 185) + (85 8) 3 1 11 1 1 και η ευκλείδεια απόσταση D 15 των προτύπων Π 1, Π 5 είναι (.1.4) D ( x x ) + ( x x ) (185 178) + (85 78) 9 15 11 15 1 5 Άρα η απόσταση των ανυσµάτων των προτύπων είναι ένα µαθηµατικό κριτήριο της ισότητας δύο προτύπων. Οι οµάδες που σχηµατίζουν τα πρότυπα λέγονται συγκεντρώσεις (clusters). Οι συγκεντρώσεις δηµιουργούνται. από πρότυπα περίπου ίδια µορφολογικά. Στο παράδειγµα µας οι τέσσερις συγκεντρώσεις δηµιουργήθηκαν από άτοµα α) µε Β>100 κ. β) µε Β<70 κ. γ) µε Υ<1.80µ και 70<Β<100 κ. και δ) µε Υ>1.80µ και 70κ<Β<100κ. Αναγνώριση Προτύπων-Νευρωνικά ίκτυα -3 Τµήµα Πληροφορικής & Επικοινωνιών

Ο εντοπισµός των συγκεντρώσεων (clusters) προτύπων που δηµιουργούνται στον χώρο των προτύπων είναι σηµαντικός για την αναγνώριση προτύπων και αναφέρεται ως πρόβληµα εύρεσης των συγεντρώσεων (clustering). Η σωστή επιλογή των χαρακτηριστικών που µετράµε για τα πρότυπα (feature selection) είναι καθοριστικής σηµασίας για την εύρεση των οµάδων των προτύπων. Συχνά ενδιαφερόµαστε για πρότυπα που έχουν κάποια ιδιότητα και βρίσκονται σε περισσότερες από µία οµάδες. Για παράδειγµα τα πρότυπα των ατόµων µε ύψος µεγαλύτερο από 1,70 µ ανήκουν σε δύο συγκεντρώσεις. Ανάλογα συµβαίνει και µε τα πρότυπα των πεζών και κεφαλαίων γραµµάτων όπως των Α, α ή Ω, ω κ.α. Η εύρεση της οµάδας ή των οµάδων των προτύπων που έχουν µία τελική κοινή χαρακτηριστική ιδιότητα (ταυτότητα: label) αποτελεί την ταξινόµηση των προτύπων και οδηγεί στην αναγνώρισή τους. Στην γενική περίπτωση το πρόβληµα της ταξινόµησης είναι δύσκολο κυρίως λόγω α) κακής επιλογής των µετρούµενων χαρακτηριστικών, β) µεγάλης ποικιλοµορφίας των προτύπων, γ) θορύβου, δ) ασάφειας των ορίων των κλάσεων στον χώρο των προτύπων. Αναγνώριση Προτύπων-Νευρωνικά ίκτυα -4 Τµήµα Πληροφορικής & Επικοινωνιών