Διδάσκουσα: Χάλκου Χαρά,

Σχετικά έγγραφα
Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Τεχνητή Νοημοσύνη ΙΙ. Εργαστηριακή Άσκηση 6. Μουστάκας Κωνσταντίνος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

Νευρωνικά ίκτυα και Εξελικτικός. Σηµερινό Μάθηµα. επανάληψη Γενετικών Αλγορίθµων 1 η εργασία Επανάληψη νευρωνικών δικτύων Ασκήσεις εφαρµογές

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Εισαγωγή στους Νευρώνες. Κυριακίδης Ιωάννης 2013

Τεχνητή Νοημοσύνη ΙΙ. Εργαστηριακή Άσκηση 5. Μουστάκας Κωνσταντίνος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

Υπερπροσαρμογή (Overfitting) (1)

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Αποθήκες εδομένων και Εξόρυξη εδομένων:

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

Ι. Preprocessing (Επεξεργασία train.arff):

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Υλοποίηση Συστήματος Ανίχνευσης Εισβολών σε Περιβάλλον Android για Ασύρματα Δίκτυα Πρόσβασης

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Διπλωματική εργασία Θέμα: «Δημιουργία ευφυούς συστήματος για τη διαχείριση και διαλογή των ασθενών Τμήματος Επειγόντων Περιστατικών

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Προγραμματισμός Ηλεκτρονικών Υπολογιστών 2 - Εργαστήριο

Τεχνικές Εξόρυξης Δεδομένων

Βελτιστοποίηση κατανομής πόρων συντήρησης οδοστρωμάτων Πανεπιστήμιο Πατρών - Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Αναγνώριση Προτύπων Εργασία 1η Classification

Πληροφοριακά Συστήματα Διοίκησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Πληροφορική 2. Τεχνητή νοημοσύνη

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση

Δομές Δεδομένων (Data Structures)

4.3. Γραµµικοί ταξινοµητές

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Αναγνώριση Προτύπων Ι

Ευφυής Προγραμματισμός

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Ευφυής Προγραμματισμός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ

HMY 795: Αναγνώριση Προτύπων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Προσαρμοστικό Σύστημα Νευρο-ασαφούς Συμπερασμού ANFIS (Adaptive Network based Fuzzy Inference System)

Αποθήκες και Εξόρυξη Δεδομένων

Σύστημα διεπαφής ανθρώπινου εγκεφάλου-υπολογιστή. Ειρήνη Ρίτη

ΕΡΓΑΣΤΗΡΙΟ 6 ο : Ταξινομήσεις εικόνων μη επιβλεπόμενη ταξινόμηση

Επιλογή παραμέτρων και χαρακτηριστικών ταξινομητή με χρήση της καμπύλης λειτουργίας δείκτη (ROC Curve)

Τεχνητά Νευρωνικά Δίκτυα. Τσιριγώτης Γεώργιος Τμήμα Μηχανικών Πληροφορικής ΤΕΙ Ανατολικής Μακεδονίας & Θράκης

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Πληροφοριακά Συστήματα & Περιβάλλον Ασκήσεις

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Βασικές αρχές εκπαίδευσης ΤΝΔ: το perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Αρχιτεκτονική Νευρωνικών Δικτύων

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Γλώσσες & Τεχνικές 4 ο Εξάμηνο. - Ενότητα 1 - Δημοσθένης Σταμάτης

Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες κατηγορίες (κλάσεις)

Κατηγοριοποίηση. 3 ο Φροντιστήριο. Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς. Σκούρα Αγγελική

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

squared error, Mean absolute error, Root mean squared error) µεγάλωσαν,

Μελέτη κατηγοριοποίησης δεδομένων με Μηχανές Διανυσμάτων Υποστήριξης (Support Vector Machines) και υλοποίηση εφαρμογής.

Στατιστική λήψη αποφάσεων

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

Πληροφοριακά Συστήματα & Περιβάλλον

Προγραµµατισµός Η/Υ. Δρ. Δ.Ν. Παγώνης. Καθηγητής Εφαρµογών. Τηλ: Τµήµα Ναυπηγών Μηχανικών ΤΕ, ΤΕΙ Αθήνας

Κεφάλαιο 7. Γενετικοί Αλγόριθµοι. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

Περιεχόμενα ΕΝΟΤΗΤΑ I. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Πρόλογος 15

ΒΙΟ003 - Εισαγωγή στη Βιοπληροφορική 1 η Εργαστηριακή Άσκηση. Διαδικτυακές βιβλιογραφικές πηγές (Μοριακής) Βιολογίας και Βιοπληροφορικής

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Τεχνητή Νοημοσύνη. TMHMA ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ. Εξάμηνο 5ο Οικονόμου Παναγιώτης & Ελπινίκη Παπαγεωργίου. Νευρωνικά Δίκτυα.

ANFIS(Από την Θεωρία στην Πράξη)

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques)

Μη Συµβολικές Μέθοδοι

Εταιρικοί Πελάτες. Delving into deep waters Οι νέες τεχνολογίες στην e-fresh.gr

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

Εξόρυξη Γνώσης - το εργαλείο WEKA

Σχεδίαση και Ανάλυση Αλγορίθμων

Ανάπτυξη και δηµιουργία µοντέλων προσοµοίωσης ροής και µεταφοράς µάζας υπογείων υδάτων σε καρστικούς υδροφορείς µε χρήση θεωρίας νευρωνικών δικτύων

Λήψη αποφάσεων κατά Bayes

Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων

Transcript:

Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr

Επιβλεπόμενοι Μη Επιβλεπόμενοι

Ομάδα Κατηγορία

Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών Τιμών

όλες οι τιμές πρέπει να ανήκουν στο [0,1] Η κανονικοποίηση πρέπει να γίνεται στο δοσμένο data set Πριν γίνει ο διαχωρισμός σε train και test set

Μεγάλος όγκος των βιολογικών δεδομένων Η ανάλυση απαιτεί μεγάλο υπολογιστικό κόστος Η εξόρυξη γνώσης ιδιαίτερα χρονοβόρα εφαρμογή αλγορίθμων μείωσης διαστατικότητας δεδομένων PCA : μη επιβλεπόμενος αλγόριθμος διατηρεί το μεγαλύτερο μέρος της διακύμανσης των δεδομένων

Δοσμένο data set 70% train set 30% test set Ο διαχωρισμός έγινε με τυχαίο τρόπο Train set : για εκπαίδευση αλγορίθμων μηχανικής μάθησης Test set : για έλεγχο εγκυρότητας των παραγόμενων κανόνων

Κλάση 1 (πρόβλεψη) Όχι Κλάση 1 (πρόβλεψη) True Positive False Negative Κλάση 1 False Positive True Negative Όχι Κλάση 1

Accuracy: είναι το ποσοστό των δειγμάτων ελέγχου που κατηγοριοποιήθηκαν ορθά από το μοντέλο. accuracy = (TP + TN) / (TP + TN + FP + FN) Specificity: είναι το ποσοστό των αρνητικών δειγμάτων που κατηγοριοποιήθηκαν ορθά από το μοντέλο. specificity = TN / (TN + FP) Sensitivity: είναι το ποσοστό των θετικών δειγμάτων που κατηγοριοποιήθηκαν ορθά από το μοντέλο. sensitivity = TP / (TP + FN)

Μηχανική Μάθηση

Ένα έμπειρο σύστημα είναι ένα υπολογιστικό σύστημα που προσομοιώνει την διαδικασία λήψης αποφάσεων από έναν εμπειρογνώμονα (άνθρωπο) Η λειτουργία τους βασίζεται πάνω σε γνώση και δεδομένα και όχι στην συμβατική διαδικασία επίλυσης προβλημάτων

Εργαλείο Μηχανικής Μάθησης Εξόρυξη δεδομένων Χρησιμότητα: Προεπεξεργασία δεδομένων Δημιουργία μοντέλων Απεικόνιση αρχικών δεδομένων/αποτελεσμάτων

στο περιβάλλον του weka επιλέγω Explorer open file φορτώνω το train.arff Classify, choose και επιλέγω τον αλγόριθμο J48 με reduced Error Pruning True Use training set start

δεξί κλίκ στην result list επιλέγω visualize tree

επιλέγω supplied test set φορτώνω το test.arff start

Το πρόβλημα κατηγοριοποίησης προκαθορισμένο σύνολο κατηγοριών Είσοδος : ένα σύνολο δεδομένων που περιγράφουν το «αντικείμενο» Έξοδος : η κατηγορία που αυτό ανήκει

σύνολο μεθόδων εκμάθησης για προβλήματα ταξινόμησης για γραμμικά & μη γραμμικά δεδομένα box constraint soft margin hyperplane μέγιστο περιθώριο

προκαθορισμένο σύνολο κατηγοριών Είσοδος : ένα σύνολο δεδομένων που περιγράφουν το «αντικείμενο» Έξοδος : η ομάδα που αυτό ανήκει

Eίσοδος το πλήθος των ομάδων k Eλαχιστοποίηση των αποστάσεων όλων των προτύπων κάθε ομάδας από το κεντροειδές της Eπαναληπτικός αλγόριθμος Ο αλγόριθμος τερματίζει όταν δεν θα συμβεί καμία μεταβολή στα clusters μέσα σε μια επανάληψη

ΤΝΔ: Συστήματα επεξεργασίας δεδομένων Αποτελούνται από τεχνητούς νευρώνες οργανωμένους σε δομές, όπως του ανθρώπινου εγκεφάλου Οργάνωση Νευρώνων: Input Layers Hidden Layers Output Layers

εμπνευσμένοι από την Δαρβινική θεωρεία της εξέλιξης των ειδών Αναζήτηση στο χώρο των υποψήφιων λύσεων Εύρεση αποδεκτών λύσεων προβλημάτων κατάλληλοι για την επίλυση βελτιστοποίησης Βελτιστοποίηση της συνάρτησης καταλληλότητας

κριτήριο αξιολόγησης των υποψηφίων λύσεων Είσοδος: μία υποψήφια λύση Έξοδος: ένας αριθμός που υποδηλώνει το βαθμό καταλληλότητας της λύσης Πρέπει: Συνεχής Μονότονη Στην παρούσα εργασία : η fitness function βαθμολογεί αρνητικά κάθε περίπτωση που είναι τύπου n και δεν είναι τοποθετημένη στη n-οστή κλάση

Ακρίβεια Υπολογιστικό κόστος

[1] Τεχνητή Νοημοσύνη, Βλαχάλας Ιωάννης, Κεφάλας Πέτρος, Βασιλειάδης Νικόλαος, Κόκκορας Φώτης, Σακελλαρίου Ηλίας. Γ Έκδοση. Εκδοτική Β. Γκιούρδας. [2]MATLAB 6 for Engineers, 3 rd Ediotion, Adrian Biran & Moshe Breiner. Εκδοσεις Τζιόλας 2003 [3]Pattern Classification, 2 nd Edition, Richard O. Duda, Peter E. Hart, David G. Stork. Wiley Interscience 2000 [4] Αναγνώριση Προτύπων, Ευάγγελος Δερματάς. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Πανεπιστήμιο Πατρών 2006