Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση"

Transcript

1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Πτυχιακή Εργασία Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση Κωνσταντίνος Παππάς Επιβλέπων: Ίων Ανδρουτσόπουλος Ιούλιος 2008

2 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή 1.1 Αντικείµενο της εργασίας ιάρθρωση εργασίας Ευχαριστίες 3 2. Ο Αλγόριθµος των k-κοντινότερων Γειτόνων 2.1 Εισαγωγή Αλγόριθµος k κοντινότερων γειτόνων Μέτρα απόστασης Αναλογία κέρδους ιδιοτήτων Ζύγισµα γειτόνων βάσει αποστάσεως Ενεργητική µάθηση 7 3. Αναγνώριση Μερών του Λόγου µε τον Αλγόριθµο των k-κοντινότερων Γειτόνων 3.1 ιαχωρισµός λεκτικών µονάδων Ιδιότητες διανυσµάτων Σύνολα ετικετών Κανόνες αυτόµατης κατάταξης εδοµένα, Πειράµατα και Αποτελέσµατα 4.1 Επιλογή και επεξεργασία δεδοµένων Ρυθµίσεις του ταξινοµητή Πειράµατα µε παθητική µάθηση Πειράµατα µε ενεργητική µάθηση Επιπλέον παρατηρήσεις Επίλογος 5.1 Ανασκόπηση Μελλοντικές επεκτάσεις 23 Παράρτηµα Ι: Αναπαράσταση των ετικετών σε XML 24 Αναφορές 26 1

3 1.1 Αντικείµενο της εργασίας ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ Στη διάρκεια δύο προηγούµενων εργασιών [Μα05, Χρο06] αναπτύχθηκε ένας επισηµειωτής µερών του λόγου (part-of-speech tagger) για ελληνικά κείµενα, ο οποίος χρησιµοποιούσε τον αλγόριθµο µάθησης των k κοντινότερων γειτόνων (knearest neighbors, k-nn). Ο επισηµειωτής κατέτασσε κάθε λέξη ενός δοθέντος κειµένου στο αντίστοιχο µέρος του λόγου (ρήµα, ουσιαστικό, άρθρο κλπ.). Εναλλακτικά, είχε τη δυνατότητα να κατατάσσει τις λέξεις σε λεπτοµερέστερες κατηγορίες, που αντανακλούσαν τον αριθµό, την πτώση και το γένος των ουσιαστικών, τη φωνή, τον αριθµό και το χρόνο των ρηµάτων κλπ. (π.χ. ξεχωριστή κατηγορία για τα αρσενικά ουσιαστικά ονοµαστικής ενικού, ξεχωριστή για τα αρσενικά ουσιαστικά γενικής ενικού κ.ο.κ.). Ακόµη, ο επισηµειωτής ήταν δυνατόν να εκπαιδευθεί µε ενεργητική µάθηση, επιλέγοντας δηλαδή ο ίδιος χρήσιµα παραδείγµατα εκπαίδευσης (λέξεις) από ένα σώµα κειµένων, τα οποία επισηµείωνε κατόπιν ο άνθρωπος-εκπαιδευτής του, αντί ο εκπαιδευτής να σηµειώνει µε τη σειρά τις λέξεις ενός σώµατος κειµένων εκπαίδευσης (παθητική µάθηση). Παρ όλο που κάποια πειράµατα είχαν δείξει ότι η ενεργητική µάθηση υπερτερούσε της παθητικής όταν χρησιµοποιούσαν και οι δύο το ίδιο µικρό σώµα κειµένων εκπαίδευσης, άλλα πειράµατα είχαν δείξει ότι η ενεργητική µάθηση αδυνατούσε να εκµεταλλευτεί επαρκώς µεγαλύτερα σώµατα εκπαίδευσης, επειδή τα επιλεγόµενα παραδείγµατα ήταν πολύ σπάνιες περιπτώσεις. Ακόµη, ο επισηµειωτής δεν διέθετε επαρκή τεκµηρίωση και χρησιµοποιούσε µια υλοποίηση του αλγορίθµου k-nn άλλης ερευνητικής οµάδας, κάτι που δηµιουργούσε προβλήµατα διάθεσης του λογισµικού του επισηµειωτή. 1 Στη διάρκεια της παρούσας εργασίας, δηµιουργήθηκε µια νέα υλοποίηση του αλγορίθµου k-nn, η οποία χρησιµοποιήθηκε κατόπιν ως βάση προκειµένου να επανυλοποιηθεί εξαρχής ο επισηµειωτής µερών του λόγου. Η νέα υλοποίηση του επισηµειωτή είναι πλήρως τεκµηριωµένη, διαθέτει εύχρηστη διεπαφή χρήστη και παρέχεται ελεύθερα. 2 ηµιουργήθηκαν, επίσης, βελτιωµένα σώµατα κειµένων εκπαίδευσης και αξιολόγησης, τα οποία χρησιµοποιήθηκαν σε νέα πειράµατα. Μελετήθηκαν, τέλος, πιθανοί τρόποι αντιµετώπισης των προβληµάτων που είχαν παρατηρηθεί στην περίπτωση της ενεργητικής µάθησης. 1.2 ιάρθρωση εργασίας Συνοπτικά, τα επόµενα κεφάλαια της εργασίας καλύπτουν τα εξής θέµατα: Το κεφάλαιο 2 αναφέρεται στις µεθόδους µηχανικής µάθησης που χρησιµοποιούνται στην εργασία. Συγκεκριµένα, περιλαµβάνει µια αναλυτική 1 Ο επισηµειωτής χρησιµοποιούσε την πλατφόρµα TiMBL [DaZa03]. Βλ. 2 Βλ. 2

4 περιγραφή του αλγορίθµου k-nn, καθώς και µια περιγραφή των µέτρων επιλογής παραδειγµάτων εκπαίδευσης που χρησιµοποιούνται στην ενεργητική µάθηση. Στο κεφάλαιο 3 περιγράφεται το πρόβληµα της αναγνώρισης µερών του λόγου και εξηγούνται τα διάφορα στάδια επεξεργασίας που χρησιµοποιούνται για τη λύση του µε µηχανική µάθηση. Στο κεφάλαιο 4 παρουσιάζονται τα δεδοµένα εκπαίδευσης και αξιολόγησης που χρησιµοποιήθηκαν στα πειράµατα της εργασίας. Επίσης, παρατίθενται τα αποτελέσµατα των πειραµάτων και τα συµπεράσµατα που προκύπτουν από αυτά. Τέλος, στο κεφάλαιο 5 γίνεται µια ανασκόπηση της εργασίας και προτείνονται πιθανές βελτιώσεις και κατευθύνσεις µελλοντικής έρευνας. 1.3 Ευχαριστίες Αρχικά, ευχαριστώ τον κ. Ίωνα Ανδρουτσόπουλο, που επέβλεψε την πτυχιακή µου εργασία, συµβουλεύοντας και ενθαρρύνοντάς µε σε κάθε στάδιό της. Αναγκαία για την ολοκλήρωση της εργασίας αποδείχθηκε η συµβολή και συνεργασία του Πρόδροµου Μαλακασιώτη, που ήταν παρών κάθε φορά που χρειάστηκε και µε βοήθησε τόσο στα σχετικά θεωρητικά ζητήµατα όσο και σε θέµατα υλοποίησης και διεξαγωγής πειραµάτων. Τον ευχαριστώ πολύ θερµά. Επίσης, ευχαριστώ το Γιώργο Λουκαρέλλι για το σύστηµα διαχωρισµού περιόδων (sentence splitter) που ανέπτυξε και διέθεσε ελεύθερα, καθώς αυτό αποτελεί µια ουσιαστική υποµονάδα του συστήµατος. Τέλος, ευχαριστώ τα µέλη του Εργαστηρίου Επεξεργασίας Πληροφοριών και ιδιαίτερα την Οµάδα Επεξεργασίας Φυσικής Γλώσσας του Τµήµατος Πληροφορικής του Οικονοµικού Πανεπιστηµίου Αθηνών, για τη βοήθεια που µου παρείχαν, εµψυχώνοντάς µε και διαθέτοντάς µου τον απαραίτητο εξοπλισµό. 3

5 ΚΕΦΑΛΑΙΟ 2: Ο ΑΛΓΟΡΙΘΜΟΣ ΤΩΝ Κ-ΚΟΝΤΙΝΟΤΕΡΩΝ ΓΕΙΤΟΝΩΝ 2.1 Εισαγωγή Η Μηχανική Μάθηση [Mit97] είναι ο τοµέας της Τεχνητής Νοηµοσύνης ο οποίος ασχολείται µε την ανάπτυξη αλγορίθµων και µοντέλων που επιτρέπουν σε υπολογιστικά συστήµατα να βελτιώνουν τις επιδόσεις τους αξιοποιώντας εµπειρικά δεδοµένα του παρελθόντος. Στην παρούσα εργασία χρησιµοποιούνται µέθοδοι Επιβλεπόµενης Μηχανικής Μάθησης [Ko07]. Ο όρος αυτός χρησιµοποιείται σε περιπτώσεις όπου απαιτείται να κατασκευαστεί µια συνάρτηση, δεδοµένων παραδειγµάτων ορισµάτων της (εισόδων) και των αντίστοιχων επιθυµητών τιµών της (εξόδων). Στο πρόβληµα της αναγνώρισης µερών του λόγου, τα ορίσµατα της αναζητούµενης συνάρτησης είναι ιδιότητες (attributes) που παρέχουν πληροφορίες για την υπό κατάταξη λέξη και τα συµφραζόµενά της. Οι τιµές που λαµβάνουν οι ιδιότητες στην περίπτωση κάθε λέξης λέγονται χαρακτηριστικά (features) της λέξης και συνήθως παριστάνονται ως διανύσµατα. Οι επιθυµητές τιµές (έξοδοι) της συνάρτησης είναι οι κατηγορίες των λέξεων, δηλαδή τα αντίστοιχα µέρη του λόγου ή τα µέρη του λόγου µε πρόσθετες πληροφορίες για την πτώση, τον αριθµό κλπ. Ο στόχος µας, δηλαδή, είναι να µάθουµε µια συνάρτηση που να απεικονίζει κάθε λέξη (ακριβέστερα, το διάνυσµα των χαρακτηριστικών της) στη σωστή κατηγορία. 2.2 Αλγόριθµος των k κοντινότερων γειτόνων Ο αλγόριθµος των k κοντινότερων γειτόνων (k-nn) [Be91] αποτελεί µια από τις απλούστερες µορφές επιβλεπόµενης µάθησης. Κατά το στάδιο της εκπαίδευσης, απλά αποθηκεύει τα διανύσµατα χαρακτηριστικών των παραδειγµάτων εκπαίδευσης, µαζί µε τις ορθές τους κατηγορίες, οι οποίες παρέχονται από τον άνθρωπο-εκπαιδευτή. Κατόπιν, κατά την κατάταξη νέων περιπτώσεων (λέξεων νέων κειµένων, στην περίπτωση του επισηµειωτή της εργασίας), κατασκευάζονται τα διανύσµατα χαρακτηριστικών τους και επιλέγονται για κάθε νέα περίπτωση (λέξη) τα k κοντινότερα (πιο παρόµοια) διανύσµατα εκπαίδευσης (γείτονες), βάσει κάποιου µέτρου απόστασης. Η κάθε νέα περίπτωση κατατάσσεται στην κατηγορία που πλειοψηφεί µεταξύ των ορθών κατηγοριών των k επιλεγέντων παραδειγµάτων εκπαίδευσης (κοντινότερων γειτόνων). Το k είναι ένας φυσικός αριθµός και αποτελεί παράµετρο του αλγορίθµου. Στην υλοποίηση του συστήµατος, αυτός ο αριθµός προσδιορίζει το πλήθος των κοντινότερων γειτονιών και όχι γειτόνων. Μια γειτονιά ορίζεται ως το σύνολο όλων των παραδειγµάτων εκπαίδευσης που έχουν την ίδια απόσταση από την υπό κατάταξη περίπτωση. Για παράδειγµα, αν k = 3 και οι κοντινότερες γειτονιές είναι δύο παραδείγµατα εκπαίδευσης σε απόσταση 5 (κοντινότερη γειτονιά), τρία 4

6 παραδείγµατα εκπαίδευσης σε απόσταση 7 (δεύτερη κοντινότερη γειτονιά) και δύο παραδείγµατα εκπαίδευσης σε απόσταση 8 (τρίτη κοντινότερη γειτονιά), θα χρησιµοποιηθούν επτά παραδείγµατα εκπαίδευσης ως γείτονες. 2.3 Μέτρα απόστασης Για τους σκοπούς της εργασίας, θα παρουσιαστούν δύο µόνο µέτρα απόστασης µεταξύ διανυσµάτων χαρακτηριστικών, τα οποία είχαν χρησιµοποιηθεί και στις προηγούµενες εργασίες [Μα05, Χρο06]: το µέτρο επικάλυψης (overlap metric) και το τροποποιηµένο µέτρο διαφοράς τιµών (modified value difference metric). Και τα δύο θεωρούν ως απόσταση δύο διανυσµάτων το συνολικό άθροισµα των διαφορών των χαρακτηριστικών τους. Το µέτρο επικάλυψης ορίζεται από τις δύο παρακάτω σχέσεις. Στις σχέσεις αυτές ( X ρ, Y ρ ) είναι η απόσταση µεταξύ των διανυσµάτων X ρ και Y ρ, που το καθένα έχει n χαρακτηριστικά (τιµές ιδιοτήτων), δ ( x i, y i ) είναι η διαφορά των αντιστοίχων χαρακτηριστικών (τιµών της ίδιας ιδιότητας) x i και y i, ενώ max i και min i είναι η µέγιστη και ελάχιστη τιµή, αντίστοιχα, της i-στής ιδιότητας. ρ ρ n ( X, Y) = δ(, ) i= 1 x i y i xi yi, αν αριθµητικές τιµές, διαφορετικά : maxi mini δ( xi, yi) = 0 αν xi = yi 1 αν xi yi (2.1) (2.2) Το διαφοροποιηµένο µέτρο διαφοράς τιµών προκύπτει εάν αντικαταστήσουµε τη σχέση (2.2) µε την παρακάτω, όπου m το πλήθος των κατηγοριών. δ m ( xi yi) = P( C j xi) P( C j yi), (2.3) j= 1 όπου οι πιθανότητες P(C j x i ) και P(C j y i ) εκτιµώνται από τα δεδοµένα εκπαίδευσης. 2.4 Αναλογία κέρδους ιδιοτήτων Το πληροφοριακό κέρδος (information gain) µετράει πόσο χρήσιµη είναι µια ιδιότητα κατά την πρόβλεψη της κατηγορίας µιας υπό κατάταξη περίπτωσης (λέξης). Μετράει, δηλαδή, τη µείωση της αβεβαιότητας της κατηγορίας που προκαλεί η γνώση της τιµής της ιδιότητας. Η αβεβαιότητα της κατηγορίας C µετριέται ως η εντροπία H(C), που ορίζεται από τον τύπο (2.4). Αν µάθουµε ότι η τιµή της ιδιότητας X είναι x, η εντροπία γίνεται H(C Χ=x), όπως στον τύπο (2.5). 5

7 H( C) = P( C= c) log 2 P( C= c) (2.4) c 2 (2.5) c ( = ) = ( = = ) log ( = = ) H C X x P C c X x P C c X x Γενικότερα, η γνώση της τιµής της ιδιότητας X οδηγεί σε αναµενόµενη εντροπία H(C X), που για ιδιότητες µε πεπερασµένο σύνολο δυνατών τιµών υπολογίζεται από τον τύπο (2.6). Το πληροφοριακό κέρδος που προσφέρει η ιδιότητα Χ είναι η αναµενόµενη µείωση της εντροπίας που επιφέρει η γνώση της τιµής της X. Υπολογίζεται από τον τύπο (2.7). H ( C X ) = P( X = x) H ( C X = x) (2.6) x IG( C, X ) = H ( C) P( X = x) H ( C X = x) (2.7) x Μια κανονικοποιηµένη µορφή του πληροφοριακού κέρδους που χρησιµοποιείται συχνά στον k-nn είναι η αναλογία κέρδους (gain ratio), η οποία υπολογίζεται ως ο λόγος του πληροφοριακού κέρδους της ιδιότητας διά την εντροπία της, όπως στον τύπο (2.8). Η εντροπία H(X) µια ιδιότητας υπολογίζεται από τον τύπο (2.9). Η αναλογία κέρδους «τιµωρεί» ιδιότητες µε πολλές ισοπίθανες δυνατές τιµές (άρα και µεγάλη εντροπία), προκειµένου να «τιµωρήσει» ιδιότητες όπως τα κλειδιά, που µπορεί να «προβλέπουν» µεν τις κατηγορίες των παραδειγµάτων εκπαίδευσης, αλλά δεν προσφέρουν χρήσιµες πληροφορίες σε νέες περιπτώσεις. = IG( C, X ) wi (2.8) H ( X ) ( ) ( ) (2.9) H ( X ) = P X = x log 2 P X = x x Κατά τον υπολογισµό της απόστασης δύο διανυσµάτων, οι διαφορές τιµών κάθε ιδιότητας µπορούν να πολλαπλασιαστούν µε την αναλογία κέρδους της ιδιότητας, ώστε να δίνεται µεγαλύτερο βάρος στις διαφορές τιµών σηµαντικών ιδιοτήτων. Στην περίπτωση αυτή η σχέση (2.1) της προηγούµενης ενότητας τροποποιείται ως εξής, όπου x i και y i οι τιµές της ιδιότητας X i στα δύο διανύσµατα: n ( Χ, Υ ) = IG( C, X i ) δ ( xi, yi ) (2.10) i= 1 6

8 2.5 Ζύγισµα γειτόνων βάσει αποστάσεως Μία συχνά χρησιµοποιούµενη βελτίωση του k-nn είναι κάθε ένας από τους k γείτονες να έχει βάρος ψήφου w i αντιστρόφως ανάλογο της απόστασης d i του γείτονα από την υπό κατάταξη περίπτωση, ώστε η κατάταξη να γίνεται λαµβάνοντας περισσότερο υπόψη τους πιο παρόµοιους γείτονες [Du76]. w i 1 = (2.11) ε + d j Στον παρονοµαστή της (2.8) προστίθεται µια µικρή θετική σταθερά ε, για να αποφευχθεί η διαίρεση µε το µηδέν όταν το d j είναι µηδέν. Κάθε νέα περίπτωση (λέξη) κατατάσσεται στην κατηγορία που πλειοψηφεί µεταξύ των k κοντινότερων γειτόνων της (πιο παρόµοια παραδείγµατα εκπαίδευσης), ζυγίζοντας τις ψήφους των γειτόνων µε τα βάρη της (2.8). Εάν ισοψηφίσουν δύο κατηγορίες, επιλέγεται µία από αυτές στην τύχη, µε πιθανότητα ανάλογη της συχνότητας εµφάνισης της κατηγορίας σε όλα τα παραδείγµατα εκπαίδευσης. 2.6 Ενεργητική µάθηση Κατά την ενεργητική µάθηση, ο ίδιος ο ταξινοµητής επιλέγει παραδείγµατα εκπαίδευσης από µια δεξαµενή παραδειγµάτων των οποίων δεν είναι γνωστές οι ορθές κατηγορίες και ζητά από τον άνθρωπο-εκπαιδευτή του να τα κατατάξει. Στην περίπτωσή µας, επιλέγονται λέξεις από ένα µη επισηµειωµένο σώµα κειµένων. Αν το µέτρο επιλογής παραδειγµάτων είναι κατάλληλο, ενδέχεται ο ταξινοµητής να επιτυγχάνει υψηλότερο ποσοστό ορθότητας (accuracy) σε σχέση µε το ποσοστό που επιτυγχάνει (για ίσο αριθµό παραδειγµάτων) όταν τα παραδείγµατα επιλέγονται τυχαία ή µε τη σειρά που εµφανίζονται στη δεξαµενή (π.χ. αν ο άνθρωποςεπισηµειωτής κατατάσσει µε τη σειρά τις λέξεις του σώµατος εκπαίδευσης). Η ενεργητική µάθηση µπορεί, εποµένως να οδηγήσει στα ίδια ή καλύτερα ποσοστά ορθότητας µε λιγότερα παραδείγµατα εκπαίδευσης, άρα µε λιγότερη χειρωνακτική κατάταξη παραδειγµάτων. Στην περίπτωση του k-nn, η µείωση των παραδειγµάτων εκπαίδευσης µπορεί να οδηγήσει επίσης σε σηµαντική µείωση της απαιτούµενης µνήµης και αύξηση της ταχύτητας κατάταξης. Στο σύστηµα της παρούσας εργασίας χρησιµοποιούνται δύο µέτρα επιλογής παραδειγµάτων κατά την ενεργητική µάθηση, τα οποία προέρχονται από τις προηγούµενες εργασίες [Μα05, Χρο06]. Το πρώτο µέτρο ορίζεται από τη σχέση (2.14), όπου x r µία λέξη προς κατάταξη (για την ακρίβεια, το διάνυσµα των χαρακτηριστικών της). Το µέτρο υπολογίζει ουσιαστικά την αβεβαιότητα (εντροπία) που έχει ο ταξινοµητής για την κατηγορία C της λέξης, δοθέντος του διανύσµατός της x r και των ήδη επιλεγµένων (και επισηµειωµένων) παραδειγµάτων εκπαίδευσης Τ. Για την ακρίβεια, χρησιµοποιείται η κανονικοποιηµένη µορφή εντροπίας του τύπου (2.12), όπου C ο συνολικός αριθµός των κατηγοριών που εµφανίζονται στους k r κοντινότερους γείτονες. Οι πιθανότητες P( C= c x, T ) εκτιµώνται µε τον τύπο 7

9 (2.13), όπου V ( c x, T ) είναι οι (ζυγισµένοι κατά απόσταση) ψήφοι των k κοντινότερων γειτόνων που ανήκουν στην κατηγορία c. Ο τύπος (2.14) δίνει αρνητικές τιµές στα υποψήφια παραδείγµατα εκπαίδευσης µε µηδενική εντροπία, ώστε να προτιµώνται παραδείγµατα µε µη µηδενική εντροπία, και µάλιστα δίνει πιο αρνητικές τιµές (τα αξιολογεί ως χειρότερα) στα υποψήφια παραδείγµατα που βρίσκονται κοντύτερα σε ήδη επιλεγµένα παραδείγµατα ανεξαρτήτως κατηγορίας (µεγαλύτερο άθροισµα ζυγισµένων κατά απόσταση ψήφων όλων των κατηγοριών). H n r ( C x, T) = c r r P C c x T P C c x T ( =, ) log ( =, ) c' 2 ( C ) log V ( c x, T ) P( C= c x r r, T) = r V ( c ' x, T ) r r H n( C x, T), αν H n( C x, T) 0 r W ( x, T ) = V ( c x, T ) H n( C x, T) = 0 r r, αν c (2.12) (2.13) (2.14) Το δεύτερο µέτρο είναι παρόµοιο, αλλά διαιρεί την κανονικοποιηµένη εντροπία µε το άθροισµα των (ζυγισµένων κατά απόσταση) ψήφων των κατηγοριών των k κοντινότερων γειτόνων, ώστε να προτιµώνται παραδείγµατα εκπαίδευσης για τα οποία είναι αβέβαιος ο ταξινοµητής αλλά και δεν βρίσκονται κοντά σε πολλά ήδη επιλεγµένα παραδείγµατα. r W ( x, T ) r H n( C x, T) r, αν Hn( C x, T) 0 r log V ( c x, T ) r r V ( c x, T ), αν Hn( C x, T) = 0 c' = c' (2.15) 8

10 ΚΕΦΑΛΑΙΟ 3: ΑΝΑΓΝΩΡΙΣΗ ΜΕΡΩΝ ΤΟΥ ΛΟΓΟΥ ΜΕ ΤΟΝ ΑΛΓΟΡΙΘΜΟ ΤΩΝ Κ-ΚΟΝΤΙΝΟΤΕΡΩΝ ΓΕΙΤΟΝΩΝ 3.1 ιαχωρισµός λεκτικών µονάδων εδοµένου ενός συνόλου κατηγοριών (ετικετών, tags) που παριστάνουν τα µέρη του λόγου (ή και λεπτοµερέστερες πληροφορίες, όπως ο αριθµός, η πτώση και το γένος των ουσιαστικών), το πρόβληµα της αναγνώρισης των µερών του λόγου έγκειται στην κατάταξη κάθε λεκτικής µονάδας (token) ενός δοσµένου κειµένου στη σωστή κατηγορία. Αυτό προϋποθέτει το διαχωρισµό του κειµένου σε λεκτικές µονάδες. Στο σύστηµα της εργασίας, ο διαχωρισµός των λεκτικών µονάδων ξεκινά µε τον εντοπισµό και επισηµείωση των τελειών που σηµατοδοτούν τέλη περιόδων. Χρησιµοποιείται ένας προϋπάρχων διαχωριστής περιόδων [Λου05], ο οποίος διαχωρίζει τις τελείες που σηµατοδοτούν τέλη περιόδων από τις υπόλοιπες, χρησιµοποιώντας και αυτός µηχανική µάθηση. Ο διαχωριστής περιόδων πετυχαίνει ποσοστό επιτυχίας κοντά στο 98%. Κατόπιν, εξετάζονται ένας προς έναν όλοι οι χαρακτήρες του κειµένου από την αρχή ως το τέλος. Κατά τη διάρκεια αυτού του περάσµατος, αναγνωρίζονται οι λεκτικές µονάδες, ως εξής: Ο χαρακτήρας, αποτελεί ξεχωριστή λεκτική µονάδα, εάν ακολουθείται από κενό, χαρακτήρα tab ή χαρακτήρα αλλαγής γραµµής. Ο χαρακτήρας. αποτελεί ξεχωριστή λεκτική µονάδα, εάν έχει σηµειωθεί ως τέλος περιόδου από το διαχωριστή περιόδων. Οι χαρακτήρες! και ; αποτελούν ξεχωριστές λεκτικές µονάδες. Η εύρεση τέτοιων χαρακτήρων σηµατοδοτεί και τέλος περιόδου. Οι χαρακτήρες (, ),, %, <, >, «,», {, }, [, ], /, \, *, $, :,,, - και + αποτελούν ξεχωριστές λεκτικές µονάδες. Κατά τα άλλα, τα κενά, οι χαρακτήρες tab και οι χαρακτήρες αλλαγής γραµµής θεωρούνται διαχωριστές λεκτικών µονάδων. 3.2 Ιδιότητες διανυσµάτων Μετά το διαχωρισµό του κειµένου σε λεκτικές µονάδες, κατασκευάζεται για κάθε µία ένα διάνυσµα χαρακτηριστικών (features, τιµές ιδιοτήτων). Οι ιδιότητες είναι οι ίδιες µε αυτές των προηγούµενων εργασιών ([Μα05], [Χρο06]), δηλαδή οι ακόλουθες. 1. Κατάληξη (οι τρεις τελευταίοι χαρακτήρες ή ολόκληρη η λεκτική µονάδα, αν αυτή έχει µήκος µικρότερο ή ίσο του τρία). 9

11 2. Μήκος της λεκτικής µονάδας (αριθµός χαρακτήρων). 3. Ύπαρξη αποστρόφου στη λεκτική µονάδα (1 εάν υπάρχει, 0 διαφορετικά). 4. Ύπαρξη αριθµητικού ψηφίου στη λεκτική µονάδα (1 εάν υπάρχει, 0 διαφορετικά). 5. Ύπαρξη τελείας στη λεκτική µονάδα (1 εάν υπάρχει, 0 διαφορετικά). 6. Ύπαρξη κόµµατος στη λεκτική µονάδα (1 εάν υπάρχει, 0 διαφορετικά). 7. Ύπαρξη λατινικού χαρακτήρα στη λεκτική µονάδα (1 εάν υπάρχει, 0 διαφορετικά). 8. Η ετικέτα αµφισηµίας (βλ. παρακάτω) της λεκτικής µονάδας. 9. Η κατάληξη της επόµενης λεκτικής µονάδας. 10. Η ετικέτα αµφισηµίας της επόµενης λεκτικής µονάδας. 11. Η κατάληξη της προηγούµενης λεκτικής µονάδας. 12. Η προηγούµενη λεκτική µονάδα. 13. Η ετικέτα αµφισηµίας της προηγούµενης λεκτικής µονάδας. 14. Η λεκτική µονάδα πριν την προηγούµενη λεκτική µονάδα. 15. Η κατάληξη της λεκτικής µονάδας πριν την προηγούµενη λεκτική µονάδα. Η ετικέτα αµφισηµίας (ambivalence tag - ambitag) [DaZa03] µιας λεκτικής µονάδας είναι µια συµβολοσειρά που περιέχει τις κατηγορίες (τα ονόµατα των κατηγοριών) που µπορούν να βρεθούν για αυτή τη λεκτική µονάδα στο σύνολο εκπαίδευσης χωρισµένες µε παύλες. Εάν η λεκτική µονάδα δεν έχει ακόµη προστεθεί στο σύνολο εκπαίδευσης, τότε η ετικέτα αµφισηµίας είναι µια συµβολοσειρά που περιέχει τις κατηγορίες που έχουν βρεθεί για την κατάληξή της χωρισµένες µε παύλες. Εάν δεν υπάρχει κάποια κατηγορία ούτε για την κατάληξη στο σύνολο εκπαίδευσης, τότε η ετικέτα αµφισηµίας παίρνει την τιµή «unknown». Οι κατηγορίες της λεκτικής µονάδας ή της κατάληξής της εµφανίζονται στην ετικέτα αµφισηµίας ταξινοµηµένες µε βάση τη συχνότητα µε την οποία έχουν βρεθεί στο σύνολο εκπαίδευσης. Εάν περισσότερες της µίας κατηγορίες εµφανίζονται µε την ίδια συχνότητα, η ταξινόµηση γίνεται αλφαβητικά. 3.3 Σύνολα ετικετών Στο σύστηµα της εργασίας, το σύνολο των κατηγοριών (ετικετών) ορίζεται µε δύο διαφορετικούς τρόπους, τον βασικό και τον εκτεταµένο. Περισσότερες πληροφορίες για την προέλευση των δύο συνόλων ετικετών παρέχονται στις προηγούµενες εργασίες [Μα05, Χρο06]. 10

12 Το βασικό σύνολο περιέχει δώδεκα ετικέτες: άρθρο, ρήµα, σηµείο στίξης, επίθετο, επίρρηµα, σύνδεσµος, ουσιαστικό, αριθµητικό, µόριο, πρόθεση, πρόθεµα και άλλο. Το εκτεταµένο σύνολο περιέχει εκατόν εβδοµήντα ετικέτες. Το σύνολο αυτό περιγράφεται αναλυτικά στο παράρτηµα Ι, όπου δίνεται µια αναπαράσταση των ετικετών σε XML. 3.4 Κανόνες αυτόµατης κατάταξης Μια πρώτη λύση που ίσως θα πρότεινε κανείς για το πρόβληµα της αναγνώρισης µερών του λόγου είναι η κατασκευή ενός λεξικού που θα περιείχε όλες τις πιθανές λεκτικές µονάδες και τις αντίστοιχες κατηγορίες τους. Μια τέτοια προσέγγιση όµως αποτυγχάνει, επειδή δεν µπορούµε να αποφανθούµε πάντα για το µέρος του λόγου µιας λεκτικής µονάδας χωρίς να εξετάσουµε τα συµφραζόµενά της. Για παράδειγµα, στην πρόταση «Η τσάντα αυτή είναι της κυρίας.» η λεκτική µονάδα «της» είναι άρθρο, ενώ στην πρόταση «Η τσάντα είναι δικιά της.» είναι αντωνυµία. Ωστόσο, σε ορισµένες περιπτώσεις µπορούµε όντως να αναγνωρίσουµε µέρη του λόγου γνωρίζοντας µονάχα την αντίστοιχη λέξη. Για παράδειγµα, η λεκτική µονάδα «!» πρέπει να καταταγεί ως σηµείο στίξης, ανεξάρτητα από τα συµφραζόµενά της. Στο παρόν σύστηµα χρησιµοποιείται ένας συνδυασµός των δύο προσεγγίσεων. Έτσι, µια λεκτική µονάδα δίνεται προς κατάταξη στον ταξινοµητή k-nn µόνο εφόσον δεν µπορεί να καταταγεί βάσει ενός λεξικού που δηµιουργείται στη διάρκεια της εκπαίδευσης. Το λεξικό περιλαµβάνει κατηγορίες λέξεων που δεν είναι δυνατόν να εµφανιστούν µε περισσότερες από µία ετικέτες. Οι κατηγορίες αυτές είναι (βλ. και παράρτηµα Ι) οι ακόλουθες. Σηµειώνεται ότι εάν επιλεγεί το βασικό σύνολο ετικετών, τότε χρησιµοποιούνται µόνο οι τρείς τελευταίες. article/definite/nominative/masculine/singular article/definite/nominative/feminine/singular article/prepositional/genitive/feminine/singular article/prepositional/accusative/feminine/singular article/prepositional/accusative/feminine/plural article/prepositional/accusative/masculine/plural pronoun/inflectionless other/abbreviation other/foreign_word other/symbol other/other punctuation conjunction particle Για κάθε µία από τις παραπάνω κατηγορίες, δηµιουργείται κατά την εκπαίδευση µια λίστα. Για να περιληφθεί µια λεκτική µονάδα εκπαίδευσης σε κάποια λίστα, πρέπει να µην είναι όλοι οι χαρακτήρες της κεφαλαίοι. Με τον έλεγχο αυτό αποφεύγουµε την λανθασµένη κατάταξη ακρωνύµων. Για παράδειγµα, ακόµα και εάν η λεκτική µονάδα «ΚΑΙ» βρεθεί ως σύνδεσµος στο σώµα εκπαίδευσης, δεν αποκλείεται η ίδια 11

13 να βρεθεί σε άλλα κείµενα ως ακρώνυµο (π.χ. σε έναν τίτλο). Επιπλέον, για αντίστοιχους λόγους, για να περιληφθεί µια λεκτική µονάδα στην λίστα ξένων λέξεων πρέπει όλοι οι χαρακτήρες της να είναι πεζοί. Μετά τους παραπάνω ελέγχους, ελέγχεται εάν όλοι οι χαρακτήρες της λεκτικής µονάδας είναι αριθµητικά ψηφία. Αν είναι, τότε η λεκτική µονάδα κατατάσσεται άµεσα ως αριθµητικό. Τέλος, εάν η λεκτική µονάδα περιλαµβάνει τουλάχιστον ένα λατινικό χαρακτήρα, κατατάσσεται ως ξένη λέξη. 12

14 ΚΕΦΑΛΑΙΟ 4: Ε ΟΜΕΝΑ, ΠΕΙΡΑΜΑΤΑ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ 4.1 Επιλογή και επεξεργασία δεδοµένων Για την ανάπτυξη του συστήµατος υπήρχαν από προηγούµενες εργασίες διαθέσιµα χιλιάδες ειδησεογραφικά κείµενα από τις εφηµερίδες «ΤΑ ΝΕΑ» και «ΒΗΜΑ». Από αυτά 46 χρησιµοποιήθηκαν για την κατασκευή ενός σώµατος κειµένων ελέγχου 7878 λεκτικών µονάδων και 160 για την κατασκευή ενός σώµατος κειµένων εκπαίδευσης λεκτικών µονάδων. Τα σώµατα κειµένων εκπαίδευσης και ελέγχου ανανεώθηκαν, σε σχέση µε αυτά των προηγούµενων εργασιών, µε σκοπό να καλυφθεί όσο το δυνατόν µεγαλύτερο φάσµα θεµατικών ενοτήτων και αρθρογράφων. Σε αντίθετη περίπτωση, το σύστηµα θα «µάθαινε» τις ιδιαιτερότητες λίγων θεµατικών ενοτήτων και θα εξειδικευόταν στον ιδιαίτερο τρόπο γραφής συγκεκριµένων αρθρογράφων. Στην παρούσα εργασία επιλέχθηκαν από κάθε ειδησεογραφικό κείµενο οι πρώτες 150 µόνο λέξεις και όσες επιπλέον χρειαζόταν για να ολοκληρωθεί η τελευταία πρόταση. Τα νέα κείµενα επισηµειώθηκαν χειρωνακτικά χρησιµοποιώντας το εργαλείο επισηµείωσης του συστήµατος. 4.2 Ρυθµίσεις του ταξινοµητή Οι συνιστώσες του συστήµατος που αξιολογήθηκαν πειραµατικά είναι: η επίδοση του αλγορίθµου k-νν για διάφορες τιµές της παραµέτρου k, η χρήση ή όχι της αναλογίας κέρδους κατά τον υπολογισµό της απόστασης δύο διανυσµάτων, η ενεργοποίηση ή µη των κανόνων αυτόµατης κατάταξης και η χρήση του µέτρου επικάλυψης ή του τροποποιηµένου µέτρου διαφοράς τιµών. Προκαταρκτικά πειράµατα έδειξαν ότι οι επιδόσεις του ταξινοµητή δεν επηρεάζονται σηµαντικά από την τιµή του k, ίσως επειδή χρησιµοποιήσαµε σε όλα τα πειράµατα ζύγισµα των ψήφων των γειτόνων βάσει των αποστάσεών τους από την υπό κατάταξη περίπτωση. Έτσι, ως προεπιλογή τίθεται η απλούστερη τιµή, δηλαδή k =1. Επίσης, το ζύγισµα µε βάση την αναλογία κέρδους φαίνεται να βελτιώνει τις επιδόσεις (βλ. παρακάτω διάγραµµα), ενώ ταυτόχρονα µειώνει το χρόνο κατάταξης. Η µείωση του χρόνου κατάταξης δικαιολογείται, επειδή χωρίς ζύγισµα παίρνουµε πολλά διανύσµατα σε ίδιες αποστάσεις, οπότε προκύπτουν πολλοί γείτονες στις κοντινότερες γειτονιές. Αυτό αυξάνει το κόστος εύρεσης πλειοψηφούσας κατηγορίας. Από την άλλη, η αναλογία κέρδους µίας ιδιότητας υπολογίζεται µία µόνο φορά στο στάδιο της εκπαίδευσης οπότε δεν επιβαρύνει το στάδιο κατάταξης. Ως προεπιλογή τίθεται η χρήση αναλογίας κέρδους. 13

15 Επεκταµένο Σύνολο 90% 80% 70% Ορθότητα 60% 50% 40% 30% gain ratio no gain ratio 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) Σχήµα 4.1 Βελτίωση µε χρήση αναλογίας κέρδους. Οι κανόνες αυτόµατης κατάταξης γενικά επιδρούν µόνο θετικά στη διαδικασία κατάταξης, επειδή απαντούν µε απόλυτη βεβαιότητα για το µέρος του λόγου κάθε λέξης που περιλαµβάνεται στις λίστες τους. Έτσι περιορίζουν τα πιθανά σφάλµατα του ταξινοµητή k-nn µόνο στις υπόλοιπες λέξεις. Πειραµατικά φάνηκε ότι, αν και η επίδοση γενικά βελτιώνεται µε τη χρήση αυτών των κανόνων, όταν το σώµα εκπαίδευσης είναι αρκετά µεγάλο οι λέξεις που κατατάσσονται από τους κανόνες θα µπορούσαν να καταταγούν εξίσου ορθά από τον ταξινοµητή k-nn. Εντούτοις, η διαδικασία ολοκληρώνεται αισθητά πιο γρήγορα όταν χρησιµοποιούνται οι κανόνες, επειδή για την κατάταξη των λεκτικών µονάδων που περιλαµβάνονται στις λίστες τους αποφεύγεται η χρονοβόρα εύρεση των κοντινότερων γειτόνων και η επιλογή της πλειοψηφούσας κατηγορίας. 14

16 Επεκταµένο Σύνολο Ετικετών, Μέτρο Επικάλυψης 90% 80% 70% Ορθότητα 60% 50% 40% 30% Lists On Lists Off 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) Σχήµα 4.2 Ποσοστό ορθότητας µε και χωρίς κανόνες αυτόµατης κατάταξης. Επεκταµένο Σύνολο Ετικετών, Μέτρο Επικάλυψης Χρόνος Εκτέλεσης (sec.) Lists On Lists Off % 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) Σχήµα 4.3 Χρόνος κατάταξης µε και χωρίς κανόνες αυτόµατης κατάταξης. Τέλος, η χρήση του τροποποιηµένου µέτρου διαφοράς τιµών παρόλο που επιτυγχάνει υψηλότερες επιδόσεις σε σχέση µε το µέτρο επικάλυψης επιβαρύνει πολύ την εφαρµογή από άποψη χρόνου, όπως φαίνεται στα παρακάτω διαγράµµατα. 15

17 Επεκταµένο Σύνολο 90,00% 80,00% 70,00% Ορθότητα 60,00% 50,00% 40,00% 30,00% MVDM Overlap 20,00% 10,00% 0,00% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) Σχήµα 4.4 Σύγκριση επίδοσης των δύο µέτρων απόστασης. Επεκταµένο Σύνολο 2500 Χρόνος Εκτέλεσης (sec.) MVDM Overlap 0 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) Σχήµα 4.5 Σύγκριση χρόνων κατάταξης µε τα δύο µέτρα απόστασης. Με βάση τα παραπάνω, επιλέχθηκε ως προεπιλογή το µέτρο επικάλυψης, επειδή κρίθηκε εξαιρετικά µη αποδοτική η καθυστέρηση του διαφοροποιηµένου µέτρου. Στα παραπάνω γραφήµατα ποσοστών ορθότητας δίνονται και τα αντίστοιχα διαστήµατα εµπιστοσύνης µε βαθµό βεβαιότητας 99%. 16

18 4.3 Πειράµατα µε παθητική µάθηση Τα πειράµατα παθητικής µάθησης επιχειρούν να µετρήσουν την ορθότητα που επιτυγχάνει ο ταξινοµητής για διάφορα µεγέθη του σώµατος εκπαίδευσης. Στα πειράµατα που εκτελέστηκαν, το σώµα ελέγχου παρέµενε σταθερό στις 7878 λεκτικές µονάδες. Σε κάθε επανάληψη, το σώµα εκπαίδευσης αυξανόταν κατά 90 λεκτικές µονάδες οι οποίες επιλέγονταν κατά τη σειρά µε την οποία εµφανίζονταν στα κείµενα. Ο ταξινοµητής εκπαιδευόταν στο νέο σώµα εκπαίδευσης και η ορθότητά του αξιολογούταν εκ νέου. Με τον ίδιο τρόπο εκτελέστηκαν και τα πειράµατα της προηγούµενης ενότητας. Ο ταξινοµητής ρυθµίστηκε µε βάση τις προεπιλογές που αναφέρθηκαν στην προηγούµενη ενότητα. Οι επιδόσεις του µετρήθηκαν και για τα δύο σύνολα ετικετών, όπως φαίνεται στο παρακάτω διάγραµµα. Είναι φανερό ότι το πρόβληµα αναγνώρισης µερών του λόγου είναι αρκετά πιο εύκολο όταν επιλέγεται το βασικό σύνολο ετικετών. Μέτρο Επικάλυψης 100% 90% 80% 70% Ορθότητα 60% 50% 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) Basic Tagset Extended Tagset Σχήµα 4.6 Επιδόσεις ταξινοµητή µε χρήση παθητικής µάθησης. 4.4 Πειράµατα µε ενεργητική µάθηση Στην ενεργητική µάθηση όλα τα υποψήφια παραδείγµατα ταξινοµούνται ως προς την χρησιµότητά τους µε βάση µέτρα όπως αυτά που περιγράφονται στην ενότητα 2.6. Σε κάθε επανάληψη των πειραµάτων επιλέγεται το χρησιµότερο από τα υποψήφια παραδείγµατα, αφαιρείται από το σύνολο υποψήφιων παραδειγµάτων και προστίθεται στο νέο σώµα εκπαίδευσης. Στα πειράµατα που πραγµατοποιήθηκαν, για να εξοικονοµηθεί χρόνος, σε κάθε επανάληψη επιλέγονταν τα 90 χρησιµότερα παραδείγµατα. Χρησιµοποιήθηκε το 17

19 µέτρο που περιγράφεται στη σχέση (2.11), το οποίο προηγούµενα πειράµατα [Μα05], [Χρο06] έχουν δείξει πως έχει παρόµοια επίδοση µε αυτό της σχέσης (2.12). Το σύνολο όλων των υποψήφιων παραδειγµάτων επιλέχθηκε να είναι το ίδιο µε αυτό που χρησιµοποιήθηκε και στα πειράµατα παθητικής µάθησης, ώστε να µετρήσουµε τα οφέλη της ενεργητικής µάθησης στα ίδια δεδοµένα, αλλά και να αποφύγουµε επιπλέον χειρωνακτικές επισηµειώσεις. Αυτό έχει ως αποτέλεσµα οι καµπύλες ορθότητας να συγκλίνουν στο σηµείο όπου χρησιµοποιείται όλο το σώµα υποψήφιων παραδειγµάτων. Άρα στα παρακάτω αποτελέσµατα µας ενδιαφέρει η ταχύτητα µε την οποία αυξάνεται η ορθότητα του ταξινοµητή συναρτήσει του µεγέθους του σώµατος εκπαίδευσης. Αρχικά, µετρήθηκε η ορθότητα του ταξινοµητή όταν χρησιµοποιείται ενεργητική µάθηση και συγκρίθηκε µε τα αντίστοιχα αποτελέσµατα που πήραµε στην παθητική µάθηση. Όπως φαίνεται και στο παρακάτω σχήµα, όταν χρησιµοποιείται το µέτρο επιλογής χρησιµότερων παραδειγµάτων της σχέσης (2.11) ο ταξινοµητής επιτυγχάνει γενικά υψηλότερα επίπεδα ορθότητας σε σχέση µε την παθητική µάθηση. Επεκταµένο Σύνολο Ετικετών, Μέτρο Επικάλυψης 90% 80% 70% 60% Ορθότητα 50% 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) AL90en PL Σχήµα 4.7 Σύγκριση ενεργητικής και παθητικής µάθησης. Μια άλλη ιδέα που διερευνήσαµε ήταν κατά την επιλογή παραδειγµάτων εκπαίδευσης στην ενεργητική µάθηση να εξαιρούνται οι σπάνιες περιπτώσεις. Στην περίπτωσή µας, αυτό σηµαίνει να αγνοούνται τα υποψήφια διανύσµατα εκπαίδευσης που προέρχονται από λέξεις οι οποίες εµφανίζονται λίγες µόνο φορές στο σώµα υποψήφιων παραδειγµάτων εκπαίδευσης. Στο πείραµα που αντιστοιχεί στην κάτω καµπύλη του ακόλουθου διαγράµµατος αποκλείστηκαν υποψήφια διανύσµατα εκπαίδευσης που προέρχονταν από λέξεις οι οποίες εµφανίζονται µία ή δύο µόνο φορές στο αρχικό σώµα υποψήφιων παραδειγµάτων. Η επιλογή τέτοιων παραδειγµάτων επιτράπηκε µόνο εφόσον είχαν εξαντληθεί όλα τα υπόλοιπα. Παρατηρούµε ότι η ορθότητα γενικά δεν βελτιώνεται. Φαίνεται, δηλαδή, ότι η 18

20 εξαίρεση παραδειγµάτων χαµηλής συχνότητας αφαιρεί από το σύνολο υποψήφιων παραδειγµάτων χρήσιµα παραδείγµατα. Επεκταµένο Σύνολο Ετικετών, Μέτρο Επικάλυψης 90% 80% 70% 60% Ορθότητα 50% 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) AL90en AL90enfr Σχήµα 4.8 Απόδοση όταν εξαιρούνται παραδείγµατα λέξεων συχνότητας ένα και δύο. Στη συνέχεια, µετρήθηκε η βελτίωση που έχουµε όταν εξαιρούνται από τα υποψήφια παραδείγµατα εκπαίδευσης τα διανύσµατα που µπορούν να καταταγούν από τους κανόνες αυτόµατης κατάταξης. Στο πείραµα του επόµενου διαγράµµατος, σε κάθε επανάληψη επιλέγονταν µόνο παραδείγµατα τα οποία δεν µπορούσαν να καταταγούν από τους κανόνες αυτόµατης κατάταξης, εκτός αν δεν είχαν αποµείνει άλλα υποψήφια παραδείγµατα. Φαίνεται ότι αυτή η χρήση των κανόνων κατάταξης επιδρά θετικά στα αποτελέσµατα της ενεργητικής µάθησης, ιδιαίτερα όταν τα παραδείγµατα εκπαίδευσης είναι λίγα, αν και η βελτίωση στο ποσοστό ορθότητας είναι µικρή, όπως και στην περίπτωση της παθητικής µάθησης. Σηµειώνεται ότι είναι επόµενο οι καµπύλες να συγκλίνουν στα δεξιά, αφού τότε αναγκαζόµαστε να χρησιµοποιήσουµε παραδείγµατα εκπαίδευσης που κατατάσσονται από τους κανόνες, µια που δεν έχουν αποµείνει άλλα. Η χρήση των κανόνων µειώνει, επίσης, τις απαιτήσεις σε µνήµη και το χρόνο ταξινόµησης, όπως ήδη αναφέρθηκε στην περίπτωση της παθητικής µάθησης. 19

21 Επεκταµένο Σύνολο Ετικετών, Μέτρο Επικάλυψης Ορθότητα 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Σώµα Εκπαίδευσης (%) AL90en AL90enli Σχήµα 4.9 Χρήση κανόνων αυτόµατης κατάταξης στην ενεργητική µάθηση. 4.5 Επιπλέον παρατηρήσεις Η ιδέα να εξαιρούνται τα υποψήφια διανύσµατα εκπαίδευσης που προέρχονται από λέξεις µε µικρή συχνότητα εµφάνισης φάνηκε να µη βελτιώνει τα αποτελέσµατα. Ωστόσο, στα παραπάνω πειράµατα το αρχικό σύνολο υποψήφιων παραδειγµάτων ήταν το ίδιο που χρησιµοποιήθηκε και στην παθητική µάθηση. Ήταν δηλαδή µια συλλογή κειµένων λεκτικών µονάδων. Σε αυτό το σώµα κειµένων οι λέξεις που εµφανίζονταν µε συχνότητα ένα και δύο ήταν στο σύνολό τους Ηταν, δηλαδή, σχεδόν το ένα τρίτο όλων των λέξεων. Έτσι, περιλαµβάνονταν και πολλές λέξεις που δεν παρουσίαζαν κάποια ιδιορυθµία και ενδεχοµένως θα ήταν χρήσιµες στον ταξινοµητή. Ενδεικτικά, µερικές από αυτές ήταν οι λέξεις «συνολική», «κατανοµή», «νοµοσχέδιο», «σύντοµη», «αναφορά», «φώτα», «Οδηγός». Εάν είχε χρησιµοποιηθεί ένα πιο µεγάλο σύνολο κειµένων, για παράδειγµα ένα σύνολο από κείµενα εκατοµµυρίων λέξεων, τότε οι λέξεις που θα εµφανίζονταν εκεί µε συχνότητα ένα και δύο µόνο θα ήταν αρκετά πιο σπάνιες. Τέτοιες λέξεις ίσως να επιλέγονταν λανθασµένα από το µέτρο επιλογής χρησιµότερων παραδειγµάτων, επειδή θα παρουσίαζαν υψηλή εντροπία για τον ταξινοµητή. Επιπλέον, είναι εξίσου πιθανό λόγω της σπανιότητάς τους η εκπαίδευση σε τέτοιες λέξεις να µη βελτίωνε επαρκώς την ορθότητα του ταξινοµητή. Τα δύο αυτά προβλήµατα είχαν παρατηρηθεί σε προηγούµενη εργασία [Χρο06]. Έτσι, µια µέθοδος όπως αυτή της εξαίρεσης λέξεων χαµηλής συχνότητας κατά την επιλογή παραδειγµάτων είναι πολύ πιθανό να οδηγήσει σε καλύτερα αποτελέσµατα όταν χρησιµοποιείται ένα πολύ µεγαλύτερο σώµα κειµένων ως δεξαµενή υποψήφιων παραδειγµάτων. υστυχώς, παρ όλο που είχαµε στη διάθεσή µας µια τέτοια δεξαµενή (τα χιλιάδες άρθρα εφηµερίδων που 20

22 αναφέρθηκαν στην αρχή του κεφαλαίου), περιορισµοί χρόνου δεν επέτρεψαν τη διερεύνηση αυτής της ιδέας. Επιπλέον, στα παραπάνω πειράµατα ενεργητικής µάθησης, µετά την ταξινόµηση όλων των υποψήφιων παραδειγµάτων ως προς την χρησιµότητά τους, επιλέγονταν σε κάθε επανάληψη τα 90 από αυτά, προκειµένου να εξοικονοµείται χρόνος (λιγότερες επαναξιολογήσεις των υποψηφίων παραδειγµάτων). Έτσι, όµως, στα 90 χρησιµότερα παραδείγµατα που επιλέγονται ανά επανάληψη είναι πιθανό να περιλαµβάνονται πολλά που είναι εξαιρετικά όµοια. Οπότε, µετά την ενσωµάτωση ενός από τα παρόµοια στο σύνολο εκπαίδευσης, τα υπόλοιπα παύουν να είναι χρήσιµα. Το παραπάνω φαινόµενο αποκτά µεγαλύτερη βαρύτητα όταν το µέγεθος του συνόλου υποψήφιων παραδειγµάτων αυξάνεται. Όσο περισσότερα υποψήφια διανύσµατα εκπαίδευσης έχουµε, τόσο πιθανότερο είναι για κάθε ένα από αυτά να µπορούν να βρεθούν παρόµοιά του. Ενδεικτικά, δίνονται τα δέκα χρησιµότερα διανύσµατα όπως ταξινοµήθηκαν µε το µέτρο της σχέσης (2.11) στην πρώτη επανάληψη των πειραµάτων ενεργητικής µάθησης όπου επιλέγονταν 90 παραδείγµατα σε κάθε επανάληψη. Επίσης, παρουσιάζεται (επάνω καµπύλη) η βελτίωση που επιτυγχάνεται στα πρώτα στάδια του πειράµατος (µέχρι διανύσµατα εκπαίδευσης, που αντιστοιχούν στο 52.08% των συνολικών διανυσµάτων εκπαίδευσης των υπολοίπων πειραµάτων), όταν επιλέγεται ένα µόνο χρησιµότερο παράδειγµα ανά επανάληψη. <ρία, 7, 0, 0, 0, 0, 0, unknown, της, f-5s, ), ), Η, Η, unknown> <λών, 5, 0, 0, 0, 0, 0, unknown, της, f-5s, κρατών, των, -, -, unknown> <τια, 5, 0, 0, 0, 0, 0, unknown, της, f-5s, ότι, ότι, τα, τα, unknown> <τος, 11, 0, 0, 0, 0, 0, unknown, της, f-5s, του, του, λου, όλου, unknown> <ρες, 5, 0, 0, 0, 0, 0, unknown, της, f-5s, στις, τις, ρες, περισσότερες, unknown> <εια, 6, 0, 0, 0, 0, 0, unknown, της, f-5s, τα, τα, ικά, στεγαστικά, unknown> <ώτα, 4, 0, 0, 0, 0, 0, unknown, της, f-5s, µονοπωλεί, λεί, τα, τα, unknown> <ένα, 7, 0, 0, 0, 0, 0, unknown, της, f-5s, τα, τα, ικά, θεατρικά, unknown> <νία, 6, 0, 0, 0, 0, 0, unknown, της, f-5s, χαρακτηρίζει, ζει, η, η, unknown> <», 1, 0, 0, 0, 0, 0, unknown, της, f-5s, «, «, νες, σειρήνες, unknown> Σχήµα 4.10 Τα δέκα χρησιµότερα διανύσµατα της πρώτης επανάληψης. 21

23 Επεκταµένο Σύνολο, Μέτρο Επικάλυψης Ορθότητα 90% 80% 70% 60% 50% 40% 30% 20% 10% % Σώµα Εκπαίδευσης Σχήµα 4.11 Σύγκριση τριών µεθόδων επιλογής χρησιµότερων παραδειγµάτων. PL AL90en Στο σχήµα 4.10 φαίνεται πως τα πρώτα διανύσµατα είναι όντως πολύ όµοια. Οι 9 στις 15 ιδιότητές τους έχουν την ίδια τιµή. Στο σχήµα 4.11 γίνεται φανερό πως για το συγκεκριµένο σώµα κειµένων των λέξεων είναι πιο αποδοτικό να επιλεχθούν σειριακά (παθητική µάθηση) τα πρώτα παραδείγµατα εκπαίδευσης από το να επιλέγονται τα 90 χρησιµότερα, ενδεχοµένως επειδή η κάθε 90-άδα περιλαµβάνει πολλά παρόµοια παραδείγµατα. Αντιθέτως, όταν επιλέγεται ένα µόνο παράδειγµα σε κάθε επανάληψη της ενεργητικής µάθησης, η ενεργητική µάθηση επιτυγχάνει εξαρχής καλύτερα αποτελέσµατα. Επαναλαµβάνεται ότι αυτή η συµπεριφορά (πολλά παρόµοια παραδείγµατα σε κάθε 90-άδα) αναµένεται να εµφανιστεί σε πιο έντονο βαθµό εάν το σύνολο υποψήφιων παραδειγµάτων αυξηθεί σηµαντικά. Αξίζει να σηµειωθεί πως από ένα σηµείο και έπειτα δεν υπάρχει σηµαντική διαφορά µεταξύ των περιπτώσεων όπου επιλέγονται ένα ή περισσότερα παραδείγµατα ανά επανάληψη. Το µειονέκτηµα του να επιλέγεται σε κάθε επανάληψη ένα µόνο παράδειγµα εκπαίδευσης είναι ότι απαιτούνται περισσότερες επαναλήψεις για να συγκεντρωθεί ο ίδιος αριθµός παραδειγµάτων εκπαίδευσης. Υπενθυµίζεται ότι σε κάθε επανάληψη απαιτείται η επαναξιολόγηση όλων των υποψηφίων παραδειγµάτων εκπαίδευσης, κάτι που είναι εξαιρετικά χρονοβόρο όταν η δεξαµενή υποψηφίων παραδειγµάτων είναι πολύ µεγάλη. Εντούτοις, η βελτίωση στο ποσοστό ορθότητας που επιτυγχάνεται µε αυτό τον τρόπο είναι εξαιρετικά σηµαντική, ιδιαίτερα στα πρώτα στάδια. Έτσι, στο σύστηµα σε κάθε επανάληψη δίνεται η δυνατότητα επιλογής του πλήθους των χρησιµότερων παραδειγµάτων που θα επιλεγούν. Στο µέλλον θα µπορούσε να προστεθεί η δυνατότητα να απορρίπτονται κατά τη συµπλήρωση της δέσµης (batch) επιλεγέντων παραδειγµάτων κάθε επανάληψης τα διανύσµατα εκπαίδευσης που είναι πολύ παρόµοια µε διανύσµατα που έχουν ήδη περιληφθεί στην δέσµη και να αντικαθίστανται από τα αµέσως λιγότερο «χρήσιµα». AL1en

24 ΚΕΦΑΛΑΙΟ 5: ΕΠΙΛΟΓΟΣ 5.1 Ανασκόπηση Ο βασικός στόχος της παρούσας εργασίας ήταν η δηµιουργία ενός βελτιωµένου και ελεύθερα διαθέσιµου επισηµειωτή µερών του λόγου για ελληνικά κείµενα. Ο στόχος αυτός επιτεύχθηκε. ηµιουργήθηκε µια νέα υλοποίηση του αλγορίθµου k-nn, η οποία χρησιµοποιήθηκε κατόπιν ως βάση προκειµένου να επανυλοποιηθεί εξαρχής ο επισηµειωτής µερών του λόγου που είχε αναπτυχθεί σε προηγούµενες εργασίες. Η νέα υλοποίηση είναι πλήρως τεκµηριωµένη, διαθέτει εύχρηστη διεπαφή χρήστη και παρέχεται ελεύθερα. ηµιουργήθηκαν, επίσης, βελτιωµένα σώµατα κειµένων εκπαίδευσης και αξιολόγησης, τα οποία χρησιµοποιήθηκαν σε νέα πειράµατα. Μελετήθηκαν, τέλος, πιθανοί τρόποι αντιµετώπισης των προβληµάτων που είχαν παρατηρηθεί στις προηγούµενες εργασίες κατά τη χρήση ενεργητικής µάθησης και προτάθηκαν τρόποι περαιτέρω βελτίωσης του συστήµατος. 5.2 Μελλοντικές επεκτάσεις Πολύ ενδιαφέρον θα ήταν να γίνουν πειράµατα ενεργητικής µάθησης µε µία πολύ µεγάλη δεξαµενή κειµένων από την οποία θα επιλέγονταν τα παραδείγµατα της ενεργητικής µάθησης. Σε αυτό το µεγάλο σώµα κειµένων θα είχε ιδιαίτερο νόηµα να διερευνηθεί η απόδοση όταν εξαιρούνται παραδείγµατα λέξεων χαµηλής συχνότητας εµφάνισης. Επιπλέον βελτιώσεις θα εστίαζαν σε µια πιο εκλεπτυσµένη αναθεώρηση του συνόλου ετικετών, για την εξυπηρέτηση πιο εξεζητηµένων αναγκών, σε έναν εµπλουτισµό του υπάρχοντος επισηµειωµένου σώµατος εκπαίδευσης, ενδεχοµένως µε κείµενα διαφορετικού είδους από τα ειδησεογραφικά, και στην µελέτη ενός πιο αποδοτικού µέτρου επιλογής παραδειγµάτων στην ενεργητική µάθηση. Ως προς το τελευταίο, προτάθηκαν ήδη πιθανές βελτιώσεις στο τέλος του προηγούµενου κεφαλαίου. 23

25 ΠΑΡΑΡΤΗΜΑ Ι: Αναπαράσταση των ετικετών σε XML Παρακάτω προδιαγράφονται όλες οι XML ετικέτες που περιλαµβάνονται στο εκτεταµένο σύνολο. Παραδείγµατα χρήσης των ετικετών περιλαµβάνονται στο συνοδευτικό CD της εργασίας. Σηµειώνεται ότι κατά σύµβαση οι παθητικές µετοχές θεωρούνται επίθετα ή ουσιαστικά, ανάλογα µε το πώς εµφανίζονται στο κείµενο. tag ::= 'PoS="adjective"' adjectivetag 'PoS="adverb"' 'PoS="article"' articletag 'PoS="conjunction"' 'PoS="noun"' nountag 'PoS="numeral"' 'PoS="particle"' 'PoS="preposition"' 'PoS="pronoun"' pronountag 'PoS="punctuation"' 'PoS="verb"' verbtag 'PoS="other"' othertag adjectivetag ::= gendertag numbertag casetag articletag ::= 'function="def" gendertag numbertag casetag 'function="prepdef" gendertag numbertag casetag 'function="indef" gendertag 'number="sg"' casetag nountag ::= gendertag numbertag casetag pronountag ::= gendertag? numbertag casetag 'mode="inflectionless"' verbtag ::= tensetag numbertag voicetag infinitivetag participletag othertag ::= 'type="abbrev"' 'type="acronym"' 'type="foreign"' 'type="symbol"' 'type="other"' infinitivetag ::= 'type="infinitive"' voicetag participletag ::= 'type="participle"' 24

26 gendertag ::= 'gender="fem"' 'gender="masc"' 'gender="neut"' numbertag ::= 'number="sg"' 'number="pl"' casetag ::= tensetag ::= 'case="nom"' 'case="gen"' 'case="acc"' 'case="voc"' 'tense="present"' 'tense="past"' 'tense="future"' voicetag ::= 'voice="active"' 'voice="passive"' 25

27 Αναφορές [Μα05] Π. Μαλακασιώτης, Αναγνώριση µερών του λόγου σε ελληνικά κείµενα µε τεχνικές ενεργητικής µάθησης. Εργασία Mεταπτυχιακού ιπλώµατος Ειδίκευσης, Τµήµα Πληροφορικής, Οικονοµικό Πανεπιστήµιο Αθηνών, [Χρο06] Ι. Χρονάκης, Επεκτάσεις και περαιτέρω αξιολόγηση συστήµατος αναγνώρισης µερών του λόγου για ελληνικά κείµενα. Πτυχιακή εργασία, Τµήµα Πληροφορικής, Οικονοµικό Πανεπιστήµιο Αθηνών, [Mit97] T. Mitchell, Machine Learning, Mc-Graw Hill, [Ko07] S. Kotsiantis, «Supervised machine learning: a review of classification techniques». Informatica, 31: , [Be91] B.V. Dasarathy, Nearest Neighbor (NN) Norms: NN Pattern Classification Techniques. IEEE Computer Society Press, pages , Los Alamitos, [Du76] S. A. Dudani The distance-weighted k-nearest neighbour rule. IEEE Transactions on System, Man, and Cybernetics, volume SMC-6, σελ , [Λου05] Γ. Λουκαρέλλι, Αναγνώριση και κατάταξη ονοµάτων οντοτήτων σε ελληνικά κείµενα. Εργασία Μεταπτυχιακού ιπλώµατος Ειδίκευσης, Τµήµα Πληροφορικής, Οικονοµικό Πανεπιστήµιο Αθηνών, [DaZa03] W. Daelemans, J. Zarvel, K. Van Der Sloot, A. Van Den Bosch. MBT: Memory-Based Tagger, version 2.0, Reference Guide,

Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα

Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Ιωάννης Χρονάκης ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος Τµήµα Πληροφορικής Οικονοµικό

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Αναγνώριση και Κατάταξη Ονοµάτων Προσώπων, Οργανισµών και Τοποθεσιών σε Ελληνικά Κείµενα µε Χρήση Μηχανών ιανυσµάτων Υποστήριξης» Ιωάννης

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 16 ης διάλεξης

Ασκήσεις μελέτης της 16 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 16 ης διάλεξης 16.1. (α) Έστω ένα αντικείμενο προς κατάταξη το οποίο

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 19 ης διάλεξης

Ασκήσεις μελέτης της 19 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 19 ης διάλεξης 19.1. Δείξτε ότι το Perceptron με (α) συνάρτηση ενεργοποίησης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης «Αναγνώριση μερών του λόγου σε ελληνικά κείμενα με τεχνικές

Διαβάστε περισσότερα

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί) Εισαγωγή στον Προγραµµατισµό Αριθµητική Ανάλυση (ή Επιστηµονικοί Υπολογισµοί) ιδάσκοντες: Καθηγητής Ν. Μισυρλής, Επίκ. Καθηγητής Φ.Τζαφέρης ΕΚΠΑ 8 εκεµβρίου 2014 Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Αριθµητική Ανάλυση 1 εκεµβρίου / 43 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 1 / 43 Κεφ.5. Αριθµητικός Υπολογισµός Ιδιοτιµών και Ιδιοδιανυσµάτων ίνεται ένας πίνακας A C n n και Ϲητούνται να προσδιορισθούν οι

Διαβάστε περισσότερα

Περίληψη ιπλωµατικής Εργασίας

Περίληψη ιπλωµατικής Εργασίας Περίληψη ιπλωµατικής Εργασίας Θέµα: Εναλλακτικές Τεχνικές Εντοπισµού Θέσης Όνοµα: Κατερίνα Σπόντου Επιβλέπων: Ιωάννης Βασιλείου Συν-επιβλέπων: Σπύρος Αθανασίου 1. Αντικείµενο της διπλωµατικής Ο εντοπισµός

Διαβάστε περισσότερα

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης»

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ θέμα: «Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» Βασιλάκος Ξενοφών Επιβλέπων

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 5. Απλή Ταξινόμηση 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 11/11/2016 Εισαγωγή Η

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Οικονομικό Πανεπιστήμιο Αθηνών. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης. Άρης Κοσμόπουλος

Οικονομικό Πανεπιστήμιο Αθηνών. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης. Άρης Κοσμόπουλος Οικονομικό Πανεπιστήμιο Αθηνών Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης Άρης Κοσμόπουλος Πρόβλημα ανεπιθύμητων μηνυμάτων Περισσότερα από το 60% των ηλεκτρονικών μηνυμάτων είναι ανεπιθύμητα

Διαβάστε περισσότερα

Μηχανική Μάθηση: γιατί;

Μηχανική Μάθηση: γιατί; Μηχανική Μάθηση Μηχανική Μάθηση: γιατί; Απαραίτητη για να μπορεί ο πράκτορας να ανταπεξέρχεται σε άγνωστα περιβάλλοντα Δεν είναι δυνατόν ο σχεδιαστής να προβλέψει όλα τα ενδεχόμενα περιβάλλοντα. Χρήσιμη

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική Σχολή Θετικών Επιστημών Πανεπιστήμιο Θεσσαλίας ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Κατηγοριοποίηση Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Κατηγοριοποιητής K πλησιέστερων

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

o AND o IF o SUMPRODUCT

o AND o IF o SUMPRODUCT Πληροφοριακά Εργαστήριο Management 1 Information Συστήματα Systems Διοίκησης ΤΕΙ Τμήμα Ελεγκτικής Ηπείρου Χρηματοοικονομικής (Παράρτημα Πρέβεζας) και Αντικείµενο: Μοντελοποίηση προβλήµατος Θέµατα που καλύπτονται:

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

Επίλυση Γραµµικών Συστηµάτων

Επίλυση Γραµµικών Συστηµάτων Κεφάλαιο 3 Επίλυση Γραµµικών Συστηµάτων 31 Εισαγωγή Αριθµητική λύση γενικών γραµµικών συστηµάτων n n A n n x n 1 b n 1, όπου a 11 a 12 a 1n a 21 a 22 a 2n A [a i j, x a n1 a n2 a nn x n, b b 1 b 2 b n

Διαβάστε περισσότερα

Περιεχόµενα...1 1. Εισαγωγή...3. 2. Μηχανική Μάθηση...7. 3. Προηγούµενες πειραµατικές προσπάθειες...15

Περιεχόµενα...1 1. Εισαγωγή...3. 2. Μηχανική Μάθηση...7. 3. Προηγούµενες πειραµατικές προσπάθειες...15 Περιεχόµενα Περιεχόµενα Περιεχόµενα...1 1. Εισαγωγή...3 1.1 Αντικείµενο της εργασίας... 3 1.2 Κυριότερα αποτελέσµατα της εργασίας... 4 1.3 ιάρθρωση της εργασίας... 5 1.4 Ευχαριστίες... 5 2. Μηχανική Μάθηση...7

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 26 Ιανουαρίου 2004 ιάρκεια: 2 ώρες (9:00-:00) Στην παρακάτω

Διαβάστε περισσότερα

Έκδοσης 2005 Π. Κεντερλής

Έκδοσης 2005 Π. Κεντερλής Σύστημα «Ηλέκτρα» Το Σύστημα «Ηλέκτρα» αποτελεί μια ολοκληρωμένη διαδικτυακή εφαρμογή διαχείρισης πληροφοριών μαθημάτων και χρηστών. Αναπτύχθηκε εξολοκλήρου από τον εργαστηριακό συνεργάτη Παναγιώτη Κεντερλή

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 4η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται κυρίως στα βιβλία Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΕΠΛ 035 - ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΓΙΑ ΗΛΕΚΤΡΟΛΟΓΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΚΑΙ ΜΗΧΑΝΙΚΟΥΣ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδηµαϊκό έτος 2017-2018 Υπεύθυνος εργαστηρίου: Γεώργιος

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

(1) 98! 25! = 4 100! 23! = 4

(1) 98! 25! = 4 100! 23! = 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2015 ιδάσκων : Π. Τσακαλίδης Φροντιστήριο 5 Συνδυαστική Ανάλυση ΙΙ και Εισαγωγή στις ιακριτές Τυχαίες Μεταβλητές

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Γράψτε ένα πρόγραμμα που θα προσομοιώνει τη ρίψη ενός νομίσματος και θα εμφανίζει στην οθόνη Κορώνα» ή «Γράμματα».

Γράψτε ένα πρόγραμμα που θα προσομοιώνει τη ρίψη ενός νομίσματος και θα εμφανίζει στην οθόνη Κορώνα» ή «Γράμματα». Εισαγωγικές Δραστηριότητες Δραστηριότητα 1 (Υ) Υπολογίστε την τιμή των παρακάτω αριθμητικών εκφράσεων. Στη συνέχεια επαληθεύστε τα αποτελέσματα που βρήκατε στην κονσόλα της Python. A. 2 + 3 ** 3 * 2 B.

Διαβάστε περισσότερα

ΦΥΣ 145 Μαθηµατικές Μέθοδοι στη Φυσική. 5 Μαίου 2012

ΦΥΣ 145 Μαθηµατικές Μέθοδοι στη Φυσική. 5 Μαίου 2012 ΦΥΣ 145 Μαθηµατικές Μέθοδοι στη Φυσική 5 Μαίου 2012 Συµπληρώστε τα στοιχεία σας στο παρακάτω πίνακα τώρα Ονοµατεπώνυµο Αρ. Ταυτότητας Username Password Δηµιουργήστε ένα φάκελο στο home directory σας µε

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις Κεφάλαιο M4 Κίνηση σε δύο διαστάσεις Κινηµατική σε δύο διαστάσεις Θα περιγράψουµε τη διανυσµατική φύση της θέσης, της ταχύτητας, και της επιτάχυνσης µε περισσότερες λεπτοµέρειες. Θα µελετήσουµε την κίνηση

Διαβάστε περισσότερα

Εφαρµογή στην αξιολόγηση επενδύσεων

Εφαρµογή στην αξιολόγηση επενδύσεων Εφαρµογή στην αξιολόγηση επενδύσεων Τα απλούστερα κριτήρια PV IRR Επένδυση: είναι µια χρηµατοροή σε περιοδικά σηµεία του χρόνου t,,,,ν, που εµφανίζονται ποσά Χ,Χ,,Χ Ν, που είναι µη αρνητικά Χ,,, Ν, κατά

Διαβάστε περισσότερα

Μάθηµα Θεωρίας Αριθµών Ε.Μ.Ε

Μάθηµα Θεωρίας Αριθµών Ε.Μ.Ε Μάθηµα Θεωρίας Αριθµών Ε.Μ.Ε 1. Να αποδειχθεί ότι κάθε ϑετικός ακέραιος αριθµός n 6, µπορεί να γραφεί στη µορφή όπου οι a, b, c είναι ϑετικοί ακέραιοι. n = a + b c,. Να αποδειχθεί ότι για κάθε ακέραιο

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Σεπτεµβρίου 2005 5:00-8:00 Σχεδιάστε έναν αισθητήρα ercetro

Διαβάστε περισσότερα

Καµπύλες στον R. σ τελικό σηµείο της σ. Το σ. σ =. Η σ λέγεται διαφορίσιµη ( αντιστοίχως

Καµπύλες στον R. σ τελικό σηµείο της σ. Το σ. σ =. Η σ λέγεται διαφορίσιµη ( αντιστοίχως Καµπύλες στον R 9. Ορισµός Μια καµπύλη στον R είναι µια συνεχής συνάρτηση σ : Ι R R όπου Ι διάστηµα ( συνήθως κλειστό και φραγµένο ) στον R. Συνήθως φανταζόµαστε την µεταβλητή t Ι ως τον χρόνο και την

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ Ενότητα 6β: Ταξινόμηση με εισαγωγή και επιλογή Μαρία Σατρατζέμη Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creatve

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Τεχνικές κατασκευής δένδρων επιθεµάτων πολύ µεγάλου µεγέθους και χρήσης

Διαβάστε περισσότερα

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ] Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών ΗΥ-317: Εφαρµοσµένες Στοχαστικές ιαδικασίες-εαρινό Εξάµηνο 2016 ιδάσκων : Π. Τσακαλίδης Συνδιασπορά - Συσχέτιση Τυχαίων Μεταβλητών Επιµέλεια : Κωνσταντίνα

Διαβάστε περισσότερα

Γ. Κορίλη Αλγόριθµοι ροµολόγησης

Γ. Κορίλη Αλγόριθµοι ροµολόγησης - Γ. Κορίλη Αλγόριθµοι ροµολόγησης http://www.seas.upenn.edu/~tcom50/lectures/lecture.pdf ροµολόγηση σε ίκτυα εδοµένων Αναπαράσταση ικτύου µε Γράφο Μη Κατευθυνόµενοι Γράφοι Εκτεταµένα έντρα Κατευθυνόµενοι

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage),

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 8 Ο. Ταξινόμηση και Αναζήτηση Συναρτήσεις χειρισμού οθόνης ΣΙΝΑΤΚΑΣ Ι. ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 8 Ο. Ταξινόμηση και Αναζήτηση Συναρτήσεις χειρισμού οθόνης ΣΙΝΑΤΚΑΣ Ι. ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 8 Ο Ταξινόμηση και Αναζήτηση Συναρτήσεις χειρισμού οθόνης ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ 2010-11 1 Εισαγωγή Η τακτοποίηση των δεδομένων με ιδιαίτερη σειρά είναι πολύ σημαντική λειτουργία που ονομάζεται

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

Α. Ερωτήσεις Ανάπτυξης

Α. Ερωτήσεις Ανάπτυξης οµηµένος Προγραµµατισµός-Κεφάλαιο 7 Σελίδα 1 α ό 10 ΕΝΟΤΗΤΑ ΙΙΙ (ΠΡΟΓΡΑΜΜΑΤΑ) ΚΕΦΑΛΑΙΟ 7: Είδη, Τεχνικές και Περιβάλλοντα Προγραµµατισµού Α. Ερωτήσεις Ανάπτυξης 1. Τι ονοµάζουµε γλώσσα προγραµµατισµού;

Διαβάστε περισσότερα

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2015-16 Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι

Διαβάστε περισσότερα

Αλγόριθμος Ομαδοποίησης

Αλγόριθμος Ομαδοποίησης Αλγόριθμος Ομαδοποίησης Εμπειρίες από τη μελέτη αναλλοίωτων χαρακτηριστικών και ταξινομητών για συστήματα OCR Μορφονιός Κωνσταντίνος Αθήνα, Ιανουάριος 2002 Γενικά Ένα σύστημα OCR χρησιμοποιείται για την

Διαβάστε περισσότερα

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ Μεταγλωττιστές Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

Ταξινόμηση. 1. Ταξινόμηση με Εισαγωγή 2. Ταξινόμηση με Επιλογή. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη

Ταξινόμηση. 1. Ταξινόμηση με Εισαγωγή 2. Ταξινόμηση με Επιλογή. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη Ταξινόμηση. Ταξινόμηση με Εισαγωγή. Ταξινόμηση με Επιλογή Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη Ταξινόμηση Η ταξινόμηση sortg τοποθετεί ένα σύνολο κόμβων ή εγγραφών σε μία συγκεκριμένη διάταξη

Διαβάστε περισσότερα

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών ΗΥ-6 Συστήµατα Ανάκτησης Πληροφοριών 7-8 Εαρινό Εξάµηνο Άσκηση Λύσεις ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Θεωρείστε µια

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΟΜΑ Α ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Στην εικόνα παρακάτω φαίνεται ένα νευρωνικό

Διαβάστε περισσότερα

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

ιαφορική εντροπία Σεραφείµ Καραµπογιάς ιαφορική εντροπία Σεραφείµ Καραµπογιάς Για πηγές διακριτού χρόνου µε συνεχές αλφάβητο, των οποίων οι έξοδοι είναι πραγµατικοί αριθµοί, ορίζεται µια άλλη ποσότητα που µοιάζει µε την εντροπία και καλείται

Διαβάστε περισσότερα

Ενότητα 3 Επιτηρούµενος διαχωρισµός

Ενότητα 3 Επιτηρούµενος διαχωρισµός Ενότητα 3 Επιτηρούµενος διαχωρισµός Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Οι διαλέξεις χρησιµοποιούν το βιβλίο Data Science for Business των Foster Provost

Διαβάστε περισσότερα

Θέματα Συστημάτων Πολυμέσων

Θέματα Συστημάτων Πολυμέσων Θέματα Συστημάτων Πολυμέσων Ενότητα # 6: Στοιχεία Θεωρίας Πληροφορίας Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,

Διαβάστε περισσότερα

οµή δικτύου ΣΧΗΜΑ 8.1

οµή δικτύου ΣΧΗΜΑ 8.1 8. ίκτυα Kohonen Το µοντέλο αυτό των δικτύων προτάθηκε το 1984 από τον Kοhonen, και αφορά διαδικασία εκµάθησης χωρίς επίβλεψη, δηλαδή δεν δίδεται καµία εξωτερική επέµβαση σχετικά µε τους στόχους που πρέπει

Διαβάστε περισσότερα

Αριθµητική Ολοκλήρωση

Αριθµητική Ολοκλήρωση Κεφάλαιο 5 Αριθµητική Ολοκλήρωση 5. Εισαγωγή Για τη συντριπτική πλειοψηφία των συναρτήσεων f (x) δεν υπάρχουν ή είναι πολύ δύσχρηστοι οι τύποι της αντιπαραγώγου της f (x), δηλαδή της F(x) η οποία ικανοποιεί

Διαβάστε περισσότερα

Η παρούσα αξία της επένδυσης αν αυτή υλοποιηθεί άµεσα είναι 0 K 0 1 K

Η παρούσα αξία της επένδυσης αν αυτή υλοποιηθεί άµεσα είναι 0 K 0 1 K 6. Αβεβαιότητα και µη Αναστρέψιµες Επενδύσεις Στην περίπτωση που µία επένδυση δεν µπορεί να αντιστραφεί χωρίς κόστος, δηλαδή αφού έχει πραγµατοποιηθεί η αγορά κεφαλαιακού εξοπλισµού, κατασκευή κτηρίων

Διαβάστε περισσότερα

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2015-16 Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι

Διαβάστε περισσότερα

Εισαγωγή στην επιστήµη των υπολογιστών ΑΡΙΘΜΗΤΙΚΑ ΣΥΣΤΗΜΑΤΑ

Εισαγωγή στην επιστήµη των υπολογιστών ΑΡΙΘΜΗΤΙΚΑ ΣΥΣΤΗΜΑΤΑ Εισαγωγή στην επιστήµη των υπολογιστών ΑΡΙΘΜΗΤΙΚΑ ΣΥΣΤΗΜΑΤΑ 1 Αριθµητικό Σύστηµα! Ορίζει τον τρόπο αναπαράστασης ενός αριθµού µε διακεκριµένα σύµβολα! Ένας αριθµός αναπαρίσταται διαφορετικά σε κάθε σύστηµα,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Οκτωβρίου 23 ιάρκεια: 2 ώρες Έστω το παρακάτω γραµµικώς

Διαβάστε περισσότερα

Συγκοινωνιακός Σχεδιασµός κόµβος Σχήµα.. Αναπαράσταση σε χάρτη του οδικού δικτύου µιας περιοχής... Μέθοδοι καταµερισµού των µετακινήσεων.. Εύρεση βέλτ

Συγκοινωνιακός Σχεδιασµός κόµβος Σχήµα.. Αναπαράσταση σε χάρτη του οδικού δικτύου µιας περιοχής... Μέθοδοι καταµερισµού των µετακινήσεων.. Εύρεση βέλτ Καταµερισµός των µετακινήσεων στο οδικό δίκτυο.. Εισαγωγή Το τέταρτο και τελευταίο στάδιο στη διαδικασία του αστικού συγκοινωνιακού σχεδιασµού είναι ο καταµερισµός των µετακινήσεων στο οδικό δίκτυο (λεωφόρους,

Διαβάστε περισσότερα

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ Αθανάσιος Γαγάτσης Τµήµα Επιστηµών της Αγωγής Πανεπιστήµιο Κύπρου Χρήστος Παντσίδης Παναγιώτης Σπύρου Πανεπιστήµιο

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Τρεις αλγόριθμοι μηχανικής μάθησης ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2018 Μηχανική μάθηση αναγνώριση προτύπων Η αναγνώριση προτύπων

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος ΑΛΓΟΡΙΘΜΟΙ Στο σηµείωµα αυτό αρχικά εξηγείται η έννοια αλγόριθµος και παραθέτονται τα σπουδαιότερα κριτήρια που πρέπει να πληρεί κάθε αλγόριθµος. Στη συνέχεια, η σπουδαιότητα των αλγορίθµων συνδυάζεται

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 7 Ιανουαρίου 2005 ιάρκεια εξέτασης: 5:00-8:00 Έστω ότι

Διαβάστε περισσότερα

Τεχνικές Προβλέψεων. 3η Ενότητα

Τεχνικές Προβλέψεων. 3η Ενότητα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα http://www.fsu.gr - lesson@fsu.gr

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #08 Συµπίεση Κειµένων Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης

Διαβάστε περισσότερα

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS) Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS) ρ. ΧΑΛΚΙΑΣ ΧΡΙΣΤΟΣ xalkias@hua.gr Χ. Χαλκιάς - Εισαγωγή στα GIS 1 Ορισµοί ΓΠΣ Ένα γεωγραφικό πληροφοριακό σύστηµα Geographic Information

Διαβάστε περισσότερα

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων Εισαγωγή στην επιστήμη των υπολογιστών Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων 1 2.1 Τύποι Δεδομένων Τα δεδομένα σήμερα συναντώνται σε διάφορες μορφές, στις οποίες περιλαμβάνονται αριθμοί,

Διαβάστε περισσότερα

ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ, ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΔΙΚΤΥΩΝ, ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ

ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ, ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΔΙΚΤΥΩΝ, ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ, ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΔΙΚΤΥΩΝ, ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ I, ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2011-2012 ΕΡΓΑΣΙΑ ΕΞΑΜΗΝΟΥ Ποιος πρέπει να ολοκληρώσει αυτή την εργασία? Φοιτητές έτους >=2 που

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο ΓΕΝΙΚΑ ΠΕΡΙ ΑΝΙΣΩΣΕΩΝ Έστω f σύνολο Α, g Α ΒΑΘΜΟΥ είναι δύο παραστάσεις μιας μεταβλητής πού παίρνει τιμές στο Ανίσωση με έναν άγνωστο λέγεται κάθε σχέση της μορφής f f g g ή, η οποία αληθεύει για ορισμένες

Διαβάστε περισσότερα

Heapsort Using Multiple Heaps

Heapsort Using Multiple Heaps sort sort Using Multiple s. Λεβεντέας Χ. Ζαρολιάγκης Τµήµα Μηχανικών Η/Υ & Πληροφορικής 29 Αυγούστου 2008 sort 1 Ορισµός ify Build- 2 sort Πως δουλεύει Ιδιότητες 3 4 Προβλήµατα Προτάσεις Ανάλυση Κόστους

Διαβάστε περισσότερα

ΣΕΤ ΑΣΚΗΣΕΩΝ 4. Προθεσµία: 8/1/12, 22:00

ΣΕΤ ΑΣΚΗΣΕΩΝ 4. Προθεσµία: 8/1/12, 22:00 ΣΕΤ ΑΣΚΗΣΕΩΝ 4 ΕΡΓΑΣΤΗΡΙΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ I, ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2011-2012 Προθεσµία: 8/1/12, 22:00 Περιεχόµενα Διαβάστε πριν ξεκινήσετε Εκφώνηση άσκησης Οδηγίες αποστολής άσκησης Πριν ξεκινήσετε (ΔΙΑΒΑΣΤΕ

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Επιλογή και επανάληψη. Λογική έκφραση ή συνθήκη

Επιλογή και επανάληψη. Λογική έκφραση ή συνθήκη Επιλογή και επανάληψη Η ύλη που αναπτύσσεται σε αυτό το κεφάλαιο είναι συναφής µε την ύλη που αναπτύσσεται στο 2 ο κεφάλαιο. Όπου υπάρχουν διαφορές αναφέρονται ρητά. Προσέξτε ιδιαίτερα, πάντως, ότι στο

Διαβάστε περισσότερα

1η Οµάδα Ασκήσεων. ΑΣΚΗΣΗ 1 (Θεωρία)

1η Οµάδα Ασκήσεων. ΑΣΚΗΣΗ 1 (Θεωρία) ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ KAI THΛΕΠΙΚΟΙΝΩΝΙΩΝ ΤΟΜΕΑΣ ΘΕΩΡΗΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ /5/007 η Οµάδα Ασκήσεων ΑΣΚΗΣΗ (Θεωρία). α) Έστω fl() x η παράσταση

Διαβάστε περισσότερα

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου; 5.1 Επίδοση αλγορίθμων Μέχρι τώρα έχουμε γνωρίσει διάφορους αλγόριθμους (αναζήτησης, ταξινόμησης, κ.α.). Στο σημείο αυτό θα παρουσιάσουμε ένα τρόπο εκτίμησης της επίδοσης (performance) η της αποδοτικότητας

Διαβάστε περισσότερα

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ). Δισδιάστατη ανάλυση Πίνακες διπλής εισόδου Σε πολλές περιπτώσεις μελετάμε περισσότερες από μία μεταβλητές ταυτόχρονα. Π.χ. μία έρευνα που έγινε σε ένα δείγμα 58 ατόμων περιείχε τις ερωτήσεις «ποια είναι

Διαβάστε περισσότερα

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1 Θεωρία πληροφοριών Εισαγωγή Αµοιβαία πληροφορία Εσωτερική πληροφορία Υπό συνθήκη πληροφορία Παραδείγµατα πληροφορίας Μέση πληροφορία και εντροπία Παραδείγµατα εντροπίας Εφαρµογές Τεχνολογία Πολυµέσων 07-

Διαβάστε περισσότερα

Σύνθετες Ασκήσεις για ιάδοση, ιασπορά και Αντιστάθµισή της

Σύνθετες Ασκήσεις για ιάδοση, ιασπορά και Αντιστάθµισή της ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΙΚΤΥΑ ΟΠΤΙΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ Καθηγητής. Συβρίδης Σύνθετες Ασκήσεις για ιάδοση, ιασπορά και Αντιστάθµισή

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων Περιεχόμενα Διακριτές Πηγές Πληροφορίας χωρίς μνήμη Ποσότητα πληροφορίας της πηγής Κωδικοποίηση

Διαβάστε περισσότερα

Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και2015 Ιδιοδιανυσµάτων 1 / 50

Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και2015 Ιδιοδιανυσµάτων 1 / 50 Αριθµητική Γραµµική Αλγεβρα Κεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών και Ιδιοδιανυσµάτων ΕΚΠΑ 2 Απριλίου 205 Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και205

Διαβάστε περισσότερα

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας 1. Εισαγωγή Σχολιασµός των εργασιών της 16 ης παράλληλης συνεδρίας µε θέµα «Σχεδίαση Περιβαλλόντων για ιδασκαλία Προγραµµατισµού» που πραγµατοποιήθηκε στο πλαίσιο του 4 ου Πανελλήνιου Συνεδρίου «ιδακτική

Διαβάστε περισσότερα

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων Θεωρία Αποφάσεων ο Φροντιστήριο Λύσεις των Ασκήσεων Άσκηση Έστω ένα πρόβλημα ταξινόμησης μιας διάστασης με δύο κατηγορίες, όπου για κάθε κατηγορία έχουν συλλεχθεί τα παρακάτω δεδομένα: D = {, 2,,,,7 }

Διαβάστε περισσότερα

Α. Ερωτήσεις Σωστού - Λάθους

Α. Ερωτήσεις Σωστού - Λάθους 2 Ο ΓΕΛ ΣΥΚΕΩΝ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ Α ΛΥΚΕΙΟΥ ΚΑΘΗΓΗΤΗΣ : ΤΡΑΣΑΝΙΔΗΣ ΓΕΩΡΓΙΟΣ διπλ. Ηλ/γος Μηχ/κός ΠΕ 12 ΘΕΜΑΤΙΚΟ ΑΝΤΙΚΕΙΜΕΝΟ ΠΡΟΣ ΑΞΙΟΛΟΓΗΣΗ : ΜΕΤΑΒΛΗΤΕΣ ΣΧΕΣΗ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ-ΕΠΙΣΤΗΜΟΝΙΚΗ ΜΕΘΟΔΟΣ- ΕΙΔΗ

Διαβάστε περισσότερα