Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα"

Transcript

1 Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Ιωάννης Χρονάκης ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος Τµήµα Πληροφορικής Οικονοµικό Πανεπιστήµιο Αθηνών Σεπτέµβριος

2 ΠΕΡΙΛΗΨΗ Η παρούσα πτυχιακή εργασία επεκτείνει µία προηγούµενη µελέτη του προβλήµατος της αναγνώρισης των µερών του λόγου (part-of-speech tagging) ελληνικών κειµένων. Πρόκειται για το πρόβληµα της κατάταξης των λέξεων ενός κειµένου ανάλογα µε το µέρος του λόγου στο οποίο ανήκουν (ουσιαστικό, ρήµα, κλπ.). Στη γενικότερη µορφή του προβλήµατος, η κατάταξη γίνεται ανάλογα και µε κλιτικά χαρακτηριστικά των λέξεων, όπως γένος, πτώση, χρόνος κλπ. (π.χ. αρσενικό ουσιαστικό στην ονοµαστική ενικού). Η προηγούµενη µελέτη είχε αναπτύξει ένα σύστηµα αναγνώρισης µερών του λόγου για ελληνικά κείµενα, το οποίο χρησιµοποιούσε τεχνικές ενεργητικής µάθησης. Στη διάρκεια της παρούσας εργασίας βελτιώθηκε το προϋπάρχον λογισµικό, επαναλήφθηκαν τα πειράµατα της προηγούµενης µελέτης µε το νέο λογισµικό, ενώ διεξήχθησαν και επιπλέον πειράµατα µε νέες συλλογές κειµένων. 2

3 ΠΕΡΙΕΧΟΜΕΝΑ Περίληψη 2 1. Εισαγωγή 1.1 Αντικείµενο της Εργασίας ιάρθρωση της Εργασίας Ευχαριστίες 6 2. Θεωρητικό Υπόβαθρο 2.1 Αναγνώριση Μερών του Λόγου Μηχανική Μάθηση Αλγόριθµος k Κοντινότερων Γειτόνων Ιδιότητες Λεκτικών Μονάδων Κατηγορίες Λεκτικών Μονάδων Ενεργητική Μάθηση Το Σύστηµα της Εργασίας 3.1 Βιβλιοθήκη Εργαλείο Επισηµείωσης Κατηγοριών Εργαλείο ηµιουργίας Σωµάτων Εκπαίδευσης µε Ενεργητική Μάθηση Πειράµατα 4.1 Σώµα µη Επισηµειωµένων Κειµένων Κατασκευή Συνόλων εδοµένων Εκπαίδευσης Κατασκευή Συνόλου εδοµένων Αξιολόγησης Πειραµατικά Αποτελέσµατα Ανασκόπηση 5.1 Συµπεράσµατα Μελλοντικές Επεκτάσεις 35 Α. Αναπαράσταση των Ετικετών σε XML 36 3

4 1.1 Αντικείµενο της Εργασίας ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ Με τον όρο "αναγνώριση µερών του λόγου" (part of speech tagging) εννοούµε τη διαδικασία αντιστοίχισης µοναδικής ετικέτας (tag) σε κάθε λέξη ενός συνόλου κειµένων, ώστε η ετικέτα να παριστάνει το µέρος του λόγου στο οποίο ανήκει η λέξη αυτή. Στη γενικότερη µορφή του προβλήµατος, η ετικέτα µπορεί να παριστάνει και επιπλέον κλιτικές πληροφορίες, όπως το γένος, τον αριθµό, την πτώση, το πρόσωπο ή το χρόνο της λέξης. Η αναγνώριση µερών του λόγου αποτελεί µέρος του ευρύτερου σταδίου της µορφολογικής ανάλυσης κειµένων και χρησιµοποιείται σε πολλά συστήµατα επεξεργασίας φυσικής γλώσσας. Είναι µία ενδιαφέρουσα περιοχή τόσο από πρακτικής όσο και από ερευνητικής πλευράς. Ιδιαίτερο ερευνητικό ενδιαφέρον παρουσιάζει η περίπτωση χρήσης τεχνικών µηχανικής µάθησης, ιδιαίτερα ενεργητικής µάθησης, κατά την οποία το ίδιο το σύστηµα συµµετέχει στην επιλογή των παραδειγµάτων εκπαίδευσής του. Αξίζει να σηµειωθεί ότι η πλειοψηφία των συστηµάτων αναγνώρισης µερών του λόγου χρησιµοποιούν ήδη µηχανική µάθηση, αλλά οι τεχνικές ενεργητικής µάθησης δεν έχουν ακόµα αξιοποιηθεί επαρκώς στην περιοχή αυτή. Μία µελέτη πάνω στην αξιοποίηση µεθόδων ενεργητικής µάθησης για τους σκοπούς της αναγνώρισης µερών του λόγου σε ελληνικά κείµενα πραγµατοποιήθηκε από τον Πρόδροµο Μαλακασιώτη [Μα05]. Η παρούσα εργασία αποτελεί επέκταση των µεθόδων και αποτελεσµάτων της µελέτης εκείνης. Οι εν λόγω επεκτάσεις µπορούν να χωριστούν σε δύο γενικά επίπεδα: Σε θεωρητικό και πειραµατικό επίπεδο, αναθεωρήθηκαν ελαφρά οι ετικέτες, ώστε να διευκολύνεται η κατάταξη των λέξεων σε κατηγορίες, ενώ διεξήχθησαν και επιπλέον πειράµατα µε νέες συλλογές κειµένων. Σε πρακτικό επίπεδο, αναδοµήθηκε και βελτιώθηκε τo λογισµικό που είχε παραχθεί στη διάρκεια της προηγούµενης µελέτης, προκειµένου να γίνει ταχύτερο και πιο εύχρηστο. Αξίζει να σηµειωθεί επίσης ότι οι µέθοδοι ενεργητικής µάθησης της εργασίας µπορούν να εφαρµοστούν και σε άλλα προβλήµατα επεξεργασίας φυσικής γλώσσας. Τέλος, παρ όλο που η εργασία εστιάζεται στην αναγνώριση µερών του λόγου σε ελληνικά κείµενα, όλες οι τεχνικές που προτείνονται µπορούν εύκολα να εφαρµοστούν και σε άλλες γλώσσες. 4

5 1.2 ιάρθρωση της Εργασίας Η εργασία είναι διαρθρωµένη ως εξής: Το Κεφάλαιο 2 αναφέρεται στη µηχανική µάθηση. Πιο συγκεκριµένα, περιέχει εκτεταµένη ανάλυση του αλγορίθµου k-nn, ο οποίος είναι ο αλγόριθµος µηχανικής µάθησης που χρησιµοποιήθηκε. Στο Κεφάλαιο 3 γίνεται µία συνοπτική παρουσίαση του συστήµατος από άποψη λογισµικού. Το Κεφάλαιο 4 περιγράφει τα κείµενα τα οποία χρησιµοποιήθηκαν κατά την διαδικασία των πειραµάτων, καθώς και τη µέθοδο προεπεξεργασίας την οποία αυτά υπέστησαν. Επίσης περιγράφει την πειραµατική διαδικασία και παρουσιάζει τα αποτελέσµατά της. Τέλος στο Κεφάλαιο 5 συνοψίζονται τα αποτελέσµατα της εργασίας και παρουσιάζονται θέµατα για πιθανή µελλοντική έρευνα. 5

6 1.3 Ευχαριστίες Αρχικά θα ήθελα να εκφράσω τις ευχαριστίες µου στον επιβλέποντα καθηγητή µου, κ. Ίωνα Ανδρουτσόπουλο, για τις ουσιαστικές κατευθύνσεις και πολύτιµες συµβουλές που µου έδωσε κατά τη διάρκεια της εκπόνησης της πτυχιακής µου εργασίας. Σίγουρα θα ήθελα επίσης να ευχαριστήσω τον Πρόδροµο Μαλακασιώτη για την διεξοδική διερεύνηση του παρόντος θέµατος στη διπλωµατική εργασία του, καθώς και για την καίρια καθοδήγηση που µου πρόσφερε, τόσο στον θεωρητικό όσο και στον τεχνικό άξονα. Τέλος θα ήθελα να ευχαριστήσω το Γιώργο Λουκαρέλλι για το σύστηµα διαχωρισµού περιόδων το οποίο ανέπτυξε και µου διέθεσε. 6

7 ΚΕΦΑΛΑΙΟ 2: ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ 2.1 Αναγνώριση Μερών του Λόγου Ένα σύστηµα αναγνώρισης µερών του λόγου πρέπει να έχει τη δυνατότητα, δεδοµένου ενός συνόλου κατηγοριών, να µπορεί να κατατάξει κάθε λέξη ενός κειµένου στην κατηγορία στην οποία αυτή η λέξη ανήκει. Στην απλούστερη περίπτωση, ο αριθµός και το είδος των κατηγοριών αντιστοιχούν στη γενική κατηγοριοποίηση των µερών του λόγου για την εκάστοτε γλώσσα (ουσιαστικά, ρήµατα, επιρρήµατα, κλπ.). Ένα περισσότερο περίπλοκο και δύσκολο πρόβληµα είναι η αναγνώριση επιπλέον πληροφοριών σχετικών µε τους τύπους των κλιτών µερών του λόγου, όπως το γένος, ο αριθµός και η πτώση στα ουσιαστικά, ο αριθµός, το πρόσωπο και ο χρόνος στα ρήµατα κ.ο.κ. Στην περίπτωση αυτή έχουµε κατηγορίες όπως «αρσενικό ουσιαστικό στην ονοµαστική ενικού», «θηλυκό ουσιαστικό στη γενική πληθυντικού», «ενεστωτικός τύπος ρήµατος στο α' πρόσωπο ενικού» κλπ., αντί για κατηγορίες που αντιστοιχούν απλά σε µέρη του λόγου, όπως «ουσιαστικό» ή «ρήµα». Οπότε σε αυτή την περίπτωση µπορεί να ειπωθεί ότι η φάση της αναγνώρισης µερών του λόγου υπεισέρχεται και σε επόµενα στάδια της µορφολογικής ανάλυσης ενός κειµένου. 7

8 2.2 Μηχανική Μάθηση Η Μηχανική Μάθηση (Machine Learning) [Mi97] αποτελεί ένα ευρύ ερευνητικό πεδίο της Τεχνητής Νοηµοσύνης. Η Μηχανική Μάθηση αφορά στην ανάπτυξη τεχνικών οι οποίες επιτρέπουν στους υπολογιστές να «διδάσκονται» βασισµένοι στην επεξεργασία συνόλων δεδοµένων για παράδειγµα να µαθαίνουν να κάνουν ιατρικές διαγνώσεις, αφού «εκπαιδευθούν» σε ιατρικές διαγνώσεις ανθρώπων-ιατρών του παρελθόντος. Στην περίπτωση της αναγνώρισης µερών του λόγου, η Μηχανική Μάθηση χρησιµοποιείται για να «εκπαιδευτεί» ο υπολογιστής να κατατάσσει κάθε λέξη στη σωστή κατηγορία. Για τους σκοπούς της εργασίας, θα µας απασχολήσει η Επιβλεπόµενη Μάθηση (Supervised Learning). Στην κατηγορία αυτή κατατάσσονται αλγόριθµοι οι οποίοι δηµιουργούν µια συνάρτηση που αντιστοιχεί κάθε µία είσοδο (π.χ. περίπτωση ασθενούς ή στην περίπτωσή µας εµφάνιση λέξεως) σε µία επιθυµητή έξοδο (π.χ. διάγνωση ή στην περίπτωσή µας κατηγορία λέξεως). Η συνάρτηση αυτή δηµιουργείται βάσει ενός σώµατος δεδοµένων εκπαίδευσης. Τα δεδοµένα αυτά αποτελούνται από ζεύγη εισόδων και αντίστοιχων επιθυµητών εξόδων. Στην περίπτωση της αναγνώρισης µερών του λόγου, τα δεδοµένα εκπαίδευσης είναι συνήθως κείµενα στα οποία έχουν σηµειωθεί χειρωνακτικά οι ορθές κατηγορίες όλων των λέξεων. Ο στόχος ενός αλγορίθµου Επιβλεπόµενης Μάθησης είναι να είναι σε θέση, µετά την εκπαίδευσή του, να αποφανθεί για την αντίστοιχη έξοδο οποιασδήποτε δυνατής εισόδου. Γι' αυτό τον σκοπό ο αλγόριθµος καλείται να χρησιµοποιήσει µεθόδους γενίκευσης πάνω στα δεδοµένα εκπαίδευσης, προκειµένου να ανακαλύψει µια συνάρτηση που να συσχετίζει κάθε δυνατή είσοδο µε την επιθυµητή έξοδο. Στη γενική περίπτωση, η διαδικασία που ακολουθείται για την επίλυση ενός προβλήµατος κατάταξης σε κατηγορίες µε τεχνικές επιβλεπόµενης µάθησης είναι η εξής: 1. Ορισµός των κατηγοριών και επιλογή των ιδιοτήτων (attributes) που χαρακτηρίζουν κάθε περίπτωση (π.χ. ηλικία, φύλο, εργαστηριακές µετρήσεις κάθε ασθενούς στην περίπτωση των ιατρικών διαγνώσεων, κατάληξη λέξης, κατηγορία προηγούµενης και προ-προηγούµενης λέξης στην περίπτωση της αναγνώρισης µερών του λόγου). Η αποτελεσµατικότητα ενός αλγορίθµου µάθησης προϋποθέτει σε µεγάλο βαθµό την επιλογή ενός όσο το δυνατόν πιο πλήρους συνόλου ιδιοτήτων, οι οποίες να παρέχουν χρήσιµες πληροφορίες για το συγκεκριµένο πρόβληµα. 2. Συλλογή του συνόλου παραδειγµάτων εκπαίδευσης. Το σύνολο εκπαίδευσης πρέπει να αποτελεί αντιπροσωπευτικό δείγµα του συνόλου των περιπτώσεων εισόδου που είναι δυνατόν να εµφανιστούν. Κάθε παράδειγµα εισόδου στο σύνολο εκπαίδευσης πρέπει να έχει εκ των προτέρων αντιστοιχηθεί χειρωνακτικά στην έξοδο η οποία θα αναµενόταν ιδανικά από τον αλγόριθµο µετά την εκπαίδευσή του. 3. Εξαγωγή των τιµών των ιδιοτήτων από κάθε παράδειγµα στο σύνολο εκπαίδευσης. Οι τιµές αυτές λέγονται χαρακτηριστικά (features) του παραδείγµατος. Στο παρόν βήµα, κάθε παράδειγµα συνήθως µετατρέπεται σε ένα διάνυσµα που περιέχει τα χαρακτηριστικά της περίπτωσης (τιµές ιδιοτήτων). 8

9 4. Εκτέλεση του αλγορίθµου µάθησης στα παραδείγµατα εκπαίδευσης. Συνήθως ο αλγόριθµος επεξεργάζεται τα διανύσµατα που παριστάνουν τα χαρακτηριστικά των παραδειγµάτων εκπαίδευσης και παράγει µια συνάρτηση ταξινόµησης, η οποία αντιστοιχεί κάθε δυνατή περίπτωση (στην περίπτωσή µας κάθε µία εµφάνιση λέξεως σε ένα κείµενο) σε µια έξοδο (στην περίπτωσή µας, µία κατηγορία λέξεων). 5. Χρήση της προκύπτουσας συνάρτησης ταξινόµησης σε νέα δεδοµένα αγνώστων εξόδων (π.χ. κείµενα στα οποία δεν είναι σηµειωµένες οι κατηγορίες των λέξεων). Όπως και κατά την εκπαίδευση του αλγορίθµου, τα νέα δεδοµένα µετατρέπονται πρώτα σε διανύσµατα χαρακτηριστικών. Συχνά χρησιµοποιούµενοι αλγόριθµοι επιβλεπόµενης µάθησης είναι ο αλγόριθµος των k κοντινότερων γειτόνων, ο αφελής ταξινοµητής Bayes, ο ID3 κλπ. [Mi97]. Για τους σκοπούς της εργασίας χρησιµοποιήθηκε ο αλγόριθµος των k κοντινότερων γειτόνων (k nearest neighbours k-nn), ο οποίος περιγράφεται παρακάτω. 9

10 2.3 Αλγόριθµος k Κοντινότερων Γειτόνων Στον αλγόριθµο των k κοντινότερων γειτόνων, όπως και σε όλους τους αλγορίθµους µάθησης που χρησιµοποιούν διανυσµατικές αναπαραστάσεις των περιπτώσεων εισόδου, κάθε ιδιότητα των διανυσµάτων αντιστοιχεί σε µία διάσταση ενός πολυδιάστατου χώρου. Κατά το στάδιο της εκπαίδευσης, ο k-nn απλά αποθηκεύει τα διανύσµατα όλων των παραδειγµάτων εκπαίδευσης, µαζί µε τις ορθές εξόδους που αντιστοιχούν στο καθένα. Ουσιαστικά, δηλαδή, αποθηκεύει τα σηµεία του πολυδιάστατου χώρου που αντιστοιχούν στα παραδείγµατα εκπαίδευσης, µαζί µε τις κατηγορίες τους. Κατά την φάση ταξινόµησης, δηλαδή κατά τη χρήση του εκπαιδευµένου k-nn, το σύστηµα λαµβάνει εισόδους (περιπτώσεις) για τις οποίες δεν γνωρίζει την έξοδο και υπολογίζει για κάθε µία τη διανυσµατική της αναπαράσταση, δηλαδή το αντίστοιχο σηµείο στον πολυδιάστατο χώρο. Κατόπιν υπολογίζεται η απόσταση του σηµείου της εισόδου από κάθε σηµείο που αντιστοιχεί σε αποθηκευµένο παράδειγµα εκπαίδευσης. Αφού υπολογιστούν οι αποστάσεις αυτές, είναι εύκολο να βρεθούν τα k σηµεία (περιπτώσεις) εκπαίδευσης µε τη µικρότερη απόσταση (βάσει κάποιας µετρικής) από το σηµείο της εισόδου. Η είσοδος κατατάσσεται στη συνέχεια στην κατηγορία που είναι πιο συχνή µεταξύ των k κοντινότερων παραδειγµάτων εκπαίδευσης, όπου το k είναι συνήθως ένας περιττός φυσικός αριθµός για να αποφεύγονται οι ισοπαλίες. Προφανώς, ο αλγόριθµος απαιτεί περισσότερους υπολογισµούς κατά την κατάταξη νέων περιπτώσεων όσο αυξάνει το πλήθος των παραδειγµάτων εκπαίδευσης, αφού υπολογίζεται κάθε φορά η απόσταση της νέας περίπτωσης από όλα τα παραδείγµατα εκπαίδευσης. Έχει, επίσης, µεγάλες απαιτήσεις µνήµης, αφού πρέπει να αποθηκεύονται όλα τα παραδείγµατα εκπαίδευσης. Από την άλλη πλευρά, όµως, ο αλγόριθµος είναι εξαιρετικά απλός, είναι ταχύτατος κατά την εκπαίδευση (αφού απλά αποµνηµονεύει τα παραδείγµατα εκπαίδευσης) και µπορεί να µάθει υπερ-επιφάνειες διαχωρισµού οποιουδήποτε είδους (σε αντίθεση µε γραµµικούς διαχωριστές όπως, για παράδειγµα, το Perceptron). Όπως και στην προηγούµενη εργασία [Μα05] στην οποία βασίζεται η παρούσα, χρησιµοποιείται µια βελτιωµένη µορφή του k-nn, η οποία: (α) δίνει διαφορετική βαρύτητα σε κάθε ιδιότητα κατά των υπολογισµό των αποστάσεων, ανάλογα µε την Αναλογία Πληροφοριακού Κέρδους (Gain Ratio) κάθε ιδιότητας και (β) ζυγίζει την ψήφο κάθε ενός από τους k κοντινότερους γείτονες αντιστρόφως ανάλογα µε την απόσταση του γείτονα από την προς κατάταξη περίπτωση. Πιο συγκεκριµένα, στο σύστηµα της παρούσας εργασίας η απόσταση του προς κατάταξη διανύσµατος X r από ένα παράδειγµα εκπαίδευσης Y r δίνεται από τον τύπο: r r n ( X, Y) = wδ( x, y ) i= 1 όπου ( Y) i i έχουν n ιδιότητες το καθένα, και ( ) i X r, r είναι η απόσταση µεταξύ των δύο διανυσµάτων. Τα διανύσµατα αυτά δ x i, y i είναι η διαφορά των τιµών της i-οστής w iορίζεται η Αναλογία ιδιότητας µεταξύ των διανυσµάτων X r και Y r. Ως Πληροφοριακού Κέρδους της i-στής ιδιότητας. 1

11 Η Αναλογία Πληροφοριακού Κέρδους [Qu93] µιας ιδιότητας ορίζεται ως εξής: w i = H ( C) v V i v V i P( v) H P( v)log 2 ( C v) P( v) όπου (C) H C v η εντροπία των κατηγοριών δεδοµένου ότι η ιδιότητα i έχει την τιµή v, και P(v) η πιθανότητα η τιµή της ιδιότητας i να είναι v. Το σύνολο V i περιέχει όλες τις δυνατές τιµές της ιδιότητας i. H η εντροπία των κατηγοριών, ( ) Τέλος, η βαρύτητα της ψήφου κάθε ενός από τους k κοντινότερους γείτονες δίνεται από τον τύπο: 1 d i = c+ όπου η απόσταση του εν λόγω γείτονα, και c µία (θετική) σταθερά ώστε να αποφευχθεί η διαίρεση µε το µηδέν. Στα πειράµατα αυτής της εργασίας, το k είχε την τιµή 5. 1

12 2.4 Ιδιότητες Λεκτικών Μονάδων Προκειµένου να χρησιµοποιηθεί ο αλγόριθµος των k Κοντινότερων Γειτόνων στην αναγνώριση µερών του λόγου, είναι αναγκαίο να παρασταθεί κάθε λεκτική µονάδα των κειµένων ως ένα διάνυσµα χαρακτηριστικών (διάνυσµα τιµών ιδιοτήτων). Βάσει προηγούµενης έρευνας [Μα05], επιλέχθηκαν οι παρακάτω ιδιότητες: Η κατάληξη της λεκτικής µονάδας. Ως κατάληξη θεωρούµε τους τρεις τελευταίους χαρακτήρες της λεκτικής µονάδας, ή ολόκληρη την λεκτική µονάδα στην περίπτωση όπου αυτή έχει µήκος µικρότερο από τρεις χαρακτήρες. Το µήκος (σε χαρακτήρες) της λεκτικής µονάδας. Η ύπαρξη ή όχι αποστρόφου µέσα στη λεκτική µονάδα. Η ύπαρξη ή όχι αριθµητικού ψηφίου µέσα στη λεκτική µονάδα. Η ύπαρξη ή όχι κόµµατος µέσα στη λεκτική µονάδα. Η ύπαρξη ή όχι τελείας µέσα στη λεκτική µονάδα. Η ύπαρξη ή όχι λατινικού χαρακτήρα µέσα στη λεκτική µονάδα. Η ετικέτα αµφισηµίας (ambitag) της λεκτικής µονάδας. Η έννοια αυτή εξηγείται παρακάτω. Η κατάληξη της επόµενης λεκτικής µονάδας. Η ετικέτα αµφισηµίας της επόµενης λεκτικής µονάδας. Η λεκτική µονάδα δύο θέσεις πριν από την τρέχουσα. Η κατάληξη της λεκτικής µονάδας δύο θέσεις πριν από την τρέχουσα. Η λεκτική µονάδα µία θέση πριν από την τρέχουσα. Η κατάληξη της λεκτικής µονάδας µία θέση πριν από την τρέχουσα. Η ετικέτα αµφισηµίας της λεκτικής µονάδας µία θέση πριν από την τρέχουσα. Οπότε έχουµε συνολικά δεκαπέντε ιδιότητες. Η Αναλογία Πληροφοριακού Κέρδους κάθε ιδιότητας, και εποµένως το βάρος της κατά τον υπολογισµό της απόστασης στον αλγόριθµο των k Κοντινότερων Γειτόνων, υπολογίζεται µε δυναµικό τρόπο πάνω στο σώµα εκπαίδευσης κατά την εκτέλεση του αλγορίθµου. Ως «ετικέτα αµφισηµίας» (ambivalence tag ambitag) ορίζουµε µία συµβολοσειρά η κατασκευή της οποίας ακολουθεί τον εξής αλγόριθµο: Για κάθε λεκτική µονάδα t, εάν υπάρχουν αντίγραφα της t στο σώµα εκπαίδευσης, τότε δηµιούργησε το ambitag ενώνοντας γραµµικά τις διαφορετικές ετικέτες των αντιγράφων αυτών σε µία συµβολοσειρά ειδάλλως, εάν υπάρχουν λεκτικές µονάδες µε ίδια κατάληξη µε την t στο σώµα εκπαίδευσης, τότε δηµιούργησε το ambitag ενώνοντας γραµµικά τις διαφορετικές ετικέτες των λεκτικών αυτών µονάδων σε µία συµβολοσειρά ειδάλλως το ambitag είναι η συµβολοσειρά "unknown" 1

13 Η σύλληψη και ο ορισµός της ετικέτας αµφισηµίας έγινε από τους Daelemans κ.ά. [DaZa03] 1

14 2.5 Κατηγορίες Λεκτικών Μονάδων Οι βασικές κατηγορίες στις οποίες κατατάσσει το σύστηµα τις λεκτικές µονάδες είναι: αντωνυµία άρθρο αριθµητικό επίθετο επίρρηµα σύνδεσµος µόριο ουσιαστικό πρόθεση ρήµα σηµείο στίξης άλλο Ο χρήστης µπορεί να επιλέξει αν θα χρησιµοποιηθεί το παραπάνω σύνολο κατηγοριών (ισοδύναµα, ετικετών, tags) ή ένα εκτενέστερο, το οποίο περιλαµβάνει και τις εξής υποκατηγορίες: Για κάθε αντωνυµία, η κατηγορία (ετικέτα) δείχνει επίσης τον τύπο της αντωνυµίας, εάν δηλαδή είναι άκλιτη ή όχι. Στην περίπτωση που είναι κλιτή, δείχνει ακόµη το γένος, τον αριθµό και την πτώση της. Για κάθε άρθρο, η κατηγορία δείχνει επίσης τον τύπο του, εάν δηλαδή είναι οριστικό, αόριστο ή εµπρόθετο, καθώς και το γένος, τον αριθµό και την πτώση του. Για κάθε επίθετο και ουσιαστικό, η κατηγορία δείχνει επίσης το γένος, τον αριθµό και την πτώση του. Για κάθε ρήµα, η κατηγορία δείχνει επίσης το χρόνο και τον αριθµό του. Τα απαρέµφατα και οι ενεργητικές µετοχές κατατάσσονται ως ρήµατα. Στην περίπτωση των απαρεµφάτων, σηµειώνεται εάν το απαρέµφατο είναι ενεργητικής ή παθητικής φωνής. Οι παθητικές µετοχές δεν σηµειώνονται ως ρήµατα, αλλά ως επίθετα ή ουσιαστικά, ανάλογα µε το συντακτικό τους ρόλο. Στην κατηγορία «άλλο» συµπεριλαµβάνονται υπο-κατηγορίες που διαχωρίζουν ακρωνύµια, συντοµεύσεις, ξένες λέξεις και διάφορους χαρακτήρες οι οποίοι δεν αποτελούν σηµεία στίξης. Περισσότερες πληροφορίες για τις κατηγορίες και την αναπαράστασή τους δίνονται στο παράρτηµα. Οι ετικέτες του εκτενούς συνόλου είναι ελαφρά διαφορετικές από εκείνες της εργασίας [Μα05], προκειµένου να διευκολύνεται η κατάταξη των λεκτικών µονάδων σε κατηγορίες. Στην περίπτωση περιφραστικών τύπων, το σύστηµα επισηµειώνει (κατατάσσει) ξεχωριστά κάθε µία λέξη του τύπου. Στους ρηµατικούς τύπους του εξακολουθητικού µέλλοντα, που έχουν τη µορφή «θα» + <ενεστωτικός τύπος> (π.χ. «θα παίζω»), το «θα» σηµειώνεται ως µόριο και ο ενεστωτικός τύπος ως ρήµα στον ενεστώτα. Όπως εξηγείται στην ενότητα 3.1, είναι δυνατόν σε µια φάση µετα-επεξεργασίας να οµαδοποιούνται οι λέξεις τέτοιων περιφραστικών τύπων και να τους αποδίδεται η κατάλληλη συνολική ετικέτα. 1

15 Οµοίως, σε ρηµατικούς τύπους του αορίστου υποτακτικής, όπως «να αποκτήσω», το «αποκτήσω» κατατάσσεται ως µέλλοντας. Στην περίπτωση αυτή οι λέξεις του περιφραστικού τύπου δεν οµαδοποιούνται στο στάδιο της µετα-επεξεργασίας, επειδή οι ετικέτες του συστήµατος δεν περιέχουν πληροφορίες έγκλισης κι έτσι δεν είναι δυνατόν να σηµειωθεί ο περιφραστικός τύπος ως τύπος της υποτακτικής. 1

16 2.6 Ενεργητική Μάθηση Συνήθως είναι εύκολο να παραχθούν ή να βρεθούν µη κατηγοριοποιηµένα δεδοµένα εκπαίδευσης (στην περίπτωσή µας, κείµενα στα οποία δεν έχουν επισηµειωθεί οι κατηγορίες των λέξεων), αλλά η κατάταξή τους σε κατηγορίες θεωρείται ακριβή και επίπονη διαδικασία. Η Ενεργητική Μάθηση (Active Learning) είναι ο τοµέας της µηχανικής µάθησης ο οποίος προτείνει µεθόδους που επιτρέπουν στον αλγόριθµο εκπαίδευσης να επιλέγει ο ίδιος τα παραδείγµατα (εµφανίσεις λέξεων στην περίπτωσή µας) που πρέπει να επισηµειωθούν χειρωνακτικά και να συµπεριληφθούν στο σύνολο εκπαίδευσης. Με τον τρόπο αυτό είναι δυνατόν να επιτύχουµε το ίδιο επίπεδο ορθότητας (accuracy) µε λιγότερα δεδοµένα εκπαίδευσης, σε σχέση µε το πλήθος των δεδοµένων που θα απαιτούνταν αν τα παραδείγµατα εκπαίδευσης επιλέγονταν τυχαία (ή µε τη σειρά, στην περίπτωση των λέξεων ενός κειµένου), κάτι που µειώνει το φόρτο των ανθρώπων που επισηµειώνουν τα παραδείγµατα εκπαίδευσης. Στην περίπτωση του k- NN η µείωση των παραδειγµάτων εκπαίδευσης οδηγεί επίσης σε αύξηση της ταχύτητας κατάταξης (λιγότεροι υπολογισµοί αποστάσεων) και µείωση της απαιτούµενης µνήµης (αποθήκευση λιγότερων παραδειγµάτων). Περισσότερες πληροφορίες για την ενεργητική µάθηση παρέχονται στην εργασία [Μα05]. Στο κείµενο εκείνο προτείνεται και ένα µέτρο σηµαντικότητας, το οποίο χρησιµοποιείται για την αξιολόγηση των υποψηφίων παραδειγµάτων εκπαίδευσης και την επιλογή των «καλύτερων», που θα επισηµειωθούν στη συνέχεια χειρωνακτικά. Το µέτρο αυτό, το οποίο χρησιµοποιείται και στην παρούσα εργασία, ορίζεται ως εξής: W n H = log c n ( x) c C C, H c V c V, H n n ( x) ( x) = 0 0 Έστω x ένα τυχαίο υποψήφιο παράδειγµα εκπαίδευσης. Στόχος του µέτρου W n είναι να µπορεί το µέτρο αυτό να αντιπροσωπεύσει τη χρησιµότητα του παραδείγµατος αυτού, βάσει του ήδη υπάρχοντος συνόλου εκπαίδευσης. Υψηλότερες τιµές του µέτρου αντιστοιχούν σε µεγαλύτερη χρησιµότητα του παραδείγµατος. Ως H n ( x) ορίζεται η κανονικοποιηµένη τιµή της εντροπίας της κατηγορίας του x, δηλαδή το κατά πόσον είµαστε αβέβαιοι για την κατηγορία του x. Η ποσότητα αυτή ορίζεται σύµφωνα µε τους εξής τύπους: H n ( x) = c C P( c)log P( c) log ( C) 1

17 P ( c) = c V V s C s c Ως V ορίζεται το άθροισµα των ψήφων των γειτόνων οι οποίοι ανήκουν στην κατηγορία c, οπότε το P(c) αντιστοιχεί στο βαθµό βεβαιότητας του ταξινοµητή ότι το x ανήκει στην κατηγορία c. Το σύνολο C περιέχει όλες τις δυνατές κατηγορίες στις οποίες µπορούν να ανήκουν οι γείτονες. Χαµηλή εντροπία σηµαίνει ότι ο αλγόριθµος k-nn βασιζόµενος στο υπάρχον σύνολο εκπαίδευσης µπορεί να αποφανθεί για την κατηγορία στην οποία ανήκει το παράδειγµα µε µεγάλη βεβαιότητα. Αντίθετα, εάν το παράδειγµα έχει υψηλή εντροπία, αυτό σηµαίνει ότι ο αλγόριθµος k-nn δεν µπορεί να προτείνει κάποια κατηγορία µε βεβαιότητα, κάτι που συνήθως είναι ένδειξη ότι πρόκειται για χρήσιµο παράδειγµα. c Η ποσότητα V c C είναι ίση µε το άθροισµα των ψήφων των k γειτόνων. Λόγω της ζύγισης της ψήφου, όπως αναφέρεται στην ενότητα 2.3, µικρή τιµή του c C c V υποδηλώνει µεγάλη απόσταση των k γειτόνων από το υποψήφιο παράδειγµα x. c Οπότε µικρή τιµή του V c C υποδηλώνει ότι είναι επιθυµητό να εισαχθεί το x στα παραδείγµατα εκπαίδευσης, αφού πρόκειται για σηµείο σε περιοχή του υπερχώρου όπου δεν έχουµε κοντινά παραδείγµατα εκπαίδευσης. c Το µέτρο V c C λογαριθµίζεται προκειµένου οι τιµές που παίρνει να είναι ανάλογου H n x. µεγέθους µε αυτές που παίρνει και η εντροπία ( ) Τέλος, εάν η εντροπία παίρνει τιµή τέτοια που µηδενίζει το κλάσµα, το µέτρο c µετατρέπεται σε V, προκειµένου να αποφευχθεί η εκφυλισµένη µηδενική τιµή. c C Από τα παραδείγµατα που έχουν µηδενική εντροπία, περισσότερο χρήσιµα είναι c εκείνα µε χαµηλή τιµή V c C, όπως περιγράφηκε ανωτέρω. 1

18 ΚΕΦΑΛΑΙΟ 3: ΤΟ ΣΥΣΤΗΜΑ ΤΗΣ ΕΡΓΑΣΙΑΣ Στο κεφάλαιο αυτό θα παρουσιαστεί το σύστηµα αναγνώρισης µερών του λόγου που αναπτύχθηκε στη διάρκεια της εργασίας. Το λογισµικό του συστήµατος αποτελείται από µία βιβλιοθήκη και δύο κύρια εργαλεία, τα οποία παρουσιάζονται παρακάτω. Ενσωµατώνει επίσης το λογισµικό TiMBL [DaZa04], το οποίο παρέχει, µεταξύ άλλων, υλοποίηση της µορφής του k-nn που χρησιµοποιούµε. 3.1 Βιβλιοθήκη POSTagger.dll Η βιβλιοθήκη αυτή περιέχει τις απαραίτητες βασικές λειτουργίες και συναρτήσεις για την υλοποίηση του αλγορίθµου ενεργητικής µάθησης. Η βιβλιοθήκη ακολουθεί το αντικειµενοστρεφές µοντέλο. Ως γλώσσα υλοποίησης επιλέχθηκε η C++, καθώς οι συναρτήσεις τις οποίες περιέχει η βιβλιοθήκη απαιτούν σηµαντική υπολογιστική ισχύ, οπότε µία γλώσσα όπως η C++ θεωρήθηκε φυσική επιλογή λόγω της ταχύτητας επεξεργασίας η οποία την χαρακτηρίζει. Η βιβλιοθήκη παρέχει προγραµµατιστική διεπαφή εφαρµογής (Application Programming Interface API), προκειµένου οι λειτουργίες αυτής να µπορούν σχετικά εύκολα να χρησιµοποιηθούν και από διαφορετικές εφαρµογές µε παρόµοιους στόχους. Μάλιστα, η βιβλιοθήκη POSTagger.dll περιέχει και τις απαραίτητες συναρτήσεις διαµεσολαβητές προκειµένου το API να µπορεί να χρησιµοποιηθεί και από προγράµµατα γραµµένα στην γλώσσα Java. Πιο συγκεκριµένα, οι λειτουργίες τις οποίες υποστηρίζει η βιβλιοθήκη είναι οι εξής: Αξιολόγηση Λεκτικών Μονάδων Κειµένου κατά την Ενεργητική Μάθηση. Αναλαµβάνει να προσδιορίσει την αξία η οποία χαρακτηρίζει (ως παράδειγµα εκπαίδευσης) κάθε λεκτική µονάδα σε ένα κείµενο. Υποστηρίζονται δύο µέτρα µέσω των οποίων µπορεί να γίνει η αξιολόγηση: H n( x), H n( x) 0 c 1. W = log V n c C c V, H n( x) = 0 c C Το µέτρο αυτό έχει περιγραφεί στην ενότητα 2.6. x 2. H n ( ) Το µέτρο αυτό είναι απλούστερο από το πρώτο. 1

19 Παρέχονται ξεχωριστές συναρτήσεις για τον υπολογισµό των παραγόντων των παραπάνω µέτρων. Κατάταξη Λεκτικών Μονάδων Κειµένου. Αναλαµβάνει να κατατάξει σε κατηγορίες τις λεκτικές µονάδες ενός κειµένου βάσει ενός υπάρχοντος σώµατος εκπαίδευσης. Για τους σκοπούς της λειτουργίας αυτής, συµπεριλαµβάνεται στο σύστηµα και ένα προκαθορισµένο (default) σώµα εκπαίδευσης, το οποίο είναι δυνατόν να αλλάξει. Αξιολόγηση Συστήµατος. Χρησιµοποιώντας την παραπάνω λειτουργία, η βιβλιοθήκη είναι σε θέση να µετρήσει το ποσοστό ορθότητας (accuracy) που επιτυγχάνει το σύστηµα σε ένα σώµα ελέγχου (test corpus). Οι κατηγορίες των λεκτικών µονάδων του σώµατος ελέγχου πρέπει να έχουν επισηµειωθεί χειρωνακτικά. Χωρισµός Κειµένου σε Λεκτικές Μονάδες. Η συνάρτηση αυτή αναλαµβάνει να διαχωρίσει ένα κείµενο στις συστατικές του λεκτικές µονάδες (tokens). Η διαδικασία αυτή περιγράφεται στην ενότητα 3.2. Mετατροπή σε XML. Η λειτουργία αυτή µετατρέπει ένα (µερικώς ή ολικώς) επισηµειωµένο κείµενο σε κείµενο XML, µε τέτοιο τρόπο ώστε οι επισηµειώσεις να µετατρέπονται σε ετικέτες XML. Οι χρησιµοποιούµενες ετικέτες XML περιγράφονται στο παράρτηµα. Σε περίπτωση που ο χρήστης το επιθυµεί, η λειτουργία αυτή είναι σε θέση να πραγµατοποιήσει και ένα επίπεδο µετα-επεξεργασίας. Η µετα-επεξεργασία αυτή περιλαµβάνει προς το παρόν µόνο τα εξής: 1. Ανίχνευση µελλοντικών τύπων. Χάριν απλότητας, το σύστηµα έχει εκπαιδευθεί να κατατάσσει, για παράδειγµα, πάντα το «παίζει» ως ενεστωτικό ρηµατικό τύπο. Αν το «παίζει» συνοδεύεται από το µόριο «θα», η µετα-επεξεργασία σηµειώνει το «θα παίζει» συνολικά ως µελλοντικό τύπο. Η µετα-επεξεργασία δεν υποστηρίζει προς το παρόν συντελεσµένους χρόνους (π.χ. «θα έχει παίξει»). 2. Σηµείωση του «για να» ως ενός ενιαίου συνδέσµου. 1

20 3.2 Εργαλείο Επισηµείωσης Κατηγοριών Το εργαλείο αυτό επιτρέπει σε ένα χρήστη να σηµειώνει τις ορθές κατηγορίες των λέξεων σε ένα κείµενο, όπως φαίνεται παρακάτω, προκειµένου το κείµενο να χρησιµοποιηθεί κατά την εκπαίδευση του συστήµατος. Μέσω του εργαλείου αυτού, ο χρήστης είναι σε θέση να φορτώσει ένα ή περισσότερα αρχεία απλού κειµένου. Τα κείµενα αυτά χωρίζονται αυτόµατα σε λεκτικές µονάδες. Κατόπιν, ο χρήστης µπορεί να αρχίσει να σηµειώνει τις κατηγορίες των λεκτικών µονάδων (να τους αποδίδει ετικέτες), χρησιµοποιώντας τα αντίστοιχα µενού του εργαλείου. Το σύστηµα είναι επίσης σε θέση να αποδώσει αυτόµατα ετικέτες στις λεκτικές µονάδες του κειµένου, βάσει ενός ορισµένου από το χρήστη σώµατος εκπαίδευσης. Κατόπιν αυτού ο χρήστης µπορεί να επέµβει εκ νέου, διορθώνοντας ετικέτες όπου αυτό είναι σκόπιµο. 2

21 Ο χρήστης µπορεί να ελέγξει ο ίδιος το βαθµό πολυπλοκότητας των ετικετών τις οποίες αποδίδει. Στην απλή βαθµίδα πολυπλοκότητας, προσφέρονται µόνο οι βασικές κατηγορίες (ρήµα, ουσιαστικό, επίθετο κλπ.), ενώ στη δεύτερη βαθµίδα οι ετικέτες περιλαµβάνουν και πληροφορίες όπως γένος, αριθµό κλπ. Οι ετικέτες και των δύο βαθµίδων περιγράφονται αναλυτικότερα στην ενότητα 2.5. Τέλος, ο χρήστης µπορεί να εξαγάγει το τρέχον επισηµειωµένο κείµενο σε µορφή XML, όπως αναφέρεται στην ενότητα

22 3.3 Εργαλείο ηµιουργίας Σωµάτων Εκπαίδευσης µε Ενεργητική Μάθηση Το εργαλείο αυτό υποστηρίζει την εκπαίδευση του συστήµατος µε ενεργητική µάθηση. Βοηθά το χρήστη να κατασκευάσει ένα βαθµιαία µεγαλύτερο και πλουσιότερο σώµα εκπαίδευσης, επιλέγοντας παραδείγµατα εκπαίδευσης (εµφανίσεις λέξεων) από µια συλλογή µη επισηµειωµένων κειµένων και ζητώντας από το χρήστη να επισηµειώσει (κατατάξει) τα επιλεγόµενα παραδείγµατα. Οι περισσότερες παράµετροι µπορούν να οριστούν από τον χρήστη. Συγκεκριµένα, ο χρήστης µπορεί να ορίσει: Tο όνοµα και την τοποθεσία του αρχείου στο οποίο θα εµπεριέχεται το τελικό σώµα εκπαίδευσης. Tο όνοµα και την τοποθεσία του φακέλου που περιέχει τη συλλογή µη επισηµειωµένων κειµένων. Tον αριθµό των µερών στις οποίες θα χωριστεί το σύνολο των µη επισηµειωµένων κειµένων. Επειδή η αξιολόγηση των υποψηφίων παραδειγµάτων εκπαίδευσης είναι χρονοβόρα, η συλλογή των µη επισηµειωµένων κειµένων είναι δυνατόν να χωριστεί σε µέρη, και σε κάθε επανάληψη το σύστηµα να αξιολογεί και να επιλέγει (κυκλικά) παραδείγµατα από µία διαφορετική διαµέριση της συλλογής. Τον αριθµό των λεκτικών µονάδων τις οποίες ο χρήστης θα επισηµειώνει (κατατάσσει) σε κάθε επανάληψη της ενεργητικής µάθησης. Προκειµένου να µειωθεί ο χρόνος αξιολόγησης και επιλογής παραδειγµάτων εκπαίδευσης, το σύστηµα επιλέγει σε κάθε επανάληψη µια δέσµη (batch) παραδειγµάτων εκπαίδευσης, αντί για ένα µεµονωµένο παράδειγµα, και ζητά από το χρήστη να επισηµειώσει όλα τα παραδείγµατα (λεκτικές µονάδες) της δέσµης, τα οποία προστίθενται στη συνέχεια στο σώµα εκπαίδευσης. Το µέτρο σύµφωνα µε το οποίο το πρόγραµµα θα αξιολογεί κάθε υποψήφιο παράδειγµα (λεκτική µονάδα των µη επισηµειωµένων κειµένων). Υποστηρίζονται τα δύο µέτρα της ενότητας

23 Εάν ο χρήστης το επιθυµεί, το πρόγραµµα µπορεί να αποθηκεύσει τα ενδιάµεσα αρχεία εκπαίδευσης που παράγονται κατά τη διάρκεια της ενεργητικής µάθησης, και όχι µόνο το τελικό σώµα εκπαίδευσης. Η επιλογή αυτή είναι χρήσιµη για ερευνητικούς σκοπούς. Ο χρήστης µπορεί επίσης να επιλέξει το βαθµό πολυπλοκότητας των ετικετών, όπως αναφέρθηκε στην ενότητα 3.2. Η ενεργητική µάθηση εξελίσσεται ως εξής: Αφού ο χρήστης δώσει τιµές στις παραπάνω παραµέτρους, το σύστηµα χωρίζει τη συλλογή µη επισηµειωµένων κειµένων σε ισοµεγέθη µέρη, όπως εξηγήθηκε παραπάνω. Ύστερα, και για όσες επαναλήψεις ο χρήστης επιθυµεί, το σύστηµα επεξεργάζεται την (κυκλικά επιλεγόµενη σε κάθε επανάληψη) τρέχουσα διαµέριση της συλλογής. Συγκεκριµένα, χρησιµοποιώντας τη βιβλιοθήκη της ενότητας 2.1, αξιολογεί τις λεκτικές µονάδες (υποψήφια παραδείγµατα εκπαίδευσης) των κειµένων του τρέχοντος µέρους και ζητά από το χρήστη να επισηµειώσει τις σηµαντικότερες από αυτές χρησιµοποιώντας το εργαλείο της ενότητας 3.2. Οι επισηµειωµένες λεκτικές µονάδες προστίθενται στη συνέχεια στο σύνολο των δεδοµένων εκπαίδευσης και η διαδικασία επαναλαµβάνεται. Καθώς η φάση της αξιολόγησης των υποψηφίων παραδειγµάτων απαιτεί ένα µη κενό σώµα εκπαίδευσης, στην πρώτη επανάληψη οι λεκτικές µονάδες επιλέγονται µε αυθαίρετο τρόπο. Συγκεκριµένα, επιλέγονται οι x πρώτες µονάδες του πρώτου κειµένου του πρώτου µέρους της συλλογής εκπαίδευσης, όπου x είναι το πλήθος των λεκτικών µονάδων ανά δέσµη. 2

24 ΚΕΦΑΛΑΙΟ 4: ΠΕΙΡΑΜΑΤΑ 4.1 Σώµα µη επισηµειωµένων κειµένων Για τους σκοπούς της εργασίας, κατασκευάστηκε ένα σώµα µη επισηµειωµένων κειµένων που περιέχει άρθρα ελληνικών εφηµερίδων. Τα άρθρα συλλέχθηκαν από τους ιστοτόπους δύο εφηµερίδων. Από τον ιστότοπο της εφηµερίδας "ΤΑ ΝΕΑ" συλλέχθηκαν 3033 άρθρα και από τον ιστότοπο της εφηµερίδας "ΤΟ ΒΗΜΑ" 5489 άρθρα. Τα άρθρα αυτά επιλέχθηκαν µε τυχαίο τρόπο από όλες τις ενότητες των εφηµερίδων (π.χ. πολιτική, αθλητικά, οικονοµικά κλπ.). Μετά τη συλλογή τους, τα προαναφερθέντα άρθρα υπέστησαν την εξής προεπεξεργασία: Αρχικά µετατράπηκαν από τη µορφή HTML στην οποία αρχικά βρισκόντουσαν σε µορφή απλού κειµένου. Στη συνέχεια διαχωρίστηκαν µε κενά τα σηµεία στίξης και άλλα ειδικά σύµβολα από τους γειτονικούς τους χαρακτήρες, προκειµένου κάθε κείµενο να είναι χωρισµένο σε σαφείς λεκτικές µονάδες (tokens). Η διαδικασία αυτή ακολουθήθηκε σε όλες τις περιπτώσεις εµφάνισης σηµείων στίξεως και συµβόλων, εκτός από τις εξής περιπτώσεις: 1. Στην περίπτωση των τελειών, ο διαχωρισµός έγινε επιλεκτικά. Στις περιπτώσεις ακρωνυµίων και συντµήσεων, θεωρήθηκε σκόπιµο οι τελείες να θεωρηθούν τµήµατά τους. Οπότε διαχωρίζονται από τους γειτονικούς τους χαρακτήρες µόνον οι τελείες οι οποίες σηµατοδοτούν λήξη περιόδου. Για τον εντοπισµό των τελειών αυτών χρησιµοποιήθηκε ο διαχωριστής περιόδων (sentence splitter) της εργασίας [Λου05], ο οποίος χρησιµοποιεί µια Μηχανή ιανυσµάτων Υποστήριξης (Support Vector Machine) και έχει εκπαιδευθεί σε ελληνικά άρθρα εφηµερίδων. 2. Στην περίπτωση των αποστρόφων («'», χαρακτήρας 0x27 σύµφωνα µε το πρότυπο ASCII), δεν βρέθηκε ικανοποιητικός αλγόριθµος ο οποίος να διακρίνει τη χρήση αποστρόφων ως εισαγωγικών από τη χρήση τους σε περιπτώσεις έκθλιψης ή αφαίρεσης. Οπότε οι απόστροφοι δεν διαχωρίζονται από τους γειτονικούς τους χαρακτήρες. Προς διευκόλυνση µελλοντικών πειραµάτων, οι προαναφερθείσες µέθοδοι διαχωρισµού συµπεριλήφθηκαν στο εργαλείο επισηµείωσης της ενότητας 2.2. Αξίζει να σηµειωθεί ότι, πέρα από την προεπεξεργασία αυτή, τα κείµενα χρησιµοποιήθηκαν ως είχαν. Οι επικεφαλίδες και οι υποκεφαλίδες των άρθρων θεωρήθηκαν οµότιµα τµήµατα του κειµένου, και δεν έγινε προσπάθεια εντοπισµού και αφαίρεσης ορθογραφικών και άλλων λαθών. 2

25 4.2 Κατασκευή Συνόλων εδοµένων Εκπαίδευσης Για τους σκοπούς των πειραµάτων της εργασίας, δηµιουργήθηκαν δύο διαφορετικά σύνολα δεδοµένων εκπαίδευσης (training sets). Πρώτα επιλέχθηκαν τυχαία 71 άρθρα πολιτικού, πολιτισµικού και οικονοµικού περιεχοµένου από το σώµα των µη επισηµειωµένων κειµένων της ενότητας 3.1. Τα 3 από αυτά τα άρθρα κρατήθηκαν ολόκληρα, ενώ από τα 68 υπόλοιπα κρατήθηκε µόνο η πρώτη παράγραφος του καθενός. Τα κείµενα που προέκυψαν ελέγχθηκαν διεξοδικά για ορθογραφικά και άλλα λάθη και συνενώθηκαν σε ένα κείµενο. Στη συνέχεια επισηµειώθηκαν στο ενιαίο κείµενο οι κατηγορίες όλων των λεκτικών µονάδων, χρησιµοποιώντας το εκτεταµένο σύνολο κατηγοριών της ενότητας 2.5. Για τους σκοπούς των πειραµάτων ενεργητικής µάθησης, δηµιουργήθηκε και ένα δεύτερο σύνολο δεδοµένων εκπαίδευσης, στο οποίο χρησιµοποιήθηκε πάλι ως αφετηρία το σώµα των µη επισηµειωµένων κειµένων της ενότητας 3.1. Για την ακρίβεια, για τους λόγους που εξηγήθηκαν στην ενότητα 3.2 το σώµα των µη επισηµειωµένων κειµένων χωρίστηκε σε 700 µέρη και χρησιµοποιήθηκε µέγεθος δέσµης ίσο µε 90. Σε κάθε επανάληψη της ενεργητικής µάθησης, η επιλογή των 90 νέων παραδειγµάτων εκπαίδευσης γινόταν από µία (κυκλικά επιλεγόµενη) διαφορετική διαµέριση. Κάθε διαµέριση περιείχε κατά µέσον όρο λεκτικές µονάδες και περίπου 12 κείµενα. Συνολικά έγιναν 271 επαναλήψεις του αλγορίθµου της ενεργητικής µάθησης και επισηµειώθηκαν (271 x 90) λεκτικές µονάδες. Ο ίδιος αριθµός επισηµειωµένων λεκτικών µονάδων υπήρχε και στο σύνολο δεδοµένων εκπαίδευσης των 71 άρθρων. 2

26 4.3 Κατασκευή Συνόλου εδοµένων Αξιολόγησης Προκειµένου να αξιολογηθούν οι επιδόσεις του συστήµατος, δηµιουργήθηκε ένα σύνολο δεδοµένων αξιολόγησης (test set). Συγκεκριµένα, επιλέχθηκαν 29 άρθρα πολιτικού, πολιτισµικού και οικονοµικού περιεχοµένου από το σώµα των µη επισηµειωµένων κειµένων της ενότητας 3.1, τα οποία είχαν εξαιρεθεί από τη διαδικασία κατασκευής των συνόλων δεδοµένων εκπαίδευσης. Τα 2 από αυτά τα άρθρα κρατήθηκαν ολόκληρα, ενώ από τα 27 υπόλοιπα κρατήθηκε µόνο η πρώτη παράγραφος του καθενός. Στη συνέχεια τα κείµενα που προέκυψαν συνενώθηκαν και πάλι σε ένα κείµενο και το ενιαίο κείµενο που προέκυψε ελέγχθηκε για ορθογραφικά και άλλα λάθη και επισηµειώθηκε χειρωνακτικά. Προέκυψε έτσι ένα κείµενο αποτελούµενο από συνολικά 8134 χειρωνακτικά επισηµειωµένες λεκτικές µονάδες. Τα διανύσµατα των λεκτικών µονάδων του κειµένου αυτού χρησιµοποιούνται ως δεδοµένα αξιολόγησης 2

27 4.4 Πειραµατικά Αποτελέσµατα Τα αποτελέσµατα που προέκυψαν από τα πειράµατα µε τα σύνολα δεδοµένων που περιγράφηκαν παραπάνω φαίνονται στο εξής γράφηµα, όπου χρησιµοποιείται το µεγάλο σύνολο ετικετών (135 ετικέτες) της ενότητας 2.5: AL 1 AL 2 PL Ορθότητα (%) Πλήθος Παραδειγµάτων Εκπαίδευσης Γράφηµα 4.1: Πειράµατα µε 135 ετικέτες (γενικές κατηγορίες και υποκατηγορίες). Στο παραπάνω γράφηµα ο οριζόντιος άξονας παριστάνει το πλήθος των παραδειγµάτων εκπαίδευσης (χειρωνακτικά επισηµειωµένες λεκτικές µονάδες). Ο κατακόρυφος άξονας παριστάνει το ποσοστό ορθότητας (accuracy) που επιτυγχάνεται στο σύνολο δεδοµένων αξιολόγησης. Το ποσοστό ορθότητας µετράται ως ο αριθµός των σωστών προβλέψεων (εµφανίσεις λεκτικών µονάδων στις οποίες αποδόθηκαν σωστές ετικέτες) δια του συνόλου των περιπτώσεων (εµφανίσεις λεκτικών µονάδων). Το γράφηµα δείχνει και τα διαστήµατα εµπιστοσύνης κάθε αποτελέσµατος, µε βαθµό βεβαιότητας 95%. ιακρίνονται τρεις καµπύλες µάθησης, µία για κάθε είδος πειράµατος που διενεργήθηκε: 1. Καµπύλη PL: Παθητική µάθηση. Τα παραδείγµατα εκπαίδευσης επιλέγονται σειριακά από τη συλλογή εκπαίδευσης των 71 άρθρων της ενότητας 4.2 (συνολικά λεκτικές µονάδες). (Μέγιστο διάστηµα εµπιστοσύνης ±1,06%.) 2. Καµπύλη AL1: Ενεργητική µάθηση, στην οποία τα παραδείγµατα εκπαίδευσης επιλέγονται από την ίδια συλλογή της περίπτωσης PL. Στο δεξί άκρο των καµπυλών PL και AL1, το σύστηµα εκπαιδεύεται στις ίδιες ακριβώς λεκτικές µονάδες. (Μέγιστο διάστηµα εµπιστοσύνης ±1,07%.) 2

28 3. Καµπύλη AL2: Ενεργητική µάθηση, στην οποία τα παραδείγµατα εκπαίδευσης επιλέγονται από ολόκληρο το σώµα µη επισηµειωµένων κειµένων της ενότητας 3.1. (Μέγιστο διάστηµα εµπιστοσύνης ±1,05%.) Όπως είναι φυσικό, οι καµπύλες PL και AL1 τελικά συγκλίνουν, αφού καταλήγουν να εκπαιδεύονται στα ίδια ακριβώς παραδείγµατα. Παρ' όλα αυτά, από τα παραδείγµατα εκπαίδευσης και πέρα, η καµπύλη AL1 βρίσκεται σηµαντικά ψηλότερα από την PL, κάτι που δείχνει ότι η AL1 επιλέγει πιο χρήσιµα παραδείγµατα εκπαίδευσης από την PL, που επιλέγει παραδείγµατα µε τη σειρά που εµφανίζονται στα κείµενα εκπαίδευσης. Αυτό µας έκανε να ελπίζουµε ότι τα αποτελέσµατα θα ήταν ακόµα καλύτερα στην περίπτωση της AL2, όπου τα παραδείγµατα εκπαίδευσης επιλέγονται από ολόκληρο το σώµα των µη επισηµειωµένων κειµένων της ενότητας 3.1, που περιέχει περίπου 3 εκατοµµύρια υποψήφια παραδείγµατα εκπαίδευσης (εµφανίσεις λεκτικών µονάδων). Τα πειραµατικά αποτελέσµατα, όµως, δείχνουν ότι η AL2 οδηγεί σε χειρότερη επίδοση από ό,τι η AL1, ενώ το τελικό ποσοστό ορθότητάς της είναι κατώτερο και εκείνου της PL. Το τελικό ποσοστό ορθότητας των PL και AL1 είναι 82,73% (±0,82% για την AL1 και ±0,86% για την PL), ενώ η αντίστοιχη τιµή για την AL2 είναι 80,4373% ±0,82%. Η µη αναµενόµενη αυτή συµπεριφορά διερευνάται περαιτέρω στη συνέχεια. Το γράφηµα 4.2 δείχνει τα αντίστοιχα αποτελέσµατα όταν χρησιµοποιούνται µόνο οι 12 γενικές κατηγορίες (ετικέτες) της ενότητας 2.5. Προκειµένου να επιταχυνθεί η διεξαγωγή των πειραµάτων, χρησιµοποιήθηκαν ακριβώς τα ίδια παραδείγµατα εκπαίδευσης (και αξιολόγησης) που είχαν χρησιµοποιηθεί στα αντίστοιχα πειράµατα του µεγάλου συνόλου ετικετών, αλλά οι ετικέτες των παραδειγµάτων εκπαίδευσης (και αξιολόγησης) απλοποιήθηκαν, ώστε να αντιστοιχούν στις 12 γενικές κατηγορίες. Στην περίπτωση αυτή, δηλαδή, τα παραδείγµατα εκπαίδευσης της ενεργητικής µάθησης είχαν επιλεγεί και πάλι βάσει των λεπτοµερών 135 ετικετών, αντί βάσει των 12 γενικότερων ετικετών. 2

29 AL 1 AL 2 PL Ορθότητα (%) Πλήθος Παραδειγµάτων Εκπαίδευσης Γράφηµα 4.2: Πειράµατα µε 12 ετικέτες (γενικές κατηγορίες µόνο). Είναι ορατό και αναµενόµενο ότι οι επιδόσεις του συστήµατος σε όλες τις περιπτώσεις (PL, AL1, AL2) είναι σηµαντικά καλύτερες συγκρινόµενες µε τις αντίστοιχες επιδόσεις του γραφήµατος 4.1, όπου χρησιµοποιούνται πολύ περισσότερες κατηγορίες. Η βελτίωση προσεγγίζει ή ακόµη και ξεπερνάει το 10%. Το γεγονός αυτό δείχνει πόσο πιο δύσκολο γίνεται το πρόβληµα όταν επιδιώκει κανείς να αναγνωρίσει όχι µόνο τα µέρη του λόγου αλλά και πληροφορίες όπως γένος, αριθµός, χρόνος κλπ. Βλέπουµε και σε αυτή την περίπτωση ότι η AL2 δεν οδηγεί σε καλύτερα αποτελέσµατα από την AL1, αντίθετα από ό,τι αναµέναµε. Προκειµένου να διερευνηθούν περαιτέρω τα αίτια των µη αναµενόµενων αποτελεσµάτων στην περίπτωση AL2, υπολογίστηκε η συχνότητα µε την οποία ο αλγόριθµος ενεργητικής µάθησης επιλέγει ως παραδείγµατα εκπαίδευσης ξένες λέξεις και ακρωνύµια. Οι συχνότητες αυτές, συναρτήσει του συνολικού αριθµού των παραδειγµάτων εκπαίδευσης φαίνονται στα παρακάτω γραφήµατα: 2

30 Συχνότητα Επιλογής Ακρωνυµίων PL AL1 AL2 Πλήθος Πλήθος Παραδειγµάτων Εκπαίδευσης Γράφηµα Συχνότητα Επιλογής Ξένων Λέξεων PL AL1 AL Πλήθος Πλήθος Παραδειγµάτων Εκπαίδευσης Γράφηµα 4.4 Όπως ήταν αναµενόµενο, οι καµπύλες των PL και AL1 τελικά συγκλίνουν, αφού και στις δύο περιπτώσεις το σύστηµα εκπαιδεύεται τελικά ακριβώς στα ίδια παραδείγµατα. Οι καµπύλες AL2 δείχνουν ότι το µέτρο που χρησιµοποιείται στην ενεργητική µάθηση για την επιλογή παραδειγµάτων ευνοεί ιδιαίτερα τις ξένες λέξεις και τα ακρωνύµια. Αντίθετα από τις περιπτώσεις PL και AL1, στην περίπτωση της 3

31 AL2, τα παραδείγµατα επιλέγονται από ολόκληρο το σώµα των µη επισηµειωµένων κειµένων της ενότητας 3.1, το οποίο περιέχει περίπου 3 εκατοµµύρια λεκτικές µονάδες, µεταξύ των οποίων υπάρχει και πολύ µεγάλος αριθµός ξένων λέξεων και ακρωνυµίων. Έτσι στην περίπτωση της AL2, η προτίµηση του µέτρου προς τις ξένες λέξεις και τα ακρωνύµια οδηγεί σε δεδοµένα εκπαίδευσης που περιέχουν έναν υπέρµετρο αριθµό λεκτικών µονάδων των κατηγοριών αυτών. Η προτίµηση των µέτρου της ενεργητικής µάθησης προς τις δύο αυτές κατηγορίες είναι εξηγήσιµη. Η µορφολογία των λεκτικών µονάδων αυτών των κατηγοριών είναι φαινοµενικά τυχαία, τουλάχιστον ως προς τα δεδοµένα της ελληνικής γλώσσας. Επίσης έχουν τυχαίο γραµµατικό ρόλο, καθώς µπορούν να αναπαριστούν ουσιαστικό, επίθετο, κλπ. σε οποιοδήποτε γένος, αριθµό και πτώση. Το αποτέλεσµα είναι ότι ο ταξινοµητής είναι ιδιαίτερα αβέβαιος για την ορθή τους κατηγορία (υψηλή εντροπία), ενώ λόγω της «τυχαιότητας» πολλών χαρακτηριστικών τους τα διανύσµατά τους συχνά απέχουν πολύ από εκείνα των υπόλοιπων παραδειγµάτων που έχουν επιλεγεί, κάτι που επίσης ευνοεί την επιλογή τους όταν οι ψήφοι των γειτόνων ζυγίζονται βάσει της απόστασής τους (βλ. ενότητα 2.3). Η εισαγωγή τους όµως στο σύνολο εκπαίδευσης δεν βοηθά το σύστηµα να επιτύχει µεγαλύτερη ορθότητα, καθώς η τυχαιότητα η οποία τις χαρακτηρίζει µορφολογικά και γραµµατικά δεν συντείνει ώστε προηγούµενα παραδείγµατα ξένων λέξεων και ακρωνυµίων να είναι κοντινοί γείτονες µελλοντικών λεκτικών µονάδων που ανήκουν στις κατηγορίες αυτές. Εκτός αυτού, η υπέρµετρη εισαγωγή ξένων λέξεων και ακρωνυµίων, οδηγεί στην επιλογή λιγότερων παραδειγµάτων από τις άλλες κατηγορίες, µε αποτέλεσµα να αυξάνονται τα λάθη κατάταξης στις υπόλοιπες κατηγορίες. Χαρακτηριστικά παρατίθεται το αντίστοιχο γράφηµα συχνότητας για επιρρήµατα: 1200 Συχνότητα Επιλογής Επιρρηµάτων PL AL1 AL Πλήθος Πλήθος Παραδειγµάτων Εκπαίδευσης Γράφηµα 4.5 3

32 Παρατηρούµε ότι η AL1 τείνει να συµπεριλάβει περισσότερα επιρρήµατα στο σύνολο εκπαίδευσης απ' ό,τι η παθητική µάθηση. Αντίθετα, η AL2 βρίσκεται πιο κοντά στην παθητική µάθηση παρά στην AL1. Το γεγονός αυτό είναι πιθανό να οφείλεται στην υπερβολική συχνότητα ξένων λέξεων και ακρωνυµίων, τα οποία εκτοπίζουν παραδείγµατα επιρρηµάτων, τα οποία υπό άλλες συνθήκες θα είχαν προταθεί για επισηµείωση. Αξίζει να σηµειωθεί ότι, όπως θα ήθελε κανείς, η AL2 δείχνει πολύ µικρή προτίµηση σε κατηγορίες όπως τα άρθρα, που το σύστηµα είναι ιδιαίτερα εύκολο να µάθει να τα κατατάσσει σωστά, επειδή είναι λίγα και ο συνδυασµός µορφολογίας και συντακτικής τοποθέτησης που τα χαρακτηρίζει κάνει εύκολη την αναγνώρισή τους. Αυτό φαίνεται στο επόµενο γράφηµα. Συχνότητα Επιλογής Άρθρων PL AL1 AL Πλήθος Πλήθος Παραδειγµάτων Εκπαίδευσης Γράφηµα 4.6 Ως τώρα χρησιµοποιήθηκαν οι ξένες λέξεις και τα ακρωνύµια ως παραδείγµατα κατηγοριών λεκτικών µονάδων στις οποίες η AL2 δείχνει υπέρµετρη προτίµηση. Άλλες τέτοιες κατηγορίες οι οποίες εντοπίστηκαν και αναφέρονται µε σύντοµο τρόπο είναι οι εξής: Ορθογραφικά και τυπογραφικά λάθη, κυρίως εάν τα λάθη αυτά διασπούν µία κατά τα άλλα ενιαία λεκτική µονάδα ή συνενώνουν δύο διαφορετικές. Λέξεις οι οποίες δεν µπορούν εύκολα να συγκαταλεχθούν στις κατηγορίες της ενότητας 2.5. Στην οµάδα αυτή περιλαµβάνονται κυρίως κατάλοιπα της δοτικής πτώσης στην νεοελληνική, δηλαδή λέξεις και φράσεις όπως "εν όψει", "λόγω", κ.α. Όπως αναφέρθηκε στην ενότητα 4.1, οι επικεφαλίδες και οι υποκεφαλίδες των άρθρων διατηρήθηκαν. Επειδή οι οι φράσεις αυτές συνήθως δεν λήγουν µε σηµείο στίξης, συχνά εθεωρούντο τµήµατα των εποµένων περιόδων, µε 3

33 αποτέλεσµα η τελευταία λέξη της υποκεφαλίδας και η πρώτη λέξη της επόµενης περιόδου να αποτελούν ασυνήθιστες ακολουθίες λέξεων και να επιλέγονται ως παραδείγµατα εκπαίδευσης. Όλες οι προαναφερόµενες κατηγορίες λεκτικών µονάδων παρουσιάζουν χαρακτηριστικά θορυβώδους συµπεριφοράς, η οποία στρεβλώνει την απόδοση του αλγορίθµου ενεργητικής µάθησης, όπως έχει διαπιστωθεί και αλλού [BaBeLa06]. 3

34 ΚΕΦΑΛΑΙΟ 5: ΑΝΑΣΚΟΠΗΣΗ 5.1 Συµπεράσµατα Στα πλαίσια της παρούσας εργασίας πραγµατοποιήθηκε µία λεπτοµερέστερη αξιολόγηση των µεθόδων ενεργητικής µάθησης που είχαν προταθεί σε προηγούµενη µελέτη [Mα05] για την επισηµείωση µερών του λόγου ελληνικών κειµένων µε τη χρήση ταξινοµητή k κοντινότερων γειτόνων. Η αξιολόγηση αυτή έδειξε ότι το µέτρο επιλογής παραδειγµάτων που είχε προταθεί δεν επιφέρει τα αναµενόµενα αποτελέσµατα όταν τα παραδείγµατα επιλέγονται από πολύ µεγάλες συλλογές µη επισηµειωµένων κειµένων, κυρίως λόγω της υπέρµετρης προτίµησης του µέτρου σε κατηγορίες όπως οι ξένες λέξεις και οι συντοµογραφίες, που παρουσιάζουν χαρακτηριστικά θορυβώδους συµπεριφοράς. Παράλληλα βελτιώθηκε το λογισµικό της προηγούµενης εργασίας, το οποίο παρέχει τώρα εργαλεία που διευκολύνουν την επανεκπαίδευση και χρήση του συστήµατος, ενώ έγιναν πολλές βελτιώσεις στον κώδικα που βελτίωσαν την ταχύτητά του. 3

35 5.2 Μελλοντικές Επεκτάσεις Στην σηµερινή του µορφή, ο αλγόριθµος ενεργητικής µάθησης επιλέγει σε υπέρµετρο βαθµό λεκτικές µονάδες των οποίων οι διανυσµατικές αναπαραστάσεις οδηγούν σε µεγάλη αβεβαιότητα του ταξινοµητή ή τις κάνουν να φαίνονται ασυνήθιστες. Ένας άλλος τρόπος επιλογής θα ήταν να αγνοείται ένα µεγάλο ποσοστό των λεκτικών µονάδων που το υπάρχον µέτρο χαρακτηρίζει ως χαµηλής σηµαντικότητας υποψήφια παραδείγµατα, και η επιλογή από τις υπόλοιπες να γίνεται µε γραµµική ή τυχαία επιλογή. Εναλλακτικά, θα ήταν δυνατόν να τεθεί ένας περιορισµός στον αριθµό παραδειγµάτων κάθε κατηγορίας που επιτρέπεται να επιλεγούν σε κάθε δέσµη (π.χ. ως 5 ξένες λέξεις ανά δέσµη). Θα ήταν, επίσης, χρήσιµο να διερευνηθεί πειραµατικά το κατά πόσον είναι πραγµατικά χρήσιµοι όλοι οι όροι του µέτρου επιλογής παραδειγµάτων. Θα ήταν, τέλος, ενδιαφέρον να διερευνηθεί η δυνατότητα προσθήκης στο µέτρο επιλογής ενός παράγοντα αντιπροσωπευτικότητας (representativeness), ώστε να επιλέγονται παραδείγµατα που να µοιάζουν µε πολλά άλλα υποψήφια παραδείγµατα εκπαίδευσης. Μία άλλη µελέτη θα µπορούσε να διερευνήσει την επιρροή που έχει η ύπαρξη εναλλακτικών µορφών της ίδιας λεκτικής µονάδας στην επίδοση του ταξινοµητή. Στη σηµερινή του µορφή, το σύστηµα θεωρεί, για παράδειγµα, τις µονάδες "σήµερα", "σηµερα", "Σήµερα", "ΣΗΜΕΡΑ" κλπ. εντελώς διαφορετικές. εν έχει µελετηθεί κατά πόσο το γεγονός αυτό συµβάλλει, θετικά ή αρνητικά, στην επίδοση του συστήµατος, ή πώς θα µπορούσαν οι διάφορες αυτές µορφές της ίδιας λεκτικής µονάδας να συνενωθούν χωρίς να χαθούν πληροφορίες που είναι χρήσιµες για την κατάταξή τους. 3

36 ΠΑΡΑΡΤΗΜΑ: ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΩΝ ΕΤΙΚΕΤΩΝ ΣΕ XML Για τους σκοπούς της εργασίας, ορίστηκε µια αναπαράσταση σε XML των κατηγοριών των λεκτικών µονάδων, η οποία δρα ως κανονικοποιηµένη µορφή εισόδου και εξόδου. Το σύστηµα είναι σε θέση να δέχεται κείµενα εκπαίδευσης στα οποία οι κατηγορίες των λέξεων ακολουθούν αυτή την αναπαράσταση. Το αποτέλεσµα της αυτόµατης επισηµείωσης (tagging) ενός νέου κειµένου αποθηκεύεται επίσης σε µορφή που ακολουθεί την ίδια αναπαράσταση. Στην αναπαράσταση αυτή οι κατηγορίες παριστάνονται χρησιµοποιώντας τις ακόλουθες ετικέτες XML: <article> και </article> Οι ετικέτες αυτές σηµατοδοτούν την έναρξη και λήξη ενός άρθρου εφηµερίδας ή άλλου κειµένου µέσα σε ένα αρχείο. Με αυτόν τον τρόπο ένα αρχείο µπορεί να περιέχει πάνω από ένα επισηµειωµένα άρθρα. <sentence> και </sentence> Οι ετικέτες αυτές σηµατοδοτούν την έναρξη και λήξη µίας περιόδου σε ένα άρθρο. Κάθε άρθρο περιέχει τουλάχιστον µία περίοδο. Οι περίοδοι περιέχουν τουλάχιστον µία λεκτική µονάδα. <token> και </token> Οι ετικέτες αυτές σηµατοδοτούν την έναρξη και λήξη µίας λεκτικής µονάδας (ή µετά την µετα-επεξεργασία, την έναρξη και λήξη ενός περιφραστικού τύπου). Η ετικέτα <token> δέχεται τις παρακάτω ιδιότητες: PoS: Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει την κύρια κατηγορία µερών του λόγου στην οποία ανήκει η λεκτική µονάδα. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: adjective, adverb, article, conjunction, noun, numeral, particle, preposition, pronoun, punctuation, verb, other case: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει µία από τις τιµές "adjective", "article", "noun", "pronoun", δηλαδή η τρέχουσα λεκτική µονάδα είναι επίθετο, άρθρο, ουσιαστικό ή αντωνυµία, αντίστοιχα. Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει την πτώση της εν λόγω µονάδας. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: nom (nominative), gen (genitive), acc (accusative), voc (vocative) gender: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει µία από τις τιµές "adjective", "article", "noun", "pronoun", δηλαδή η τρέχουσα λεκτική µονάδα είναι επίθετο, άρθρο, ουσιαστικό ή αντωνυµία, αντίστοιχα. Η 3

37 ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει το γένος της εν λόγω µονάδας. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: masc (masculine), fem (feminine), neut (neuter) function: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει τιµή "article", δηλαδή η τρέχουσα λεκτική µονάδα είναι άρθρο. Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει τον τύπο του άρθρου. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: def (definite), indef (indefinite), prep (prepositional) (π.χ. «στον») mode: Η ύπαρξη της ιδιότητας αυτής εξαρτάται από την τιµή που έχει η ιδιότητα PoS. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα mode σε κάθε περίπτωση είναι: inflectionless, εάν η ιδιότητα PoS έχει τιµή "pronoun", ώστε να σηµατοδοτεί άκλιτη αντωνυµία. infinitive, εάν η ιδιότητα PoS έχει τιµή "verb", ώστε να σηµατοδοτεί απαρέµφατο. participle, εάν η ιδιότητα PoS έχει τιµή "verb", ώστε να σηµατοδοτεί µετοχή. number: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει µία από τις τιµές "adjective", "article", "noun", "pronoun", "verb", δηλαδή η τρέχουσα λεκτική µονάδα είναι επίθετο, άρθρο, ουσιαστικό, αντωνυµία ή ρήµα, αντίστοιχα. Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει τον αριθµό της εν λόγω µονάδας. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: sg (singular), pl (plural) tense: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει την τιµή "verb", δηλαδή η τρέχουσα λεκτική µονάδα είναι ρήµα. Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει τον χρόνο της εν λόγω µονάδας. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: present, past, future voice: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει την τιµή "verb", δηλαδή η τρέχουσα λεκτική µονάδα είναι ρήµα. Επί πλέον, το εν λόγω ρήµα πρέπει να είναι απαρέµφατο, δηλαδή να έχει επίσης την ιδιότητα mode µε τιµή "infinitive". Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει την φωνή του εν λόγω απαρεµφάτου. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: active, passive type: Η ύπαρξη της ιδιότητας αυτής προβλέπεται µόνο όταν η ιδιότητα PoS έχει την τιµή "other". Η ιδιότητα αυτή περιέχει µία τιµή η οποία χαρακτηρίζει την επί µέρους κατηγορία της εν λόγω µονάδας. Οι δυνατές τιµές που µπορεί να έχει η ιδιότητα αυτή είναι: abbrev (abbreviation), acronym, foreign (foreign word), symbol, undefined 3

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 16 ης διάλεξης

Ασκήσεις μελέτης της 16 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 16 ης διάλεξης 16.1. (α) Έστω ένα αντικείμενο προς κατάταξη το οποίο

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Αναγνώριση και Κατάταξη Ονοµάτων Προσώπων, Οργανισµών και Τοποθεσιών σε Ελληνικά Κείµενα µε Χρήση Μηχανών ιανυσµάτων Υποστήριξης» Ιωάννης

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 19 ης διάλεξης

Ασκήσεις μελέτης της 19 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 19 ης διάλεξης 19.1. Δείξτε ότι το Perceptron με (α) συνάρτηση ενεργοποίησης

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.) ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.) «Διερμηνεία και Μετάφραση» Tων Τμημάτων: Φιλολογίας, Αγγλικής Γλώσσας και Φιλολογίας, Γαλλικής Γλώσσας και

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

ΓΡΑΜΜΑΤΙΚΗ ΣΥΝΤΑΞΗ ΕΙΣΑΓΩΓΗ

ΓΡΑΜΜΑΤΙΚΗ ΣΥΝΤΑΞΗ ΕΙΣΑΓΩΓΗ ΕΙΣΑΓΩΓΗ Η Γραμματική εντάσσεται στα ευρύτερα πλαίσια του γλωσσικού μαθήματος. Δε διδάσκεται χωριστά, αλλά με βάση την ενιαία προσέγγιση της γλώσσας, όπου έμφαση δίνεται στη λειτουργική χρήση της. Διδάσκεται

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης»

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ θέμα: «Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» Βασιλάκος Ξενοφών Επιβλέπων

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης «Αναγνώριση μερών του λόγου σε ελληνικά κείμενα με τεχνικές

Διαβάστε περισσότερα

Τα κύρια σηµεία της παρούσας διδακτορικής διατριβής είναι: Η πειραµατική µελέτη της µεταβατικής συµπεριφοράς συστηµάτων γείωσης

Τα κύρια σηµεία της παρούσας διδακτορικής διατριβής είναι: Η πειραµατική µελέτη της µεταβατικής συµπεριφοράς συστηµάτων γείωσης Κεφάλαιο 5 ΣΥΜΠΕΡΑΣΜΑΤΑ Το σηµαντικό στην επιστήµη δεν είναι να βρίσκεις καινούρια στοιχεία, αλλά να ανακαλύπτεις νέους τρόπους σκέψης γι' αυτά. Sir William Henry Bragg 5.1 Ανακεφαλαίωση της διατριβής

Διαβάστε περισσότερα

Το λογισµικό εκπόνησης οικονοµοτεχνικών µελετών COBA. Η δυνατότητα εφαρµογής του στην Ελλάδα.

Το λογισµικό εκπόνησης οικονοµοτεχνικών µελετών COBA. Η δυνατότητα εφαρµογής του στην Ελλάδα. Το λογισµικό εκπόνησης οικονοµοτεχνικών µελετών COBA. Η δυνατότητα εφαρµογής του στην Ελλάδα. Κ.Μ. Ευθυµίου Πολιτικός µηχανικός, Msc. Λέξεις κλειδιά: COBA, οικονοµοτεχνική µελέτη ΠΕΡΙΛΗΨΗ: Το λογισµικό

Διαβάστε περισσότερα

ιπλωµατική εργασία: Νικόλαος Ματάνας Επιβλέπων Καθηγήτρια: Μπούσιου έσποινα

ιπλωµατική εργασία: Νικόλαος Ματάνας Επιβλέπων Καθηγήτρια: Μπούσιου έσποινα ιπλωµατική εργασία: Νικόλαος Ματάνας Επιβλέπων Καθηγήτρια: Μπούσιου έσποινα ΤµήµαΕφαρµοσµένης Πληροφορικής Πανεπιστήµιο Μακεδονίας Θεσσαλονίκη Ιούνιος 2006 εισαγωγικού µαθήµατος προγραµµατισµού υπολογιστών.

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Οικονομικό Πανεπιστήμιο Αθηνών. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης. Άρης Κοσμόπουλος

Οικονομικό Πανεπιστήμιο Αθηνών. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης. Άρης Κοσμόπουλος Οικονομικό Πανεπιστήμιο Αθηνών Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης Άρης Κοσμόπουλος Πρόβλημα ανεπιθύμητων μηνυμάτων Περισσότερα από το 60% των ηλεκτρονικών μηνυμάτων είναι ανεπιθύμητα

Διαβάστε περισσότερα

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί) Εισαγωγή στον Προγραµµατισµό Αριθµητική Ανάλυση (ή Επιστηµονικοί Υπολογισµοί) ιδάσκοντες: Καθηγητής Ν. Μισυρλής, Επίκ. Καθηγητής Φ.Τζαφέρης ΕΚΠΑ 8 εκεµβρίου 2014 Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΟΜΑ Α ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Στην εικόνα παρακάτω φαίνεται ένα νευρωνικό

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας 1. Εισαγωγή Σχολιασµός των εργασιών της 16 ης παράλληλης συνεδρίας µε θέµα «Σχεδίαση Περιβαλλόντων για ιδασκαλία Προγραµµατισµού» που πραγµατοποιήθηκε στο πλαίσιο του 4 ου Πανελλήνιου Συνεδρίου «ιδακτική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΕΠΛ 035 - ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΓΙΑ ΗΛΕΚΤΡΟΛΟΓΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΚΑΙ ΜΗΧΑΝΙΚΟΥΣ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδηµαϊκό έτος 2017-2018 Υπεύθυνος εργαστηρίου: Γεώργιος

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Οκτωβρίου 23 ιάρκεια: 2 ώρες Έστω το παρακάτω γραµµικώς

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,

Διαβάστε περισσότερα

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις Κεφάλαιο M4 Κίνηση σε δύο διαστάσεις Κινηµατική σε δύο διαστάσεις Θα περιγράψουµε τη διανυσµατική φύση της θέσης, της ταχύτητας, και της επιτάχυνσης µε περισσότερες λεπτοµέρειες. Θα µελετήσουµε την κίνηση

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΕΥΑΙΣΘΗΣΙΑΣ Εισαγωγή

ΑΝΑΛΥΣΗ ΕΥΑΙΣΘΗΣΙΑΣ Εισαγωγή 1 ΑΝΑΛΥΣΗ ΕΥΑΙΣΘΗΣΙΑΣ Εισαγωγή Η ανάλυση ευαισθησίας μιάς οικονομικής πρότασης είναι η μελέτη της επιρροής των μεταβολών των τιμών των παραμέτρων της πρότασης στη διαμόρφωση της τελικής απόφασης. Η ανάλυση

Διαβάστε περισσότερα

ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος Παναγιώτα Φατούρου. Προγραµµατιστική Εργασία 3 ο Μέρος

ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος Παναγιώτα Φατούρου. Προγραµµατιστική Εργασία 3 ο Μέρος Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών 6 εκεµβρίου 2008 ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος 2008-09 Παναγιώτα Φατούρου Προγραµµατιστική Εργασία 3 ο Μέρος Ηµεροµηνία Παράδοσης:

Διαβάστε περισσότερα

Περιεχόµενα...1 1. Εισαγωγή...3. 2. Μηχανική Μάθηση...7. 3. Προηγούµενες πειραµατικές προσπάθειες...15

Περιεχόµενα...1 1. Εισαγωγή...3. 2. Μηχανική Μάθηση...7. 3. Προηγούµενες πειραµατικές προσπάθειες...15 Περιεχόµενα Περιεχόµενα Περιεχόµενα...1 1. Εισαγωγή...3 1.1 Αντικείµενο της εργασίας... 3 1.2 Κυριότερα αποτελέσµατα της εργασίας... 4 1.3 ιάρθρωση της εργασίας... 5 1.4 Ευχαριστίες... 5 2. Μηχανική Μάθηση...7

Διαβάστε περισσότερα

"The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ "

The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ Αρχιµήδης ΙΙ Ενίσχυση Ερευνητικών Οµάδων του ΤΕΙ Κρήτης Τίτλος Υποέργου: Εφαρµογές Τεχνητής Νοηµοσύνης στην Τεχνολογία Λογισµικού και στην Ιατρική Επιστηµονικός Υπεύθυνος: ρ Εµµανουήλ Μαρακάκης ραστηριότητα

Διαβάστε περισσότερα

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ Μεταγλωττιστές Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 26 Ιανουαρίου 2004 ιάρκεια: 2 ώρες (9:00-:00) Στην παρακάτω

Διαβάστε περισσότερα

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Αριθµητική Ανάλυση 1 εκεµβρίου / 43 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 1 / 43 Κεφ.5. Αριθµητικός Υπολογισµός Ιδιοτιµών και Ιδιοδιανυσµάτων ίνεται ένας πίνακας A C n n και Ϲητούνται να προσδιορισθούν οι

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική Σχολή Θετικών Επιστημών Πανεπιστήμιο Θεσσαλίας ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Κατηγοριοποίηση Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Κατηγοριοποιητής K πλησιέστερων

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

Α. Ερωτήσεις Ανάπτυξης

Α. Ερωτήσεις Ανάπτυξης οµηµένος Προγραµµατισµός-Κεφάλαιο 7 Σελίδα 1 α ό 10 ΕΝΟΤΗΤΑ ΙΙΙ (ΠΡΟΓΡΑΜΜΑΤΑ) ΚΕΦΑΛΑΙΟ 7: Είδη, Τεχνικές και Περιβάλλοντα Προγραµµατισµού Α. Ερωτήσεις Ανάπτυξης 1. Τι ονοµάζουµε γλώσσα προγραµµατισµού;

Διαβάστε περισσότερα

Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση

Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Πτυχιακή Εργασία Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση Κωνσταντίνος

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL

ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL 8.1. Εισαγωγή ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PACAL Πως προέκυψε η γλώσσα προγραμματισμού Pascal και ποια είναι τα γενικά της χαρακτηριστικά; Σχεδιάστηκε από τον Ελβετό επιστήμονα της Πληροφορικής Nicklaus Wirth to

Διαβάστε περισσότερα

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής Θεωρία Πληροφορίας Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Ατζέντα Διακριτή πηγή πληροφορίας χωρίς μνήμη Ποσότητα πληροφορίας της πηγής Κωδικοποίηση

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Σεπτεµβρίου 2005 5:00-8:00 Σχεδιάστε έναν αισθητήρα ercetro

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Ολοκλήρωση Εισαγωγή Έστω ότι η f είναι μία φραγμένη συνάρτηση στο πεπερασμένο

Διαβάστε περισσότερα

Τηλεπικοινωνιακά Συστήματα ΙΙ

Τηλεπικοινωνιακά Συστήματα ΙΙ Τηλεπικοινωνιακά Συστήματα ΙΙ Διάλεξη 11: Κωδικοποίηση Πηγής Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Ατζέντα 1. Αλγόριθμοι κωδικοποίησης πηγής Αλγόριθμος Fano Αλγόριθμος Shannon Αλγόριθμος Huffman

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005 ΕΚΕΦΕ «ηµόκριτος» Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Τεχνολογίας Γνώσεων και Λογισµικού Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005 Το Εργαστήριο Τεχνολογίας Γνώσεων και Λογισµικού

Διαβάστε περισσότερα

Τμήμα Μηχανικών Πληροφορικής ΤΕ Η μέθοδος Simplex. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 19/01/2017

Τμήμα Μηχανικών Πληροφορικής ΤΕ Η μέθοδος Simplex. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 19/01/2017 Τμήμα Μηχανικών Πληροφορικής ΤΕ 2016-2017 Η μέθοδος Simplex Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα τελευταία ενημέρωση: 19/01/2017 1 Πλεονεκτήματα Η μέθοδος Simplex Η μέθοδος Simplex είναι μια

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Παρασκευή 9 Ιανουαρίου 2007 5:00-8:00 εδοµένου ότι η

Διαβάστε περισσότερα

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ»

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ» ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ» Νικόλαος Μπαλκίζας 1. ΕΙΣΑΓΩΓΗ Σκοπός του σχεδίου μαθήματος είναι να μάθουν όλοι οι μαθητές της τάξης τις έννοιες της ισοδυναμίας των κλασμάτων,

Διαβάστε περισσότερα

οµή δικτύου ΣΧΗΜΑ 8.1

οµή δικτύου ΣΧΗΜΑ 8.1 8. ίκτυα Kohonen Το µοντέλο αυτό των δικτύων προτάθηκε το 1984 από τον Kοhonen, και αφορά διαδικασία εκµάθησης χωρίς επίβλεψη, δηλαδή δεν δίδεται καµία εξωτερική επέµβαση σχετικά µε τους στόχους που πρέπει

Διαβάστε περισσότερα

Singular Report Generator. Σχ 1 ηµιουργία Καταστάσεων SRG

Singular Report Generator. Σχ 1 ηµιουργία Καταστάσεων SRG Μια από τις πιο σηµαντικές ανάγκες που αντιµετωπίζει µια επιχείρηση κατά την εγκατάσταση ενός λογισµικού «πακέτου» (Οικονοµικής & Εµπορικής ιαχείρισης), είναι ο τρόπος µε τον οποίο πρέπει να ανταποκριθεί

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Β06Σ03 ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΗΝ ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΗ

Β06Σ03 ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΗΝ ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Β06Σ03 ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΗΝ ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΗ Ενότητα 2: Επαγωγική-περιγραφική στατιστική, παραµετρικές

Διαβάστε περισσότερα

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί

Διαβάστε περισσότερα

Γράψτε ένα πρόγραμμα που θα προσομοιώνει τη ρίψη ενός νομίσματος και θα εμφανίζει στην οθόνη Κορώνα» ή «Γράμματα».

Γράψτε ένα πρόγραμμα που θα προσομοιώνει τη ρίψη ενός νομίσματος και θα εμφανίζει στην οθόνη Κορώνα» ή «Γράμματα». Εισαγωγικές Δραστηριότητες Δραστηριότητα 1 (Υ) Υπολογίστε την τιμή των παρακάτω αριθμητικών εκφράσεων. Στη συνέχεια επαληθεύστε τα αποτελέσματα που βρήκατε στην κονσόλα της Python. A. 2 + 3 ** 3 * 2 B.

Διαβάστε περισσότερα

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται δύο κριτήρια απόρριψης απομακρυσμένων από τη μέση τιμή πειραματικών μετρήσεων ενός φυσικού μεγέθους και συγκεκριμένα

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Μηχανική Μάθηση: γιατί;

Μηχανική Μάθηση: γιατί; Μηχανική Μάθηση Μηχανική Μάθηση: γιατί; Απαραίτητη για να μπορεί ο πράκτορας να ανταπεξέρχεται σε άγνωστα περιβάλλοντα Δεν είναι δυνατόν ο σχεδιαστής να προβλέψει όλα τα ενδεχόμενα περιβάλλοντα. Χρήσιμη

Διαβάστε περισσότερα

«Η τροπικότητα στην Νέα Ελληνική» Ανάλυση βάσει του Επικοινωνιακού Δοµολειτουργικού Προτύπου

«Η τροπικότητα στην Νέα Ελληνική» Ανάλυση βάσει του Επικοινωνιακού Δοµολειτουργικού Προτύπου Πώς τροποποιούµε το µήνυµα: 1. Έγκλιση (σελ. 1) 2. Άποψη - Ποιόν Ενεργείας (σελ. 7) 3. Άρνηση - Ερώτηση (σελ. ) 4. Τροπικά (σελ. 13). Επιτονισµός και τόνος (σελ. 13) 1 1. Έγκλιση: Οριστική (+/-) Απαρέµφατο

Διαβάστε περισσότερα

ECDL Module 4 Υπολογιστικά Φύλλα Εξεταστέα Ύλη, έκδοση 5.0 (Syllabus Version 5.0)

ECDL Module 4 Υπολογιστικά Φύλλα Εξεταστέα Ύλη, έκδοση 5.0 (Syllabus Version 5.0) ECDL Module 4 Υπολογιστικά Φύλλα Εξεταστέα Ύλη, έκδοση 5.0 (Syllabus Version 5.0) (Module 4 Spreadsheets) Συνολική ιάρκεια: Προτεινόµενο * Χρονοδιάγραµµα Εκπαίδευσης 10-14 (δέκα έως δεκατέσσερις) ώρες

Διαβάστε περισσότερα

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών ΗΥ-6 Συστήµατα Ανάκτησης Πληροφοριών 7-8 Εαρινό Εξάµηνο Άσκηση Λύσεις ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Θεωρείστε µια

Διαβάστε περισσότερα

ΤΟ ΠΡΟΣΗΜΟ ΤΟΥ ΤΡΙΩΝΥΜΟΥ

ΤΟ ΠΡΟΣΗΜΟ ΤΟΥ ΤΡΙΩΝΥΜΟΥ ΣΕΝΑΡΙΟ του Κύπρου Κυπρίδηµου, µαθηµατικού ΤΟ ΠΡΟΣΗΜΟ ΤΟΥ ΤΡΙΩΝΥΜΟΥ Περίληψη Στη δραστηριότητα αυτή οι µαθητές καλούνται να διερευνήσουν το πρόσηµο του τριωνύµου φ(x) = αx 2 + βx + γ. Προτείνεται να διδαχθεί

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 12/10/2017

Διαβάστε περισσότερα

Σκοπός. Εργαστήριο 6 Εντολές Επανάληψης

Σκοπός. Εργαστήριο 6 Εντολές Επανάληψης Εργαστήριο 6 Εντολές Επανάληψης Η δομή Επιλογής στη PASCAL H δομή Επανάληψης στη PASCAL. Ρεύμα Εισόδου / Εξόδου.. Ρεύμα Εισόδου / Εξόδου. To πρόγραμμα γραφικών gnuplot. Γραφικά στη PASCAL. Σκοπός 6.1 ΕΠΙΔΙΩΞΗ

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού

Πληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού Πληροφοριακά Συστήματα Διοίκησης Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού Σημασία μοντέλου Το μοντέλο δημιουργεί μια λογική δομή μέσω της οποίας αποκτούμε μια χρήσιμη άποψη

Διαβάστε περισσότερα

Περίληψη ιπλωµατικής Εργασίας

Περίληψη ιπλωµατικής Εργασίας Περίληψη ιπλωµατικής Εργασίας Θέµα: Εναλλακτικές Τεχνικές Εντοπισµού Θέσης Όνοµα: Κατερίνα Σπόντου Επιβλέπων: Ιωάννης Βασιλείου Συν-επιβλέπων: Σπύρος Αθανασίου 1. Αντικείµενο της διπλωµατικής Ο εντοπισµός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 7 Ιανουαρίου 2005 ιάρκεια εξέτασης: 5:00-8:00 Έστω ότι

Διαβάστε περισσότερα

Υπολογιστικό Πρόβληµα

Υπολογιστικό Πρόβληµα Υπολογιστικό Πρόβληµα Μετασχηµατισµός δεδοµένων εισόδου σε δεδοµένα εξόδου. Δοµή δεδοµένων εισόδου (έγκυρο στιγµιότυπο). Δοµή και ιδιότητες δεδοµένων εξόδου (απάντηση ή λύση). Τυπικά: διµελής σχέση στις

Διαβάστε περισσότερα

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ Αναγνώριση Προτύπων - Νευρωνικά ίκτυα ρ. Χαράλαµπος Π. Στρουθόπουλος Αναπληρωτής Καθηγητής

Διαβάστε περισσότερα

Browsers. Λειτουργικότητα και Παραμετροποίηση

Browsers. Λειτουργικότητα και Παραμετροποίηση Browsers Λειτουργικότητα και Παραμετροποίηση 1 Πίνακας περιεχομένων Γενική περιγραφή... 3 Γενικά... 3 Ποιο αναλυτικά τα μέρη ενός browser... 4 Φίλτρα αναζήτησης... 4 Σενάρια αναζήτησης... 4 Όψεις εμφάνισης

Διαβάστε περισσότερα

Επιµέλεια Θοδωρής Πιερράτος

Επιµέλεια Θοδωρής Πιερράτος Εισαγωγή στον προγραµµατισµό Η έννοια του προγράµµατος Ο προγραµµατισµός ασχολείται µε τη δηµιουργία του προγράµµατος, δηλαδή του συνόλου εντολών που πρέπει να δοθούν στον υπολογιστή ώστε να υλοποιηθεί

Διαβάστε περισσότερα

1. ** α) Αν η f είναι δυο φορές παραγωγίσιµη συνάρτηση, να αποδείξετε ότι. β α. = [f (x) ηµx] - [f (x) συνx] β α. ( )

1. ** α) Αν η f είναι δυο φορές παραγωγίσιµη συνάρτηση, να αποδείξετε ότι. β α. = [f (x) ηµx] - [f (x) συνx] β α. ( ) Ερωτήσεις ανάπτυξης. ** α) Αν η f είναι δυο φορές παραγωγίσιµη συνάρτηση, να αποδείξετε ότι β ( f () f () ) + α ηµ d β α = [f () ηµ] - [f () συν] β α. ( ) β) Αν f () = ηµ, να αποδείξετε ότι f () + f ()

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2010-2011 ΑΣΚΗΣΗ Συγκομιδή και δεικτοδότηση ιστοσελίδων Σκοπός της άσκησης είναι η υλοποίηση ενός ολοκληρωμένου συστήματος συγκομιδής και δεικτοδότησης ιστοσελίδων.

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Ενότητα 8. Οργάνωση Ελεγκτικής ιαδικασίας

Ενότητα 8. Οργάνωση Ελεγκτικής ιαδικασίας Ενότητα 8 Οργάνωση Ελεγκτικής ιαδικασίας Σχέση Εσωτερικού Εξωτερικού Ελέγχου Εσωτερικός Έλεγχος Εξωτερικός Έλεγχος Φύση Σχέσης Εργασιακής Υπάλληλος της οικονοµικής µονάδας Σκοπός Σκοπεύει στην εκτίµηση

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο Επιλέξτε μία σωστή απάντηση σε κάθε ένα από τα παρακάτω ερωτήματα. 1) Η χρήση απόλυτων δεσμεύσεων για τη συνόρθωση ενός τοπογραφικού

Διαβάστε περισσότερα

Μηχανική ΙI. Λογισµός των µεταβολών. Τµήµα Π. Ιωάννου & Θ. Αποστολάτου 2/2000

Μηχανική ΙI. Λογισµός των µεταβολών. Τµήµα Π. Ιωάννου & Θ. Αποστολάτου 2/2000 Τµήµα Π Ιωάννου & Θ Αποστολάτου 2/2000 Μηχανική ΙI Λογισµός των µεταβολών Προκειµένου να αντιµετωπίσουµε προβλήµατα µεγιστοποίησης (ελαχιστοποίησης) όπως τα παραπάνω, όπου η ποσότητα που θέλουµε να µεγιστοποιήσουµε

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (# 252) Ε ΕΞΑΜΗΝΟ 9 η ΕΙΣΗΓΗΣΗ ΣΗΜΕΙΩΣΕΙΣ ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΛΙΓΗ ΘΕΩΡΙΑ Στην προηγούμενη διάλεξη μάθαμε ότι υπάρχουν διάφορες μορφές έρευνας

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Το Επενδυτικό σχέδιο 3. Βασικές έννοιες και ορισµοί

Το Επενδυτικό σχέδιο 3. Βασικές έννοιες και ορισµοί ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΤΕΧΝΟΛΟΓΙΚΗ ΟΙΚΟΝΟΜΙΚΗ I Διδάσκων: Δρ. Κ. Αραβώσης Το Επενδυτικό σχέδιο 3. Βασικές έννοιες

Διαβάστε περισσότερα

Σε αυτό το µάθηµα θα ασχοληθούµε µε τη βελτίωση της εµφάνισης ενός ιστοτόπου, αλλά και τον εύκολο χειρισµό όλων των αλλαγών στην εµφάνιση της σελίδας

Σε αυτό το µάθηµα θα ασχοληθούµε µε τη βελτίωση της εµφάνισης ενός ιστοτόπου, αλλά και τον εύκολο χειρισµό όλων των αλλαγών στην εµφάνιση της σελίδας Σε αυτό το µάθηµα θα ασχοληθούµε µε τη βελτίωση της εµφάνισης ενός ιστοτόπου, αλλά και τον εύκολο χειρισµό όλων των αλλαγών στην εµφάνιση της σελίδας µέσω της τεχνολογίας των ιαδοχικών Φύλλων Στυλ (cascading

Διαβάστε περισσότερα

Παρεµβολή και Προσέγγιση Συναρτήσεων

Παρεµβολή και Προσέγγιση Συναρτήσεων Κεφάλαιο 4 Παρεµβολή και Προσέγγιση Συναρτήσεων 41 Παρεµβολή µε πολυώνυµο Lagrage Εστω ότι γνωρίζουµε τις τιµές µιας συνάρτησης f (x), f 0, f 1,, f ν σε σηµεία x 0, x 1,, x ν, και Ϲητάµε να υπολογίσουµε

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Τεχνικές Προβλέψεων. 3η Ενότητα

Τεχνικές Προβλέψεων. 3η Ενότητα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα http://www.fsu.gr - lesson@fsu.gr

Διαβάστε περισσότερα

Εισαγωγικά για την αναγνώριση έκφρασης προσώπου (Facial Expression Recognition)

Εισαγωγικά για την αναγνώριση έκφρασης προσώπου (Facial Expression Recognition) Ο στόχος της διπλωματικής είναι η αναγνώριση του συναισθήματος ενός συγκεκριμένου ανθρώπου από μια αλληλουχία εικόνων στις οποίες παίρνει διάφορες εκφράσεις. Αυτό θα γίνει κάνοντας χρήση τεχνικών βαθιάς

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 6 ΟΥ ΚΕΦΑΛΑΙΟΥ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ 6.1 Τι ονοµάζουµε πρόγραµµα υπολογιστή; Ένα πρόγραµµα

Διαβάστε περισσότερα

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη.

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. 4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. Η μετατροπή μιας εντολής επανάληψης σε μία άλλη ή στις άλλες δύο εντολές επανάληψης, αποτελεί ένα θέμα που αρκετές φορές έχει εξεταστεί σε πανελλαδικό

Διαβάστε περισσότερα