ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ"

Transcript

1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Αναγνώριση και Κατάταξη Ονοµάτων Προσώπων, Οργανισµών και Τοποθεσιών σε Ελληνικά Κείµενα µε Χρήση Μηχανών ιανυσµάτων Υποστήριξης» Ιωάννης Κώνστας Επιβλέπων: Ίων Ανδρουτσόπουλος ΑΘΗΝΑ, ΑΥΓΟΥΣΤΟΣ 2007

2 Περίληψη Στην παρούσα εργασία αναπτύχθηκε ένα σύστηµα Αναγνώρισης και Κατάταξης Ονοµάτων Οντοτήτων για ελληνικά κείµενα που αποτελεί επέκταση προηγούµενων συστηµάτων. Το εν λόγω σύστηµα αναγνωρίζει και κατατάσσει ονόµατα προσώπων, οργανισµών και τοποθεσιών µε τη χρήση τριών ανεξάρτητων Μηχανών ιανυσµάτων Υποστήριξης. ιεξήχθησαν πειράµατα τόσο παθητικής όσο και ενεργητικής µάθησης. Στην περίπτωση της ενεργητικής µάθησης, µελετήθηκαν δυο διαφορετικές µέθοδοι επιλογής παραδειγµάτων προς επισηµείωση από τον άνθρωπο-εκπαιδευτή. Η εκπαίδευση και ο έλεγχος του συστήµατος έγιναν σε µια συλλογή κειµένων του ελληνικού ηµερήσιου τύπου. Τα αποτελέσµατα έδειξαν ότι εν γένει η ενεργητική µάθηση αποφέρει καλύτερα αποτελέσµατα από την παθητική και ότι η κατηγορία των τοποθεσιών χρειάζεται ενδεχοµένως ξεχωριστή µελλοντική έρευνα. 2

3 Ευχαριστίες Θα ήθελα να ευχαριστήσω τον Επίκουρο Καθηγητή του Τµήµατος Πληροφορικής του Οικονοµικού Πανεπιστηµίου Αθηνών κ. Ίωνα Ανδρουτσόπουλο για την καθοδήγησή του σε όλη τη διάρκεια της παρούσας πτυχιακής εργασίας. Επίσης θα ήθελα να ευχαριστήσω τον υποψήφιο διδάκτορα του ιδίου τµήµατος κ. Γεώργιο Λουκαρέλλι για τη συµµετοχή του στην επίβλεψη της εργασίας και ιδιαίτερα για τη βοήθειά του στο ξεκίνηµα της εργασίας. Τέλος, θα ήθελα να ευχαριστήσω θερµά τον τελειόφοιτο του Τµήµατος Πληροφορικής του Ο.Π.Α. και φίλο κ. Ξενοφώντα Βασιλάκο για την πολύτιµη αρωγή του, τις χρήσιµες συµβουλές του και κυρίως για το χρόνο που διέθεσε σε όλες τις φάσεις της εργασίας αυτής. 3

4 Περιεχόµενα 1. Εισαγωγή Αναγνώριση και Κατάταξη Ονοµάτων Οντοτήτων Επεκτάσεις προηγούµενων συστηµάτων Τι θα ακολουθήσει Περιγραφή Συστήµατος Μηχανές ιανυσµάτων Υποστήριξης Μέτρα Αξιολόγησης Αρχιτεκτονική Συστήµατος Ιδιότητες ιανυσµάτων Πειράµατα Συλλογές κειµένων εκπαίδευσης και ελέγχου Συντονισµός Παραµέτρων και Επιλογή Ιδιοτήτων Παθητική Μάθηση Ενεργητική Μάθηση Κλασική µέθοδος επιλογής παραδειγµάτων Επιγραµµική µέθοδος επιλογής παραδειγµάτων Πειραµατικά Αποτελέσµατα Αποτελέσµατα Ακρίβειας Αποτελέσµατα Ανάκλησης Αποτελέσµατα F-measure Μη επικαλυπτόµενες κατηγορίες ονοµάτων Χρονικά ιαγράµµατα Ενεργητικής Μάθησης Συµπεράσµατα και Μελλοντικές Επεκτάσεις Βιβλιογραφικές Αναφορές

5 1. Εισαγωγή 1.1 Αναγνώριση και Κατάταξη Ονοµάτων Οντοτήτων Η Αναγνώριση και Κατάταξη Ονοµάτων Οντοτήτων (Named-Entity Recognition and Categorization NERC) αποσκοπεί στον εντοπισµό ονοµάτων οντοτήτων συγκεκριµένων ειδών σε κείµενα φυσικής γλώσσας. Για παράδειγµα, ένα σύστηµα NERC ενδέχεται να έχει εκπαιδευθεί ώστε να εντοπίζει ονόµατα προσώπων, οργανισµών, τοποθεσιών, ηµεροµηνίες κ.ά. σε κείµενα εφηµερίδων ή σε επιστηµονικά άρθρα. Άλλο σύστηµα NERC ενδέχεται να έχει εκπαιδευθεί ώστε να εντοπίζει ονόµατα πρωτεϊνών σε ιατρικά κείµενα κ.ο.κ. Η λειτουργία της αναγνώρισης και κατάταξης ονοµάτων οντοτήτων αποτελεί απαραίτητο στάδιο προεπεξεργασίας πολλών συστηµάτων επεξεργασίας φυσικής γλώσσας, όπως συστήµατα ανάκτησης πληροφοριών ή συστήµατα ερωταποκρίσεων. Σηµαντική έρευνα έχει πραγµατοποιηθεί σε αυτό τον τοµέα κυρίως σε κείµενα αγγλικής γλώσσας [7]. Στην παρούσα εργασία παρουσιάζουµε ένα ελεύθερα διαθέσιµο σύστηµα Αναγνώρισης και Κατάταξης Ονοµάτων Οντοτήτων για ελληνικά κείµενα, το οποίο εντοπίζει ονόµατα προσώπων, οργανισµών, τοποθεσιών, καθώς επίσης και χρονικές εκφράσεις. Το σύστηµα χρησιµοποιεί Μηχανές ιανυσµάτων Υποστήριξης (Μ Υ, Support Vector Machines, SVMs) για την αναγνώριση ονοµάτων και ηµι-αυτόµατα παραγόµενα πρότυπα για την αναγνώριση χρονικών εκφράσεων. 1.2 Επεκτάσεις προηγούµενων συστηµάτων Η συγκεκριµένη εργασία αποτελεί επέκταση του ελεύθερα διαθέσιµου συστήµατος NERC για ελληνικά κείµενα του Ξενοφώντα Βασιλάκου [3, 4], το οποίο µε τη σειρά του αποτέλεσε επέκταση του συστήµατος του Γεώργιου Λουκαρέλλι [1, 2]. Το σύστηµα του Λουκαρέλλι αναγνώριζε µόνο ονόµατα προσώπων και χρονικές εκφράσεις. Οι χρονικές εκφράσεις αναγνωρίζονταν µε ηµι-αυτόµατα παραγόµενα πρότυπα κανονικών εκφράσεων (regular expression patterns). Τα ονόµατα προσώπων αναγνωρίζονταν µε δύο ξεχωριστές σαρώσεις των κειµένων, µε τη χρήση δύο Μ Υ, µιας για κάθε σάρωση. Κάθε Μ Υ εκπαιδευόταν να διαχωρίζει λεκτικές µονάδες που αποτελούν (θετική κατηγορία) µέρη ονοµάτων προσώπων από λεκτικές µονάδες που δεν αποτελούν (αρνητική κατηγορία) µέρη ονοµάτων προσώπων. Η Μ Υ της δεύτερης σάρωσης λάµβανε υπόψη της τα αποτελέσµατα της πρώτης, κάτι που µεταξύ άλλων της επέτρεπε να αναγνωρίζει επανεµφανίσεις των ονοµάτων προσώπων που είχε εντοπίσει η πρώτη σάρωση, αλλά µε λιγότερο ενδεικτικά συµφραζόµενα (π.χ. «Κωνσταντίνου» αντί «ο κ. Κωνσταντίνου»). Το σύστηµα του Βασιλάκου µπορούσε επιπλέον να αναγνωρίσει ονόµατα οργανισµών. Χρησιµοποιούσε επίσης περισσότερες ιδιότητες (attributes) στις Μ Υ κατά την αναγνώριση των ονοµάτων προσώπων. Για τον εντοπισµό των χρονικών εκφράσεων διατηρήθηκαν τα ηµι-αυτόµατα παραγόµενα πρότυπα του Λουκαρέλλι, ενώ για τον εντοπισµό και την κατάταξη των ονοµάτων οργανισµών προστέθηκαν δύο ακόµη Μ Υ, µία για κάθε σάρωση, οδηγώντας σε ένα σύστηµα µε συνολικά τέσσερις Μ Υ. Η εκπαίδευση των δύο Μ Υ (ονοµάτων προσώπων και οργανισµών) 5

6 κάθε σταδίου σάρωσης γινόταν παράλληλα, δηλαδή και οι δύο Μ Υ εκπαιδεύονταν στα ίδια παραδείγµατα εκπαίδευσης. Επίσης, κατά τη χρήση του συστήµατος, αν και οι δύο Μ Υ ενός σταδίου σάρωσης θεωρούσαν ότι µια λεκτική µονάδα ανήκει στη θετική τους κατηγορία (όνοµα προσώπου και οργανισµού µαζί), η λεκτική µονάδα κατατασσόταν στην κατηγορία ονοµάτων της Μ Υ µε το µεγαλύτερο βαθµό βεβαιότητας (π.χ. µόνο όνοµα προσώπου, αν η Μ Υ των ονοµάτων προσώπων είχε επιστρέψει µεγαλύτερο βαθµό βεβαιότητας). Εποµένως, κάθε λεκτική µονάδα κατατασσόταν το πολύ σε µία κατηγορία. Και τα δύο προηγούµενα συστήµατα υποστήριζαν τόσο παθητική µάθηση (PL, passive learning) όσο και ενεργητική µάθηση (AL, active learning) κατά την εκπαίδευση των Μ Υ. Στην παθητική µάθηση, η εκπαίδευση γίνεται σε ένα σύνολο κειµένων στα οποία έχουν επισηµειωθεί χειρωνακτικά οι κατηγορίες όλων των λεκτικών µονάδων. Στην ενεργητική µάθηση, αντίθετα, το ίδιο το σύστηµα προτείνει στον άνθρωπο-εκπαιδευτή ποιες λεκτικές µονάδες των κειµένων εκπαίδευσης να επισηµειώσει, χωρίς να απαιτείται η επισηµείωση όλων των λεκτικών µονάδων. Προηγούµενα πειράµατα δείχνουν ότι η ενεργητική µάθηση µπορεί να οδηγήσει στις ίδιες ή και καλύτερες επιδόσεις, σε σχέση µε την παθητική µάθηση, µε λιγότερα παραδείγµατα εκπαίδευσης, γεγονός που συνεπάγεται, µεταξύ άλλων, λιγότερη χειρωνακτική δουλειά κατά την εκπαίδευση. Το σύστηµα της παρούσας εργασίας προσθέτει κυρίως τη δυνατότητα αναγνώρισης ονοµάτων τοποθεσιών. Λόγω περιορισµένου χρόνου, το σύστηµα αναπτύχθηκε ώστε να χρησιµοποιεί µία µόνο σάρωση, αλλά είναι δυνατόν στο µέλλον να επεκταθεί, ώστε να χρησιµοποιεί δύο σαρώσεις όπως τα προηγούµενα συστήµατα. Το νέο σύστηµα διατηρεί αµετάβλητη τη µέθοδο αναγνώρισης χρονικών εκφράσεων του Λουκαρέλλι, αλλά προσθέτει µία ακόµα Μ Υ, για την κατηγορία των τοποθεσιών. Συνολικά πλέον έχουµε τρεις Μ Υ, µία για κάθε κατηγορία ονοµάτων (πρόσωπα, οργανισµοί, τοποθεσίες) για µία µόνο σάρωση. Κάθε Μ Υ εκπαιδεύεται πλέον ξεχωριστά από τις υπόλοιπες (διαφορετικά παραδείγµατα εκπαίδευσης αλλά και ξεχωριστές ιδιότητες), κάτι που κάνει ευκολότερη τη µελλοντική υποστήριξη νέων κατηγοριών ονοµάτων. Επιπλέον, υποστηρίζεται η κατάταξη ενός ονόµατος σε παραπάνω από µία κατηγορίες (π.χ. σε ορισµένες περιπτώσεις «η Βουλή» µπορεί να αποτελεί ταυτόχρονα όνοµα οργανισµού και τοποθεσία). ιερευνήθηκε επίσης η χρήση µίας καινούριας επιγραµµικής (online) µεθόδου επιλογής διανυσµάτων προς επισηµείωση κατά την ενεργητική µάθηση. Η εκπαίδευση του νέου συστήµατος έγινε σε κείµενα του ελληνικού ηµερήσιου τύπου µε θεµατολογία που περιελάµβανε πολιτικές και οικονοµικές ειδήσεις, εικαστικά και αθλητικά. Σε γενικές γραµµές, η ενεργητική µάθηση απέφερε υψηλότερες επιδόσεις από την παθητική, γεγονός που επιβεβαιώνει το αντίστοιχο συµπέρασµα των Λουκαρέλλι και Βασιλάκου. Ακόµα, τα αποτελέσµατα των πειραµάτων επιβεβαίωσαν την παρατήρηση του Βασιλάκου ότι τα ονόµατα των οργανισµών είναι δυσκολότερο να εντοπισθούν από εκείνα των προσώπων. Τα αποτελέσµατα δείχνουν, επίσης, ότι η κατηγορία των ονοµάτων τοποθεσιών είναι η δυσκολότερη των τριών. 6

7 1.3 Τι θα ακολουθήσει Κεφάλαιο 2: Περιγραφή συστήµατος Σε αυτό το κεφάλαιο θα δοθούν ορισµοί για τις Μ Υ και τα χρησιµοποιούµενα µέτρα αξιολόγησης. Θα περιγραφεί, επίσης, συνοπτικά η αρχιτεκτονική του συστήµατος. Στη συνέχεια, θα παρουσιαστούν οι δύο βασικές διαφοροποιήσεις από το σύστηµα του Βασιλάκου: η απεµπλοκή των κατηγοριών των προσώπων και των οργανισµών και η προσθήκη της κατηγορίας των τοποθεσιών. Θα ακολουθήσει παράθεση και αξιολόγηση των ιδιοτήτων κάθε Μ Υ. Κεφάλαιο 3: Πειράµατα Στο κεφάλαιο αυτό παρέχονται αρχικά πληροφορίες για τις συλλογές κειµένων που χρησιµοποιήθηκαν κατά την εκπαίδευση και την αξιολόγηση του συστήµατος. Έπειτα, περιγράφεται η διεξαγωγή των πειραµάτων µε τις διάφορες µεθόδους που µελετήθηκαν και παρατίθενται τα διαγράµµατα των αποτελεσµάτων µαζί µε σχόλια και παρατηρήσεις. Κεφάλαιο 4: Συµπεράσµατα και µελλοντικές επεκτάσεις Σε αυτό το κεφάλαιο συνοψίζονται τα αποτελέσµατα της εργασίας και προτείνονται µελλοντικές βελτιώσεις του συστήµατος. 7

8 2. Περιγραφή Συστήµατος 2.1 Μηχανές ιανυσµάτων Υποστήριξης Οι Μηχανές ιανυσµάτων Υποστήριξης είναι µία µέθοδος επιβλεπόµενης (supervised) µηχανικής µάθησης. Στην απλούστερη µορφή τους, υποστηρίζουν µόνο δύο κατηγορίες (θετική και αρνητική). Στην περίπτωσή µας, όπου τα αντικείµενα προς κατάταξη είναι λεκτικές µονάδες (tokens) και κάθε Μ Υ αντιστοιχεί σε µια κατηγορία ονοµάτων (προσώπων, οργανισµών ή τοποθεσιών), η θετική κατηγορία κάθε Μ Υ αντιστοιχεί σε λεκτικές µονάδες που ανήκουν στην κατηγορία ονοµάτων για την οποία χρησιµοποιείται η Μ Υ, ενώ η αρνητική κατηγορία περιλαµβάνει όλες τις υπόλοιπες λεκτικές µονάδες. Η κάθε λεκτική µονάδα αναπαρίσταται εσωτερικά µε ένα διάνυσµα ιδιοτήτων που παρέχει πληροφορίες για την ίδια τη λεκτική µονάδα (π.χ. αν αρχίζει µε κεφαλαίο γράµµα ή όχι, αν περιλαµβάνεται ή όχι σε λίστα γνωστών κύριων ονοµάτων) και τα συµφραζόµενά της (π.χ. γειτονικές λεκτικές µονάδες). Συνοπτικά, η λειτουργία των Μ Υ είναι να προβάλλουν τα διανύσµατα ιδιοτήτων των παραδειγµάτων εκπαίδευσης σε ένα χώρο περισσότερων διαστάσεων και στη συνέχεια να βρίσκουν ένα γραµµικό διαχωριστή (εν γένει ένα υπερ-επίπεδο), που να τα διαχωρίζει στις δυο κατηγορίες (θετική και αρνητική). Μετά την εκπαίδευση, η κατάταξη νέων αντικειµένων γίνεται προβάλλοντάς τα στο χώρο περισσότερων διαστάσεων και υπολογίζοντας σε ποια πλευρά του γραµµικού διαχωριστή βρίσκονται. Η προβολή των διανυσµάτων σε χώρο περισσότερων διαστάσεων αυξάνει την πιθανότητα οι δύο κατηγορίες να είναι γραµµικά διαχωρίσιµες. Λεπτοµερέστερη εισαγωγή στις Μ Υ γίνεται από τον Λουκαρέλλι [1] και από τους Cristianini και Shawe-Taylor [5]. 2.2 Μέτρα αξιολόγησης Η ακρίβεια (Precision) µίας κατηγορίας ονοµάτων είναι ο λόγος των λεκτικών µονάδων που κατετάγησαν ορθά στην κατηγορία (True Positive) προς το σύνολο των λεκτικών µονάδων που κατετάγησαν σε αυτήν είτε ορθά είτε λανθασµένα (True Positive + False Positive). Precision True Positive True Positive + False Positive = (2.1) Η ανάκληση (Recall) µίας κατηγορίας ονοµάτων είναι ο λόγος των λεκτικών µονάδων που κατετάγησαν ορθά στην κατηγορία (True Positive) προς το σύνολο των λεκτικών µονάδων της κατηγορίας που υπάρχουν στην πραγµατικότητα στα κείµενα ελέγχου, δηλαδή προς το σύνολο των λεκτικών µονάδων που κατετάγησαν σωστά στην κατηγορία και των λεκτικών µονάδων που λανθασµένα δεν κατετάγησαν στην κατηγορία (True Positive + False Negative) 8

9 True Positive Recall = True Positive + False Negative (2.2) To F-measure είναι ένας συνδυασµός της ακρίβειας και της ανάκλησης. Ο γενικός τύπος είναι: F-measure = 2 ( b + 1) Precision Recall b 2 Precison+Recall (2.3) Στην παρούσα εργασία, όπου γίνεται στο εξής αναφορά στο F-measure θα εννοούµε τον τύπο του F 1, που δίνει ίση βαρύτητα στην ακρίβεια και την ανάκληση: F 1 2 Precision Recall Precision + Recall = (2.4) Για την επιλογή των διανυσµάτων προς επισηµείωση στην ενεργητική µάθηση, χρησιµοποιήθηκε το µέτρο του Πληροφοριακού Οφέλους (Informativeness). Το Πληροφοριακό Όφελος ενός διανύσµατος εκπαίδευσης ουσιαστικά είναι µια ένδειξη της βεβαιότητας της Μ Υ για την κατηγορία (θετική ή αρνητική) του διανύσµατος. Προηγούµενες εργασίες (π.χ. [4, 6]) δείχνουν ότι είναι επωφελές να επιλέγονται παραδείγµατα εκπαίδευσης για την κατηγορία των οποίων είναι περισσότερο αβέβαιη η Μ Υ. Informativeness = 1 hyp u ( u) Dist( SVM, ) Dist SVM P u P u ( hyp, u) = pos( ) neg( ) Στους παραπάνω τύπους, Ppos ( u ) και Pneg ( ) (2.5) (2.6) u είναι εκτιµήσεις των πιθανοτήτων το διάνυσµα u να είναι θετικό ή αρνητικό αντίστοιχα. 1 Εναλλακτικά, θα µπορούσε το πληροφοριακό όφελος να υπολογισθεί κατευθείαν ως η απόσταση του διανύσµατος u από το υπερεπίπεδο διαχωρισµού της Μ Υ. 2 Οι παραπάνω τύποι, που χρησιµοποιούν εκτιµήσεις των πιθανοτήτων ( ) pos P u και P ( ) neg u, είχαν χρησιµοποιηθεί τόσο στην εργασία του Λουκαρέλλι [1] όσο και στην εργασία του Βασιλάκου [3]. Για την επιλογή των ιδιοτήτων των διανυσµάτων κάθε µίας Μ Υ χρησιµοποιήθηκε το µέτρο του Πληροφοριακού Κέρδους (Information Gain), όπως ορίζεται, µεταξύ άλλων, στις προηγούµενες εργασίες [1, 3]. Συνοπτικά, το 1 Η υλοποίηση Μ Υ που χρησιµοποιήθηκε έχει τη δυνατότητα να επιστρέφει εκτιµήσεις αυτού του είδους, οι οποίες συνήθως παράγονται προσαρµόζοντας µια σιγµοειδή συνάρτηση στις αποστάσεις των διανυσµάτων από το υπερ-επίπεδο της Μ Υ. Οι παράµετροι της σιγµοειδούς είναι δυνατόν να επιλεγούν µέσω διασταυρωµένης επικύρωσης (cross-validation) κατά την εκπαίδευση. 2 Χρησιµοποιώντας απλώς την απόσταση από το υπερ-επίπεδο διαχωρισµού, θα αποφεύγαµε τα σφάλµατα και την επιπλέον καθυστέρηση κατά την εκπαίδευση (λόγω της απαιτούµενης διασταυρωµένης επικύρωσης) που εισάγει η εκτίµηση των πιθανοτήτων. Θα ήταν σκόπιµο να δοκιµασθεί αυτή η µέθοδος υπολογισµού του πληροφοριακού οφέλους σε µελλοντική εργασία. 9

10 πληροφοριακό κέρδος µιας ιδιότητας είναι η αναµενόµενη µείωση της εντροπίας της τυχαίας µεταβλητής της κατηγορίας (στην περίπτωσή µας, θετική ή αρνητική), που προκαλείται όταν γίνει γνωστή η τιµή της ιδιότητας. Ιδιότητες µε µεγάλο πληροφοριακό κέρδος είναι γενικά πιο χρήσιµες. 10

11 2.3 Αρχιτεκτονική Συστήµατος Το σύστηµα της παρούσας εργασίας αποτελείται από 6 διαφορετικές µονάδες, όπως φαίνεται και στο σχήµα 2.1. Αναγνώριση Ονοµάτων Προσώπων Κείµενο ιαχωριστής Λεκτικών Μονάδων Λεκτικές Μονάδες ιαχωριστής Περιόδων Αναγνώριση Χρονικών Εκφράσεων Αναγνώριση Ονοµάτων Οργανισµών Αναγνώριση Ονοµάτων Τοποθεσιών Σχήµα 2.1 Κάθε κείµενο (εκπαίδευσης ή αξιολόγησης) περνάει πρώτα από το ιαχωριστή Λεκτικών Μονάδων, ο οποίος το διασπά σε λεκτικές µονάδες (tokens), αποθηκεύοντας αυτές σε µία λίστα. Ως λεκτική µονάδα θεωρούµε κάθε ακολουθία ελληνικών, λατινικών ή αριθµητικών χαρακτήρων. Οποιοσδήποτε άλλος µη κενός χαρακτήρας αποτελεί λεκτική µονάδα από µόνος του. Παραδείγµατος χάριν τα αποσιωπητικά («...») θεωρούνται τρεις λεκτικές µονάδες. Στη συνέχεια το κείµενο περνάει από το ιαχωριστή Περιόδων και τη µονάδα Αναγνώρισης Χρονικών Εκφράσεων. Επειδή και οι δύο µονάδες επιδρούν µόνο στο αποτέλεσµα του ιαχωριστή Λεκτικών Μονάδων, δεν έχει σηµασία η σειρά εκτέλεσής τους. Ο ιαχωριστής Περιόδων, που χρησιµοποιεί µια δική του Μ Υ, εντοπίζει τα τέλη των περιόδων διαχωρίζοντας τις τελείες που σηµατοδοτούν τέλη περιόδων από τελείες που σηµατοδοτούν συντοµογραφίες (π.χ. «κ. Σηµίτης») ή που έχουν άλλες χρήσεις (π.χ. διαχωριστικά ηµεροµηνιών κλπ.). Φυσικά είναι δυνατόν κάποιες περίοδοι να µην τελειώνουν µε τελείες (π.χ. να τελειώνουν µε ερωτηµατικά), αλλά αυτές οι περιπτώσεις είναι πολύ σπάνιες στα κείµενα ειδήσεων µε τα οποία κυρίως ασχολούµαστε και δεν επηρεάζουν σηµαντικά τις επιδόσεις του συνολικού συστήµατος, όπως εξηγείται στην εργασία του Λουκαρέλλι [1]. Η µονάδα Αναγνώρισης Χρονικών Εκφράσεων εντοπίζει χρονικές εκφράσεις χρησιµοποιώντας ηµι-αυτόµατα παραγόµενα πρότυπα κανονικών εκφράσεων. Ο ιαχωριστής Λεκτικών Μονάδων, ο ιαχωριστής Περιόδων και η µονάδα Αναγνώρισης Χρονικών εκφράσεων λειτουργούν ακριβώς όπως στο σύστηµα του Λουκαρέλλι [1] και δεν περιγράφονται περαιτέρω στην παρούσα εργασία. 11

12 Τέλος, η λίστα των λεκτικών µονάδων, στην οποία έχουν προστεθεί πληροφορίες για τα τέλη των περιόδων και τις χρονικές εκφράσεις, περνάει από τις µονάδες Αναγνώρισης Ονοµάτων Προσώπων, Οργανισµών και Τοποθεσιών. Και πάλι δεν είναι απαραίτητο η εκτέλεση των τριών αυτών µονάδων να γίνει µε συγκεκριµένη σειρά, καθώς οι τρεις µονάδες είναι εντελώς ανεξάρτητες µεταξύ τους. Είναι, επίσης, δυνατόν να παραληφθεί η εκτέλεση κάποιων από τις τρεις αυτές µονάδες, αν δεν µας ενδιαφέρει η αναγνώριση των ονοµάτων των αντιστοίχων κατηγοριών. Η λειτουργία των µονάδων Αναγνώρισης Ονοµάτων Προσώπων και Οργανισµών είναι πολύ παρόµοια µε τη λειτουργία των αντιστοίχων µονάδων των εργασιών των Λουκαρέλλι και Βασιλάκου [1, 3]. Ως εκ τούτου, οι δύο αυτές µονάδες περιγράφονται πολύ περιληπτικά στην παρούσα εργασία. Η αναγνώριση ονοµάτων τοποθεσιών γίνεται µε µία ξεχωριστή Μ Υ, όπως ακριβώς στις άλλες δύο κατηγορίες ονοµάτων, αλλά χρησιµοποιώντας διαφορετικές ιδιότητες. 3 Οι ιδιότητες και των τριών Μ Υ παρατίθενται στην επόµενη ενότητα. ύο σηµαντικές διαφορές από τα συστήµατα των προηγούµενων εργασιών είναι πως χρησιµοποιείται µόνο µία σάρωση του κειµένου και οι Μ Υ των µονάδων Αναγνώρισης Ονοµάτων Προσώπων, Οργανισµών και Τοποθεσιών εκπαιδεύονται πλέον εντελώς ανεξάρτητα, µε διαφορετικά εν γένει παραδείγµατα εκπαίδευσης. Επίσης, κάθε µία Μ Υ χρησιµοποιεί µόνο ιδιότητες που σχετίζονται άµεσα µε την αναγνώριση ονοµάτων της κατηγορίας της. Αντίθετα, στις προηγούµενες εργασίες η Μ Υ των ονοµάτων οργανισµών χρησιµοποιούσε, για παράδειγµα, και ιδιότητες που έλεγχαν αν η προς κατάταξη λεκτική µονάδα έχει στα αριστερά της εκφράσεις όπως «κ.» (κύριος), οι οποίες συνοδεύουν συνήθως ονόµατα προσώπων. Αντίστοιχα, η Μ Υ των ονοµάτων προσώπων χρησιµοποιούσε και ιδιότητες που έλεγχαν αν η προς κατάταξη λεκτική µονάδα ακολουθείται από εκφράσεις όπως «Α.Ε.», οι οποίες σηµατοδοτούν συνήθως ονόµατα οργανισµών. Η απεµπλοκή των Μ Υ (ξεχωριστή εκπαίδευση και ξεχωριστές ιδιότητες) έγινε για να είναι ευκολότερη η προσθήκη Μ Υ αναγνώρισης νέων κατηγοριών ονοµάτων στο µέλλον, χωρίς να απαιτείται η επανεκπαίδευση των Μ Υ των υπαρχόντων κατηγοριών ονοµάτων. Η χρήση µιας µόνο σάρωσης έγινε λόγω έλλειψης χρόνου κατά την ανάπτυξη του νέου συστήµατος. Στο µέλλον θα ήταν σκόπιµο να προστεθεί και δεύτερη σάρωση, όπως στις προηγούµενες εργασίες. Μια ακόµη διαφορά από τις προηγούµενες εργασίες είναι πως πλέον είναι δυνατόν µια λεκτική µονάδα να καταταγεί σε περισσότερες από µία κατηγορίες ονοµάτων. Για την ακρίβεια, κάθε λεκτική µονάδα κατατάσσεται στις κατηγορίες ονοµάτων των οποίων οι Μ Υ κατέταξαν τη λεκτική µονάδα στη θετική τους κατηγορία. Εναλλακτικά, ο χρήστης µπορεί να επιλέξει κάθε λεκτική µονάδα να κατατάσσεται σε µία µόνο κατηγορία ονοµάτων, όπως στις προηγούµενες εργασίες. Στην περίπτωση αυτή, αν περισσότερες από µία Μ Υ κατατάξουν µια λεκτική µονάδα στη θετική τους κατηγορία, η λεκτική µονάδα κατατάσσεται στην κατηγορία ονοµάτων που αντιστοιχεί στην Μ Υ που επέστρεψε το µεγαλύτερο βαθµό βεβαιότητας για την απόφασή της. 3 Κατά την αναγνώριση ονοµάτων τοποθεσιών χρησιµοποιούνται, επίσης, «ασφαλείς κανόνες» και λίστες «τετριµµένων λέξεων», αντίστοιχες εκείνων που χρησιµοποιούνταν κατά την αναγνώριση ονοµάτων προσώπων και οργανισµών στις προηγούµενες εργασίες [1, 3]. 12

13 2.4 Ιδιότητες ιανυσµάτων Για τις κατηγορίες των προσώπων και των οργανισµών έχουµε διατηρήσει τις περισσότερες ιδιότητες που είχε χρησιµοποιήσει ο Βασιλάκος στο σύστηµά του. Ωστόσο, από τις ιδιότητες που χρησιµοποιούσε η Μ Υ των προσώπων έχουµε αφαιρέσει 15 ιδιότητες που αναφέρονταν στους οργανισµούς και αντίστοιχα έχουµε αφαιρέσει 28 ιδιότητες που χρησιµοποιούσε η Μ Υ των οργανισµών. Πιο αναλυτικά, από τις 165 ιδιότητες πλέον έχουµε 150 για τα πρόσωπα και για τους οργανισµούς από 170 έχουµε συνολικά 142. Για την κατηγορία των τοποθεσιών χρησιµοποιούµε 133 ιδιότητες για κάθε διάνυσµα. Ακολουθούν πίνακες µε τις ιδιότητες που χρησιµοποιεί η κάθε µία από τις τρεις Μ Υ (ονοµάτων προσώπων, οργανισµών, τοποθεσιών). Συµβολίζουµε µε t 0 τη λεκτική µονάδα που έχουµε να κατατάξουµε, µε t 1 την επόµενή της λεκτική µονάδα, µε t -1 την προηγούµενη κ.ο.κ. Για παράδειγµα, η τρίτη ιδιότητα του πρώτου πίνακα εξετάζει αν η προηγούµενη λεκτική µονάδα είναι κόµµα. Κάθε κελί περιέχει µια κουκίδα, το µέγεθος της οποίας αναπαριστά το Πληροφοριακό Κέρδος της αντίστοιχης ιδιότητας. Όσο µεγαλύτερη είναι η κουκίδα, τόσο µεγαλύτερο είναι και το πληροφοριακό κέρδος της ιδιότητας. Αν στη θέση της κουκίδας υπάρχει το «0», τότε η ιδιότητα αυτή έχει πολύ µικρό πληροφοριακό κέρδος και δε χρησιµοποιείται στο σύστηµα καθόλου (βλ. ενότητα 3.2). Οι ιδιότητες που χρησιµοποιούνταν στις Μ Υ των ονοµάτων προσώπων και οργανισµών εξηγούνται αναλυτικά στις προηγούµενες εργασίες [1, 3]. 13

14 Πίνακας Ιδιότητες της Μ Υ Ονοµάτων Προσώπων Οι ιδιότητες αντιστοιχούν σε λίστες λεκτικών µονάδων που συναντώνται συχνά αµέσως πριν από λεκτικές µονάδες ονοµάτων προσώπων στα δεδοµένα t 1 εκπαίδευσης. Η λίστα P περιέχει λεκτικές µονάδες µήκους ενός ή δύο χαρακτήρων, η λίστα 1 2 t 1 P 3 4 t 1 P 4 περίεχει λεκτικές µονάδες µήκους τριών ή τεσσάρων χαρακτήρων και η λίστα > λεκτικές µονάδες µε µήκος µεγαλύτερο των τεσσάρων χαρκατήρων. Οι ιδιότητες αντιστοιχούν σε παρόµοιες µε τις προηγούµενες τρεις λίστες, αλλά στην περίπτωση αυτή οι λίστες περιλαµβάνουν τις συχνές λεκτικές µονάδες που βρίσκονται σε ένα παράθυρο 7 λεκτικών µονάδων πριν από λεκτικές µονάδες ονοµάτων προσώπων στα δεδοµένα εκπαίδευσης. Περισσότερες 14

15 πληροφορίες για αυτές τις ιδιότητες παρέχονται στις εργασίες των Λουκαρέλλι και Βασιλάκου [1, 3]. Πίνακας Ιδιότητες της Μ Υ Ονοµάτων Οργανισµών Οι ιδιότητες είναι αντίστοιχες των ιδιοτήτων του προηγούµενου πίνακα, αλλά σε αυτή την περίπτωση οι λίστες περιέχουν λεκτικές µονάδες που εµφανίζονται συχνά πριν από ονόµατα οργανισµών. 15

16 Πίνακας Ιδιότητες της Μ Υ Ονοµάτων Τοποθεσιών Οι ιδιότητες είναι αντίστοιχες των ιδιοτήτων του προηγούµενου πίνακα. Παρατηρούµε στον πίνακα ότι οι ιδιότητες για την κατηγορία των τοποθεσιών έχουν πολύ χαµηλότερο Πληροφοριακό Κέρδος από ό,τι οι αντίστοιχες των άλλων κατηγοριών. 16

17 3. Πειράµατα 3.1 Συλλογές κειµένων εκπαίδευσης και ελέγχου Η διεξαγωγή των πειραµάτων έγινε σε κείµενα από τον ηµερήσιο τύπο µε άρθρα από τις εφηµερίδες «Το Βήµα» και «Τα Νέα». Όπως προαναφέρθηκε, η θεµατολογία ποικίλλει από πολιτικές και οικονοµικές ειδήσεις µέχρι εικαστικά, αθλητικά κ.ά. Πιο συγκεκριµένα, χρησιµοποιήθηκαν οι δύο δεξαµενές κειµένων των 400 και 5000 κειµένων αντίστοιχα από την εργασία του Λουκαρέλλι [1]. Η πρώτη δεξαµενή αποτελείται από 200 κείµενα από την εφηµερίδα «Το Βήµα» και 200 κείµενα από την εφηµερίδα «Τα Νέα», µε µέσο µέγεθος άρθρου 6,3 KB και είναι πλήρως επισηµειωµένη ως προς τα ονόµατα προσώπων, οργανισµών και τοποθεσιών. Ωστόσο, ενώ η επισηµείωση του Λουκαρέλλι επέτρεπε σε κάθε λεκτική µονάδα να ανήκει σε µία το πολύ κατηγορία ονοµάτων, πλέον υπάρχει η δυνατότητα µια λεκτική µονάδα να ανήκει σε περισσότερες από µία κατηγορίες ονοµάτων. Ως εκ τούτου, χρειάστηκε να επανεξεταστούν τα κείµενα αυτής της δεξαµενής και να τροποποιηθούν οι επισηµειώσεις τους. Η γενική πολιτική που ακολουθήσαµε ήταν να κατατάσσουµε κάθε λεκτική µονάδα σε µία µόνο κατηγορία, ανάλογα µε τα συµφραζόµενα. Για παράδειγµα, στην πρόταση «χθες συνεδρίασε η Βουλή για την ψήφιση του νέου νόµου για το ασφαλιστικό», η λεκτική µονάδα «Βουλή» επισηµειώθηκε µόνο ως όνοµα οργανισµού, ενώ στην πρόταση «διαδήλωση συνταξιούχων πραγµατοποιήθηκε σήµερα το πρωί µπροστά από τη Βουλή» επισηµειώθηκε µόνο ως όνοµα τοποθεσίας. Επίσης, στην πρόταση «η µετοχή της Παπαδόπουλος Α.Ε. σηµείωσε σήµερα άνοδο 5,6%», η λέξη «Παπαδόπουλος» επισηµειώθηκε ως οργανισµός, παρόλο που αποτελεί σύνηθες όνοµα προσώπου. Σε περιπτώσεις, όµως, που θεωρούσαµε ότι κάποιες λεκτικές µονάδες µπορούσαν να ανήκουν σε περισσότερες από µία κατηγορίες ονοµάτων, τις κατατάσσαµε σε όλες αυτές τις κατηγορίες. Για παράδειγµα στην πρόταση «ακυρώθηκαν 13 πτήσεις σήµερα στο αεροδρόµιο Ελ. Βενιζέλος, προκαλώντας αναστάτωση στους επιβάτες», το «Ελ. Βενιζέλος» επισηµειώθηκε τόσο ως όνοµα τοποθεσίας όσο και ως όνοµα οργανισµού. Για τους σκοπούς των πειραµάτων η πρώτη δεξαµενή χωρίστηκε σε δύο τµήµατα µε 198 και 202 άρθρα αντίστοιχα. Το πρώτο τµήµα χρησιµοποιήθηκε για την εκπαίδευση του συστήµατος κατά την παθητική µάθηση, για το συντονισµό των παραµέτρων (parameter tuning) του συστήµατος, καθώς και για την επιλογή των ιδιοτήτων σύµφωνα µε το πληροφοριακό τους κέρδος. Το δεύτερο τµήµα χρησιµοποιήθηκε για τον έλεγχο του συστήµατος. Η δεύτερη δεξαµενή, των 5000 κειµένων, αποτελείται από µη επισηµειωµένα άρθρα. Από αυτήν επιλέγονταν τα προς επισηµείωση παραδείγµατα εκπαίδευσης της ενεργητικής µάθησης. Παρακάτω θα δοθούν περισσότερες λεπτοµέρειες σχετικά µε τις διάφορες µεθόδους επιλογής παραδειγµάτων ενεργητικής µάθησης που µελετήθηκαν σε αυτή την εργασία. 17

18 3.2 Συντονισµός Παραµέτρων και Επιλογή Ιδιοτήτων Χρησιµοποιήσαµε Μ Υ µε πυρήνα Radial Basis Function, µε αποτέλεσµα να υπάρχουν δύο παράµετροι (C και γ) των οποίων έπρεπε να επιλέξουµε τις τιµές σε κάθε Μ Υ. Η επιλογή αυτών των τιµών (parameter tuning, συντονισµός παραµέτρων) έγινε όπως στις εργασίες των Λουκαρέλλι και Βασιλάκου [1, 3], χρησιµοποιώντας τη µέθοδο αναζήτησης πλέγµατος (grid search) και πενταπλής διασταυρωµένης επικύρωσης (5-fold cross-validation) που παρέχεται από την υλοποίηση LibSVM [8] που χρησιµοποιήσαµε. Κατά το συντονισµό παραµέτρων χρησιµοποιήθηκαν 14 κείµενα από το τµήµα εκπαίδευσης της πρώτης δεξαµενής, από όπου αντλήθηκαν 1115 διανύσµατα για την κατηγορία των προσώπων, 1033 για την κατηγορία των οργανισµών και 969 για την κατηγορία των τοποθεσιών. Τα αποτελέσµατα του συντονισµού για κάθε Μ Υ ήταν τα ακόλουθα: Κατηγορία Παράµετρος C Παράµετρος γ Πρόσωπα Οργανισµοί Τοποθεσίες Πίνακας Παράµετροι Συντονισµού Οι ιδιότητες των Μ Υ προσώπων και οργανισµών διατηρήθηκαν ίδιες όπως στο προηγούµενο σύστηµα του Βασιλάκου, αλλά αφαιρέθηκαν ιδιότητες που δεν ήταν άµεσα σχετικές µε τον εντοπισµό ονοµάτων των αντιστοίχων κατηγοριών (βλ. ενότητα 2.3) Για την επιλογή των ιδιοτήτων της Μ Υ των τοποθεσιών υιοθετήθηκε και πάλι η µέθοδος του προηγούµενου συστήµατος. Εν συντοµία, οι ιδιότητες ταξινοµούνται κατά φθίνουσα σειρά βάσει του πληροφοριακού τους κέρδους και απορρίπτονται οι k χειρότερες. Επιλέγεται η τιµή του k που µεγιστοποιεί το F- measure της Μ Υ σε ένα τµήµα του συνόλου εκπαίδευσης, το οποίο χρησιµοποιείται ως σύνολο επικύρωσης (validation set) και εξαιρείται από την εκπαίδευση της Μ Υ. Για περισσότερες πληροφορίες, συµβουλευτείτε την εργασία του Βασιλάκου [3]. 3.3 Παθητική Μάθηση Τα πειράµατα παθητικής µάθησης (passive learning, PL) πραγµατοποιήθηκαν εξολοκλήρου στα κείµενα της πρώτης δεξαµενής. Έγιναν τρεις ξεχωριστές σειρές πειραµάτων, µία για κάθε κατηγορία ονοµάτων. Σε κάθε σειρά πειραµάτων, επιλεγόταν κάθε φορά τυχαία ένα κείµενο (πλήρως επισηµειωµένο) από το τµήµα εκπαίδευσης της δεξαµενής και εξάγονταν από αυτό τα διανύσµατα των λεκτικών µονάδων που περνούσαν τους ασφαλείς κανόνες και δεν περιλαµβάνονταν στις λίστες τετριµµένων λέξεων. Τα διανύσµατα αυτά προσθέτονταν στα δεδοµένα εκπαίδευσης της Μ Υ. Η Μ Υ επανεκπαιδευόταν στα δεδοµένα εκπαίδευσης και καλείτο να ταξινοµήσει τις λεκτικές µονάδες του τµήµατος ελέγχου της πρώτης δεξαµενής. Σε αυτό το σηµείο υπολογίζονταν η Ακρίβεια, η Ανάκληση και του F-measure της Μ Υ στο τµήµα ελέγχου και η σειρά πειραµάτων προχωρούσε µε την επιλογή ενός νέου κειµένου από το τµήµα εκπαίδευσης, που συνεισέφερε πρόσθετα δεδοµένα εκπαίδευσης. Με τον τρόπο αυτό έγινε δυνατή η κατασκευή καµπυλών µάθησης, που δείχνουν πώς µεταβάλλονται οι επιδόσεις της κάθε Μ Υ όσο συσσωρεύονται περισσότερα δεδοµένα εκπαίδευσης. 18

19 3.4 Ενεργητική Μάθηση Για τη διεξαγωγή των πειραµάτων ενεργητικής µάθησης (active learning, AL) χρησιµοποιήθηκαν και οι δύο δεξαµενές κειµένων. Η επιλογή των διανυσµάτων προς επισηµείωση γινόταν από τα 5000 κείµενα της δεύτερης δεξαµενής, ενώ ο έλεγχος του συστήµατος γινόταν στα 202 κείµενα του τµήµατος ελέγχου της πρώτης δεξαµενής, όπως ακριβώς και στην παθητική µάθηση. Πιο αναλυτικά, µελετήθηκαν δύο διαφορετικές µέθοδοι 4 επιλογής διανυσµάτων προς επισηµείωση, οι οποίες περιγράφονται στις επόµενες ενότητες. Για κάθε µία από τις δύο µεθόδους επιλογής, πραγµατοποιήθηκαν τρεις σειρές πειραµάτων, αντίστοιχες εκείνων της παθητικής µάθησης, δηλαδή µε διαδοχικά περισσότερα παραδείγµατα εκπαίδευσης, µία σειρά πειραµάτων για κάθε κατηγορία ονοµάτων. Προτού ξεκινήσει οποιαδήποτε σειρά πειραµάτων ενεργητικής µάθησης, κάθε Μ Υ εκπαιδεύεται µε παθητική µάθηση στα 14 κείµενα που χρησιµοποιήθηκαν για το συντονισµό τους (βλ. ενότητα 3.2). Στη συνέχεια, σε κάθε βήµα ενεργητικής µάθησης µιας σειράς πειραµάτων, αναζητείται µια δέσµη (batch) των «καλύτερων» παραδειγµάτων προς επισηµείωση από τη δεύτερη δεξαµενή, χρησιµοποιώντας το µέτρο του πληροφοριακού οφέλους. Το µέγεθος της δέσµης ποικίλλει, για λόγους που θα δούµε στις επόµενες ενότητες. Ακολούθως, η δέσµη παραδειγµάτων δίνεται προς επισηµείωση στον άνθρωπο-εκπαιδευτή και τα παραγόµενα διανύσµατα εκπαίδευσης προστίθενται στα υπάρχοντα δεδοµένα εκπαίδευσης 5. Η Μ Υ επανεκπαιδεύεται, αξιολογείται στα δεδοµένα εκπαίδευσης και η σειρά πειραµάτων προχωρά µε την επιλογή µιας νέας δέσµης παραδειγµάτων προς επισηµείωση Κλασική µέθοδος επιλογής παραδειγµάτων Η πρώτη µέθοδος επιλογής παραδειγµάτων προς επισηµείωση, την οποία ονοµάζουµε χάριν συντοµίας «κλασική», είναι ουσιαστικά η ίδια που είχε χρησιµοποιθεί από τους Λουκαρέλλι και Βασιλάκο [1, 3]. Συγκεκριµένα, η δεύτερη δεξαµενή των 5000 κειµένων χωρίζεται σε 5 διαµερίσεις των 1000 κειµένων η κάθε µία. Σε κάθε βήµα µιας σειράς πειραµάτων, όποτε χρειάζεται να επιλεγεί µια νέα δέσµη παραδειγµάτων προς επισηµείωση, το σύστηµα εξετάζει τα κείµενα µιας διαφορετικής (κυκλικά επιλεγόµενης) διαµέρισης, υπολογίζει το πληροφοριακό όφελος κάθε υποψηφίου διανύσµατος εκπαίδευσης της διαµέρισης, ταξινοµεί τα διανύσµατα κατά φθίνουσα σειρά πληροφοριακού οφέλους και επιλέγει ως δέσµη τα διανύσµατα µε το υψηλότερο πληροφοριακό όφελος. Ως µέγεθος δέσµης σε αυτή τη µέθοδο επιλογής επιλέχτηκαν τα 400 διανύσµατα, 4 Σηµειώνεται ότι για τα ονόµατα οργανισµών, πραγµατοποιήθηκε µία επιπλέον σειρά πειραµάτων ενεργητικής µάθησης, όπου η επιλογή των διανυσµάτων γινόταν µε µια τρίτη µέθοδο, η οποία περιγράφεται στην εργασία [9]. Ωστόσο, τα αποτελέσµατα αυτής της σειράς πειραµάτων δεν ήταν ενθαρρυντικά, όπως είχε παρατηρηθεί και στην εργασία του Βασιλάκου, γεγονός που απέτρεψε την περαιτέρω χρήση της τρίτης µεθόδου επιλογής. 5 Στο σηµείο αυτό επανυπολογίζονται οι λίστες των συχνών λέξεων, βάσει και των νέων παραδειγµάτων εκπαίδευσης. Επανυπολογίζονται, επίσης, όλες οι ιδιότητες των διανυσµάτων εκπαίδευσης (παλαιών και νέων) που εξαρτώνται από τις λίστες συχνών λέξεων. Αντιθέτως, στα προηγούµενα δύο συστήµατα [1, 3] οι λίστες συχνών λέξεων υπολογίζονταν µόνο βάσει των 14 κειµένων παθητικής µάθησης. 19

20 µέγεθος στο οποίο είχε καταλήξει ο Βασιλάκος [3], ο οποίος είχε πειραµατιστεί µε διαφορετικά µεγέθη δέσµης. Σηµειώνεται ότι όσο µικρότερο είναι το µέγεθος της δέσµης τόσο περισσότερα είναι τα βήµατα µιας σειράς πειραµάτων και άρα τόσο περισσότερες είναι οι επανεκπαιδεύσεις της Μ Υ που απαιτούνται µέχρι να φτάσουµε σε έναν επιθυµητό συνολικό αριθµό επισηµειωµένων παραδειγµάτων εκπαίδευσης, µε αποτέλεσµα να απαιτείται περισσότερος χρόνος για την εκτέλεση των πειραµάτων και γενικότερα την εκπαίδευση του συστήµατος. Από την άλλη πλευρά, όσο µεγαλύτερο είναι το µέγεθος της δέσµης, τόσο περισσότερο κινδυνεύουµε η δέσµη να περιέχει πολύ παρόµοια, και άρα λιγότερο χρήσιµα, διανύσµατα εκπαίδευσης ή γενικότερα διανύσµατα που είναι λιγότερο χρήσιµα δεδοµένων των υπολοίπων διανυσµάτων της δέσµης. Από πλευράς διεπαφής χρήστη, σε κάθε βήµα ο άνθρωπος-εκπαιδευτής βλέπει µία-µία τις λεκτικές µονάδες που περιέχονται στη δέσµη, µαζί µε µια γειτονιά 16 λεκτικών µονάδων πριν και µετά τη λεκτική µονάδα που αποτελεί το παράδειγµα εκπαίδευσης, και απαντά «Ναι» ή «Όχι», ανάλογα µε το αν η λεκτική µονάδα ανήκει ή όχι στην κατηγορία ονοµάτων της Μ Υ Επιγραµµική µέθοδος επιλογής παραδειγµάτων H δεύτερη µέθοδος επιλογής παραδειγµάτων, την οποία καλούµε «επιγραµµική» (online) [10], συµπληρώνει σε κάθε βήµα τη δέσµη των παραδειγµάτων προς επισηµείωση επιλέγοντας τυχαία ένα ή περισσότερα κείµενα από τη δεύτερη δεξαµενή (των µη επισηµειωµένων κειµένων) και κρατώντας από κάθε κείµενο τα καλύτερα διανύσµατα, βάσει του πληροφοριακού τους οφέλους. Πιο αναλυτικά, στην αρχή των πειραµάτων ο άνθρωπος-εκπαιδευτής ορίζει τον επιθυµητό τελικό συνολικό αριθµό διανυσµάτων εκπαίδευσης (διανύσµατα-στόχος) και το σύστηµα υπολογίζει το συνολικό αριθµό των διαθέσιµων υποψηφίων διανυσµάτων εκπαίδευσης της δεύτερης δεξαµενής (διανύσµατα στη δεξαµενή). Κάθε φορά που χρειάζεται να συµπληρωθεί µια δέσµη, το σύστηµα επιλέγει τυχαία ένα διαφορετικό κείµενο της δεύτερης δεξαµενής και από αυτό επιλέγει τα k καλύτερα διανύσµατα, όπου το k ορίζεται στη σχέση (3.1). Ανάλογα, δηλαδή, µε τον αριθµό των διανυσµάτων του κειµένου (διανύσµατα στο κείµενο) επιλέγονται περισσότερα ή λιγότερα διανύσµατα από αυτό ως παραδείγµατα εκπαίδευσης. Αν η δέσµη δεν έχει συµπληρωθεί, επιλέγεται τυχαία και νέο κείµενο της δεύτερης δεξαµενής, από αυτό επιλέγονται πάλι k διανύσµατα (το k επανυπολογίζεται) κ.ο.κ., µέχρι να συµπληρωθεί η δέσµη. διανύσµατα-στόχος διανύσµατα στο κείµενο k = διανύσµατα στη δεξαµενη (3.1) Το κυριότερο ίσως πλεονέκτηµα της επιγραµµικής µεθόδου είναι ότι επιτυγχάνει δραµατική µείωση του χρόνου επιλογής των παραδειγµάτων εκπαίδευσης, αφού σε κάθε βήµα ο υπολογισµός του πληροφοριακού οφέλους γίνεται µόνο για τα διανύσµατα των (λίγων) τυχαία επιλεγµένων κειµένων από τα οποία εξάγονται τα παραδείγµατα της δέσµης. Αντιθέτως, στην κλασική µέθοδο, ο επανυπολογισµός γίνεται για όλα τα διανύσµατα της διαµέρισης (1/5 της δεύτερης δεξαµενής). Ένα άλλο πλεονέκτηµα της επιγραµµικής µεθόδου είναι ότι αποφεύγεται ο κίνδυνος η δέσµη να αποτελείται από πολύ παρόµοια διανύσµατα, τα οποία προέρχονται από πολλαπλές εµφανίσεις των ιδίων λεκτικών µονάδων µε τα ίδια συµφραζόµενα στη 20

21 δεύτερη (µεγάλη) δεξαµενή κειµένων. Κι αυτό γιατί στην περίπτωση της επιγραµµικής µεθόδου, τα διανύσµατα επιλέγονται από λίγα, τυχαία επιλεγµένα κείµενα της δεύτερης δεξαµενής, όχι µια ολόκληρη διαµέριση (1/5) της δεύτερης δεξαµενής, και η πιθανότητα να εµφανιστούν (και να επιλεγούν) πολλές φορές οι ίδιες λεκτικές µονάδες µε τα ίδια συµφραζόµενα στα λίγα αυτά κείµενα είναι πολύ µικρότερη από ό,τι στην περίπτωση µιας ολόκληρης διαµέρισης της δεύτερης δεξαµενής. Η σηµαντική µείωση του χρόνου επιλογής παραδειγµάτων κατά την κατασκευή κάθε δέσµης επιτρέπει τη χρήση µικρότερου µεγέθους δέσµης (συνολικά περισσότερες δέσµες µέχρι να φτάσουµε στον επιθυµητό συνολικό αριθµό παραδειγµάτων εκπαίδευσης). Στα πρώτα περίπου διανύσµατα εκπαίδευσης κάθε σειράς πειραµάτων, η δέσµη είχε µέγεθος 100 διανυσµάτων, ενώ στα επόµενα είχε µέγεθος 200 διανυσµάτων. Στη διεπαφή χρήστη, ο άνθρωπος-εκπαιδευτής βλέπει πλέον στην οθόνη ολόκληρα τα κείµενα από τα οποία επιλέγονται τα παραδείγµατα της δέσµης. Σε κάθε κείµενο, το σύστηµα σηµειώνει τις k λεκτικές µονάδες που πρέπει να επισηµειωθούν. 3.5 Πειραµατικά αποτελέσµατα Στις επόµενες υποενότητες παρουσιάζονται τα αποτελέσµατα των πειραµάτων που διεξήχθησαν στην παρούσα εργασία, µε τη µορφή διαγραµµάτων ακρίβειας, ανάκλησης και f-measure. Στα διαγράµµατα της ακρίβειας και της ανάκλησης υπάρχουν ράβδοι λάθους (error bars) που απεικονίζουν τα διαστήµατα εµπιστοσύνης 95% (βλ. παράρτηµα εργασίας Βασιλάκου [3]). 21

22 3.5.1 Αποτελέσµατα Ακρίβειας ιάγραµµα ακρίβειας για τις κατηγορίες προσώπων και οργανισµών Το διάγραµµα παρουσιάζει τα αποτελέσµατα ακρίβειας (precision) των πειραµάτων παθητικής και ενεργητικής µάθησης για τις κατηγορίες των ονοµάτων προσώπων και οργανισµών. Εξετάζοντας τα διαστήµατα εµπιστοσύνης, παρατηρούµε ότι στην κατηγορία των οργανισµών υπάρχει µεγάλη επικάλυψη µεταξύ παθητικής και ενεργητικής µάθησης, ενώ αντίθετα η επικάλυψη είναι πολύ µικρότερη στα ονόµατα προσώπων. Και στις δύο κατηγορίες, ιδιαίτερα στην κατηγορία των προσώπων, η παθητική µάθηση φαίνεται περιέργως να οδηγεί σε καλύτερα αποτελέσµατα ακρίβειας, κάτι που έρχεται σε αντίθεση µε τα αποτελέσµατα των προηγούµενων εργασιών [1, 3], αν και τα αποτελέσµατα αυτής της εργασίας δεν είναι άµεσα συγκρίσιµα µε των προηγούµενων, επειδή οι Μ Υ εκπαιδεύονται πλέον ανεξάρτητα. Ως προς τις δύο µεθόδους ενεργητικής µάθησης, σε γενικές γραµµές η καµπύλη της κλασικής µεθόδου είναι πιο κάτω από την αντίστοιχη της επιγραµµικής, 22

23 αν και οι διαφορές δεν είναι πάντα στατιστικά σηµαντικές, ιδιαίτερα στην περίπτωση των ονοµάτων οργανισµών ιάγραµµα ακρίβειας για την κατηγορία των τοποθεσιών Το διάγραµµα παρουσιάζει τα αποτελέσµατα ακρίβειας για την κατηγορία των τοποθεσιών. Η επικάλυψη µεταξύ όλων των µεθόδων είναι πολύ µεγαλύτερη σε αυτή την κατηγορία ονοµάτων, σε σχέση µε τις προηγούµενες δύο. Επίσης οι ράβδοι λάθους έχουν µεγαλύτερο εύρος, γεγονός που οφείλεται στο µικρότερο αριθµό διαθέσιµων παραδειγµάτων ελέγχου (2094 διανύσµατα ελέγχου, έναντι 3846 για τα πρόσωπα και 3560 για τους οργανισµούς). Η γενική εικόνα που προκύπτει ως προς την ακρίβεια είναι ότι η υπολογιστικά φθηνότερη επιγραµµική µέθοδος ενεργητικής µάθησης είναι εξίσου καλή ή και καλύτερη της κλασικής. Καµία από τις δύο µεθόδους ενεργητικής µάθησης, όµως, δεν φαίνεται να οδηγεί σε αποτελέσµατα καλύτερα της παθητικής µάθησης. Στην περίπτωση των ονοµάτων προσώπων, µάλιστα, η παθητική µάθηση φαίνεται να οδηγεί σε σηµαντικά καλύτερα αποτελέσµατα ακρίβειας. 23

24 3.5.2 Αποτελέσµατα Ανάκλησης ιάγραµµα ανάκλησης για τις κατηγορίες προσώπων και οργανισµών Το διάγραµµα παρουσιάζει τα αποτελέσµατα ανάκλησης (recall) για τα ονόµατα προσώπων και οργανισµών. Και στις δύο κατηγορίες, τα καλύτερα αποτελέσµατα επιτυγχάνονται µε την επιγραµµική ενεργητική µάθηση, η οποία φαίνεται να υπερτερεί της κλασικής, αν και οι διαφορές είναι πολύ µικρές στην περίπτωση των ονοµάτων προσώπων. Επιπροσθέτως, στην περίπτωση των ονοµάτων οργανισµών οι δύο µέθοδοι ενεργητικής µάθησης οδηγούν σε σαφώς καλύτερα αποτελέσµατα, σε σχέση µε την παθητική µάθηση, κάτι που ενδεχοµένως να αποτελεί ένδειξη πως η ενεργητική µάθηση βοηθά το σύστηµα να µάθει καλύτερα τη µεγάλη ποικιλία µορφών που παρουσιάζουν τα ονόµατα οργανισµών. εν παρουσιάζεται, όµως, το ίδιο φαινόµενο στην κατηγορία των ονοµάτων τοποθεσιών, τα αποτελέσµατα ανάκλησης της οποίας φαίνονται στο διάγραµµα Η επιγραµµική µέθοδος ενεργητικής µάθησης φαίνεται και πάλι να υπερτερεί της κλασικής, αλλά τα καλύτερα αποτελέσµατα επιτυγχάνονται µε την παθητική µάθηση. 24

25 3.5.4 ιάγραµµα ανάκλησης για την κατηγορία των τοποθεσιών Η γενική εικόνα που προκύπτει ως προς την ανάκληση είναι ότι η υπολογιστικά φθηνότερη επιγραµµική µέθοδος ενεργητικής µάθησης είναι εξίσου καλή ή και καλύτερη της κλασικής, όπως και στην περίπτωση της ακρίβειας. Οι δύο µέθοδοι ενεργητικής µάθησης φαίνεται, επίσης, να οδηγούν σε υψηλότερη ανάκληση από ό,τι η παθητική µάθηση στα ονόµατα οργανισµών, αλλά οι διαφορές είναι πολύ µικρές στα ονόµατα προσώπων, ενώ στα ονόµατα τοποθεσιών η παθητική µάθηση υπερτερεί. 25

26 3.5.3 Αποτελέσµατα F-measure ιάγραµµα F-measure και για τις τρεις κατηγορίες ονοµάτων Το διάγραµµα παρουσιάζει τα αποτελέσµατα F-measure των τριών κατηγοριών ονοµάτων. Βλέπουµε και πάλι ότι η επιγραµµική µέθοδος ενεργητικής µάθησης υπερτερεί της κλασικής. Η επιγραµµική µέθοδος επιτυγχάνει, επίσης, τα καλύτερα τελικά αποτελέσµατα µεταξύ των τριών µεθόδων στα ονόµατα προσώπων και οργανισµών, αν και η διαφορά στην περίπτωση των ονοµάτων προσώπων είναι πάρα πολύ µικρή. Αντιθέτως, στα ονόµατα τοποθεσιών υπερτερεί η παθητική µάθηση. Σηµειώνεται ότι στην περίπτωση της κλασικής µεθόδου ενεργητικής µάθησης, στην κατηγορία των προσώπων και των τοποθεσιών εκτελέστηκαν λιγότερα πειράµατα από ό,τι στις άλλες δύο µεθόδους, καθότι παρατηρήθηκε µεγάλη διαφορά από τα αποτελέσµατα της παθητικής µάθησης και η επιλογή διανυσµάτων προς επισηµείωση ήταν χρονικά αρκετά δαπανηρή. 26

27 3.5.4 Μη επικαλυπτόµενες κατηγορίες ονοµάτων Στα ως τώρα πειράµατα εξετάσαµε ξεχωριστά τις επιδόσεις των Μ Υ των τριών κατηγοριών ονοµάτων. Στα πειράµατα αυτής της υποενότητας, εξετάζουµε την περίπτωση όπου κάθε λεκτική µονάδα επιτρέπεται να ταξινοµηθεί σε µία µόνο κατηγορία ονοµάτων. Στην περίπτωση αυτή, οι τρεις Μ Υ εκπαιδεύονται και πάλι ανεξάρτητα, όπως στα προηγούµενα πειράµατα, αλλά κατά την κατάταξη νέων λεκτικών µονάδων (δεδοµένα ελέγχου) το σύστηµα κατατάσσει κάθε λεκτική µονάδα στην κατηγορία ονοµάτων της οποίας η αντίστοιχη Μ Υ είναι περισσότερο βέβαιη πως η λεκτική µονάδα ανήκει στη θετική της κατηγορία. Αν καµία Μ Υ δεν αποκριθεί ότι η λεκτική µονάδα ανήκει στη θετική της κατηγορία, τότε η λεκτική µονάδα δεν κατατάσσεται σε καµία κατηγορία ονοµάτων. Πραγµατοποιήθηκαν δυο σειρές πειραµάτων, µία µε παθητική µάθηση και µία µε την επιγραµµική µέθοδο ενεργητικής µάθησης. Στην περίπτωση της παθητικής µάθησης, κάθε Μ Υ εκπαιδεύτηκε µε τον ίδιο τρόπο όπως και στα προηγούµενα πειράµατα παθητικής µάθησης για επικαλυπτόµενες κατηγορίες ονοµάτων. Στα πειράµατα της ενεργητικής µάθησης, εκπαιδεύσαµε σε κάθε βήµα (100 διανύσµατα ανά δέσµη) την κάθε Μ Υ στα αντίστοιχα δεδοµένα εκπαίδευσης που είχαν παραχθεί για αυτή τη Μ Υ στα προηγούµενα πειράµατα µε την επιγραµµική µέθοδο ενεργητικής µάθησης. Η αξιολόγηση της κάθε Μ Υ σε κάθε βήµα γινόταν όπως και πριν στα δεδοµένα ελέγχου της πρώτης δεξαµενής. Ακολουθούν τα διάγραµµατα ακρίβειας, ανάκλησης και f-measure για αυτές τις σειρές πειραµάτων. 27

28 3.5.6 ιάγραµµα ακρίβειας για τις κατηγορίες προσώπων και οργανισµών για µη επικαλυπτόµενες κατηγορίες Στο διάγραµµα βλέπουµε τα αποτελέσµατα ακρίβειας των πειραµάτων παθητικής και ενεργητικής µάθησης για τις κατηγορίες των ονοµάτων προσώπων και οργανισµών. Συγκρίνοντας µε το αντίστοιχο διάγραµµα των πειραµάτων επικαλυπτόµενων κατηγοριών, παρατηρούµε παρόµοια αποτελέσµατα στην κατηγορία των προσώπων, µε την παθητική µάθηση να υπερτερεί και πάλι. Στην κατηγορία των οργανισµών, ωστόσο, η ενεργητική µάθηση έχει τώρα σηµαντικά υψηλότερες τιµές ακρίβειας σε σχέση µε την παθητική µάθηση, ενώ στα πειράµατα επικαλυπτόµενων κατηγοριών η διαφορά ήταν πολύ µικρή. 28

29 3.5.7 ιάγραµµα ακρίβειας για την κατηγορία των τοποθεσιών για µη επικαλυπτόµενες κατηγορίες Στο διάγραµµα έχουµε τα αποτελέσµατα της ακρίβειας για την κατηγορία των τοποθεσιών. Η επικάλυψη µεταξύ παθητικής και ενεργητικής µάθησης είναι ιδιαίτερα µεγάλη, ενώ οι ράβδοι λάθους έχουν µεγάλο εύρος λόγω µικρού αριθµού διανυσµάτων ελέγχου, όπως ακριβώς συνέβη και στα αντίστοιχα πειράµατα επικαλυπτόµενων κατηγοριών (διάγραµµα 3.5.2). 29

30 3.5.8 ιάγραµµα ανάκλησης για τις κατηγορίες προσώπων, οργανισµών και τοποθεσιών για µη επικαλυπτόµενες κατηγορίες Το διάγραµµα παρουσιάζει τα αποτελέσµατα της ανάκλησης και για τις τρεις κατηγορίες ονοµάτων. Συγκρίνοντας µε το αντίστοιχο διάγραµµα 3.5.3, η διαφορά µεταξύ ενεργητικής και παθητικής µάθησης είναι τώρα πολύ µεγαλύτερη, µε την ενεργητική µάθηση να υπερτερεί σαφώς. Για τους οργανισµούς, πάλι η ενεργητική υπερτερεί της παθητικής µάθησης, αλλά η διαφορά είναι ελαφρά µικρότερη από εκείνη του διαγράµµατος Τέλος, στην περίπτωση των τοποθεσιών, η παθητική µάθηση υπερτερεί, όπως στο αντίστοιχο διάγραµµα 3.5.4, αλλά η διαφορά από την ενεργητική µάθηση είναι τώρα πολύ µεγαλύτερη. 30

31 3.5.9 ιάγραµµα F-measure για επικαλυπτόµενες και µη επικαλυπτόµενες κατηγορίες Στο διάγραµµα συγκρίνουµε το F-measure των πειραµάτων των επικαλυπτόµενων κατηγοριών µε τα αντίστοιχα αποτελέσµατα των πειραµάτων των µη επικαλυπτόµενων κατηγοριών. Η γενική εικόνα είναι ότι η κατάταξη των λεκτικών µονάδων σε µία µόνο κατηγορία δε δείχνει να βελτιώνει τις επιδόσεις του συστήµατος. Αντιθέτως τις χειροτερεύει. 31

32 ιάγραµµα ακρίβειας, ανάκλησης και F-measure για µη επικαλυπτόµενες κατηγορίες ονοµάτων παθητικής µάθησης και ενεργητικής µάθησης µε επιγραµµική µέθοδο Το διάγραµµα παρουσιάζει τα συνολικά αποτελέσµατα ακρίβειας, ανάκλησης και F-measure για µη επικαλυπτόµενες κατηγορίες ονοµάτων για την παθητική και την ενεργητική µάθηση. Η γενική εικόνα είναι ότι υπάρχει µεγάλη επικάλυψη µεταξύ ενεργητικής και παθητικής µάθησης, η οποία ίσως οφείλεται εν µέρει στη χαµηλή επίδοση της ενεργητικής µάθησης στην κατηγορία των τοποθεσιών. Η µελλοντική βελτίωση της ενεργητικής µάθησης σε αυτή την κατηγορία ενδεχοµένως θα άλλαζε τη συνολική εικόνα υπέρ της ενεργητικής µάθησης. 32

33 3.6 Χρονικά ιαγράµµατα Ενεργητικής Μάθησης Στην υποενότητα αυτή επικεντρωνόµαστε στους χρόνους εκπαίδευσης και κατάταξης των τριών Μ Υ όταν χρησιµοποιούνται οι δύο µέθοδοι ενεργητικής µάθησης. Από τα παρακάτω διαγράµµατα (3.6.1 και 3.6.2) φαίνεται ότι και στις δύο µεθόδους ενεργητικής µάθησης η Μ Υ των προσώπων απαιτεί τον περισσότερο χρόνο εκπαίδευσης από τις τρεις Μ Υ. Ακολουθούν η Μ Υ των οργανισµών και µετά εκείνη των τοποθεσιών. Αυτό ενδέχεται να οφείλεται στο ότι η Μ Υ των προσώπων χρησιµοποιεί τις περισσότερες ιδιότητες (150), ενώ οι Μ Υ των οργανισµών και των τοποθεσιών χρησιµοποιούν λιγότερες (142 και 133 αντίστοιχα) ιάγραµµα χρόνου για την κλασική µέθοδο ενεργητικής µάθησης Στα δύο διαγράµµατα (3.6.1 και 3.6.2) φαίνεται επίσης καθαρά ότι η φάση του ελέγχου (training) είναι περίπου γραµµική µε πολύ µικρή κλίση και στις δύο µεθόδους ενεργητικής µάθησης. 33

34 3.6.2 ιάγραµµα χρόνου για την επιγραµµική µέθοδο ενεργητικής µάθησης Είναι ενδιαφέρον ότι ο χρόνος επανεκπαίδευσης των Μ Υ αυξάνει πολύ πιο απότοµα όταν χρησιµοποιείται η επιγραµµική µέθοδος, ενώ αντίθετα η αύξηση είναι λιγότερο απότοµη όταν χρησιµοποιείται η κλασική µέθοδος. Ενδέχεται στην κλασική µέθοδο να καταλήγουµε να επιλέγουµε διαρκώς τα ίδια (ή πολλά ίδια) παραδείγµατα εκπαίδευσης από ένα σηµείο και πέρα (βλ. και ενότητα 3.4.2), τα οποία ουσιαστικά αγνοούνται από τις Μ Υ, ενώ στην επιγραµµική µέθοδο τα επιλεγόµενα παραδείγµατα ενδέχεται να έχουν µεγαλύτερη ποικιλία, οπότε δεν είναι δυνατόν να αγνοηθούν. 34

35 3.6.3 ιάγραµµα χρόνου επιλογής διανυσµάτων εκπαίδευσης Το διάγραµµα δείχνει ότι η φάση επιλογής διανυσµάτων εκπαίδευσης της επιγραµµικής µεθόδου απαιτεί περίπου σταθερό και σηµαντικά λιγότερο χρόνο από την αντίστοιχη φάση της κλασικής µεθόδου ενεργητικής µάθησης. 35

36 4. Συµπεράσµατα και Μελλοντικές Επεκτάσεις Συνοψίζοντας, σε αυτή την εργασία µελετήθηκε η επέκταση του συστήµατος Αναγνώρισης και Κατάταξης Ονοµάτων Οντοτήτων των Λουκαρέλλι και Βασιλάκου. Εκτός από χρονικές εκφράσεις, που αναγνωρίζονται όπως στο προηγούµενο σύστηµα µε τη χρήση προτύπων, το νέο σύστηµα αναγνωρίζει και κατατάσσει ονόµατα προσώπων, οργανισµών και τοποθεσιών χρησιµοποιώντας τρεις ανεξάρτητες Μ Υ και µία µόνο σάρωση των κειµένων. Οι τρεις Μ Υ είναι δυνατόν να εκπαιδευθούν τόσο µε παθητική όσο και µε ενεργητική µάθηση. Στην ενεργητική µάθηση µελετήθηκαν δυο διαφορετικές µέθοδοι επιλογής διανυσµάτων προς επισηµείωση, η µέθοδος που είχαν χρησιµοποιήσει οι Λουκαρέλλι και Βασιλάκος, την οποία ονοµάζουµε «κλασική», και µια υπολογιστικά πολύ φθηνότερη µέθοδος, καλούµενη «επιγραµµική», που επιτυγχάνει εξίσου καλά ή και καλύτερα αποτελέσµατα µε την κλασική. Αφήνοντας κατά µέρος την αναγνώριση ηµεροµηνιών, µε την οποία δεν ασχοληθήκαµε ιδιαίτερα σε αυτή την εργασία, τα καλύτερα αποτελέσµατα επιτεύχθηκαν εν γένει στην αναγνώριση ονοµάτων προσώπων, ακολουθούµενα από την αναγνώριση ονοµάτων οργανισµών, ενώ αντιθέτως τα αποτελέσµατα της αναγνώρισης ονοµάτων τοποθεσιών ήταν πολύ χαµηλότερα. Για την κατηγορία των προσώπων, το καλύτερο f-measure (83,93%) επιτεύχθηκε µε την επιγραµµική µέθοδο στα διανύσµατα εκπαίδευσης. Για την κατηγορία των οργανισµών, το καλύτερο f-measure (70,87%) επιτεύχθηκε πάλι µε την επιγραµµική µέθοδο στα διανύσµατα εκπαίδευσης. Τέλος, για την κατηγορία των τοποθεσιών το καλύτερο f-measure (52,99%) επιτεύχθηκε µε την παθητική µάθηση στα διανύσµατα εκπαίδευσης. Αντίθετα από τα αποτελέσµατα των Λουκαρέλλι και Βασιλάκου, τα αποτελέσµατα της ενεργητικής µάθησης σε αυτή την εργασία ήταν σε αρκετές περιπτώσεις χειρότερα από εκείνα της παθητικής, αν και τα αποτελέσµατα δεν είναι άµεσα συγκρίσιµα, επειδή οι τρεις Μ Υ εκπαιδεύονται τώρα ανεξάρτητα, αντίθετα από το σύστηµα των Λουκαρέλλι και Βασιλάκου. εδοµένων των παραπάνω αποτελεσµάτων, προτείνονται οι εξής µελλοντικές βελτιώσεις του συστήµατος: - Η χρήση ενός επισηµειωτή µερών του λόγου (part of speech tagger), που θα επιτρέψει να ενσωµατωθούν στα διανύσµατα ιδιότητες οι οποίες θα δείχνουν σε ποια µέρη του λόγου ανήκει η προς κατάταξη λεκτική µονάδα και οι γειτονικές της. Η αναγνώριση συγκεκριµένων µερών του λόγου (π.χ. δεικτικές αντωνυµίες, προθέσεις) που συναντώνται πολύ συχνά πριν από ονόµατα τοποθεσιών ενδέχεται να βελτιώσει τις επιδόσεις του συστήµατος σε αυτή την κατηγορία ονοµάτων. - Η περαιτέρω διερεύνηση της κατηγορίας των τοποθεσιών και ενδεχοµένως η υιοθέτηση διαφορετικής προσέγγισης (π.χ. διαφορετικές ιδιότητες). Ιδιαίτερη σηµασία πρέπει να δοθεί στο γεγονός ότι το Πληροφοριακό Κέρδος των ιδιοτήτων που χρησιµοποιήθηκαν σε αυτή την κατηγορία ονοµάτων ήταν πολύ χαµηλό (η πλειοψηφία των ιδιοτήτων είχε 0 IG< 0.01). Επιπλέον, κρίνεται απαραίτητο να επισηµειωθούν επιπλέον παραδείγµατα ελέγχου για την κατηγορία των τοποθεσιών. 36

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης»

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ θέμα: «Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» Βασιλάκος Ξενοφών Επιβλέπων

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 26 Ιανουαρίου 2004 ιάρκεια: 2 ώρες (9:00-:00) Στην παρακάτω

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Σεπτεµβρίου 2005 5:00-8:00 Σχεδιάστε έναν αισθητήρα ercetro

Διαβάστε περισσότερα

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών ΗΥ-6 Συστήµατα Ανάκτησης Πληροφοριών 7-8 Εαρινό Εξάµηνο Άσκηση Λύσεις ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Θεωρείστε µια

Διαβάστε περισσότερα

«Αναγνώριση και κατάταξη ονοµάτων οντοτήτων σε ελληνικά κείµενα»

«Αναγνώριση και κατάταξη ονοµάτων οντοτήτων σε ελληνικά κείµενα» ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία Μεταπτυχιακού ιπλώµατος Ειδίκευσης «Αναγνώριση και κατάταξη ονοµάτων οντοτήτων σε ελληνικά

Διαβάστε περισσότερα

Περίληψη ιπλωµατικής Εργασίας

Περίληψη ιπλωµατικής Εργασίας Περίληψη ιπλωµατικής Εργασίας Θέµα: Εναλλακτικές Τεχνικές Εντοπισµού Θέσης Όνοµα: Κατερίνα Σπόντου Επιβλέπων: Ιωάννης Βασιλείου Συν-επιβλέπων: Σπύρος Αθανασίου 1. Αντικείµενο της διπλωµατικής Ο εντοπισµός

Διαβάστε περισσότερα

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.

Διαβάστε περισσότερα

o AND o IF o SUMPRODUCT

o AND o IF o SUMPRODUCT Πληροφοριακά Εργαστήριο Management 1 Information Συστήματα Systems Διοίκησης ΤΕΙ Τμήμα Ελεγκτικής Ηπείρου Χρηματοοικονομικής (Παράρτημα Πρέβεζας) και Αντικείµενο: Μοντελοποίηση προβλήµατος Θέµατα που καλύπτονται:

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Οκτωβρίου 23 ιάρκεια: 2 ώρες Έστω το παρακάτω γραµµικώς

Διαβάστε περισσότερα

4. Ο αισθητήρας (perceptron)

4. Ο αισθητήρας (perceptron) 4. Ο αισθητήρας (perceptron) Σκοπός: Προσδοκώµενα αποτελέσµατα: Λέξεις Κλειδιά: To µοντέλο του αισθητήρα (perceptron) είναι από τα πρώτα µοντέλα νευρωνικών δικτύων που αναπτύχθηκαν, και έδωσαν µεγάλη ώθηση

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Παρασκευή 9 Ιανουαρίου 2007 5:00-8:00 εδοµένου ότι η

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 19 ης διάλεξης

Ασκήσεις μελέτης της 19 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 19 ης διάλεξης 19.1. Δείξτε ότι το Perceptron με (α) συνάρτηση ενεργοποίησης

Διαβάστε περισσότερα

Μαρία-Ελένη Κολλιάρου Σελίδα 2

Μαρία-Ελένη Κολλιάρου Σελίδα 2 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία Μεταπτυχιακού ιπλώµατος Ειδίκευσης «Ανάπτυξη συστήµατος ερωταποκρίσεων για αρχεία ελληνικών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΟΜΑ Α ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Στην εικόνα παρακάτω φαίνεται ένα νευρωνικό

Διαβάστε περισσότερα

οµή δικτύου ΣΧΗΜΑ 8.1

οµή δικτύου ΣΧΗΜΑ 8.1 8. ίκτυα Kohonen Το µοντέλο αυτό των δικτύων προτάθηκε το 1984 από τον Kοhonen, και αφορά διαδικασία εκµάθησης χωρίς επίβλεψη, δηλαδή δεν δίδεται καµία εξωτερική επέµβαση σχετικά µε τους στόχους που πρέπει

Διαβάστε περισσότερα

Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής

Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Αναγνώριση Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα Κοινωνικών Δικτύων Καραμπάτσης Ραφαήλ Μιχαήλ Α.Μ. 3080064 Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος

Διαβάστε περισσότερα

Οδηγός Εξαγωγής Συγκεντρωτικών Καταστάσεων. ΚΕΠΥΟ και Ηλεκτρονικού Ισοζυγίου. στο InnovEra 3 R2 για τον RTC client

Οδηγός Εξαγωγής Συγκεντρωτικών Καταστάσεων. ΚΕΠΥΟ και Ηλεκτρονικού Ισοζυγίου. στο InnovEra 3 R2 για τον RTC client Οδηγός Εξαγωγής Συγκεντρωτικών Καταστάσεων ΚΕΠΥΟ και Ηλεκτρονικού Ισοζυγίου στο InnovEra 3 R2 για τον RTC client Μελίσσια, 12 Ιουλίου 2012 1. ιαδικασία Εξαγωγής Συγκεντρωτικής Κατάστασης ΚΕΠΥΟ - ΜΥΦ 1.1

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Παλαιότερες ασκήσεις

Παλαιότερες ασκήσεις Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY6 - Συστήµατα Ανάκτησης Πληροφοριών Παλαιότερες ασκήσεις η Σειρά Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Άσκηση ( η σειρά ασκήσεων

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Εγχειρίδιο Χρήσης Συστήµατος ιαχείρισης Αιτήσεων Υποψηφίων Συνεργατών ΑΤΕΙ Καλαµάτας

Εγχειρίδιο Χρήσης Συστήµατος ιαχείρισης Αιτήσεων Υποψηφίων Συνεργατών ΑΤΕΙ Καλαµάτας ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ 1. Εγγραφή Χρήστη Για να µπορείτε να υποβάλλεται αιτήσεις προς τα Τµήµατα του ΤΕΙ θα πρέπει προηγουµένως να έχετε εγγραφεί στο σύστηµα έτσι ώστε να έχετε πρόσβαση στις υπηρεσίες που σας

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΘΕΜΑ ο (.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Πέµπτη 7 Ιανουαρίου 8 5:-8: Σχεδιάστε έναν αισθητήρα (perceptron)

Διαβάστε περισσότερα

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ 1 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΑΝΑΛΥΣΗ ΜΕΝΟΥ ΕΦΑΡΜΟΓΗΣ... 4 2. ΕΠΕΞΗΓΗΣΗ ΚΕΝΤΡΙΚΟΥ ΜΕΝΟΥ ΚΑΡΤΕΛΑΣ... 5 3. ΔΗΜΙΟΥΡΓΙΑ ΠΕΛΑΤΗ... 6 4. ΑΝΑΖΗΤΗΣΗ ΠΕΛΑΤΗ... 6 5. ΕΠΕΞΕΡΓΑΣΙΑ/ΔΙΑΓΡΑΦΗ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 435: ΑΛΛΗΛΕΠΙ ΡΑΣΗ ΑΝΘΡΩΠΟΥ ΥΠΟΛΟΓΙΣΤΗ Ακαδηµαϊκό Έτος 2004 2005, Χειµερινό Εξάµηνο 2 Η ΟΜΑ ΙΚΗ ΕΡΓΑΣΙΑ: ΑΝΑΠΤΥΞΗ ΑΡΧΙΚΗΣ Ι ΕΑΣ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΚΑΙ ΑΝΑΛΥΣΗ ΑΝΑΓΚΩΝ

Διαβάστε περισσότερα

Παρακάτω προτείνεται μια αλληλουχία ενεργειών την οποία ο χρήστης πρέπει να ακολουθήσει για να αξιοποιήσει τις δυνατότητες της εφαρμογής.

Παρακάτω προτείνεται μια αλληλουχία ενεργειών την οποία ο χρήστης πρέπει να ακολουθήσει για να αξιοποιήσει τις δυνατότητες της εφαρμογής. Έκδοση Επιταγών Το συγκεκριμένο εγχειρίδιο δημιουργήθηκε για να βοηθήσει την κατανόηση της διαδικασίας Έκδοσης Επιταγών στην εφαρμογή Λογιστική Διαχείριση της σειράς HyperΛογιστική. Παρακάτω προτείνεται

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 16 ης διάλεξης

Ασκήσεις μελέτης της 16 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 16 ης διάλεξης 16.1. (α) Έστω ένα αντικείμενο προς κατάταξη το οποίο

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: ΠΡΟΚΗΡΥΞΕΙΣ

ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: ΠΡΟΚΗΡΥΞΕΙΣ ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: ΠΡΟΚΗΡΥΞΕΙΣ VERSION CMS 4.0 ΕΚ ΟΣΗ ΕΓΧΕΙΡΙ ΙΟΥ 4-2010 Το παρόν εγχειρίδιο διατίθεται µαζί µε την πλατφόρµα ηλεκτρονικού επιχειρείν altab2x και η χρήση του προορίζεται για τους

Διαβάστε περισσότερα

Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος;

Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος; Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος; Για να εξετάσουµε το κύκλωµα LC µε διδακτική συνέπεια νοµίζω ότι θα πρέπει να τηρήσουµε τους ορισµούς που δώσαµε στα παιδιά στη Β Λυκείου. Ας ξεκινήσουµε

Διαβάστε περισσότερα

Ανάπτυξη και αποτελέσµατα πολυκριτηριακής ανάλυσης Κατάταξη εναλλακτικών σεναρίων διαχείρισης ΟΤΚΖ Επιλογή βέλτιστου σεναρίου διαχείρισης

Ανάπτυξη και αποτελέσµατα πολυκριτηριακής ανάλυσης Κατάταξη εναλλακτικών σεναρίων διαχείρισης ΟΤΚΖ Επιλογή βέλτιστου σεναρίου διαχείρισης Ανάπτυξη και αποτελέσµατα πολυκριτηριακής ανάλυσης Κατάταξη εναλλακτικών σεναρίων διαχείρισης ΟΤΚΖ Επιλογή βέλτιστου σεναρίου διαχείρισης 1. Εισαγωγή Στην τεχνική αυτή έκθεση περιγράφεται αναλυτικά η εφαρµογή

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 7 Ιανουαρίου 2005 ιάρκεια εξέτασης: 5:00-8:00 Έστω ότι

Διαβάστε περισσότερα

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville Τµήµα Π. Ιωάννου & Θ. Αποστολάτου 16/5/2000 Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville Στη Χαµιλτονιανή θεώρηση η κατάσταση του συστήµατος προσδιορίζεται κάθε στιγµή από ένα και µόνο σηµείο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΣΥΣΤΗΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΤΩΝ Online Student Trainer

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΣΥΣΤΗΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΤΩΝ Online Student Trainer ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΖΕΓΚΙΝΗΣ ΗΜΗΤΡΙΟΣ (Α.Μ. 26/01) ΤΟΥΤΟΥΝΤΖΙ ΗΣ ΧΡΗΣΤΟΣ (Α.Μ. 120/01) ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΣΥΣΤΗΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΤΩΝ Online Student Trainer Εξεταστική

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ Ελαχιστοποίηση κόστους διατροφής Ηεπιχείρηση ζωοτροφών ΒΙΟΤΡΟΦΕΣ εξασφάλισε µια ειδική παραγγελίααπό έναν πελάτη της για την παρασκευή 1.000 κιλών ζωοτροφής, η οποία θα πρέπει

Διαβάστε περισσότερα

for for for for( . */

for for for for( . */ Εισαγωγή Στον Προγραµµατισµό «C» Βρόχοι Επανάληψης Πανεπιστήµιο Πελοποννήσου Τµήµα Πληροφορικής & Τηλεπικοινωνιών Νικόλαος Δ. Τσελίκας Νικόλαος Προγραµµατισµός Δ. Τσελίκας Ι Ο βρόχος for Η εντολή for χρησιµοποιείται

Διαβάστε περισσότερα

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x).

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x). Οικονοµικό Πανεπιστήµιο Αθηνών Άνοιξη 2012 Τµήµα Οικονοµικής Επιστήµης ηµόσια Οικονοµική ΙI Η διαδικασία της ψηφοφορίας Ως µεθόδου παροχής των δηµοσίων αγαθών (για τα ιδιωτικά αγαθά, ο µηχανισµός των τιµών).

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 9 ο ΤΟ ΠΕΡΙΒΑΛΛΟΝ. 9.1 Εισαγωγή

ΚΕΦΑΛΑΙΟ 9 ο ΤΟ ΠΕΡΙΒΑΛΛΟΝ. 9.1 Εισαγωγή ΚΕΦΑΛΑΙΟ 9 ο ΤΟ ΠΕΡΙΒΑΛΛΟΝ 9.1 Εισαγωγή Η βιώσιµη ανάπτυξη είναι µία πολυδιάστατη έννοια, η οποία αποτελεί µία εναλλακτική αντίληψη της ανάπτυξης, µε κύριο γνώµονα το καθαρότερο περιβάλλον και επιδρά στην

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ Βασικός τελικός στόχος κάθε επιστηµονικής τεχνολογικής εφαρµογής είναι: H γενική βελτίωση της ποιότητας του περιβάλλοντος Η βελτίωση της ποιότητας ζωής Τα µέσα µε τα

Διαβάστε περισσότερα

3. Σηµειώσεις Access. # Εισαγωγή ψηφίου ή κενού διαστήµατος. Επιτρέπονται τα ση-

3. Σηµειώσεις Access. # Εισαγωγή ψηφίου ή κενού διαστήµατος. Επιτρέπονται τα ση- Μάθηµα 3 Προχωρηµένες ιδιότητες πεδίων Μάσκες εισαγωγής Οι ιδιότητες Μορφή και Μάσκα εισαγωγής περιγράφονται µαζί γιατί έχουν κοινά χαρακτηριστικά που αφορούν την εµφάνιση. Με την ιδιότητα Μορφή καθορίζουµε

Διαβάστε περισσότερα

if(συνθήκη) {... // οµάδα εντολών } C: Από τη Θεωρία στην Εφαρµογή 5 ο Κεφάλαιο

if(συνθήκη) {... // οµάδα εντολών } C: Από τη Θεωρία στην Εφαρµογή 5 ο Κεφάλαιο C: Από τη Θεωρία στην Εφαρµογή Κεφάλαιο 5 ο Έλεγχος Προγράµµατος Γ. Σ. Τσελίκης Ν. Δ. Τσελίκας Η εντολή if (Ι) Η εντολή if είναι µία από τις βασικότερες δοµές ελέγχου ροής στη C, αλλά και στις περισσότερες

Διαβάστε περισσότερα

Βασικές Οδηγίες Χρήσης της Εφαρμογής

Βασικές Οδηγίες Χρήσης της Εφαρμογής Βασικές Οδηγίες Χρήσης της Εφαρμογής Σύνδεση στην Εφαρμογή Πριν ξεκινήσετε την εργασία σας με το Σύστημα Διαχείρισης Εφαρμογών του ΚΕΠΕΑ πρέπει να συνδεθείτε δίνοντας το username και το password που σας

Διαβάστε περισσότερα

Παιδαγωγική προσέγγιση: Πρόταση για την διδασκαλία της έννοιας αλγόριθµός στο περιβάλλον MicroWorlds Pro

Παιδαγωγική προσέγγιση: Πρόταση για την διδασκαλία της έννοιας αλγόριθµός στο περιβάλλον MicroWorlds Pro Παιδαγωγική προσέγγιση: Πρόταση για την διδασκαλία της έννοιας αλγόριθµός στο περιβάλλον MicroWorlds Pro Το «Φύλλο Εργασίας» για τους µαθητές Το παρακάτω φύλλο εργασίας µπορεί να χρησιµοποιηθεί ως εισαγωγικό

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: NEWSLETTER

ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: NEWSLETTER ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: NEWSLETTER VERSION CMS 4.0 ΕΚ ΟΣΗ ΕΓΧΕΙΡΙ ΙΟΥ 4.0.1-2009 ΤΕΛΕΥΤΑΙΑ ΕΝΗΜΕΡΩΣΗ ΙΑΝΟΥΑΡΙΟΣ 2009 Το παρόν εγχειρίδιο διατίθεται µαζί µε την πλατφόρµα ηλεκτρονικού επιχειρείν altab2x

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Εργασία στο µάθηµα Ανάλυση εδοµένων

Εργασία στο µάθηµα Ανάλυση εδοµένων Μεταπτυχιακό Υπολογιστικής Φυσικής Εργασία στο µάθηµα Ανάλυση εδοµένων ηµήτρης Κουγιουµτζής E-mail: dkugiu@auth.gr 30 Ιανουαρίου 2018 Οδηγίες : Σχετικά µε την παράδοση της εργασίας ϑα πρέπει : Το κείµενο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 4 ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΤΩΝ ΑΠΟΦΟΙΤΩΝ Γ ΛΥΚΕΙΟΥ ΑΝΑ ΕΣΜΗ ΚΑΙ ΜΑΘΗΜΑ

ΚΕΦΑΛΑΙΟ 4 ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΤΩΝ ΑΠΟΦΟΙΤΩΝ Γ ΛΥΚΕΙΟΥ ΑΝΑ ΕΣΜΗ ΚΑΙ ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 4 ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΤΩΝ ΑΠΟΦΟΙΤΩΝ Γ ΛΥΚΕΙΟΥ ΑΝΑ ΕΣΜΗ ΚΑΙ ΜΑΘΗΜΑ Εισαγωγή Στο κεφάλαιο αυτό εξετάζουµε µε περιγραφικά στατιστικά µέτρα τις βαθµολογικές επιδόσεις των αποφοίτων της Γ Λυκείου

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΞΑΜΗΝΟ Η ΟΝΟΜΑΤΕΠΩΝΥΜΟ ΦΟΙΤΗΤΗ : ΜΟΣΧΟΥΛΑ ΟΛΓΑ ΑΡΙΘΜΟΣ ΜΗΤΡΩΟΥ : 30/02 ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ : ΥΛΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΟΣ ΙΑΧΕΙΡΙΣΗΣ ΣΥΝΕ ΡΙΩΝ ΜΕ ΧΡΗΣΗ

Διαβάστε περισσότερα

ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ

ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ ΑΓΩΓΟΙ & ΙΑΝΥΣΜΑΤΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ ΣΥΓΚΡΟΥΣΕΙΣ ΣΕ ΑΓΩΓΟΥΣ & ΜΕΓΙΣΤΟΠΟΙΗΣΗ ΠΑΡΑΓΩΓΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΥΨΗΛΩΝ

Διαβάστε περισσότερα

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές:

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές: Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάµηνο 1 η Σειρά Ασκήσεων (Αξιολόγηση Αποτελεσµατικότητας Ανάκτησης) Άσκηση 1 (4 βαθµοί) Θεωρείστε

Διαβάστε περισσότερα

Γενικές Παρατηρήσεις. Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα (1) Το Λήµµα της Αντλησης. Χρήση του Λήµµατος Αντλησης.

Γενικές Παρατηρήσεις. Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα (1) Το Λήµµα της Αντλησης. Χρήση του Λήµµατος Αντλησης. Γενικές Παρατηρήσεις Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα () Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Υπάρχουν µη κανονικές γλώσσες, π.χ., B = { n n n }. Αυτό

Διαβάστε περισσότερα

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner 10. Text Mining Για να μπορέσουμε να χρησιμοποιήσουμε τις δυνατότητες text mining του Rapid Miner πρέπει να εγκαταστήσουμε το Text Mining Extension. Πηγαίνουμε Help Updates and Extensions (Marketplace)

Διαβάστε περισσότερα

Οδηγός Χρήσης Υποβολής ήλωσης µέσω ιαδικτύου

Οδηγός Χρήσης Υποβολής ήλωσης µέσω ιαδικτύου Οδηγός Χρήσης Υποβολής ήλωσης µέσω ιαδικτύου Ιούνιος 2008 (1/29) ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή...3 Εγγραφή Νέου Χρήστη...5 Σύνδεση Χρήστη...7 Στοιχεία ικαιούχου...8 Υποβολή ήλωσης...13 Προσθήκη Ακινήτου... 14 Προσθήκη

Διαβάστε περισσότερα

Διαγραφή Επιλέγετε Διαγραφή για να διαγράψετε μία ήδη υπάρχουσα διαδικασία εισαγωγής ASCII

Διαγραφή Επιλέγετε Διαγραφή για να διαγράψετε μία ήδη υπάρχουσα διαδικασία εισαγωγής ASCII Published on PRISMA Win Help - Megasoft (http://docs.megasoft.gr) Home > Διαχείριση Βάσης Δεδομένων (dbadmin) > Αρχεία Αρχεία Εισαγωγή από αρχείο ASCII Με την εργασία αυτή έχετε την δυνατότητα να εισάγετε

Διαβάστε περισσότερα

Η προσδοκώµενη χρησιµότητα του κέρδους όταν η πιθανότητα η τιµή του προϊόντος Ρ1 είναι ψ, χ το επίπεδο παραγωγής και c(x) η συνάρτηση κόστους, είναι

Η προσδοκώµενη χρησιµότητα του κέρδους όταν η πιθανότητα η τιµή του προϊόντος Ρ1 είναι ψ, χ το επίπεδο παραγωγής και c(x) η συνάρτηση κόστους, είναι 3. Θεωρία της Επιχείρησης 3. Η Ανταγωνιστική Επιχείρηση. Το τµήµα αυτό έχει δύο στόχους. Πρώτα να δείξει ότι αν υπάρχει ουδετερότητα απέναντι στον κίνδυνο, τότε η µέση αξία ενός αβέβαιου γεγονότος είναι

Διαβάστε περισσότερα

Οδηγός για Εργαζόµενους

Οδηγός για Εργαζόµενους EIPIL-PAN Ευρωπαϊκή Πρωτοβουλία για την Προώθηση της Άτυπης Μάθησης Βραβείο Εργαζόµενου Οδηγός για Εργαζόµενους εκέµβριος 2009 Asset Τεχνολογική Ευρωπαϊκή Πρωτοβουλία για την Προώθηση της Άτυπης Μάθησης

Διαβάστε περισσότερα

Συχνές ερωτήσεις - απαντήσεις για τη χρήση του λογισµικού

Συχνές ερωτήσεις - απαντήσεις για τη χρήση του λογισµικού Συχνές ερωτήσεις - απαντήσεις για τη χρήση του λογισµικού Πώς µπορώ να αποκτήσω κωδικούς πρόσβασης στο σύστηµα δήλωσης αυθαιρέτων; Οι κωδικοί πρόσβασης στην ηλεκτρονική εφαρµογή για τις δηλώσεις και βεβαιώσεις

Διαβάστε περισσότερα

Επιλογή και επανάληψη. Λογική έκφραση ή συνθήκη

Επιλογή και επανάληψη. Λογική έκφραση ή συνθήκη Επιλογή και επανάληψη Η ύλη που αναπτύσσεται σε αυτό το κεφάλαιο είναι συναφής µε την ύλη που αναπτύσσεται στο 2 ο κεφάλαιο. Όπου υπάρχουν διαφορές αναφέρονται ρητά. Προσέξτε ιδιαίτερα, πάντως, ότι στο

Διαβάστε περισσότερα

Σχεδίαση Σ.Α.Ε: Σχεδίαση µε το Γεωµετρικό Τόπο Ριζών

Σχεδίαση Σ.Α.Ε: Σχεδίαση µε το Γεωµετρικό Τόπο Ριζών ΚΕΣ : Αυτόµατος Έλεγχος ΚΕΣ Αυτόµατος Έλεγχος Σχεδίαση Σ.Α.Ε: Σχεδίαση µε το Γεωµετρικό Τόπο Ριζών ΚΕΣ : Αυτόµατος Έλεγχος Βιβλιογραφία Ενότητας Παρασκευόπουλος []: Εφαρµογές, Κεφάλαιο 9: Ενότητες 9.-9.4

Διαβάστε περισσότερα

Άρα, Τ ser = (A 0 +B 0 +B 0 +A 0 ) επίπεδο 0 + (A 1 +B 1 +A 1 ) επίπεδο 1 + +(B 5 ) επίπεδο 5 = 25[χρονικές µονάδες]

Άρα, Τ ser = (A 0 +B 0 +B 0 +A 0 ) επίπεδο 0 + (A 1 +B 1 +A 1 ) επίπεδο 1 + +(B 5 ) επίπεδο 5 = 25[χρονικές µονάδες] Α. Στο παρακάτω διάγραµµα εµφανίζεται η εκτέλεση ενός παράλληλου αλγόριθµου που λύνει το ίδιο πρόβληµα µε έναν ακολουθιακό αλγόριθµο χωρίς πλεονασµό. Τα Α i και B i αντιστοιχούν σε ακολουθιακά υποέργα

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ ΕΝΟΤΗΤΑ «ΕΙΣΡΟΕΣ»

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ ΕΝΟΤΗΤΑ «ΕΙΣΡΟΕΣ» ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ 2014-2020 ΕΝΟΤΗΤΑ «ΕΙΣΡΟΕΣ» 1η Έκδοση: 2016 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΕΙΣΑΓΩΓΗ... 3 2. ΚΑΤΑΧΩΡΗΣΗ ΕΙΡΟΩΝ... 4 2.1.

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

3. Η παρακάτω συνάρτηση παραγωγής παρουσιάζει φθίνουσες, σταθερές, ή αύξουσες οικονοµίες κλίµακας; παραγωγής παρουσιάζει σταθερές αποδόσεις κλίµακας.

3. Η παρακάτω συνάρτηση παραγωγής παρουσιάζει φθίνουσες, σταθερές, ή αύξουσες οικονοµίες κλίµακας; παραγωγής παρουσιάζει σταθερές αποδόσεις κλίµακας. 1. Μια επιχείρηση έχει συνάρτηση παραγωγής την f(k,l), όπου Κ είναι οι µονάδες κεφαλαίου και L είναι οι µονάδες εργασίας που χρησιµοποιεί. Αν ξέρουµε ότι το οριακό προϊόν της εργασίας είναι θετικό, αλλά

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Α Κ Α Η Μ Α Ι Κ Ο Ε Τ Ο Σ 2 0 1 1-2 0 1 2 ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT Ο συγκεκριµένος οδηγός για το πρόγραµµα

Διαβάστε περισσότερα

Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα

Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Ιωάννης Χρονάκης ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος Τµήµα Πληροφορικής Οικονοµικό

Διαβάστε περισσότερα

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ Τα τελευταία 25 χρόνια, τα προβλήµατα που σχετίζονται µε την διαχείριση της Γεωγραφικής Πληροφορίας αντιµετωπίζονται σε παγκόσµιο αλλά και εθνικό επίπεδο µε την βοήθεια των Γεωγραφικών

Διαβάστε περισσότερα

Διαχείριση Βάσης Δεδομένων (dbadmin)

Διαχείριση Βάσης Δεδομένων (dbadmin) Published on PRISMA Win Help - Megasoft (http://docs.megasoft.gr) Home > Εμπορική Διαχείριση > Διαχείριση Βάσης Δεδομένων (dbadmin) Διαχείριση Βάσης Δεδομένων (dbadmin) Μέσα από τη διαχείριση βάσης δεδομένων

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα. Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι

Διαβάστε περισσότερα

Στο παράρτηµα θα παρουσιαστούν συνοπτικά οι δυνατότητες δύο προγραµµάτων Το ένα είναι το Professional Portfolio Manager (-P.P.M-) µε το οποίο µπορεί

Στο παράρτηµα θα παρουσιαστούν συνοπτικά οι δυνατότητες δύο προγραµµάτων Το ένα είναι το Professional Portfolio Manager (-P.P.M-) µε το οποίο µπορεί ΠΑΡΑΡΤΗΜΑ Στο παράρτηµα θα παρουσιαστούν συνοπτικά οι δυνατότητες δύο προγραµµάτων Το ένα είναι το Professional Portfolio Manager (-P.P.M-) µε το οποίο µπορεί ο χρήστης να πραγµατοποιήσει τις µεθόδους

Διαβάστε περισσότερα

Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής

Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Γιάννης Γαροφαλάκης Αν. Καθηγητής ιατύπωση του προβλήματος (1) Τα συστήματα αναμονής (queueing systems), βρίσκονται

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Κατασκευή µοντέλου και προσοµοίωσης: Μελέτη ελεύθερης πτώσης

Κατασκευή µοντέλου και προσοµοίωσης: Μελέτη ελεύθερης πτώσης ραστηριότητα Εκµάθησης Κατασκευή µοντέλου και προσοµοίωσης: Μελέτη ελεύθερης πτώσης Στο πλαίσιο της δραστηριότητας αυτής, θα κατασκευάσετε ένα µαθηµατικό µοντέλο που συσχετίζει τη θέση, την ταχύτητα και

Διαβάστε περισσότερα

Σύνοψη Προηγούµενου. Γλώσσες χωρίς Συµφραζόµενα (2) Ισοδυναµία CFG και PDA. Σε αυτό το µάθηµα. Αυτόµατα Στοίβας Pushdown Automata

Σύνοψη Προηγούµενου. Γλώσσες χωρίς Συµφραζόµενα (2) Ισοδυναµία CFG και PDA. Σε αυτό το µάθηµα. Αυτόµατα Στοίβας Pushdown Automata Σύνοψη Προηγούµενου Γλώσσες χωρίς Συµφραζόµενα (2) Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Αυτόµατα Στοίβας Pushdown utomata Ισοδυναµία µε τις Γλώσσες χωρίς Συµφραζόµενα:

Διαβάστε περισσότερα

ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΔΗΜΟΣΙΩΝ ΕΠΕΝΔΥΣΕΩΝ & ΕΣΠΑ

ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΔΗΜΟΣΙΩΝ ΕΠΕΝΔΥΣΕΩΝ & ΕΣΠΑ ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΔΗΜΟΣΙΩΝ ΕΠΕΝΔΥΣΕΩΝ & ΕΣΠΑ ΕΘΝΙΚΗ ΑΡΧΗ ΣΥΝΤΟΝΙΣΜΟΥ ΕΙΔΙΚΗ ΥΠΗΡΕΣΙΑ Ο.Π.Σ. ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΤΗ ΑΞΙΟΛΟΓΗΣΗ ΠΡΑΞΕΩΝ ΈΚΔΟΣΗ 2.00 ΙΣΤΟΡΙΚΟ ΑΛΛΑΓΩΝ Έκδοση Ημερομηνία Αιτιολογία Αλλαγής 01.00

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: ΝΕΑ - ΑΝΑΚΟΙΝΩΣΕΙΣ

ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: ΝΕΑ - ΑΝΑΚΟΙΝΩΣΕΙΣ ΕΓΧΕΙΡΙ ΙΟ ΧΡΗΣΗΣ MODULE: ΝΕΑ - ΑΝΑΚΟΙΝΩΣΕΙΣ VERSION CMS 4.0 ΕΚ ΟΣΗ ΕΓΧΕΙΡΙ ΙΟΥ 4.0.1-2009 ΤΕΛΕΥΤΑΙΑ ΕΝΗΜΕΡΩΣΗ ΙΑΝΟΥΑΡΙΟΣ 2009 Το παρόν εγχειρίδιο διατίθεται µαζί µε την πλατφόρµα ηλεκτρονικού επιχειρείν

Διαβάστε περισσότερα

ροµολόγηση πακέτων σε δίκτυα υπολογιστών

ροµολόγηση πακέτων σε δίκτυα υπολογιστών ροµολόγηση πακέτων σε δίκτυα υπολογιστών Συµπληρωµατικές σηµειώσεις για το µάθηµα Αλγόριθµοι Επικοινωνιών Ακαδηµαϊκό έτος 2011-2012 1 Εισαγωγή Οι παρακάτω σηµειώσεις παρουσιάζουν την ανάλυση του άπληστου

Διαβάστε περισσότερα

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση Υπολογιστική Νοημοσύνη Μάθημα 9: Γενίκευση Υπερπροσαρμογή (Overfitting) Ένα από τα βασικά προβλήματα που μπορεί να εμφανιστεί κατά την εκπαίδευση νευρωνικών δικτύων είναι αυτό της υπερβολικής εκπαίδευσης.

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

Μικροοικονοµική Θεωρία. Ζήτηση ενός αγαθού ως συνάρτηση της τιµής. Notes. Notes. Notes. Notes. Κώστας Ρουµανιάς. 22 Σεπτεµβρίου 2014

Μικροοικονοµική Θεωρία. Ζήτηση ενός αγαθού ως συνάρτηση της τιµής. Notes. Notes. Notes. Notes. Κώστας Ρουµανιάς. 22 Σεπτεµβρίου 2014 Μικροοικονοµική Θεωρία Κώστας Ρουµανιάς Ο.Π.Α. Τµήµα. Ε. Ο. Σ. 22 Σεπτεµβρίου 2014 Κώστας Ρουµανιάς (.Ε.Ο.Σ.) Μικροοικονοµική Θεωρία 22 Σεπτεµβρίου 2014 1 / 40 Ζήτηση ενός αγαθού ως συνάρτηση της τιµής

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ 2014-2020 ΕΝΟΤΗΤΑ «ΔΕΛΤΙΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΥΠΟΨΗΦΙΩΝ ΈΡΓΩΝ ΔΣ» 1η Έκδοση: 2016 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΕΙΣΑΓΩΓΗ...3

Διαβάστε περισσότερα

Σχεδιασμός εκτυπώσεων ERG

Σχεδιασμός εκτυπώσεων ERG Σχεδιασμός εκτυπώσεων ERG Περιεχόμενα Δημιουργία εκτυπώσεων ERG... 3 Επιλογή πεδίων... 4 Λεπτομέρειες... 6 Καθορισμός φίλτρων... 6 Ταξινόμηση και ομαδοποίηση... 7 Εξαγόμενο εκτύπωσης... 7 Δικαιώματα πρόσβασης...

Διαβάστε περισσότερα

Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών

Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών 3.5.1.1 Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών Ένα σύνηθες πρόβλημα που υπάρχει, είναι η ανάγκη αποστολής επιστολών ή πληροφοριών

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ 2014-2020 ΕΝΟΤΗΤΑ «ΔΕΛΤΙΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΥΠΟΨΗΦΙΩΝ ΣΧΕΔΙΩΝ ΧΟΡΗΓΙΩΝ» 1η Έκδοση: 2016 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΕΙΣΑΓΩΓΗ...3

Διαβάστε περισσότερα

Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων

Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων 5 BACKPROPAGATION MULTILAYER FEEDFORWARD ΔΙΚΤΥΑ Α. ΕΙΣΑΓΩΓΗ Τα νευρωνικά δίκτυα που εξετάσαµε µέχρι τώρα είχαν

Διαβάστε περισσότερα

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων... Μέρος 2 Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων... 211 Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων... 241 Kεφάλαιο 13 Ανάλυση δεδομένων... 257 Kεφάλαιο 14 Συναρτήσεις Μέρος Β... 285 Kεφάλαιο 15 Ευρετήριο

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Βάση δεδομένων είναι συσχετισμένα μεταξύ τους δεδομένα, οργανωμένα σε μορφή πίνακα. Οι γραμμές του πίνακα αποτελούν τις εγγραφές και περιλαμβάνουν τις πληροφορίες για μια οντότητα. Οι

Διαβάστε περισσότερα

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Πρακτική µε στοιχεία στατιστικής ανάλυσης Πρακτική µε στοιχεία στατιστικής ανάλυσης 1. Για να υπολογίσουµε µια ποσότητα q = x 2 y xy 2, µετρήσαµε τα µεγέθη x και y και βρήκαµε x = 3.0 ± 0.1και y = 2.0 ± 0.1. Να βρεθεί η ποσότητα q και η αβεβαιότητά

Διαβάστε περισσότερα

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α) Τμήμα Διοίκησης Επιχειρήσεων (Αγ. Νικόλαος), Τ.Ε.Ι. Κρήτης Σελίδα 1 από 13 5η Εργαστηριακή Άσκηση Σκοπός: Η παρούσα εργαστηριακή άσκηση στοχεύει στην εκμάθηση κατασκευής γραφημάτων που θα παρουσιάζουν

Διαβάστε περισσότερα