ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Αυτόµατη Κατάταξη Ερωτήσεων Φυσικής Γλώσσας σε Κατηγορίες. ηµήτριος Μαυροειδής Α.Μ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Αυτόµατη Κατάταξη Ερωτήσεων Φυσικής Γλώσσας σε Κατηγορίες. ηµήτριος Μαυροειδής Α.Μ. 3970050"

Transcript

1 ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Αυτόµατη Κατάταξη Ερωτήσεων Φυσικής Γλώσσας σε Κατηγορίες ηµήτριος Μαυροειδής Α.Μ Επιβλέπων Καθηγητής : Ίων Ανδρουτσόπουλος ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ, 2005

2 Περιεχόµενα ΠΕΡΙΛΗΨΗ ΕΙΣΑΓΩΓΗ 4 2. ΣΥΣΤΗΜΑΤΑ ΕΡΩΤΑΠΟΚΡΙΣΕΩΝ 2.1. TREC ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΥΣΤΗΜΑΤΩΝ ΕΡΩΤΑΠΟΚΡΙΣΕΩΝ ΚΑΤΑΤΑΞΗ ΕΡΩΤΗΣΕΩΝ ΣΕ ΚΑΤΗΓΟΡΙΕΣ ΠΡΟΗΓΟΥΜΕΝΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Η ΙΚΗ ΜΑΣ ΠΡΟΣΕΓΓΙΣΗ 8 3. ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ 3.1. ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ ΚΑΙ ΚΑΤΑΤΑΞΗ ΕΡΩΤΗΣΕΩΝ ΜΗΧΑΝΕΣ ΙΑΝΥΣΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ ΜΕΘΟ ΟΙ ΚΑΙ ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΤΗΣ ΕΡΓΑΣΙΑΣ 4.1. ΕΙΣΑΓΩΓΗ ΧΡΗΣΗ ΚΑΤΩΦΛΙΟΥ ΕΠΙΛΟΓΗ Ι ΙΟΤΗΤΩΝ ΜΕ ΒΑΣΗ ΤΟ ΠΛΗΡΟΦΟΡΙΑΚΟ ΚΕΡ ΟΣ ΧΡΗΣΗ ΑΚΟΛΟΥΘΙΩΝ ΛΕΞΕΩΝ ΩΣ Ι ΙΟΤΗΤΩΝ ΧΡΗΣΗ ΜΗ ΣΥΝΕΧΟΜΕΝΩΝ ΙΓΡΑΜΜΑΤΩΝ ΚΑΙ ΤΡΙΓΡΑΜΜΑΤΩΝ ΧΡΗΣΗ ΕΝΟΣ ΣΥΣΤΗΜΑΤΟΣ ΑΝΑΓΝΩΡΙΣΗΣ ΚΥΡΙΩΝ ΟΝΟΜΑΤΩΝ ΧΡΗΣΗ ΤΟΥ WORDNET ΣΥΓΚΕΝΤΡΩΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΠΙΘΑΝΕΣ ΒΕΛΤΙΩΣΕΙΣ.. 23 ΑΝΑΦΟΡΕΣ 24 2

3 ΠΕΡΙΛΗΨΗ Ένα σύστηµα ερωταποκρίσεων φυσικής γλώσσας για συλλογές εγγράφων καλείται να εντοπίσει στα έγγραφα µιας συλλογής (π.χ. τα αρχεία µιας εφηµερίδας ή τον Παγκόσµιο Ιστό) απαντήσεις σε ερωτήσεις που τίθενται σε φυσική γλώσσα. Για τη δηµιουργία της απάντησης απαιτείται η επεξεργασία της ερώτησης, η ανάκτηση σχετικών εγγράφων από τη συλλογή µε µια µηχανή ανάκτησης πληροφοριών, η επεξεργασία των εγγράφων, η αναζήτηση µέσα σε αυτά υποψηφίων απαντήσεων και η επιλογή της τελικής απάντησης. Η εργασία ασχολείται µε το πρώτο στάδιο, την επεξεργασία της ερώτησης, και πιο συγκεκριµένα µε την κατάταξη των ερωτήσεων σε κατηγορίες, ανάλογα µε τον τύπο της απάντησης που απαιτούν (π.χ. όνοµα προσώπου, τοποθεσίας, οργανισµού). Η κατηγορία της ερώτησης αποτελεί σηµαντική πληροφορία, την οποία αξιοποιεί στη συνέχεια το στάδιο αναζήτησης υποψηφίων απαντήσεων. Χρησιµοποιήθηκε κατά κύριο λόγο µηχανική µάθηση, πιο συγκεκριµένα Μηχανές ιανυσµάτων Υποστήριξης (Support Vector Machines), και κατά δεύτερο λόγο γλωσσικά εργαλεία και πόροι, όπως ένα σύστηµα Αναγνώρισης Κυρίων Ονοµάτων (Named Entity Recognition) και ο ιεραρχικός θησαυρός WordNet. Το σύστηµα που αναπτύχθηκε δέχεται ως είσοδο µια ερώτηση στα Αγγλικά και δίνει ως έξοδο την κατηγορία της ζητούµενης απάντησης. Πειραµατικά αποτελέσµατα δείχνουν ότι το σύστηµα επιτυγχάνει περίπου το ίδιο καλά αποτελέσµατα µε εκείνα προηγούµενων ερευνητών. 3

4 1. ΕΙΣΑΓΩΓΗ H αναζήτηση πληροφοριών σε συλλογές εγγράφων (π.χ. αρχεία εφηµερίδων ή ολόκληρο το Internet) γίνεται σήµερα κυρίως µε την υποβολή λέξεων-κλειδιών σε µια µηχανή ανάκτησης πληροφοριών ή αναζήτησης ιστοσελίδων. Η µηχανή επιστρέφει µια λίστα µε έγγραφα στα οποία βρήκε τις λέξεις-κλειδιά, επιστρατεύοντας και κριτήρια όπως το αν οι λέξεις-κλειδιά βρίσκονταν σε σηµαντικά σηµεία των εγγράφων (π.χ. τον τίτλο τους), αν είχαν µεγάλη συχνότητα εµφάνισης στα έγγραφα κλπ. Ο χρήστης στη συνέχεια πρέπει να εντοπίσει µόνος του στα έγγραφα που επεστράφησαν τις πληροφορίες που αναζητά, οι οποίες ενδέχεται να µην περιέχονται καν σε πολλά από αυτά τα έγγραφα. Τα συστήµατα ερωταποκρίσεων (question-answering systems) φυσικής γλώσσας για συλλογές εγγράφων επιχειρούν να επεκτείνουν τις δυνατότητες των σηµερινών µηχανών ανάκτησης πληροφοριών και αναζήτησης ιστοσελίδων. Επιτρέπουν στο χρήστη να εισάγει ερωτήσεις φυσικής γλώσσας (π.χ. «Ποιος σκότωσε τον Καποδίστρια;», «Ποια είναι η υψηλότερη βουνοκορφή στον κόσµο;», «Ποια η κοινή ονοµασία του ακετυλοσαλικυλικού οξέος;», «Από τι αποτελείται µια γραφοµηχανή;», «Τι είναι η caretta-caretta;»), αντί απλά λέξεις-κλειδιά, και προσπαθούν να επιστρέψουν ακριβείς απαντήσεις (π.χ. ονόµατα προσώπων, εταιριών, ηµεροµηνίες κλπ. ή σύντοµα αποσπάσµατα) αντί για λίστες εγγράφων. Ένα τέτοιο σύστηµα ακολουθεί συνήθως τα εξής στάδια επεξεργασίας: επεξεργασία της ερώτησης, ανάκτηση σχετικών εγγράφων από τη συλλογή µε µια µηχανή ανάκτησης πληροφοριών (ή αναζήτησης ιστοσελίδων) χρησιµοποιώντας τους όρους της ερώτησης ως λέξεις-κλειδιά, επεξεργασία των εγγράφων, αναζήτηση µέσα σε αυτά υποψηφίων απαντήσεων και επιλογή της τελικής απάντησης. Η εργασία ασχολείται µε το πρώτο στάδιο, την επεξεργασία της ερώτησης, και πιο συγκεκριµένα µε το υπο-στάδιο της κατάταξης των ερωτήσεων σε κατηγορίες, ανάλογα µε τον τύπο της απάντησης που απαιτούν (π.χ. όνοµα προσώπου, τοποθεσίας, οργανισµού). Η κατηγορία της ερώτησης αποτελεί σηµαντική πληροφορία, την οποία αξιοποιεί στη συνέχεια το στάδιο αναζήτησης υποψηφίων απαντήσεων. Χρησιµοποιήσαµε κατά κύριο λόγο µηχανική µάθηση, πιο συγκεκριµένα Μηχανές ιανυσµάτων Υποστήριξης (Support Vector Machines), και κατά δεύτερο λόγο γλωσσικά εργαλεία και πόρους, όπως ένα σύστηµα Αναγνώρισης Κυρίων Ονοµάτων (Named Entity Recognition) και τον ιεραρχικό θησαυρό WordNet. Το σύστηµα που αναπτύχθηκε δέχεται ως είσοδο µια ερώτηση στα Αγγλικά και δίνει ως έξοδο την κατηγορία της ζητούµενης απάντησης. Ο πρώτος στόχος της εργασίας ήταν να επαληθεύσουµε τα αποτελέσµατα των µεθόδων που δηµοσιεύθηκαν σε δύο προηγούµενες εργασίες των Zhang & Lee [39] και Li & Roth [18]. Ένας δεύτερος στόχος ήταν να βελτιώσουµε τις µεθόδους αυτές, ώστε να πετύχουµε καλύτερα αποτελέσµατα. Όσον αφορά τον πρώτο στόχο, επετεύχθησαν αποτελέσµατα ελαφρά υποδεέστερα από εκείνα των προηγούµενων εργασιών, γεγονός που οφείλεται κατά πάσα πιθανότητα στη χρήση διαφορετικών υλοποιήσεων αλγορίθµων µηχανικής µάθησης. Όσον αφορά το δεύτερο στόχο, αξιολογήσαµε πειραµατικά διάφορες παραλλαγές των προηγούµενων µεθόδων, προσπαθώντας να τις βελτιώσουµε, αλλά δεν καταφέραµε να ξεπεράσουµε τα ποσοστά επιτυχίας των προηγούµενων εργασιών. Η εργασία ξεκινά µε µια σύντοµη περιγραφή των συστηµάτων ερωταποκρίσεων (κεφάλαιο 2). Στη συνέχεια (κεφάλαιο 3) γίνεται µια εισαγωγή στη µηχανική µάθηση, καθώς και τον αλγόριθµο που χρησιµοποιείται στην εργασία τις Μηχανές ιανυσµάτων Υποστήριξης. Στο τέταρτο κεφάλαιο περιγράφονται αναλυτικά οι µέθοδοι που διερευνήσαµε και τα αποτελέσµατα των πειραµάτων µας. 4

5 Το πέµπτο κεφάλαιο αναφέρει τα συµπεράσµατά µας και πιθανές βελτιώσεις που επιδέχεται η προσέγγισή µας. 5

6 2. ΣΥΣΤΗΜΑΤΑ ΕΡΩΤΑΠΟΚΡΙΣΕΩΝ 2.1. TREC Με σκοπό τη δηµιουργία ολοκληρωµένων συστηµάτων ανάκτησης πληροφοριών, δηµιουργήθηκε µε πρωτοβουλία του NIST (National Institute of Standards and Technology) και του Υπουργείου Αµύνης των ΗΠΑ το Συνέδριο Ανάκτησης Πληροφοριών (TREC Text REtrieval Conference [37], βλ. Το TREC έχει σκοπό την υποστήριξη της έρευνας στο αντικείµενο της ανάκτησης πληροφοριών, παρέχοντας την απαραίτητη υποδοµή για µεγάλης κλίµακας πειραµατική αξιολόγηση σχετικών µεθόδων. Το συνέδριο διοργανώνει κάθε χρόνο διαγωνισµούς συστηµάτων ανάκτησης πληροφοριών. Οι διαγωνισµοί ξεκίνησαν το 1992 και συνεχίζεται έκτοτε µε συνεχώς περισσότερους συµµετέχοντες. Οι διαγωνισµοί του TREC διευρύνονται συνεχώς µε νέους τοµείς (tracks). Το 1999 (TREC-8) δηµιουργήθηκε ο τοµέας για τα συστήµατα ερωταποκρίσεων. Από τότε έχουν παρουσιαστεί πολλά συστήµατα ερωταποκρίσεων και έχουν προταθεί διαφορετικές προσεγγίσεις και αρχιτεκτονικές. Σε γενικές γραµµές, όµως, η πλειοψηφία των συστηµάτων ερωταποκρίσεων ακολουθεί τη γενική αρχιτεκτονική που περιγράφεται παρακάτω ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΥΣΤΗΜΑΤΩΝ ΕΡΩΤΑΠΟΚΡΙΣΕΩΝ Ένα σύστηµα ερωταποκρίσεων ακολουθεί συνήθως τρία στάδια επεξεργασίας: α) Το πρώτο στάδιο είναι η επεξεργασία της ερώτησης. Αυτό είναι ένα απαραίτητο βήµα για να καταλάβουµε τι ακριβώς ζητάει η ερώτηση. Η επεξεργασία της ερώτησης περιλαµβάνει, µεταξύ άλλων, τον καθορισµό του τύπου της απάντησης που αναµένεται. Γνωρίζοντας, παραδείγµατος χάριν, ότι αναζητάµε ένα όνοµα προσώπου, στενεύουµε κατά πολύ τον ορίζοντα αναζήτησης της απάντησης, αφού µπορούµε να περιοριστούµε σε τµήµατα εγγράφων που αποτελούν ή περιέχουν ονόµατα προσώπων. Μπορούµε επίσης, κατά την ανάλυση της ερώτησης, να πάρουµε και πληροφορίες άλλου τύπου, όπως τους όρους της ερώτησης, το συντακτικό της δέντρο, συνώνυµα των όρων της ερώτησης κλπ., τις οποίες αξιοποιούν τα µετέπειτα στάδια. β) Το δεύτερο στάδιο διεξάγει αναζήτηση για υποψήφιες απαντήσεις στη συλλογή εγγράφων. Το στάδιο αυτό αποτελείται συχνά από τρία υπο-στάδια. Το πρώτο υποβάλλει τους όρους της ερώτησης (πιθανώς επεκτείνοντάς τους µε συνώνυµα κλπ.) σε µια µηχανή ανάκτησης πληροφοριών ή αναζήτησης ιστοσελίδων, η οποία επιστρέφει σχετικά έγγραφα. Το δεύτερο επεξεργάζεται τα έγγραφα που επεστράφησαν (π.χ. διαχωρισµός σε περιόδους, συντακτική ανάλυση, εντοπισµός κυρίων ονοµάτων κλπ.). Το τρίτο εντοπίζει υποψήφιες απαντήσεις µέσα στα έγγραφα που επεστράφησαν (π.χ. προτάσεις που περιέχουν ονόµατα προσώπων αν η ερώτηση ζητά όνοµα προσώπου). γ) Στο τρίτο στάδιο γίνεται η επιλογή της υποψήφιας απάντησης ή κάποιου µέρους της που θα αποτελέσει την τελική απάντηση του συστήµατος στη δοθείσα ερώτηση. Αυτή η επιλογή γίνεται συνήθως χρησιµοποιώντας αλγορίθµους µηχανικής µάθησης, αφού οι υποψήφιες απαντήσεις παρασταθούν ως διανύσµατα ιδιοτήτων που περιλαµβάνουν πληροφορίες όπως το ποσοστό των όρων της ερώτησης που περιέχει 6

7 η υποψήφια απάντηση, το κατά πόσον το συντακτικό δέντρο της υποψήφιας απάντησης ταιριάζει µε εκείνο της ερώτησης κλπ ΚΑΤΑΤΑΞΗ ΕΡΩΤΗΣΕΩΝ ΣΕ ΚΑΤΗΓΟΡΙΕΣ Σκοπός της παρούσης εργασίας ήταν να κατασκευαστεί ένα σύστηµα για το υπο-στάδιο που προσδιορίζει τον τύπο της αναµενόµενης απάντησης κάθε ερώτησης, δηλαδή ένα σύστηµα που θα δέχεται ως είσοδο ερωτήσεις και θα τις ταξινοµεί σε κατηγορίες, ανάλογα µε τους τύπους των απαντήσεων που ζητούν. Για την κατάταξη των ερωτήσεων σε κατηγορίες έχουν προταθεί πολλοί τρόποι από ερευνητές της περιοχής ([8], [10], [12], [18], [35], [36], [39]). Οι περισσότεροι κατασκευάζουν κανόνες που εξετάζουν τις λέξεις των ερωτήσεων. Κυρίως λαµβάνεται υπόψιν η πρώτη λέξη αυτό είναι εύλογο, καθώς, παραδείγµατος χάριν, όταν ζητάµε να µάθουµε το όνοµα κάποιου προσώπου η ερώτηση συχνά ξεκινά µε «Ποιος», «Ποια», «Ποιο» κτλ., ενώ ερωτήσεις που ξεκινούν µε «Πού», «Πότε», «Πώς», «Γιατί» κατά κανόνα ζητούν τοποθεσία, χρόνο, τρόπο και αιτία, αντίστοιχα. Υπάρχουν, όµως, ερωτήσεις των οποίων το ζητούµενο δεν είναι τόσο εύκολο να διαπιστωθεί. Αυτές µπορεί να ξεκινούν από «Τι», «Ονόµασε», «Από τι» κ.α. Παραδείγµατα είναι τα εξής: «Τι είναι το αυγό του Κολόµβου;», «Ονόµασε τους 7 σοφούς της αρχαιότητας.», «Από τι φτιάχνεται η ταραµοσαλάτα;». Στις ερωτήσεις αυτές υπάρχει µεγάλη δυσκολία εντοπισµού της κατηγορίας τους τι, δηλαδή, ζητάνε ως απάντηση. Έχουν προταθεί διάφοροι τρόποι για να ξεπεραστεί αυτή η δυσκολία. Ένας από αυτούς είναι η χρήση επιβλεπόµενης µηχανικής µάθησης (βλέπε κεφάλαιο 3). Στην περίπτωση που χρησιµοποιείται επιβλεπόµενη µηχανική µάθηση, πρέπει πρώτα να κατασκευάσουµε κατηγορίες ερωτήσεων. Επιλέξαµε τις ίδιες κατηγορίες που χρησιµοποίησαν οι Zhang & Lee [39] και Li & Roth [18], γεγονός που µας βοηθά στη σύγκριση των αποτελεσµάτων µας µε εκείνα που έχουν δηµοσιεύσει οι συγκεκριµένοι ερευνητές. Στη συνέχεια, πρέπει να κατασκευαστεί ένα σύνολο ερωτήσεων που θα αποτελέσουν τα δεδοµένα εκπαίδευσης του αλγορίθµου µηχανικής µάθησης κάθε µία από αυτές τις ερωτήσεις πρέπει να αντιστοιχηθεί χειρωνακτικά µε την κατηγορία (ή τις κατηγορίες) στην οποία ανήκει. Ο αλγόριθµος µηχανικής µάθησης εκπαιδεύεται στα δεδοµένα εκπαίδευσης, και στη συνέχεια χρησιµοποιείται για να καταταχθούν σε κατηγορίες νέες ερωτήσεις των οποίων δεν γνωρίζουµε τις σωστές κατηγορίες. Η αξιοπιστία του συστήµατος, δηλαδή το ποσοστό των ερωτήσεων που κατατάσσεται στη σωστή κατηγορία, υπολογίζεται µε τη βοήθεια µιας ξεχωριστής συλλογής ερωτήσεων αξιολόγησης ΠΡΟΗΓΟΥΜΕΝΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Στο παρελθόν υπήρξαν ορισµένοι ερευνητές οι οποίοι χρησιµοποίησαν µηχανική µάθηση για την κατάταξη ερωτήσεων, µε πολύ καλά αποτελέσµατα. Μεταξύ αυτών αποφασίσαµε να στηριχθούµε στις εργασίες των Zhang & Lee [39] και Li & Roth [18], οι οποίες είχαν τα καλύτερα αποτελέσµατα. Τα αποτελέσµατα των εργασιών αυτών συγκρίνονται µε τα αποτελέσµατα του δικού µας συστήµατος στο κεφάλαιο 4. Χρονικά προηγήθηκε η εργασία των Li & Roth [18], η οποία χρησιµοποίησε τον αλγόριθµο µηχανικής µάθησης SNoW και πέτυχε ποσοστό επιτυχίας 84,2% κατά την κατάταξη των ερωτήσεων. Ακολούθησαν οι Zhang & Lee [39], οι οποίοι ακολούθησαν την ίδια µεθοδολογία µε τους προηγούµενους, µε τη διαφορά ότι 7

8 χρησιµοποίησαν Μ Y (Μηχανή ιανυσµάτων Υποστήριξης). Χρησιµοποιώντας µια Μ Y µε έναν πυρήνα που µπορεί να εκµεταλλεύεται και πληροφορίες για τη συντακτική δοµή της ερώτησης, πέτυχαν ποσοστά επιτυχίας µέχρι και 80,2% Η ΙΚΗ ΜΑΣ ΠΡΟΣΕΓΓΙΣΗ Έχοντας υπόψη τα παραπάνω καλά αποτελέσµατα, πρώτος στόχος της εργασίας ήταν να τα επιβεβαιώσει. Ακολουθήσαµε µε προσοχή τα βήµατα των παραπάνω δύο εργασιών και καταλήξαµε σε παρόµοια αποτελέσµατα. Τα ποσοστά µας ήταν ελαφρώς χαµηλότερα, γεγονός που οφείλεται κατά πάσα πιθανότητα στην υλοποίηση και τις παραµέτρους της Μ Υ που χρησιµοποιήσαµε. Η υλοποίηση της Μ Υ στην οποία στηριχθήκαµε περιέχεται στο Weka 1, ένα γενικό εργαλείο µηχανικής µάθησης, ενώ χρησιµοποιήσαµε τις προεπιλεγµένες τιµές των παραµέτρων. Έγιναν πειράµατα µε πολυωνυµικό πυρήνα της Μ Υ και διαφορετικές τιµές για το βαθµό του πυρήνα. Η Μ Υ µάς έδινε καλύτερα αποτελέσµατα για πολυωνυµικό πυρήνα 2 ου βαθµού, αλλά δεν µπορούσε να διαχειριστεί µεγάλα σύνολα εκπαίδευσης (πάνω από 300 ερωτήσεις) λόγω µεγάλων απαιτήσεων σε µνήµη. Έτσι περιοριστήκαµε σε πυρήνα 1 ου βαθµού (γραµµική Μ Υ). Μεταξύ των βελτιώσεων που διερευνήσαµε ήταν η χρήση του εργαλείου Αναγνώρισης Κυρίων Ονοµάτων (Named Entity Recognizer) που περιλαµβάνεται στο ελεύθερα διαθέσιµο σύστηµα GATE 2, ένα γενικό σύστηµα ανάπτυξης εφαρµογών φυσικής γλώσσας. Με τη βοήθεια του εργαλείου αυτού, αντικαταστάθηκαν τα κύρια ονόµατα που περιέχονταν στις ερωτήσεις µε τους τύπους των ονοµάτων, ώστε να δοθεί στη Μ Υ η δυνατότητα µεγαλύτερης γενίκευσης. Για παράδειγµα, τα ονόµατα «United Nations» και «Marie Curie» αντικαταστάθηκαν από τους τύπους «Organization» και «Person» αντίστοιχα. Πειραµατιστήκαµε, επίσης, µε τη χρήση του ιεραρχικού θησαυρού λέξεων WordNet 3 [7]. Το WordNet παρέχει, µεταξύ άλλων, πληροφορίες για τα συνώνυµα, υπερώνυµα, υπώνυµα κλπ. των διαφόρων λέξεων και οι πληροφορίες αυτές µπορούν να χρησιµοποιηθούν, παραδείγµατος χάριν, για την αντικατάσταση λέξεων της ερώτησης µε λέξεις γενικότερης σηµασίας, κατ αντιστοιχία µε την αντικατάσταση κυρίων ονοµάτων µε τους τύπους τους, ώστε και πάλι να δοθεί στη Μ Υ η δυνατότητα µεγαλύτερης γενίκευσης

9 3. ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ 3.1. ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ ΚΑΙ ΚΑΤΑΤΑΞΗ ΕΡΩΤΗΣΕΩΝ Η Μηχανική Μάθηση αποτελεί έναν κλάδο της Τεχνητής Νοηµοσύνης ο οποίος αναπτύσσει τεχνικές που επιτρέπουν σε υπολογιστικά συστήµατα να «µαθαίνουν», δηλαδή να αυτοβελτιώνονται µέσω της αξιοποίησης εµπειρικών δεδοµένων του παρελθόντος. Ένας πιο ακριβής ορισµός ανήκει στον Mitchell [22] : Ένα πρόγραµµα µαθαίνει από την εµπειρία που αποκτά κατά την εκτέλεση ενός συνόλου διεργασιών, εφόσον η απόδοσή του βελτιώνεται µε την αξιοποίηση της εµπειρίας αυτής. Συνήθως η εµπειρία αναφέρεται και ως «εδοµένα Εκπαίδευσης». Στην παρούσα εργασία ασχολούµαστε µε Επιβλεπόµενη Μηχανική Μάθηση, όπου τα δεδοµένα εκπαίδευσης έχουν συνήθως τη µορφή διανυσµάτων και κάθε διάνυσµα αποτελείται από µια τιµή-στόχο και πολλές τιµές ιδιοτήτων. Ας θεωρήσουµε ένα απλοϊκό παράδειγµα: Έστω ότι διαθέτουµε έναν µετρητή ταχύτητας ανέµου, ένα βαρόµετρο και ένα θερµόµετρο. Θέλουµε να φτιάξουµε ένα υποτυπώδες σύστηµα πρόβλεψης του καιρού. Κάθε µέρα στις 18:00, παίρνουµε µετρήσεις από τα τρία όργανα που διαθέτουµε και καταγράφουµε τις τιµές που αυτά δείχνουν. Την επόµενη µέρα το πρωί καταγράφουµε αν έχει λιακάδα ή συννεφιά. Εισάγουµε τις τέσσερις αυτές τιµές σε ένα διάνυσµα. Ας υποθέσουµε ότι κάνουµε µετρήσεις για ένα έτος. Στο τέλος του έτους θα έχουµε 365 διανύσµατα της µορφής: t = {[ ταχ ύτητα _ αν έµου ],[ ατµοσφαιρικ ή_ πίεση ],[ θερµοκρασ ία],[ αυριανός _ καιρός ]} Στα διανύσµατα αυτά, οι τρεις πρώτες τιµές αποτελούν τιµές των ιδιοτήτων «ταχύτητα ανέµου», «ατµοσφαιρική πίεση» και «θερµοκρασία», και η τελευταία τιµή είναι η τιµή-στόχος. Με διαφορετική ορολογία, θα µπορούσαµε να πούµε ότι οι τρεις πρώτες τιµές αποτελούν τα ορίσµατα µιας συνάρτησης και η τελευταία τιµή το αποτέλεσµά της. Παραδείγµατα τέτοιων διανυσµάτων είναι τα u και v παρακάτω: u = {6, 910,14, συννεφιά} v = {3,1025, 25, λιακάδα} Τα 365 διανύσµατα εισάγονται σε ένα σύστηµα µηχανικής µάθησης ως δεδοµένα εκπαίδευσης. Το σύστηµα εκπαιδεύεται µε βάση αυτά τα διανύσµατα σύµφωνα µε κάποιον αλγόριθµο µάθησης. Στη συνέχεια, δίνοντας στο σύστηµα οποιεσδήποτε τιµές ταχύτητας ανέµου, ατµοσφαιρικής πίεσης και θερµοκρασίας, πρέπει να µπορεί να µας δώσει πρόβλεψη για τον αυριανό καιρό (δηλαδή µία από τις τιµές «λιακάδα» ή «συννεφιά»). Η τιµή-στόχος, στο παραπάνω παράδειγµα, είναι δυαδική («λιακάδα» - «συννεφιά»). Υπάρχουν περιπτώσεις όπου η τιµή-στόχος µπορεί να έχει πάνω από δύο εκδοχές. Στο ίδιο παράδειγµα χάριν εµπλουτισµού των προβλέψεών µας µπορούµε να έχουµε επιπλέον «βροχή», «καταιγίδα», «καύσωνας», κ.ο.κ. Κάποιοι αλγόριθµοι µηχανικής µάθησης είναι εκ κατασκευής δυαδικοί, µπορούν, δηλαδή, να αντιµετωπίσουν µόνο 2 τιµές-στόχους. Συχνά, όµως, µε κατάλληλες µετατροπές µπορούν να αντιµετωπίσουν πάνω από 2 τιµές-στόχους. 9

10 Ας επιστρέψουµε τώρα στο πρόβληµα της κατάταξης ερωτήσεων σε κατηγορίες. Η τιµή-στόχος είναι η κατηγορία στην οποίαν ανήκει η ερώτηση. Στην απλούστερη περίπτωση, κάθε µία από τις ιδιότητες δείχνει αν εµφανίζεται ή όχι στην ερώτηση κάποια συγκεκριµένη λέξη. Έτσι, ένα διάνυσµα εκπαίδευσης που θα εισαγόταν στο σύστηµα µηχανικής µάθησης θα µπορούσε να µοιάζει µε το παρακάτω: v = {0,0,1,0,1,1,1,0,0,0,27} Θεωρούµε εδώ πως έχουµε 10 συνολικά ιδιότητες, που αντιστοιχούν κατά σειρά στις λέξεις «και», «αν», «πώς», «αλλά», «φτιάχνονται», «τα», «γαριδάκια», «γιατί», «τι», «από». Το παραπάνω διάνυσµα µας λέει ότι η ερώτηση περιέχει τις λέξεις: «πώς», «φτιάχνονται», «τα» και «γαριδάκια», ενώ δεν περιέχει καµία άλλη λέξη που αντιστοιχεί σε ιδιότητα. Επίσης, µας λέει ότι ο τύπος της ερώτησης είναι «27». Το «27» αντιπροσωπεύει µια κατηγορία ερώτησης, όπως «Πρόσωπο», «Τοποθεσία», «Αντικείµενο» κ.τ.λ. Στην εργασία των Li & Roth [18] χρησιµοποιείται ο αλγόριθµος µηχανικής µάθησης SNoW [3], µε τη βοήθεια του οποίου αναπτύχθηκε ένας ταξινοµητής που µπορεί να κατατάξει κάθε ερώτηση σε µια από τις 50 κατηγορίες µιας ιεραρχικής ταξινοµίας ερωτήσεων. Στα πειράµατά τους, οι Li και Roth χρησιµοποίησαν ως δεδοµένα εκπαίδευσης σύνολα των 1000, 2000, 3000, 4000, και 5452 ερωτήσεων και ένα σύνολο 500 ερωτήσεων ως δεδοµένα αξιολόγησης. Για τις 5452 ερωτήσεις, το ποσοστό ορθής κατάταξης νέων ερωτήσεων ήταν 84,2%. Η εργασία των Zhang & Lee [39] συγκρίνει διαφόρους αλγορίθµους µηχανικής µάθησης (Nearest Neighbor [38], Naïve Bayes [19], C4.5 [31], SNoW [3]). Επίσης, χρησιµοποιεί ως ιδιότητες εκτός από απλές λέξεις και ακολουθίες λέξεων (ngrams). Η εργασία επικεντρώνεται στις Μηχανές ιανυσµάτων Υποστήριξης και δείχνει πως οι Μ Υ δίνουν καλύτερα αποτελέσµατα από τους άλλους αλγορίθµους. Συγκεκριµένα, µε το ίδιο σύνολο των 5452 ερωτήσεων εκπαίδευσης και 500 ερωτήσεων αξιολόγησης που χρησιµοποίησαν οι Li & Roth [18], το ποσοστό ορθής κατάταξης νέων ερωτήσεων της Μ Υ ήταν 80,2%, ενώ του SNoW ήταν 74%. Η διαφορά που προκύπτει στα ποσοστά επιτυχίας του SNoW ανάµεσα στις δύο εργασίες, οφείλεται κατά πάσα πιθανότητα στη χρήση κατωφλίου ίσου µε 10 από τους Zhang & Lee [39] (βλ. ενότητα 4.2 παρακάτω) ΜΗΧΑΝΕΣ ΙΑΝΥΣΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ Οι Μ Υ είναι µια οικογένεια µεθόδων επιβλεπόµενης µάθησης, που µπορούν, µεταξύ άλλων, να χρησιµοποιηθούν στην κατάταξη διαφόρων αντικειµένων σε κατηγορίες. Οι Μ Υ µπορούν γενικά να διαχωριστούν σε δυαδικές (διταξικές binary) και πολυταξικές (multiclass). Οι πολυταξικές Μ Υ µπορούν, στην απλούστερη περίπτωση, να υλοποιηθούν ως διαδοχική εφαρµογή δυαδικών Μ Υ. Οι δυαδικές Μ Υ δηµιουργούν ένα υπερεπίπεδο µεγίστου περιθωρίου, το οποίο βρίσκεται σε ένα διαφοροποιηµένο από τον αρχικό διανυσµατικό χώρο, που προκύπτει µε τη χρήση ενός εν γένει µη γραµµικού µετασχηµατισµού. εδοµένων διανυσµάτων εκπαίδευσης που έχουν ταξινοµηθεί σε µία από τις δύο κατηγορίες 0 ή 1, το υπερεπίπεδο επιχειρεί να διαχωρίσει στο νέο χώρο τα διανύσµατα εκπαίδευσης έτσι ώστε η απόσταση του υπερεπιπέδου από τα κοντινότερα διανύσµατα εκπαίδευσης (το περιθώριο) να είναι η µέγιστη δυνατή. Η χρήση του υπερεπιπέδου µεγίστου περιθωρίου στηρίζεται στη Θεωρία Στατιστικής Μάθησης, που προσφέρει ένα όριο πιθανοτικού σφάλµατος ελέγχου το οποίο ελαχιστοποιείται όταν το 10

11 περιθώριο µεγιστοποιείται. Η εξεύρεση του βέλτιστου υπερεπιπέδου γίνεται µε την επίλυση ενός προβλήµατος βελτιστοποίησης µε µεθόδους µαθηµατικού προγραµµατισµού. Για περισσότερες πληροφορίες, ανατρέξτε στο βιβλίο των Cristianini και Shawe-Taylor [5]. 11

12 4. ΜΕΘΟ ΟΙ ΚΑΙ ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΤΗΣ ΕΡΓΑΣΙΑΣ 4.1. ΕΙΣΑΓΩΓΗ Ο πρώτος στόχος ήταν η επανάληψη των πειραµάτων των εργασιών των Zhang & Lee [39], Li & Roth [18] και η επίτευξη παραπλησίων ποσοστών επιτυχίας στην κατάταξη των ερωτήσεων σε κατηγορίες. Χρησιµοποιήσαµε στα πειράµατά µας το ίδιο σύνολο ερωτήσεων που χρησιµοποίησαν οι Li & Roth [18], το οποίο υιοθέτησαν και οι Zhang & Lee [39], ώστε τα αποτελέσµατά µας να είναι συγκρίσιµα. Το σύνολο αυτό αποτελείται από 5452 ερωτήσεις εκπαίδευσης και 500 ερωτήσεις αξιολόγησης. (Τα σύνολα των ερωτήσεων βρίσκονται στο διαδικτυακό τόπο: [18].) Για το σύνολο εκπαίδευσης, διατίθενται 5 υποσύνολα των 1000, 2000, 3000, 4000 και 5452 ερωτήσεων, που χρησιµοποιούνται σε πειράµατα µε µεταβλητό µέγεθος δεδοµένων εκπαίδευσης. Οι 500 ερωτήσεις αξιολόγησης προέρχονται από το TREC-10. Χρησιµοποιήσαµε, επίσης, τις ίδιες κατηγορίες ερωτήσεων µε εκείνες των Li & Roth [18]. Οι κατηγορίες είναι δύο επιπέδων, όπως φαίνεται στον παρακάτω πίνακα. Στο πρώτο επίπεδο υπάρχουν γενικές κατηγορίες και στο δεύτερο πιο ειδικές. Κυρίως κατηγορία Υποκατηγορία # ABBREV. Abb 1 Exp 2 ENTITY Animal 3 Body 4 Colour 5 Creative 6 Currency 7 Dis.med. 8 Event 9 Food 10 Instrument 11 Lang 12 Letter 13 Other 14 Plant 15 Product 16 Religion 17 Sport 18 Substance 19 Symbol 20 Technique 21 Term 22 Vehicle 23 Word 24 DESCRIPTION Definition 25 Description 26 Manner 27 Reason 28 HUMAN Group 29 Individual 30 Title 31 Description 32 LOCATION City 33 12

13 Country 34 Mountain 35 Other 36 State 37 NUMERIC Code 38 Count 39 Date 40 Distance 41 Money 42 Order 43 Other 44 Period 45 Percent 46 Speed 47 Temp 48 Size 49 Weight 50 Στα πειράµατά µας λάβαµε υπόψη µας µόνο τα ποσοστά επιτυχίας για τις ειδικές κατηγορίες (του 2 ου επιπέδου). Η επιλογή αυτή έγινε διότι η γνώση της γενικής κατηγορίας των ερωτήσεων δεν βοηθάει τόσο στην απάντηση ερωτήσεων όσο εκείνη των ειδικών κατηγοριών. Όπως προαναφέρθηκε, στα πειράµατά µας χρησιµοποιήσαµε την υλοποίηση των Μ Υ που περιέχεται στο Weka, µε τις προεπιλεγµένες τιµές των παραµέτρων της. 4 Το Weka είναι ένα εργαλείο µηχανικής µάθησης που περιέχει υλοποιήσεις των περισσοτέρων γνωστών αλγορίθµων µηχανικής µάθησης. Είναι γραµµένο σε JAVA και είναι σχετικά εύκολο στη χρήση του. Όσον αφορά τις Μ Υ, το Weka υλοποιεί τον αλγόριθµο Σειριακής Ελάχιστης Βελτιστοποίησης (Sequential Minimal Optimization - SMO) [28]. Αντίθετα, οι Zhang & Lee [39], χρησιµοποίησαν το LIBSVM [31], µια άλλη υλοποίηση Μ Υ, ενώ οι Li & Roth [18] χρησιµοποίησαν το SNoW [3], το οποίο ανήκει στην κατηγορία των αλγορίθµων που χρησιµοποιούν πυρήνα (kernel method), αλλά δεν είναι Μ Υ. Στην απλούστερη περίπτωση που δοκιµάσαµε, κάθε ερώτηση παριστάνεται από ένα διάνυσµα του οποίου οι ιδιότητες έχουν τιµές 0 ή 1. Κάθε ιδιότητα αντιστοιχεί σε µια διαφορετική λέξη και δείχνει αν η λέξη εµφανίζεται στην ερώτηση ή όχι. Τα διανύσµατα περιλαµβάνουν µία ιδιότητα για κάθε λέξη που εµφανίζεται πάνω από δύο φορές στη συλλογή εκπαίδευσης. Αφού πετύχαµε αποτελέσµατα παρόµοια µε των προαναφερθέντων εργασιών, διερευνήσαµε το κατά πόσον τα αποτελέσµατα βελτιώνονται χρησιµοποιώντας διαφορετικές διανυσµατικές αναπαραστάσεις των ερωτήσεων. Πιο συγκεκριµένα, εξερευνήσαµε τα ακόλουθα: α) Χρήση κατωφλιού για τη συχνότητα εµφάνισης των λέξεων. Απορρίπτουµε λέξεις που εµφανίζονται πολύ λίγες φορές, δηλαδή δεν τις αντιστοιχούµε σε ιδιότητες. β) Επιλογή ιδιοτήτων µε το µέτρο του πληροφοριακού κέρδους (information gain). γ) Χρήση 2 ή 3 συνεχοµένων λέξεων ως ιδιοτήτων (διγράµµατα και τριγράµµατα), δ) Χρήση διγραµµάτων και τριγραµµάτων που δεν αποτελούνται απαραίτητα από συνεχόµενες λέξεις. 4 Για τις ανάγκες της εργασίας χρησιµοποιήθηκε ένα σύστηµα Pentium 4 στα 3,2 GHz µε 1,5 GB RAM. 13

14 ε) Ειδική σήµανση της αρχής µιας ερώτησης και προσθήκη της ως λέξης. στ) Απαλοιφή των λέξεων που αποτελούνται από τρία γράµµατα και κάτω εκτός των ερωτηµατικών µορίων. Έτσι απαλείφουµε συνδέσµους όπως το «and», «not», κ.τ.λ.. ζ) Χρήση ενός Εργαλείου Αναγνώρισης Κυρίων Ονοµάτων (Named Entity Recognizer) για την αντικατάσταση των κυρίων ονοµάτων στις ερωτήσεις µε τους τύπους τους (πρόσωπο, τοποθεσία κλπ.). η) Χρήση του WordNet, ώστε να προστίθενται σε κάθε ερώτηση τα συνώνυµα και υπερώνυµα του πρώτου ουσιαστικού της ερώτησης. Παρακάτω θα αναλύσουµε µία προς µία τις ιδέες αυτές και τα αποτελέσµατα που αυτές µας έδωσαν. Στο τέλος θα συγκρίνουµε όλα τα αποτελέσµατα σε ένα διάγραµµα για να διαπιστωθούν οι διαφορές ανάµεσά τους ΧΡΗΣΗ ΚΑΤΩΦΛΙΟΥ Επειδή µια γραµµική Μ Υ στηρίζεται στον υπολογισµό εσωτερικών γινοµένων των διανυσµάτων εκπαίδευσης, η επεξεργαστική ισχύς που απαιτεί αυξάνεται µε την αύξηση των ιδιοτήτων, µε αποτέλεσµα να καθυστερεί η ολοκλήρωση των πειραµάτων. (Αυτό ήταν σηµαντικό πρόβληµα στην περίπτωση της υλοποίησης που χρησιµοποιήσαµε, η οποία είναι ιδιαίτερα αργή µε µεγάλα σύνολα ιδιοτήτων.) Επίσης, η χρήση πολύ µεγάλου αριθµού άχρηστων ιδιοτήτων ενδέχεται να προσθέτει θόρυβο στα δεδοµένα εκπαίδευσης, εµποδίζοντας την Μ Υ να επιτύχει καλό διαχωρισµό των κατηγοριών. Έτσι είναι λογικό να προσπαθήσει κανείς να απαλείψει τις λιγότερο χρήσιµες ιδιότητες. Η πρώτη ιδέα ήταν να αφαιρέσουµε τις λέξεις (να µην τις αντιστοιχούµε σε ιδιότητες) που εµφανίζονται συνολικά κάτω από n φορές στο σύνολο εκπαίδευσης. Κάναµε πειράµατα για διάφορες τιµές του n και βρήκαµε ότι η καλύτερη αντιστάθµιση του χρόνου εκτέλεσης των πειραµάτων µε την επιθυµητή ακρίβεια επιτυγχάνεται στην περίπτωσή µας για n=3 (Οι Zhang & Lee [39] χρησιµοποίησαν κατώφλι ίσο µε 10 στην εργασία τους.) Όλα αυτά γίνονται πιο κατανοητά αν κοιτάξουµε τον πίνακα παρακάτω: Αριθµός ερωτήσεων Αριθµός λέξεων Κατώφλι εκπαίδευσης (ιδιοτήτων) Επιτυχία ,8% ,6% % ,8% ,4% ,0% ,8% ,8% ,0% ,2% ,0% ,0% ,8% ,8% 14

15 Για 5452 ερωτήσεις και κατώφλι 1 δεν κατορθώσαµε να ολοκληρώσουµε το πείραµα, διότι οι απαιτήσεων µνήµης της υλοποίησης Μ Υ που χρησιµοποιήσαµε ξεπερνούσαν τις δυνατότητες του υπολογιστή µας ΕΠΙΛΟΓΗ Ι ΙΟΤΗΤΩΝ ΜΕ ΒΑΣΗ ΤΟ ΠΛΗΡΟΦΟΡΙΑΚΟ ΚΕΡ ΟΣ Ένας άλλος τρόπος απαλοιφής ιδιοτήτων είναι η χρήση του µέτρου του πληροφοριακού κέρδους, ώστε να επιλεγούν µόνο οι ιδιότητες που δίνουν την περισσότερη πληροφορία στη Μ Υ. Χρησιµοποιήθηκε η σχετική βιβλιοθήκη «weka.attributeselection.infogainattributeeval». Οι µέθοδοι που παρέχει εκτιµούν την αξία µιας ιδιότητας Attribute µετρώντας το πληροφοριακό κέρδος που παρέχει σύµφωνα µε τον παρακάτω τύπο: InfoGain(Class,Attribute) = H(Class) - H(Class Attribute) όπου H(Class) η εντροπία της τυχαίας µεταβλητής Class που παριστάνει την κατηγορία της ερώτησης και H(Class Attribute) η αναµενόµενη εντροπία της Class δοθείσης της τιµής της ιδιότητας Attribute. Οι ιδιότητες στη συνέχεια κατατάσσονται µε βάση το πληροφοριακό κέρδος που προσφέρουν (από το µεγαλύτερο πληροφοριακό κέρδος στο µικρότερο). Επιλέξαµε να κάνουµε πειράµατα µε το 20%, 40%, 60%, 80% των ιδιοτήτων, κρατώντας κάθε φορά εκείνες που προσφέρουν το µεγαλύτερο πληροφοριακό κέρδος. Τα καλύτερα αποτελέσµατα τα είχαµε για το 60%. Τα πειράµατα µε βάση το πληροφοριακό κέρδος µείωσαν οριακά τα ποσοστά επιτυχίας για τα σύνολα ερωτήσεων των 1000, 2000, και 3000 ερωτήσεων µέχρι και 0,6%. Για τα σύνολα των 4000 και 5452 ερωτήσεων είχαµε µια οριακή αύξηση στα ποσοστά επιτυχίας κατά 0,4%. Τα παραπάνω γίνονται πιο εύληπτα µε τον ακόλουθο πίνακα. Τα αποτελέσµατά µας βρίσκονται εγγύτερα σε εκείνα των Zhang & Lee [39], που επίσης χρησιµοποίησαν µια Μ Υ. Αριθµός Αριθµός ερωτήσεων Κατώφλι λέξεων (προ εκπαίδευσης Info Gain) Info gain (ποσοστό λέξεων) Τελικός αριθµός Επιτυχία Li-Roth λέξεων (SΝoW) (ιδιοτήτων) Zhang-Lee (LIBSVM) % ,2% 71,0% 68,0% % ,8% 77,8% 75,0% % ,2% 79,8% 77,2% % ,2% 80,0% 77,4% % ,4% 84,2% 80,2% 4.4. ΧΡΗΣΗ ΑΚΟΛΟΥΘΙΩΝ ΛΕΞΕΩΝ ΩΣ Ι ΙΟΤΗΤΩΝ Εκτός από µεµονωµένες λέξεις, µπορούµε να αντιστοιχίσουµε ιδιότητες και σε ακολουθίες δύο (διγράµµατα) ή τριών (τριγράµµατα) συνεχόµενων λέξεων, ελπίζοντας ότι υπάρχουν ακολουθίες λέξεων που σηµατοδοτούν συγκεκριµένες κατηγορίες ερωτήσεων (π.χ. «How do I», «Name the capital»). υστυχώς τα αποτελέσµατα έδειξαν πως µε την προσθήκη ιδιοτήτων που αντιστοιχούν σε 15

16 διγράµµατα τα ποσοστά επιτυχίας µειώθηκαν από 15% έως και 25% για κατώφλι συχνότητας εµφανίσεων 3 και 5, ενώ χωρίς κατώφλι (κατώφλι = 1) τα ποσοστά ήταν χαµηλότερα κατά 0,4% έως 1,6% από τα αρχικά. Αυτά τα αποτελέσµατα φαίνεται να δείχνουν πως τα πιο συχνά διγράµµατα (που παραµένουν µε κατώφλι 3 και 5) συνεισφέρουν περισσότερο θόρυβο παρά χρήσιµη πληροφορία κι έτσι τα αποτελέσµατα είναι χειρότερα από εκείνα που παίρνουµε µε τη χρήση µόνο µεµονωµένων λέξεων. Όταν διατηρούνται και τα πιο σπάνια διγράµµατα (κατώφλι = 1), τα αποτελέσµατα βελτιώνονται αλλά και πάλι δεν υπερβαίνουν τα αποτελέσµατα που είχαµε χρησιµοποιώντας µεµονωµένες µόνο λέξεις. Με την προσθήκη και τριγραµµάτων (και κατώφλι = 1), τα αποτελέσµατα ήταν τα ίδια ακριβώς µε εκείνα που πήραµε χρησιµοποιώντας ως ιδιότητες µεµονωµένες λέξεις. εν µελετήθηκε η περίπτωση αξιολόγησης των διγραµµάτων και τριγραµµάτων µε το µέτρο του πληροφοριακού κέρδους. Συνοψίζοντας, η προσθήκη ιδιοτήτων που αντιστοιχούν σε διγράµµατα και τριγράµµατα δεν έδωσε καλύτερα αποτελέσµατα. Παράλληλα, τα δεδοµένα εκπαίδευσης αυξήθηκαν σε µέγεθος έως και 2 φορές µεγαλύτερα µε αποτέλεσµα η χρήση τους στο Weka να γίνεται δυσχερής (για τα µικρά σύνολα ερωτήσεων εκπαίδευσης) έως αδύνατη (για τα µεγάλα σύνολα 4000 και 5452 ερωτήσεων). Παρακάτω παρατίθενται τα σχετικά αποτελέσµατα. Για το σύνολο των 5452 ερωτήσεων εκπαίδευσης, καθώς και για την περίπτωση των τριγραµµάτων και το σύνολο των 4000 ερωτήσεων εκπαίδευσης, δεν υπάρχουν αποτελέσµατα. Αυτό οφείλεται και πάλι στην αδυναµία ολοκλήρωσης των σχετικών πειραµάτων λόγω των απαιτήσεων σε µνήµη της υλοποίησης Μ Υ που χρησιµοποιήσαµε. Αριθµός ερωτήσεων εκπαίδευσης Κατώφλι Επιτυχία (µεµονωµένες λέξεις) Επιτυχία (λέξεις + διγράµµατα) Επιτυχία (λέξεις + διγράµµατα + τριγράµµατα) ,8% 66,4% 66,4% ,6% 71,2% 71,2% ,0% 74,0% 74,0% ,8% 76,2% ΧΡΗΣΗ ΜΗ ΣΥΝΕΧΟΜΕΝΩΝ ΙΓΡΑΜΜΑΤΩΝ ΚΑΙ ΤΡΙΓΡΑΜΜΑΤΩΝ Αυτή η ιδέα αποτελεί τη συνέχεια της προηγούµενης µε την µόνη αλλαγή ότι επιτρέπεται να παραληφθούν µία ή δύο λέξεις ανάµεσα από δύο συνεχόµενες λέξεις που συµµετέχουν σε ένα δίγραµµα ή τρίγραµµα. Επί παραδείγµατι για την ερώτηση «Who was President of Cuba in 1978?», οι ιδιότητες που θα παίρναµε για διγράµµατα µε παράλειψη µίας λέξης, θα ήταν οι εξής: «Who President», «was of», «President Cuba», «of in», «Cuba 1978», «in?». Η σηµαντικότερη παρατήρηση για τα αποτελέσµατα µε παραλήψεις λέξεων είναι πως διατηρούν τα ίδια αποτελέσµατα µε τα αντίστοιχα των απλών διγραµµάτων και τριγραµµάτων. Αυτό φαίνεται αναλυτικότερα στον παρακάτω πίνακα: 16

17 Αριθµός ερωτήσεων Κατώφλι Επιτυχία (µεµονωµένες λέξεις) Επιτυχία (λέξεις + διγράµµατα µε παραλήψεις ως 1 λέξης) Επιτυχία (λέξεις + διγράµµατα µε παραλήψεις ως 2 λέξεων) Επιτυχία (λέξεις + διγράµµατα + τριγράµµατα µε παραλήψεις ως 1 λέξης) Επιτυχία (λέξεις + διγράµµατα + τριγράµµατα µε παραλήψεις ως 2 λέξεων) ,8% 66,4% 66,4% 66,4% 66,4% ,6% 71,2% 71,2% 71,2% 71,2% ,0% 74,0% 74,0% 74,0% 74,0% ,8% 76,2% 76,2% Όπου υπάρχουν κενά στον παραπάνω πίνακα, δεν καταφέραµε να παραγάγουµε αποτελέσµατα, λόγω των απαιτήσεων σε µνήµη της υλοποίησης Μ Υ που χρησιµοποιήσαµε ΧΡΗΣΗ ΕΝΟΣ ΣΥΣΤΗΜΑΤΟΣ ΑΝΑΓΝΩΡΙΣΗΣ ΚΥΡΙΩΝ ΟΝΟΜΑΤΩΝ Ένα Σύστηµα Αναγνώρισης Κυρίων Ονοµάτων (ΣΑΚΟ, Named Entity Recognizer NER) έχει τη δυνατότητα να αναγνωρίσει τα κύρια ονόµατα µέσα σε ένα κείµενο, καθώς και τους τύπους των κυρίων ονοµάτων (πρόσωπο, τοποθεσία κλπ). Όπως προαναφέρθηκε, χρησιµοποιήσαµε το ΣΑΚΟ που περιλαµβάνεται στο σύστηµα επεξεργασίας φυσικής γλώσσας GATE (έκδοση 3.0beta). Το ΣΑΚΟ του GATE υποστηρίζει πολλούς τύπους κυρίων ονοµάτων. Εµείς επιλέξαµε να χρησιµοποιήσουµε τους παρακάτω: «Organization», «Location», «Person», «Title» και «Date». Κάθε κύριο όνοµα που ανακαλύφθηκε στις ερωτήσεις (εκπαίδευσης και αξιολόγησης) αντικαταστάθηκε από τον τύπο του, ο οποίος εισήχθη στην ερώτηση ως λέξη («organization», «location» κλπ), προκειµένου να δοθεί στη Μ Υ η δυνατότητα µεγαλύτερης γενίκευσης (π.χ. οι ερωτήσεις «What is the capital of Greece?» και «What is the capital of Italy?» παριστάνονται πλέον από το ίδιο διάνυσµα). Στη συνέχεια αντιστοιχίσαµε τις λέξεις των ερωτήσεων εκπαίδευσης σε ιδιότητες, όπως στην ενότητα 4.2. Τα αποτελέσµατα ήταν οριακά καλύτερα µόνο για τις 2000 ερωτήσεις εκπαίδευσης, όπου το ποσοστό επιτυχίας αυξήθηκε κατά 0,4%. Στην περίπτωση των υπολοίπων συνόλων ερωτήσεων εκπαίδευσης, τα ποσοστά είτε παρέµειναν σταθερά είτε µειώθηκαν ελαφρά. Παρακάτω φαίνονται τα αποτελέσµατα αναλυτικά. εν διερευνήθηκε η χρήση ΣΑΚΟ σε συνδυασµό µε διγράµµατα και τριγράµµατα. Αριθµός ερωτήσεων Κατώφλι Επιτυχία εκπαίδευσης Επιτυχία µε χρήση ΣΑΚΟ ,8% 66,8% ,6% 74,0% ,0% 75,8% ,8% 77,4%

18 Τα κενά στον παραπάνω πίνακα οφείλονται στις απαιτήσεις σε µνήµη της υλοποίησης Μ Υ που χρησιµοποιήσαµε ΧΡΗΣΗ ΤΟΥ WORDNET Στις περισσότερες ερωτήσεις υπάρχει ένα «κεντρικό» ουσιαστικό που παρέχει σηµαντικές πληροφορίες για τον τύπο της απάντησης που ζητά η ερώτηση (π.χ. «Ποια είναι η πρωτεύουσα της Ελλάδας;», «Ποιος είναι ο πρόεδρος της Αργεντινής;»). Ο εντοπισµός του κεντρικού ουσιαστικού µπορεί να παίξει σηµαντικό ρόλο στην εύρεση της κατηγορίας της ερώτησης, όπως έχουν δείξει προηγούµενες εργασίες [10] [8]. Στην εργασία [29] αναφέρεται, ακόµη, ότι η προσθήκη στις ερωτήσεις εκπαίδευσης επιπλέον λέξεων που σχετίζονται µε το κεντρικό ουσιαστικό τους (π.χ. συνώνυµα, υπερώνυµα) βοηθά πολύ στην επιτυχή κατάταξη καινούριων ερωτήσεων. Στις εργασίες [20] [26] [23] χρησιµοποιείται, επίσης, το WordNet για την προσθήκη υπερωνύµων κατά την κατάταξη ερωτήσεων ή γενικότερα κειµένων. Βασιζόµενοι στις ιδέες των προσεγγίσεων της προηγούµενης παραγράφου, µπορούµε να παρατηρήσουµε ότι δύο ερωτήσεις όπως «What is the largest country in Europe?» και «What is the most populated region in Germany?» περιέχουν κεντρικά ουσιαστικά («country» και «region») που σχετίζονται σηµασιολογικά (και τα δύο αναφέρονται σε γεωγραφικές τοποθεσίες). Η συνάφεια µεταξύ των δύο ερωτήσεων µπορεί να γίνει περισσότερο εµφανής αν αντικατασταθούν τα δύο κεντρικά ουσιαστικά µε µια λέξη (π.χ. «location») που αντιπροσωπεύει τον κοινό σηµασιολογικό τους τύπο, µε τον ίδιο τρόπο που η χρήση ενός ΣΑΚΟ αντικαθιστά κύρια ονόµατα µε τους τύπους τους. Γενικότερα, προσθέτοντας σε κάθε ερώτηση συνώνυµα ή υπερώνυµα (λέξεις µε ευρύτερη σηµασία) του κεντρικού ουσιαστικού της, αυξάνεται η πιθανότητα ερωτήσεις που ζητούν συναφείς σηµασιολογικά απαντήσεις να περιέχουν κοινές λέξεις και άρα να οδηγούν σε κοινές τιµές ιδιοτήτων στα διανύσµατα που τις παριστάνουν. Αυτό είναι δυνατόν να βοηθήσει τον αλγόριθµο µηχανικής µάθησης να κατατάξει στην ίδια κατηγορία ερωτήσεις που ζητούν συναφείς σηµασιολογικά απαντήσεις. Στην παρούσα εργασία, η προσθήκη συνωνύµων και υπερωνύµων επιτεύχθηκε µε τη βοήθεια του WordNet. Το WordNet είναι ένας ιεραρχικός θησαυρός λέξεων που παρέχει, µεταξύ άλλων, τις εξής πληροφορίες για κάθε λέξη λ που περιέχει: - Μέρος του λόγου (ρήµα, ουσιαστικό κλπ). - Συνώνυµα (λέξεις που βρίσκονται στο ίδιο επίπεδο µε τη λ), - Υπερώνυµα (λέξεις που βρίσκονται πιο ψηλά στην ιεραρχία παριστάνουν πιο γενικές έννοιες από ό,τι η λ), - Υπώνυµα (λέξεις που βρίσκονται πιο χαµηλά στην ιεραρχία πιο ειδικές έννοιες). Επειδή δεν υπήρχε εργαλείο ελεύθερα διαθέσιµο για την εύρεση του κεντρικού ουσιαστικού κάθε ερώτησης, ούτε και ο απαραίτητος χρόνος για να αναπτυχθεί εξαρχής ένα τέτοιο εργαλείο, αποφασίσαµε να χρησιµοποιήσουµε ως κεντρικό ουσιαστικό την πρώτη λέξη της ερώτησης που αναγνωρίζει ως ουσιαστικό το WordNet. 5 Σε κάθε ερώτηση προσθέταµε τα υπερώνυµα και τα συνώνυµα αυτής της λέξης. Η επιλογή αυτή αποδείχθηκε πως δίνει καλά αποτελέσµατα, καθώς οι ερωτήσεις έχουν κατά µέσο όρο 1-2 ουσιαστικά και το πρώτο που συναντούµε είναι, στην πλειοψηφία των περιπτώσεων, το κεντρικό. Μετά από πειράµατα, αποφασίσαµε 5 Το WordNet παρέχει συναρτήσεις που µπορούν να χρησιµοποιηθούν για αυτόν το σκοπό. Παράλληλα, το WordNet µπορεί να αναγνωρίσει εάν ένα ουσιαστικό βρίσκεται σε πληθυντικό αριθµό και να το µετατρέψει στη βασική του µορφή (ενικό αριθµό). 18

19 να προσθέτουµε όλα τα υπερώνυµα του κεντρικού ουσιαστικού (αντί π.χ. των υπερωνύµων συγκεκριµένου βάθους). Τα ποσοστά που επετεύχθησαν από την προσθήκη των υπερωνύµων φαίνονται παρακάτω. υστυχώς, ούτε και µε την προσθήκη των υπερωνύµων υπήρξε βελτίωση των αποτελεσµάτων, όπως φαίνεται και στον πίνακα. Αριθµός ερωτήσεων Κατώφλι Επιτυχία εκπαίδευσης Επιτυχία µε χρήση WORDNET Επιτυχία µε χρήση WORNDET & ΣΑΚΟ ,8% 62,4% 64,2% ,6% 69,2% 70,8% ,0% 72,2% 73,4% ,8% 73,8% 75,8% Σηµειώνουµε και πάλι πως το µεγάλο πλήθος των ιδιοτήτων δεν επέτρεψε την ολοκλήρωση των πειραµάτων για το σύνολο εκπαίδευσης των 5452 ερωτήσεων (µεγάλες απαιτήσεις σε µνήµη της υλοποίησης Μ Υ που χρησιµοποιήσαµε). 19

20 4.8 ΣΥΓΚΕΝΤΡΩΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ Παρακάτω φαίνονται τα αποτελέσµατα των πειραµάτων συγκεντρωµένα σε διαγράµµατα. Γίνεται φανερό πως τα αποτελέσµατά µας υπολείπονται από αυτά των Zhang & Lee [39] και Li & Roth [18], αν και βρίσκονται σχετικά κοντά στα αποτελέσµατα των Zhang & Lee, που χρησιµοποίησαν επίσης µια υλοποίηση Μ Υ. Στην περίπτωση της χρήσης µόνο µεµονωµένων λέξεων, οι διαφορές των αποτελεσµάτων µας από εκείνων των Zhang & Lee [39] οφείλονται κατά πάσα πιθανότητα στη χρήση διαφορετικής υλοποίησης Μ Υ (χρησιµοποίησαν το LIBSVM αντί για το Weka), ενδεχοµένως στις διαφορετικές τιµές των παραµέτρων των υλοποιήσεων (χρησιµοποιήσαµε τις προεπιλεγµένες τιµές του Weka) και στη χρήση διαφορετικού κατωφλίου (οι Zhang & Lee χρησιµοποίησαν κατώφλι 10). Ακόµα και στην περίπτωση που χρησιµοποιήσαµε ΣΑΚΟ ή τα υπερώνυµα του WordNet και ενώ περιµέναµε τα αποτελέσµατα να είναι καλύτερα δεν είχαµε βελτίωση. Μεταξύ των παραλλαγών που δοκιµάσαµε, καλύτερα αποτελέσµατα είχαµε χρησιµοποιώντας µόνο ιδιότητες που αντιστοιχούν σε µεµονωµένες λέξεις, χωρίς επιλογή ιδιοτήτων µε κατώφλι συχνότητας ή πληροφοριακό κέρδος. Τα αποτελέσµατα πάντως σε όλες τις περιπτώσεις δεν δείχνουν συµπτώµατα κορεσµού, κάτι που µας κάνει να πιστεύουµε πως είναι δυνατόν να επιτευχθούν καλύτερα αποτελέσµατα µε µεγαλύτερες συλλογές ερωτήσεων εκπαίδευσης, κάτι που απαιτεί και ταχύτερη υλοποίηση Μ Υ από αυτή που χρησιµοποιήσαµε. 20

21 90,0% Κατώφλι 1 80,0% Κατώφλι 3 Κατώφλι 5 Επιτυχία Κατάταξης 70,0% 60,0% 50,0% 40,0% Zhang-Lee Li-Roth InfoGain 60% ΣΑΚΟ WORDNET WORDNET & ΣΑΚΟ 30,0% 20,0% 10,0% 0,0% Αριθµός Ερωτήσεων ιάγραµµα 1. Πειραµατικά αποτελέσµατα. 21

22 Το ιάγραµµα 2 µας δίνει πιο καθαρά τα αποτελέσµατα του διαγράµµατος 1. WORDNET & ΣΑΚΟ WORDNET 5452 ΣΑΚΟ InfoGain 60% Li-Roth Αριθµός Ερωτήσεων Zhang-Lee Κατώφλι 5 Κατώφλι 3 Κατώφλι ,0% 20,0% 40,0% 60,0% 80,0% 100,0% Επιτυχία Κατάταξης ιάγραµµα 2. Τα πειραµατικά αποτελέσµατα σε µορφή ραβδοδιαγράµµατος. 22

23 5. ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΠΙΘΑΝΕΣ ΒΕΛΤΙΩΣΕΙΣ Καταφέραµε να επιβεβαιώσουµε τα πειραµατικά αποτελέσµατα των Zhang & Lee [39], µε µικρές διαφορές που κατά πάσα πιθανότητα οφείλονται στις διαφορετικές υλοποιήσεις Μ Υ που χρησιµοποιήσαµε, στις διαφορετικές τιµές των παραµέτρων των υλοποιήσεων και στο διαφορετικό κατώφλι συχνότητας λέξεων. Τα αποτελέσµατά µας ήταν κατώτερα από εκείνα των Li & Roth [18], που χρησιµοποίησαν διαφορετικό αλγόριθµο µάθησης (SNoW [3]). Επιχειρήσαµε να βελτιώσουµε περαιτέρω τα αποτελέσµατά µας χρησιµοποιώντας επιλογή ιδιοτήτων, ιδιότητες που αντιστοιχούν σε n-γράµµατα, αντικατάσταση κυρίων ονοµάτων από τους τύπους τους και επέκταση των ερωτήσεων µε υπερώνυµα και συνώνυµα του κεντρικού ουσιαστικού, χωρίς όµως να επιτύχουµε βελτίωση. Τα πειράµατα έγιναν µε χρήση πολυωνυµικού πυρήνα βαθµού 1, κάτι που πρακτικά σηµαίνει πως η Μ Υ επιχειρεί να κατασκευάσει το υπερεπίπεδο µεγίστου περιθωρίου στον αρχικό διανυσµατικό χώρο, κάτι που είναι απολύτως εφικτό µόνο όταν τα δεδοµένα εκπαίδευσης είναι γραµµικά διαχωρίσιµα. Θα θέλαµε να έχουµε την ευχέρεια να δοκιµάσουµε πυρήνα µε πολυωνυµικό βαθµό 2 ή και παραπάνω αλλά αυτό δεν ήταν δυνατόν λόγω της µικρής ταχύτητας και των µεγάλων απαιτήσεων µνήµης της υλοποίησης Μ Υ που χρησιµοποιήσαµε. Θα ήταν επίσης χρήσιµο να δοκιµάσουµε και άλλους πυρήνες, όπως για παράδειγµα ο RBF, αλλά και πάλι αυτό δεν ήταν δυνατόν, επειδή δεν τους υποστήριζε η υλοποίηση Μ Υ που χρησιµοποιήσαµε. Η εύρεση του κεντρικού ουσιαστικού έγινε προσεγγιστικά, εντοπίζοντας το πρώτο ουσιαστικό της ερώτησης. Η προσθήκη υπερωνύµων ενδέχεται να έδινε καλύτερα αποτελέσµατα αν ο εντοπισµός του κεντρικού ουσιαστικού γινόταν µε µεγαλύτερη ακρίβεια. Η προσθήκη ιδιοτήτων που έχουν σχέση µε το συντακτικό της ερώτησης είναι µια ακόµα δυνατή βελτίωση που έχει αποδειχθεί ότι βοηθάει [17][12]. 23

24 ΑΝΑΦΟΡΕΣ [1] Banko M., Brill E., "Scaling to very very large corpora for natural language disambiguation, In Meeting of the Association for Computational Linguistics (2001), pages [2] Burges C.J.C., A Tutorial on Support Vector Machines for Pattern Recognition, in Data Mining and Knowledge Discovery 2, , [3] Carlson C., Cumby J., Rosen and Roth D.. SNoW User Guide. Technical Report UIUCDCS-R UIUC Computer Science Department, Aug [4] Chang C-C and Lin C-J. LIBSVM: a library for support vector machines [5] Cristianini Ν., Shawe-Taylor J., "An Introduction to Support Vector Machines and Other Kernel-based Learning Methods", Cambridge Univ. Press, [6] Diekema R., Yilmazel O., Liddy E. D., Evaluation of Restricted-Domain Question-Answering Systems, ACL [7] Fellbaum Ch., Wordnet, An Electronic Lexical Database, MIT Press, Cambridge Massachusetts, 1999 [8] Ferret O., Grau B., Hurault-Plantet M., Illouz G., Monceaux L., Robba I., Vilnat A., Finding an answer based on the recognition of the question focus, TREC [9] Gunn S., Support Vector Machines for Classification and Regression, Image Speech & Intelligent Systems Group, University of Southampton, May [10] Harabagiu S. M., Maiorano S. J., Pasca M. A., Open-domain textual question answering techniques, Natural Language Engineering 9 (3): , 2003 Cambridge University Press. [11] Harabagiu S., Moldovan D., Pasca M., Mihalcea R., Surdeanu M., Bunescu R., Girju R., Rus V., Morarescu P., The Role of Lexico-Semantic Feedback in Open-Domain Textual Question- Answering, Proceedings of the 39 th Annual Meeting of the Association for Computational Linguistics (ACL-2001), July 2001, Toulouse, France, [12] Hermjakob U., Parsing and Question Classification for Question Answering, Proceedings of the Workshop on Open-Domain Question Answering at ACL-2001, Toulouse, France, July 6-11, [13] Hovy E., Gerber L., Hermjakob U., Lin C. and Ravichandran D Toward semanticsbased answer pinpointing, In Proceedings of the Darpa Human Language Technology Conference (HLT). San Diego, CA, [14] Hsu C.-W. and Lin C.-J., A Comparison of Methods for Multi-class Support Vector Machines, IEEE Trans. Neural Networks, vol. 13, no. 2, pp , March [15] Hsu C-W, Chang C-C, Lin C-J, A Practical Guide to Support Vector Classification, [16] Joachims T., Support Vector Machines, KI 13(4): (1999). [17] Li W., Question Classification Using Language modelling, in CIIR Technical Report: University of Massachusetts, Amherst, [18] Li X., Roth D., Learning Question Classifiers, in Proceedings of the 19 th International Conference on Computational Linguistics (COLING), Taipei, Taiwan, 2002, pp [19] McCallum and Nigam K.. A Comparison of Event Models for Naïve Bayes Text Classification. In AAAI- 98 Workshop on Learning for Text Categorization, [20] McCallum R., Rosenfeld T., Mitchell A., Ng Y., Improving Text Classification by Shrinkage in a Hierarchy of Classes, Proceedings of (ICML)-98, 15 th International Conference on Machine Learning, pp , [21] Miliaraki S., Androutsopoulos I., Learning to Identify Single-Snippet Answers to Definition Questions, Proceedings of the 20 th International Conference on Computational Linguistics (COLING 2004), Geneve, Switzerland, pp [22] Mitchell T.M., Machine Learning, McGraw-Hill International Editions, 1997 [23] Na S-H, Kang I-S, Lee S-Y, Lee J-H, Question Answering Approach Using a WordNet-based Answer Type Taxonomy, TREC [24] Osouna E., Freund R., Girosi F., Training Support Vector Machines: an Application to Face Detection, Center for Biological and Computational Learning and Operations Research Center, Massachusetts Institute of Technology, Proceedings of CVPR 97, Puerto Rico, [25] Pasca M. A., Harabagiu S. M., High Performance Question/Answering, SIGIR

25 [26] Pinto D., Branstein M., Coleman R., Croft W. B., King M., Li W., Wei X., QuASM: A System for Question Answering Using Semi-Structured Data, Proceedings of the JCDL 2002 Joint Conference on Digital Libraries, [27] Plamondon L., Lapalme G., Kosseim L., The QUANTUM Question Answering System, in Proceedings of the Tenth Text Retrieval Conference (TREC-X, p , Gaithersburg, Maryland, [28] Platt J., "Fast Training of Support Vector Machines using Sequential Minimal Optimization". Advances in Kernel Methods - Support Vector Learning, B. Schlkopf, C. Burges, and A. Smola, eds., MIT Press [29] Prager J., Chu-Carroll J., Czuba K., Use of WordNet Hypernyms for Answering What-is Questions, TREC [30] Qi H., Otterbacher J., Winkel A., Radev D. R., The University of Michigan at TREC2002: Question Answering and Novelty tracks. [31] Quinlan J. R.. C4.5: Programs for Machine Learning. Morgan Kaufmann, San Francisco, CA, [32] Radev D., Fan W., Qi H., Wu H., Grewal A., Probabilistic Question Answering on the Web, Journal of the American Society for Information Science and Technology 56(3), March [33] Ravichandran D., Hovy E., Learning Surface Text Patterns, in Proceedings of the 40 th Annual Meeting of the Association for Computational Linguistics (ACL), Philadelphia, July 2002, pp [34] Srihari R., Li W., A Question Answering System Supported by Information Extraction, ANLP 2000: pp [35] Solorio1 T., Perez-Coutino1 M., Montes-y-Gomez M., Villasenor-Pineda1 L., Lopez-Lopez A., A Language Independent Method for Question Classification, COLING-04, Geneva, Switzerland, 2004 [36] Suzuki J., Taira H., Sasaki Y., and Maeda E., Question Classification using HDAG Kernel, Workshop on Multilingual Summarization and Question Answering, ACL 2003, Sapporo, Japan, pp [37] Voorhees H., The TREC question answering track, Natural Language Engineering 7 (4): pp , 2001 Cambridge University Press. [38] Yang Y. and Liu X.. A Re-examination of Text Categorization Methods. In Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 99), pp , [39] Zhang D., Lee W. S., Question Classification using Support Vector Machines, SIGIR 2003, pp

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚO ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΟΙΚΟΝΟΜΙΚO ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΟΙΚΟΝΟΜΙΚO ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ: Αυτόματη Κατάταξη Ελληνικών Ερωτήσεων σε Κατηγορίες Ονοματεπώνυμο Φοιτητή: Βρυσαγώτης Χαράλαμπος Αριθμός Μητρώου:3020010 Επιβλέπων Καθηγητής:

Διαβάστε περισσότερα

Ενεργητική Μάθηση Με Χρήση Μηχανών ιανυσµάτων Υποστήριξης. Ανδρέας Βλάχος Πανεπιστήµιο του Εδιµβούργου

Ενεργητική Μάθηση Με Χρήση Μηχανών ιανυσµάτων Υποστήριξης. Ανδρέας Βλάχος Πανεπιστήµιο του Εδιµβούργου Ενεργητική Μάθηση Με Χρήση Μηχανών ιανυσµάτων Υποστήριξης Ανδρέας Βλάχος Πανεπιστήµιο του Εδιµβούργου Εισαγωγή Τις τελευταίες δεκαετίες έχουν παρουσιασθεί διάφοροι αλγόριθµοι επιβλεπόµενης µηχανικής µάθησης

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής Το πρόβληµα Το πρόβληµα που καλείται ο υποψήφιος διδάκτορας να επιλύσει είναι η εξαγωγή χαρακτηριστικών (feature extraction) από ένα 3 αντικείµενο,

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP Σχεδιαστικά Θέματα Natural Language Processing Επεξεργασία δεδομένων σε φυσική γλώσσα Κατανόηση φυσικής γλώσσας από τη μηχανή

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση Οι συµφράσεις είναι ακολουθίες όρων οι οποίοι συνεµφανίζονται σε κείµενο µε µεγαλύτερη συχνότητα από εκείνη της εµφάνισης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 9 ο 9.1 ηµιουργία µοντέλων πρόβλεψης 9.2 Απλή Γραµµική Παλινδρόµηση 9.3 Αναλυτικά για το ιάγραµµα ιασποράς

Διαβάστε περισσότερα

Περιεχόµενα. Ανασκόπηση - Ορισµοί. Ο κύκλος ανάπτυξης προγράµµατος. Γλώσσες Προγραµµατισµού Ασκήσεις

Περιεχόµενα. Ανασκόπηση - Ορισµοί. Ο κύκλος ανάπτυξης προγράµµατος. Γλώσσες Προγραµµατισµού Ασκήσεις Προγραµµατισµός Η/Υ Ανασκόπηση - Ορισµοί Περιεχόµενα Ο κύκλος ανάπτυξης προγράµµατος Περιγραφή προβλήµατος Ανάλυση προβλήµατος Λογικό ιάγραµµα Ψευδοκώδικας Κωδικοποίηση Συντήρηση Γλώσσες Προγραµµατισµού

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 7 ΕΙ Η, ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ

ΚΕΦΑΛΑΙΟ 7 ΕΙ Η, ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΚΕΦΑΛΑΙΟ 7 ΕΙ Η, ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ 7.1. Ανάπτυξη Προγράµµατος Τι είναι το Πρόγραµµα; Το Πρόγραµµα: Είναι ένα σύνολο εντολών για την εκτέλεση ορισµένων λειτουργιών από τον υπολογιστή.

Διαβάστε περισσότερα

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή Ανοικτή και Εξ Αποστάσεως Εκπαίδευση Χρησιµοποιώντας το Εκπαιδευτικό Περιβάλλον του MOODLE. Open and Distance Learning Using MOODLE Learning Environment Αθανάσιος Ι. Μάργαρης, Ευθύµιος. Κότσιαλος Πανεπιστήµιο

Διαβάστε περισσότερα

{takasu, Conditional Random Field

{takasu, Conditional Random Field DEIM Forum 2016 C8-6 CRF 700 8530 3 1 1 700 8530 3 1 1 101 8430 2-1-2 E-mail: pobp52cw@s.okayama-u.ac.jp, ohta@de.cs.okayama-u.ac.jp, {takasu, adachi}@nii.ac.jp Conditional Random Field 1. Conditional

Διαβάστε περισσότερα

4. Ο αισθητήρας (perceptron)

4. Ο αισθητήρας (perceptron) 4. Ο αισθητήρας (perceptron) Σκοπός: Προσδοκώµενα αποτελέσµατα: Λέξεις Κλειδιά: To µοντέλο του αισθητήρα (perceptron) είναι από τα πρώτα µοντέλα νευρωνικών δικτύων που αναπτύχθηκαν, και έδωσαν µεγάλη ώθηση

Διαβάστε περισσότερα

a 1d L(A) = {m 1 a m d a d : m i Z} a 11 a A = M B, B = N A, k=1

a 1d L(A) = {m 1 a m d a d : m i Z} a 11 a A = M B, B = N A, k=1 Α44 ΚΡΥΠΤΟΓΡΑΦΙΑ ΣΗΜΕΙΩΣΕΙΣ #12 ΘΕΟ ΟΥΛΟΣ ΓΑΡΕΦΑΛΑΚΗΣ 1 Πλεγµατα Εστω ο διανυσµατικός χώρος R d διάστασης d Ο χώρος R d έρχεται µε ένα εσωτερικό γινόµενο x, y = d i=1 x iy i και τη σχετική νόρµα x = x,

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Σεπτεµβρίου 2005 5:00-8:00 Σχεδιάστε έναν αισθητήρα ercetro

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

Μεθοδολογίες παρεµβολής σε DTM.

Μεθοδολογίες παρεµβολής σε DTM. Μάθηµα : Αλγοριθµικές Βάσεις στη Γεωπληροφορική ιδάσκων : Συµεών Κατσουγιαννόπουλος Μεθοδολογίες παρεµβολής σε DTM.. Μέθοδοι παρεµβολής. Η παρεµβολή σε ψηφιακό µοντέλο εδάφους (DTM) είναι η διαδικασία

Διαβάστε περισσότερα

ιδάσκων: ηµήτρης Ζεϊναλιπούρ

ιδάσκων: ηµήτρης Ζεϊναλιπούρ Κεφάλαιο 1.3-1.4: Εισαγωγή Στον Προγραµµατισµό ( ιάλεξη 2) ιδάσκων: ηµήτρης Ζεϊναλιπούρ Περιεχόµενα Εισαγωγικές Έννοιες - Ορισµοί Ο κύκλος ανάπτυξης προγράµµατος Παραδείγµατα Πότε χρησιµοποιούµε υπολογιστή?

Διαβάστε περισσότερα

Περίληψη ιπλωµατικής Εργασίας

Περίληψη ιπλωµατικής Εργασίας Περίληψη ιπλωµατικής Εργασίας Θέµα: Εναλλακτικές Τεχνικές Εντοπισµού Θέσης Όνοµα: Κατερίνα Σπόντου Επιβλέπων: Ιωάννης Βασιλείου Συν-επιβλέπων: Σπύρος Αθανασίου 1. Αντικείµενο της διπλωµατικής Ο εντοπισµός

Διαβάστε περισσότερα

Automatic extraction of bibliography with machine learning

Automatic extraction of bibliography with machine learning Automatic extraction of bibliography with machine learning Takeshi ABEKAWA Hidetsugu NANBA Hiroya TAKAMURA Manabu OKUMURA Abstract In this paper, we propose an extraction method of bibliography using support

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 19 ης διάλεξης

Ασκήσεις μελέτης της 19 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 19 ης διάλεξης 19.1. Δείξτε ότι το Perceptron με (α) συνάρτηση ενεργοποίησης

Διαβάστε περισσότερα

Μαρία-Ελένη Κολλιάρου Σελίδα 2

Μαρία-Ελένη Κολλιάρου Σελίδα 2 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία Μεταπτυχιακού ιπλώµατος Ειδίκευσης «Ανάπτυξη συστήµατος ερωταποκρίσεων για αρχεία ελληνικών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 7 Ιανουαρίου 2005 ιάρκεια εξέτασης: 5:00-8:00 Έστω ότι

Διαβάστε περισσότερα

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017 Θέμα μεταπτυχιακής διατριβής: Λογισμικά μελέτης και σχεδίασης ρομποτικών συστημάτων - συγκρτική μελέτη και εφαρμογές. 1) Μελέτη των δημοφιλών λογισμικών σχεδίασης ρομποτικών συστημάτων VREP και ROS. 2)

Διαβάστε περισσότερα

Γραµµικοί Ταξινοµητές

Γραµµικοί Ταξινοµητές ΚΕΣ 3: Αναγνώριση Προτύπων και Ανάλυση Εικόνας KEΣ 3 Αναγνώριση Προτύπων και Ανάλυση Εικόνας Γραµµικοί Ταξινοµητές ΤµήµαΕπιστήµης και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήµιο Πελοποννήσου 7 Ncolas sapatsouls

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Διαδικασιακός Προγραμματισμός

Διαδικασιακός Προγραμματισμός Τμήμα ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ Διαδικασιακός Προγραμματισμός Διάλεξη 12 η Αναζήτηση/Ταξινόμηση Πίνακα Οι διαλέξεις βασίζονται στο βιβλίο των Τσελίκη και Τσελίκα C: Από τη Θεωρία στην

Διαβάστε περισσότερα

Τίτλος Υποέργου: Εφαρµογές Τεχνητής Νοηµοσύνης στην Τεχνολογία Λογισµικού και στην Ιατρική

Τίτλος Υποέργου: Εφαρµογές Τεχνητής Νοηµοσύνης στην Τεχνολογία Λογισµικού και στην Ιατρική Αρχιµήδης ΙΙ Ενίσχυση Ερευνητικών Οµάδων του ΤΕΙ Κρήτης Τίτλος Υποέργου: Εφαρµογές Τεχνητής Νοηµοσύνης στην Τεχνολογία Λογισµικού και στην Ιατρική Επιστηµονικός Υπεύθυνος: ρ Εµµανουήλ Μαρακάκης ραστηριότητα

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1)

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) 1 Προέλευση και ιστορία της Επιχειρησιακής Έρευνας Αλλαγές στις επιχειρήσεις Τέλος του 19ου αιώνα: βιομηχανική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Αναγνώριση και Κατάταξη Ονοµάτων Προσώπων, Οργανισµών και Τοποθεσιών σε Ελληνικά Κείµενα µε Χρήση Μηχανών ιανυσµάτων Υποστήριξης» Ιωάννης

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ Ελαχιστοποίηση κόστους διατροφής Ηεπιχείρηση ζωοτροφών ΒΙΟΤΡΟΦΕΣ εξασφάλισε µια ειδική παραγγελίααπό έναν πελάτη της για την παρασκευή 1.000 κιλών ζωοτροφής, η οποία θα πρέπει

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1)

Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1) Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1) Το εσωτερικό ποσοστό απόδοσης (internal rate of return) ως κριτήριο αξιολόγησης επενδύσεων Προβλήµατα προκύπτουν όταν υπάρχουν επενδυτικές ευκαιρίες

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΤΜ. ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ 2018-2019 Επιβλέπουσα: Μπίμπη Ματίνα Ανάλυση της πλατφόρμας ανοιχτού κώδικα Home Assistant Το Home Assistant είναι μία πλατφόρμα ανοιχτού

Διαβάστε περισσότερα

Επιµέλεια Θοδωρής Πιερράτος

Επιµέλεια Θοδωρής Πιερράτος Η έννοια πρόβληµα Ανάλυση προβλήµατος Με τον όρο πρόβληµα εννοούµε µια κατάσταση η οποία χρήζει αντιµετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή ούτε προφανής. Μερικά προβλήµατα είναι τα εξής:

Διαβάστε περισσότερα

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ Αθανάσιος Γαγάτσης Τµήµα Επιστηµών της Αγωγής Πανεπιστήµιο Κύπρου Χρήστος Παντσίδης Παναγιώτης Σπύρου Πανεπιστήµιο

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 5 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας)

Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 5 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας) Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 5 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας) ΑΝΤΙΚΕΙΜΕΝΟ: Βελτιστοποίηση ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ σε διάφορα

Διαβάστε περισσότερα

Επιστηµονικός Υπολογισµός Ι Ενότητα 1 - Εισαγωγή. Ευστράτιος Γαλλόπουλος

Επιστηµονικός Υπολογισµός Ι Ενότητα 1 - Εισαγωγή. Ευστράτιος Γαλλόπουλος Ενότητα 1 - Εισαγωγή Ευστράτιος Γαλλόπουλος c Ε. Γαλλόπουλος 201-2015 Ασκηση 1 Τι ονοµάζουµε υπολογιστικούς πυρήνες ; πυρήνων. Να δώσετε 3 παραδείγµατα τέτοιων Απάντηση ιαδικασίες (που µπορεί να είναι

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 16 ης διάλεξης

Ασκήσεις μελέτης της 16 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 16 ης διάλεξης 16.1. (α) Έστω ένα αντικείμενο προς κατάταξη το οποίο

Διαβάστε περισσότερα

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής Προγραμματισμός Η/Υ Προτεινόμενα θέματα εξετάσεων Εργαστήριο Μέρος 1 ό ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής Ιανουάριος 2011 Καλογιάννης Γρηγόριος Επιστημονικός/ Εργαστηριακός

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

ΕΣ 08 Επεξεργαστές Ψηφιακών Σηµάτων. Βιβλιογραφία Ενότητας

ΕΣ 08 Επεξεργαστές Ψηφιακών Σηµάτων. Βιβλιογραφία Ενότητας ΕΣ 08 Επεξεργαστές Ψηφιακών Σηµάτων Βελτιστοποίηση κώδικα σε επεξεργαστές ΨΕΣ Τµήµα Επιστήµη και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήµιο Πελοποννήσου Βιβλιογραφία Ενότητας Kehtarnavaz [2005]: Chapter

Διαβάστε περισσότερα

Γραµµική Αλγεβρα Ι. Ενότητα: ιανυσµατικοί χώροι. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

Γραµµική Αλγεβρα Ι. Ενότητα: ιανυσµατικοί χώροι. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών Ενότητα: ιανυσµατικοί χώροι Ευάγγελος Ράπτης Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΟΜΑ Α ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Στην εικόνα παρακάτω φαίνεται ένα νευρωνικό

Διαβάστε περισσότερα

Ειδικές Επιστηµονικές Εργασίες

Ειδικές Επιστηµονικές Εργασίες Ειδικές Επιστηµονικές Εργασίες 2005-2006 1. Ανίχνευση προσώπων από ακολουθίες video και παρακολούθηση (face detection & tracking) Η ανίχνευση προσώπου (face detection) αποτελεί το 1 ο βήµα σε ένα αυτόµατο

Διαβάστε περισσότερα

ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ

ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ 1ΗΣ ΣΕΛΙΔΑΣ ΘΕΜΑ Α ΑΝΑΚΕΦΑΛΑΙΩΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ Γ' ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 26 ΑΠΡΙΛΙΟΥ 2012 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΥ

Διαβάστε περισσότερα

Αριθµητική Ολοκλήρωση

Αριθµητική Ολοκλήρωση Κεφάλαιο 5 Αριθµητική Ολοκλήρωση 5. Εισαγωγή Για τη συντριπτική πλειοψηφία των συναρτήσεων f (x) δεν υπάρχουν ή είναι πολύ δύσχρηστοι οι τύποι της αντιπαραγώγου της f (x), δηλαδή της F(x) η οποία ικανοποιεί

Διαβάστε περισσότερα

Ανάλυση αλγορίθμων. Χρόνος εκτέλεσης: Αναμενόμενη περίπτωση. - απαιτεί γνώση της κατανομής εισόδου

Ανάλυση αλγορίθμων. Χρόνος εκτέλεσης: Αναμενόμενη περίπτωση. - απαιτεί γνώση της κατανομής εισόδου Ανάλυση αλγορίθμων Παράμετροι απόδοσης ενός αλγόριθμου: Χρόνος εκτέλεσης Απαιτούμενοι πόροι, π.χ. μνήμη, επικοινωνία (π.χ. σε κατανεμημένα συστήματα) Προσπάθεια υλοποίησης Ανάλυση της απόδοσης Θεωρητική

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ Μετά από την εκτίµηση των παραµέτρων ενός προσοµοιώµατος, πρέπει να ελέγχουµε την αλήθεια της υποθέσεως που κάναµε. Είναι ορθή η υπόθεση που κάναµε? Βεβαίως συνήθως υπάρχουν

Διαβάστε περισσότερα

Εργασία στο µάθηµα Ανάλυση εδοµένων

Εργασία στο µάθηµα Ανάλυση εδοµένων Μεταπτυχιακό Υπολογιστικής Φυσικής Εργασία στο µάθηµα Ανάλυση εδοµένων ηµήτρης Κουγιουµτζής E-mail: dkugiu@auth.gr 30 Ιανουαρίου 2018 Οδηγίες : Σχετικά µε την παράδοση της εργασίας ϑα πρέπει : Το κείµενο

Διαβάστε περισσότερα

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης Εργαστήριο Εκπαιδευτικής & Γλωσσικής Τεχνολογίας http://hermes.di.uoa.gr/ S.C.A.L.E. Μαρία Γρηγοριάδου A.L.M.A. Οµότιµη Καθηγήτρια SemanDix Τµήµα Πληροφορικής

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Ανάκτηση Πληροφορίας (Information Retrieval IR) Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη ( )

Τεχνητή Νοημοσύνη ( ) Εβδομάδα Διάλεξη Ενδεικτικά θέματα διαλέξεων Ενδεικτικά θέματα εργαστηρίων/φροντιστηρίων 1 1 1 2 2 3 2 4 3 5 3 6 4 7 4 8 5 9 Τεχνητή Νοημοσύνη (2017-18) Γενικές πληροφορίες για το μάθημα. Εισαγωγή στην

Διαβάστε περισσότερα

Κεφάλαιο 7 : Είδη, Τεχνικές, και Περιβάλλοντα Προγραµµατισµού

Κεφάλαιο 7 : Είδη, Τεχνικές, και Περιβάλλοντα Προγραµµατισµού ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΥΠΟΛΟΓΙΣΤΩΝ Κεφάλαιο 7 : Είδη, Τεχνικές, και Περιβάλλοντα Προγραµµατισµού ( Απαντήσεις & Λύσεις Βιβλίου) 1. Σκοποί κεφαλαίου Κύκλος ανάπτυξης προγράµµατος Κατηγορίες γλωσσών προγραµµατισµού

Διαβάστε περισσότερα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος ΑΛΓΟΡΙΘΜΟΙ Στο σηµείωµα αυτό αρχικά εξηγείται η έννοια αλγόριθµος και παραθέτονται τα σπουδαιότερα κριτήρια που πρέπει να πληρεί κάθε αλγόριθµος. Στη συνέχεια, η σπουδαιότητα των αλγορίθµων συνδυάζεται

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

Twitter 6. DEIM Forum 2014 A Twitter,,, Wikipedia, Explicit Semantic Analysis,

Twitter 6.   DEIM Forum 2014 A Twitter,,, Wikipedia, Explicit Semantic Analysis, DEIM Forum 2014 A5-2 Twitter 565 0871 1 5 E-mail: {shirakawa.masumi,hara,nishio}@ist.osaka-u.ac.p 9 24 Twitter,,, Wikipedia, Explicit Semantic Analysis, 1. political leaning Twitter Cision 2013 1 90% 9

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΣΔΒΔ Σύνολο από προγράµµατα για τη διαχείριση της ΒΔ Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Αρχεία δεδοµένων συστήµατος Σύστηµα Βάσεων Δεδοµένων (ΣΒΔ)

Διαβάστε περισσότερα

ΕΠΛ202:'Η'επιστημονική'δημοσίευση

ΕΠΛ202:'Η'επιστημονική'δημοσίευση Θέµατα ΕΠΛ202:'Η'επιστημονική'δημοσίευση 2 Ορισµός Τι είναι ένα επιστηµονικό άρθρο; Παρουσίαση και τεκµηρίωση µιας πρωτότυπης επιστηµονικής συνεισφοράς 3 Θέµατα Θέµατα 7 8 Θέµατα Ετεροναφορές Η δοµή ενός

Διαβάστε περισσότερα

ΑΞΙΟΠΙΣΤΙΑ ΥΛΙΚΟΥ ΚΑΙ ΛΟΓΙΣΜΙΚΟΥ

ΑΞΙΟΠΙΣΤΙΑ ΥΛΙΚΟΥ ΚΑΙ ΛΟΓΙΣΜΙΚΟΥ ΑΞΙΟΠΙΣΤΙΑ ΥΛΙΚΟΥ ΚΑΙ ΛΟΓΙΣΜΙΚΟΥ Εισαγωγή Ηεµφάνιση ηλεκτρονικών υπολογιστών και λογισµικού σε εφαρµογές µε υψηλές απαιτήσεις αξιοπιστίας, όπως είναι διαστηµικά προγράµµατα, στρατιωτικές τηλεπικοινωνίες,

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Διαβάστε περισσότερα

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Αλγόριθµοι Ευθυγράµµισης Τρισδιάστατων Αντικειµένων Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό & Καποδιστριακό Πανεπιστήµιο Αθηνών 20 Οκτωβρίου 2005 Εισαγωγή

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

ER-Tree (Extended R*-Tree)

ER-Tree (Extended R*-Tree) 1-9825/22/13(4)768-6 22 Journal of Software Vol13, No4 1, 1, 2, 1 1, 1 (, 2327) 2 (, 3127) E-mail xhzhou@ustceducn,,,,,,, 1, TP311 A,,,, Elias s Rivest,Cleary Arya Mount [1] O(2 d ) Arya Mount [1] Friedman,Bentley

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Διαχωριστικές συναρτήσεις Ταξινόμηση κανονικών

Διαβάστε περισσότερα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα Εξαγωγή κανόνων από αριθµητικά δεδοµένα Συχνά το σύστηµα που θέλουµε να µοντελοποιήσουµε η να ελέγξουµε αντιµετωπίζεται ως µαύρο κουτί και η πληροφορία για τη λειτουργία του διατίθεται υπό µορφή ζευγών

Διαβάστε περισσότερα

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής: ΣΕΙΡΕΣ TAYLOR Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων Πολυώνυµο είναι κάθε συνάρτηση της µορφής: p( ) = a + a + a + a + + a, όπου οι συντελεστές α i θα θεωρούνται

Διαβάστε περισσότερα

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα Αλγόριθµοι και Πολυπλοκότητα Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών Καθηγητής: Ν. Μ. Μισυρλής () Αλγόριθµοι και Πολυπλοκότητα 15 Ιουνίου 2009 1 / 26 Εισαγωγή Η ϑεωρία

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα Αλγόριθµοι και Πολυπλοκότητα Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών Καθηγητής: Ν. Μ. Μισυρλής () Αλγόριθµοι και Πολυπλοκότητα Φεβρουαρίου 0 / ένδρα Ενα δένδρο είναι

Διαβάστε περισσότερα

Προγραµµατισµός 1 Ταξινόµηση - Αναζήτηση

Προγραµµατισµός 1 Ταξινόµηση - Αναζήτηση Προγραµµατισµός 1 Ταξινόµηση - Αναζήτηση 1 Ταξινόµηση! Δεδοµένα: Δίνεται ένας πίνακας data από N ακεραίους! Ζητούµενο: Να ταξινοµηθούν τα περιεχόµενα σε αύξουσα αριθµητική σειρά:!i : 0 data[i]

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 25 Αυγούστου 26 :-4: Κατασκευάστε έναν αισθητήρα (perceptron)

Διαβάστε περισσότερα

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής Το πρόβληµα Το πρόβληµα που καλείται ο υποψήφιος διδάκτορας να επιλύσει είναι η εξαγωγή χαρακτηριστικών (feature extraction) από ένα 3 αντικείµενο,

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Τρεις αλγόριθμοι μηχανικής μάθησης ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2018 Μηχανική μάθηση αναγνώριση προτύπων Η αναγνώριση προτύπων

Διαβάστε περισσότερα

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o Sound Source Identification based on Deep Learning with Partially-Shared Architecture 1 2 1 1,3 Takayuki MORITO 1, Osamu SUGIYAMA 2, Ryosuke KOJIMA 1, Kazuhiro NAKADAI 1,3 1 2 ( ) 3 Tokyo Institute of

Διαβάστε περισσότερα

Σύνοψη Προηγούµενου. Γλώσσες χωρίς Συµφραζόµενα (2) Ισοδυναµία CFG και PDA. Σε αυτό το µάθηµα. Αυτόµατα Στοίβας Pushdown Automata

Σύνοψη Προηγούµενου. Γλώσσες χωρίς Συµφραζόµενα (2) Ισοδυναµία CFG και PDA. Σε αυτό το µάθηµα. Αυτόµατα Στοίβας Pushdown Automata Σύνοψη Προηγούµενου Γλώσσες χωρίς Συµφραζόµενα (2) Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Αυτόµατα Στοίβας Pushdown utomata Ισοδυναµία µε τις Γλώσσες χωρίς Συµφραζόµενα:

Διαβάστε περισσότερα