ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (ΜSc) ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (ΜSc) ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ"

Transcript

1 ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (ΜSc) ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ορθογραφική διόρθωση και κανονικοποίηση κριτικών προϊόντων» Δημήτρης Προκοπίου Μ Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος ΑΘΗΝΑ, ΦΕΒΡΟΥΑΡΙΟΣ 2015

2 Περίληψη Στην παρούσα εργασία αναπτύχθηκε ένα σύστημα ορθογραφικής διόρθωσης και κανονικοποίησης κριτικών προϊόντων γραμμένων στην Αγγλική γλώσσα. Για την εύρεση και τη διόρθωση των λαθών χρησιμοποιείται ένα γλωσσικό μοντέλο n-γραμμάτων, λεξικά, η DBpedia και ένα εργαλείο αναγνώρισης ονομάτων οντοτήτων. Για την ανάπτυξη και την αξιολόγηση του συστήματος χρησιμοποιήθηκαν κείμενα από ένα διεθνή διαγωνισμό εξόρυξης γνώμης, στα οποία επισημειώθηκαν χειρωνακτικά οι επιθυμητές διορθώσεις και κανονικοποιήσεις. Οι επιδόσεις του συστήματος ήταν αρκετά ικανοποιητικές όταν τα δεδομένα ανάπτυξης και αξιολόγησης περιείχαν κριτικές προϊόντων του ίδιου είδους και το γλωσσικό μοντέλο είχε εκπαιδευτεί σε σώμα κειμένων συναφών θεμάτων. Αντιθέτως, τα αποτελέσματα ήταν αρκετά χειρότερα όταν τα δεδομένα ανάπτυξης και αξιολόγησης περιείχαν κριτικές προϊόντων διαφορετικών ειδών ή όταν το γλωσσικό μοντέλο είχε εκπαιδευτεί σε μη συναφές σώμα κειμένων. 1

3 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή Αντικείμενο της Εργασίας Διάρθρωση της Εργασίας Ευχαριστίες Θεωρητικό Υπόβαθρο και Σχετικές Εργασίες Απόσταση Διόρθωσης Levenshtein Μοντέλα n-γραμμάτων Σχετικές εργασίες Βοηθητικά Εργαλεία Σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford DBpedia SRILM Toolkit Εργαλείο Επισημείωσης BRAT Αρχιτεκτονική Συστήματος Προεπεξεργασία Εισαγωγή προτάσεων, λεξικών και γλωσσικού μοντέλου Διαδικασίες διόρθωσης Εύρεση και διόρθωση ονομάτων οντοτήτων Εύρεση και διόρθωση λέξεων Άλλες διορθώσεις Εξαγωγή τελικού αρχείου XML και στατιστικών Παράδειγμα χρήσης Παράδειγμα ορθής διόρθωσης Παράδειγμα λανθασμένης διόρθωσης Πειράματα Δεδομένα Χειρωνακτική διόρθωση Μέτρα αξιολόγησης Αποτελέσματα Πείραμα 1 - Laptop Training Data Πείραμα 2 - Laptop Test Data Πείραμα 3 - Restaurant Data Πείραμα 4 - Laptop Training Data με διαφορετικό γλωσσικό μοντέλο Σύνοψη και μελλοντικές επεκτάσεις Σύνοψη Προσαρμογή και Μελλοντικές Επεκτάσεις Βιβλιογραφία

4 ΛΙΣΤΑ ΕΙΚΟΝΩΝ Εικόνα 1 - Screenshot από αρχείο της DBpedia Εικόνα 2 - Βασικές λειτουργίες του SRILM Toolkit Εικόνα 3 - Παράδειγμα κειμένου για εκπαίδευση γλωσσικού μοντέλου Εικόνα 4 - Παράδειγμα αρχείου με μετρήσεις εμφανίσεων Εικόνα 5 - Παράδειγμα τελικού αρχείου με γλωσσικό μοντέλο Εικόνα 6 - Screenshot χρήσης του BRAT Annotation Tool Εικόνα 7 - Βασικές διαδικασίες του συστήματος Εικόνα 8 - Διαδικασία προεπεξεργασίας Εικόνα 9 - Παράδειγμα αρχείου στο BRAT Εικόνα 10 - Αρχείο BRAT με κατάληξη.txt Εικόνα 11 - Αρχείο BRAT με κατάληξη.ann Εικόνα 12 - Αρχείο BRAT με κατάληξη.id Εικόνα 13 - Τελικό XML μετά από τη διαδικασία της προεπεξεργασίας Εικόνα 14 - Δομές συστήματος για την εισαγωγή προτάσεων, λεξικών και γλωσσικού μοντέλου Εικόνα 15 - Παράδειγμα δομής Trie Εικόνα 16 - Παράδειγμα γλωσσικού μοντέλου Εικόνα 17 - Διαδικασίες διόρθωσης και δομές που χρησιμοποιούν Εικόνα 18 - Διαδικασία διόρθωσης ονομάτων οντοτήτων Εικόνα 19 - Αλγόριθμος εύρεσης λανθασμένης λέξης Εικόνα 20 - Αλγόριθμος εύρεσης και διόρθωσης λέξεων Εικόνα 21 - Διαδικασία εύρεσης και διόρθωσης λέξεων Εικόνα 22 - Τελικό XML με όλες τις διορθώσεις Εικόνα 23 - Στατιστικά συστήματος Εικόνα 24 - Συνολικά αποτελέσματα 1ου πειράματος Εικόνα 25 - Συνολικά αποτελέσματα 2ου πειράματος Εικόνα 26 - Συνολικά αποτελέσματα 3ου πειράματος Εικόνα 27 - Συνολικά αποτελέσματα 4ου πειράματος Εικόνα 28 - Συνολικά αποτελέσματα όλων των πειραμάτων

5 ΛΙΣΤΑ ΠΙΝΑΚΩΝ Πίνακας 1 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 1) Πίνακας 2 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 2) Πίνακας 3 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 3) Πίνακας 4 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 4) Πίνακας 5 - Συμβολισμοί για περιγραφή υπολογισμού πιθανοτήτων Πίνακας 6 - Παράμετροι παραδείγματος Πίνακας 7 - Παράδειγμα διόρθωσης πρότασης (Λέξη: get) Πίνακας 8 - Παράδειγμα διόρθωσης πρότασης (Λέξη: this) Πίνακας 9 - Παράδειγμα διόρθωσης πρότασης (Λέξη: awesome) Πίνακας 10 - Παράδειγμα διόρθωσης πρότασης (Λέξη: dell) Πίνακας 11 - Παράδειγμα διόρθωσης πρότασης (Λέξη: laptop) Πίνακας 12 - Παράδειγμα διόρθωσης πρότασης (Λέξη: cause) Πίνακας 13 - Παράδειγμα διόρθωσης πρότασης (Λέξη: its) Πίνακας 14 - Παράδειγμα διόρθωσης πρότασης (Λέξη: the) Πίνακας 15 - Παράδειγμα διόρθωσης πρότασης (Λέξη: best) Πίνακας 16 - Αποτέλεσμα πρότασης μετά τις διορθώσεις Πίνακας 17 - Παράμετροι παραδείγματος λανθασμένης διόρθωσης Πίνακας 18 - Παράδειγμα διόρθωσης πρότασης (Λέξη: My) Πίνακας 19 - Παράδειγμα διόρθωσης πρότασης (Λέξη: macbok) Πίνακας 20 - Παράδειγμα διόρθωσης πρότασης (Λέξη: get) Πίνακας 21 - Παράδειγμα διόρθωσης πρότασης (Λέξη: stuck) Πίνακας 22 Παράδειγμα διόρθωσης πρότασης (Λέξη: with) Πίνακας 23 Παράδειγμα διόρθωσης πρότασης (Λέξη: many) Πίνακας 24 - Παράδειγμα διόρθωσης πρότασης (Λέξη: windows) Πίνακας 25 - Παράδειγμα διόρθωσης πρότασης (Λέξη: open) Πίνακας 26 - Αποτέλεσμα πρότασης μετά τις διορθώσεις Πίνακας 27 - Παραδείγματα λέξεων που δεν υπάρχουν στο λεξικό Πίνακας 28 - Παραδείγματα σωστών λέξεων αλλά λάνθασμένα σε συγκεκριμένη πρόταση Πίνακας 29 - Παραδείγματα προτάσεων που δεν τελειώνουν με αποδεκτό σημείο στίξης Πίνακας 30 - Παραδείγματα προτάσεων που δεν αρχίζουν με κεφαλαίο γράμμα Πίνακας 31 - Παραδείγματα λέξεων ονομάτων οντοτήτων Πίνακας 32 - Παραδείγματα λέξεων με άσκοπα κεφαλαία γράμματα Πίνακας 33 - Παραδείγματα λέξεων φαγητών με κεφαλαία γράμματα Πίνακας 34 - Παράμετροι συστήματος για τα πειράματα Πίνακας 35 - Συνολικά αποτελέσματα 1ου πειράματος Πίνακας 36 - Αποτελέσματα διόρθωσης ονομάτων οντοτήτων 1ου πειράματος Πίνακας 37 - Αποτελέσματα διόρθωσης λέξεων 1ου πειράματος Πίνακας 38 - Αποτελέσματα άλλων διορθώσεων 1ου πειράματος Πίνακας 39 - Συνολικά αποτελέσματα 2ου πειράματος Πίνακας 40 - Αποτελέσματα διόρθωσης ονομάτων οντοτήτων 2ου πειράματος Πίνακας 41 - Αποτελέσματα διόρθωσης λέξεων 2ου πειράματος Πίνακας 42 - Αποτελέσματα άλλων διορθώσεων 2ου πειράματος Πίνακας 43 - Συνολικά αποτελέσματα 3ου πειράματος Πίνακας 44 - Αποτελέσματα διόρθωσης ονομάτων οντοτήτων 3ου πειράματος Πίνακας 45 - Αποτελέσματα διόρθωσης λέξεων 3ου πειράματος Πίνακας 46 - Αποτελέσματα άλλων διορθώσεων 3ου πειράματος Πίνακας 47 - Αποτελέσματα διόρθωσης λέξεων 4ου πειράματος

6 1. Εισαγωγή 1.1 Αντικείμενο της Εργασίας Η εργασία αυτή έχει ως σκοπό τη δημιουργία ενός συστήματος ορθογραφικής διόρθωσης και κανονικοποίησης κειμένων και συγκεκριμένα κειμένων αξιολόγησης προϊόντων ή υπηρεσιών (π.χ. φορητών υπολογιστών, εστιατορίων) γραμμένων στην Αγγλική γλώσσα. Τα τελευταία χρόνια, με τη συνεχώς αυξανόμενη χρήση του διαδικτύου, η δημοτικότητα των ιστοτόπων ηλεκτρονικού εμπορίου έχει αυξηθεί. Πολλοί από αυτούς τους ιστοτόπους δίνουν τη δυνατότητα στους χρήστες να γράψουν σχόλια ή κριτικές. Για παράδειγμα, για έναν ηλεκτρονικό υπολογιστή μπορούμε να δούμε κριτικές όπως «Awesome design, poor performance.» ή «Stay away from this useless laptop». Οι κριτικές προϊόντων και υπηρεσιών έχουν αποσπάσει το ενδιαφέρον πολλών ερευνητών και οργανισμών, οι οποίοι αναπτύσσουν μεθόδους και συστήματα που εξάγουν ή συνοψίζουν αυτόματα τη γνώμη των χρηστών από τέτοιες κριτικές [Liu 2010]. Ένα μεγάλο πρόβλημα όμως στην εξόρυξη γνώμης από τα κείμενα αυτά είναι το ότι περιέχουν πολλά ορθογραφικά λάθη (π.χ. στην πρόταση «it's a definately awesome laptop.» η λέξη «definately» πρέπει να αντικατασταθεί με τη λέξη «definitely»), συντομεύσεις (π.χ. στην πρόταση «I got it last Nov.» η λέξη «Nov» πρέπει να αντικατασταθεί με τη λέξη «November»), λανθασμένες λέξεις σε συγκεκριμένες προτάσεις (π.χ. στην πρόταση «Get it cause it's good.» η λέξη «cause» πρέπει να αντικατασταθεί με τη λέξη «because») κτλ. τα οποία είτε αλλοιώνουν το νόημα της πρότασης είτε γενικότερα δυσκολεύουν τη διαδικασία εξόρυξης γνώμης από αυτές. Σκοπός της εργασίας αυτής είναι η εύρεση των σημαντικότερων λαθών, όπως αυτά που προαναφέρθηκαν, στο περιεχόμενο των κριτικών και η αυτόματη διόρθωσή τους με τον κατά δυνατό καλύτερο τρόπο, ώστε το κείμενο να μπορεί να τύχει καλύτερης επεξεργασίας από συστήματα εξόρυξης γνώμης. Για την διόρθωση και κανονικοποίηση των κειμένων αρχικά εντοπίζονται ονόματα οντοτήτων, όπως για παράδειγμα «MacBook Pro» ή «Microsoft» με τη βοήθεια ενός υποσυνόλου της DBpedia και του συστήματος αναγνώρισης ονομάτων οντοτήτων (named entity recognizer) του Πανεπιστημίου Stanford. Συγκεκριμένα, αν μία λέξη ή φράση που υπάρχει στο κείμενο εντοπιστεί στην οντολογία της DBpedia ή αναγνωριστεί από το σύστημα αναγνώρισης ονομάτων οντοτήτων και δεν είναι γραμμένη με τον πιο συνήθη τρόπο γραφής της, τότε 5

7 διορθώνεται. Για παράδειγμα αν έχουμε την πρόταση «I replaced my dell laptop with a macbook air.» τότε η πρόταση θα διορθωθεί σε «I replaced my Dell laptop with a MacBook Air.». Στη συνέχεια ελέγχεται η ορθότητα των λέξεων του κειμένου με τη βοήθεια ενός στατιστικού γλωσσικού μοντέλου n-γραμμάτων που εκπαιδεύτηκε πάνω σε κριτικές τεχνολογικών προϊόντων με τη βοήθεια του SRILM Toolkit. Συγκεκριμένα, εντοπίζονται λέξεις που, σε συνδυασμό με τις προηγούμενες και τις επόμενες, έχουν χαμηλή πιθανότητα εμφάνισης και θεωρούνται από το σύστημα ως λανθασμένες. Για κάθε μία από αυτές τις λέξεις, δημιουργείται μια λίστα με πιθανές αντικαταστάσεις (διορθωμένες λέξεις), υπολογίζοντας την απόσταση διόρθωσης μεταξύ της λανθασμένης λέξης και των λέξεων ενός λεξικού. Αν κάποια λέξη της λίστας (πιθανή αντικατάσταση) κριθεί πιο κατάλληλη (κατά το γλωσσικό μοντέλο) από την αρχική (λανθασμένη) λέξη, τότε αντικαθιστά την αρχική λέξη. Τέλος, το κείμενο ελέγχεται για άλλα συνηθισμένα λάθη. Για παράδειγμα ελέγχεται αν οι προτάσεις αρχίζουν με κεφαλαίο γράμμα και τελειώνουν με αποδεκτά σημεία στίξης. Επίσης, διορθώνονται λέξεις που δεν βρίσκονται στην αρχή της πρότασης και περιέχουν κεφαλαία γράμματα, εκτός από την περίπτωση που έχουμε όλη τη λέξη γραμμένη με κεφαλαία (συχνά επισημαίνοντας έμφαση). Για παράδειγμα η πρόταση «an EXCELLENT option for a present.» θα μετατραπεί σε «An EXCELLENT option for a present.». Για την αξιολόγηση του συστήματος χρησιμοποιήθηκαν τα δεδομένα του διαγωνισμού «SemEval 2015 Task 12: Aspect Based Sentiment Analysis» που δίνονται στους διαγωνιζόμενους για εξόρυξη γνώμης. Στα κείμενα αυτά έγιναν χειρωνακτικές διορθώσεις με τη βοήθεια του εργαλείου επισημείωσης BRAT ούτως ώστε να μπορούν να συγκριθούν με τις διορθώσεις που εντοπίστηκαν από το σύστημα και να γίνει η αξιολόγησή του. Οι διορθωμένες μορφές των κειμένων αυτών είναι διαθέσιμες για όποιον επιθυμεί να τις χρησιμοποιήσει για να εκπαιδεύσει ή να αξιολογήσει το σύστημά του με αυτές. Πιο συγκεκριμένα, το σύστημα αναπτύχθηκε εξετάζοντας ένα υποσύνολο των κριτικών φορητών υπολογιστών του διαγωνισμού (training data). Κατόπιν αξιολογήθηκε στις υπόλοιπες κριτικές φορητών υπολογιστών του διαγωνισμού (test data), καθώς και σε ένα άλλο υποσύνολο δεδομένων του διαγωνισμού με κριτικές εστιατορίων, που δεν είχαν εξεταστεί κατά τη διάρκεια της ανάπτυξης του συστήματος. Με το πέρας της αξιολόγησης φάνηκε ότι το σύστημα που δημιουργήθηκε έχει αρκετά καλά αποτελέσματα σε κριτικές φορητών υπολογιστών, ενώ αντίθετα μέτρια έως κακά αποτελέσματα σε κριτικές εστιατορίων, κάτι που 6

8 ήταν αναμενόμενο λόγω της διαφορετικής φύσης των κριτικών του δεύτερου είδους. Επίσης, διαπιστώσαμε ότι αν το γλωσσικό μοντέλο εκπαιδευτεί σε πρακτικά του Ευρωπαϊκού Κοινοβουλίου αντί για κριτικές τεχνολογικών προϊόντων, τότε το σύστημα έχει πάλι κακές επιδόσεις ακόμα και σε κριτικές φορητών υπολογιστών, λόγω της διαφορετικής φύσης των κειμένων, κάτι που δείχνει τη σημασία της εκπαίδευσης του γλωσσικού μοντέλου σε συναφή κείμενα. Επομένως για την μελλοντική προσαρμογή ή επέκταση του συστήματος σε άλλου είδους ή και διαφορετικής γλώσσας κείμενα, θα πρέπει το γλωσσικό μοντέλο να εκπαιδευτεί σε παρόμοια κείμενα. Θα πρέπει να επιλεγεί επίσης το κατάλληλο υποσύνολο των ονομάτων οντοτήτων της DBpedia και ενδεχομένως να βρεθεί (ή να κατασκευαστεί) σύστημα αναγνώρισης ονομάτων οντοτήτων που να υποστηρίζει τους τύπους οντοτήτων του νέου είδους κειμένων και γλώσσας. 1.2 Διάρθρωση της Εργασίας Το υπόλοιπο της εργασίας είναι διαρθρωμένο ως εξής: Στο κεφάλαιο 2 αναφέρεται το θεωρητικό υπόβαθρο που είναι απαραίτητο για την κατανόηση του τρόπου λειτουργίας του συστήματος, καθώς και σχετικές προηγούμενες εργασίες. Στο κεφάλαιο 3 γίνεται μια σύντομη αναφορά και περιγραφή των βασικών εργαλείων (βοηθητικού λογισμικού ελεύθερης χρήσης) που χρησιμοποιήθηκαν για την ανάπτυξη του συστήματος. Στο κεφάλαιο 4 γίνεται αναλυτική περιγραφή όλων των λειτουργιών του συστήματος καθώς και επεξήγηση της διαδικασίας διόρθωσης των προτάσεων. Μετά την περιγραφή υπάρχει αναλυτικό παράδειγμα εφαρμογής των διαδικασιών. Στο κεφάλαιο 5 παρατίθενται οι πειραματικές μελέτες καθώς και τα αποτελέσματα αυτών και γενικότερα ο τρόπος με τον οποίο εξελίχθηκε η αξιολόγηση του συστήματος. 7

9 Τέλος, στο κεφάλαιο 6 συνοψίζονται τα συμπεράσματα από τα πειράματα τα οποία έγιναν και προτείνονται μελλοντικές επεκτάσεις του συστήματος. 1.3 Ευχαριστίες Θα ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή μου κ. Ίωνα Ανδρουτσόπουλο για τις ουσιαστικές και εποικοδομητικές κατευθύνσεις που μου έδωσε κατά τη διάρκεια της εκπόνησης της εργασίας αυτής, αλλά και για την ευκαιρία που μου παρείχε να ασχοληθώ με ένα τόσο ενδιαφέρον θέμα. Ευχαριστίες οφείλω και σε όλα τα μέλη της Ομάδας Επεξεργασίας Φυσικής Γλώσσας του Οικονομικού Πανεπιστημίου Αθηνών για τις σημαντικές συμβουλές, ιδέες και παρατηρήσεις τους σε όλες τις φάσεις του εγχειρήματος αυτού. Τέλος, ευχαριστώ θερμά το Δημήτρη Γαλάνη και το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου «Αθηνά» για την κατασκευή των δεδομένων που χρησιμοποιήθηκαν κατά την εκπαίδευση και αξιολόγηση του συστήματος. 8

10 2. Θεωρητικό Υπόβαθρο και Σχετικές Εργασίες Στις ενότητες που ακολουθούν γίνεται μια σύντομη αναφορά στο θεωρητικό υπόβαθρο που είναι απαραίτητο για την κατανόηση του τρόπου λειτουργίας του συστήματος. 2.1 Απόσταση Διόρθωσης Levenshtein Η απόσταση διόρθωσης Levenshtein 1 μεταξύ δύο λέξεων είναι το ελάχιστο κόστος των αλλαγών που πρέπει να γίνουν στη μία λέξη, ώστε να γίνει ίδια με την άλλη. Οι δυνατές αλλαγές και τα κόστη τους είναι: προσθήκη γράμματος σε κάποιο σημείο της λέξης (κόστος 1), αφαίρεση γράμματος από τη λέξη (κόστος 1), αντικατάσταση ενός γράμματος με κάποιο άλλο σε κάποιο σημείο της λέξης (κόστος 2). Για τον υπολογισμό της απόστασης μεταξύ δύο λέξεων χρησιμοποιείται ένας αλγόριθμος δυναμικού προγραμματισμού που περιλαμβάνει την συμπλήρωση ενός πίνακα (Ν + 1) x (M + 1) με μη αρνητικούς ακεραίους, όπου Ν το μήκος γραμμάτων της πρώτης λέξης και Μ το μήκος γραμμάτων της δεύτερης. Παρακάτω περιγράφονται τα βήματα του αλγόριθμου με παράδειγμα υπολογισμού απόστασης μεταξύ των λέξεων «GUMBO» και «GAMBOL». 1 Βλ. Jurafsky και Martin (2008), ενότητα

11 1. Δημιουργία του πίνακα τοποθετώντας τη μία λέξη οριζόντια και την άλλη κάθετα μετά από το σύμβολο # που δηλώνει την αρχή της λέξης. # G U M B O # G A M B O L Πίνακας 1 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 1) 2. Η πρώτη γραμμή και η πρώτη στήλη συμπληρώνονται με αύξοντες αριθμούς από το 0 μέχρι το συνολικό μήκος της λέξης. # G U M B O # G 1 A 2 M 3 B 4 O 5 L 6 Πίνακας 2 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 2) 3. Για κάθε ένα από τα υπόλοιπα κελιά ορίζουμε το κόστος για κάθε μια από τις αλλαγές που μπορεί να γίνουν. Θεωρούμε μια διαγώνια μετακίνηση μέσα στον πίνακα ως αντικατάσταση, μια οριζόντια μετακίνηση ως προσθήκη και μια κάθετη μετακίνηση ως διαγραφή. Οπότε για κάθε ένα από τα κελιά θα κοιτάμε τις τρεις τιμές γύρω από αυτό (αριστερά, πάνω-αριστερά και πάνω), θα προσθέτουμε το κόστος, και από τα τρία αποτελέσματα που θα προκύψουν θα τοποθετούμε το μικρότερο, με μόνη εξαίρεση την περίπτωση στην οποία τα γράμματα στις θέσεις οριζόντια και κάθετα από το κελί που εξετάζουμε είναι ίδια, οπότε το κόστος θα είναι 0. 10

12 # G U M B O # G 1 0 A 2 M 3 B 4 O 5 L 6 # G U M B O # G A 2 M 3 B 4 O 5 L 6 Πίνακας 3 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 3) Στο πρώτο στάδιο, αφού παρατηρούμε ότι έχουμε και οριζόντια αλλά και κάθετα το γράμμα G, το κόστος θα είναι 0. Άρα έχουμε τα εξής αποτελέσματα: Αριστερά: = 1 Πάνω-Αριστερά: = 0 Πάνω: = 1 Ως εκ τούτου, τοποθετούμε τον αριθμό 0 που είναι ο μικρότερος των τριών αποτελεσμάτων. Στο δεύτερο στάδιο, δεν έχουμε ίδια γράμματα οπότε με κόστος 1 παίρνουμε τα εξής: Αριστερά: = 1 Πάνω-Αριστερά: = 2 Πάνω: = 3 4. Αφού επαναλάβουμε τη διαδικασία και συμπληρώσουμε αντίστοιχα όλα τα κελιά του πίνακα, η τιμή του τελευταίου κελιού (κάτω αριστερά), θα είναι η απόσταση των δύο λέξεων. 11

13 # G U M B O # G A M B O L Πίνακας 4 - Παράδειγμα υπολογισμού απόστασης Levenshtein (Βήμα 4) Ο αλγόριθμος αυτός χρησιμοποιείται εκτεταμένα στο σύστημα στην περίπτωση εύρεσης λανθασμένων λέξεων, ούτως ώστε να βρεθούν πιθανές λέξεις για την αντικατάστασή τους. 2.2 Μοντέλα n-γραμμάτων Τα στατιστικά γλωσσικά μοντέλα 2 προσπαθούν να εκτιμήσουν την πιθανότητα εμφάνισης μιας ακολουθίας λέξεων σε μια συγκεκριμένη γλώσσα. Μία από τις πιο δημοφιλείς τεχνικές στατιστικής εκτίμησης είναι τα μοντέλα n-γραμμάτων. Ο ρόλος τους είναι πολύ σημαντικός σε πολλές εφαρμογές της Γλωσσικής Τεχνολογίας, όπως η αναγνώριση φωνής, η οπτική αναγνώριση χαρακτήρων, η μηχανική μετάφραση, και στην προκειμένη περίπτωση, η ορθογραφική διόρθωση κειμένων. Με τον όρο n-γραμμα, εννοούμε εδώ την ακολουθία n συνεχόμενων λέξεων, όπως για παράδειγμα: 3-γραμματα: «ένας καλός φοιτητής», «ο μεγάλος σκύλος» 2-γραμματα: «καλός φοιτητής», «στο πανεπιστήμιο» Ένα γλωσσικό μοντέλο n-γραμμάτων χρησιμοποιείται για να υπολογίσει την πιθανότητα εμφάνισης μιας ολόκληρης φράσης ή πρότασης (γενικά με περισσότερες από n λέξεις), «σπάζοντας» την πιθανότητα όλης της φράσης ή πρότασης σε γινόμενο πιθανοτήτων των n- k γραμμάτων της. Χρησιμοποιώντας τον συμβολισμό w 1 για μια ακολουθία λέξεων 2 Βλ. Jurafsky και Martin (2008), ενότητες

14 w 1, w 2,, w k η πιθανότητα εμφάνισης μιας ακολουθίας λέξεων με χρήση του κανόνα της αλυσίδας είναι: P(w 1 k ) = P(w 1,, w k ) = P(w 1 ) P(w 2 w 1 ) P(w 3 w 1 2 ) P(w k w 1 k 1 ) Γενικότερα όμως στα μοντέλα n-γραμμάτων, για απλούστευση, γίνεται η παραδοχή ότι η πιθανότητα εμφάνισης μιας λέξης δεν εξαρτάται από όλες τις προηγούμενες, αλλά μόνο από τις n 1 προηγούμενες, δηλαδή: P(w i w i 1 i 1 1 ) P(w i w i n+1 ) Αν για παράδειγμα έχουμε ένα σώμα κειμένων και θέλουμε να υπολογίσουμε την πιθανότητα της φράσης «he is a student», με χρήση 2-γραμμάτων τότε θα υπολογίσουμε: P(he is a student) = P(he start) P(is he) P(a is) P(student a) P(end student) όπου start και end ψευδο-λέξεις που δείχνουν την αρχή και το τέλος της φράσης αντίστοιχα. Για τον υπολογισμό των πιθανοτήτων αυτών έχουμε για παράδειγμα: P(student a) = c(a,student) c(a) = συνολικές εμφανίσεις της φράσης a student στο κείμενο συνολικές εμφανίσεις της λέξης a στο κείμενο Προκειμένου να αποφευχθούν μηδενικές εκτιμήσεις πιθανοτήτων για n-γράμματα που δεν εμφανίζονται στο σώμα εκπαίδευσης, συνήθως χρησιμοποιούνται διάφορες τεχνικές εξομάλυνσης πιθανοτήτων 3 όπως Good-Turing, Kneser-Ney κτλ. Στην παρούσα εργασία χρησιμοποιείται η τεχνική εξομάλυνσης Good-Turing. Σύμφωνα με την τεχνική αυτή θεωρούμε ότι η πιθανότητα να συναντήσουμε κάποια λέξη w την οποία δεν έχουμε ξανασυναντήσει ισούται με την πιθανότητα να συναντήσουμε μια λέξη που έχουμε συναντήσει μόνο μια φορά και υπολογίζουμε: P GT (w) = 1 N 1 C 3 Βλ. Jurafsky και Martin, ενότητα

15 όπου Ν 1 ο αριθμός των (διαφορετικών) λέξεων που έχουμε συναντήσει μόνο μια φορά στο σώμα εκπαίδευσης και C το σύνολο των λέξεων στο κείμενο (tokens). Στην περίπτωση που έχουμε συναντήσει την w ακριβώς c φορές (c > 0) στο σώμα εκπαίδευσης, τότε υπολογίζουμε: P GT (w) = c + 1 C Nc+1 N c Ομοίως, για 3-γράμματα, αν δεν έχουμε συναντήσει την ακολουθία w i 2, w i 1, w i τότε υπολογίζουμε: P GT (w i w i 2, w i 1 ) = 1 N 1 c(w i 2, w i 1 ) και αντίστοιχα αν έχουμε συναντήσει την ακολουθία w i 2, w i 1, w i ακριβώς c φορές (c > 0) στο σώμα εκπαίδευσης, τότε υπολογίζουμε: P GT (w i w i 2, w i 1 ) = c + 1 c(w i 2, w i 1 ) Nc+1 N c Στην παρούσα εργασία, γίνεται εκπαίδευση ενός γλωσσικού μοντέλου 3-γραμμάτων και χρησιμοποιούνται ξεχωριστά τα 3-γράμματα, δεν γίνεται δηλαδή υπολογισμός πιθανοτήτων φράσεων μεγαλύτερων των τριών λέξεων. Για κάθε λέξη που ελέγχεται χρησιμοποιούμε τις πιθανότητες που αφορούν τη λέξη αυτή με τις δύο προηγούμενες ή δύο επόμενες λέξεις. Για την εκπαίδευση του γλωσσικού μοντέλου χρειάζεται ένα μεγάλο σώμα κειμένων (corpus) από το οποίο θα εκτιμηθούν οι συχνότητες των 3-γραμμάτων. Επίσης, το είδος των κειμένων του σώματος θα πρέπει να είναι σχετικό με τις προτάσεις οι οποίες θα δοθούν προς διόρθωση. Αν για παράδειγμα, η εκπαίδευση του γλωσσικού μοντέλου γίνει σε ένα σώμα με κριτικές ειδών ρουχισμού και επιδιώξουμε να γίνει διόρθωση κριτικών φορητών υπολογιστών, η πιθανότητα του 3-γράμματος «this laptop is» θα είναι αν όχι μηδενική, πολύ χαμηλή, σε σύγκριση με ένα γλωσσικό μοντέλο το οποίο έχει εκπαιδευτεί σε κριτικές που έχουν να κάνουν με προϊόντα τεχνολογίας. 14

16 Στην παρούσα εργασία, η εκπαίδευση του γλωσσικού μοντέλου γίνεται με τη χρήση ενός έτοιμου (ελεύθερα διαθέσιμου) εργαλείου δημιουργίας γλωσσικών μοντέλων, του SRILM. Περισσότερα για το συγκεκριμένο εργαλείο αναφέρονται στο κεφάλαιο Σχετικές εργασίες Στην ενότητα αυτή θα δούμε μερικές μεθόδους που έχουν χρησιμοποιηθεί τα τελευταία χρόνια για τη διόρθωση κειμένων. Διόρθωση βασισμένη στη συνοχή Η πρώτη μέθοδος στην οποία θα αναφερθούμε είναι αυτή των Hirst και Budanitsky (2005) που βασίζεται στη συνοχή του περιεχομένου του κειμένου (coherence based). Συγκεκριμένα χρησιμοποιούνται σημασιολογικά μέτρα απόστασης με βάση το WordNet 4 για να εντοπιστούν λέξεις που δεν ταιριάζουν με τις υπόλοιπες στην ίδια πρόταση. Για κάθε λέξη υπολογίζεται ένα μέτρο ομοιότητας (similarity) σε σχέση με τις υπόλοιπες και αν το αποτέλεσμα είναι μικρότερο από ένα προκαθορισμένο αριθμό (παράμετρο) τότε η λέξη θεωρείται λανθασμένη. Για την εύρεση των πιθανών αντικαταστάσεων της λέξης αυτής χρησιμοποιείται το λογισμικό ανοικτού κώδικα Ιspell 5, το οποίο περιορίζει την εύρεση πιθανών αντικαταστάσεων σε λέξεις με μέγιστη απόσταση (Levenshtein) ίση με 1 κάτι που μπορεί να θεωρηθεί ως βασικό μειονέκτημα σε σύγκριση με τη δική μας μέθοδο. Τέλος, ως διόρθωση επιλέγεται η λέξη η οποία έχει το μεγαλύτερη ομοιότητα με το υπόλοιπο της πρότασης, δηλαδή αυτή για την οποία μεγιστοποιείται η ομοιότητα (similarity) με το υπόλοιπο περιεχόμενο της πρότασης. Σύνολα σύγχυσης Η μέθοδος των Golding και Roth (1999) βασίζεται στη χρήση ενός αλγόριθμου μηχανικής μάθησης με προκαθορισμένα «σύνολα σύγχυσης» (confusion sets) [Alla and Roth 2010]. Τα σύνολα σύγχυσης περιέχουν λέξεις οι οποίες συχνά χρησιμοποιούνται λανθασμένα έναντι των άλλων λέξεων που ανήκουν στο ίδιο σύνολο. 4 WordNet - 5 Ispell - https://www.gnu.org/software/ispell/ 15

17 Μερικά παραδείγματα συνόλων σύγχυσης μπορεί να είναι {to, too}, {principal, principle}, {their, they're, there} κτλ. Αφού οριστούν τα σύνολα σύγχυσης γίνεται εκπαίδευση του συστήματος σε κείμενα ούτως ώστε να μάθει να αποφασίζει για κάθε σύνολο ποια από τις λέξεις μέσα στο σύνολο πρέπει να χρησιμοποιηθεί με βάση το υπόλοιπο περιεχόμενο της πρότασης. Το βασικό μειονέκτημα αυτής της μεθόδου είναι τα προκαθορισμένα σύνολα σύγχυσης, που έχουν ως συνέπεια λάθη τα οποία δεν έχουν προβλεφθεί εξαρχής να μην εντοπίζονται. Βασικά πλεονεκτήματα σε σύγκριση με το δικό μας σύστημα είναι ότι με τη χρήση αυτής της μεθόδου δεν υπάρχουν μεγάλες απαιτήσεις σε μνήμη (π.χ. για την αποθήκευση πιθανοτήτων n-γραμμάτων ή λεξικών όπως στην περίπτωση του δικού μας συστήματος) και επίσης ότι η εύρεση πιθανών αντικαταστάσεων μιας λέξης που θεωρείται λανθασμένη δεν περιορίζεται με βάση την απόσταση διόρθωσης (π.χ. ένα έγκυρο confusion set μπορεί να είναι το {money, amount}, ενώ στο δικό μας σύστημα δεν μπορεί να γίνει τέτοιου είδους διόρθωση). Σύνολα σύγχυσης και μάθηση κανόνων Η μέθοδος των Mangu και Brill (1997) είναι αρκετά παρόμοια με την προηγούμενη. Βασίζεται και αυτή στη χρήση συνόλων σύγχυσης και μηχανικής μάθησης. Πιο συγκεκριμένα χρησιμοποιείται μάθηση βασισμένη σε μετασχηματισμούς (transformation based learning). Κατά την εκπαίδευση, το σύστημα μαθαίνει κανόνες που του επιτρέπουν να επιλέγει μεταξύ των λέξεων κάθε συνόλου σύγχυσης. Ένας κανόνας μπορεί π.χ. να είναι «Αντικατάσταση της λέξης except με accept αν η προηγούμενη λέξη είναι does και η επόμενη it» ή «Αντικατάσταση της λέξης its με it's αν η επόμενη λέξη είναι not». Έτσι, με το πέρας της εκπαίδευσης για κάθε σύνολο σύγχυσης υπάρχει και ένα σύνολο από κανόνες (συγκεκριμένο για κάθε confusion set) το οποίο λαμβάνεται υπόψιν στη διαδικασία διόρθωσης. Με χρήση n-γραμμάτων Τέλος, η μέθοδος των Mays, Damerau και Mercer (1991) παρουσιάζει τη μεγαλύτερη συνάφεια με τη δική μας, καθώς χρησιμοποιούνται πιθανότητες 3-γραμμάτων για τη διόρθωση των κειμένων. Η κύρια διαφορά αυτής της μεθόδου με τη δική μας είναι ότι για κάθε λέξη μιας 16

18 πρότασης, βρίσκονται πιθανές αντικαταστάσεις και υπολογίζονται (με το γλωσσικό μοντέλο) οι πιθανότητες όλων των συνδυασμών (όπου μία ή περισσότερες αρχικές λέξεις έχουν αντικατασταθεί). Στο τέλος επιλέγεται ο πιθανότερος συνδυασμός. Αν και θεωρητικά ο έλεγχος όλων των πιθανών συνδυασμών μπορεί να μας δώσει καλύτερα αποτελέσματα, ο χρόνος διόρθωσης ενός μεγάλου αριθμού προτάσεων μπορεί να είναι μεγάλος. Αν έχουμε, για παράδειγμα, μια πρόταση 5 λέξεων, όπου η κάθε λέξη έχει 2 πιθανές αντικαταστάσεις (στην πραγματικότητα θα είναι πολύ περισσότερες), τότε θα πρέπει να υπολογιστούν πιθανότητες για 3 5 = 243 προτάσεις. Στην πράξη, βέβαια, δεν χρειάζεται να υπολογιστεί ξεχωριστά η πιθανότητα κάθε διαφορετικού συνδυασμού. Ο υπολογισμός του πιθανότερου συνδυασμού μπορεί να γίνει πιο αποδοτικά με χρήση δυναμικού προγραμματισμού. Παρ όλα αυτά για μεγάλες προτάσεις και πολλές αντικαταστάσεις, ο υπολογισμός μπορεί να είναι υπολογιστικά ακριβός. 17

19 3. Βοηθητικά Εργαλεία 3.1 Σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford Το σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford (Stanford Named Entity Recognizer) 6 είναι γραμμένο σε Java και διατίθεται δωρεάν με άδεια GNU General Public License για ερευνητικούς και εκπαιδευτικούς σκοπούς. Κύριος στόχος του εργαλείου αυτού είναι να εντοπίζει μέσα σε κείμενα ακολουθίες λέξεων που αποτελούν ονόματα οντοτήτων και να τους αποδίδει ετικέτες που προσδιορίζουν τον τύπο του κύριου ονόματος. Ανάλογα με την θεματική περιοχή και το πεδίο εφαρμογής, έχουν οριστεί διάφοροι τύποι κυρίων ονομάτων. Οι πιο συνηθισμένοι είναι πρόσωπα (Person), τοπωνύμια (Location) και οργανισμοί (Organization). Αυτοί είναι και οι τύποι που υποστηρίζονται από το σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford. Ο τρόπος χρήσης του συγκεκριμένου εργαλείου είναι αρκετά απλός. Χρησιμοποιώντας το API του λογισμικού, δίνεται ως όρισμα μία πρόταση και η πρόταση αυτή επιστρέφεται σε διάφορες μορφές έχοντας σημειωμένα τα ονόματα οντοτήτων που κατάφερε να αναγνωρίσει το λογισμικό καθώς και τον τύπο οντότητας. Παραδείγματα χρήσης: input output Good afternoon John Thomas. Good afternoon <PERSON>John Thomas</PERSON>. input output I go to school at Stanford University, which is located in California. I go to school at <ORGANIZATION>Stanford University<ORGANIZATION>, which is located in <LOCATION>California</LOCATION>. 6 Σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford - 18

20 3.2 DBpedia H DBpedia 7 αποτελεί μια συλλογική προσπάθεια για την εξαγωγή και επαναχρησιμοποίηση δομημένης πληροφορίας από την Wikipedia. Στόχος της είναι να δημιουργήσει νέους τρόπους αξιοποίησης του πλούτου της Wikipedia και να εμπνεύσει νέους μηχανισμούς για πλοήγηση, διασύνδεση και βελτίωση της ίδιας της εγκυκλοπαίδειας. H DBpedia μας παρέχει πολλούς τρόπους αξιοποίησης της δομημένης πληροφορίας που διαθέτει. Για τη χρήση της στην εργασία αυτή, μας ενδιαφέρει συγκεκριμένα, η DBpedia Ontology που είναι στην ουσία ένα τεράστιο αρχείο (6.81 GB) το οποίο περιέχει οντότητες καθώς και την κατηγορία στην οποία αυτές ανήκουν. Πιο συγκεκριμένα το αρχείο περιέχει γραμμές οι οποίες είναι σε μορφή RDF και αποτελούνται από 4 πεδία: DBpedia Link για το όνομα οντότητας W3 Link για τον πόρο RDF#type DBpedia Link για την κατηγορία στην οποία ανήκει το όνομα Wikipedia Link από το οποίο έχει συλλέξει τα δεδομένα Για την χρήση της οντολογίας αυτής, στην παρούσα εργασία χρησιμοποιείται ένα μικρό υποσύνολο του αρχείου αυτού, για τις κατηγορίες που μας ενδιαφέρουν. Ο ακριβής τρόπος με τον οποίο χρησιμοποιείται περιγράφεται στην ενότητα 4.1. Στην παρακάτω εικόνα φαίνεται η εγγραφή στη DBpedia για τον Αυτισμό (Autism) που ανήκει στην κατηγορία Ασθένεια (Disease) και τέλος το link στη Wikipedia όπου υπάρχουν πληροφορίες. Εικόνα 1 - Screenshot από αρχείο της DBpedia 7 DBpedia - 19

21 3.3 SRILM Toolkit Το SRILM Toolkit (SRI Language Modeling Toolkit) 8 είναι ένα εργαλείο, ή καλύτερα μια συλλογή από ξεχωριστά εκτελέσιμα προγράμματα, γραμμένα σε C++ που χρησιμοποιούνται για την παραγωγή στατιστικών γλωσσικών μοντέλων. Το εργαλείο αυτό είναι ιδιαίτερα χρήσιμο για τη δημιουργία γλωσσικών μοντέλων που βασίζονται σε n-γράμματα όπως επίσης και για την αξιολόγησή τους. Οι δύο βασικές λειτουργίες του SRILM που μας ενδιαφέρουν είναι: Εξαγωγή αρχείου με την καταμέτρηση n-γραμμάτων από το σώμα κειμένων. Εκπαίδευση γλωσσικού μοντέλου στο αρχείο με τις μετρήσεις n-γραμμάτων. Εικόνα 2 - Βασικές λειτουργίες του SRILM Toolkit Η διαδικασία εκπαίδευσης του γλωσσικού μοντέλου φαίνεται στο παραπάνω σχήμα. Γίνεται καταμέτρηση των n-γραμμάτων μέσα στο κείμενο (Traning Corpus) και τα αποτελέσματα αποθηκεύονται σε ένα αρχείο (Count File). Από το αρχείο αυτό παράγεται και το τελικό γλωσσικό μοντέλο (LM). Προαιρετικά μπορεί να χρησιμοποιηθεί ένα λεξικό (Lexicon) ούτως ώστε τα n-γράμματα τα οποία περιέχουν λέξεις που δεν υπάρχουν στο λεξικό να μην εμφανίζονται στο τελικό αρχείο. 8 SRI Language Modeling Toolkit - 20

22 Αν και το εργαλείο μας δίνει πάρα πολλές δυνατότητες, σε αυτή την ενότητα θα επικεντρώσουμε το ενδιαφέρον μας στις λειτουργίες εκείνες που χρησιμοποιήθηκαν στη δημιουργία του συστήματος, με τη χρήση ενός παραδείγματος. Θέλοντας να δημιουργήσουμε ένα γλωσσικό μοντέλο με 3-γράμματα, χρησιμοποιούμε ένα σώμα αρχείων, στο οποίο υπάρχει μία πρόταση ανά γραμμή, όπως φαίνεται στην παρακάτω εικόνα. Εικόνα 3 - Παράδειγμα κειμένου για εκπαίδευση γλωσσικού μοντέλου Έχοντας το κείμενο στο οποίο θα γίνει η εκπαίδευση, εκτελούμε την παρακάτω εντολή: ngram-count -text demo.txt -order 3 -write demo.count -lm demo.lm Με την εκτέλεση της εντολής αυτής το εργαλείο θα εκπαιδεύσει ένα γλωσσικό μοντέλο από το περιεχόμενο του αρχείου demo.txt (-text), με 3-γράμματα (-order). Πρώτα θα μετρήσει τις εμφανίσεις κάθε 3-γράμματος, θα αποθηκεύσει τα αποτελέσματα στο αρχείο demo.count (-write) και στη συνέχεια με χρήση των μετρήσεων αυτών θα δημιουργήσει το τελικό αρχείο demo.lm (-lm) που θα περιέχει λογάριθμους πιθανότητας εμφάνισης του κάθε 3-γράμματος. Η παράμετρος για χρήση εξομάλυνσης (-discount) παραλείπεται γιατί το εργαλείο έχει ως προκαθορισμένη (default) τη χρήση του Good-Turing την οποία θα χρησιμοποιήσουμε. Στις εικόνες που ακολουθούν φαίνονται παραδείγματα των δύο αρχείων που δημιουργούνται (ένα με τις μετρήσεις και ένα με τους λογάριθμους πιθανοτήτων). 21

23 Εικόνα 4 - Παράδειγμα αρχείου με μετρήσεις εμφανίσεων Εικόνα 5 - Παράδειγμα τελικού αρχείου με γλωσσικό μοντέλο 22

24 3.4 Εργαλείο Επισημείωσης BRAT To Εργαλείο Επισημείωσης BRAT (BRAT Annotation Tool) 9 είναι ένα web-based εργαλείο επισημείωσης και σχολιασμού κειμένου. Διατίθεται δωρεάν (MIT License) και είναι αρκετά εύκολο στη χρήση του. Στην εργασία αυτή το συγκεκριμένο εργαλείο χρησιμοποιήθηκε για να επισημειωθούν χειρωνακτικά τα λάθη που υπήρχαν στις προτάσεις με τις οποίες ασχοληθήκαμε και στη συνέχεια εξήχθησαν από το εργαλείο σε μία μορφή εύκολα επεξεργάσιμη από το σύστημα. Παράδειγμα χρήσης φαίνεται στο παρακάτω screenshot. Εικόνα 6 - Screenshot χρήσης του BRAT Annotation Tool Όπως φαίνεται στο παραπάνω παράδειγμα, μέσω του εργαλείου εντοπίζουμε και επιλέγουμε τις λανθασμένες λέξεις και σαν σχόλιο γράφουμε τη λέξη (μπορεί να είναι η ίδια με την αρχική με κάποια διόρθωση ή οποιαδήποτε άλλη που ταιριάζει καλύτερα) η οποία θα έπρεπε να βρίσκεται στη θέση της λανθασμένης. Περισσότερες πληροφορίες για τα δεδομένα που χρησιμοποιήθηκαν στα πειράματα καθώς και τα είδη διορθώσεων που έγιναν, υπάρχουν στο κεφάλαιο 5. 9 Brat Annotation Tool - 23

25 4. Αρχιτεκτονική Συστήματος Το σύστημα που δημιουργήθηκε έχει αναπτυχθεί σε γλώσσα Java. Οι κύριοι λόγοι επιλογής της συγκεκριμένης γλώσσας ήταν η εύκολη υποστήριξη βοηθητικών βιβλιοθηκών και εργαλείων, όπως για παράδειγμα το σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford, αλλά και η πολύ καλή υποστήριξη ξένων γλωσσών, σε περίπτωση που επεκταθεί το σύστημα για Ελληνικά κείμενα. Αποτελείται από 6 βασικά κομμάτια, καθένα από τα οποία αναλαμβάνει την εκτέλεση των βασικών διαδικασιών για τη διόρθωση των προτάσεων που είναι οι εξής: Προεπεξεργασία Σε αυτή τη διαδικασία, εισάγονται στο σύστημα τα αρχεία που έχουν εξαχθεί από το Εργαλείο επισημείωσης BRAT με τις διορθώσεις και δημιουργείται ένα μοναδικό XML αρχείο με όλες τις προτάσεις και τις διορθώσεις τους. Αυτό το μοναδικό αρχείο δίνεται αργότερα ως είσοδος στην επόμενη διαδικασία του συστήματος για να αρχίσουν οι διαδικασίες διόρθωσης των προτάσεων. Σημειώνεται ότι οι χειρωνακτικές διορθώσεις χρησιμοποιούνται από το σύστημα μόνο κατά την αξιολόγηση (συγκρίνοντάς τις χειρωνακτικές διορθώσεις με αυτές που εντόπισε το σύστημα). Εισαγωγή προτάσεων, λεξικών και γλωσσικού μοντέλου Αφού διαβαστεί το αρχείο XML που περιέχει όλες τις προτάσεις με τις διορθώσεις τους τότε εισάγονται στη μνήμη του συστήματος για να αρχίσει η επεξεργασία και στη συνέχεια η διόρθωσή τους. Για την επεξεργασία αυτή εισάγονται επίσης δύο λεξικά. Ένα με ονόματα οντοτήτων (που φτιάχτηκε από τις οντολογίες της DBpedia) και ένα με λέξεις τις Αγγλικής γλώσσας που δημιουργήθηκε με τη συγχώνευση ελεύθερα διαθέσιμων λεξικών και λέξεων από τα πρακτικά του Ευρωπαϊκού Κοινοβουλίου. Τέλος, εισάγεται ένα κατάλληλα εκπαιδευμένο γλωσσικό μοντέλο. Όπως έχει προαναφερθεί και σε προηγούμενες ενότητες, για καλύτερα αποτελέσματα το γλωσσικό μοντέλο πρέπει να είναι εκπαιδευμένο σε κείμενα με παρόμοιο θέμα με αυτά που πρόκειται να ελέγξει το σύστημα. 24

26 Εύρεση και διόρθωση ονομάτων οντοτήτων: Στη διαδικασία αυτή, η κάθε πρόταση ελέγχεται για το αν περιέχει λέξεις ή φράσεις που είναι ονόματα οντοτήτων (ονόματα, τοποθεσίες, οργανισμοί κτλ.) με τη βοήθεια του λεξικού που αναφέραμε πιο πάνω (DBpedia) και του συστήματος αναγνώρισης ονομάτων οντοτήτων του Stanford. Αν βρεθούν λέξεις ή φράσεις οι οποίες αναγνωριστούν ως ονόματα οντοτήτων και δεν είναι γραμμένα με τον πιο συνήθη τρόπο γραφής τους, τότε διορθώνονται. Για παράδειγμα η φράση «windows 7 home edition» θα μετατραπεί σε «Windows 7 Home Edition». Εύρεση και διόρθωση λέξεων Στη διαδικασία αυτή, ελέγχεται κάθε λέξη της πρότασης σε συνδυασμό με τις δύο προηγούμενες και τις δύο επόμενες λέξεις χρησιμοποιώντας τις πιθανότητες των 3- γραμμάτων του γλωσσικού μοντέλου. Για κάθε λέξη που θεωρείται λανθασμένη (τα 3-γράμματα στα οποία συμμετέχει στην πρόταση έχουν χαμηλή πιθανότητα εμφάνισης), δημιουργείται μια λίστα πιθανών αντικαταστάσεων που περιέχει όλες τις κοντινές λέξεις του λεξικού, με βάση την απόσταση Levenshtein (η μέγιστη απόσταση δίνεται ως παράμετρος στο σύστημα). Οι πιθανές αντικαταστάσεις ελέγχονται χρησιμοποιώντας πάλι τις πιθανότητες των 3-γραμμάτων και αν κάποια αντικατάσταση κριθεί αρκετά πιο κατάλληλη (με βάση ένα κατώφλι πιθανότητας που δίνεται ως παράμετρος στο σύστημα) τότε γίνεται η αντικατάστασή της λανθασμένης λέξης με αυτή. Ο ακριβής τρόπος λειτουργίας και οι υπολογισμοί που γίνονται στη διαδικασία αυτή εξηγούνται στις ενότητες και 4.5. Άλλες διορθώσεις Πρόκειται για την τελευταία διαδικασία διόρθωσης και ελέγχει για τρία συγκεκριμένα είδη λαθών: o Στην πρώτη λέξη της πρότασης, πρέπει το πρώτο γράμμα να είναι κεφαλαίο. o Η τελευταία λέξη της πρότασης πρέπει να ακολουθείται από κάποιο αποδεκτό σημείο στίξης (τελεία '. ', θαυμαστικό '!' ή ερωτηματικό '?'). o Αν μια λέξη δεν είναι ούτε ή πρώτη ούτε η τελευταία, δεν θα πρέπει να έχει κανένα γράμμα κεφαλαίο. Εξαιρούνται οι περιπτώσεις ονομάτων οντοτήτων. 25

27 Εξαγωγή τελικού XML αρχείου και στατιστικών Στη διαδικασία αυτή, αφού υπάρχουν στο σύστημα όλες οι προτάσεις με τις χειρωνακτικές διορθώσεις αλλά και με τις διορθώσεις του συστήματος, παράγεται ένα τελικό XML αρχείο το οποίο έχει την ίδια μορφή με το αρχικό που δίνεται ως είσοδος στο σύστημα. Η μόνη διαφορά είναι ότι περιλαμβάνει και όλες τις διορθώσεις που βρήκε το σύστημα. Τέλος, συγκρίνοντας τις διορθώσεις, εξάγονται κάποια στατιστικά που αναδεικνύουν την αξιοπιστία του συστήματος. Στο σχήμα που ακολουθεί φαίνεται σε υψηλό επίπεδο ο τρόπος λειτουργίας του συστήματος με τη σειριακή χρήση των διαδικασιών που προαναφέρθηκαν. 26

28 Εικόνα 7 - Βασικές διαδικασίες του συστήματος Στη συνέχεια θα περιγραφούν αναλυτικά οι διαδικασίες διόρθωσης και στο τέλος θα ακολουθήσει παράδειγμα στο οποίο φαίνεται πώς με τον συνδυασμό όλων των διαδικασιών γίνεται η διόρθωση μιας πρότασης. 27

29 4.1 Προεπεξεργασία Στη διαδικασία αυτή ο βασικός στόχος είναι η μετατροπή των αρχείων που εξάγονται από το εργαλείο επισημείωσης BRAT σε ένα μοναδικό αρχείο που περιέχει όλες τις προτάσεις μαζί με τις διορθώσεις τους. Εικόνα 8 - Διαδικασία προεπεξεργασίας Το BRAT αποθηκεύει τριάδες αρχείων, όπου η κάθε τριάδα αφορά ένα υποσύνολο των προτάσεων. Για παράδειγμα, οι παρακάτω προτάσεις: Εικόνα 9 - Παράδειγμα αρχείου στο BRAT εξάγονται από το BRAT σε τρία αρχεία: Ένα με κατάληξη.txt το οποίο περιέχει μόνο τις προτάσεις. Εικόνα 10 - Αρχείο BRAT με κατάληξη.txt 28

30 Ένα με κατάληξη.ann το οποίο περιέχει τις χειρωνακτικές διορθώσεις που έγιναν με βάση το offset της κάθε διόρθωσης. Κάθε διόρθωση που έγινε περιγράφεται με δύο γραμμές στο συγκεκριμένο αρχείο. Αν δούμε για παράδειγμα την πρώτη γραμμή της εικόνας του παραδείγματος πιο κάτω, φαίνεται ότι έχει γίνει η επισημείωση της λέξης «the» που ξεκινάει στο offset 0 και τελειώνει στο offset 3 από την αρχή του αρχείου με id=t1 (μοναδικό id για την επισημείωση). Στην επόμενη γραμμή φαίνεται ότι στην επισημείωση με id=t1, δηλαδή αυτήν που βρίσκεται στην πρώτη γραμμή, η σωστή αντικατάσταση είναι η λέξη «The». Εικόνα 11 - Αρχείο BRAT με κατάληξη.ann Ένα αρχείο με κατάληξη.id το οποίο περιέχει το id της κάθε πρότασης. Το id της κάθε πρότασης έχει τη μορφή «όνομα_αρχείου:αριθμός_πρότασης_μέσα_στο_αρχείο». Η κάθε γραμμή του συγκεκριμένου αρχείου αντιστοιχεί με την ίδια γραμμή στο αρχείο.txt. Δηλαδή στο παράδειγμα που φαίνεται στην παρακάτω εικόνα βλέπουμε ότι στην πρώτη γραμμή του αρχείου (10.id) έχουμε το id «10:0». Αυτό σημαίνει ότι στο αντίστοιχο αρχείο όπου υπάρχει το κείμενο (10.txt) η πρόταση που βρίσκεται στην πρώτη γραμμή («the laptop was really») είναι η πρώτη (0) στο αρχείο (10). Εικόνα 12 - Αρχείο BRAT με κατάληξη.id 29

31 Σε αυτή τη διαδικασία, το σύστημα παίρνει ως είσοδο όλες αυτές τις τριάδες αρχείων και αφού κάνει τη σωστή αντιστοίχιση των κειμένων με τα ids και τις διορθώσεις, παράγει ένα μοναδικό αρχείο XML, με όλες τις πληροφορίες. Παρακάτω φαίνεται η μετατροπή για την πρώτη πρόταση του αρχείου που είδαμε και πιο πάνω. Κάθε πρόταση μετατρέπεται σε ένα στοιχείο (element) «sentence» με attributes): id: Το id σύμφωνα με το αρχείο 10.id. file: Το αρχείο στο οποίο υπάρχει το περιεχόμενο της πρότασης (10.txt). text: Το περιεχόμενο της πρότασης humannormalizations: Όλες οι διορθώσεις που έγιναν σύμφωνα με το αρχείο.ann Εικόνα 13 - Τελικό XML μετά από τη διαδικασία της προεπεξεργασίας 30

32 4.2 Εισαγωγή προτάσεων, λεξικών και γλωσσικού μοντέλου Στη διαδικασία αυτή δημιουργούνται και αρχικοποιούνται οι βασικές δομές του συστήματος στις οποίες θα αποθηκευτούν οι προτάσεις, τα λεξικά καθώς και το γλωσσικό μοντέλο για γρήγορη προσπέλαση και επεξεργασία από τις διαδικασίες διόρθωσης. Εικόνα 14 - Δομές συστήματος για την εισαγωγή προτάσεων, λεξικών και γλωσσικού μοντέλου Χρησιμοποιούμε τέσσερα αρχεία τα οποία αποθηκεύονται σε διαφορετικές δομές: Το XML που δημιουργήσαμε στη διαδικασία προεπεξεργασίας Το σύστημα δημιουργεί μια δομή τύπου ArrayList από προτάσεις τύπου Sentence. Ο τύπος αυτός (Sentence) δημιουργήθηκε ούτως ώστε κάθε πρόταση να αποθηκεύεται ξεχωριστά μαζί με τις διορθώσεις της. Σε αυτή τη δομή θα προστεθούν αργότερα οι διορθώσεις που βρίσκει το σύστημα και έτσι θα μπορούν εύκολα να γίνουν συγκρίσεις για την εξαγωγή στατιστικών. 31

33 Λεξικό με όλες τις λέξεις της Αγγλικής γλώσσας Το λεξικό αυτό φτιάχτηκε χρησιμοποιώντας τις εξής πηγές: o Τα ελεύθερα διαθέσιμα λεξικά του OpenOffice για την Αγγλική γλώσσα. o Λέξεις από τα πρακτικά του Ευρωπαϊκού Κοινοβουλίου οι οποίες εμφανίζονται πάνω από δέκα φορές. Συγχωνεύοντας λοιπόν όλες τις λέξεις από τις δύο αυτές πηγές, δημιουργήθηκε ένα μεγάλο λεξικό μεγέθους περίπου 9MB το οποίο καλύπτει, αν όχι όλες, ένα μεγάλο ποσοστό των λέξεων της Αγγλικής γλώσσας. Οι λέξεις αυτές αποθηκεύονται σε μια δενδρική δομή Τrie, κάτι που επιτρέπει τον γρήγορο υπολογισμό της απόστασης Levenshtein μιας λέξης με όλες τις λέξεις του λεξικού. 10 Εικόνα 15 - Παράδειγμα δομής Trie Λεξικό με ονόματα-οντοτήτων Το λεξικό αυτό δημιουργήθηκε, όπως προαναφέραμε και στην ενότητα 3.2, από τη DBpedia Ontology. Από το τεράστιο λοιπόν αρχείο της DBpedia (6.81GB) που περιέχει πολλών κατηγοριών ονόματα, κρατήσαμε αυτά που μας ενδιαφέρουν περισσότερο. Πιο συγκεκριμένα κρατήσαμε ονόματα που ανήκουν στις εξής κατηγορίες: 10 Βλ. Καραμπάτσης (2014), ενότητα

34 o Company & Organization (εταιρίες/οργανισμοί όπως Dell, Acer, HP κτλ.) o Software (Προϊόντα λογισμικού όπως Linux, Microsoft Office κτλ.) o Information Appliance (Συσκευές όπως IPhone, MacBook κτλ.) Επίσης αφαιρέθηκαν όλες οι πρόσθετες πληροφορίες που υπήρχαν (links, πόροι) και έτσι το αρχείο περιέχει απλά μία λέξη ή φράση ανά γραμμή. Οι φράσεις αυτές αποθηκεύονται σε μία δομή (HashSet) για γρήγορη αναζήτηση με βάση το όνομα. Γλωσσικό μοντέλο Το γλωσσικό μοντέλο που χρησιμοποιεί το σύστημα φτιάχτηκε με τη βοήθεια του SRILM Toolkit. Για τη δημιουργία του, όπως προαναφέρθηκε και στην ενότητα 3.3, χρησιμοποιήθηκε ένα μεγάλο σώμα κριτικών, το SNAP 11, που διατίθεται ελεύθερα από το Πανεπιστήμιο του Stanford. Το SNAP, είναι ένα τεράστιο dataset που αποτελείται από κριτικές προϊόντων στο Amazon. Οι κριτικές αυτές, που είναι περίπου , έχουν χωριστεί σε κατηγορίες ανάλογα με τα προϊόντα στα οποία αναφέρονται. Από τις κατηγορίες αυτές επιλέχθηκαν οι πιο σχετικές: o Electronics ( κριτικές) o Software ( κριτικές) Από αυτές τις κατηγορίες συγχωνεύτηκαν όλες οι κριτικές και δημιουργήθηκε το τελικό κείμενο στο οποίο έγινε η εκπαίδευση του γλωσσικού μοντέλου, που περιείχε όμως πάρα πολλά ορθογραφικά λάθη. Για παράδειγμα το 3-γραμμα «you dont know» είχε μεγαλύτερη πιθανότητα από το «you don t know». Για τον λόγο αυτό, έγινε χειρωνακτική διόρθωση αρκετών σημαντικών λαθών (π.χ. «im» σε «I m», «cant» σε «can t» κτλ.), ούτως ώστε να προκύψουν σωστότερες πιθανότητες στο γλωσσικό μοντέλο και αντίστοιχα καλύτερες διορθώσεις στις προτάσεις. Το τελικό αρχείο που δημιουργήθηκε αποτελείται από 3-γράμματα, όπου η κάθε γραμμή περιέχει το 3-γραμμα και τον λογάριθμο της πιθανότητας εμφάνισής του. Επίσης χρησιμοποιήθηκε η τεχνική εξομάλυνσης Good-Turing για αποφυγή μηδενικών εκτιμήσεων πιθανοτήτων για n-γράμματα τα οποία δεν εμφανίζονται στο σώμα εκπαίδευσης. 11 SNAP Web Data: Amazon Reviews - 33

35 Εικόνα 16 - Παράδειγμα γλωσσικού μοντέλου Οι εγγραφές αυτές, λόγω του μεγάλου μεγέθους (~300ΜΒ), δεν αποθηκεύονται στη μνήμη αλλά σε ένα πίνακα βάσης δεδομένων (MySQL) με δύο πεδία. o Phrase (n-γραμμα πρωτεύον κλειδί για γρήγορη αναζήτηση) o LogProb (o λογάριθμος της πιθανότητας εμφάνισης του n-γράμματος) 34

36 4.3 Διαδικασίες διόρθωσης Σε αυτή την ενότητα θα παρουσιαστούν οι βασικές διαδικασίες του συστήματος, που αφορούν τη διόρθωση των προτάσεων με τη σειρά που αυτές εκτελούνται. Η κάθε πρόταση που πρόκειται να εξεταστεί για λάθη μετατρέπεται σε μια δομή λέξεων (ArrayList από λέξεις της πρότασης) και η δομή αυτή δίνεται ως όρισμα σε κάθε μία από τις διαδικασίες διόρθωσης. Κάθε διόρθωση που εντοπίζεται προστίθεται στην αρχική δομή της πρότασης (Sentence), ούτως ώστε η κάθε διαδικασία να έχει πρόσβαση και σε διορθώσεις που έγιναν από διαδικασίες που εκτελέσθηκαν πιο πριν. Στο παρακάτω σχήμα φαίνονται όλες οι διαδικασίες διόρθωσης καθώς και οι δομές οι οποίες χρησιμοποιούνται από κάθε μία από αυτές. Η διαδικασία εύρεσης ονομάτων οντοτήτων χρησιμοποιεί τη δομή με ονόματα οντοτήτων (DBpedia). Η διαδικασία εύρεσης και διόρθωσης λέξεων χρησιμοποιεί τη βάση δεδομένων (MySQL) για τις πιθανότητες των 3-γραμμάτων και, αν χρειαστεί, τη δομή Trie για εύρεση των κοντινών λέξεων. Τέλος, οι άλλες διορθώσεις δεν χρησιμοποιούν καμία από τις βασικές δομές του συστήματος. Εικόνα 17 - Διαδικασίες διόρθωσης και δομές που χρησιμοποιούν 35

37 4.3.1 Εύρεση και διόρθωση ονομάτων οντοτήτων Σε αυτή τη διαδικασία, το σύστημα προσπαθεί να εντοπίσει στις λέξεις της κάθε πρότασης ονόματα οντοτήτων που πρέπει να είναι γραμμένα με συγκεκριμένο τρόπο. Ο τρόπος αυτός στη συγκεκριμένη περίπτωση είναι είτε ο προκαθορισμένος που ορίζεται από τη γλώσσα, είτε ο πιο συνήθης που θα θεωρήσουμε ότι είναι αυτός με τον οποίο οι οντότητες είναι γραμμένες στη DBpedia. Για παράδειγμα, μήνες, ημέρες, τοποθεσίες κτλ., ξέρουμε ότι γράφονται με κεφαλαίο το πρώτο γράμμα, αλλά για προϊόντα όπως IPhone, MacBook δεν υπάρχει προκαθορισμένος τρόπος γραφής, οπότε θεωρούμε ως σωστό τον τρόπο με τον οποίο γράφονται στην DBpedia. Στη συγκεκριμένη διαδικασία, λέξεις οι οποίες περιέχουν ορθογραφικά λάθη και δεν εντοπίζονται ως ονόματα οντοτήτων, αντιμετωπίζονται σαν κανονικές λέξεις και δεν διορθώνεται ο τρόπος γραφής τους. Για παράδειγμα, η λέξη «macbooc» δεν θα εντοπιστεί στην οντολογία. Αν και υπάρχει η δυνατότητα να διορθωθεί σε «macbook» από την επόμενη διαδικασία, δεν θα γίνει διόρθωση των κεφαλαίων γραμμάτων ώστε να πάρουμε το σωστό «MacBook». Η διαδικασία αυτή αποτελείται από δύο στάδια: Αναζήτηση στη δομή ονομάτων-οντοτήτων Για κάθε λέξη ή φράση γίνεται αναζήτηση στη δομή που έχουμε δημιουργήσει, η οποία περιέχει τα ονόματα οντοτήτων της DBpedia. (Για κάθε λέξη ή φράση, γίνεται έλεγχος ισότητας αγνοώντας τις διαφορές μεταξύ κεφαλαίων και πεζών γραμμάτων. Για παράδειγμα, «MacBook» = «macbook».) Αν η λέξη ή φράση εντοπιστεί στη δομή, και δεν είναι γραμμένη με τον ίδιο τρόπο, προστίθεται η διόρθωση στη δομή της πρότασης. Επισημείωση από τον σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford Η πρόταση δίνεται ως όρισμα στο σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford και αν επισημειωθεί κάποια λέξη ή φράση η οποία δεν έχει βρεθεί από το προηγούμενο στάδιο της αναζήτησης στη δομή ονομάτων οντοτήτων, ελέγχεται για τον τρόπο γραφής. Αν διαφέρει από τον προκαθορισμένο, τότε προστίθεται η διόρθωση στη δομή της πρότασης. 36

38 Για παράδειγμα, ας υποθέσουμε ότι έχουμε την πρόταση «macbook is the finest product made by apple.». Ας υποθέσουμε ακόμη ότι η λέξη «macbook» υπάρχει στη DBpedia (με σωστό τρόπο γραφής «MacBook») και ότι η λέξη «apple» εντοπίζεται μόνο από το σύστημα αναγνώρισης ονομάτων οντοτήτων του Stanford. Τότε γίνονται και οι δύο διορθώσεις και έχουμε την τελική πρόταση «MacBook is the finest product made by Apple». Σε αυτό το σημείο αξίζει να σημειωθεί ότι οι λέξεις ή φράσεις που έχουν εντοπιστεί ως ονόματα οντοτήτων δεν ελέγχονται από την επόμενη διαδικασία διόρθωσης λέξεων. Εικόνα 18 - Διαδικασία διόρθωσης ονομάτων οντοτήτων 37

39 4.3.2 Εύρεση και διόρθωση λέξεων Σε αυτή τη διαδικασία γίνεται έλεγχος με βάση το γλωσσικό μοντέλο, κατά πόσο ταιριάζει η κάθε λέξη στο συγκεκριμένο σημείο της πρότασης, σε συνδυασμό με τις προηγούμενες και τις επόμενες λέξεις. Όταν βρεθεί ότι κάποια λέξη έχει πολύ μικρή πιθανότητα εμφάνισης, τότε αρχίζει η διαδικασία αντικατάστασης της λέξης αυτής με κάποια άλλη, με μεγαλύτερη πιθανότητα εμφάνισης. Τα βήματα αναλυτικά είναι τα εξής: 1. Έλεγχος ορθότητας λέξης με βάση το γλωσσικό μοντέλο Για να ελέγξουμε αν μια λέξη πρέπει να αντικατασταθεί, θέλουμε να δούμε τις πιθανότητες εμφάνισής της σε σχέση με τις προηγούμενες και τις επόμενες λέξεις της πρότασης. Συνεπώς, αφού στο γλωσσικό μοντέλο που έχουμε εκπαιδεύσει έχουμε 3-γράμματα, τότε ένας καλός τρόπος για να μπορούμε να έχουμε μια ολοκληρωμένη άποψη για την ορθότητα της λέξης είναι να υπολογίσουμε τις πιθανότητες εμφάνισής της με τις δύο προηγούμενες και τις δύο επόμενες λέξεις. Όμως αυτό δεν είναι εφικτό σε περιπτώσεις που ελέγχουμε λέξεις που βρίσκονται είτε στην αρχή μιας πρότασης, είτε στο τέλος. Ως εκ τούτου, οι υπολογισμοί που γίνονται διαφέρουν ανάλογα με τη θέση της λέξης στην πρόταση. Παρακάτω περιγράφονται οι υπολογισμοί που γίνονται σε κάθε περίπτωση με χρήση των συμβολισμών που φαίνονται στον πίνακα. w a aa b bb [s] [/s] Η λέξη που ελέγχεται Η επόμενη λέξη Η μεθεπόμενη λέξη Η προηγούμενη λέξη Η προ-προηγούμενη λέξη Ειδικός χαρακτήρας που δηλώνει την αρχή μιας πρότασης Ειδικός χαρακτήρας που δηλώνει το τέλος μιας πρότασης Πίνακας 5 - Συμβολισμοί για περιγραφή υπολογισμού πιθανοτήτων Για ευκολότερη κατανόηση των υπολογισμών που γίνονται θα χρησιμοποιήσουμε ως παράδειγμα τις λέξεις της πρότασης: «Everything looks fine around here». 38

40 Πρώτη λέξη σε πρόταση (στο παράδειγμα: Everything) Υπολογισμός Παράδειγμα log(p([s] w a)) + log(p(w a aa)) 2 log(p([s] Everything looks)) + log(p(everything looks fine)) 2 Δεύτερη λέξη σε πρόταση (στο παράδειγμα: looks) Υπολογισμός Παράδειγμα log(p([s] b w)) + log(p(b w a)) + log(p(w a aa)) 3 log(p([s] Everything looks)) + log(p(everything looks fine)) + log(p(looks fine around)) 3 Προτελευταία λέξη σε πρόταση (στο παράδειγμα: around) Υπολογισμός Παράδειγμα log(p(bb b w)) + log(p(b w a)) + log(p(w a [/s])) 3 log(p( looks fine around)) + log(p(fine around here)) + log(p(around here [/s])) 3 Τελευταία λέξη σε πρόταση (στο παράδειγμα: here) Υπολογισμός Παράδειγμα log(p(bb b w)) + log(p(b w [/s])) 2 log(p( fine around here)) + log(p(around here [/s])) 2 Λέξη σε οποιαδήποτε άλλη θέση στην πρόταση (στο παράδειγμα: fine) Υπολογισμός Παράδειγμα log(p(bb b w)) + log(p(b w a)) + log(p(w a aa)) 3 log(p( Everything looks fine)) + log(p(looks fine around)) + log(p(fine around here)) 3 39

41 Υπενθυμίζουμε ότι οι τιμές των πιθανοτήτων αυτών είναι προϋπολογισμένες και βρίσκονται αποθηκευμένες στη βάση δεδομένων (MySQL). Το σύστημα παίρνει τις τιμές αυτές, τις αθροίζει και ακολούθως διαιρεί για να φτάσει στο τελικό αποτέλεσμα. Για να κριθεί μια λέξη ως λανθασμένη χρησιμοποιείται μια σταθερά που δίνεται ως παράμετρος στο σύστημα (wrongwordconstant) με την οποία γίνεται η σύγκριση με το αποτέλεσμα του υπολογισμού. Αν δηλαδή του αποτέλεσμα του υπολογισμού είναι μικρότερο της σταθεράς αυτής, τότε το σύστημα αρχίζει τη διαδικασία διόρθωσης της λέξης. Εικόνα 19 - Αλγόριθμος εύρεσης λανθασμένης λέξης 2. Διόρθωση λανθασμένης λέξης Για τη διόρθωση της λέξης που έχει εντοπιστεί ως λανθασμένη, αρχικά δημιουργείται μια λίστα με τις πιο κοντινές λέξεις με βάση το όριο της μέγιστης απόστασης Levenshtein που θα αναζητήσει το σύστημα μέσα στη δομή Trie. Η μέγιστη αυτή απόσταση δίνεται ως παράμετρος (maxdistance). Σε αυτό το σημείο αξίζει να σημειωθεί ότι όσο μεγαλώνει η παράμετρος αυτή, τόσο μεγαλώνει και ο αριθμός των πιθανών αντικαταστάσεων για κάθε λέξη και αντίστοιχα ο χρόνος εκτέλεσης, οπότε καλό θα ήταν, ο μέγιστος αριθμός απόστασης να είναι μικρότερος του 4. Αφού δημιουργηθεί η λίστα με τις υποψήφιες αντικαταστάσεις για κάθε μία λέξη γίνεται ο ίδιος υπολογισμός με το προηγούμενο βήμα. Αυτή τη φορά όμως με την κάθε υποψήφια λέξη. Σε περίπτωση που βρεθούν λέξεις με μεγαλύτερη πιθανότητα από την αρχική, τότε κρατάμε την πιο πιθανή από αυτές. Τέλος, για να αποφασιστεί εάν θα γίνει η αντικατάσταση, θα πρέπει η υποψήφια λέξη να είναι αρκετά πιο πιθανή από την αρχική. Για τον λόγο αυτό έχουμε ορίσει μία ακόμη σταθερά (logprobdiff), η οποία επίσης δίνεται ως παράμετρος στο σύστημα και μας δίνει τη δυνατότητα να επιλέξουμε το «πόσο καλύτερη» πρέπει να είναι μια υποψήφια λέξη για 40

42 να γίνει τελικά η αντικατάσταση. Αν η υποψήφια λέξη δεν είναι αρκετά πιο πιθανή από την αρχική λέξη, τότε δε γίνεται καμία διόρθωση. Ο τελικός αλγόριθμος εύρεσης και διόρθωσης λέξεων σε γενική μορφή φαίνεται στην παρακάτω εικόνα. Εικόνα 20 - Αλγόριθμος εύρεσης και διόρθωσης λέξεων Στην παρακάτω εικόνα φαίνεται συνοπτικά η διαδικασία. Για τις πιθανότητες των 3-γραμμάτων γίνεται αναζήτηση στην βάση δεδομένων (MySQL). Αν έχουμε χαμηλές πιθανότητες τότε στη διαδικασία διόρθωσης εντοπίζονται οι κοντινές λέξεις που είναι αποθηκευμένες στη δομή Trie και ελέγχονται οι πιθανότητες για καθεμία από αυτές. Εικόνα 21 - Διαδικασία εύρεσης και διόρθωσης λέξεων 41

43 4.3.3 Άλλες διορθώσεις Στην τελευταία διαδικασία διόρθωσης, γίνονται απλές αλλά σημαντικές διορθώσεις στις προτάσεις. Οι διορθώσεις αυτές αφορούν στον τρόπο γραφής των λέξεων (πεζά ή κεφαλαία γράμματα) αλλά και στην κατάληξη της κάθε πρότασης με αποδεκτά σημεία στίξης. Συγκεκριμένα εντοπίζονται και διορθώνονται τα παρακάτω: Αρχή πρότασης με κεφαλαίο γράμμα Πρόκειται για απλή περίπτωση διόρθωσης όμως πρέπει να προσεχθούν συγκεκριμένες περιπτώσεις όπως: o Προτάσεις που ξεκινούν με αριθμούς. Σε αυτή την περίπτωση δεν γίνεται καμία διόρθωση, όπως για παράδειγμα η πρόταση «1st time and last.». o Προτάσεις που ξεκινούν πάλι με αριθμούς/γράμματα αλλά με σκοπό αρίθμησης, όπως για παράδειγμα «2) no problems so far.». Σε περιπτώσεις τέτοιου τύπου, θεωρούμε ως αρχή της πρότασης τη δεύτερη λέξη (no) και γίνεται διόρθωση με μετατροπή του πρώτου γράμματος της δεύτερης λέξης σε κεφαλαίο. o Προτάσεις που ξεκινούν με όνομα οντότητας και έχει εντοπιστεί από τη διαδικασία εύρεσης και διόρθωσης ονομάτων οντοτήτων και ως εκ τούτου δε γίνεται καμία επιπλέον διόρθωση. Για παράδειγμα η πρόταση «macbook is great.» θα μετατραπεί σε «MacBook is great». Λέξεις που περιέχουν κεφαλαία γράμματα εξαιρουμένης της πρώτης Οι λέξεις που βρίσκονται μετά την πρώτη και περιέχουν κεφαλαία γράμματα διορθώνονται ούτως ώστε να περιέχουν μόνο πεζά γράμματα. Εξαιρούνται οι περιπτώσεις όπου έχουμε όλη τη λέξη γραμμένη με κεφαλαία (συχνά επισημαίνοντας έμφαση) και λέξεις που έχουν εντοπιστεί ως ονόματα οντοτήτων. Για παράδειγμα η λέξη «hello» θα διορθωθεί σε «hello» ενώ η λέξη «AMAZING» θα παραμείνει ως έχει. Αποδεκτό σημείο στίξης στο τέλος της πρότασης Η κάθε πρόταση θα πρέπει να τελειώνει με κάποιο αποδεκτό σημείο στίξης. Θεωρούμε ως αποδεκτά σημεία στίξης την τελεία '.', το θαυμαστικό '!' και το ερωτηματικό '?'. Ως 42

44 εκ τούτου, αν δεν υπάρχει κανένα σημείο στίξης προστίθεται η τελεία ενώ αν υπάρχει κάποιο μη αποδεκτό (';', '*', κτλ.) αντικαθίσταται με τελεία. 4.4 Εξαγωγή τελικού αρχείου XML και στατιστικών Με την ολοκλήρωση όλων των διαδικασιών διόρθωσης, υπάρχουν πλέον στην κάθε δομή πρότασης (Sentence) οι διορθώσεις που βρέθηκαν και χειρωνακτικά αλλά και από το σύστημα. Σε αυτή τη διαδικασία οι προτάσεις με τις διορθώσεις γράφονται σε ένα μοναδικό τελικό αρχείο XML το οποίο περιέχει όλες τις πληροφορίες. Εικόνα 22 - Τελικό XML με όλες τις διορθώσεις Το σύστημα εκτός από το τελικό αρχείο XML εκτυπώνει επίσης μερικά στατιστικά για τις προτάσεις που επεξεργάστηκε. Στην παρακάτω εικόνα φαίνονται τα στατιστικά που εκτυπώνονται. 43

45 Εικόνα 23 - Στατιστικά συστήματος 4.5 Παράδειγμα χρήσης Παράδειγμα ορθής διόρθωσης Στη παρούσα ενότητα περιγράφεται ένα παράδειγμα διόρθωσης των λέξεων μιας πρότασης και τα βήματα που ακολουθούνται σε κάθε διαδικασία. Παράδειγμα διόρθωσης πρότασης Για το συγκεκριμένο παράδειγμα υποθέτουμε ότι οι παράμετροι (σταθερές) που χρειάζεται το σύστημα είναι: Πρόταση προς έλεγχο get this awesome dell laptop cause its the best wrongwordconstant -4.0 maxdistance 2 logprobdiff 1.32 Πίνακας 6 - Παράμετροι παραδείγματος Έλεγχος λέξης: get Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p([s] get this)) = log(p(get this awesome)) = Σύνολο: -3.87/2 = > -4.0 άρα δεν γίνεται καμία διόρθωση Είναι πρώτη λέξη άρα πρέπει το πρώτο γράμμα να είναι κεφαλαίο. Αλλαγή: get -> Get Πίνακας 7 - Παράδειγμα διόρθωσης πρότασης (Λέξη: get) 44

46 Έλεγχος λέξης: this Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p([s] get this)) = log(p(get this awesome)) = log(p(this awesome dell)) = Σύνολο: -7.23/3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 8 - Παράδειγμα διόρθωσης πρότασης (Λέξη: this) Έλεγχος λέξης: awesome Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p(get this awesome)) = log(p(this awesome dell)) = log(p(awesome dell laptop)) = Σύνολο: -6.76/3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Άλλες διορθώσεις Αποτέλεσμα Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 9 - Παράδειγμα διόρθωσης πρότασης (Λέξη: awesome) Έλεγχος λέξης: dell Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Βρέθηκε στη DBpedia -> Dell Έχει εντοπιστεί ως οντότητα άρα δεν γίνεται έλεγχος Καμία dell -> Dell Πίνακας 10 - Παράδειγμα διόρθωσης πρότασης (Λέξη: dell) 45

47 Έλεγχος λέξης: laptop Εύρεση/διόρθωση οντοτήτων ονομάτων Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER Εύρεση/διόρθωση λέξεων log(p(awesome dell laptop)) = log(p(dell laptop cause)) = log(p(laptop cause its)) = Σύνολο: /3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Άλλες διορθώσεις Αποτέλεσμα Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 11 - Παράδειγμα διόρθωσης πρότασης (Λέξη: laptop) Έλεγχος λέξης: cause Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p(dell laptop cause)) = log(p(laptop cause its)) = log(p(cause its the)) = Σύνολο: /3 = > -4.0 άρα πρέπει να γίνει διόρθωση Πιθανές αντικαταστάσεις σε απόσταση 2: causes σύνολο: caused σύνολο: because σύνολο: Πρέπει: > => > άρα πρέπει να γίνει η αντικατάσταση Πρέπει να είναι με πεζά γράμματα. cause -> because Πίνακας 12 - Παράδειγμα διόρθωσης πρότασης (Λέξη: cause) 46

48 Έλεγχος λέξης: its Εύρεση/διόρθωση οντοτήτων ονομάτων Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα log(p(laptop because its)) = log(p(because its the)) = log(p(its the best)) = Σύνολο: /3 = > -4.0 άρα πρέπει να γίνει διόρθωση Πιθανές αντικαταστάσεις σε απόσταση 2: it σύνολο: it s σύνολο: i σύνολο: is σύνολο: Πρέπει: > => > άρα πρέπει να γίνει η αντικατάσταση Πρέπει να είναι με πεζά γράμματα. its -> it s Πίνακας 13 - Παράδειγμα διόρθωσης πρότασης (Λέξη: its) Έλεγχος λέξης: the Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p(because it s the)) = log(p(it s the best)) = log(p(the best [/s])) = Σύνολο: -4.88/3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 14 - Παράδειγμα διόρθωσης πρότασης (Λέξη: the) 47

49 Έλεγχος λέξης: best Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p(it s the best)) = log(p(the best [/s])) = Σύνολο: -3.24/2 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα και επειδή είναι τελευταία πρέπει να τελειώνει με αποδεκτό σημείο στίξης. Αλλαγή: best -> best. Πίνακας 15 - Παράδειγμα διόρθωσης πρότασης (Λέξη: best) Άρα έχουμε το εξής αποτέλεσμα: Αρχική πρόταση Ορθά διατυπωμένη πρόταση Προτεινόμενη πρόταση get this awesome dell laptop cause its the best Get this awesome Dell laptop because it s the best. Get this awesome Dell laptop because it s the best. Πίνακας 16 - Αποτέλεσμα πρότασης μετά τις διορθώσεις 48

50 4.5.2 Παράδειγμα λανθασμένης διόρθωσης Στη παρούσα ενότητα περιγράφεται ένα παράδειγμα διόρθωσης των λέξεων μιας πρότασης και τα βήματα που ακολουθούνται σε κάθε διαδικασία. Παράδειγμα διόρθωσης πρότασης Για το συγκεκριμένο παράδειγμα υποθέτουμε ότι οι παράμετροι (σταθερές) που χρειάζεται το σύστημα είναι: Πρόταση προς έλεγχο My macbok get stuck with many windows opened. wrongwordconstant -4.0 maxdistance 2 logprobdiff 1.32 Πίνακας 17 - Παράμετροι παραδείγματος λανθασμένης διόρθωσης Έλεγχος λέξης: My Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p([s] My macbok)) = log(p(my macbok stuck)) = Σύνολο: -8.87/2 = > -4.0 άρα πρέπει να γίνει διόρθωση Πιθανές αντικαταστάσεις σε απόσταση 2: me σύνολο: mix σύνολο: man σύνολο: Πρέπει: > => < άρα δε βρέθηκε λέξη αρκετά πιο πιθανή για να γίνει αντικατάσταση Είναι πρώτη λέξη άρα πρέπει το πρώτο γράμμα να είναι κεφαλαίο. Καμία αλλαγή Πίνακας 18 - Παράδειγμα διόρθωσης πρότασης (Λέξη: My) 49

51 Έλεγχος λέξης: macbok Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p([s] My macbok)) = log(p(my macbok get)) = log(p(macbok get stuck)) = Σύνολο: /3 = > -4.0 άρα πρέπει να γίνει διόρθωση Πιθανές αντικαταστάσεις σε απόσταση 2: macro σύνολο: macbook σύνολο: mambo σύνολο: Πρέπει: > => < άρα δε βρέθηκε λέξη αρκετά πιο πιθανή για να γίνει αντικατάσταση. Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 19 - Παράδειγμα διόρθωσης πρότασης (Λέξη: macbok) Έλεγχος λέξης: get Εύρεση/διόρθωση οντοτήτων ονομάτων Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα log(p(my macbok get)) = log(p(macbok get stuck)) = log(p(get with many)) = Σύνολο: /3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 20 - Παράδειγμα διόρθωσης πρότασης (Λέξη: get) 50

52 Έλεγχος λέξης: stuck Εύρεση/διόρθωση οντοτήτων ονομάτων Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα log(p(macbok get stuck)) = log(p(get stuck with)) = log(p(stuck with many)) = Σύνολο: -8.84/3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 21 - Παράδειγμα διόρθωσης πρότασης (Λέξη: stuck) Έλεγχος λέξης: with Εύρεση/διόρθωση οντοτήτων ονομάτων Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα log(p(get stuck with)) = log(p(stuck with many)) = log(p(with many windows)) = Σύνολο: -6.12/3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 22 Παράδειγμα διόρθωσης πρότασης (Λέξη: with) 51

53 Έλεγχος λέξης: many Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p(stuck with many)) = log(p(with many windows)) = log(p(many windows open)) = Σύνολο: -6.78/3 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα. Καμία αλλαγή Πίνακας 23 Παράδειγμα διόρθωσης πρότασης (Λέξη: many) Έλεγχος λέξης: windows Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Βρέθηκε στη DBpedia -> Windows Έχει εντοπιστεί ως οντότητα άρα δεν γίνεται έλεγχος Καμία Αποτέλεσμα windows -> Windows Πίνακας 24 - Παράδειγμα διόρθωσης πρότασης (Λέξη: windows) Έλεγχος λέξης: open Εύρεση/διόρθωση οντοτήτων ονομάτων Εύρεση/διόρθωση λέξεων Άλλες διορθώσεις Αποτέλεσμα Δεν βρέθηκε ούτε στη DBPedia ούτε από τον Stanford NER log(p(many Windows open)) = log(p(windows open [/s])) = Σύνολο: -3.24/2 = > -4.0 άρα δεν γίνεται καμία διόρθωση Πρέπει να είναι με πεζά γράμματα και επειδή είναι τελευταία πρέπει να τελειώνει με αποδεκτό σημείο στίξης. Αλλαγή: open -> open. Πίνακας 25 - Παράδειγμα διόρθωσης πρότασης (Λέξη: open) 52

54 Άρα έχουμε το εξής αποτέλεσμα: Αρχική πρόταση Ορθά διατυπωμένη πρόταση Προτεινόμενη πρόταση My macbok get stuck with many windows open. My MacBook gets stuck with many windows open. My macbok stuck with many Windows open. Πίνακας 26 - Αποτέλεσμα πρότασης μετά τις διορθώσεις 53

55 5. Πειράματα Στις ενότητες που ακολουθούν παρουσιάζονται τα πειράματα που έγιναν για την αξιολόγηση του συστήματος μαζί με τα αποτελέσματά τους. 5.1 Δεδομένα Για την αξιολόγηση του συστήματος έπρεπε να συγκεντρωθεί ένας μεγάλος αριθμός προτάσεων κριτικών. Έτσι, αποφασίσαμε να χρησιμοποιήσουμε τα δεδομένα του διαγωνισμού «SemEval 2015 Task 12: Aspect Based Sentiment Analysis» 12. Τα δεδομένα αυτά δίνονται στους διαγωνιζόμενους οι οποίοι προσπαθούν να δημιουργήσουν συστήματα που να εντοπίζουν το θέμα της πρότασης, αν είναι θετική/αρνητική η άποψη του χρήστη για συγκεκριμένα προϊόντα κτλ. Αρχικά, δίνονται τα δεδομένα εκπαίδευσης (training data), με βάση τα οποία οι διαγωνιζόμενοι δημιουργούν και εκπαιδεύουν τα συστήματά τους και αργότερα δίνονται τα δεδομένα αξιολόγησης (test data) πάνω στα οποία γίνεται η αξιολόγησή τους. Εμείς, για τους σκοπούς της εργασίας χρησιμοποιήσαμε κάποια από τα δεδομένα αυτά, επισημειώνοντας τα λάθη που υπάρχουν στις προτάσεις. Στη συνέχεια, οι προτάσεις αυτές δόθηκαν στο σύστημα για διόρθωση και τέλος συγκρίθηκαν τα αποτελέσματα. Τα δεδομένα που χρησιμοποιήθηκαν είναι τα εξής: Laptop Training Data Laptop Test Data Restaurant Training Data Τα δεδομένα με τις επισημειώσεις που έγιναν, δόθηκαν και στους διοργανωτές του διαγωνισμού και είναι διαθέσιμα για όποιον επιθυμεί να τα χρησιμοποιήσει για να εκπαιδεύσει ή να αξιολογήσει το σύστημά του με αυτά. 12 SemEval 2015 Task 12: Aspect Based Sentiment Analysis - 54

56 5.2 Χειρωνακτική διόρθωση Σε όλα τα δεδομένα που διορθώθηκαν χειρωνακτικά, δηλαδή και στα 3 αρχεία κριτικών, επισημειώθηκαν οι παρακάτω διορθώσεις: Λέξεις που δεν υπάρχουν στο λεξικό. Παραδείγματα: Πρόταση Λάθος Σωστό All I can say is W-O-W. W-O-W wow It doesnt work well. doesnt doesn t I paid for 3 year warrenty. warrenty warranty Πίνακας 27 - Παραδείγματα λέξεων που δεν υπάρχουν στο λεξικό Λέξεις που υπάρχουν στο λεξικό αλλά χρησιμοποιούνται λανθασμένα. Παραδείγματα: Πρόταση Λάθος Σωστό I paid a lot but its really good. its it s Get this cause it rocks! cause because Πίνακας 28 - Παραδείγματα σωστών λέξεων αλλά λάνθασμένα σε συγκεκριμένη πρόταση Προτάσεις που δεν τελειώνουν με αποδεκτό σημείο στίξης. Παραδείγματα: Πρόταση Λάθος Σωστό This laptop is insane; ;. I love this Δεν έχει τελεία Πρόσθεση. Πίνακας 29 - Παραδείγματα προτάσεων που δεν τελειώνουν με αποδεκτό σημείο στίξης 55

57 Προτάσεις που δεν αρχίζουν με κεφαλαίο γράμμα. Παραδείγματα: Πρόταση Λάθος Σωστό definitely recommended. definitely Definitely Πίνακας 30 - Παραδείγματα προτάσεων που δεν αρχίζουν με κεφαλαίο γράμμα Ονόματα οντοτήτων (οργανισμοί, τοποθεσίες, πρόσωπα), ημέρες, μήνες κτλ., πρέπει να είναι με τον πιο συχνό τρόπο γραφής τους. Παραδείγματα: Πρόταση Λάθος Σωστό I bought a macbook pro. macbook pro MacBook Pro Bought it from france. france France We visited them last friday. friday Friday Πίνακας 31 - Παραδείγματα λέξεων ονομάτων οντοτήτων Λέξεις που περιέχουν άσκοπα κεφαλαία γράμματα. Εξαιρούνται περιπτώσεις που είναι ολόκληρη η λέξη με κεφαλαία (επισημαίνοντας έμφαση). Παραδείγματα: Πρόταση Λάθος Σωστό Looks Good. Good good We had a great time! had had Πίνακας 32 - Παραδείγματα λέξεων με άσκοπα κεφαλαία γράμματα Συγκεκριμένα για τις κριτικές εστιατορίων θεωρούμε ότι όλα τα φαγητά πρέπει να γράφονται με πεζά γράμματα με εξαίρεση αυτά που συμπεριλαμβάνουν ονόματα χωρών, πόλεων κλπ. Παραδείγματα: Πρόταση Λάθος Σωστό I had a greek salad. greek Greek You should try the Spicy Chicken. Spicy Chicken spicy chicken Πίνακας 33 - Παραδείγματα λέξεων φαγητών με κεφαλαία γράμματα 56

58 5.3 Μέτρα αξιολόγησης Σε αυτή την ενότητα θα ορίσουμε τα μέτρα με τα οποία θα αξιολογήσουμε το σύστημα. Θα χρησιμοποιήσουμε μετρήσεις ακρίβειας (precision), ανάκλησης (recall) 13 και F1 Score 14. Για τις διορθώσεις που γίνονται στις προτάσεις θεωρούμε τα εξής: True Positive: διόρθωση που έγινε από το σύστημα ορθά. Για παράδειγμα, αν έγινε η διόρθωση της λέξης «its» σε «it's» και η ίδια διόρθωση είχε γίνει και χειρωνακτικά, τότε αυτή είναι μια περίπτωση True Positive. False Positive: διόρθωση που έγινε από το σύστημα λανθασμένα. Για παράδειγμα, αν έγινε η διόρθωση της λέξης «its» σε «it's» ενώ χειρωνακτικά δεν είχε γίνει τέτοια διόρθωση, τότε αυτή είναι περίπτωση False Positive. False Negative: διόρθωση που δε βρέθηκε από το σύστημα. Για παράδειγμα, αν είχε γίνει χειρωνακτική διόρθωση της λέξεις «its» σε «it's» και η συγκεκριμένη διόρθωση δεν είχε βρεθεί από το σύστημα, τότε αυτή είναι περίπτωση False Negative. Έχοντας εξηγήσει πλέον το βασικό υπόβαθρο που χρειάζεται μπορούμε να συνεχίσουμε με το πώς υπολογίζονται αυτά. Precision: Το ποσοστό των διορθώσεων που έγιναν από το σύστημα και που ήταν σωστές. Υπολογίζεται ως εξής: Precision = TruePositives TruePositives + FalsePositives 13 Precision and Recall F1 Score - 57

59 Recall: Το ποσοστό των χειρωνακτικών διορθώσεων που βρέθηκαν επιτυχώς από το σύστημα. Υπολογίζεται ως εξής: Recall = TruePositives TruePositives + FalseNegatives F1 Score: Συνδυασμός ακρίβειας και ανάκλησης. Υπολογίζεται ως εξής: F 1 = 2 precision recall precision + recall 5.4 Αποτελέσματα Σε αυτή την ενότητα φαίνονται αναλυτικά τα πειράματα που έγιναν και τα αποτελέσματα όσον αφορά τα μέτρα αξιολόγησης που προαναφέρθηκαν. Σε όλα τα πειράματα χρησιμοποιούνται οι εξής παράμετροι: wrongwordconstant -4.0 maxdistance 2 logprobdiff 1.32 Πίνακας 34 - Παράμετροι συστήματος για τα πειράματα Οι συγκεκριμένες τιμές επιλέχτηκαν μετά από δοκιμές και αφού απεδείχθη ότι με τις συγκεκριμένες πετυχαίνουμε τα καλύτερα αποτελέσματα στα δεδομένα που χρησιμοποιήθηκαν κατά την ανάπτυξη του συστήματος. 58

60 5.4.1 Πείραμα 1 - Laptop Training Data Στο πρώτο αυτό πείραμα χρησιμοποιούμε τα δεδομένα που αξιοποιήθηκαν κατά την ανάπτυξη του συστήματος. Χρησιμοποιείται το βασικό γλωσσικό μοντέλο που έχουμε εκπαιδεύσει σε κριτικές τεχνολογικών προϊόντων, στις οποίες έγιναν προηγουμένως αρκετές ορθογραφικές διορθώσεις (ενότητα 4.2). Συνολικά Αποτελέσματα: Σύνολο Προτάσεων 1739 Σύνολο χειρωνακτικών διορθώσεων 899 Σύνολο διορθώσεων που βρέθηκαν 958 True Positives 770 False Positives 178 False Negatives 129 Precision 0.81 Recall 0.85 F1 Score 0.83 Μετρήσεις διορθώσεων από κάθε διαδικασία: Πίνακας 35 - Συνολικά αποτελέσματα 1ου πειράματος Διόρθωση ονομάτων οντοτήτων: True Positives 180 False Positives 52 False Negatives 33 Precision 0.77 Recall 0.83 F1 Score 0.79 Πίνακας 36 - Αποτελέσματα διόρθωσης ονομάτων οντοτήτων 1ου πειράματος 59

61 Διόρθωση λέξεων: True Positives 397 False Positives 97 False Negatives 72 Precision 0.80 Recall 0.84 F1 Score 0.82 Πίνακας 37 - Αποτελέσματα διόρθωσης λέξεων 1ου πειράματος Άλλες διορθώσεις: True Positives 193 False Positives 29 False Negatives 24 Precision 0.86 Recall 0.88 F1 Score 0.87 Πίνακας 38 - Αποτελέσματα άλλων διορθώσεων 1ου πειράματος Τα αποτελέσματα, όπως ήταν αναμενόμενο, είναι αρκετά καλά, καθώς το θέμα των προτάσεων που διορθώθηκαν είναι παρόμοιο με αυτό του σώματος κειμένων στο οποίο εκπαιδεύτηκε το γλωσσικό μοντέλο και οι περισσότερες οντότητες που υπάρχουν στις προτάσεις υπάρχουν στη λίστα που δημιουργήθηκε από την DBpedia. 60

62 Εικόνα 24 - Συνολικά αποτελέσματα 1ου πειράματος 61

63 5.4.2 Πείραμα 2 - Laptop Test Data Σε αυτό το πείραμα δεν έγιναν περαιτέρω αλλαγές στο σύστημά μας, για να δούμε την επίδοση του συστήματος σε άγνωστα δεδομένα (δεν χρησιμοποιήθηκαν κατά την ανάπτυξη του συστήματος) της ίδιας όμως θεματικής περιοχής (κριτικές φορητών υπολογιστών). Συνολικά Αποτελέσματα: Σύνολο Προτάσεων 400 Σύνολο χειρωνακτικών διορθώσεων 342 Σύνολο διορθώσεων που βρέθηκαν 405 True Positives 263 False Positives 142 False Negatives 79 Precision 0.65 Recall 0.77 F1 Score 0.70 Πίνακας 39 - Συνολικά αποτελέσματα 2ου πειράματος Μετρήσεις διορθώσεων από κάθε διαδικασία: Διόρθωση ονομάτων οντοτήτων: True Positives 59 False Positives 21 False Negatives 12 Precision 0.74 Recall 0.83 F1 Score 0.78 Πίνακας 40 - Αποτελέσματα διόρθωσης ονομάτων οντοτήτων 2ου πειράματος 62

64 Διόρθωση λέξεων: True Positives 107 False Positives 101 False Negatives 55 Precision 0.51 Recall 0.68 F1 Score 0.59 Πίνακας 41 - Αποτελέσματα διόρθωσης λέξεων 2ου πειράματος Άλλες διορθώσεις: True Positives 87 False Positives 20 False Negatives 10 Precision 0.81 Recall 0.89 F1 Score 0.84 Πίνακας 42 - Αποτελέσματα άλλων διορθώσεων 2ου πειράματος Τα αποτελέσματα και στα Laptop Test data, είναι αρκετά καλά, με ελαφρά χαμηλότερες επιδόσεις σε σχέση με τα training data ωστόσο ένα μεγάλο ποσοστό των διορθώσεων ήταν σωστό. 63

65 Εικόνα 25 - Συνολικά αποτελέσματα 2ου πειράματος 64

66 5.4.3 Πείραμα 3 - Restaurant Data Σε αυτό το πείραμα δοκιμάσαμε το σύστημα σε κριτικές σε διαφορετικό αντικείμενο, δηλαδή σε κριτικές εστιατορίων, ενώ το σύστημά μας είναι εκπαιδευμένο για τεχνολογικά προϊόντα. Συνολικά Αποτελέσματα: Σύνολο Προτάσεων 1315 Σύνολο χειρωνακτικών διορθώσεων 504 Σύνολο διορθώσεων που βρέθηκαν 1452 True Positives 286 False Positives 1166 False Negatives 218 Precision 0.20 Recall 0.57 F1 Score 0.29 Πίνακας 43 - Συνολικά αποτελέσματα 3ου πειράματος Μετρήσεις διορθώσεων από κάθε διαδικασία: Διόρθωση ονομάτων οντοτήτων: True Positives 77 False Positives 345 False Negatives 101 Precision 0.18 Recall 0.43 F1 Score 0.25 Πίνακας 44 - Αποτελέσματα διόρθωσης ονομάτων οντοτήτων 3ου πειράματος 65

67 Διόρθωση λέξεων: True Positives 83 False Positives 687 False Negatives 68 Precision 0.10 Recall 0.27 F1 Score 0.15 Πίνακας 45 - Αποτελέσματα διόρθωσης λέξεων 3ου πειράματος Άλλες διορθώσεις: True Positives 126 False Positives 134 False Negatives 49 Precision 0.48 Recall 0.72 F1 Score 0.58 Πίνακας 46 - Αποτελέσματα άλλων διορθώσεων 3ου πειράματος Σε αυτά τα δεδομένα, βλέπουμε ότι η μόνη διαδικασία που έχει σχετικά καλά αποτελέσματα, είναι αυτή των άλλων διορθώσεων, η οποία δεν επηρεάζεται από το θέμα των προτάσεων. Στις άλλες δύο διαδικασίες, επειδή η εκπαίδευση του γλωσσικού μοντέλου καθώς και η λίστα με οντότητες που δημιουργήσαμε αφορούν προϊόντα τεχνολογίας, ενώ οι προτάσεις εστιατόρια, τα αποτελέσματα ήταν αρκετά χαμηλά. 66

68 Εικόνα 26 - Συνολικά αποτελέσματα 3ου πειράματος 67

69 5.4.4 Πείραμα 4 - Laptop Training Data με διαφορετικό γλωσσικό μοντέλο Στο τελευταίο αυτό πείραμα, δοκιμάσαμε στα αρχικά δεδομένα εκπαίδευσης (laptops training data) το σύστημα με διαφορετικό γλωσσικό μοντέλο που εκπαιδεύτηκε στα πρακτικά του Ευρωπαϊκού Κοινοβουλίου. Συνολικά Αποτελέσματα: Σύνολο Προτάσεων 1739 Σύνολο χειρωνακτικών διορθώσεων 899 Σύνολο διορθώσεων που βρέθηκαν 2236 True Positives 585 False Positives 1651 False Negatives 314 Precision 0.26 Recall 0.65 F1 Score 0.37 Εικόνα 27 - Συνολικά αποτελέσματα 4ου πειράματος Στο συγκεκριμένο πείραμα, θα δούμε μόνο ξεχωριστά τον πίνακα για τη διαδικασία διόρθωσης λέξεων η οποία χρησιμοποιεί το γλωσσικό μοντέλο, γιατί στις άλλες διαδικασίες διόρθωσης, τα αποτελέσματα είναι τα ίδια με το πρώτο πείραμα. Μετρήσεις από διόρθωση λέξεων: True Positives 212 False Positives 1570 False Negatives 257 Precision 0.12 Recall 0.11 F1 Score 0.11 Πίνακας 47 - Αποτελέσματα διόρθωσης λέξεων 4ου πειράματος 68

70 Βλέπουμε ότι η διαδικασία διόρθωσης λέξεων, έχει πάρα πολύ χαμηλά αποτελέσματα. Αυτό οφείλεται στο ότι τα κείμενα από το Ευρωπαϊκό Κοινοβούλιο είναι πολύ πιο επίσημα από αυτά που γράφονται στις κριτικές και επίσης περιέχουν πολύ λίγους έως καθόλου τεχνολογικούς όρους. Τέλος στο σχήμα φαίνονται συνολικά τα αποτελέσματα και των τεσσάρων πειραμάτων. Εικόνα 28 - Συνολικά αποτελέσματα όλων των πειραμάτων 69

ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (ΜSc) ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (ΜSc) ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (ΜSc) ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ορθογραφική διόρθωση και κανονικοποίηση κριτικών προϊόντων» Δημήτρης Προκοπίου Μ313019 Επιβλέπων

Διαβάστε περισσότερα

Επικοινωνία Ανθρώπου Υπολογιστή

Επικοινωνία Ανθρώπου Υπολογιστή Επικοινωνία Ανθρώπου Υπολογιστή Β1. Εισαγωγή στη γλωσσική τεχνολογία, γλωσσικά μοντέλα, διόρθωση και πρόβλεψη κειμένου (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ Οι διαφάνειες αυτές βασίζονται

Διαβάστε περισσότερα

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων... Μέρος 2 Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων... 211 Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων... 241 Kεφάλαιο 13 Ανάλυση δεδομένων... 257 Kεφάλαιο 14 Συναρτήσεις Μέρος Β... 285 Kεφάλαιο 15 Ευρετήριο

Διαβάστε περισσότερα

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ ΑΘΗΝΑ Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ" Επισκόπηση Γνωρίζετε ήδη Τι είδους δεδομένα χρειάζονται από προηγούμενη συνεδρία Μοντέλο που βασίζεται στα Δεδομένα

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή 1 Πίνακας Περιεχομένων 1. Εισαγωγή... 4 1.1 Περιβάλλον Moodle...4 1.2 Χρήση ονόματος χρήστη και κωδικού...4 1.3 Δημιουργία νέου μαθήματος...4 1.3.1

Διαβάστε περισσότερα

Φυσική Απογραφή & Παραστατικά Αποθήκης

Φυσική Απογραφή & Παραστατικά Αποθήκης Φυσική Απογραφή & Παραστατικά Αποθήκης Περιεχόμενα Διαδικασία Φυσικής Απογραφής... 3 Συμπλήρωση φόρμας... 3 Βήματα Απογραφής... 5 Εισαγωγή Αρχείου Απογραφής... 9 Εκτυπώσεις Φυσικής Απογραφής... 10 Λίστα

Διαβάστε περισσότερα

Πληροφορική 2. Δομές δεδομένων και αρχείων

Πληροφορική 2. Δομές δεδομένων και αρχείων Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΓΕΛ & ΕΠΑΛ Β Έκδοση 1.0, Ιούνιος 2012 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ

Διαβάστε περισσότερα

Περιεχόμενα. Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών Μέρος 2: Χρήση υπολογιστή και διαχείριση αρχείων Πρόλογος...

Περιεχόμενα. Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών Μέρος 2: Χρήση υπολογιστή και διαχείριση αρχείων Πρόλογος... Περιεχόμενα Πρόλογος...11 Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών... 13 1.1 Εισαγωγή στους υπολογιστές... 15 1.2 Μονάδες μέτρησης... 27 1.3 Οι βασικές λειτουργίες ενός ηλεκτρονικού υπολογιστή...

Διαβάστε περισσότερα

SilverPlatter WebSPIRS 4.1.

SilverPlatter WebSPIRS 4.1. WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας

Διαβάστε περισσότερα

Τίτλος Πακέτου Certified Computer Expert-ACTA

Τίτλος Πακέτου Certified Computer Expert-ACTA Κωδικός Πακέτου ACTA - CCE - 002 Τίτλος Πακέτου Certified Computer Expert-ACTA Εκπαιδευτικές Ενότητες Επεξεργασία Κειμένου - Word Δημιουργία Εγγράφου Προχωρημένες τεχνικές επεξεργασίας κειμένου & αρχείων

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ ΑΚ. ΕΤΟΣ 2013-2014 Π. ΒΑΣΙΛΕΙΑΔΗΣ http://www.cs.uoi.gr/~pvassil/courses/diplomatikes ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ 1. Μελέτη της Εξέλιξης Βάσεων Δεδομένων... 2 1.1. Εξόρυξη Προτύπων

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΕΠΑΛ Α Έκδοση 1.0, Ιούνιος 2011 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ ΠΙΝΑΚΑΣ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ 2 ο ΣΕΤ ΑΣΚΗΣΕΩΝ Οι ασκήσεις αυτού του φυλλαδίου καλύπτουν τα παρακάτω θέματα: Συναρτήσεις (κεφάλαιο Functions)

Διαβάστε περισσότερα

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων .. Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Μάθημα Βασικές Έννοιες - . Ύλη Εργαστηρίου ΒΔ Ύλη - 4 Ενότητες.1 - Σχεδιασμός Βάσης Δεδομένων.2 Δημιουργία Βάσης Δεδομένων Δημιουργία Πινάκων Εισαγωγή/Ανανέωση/Διαγραφή

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων ..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα

Διαβάστε περισσότερα

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται δύο κριτήρια απόρριψης απομακρυσμένων από τη μέση τιμή πειραματικών μετρήσεων ενός φυσικού μεγέθους και συγκεκριμένα

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ 2013 ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ Περιήγηση στις δυνατότητες του λογισμικού και στον τρόπο χρήσης του ΟΜΑΔΑ ΕΡΓΟΥ ΔΙΕΥΘΥΝΣΗΣ

Διαβάστε περισσότερα

Οδηγίες Καταχώρησης Τεκμηρίου

Οδηγίες Καταχώρησης Τεκμηρίου Οδηγίες Καταχώρησης Τεκμηρίου Αναφορικά με τους τρόπους με τους οποίους μπορείτε να ξεκινήσετε μια νέα υποβολή δείτε το κεφάλαιο 3.2 των Οδηγιών Χρήσης. Στο παρόν εγχειρίδιο περιγράφονται τα βήματα που

Διαβάστε περισσότερα

Εισαγωγή στην επιστήμη των υπολογιστών

Εισαγωγή στην επιστήμη των υπολογιστών Εισαγωγή στην επιστήμη των υπολογιστών Υπολογιστές και Δεδομένα Κεφάλαιο 3ο Αναπαράσταση Αριθμών www.di.uoa.gr/~organosi 1 Δεκαδικό και Δυαδικό Δεκαδικό σύστημα 2 3 Δεκαδικό και Δυαδικό Δυαδικό Σύστημα

Διαβάστε περισσότερα

«Ανάπτυξη μηχανής παραγωγής φυσικής γλώσσας για οντολογίες OWL»

«Ανάπτυξη μηχανής παραγωγής φυσικής γλώσσας για οντολογίες OWL» «Ανάπτυξη μηχανής παραγωγής φυσικής γλώσσας για οντολογίες OWL» Διπλωματική εργασία ΜΠΣ «Επιστήμη Υπολογιστών» Γαλάνης Δημήτριος Επιβλέπων: Ι. Ανδρουτσόπουλος Δεύτερος Αξιολογητής: Π. Κωνσταντόπουλος Παραγωγή

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δρ. Κόννης Γιώργος Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής Προγραμματισμός Στόχοι 1 Να περιγράψουμε τις έννοιες του Υπολογιστικού Προβλήματος και του Προγράμματος/Αλγορίθμου

Διαβάστε περισσότερα

Κεφάλαιο 4: Λογισμικό Συστήματος

Κεφάλαιο 4: Λογισμικό Συστήματος Κεφάλαιο 4: Λογισμικό Συστήματος Ερωτήσεις 1. Να αναφέρετε συνοπτικά τις κατηγορίες στις οποίες διακρίνεται το λογισμικό συστήματος. Σε ποια ευρύτερη κατηγορία εντάσσεται αυτό; Το λογισμικό συστήματος

Διαβάστε περισσότερα

ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ ΠΑΡΑΡΤΗΜΑ ΧΙ

ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ ΠΑΡΑΡΤΗΜΑ ΧΙ ΕΘΝΙΚΟΝ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟΝ ΠΑΝΕΠΙΣΤΗΜΙΟΝ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ 2008-2013 ΠΑΡΑΡΤΗΜΑ ΧΙ ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS Μια βάση δεδομένων είναι μια οργανωμένη συλλογή πληροφοριών, οι οποίες είναι αποθηκευμένες σε κάποιο αποθηκευτικό μέσο (π.χ σκληρό δίσκο). Οι πληροφορίες τις οποίες καταχωρούμε και

Διαβάστε περισσότερα

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Σχεδίαση Βάσεων Δεδομένων

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Σχεδίαση Βάσεων Δεδομένων Ενότητα 3 Σχεδίαση Βάσεων Δεδομένων 17 18 3.1 Εισαγωγή Μία βάση δεδομένων αποτελείται από δεδομένα για διάφορα θέματα τα οποία όμως σχετίζονται μεταξύ τους και είναι καταχωρημένα με συγκεκριμένο τρόπο.

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης «Γλωσσικά μοντέλα μορφολογικά περίπλοκων γλωσσών» Δημήτρης

Διαβάστε περισσότερα

Η-Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Εργαστήριο 1 Εισαγωγή στη C. Σοφία Μπαλτζή s.mpaltzi@di.uoa.gr

Η-Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Εργαστήριο 1 Εισαγωγή στη C. Σοφία Μπαλτζή s.mpaltzi@di.uoa.gr Η-Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Εργαστήριο 1 Εισαγωγή στη C Σοφία Μπαλτζή s.mpaltzi@di.uoa.gr Διαδικαστικά Ιστοσελίδα μαθήματος: http://eclass.uoa.gr/courses/f30/ Υποχρεωτική παρακολούθηση: Παρασκευή 14:00 16:00 στην

Διαβάστε περισσότερα

5 ΕΙΣΑΓΩΓΗ ΣΤΗ ΘΕΩΡΙΑ ΑΛΓΟΡΙΘΜΩΝ

5 ΕΙΣΑΓΩΓΗ ΣΤΗ ΘΕΩΡΙΑ ΑΛΓΟΡΙΘΜΩΝ 5 ΕΙΣΑΓΩΓΗ ΣΤΗ ΘΕΩΡΙΑ ΑΛΓΟΡΙΘΜΩΝ 5.1 Εισαγωγή στους αλγορίθμους 5.1.1 Εισαγωγή και ορισμοί Αλγόριθμος (algorithm) είναι ένα πεπερασμένο σύνολο εντολών οι οποίες εκτελούν κάποιο ιδιαίτερο έργο. Κάθε αλγόριθμος

Διαβάστε περισσότερα

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26 Περιεχόμενα Λίγα λόγια από το συγγραφέα... 7 Κεφάλαιο 1: Microsoft Excel 2002... 9 Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26 Κεφάλαιο 3: Δημιουργία νέου βιβλίου εργασίας και καταχώριση δεδομένων...

Διαβάστε περισσότερα

Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές

Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές Λαμπαδαρίδης Αντώνιος el04148@mail.ntua.gr Διπλωματική εργασία στο Εργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων Επιβλέπων: Καθηγητής Τ. Σελλής Περίληψη

Διαβάστε περισσότερα

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη.

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. 4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. Η μετατροπή μιας εντολής επανάληψης σε μία άλλη ή στις άλλες δύο εντολές επανάληψης, αποτελεί ένα θέμα που αρκετές φορές έχει εξεταστεί σε πανελλαδικό

Διαβάστε περισσότερα

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ: ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: Υπολογιστικά Συστήµατα & Τεχνολογίες Πληροφορικής ΣΥΓΓΡΑΦΕΑΣ: Γιώργος Γιαννόπουλος, διδακτορικός φοιτητής

Διαβάστε περισσότερα

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Γ ΓΥΜΝΑΣΙΟΥ

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Γ ΓΥΜΝΑΣΙΟΥ ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Γ ΓΥΜΝΑΣΙΟΥ Νέα Αναλυτικά Προγράμματα Πληροφορικής και Επιστήμης Ηλεκτρονικών Υπολογιστών Πηγή: Οδηγός

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Άλλες Τεχνικές Βελτίωσης μιας Παρουσίασης

Άλλες Τεχνικές Βελτίωσης μιας Παρουσίασης Άλλες Τεχνικές Βελτίωσης μιας Παρουσίασης 3 ΚΥΡΙΑ ΣΗΜΕΙΑ ΤΟΥ ΚΕΦΑΛΑΙΟΥ Προσθήκη ενοτήτων σε μια παρουσίαση Έλεγχος ορθογραφίας μιας παρουσίασης ΑΡΧΕΙΑ ΕΡΓΑΣΙΑΣ ΕΚΠΑΙΔΕΥΤΙΚΗ ΑΣΚΗΣΗ, ΕΚΠΑΙΔΕΥΤΙΚΗ ΑΣΚΗΣΗ

Διαβάστε περισσότερα

Οδηγίες Χρήσης Εφαρµογής Καταχώρησης Αποδείξεων µε απλά βήµατα

Οδηγίες Χρήσης Εφαρµογής Καταχώρησης Αποδείξεων µε απλά βήµατα Οδηγίες Χρήσης Εφαρµογής Καταχώρησης Αποδείξεων µε απλά βήµατα Βήµα 1 Έναρξη Λειτουργίας Εφαρµογής Μετά την ολοκλήρωση της εγκατάστασης έχει την δυνατότητα ο χρήστης µέσα από ένα ευέλικτο υποσύστηµα να

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ: ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ: Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Ημερίδα παρουσίασης CLARIN-EL 1/10/2010 Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" ΧΑΡΤΟΓΡΑΦΗΣΗ ΧΩΡΟΥ ΓΤ ΓΙΑ ΚΑΕ Στο

Διαβάστε περισσότερα

Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών

Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών 3.5.1.1 Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών Ένα σύνηθες πρόβλημα που υπάρχει, είναι η ανάγκη αποστολής επιστολών ή πληροφοριών

Διαβάστε περισσότερα

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2015-16 Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι

Διαβάστε περισσότερα

Εισαγωγή Κεφάλαιο 1: Εγκατάσταση της Access Κεφάλαιο 2: Βάσεις δεδομένων και δομικά στοιχεία της Access

Εισαγωγή Κεφάλαιο 1: Εγκατάσταση της Access Κεφάλαιο 2: Βάσεις δεδομένων και δομικά στοιχεία της Access ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή...15 Κεφάλαιο 1: Εγκατάσταση της Access 2002...17 Τι είναι το Office XP;...17 Τεχνικές απαιτήσεις του Office XP...17 Πρόσθετα απαιτούμενα για την αξιοποίηση εξειδικευμένων χαρακτηριστικών...18

Διαβάστε περισσότερα

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ 1 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΑΝΑΛΥΣΗ ΜΕΝΟΥ ΕΦΑΡΜΟΓΗΣ... 4 2. ΕΠΕΞΗΓΗΣΗ ΚΕΝΤΡΙΚΟΥ ΜΕΝΟΥ ΚΑΡΤΕΛΑΣ... 5 3. ΔΗΜΙΟΥΡΓΙΑ ΠΕΛΑΤΗ... 6 4. ΑΝΑΖΗΤΗΣΗ ΠΕΛΑΤΗ... 6 5. ΕΠΕΞΕΡΓΑΣΙΑ/ΔΙΑΓΡΑΦΗ

Διαβάστε περισσότερα

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΜΑΘΗΣΙΑΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η ΧΩΡΙΣ ΤΗ ΧΡΗΣΗ Η/Υ ΓΙΑ ΤΗ ΔΙΔΑΣΚΑΛΙΑ ΚΛΑΣΜΑΤΩΝ

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΜΑΘΗΣΙΑΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η ΧΩΡΙΣ ΤΗ ΧΡΗΣΗ Η/Υ ΓΙΑ ΤΗ ΔΙΔΑΣΚΑΛΙΑ ΚΛΑΣΜΑΤΩΝ 3 Ο ΣΥΝΕΔΡΙΟ ΣΤΗ ΣΥΡΟ-ΤΠΕ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ 415 ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΜΑΘΗΣΙΑΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η ΧΩΡΙΣ ΤΗ ΧΡΗΣΗ Η/Υ ΓΙΑ ΤΗ ΔΙΔΑΣΚΑΛΙΑ ΚΛΑΣΜΑΤΩΝ Μεταφετζής Γιώργος Δάσκαλος, 1ο ΔΣ Βόλου gmetafetz@in.gr

Διαβάστε περισσότερα

Browsers. Λειτουργικότητα και Παραμετροποίηση

Browsers. Λειτουργικότητα και Παραμετροποίηση Browsers Λειτουργικότητα και Παραμετροποίηση 1 Πίνακας περιεχομένων Γενική περιγραφή... 3 Γενικά... 3 Ποιο αναλυτικά τα μέρη ενός browser... 4 Φίλτρα αναζήτησης... 4 Σενάρια αναζήτησης... 4 Όψεις εμφάνισης

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΓΕΛ & ΕΠΑΛ Β Έκδοση 1.0, Ιούνιος 2012 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ

Διαβάστε περισσότερα

Ημερομηνία Παράδοσης: 4/4/2013

Ημερομηνία Παράδοσης: 4/4/2013 Δράση 9.14 / Υπηρεσία εντοπισμού λογοκλοπής Κυρίως Παραδοτέο / Σχεδιασμός και ανάπτυξη λογισμικού (λογοκλοπής) και βάσης δεδομένων (αποθετηρίου) Επιμέρους Παραδοτέο 9.14.1.4 / Πληροφοριακό σύστημα υπηρεσίας

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ ΚΕΦΑΛΑΙΟ ΔΙΑΤΑΞΕΙΣ ΜΕΤΑΘΕΣΕΙΣ ΣΥΝΔΥΑΣΜΟΙ Εισαγωγή. Οι σχηματισμοί που προκύπτουν με την επιλογή ενός συγκεκριμένου αριθμού στοιχείων από το ίδιο σύνολο καλούνται διατάξεις αν μας ενδιαφέρει η σειρά καταγραφή

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 21/10/2016

Διαβάστε περισσότερα

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης ιπλωµατική Εργασία του Θεοδώρου Ι. Γαλάνη ΠΕΡΙΛΗΨΗ Γενικά Με την εξάπλωση του διαδικτύου όλο και περισσότεροι

Διαβάστε περισσότερα

Εννοιολογικός Χάρτης Cmap Tools

Εννοιολογικός Χάρτης Cmap Tools Εννοιολογικός Χάρτης Cmap Tools Angelos Giannoulas http://cmap.ihmc.us/ http://cmap.ihmc.us/download/ Εγκατάσταση του λογισμικού Κάντε διπλό κλικ στο εικονίδιο εγκατάστασης της εφαρμογής Εγκατάσταση του

Διαβάστε περισσότερα

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0 ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0 20130510 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εγκατάσταση προγράμματος DCAD 2 2. Ενεργοποίηση Registration 2 3. DCAD 3 3.1 Εισαγωγή σημείων 3 3.2 Εξαγωγή σημείων 5 3.3 Στοιχεία ιδιοκτησίας

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤOΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΕΙΣΑΓΩΓΗ ΣΤOΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΕΙΣΑΓΩΓΗ ΣΤOΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ Στόχοι του μαθήματος Μετά το τέλος του μαθήματος οι μαθητές πρέπει να είναι σε θέση: Να περιγράφουν τι είναι πρόγραμμα Να εξηγούν την αναγκαιότητα για τη δημιουργία γλωσσών

Διαβάστε περισσότερα

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ Σπύρος Δόικας translatum@translatum.gr ΑΠΘ Τομέας Μετάφρασης του Τμήματος Γαλλικής Γλώσσας και

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΕΠΑΛ Α Έκδοση 1.0, Ιούνιος 2011 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ ΠΙΝΑΚΑΣ

Διαβάστε περισσότερα

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων Ενότητα 4 Επεξεργασία πινάκων 36 37 4.1 Προσθήκη πεδίων Για να εισάγετε ένα πεδίο σε ένα πίνακα που υπάρχει ήδη στη βάση δεδομένων σας, βάζετε τον κέρσορα του ποντικιού στο πεδίο πάνω από το οποίο θέλετε

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Υπολογιστικά Συστήματα

Υπολογιστικά Συστήματα Υπολογιστικά Συστήματα Ενότητα 3: Βασικά στοιχεία της γλώσσας προγραμματισμού Visual Basic for Applications (VBA) Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Προγραμματισμός Η/Υ. Χειρισμός Αρχείων. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος

Προγραμματισμός Η/Υ. Χειρισμός Αρχείων. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος Προγραμματισμός Η/Υ Χειρισμός Αρχείων ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος Αρχεία Συλλογές δεδομένων. Αποθηκεύονται στην περιφερειακή μνήμη: π.χ.

Διαβάστε περισσότερα

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 - Project Σεπτεμβρίου Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος Εξέταση: Προφορική, στο τέλος της εξεταστικής. Θα βγει ανακοίνωση στο forum. Ομάδες

Διαβάστε περισσότερα

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση Οι συµφράσεις είναι ακολουθίες όρων οι οποίοι συνεµφανίζονται σε κείµενο µε µεγαλύτερη συχνότητα από εκείνη της εµφάνισης

Διαβάστε περισσότερα

ΑΕΠΠ 7o Επαναληπτικό Διαγώνισμα

ΑΕΠΠ 7o Επαναληπτικό Διαγώνισμα ΑΕΠΠ 7o Επαναληπτικό Διαγώνισμα Ονοματεπώνυμο: ΘΕΜΑ Α Α1. Να γράψετε στο τετράδιό σας τον αριθμό καθεμίας από τις παρακάτω προτάσεις 1-5 και, δίπλα, τη λέξη ΣΩΣΤΟ, αν η πρόταση είναι σωστή, ή τη λέξη ΛΑΘΟΣ,

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΤΕΛΙΚΗΣ ΦΑΣΗΣ

ΘΕΜΑΤΑ ΤΕΛΙΚΗΣ ΦΑΣΗΣ 6 ος ΠΑΝΕΛΛΗΝΙΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Θέμα 1 ο : Άθροισμα ζευγών ΘΕΜΑΤΑ ΤΕΛΙΚΗΣ ΦΑΣΗΣ [30 Μονάδες] Δίνεται μία ακολουθία Ν ακέραιων αριθμών. Θέλουμε να μπορούμε να απαντάμε στο ερώτημα «υπάρχει ζεύγος

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Βάσεις Δεδομένων - Γενικά Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα. Τα περιεχόμενα

Διαβάστε περισσότερα

Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής

Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Αναγνώριση Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα Κοινωνικών Δικτύων Καραμπάτσης Ραφαήλ Μιχαήλ Α.Μ. 3080064 Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΕΠΑΛ A Έκδοση 1.0, Ιούνιος 2015 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΟΛΙΤΙΣΜΟΥ, ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ ΠΙΝΑΚΑΣ

Διαβάστε περισσότερα

Κατασκευή βάσης δεδομένων ελληνικών ακρωνυμίων σε ελληνικά νομικά κείμενα

Κατασκευή βάσης δεδομένων ελληνικών ακρωνυμίων σε ελληνικά νομικά κείμενα 9ο Συνέδριο «Ελληνική Γλώσσα και Ορολογία», Αθήνα, 7-9 Νοεμβρίου 2013 Κατασκευή βάσης δεδομένων ελληνικών ακρωνυμίων σε ελληνικά νομικά κείμενα Τσιμπούρης Χαράλαμπος Υπ. Διδάκτορας Εργαστήριο Ενσύρματης

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΤΕΛΙΚΗΣ ΦΑΣΗΣ

ΘΕΜΑΤΑ ΤΕΛΙΚΗΣ ΦΑΣΗΣ 22 ος ΠΑΝΕΛΛΗΝΙΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Θέμα 1o: Lines man ΘΕΜΑΤΑ ΤΕΛΙΚΗΣ ΦΑΣΗΣ [25 Μονάδες] Το ποδόσφαιρο από την ανακάλυψή του στο Πανεπιστήμιο του Cambridge, έγινε το πιο δημοφιλές αλλά και το πιο

Διαβάστε περισσότερα

Δημιουργία Παραστατικού Αγοράς- Πώλησης και Μετασχηματισμοί

Δημιουργία Παραστατικού Αγοράς- Πώλησης και Μετασχηματισμοί Δημιουργία Παραστατικού Αγοράς- Πώλησης και Μετασχηματισμοί Περιεχόμενα Δημιουργία Παραστατικού Αγοράς... 3 Καρτέλα Παραστατικού Αγοράς... 3 Καρτέλα Βασικό... 4 Καρτέλα Πρόσθετα Στοιχεία... 5 Καρτέλες

Διαβάστε περισσότερα

Αλγοριθμική & Δομές Δεδομένων- Γλώσσα Προγραμματισμού Ι (PASCAL)

Αλγοριθμική & Δομές Δεδομένων- Γλώσσα Προγραμματισμού Ι (PASCAL) Αλγοριθμική & Δομές Δεδομένων- Γλώσσα Προγραμματισμού Ι (PASCAL) Pascal- Εισαγωγή Η έννοια του προγράμματος Η επίλυση ενός προβλήματος με τον υπολογιστή περιλαμβάνει, όπως έχει ήδη αναφερθεί, τρία εξίσου

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

þÿ ½ ÁÉÀ ºµ½ÄÁ¹º ÀÁ à ³³¹Ã Ä þÿ Á³±½Éù±º  ±»»±³  ¼ ÃÉ þÿà» Á Æ Á¹±º Í ÃÅÃÄ ¼±Ä Â.

þÿ ½ ÁÉÀ ºµ½ÄÁ¹º ÀÁ à ³³¹Ã Ä þÿ Á³±½Éù±º  ±»»±³  ¼ ÃÉ þÿà» Á Æ Á¹±º Í ÃÅÃÄ ¼±Ä Â. Neapolis University HEPHAESTUS Repository School of Economic Sciences and Business http://hephaestus.nup.ac.cy Master Degree Thesis 2016-02 þÿ ½ ÁÉÀ ºµ½ÄÁ¹º ÀÁ à ³³¹Ã Ä þÿ Á³±½Éù±º  ±»»±³  ¼ ÃÉ þÿà»

Διαβάστε περισσότερα

Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η

Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η Μονοδιάστατοι Πίνακες Τι είναι ο πίνακας γενικά : Πίνακας είναι μια Στατική Δομή Δεδομένων. Δηλαδή συνεχόμενες θέσεις μνήμης, όπου το πλήθος των θέσεων είναι συγκεκριμένο. Στις θέσεις αυτές καταχωρούμε

Διαβάστε περισσότερα

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace ΒΙΒΛΙΟΘΗΚΗ ΚΑΙ ΚΕΝΤΡΟ ΠΛΗΡΟΦΟΡΙΣΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΕΛΟΠΟΝΝΗΣΟΥ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace Οδηγός Χρήσης ΤΡΙΠΟΛΗ 2015 Μ ε τ η σ υ γ χ ρ η μ α τ ο δ ό τ η σ η τ η ς Ε λ λ ά δ α ς κ α ι τ η ς Ε υ ρ ω π α

Διαβάστε περισσότερα

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing)

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 1 Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Διαχείριση Συγκρούσεων με Ανοικτή Διεύθυνση a) Linear

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Οδηγός γρήγορης εκκίνησης

Οδηγός γρήγορης εκκίνησης Οδηγός γρήγορης εκκίνησης Το Microsoft Excel 2013 έχει διαφορετική εμφάνιση από προηγούμενες εκδόσεις. Γι αυτό το λόγο, δημιουργήσαμε αυτόν τον οδηγό για να ελαχιστοποιήσουμε την καμπύλη εκμάθησης. Προσθήκη

Διαβάστε περισσότερα

Περιεχόμενα. Δομές δεδομένων. Τεχνικές σχεδίασης αλγορίθμων. Εισαγωγή στον προγραμματισμό. Υποπρογράμματα. Επαναληπτικά κριτήρια αξιολόγησης

Περιεχόμενα. Δομές δεδομένων. Τεχνικές σχεδίασης αλγορίθμων. Εισαγωγή στον προγραμματισμό. Υποπρογράμματα. Επαναληπτικά κριτήρια αξιολόγησης Περιεχόμενα Δομές δεδομένων 37. Δομές δεδομένων (θεωρητικά στοιχεία)...11 38. Εισαγωγή στους μονοδιάστατους πίνακες...16 39. Βασικές επεξεργασίες στους μονοδιάστατους πίνακες...25 40. Ασκήσεις στους μονοδιάστατους

Διαβάστε περισσότερα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Μεταπτυχιακό Δίπλωμα Ειδίκευσης Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Δρ. Κακαρόντζας Γεώργιος Επίκουρος Καθηγητής Τμ. Μηχανικών Πληροφορικής Τ.Ε. Μηχανική Λογισμικού για Διαδικτυακές

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel...9

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel...9 Περιεχόμενα Κεφάλαιο 1 Γνωριμία με το Excel...9 Τα στοιχεία του παραθύρου του Excel... 10 Κελιά και διευθύνσεις... 13 Σε ποιο κελί θα τοποθετηθούν τα δεδομένα;... 14 Καταχώριση δεδομένων... 15 Τι καταλαβαίνει

Διαβάστε περισσότερα

Λειτουργικά Συστήματα Κεφάλαιο 2 Οργάνωση Συστήματος Αρχείων 2.1 Διαχείριση Αρχείων και Σύστημα Αρχείων(File System)

Λειτουργικά Συστήματα Κεφάλαιο 2 Οργάνωση Συστήματος Αρχείων 2.1 Διαχείριση Αρχείων και Σύστημα Αρχείων(File System) 2.1.1 Εισαγωγή στη διαχείριση αρχείων Οι Η/Υ αποθηκεύουν τα δεδομένα και τα επεξεργάζονται. Εφαρμογή Προγράμματος C:\Documents and Settings\user\Τα έγγραφά μου\leitourgika.doc Λ.Σ. File System Γι αυτό

Διαβάστε περισσότερα

Λειτουργικά Συστήματα. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Λειτουργικά Συστήματα. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Λειτουργικά Συστήματα Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Στέργιος Παλαμάς, Υλικό Μαθήματος «Λειτουργικά Συστήματα», 2015-2016 Κεφάλαιο 2: Σύστημα Αρχείων Τα προγράμματα που εκτελούνται

Διαβάστε περισσότερα

Οδηγίες Ηλεκτρονικής Υποβολής Προτάσεων

Οδηγίες Ηλεκτρονικής Υποβολής Προτάσεων ΥΠΟΥΡΓΕΊΟ ΑΝΑΠΤΥΞΗΣ ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΒΙΟΜΗΧΑΝΙΑΣ /ΝΣΗ ΜΜΕ ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑ ΚΑΙ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ» 2007 2013 ΠΡΟΓΡΑΜΜΑΤΑ «ΕΝΙΣΧΥΣΗ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑΣ ΝΕΩΝ» «ΕΝΙΣΧΥΣΗ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑΣ

Διαβάστε περισσότερα

Αυτόματο Κλείσιμο Ισολογισμού

Αυτόματο Κλείσιμο Ισολογισμού Αυτόματο Κλείσιμο Ισολογισμού Το συγκεκριμένο εγχειρίδιο δημιουργήθηκε για να βοηθήσει την κατανόηση της διαδικασίας διαχείρισης Οδηγιών Αυτόματου Κλεισίματος Ισολογισμού στην εφαρμογή extra Λογιστική

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΕΠΑΛ Α Έκδοση 1.0, Ιούνιος 2014 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

Διαβάστε περισσότερα

ΥΠ.ΕΣ. - Δ.Μ.Η.Ε.Σ. ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΕΦΑΡΜΟΓΗΣ ΛΗΞΙΑΡΧΕΙΟΥ

ΥΠ.ΕΣ. - Δ.Μ.Η.Ε.Σ. ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΕΦΑΡΜΟΓΗΣ ΛΗΞΙΑΡΧΕΙΟΥ ΥΠ.ΕΣ. - Δ.Μ.Η.Ε.Σ. ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΕΦΑΡΜΟΓΗΣ ΛΗΞΙΑΡΧΕΙΟΥ V 1.0 Δεκέμβριος 2012 Πίνακας Περιεχομένων 1. Εισαγωγή.. σελ. 3 2. Σύνδεση για πρώτη φορά με την εφαρμογή 4 3. Είσοδος στην εφαρμογή 9 4. Αναζήτηση

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος. Γιώργος Μικρός ΕΚΠΑ

Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος. Γιώργος Μικρός ΕΚΠΑ Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος Γιώργος Μικρός ΕΚΠΑ Γλωσσικά χαρακτηριστικά Θα αναλύσουμε την συχνότητα ορισμένων

Διαβάστε περισσότερα

Εργασία Συστήματα Βάσεων Δεδομένων. Θέμα

Εργασία Συστήματα Βάσεων Δεδομένων. Θέμα ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Εργασία Συστήματα Βάσεων Δεδομένων Θέμα.. Σπουδαστής Σειρά / Έτος Εισαγωγής : Επιβλέπων Καθηγητής Γιώργος Σαμαράς Μάιος 2014 Περιεχόμενα

Διαβάστε περισσότερα

Εικόνα 2 Αφού εισέλθετε στο σύστημα, έχετε τη δυνατότητα επιλέγοντας «Software» να αναζητήσετε το λογισμικό που σας ενδιαφέρει. Αυτό γίνεται είτε εισά

Εικόνα 2 Αφού εισέλθετε στο σύστημα, έχετε τη δυνατότητα επιλέγοντας «Software» να αναζητήσετε το λογισμικό που σας ενδιαφέρει. Αυτό γίνεται είτε εισά Για το τμήμα Εφ. Πληροφορικής η είσοδος στην υπηρεσία MSDNAA ELMS γίνεται από το σύνδεσμο: http://msdn63.e academy.com/elms/storefront/home.aspx?campus=msdnaa_er7885 Για το τμήμα Διοίκησης Τεχνολογίας

Διαβάστε περισσότερα

Σύστημα Πρακτικής Άσκησης Εγχειρίδιο χρήσης Επιστημονικά Υπευθύνου

Σύστημα Πρακτικής Άσκησης Εγχειρίδιο χρήσης Επιστημονικά Υπευθύνου Σύστημα Πρακτικής Άσκησης Εγχειρίδιο χρήσης Επιστημονικά Υπευθύνου Σύντομη περιγραφή και σειρά εικόνων για την χρήση του Πληροφοριακού Συστήματος της Πρακτικής Άσκησης από τους/τις Επιστημονικά Υπευθύνους

Διαβάστε περισσότερα

ΤΕΙ ΚΑΒΑΛΑΣ. Πτυχιακή εργασία ΕΙΣΑΓΩΓΗ. Μιλτιάδης Κακλαμάνης

ΤΕΙ ΚΑΒΑΛΑΣ. Πτυχιακή εργασία ΕΙΣΑΓΩΓΗ. Μιλτιάδης Κακλαμάνης Σελίδα 1από ΤΕΙ ΚΑΒΑΛΑΣ Πτυχιακή εργασία Δικτυακή Εφαρμογή διαχείρισης ηλεκτρονικών εγγράφων υπηρεσίας. ΕΙΣΑΓΩΓΗ Μιλτιάδης Κακλαμάνης Σελίδα 2από Κατάλογος περιεχομένων ΕΙΣΑΓΩΓΗ...1 Σχετιζόμενα πρόσωπα...3

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

Περιπτώσεις Χρήσης για το Π.Σ. ΜΟ.ΔΙ.Π. Κρήτης

Περιπτώσεις Χρήσης για το Π.Σ. ΜΟ.ΔΙ.Π. Κρήτης ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ ΜΟΝΑΔΑ ΔΙΑΣΦΑΛΙΣΗΣ ΠΟΙΟΤΗΤΑΣ Ε.Π.: «ΕΚΠΑΙΔΕΥΣΗ ΚΑΙ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗ» ΠΡΑΞΗ: ΜΟΔΙΠ ΤΟΥ Τ.Ε.Ι. ΚΡΗΤΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΥΠΕΥΘΥΝΟΣ: ΚΩΝ/ΝΟΣ ΣΑΒΒΑΚΗΣ Περιπτώσεις Χρήσης για

Διαβάστε περισσότερα

Λειτουργικά Συστήματα

Λειτουργικά Συστήματα Λειτουργικά Συστήματα Ενότητα: ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ No:01 Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Ψηφιακών Συστημάτων και Αρχιτεκτονικής Υπολογιστών

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ Διδάσκουσα Δρ Β. Καβακλή Χειμερινό Εξάμηνο 2001 1 Δοκιμή Έλεγχος Αλγορίθμου Για να

Διαβάστε περισσότερα

Αναλυτικός οδηγός χρήσης εφαρμογής Energy Audit Pro edition

Αναλυτικός οδηγός χρήσης εφαρμογής Energy Audit Pro edition Αναλυτικός οδηγός χρήσης εφαρμογής Energy Audit Pro edition Περιεχόμενα Εισαγωγή... 2 Αρχική Οθόνη Εφαρμογής... 3 Εγγραφή χρήστη... 4 Είσοδος χρήστη... 6 Δημιουργία Νέας Μελέτης... 8 Μεταφορά δεδομένων

Διαβάστε περισσότερα

Λογισμική Εφαρμογή Διαχείρισης Ερωτηματολογίων ΟΔΗΓΟΣ ΧΡΗΣΗΣ System Συμβουλευτική Α.Ε

Λογισμική Εφαρμογή Διαχείρισης Ερωτηματολογίων ΟΔΗΓΟΣ ΧΡΗΣΗΣ System Συμβουλευτική Α.Ε σχετικά με τον έλεγχο της καπνιστικής συνήθειας 1 22 Λογισμικές εφαρμογές καταγραφής και αξιοποίησης πληροφοριών σχετικά με τον έλεγχο της καπνιστικής συνήθειας Λογισμική Εφαρμογή Διαχείρισης Ερωτηματολογίων

Διαβάστε περισσότερα