Πτυχιακή Ρ^ργασία I Ιλιού Αναστάσιος Λογισμικό μορφολογικής ανάλυσης της νέας και αρχαίας Ελληνικής γλώσσας



Σχετικά έγγραφα
Εισαγωγή στον Προγραμματισμό

Αναπαράσταση Μη Αριθμητικών Δεδομένων

! Δεδομένα: ανεξάρτητα από τύπο και προέλευση, στον υπολογιστή υπάρχουν σε μία μορφή: 0 και 1

Ο Οδηγός γρήγορης εκκίνησης

Προγραμματισμός Υπολογιστών

Ηλεκτρονικό Λεξικό Ρηµάτων Αρχαίας Ελληνικής Γλώσσας. Περίληψη

Εισαγωγή στην επιστήμη των υπολογιστών. Αναπαράσταση Δεδομένων

Σύντομη περιγραφή 5. Για να ξεκινήσετε 6. Οι οθόνες του προγράμματος 8. Εγκατάσταση προγράμματος 6 Δημιουργία κωδικών χρήστη 7

GreekLUG Ελεύθερο Λογισμικό & Λογισμικό Ανοικτού Κώδικα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΜΕ ΘΕΜΑ:

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Προγραμματισμός Ι. Χαρακτήρες. Πανεπιστήμιο Πελοποννήσου Τμήμα Πληροφορικής & Τηλεπικοινωνιών

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel... 9

ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL

Εισαγωγή στο Libre Office. Bάιος Κολοφωτιάς Επιστημονικός Συνεργάτης Sweng Lab A.Π.Θ

Οδηγός γρήγορης εκκίνησης

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel...9

Προγραμματισμός Διαχείρισης Συστημάτων Ι

Οδηγός γρήγορης εκκίνησης

MK Prosopsis Ltd - Assistive Technology Products & Services

ΓΡΑΜΜΑΤΙΚΗ ΣΥΝΤΑΞΗ ΕΙΣΑΓΩΓΗ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

Συνοπτικό εγχειρίδιο χρήσης του Microsoft Visual Studio 2010

Διαγραφή Επιλέγετε Διαγραφή για να διαγράψετε μία ήδη υπάρχουσα διαδικασία εισαγωγής ASCII

ΠΛΗΡΟΦΟΡΙΚΗ Ι JAVA Τμήμα θεωρίας με Α.Μ. σε 8 & 9 11/10/07

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Διαχείριση Βάσης Δεδομένων (dbadmin)

Οδηγός γρήγορης εκκίνησης

Αλγόριθμος. Αλγόριθμο ονομάζουμε τη σαφή και ακριβή περιγραφή μιας σειράς ξεχωριστών οδηγιών βημάτων με σκοπό την επίλυση ενός προβλήματος.

Η-Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Εργαστήριο 1 Εισαγωγή στη C. Σοφία Μπαλτζή s.mpaltzi@di.uoa.gr

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

Γνωρίστε το χώρο εργασίας του PowerPoint

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access Κεφάλαιο 2 Χειρισμός πινάκων... 27

Βάσεις δεδομένων (Access)

Σενάριο Χρήσης myschool

Visual Flowchart Γενικά

Σου προτείνω να τυπώσεις τις επόμενες τέσσερις σελίδες σε ένα φύλο διπλής όψης και να τις έχεις μαζί σου για εύκολη αναφορά.

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

1. Εισαγωγή στο ΟΠΣ - ΠΔΕ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΧΡΗΣΤΗ. Ηλεκτρονική Υποβολή Α.Π.Δ.

Αριθμητικά Συστήματα

Εισαγωγή στην επιστήµη των υπολογιστών. Αναπαράσταση Δεδοµένων

Ο Προγραμματισμός στην Πράξη

Επαναληπτικό διαγώνισμα στην Α.Ε.Π.Π - 18 / Απριλίου / 2010 ΘΕΜΑ 1

Εγχειρίδιο Χρήσης για το «Κρυμμένο Κείμενο»

Σχεδιάζοντας Εφαρμογές για το Διαδίκτυο

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ

ΠΛΗΡΟΦΟΡΙΚΗ I Ενότητα 6

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

Σημειώσεις στο PowerPoint

Γ ΓΥΜΝΑΣΙΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΕ ΤΗ ΓΛΩΣΣΑ MicroWorlds Pro

Ηλεκτρονικό Λατινικό Λεξικό Ρηµάτων. Περίληψη

Εγχειρίδιο διαχείρισης χρηστών και λιστών διανομής για τον Υπεύθυνο Φορέα του Δικτύου "Σύζευξις" -1-

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Σχεδίαση Βάσεων Δεδομένων

ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΜΗΜΑ: Γ2

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Βασικές Έννοιες Προγραμματισμού. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD

Εγχειρίδιο του πίνακα χαρακτήρων

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Βάσεις δεδομένων (Access)

5 ΕΙΣΑΓΩΓΗ ΣΤΗ ΘΕΩΡΙΑ ΑΛΓΟΡΙΘΜΩΝ

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Θέµατα Μορφολογίας της Νέας Ελληνικής Ι. Κώστας Δ. Ντίνας Πανεπιστήµιο Δυτικής Μακεδονίας

«Οδηγίες χρήσης εφαρμογής Ενιαίου Συστήματος Πληρωμών»

Διαδικασιακός Προγραμματισμός

Αναπαράσταση Δεδομένων (2 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

ΓΛΩΣΣΑ ΑΛΦΑΒΗΤΟ ΤΥΠΟΙ ΔΕΔΟΜΕΝΩΝ ΣΤΑΘΕΡΕΣ ΜΕΤΑΒΛΗΤΕΣ

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub

Εκπαιδευτικό Εργαλείο Κανονικοποίησης

Εγκατάσταση Λογαριασμού Αλληλογραφίας στο ελληνικό Outlook Express Περιεχόμενα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Atlantis - Νέο user interface

MICROBOT SERVER MICROBOT MONITOR ΕΦΑΡΜΟΓΕΣ ΕΛΕΓΧΟΥ ΚΑΙ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΓΙΑ ΣΥΣΤΗΜΑΤΑ MICROBOT

Ο Οδηγός γρήγορης εκκίνησης

Κλιμάκιο Πληροφορικής Σεμινάρια για τα λογισμικά κλειστού τύπου Κύκλος Α

Αλλαγή της εμφάνισης κειμένου: μέγεθος γραμματοσειράς, είδος γραμματοσειράς

Μαλούτα Θεανώ Σελίδα 1

Τεχνολογία Λογισμικού

Εισαγωγή στην εφαρμογή Βασική Σελίδα (Activity) Αναζήτηση Πελάτη... 6 Προβολή Πελάτη... 7 Επεξεργασία Πελάτη... 10

Εγχειρίδιο Χρήσης για την εφαρμογή «Αναλυτική Καταγραφή Δικαιούχων Παραγωγών για τα Ειδικά Μέτρα Στήριξης στα Μικρά Νησιά Αιγαίου Πελάγους»

Οδηγός γρήγορης εκκίνησης

ΓΝΩΣΤΙΚΟ ΑΝΤΙΚΕΙΜΕΝΟ: ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

Τετάρτη 5-12/11/2014. ΣΗΜΕΙΩΣΕΙΣ 3 ου και 4 ου ΜΑΘΗΜΑΤΟΣ ΕΙΔΙΚΟΤΗΤΑ: ΤΕΧΝΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΑΡΧΙΤΕΚΤΟΝΙΚΗ Η/Υ Α ΕΞΑΜΗΝΟ

Α2. Να γράψετε στο τετράδιο σας τον αριθμό 1-4 κάθε πρότασης και δίπλα το γράμμα που δίνει τη σωστή επιλογή.

ΟΜΑΔΑ Ε ΓΕΩΡΓΙΟΥ ΦΩΤΕΙΝΗ ΗΛΙΟΥΔΗ ΑΦΡΟΔΙΤΗ ΜΕΤΑΛΛΙΔΟΥ ΧΡΥΣΗ ΝΙΖΑΜΗΣ ΑΛΕΞΑΝΔΡΟΣ ΤΖΗΚΑΛΑΓΙΑΣ ΑΝΔΡΕΑΣ ΤΡΙΓΚΑΣ ΑΓΓΕΛΟΣ

Περιεχόµενα. I Βασικές Γνώσεις 1

Εισαγωγή στην Πληροφορική & τον Προγραμματισμό

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

να ακολουθήσουμε Έναρξη Όλα τα Προγράμματα και να ενεργοποιήσουμε την επιλογή Microsoft Word.

Μάθημα 2: Παράσταση της Πληροφορίας

Μεταβλητές τύπου χαρακτήρα

ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ. Πρόγραμμα Διαχείρισης Α.Π.Δ.

Εγχειρίδιο Χρήσης Φορέα Πιστοποίησης

Transcript:

Πτυχιακή Ρ^ργασία I Ιλιού Αναστάσιος Λογισμικό μορφολογικής ανάλυσης της νέας και αρχαίας Ελληνικής γλώσσας Όνομα Πατρός : Εααανουήλ Αριθμός Μ ητρώου : 1066 Επιρ)α;πων Καθηγητής : ( ). Λλεβίζος

- Περιεχόμενα - Εισαγωγή.........02 Ανάλυση Απαιτήσεων... Σχεδιασμός... Σχεδιασμός Της Βάσης Δεδομένων....07...13 Μοντέλο Οντοτήτων Συσχετίσεων... Σχεδιασμός του προγράμματος... Διάγραμμα Ροής......20 Διάγραμμα Κλάσεων... Εγχειρίδιο Χρήσης... Τρόπος Πληκτρολόγησης Αρχαιοελληνικών... 22 23 Αρχική Οθόνη... Η λέξη Βρέθηκε... Η λέξη δεν Βρέθηκε....26 28 Σημειώσεις... Δομή Αρχείων Παραδειγμάτων... 29 Συμπεράσματα... Βιβλιογραφία - Διευθύνσεις Internet... 32

1. Εισαγωγή Γενική Περιγραφή Η πτυχιακή εργασία έχει ως στόχο τη δημιουργία ενός λογισμικού το οποίο θα κάνει μορφολογική ανάλυση σε οποιαδήποτε λέξη της αρχαίας και της νέας Ελληνικής γλώσσας. Αναλυτικότερα, το λογισμικό θα δέχεται οποιαδήποτε λέξη σε αρχαία ή νέα Ελληνική και θα την αναλύει σε όλες τις μορφές της προσδιορίζοντας παράλληλα τι μέρος του λόγου είναι. Μορφολογική Ανάλυση Η μορφολογική ανάλυση αποτελεί αφενός το πρώτο και βασικότερο βήμα στην αυτόματη επεξεργασία μιας γλώσσας, αφετέρου μία από τις τέσσερις διαστάσεις για την εκμάθηση και σωστή χρήση μιας γλώσσας ως πρώτης ή δεύτερης. Οι άλλες τρεις διαστάσεις είναι το λεξιλόγιο, η σύνταξη και η σημασιολογία της. Η ελληνική γλώσσα είναι μια γλώσσα με πολλή ιδιαίτερη μορφολογία, ως γνωστό, είναι μια υψηλού βαθμού κλιτή γλώσσα. Αποτελείται από 11 μέρη του λόγου, εκ των οποίων τα 6 είναι κλιτά. Αυτά περιλαμβάνουν μια μεγάλη ποικιλία μορφολογικών μονολεκτικών και περιφραστικών τύπων. Οι κανόνες παραγωγής τους, οι κλίσεις τους δηλαδή, ταξινομούνται, βάσει της ελληνικής Γραμματικής, ως προς το κλιτό μέρος του λόγου στο οποίο ανήκουν, π.χ. ουσιαστικά, επίθετα, ρήματα, ως προς τις υποδιαιρέσεις τους, για παράδειγμα γένη και τύπος για τα ουσιαστικά, και ως προς τον τρόπο που σχηματίζονται οι μορφολογικοί τύποι τους, σε ομαλές κλίσεις, ανώμαλες κλίσεις και ειδικές εξαιρέσεις των κλίσεων. Ενδεικτικά σημειώνουμε επίσης ότι για κάθε ουσιαστικό παράγονται κατά κανόνα 8 μορφολογικοί τύποι, για κάθε ρήμα 76, για κάθε επίθετο 120 τύποι, κ.λπ. Σε αυτούς τους μορφολογικούς τύπους πρέπει να προσθέσουμε τους δεύτερους και τους τρίτους μορφολογικούς τύπους που πολλές φορές συναντούμε όταν επεξεργαζόμαστε κείμενα. Είναι ακόμα γνωστό ότι οι διάφοροι μορφολογικοί τύποι των κλιτών μερών του λόγου χρησιμοποιούν συχνά για τον σχηματισμό τους, πέρα από τις διαφορετικές καταλήξεις, και διαφορετικά θέματα. Συμβαίνει όμως, διαφορετικοί μορφολογικοί τύποι σε συγκεκριμένα κλιτά μέρη του λόγου να είναι όμοιοι και να μπορούν να διακριθούν μόνο με τη βοήθεια των συμφραζομένων τους. Για παράδειγμα, σε πολλά ουσιαστικά η ονομαστική, αιτιατική και κλητική σχηματίζουν τον ίδιο μορφολογικό τύπο στον ενικό και αντίστοιχα στον πληθυντικό, όπως ο ίδιος μορφολογικός τύπος ανηστοιχεί στη γενική πληθυντικού σε όλα τα γένη του ίδιου ετηθέτου. Στην πρώτη περίπτωση οι διαφορετικές πτώσεις μπορούν να εντοπιστούν με τη βοήθεια του άρθρου που προηγείται, ενώ στη δεύτερη από το ουσιαστικό που έπεται. Η πολυπλοκότητα των δεδομένων που ήδη περιγράφηκε αυξάνεται δραματικά όταν κάποιες λέξεις, εκτός του ότι αντιστοιχούν σε διαφορετικούς τύπους του ιδίου μέρους του λόγου, ανήκουν ταυτόχρονα και σε άλλα μέρη του λόγου. Για παράδειγμα ο μορφολογικός τύπος «καλά», μπορεί να αντιστοιχεί στην ονομαστική, αιτιατική και κλητική πληθυντικού του επιθέτου

«καλός» στο ουδέτερο γένος, μπορεί επίσης να είναι τροπικό επίρρημα «καλά», αλλά μπορεί να είναι και ένας αδύνατος ρηματικός τύπος, το τρίτο ενικό πρόσωπο της οριστικής του ενεστώτα του ρήματος «καλώ». Εφαρμογές Το λογισμικό μπορεί να βρει εφαρμογή σε: 1. Εφαρμογές Φυσικής Γλώσσας όπως: - Συντακτική ανάλυση - Παραγωγή κειμένων - Μηχανική μετάφραση - Λεξικογραφικά εργαλεία κ λημματοποίηση 2. Εφαρμογές Φωνής όπως: - Συστήματα σύνθεσης φωνής - Συστήματα αναγνώρισης φωνής 3. Εφαρμογές Επεξεργασίας Κειμένου όπως: - Έλεγχος ορθογραφίας - Εισαγωγή κειμένου 4. Ανάκτηση Εγγράφων 5. Εκπαιδευτικά εργαλεία διδασκαλίας μορφολογίας Σχετικές Εφαρμογές Θα πρέπει να σημειωθεί ότι υπάρχουν ανάλογες εφαρμογές με το λογισμικό της παρούσας πτυχιακής. Κάποιες από αυτές είναι: - Ελληνική Γλώσσα (διαμοιραζόμενο μαζί με την εφημερίδα Τα Νέα.). - Ηλεκτρονικό Λεξικό της νέας Ελληνικής γλώσσας. (Ευρωπαϊκή Εταιρία Νεοελληνικών σπουδών, http://www.eens-congress.eu). Υπάρχουν όμως κάποιες βασικές διαφορές τις οποίες θα εξετάσουμε παρακάτω.

2. Ανάλυση Απαιτήσεων Το λογισμικό θα πρέτιει: 1. Να έχει μια καλοσχεδιασμένη και αξιόπιστη βάση δεδομένιαν. 2. Να είναι εύχρηστο και αξιόπιστο. 3. Να αναγνωρίζει λέξεις αρχαίας και νέας Ελληνικής(ρήματα, ουσιαστικά, επίθετα, επιρρήματα). 4. Να υπάρχει δυνατότητα προσθήκης νέων λέξεων(ρήματα, ουσιαστικά, επίθετα, επιρρήματα). 5. Να υπάρχει η δυνατότητα αλλαγής υπαρχόντων λέξεων(ρήματα, ουσιαστικά, επίθετα, επιρρήματα). 6. Να υπάρχει η δυνατότητα διαγραφής υπαρχόντων λέξεων(ρήματα, ουσιαστικά, επίθετα, επιρρήματα). 7. Να παρέχει παραδείγματα για την προσθήκη νέων λέξεων(ρήματα, ουσιαστικά, επίθετα, επιρρήματα). 8. Να υπάρχει δυνατότητα προσθήκης νέων παραδειγμάτων(ρήματα, ουσιαστικά, επίθετα, επιρρήματα). 9. Να παρέχει δυνατότητα γραφής αρχαίων χαρακτήρων. 10. Να έχει Exception Handling. Απαιτήσεις κατά F.U.R.P.S Functionality 1,3, 4, 5, 6, 8,9 Usability 2, 7, 8, 9 Reliability 1,2, 10 Performance 1 Supportability 1

Προδιαγραφές Προδιαγραφή (1) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΛ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Προδιαγραφή (2) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΑ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Προδιαγραφή (3) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΑ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Προδιαγραφή (4) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΑ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Αναγνώριση Λέξεων Πληκτρολόγιο Λέξη (Αρχαία/Νέα) Αναζήτηση στη βάση δεδομένων για την λέξη και εμφάνιση αποτελεσμάτων. Λέξη σε όλες τις μορφές της. Οθόνη Προσθήκη Λέξεων Πληκτρολόγιο Λέξη (Αρχαία/Νέα) Εισαγωγή λέξης στην βάση δεδομένων. Η λέξη υπάρχει ήδη. Μήνυμα επιτυχούς εισαγωγής. Οθόνη Τροποποίηση Λέξεων Πληκτρολόγιο Λέξη (Αρχαία/Νέα) Αναζήτηση στη βάση δεδομένων για την λέξη και αλλαγή αυτής. Η λέξη δεν υπάρχει. Μήνυμα επιτυχούς τροποποίησης. Οθόνη Διαγραφή Λέξεων Πληκτρολόγιο Λέξη (Αρχαία/Νέα) Αναζήτηση στη βάση δεδομένων για την λέξη και διαγραφή αυτής. Η λέξη δεν υπάρχει. Μήνυμα επιτυχούς διαγραφής. Οθόνη

Προδιαγραφή (5) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΛ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΛ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Προδιαγραφή (6) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΑ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Πληκτρολόγηση Unicode Πληκτρολόγιο Συνδυασμός συμβόλων Έλεγχος συνδυασμού συμβόλων κ εμφάνιση του κατάλληλου αρχαιοελληνικού. Αρχαιοελληνικός χαρακτήρας. Οθόνη Εμφάνιση Λέξεων Μέθοδος αναζήτησης. Λέξεις (Αρχαία/Νέα) Εμφάνιση λέξεων. Λέξεις. Οθόνη Προδιαγραφή (7) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΑ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Προδιαγραφή (8) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΑ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Προσθήκη Παραδειγμάτων Πληκτρολόγιο Παράδειγμα (Αρχαία/Νέα) Εισαγωγή του παραδείγματος στο αρχείο παραδειγμάτων. Δεν υπάρχει αρχείο παραδειγμάτων. Αρχείο παραδειγμάτων. Τροποποίηση Παραδειγμάτων Πληκτρολόγιο Παράδειγμα (Αρχαία/Νέα) Τροποποίηση του παραδείγματος στο αρχείο παραδειγμάτων. Δεν υπάρχει αρχείο παραδειγμάτων. Δεν υπάρχει παράδειγμα. Αρχείο παραδειγμάτων.

Προδιαγραφή (9) ΤΙΤΛΟΣ ΠΡΟΕΛΕΥΣΗ ΕΙΣΟΔΟΥ ΔΕΔΟΜΕΝΛ ΕΙΣΟΔΟΥ ΛΕΙΤΟΥΡΓΙΑ ΠΛΕΥΡΙΚΑ ΦΑΙΝΟΜΕΝΑ ΠΡΟΫΠΟΘΕΣΗ ΕΞΟΔΟΣ ΠΡΟΟΡΙΣΜΟΣ Διαγραφή Παραδειγμάτων Πληκτρολόγιο Παράδειγμα (Αρχαία/Νέα) Διαγραφή του παραδείγματος από το αρχείο παραδειγμάτων. Δεν υπάρχει αρχείο παραδειγμάτων. Δεν υπάρχει παράδειγμα. Αρχείο παραδειγμάτων. 3. Σχεδιασμός Μετά την ανάλυση των απαιτήσεων βγήκαν τα εξής συμπεράσματα: 1. Η χρήση του προτύπου Unicode είναι μονόδρομος λόγω της απαίτησης για την αρχαία Ελληνική γλώσσα. 2. Η βάση δεδομένων θα υλοποιηθεί με την Oracle λόγω του υψηλού δείκτη αξιοπιστίας της καθώς και για την συμβατότητα της με το πρότυπο Unicode. 3. Η γλώσσα προγραμματισμού που θα χρησιμοποιηθεί θα είναι η Borland C++ Builder, λόγω της ευχρηστίας της και της πολύ καλή διαχείρισης βάσεων δεδομένων Oracle. Λίγα λόγια για το Unicode Στους υπολογιστές, το διεθνές πρότυπο Unicode στοχεύει στην κωδικοποίηση όλων των αλφάβητων που χρησιμοποιούνται στον πλανήτη ώστε να γίνει δυνατή η αποθήκευση στη μνήμη ενός υπολογιστή το κείμενο μιας οποιασδήποτε γλώσσας συμπεριλαμβανομένων και συμβόλων επιστημών, όπως μαθηματικά, φυσική κτλ. Η καθιέρωση του Unicode είναι ένα φιλόδοξο σχέδιο αφού σκοπεύει να αντικαταστήσει όλες τις υπάρχοντες κωδικοποιήσεις συνόλων χαρακτήρων, οι οποίες έχουν περιορισμούς που τις καθιστούν προβληματικές για χρήση σε πολυγλωσσικά υπολογιστικά συστήματα. Παρά τα τεχνικά προβλήματα που έχουν παρουσιαστεί το Unicode έχει καθιερωθεί σαν το πιο πλήρες σύνολο χαρακτήρων και σαν η προτιμότερη κωδικοποίηση σε πολυγλωσσικό λογισμικό. Πολλά πρόσφατα πρότυπα όπως το XML, καθώς και λογισμικό συστήματος όπως λειτουργικά συστήματα, έχουν υιοθετήσει το Unicode για να αναπαριστούν εσωτερικά κείμενο.

Γέννηση και ανάπτυξη του προτύπου Το Unicode στάνταρντ είχε τον ρητό στόχο να ξεπεράσει τους περιορισμούς των παραδοσιακών κωδικοποιήσεων χαρακτήρων όπως αυτοί ορίζονται από το ISO 8859 πρότυπο που χρησιμοποιήθηκε ευρέως σε πολλές χώρες στον κόσμο αλλά παρουσίαζε προβλήματα ασυμβατότητας μεταξύ των διαφορετικών υλοποιήσεών του. Πολλές παραδοσιακές κωδικοποιήσεις χαρακτήρων μοιράζονται ένα κοινό πρόβλημα στο ότι επιτρέπουν υποστήριξη δύο αλφάβητων,συνήθως του Λατινικού και ενός τοπικού, αλλά δεν υποστηρίζουν πολλές γλώσσες. Το Unicode κωδικοποιεί αφηρημένους χαρακτήρες προμηθεύοντας ένα κωδικό σημείο σε καθέναν τους, όχι συγκεκριμένες μορφές που αυτοί μπορούν να πάρουν σε διάφορες γραμματοσειρές. Με άλλα λόγια το Unicode πρότυπο αφήνει το ανάλογο λογισμικό πλοηγός διαδικτύου, επεξεργαστής κειμένου να αποφασίσει αυτό την οπτική αναπαράσταση (στυλ, μέγεθος, γραμματοσειρά) των χαρακτήρων Επίσης στο πρότυπο περιλαμβάνει και σχετικά θέματα όπως ιδιότητες χαρακτήρων, φόρμες κανονικοποίησης κειμένου, κατεύθυνση εμφάνισης(για γλώσσες που διαβάζονται και από τα δεξιά προς τα αριστερά όπως η Αραβική γλώσσα και τα Εβραϊκά. Αλφάβητα που περιλαμβάνονται Το Unicode περιλαμβάνει σχεδόν όλα τα αλφάβητα που είναι σε χρήση σήμερα. Αυτά είναι τα: Αραβικά Ελληνικά Λατινικά Αρμενικά Gujarati Malayalam Bengali Gurmukhi Μογκολικά Bopomofo Hangul (Κορεατικά) Myanmar Braille Han (Kanji, Hanja, Hanzi) (Burmese) Canadian Aboriginal Japanese (Kanji, Hiragana και Oriya Syllables Katakana) Συριακά Τσερόκι Εβραϊκά Tamil Κοπτικά Hiragana Τάϊλανδικά Κυριλλικά Katakana Θιβετιανά Devanagari Khmer (Cambodian) Yi Αιθιοπικά Kannada και άλλα Γ εωργιανικά Lao Το Unicode έχει προσθέσει και άλλα αλφάβητα όπως ιστορικά αλφάβητα και εξαφανισμένα αλφάβητα για ακαδημαϊκούς λόγους: Runic Αιγυπτιακά Mayan Inka Ιερογλυφικά Cuneiform

Επίσης περιλαμβάνει και άλλα σύμβολα που χρησιμοποιούνται στα μαθηματικά και την μουσική. Κωδικοποιήσεις Πρότυπα Η κοινοπραξία δημοσίευσε πρώτη φορά Το πρότυπο Unicode(ISBN 0321185781) το 1991,και συνεχίζει να αναπτύσσει πρότυπα βασισμένα στην αρχική αυτή εργασία. Η κοινοπραξία Unicode αναπτύχθηκε σε συνδυασμό με τον Διεθνή Οργανισμό Τυποποίησης ISO, και το πρότυπό της μοιράζεται το σύνολο χαρακτήρων της με το πρότυπο ISO/IEC 10646. Το Unicode και το ISO/IEC 10646 είναι ισοδύναμα σαν κωδικοποιήσεις χαρακτήρων αλλά το Unicode παρέχει πολύ περισσότερες πληροφορίες για προγραμματιστές που το υλοποιούν.καλύπτοντας σε βάθος θέματα όπως κωδικοποίηση βασισμένη σε μπιτ, Unicode collation αλγόριθμοι, και γραφική απόδοση. Το Unicode απαριθμεί αρκετές ιδιότητες χαρακτήρων, περιλαμβάνοντας και αυτές που χρειάζονται για BiDi υποστήριξη. Τα δυο πρότυπα χρησιμοποιούνε μερικώς διαφορετική ορολογία. Όταν γράφουμε για κώδικα σημεία του Unicode είναι σύνηθες να χρησιμοποιούμε την μορφή U+xxxx or U+xxxxxx όπου χχχχ ή χχχχχχ είναι το κωδικό σημείο στο δεκαεξαδικό σύστημα Unicode ιστορίκο αναθεωρήσεων 1991 Unicode 1.0 1993 Unicode 1.1 1996 Unicode 2.0 1998 Unicode 2.1 1999 Unicode 3.0 2001 Unicode 3.1 2002 Unicode 3.2 2003 Unicode 4.0 2005 Unicode 4.1 Αποθήκευση μεταφορά και επεξεργασία Μέχρι τώρα το Unicode παρουσιάστηκε απλά σαν μια απεικόνιση κάθε χαρακτήρα που χρησιμοποιείται σε κάποιο αλφάβητο στη Γη σε έναν μοναδικό αριθμό, το κωδικό σημείο. Όμως η αποθήκευση αυτών των αριθμών κατά την επεξεργασία κειμένου είναι ένα εντελώς διαφορετικό θέμα. Προβλήματα ανακύπτουν από το γεγονός ότι το λογισμικό που γράφεται στον δυτικό κόσμο χειρίζεται μόνο κωδικοποιήσεις 8-bit με την Unicode υποστήριξη να προστίθεται πολύ αργότερα. Η εσωτερική λογική παραδοσιακών 8-μπιτ εφαρμογών επιτρέπει μόνο 8 μπιτς για κάθε χαρακτήρα κάνοντας αδύνατη την χρησιμοποίηση περισσότερων των 256 κωδικών σημείων χωρίς ειδική επεξεργασία. Έτσι οι μηχανικοί λογισμικού έχουν προτείνει διάφορους μηχανισμούς για την υλοποίηση του Unicode. Ποιά υλοποίηση χρησιμοποιεί

ο κάθε προγραμματιστής από θέματα χωρητικότητας, συμβατότητας πηγαίου κώδικα και διαλειτουργικότητας με άλλα συστήματα. Το Unicode ορίζει δυο τρόπους απεικόνισης: Τις UTF (Unicode Transformation Format) κωδικοποιήσεις Και τις UCS (Universal Character Set) κωδικοποιήσεις Αυτές οι κωδικοποιήσεις περιλαμβάνουν τις εξής κύριες: UTF-32 UCS-4 UTF-16 UCS-2 UTF-8 UTF-EBCDIC UTF-7 (Ο αριθμός υποδηλώνει τον αριθμό των μπιτ σε κάθε μονάδα (για UTF κωδικοποιήσεις) ή byte ανά μονάδα (για UCS κωδικοποιήσεις).) Έτοιμοι και σύνθετοι χαρακτήρες Μέχρι και το 2004, τα περισότερα λογισμικά ακόμα δεν μπορούσαν να χειριστούν αξιόπιστα πολλά χαρακτηριστικά που δεν υποστηρίζονταν από παλαιότερες τυποποιήσεις γραμματοσειρών, έτσι το να συνδυάζει κανείς χαρακτήρες, γενικώς δεν λειτουργούσε σωστά. Υποθετικά, το e (προστεθειμένο e με περισπωμένη και οξεία) και το C (e που ακολουθείται από συνδυαζόμενη περισπωμένη επάνω και συνδυαζόμενη οξεία επάνω) είναι πανομοιότυπα στην εμφάνιση, δίνοντας και τα δύο ένα e με περισπωμένη και οξεία, αλλά η εμφάνιση μπορεί να διαφοροποιείται σε μεγάλο βαθμό κατά την εφαρμογή εφαρμογών λογισμικού. Επίσης, οι κάτω τελείες, οι οποίες χρειάζονται στα Ινδικά Romanization, συχνά θα τοποθετούνται λανθασμένα ή ακόμα χειρότερα. Παράδειγμα: φ -η -.1 Βέβαια, αυτό δεν είναι στην πραγματικότητα μια αδυναμία του ίδιου του Unicode, αλλά απλώς αποκαλύπτει κενά της τεχνολογίας απόδοσης και των γραμματοσειρών. Χρήση του Unicode Λειτουργικά συστήαατα Παρά τα τεχνικά προβλήματα τους περιορισμούς και την κριτική στη πορεία,το Unicode έχει επικρατήσει σαν το κυρίαρχο σχήμα κωδικοποίησης χαρακτήρων. Τα Windows NT και οι απόγονοί του Windows 2000 και Windows ΧΡ κάνουν εκτεταμένη χρήση του σχήματος κωδικοποίησης UTF-16 για εσωτερική αναπαράσταση κειμένου. UNIX λειτουργικά συστήματα όπως GNU/Linux, Plan 9 από Bell Labs, BSD και Mac OS X έχουν υιοθετήσει το σχήμα UTF-8, σαν τη βάση για την αναπαράσταση πολυγλωσσικό κείμενο.

Ηλ κτρονΐ)αι αλληλογραφία Το πρότυπο ΜΙΜΕ ορίζει δυο διαφορετικούς μηχανισμούς για κωδικοποίηση όχι-ascii χαρακτήρων στα μηνύματα ηλεκτρονικής αλληλογραφίας, e-mails, ανάλογα με το αν οι χαρακτήρες είναι στις επικεφαλίδες του ηλ. μηνύματος όπως πχ η επικεφαλίδα "Θέμα:" ή βρίσκονται στο κυρίως κείμενο του ηλεκτρονικού μηνύματος. Και στις δυο περιπτώσεις, προσδιορίζεται το αρχικό σύνολο χαρακτήρων καθώς και η κωδικοποίηση μεταφοράς. Για ηλεκτρονική αλληλογραφία με Unicode χαρακτήρες προτείνονται το σχήμα κωδικοποίησης UTF-8 και η κωδικοποίηση μεταφοράς Base64. Οι λεπτομέρειες των δύο μηχανισμών καθορίζονται στο πρότυπο ΜΙΜΕ και γενικά είναι κρυμμένοι από τον απλό χρήστη λογισμικού ηλ. αλληλογραφίας. Η υιοθέτηση του Unicode στην Ηλεκτρονική αλληλογραφία είναι πολύ αργή. Τα περισσότερα κείμενα στην ανατολική Ασία κωδικοποιούνται ακόμα σε τοπικές κωδικοποιήσεις όπως η Shift-JIS,Kai πολλά δημοφιλή προγράμματα ηλ. αλληλογραφίας ακόμα και αν έχουν κάποια Unicode υποστήριξη εντούτοις δεν μπορούν να χειριστούν Unicode δεδομένα σωστά. Η κατάσταση αυτή δεν προβλέπεται να αλλάξει το προσεχές μέλλον. Διαδίκτυο Οι καινούργιοι πλοηγοί διαδικτύου μπορούν και απεικονίζουν σωστά ιστοσελίδες με Unicode χαρακτήρες εφόσον έχει εγκατασταθεί η ανάλογη γραμματοσειρά. Παρόλο που συντακτικοί κανόνες μπορεί να επηρεάζουν την σειρά με την οποία οι χαρακτήρες επιτρέπεται να εμφανίζονται και η γλώσσα HTML 4.0 αλλά και η XML 1.0 εξ' ορισμού υποστηρίζουν έγγραφα που αποτελούνται από χαρακτήρες από όλο το εύρος των κωδικών σημείων του Unicode εξαιρούμενων μόνο κάποιων χαρακτήρων ελέγχου τα μόνιμα μη-διαθέσιμα κώδικά σημεία D800-DFFF, οποιοδήποτε κωδικό σημείο που τελειώνει σε FFFE or FFFF και οποιοδήποτε κωδικό σημείο πάνω από 10FFFF. Αυτοί οι χαρακτήρες παρουσιάζονται είτε απευθείας σαν bytes σύμφωνα με την κωδικοποίηση του εγγράφου, εφόσον υποστηρίζονται από την κωδικοποίηση, ή μπορούν να γραφτούν σαν αριθμητικές αναφορές χαρακτήρων βασισμένες στο κωδικό σημείο του Unicode χαρακτήρα, εφόσον η κωδικοποίηση που χρησιμοποιεί το έγγραφο επιτρέπει τα ψηφία και τα σύμβολα που χρειάζονται για να γράψουμε τις αναφορές(κάτι που συμβαίνει με όλες τις κωδικοποιήσεις που έχουν υιοθετηθεί στο διαδίκτυο). Γ οαααατοσειρές Ελεύθερες και εμπορεύσιμες γραμματοσειρές που βασίζονται στο Unicode πρότυπο είναι κοινές, με πρώτες τις TrueType και τώρα τις OpenType γραμματοσειρές που υποστηρίζουν και οι δύο Unicode απεικονίζοντας κώδικά σημεία σε συγκεκριμένες εμφανίσεις χαρακτήρων. Υπάρχουν χιλιάδες γραμματοσειρές στην αγορά, αλλά λιγότερες από δώδεκα προσπαθούν να υποστηρίξουν την πλειοψηφία του συνόλου χαρακτήρων του προτύπου Unicode. Αντίθετα οι βασισμένες στο Unicode γραμματοσειρές συνήθως υποστηρίζουν μόνο βασικό ASCII και κάποια συγκεκριμένα αλφάβητα. Αυτό γίνεται κυρίως για λόγους οικονομίας των δημιουργών γραμματοσειρών και απόδοσης των προγραμμάτων που μπορεί να γονατίσουν καθώς η απόδοση γραμματοσειρών είναι μια διαδικασία που καταναλώνει πολλούς πόρους ενός υπολογιστή.χαρακτήρες Unicode που δεν μπορούν να αποδοθούν γραφικά απεικονίζονται με ένα λευκό τετράγωνο.

Πίνακες Unicode που χρησιμοποιούνται από το λογισμικό Greek and Coptic 0 1 2 3 4 5 6 7 8 9 A Β C D Ε F 0370,. 0380 Ά 1 Μ 1 Ω 0 3 9 0 ΐ A B Γ Δ Ε Ζ Η Θ I Κ Λ Μ Ν Ξ Ο 03A O Π P Σ T Υ Φ X Ψ Ω ϊ Ϋ ά έ ή ί 0 3 B 0 V a fi Ϊ δ ε ί η θ ι κ λ Β V ί ρ 0 3 C 0 π σ τ υ ω ϊ ΰ ό ύ ώ fi ς S. X π 0 3 D 0 β a Y Ί Ϋ φ τα 2ί Q fi Q F h h 03E0 (Goi 9 m jiere) 03F0 X e c κ h 1^ 1 1 1 1F 1 Ρ 1F Greek Extended (precomposed polytonic Greek) 0 1 2 3 4 5 6 7 8 9 Α Β C D Ε F 1F00 ά ά α α α α ά ά Ά Α "Α "Α Ά Ά \ \ 1F10 έ έ έ ε έ έ Έ Έ Έ Έ Έ Έ 1F20 Π ή ή ή ή ή ή ή Ή Ή Ή Ή Ή Ή Ή Η 1F30 Τ Τ 1 1 Τ Ί. 1 Ί Λ Λ 1F40 Ό Ό Ό Ό 0 "Ο ό ό δ δ δ δ 1F50 ύ ύ ΰ ΰ ΰ ύ Ύ Ύ Ύ υ ύ Ύ 1F60 ώ ώ ώ ώ ώ ώ ω ώ Ώ Ώ "Ω Ώ Ώ Ώ Ώ Ώ η η 1F70 ά έ έ ί ό ό ύ ύ ώ ω 1F80 ά ά δ δ ό δ δ δ Α Ά Α "Α Α 'Α Ά Ά 1F90 Π ή Π ή ή ή ή ή Ή 'Η Ή ΤΗ Ή Ή Ή Ή ώ ώ ώ ώ ώ ώ Ω Ώ Ώ Ώ Ώ Ώ "Ω 1:2 1FA0 Φ Φ 1FB0 α α ά α ά α α Α Α Α Ά Α ι 1FC0 -!ΐ η ή ή Π Έ Έ Ή Ή Η " ϊ ΐ ϊ ϊ Ί 1 1FD0 ϊ 1FE0 ΰ ΰ ΰ Ϋ Ϋ Ύ Ύ ϋ Ρ Ρ 0 υ ρ 1FF0 Φ φ Φ ώ Φ Ό Ό Ώ Ώ Ω

3.1 Σχεδιασμός της βάσης δεδομένων Στο χαμηλότερο επίπεδο έχουμε την οντότητα θέμα (Stem), κάθε λέξη έχει ένα και μοναδικό θέμα. Αμέσως μετά βρίσκεται η οντότητα Βασική Φόρμα (BaseForm) η οποία περιέχει την λέξη στην πιο απλή μορφή της, δηλαδή χωρίς τονισμό(αρχαία/νέα), καθώς και το μέρος του λόγου στο οποίο αυτή ανήκει. Στην συνέχεια έχουμε την οντότητα Φόρμα (Form) η οποία απεικονίζει τη λέξη αυτή καθαυτή δηλαδή με τονισμό. Τέλος κάθε ένα από τα 4 μέρη του λόγου (Verb, Adverb, Noun, Adjective) αποτελεί μία οντότητα η οποία συνοδεύεται από τις ιδιότητες και τους μηχανισμούς της. Για παράδειγμα, το μέρος του λόγου ουσιαστικό αποτελεί μία οντότητα, και οι ιδιότητες και μηχανισμοί της, κωδικοποιημένοι, αντιστοιχούν στην καταγραφή της κλίσης (μηχανισμός : α' κλίση αρσενικού, κ.ο.κ), του γένους, της πτώσης (μηχανισμός: ονομαστική, κ.λ.π.) και του αριθμού. FI βάση σχεδιάστηκε με τον παραπάνω τρόπο λαμβάνοντας υπόψη τους παρακάτω περιορισμούς: 1. Πολλές λέξεις αντιστοιχούν σε διαφορετικούς τύπους του ίδιου μέρους του λόγου 2. Πολλές λέξεις αντιστοιχούν σε διαφορετικά μέρη του λόγου 3. Λέξεις από διαφορετικά μέρη του λόγου αν'τιστοιχούν στο ίδιο θέμα Με την παραπάνω σχεδίαση πετυχαίνουμε τα εξής: - Πολλές λέξεις μπορούν να έχουν το ίδιο θέμα αλλά κάθε λέξη αντιστοιχεί σε ένα θέμα. - Πολλές λέξεις μπορούν να έχουν πολλές βασικές φόρμες, δηλαδή πολλές λέξεις μπορούν να ανήκουν σε διαφορετικά μέρη του λόγου. - Μία λέξη μπορεί να αντιστοιχεί σε πολλές λέξεις του ίδιου μέρους του λόγου.

Μοντέλχ) οντοττίτων συσγετίσεων

Η δηαιουργία inc βάσης δεδοαενων σε Oracle SQL Plus Για την σωστή λειτουργία του λογισμικού απαιτείται μία βάση δεδομένων συμβατή με Unicode. Πίνακας Stem create table Stem(stem_code number,stem form varchar2(30) unique,primary key(stemcode)); Πίνακας BaseForm create table BaseForm(bform_code number,base varchar2(30),pos number,stem_code number,primary key(bform_code),foreign key(stem_code)references STEM); Πίνακας Form create table Form(form_code number,word varchar2(30),primary key(form_code)); Πίνακας form has base create table form_has_base(bform_code number, form_code number,primeuy key(bform_code,form_code),foreign key(bform code) references baseform,foreign key (form code) references form); Πίνακας Verb create table verb(form_code number,fwnh number,proswpo number,arithmos number,xronos number,eglish number,foreign key (form_code) references form); Πίνακας noun create table noun(form_code number,genos number,arithmos number,ptwsh number,foreign key (form code) references form); Πίνακας adjective create table adjective(form_code number,genos number,arithmos number,ptwsh number,bathmos number,foreign key (form_code) references form); Πίνακας adverb create table adverb(form_code number,foreign key (form code) references form); Εντολές διαγραφής της βάσης. drop table adverb; drop table adjective; drop table noun; drop table verb; drop table form has base; drop table form; drop table baseform; drop table stem;

3.2 Σχεδιασμός του Προγράμματος Στην συνέχεια κάθε οντότητα ή πίνακας της βάσης δεδομένων μετατράπηκε σε μία κλάση η οποία περιέχει και όλες τις ιδιότητες του, επίσης σχεδιάστηκαν μέθοδοι οι οποίες επιτρέπουν την πληκτρολόγηση Αρχαίων Unicode χαρακτήρων μέσω ενός συνηθισμένου πληκτρολογίου χρησιμοποιώντας κάποιους συνδυασμούς πλήκτρων (Βλ. Εγχειρίδιο χρήσης), και μέθοδοι οι οποίες επιτρέπουν την ανάγνωση από αρχεία παραδειγμάτων. (Τα παραδείγματα αποφασίστηκε να βρίσκονται σε αρχεία.txt σε συνεργασία με τον κ. Αλεβίζο.), Τέλος σχεδιάστηκαν μέθοδοι οι οποίες αναζητούν, εισάγουν, τροποποιούν, διαγράφουν και εμφανίζουν δεδομένα από την βάση δεδομένων. Ακολουθούν τα διαγράμματα ροής των μεθόδων καθώς και το διάγραμμα κλάσεων. Διάγραααα Pone Πληκτρολόγησης Unicode

AidYpauua Pofic Εαφάνιση Παραδειγαάτων Διάγραμρα Poiic Εαωάνισπ Λέ εων

Διάγραααα Poiic Εισαγωγή Λέ εων

Διάγραααα Poiic Τροποποίηση Λε εων

Αρχή ^

Διάνοαααα Κλήσεων

4. Εγχειρίδιο Χρήσης Το παρών λογισμικό είναι ένας μορφολογικός αναλυτής της νέας και της αρχαίας Ελληνικής γλώσσας και έχει τη δυνατότητα αναγνώρισης οποιασδήποτε νέας ή αρχαίας ελληνικής λέξης (ρήμα, ουσιαστικό, επίθετο, επίρρημα) καθώς και την κλίση αυτής όπου είναι δυνατό. Παρακάτω αναλύονται οι λειτουργίες του. Τρόπος Γραφής Αργαιοελληνακών Η πληκτρολόγηση αρχαιοελληνικών χαρακτήρων γίνεται με την πληκτρολόγηση συνδυασμών συμβόλων και νεοελληνικών χαρακτήρων έτσι ώστε να εμφανίζονται αρχαιοελληνικοί, οι συνδυασμοί φαίνονται στον παρακάτω πίνακα. (α/ά ά/ά )α/ά ά/ά ~α ά 'α ά _α/ά α /ά (~α ά ('α ά (_α/ά ά /α )~α ά )'α ά )_α/ά cd a '_α ά ~_α (~_α )~_α ά Πρέπει να σημειωθεί ότι δεν παίζει ρόλο η σειρά με την οποία πληκτρολογούμε τα σύμβολα, δηλαδή μπορούμε να έχουμε (~_α ή ~_( και το αποτέλεσμα θα είναι πάντα ά. Παοάδειγαα _ α ( ~ _ α ( 'α

ApyiKTi Οθόνη Με την εκχίνηση του προγράμματος βλέπουμε την παρακάτω οθόνη Παράθυρο Πληκτρολόγησης Λέξης: Εδώ πληκτρολογείται η προς αναζήτηση λέξη. Παράθυρο Εμφάνισης Λέξης μετά την Τροποποίηση: Εδώ εμφανίζεται η λέξη μετά την τροποποίηση από το λογισμικό δηλαδή μετά την αλλαγή των συνδυασμών συμβόλων σε αρχαίους χαρακτήρες. Button Λνάλυσης Λέξης: Εκκινεί τη διαδικασία ανάλυσης. Παράθυρο Εμφάνισης Λποτελεσμάτων: Εδώ εμφανίζονται όλα τα σχετικά αποτελέσματα. Μετά την ανάλυση της λέξης προκύπτουν 2 περιπτώσεις.

l.h λέ η βρέθηκε Αν θέλουμε να ξεκινήσουμε μία νέα αναζήτηση μπορούμε να επαναλάβουμε την αρχική διαδικασία, δηλαδή να πληκτρολογήσουμε νέα λέξη και να κάνουμε click στο button Ανάλυση, αλλιώς για να προβάλλουμε τα αποτελέσματα της αναζήτησης επιλέγουμε την λέξη που μας ενδιαφέρει από την λίστα και κάνουμε click στο Button OK.

Οθόνη αποτελεσαάτων Θέμα της Λέξης: Το θέμα της λέξης. Αποτελέσματα: Τα αποτελέσματα ανάλυσης και παραγωγής όλων των μορφών της λέξης. Button Εισαγωγής στη Βάση: Εισάγει στη βάση δεδομένων τυχόν τροποποιήσεις στ αποτελέσματα. Τα αποτελέσματα για κάθε λέξη είναι πλήρως τροποποιήσιμα, όλες οι αλλαγές αποθηκεύονται κάνοντας click στο Button εισαγωγής στη βάση.

2.Η Λέ η Δεν Βρέθηκε Λίστα Παραδειγμάτων: Λίστα από την οποία επιλέγουμε κάποιο παράδειγμα. Λέξη χωρίς κατάληξη: Λέξη πάνω στην οποία θα εφαρμοστεί το επιλεγμένο παράδειγμα. Θέμα: Το θέμα της λέξης. Αν δεν θέλουμε να χρησιμοποιήσουμε κάποιο παράδειγμα τότε κάνουμε απευθείας click στο Button OK, αλλιώς επιλέγουμε ένα παράδειγμα από την λίστα και στη συνέχεια κάνουμε click στο Button OK Λίστες Παοαδειγαάτων ταμιας

Ανάλογα με το μέρος του λόγου το οποίο επιλέγω, εμφανίζονται και τα αντίστοιχα παραδείγματα. Επιλέγοντας κάποιο παράδειγμα και κάνοντας click στο Button OK βλέπουμε την παρακάτω οθόνη.

Θέμα: To θέμα της λέξης generated από το λογισμικό. Αποτελέσματα: Τα αποτελέσματα της λέξης generated από το λογισμικό. Button Εισαγωγής στη βάση: Εισάγει τα δεδομένα στη βάση. Τα αποτελέσματα παράγονται από το λογισμικό σύμφωνα με το παράδειγμα, αυτό δεν τα καθιστά 100% ακριβή και γ αυτό συνίσταται πάντα ο έλεγχος και η διόρθωση τους όπου χρειάζεται. Τα αποτελέσματα για κάθε λέξη είναι πλήρως τροποποιήσιμα,όλα τα αποτελέσματα αποθηκεύονται κάνοντας click στο Button Εισαγωγής στη βάση. Σημειώσεις - Οποιαδήποτε στιγμή θελήσουμε να ξεκινήσουμε μία νέα αναζήτηση μπορούμε να επαναλάβουμε την αρχική διαδικασία, δηλαδή να πληκτρολογήσουμε νέα λέξη και να κάνουμε click στο button Ανάλυση. - Σε περίπτωση που κάποια λέξη έχει διπλή μορφή τότε αυτή εισάγεται με τον παρακάτω τρόπο. EVIK6C Πληθυντικός ΔυΙκός ί Ονομαστική πατίςας πατίρίς,7ΐατ 9άδ ς πατέρων ΐΓτΓή Αιτιατική πατ^α 'τζατέοες Κλητική ]πατ^α πατ 9 ς Δηλαδή διαχωρίζοντας τις δύο μορφές με ένα «,». -Η πληκτρολόγηση αρχαιοελληνικών χαρακτήρων μπορεί να εφαρμοστεί με τον τρόπο που περιγράφεται παραπάνω και στην περιοχή των αποτελεσμάτων. -Για κάθε εισαγωγή/τροποποίηση στην βάση δεδομένων εμφανίζονται τα κατάλληλα μηνύματα επιτυχίας/αποτυχίας.

Δομ,ή των αργείων παραδειγαάτων Παρακάτω παρουσιάζεται η δομή των αρχείων παραδειγμάτων έτσι ώστε να γίνει κατανοητός ο τρόπος με τον οποίο μπορούν προστεθούν περισσότερα. 1 -Αργείο Ουσιαστικών Κάθε παράδειγμα ξεκινά με τον χαρακτήρα «-», ακολουθεί το όνομα του παραδείγματος και τέλος ο αριθμός ο οποίος συμβολίζει το γένος του ουσιαστικού(1.αρσενικό,2.θηλυκό,3-ουδέτερο). πχ. -Πατέραςί Στη συνέχεια ανά γραμμή έχουμε τις καταλήξεις για κάθε πτώση(ον., Γεν., Δοτ., Αιτ., Κλητ.). Σε περίπτωση που κάποια μορφή του παραδείγματος απαιτεί την μεταφορά του τόνου τότε: -Αν ο τόνος μεταφέρεται, πριν από την κατάληξη βάζουμε τον αριθμό 1. πχ. 1ων (ταμιών). -Αν ο τόνος μεταφέρεται στη παραλήγουσα πριν από την κατάληξη βάζουμε τον αριθμό 2. πχ. 2ων (φυλάκων). Σε περίπτωση που κάποια μορφή δεν υπάρχει αφήνουμε μια κενή γραμμή. Το αρχείο τελειώνει με τον χαρακτήρα «-» και την λέξη Τέλος. 2.Αργείο Επιθέτων Κάθε παράδειγμα ξεκινά με τον χαρακτήρα «-», ακολουθεί το όνομα του παραδείγματος και τέλος ο αριθμός ο οποίος δηλώνει τον βαθμό του επιθέτου(1.θετικός, 2.Συγκριτικός, 3.Υπερθετικός).Πχ. -ος/η/ο1 Στη συνέχεια ανά γραμμή έχουμε τις καταλήξεις για κάθε πτώση(ον., Γεν., Δοτ., Αιτ., Κλητ.). πρώτα για το αρσενικό στη συνέχεια για το θηλυκό και τέλος για το ουδέτερο. Σε περίπτωση που κάποια μορφή του παραδείγματος απαιτεί την μεταφορά του τόνου τότε: -Αν ο τόνος μεταφέρεται, πριν από την κατάληξη βάζουμε τον αριθμό 1 όπως και παραπάνω. -Αν ο τόνος μεταφέρεται στη παραλήγουσα πριν από την κατάληξη βάζουμε τον αριθμό 2 όπως και παραπάνω. Σε περίπτωση που κάποια μορφή δεν υπάρχει αφήνουμε μια κενή γραμμή. Το αρχείο τελειώνει με τον χαρακτήρα «-» και την λέξη Τέλος.

3.Αογείο Ρπαάτων Κάθε παράδειγμα ξεκινά με τον χαρακτήρα «-», ακολουθεί το όνομα του παραδείγματος και τέλος χαρακτήρας «*». Στη συνέχεια ανά γραμμή έχουμε τις καταλήξεις ανά πρόσωπο χωρισμένες με τον χαρακτήρα «/» για κάθε έγκλιση (Οριστική/Υποτακτική/Απαρέμφατο/Μετοχή/Ευκτική). πχ. ω/ω//// για το ρήμα Δένω (εισάγονται μόνο Οριστική/υποτακτική.) Οι καταλήξεις είναι ανά γραμμή για κάθε χρόνο με την εξής σειρά Ενεστώτας, Παρατατικός, Αόριστος, Μέλλοντας, Εξ. Μέλλοντας, Παρακείμενος, Υπερσυντέλικος, Συντ. Μέλλοντας. Στην συνέχεια βρίσκονται οι καταλήξεις για την παθητική φωνή του ρήματος με το ιδίο τρόπο όπως και παραπάνω. Σε περίπτωση που κάποια μορφή του παραδείγματος απαιτεί την μεταφορά του τόνου τότε: -Αν ο τόνος μεταφέρεται, πριν από την κατάληξη βάζουμε τον αριθμό 1. πχ. 1ων (ταμιών). -Αν ο τόνος μεταφέρεται στη παραλήγουσα πριν από την κατάληξη βάζουμε τον αριθμό 2. πχ. 2ων (φυλάκων). Το αρχείο τελειώνει με τον χαρακτήρα «-» και την λέξη Τέλος.

5. Συμπεράσματα Η Ελληνική γλώσσα είναι μία από τις πιο δύσκολες γλώσσες στον κόσμο, η ίδια αυτή δυσκολία μεταφέρθηκε και στην δημιουργία του παρόντος λογισμικού. Λόγω των πολλών μορφολογικών ιδιαιτεροτήτων που έχει η ελληνική γλώσσα είναι φυσικά αδύνατο να δημιουργηθούν αλγόριθμοι που να ανταποκρίνονται με ακρίβεια σε όλες τις περιπτώσεις και υποπεριπτώσεις, αυτό σημαίνει ότι μελετήθηκαν και δημιουργήθηκαν αλγόριθμοι οι οποίοι είναι όσο το δυνατόν πιο λειτουργικοί και αξιόπιστοι, έχοντας πάντα ένα μικρό ποσοστό λάθους. Με βάση τη θέση από την οποία ερευνήθηκε το θέμα, κρίνεται σκόπιμο να σημειωθεί, ότι το λογισμικό είναι από τα πιο εξελίξιμα, αυτό συμβαίνει τόσο λόγω του απλού σχεδιασμού της βάσης δεδομένων που χρησιμοποιείται (και την επεκτασιμότητα της) όσο και για τον απλό σχεδιασμό των αλγορίθμων. Το παρών λογισμικό ασχολείται με τέσσερα από τα μέρη του λόγου της Ελληνικής γλώσσας, η προσθήκη και των υπολοίπων, λόγω του σχεδιασμού, είναι σχετικά απλή υπόθεση. Συμπερασματικά πρόκειται για ένα χρήσιμο και εύχρηστο λογισμικό το οποίο θέτει τις βάσεις για ακόμα περισσότερα πράγματα στον τομέα της γλωσσολογικής μορφολογίας και σε όσους τομείς αυτή βρίσκει εφαρμογή.

6. Βιβλιογραφία - Γραμματική της αρχαίας Ελληνικής Μ. Οικονόμου Νεοελληνική Γραμματική Μ. Τριανταφυλλίδη Εισαγωγή στα συστήματα Βάσεων δεδομένων C. J. Date Υλοποίηση Εφαρμογών με γλώσσα SQL Προγραμματισμός ΗΑ" με τη γλώσσα C-H- ( μέρος A )Θ. Αλεβίζος Προγραμματισμός W Y με τη γλώσσα C++ ( μέρος Β )Θ. Αλεβίζος Borland C++ Builder Documentation Σύγχρονα Αειτουργικά Συστήματα A.Tanenbaum: 7. Διευθύνσεις Internet - http;//el.wikipedia.org/wiki/unicode - http://www.eens-congress.eu - http://techpubs.borland.com/bcppbuilder/ - http://msdn.microsoft.com - http://www.tmssoflware.com/v2/tmsuni.asp - http://www.skillbuilders.com/tutorials- V2/SkillBuilders%20oracle%20Tutorials.cfm - http://www.orafaq.com/links/tutorials/