G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos



Σχετικά έγγραφα
ΚΟΡΑΗΣ: Έντυπο και Ηλεκτρονικό Ελληνο-Αγγλικό Λεξικό

ΠΕΡΙΛΗΨΗ. Είναι γνωστό άτι καθημερινά διακινούνται δεκάδες μηνύματα (E~mail) μέσω του διαδικτύου

Γλώσσα και Γλωσσική Τεχνολογία στην Ελλάδα

Τι είναι το αρχείο Γεωργακά;

Software Production Company

Π20: Ανακοινώσεις επιστηµονικών εργασιών σε συνέδρια/περιοδικά

Τη γλώσσα μου έδωσαν ellhnikh. Μαρία Γαβριηλίδου, ΙΕΛ/ΕΚ Αθηνά Παγκόσμια Ημέρα Μετάφρασης 29 Σεπτεμβρίου 2018, ΕΙΕ

ΓΛΩΣΣΑ & ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΤΗΝ ΚΥΠΡΟ

Η οικονομία της γνώσης και η απόδοση της καινοτομίας στην Ελλάδα

Keywords: Tutorials, pedagogic principles, print and digital distance learning materials, e-comet Laboratory of Hellenic Open University

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Κλεοπάτρα Φέρλα ΕΚΠΑ, 01/03/2019

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική»

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Δηµήτρης Παπαζαχαρίου

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

PUBLICATION. Participation of POLYTECH in the 10th Pan-Hellenic Conference on Informatics. April 15, Nafplio

Εθνικό σύστημα καινοτομίας και δικτύωση (clusters) επιχειρήσεων και οργανισμών

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Information Extraction

Πέργαµος: Το Σύστηµα Ψηφιακής Βιβλιοθήκης του Πανεπιστηµίου Αθηνών

Ο 19ος αιώνας Είδαμε ότι πρώτοι ιστορικο-συγκριτικοί επιστήμονες είχαν στόχο να εξηγήσουν τις ομοιότητες που παρατηρούσαν ανάμεσα στις γλώσσες. Είδαμε

Περιβαλλοντική Ρευστομηχανική

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Διονύσης Γούτσος ΕΚΠΑ, 01/03/2019

Συνάντηση Εργασίας για τις Ερευνητικές Υποδοµές, 21 Φεβρουαρίου 2013, Αθήνα

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

Ο Γενικός Γραμματέας Αποκεντρωμένης Διοίκησης Πελοποννήσου, Δυτικής Ελλάδας και Ιονίου Μανώλης Αγγελάκας,συμμετείχε στο συνέδριο με τίτλο «Καινοτομία

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΕΚΠΑΙΔΕΥΣΗ

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

Η ΣΥΜΒΟΛΗ ΤΩΝ ΓΟΝΕΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΗΣ ΜΑΘΗΣΗΣ: ΠΟΡΙΣΜΑΤΑ ΤΗΣ ΕΡΕΥΝΑΣ ΓΙΑ ΤΗΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΑΠΟΤΕΛΕΣΜΑΤΙΚΟΤΗΤΑ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet

4000 specialists, 600 local points, more than 50 countries in Europe and beyond

ΑΜΑΛΙΑ ΑΡΒΑΝΙΤΗ, University of California, San Diego (UCSD)

EBSCOhost Research Databases

Κώστας Γκόρτσος. Ειδικότητα Αρχιτέκτονας - Πολεοδόμος ΕΛΕ / Δ. Επικοινωνία Γραφείο 7.3, τηλ , kgortsos@ekke.gr,

ΕΠΙΠΤΩΣΕΙΣ ΤΗΣ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΑ ΠΡΟΪΟΝΤΑ, ΣΤΙΣ ΔΙΑΔΙΚΑΣΙΕΣ ΚΑΙ ΣΤΟ ΠΕΡΙΒΑΛΛΟΝ. Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΔΥΝΑΤΟΤΗΤΕΣ ΠΑΡΑΓΩΓΗΣ ΑΛΛΑΝΤΙΚΩΝ ΑΕΡΟΣ ΧΑΜΗΛΗΣ ΛΙΠΟΠΕΡΙΕΚΤΙΚΟΤΗΤΑΣ ΜΕ ΠΡΟΣΘΗΚΗ ΕΛΑΙΟΛΑΔΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΑΝΘΡΩΠΙΣΤΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΦΙΛΟΛΟΓΙΑΣ

Συνάντηση Εργασίας για τις Αρχαίες Ελληνικές Διαλέκτους

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Καλωσορίσατε στο Emphasys Centre!

Μαθαίνοντας µε την Τεχνολογία των Πολυµέσων Υπόσχεση ή Πραγµατικότητα;

Διασφάλιση Ποιότητας στην Ανώτατη Εκπαίδευση

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ ΑΘΗΝΑ Ε - ΜΑΙL : mkap@aueb.gr ΤΗΛ: , ΚΑΠΕΤΗΣ ΧΡΥΣΟΣΤΟΜΟΣ. Βιογραφικό Σημείωμα

Online Social Networks: Posts that can save lives. Dimitris Gritzalis, Sotiria Giannitsari, Dimitris Tsagkarakis, Despina Mentzelioti April 2016

Ερευνητικές Δραστηριότητες του Εργαστηρίου Δασικής Διαχειριστικής και Τηλεπισκόπησης

UNIVERSITY OF PATRAS. Πάτρα, 28 Ιουλίου 2011

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΠΟΛΥΜΕΣΩΝ

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

(clusters) clusters : clusters : clusters : 4. :

Η βιβλιοθήκη της Ι.Μ. Ευαγγελισμού της Θεοτόκου

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

INTERNSHIP THE PATRAS INNOHUB, May 15 th, INFITHEON Technologies & INFISENSIS Technologies

Το πρόγραμμα PETALL. Πανευρωπαϊκές Δραστηριότητες για την Εκμάθηση Γλωσσών Πρόταση διεξαγωγής σεμιναρίου σε εθνικό επίπεδο.

Υποβολή Προσφορών. Συνολική αξία περιλαμβανομένου του ΦΠΑ ( ) (1) (2) (3) (6) Όργανα μετρητικά γενικά 1 (Σταθερό αγωγιμόμετρο Φορητό αγωγιμόμετρο

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

Προϊόντα και υπηρεσίες συνθετικής φωνής

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

GREECE BULGARIA 6 th JOINT MONITORING

Επίδειξη της αποδοτικότητας των πόρων μέσω καινοτόμων, ολοκληρωμένων συστημάτων ανακύκλωσης απόβλητων για τις απομακρυσμένες περιοχές.

Η ΤΑΥΤΟΤΗΤΑ ΜΑΣ. Αναλαμβάνουμε τη μελέτη, εγκατάσταση και υποστήριξη όλων των τηλεπικοινωνιακών συστημάτων VοIP.

Εκτεταμένη περίληψη Περίληψη

«ΑΓΡΟΤΟΥΡΙΣΜΟΣ ΚΑΙ ΤΟΠΙΚΗ ΑΝΑΠΤΥΞΗ: Ο ΡΟΛΟΣ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΩΝ ΓΥΝΑΙΚΕΙΩΝ ΣΥΝΕΤΑΙΡΙΣΜΩΝ»

ΕΠΑΝΑΛΗΨΗ ΨΕΥΔΟΛΕΞΕΩΝ ΑΠΟ ΠΑΙΔΙΑ ΜΕ ΕΙΔΙΚΗ ΓΛΩΣΣΙΚΗ ΔΙΑΤΑΡΑΧΗ ΚΑΙ ΠΑΙΔΙΑ ΤΥΠΙΚΗΣ ΑΝΑΠΤΥΞΗΣ

Ερευνητικό Πρόγραµµα BalkaNet

3/6/2015. Τιτίκα Δημητρούλια Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

ΣΟΦΟΚΛΗΣ ΣΚΟΥΛΤΣΟΣ. Σεπτέμβριος 2007 Σήμερα Υποψήφιος Διδάκτορας στο γνωστικό πεδίο του Τουρισμού

Οδηγίες Συγγραφής και Μορφοποίησης Κειμένου

Ερευνητικές Υποδομές: η παρούσα κατάσταση και οι προοπτικές στον ΟΡΙΖΟΝΤΑ 2020

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Εθνικές Γλώσσες και Πολυγλωσσία

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. Προσωπικά Στοιχεία. Επώνυμο: Μέμος. Όνομα: Κωνσταντίνος

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΤΗΛΕΠΙΣΚΟΠΗΣΗ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΓΕΩΛΟΓΙΑ

Προγράμματα για τη δημιουργία και διαχείριση θησαυρού

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Συστήματα πανταχού παρόντος υπολογιστή σε περιβάλλοντα υβριδικών βιβλιοθηκών

ΗΧΗΤΙΚΕΣ ΕΓΚΑΤΑΣΤΑΣΕΙΣ

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Linked Heritage Kick-off meeting Rome, 29/4/2011

Αξιολόγηση της ερευνητικής δραστηριότητας των Ελληνικών Πανεπιστημιακών Τμημάτων με τη χρήση βιβλιομετρικών δεικτών

Αξιοποίηση και διάθεση ελληνικού ψηφιακού έγκριτου περιεχομένου

Η ΔΙΑΣΤΡΕΥΛΩΣΗ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΜΕΣΩ ΤΩΝ SOCIAL MEDIA ΤΗΝ ΤΕΛΕΥΤΑΙΑ ΠΕΝΤΑΕΤΙΑ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΗΣ ΑΝΑΣΤΑΣΙΑΣ-ΜΑΡΙΝΑΣ ΔΑΦΝΗ

ΕΙΣΑΓΩΓΗ ΧΡΗΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΣΤΟΝ ΠΡΩΤΟΓΕΝΗ ΤΟΜΕΑ ΤΗΣ ΝΗΣΟΥ ΛΕΣΒΟΥ

ΔΘΝΗΚΖ ΥΟΛΖ ΓΖΜΟΗΑ ΓΗΟΗΚΖΖ ΚΑ ΔΚΠΑΙΓΔΤΣΙΚΗ ΔΙΡΑ ΣΔΛΗΚΖ ΔΡΓΑΗΑ

ΚΑΤΑΡΤΙΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΟΡΟΛΟΓΙΚΩΝ ΠΟΡΩΝ COMPILATION AND MANAGEMENT OF TERMINOLOGICAL RESOURCES

Τα Ανοικτά Δεδομένα είναι αναγκαία συνθήκη για διαφάνεια, καινοτομία επιχειρηματικότητα. Είναι όμως και ικανή; (Πρέπει και Αρκεί)

M O. ΔΙ.Π. ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΡΗΤΗΣ

IBM Surveillance Insight for Financial Services on Cloud

Αποτελέσματα Έργου EUfolio

Ποιος φοβάται το ψηφιακό περιεχόμενο στη Νεοελληνική Φιλολογία;

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Εφαρμογές των Η/Υ στη διδασκαλία της ξένης γλώσσας. Γεώργιος Μικρός Πανεπιστήμιο Αθηνών

ΔΕΛΤΙΟ ΤΥΠΟΥ. Οργάνωση Study Visit στο πλαίσιο του έργου ClusterPoliSEE στην Αθήνα Απριλίου 2013

Transcript:

ΑΝΑΠΤΥΞΗ ΗΛΕΚΤΡΟΝΙΚΩΝ ΛΕΞΙΚΩΝ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΠΕΡΙΛΗΨΗ Γ. Κοκκινάκης, Ε. Δερματάς, Ε. Κουτσογεωργοπούλου Η ομάδα γλωσσικής τεχνολογίας του ΕΕΤ ανέπτυξε πρόσφατα τρία ηλεκτρονικά λεξικά της Ελληνικής γλώσσας στα πλαίσια των Ευρωπαικών προγραμμάτων SOCRATES/LINGUA και του προγράμματος ΕΠΕΤ ΙΙ «Γλωσσικής Τεχνολογίας» της ΓΓΕΤ. Ηλεκτρονικό λεξικό προφοράς και χρήσης της σύγχρονης Ελληνικής Γλώσσας για Ξένους. Ηλεκτρονικό Λεξικό προφοράς και χρήσης της Ελληνικής (Γραικανικής) διαλέκτου της Νότιας Ιταλίας. ΚΟΡΑΗΣ: Καινοτόμο Ελληνο-Αγγλικό Ηλεκτρονικό λεξικό 100.000 λημμάτων. Η ανάπτυξη των ανωτέρω λεξικών στηρίχθηκε στην λεξικογραφική υποδομή του ΕΕΤ που έχει δημιουργηθεί τα τελευταία 10 χρόνια και περιλαμβάνει: Ηλεκτρονικά κείμενα και ηχογραφήσεις προφορικού λόγου, λογισμικό επεξεργασίας ηλεκτρονικών κειμένων φυσικής γλώσσας, βάσεις ηλεκτρονικών λεξικών. DEVELOPMENT OF ELECTRONIC DICTIONARIES OF THE GREEK LANGUAGE G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos SUMMARY The Speech & Language Technology group of the Wire Communcations Laboratory (WCL) recently developed three electronic dictionaries of the Greek Language within the framework of the European programmes SOCRATES /LINGUA and the programme Language Technology of the Greek General Secretariat of Research and Technology: Electronic Dictionary of Pronunciation and Usage of the Modern Greek Language Electronic Dictionary of Pronunciation and Usage of the Graecanic Dialect of South Italy ΚΟΡΑIS Innovative Greek-English Electronic Dictionary of 100.000 Lemmas The development of the above dictionaries was based on the lexicographic infrastructure of WCL which has been created in the last ten years and consists of electronic corpora, speech databases, databases of electronic dictionaries and software for the processing of large corpora. The above dictionaries have a series of innovative features which greatly facilitate their use. 243

1 ΕΙΣΑΓΩΓΗ Το εργαστήριο Ενσύρματης Τηλεπικοινωνίας (ΕΕΤ) του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών του Πανεπιστημίου Πατρών, εργάζεται από ετών στην περιοχή Γλωσσικής Τεχνολογίας (Επεξεργασία Ομιλίας και Φυσικής Γλώσσας) με οργανωμένες ερευνητικές ομάδες, παράλληλα με τη δραστηριότητά του στις περιοχές Τηλεπικοινωνιών και Τεχνολογίας Ήχου. Στο διάστημα των τελευταίων έξι ετών, η ομάδα ηλεκτρονικής λεξικογραφίας του ΕΕΤ, σε συνεργασία με εξωτερικούς ειδικούς επιστήμονες στην Ελλάδα, Αγγλία και Ιταλία, ανέπτυξε τρία ηλεκτρονικά λεξικά της Ελληνικής γλώσσας για διάφορες χρήσεις. Στην συνέχεια δίνονται συνοπτικά στοιχεία για τα λεξικά αυτά. 2. ΗΛΕΚΤΡΟΝΙΚΑ ΛΕΞΙΚΑ Ηλεκτρονικό Λεξικό Προφοράς και Χρήσης της Σύγχρονης Ελληνικής Γλώσσας για Ξένους Αναπτύχθηκε στα πλαίσια του Ευρωπαϊκού προγράμματος SOCRATES/LINGUA 1995-1-GR-30 (1995-1997) σε συνεργασία με το εκπαιδευτικό κέντρο THE BRASSHOUSE CENTRE του Δήμου Birmingham (GB). 45.000 λήμματα + 10.000 παραδείγματα χρήσης. Ανάπτυξη με βάση τη συλλογή κειμένων του ΕΕΤ (Corpus based lexicography) και τις συμβουλές του Brasshouse. Φωνητική απόδοση των λημμάτων και μέρους των παραδειγμάτων (Ηχογραφήσεις). Φωνητική γραφή κάθε λήμματος (Διεθνές φων. αλφάβητο). Γραμματική κατηγορία με παραπομπή σε κλιτικό παράδειγμα. Πρόσβαση σε λήμμα από μορφή λήμματος. Πρόσβαση με ορθή και εσφαλμένη ορθογραφική γραφή λήμματος. Πρόσβαση με φωνητική γραφή (Παροχή εναλλακτικών ορθογραφικών μορφών από φωνητικό λεξικό). Αντίστροφο λεξικό (ταξινόμηση λημμάτων με βάση την κατάληξη). Πίνακες τοπονυμιών και ονομάτων. 244

Ηλεκτρονικό Λεξικό της Ελληνικής (Γραικανικής) Διαλέκτου της Νότιας Ιταλίας Αναπτύχθηκε στα πλαίσια του Ευρωπαϊκού προγράμματος SOCRATES/LINGUA 96-06-MDD-013700 (1996-1998) σε συνεργασία με ειδικούς επιστήμονες στην Ελλάδα και Ιταλία (Δρ. Α. Μποτίνης, S. Minuto, A. Rocco, κ.ά.) 10.0000 περίπου λήμματα και παραδείγματα χρήσης με μετάφραση στα Ελληνικά και Ιταλικά και αντίστροφα (τρίγλωσσο λεξικό). Πολλαπλές ηχογραφήσεις κάθε λήμματος και μέρους των παραδειγμάτων σύμφωνα με τις τοπικές διαφορές προφοράς. Φωνητική γραφή κάθε λήμματος (Διεθνές φωνητικό αλφάβητο). Γραμματική κατηγορία και πληροφορίες σχετικές με το λήμμα (τόπος χρήσης) και τον ομιλητή (γένος, ηλικία, επάγγελμα, καταγωγή, κλπ). Αξιοποίηση υπάρχοντος υλικού (λεξικά, κείμενα, ηχογραφήσεις, κλπ). Ηχογραφήσεις επί τόπου. Χρήση λεξικού όπως στο ηλεκτρονικό λεξικό για ξένους (πρόσβαση, κλπ). ΚΟΡΑΗΣ - Καινότομο Έλληνο-Αγγλικό Ηλεκτρονικό Λεξικό 100.000 Λημμάτων Αναπτύχθηκε στα πλαίσια του προγράμματος «Γλωσσική Τεχνολογία» της ΓΓΕΤ 98 ΓΤ 45 (2000-2001) σε συνεργασία με ειδικούς λεξικογράφους και μεταφραστές. Ηχητική απόδοση της προφοράς (Ελληνικής και Αγγλικής) κάθε λήμματος από ενταμιευμένη ηχογράφηση Μετατροπή οποιασδήποτε πληκτρολογούμενης λέξης ή πρότασης της ελληνικής από την ορθογραφική της μορφή (η οποία μπορεί να είναι και λανθασμένη) στην αντίστοιχη φωνητική μορφή (IPA). Μετατροπή οποιουδήποτε λήμματος του λεξικού από την πληκτρολογούμενη φωνητική του μορφή (η οποία μπορεί να είναι και λανθασμένη) στην αντίστοιχη ή αντίστοιχες ορθογραφικές μορφές (προσδιορισμός ομοήχων) Εντοπισμός του λήμματος από οποιονδήποτε πληκτρολογούμενο τύπο του μέσω μορφολογικού αναλυτή (π.χ. από τον τύπο «είδες», εντοπισμός του λήμματος «βλέπω» και εμφάνιση στην οθόνη όλης της κλίσης του λήμματος). 245

3. ΑΝΑΠΤΥΞΗ ΤΩΝ ΛΕΞΙΚΩΝ Η ανάπτυξη των ανωτέρω λεξικών στηρίχθηκε στην λεξικογραφική υποδομή του ΕΕΤ που έχει δημιουργηθεί τα τελευταία 10 χρόνια και περιλαμβάνει: Ηλεκτρονικά κείμενα και ηχογραφήσεις προφορικού λόγου: 1. Συλλογή ηλεκτρονικών κειμένων 50 εκατομμυρίων λέξεων 2. Ηλεκτρονικό κείμενο 310.000 λέξεων με λεπτομερή γραμματική ανάλυση 3. Βάσεις δεδομένων προφορικού λόγου (SAM, POLYGLOT, SIEMENS) Λογισμικό επεξεργασίας ηλεκτρονικών κειμένων φυσικής γλώσσας: 1. Λεξικογραφική επεξεργασία των κειμένων σε πραγματικό χρόνο 2. Σύστημα αυτόματης γραμματικής ανάλυσης 3. Σύστημα αυτόματης μετατροπής κειμένου από ορθογραφική σε φωνητική γραφή και αντίστροφα Βάσεις ηλεκτρονικών λεξικών 1. Ορθογραφικό λεξικό 100.000 λημμάτων με παραδείγματα χρήσεως 2. Λεξικό 1.5 εκατομμυρίων κυρίων ονομάτων σε ορθογραφική και φωνητική γραφή Τα ανωτέρω λεξικά παρουσιάζουν μια σειρά καινοτομιών, οι οποίες διευκολύνουν σημαντικά τον χρήστη. ΒΙΒΛΙΟΓΡΑΦΙΑ [1] Dermatas E. and Kokkinakis G., "Lexithiras: Multilingual Corpus Based Lexicography On PCs", Language Engineering on the Information Highway, Santorini, Greece, 26-30, Sept. 1994 [2] Γ. Κοκκινάκης, «Γλωσσική Τεχνολογία: Ερευνητικά αποτελέσματα από τη συμμετοχή του Εργαστηρίου Ενσύρματης Τηλεπικοινωνίας του Πανεπιστημίου Πατρών σε Ευρωπαϊκά προγράμματα την τελευταία δεκαετία». Καινοτομία, Έρευνα και Τεχνολογία, Τεύχος 5, Ιαν-Μαρτ. 1997. [3] Koutsogeogopoulos E., Giouli P., Dermatas E. and G. Kokkinakis, "Developing of Electroning Dictionaries of the Greek Language", 19 th International Conference for the Greek Language, Aristotele University of Thessaloniki, Sept. 1998. 246

[4] Kokkinakis G. and Dermatas E., "Α web-lab for demonstrating and experimenting with speech & language technology", ESCA Workshop, 1998 [5] Dermatas E. and Kokkinakis G., "LEXITHIRAS: Corpus Based Lexicography on PCs", TSD 98, Text, Speech, Dialogue, Brno, Czech Republic, 15-20, Sep. 1998 [6] G. Kokkinakis, H. Coutsogeorgopoulos, E. Dermatas, G. Kaitsas, Electronic Dictionary of Pronunciation and Usage of the Graecanic Dialect of Southern Italy, LREC-2000, Athens, 31 May-1June, 2000 [7] H. Coutsogeorgopoulos, E. Dermatas, G. Kokkinakis, "A Monolingual Electronic Dictionary For The Pronunciation And Usage Of Modern Greek For Foreigners", COMLEX 2000, Pyrgos, Greece, 83-88, 21-22 Sept. 2000 [8] H. Coutsogeorgopoulos, G. Kokkinakis, E. Dermatas, "KORAIS: A Large Electronic Greek-English Dictionary With Spoken Pronunciation, COMLEX 2000, Pyrgos, Greece, 127-130, 21-22 Sept. 2000 [9] George Kaitsas, Helen Coutsogeorgopoulos, Evangelos Dermatas, George Kokkinakis, "Pronunciation and Usage of the Graecanic Dialect of Southern Italy on CDROM and Web", COMLEX 2000, Pyrgos, Greece, 35-140, 21-22 Sept. 2000, [10] Ε. Δερματάς και Γ. Κοκκινάκης, Στατιστικά Εργαλεία Εντοπισμού και Εξαγωγής Λεξικογραφικής Πληροφορίας από Ηλεκτρονικά κείμενα πολύ μεγάλου μεγέθους για Μονόγλωσσα Λεξικά - Μετρήσεις Απόδοσης στην Ελληνική Γλώσσα, 22 International Conference for the Greek Language, Aristotele University of Thessaloniki, Apr. 2001 [11] George Kokkinakis, Electronic Dictionaries Integrating Multimedia and Speech Language Technologies, SPECOM 2001, Moscow, 27-28 Oct. 2001, (to be presented). Γ. Κοκκινάκης, Ε. Δερματάς, Ε. Κουτσογεωργοπούλου Εργαστήριο Ενσύρματης Τηλεπικοινωνίας (ΕΕΤ) Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Πανεπιστήμιο Πάτρας e-mail: gkokkin@wcl.ee.upatras.gr 247