ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΟΛΥΓΛΩΣΣΗΣ ΟΡΟΛΟΓΙΚΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΟΝ ΓΝΩΣΤΙΚΟ ΤΟΜΕΑ ΤΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΓΛΩΣΣΟΛΟΓΙΑΣ



Σχετικά έγγραφα
Ασφάλεια σε χώρους αναψυχής: Ένα σύστημα από έξυπνα αντικείμενα

Η Επιτροπή ΤΕ 21 και το έργο της

ΚΑΤΑΡΤΙΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΟΡΟΛΟΓΙΚΩΝ ΠΟΡΩΝ COMPILATION AND MANAGEMENT OF TERMINOLOGICAL RESOURCES

Προγράμματα για τη δημιουργία και διαχείριση θησαυρού

G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

Αυτοματοποιημένη χαρτογραφία

Ζητήματα Τυποποίησης στην Ορολογία - ο ρόλος και οι δράσεις της Επιτροπής Ορολογίας ΤΕ21 του ΕΛΟΤ


Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

ΘΕΜΑΤΙΚΗ ΕΥΡΕΤΗΡΙΑΣΗ ΚΑΙ ΚΑΘΙΕΡΩΣΗ ΟΡΟΛΟΓΙΑΣ ΣΤΙΣ ΤΕΧΝΙΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ: Η ΕΜΠΕΙΡΙΑ ΣΤΟ ΤΕΕ

Η τυποποίηση στην περιγραφή και διαχείριση των αρχείων και η συμβολή του ISOκαι του ΕΛΟΤ

Διαχείριση Πολιτισμικών Δεδομένων

«Ωρίων»: Online Πρόγραμμα Πληροφοριακού Γραμματισμού

Information Technology for Business

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Παρουσίαση του Ελληνικού Θησαυρού Επιστημονικών Όρων

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Μονάδα Διασφάλισης Ποιότητας. ΜΟΔΙΠ Πανεπιστημίου Δυτικής Μακεδονίας. Κωδικός Πράξης ΟΠΣ: Επιχειρησιακό Πρόγραμμα:

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

Συνεργασία για την Ευρωπαϊκή Ορολογία. Κέρκυρα, Πέμπτη , Ροδόλφος Μασλίας, Στέλλα Τσομπάνου, Όλγα Βαμβακά, Γιάννης Μπέρσος

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας

Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α

Από τις Βάσεις Ορολογίας στις Βάσεις Γνώσης: Το Παράδειγµα του Συστήµατος ιαχείρισης Ορολογίας της Εγνατία Οδός Α.Ε. (Οδο-λέξις)

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

Θεόδωρος Βυζάς Ελευθερία Δογορίτη ΤΕΙ ΗΠΕΙΡΟΥ

24 Αξιοποιώντας τις σχεσιακές βάσεις δεδομένων για την ανάπτυξη ορολογικών βάσεων γνώσης

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

ορολογίας στο έργο του ελληνόφωνου νομικού Παναγιώτης Γ. Κριμπάς Επίκουρος Καθηγητής Ορολογίας και Μετάφρασης (Δ.Π.Θ.) Δικηγόρος (Δ.Σ.Α.

ΕΘΝΙΚΟ ΠΡΟΓΡΑΜΜΑ ΟΡΟΛΟΓΙΚΟΥ ΣΥΝΤΟΝΙΣΜΟΥ (ΕΠΟΣ): ΣΤΡΑΤΗΓΙΚΗ ΜΕΛΕΤΗ, ΜΕΘΟΔΟΛΟΓΙΑ ΚΑΙ ΣΤΟΧΟΙ. Γεώργιος Καραγιάννης

Database System Concepts and Architecture (Αρχιτεκτονική, οµές, και Μοντέλα)

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

Γλώσσα και Γλωσσική Τεχνολογία στην Ελλάδα

ΜΑΘΗΜΑ 3 MULTIPLE CHOICE

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Προσδιορισμός Σημαντικών Χαρακτηριστικών της Αυθόρμητης Δραστηριότητας Απομονωμένου Εγκεφαλικού Φλοιού in vitro

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

Αναφορά εκτέλεσης εργασιών

Ερευνητικό Πρόγραµµα BalkaNet

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

Computer & Applied Sciences Complete ΟΔΗΓΟΣ ΧΡΗΣΗΣ

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ Εργ. Συστημάτων Βάσεων Γνώσεων & Δεδομένων CONTEXT AWARE ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΕΙΣΑΓΩΓΙΚΟ ΣΗΜΕΙΩΜΑ

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

Ψηφίδες για τη Νεοελληνική Γλώσσα

Η παρούσα ανακοίνωση εντάσσεται στο πλαίσιο μίας ευρύτερης μελέτης (διδακτορική διατριβή) με θέμα: Η ορολογία των φυσικών κινδύνων από την σκοπιά της

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

EBSCOhost Research Databases

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 10 ΔΗΜΙΟΥΡΓΙΑ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΓΕΩΒΑΣΕΩΝ

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Προγραμματισμός διαδικτυακών εφαρμογών με PHP

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Τίτλος. Πτυχιακή Εργασία. Φοιτήτρια 1: Ελευθερία Καραντζά ΑΜ: Φοιτήτρια 2:Μαρία Παπαγρηγορίου ΑΜ: Επιβλέπων Καθηγητής

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ

Σχεδιασµός Ανάπτυξη Οντολογίας

Επιχειρησιακό Πρόγραμμα «Ανταγωνιστικότητα και Επιχειρηματικότητα» Δράση Εθνικής Εμβέλειας «Συνεργασία» «Γεώκλιμα»

Information Technology for Business

Εισαγωγή στην Πληροφορική

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Προπτυχιακό ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ GD2690

Μετάφραση Ειδικών Κειμένων Ι

ΕΘΝΙΚΗ ΣΧΟΛΗ ΔΗΜΟΣΙΑΣ ΔΙΟΙΚΗΣΗΣ ΙΓ' ΕΚΠΑΙΔΕΥΤΙΚΗ ΣΕΙΡΑ

Ψηφιοποίηση και ψηφιακή επεξεργασία εικόνας

Τη γλώσσα μου έδωσαν ellhnikh. Μαρία Γαβριηλίδου, ΙΕΛ/ΕΚ Αθηνά Παγκόσμια Ημέρα Μετάφρασης 29 Σεπτεμβρίου 2018, ΕΙΕ

Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α

ΑΚΑΔΗΜΙΑ ΠΛΑΤΩΝΟΣ ΑΝΑΠΤΥΞΗ ΤΗΣ ΓΝΩΣΗΣ ΚΑΙ ΚΑΙΝΟΤΟΜΩΝ ΙΔΕΩΝ

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

προετοιμασίας και του σχεδιασμού) αρχικά στάδια (της αντιμετώπισή τους. προβλήματος της ΔΕ Ειρήνη Γεωργιάδη Καθηγήτρια Σύμβουλος της ΕΚΠ65 του ΕΑΠ

ΚΑΤΑΛΟΓΟΣ ΕΚΠΑΙΔΕΥΣΗΣ

8ο Πανελλήνιο Συμποσιο Ωκεανογραφίας & Αλιείας 637

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.)

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

(econtent Localisation Resources for Translator Training)

Κύρια σημεία. Μεθοδολογικές εργασίες. Άρθρα Εφαρμογών. Notes - Letters to the Editor. Εργασίες στη Στατιστική Μεθοδολογία

Test Data Management in Practice

Αρχιτεκτονική του πληροφοριακού συστήµατος Cardisoft Γραµµατεία 2003 ιαχείριση Προσωπικού

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

Επιμορφωτικό Σεμινάριο Διδάσκοντας σε πολύγλωσση τάξη: θεωρητικά ζητήματα και πρακτικές εφαρμογές

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΩΝ

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

e-εκπαιδευτησ Περίληψη Η παρούσα εισήγηση αφορά την παρουσίαση του εκπαιδευτικού λογισμικού με τίτλο

ΑΚΑΔΗΜΙΑ ΕΜΠΟΡΙΚΟΥ ΝΑΥΤΙΚΟΥ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΚΒΑΝΤΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Μαρίνα Ματθαιουδάκη. Περίληψη

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Διαχείρισης Βάσεων Δεδομένων

Κεφάλαιο 7: Τεχνολογία Λογισμικού

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης

Διαδανεισμός, Πρωτόκολλο z39.50 Στρατηγικές αναζήτησης

ΚΡΑΤΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΡΙΟΥΠΟΛΗΣ (ΟΥΚΡΑΝΙΑ) Διεθνής Ημερίδα ΟΡΟΛΟΓΙΑ ΚΑΙ ΜΕΤΑΦΡΑΣΗ 22 Απριλίου 2016 ΡΟΔΟΛΦΟΣ ΜΑΣΛΙΑΣ

Εισαγωγή στα Πληροφοριακά Συστήματα. Ενότητα 11: Αρχιτεκτονική Cloud

«Η ελληνική γλώσσα στην ανώτατη. και στην τεχνολογία Εθνική και διεθνής διάσταση» Άννα Αναστασιάδη-Συμεωνίδη

Transcript:

1 ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΟΛΥΓΛΩΣΣΗΣ ΟΡΟΛΟΓΙΚΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΟΝ ΓΝΩΣΤΙΚΟ ΤΟΜΕΑ ΤΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΓΛΩΣΣΟΛΟΓΙΑΣ Άλκηστις Χιδίρογλου, Παναγιώτης Αρβανίτης, Παναγιώτης Παναγιωτίδης ΠΕΡΙΛΗΨΗ Η ανακοίνωση αυτή έχει στόχο να περιγράψει τον σχεδιασμό και την δημιουργία ενός πολύγλωσσου λεξικού όρων που αναφέρονται στο γνωστικό πεδίο της γενικής και εφαρμοσμένης γλωσσολογίας. Ειδικότερα αναλύονται οι βασικές μεθοδολογικές αρχές που εφαρμόσθηκαν, περιγράφεται η ορολογική βάση δεδομένων που δημιουργήθηκε για την συλλογή και επεξεργασία των γλωσσολογικών όρων και αναλύονται ζητήματα σχετικά με την επιλογή τους, την σημασιολογική τους επεξεργασία και την τυποποίησή τους. Περιγράφεται επίσης ο σχεδιασμός των οθονών διεπαφής (interfaces) χρήστη - Βάσης Δεδομένων και οι τρόποι πρόσβασης των χρηστών σ αυτήν, εφόσον απώτερος στόχος είναι η δημιουργία ενός πλήρους ηλεκτρονικού περιβάλλοντος αναζήτησης, επισήμανσης και ανάκτησης γλωσσολογικών όρων για το διαδίκτυο. Η ανακοίνωση συνοδεύεται από παρουσίαση της Βάσης σε υπολογιστή. DESIGN AND DEVELOPMENT OF A MULTILINGUAL TERMINOLOGICAL DATABASE FOR THE SUBJECT FIELD OF APPLIED LINGUISTICS Άλκηστις Χιδίρογλου, Παναγιώτης Αρβανίτης, Παναγιώτης Παναγιωτίδης SUMMARY This paper focuses on the planning and the creation of a multilingual terminoly database that refers to the cognitive field of applied linguistics. More specifically, we analyze the methodological approaches and principles that were used, we describe the database which was created for the collection and processing of the linguistic terms and finally we analyze questions regarding their choice, their semantic processing and their standardization. Furthermore, the planning of user interfaces is described as well as the different users access ways since the ultimate goal is the creation of a complete electronic environment of searching and retrieving in the Internet. The paper is accompanied by an electronic presentation.

2 0. ΕΙΣΑΓΩΓΗ Σε ένα κοινωνικό περιβάλλον που γίνεται ολοένα και περισσότερο πολύγλωσσο, έχει διαπιστωθεί από καιρό η ανάγκη για την οργανωμένη ανάπτυξη της ελληνικής ορολογίας [1]. Έτσι έχει διαφανεί πως απαιτείται συντονισμός σε πολλά επίπεδα και ένωση δυνάμεων όχι μόνο για την παραγωγή όρων, τον έλεγχο ποιότητας, την πιστοποίηση και την διάδοσή τους, αλλά και για την δημιουργία μιας ισχυρής ηλεκτρονικής υποδομής, με δημιουργία ειδικευμένων ορολογικών βάσεων δεδομένων, ειδικευμένων λεξικών υπό μορφή CD-ROM καθώς και ορολογικών θησαυρών. Ένα επιστημονικό πεδίο που παρά την εξέλιξη που γνωρίζει τα τελευταία χρόνια έχει λίγα σημεία ηλεκτρονικής αναφοράς και πρόσβασης για την ανεύρεση όρων που θα διευκόλυναν τόσο τους απλούς χρήστες όσο και τους φοιτητές και τους επιστήμονες του χώρου είναι αυτό της Θεωρητικής και της Εφαρμοσμένης Γλωσσολογίας. Με έναυσμα την σκέψη αυτή, η παρούσα ανακοίνωση δεν θα ασχοληθεί με γενικές θεωρητικές αρχές της Ορολογίας αλλά θα επικεντρωθεί στα προβλήματα που προέκυψαν κατά τον σχεδιασμό και την κατασκευή μιας πολύγλωσσης ορολογικής βάσης δεδομένων για τα παραπάνω γνωστικά πεδία. 1. ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΟΡΟΛΟΓΙΑ Όπως είναι γνωστό η τεχνολογία των Βάσεων Δεδομένων προσφέρει πάρα πολλά τόσο στο χώρο της λεξικογραφίας όσο και σ αυτόν της ορολογίας, παρέχοντας συστήματα που επιτρέπουν την διαχείριση, αποθήκευση και αναζήτηση μεγάλου αριθμού γλωσσικών δεδομένων. Σήμερα αν και η ανάγκη εργαλείων διαχείρισης και αποθήκευσης γλωσσικών δεδομένων είναι αυταπόδεικτη και παρά τις τεράστιες συλλογές δεδομένων που βρίσκονται αποθηκευμένες (κυρίως μεγάλα τεχνικά και διοικητικά κείμενα, παράλληλα μονόγλωσσα ή πολύγλωσσα κείμενα, φωνητικά δεδομένα, φωνητικές καταγραφές, μορφολογικά και συντακτικά σχήματα, κλπ), παραμένουν εκκρεμή πολλά ζητήματα προς διερεύνηση και γίνεται επιτακτικότερη η αναζήτηση νέων μοντέλων Βάσεων Δεδομένων που θα ήταν γλωσσολογικά περισσότερο κατάλληλες και ευέλικτες. Για παράδειγμα οι πολύγλωσσες Λεξιλογικές και Ορολογικές Βάσεις Δεδομένων που συναντώνται στα Συστήματα υποβοηθούμενης από Μηχανή Μετάφρασης (machine-aided human translation - MAHT) συχνά δεν είναι τίποτε άλλο παρά τεράστιες συλλογές δίγλωσσων λεξικών που αποθηκεύονται με την μορφή πινάκων. Έτσι η ποιότητα της μετάφρασης στηρίζεται πρωτίστως στον όγκο των ειδικευμένων λεξικών που υποστηρίζουν το σύστημα, συνήθως

3 δεν ενσωματώνονται σ αυτό και συχνά δέχονται συγκρουόμενες μεταξύ τους μεταφράσεις όρων από εκατοντάδες διαφορετικούς μεταφραστές - χρήστες. Τα στηριζόμενα στο Σχεσιακό μοντέλο [2], συστήματα Διαχείρισης Βάσης Δεδομένων, που χρησιμοποιούνται ευρέως σήμερα, επιτρέπουν την αποθήκευση γλωσσικών δεδομένων σε αλληλοσυνδεόμενους μεταξύ τους δισδάστατους πίνακες χρησιμοποιώντας όμως τεράστια υπολογιστική ισχύ που καταναλώνεται για να δεικτοδοτεί λέξεις και όρους στους πίνακες αυτούς, να τις αναζητά και να τις ανακαλεί. Στην ανάγκη μείωσης του εύρους και της πολυπλοκότητας αυτής προσπάθησαν να απαντήσουν τα λεγόμενα "σημασιολογικά" μοντέλα Βάσεων Δεδομένων, τα οποία άρχισαν να αναπτύσσονται στις αρχές της δεκαετίας του '80, για να καθιερωθούν αργότερα ως "Αντικειμενοστρεφή Συστήματα Βάσεων Δεδομένων" (Object Oriented Database Management Systems - OODBMS) [2]. Στα συστήματα αυτά, τα διαφορετικού είδους δεδομένα αντιμετωπίζονται ως "αντικείμενα" (objects), με συγκεκριμένα χαρακτηριστικά, συγκεκριμένες ιδιότητες και συγκεκριμένες σχέσεις. Ωστόσο, φαίνεται ότι η ανάπτυξή τους περιορίζεται ακόμη, τόσο από την ύπαρξη διαφορετικών μεθοδολογικών προσεγγίσεων όσο και από την απουσία ισχυρών προτύπων [3]. 2. ΜΕΘΟΔΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ Η προσέγγιση που επιλέχθηκε για την παρούσα Βάση Δεδομένων είναι υβριδική. Για την καταγραφή και συγκέντρωση των όρων προτιμήθηκε ο εξαρχής σχεδιασμός ενός ενοποιημένου περιβάλλοντος διαχείρισης που υλοποιήθηκε σε ένα Σύστημα Σχεσιακής Βάσης Δεδομένων. Η προσπάθεια για την υλοποίηση μιας ορολογικής Βάσης Δεδομένων ξεκινά ήδη από μια αρχική επισήμανση που πρέπει να λαμβάνεται υπόψη κατά το στάδιο του σχεδιασμού της. Σύμφωνα με αυτήν οι ορολόγοι επιστήμονες ενδιαφέρονται πρωτίστως για την έννοια και την απόδοσή της ενώ οι λεξικογράφοι ξεκινούν από το λήμμα για να καταλήξουν στην έννοια. Ο σχεδιασμός μιας δίγλωσσης, πολύ δε περισσότερο πολύγλωσσης βάσης, αναδεικνύει ζητήματα που αναφέρονται τόσο στο είδος των γλωσσολογικών πληροφοριών που πρέπει να αποθηκευτούν (γραμματικο μορφοσυντακτικές), όσο και στον τρόπο με τον οποίο πρέπει αυτές οι πληροφορίες να καταγραφούν και να ταξινομηθούν. Ένα ακόμα σημαντικό ζήτημα που πρέπει να ληφθεί υπόψη είναι η αυστηρή τυποποίηση και κατηγοριοποίηση των συγκεντρωμένων δεδομένων, η εναρμόνισή τους -όσο είναι δυνατόν- με διεθνή πρότυπα,

4 έτσι ώστε να είναι δυνατή η μορφοποιημένη εξαγωγή τους και η ανταλλαγή τους με παρόμοια συστήματα. Για την αποφυγή μέρους των παραπάνω προβλημάτων η συγκέντρωση των όρων βασίστηκε αρχικά στην επισκόπηση υλικού το οποίο περιλαμβάνει την ελληνική και ξένη βιβλιογραφία ειδικών λεξικών του συγκεκριμένου γνωστικού πεδίου [4], με πρόθεση αυτή να επεκταθεί αργότερα σε ειδικά περιοδικά, πανεπιστημιακά εγχειρίδια, βιβλία [5], [6], πρακτικά συνεδρίων εφαρμοσμένης γλωσσολογίας, κ.ά. Κατά τον σχεδιασμό των πεδίων χρησιμοποιήθηκαν οι γενικές οδηγίες τυποποίησης για την ανάπτυξη μονόγλωσσών και πολύγλωσσων θησαυρών [7], [8], και λήφθηκαν εκτενώς υπόψη οι προτεινόμενες κατηγοριοποιήσεις των προτύπων OLIF [9], MARTIF [10]. Τα συγκεκριμένα πρότυπα προτείνουν ένα σύνολο γενικών και ειδικών κατηγοριών και ένα μεγάλο αριθμό επιμέρους χαρακτηριστικών. Απ αυτά επιλέχθηκαν περίπου 100 και όπου ήταν δυνατόν, η ονοματολογία τους κρατήθηκε ίδια για λόγους συμβατότητας. 3. ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Αναφέρθηκε προηγούμενα πως ο σχεδιασμός της παρούσας Βάσης Δεδομένων για την διαχείριση των ορολογικών δεδομένων έγινε χρησιμοποιώντας τις αρχές των Συστημάτων Σχεσιακών Βάσεων Δεδομένων. Τμήμα του αρχικού σχεδιασμού έγινε ακολουθώντας μια αντικειμενοστρεφή προσέγγιση, η έλλειψη όμως αυστηρής τυποποίησης σε περιβάλλοντα ανάπτυξης αντικειμενοστρεφών Βάσεων Δεδομένων, επέβαλλε την τελική υλοποίηση σε σχεσιακό μοντέλο. Ειδικότερα ο αρχικός σχεδιασμός έγινε σε Microsoft Access και περιελάμβανε πεδία όρων και εννοιών για έξι γλώσσες (ελληνικά, αγγλικά, γαλλικά, γερμανικά, ιταλικά, ισπανικά). Στη συνέχεια αναπτύχθηκαν δοκιμαστικά περιβάλλοντα σε SQL [11] και σε γλώσσα PHP και MysQL για χρήση στο διαδίκτυο.

5 ΣΧΗΜΑ 1 Όπως φαίνεται και στο παραπάνω σχήμα 1, που απεικονίζει μερικώς τις σχέσεις μεταξύ πινάκων και πεδίων, η Βάση Δεδομένων περιλαμβάνει 14 πίνακες που αποτελούνται από ένα σύνολο 180 πεδίων περίπου που καλύπτουν: Ορισμό όρου Συνώνυμα / Αντώνυμα όρου Σχετιζόμενους όρους Θεματικό πεδίο / υποπεδίο Μορφολογικές πληροφορίες Γραμματικές πληροφορίες (μέρος λόγου, κλπ) Παραδείγματα χρήσης Δημιουργό όρου (αν υπάρχει) Πηγή όρου (με πλήρη αναφορά σε βιβλιογραφία αν υπάρχει) Διάφορες τεχνικές πληροφορίες (καταγραφέας όρου, ημερομηνία εισαγωγής όρου, ημερομηνία ελέγχου και επικύρωσης, κ.ά)

6 Συγκείμενο όρου Λέξεις-κλειδιά ανεύρεσης όρου Παρατηρήσεις και γενικά σχόλια Η καταγραφή αποφασίστηκε να γίνει σε δύο στάδια. Στο πρώτο, μικρές ομάδες ερευνητών σπουδαστών ασχολούνται με την εύρεση, επισκόπηση και καταγραφή των όρων ενώ στην δεύτερη μια ολιγομελής ομάδα 10 μεταπτυχιακών φοιτητών ελέγχει, αξιολογεί και «επικυρώνει» τα ήδη συγκεντρωμένα δεδομένα. 4. ΗΛΕΚΤΡΟΝΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΔΙΑΧΕΙΡΙΣΗΣ Η παρούσα Βάση Δεδομένων αρχικά σχεδιάστηκε και υλοποιήθηκε για χρήση μόνο σε περιβάλλον τοπικού δικτύου Η/Υ. Όπως φαίνεται και στο σχήμα 2, κατά το πρώτο στάδιο, ένας κεντρικός υπολογιστής διανέμει την Βάση σε 20 τερματικούς σταθμούς εργασίας, όπου γίνεται εισαγωγή όρων από ισάριθμους καταγραφείς. Η αποθηκευμένη Βάση Δεδομένων είναι προσβάσιμη μόνο σε αυτούς. ΣΤΑΔΙΟ 2 Πολύγλωσση Ορολογική Βάση Δεδομένων ΔΙΑΔΙΚΤΥΟ Multilingual Terminological Database (MTDB) ΣΤΑΔΙΟ 1 σταθμός εργασίας Πολύγλωσση Ορολογική Βάση Δεδομένων Multilingual Terminological Database (MTDB) Server σταθμός εργασίας σταθμός εργασίας ΣΧΗΜΑ 2

7 Στην συνέχεια, στο δεύτερο στάδιο, τα περιεχόμενα της Βάσης ελέγχονται και «επικυρώνονται» από μια μικρή ομάδα ερευνητών και κατόπιν μπορούν να διανεμηθούν ελεύθερα στο διαδίκτυο. Το υπόλοιπο τμήμα της Βάσης Δεδομένων αποτελείται από τις οθόνες διεπαφής χρήστη Βάσης για την εισαγωγή και διαχείριση των όρων. Σύμφωνα με τον σχεδιασμό, η Βάση Δεδομένων στο το πρώτο στάδιο επιτρέπει την: εισαγωγή νέων όρων, διόρθωση όρων, επιλεκτική διαγραφή όρων ή πληροφοριών αυτών. Ενώ στο το δεύτερο στάδιο επιτρέπει την: διόρθωση και επιλεκτική διαγραφή όρων ή πληροφοριών αυτών, αναζήτηση όρων από ανεξάρτητους χρήστες (για χρήση στο Διαδίκτυο). 5. ΕΠΙΛΟΓΟΣ Είναι προφανές πως η προσπάθεια συγκέντρωσης και απόδοσης όρων που αναφέρονται στο δυναμικά εξελισσόμενο χώρο της Θεωρητικής και Εφαρμοσμένης Γλωσσολογίας είναι ένα εξαιρετικά δύσκολο εγχείρημα, που απαιτεί μακροχρόνιο σχεδιασμό, συντονισμό σε πολλά επίπεδα και συνεχή ανταλλαγή πληροφοριών και απόψεων. Για τον λόγο αυτό λήφθηκε ιδιαίτερη μνεία, ώστε η αρχιτεκτονική του συστήματος να είναι ανοιχτή, να επιδέχεται συνεχείς διορθώσεις και βελτιώσεις και επίσης έγινε προσπάθεια ώστε οι κατηγοριοποιήσεις των γλωσσικών δεδομένων να υπακούουν όσο το δυνατόν σε διεθνή πρότυπα τυποποίησης [12], [13], [14]. 6. ΒΙΒΛΙΟΓΡΑΦΙΑ [1]: Καραγιάννης, Γ. (2001), Εθνικό Πρόγραμμα Ορολογικού συντονισμού (ΕΠΟΣ): Στρατηγική μελέτη, μεθοδολογία και στόχοι, Πρακτικά 3 ου συνεδρίου Ελληνικής Γλώσσας και ορολογίας, Αθήνα, σελ. 324. [2]: Date, C. J. (1995). An Introduction to Database Systems. Massachusetts: Addison-Wesley Publishing Company, ελλ. μτφ. Άλβας, Τάκης (1996), Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. Αθήνα: εκδ. Κλειδάριθμος, τομ. Α, Β. [3]: BLAKOWSKI, Gerold & SAMPATHKUMAR, Srihari (1994). "Multimedia Storage and Databases", Perspectives of Multimedia Systems: Reports from the 1994 Dagstuhl Multimedia Seminar, Technical Report GIT-GVU-95-23, pp.31-39, Atlanta: Graphics, Visualisation and Usability Laboratory and College of Computing, Georgia Institute of Technology Electronic version: ftp://ftp.gvu.gatech.edu/pub/ gvu/tech-reports/ 95-23.ps.Z

8 [4]: Galisson, R. & Coste, D. (1976). Dictionnaire de Didactique des Langues. Paris: Hachette [5]: Τοκατλίδου, Βάσω (1986). Εισαγωγή στην Διδακτική των Ζωντανών Γλωσσών. Προβλήματα-Προτάσεις. Αθήνα: Εκδόσεις Οδυσσέας [6]: Τοκατλίδου, Βάσω (2003). Γλώσσα, επικοινωνία και γλωσσική εκπαδευση. Αθήνα: Εκδόσεις Πατάκη [7]: ISO 2788-1986, Guidelines for the establishment and development of monolingual thesauri Documentation, International Organization for Standarization, 1986. [8] ISO 5965-1985, Guidelines for the establishment and development of multilingual thesauri Documentation, International Organization for Standarization, 1985. [9]: Formalization of the Data Categories for the Open Lexicon Interchange Format (OLIF), July 4 2003, OLIF Consortium Web site http://www.olif.net/ [10]: ISO 12200 (1998). Computer applications in terminology - Machine-readable terminology interchange format (MARTIF) -Negociated interchange ISO/DIS 12200, ISO, Genéva. [11]: ISO/IEC 9075-4:1996 (1996). Information technology - Database languages - SQL - Part 4: Persistent Stored Modules (SQL/PSM), ISO, Genéva. ISO/IEC 9075-3:1995 (1995). Information technology - Database languages - SQL - Part 3: Call-Level Interface (SQL/CLI), ISO, Genéva. ISO/IEC DIS 9075-1 (1999). Information processing systems - Data base language SQL - Part 1: Frame, ISO, Genéva [12]: Sager, J. C., L'Homme, M.-C. (1994). A model for the definition of concepts: Rules for analytical definitions in terminological databases. Terminology 1(2): 351-374. [13]: ISO 1951:1997 (1997). Lexicographical symbols and typographical conventions for use in terminography ISO 1951:1997, ISO, Genéva. [14]: ISO 12618:1994 (1994). Computational aids in terminology - Creation and use of terminological databases and text corpora ISO/TR 12618:1994, ISO, Genéva. Άλκηστις Χιδίρογλου Επίκουρη Καθηγήτρια του Τμήματος Γαλλικής Γλώσσας και Φιλολογίας του Α.Π.Θ., alkisti@frl.auth.gr Παναγιώτης Αρβανίτης Λέκτορας του Τμήματος Γαλλικής Γλώσσας και Φιλολογίας του Α.Π.Θ., arva@frl.auth.gr Παναγιώτης Παναγιωτίδης Λέκτορας του Τμήματος Γαλλικής Γλώσσας και Φιλολογίας του Α.Π.Θ., pana@frl.auth.gr