24 Αξιοποιώντας τις σχεσιακές βάσεις δεδομένων για την ανάπτυξη ορολογικών βάσεων γνώσης

Σχετικά έγγραφα
Από τις Βάσεις Ορολογίας στις Βάσεις Γνώσης: Το Παράδειγµα του Συστήµατος ιαχείρισης Ορολογίας της Εγνατία Οδός Α.Ε. (Οδο-λέξις)

Προγράμματα για τη δημιουργία και διαχείριση θησαυρού

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Σχεδιασµός Ανάπτυξη Οντολογίας

Αξιοποιώντασ τισ ςχεςιακζσ βάςεισ δεδομζνων για τθν ανάπτυξθ ορολογικών βάςεων γνώςθσ. αρακατςιάνου Διμθτρα, Μυρίδθσ Νικόλαοσ

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΟΛΥΓΛΩΣΣΗΣ ΟΡΟΛΟΓΙΚΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΟΝ ΓΝΩΣΤΙΚΟ ΤΟΜΕΑ ΤΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΓΛΩΣΣΟΛΟΓΙΑΣ

Διαχείριση Πολιτισμικών Δεδομένων

Η Επιτροπή ΤΕ 21 και το έργο της

Ανοικτά Ακαδημαϊκά Μαθήματα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

ΘΕΜΑΤΙΚΗ ΕΥΡΕΤΗΡΙΑΣΗ ΚΑΙ ΚΑΘΙΕΡΩΣΗ ΟΡΟΛΟΓΙΑΣ ΣΤΙΣ ΤΕΧΝΙΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ: Η ΕΜΠΕΙΡΙΑ ΣΤΟ ΤΕΕ

«Ωρίων»: Online Πρόγραμμα Πληροφοριακού Γραμματισμού

ΕΠΙΣΤΗΜΟΝΙΚΟ ΛΕΞΙΚΟ ΚΟΙΝΩΝΙΚΩΝ ΟΡΩΝ

Βάσεις Δεδομένων Ι. 2 ο Φροντιστήριο. Πέρδικα Πολίνα [perdika]

Εαρινό Εξάμηνο

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Εισαγωγή στην Πληροφορική

Information Technology for Business

Παρουσίαση του Ελληνικού Θησαυρού Επιστημονικών Όρων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

Μοντέλο Οντοτήτων-Συσχετίσεων. Η ανάγκη Διαγράμματα ΟΣ Σύνολα Οντοτήτων-Συσχετίσεων Απεικονίσεις Επεκτάσεις

Εννοιολογική χαρτογράφηση. Τ. Α. Μικρόπουλος

Ηλεκτρονικός πολύγλωσσος θησαυρός : το μέλλον στην αυτοματοποιημένη ευρετηρίαση

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Συνεργασία για την Ευρωπαϊκή Ορολογία. Κέρκυρα, Πέμπτη , Ροδόλφος Μασλίας, Στέλλα Τσομπάνου, Όλγα Βαμβακά, Γιάννης Μπέρσος

(Α.Σ.ΠΑΙ.Τ.Ε.) ΠΑΡΑΔΟΤΕΟ Δ3-5_3 1 ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΣΕ ΔΙΕΘΝΕΣ ΕΠΙΣΤΗΜΟΝΙΚΟ ΣΥΝΕΔΡΙΟ. Vocational Technology Enhanced Learning (VocTEL) 2015

ΑΣΚΗΣΗ 1η Αναζήτηση πληροφορίας σε Βιβλιογραφικές Βάσεις εδοµένων

Ζητήματα Τυποποίησης στην Ορολογία - ο ρόλος και οι δράσεις της Επιτροπής Ορολογίας ΤΕ21 του ΕΛΟΤ

Εννοιολογική Ομοιογένεια

Αξιολόγηση πληροφοριακών συστηµάτων και υπηρεσιών πληροφόρησης

Kεφ.2: Σχεσιακό Μοντέλο (επανάληψη) Κεφ.6.1: Σχεσιακή Άλγεβρα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης

Εισαγωγή στην πληροφορική

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ Μαθήματα Ειδικής Υποδομής Υποχρεωτικά. Εργαστήριο 2 Παραδόσεις 3

Σχεδίαση Σχεσιακών ΒΔ

Μάθημα: Συστήματα Διαχείρισης Βάσεων Δεδομένων Αναλυτικό Διάγραμμα Μελέτης

Η τυποποίηση στην περιγραφή και διαχείριση των αρχείων και η συμβολή του ISOκαι του ΕΛΟΤ

Προγράμματα Η /Υ / Εφαρμογές σε συστ ήματα Π ό οι τητας Αριστομένης Μακρής

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

Στρατηγικό Σχεδιασµό Πληροφοριακών Συστηµάτων

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 10 ΔΗΜΙΟΥΡΓΙΑ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΓΕΩΒΑΣΕΩΝ


Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

Σχεδιασμός Βάσεων Δεδομένων

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

Δπγαζηήπιο «Βάζειρ Γεδομένων» Αζκήζειρ Ππακηικήρ Δξάζκηζηρ (έκδοζη 1.0) ςνηακηική Ομάδα. Δπιμέλεια ημειώζεων

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ. «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΝΟΣΟΚΟΜΕΙΑΚΟΥ ΠΡΟΣΩΠΙΚΟΥ

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

Διάγραμμα Οντοτήτων - Συσχετίσεων

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

15. Ο Θησαυρός Ελληνικών Όρων: ένα εργαλείο για τη θεματική οργάνωση του περιεχομένου

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Το Open Eclass ως Σύστημα Διαχείρισης Μάθησης

Ορολογία, οντολογία και οντοορολογία: επισκόπηση των εννοιών και συζήτηση για τη σχέση μεταξύ τους Κατερίνα Τοράκη

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Τυποποίηση, Ορολογία και Βιβλιοθήκες

Αξιολόγηση πληροφοριακών συστηµάτων και υπηρεσιών πληροφόρησης

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS

3/6/2015. Τιτίκα Δημητρούλια Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Αξιολόγηση των εκπαιδευτικών δραστηριοτήτων των νοσοκομειακών βιβλιοθηκών.

ΔΙΓΛΩΣΣΟΣ ΕΛΛΗΝΙΚΟΣ ΘΗΣΑΥΡΟΣ ΘΕΜΑΤΙΚΩΝ ΟΡΩΝ. Τσάφου Σταματία Χατζημαρή Στέλλα Τοράκη Κατερίνα ΠΕΡΙΛΗΨΗ

EE512: Error Control Coding

Approximation of distance between locations on earth given by latitude and longitude

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ ΙΑ ΙΚΤΥΑΚΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΎ ΣΥΣΤΗΜΑΤΟΣ. Τρίτη, 7 Φεβρουαρίου 2012

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΣΙΑ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Διαχείρισης Βάσεων Δεδομένων

Η παρούσα ανακοίνωση εντάσσεται στο πλαίσιο μίας ευρύτερης μελέτης (διδακτορική διατριβή) με θέμα: Η ορολογία των φυσικών κινδύνων από την σκοπιά της

«Χρήσεις γης, αξίες γης και κυκλοφοριακές ρυθμίσεις στο Δήμο Χαλκιδέων. Η μεταξύ τους σχέση και εξέλιξη.»

ΙΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΡΕΥΝΑΣ (ITE)

ΜΗΤΡΙΚΟΣ ΘΗΛΑΣΜΟΣ ΚΑΙ ΓΝΩΣΤΙΚΗ ΑΝΑΠΤΥΞΗ ΜΕΧΡΙ ΚΑΙ 10 ΧΡΟΝΩΝ

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

Μάθημα «Υπηρεσίες Ηλεκτρονικής Υγείας»

Επέκταση του Ελληνικού WordNet µε Όρους Πληροφορικής και Σηµασιολογικές Σχέσεις Βασισµένες σε Μοντέλο Κατανόησης Κειµένου

ΣΥΓΧΡΟΝΕΣ ΤΑΣΕΙΣ ΣΤΗΝ ΕΚΤΙΜΗΣΗ ΚΑΙ ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΩΝ ΚΙΝΔΥΝΩΝ

Οντολογία Ψηφιακής Βιβλιοθήκης

Εκπαιδευτικές δράσεις σε προγράμματα πληροφοριακής παιδείας: Ανάπτυξη ψηφιακών μαθημάτων στο σύστημα διαχείρισης μάθησης LAMS

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

Κατανόηση των παραγόντων που συνδέονται με την εξέλιξη των συστημάτων ERP

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία Η ΚΑΤΑΘΛΙΨΗ ΣΕ ΕΦΗΒΟΥΣ ΜΕ ΣΑΚΧΑΡΩΔΗ ΔΙΑΒΗΤΗ ΤΥΠΟΥ 1

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ ΑΘΗΝΑ Ε - ΜΑΙL : mkap@aueb.gr ΤΗΛ: , ΚΑΠΕΤΗΣ ΧΡΥΣΟΣΤΟΜΟΣ. Βιογραφικό Σημείωμα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 1 ο Μάθημα: Εισαγωγή. Δρ. Κωνσταντίνος Χ. Γιωτόπουλος

ΕΤΑΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΥΘΥΝΗ ΣΤΗΝ ΝΑΥΤΙΛΙΑΚΗ ΒΙΟΜΗΧΑΜΙΑ

Εισαγωγή στην Πληροφορική & τον Προγραμματισμό

ΣΧΕΔΙΑΣΜΟΣ ΔΙΚΤΥΩΝ ΔΙΑΝΟΜΗΣ. Η εργασία υποβάλλεται για τη μερική κάλυψη των απαιτήσεων με στόχο. την απόκτηση του διπλώματος

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

AΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ

Βάσεις Δεδομένων. Σταύρος Βαλσαμίδης Βάσεις Δεδομένων Διάγραμμα Ο-Σ 1

Transcript:

24 Αξιοποιώντας τις σχεσιακές βάσεις δεδομένων για την ανάπτυξη ορολογικών βάσεων γνώσης Δήμητρα Σαρακατσιάνου, Νικόλαος Μυρίδης ΠΕΡΙΛΗΨΗ Σήμερα υπάρχουν ποικίλοι διαθέσιμοι ορολογικοί πόροι όπως λεξικά, θησαυροί, ορολογικές βάσεις, γλωσσάρια, κ.ά., τα οποία παρέχουν διαφορετικής χροιάς και ενδιαφέροντος πληροφορίες. Συνεπώς, οι αναζητήσεις των επιθυμητών ορολογικών δεδομένων από τους χρήστες εκτελούνται σε δύο διακριτές διεργασίες. Πρωταρχικά πρέπει να προσδιορισθεί από τον χρήστη ο κατάλληλος ορολογικός πόρος με βάση τα στοιχεία που επιθυμεί να αντλήσει (π.χ. η εύρεση ενός ισοδύναμου όρου στην αγγλική γλώσσα θα πρέπει να αντληθεί από μία δίγλωσση ορολογική βάση δεδομένων) και έπειτα να αναζητήσει αυτόν τον πόρο σε ποικίλους χώρους (όπως, βιβλιοθήκες ή διαδίκτυο). Η εξέλιξη των τεχνολογιών δίνει την δυνατότητα ενοποίησης των διάφορων ορολογικών πόρων σε ένα σύστημα βάσεων δεδομένων, το οποίο θα παρέχει όλες τις εν δυνάμει πληροφορίες σε ένα μόνο πληροφοριακό μέσο. Στο πλαίσιο αυτό η εργασία μας παρουσιάζει τον σχεδιασμό μίας ενιαίας ορολογικής βάσης γνώσεων η οποία θα παρέχει την πρόσβαση σε ένα μεγάλο πλήθος ορολογικών δεδομένων (όπως: γλωσσικές πληροφορίες, εννοιολογικές πληροφορίες, σημασιολογικές πληροφορίες). Με άλλους όρους, η εργασία αποτελεί μία πρόταση αξιοποίησης των σχεσιακών βάσεων δεδομένων για την δημιουργία ορολογικών βάσεων γνώσης. Αρχικά πραγματοποιείται η χαρτογράφηση των δομικών στοιχείων της βάσης δεδομένων δηλαδή η καταγραφή των βασικών χαρακτηριστικών της βάσης (όπως: όρος, ορισμός, γλώσσα, συγκείμενο, θεματικό πεδίο, γραμματική πληροφορία, γένος, κ.ά.). Στην συνέχεια λαμβάνει χώρα η διερεύνηση των διασυνδέσεων των στοιχείων της βάσης προκειμένου να αποτυπωθούν οι σημασιολογικές σχέσεις μεταξύ των λημμάτων (δηλ. σχέσεις ισοδυναμίας, ιεραρχίας και συσχέτισης). Το τελικό προϊόν της όλης διαδικασίας είναι η δημιουργία του Μοντέλου Οντοτήτων-Συσχετίσεων (Entity- Relationship Model) της ορολογικής βάσης δεδομένων, το οποίο μπορεί να αξιοποιηθεί για την ανάπτυξη της βάσης δεδομένων σε ένα σύστημα διαχείρισης σχεσιακών βάσεων δεδομένων. Τα οφέλη της ανάπτυξης αυτής της βάσης δεδομένων είναι πολλαπλά τα οποία και συνοψίζονται ως εξής: ενοποίηση των ορολογικών δεδομένων, άρση κατακερματισμού χώρων ενδιαφέροντος, επιτάχυνση διαδικασιών, τεκμηρίωση και αξιοπιστία ευρημάτων, κλπ. 312 The use of relational databases for the development of terminological knowledge bases Sarakatsianou Dimitra, Myridis Nikolaos ABSTRACT Nowadays there is a variety of available terminological resources such as dictionaries, treasures, term bases, glossaries, etc., which provide with information of diverse character and interest. Therefore, users queries of anticipated terminological data are executed in two individual processes. Initially, the user must determine the suitable terminology resource according to the data he/she wishes to mine

(e.g. finding an equivalent term in English should be drawn from a bilingual terminological database). Then the user should seek this resource into diverse fields (e.g. libraries, web etc.). Technology progress gives us the opportunity to unify diverse terminology resources into one database system, which will enable user s access to a huge plethora of terminological data (e.g. linguistic, conceptual, semantic etc. information). In other terms, this paper consists a framework for the utilization of relational databases for the construction of terminological knowledge bases. Initially the mapping of the database s structural elements takes place, i.e. the determination of critical database s elements (as for instance term, definition, language, context, subject field, grammatical information, gender etc.). Then examination of interrelations between database elements follows in order to find out the semantic relations between entries (i.e. relations of equivalence, hierarchy and correlation). Final output of this process is the Entity-Relationship Model of the terminological knowledge base which could be utilized for database construction in a relational database management system (RDBMS). The benefits of this database construction are multiple and they are summarized as follows: unification of terminological data, elimination of fragmentation in fields of interest, acceleration of processes, documentation and liability of findings etc. 0 Εισαγωγή Στην εποχή μας η εκθετική αύξηση της πληροφορίας δημιουργεί την ανάγκη για την ανεύρεση κατάλληλων πληροφοριακών συστημάτων ή εργαλείων προκειμένου αυτή να καταγράφεται, ταξινομείται, ευρετηριάζεται, τεκμηριώνεται, κ.ά. Η ανάγκη αυτή στον τομέα της ορολογίας αντιμετωπίζεται με την δημιουργία ποικίλων ορολογικών πόρων (όπως λεξικά, γλωσσάρια, θησαυροί, ορολογικές βάσεις), οι οποίοι εξυπηρετούν διαφορετικές πληροφοριακές ανάγκες. Ωστόσο, η διεργασία της εύρεσης των απαιτούμενων ορολογικών δεδομένων, ορισμένες φορές, είναι μία χρονοβόρα διαδικασία αφού πρέπει να πραγματοποιηθεί η αναζήτηση των κατάλληλων ορολογικών πόρων σε διαφορετικούς χώρους, είτε φυσικούς (π.χ. βιβλιοθήκες) είτε άυλους (διαδίκτυο). Παράλληλα, στον χώρο της επιστήμης της Πληροφορικής ως γνωστόν, αναφορικά με την διαχείριση της πληροφορίας, οι αναδυόμενες τεχνολογικές επιλύσεις συγκλίνουν στην υιοθέτηση μίας ολικής προσέγγισης δηλαδή στην ενοποίηση των ποικίλων πληροφοριακών συστημάτων. Σημαντικό ρόλο σε αυτή την ενοποίηση διαδραμάτισε και η εξέλιξη στον τομέα των συστημάτων Βάσεων Δεδομένων. Χαρακτηριστικό παράδειγμα είναι οι «Σχεσιακές 313

Βάσεις Δεδομένων» (Relational Databases), οι οποίες οργανώνουν τα δεδομένα σε συσχετιζόμενες οντότητες (πίνακες) προκειμένου η εύρεση, ανάκτηση και επεξεργασία των δεδομένων να γίνεται με το βέλτιστο τρόπο [1]. Συνεπώς, η δυνατότητα που παρέχει η σύγχρονη τεχνολογία επιτρέπει την ενοποίηση των ορολογικών πόρων σε ένα σύστημα βάσεων δεδομένων, το οποίο θα αποθηκεύει και οργανώνει τα ποικίλα ορολογικά δεδομένα σε ένα μόνο πληροφοριακό σύστημα. Δηλαδή μία απλή «Ορολογική Βάση» (Term Base) μετεξελίσσεται σε μία «Ορολογική Βάση Γνώσης» (Terminological Knowledge Base) [2]. Πρακτικά αυτό σημαίνει ότι η ορολογική βάση η οποία συνήθως περιέχει βασικά ορολογικά δεδομένα (π.χ. όρος, μετάφραση όρου, συντομογραφία, πηγή) αναβαθμίζεται σε μία ορολογική βάση γνώσης. Η βάση γνώσης προσφέρει «γνώση» μέσω των σημασιολογικών διασυνδέσεων των όρων της. Με απλούς όρους, η ορολογική βάση γνώσης καθοδηγεί τον χρήστη στην επιλογή του κατάλληλου όρου μέσω των εννοιολογικών πληροφορίων που παρέχει. Επομένως, στο πλαίσιο αυτό, η εργασία παρουσιάζει μία πρόταση ανάπτυξης μίας ορολογικής βάσης γνώσης μέσω της αξιοποίησης των σχεσιακών βάσεων δεδομένων. 1. Μεθοδολογία Ο σχεδιασμός της ορολογικής βάσης γνώσης βασίστηκε στις προδιαγραφές που εφαρμόζονται διεθνώς για την ανάπτυξη βάσεων δεδομένων [3] [5]. Κατά συνέπεια το στάδιο του σχεδιασμού της ορολογικής βάσης διαιρέθηκε σε δύο επιμέρους φάσεις. Η πρώτη φάση αφορά την «Ανάλυση Απαιτήσεων» (Requirements Analysis) της βάσης. Με απλούς όρους, η ανάλυση απαιτήσεων αναφέρεται στην καταγραφή των δομικών στοιχείων της βάσης, τα οποία απορρέουν από τον καθορισμό των βασικών διεργασιών που θα επιτελεί η βάση δεδομένων. Η δεύτερη φάση αναφέρεται στον «Εννοιολογικό Σχεδιασμό» (Conceptual Design) της βάσης δηλαδή στην αποτύπωση των σημασιολογικών σχέσεων (διασυνδέσεων) μεταξύ των ορολογικών δεδομένων. Οι προηγούμενες διεργασίες οδηγούν στην δημιουργία ενός εννοιολογικού σχήματος δηλαδή στο «Διάγραμμα Οντοτήτων- Συσχετίσεων» (Entity-Relationship Diagram). Το εννοιολογικό διάγραμμα που δημιουργείται αποτελεί το καθοριστικό στοιχείο για την φάση του «Λογικού Σχεδιασμού» (Logical Design) δηλαδή της φυσικής υλοποίησης της βάσης σε ένα «Σύστημα Διαχείρισης Βάσεων Δεδομένων» (Database Management System) όπως είναι το περιβάλλον Microsoft Access [6]. Τέλος ας σημειωθεί ότι η επιλογή του κατάλληλου λεξιλογίου για την παρουσίαση των ορολογικών δεδομένων και των τυποποιημένων μορφότυπών τους βασίστηκε πρωτίστως 314

στην επισκόπηση των ελληνικών ορολογικών προτύπων ΕΛΟΤ 561-1, ΕΛΟΤ 561-2 και ΕΛΟΤ 1447 [7] [9], καθώς επίσης και της αντίστοιχης ελληνικής και ξένης βιβλιογραφίας [10] [14] 2 Σχεδιασμός της ορολογικής βάσης γνώσης Όπως ήδη έχει αναφερθεί στην ενότητα της μεθοδολογίας, η πρώτη φάση του σχεδιασμού της Βάσης Δεδομένων περιλαμβάνει την καταγραφή των βασικών ιδιοτήτων της, δηλαδή των κατηγοριών των ορολογικών δεδομένων που θα εμπεριέχει. Ωστόσο, ο καθορισμός αυτών των δεδομένων εξαρτάται από τις προδιαγραφές της ορολογικής βάσης γνώσεων, τις οποίες προσδιορίσαμε ως εξής: Η βάση δεδομένων θα καλύπτει ένα ευρύ πεδίο γνώσης δηλαδή θα εμπεριέχει ειδική ορολογία που θα αφορά ποικίλους τομείς (π.χ. πληροφορική, ιατρική, εκπαίδευση) και θεματικά υποπεδία (π.χ. επικοινωνίες, δίκτυα υπολογιστών). Η βάση δεδομένων θα υποστηρίζει την πολύγλωσση διαχείριση των πληροφορίων. Κάθε ορολογικό λήμμα (λεξική εγγραφή) θα αντιστοιχεί σε έναν συγκεκριμένο τομέα, αλλά δύνανται να αντιστοιχεί σε πολλά θεματικά υποπεδία που ανήκουν στον συγκεκριμένο τομέα. Κάθε ορολογικό λήμμα αναφέρεται σε ξεχωριστή έννοια, ωστόσο κάθε έννοια μπορεί να αντιστοιχεί σε πολλά ορολογικά λήμματα. Τα ορολογικά δεδομένα της βάσης θα αναφέρονται σε γραμματικές, εννοιολογικές, σημασιολογικές, βιβλιογραφικές, διαχειριστικές πληροφορίες. Οι βασικές σημασιολογικές σχέσεις οι οποίες θα υποστηρίζονται εντός της ίδιας γλώσσας είναι: σχέσεις συνωνυμίας, υπωνυμίας, υπερωνυμίας, μερωνυμίας, ολωνυμίας, συνάφειας, συγγενείας. Με βάση τις προηγούμενες προδιαγραφές, ο σχεδιασμός της βάσης εμπεριέχει δέκα (10) οντότητες/πίνακες. Αναλυτικότερα, οι πίνακες της βάσης δεδομένων και οι ιδιότητές τους αποτυπώνονται ως εξής: 315

ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ {Αναγνωριστικό Λήμματος, Αναγνωριστικό Τομέα, Αναγνωριστικό Θεματικού Υποπεδίου, Ορολογικό Λήμμα, Συντομομορφή, Σύμβολο, Τύπος 1, Κωδικός Γλώσσας Λήμματος 2 } ΤΟΜΕΑΣ 3 {Αναγνωριστικό Τομέα, Τομέας, Κωδικός Γλώσσας Τομέα} ΘΕΜΑΤΙΚΟ ΥΠΟΠΕΔΙΟ 4 {Αναγνωριστικό Θεματικού Υποπεδίου, Θεματικό Υποπεδίο, Κωδικός Γλώσσας Θεματικού Υποπεδίου} ΕΝΝΟΙΟΛΟΓΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ {Αναγνωριστικό Λήμματος, Ορισμός, Αναγνωριστικό Πηγής Ορισμού, Επεξήγηση, Σχήμα, Σημείωση} ΠΗΓΗ ΑΝΑΦΟΡΑΣ {Αναγνωριστικό Πηγής, Πηγή, Είδος Πηγής, Κωδικός Γλώσσας Πηγής} ΣΥΓΚΕΙΜΕΝΟ {Αναγνωριστικό Συγκείμενου, Αναγνωριστικό Λήμματος, Τίτλος Κειμένου, Συγκείμενο, Αναγνωριστικό Πηγής Συγκείμενου, Κωδικός Γλώσσας Κειμένου} ΓΡΑΜΜΑΤΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ {Αναγνωριστικό Λήμματος, Γραμματική Κατηγορία, Γένος, Αριθμός} ΙΣΟΔΥΝΑΜΟΣ ΟΡΟΣ {Αναγνωριστικό Ισοδύναμου Όρου, Λήμμα Πηγής, Λήμμα Στόχου, Βαθμός Ισοδυναμίας 5, Βαθμός Αξιοπιστίας 6 } ΣΗΜΑΣΙΟΛΟΓΙΚΕΣ ΣΧΕΣΕΙΣ {Αναγνωριστικό Σχέσης, Τύπος Σχέσης, 1 ο Λήμμα, 2 ο Λήμμα} ΔΙΑΧΕΙΡΙΣΤΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ {Αναγνωριστικό Λήμματος, Ημερομηνία Καταχώρησης, Καταχωρητής} Με βάση την προηγούμενη δομή της βάσης, προκύπτουν και αντίστοιχες σχέσεις μεταξύ των οντοτήτων της βάσης δεδομένων, οι οποίες παρουσιάζονται στον Πίνακα 1. 1 Π.χ. H2SO4. 2 Οι κωδικοί των γλωσσών δίνονται στo ISO 639. Π.χ. el=ελληνική γλώσσα, en=αγγλική γλώσσα. 3 Ο τομέας αναφέρεται στην γνωστική περιοχή στην οποία ανήκει ένας όρος. 4 Το θεματικό υποπεδίο αποτελεί υποδιαίρεση ενός τομέα. 5 Ενδεικτικές τιμές: Ακριβής ισοδύναμος όρος, στενότερος όρος, ευρύτερος όρος. 6 Ενδεικτικές τιμές: Πολύ αξιόπιστο, αξιόπιστο, ελάχιστα αξιόπιστο, μη επαληθευμένη αξιοπιστία. 316

Πίνακας 1: Συσχετίσεις οντοτήτων και λόγος πληθικότητας. Συσχετίσεις Οντοτήτων Λόγος Πληθικότητας 7 ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΤΟΜΕΑΣ Ένα-προς-Ένα (1:1) ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΘΕΜΑΤΙΚΟ ΥΠΟΠΕΔΙΟ ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΣΥΓΚΕΙΜΕΝΟ Πολλά-προς-πολλά (Ν:Μ) Πολλά-προς-πολλά (Ν:Μ) ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΕΝΝΟΙΟΛΟΓΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Ένα-προς-Ένα (1:1) ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΓΡΑΜΜΑΤΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Ένα-προς-Ένα (1:1) ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΙΣΟΔΥΝΑΜΟΣ ΟΡΟΣ ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ ΣΗΜΑΣΙΟΛΟΓΙΚΕΣ ΣΧΕΣΕΙΣ Ένα-προς-πολλά (1:Ν) Ένα-προς-πολλά (1:Ν) ΟΡΟΛΟΓΙΚΟ ΛΗΜΜΑ - ΔΙΑΧΕΙΡΙΣΤΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Ένα-προς-Ένα (1:1) ΠΗΓΗ ΑΝΑΦΟΡΑΣ - ΣΥΓΚΕΙΜΕΝΟ ΠΗΓΗ ΑΝΑΦΟΡΑΣ - ΕΝΝΟΙΟΛΟΓΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Ένα-προς-πολλά (1:Ν) Ένα-προς-πολλά (1:Ν) Στο Σχήμα 1 παρουσιάζεται το μοντέλο Οντοτήτων-Συσχετίσεων (Ο-Σ) δηλ. το διάγραμμα απεικόνισης της εννοιολογικής δομής της Βάσης Δεδομένων. Τα δομικά στοιχεία του μοντέλου αυτού είναι οι οντότητες (τετράγωνα), οι ιδιότητες (ελλείψεις) και οι συσχετίσεις (ρόμβοι). Επιπλέον, στο μοντέλο επισημαίνεται ο λόγος πληθικότητας (1:1, 1:Ν, Ν:Μ) της κάθε συσχέτισης, καθώς επίσης και τα πρωτεύοντα κλειδιά των οντοτήτων τα οποία και υπογραμμίζονται [3]. 7 Ο Λόγος πληθικότητας (Cardinality Ratio) ουσιαστικά ορίζει την διάσταση των συσχετίσεων μεταξύ των οντοτήτων. 317

Σχήμα 1: Μοντέλο Οντοτήτων-Συσχετίσεων (Ο-Σ) της Ορολογικής ΒΔ 318

3 Επίλογος Από τα προηγούμενα αντιλαμβάνεται κανείς ότι ο σχεδιασμός μίας ορολογικής βάσης γνώσης είναι μία διαδικασία περίπλοκη αλλά και απαιτητική. Φυσικά, στο πλαίσιο της ανά χείρας εργασίας δεν ήταν δυνατόν να παρουσιαστεί μια εξαντλητική αναφορά όλων των κατηγοριών (οντοτήτων-πινάκων) των ορολογικών δεδομένων τα οποία μπορεί να ενσωματώνει μια ορολογική βάση γνώσης, αφού αυτό εξαρτάται κάθε φορά από τις ειδικές ανάγκες που καλείται να εξυπηρετήσει η βάση. Ωστόσο, ο σχεδιασμός της προτεινόμενης ορολογικής βάσης επιτρέπει την ενσωμάτωση και άλλων κατηγοριών δεδομένων (όπως: ετυμολογικές και μορφολογικές πληροφορίες, χρήση ορολογικού λήμματος, στάτο ορολογικού λήμματος, κ.ά.) ανάλογα με τις εκάστοτε μελλοντικές ανάγκες. Εν κατακλείδι, τα κυριότερα πλεονεκτήματα που προκύπτουν εκ της προτεινόμενης ορολογικής βάσης γνώσης είναι: (α) η συγκέντρωση των ορολογικών δεδομένων των ποικίλων ορολογικών πόρων σε ένα πληροφορικό σύστημα, (β) η άρση κατακερματισμού των χώρων ενδιαφέροντος, (γ) η μείωση του χρόνου εύρεσης και ανάκτησης πληροφορίων, (δ) η αξιοπιστία και διασφάλιση ποιότητας ορολογικών δεδομένων. Επέκταση της εργασίας αυτής αποτελεί η ανάπτυξη της προτεινόμενης ορολογικής βάσης σε ένα σύστημα διαχείρισης Βάσεων Δεδομένων όπως π.χ. Microsoft Access. Η διεργασία αυτή θα οδηγήσει κατά πρώτον στην δημιουργία του περιβάλλοντος διεπαφής της βάσης. Έπειτα θα επιτρέψει την διερεύνηση και επιλογή των ερωτήσεων (queries) τα οποία θα παρέχει η βάση, μέσω των οποίων ο χρήστης θα μπορεί να ανακτά πολυεπίπεδες πληροφορίες. 4 Βιβλιογραφικές αναφορές [ 1] P. Atzeni and V. De Antonellis, Relational database theory. Redwood City, Calif: Benjamin/Cummings Pub. Co, 1993. [ 2] I. Meyer, D. Skuce, L. Bowker, and K. Eck, Towards a new generation of terminological resources: an experiment in building a terminological knowledge base, in Proceedings of the 14th conference on Computational linguistics-volume 3, 1992, pp. 956 960. [ 3] Ι. Μανωλόπουλος and Α. Ν. Παπαδόπουλος, Συστήματα βάσεων δεδομένων: θεωρία και πρακτική εφαρμογή. Αθήνα: Εκδόσεις Νέων Τεχνολογιών, 2006. [ 4] R. Ramakrishnan and J. Gehrke, Database management systems, 3. ed., International ed. Boston, Mass.: McGraw-Hill, 2003. [ 5] A. Silberschatz, H. F. Korth, and S. Sudarshan, Συστήματα βάσεων δεδομένων. Αθήνα: Μ. Γκιούρδας, 2012. 319

[ 6] M. Alexander and R. Kusleika, Access 2016 Bible, 1 edition. Indianapolis, IN: Wiley, 2015. [ 7] Ελληνικός Οργανισμός Τυποποίησης, ΕΛΟΤ 561-1: Ορολογική εργασία - Λεξιλόγιο: μέρος 1: Θεωρία και εφαρμογή. Αθήνα: ΕΛΟΤ, 2006. [ 8] Ελληνικός Οργανισμός Τυποποίησης, ΕΛΟΤ 561-2: Ορολογική εργασία - Λεξιλόγιο: Πληροφορικές εφαρμογές. Αθήνα: ΕΛΟΤ, 2006. [ 9] Ελληνικός Οργανισμός Τυποποίησης, ΕΛΟΤ 1447: Μεταφρασεοστρεφής ορογραφία, 1 η εκδ. Αθήνα: ΕΛΟΤ, 2017. [10] Ελληνικός Οργανισμός Τυποποίησης, Λεξιλόγιο ορολογίας. Αθήνα: ΕΛΟΤ, 1982. [11] Α. Χιδίρογλου, Π. Αρβανίτης, & Π. Παναγιωτίδης, Σχεδιασμός και ανάπτυξη πολύγλωσσης ορολογικής βάσης δεδομένων για τον γνωστικό τομέα της εφαρμοσμένης γλωσσολογίας, στο 4ο Συνέδριο «Ελληνική Γλώσσα και Ορολογία», Αθήνα, 2003. [12] J. Aitchison, A. Gilchrist, and D. Bawden, Thesaurus Construction and Use: A Practical Manual. Psychology Press, 2000. [13] H. Felber, Terminology Manual. Unesco, 1984. [14] D. Rummel and S. Ball, The IATE Project - Towards a Single Terminology Database for the European Union, Transl. Compute, no. 23, p. 4, 2001. Δήμητρα Σαρακατσιάνου Πληροφορικός MSc in Sciences of Education & Lifelong Learning Ηλ.ταχ.: sardimitra1@gmail.com Νικόλαος Μυρίδης Επίκουρος Καθηγητής, ΑΠΘ Ηλ.ταχ.: nmyridis@auth.gr 320