2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

Σχετικά έγγραφα
Π20: Ανακοινώσεις επιστηµονικών εργασιών σε συνέδρια/περιοδικά

Software Production Company

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

. « : project site

Π22: Τελική Αναφορά Έργου

Π17: Μορφοσυντακτικός και Σηµασιολογικός Σχολιαστής (λογισµικό)

7 0 0 /2 /7 0 : 2 1 ( 2 ( Google Yahoo

Javascript. του project /software/web_tools/webapps/search_engine/.

hypertext markup language (.htm) και σε Portable Document Format (.pdf) µορφή.

Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Βαγγελάτος A. 1, Ορφανός Γ. 2, Τσαλίδης Χ. 2, Καλαμαρά Χ. 3

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ 3 2 ΤΟ ΠΡΟΓΡΑΜΜΑ ΤΗΣ ΗΜΕΡΙ ΑΣ 4 3 ΑΝΑΛΥΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΘΕΜΑΤΩΝ ΕΙΣΑΓΩΓΗ ΕΝΑΡΚΤΗΡΙΑ ΣΥΝΕ ΡΙΑ ΠΡΟΣΚΕΚΛΗΜΕΝΟ

/software/web_tools/webapps/speller/.

Ε.Π. «Κ.τ.Π.» Μέτρο 3.3 «Έρευνα και Τεχνολογική Ανάπτυξη στην ΚτΠ», Πράξη Επεξεργασία εικόνων, ήχου και γλώσσας»,

Π18: Τεκµηρίωση Εφαρµογών Ιστού

ΙΑΤΡΟΛΕΞΗ Το ορολόγιο της βιοϊατρικής: συλλογή και επεξεργασία του γλωσσικού υλικού. Μαβίνα Πανταζάρα, ρ. Γλωσσολόγος

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΕΡΕΥΝΗΤΙΚΟ ΠΡΟΓΡΑΜΜΑ «ΑΡΧΙΜΗΔΗΣ ΙΙΙ Ενίσχυση Ερευνητικών Ομάδων στο ΤΕΙ Λάρισας»

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

ΤΕΛΙΚΕΣ ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ (6 Μονάδες ECTS)- Ακαδημαϊκό Έτος

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

e-pyxis: Περιβάλλον ασύγχρονης ηλεκτρονικής εκµάθησης eschoollib

Χρονοδιάγραµµα ΙΑΡΚΕΙΑ (µήνες) Ε 1 Ε 2 Ε 3 Ε 4 Ε 5 Ε 6 Ε 7 Ε 8

Ανάπτυξη Λογισµικού Κοινωνικής ικτύωσης για Ερευνητικούς Σκοπούς

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

ΤοΠληροφοριακό Σύστηµα ιασφάλισηποιότηταςτης ΜΟ ΙΠΤΕΙΗπείρου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

Βάσεις Δεδομένων Ενότητα 1

Σχεδιασµός Ανάπτυξη Οντολογίας

Ανάλυση Απαιτήσεων Απαιτήσεις Λογισµικού

The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ web εφαρµογής - ηλεκτρονικού κατατήµατος για έξυπνα κινητά

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2014 ΑΡΧΕΣ ΟΡΓΑΝΩΣΗΣ & ΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος. Γιώργος Μικρός ΕΚΠΑ

"The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ "

ανθρωπιστικών επιστημών για

Παρουσίαση της απαλλακτικής εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2015)

(Blended Executive Learning)

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

ΟΡΘΗ ΕΠΑΝΑΛΗΨΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

Η ΟΝΤΟΛΟΓΙΑ ΤΟΥ ΕΛΛΗΝΙΚΟΥ ΚΤΗΜΑΤΟΛΟΓΙΟΥ. Μελέτη υλοποίησης στο Protégé-2000

«Υπηρεσία Ιδρυματικού Αποθετηρίου στο ΤΕΙ Δυτικής Μακεδονίας»

Ερευνητικό Πρόγραµµα BalkaNet

ΙΑΤΡΟΛΕΞΗ. Όροι της βιοϊατρικής: συλλογή και επεξεργασία του γλωσσικού υλικού. Μαβίνα Πανταζάρα, ρ. Γλωσσολογίας. Σελίδα 1 Ηµεροµηνία: 10/12/2007

Κλέτσας Αλέξανδρος Τεχνικός ΚΕ.ΠΛΗ.ΝΕ.Τ. Σερρών 24/10/2014 ΚΕ.ΠΛΗ.ΝΕ.Τ. ΣΕΡΡΩΝ 1

ΠΡΟΣΚΛΗΣΗ ΕΚΔΗΛΩΣΗΣ ΕΝΔΙΑΦΕΡΟΝΤΟΣ

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ. Ανάπτυξη Πληροφοριακών Συστηµάτων Επισκόπηση Π.Σ. & τεχνικές για Ανάλυση και Ανάπτυξη. πληροφοριακών συστηµάτων

Ηµεροµηνία: Έκδοση: Τύπος: Final Eµπιστευτικό

7

«Περιεχόµενα. 03 Εισαγωγή Ένα ολοκληρωµένο πληροφοριακό σύστηµα. 04 Περιγραφή Εργαλείο εφαρµογής διαδικασιών

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

ΠΡΟΣΚΛΗΣΗ ΕΚ ΗΛΩΣΗΣ ΕΝ ΙΑΦΕΡΟΝΤΟΣ ΓΙΑ ΥΠΟΒΟΛΗ ΠΡΟΤΑΣΗΣ ΠΡΟΣ ΣΥΝΑΨΗ ΣΥΜΒΑΣΕΩΝ ΜΙΣΘΩΣΗΣ ΕΡΓΟΥ Ι ΙΩΤΙΚΟΥ ΙΚΑΙΟΥ

ΥΠΟΔΟΧΗ ΠΡΩΤΟΕΤΩΝ ΦΟΙΤΗΤΩΝ Παρουσίαση του Τµήµατος

Επιλεγμένο εκπαιδευτικό υλικό, καθολικά σχεδιασμένο για μαθητές με αναπηρία. ΕΛΛΗΝΟΓΕΡΜΑΝΙΚΗ ΑΓΩΓΗ Παλλήνη,

Γ ΚΟΙΝΟΤΙΚΟ ΠΛΑΙΣΙΟ ΣΤΗΡΙΞΗΣ

Αναφορά εργασιών για το τρίµηνο Μάρτιος - Μάϊος 2013

Αν Ναι, δείτε πως με το λογισμικό axes μπορείτε!

Τίτλος Υποέργου: Εφαρµογές Τεχνητής Νοηµοσύνης στην Τεχνολογία Λογισµικού και στην Ιατρική

Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές

ΕΛΑΧΙΣΤΕΣ ΑΠΑΙΤΗΣΕΙΣ ΕΞΟΠΛΙΣΜΟΥ ΕΠΙΚΟΙΝΩΝΙΑ... 23

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Linux Terminal Server Project

Αγρονόμο Τοπογράφο Μηχανικό

Α. ΥΠΟΒΟΛΗ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΟΥ

CESSDA ATTIKH: Παρουσίαση αποτελεσμάτων υποέργων Εθνικού Κέντρου Κοινωνικών Ερευνών. Ερευνητική Ομάδα ΕΚΚΕ

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ ΙΑ ΙΚΤΥΑΚΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΎ ΣΥΣΤΗΜΑΤΟΣ. Τρίτη, 7 Φεβρουαρίου 2012

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

Αρχιτεκτονική του πληροφοριακού συστήµατος Cardisoft Γραµµατεία 2003 ιαχείριση Προσωπικού

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

ΑΔΑ: ΒΙΞ9ΟΡΥΛ-Κ31 ΗΜΟΤΙΚΗ ΕΠΙΧΕΙΡΗΣΗ Υ ΡΕΥΣΗΣ ΑΠΟΧΕΤΕΥΣΗΣ ΣΠΑΡΤΗΣ ΑΠΟΣΠΑΣΜΑ ΑΠΟΦΑΣΗ. διάταξης: «Μηχανογράφηση ΕΥΑΣ».

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΜΕ ΧΡΗΣΗ PHP

14 Ζητήματα αναγνώρισης των πολυλεκτικών σύμπλοκων όρων στον τομέα της βιοϊατρικής

ΑΝΑΠΤΥΞΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΨΗΦΙΑΚΩΝ ΣΥΛΛΟΓΩΝ ΕΦΗΜΕΡΙΔΩΝ

ΠΡΑΞΗ: «ΜΟ.ΔΙ.Π» (Μονάδα Διασφάλισης Ποιότητας) του Πανεπιστημίου Μακεδονίας» Κωδικός MIS ΥΠΟΕΡΓΟ: «02»

Εκδήλωση ενδιαφέροντος

Ελληνικό Ανοικτό Πανεπιστήµιο. Η Ανάλυση και ο Σχεδιασµός στην Ενοποιηµένη ιαδικασία. ρ. Πάνος Φιτσιλής

ΗΜΕΡΙΔΑ Cloud Computing: Νέοι Ορίζοντες

Τι είδους δεδομένα χρειάζονται; Προκόπης Προκοπίδης ΙΕΛ/ΕΚ «Αθηνά»

Ανάλυση Πληροφοριακών Συστημάτων. Εαρινό Εξάμηνο Lec06 (Εργαστήριο) 26/03/2019 Διδάσκων: Γεώργιος Χρ. Μακρής

ΡΑΣΤΗΡΙΟΤΗΤΕΣ. Ασφάλεια & Ηλεκτρονική ιακυβέρνηση

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Γ Κ.Π.Σ. Β Ε.Π.Ε.Α.Ε.Κ. ΕΡΓΟ : ΕΚΣΥΓΧΡΟΝΙΣΜΟΣ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΒΙΒΛΙΟΘΗΚΩΝ ΤΟΥ Α.Π.Θ. Γ Κ.Π.Σ.

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΜΕΤΑΦΡΑΣΗΣ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ ΜΟΝΑ Α ΑΥΤΟΜΑΤΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΩΝ ΓΛΩΣΣΩΝ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Αθήνα: ΥΠΟΥΡΓΕΙΟ ΑΓΡΟΤΙΚΗΣ. ΑΝΑΠΤΥΞΗΣ & ΤΡΟΦΙΜΩΝ Αριθ.πρωτ: 2349/ Πληροφορίες Μ. Τζανή

Λ. Μεσογείων 56, Αμπελόκηποι, Αθήνα, Τηλ: , Fax:

Business Development, SAP Hellas 01/12/2007

Transcript:

ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΡΑΞΗ «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ» στο πλαίσιο του ΜΕΤΡΟΥ 3.3 «Έρευνα και Τεχνολογική Ανάπτυξη στην Κοινωνία της Πληροφορίας» ΕΡΓΟ - 9: ΙΑΤΡΟΛΕΞΗ ΠΑΡΑ ΟΤΕΟ Π3: Σύστηµα ιαχείρισης Σώµατος Κειµένων και Εξαγωγής Ορολογίας (λογισµικό) (στο παραδοτέο περιλαµβάνεται οπτικός δίσκος που περιέχει το λογισµικό) Ηµεροµηνία: 28.05.2007 Έκδοση: Τύπος: Final Εµπιστευτικό 1

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ 3 2 ΣΥΜΠΕΡΑΣΜΑΤΑ 6 3 ΒΙΒΛΙΟΓΡΑΦΙΑ 7 3.1 ΗΜΟΣΙΕΥΣΕΙΣ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΕΡΓΟΥ 7 3.2 ΣΧΕΤΙΚΟ ΛΟΓΙΣΜΙΚΟ 7 2

1 ΕΙΙΣΑΓΩΓΗ Το παρών παραδοτέο αποτελεί το Π3: «Σύστηµα ιαχείρισης Σώµατος Κειµένων και Εξαγωγής Ορολογίας» του έργου ΙΑΤΡΟΛΕΞΗ. Πρόκειται για ένα λογισµικό (στην πραγµατικότητα µια σειρά εργαλείων) που υλοποιήθηκε στο πλαίσιο της Ενότητας Εργασίας 2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας». Τα εργαλεία αυτά έγιναν για να υποστηρίξουν την ανάπτυξη των γλωσσικών πόρων του έργου, αλλά και την ολοκλήρωση των τελικών στόχων του. Τα εργαλεία που ολοκληρώθηκαν δεν υλοποιήθηκαν όλα από την αρχή. Με δεδοµένο ότι οι δύο φορείς διαθέτουν µακράν εµπειρία στην ανάπτυξη εργαλείων γλωσσικής τεχνολογίας, κάποια αναπτύχθηκαν εκ του µηδενός, κάποια βασίστηκαν πάνω σε ήδη υπάρχοντα προπλάσµατα και κάποια εµπλουτίστηκαν. Πιο συγκεκριµένα στα πλαίσια της παρούσας ΕΕ, ολοκληρώθηκαν τα παρακάτω συστηµάτων: 1) Αποθήκη Εγγράφων (Document Warehouse): είναι ο χώρος αποθήκευσης των κειµένων αλλά και των παραγόµενων από αυτά µεταδεδοµένων. Υλοποιήθηκε µε βάση την open source βάση δεδοµένων MySQL. 2) Προσκοµιστής Εγγράφων (Crawler): διατρέχει συγκεκριµένους δικτυακούς τόπους και προσκοµίζει τα κείµενα προς επεξεργασία. Υλοποιήθηκε σε Java (JDK 6.0). 3) Μετατροπέας Εγγράφων σε απλό κείµενο (Document Converter): µετατρέπει τα έγγραφα HTML ή PDF που προσκοµίζει ο Crawler σε έγγραφα TXT (δηλ. σε απλό κείµενο). Υλοποιήθηκε σε Java (JDK 6.0). Το εργαλείο αυτό δεν είχε προβλεφθεί αρχικά µια και είχε γίνει η εκτίµηση ότι θα βρεθούν έγγραφα έτοιµα σε µορφή κειµένου, κάτι που όπως αποδείχθηκε εκ των υστέρων δεν ήταν σωστό. 4) Αναγνωριστής Στοιχείων (Tokenizer): κερµατίζει ένα κείµενο σε µία σειρά στοιχείων (tokens: λέξεις, σηµεία στίξης, αριθµοί, σύµβολα κτλ.) µε τα οποία τροφοδοτούνται οι επόµενες φάσεις επεξεργασίας του κειµένου. Για την υλοποίησή του εξελίχθηκε ένα πρωτόλειο σχετικό σύστηµα που είχε αναπτυχθεί στο παρελθόν για ερευνητικούς σκοπούς. 5) Μορφοσυντακτικός Σχολιαστής (Morphosyntactic Tagger): επισυνάπτει µορφοσυντακτικά µεταδεδοµένα (µέρος του λόγου, γένος, αριθµός πτώση, κλπ.) σε κάθε λέξη του κειµένου (που έχει αναγνωρίσει ο Tokenizer). Αυτό πραγµατοποιείται µε τη βοήθεια του Μορφολογικού Λεξικού. Υλοποιήθηκε σε Java (JDK 6.0). 3

6) Μορφολογικό Λεξικό. Η Neurosoft Α.Ε. έχει αναπτύξει µορφολογικό λεξικό της Ελληνικής µε περίπου 90.000 λήµµατα, το οποίο περιέχει και περιορισµένο αριθµό βιοϊατρικών όρων. Το λεξικό αυτό εµπλουτίστηκε µε τις άγνωστες λέξεις-όρους (περίπου 7.250) που συλλέχθηκαν στο πλαίσιο της ΕΕ3. Το υπάρχον σύστηµα περιγραφής της κλίσης των ληµµάτων καλύπτει τον ορισµό της µορφοσυντακτικής πληροφορίας µονολεκτικών όρων. 7) Μηχανισµός Κλίσης Πολυλεκτικών Όρων. Στην ΕΕ3 επεκτάθηκε ο µηχανισµός κλίσης µονολεκτικών όρων ώστε να υποστηρίζει τον ορισµό πολυλεκτικών όρων. Για την υποστήριξη του µοντέλου αυτού, αναπτύχθηκε σχετική εφαρµογή, που παρέχει στο χρήστη τη δυνατότητα εύκολου ορισµού της κλίσης πολυλεκτικών όρων. 8) Αναγνωριστής Όρων. Αναπτύχθηκε σχετικό σύστηµα το οποίο συµβουλεύεται το Μορφολογικό Λεξικό, καθώς και τους κανόνες που περιγράφουν τη σύνταξη πολυλεκτικών όρων και αναγνωρίζει τους όρους αυτούς σε κείµενα, σε όποια κλιτική µορφή κι αν βρίσκονται. Σχεδόν όλα τα παραπάνω εργαλεία, µπορούν να χρησιµοποιηθούν αυτόνοµα. Επιπρόσθετα, για την καλύτερη και ευκολότερη χρήση τους από τρίτους (ερευνητές ή µη) ολοκληρώθηκαν (εκτός του crawler) κάτω από ένα κοινό περιβάλλον που καθοδηγεί το χρήστη σε διαδοχικές ενέργειες/βήµατα. Στο παραδοτέο Π4: Εγχειρίδιο χρήσης, περιγράφονται αναλυτικά τα υποσυστήµατα αυτά. Ο τρόπος περιγραφής που έχει επιλεγεί, περιλαµβάνει τρία βασικά τµήµατα για κάθε υποσύστηµα: Εισαγωγή: περιγράφεται γενικά το εργαλείο υποσύστηµα. Τεχνικά χαρακτηριστικά εγκατάσταση: δίνονται τα τεχνικά χαρακτηριστικά του και ο τρόπος εγκατάστασης. Εγχειρίδιο χρήσης: Περιγράφεται ο τρόπος χρήσης του συστήµατος. Τέλος στο ίδιο παραδοτέο (Π4), περιγράφεται και ένα επιπλέον εργαλείο που αποφασίστηκε να υλοποιηθεί µε βάση τις απαιτήσεις των ειδικών (ιατρών γλωσσολόγων): Ένας Συλλογέας Λεξιλογικών Συνάψεων (Concordancer), που όταν χρησιµοποιηθεί µε βάση τη συλλογή κειµένων, δίνει πολύ καίρια και σηµαντικά στοιχεία στον επιστήµονα σε σχέση µε τη λεξικογραφία ενός όρου. 4

Στο παρών, επισυνάπτεται οπτικός δίσκος (CD) στον οποίο περιέχεται το λογισµικό που αναφέρθηκε παραπάνω. Η διαδικασία εγκατάστασης και κάθε σχετική πληροφορία για το λογισµικό, περιλαµβάνεται στο παραδοτέο Π4. 5

2 ΣΥΜΠΕΡΑΣΜΑΤΑ Το παραδοτέο αυτό (Π3) περιλαµβάνει το «Σύστηµα ιαχείρισης Σώµατος Κειµένων και Εξαγωγής Ορολογίας» του έργου ΙΑΤΡΟΛΕΞΗ. Το παραδοτέο, είναι αποτελέσµατα της Ενότητας Εργασίας 2: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας». Βασικό συµπέρασµα της ενότητας συνολικά, είναι ότι η υλοποίηση των εργαλείων αποδείχθηκε περισσότερο δύσκολη και χρονοβόρα από ότι είχε προβλεφθεί. Ένας λόγος είναι ίσως ο γενικός νόµος που ισχύει στα έργα ανάπτυξης λογισµικού και τα φέρνει να είναι σχεδόν πάντα καθυστερηµένα σε σχέση µε το αρχικό χρονοδιάγραµµα. Ένας δεύτερος λόγος είναι η απαίτηση της ανάπτυξης εργαλείων από δύο φορείς, τα οποία στη συνέχεια έπρεπε να συνεργάζονται και να λειτουργούν συνεκτικά. Τέλος ένας ακόµα λόγος είναι το γεγονός ότι κάποιες απαιτήσεις για το λογισµικό και τις λειτουργίες του, έρχονταν από τους γλωσσολόγους και τους ιατρούς της οµάδας εργασίας, µόνον όταν οι τελευταίο, έπαιρναν µια πρόγευση (χρησιµοποιούσαν) των εργαλείων. Συµπερασµατικά τα εργαλεία που υλοποιήθηκαν πέτυχαν το στόχο τους: να βοηθήσουν στην ανάπτυξη των υποδοµών του έργου. Πιστεύουµε και ευελπιστούµε ότι θα ικανοποιήσουν και τον τελικό σκοπό τους: Την επίτευξη των τελικών στόχων του έργου! 6

3 ΒΙΙΒΛΙΙΟΓΡΑΦΙΙΑ 3.1 ΗΜΟΣΙΕΥΣΕΙΣ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΕΡΓΟΥ Α. Βαγγελάτος, Γ. Ορφανός, Χ. Τσαλίδης, Χρ. Καλαµαρά: Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων. 8ο Πανελλήνιο Επιστηµονικό Συνέδριο Management Υπηρεσιών Υγείας και κοινωνικής Φροντίδας, Ερέτρια, Οκτώβριος 2006. M. Pantazara, E. Mantzari, A. Vagelatos, Ch. Kalamara, A. Iordanidou: Development of a Greek biomedical corpus, 11th Panhellenic Conference on Informatics (PCI 2007), Patras, Greece, May 2007. Ch. Tsalidis, E. Mantzari, M. Pantazara, Ch. Diolis, A. Vagelatos: Developing a Greek biomedical corpus for text mining, Accepted for presentation at: Corpus Linguistics Conference 2007 (CL 2007), Birmingham, UK, July 2007. A. Vagelatos, E. Mantzari, G. Orphanos, Ch. Tsalidis, M. Pantazara, Ch. Kalamara, Ch. Diolis: Biomedical data mining for the Greek language, Accepted for presentation at: MEDNET 2007, Leipzig, Germany, October 2007. Α. Ιορδανίδου, Μ. Πανταζάρα, Ε. Μάντζαρη, Α. Βαγγελάτος, Γ. Ορφανός, Β. Παπαπαναγιώτου: Ζητήµατα αναγνώρισης των πολυλεκτικών σύνθετων όρων στον τοµέα της βιοϊατρικής. Έγινε δεκτό για παρουσίαση στο: 6ο Συνέδριο «Ελληνική Γλώσσα και Ορολογία» (2007), Αθήνα, Νοέµβριος 2007. 3.2 ΣΧΕΤΙΚΟ ΛΟΓΙΣΜΙΚΟ The source for Java developers: http://java.sun.com/ MySQL: The world s most popular open source database: http://www.mysql.com/ Open Source Initiative: http://www.opensource.org/ Ritmark FS (Filesystem Storage Engine for MySQL): http://www.ritmark.com 7