Software Production Company

Σχετικά έγγραφα
ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

7 0 0 /2 /7 0 : 2 1 ( 2 ( Google Yahoo

Π22: Τελική Αναφορά Έργου

Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Βαγγελάτος A. 1, Ορφανός Γ. 2, Τσαλίδης Χ. 2, Καλαμαρά Χ. 3

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ 3 2 ΤΟ ΠΡΟΓΡΑΜΜΑ ΤΗΣ ΗΜΕΡΙ ΑΣ 4 3 ΑΝΑΛΥΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΘΕΜΑΤΩΝ ΕΙΣΑΓΩΓΗ ΕΝΑΡΚΤΗΡΙΑ ΣΥΝΕ ΡΙΑ ΠΡΟΣΚΕΚΛΗΜΕΝΟ

Π17: Μορφοσυντακτικός και Σηµασιολογικός Σχολιαστής (λογισµικό)

Javascript. του project /software/web_tools/webapps/search_engine/.

Π18: Τεκµηρίωση Εφαρµογών Ιστού

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Σχεδιασµός Ανάπτυξη Οντολογίας

Π20: Ανακοινώσεις επιστηµονικών εργασιών σε συνέδρια/περιοδικά

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

/software/web_tools/webapps/speller/.

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΙΑΤΡΟΛΕΞΗ Το ορολόγιο της βιοϊατρικής: συλλογή και επεξεργασία του γλωσσικού υλικού. Μαβίνα Πανταζάρα, ρ. Γλωσσολόγος

. « : project site

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Πέργαµος: Το Σύστηµα Ψηφιακής Βιβλιοθήκης του Πανεπιστηµίου Αθηνών

DECO DECoration Ontology

Πρόσκληση Εκδήλωσης Ενδιαφέροντος

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

Ερευνητικό Πρόγραµµα BalkaNet

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

ΤΕΛΙΚΕΣ ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ (6 Μονάδες ECTS)- Ακαδημαϊκό Έτος

Η ΟΝΤΟΛΟΓΙΑ ΤΟΥ ΕΛΛΗΝΙΚΟΥ ΚΤΗΜΑΤΟΛΟΓΙΟΥ. Μελέτη υλοποίησης στο Protégé-2000

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ Ευρωπαϊκό Κοινωνικό Ταµείο ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙ ΕΙΑΣ ΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ & ΘΡΗΣΚΕΥΜΑΤΩΝ

Α.Π.: Προς: ΕΑΙΤΥ - ιευθυντή κο Σπυράκη

Γ ΚΟΙΝΟΤΙΚΟ ΠΛΑΙΣΙΟ ΣΤΗΡΙΞΗΣ

Ε.Π. «Κ.τ.Π.» Μέτρο 3.3 «Έρευνα και Τεχνολογική Ανάπτυξη στην ΚτΠ», Πράξη Επεξεργασία εικόνων, ήχου και γλώσσας»,

ΠΡΟΣΚΛΗΣΗ ΓΙΑ ΕΚ ΗΛΩΣΗ ΕΝ ΙΑΦΕΡΟΝΤΟΣ του ΕΑΙΤΥ

ΠΕΡΙΦΕΡΕΙΑ ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ I.S.TO.S. Services in South Aegean. Καινοτοµία για τον Αειφόρο Τουρισµό & τις υπηρεσίες στο Νότιο Αιγαίο

hypertext markup language (.htm) και σε Portable Document Format (.pdf) µορφή.

ανθρωπιστικών επιστημών για

ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΕΡΕΥΝΗΤΙΚΟ ΠΡΟΓΡΑΜΜΑ «ΑΡΧΙΜΗΔΗΣ ΙΙΙ Ενίσχυση Ερευνητικών Ομάδων στο ΤΕΙ Λάρισας»

Πανεπιστήµιο Πατρών Πρόγραµµα Βασικής Έρευνας Κ. Καραθεοδωρή. Προκήρυξη 2009

ΠΕΡΙΦΕΡΕΙΑΚΟΣ ΠΟΛΟΣ ΚΑΙΝΟΤΟΜΙΑΣ ΥΤΙΚΗΣ ΕΛΛΑ ΑΣ

ΑΔΑ: 4ΑΡΟ46941Δ-Ε. Συνολικός Προϋπολογισμός Έργου : ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΙΑ ΙΚΤΥΟ 137/

ΑΔΑ: ΒΙΦΓ9-ΟΔ1.

ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΕΙΔΙΚΗ ΥΠΗΡΕΣΙΑ ΔΙΑΧΕΙΡΙΣΗΣ Ε.Π. "ΕΚΠΑΙΔΕΥΣΗ & ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗ"

ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗΣ. Για την υποβολή προτάσεων προς σύναψη συμβάσεων μίσθωσης έργου Ιδιωτικού Δικαίου, για την

ΠΡΟΣΚΛΗΣΗ ΕΚ ΗΛΩΣΗΣ ΕΝ ΙΑΦΕΡΟΝΤΟΣ στα Σεµινάρια του Εργαστηρίου Προηγµένων Εκπαιδευτικών Τεχνολογιών και Εφαρµογών Κινητών Συσκευών

DARIAH και Europeana - Σημασιολογική Συσσώρευση και Διάθεση Περιεχομένου

"The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ "

Υποέργο: 2 Τίτλος: «Δημιουργία και Αξιολόγηση Εικονικού Χώρου Εργαστηριών Ηλεκτρονικής» Επιστημονικός Υπεύθυνος: ΠΑΝΕΤΣΟΣ ΣΠΥΡΟΣ

...στις µέρες µας, όσο ποτέ άλλοτε, οι χώρες καταναλώνουν χρόνο και χρήµα στη µέτρηση της απόδοσης του δηµόσιου τοµέα...(oecd)

Ινστιτούτο Ερευνών / Μελετών Τηλεπικοινωνιών & Πληροφορικής Ν.Α. Ευρώπης

o Η ψηφιακή διαµόρφωση των σχολικών βιβλίων της πρωτοβάθµιας και δευτεροβάθµιας εκπαίδευσης και ο εµπλουτισµός τους µε ψηφιακό διαδραστικό υλικό o Ο τ

ΠΡΟΣΚΛΗΣΗ ΕΚΔΗΛΩΣΗΣ ΕΝΔΙΑΦΕΡΟΝΤΟΣ ΣΥΝΕΡΓΑΣΙΑΣ ΜΕ ΜΕΛΗ ΕΠ ΑΝΑΡΤΗΤΕΑ ΣΤΗΝ ΙΣΤΟΣΕΛΙΔΑ ΤΕΙ ΠΑΤΡΩΝ ΓΡΑΦΕΙΟ ΔΙΑΣΥΝΔΕΣΗΣ

Ήλιος: Το ψηφιακό Αποθετήριο Ανοικτής Πρόσβασης του Εθνικού Ιδρύματος Ερευνών

Αναβάθμιση και εμπλουτισμός ΙδρυματικούΑποθετηρίουΕΜΠ

CESSDA ATTIKH: Παρουσίαση αποτελεσμάτων υποέργων Εθνικού Κέντρου Κοινωνικών Ερευνών. Ερευνητική Ομάδα ΕΚΚΕ

«DARIAH-ΑΤΤΙΚΗ Ανάπτυξη της ελληνικής ερευνητικής υποδοµής για τις ανθρωπιστικές επιστήµες ΥΑΣ»

ΕΡΓΟ Υλοποίηση Επιµόρφωσης εκπαιδευτικών Πληροφορικής

ΠΥΛΗ ΨΗΦΙΑΚΗΣ ΑΣΦΑΛΕΙΑΣ και ΨΗΦΙΑΚΗ ΑΣΦΑΛΕΙΑ ΣΤΗΝ Α ΓΥΜΝΑΣΙΟΥ

ΠΡΟΣΚΛΗΣΗ ΓΙΑ ΕΚ ΗΛΩΣΗ ΕΝ ΙΑΦΕΡΟΝΤΟΣ του Τομέα Επιμόρφωσης & Κατάρτισης του ΕΑΙΤΥ

Οι Μεταπτυχιακές Σπουδές ως εργαλείο ανάπτυξης της επιχειρηµατικότητας στον κλάδο της Πληροφορικής

Εσωτερικό Πρόγραμμα Ενίσχυσης Έρευνας Προκήρυξη 2015

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ. Τόπος : Αθήνα Ημερομηνία : 31/08/2010 Α.Π. : /ΨΣ4977-Α2

ΜΕΤΑΒΑΤΙΚΕΣ ΠΡΟΫΠΟΘΕΣΕΙΣ ΑΠΟΚΤΗΣΗΣ ΠΤΥΧΙΟΥ

Στόχοι και Προοπτικές

Τel. : / 4383, Fax :

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

digi-content Τεκμηρίωση

Το Αναδυόµενο Οικοσύστηµα της Πρόσβασης στη Γνώση. ρ. Εύη Σαχίνη Εθνικό Κέντρο Τεκµηρίωσης

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

Περιβάλλον Διαχείρισης Συνεδρίων και άλλων Επιστημονικών Εκδηλώσεων. Πολιτική Χρήσης

Α ΠΛΗΡΟΦΟΡΙΑΚΟ ΣΥΣΤΗΜΑ ΜΟΥΣΕΙΩΝ ΤΗΣ ΛΕΣΒΟΥ. Στόχος της εργασίας είναι ο σχεδιασμός και υλοποίηση μιας βάσης δεδομένων των Μουσείων της Λέσβου.

ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΚΡΗΤΗΣ

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Ανάλυση Απαιτήσεων Απαιτήσεις Λογισµικού

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

. « : 12: Protégé

ΥΠΟΥΡΓΕΙΟ ΑΝΑΠΤΥΞΗΣ. Επιχειρησιακό Σχέδιο. για την Κοινωνία της Πληροφορίας

H πλατφόρµα ItBiz E- Learn, συνοπτικά.

Ηµεροµηνία: Έκδοση: Τύπος: Final Eµπιστευτικό

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΣΤΗΝ ΧΡΗΣΗ ΚΑΙ ΑΞΙΟΠΟΙΗΣΗ ΤΩΝ ΤΠΕ ΣΤΗΝ ΕΚΠΑΙ ΕΥΤΙΚΗ Ι ΑΚΤΙΚΗ ΙΑ ΙΚΑΣΙΑ. Οδηγίες για την πιστοποίηση των εκπαιδευτικών

ΕΚΤ και καινοτομία με ανοιχτά δεδομένα και APIs

ΠΡΟΣΚΛΗΣΗ ΕΚ ΗΛΩΣΗΣ ΕΝ ΙΑΦΕΡΟΝΤΟΣ

Certified Project Manager in Information Technology (CPMIT)

Υποστηρίζοντας την Ανοικτή Επιστήμη

ΕΡΓΟ Υλοποίηση Επιμόρφωσης Εκπαιδευτικών Πληροφορικής

Προβλήματα και Προοπτικές

Επικοινωνιών στην Εκπαίδευση. Τεχνολογίες Πληροφορίας & (ΤΠΕ-Ε)

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

Transcript:

Ανάπτυξη Υποδοµής Γλωσσικής Τεχνολογίας για το Βιοϊατρικό Τοµέα Neurosoft A.E. --- ΕΑΙΤΥ ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ» Προϋπολογισµός: 561.240 ιάρκεια: 18 µήνες ΕπιστηµονικόςΥπεύθυνος: Ά. Βαγγελάτος Σελίδα 1 Ηµεροµηνία: 20/7/2007

Ανάπτυξη Υποδοµής Γλωσσικής Τεχνολογίας για το Βιοϊατρικό Τοµέα ΕΤΗΣΙΑ ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Φυσικού Αντικειµένου Σελίδα 2 Ηµεροµηνία: 20/7/2007 Neurosoft, 20-7-2007

Neurosoft A.E. Software Production Company http://www.neurosoft.gr Μακρά εµπειρία σε θέµατα Επεξεργασίας Φυσικής Γλώσσας (Ελεγκτής Ορθογραφίας, Θησαυρός κ.ά.) Σελίδα 3 Ηµεροµηνία: 20/7/2007

ΕΑΙΤΥ Ερευνητικό Ακαδηµαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών Μη κερδοσκοπικού χαρακτήρα, Εποπτευόµενο από το Υπουργείο Παιδείας http://www.cti.gr Έδρα: ΠανεπιστήµιοΠατρών Σελίδα 4 Ηµεροµηνία: 20/7/2007 Παράρτηµα: Αθήνα Προσωπικό: 200

Αντικείµενο του έργου Αντικείµενο της παρούσας πρότασης έργου είναι η δηµιουργία της απαραίτητης γλωσσικής υποδοµής για την ελληνική γλώσσα, που θα επιτρέψει σε πρώτη φάση την καλύτερη διαχείριση και επεξεργασία της βιοϊατρικής πληροφορίας που υπάρχει σε ψηφιακή µορφή. Αυτό θα καταστεί δυνατό µε τη δηµιουργία και διάθεση στους χρήστες εξελιγµένων εργαλείων για την αναζήτηση, τη συσχέτιση και το χαρακτηρισµό των βιοϊατρικών κειµένων. Σελίδα 5 Ηµεροµηνία: 20/7/2007 Σε επόµενη φάση (πέρα από το πλαίσιο του παρόντος), είναι δυνατή η επέκταση των αποτελεσµάτων του και η διαµόρφωσή του ώστε να εξυπηρετεί και άλλους σκοπούς (π.χ. υλοποίηση δυνατοτήτων semantic web σε βιοϊατρικούς ιστοχώρους κτλ.).

Αντικείµενο του έργου (παραγόµενα) I Οντολογία Βιοϊατρικών όρων Υπολογιστικοί πόροι και εργαλεία που θα υποστηρίξουν την ανάπτυξη της οντολογίας: 1) Μορφολογικό Λεξικό (της Neurosoft) εµπλουτισµένο µε βιοϊατρικούς όρους. 2) Μορφοσυντακτικός Σχολιαστής (Morphosyntactic Tagger), ο οποίος θα χαρακτηρίζει µορφοσυντακτικά κάθε λέξη ενός κειµένου. 3) Αναγνωριστής Ονοµατικών Φράσεων (Noun-Phrase Chunker), ο οποίος θα ανιχνεύει πολυλεκτικούς όρους σε κείµενα µε χρήση µορφοσυντακτικών κανόνων. 4) Περιβάλλον Ανάπτυξης - Παρουσίασης Οντολογιών, βασισµένο στο state-of-the-art σύστηµα Protégé. 5) Σηµασιολογικός Σχολιαστής (Semantic Tagger), ο οποίος θα επισυνάπτει πληροφορία από την οντολογία σε όρους που αναγνωρίζονται σε κείµενα. 6) Μηχανισµός δεικτοδότησης βιοϊατρικών κειµένων. Σελίδα 6 Ηµεροµηνία: 20/7/2007

Αντικείµενο του έργου (παραγόµενα) II Σώµα (corpus) βιοϊατρικώνκειµένων. ΕφαρµογέςΙστούµετιςοποίεςοχρήστηςθαµπορεί: 1) Ναελέγχειτηνορθογραφίαµίαςλέξης (βιοϊατρικόςόρος). 2) Να περιηγείται στην οντολογία πραγµατοποιώντας σύνθετες αναζητήσειςγιασχέσειςπουδιέπουνόρουςτηςοντολογίας. 3) Να εισάγει ένα νέο κείµενο και να λαµβάνει ως αποτέλεσµα το κείµενο µε µορφοσυντακτικούς και σηµασιολογικούς σχολιασµούς των όρων τουκειµένου (annotations). 4) Να αναζητεί κείµενα µε συγκεκριµένους όρους ή συνδυασµό όρων ή σχέσεωνπουισχύουνσεόρους. Σελίδα 7 Ηµεροµηνία: 20/7/2007

Ενότητες Εργασίας 1. Σχεδιασµός Σώµατος Βιοϊατρικών Κειµένων και Οντολογίας 2. Υλοποίηση Εργαλείων ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας 3. Συλλογή Βιοϊατρικών Κειµένων και Εξαγωγή Ορολογίας 4. Επεξεργασία Βιοϊατρικών Όρων και ηµιουργία Οντολογίας 5. Υλοποίηση Εφαρµογών Ιστού Σελίδα 8 Ηµεροµηνία: 20/7/2007 6. ιάχυση Αποτελεσµάτων

1. Σχεδιασµός Σώµατος Βιοϊατρικών Κειµένων και Οντολογίας Περιγραφή: Στην ΕΕ1 σχεδιάστηκε το σώµα βιοϊατρικών κειµένων και ορίστηκε το µοντέλο οντολογικής αναπαράστασης της ορολογίας. Έναρξη:Τ0 Λήξη:Τ0 + 6 Παραδοτέα: Σχέδιο Συγκρότησης Σώµατος Βιοϊατρικών Κειµένων (τεχνική αναφορά) Σελίδα 9 Ηµεροµηνία: 20/7/2007 Μοντέλο Αναπαράστασης Οντολογίας (τεχνική αναφορά)

1. Σχεδιασµός Σώµατος Βιοϊατρικών Κειµένων και Οντολογίας Σε αυτή την ενότητα εργασίας σχεδιάστηκε ουσιαστικά και σε λεπτοµέρεια το συνολικό έργο. Καθορίστηκε και περιγράφηκε το απαιτούµενο σώµα κειµένωνκαισχεδιάστηκεηµεθοδολογίαγιατηνανάπτυξητηςοντολογίας. Πιο συγκεκριµένα, δύο ήταν οι κατευθύνσεις µελέτης της ΕΕ1: α) Η εκπόνηση ενός σχεδίου συγκρότησης σώµατος βιοϊατρικών κειµένων και β) Ο καθορισµός του µοντέλου αναπαράστασης της οντολογίας. Σελίδα 10 Ηµεροµηνία: 20/7/2007 Tα παραπάνω απεικονίζονται λεπτοµερώς στα σχετικά παραδοτέα Π1 και Π2.

2. Υλοποίηση Εργαλείων ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας Περιγραφή: Στην ΕΕ2 αναπτύχθηκαν εργαλεία για τη διαχείριση σώµατος κειµένων και την αυτόµατη εξαγωγή ορολογίας, τα οποία υποστήριξαν και υποστηρίζουν την ανάπτυξη γλωσσικών πόρων. Έναρξη:Τ0 + 1 Λήξη:Τ0 + 11 Παραδοτέα: Σύστηµα ιαχείρισης Σώµατος Κειµένων και Εξαγωγής Ορολογίας (λογισµικό) Σελίδα 11 Ηµεροµηνία: 20/7/2007 Εγχειρίδιο Χρήσης

2. Υλοποίηση Εργαλείων ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας Στο πλαίσιο της παρούσας ΕΕ, ολοκληρώθηκαν τα παρακάτω συστήµατα: Αποθήκη Εγγράφων (Document Warehouse): είναι ο χώρος αποθήκευσης των κειµένων αλλά και των παραγόµενων από αυτά µεταδεδοµένων. Υλοποιήθηκε µε βάση την open source βάση δεδοµένων MySQL. Προσκοµιστής Εγγράφων (Crawler): διατρέχει συγκεκριµένους δικτυακούς τόπους ή τοπικούς δίσκους και προσκοµίζει τα κείµενα προς επεξεργασία. Υλοποιήθηκε σε Java (JDK 6.0). Μετατροπέας Εγγράφων (Document Converter): µετατρέπει τα έγγραφα HTML ή PDF που προσκοµίζειοcrawlerσεέγγραφα TXT (δηλ. σεαπλόκείµενο). Υλοποιήθηκεσε Java (JDK 6.0). ΑναγνωριστήςΣτοιχείων (Tokenizer): κερµατίζειένακείµενοσεµίασειράστοιχείων (tokens: λέξεις, σηµεία στίξης, αριθµοί, σύµβολα κτλ.) µε τα οποία τροφοδοτούνται οι επόµενες φάσεις επεξεργασίαςτουκειµένου. Μορφοσυντακτικός Σχολιαστής (Morphosyntactic Tagger): επισυνάπτει µορφοσυντακτικά µεταδεδοµένα (µέρος του λόγου, γένος, αριθµός πτώση κτλ.) σε κάθε λέξη του κειµένου (που έχει αναγνωρίσει ο Tokenizer) µε τη βοήθεια του Μορφολογικού Λεξικού. Υλοποιήθηκε σε Java (JDK 6.0). Σελίδα 12 Ηµεροµηνία: 20/7/2007

2. Υλοποίηση Εργαλείων ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας Μορφολογικό Λεξικό. Η Neurosoft Α.Ε. έχει αναπτύξει µορφολογικό λεξικό της ελληνικής µε περίπου 90.000 λήµµατα, το οποίο περιέχει και περιορισµένο αριθµό βιοϊατρικών όρων. Το λεξικό αυτό εµπλουτίστηκε µε τις άγνωστες λέξεις-όρους (περίπου 7.250) που συλλέχθηκαν στοπλαίσιοτηςεε3. Μηχανισµός Κλίσης Πολυλεκτικών Όρων. Στην ΕΕ3 επεκτάθηκε ο µηχανισµός κλίσης µονολεκτικών όρων ώστε να υποστηρίζει τον ορισµό πολυλεκτικών όρων. Για την υποστήριξη του µοντέλου αυτού αναπτύχθηκε σχετική εφαρµογή, που παρέχει τη δυνατότητα εύκολου ορισµούτηςκλίσηςπολυλεκτικώνόρων. Αναγνωριστής Όρων. Αναπτύχθηκε σχετικό σύστηµα το οποίο συµβουλεύεται το Μορφολογικό Λεξικό, καθώς και τους κανόνες που περιγράφουν τη σύνταξη πολυλεκτικών όρων και αναγνωρίζειτουςόρουςαυτούςσεκείµενα, σεόποιακλιτικήµορφήκιανβρίσκονται. Σχεδόν όλα τα παραπάνω εργαλεία, µπορούν να χρησιµοποιηθούν αυτόνοµα. Επιπρόσθετα, για την καλύτερη και ευκολότερη χρήση τους από τρίτους (ερευνητές ή µη) ολοκληρώθηκαν κάτω απόένακοινόπεριβάλλονπουκαθοδηγείτοχρήστησεδιαδοχικέςενέργειες/βήµατα. Τέλος, υλοποιήθηκε και ένας Συλλογέας Λεξιλογικών Συνάψεων (Concordancer), που, όταν χρησιµοποιηθεί µε βάση τη συλλογή κειµένων, δίνει σηµαντικές λεξικογραφικές πληροφορίες γιακάθεόρο (http://www.iatrolexi.gr/tools/webconc). Σελίδα 13 Ηµεροµηνία: 20/7/2007

3. Συλλογή Βιοϊατρικών Κειµένων και Εξαγωγή Ορολογίας Περιγραφή: Στην ΕΕ3 έγινε η συλλογή και επεξεργασία βιοϊατρικών κειµένων, η εξαγωγή βιοϊατρικών όρων, ο εµπλουτισµός του Μορφολογικού Λεξικού και ο καθορισµός της ταξινοµίας που αποτελεί τηβάσητηςοντολογίας. Έναρξη:Τ0 + 2 Λήξη:Τ0 + 9 Παραδοτέα: Μονολεκτικοί Όροι Βιοϊατρικής (αρχείο δεδοµένων) Κανόνες Αναγνώρισης Πολυλεκτικών Όρων Βιοϊατρικής (αρχείο δεδοµένων + αναφορά τεκµηρίωσης) Πολυλεκτικοί Όροι Βιοϊατρικής (αρχείο δεδοµένων) Αρχική Ταξινοµία Βιοϊατρικών Όρων (αρχείο δεδοµένων) Συλλογή βιοϊατρικών κειµένων (αρχείο) Τεκµηρίωση συλλογής βιοϊατρικών κειµένων (αναφορά) Σελίδα 14 Ηµεροµηνία: 20/7/2007

3. Συλλογή Βιοϊατρικών Κειµένων και Εξαγωγή Ορολογίας Στην ενότητα εργασίας αυτή συλλέχθηκε από τον κυβερνοχώροτοαπαραίτητοσώµαβιοϊατρικώνκειµένων. Τοσώµααυτόπεριέχει 6.276 κείµενακαιπερίπου 11,5 εκ. λέξεις. Από το σώµα αυτό, εξήχθησαν οι ιατρικοί όροι που µαζί και µε τους όρους που συλλέχθηκαν από ιατρικά λεξικά έφτασαν τους περίπου 7.250. Τους όρους αυτούς επιµελήθηκανοιιατροίκαιοιγλωσσολόγοι. Επιπλέον συλλέχθηκαν και οι πολυλεκτικοί όροι, που ανέρχονται περίπου σε 5.000. Σελίδα 15 Ηµεροµηνία: 20/7/2007

4. Επεξεργασία Βιοϊατρικών Όρων και ηµιουργία Οντολογίας Στόχος: Στην ΕΕ4 θα αναπτυχθεί η οντολογία βιοϊατρικών όρων. Έναρξη:Τ0 + 4 Λήξη:Τ0 + 14 Παραδοτέα: Σελίδα 16 Ηµεροµηνία: 20/7/2007 Προσαρµοσµένο Protégé (λογισµικό + αναφορά προσαρµογών) Αρχική Ταξινοµία εντός Protégé (αρχείο δεδοµένων) Οντολογία Βιοϊατρικών Όρων (αρχείο δεδοµένων)

5. Υλοποίηση Εφαρµογών Ιστού Στόχος: Στην ΕΕ5 θα αναπτυχθούν εφαρµογές ιστού, οι οποίες θα επιτρέπουν την αξιοποίηση των αποτελεσµάτων του έργου µέσα από το διαδίκτυο. Έναρξη:Τ0 + 11 Λήξη:Τ0 + 18 Παραδοτέα: Περιηγητής Οντολογίας Μηχανή Αναζήτησης Ορθογραφικός ιορθωτής Ιστού Μορφοσυντακτικός και Σηµασιολογικός Σχολιαστής Τεκµηρίωση Εφαρµογών Ιστού Σελίδα 17 Ηµεροµηνία: 20/7/2007

6. ιάχυση Αποτελεσµάτων Στόχος: Στην ΕΕ6 θα υλοποιηθεί σειρά ενεργειών και δράσεων δηµοσιοποίησης της µεθοδολογίας και των αποτελεσµάτων του προτεινόµενου έργου. Έναρξη:Τ0 + 3 Λήξη:Τ0 + 18 Παραδοτέα: Υλοποίηση και συντήρηση project site Ανακοινώσεις επιστηµονικών εργασιών σε συνέδρια / περιοδικά Ηµερίδα διάχυσης αποτελεσµάτων (πρόγραµµα υλικό) Τελική Αναφορά Έργου Σελίδα 18 Ηµεροµηνία: 20/7/2007

Χρ/γραµµα Σελίδα 19 Ηµεροµηνία: 20/7/2007

Σελίδα 20 Ηµεροµηνία: 20/7/2007

Σελίδα 21 Ηµεροµηνία: 20/7/2007

Σελίδα 22 Ηµεροµηνία: 20/7/2007

Σελίδα 23 Ηµεροµηνία: 20/7/2007

Σελίδα 24 Ηµεροµηνία: 20/7/2007

Σελίδα 25 Ηµεροµηνία: 20/7/2007

Σελίδα 26 Ηµεροµηνία: 20/7/2007

Σελίδα 27 Ηµεροµηνία: 20/7/2007

είκτες είκτες Aριθµός εταιρειών που θα ωφεληθούν από την υλοποίηση του προγράµµατος. Aριθµός ερευνητικών φορέων που θα ωφεληθούν από την υλοποίηση του προγράµµατος. Αριθµός επιστηµονικών ανακοινώσεων που θα προκύψουν από το έργο Νέες θέσεις εργασίας πλήρους απασχόλησης (αριθµός) Θέσεις εργασίας που δηµιουργούνται κατά τη διάρκεια υλοποίησης του έργου (ισοδύναµα ανθρωποέτη δωδεκάµηνης διάρκειας) Τιµή Στόχος 10 6 6 2 15,5 Σηµερινή τιµή? 1 7 2 11 Σελίδα 28 Ηµεροµηνία: 20/7/2007 Νέες προσλήψεις γυναικών (αριθµός) 1 2 ραστηριότητες ενηµέρωσης, διάδοσης, προβολής, ευαισθητοποίησης του κοινού (αριθµός) 2 1

Επιστηµονικές Ανακοινώσεις Σελίδα 29 Ηµεροµηνία: 20/7/2007

Επιστηµονικές Ανακοινώσεις (έχουν γίνει) Σεπτ. 2006, 8 ο ΠανελλήνιοΣυνέδριο, Management Υπηρεσιών Υγείας, Ερέτρια, Ά. Βαγγελάτος Μάιος 2007, 11 th PanHellenic Conference on Informatics, Πάτρα, Ά. Βαγγελάτος Ιούλιος 2007, 5 th International Conference on Information Communication Technologies in Health, Σάµος, Ά. Βαγγελάτος Σελίδα 30 Ηµεροµηνία: 20/7/2007

Ερευνητικοί Φορείς που θα ωφεληθούν Έχει ήδη εκδηλωθεί ενδιαφέρον για συνεργασία (αξιοποίηση των αποτελεσµάτων του έργου) από το εργαστήριο Ηλεκτρονικής ιακυβέρνησης του ΕΚΠΑ (δρ. ηµήτρης Γκούσκος) Σελίδα 31 Ηµεροµηνία: 20/7/2007

Συνεργασία Φορέων Η συνεργασία των φορέων στο φυσικό αντικείµενο υπήρξε µέχρι σήµερα ιδιαίτερα θετική. Προς αυτή την κατεύθυνση βοήθησαν: Α) Η ισότιµη (µε βάση το Τεχνικό Παράρτηµα) συνεργασία σε όλα τα επίπεδα Σελίδα 32 Ηµεροµηνία: 20/7/2007 Β) Η µακρά συνεργασία στο παρελθόν, τόσο σε επίπεδο ατόµων όσο και σε επίπεδο φορέων.

Συνέχεια Ευελπιστούµεηεξέλιξητουέργουναείναιστοίδιοκαλόπλαίσιοπουήταν µέχρι τώρα. Αξιολογούµε ότι ίσως χρειαστεί µικρή παράταση, εφόσον, όπως φαίνεται µέχρι σήµερα, υπάρχει κάποια καθυστέρηση (~1,5 µήνας) στην ολοκλήρωση των ΕΕ και στην παράδοση των παραδοτέων. Ηκαθυστέρησηαυτήοφείλεταιαφενόςστηχρονοβόρα, όπωςαποδείχθηκε, διαδικασία επεξεργασίας των όρων (από τους γλωσσολόγους και ιατρούς) και αφετέρου στη δυσκολία (µεγαλύτερη απ ό,τι είχε προβλεφθεί) στην ανάπτυξη κάποιων εφαρµογών. Σελίδα 33 Ηµεροµηνία: 20/7/2007

Επί της ουσίας, ένα έργο γλωσσικής τεχνολογίας για το πεδίο της Βιοϊατρικής, όπου κατά τεκµήριο υπάρχουν µεγάλες ανάγκες. Σελίδα 34 Ηµεροµηνία: 20/7/2007