The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling



Σχετικά έγγραφα
Π20: Ανακοινώσεις επιστηµονικών εργασιών σε συνέδρια/περιοδικά

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

Software Production Company

Σχεδιασµός Ανάπτυξη Οντολογίας

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Οντολογία Ψηφιακής Βιβλιοθήκης

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

DECO DECoration Ontology

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Υποστήριξη στη ιαχείριση Γνώσης

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Description Logics. Γεώργιος Χρ. Μακρής MSc, MEd

Toward a SPARQL Query Execution Mechanism using Dynamic Mapping Adaptation -A Preliminary Report- Takuya Adachi 1 Naoki Fukuta 2.

ΑΝΑΚΤΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ ΚΑΙ ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ Γ.Τ.Π

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Javascript. του project /software/web_tools/webapps/search_engine/.

hypertext markup language (.htm) και σε Portable Document Format (.pdf) µορφή.

Διαχείριση οντολογιών: μελέτη και εμβάθυνση στα βασικά προβλήματα που την αφορούν και παρουσίαση υπαρχουσών βιβλιοθηκών οντολογιών

Κεφάλαιο 29. Τεχνητή Νοημοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου

Χρήση οντολογιών στη χαρτογράφηση γνώσης: Μελέτη περίπτωσης σε μία ακαδημαϊκή βιβλιοθήκη

Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Βαγγελάτος A. 1, Ορφανός Γ. 2, Τσαλίδης Χ. 2, Καλαμαρά Χ. 3

Π22: Τελική Αναφορά Έργου

Ερευνητική+Ομάδα+Τεχνολογιών+ Διαδικτύου+

Π17: Μορφοσυντακτικός και Σηµασιολογικός Σχολιαστής (λογισµικό)

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

author Ανάκτηση πολυµεσικού περιεχοµένου & quality image semantic web & video Κωνσταντίνος Μικάλεφ multimedia

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Ανάκτηση Πληροφορίας

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Οντολογία σύμφωνα με τη Φιλοσοφία

Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση

Σηµασιολογικό Ιστό. Αλέξανδρος Βαλαράκος Αιγαίου.

Ζητήματα Τυποποίησης στην Ορολογία - ο ρόλος και οι δράσεις της Επιτροπής Ορολογίας ΤΕ21 του ΕΛΟΤ

Διακιρυξθ Διαγωνιςμοφ για το Ζργο ΨΘΦΙΑΚΘ ΠΕΡΙΘΓΘΘ ΣΟ ΠΟΛΙΣΙΣΙΚΟ ΚΑΙ ΙΣΟΡΙΚΟ ΑΡΧΕΙΟ ΣΟΤ ΧΑΪΔΑΡΙΟΤ

Εισαγωγή στις Οντολογίες και το Σημασιολογικό Ιστό

ΠΑΝΕΠΙΣΤΗΜΙΟ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ

ΟΝΤΟΛΟΓΙΕΣ, ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΔΙΑΚΥΒΕΡΝΗΣΗΣ

7 0 0 /2 /7 0 : 2 1 ( 2 ( Google Yahoo

Προγράμματα για τη δημιουργία και διαχείριση θησαυρού

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

/software/web_tools/webapps/speller/.

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Η Επιτροπή ΤΕ 21 και το έργο της

Τεχνολογία ανάπτυξης νέων ιστοσελίδων στο Semantic Web.

ΟΝΤΟΛΟΓΙΕΣ & ΘΗΣΑΥΡΟΙ

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Εξωτερικός Συνεργάτης στο διπλογραφικό σύστημα φορέων και οργανισμών. κατείχα: Κύριες δραστηριότητες και Ενδεικτικά αναφέρονται:

ΝΕΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ, ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ, ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ, ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ 3 2 ΤΟ ΠΡΟΓΡΑΜΜΑ ΤΗΣ ΗΜΕΡΙ ΑΣ 4 3 ΑΝΑΛΥΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΘΕΜΑΤΩΝ ΕΙΣΑΓΩΓΗ ΕΝΑΡΚΤΗΡΙΑ ΣΥΝΕ ΡΙΑ ΠΡΟΣΚΕΚΛΗΜΕΝΟ

Η ΟΝΤΟΛΟΓΙΑ ΤΟΥ ΕΛΛΗΝΙΚΟΥ ΚΤΗΜΑΤΟΛΟΓΙΟΥ. Μελέτη υλοποίησης στο Protégé-2000

-,,.. Fosnot. Tobbins Tippins -, -.,, -,., -., -,, -,.

Πληροφοριακά Συστήματα

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Linked Data for the Masses: Η προσέγγιση και το λογισμικό

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

Β Ι Ο Γ Ρ Α Φ Ι Κ Ο Σ Η Μ Ε Ι Ω Μ Α

Ανάπτυξη Οντολογίας για τη δομή και τη λειτουργία Τηλεπικοινωνιακού Οργανισμού

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

: ΗΥ-215, : ΗΥ-217, ΗΥ-370

. « : 12: Protégé

Ο ρόλος των ελεγχόμενων λεξιλογίων και θησαυρών στην οργάνωση της γνώσης

5.3.1 Γενικά οµή & οργάνωση της βάσης δεδοµένων... 45

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧ/ΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΕΚΠΟΝΗΣΗ ΕΡΓΑΣΙΑΣ

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

DECO-DECoration Ontology.

Σημασιολογικός Ιστός RDF(S) OWL Οντολογίες. Pervasive Computing Research Group

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

Επέκταση του Ελληνικού WordNet µε Όρους Πληροφορικής και Σηµασιολογικές Σχέσεις Βασισµένες σε Μοντέλο Κατανόησης Κειµένου

Ορολογία, οντολογία και οντοορολογία: επισκόπηση των εννοιών και συζήτηση για τη σχέση μεταξύ τους Κατερίνα Τοράκη

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Εισαγωγή στη Γνωστική Ψυχολογία. επ. Κωνσταντίνος Π. Χρήστου

Μάθηµα 6. Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

19. Διαχείριση ορολογίας για την ανάπτυξη οντολογιών επιχειρησιακών

Μοντέλο Οντοτήτων-Συσχετίσεων. Η ανάγκη Διαγράμματα ΟΣ Σύνολα Οντοτήτων-Συσχετίσεων Απεικονίσεις Επεκτάσεις

Ολοκληρωμένη Πλατφόρμα Δικτύωσης της Δημόσιας Διοίκησης για την παροχή ενιαίων και εξατομικευμένων ηλεκτρονικών υπηρεσιών σε πολίτες και επιχειρήσεις»

Ιχνηλασιμότητα η τροφίμων φμ με ανοικτό διαδικτυακό σύστημα:

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

From Secure e-computing to Trusted u-computing. Dimitris Gritzalis

Ανάπτυξη οντολογίας για τη δομή και τις διαδικασίες του Τμήματος Σπουδών ΑΠΘ

Μοντέλα Κυβερνητικής Πληροφορίας

Αρχές Προγραμματισμού Υπολογιστών


FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2016

Η Πληροφορική ως γνώση και εργαλείο για τον σύγχρονο μηχανικό. Νικόλαος Μήτρου Καθηγητής, ΕΜΠ

Transcript:

ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΡΑΞΗ «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ» στο πλαίσιο του ΜΕΤΡΟΥ 3.3 «Έρευνα και Τεχνολογική Ανάπτυξη στην Κοινωνία της Πληροφορίας» ΕΡΓΟ - 9: ΙΑΤΡΟΛΕΞΗ ΠΑΡΑ ΟΤΕΟ (αρχείο δεδοµένων: στο παραδοτέο περιλαµβάνεται οπτικός δίσκος που περιέχει την οντολογία) Ηµεροµηνία: 022.12.2007 Έκδοση: Τύπος: Final Εµπιστευτικό 1

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ...3 2 ΟΝΤΟΛΟΓΙΕΣ...4 2.1 ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ ΚΑΙ ΟΝΤΟΛΟΓΙΕΣ...4 2.1.1 Σηµασιολογικός Ιστός...4 2.1.2 Η σχέση του Σηµασιολογικού Ιστού µε τον Παγκόσµιο Ιστό...5 2.1.3 Τα συστατικά του Σηµασιολογικού Ιστού...5 2.2 Οντολογίες...6 2.2.1 Ορισµός της οντολογίας...6 2.2.2 Τα κύρια συστατικά των οντολογιών...6 3 ΟΝΤΟΛΟΓΙΑ ΒΙΟΪΑΤΡΙΚΩΝ ΟΡΩΝ...8 3.1 Βήµα 1 ο : Καθορισµός µοντέλου αναπαράστασης και αρχικής ταξινοµίας...8 3.2 Βήµα 2 ο : Κατάρτιση της µακροδοµής της οντολογίας...8 3.3 Οντότητες στην Οντολογία...10 4 ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...11 5 Ο ΗΓΙΕΣ ΧΡΗΣΗΣ ΤΟΥ ΟΠΤΙΚΟΥ ΙΣΚΟΥ...13 6 ΒΙΒΛΙΟΓΡΑΦΙΑ...17 6.1 ηµοσιεύσεις στα πλαίσια του έργου...17 6.2 Σχετική Βιβλιογραφία...18 2

11 ΕΙΣΑΓΩΓΗ Το παρόν παραδοτέο περιλαµβάνει την οντολογία βιοϊατρικών όρων που αναπτύχθηκε στα πλαίσια του έργου «Ιατρολέξη» και ολοκληρώθηκε στην ενότητα ΕΕ4. Σύµφωνα µε το Τεχνικό Παράρτηµα του έργου, είχαν τεθεί οι παρακάτω προδιαγραφές: Μετά τον ορισµό του Μοντέλου Αναπαράστασης Οντολογίας (ΕΕ1, Παραδοτέο 2), η ΕΕ4 θα ξεκινήσει υλοποιώντας το µοντέλο αυτό µε προσαρµογή/επέκταση του περιβάλλοντος ανάπτυξης οντολογιών Protégé. Στη συνέχεια, η Αρχική Ταξινοµία Βιοϊατρικών Όρων (ΕΕ3, Παραδοτέο 4) θα εισαχθεί στο Protégé και πάνω σε αυτή θα στηριχθεί η ανάπτυξης της οντολογίας. Η οµάδα εξειδικευµένων γιατρών και έµπειρων γλωσσολόγων θα εξετάζει: 1) τους βιοϊατρικούς όρους που συλλέχθηκαν από τα κείµενα, 2) το περιβάλλον (context) που βρέθηκαν και κυρίως το περιβάλλον που συνεµφανίστηκαν οι όροι. 3) αν οι υποψήφιοι όροι είναι παραλλαγές όρων της οντολογίας ή νέοι όροι, 4) αν οι έννοιες που ορίσθηκαν στην οντολογία είναι επαρκείς για τον εισαγωγή ενός όρου στην οντολογία ή πρέπει να επεκταθεί η Οντολογία µε νέες έννοιες, 5) αν η συνεµφάνιση όρων σηµατοδοτεί κάποια σχέση που πρέπει να εισαχθεί στην οντολογία. Με βάση τα παραπάνω υλοποιήθηκε η οντολογία που περιλαµβάνεται στο παρόν παραδοτέο. Πιο συγκεκριµένα το περιλαµβάνει: 1. το αρχείο δεδοµένων της οντολογίας σε µορφή OWL (περιλαµβάνεται στον επισυναπτόµενο οπτικό δίσκο), 2. την Εφαρµογή Απεικόνισης Οντολογιών (βλέπε παραδοτέο Π12) που δίνει τη δυνατότητα πλοήγησης και αναζήτησης µε βάση τους όρους στην ελληνική γλώσσα. Το εργαλείο αυτό είναι µια αυτόνοµη εφαρµογή και δεν απαιτεί την εγκατάσταση του εργαλείου Protégé. Να σηµειωθεί εδώ ότι ο χρήστης, θα µπορεί να περιηγηθεί στην οντολογία και µέσω του σχετικού περιηγητή ιστού (Π14) που αναπτύσσεται στα πλαίσια της ΕΕ5 και θα αναρτηθεί στο site του έργου, 3. την παρούσα τεκµηρίωση. 3

22 ΟΝΤΟΛΟΓΙΕΣ Στο παραδοτέο «Π2: Μοντέλο Αναπαράστασης Οντολογίας» έγινε µια εις βάθος ανάλυση σε σχέση µε τον ορισµό των οντολογιών και τις µεθοδολογίες ανάπτυξής τους. Στο κεφάλαιο αυτό κάνουµε µια µικρή αναδροµή, δίνοντας έµφαση στις απαιτήσεις του παρόντος παραδοτέου. 2.1 ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ ΚΑΙ ΟΝΤΟΛΟΓΙΕΣ Η ανάπτυξη του Παγκοσµίου Ιστού άλλαξε ριζικά τον τρόπο επικοινωνίας των ανθρώπων, τον τρόπο διάθεσης και ανάπτυξης της πληροφορίας καθώς και τον τρόπο διεξαγωγής των επιχειρηµατικών δραστηριοτήτων. Η ανάπτυξη του Παγκόσµιου Ιστού δεν θα ήταν τόσο ραγδαία αν δεν υπήρχαν οι µηχανές αναζήτησης (π.χ. Google, Yahoo!, AltaVista) που βασίζονται σε λέξεις-κλειδιά. Παρ όλα αυτά υπάρχουν κάποια προβλήµατα που σχετίζονται µε τη χρήση τους. Ένα από αυτά είναι το γεγονός ότι τα αποτελέσµατα που επιστρέφουν είναι απλές ιστοσελίδες. Έτσι, αν χρειαζόµαστε πληροφορίες οι οποίες είναι κατανεµηµένες σε ξεχωριστά έγγραφα, θα πρέπει να εκτελέσουµε αρκετές αναζητήσεις µε διαφορετικές λέξεις-κλειδιά προκειµένου να ανακτήσουµε όλες τις σχετικές πληροφορίες. Ένα εξίσου σηµαντικό µειονέκτηµα των µηχανών αναζήτησης είναι η µεγάλη «ευαισθησία» τους στο λεξιλόγιο. Αυτό σηµαίνει ότι πολύ συχνά δεν επιστρέφονται έγγραφα που σχετίζονται µε τις λέξεις-κλειδιά για το λόγο ότι χρησιµοποιούν διαφορετική ορολογία. Αυτό δεν είναι αποτελεσµατικό γιατί οι σηµασιολογικά όµοιες αναζητήσεις θα έπρεπε να επιστρέφουν και ίδια αποτελέσµατα. Τη λύση στα προβλήµατα που αντιµετωπίζει ο Παγκόσµιος Ιστός έρχεται να δώσει µια επέκταση αυτού, ο Σηµασιολογικός Ιστός. 2.1.1 Σηµασιολογικός Ιστός Ο Σηµασιολογικός Ιστός (Semantic Web, SW) είναι ένα όραµα και µια πρόταση για τη µετεξέλιξη του διαδικτύου και ειδικότερα του Παγκόσµιου Ιστού. Ο στόχος του Σηµασιολογικού Ιστού είναι να εξελίξει το σηµερινό διαδίκτυο έτσι ώστε οι πληροφορίες που υπάρχουν και διακινούνται σε αυτό να είναι κατανοητές, και κατ επέκταση αυτόµατα επεξεργάσιµες από τους υπολογιστές. Ο Σηµασιολογικός Ιστός δεν είναι ένας νέος Παγκόσµιος Ιστός. Είναι µια επέκταση και βελτίωση του σηµερινού ιστού στην κατεύθυνση, κυρίως, της δόµησης της πληροφορίας έτσι ώστε να είναι προσπελάσιµη από προγράµµατα υπολογιστών. H σηµερινή αναπαράσταση των κειµένων στις σελίδες του Ιστού που προορίζεται για χρήση από ανθρώπους θα αντικατασταθεί από αναπαράσταση κατανοητή στους υπολογιστές. Ο Tim Berners-Lee, ο άνθρωπος που επινόησε τον Παγκόσµιο Ιστό το 1989 έχοντας το όραµα ενός ιστού δεδοµένων που να είναι επεξεργάσιµα από µηχανές, έδωσε τον ακόλουθο ορισµό για τον Σηµασιολογικό Ιστό: The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation." 4

Ο Σηµασιολογικός Ιστός, που αποτελεί µια πρωτοβουλία της Κοινοπραξίας του Παγκοσµίου Ιστού (World Wide Web Consortium W3C), παρέχει µια διεθνώς προσβάσιµη πλατφόρµα που επιτρέπει σε αυτοµατοποιηµένα εργαλεία αλλά και σε ανθρώπους να επεξεργάζονται και να µοιράζονται δεδοµένα. Το κλειδί για την επίτευξη του παραπάνω στόχου είναι τα µεταδεδοµένα (metadata) ή, αλλιώς, η µεταπληροφορία. Τα µεταδεδοµένα κάνουν σαφή την πληροφορία που είναι αόριστη και την εκθέτουν προς αναζήτηση, επεξεργασία και ενοποίηση (integration). Τα µεταδεδοµένα είναι δεδοµένα που αναφέρονται σε άλλα δεδοµένα (data about data). Συγκεκριµένα, περιέχουν µέρος της σηµασίας των δεδοµένων, γεγονός που δικαιολογεί τη λέξη «σηµασιολογικός» µέσα στον όρο Σηµασιολογικό Ιστό. 2.1.2 Η σχέση του Σηµασιολογικού Ιστού µε τον Παγκόσµιο Ιστό Ο Παγκόσµιος Ιστός βασίζεται κυρίως σε έγγραφα γραµµένα σε HTML (Hypertext Markup Language) [5], µια γλώσσα η οποία περιγράφει το σώµα ενός δοµηµένου κειµένου δίνοντας έµφαση στην οπτική παρουσίαση, διανθίζοντάς το µε αντικείµενα πολυµέσων, όπως εικόνες και φόρµες διαλόγου. Για παράδειγµα, µε τη χρήση της HTML και ενός προγράµµατος πλοήγησης µπορούµε να δηµιουργήσουµε και να παρουσιάσουµε µια ιστοσελίδα που απαριθµεί στοιχεία κάποιων προς πώληση βιβλίων. Όµως µε την HTML δεν µπορεί να γίνει αντιληπτό ότι το στοιχείο The Da Vinci Code χαρακτηρίζει ένα βιβλίο αφού αναφέρεται στον τίτλο του ή ότι το στοιχείο 20 αναφέρεται στην τιµή του. εν υπάρχει επίσης κανένας τρόπος να εκφραστεί το γεγονός ότι αυτά τα κοµµάτια πληροφορίας είναι αλληλένδετα στην περιγραφή ενός συγκεκριµένου στοιχείου (δηλαδή ενός βιβλίου και µόνο), ευδιάκριτου από άλλα που ίσως απαριθµούνται στην ίδια σελίδα. Ο Σηµασιολογικός Ιστός αντιµετωπίζει την αδυναµία αυτή χρησιµοποιώντας γλώσσες που περιγράφουν δεδοµένα και τη σχέση που έχουν αυτά µεταξύ τους. ύο από αυτές τις γλώσσες είναι η RDF (Resource Description Framework) και OWL (Web Ontology Language) οι οποίες περιγράφονται στην ενότητα 3.2.3 και 3.2.4 αντίστοιχα και είναι κατανοητές από τους υπολογιστές. 2.1.3 Τα συστατικά του Σηµασιολογικού Ιστού Ο Σηµασιολογικός Ιστός στηρίζεται από τις ακόλουθες γλώσσες και πρότυπα: XML (Extensible Markup Language) [9]: Είναι µια γλώσσα περιγραφής δεδοµένων τα οποία είναι εύκολο να τα διαβάσουν και να τα επεξεργαστούν τόσο οι άνθρωποι όσο και τα προγράµµατα. εν επιβάλλει κανέναν σηµασιολογικό περιορισµό στα δεδοµένα που περιγράφει. XML Schema [30]: Είναι µια γλώσσα η οποία περιορίζει τη δοµή των XML εγγράφων. RDF: Είναι ένα µοντέλο περιγραφής και επεξεργασίας µεταδεδοµένων. RDF Schema: Είναι ένας µηχανισµός περιγραφής πόρων και των σχέσεων ανάµεσα τους και αποτελεί σηµασιολογική επέκταση του RDF. OWL: Παρέχει έναν τρόπο περιγραφής όρων και σχέσεων γύρω από ένα πεδίο ενδιαφέροντος, προσφέροντας πιο ισχυρό συντακτικό από τις RDF και RDF Schema καθώς και πιο ισχυρή σηµασιολογία που βασίζεται στη λογική (logic based semantics). 5

2.2 ΟΝΤΟΛΟΓΙΕΣ Οι οντολογίες, όπως αναφέρθηκε στην προηγούµενη ενότητα, αποτελούν το δοµικό στοιχείο του Σηµασιολογικού Ιστού. Ωστόσο, χρησιµοποιούνται ευρέως και στον τοµέα της Τεχνητής Νοηµοσύνης (Artificial Intelligence), σε εφαρµογές που σχετίζονται µε τη διαχείριση της γνώσης, στο ηλεκτρονικό εµπόριο, στην ανάκτηση πληροφοριών, στην επεξεργασία της φυσικής γλώσσας και σε πολλούς ακόµα τοµείς. Στην ενότητα αυτή περιγράφονται τα βασικότερα χαρακτηριστικά των οντολογιών. 2.2.1 Ορισµός της οντολογίας Η οντολογία είναι µια έννοια που χρησιµοποιήθηκε για πρώτη φορά από τους αρχαίους Έλληνες φιλοσόφους στην προσπάθειά τους να απαντήσουν σε κάποια φιλοσοφικά ερωτήµατα σχετικά µε την ουσία και την ύπαρξη κάποιων πραγµάτων και εννοιών. Με τον όρο «οντολογία» εννοούµε την ακριβή περιγραφή πραγµάτων και εννοιών καθώς και των σχέσεων που υπάρχουν ανάµεσά τους. Ο πιο γνωστός ορισµός για την οντολογία, στην επιστήµη των υπολογιστών, πάνω στον οποίο στηρίχτηκαν και άλλοι ορισµοί, δόθηκε από τον Gruber και είναι ο ακόλουθος: An ontology is an explicit specification of a conceptualization. Παρακάτω αναφέρονται µερικοί ακόµα ενδεικτικοί ορισµοί που έχουν δοθεί για να περιγράψουν την έννοια της οντολογίας: Α logical theory which gives an explicit, partial account of a conceptualization. A set of logical axioms designed to account for the intended meaning of a vocabulary. An ontology is a hierarchically structured set of terms for describing a domain that can be used as a skeletal foundation for a knowledge base. Οι οντολογίες µπορούν να χωριστούν σε δύο κατηγορίες: α) Η µια κατηγορία περιλαµβάνει οντολογίες που αποτελούν απλές ταξινοµήσεις και ονοµάζονται lightweight οντολογίες. β) Στη δεύτερη κατηγορία ανήκουν οι οντολογίες οι οποίες µοντελοποιούν έννοιες και τις µεταξύ τους σχέσεις µε τη χρήση αξιωµάτων και περιορισµών. Οι οντολογίες που ανήκουν σ αυτή την κατηγορία ονοµάζονται heavyweight οντολογίες. 2.2.2 Τα κύρια συστατικά των οντολογιών Στην ενότητα αυτή περιγράφονται τα κύρια συστατικά µιας οντολογίας µε χρήση των Description Logics (DL). Ο όρος Description Logic αναφέρεται σε ένα υποσύνολο της λογικής πρώτης τάξης (First Order Logic), στο οποίο στηρίχθηκαν οι γλώσσες του Σηµασιολογικού Ιστού, όπως η OWL, και δεν υποστηρίζει την ύπαρξη ελεύθερων µεταβλητών. Μια DL οντολογία αποτελείται από τρία είδη συστατικών: κλάσεις (classes ή concepts), σχέσεις (roles ή properties) και στιγµιότυπα (individuals ή instances). 6

Οι κλάσεις αναπαριστούν έννοιες, είτε αφηρηµένες είτε συγκεκριµένες. Οι κλάσεις είναι σύνολα από στιγµιότυπα και συνήθως είναι οργανωµένες σε µια ιεραρχία, η οποία είναι γνωστή και ως ταξινοµία (taxonomy). Μπορούµε για παράδειγµα να αναπαραστήσουµε µια ταξινοµία από τους φοιτητές ενός πανεπιστηµίου (προπτυχιακοί, µεταπτυχιακοί, υποψήφιοι διδάκτορες κτλ.). Σε αυτήν την ταξινοµία η κλάση «Προπτυχιακός Φοιτητής» είναι υποκλάση της κλάσης «Φοιτητής». Οι σχέσεις αναπαριστούν δυαδικές συσχετίσεις ανάµεσα στα στιγµιότυπα των κλάσεων. Οι σχέσεις µπορεί να έχουν ένα πεδίο ορισµού (domain) και ένα πεδίο τιµών (range), ενώ συνδέουν στιγµιότυπα από το πεδίο ορισµού µε στιγµιότυπα από το πεδίο τιµών. Το πεδίο τιµών µπορεί να είναι είτε µια κλάση είτε ένας τύπος δεδοµένων. Ανάλογα µε το είδος του πεδίου τιµών, οι σχέσεις διακρίνονται στις ακόλουθες κατηγορίες: Relations: Στην κατηγορία αυτή ανήκουν οι σχέσεις που συνδέουν ένα στιγµιότυπο µε ένα άλλο στιγµιότυπο. Attributes: Στην κατηγορία αυτή ανήκουν οι σχέσεις που συνδέουν ένα στιγµιότυπο µε έναν literal τύπο δεδοµένων (π.χ. αριθµητικό, συµβολοσειρά κτλ.). Όπως και οι κλάσεις, έτσι και οι σχέσεις είναι δυνατόν να οργανωθούν σε ιεραρχίες. Για παράδειγµα η σχέση hasmother αποτελεί υπο-σχέση (sub-property) της σχέσης hasparent. Οι στοιχειώδεις DL οντολογίες περιέχουν ατοµικές κλάσεις και ατοµικές σχέσεις. Είναι όµως δυνατό να οριστούν σύνθετες κλάσεις µε τη βοήθεια των DL constructs. Επίσης, οι DLs προσφέρουν αξιώµατα τα οποία περιγράφουν τον τρόπο µε τον οποίο οι κλάσεις ή οι σχέσεις σχετίζονται µεταξύ τους. 7

33 ΟΝΤΟΛΟΓΙΑ ΒΙΟΪΑΤΡΙΚΩΝ ΟΡΩΝ Η µεθοδολογία ανάπτυξης της βιοϊατρικής οντολογίας του έργου ΙΑΤΡΟΛΕΞΗ (βλ. παραδοτέο «Π2: Μοντέλο Αναπαράστασης Οντολογίας») ήταν η ακόλουθη: 3.1 ΒΗΜΑ 1 Ο : ΚΑΘΟΡΙΣΜΟΣ ΜΟΝΤΕΛΟΥ ΑΝΑΠΑΡΑΣΤΑΣΗΣ ΚΑΙ ΑΡΧΙΚΗΣ ΤΑΞΙΝΟΜΙΑΣ Το βήµα αυτό υλοποιήθηκε στα πλαίσια τόσο του παραδοτέου «Π8: Αρχική Ταξινοµία Βιοϊατρικών όρων» όσο και στο παραδοτέο «Π12: Αρχική ταξινοµία Εντός Protégé». 3.2 ΒΗΜΑ 2 Ο : ΚΑΤΑΡΤΙΣΗ ΤΗΣ ΜΑΚΡΟ ΟΜΗΣ ΤΗΣ ΟΝΤΟΛΟΓΙΑΣ εύτερο βήµα για την ανάπτυξη της οντολογίας αποτελεί η κατάρτιση της µακροδοµής της, δηλαδή του συνόλου των όρων που αποτελούν πραγµατώσεις των βιοϊατρικών εννοιών και απαρτίζουν το λεξιλόγιο της. Το βήµα αυτό υλοποιήθηκε στα πλαίσια των παραδοτέων «Π5: «Μονολεκτικοί όροι βιοϊατρικής» και Π7: «Πολυλεκτικοί όροι βιοϊατρικής». Η διαδικασία συγκέντρωσης και επεξεργασίας των όρων έχει περιγραφεί στις αναφορές των παραδοτέων Π5 και Π7 ως εξής: Θα ακολουθηθούν δύο αλληλοσυµπληρούµενες διαδικασίες για τη συγκέντρωση των όρων: 1. Επεξεργασία δίγλωσσων λεξιλογίων βιοϊατρικών όρων (αγγλικών - ελληνικών): Στόχος αυτής της εργασίας είναι να εντοπιστεί το βασικό λεξιλόγιο της ελληνικής βιοϊατρικής ορολογίας που περιλαµβάνεται σε έντυπα και ηλεκτρονικά λεξικά. Πιο συγκεκριµένα, για τον εντοπισµό του βασικού λεξιλογίου έχει σχεδιαστεί η επεξεργασία περίπου 14.000 όρων που περιλαµβάνονται στο ελληνικό MeSH (έκδοση 1996) και συνεχίζουν να αποτελούν όρους της τρέχουσας έκδοσης του αµερικανικού MeSH (έκδοση 2006) και η σύγκρισή τους µε το λεξιλόγιο των 20.000 όρων του Λεξικού Βιολογικών και Ιατρικών Όρων της Magenta και των 5.000 βιοϊατρικών όρων που περιλαµβάνονται στο Μορφολογικό Λεξικό της Neurosoft. Ο εντοπισµός του βασικού λεξιλογίου στο πρώτο στάδιο κατάρτισης της µακροδοµής αναµένεται ότι θα προσφέρει ορολογικό υλικό για τις περισσότερες από τις σηµασιολογικές κατηγορίες της οντολογίας. 8

2. Εξαγωγή όρων από ελληνικά βιοϊατρικά κείµενα : Το ορολογικό υλικό που θα αντληθεί από υπάρχοντα λεξικά θα εµπλουτιστεί µε έννοιες και όρους που θα εντοπιστούν σε ελληνικά βιοϊατρικά κείµενα. Για να καταστεί δυνατή η αυτόµατη ή ηµιαυτόµατη εξαγωγή όρων από αυτά έχουν προβλεφθεί οι εξής εργασίες στο πλαίσιο του έργου: o Σχεδιασµός και κατάρτιση σώµατος βιοϊατρικών κειµένων, που θα αποτελέσει την είσοδο σε µια σειρά υπολογιστικών εργαλείων γλωσσικής ανάλυσης. Το σώµα βιοϊατρικών κειµένων θα χρησιµοποιηθεί ως πηγή για την εξαγωγή µονολεκτικών και πολυλεκτικών όρων, για τον εντοπισµό εναλλακτικών όρων για την ίδια έννοια κτλ., ενώ ταυτόχρονα θα αξιοποιηθεί ως πηγή για την τεκµηρίωση της χρήσης και της σηµασίας των όρων (βλ. Παραδοτέο 1 «Σχέδιο Συγκρότησης Σώµατος Βιοϊατρικών Κειµένων»). o Κατασκευή και προσαρµογή εργαλείων γλωσσικής ανάλυσης (π.χ. ληµµατοποιητής (lemmatizer), µορφοσυντακτικός χαρακτηριστής (tagger, γραµµατική ιατρικών πολυλεκτικών όρων)), που θα χρησιµοποιηθούν για τον εντοπισµό και την αυτόµατη εξαγωγή µονολεκτικών και πολυλεκτικών όρων από τα κείµενα. Οι όροι που θα συγκεντρωθούν µε τις δύο προαναφερθείσες διαδικασίες θα τύχουν περαιτέρω επεξεργασίας για την επιστηµονική τους εγκυρότητα και τη γλωσσική τους ορθότητα από τους ειδικούς επιστήµονες του έργου, γιατρούς και γλωσσολόγους. Όπως ακριβώς περιγράφηκε στο παραπάνω απόσπασµα από τη µελέτη, και αναλύθηκε περαιτέρω στα παραδοτέα Π5 και Π7 η µακροδοµή της οντολογίας αποτελεί συνδυασµό των όρων που εξήχθησαν από το MeSH µε αυτούς που εξήχθησαν από τα βιοϊατρικά κείµενα. Τους όρους στη συνέχεια επιµελήθηκαν τόσο οι ιατροί όσο και οι γλωσσολόγοι. 9

3.3 ΟΝΤΟΤΗΤΕΣ ΣΤΗΝ ΟΝΤΟΛΟΓΙΑ Κάθε κόµβος/οντότητα της Οντολογίας αντιστοιχεί σε µια βιοϊατρική έννοια (concept), η οποία πραγµατώνεται γλωσσικά µέσω ενός ή περισσότερων (συνώνυµων ή ταυτόσηµων) βιοϊατρικών όρων. Για την αποφυγή της αµφισηµίας/πολυσηµίας, η οποία είναι εγγενής στην έκφραση των εννοιών µέσω των λέξεων, κάθε έννοια εκπροσωπείται µοναδικά από έναν κωδικό (concept ID). Οι κωδικοί εννοιών της Οντολογίας ΙΑΤΡΟΛΕΞΗ είναι σε πλήρη αντιστοιχία προς τους κωδικούς εννοιών του Σηµασιολογικού ικτύου του UMLS και τους κωδικούς εννοιών του MeSH. Έτσι, οι κόµβοι που είναι κοντά στο ριζικό κόµβο της Οντολογίας φέρουν κωδικούς εννοιών από το Σηµασιολογικό ίκτυο του UMLS (κωδικοί που αρχίζουν από Α ή Β, π.χ. Α1.1.3, Β1.3), από το οποίο γίνεται φανερό ότι η αρχική ταξινοµία (η ραχοκοκαλιά) της Οντολογίας βασίστηκε σε αυτό το ίκτυο. Από ένα βάθος και κάτω, οι κόµβοι της Οντολογίας φέρουν κωδικούς εννοιών από το MeSH (κωδικοί που αρχίζουν από C, π.χ. C0004714), από το οποίο γίνεται φανερό ότι η αρχική οντολογία επεκτάθηκε µε όρους του MeSH. Αναλυτικά, κάθε κόµβος της Οντολογίας φέρει τις εξής πληροφορίες: Τον κωδικό έννοιας (µοναδικός για κάθε κόµβο) Ένα ή περισσότερα λεκτικά που αντιστοιχούν στην εκφορά της έννοιας µέσω όρου ή όρων της Αγγλικής (όροι που αντλήθηκαν από το UMLS και το MeSH) Ένα ή περισσότερα λεκτικά που αντιστοιχούν στην εκφορά της έννοιας µέσω όρου ή όρων της Ελληνικής (όροι που αντλήθηκαν από το σώµα κειµένων, το ελληνικό MeSH και άλλα βιοϊατρικά γλωσσάρια ή λεξικά) Ένα λεκτικό στην Αγγλική που αντιστοιχεί στον ορισµό της έννοιας (από το UMLS και το MeSH) Οι σχέσεις που αναπαρίστανται µέσω της Οντολογίας είναι: Η σχέση υπαγωγής (is-a). Κάθε κόµβος Β που υπάγεται σε έναν κόµβο Α αναπαριστά µια έννοια που αποτελεί εξειδίκευση της έννοιας που αναπαριστά ο κόµβος Α. Κατ επέκταση, η έννοια που αναπαριστά ο κόµβος Α αποτελεί γενίκευση της έννοιας που αναπαριστά οποιοσδήποτε κόµβος Β υπάγεται στον Α. Η σχέση συνωνυµίας. Όταν ένας κόµβος περιέχει περισσότερα του ενός λεκτικά όρων, είτε στην Ελληνική είτε στην Αγγλική, τότε αυτοί οι όροι είναι συνώνυµοι µεταξύ τους. 10

44 ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Όπως περιγράφεται και στο Παραδοτέο «Π2: Μοντέλο αναπαράστασης της οντολογίας», για τις ανάγκες του έργου, κρίθηκε σκόπιµη η χρήσης της OWL-lite (βλ. Παράρτηµα για µια σύντοµη περιγραφή) για την αναπαράσταση της οντολογίας. Αρχικά µεταφέρθηκε η αρχική ταξινοµία σε OWL-Lite αναπαράσταση. Η µορφή της όπως φαίνεται µέσα από έναν text editor είναι όπως φαίνεται παρακάτω: Με τη µορφή αυτή δεν είναι φυσικά εύκολα επεξεργάσιµη ούτε καν από πληροφορικούς. Για το σκοπό αυτό, κατασκευάστηκε στα πλαίσια του παραδοτέου Π12 (βλ. σχετικά), µια εφαρµογή απεικόνισης οντολογιών. Με την εφαρµογή αυτή η ταξινοµία εµφανίζεται σε πολύ καλύτερη µορφή για περιήγηση και έλεγχο. Παρακάτω φαίνεται η µορφή αυτή: 11

Επιπλέον, στο πλαίσιο της Ενότητας Εργασίας 5 και ειδικότερα του Παραδοτέου «Π14: Περιηγητής Οντολογίας» υλοποιήθηκε ο διαδικτυακός περιηγητής οντολογίας, ο οποίος έχει «αναρτηθεί» στην ιστοσελίδα του έργου (και περιλαµβάνεται και στο σχετικό παραδοτέο). Μέσω αυτού ο χρήστης µπορεί και διαδικτυακά, να περιηγηθεί στην οντολογία. 12

55 Ο ΗΓΙΕΣ ΧΡΗΣΗΣ ΤΟΥ ΟΠΤΙΚΟΥ ΙΣΚΟΥ Στο παρόν παραδοτέο περιλαµβάνεται οπτικός δίσκος (CD) ο οποίος περιέχει την οντολογία βιοϊατρικών όρων του έργου. Μόλις εισαχθεί ο δίσκος στη µονάδα οπτικού δίσκου του υπολογιστή θα ανοίξει αυτόµατα ο φυλλοµετρητής µε την παρουσίαση του παραδοτέου (εικόνα 1). Εικόνα 1: Στιγµιότυπο παρουσίασης του παραδοτέου. Στην πρώτη σελίδα παρουσιάζονται στοιχεία του έργου και του συγκεκριµένου παραδοτέου καθώς και τρεις υπερσύνδεσµοι (links): Ο πρώτος οδηγεί στην αναφορά του παραδοτέου (παρούσα αναφορά) σε µορφή PDF. Ο δεύτερος οδηγεί στην οντολογία, η οποία είναι σε µορφή OWL-lite, και µπορείτε να τη δείτε µε κάποιο πρόγραµµα απεικόνισης αρχείων κειµένου. Ο τρίτος, οδηγεί στο λογισµικό του οπτικού δίσκου. Εκεί βρίσκεται το αρχείο owl της οντολογίας και το εργαλείο απεικόνισης οντολογιών. Πρέπει να αναφέρουµε πως για την καλύτερη απεικόνιση της οντολογίας, αλλά και την πλοήγηση σε αυτήν, µπορεί να χρησιµοποιηθεί το εργαλείο απεικόνισης οντολογιών IatrolexiOWLViewer. Οι οδηγίες χρήσης και εγκατάστασης του IatrolexiOWLViewer έχουν αναπτυχθεί εκτενώς στο παραδοτέο «Π12. Αρχική Ταξινοµία εντός Protégé». 13

Στην παρακάτω εικόνα παρουσιάζεται ένα στιγµιότυπο της οντολογίας βιοϊατρικών όρων µέσω του IatrolexiOWLViewer. Η απεικόνιση της οντολογίας µπορεί επίσης να γίνει µέσω της εφαρµογής επεξεργασίας οντολογιών Protégé. Εκτενής αναφορά στο Protégé υπάρχει στο παραδοτέο «Π11.Προσαρµοσµένο Protégé». Τονίζεται ότι επειδή η οντολογία περιέχει ιδιαίτερα µεγάλο αριθµό όρων θα πρέπει να αυξήσουµε την µνήµη που χρησιµοποιεί η εφαρµογή του Protégé. Αυτό γίνεται αλλάζοντας την γραµµή: lax.nl.java.option.java.heap.size.max=100000000 του αρχείου Protege.lax σε lax.nl.java.option.java.heap.size.max=512000000. Το αρχείο βρίσκεται στην θέση του δίσκου στην oποία είναι εγκαταστηµένο το Protégé. Στις εικόνες που ακολουθούν φαίνονται κάποια ενδεικτικά στιγµιότυπα της οντολογίας εντός του Protégé. 14

IatrolexiTab: OWL Classes: 15

TGVizTab: 16

66 ΒΙΒΛΙΟΓΡΑΦΙΑ 6.1 ΗΜΟΣΙΕΥΣΕΙΣ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΕΡΓΟΥ Α. Βαγγελάτος, Γ. Ορφανός, Χ. Τσαλίδης, Χρ. Καλαµαρά: Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων. 8ο Πανελλήνιο Επιστηµονικό Συνέδριο Management Υπηρεσιών Υγείας και κοινωνικής Φροντίδας, Ερέτρια, Οκτώβριος 2006. M. Pantazara, E. Mantzari, A. Vagelatos, Ch. Kalamara, A. Iordanidou: Development of a Greek biomedical corpus, 11th Panhellenic Conference on Informatics (PCI 2007), Patras, Greece, May 2007. Α. Βαγγελάτος, Έ. Μάντζαρη, Μ. Πανταζάρα, Β. Παπαπαναγιώτου, Χ. Καλαµαρά. Implementation of a Biomedical Ontology for the Greek Language. 5th ICICTH International Conference on Information Communication Technologies in Health, Samos, Greece, Ιούλιος 2007. Ch. Tsalidis, E. Mantzari, M. Pantazara, Ch. Diolis, A. Vagelatos: Developing a Greek biomedical corpus for text mining, Corpus Linguistics Conference 2007 (CL 2007), Birmingham, UK, July 2007. Vagelatos, E. Mantzari, G. Orphanos, C. Tsalidis, C. Kalamara and C. Diolis: Implementing the NLP Infrastructure for Greek Biomedical Data Mining, International Workshop «A COMMON NATURAL LANGUAGE PROCESSING PARADIGM FOR BALKAN LANGUAGES», RANLP-2007, Borovets, Bulgaria, September 2007. Α. Βαγγελάτος, Γ. Ορφανός, Μ. Πανταζάρα, Χ. ιολής, Χ. Καλαµαρά: ΙΑΤΡΟΛΕΞΗ: Υποδοµή γλωσσικής Επεξεργασίας Βιοϊατρικών Κειµένων: 9ο Πανελλήνιο Συνέδριο Management Υπηρεσιών Υγείας και Κοινωνικής Φροντίδας (2007), Κέρκυρα, Οκτώβριος 2007. Vagelatos, E. Mantzari, G. Orphanos, Ch. Tsalidis, M. Pantazara, Ch. Kalamara, Ch. Diolis: Biomedical data mining for the Greek language: MEDNET 2007, Leipzig, Germany, October 2007. Α. Ιορδανίδου, Μ. Πανταζάρα, Ε. Μάντζαρη, Α. Βαγγελάτος, Γ. Ορφανός, Β. Παπαπαναγιώτου: Ζητήµατα αναγνώρισης των πολυλεκτικών σύνθετων όρων στον τοµέα της βιοϊατρικής: 6ο Συνέδριο «Ελληνική Γλώσσα και Ορολογία» (2007), Αθήνα, Νοέµβριος 2007. 17

Α. Βαγγελάτος, Ά. Ιορδανίδου, Ι. Σταµατόπουλος, Γ. Ορφανός, Β. Παπαπαναγιώτου: Εξόρυξη Γνώσης σε Βιοϊατρικά Κείµενα. 3 ο Πανελλήνιο Συνέδριο για τη ιοίκηση, τα Οικονοµικά και τις Πολιτικές Υγείας (2007), Αθήνα, εκέµβριος 2007. 6.2 ΣΧΕΤΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ 1. Bada M, Stevens R, Goble C, Gil Y, Ashburner M, Blake JA, Cherry JM, Harris M, Lewis S: A short study on the success of the GeneOntology. J Web Semantics 2004, 1:235-240. 2. Bard J, Rhee SY, Ashburner M: An ontology for cell types. Genome Biol 2005, 6:R21. 3. Bard J. Ontologies: formalising biological knowledge for bioinformatics. Bioessays 2003:25(5):501-6. 4. Bodenreider O, Mitchell JA, McCray AT. Evaluation of the UMLS as a terminology and knowledge resource for biomedical informatics. Proceedings AMIA Symposium 2002: 61 5. 5. Burgun A, Bodenreider O. Mapping the UMLS semantic network into general ontologies. Proceedings AMIA Symposium 2001:81 5. 6. Campbell KE, Cohn SP, Chute CG, Shortliffe EH, Rennels G. Scalable methodologies for distributed development of logic-based convergent medical terminology. Methods of Information in Medicine 1998, 37 (4 5):426 39. 7. Carrara M, Giaretta P, Morato V, Soavi M, Spolaore G. Identity and Modality in OntoClean. In: Formal Ontology in Information Systems. Italy: Torino, 2004. 8. Casati R, Varzi AC: Holes and Other Superficialities. Cambridge, MA: MIT Press; 1994. 9. Ceusters W, Smith B, Flanagan J. Ontology and medical terminology: why description logics are not enough. In: TEPR. San Antonio, 2003. 10. Ceusters W, Smith B, Goldberg L. A terminological and ontological analysis of the NCI thesaurus. Methods of Information in Medicine 2005, 44:498 507. 11. Cimino JJ, Clayton PD, Hripcsak G, Johnson SB. Knowledge-based approaches to the maintenance of a large controlled medical terminology. JAMIA 1994, 1(1):35 50. 12. Cimino JJ. Desiderata for controlled medical vocabularies in the twenty-first century. Methods of Information in Medicine 1998, 37(4 5):394 403. 18

13. Consortium GO. Creating the gene ontology resource: design and implementation. Genome Res 2001,11(8):1425 33. 14. dos Santos MC, Dhaen C, Fielding M, Ceusters W: Philosophical scrutiny for run-time support of application ontology development. In Formal Ontology and Information Systems. Amsterdam: IOS Press; 2004:342-352. 15. Fielding J, Simon J, Ceusters W, Smith B. Ontological theory for ontological engineering: biomedical systems information integration. In: Proceedings of the 9th international conference on the principles of knowledge representation and reasoning (KR2004) 2004 June. Whistler BC, 2004. 16. Friedman C, Liu H, Shagina L, Johnson S, Hripcsak G. Evaluating the UMLS as a source of lexical knowledge for medical language processing. Proceedings AMIA Symposium 2001:189 93. 17. Fung KW, Hole WT, Nelson SJ, Srinivasan S, Powell T, Roth L. Integrating SNOMED CT into the UMLS: an exploration of different views of synonymy and quality of editing. JAMIA 2005, 12(4):486 94. 18. Gangemi A, Guarino N, Masolo C, Oltramari A: Sweetening WordNet with DOLCE. AI Magazine 2003, 24:13-24. 19. Gangemi A, Pisanelli DM, Steve G. An overview of the ONIONS project: Applying ontologies to the integration of medical terminologies. Data Knowl Eng 1999;31. 20. Gene Ontology Consortium: Creating the Gene Ontology resource: design and implementation. Genome Res 2001, 11:1425-1433. 21. Golbeck J, Fragoso G, Hartel FW, Hendler J, Parsia B, Oberthaler J. The national cancer institute s thesaurus and ontology. Journal of Web Semantics 2003, 1(1). 22. Gomez-Perez A, Fernandez-Lopez M, Corcho O. Ontological engineering. London: Springer-Verlag, 2004. 23. Gomez-Perez A, Fernandez-Lopez M, de Vicente A. Towards a method to conceptualize domain ontologies. In: van der Vet P, A. C. Yu / Journal of Biomedical Informatics 39, 2006: 252 266. 24. Grenon P, Smith B, Goldberg L: Biodynamic ontology: applying BFO in the biomedical domain. In Ontologies in Medicine. Amsterdam: IOS Press; 2004:20-38. 25. Gruber T. Ontolingua: A mechanism to support portable ontologies. Stanford University, Stanford: California Knowledge Systems Laboratory, 1992. 26. Guarino N, Welty C. An overview of OntoClean. In: Staab S, Studer R, editors. The handbook on ontologies. Berlin: Springer- Verlag, 2004:151-72. 19

27. Guarino N. Formal ontology and information systems. In: Guarino N, editor. Proceedings of the first international conference on formal ontologies in information systems. FOIS 98. Trento, Italy: IOS Press, 1998: 3 15. 28. Harris MA, Clark J, Ireland A, Lomax J, Ashburner M, Foulger R, et al. The gene ontology (GO) database and informatics resource. Nucleic Acids Res 2004:D258 61 (Database issue). 29. ISO 1087-1:2000 Terminology work -- Vocabulary -- Part 1: Theory and application 30. ISO 12200: 1999 Computer-Applications in Terminology Machine-readable Terminology Interchange Format (MARTIF) Negotiated Interchange. Geneva: International Organization for Standardization. 31. ISO 12616:2002.Translation-oriented terminography. 32. ISO 12620: 1999 Computer Applications in Terminology Data Categories. Geneva: International Organization for Standardization. 33. ISO 16642:2003. Computer assisted terminology management - Terminology Markup Framework. Geneva, InternationalOrganization for Standardization. 34. Kumar A, Smith B. Ontology for task-based clinical guidelines and the theory of granular partitions. In: Artificial Intelligence in Medicine. Cyprus: Springer- Verlag; 2003:71 5. 35. Kumar A, Yip L, Smith B, Grenon P. Bridging the gap between medical and bioinformatics using formal ontological principles. Computers in Biology & Med 2005. Available from: http://ontology.buffalo.edu/medo/cbm_coloncancerontology.pdf. 36. Lenat DB, Guha RV. Building large knowledge-based systems: representation and inference in the Cyc project. Boston, Massachusetts: Addison-Wesley; 1990. 37. Levesque HJ, Brachman RJ: A fundamental tradeoff in knowledge representation and reasoning. In Readings in Knowledge Representation. San Francisco: Morgan Kaufman; 1985:41-70. 38. Unified Medical Language System. (http://www.nlm.nih.gov/research/umls/). 39. McGuinness DL, Harmelen Fv. OWL Web Ontology Language Overview. http://www.w3.org/tr/owl-features/. 2004. 40. Mungall C: OBOL: integrating language and meaning in bio-ontologies. Comp Funct Genomics 2004, 5:509-520. 41. Ogren P, Bretonnel Cohen K, Hunter L: Implications of compositionality in the Gene Ontology for its curation and usage. Pac Symp Biocomput 2005, 174-185. 20

42. Ogren PV, Cohen KB, Acquaah-Mensah GK, Eberlein J, Hunter L: The compositional structure of Gene Ontology terms. Pac Symp Biocomput 2004, 214-225. 43. Rogers J, Rector A. The GALEN ontology. In: Medical informatics Europe. Amsterdam: IOS Press, 1996: 174 178. 44. Rogers J, Rector AL: GALEN's model of parts and wholes: experience and comparisons. In Proceedings AMIA Symposium 2000. Bethesda, MD: American Medical Informatics Association; 2000:819-823. 45. Rosse C, Mejino JLV Jr: A reference ontology for bioinformatics: the Foundational Model of Anatomy. J Biomed Inform 2003, 36:478-500. 46. Schulz S, Hahn U: Towards a computational paradigm for biomedical structure. In KR-MED 2004: Workshop on Formal Biomedical Knowledge Representation. Aachen: University of Aachen; 2004:63-71. 47. Sculze-Kremer S, Smith B, Kumar A. Revising the UMLS Semantic Network. In: Fieschi M, editor. MEdinfo. San Francisco: IOS Press, 2004:1700. 48. Smith B, Brogaard B: Sixteen days. J Med Philos 2003, 28:45-78. 49. Smith B, Ceusters W, Klagges B, Kohler J, Kumar A, Lomax J, et al. Relations in biomedical ontologies. Genome Biol 2005, 6(5):R46. 50. Smith B, Grenon P: The cornucopia of formal-ontological relations. Dialectica 2004, 58:279-296. 51. Smith B, Köhler J, Kumar A: On the application of formal principles to life science data: a case study in the Gene Ontology. DILS 2004: Data Integration in the Life Sciences. Lecture Notes in Computer Science 2994 2004, 124-139. 52. Smith B, Kumar A: On controlled vocabularies in bioinformatics: a case study in the Gene Ontology. BioSilico: Inform Technol Drug Discovery 2004, 2:246-252. 53. Smith B, Rosse C: The role of foundational relations in the alignment of biomedical ontologies. In Proceedings Medinf 2004. Amsterdam: IOS Press; 2004:444-448. 54. Smith B, Williams J, Schulze-Kremer S: The ontology of the Gene Ontology. Proc AMIA Symp 2003, 609-13. 55. Smith B. Beyond concepts, or: ontology as reality representation. In: Varzi A, Vieu L, editors. Formal ontology and information systems. Proceedings of the third international conference (FOIS 2004). Amsterdam: IO Press, 2004:73 84. 21

56. Smith B. Ontology: philosophical and computational. In: Floridi L, editor. The Blackwell guide to the philosophy of computing and information. Oxford: Blackwell Publishers; 2003. 57. Stoll R: Set Theory and Logic. New York: Dover Publications; 1979. 58. Uschold M, Gruninger M. Ontologies: principles, methods, and applications. Knowledge Engineering Review 1996, 11(2):93 115. 59. Wroe C, Stevens R, Goble CA, Ashburner M: An evolutionary methodology to migrate the Gene Ontology to a Description Logic environment using DAML+OIL. Pac Symp Biocomput 2003, 624-635. 22