GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

Σχετικά έγγραφα
ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Το συγκεκριμένο εγχειρίδιο δημιουργήθηκε για να βοηθήσει την κατανόηση της διαδικασίας δημιουργίας εγγράφων από το χρήστη. Παρακάτω προτείνεται μια

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

e-κπαίδευση Πλατφόρµα Ασύγχρονης Τηλε-κπαίδευσης Οδηγίες χρήσης για τους σπουδαστές του ΤΕΙ Αθήνας και τους επισκέπτες της δικτυακής πύλης e-κπαίδευση

ΜΜ Document Imaging Solution

Π18: Τεκµηρίωση Εφαρµογών Ιστού

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access...9. Κεφάλαιο 2 Χειρισμός πινάκων... 25

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Επεξεργασία Ερωτήσεων

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Πληροφορική 2. Δομές δεδομένων και αρχείων

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης

Javascript. του project /software/web_tools/webapps/search_engine/.

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΣΤΗΝ ΧΡΗΣΗ ΚΑΙ ΑΞΙΟΠΟΙΗΣΗ ΤΩΝ ΤΠΕ ΣΤΗΝ ΕΚΠΑΙ ΕΥΤΙΚΗ Ι ΑΚΤΙΚΗ ΙΑ ΙΚΑΣΙΑ. Οδηγίες για την πιστοποίηση των εκπαιδευτικών

Software Production Company

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

Κεφάλαιο 16 Εφαρμογές Αυτοματισμού Γραφείου

ΔΙΑΔΙΚΤΥΟ & ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ (XML P2P SYSTEMS - ONTOLOGIES)

Microsoft Excel Κεφάλαιο 1. Εισαγωγή. Βιβλίο εργασίας

Δημιουργία ερωτηματολογιου με την πλατφόρμα Limesurvey

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

EBSCOhost Research Databases

Ο χρήστης συμπληρώνει όνομα χρήστη και κωδικό και επιλέγει Είσοδος. Εάν δεν έχει κάνει εγγραφή στο σύστημα θα πρέπει να επιλέξει πρώτα Εγγραφή.

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Άνοιγμα (και κλείσιμο) της εφαρμογής Εγγράφου Κειμένου

H πλατφόρµα ItBiz E- Learn, συνοπτικά.

GreekLUG Ελεύθερο Λογισμικό & Λογισμικό Ανοικτού Κώδικα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧ/ΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΕΚΠΟΝΗΣΗ ΕΡΓΑΣΙΑΣ

Τοµέας Εϖιµόρφωσης & Κατάρτισης

Β ΕΙΔΙΚΗ ΦΑΣΗ ΣΠΟΥΔΩΝ

Αναζήτηση στον Ιστό. Πληκτρολόγηση του URL: στο πλαίσιο αναζήτησης του Mozilla Firefox. Enter ή κλικ στο Αναζήτηση

Επεξεργασία Ερωτήσεων

Το συγκεκριμένο εγχειρίδιο δημιουργήθηκε για να βοηθήσει την κατανόηση της διαδικασίας Office Management (Ημερολόγιο Λογιστή). Παρακάτω προτείνεται

Δημιουργίας Ενεργειών

Ηλεκτρονικό Μητρώο Αποβλήτων Παντελής Πεκάκης

Συνεργείο Αυτοκινήτων

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ

Κεφάλαιο 2.3: Ρυθμίσεις των Windows

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ web εφαρµογής - ηλεκτρονικού κατατήµατος για έξυπνα κινητά

ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΔΗΜΟΣΙΩΝ ΕΠΕΝΔΥΣΕΩΝ & ΕΣΠΑ

Εξαγωγή Οικονοµικών Αναφορών (Ισολογισµός, Αποτελέσµατα Χρήσης, Λογαριασµοί Γενικής Εκµετάλλευσης) στην Εφαρµογή Ms Excel

ALERTS ή EDA (Event Driven Actions)

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική II. Ενότητα 6 : Δομές αρχείων. Δρ. Γκόγκος Χρήστος

Alfaware Οδηγός Χρήσης Εφαρμογής (Software User Manual)

Το εσωτερικό ενός Σ Β

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Vodafone Business Connect

Περιεχόµενα. 1 Tο βιβλίο "µε µια µατιά" Εισαγωγή στη Microsoft Access Γνωριµία µε τις βάσεις δεδοµένων της Access...

...στις µέρες µας, όσο ποτέ άλλοτε, οι χώρες καταναλώνουν χρόνο και χρήµα στη µέτρηση της απόδοσης του δηµόσιου τοµέα...(oecd)

4.1 Άνοιγμα υπάρχοντος βιβλίου εργασίας

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ

Περιεχόμενα. Περιβάλλον ηλεκτρονικού υπολογιστή...9 Επιφάνεια εργασίας...12 Διαχείριση αρχείων...15 Ιοί Η/Υ...21 Διαχείριση εκτυπώσεων...

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

ηµιουργία αντιγράφων ασφαλείας και επαναφορά Οδηγός χρήσης

FROM TESTOTA.REGISTRY

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ


Διπλωματική Εργασία. Μουσικές Εφαρμογές σε Περιβάλλον Κινητών Συσκευών Android με Χαρακτηριστικά Εξατομίκευσης

ΤΜΗΜΑ Δ1 ΕΡΓΑΣΙΑ : ΕΠΕΞΕΡΓΑΣΙΑ ΚΕΙΜΕΝΟΥ ΜΕ ΕΙΚΟΝΕΣ ΟΜΑΔΑ PC 5

ηµιουργία αντιγράφων ασφαλείας και επαναφορά

Ο Οδηγός γρήγορης εκκίνησης

Ο ΗΓΟΣ ΧΡΗΣΗΣ ΥΠΟΒΟΛΗΣ ΕΡΩΤΗΜΑΤΟΣ ΣΤΟ HELP DESK Της Ηλεκτρονικής Πλατφόρµας Προστασίας Κύριας Κατοικίας (ΗΠΠΚΚ)

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

Αντίγραφα ασφαλείας και επαναφορά Οδηγός χρήσης

Π17: Μορφοσυντακτικός και Σηµασιολογικός Σχολιαστής (λογισµικό)

Η αρχική οθόνη της Ηλεκτρονικής Βιβλιοθήκης περιλαμβάνει τις εξής βασικές ενότητες όπως φαίνονται στην Εικόνα 1:

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι

ΠΜΣ 513 ΤΕΧΝΟΛΟΓΙΑ ΗΛΕΚΤΡΟΝ ΙΚΟΥ ΕΜΠΟΡΙΟΥ ΥΠΟΧΡΕΩΤΙΚΗ ΕΡΓΑΣΙΑ 2015

Σύνταξη. Βιβλιοθήκη και Κέντρο Πληροφόρησης Α.Π.Θ. Υπηρεσία Ηλεκτρονικών Μαθημάτων. Μιχάλης Γερόλιμος Σουλτάνα Κάργα Νίκη Καλιακούδα Δέσποινα Παπαδάκη

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Οδηγός γρήγορης εκκίνησης

SilverPlatter WebSPIRS 4.1.

Σύστημα Ηλεκτρονικού Πρωτοκόλλου. Σχεδιασμός Υποσυστημάτων

Περιεχόµενα 1 Περιγραφή Προετοιµασία εκτέλεσης της άσκησης Πρόσβαση στην άσκηση τοπικά στον Υπολογιστή σας Περιεχόµενα αρχε

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

Περιεχόµενα. 1 Εισαγωγή: Λίγα λόγια για το βιβλίο Τι νέο υπάρχει στο Outlook Ξεκίνηµα Ευχαριστίες...

Οδηγίες Χρήσης της εφαρμογής Class-Web

TRAVIS TRAFFIC VIOLATION INFORMATION SYSTEM ΣΥΣΤΗΜΑ ΔΙΑΧΕΙΡΗΣΗΣ ΠΑΡΑΒΑΣΕΩΝ ΦΩΤΟΕΠΙΣΗΜΑΝΣΗΣ

Αικατερίνη Καμπάση, PhD. Τμήμα Προστασίας και Συντήρησης Πολιτισμικής Κληρονομιάς Α.Τ.Ε.Ι. Ιονίων Νήσων

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

wikispaces Επεξεργασία και συγγραφή Πατρώνας Γεώργιος

Ενότητα 5 Βάσεις Δεδομένων

1 Εξερεύνηση της Access ηµιουργία βάσεων δεδοµένων 107

Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής ΔΕΞΙΟΤΗΤΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ / ΚΟΙΝΩΝΙΚΑ ΔΙΚΤΥΑ (ΕΡΓΑΣΤΗΡΙΟ)

Εισαγωγή στην εφαρμογή Βασική Σελίδα (Activity) Αναζήτηση Πελάτη... 6 Προβολή Πελάτη... 7 Επεξεργασία Πελάτη... 10

Εισαγωγή Κεφάλαιο 1: Εγκατάσταση της Access Κεφάλαιο 2: Βάσεις δεδομένων και δομικά στοιχεία της Access

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη

Στο grid διαχείρισης φακέλων εμφανίζονται οι εξής πληροφορίες:

ΟΓΗΓΙΕΣ ΧΡΗΣΗΣ ΗΛΕΚΤΡΟΝΙΚΟΥ ΜΗΤΡΩΟΥ ΑΠΟΒΛΗΤΩΝ. Draft version

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΨΗΦΙΑΚΩΝ ΠΙΣΤΟΠΟΙΗΤΙΚΩΝ

Transcript:

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης που προσφέρονται σήµερα (desktop search engines) λειτουργούν µε τον κλασσικό τρόπο αναζήτησης, δηλαδή µε χρήση λέξεων-κλειδιών. Συγκεκριµένα, διατρέχουν τον σκληρό δίσκο, εξάγουν από το κάθε έγγραφο πληροφορία που αφορά το περιεχόµενό του και αποθηκεύουν σε ευρετήρια την πληροφορία αυτή. Έτσι, καθίσταται δυνατή η αναζήτηση λέξεων κλειδιών στον τίτλο ή στο κείµενο κάποιου εγγράφου, µέσω των ευρετηρίων αυτών. Το πρόβληµα που προκύπτει µε τον παραπάνω τρόπο αναζήτησης είναι ότι, κάποια έγγραφα ενδέχεται να µην περιέχουν στο κείµενο ή στον τίτλο τους µία συγκεκριµένη λέξη ή φράση, παρόλα αυτά, όµως, να ανήκουν σηµασιολογικά στην ευρύτερη έννοια που περιγράφεται από την ίδια λέξη. Για παράδειγµα, ένα πολύ εξειδικευµένο κείµενο που περιγράφει τη γλώσσα SQL, µπορεί να µην περιέχει τη λέξη database, έχει, όµως, σχέση µε βάσεις δεδοµένων. Λύση στο παραπάνω πρόβληµα προσφέρει η χρήση οντολογιών. Με τη βοήθεια µίας οντολογίας, ο χρήστης δύναται να χαρακτηρίζει σηµασιολογικά ένα έγγραφο, µε βάση τις έννοιες τις οντολογίας, και ανεξάρτητα από τις λέξεις κλειδιά που περιέχει το έγγραφο. Ύστερα, µπορεί να πλοηγείται στις έννοιες της οντολογίας και να αναζητά τα επιθυµητά έγγραφα, εκτελώντας διαφόρων ειδών επερωτήµατα (queries) στην οντολογία. Αντικείµενο Αντικείµενο της διπλωµατικής είναι η ανάπτυξη µίας µηχανής αναζήτησης εγγράφων (GoNToggle) σε σκληρό δίσκο υπολογιστών, που συνδυάζει την κλασσική αναζήτηση µε λέξεις κλειδιά µε αναζήτηση-περιήγηση στις έννοιες µίας οντολογίας. Για την ανάπτυξη της

εφαρµογής χρησιµοποιήθηκαν βιβλιοθήκες συναρτήσεων από δύο διαφορετικά εργαλεία, το lucene και το protégé. Εργαλεία και βιβλιοθήκες που χρησιµοποιήθηκαν Το lucene είναι µία ολοκληρωµένη βιβλιοθήκη συναρτήσεων για αναζήτηση κειµένων, υλοποιηµένη σε Java. Παρέχει συναρτήσεις για διάσχιση του σκληρού δίσκου, εξαγωγή κειµένου από διάφορους τύπους εγγράφων, ανάλυση του κειµένου και αποθήκευση της εξαγόµενης πληροφορίας σε ευρετήρια και αναζήτηση λέξεων κλειδιών σε αυτά. Οι συναρτήσεις αυτές του lucene χρησιµοποιήθηκαν για την υλοποίηση του ενός µέρους της εφαρµογής µας, δηλαδή της αναζήτησης µε λέξεις κλειδιά. Η βιβλιοθήκη δεν χρησιµοποιήθηκε ως είχε, αλλά έγιναν ορισµένες τροποποιήσεις, ώστε, για παράδειγµα να είναι δυνατή η αναγνώριση από την εφαρµογή όσο το δυνατόν περισσοτέρων τύπων αρχείων. Το protégé, σε αντίθεση µε το lucene, είναι µία ολοκληρωµένη εφαρµογή διαχείρισης οντολογίων, υλοποιηµένη και αυτή σε Java, που προσφέρει επιπλέον και API (protégé και protégé-owl) για χρησιµοποίηση από άλλα προγράµµατα. Με τη χρήση συναρτήσεων του protégé καθίσταται δυνατή η δηµιουργία µίας OWL οντολογίας, η επεξεργασία των στοιχείων (κλάσεων, στιγµιοτύπων, ιδιοτήτων) της οντολογίας και η εκτέλεση ερωτηµάτων πάνω στην οντολογία. Αρκετές από αυτές τις λειτουργίες συνοδεύονται από ολοκληρωµένες διαπροσωπείες (GUI), τις οποίες ο χρήστης µπορεί να χρησιµοποιήσει χωρίς αλλαγές. Βέβαια, η βιβλιοθήκη συναρτήσεων του protégé είναι αρκετά µεγαλύτερη και πιο πολύπλοκη από αυτή του lucene, παρέχοντας ταυτόχρονα περισσότερες και πιο ολοκληρωµένες συναρτήσεις. Για αυτό, σχεδόν όλες οι συναρτήσεις της (που χρειάστηκαν για την ανάπτυξη της εφαρµογής) χρησιµοποιήθηκαν ως είχαν, χωρίς να τροποποιηθούν. Η ανάπτυξη του GoNToggle έγινε σε γλώσσα Java 2. Η κύρια πλατφόρµα ανάπτυξης, η οποία στηρίχθηκε στα j2sdk1.4.2_07 και j2re-1_4_2_07 είναι το NetBeans IDE 5.0. Επιπλέον, ειδικά για την ανάπτυξη (µεταβολή, προσαρµογή, δηµιουργία νέων) συναρτήσεων της βιβλιοθήκης lucene χρησιµοποιήθηκαν δευτερεύοντα εργαλεία όπως τα apache-ant-1.6.5, javacc-4.0 και junit4.0. Περιγραφή της εφαρµογής Η εφαρµογή αποτελείται από τρία βασικά υποσυστήµατα: Το υποσύστηµα δηµιουργίας ευρετηρίου, το υποσύστηµα σηµασιολογικού χαρακτηρισµού κειµένων και επεξεργασίας οντολογιών και το υποσύστηµα αναζήτησης. Ακολουθούν οι λειτουργίες που επιτελούνται σε κάθε υποσύστηµα. 1. ηµιουργία ευρετηρίου

Το υποσύστηµα δηµιουργίας ευρετηρίου δίνει στο χρήστη τη δυνατότητα να επιλέξει αν θα δηµιουργήσει ένα νέο ευρετήριο ή αν θα επεξεργαστεί ήδη υπάρχον ευρετήριο, να επιλέξει το φάκελο αρχείων που θα δεικτοδοτηθούν και τέλος, να δηµιουργήσει το ευρετήριο πάνω στο οποίο θα εκτελεστεί αργότερα αναζήτηση µε λέξεις κλειδιά. Τα είδη εγγράφων που υποστηρίζονται, δηλαδή τα είδη των εγγράφων από τα οποία µπορεί να εξαχθεί πληροφορία και να αποθηκευθεί στο ευρετήριο είναι τα εξής: doc, pdf, txt, rtf, xls, html. Η ανάπτυξη αυτού του υποσυστήµατος πραγµατοποιήθηκε µε τη βοήθεια συναρτήσεων του lucene. 2. Σηµασιολογικός χαρακτηρισµός Επεξεργασία οντολογίας Το υποσύστηµα σηµασιολογικού χαρακτηρισµού κειµένων και επεξεργασίας οντολογιών δίνει στο χρήστη δυνατότητα επιλογής ενός εγγράφου, προβολής του κειµένου του και επιλογής όλου του κειµένου ή µόνο ενός µέρους του για σηµασιολογική επισηµείωση. Το σηµασιολογικά χαρακτηρισµένο κείµενο (ή κοµµάτι κειµένου) αποθηκεύεται σε µία επιλεγµένη από το χρήστη οντολογία ως στιγµιότυπο µίας ή περισσοτέρων κλάσεων που καθορίζει ο χρήστης. Αυτό το στιγµιότυπο περιέχει σηµαντική πληροφορία (όνοµα-µονοπάτι του εγγράφου στο δίσκο, έννοιες-κλάσεις µε τις οποίες έχει χαρακτηριστεί) οι οποίες είναι απαραίτητες για το κοµµάτι της σηµασιολογικής αναζήτησης. Επιπλέον, ο χρήστης µπορεί να επιλέγει την οντολογία µε την οποία θα εργαστεί, να επεξεργάζεται την οντολογία και τα στιγµιότυπά της, καθώς και να αποθηκεύσει τις αλλαγές. Συγκεκριµένα, είναι δυνατή η επεξεργασία της ιεραρχίας της οντολογίας (προσθαφαίρεση κλάσεων-εννοιών, δηµιουργία υπερκλάσεων-υποκλάσεων, προσθαφαίρεση ιδιοτήτων των κλάσεων) καθώς και η επεξεργασία των στιγµιοτύπων που περιγράφηκαν παραπάνω (διαγραφή στιγµιοτύπων, προσθαφαίρεση στιγµιοτύπων από κλάσεις της οντολογίας, σύνδεση στιγµιοτύπων µέσω ιδιοτήτων). Για την ανάπτυξη του υποσυστήµατος χρησιµοποιήθηκαν συναρτήσεις του protégé. 3. Αναζήτηση Το υποσύστηµα αναζήτησης δίνει στο χρήστη τη δυνατότητα να εκτελεί αναζήτηση µε λέξεις κλειδιά, αναζήτηση µε ερωτήσεις στην οντολογία και συνδυαστική αναζήτηση. Συγκεκριµένα, µε τη συνδυαστική αναζήτηση, ο χρήστης εκτελεί ταυτόχρονα αναζήτηση µε λέξεις κλειδιά στο ευρετήριο και σηµασιολογική αναζήτηση-περιήγηση στις έννοιες της οντολογίας, έχοντας τη δυνατότητα να επιλέξει ως αποτέλεσµα την ένωση ή την τοµή των δύο αναζητήσεων. Επίσης, µπορεί να εκτελεί αναζήτηση στα αποτελέσµατα προηγούµενης αναζήτησης. Όσον αφορά την αναζήτηση µε λέξεις κλειδιά, προσφέρονται κάποιες προχωρηµένες επιλογές, όπως αναζήτηση ολόκληρων φράσεων, αναζήτηση µε AND, OR και ΝΟΤ, αναζήτηση στον τίτλο των εγγράφων κ.α. Με τη σηµασιολογική αναζήτηση, δίνεται η δυνατότητα περιήγησης στην ιεραρχία της οντολογίας, επιλογής µίας ή περισσοτέρων κλάσεων-εννοιών και περαιτέρω επιλογής, από τις επιλεγµένες κλάσεις (και τις υποκλάσεις

τους), των στιγµιοτύπων των εγγράφων που επιθυµεί ο χρήστης. Επίσης, µε την επιλογή ενός εγγράφου από τη λίστα των αποτελεσµάτων µίας αναζήτησης, διατίθενται επιπλέον δυνατότητες: Ο χρήστης µπορεί να αναζητήσει έγγραφα τα οποία ανήκουν στις ίδιες κλάσεις της οντολογίας µε το επιλεγµένο έγγραφο αλλά και να αναζητήσει έγγραφα που συνδέονται µε ορισµένες ιδιότητες µε το επιλεγµένο έγγραφο. Η παρουσίαση των αποτελεσµάτων γίνεται µε τέτοιο τρόπο ώστε ο χρήστης να αντλεί πληροφορίες σχετικές µε το σκορ του κάθε εγγράφου, το είδος της αναζήτησης από την οποία προήλθε, αλλά και πληροφορίες σηµασιολογικού περιεχοµένου. Το συνολικό σκορ κάθε εγγράφου προέρχεται από έναν συνδυασµό του σκορ που προκύπτει από την αναζήτηση µε λέξεις κλειδιά και του σκορ που προκύπτει από το ποσοστό του κειµένου που έχει χαρακτηριστεί σηµασιολογικά. Επίσης, για κάθε έγγραφο επισηµαίνεται αν είναι ολόκληρο χαρακτηρισµένο µε συγκεκριµένη κλάση, αν είναι κοµµάτια του χαρακτηρισµένα και αν περιέχει συγκεκριµένη λέξη κλειδί, δηλαδή ουσιαστικά καθορίζεται το είδος αναζήτησης από το οποίο προήλθε το συγκεκριµένο αποτέλεσµα. Μάλιστα, σε περίπτωση εγγράφων που προέκυψαν από αναζήτηση στην οντολογία, εµφανίζονται και οι κλάσεις που περιέχουν στιγµιότυπα του εγγράφου, για τη συγκεκριµένη αναζήτηση. Τέλος, ο χρήστης µπορεί να ανοίξει κάποιο έγγραφο (αρκεί αυτό να ανήκει στους υποστηριζόµενους τύπους) και να δει αναλυτικά στο κείµενό του τις σηµασιολογικές επισηµειώσεις που έχουν πραγµατοποιηθεί στο έγγραφο, µε βάση κάποια οντολογία. Για την ανάπτυξη του υποσυστήµατος χρησιµοποιήθηκαν συναρτήσεις του lucene και του protégé. Συνεισφορά της εργασίας Με την εφαρµογή GoNToggle, υλοποιήθηκε «έξυπνη» µηχανή αναζήτησης εγγράφων αξιοποιώντας τις δυνατότητες που προσφέρει το εργαλείο ανοιχτού κώδικα για διαχείριση οντολογιών Protégé. Η εφαρµογή, εκτός από παροχή δυνατοτήτων επεξεργασίας µίας οντολογίας, έχει ως κύρια λειτουργία της την αναζήτηση σηµασιολογικά χαρακτηρισµένων εγγράφων και την προβολή στο χρήστη της σηµασιολογικής πληροφορίας που ο ίδιος τους έχει προσδώσει, µέσω της οντολογίας. Συγκεκριµένα αναπτύχθηκαν τα εξής: ιαδικασία σηµασιολογικού χαρακτηρισµού εγγράφων µέσω οντολογίας ιαδικασία επεξεργασίας επισηµειωµένων εγγράφων Αναζήτηση µε λέξεις κλειδιά και συνδυασµό τους Σηµασιολογική αναζήτηση µε πλήθος επιλογών Βαθµολόγηση αποτελεσµάτων αναζήτησης Ολοκλήρωση των παραπάνω µε τα εργαλεία ανοιχτού κώδικα Lucene και Protégé

Ανάπτυξη διαπροσωπείας χρήστη σε γραφικό περιβάλλον για εκτέλεση όλων των παραπάνω ενεργειών και παρουσίαση αποτελεσµάτων Μελλοντικές επεκτάσεις Μελλοντικές επεκτάσεις της διπλωµατικής θα µπορούσαν να γίνουν όσον αφορά την αυτοµατοποίηση της διαδικασίας σηµασιολογικού χαρακτηρισµού εγγράφων. ηλαδή, πέραν του χειρωνακτικού χαρακτηρισµού από το χρήστη, το ίδιο το πρόγραµµα θα µπορούσε αυτόµατα να χαρακτηρίζει σηµασιολογικά ένα έγγραφο, ή κοµµάτια του, µε βάση, για παράδειγµα, ένα ποσοστό λέξεων κλειδιών που περιέχει και που αντιστοιχούν σε κάποια έννοια της οντολογίας. Επιπλέον, η εφαρµογή θα µπορούσε να επεκταθεί πέρα από το σκληρό δίσκο ενός υπολογιστή και να αναζητά λέξεις κλειδιά και έννοιες οντολογιών σε περισσότερους από έναν υπολογιστές ή στο διαδίκτυο.