Σημασιολογικά Λεξικά WordNet
Σημασιολογικές Σχέσεις (Fellbaum, 1998, Snow, Jurafsky & Ng, 2004) 1. Συνώνυμο (Synonym): Το X είναι συνώνυμο του Υ, όταν το Υ μπορεί να αντικατασταθεί από το Χ χωρίς σημασιολογικό και εννοιολογικό λάθος, π.χ. o «δήμος» είναι συνώνυμο της «πόλης». 2. Αντώνυμο (Antonym): To X είναι αντώνυμο του Υ, όταν το Χ έχει αντίθετη σημασία από το Υ, π.χ. το «υγρό» είναι αντώνυμο του «ξηρό». 3. Υπώνυμο/Υπερώνυμο (Hyponym/Hypernym): Το X είναι υπερώνυμο του Υ (ή με άλλα λόγια το Υ είναι υπώνυμο του Χ), όταν το Υ είναι ένα είδος του Χ, π.χ. ο "σκύλος" είναι υπώνυμο του «ζώου» ή αλλιώς ο σκύλος είναι είδος ζώου. 4. Μερώνυμο/Ολώνυμο (Meronym/Olonym): Το X είναι μερώνυμο του Υ (ή με άλλα λόγια το Υ είναι ολώνυμο του Χ), όπως ο "προφυλακτήρας" είναι μερώνυμο του "αυτοκινήτου", δηλ. ο προφυλακτήρα είναι μέρος του αυτοκινήτου. 5. Συγγένεια/Ισοτιμία (Familiarity/Coordinate): Το Υ είναι συγγενής του Χ, όταν τα Χ και Υ μοιράζονται το ίδιο υπερώνυμο, π.χ. ο "Λύκος" είναι συγγενής του "σκύλου" και ο "σκύλος" είναι συγγενής του "λύκου", αφού και τα δυο έχουν υπερώνυμο το "ζώο". 6. Σχέσεις Χωρικής Συμπερίληψης: Μια σχέση που μπορεί να θεωρηθεί λανθασμένα μερωνυμική είναι αυτή της σχέσης μεταξύ ενός δοχείου-περιοχής και του αντικειμένου το οποίο είναι προσωρινά αποθηκευμένο μέσα σε αυτό. Παραδείγματα τέτοιων σχέσεων είναι «τo κρασί είναι μέσα στο ψυγείο» και «ο κρατούμενος είναι μέσα στο κελί». 7. Σχέσεις Χαρακτηριστικού: Κάποιες σχέσεις έχουν την έννοια του αντικειμένου και του χαρακτηριστικού του. Παραδείγματα τέτοιων σχέσεων είναι «οι πύργοι είναι ψηλοί» και «το ανέκδοτο ήταν αστείο».
Είδη Μερωνυμικών σχέσεων (Winston, Chaffin & Herrmann, 1987) - Λειτουργικότητα Όταν τα μέρη ενός αντικειμένου έχουν μία συγκεκριμένη θέση χρονική ή χωρική σε σχέση με τα άλλα μέρη ή/και προς το σύνολο. - Ομοιομέρεια Όταν τα μέρη είναι του ιδίου είδους μεταξύ τους αλλά και με το σύνολο - Διαχωρισιμότητα Όταν τα μέλη μπορούν να χωριστούν φυσικά από το σύνολο στο οποίο ανήκουν. α/α# Μερωνυμική#Σχέση# Παραδείγματα# Λειτουργι :κότητα# Ομοιο: μέρεια# 1 Συστατικό+ πετάλι+ποδήλατο, Ναι Όχι Ναι Αντικείμενο κεφάλαιο+βιβλίο 2 Μέλος Συλλογή πλοίο+στόλος, Όχι Όχι Ναι δέντρο+δάσος 3 Μερίδιο Μάζα κόκκος+αλάτι, κομμάτιτούρτας+ 4 Υλικό Αντικείμενο τούρτα ατσάλι+αυτοκίνητο, αλκοόλ+ουίσκι 5 Γεγονός πληρώνω+ψωνίζω, Δραστηριότητα ραντεβού+εφηβεία 6 Χώρος Επιφάνεια όαση+έρημος, γήπεδοποδοσφ+μικρή περιοχή Όχι Ναι Ναι Όχι Όχι Όχι Ναι Όχι Όχι Όχι Ναι Όχι Διαχωρι: σιμότητα#
Σημασιολογικό λεξικό WordNet (Miller, 1995; Fellbaum, 1998) Aρχικά αναπτύχθηκε στο Princeton για τα αγγλικά, Είναι οργανωμένο σημασιολογικά Περιέχει ουσιαστικά, ρήματα, επίθετα & επιρρήματα, Περιέχει σύνολο συνωνύμων (synset). Υπάρχει διαχωρισμός εννοιών σε σημασίες (senses) Είδη Σημασιολογικών Σχέσεων Συνώνυμο Υπώνυμο/Υπερώνυμο Μερώνυμο/Ολώνυμο Ισοτιμία
EuroWordNet (EWN) Συνδέει το µονόγλωσσα wordnets (Ολλανδικό, Ισπανικό, Ιταλικό, Αγγλικό, Γαλλικό, Γερµανικό, Τσέχικο, Εσθονικό) και χρησιµοποιεί έναν ενδογλωσσικό δείκτη (Inter-Lingual Index, ILI) µε βάση το οποίο όλα τα µονόγλωσσα wordnets «συντονίζονται» BalkaNet Επεκτείνει το πλήθος των γλωσσών σε Βουλγαρικά, Ελληνικά, Ρουµανικά, Σερβικά, Τούρκικα. Ελληνικό wordnet Αναπτύχθηκε στο Πανεπιστήµιο της Πάτρας από οµάδα γλωσσολόγων υπό την επίβλεψη του Πανεπιστηµίου Αθηνών Στατιστικά δεδοµένα: synsets 18.677, literals 24.811,literals/synset 1.33, Inter-Lingual Relations (ILR) 24.582, ILR per synset 1.33, nonlexicalized concepts 46, definitions 18.649
Τι είναι το VisDic? Είναι γραφική εφαρµογή για την περιήγηση και editing αναγνώσιµων από µηχανή λεξικών που έχουν δοµηθεί σε XML format. Πρώτα αναπτύχθηκε για περιήγηση και editing των wordnets Είναι ο βασικός browser των BalkaNet wordnets (Greek, Bulgarian, Serbian, Rumanian and Turkish). Αναπτύχθηκε στην σχολή Πληροφορικής του Πανεπιστηµίου του Brno, Τσεχία
Visdic Editor (Horak & Smrž, 2004) Δημιουργία WordNets Περιήγηση σε WordNets Editing WordNets που έχουν δομηθεί σε XML μορφή Σύνδεση WordNets διαφορετικών γλωσσών
Η λέξη memory του English Wordnet στο περιβάλλον του VisDic
Yλοποίηση επέκτασης του Ελληνικού WordNet Πραγματοποιήθηκε σε 4 στάδια: Στάδιο Επιλογής Aποσπάσματα από το βιβλίο "Επιστήμη Υπολογιστών: Μία προεπισκόπηση (Brookshear, 2006). Επιλογή εννοιών και σημασιολογικών σχέσεων. Στάδιο Σύγκρισης Χρησιμοποιήθηκε Λεξικό της Κοινής Ελληνικής του Ινστιτούτου Νέων Ελληνικών και αλλά λεξικά Πληροφορικής. Στάδιο Μοντελοποίησης και Ανάπτυξης Οι νέοι τύποι σχέσεων σύμφωνα με το μοντέλο κατανόησης κειμένου προστέθηκαν χειρωνακτικά μέσω του VisDic Editor. Στάδιο Επέκτασης Το Ελληνικό WordNet επεκτάθηκε με νέους όρους του τομέα της Πληροφορικής μέσω του VisDic Editor. Για το αντικείμενο τις ιεραρχίας μνήμης από τα 128 synsets του wordnet, 75 είναι νέα ενώ τα υπόλοιπα 53 τροποποιήθηκαν, και 745 νέες σχέσεις μεταξύ των synsets έχουν προστεθεί. Και άλλα αντικείμενα δίκτυα υπολογιστών, βάσεις δεδομένων κλπ
Μοντέλο Kατανόησης Kειμένου των Denhière & Baudet (1992) Ο αναγνώστης ενός κειμένου κατά την ανάγνωση οικοδομεί σε: Μικροεπίπεδο (μικροδομή) Σχεσιακή Δομή { άτομα & καταστάσεις: Μια κατάσταση αποτελεί ένα στατικό στιγμιότυπο των ιδιοτήτων των μονάδων (άτομα). ταξινομικές & μερωνυμικές σχέσεις που τα συνδέουν. Μετασχηματιστική Δομή { ακολουθία γεγονότων που προκαλούν τη μετάβαση από μία κατάσταση σε μία άλλη. χρονικές & αιτιακές σχέσεις που συνδέουν τα γεγονότα. Μακροεπίπεδο (μακροδομή) Τελεολογική Δομή { σκοποί/υποσκοποί των διαφόρων μονάδων του συστήματος. Λειτουργεί ως ομπρέλα των δομών της οικοδόμησης σε μικροεπίπεδο
Σχέσεις μετά την Επέκταση
Επέκταση με Νέες Έννοιες - Χειρωνακτικός επέκταση του ελληνικού WordNet με νέους όρους σχετικούς με το γνωστικά αντικείμενο. - Καταγραφή/όρων που δεν υπήρχαν στο ελληνικό WordNet μέσω της διεπαφής του VisDic. - Στο πεδίο της αναζήτησης όρου στο ελληνικό WordNet, προστέθηκαν οι νέοι όροι επιλέγοντας το κουμπί "New". - Στο πεδίο "Definition", προστέθηκαν οι ορισμοί των νέων όρων. - Στο πεδίο "Part of speech", καταγράφηκε το μέρος του λόγου των νέων όρων (π.χ. ρήμα, επίθετο). - Στο πεδίο "Relations", προστέθηκαν οι σχέσεις μεταξύ του νεοεισαχθέντα όρου με άλλους όρους.
Παραδείγματα Επέκτασης Τελεολογική Δομή σκληρός δίσκος IDE σκοπεύει (υποστηρίζει το σκοπό) μόνιμη αποθήκευση Μετασχηματιστική Δομή σκληρός δίσκος IDE έχει λειτουργία εγγραφή Σχεσιακή Δομή σκληρός δίσκος IDE έχει χαρακτηριστικό/ ιδιότητα χωρητικότητα