Μοντέλο Κατανόησης Κειµένου Σύµφωνα µε το µοντέλο, το άτοµο που διαβάζει ένα κείµενο, κατασκευάζει τη Μικροδοµή και τη Μακροδοµή του. Γνωστικές κατηγορίες αντικειµένων: (1) Άτοµο: Ο όρος χρησιµοποιείται για τις οντότητες που συµµετέχουν στην αναπαράσταση γνώσης. (2) Κατάσταση: Ο όρος περιγράφει µια στατική κατάσταση όπου δεν υπάρχει µεταβολή κατά τη διάρκεια µιας χρονικής περιόδου. (3) Γεγονός: Ο όρος περιγράφει µια δράση (όχι από άνθρωπο) που προκαλεί αλλαγές. Η Μικροδοµή περιλαµβάνει δύο υπο-δοµές: Σχεσιακή Δοµή (Relational Structure - RS), η οποία αποτελεί την οντολογία των µονάδων που χαρακτηρίζονται από τις τιµές των χαρακτηριστικών τους, και των στατικών σχέσεων µεταξύ τους, και τη Μετασχηµατιστική Δοµή (Transformational Structure - TrS), η οποία αποτελεί την περιγραφή της ακολουθίας των γεγονότων, που εκτελούνται από τις µονάδες και των αιτιακών/χρονικών σχέσεων µεταξύ τους. Η Μακροδοµή, εκτός από τη µικροδοµή, περιλαµβάνει την Τελεολογική Δοµή (Teleological Structure - TeS) των στόχων και υποστόχων των λειτουργιών των µονάδων του συστήµατος.
Εννοιολογική Χαρτογράφηση Εννοιολογικοί Χάρτες - διαγράµµατα αναπαράστασης σχέσεων µεταξύ εννοιών. Κόµβος - Έννοια Σχέση µεταξύ κόµβων - Σύνδεση µεταξύ τους (ρηµατική περιγραφή) Έννοια - Κάποια καταγραφή γεγονότων ή απλώς κάποια αντικείµενα του φυσικού κόσµου (Novak & Gowin, 1984). Οι έννοιες αποτελούν κόµβους του εννοιολογικού χάρτη και χαρακτηρίζονται µέσω µίας µοναδικής λεκτικής περιγραφής, η οποία πρέπει να ακολουθείται µε συνέπεια κατά τη σχεδίαση του χάρτη. Οι σχέσεις µε τη σειρά τους αποτελούν προτάσεις που αφορούν κάποιες έννοιες της οντολογίας που περιγράφει ο χάρτης και συνδέουν δύο κόµβους-έννοιες του χάρτη. Περιγράφονται πάντα µε τη χρήση κάποιων λέξεων, οι οποίες δηλώνουν το είδος της εξάρτησης των δύο εννοιών. O εννοιολογικός χάρτης αναπτύσσεται µε σκοπό να µπορεί να απαντάει σε µία ερώτηση εστίασης (focus question) καθώς και σε επιµέρους ερωτήσεις που την αναλύουν. Η πρώτη χρήση εννοιολογικών χαρτών έγινε από τον Novak (Novak & Gowin, 1984; Novak & Musonda, 1991) κατά τη διάρκεια πειραµάτων σχετικών µε την εννοιολογική αλλαγή (conceptual change) καί την κατανόηση επιστηµονικών θεωριών σε παιδιά. Οι ερευνητές χρησιµοποίησαν τους εννοιολογικούς χάρτες ως εργαλεία αναπαράστασης της γνώσης των παιδιών.
CMapTools http://cmap.ihmc.us/download/
Σηµασιολογική Ανάλυση Σηµασιολογικές Σχέσεις (Snow, Jurafsky & Ng, 2004): (i) Σχέση υπωνυµίας/υπερωνυµίας: «Το Ασθενοφόρο, Νοσοκοµειακό είναι ένα υπώνυµο του Αυτοκίνητο» (δηλ. το ασθενοφόρο είναι ένα είδος αυτοκινήτου). (ii) Μερωνυµικές Σχέσεις (Μερωνυµία/Ολωνυµία) «Το κεφάλι είναι µέρος του σώµατος», «Μέρος των ποδηλάτων αποτελείται από αλουµίνιο», «Οι βαλβίδες είναι µέρος των µηχανών», «Τα ραντεβού είναι µέρος της εφηβείας», κ.α. 6 Είδη Μερωνυµικών σχέσεων (Winston, Chaffin & Herrmann, 1987)
Λειτουργικότητα Όταν τα µέρη ενός αντικειµένου έχουν µία συγκεκριµένη θέση χρονική ή χωρική σε σχέση µε τα άλλα µέρη ή/και προς το σύνολο. Οµοιοµέρεια Όταν τα µέρη είναι του ιδίου είδους µεταξύ τους αλλά και µε το σύνολο Διαχωρισιµότητα Όταν τα µέλη µπορούν να χωριστούν φυσικά από το σύνολο στο οποίο ανήκουν. "# $%&'()*+,-#./012# 3&4%56*7# 8%+79)&6+ <*9+9: :,;727# *0&%+# " #$%&'&()*+ 2.&34(+21564'&17 :'( ;<( :'(,-&()./0.-1 ).834'(1+9(94/1 = >?41@A#$441B6 241/1+%&*41@7 ;<( ;<( :'( 5?-&C1+53%1@ D >.C/5(1A>3E' )*))1@+'43&(7 )1003&(&1FC&'@+ G H4()*A,-&()./0.-1 &1FC&' '&%34(+'$&1)/-I&17 '4)1*4+1$/%)( J K.B1-*@A 24ICM-N+ON-/EN7 LC'%&IC(*&I&' C'-&.91F+.8I9./' P QMC1@AR2(83-.(' *'%I+?CI01@7 B62.512151%8+0()C6 2.C(1<6 ;<( :'( :'( ;<( ;<( ;<( :'( ;<( ;<( ;<( :'( ;<( =+/'&+: 1+*;727#
Σχεσιακή Δοµή Ειδικού 1. Μαγνητικός δίσκος αποτελείται από Μαγνητικό υλικό (µερωνυµική σχέση 4 τύπου Υλικό Αντικείµενο) 2. Μνήµη υπολογιστή αποτελείται από Κύρια µνήµη (µερωνυµική σχέση 1 τύπου Συστατικό Αντικείµενο) 3. Κεντρική µονάδα επεξεργασίας (CPU) αποτελείται από Καταχωρητές CPU. (µερωνυµική σχέση 6 τύπου Χώρος Επιφάνεια)
Μετασχηµατιστική Δοµή Ειδικού Έχει γεγονός Xρησιµοποιείται για να δηλώσει γεγονότα από τα οποία αποτελείται ένα µακρογεγονός (λειτουργία). Κάθε µακρογεγονός έχει ένα σκοπό, ο οποίος για να επιτευχθεί πρέπει το σύστηµα να µεταβεί από κατάσταση σε κατάσταση ώσπου να καταλήξει στην τελική. Προκαλεί (είναι αιτία) Eκφράζει την αιτιότητα µεταξύ γεγονότων. Οι αιτιακές αυτές σχέσεις είναι και χρονικές. Έπεται Δηλώνει ότι ένα γεγονός ενός µακρογεγονότος έπεται χρονικά ενός άλλου. Δηλαδή, για να συµβεί αυτό το γεγονός θα πρέπει να προηγηθεί κάποιο άλλο γεγονός χωρίς απαραίτητα να προκαλείται από αυτό.
Τελεολογική Δοµή Ειδικού Έχει σκοπό ή υποσκοπό Xρησιµοποιείται για να δηλώσουµε το σκοπό µίας συγκεκριµένης οντότητας ή τον υποσκοπό που πρέπει να επιτευχθεί µε στόχο την επίτευξη του απώτερο σκοπού. Συνδέει µία οντότητα µε µία άλλη, δηλώνοντας ότι η δεύτερη οντότητα αποτελεί το σκοπό της πρώτης. Στην πραγµατικότητα και αυτές οι σχέσεις είναι µερωνυµικές τύπου Γεγονός Δραστηριότητα. Πραγµατοποιείται µε Συνδέει την τελεολογική µε τη µετασχηµατιστική δοµή αφού οι δύο δοµές αλληλοσυσχετίζονται.
WordNet WordNet http://wordnet.princeton.edu/wordnet/ - Aγγλική λεξικολογική βάση δεδοµένων µε τις έννοιες και τις σηµασιολογικές σχέσεις µεταξύ λέξεων/εννοιών.ουσιαστικά, ρήµατα, επίθετα και επιρρήµατα. Synset - σύνολο λέξεων, που σε δεδοµένο περιβάλλον η µία λέξη µπορεί να χρησιµοποιηθεί στη θέση µιας άλλης. Tοµείς - Μια λέξη µπορεί να ανήκει σε διάφορες synsets σε πολλούς τοµείς. Κάθε synset σε κάθε τοµέα, έχει τη δική του ερµηνεία και σηµασιολογικές συσχετίσεις υπερωνυµίας, υπωνυµίας, ολωνυµίας ή µερωνυµίας µε άλλες έννοιες. "Mνήµη" - χωριστά synsets στην Ψυχολογία & στην Επιστήµη Υπολογιστών. Τo Eλληνικό WordNet αναπτύχθηκε στο Πανεπιστήµιο της Πάτρας από οµάδα γλωσσολόγων, µε τη συµβολή του Πανεπιστηµίου Αθηνών (BalkaNet Project).
WordNet Είδη σηµασιολογικών σχέσεων του WordNet (i) Συνώνυµο (Synonym): Το X είναι συνώνυµο του Υ, όταν το Υ µπορεί να αντικατασταθεί από το Χ χωρίς σηµασιολογικό και εννοιολογικό λάθος, π.χ. o «δήµος» είναι συνώνυµο της «πόλης». (ii) Υπώνυµο/Υπερώνυµο (Hyponym/Hypernym): Το X είναι υπερώνυµο του Υ (ή µε άλλα λόγια το Υ είναι υπώνυµο του Χ), όταν το Υ είναι ένα είδος του Χ, π.χ. ο "σκύλος" είναι υπώνυµο του «ζώου» ή αλλιώς ο σκύλος είναι είδος ζώου. (iii) Μερώνυµο/Ολώνυµο (Meronym/Olonym): Το X είναι µερώνυµο του Υ (ή µε άλλα λόγια το Υ είναι ολώνυµο του Χ), όπως ο "προφυλακτήρας" είναι µερώνυµο του "αυτοκινήτου", δηλ. ο προφυλακτήρα είναι µέρος του αυτοκινήτου. (iv) Συγγένεια (Familiarity): Το Υ είναι συγγενής του Χ, όταν τα Χ και Υ µοιράζονται το ίδιο υπερώνυµο, π.χ. ο "Λύκος" είναι συγγενής του "σκύλου" και ο "σκύλος" είναι συγγενής του "λύκου", αφού και τα δυο έχουν υπερώνυµο το "ζώο".
Visdic Editor Ο VisDic Editor (http://nlp.fi.muni.cz/projekty/visdic/) - γραφική εφαρµογή (Horak & Smrž, 2004), η οποία χρησιµοποιείται για την αναζήτηση όρων και σηµασιολογικών σχέσεων µεταξύ τους, την τροποποίηση λεξικών αποθηκευµένων σε XML (extensible Markup Language) µορφή, και την περιήγηση στα BalkaNet WordNets. αποθηκευτική συσκευή συσκευή
"µ# $%&"' ()*(+',-./0123µ- RS has_attribute ("#$ $%$&'(')) X has_attribute Y *.". +,-$) µ./µ( has_attribute ')",'(') TrS TeS SYNSET.SNOTE SYNSET.ILR.TYPE HOLO_MEMBER HOLO_PART HOLO_PORTION HOLO_SUBSTANCE HYPERNYM NEAR_ANTONYM HAS_ATTRIBUTE HAS_ACTION HAS_FUNCTION HAS_INPUT HAS_OUTPUT INTENDS_TO HAS_A_GOAL.inf αρχείο Εμπλουτισμός με Νέες Σχέσεις has_function ("#$ 0#$'12-34)) has_action ("#$ %-56() has_input ("#$ #461%1) has_output ("#$ 81%1) has_a_goal ("#$ 6+1*&) intends_to (6+1*#,#$.)), "#$%&'()*+,() "#$%&'($#)%#)*+, -.(+, "#"$#$%&'() *$+() X has_function / has_action Y *.". +,-$) µ./µ( has_function )*17/+#26( X as_input / has_output Y *.". *-&67#6( has_input )-$7µ&9 X has_a_goal / intends_to Y *.". +,-$) µ./µ( has_a_goal *-16:-$./ )*17/+#26(. Δηµιουργήθηκε XML µε τις τελικές σχέσεις εµπλουτισµού και καινούριος gre_db κατάλογος µέσω του VisDic. Αντιγράφτηκαν στο νέο κατάλογο τα αρχεία του καταλόγου που περιέχονται στο ελληνικό WordNet, καθώς και το εµπλουτισµένο.inf αρχείο, το οποίο περιέχει τα νέα σύνολα συνωνύµων.νέες εγγραφές προστέθηκαν µε το όνοµα του κάθε νέου τύπου σχέσης. (ήδη υπάρχουσες σχέσεις του WordNet αφορούν στη σχεσιακή δοµή του µοντέλου)
Εμπλουτισμός με Νέες ΈΈννοιες Εµπλουτισµός χειρονακτικά το ελληνικό WordNet µε νέους όρους σχετικά µε τα γνωστικά αντικείµενα. "#$%&'()*+,-.-/& Καταγραφή των λέξεων/όρων που δεν υπάρχουν στο ελληνικό WordNet µέσω της διεπαφής του VisDic. '0%,12".3)& 4%.5+6-&%47.3%8&94%:& Στο πεδίο της αναζήτησης όρου στο ελληνικό WordNet, προσθήκη των νέων όρων επιλέγοντας το κουµπί "New". 4%.5+6-&.;1.-/& 4%.5+6-&,80%:&.;1.-/&& Στο πεδίο "Definition", προσθήκη ορισµών των νέων όρων. Στο πεδίο "Part of speech", καταγραφή µέρος του λόγου των νέων όρων (π.χ. ρήµα, επίθετο).
Μέσο µετάδοσης has_a_goal ζεύξη Κ.Σ.Δ.Β.Δ. has_action βελτιστοποίηση ερωτήµατος Δικτύα Η/Υ - 70 νέα synsets - τροποποιήθηκαν 60 Βάσεις Δεδοµένων - 50 νέα synsets - τροποποιήθηκαν 19