1 Απόκτηση Γνώσης
Απόκτηση Γνώσης Απόκτηση γνώσης (Knowledge Acquisition) είναι η μεταφορά και μετασχηματισμός των ικανοτήτων στην επίλυση προβλημάτων από κάποια πηγή γνώσης σε ένα πρόγραμμα Η Εκμαίευση γνώσης (Knowledge Elicitation) υπονοεί ότι η μεταφορά γνώσης πραγματοποιείται μέσα από μια σειρά συνεντεύξεων μεταξύ ενός ανθρώπου ειδικού του τομέα (domain expert) και του μηχανικού της γνώσης ( knowledge engineer). 2
Διαδικασία Ανάπτυξης Εμπείρων Συστημάτων Μηχανικός Γνώσης Απόκτηση Γνώσης Ανάλυση Προβλήματος Εκμαίευση Γνώσης Ανάλυση Γνώσης Σχεδίαση Άνθρωπος Ειδικός Άνθρωπος - Ειδικός & Μηχανικός Γνώσης Προγραμματιστής & Μηχανικός Γνώσης Υλοποίηση Πρωτότυπο Ανάλυση του Προβλήματος Απόκτηση της Γνώσης Τελικός Σχεδίαση Χρήστης Υλοποίηση Επαλήθευση και Έλεγχος Αξιοπιστίας 3 Επαλήθευση Έλεγχος Αξιοπιστίας Τελικό Σύστημα
Ανάλυση Προβλήματος Προσδιορίζεται η μορφή της επιθυμητής λύσης του προβλήματος. Κυριότερα ζητήματα: 4 Είναι το πρόβλημα κατάλληλο για επίλυση από έμπειρο σύστημα ή συμβατικό πρόγραμμα; Υπάρχουν έτοιμες μελέτες περιπτώσεων επίλυσης του προβλήματος (case-studies); Ποια είναι τα οφέλη από την κατασκευή του έμπειρου συστήματος;
Εκμαίευση Γνώσης Διαδικασία αλληλεπίδρασης μεταξύ του ειδικού και του μηχανικού της γνώσης προκειμένου να: 5 Εκμαιεύσει τη γνώση από τους ειδικούς με έναν συστηματικό τρόπο π.χ. Παρουσιάζοντας τους παραδείγματα προβλημάτων και ζητώντας να τα λύσουν μαζί Αποθηκεύσει τη γνώση σε μια ενδιάμεση μορφή αναπαράστασης Συνθέσει τη γνώση από την ενδιάμεση μορφή αναπαράστασης σε μια αξιοποιήσιμη μορφή, όπως οι κανόνες παραγωγής
6 Εκμαίευση Γνώσης (Knowledge Elicitation) Διαδικασία απόκτησης (εξαγωγής) της γνώσης από άτομα που θεωρούνται "ειδικοί" ή "εμπειρογνώμονες". Θεωρείται ως το πιο δύσκολο και αμφίβολο βήμα στην ανάπτυξη ενός εμπείρου συστήματος. Ειδικός είναι το άτομο που έχει ειδική γνώση ή ικανότητα πάνω σε ένα θέμα. Δεν περιορίζεται μόνο στην κατοχή πληροφοριών ή δεδομένων πάνω σε ένα θέμα. Κατέχει ειδική γνώση σε βαθμό που τον κάνει να ξεχωρίζει από τους υπόλοιπους απλούς "γνώστες". Γνώση: Πλήρης επίγνωση (awareness) ή οικειότητα (familiarity) για ένα γεγονός, μια θεωρητική ή πρακτική κατανόηση ενός θέματος, η οποία αποκτάται από την εμπειρία ενός ατόμου. Η εμπειρία ενός ατόμου θεωρείται αναπόσπαστο μέρος της γνώσης που κατέχει. Διαφοροποίηση της σχεδίασης έμπειρων συστημάτων από την παραδοσιακή τεχνολογία λογισμικού.
Η εκμαίευση της γνώσης είναι πολύ δύσκολη Αιτίες για τη δυσκολία εκμαίευσης και την εξαγωγή του αποτελέσματος Η τεχνική φύση του συγκεκριμένου πεδίου Ο μηχανικός της γνώσης πρέπει να γνωρίζει την περιοχή εφαρμογής, ιδιαιτερότητες, ορολογία, πριν αρχίσει να επικοινωνεί με τον ειδικό Ο τρόπος σκέψης των ειδικών Οι ειδικοί σκέφτονται χρησιμοποιώντας τυπικά αντικείμενα και γεγονότα που συμβαίνουν συχνά παρά ακολουθώντας γενικές αρχές Η περιγραφή και το πλαίσιο της γνώσης Είναι πολύ δύσκολο να βρεθεί ένα καλός τρόπος περιγραφής που να εκφράζει την υπάρχουσα γνώση και συγχρόνως να βρεθεί να καλό πλαίσιο που να ταιριάζει στη γνώση 7
Προβλήματα στην Εκμαίευση της Γνώσης Παράδοξο της ειδίκευσης: Όσο πιο πολύ ισχυρίζεται κάποιος ότι είναι ειδικός σε κάποιο θέμα, τόσο πιο δύσκολη είναι η ανταλλαγή πληροφοριών μαζί του. Ευσεβής πόθος (wishful thinking): Όταν ο ειδικός περιγράφει ένα παράδειγμα, εκφράζει ουσιαστικά το τι θα έπρεπε να γίνεται και όχι το τι πραγματικά γίνεται. Κατάλληλο υπόβαθρο γνώσης του μηχανικού γνώσης. Έλλειψη χρόνου: Ο ειδικός καταλήγει σε βιαστικές απαντήσεις, όταν αυτές απαιτούν αρκετό χρόνο. Ο μηχανικός γνώσης πρέπει να διασφαλίσει ότι ικανοποιούνται οι στόχοι της συνέντευξης. Αμεροληψία του μηχανικού γνώσης. Aπροθυμία του ειδικού να μεταδώσει γνώση. 8 Ανεπιτήδειος έμπειρος (inexpert expert).
Στάδια απόκτησης γνώσης Καθορισμός Χαρακτηριστικών Προβλήματος ΠΡΟΣΔΙΟΡΙΣΜΟΣ 9 Απαιτήσεις Εύρεση εννοιών Αναπαράστασης γνώσης ΕΝΝΟΙΛΟΓΙΚΟ Έννοιες Σχεδίαση δομής για την Οργάνωση της γνώσης ΤΥΠΟΠΟΙΗΣΗ Δομή Τυποποίηση κανόνων Που περιέχουν γνώση ΥΛΟΠΟΙΗΣΗ Επαναπροσδιορισμός Επανασχεδιασμός Ρεφινάρισμα Κανόνες Αξιοπιστία Κανόνων Που ελέγχουν γνώση ΕΛΕΓΧΟΣ
Στάδια απόκτησης γνώσης Καθορισμός Καθορισμός της τάξης των προβλημάτων που το σύστημα πρέπει να λύσει. Καθορισμός των δεδομένων με τα οποία το σύστημα θα δουλεύει και τα κριτήρια που πρέπει να ικανοποιούν οι λύσεις Εννοιολογικό Εύρεση των βασικών εννοιών, περιγραφή τους και των συσχετίσεων μεταξύ τους. Είδη δεδομένων, ροή πληροφοριών στο πεδίο εφαρμογής. Τυποποίηση Καθορισμός του χώρου αναζήτησης, έλεγχος της βεβαιότητας πληροφορίας και της συμπληρωματικότητας της πληροφορίας. Οργάνωση και συσχέτιση εννοιών Υλοποίηση Η γνώση μετατρέπεται σε ένα εκτελέσιμο πρόγραμμα, όπου ο έλεγχος και η ροή πληροφορίας είναι σημαντικά. Σχεδιασμός των κανόνων και των πλαισίων Επαλήθευση Περιλαμβάνει αντιπροσωπευτικά τεστ. Η ανατροφοδότηση από τον ειδικό 10 είναι σημαντική. Έλεγχος συμβατότητας του συστήματος, επιβεβαίωση ορθής κωδικοποίησης γνώσης,
Επίπεδα ανάλυσης της γνώσης Μεθοδολογία τυποποίησης της μοντελοποίησης της γνώσης αναπτύχθηκε από τον Wielinga που ονομάστηκε KADS (Knowledge Acquisition and Domain Structuring). Βασίζεται στην προσέγγιση ότι ένα σύστημα βασισμένο σε γνώση είναι ένα λειτουργικό μοντέλο που δείχνει κάποια επιθυμητή συμπεριφορά και επιδρά σε φαινόμενα του πραγματικού κόσμου Η απόκτηση γνώσης εμπεριέχει την εκμαίευση της γνώσης από το πεδίο γνώσης και την ερμηνεία αυτή της πληροφορίας σε σχέση με το εννοιολογικό πλαίσιο και αντίστοιχο φορμαλισμό αυτών των ιδεών έτσι ώστε το πρόγραμμα να μπορεί στην πραγματικότητα να χρησιμοποιεί τη γνώση 11
Βασικές αρχές του KADS 12 Το KADS βασίζεται σε 5 βασικές αρχές: Πολλαπλά μοντέλα προκειμένου να χειριστούν την πολυπλοκότητα της τεχνολογίας της γνώσης Ένα πλαίσιο τεσσάρων επιπέδων για τη μοντελοποίηση της εμπειρίας Επαναχρησιμοποίηση γενικών συστατικών μοντέλων ως πρότυπα για top-down απόκτηση γνώσης. Μετατρεψιμότητα απλών μοντέλων σε πιο πολύπλοκα Διατήρηση της δομής μετά το μετασχηματισμό των εμπειρικών μοντέλων κατά το σχεδιασμό και την εφαρμογή
Διαχείριση πολυπλοκότητας Το KADS σχεδιάστηκε για να διαχειρίζεται την πολυπλοκότητα Ο μηχανικός της γνώσης πρέπει να είναι ικανός να: Ορίζει το πρόβλημα που το έμπειρο σύστημα πρόκειται να λύσει Ορίζει την λειτουργία που το σύστημα πρέπει να ικανοποιεί σε σχέση με το συγκεκριμένο πρόβλημα Ορίζει τις ενέργειες που πρέπει να πραγματοποιηθούν προκειμένου να ικανοποιηθεί η λειτουργία 13
Μοντέλα KADS Το KADS διαθέτει μερικά μοντέλα προκειμένου να επιλύσει τέτοια προβλήματα Ένα μοντέλο οργάνωσης για το κοινωνικόοικονομικό περιβάλλον στο οποίο το σύστημα θα λειτουργήσει Ένα μοντέλο εφαρμογής για το πρόβλημα που πρέπει να λυθεί και την λειτουργία που θα πρέπει να επιτελεί Ένα μοντέλο εργασίας η οποία δείχνει πως επιτελείται η λειτουργία του συστήματος. Αυτό χωρίζει την επιθυμητή συμπεριφορά σε συστατικές εργασίες 14
Μοντέλα KADS Το KADS διαθέτει: Ένα συνεργατικό ή επικοινωνιακό μοντέλο που είναι υπεύθυνο για την αποκέντρωση του προβλήματος της συμπεριφοράς σε πρωταρχικές εργασίες που κατανέμονται κατάλληλα Ένα μοντέλο εξειδίκευσης που αναλύει τη γνώση την οποία χρησιμοποιεί ο ειδικός κατά τη διαδικασία επίλυσης ενός προβλήματος Ένα μοντέλο σχεδίασης που προτείνει υπολογιστικές τεχνικές και μηχανισμούς που μπορούν να χρησιμοποιηθούν για την πραγματοποίηση των προδιαγραφών που προέκυψαν από τα προηγούμενα μοντέλα 15
Η 4 επιπέδων προβολή της γνώσης στο KADS Κατηγορία Γνώσης Οργάνωση Τύποι γνώσης Στρατηγική Στρατηγικές Σχέδια, μετά-κανόνες Ενέργεια Ενέργειες Στόχοι, όροι ελέγχου, Συμπερασμός Δομή Συμπερασμού δομές ενεργειών Πηγή γνώσης, Περιοχή Θεωρία περιοχής Metaclass, Προβολή του πεδίου Έννοια, Ιδιότητα, Σχέσεις 16
Οντολογική Ανάλυση Ένας άλλος τύπος ανάλυσης των επιπέδων της γνώσης ονομάζεται οντολογική ανάλυση Αυτή η προσέγγιση περιγράφει τα συστήματα σε σχέση με οντότητες, τις σχέσεις μεταξύ τους, και τους μετασχηματισμούς μεταξύ των οντοτήτων που συμβαίνουν κατά την εκτέλεση μιας εργασίας 17
Οντολογική ανάλυση Υπάρχουν 3 κύριες κατηγορίες για τη δόμηση του πεδίου της γνώσης: Η στατική οντολογία αποτελείται από οντότητες του πεδίου με τις ιδιότητές τους και τις σχέσεις τους Η δυναμική οντολογία ορίζει τις καταστάσεις που συμβαίνουν κατά την επίλυση ενός προβλήματος και πως μετασχηματίζονται οι καταστάσεις Η επιστημολογική οντολογία περιγράφει τη γνώση που καθοδηγεί και περιορίζει τις καταστάσεις των μετασχηματισμών 18
Κελύφη των εμπείρων συστημάτων Τα πρώτα έμπειρα συστήματα φτιάχτηκαν από το μηδέν Στη συνέχεια αναπτύχθηκαν εξειδικευμένες γλώσσες Οι γλώσσες αυτές είχαν 2 είδη ευκολιών: modules, για την αναπαράσταση της γνώσης, βασισμένα σε δομές όπως οι κανόνες ή τα πλαίσια Έναν διερμηνέα να ελέγχει ποία modules ενεργοποιούνται κάθε φορά. Έγινε φανερό ότι αυτά τα τμήματα θα μπορούσαν να επαναχρησιμοποιηθούν. Θα μπορούσαν να χρησιμοποιηθούν ως βάση άλλες εφαρμογές. Αυτά τα προγράμματα είναι γνωστά ως κελύφη 19
Κελύφη Εμπείρων Συστημάτων Εξειδικευμένα εργαλεία για την ανάπτυξη εμπείρων συστημάτων. Αποτελούν έμπειρα συστήματα χωρίς τη βάση γνώσης. Μπορούν να παρομοιαστούν ως περιβλήματα (κελύφη) μιας βάση γνώσης. Προέρχονται από: Υπάρχοντα έμπειρα συστήματα με αφαίρεση της αρχικής βάσης γνώσης τους. Αναπτύσσονται από την αρχή και δεν προσανατολίζονται σε συγκεκριμένη εφαρμογή. Διαχωρίζονται σε απλά ή εξελιγμένα βάσει σημαντικών χαρακτηριστικών τους: Μορφές αναπαράστασης γνώσης και συλλογιστικής. Ευκολίες διασύνδεσης. 20
EMYCIN 1 EMYCIN προήλθε από μια ανεξάρτητη από το πεδίο εφαρμογής έκδοση του MYCIN. Επειδή το MYCIN αναπτύχθηκε για διάγνωση και συμβουλές το EMYCIN είναι πιο κατάλληλο για παραγωγική συλλογιστική προβλημάτων διάγνωσης Η εξειδικευμένη γνώση κάθε προβλήματος παριστάνεται με κανόνες παραγωγής της μορφής IF <υπόθεση> THEN <ενέργεια> ; Όπου η υπόθεση είναι έκφραση Boolean αποτελούμενη από κατηγορήματα από τριάδες OAV. Ένα δένδρο από συμφραζόμενα οργανώνει τις οντότητες του πεδίου εφαρμογής σε μια απλή ιεραρχία έτσι ώστε να διαθέτει κάποια τα χαρακτηριστικά κληρονομικότητας του μηχανισμού πλαισίων 21
EMYCIN 2 EMYCIN συσχετίζει έναν συντελεστής βεβαιότητας CF από το -1 μέχρι το +1 (true) για κάθε τριάδα OAV. Μια προϋπόθεση θεωρείται αληθής εάν ο CF είναι μεγαλύτερος από την τιμή 0.2. Η εκτέλεση του κανόνα περιλαμβάνει τον υπολογισμό του CF του συμπεράσματος. Αυτό εμπεριέχει το συνδυασμό των CF από τον πρωθύστερο τμήμα, το επακόλουθο και τον ίδιο τον κανόνα EMYCIN χρησιμοποιεί ανάστροφη ακολουθία εκτέλεσης για τη στρατηγική ελέγχου. Μετά την επιλογή ενός στόχου, επιλέγονται οι κανόνες των οποίων τα αποτελέσματα συσχετίζονται με το στόχο και επαναληπτικά προσπαθεί να βρει τους υποστόχους που από τις προϋποθέσεις των κανόνων Οι κανόνες εκτελούνται ανάστροφα: Όταν επαληθεύεται η συνθήκη τότε προστίθενται στη μνήμη οι τριάδες της ενέργειας. Η ενέργεια συνοδεύεται με συντελεστές βεβαιότητας. Όταν δεν φτάνει σε κάποιο τελικό υπολογισμό ζητάει από το χρήστη 22περισσότερη πληροφορία
Ιδιότητες που προστέθηκαν από EMYCIN Μια συνοπτική γλώσσα κανόνων, ευκολότερη στο διάβασμα από τη LISP & και πιο συμπυκνωμένη σε σχέση με τα αγγλικά που χρησιμοποιούσε το MYCIN. Μια οργάνωση καταλόγου για τους κανόνες. Είναι οργανωμένοι σε ομάδες Μια διεπιφάνεια (interface) μεταξύ του τελικού προγράμματος συμβουλών και του τελικού χρήστη Μια διεπιφάνεια μεταξύ του σχεδιαστή του συστήματος και του προγράμματος συμβουλών, που διαθέτει εργαλεία για επεξεργασία και απεικόνιση κανόνων και πινάκων Ο TEΙRESIAS συμπεριλαμβάνεται ως τμήμα της διεπιφάνειας Υποστηρίζονται μετα-κανόνες: Εξετάζουν τις συνθήκες των κανόνων που μπορούν να εκτελεστούν. 23 Καθορίζουν τη σειρά εκτέλεσης, ή αποτρέπουν την εκτέλεση κάποιων κανόνων.
EMYCIN 3 EMYCIN παρακολουθεί τη συμπεριφορά ενός συνόλου κανόνων χρησιμοποιώντας τα ακόλουθα: EXPLAIN μετά από κάθε συμβουλή, μια επεξήγηση δίνεται που περιγράφει στο χρήστη πως προέκυψε το συμπέρασμα TEST Σε αυτό το mode, ο ειδικός μπορεί να συγκρίνει τα αποτελέσματα από την παρούσα δοκιμή με άλλα αποθηκευμένα σωστά αποτελέσματα και να δει τις διαφορές REVIEW Ο ειδικός μπορεί να εξετάσει τα συμπεράσματα του συστήματος από μια βιβλιοθήκη αποθηκευμένων περιπτώσεων. Αυτό βοηθά για να παρακολουθεί τις επιδράσεις της πρόσθεσης νέων κανόνων και βοηθάει στο debugging. 24
EMYCIN Χρησιμοποιήθηκε για την κατασκευή διαφόρων εμπείρων συστημάτων: Lithio (γεωλογία) Clot (ασθένειες πήξης του αίματος) Puff (πνευμονικές ασθένειες) Tax-Advisor (νομική) Sacon (ανάλυση μηχανολογικών σχεδίων) Head Med (ψυχιατρικές διαγνώσεις) 25
Εξελιγμένα Κελύφη 26 Εργαλεία της τεχνολογίας της γνώσης τα οποία υποστηρίζουν: Πολλαπλούς τρόπους αναπαράστασης γνώσης και συλλογιστικής. Εξελιγμένες δυνατότητες διασύνδεσης. Μεγαλύτερη γενικότητα εφαρμογών. Κατηγορίες εξελιγμένων κελυφών, ανάλογα με τον τρόπο που αναπτύχθηκαν: Αρχικά από έμπειρα συστήματα και στη συνέχεια μετατράπηκαν και επεκτάθηκαν ώστε να υποστηρίζουν περισσότερα είδη αναπαράστασης γνώσης και συλλογιστικής. Π.χ. Personal Consultant, S1 και M4, κ.ά. Από την αρχή σε κάποια γλώσσα προγραμματισμού και δεν προήλθαν από κάποιο έμπειρο σύστημα. Art, Kee, και Knowledge Craft (αναπτύχθηκαν σε Lisp)
Εξελιγμένα Κελύφη Διαφορές με τα απλά κελύφη 27 Δε δεσμεύονται από τη δόμηση και τους περιορισμούς του αρχικού έμπειρου συστήματος. Δίνουν περισσότερες δυνατότητες στην κατασκευή και τη συντήρηση των εμπείρων συστημάτων. Είναι συνήθως δυσκολότερα στην εκμάθηση γιατί περιέχουν πολλές και ετερογενείς μεταξύ τους προγραμματιστικές έννοιες. Η ανάμειξη διαφόρων προγραμματιστικών μοντέλων γίνεται πειραματικά από τους προγραμματιστές, γιατί δεν υπάρχουν θεωρίες υβριδικών τρόπων αναπαράστασης της γνώσης.
Εξελιγμένα Κελύφη Οι κυριότεροι μέθοδοι αναπαράστασης γνώσης: Πλαίσια: Πλεονεκτούν στη δομημένη αναπαράσταση σύνθετων φυσικών αντικειμένων και στο συμπαγή τρόπο χειρισμού τους. Κανόνες: Πλεονεκτούν στο δηλωτικό τρόπο αναπαράστασης εμπειρικών συσχετίσεων μεταξύ παρατηρηθέντων δεδομένων και επαρκούντων δράσεων για την αντιμετώπιση των περιπτώσεων. Ο συνδυασμός των δύο μεθόδων αναπαράστασης γνώσης γίνεται ως εξής: Οι συνθήκες των κανόνων μπορούν να αναφέρονται σε τιμές των ιδιοτήτων των πλαισίων. 28 Οι ενέργειες μπορούν να αλλάζουν τις τιμές των ιδιοτήτων ή να δημιουργούν και να διαγράφουν πλαίσια.
Personal Consultant Είναι εξέλιξη του απλού κελύφους Emycin. Η αναπαράσταση γνώσης γίνεται με κανόνες και γεγονότα. Τα γεγονότα παριστάνονται με τριάδες όπως και στο Emycin. Υποστηρίζει αβεβαιότητα Υποστηρίζει τόσο ανάστροφη όσο και ορθή συλλογιστική Εξελιγμένες δυνατότητες: Εξελιγμένος επεξεργαστής κειμένου για τη βάση γνώσης. Δυνατότητα επεξήγησης της πορείας συλλογισμού. Πρόγραμμα επεξεργασίας φυσικής γλώσσας. 29
Art Automated Reasoning Tool Προσφέρει διάφορους τρόπους αναπαράστασης της γνώσης. Κανόνες. Μπορούν να εκτελεστούν με ορθή ή ανάστροφη συλλογιστική. Σενάρια. κλπ. Προσφέρει εξελιγμένους μηχανισμούς ελέγχου, Αρχιτεκτονική μαυροπίνακα Μηχανισμός συντήρησης της αλήθειας (truth maintenance) Καταγράφεται ο δρόμος συλλογισμού που ακολουθεί η ικανοποίηση της υπόθεσης ενός κανόνα, έτσι ώστε αν καταρριφθεί η τελική υπόθεση, διαγράφονται όλες οι σχετιζόμενες υποθέσεις. Εξελιγμένες δυνατότητες: Γραφικό εργαλείο Art Studio για τη σταδιακή ανάπτυξη της βάσης γνώσης μέσω παραθύρων, μενού, κλπ. Δυνατότητα κλήσης προγραμμάτων που γράφηκαν σε άλλες γλώσσες προγραμματισμού, π.χ. Lisp, C, Pascal. 30
Kee Knowledge Engineering Environment Η αναπαράσταση γνώσης γίνεται με μονάδες (units) ή πλαίσια. Η εκτέλεση κανόνων μπορεί να είναι ορθή ή ανάστροφη, με μηχανισμό οπισθοδρόμησης. Εξελιγμένες δυνατότητες: 31 Εργαλείο σύνταξης της βάσης γνώσης. Εργαλείο Kee Worlds που δίνει τη δυνατότητα για αναπαράσταση και σύγκριση εναλλακτικών σεναρίων. Εργαλείο Tms ως μηχανισμός συντήρησης της αλήθειας. Εργαλείο Kee Connection, για διασύνδεση με σχεσιακές βάσεις δεδομένων.
TEIRESIAS 1 TEΙRESIAS, αναπτύχθηκε από τον Davis, για να διευκολύνει την αυτόματη απόκτηση γνώσης. Αφορά τη χρήση μεταγνώσης Υποθέτει ότι υπάρχουν μονάδες γνώσης που μοιάζουν με κανόνες και χρησιμοποιούνται έτσι ώστε μια ακολουθία από τέτοιους κανόνες να εξηγεί τη συμπεριφορά του συστήματος TEΙRESIAS έχει μοντέλα κανόνων και κανόνες που περιγράφουν τη δομή των κανόνων. Αυτό επιτρέπει στον TIERESIAS να εντοπίζει τους λανθασμένους κανόνες όταν εισάγονται στο σύστημα Χρησιμοποιώντας το διάλογο με τους ειδικούς και τη γνώση τους με το τι θα μοιάζει ένας κανόνας ο TIERESIAS μπορεί να να φτιάξει έναν νέο κανόνα για τον ειδικό 32
TEIRESIAS 2 Ο TEIRESIAS είναι ένας επεξεργαστής γνώσης προορισμένος για την ανάπτυξη και συντήρηση μεγάλων βάσεων γνώσης Δίνει σημασία στο συντακτικό των κανόνων Δεν έχει γνώση για το πεδίο εφαρμογής ή για το πρόβλημα που πρόκειται να λυθεί από το σύστημα Η γενικότητά του επιτρέπει να εφαρμοσθεί σε κανόνες που αφορούν πολλές περιοχές εφαρμογής 33
TEIRESIAS 3 Δοθέντος ενός αρχικού, μικρού συνόλου κανόνων σε ένα πρωτότυπο έμπειρο σύστημα, TEIRESIAS εκτελεί τους κανόνες σε παραδείγματα προβλημάτων και ζητείται από τους ειδικούς να κριτικάρουν τα αποτελέσματα Οι ειδικοί στη συνέχεια προτείνουν νέους κανόνες ή βελτίωση των υπαρχόντων. Αυτοί οι νέοι κανόνες παρακολουθούνται για τη συνέπεια τους και τη συμφωνία τους με τα μοντέλα κανόνων Τα μοντέλα κανόνων είναι ένα είδος μετα κανόνων που περιγράφουν γενικούς ορισμούς σχετικά με τους κανόνες TEIRESIAS επιτρέπει στους ειδικούς να προσθέτουν νέα στοιχεία από έναν τύπο δεδομένων. Ελέγχει ότι οι ειδικοί χρησιμοποιούν τη σωστή δομής και ότι εισέρχονται σωστά μέσα στο σύστημα 34
TEIRESIAS 4 TEIRESIAS διακρίνει μεταξύ 3 επιπέδων γενίκευσης: Εξειδικευμένη γνώση πεδίου για τα αντικείμενα δεδομένων Αναπαράσταση εξειδικευμένης γνώσης σχετικά με τους τύπους δεδομένων Αναπαράσταση ανεξάρτητης γνώσης σχετικά με τις δηλώσεις Ένας ειδικός μπορεί να χρησιμοποιήσει τον TEIRESIAS για να επικοινωνήσει με ένα έμπειρο σύστημα. 35
Μέθοδοι απόκτησης γνώσης Κλασσικές μέθοδοι Συνέντευξη Παρατήρηση, Ανάλυση πρωτοκόλλων Αυτόματες Ημιαυτόματες Ο ειδικός εισάγει απευθείας τη γνώση στο σύστημα χρησιμοποιώντας ειδικό λογισμικό (π.χ. Teiresias, Opal, κλπ) Τεχνικές μηχανικής μάθησης 36
Συνέντευξη Η συνέντευξη απαιτεί πολύ καλές ικανότητες διαπροσωπικής επικοινωνίας. Δύο τύποι: Μη-δομημένες Αποτελούνται από γενικές ερωτήσεις που υποβάλλονται με την ελπίδα της καταγραφής όσο περισσότερων πληροφοριών γίνεται. Ξεκινάμε έτσι ώστε να αποκτήσουμε μια γενική ιδέα και να γνωρίσουμε τον ειδικό. Οι αρχικές συνεντεύξεις είναι διερευνητικές για να περιγραφεί το πεδίο και το πρόβλημα Ημιδομημένες συνεντεύξεις. Περιέχουν μια σειρά ανοιχτών ερωτήσεων και θεμάτων που πρέπει να καλυφθούν. Δομημένες Περιέχουν ένα ερωτηματολόγιο με αυστηρά καθορισμένη δομή που περιλαμβάνει συγκεκριμένες ερωτήσεις σχετικές με τα χαρακτηριστικά του προβλήματος, συγκεκριμένα αντικείμενα, τάξεις, τύπους, μηχανισμούς επίλυσης. 37
Συνέντευξη Για να είναι επιτυχημένη η διαδικασία συνέντευξης: Ο μηχανικός της γνώσης συνομιλεί με τον ειδικό Είναι απαραίτητη καλή ανατροφοδότηση από τον ειδικό για τον έλεγχο της αξιοπιστίας της γνώσης Οι κανόνες επιδρούν έτσι ώστε το απλό διάβασμα από τους ειδικούς δεν είναι αρκετό Φτιάχνονται πρωτότυπα για τον έλεγχο εξειδικευμένων μονάδων πληροφορίας. Τα πρωτότυπα βοηθούν τον ειδικό να καταλάβει καλύτερα πως θα είναι το σύστημα Είναι χρήσιμο να δοκιμάσει ο ειδικός ένα πρωτότυπο. Έτσι θα έχει καλύτερη γνώμη για το σύστημα και ο ειδικός θα δείχνει περισσότερο ενδιαφέρον Η συνέντευξη απαιτεί αρκετό χρόνο και προσπάθεια 38
Τεχνικές Συνέντευξης Επαναδιδασκαλία: μηχανικός γνώσης προσπαθεί να επαναδημιουργήσει και να συνοψίσει ότι έχει ειπωθεί από τον ειδικό και να το διδάξει σε αυτόν. Διδακτική συνέντευξη (tutorial interview): Ο ειδικός δίνει μια διάλεξη πάνω στην περιοχή του θέματος. Βαθμωτά πλέγματα (laddered grids): Εξετάζεται ο χώρος του γνωστικού πεδίου, βάσει ερωτήσεων οι οποίες κινούνται στον άξονα γενικού-ειδικού (ή κάθετα), πάνω στον οποίο θεωρείται ότι ανήκουν οι έννοιες. Ταξινόμηση καρτών (card sorting): Ανακάλυψη κατάλληλων ιδιοτήτων των στοιχείων που απαρτίζουν την περιοχή του πεδίου, για την ταξινόμηση των 39
Τεχνικές Συνέντευξης Πλέγματα ρεπερτορίων (repertory grid): Κάθε στοιχείο της περιοχής κατηγοριοποιείται σύμφωνα με ένα σύνολο από έννοιες ή χαρακτηρισμούς, οι οποίες εφαρμόζονται σε όλα τα στοιχεία σε κάποιο βαθμό. Κάθε έννοια εκφράζεται σε μια γραμμική, αριθμητική κλίμακα. Η κλίμακα είναι ίδια κάθε φορά. Τυπικά οι τιμές κυμαίνονται 1-5 ή 1-10 Υπάρχουν δύο ακραίες τιμές, π.χ. βαρύς/ελαφρύς, φτηνός/ακριβός, κ.α. Η μέση τιμή (π.χ. 3 στα 5) αντιπροσωπεύει μια ενδιάμεση τιμή της έννοιας. Ζητείται από τον ειδικό να αποδώσει μια τιμή σε κάθε έννοια για όλα τα στοιχεία της περιοχής, στο πλέγμα που δημιουργείται. Εξετάζεται αν κάποιο ζευγάρι εννοιών είναι παρόμοιο κατά 40 τη σύγκριση των οριζοντίων γραμμών του πλέγματος, ώστε να παραλειφθούν κάποιες παραπλήσιες έννοιες.
Παράδειγμα Πλέγματος Ρεπερτορίων μεγάλη καταδίκη οποιονδήποτε μικρή καταδίκη οποιαδήποτε τοποθεσία ειδική τοποθεσία μόνο γυναίκες μη-βίαιος προσχεδιασμένο αφθόρμητα μη-απειλητικός απρόσωπο απειλητικός προσωπικό ασήμαντο σημαντικό διάρρηξη 4 ναρκωτικά μικροκλοπή βίαιος βιασμός ληστεία δολοφονία 1 1 1 1 1 1 1 1 1 1 1 1 1 1 5 3 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 2 2 2 2 2 2 2 2 2 2 3 3 3 4 4 4 διάρρηξη ναρκωτικά μικροκλοπή βιασμός ληστεία δολοφονία 16 13 18 15 9 29 10 21 10 10 10 18 23 21 15 μικροκλοπή βιασμός ληστεία διάρρηξη ναρκωτικά δολοφονία - - - - - - 41
COMPASS COMPASS αναπτύχθηκε από τον Prerau ως ένα έμπειρο σύστημα για να εξετάζει τα μηνύματα σφαλμάτων από σύστημα μεταγωγής μιας τηλεφωνικής εταιρείας Αυτά μπορούσε να ήταν ανοιχτό κύκλωμα, διακοπές, λάθος χρονισμοί στα εξαρτήματα Ψάχνοντας στις ακολουθίες αυτών των μηνυμάτων σφαλμάτων και χρησιμοποιώντας την εμπειρία μπορούσε να εντοπιστεί η αιτία του προβλήματος COMPASS μπορούσε να προτείνει και άλλα επιπρόσθετα τέστ ή αντικαταστάσεις ενός εξαρτήματος όπως ενός ρελέ ή κάρτας κυκλώματος 42
Απόκτηση γνώσης στο COMPASS Στα 1990, υπήρχε εξειδικευμένο προσωπικό συντήρησης και πολλά αρχεία καταγραφής που θα μπορούσαν να αναλυθούν. Η υπάρχουσα εμπειρία μπορούσε να αποκτηθεί από έναν πολύ καλό ειδικό και να μετατραπεί σε ένα πρόγραμμα υπολογιστή Έγιναν μια σειρά από συνεντεύξεις Ο ειδικός περιέγραψε την ευρεστική μεθοδολογία επίλυσης προβλημάτων που ακολουθούσε και οι μηχανικοί γνώσης τη μετέτρεψαν σε κανόνες σε απλά αγγλικά. Αυτή η μορφή εξετάστηκε από τον ειδικό για να είναι σίγουρος ότι ανταποκρίνονταν σε ότι εννοούσε 43
Παράδειγμα ενός κανόνα του COMPASS IF There exists a BC Dual Expansion One PGA Dominant Problem, and The number of messages is five or more THEN The fault is in the PGA of the indicated expansion (.5), and The fault is in the PGA of the silent expansion (.3), and The fault is in the IGA (.1), and The fault is in the Backplane (.1) 44
Ο κύκλος απόκτησης γνώσης στο COMPASS Εκμαίευση γνώσης Κείμενο Γνώσης 45 Ανάλυση από τον ειδικό Προσομοίωση Στο χαρτί Σύγκριση
Ο κύκλος απόκτησης γνώσης στο COMPASS Ο κύκλος είχε την ακόλουθη μορφή: 1) Εκμαίευση γνώσης από τον ειδικό 2) Καταγραφή της εκμαιευμένης γνώσης 3) Έλεγχος νέας γνώσης: 46 Ο ειδικός αναλύει ένα νέο σύνολο δεδομένων Αναλύεται το ίδιο σύνολο στο χαρτί χρησιμοποιώντας την παλιά γνώση Συγκρίνονται τα αποτελέσματα από τον ειδικό με τη την προσομοίωση στο χαρτί Εάν τα αποτελέσματα διαφέρουν, βρείτε τους κανόνες που δημιουργούν τη διαφορά και ξαναζητήσετε από τον ειδικό έτσι ώστε να εκμαιεύσετε περισσότερη γνώση για να επιλύσετε το πρόβλημα, αλλιώς τέλος
Ανάλυση πρωτοκόλλου και παρατήρηση Ο ειδικός παρακολουθείται στο χώρο δουλειάς πως κάνει τη δουλειά του Ο μηχανικός της γνώσης προσπαθεί να ακολουθήσει τη συλλογιστική του ειδικού Καταγράφει τι κάνει ο ειδικός: Χρησιμοποιεί βίντεο, κασετόφωνο, σημειώσεις. Ενθαρρύνει τον ειδικό να σκέφτεται φωναχτά. Προσπαθεί να κάνει το ειδικό να εξηγεί τι κάνει και πως το κάνει και γιατί το κάνει Αυτή η διαδικασία σχηματίζει ένα πρωτόκολλο λύσης. Αυτό αναλύεται λαμβάνοντας αντικείμενα (ουσιαστικά) και ενέργειες (ρήματα) 47
Τεχνικές μηχανικής μάθησης (Machine Learning) Χρησιμοποιεί αλγορίθμους επαγωγής όπως ο ID3. Δοθέντος ένα σύνολο παραδειγμάτων, όπως διανύσμτα που ο ειδικός έχει ήδη λύσει, ο ID3 φτιάχνει ένα δένδρο απόφαση Αυτό στη συνέχεια χρησιμοποιείται για να κατηγοριοποιήσει νέα προβλήματα Το σύστημα χρειάζεται να εκπαιδευθεί σε ένα υποσύνολο προβλημάτων Αυτή η προσέγγιση είναι κατάλληλη όταν υπάρχει ένας μεγάλος αριθμός παραδειγμάτων για το σύστημα που μπορούν να χρησιμοποιηθούν για εκπαίδευση Μπορεί να αποκαλύψει σχέσεις και ομαδοποιήσεις εννοιών που μπορεί να μην υπήρχαν θεωρηθεί προηγουμένως Απαιτεί ο ειδικός να εισάγει πάρα πολλά δεδομένα 48
ONCOCIN 1 ONCOCIN αναπτύχθηκε από τον Shortliffe. Ήταν ένα σύστημα που έφτιαχνε προγράμματα θεραπείας για ασθενείς με καρκίνο Χρησιμοποιούσε ένα μοντέλο πεδίου εφαρμογής για να αποκτήσει τη γνώση από ένα ειδικό διαμέσου ενός συστήματος GUI. Η θεραπεία του καρκίνου είναι πολύπλοκη και απαιτεί συχνά διαφορετικούς συνδυασμούς πολλών φαρμάκων σε διαφορετική δοσολογία Το πρόγραμμα θεραπείας ονομάζεται πρωτόκολλο. Όπου περιγράφεται ο συνδυασμός των φαρμάκων που χορηγούνται, οι εξετάσεις που πρέπει να γίνουν και εάν θα πρέπει να γίνει ραδιοθεραπεία 49
ONCOCIN 2 ONCOCIN είχε μια βάση γνώσης με πρωτόκολλα θεραπείας καρκίνου για διαφορετικούς τύπους καρκίνου Τα πρωτόκολλα αποθηκεύονταν ως σκελετικά πλάνα Το πρόγραμμα διαλέγει το κατάλληλο πρωτόκολλο και στη συνέχεια το συγκεκριμενοποιεί βάζοντας λεπτομέρειες για τα φάρμακα, για την παρακολούθηση από τους γιατρούς Η μέθοδος λύσης ονομάζεται ραφινάρισμα σχεδίου 50
ONCOCIN 3 ONCOCIN χρησιμοποιεί 3 τρόπους αναπαράστασης της γνώσης όταν προτείνει θεραπεία: Μια ιεραρχία από αντικείμενα, αυτά αναπαραστούν τα πρωτόκολλα και τα τμήματά τους όπως είναι τα φάρμακα Κανόνες παραγωγής, συνδέονται με πλαίσια για να συμπεράνουν τις τιμές των ιατρικών παραμέτρων Πίνακες τελικών καταστάσεων, που αναπαραστούν ακολουθίες θεραπειών που πρέπει να ελεγχθούν. 51
Απόκτηση γνώσης και βάση γνώσης Η απόκτηση γνώσης διευκολύνεται όταν βασίζεται σε βάση γνώσης Ένα πρόγραμμα για εκμαίευση γνώσης χρειάζεται να διαθέτει γνώση για την περιοχή εφαρμογής προκειμένου να αποκτήσει νέα γνώση πιο αποδοτικά Μια μοναδική γενική γνώση δεν είναι κατάλληλη για όλα τα πεδία 52 Η γνώση που απαιτείται για να αποκτηθεί περισσότερη γνώση έχει τη μορφή μετα-γνώσης Είναι γνώση σχετικά με τη δομή και τη στρατηγική, περιέχοντας πληροφορίες σχετικά με τους τρόπους κατηγοριοποίησης των φαινομένων και τους τρόπους απόφασης μεταξύ εναλλακτικών ενεργειών
Επεξήγηση-Αιτιολόγηση Η δυνατότητα επεξήγησης και αιτιολόγησης της πορείας συλλογισμούσ είναι απαραίτητο τμήμα ενός πολύ καλού έμπειρου συστήματος Η επεξήγηση σχεδιάζεται για να επιτρέπει: 53 Επεξηγήσεις για τα συμπεράσματα του συστήματος Επιτρέπει στο χρήστη να εξερευνά το σύστημα χρησιμοποιώντας ερωτήσεις του τύπου What if για υποθετικό συλλογισμό Μετάφραση της φυσικής γλώσσας σε κανόνες
Σύστημα επεξήγησης Οι χρήστες ενός συστήματος αυτόματων συμβουλών χρειάζεται να είναι βέβαιοι για το συλλογισμό που υπάρχει πίσω από κάθε συμπέρασμα ότι είναι σωστός και η προτεινόμενη λύση είναι κατάλληλη για την περίπτωσή τους Οι μηχανικοί χρειάζεται να είναι σίγουροι ότι οι μηχανισμοί που χρησιμοποιήθηκαν για να παράγουν ένα συμπέρασμα δουλεύουν σύμφωνα με τις οδηγίες τους 54
Επεξήγηση βασισμένη σε κανόνες Τα πρώτα έμπειρα συστήματα έδιναν μόνο τους κανόνες που είχαν πυροδοτηθεί Τώρα τα συστήματα περιγράφουν τον έλεγχο της μεθόδου συμπερασμού και την αρχιτεκτονική που ακολουθούν Η αυτόματη επεξήγηση απαιτεί πρόσβαση σε ένα μοντέλο περιοχής, όπως κάνει η αυτόματη εκμαίευση γνώσης Γεφυρώνεται τι χάσμα μεταξύ χαμηλού επιπέδου λεπτομερή εφαρμογή (ποιους κανόνες το σύστημα πυροδότησε) και υψηλού επιπέδου στρατηγική (πως να γίνει η επιλογή μεταξύ συγκρίσιμων υποθέσεων 55
MYCIN & Επεξήγηση1 Οι επεξηγήσεις δίνονταν αυτόματα στο τέλος κάθε συμπεράσματος Για να εξηγηθεί πως είχε υπολογισθεί η τιμή μιας ιατρικής παραμέτρου, το module επεξήγησης έβρισκε τη λίστα με τους κανόνες που είχαν εφαρμοσθεί και τους τύπωνε μαζί με τα αποτελέσματα Σε κάθε σημείο, ο χρήστης μπορούσε να ζητήσει να δει τους κανόνες που χρησιμοποιούνταν. Οι κανόνες είχαν δείκτες έτσι ώστε να προκύπτουν οι συγκεκριμένοι κανόνες Επιτρεπόταν ο χρήστης να ρωτά ερωτήσεις σχετικά με τα αποτελέσματα και τις συμβουλές και να ρωτά πιο γενικές ερωτήσεις. Αυτή η αλληλεπίδραση μπορούσε να καταγραφεί 56
MYCIN & Επεξήγηση 2 Η συμβουλή σε ένα σύστημα ανάστροφης ακολουθίας συλλογισμού απαιτεί αναζήτηση μέσα από ένα δένδρο στόχων Τα ερωτήματα κατά τη διαδικασία αναζήτησης συμβουλής είναι 2 τύπων: 57 Γιατί η συγκεκριμένη ερώτηση έχει τεθεί Για να απαντηθεί πρέπει να δούμε ψηλότερα στο δένδρο να δούμε ποιούς στόχους επιδιώκει το σύστημα να πετύχει Πως έφτασε σε ένα συμπέρασμα Για να απαντηθεί απαιτείται να ψάξουμε προς τα κάτω το δένδρο για να σούμε ποιοι υποστόχοι είχαν ικανοποιηθεί προκειμένου να επιτευχθεί ο στόχος
MYCIN & Επεξήγηση 3 58 Περιορισμοί του συστήματος επεξήγησης του MYCIN: Ο χρήστης δεν έχει πρόσβαση στη στατική γνώση, στις λίστες και τους πίνακες γνώσης γιατί αυτές οι πηγές γνώσης δεν είναι σε ενιαία μορφή κανόνων παραγωγής Ο μηχανισμός δημιουργίας της λίστας θεραπείας και επιλογής των προτεινόμενων φαρμάκων ήταν πολύπλοκες συναρτήσεις LISP που ο χρήστης δεν μπορούσε να κατανοήσει Ο χρήστης δεν μπορούσε να δει την ακολουθία με την οποία εφαρμόζονταν οι κανόνες ή την ακολουθία με την οποίας οι υποθέσεις λαμβάνονταν υπόψιν
EMYCIN EMYCIN ανέπτυξε και επέκτεινε τις επεξηγήσεις που είχε το MYCIN. Οι εντολές EXPLAIN, TEST & REVIEW χρησιμοποιούνταν για debugging από το μηχανικό της γνώσης Ο συλλογισμός μετα-επιπέδου χρησιμοποιήθηκε για την ερμηνεία των επεξηγήσεων. Οι επεξηγήσεις για το τι είχε συμπερασθεί επαυξάνονταν με την παρουσίαση γιατί κάποιοι συμπερασμοί είχαν εξαχθεί και όχι κάποιοι άλλοι 59