Κεφάλαιο 24. Κατηγοριοποίηση. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου

Σχετικά έγγραφα
Αναπαράσταση Γνώσης. Αρχές & τεχνικές STRIPS ( Stanford Research Institute Problem Solver, 1971) MYCIN Εκτίμηση και σύγκριση έμπειρων συστημάτων

Κατηγοριοποίηση. ! O προσδιορισµός της κατηγορίας στην οποία ανήκει ένα αντικείµενο.

Κεφάλαιο 13. Αβεβαιότητα. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Κεφάλαιο 6. Ικανοποίηση Περιορισµών. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ιάγνωση και Επιδιόρθωση Βλαβών

Οικονόμου Παναγιώτης.

Χαρακτηριστικά, οµή και Λειτουργία Συστηµάτων Γνώσης

Κεφάλαιο 8. Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Κατηγοριοποίηση & Κατασκευή 1

Επίλυση Προβλημάτων 1

ΙΚΑΝΟΠΟΙΗΣΗ ΠΕΡΙΟΡΙΣΜΩΝ

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τύποι σφαλμάτων. Σφάλματα. Πολυσημα ντικότητα Ελλιπή. Τυχαιότητα Συστηματικά. Συλλογισμός. Λάθος Μέτρηση. Επαγωγικά Σφάλματα Παραγωγικά σφάλματα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΠΕΡΣΕΦΟΝΗ ΠΟΛΥΧΡΟΝΙΔΟΥ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΤΕ

Rule Based systems Συστήματα Βασισμένα σε κανόνες

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Εξελιγµένες Τεχνικές Σχεδιασµού

Πληροφορική 2. Τεχνητή νοημοσύνη

Περιεχόµενα. ΜΕΡΟΣ Α: Επίλυση Προβληµάτων... 17

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΕΜΠΕΙΡΑ ΣΥΣΤΗΜΑΤΑ Χρυσόστομος Στύλιος

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Αναπαράσταση Γνώσης και Συλλογιστικές

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνολογίες Υλοποίησης Αλγορίθµων

Υπερπροσαρμογή (Overfitting) (1)

Μεθοδολογίες Αξιοποίησης Δεδομένων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

"The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ "

Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση

ιαγνωστικός Συλλογισµός και Λήψη Ιατρικής Απόφασης

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

Ελεγχος, Αξιοπιστία και Διασφάλιση Ποιότητας Λογισµικού Πολυπλοκότητα

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Συστήματα Γνώσης. Θεωρητικό Κομμάτι Μαθήματος Ενότητα 13: Εφαρμογές Συστημάτων Γνώσης - Διάγνωση και Επιδιόρθωση Βλαβών

ιµελής Σχέση ιατεταγµένο ζεύγος (α, β): ύο αντικείµενα (όχι κατ ανάγκη διαφορετικά) σε καθορισµένη σειρά. Γενίκευση: διατεταγµένη τριάδα (α, β, γ), δι

ΠΛΑΙΣΙΑ. Τα πλαίσια έχουν:

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΜΑΘΗΜΑ 2 ΑΝΑΠΑΡΑΣΤΑΣΗ - ΤΕΧΝΙΚΕΣ ΤΝ (1)

ΑΝ.ΕΦ. Γ ΛΥΚΕΙΟΥ Αν η συνθήκη ισχύει, τότε εκτελούνται οι εντολές που βρίσκονται µεταξύ των λέξεων ΤΟΤΕ και και η εκτέλεση του προγράµµατος συνεχίζετα

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

4.3. Γραµµικοί ταξινοµητές

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΕΡΓΑΛΕΙΑ ΙΟΙΚΗΣΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΜΑΘΗΜΑ: ΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Κεφάλαιο 3. Αλγόριθµοι Τυφλής Αναζήτησης. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Κεφάλαιο 25. ιαµόρφωση. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

Πανεπιστήµιο Πατρών Τµήµα Μηχ/κών Η/Υ & Πληροφορικής ΜΠΣ ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΥΦΥΗ ΣΥΣΤΗΜΑΤΑ ΑΠΟΦΑΣΕΩΝ. Ι.

Ανάλυση Χρόνου, Πόρων & Κόστους

Οργάνωση Γεωγραφικών. πληροφοριών

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση

ιδάσκων: ηµήτρης Ζεϊναλιπούρ

ΜΕΡΟΣ Ι: ΓΕΩΓΡΑΦΙΚΑ Ε ΟΜΕΝΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Η ΦΥΣΗ ΤΩΝ ΓΕΩΓΡΑΦΙΚΩΝ Ε ΟΜΕΝΩΝ...

Επίλυση προβληµάτων. Αλγόριθµοι Αναζήτησης

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Εφαρμόζονται σε προβλήματα στα οποία δεν υπάρχει πληροφορία που να επιτρέπει την αξιολόγηση των καταστάσεων του χώρου αναζήτησης.

Ασκήσεις μελέτης της 8 ης διάλεξης

(REASONING WITH UNCERTAINTY)

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Σχέσεις. ιδάσκοντες:. Φωτάκης,. Σούλιου Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Έλεγχος Συστήματος. Επαλήθευση (verification) Έλεγχος και Εγκατάσταση Συστήματος. Επαλήθευση (verification)

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

ΚΕΦΑΛΑΙΟ 5: Αλγόριθµοι

Κεφάλαιο 7 : Είδη, Τεχνικές, και Περιβάλλοντα Προγραµµατισµού

ΑΕΠΠ Ερωτήσεις θεωρίας

Απλοποιεί τα γεγονότα έτσι ώστε να περιγράφει τι έχει γίνει και όχι πως έχει γίνει.

Γ. Κορίλη Αλγόριθµοι ροµολόγησης

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Μεθοδολογία Έρευνας Διάλεξη 1 η : Εισαγωγή στη Μεθοδολογία Έρευνας

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 3 ο, Τμήμα Α. Τρόποι απόδειξης

Σειρά Προβλημάτων 5 Λύσεις

K15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Επίλυση Προβλημάτων και Τεχνικές Αναζήτησης Εισαγωγή

Υπολογιστικό Πρόβληµα

Εισαγωγή στην επιστήμη των υπολογιστών. Λογισμικό Υπολογιστών Κεφάλαιο 8ο Αλγόριθμοι

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

4.3 Ορθότητα και Πληρότητα

Αλγόριθμοι Αναζήτησης σε Παίγνια Δύο Αντιπάλων

Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών

Κεφάλαιο 7. Γενετικοί Αλγόριθµοι. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ιδάσκοντες: Φ. Αφράτη,. Φωτάκης,. Σούλιου Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Το Επενδυτικό σχέδιο 3. Βασικές έννοιες και ορισµοί

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Transcript:

Κεφάλαιο 24 Κατηγοριοποίηση Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου

Κατηγοριοποίηση Προσδιορισµός της κατηγορίας στην οποία ανήκει ένα αντικείµενο. Είσοδος: ένα σύνολο δεδοµένων που περιγράφουν το αντικείµενο. Έξοδος: η κατηγορία στην οποία ανήκει Η επιλογή κατηγορίας γίνεται από προκαθορισµένο σύνολο Κάθε αντικείµενο δεν ανήκει σε µια µοναδική κατηγορία. Κάθε αντικείµενο δεν ανήκει σίγουρα σε κάποια κατηγορία. Συνήθως οι κατηγορίες είναι οργανωµένες σε ιεραρχίες Οι υποκατηγορίες έχουν τις ιδιότητες των υπερκατηγοριών Οι κατηγορίες του ίδιου επίπεδου έχουν αλληλοαναιρούµενες ιδιότητες Εφαρµογές: Π.χ. διάγνωση, διαµόρφωση, επιδιόρθωση βλαβών, κλπ. Τεχνητή Νοηµοσύνη, B' Έκδοση 2

Ευριστική Κατηγοριοποίηση Heuristic Classification Εξαντλητική Κατηγοριοποίηση: Απλή σύγκριση "επιφανειακών" χαρακτηριστικών του αντικειµένου Στις απλές περιπτώσεις αρκεί Όταν υπάρχουν πολλές ιδιότητες και πολύπλοκη ιεραρχία κατηγοριών: Τα επιφανειακά χαρακτηριστικά δεν επαρκούν για την κατάταξη Η εξαντλητική σύγκριση δεν είναι πρακτική Ευριστική κατηγοριοποίηση: Προσπαθεί να κατατάξει τα αντικείµενα σε κατηγορίες στα φύλλα της ιεραρχίας χωρίς να περάσει από όλα τα επίπεδα και να κάνει όλες τις συγκρίσεις Η κατάταξη γίνεται πιο γρήγορα, αλλά µε µικρότερη ακρίβεια Χρησιµοποιεί εµπειρική γνώση για αντικείµενα, κατηγορίες και συσχετίσεις Τεχνητή Νοηµοσύνη, B' Έκδοση 3

Φάσεις Ευριστικής Κατηγοριοποίησης Αφαίρεση ή γενίκευση των αντικειµένων-δεδοµένων (data abstraction). Επικέντρωση µόνο στα σηµαντικά χαρακτηριστικά ενός δεδοµένου. ΕΑΝ ένα βακτήριο ζει σε περιβάλλον στο οποίο δεν υπάρχει ελεύθερο οξυγόνο ΤΟΤΕ πρόκειται για αναερόβιο βακτήριο Απλοποίηση ποσοτικών δεδοµένων. ΕΑΝ ο ασθενής είναι ενήλικος, ΚΑΙ ο αριθµός των λευκών αιµοσφαιρίων είναι µικρότερος από 2500/cm 3 ΤΟΤΕ ο αριθµός των λευκών αιµοσφαιρίων είναι µικρός Ιεραρχική οργάνωση των εννοιών. ΕΑΝ το άτοµο είναι πατέρας ΤΟΤΕ το άτοµο είναι άντρας Ευριστική ταυτοποίηση (heuristic match) των γενικευµένων αντικειµένων σε µια γενικότερη περιγραφή ενός συνόλου κατηγοριών. Π.χ., ο πυρετός (γενίκευση υψηλής θερµοκρασίας) µπορεί να είναι ένδειξη µόλυνσης, η οποία εξειδικεύεται σε πολλές διαφορετικές µορφές. Επιλογή µιας συγκεκριµένης κατηγορίας-λύσης από το γενικό σύνολο κατηγοριών (solution refinement). Π.χ., το είδος της µόλυνσης πρέπει να διαγνωστεί µε ακρίβεια ώστε να δοθεί η σωστή θεραπεία. Τεχνητή Νοηµοσύνη, B' Έκδοση 4

Συστήµατα Ευριστικής Κατηγοριοποίησης Φάσεις Λειτουργίας Χώρος αντικειµένων Γενικευµένα αντικείµενα Αντιστοίχιση Χώρος κατηγοριών Γενικές κατηγορίες Γενίκευση αντικειµένων Επιλογή κατηγορίας Αντικείµενα Κατηγορίες Τεχνητή Νοηµοσύνη, B' Έκδοση 5

Πολυβάθµια Συστήµατα Κατηγοριοποίησης Multistage Classification Systems Χώρος αντικειµένων Ενδιάµεσος Χώρος Χώρος κατηγοριών Ενδιάµεσες κατηγορίες Αντιστοίχιση Γενικές κατηγορίες Γενίκευση Επιλογή κατηγορίας Γενικευµένα Αντικείµενα Αντιστοίχιση Ενδιάµεσες κατηγορίες Κατηγορίες Γενίκευση αντικειµένων Αντικείµενα Τεχνητή Νοηµοσύνη, B' Έκδοση 6

Συζευκτικό Μοντέλο Κατηγοριοποίησης (1/2) Χώρος δεδοµένων D: Πεπερασµένο σύνολο χαρακτηριστικών {D i } του αντικειµένου που πρέπει να καταταχθεί σε µια κατηγορία. D i {0, 1, "?") Το σύνολο τιµών των D i ονοµάζεται διάνυσµα τιµών. Χώρος κατηγοριών-λύσεων S: Πεπερασµένο σύνολο λύσεων {S j }. Για κάθε υποψήφια λύση S j υπάρχει ένα πρότυπο που προσδιορίζει τις συνθήκες συνέπειας µεταξύ λύσεων και δεδοµένων. C(S j,d i )=1, S j είναι συνεπές µε D i =1 (δεν µπορεί να είναι λύση αν D i =0) C(S j,d i )=0, S j είναι συνεπές µε D i =0 (δεν µπορεί να είναι λύση αν D i =1) C(S j,d i )=?, oι τιµές του D i δεν έχουν σχέση µε τη συνέπεια των λύσεων S j Μια υποψήφια λύση S j είναι ασυνεπής µε ένα διάνυσµα τιµών και απορρίπτεται, αν τουλάχιστον ένα από τα δεδοµένα είναι ασυνεπές µε αυτήν. Μια λύση είναι συνεπής (consistent) αν δεν υπάρχει τιµή που να είναι ασυνεπής. Τεχνητή Νοηµοσύνη, B' Έκδοση 7

Συζευκτικό Μοντέλο Κατηγοριοποίησης (2/2) Η λύση S j καλύπτει το δεδοµένο D i αν ισχύει µια από τις περιπτώσεις: A. D i =1 και C(S j,d i )=1, ή B. D i =0 και C(S j,d i )=0. Μια λύση S j ταιριάζει ή εξηγεί τα δεδοµένα, αν όλα τα δεδοµένα τα σχετικά µε την S j είναι γνωστά και όλες οι τιµές τους είναι συνεπείς µε αυτήν. Ο προσδιορισµός της συνέπειας µιας λύσης γίνεται µε τη διάδοση των τιµών από τα δεδοµένα στις υποψήφιες λύσεις. Η κατάσταση µιας λύσης S j : Αν όλες οι τιµές στο S j είναι 1, τότε το S j ταιριάζει ή εξηγεί τα δεδοµένα. Αν κάποια τιµή στο S j είναι 0, τότε το S j είναι ασυνεπές και απορρίπτεται. Αν όλες οι τιµές στο S j είναι 1 και?, τότε το S j είναι συνεπές ή καλύπτει τα δεδοµένα. Υπάρχει πιθανότητα κάποια διανύσµατα τιµών να µην ταιριάζουν µε καµία κατηγορία ή να ταιριάζουν µε περισσότερες από µια κατηγορίες. Τεχνητή Νοηµοσύνη, B' Έκδοση 8

Συζευκτικό Μοντέλο Κατηγοριοποίησης Παράδειγµα Χώρος αντικειµένων-δεδοµένων Χώρος κατηγοριών-λύσεων 1 D 1 0 D 2 S 1 S 2 1 1 Εξηγούν τα δεδοµένα Άγνωστη Τιµή? D 3 1 D 4 S 3? Καλύπτει τα δεδοµένα 1 D 5 S 4 S 5 0 0 Ασυνεπείς µε τα δεδοµένα 0 D 6 Τρέχον Σύνολο Τιµών Υποψήφιο Σύνολο Λύσεων Λύση συνεπής µε D i =1 Λύση συνεπής µε D i =0 Τεχνητή Νοηµοσύνη, B' Έκδοση 9

Μέθοδοι Κατηγοριοποίησης Βασικός στόχος: Ο αποκλεισµός των εναλλακτικών µονοπατιών στο χώρο αναζήτησης που αποτελείται από υποψήφιες κατηγορίες των δεδοµένων εισόδου. Κ1: Παραγωγή και οκιµή 1. Θέσε την κενή λίστα ως λίστα των κατηγοριών-λύσεων 2. Πάρε τα δεδοµένα εισόδου και γενίκευσέ τα 3. Για κάθε υποψήφια γενική κατηγορία i. Έλεγξε αν τα δεδοµένα εισόδου ανήκουν στην υποψήφια γενική κατηγορία ii. Εάν ναι, πρόσθεσε την υποψήφια γενική κατηγορία στη λίστα των κατηγοριών 4. Ανέφερε τις λύσεις από τη λίστα των κατηγοριών-λύσεων Το σύνολο των κατηγοριών (λύσεων) είναι αρκετά µικρό Η εξαντλητική σύγκριση είναι πρακτικά εφικτή Όλα τα απαραίτητα δεδοµένα µπορούν να αποκτηθούν στην αρχή της διαδικασίας Η απουσία κάποιων δεδοµένων σηµαίνει πως αυτά δεν υφίστανται Ελάχιστα συστήµατα χρησιµοποιούν αυτή τη µέθοδο Τεχνητή Νοηµοσύνη, B' Έκδοση 10

Κ2: Από τα εδοµένα σε Πιθανές Λύσεις Μειώνει τον υπολογιστικό χρόνο όταν υπάρχει µεγάλος αριθµός λύσεων Επικεντρώνεται µόνο σε εκείνες που πιθανώς ικανοποιούν τα δεδοµένα Καταγράφει ποιες λύσεις έχει ήδη δοκιµάσει Ασχολείται µε κάθε υποψήφια λύση µόνο µια φορά ιαδικασία γενίκευσης δεδοµένων (data abstractor) Από µόνη της ένα µικρό σύστηµα κατηγοριοποίησης. Για κάθε σύνολο δεδοµένων µπορεί να υπάρχουν πολλές δυνατότητες γενίκευσης. ιαδικασία ανάκλησης υποψήφιων λύσεων (candidate retriever) Μπορούν εν δυνάµει να εξηγήσουν ένα δεδοµένο. Συζευκτικό µοντέλο κατηγοριοποίησης: λύσεις που είναι συνεπείς ή καλύπτουν τα δεδοµένα εν πρέπει να επιστρέφονται πολύ λίγες λύσεις (θα χαθούν κάποιες) εν πρέπει να επιστρέφονται πάρα πολλές (δεν βελτιώνει την Κ1) ιαδικασία ελέγχου λύσεων (solution tester) Βαθµολογεί τις υποψήφιες κατηγορίες-λύσεις και επιλέγει µία ή περισσότερες Κριτήρια: π.χ. προϋπάρχουσες πιθανότητες, κλπ. Τεχνητή Νοηµοσύνη, B' Έκδοση 11

Κ2: Από τα εδοµένα σε Πιθανές Λύσεις Αλγόριθµος 1. Θέσε την κενή λίστα ως λίστα των κατηγοριών-λύσεων. 2. Πάρε τα δεδοµένα εισόδου. 3. Γενίκευσε τα δεδοµένα µε τη διαδικασία data_abstractor. 4. Βρες τις υποψήφιες γενικές κατηγορίες µε τη διαδικασία candidate_retriever. 5. Για κάθε υποψήφια γενική κατηγορία: i. Έλεγξε αν τα δεδοµένα εισόδου ανήκουν στην υποψήφια γενική κατηγορία (solution_tester) ii. Εάν ναι, πρόσθεσε την υποψήφια γενική κατηγορία στη λίστα των κατηγοριών. 6. Ανέφερε τις λύσεις από τη λίστα των κατηγοριών-λύσεων. Τεχνητή Νοηµοσύνη, B' Έκδοση 12

Κ3: Ιεραρχική Κατηγοριοποίηση Καθοδηγούµενη από τις Λύσεις Ιεραρχική τεχνική παραγωγής και δοκιµής Υπόθεση: οι πιθανές κατηγορίες-λύσεις είναι ιεραρχικά διατεταγµένες ιασχίζει την ιεραρχία από πάνω προς τα κάτω και πρώτα σε πλάτος Οι τελικές κατηγορίες-λύσεις βρίσκονται στα φύλλα του δένδρου Οι λύσεις των ενδιάµεσων επιπέδων είναι µερικές ή γενικές Σε κάθε επίπεδο συγκρίνει τις υποψήφιες λύσεις µε τα δεδοµένα και απορρίπτει κλαδιά Μπορεί να ζητήσει πρόσθετα δεδοµένα για λεπτοµερέστερη διάκριση Έλεγχος λύσεων σε κατώτερο επίπεδο, ακολουθώντας τα κλαδιά που δεν έχουν απορριφθεί Αν µια κατηγορία απορριφθεί, απορρίπτονται και όλες οι υποκατηγορίες Τεχνητή Νοηµοσύνη, B' Έκδοση 13

Κ3: Ιεραρχική Κατηγοριοποίηση Καθοδηγούµενη από τις Λύσεις Αλγόριθµος 1. Θέσε την κενή λίστα ως λίστα των κατηγοριών-λύσεων. 2. Για κάθε επίπεδο της ιεραρχίας των κατηγοριών-λύσεων, επανέλαβε τα ακόλουθα: i. Πάρε τα δεδοµένα εισόδου που χρειάζονται για να γίνει διάκριση των υποψήφιων λύσεων σε αυτό το επίπεδο. ii. Γενίκευσε τα δεδοµένα µε τη διαδικασία data_abstractor. iii. Για κάθε υποψήφια γενική κατηγορία αυτού του επιπέδου: a. Έλεγξε αν τα δεδοµένα εισόδου ανήκουν στην υποψήφια γενική κατηγορία µε τη διαδικασία solution_tester. b. Εάν όχι, τότε απέρριψε την υποψήφια γενική κατηγορία. c. Εάν ναι, τότε έλεγξε αν η υποψήφια γενική κατηγορία είναι τερµατική στην ιεραρχία 1) Εάν όχι, τότε αφαίρεσε την υποψήφια γενική κατηγορία από τη λίστα και πρόσθεσε τις κατηγορίες των κόµβων-παιδιών του δένδρου. 2) Εάν ναι, τότε πρόσθεσε την υποψήφια γενική κατηγορία στη λίστα των λύσεων 3. Βαθµολόγησε τις λύσεις από τη λίστα των κατηγοριών-λύσεων και επέστρεψέ τες. Τεχνητή Νοηµοσύνη, B' Έκδοση 14

Κ3: Ιεραρχική Κατηγοριοποίηση Καθοδηγούµενη από τις Λύσεις Προϋποθέσεις Εφαρµογής Οι κατηγορίες πρέπει να µπορούν να διαταχθούν σε ιεραρχία Σε κάθε επίπεδο πρέπει να υπάρχει ένα υποσύνολο των δεδοµένων που µπορεί να κάνει διάκριση µεταξύ των γενικών κατηγοριών του συγκεκριµένου επιπέδου. Το δένδρο πρέπει να είναι όσο πιο ισορροπηµένο γίνεται Ο διαχωρισµός των πληθυσµών πρέπει να είναι όσο το δυνατόν µεγαλύτερος Κατάλληλη επιλογή του υποσυνόλου των δεδοµένων Σε κάθε βήµα αποκλείονται πολλές λύσεις (αποδοτικότητα) Οµοιότητα µε τα δένδρα κατηγοριοποίησης ή απόφασης. Στόχος: να βρεθούν οι πιο ειδικές κατηγορίες που είναι συνεπείς µε τα δεδοµένα Οι τερµατικοί κόµβοι (φύλλα) του δένδρου Τερµατισµός: αν φθάσει στους τερµατικούς κόµβους ή αν δεν υπάρχουν άλλα κλαδιά προς εξερεύνηση Τεχνητή Νοηµοσύνη, B' Έκδοση 15

Κ4: Ιεραρχική Κατηγοριοποίηση Καθοδηγούµενη από τα εδοµένα Η Κ3 ανεξάρτητα από την περίπτωση ξεκινά ζητώντας πάντα τα ίδια δεδοµένα Εξαιρετικά χρονοβόρο σε προβλήµατα διάγνωσης βλαβών ή ασθενειών Πάντα ξεκινάµε από τα δεδοµένα-συµπτώµατα Η µέθοδος Κ4 δεν ζητάει από το χρήστη δεδοµένα που δεν έχουν σχέση µε την περίπτωση που αντιµετωπίζεται Η µέθοδος: Υποθέτει ότι όλα τα σχετικά δεδοµένα έχουν δοθεί στην αρχή (όπως η Κ2) Προχωρά στην επιλογή των υποψήφιων κατηγοριών-λύσεων µε αυτά Αποκλείει από την ιεραρχία όλα εκείνα τα κλαδιά που δεν είναι συµβατά µε τα δεδοµένα που δόθηκαν (όπως η Κ3) Αποκλείει επίσης κάποιες από τις αρχικές υποψήφιες λύσεις, οι οποίες δεν επιβεβαιώνουν τα δεδοµένα Τεχνητή Νοηµοσύνη, B' Έκδοση 16

Κ4: Ιεραρχική Κατηγοριοποίηση Καθοδηγούµενη από τα εδοµένα Αλγόριθµος 1. Θέσε την κενή λίστα ως λίστα των κατηγοριών-λύσεων. 2. Πάρε τα δεδοµένα εισόδου. 3. Γενίκευσε τα δεδοµένα µε τη διαδικασία data_abstractor. 4. Βρες τις υποψήφιες γενικές κατηγορίες µε τη διαδικασία candidate_retriever. 5. Για κάθε επίπεδο της ιεραρχίας των κατηγοριών το οποίο ξεκινάει από τις υποψήφιες γενικές κατηγορίες (και όχι από την κορυφή της ιεραρχίας), επανέλαβε τα ακόλουθα: i. Πάρε τα δεδοµένα εισόδου που χρειάζονται για να γίνει διάκριση των υποψήφιων λύσεων σε αυτό το επίπεδο. ii. Γενίκευσε τα δεδοµένα µε τη διαδικασία data_abstractor. iii. Πρόσθεσε νέες υποψήφιες γενικές κατηγορίες λόγω των καινούριων δεδοµένων. iv. Για κάθε υποψήφια γενική κατηγορία αυτού του επιπέδου: a. Έλεγξε αν τα δεδοµένα εισόδου ανήκουν στην υποψήφια γενική κατηγορία µε τη διαδικασία solution_tester. b. Εάν όχι, τότε απέρριψε την υποψήφια γενική κατηγορία. c. Εάν ναι, τότε έλεγξε αν η υποψήφια γενική κατηγορία είναι τερµατική στην ιεραρχία 1) Εάν όχι, τότε αφαίρεσε την υποψήφια γενική κατηγορία από τη λίστα και πρόσθεσε τις κατηγορίες των κόµβων-παιδιών του δένδρου. 2) Εάν ναι, τότε πρόσθεσε την υποψήφια γενική κατηγορία στη λίστα των λύσεων. 6. Βαθµολόγησε τις λύσεις από τη λίστα των κατηγοριών-λύσεων και επέστρεψέ τες. Τεχνητή Νοηµοσύνη, B' Έκδοση 17

Κ4: Ιεραρχική Κατηγοριοποίηση Καθοδηγούµενη από τα εδοµένα Πλεονεκτήµατα Η µέθοδος Κ4 βελτιώνει την Κ3 Θεωρεί ότι όσα δεδοµένα δόθηκαν στην αρχή είναι τα µόνα σχετικά µε την περίπτωση εν εξετάζει καθόλου τις γενικές κατηγορίες οι οποίες δεν εξηγούν τα αρχικά δεδοµένα Όταν φτάσει στη γενίκευση των αρχικών δεδοµένων, η Κ4 λειτουργεί ανάστροφα Από τις λύσεις προς τα δεδοµένα (όπως η Κ3) Ρωτά για επιπλέον δεδοµένα για να αποκλείσει κάποιες από τις αρχικές υποψήφιες λύσεις Κάποιες από τις γενικές κατηγορίες που είχαν αρχικά αποκλειστεί µπορεί µε τα καινούρια δεδοµένα να θεωρηθούν υποψήφιες. Η µέθοδος κινείται σε κάθε κύκλο: 1. προς τα πάνω, γενικεύοντας τα νέα δεδοµένα που αποκτά 2. προς τα κάτω, αποκλείοντας κάποια κλαδιά του δένδρου λόγω νέων δεδοµένων Η Κ4 είναι ευέλικτη και πιο αποδοτική Επικεντρώνεται στην εξέταση µόνο των λύσεων που είναι απολύτως σχετικές µε τα δεδοµένα Τεχνητή Νοηµοσύνη, B' Έκδοση 18

Μελέτη Περίπτωσης - Το Σύστηµα DENDRAL Ενδιάµεσος σταθµός µεταξύ προγραµµάτων "έξυπνης αναζήτησης" και εµπείρων συστηµάτων Απ' ευθείας καταγραφή ειδικής γνώσης Η αναζήτηση λύσεων περιορίζεται µε πληροφορίες του χρήστη Αντικείµενο: Ο καθορισµός της µοριακής δοµής (στερεοχηµικό τύπος) αγνώστων οργανικών ουσιών Από την ανάλυση των αποτελεσµάτων του φασµατογράφου µάζας Με τη χρήση τροποποιηµένης µεθόδου δηµιουργίας και ελέγχου (generate-and-test) εναλλακτικών λύσεων. Στερεοχηµικός τύπος: δοµή των ατόµων που αποτελούν το µόριο στο χώρο, καθώς και το είδος των µεταξύ τους χηµικών δεσµών εδοµένος ο µοριακός τύπος (π.χ. C 6 H 13 NO 2 ) Τα ισοµερή που αντιστοιχούν σε ένα µοριακό τύπο είναι συνήθως πάρα πολλές (π.χ. 10000) Τεχνητή Νοηµοσύνη, B' Έκδοση 19

Το Σύστηµα DENDRAL Βάση γνώσης Περιέχει περιορισµούς που πρέπει να ικανοποιεί η δοµή της ένωσης, για να περιορίσει τον µεγάλο αριθµό ισοµερών της ένωσης Βασίζονται στην παρουσία ή απουσία κάποιων τµηµάτων από το φάσµα. Χρησιµοποιούνται για να περιορίσουν το µεγάλο αριθµό εναλλακτικών δοµών. Απαιτούµενοι: Οι υποψήφιες ενώσεις πρέπει να ικανοποιούν τα στοιχεία που παρατηρήθηκαν. Απαγορευτικοί: Οι πιθανές ενώσεις πρέπει να είναι χηµικά σταθερές. Τεχνητή Νοηµοσύνη, B' Έκδοση 20

Το Σύστηµα DENDRAL Λειτουργία Το πρόγραµµα: Συσχετίζει τις κορυφές εντάσεων του φάσµατος µε τµήµατα της διασπασµένης ένωσης Συνδυάζει τα τµήµατα ώστε να ταιριάζουν στο δοµικό σκελετό ίνει µια λίστα ηµιτελών υποθέσεων σχετικά µε τη δοµή της άγνωστης ένωσης Έλεγχος εκτέλεσης: ηµιουργία και έλεγχος υποθέσεων (hypothesize-and-test) (µέθοδος Κ1). Μεγάλο αρχικό σύνολο υποψήφιων λύσεων (υποθέσεις) Κάθε υπόθεση µπορεί να ελεγχθεί µε την ύπαρξη ή την απουσία σχετικών δεδοµένων Μπορεί να γίνει περισσότερο συγκεκριµένη ή να αποκλειστεί Η διαδικασία επαναλαµβάνεται, προσθέτοντας περισσότερους περιορισµούς Τεχνητή Νοηµοσύνη, B' Έκδοση 21

Μελέτη Περίπτωσης - Το Σύστηµα MYCIN Αντιµετώπιση µολύνσεων του αίµατος από βακτήρια-µικρόβια. Έγκαιρη διάγνωση των πιθανών µικροοργανισµών που προκαλούν τη µόλυνση. Πρόταση ενός ή περισσοτέρων αντιβιοτικών για την αντιµετώπισή της. Λειτουργεί ως απόδειξη θεωρηµάτων Επίτευξη ενός στόχου ως επίτευξη µιας σειράς υποστόχων. Ερευνά το µεγαλύτερο µέρος των εναλλακτικών διαδροµών προς την επίλυση ενός προβλήµατος Αξιολογεί τις εναλλακτικές διαδροµές βάσει κριτηρίων Βήµατα: Λήψη απόφασης για το αν ο ασθενής έχει κάποια σοβαρή µόλυνση. Καθορισµός των πιθανών µικροοργανισµών (µικροβίων) που εµπλέκονται. Επιλογή του συνόλου των κατάλληλων φαρµάκων. Επιλογή του καταλληλότερου φαρµάκου ή συνδυασµού φαρµάκων. Τεχνητή Νοηµοσύνη, B' Έκδοση 22

Βασική οµή του MYCIN Χρήστης (ιατρός) Συµβουλευτικό πρόγραµµα εδοµένα ασθενών (δυναµικά) Πρόγραµµα επεξηγήσεων Βάση Γνώσης (στατική) Πρόγραµµα απόκτησης γνώσης Ειδικός στις µολυσµατικές ασθένειες Τεχνητή Νοηµοσύνη, B' Έκδοση 23

Κανόνες: IF condition 1 AND AND condition m Βάση Γνώσης του MYCIN THEN conclusion 1 AND AND conclusion n Παράδειγµα κανόνα που καθορίζει την κατηγορία ενός µικροοργανισµού: Ο αριθµός 0.8 είναι η βεβαιότητα του κανόνα και καθορίζει πόσο σίγουρο είναι το συµπέρασµά του, µε την προϋπόθεση ότι ικανοποιούνται οι συνθήκες του. IF The stain of the organism is Gram negative, and The morphology of the organism is rod, and The aerobicity of the organism is aerobic THEN There is strongly suggestive evidence (0.8) that the class of the organism is Enterobacteriaceae Η βάση γνώσης περιέχει επίσης: Απλές λίστες, π.χ. η λίστα όλων των µικροοργανισµών που γνωρίζει το σύστηµα. Πίνακες γνώσης: Εγγραφές κλινικών παραµέτρων και τιµές που παίρνουν Σύστηµα ταξινόµησης κλινικών παραµέτρων ανάλογα µε την κατηγορία στην οποία ανήκουν, π.χ. αν είναι χαρακτηριστικά ασθενών ή µικροοργανισµών. Οι πληροφορίες για τον ασθενή αποθηκεύονται στο context tree (δένδρο περιβάλλοντος). Τεχνητή Νοηµοσύνη, B' Έκδοση 24

Παράδειγµα ένδρου Περιβάλλοντος Ασθενή PATIENT-1 CULTURE-1 CULTURE-2 CULTURE-3 OPERATION ORGANISM-1 ORGANISM-2 ORGANISM-3 DRUG-1 DRUG-2 Τεχνητή Νοηµοσύνη, B' Έκδοση 25

Έλεγχος Εκτέλεσης στο MYCIN Οι κανόνες εκτελούνται ανάστροφα Ο αρχικός στόχος είναι η σύσταση κατάλληλης θεραπείας Σταδιακά αναλύεται σε απλούστερους υποστόχους Οι υποστόχοι περιλαµβάνουν τον καθορισµό των εµπλεκοµένων µικροοργανισµών και τη διαπίστωση της σοβαρότητάς τους ως παράγοντες της µολυσµατικής ασθένειας. Οι περισσότεροι υποστόχοι έχουν δικούς τους υποστόχους, όπως π.χ. τον καθορισµό των ιδιοτήτων της χρώσης και της µορφολογίας του µικροοργανισµού. Οι απλούστεροι στόχοι είναι η ανάκληση γεγονότων από τη βάση δεδοµένων ή το χρήστη. Εργαστηριακά δεδοµένα που δεν µπορούν να εξαχθούν µε λογικούς συµπερασµούς. Βασικός στόχος: IF υπάρχει κάποιος µικροοργανισµός που χρειάζεται αντιµετώπιση ΚΑΙ THEN όλοι οι υπόλοιποι µικροοργανισµοί έχουν αντιµετωπισθεί φτιάξε µία λίστα µε πιθανές θεραπείες-φάρµακα και εξακρίβωσε την καλύτερη από αυτές. Τεχνητή Νοηµοσύνη, B' Έκδοση 26

Ανάστροφη Ακολουθία Εκτέλεσης στο MYCIN Οι κανόνες που περιέχουν τις κύριες παραµέτρους εκτελούνται πριν από τους υπόλοιπους. Πολλοί από τους συµπερασµούς στο MYCIN είναι αβέβαιοι. Συλλέγονται πληροφορίες από όλους τους σχετικούς κανόνες. Η βεβαιότητά τους συνδυάζεται για να εξαχθεί η τελική βεβαιότητα κάποιου συµπεράσµατος. Αν κάποιος κανόνας έχει βεβαιότητα 1.0 τότε χρησιµοποιείται µόνο αυτός για την εξαγωγή συµπεράσµατος. Αν κάποιο συµπέρασµα εξαχθεί µε βεβαιότητα µεταξύ 0.2 και +0.2, τότε θεωρείται ότι δεν εξήχθη καθόλου (αυθαίρετη παραδοχή). Αν κάποια από τις συνθήκες ενός κανόνα είναι από την αρχή σίγουρα ψευδής (βεβαιότητα -1.0), τότε ο κανόνας αυτός δεν εξετάζεται καθόλου. Αν κάποια παράµετρος εξαχθεί µε απόλυτη βεβαιότητα (1.0), τότε προηγούνται οι κανόνες που έχουν αυτήν την παράµετρο στη συνθήκη τους. Τεχνητή Νοηµοσύνη, B' Έκδοση 27

Κατηγοριοποίηση στο MYCIN Χρησιµοποιεί µέθοδο κατηγοριοποίησης που είναι πιο κοντά στην Κ3. Το σύστηµα οδηγείται από τις λύσεις προς τα δεδοµένα. Χρησιµοποιεί δενδροειδή ιεράρχηση των υπο-στόχων. Το MYCIN χρησιµοποιεί πρώτα σε βάθος αναζήτηση (ενώ η Κ3 πρώτα σε πλάτος). Παράδειγµα κανόνα: IF A complete blood count is available AND The white blood count is less than 2500/cm 3 THEN The following bacteria might be causing infection: E.coli (0.75), Pseudomonas (0.5), Pneumonia (0.5) Η πρώτη σειρά του κανόνα αποτρέπει τη χρήση του στην περίπτωση που δεν είναι διαθέσιµα τα αποτελέσµατα της εξέτασης του αίµατος. Αν δεν υπήρχε, το δεύτερο µέρος θα ζητούσε αυτά τα δεδοµένα από το χρήστη. Το τρίτο µέρος προσδιορίζει πιθανές υποψήφιες λύσεις. Βασικά στάδια κατηγοριοποίησης: Χρησιµοποιούνται οι σχέσεις γενίκευσης, για να βρεθεί µία γενική κατηγορία ασθενούς για την οποία µπορεί να βρει µία πιθανή αιτία (ασθένεια). H γενική κατηγορία γίνεται ολοένα και πιο συγκεκριµένη, επιλέγοντας υποκατηγορίες της αρχικής ασθένειας από την ιεραρχία των µικροβίων. Τεχνητή Νοηµοσύνη, B' Έκδοση 28

Βασικά Στάδια Κατηγοριοποίησης στο MYCIN Χώρος εδοµένων Χώρος Κατηγοριών-Λύσεων Κατηγορίες ασθενών Κατάσταση Εκτεθειµένου Ξενιστή ΑΙΤΙΑ Κατηγορίες ασθενειών Βακτήρια που προσβάλουν µη-αποστειρωµένα µέρη εδοµένα ασθενούς ΓΕΝΙΚΕΥΣΗ ΕΠΙΛΟΓΗ ΥΠΟΚΑΤΗΓΟΡΙΑΣ Κατάσταση ανοσοκαταστολής ΙΕΡΑΡΧΙΑ Κατάσταση λευκοπενίας ΟΡΙΣΜΟΣ Βακτήρια που προσβάλουν την περιοχή GI Εντεροβακτήρια ΕΠΙΛΟΓΗ ΥΠΟΚΑΤΗΓΟΡΙΑΣ Χαµηλός αριθµός λευκών αιµοσφαιρίων ΠΟΙΟΤΗΤΑ Αριθµός λευκών αιµοσφαιρίων < 2500 Μόλυνση από τον οργανισµό E.coli ΕΠΙΛΟΓΗ ΥΠΟΚΑΤΗΓΟΡΙΑΣ Συγκεκριµένη ασθένεια Τεχνητή Νοηµοσύνη, B' Έκδοση 29

Μελέτη Περίπτωσης - Το Σύστηµα PROSPECTOR Έµπειρο σύστηµα για την αξιολόγηση γεωλογικών δεδοµένων Καθορισµός πιθανότητα ύπαρξης αξιόλογων ορυκτών κοιτασµάτων σε µια περιοχή Χρησιµοποιήθηκε πειραµατικά µόνο 1 φορά, Προέβλεψε την ύπαρξη ορυκτού κοιτάσµατος µολυβδαίνιου Λειτουργία έχεται παρατηρήσεις (δεδοµένα) και κάνει ερωτήσεις για την πιθανή ύπαρξη χρήσιµου αποθέµατος Αν η πιθανότητα είναι καλή, εµφανίζει γραφική απεικόνιση των πιθανών σηµείων γεώτρησης Η γνώση αναπαριστάται µε: Σηµασιολογικά δίκτυα: Αναπαριστούν γεωλογικές γνώσεις ίκτυα Συµπερασµού: Αναπαριστούν τους κανόνες Τεχνητή Νοηµοσύνη, B' Έκδοση 30

Σηµασιολογικά ίκτυα Αναπαριστούν γεωλογικές γνώσεις. Χρήσεις: Εξαγωγή συµπερασµάτων Π.χ., αν υπάρχουν πυρίτες στην περιοχή, τότε υπάρχει θειούχος σίδηρος και θειούχες ενώσεις Έλεγχος πληροφοριών που δίνει ο χρήστης Π.χ., αν δεν υπάρχουν θειούχα κοιτάσµατα στην περιοχή δεν µπορούν να υπάρχουν και πυρίτες. Ορυκτά Σουλφίδια υποσύνολο υποσύνολο υποσύνολο Οξείδια Σουλφίδια του Σιδήρου ιακριτό στοιχείο ιακριτό στοιχείο Πυρίτης Ντορνίτης Τεχνητή Νοηµοσύνη, B' Έκδοση 31

ίκτυα Συµπερασµού Αναπαριστούν τους κανόνες. Υπάρχει ένα δίκτυο για κάθε ορυκτό. Τα τόξα αναπαριστούν τη συνεπαγωγή ενώ οι κόµβοι τις λογικές πράξεις AND/OR Κάθε κόµβος έχει µια προϋπάρχουσα πιθανότητα Με τη λογική επάρκεια (LS) και αναγκαιότητα (LN) η πιθανότητα κάθε κόµβου µεταβάλλεται, λόγω της παρουσίας άλλων πληροφοριών Οι πιθανότητες και τα µεγέθη LS, LN παρέχονται από τους ειδικούς-γεωλόγους Υποκειµενικότητα - Πιθανότητα σφάλµατος. Ο τρόπος δόµησης της γνώσης και της αβεβαιότητας είναι κατάλληλος µόνο για µικρό αριθµό δικτύων (15 δίκτυα, 150 κανόνες) Τεχνητή Νοηµοσύνη, B' Έκδοση 32

Λογική Επάρκεια και Λογική Αναγκαιότητα Λογική Επάρκεια (Logical Sufficiency LS) Πόσο πιθανότερο είναι να συνδεθεί ένα γεγονός Ε µε την αλήθεια ενός υποθετικού συµπεράσµατος Η, παρά µε την άρνηση του Η (συµβολίζεται Η) P( E H) LS = P E H ( ) Λογική Αναγκαιότητα (Logical Necessity LN) Πόσο πιθανότερο είναι να συνδεθεί η απουσία ενός γεγονότος Ε µε την αλήθεια του υποθετικού συµπεράσµατος Η παρά µε την άρνηση του Η P( E H) LN = P E H ( ) Τεχνητή Νοηµοσύνη, B' Έκδοση 33

Έλεγχος Εκτέλεσης στο PROSPECTOR Εισαγωγή εδοµένων: Ο χρήστης παραθέτει ένα σύνολο παρατηρήσεων. Κάθε πληροφορία συνοδεύεται από µία τιµή από 5 έως 5 Υπολογίζεται η πιθανότητα ύπαρξης της παρατήρησης Ε, βάσει των παρατηρήσεων E του χρήστη 5 P(E E )=0: το Ε δεν υπάρχει βάσει των παρατηρήσεων του χρήστη. 0 P(E E )=P(E): Οι παρατηρήσεις δε µεταβάλλουν τις προϋπάρχουσες πιθανότητες. +5 P(E E )=1: Το Ε υπάρχει βάσει των παρατηρήσεων. Προώθηση Πιθανοτήτων: Το σύστηµα προωθεί στο δίκτυο τις µεταβολές των πιθανοτήτων µε ορθή ακολουθία εκτέλεσης Συνεχίζεται έως ότου προκύψει η ύπαρξη ή όχι κάποιου ορυκτού στην περιοχή Το πιο πιθανό δίκτυο επιλέγεται ως υποψήφιο για την επόµενη φάση Επιβεβαίωση Υπόθεσης: Το σύστηµα κινείται από το συµπέρασµα προς τις παρατηρήσεις Η διαδικασία συνεχίζεται έως ότου το σύστηµα φθάσει σε τερµατικούς κόµβους. Τεχνητή Νοηµοσύνη, B' Έκδοση 34

Κατηγοριοποίηση στο PROSPECTOR Χρησιµοποιεί τη µέθοδο κατηγοριοποίησης Κ4. Αρχικά οδηγείται από τα δεδοµένα του χρήστη σε πιθανές λύσεις. Μετά προσπαθεί να φτάσει από τις υποψήφιες λύσεις σε δεδοµένα που τις στηρίζουν Χρησιµοποιεί ενδιάµεσες υποθέσεις στην κατηγοριοποίηση. Περιοχή που βρίσκεται κάποιο πέτρωµα, ηλικία και τρόπος σχηµατισµού του, κλπ. Χώρος εδοµένων Ενδιάµεσος Χώρος Χώρος Κατηγοριών Περιοχή πιθανόν πλούσια σε ορυκτά ΑΝΤΙΣΤΟΙΧΙΣΗ Απόθεµα πορφύρηχαλκού, τύπου-α ΙΕΡΑΡΧΙΑ Εκρηξιγενή πετρώµατα ΑΝΤΙΣΤΟΙΧΙΣΗ Περιοχή µε υπόγεια δραστηριότητα ΟΡΙΣΜΟΣ Ηφαιστειακός λαιµός Τεχνητή Νοηµοσύνη, B' Έκδοση 35