Αναφορά Π.14 Εσωτερική αναφορά σχετικά με την υπάρχουσα γνώση, αδυναμίες και προοπτικές Το έγγραφο που ακολουθεί είναι μια αναφορά στα πλαίσια του έργου «Γενικευμένο σύστημα ασαφούς γνωστικού χάρτη για ρεαλιστική προσομοίωση πολύπλοκων δυναμικών συστημάτων». Το πρώτο βήμα στο χώρο της οικοδομής είναι η τοποθέτηση γερών θεμελίων τα οποία εγγυούνται την σταθερότητα και τη σωστή ανάπτυξη ενός κτηρίου. Στο δικό μας έργο αντίστοιχης αξίας με τα θεμέλια αποτελεί η σωστή τοποθέτηση του προβλήματος και η μελέτη της ήδη υπάρχουσας γνώσης γύρω από αυτό. Οι στόχοι γύρω από το μοντέλο των Ασαφών Γνωστικών Χαρτών (ΑΓΧ) έτσι όπως τέθηκαν αρχικά μπορούν να χωριστούν σε 2 γενικότερες κατηγορίες: 1. Καθορισμός και χρήση χρονικών εξαρτήσεων 2. Εισαγωγή μεθόδων μάθησης Στην προσπάθεια αναζήτησης πληροφοριών που θα μπορούσαν να μας βοηθήσουν στην περαιτέρω μελέτη και υλοποίηση του έργου μας, έγινε μια βιβλιογραφική ανασκόπηση της ήδη υπάρχουσας γνώσης των τελευταίων 10 χρόνων, με γνώμονα τους προαναφερθέντες στόχους η οποία παρουσιάζεται στην 1 η ενότητα. Στη 2 η ενότητα εντοπίζονται οι αδυναμίες των ΑΓΧ ως προς τους στόχους του έργου ενώ στην 3 η ενότητα παρουσιάζονται οι προοπτικές για το νέο σύστημα που θα ολοκληρωθεί με το τέλος του έργου αυτού ως προς την εκμετάλλευση της ήδη υπάρχουσας γνώσης και την επίλυση των εντοπισμένων αδυναμιών. 1. Υπάρχουσα γνώση 1.1 Χρονικές εξαρτήσεις στον ΑΓΧ Η ιδέα εισαγωγής χρονικών εξαρτήσεων στους ΑΓΧ αποτελεί ένα από τα πιο σημαντικά και κρίσιμα σημεία για την περαιτέρω εξέλιξη των ΑΓΧ. Παρόλ αυτά λίγοι ερευνητές έχουν ασχοληθεί με αυτό τον τομέα και ως εκ τούτου η τεχνογνωσία γύρω Σελ. 1 από 28
από αυτή την ιδέα βρίσκεται ακόμα σε νηπιακό στάδιο. Υπήρξαν βέβαια κάποιες προσπάθειες προσέγγισης του θέματος κάνοντας έτσι τα πρώτα βήματα σε αυτόν τον τόσο προκλητικό χώρο των ΑΓΧ. Το άρθρο [3] υποστηρίζει τη χρήση των ΑΓΧ βασισμένων σε κανόνες (Rule Based Fuzzy Cognitive Maps RBFCM) έναντι των κλασικών ΑΓΧ. Σύμφωνα με τους συγγραφείς το μοντέλο RBFCM μπορεί πιο εύκολα να κωδικοποιήσει τις χρονικές εξαρτήσεις μέσα από τους ασαφείς κανόνες που χαρακτηρίζουν κάθε αιτιώδη σχέση (βάρος). Σε αυτό το σημείο θα ήταν συνετό να δίναμε ένα ορισμό των RBFCM για καλύτερη κατανόηση της προσθήκης του χρονικού προσδιορισμού σε αυτά. Σύμφωνα με την αναφορά [3], ένα RBFCM είναι ένας ασαφής κατευθυνόμενος γράφος με ανάδραση ο οποίος αποτελείται από ασαφείς κόμβους, που ορίζονται και περιγράφονται από ασαφείς γλωσσολογικές μεταβλητές, και ασαφείς συνδέσεις (που αναπαριστούν τις αιτιώδεις σχέσεις) οι οποίες εκφράζονται από ασαφείς βάσεις κανόνων. Έτσι λοιπόν οι συγγραφείς προτείνουν ότι ο χρόνος πρέπει να αναπαριστάται μέσα από κάθε σχέση (βάρος) ενός RBFCM. Ο ορισμός του χρόνου μέσα από κάθε σχέση εξαρτάται αποκλειστικά από τον κατασκευαστή κάθε μοντέλου αφού αυτός έχει την ευθύνη για να βρει τη φύση και τα χαρακτηριστικά κάθε τέτοιας σχέσης αλλά επίσης να βρει τον τρόπο ούτως ώστε το μέγεθος της σχέσης αυτής να είναι αντίστοιχο του χρονικού διαστήματος το οποίο αναπαριστά. Ο κατασκευαστής του μοντέλου καλείται να προσδιορίσει ακριβώς τη χρονική διάσταση κάθε επανάληψης για κάθε σχέση του RBFCM. Μια επανάληψη μπορεί να εκφράζει 1 ώρα, 1 μέρα, 10 χρόνια κλπ. Σε κάθε περίπτωση η συνέπεια μιας σχέσης, όσον αφορά την αλλαγή των τιμών ενεργοποίησης των κόμβων, θα είναι διαφορετική ανά επανάληψη μέχρι να εμφανιστεί η ολική συνέπεια. C1 C2 Εικόνα 1 Δύο κόμβοι μέσα από μια σχέση ΑΓΧ Σελ. 2 από 28
Για καλύτερη κατανόηση της σχέσης αυτής παρατίθεται ένα μικρό παράδειγμα. Έστω ότι οι δύο κόμβοι όπως εμφανίζονται στην Εικόνα 1 είναι μέρος ενός γενικότερου ΑΓΧ. Ο κόμβος C1 συμβολίζει το φαινόμενο του θερμοκηπίου ενώ ο κόμβος C2 το ποσοστό των λιωμένων πάγων. Εάν κάθε επανάληψη για αυτή τη σχέση αναπαριστά μια μέρα, η αλλαγή στην τιμή ενεργοποίησης του C2 θα είναι πολύ μικρότερη από ότι εάν κάθε επανάληψη αναπαριστούσε 10 χρόνια. Έτσι ο μοντελοποιός ενός RBFCM πρέπει να προσδιορίσει την αιτιώδη σχέση μεταξύ δύο κόμβων και να περιγράψει γλωσσολογικά την επιρροή που ασκεί ο ένας στον άλλο αλλά πρέπει επίσης να προσδιορίσει πρώτα την ποσότητα του χρόνου που συμβολίζει κάθε επανάληψη του RBFCΜ και μετά να ορίσει και το μέγεθος της αλλαγής στην τιμή ενεργοποίησης του επηρεαζόμενου κόμβου σε μια επανάληψη. Οι συγγραφείς του [3] ονομάζουν B Time την περίοδο που αναπαριστά κάθε επανάληψη ενός μοντέλου RBFCM. Η μεταβλητή B-Time πρέπει να είναι απόλυτη όταν ορίζεται κάθε κανόνας στη βάση κανόνων ενός RBFCM, ιδιαίτερα όταν ορίζονται οι αιτιώδεις σχέσεις. Είναι προφανές ότι η μεταβλητή B-Time εξαρτάται κατά πολύ από το πραγματικό μοντελοποιημένο σύστημα και τι ζητάμε να μάθουμε μοντελοποιώντας το. Ένα μεγαλύτερο B-Time αυξάνει τις πιθανότητες για πιο αξιόπιστα, σε βάθος χρόνου, αποτελέσματα με πιθανό κόστος στην ακρίβεια και την εγκυρότητα των βραχυπρόθεσμων αποτελεσμάτων. Για αυτό πρέπει πρώτα να ξεκαθαρίζει ο κατασκευαστής κάθε μοντέλου ποιος ακριβώς είναι ο σκοπός του μοντελοποιημένου συστήματος και να ξέρει σε ποιο βάθος χρόνου θα ήθελε να μελετήσει τα αποτελέσματα του μοντέλου του. Πέρα από αυτά, η περίοδος B-Time εξαρτάται και από την εσωτερική συμπεριφορά του μοντελοποιημένου συστήματος. Όπως αναφέρεται στο [3], εάν το σύστημα καταλήγει σε χαοτική συμπεριφορά, τότε θα ήταν καλύτερη επιλογή μια μικρή τιμή στο B-Time, ενώ αν καταλήγει σε σταθερή συμπεριφορά τότε οι μεγάλες τιμές στο B-Time είναι πιο κατάλληλες (π.χ. 1 μήνας, 1 χρόνος, κτλ). Πολλές φορές, παρόλ αυτά, η έκφραση της συνέπειας μιας αλλαγής της κατάστασης ενεργοποίησης ενός κόμβου δεν είναι άμεσα ορατή στην κατάσταση ενεργοποίησης του επηρεαζόμενου κόμβου. Υπάρχει ένας νεκρός χρόνος που αρχίζει από τη στιγμή Σελ. 3 από 28
της αλλαγής της κατάστασης ενός κόμβου και τελειώνει την στιγμή που αλλάζει έστω και λίγο η κατάσταση ενεργοποίησης του επηρεαζόμενου κόμβου. Αυτός ο νεκρός χρόνος ονομάζεται καθυστέρηση στο [3]. Ένα πολύ γνωστό παράδειγμα τέτοιας συμπεριφοράς είναι η καθυστέρηση που παρατηρείται στην αλλαγή της τιμής της βενζίνης στα πρατήρια όταν γίνει μια αλλαγή της τιμής του πετρελαίου ανά βαρέλι. Στο [3] μοντελοποιείται αυτή η συμπεριφορά χρησιμοποιώντας ένα FIFO buffer για κάθε σχέση. Το μέγεθος αυτού του buffer είναι το πηλίκο της καθυστέρησης που παρουσιάζει η συγκεκριμένη σχέση διά την περίοδο B-Time της σχέσης αυτής. Έτσι για να εμφανιστεί η πρώτη αλλαγή στον επηρεαζόμενο κόμβο θα πρέπει να περάσουν (delay/ B-Time) επαναλήψεις (μέγεθος του buffer). Ο μοντελοποιός πρέπει να ορίσει και την καθυστέρηση που χαρακτηρίζει κάθε αιτιώδη σχέση. Είναι σημαντικό ότι η διάρκεια της καθυστέρησης πρέπει να είναι ακέραιος αριθμός. Το δεύτερο άρθρο που προσεγγίζει τον χρονικό προσδριορισμό ενός ΑΓΧ είναι το[25] το οποίο προτείνει ένα μοντέλο χρονικού ΑΓΧ το οποίο ονομάζει tfcm. Αφού πρώτα περιγράφει και ορίζει όλες τις επιρροές που ενδέχεται να έχει ένας κόμβος (από τον εαυτό του, από άλλους κόμβους και από την είσοδο του συστήματος) σε θεωρητικό επίπεδο προχωρά στην χρονική αναπαράσταση του μοντέλου. Η χρονική εξάρτηση του ΑΓΧ μοντελοποιείται μέσα από τις αιτιώδεις σχέσεις (βάρη). Σύμφωνα με τους συγγραφείς οι αιτιώδεις σχέσεις αποτελούνται από: 1. Τις συναρτησεις επίδρασης (όπως ονομάζονται στο [25]) 2. Τις σχέσεις επιδράσεων αιτιότητας μεταξύ των κόμβων Οι επιδράσεις αιτιότητας είναι οι συνέπειες που δέχονται οι κόμβοι από τους άλλους κόμβους. Οι συναρτήσεις επίδρασης σχεδιάζονται για τον καθορισμό αυτών των επιδράσεων και αυτός ο σχεδιασμός, όπως αναφέρεται στο [25], αποτελεί το κλειδί για την επιτυχία της μοντελοποίησης ενός tfcm. Οι συναρτήσεις επίδρασης περιγράφουν τις σχέσεις αιτιότητας αιτιότητας μεταξύ των κόμβων λαμβάνοντας υπόψη τόσο τη χρονική διάσταση του συστήματος όσο και την επιρροή που ασκεί ο ένας κόμβος στον άλλο. Σελ. 4 από 28
Σύμφωνα με το [25] υπάρχουν 2 τρόποι να σχεδιάσεις μια τέτοια συνάρτηση επίδρασης. 1. Ο πρώτος τρόπος έχει να κάνει απλά με την εκμετάλλευση της γνώσης που υπάρχει γύρω από το μοντελοποιημένο σύστημα τόσο από την άποψη της ταχύτητας και το ρυθμό που κινούνται οι αλλαγές των παραμέτρων (κόμβων) ενός συστήματος όσο και από την ποσότητα επιρροής που ασκεί ο καθένας σε κάθε σχέση αιτίας. 2. Ο δεύτερος τρόπος αφορά στην περίπτωση που δεν υπάρχει ξεκάθαρη άποψη για την ταχύτητα και τον ρυθμό που γίνονται οι αλλαγές στις παραμέτρους. Πρώτα από όλα πρέπει να οριστεί μια σειρά από ασαφή σύνολα χρόνου. Κάθε σύνολο θα περιγράφει τη λεκτική μεταβλητή Διάρκεια Χρόνου (βραχυπρόθεσμη διάρκεια, μακροπρόθεσμη διάρκεια, κτλ). Εικόνα 2 Γραφική αναπαράσταση των ασαφών συνόλων χρονικών φάσεων [3] Στην Εικόνα 2 φαίνονται οι συναρτήσεις συμμετοχής τριών ασαφών χρονικών συνόλων: βραχυπρόθεσμο σύνολο (ST), ενδιάμεσο σύνολο (ΜΤ) και το μακροπρόθεσμο σύνολο (LT). Αφού οριστούν με ακρίβεια οι παράμετροι αυτών των ασαφών συνόλων χρόνου και των αντίστοιχων τους συναρτήσεων συμμετοχής προχωρούμε στο δεύτερο βήμα. Σε αυτό το βήμα γίνεται ο προσδιορισμός του βαθμού της επίδρασης (επιρροής) σε κάθε χρονική φάση. Για παράδειγμα, στα ασαφή χρονικά σύνολα της Εικόνας 2 δίνονται τρεις αριθμοί οι οποίοι συνιστούν τους βαθμούς επίδρασης στο Σελ. 5 από 28
βραχυπρόθεσμο, ενδιάμεσο και μακροπρόθεσμο ασαφές σύνολο και που συμβολίζονται ως, και αντίστοιχα. Στο τέλος, χρησιμοποιώντας τη μέθοδο Center of Gravity (COG) based defuzzification υπολογίζεται η τελική επίδραση που θα έχει ένας κόμβος j στον κόμβο i τη δεδομένη στιγμή t σύμφωνα με τον τύπο: hij(t) =, Εξίσωση 1 [3] όπου: είναι ο βαθμός επίδρασης που αντιστοιχεί στο n οστό ασαφές χρονικό σύνολο μεταξύ του κόμβου j και του κόμβου i. είναι ο βαθμός συμμετοχής της επανάληψης t στο n οστό ασαφές χρονικό σύνολο μεταξύ του κόμβου j και του κόμβου i. 1.2 Μέθοδοι μάθησης στον ΑΓΧ Η ιδέα της εισαγωγής μάθησης στο μοντέλο των ΑΓΧ είναι κάτι περισσότερο από ενδιαφέρουσα. Ένα ΑΓΧ το οποίο έχει τη δυνατότητα να μαθαίνει ή να αξιοποιεί και να βελτιστοποιεί την εμπειρία των ειδικών, οι οποίοι ορίζουν τις βασικές του παραμέτρους, θα αποτελεί ένα ακόμα πιο εύχρηστο και ισχυρό εργαλείο προς επίλυση μεγάλης γκάμας προβλημάτων. Η ιδέα αυτή προσεγγίστηκε από αρκετούς ερευνητές. Οι μέθοδοι μάθησης που εφάρμοστηκαν στην τεχνολογία των ΑΓΧ ανήκουν στο χώρο της: 1. Μη επιβλεπόμενης μάθησης 2. Εξελικτικών Αλγορίθμων 3. Γενετικών Αλγορίθμων 4. Αλγορίθμων Σμηνών Όλοι αυτοί οι αλγόριθμοι παρουσιάζονται στη συνέχεια ανά κατηγορία των μεθόδων μάθησης ή βελτιστοποίησης που χρησιμοποιούν. Σελ. 6 από 28
1.2.1 Μέθοδοι Μη Επιβλεπόμενης Μάθησης Nonlinear Hebbian Rule (NHL) Στο άρθρο [10,19] παρουσιάζεται ο αλγόριθμος NonLinear Hebbian Rule (NLH) ο οποίος στηρίζεται στην υπόθεση ότι όλοι οι κόμβοι του ΑΓΧ «πυροδοτούν» συγχρόνως και αλλάζουν τις τιμές τους σε κάθε επανάληψη του αλγορίθμου. Στην φάση της «πυροδότησης» όλα τα βάρη wji αλλάζουν τιμή και έτσι για κάθε βήμα επανάληψης k έχουμε και ένα καινούριο πίνακα βαρών W k. Η αρχικοποίηση του διανύσματος με τις τιμές ενεργοποίησης των κόμβων και του πίνακα βαρών δίνεται από τους ειδικούς του εκάστοτε προβλήματος. Το διάνυσμα τιμών ενεργοποίησης των κόμβων μπορεί επίσης (όπως φαίνεται από το πείραμα που έκαναν οι συγγραφείς) να επιλεχθεί τυχαία. Σημαντικό δε είναι ότι κατά τη διάρκεια της ανάπτυξης ενός ασαφούς δικτύου μάθησης οι ειδικοί θα πρέπει επιπρόσθετα να ορίσουν το σύνολο των κόμβων εξόδου (DesiredOutputConcepts) του ασαφούς δικτύου και μετά να ορίσουν την κατώτατη και ανώτατη επιθυμητή τιμή ενεργοποίησής τους. Επίσης η τελική τιμή κάθε βάρους πρέπει να ανήκει στο σύνολο που ορίζει η συνάρτηση μέλους (membership function) με την οποία αντιστοίχισαν οι ειδικοί, εξαρχής, το συγκεκριμένο βάρος. Η συνάρτησ ί ή ό ό ί : Ενώ ο κανόνας μάθησης ορίζεται ως:., Εξίσωση 2, [10,19]., Εξίσωση 3 [19] όπου η παράμετρος γ και η καθορίζονται πειραματικά. Ο έλεγχος της μάθησης του αλγορίθμου αυτού γίνεται διά μέσου των δύο αντικειμενικών συναρτήσεων: Σελ. 7 από 28
1. Ελαχιστοποίηση της συνάρτησης F1: F1 = όπου, Εξίσωση 4 [19] και Τj min, Τj max είναι το κατώτατο και ανώτατο όριο (αντίστοιχα) τιμής που όρισαν οι ειδικοί για τους προκαθορισμένους κόμβους εξόδου DOCj 2. F2 = - < 0.002, Εξίσωση 5 [19] Έτσι ο αλγόριθμος τερματίζει είτε όταν οι πιο πάνω συνθήκες ικανοποιηθούν είτε εάν ξεπεράσει ένα συγκεκριμένο αριθμό επαναλήψεων. Active Hebbian Learning (AHL) Στο [19,20] παρουσιάζεται ακόμα ένας αλγόριθμος εμπνευσμένος από τον κανόνα Hebbian από τους ίδιους συγγραφείς. Διαφέρει από τον προηγούμενο αλγόριθμο τόσο στη μέθοδο ανανέωσης των βαρών σε κάθε επαναληπτικό βήμα, όσο και στην υπόθεση στην οποία η όλη εφαρμογή στηρίζεται. Σε αυτή την περίπτωση οι κόμβοι δεν αλλάζουν τις τιμές τους συγχρόνως αλλά υπάρχει μια αλληλουχία από βήματα ενεργοποίησης. Σε κάθε βήμα ενεργοποίησης ένας ή περισσότεροι κόμβοι τίθενται ως «κόμβοι ενεργοποίησης» οι οποίοι «πυροδοτούν» ένα ή περισσότερους κόμβους (Activated Concepts). Όπως και στον αλγόριθμο NHL έτσι και εδώ οι ειδικοί πρέπει να ορίσουν τους κόμβους εξόδου (Activation Decision Concepts - ADCs) αλλά και το ανώτατο και κατώτατο όριο των τιμών τους. Στη φάση της πυροδότησης κάθε κόμβος που ενεργοποιείται (Activated Concept) αλλάζει την τιμή του, λαμβάνοντας υπόψη τις τιμές των κόμβων ενεργοποίησης και τα μεταξύ τους βάρη. 1., Εξίσωση 6 [20] όπου l αντιστοιχεί σε κάθε κόμβο ενεργοποίησης που υφίσταται στο δεδομένο βήμα ενεργοποίησης k. Έπειτα αλλάζει και η τιμή των βαρών σύμφωνα με τον κανόνα μάθησης: Σελ. 8 από 28
1 1 1 1 1 1, Εξίσωση 7 [20] όπου η παράμετρος γ και η είναι θετικά μεγέθη τα οποία μειώνονται σε κάθε κύκλο ενεργοποίησης (c). Ο έλεγχος της προόδου της μάθησης γίνεται με τις αντικειμενικές συναρτήσεις: 1. Ελαχιστοποίηση της συνάρτησης J J =, Εξίσωση 8 [20] Όπου ADCj είναι οι προκαθορισμένοι κόμβοι εξόδου, Αj min και Aj max είναι τα προκαθορισμένα όρια από τους ειδικούς για κάθε κόμβο εξόδου 2. - < e, Εξίσωση 9 [20] Όπου c είναι ο κύκλος ενεργοποίησης και e = 0.001 Ο αλγόριθμος τερματίζει όταν ικανοποιηθούν και οι 2 αντικειμενικές συναρτήσεις ταυτοχρόνως. Adaptive Random Fuzzy Cognitive Maps (ARFCM) Ο προτεινόμενος αλγόριθμος του [1] ARFCM στηρίζεται στην ιδέα και τη λειτουργία του μοντέλου του Random Neural Network (RNN) ο οποίος κυρίως χρησιμοποιεί την πιθανότητα εξόδου θετικού σήματος και αρνητικού σήματος από έναν κόμβο προς έναν άλλον, έτσι ώστε να υπολογίσει κατά πόσο ο κόμβος δέκτης σημάτων θα «πυροβολήσει» ή όχι (για να «πυροβολήσει» πρέπει το συνάθροισμα των σημάτων να είναι θετικό). Βασιζόμενος στην κεντρική ιδέα του αλγορίθμου RNN αλλά χρησιμοποιώντας τα χαρακτηριστικά ενός ασαφούς γνωστικού χάρτη, ο ARFCM χωρίζει κάθε βάρος Wij που ενώνει 2 κόμβους i και j σε 2 συνιστώσες, τη θετική W + ij και την αρνητική συνιστώσα W - ij. Έτσι όταν έχουμε ένα θετικό βάρος μεταξύ 2 Σελ. 9 από 28
κόμβων τότε W + ij > 0 και W - ij = 0, ενώ όταν έχουμε ένα αρνητικό βάρος τότε W + ij = 0 και W - ij > 0, αλλιώς Wij = W + ij = W - ij = 0. Για την καλύτερη περιγραφή των φάσεων αυτού του αλγορίθμου χρειαζόμαστε τον ορισμό κάποιων καινούριων συμβόλων και εξισώσεων οι οποίοι και ακολουθούν παρακάτω. Για να υπολογίσουμε την κατάσταση (activation level) ενός κόμβου με τον αλγόριθμο ARFCM χρησιμοποιούμε την πιο κάτω έκφραση: q(j) = min{λ + (j), max{r(j), λ - }}, όπου λ + (j) = max, min,, λ - (j) = max, min,,, Εξίσωση 10 [1] όπου: 1. q(j) εκφράζει την πιθανότητα ενεργοποίησης του κόμβου Cj 2. i ο κάθε κόμβος που δείχνει στον κόμβο j Για κάθε βήμα επανάληψης k ο αλγόριθμος ARFCM κάνει τα ακόλουθα βήματα: 1. Υπολογισμός της πιθανότητας ενεργοποίησης κάθε κόμβου σύμφωνα με την Εξίσωση 10 2. Όταν ο κόμβος i, από τον οποίο ξεκινά ένα βάρος, δεν έχει μηδενική κατάσταση τότε το βάρος Wij αλλάζει ως εξής: =, Εξίσωση 11 [1] Όπου Δqi t και Δqj t είναι η διαφορά των καταστάσεων των κόμβων μεταξύ της χρονικής στιγμής t και t 1. Ο αλγόριθμος τερματίζει όταν το σύστημα συγκλίνει σε μια επιθυμητή λύση (τιμές κόμβων) που ορίζεται από τους ειδικούς. Σελ. 10 από 28
1.1.2 Εξελικτικοί Αλγόριθμοι Αλγόριθμος Evolution Strategy στους ΑΓΧ Οι Εξελικτικές Στρατηγικές είναι ένα κομμάτι στο χώρο των Εξελικτικών Αλγορίθμων. Όπως και στους Εξελικτικούς Αλγορίθμους έτσι και αυτές οι μέθοδοι χρησιμοποιούν πληθυσμούς οι οποίοι αποτελούνται από χρωματοσώματα τα οποία αναπαριστούν τις λύσεις ενός προβλήματος. Τα χρωματοσώματα αυτά αλληλεπιδρούν μεταξύ τους για να φτάσουμε στη δημιουργία της βέλτιστης λύσης. Είναι εύχρηστες μέθοδοι αφού επιτρέπουν την ανάθεση πραγματικών τιμών στα γονίδια των χρωματοσωμάτων (σε αντίθεση με μερικούς γενετικούς αλγορίθμους που υποστηρίζουν τη δυαδική αναπαράσταση των λύσεων). Ο αλγόριθμος όπως παρουσιάζεται στο [8] διαφέρει από τις προαναφερόμενες μεθόδους ως προς την αναπαράσταση λύσης. Όπως ήδη αφέρθηκε οι εξελικτικοί αλγόριθμοι χρησιμοποιούν πληθυσμούς λύσεων και εφαρμόζουν πάνω σε αυτές διάφορους τελεστές μέχρι να βρεθεί η λύση που να ικανοποιεί κάποια κριτήρια. Το ζητούμενο αυτού του αλγορίθμου είναι ο τελικός πίνακας των βαρών ο οποίος αναπαρίσταται με ένα διάνυσμα το οποίο περιέχει όλες τις τιμές των βαρών ενός ΑΓΧ όπως φαίνεται στην Εξίσωση 12.,,,,,,,,, T, Εξίσωση 12 [8] Έτσι ένας πληθυσμός λύσεων στην προκείμενη περίπτωση αποτελείται από πολλά τέτοια διανύσματα βαρών. Οι Εξελικτικές Στρατηγικές σε κάθε επανάληψη αναπαράγουν καινούρια μέλη στον πληθυσμό έτσι ώστε να προωθεί την εξερεύνηση στο χώρο του προβλήματος για τη βέλτιστη λύση. Για το σκοπό αυτό υιοθετούνται οι τελεστές της μετάλλαξης (mutation) και του επανασυνδυασμού (recombination). Σε κάθε επανάληψη του αλγορίθμου εφαρμόζεται ο επανασυνδυασμός πάνω σε όλα τα χρωματοσώματα έτσι ώστε να παραχθούν καινούρια χρωματοσώματα τα οποία όμως θα φέρουν χαρακτηριστικά των «γονιών» τους. Ακολουθεί ο τελεστής της μετάλλαξης όπου κάθε γονίδιο ενός χρωματοσώματος έχει πιθανότητες να αλλάξει τιμή. Για το κάθε γονίδιο Σελ. 11 από 28
υπάρχουν διαφορετικές παράμετροι ρύθμισης της τιμής αυτής. Στη συνέχεια υπολογίζονται οι τελικές τιμές ενεργοποίησης των κόμβων ΑΓΧ χρησιμοποιώντας τα βάρη που προτείνει η κάθε λύση χρωματόσωμα. Η τελική αποτίμηση κάθε χρωματοσώματος γίνεται με την εύρεση του fitness το οποίο υπολογίζεται βάσει των τελικών τιμών ενεργοποίησης των κόμβων εξόδου: Fitness =, Εξίσωση 13 [8] Όπου η λέξη output συμβολίζει τον κάθε κόμβο που ανήκει στο σύνολο των κόμβων εξόδου ενώ το estimated και το real είναι η υπολογισμένη τιμή από το k οστό χρωματόσωμα για τον κόμβο i και η πραγματική τιμή που θα πρεπε να έχει, αντίστοιχα. Ανάλογα με το fitness κάθε χρωματοσώματος γίνεται και η επιλογή του επόμενου πληθυσμού. Στο άρθρο αυτό προτείνονται 2 μέθοδοι επιλογής πληθυσμού όπου το μ συμβολίζει το σύνολο των γονιών και το λ το σύνολο των παιδιών που προέρχονται από αυτούς κατά τη φάση του επανασυνδιασμού: 1. (μ,λ) όπου ο αλγόριθμος επιλέγει τις καλύτερες μονάδες λύσεις (σε fitness function) από τo σύνολο των παιδιών αντικαθιστώντας εντελώς τον προηγούμενο πληθυσμό. 2. (μ+λ) όπου ο αλγόριθμος επιλέγει τις καλύτερες μονάδες λύσεις και από τα δύο σύνολα, των παιδιών και των γονιών. Ο αλγόριθμος τερματίζει εάν ικανοποιηθεί μία από τις πιο κάτω συνθήκες: 1. Best Individual Fitness (όπως ορίζεται στην Εξίσωση 13) < 10-3,Εξίσωση 14 [8] 2. Αριθμός γενεών (επαναλήψεων) > 100, Εξίσωση 15 [8] 1.1.3 Γενετικοί Αλγόριθμοι Αλγόριθμος RCGA Η καινοτομία αυτού του αλγορίθμου [24] είναι η απουσία χρήσης (τουλάχιστον καθ οποιονδήποτε άμεσο τρόπο) των ειδικών στη φάση της προετοιμασίας του Σελ. 12 από 28
αλγορίθμου. Αντί αυτούς, ο αλγόριθμος δέχεται ένα σύνολο δεδομένων εισόδου. Για την είσοδο δεδομένων χρειαζόμαστε όλες τις τιμές ενεργοποίησης των κόμβων ανά επανάληψη. Έτσι τα δεδομένα εισόδου μας είναι τα διανύσματα καταστάσεων ενεργοποίησης των κόμβων από την 1 η επανάληψη μέχρι την επανάληψη όπου οι κόμβοι θα συγκλίνουν σε σταθερές τιμές. Ένας τρόπος για να γίνει αυτό είναι η χρήση ιστορικών δεδομένων των οποίων εκ των πραγμάτων γνωρίζουμε τις τιμές τους ανά χρονική επανάληψη. Τα δεδομένα εισόδου χωρίζονται σε 2 κατηγορίες, τα συνθετικά δεδομένα, τα οποία αποκτούμε με υλοποιημένους ασαφείς γνωστικούς χάρτες, και τα δεδομένα που βγαίνουν μέσα από πραγματικά ιστορικά αποδεδειγμένα γεγονότα. Η μορφή των δεδομένων και στις 2 περιπτώσεις πρέπει να έχει τη μορφή της Εικόνας 3. Εικόνα 3 Στο 1 ο μέρος της πιο πάνω αλυσίδας φαίνονται τα δεδομένα που θα εισαχθούν στον αλγόριθμο για να τον εκπαιδεύσουν. Ο κάθετος άξονας δείχνει τις τιμές των κόμβων (στην προκείμενη περίπτωση υπάρχουν 7 γραμμές άρα 7 κόμβοι) ενώ ο οριζόντιος άξονας δείχνει τον αριθμό της επανάληψης στον οποίο υφίστανται οι συγκεκριμένες τιμές των κόμβων.[24] Εφόσον ο αλγόριθμος αυτός ανήκει στην οικογένεια των γενετικών αλγορίθμων, η λύση που προτείνει αναπαρίσταται (όπως και στον Εξελικτικό Αλγόριθμο) με χρωματοσώματα τα οποία συνθέτουν ένα πληθυσμό. Σε κάθε βήμα του αλγορίθμου υπάρχει ο συνδυασμός των τελεστών διασταύρωσης και της μετάλλαξης. Αρχικά εφαρμόζεται ο τελεστής διασταύρωσης one point crossover με πιθανότητα διασταύρωσης = 0.9. Η μετάλλαξη εφαρμόζεται χρησιμοποιώντας τυχαία ένας από τους 3 τελεστές (Random Mutation, Non Uniform Mutation, Muhlenbein s Mutation). Έπειτα προχωρούμε στην εύρεση τιμής Σελ. 13 από 28
ενεργοποίησης για κάθε κόμβο του δικτύου χρησιμοποιώντας τα βάρη που δίνει το κάθε χρωματόσωμα του πληθυσμού. Βάσει αυτών των τιμών ενεργοποίησης υπολογίζεται η μεταβλητή fitness που δείχνει την απόσταση της λύσης που δίνει το κάθε χρωματόσωμα από την ζητούμενη λύση. Για την εύρεση του fitness πρώτα πρέπει να υπολογιστεί το λάθος που έχει η λύση που προτείνει το κάθε χρωματόσωμα. Χρησιμοποιούνται 3 μετρήσεις για το λάθος βασισμένες στο L1 norm, L2 norm, L norm όπως φαίνεται πιο κάτω: Error_Lp = a p, Εξίσωση 16 [24] Όπου C(t) = [C1(t), C2(t),, Cn(t) ] αποτελούν τις τιμές των κόμβων στην επανάληψη t ενώ το ^Cn(t) είναι η τιμή του κόμβου που δίνει το δεδομένο εισόδου (όπως το περιγράψαμε στην αρχή αυτού του αλγορίθμου) για τον κόμβο n τη στιμγή t. Η παράμετρος N είναι ο αριθμός των κόμβων ενώ Κ είναι ο αριθμός των επαναλήψεων που χρειάστηκε το FCM του δεδομένου εισόδου για να συγκλίνει. Η παράμετρος p ποικίλλει αναλόγως της επιλογής που θα κάνουμε μεταξύ της L1 norm, L2 norm και L norm όπου η p παίρνει τις τιμές 1, 2 και αντίστοιχα. Η παράμετρος α χρησιμοποιείται για την κανονικοποίηση του λάθους και ισούται με την τιμή 1/(Κ 1)Ν όταν το p = 1 ή 2 και με την τιμή 1 /(Κ 1) όταν p =. Έχοντας λοιπόν βρει το λάθος προχωρούμε στον υπολογισμό του fitness κάθε χρωματοσώματος σύμφωνα με την Εξίσωση 17: Fitness Function = h(error_lp), Εξίσωση 17 [24] h(χ) = 1 / (αχ + 1), Εξίσωση 18 [24] όπου η παράμετρος α ρυθμίζεται πειραματικά. Όσο πιο κοντά στο 0 είναι το fitness κάποιου χρωματοσώματος τόσο πιο κακή λύση αποτελεί. Στο τέλος γίνεται η επιλογή του νέου πληθυσμού ο οποίος θα χρησιμοποιηθεί στην επόμενη επανάληψη. Για την επιλογή πληθυσμού χρησιμοποιήθηκαν 2 μέθοδοι: Σελ. 14 από 28
1. Roulette Wheel Selection 2. Tournament Selection Ο αλγόριθμος τερματίζει εάν ικανοποιηθεί μία από τις πιο κάτω συνθήκες: 1. Best Individual Fitness < max_fitness όπου το max_fitness είναι ένα προκαθορισμένο κατώφλι 2. t > max_generation όπου το t είναι ο μετρητής των γενεών (επαναλήψεων) και max_generation είναι ένα αριθμητικό όριο H παράμετρος max_generation αλλά και η max_ fitness καθορίζονται πειραματικά. Goal Oriented Analysis of FCM with Genetic Algorithm Ο σκοπός του αλγορίθμου αυτού όπως παρουσιάζεται στο [6] έχει έναν εντελώς διαφορετικό προσανατολισμό από όλους τους προηγούμενους. Η διαφορά έγκειται στο ζητούμενο που αναζητούσε ο κάθε αλγόριθμος όπου ενώ όλοι οι προηγούμενοι αλγόριθμοι πραγματεύονταν την εξεύρεση του πίνακα των βαρών W ενός ΑΓΧ, αυτός ο αλγόριθμος έχει ως στόχο την εξεύρεση της αρχικής κατάστασης κάθε κόμβου δεδομένης της τελικής κατάστασής του. Όπως λέει και ο τίτλος, χρησιμοποιεί ανάλυση προσανατολισμένη στο στόχο (goal oriented) η οποία ορίζεται μέσα από το άρθρο ως η μέθοδος που χρησιμοποιεί το επιθυμητό αποτέλεσμα σε ένα πρόβλημα και στοχεύει να «ανακαλύψει» την αρχική κατάσταση που οδηγεί σε αυτό. Στην περίπτωση των μοντέλων ΑΓΧ ο συγγραφέας ονομάζει αυτή τη μέθοδο «backward chaining analysis of FCM» της οποίας δίνεται η τελική κατάσταση κάθε κόμβου (fixed ή limit cycle attractor) και προσπαθεί να βρει το διάνυσμα με τις αντίστοιχες αρχικές καταστάσεις των κόμβων. Συνεπεία αυτού τα χρωματοσώματα που αποτελούν τον πληθυσμό αυτού του γενετικού αλγορίθμου αναπαριστούν το διάνυσμα με τις αρχικές τιμές ενεργοποίησης κάθε κόμβου ενός ΑΓΧ. Σε κάθε εποχή του γενετικού αλγορίθμου δημιουργούνται νέα χρωματοσώματα χρησιμοποιώντας τελεστές μετάλλαξης και επανασυνδιασμού. Στο τέλος γίνεται αποτίμηση της λύσης Σελ. 15 από 28
που προσφέρεται μέσα από κάθε χρωματόσωμα υπολογίζοντας την τιμή της μεταβλητής da(a,g) όπως ορίζεται πιο κάτω: da(a,g) = min, Εξίσωση 19 [6] όπου D = {ds(a,b) a ε A, b ε G}, Eξίσωση 20 [6] ds (a,b) = (a b) W ( a b) T, Εξίσωση 21 [6] Όπου το διάνυσμα Α αποτελείται από τις τελικές τιμές ενεργοποίησης των κόμβων, στις οποίες σύγκλινε ο ΑΓΧ μετά που τροφοδοτήθηκε από ένα υποψήφιο διάνυσμα με αρχικές τιμές ενεργοποίησης των κόμβων έτσι όπως ορίζονται από κάποιο χρωματόσωμα. Έπειτα μετρούμε την ευκλείδια απόσταση μεταξύ του διανύσματος Α και του διανύσματος G, το οποίο περιέχει τις επιθυμητές τελικές τιμές ενεργοποίησης, πολλαπλασιάζοντάς την με τον πίνακα βαρών W τον οποίο ορίσαν οι ειδικοί στην φάση της αρχικοποίησης. Σκοπός του αλγορίθμου είναι η ελαχιστοποίηση της μεταβλητής da(a,g). Ο αλγόριθμος τερματίζει όταν βρεθεί μια λύση με καλή απόδοση ή όταν συμπληρώσει το ανώτατο όριο επαναλήψεων. Genetically Evolved Fuzzy Cognitive Map (GE FCM) Ο αλγόριθμος GE FCM [12] προτείνει ένα υβριδικό ΑΓΧ γενετικό αλγόριθμο όπου σαν πρώτο βήμα ο ΑΓΧ υπολογίζει τις τελικές τιμές ενεργοποίησης δοθέντος ενός πίνακα βαρών και σαν δεύτερο βήμα ο γενετικός αλγόριθμος δουλεύει πάνω σε αυτόν τον πίνακα βαρών προσπαθώντας να βρει το βέλτιστο συνδυασμό βαρών που να ικανοποιούν στο μέγιστο τις προ καθορισμένες επιθυμητές τελικές τιμές ενεργοποίησης των κόμβων (όπως διαμορφώθηκαν στο πρώτο βήμα). Όπως και στους προηγούμενους γενετικούς αλγορίθμους έτσι και αυτός χρησιμοποιεί ένα πληθυσμό από χρωματοσώματα τα οποία αναπαριστούν διαφορετικές λύσεις πινάκων βαρών. Έτσι σε κάθε γενεά του αλγορίθμου, αφού εφαρμοστούν οι τελεστές μετάλλαξης και επανασυνδυασμού, κρίνεται η κάθε λύση πίνακα βαρών όπως ορίζεται από το κάθε χρωματόσωμα. Η αξιολόγηση του κάθε χρωματοσώματος Σελ. 16 από 28
γίνεται σύμφωνα με τις τελικές τιμές που συγκλίνει ο ΑΓΧ όταν χρησιμοποιήσει τον πίνακα βαρών που προτείνει το χρωματόσωμα ακολουθώντας την Εξίσωση 22: Fitness(Wi) = 1/ (1 abs(ald,i mean50(ala,i) ), Εξίσωση 22 [12] Όπου: ALd,i είναι η επιθυμητή τιμή ενεργοποίησης του κόμβου Ci έτσι όπως υπολογίστηκε στο πρώτο βήμα. mean50(ala,i) είναι η μέση τιμή των 50 τελευταίων τιμών ενεργοποίησης του κόμβου Ci έτσι όπως υπολογίστηκαν από τον ΑΓΧ. 1.1.4 Αλγόριθμοι Βελτιστοποίησης με Σμήνος Σωματιδίων (Particle Swarm Optimization - PSO) Ο αλγόριθμος Βελτιστοποίησης με Σμήνος Σωματιδίων [18] είναι ένας στοχαστικός αλγόριθμος ο οποίος χρησιμοποιεί ένα πληθυσμό από μονάδες οι οποίες αναπαριστούν τις πιθανές λύσεις σε ένα πρόβλημα. Οι μονάδες αυτές κινούνται στο χώρο λύσης του προβλήματος με μια ταχύτητα (velocity) ανιχνεύοντας την βέλτιστη τοποθεσία στο χώρο (ο οποίος μπορεί να είναι και πολυδιάστατος αναλόγως των παραμέτρων του προβλήματος) για τη λύση του προβλήματος. Για να λειτουργήσει όλο αυτό το σκηνικό ο αλγόριθμος χρειάζεται: 1. Ένα πληθυσμό από σωματίδια εκ των οποίων το καθένα αντιπροσωπεύει μια πρόταση λύσης στο πρόβλημα που προσπαθούμε να λύσουμε 2. Σχηματισμό γειτονιών από σωματίδια 3. Το κάθε particle κινείται στο χώρο με μια συγκεκριμένη ταχύτητα που καθορίζεται από διάφορους παράγοντες όπως π.χ. τη βέλτιστη τοποθεσία που βρέθηκε μέχρι στιγμής κάποιο particle από μια γειτονιά και τη βέλτιστη τοποθεσία που βρέθηκε το κάθε σωματίδιο ατομικά 4. Αποθήκευση της καλύτερης τοποθεσίας που βρέθηκε το κάθε particle Σελ. 17 από 28
5. Αποθήκευση της καλύτερης τοποθεσίας που βρέθηκε κάποιο σωματίδιο από μια γειτονιά Σύμφωνα με τους συγγραφείς, στην προσπάθεια τους να μην αλλάξουν άρδην οι τιμές των κόμβων, θέλοντας έτσι να μην χαθεί εντελώς η συνεισφορά των ειδικών στον ορισμό των βαρών, θέτουν κάποια όρια στις τιμές που μπορεί να πάρει ένα βάρος (κάθε βάρος ενός ΑΓΧ αποτελεί μια διάσταση ενός σωματίδιο). Συγκεκριμένα: 1. Εάν οι ειδικοί βάλουν αρνητικό πρόσημο στο βάρος, τότε το εύρος τιμών που μπορεί να πάρει αυτό περιορίζεται στο διάστημα [-1,0] 2. Αντίθετα, όταν το βάρος οριστεί με θετικό πρόσημο το διάστημα αλλάζει σε [0, 1] Επιπλέον μπορούν να τεθούν ακόμα πιο αυστηροί περιορισμοί στις τιμές που μπορούν να πάρουν τα βάρη λαμβάνοντας υπόψη τη γνώμη των ειδικών ορίζοντας πιο αυστηρά ανώτατα και κατώτατα όρια για μερικά βάρη ή παρατηρώντας το διάστημα των τιμών στο οποίο συγκλίνει ένα βάρος επαναλαμβάνοντας πολλά πειράματα με τον αλγόριθμο και χρησιμοποιώντας στατιστική για περαιτέρω ανάλυση των αποτελεσμάτων. Το μόνο σίγουρο είναι ότι τέτοιοι περιορισμοί μπορούν να αλλάξουν σε μεγάλο βαθμό την απόδοση και την αποτελεσματικότητα του αλγορίθμου, γι αυτό πρέπει να γίνονται με ιδιαίτερη προσοχή. Ο αλγόριθμος PSO χρησιμοποιεί ένα σμήνος από μονάδες για την εξεύρεση λύσης ενός προβλήματος. Κάθε τέτοια μονάδα έχει τόσες διαστάσεις όσες και οι παράμετροι λύσης του προβλήματος που ο αλγόριθμος προσπαθεί να λύσει. Έτσι κάθε μονάδα του σμήνους είναι ένα διάνυσμα. Στην περίπτωση του αλγορίθμου [18] το ζητούμενο λύσης είναι ο πίνακας βαρών ενός ΑΓΧ. Έτσι η κάθε μονάδα λύσης είναι ένα διάνυσμα που αποτελείται από όλα τα βάρη του πίνακα W του ΑΓΧ έτσι όπως φαίνεται στην Εξίσωση 12. Σελ. 18 από 28
Εάν κάποια από τα βάρη, έτσι όπως τα όρισαν οι ειδικοί, έχουν μηδενική τιμή (π.χ. λόγω του ότι δεν υπάρχει αιτιώδης σχέση μεταξύ των αντίστοιχων δύο κόμβων), τότε μπορούν να παραλειφθούν από όλα τα διανύσματα των μονάδων που αποτελούν το σμήνος του αλγορίθμου. Η ταχύτητα κάθε μονάδας του σμήνους, velocity, έχει την ίδια δομή με τις μονάδες (particles) και ακριβώς τις ίδιες διαστάσεις. Για να λειτουργήσει ο αλγόριθμος χρειάζεται τον καθορισμό, από τους ειδικούς των κόμβων εξόδου (Cout) τους οποίους μας ενδιαφέρει ουσιαστικά η τελική τιμή τους. Ο αλγόριθμος αρχικοποιεί τυχαία τις μονάδες του σμήνους που χρησιμοποιεί. Αρχικά υπολογίζεται η ταχύτητα κάθε μονάδας λύσης σύμφωνα με την Εξίσωση 23. Vi(k + 1) = χ[vi(k) + c1r1(pi(k) Xi(k)) + c2r2(pgi(k) Xi(k))], Εξίσωση 23 [18] Όπου: 1. c1 και c2 είναι 2 παράμετροι, η γνωστική και η κοινωνική αντίστοιχα. Η 1 η καθορίζει το μέγεθος της εξερεύνησης που θα κάνει μια μονάδα λύσης ενώ η 2 η την αξιοποίηση της συγκεκριμένης τοποθεσίας που βρίσκεται τη δεδομένη στιγμή έτσι ώστε να συγκλίνει στη βέλτιστη θέση. 2. r1 και r2 είναι 2 τυχαία vectors με στοιχεία παρμένα από την ομοιόμορφη κατανομή στο διάστημα [0,1] 3. κ φ για φ>4 όπου φ = c1 + c2 4. gi είναι ο δείκτης του particle που έχει πετύχει την καλύτερη τοποθεσία στη γειτονιά του Αφού υπολογιστεί η ταχύτητα κάθε μονάδας, ο αλγόριθμος βρίσκει την καινούρια τοποθεσία τους μέσα στον χώρο λύσης του προβλήματος ακολουθώντας την Εξίσωση 24. Xi(k + 1) = Xi(k) + Vi(k + 1), Εξίσωση 24 [18] Σελ. 19 από 28
Η αποτίμηση της νέας τοποθεσίας κάθε μονάδας του σμήνους γίνεται μέσα από την Εξίσωση 25: F(W)= Όπου Η είναι η συνάρτηση Heaviside: Εξίσωση 25 [18] 0, 0 H(x) = 1, 0, Εξίσωση 26 [18] και Αouti i = 1 m, είναι οι τελικές καστάσεις των κόμβων εξόδου στις οποίες σύγκλινε ο ΑΓΧ χρησιμοποιώντας τον πίνακα W μέσα από κάθε μονάδα λύσης του σμήνους. Ο αλγόριθμος τερματίζει όταν βρεθεί το διάνυσμα βαρών που καθολικά ελαχιστοποιεί την αντικειμενική συνάρτηση. 2. Αδυναμίες Η υπάρχουσα τεχνογνωσία υστερεί στον τομέα της προσθήκης της χρονικής εξάρτησης στη διαδικασία υπολογισμού των τιμών ενεργοποίησης των κόμβων. Και τα δύο άρθρα, όπως παρουσιάζονται στην πιο πάνω ενότητα, μοντελοποιούν τις χρονικές εξαρτήσεις μέσα από τις αιτιώδεις σχέσεις κάθε ΑΓΧ. Σε κάθε επανάληψη του ΑΓΧ η επίδραση που εκφράζεται στον επηρεαζόμενο κόμβο από έναν γείτονα κόμβο είναι σταθερή και ισότιμη ενώ κάθε επανάληψη είτε αντιστοιχεί σε σταθερή χρονική τιμή (π.χ. 1 μέρα, 1 χρόνος κλπ) είτε ανήκει με κάποιο βαθμό συμμετοχής σε ένα ασαφές χρονικό σύνολο (π.χ. βραχυπρόθεσμο σύνολο). Στα πραγματικά συστήματα, όμως, δεν υπάρχει πάντα ισομερής καταμερισμός των συνεπειών ανά σταθερά χρονκά διαστήματα ή για κάθε ασαφές χρονικό σύνολο μέσα από μια σχέση αιτιότητας. Αντιθέτως ο χρονικός διαμερισμός της έκφρασης της επίδρασης μιας αλλαγής ενός κόμβου πάνω σε έναν άλλο διαφέρει από σχέση σε σχέση. Μπορεί να περάσει από πολλές διακυμάνσεις η ποσότητα έκφρασης αυτής της επίδρασης στον επηρεαζόμενο κόμβο με το πέρασμα του χρόνου. Για παράδειγμα, θα Σελ. 20 από 28
μπορούσε τις πρώτες χρονικές περιόδους να εκφράζεται σε αυξημένα επίπεδα. Αργότερα να μειώνεται αυτή η έκφραση ενός στο βάθος χρόνου να κορυφώνεται κ.ο.κ. Κάθε σχέση ενός συστήματος μπορεί να είναι διαφορετική ως προς την έκφραση των συνεπειών μιας αλλαγής σε χρονικά πλαίσια και έτσι φαίνεται η ανάγκη ενός μοντέλου που να μπορεί ακριβώς να κωδικοποιεί και να συλλαμβάνει αυτή τη διαφορετικότητα. Μόνο έτσι μπορεί να αποδοθεί στο μέγιστο η ρεαλιστικότητα κάθε μοντελοποιημένου συστήματος. Στον τομέα της εισαγωγής μάθησης στους ΑΓΧ παρατηρείται έντονη κίνηση στη βιβλιογραφία όπως φαίνεται και πιο πάνω. Παρόλ αυτά, όλοι οι αλγόριθμοι μάθησης που προτάθηκαν στηρίζονται σε μια υπόθεση: Ότι είναι γνωστές εκ των προτέρων οι τελικές (επιθυμητές) καταστάσεις ενεργοποίησης των κόμβων που συμμετέχουν στο εκάστοτε μοντελοποιημένο σύστημα. Στην περίπτωση που δεν είναι γνωστές μερικοί αλγόριθμοι ζητούν από τους ειδικούς, βάσει της εμπειρίας τους, να δώσουν ανώτατο και κατώτατο όριο στις επιθυμητές τελικές τιμές ενεργοποίησης των κόμβων. Και στις δύο περιπτώσεις χρειάζεται η γνώση των ειδικών για τη σωστή καθοδήγηση των αλγορίθμων. Εφαρμόζουν όλοι επιβλεπόμενη μάθηση έστω και αν ο τρόπος ανανέωσης των τιμών των βαρών (που είναι και το ζητούμενο στους περισσότερους) παραπέμπει σε άλλες μεθόδους μάθησης (όπως κατηγοριοποιούνται πιο πάνω). Ακόμα και οι υβριδικοί αλγόριθμοι που προτάθηκαν [16,17], οι οποίοι αποτελούν συνδυασμούς αλγορίθμων που παρουσιάστηκαν πιο πάνω, δεν διαφοροποιούνται από τους άλλους όσον αφορά αυτή την υπόθεση. Αυτό αποτελεί πρόβλημα όμως στις περιπτώσεις όπου δεν υπάρχει πρότερη γνώση για ένα σύστημα ή όπου για κάποιο λόγο είναι δύσκολο να καταγραφεί αυτή η γνώση. Αυτό ισχύει και στη δική μας περίπτωση αφού το έργο μας προβλέπει την υλοποίηση ενός διαδικτιακού εργαλείου προσομοίωσης συστημάτων με ΑΓΧ. Αυτό το εργαλείο θα μπορεί να το χρησιμοποιεί κάποιος ουδέτερος άνθρωπος ο οποίος να μην έχει την εμπειρία και τις γνώσεις ώστε να μπορεί με αξιοπιστία να ορίσει τον πίνακα βαρών του συστήματος που θέλει να μοντελοποιήσει. Μια μέθοδος μάθησης ΑΓΧ για την εξεύρεση του ιδανικού πίνακα βαρών θα ήταν ότι καλύτερο για ένα τέτοιο Σελ. 21 από 28
διαδικτιακό εργαλείο αλλά δυστυχώς δεν προτάθηκε κάτι αντίστοιχο μέχρι τώρα στον ερευνητικό χώρο των ΑΓΧ. Επιπρόσθετα, ακόμα μια αδυναμία αποτελεί η έλλειψη μιας καθολικά αποδεκτής βάσης από παραδείγματα μοντελοποιημένων συστημάτων ΑΓΧ τα οποία να μπορούν να χρησιμοποιηθούν ως σημείο αναφοράς ως προς την αξιολόγηση κάθε αλγορίθμου μάθησης που προτείνεται. Ως αποτέλεσμα της έλλειψης αυτής, δεν καθίσταται δυνατή η σύγκριση της αποτελεσματικότητας αλλά και της αξιοπιστίας των αλγορίθμων που προτείνονται αφού σε κάθε άρθρο παρουσιάζονται τα αποτελέσματα του κάθε αλγορίθμου βασισμένα σε εφαρμογές τους σε διαφορετικά μοντελοποιημένα συστήματα, με διαφορετική πυκνότητα και πολυπλοκότητα, μην επιτρέποντας έτσι την ασφαλή εξαγωγή συμπερασμάτων για τη λειτουργία κάθε αλγορίθμου. 3. Προοπτικές Οι ΑΓΧ σταδιακά εξελίχτηκαν σε μια ισχυρή διαδικασία μοντελοποίησης και προσομοίωσης η οποία τυγχάνει μεγάλου ερευνητικού ενδιαφέροντος και βρίσκει εφαρμογή σε διαφορετικής φύσης δυναμικά συστήματα. Αυτή ακριβώς όμως η πολυδιάστατη εφαρμογή τους είναι που δημιουργεί όλο και πιο πολλές απαιτήσεις στην κατασκευαστική λεπτομέρεια και ρεαλιστικότητα ενός τέτοιου μοντέλου. Η χρήση των ΑΓΧ σε κοινωνικο-οικονομικο-τεχνο-πολιτικά δυναμικά συστήματα αποτελεί και την πρόκληση στο έργο μας αφού έτσι φαίνεται καθαρά ότι οι ΑΓΧ μπορούν να αποτελέσουν αναγκαίο συμβουλευτικό εργαλείο για τον σχεδιασμό στρατηγικής σε όλους τους ζωτικούς τομείς της καθημερινότητας του ανθρώπου. Αυτό αναπόφευκτα οδηγεί στην ανάγκη πρόσδωσης μεγαλύτερης ακρίβειας στις πληροφορίες που μπορεί να δώσει ένας ΑΓΧ για ένα μοντελοποιημένο σύστημα. Μεγάλη πρόκληση προς αυτή την κατεύθυνση αποτελεί η εισαγωγή χρονικών εξαρτήσεων στο μοντέλο των ΑΓΧ. Έχει ήδη παρατηρηθεί ότι ο χρόνος εμφάνισης όλων των συνεπειών της επίδρασης ενός κόμβου σε ένα άλλον χωρίζεται σε δύο Σελ. 22 από 28
σταθερές. Για να τις περιγράψουμε θα βασιστούμε στην αιτιώδη σχέση που φαίνεται στην Εικόνα 1. 1. Η πρώτη σταθερά είναι ο νεκρός χρόνος. Αυτή η σταθερά ορίζει το μέγεθος του χρονικού διαστήματος που χρειάζεται ένας επηρεαζόμενος κόμβος μιας αιτιώδους σχέσης για να αρχίσει να εμφανίζει αλλαγές στην κατάσταση ενεργοποίησης του ως συνέπεια της επίδρασης που δέχεται από τον γείτονα κόμβου του που συμμετέχει στην συγκεκριμένη σχέση. Δηλαδή με άλλα λόγια ο νεκρός χρόνος αρχίζει από την στιγμή που αλλάζει η τιμή ενεργοποίησης του κόμβου C1 και τελειώνει τη στιγμή που εμφανίζει την πρώτη αλλαγή στην τιμή ενεργοποίησης του ο κόμβος C2 στην Εικόνα 1. 2. Η δεύτερη σταθερά είναι η σταθερά εξέλιξης. Η σταθερά εξέλιξης ορίζει το μέγεθος του χρονικού διαστήματος στο οποίο εκφράζεται το 100% της επίδρασης που μπορεί να επιφέρει στη δική του κατάσταση ενεργοποίησης, η αλλαγή στην κατάσταση ενεργοποίησης του γείτονα κόμβου που συμμετέχει στην συγκεκριμένη σχέση. Εικόνα 4 Ένα παράδειγμα μιας γραφικής παράστασης που περιγράφει την έκφραση της επίδρασης που ασκεί ένας κόμβος σε ένα άλλο κόμβο. Στο παράδειγμα της Εικόνας 4 παρατηρείται μια καθυστέρηση περίπου 10 μηνών μέχρι να αρχίσει ο επηρεαζόμενος κόμβος να αντιδρά στην αλλαγή του γείτονα κόμβου της συγκεκριμένης σχέσης. Αυτός είναι ο νεκρός χρόνος. Προχωρώντας βλέπουμε ότι χρειάζεται περίπου25 μήνες για να εμφανιστούν οι ολικές συνέπειες της επίδρασης της σχέσης αυτής. Ο χρόνος αυτός είναι η σταθερά εξέλιξης. Η κάθε επανάληψη σε αυτό το μοντέλο αντιστοιχεί σε 1 μήνα. Είναι κατανοητό ότι ο χρονικός προσδιορισμός της επανάληψης μπορεί να διαφέρει από σχέση σε σχέση. Σελ. 23 από 28
Μαζί με τις πιο πάνω χρονικές σταθερές κρίνεται αναγκαίο να οριστεί και ο ρυθμός εμφάνισης των συνεπειών της συνακόλουθης επιρροής που ασκεί ο ένας κόμβος στον άλλο μέσα στο χρονικό διάστημα που ορίζει η σταθερά εξέλιξης. Για αυτό το σκοπό ήδη μελετούμε διαφορετικά από τους ΑΓΧ, χρονικά μοντέλα δυναμικών συστημάτων με αιτιώδεις σχέσεις, παρμένα κυρίως από τον οικονομικό τομέα, τα οποία μπορούν να μας οδηγήσουν στη σωστή κατεύθυνση του χρονικού προσδιορισμού της επίδρασης στους ΑΓΧ. Υπάρχει ήδη η πρώτη σκέψη της χρονικής περιγραφής κάθε αιτιώδους σχέσης ενός ΑΓX ακολουθώντας μια διαδικασία που εμπλέκει και τους ειδικούς για το εκάστοτε πρόβλημα. Σε αυτή την περίπτωση το σύστημα θα έχει μια βάση από συναρτήσεις (παρμένες από οικονομικά κυρίως μοντέλα) ή και γραφικές παραστάσεις αυτών οι οποίες θα περιγράφουν με διαφορετικους τρόπους τον ρυθμό έκφρασης της επιρροής που ασκεί ένας κόμβος στον άλλο για κάθε αιτιώδη σχέση του συστήματος. Οι ειδικοί θα πρέπει να επιλέξουν τη συνάρτηση που περιγράφει καλύτερα κάθε σχέση του συστήματος που κτίζουν και αφού την επιλέξουν να ορίσουν με ακρίβεια τις παραμέτρους που χρειάζεται η κάθε συνάρτηση χρησιμοποιώντας την πείρα και τη γνώση τους για το πώς κατανέμεται η επίδραση του ενός κόμβου πάνω στον άλλο στο χρόνο. Αναμφίβολα το κτίσιμο μιας τέτοιας βάσης χρειάζεται εξονυχιστική έρευνα και μελέτη ούτως ώστε να καλύπτεται η χρονική συμπεριφορά σχέσεων ενός μεγάλου ποσοστού δυναμικών συστημάτων που δύνανται να μοντελοποιηθούν με ΑΓΧ. Πέρα από αυτό θα γίνει μια προσπάθεια εύρεσης ενός αλγορίθμου μάθησης ΑΓΧ ο οποίος να μην προϋποθέτει τη γνώση των επιθυμητών τελικών καταστάσεων ενεργοποίησης του εκάστοτε μοντελοποιημένου συστήματος. Να είναι μια μέθοδος μάθησης η οποία θα μπορεί να εισαχθεί στο τελικό διαδικτιακό εργαλείο που πρόκειται να υλοποιήσουμε έτσι ώστε να διευκολύνει τη λήψη αποφάσεων από τους αρμόδιους φορείς που θα απολαμβάνουν τις υπηρεσίες του ΑΓΧ-μοντέλου (Κυβέρνηση, Βουλή, Στρατός, Αστυνομία, κλπ). Είναι προφανές ότι είναι δύσκολο να γνωρίζουν όλοι αυτοί τις επιθυμητές τελικές καταστάσεις του συστήματος που θα θελαν να μοντελοποιήσουν αφού τις περισσότερες φορές αυτό θα είναι και το ζητούμενο. Υπάρχει η ανάγκη εισαγωγής μιας μεθόδου μάθησης η οποία θα Σελ. 24 από 28
λειτουργεί βοηθητικά ως προς τον ορισμό του πίνακα βαρών για κάθε σύστημα. Θα γίνει μια έρευνα στις μεθόδους μάθησης που χρησιμοποιούνται μέχρι τώρα στα ΤΝΔ ή και σε άλλα συγγενή δίκτυα προς τον ΑΓΧ έτσι ώστε να βρούμε την κατάλληλη μέθοδο που μπορεί να εφαρμοστεί σε ένα ΑΓΧ μοντέλο. Οποιαδήποτε αξιολόγηση του νέου ΑΓΧ μοντέλου θα γίνει βάσει των αποτελεσμάτων της εφαρμογής του σε γνωστά συστήματα και προβλήματα της κυπριακής κοινωνίας αφού σε αυτή θα απευθύνεται το καινούριο εργαλείο που θα χρησιμοποιήσουμε. Επιπροσθέτως, στο νέο μοντέλο ΑΓΧ θα εισαχθούν καινούριες μέθοδοι καθορισμού της αβεβαιότητας και αποσαφήνισης των αρχικών συνθηκών ενός ΑΓΧ μέσα από τη στατική ανάλυση ενός ΑΓΧ όπως περιγράφεται στην αναφορά στα πλαίσια του έργου αυτού Π.13 «Ιδιαιτερότητες των παραμέτρων και των αλληλεπιδράσεων». Με αυτό το τρόπο θα εντοπίζονται μέσα από τον απλό σχεδιασμό ενός ΑΓΧ συστήματος, προβληματικές δομές που μπορεί να οδηγήσουν σε ανεπιθύμητες συμπεριφορές του μοντέλου. Αυτό θα διευκολύνει και θα καθοδηγεί τους χρήστες του τελικού συστήματος στον καλύτερο σχεδιασμό του μοντέλου του ούτως ώστε να έχουν πιο ποιοτικά αποτελέσματα προς εξαγωγή ασφαλών συμπερασμάτων. Σελ. 25 από 28
Βιβλιογραφία 1. Aguilar J. 2002; Adaptive random fuzzy cognitive maps. Advances in Artificial Intelligence IBERAMIA 2002402-410. 2. Aguilar J. 2001; A fuzzy cognitive map based on the random neural model. Engineering of Intelligent Systems 333-338. 3. Carvalho JP, Tomé JAB. 2001; Rule based fuzzy cognitive maps - expressing time in qualitative system dynamics. IEEE International Conference on Fuzzy Systems 1: 280-283. 4. Carvalho JP, Tome JAB. Rule based fuzzy cognitive maps and fuzzy cognitive maps - a comparative study. Annual Conference of the North American Fuzzy Information Processing Society - NAFIPS 1999; 115-119. 5. Hengjie S, Chunyan M, and Zhiqi S. 2007; Fuzzy cognitive map learning based on multi-objectiveparticle swarm optimization. Proceedings of GECCO 2007: Genetic and Evolutionary Computation Conference 339. 6. Khan MS, Chong A. 2003; Fuzzy cognitive map analysis with genetic algorithm. 1196-1205. 7. Koulouriotis DE, Diakoulakis IE, Emris DM, Antonidakins EN, and Kaliakatsos IA. Efficiently modeling and controlling complex dynamic systems using evolutionary fuzzy cognitive maps (invited paper). International Journal of Computational Cognition 2003; 1: 41-65. 8. Koulouriotis DE, Diakoulakis IE, and Emiris DM. 2001; Learning fuzzy cognitive maps using evolution strategies: A novel schema for modeling and simulating high-level behavior. Proceedings of the IEEE Conference on Evolutionary Computation, ICEC 1: 364-371. 9. Li S-, Shen R-. 2004; Fuzzy cognitive map learning based on improved nonlinear hebbian rule. Proceedings of 2004 International Conference on Machine Learning and Cybernetics 4: 2301-2306. 10. Li S-, Shen R-. 2004; Fuzzy cognitive map learning based on improved nonlinear hebbian rule. Proceedings of 2004 International Conference on Machine Learning and Cybernetics 4: 2301-2306. Σελ. 26 από 28
11. Luo X-. 2005; Knowledge acquisition based on the global concept of fuzzy cognitive maps. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 3795 LNCS: 579-584. 12. Mateou NH. 2008; A framework for developing intelligent information systems to support decision making in complex and uncertain environments. 13. Papageorgiou E, Groumpos P. 2004; A weight adaptation method for fuzzy cognitive maps to a process control problem. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 3037: 515-522. 14. Papageorgiou E, Stylios C, and Groumpos P. Fuzzy cognitive map learning based on nonlinear hebbian rule. LECTURE NOTES IN COMPUTER SCIENCE 2003; 256-268. 15. Papageorgiou EI. 2004; ΝΕΕΣ ΜΕΘΟΔΟΙ ΕΚΜΑΘΗΣΗΣ ΓΙΑ ΑΣΑΦΗ ΓΝΩΣΤΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΒΙΟΜΗΧΑΝΙΑ. 16. Papageorgiou EI, Groumpos PP. A new hybrid method using evolutionary algorithms to train fuzzy cognitive maps. Applied Soft Computing Journal 2005; 5: 409-431. 17. Papageorgiou EI, Groumpos PP. 2004; Two-stage learning algorithm for fuzzy cognitive maps. 20042nd International IEEE Conference 'Intelligent Systems' - Proceedings 1: 82-87. 18. Papageorgiou EI, Parsopoulos KE, Stylios CS, Groumpos PP, and Vrahatis MN. Fuzzy cognitive maps learning using particle swarm optimization. J Intell Inform Syst 2005; 25: 95-121. 19. Papageorgiou EI, Stylios C, and Groumpos PP. Unsupervised learning techniques for fine-tuning fuzzy cognitive map causal links. International Journal of Human Computer Studies 2006; 64: 727-743. 20. Papageorgiou EI, Stylios CD, and Groumpos PP. Active hebbian learning algorithm to train fuzzy cognitive maps. International Journal of Approximate Reasoning 2004; 37: 219-249. Σελ. 27 από 28
21. Parsopoulos KE, Papageorgiou EI, Groumpos PP, and Vrahatis MN. A first study of fuzzy cognitive maps learning using particle swarm optimization. IEEE Congress on Evolutionary Computation 2003;. 22. Stach W, Kurgan L, and Pedrycz W. 2007; Parallel learning of large fuzzy cognitive maps. IEEE International Conference on Neural Networks - Conference Proceedings 1584-1589. 23. Stach W, Kurgan L, Pedrycz W, and Reformat M. 2005; Evolutionary development of fuzzy cognitive maps. IEEE International Conference on Fuzzy Systems 619-624. 24. Stach W, Kurgan L, Pedrycz W, and Reformat M. Genetic learning of fuzzy cognitive maps. Fuzzy Sets Syst 2005; 153: 371-401. 25. Zhong H, Miao C, Shen Z, and Feng Y. 2008; Temporal fuzzy cognitive maps. IEEE International Conference on Fuzzy Systems 1831-1840. Σελ. 28 από 28