Π ΑΝΕΠΙΣΤΗΜΙΟ Π ΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΓΙΑ ΤΟ ΜΕΤΑΠΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ Ε. Τ. Υ. ΣΙΕΛΗΣ ΓΕΩΡΓΙΟΣ Α.Μ.: 494 ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΥΛΟΠΟΙΗΣΗ ΕΞΕΛΙΚΤΙΚΩΝ ΜΟΝΤΕΛΩΝ ΧΡΗΣΤΩΝ ΣΕ ΕΙΚΟΝΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ ΜΑΘΗΣΗΣ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Σ. ΛΥΚΟΘΑΝΑΣΗΣ ΠΑΤΡΑ 2008 1
ΕΙΣΑΓΩΓΗ Τα βασικά θέματα με τα οποία καταπιάνεται η συγκεκριμένη Διπλωματική Εργασία είναι κυρίως τα εικονικά περιβάλλοντα μάθησης, τα εξελικτικά μοντέλα χρηστών και οι τρόποι υλοποίησης τους που έχουν ως βάση τους την υπολογιστική νοημοσύνη και πιο συγκεκριμένα τους γενετικούς/εξελικτικούς αλγόριθμους και τα νευρωνικά δίκτυα. Η συγκεκριμένη έρευνα και η υλοποίηση η οποία περιγράφεται, αποτελεί συνέχεια προηγούμενης Διπλωματικής εργασίας που έχει γίνει στο προπτυχιακό επίπεδο. Στην παρούσα διπλωματική γίνεται μια πιο εξειδικευμένη παρουσίαση των τεχνικών για το προτεινόμενο σύστημα ηλεκτρονικής μάθησης και χρησιμοποιούνται διαφορετικές τεχνολογίες και αρχιτεκτονική ως προς την ανάπτυξη του συστήματος. Σήμερα παρατηρείται μια ραγδαία ανάπτυξη τεχνικών μάθησης που βάση της έχει το διαδίκτυο και γενικά τεχνολογικά μέσα τα οποία στο σύνολό τους προσδιορίζουν την έννοια εικονική μάθηση και βασίζονται στα διάφορα περιβάλλοντα εικονικής μάθησης. Η προσπάθεια να ξεφύγουμε από τις κλασσικές μεθόδους διδασκαλίας ( τάξη, δάσκαλοι, μαθητές) και να διευρύνουμε το σύνολο που συμμετέχει στη μετάδοση και λήψη γνώσης οδήγησαν στη δημιουργία τέτοιων περιβαλλόντων και τεχνικών. Τί εννοούμε όμως με τον όρο εικονικά περιβάλλοντα μάθησης; Ένα Εικονικό Περιβάλλον Μάθησης δεν είναι απόλυτα ένα εκπαιδευτικό web site, αν και ορισμένοι χρησιμοποιούν τον όρο εικονικό περιβάλλον μάθησης για να περιγράψουν web sites που απλά περιέχουν κάποιες στατικές ιστοσελίδες με εκπαιδευτικό υλικό. Ένα Εικονικό Περιβάλλον Μάθησης δεν είναι ταυτόσημο με ένα "virtual campus", καθώς ένα virtual campus παρέχει πανεπιστημιακά μαθήματα, ενώ ο 2
όρος Εικονικό Περιβάλλον Μάθησης δεν πρέπει να περιορίζεται σε αυτό μόνο το σκοπό. Έτσι λοιπόν το virtual campus μπορεί να θεωρηθεί σαν μια υποκατηγορία ενός Εικονικού Περιβάλλοντος Μάθησης. Ένα Εικονικό Περιβάλλον Μάθησης δεν πρέπει να περιορίζεται σε συστήματα που περιλαμβάνουν εικονική πραγματικότητα και χρήση τρισδιάστατης τεχνολογίας, αφού κάποια περιβάλλοντα περιλαμβάνουν λιγότερο σύνθετα interfaces, όπως απλό κείμενο. Ένα βιβλίο από μόνο του δύσκολα μπορεί να περιγραφεί ως εκπαιδευτικό περιβάλλον. Άσχετα από τη πληροφορία και τη συσσωρευμένη γνώση την οποία μπορεί να παρέχει ένα βιβλίο, το εκπαιδευτικό περιβάλλον προσδιορίζεται από τις ενέργειες που γίνονται για την εκμετάλλευση της πληροφορίας που περιέχει το βιβλίο, όπως π.χ. Η παρουσίαση του σε ένα συνέδριο, το γράψιμο της περίληψής του, η συζήτησή του από τους αναγνώστες του. Ομοίως, ένα σύνολο από ιστοσελίδες δεν αποτελεί ένα Εικονικό Περιβάλλον Μάθησης αν δεν υπάρχει αλληλεπίδραση μεταξύ των χρηστών σχετικά με την παρεχόμενη εκπαιδευτική πληροφορία. Μιλώντας για εικονικό περιβάλλον μάθησης στο μυαλό μας έρχεται αμέσως το διαδίκτυο. Αντίθετα όμως εικονικό περιβάλλον μάθησης μπορεί να δημιουργηθεί σε μια τάξη ή να εννοούμε τη σύγχρονη και ασύγχρονη επικοινωνία των συμμετεχόντων (δασκάλων-μαθητών, μαθητών μεταξύ τους ). Γενικά ο συνδυασμός πολυμέσων, διαδικτύου, προγραμμάτων προσομοίωσης είναι στοιχεία που δομούν ένα εικονικό περιβάλλον μάθησης. Στοιχεία που αφορούν τα Συνεργατικά Περιβάλλοντα Μάθησης: Εικονικά περιβάλλοντα προβολής (Projection based virtual environments) Εικονικά περιβάλλοντα Οθόνης (Screen based virtual environments) Εικονικά περιβάλλοντα για πολλούς θεατές(multi-spectator virtual environments) Εικονικά περιβάλλοντα για πολλούς χρήστες (Multi users virtual environments) Εικονικά περιβάλλοντα σε δίκτυο (Networked virtual environments) 3
Εμείς θα ασχοληθούμε περισσότερο με τις δύο τελευταίες κατηγορίες εικονικών περιβαλλόντων αφού στόχος μας είναι η δημιουργία εξελεγκτικών μοντέλων χρηστών και η μελέτη για την εξόρυξη αποτελεσμάτων θα γίνει με βάση το εικονικό περιβάλλον σε δίκτυο. Στόχος μας είναι η εύκολη συλλογή δεδομένων για χρήστες σχετικά με το επίπεδο γνώσεων τους και να δημιουργήσουμε ένα σύστημα το οποίο με τη χρήση εξελικτικού προγραμματισμού να μαθαίνει τον κάθε χρήστη και να είναι σε θέση να προβλέπει τις κινήσεις του. Πιο κάτω αναλύουμε σε θεωρητικό επίπεδο γενικά τους όρους εικονικά περιβάλλοντα μάθησης, εικονικός μαθητής, εικονικός καθηγητής, τα είδη τεχνητής νοημοσύνης που γνωρίζουμε σήμερα και επικεντρώνουμε στους γενετικούς αλγόριθμούς και τα νευρωνικά δίκτυα. Περιγράφουμε τι εννοούμε με τον όρο εξελικτικός προγραμματισμός και αναλύουμε το πως τον χρησιμοποιούμε στην συγκεκριμένη υλοποίηση του συστήματος. Στη συγκεκριμένη διπλωματική περιλαμβάνεται και υλοποίηση εικονικού περιβάλλοντος μάθησης το οποίο βασίζεται σε ερωτηματολόγια και με τη χρήση εξελικτικών μεθόδων όπως η θεωρία απόφασης του Bayes για πρόβλεψη των κινήσεων του χρήστη σχετικά με τις γνώσεις του. Γίνεται αναλυτική περιγραφή του τρόπου υλοποίησης της σχετικής βάσης δεδομένων, και των εργαλείων που παρέχονται στο διαχειριστή για δημιουργία ερωτηματολογίων και τη συλλογή στατιστικών για τους χρήστες και τις ερωτήσεις, περιγράφεται ο τρόπος υλοποίησης του αλγορίθμου για τη θεωρία απόφασης του Bayes με τη χρήση του λογισμικού προγράμματος MSBNx, και δίνονται αναλυτικά τα βήματα εγκατάστασης του προγράμματος για προσωπικό υπολογιστή ή server. 4
Περίληψη Πέραν από τις κλασσικές μεθόδους ηλεκτρονικής μάθησης που εφαρμόζονται σήμερα, προτείνεται ένας συνδυασμός εξελικτικών αλγορίθμων και τεχνητής νοημοσύνης για την δημιουργία έξυπνων προσαρμοστικών συστημάτων ηλεκτρονικής μάθησης. Σε αυτή τη διπλωματική εργασία περιγράφονται και παρουσιάζονται οι προτεινόμενοι αλγόριθμοι και ταυτόχρονα η προτεινόμενη πιλοτική εφαρμογή. Το προτεινόμενο σύστημα μπορεί να προβλέψει τις μαθησιακές ικανότητες του μαθητή, μέσα από εξεταστικές διαδικασίες οι οποίες προσφέρονται από το σύστημα, με αποτέλεσμα, το σύστημα να είναι σε θέση να προβλέψει τις επόμενες κινήσεις του μαθητή. Μέσα από την προτεινόμενη εφαρμογή αναπτύχθηκαν μηχανισμοί οι οποίοι συλλέγουν πληροφορίες για τον κάθε χρήστη ξεχωριστά και δημιουργούν ανεξάρτητα προφίλ χρήστη για τον κάθε ένα. Με την χρήση συνδυασμού εξελικτικών αλγορίθμων και αλγορίθμων μάθησης το σύστημα εκπαιδεύεται ώστε να μπορεί να προβλέπει τις μελλοντικές κινήσεις του χρήστη. Η εφαρμογή που αναπτύχτηκε είναι βασισμένη σε τεχνολογίες διαδικτύου, βάσεις δεδομένων και τεχνολογίες έξυπνων πρακτόρων. 5
ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΕΧΟΜΕΝΑ... 6 ΚΕΦΆΛΑΙΟ 1: ΕΙΚΟΝΙΚΆ ΠΕΡΙΒΆΛΛΟΝΤΑ ΜΆΘΗΣΗΣ... 8 ΕΙΚΟΝΙΚΆ ΠΕΡΙΒΆΛΛΟΝΤΑ ΓΙΑ ΠΟΛΛΟΎΣ ΧΡΉΣΤΕΣ... 9 ΕΙΚΟΝΙΚΆ ΠΕΡΙΒΆΛΛΟΝΤΑ ΣΕ ΔΊΚΤΥΟ... 9 ΑΝΆΓΚΗ ΓΙΑ ΔΗΜΙΟΥΡΓΊΑ ΕΙΚΟΝΙΚΏΝ ΠΕΡΙΒΑΛΛΌΝΤΩΝ ΜΆΘΗΣΗΣ... 9 Εικονικός Χρήστης.... 11 Εικονικός Δάσκαλος... 11 Εικονικός Μαθητής... 12 ΕΞΑΤΟΜΙΚΕΥΜΈΝΗ ΗΛΕΚΤΡΟΝΙΚΉ ΜΆΘΗΣΗ... 13 ΚΕΦΆΛΑΙΟ2: ΕΞΕΛΙΚΤΚΌΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΌΣ... 15 ΕΞΕΛΙΓΚΤΙΚΌΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΌΣ ΓΙΑ ΤΗ ΔΗΜΙΟΥΡΓΊΑ ΕΞΕΛΙΚΤΙΚΏΝ ΜΟΝΤΈΛΩΝ ΧΡΗΣΤΏΝ... 16 Γενική περιγραφή των Εξελικτικών Αλγορίθμων... 17 ΓΕΝΕΤΙΚΟΊ ΑΛΓΌΡΙΘΜΟΙ ΚΑΙ ΝΕΥΡΩΝΙΚΆ ΔΊΚΤΥΑ... 19 Γενετικοί Αλγόριθμοι... 19 Γενετικοί Αλγόριθμοι ως Εξελικτικοί Αλγόριθμοι... 21 Βασικά χαρακτηριστικά και παραλλαγές των ΓΑ... 22 Μετάλλαξη και Διασταύρωση... 27 Αναπαράσταση... 34 Παράλληλοι Γενετικοί Αλγόριθμοι... 36 ΠΛΕΟΝΕΚΤΉΜΑΤΑ ΤΩΝ ΓΕΝΕΤΙΚΏΝ ΑΛΓΟΡΊΘΜΩΝ... 37 ΝΕΥΡΩΝΙΚΆ ΔΊΚΤΥΑ...41 Σύγκριση τεχνητού νευρώνα και βιολογικού νευρώνα.... 41 Το Μοντέλο του Τεχνητού Νευρώνα... 42 Αρχιτεκτονικές των Νευρωνικών Δικτύων... 45 ΑΛΓΌΡΙΘΜΟΙ ΜΆΘΗΣΗΣ ΤΕΧΝΗΤΏΝ ΝΕΥΡΩΝΙΚΏΝ ΔΙΚΤΎΩΝ... 48 ΙΔΙΌΤΗΤΕΣ ΤΩΝ ΝΕΥΡΩΝΙΚΏΝ ΔΙΚΤΎΩΝ.... 52 ΚΕΦΆΛΑΙΟ 3: ΘΕΩΡΊΑ ΑΠΌΦΑΣΗΣ ΤΟΥ BAYES... 53 ΘΕΩΡΊΑ ΑΠΌΦΑΣΗΣ ΤΟΥ BAYES... 54 ΕΦΑΡΜΟΓΉ ΤΗΣ ΘΕΩΡΊΑΣ ΑΠΌΦΑΣΗΣ ΤΟΥ BAYES ΓΙΑ ΤΗ ΔΗΜΙΟΥΡΓΊΑ ΕΞΕΛΙΚΤΙΚΟΎ ΕΙΚΟΝΙΚΟΎ ΠΕΡΙΒΆΛΛΟΝΤΟΣ ΜΆΘΗΣΗΣ... 58 ΚΕΦΆΛΑΙΟ 4: ΠΕΡΙΓΡΑΦΉ ΥΛΟΠΟΊΗΣΗΣ... 62 ΠΕΡΙΓΡΑΦΉ ΒΗΜΆΤΩΝ ΥΛΟΠΟΊΗΣΗΣ ΚΎΚΛΟΥ ΛΕΙΤΟΥΡΓΙΏΝ ΚΑΙ ΣΧΕΔΙΑΣΜΟΎ ΤΟΥ ΣΥΣΤΉΜΑΤΟΣ.... 63 Στόχοι Υλοποίησης... 64 Βήματα Υλοποίησης... 64 Αρχιτεκτονική Συστήματος... 64 Σχεδιασμός διαγράμματος ροής λειτουργίας και καθορισμός του κύκλου διεργασιών συστήματος... 67 Υλοποίηση του συστήματος... 71 Περιγραφή Στοιχείων που καταχωρούνται στη Βάση... 75 Σχεδιάγραμμα Συστήματος... 77 Σχεδιάγραμμα ER...78 ΓΕΝΙΚΆ ΣΤΟΙΧΕΊΑ ΣΧΕΔΙΑΣΜΟΎ ΔΙΕΠΑΦΉΣ... 79 ΓΙΑΤΊ ΧΡΉΣΗ ΤΗΣ ASP.NET ΣΕ ΣΥΝΔΙΑΣΜΌ ΜΕ SQL SERVERL.... 80 ΠΕΡΙΓΡΑΦΉ ΛΕΙΤΟΥΡΓΙΏΝ ΔΙΕΠΑΦΉΣ.... 81 ΑΝΑΛΥΤΙΚΆ ΤΟ ΜΕΝΟΎ ΕΠΙΛΟΓΏΝ ΔΙΑΧΕΙΡΙΣΤΉ.... 84 Επιλογή Ερωτήσεις... 85 Επιλογή Επίπεδα Γνώσεων... 87 Επιλογή Ερωτηματολόγια... 88 6
Επιλογή Χρήστες... 90 Επιλογή Στατιστικά... 91 ΧΡΉΣΗ ΛΟΓΙΣΜΙΚΟΎ MSBNX ΓΙΑ ΤΟΝ ΣΧΕΔΙΑΣΜΌ ΤΩΝ BAYESIAN ΔΙΚΤΎΩΝ ΚΑΙ ΔΙΑΜΌΡΦΩΣΉ ΤΟΥ ΩΣΤΕ ΝΑ ΕΚΠΑΙΔΕΎΕΤΑΙ ΤΟ ΣΎΣΤΗΜΑ... 93 ΚΕΦΆΛΑΙΟ 5: ΕΓΚΑΤΆΣΤΑΣΗ ΑΠΑΡΑΊΤΗΤΩΝ ΠΡΟΓΡΑΜΜΆΤΩΝ ΚΑΙ ΕΓΚΑΤΆΣΤΑΣΗ ΤΟΥ ΣΥΣΤΉΜΑΤΟΣ ΣΕ ΥΠΟΛΟΓΙΣΤΉ Ή SERVER.... 104 ΕΓΚΑΤΆΣΤΑΣΗ ΤΟΥ ΣΥΣΤΉΜΑΤΟΣ ΕΙΚΟΝΙΚΉΣ ΜΆΘΗΣΗΣ ΣΕ ΥΠΟΛΟΓΙΣΤΉ.... 105 ΚΕΦΆΛΑΙΟ 6: ΣΥΜΠΕΡΆΣΜΑΤΑ ΚΑΙ ΠΡΟΟΠΤΙΚΈΣ... 108 ΒΙΒΛΙΟΓΡΑΦΊΑ... 112 7
Κ ΕΦΑΛΑΙΟ 1: Ε ΙΚΟΝΙΚΑ Π ΕΡΙΒΑΛΛΟΝΤΑ Μ ΑΘΗΣΗΣ 8
Εικονικά περιβάλλοντα για πολλούς χρήστες Πολλοί χρήστες μπορούν ταυτόχρονα να είναι παρόντες και να αλληλεπιδρούν με το εικονικό περιβάλλον. Εικονικά περιβάλλοντα σε δίκτυο Πολλοί χρήστες που κατανέμονται σε ένα δίκτυο μπορούν να αλληλεπιδρούν ταυτόχρονα σε εικονικό περιβάλλον. Αυτό που προσφέρεται από περιβάλλοντα που υποστηρίζουν συνεργατικότητα Computer Supported Cooperative Work (CSCW))είναι: Η δυνατότητα να παρουσιαστεί μεγάλη ποσότητα πληροφορίας Ο φυσικός τρόπος αλληλεπίδρασης πολλών χρηστών Ο φυσικός τρόπος δημιουργίας δραστηριοτήτων Ανάγκη για δημιουργία εικονικών περιβαλλόντων μάθησης Σε μελέτη του ιδρύματος μελετών Λαμπράκη [2] σχετικά με τα ευρωπαϊκά προγράμματα εικονικών περιβαλλόντων μάθησης αναφέρεται: Ένα ισχυρό χαρακτηριστικό των πιλοτικών έργων αυτού του είδους είναι ότι έχουν προστιθέμενη αξία για μία ευρύτερη ομάδα ενδιαφερομένων, που δεν περιορίζεται στα εκπαιδευτικά ιδρύματα αλλά περιλαμβάνει και εκείνους που σχεδιάζουν εκπαιδευτική πολιτική, όπως και την κοινότητα της Ανοικτής εξ Αποστάσεως Εκπαίδευσης στην Ευρώπη. Τα έργα αυτά ασχολούνται με τη συνεργασία στο χώρο της ΑεξΑΕ, τη δημιουργία δικτύων οργανισμών και ιδρυμάτων, την υποστήριξη του ευρύτερου κοινού στην εξοικείωσή του με την ΑεξΑΕ, την αναβάθμιση της 9
ποιότητας της εκπαίδευσης μέσω της δημιουργίας πόρων γνώσης και της διάδοσης πληροφοριών, εμπειριών, υποδειγματικών πρακτικών, και εντέλει τεχνογνωσίας Γενικεύοντας το πιο πάνω πέρα από τα όρια της Ευρώπης παρατηρούμε την ανάγκη γενικά στον κόσμο για δημιουργία Εξ αποστάσεως εκπαίδευσης. Με ένα απλό ψάξιμο στο Διαδίκτυο μπορεί κάποιος να συνειδητοποιήσει την απίστευτη ποσότητα γνώσης που παρέχεται σε όλες τις γλώσσες και για όλες τις ηλικίες χρηστών. Για την βοήθεια κατανόησης του λόγου για τον οποίο γίνονται τα έργα αυτά και ο τρόπος με τον υλοποιούνται και οργανώνονται βοηθά η συνέχεια της προαναφερθείσας μελέτης με την κατάταξη των πιλοτικών έργων σε τέσσερις κατηγορίες: Μεγάλα δίκτυα ιδρυμάτων/οργανισμών με ευρείς στόχους: Δημόσια εκπαιδευτικά ιδρύματα ή ενώσεις, πανεπιστήμια και ερευνητικοί φορείς έχουν δημιουργήσει δίκτυα με στόχο τη διασύνδεση ή/και υποστήριξη τοπικών δικτύων, την ανταλλαγή πληροφοριών για την αξιοποίηση της Τεχνολογίας της Πληροφορίας και της Επικοινωνίας, τη συλλογή και διάδοση αξιόλογων πρακτικών και υλικού, κτλ. Τα συγκεκριμένα δίκτυα δίνουν το πλαίσιο, αν όχι την υπόσχεση, για μακροπρόθεσμη συνεργασία. Συμπράξεις πανεπιστημίων με πιο ειδικούς στόχους: Συμπράξεις πανεπιστημίων συνεργάζονται σε συγκεκριμένο τομέα της ανώτατης εκπαίδευσης (π.χ. μαθηματικά, χημεία, λογοτεχνία, κτλ.). Σε αυτές τις περιπτώσεις η έμφαση δίνεται στην αξιοποίηση της Τεχνολογίας της Πληροφορίας και της Επικοινωνίας, στις συνθήκες μάθησης και την ομάδα-στόχο. Συλλογή και επεξεργασία πληροφοριών σχετικά με την Τεχνολογία της Πληροφορίας και της Επικοινωνίας και την ΑεξΑΕ: Τα πιλοτικά έργα αυτού του τύπου ασχολούνται με τη δημιουργία βάσεων δεδομένων, βιβλιογραφικών καταλόγων, συλλογών υλικού, οδηγών, κτλ. Εγκάρσια ερευνητικά δίκτυα και μελέτες: Ένας μικρότερος αριθμός έργων αφορά ερευνητικές μελέτες στον τομέα της ΑεξΑΕ από διαφορετικές πλευρές 10
(π.χ. πολιτική, ποιότητα, διάχυση, αξιολόγηση, πιστοποίηση, οικονομία, διοίκηση). Σε web-based περιβάλλοντα, οι εκπαιδευτικές διαδικασίες ποικίλουν από ερωτηματολόγια πολλαπλής επιλογής σε λύση προβλημάτων. Οι εξομοιώσεις είναι επίσης Εικονικά Περιβάλλοντα Μάθησης. Ενώ αρχικά περιορίζονταν σε φυσικά μοντέλα, σήμερα καλύπτουν ένα ευρύ φάσμα πεδίων όπως οικονομικά, πολιτική, βιολογία κλπ. Ωστόσο, αυτό που είναι πιο σαφές στα Εικονικά Περιβάλλοντα Μάθησης είναι το σύνολο των δραστηριοτήτων στις οποίες οι εκπαιδευόμενοι κατασκευάζουν και διαμοιράζουν αντικείμενα. Πιο συχνά τα αντικείμενα αυτά είναι ιστοσελίδες. Δραστηριότητες σχετικές με την σύνταξη αναφορών, εφημερίδων κλπ., είναι πολύ δημοφιλείς στα σχολεία. Οι εκπαιδευόμενοι δεν περιορίζονται στην χρήση πληροφορίας που υπάρχει στο web, αλλά συμμετέχουν στην δημιουργία πληροφορίας. Εικονικός Χρήστης. Η έννοια εικονικός χρήστης σε ένα εικονικό περιβάλλον μάθησης χωρίζεται σε δύο κατηγορίες Εικονικούς Δασκάλους (Virtual Teachers) Εικονικούς Μαθητές (Virtual Students) Εικονικός Δάσκαλος Σε μια εικονική τάξη ο εικονικός δάσκαλος χρησιμοποιώντας μεθόδους και αρχιτεκτονικές που υποστηρίζουν πολυμέσα όπως video/animation κείμενο και εικόνα δημιουργεί πληροφορία η οποία σκοπό έχει να διδάξει. Σε web εφαρμογές δημιουργούνται βάσεις δεδομένων για την αποθήκευση της πληροφορίας και με τη 11
χρήση ηλεκτρονικών πρακτόρων και διαφόρων άλλων web services η πληροφορία αυτή ανακτάται και επεξεργάζεται από τους εικονικούς μαθητές. Εικονικός Μαθητής Ο εικονικός Μαθητής είναι ο Τελικός αποδέκτης της πληροφορίας που παρέχεται σε ένα εικονικό περιβάλλον μάθησης. Ο εικονικός μαθητής μπορεί απλά να παρακολουθεί ή να διαβάζει την πληροφορία που του παρέχεται σε ένα τέτοιο περιβάλλον ανάλογα αν είναι κείμενο ή εικόνα, να συμμετέχει ενεργά αν πρόκειται για ερωτηματολόγιο ή συζήτηση σχετικά με το θέμα, μέσω forum ή chat ή να καταχωρεί σχόλια που να βοηθούν στη βελτίωση του μαθήματος και γενικά ολόκληρου του περιβάλλοντος μάθησης. Αναμφίβολα τα εικονικά περιβάλλοντα μάθησης έχουν σπάσει τα όρια της περιορισμένης μάθησης και δημιούργησαν προυποθέσεις για διδασκαλία νέων θεμάτων με απλότητα,ταχύτητα και χωρίς κόστος για τον οποιοδήποτε. Για παράδειγμα είναι πολύ εύκολο σήμερα για κάποιον να μάθει μια ξένη γλώσσα, να αξιολογήσει τις γνώσεις του σε αυτήν και αν το επιθυμεί να εμβαθύνει στο βαθμό που θέλει, χρησιμοποιώντας μόνο τον υπολογιστή αλλά στην ουσία αυτό γίνεται με μια εικονική αλληλεπίδραση του εικονικού δασκάλου και του εικονικού μαθητή. Αυτή η εικονική αλληλεπίδραση πριν χρόνια ίσως δεν μπορούσε να κατανοηθεί ούτε στο ελάχιστο αλλά σήμερα είναι πλέον τρόπος ζωής και είμαστε στην προνομιακή θέση να μην αρκούμαστε από αυτά που μας προσφέρουν τα υπάρχοντα εικονικά περιβάλλοντα μάθησης και προσδοκούμε στην επιπλέον εξέλιξη των συστημάτων αυτών. Πιο συγκεκριμένα, οι προσδοκίες μας σήμερα δεν αφορούν μόνο την παροχή γνώσεων μέσα σε ένα εικονικό περιβάλλον μάθησης, αλλά να εξελίξουμε σε τέτοιο βαθμό τα συστήματα ώστε να αναγνωρίζουν τους εικονικούς χρήστες να τους καθοδηγούν, να τους προβλέπουν και να τους προσφέρουν ακόμα πιο εύκολα γνώσεις. Θέλουμε δηλαδή να δημιουργήσουμε ακόμα πιο εξελιγμένα μοντέλα χρηστών που με βάση το υπάρχον υπόβαθρο γνώσεών τους να εμπλουτίζουν τη γνώση τους ακόμα πιο εύκολα και πιο γρήγορα. Στην προσπάθεια μας αυτή εισαγάγαμε 12
στα εικονικά περιβάλλοντα μάθησης νέες τεχνολογίες επεξεργασίας της πληροφορίας, όπως η Τεχνητή νοημοσύνη και η Υπολογιστική νοημοσύνη. Για την δημιουργία ενός εξελικτικού μοντέλου μαθητή χρησιμοποιήσαμε μεθόδους της υπολογιστικής νοημοσύνης π.χ. γενετικούς αλγόριθμους και νευρωνικά δίκτυα για να κάνουμε το σύστημα να αναγνωρίζει το χρήστη, να τον προβλέπει και να τον καθοδηγεί. Εξατομικευμένη ηλεκτρονική μάθηση Οι αλλαγές που επιφέρει η ηλεκτρονική μάθηση σηματοδοτεί το πέρασμα από την αντίληψη για τη μάθηση με μετάδοση (broadcast learning), στη μάθηση με αλληλεπίδραση (interactive learning). Οι βασικές αλλαγές οι οποίες έχουν συντελέσει στον τομέα της ανθρώπινης μάθησης με την ευρύτατη διάδοση του διαδικτύου και των υπηρεσιών του είναι σύμφωνα με τον (Tapscot1998), η μετάβαση: Από τη γραμμική μάθηση στη μάθηση με υπερμέσα, Από την εκπαίδευση (instruction) στην οικοδόμηση (construction) και στην ανακάλυψη της γνώσης, Από τη δάσκαλο-κεντρική στη μαθητο-κεντρική παιδαγωγική, Από την απορρόφηση της ύλης, στη μάθηση του πώς να πλοηγείται κανείς και πως να μαθαίνει κανείς, Από τη σχολική εκπαίδευση στη δια βίου μάθηση Από την ομοιόμορφη για όλους μάθηση στην εξατομικευμένη μάθηση Από τη μάθηση τυρρανία στη μάθηση ψυχαγωγία, Από τον/την εκπαιδευτικό ως μεταδότη, στον εκπαιδευτικό διευκολυντή και βοηθό των εκπαιδευομένων. Στόχος της ηλεκτρονικής μάθησης είναι η μέγιστη κατά το δυνατόν αξιοποίηση των τεχνολογιών επεξεργασίας της πληροφορίας και των διαδικτυακών τεχνολογιών προκειμένου να παρέχεται (Sampson, Karagiannidis & Kinshuck, 2002): I. Εξατομικευμένη μάθηση, δηλαδή εκπαίδευση η οποία δεν περιορίζεται από χρονικά και γεωγραφικά όρια, ή άλλους περιορισμούς, αλλά απευθύνεται σε κάθε 13
εκπαιδευόμενο και προσαρμόζεται στις ανάγκες και τα ενδιαφέροντά του, τα οποία διαρκώς μεταβάλλονται καθώς αλλάζουν καθώς αλλάζουν οι χρήστες που εκπαιδεύονται μέσα από ένα εξ αποστάσεως σύστημα. II. Αλληλεπιδραστικότητα, δηλαδή διαδικασίες στις οποίες οι χρήστες επεξεργάζονται ενεργά μια σειρά από καταστάσεις και περιβάλλοντα, και έχουν την ευκαιρία να αναπτύξουν αυθεντική και εγκατεστημένη μάθηση μέσα από το χειρισμό προσομοιώσεων πραγματικών καταστάσεων, διαδικτυακών συνεργατικών περιβαλλόντων κ.λπ. III. Παρουσίαση περιεχομένου με ποικιλία μέσων, καθώς χρησιμοποιούνται πλούσιες πηγές πολυμέσων και υπερμέσων για την παρουσίαση ενός σώματος γνώσης. IV. Παράδοση εκπαιδευτικού υλικού και υποστήριξης τη στιγμή ακριβώς και στον τόπο που τα χρειάζεται ο εκπαιδευόμενος για να φέρει εις πέρας μια ορισμένη δραστηριότητα σε ένα πραγματικό περιβάλλον εργασίας. V. Χρηστο-κεντρικά περιβάλλοντα, όπου ο εκπαιδευόμενος αναλαμβάνει την ευθύνη της ίδιας του της μάθησης και ο εκπαιδευτής έχει ως ρολό το να υποβοηθά και να διευκολύνει τον εκπαιδευόμενο στη μαθησιακή διαδικασία. Ο (Ainsworth S. 2007)[19], παρουσιάζοντας προβλήματα που παρουσιάστηκαν κατά την εφαρμογή ενός συστήματος ηλεκτρονικής μάθησης με μεθόδους κατηγοριοποίησης των εκπαιδευομένων αναφέρει «Οι δάσκαλοι θεώρησαν οτι κατά την προσπάθεια τους να χρησιμοποιηθεί μεγάλο ποσό διδακτικού υλικού το σύστημα περιείχε υλικό που δεν απαιτήθηκε από τους εκπαιδευόμενους και υλικό το οποίο δεν ταίριαζε με το πρόγραμμα σπουδών των εκπαιδευομένων». Μέσα από την εφαρμογή των συστημάτων ηλεκτρονικής μάθησης προκύπτει η ανάγκη για εξατομίκευση και προσαρμογή του περιεχομένου μιας εκπαιδευτικής διαδικασίας σύμφωνα με τις ανάγκες του κάθε εκπαιδευόμενου ξεχωριστά. Η εξατομίκευση και η προσαρμογή του συστήματος στις ανάγκες του εκπαιδευόμενου οδηγεί αντίστοιχα τους δημιουργούς μιας τέτοιας εκπαιδευτικής διαδικασίας ( εκπαιδευτές ) στην καλύτερη αντίληψη των αναγκών των εκπαιδευομένων και την καλύτερη αξιολόγηση του εκπαιδευτικού υλικού για τη δημιουργία μια ουσιαστικής και εποικοδομητικής διδασκαλίας. 14
Κ ΕΦΑΛΑΙΟ2: Ε ΞΕΛΙΚΤΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ 15
Εξελικτικός προγραμματισμός για τη δημιουργία εξελικτικών μοντέλων χρηστών. Ο Εξελικτικός Προγραμματισμός (ΕΠ) έχει σχετικά πρόσφατα αναγνωριστεί ως ένας τομέας που περιλαμβάνει πολλές μεθόδους αποδοτικής επίλυσης προβλημάτων. Ο ίδιος ο όρος επινοήθηκε μόλις το 1991 και αντιπροσωπεύει την προσπάθεια να συγχωνευτούν κάτω από ένα κοινό όνομα διαφορετικές προσεγγίσεις της προσομοίωσης των διαφόρων μορφών της εξελικτικής διαδικασίας. Όλες όμως αυτές οι διαφορετικές προσεγγίσεις των Γενετικών Αλγορίθμων (ΓΑ), των Εξελικτικών Στρατηγικών (ΕΣ), και του Εξελικτικού Προγραμματισμού έχουν μία πολύ βασική ομοιότητα: εξελίσσουν την αναπαραγωγή, την τυχαία μετάλλαξη, τον ανταγωνισμό και την επιλογή για εξέλιξη των ατόμων που περιέχονται σε ένα πληθυσμό. Αυτές οι τέσσερις διαδικασίες αποτελούν τα θεμελιώδη χαρακτηριστικά της εξέλιξης, και όταν συνυπάρχουν είτε στη φύση είτε σε έναν ηλεκτρονικό υπολογιστή, οδηγούν αναπόφευκτα σε αυτή (Atmar 1994). Η ώθηση για την προσομοίωση της εξελικτικής διαδικασίας σε ένα ηλεκτρονικό υπολογιστή προέρχεται από τουλάχιστον τέσσερις διαφορετικές ερευνητικές κατευθύνσεις. Βελτιστοποίηση σε προβλήματα της επιστήμης των μηχανικών Γρήγορη προσαρμοστικότητα σε μεταβλητές συνθήκες Τεχνητή νοημοσύνη Βιολογία 16
Γενική περιγραφή των Εξελικτικών Αλγορίθμων Από τη στιγμή που βασίζονται στο μοντέλο της φυσικής εξέλιξης, όλες οι μορφές των ΕΑ παρουσιάζουν έναν αριθμό από κοινές ιδιότητες, οι οποίες μπορούμε να πούμε ότι χαρακτηρίζουν και διαμορφώνουν ένα πρωτότυπο ενός γενικής μορφής ΕΑ: 1. Οι ΕΑ αξιοποιούν τη συλλογική διαδικασία μάθησης ενός πληθυσμού από άτομα. Συνήθως, κάθε άτομο αναπαριστά, σε κωδικοποιημένη ή μη μορφή, ένα σημείο αναζήτησης μέσα στο χώρο των πιθανών λύσεων ενός συγκεκριμένου προβλήματος. Μερικές φορές, τα άτομα μπορούν επίσης να συμπεριλαμβάνουν και άλλου είδους πληροφορίες, όπως για παράδειγμα στρατηγικές παραμέτρους του ΕΑ. 2. Οι απόγονοι των ατόμων δημιουργούνται μέσα από τυχαίες διαδικασίες που έχουν ως στόχο να μοντελοποιήσουν τη μετάλλαξη και τη διασταύρωση (διαδικασία ανασυνδυασμού του γενετικού υλικού των ατόμων). Η μετάλλαξη αντιστοιχεί σε μια λανθασμένη αντιγραφή των χαρακτηριστικών των ατόμων στους απόγονούς τους (συνήθως, οι μικρού εύρους αλλαγές είναι πολύ πιο πιθανές από αλλαγές μεγάλου εύρους). Η διασταύρωση ανταλλάσσει γενετική πληροφορία ανάμεσα σε δύο ή περισσότερα άτομα που υπάρχουν στον πληθυσμό. 3. Όσον αφορά την αποτίμηση των ατόμων μέσα στο περιβάλλον τους, μπορεί να ανατεθεί σε κάθε άτομο ένα μέτρο της ποιότητας/απόδοσής του. Ως ελάχιστη απαίτηση, θα πρέπει να υπάρχει και η δυνατότητα για σύγκριση της απόδοσης δύο ατόμων η οποία να καταλήγει σε απόφαση για το ποιο από τα δύο είναι καλύτερο από το άλλο. Βασισμένη στο μέτρο απόδοσής τους η διαδικασία επιλογής θα επιλέγει για αναπαραγωγή πιο συχνά τα άτομα που έχουν υψηλή απόδοση σε σχέση με αυτά που παρουσιάζουν χαμηλή. 17
Οι Γενετικοί Αλγόριθμοι δίνουν μεγαλύτερη έμφαση στη διασταύρωση, την οποία θεωρούν την πιο σημαντική διαδικασία αναπαραγωγής, ενώ εφαρμόζουν μεμονωμένα τη μετάλλαξη με πολύ μικρή πιθανότητα αντιμετωπίζοντάς την ως μία δεύτερης κατηγορίας διαδικασία. Χρησιμοποιούν επίσης ένα πιθανοτικό τελεστή επιλογής (επιλογή αναλογικά με την απόδοση) και συνήθως βασίζονται σε δυαδική αναπαράσταση των ατόμων. Οι Εξελικτικές Στρατηγικές χρησιμοποιούν ομοιόμορφα κατανεμημένες μεταλλάξεις για να τροποποιήσουν διανύσματα πραγματικών τιμών. Δίνουν έμφαση στη μετάλλαξη και τη διασταύρωση ως απαραίτητες διαδικασίες για την ταυτόχρονη αναζήτηση τόσο μέσα στο χώρο αναζήτησης των λύσεων όσο και μέσα στο χώρο των παραμέτρων της στρατηγικής που εφαρμόζεται. Ο τελεστής επιλογής είναι ντετερμινιστικός, ενώ το μέγεθος του πληθυσμού των γονέων συνήθως διαφέρει από το μέγεθος του πληθυσμού των απογόνων τους. Ο Εξελικτικός Προγραμματισμός δίνει έμφαση στη διαδικασία της μετάλλαξης και δεν συμπεριλαμβάνει τη διαδικασία της διασταύρωσης μεταξύ των ατόμων. Όπως ακριβώς στην περίπτωση των ΕΣ, όταν αντιμετωπίζει προβλήματα βελτιστοποίησης με πραγματικές παραμέτρους, ο ΕΠ χρησιμοποιεί ομοιόμορφα κατανεμημένες μεταλλάξεις και επεκτείνει την εξελικτική διαδικασία και στις παραμέτρους της στρατηγικής που εφαρμόζεται. Ο τελεστής επιλογής που χρησιμοποιείται είναι πιθανοτικός. Εάν και ΕΠ αναπτύχθηκε αρχικά για την εξέλιξη μηχανών πεπερασμένων καταστάσεων, στη σημερινή εποχή οι περισσότερες εφαρμογές του περιέχουν διανύσματα πραγματικών τιμών. 18
Γενετικοί Αλγόριθμοι και Νευρωνικά δίκτυα Γενετικοί Αλγόριθμοι Οι Γενετικοί Αλγόριθμοι έχουν τις ρίζες τους στη Βιολογία και χρησιμοποιούνται στην ανάπτυξη συστημάτων επίλυσης προβλημάτων βασισμένων στις αρχές της Γενετικής Εξέλιξης και της Κληρονομικότητας. Οι Γενετικοί Αλγόριθμοι είναι ένα μοντέλο μάθησης του οποίου η συμπεριφορά απορρέει από τη μεταφορά μερικών από τους μηχανισμούς της εξέλιξης του φυσικού περιβάλλοντος. Μαζί με τον Εξελεγκτικό προγραμματισμό, τις στρατηγικές Εξέλιξης και το Γενετικό προγραμματισμό αποτελούν μια ξεχωριστή κατηγορία συστημάτων επίλυσης προβλημάτων που είναι ευρύτερα γνωστοί ως Εξελεγκτικοί Αλγόριθμοι. Βασική ώθηση των επιστημόνων για την αναζήτηση μεθόδων όπως οι Γενετικοί Αλγόριθμοι ήταν τα πολλά μειονεκτήματα των κλασσικών μεθόδων αναζήτησης και βελτιστοποίησης, καθώς και η συνεχώς αυξανόμενη ανάγκη για παραγωγή λογισμικού που να μπορεί να εκμεταλλεύεται πιο αποδοτικά τις τεράστιες δυνατότητες του υλικού. Η βάση στην οποία θεμελιώνονται και λειτουργούν τα συστήματα αυτά, είναι η δημιουργία πληθυσμού πιθανών λύσεων και η εφαρμογή πάνω σε αυτό διαφόρων διαδικασιών επιλογής του καλύτερου, καθώς και επιλογή διάφορων γενετικών τελεστών. Οι γενετικοί τελεστές αντιγράφουν τον τρόπο με τον οποίο μεταλλάσσονται τα χρωματοσώματα των κυττάρων των ζωντανών οργανισμών με συνέπεια κατά το πέρασμα από γενιά σε γενιά τα συστήματα αυτά να δημιουργούν συνεχώς νέους πληθυσμούς πιθανών λύσεων, χρησιμοποιώντας τόσο κομμάτια και στοιχεία από την προηγούμενη γενιά, όσο και εντελώς καινούρια κομμάτια που δοκιμάζονται για τυχόν καλή απόδοσή τους. Ο όρος Γενετικοί Αλγόριθμοι αναφέρεται σε οποιοδήποτε πληθυσμιακό μοντέλο το οποίο χρησιμοποιεί την επιλογή επι μέρους στοιχείων του υπάρχοντος μοντέλου την συνένωσή τους και την επαναδημιουργία ενός νέου μοντέλου σε ένα διάστημα αναζήτησης. Οι περισσότεροι ερευνητές χρησιμοποιούν τους γενετικούς αλγόριθμους 19
σε πειραματικές μετρήσεις και στοχεύουν κυρίως στη βελτιστοποίηση των εργαλείων τους. Συνήθως οι Γενετικοί Αλγόριθμοι καταπιάνονται και χρησιμοποιούνται σε δυο θέματα: 1. Προβλήματα Κωδικοποίησης 2. Υπολογιστικές Συναρτήσεις Φανταστείτε ένα πρόβλημα κατά το οποίο επιθυμούμε την βελτιστοποίηση των παραμέτρων του για να ελαχιστοποιήσουμε το σφάλμα στο αποτέλεσμα ή που στόχο έχει την μεγιστοποίηση του κέρδους και ανάλογα την ελαχιστοποίηση του κόστους. Συνήθως τέτοιου είδους προβλήματα τα αντιμετωπίζουμε ως μαύρα κουτιά που περιέχουν πλήθος ελέγχων που αντιπροσωπεύουν το πλήθος των παραμέτρων και ότι η τιμή που επιστρέφει το κουτί είναι ένας βέλτιστος συνδυασμός των παραμέτρων του. Στόχος μας δηλαδή είναι να βρούμε τον κατάλληλο συνδυασμό των παραμέτρων που να βελτιστοποιούν το αποτέλεσμα, ή αλλιώς να θέσουμε τις τιμές σε μια συνάρτηση F(X1,X2,X3,,Xn ) που να μεγιστοποιούν ή να ελαχιστοποιούν το επιστρεφόμενο αποτέλεσμά της. Οι πιο πολλοί Γενετικοί αλγόριθμοι αντιμετωπίζουν τέτοια προβλήματα ως μη γραμμικά, πράγμα που υπονοεί ότι είναι αδύνατο να αντιμετωπίζεται η κάθε μεταβλητή ως ανεξάρτητη μεταβλητή, αλλά αντίθετα, για την επίτευξη του επιθυμητού βέλτιστου αποτελέσματος να χρησιμοποιείται η επίδραση συνδυασμού μεταβλητών στο αποτέλεσμα ή την αλληλεπίδραση των μεταβλητών μεταξύ τους. Μια πρώτη προσέγγιση ήταν η αναπαράσταση των μεταβλητών-παραμέτρων με δυαδικά ψηφία (bits). Αυτό είχε ως αποτέλεσμα τη διακριτοποίηση του προβλήματος και η διακριτοποίηση περιοριζόταν σε κάποιο φάσμα που ήταν δύναμη του 2. Για παράδειγμα χρησιμοποιώντας 10 bits για την κάθε παράμετρο θα λαμβάναμε 1024 διακριτά αποτελέσματα. Αν όμως μια παράμετρος πρέπει να αντιστοιχεί σε καθορισμένο αριθμό αποτελεσμάτων τότε το πρόβλημα γίνεται πιο πολύπλοκο. Για παράδειγμα αν υπάρχουν 1200 αποτελέσματα που να αντιστοιχούν σε μια μεταβλητή Xi χρειαζόμαστε το λιγότερο 11 bits για να καλύψουμε το φάσμα τιμών της. Η κωδικοποίηση όμως της μεταβλητής αυτής θα δημιουργήσει 2048 διακριτές τιμές για το πρόβλημα. Τα 848 αχρησιμοποίητα bits μπορεί να μην συμμετέχουν 20
καθόλου στον υπολογισμό, ή κάποιες παράμετροι να αναπαρίστανται περισσότερες από μια φορά, ώστε όλες οι τιμές να συγκαταλέγονται στο σύνολο των αποτελεσμάτων. Η επίλυση τέτοιων προβλημάτων αποτελούν τον σχεδιασμό των υπολογιστικών συναρτήσεων. Ο σχεδιασμός και υπολογισμός της υπολογιστικής συνάρτησης συνήθως αποτελεί ξεχωριστό μέρος του προβλήματος και πολλές φορές για την υλοποίησή της χρειάζεται ένα είδος προσομοίωσης του προβήματος. Σε άλλες περιπτώσεις η υλοποίηση βασίζεται στην απόδοση ή σε προσεγγιστικά αποτελέσματα. Μια υπολογιστική συνάρτηση πρέπει να είναι γρήγορη και να μπορεί να βελτιστοποιηθεί, γιατί έχοντας υπόψη ότι θα χρησιμοποιηθεί σε γενετικούς αλγόριθμους, αν παράγει ένα αποτέλεσμα κάθε 1 ώρα τότε θα χρειάζεται 1 χρόνο για 10 000 αποτελέσματα 50 γενιές περίπου για ένα πληθυσμό 200 περίπου ψηφιολέξεων. Γενετικοί Αλγόριθμοι ως Εξελικτικοί Αλγόριθμοι Οι Γενετικοί Αλγόριθμοι αποτελούν μία κλάση ΕΑ που προτάθηκαν και αναλύθηκαν για πρώτη φορά από τον Ηolland (1975). Υπάρχουν τρία βασικά χαρακτηριστικά που διαφοροποιούν τους ΓΑ, όπως αυτοί προτάθηκαν από τον Holland, από τους άλλους ΕΑ: Η αναπαράσταση που χρησιμοποιούν (δυαδικές συμβολοσειρές). Η μέθοδος επιλογής (επιλογή με βάση το κλάσμα απόδοσης). Η βασική μέθοδος για την παραγωγή μεταβολών (διασταύρωση). Από τα τρία παραπάνω χαρακτηριστικά ιδιαίτερη έμφαση δίνεται στη διασταύρωση η οποία αποτελεί το βασικό στοιχείο των ΓΑ που τους ξεχωρίζει από τους άλλους ΕΑ. Διάφορες άλλες υλοποιήσεις ΓΑ που ακολούθησαν χρησιμοποίησαν διαφορετικές μεθόδους επιλογής ενώ άλλες εγκατέλειψαν τις δυαδικές αναπαραστάσεις και τις αντικατέστησαν με άλλες αναπαραστάσεις οι οποίες ήταν πιο κατάλληλες για τα προβλήματα που έπρεπε να αντιμετωπίσουν. Αν και έχουν προταθεί πολλές εναλλακτικές μορφές μεθόδων διασταύρωσης, σε όλες σχεδόν τις περιπτώσεις αυτές οι παραλλαγές είναι βαθύτατα επηρεασμένες από το πνεύμα που διακρίνει την πρωτότυπη ανάλυση του 21
Holland για τη συμπεριφορά των ΓΑ όσον αφορά την επεξεργασία των σχημάτων και των μπλοκ κατασκευής. Πρέπει να τονιστεί, όμως, ότι οι Εξελικτικές Στρατηγικές έχουν προσθέσει τη διασταύρωση στο ρεπερτόριο των μεθόδων τους κάνοντας έτσι την διάκριση ανάμεσα στις κλάσεις των ΕΑ ιδιαίτερα δύσκολη. Βασικά χαρακτηριστικά και παραλλαγές των ΓΑ Ένας αρχικός πληθυσμός από άτομα P(0) δημιουργείται (συνήθως με τυχαίο τρόπο) και κάθε άτομο αποτιμάται για να βρεθεί η απόδοσή του. Έπειτα κάποια από αυτά τα άτομα επιλέγονται για ζευγάρωμα και αντιγράφονται στον αποθηκευτή ζευγαρώματος C(t). Στην πρωτότυπη μορφή ΓΑ του Holland, τα άτομα επιλέγονται για ζευγάρωμα πιθανοτικά, με κάθε άτομο να έχει μία πιθανότητα σχετική με την απόδοσή του. Έτσι, τα καλύτερα άτομα έχουν περισσότερες πιθανότητες για να παράγουν απογόνους. Στη συνέχεια οι γενετικοί τελεστές (συνήθως η μετάλλαξη και η διασταύρωση) εφαρμόζονται στα άτομα που βρίσκονται στον αποθηκευτή ζευγαρώματος παράγοντας τους απογόνους C (t). Οι πιθανότητες της μετάλλαξης και της διασταύρωσης που θα χρησιμοποιηθούν αποτελούν κάθε φορά μια απόφαση που εξαρτάται από την υλοποίηση και τη φύση του προβλήματος που πρέπει να επιλυθεί. Εάν οι πιθανότητες είναι σχετικά μικρές, υπάρχει περίπτωση κάποιοι από τους απογόνους που θα δημιουργηθούν να είναι όμοιοι με τους γονείς τους. Άλλες λεπτομέρειες που έχουν σχέση με την υλοποίηση των ΓΑ είναι ο αριθμός των απογόνων που παράγονται από τη διασταύρωσα (ένας ή δύο) και ο αριθμός των ατόμων που επιλέγονται για ζευγάρωμα και τοποθετούνται στον αποθηκευτή ζευγαρώματος. Στην πρωτότυπη περιγραφή του Holland, μόνο ένα ζεύγος επιλέγεται για ζευγάρωμα ανά κύκλο. Ο ψευδοκώδικας για τον ΓΑ του Holland είναι ο ακόλουθος: 22
Begin t = 0; initialize P(t); evaluate structures in P(t); while termination condition not satisfied do begin t = t + 1; select_repro C(t) from P(t-1); recombine and mutate structures in C(t) forming C (t); evaluate structures in C (t); select_replace P(t) from C (t) and P(t-1); end end Αφού δημιουργηθούν οι καινούριοι απόγονοι με τη χρήση των γενετικών τελεστών, οι δυο πληθυσμοί των γονέων και των απογόνων πρέπει να ενωθούν για να προκύψει ο νέος πληθυσμός. Από τη στιγμή που οι περισσότεροι ΓΑ διατηρούν ένα πληθυσμό σταθερού μεγέθους Μ, εννοείται ότι, για να δημιουργηθεί ο καινούριος πληθυσμός, πρέπει ένα πλήθος Μ ατόμων να επιλεχθεί από τους πληθυσμούς των γονέων και των απογόνων. Ένας τρόπος είναι να χρησιμοποιηθούν όλοι οι απόγονοι που έχουν δημιουργηθεί (θεωρώντας ότι ο αριθμός τους δεν είναι μεγαλύτερος από Μ) και να επιλεχθούν (με εντελώς τυχαίο τρόπο) άτομα από τον πληθυσμό των γονέων μέχρι να γίνει το μέγεθος του καινούριου πληθυσμού ίσο με Μ. Εάν μόνο ένας ή δύο απόγονοι παράγονται, αυτό σημαίνει ότι σε κάθε γενιά αντικαθιστώνται τυχαία ένα ή δύο άτομα του παλιού πληθυσμού. Από την άλλη πλευρά, εάν ο αριθμός των απογόνων που δημιουργούνται είναι ίσος με Μ, τότε ο παλιός πληθυσμός αντικαθιστάται πλήρως από τον καινούριο. Υπάρχουν διάφορες δυνατότητες για εξαναγκασμένη επιλογή: επιλογή για αναπαραγωγή (ζευγάρωμα) και επιλογή από τους πληθυσμούς των γονέων και των απογόνων για τη δημιουργία του νέου πληθυσμού. Οι ΓΑ που ακολουθούν το μοντέλο του Holland 23
εφαρμόζουν όλο τον εξαναγκασμό στο επίπεδο της επιλογής των ατόμων για αναπαραγωγή. Ακόμα όμως και ανάμεσα σ' αυτούς τους ΓΑ υπάρχουν αρκετές παραλλαγές. Εάν χρησιμοποιείται αναπαραγωγή με έμφαση, τότε η πιθανότητα να επιλεγεί ένα άτομο είναι συνάρτηση της απόδοσής τους. Ένας άμεσος τρόπος για να γίνει αυτό είναι η άθροιση των αποδόσεων όλων των ατόμων του πληθυσμού των γονέων και ο υπολογισμός για κάθε άτομο της πιθανότητας να επιλεγεί διαιρώντας την απόδοσή του με το συνολικό άθροισμα των αποδόσεων όλων των ατόμων. Ένα από τα χαρακτηριστικά αυτού του τρόπου καθορισμού των πιθανοτήτων επιλογής είναι ότι ο ΓΑ μπορεί να συμπεριφερθεί διαφορετικά σε συναρτήσεις που φαίνονται να είναι παρόμοιες όσον αφορά τη βελτιστοποίησης τους. Για παράδειγμα οι συναρτήσεις y=ax 2 και y=ax 2 +b. Εάν η τιμή του b είναι μεγάλη σε σχέση με τις τιμές που μπορεί να πάρει το γινόμενο ax 2, τότε οι διαφορές στις πιθανότητες για την επιλογή των διαφόρων ατόμων από τους πληθυσμούς θα είναι μικρές και η πίεση από την επιλογή θα είναι μικρή. Αυτό συμβαίνει συχνά όταν ο πληθυσμός συγκλίνει σε ένα μικρού εύρους πεδίο τιμών. Ένας τρόπος για να αντιμετωπιστεί αυτό το πρόβλημα είναι να γίνει διαβάθμιση στη συνάρτηση αποτίμησης, συνήθως σε σχέση με το άτομο του πληθυσμού που έχει τη χειρότερη απόδοση. Έτσι, το μέτρο της απόδοσης που χρησιμοποιείται στον υπολογισμό της πιθανότητας επιλογής ενός ατόμου του πληθυσμού, δεν είναι η απόλυτη τιμή της απόδοσης του ατόμου, αλλά η απόδοση του ατόμου σε σχέση με την απόδοση που έχει το χειρότερο άτομο του πληθυσμού. Αν και η διαβάθμιση μπορεί να εξαλείψει το πρόβλημα της μη επαρκούς πίεσης στην επιλογή, οι ΓΑ που χρησιμοποιούν επιλογή με βάση την απόδοση των ατόμων αντιμετωπίζουν συχνά το αντίθετο ακριβώς πρόβλημα: υπερβολική πίεση στην επιλογή. Εάν βρεθεί ένα άτομο το οποίο έχει πολύ μεγαλύτερη απόδοση από οποιοδήποτε άλλο άτομο του πληθυσμού, η πιθανότητα να επιλεγεί πιθανόν θα είναι πολύ μεγάλη (κυρίως εάν χρησιμοποιείται διαβάθμιση σε σχέση με το χειρότερο άτομο). Υπάρχει ο κίνδυνος πολλά αντίγραφα αυτού του ατόμου να τοποθετηθούν στον αποθηκευτή ζευγαρώματος και αυτό το άτομο (και οι παρόμοιοι με αυτό απόγονοί του) να κυριαρχήσουν γρήγορα στον πληθυσμό (φαινόμενο πρόωρης σύγκλισης). Ένας τρόπος αντιμετώπισης αυτού του φαινομένου είναι η αντικατάσταση της με εφαρμογή της επιλογής με κατάταξη. Τα άτομα στον πληθυσμό των γονέων τοποθετούνται σε σειρά σύμφωνα με την απόδοσή 24
τους και η πιθανότητα επιλογής τους αυτά είναι μια γραμμική συνάρτηση της θέσης του κάθε ατόμου παρά της απόδοσής του. Το πόσο απότομη θα είναι η συνάρτηση αυτή εξαρτάται από μία μεταβαλλόμενη και καθορισμένη από το χρήστη παράμετρο. Μια άλλη δημοφιλής μέθοδος για την επιλογή είναι η επιλογή συναγωνισμού. Επιλέγεται με τυχαίο τρόπο ένα μικρό υποσύνολο ατόμων και στη συνέχεια το καλύτερο άτομο (ή τα δύο καλύτερα άτομα) από το σύνολο αυτό επιλέγεται (επιλέγονται) για τον αποθηκευτή ζευγαρώματος. Η επιλογή συναγωνισμού, όπως και η επιλογή με κατάταξη, είναι λιγότερο πιθανό να οδηγήσει σε φαινόμενα πρόωρης σύγκλισης, ενώ η πίεση της επιλογής μπορεί να καθοριστεί από το μέγεθος του υποσυνόλου που χρησιμοποιείται. Ένα άλλο κοινό χαρακτηριστικό αυτών των ΓΑ είναι το ότι διατηρούν ένα αντίγραφο του καλύτερου ατόμου που έχει βρεθεί μέχρι εκείνη τη γενιά. Η στρατηγική αυτή καλείται ελιτισμός. Στην πραγματικότητα ο ελιτισμός είναι μία εξαναγκασμένη μέθοδος επιλογής γονέων, όπου επιλέγεται το καλύτερο μέλος από τον πληθυσμό των γονέων και Μ-1 μέλη από τον πληθυσμό των απογόνων. Το μέλος του πληθυσμού των απογόνων που θα αντικατασταθεί από το καλύτερο μέλος του πληθυσμού των γονέων μπορεί ανάλογα με την υλοποίηση να είναι εξαναγκασμένη ή όχι. Ένας αριθμός από παραλλαγές ΓΑ κάνουν χρήση της εξαναγκασμένης επιλογής για αντικατάσταση. Το πρόγραμμα GENITOR του Whitley, για παράδειγμα, δημιουργεί έναν απόγονο σε κάθε γενιά, επιλέγοντας τους γονείς του με επιλογή με κατάταξη και αντικαθιστώντας στη συνέχεια το χειρότερο μέλος του πληθυσμού με αυτό. Ο σταθερής κατάστασης (steady-state) ΓΑ του Syswerda δημιουργεί δύο απογόνους σε κάθε γενιά, επιλέγοντας τους γονείς του με επιλογή με κατάταξη και αντικαθιστώντας δύο μέλη από τον πληθυσμό των γονέων τα οποία έχουν επιλεγεί πιθανοτικά με εξαναγκασμό έτσι ώστε να ανήκουν σε αυτά που έχουν τη χειρότερη απόδοση. Ο Eshelman χρησιμοποιεί μη εξαναγκασμένη αναπαραγωγική επιλογή ζευγαρώνοντας τυχαία όλα τα μέλη του πληθυσμού των γονέων και αντικαθιστώντας στη συνέχεια τα άτομα με τη χειρότερη απόδοση από τον πληθυσμό των γονέων με τα άτομα με την καλύτερη απόδοση από τον πληθυσμό των απογόνων (Στην πραγματικότητα, οι δύο πληθυσμοί γίνονται ένας από τον οποίο επιλέγονται για την επόμενη γενιά τα Μ άτομα με τη μεγαλύτερη απόδοση). Αφού οι νέοι απόγονοι επιλέγονται για την επόμενη γενιά μόνο εάν η απόδοσή τους είναι 25
καλύτερη από την απόδοση των μελών του πληθυσμού των γονέων, η επιλογή τόσο του πληθυσμού των γονέων όσο και του πληθυσμού των απογόνων είναι εξαναγκασμένη. Συχνά γίνεται μία διάκριση ανάμεσα στους εξελισσόμενους με τον αριθμό των γενεών και τους σταθερής κατάστασης ΓΑ. Δυστυχώς αυτή η διάκριση τείνει να συνδυάσει δύο λειτουργίες οι οποίες είναι σχεδόν ανεξάρτητες: το εάν η στρατηγική αντικατάστασης του ΓΑ είναι εξαναγκασμένη ή όχι και το εάν ο ΓΑ δημιουργεί ένα (ή δύο) αντί για πολλούς (συνήθως Μ) απογόνους σε κάθε γενιά. Ο σταθερής κατάστασης ΓΑ του Syswerda, όπως και ο GENITOR του Whitley, επιτρέπει μόνο ένα ζευγάρωμα ανά γενιά και χρησιμοποιεί μία εξαναγκασμένης αντικατάστασης μέθοδο επιλογής, όμως υπάρχουν και ΓΑ οι οποίοι συνδυάζουν πολλαπλά ζευγαρώματα ανά γενιά με χρήση εξαναγκασμένης αντικατάσταση μεθόδου επιλογής. Επιπλέον, οι ΓΑ που περιγράφονται από τον Holland συνδυάζουν ένα μόνο ζευγάρωμα ανά γενιά με μη εξαναγκασμένης αντικατάστασης μέθοδο επιλογής. Από αυτά τα δύο χαρακτηριστικά, φαίνεται ότι το πιο σημαντικό είναι η στρατηγική αντικατάστασης. Οι De Jong και Sarma βρήκαν ότι η βασική διαφορά ανάμεσα στους ΓΑ που επιτρέπουν πολλά ζευγαρώματα ανά γενιά σε σχέση με αυτούς που επιτρέπουν λίγα είναι ότι οι δεύτεροι έχουν μία μεγαλύτερη διακύμανση στην απόδοσή τους. Επομένως, η απόφαση για επιλογή μιας εξαναγκασμένης ή μιας μη εξαναγκασμένης στρατηγικής αντικατάστασης αποτελεί μια βασική παράμετρο του καθορισμού της συμπεριφοράς των ΓΑ. Πρώτον, εάν χρησιμοποιηθεί εξαναγκασμένη αντικατάσταση σε συνδυασμό με εξαναγκασμένη αναπαραγωγή, τότε είναι πολύ πιθανόν να εμφανιστεί το πρόβλημα της πρόωρης σύγκλισης (Αυτό φυσικά εξαρτάται και από άλλες παραμέτρους, όπως το μέγεθος του πληθυσμού, το εάν χρησιμοποιείται μέθοδος επιλογής με κατάταξη και, αν ναι, από την τιμή της παραμέτρου εξαναγκασμένης επιλογής, κ.α.). Δεύτερον, το προφανές αποτέλεσμα της μη εξαναγκασμένης αντικατάστασης επιλογής μπορεί να αποτελέσει μια σημαντική βοήθεια. Αντίθετα, αντικαθιστώντας τους γονείς με τους απογόνους χωρίς κάποιο μηχανισμό που να ελέγχει εάν οι απόγονοι έχουν καλύτερη απόδοση από τους γονείς, εμπεριέχει το ρίσκο να χαθούν, ίσως για πάντα, άτομα με πολύ μεγάλη απόδοση. Από την άλλη πλευρά, η αντικατάσταση τον γονέων από τους απογόνους τους, επιτρέπει στον ΓΑ να περιπλανιέται στο χώρο λύσεων και να ξεφεύγει από τοπικά ακρότατα τα οποία θα παγίδευαν έναν άλλο ΓΑ ο οποίος βασίζεται σε 26
εξαναγκασμένης αντικατάστασης μέθοδο επιλογής. Το ποια τεχνική είναι καλύτερη δεν μπορεί απαντηθεί παρά μόνο στο πλαίσιο και των άλλων μηχανισμών του ΓΑ που χρησιμοποιούνται και φυσικά του προβλήματος που πρέπει να επιλυθεί. Μετάλλαξη και Διασταύρωση Όλοι οι ΕΑ λειτουργούν συνδυάζοντας την επιλογή με ένα μηχανισμό για παραγωγή παραλλαγών. Ο πιο γνωστός μηχανισμός για την παραγωγή παραλλαγών είναι η μετάλλαξη, στην οποία ένα allele ενός γονιδίου αντικαθίσταται με τυχαίο τρόπο από ένα άλλο. Με άλλα λόγια, δημιουργούνται νέες λύσεις προς δοκιμή μέσα από μικρές αλλαγές στις αναπαραστήσεις των προηγούμενων λύσεων. Εάν χρησιμοποιείται δυαδική αναπαράσταση, τότε η μετάλλαξη υλοποιείται με αντιστροφή δυαδικών ψηφίων (από 0 σε 1 και αντίστροφα) με τυχαίο τρόπο. Μια συνήθης τιμή που χρησιμοποιείται για την πιθανότητα μετάλλαξης είναι ο λόγος της μονάδας προς το μήκος της δυαδικής συμβολοσειράς. Για παράδειγμα, εάν το χρωμόσωμα έχει μήκος εκατό δυαδικά ψηφία, τότε η πιθανότητα μετάλλαξης είναι τέτοια ώστε κάθε δυαδικό ψηφίο να έχει πιθανότητα 0.01 για να υποστεί μετάλλαξη. Αν και οι περισσότεροι ΓΑ χρησιμοποιούν τη μετάλλαξη σε συνεργασία με τη διασταύρωση, η μετάλλαξη κάποιες φορές αντιμετωπίζεται σαν να είναι ένας τελεστής υποδεέστερος, ο οποίος είναι υπεύθυνος για τη διατήρηση στον πληθυσμό μιας τράπεζας από διαφορετικά alleles που μπορούν να χρησιμοποιηθούν από τη διασταύρωση. Παρ' όλ' αυτά, σε πολλά προβλήματα βελτιστοποίησης μπορεί ένας εξελικτικός αλγόριθμος να είναι πολύ πιο αποδοτικός χρησιμοποιώντας μόνο μετάλλαξη χωρίς καθόλου διασταύρωση. Αυτό φυσικά δεν σημαίνει ότι η διασταύρωση δε παρέχει ποτέ κάποιο όφελος στην εξέλιξη του ΕΑ, παρά μόνο ότι δεν πρέπει κανείς να υποτιμά και να αγνοεί τη μετάλλαξη. Η αρχική ιδέα που κρύβεται πίσω από τη διασταύρωση είναι η εξής: δεδομένων δύο ατόμων που έχουν υψηλή απόδοση, εξαιτίας όμως διαφορετικών χαρακτηριστικών, σε ιδανική κατάσταση αυτό που θα ήθελε κάποιος να επιτύχει είναι η δημιουργία ενός νέου ατόμου το οποίο θα συνδυάζει τα καλύτερα χαρακτηριστικά από κάθε άτομο. Φυσικά, αφού δεν είναι γνωστά εκ των προτέρων τα χαρακτηριστικά στα οποία οφείλεται η καλή 27
απόδοση (εάν ήταν γνωστά δε θα χρειαζόταν αλγόριθμος αναζήτησης), το καλύτερο που θα μπορούσε κάποιος να κάνει θα ήταν να συνδυάσει τα χαρακτηριστικά των ατόμων με τυχαίο τρόπο. Αυτός είναι ο τρόπος με τον οποίο λειτουργεί η διασταύρωση. Χειρίζεται αυτά τα χαρακτηριστικά σαν μπλοκ οικοδόμησης που είναι διασκορπισμένα σε όλο τον πληθυσμό και προσπαθεί να τα συνδυάσει και να δημιουργήσει νέα καλύτερα άτομα. Κάποιες φορές η διασταύρωση συνδυάζει τα χειρότερα χαρακτηριστικά από τους δύο γονείς και δημιουργεί απογόνους με μικρή απόδοση τα οποία δεν πρόκειται να επιβιώσουν για πολλές γενιές. Άλλες φορές όμως, συνδυάζει τα καλύτερα στοιχεία από τα δύο καλής απόδοσης άτομα, υπό την προϋπόθεση ότι αυτά τα στοιχεία μπορούν να συνδυαστούν, και δημιουργεί ακόμα καλύτερης απόδοσης άτομα. Θεωρώντας ότι η αναπαράσταση που χρησιμοποιεί ο ΓΑ είναι η κλασσική δυαδική αναπαράσταση, οι κωδικοποιημένες λύσεις στον πληθυσμό είναι δυαδικές συμβολοσειρές που αποτελούνται από μηδενικά και άσους με μήκος L. Ένας ΓΑ δημιουργεί δύο νέα άτομα με τη βοήθεια της διασταύρωσης, επιλέγοντας δύο συμβολοσειρές από τον πληθυσμό των γονέων και εναλλάσσοντας τα δυαδικά ψηφία ανάμεσα τους με τυχαίο τρόπο (σε κάποιους ΓΑ δημιουργείται μόνο ένας απόγονος, χωρίς όμως να διαφοροποιείται η διαδικασία της διασταύρωσης). Ο Holland είχε προτείνει αρχικά να γίνεται η εναλλαγή των δυαδικών ψηφίων σε τμήματα και όχι ανά δυαδικό ψηφίο. Πιο συγκεκριμένα, πρότεινε να επιλέγεται μία θέση στο άτομο με τυχαίο τρόπο και στη συνέχεια να αλλάζονται όλα τα δυαδικά ψηφία που βρίσκονται μετά από αυτό. Η μέθοδος αυτή είναι γνωστή ως διασταύρωση μονού σημείου (one-point crossover). Μία άλλη κοινή μέθοδος διασταύρωσης είναι η διασταύρωση διπλού σημείου (two-point crossover). Σύμφωνα με αυτή, επιλέγονται με τυχαίο τρόπο δύο σημεία στα άτομα και εναλλάσσονται τα δυαδικά ψηφία που βρίσκονται στα τμήματα που καθορίζονται από τα σημεία αυτά. Εκτός από αυτές τις δύο μεθόδους διασταύρωσης υπάρχουν φυσικά και διάφορες άλλες παραλλαγές. Η πιο γνωστή από αυτές είναι η ομοιόμορφη διασταύρωση (uniform crossover). Η ομοιόμορφη διασταύρωση εναλλάσσει με τυχαίο τρόπο τα δυαδικά ψηφία μεταξύ των γονέων (δηλαδή ανταλλάσσει ανάμεσα στους γονείς τις τιμές που έχουν σε συγκεκριμένες θέσεις οι οποίες έχουν επιλεγεί με τυχαίο τρόπο). 28
Σύμφωνα με τον Holland, η συμπεριφορά των ΓΑ ερμηνεύεται και αναλύεται με τη βοήθεια των σχημάτων. Δεδομένου ενός χώρου από δομές που αναπαριστώνται από δυαδικές συμβολοσειρές μήκους L, τα σχήματα αποτελούν διαμελισμούς του χώρου αναζήτησης. Εάν οι δυαδικές συμβολοσειρές μήκους L παριστάνονται ως διανύσματα σε έναν L-διάστατο υπερκύβο, τότε τα σχήματα αποτελούν υπερεπίπεδα του χώρου αυτού. Ένα σχήμα μπορεί να παρασταθεί από μία συμβολοσειρά αποτελούμενη από L σύμβολα επιλεγμένα από το σύνολο {0, 1, #}, όπου το σύμβολο # καλείται αδιάφορο και αντιπροσωπεύει την περίπτωση το συγκεκριμένο ψηφίο να μπορεί να είναι είτε 0 είτε 1. Όταν μία συμβολοσειρά μήκους L ταυτίζεται με ένα σχήμα στις θέσεις όπου το σχήμα έχει μη αδιάφορα σύμβολα μπορεί να θεωρηθεί ότι αποτελεί ένα δείγμα που ανήκει στο διαμελισμό του χώρου που καθορίζει το σχήμα αυτό. Για παράδειγμα, η συμβολοσειρά 011001 ανήκει στο σχήμα 01##0#. Στην πραγματικότητα, κάθε συμβολοσειρά ανήκει σε L 2 σχήματα. Οι δύο σημαντικότερες ποσότητες ενός σχήματος είναι η τάξη (order) και το καθορισμένο μήκος (defining length). Η τάξη ενός σχήματος είναι ο αριθμός των μη καθορισμένων θέσεων του σχήματος, δηλαδή ο αριθμός των μη αδιάφορων στοιχείων του. Για παράδειγμα, το σχήμα #01##1### έχει τάξη 3. Το καθορισμένο μήκος ισούται με την απόσταση μεταξύ της πρώτης και της τελευταίας θέσης που έχει μη αδιάφορο σύμβολο. Το καθορισμένο μήκος του παραπάνω σχήματος ισούται με 4, αφού η θέση του πρώτου μη αδιάφορου συμβόλου είναι 2 και του τελευταίου είναι 6. Από την πλευρά της ανάλυσης με βάση τα υπερεπίπεδα, ο ΓΑ μπορεί να θεωρηθεί ως μία μέθοδος που συγκεντρώνει την αναζήτησή του, με τη βοήθεια της διασταύρωσης, πάνω σε εκείνα τα στοιχεία των υπερεπιπέδων τα οποία έχουν κατά μέσο όρο παράγει τα άτομα με την καλύτερη απόδοση. Με το πέρασμα των γενεών η αναζήτηση εστιάζεται όλο και περισσότερο σε συγκεκριμένες περιοχές καθώς ο πληθυσμός συγκλίνει. Η σύγκλιση του πληθυσμού προκαλείται αναπόφευκτα διότι ο βαθμός διαφοροποίησης που χρησιμοποιείται για την παραγωγή της επόμενης γενεάς περιορίζεται από το βαθμό διαφοροποίησης του τρέχοντος πληθυσμού. Αυτό το φαινόμενο προκύπτει από το γεγονός ότι εάν δύο γονείς ανήκουν στο ίδιο σχήμα τότε και οι απόγονοί τους θα ανήκουν στο σχήμα αυτό. Εάν ένα συγκεκριμένο σχήμα προσδίδει υψηλές τιμές απόδοσης στις συμβολοσειρές που ανήκουν σε αυτό, τότε υπάρχει μεγάλη πιθανότητα ο 29
πληθυσμός να συγκλίνει στα δυαδικά ψηφία του σχήματος που έχουν καθορισμένες τιμές. Φυσικά, όταν ο αλγόριθμος ολοκληρωθεί, όλα τα άτομα του πληθυσμού θα ανήκουν σε αυτό το σχήμα. Πρακτικά, αυτό σημαίνει ότι καθώς ο πληθυσμός συγκλίνει, η αναζήτηση περιορίζεται όλο και περισσότερο σε μικρότερα κομμάτια του χώρου αναζήτησης. Στο σημείο αυτό είναι χρήσιμο να γίνει σύγκριση ανάμεσα στη διασταύρωση και τη μετάλλαξη όσον αφορά το πώς επηρεάζουν την αναζήτηση ενός ΓΑ. Ενώ η μετάλλαξη προκαλεί διαφοροποιήσεις στον πληθυσμό με τυχαία εναλλαγή των δυαδικών ψηφίων των ατόμων του, η διασταύρωση περιορίζεται στην παραγωγή διαφορετικών τιμών μόνο για τις θέσεις εκείνες για τις οποίες ο πληθυσμός δεν έχει ακόμα συγκλίνει. Έτσι η διασταύρωση, και κυρίως οι δυαδικές εκδοχές της, μπορούν να θεωρηθούν ως μία μορφή προσαρμοστικής μετάλλαξης ή ελεγχόμενης από το βαθμό σύγκλισης διαφοροποίησης (convergence-controlled variation, CCV). Η επίσημη εξήγηση του τρόπου λειτουργίας των ΓΑ αναφέρεται συχνά ως υπόθεση των μπλοκ οικοδόμησης (building block hypothesis). Σύμφωνα με αυτή τη θεωρία, οι ΓΑ λειτουργούν συνδυάζοντας μικρά μπλοκ οικοδόμησης και δημιουργώντας μεγαλύτερα. Η διαισθητική ιδέα που κρύβεται πίσω από τη διασταύρωση είναι το ότι με το συνδυασμό χαρακτηριστικών (ή μπλοκ οικοδόμησης) από δύο καλούς γονείς η διασταύρωση θα παράγει συνήθως ακόμα καλύτερους απογόνους. Για παράδειγμα, μία μητέρα η οποία έχει γονίδια για κοφτερά δόντια και ένας πατέρας ο οποίος έχει γονίδια για κοφτερά νύχια είναι σχεδόν σίγουρο ότι θα παράγουν κάποιους απογόνους οι οποίοι θα έχουν και τα δύο αυτά χαρακτηριστικά. Στην πραγματικότητα τα μπλοκ οικοδόμησης είναι τα σχήματα στα οποία έγινε αναφορά στις προηγούμενες παραγράφους. Η επιλογή κάθε τελεστή διασταύρωσης από αυτούς που έχουν προταθεί κατά καιρούς εμπεριέχει το δικό της κίνδυνο για απώλεια χρήσιμων χαρακτηριστικών. Για παράδειγμα, ο τελεστής ομοιόμορφης διασταύρωσης κάνει εντονότερη διασταύρωση από τον τελεστή διπλού σημείου όμως είναι περισσότερο διασπαστικός. Στην αρχική ανάλυση του Holland η εξισορρόπηση ανάμεσα στη διατήρηση των καλών σχημάτων και την εφαρμογή έντονης διασταύρωσης ικανοποιείται με τη χρήση ενός τελεστή διασταύρωσης τμημάτων, όπως για παράδειγμα του τελεστή διασταύρωσης μονού ή διπλού σημείου, και θεωρώντας ότι τα σημαντικά μπλοκ οικοδόμησης έχουν μικρό καθορισμένο μήκος. 30
Δυστυχώς, για τους τύποι των προβλημάτων για τους οποίους οι ΓΑ υποτίθεται ότι είναι ιδανικοί - προβλήματα τα οποία είναι πολύπλοκα χωρίς ανιχνεύσιμη αναλυτική λύση - δεν υπάρχει απολύτως κανένας λόγος για να θεωρηθεί εκ των προτέρων ότι το πρόβλημα θα μπορέσει να αναπαρασταθεί με τέτοιο τρόπο ώστε τα σημαντικά μπλοκ οικοδόμησης θα έχουν μικρό καθορισμένο μήκος. Για την αντιμετώπιση αυτού του προβλήματος ο Holland πρότεινε έναν τελεστή αντιστροφής ο οποίος μπορούσε να αναδιατάξει τις θέσεις στη συμβολοσειρά και έτσι να καταλήξει σε μία αναπαράσταση η οποία να έχει μπλοκ οικοδόμησης με μικρά καθορισμένα μήκη. Ο τελεστής αντιστροφής όμως στην πράξη, δεν έχει αποδειχθεί αρκετά αποδοτικός στην επανακωδικοποίηση των συμβολοσειρών. Για την αντιμετώπιση αυτού του προβλήματος, ο Goldberg πρότεινε ένα νέο είδος ΓΑ τους οποίους ονόμασε «ακατάστατους ΓΑ» (messy GAs). Η έννοια της παραπλάνησης (deception) αναφέρθηκε για πρώτη φορά από τον Goldberg (1987). Θεωρώντας δύο ασύμβατα σχήματα Α και Β, ένα πρόβλημα είναι παραπλανητικό εάν η μέση απόδοση του Α είναι μεγαλύτερη από τη μέση απόδοση του Β και όμως στο Β υπάρχει ένα άτομο το οποίο έχει απόδοση μεγαλύτερη από όλα τα άτομα που ανήκουν στο σχήμα Α. Πρακτικά, αυτό σημαίνει ότι τα χαμηλότερης τάξης μπλοκ οικοδόμησης οδηγούν τον ΓΑ μακριά από τη βέλτιστη λύση. Για παράδειγμα, έστω ένα πρόβλημα το οποίο αποτελείται από τμήματα των πέντε δυαδικών ψηφίων για καθένα από τα οποία η απόδοσή του υπολογίζεται ως εξής (Liepins και Vose 1991): Για κάθε δυαδικό ψηφίο που ισούται με 1 το τμήμα λαμβάνει ένα πόντο - οπότε συνολικά πέντε πόντους εάν όλα τα δυαδικά ψηφία ισούνται με 1 - ενώ εάν όλα τα δυαδικά ψηφία ισούνται με 0 λαμβάνει μία τιμή μεγαλύτερη από το πέντε. Για προβλήματα όπου η τιμή του βέλτιστου βρίσκεται ανάμεσα στο πέντε και το οκτώ το πρόβλημα είναι πλήρως παραπλανητικό. Η συνολική απόδοση προκύπτει από το άθροισμα των αποδόσεων όλων των επί μέρους τμημάτων. Εάν το πρόβλημα αναπαριστάται με τέτοιο τρόπο ώστε οι θέσεις των στοιχείων που καθορίζουν τα μπλοκ οικοδόμησης να είναι κοντά το ένα με το άλλο μέσα στη συμβολοσειρά, ικανοποιείται η αρχική άποψη του Holland ότι τα σημαντικά μπλοκ οικοδόμησης πρέπει να έχουν μικρό καθορισμένο μήκος. Σ αυτήν την περίπτωση ο ΓΑ θα μπορέσει να εκμεταλλευτεί όλη τη χρήσιμη πληροφορία χρησιμοποιώντας τελεστή διασταύρωσης μονού ή διπλού σημείου τα μπλοκ οικοδόμησης θα έχουν μικρή πιθανότητα να καταστραφούν ενώ θα μπορέσουν να συνδυαστούν αποδοτικά με τα άλλα 31