Θεµελίωση Γενετικών Αλγορίθµων Σηµερινό Μάθηµα Προβληµατισµοί Σχήµατα Τάξη Οριστικό Μήκος ΘεώρηµατωνΣχηµάτων Υπόθεση δοµικών Στοιχείων Πλάνη 1
Προβληµατισµοί Τι προβλέψεις µπορούν να γίνουν για τη χρονική εξέλιξη και για τη δυναµική των δοµών του πληθυσµού σε ένα συγκεκριµένο ΓA; Πώς οι τελεστές χαµηλού επιπέδου (επιλογή, διασταύρωση και µετάλλαξη) βελτιώνουν την µακροσκοπική συµπεριφορά των ΓA; Σε τι τύπους προβληµάτων οι ΓA αποδίδουν καλά; Σε τι τύπους προβληµάτων οι ΓA δεν αποδίδουν καλά; Τι κριτήρια απόδοσης είναι κατάλληλα; Κάτω από ποιες συνθήκες ένας ΓA υπερτερεί από τις συµβατικές µεθόδους αναζήτησης; Παραδοσιακή θεωρία ΓΑ Οι ΓA δουλεύουν ανασυνδυάζοντας «καλά δοµικά στοιχεία» λύσεων, µεένατρόπουψηλού παραλληλισµού (Holland) Η βασική ιδέα είναι ότι οι καλές λύσεις τείνουν να δηµιουργηθούν από καλά δοµικά στοιχεία Τα δοµικά στοιχεία είναι συνδυασµοί τµηµάτων συµβολοσειρών τα οποία προσδίδουν µεγαλύτερη απόδοση στις συµβολοσειρές στις οποίες παραβρίσκονται. Ο Holland εισήγαγε πρώτος την ονοµασία σχήµατα, γιανατυποποιήσειτηνάτυπη ονοµασία των «δοµικών στοιχείων» 2
Σχήµατα Ηθεωρητικήθεµελίωση των ΓA βασίζεται στην αναπαράσταση των λύσεων ως δυαδικών συµβολοσειρών, και στην έννοια του σχήµατος Το σχήµαείναιέναπρότυπο(template) που επιτρέπει τον προσδιορισµότηςοµοιότητας µεταξύ των χρωµοσωµάτων Ένα σχήµα κατασκευάζεται εισάγοντας ένα αδιάφορο σύµβολο (*) στο αλφάβητο των γονιδίων Ένα σχήµα αναπαριστά όλες τις συµβολοσειρές οι οποίες ταιριάζουν σε όλες τις θέσεις εκτός από αυτές που περιέχουν το αδιάφορο σύµβολο Σχήµατα - Παράδειγµα Στο σχήµα (*111100100) ταιριάζουν οι δύο συµβολοσειρές: {(0111100100), (1111100100)} Ενώ το σχήµα (**********) αναπαριστά όλες τις συµβολοσειρές µήκους 10 3
Σχήµατα Κάθε σχήµααναπαριστά2 r συµβολοσειρές, όπου r είναι ο αριθµός των αδιάφορων συµβόλων * στο σχήµα Κάθε συµβολοσειρά µήκους m ταιριάζει σε 2 m διαφορετικά σχήµατα Το πλήθος των αδιάφορων συµβόλων * σε ένα σχήµακαθορίζειτοναριθµότων συµβολοσειρών που ταιριάζουν σε αυτό το σχήµα. Σχήµατα - Παράδειγµα Ησυµβολοσειρά (1001110001) ταιριάζει στα ακόλουθα 2 10 σχήµατα: (100111000) (*001110001) (1*01110001) (10*1110001) (100111000*) (**01110001) (*0*1110001) (10011100**) (***1110001) (**********) 4
Τάξη και Οριστικό Μήκος Υπάρχουν δύο σηµαντικά µεγέθη που χαρακτηρίζουν τα σχήµατα: η τάξηκαι το οριστικό µήκος Ητάξηενόςσχήµατος S (ο(s)) είναι ο αριθµός των θέσεων µε 0 και 1, που καλούνται και σταθερές θέσεις (fixed positions) Η τάξη προσδιορίζει την ειδικότητα ενός σχήµατος Ητάξηενόςσχήµατος χρησιµεύει στον υπολογισµό της πιθανότητας επιβίωσης του σχήµατος κατά τη µετάλλαξη. Τάξη και Οριστικό Μήκος Το οριστικό µήκος ενός σχήµατος S (δ(s)) είναι η απόσταση µεταξύ της πρώτης και της τελευταίας σταθερής θέσης. Προσδιορίζει την πυκνότητα (compactness) της πληροφορίας Η έννοια του οριστικού µήκους ενός σχήµατος είναι χρήσιµηστον υπολογισµότηςπιθανότητας επιβίωσης του σχήµατος κατά τη διασταύρωση 5
ΘεώρηµατωνΣχηµάτων (Schema Theorem) Σχήµατα άνω του µέσου όρου απόδοσης, µε µικρό οριστικό µήκος και µικρή τάξη λαµβάνουν εκθετικά αυξανόµενες συµβολοσειρές σε διαδοχικές γενιές ενός Γενετικού Αλγορίθµου Εξέλιξη του ΓΑ Η διαδικασία εξέλιξης ενός Γ.Α. αποτελείται από τέσσερα επαναλαµβανόµενα βήµατα: 1) t t+1 2) επέλεξε νέο πληθυσµό P(t+1) από τον P( 3) ανασυνδύασε τον 4) αξιολόγησε τον 6
Επίδραση της επιλογής Ορίζουµεωςξ(S, τον αριθµός των συµβολοσειρών στον πληθυσµότηστιγµή t που ταιριάζουν στο σχήµα S παράδειγµα για το σχήµα S 0 = (****111************************** ) στο παράδειγµα του προηγ. µαθήµατος είναι ξ(s 0, = 3 Αρχικός Πληθυσµός v 1 = (100110100000001111111010011011111) v 2 = (111000100100110111001010100011010) v 3 = (000010000011001000001010111011101) v 4 = (100011000101101001111000001110010) v 5 = (000111011001010011010111111000101) v 6 = (000101000010010101001010111111011) v 7 = (001000100000110101111011011111011) v 8 = (100001100001110100010110101100111) v 9 = (010000000101100010110000001111100) v 10 = (000001111000110000011010000111011) v 11 = (011001111110110101100001101111000) v 12 = (110100010111101101000101010000000) v 13 = (111011111010001000110000001000110) v 14 = (010010011000001010100111100101001) v 15 = (111011101101110000100011111011110) v 16 = (110011110000011111100001101001011) v 17 = (011010111111001111010001101111101) v 18 = (011101000000001110100111110101101) v 19 = (000101010011111111110000110001100) v 20 = (101110010110011110011000101111110) 7
Επίδραση της επιλογής Η απόδοσή του σχήµατος τη στιγµή t ορίζεται ως η µέση απόδοση όλων των συµβολοσειρών του πληθυσµού τη στιγµή t που ταιριάζουν µετοσχήµα S. Έστω p συµβολοσειρές: eval( S, = ( p j= 1 eval( v i )) / p j Επίδραση της επιλογής Μετά την επιλογή, αναµένεται ότι θα ταιριάζουν µετο σχήµαξ(s,t+1) συµβολοσειρές, επειδή: 1. για µια συµβολοσειρά που ταιριάζει µετοσχήµα S, ηπιθανότηταεπιλογήςτηςείναιeval (S, /F(, 2. οαριθµός των συµβολοσειρών που ταιριάζουν µετο σχήµα S είναι ξ(s, 3. οαριθµόςτωνεπιλογώνσεκάθεβήµαείναι pop_size ξ ( S, t + 1) = ξ ( S, pop _ size eval( S, / F( ή ξ ( S, t + 1) = ξ ( S, eval( S, / F( 8
Τελικός Πληθυσµός ξ(s,t+1)=4,19 v1 = (011001111110110101100001101111000) v2 = (100011000101110000100011111011110) v3 = (001000100000110101111011011111011) v4 = (011001111110010101100001101111000) v5 = (000101010011111111110000110001100) v6 = (100011000101101001111000001110010) v7 = (111011101101110000100011111011110) v8 = (000111011001010011010111111000101) v9 = (011001111110110101100001101111000) v10 = (000010000011001000001010111011101) v11 = (111011101101101001011000001110010) v12 = (010000000101100010110000001111100) v13 = (000101000010010101000100001000111) v14 = (100001100001110100010110101100111) v15 = (101110010110011110011000101111110) v16 = (100110100000001111111010011011111) v17 = (000001111000110000011010000111011) v18 = (111011111010001000111010111111011) v19 = (111011100101110000100011111011110) v20 = (110011110000011111100001101001011) Επίδραση της επιλογής Οαριθµός των συµβολοσειρών στον πληθυσµό που ταιριάζει στο σχήµα, αυξάνεται ανάλογα µετολόγοτης απόδοσης του αντίστοιχου σχήµατος προς την µέση απόδοση του πληθυσµού. Η διαδικασία της επιλογής δεν εισάγει νέες πιθανές λύσεις στον πληθυσµό. Απλά, αντιγράφει κάποιες συµβολοσειρές για το σχηµατισµόενός προσωρινού πληθυσµού. 9
Επίδραση των γενετικών τελεστών διασταύρωση-παράδειγµα Έστω τα σχήµατα S 0 =(****111**************************) S 1 =(111****************************10) Ζευγαρώνουν τα v 13 και v 18 και επιλέχθηκε, ως σηµείο διασταύρωσης, pos = 20: v 13 = (00010100001001010100 1010111111011) v 18 =(11101111101000100011 0000001000110) δίνει v 13 = (00010100001001010100 0000001000110) v 18 =(11101111101000100011 1010111111011) Επίδραση των γενετικών τελεστών διασταύρωση Το οριστικό µήκος ενός σχήµατος παίζει καθοριστικό ρόλο για την επιβίωση του. Η πιθανότητα καταστροφής του είναι: δ ( S) p d ( S ) = m 1 Το σηµείο διασταύρωσης επιλέγεται οµοιόµορφα από m-1 πιθανά σηµεία. Η πιθανότητα επιβίωσης ενός σχήµατος S είναι: δ ( S) ps ( S) = 1 pd ( S) = 1 m 1 10
Επίδραση των γενετικών τελεστών διασταύρωση Όµως, η διασταύρωση έχει µια πιθανότητα p c να εκτελεστεί, η πιθανότητα επιβίωσης ενός σχήµατος είναι: δ ( S) ps ( S) = 1 pc m 1 Αν το σηµείο διασταύρωσης επιλεχθεί ανάµεσα σε σταθερές θέσεις σε ένα σχήµα, υπάρχει ακόµα πιθανότητα να επιβιώσει και συνεπώς : p ( S) 1 p s c δ ( S) m 1 Επίδραση επιλογής & διασταύρωσης Η επίδραση της επιλογής και της διασταύρωσης στην αύξηση του αριθµού των συµβολοσειρών είναι: ξ ( S, t + 1) ξ ( S, δ ( S) ( eval( S, / F( ) 1 p c m 1 Συνεπώς, τα άνω του µέσου όρου σχήµατα µε µικρό οριστικό µήκος θα δειγµατοληπτούνται µεεκθετικά αυξανόµενους ρυθµούς 11
Επίδραση των γενετικών τελεστών µετάλλαξη - παράδειγµα Έστω το από το παράδειγµα µας το άτοµο: v 19 =(111011101101110000100011111011110) Και το σχήµα: S 0 =(****111**************************) Το άτοµο µας µεταλλάχθηκε στην ένατη θέση v 19 =(111011101101110000100011111011110 ) Επίδραση των γενετικών τελεστών µετάλλαξη η πιθανότητα επιβίωσης ενός σχήµατος κατά την όλη διαδικασία της µετάλλαξης είναι: p ( S) = (1 s p m Επειδή, όµως, p m <<1: p ( S) 1 o( S) ) o( S ) s p m 12
Θεώρηµατωνσχηµάτων Οσυνδυασµός των αποτελεσµάτων για την επιλογή, τη διασταύρωση και την µετάλλαξη: δ ( S) ( eval( S, / F( ) 1 p o( S p ξ ( S, t 1) ξ ( S, c ) m 1 + m Σχήµατα άνω του µέσου όρου απόδοσης, µε µικρό οριστικό µήκος και µικρή τάξη λαµβάνουν εκθετικά αυξανόµενες συµβολοσειρές σε διαδοχικές γενιές ενός Γενετικού Αλγορίθµου. Υπόθεση δοµικών Στοιχείων Ένας Γενετικός Αλγόριθµος αναζητεί απόδοση κοντά στο βέλτιστο, τοποθετώντας δίπλα δίπλα µικρού µήκους, χαµηλής τάξης και υψηλής απόδοσης σχήµατα, που ονοµάζονται δοµικά στοιχεία Η υπόθεση προϋποθέτει ότι το πρόβληµα της κωδικοποίησης για ένα ΓA είναι κρίσιµο για την απόδοσή του και ότι µια τέτοια κωδικοποίηση θα έπρεπε να ικανοποιεί την ιδέα των δοµικών στοιχείων µικρού µήκους 13
«πλάνη» Συµβαίνει όταν µερικά δοµικά σχήµατα (µικρού µήκους, χαµηλής τάξης σχήµατα) µπορούν να παρασύρουν το ΓA και να τον αναγκάσουν να συγκλίνει σε υποβέλτιστα σηµεία Έχουν προταθεί τρεις προσεγγίσεις που ασχολούνται µετην«πλάνη» Πρώτη προσέγγιση Προϋποθέτει εκ των προτέρων γνώση της αντικειµενικής συνάρτησης για να κωδικοποιηθεί µε κατάλληλο τρόπο. Για παράδειγµα, µπορεί να οδηγήσει σε διαφορετική κωδικοποίηση, όπου τα έξι ψηφία που απαιτούνται για τη βελτιστοποίηση της συνάρτησης είναι γειτονικά, αντί να είναι σε έξι χωριστές θέσεις. 14
εύτερη προσέγγιση Χρησιµοποιεί τον τρίτο γενετικό τελεστή, την αντιστροφή: επιλέγει δύο σηµεία µέσα σε µια συµβολοσειρά και αντιστρέφει την τάξη των ψηφίων µεταξύ των επιλεγµένων σηµείων, αλλά θυµάται τη «σηµασία» του ψηφίου. Παράδειγµα: s = ((1, 0), (2, 0), (3, 0) (4, 1), (5, 1), (6, 0), (7, 1) (8, 0), (9, 0), (10, 0), (11, 1)) s = ((1, 0), (2, 0), (3, 0) (7, 1), (6, 0), (5, 1), (4, 1) (8, 0), (9, 0), (10, 0), (11, 1)) Γενικά ο τελεστής αυτός έχει αυξηµένη πολυπλοκότητα και η επιτυχής εφαρµογή του είναι περιορισµένη. Τρίτη προσέγγιση Η τρίτη προσέγγιση για την εξουδετέρωση της «πλάνης», προτάθηκε σχετικά πρόσφατα και είναι η υλοποίηση ένος «ακατάστατου» (messy) Γενετικού Αλγορίθµου. 15
Aσκήσεις Άσκηση 1 Έξι συμβολοσειρές έχουν τις ακόλουθες τιμές της αντικειμενικής συνάρτησης: 5, 10, 15, 25, 50, 100. Κάνοντας χρήση της εξαναγκασμένης ρουλέτας, να υπολογίσετε τον αναμενόμενο αριθμό αντιγράφων κάθε συμβολοσειράς στο νέο πληθυσμό, ανσεκάθεγενιάδιατηρείται έναςσταθερός πληθυσμός μεγέθους n=6. Άσκηση 2 Έστω ότι θέλουμε να ελαχιστοποιήσουμε τη συνάρτηση f(x)=x 2 +5x+3 όπου το x ανήκει στο διάστημα [0, 63]. Πόσα δυαδικά ψηφία θα χρειαστούν για να κωδικοποιηθούν όλες οι πιθανές ακέραιες τιμές του x στο διάστημα 0 έως 63; Άσκηση 3 Έστω ότι θέλετε να υλοποιήσετε ένα Γ.Α., ο οποίος από ένα πληθυσμό 100 ατόμων θα ξεχωρίζει εκείνο το χρωμόσωμα (μήκους 100), το οποίο περιέχει τους περισσότερους άσους. Ποια αντικειμενική συνάρτηση θα χρησιμοποιήσετε; 16