ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΓΕΝΕΤΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΓΕΝΕΤΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΓΕΝΕΤΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ ΓΙΑ ΡΥΘΜΙΣΗ ΜΕΘΟ ΟΥ ΕΚΤΙΜΗΣΗΣ ΚΟΣΤΟΥΣ ΜΕ ΑΝΑΛΟΓΙΕΣ Πτυχιακή Εργασία του ηµητρίου Μήλιου (ΑΕΜ: 932) Επιβλέπων Καθηγητής: Ιωάννης Σταµέλος - Θεσσαλονίκη

2 2

3 3 ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΙΚΑ ΕΚΤΙΜΗΣΗ ΚΟΣΤΟΥΣ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΚΤΙΜΗΣΗ ΚΟΣΤΟΥΣ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ ΣΤΗΝ ΕΚΤΙΜΗΣΗ ΚΟΣΤΟΥΣ Η ΜΕΘΟ ΟΣ ΤΩΝ ΑΝΑΛΟΓΙΩΝ ΑΝΑΛΥΣΗ ΣΕ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΟΜΟΙΟΤΗΤΑΣ ΘΕΜΑΤΑ ΥΠΟΛΟΓΙΣΜΟΥ ΤΗΣ ΑΠΟΣΤΑΣΗΣ ΕΞΑΓΩΓΗ ΤΕΛΙΚΗΣ ΕΚΤΙΜΗΣΗΣ ΤΟ ΠΡΟΒΛΗΜΑ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ ΤΗΣ ΜΕΘΟ ΟΥ ΤΩΝ ΑΝΑΛΟΓΙΩΝ ΠΕΡΙΓΡΑΦΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΠΡΟΣΠΑΘΕΙΕΣ ΓΙΑ ΛΥΣΗ ΓΕΝΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΓΕΝΕΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΒΙΟΛΟΓΙΚΗ ΘΕΜΕΛΙΩΣΗ ΒΑΣΙΚΕΣ ΈΝΝΟΙΕΣ ΥΝΑΤΟΤΗΤΕΣ ΚΑΙ Α ΥΝΑΜΙΕΣ Ο ΒΑΣΙΚΟΣ ΓΕΝΕΤΙΚΟΣ ΑΛΓΟΡΙΘΜΟΣ ΚΩ ΙΚΟΠΟΙΗΣΗ ΛΥΣΕΩΝ ΕΠΙΛΟΓΗ ΓΟΝΕΩΝ ΙΑΣΤΑΥΡΩΣΗ ΚΑΙ ΜΕΤΑΛΛΑΞΗ ΧΡΩΜΟΣΩΜΑΤΩΝ ΘΕΜΑΤΑ ΣΥΓΚΛΙΣΗΣ ΑΝΑΛΥΣΗ ΛΕΙΤΟΥΡΓΙΑΣ ΣΧΗΜΑΤΑ ΚΑΙ Ι ΙΟΤΗΤΕΣ ΤΟ ΘΕΩΡΗΜΑ ΤΩΝ ΣΧΗΜΑΤΩΝ Η ΥΠΟΘΕΣΗ ΤΩΝ ΟΜΙΚΩΝ ΜΟΝΑ ΩΝ ΤΟ ΠΡΟΒΛΗΜΑ ΤΗΣ ΚΩ ΙΚΟΠΟΙΗΣΗΣ ΠΑΡΑΛΛΑΓΕΣ ΓΕΝΕΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ ΕΛΙΤΙΣΜΟΣ ΠΡΟΣΑΡΜΟΣΤΙΚΟΙ ΓΕΝΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΑΝΑΠΑΡΑΓΩΓΗ ΣΕ ΕΙ ΙΚΑ ΠΡΟΒΛΗΜΑΤΑ ΚΩ ΙΚΟΠΟΙΗΣΗ ΜΕ ΠΡΑΓΜΑΤΙΚΕΣ ΤΙΜΕΣ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΤΗΣ ΜΕΘΟ ΟΥ ΤΩΝ ΑΝΑΛΟΓΙΩΝ ΠΡΟΣΑΡΜΟΓΗ ΣΤΟ ΠΡΟΒΛΗΜΑ ΤΩΝ ΑΝΑΛΟΓΙΩΝ ΑΝΤΙΣΤΟΙΧΗΣΗ ΛΥΣΕΩΝ ΣΕ ΆΤΟΜΑ ΑΞΙΟΛΟΓΗΣΗ ΛΥΣΕΩΝ ΚΑΤΑΣΚΕΥΗ ΓΕΝΕΤΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ...44

4 ΠΟΛΙΤΙΚΗ ΕΠΙΛΟΓΗΣ ΚΩ ΙΚΟΠΟΙΗΣΗ ΣΕ ΥΑ ΙΚΕΣ ΑΚΟΛΟΥΘΙΕΣ ΑΝΑΠΑΡΑΓΩΓΗ ΚΑΙ ΑΝΑΝΕΩΣΗ ΤΟΥ ΠΛΗΘΥΣΜΟΥ ΈΛΕΓΧΟΣ ΣΥΓΚΛΙΣΗΣ ΚΑΙ ΤΕΡΜΑΤΙΣΜΟΣ ΕΝΑΛΛΑΚΤΙΚΗ ΚΩ ΙΚΟΠΟΙΗΣΗ ΣΥΝΤΕΛΕΣΤΩΝ ΒΑΡΥΤΗΤΑΣ ΤΟ ΠΡΟΒΛΗΜΑ ΤΗΣ ΚΑΝΟΝΙΚΟΠΟΙΗΣΗΣ ΙΑΝΥΣΜΑΤΑ ΚΩ ΙΚΟΠΟΙΗΜΕΝΑ ΜΕ ΠΡΑΓΜΑΤΙΚΕΣ ΤΙΜΕΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΑΠΟ ΥΠΕΡΣΦΑΙΡΙΚΕΣ ΣΥΝΤΕΤΑΓΜΕΝΕΣ ΣΧΕ ΙΑΣΗ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΡΥΘΜΙΣΗ ΜΕΘΟ ΟΥ ΑΝΑΛΟΓΙΩΝ ΓΕΝΙΚΗ ΘΕΩΡΗΣΗ ΣΧΕ ΙΑΣΗΣ ΕΝΟΤΗΤΕΣ ΛΟΓΙΣΜΙΚΟΥ ΚΛΑΣΕΙΣ ΓΕΝΕΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ ΚΑΙ ΠΑΡΑΜΕΤΡΟΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΣΥΣΤΑΤΙΚΩΝ ΓΕΝΕΤΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ ΆΤΟΜΑ ΚΑΙ ΠΛΗΘΥΣΜΟΙ ΣΥΝΑΡΤΗΣΕΙΣ ΚΑΤΑΛΛΗΛΟΤΗΤΑΣ ΙΑ ΙΚΑΣΙΕΣ ΕΠΙΛΟΓΗΣ ΙΑ ΙΚΑΣΙΕΣ ΑΝΑΠΑΡΑΓΩΓΗΣ...77 ΠΑΡΑΡΤΗΜΑ Α - ΑΠΟ ΕΙΞΗ ΘΕΩΡΗΜΑΤΟΣ ΣΧΗΜΑΤΩΝ...81 ΠΑΡΑΡΤΗΜΑ Β - ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΒΑΣΗΣ Ε ΟΜΕΝΩΝ ALBRECHT..83 ΒΙΒΛΙΟΓΡΑΦΙΑ...85

5 5 Εισαγωγικά Η εκτίµηση κόστους έργων λογισµικού αποτελεί σηµαντικό εργαλείο για την τεχνολογία λογισµικού. Η εκ των προτέρων πληροφορία για την πορεία ανάπτυξης ενός έργου πληροφορικής µπορεί να επηρεάσει την κατανοµή των πόρων που θα διατεθούν για την υλοποίησή του. Η δε ακρίβεια της εκτίµησης είναι κρίσιµη για την όλη οργάνωση της διαδικασίας σχεδιασµού και ανάπτυξης του έργου. Τα µέχρι τώρα αποτελέσµατα στην προσπάθεια εκτίµησης του κόστους επιδέχονται βελτίωση. Ο λόγος είναι η αντικειµενική δυσκολία να µοντελοποιηθούν όλες εκείνες οι παράµετροι που επηρεάζουν την εξέλιξη ενός έργου λογισµικού. Συνεπώς, στο εν λόγω πεδίο υπάρχουν πολλά περιθώρια για νέα έρευνα, κυρίως προς την κατεύθυνση της βελτιστοποίησης των υπαρχουσών µεθόδων εκτίµησης. Σε αυτόν ακριβώς τον τοµέα κινείται η παρούσα εργασία, και συγκεκριµένα εστιάζει στη βελτιστοποίηση της µεθόδου των αναλογιών. Για την εκτίµηση κόστους µε αναλογίες, η ακρίβεια της πρόβλεψης επηρεάζεται από ένα σύνολο παραµέτρων. Η διαδικασία ρύθµισης της µεθόδου συνίσταται στην εύρεση των παραµέτρων για τις οποίες η απόδοση µεγιστοποιείται. Αντικείµενο της εργασίας είναι η κατασκευή σε θεωρητικό επίπεδο ενός µοντέλου προς επίλυση του εν λόγω προβλήµατος. Συγκεκριµένα, προτείνεται η χρήση γενετικών αλγορίθµων, µέθοδος που ενδείκνυνται για προβλήµατα βελτιστοποίησης µε µεγάλους χώρους λύσεων, ειδικά όταν δεν είναι δυνατό να χρησιµοποιηθούν ευριστικές µέθοδοι αναζήτησης. Όσον αφορά την παρούσα προσέγγιση, καινοτόµα θεωρούνται χαρακτηριστικά όπως η ταυτόχρονη αναζήτηση για βέλτιστες παραµέτρους εκτέλεσης και µεταβλητές έργων. Ακόµη, εισάγεται µια ιδιαίτερη κωδικοποίηση χρωµοσωµάτων η οποία διατηρεί τις ιδιότητες των κανονικοποιηµένων διανυσµάτων. Στη συνέχεια της εργασίας εξηγούνται επαρκώς οι παραπάνω έννοιες και µεθοδολογίες. Το πρώτο κεφάλαιο εισάγει τον αναγνώστη στο πεδίο της εκτίµησης κόστους έργων λογισµικού, εστιάζοντας στην εκτίµηση µε τη µέθοδο των αναλογιών. Σκοπός είναι η ανάδειξη του προβλήµατος, αλλά και η κατανόηση των λεπτοµερειών και των ιδιαιτεροτήτων του. Τα βασικά στοιχεία της δοµής και της λειτουργίας των γενετικών αλγορίθµων περιγράφονται στο δεύτερο κεφάλαιο, προκειµένου να είναι κατανοήσιµη η προσπάθεια σχεδιασµού του µοντέλου επίλυσης που προτείνεται. Στο τρίτο κεφάλαιο, µετά την απόκτηση γνώσης για το πρόβληµα αλλά και για τη µεθοδολογία επίλυσης, τεκµηριώνεται η επιλογή δοµών και αλγορίθµων που απαιτούνται για την υλοποίηση του κατάλληλου γενετικού αλγορίθµου. Ουσιαστικά, επιλύεται το πρόβληµα σε θεωρητικό επίπεδο. Η εργασία καταλήγει στο σχεδιασµό συστήµατος για τη ρύθµιση της µεθόδου των αναλογιών, χωρίς ωστόσο να καταπιάνεται µε θέµατα υλοποίησης. Στο τελευταίο µέρος εκπονείται σχέδιο της στατικής συµπεριφοράς του συστήµατος, το οποίο θα αποτελέσει και τη βάση για την ανάπτυξη του σχετικού λογισµικού. Η µοντελοποίηση αφορά µόνο τις δοµές που συνιστούν τα κύρια συστατικά του προτεινόµενου γενετικού αλγορίθµου, και όχι τις ιδιαιτερότητες για την προσαρµογή ως υποσύστηµα σε ένα εργαλείο εκτίµησης κόστους µε αναλογίες.

6 6

7 7 Κεφάλαιο πρώτο: ΕΚΤΙΜΗΣΗ ΚΟΣΤΟΥΣ Η παρούσα εργασία ασχολείται µε τη βελτιστοποίηση της µεθόδου των αναλογιών για την εκτίµηση κόστους έργων λογισµικού. Για να κατανοηθεί όµως η λειτουργία της µεθόδου και τα περιθώρια βελτιστοποίησης αυτής, θα πρέπει ο αναγνώστης να είναι εξοικειωµένος µε την έννοια της εκτίµησης κόστους. Το τρέχον κεφάλαιο αποτελεί µια εισαγωγή στις παραπάνω έννοιες. Στην αρχή, αναδεικνύεται το πρόβληµα της εκτίµησης του κόστους νέων έργων, και η σηµασία της επίλυσης του για τη βιοµηχανία λογισµικού. Στη συνέχεια παρουσιάζονται λύσεις που έχουν προταθεί, και γίνεται εστίαση στη µέθοδο των αναλογιών. Τέλος, µετά από περαιτέρω ανάλυση της µεθόδου, προκύπτει το συµπέρασµα ότι η απόδοση της τελευταίας εξαρτάται από την επιλογή των παραµέτρων για την εκτέλεσή της. Προσπαθώντας δηλαδή να κάνουµε εκτίµηση του κόστους, βρισκόµαστε αντιµέτωποι µε ένα νέο πρόβληµα. Στο τέλος του κεφαλαίου θα γίνει σαφές το πώς οι Γενετικοί Αλγόριθµοι µπορούν να φανούν χρήσιµοι σε µια διαδικασία εκτίµησης κόστους µε αναλογίες. 1.1 Εισαγωγή στην Εκτίµηση Κόστους Τα τελευταία χρόνια, το λογισµικό έχει γίνει το πιο ακριβό συστατικό των έργων πληροφορικής. Αναφερόµενοι στο κόστος, δεν εννοούµε απαραίτητα το ποσό των χρηµάτων που θα δαπανηθεί, αλλά κυρίως τη συνολική ανθρώπινη προσπάθεια, εκφρασµένη σε µια µονάδα όπως ανθρωποµήνες. Είναι αντιληπτό λοιπόν το πόσο κρίσιµη είναι η εκ των προτέρων γνώση του κόστους για τις εταιρείες ανάπτυξης λογισµικού, καθώς θα επηρεάσει την κατανοµή των ανθρώπινων πόρων. Αλλά, η εκτίµηση κόστους έργων λογισµικού είναι µια ανάγκη η οποία και γενικότερα στον κόσµο των επιχειρήσεων γίνεται ολοένα και πιο έντονη. Ο µεγάλος βαθµός διείσδυσης των πληροφοριακών συστηµάτων στις επιχειρήσεις έχει δηµιουργήσει την ανάγκη προσαρµογής των συστηµάτων αυτών, ώστε να ανταποκρίνονται στις ανάγκες της κάθε επιχείρησης ξεχωριστά. Η προσαρµογή συνεπάγεται την ανάπτυξη πρόσθετων υποσυστηµάτων ή και δηµιουργία νέων εργαλείων λογισµικού. Ακόµα και στις περιπτώσεις συστηµάτων ERP (Enterprise Resource Planning), των οποίων η υλοποίηση εξ αρχής περιλαµβάνει την προσαρµογή και ρύθµιση αυτών στις ανάγκες της επιχείρησης, πάντα θα υπάρχει η ανάγκη για ανάπτυξη εξειδικευµένων για την επιχείρηση εφαρµογών.

8 8 Κεφάλαιο πρώτο Ακόµη, η σωστή εκτίµηση του κόστους συµβάλλει στη συνεννόηση µεταξύ υπευθύνου ανάπτυξης και πελάτη. Η όποια πρόβλεψη µπορεί να χρησιµοποιηθεί για προτάσεις, διαπραγµατεύσεις, προγραµµατισµό ή και παρακολούθηση της πορείας του έργου. Είναι αντιληπτή πλέον, από πολλές σκοπιές, η κρισιµότητα της εκτίµησης του κόστους. Ενδεχόµενη υποεκτίµηση αυτού, οδηγεί στην έγκριση χαµηλών προϋπολογισµών, που συνεπάγονται χαµηλή ποιότητα αλλά και ρυθµό ανάπτυξης. Στην περίπτωση της υπερεκτίµησης καταλήγουµε στη δέσµευση υπερβολικά πολλών πόρων, επιφέροντας, σε τελική ανάλυση, και πάλι ζηµία. Το µέγεθος και η σηµασία του προβλήµατος καταδεικνύεται ακόµα περισσότερο αν θεωρήσουµε το ποσοστό αποτυχίας έργων πληροφορικής. Με τον όρο αποτυχία εννοούµε την τάση να ξεφεύγουν τα έργα από τον αρχικό τους προϋπολογισµό, γεγονός που µπορεί να οδηγήσει και στην ακύρωσή τους. Έχει εκτιµηθεί για παράδειγµα ότι το 90% των ERP έργων παραδίδονται αργά ή ξεπερνούν τις αρχικές προσδοκίες σε κόστος [1]. Οι κυριότερες αιτίες που οδηγούν σε αποτυχία είναι οι µεταβολές των προδιαγραφών στη διάρκεια του έργου, και οι ανακριβείς εκτιµήσεις του κόστους. Πράγµατι, τα περισσότερα µοντέλα πρόβλεψης είναι εξαιρετικά ανακριβή, και είναι προφανής η πρόκληση που καλείται να αντιµετωπίσει η τεχνολογία λογισµικού Βασικές έννοιες Πριν γίνει αναφορά στις κυριότερες µεθόδους εκτίµησης κόστους, είναι απαραίτητο ο αναγνώστης να εξοικειωθεί µε κάποιες βασικές έννοιες, ώστε να κατανοήσει τη λειτουργία των µεθόδων, αλλά και τη σύγκριση µεταξύ αυτών. Το αναµενόµενο κόστος ενός έργου µπορεί να εκφραστεί σε χρηµατικό κόστος, σε χρόνο διάρκειας του έργου ή και σε ανθρώπινη προσπάθεια, συνήθως σε ανθρωποµήνες. Η τελευταία προσέγγιση είναι που χρησιµοποιείται και από τις περισσότερες µεθόδους εκτίµησης, αλλά και από αυτή που παρουσιάζεται στην τρέχουσα εργασία. Όπως έχει γίνει ξεκάθαρο παραπάνω, η σωστή κατανοµή ανθρώπινων πόρων είναι ο κύριος στόχος µιας πρόβλεψης, οπότε είναι λογικό να θέλουµε η πρόβλεψη να αντικατοπτρίζει τη συνολική εµπλοκή ανθρώπινου δυναµικού. Άλλωστε, το χρηµατικό κόστος εύκολα συνήθως προκύπτει, εφόσον είναι γνωστός ο αριθµός των ανθρωποµηνών. Κάνοντας λόγο για ανθρώπινη προσπάθεια, αυτό περιλαµβάνει την ανάλυση απαιτήσεων, το σχεδιασµό, τη συγγραφή του κώδικα και τη φάση του ελέγχου. ραστηριότητες όπως ή ίδια η διοίκηση του έργου ή η επιβεβαίωση της ποιότητας του λογισµικού, πρέπει να ληφθούν και αυτές υπ όψιν. Στις µέχρι τώρα αναφορές στο µέγεθος του έργου, δεν έχουν αποσαφηνιστεί οι τρόποι µέτρησης αυτού. Ένα παράδειγµα τέτοιας µέτρησης αφορά τις γραµµές του πηγαίου κώδικα ενός προγράµµατος. Ωστόσο, αυτή η τεχνική µέτρησης παρουσιάζει µειονεκτήµατα, καθώς δεν είναι εύκολο να προβλεφθούν οι γραµµές κώδικα, ενώ η έκταση του κώδικα εξαρτάται και από το στυλ προγραµµατισµού.

9 Εκτίµηση Κόστους 9 Ένας άλλος, πιο αξιόπιστος, τρόπος µέτρησης του µεγέθους είναι οι Βαθµοί Λειτουργικότητας (Function Points). Η τεχνική παρέχει κανόνες για καταµέτρηση των εµφανίσεων πέντε τύπων συστηµάτων στα οποία το υπό ανάπτυξη σύστηµα αναλύεται. Για περισσότερες πληροφορίες για µέτρηση µεγέθους λογισµικού, ο αναγνώστης παραπέµπεται στη σχετική βιβλιογραφία [4]. Πριν κάνουµε λόγο για συγκεκριµένες µεθόδους εκτίµησης, πρέπει να οριστεί ένας τρόπος αξιολόγησης αυτών. Η προφανής λύση είναι η ακρίβεια της πρόβλεψης. Μένει όµως να καθοριστεί το πώς θα εκφραστεί η ακρίβεια αυτή. Έχουν προταθεί αρκετά κριτήρια για την αποδοτικότητα µεθόδων που εφαρµόζονται σε ένα περιβάλλον έργων. Το ευρύτερα αποδεκτό κριτήριο είναι το MMRE (Mean Magnitude Relative Error), δηλαδή µέσο µέγεθος σχετικού σφάλµατος. Ορίζεται ως ένα επί τοις εκατό ποσοστό της ανθρώπινης προσπάθειας που δαπανήθηκε για το έργο: Όπου E i η πραγµατική προσπάθεια σε ανθρωποµήνες για το i-οστό έργο, και Ê i η αντίστοιχη εκτιµώµενη τιµή. Μια αποδεκτή τιµή για το MMRE είναι το 25%, που σηµαίνει ότι η ανθρώπινη προσπάθεια για ένα νέο έργο θα προσεγγίζεται από µια τιµή που αναµένεται στη µέση περίπτωση να απέχει κατά 25% από την πραγµατική. Η τιµή αυτή µπορεί να φαίνεται υψηλή για τον αµύητο στην εκτίµηση κόστους, αλλά έχει ήδη καταδειχτεί η δυσκολία του εγχειρήµατος, καθώς υπεισέρχονται πολλοί αστάθµητοι παράγοντες στη διαδικασία ανάπτυξης λογισµικού. Ένα άλλο δηµοφιλές κριτήριο απόδοσης είναι το PRED(25), το οποίο ορίζεται ως το ποσοστό των προβλέψεων που αποκλίνουν λιγότερο από 25% από την πραγµατική τιµή. Επί της ουσίας, πρόκειται για το ποσοστό των επιτυχών προβλέψεων, έχοντας ορίσει ως επιτυχία την απόκλιση µέχρι 25%. Μια καλή τιµή για το συγκεκριµένο µέτρο θεωρείται το 75% [1] Προσεγγίσεις στην εκτίµηση κόστους Όσον αφορά τώρα τις µεθόδους εκτίµησης κόστους, αυτές µπορούν να κατηγοριοποιηθούν στα εξής: Κρίση από ειδικό Αλγοριθµικά µοντέλα κόστους Εκτίµηση µε αναλογίες Η πρώτη µέθοδος είναι και αυτή που για πολλά χρόνια χρησιµοποιούνταν ευρέως. Συγκεκριµένα, η όποια πρόβλεψη γινόταν µε βάση την εµπειρία από κάποιον ο οποίος είχε εµπλακεί στο παρελθόν σε παρόµοια έργα. Οι εκτιµήσεις παράγονται εύκολα µε αυτόν τον τρόπο, χωρίς χρήση περίπλοκων εργαλείων ή τεχνικών. Μια τέτοια προσέγγιση είναι, ωστόσο, προβληµατική. Κατ αρχάς, τα µέσα µε τα οποία προκύπτει η εκτίµηση δεν είναι σαφή. Οπότε ακόµα και στην περίπτωση που µια πρόβλεψη είναι ακριβής, δεν µπορεί αυτή εγγυηµένα να

10 10 Κεφάλαιο πρώτο επαναληφθεί µε επιτυχία στο µέλλον. Επιπλέον, δεν είναι πάντα εύκολο να βρεθεί έµπειρος εκτιµητής για κάθε νέο έργο που αναλαµβάνεται. Το µέγεθος ενός έργου και το κόστος του, δεν είναι γραµµικώς εξαρτώµενα. Το κόστος συνήθως αυξάνεται εκθετικά συναρτήσει του µεγέθους. Συνεπώς, ο εκτιµητής είναι κατάλληλος µόνο για την περίπτωση που έχει εµπειρία σε έργα µε παραπλήσιο µέγεθος. Τέλος, οι διαφορετικές επιλογές στη διοίκηση σε κάθε έργο, καθιστούν αµφίβολη την αξία της εµπειρίας από προηγούµενα έργα. Συνεπώς, σύντοµα αναδείχθηκε η ανάγκη εφαρµογής αυτοµατοποιηµένωντυποποιηµένων τεχνικών. Οι αλγοριθµικές τεχνικές εκτίµησης κόστους περιλαµβάνουν την εφαρµογή ενός µοντέλου κόστους, το οποίο έχει προκύψει µετά από στατιστική ανάλυση δεδοµένων. Ένα τυπικό µοντέλο εκτίµησης κόστους µπορεί να είναι της µορφής: προσπάθεια = a (µέγεθος) b Έχουµε ήδη πει ότι η προσπάθεια εκφράζεται σε ανθρωποµήνες, ενώ το µέγεθος σε function points ή οποιαδήποτε άλλη Software Sizing τεχνική. Σε παρόµοια µοντέλα βασίζονται µέθοδοι όπως COCOMO και η SLIM. Οι διαφορές τους συνίστανται στην πολιτική επιλογής των παραµέτρων a και b, τα οποία είναι συνήθως συναρτήσεις, ή άλλοι παράγοντες κόστους. Η διαδικασία επιλογής των a και b λέγεται ρύθµιση (calibration) του µοντέλου. Οι δύο προαναφερθείσες αλγοριθµικές µέθοδοι, αν και οι πιο δηµοφιλείς, εξακολουθούν να παρουσιάζουν µεγάλα ποσοστά αποτυχίας σε πολλές εργασίες [3]. Επιπλέον, η ανάγκη ρύθµισης του µοντέλου σε κάθε περιβάλλον µέτρησης, και η αδυναµία επαρκούς µοντελοποίησης των πολύπλοκων σχέσεων που υπάρχουν σε πολλά περιβάλλοντα ανάπτυξης, επηρεάζουν επίσης αρνητικά την αποδοτικότητα τέτοιων µεθόδων. Τελειώνοντας τη σύντοµη παρουσίαση µεθόδων εκτίµησης κόστους, η µέθοδος των αναλογιών είναι µια τεχνική που έχει στόχο να υποκαταστήσει τη γνώµη του ειδικού, ψάχνοντας να βρει συσχετίσεις µεταξύ των δεδοµένων. Πιο συγκεκριµένα, η λογική της συνοψίζεται στην προσπάθεια εύρεσης οµοιοτήτων µεταξύ του νέου έργου µε άλλα γνωστά τα οποία διατηρούνται σε µια βάση δεδοµένων. Η τιµή των ανθρωποµηνών του περισσότερο όµοιου έργου, εικάζουµε ότι θα προσεγγίζει και την αντίστοιχη πραγµατική τιµή του έργου που µας ενδιαφέρει. Εφόσον έγινε παραλληλισµός µε τη µέθοδο της εκτίµησης από ειδικό, πρέπει να σηµειωθεί ότι σε αντίθεση µε την πρώτη, η µέθοδος των αναλογιών µπορεί να εφαρµοστεί συστηµατικά και αυτοµατοποιηµένα, προσπερνώντας τα όποια µειονεκτήµατα. Καθώς είναι η µέθοδος µε την βελτιστοποίηση της οποίας η παρούσα εργασία ασχολείται, ακολουθεί αναλυτική περιγραφή της στην παράγραφο που ακολουθεί.

11 Εκτίµηση Κόστους Η Μέθοδος των Αναλογίων Όπως έχει ήδη διατυπωθεί, το κύριο χαρακτηριστικό της µεθόδου είναι η χρησιµοποίηση της ιστορικής πληροφορίας από ολοκληρωµένα έργα µε γνωστή τη συνολική ανθρώπινη προσπάθεια. Η µέθοδος αποτελεί µια προσέγγιση που βασίζεται στη Συλλογιστική Βασισµένη σε Περιπτώσεις (Case Based Reasoning). Η τελευταία, ως τεχνική Μηχανικής Μάθησης (Machine Learning), προσπαθεί να µιµηθεί τη λειτουργία του εγκεφάλου που µας επιτρέπει να βγάζουµε συµπεράσµατα, ανατρέχοντας σε παλαιότερα δεδοµένα. Ο όρος «µίµηση εγκεφαλικής λειτουργίας» δικαιολογείται απόλυτα, αν σκεφτούµε ότι έτσι προσοµοιάζουµε τον τρόπο δουλείας του ειδικού. Αναλυτικότερα τώρα, η συλλογιστική βασισµένη σε περιπτώσεις χαρακτηρίζεται από µια κυκλική διαδικασία που αποτελείται από τέσσερα βήµατα: Ανάκτηση παρόµοιων περιπτώσεων Χρήση των παρόµοιων περιπτώσεων για εξεύρεση λύσης στο πρόβληµα Αναθεώρηση της προτεινόµενης λύσης αν είναι απαραίτητο ιατήρηση της λύσης για διαµόρφωση νέας περίπτωσης Η µέθοδος των αναλογιών, που όπως είπαµε, εµπίπτει σε αυτήν την κατηγορία, αναλύεται εκτενέστερα στη συνέχεια Ανάλυση σε Χαρακτηριστικά Έχει ήδη αναφερθεί, πολύ γενικά, η λειτουργία της µεθόδου. Εντοπίζονται σε πρώτη φάση τα περισσότερο όµοια µε το προς εκτίµηση έργα, τα οποία έχουν γνωστό κόστος. Με βάση αυτά γίνεται η εκτίµηση του κόστους και για το νέο έργο. Από αυτήν την απλή περιγραφή προκύπτουν µια σειρά από θέµατα που αφορούν την εφαρµογή της µεθόδου. Το πρώτο που θα πρέπει να µας απασχολήσει είναι η οµοιότητα µεταξύ δύο έργων. Το πρώτο βήµα προς αυτή την κατεύθυνση είναι η ανάλυση των έργων σε συνιστώσες-χαρακτηριστικά, τα οποία περιγράφουν ιδιότητες αυτών. Στη βιβλιογραφία αναφέρονται και ως µεταβλητές. Για παράδειγµα ένα έργο µπορούµε να πούµε ότι χαρακτηρίζεται από το πλήθος των γραµµών του πηγαίου κώδικά του, τη γλώσσα προγραµµατισµού που χρησιµοποιήθηκε, τα Function Points, την εµπειρία του προσωπικού. Παρατηρώντας τα παραπάνω παραδείγµατα χαρακτηριστικών, είναι σαφές ότι κάποια από αυτά περιγράφονται από αριθµητικές τιµές, όπως οι γραµµές του κώδικα, ενώ οι τιµές άλλων ανήκουν σε δύο ή περισσότερες κατηγορίες. Η εµπειρία, λόχου χάριν, των εµπλεκοµένων µπορεί να χαρακτηριστεί από το παρακάτω σύνολο τιµών: Εµπειρία Προσωπικού: { µικρή, µεσαία, µεγάλη }

12 12 Κεφάλαιο πρώτο Γίνεται αντιληπτή λοιπόν η διάκριση των χαρακτηριστικών-µεταβλητών σε δύο κατηγορίες: Αριθµητικές µεταβλητές Κατηγοριοποιηµένες µεταβλητές Η ανάλυση σε συνιστώσες είναι απαραίτητη τόσο για το προς εκτίµηση έργο, όσο και για αυτά της βάσης δεδοµένων µε γνωστό κόστος. Εννοείται ότι όλες οι τιµές για τα έργα πρέπει να είναι συµπληρωµένες. Για το εκτιµητέο, βέβαια, µόνο ένα µέρος των χαρακτηριστικών είναι εκ των προτέρων γνωστό. Η επιλογή του υποσυνόλου των διαθέσιµων χαρακτηριστικών που ελαχιστοποιεί το σφάλµα πρόβλεψης, είναι από τα προβλήµατα που γίνεται προσπάθεια να λυθούν στην παρούσα εργασία Μέτρα Ανοµοιότητας Αυτό που κερδίσαµε είναι η αναπαράσταση των έργων ως σηµεία σε ένα n-διάστατο χώρο, όπου n το πλήθος των χαρακτηριστικών. Σε ένα τέτοιο χώρο η οµοιότητα µπορεί να εκφραστεί ως απόσταση µεταξύ δύο σηµείων, δύο έργων στη συγκεκριµένη περίπτωση. Προφανώς η ελαχιστοποίηση της απόστασης συνεπάγεται µεγαλύτερη οµοιότητα. Η ανοµοιότητα, λοιπόν, µεταξύ δύο έργων είναι δυνατόν να εκφραστεί µε διάφορα µέτρα απόστασης. Το ευρύτερα γνωστό από αυτά είναι η Ευκλείδεια απόσταση, η οποία έχει τη σηµασία της γεωµετρικής απόστασης δύο σηµείων σε ένα k διαστάσεων Ευκλείδειο χώρο. Ο µαθηµατικός τύπος που την περιγράφει είναι ο εξής: d new 1/ 2 k 2, i = ( Y j X ij ), i = 1, 2,..., j= 1 Η ερµηνεία των συµβόλων για τη µέθοδο των αναλογιών είναι: d: η απόσταση του έργου Y από το i-οστό έργο της βάσης δεδοµένων X Y j : η j-οστή συνιστώσα του προς εκτίµηση έργου Y X ij : η j-οστή συνιστώσα του το i-οστού έργου της βάσης X k: ο συνολικός αριθµός των συνιστωσών Εναλλακτικά µέτρα απόστασης µπορούν να χρησιµοποιηθούν, και να δώσουν µάλιστα διαφορετικά αποτελέσµατα. Παρακάτω περιγράφονται όσα θα απασχολήσουν την παρούσα εργασία. n Η απόσταση Manhattan:

13 Εκτίµηση Κόστους 13 Η απόσταση Minkowski: Είναι προφανές ότι για λ=1 ισοδυναµεί µε την απόσταση Manhattan, ενώ για λ=2 µε την Ευκλείδεια. Η απόσταση Canberra: Ο συντελεστής Czekanowski: Η απόσταση Chebychev ή «Μέγιστη» απόσταση: Συντελεστή ανοµοιότητας Kaufman-Rousseeuw όπου Rj τα όρια των τιµών της µεταβλητής:

14 14 Κεφάλαιο πρώτο Θέµατα υπολογισµού της απόστασης Πριν τη συµµετοχή των χαρακτηριστικών στους υπολογισµούς, ανεξαρτήτως µέτρου απόστασης, είναι απαραίτητο να εξαλειφθεί η όποια επιρροή από την επιλογή διαφορετικών µονάδων µέτρησης. Έτσι, οι τιµές κανονικοποιούνται έτσι ώστε να κυµαίνονται στο διάστηµα Η κανονικοποίηση γίνεται µε τον παρακάτω τύπο όπου X ij η κανονικοποιηµένη τιµή του χαρακτηριστικού, και X ij η αντίστοιχη πραγµατική. Για τις αριθµητικές µεταβλητές, ο όρος Y j X ij ισούται απλά µε την αφαίρεση των αντιστοίχων τιµών. Για τις δε κατηγοριοποιηµένες, ισχύει η σχέση: Y i X ij 1 = 0 if if X X ij ij Y j = Y j Πολλές φορές, υπολογίζοντας την απόσταση δύο σηµείων σε ένα χώρο n διαστάσεων, χρειάζεται να υπάρχει διαφορετικός σταθµικός παράγοντας για κάθε διάσταση. Στην πράξη αυτό σηµαίνει ότι κάποια χαρακτηριστικά κρίνονται σηµαντικότερα, και συνεπώς, οφείλουν να επηρεάζουν περισσότερο το αποτέλεσµα. Η λογική απόδοσης βάρους σε χαρακτηριστικό θα µας απασχολήσει σε επόµενη παράγραφο, και άλλωστε, είναι από τους κύριους στόχους της εργασίας. Η τροποποίηση των τύπων της απόστασης µε την εισαγωγή συντελεστή βαρύτητας, συνίσταται στον πολλαπλασιασµό της διαφοράς ενός χαρακτηριστικού για δύο διαφορετικά έργα, µε το βάρος που αντιστοιχεί στο συγκεκριµένο χαρακτηριστικό. Για τις κατηγοριοποιηµένες µεταβλητές αρκεί στη διαφορά Y i - X i να γίνει ανάθεση του βάρους του χαρακτηριστικού αντί για την µονάδα, σε περίπτωση διαφοροποίησης της τιµής των Y i & X i. Πριν την όποια χρήση σε υπολογισµούς, το διάνυσµα των συντελεστών βαρύτητας ανάγεται σε διάνυσµα µοναδιαίου µέτρου. Πρόκειται δηλαδή για την κλασική κανονικοποίηση διανύσµατος που είναι γνωστή από τη γραµµική άλγεβρα Εξαγωγή τελικής εκτίµησης Με εργαλεία όπως τα µέτρα απόστασης, όπως έχουν οριστεί στις παραγράφους που προηγηθήκαν, είναι δυνατόν πλέον να οριστούν τα γειτονικά µε το προς εκτίµηση έργα. Ο όρος γειτονικά αναφέρεται στα περισσότερο όµοια, δηλαδή, αυτά που απέχουν λιγότερο από το νέο έργο, στο χώρο που έχει οριστεί. Το επόµενο βήµα είναι η εξαγωγή της πρόβλεψης, µε βάση τα παρόµοια έργα. Στη βιβλιογραφία τα έργα αυτά αναφέρονται και ως ανάλογα, ενώ ο αριθµός των ανάλογων έργων που λαµβάνονται υπ όψιν, είναι γνωστός ως αριθµός αναλογιών.

15 Εκτίµηση Κόστους 15 Η τελική εκτίµηση προκύπτει µε τον υπολογισµό ενός στατιστικού µέτρου εφαρµοζόµενο στα κόστη των ανάλογων έργων. Στην παρούσα εργασία θα εξεταστούν οι αποδόσεις των εξής: Μέση τιµή (mean) ιάµεσος (median) Σταθµισµένη µέση τιµή (size adjusting mean) Σταθµισµένη διάµεσος (size adjusting median) Τα σταθµισµένα µέτρα για τα οποία έγινε λόγος, περιλαµβάνουν µια προσαρµογή της πρόβλεψης στο µέγεθος των γειτονικών έργων, εκµεταλλευόµενα τη στενή σχέση µεταξύ κόστους και µεγέθους του έργου. Για παράδειγµα, στην περίπτωση του ενός γείτονα, η γραµµική προσαρµογή ως προς το µέγεθος δίνεται από τον ακόλουθο τύπο: SIZE NEW EFFORT NEW = SIZENEIGHBOUR EFFORT NEIGHBOUR 1.3 Το Πρόβληµα Βελτιστοποίησης της Μεθόδου των Αναλογιών Το πρόβληµα που διαπραγµατεύεται η παρούσα εργασία, σχετίζεται µε τον τρόπο εφαρµογής της µεθόδου των αναλογιών. Ακολουθεί λεπτοµερής περιγραφή των θεµάτων επηρεάζουν την εκτέλεση της µεθόδου, µε σκοπό την ανάδειξη της ανάγκης για εφαρµογή πιθανοκρατικών µεθόδων βελτιστοποίησης, όπως οι γενετικοί αλγόριθµοι Περιγραφή του προβλήµατος Εφόσον έχουν πλέον αναλυθεί οι λεπτοµέρειες της µεθόδου, είναι προφανές ότι υπάρχουν πολλές εναλλακτικές για την εφαρµογή της. Το θέµα είναι ότι η απόδοση της µεθόδου επηρεάζεται από τις παραµέτρους εκτέλεσής της. Έχουµε ήδη ορίσει κριτήρια για την καταλληλότητα µιας µεθόδου πρόβλεψης τα MMRE και PRED(25). Το πρώτο είναι το µέσο µέγεθος σχετικού σφάλµατος εκτίµησης, ενώ το δεύτερο το ποσοστό των έργων των οποίων η εκτιµώµενη τιµή απέχει λιγότερο από 25% από την πραγµατική. Έτσι, θα θεωρείται ένας µια συγκεκριµένη ρύθµιση της µεθόδου τόσο καλύτερη, όσο µικρότερο είναι το MMRE ή µεγαλύτερο το PRED(25).

16 16 Κεφάλαιο πρώτο Το πρώτο που θα πρέπει να εξεταστεί είναι το πώς η επιλογή των µεταβλητών επιδρά στην απόδοση. Μια απλή παραδοχή που µπορεί να γίνει είναι η εξής: όσο περισσότερα χαρακτηριστικά, τόσο το καλύτερο. Στην πράξη, ωστόσο, δεν ισχύει, καθώς υπάρχουν µεταβλητές που δεν είναι εύκολο να εκτιµηθούν για ένα νέο έργο, όπως για παράδειγµα το πλήθος των γραµµών κώδικα. Μια άλλη περίπτωση είναι να µην είναι διαθέσιµη η τιµή κάποιας µεταβλητής για πολλά από τα γνωστά έργα της βάσης. Εποµένως, ενδέχεται η επιλογή της να αλλοιώσει το βαθµό οµοιότητας κάποιων έργων, χωρίς µάλιστα να βασίζεται σε κάποια πληροφορία. Συνεπώς, τίθεται το πρόβληµα της επιλογής του βέλτιστου υποσυνόλου των χαρακτηριστικών, δηλαδή αυτών που περιγράφουν καλύτερα ένα σύνολο δεδοµένων. Με άλλα λόγια, αναζητούνται τα χαρακτηριστικά εκείνα για τα οποία η µέθοδος δίνει ακριβέστερη πρόβλεψη. Το δεύτερο θέµα προς θεώρηση είναι ο επακριβής προσδιορισµός της οµοιότητας. Έχουν αναφερθεί ήδη διάφορα µέτρα απόστασης, αλλά το ζητούµενο είναι για ποιο από αυτά το MMRE ελαχιστοποιείται. Ενδέχεται να είναι τέτοια η φύση των δεδοµένων, ώστε κάποια µέτρα να δίνουν καλύτερα αποτελέσµατα από άλλα, µε βάση πάντα την απόδοση της µεθόδου. Αλλά και ο αριθµός των αναλογιών, δηλαδή των χαρακτηριζόµενων ως όµοιων έργων, χρήζει περαιτέρω διερεύνησης. Το να βασίζεται η εκτίµηση σε υπερβολικά λίγα έργα µειώνει την αξιοπιστία της, καθώς αυξάνεται το ενδεχόµενο επιρροής από θόρυβο. Στην αντίθετη περίπτωση, αυτή του µεγάλου αριθµού αναλογιών, η µέθοδος εκφυλίζεται. Ένα τελευταίο πρόβληµα είναι το πώς ακριβώς θα αξιοποιηθούν τα γνωστά κόστη των αναλογιών που έχουν βρεθεί, ώστε να προκύψει η τελική πρόβλεψη. Και πάλι το πρόβληµα ανάγεται στην επιλογή µιας από τις λύσεις που έχουν προταθεί, όπως η µέση τιµή, η διάµεσος ή η σταθµισµένη µέση τιµή. Υπάρχει όµως ένας συνδυασµός όλων των παραπάνω παραµέτρων που να µπορεί να θεωρηθεί ως ο απόλυτα βέλτιστος για την εφαρµογή της µεθόδου; Η απάντηση είναι µάλλον αρνητική. Είναι γενικότερα αποδεκτό ότι η φύση των δεδοµένων, αλλά και η διαθεσιµότητα αυτών, καθορίζουν τον τρόπο µε τον οποίο αυτά πρέπει να χρησιµοποιηθούν. Συνεπώς, είναι απαραίτητη η ρύθµιση της µεθόδου στο εκάστοτε σύνολο δεδοµένων. Αυτό ακριβώς πραγµατεύεται η παρούσα εργασία. Στην επόµενη παράγραφο δικαιολογείται η επιλογή των Γενετικών Αλγορίθµων ως λύση Προσπάθειες για λύση Παρατηρώντας το πρόβληµα από µια πιο ψυχρή σκοπιά, είναι ξεκάθαρο ότι έχουµε να κάνουµε µε πρόβληµα αναζήτησης. Πράγµατι, αναζητούµε ένα συνδυασµό χαρακτηριστικών και παραµέτρων εφαρµογής, ώστε να ελαχιστοποιηθεί το σφάλµα πρόβλεψης, εκφρασµένο ως MMRE. Ως παράµετροι εφαρµογής αναφέρονται τα µέτρα απόστασης, ο αριθµός αναλογιών και τα στατιστικά για την εξαγωγή της τελικής εκτίµησης. Για την αξιολόγηση ενός τυχαίου συνδυασµού έχει προταθεί σε παλαιότερη εργασία [2] η µέθοδος Jackknife. Σύµφωνα µε αυτή, σε κάθε βήµα ένα έργο αφαιρείται από τη βάση δεδοµένων και τα υπόλοιπα έργα χρησιµοποιούνται σαν βάση για την εκτίµηση

17 Εκτίµηση Κόστους 17 της προσπάθειας αυτού του έργου. Το κόστος του τελευταίου όµως είναι ήδη γνωστό. Συνεπώς, είναι γνωστό και το σφάλµα της εκτίµησης που δόθηκε. Υπολογίζοντας όµοια τα σφάλµατα για όλα τα έργα της βάσης, καταλήγουµε σε ένα MMRE που χαρακτηρίζει τη ρύθµιση που χρησιµοποιήθηκε για το συγκεκριµένο σύνολο δεδοµένων. εδοµένης µιας συγκεκριµένης βάσης έργων, ο απλούστερος και πιο σίγουρος τρόπος ρύθµισης είναι η σειριακή αναζήτηση στο χώρο των υποψηφίων συνδυασµώνλύσεων. Ωστόσο, το µέγεθος του χώρου αναζήτησης καθιστά µια τέτοια προσέγγιση ανέφικτη. Ο αριθµός όλων των δυνατών υποσυνόλων των χαρακτηριστικών είναι της τάξης του 2 k, όπου k το σύνολο των µεταβλητών. Ο χώρος αναζήτησης πολλαπλασιάζεται όταν θεωρήσουµε και τις παραµέτρους εφαρµογής της µεθόδου. Για d τω αριθµώ µέτρα απόστασης, s στατιστικά και a αναλογίες, ο τύπος που δίνει το µέγεθος του χώρου αναζήτησης είναι: d * s * a * 2 k Το γεγονός ότι το 2 υψωµένο εις την k, δίνει το πλήθος των υποσυνόλων των χαρακτηριστικών, ερµηνεύεται ότι κάθε µεταβλητή, είτε θα συµµετέχει στη λύση, είτε όχι. Έχει δηλαδή δύο δυνατές καταστάσεις. Ωστόσο, στην περίπτωση που χρησιµοποιούνται συντελεστές βαρύτητας, τα πράγµατα περιπλέκονται. Αν υποτεθεί ότι οι συντελεστές παίρνουν τιµές στο διάστηµα 0..1, µε ακρίβεια δύο δεκαδικών ψηφίων, τότε σε κάθε χαρακτηριστικό αντιστοιχούν 100 καταστάσεις. Οπότε, στον παραπάνω τύπο, το 2 αντικαθίσταται από το 100, το οποίο και θα υψωθεί στην k-οστή δύναµη. Σε περίπτωση, λοιπόν, αναζήτησης των βέλτιστων βαρών, ακόµα και για µικρές τιµές του k, παρατηρείται το φαινόµενο της υπολογιστικής έκρηξης. Σε τέτοιες περιπτώσεις είναι σύνηθες να περιορίζεται ο χώρος αναζήτησης βάσει κάποιων κανόνων. Μπορούν για παράδειγµα να αποκλειστούν οι συνδυασµοί που περιέχουν υπερβολικά µεγάλο αριθµό αναλογιών, καθώς είµαστε σίγουροι, από την εµπειρία, ότι κάτι τέτοιο επηρεάζει αρνητικά την απόδοση. εν είναι όµως εφαρµόσιµη αυτή η τακτική για όλες τις παραµέτρους της µεθόδου. Σε παλαιότερη εργασία [2] γινόταν πρώτα εύρεση των βέλτιστων παραµέτρων εφαρµογής λαµβάνοντας υπ όψιν όλα τα χαρακτηριστικά, και στη συνέχεια εύρεση του βέλτιστου υποσυνόλου µε βάση τις παραµέτρους που µόλις υπολογίστηκαν. Η προσέγγιση είναι προβληµατική, καθώς αποκλείονται πολλοί συνδυασµοί, χωρίς να είµαστε σίγουροι για την ποιότητά τους. Προκειµένου να είναι αποδοτική η αναζήτηση σε ένα χώρο όπως αυτόν που έχει περιγραφεί, χρειάζεται να αποκαλυφθούν οι συσχετίσεις που υπάρχουν µεταξύ των δεδοµένων. Αν µια τέτοια µοντελοποίηση ήταν εφικτή, θα αρκούσε ίσως η εφαρµογή κάποιας αλγοριθµικής µεθόδου εκτίµησης κόστους. Άλλωστε, η µέθοδος των αναλογιών κλήθηκε να ξεπεράσει αυτό ακριβώς το πρόβληµα. Λόγω των παραπάνω, για τη βελτιστοποίηση της Μεθόδου των Αναλογιών, προτείνεται στην παρούσα εργασία η χρήση Γενετικών Αλγορίθµων. Κύριο χαρακτηριστικό τους είναι η δυνατότητά τους να εκτελούν αναζήτηση σε χώρους που δεν είναι δυνατό να µοντελοποιηθούν επαρκώς. Επιπλέον, δεν επηρεάζονται από το

18 18 Κεφάλαιο πρώτο µέγεθος του χώρου, καθώς δεν εκτελούν εξαντλητική αναζήτηση, αλλά προσαρµόζονται αυτόµατα στα δεδοµένα. Με αυτή την επιλογή, λοιπόν, ξεπεράστηκαν τα δύο σηµαντικότερα εµπόδια για τη βελτιστοποίηση της µεθόδου. Αλλά θα πρέπει να επισηµανθεί ότι οι γενετικοί αλγόριθµοι ανήκουν στην κατηγορία των πιθανοκρατικών αλγορίθµων. Συνέπεια του τελευταίου είναι ότι στην πράξη δε δίνουν ακριβώς τη βέλτιστη λύση, αλλά προσέγγισή της. Ωστόσο, το σηµαντικό είναι ότι µια καλή προσέγγιση µπορεί να προκύψει σε εύλογο χρονικό διάστηµα. Στα κεφάλαια που ακολουθούν αναλύονται εκτενέστερα οι γενετικοί αλγόριθµοι, αλλά και η προσαρµογή αυτών, ώστε να καθίστανται εφαρµόσιµοι στο παρόν πρόβληµα βελτιστοποίησης.

19 19 Κεφάλαιο δεύτερο: ΓΕΝΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ Η εφαρµογή των µαθηµατικών σε ένα πρόβληµα του πραγµατικού κόσµου, συνήθως σηµαίνει τη µαθηµατική µοντελοποίηση του προβλήµατος. Στη συνέχεια επιλύεται το µαθηµατικό πρόβληµα που έχει προκύψει, και τελικά, εξάγονται συµπεράσµατα για το πραγµατικό πρόβληµα, µε βάση τη µαθηµατική λύση. Ωστόσο, έχουν αναπτυχθεί µέθοδοι επίλυσης προβληµάτων που λειτουργούν χωρίς χρήση µαθηµατικών µοντέλων. Πηγή έµπνευσης για τέτοιες µεθόδους είναι το γεγονός ότι η φύση δρα µε πολύπλοκες διαδικασίες και µηχανισµούς, που όµως, όπως είναι φυσικό, δεν έχουν µοντελοποιηθεί. Η αξιοθαύµαστη τελειότητά τους οδήγησε τους ερευνητές σε µια προσπάθεια µίµησης τέτοιων διαδικασιών µε µαθηµατικά µοντέλα, ώστε να µπορούν να χρησιµοποιηθούν για την αντιµετώπιση ευρύτερης κλίµακας προβληµάτων. Σε αυτή την κατηγορία µεθόδων ανήκουν οι Γενετικοί Αλγόριθµοι. Το τρέχον κεφάλαιο αποσκοπεί στη γνωριµία του αναγνώστη µε αυτό το είδος αλγορίθµων, ώστε να κατανοήσει αργότερα την εφαρµογή τους για την επίλυση του προβλήµατος που η εργασία πραγµατεύεται. 2.1 Εισαγωγή στους Γενετικούς Αλγορίθµους Αν και η ιδέα του γενετικού προγραµµατισµού είναι πιο παλιά, η θεωρία και η εφαρµοσιµότητα των γενετικών αλγορίθµων επηρεάστηκε από το Holland. Με το έργο του Προσαρµογή στα Φυσικά και τεχνητά Συστήµατα θεωρείται πρωτοπόρος του χώρου. Στην παρούσα ενότητα γίνεται λόγος για τους µηχανισµούς της φύσης που ενέπνευσαν την ανάπτυξη των γενετικών αλγορίθµων, και για το πώς οι µηχανισµοί αυτοί προσοµοιώθηκαν, ώστε να είναι χρήσιµοι στην επιστήµη της πληροφορικής. Ακόµα, επισηµαίνονται οι κύριες δυνατότητές τους στην επίλυση προβληµάτων, αλλά και κάποιες αδυναµίες Βιολογική Θεµελίωση Προκειµένου να κατανοηθούν οι αναπαραστάσεις και οι λειτουργίες των γενετικών αλγορίθµων, είναι χρήσιµο να γίνει λόγος για τις αντίστοιχες του βιολογικού ανάλογου. Ο βασικός µηχανισµός των γενετικών αλγορίθµων είναι εµπνευσµένος από τη αρβινική θεωρία της εξέλιξης. Σύµφωνα µε αυτή, τα καλύτερα άτοµα ενός

20 20 Κεφάλαιο δεύτερο πληθυσµού επιβιώνουν και αναπαράγονται, δίνοντας καλύτερους απογόνους. Με τον όρο καλύτερα εννοούµε αυτά που είναι πιο ικανά να ανταπεξέλθουν στις συνθήκες του περιβάλλοντος. Αυτή ακριβώς η δοκιµασία του ατόµου µε το περιβάλλον αναφέρεται ως φυσική επιλογή, καθώς µόνο οι καλύτεροι θα επιβιώσουν και θα αναπαραχθούν. Τέλος, όταν δύο καλά άτοµα αναπαράγονται, γίνεται συνδυασµός των γενετικών τους υλικών, και είναι πολύ πιθανό να προκύψει ένα νέο άτοµο που θα συνδυάζει τα καλύτερα από τα χαρακτηριστικά των γονιών του. Ίσως να µη γίνεται αντιληπτό το πόσο αποδοτικός είναι ο παραπάνω µηχανισµός σε βάθος µιας ή δυο γενεών. Ωστόσο, παρατηρώντας τα εκατοµµύρια χρόνια εξέλιξης των ειδών στον πλανήτη, φαίνεται ο µεγάλος βαθµός προσαρµοστικότητας της φύσης, ώστε να διατηρηθεί η ζωή. Το γενετικό υλικό, DNA στις περισσότερες περιπτώσεις, αποτελεί το σχεδιάγραµµα για έναν οργανισµό, καθώς σε αυτό είναι κωδικοποιηµένα όλα τα χαρακτηριστικά του. Για να δούµε τον τρόπο µε τον οποίο γίνεται αυτή η κωδικοποίηση, αξίζει να παρατηρήσουµε τη χηµική δοµή του. Όπως φαίνεται στο παρακάτω σχήµα, η διαµόρφωση των µορίων του DNA έχει στο χώρο τη µορφή δύο επιµηκών αλυσίδων, οι οποίες συστρέφονται ελικοειδώς µεταξύ τους. Σχήµα 2-1 Ένα µόριο DNA συγκροτείται από αζωτούχες-πρωτεϊνικές βάσεις, φωσφορικά οξέα και σάκχαρα. Την κωδικοποίηση αφορούν µόνο οι πρωτεϊνικές βάσεις, οι οποίες ανάλογα µε την σειρά αλληλουχίας τους, κωδικοποιούν το µήνυµα για τη σύνθεση των διάφορων πρωτεϊνών. Οι οµάδες των βάσεων είναι: Αδενίνη (A) Θυµίνη (T) Γουανίνη (G) Κυτοσίνη (C)

21 Γενετικοί Αλγόριθµοι 21 Μάλιστα, επειδή η µία έλικα είναι συµπληρωµατική της άλλης, πάντα η Αδενίνη συνδέεται µε Θυµίνη και η Γουανίνη µε Κυτοσίνη, αρκεί µια συµβολοσειρά µε αλφάβητο {A, T, G, C} για να περιγράψει ένα µόριο DNA από τη σκοπιά της αναπαράστασης πληροφορίας. Σύµφωνα µε τη βιολογία, ένα κύτταρο έχει ένα ή περισσότερα χρωµοσώµατα, τα οποία αποτελούν ενιαίες αλυσίδες DNA. Τα επιµέρους τµήµατα του χρωµοσώµατος που κωδικοποιούν κάποιο χαρακτηριστικό, ονοµάζονται γονίδια. Το σύνολο των παραµέτρων που αναπαρίστανται από ένα συγκεκριµένο γονίδιο ή από ένα σύνολο γονιδίων, αναφέρεται ως γονότυπος. Ο γονότυπος είναι που προκαλεί της έγερση του φαινοτύπου του οργανισµού, δηλαδή των φυσικών και πνευµατικών χαρακτηριστικών του. Αυτό που γίνεται στην περίπτωση της αναπαραγωγής είναι ο συνδυασµός γονιδίων που βρίσκονται στα χρωµοσώµατα των γονέων, ώστε να προκύψουν νέα. Έτσι, διαφορετικά τµήµατα από τις αρχικές συµβολοσειρές θα συνυπάρχουν στις καινούργιες. Με αυτό τον τρόπο, επιλέγονται συγκεκριµένα χαρακτηριστικά από τους γονείς, τα οποία κληρονοµούνται από τον απόγονο. Βέβαια, στη φύση υπάρχουν και άλλα είδη αναπαραγωγής (πχ µονογονική), αλλά και γενετικού υλικού, όπως RNA. Ωστόσο, σε γενικές γραµµές ο µηχανισµός µετάβασης της πληροφορίας από γενιά σε γενιά είναι πλέον κατανοητός Βασικές Έννοιες Στην παρούσα παράγραφο εξηγείται το πώς οι φυσικοί µηχανισµοί που έχουν περιγραφεί παραπάνω αξιοποιηθήκαν ώστε να προκύψουν δοµές και διαδικασίες που επιλύουν προβλήµατα εκµεταλλευόµενες τις ιδιότητες της εξέλιξης. Ας υποθέσουµε, λοιπόν, ότι έχουµε να κάνουµε µε ένα πρόβληµα βελτιστοποίησης, που αποτελεί και τη συνηθέστερη εφαρµογή των γενετικών αλγορίθµων. Για ένα τέτοιο πρόβληµα προφανώς θα υπάρχουν πολλές έγκυρες λύσεις, αλλά το ζητούµενο είναι η εύρεση της καλύτερης από αυτές. Εν ολίγοις, εκτελείται αναζήτηση στο χώρο των υποψηφίων λύσεων, µε σκοπό τον εντοπισµό της βέλτιστης. Το σύνολο των έγκυρων λύσεων εύκολα παραλληλίζεται µε το σύνολο των ατόµων της βιολογικής εξέλιξης. Η λύση ενός µαθηµατικού, για παράδειγµα, προβλήµατος µπορεί να αποδοθεί ως µια ένα διάνυσµα πραγµατικών τιµών. Επειδή αυτή είναι και η αληθινή της σηµασία για το πρόβληµα, χαρακτηρίζεται και ως φαινότυπος, σε αντιστοιχία µε τα χαρακτηριστικά των οργανισµών. Όµως στη βιολογία, το άτοµο, δηλαδή τα χαρακτηριστικά του, κωδικοποιείται µε µια συµβολοσειρά της οποίας το αλφάβητο αποτελείται από τέσσερις χαρακτήρες, ένας για κάθε πρωτεϊνική βάση. Παρόµοια, τα επιµέρους χαρακτηριστικά-µεταβλητές µια µαθηµατικής λύσης µπορούν να κωδικοποιηθούν σε µια µορφή που να επιτρέπουν την εφαρµογή διαδικασιών ανάλογων µε τη βιολογική ανταλλαγή γενετικού υλικού. Η ευρύτερα χρησιµοποιούµενη αναπαράσταση είναι η δυαδική. Η οµάδα των bit που κωδικοποιούν µια συγκεκριµένη µεταβλητή, είναι ανάλογο του γονιδίου στη βιολογία, και έτσι αναφέρεται. Ακόµη, ολόκληρη η αναπαράσταση µιας λύσης είναι ένα χρωµόσωµα για το γενετικό αλγόριθµο.

22 22 Κεφάλαιο δεύτερο Στο παρακάτω σχήµα φαίνεται η σχέση ατόµου και γενετικής κωδικοποίησής του, τόσο για τη φυσική εξέλιξη, όσο και για τους γενετικούς αλγορίθµους. Σχήµα 2-2 Το πόσο κατάλληλος για επιβίωση και αναπαραγωγή είναι ένας οργανισµός, εξαρτάται από την αλληλεπίδραση των χαρακτηριστικών του µε το περιβάλλον. Στο πεδίο των γενετικών αλγορίθµων το αντίστοιχο των χαρακτηριστικών µπορεί να είναι οι µεταβλητές µιας συνάρτησης, ενώ το ρόλο του περιβάλλοντος διαδραµατίζει η ίδια η συνάρτηση. Η οντότητα συνάρτηση, για την οποία έχει γίνει αναφορά πιο πάνω, στη βιβλιογραφία αναφέρεται ως συνάρτηση καταλληλότητας. Η λειτουργία της θυµίζει µαθηµατική συνάρτηση, αλλά δεν είναι πάντα έτσι. Η τυπική συµπεριφορά της είναι ότι δέχεται ένα διάνυσµα τιµών, και αποδίδει µια τιµή που αντιστοιχεί στην καταλληλότητα του χρωµοσώµατος που κωδικοποίησε το παρόν διάνυσµα. Οι τιµές του διανύσµατος µπορεί να είναι οποιουδήποτε τύπου, ακόµα και µη αριθµητικού, ανάλογα µε τα δεδοµένα και τους περιορισµούς του εκάστοτε προβλήµατος. Η φυσική επιλογή είναι απόρροια της επιβίωσης των ισχυρότερων οργανισµών, και της συµµετοχής τους στη διαδικασία αναπαραγωγής. Για τους γενετικούς, ο µηχανισµός αυτός υλοποιείται εν µέρει µε την απόδοση καταλληλότητας σε άτοµαλύσεις, αλλά χρειάζεται και ένας αλγόριθµος επιλογής των ατόµων µε τις καλύτερες τιµές καταλληλότητας. Πιστότερη αντιγραφή του φυσικού µηχανισµού επιτυγχάνεται όταν υπεισέρχεται και ένας παράγοντας τυχαιότητας στην επιλογή. Η δε αναπαραγωγή συνήθως ανάγεται στη διασταύρωση των χρωµοσωµάτων των ατόµων γονέων, ώστε να προκύψουν νέα, που θα κληρονοµούν και θα συνδυάζουν διαφορετικές αλληλουχίες από 0 και 1 (στην περίπτωση δυαδικής κωδικοποίησης), που αρχικά ανήκαν στους γονείς. Είναι το αντίστοιχο της ανταλλαγής γενετικού υλικού της βιολογικής αναπαραγωγής. Μια άλλη διαδικασία εµπνευσµένη από τη βιολογία είναι η µετάλλαξη. Για τους γενετικούς αλγόριθµους θεωρείται είδος αναπαραγωγής, και συνίσταται στην τυχαία µεταβολή του χρωµοσώµατος. Ο λόγος χρήσης της θα εξηγηθεί σε επόµενη παράγραφο. Για τους γενετικούς αλγορίθµους γενικότερα, οι πράξεις της επιλογής, της διασταύρωσης και της µετάλλαξης αναφέρονται ως τελεστές.

23 Γενετικοί Αλγόριθµοι 23 Ένα τελευταίο στοιχείο της βιολογικής εξέλιξης που µένει να προσοµοιωθεί, είναι η ανανέωση του πληθυσµού. Η παραγωγή απογόνων από ένα παλαιότερο πληθυσµό σηµαίνει και την αντικατάσταση του δευτέρου από τον πρώτο. Ωστόσο, υπάρχουν και άλλες πολιτικές ανανέωσης. Ο πληθυσµός που προκύπτει σε κάθε βήµα ανανέωσης, αναφέρεται ως γενιά. Πάντως, σε κάθε περίπτωση το επιθυµητό και αναµενόµενο, είναι να αυξάνεται η µέση καταλληλότητα του πληθυσµού, βασιζόµενοι στην αρχή ότι επιβιώνουν και συνδυάζονται οι καλύτεροι. Κάθε άτοµο είναι µια τυχαία προσπάθεια εύρεσης του µέγιστου. Κάθε συνδυασµός καλών ατόµων, ερµηνεύεται ως µετακίνηση προς την κατεύθυνση µιας καλύτερης λύσης. Συνεπώς, για άπειρα βήµατα, ο γενετικός αλγόριθµος συγκλίνει στη βέλτιστη λύση. Μια παράµετρος που συναντάται στη φύση και επηρεάζει θετικά την απόδοση ενός γενετικού αλγορίθµου είναι η τυχαιότητα. Πιο συγκεκριµένα, έχει σηµασία ο πληθυσµός να καλύπτει όσο το δυνατό µεγαλύτερο µέρος του χώρου αναζήτησης, και αυτό είναι εφικτό µε τυχαία δειγµατοληψία λύσεων σε όλο το φάσµα του. Όσο πιο ανοµοιογενής είναι ένας πληθυσµός, τόσο µειώνεται η πιθανότητα της πρόωρης σύγκλισης, δηλαδή της τάσης του αλγορίθµου να συγκλίνει σε κάποιο τοπικό βέλτιστο, αγνοώντας µέρος του χώρου αναζήτησης. Η τυχαιότητα µπορεί να υπεισέλθει σε διάφορα στάδια του γενετικού αλγορίθµου, όπως η παραγωγή του αρχικού πληθυσµού ή κατά τη διασταύρωση υνατότητες και Αδυναµίες Ας δούµε τώρα γιατί συµφέρει η εφαρµογή γενετικών αλγορίθµων. Εφόσον ο λόγος γίνεται για προβλήµατα βελτιστοποίησης, θα πρέπει να σηµειωθεί ότι η συνάρτηση καταλληλότητας είναι ακριβώς η προς βελτιστοποίηση οντότητα. Για να απλοποιήσουµε την κατάσταση, χωρίς απώλεια της γενικότητας, θα θεωρήσουµε και πάλι µια µαθηµατική συνάρτηση. Οι πιθανές λύσεις του προβλήµατος είναι όλα εκείνα τα σηµεία του χώρου που ορίζουν οι µεταβλητές της συνάρτησης, και την επαληθεύουν. Με αυτά τα δεδοµένα, συνήθως η επιλογή της βέλτιστης λύσης ανάγεται στον εντοπισµό του ολικού µέγιστου της συνάρτησης καταλληλότητας. Η εύρεση του ολικού µέγιστου αυτής, ισοδυναµεί µε µια αναζήτηση στο n-διάστατο χώρο που ορίζουν οι n µεταβλητές εισόδου. Το αναµενόµενα µεγάλο µέγεθος του χώρου αναζήτησης καθιστά απαγορευτικό το κόστος εφαρµογής τυπικών µεθόδων αναζήτησης, όπως η σειριακή. Συνεπώς, θα ήταν λογικό να εκµεταλλευτούµε κάποιες ιδιότητες της συνάρτησης περιορίζοντας, έτσι, το χώρο αναζήτησης, ή να εφαρµοστούν µέθοδοι αριθµητικής ανάλυσης. Η αδυναµία µαθηµατικής µοντελοποίησης πολλών συναρτήσεων, καθιστά ανέφικτη την εφαρµογή τέτοιων µεθόδων. Η δύναµη των γενετικών αλγορίθµων έγκειται στο ότι δε χρειάζεται να υπάρχει γνώση του χώρου αναζήτησης. Η ιδιότητα αυτή υποστηρίζεται από µια σειρά από χαρακτηριστικά: Χρησιµοποιούνται κωδικοποιηµένες αναπαραστάσεις των λύσεων.

24 24 Κεφάλαιο δεύτερο Η αναζήτηση γίνεται σε πολλά σηµεία, τα σηµεία-άτοµα ενός πληθυσµού. Αυτό ευνοεί την ευρωστία του αλγορίθµου, καθώς δεν επηρεάζεται από τοπικά βέλτιστα. ε χρησιµοποιούνται πληροφορίες όπως παράγωγοι, και συνεπώς είναι εφαρµόσιµοι σε κάθε συνεχές ή διακριτό πρόβληµα. Οι αλγόριθµοι επιλογής και αναπαραγωγής είναι πιθανοκρατικοί. Κάθε νέα γενιά έχει και τυχαία συστατικά, συνεχίζοντας την αναζήτηση και σε περιοχές που δεν είχαν προσεγγιστεί προηγουµένως. Ωστόσο, υπάρχει και η περίπτωση όπου η συνάρτηση καταλληλότητας επηρεάζει αρνητικά την απόδοση ενός γενετικού αλγορίθµου. Συγκεκριµένα, αυτό συµβαίνει όταν η γραφική της παράταση είναι σχετικά επίπεδη, δηλαδή πολλές λύσεις έχουν περίπου την ίδια καταλληλότητα, και η βέλτιστη διαφέρει κατά πολύ από αυτές. Ένα απλό παράδειγµα είναι το εξής: Είναι αντιληπτό ότι τα χιλιάδες άτοµα που θα διασταυρώνονται θα δίνουν πανοµοιότυπη καταλληλότητα, χωρίς να υπάρχει ένα στοιχείο προς την κατεύθυνση του µέγιστου, δηλαδή του x0. Το πρόβληµα έγκειται στο γεγονός ότι δεν υπάρχει διαβάθµιση µεταξύ των λύσεων, και µόνο από τύχη µπορεί ο γενετικός να δώσει πλέον λύση. Η ιδιότητα της εξέλιξης µένει ανεκµετάλλευτη, και ο αλγόριθµος εκφυλλίζεται σε τυχαίες δοκιµές, που στην προκειµένη περίπτωση, είναι τακτική χειρότερη από τη σειριακή αναζήτηση. 2.2 Ο Βασικός Γενετικός Αλγόριθµος Υπάρχουν πολλές παραλλαγές γενετικών αλγορίθµων, ώστε να είναι εφαρµόσιµοι σε ευρεία κλίµακα προβληµάτων. Ωστόσο, µοιράζονται κάποια κοινά συστατικά. Αυτά είναι: οι κωδικοποιηµένες λύσεις ο τελεστής επιλογής οι τελεστές αναπαραγωγής η ανανέωση του πληθυσµού και ο έλεγχος για σύγκλιση Ακολουθεί περιγραφή των παραπάνω συστατικών για την τυπική περίπτωση γενετικού αλγορίθµου.

25 Γενετικοί Αλγόριθµοι Κωδικοποίηση Λύσεων Για την προσαρµογή ενός απλού γενετικού αλγορίθµου σε ένα πρόβληµα, το πρώτο βήµα είναι ο προσδιορισµός της συνάρτησης καταλληλότητας. Η τελευταία είναι µια περιγραφή του προβλήµατος, εκφρασµένη ως συνάρτηση που πρέπει να µεγιστοποιηθεί. Οι είσοδοί της είναι που θα καθορίσουν τη σηµασία, το φαινότυπο αλλιώς, της όποιας αναπαράστασης επιλεχθεί. Εφόσον πλέον γνωρίζουµε το είδος των παραµέτρων του προβλήµατος, µένει να καταλήξουµε σε κάποια κωδικοποίηση. Άλλωστε, αν συµφωνήσουµε σε συγκεκριµένη µορφή χρωµοσώµατος, όλοι οι µηχανισµοί που θα περιγραφούν στη συνέχεια θα είναι εφαρµόσιµοι σε οποιαδήποτε συνάρτηση καταλληλότητας. Τις περισσότερες φορές χρησιµοποιείται η δυαδική αναπαράσταση, κυρίως λόγω της ευκολίας διαχείρισης αυτής από τους υπολογιστές. Επιπλέον επιλέγεται να είναι το µέγεθος του χρωµοσώµατος σταθερό, αν και υπάρχουν παραλλαγές. Όλες οι συµβολοσειρές µήκους n που δύνανται να απαρτίσουν χρωµόσωµα είναι ανήκουν στο παρακάτω σύνολο: Επειδή οι περισσότερες από τις διαδικασίες που περιγράφονται στις επόµενες παραγράφους εφαρµόζονται στις κωδικοποιηµένες συµβολοσειρές, παρουσιάζεται το πρόβληµα της εµφάνισης µη έγκυρων χρωµοσωµάτων. Μη έγκυρο χαρακτηρίζεται ένα χρωµόσωµα, όταν ένα ή περισσότερα γονίδιά του δεν κωδικοποιούν κάποιες από τις προκαθορισµένες τιµές. Ας θεωρήσουµε ένα παράδειγµα στο οποίο µια λύση αποτελείται από µια µεταβλητή οι οποία είναι θετική ακέραια στο διάστηµα [0, 1000]. Υποθέτουµε, ακόµα, ότι η κωδικοποίηση συνίσταται στην µετατροπή της τιµής στο δυαδικό σύστηµα. Ευνόητο είναι ότι αρκούν 10 bits για την αναπαράσταση όλων των δυνατών τιµών, 1001 τω αριθµώ. Σε αυτή την περίπτωση µη έγκυρες θεωρούνται οι συµβολοσειρές των οποίων η τιµή στο δεκαδικό σύστηµα είναι από 1001 έως 1023, καθώς αυτοί οι αριθµοί δεν ορίζονται για το πρόβληµά µας. Για το θέµα της κωδικοποίησης, λοιπόν, προκύπτουν τα εξής ζητήµατα: Εύρεση µηχανισµού ελέγχου εγκυρότητας των λύσεων. Επιλογή αναπαράστασης τέτοιας ώστε να ελαχιστοποιείται η πιθανότητα παραγωγής µη έγκυρων λύσεων, αλλιώς θα επιβαρύνεται ο αλγόριθµος µε πράξεις επί των συµβολοσειρών που δε θα έχουν αντίκρισµα Επιλογή Γονέων Έχοντας παράγει έναν αρχικό, τυχαίο πληθυσµό, και έχοντας αξιολογήσει τα άτοµά του µε τη βοήθεια της συνάρτησης καταλληλότητας, µένει η επιλογή των καλύτερων, αυτών που θα συµµετάσχουν στη διαδικασία της αναπαραγωγής. Ο τελεστής επιλογής είναι το συστατικό µε το οποίο γίνεται η διάκριση µεταξύ των λύσεων. Θα µπορούσε να είναι µια προσδιοριστική λειτουργία, αλλά συνήθως σκόπιµα εισάγονται παράγοντες τυχαιότητας στη διαδικασία.

26 26 Κεφάλαιο δεύτερο Κατά τη διαδικασία της επιλογής, αρχικά τα χρωµοσώµατα αντιγράφονται σε ένα ενδιάµεσο πληθυσµό, στον οποίο τα άτοµα του αρχικού εισέρχονται µε πιθανότητα που εξαρτάται από τη καταλληλότητάς τους. Τα επιλεχθέντα αυτά άτοµα θα δώσουν αργότερα ανά ζεύγη απογόνους µε την εφαρµογή τελεστών αναπαραγωγής. Το ακόλουθο σχήµα είναι ενδεικτικό της διαδικασίας. Σχήµα 2-3 Υπάρχουν πολλές πολιτικές για την επιλογή των ατόµων για αναπαραγωγή. Μια από τις πιο δηµοφιλείς είναι η επιλογή ρουλέτας (Roulette Wheel Selection), η οποία αποδίδει σε κάθε χρωµόσωµα πιθανότητα επιλογής ανάλογη µε την καταλληλότητά του. Η ονοµασία της δικαιολογείται αν θεωρήσουµε µια απεικόνιση των χρωµοσωµάτων σε ένα τροχό ρουλέτας, όπου το κάθε ένα από αυτά καταλαµβάνει χώρο ανάλογο της καταλληλότητάς του. Σχήµα 2-4 Η τιµή της πιθανότητας για το χρωµόσωµα Xi προκύπτει από τον τύπο:

27 Γενετικοί Αλγόριθµοι 27 ηλαδή ισούται µε την τιµή της καταλληλότητας του τρέχοντος ατόµου, προς το άθροισµα των αντίστοιχων τιµών για όλα τα άτοµα. Η επιλογή προσοµοιώνει τη ρίψη µιας υποθετικής µπίλιας στη ρουλέτα που ορίσαµε. Είναι προφανές ότι όσο καλύτερο είναι ένα άτοµο, τόσο µεγαλύτερη η πιθανότητα να σταµατήσει σε αυτό η µπίλια, χωρίς να αποκλείεται επανεπιλογή του. Στην πράξη, η επιλογή ρουλέτας υλοποιείται µε τα ακόλουθα βήµατα: 1. Εύρεση του αθροίσµατος των τιµών καταλληλότητας Σ f(xi) 2. Επιλογή τυχαίου αριθµού n µεταξύ 0 και Σ f(xi), µε κανονική κατανοµή 3. Επιστροφή του πρώτου µέλους του πληθυσµού του οποίου η καταλληλότητα, προστιθέµενη σε αυτές των προηγούµενων µελών του πληθυσµού, υπερβαίνει ή είναι ίση του n Μια άλλη διαδικασία επιλογής είναι η στοχαστική δειγµατοληψία υπολοίπου (remainder stochastic sampling). Η ιδιαιτερότητά της είναι ότι µηδενίζει την πιθανότητα της µη συµµετοχής των καλύτερων ατόµων στην αναπαραγωγή, χωρίς όµως να εξαλείφεται η τυχαιότητα στην επιλογή του πληθυσµού. Η διαδικασία συνοψίζεται στη διαίρεση της καταλληλότητας του κάθε χρωµοσώµατος µε τη µέση τιµή της τρέχουσας γενιάς. Το ακέραιο µέρος της διαίρεσης δείχνει πόσες φορές σίγουρα θα συµµετέχει το παρόν άτοµο στην αναπαραγωγή, ενώ το υπόλοιπο αντιστοιχεί στην πιθανότητα συµµετοχής µια φορά ακόµα. Για παράδειγµα, αν για ένα χρωµόσωµα ο παραπάνω λόγος είναι 1.25, τότε θα τοποθετηθεί ένα αντίγραφό του στον ενδιάµεσο πληθυσµό, και υπάρχει πιθανότητα 0.25για ακόµα µια αντιγραφή. Αν ο λόγος ήταν 0.84, τότε το άτοµο θα συµµετείχε στην αναπαραγωγή µε αυτήν ακριβώς την πιθανότητα. Ανάλογα µε τα δεδοµένα του προβλήµατος και τη µορφή της συνάρτησης καταλληλότητας, ενδέχεται οι δύο παραπάνω τεχνικές να παρουσιάσουν προβλήµατα. Είναι δυνατόν κάποια καλά άτοµα να επικρατήσουν από πολύ νωρίς, οδηγώντας τον αλγόριθµο σε τοπικά µέγιστα. Ανάµεσα στους µηχανισµούς για τη διατήρηση της ποικιλοµορφίας στον πληθυσµό είναι και οι δύο παρακάτω πολιτικές επιλογής: o Επιλογή µε βάση την κατάταξη (rank selection): Αντί να λαµβάνεται υπ όψιν η ίδια η καταλληλότητα του ατόµου για την επιλογή, χρησιµοποιείται ο βαθµός κατάταξης αυτής. Έτσι, αποφεύγεται η εκτεταµένη επανεπιλογή κάποιας υπερβολικά καλής λύσης. o Επιλογή τουρνουά (tournament selection): Η επιλογή ενός γονέα συνίσταται αρχικά στη λήψη ενός τυχαίου, µικρού δείγµατος του πληθυσµού. Στη συνέχεια από αυτό το δείγµα επιλέγεται: το καλύτερο από τα χρωµοσώµατα µε πιθανότητα p

28 28 Κεφάλαιο δεύτερο το δεύτερο καλύτερο µε πιθανότητα p*(1-p) και τρίτο καλύτερο µε πιθανότητα p*(1-p) 2, κοκ Στην απλούστερη περίπτωση, όπου το p ισούται µε 1, επιλέγεται πάντα το καλύτερο ιασταύρωση και Μετάλλαξη Χρωµοσωµάτων Στη φύση, κατά τη δηµιουργία απογόνων, το γενετικό υλικό των γονέων αναµιγνύεται, ώστε να συνδυαστούν τα χαρακτηριστικά που κωδικοποιούνται σε αυτό, και να κληροδοτηθούν στον απόγονο. Για το πεδίο των γενετικών αλγορίθµων, ο τελεστής διασταύρωσης είναι που προσοµοιώνει αυτή τη λειτουργία. Κατά τη φάση της αναπαραγωγής, έχει υιοθετηθεί η εφαρµογή ενός ακόµα τελεστή, αυτού της µετάλλαξης. Όπως και στη φύση, συµβαίνει σπάνια, και η χρήση του αποσκοπεί, όπως θα δούµε, στην ανοµοιοµορφία του πληθυσµού. Σε αντίθεση µε τον τελεστή επιλογής, ο οποίος συνήθως επιδρά στα αρχικά χαρακτηριστικά εφαρµόζοντας σε αυτά τη συνάρτηση καταλληλότητας, οι τελεστές αναπαραγωγής επιδρούν στην κωδικοποιηµένη ακολουθία-χρωµόσωµα. Άλλωστε, η ανάγκη εφαρµογής των, ήταν που επέβαλε είδος κωδικοποίησης που προσεγγίζει σε ιδιότητες το γενετικό υλικό των οργανισµών. Στα πλαίσια της εφαρµογής της διασταύρωσης σε δυαδικές συµβολοσειρές, παράγονται ακριβώς δύο απόγονοι, από δύο ακολουθίες-γονείς. Ο συνδυασµός των τµηµάτων των αρχικών ακολουθιών γίνεται µε τρόπο ώστε το i-οστό bit του απογόνου να είναι το i-οστό bit ενός από τους δύο γονείς. Η απλούστερη πολιτική για το συνδυασµό χρωµοσωµάτων είναι η διασταύρωση σηµείου (1-point crossover). Σε πρώτο βήµα επιλέγεται, τυχαία κάθε φορά, ένα σηµείο στις αρχικές ακολουθίες, το σηµείο διασταύρωσης. Το πρώτο χρωµόσωµαπαιδί προκύπτει από τη συνένωση του πρώτου τµήµατος του ενός γονέα, µέχρι το σηµείο διασταύρωσης, και του δεύτερου τµήµατος του δεύτερου γονέα. Αντίστροφα για το άλλο παιδί, όπως φαίνεται και στο σχήµα. Σχήµα 2-5 Την ίδια ακριβώς λογική ακολουθεί η διασταύρωση δύο σηµείων (2-point crossover). Όπως και το όνοµά της προδίδει, τα σηµεία διασταύρωσης είναι πλέον δύο. Οτιδήποτε µεταξύ αυτών, αντιµετατίθεται κατά τη διαδικασία στης δηµιουργίας των χρωµοσωµάτων-απογόνων.

29 Γενετικοί Αλγόριθµοι 29 Σχήµα 2-6 Ενδιαφέρον παρουσιάζει και η οµοιόµορφη διασταύρωση (uniform crossover), στην οποία το i-οστό bit ενός παιδιού µπορεί να κληρονοµείται µε πιθανότητα 0.5 από οποιονδήποτε από τους δύο γονείς. Έχει ήδη τονιστεί η σηµασία της ποικιλίας σε ένα πληθυσµό. ιαφορετικά χρωµοσώµατα σηµαίνει και διαφορετικά µέτωπα στο χώρο αναζήτησης. Ωστόσο, µε διαδοχικές διασταυρώσεις τα άτοµα τείνουν να προσεγγίζουν κάποιο βέλτιστο, ίσως όχι το ολικό, εφόσον δεν είναι σίγουρο ότι έχει ερευνηθεί διεξοδικώς ο χώρος των λύσεων. Ο τελεστής µετάλλαξης προσπαθεί να χαλάσει τη διαδικασία στης σύγκλισης των χρωµοσωµάτων, µεταβάλλοντας κατά τυχαίο τρόπο κάποια χρωµοσώµατα, ώστε να αλλάξει τελείως τα χαρακτηριστικά τους. εν επηρεάζει αρνητικά την πορεία προς την εύρεση της λύσης, καθώς εφαρµόζεται σε ελάχιστα χρωµοσώµατα, συνήθως της τάξεως του 1%. Το όφελος της εφαρµογής του γίνεται αντιληπτό µακροπρόθεσµα. Το αποτέλεσµα είναι ότι εισάγονται νέα άτοµα, άρα και νέα χαρακτηριστικά που θα πρέπει να δοκιµαστούν και να ανταγωνιστούν τα υπόλοιπα. Ενδέχεται κάποια από αυτά να µην είχαν ποτέ την ευκαιρία να συµµετέχουν στον πληθυσµό κατά τη φυσιολογική εξέλιξη του αλγορίθµου. Στην απλούστερη µορφή του, ο τελεστής µετάλλαξης αλλάζει την τιµή ενός τυχαίου bit κάποιου απογόνου. Μια άλλη περίπτωση είναι η αντιστροφή περισσοτέρων τυχαίων bit, ενώ είναι δυνατή και η πλήρης αντικατάσταση του χρωµοσώµατος από κάποιο άλλο τυχαίο. Ανεξαρτήτως µορφής, συνήθως εφαρµόζεται µετά τη διασταύρωση, µε µικρή, όπως διατυπώθηκε, πιθανότητα Θέµατα Σύγκλισης Έχοντας περιγράψει τα βασικά συστατικά ενός γενετικού αλγορίθµου, είµαστε σε θέση να δούµε το πώς αυτά αξιοποιούνται στην πράξη. Στη συνέχεια δίνεται ο βασικός γενετικός αλγόριθµος ως µια σειρά από βήµατα:

30 30 Κεφάλαιο δεύτερο 1. ηµιουργία τυχαίου αρχικού πληθυσµού 2. Αξιολόγηση των ατόµων του πληθυσµού µε τη βοήθεια της συνάρτησης καταλληλότητας 3. Επιλογή ατόµων για αντιγραφή στον ενδιάµεσο πληθυσµό, µε κάποια από τις πολιτικές επιλογής 4. Εφαρµογή των επιλεχθέντων τελεστών διασταύρωσης και µετάλλαξης, ώστε να προκύψει νέος πληθυσµός, ίδιου αριθµού ατόµων µε τον προηγούµενο 5. Έλεγχος της βέλτιστης τιµής καταλληλότητας που έχει βρεθεί. Επιστροφή στο βήµα 2 αν αυτή δεν είναι ικανοποιητική Από τα παραπάνω βήµατα, αυτό που δεν έχει πλήρως αποσαφηνιστεί είναι το πέµπτο. εν είναι απλό να προσδιοριστεί το πότε µια τιµή είναι ικανοποιητική. Στην καλύτερη περίπτωση, µετά από έναν αριθµό βηµάτων, θα έχουµε το µέγιστο της συνάρτησης καταλληλότητας. Ωστόσο, συνήθως αρκεί και µια καλή προσέγγισή του. Η µορφή του χώρου αναζήτησης είναι συνήθως άγνωστη, αυτή είναι άλλωστε και η δύναµη των γενετικών. Όµως, αυτό καθιστά δύσκολη την εκτίµηση του πόσο κοντά στη βέλτιστη είναι µια λύση. Συνεπώς, θα πρέπει να παρατηρηθεί η πορεία της σύγκλισης του αλγορίθµου. Μια πρώτη σκέψη είναι η παρακολούθηση του µέσου όρου της καταλληλότητας του πληθυσµού. Όταν για αρκετές γενιές αυτός µεταβάλλεται ελάχιστα, τότε ο γενετικός αλγόριθµος δεν έχει νόηµα να συνεχίσει. Τα άτοµα του πληθυσµού µοιάζουν υπερβολικά, και γίνονται άσκοπες ανταλλαγές γενετικού υλικού, χωρίς να δίνουν διαφορετικούς σε ιδιότητες απογόνους. Όµως αυτό δεν είναι σωστό κριτήριο για τον τερµατισµό του αλγορίθµου, καθώς ενδέχεται να έχει εγκλωβιστεί σε τοπικό µέγιστο, αγνοώντας το ολικό. Αυτός είναι άλλωστε ο λόγος που έχει υιοθετηθεί η µετάλλαξη αλλά και τελεστές επιλογής, όπως επιλογή τουρνουά, που ενισχύουν την ποικιλοµορφία. Με χρήση τελεστών όπως η µετάλλαξη, είναι απίθανο να συγκλίνει η εξέλιξη του πληθυσµού σε ένα σηµείο. Ωστόσο, το αποτέλεσµα που θα δοθεί από τον αλγόριθµο θα είναι το καλύτερο άτοµο που έχει προκύψει σε όλη τη διαδικασία, και όχι η τάση της κάθε γενιάς. Συνεπώς, αρκεί η παρατήρηση της βέλτιστης και της επιρροής που ασκείται σε αυτήν από την τάση των ατόµων να συγκλίνουν σε ένα σηµείο, αλλά και τις εξάρσεις µετάλλαξης και άλλων παραπλήσιων µέτρων. Αν για παράδειγµα µια αύξηση του ρυθµού µετάλλαξης δεν µεταβάλλει σε βάθος χρόνου τη λύση που έχει χαρακτηριστεί ως βέλτιστη µέχρι το σηµείο εκείνο, τότε πιθανώς ο αλγόριθµος κατέληξε σε ικανοποιητικό αποτέλεσµα. 2.3 Ανάλυση Λειτουργίας Μέχρι τώρα, έχει γίνει η υπόθεση ότι µετά από κάποιο αριθµό εκτελέσεων, ο γενετικός αλγόριθµος συγκλίνει. Όµως, δεν έχει γίνει λόγος για την αιτία που προκαλεί αυτή τη σύγκλιση. ιαισθητικά είναι αντιληπτό ότι καλοί γονείς δίνουν και

31 Γενετικοί Αλγόριθµοι 31 καλούς απογόνους, αλλά χρειάζεται µια πιο εµπεριστατωµένη εξήγηση του φαινόµενου. Εφόσον ο λόγος είναι για είδος πιθανοκρατικών αλγορίθµων, δεν υπάρχει καν εγγύηση για σύγκλιση, αντίθετα µε ντετερµινιστικές µεθόδους βελτιστοποίησης. Ωστόσο, έχουν γίνει προσπάθειες ερµηνείας της λειτουργίας της εξέλιξης. ύο προσεγγίσεις είναι το Θεώρηµα Σχηµάτων και η Υπόθεση των οµικών Μονάδων Σχήµατα και Ιδιότητες Για της κατανόηση της όποιας προσπάθειας για εξήγηση της σύγκλισης των γενετικών αλγορίθµων θα πρέπει να αποσαφηνιστούν οι έννοιες που χρησιµοποιούνται. Θεωρώντας ότι το αλφάβητο των κωδικοποιηµένων συµβολοσειρών είναι το {0, 1}, τότε ένα σχήµα είναι ένα χρωµόσωµα που αποτελείται από το αλφάβητο {0, 1, *}, όπου το σύµβολο * υποδηλώνει µια οποιαδήποτε τιµή, 0 ή 1. Για παράδειγµα, το σχήµα **10*1 αντιστοιχεί σε όλα τα χρωµοσώµατα µήκους 6 που έχουν 1 στις θέσεις 3 και 6, και 0 στη θέση 4. Ως τάξη σχήµατος αναφέρεται το πλήθος των συµβόλων που είναι διάφορα από *. Προφανώς, όσο µεγαλύτερη η τάξη, τόσο πιο συγκεκριµένο είναι το σχήµα, δηλαδή περιγράφει λιγότερα χρωµοσώµατα. Μήκος σχήµατος είναι η απόσταση των δύο πιο αποµακρυσµένων συµβόλων που δεν είναι *. Για το παραπάνω παράδειγµα η τάξη θα είναι 3, ενώ το µήκος ισούται µε Το Θεώρηµα των Σχηµάτων Με το θεώρηµα των σχηµάτων, ο Holland ήταν ο πρώτος που έδωσε τεκµηριωµένη εξήγηση της λειτουργίας των γενετικών. Σύµφωνα µε το θεώρηµα αυτό, ο χώρος αναζήτησης παίρνει τη µορφή ενός χώρου n διαστάσεων, όπου n το µήκος του χρωµοσώµατος, ενώ τα χρωµοσώµατα αντιστοιχούν σε σηµεία στο χώρο αυτό. Στο σχήµα που ακολουθεί φαίνεται η αντιστοιχία για µήκος χρωµοσώµατος 3, όπου έχουµε έναν απλό τρισδιάστατο χώρο, αλλά και για µήκος χρωµοσώµατος 4.

32 32 Κεφάλαιο δεύτερο Σχήµα 2-7 Παρατηρούµε, και στα δύο σχήµατα, ότι δύο σηµεία συνδέονται όταν διαφέρουν ακριβώς κατά ένα δυαδικό ψηφίο. Επιπλέον, οµάδες χρωµοσωµάτων των οποίων το i- οστό bit είναι το ίδιο σχηµατίζουν επίπεδα για το τρισδιάστατο σχήµα και κύβους για το τετραδιάστατο. Αυτού του είδους τις συµβολοσειρές, όπου κάποια ψηφία είναι σταθερά και τα υπόλοιπα παίρνουν οποιαδήποτε τιµή, τα ονοµάσαµε σχήµατα. Συνεπώς, στη γενικότερη περίπτωση ένα σχήµα αντιστοιχεί σε ένα υπερεπίπεδο του χώρου αναζήτησης, µε τον ίδιο τρόπο που αντιστοιχεί σε µια οµάδα λύσεων. Για το πρώτο παράδειγµα, το σχήµα 0*1 αντιπροσωπεύει την γραµµή που ενώνει τα 001 και 011, ενώ το σχήµα 1** ισοδυναµεί µε το επίπεδο που περιλαµβάνει τα σηµεία 101, 111, 110 και 100. Η εικόνα που ακολουθεί είναι διαφωτιστική. Σχήµα 2-8

33 Γενετικοί Αλγόριθµοι 33 Η πληροφορία ότι µια συµβολοσειρά ανήκει σε κάποιο υπερεπίπεδο, δεν είναι ιδιαίτερα σηµαντική, αν κάθε σηµείο του χώρου εξετάζεται αποµονωµένα. Αυτός είναι και ο λόγος που είναι τόσο κρίσιµη η έννοια του πληθυσµού. Ένας πληθυσµός δειγµατικών σηµείων παρέχει πληροφορία για µεγάλο αριθµό υπερεπιπέδων. Χαρακτηριστικό της λειτουργίας των γενετικών αλγορίθµων είναι ο έµµεσος παραλληλισµός (implicit parallelism). Ο όρος δικαιολογείται από το γεγονός ότι πολλά υπερεπίπεδα δειγµατοληπτούνται όταν ένας πληθυσµός αξιολογείται, και µάλιστα, πολύ περισσότερα από τα άτοµα του αντίστοιχου πληθυσµού. Ο Holland απέδειξε ότι ο αριθµός των σχηµάτων που µεταφέρονται από γενιά σε γενιά είναι την τάξης του N 3, όπου N το µέγεθος του πληθυσµού. Η συνάρτηση καταλληλότητας επιδρά άµεσα στα άτοµα, ωστόσο, έµµεσα βαθµολογούνται και τα υπερεπίπεδα που περιλαµβάνουν τα άτοµα αυτά. Μάλιστα, η επίδραση της αξιολόγησης είναι συσωρευτική, και παρέχει στατιστική πληροφορία για οποιοδήποτε συγκεκριµένο σύνολο υπερεπιπέδων. Οι διαδικασίες, λοιπόν, ενός γενετικού αλγορίθµου εφαρµόζονται αποκλειστικά στα χρωµοσώµατα, χωρίς καµία γνώση του χώρου αναζήτησης. Ο παραλληλισµός έγκειται στο ότι µέσω της επιλογής και της αναπαραγωγής, τα σχήµατα των ανταγωνιζόµενων υπερεπιπέδων αυξάνουν ή µειώνουν την εκπροσώπησή τους στον πληθυσµό, σύµφωνα µε τη σχετική καταλληλότητα των συµβολοσειρών που περιλαµβάνονται σε αυτά. Ορίσαµε καλό ένα σχήµα του οποίου το υπερεπίπεδο περιλαµβάνει πολλές καλές λύσεις. Ο λόγος που αυξάνεται η πιθανότητα εµφάνισης των καλών σχηµάτων κατά τη διάρκεια της εξέλιξης έγκειται στον τελεστή επιλογής. Ωστόσο, οι τελεστές αναπαραγωγής έχουν διασπαστική επίδραση στα τρέχοντα σχήµατα. Συνεπώς, για να έχει µεγάλη πιθανότητα επανεµφάνισης ένα καλό σχήµα, πρέπει να είναι µικρού µήκους και χαµηλής τάξης, ιδιότητα που ευνοεί το συνδυασµό διαφορετικών καλών σχηµάτων. Απόδειξη της επίδρασης των γενετικών τελεστών στα σχήµατα διατίθεται στο σχετικό παράρτηµα Η Υπόθεση των οµικών Μονάδων Τα όσα έχουν κατατεθεί σχετικά µε το θεώρηµα των σχηµάτων δεν συνιστούν αυστηρή απόδειξη ότι ένας γενετικός αλγόριθµος θα συγκλίνει, αλλά είναι απλές ενδείξεις. Στην πράξη, δεν υπάρχει ολοκληρωµένη θεωρία που να δίνει ξεκάθαρη απάντηση στο θέµα της σύγκλισης, παρά µόνο µία υπόθεση. Σύµφωνα µε την Υπόθεση των οµικών µονάδων (Building Block Hypothesis), ένας γενετικός αλγόριθµος, αναζητώντας το βέλτιστο κάποιας συνάρτησης, δηµιουργεί σε κάθε βήµα καλύτερες λύσεις µέσω της αντιπαράθεσης µικρών σε µήκος, χαµηλής τάξης και υψηλής καταλληλότητας σχηµάτων, τα οποία καλούνται δοµικές µονάδες (building blocks). Οι τελεστές διασταύρωσης και µετάλλαξης έχουν την ικανότητα να παράγουν, να προάγουν και να αντιπαραθέτουν δοµικές µονάδες προκειµένου να σχηµατίσουν βέλτιστες ακολουθίες. Η διασταύρωση τείνει να διατηρεί τη γενετική πληροφορία που υπάρχει στις ακολουθίες-γονείς. Οπότε, όταν οι προς διασταύρωση ακολουθίες

34 34 Κεφάλαιο δεύτερο είναι όµοιες, µειώνεται σηµαντικά η δυνατότητα παραγωγής νέων δοµικών µονάδων. Η τελευταία πρόταση αποτελεί την εξήγηση του φαινόµενου της πρόωρης σύγκλισης, αλλά και τον ουσιαστικό λόγο της χρήσης της µετάλλαξης, η οποία δεν συνιστά τελεστή συντήρησης, αλλά έχει τη δυνατότητα δραστικής παραγωγής νέων δοµικών µονάδων. Ακόµη, σηµαντικός είναι ο ρόλος του τελεστή της επιλογής, επειδή τείνει να είναι πολωµένος προς τις δοµικές µονάδες που έχουν υψηλότερες τιµές καταλληλότητας. Η κατηγοριοποίηση των δοµικών µονάδων από τη διαδικασία επιλογής είναι που καθορίζει την παρουσία τους από γενιά σε γενιά Το Πρόβληµα της Κωδικοποίησης Έχει ήδη διατυπωθεί, σε προηγούµενη ενότητα του κεφαλαίου, ότι οι γενετικοί αλγόριθµοι δεν είναι κατάλληλοι για την επίλυση οποιουδήποτε προβλήµατος βελτιστοποίησης. Ας δούµε πώς αυτό δικαιολογείται από την υπόθεση των δοµικών µονάδων. Απόρροια της εν λόγω υπόθεσης είναι η ανάγκη κωδικοποίησης των λύσεων µε τρόπο που να ικανοποιεί τη λογική των δοµικών µονάδων. ηλαδή, να γίνεται στην πράξη αντιπαράθεση και προώθηση σχηµάτων µικρής τάξης και µήκους. Για να γίνει κάτι τέτοιο, θα πρέπει κάθε στοιχείο της κωδικοποιηµένης συµβολοσειράς να αξιοποιείται, ώστε να επηρεάζει την καταλληλότητα της λύσης. Όµως µια τέτοια συµπεριφορά δεν είναι εφικτή σε όλα τα είδη προβληµάτων. Για την περίπτωση µιας γραµµικής συνάρτησης καταλληλότητας, όπως η εικονιζόµενη, είναι προφανής η επιρροή του i-οστού bit της ακολουθίας s, στην καταλληλότητα του χρωµοσώµατος. Όπου c i θεωρούµε έναν πίνακα συντελεστών. Για ένα πρόβληµα µοναδιαίου παλµού όµως, όπως αυτό της παραγράφου 2.1.3, οι περισσότερες από τις πιθανές αναπαραστάσεις θα έχουν ακριβώς την ίδια τιµή καταλληλότητας. Τότε το φαινόµενο της µη σύγκλισης είχε αποδοθεί στην έλλειψη πληροφορίας προς την κατεύθυνση της βέλτιστης λύσης. Τώρα, σύµφωνα µε όσα έχουν καταγραφεί στην προηγούµενη παράγραφο, είναι αντιληπτό ότι οφείλεται στην απουσία δοµικών µονάδων. Πράγµατι, όταν ένα σχήµα της µορφής ***101** έχει ίδια καταλληλότητα µε κάποιο **011**, είναι προφανές ότι οποιαδήποτε επιλογή ή διασταύρωση µεταξύ των δύο είναι ανούσια. Μόνο η πράξη της µετάλλαξης έχει νόηµα εφαρµογής, αλλά υπό συνθήκες όπως αυτές ισοδυναµεί µε τυχαία αναζήτηση. Αυτό το είδος της µη γραµµικότητας αναφέρεται ως επίσταση. Προβλήµατα χαµηλής επίστασης, δηλαδή γραµµικά, µπορούν εύκολα να λυθούν µε παραδοσιακές µεθόδους βελτιστοποίησης. Οι γενετικοί αλγόριθµοι προσφέρονται κυρίως για προβλήµατα µε µέσο βαθµό επίστασης, ενώ για αυτά µε υψηλή επίσταση, δεν υπάρχει καν αποδοτικός τρόπος επίλυσης.

35 Γενετικοί Αλγόριθµοι Παραλλαγές Γενετικών Αλγορίθµων Ο τυπικός γενετικός αλγόριθµος, όπως έχει περιγραφεί σε προηγούµενη ενότητα, µπορεί να προσαρµοστεί σε διάφορα από τα συστατικά του, ώστε να εφαρµόζεται σε προβλήµατα τα οποία δε συνάδουν µε τις προϋποθέσεις κωδικοποίησης που έχουν τεθεί. Επιπλέον, έχουν υιοθετηθεί παραλλαγές που προωθούν την έννοια είτε της ποικιλοµορφίας, είτε της συντήρησης του πληθυσµού, µε στόχο τη µεγιστοποίηση της απόδοσης µακροπρόθεσµα Ελιτισµός Η αύξηση του ρυθµού σύγκλισης ενός γενετικού αλγορίθµου, είναι µια κατεύθυνση, αν και όχι η µοναδική, προς την αύξηση της απόδοσής του. Ένα µέτρο που προάγει τη σύγκλιση είναι ο ελιτισµός (elitism). Η εφαρµογή του είναι δυνατή σε οποιοδήποτε από τα σχήµατα επιλογής που έχουν παρουσιαστεί. Επί της ουσίας, ο ελιτισµός είναι µια διαφορετική πολιτική για την ανανέωση του πληθυσµού. Στη βιβλιογραφία αναφέρεται και ως πολιτική µερικής ανανέωσης. Στις µέχρι τώρα περιπτώσεις, τα άτοµα κάποιας γενεάς αντικαθίσταντο εξ ολοκλήρου από την επόµενη. Ο ελιτισµός συνεπάγεται ότι τα καταλληλότερα άτοµα µιας γενεάς θα αντιγραφούν στην επόµενη, αλλά και θα συµµετέχουν κανονικά στη διαδικασία της αναπαραγωγής. Προφανές όφελος από της εξαιρετικής αυτής µεταχείρισης είναι η εκµηδένιση της πιθανότητας να µην επιλεγεί κάποιο καλό χρωµόσωµα. Ωστόσο, δεν είναι το σηµαντικότερο, καθώς η πιθανότητα αυτή είναι αναµενόµενα µικρή. Άλλωστε η στοχαστική δειγµατοληψία υπολοίπου αναπτύχθηκε προς αντιµετώπιση αυτού του προβλήµατος. Περισσότερο ενδιαφέρον έχει να εξετάσουµε την επίδραση που έχει στα σχήµατα η εν λόγω πολιτική. Σε πρώτο επίπεδο παρατηρούµε ότι τα υψηλότερης καταλληλότητας σχήµατα κατακλύζουν τους πληθυσµούς των γενεών που ακολουθούν. Η πρόωρη σύγκλιση αποτελεί κίνδυνο, γεγονός που επιβάλλει τα ευνοηµένα άτοµα να είναι σχετικά µικρό ποσοστό του συνόλου, όχι µεγαλύτερο συνήθως από 20%. Χαρακτηριστικό είναι ότι στη βιβλιογραφία αναφέρεται ότι ο ελιτισµός πρέπει να χρησιµοποιείται σε περιπτώσεις τοπικής αναζήτησης. Όµως, δεν πρέπει να παραβλέπουµε ότι δίνεται η δυνατότητα ανταγωνισµού νέων και παλαιότερων σχηµάτων. Τα νέα σχήµατα µπορεί έχουν προκύψει είτε από συνδυασµούς του γενετικού υλικού των προγόνων, είτε από τυχαίες µεταλλάξεις. Το σηµαντικό είναι ότι οι απόγονοι θα προωθηθούν εφόσον είναι το ίδιο καλοί ή και καλύτεροι από τους γονείς, µε άλλα λόγια, εφόσον είναι προς την κατεύθυνση της βέλτιστης λύσης. Για την αποφυγή της πρόωρης επικράτησης συγκεκριµένων σχηµάτων, εκτός από αύξηση του ρυθµού µετάλλαξης προτείνεται και η τροποποίησης της αξιολόγησης των ατόµων µε βάση την ηλικία. Αυτό επιτυγχάνεται µε την προσαρµογή στη

36 36 Κεφάλαιο δεύτερο συνάρτηση καταλληλότητας µιας ποινής που εξαρτάται από την ηλικία του αξιολογούµενου. Με την πάροδο ενός αριθµού γενεών, τα αρχικά ευνοηµένα άτοµα θα αντικατασταθούν, αφού πρώτα έχουν επηρεάσει αρκετά τη σύγκλιση. Συνεπώς, η διαδικασία µετατρέπεται σε ένα πλήθος τοπικών αναζητήσεων. Στην πορεία της εξέλιξης θα εξεταστούν πολλά τοπικά βέλτιστα, χωρίς να χαθεί η δυνατότητα έρευνας σε όλο το φάσµα του χώρου αναζήτησης Προσαρµοστικοί Γενετικοί Αλγόριθµοι Μια ακόµη παραλλαγή που έχει σκοπό να βελτιώσει την απόδοση είναι οι προσαρµοστικοί γενετικοί αλγόριθµοι. Η απλή αύξηση του ρυθµού σύγκλισης δεν οδηγεί πάντα σε καλύτερα αποτελέσµατα, όπως έχουµε δει. Χρησιµότερη θα ήταν η παρακολούθηση του ρυθµού αυτού, ώστε να προσαρµοστούν τα χαρακτηριστικά του αλγορίθµου στα δεδοµένα της πορείας της αναζήτησης. Ο λόγος γίνεται για γενετικούς αλγορίθµους των οποίων οι παράµετροι, όπως το µέγεθος πληθυσµού και οι πιθανότητες για διασταύρωση ή µετάλλαξη, µεταβάλλονται κατά της εκτέλεσή τους. Χαρακτηριστικό παράδειγµα προσαρµογής είναι η µεταβολή του ρυθµού µετάλλαξης ανάλογα µε τη µέση καταλληλότητα του πληθυσµού. Όσο, δεν παρατηρείται σηµαντική διακύµανση της καταλληλότητας, αυξάνεται η πιθανότητα µετάλλαξης, υποθέτοντας ότι ο αλγόριθµος έχει συγκλίνει σε τοπικό µέγιστο. Με αυτό τον τρόπο, του δίνεται η ευκαιρία να απεγκλωβιστεί. Όταν δε σηµειώνεται αύξηση της καταλληλότητας από βήµα σε βήµα, είναι λογικό να µειωθούν οι µεταλλάξεις, ώστε να επιταχυνθεί προσωρινά η σύγκλιση Κωδικοποίηση και Αναπαραγωγή σε Ειδικά Προβλήµατα Η κωδικοποίηση σε δυαδικές συµβολοσειρές είναι ιδιαίτερα βολική για τη λειτουργία των γενετικών αλγορίθµων, καθώς υπό προϋποθέσεις ικανοποιεί την υπόθεση των δοµικών µονάδων, ενώ προάγεται η τυχαιότητα στις διαδικασίες διασταύρωσης και µετάλλαξης. Όµως, σε ορισµένα προβλήµατα, η µορφή των πιθανών λύσεων επιβάλλει εναλλακτικές µορφές αναπαράστασης. Αιτία αυτής της αναγκαιότητας είναι συνήθως το µεγάλο αχρησιµοποίητο σύνολο δυαδικών λέξεων, µε συνέπεια την παραγωγή αναπαραστάσεων που δεν έχουν καµία σηµασία για το πρόβληµα. Το πρόβληµα του πλανόδιου πωλητή είναι αντιπροσωπευτικό της κατάστασης. Το πρόβληµα έγκειται στην εύρεση του µικρότερου σε κόστος µονοπατιού ενός βεβαρηµένου γράφου, ώστε κάθε κόµβος του γράφου να εµφανίζεται στο µονοπάτι ακριβώς µία φορά. Η ονοµασία του οφείλεται στον παραλληλισµό µε έναν πλανόδιο πωλητή που πρέπει να περάσει ακριβώς µία φορά από ένα σύνολο πόλεων, µε το µικρότερο δυνατό κόστος σε χιλιοµετρική απόσταση. Η λύσεις για ένα τέτοιο πρόβληµα είναι µονοπάτια που γράφου που περιέχουν όλες τις κορυφές. Η αξιολόγηση γίνεται µε το άθροισµα όλων των βαρών των ακµών που περιέχονται στο εκάστοτε µονοπάτι. Ας δούµε τώρα ένα παράδειγµα κωδικοποίησης σε χρωµοσώµατα για τον παρακάτω γράφο.

37 Γενετικοί Αλγόριθµοι 37 Σχήµα 2-9 Οι λύσεις µπορούν να παρασταθούν ως δυαδικές ακολουθίες όπου το κάθε γονίδιο συνιστά µια δυαδική παράσταση, µοναδική για κάθε πόλη. Έτσι έχουµε 0 => 000, 1 => 001, 2 => 010, 3 => 011 και 4 => 100. Για διασταύρωση δύο µονοπατιών θα έχουµε: µονοπάτι 1: => αναπαράσταση 1: µονοπάτι 2: => αναπαράσταση 2: Αν εφαρµοστεί διασταύρωση ενός σηµείου στο δέκατο bit θα έχουµε: γονέας 1: => απόγονος 1: φαινότυπος 1: 0, 1, 2,?, 4 γονέας 2: => απόγονος 2: φαινότυπος 2: 0, 2, 1, 0, 3 Παρατηρούµε και στους δύο απογόνους ότι το τέταρτο γονίδιο είναι προβληµατικό. Στον πρώτο απόγονο, η σχηµατισθείσα ακολουθία δεν έχει αντιστοιχηθεί σε κάποια από τις ακµές του γράφου, ενώ στο δεύτερο βλέπουµε ότι επαναλαµβάνεται η ακµή 0, χωρίς να εµφανίζεται καθόλου η ακµή 4. Μια πρώτη σκέψη θα ήταν η απαγόρευση της διασταύρωσης στα µέσα των γονιδίων των γονέων, ώστε να εκµηδενιστεί η πιθανότητα παραγωγής µη έγκυρων γονιδίων. Σε µια τέτοια περίπτωση, η δυαδική αναπαράσταση καθίστανται άχρηστη. Αρκεί πλέον η ακολουθία των ακµών για την παράσταση των µονοπατιών-λύσεων. Αξίζει να δοθεί ένα παράδειγµα διασταύρωσης ενός σηµείου µε τα νέα δεδοµένα: µονοπάτι-γονέας 1: ( ) => απόγονος 1: ( ) µονοπάτι-γονέας 2: ( ) => απόγονος 2: ( ) Είναι φανερό ότι και η νέα αναπαράσταση δεν είναι απαλλαγµένη από προβλήµατα εγκυρότητας. Αν για σηµείο διασταύρωσης επιλεχθεί αυτό που φαίνεται στο σχήµα, θα έχουµε επανάληψη της κορυφής 1 και απουσία της 2 στο πρώτο µονοπάτι, και αντίστροφα στο δεύτερο. Συνεπώς, είναι απαραίτητο η διαδικασία της αναπαραγωγής

38 38 Κεφάλαιο δεύτερο να εµπλουτιστεί από µια ακολουθία ελέγχων και διορθώσεων. Ένα απλό µέτρο είναι η αντικατάσταση της πλεονάζουσας κορυφής µε την εκλιπούσα. Να σηµειωθεί ότι η νέα αναπαράσταση επέφερε διαφοροποίηση στην έννοια των δοµικών µονάδων. εν πρόκειται πλέον για δυαδικές συµβολοσειρές, αλλά για τις απόλυτες θέσεις των κορυφών µέσα σε ένα µονοπάτι, κάτι που είναι πιο κοντά στη λογική του προβλήµατος. Αν και η πολιτική της διόρθωσης µετά την αναπαραγωγή είναι ορθή, ενδέχεται να µην είναι αποτελεσµατική για µεγάλους γράφους. Σύνηθες πρόβληµα είναι η προσθήκη ακµών που δεν υπάρχουν στον αρχικό γράφο, γεγονός που καθιστά φυσικά την όποια λύση άκυρη. Ειδικά για το πρόβληµα του πλανοδίου πωλητή, για το θέµα του συνδυασµού µονοπατιών, έχει προταθεί ένας διαφορετικός τελεστής αναπαραγωγής. Ο ανασυνδυασµός των ακµών (Edge Recombination) προσπαθεί να κατασκευάσει ένα µονοπάτι-παιδί, έχοντας ως είσοδο δύο ακολουθίες ακµών. Η λογική είναι ότι κάθε ακµή του νέου µονοπατιού θα πρέπει να ανήκει και σε ένα από τους δύο γονείς. εν είναι πάλι όλοι οι συνδυασµοί έγκυροι, αλλά µε συγκεκριµένη πολιτική διάσχισης των γονέων, υπάρχει πολύ καλή πιθανότητα για παραγωγή λύσης που να ικανοποιεί τους περιορισµούς. Ας δούµε τώρα το παράδειγµα του συνδυασµού µε το νέο τελεστή των µονοπατιών και : Σχήµα 2-10 Το σύνολο των ακµών µπλε χρώµατος αντιστοιχεί στον πρώτο γονέα, ενώ οι ακµές µαύρου χρώµατος στο δεύτερο. ιασχίζοντας το γράφο που σχηµατίστηκε επιλέγοντας κάθε φορά την ακµή µε το µεγαλύτερο αριθµό γειτόνων, µπορούµε να καταλήξουµε σε ένα µονοπάτι όπως το , που συνδυάζει χαρακτηριστικά, δηλαδή ακµές, και από τους δύο γονείς του. Σηµειωτέο είναι ότι ο νέος τελεστής ενεργεί σε ακµές και όχι σε κορυφές. Αυτό σηµαίνει ότι ως δοµικές µονάδες αντιµετωπίζονται οι σχετικές θέσεις των ακµών, και όχι οι απόλυτες. Μια τέτοια συµπεριφορά είναι επιθυµητή για τα δεδοµένα του παρόντος προβλήµατος, καθώς δεν έχει νόηµα να γίνεται λόγος για απόλυτη θέση σε ένα κυκλικό µονοπάτι. Τα όσα έχουν παρουσιαστεί για την επίλυση του προβλήµατος του πλανόδιου πωλητή, αποσκοπούν στην κατανόηση των προβληµάτων της παραδοσιακής κωδικοποίησης σε εξαιρετικά προβλήµατα. Ο αναγνώστης µπορεί να ανατρέξει στη βιβλιογραφία για περισσότερες λεπτοµέρειες [7].

39 Γενετικοί Αλγόριθµοι Κωδικοποίηση µε Πραγµατικές Τιµές Ένα µεγάλο µέρος των προβληµάτων βελτιστοποίησης του πραγµατικού κόσµου, έχουν παραµέτρους στο πεδίο των πραγµατικών αριθµών. Η διακριτοποίηση που έχει επιβληθεί µε την υιοθέτηση δυαδικών αναπαραστάσεων για τα χρωµοσώµατα, έχει κάποιες παρενέργειες: o Το πλήθος των πιθανών τιµών είναι καθορισµένο εκ των προτέρων. o Η ακρίβεια της λύσης περιορίζεται από το εύρος της διακριτοποίησης, που είναι 1/(2 n -1). o Συχνά δεν υπάρχουν λογικές δοµικές µονάδες. Αυτοί είναι λόγοι που ώθησαν την ανάπτυξη των γενετικών αλγορίθµων που κάνουν χρήση κωδικοποίησης µε πραγµατικές τιµές (Real-Coded genetic algorithms). Για ένα πρόβληµα βελτιστοποίησης στο χώρο X=R N, η αναπαράσταση των ατόµων θα είναι ως ένα N-διάστατο διάνυσµα πραγµατικών αριθµών: b = (x 1, x 2 x N ) Είναι ξεκάθαρο ότι το κάθε γονίδιο x i αναπαρίστανται ως έχει. Συνεπώς, δεν υπάρχει καµία διαφοροποίηση όσον αφορά την αξιολόγηση και επιλογή των λύσεων. Αυτές ήταν πράξεις που εφαρµόζονταν στο φαινότυπο του ατόµου, και όχι στην αναπαράστασή του ως χρωµόσωµα. Αλλά σε αυτή την παραλλαγή, φαινότυπος και χρωµόσωµα ταυτίζονται. Η απουσία όµως δυαδικής κωδικοποίησης επιβάλλει την εισαγωγή νέων τελεστών διασταύρωσης και µετάλλαξης. Το ζητούµενο σε µια διαδικασία διασταύρωσης είναι να περνούν οι ιδιότητες των γονέων στους απογόνους. Ας δούµε πώς αυτό υλοποιείται στα ακόλουθα σχήµατα: Στην επίπεδη διασταύρωση (flat crossover) επιλέγεται ένα διάνυσµα τυχαίων τιµών (λ 1, λ 2 λ N ) που κυµαίνονται στο διάστηµα [0..1]. οθέντων δύο γονέων b 1 =(x 1, x 2 x N ) και b 2 =(y 1, y 2 y N ), τότε ο απόγονος b =(x 1, x 2 x N ) υπολογίζεται ως εξής: x i = λ i * x i + (1 - λ i ) * y i, για κάθε i από 1 έως N Η διασταύρωση BLX-α είναι επέκταση της επίπεδης, προσφέροντας την δυνατότητα σε ένα γονίδιο απογόνου να πάρει τιµή έξω από το διάστηµα που ορίζουν τα αντίστοιχα γονίδια των γονέων. Οι συνιστώσες x i του απογόνου επιλέγονται τυχαία µε οµοιόµορφη κατανοµή από το διάστηµα: [min(x i, y i ) - I * α, max(x i, y i ) + I * α] Όπου I = max(x i, y i ) - min(x i, y i ). Η παράµετρος α πρέπει να επιλεγεί εκ των προτέρων. Στην περίπτωση που η τελευταία ισούται µε µηδέν, τότε η εν λόγω διασταύρωση είναι πανοµοιότυπη µε την επίπεδη.

40 40 Κεφάλαιο δεύτερο Όσον αφορά τη µετάλλαξη, αρκεί η τυχαία µεταβολή µιας οποιαδήποτε τιµής του αρχικού διανύσµατος, σε αντιστοιχία µε την απλή µετάλλαξη στις δυαδικές ακολουθίες. Άλλες πρακτικές περιλαµβάνουν την κυκλική µετακίνηση των γονιδίων, ή και την ολοκληρωτική αντικατάσταση του παλαιού ατόµου από κάποιο τυχαίο. Το σηµαντικό είναι ότι µεταβάλλονται κατά πολύ οι ιδιότητες του διανύσµατος, τοποθετώντας το σε νέες περιοχές του χώρου αναζήτησης.

41 41 Κεφάλαιο τρίτο: ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΤΗΣ ΜΕΘΟ ΟΥ ΤΩΝ ΑΝΑΛΟΓΙΩΝ Στο πρώτο κεφάλαιο έγινε µια εισαγωγή στις µεθόδους εκτίµηση κόστους, ενώ ιδιαίτερη µνεία έγινε στην εκτίµηση µε αναλογίες. Με την εξέταση των λεπτοµερειών της εν λόγω µεθόδου, το συµπέρασµα ήταν ότι η απόδοσή της επηρεάζεται από ένα πλήθος παραµέτρων. Συνεπώς, προέκυψε ένα πρόβληµα βελτιστοποίησης που συνίσταται στην εύρεση του συνδυασµού των παραµέτρων που αντιστοιχούν στην καλύτερη απόδοση. Το µέγεθος του χώρου αναζήτησης που ορίζεται από αυτές τις παραµέτρους, αλλά και η αδυναµία µοντελοποίησης αυτού, καθιστά απαγορευτική την εφαρµογή παραδοσιακών µεθόδων βελτιστοποίησης. Αυτός είναι και ο λόγος που στην παρούσα εργασία προτάθηκαν για το πρόβληµα αυτό οι γενετικοί αλγόριθµοι. Η παρουσίαση της λογικής και της εφαρµογής των γενετικών αλγορίθµων που ακολούθησε, ήταν ενδεικτική των δυνατοτήτων τους. Η αδυναµία τους εντοπίστηκε σε προβλήµατα υψηλής επίστασης, δηλαδή µε µη γραµµικό χώρο αναζήτησης. Ωστόσο, από την εµπειρία, περιµένουµε ότι θα υπάρχει κάποια γραµµικότητα στη µεταβολή της απόδοσης για διαφορετικές παραµέτρους. Ο αναγνώστης έχει πλέον αποκτήσει εξοικείωση τόσο µε το πρόβληµα που έχει τεθεί, όσο και µε τη µεθοδολογία που προτείνεται για τη λύση του. Αυτό που µένει είναι η προσαρµογή των γενετικών αλγορίθµων στο ιδιόµορφο πρόβληµα βελτιστοποίησης της µεθόδου των αναλογιών. 3.1 Προσαρµογή στο Πρόβληµα των Αναλογιών Στο πεδίο των γενετικών αλγορίθµων υπάρχει µια σειρά από έννοιες που συνιστούν δοµικά στοιχεία για τον αλγόριθµο. Τέτοια είναι η συνάρτηση καταλληλότητας, ο πληθυσµός, η αναπαραγωγή και άλλα θέµατα που έχουν παρουσιαστεί στο δεύτερο κεφάλαιο. Η προσαρµογή για τη βελτιστοποίηση της µεθόδου των αναλογιών συνίσταται στην εκ νέου κατασκευή των συστατικών ενός γενετικού, ώστε τα άτοµα που αξιολογούνται, αναπαράγονται και ανταγωνίζονται να είναι οι πιθανές λύσεις του προβλήµατος. Η τρέχουσα ενότητα διαπραγµατεύεται τη µετατροπή των παραµέτρων του προβλήµατος, σε οντότητες που χρησιµοποιήσιµες από ένα γενετικό αλγόριθµο.

42 42 Κεφάλαιο τρίτο Αντιστοίχηση Λύσεων σε Άτοµα Εν ολίγοις, κατά την εκτίµηση µε αναλογίες, εντοπίζονται τα κοντινότερα στο προς εκτίµηση έργα, µε βάση τα χαρακτηριστικά στα οποία τα έργα αναλύονται. Στη συνέχεια, εξάγεται, µε χρήση των αναλογιών, πρόβλεψη για το κόστος του νέου έργου. Στην ενότητα περί ανάλυσης των γενετικών αλγορίθµων έχει τονιστεί ιδιαίτερα η σηµασία του πληθυσµού στη λειτουργία τους. Οι πληθυσµοί αποτελούνται από άτοµα τα οποία συνιστούν λύσεις του εκάστοτε προβλήµατος βελτιστοποίησης. Για το θέµα της µεθόδου των αναλογιών, οι λύσεις είναι οι πιθανοί συνδυασµοί παραµέτρων εφαρµογής και χαρακτηριστικών. Υπενθυµίζεται ότι στις παραµέτρους εφαρµογής τις µεθόδου των αναλογιών, συγκαταλέγονται: Τα διάφορα µέτρα απόστασης για τον υπολογισµό της ανοµοιότητας µεταξύ δύο έργων Ο αριθµός των αναλογιών, δηλαδή των γειτονικών έργων από τα οποία θα εξαχθεί η εκτίµηση Τα διάφορα στατιστικά µέσω των οποίων θα γίνει εκτίµηση µε βάση τις αναλογίες Τα χαρακτηριστικά δεν είναι άλλο από µεταβλητές που χαρακτηρίζουν ένα έργο, και συνήθως είναι διαθέσιµες από την έναρξή του. ιαφορετικό υποσύνολο από αυτά ορίζει και διαφορετικό χώρο στον οποίο µετράται η απόσταση µεταξύ των έργων, οπότε η γειτνίαση, άρα και το αποτέλεσµα της µεθόδου των αναλογιών, επηρεάζεται. Το τελευταίο επηρεάζεται και από το συντελεστή βαρύτητας που αποδίδεται σε κάποιο χαρακτηριστικό. Με βάση τα παραπάνω, µια περίπτωση ρύθµισης, ένα άτοµο αλλιώς, µπορεί να αποδοθεί ως µια ακολουθία τιµών από τις οποίες αντιστοιχούν στις προαναφερθείσες παραµέτρους εφαρµογής και στις τιµές των βαρών όλων των χαρακτηριστικών που είναι διαθέσιµα. Στο σχήµα απεικονίζεται ένα άτοµο για n τω αριθµώ συνολικά χαρακτηριστικά. Να σηµειωθεί ότι η προς εκτίµηση µεταβλητή-χαρακτηριστικό εξαιρείται από τη διαδικασία εισαγωγής σε άτοµο. Σχήµα 3-1 Οι δυνατές τιµές για τις τρεις πρώτες µεταβλητές είναι προσυµφωνηµένοι αριθµοί ταυτότητας σε µονοσήµαντη αντιστοιχία µε τα διαθέσιµα µέτρα απόστασης, τους δυνατούς αριθµούς των αναλογιών και τα διαθέσιµα στατιστικά εξαγωγής αποτελέσµατος.

43 Βελτιστοποίηση της Μεθόδου των Αναλογιών 43 Το διάνυσµα (X1, X2, Xn) είναι το διάνυσµα των σταθµικών παραγόντων που αντιστοιχούν στα χαρακτηριστικά των έργων. Υπάρχει όµως και η περίπτωση να µην ενδιαφερόµαστε για τα βάρη, αλλά απλά για τη συµµετοχή του χαρακτηριστικού στους υπολογισµούς ή όχι. Η δοθείσα αναπαράσταση καλύπτει και αυτό το ενδεχόµενο, µε την παραδοχή ότι το βάρος θα είναι 1 ή 0, χωρίς καµία διαβάθµιση. Θέµατα κωδικοποίησης σε χρωµοσώµατα, ώστε να είναι εφικτή η εφαρµογή τελεστών αναπαραγωγής, θα θιχτούν στη σχετική ενότητα. Ο µορφή που παρουσιάστηκε αποτελεί το φαινότυπο. Σε αυτόν είναι εφαρµόσιµη η συνάρτηση καταλληλότητας και, κατ επέκταση, ο τελεστής επιλογής. Το σηµαντικό είναι ότι µε την εφαρµογή διαφορετικών ατόµων, το αποτέλεσµα που θα δώσει η µέθοδος, αλλά και η ακρίβεια πρόβλεψης, ποικίλουν Αξιολόγηση Λύσεων Με τον προσδιορισµό των ατόµων έχουµε συγκεντρώσει τους παράγοντες που επηρεάζουν την αποδοτικότητα της µεθόδου σε δοµές που είναι εύκολο να αξιολογηθούν από το γενετικό αλγόριθµο. Μένει τώρα να περιγραφεί αυτή η διαδικασία της αξιολόγησης. Συνηθίζεται η απόδοση µιας µεθόδου εκτίµησης να υπολογίζεται µε στατιστικά µέτρα που απεικονίζουν την ακρίβεια της πρόβλεψης. Το MMRE είναι το µέσο µέγεθος σχετικού σφάλµατος, οπότε µια χαµηλή τιµή του συνεπάγεται και υψηλή καταλληλότητα για κάποιο συνδυασµό παραµέτρων. Επειδή το πρόβληµα ανάγεται στην ελαχιστοποίηση του MMRE, η συνάρτηση καταλληλότητας πρέπει να διατυπωθεί µε τέτοιο τρόπο ώστε η καταλληλότητα να είναι αντιστρόφως ανάλογη του µέσου σφάλµατος: f(x) = 1 / MMRE Το PRED(25), δηλαδή το ποσοστό των προβλέψεων µε σφάλµα µικρότερο του 25%, είναι ευθέως ανάλογο της καταλληλότητας. Οπότε, δεν υπάρχει λόγος για ιδιαίτερη ρύθµιση. Οποιοδήποτε από τα δύο µέτρα µπορεί να χρησιµοποιηθεί χωρίς περιορισµούς. Ο βέλτιστος συνδυασµός παραµέτρων, για τη ρύθµιση της µεθόδου, έχει νόηµα για ένα σύνολο δεδοµένων. Αυτό σηµαίνει ότι τα προαναφερθέντα µέτρα υπολογίζονται για το συγκεκριµένο σύνολο. Στην παράγραφο έγινε λόγος για τη µέθοδο Jackknife, η οποία εκτιµά το κάθε γνωστό έργο της βάσης, µε σκοπό να καταγραφεί το σφάλµα της πρόβλεψης που προκύπτει από κάποια ρύθµιση. Τα παρακάτω βήµατα περιγράφουν τη διαδικασία που θα πρέπει να εκτελείται κατά την εφαρµογή της συνάρτησης καταλληλότητας.

44 44 Κεφάλαιο τρίτο 1. Για κάθε γνωστό έργο της βάσης δεδοµένων 1.1. Για κάθε ένα από τα υπόλοιπα γνωστά έργα Για τα επιλεχθέντα έργα από τα βήµατα 1 & 1.1, µε χρήση του τρέχοντος µέτρου απόστασης Για κάθε χαρακτηριστικό µε το βάρος που έχει επιλεγεί Αξιοποίησή του για την εύρεση της απόστασης, µε τρόπο που ορίζεται από το τρέχον µέτρο 1.2. Ταξινόµηση των έργων σε αύξουσα διάταξη µε βάση την απόσταση από το επιλεχθέν του βήµατος Εύρεση των κοντινότερων γειτόνων, οι οποίοι είναι στον αριθµό όσο υποδεικνύει ο τρέχων αριθµός αναλογιών 1.4. Εξαγωγή εκτίµησης µε χρήση του τρέχοντος στατιστικού 1.5. Σύγκριση εκτίµησης και πραγµατικής τιµής κόστους 2. Αξιοποίηση των σφαλµάτων για όλα τα έργα της βάσης, ώστε να προκύψει το MMRE ή το PRED(25) Οι όροι σε πλάγια γραµµατοσειρά είναι τα χαρακτηριστικά των ατόµων, ή αλλιώς, οι παράµετροι που επιδρούν στην απόδοση της µεθόδου. Για συγκεκριµένο συνδυασµό αυτών, επιβάλλεται η εκτέλεση της παραπάνω ρουτίνας, προκειµένου να καταγραφεί η επιρροή του συνδυασµού στην απόδοση. Όµως η παραπάνω παρουσίαση σε βήµατα ανέδειξε ένα ακόµη πρόβληµα. Ο βρόχος στο βήµα είναι εµφωλευµένος στον 1.1, τον οποίο µε τη σειρά του εµφωλεύει ο βρόχος 1. Αν έχουµε n έργα και k χαρακτηριστικά, τότε εύκολα προκύπτει ότι η πολυπλοκότητα είναι της τάξης του Θ(n 2 k). Το πρόβληµα έγκειται στην ανάγκη εφαρµογής της συνάρτησης καταλληλότητας για κάθε άτοµο που προκύπτει σε όλη τη διαδικασία της εξέλιξης. Μια αποδεκτή λύση θα ήταν η δειγµατοληψία των έργων της βάσης που θα συµµετάσχουν στη διαδικασία δοκιµής τα µεθόδου, είτε τυχαία, είτε µε τρόπο που να ευνοεί τα νεότερα έργα. Για σύνολα δεδοµένων µε λιγότερα από 100 έργα, συνήθως δεν υπάρχει ανάγκη για τέτοια πρακτική. 3.2 Κατασκευή Γενετικού Αλγορίθµου Εφόσον έχει γίνει η σύνδεση µε το προς επίλυση πρόβληµα, µπορούµε να θεωρήσουµε την κατασκευή του ζητούµενου γενετικού αλγορίθµου από µια πιο ψυχρή σκοπιά. Αρκεί πλέον να εστιάσουµε στα θέµατα κωδικοποίησης, αναπαραγωγής και ανανέωσης του πληθυσµού, µε µοναδικό σκοπό τη βελτιστοποίηση της ορισθείσας συνάρτησης καταλληλότητας. Έτσι, θα είναι εφαρµόσιµο το παρακάτω γενικό µοντέλο.

45 Βελτιστοποίηση της Μεθόδου των Αναλογιών 45 Σχήµα Πολιτική Επιλογής Στην παράγραφο έγινε λόγος για διάφορες πολιτικές επιλογής. Κοινό χαρακτηριστικό τους είναι η προώθηση των καλών ατόµων, ώστε τα χαρακτηριστικά τους να επικρατήσουν. Ωστόσο, υπεισέρχεται και τυχαιότητα στην επιλογή, προσοµοιάζοντας τον αντίστοιχο µηχανισµό της φύσης. Η επιλογή ρουλέτας συγκεντρώνει αυτά τα χαρακτηριστικά, µε ένα εύκολο στην υλοποίηση τρόπο. Η πιθανότητα επιλογής του κάθε ατόµου είναι ανάλογη της καταλληλότητας που του έχει αποδοθεί. Η λειτουργία της συνοψίζεται στην κατάταξη των ατόµων, και στη συνέχεια την επιλογή µε κανονική κατανοµή τυχαίου αριθµού r στο διάστηµα από το µηδέν ως το συνολικό άθροισµα των καταλληλολήτων. Το πρώτο άτοµο του οποίου η καταλληλότητα αθροισµένη σε αυτές των προηγούµενων, είναι ίση ή ξεπερνά τον αριθµό r, είναι και αυτό που επιλέγεται. Σχήµα 3-3 Εφόσον το κοµµάτια της αξιολόγησης και της αναπαράστασης είναι ανεξάρτητα, δεν υπάρχει κανείς περιορισµός, αλλά ούτε και ιδιαίτερη προσαρµογή για την εφαρµογή οποιασδήποτε πολιτικής. Με σκοπό τη διατήρηση της ανοµοιοµορφίας στους πληθυσµούς, εναλλακτικά προτείνεται και η επιλογή τουρνουά. Εξακολουθούν να προάγονται τα πιο ικανά

46 46 Κεφάλαιο τρίτο άτοµα, αλλά αποτρέπεται η υπερβολική επικράτησή τους. Έγινε µια παρουσίαση στο δεύτερο κεφαλαίο, αλλά η λειτουργία της φαίνεται ακριβέστερα στον αλγόριθµο σε µορφή βηµάτων που ακολουθεί: 1. Ορισµός πιθανότητας επιλογής του βέλτιστου p 2. Τυχαία δειγµατοληψία n ατόµων της τρέχουσας γενεάς 3. Επιλογή τυχαίου αριθµού r στο διάστηµα Αν το r δεν ξεπερνά την πιθανότητα p 4.1. Επιστροφή του ατόµου που θεωρείται βέλτιστο 5. Αλλιώς 5.1. Αφαίρεση του βέλτιστου από τον πληθυσµό 5.2. επιστροφή στο βήµα 3 Συνηθισµένη τιµή για την πιθανότητα p είναι 0.7, γεγονός που καθιστά απίθανη την επιλογή των λιγότερο καλών λύσεων. Ωστόσο, λόγω της αρχικής τυχαίας δειγµατοληψίας, υπάρχει πολύ µεγαλύτερη τυχαιότητα στην επιλογή, και κατ επέκταση, πιο πλούσιοι σε σχήµατα πληθυσµοί Κωδικοποίηση σε υαδικές Ακολουθίες Όπως έχουν οριστεί µέχρι τώρα τα άτοµα, δηλαδή ως σύνολα παραµέτρων, δεν υπήρχε πρόβληµα στην αξιολόγηση και επιλογή αυτών. Ο συνδυασµός των χαρακτηριστικών, ώστε αυτά να κληροδοτούνται από τους γονείς στου απογόνους µε κάποια τυχαιότητα, επιβάλει την αναπαράσταση σε χρωµοσώµατα. Μια πρώτη σκέψη είναι η χρήση απλών δυαδικών ακολουθιών. Η συγκεκριµένη αναπαράσταση είναι βολική, καθώς έτσι εξαλείφεται η ανοµοιογένεια που υπάρχει µεταξύ των παραµέτρων που αποθηκεύονται σε ένα άτοµο. Οι τυπικοί τελεστές διασταύρωσης και µετάλλαξης µπορούν πλέον να χρησιµοποιηθούν χωρίς πρόβληµα. Το ζήτηµα που αποµένει είναι ο προσδιορισµός της δυαδικής ακολουθίας που αντιστοιχεί σε κάθε συστατικό της λύσης. Εφόσον το αρχικό πρόβληµα µπορεί να οριστεί είτε για απλή εύρεση του βέλτιστου υποσυνόλου των µεταβλητών των έργων, είτε για τη γενικότερη περίπτωση της εύρεσης των βέλτιστων βαρών, αναµένεται να προκύψουν δύο διαφορετικές αναπαραστάσεις. Πάντως, ανεξαρτήτως του ορισµού του προβλήµατος, η κωδικοποίηση των παραµέτρων εφαρµογής θα είναι κοινή για τα δύο είδη χρωµοσωµάτων. Το µέτρο απόστασης για τον ορισµό της ανοµοιότητας, ο αριθµός των αναλογιών και είδος του στατιστικού, παίρνουν τιµές από προκαθορισµένα σύνολα. Συνεπώς, ο αριθµός των bit του κάθε γονιδίου πρέπει να επαρκεί για την περιγραφή όλων των δυνατών καταστάσεων, ενώ παράλληλα πρέπει να περιοριστεί στο ελάχιστο δυνατό, ώστε να έχει το δυνατόν περισσότερη αξία η πληροφορία στη νέα αναπαράσταση. Συνεπώς, ο τύπος που αποδίδει τον αριθµό των bit για ένα γονίδιο είναι το ανώφλι του δυαδικού λογαρίθµου του αριθµού Ν των προκαθορισµένων τιµών. αριθµός bit = log 2 N

47 Βελτιστοποίηση της Μεθόδου των Αναλογιών 47 Εφόσον το µήκος των χρωµοσωµάτων είναι σταθερό, το ζητούµενο είναι να ελαττωθούν οι µη χρησιµοποιούµενοι συνδυασµοί των δυαδικών ψηφίων. Σε αντίθετη περίπτωση αυξάνεται η πιθανότητα παραγωγής άκυρων λύσεων, οπότε διαδικασίες που επιδρούν στα χρωµοσώµατα δε θα έχουν αποτέλεσµα, καθυστερώντας τον αλγόριθµο. Στο πρώτο κεφάλαιο έγινε λόγος για συγκεκριµένα µέτρα απόστασης, αλλά και στατιστικά για την εξαγωγή της πρόβλεψης. Με βάση αυτά, ας δούµε το ακόλουθο παράδειγµα κωδικοποίησης. Στη συγκεκριµένη περίπτωση τα διαθέσιµα µέτρα είναι επτά. Ο παρακάτω πίνακας απεικονίζει την αντιστοιχία των µέτρων σε αριθµούς ταυτότητας, για την αναγνώρισή τους από τη διαδικασία αξιολόγησης. Οι αριθµού ταυτότητας κωδικοποιούνται σε δυαδικές συµβολοσειρές των τριών bit, καθώς log 2 7 = 3. Μέτρο Απόστασης ID Γονίδιο Ευκλείδεια Απόσταση Απόσταση Manhattan Απόσταση Minkowski Απόσταση Canberra Συντελεστής Czekanowski Απόσταση Chebychev Συντελεστή Ανοµοιότητας Kaufman-Rousseeuw Η µοναδική τιµή του γονιδίου που δεν αντιστοιχεί σε λύση είναι η 111. Μοναδική επιλογή για τον αλγόριθµο είναι η επανάληψη της όποιας πράξης επί του χρωµοσώµατος. Ωστόσο, η πιθανότητα εµφάνισης άκυρου γονιδίου µειώθηκε στο ελάχιστο. Στη χειρότερη περίπτωση οι µη έγκυρες λύσεις θα είναι N/2-1. Παρόµοια θα πορευτούµε για την κατασκευή του γονιδίου που κωδικοποιεί τον αριθµό των αναλογιών. Η προφανής λύση της απόδοσης της δυαδικής τιµής του ακεραίου που περιγράφει το πλήθος των γειτόνων, είναι λάθος. Η εν λόγω µεταβλητή χρειάζεται να αντιµετωπιστεί ως κατηγοριοποιηµένη και όχι ως ακέραια. Υπερβολικά πολλές αναλογίες οδηγούν τη µέθοδο των αναλογιών σε εκφυλισµό. Πρακτικά, γνωρίζουµε εκ των προτέρων ότι δεν είναι δυνατόν να έχουµε καλή ρύθµιση για πάνω από 10 αναλογίες. Επιπλέον, µικροί αριθµοί αναλογιών µπορεί να εξαιρεθούν από την αναζήτηση, οπότε χάνεται η αντιστοιχία δεκαδικής και δυαδικής αναπαράστασης. Στο παράδειγµά µας θεωρούµε ότι αναζητάται το βέλτιστο µεταξύ 2 και 8 αναλογιών. Στον πίνακα που ακολουθεί φαίνεται ότι ο κάθε αριθµός αντιµετωπίζεται ως µία κατάσταση, δηλαδή χωρίς καµία εκµετάλλευση της ιδιότητάς του. Άλλωστε, στη συνάρτηση καταλληλότητας, ο αριθµός ταυτότητας που προκύπτει από το γονίδιο θα αποκωδικοποιηθεί ανάλογα.

48 48 Κεφάλαιο τρίτο Αριθµός Αναλογιών ID Γονίδιο Η παράµετρος εφαρµογής που αποµένει είναι το στατιστικό που θα χρησιµοποιηθεί για την εξαγωγή της τελικής εκτίµησης. Η ίδια µέθοδος απεικόνισης σε καταστάσεις θα εφαρµοστεί και πάλι. Τα διαθέσιµα στατιστικά είναι τέσσερα, οπότε αρκούν δύο δυαδικά ψηφία για την αναπαράσταση όλων των περιπτώσεων. Στατιστικό ID Γονίδιο Μέση Τιµή 0 00 ιάµεσος 1 01 Σταθµισµένη Μέση Τιµή 2 10 Σταθµισµένη ιάµεσος 3 11 Τα παραπάνω συνιστούν το πρώτο µέρος του χρωµοσώµατος. Μια ολοκληρωµένη πρόταση ρύθµισης περιλαµβάνει και την πληροφορία για τα χαρακτηριστικά των έργων, δηλαδή το χώρο στον οποίο ελέγχεται η απόσταση µεταξύ τους. Από αυτό το σηµείο και έπειτα προτείνονται δύο διαφορετικές αναπαραστάσεις, ανάλογα τον ορισµό του προβλήµατος. Σε περίπτωση που το ενδιαφέρον είναι για το βέλτιστο υποσύνολο των µεταβλητών των έργων, η κάθε µεταβλητή µπορεί να συµµετέχει στη λύση, ή όχι. Η δε συµµετοχή της δεν επηρεάζει τις άλλες µεταβλητές. Συνεπώς, για Ν µεταβλητές έχουµε 2 Ν καταστάσεις, οπού η κάθε κατάσταση είναι ένα υποσύνολο. Οπότε, αρκούν ακριβώς log 2 (2 Ν ) = Ν bit, για τη περιγραφή όλων των δυνατών καταστάσεων. Στην ενότητα για τη µορφή των ατόµων, ορίστηκε ότι κάθε µεταβλητή των έργων, ως χαρακτηριστικό ατόµου θα συνδέεται µε έναν αριθµό που θα εκφράζει το βάρος. Επειδή όµως τα βάρη δεν αφορούν τη διαδικασία βελτιστοποίησης σε αυτό το επίπεδο, αρκεί η απόδοση της τιµής 0 στο βάρος, αν δεν πρέπει η µεταβλητή να συµµετέχει στο υποσύνολο, και της τιµής 1 στην αντίθετη περίπτωση. Παρατηρείται ότι, εφόσον είναι δύο οι πιθανές τιµές, δεν υπάρχει ανάγκη για κλασική δυαδικά αναπαράσταση ακεραίου. Ένα δυαδικό ψηφίο είναι αρκετό για να αποτελέσει γονίδιο που θα κωδικοποιεί τη συµµετοχή µεταβλητής στη λύση. Ευνόητο είναι ότι για Ν µεταβλητές, θα έχουµε και Ν δυαδικά ψηφία, άρα και 2 Ν συνδυασµούς.

49 Βελτιστοποίηση της Μεθόδου των Αναλογιών 49 Χαρακτηριστικό X 1 X 2... Συµµετέχει 1 ε Συµµετέχει 0 Συµµετέχει 1 ε Συµµετέχει 0 Γονίδιο X Ν Συµµετέχει 1 ε Συµµετέχει 0 Το σχήµα που ακολουθεί αποτελεί απεικόνιση τυχαίου χρωµοσώµατος που θα χρησιµοποιηθεί για την εύρεση των βέλτιστων παραµέτρων εφαρµογής της µεθόδου, σε συνδυασµό µε το βέλτιστο υποσύνολο µεταβλητών. Οι παράµετροι εφαρµογής είναι αυτές που παρουσιάστηκαν στους προηγούµενους πίνακες, µε τις ανάλογες αναπαραστάσεις που έχουν επιλεγεί. Το σύνολο των µεταβλητών είναι αυτό που ορίζεται για τη βάση δεδοµένων Albrecht 1. Η συνιστώσα Actual Effort είναι η προς εκτίµηση, οπότε και δεν περιλαµβάνεται στο χρωµόσωµα. Σχήµα Οι µεταβλητές που χαρακτηρίζουν τα έργα της βάσης δεδοµένων Albrecht, περιγράφονται στο σχετικό παράρτηµα.

50 50 Κεφάλαιο τρίτο Αν το ζητούµενο είναι η εύρεση των βέλτιστων συντελεστών βαρύτητας για τις µεταβλητές, αρκεί να αλλάξει η κωδικοποίηση της δεύτερης µόνο αµάδας γονιδίων. Η κατάσταση µιας µεταβλητής, δεν περιορίζεται πλέον στη συµµετοχή της στη λύση ή όχι, αλλά εκφράζεται ως βαθµός συµµετοχής. Αυτή είναι ακριβώς η έννοια του συντελεστή βαρύτητας. Για την περιγραφή του τελευταίου αρκεί ένας αριθµός κινητής υποδιαστολής. Τα συνήθη όρια αυτού του τύπου δεδοµένων, στις περισσότερες γλώσσες προγραµµατισµού, καθιστούν υπερβολικά µεγάλο το πεδίο τιµών για τις ανάγκες ρύθµισης της µεθόδου των αναλογιών. Στις περισσότερες των περιπτώσεων, η απόδοση βαρών σε χαρακτηριστικά κυµαίνεται σε ένα συγκεκριµένο διάστηµα, συνήθως από µηδέν έως ένα. Άλλωστε, πριν τη διενέργεια υπολογισµών για εκτίµηση, το διάνυσµα των βαρών κανονικοποιείται. Όλα τα διανύσµατα των οποίων οι τιµές ανήκουν στο διάστηµα [0..1] είναι στην πράξη υπερσύνολο των κανονικοποιηµένων διανυσµάτων βαρών. Τα τελευταία αντιστοιχούν σε όλους τους δυνατούς συσχετισµούς µεταξύ των συντελεστών βαρύτητας. Συνεπώς, µε τον περιορισµό του πεδίου τιµών δε χάνεται η δυνατότητα περιγραφής όλων των λύσεων, απλά περιορίζονται τα γραµµικώς εξαρτηµένα διανύσµατα. Το θέµα της γραµµικής ανεξαρτησίας θα αναλυθεί λεπτοµερέστερα σε επόµενη ενότητα. Ένα µη επιθυµητό χαρακτηριστικό στο εν λόγω πρόβληµα είναι η υπερβολική ακρίβεια της λύσης. Ο λόγος γίνεται για πρόβλεψη κόστους, διαδικασία δύσκολο να αξιολογηθεί. Συνεπώς, διανύσµατα βαρών που διαφέρουν ελάχιστα, πρακτικά έχουν το ίδιο αποτέλεσµα στην εκτίµηση νέων έργων. Στην πράξη, ο υπεύθυνος έργου που θα κληθεί να αξιοποιήσει το αποτέλεσµα της ρύθµισης της µεθόδου, θα στρογγυλοποιήσει τις προτεινόµενες τιµές. Συνήθως η ακρίβεια δύο δεκαδικών ψηφίων είναι αρκετή, οπότε µπορούµε να περιορίσουµε και το χώρο αναζήτησης ανάλογα. Λαµβάνοντας υπ όψιν τις προαναφερθείσες ανάγκες σε ακρίβεια, παρατηρούµε ότι στο διάστηµα [0..1] το βάρος κάθε µεταβλητής κυµαίνεται µεταξύ 101 διαφορετικών τιµών (0, 0.01, 0.02, 0.99, 1). Είναι φανερό ότι η απόδοση βαρών είναι περίπτωση γενικότερη αυτής της εύρεσης υποσυνόλου, όπου και είχαµε δύο µόνο καταστάσεις (0 και 1). Εφαρµόζοντας και πάλι τη λογική της χρήσης ελάχιστου αριθµού δυαδικών ψηφίων, τα χρησιµοποιούµενα για κάθε γονίδιο bit θα είναι στον αριθµό log = 7. Η κωδικοποίηση µπορεί να γίνει συγκεκριµένα ως εξής: Κατάταξη των δυνατών τιµών σε αύξουσα διάταξη Αντιστοιχία σε κάθε τιµή βάρους ενός αύξοντα αριθµού διάταξης Μετατροπή του αριθµού διάταξης στο δυαδικό σύστηµα, και ορισµός αυτού ως γονιδίου για την αντίστοιχη τιµή βάρους Τιµή Συντελεστή Βαρύτητας Αριθµός ιάταξης Γονίδιο

51 Βελτιστοποίηση της Μεθόδου των Αναλογιών 51 Στο παρακάτω σχήµα φαίνεται ένα δεύτερο παράδειγµα χρωµοσώµατος για τη βάση δεδοµένων Albrecht, αυτή τη φορά µε χρήση συντελεστών βαρύτητας. Σχήµα Αναπαραγωγή και Ανανέωση του Πληθυσµού Η δυαδική κωδικοποίηση σε χρωµοσώµατα που επιλέχθηκε καθιστά εύκολη την εφαρµογή οποιασδήποτε πολιτικής διασταύρωσης ή µετάλλαξης που παρουσιάστηκαν στην ενότητα Άλλωστε, αυτό ήταν και το νόηµα µιας τέτοιας αναπαράστασης, να επιτρέπεται δηλαδή ανταλλαγή χαρακτηριστικών κατά τρόπο τυχαίο, χωρίς να υπάρχει γνώση της σηµασίας των γονιδίων. εν αναµένεται ιδιαίτερη διαφορά στα αποτελέσµατα µεταξύ των επιλογών για διασταύρωση ενός ή δύο σηµείων. Και οι δύο πρακτικές έχουν την ιδιότητα να διατηρούν τα σχήµατα των γονέων, και να παράγουν καινούργια µε κάποια πιθανότητα. Η πιθανότητα παραγωγής νέων σχηµάτων είναι πολύ µεγαλύτερη για την οµοιόµορφη διασταύρωση, αλλά µε αρνητικές συνέπειες στη συντήρηση των παλαιότερων δοµικών µονάδων. Η εφαρµογή του τελεστή διασταύρωσης θα ήταν δυνατό να προσαρµόζεται στη δυνατότητα για δηµιουργία νέων σχηµάτων. Για παράδειγµα, αν δύο χρωµοσώµατα είναι σχετικά ανόµοια, τότε η διασταύρωση σηµείου ενδείκνυνται, προς όφελος της διατήρησης παλαιότερων σχηµάτων. Αν ωστόσο οι γονείς δε διαφέρουν παρά µόνο σε ελάχιστα bit, είναι πολύ µεγάλη η πιθανότητα να προκύψουν απόγονοι πανοµοιότυποι µε αυτούς.

52 52 Κεφάλαιο τρίτο Σχήµα 3-6 Στο παράδειγµα που απεικονίζεται παραπάνω, προκειµένου να προκύψει νέο σχήµα µε τη διασταύρωση σηµείου, πρέπει να ορισθεί το σηµείο της διαφοράς ως σηµείο διασταύρωσης. Τα ίδια ζεύγη δυαδικών ψηφίων, µε οµοιόµορφη διασταύρωση, είναι πιθανότερο να συνδυαστούν ώστε να παραχθεί νέο σχήµα. Συνεπώς, προτείνεται διαδικασία λήψης απόφασης που θα ορίζει κάθε φορά το είδος της διασταύρωσης, ανάλογα το ποσοστό οµοιότητας µεταξύ των γονέων. Όσον αφορά τον τελεστή µετάλλαξης, είναι επίσης δυνατό να γίνει εκµετάλλευση της δυνατότητάς του για παραγωγή νέων σχηµάτων, λιγότερο ή περισσότερο, ανάλογα µε τα δεδοµένα σύγκλισης. Ενώ η πιθανότητα εφαρµογής του θα είναι φυσιολογικά µικρή, αυτή θα αυξάνεται όσο ο πληθυσµός κατακλύζεται από όµοια άτοµα. Μόλις ο βαθµός ανοµοιογένειας επανέλθει στα φυσιολογικά επίπεδα, αντίστοιχα θα µειωθεί η πιθανότητα µετάλλαξης. Ο αλγόριθµος ελέγχου της σύγκλισης θα συζητηθεί σε επόµενη ενότητα. Τα θέµατα αξιολόγησης, επιλογής και αναπαραγωγής που συζητήθηκαν, είχαν απώτερο σκοπό τη δηµιουργία ενός νέου πληθυσµού, µε χαρακτηριστικά καλύτερα από τον προηγούµενο. Η τακτική ανανέωσης του πληθυσµού αναφέρεται στο βαθµό στον οποίο ο παλαιότερος πληθυσµός αντικαθίστανται από το νέο. Στην απλούστερη περίπτωση έχουµε πλήρη αντικατάσταση. Ωστόσο, τη σύγκλιση επιταχύνει η απ ευθείας αντιγραφή των καταλληλότερων ατόµων µιας γενιάς στην επόµενη. Έχουµε δηλαδή µερική ανανέωση πληθυσµού, προς όφελος των ικανότερων ατόµων. Στην ενότητα ονοµάσαµε την πρακτική αυτή, ελιτισµό. ιαπιστώθηκε ότι προωθείται η σύγκλιση του αλγορίθµου, αλλά µε τον κίνδυνο εγκλωβισµού σε τοπικό βέλτιστο. Για την αποφυγή της ενδεχόµενης αέναης συµµετοχής κάποιων αρκετά καλών ατόµων, προτάθηκε τροποποίηση της βαθµολόγησης µε βάση την ηλικία. Συγκεκριµένα θα αποδίδεται ποινή στα παλαιότερα άτοµα, η οποία θα µειώνει την καταλληλότητά τους, ανάλογα την παλαιότητά τους. Για παράδειγµα, η ποινή θα µπορούσε να είναι ένα -10% της καταλληλότητας του χρωµοσώµατος για κάθε γενιά από την οποία έχει επιβιώσει. νέα καταλληλότητα = καταλληλότητα ηλικία * καταλληλότητα 10% Η παραπάνω τακτικές καταλήγουν στην εύρεση πολλών τοπικών µέγιστων, και σε σταδιακό απεγκλωβισµό από αυτά. Μακροπρόθεσµα, ερευνάται το σύνολο του χώρου αναζήτησης.

53 Βελτιστοποίηση της Μεθόδου των Αναλογιών Έλεγχος Σύγκλισης και Τερµατισµός Στην ενότητα που προηγήθηκε, έγινε λόγος για προσαρµογή χαρακτηριστικών του γενετικού αλγορίθµου, όπως διασταύρωση και µετάλλαξη, ανάλογα µε τη σύγκλιση. Όµως, δεν έχει καθοριστεί µε ακρίβεια ο τρόπος ελέγχου της σύγκλισης. Μια απλή σκέψη συνίσταται στην παρακολούθηση του µέσου όρου καταλληλότητας της κάθε γενιάς. Πράγµατι, η µη σηµαντική µεταβολή της καταλληλότητας του πληθυσµού ενδέχεται να οφείλεται στην αδυναµία του συστήµατος να παράγει νέα σχήµατα. Ωστόσο, αυτό το συµπέρασµα δεν είναι ασφαλές. Ο µέσος όρος µπορεί να επηρεάζεται από την εµπλοκή ατόµων µε ακραίες τιµές καταλληλότητας, όµως τέτοια άτοµα ευνοούν την επίδοση του αλγορίθµου. Συνεπώς, χρειάζεται η χρήση µέτρων µεταβλητότητας της καταλληλότητας σε ένα πληθυσµό, καθώς αυτά είναι ενδεικτικά της ποικιλοµορφίας. Χαρακτηριστικό παράδειγµα είναι η τυπική απόκλιση, η οποία ορίζεται ως εξής: s = [1 / (n-1) * Σ (x i - µέση τιµή) 2 ] 1/2 Όπου x i η καταλληλότητα του i-οστού χρωµοσώµατος, και n ο αριθµός των ατόµων µιας γενεάς. Μεγάλη τυπική απόκλιση σηµαίνει και µεγάλη ανοµοιογένεια στον πληθυσµό, οπότε δε συντρέχει λόγος για αύξηση του αριθµού των µεταλλάξεων, ή χρήση άλλων µέτρων ενίσχυσης της ποικιλότητας. Ωστόσο, η ανάγκη προσδιορισµού της θεωρούµενης υψηλής ή χαµηλής τυπικής απόκλισης, οδηγεί στην υιοθέτηση σχετικών µέτρων µεταβλητότητας. Ο συντελεστής µεταβλητότητας ορίζεται ως ο λόγος της τυπικής απόκλισης προς τη µέση τιµή. v = (s / µέση τιµή) * 100% Το πλεονέκτηµα χρήσης του έγκειται στο ότι είναι ανεξάρτητος από µονάδες µέτρησης. Χαρακτηρίζει ένα δείγµα οµοιογενές, όταν η τιµή του δεν ξεπερνά το 10%. Με άλλα λόγια, αν ο συντελεστής µεταβλητότητας ενός πληθυσµού είναι µικρότερος του 10%, ο αλγόριθµος έχει πιθανώς συγκλίνει σε κάποιο τοπικό βέλτιστο. Ο παρακάτω πίνακας περιλαµβάνει τα βήµατα που περιγράφουν τη διαδικασία απόφασης για µεταβολή της µετάλλαξης. Να σηµειωθεί ότι ο συντελεστής µεταβλητότητας ελέγχεται µόνο στην περίπτωση σταθεροποίησης του µέσου όρου. 1. Ελέγχεται η µέση καταλληλότητα της τρέχουσας γενεάς 2. Αν αυτή διαφέρει από της προηγούµενη λιγότερο από 10% a. Ελέγχεται ο συντελεστής µεταβλητότητας της τρέχουσας γενεάς b. Αν αυτός είναι µικρότερος του 10% i. ιπλασιασµός της πιθανότητας µετάλλαξης 3. Αλλιώς, επαναφορά του ρυθµού µετάλλαξης στα φυσιολογικά επίπεδα

54 54 Κεφάλαιο τρίτο Αυτό που µένει για να περατωθεί η κατασκευή του γενετικού αλγορίθµου είναι ο ορισµός µιας συνθήκης τερµατισµού. Συνήθως, για πληθυσµούς των 100 ατόµων αρκούν 100 γενεές, αλλά ο απαιτούµενος αριθµός γενεών εξαρτάται από τη µορφή του χώρου αναζήτησης, αλλά και την ίδια την πορεία της αναζήτησης. Ο έλεγχος της σύγκλισης δεν έχει νόηµα, καθώς έχουν ληφθεί µέτρα που την αποτρέπουν, προς όφελος του ολικού βέλτιστου, όπως έχουµε δει. Καλύτερη πρακτική είναι η παρακολούθηση της εξέλιξης της βέλτιστης λύσης στην πάροδο των γενεών. Αν για παράδειγµα στις τελευταίες 50 γενεές δεν έχει σηµειωθεί βελτίωση στην προτεινόµενη λύση, τότε είναι ασφαλές να τερµατίσει ο αλγόριθµος, θεωρώντας ότι το µέγιστο έχει προσεγγιστεί σε µεγάλο βαθµό. ίνεται στη συνέχεια µια τροποποίηση του βασικού διαγράµµατος ροής του γενετικού αλγορίθµου, ο οποία περιλαµβάνει την εν λόγω συνθήκη τερµατισµού. Σχήµα 3-7 Μια εναλλακτική πρόταση θα ήταν η αξιοποίηση των κύκλων µεταβολής της µετάλλαξης που έχουν περιγραφεί. Με άλλα λόγια, να σηµειώνεται ο αριθµός των τοπικών βέλτιστων που προσεγγίζονται. Αφού ο αλγόριθµος είµαι προσαρµοστικός, θα απεγκλωβιστεί από αυτά, και θα ερευνήσει νέες περιοχές. Η µη βελτίωση του αποτελέσµατος για ένα αριθµό κύκλων, ή η προσέγγιση της ίδιας λύσης για περισσότερες από µία φορά, κάλλιστα µπορούν να θεωρηθούν ικανές συνθήκες για

55 Βελτιστοποίηση της Μεθόδου των Αναλογιών 55 τερµατισµό του αλγορίθµου. Η εν λόγω προσέγγιση απεικονίζεται και στο ακόλουθο διάγραµµα ροής. Σχήµα Εναλλακτική Κωδικοποίηση Συντελεστών Βαρύτητας Η κωδικοποίηση των χαρακτηριστικών των ατόµων σε δυαδικές συµβολοσειρές, προσέφερε µια ενιαία αναπαράσταση, ανεξάρτητα από το είδος της πληροφορίας που κωδικοποιούνταν σε κάθε γονίδιο. Το γεγονός αυτό ευνόησε την εφαρµογή παραδοσιακών γενετικών τελεστών. Έχοντας αποµονώσει το κοµµάτι των µεταβλητών των έργων από τις υπόλοιπες παραµέτρους εφαρµογής, έχουµε διακρίνει δύο προβλήµατα προς επίλυση, ανεξάρτητα το ένα από το άλλο. Για το πρώτο από αυτά, δηλαδή την εύρεση βέλτιστου υποσυνόλου µεταβλητών, οι δυνατές δυαδικές ακολουθίες αντιστοιχούσαν

56 56 Κεφάλαιο τρίτο ακριβώς, µία προς µία, στο σύνολο των λύσεων. Το τελευταίο καθιστά βέλτιστη την τρέχουσα αναπαράσταση. Όσον αφορά την εύρεση των βέλτιστων συντελεστών βαρύτητας για τις µεταβλητές, προκύπτουν µια σειρά από θέµατα. Ψάχνοντας για κάποιο ψεγάδι στη δυαδική αναπαράσταση για την κωδικοποίηση των βαρών, µια εύλογη σκέψη θα αφορούσε την ύπαρξη αχρησιµοποίητου αριθµού ακολουθιών. Ωστόσο, δεν αποτελεί σηµαντικό πρόβληµα, καθώς στην παράγραφο έγινε προσπάθεια περιορισµού του φαινόµενου. Το πρόβληµα, αλλά και οι λύσεις που προτείνονται, παρουσιάζονται στη συνέχεια της παρούσας ενότητας Το Πρόβληµα της Κανονικοποίησης Σε παράγραφο που προηγήθηκε ορίσαµε ότι οι συντελεστές βαρύτητας θα παίρνουν τιµές στο διάστηµα [0, 1]. Η επιλογή αυτή δεν περιόρισε το πλήθος των προτεινόµενων λύσεων. Ο λόγος είναι ότι τα διανύσµατα των βαρών των µεταβλητών, κανονικοποιούνται πρωτού χρησιµοποιηθούν στους υπολογισµούς. Η κανονικοποίηση έχει όµως επίδραση στο αποτέλεσµα της διαδικασίας µέτρησης της απόστασης µεταξύ δύο σηµείων. Ας θεωρήσουµε για παράδειγµα ένα χώρο δύο διαστάσεων, και έστωσαν τα σηµεία Α(0, 0), Β(1, 0) και Γ(1, 1) σε αυτόν. Θέτουµε ως µέτρο απόστασης την Ευκλείδειο, αλλά µε διάνυσµα βαρών για τις συντεταγµένες x και y το (3, 4). ηλαδή η απόσταση µεταξύ δύο σηµείων υπολογίζεται από τον τύπο: d = {3 * (x1-x2) * (y1-y1) 2 } 1/2. Μετρώντας τις αποστάσεις του Α από τα Β και Γ, παρατηρούµε ότι η απόσταση ΑΒ είναι ίση µε 1.73, ενώ η ΑΓ είναι 3.46 περίπου. Η κανονικοποίηση του διανύσµατος των βαρών συνίσταται στην εύρεση του γραµµικού συνδυασµού αυτού, που να έχει µέτρο ίσο µε τη µονάδα. Στην περίπτωσή µας είναι το διάνυσµα (3/5, 4/5). Υπολογίζοντας τις αποστάσεις µε τα νέα βάρη έχουµε ΑΒ = 0.77 και ΑΓ = 1.18 περίπου. Αν και οι αποστάσεις έχουν αλλάξει, αυτό δεν επηρεάζει τη µέθοδο των αναλογιών, καθώς σηµασία έχει η κατάταξη των σηµείων µε βάση αυτές. Για διανύσµατα βαρών γραµµικώς εξαρτηµένα, η κατάταξη δεν αλλάζει, οπότε η µέθοδος των αναλογιών δίνει ίδιο αποτέλεσµα. Συνεπώς, το πεδίο τιµών µεταξύ µηδέν και ένα για τα βάρη, είναι παραπάνω από το ωφέλιµο. Αν στο παραπάνω παράδειγµα θεωρήσουµε ότι οι µεταβλητές x και y είναι χαρακτηριστικά έργου, τότε σύµφωνα µε τους περιορισµούς που έχουν τεθεί, τα διανύσµατα (0.6, 0.8) και (0.3, 0.4) είναι έγκυρες λύσεις, µε πανοµοιότυπη καταλληλότητα, λόγω της γραµµικής τους εξάρτησης. Ωστόσο, έχουν τελείως διαφορετική δυαδική αναπαράσταση, σύµφωνα µε την κωδικοποίηση που ορίστηκε στην παράγραφο 3.2.2: Γονίδιο 1 Γονίδιο 2 (0.6, 0.8) (0.3, 0.4)

57 Βελτιστοποίηση της Μεθόδου των Αναλογιών 57 Το συµπέρασµα είναι ότι τα δύο χρωµοσώµατα περιέχουν διαφορετικά σχήµατα, κατευθύνοντας τον αλγόριθµο σε εξίσου καλά άτοµα, καθιστώντας τη διαδικασία σύγκλισης απρόβλεπτη. Το χειρότερο, όµως, είναι ότι ο χώρος αναζήτησης είναι πολύ µεγαλύτερος από όσο χρειάζεται. Ακόµα και για ακρίβεια δύο δεκαδικών ψηφίων, για κάθε κανονικοποιηµένο διάνυσµα όπως το (0.6, 0.8), υπάρχουν πολλοί γραµµικοί συνδυασµοί στο διάστηµα [0, 1]. Θα είχε λοιπόν ενδιαφέρον να καταγραφεί η απόδοση του αλγορίθµου στην περίπτωση που οι πληθυσµοί περιλαµβάνουν κανονικοποιηµένα και µόνο διανύσµατα βαρών. Η λύση της κανονικοποίησης του εκάστοτε απογόνου µετά από κάθε διασταύρωση δεν είναι ορθή σα σκέψη, καθώς έτσι καταστρέφονται τα όποια σχήµατα έχουν οι γονείς κληροδοτήσει. Ειδικά για τους συντελεστές βαρύτητας, παρουσιάζεται η ανάγκη για µια νέα µορφή κωδικοποίησης που να ανταποκρίνεται στη λογική των σχηµάτων, αλλά παράλληλα να εξασφαλίζει την εγκυρότητα µε τα νέα κριτήρια των διανυσµάτων που προκύπτουν ιανύσµατα Κωδικοποιηµένα µε Πραγµατικές Τιµές Σε µια αναπαράσταση όπως η δυαδική, δεν είναι εύκολο να ελεγχθούν οι ιδιότητες ενός διανύσµατος. Αντίθετα, στην κωδικοποίηση µε πραγµατικές τιµές, για την οποία έγινε λόγος στο τέλος του κεφαλαίου 2, γίνεται διαχείριση των ιδίων των τιµών, οπότε είναι δυνατόν να εφαρµοστούν οι αναγκαίοι περιορισµοί. Να σηµειωθεί ότι εφόσον η νέα κωδικοποίηση δεν µπορεί να εφαρµοστεί παρά µόνο για τους συντελεστές βαρύτητας, για τις υπόλοιπες παραµέτρους εφαρµογής ισχύει η γνωστή δυαδική αναπαράσταση. Από τη στιγµή που δεν είναι όλα τα γονίδια εκφρασµένα σε µια κοινή µορφή, δεν είναι δυνατή η χρήση ενιαίου τελεστή για την αναπαραγωγή. Για παράδειγµα, θα γίνει εφαρµογή µιας σύνθετης διασταύρωσης, κατά την οποία τα οµότιµα µέλη των συµµετεχόντων χρωµοσωµάτων θα διασταυρώνονται χωριστά. Αντίστοιχα και για τη µετάλλαξη. Σχήµα 3-9 Για να καταλάβουµε την επίδραση που έχει στο χώρο αναζήτησης η ύπαρξη αποκλειστικά µοναδιαίων διανυσµάτων, ας θεωρήσουµε και πάλι το παράδειγµα των δύο µεταβλητών. Αν τα πιθανά βάρη για τη µεταβλητή x είναι n τω αριθµώ, ενώ για

58 58 Κεφάλαιο τρίτο τη y είναι m, τότε έχουµε n * m πιθανές λύσεις. Με τη παραδοσιακή κωδικοποίηση εκτελείται αναζήτηση σε όλο το χώρο. Ωστόσο, µε την εναλλακτική µέθοδο που προτείνεται, εξετάζονται µόνο οι συνδυασµοί των τιµών των βαρών που έχουν µέτρο ίσο µε τη µονάδα. Για την περίπτωση των δύο µεταβλητών, απεικονίζονται στο σχήµα ως τεταρτοκύκλιο. Με γενίκευση προκύπτει ότι ο νέος χώρος αναζήτησης είναι ένα υπερεπίπεδο του αρχικού. Σχήµα 3-10 Για τη φάση της αρχικοποίηση του πληθυσµού, υποθέτουµε ότι έχουµε µια γεννήτρια τυχαίων διανυσµάτων, θετικών τιµών, καθώς δεν ορίζονται αρνητικά βάρη στο πρόβληµα. Είναι εύκολη η µετατροπή των δοθέντων διανυσµάτων στα αντίστοιχα µοναδιαία, µε διαίρεση της κάθε τιµής µε το µέτρο του εκάστοτε διανύσµατος. Το ζητούµενο είναι η διασφάλιση της ύπαρξης αυτής της ιδιότητας και στους απογόνους, γεγονός που οφείλουν να εγγυηθούν οι τελεστές αναπαραγωγής που θα χρησιµοποιηθούν. Ξεκινώντας µε την επίπεδη διασταύρωση, έχουµε δει ότι µε τη θεώρηση διανύσµατος τυχαίων τιµών (λ 1, λ 2 λ N ) που κυµαίνονται στο διάστηµα [0..1], η i-οστή συνιστώσα του απογόνου θα είναι λ i * x i + (1 - λ i ) * y i, όπου x i και y i οι συνιστώσες των γονέων. Εύκολα προκύπτει και δεύτερος απόγονος µε αντιστροφή των παραµέτρων λ i και (1 - λ i ) στον παραπάνω τύπο. ηλαδή το κάθε παιδί θα κληρονοµήσει κατά ένα ποσοστό την i-οστή τιµή του ενός γονέα, και κατά το υπόλοιπο την i-οστή τιµή του δευτέρου. Χρειάζεται, ωστόσο, να διερευνηθεί κατά πόσο αυτή η τακτική αποδίδει πράγµατι απογόνους-διανύσµατα µε µοναδιαίο µέτρο. Σχήµα 3-11

59 Βελτιστοποίηση της Μεθόδου των Αναλογιών 59 Στο εικονιζόµενο παράδειγµα, υπάρχουν δύο µεταβλητές προς απόδοση συντελεστή βαρύτητας σε αυτές. Τα δυνατά βάρη για αυτές είναι οι τιµές στους άξονες 1 και 2. Ενδιαφέρον υπάρχει µόνο για τις τιµές που ανήκουν σε διανύσµατα µοναδιαίου µέτρου, όπως αυτά των γονέων. Γονέας x θεωρείται το πράσινο διάνυσµα (0.6, 0.8), και γονέας y το κόκκινο (0.98, 0.2). Η ανάλυση αυτών σε συνιστώσες φαίνεται στο πρώτο σχήµα. Από τις τελευταίες θα προκύψουν οι συνιστώσες του απογόνου, σύµφωνα µε τον παραπάνω τύπο της επίπεδης διασταύρωσης. Στην πιο απλή περίπτωση, το διάνυσµα λ θα είναι (0.5, 0.5). ηλαδή, για κάθε διάσταση, η συνιστώσα του απογόνου θα είναι ο µέσος όρος των αντίστοιχων συνιστωσών των γονέων, εφόσον ο τύπος θα έχει γίνει 0.5 * x i * y i. Για το παράδειγµά µας, το αποτέλεσµα της διασταύρωσης θα είναι (0.79, 0.5), του οποίου το µέτρο απέχει πολύ από τη µονάδα. Αν και ο εν λόγω τελεστής δεν είναι κατάλληλος στην παρούσα µορφή του, όπως φάνηκε, εύκολα τα παραγόµενα άτοµα µπορούν να κανονικοποιηθούν εκ των υστέρων, ώστε να ανταποκρίνονται στους περιορισµούς. Η κανονικοποίηση δε µεταβάλλει τις ιδιότητες που έχουν κληρονοµηθεί. Στο σχήµα, το τελικό διάνυσµα θα είχε την ίδια διεύθυνση µε το εικονιζόµενο κίτρινο, αυτό που δε βρίσκεται στους κύριου άξονες, αλλά το πέρας του θα ενέπιπτε ακριβώς στο όριο του µοναδιαίου τεταρτοκύκλιου. Φυσικά, ο όρος τεταρτοκύκλιο ισχύει µόνο για τις δύο διαστάσεις. Στη γενικότερη περίπτωση η αναφορά γίνεται στο τµήµα εκείνο της µοναδιαίας υπερσφαίρας όπου όλες οι τιµές των διανυσµάτων είναι θετικές, εφόσον έτσι ορίζεται από το πρόβληµα. Εναλλακτικά, µπορεί να χρησιµοποιηθεί η διασταύρωση BLX-α, που συζητήθηκε στην παράγραφο 2.4.4, ακολουθουµένη οπωσδήποτε από κανονικοποίηση του απογόνου. Στην επίπεδη διασταύρωση κάθε συνιστώσα παίρνει τυχαία τιµές από αυτή που ορίζουν τα max(x i, y i ) και min(x i, y i ), έστω Ι. Στην BLX-α επιλέγονται τυχαίες τιµές στο διάστηµα [min(x i, y i ) - I * α, max(x i, y i ) + I * α], όπου α προεπιλεγµένη παράµετρος, συνήθως µικρότερη της µονάδας. Ενδεικτικό της νέας προσέγγισης είναι το ακόλουθο σχήµα, όπου α ίσο µε 0.5. Φυσικά, θα χρειαστεί κανονικοποίηση προκειµένου το πέρας του νέου διανύσµατος να εµπίπτει στην έντονα µπλε περιοχή του τεταρτοκυκλίου.

60 60 Κεφάλαιο τρίτο Σχήµα 3-12 Η µετάλλαξη µπορεί να υλοποιηθεί µε οποιονδήποτε από τους τρόπους που έχουν προταθεί στο κεφάλαιο 2 για την κωδικοποίηση µε πραγµατικές τιµές. Προϋπόθεση, βέβαια, είναι να έπεται της µετάλλαξης κανονικοποίηση του απογόνου. Ωστόσο, η τελευταία δεν είναι απαραίτητη στην περίπτωση που αντιµετατίθενται δύο ή και περισσότερες τιµές του διανύσµατος. Άλλωστε, το µέτρο ενός διανύσµατος δεν εξαρτάται από τη σειρά των τιµών του, αλλά η αλλαγή αυτής της σειράς αλλάζει τελείως την επίδρασή του στο περιβάλλον του. ηλαδή, ακριβώς αυτό που θέλουµε να επιτύχουµε µε τη µετάλλαξη. Συνοψίζοντας, ο λόγος χρήσης πραγµατικών τιµών έγκειται στην ευκολία ελέγχου εγκυρότητας των λύσεων, σύµφωνα µε τις απαιτήσεις περί µοναδιαίου µέτρου. Η κανονικοποίηση είναι εύκολη, χωρίς να µεταβληθούν τα χαρακτηριστικά που συνδυάζονται. Το τελευταίο ακούγεται παράδοξο, αλλά δεν είναι οι ίδιες οι τιµές των γονέων που επηρεάζουν τη µορφή των απογόνων, αλλά οι γωνίες που σχηµατίζουν τα διανύσµατα των τιµών τους µε τους άξονες. Αυτό συµβαίνει από τη στιγµή που µετά τη διασταύρωση ακολουθεί κανονικοποίηση Μετασχηµατισµός από Υπερσφαιρικές Συντεταγµένες Στο σχήµα 3-11 είδαµε ότι η τροποποιηµένη κωδικοποίηση µε πραγµατικές τιµές, έχει θεαµατικά αποτελέσµατα όσον αφορά το χώρο αναζήτησης, καθώς ο αριθµός των διαστάσεων ελαττώνεται κατά µία µονάδα. Η ιδέα της αποκλειστικής χρήσης κανονικοποιηµένων διανυσµάτων φαίνεται σωστή, αλλά η προηγούµενη υλοποίηση έχει κάποια προβλήµατα. Η έλλειψη κωδικοποιηµένης αναπαράστασης, έστω δυαδικής, περιορίζει τη τυχαιότητα όσον αφορά το συνδυασµό των χαρακτηριστικών των ατόµων. Κληροδοτείται στους απογόνους η τάση να έχουν κάποια συγκεκριµένη

61 Βελτιστοποίηση της Μεθόδου των Αναλογιών 61 γωνία µε τους άξονες, και όχι σχήµατα, σε αντίθεση µε τα φυσικά αλλά και τα περισσότερα τεχνητά εξελικτικά συστήµατα. Σε παραδείγµατα της προηγούµενης παραγράφου, είδαµε ότι οι απόγονοι κινούνταν στα όρια της µοναδιαίας υπερσφαίρας. Πιο συγκεκριµένα, για το παράδειγµα των δύο µεταβλητών, ο λόγος ήταν για κύκλο. Αντίστοιχα λοιπόν, για ένα χώρο n διαστάσεων, τα διανύσµατα µε µέτρο ίσο µε µονάδα κινούνται στην επιφάνεια µιας µοναδιαίας (n- 1)-σφαίρας. Ενώ, λοιπόν, ένα οποιοδήποτε διάνυσµα θα είχε n βαθµούς ελευθερίας, ένα κανονικοποιηµένο έχει n-1. Εκφράζοντας τα διανύσµατα σε καρτεσιανές συντεταγµένες, είµαστε δέσµιοι της σχέσης που πρέπει να υπάρχει µεταξύ των τιµών, δηλαδή, η ρίζα του αθροίσµατος των τετραγώνων να είναι µονάδα. Αυτό που χρειάζεται είναι ο µετασχηµατισµός σε ένα σύστηµα συντεταγµένων στο οποίο τα σηµεία εκφράζονται ως απόσταση από την αρχή των αξόνων και µια ακολουθία γωνιών. Για την περίπτωση των τριών διαστάσεων, ας δούµε την αντιστοιχία του καρτεσιανού συστήµατος, σε ένα σφαιρικό σύστηµα συντεταγµένων. Σχήµα 3-13 Στο νέο σύστηµα, τα σηµεία εκφράζονται ως ακολουθίες του τύπου (ρ, φ,θ), όπου: ρ ορίζεται η απόσταση ενός σηµείου P από την αρχή των αξόνων όπου ρ 0 φ είναι η γωνία µεταξύ του θετικού άξονα z, και της ευθείας που ορίζεται από το P και την αρχή των αξόνων όπου 0 φ π θ είναι η γωνία µεταξύ του θετικού άξονα x, και της προβολής στο επίπεδο xy της ευθείας που ορίζεται από το P και την αρχή των αξόνων όπου 0 θ 2π Πλέον, τα διανύσµατα µοναδιαίου µέτρου είναι της µορφής (1, φ,θ), αφού ως µέτρο διανύσµατος ορίζεται η απόσταση του πέρατός του από την αρχή των αξόνων. Στη νέα µορφή, είναι εµφανής η ιδιότητα ότι οι βαθµοί ελευθερίας µειώνονται κατά ένα, για συγκεκριµένο µέτρο διανύσµατος. Ο χώρος αναζήτησης δεν είναι πια τρισδιάστατος, αλλά ο δυσδιάστατος που ορίζεται από την επιφάνεια της µοναδιαίας σφαίρας. Αλλά από τη στιγµή που το διάνυσµα βαρών αποτελείται µόνο από θετικές τιµές, ωφέλιµο για την περίπτωσή µας είναι µόνο το τµήµα της σφαίρας για οποίο οι

62 62 Κεφάλαιο τρίτο αντίστοιχες καρτεσιανές συντεταγµένες είναι θετικές. ηλαδή όλες οι γωνίες κυµαίνονται στο διάστηµα [0, π/2]. Για την απεικόνιση σηµείων στο νέο χώρο, αρκούν οι γωνίες φ και θ. Μια απλή κωδικοποίηση των εν λόγω γωνιών, θα µπορούσε να γίνει ως εξής: Ορισµός της µονάδας µέτρησης των γωνιών. Οι γωνίες θα εκφράζονται ως ακέραια πολλαπλάσια αυτής (πχ 45 ο = 45 * 1 ο ) Ορισµός ελάχιστου µήκους δυαδικής αναπαράστασης, ώστε να απεικονίζονται όλες οι δυνατές τιµές γωνιών (πχ log 2 90 = 7) Απεικόνιση κάθε δυνατής τιµής γωνίας, σε µια µοναδική δυαδική παράσταση Από τη στιγµή που διαχειριζόµαστε γωνίες, η κωδικοποίηση δε διαφέρει από την απλή κωδικοποίηση των βαρών στην παράγραφο Μόνο που τα γονίδια είναι πλέον οι δυαδικές ακολουθίες που κωδικοποιούν την κάθε γωνία, και όχι τα ίδια τα βάρη. Μη έγκυρες δυαδικές παραστάσεις θα θεωρούνται µόνο αυτές που δεν έχουν συνδεθεί µε κάποια γωνία. Κατά τα άλλα, ο συνδυασµός των n-1 γωνιών, όπου n ο αριθµός των βαρών, παρέχει αρκετή πληροφορία για την εξαγωγή του κανονικοποιηµένου διανύσµατος των συντελεστών βαρύτητας. Το τελευταίο επιτυγχάνεται µε µια απλή µετατροπή των σφαιρικών συντεταγµένων σε καρτεσιανές, θεωρώντας ότι η απόσταση ρ ισούται µε τη µονάδα. x = ρ sinφ cosθ y = ρ sinφ sinθ z = ρ cosθ Τα παραπάνω µπορούν να γενικευθούν, ώστε να ανταποκρίνονται για χώρους των n διαστάσεων. Στη γενική, λοιπόν, περίπτωση που το διάνυσµα συντελεστών βαρύτητας είναι το {x 1, x 2 x n }, το αντίστοιχο σε υπερσφαιρικές συντεταγµένες είναι {r, φ 1,φ 2 φ n-1 }. Με τον όρο υπερσφαίρα εννοείται κάθε n-σφαίρα, η οποία ενσωµατώνεται σε ένα χώρο n+1. Στο παράδειγµα των τριών διαστάσεων, είχαµε 2- σφαίρα, ενσωµατωµένη στον τρισδιάστατο χώρο. Οµοίως η απόσταση r ορίζεται µόνο για θετικές τιµές. Η γωνία φ 1 κυµαίνεται στο διάστηµα [0, 2π], ενώ το πεδίο τιµών των φ 2 φ n-1 είναι το [0, π]. Σε αναλογία µε τις παραδοχές για τον τρισδιάστατο χώρο, µας ενδιαφέρει µόνο η επιφάνεια της µοναδιαίας n-1-σφαίρας, δηλαδή τα σηµεία όπου r = 1, οπότε το r παραλείπεται από την αναπαράσταση της λύσης. Επιπλέον, όλες οι γωνίες περιορίζονται στο διάστηµα [0, π/2], αφού είναι το µόνο τµήµα της υπερσφαίρας που αντιστοιχεί σε διάνυσµα θετικών τιµών σε καρτεσιανό σύστηµα. Συνεπώς, για την περιγραφή των λύσεων σχετικά µε το πρόβληµα της απόδοσης σταθµικών παραγόντων στα χαρακτηριστικά των έργων, αρκεί µια ακολουθία γωνιών: { φ 1,φ 2 φ n-1 }, φ i [0, π/2], 1 i n-1 Παρατηρούµε ότι στη νέα του µορφή, το διάνυσµα έχει όντως n-1 βαθµούς ελευθερίας. Για την παραγωγή των νέων λύσεων αρκεί η παραγωγή n-1 γωνιών, που κυµαίνονται στο διάστηµα που ορίστηκε. Αφού οι τιµές των γωνιών κωδικοποιηθούν δυαδικά, οι πράξεις επί του γενετικού υλικού θα συνδυάσουν τις γωνίες και όχι άµεσα τα βάρη των χαρακτηριστικών. Εφόσον δεν υπάρχει εξάρτηση µεταξύ των γωνιών,

63 Βελτιστοποίηση της Μεθόδου των Αναλογιών 63 αντίθετα µε τα βάρη, κάθε νέα ακολουθία γωνιών είναι έγκυρη, δηλαδή αντιστοιχεί σε µοναδιαίο διάνυσµα. Όµως, η παρούσα µορφή δεν είναι άµεσα χρησιµοποιήσιµη από τη συνάρτηση καταλληλότητας. Την εξαγωγή των γωνιών από τη δυαδική παράσταση, πρέπει να ακολουθήσει µετασχηµατισµός στο καρτεσιανό σύστηµα συντεταγµένων. Είδαµε τη µετατροπή για τρισδιάστατο χώρο, αλλά στη γενικότερη περίπτωση οι καρτεσιανές µεταβλητές x 1 υπολογίζονται ως εξής: Με λίγα λόγια, η νέα δυαδική αναπαράσταση που προτείνεται, όχι µόνο είναι συµβατή µε τα υπόλοιπα προς κωδικοποίηση χαρακτηριστικά, αλλά διατηρεί τις ιδιότητας των κανονικοποιηµένων διανυσµάτων. Ακόµη, το νέο µοντέλο είναι συµβατό µε την υπόθεση των δοµικών µονάδων, εφόσον εφαρµόζονται οι παραδοσιακοί γενετικοί τελεστές πάνω σε δυαδικά σχήµατα, προάγοντας µακροπρόθεσµα τα καλύτερα από αυτά. Το σχήµα 3-14 απεικονίζει συνοπτικά τις διαδικασίες παραγωγής λύσεων, κωδικοποίησης σε χρωµόσωµα, και τελικά εξαγωγή του πραγµατικού διανύσµατος βαρών που αντιστοιχεί στο µοναδιαίο µέτρο και στις αποθηκεµένες γωνίες. εν υπάρχει ανάγκη µετατροπής από καρτεσιανό σύστηµα σε υπερσφαιρικό. Η παραγωγή τυχαίων γωνιών φ i, όπου 1 i n-1, εγγυάται ότι τα αντίστοιχα κανονικοποιηµένα διανύσµατα είναι εξ ίσου τυχαία.

64 64 Κεφάλαιο τρίτο Σχήµα 3-14

65 65 Κεφάλαιο τέταρτο: ΣΧΕ ΙΑΣΗ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΡΥΘΜΙΣΗ ΜΕΘΟ ΟΥ ΑΝΑΛΟΓΙΩΝ Στο προηγούµενο κεφάλαιο παρουσιάστηκαν και αξιολογήθηκαν διάφορες προτάσεις για την κατασκευή γενετικού αλγορίθµου ικανού να δώσει λύση στο πρόβληµα βελτιστοποίησης που πραγµατεύεται η εν λόγω εργασία. Η κατανόηση του προβλήµατος της ρύθµισης της µεθόδου των αναλογιών, αλλά και η διερεύνηση των δυνατοτήτων επίλυσης µε γενετικούς αλγορίθµους, είχαν απώτερο σκοπό την εκπόνηση ενός µοντέλου για την ανάπτυξη συστήµατος που θα διαχειρίζεται το πρόβληµα µε την προτεινόµενη µέθοδο. Αυτό το µοντέλο παρουσιάζεται στο τρέχον κεφάλαιο. Η µοντελοποίηση έγινε µε βάση τις αρχές της αντικειµενοστραφούς προσέγγισης. Στόχος είναι η οργάνωση του κώδικα που πρόκειται να παραχθεί µε τρόπο που να καθίσταται εύκολη η συντήρηση και η επέκταση του συστήµατος. Επιπλέον, είναι σχετικά απλό να αντιστοιχηθούν τα συστατικά του γενετικού αλγορίθµου σε οντότητες που προσεγγίζονται από τις κλάσεις του αντικειµενοστραφούς προγραµµατισµού. Ωστόσο, δεν έχει γίνει σύνδεση µε συγκεκριµένη γλώσσα προγραµµατισµού, αλλά µε την Ενοποιηµένη Γλώσσα Μοντελοποίησης (Unified Modeling Language) UML. Το σκεπτικό είναι η δηµιουργία σχεδίου ανάπτυξης λογισµικού για την επίλυση του προβλήµατος, αφήνοντας στον προγραµµατιστή τις αποφάσεις για τεχνικές λεπτοµέρειες. 4.1 Γενική Θεώρηση Σχεδίασης Σε πρώτη φάση, θα γίνει µια περιγραφή του µοντέλου σε αφαιρετικό επίπεδο, δηλαδή θα οριστούν οι ενότητες στις οποίες οι κλάσεις θα οµαδοποιηθούν. Αυτές οι ενότητες αναφέρονται στη UML ως πακέτα. Στη συνέχεια, θα εστιάσουµε στις κλάσεις που συγκροτούν το σκελετό ενός γενετικού αλγορίθµου, πάνω στον οποίο θα προσαρτηθούν αργότερα τα επιµέρους συστατικά Ενότητες Λογισµικού Στο δεύτερο κεφάλαιο είδαµε ότι τµήµατα ενός γενετικού αλγορίθµου αποτελούν η συνάρτηση καταλληλότητας, η επιλογή, η αναπαράσταση σε χρωµοσώµατα, η αναπαραγωγή και η ανανέωση του πληθυσµού. Τα προαναφερθέντα αποτελούν τις ενότητες του υπό ανάπτυξη συστήµατος. Η προσπάθεια γίνεται µε σκοπό την ανεξαρτητοποίηση των κλάσεων από το περιβάλλον εκτός της ενότητάς τους.

66 66 Κεφάλαιο τέταρτο Το παρακάτω διάγραµµα πακέτων απεικονίζει τα σύνολα των κλάσεων που επιλέχθηκαν, ώστε να ανταποκρίνονται στα συστατικά του αλγορίθµου. Στη συνέχεια σχολιάζεται το περιεχόµενό τους, αλλά και ο τρόπος αλληλεπίδρασής τους. Σχήµα 4-1 Ξεκινώντας µε το πακέτο selection, εν ολίγοις περιλαµβάνει κλάσεις που υλοποιούν αλγόριθµους επιλογής για συµµετοχή στην αναπαραγωγή. Η επιλογή γίνεται φυσικά µε βάση την καταλληλότητα, όπως αυτή ορίζεται στο ίδιο το πακέτο. Πρόσβαση στις κλάσεις επιλογής δεν απαιτείται παρά µόνο από το γενικό αλγόριθµο. Ωστόσο, η έννοια της καταλληλότητας είναι κρίσιµη για τις υλοποιήσεις της συνάρτησης καταλληλότητας, οι οποίες ανήκουν στο πακέτο fitnessevaluation, κάτι που δικαιολογεί και τη σχετική εξάρτηση. Σηµαντική λεπτοµέρεια είναι το γεγονός ότι δεν υπάρχουν εξαρτήσεις που να καταλήγουν στο fitnessevaluation. Η διαδικασία της αξιολόγησης, που υλοποιείται σε αυτό, αποκωδικοποιεί τα γονίδια και χρησιµοποιεί αυτές τις πληροφορίες σε ρουτίνες που δεν έχουν άµεσα σχέση µε το γενετικό αλγόριθµο. Είναι το κοµµάτι που συνδέει τον αλγόριθµο µε το εκάστοτε πρόβληµα. Η λογική της σχεδίασης επιτρέπει την προσάρτηση οποιασδήποτε συνάρτησης προς βελτιστοποίηση, χωρίς να επηρεάζονται οι υπόλοιπες διαδικασίες που προσοµοιώνουν την εξέλιξη των πληθυσµών. Στο πακέτο reproduction οµαδοποιούνται οι διαθέσιµοι τελεστές διασταύρωσης και µετάλλαξης. Έχει υιοθετηθεί κι εδώ το σκεπτικό της αποµόνωσης των περιλαµβανοµένων λειτουργιών από άλλα θέµατα, όπως η επιλογή ή η αξιολόγηση.

67 Σχεδίαση Συστήµατος για Ρύθµιση Μεθόδου Αναλογιών 67 Φυσικά, η όποια διαδικασία επέµβασης στο γενετικό υλικό απαιτεί γνώση της δοµής των χρωµοσωµάτων, το οποίο µεταφράζεται σε εξάρτηση από το αντίστοιχο πακέτο. Το τελευταίο είναι δηλωµένο ως individualrepresentation, και συγκεντρώνει πληροφορίες για τα χρωµοσώµατα, το φαινότυπο και την καταλληλότητα των ατόµων. Η εξάρτηση από την ενότητα επιλογής, αφορά µόνο τον ορισµό της καταλληλότητας. Εξαιρουµένης αυτής, υπάρχουν πολλοί βαθµοί ελευθερίας στη σχεδίαση των κλάσεων των ατόµων, καθώς δεν υπάρχει επίδραση από τις επιλογές σε άλλα τµήµατα του γενετικού αλγορίθµου. Από εκεί κι πέρα, όλες οι διεργασίες που αναφέρονται στα άτοµα, εξαρτώνται από το εν λόγω πακέτο. Συνεπώς, θα πρέπει να έχουµε υπ όψιν ότι οι επιλογές σχεδίασης θα επηρεάσουν τη µορφή των υπόλοιπων ενοτήτων. Οι κλάσεις που συνδυάζουν τα παραπάνω στοιχεία µε σκοπό την ανανέωση του πληθυσµού και τη σύγκλιση σε λύση, συγκροτούν το πακέτο mainga. Υπάρχουν αµφίδροµες εξαρτήσεις προς όλες τις ενότητες, αφού ο ρόλος των περιεχοµένων κλάσεων συνίσταται στην επικοινωνία και συνεργασία των συστατικών του γενετικού αλγορίθµου Κλάσεις Γενετικών Αλγορίθµων και Παράµετροι Με σκοπό τη µεγιστοποίηση της επαναχρησιµοποίησης του κώδικα, σε όλη τη φάση της σχεδίασης περιλαµβάνονται αφαιρετικοί τύποι όπως παράγωγες κλάσεις και διασυνδέσεις (interface), που ορίζουν τις προδιαγραφές για συγκεκριµένους τύπους αλγορίθµων. Η παρούσα παράγραφος είναι αφιερωµένη στην οργάνωση των συστατικών που είναι αντιληπτά από το περιβάλλον και οργανώνουν τις επιµέρους λειτουργίες. Τέτοια είναι η έννοια του αποτελέσµατος, του πληθυσµού, του συνόλου των παραµέτρων λειτουργίας, αλλά και ο ίδιος ο γενετικός αλγόριθµος. Αυτά περιλαµβάνονται στο πακέτο mainga. Εστιάζοντας στις απολύτως βασικές λειτουργίες της τάξης των γενετικών αλγορίθµων, καταλήγουµε στον ορισµό της διασύνδεσης GeneticAlgorithm. Κάθε κλάση που την υλοποιεί, είναι υποχρεωµένη να συµπεριλάβει µια µέθοδο exec() που θα δέχεται το σύνολο των παραµέτρων εκτέλεσης του αλγορίθµου, και θα επιστρέφει αποτέλεσµα. Οι έννοιες παράµετροι και αποτέλεσµα περιγράφονται εξίσου γενικά, µε ανάλογες διασυνδέσεις. Το παρακάτω διάγραµµα απεικονίζει την πραγµάτωση του παρόντος interface από την κλάση που θα χρησιµοποιηθεί.

68 68 Κεφάλαιο τέταρτο Σχήµα 4-2 Η κλάση AdaptiveGA περιγράφει πλήρως τη λειτουργία του βασικού γενετικού αλγορίθµου, ενισχυµένου µε χαρακτηριστικά προς βελτίωση της απόδοσης. Η υπέρβαση της exec() θα περιλαµβάνει την αρχικοποίηση του πληθυσµού και την ανανέωσή του σύµφωνα µε τις παραµέτρους που έχουν επιλεγεί, µέχρι να ικανοποιηθεί ένα κριτήριο τερµατισµού. Η έννοια της προσαρµοστικότητας προσεγγίζεται µε τη διακύµανση της πιθανότητας µετάλλαξης ανάλογα µε της σύγκλιση του αλγορίθµου. Στην ίδια κλάση πραγµατοποιείται και η πολιτική της µερικής ανανέωσης. ιατηρούνται ιδιωτικές µεταβλητές που εκφράζουν την αναλογία των καλύτερων ατόµων του πληθυσµού που θα περάσουν απ ευθείας στην επόµενη γενεά, αλλά και αυτών που θα αποκοπούν από την διαδικασία αναπαραγωγής, ως τα λιγότερο ικανά. Επιπλέον, µε σκοπό την αποφυγή της πρόωρης σύγκλισης λόγω ελιτισµού, κατά την ανανέωση του πληθυσµού, υπάρχει διαδικασία διαγραφής επαναλαµβανόµενων ατόµων στην ίδια γενεά. Η σχέση εξάρτησης της παρούσας κλάσης από το interface Population, έχει σχέση µε την ιδιότητά της για διαχείριση πληθυσµών. Ο λόγος χρήσης αφαιρετικού τύπου έγκειται στην ανάγκη παραµετροποίησης των ατόµων που θα συµµετέχουν στις γενεές. Λεπτοµέρειες για την υλοποίηση της τρέχουσας διασύνδεσης θα αναλυθούν κατά την περιγραφή του πακέτου individualrepresentation, όπου και ανήκει. Στο προηγούµενο διάγραµµα φάνηκαν κάποιες επιπλέον εξαρτήσεις, αυτές του interface GeneticAlgorithm από τα GAParameterSet και GAResult, τα οποία καθορίζουν τη συµπεριφορά των κλάσεων οµαδοποίησης παραµέτρων και αποτελεσµάτων αντίστοιχα. Για τη δεύτερη περίπτωση, η υλοποίηση γίνεται από την κλάση FittestIndividualResult, η οποία απλά περιέχει το άτοµο που θεωρείται ικανότερο και αποδίδει την καταλληλότητά του. Οι έννοιες άτοµο και καταλληλότητα περιγράφονται από διασυνδέσεις που ανήκουν σε άλλα πακέτα, η Individual στο individualrepresentation και η Fitness στο selection. Ο διαχωρισµός από το βασικό γενετικό αλγόριθµο συστατικών όπως το είδος διασταύρωσης, η πολιτική επιλογής ή η αξιολόγηση των λύσεων, έχει σκοπό την παραµετροποίηση της εκτέλεσής του. Οι κλάσεις που θα πραγµατώνουν το interface GAParameterSet οφείλουν να διαθέτουν µεθόδους για πέρασµα αντικειµένων που υλοποιούν τις παραµέτρους. Στο διάγραµµα φαίνονται οι εξαρτήσεις του παρόντος

69 Σχεδίαση Συστήµατος για Ρύθµιση Μεθόδου Αναλογιών 69 interface από τις διασυνδέσεις άλλων πακέτων, αλλά και ο τρόπος υλοποίησης από της κλάση DefaultParameterSet. Σχήµα 4-3 Επί της ουσίας, η τελευταία κλάση πραγµατοποιεί µια οµαδοποίηση στη µνήµη, των αλγορίθµων που θα χρησιµοποιηθούν για τα βήµατα της διαδικασίας της εξέλιξης. Η παραγωγή και αναπαραγωγή των ατόµων, η αξιολόγηση και η επιλογή, µπορούν να πραγµατωθούν µε πολλούς τρόπους, που παρουσιάζονται στην περιγραφή των αντίστοιχων πακέτων. Η χρήση διασυνδέσεων για την απεικόνιση των συσχετίσεων µε τις οντότητες του τρέχοντος πακέτου, επιτρέπει την παραµετροποίηση των διαδικασιών. 4.2 Μοντελοποίηση Συστατικών Γενετικού Αλγορίθµου Στην προηγούµενη ενότητα έγινε λόγος για το µοντέλο της οργάνωσης των στοιχείων που συγκροτούν ένα γενετικό αλγόριθµο. Είδαµε ότι οι διασυνδέσεις και οι υλοποιήσεις που αφορούν την αναπαράσταση, την αναπαραγωγή, την αξιολόγηση και της επιλογή των ατόµων, κατανέµονται σε πακέτα, ενότητες λογισµικού που θα αναπτυχθούν ανεξάρτητα. Ακολουθεί µια πιο διεισδυτική µατιά στον τρόπο µε τον οποίο αυτά τα συστατικά µεταφράζονται σε οντότητες του αντικειµενοστραφούς µοντέλου.

70 70 Κεφάλαιο τέταρτο Άτοµα και Πληθυσµοί Στην ενότητα που προηγήθηκε, έγινε λόγος για άτοµα και πληθυσµούς, χωρίς όµως να αποσαφηνιστεί η αναπαράστασή τους. Ξεκινώντας από την έννοια του πληθυσµού, το interface Population ορίζει απλά τις µεθόδους επικοινωνίας µιας συλλογής ατόµων στη µνήµη. Αυτές υλοποιούνται στην κλάση SimpleCollectionOfIndividuals, η οποία και αποθηκεύει τα άτοµα σε ιδιωτική δοµή δεδοµένων. Ενδιαφέρον είναι ότι η παρούσα σχεδίαση της κλάσης του πληθυσµού, επιτρέπει συλλογές ατόµων οποιουδήποτε τύπου από αυτούς που θα υλοποιήσουν το interface Individual. Σχήµα 4-4 Μέχρι τώρα, αναφορά σε άτοµα, από προγραµµατιστική άποψη, έγινε µόνο µέσω ενός αφαιρετικού τύπου, του interface Individual. Πράγµατι, το σύνολο των λειτουργιών που δηλώνονται σε αυτό, είναι η µοναδική πληροφορία για τη διαχείρισή τους από τις περισσότερες από τις εξωτερικές του πακέτου οντότητες. ηλαδή, µε εξαίρεση πακέτα όπως της αναπαραγωγής, µόνο η καταλληλότητα χρειάζεται να είναι προσπελάσιµη από το περιβάλλον. Το πακέτο individualrepresentation περιλαµβάνει διάφορες υλοποιήσεις, που αντιστοιχούν σε διαφορετικά προβλήµατα, αλλά η λεπτοµέρειές τους είναι κατά κύριο λόγο άγνωστες για τον έξω κόσµο. Ακολουθεί το διάγραµµα κληρονοµικότητας για τις κλάσεις υλοποίησης των ατόµων.

71 Σχεδίαση Συστήµατος για Ρύθµιση Μεθόδου Αναλογιών 71 Σχήµα 4-5 Το interface BinaryEncodedIndividual επεκτείνει το βασικό, µε σκοπό τη γενική περιγραφή των λειτουργιών των δυαδικά κωδικοποιηµένων χρωµοσωµάτων. Αυτές συνοψίζονται στο πέρασµα της δυαδικά κωδικοποιηµένης ακολουθίας, δηλαδή του χρωµοσώµατος. Η κλάση BaseIndividual είναι που υλοποιεί όλες τις µεθόδους που ορίζονται στην ιεραρχία των interface που προηγούνται αυτής. Ωστόσο, δεν είναι δυνατό να δηµιουργηθούν ενσαρκώσεις αυτής, καθώς έχει οριστεί ως αφαιρετική. Άλλωστε, ως ιδιωτικές µεταβλητές έχει µόνο τη δυαδική παράσταση (content), και την καταλληλότητα, εκφρασµένη ως συγκεκριµένη κλάση, που θα αναλυθεί στο πακέτο selection. εν υπάρχει καµία πληροφορία για τον τρόπο κωδικοποίησης σε χρωµόσωµα. Τέτοιες διαδικασίες θα προστεθούν από τις κλάσεις που θα την επεκτείνουν. Όµως, για κάθε κλάση ατόµου χρειάζεται να υπάρχει µια κλάση που θα συγκεντρώνει τις προδιαγραφές κατασκευής του. Χρειαζόµαστε δηλαδή γεννήτριες ατόµων, η οποία θα παράγουν άτοµα µε τυχαίο, ή και συγκεκριµένο τρόπο. Στη γενικότερη περίπτωση, οι λειτουργίες οµαδοποιούνται µε το interface IndividualsFactory. Ωστόσο, τα άτοµα που θα χρησιµοποιηθούν θα ανήκουν σε υποκλάσεις της BaseIndividual, και µια κοινή λειτουργία σε αυτά είναι ο έλεγχος της εγκυρότητάς τους. Η αφαιρετική κλάση BaseIndividualFactory υποχρεώνει την υπέρβαση µεθόδου εξέτασης εγκυρότητας, από όλες τις υποκλάσεις αυτής. Ο τρόπος υπερφόρτωσης εξαρτάται από τους περιορισµούς που έχουν τεθεί κατά την περιγραφή των προτεινόµενων κωδικοποιήσεων. Στο παρακάτω διάγραµµα κληρονοµικότητας, απεικονίζονται και οι εξαρτήσεις των παραγουσών τάξεων-γεννητριών, από τα αντίστοιχα άτοµα.

72 72 Κεφάλαιο τέταρτο Σχήµα 4-6 Μένει να περιγραφούν οι ιδιότητες και οι συσχετίσεις µεταξύ των κλάσεων των ατόµων και των γεννητριών που θα χρησιµοποιηθούν στην πράξη για τη συγκρότηση των πληθυσµών. Στο τρίτο κεφάλαιο έχουµε δει ότι τα γονίδια είναι ανοµοιογενή όσον αφορά την κωδικοποίησή τους. Έχουν γίνει διαφορετικές προτάσεις για την κωδικοποίηση των παραµέτρων εφαρµογής της µεθόδου των αναλογιών, για το υποσύνολο των χαρακτηριστικών των έργων, αλλά και για τα βάρη αυτών των χαρακτηριστικών. Για το πρόβληµά µας, τα άτοµα είναι ο συνδυασµός παραµέτρων και χαρακτηριστικών, όπως κι αν εκφράζονται τα τελευταία. Ωστόσο, η προσέγγιση που υιοθετήθηκε είναι η δηµιουργία κλάσεων ατόµων και γεννητριών, για κάθε ένα από το είδος των γονιδίων. Οι κλάσεις αυτές θα συσχετιστούν κατάλληλα, προκειµένου να περιγραφούν ολοκληρωµένα οι λύσεις.

73 Σχεδίαση Συστήµατος για Ρύθµιση Μεθόδου Αναλογιών 73 Σχήµα 4-7 Η σηµασία των γονιδίων για την κλάση ParametersIndividual, αφορά τους αριθµούς ταυτότητας των πολιτικών που µπορούν να εφαρµοστούν για κάθε παράµετρο εκτέλεσης της µεθόδου των αναλογιών. Εφόσον η δυαδική παράσταση έχει κληρονοµηθεί από υπερκλάση, λείπει µόνο ο τρόπος µετάφρασης αυτής. Χρειάζεται µια µέθοδος που θα αποδίδει ένα πίνακα ακεραίων µε τα ID, ενώ σαν είσοδο θα έχει τα σηµεία διαχωρισµού των χρωµοσωµάτων. Το τελευταίο είναι απαραίτητο, καθώς το µήκος της κωδικοποίησης θα εξαρτάται από τις δυνατές λύσεις, και καθορίζεται από την γεννήτρια ParametersIndividualFactory στην φάση παραγωγής ατόµων. Για τη δεύτερη κλάση, αυτές οι λειτουργίες έχουν υποστεί υπέρβαση κατάλληλα. Αλλά, πρώτα επιβάλλεται η αποθήκευση των στοιχείων από τα οποία εξαρτάται το µήκος των γονιδίων. Αυτά είναι ο αριθµός των διαθέσιµων µέτρων απόστασης, ο αριθµός των στατιστικών µέτρων, αλλά και ο µέγιστος και ο ελάχιστος αριθµός αναλογιών. Ο έλεγχος εγκυρότητας ανάγεται στην ύπαρξη ή όχι του ID που προκύπτει αποκωδικοποιώντας κάποιο γονίδιο. Για την κλάση SetIndividual, το n-οστό bit της ακολουθίας συνεπάγεται τη συµµετοχή ή όχι του n-οστού χαρακτηριστικού στη λύση, ανάλογα την τιµή του, 1 ή 0 αντίστοιχα. Είναι αρκετή η πρόσθεση µιας συνάρτησης που θα δέχεται είσοδο το σύνολο των ονοµάτων των χαρακτηριστικών. έξοδός της θα είναι ένα υποσύνολο ονοµάτων, που θα προκύπτει από τη δυαδική παράσταση. Το σχετικό εργοστάσιο παραγωγής ατόµων, SetIndividualFactory, απλά διατηρεί το µέγιστο πλήθος των χαρακτηριστικών, το οποίο συµπίπτει µε το µήκος του χρωµοσώµατος.

74 74 Κεφάλαιο τέταρτο Για την κωδικοποίηση των συντελεστών βαρύτητας των µεταβλητών των έργων, προτιµήθηκε η αναπαράσταση µε υπερσφαιρικές συντεταγµένες. Η επιλογή αυτή συνεπάγεται ότι οι φαινότυποι των ατόµων θα είναι διανύσµατα µοναδιαίου µέτρου, δικαιολογώντας το όνοµα της κλάσης UnitVectorIndividual. Ένα κανονικοποιηµένο διάνυσµα στο n-χώρο µπορεί να αποθηκευτεί ως µια διατεταγµένη ακολουθία στην οποία περιλαµβάνονται, η απόσταση από την αρχή των αξόνων, και οι n-1 γωνίες µε τους άξονες, όπως είδαµε στην παράγραφο Ακόµα, όπως έχουµε δει, η ακτίνα είναι σταθερή και ίση µε τη µονάδα, οπότε δεν απαιτείται αποθήκευση αυτής στο χρωµόσωµα. Για λόγους σαφήνειας, διατηρείται τόσο το πλήθος των µεταβλητών της λύσης (size), όσο και αυτό των γωνιών που αποθηκεύονται στο χρωµόσωµα (normalsize), αν και είναι γνωστό ότι το δεύτερο υπολείπεται του πρώτου κατά ένα. Η ιδιωτική µεταβλητή decimalscale δείχνει τη δεκαδική κλίµακα του πλήθους των τιµών των συντελεστών βαρύτητας. Εφόσον οι τιµές κυµαίνονται στο διάστηµα [0,1], τότε η εν λόγω µεταβλητή συµπίπτει µε ορισµό της ακρίβειας εκφρασµένη σε πλήθος δεκαδικών ψηφίων. Ακόµη, η precision αναφέρεται στον αριθµό των bits που θα χρησιµοποιηθούν για την κωδικοποίηση της κάθε γωνίας. Υπενθυµίζεται ότι οι γωνίες κυµαίνονται στο διάστηµα [0, π/2]. Η µεταβλητή precision επηρεάζει την ακρίβεια της αναπαράστασης, η οποία εξαρτάται από την επιθυµητή ακρίβεια των συντελεστών βαρύτητας. Το πέρασµα των τιµών των γωνιών γίνεται µε συνηθισµένες µεθόδους ανάθεσης και επιστροφής τιµών. Σηµειώνεται ότι το όρισµα που δείχνει τη θέση έχει µέγιστη τιµή το normalsize, αντί για το πλήθος των µεταβλητών των έργων. Οι παραπάνω ιδιωτικές µεταβλητές υπάρχουν δηλωµένες µε ακριβώς την ίδια έννοια στο εργοστάσιο λύσεων, UnitVectorIndividualFactory. Μάλιστα, µε βάση τις τιµές που έχουν οριστεί σε αυτό, παράγονται τα αντίστοιχα άτοµα. Όση είναι η ακρίβεια σε δεκαδικά ψηφία των βαρών που αναζητούνται, τόση θα είναι και αυτή των γωνιών που θα κωδικοποιηθούν. Το τελευταίο σηµαίνει ότι το precision ορίζεται ανάλογα µε το decimalscale, έργο που αναλαµβάνει η γεννήτρια κατά την αρχικοποίησή της. Γυρίζοντας πίσω στην UnitVectorIndividual, η µέθοδος getnormalizedvector() επιστρέφει το τελικό διάνυσµα, στον χώρο που είχε οριστεί αρχικά. Ουσιαστικά εκτελείται µετασχηµατισµός υπερσφαιρικών συντεταγµένων σε καρτεσιανές, θεωρώντας ότι η απόσταση από την αρχή των αξόνων ισούται µε µονάδα, όπως είδαµε στο τρίτο κεφάλαιο. Για το πρώτο από τα δύο προβλήµατα προς λύση, αρκεί η θεώρηση ενός ατόµου του οποίου η κωδικοποιηµένη δυαδική ακολουθία θα είναι η συνένωση µιας ακολουθίας αντικειµένου τύπου ParametersIndividual, και µιας τύπου SetIndividual. Αυτό ακριβώς κάνει η combine() µέθοδος της κλάσης AnalogiesIndividual, µε τα αντίστοιχα ορίσµατα. Ορίζεται συνάρτηση µε το ίδιο όνοµα για εισόδους ParametersIndividual και UnitVectorIndividual, µε παρόµοια λειτουργία. Ανάλογα την κλήση της combine(), επηρεάζεται µια ιδιωτική µεταβλητή σηµαίας που δηλώνει το είδος του ατόµου που είναι αποθηκευµένο. Επίσης, χρειάζονται ιδιωτικές µεταβλητές που να υποδεικνύουν το µήκος του χρωµοσώµατος, αλλά και το σηµείο διαχωρισµού των επιµέρους στοιχείων. Έτσι, η παρούσα κλάση µπορεί να χρησιµοποιηθεί για την αναπαράσταση κάθε ρύθµισης της µεθόδου των αναλογιών, ανεξάρτητα από τον ορισµό του προβλήµατος. Ακόµα, επειδή µια λύση χαρακτηρίζεται από στατιστικά µέτρα όπως το MMRE και το PRED(25), υπάρχουν αντίστοιχες ιδιότητες προ αποθήκευση αυτών.

75 Σχεδίαση Συστήµατος για Ρύθµιση Μεθόδου Αναλογιών 75 Όσον αφορά τη γεννήτρια AnalogiesIndividualFactory, δεν είναι παρά ένας συνδυασµός εργοστασίων λύσεων τύπου ParametersIndividualFactory και BaseIndividualFactory. Σχετικά µε το δεύτερο, µπορεί να αρχικοποιηθεί µόνο ως SetIndividualFactory ή ως UnitVectorIndividualFactory. Η δηµιουργία και ο έλεγχος ατόµων συνίσταται στην πραγµατοποίηση της αντίστοιχης λειτουργίας στις γεννήτριες που αποτελούν την παρούσα, και στη συνέχεια, σε συνδυασµό του αποτελέσµατος Συναρτήσεις Καταλληλότητας Το πακέτο fitnessevaluation αποµονώνει τις κλάσεις εκείνες που είναι υπεύθυνες για την απόδοση τιµών καταλληλότητας στα άτοµα. Κάθε κλάση που επιτελεί αυτή τη λειτουργία, περιλαµβάνει διαδικασίες που δεν πηγάζουν από τις ανάγκες του γενετικού αλγορίθµου για εξέλιξη και σύγκλιση, αλλά από το προς επίλυση πρόβληµα. Ωστόσο, κοινό χαρακτηριστικό της λειτουργικότητάς τους αποτελεί η ύπαρξη µεθόδου αξιολόγησης ατόµων, όπως κι αν αυτή διεξάγεται. Η οµαδοποίηση των κλάσεων αξιολόγησης γίνεται µε το interface FitnessEvaluationAlgorithm. Σχήµα 4-8 Η θεώρηση που έχει γίνει για το πρόβληµα ρύθµισης της µεθόδου των αναλογιών, αναφέρεται στην επίλυση δύο ανεξαρτήτων µεταξύ τους προβληµάτων. Συνεπώς, προκύπτει η ανάγκη ορισµού δύο αλγορίθµων εκτίµησης καταλληλότητας, από τους οποίους ένας µόνο θα επιλέγεται κατά την εκτέλεση. Οι κλάσεις CombinedSubsetEvaluation και CombinedWeightEvaluation υλοποιούν τον υπολογισµό της καταλληλότητας για την εύρεση του βέλτιστου υποσυνόλου και των βέλτιστων βαρών των χαρακτηριστικών αντίστοιχα. Στην πράξη, και στις δύο κλάσεις, γίνεται υπέρβαση της µεθόδου evaluatefitness(), µε τρόπο που να εκτελεί µια διαδικασία Jackknife, όπως αυτή που έχει περιγραφεί στην παράγραφο Για τον υπολογισµό των αποστάσεων µεταξύ των γνωστών έργων λογισµικού, θα χρησιµοποιηθεί είτε µόνο το υποσύνολο χαρακτηριστικών, είτε τα βάρη που είναι κωδικοποιηµένα στο χρωµόσωµα, ανάλογα το είδος της αξιολόγησης.

76 76 Κεφάλαιο τέταρτο Σχήµα 4-9 Να σηµειωθεί ότι η καταλληλότητα εκφράζεται πλέον µε συγκεκριµένη υλοποίηση του interface Fitness, εξ αυτού και η ανάλογη εξάρτηση. Ο λόγος είναι η ανάγκη χρήσης απόλυτων τιµών καταλληλότητας, αλλά περισσότερες πληροφορίες για την υλοποίηση διατίθενται στην επόµενη παράγραφο. Σχετικά µε τις εξαρτήσεις από τα άτοµα, στη γενικότερη περίπτωση, κάθε κλάση που υλοποιεί το FitnessEvaluationAlgorithm εξαρτάται και από συγκεκριµένη κλάση ατόµου. Η αξιολόγηση επηρεάζεται άµεσα από το φαινότυπο, του οποίου η έκφραση είναι µοναδική για κάθε τύπο ατόµου. Ωστόσο, αν και οι δύο κλάσεις βαθµολόγησης ατόµων εξαρτώνται από αντικείµενα τύπου AnalogiesIndividual, αυτός ο τύπος εµπεριέχει άλλες δύο κλάσεις, οι οποίες διαχωρίζουν τη χρήση του από τις διαθέσιµες υλοποιήσεις των συναρτήσεων καταλληλότητας ιαδικασίες Επιλογής Η καταλληλότητα είναι το µέγεθος που αποδίδεται από τους αλγορίθµους αξιολόγησης χρωµοσωµάτων, και αξιοποιείται από τις πολιτικές επιλογής. Στη γενικότερη περίπτωση αρκεί ο ορισµός της σχετικής καταλληλότητας όπως ορίζεται το interface Fitness. Αλλά τόσο οι συναρτήσεις καταλληλότητας που έχουν παρουσιαστεί, όσο και οι πολιτικές επιλογής που θα προταθούν, κάνουν χρήση απόλυτων τιµών, δυνατότητα που προσφέρει η κλάση AbsoluteFitness. Σχήµα 4-10

Τυπικά θέματα εξετάσεων. ΠΡΟΣΟΧΗ: Οι ερωτήσεις που παρατίθενται ΔΕΝ καλύπτουν την πλήρη ύλη του μαθήματος και παρέχονται απλά ενδεικτικά

Τυπικά θέματα εξετάσεων. ΠΡΟΣΟΧΗ: Οι ερωτήσεις που παρατίθενται ΔΕΝ καλύπτουν την πλήρη ύλη του μαθήματος και παρέχονται απλά ενδεικτικά ΤΕΙ Κεντρικής Μακεδονίας Τμήμα Μηχανικών Πληροφορικής ΤΕ Μεταπτυχιακό Πρόγραμμα Τηλεπικοινωνιών & Πληροφορικής Μάθημα : 204a Υπολογιστική Ευφυία Μηχανική Μάθηση Καθηγητής : Σπύρος Καζαρλής Ενότηα : Εξελικτική

Διαβάστε περισσότερα

ΕΡΩΤΗΜΑΤΑ σε ΓΕΝΕΤΙΚΟΥΣ

ΕΡΩΤΗΜΑΤΑ σε ΓΕΝΕΤΙΚΟΥΣ ηµήτρης Ψούνης ΠΛΗ31, Απαντήσεις Quiz Γενετικών Αλγορίθµων 1 ΕΡΩΤΗΜΑΤΑ σε ΓΕΝΕΤΙΚΟΥΣ ΚΩ ΙΚΟΠΟΙΗΣΗ ΕΡΩΤΗΜΑ 1.1 Ο φαινότυπος ενός ατόµου α.αναπαριστά ένα άτοµο στο χώρο λύσεων του προβλήµατος β.κωδικοποιεί

Διαβάστε περισσότερα

Κεφάλαιο 7. Γενετικοί Αλγόριθµοι. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 7. Γενετικοί Αλγόριθµοι. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 7 Γενετικοί Αλγόριθµοι Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Εισαγωγή Σε αρκετές περιπτώσεις το µέγεθος ενός προβλήµατος καθιστά απαγορευτική

Διαβάστε περισσότερα

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής Κύρια σημεία Ερευνητική Μεθοδολογία και Μαθηματική Στατιστική Απόστολος Μπουρνέτας Τμήμα Μαθηματικών ΕΚΠΑ Αναζήτηση ερευνητικού θέματος Εισαγωγή στην έρευνα Ολοκλήρωση ερευνητικής εργασίας Ο ρόλος των

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Παρασκευή 9 Ιανουαρίου 2007 5:00-8:00 εδοµένου ότι η

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Προβλήματα Βελτιστοποίησης Περιγραφή προβλήματος με αρχική κατάσταση, τελική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

Γενετικοί Αλγόριθμοι. Εισαγωγή

Γενετικοί Αλγόριθμοι. Εισαγωγή Τεχνητή Νοημοσύνη 08 Γενετικοί Αλγόριθμοι (Genetic Algorithms) Εισαγωγή Σε αρκετές περιπτώσεις το μέγεθος ενός προβλήματος καθιστά απαγορευτική τη χρήση κλασικών μεθόδων αναζήτησης για την επίλυσή του.

Διαβάστε περισσότερα

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης. Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης. Ένα από τα γνωστότερα παραδείγματα των ΕΑ είναι ο Γενετικός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Σεπτεµβρίου 2005 5:00-8:00 Σχεδιάστε έναν αισθητήρα ercetro

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής Θεωρία Παιγνίων και Αποφάσεων Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος Ε. Μαρκάκης Επικ. Καθηγητής Περίληψη Παίγνια μηδενικού αθροίσματος PessimisIc play Αμιγείς max-min και

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα Θεωρία Δυαδικότητας Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Περιεχόμενα Παρουσίασης 1. Βασικά Θεωρήματα 2. Παραδείγματα 3. Οικονομική Ερμηνεία

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

4 η ΕΝΟΤΗΤΑ ΜΕΤΑΕΥΡΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΕΠΙΛΥΣΗΣ ΠΡΟΒΛΗΜΑΤΩΝ ΕΝΟΣ ΚΡΙΤΗΡΙΟΥ

4 η ΕΝΟΤΗΤΑ ΜΕΤΑΕΥΡΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΕΠΙΛΥΣΗΣ ΠΡΟΒΛΗΜΑΤΩΝ ΕΝΟΣ ΚΡΙΤΗΡΙΟΥ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ ΕΙΣΑΓΩΓΗ ΣΤΗN ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ 4 η ΕΝΟΤΗΤΑ ΜΕΤΑΕΥΡΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΕΠΙΛΥΣΗΣ ΠΡΟΒΛΗΜΑΤΩΝ ΕΝΟΣ ΚΡΙΤΗΡΙΟΥ Μ. Καρλαύτης Ν. Λαγαρός Άδεια Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Υπολογιστικό Πρόβληµα

Υπολογιστικό Πρόβληµα Υπολογιστικό Πρόβληµα Μετασχηµατισµός δεδοµένων εισόδου σε δεδοµένα εξόδου. Δοµή δεδοµένων εισόδου (έγκυρο στιγµιότυπο). Δοµή και ιδιότητες δεδοµένων εξόδου (απάντηση ή λύση). Τυπικά: διµελής σχέση στις

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Θεµελίωση Γενετικών Αλγορίθµων

Θεµελίωση Γενετικών Αλγορίθµων Θεµελίωση Γενετικών Αλγορίθµων Σηµερινό Μάθηµα Προβληµατισµοί Σχήµατα Τάξη Οριστικό Μήκος ΘεώρηµατωνΣχηµάτων Υπόθεση δοµικών Στοιχείων Πλάνη 1 Προβληµατισµοί Τι προβλέψεις µπορούν να γίνουν για τη χρονική

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Τεχνικές κατασκευής δένδρων επιθεµάτων πολύ µεγάλου µεγέθους και χρήσης

Διαβάστε περισσότερα

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6) Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών Τοµέας Υδατικών Πόρων Μάθηµα: Τυπικά Υδραυλικά Έργα Μέρος 2: ίκτυα διανοµής Άσκηση E0: Μαθηµατική διατύπωση µοντέλου επίλυσης απλού δικτύου διανοµής

Διαβάστε περισσότερα

Επιµέλεια Θοδωρής Πιερράτος

Επιµέλεια Θοδωρής Πιερράτος Η έννοια πρόβληµα Ανάλυση προβλήµατος Με τον όρο πρόβληµα εννοούµε µια κατάσταση η οποία χρήζει αντιµετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή ούτε προφανής. Μερικά προβλήµατα είναι τα εξής:

Διαβάστε περισσότερα

Γεώργιος Φίλιππας 23/8/2015

Γεώργιος Φίλιππας 23/8/2015 MACROWEB Προβλήματα Γεώργιος Φίλιππας 23/8/2015 Παραδείγματα Προβλημάτων. Πως ορίζεται η έννοια πρόβλημα; Από ποιους παράγοντες εξαρτάται η κατανόηση ενός προβλήματος; Τι εννοούμε λέγοντας χώρο ενός προβλήματος;

Διαβάστε περισσότερα

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ)

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ) Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ) ΜΙΧΑΛΗΣ ΤΖΟΥΜΑΣ ΕΣΠΟΤΑΤΟΥ 3 ΑΓΡΙΝΙΟ. ΠΕΡΙΛΗΨΗ Η έννοια της συνάρτησης είναι στενά συνυφασµένη µε τον πίνακα τιµών και τη γραφική παράσταση.

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Ανάπτυξη εφαρµογών σε προγραµµατιστικό περιβάλλον (στοιχεία θεωρίας)

Ανάπτυξη εφαρµογών σε προγραµµατιστικό περιβάλλον (στοιχεία θεωρίας) Ανάπτυξη εφαρµογών σε προγραµµατιστικό περιβάλλον (στοιχεία θεωρίας) Εισαγωγή 1. Τι είναι αυτό που κρατάς στα χέρια σου. Αυτό το κείµενο είναι µια προσπάθεια να αποτυπωθεί όλη η θεωρία του σχολικού µε

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣΕ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΑΙ ΕΞΕΛΙΚΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΟΜΑ Α ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Στην εικόνα παρακάτω φαίνεται ένα νευρωνικό

Διαβάστε περισσότερα

Κασταλία Σύστηµα στοχαστικής προσοµοίωσης υδρολογικών µεταβλητών

Κασταλία Σύστηµα στοχαστικής προσοµοίωσης υδρολογικών µεταβλητών Εθνικό Μετσόβιο Πολυτεχνείο Τοµέας Υδατικών Πόρων, Υδραυλικών και Θαλάσσιων Έργων Κασταλία Σύστηµα στοχαστικής προσοµοίωσης υδρολογικών µεταβλητών. Κουτσογιάννης Α. Ευστρατιάδης Φεβρουάριος 2002 Εισαγωγή

Διαβάστε περισσότερα

Σύµφωνα µε την Υ.Α /Γ2/ Εξισώσεις 2 ου Βαθµού. 3.2 Η Εξίσωση x = α. Κεφ.4 ο : Ανισώσεις 4.2 Ανισώσεις 2 ου Βαθµού

Σύµφωνα µε την Υ.Α /Γ2/ Εξισώσεις 2 ου Βαθµού. 3.2 Η Εξίσωση x = α. Κεφ.4 ο : Ανισώσεις 4.2 Ανισώσεις 2 ου Βαθµού Σύµφωνα µε την Υ.Α. 139606/Γ2/01-10-2013 Άλγεβρα Α ΤΑΞΗ ΕΣΠΕΡΙΝΟΥ ΓΕΛ Ι. ιδακτέα ύλη Από το βιβλίο «Άλγεβρα και Στοιχεία Πιθανοτήτων Α Γενικού Λυκείου» (έκδοση 2013) Εισαγωγικό κεφάλαιο E.2. Σύνολα Κεφ.1

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Συστήματα Επιχειρηματικής Ευφυίας

Συστήματα Επιχειρηματικής Ευφυίας Συστήματα Επιχειρηματικής Ευφυίας Γενετικοί αλγόριθμοι (GA) : Από τον Δαρβίνο (1859) στον J. Holland (1975). (Ένα ταξίδι στον υπέροχο κόσμο της επιλογής, της διασταύρωσης και της μετάλλαξης). Charles Darwin

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΘΕΜΑ ο (.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Πέµπτη 7 Ιανουαρίου 8 5:-8: Σχεδιάστε έναν αισθητήρα (perceptron)

Διαβάστε περισσότερα

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson Ιαν. 009 Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson Έστω y, y,, yn παρατηρήσεις µιας m -διάστατης τυχαίας µεταβλητής µε συνάρτηση πυκνότητας πιθανότητας p( y; θ) η οποία περιγράφεται από ένα

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ Συνδυασμένη χρήση μοντέλων προσομοίωσης βελτιστοποίησης. Η μέθοδος του μητρώου μοναδιαίας απόκρισης Νικόλαος

Διαβάστε περισσότερα

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική ΕΕΟ 11 Η χρήση στατιστικών εργαλείων στην εκτιμητική 1. Εισαγωγή 2. Προϋποθέσεις χρήσης των Αυτοματοποιημένων Εκτιμητικών Μοντέλων (ΑΕΜ) 3. Περιορισμοί στη χρήση των ΑΕΜ εφόσον έχουν πληρωθεί οι προϋποθέσεις

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 5η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 5η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 5η διάλεξη (2017-18) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ Ελαχιστοποίηση κόστους διατροφής Ηεπιχείρηση ζωοτροφών ΒΙΟΤΡΟΦΕΣ εξασφάλισε µια ειδική παραγγελίααπό έναν πελάτη της για την παρασκευή 1.000 κιλών ζωοτροφής, η οποία θα πρέπει

Διαβάστε περισσότερα

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) +

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) + KΕΦΑΛΑΙΟ 4 Κλασσικές Μέθοδοι Βελτιστοποίησης Με Περιορισµούς Ανισότητες 4. ΠΡΟΒΛΗΜΑΤΑ ΜΕ ΠΕΡΙΟΡΙΣΜΟΥΣ ΑΝΙΣΟΤΗΤΕΣ Ζητούνται οι τιµές των µεταβλητών απόφασης που ελαχιστοποιούν την αντικειµενική συνάρτηση

Διαβάστε περισσότερα

Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ

Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ 1 η Διάλεξη: Αναδρομή στον Μαθηματικό Προγραμματισμό 2019, Πολυτεχνική Σχολή Εργαστήριο Συστημάτων Σχεδιασμού, Παραγωγής και Λειτουργιών Περιεχόμενα 1. Γραμμικός Προγραμματισμός

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων Φίλτρα Kalman Εξαγωγή των εξισώσεων τους µε βάση το κριτήριο ελαχιστοποίησης της Μεθόδου των Ελαχίστων Τετραγώνων. Αναλυτικές Μέθοδοι στη Γεωπληροφορική Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ ιατύπωση του

Διαβάστε περισσότερα

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων.

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων. ειγµατοληψία Καθώς δεν είναι εφικτό να παίρνουµε δεδοµένα από ολόκληρο τον πληθυσµό που µας ενδιαφέρει, διαλέγουµε µια µικρότερη οµάδα που θεωρούµε ότι είναι αντιπροσωπευτική ολόκληρου του πληθυσµού. Τέσσερις

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ Βασικές µορφές Ερωτήσεων - απαντήσεων Ανοιχτές Κλειστές Κλίµακας ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2 Ανοιχτές ερωτήσεις Ανοιχτές

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ Βασικός τελικός στόχος κάθε επιστηµονικής τεχνολογικής εφαρµογής είναι: H γενική βελτίωση της ποιότητας του περιβάλλοντος Η βελτίωση της ποιότητας ζωής Τα µέσα µε τα

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

στατιστική θεωρεία της δειγµατοληψίας

στατιστική θεωρεία της δειγµατοληψίας στατιστική θεωρεία της δειγµατοληψίας ΕΙΓΜΑΤΟΛΗΨΙΑ : Εισαγωγή δειγµατοληψία Τα στοιχεία που απαιτούνται τόσο για την ανάλυση των µεταφορικών συστηµάτων και όσο και για την ανάπτυξη των συγκοινωνιακών µοντέλων

Διαβάστε περισσότερα

5.1 Θεωρητική εισαγωγή

5.1 Θεωρητική εισαγωγή ΨΗΦΙΑΚΑ ΚΥΚΛΩΜΑΤΑ - ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 5 ΚΩ ΙΚΟΠΟΙΗΣΗ BCD Σκοπός: Η κατανόηση της µετατροπής ενός τύπου δυαδικής πληροφορίας σε άλλον (κωδικοποίηση/αποκωδικοποίηση) µε τη µελέτη της κωδικοποίησης BCD

Διαβάστε περισσότερα

Ανάλυση Χρόνου, Πόρων & Κόστους

Ανάλυση Χρόνου, Πόρων & Κόστους ΠΜΣ: «Παραγωγή και ιαχείριση Ενέργειας» ιαχείριση Ενέργειας και ιοίκηση Έργων Ανάλυση Χρόνου, Πόρων & Κόστους Επ. Καθηγητής Χάρης ούκας, Καθηγητής Ιωάννης Ψαρράς Εργαστήριο Συστημάτων Αποφάσεων & ιοίκησης

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ. Χρηματοδότηση Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Εφαρμοσμένη Βελτιστοποίηση

Εφαρμοσμένη Βελτιστοποίηση Εφαρμοσμένη Βελτιστοποίηση Ενότητα 1: Το πρόβλημα της βελτιστοποίησης Καθηγητής Αντώνιος Αλεξανδρίδης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Σημείωμα Αδειοδότησης Το

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Υπολογιστική Νοηµοσύνη

Υπολογιστική Νοηµοσύνη Υπολογιστική Νοηµοσύνη Σηµερινό Μάθηµα Η θεωρία της Εξέλιξης των Ειδών οµή Γενετικού Αλγόριθµου Κύρια χαρακτηριστικά ενός Γενετικού Αλγορίθµου (ΓΑ) Γενετική ιαδικασία 1 Η θεωρία της Εξέλιξης των Ειδών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 26 Ιανουαρίου 2004 ιάρκεια: 2 ώρες (9:00-:00) Στην παρακάτω

Διαβάστε περισσότερα

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,

Διαβάστε περισσότερα

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ ΜΕΡΟΣ ΙΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ 36 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ Πολλές από τις αποφάσεις

Διαβάστε περισσότερα

ΒΕΛΤΙΣΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΤΩΝ ΚΑΤΑΣΚΕΥΩΝ. Δρ. Πολ. Μηχ. Κόκκινος Οδυσσέας

ΒΕΛΤΙΣΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΤΩΝ ΚΑΤΑΣΚΕΥΩΝ. Δρ. Πολ. Μηχ. Κόκκινος Οδυσσέας ΒΕΛΤΙΣΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΤΩΝ ΚΑΤΑΣΚΕΥΩΝ Δρ. Πολ. Μηχ. Κόκκινος Οδυσσέας Σχεδιασμός αντικειμένων, διεργασιών, δραστηριοτήτων (π.χ. τεχνικά έργα, έπιπλα, σκεύη κτλ) ΠΡΟΚΑΤΑΡΚΤΙΚΗ ΜΕΛΕΤΗ (conceptual design) ΠΡΟΜΕΛΕΤΗ

Διαβάστε περισσότερα

Η επίδραση της δειγματοληπτικής αβεβαιότητας των εισροών στη στοχαστική προσομοίωση ταμιευτήρα

Η επίδραση της δειγματοληπτικής αβεβαιότητας των εισροών στη στοχαστική προσομοίωση ταμιευτήρα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ & ΠΕΡΙΒΑΛΛΟΝΤΟΣ Η επίδραση της δειγματοληπτικής αβεβαιότητας των εισροών στη στοχαστική προσομοίωση ταμιευτήρα Ελένη Ζαχαροπούλου

Διαβάστε περισσότερα

ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΧΩΡΟΘΕΤΗΣΗΣ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΑΙ ΔΡΟΜΟΛΟΓΗΣΗΣ ΟΧΗΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΜΙΜΗΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ

ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΧΩΡΟΘΕΤΗΣΗΣ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΑΙ ΔΡΟΜΟΛΟΓΗΣΗΣ ΟΧΗΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΜΙΜΗΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΧΩΡΟΘΕΤΗΣΗΣ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΑΙ ΔΡΟΜΟΛΟΓΗΣΗΣ ΟΧΗΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΜΙΜΗΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ Μανινάκης Ανδρέας 1 Πολυτεχνείο Κρήτης Τμήμα Μηχανικών Παραγωγής και Διοίκησης Επιβλέπων καθηγητής:

Διαβάστε περισσότερα

ΑΞΙΟΠΙΣΤΙΑ ΥΛΙΚΟΥ ΚΑΙ ΛΟΓΙΣΜΙΚΟΥ

ΑΞΙΟΠΙΣΤΙΑ ΥΛΙΚΟΥ ΚΑΙ ΛΟΓΙΣΜΙΚΟΥ ΑΞΙΟΠΙΣΤΙΑ ΥΛΙΚΟΥ ΚΑΙ ΛΟΓΙΣΜΙΚΟΥ Εισαγωγή Ηεµφάνιση ηλεκτρονικών υπολογιστών και λογισµικού σε εφαρµογές µε υψηλές απαιτήσεις αξιοπιστίας, όπως είναι διαστηµικά προγράµµατα, στρατιωτικές τηλεπικοινωνίες,

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016 Τμήμα Μηχανικών Πληροφορικής ΤΕ 2016-2017 Δυϊκότητα Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα τελευταία ενημέρωση: 1/12/2016 1 Το δυϊκό πρόβλημα Για κάθε πρόβλημα Γραμμικού Προγραμματισμού υπάρχει

Διαβάστε περισσότερα

Το µαθηµατικό µοντέλο του Υδρονοµέα

Το µαθηµατικό µοντέλο του Υδρονοµέα Ερευνητικό έργο: Εκσυγχρονισµός της εποπτείας και διαχείρισης του συστήµατος των υδατικών πόρων ύδρευσης της Αθήνας Το µαθηµατικό µοντέλο του Υδρονοµέα Ανδρέας Ευστρατιάδης και Γιώργος Καραβοκυρός Τοµέας

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση Πέρα όµως από την Γνωσιακή/Εννοιολογική ανάλυση της δοµής και του περιεχοµένου των σχολικών εγχειριδίων των Μαθηµατικών του Δηµοτικού ως προς τις έννοιες

Διαβάστε περισσότερα

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΚΕΦΑΛΑΙΟ 1

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΚΕΦΑΛΑΙΟ 1 ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΚΕΦΑΛΑΙΟ 1 1 Βελτιστοποίηση Στην προσπάθεια αντιμετώπισης και επίλυσης των προβλημάτων που προκύπτουν στην πράξη, αναπτύσσουμε μαθηματικά μοντέλα,

Διαβάστε περισσότερα

E[ (x- ) ]= trace[(x-x)(x- ) ]

E[ (x- ) ]= trace[(x-x)(x- ) ] 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο Εισαγωγικές Έννοιες ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014 ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014 Περιεχόμενα 1 Εισαγωγή 2 2 Μεγιστικός τελέστης στην μπάλα 2 2.1 Βασικό θεώρημα........................ 2 2.2 Γενική περίπτωση μπάλας.................. 6 2.2.1 Στο

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 25 Αυγούστου 26 :-4: Κατασκευάστε έναν αισθητήρα (perceptron)

Διαβάστε περισσότερα

2 η ΕΝΟΤΗΤΑ ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

2 η ΕΝΟΤΗΤΑ ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ ΕΙΣΑΓΩΓΗ ΣΤΗN ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ 2 η ΕΝΟΤΗΤΑ ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Μ. Καρλαύτης Ν. Λαγαρός Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες Χρήσης Creative

Διαβάστε περισσότερα

ιοίκηση Παραγωγής και Υπηρεσιών

ιοίκηση Παραγωγής και Υπηρεσιών ιοίκηση Παραγωγής και Υπηρεσιών Προγραµµατισµός Παραγωγής Προβλήµατα µε πολλές µηχανές Γιώργος Ιωάννου, Ph.D. Αναπληρωτής Καθηγητής Σύνοψη διάλεξης Προβλήµατα Παράλληλων Μηχανών Ελαχιστοποίηση χρόνου ροής

Διαβάστε περισσότερα

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ ΚΩΔΙΚΟΣ ΠΑΡΑΔΟΤΕΟΥ: Π18 ΑΡΙΘΜΟΣ ΠΡΩΤΟΚΟΛΛΟΥ ΈΡΓΟΥ: ΤΠΕ/ΟΡΖΙΟ/0308(ΒΕ)/03 ΤΙΤΛΟΣ ΕΡΓΟΥ: ΓΕΝΙΚΕΥΜΕΝΟ ΣΥΣΤΗΜΑ ΑΣΑΦΟΥΣ ΓΝΩΣΤΙΚΟΥ ΧΑΡΤΗ

Διαβάστε περισσότερα

Σύγχρονα συστήµατα προβλέψεων και µοντελοποίησης. Τµήµα Στατιστικής και Αναλογιστικών Χρηµατοοικονοµικών Μαθηµατικών

Σύγχρονα συστήµατα προβλέψεων και µοντελοποίησης. Τµήµα Στατιστικής και Αναλογιστικών Χρηµατοοικονοµικών Μαθηµατικών Σύγχρονα συστήµατα προβλέψεων και µοντελοποίησης Τµήµα Στατιστικής και Αναλογιστικών Χρηµατοοικονοµικών Μαθηµατικών 2 Εργαλεία διαχείρισης Για κάθε µελλοντική εξέλιξη και απόφαση, η πρόβλεψη αποτελεί το

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

1.1. Με τι ασχολείται η Αριθμητική Ανάλυση

1.1. Με τι ασχολείται η Αριθμητική Ανάλυση Κεφάλαιο 1 Εισαγωγικά 1.1. Με τι ασχολείται η Αριθμητική Ανάλυση Πολλοί επιστημονικοί κλάδοι, στην προσπάθειά τους να επιλύσουν πρακτικά προβλήματα κάνουν χρήση μεθόδων Αριθμητικής Ανάλυσης. Οι μέθοδοι

Διαβάστε περισσότερα

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ Αθανάσιος Γαγάτσης Τµήµα Επιστηµών της Αγωγής Πανεπιστήµιο Κύπρου Χρήστος Παντσίδης Παναγιώτης Σπύρου Πανεπιστήµιο

Διαβάστε περισσότερα

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης 1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης Στη συγκεκριμένη ενότητα εξετάζουμε θέματα σχετικά με την αριθμητική πεπερασμένης ακρίβειας που χρησιμοποιούν οι σημερινοί υπολογιστές και τα

Διαβάστε περισσότερα

ΔΕΟ13 - Επαναληπτικές Εξετάσεις 2010 Λύσεις

ΔΕΟ13 - Επαναληπτικές Εξετάσεις 2010 Λύσεις ΔΕΟ - Επαναληπτικές Εξετάσεις Λύσεις ΘΕΜΑ () Το Διάγραμμα Διασποράς εμφανίζεται στο επόμενο σχήμα. Από αυτό προκύπτει καταρχήν μία θετική σχέση μεταξύ των δύο μεταβλητών. Επίσης, από το διάγραμμα φαίνεται

Διαβάστε περισσότερα

Μεθοδολογίες Παραγωγής Λογισµικού

Μεθοδολογίες Παραγωγής Λογισµικού Μεθοδολογίες Παραγωγής Λογισµικού Βασικά Γενικά Μοντέλα Μοντέλο καταρράκτη (waterfall model) Ξεχωριστές φάσεις καθορισµού απαιτήσεων και ανάπτυξης, επικύρωσης, εξέλιξης Εξελικτική ανάπτυξη (evolutionary

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΕΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ (11/05/2011, 9:00)

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΕΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ (11/05/2011, 9:00) ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών Θεματική Ενότητα Διοίκηση Επιχειρήσεων & Οργανισμών ΔΕΟ 3 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος 00-0 ΤΕΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ (/05/0, 9:00) Να απαντηθούν 4 από τα 5

Διαβάστε περισσότερα