http://users.uom.gr/~cg Στοιχεία από τον υναμικό Προγραμματισμό (DP Μεθοδολογία λήψης αποφάσεων σε σύνθετα πολυσταδιακά προβλήματα (αλληλο-εξαρτώμενα υποπροβλήματα Προσδιορίζει το βέλτιστο συνδυασμό διαδοχικών αποφάσεων με βάση την αριστοποίηση ενός κριτηρίου εν υπάρχει τυποποιημένη μαθηματική διαμόρφωση των προβλημάτων, είναι ένα γενικό πλαίσιο μοντελοποίησης Το πολυσταδιακό πρόβλημα διασπάται σε πιο στοιχειώδη αλληλοσυνδεόμενα προβλήματα Εντοπίζονται βέλτιστες λύσεις για τα επιμέρους και ανασυνθέτονται σε μία συνολική βέλτιστη λύση Ιστορικά στοιχεία Richrd Bellm (90-98, θεμελιωτής του υναμικού Προγραμματισμού το 9 Ο όρος χρησιμοποιήθηκε για να χαρακτηριστεί μία διαδικασία επίλυσης που διασπά ένα πρόβλημα, σε μία αλληλουχία διαδοχικών αποφάσεων Αρχή της βελτιστοποίησης: «A optiml policy hs the property tht whtever the iitil stte d iitil decisio re, the remiig decisios must costitute optiml policy with regrd to the stte resultig rom the irst decisio». (R. Bellm, Dymic Progrmmig 9 Αναδρομικές συναρτήσεις (recursive uctios H εξίσωση Bellm: Παραδείγματα εφαρμογής Προβλήματα πολλαπλών χρονικών περιόδων όπως: επενδύσεις, χρηματοοικονομικός προγραμματισμός απόκτηση και αντικατάσταση παγίων, χρηματικές ροές υπό διάφορες συνθήκες, αξιοπιστία εξοπλισμού, διαχείριση αποθεμάτων κ.λπ Προβλήματα δικτύων (π.χ. συντομότερη διαδρομή Προβλήματα κατανομής πόρων σε ανταγωνιστικές δραστηριότητες όπως: χρηματικές μονάδες, ανθρώπινο δυναμικό, πρώτες ύλες κλπ (στα οποία συνήθως δεν ισχύει η αρχή της αναλογικότητας ή υπάρχουν οικονομίες κλίμακας To (γνωστό μας παράδειγμα της συντομότερης διαδρομής Λ={,,,,,, 9,, 8, 0} ή 9 8, ή, 9,,, ος ος 0, 8,, 9ος 0, Αρχή, ος 8,, ος,,, ος 0, 9 ή,, ος 9, 8 0ος,, ος 8,, ή 8, ή 8,, 8ος http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg Οι συντομότερες διαδρομές από προς 0 (κόστος = 8 0 9 http://users.uom.gr/~cg Το παράδειγμα της συντομότερης διαδρομής (revisited (usig DP the stgecoch problem 8 0 9 = s= = = s =,, = s =,, = s=8,9 s : οι καταστάσεις σε κάθε στάδιο = s=0 http://users.uom.gr/~cg Εσφαλμένες Προσεγγίσεις ( Πλήρης απαρίθμηση όλων των περιπτώσεων (totl eumertio και εντοπισμός της βέλτιστης διαδρομής απαράδεκτη Υπάρχουν =8 περιπτώσεις μόνο (μονοπάτια αλλά: Αν υπήρχε ακόμα ένα στάδιο με τρεις καταστάσεις τότε θα είχαμε μονοπάτια Aν υποθέσουμε ότι σε ένα πρόβλημα έχουμε στάδια με k καταστάσεις το καθένα, τότε έχουμε k διαφορετικά μονοπάτια ηλαδή αν, εκτός από την αφετηρία και τον προορισμό, είχαμε =0 ενδιάμεσα στάδια με k= πιθανές καταστάσεις στο καθένα, θα είχαμε συνολικά 0 = 9.. εναλλακτικές διαδρομές για να ελέγξουμε! http://users.uom.gr/~cg Εσφαλμένες Προσεγγίσεις ( Επιλογή του τόξου (ακμής με το μικρότερο κόστος από κάθε κόμβο σε κάθε επόμενο (greedy pproch δεν δίνει κατ' ανάγκη τη βέλτιστη λύση Στο παράδειγμα η προσέγγιση αυτή δίνει το μονοπάτι 9 0 με συνολικό κόστος μονάδες (δεν είναι το βέλτιστο Γιατί? Ποιο είναι το πρόβλημα στην προσέγγιση αυτή? http://users.uom.gr/~cg 8
http://users.uom.gr/~cg 9 Παραδείγματα αναδρομικών συναρτήσεων (ακολουθίες Οι αριθμοί Fibocci (συνέχεια, Leordo o Pis (0 0 Οι αριθμοί Fibocci (συνέχεια - Οι αριθμοί Fibocci (συνέχεια - Το σύνολο των (μη αρνητικών ακεραίων αριθμών o F = F- + με F0 = 0 o F = F0 + =?, F = F + =?, F =?, F,? To παραγοντικό Leordo Fibocci (Liber Abci Book o clcultios: Itroductio o Arbic umerls, the use o zero, d the deciml plce system to the Lti world. The umerl system cme to be clled "Arbic" by the Europes. It ws used i Europe mthemtics rom the th cetury, d etered commo use rom the th cetury to replce Rom umerls. o F = F- + F- με F = 0 και F = o F=F + F =, o F=F+F =, o F = F- με F0 = (δηλαδή, 0! = o F = F0=?, F = F =?, F =?, F,? Fibocci umbers re coected with the golde rtio, or emple the closest rtiol pproimtios to the rtio re /, /, /, 8/,... Applictios iclude computer lgorithms such s the Fibocci serch techique d the Fibocci hep dt structure, o F=, F=, F=8, F8=, F9=, κ.ο.κ. Οι αριθμοί Fibocci o F = F- + F- με F = 0 και F = o F=F + F =?, F = F + F =?, F,? d grphs clled Fibocci cubes used or itercoectig prllel d distributed systems. They lso pper i biologicl settigs, such s brchig i trees, phyllotis (the rrgemet o leves o stem, the ruit spouts o piepple, the lowerig o rtichoke, ucurlig er d the rrgemet o pie coe. Source: Wikipedi http://users.uom.gr/~cg 0 http://users.uom.gr/~cg http://users.uom.gr/~cg Οι αριθμοί Fibocci (συνέχεια - Οι αριθμοί Fibocci (συνέχεια - Fibocci spirl Τελικά πόσοι αριθμοί χρειάζονται για να υπολογιστεί ο F?? 0 8? F F F F F F F F8 F9 F0 Πρακτικά, το πρόβλημα υπολογισμού του F διασπάται σε δύο επιμέρους προβλήματα (F- και F- που με τη σειρά τους διασπώνται σε άλλα δύο, μέχρι να φτάσουμε πίσω στις αρχικές συνθήκες ηλαδή: Σε κάθε βήμα χρειάζομαι μόνο τους δύο προηγούμενους αριθμούς (prtil solutios storig μερική απαρίθμηση φ =,80 (? Πηγή: http://www.mthsisu.com/umbers/ibocci-sequece.html http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Fibocci spirl i ture Πηγή: Google serch Η οπισθοδρομική προσέγγιση του δυναμικού προγραμματισμού Εκκίνηση από το τελευταίο στάδιο (οπισθοδρομική προσέγγιση Επίλυση του στοιχειώδους υπο-προβλήματος στο στάδιο Χρήση των αποτελεσμάτων του σταδίου ως στοιχεία εισόδου (iput για το υπο-πρόβλημα του επόμενου σταδίου (- Ολοκλήρωση όταν φτάσουμε στην αρχή Η συνολική άριστη λύση προκύπτει από τη σύνθεση των άριστων λύσεων των υπο-προβλημάτων Είναι μέθοδος μερικής απαρίθμησης (δεν εξετάζονται αποθηκεύονται όλες οι πιθανές περιπτώσεις αλλά όσες χρειάζεται σε κάθε βήμα Συμβολισμοί (οπισθοδρομική προσέγγιση (με βάση το πρόβλημα της συντομότερης διαδρομής = τα στάδια του προβλήματος, =,,,, = μεταβλητές απόφασης του σταδίου, δηλαδή πιθανοί άμεσοι προορισμοί (επόμενοι κόμβοι του σταδίου s = οι μεταβλητές κατάστασης του σταδίου. Εκφράζουν την κατάσταση (πόλη - κόμβο στην οποία μπορεί ο ταξιδιώτης να βρίσκεται στο στάδιο ds = η άμεση απόσταση (κόστος ακμής μεταξύ τρέχουσας κατάστασης s (κόμβος προέλευσης και της μεταβλητής απόφασης (κόμβος μετάβασης (s, = συνάρτηση (απόδοσης, στην οπισθοδρομική μέθοδο εκφράζει τη συνολική απόσταση από την κατάσταση s του σταδίου, μέχρι το τέλος (κόμβος 0, όταν επιλέγεται η πόλη ως επόμενος προορισμός (που είναι κόμβος του σταδίου +. Είναι αναδρομική συνάρτηση. Μερικά ακόμη στοιχεία συμβολισμών (οπισθοδρομική- Όταν βρισκόμαστε στο στάδιο στην κατάσταση s, τότε επιλέγουμε εκείνη την απόφαση (σε ποιο κόμβο να πάω? που θα βελτιστοποιήσει την τιμή της συνάρτησης απόδοσης (s, Με συμβολίζουμε την (βέλτιστη τιμή της μεταβλητής απόφασης, δηλαδή εκείνη που ελαχιστοποιεί την (s, Την άριστη (ελάχιστη τιμή της (s, την παριστάνουμε με (s. ηλαδή: (s = mi { (s, } (μεταξύ των Ισοδύναμα είναι (s = (s, ηλαδή: (s είναι η ελάχιστη απόσταση από τον κόμβο s του σταδίου, μέχρι το τέλος. Με +( παριστάνεται η βέλτιστη τιμή από το στάδιο + μέχρι το τέλος, εφόσον πάρουμε την απόφαση στο στάδιο http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 0 Μερικά ακόμη στοιχεία συμβολισμών (οπισθοδρομική- Μερικά ακόμη στοιχεία συμβολισμών (οπισθοδρομική- Επίλυση του παραδείγματος (επιτέλους!: Μία άριστη πολιτική έχει τη μορφή:?? Μαθηματική διατύπωση της συνάρτησης (s, ( s, = d + ( s + Μαθηματική διατύπωση της συνάρτησης (s ( s = mi + { d + ( } = mi{ ( s, } s Υπενθυμίζεται, ότι είναι όλοι οι πιθανοί κόμβοι (αποφάσεις που μπορούν να επιλεγούν στο στάδιο s δηλαδή, ευρισκόμενος στην κατάσταση s, που μπορώ να μεταβώ? Ο κόμβος που δίνει την ελάχιστη τιμή, (s, παριστάνεται με και είναι μια απόφαση που λαμβάνεται στο «τέλος» του σταδίου Ξεκινάμε από το τελευταίο στάδιο απόφασης (= και κινούμενοι οπισθοδρομικά στοχεύουμε: Στον υπολογισμό της τιμής?? ( μεταβλητή κατάστασης άμεσο κόστος ελάχιστο κόστος από το στάδιο + μέχρι το τέλος τιμή για την απόφαση για την απόφαση http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Επίλυση του παραδείγματος οπισθοδρομικά: = (Οριακή συνθήκη=προορισμός Η μόνη πιθανή κατάσταση είναι s=0 γιατί «είμαστε» στον προορισμό που είναι ένας και μοναδικός Η μεταβλητή απόφασης δεν μπορεί να πάρει καμία τιμή ( = ull αφού είσαι στον κόμβο 0 και δεν έχει νόημα το «που θα πας» Η βέλτιστη διαδρομή από τον κόμβο 0 προς τον κόμβο 0 είναι (τετριμμένο υποπρόβλημα ( 0 = d0, 0 = 0 Το ελάχιστο κόστος από τον κόμβο 0 μέχρι τον προορισμό (που είναι ο κόμβος 0 είναι μηδέν (προφανώς και η απόφαση είναι «μην πας πουθενά» (αν απλά ήθελες να πας στον κόμβο 0 Οπισθοδρομικά: Επίλυση του παραδείγματος (συνέχεια = (δηλαδή, δύο στάδια από τον προορισμό Οι πιθανές καταστάσεις είναι s = 8, 9 Η μεταβλητή απόφασης μπορεί να πάρει μόνο μία τιμή, = 0 Ποια είναι η βέλτιστη διαδρομή από τον κόμβο 8 προς τον κόμβο 0 (προορισμό? (αν τυχόν βρεθείς στον κόμβο 8; (8 = d8,0 + (0 = + 0 = με = 0 Ποια είναι η βέλτιστη διαδρομή από τον κόμβο 9 προς τον κόμβο 0 (προορισμό? (αν τυχόν βρεθείς στον κόμβο 9; (9 = d9,0 + (0 = + 0 = με = 0 Οπισθοδρομικά: = (δηλαδή, τρία στάδια από τον προορισμό Οι πιθανές καταστάσεις είναι s =,, Για s = : Ποια είναι η βέλτιστη διαδρομή από τον κόμβο μέχρι τον κόμβο 0 (προορισμό? (αν τυχόν βρεθείς στον κόμβο ; Πιθανές αποφάσεις για s = είναι = 8, 9. Υπολογίζουμε τις τιμές της συνάρτησης απόδοσης και επιλέγουμε την άριστη από αυτές δηλαδή, βρίσκουμε το. ηλαδή: Από τον κόμβο στον 8 και μετά στον 0 με τον καλύτερο τρόπο ή Από τον κόμβο στον 9 και μετά στον 0 με τον καλύτερο τρόπο Από τα δύο μονοπάτια επέλεξε το άριστο! Οπισθοδρομικά: = (συνέχεια Για τον κόμβο : ( s = = mi{ d8 + (8, d9 + (9}= =mi{+, +} =, άρα όταν s= τότε = 8 Ομοίως για τον κόμβο (αν τυχόν βρεθείς στον κόμβο : ( s = = mi{ d8 + (8, d9 + (9}= =mi{+, +} =, άρα όταν s= τότε = 9 Ομοίως για τον κόμβο (αν τυχόν βρεθείς στον κόμβο ;: ( s = = mi{ d 8 + (8, d9 + (9}= =mi{+, +} =, άρα όταν s= τότε = 8 http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg 8 Οπισθοδρομικά: = (δηλαδή τέσσερα στάδια από τον προορισμό Οι πιθανές καταστάσεις είναι s =,, Για s = : ποια είναι η βέλτιστη διαδρομή από τον κόμβο μέχρι τον προορισμό (κόμβο 0? (αν τυχόν βρεθείς στον κόμβο ; Πιθανές αποφάσεις για s = είναι =, και οπότε υπολογίζουμε τις τιμές της συνάρτησης απόδοσης και επιλέγουμε την άριστη εντοπίζοντας την. ηλαδή: Από τον κόμβο στον και μετά στον 0 με τον καλύτερο τρόπο Από τον κόμβο στον και μετά στον 0 με τον καλύτερο τρόπο Από τον κόμβο στον και μετά στον 0 με τον καλύτερο τρόπο Από τις τρεις επιλογές επέλεξε την άριστη! Οπισθοδρομικά: = (συνέχεια Για τον κόμβο : ( = mi{ d + (, d + (, d + (}= =mi{+, +, +} =, άρα για s= τότε = ή Ομοίως για τον κόμβο (αν τυχόν βρεθείς στον κόμβο : ( = mi{ d + (, d + (, d + (}= =mi{+, +, +} =, άρα για s= τότε = Ομοίως για τον κόμβο (αν τυχόν βρεθείς στον κόμβο : d ( = mi d + (, d + ( + (, = =mi{+, +, +} = 8, άρα για s= τότε = ή Οπισθοδρομικά: = (δηλαδή, πέντε στάδια από τον προορισμό Η μόνη πιθανή κατάσταση είναι s = Για s = : ποια είναι η βέλτιστη διαδρομή από τον κόμβο μέχρι τον προορισμό (κόμβο 0? το αρχικό ερώτημα (επιτέλους! Πιθανές αποφάσεις για s = είναι =, και οπότε υπολογίζουμε τις τιμές της συνάρτησης απόδοσης και επιλέγουμε την άριστη δηλαδή βρίσκουμε την. ηλαδή: Από τον κόμβο στον και μετά στον 0 με τον καλύτερο τρόπο Από τον κόμβο στον και μετά στον 0 με τον καλύτερο τρόπο Από τον κόμβο στον και μετά στον 0 με τον καλύτερο τρόπο Από τις τρεις επιλογές επέλεξε την άριστη! Οπισθοδρομικά: = (συνέχεια Για τον κόμβο : ( = mi{ d + (, d + (, d + (}= =mi{+, +, +8} = άρα: για s = τότε = ή. Επομένως, το κόστος της άριστης διαδρομής είναι μονάδες http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Οπισθοδρομικά: Πώς εντοπίζουμε την άριστη διαδρομή? ( Ξεκινώντας από τον κόμβο με βάση την πρώτη βέλτιστη απόφαση, δηλαδή την τιμή της μεταβλητής = ή, μετακινούμαστε στη συνάρτηση που υποδεικνύεται, δηλαδή την ( ή την ( (δηλαδή, υπάρχουν εναλλακτικές άριστες λύσεις διαδρομές Ελέγχουμε την τιμή της ( και την τιμή της (. Οι τιμές αυτές υποδεικνύουν το επόμενο βήμα στον εντοπισμό του άριστου μονοπατιού, με βάση την απόφαση στο στάδιο Συνεχίζουμε με το στάδιο = και η διαδικασία ολοκληρώνεται όταν φτάσουμε στον προορισμό ιχνηλατώντας το δίκτυο προδρομικά ώστε να βρούμε το μονοπάτι. Οπισθοδρομικά: Πώς εντοπίζουμε την άριστη διαδρομή? ( Το ελάχιστο κόστος, υποδεικνύει τα ( και (. Επομένως, από τον κόμβο πηγαίνουμε στον ή στον στο στάδιο =. Αν εξετάσουμε την (, αυτή μας στέλνει στον κόμβο Στη συνέχεια η ( με τη σειρά της, μας στέλνει στην (8, δηλαδή στον κόμβο 8. Ο κόμβος αυτός καταλήγει στον κόμβο 0. Οι υπόλοιπες εναλλακτικές διαδρομές προκύπτουν με όμοιο τρόπο. Όλα τα άριστα μονοπάτια που προκύπτουν με κόστος ίσο με : 8 0 8 0 9 0 και είναι αυτά που βρέθηκαν με τον αλγόριθμο του Dijkstr Οπισθοδρομικά: Αναπαριστώντας τη διαδικασία επίλυσης με πίνακα ( = s ( s, = ull = d s, ull ull s = mi ( s, ( 0 0 0 ull (0 0 Πρακτικά: Η οριακή κατάσταση για =, = Στο «στάδιο» αυτό ουσιαστικά βρίσκουμε τις οριακές συνθήκες για την εκκίνηση της οπισθοδρομικής διαδικασίας επίλυσης Οπισθοδρομικά: Παράσταση της διαδικασίας επίλυσης με πίνακα ( = ( s, = ds ( + ( s = mi ( s, s 0 8 +0 0 9 +0 0 πιθανές τιμές μεταβλητής κατάστασης s πιθανές τιμές μεταβλητής απόφασης τιμές της συνάρτησης για την απόφαση άριστη τιμή, από το στάδιο μέχρι το τέλος, με βάση την τιμή τρέχουσας κατάστασης s και τις πιθανές αποφάσεις άριστη απόφαση δηλαδή, η βέλτιστη τιμή της για την κάθε πιθανή τιμή της κατάστασης s http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg Οπισθοδρομικά: Παράσταση της διαδικασίας επίλυσης με πίνακα ( = ( s, = ds ( + ( s = mi ( s, s 8 9 += +=8 8 +=9 += 9 += += 8 πιθανές τιμές άριστη τιμή, από το μεταβλητής στάδιο μέχρι το τέλος, με άριστη απόφαση κατάστασης s βάση την τιμή τρέχουσας δηλαδή, η βέλτιστη κατάστασης s και τις τιμή της για την πιθανές αποφάσεις κάθε πιθανή τιμή της τιμές της κατάστασης s πιθανές τιμές μεταβλητής συνάρτησης για την απόφασης απόφαση http://users.uom.gr/~cg Οπισθοδρομικά: Παράσταση της διαδικασίας επίλυσης με πίνακα ( = ( s, = ds ( + ( s = mi ( s, s += += += ή += += 9 +=0 += 8 += 8 += 8 ή http://users.uom.gr/~cg 8 Οπισθοδρομικά: Παράσταση της διαδικασίας επίλυσης με πίνακα ( ==τέλος=αφετηρία ( s, = ds ( + ( s = mi ( s, s += += +8= ή Το βέλτιστο κόστος είναι και επιτυγχάνεται με τα εξής μονοπάτια: Αποφάσεις 8 0 9 http://users.uom.gr/~cg 9 Η προδρομική προσέγγιση του δυναμικού προγραμματισμού Εκκίνηση από το πρώτο στάδιο (προδρομική προσέγγιση επίλυσης Επίλυση του στοιχειώδους υπο-προβλήματος στο στάδιο Χρήση των αποτελεσμάτων του σταδίου ως στοιχεία εισόδου (iput για το υπο-πρόβλημα του επόμενου σταδίου (+ Ολοκλήρωση όταν φτάσουμε στο τέλος Η συνολική άριστη λύση προκύπτει από τη σύνθεση των άριστων λύσεων των υπο-προβλημάτων Είναι μέθοδος μερικής απαρίθμησης http://users.uom.gr/~cg 0
Συμβολισμοί (προδρομική προσέγγιση Μερικά ακόμη στοιχεία συμβολισμών (προδρομική - (με βάση το πρόβλημα της συντομότερης διαδρομής http://users.uom.gr/~cg Μερικά ακόμη στοιχεία συμβολισμών (προδρομική - Όταν στο στάδιο μεταβαίνουμε στην κατάσταση s, τότε επιλέγουμε εκείνη την απόφαση (από ποιο κόμβο να έρθω? που θα = τα στάδια του προβλήματος, =,,,, = μεταβλητές απόφασης του σταδίου, δηλαδή πιθανοί προηγούμενοι κόμβοι από τους οποίους μπορεί ο ταξιδιώτης να μεταβεί στον κόμβο s του σταδίου s = μεταβλητές κατάστασης του σταδίου. Εκφράζουν την κατάσταση (πόλη - κόμβο στην οποία μεταβαίνει ο ταξιδιώτης στο στάδιο (ερχόμενος από κάποιο κόμβο ds = η άμεση απόσταση (κόστος ακμής μεταξύ της μεταβλητής απόφασης (κόμβος προέλευσης και της κατάστασης s (κόμβος μετάβασης (s, = συνάρτηση (απόδοσης, στην προδρομική μέθοδο εκφράζει τη συνολική απόσταση από την αφετηρία (κόμβος μέχρι την κατάσταση s του σταδίου, όταν επιλέγεται η πόλη (που είναι κόμβος του σταδίου ως ο κόμβος από τον οποίο μεταβαίνω στον κόμβο s. Είναι αναδρομική συνάρτηση. βελτιστοποιήσει την τιμή της συνάρτησης απόδοσης (s, Με συμβολίζουμε την (βέλτιστη τιμή της μεταβλητής απόφασης, δηλαδή εκείνη που ελαχιστοποιεί την (s, Μία άριστη πολιτική έχει τη μορφή:?? Μαθηματική διατύπωση της συνάρτησης (s, (s, = d s + ( Την άριστη (ελάχιστη τιμή της (s, την παριστάνουμε με (s. ηλαδή: (s = mi { (s, } (μεταξύ των Μαθηματική διατύπωση της συνάρτησης (s Ισοδύναμα είναι (s = (s, ηλαδή: (s είναι η ελάχιστη απόσταση από την αφετηρία μέχρι τον κόμβο s του σταδίου. Με -( παριστάνεται η βέλτιστη τιμή από την αφετηρία μέχρι τον κόμβο του σταδίου - (από τον οποίο ήρθαμε. http://users.uom.gr/~cg Μερικά ακόμη στοιχεία συμβολισμών (προδρομική - http://users.uom.gr/~cg Επίλυση του παραδείγματος (προδρομικά!: Υπενθυμίζεται, ότι είναι όλοι οι πιθανοί κόμβοι (αποφάσεις που { } ( s = mi d s + ( = mi{ ( s, } μεταβλητή κατάστασης άμεσο κόστος http://users.uom.gr/~cg ελάχιστο κόστος από την αφετηρία μέχρι το στάδιο - τιμή για την απόφαση Υπενθύμιση (Οπισθοδρομική μπορούν να επιλεγούν στο στάδιο για μετάβαση στην s Προδρομικά: Ξεκινάμε από το πρώτο στάδιο απόφασης (= και κινούμενοι προδρομικά στοχεύουμε: δηλαδή, από ποια πόλη θα μπορούσα να μεταβώ στην s? Στον υπολογισμό της τιμής?? (0 Ο κόμβος που δίνει την ελάχιστη τιμή, (s, παριστάνεται με και είναι μια απόφαση που λαμβάνεται στην «αρχή» του σταδίου. http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg 8
http://users.uom.gr/~cg 9 Το σχήμα ξανά (stgecoch problem 8 0 9 = s= = = s =,, = s =,, = s=8,9 s : οι καταστάσεις σε κάθε στάδιο = s=0 Επίλυση του παραδείγματος προδρομικά: = (Οριακή συνθήκη=αφετηρία Η μόνη πιθανή κατάσταση είναι s = γιατί είμαστε στην αφετηρία Η μεταβλητή απόφασης δεν μπορεί να πάρει καμία τιμή ( = ull αφού δεν έχει νόημα το «από πού ήρθα» Η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο (τετριμμένο είναι ( = d, = 0 Το ελάχιστο κόστος από την αφετηρία (που είναι ο κόμβος μέχρι τον κόμβο είναι μηδέν (προφανώς και η απόφαση είναι «μην πας πουθενά» (αν ήθελες να πας στον κόμβο Επίλυση του παραδείγματος προδρομικά (συνέχεια = (δηλαδή, δύο στάδια από την αφετηρία Οι πιθανές καταστάσεις (που τυχόν μπορώ να βρεθώ; είναι s =,, Η μεταβλητή απόφασης (από πού ήρθα μπορεί να πάρει μόνο μία τιμή, =, για όλες τις καταστάσεις Ποια είναι η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο? ( = d, + ( = + 0 = με = Ποια είναι η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο? ( = d, + ( = + 0 = με = Ποια είναι η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο? ( = d, + ( = + 0 = με = Προδρομικά: = (δηλαδή, τρία στάδια από την αφετηρία Οι πιθανές καταστάσεις είναι s =,, π.χ. Για s = : Ποια είναι η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο? Πιθανές αποφάσεις για s = είναι =,, (από πού μπορώ να έλθω;. Υπολογίζουμε τις τιμές της συνάρτησης απόδοσης και επιλέγουμε την άριστη από αυτές, δηλαδή βρίσκουμε το για το s =. ηλαδή: Μετάβαση στον κόμβο μέσω του (και στον να έχω πάει με βέλτιστο τρόπο από την αφετηρία Μετάβαση στον κόμβο μέσω του (ομοίως για τον Μετάβαση στον κόμβο μέσω του (ομοίως για τον Από τα τρία μονοπάτια επέλεξε το άριστο! http://users.uom.gr/~cg 0 http://users.uom.gr/~cg http://users.uom.gr/~cg Προδρομικά: = (συνέχεια Για τον κόμβο : ( s = = mi{ d + (, d + (, d + (}= =mi{+, +, +} =, άρα όταν s= τότε = ή Ομοίως για τον κόμβο : ( s = = mi{ d + (, d + (, d + (}= =mi{+, +, +} =, άρα όταν s= τότε = Ομοίως για τον κόμβο : ( s = = mi{ d + (, d + (, d + (}= =mi{+, +, +} = 8, άρα όταν s= τότε = ή ή Προδρομικά: = (τέσσερα στάδια από την αφετηρία Οι πιθανές καταστάσεις είναι s = 8, 9 π.χ. Για s = 8: Ποια είναι η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο 8? Πιθανές αποφάσεις για s = 8 είναι =,,. Υπολογίζουμε τις τιμές της συνάρτησης απόδοσης και επιλέγουμε την άριστη από αυτές, δηλαδή βρίσκουμε το για το s = 8. ηλαδή: Μετάβαση στον κόμβο 8 μέσω του (και στον να έχω πάει με βέλτιστο τρόπο από την αφετηρία Μετάβαση στον κόμβο 8 μέσω του (ομοίως για τον Μετάβαση στον κόμβο 8 μέσω του (ομοίως για τον Από τα τρία μονοπάτια επέλεξε το άριστο! Προδρομικά: = (συνέχεια Για τον κόμβο 8: (8 = mi{ d + (, d + (, d + (}= 8 8 8 =mi{+, +, +8} = 8, άρα για s=8 τότε = Για τον κόμβο 9: (9 = mi{ d + (, d + (, d + (}= 9 9 9 =mi{+, +, +8} =, άρα για s=9 τότε = Προδρομικά: = (πέντε στάδια από την αφετηρία = τέλος Οι πιθανές καταστάσεις είναι μόνο μία: s = 0 Για s = 0: Ποια είναι η βέλτιστη διαδρομή από την αφετηρία μέχρι τον κόμβο 0? (επιτέλους, έχουμε το αρχικό μας ερώτημα Πιθανές αποφάσεις για s = 0 είναι = 8, 9. Υπολογίζουμε τις τιμές της συνάρτησης απόδοσης και επιλέγουμε την άριστη από αυτές, δηλαδή βρίσκουμε το για το s = 0. ηλαδή: Μετάβαση στον κόμβο 0 μέσω του 8 (και στον 8 να έχω πάει με βέλτιστο τρόπο από την αφετηρία Μετάβαση στον κόμβο 0 μέσω του 9 (ομοίως για τον 9 Από τα δύο μονοπάτια επέλεξε το άριστο! http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Προδρομικά: = (συνέχεια Για τον κόμβο 0: (0 = mi{ d + (8, d + (9}= 8,0 9,0 =mi{+8, +} = (άριστο κόστος άρα: για s =0 τότε = 8 ή 9. Επομένως, το κόστος της άριστης διαδρομής είναι μονάδες Προδρομικά: Πώς εντοπίζουμε την άριστη διαδρομή? ( Ξεκινώντας από τον κόμβο 0 με βάση την τελευταία βέλτιστη απόφαση, δηλαδή την τιμή της μεταβλητής = 8 ή 9 μετακινούμαστε στη συνάρτηση που υποδεικνύεται, δηλαδή την (8 ή την (9 Ελέγχουμε την τιμή της (8 και την τιμή της (9. Οι τιμές αυτές υποδεικνύουν το επόμενο βήμα στον εντοπισμό του μονοπατιού με βάση την άριστη απόφαση στο στάδιο (δηλαδή ανάλογα από το που ήρθαμε Συνεχίζουμε με το στάδιο = και η διαδικασία ολοκληρώνεται όταν φτάσουμε στην αφετηρία, ιχνηλατώντας το δίκτυο οπισθοδρομικά ώστε να βρούμε το μονοπάτι. Προδρομικά: Πώς εντοπίζουμε την άριστη διαδρομή? ( Το ελάχιστο κόστος, υποδεικνύει τα (8 και (9. Επομένως, στον κόμβο 0 ήρθαμε από τον 8 ή από τον 9 στο στάδιο =. Αν εξετάσουμε περαιτέρω την (8, μας στέλνει στον κόμβο ενώ η συνάρτηση (9 μας στέλνει στον κόμβο. Στη συνέχεια η ( με τη σειρά της, μας στέλνει στην ( ή στην (, δηλαδή ήρθαμε στον από τον ή τον. Ενώ, η ( μας στέλνει στην (, δηλαδή ήρθαμε από τον κόμβο. Οι συναρτήσεις ( ή ( μας στέλνουν στην (, όπως είναι λογικό. Έτσι, προκύπτουν όλες οι εναλλακτικές διαδρομές από την αφετηρία προς τον προορισμό. Όλα τα άριστα μονοπάτια που προκύπτουν με κόστος ίσο με : 8 0 8 0 9 0 και είναι αυτά που βρέθηκαν με τον αλγόριθμο του Dijkstr Προδρομικά: Αναπαριστώντας τη διαδικασία επίλυσης με πίνακα ( Οριακή κατάσταση (= ( s, = ull = d ull, s s ull s = mi ( s, ( 0 0 ull Πρακτικά: Η οριακή κατάσταση για =, ( = 0 Στο «στάδιο» αυτό ουσιαστικά βρίσκουμε τις οριακές συνθήκες για την εκκίνηση της προδρομικής διαδικασίας επίλυσης http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 0 Προδρομικά: ιαδικασία επίλυσης με πίνακα ( Προδρομικά: ιαδικασία επίλυσης με πίνακα ( Προδρομικά: ιαδικασία επίλυσης με πίνακα ( Προδρομικά: ιαδικασία επίλυσης με πίνακα ( = = = = = τέλος=προορισμός ( s, = d ( s + ( s = mi ( s, s +0 +0 +0 πιθανές τιμές μεταβλητής κατάστασης s πιθανές τιμές μεταβλητής απόφασης τιμές της συνάρτησης για την απόφαση άριστη τιμή, από την αφετηρία μέχρι το στάδιο με βάση την τιμή τρέχουσας κατάστασης s και τις πιθανές αποφάσεις άριστη απόφαση δηλαδή, η βέλτιστη τιμή της για την κάθε πιθανή τιμή της κατάστασης s ( s, = d ( s + ( s = mi ( s, s +=9 += += ή += += += +=8 +=8 +=8 8 ήή πιθανές τιμές μεταβλητής κατάστασης s πιθανές τιμές μεταβλητής απόφασης τιμές της συνάρτησης για την απόφαση άριστη τιμή, από την αφετηρία μέχρι το στάδιο, με βάση την τιμή τρέχουσας κατάστασης s και τις πιθανές αποφάσεις άριστη απόφαση δηλαδή, η βέλτιστη τιμή της για την κάθε πιθανή τιμή της κατάστασης s ( s, = d ( s + ( s = mi ( s, s 8 += 8 +=0 +8= 8 9 += += +8= ( s, = d ( s + ( s = mi ( s, s 8 9 0 +8= += 8 ή 9 Το βέλτιστο κόστος είναι και επιτυγχάνεται με τα εξής μονοπάτια: Αποφάσεις 8 0 9 http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Παραλλαγή η : Παραλλαγή η (συνέχεια-: Παραλλαγή η (συνέχεια-: Παραλλαγή η (συνέχεια-: Έστω ότι το συνολικό κόστος μίας διαδρομής προκύπτει από το γινόμενο των ακμών της ( s = mi { d ( } s + Οριακή κατάσταση (=, το λύνουμε οπισθοδρομικά ( s, = ull = d s, ull ( s = mi ( s, s ull = ( s, = ds ( ( s = mi ( s, s 0 8 0 9 0 = ( s, = ds ( ( s = mi ( s, s 8 9 = = 8 =8 = 9 = 9 = 9 8 = ( s, = ds ( s ( s = mi ( s, = =8 9= = 9 = 9= 9 = = 9= ή 0 ull Πρακτικά: Η οριακή κατάσταση για =, (0 = http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg 8 Παραλλαγή η (συνέχεια-: = ( s, = ds ( ( s = mi ( s, s = 9= = ή Το βέλτιστο κόστος είναι και επιτυγχάνεται με τα εξής μονοπάτια: Αποφάσεις 8 0 9 Παραλλαγή η : Οι βέλτιστες διαδρομές στο δίκτυο 8 0 9 Παραλλαγή η : Το συνολικό κέρδος μιας διαδρομής είναι το γινόμενο των ακμών της (Υποθέτουμε επιπλέον ότι το δίκτυο είναι προσανατολισμένο, με γενική κατεύθυνση όλων των ακμών προς τα «δεξιά» ( s = m { d ( } s + Οριακή κατάσταση (=, οπισθοδρομική επίλυση ( s, = ull = d s, ull ( s = m ( s, s ull 0 ull Πρακτικά: Η οριακή κατάσταση για =, (0 = Παραλλαγή η (συνέχεια-: = ( s, = ds ( ( s = m ( s, s 0 8 0 9 0 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Παραλλαγή η (συνέχεια-: Παραλλαγή η (συνέχεια-: Παραλλαγή η (συνέχεια-: Παραλλαγή η : Η βέλτιστη διαδρομή στο δίκτυο = ( s, = ds ( ( s = m ( s, s 8 9 = = 9 =8 = 8 8 = 9 = 9 = ( s, = ds ( s ( s = m ( s, = 8= = = 8 8= =8 8 ή = 8=8 =0 = ( s, = ds ( ( s = m ( s, s = 8=9 =9 Το βέλτιστο κέρδος είναι και επιτυγχάνεται με το εξής μονοπάτι: Αποφάσεις 9 0 8 0 9 http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg Ανακεφαλαίωση: Κύρια Χαρακτηριστικά Π..Π. ( Κύρια Χαρακτηριστικά Π..Π. ( Κύρια Χαρακτηριστικά Π..Π. ( Κύρια Χαρακτηριστικά Π..Π. (. Το πρόβλημα διαιρείται σε στάδια, σε καθένα από τα οποία ακολουθείται μια πολιτική (στρατηγική, δηλαδή λαμβάνουμε μία απόφαση.. Συνολικά λαμβάνουμε μία ακολουθία αλληλοσυνδεόμενων αποφάσεων.. Σε κάθε στάδιο του προβλήματος αντιστοιχεί ένα πλήθος καταστάσεων, που αντιπροσωπεύουν τις διάφορες συνθήκες, στις οποίες είναι δυνατό να βρεθεί το σύστημα.. Οι καταστάσεις παρέχουν την πληροφόρηση εκείνη, με την οποία περιγράφεται το σύστημα σε κάθε στάδιο. Ο αριθμός των καταστάσεων μπορεί να είναι πεπερασμένος ή άπειρος σε κάθε στάδιο της πολυσταδιακής διαδικασίας.. Σε κάθε στάδιο, η τρέχουσα κατάσταση s «μετασχηματίζεται» σε μια κατάσταση s+ συνδεδεμένη με το επόμενο στάδιο της διαδικασίας και αντίστοιχα η μεταβλητή κατάστασης s συνδέει το τρέχον στάδιο με το προηγούμενο στάδιο.. Για δεδομένη τιμή της κατάστασης s αναζητούμε την άριστη τιμή της μεταβλητής απόφασης, δηλαδή εκείνη που βελτιστοποιεί τη συνολική απόδοση του συστήματος μέχρι το τέλος όλων των επόμενων σταδίων.. Η τιμή της μεταβλητής απόφασης δημιουργεί στο τρέχον στάδιο του προβλήματος δύο εκροές, που είναι η τιμή της συνάρτησης απόδοσης: (s, και η κατάσταση που θα βρεθεί με βάση την απόφαση αυτή: s+. http://users.uom.gr/~cg http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 80
http://users.uom.gr/~cg 8 Κύρια Χαρακτηριστικά Π..Π. ( Κύρια Χαρακτηριστικά Π..Π. ( Κύρια Χαρακτηριστικά Π..Π. ( οκιμάστε αυτό τώρα: 8. Η επίλυση ενός προβλήματος δυναμικού προγραμματισμού, βασίζεται στην αρχή της αριστότητας του Bellm, σύμφωνα με την οποία: «Μια άριστη πολιτική έχει την ιδιότητα πως οποιαδήποτε και αν είναι η αρχική απόφαση που πήραμε για να φτάσουμε σε μια κατάσταση, οι υπόλοιπες αποφάσεις πρέπει να αποτελούν μιαν άριστη πολιτική για να φύγουμε από την κατάσταση αυτή» «A optiml policy hs the property tht whtever the iitil stte d iitil decisio re, the remiig decisios must costitute optiml policy with regrd to the stte resultig rom the irst decisio». (Bellm, R.E. 9. Dymic Progrmmig. Priceto Uiversity Press, Priceto, NJ. Republished 00: Dover, ISBN 08809. 9. Με δεδομένη την τρέχουσα κατάσταση σε ένα στάδιο της διαδικασίας, μια άριστη πολιτική για τα υπόλοιπα στάδια της διαδικασίας είναι ανεξάρτητη της πολιτικής που υιοθετήθηκε στα προηγούμενα στάδια της διαδικασίας (Μαρκοβιανή ιδιότητα. 0. Η διαδικασία επίλυσης μπορεί να προχωρήσει είτε οπισθοδρομικά (από το τελευταίο στάδιο προς το πρώτο είτε προδρομικά (από το πρώτο στάδιο προς το τελευταίο. Η διαδικασία επίλυσης αρχίζει με την εύρεση της οριακής κατάστασης, δηλαδή της άριστης πολιτικής για κάθε κατάσταση του οριακού σταδίου (του πρώτου ή του τελευταίου, ανάλογα αν ακολουθούμε προδρομική ή οπισθοδρομική προσέγγιση.. Στη διαδικασία της επίλυσης χρησιμοποιείται μια αναδρομική σχέση (recursive reltioship, που προσδιορίζει την άριστη πολιτική για κάθε κατάσταση του σταδίου, με δεδομένη την άριστη πολιτική για κάθε κατάσταση του σταδίου - (ή + στην προδρομική. όπου ( s = M/ Mi ( s, = d ( s, = d ( s + τελεστής οπισθοδρομική s { ( s, } ( προδρομική Για έναν τυχαίο θετικό ακέραιο, έστω, μπορείτε να εκτελέσετε σε κάθε βήμα μία από τις ακόλουθες πράξεις: ( να αφαιρέσετε τo (:=-, (b αν είναι άρτιος να διαιρέσετε διά του (:=/ (c αν είναι πολλαπλάσιο του να διαιρέσετε διά του (:=/. To πρόβλημα είναι το εξής: οθέντος ενός τυχαίου φυσικού αριθμού, πόσο είναι το ελάχιστο πλήθος επαναλήψεων που απαιτούνται, ώστε εκτελώντας σε κάθε επανάληψη μία από τις παραπάνω πράξεις, να φτάσετε στην μονάδα; http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 8 είτε πώς γίνεται: Για =, έχουμε: 0 επαναλήψεις. Για =, έχουμε: /= ή -=, άρα μία επανάληψη. Για =, έχουμε: -= και / = ( επαναλήψεις αλλά μπορούμε καλύτερα: /= (μία επανάληψη. Γενικά: Έστω ( = το πλήθος των επαναλήψεων όταν στον -οστό αριθμό εκτελώ τον υπολογισμό τύπου ( =, b, c. Σημειώστε, ότι για οικονομία, ο αριθμός παριστάνει και το στάδιο Τότε: ( = + (. όπου (. είναι το βέλτιστο πλήθος μέχρι το τέλος, εφόσον πάρω την απόφαση να εφαρμόσω την πράξη τύπου στον αριθμό. Οπότε: ( = + mi[ (.], όπου ( είναι το βέλτιστο πλήθος επαναλήψεων (ελάχιστο ώστε ο αριθμός (του σταδίου να εκφυλιστεί σε μονάδα. είτε εφαρμογή για =0 Εξ, ορισμού : ( = 0 ( + mi[ (, (/ ] = + 0 = = b ( = + mi[ (, (/] = + mi[ (, (] = + mi[,0] = c ( = + mi[ (, (/ ] = + mi[ (, (] = + mi[,] = ( = + mi[ ( ] = + [ (] = + = b ( = + mi[ (, ( /, ( / ] = + mi[ (, (, (] = + mi[,,] = b ( = + mi[ ( ] = + [ (] = + = c (8 = + mi[ (8, (8/ ] = + mi[ (, (] = + mi[,] = b (9 = + mi[ (9, (9/] = + mi[ (8, (] = + mi[,] = c (0 = + mi[ (0, (0/ ] = + mi[ (9, (] = + mi[,] = b Εφαρμογή για =0 (συνέχεια ηλαδή: για να εκφυλιστεί το 0 σε μονάδα χρειάζομαι επαναλήψεις: Αφαιρώ πρώτα την μονάδα και πάω στο (9 (0 = + mi[ (0, (0/ ] = + mi[ (9, (] = + mi[,] = b Στη συνέχεια, διαιρώ δια του και πάω στο ( (9 = + mi[ (9, (9/] = + mi[ (8, (] = + mi[,] = c Τέλος, διαιρώ πάλι με το και πάω στο ( ( = + mi[ (, (/] = + mi[ (, (] = + mi[,0] = Τέλος διαδικασίας. c Παράδειγμα (resource lloctio: Μια επιχείρηση διατηρεί τρία υποκαταστήματα σε διαφορετικές πόλεις. Έχει παραλάβει και θέλει να διανείμει εμπορεύματα από πέντε εμπορευματοκιβώτια. Η διοίκηση ενδιαφέρεται να προσδιορίσει τον άριστο τρόπο με τον οποίο θα κατανείμει τα πέντε εμπορευματοκιβώτια στα τρία υποκαταστήματα, ώστε να μεγιστοποιήσει το συνολικό προσδοκώμενο κέρδος της. Το περιεχόμενο ενός κιβωτίου δεν μπορεί να διαμοιραστεί μεταξύ των υποκαταστημάτων. Στον παρακάτω πίνακα δίνεται το προσδοκώμενο κέρδος (χ.μ. κάθε υποκαταστήματος με βάση το πλήθος κιβωτίων που εκχωρούνται σ αυτό. http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 88
http://users.uom.gr/~cg 89 εδομένα σχετικά με την απόδοση των καταστημάτων Προσδοκώμενο κέρδος (χ.μ Υποκατάστημα Κιβώτια ο ο ο 0 0 0 0 0 8 0 8 Ποιο είναι το πρόβλημα?? εδομένα σχετικά με την απόδοση των καταστημάτων Προσοχή: Ο πίνακας δεδομένων μπορεί να δίνεται και ανάστροφα αλλά αυτό δεν επηρεάζει τη διαδικασία επίλυσης Προσδοκώμενο κέρδος (χ.μ. Κιβώτια Υποκατάστημα 0 o 0 8 o 0 0 0 o 0 8 Συμβολισμοί και στοιχεία του παραδείγματος Οπισθοδρομική επίλυση Στάδια: τα καταστήματα (=,, Μεταβλητή κατάστασης: s, το πλήθος των κιβωτίων που είναι διαθέσιμα στο στάδιο, μέχρι το τέλος (οπισθοδρομική. Μεταβλητή απόφασης: ο αριθμός των κιβωτίων που παραδίδονται στο κατάστημα, =,,. Προσδοκώμενο κέρδος: p(, από την εκχώρηση κιβωτίων στο υποκατάστημα. Στόχος: να εντοπίσουμε το άριστο πλήθος κιβωτίων για κάθε κατάστημα ( ώστε να μεγιστοποιείται το συνολικό κέρδος. Επίλυση παραδείγματος, οπισθοδρομικά ( Αναλυτικά, ο στόχος είναι: Να προσδιοριστούν οι άριστες τιμές των,, ώστε: M P = = p ( με περιορισμούς: και 0, ακέραιοι = Η (οπισθοδρομική αναδρομική σχέση του προβλήματος είναι: = 0,,..., s { p ( + ( s } ( s = m + ηλαδή: το μέγιστο κέρδος που προκύπτει, όταν από το -οστό κατάστημα μέχρι το τελευταίο, διαθέτω προς κατανομή s κιβώτια. http://users.uom.gr/~cg 90 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 9 Επίλυση παραδείγματος, οπισθοδρομικά ( = - Οριακή συνθήκη s (κατάσταση ( s (βέλτιστη τιμή (βέλτιστη απόφαση 0 0 0 8 ή Επίλυση παραδείγματος,οπισθοδρομικά ( = Επίλυση παραδείγματος, οπισθοδρομικά (, = Μέγιστο προσδοκώμενο κέρδος Προσοχή: s = (μόνο?? Άριστη απόφαση για = Εύρεση της άριστης λύσης (οπισθοδρομικά Μέγιστο αναμενόμενο κέρδος = ( = Εναλλακτική άριστη λύση η : = για s = 0 = για s = - 0 = = = για s = - = Εναλλακτική άριστη λύση η : = για s = = = για s = - = = για s = - = http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 9
http://users.uom.gr/~cg 9 Συμβολισμοί και στοιχεία του παραδείγματος Προδρομική επίλυση Στάδια: τα καταστήματα (=,, Μεταβλητή κατάστασης: s, Το πλήθος των κιβωτίων που έχουν τοποθετηθεί από την αρχή μέχρι το στάδιο (προδρομική. Μεταβλητή απόφασης: ο αριθμός των κιβωτίων που παραδίδονται στο κατάστημα, =,,. Προσδοκώμενο κέρδος: p(, από την εκχώρηση κιβωτίων στο υποκατάστημα. Στόχος: να εντοπίσουμε το άριστο πλήθος κιβωτίων για κάθε κατάστημα ( ώστε να μεγιστοποιείται το συνολικό κέρδος. Επίλυση παραδείγματος, προδρομικά ( Αναλυτικά, ο στόχος είναι: Να προσδιοριστούν οι άριστες τιμές των,, ώστε: M P = p ( = με περιορισμούς: και 0, ακέραιοι = Η (προδρομική αναδρομική σχέση του προβλήματος είναι: = 0,,..., s { p ( + ( s } ( s = m ηλαδή: το μέγιστο κέρδος που προκύπτει, όταν από το πρώτο κατάστημα μέχρι το -οστό, έχω διαθέσει s κιβώτια Επίλυση παραδείγματος, προδρομικά ( = - Οριακή συνθήκη s (κατάσταση ( s (βέλτιστη τιμή (βέλτιστη απόφαση 0 0 0 8 Επίλυση παραδείγματος, προδρομικά ( = (s, = p( + (s- s (s 0 0 0 - - - - - 0 0 0+= 0+0=0 - - - - 0 0+= 0+= 0+0=0 - - - 0 0+8=8 0+= 0+= +0= - - 0+= 0+8=8 0+= +=8 +0= - 0+= 0+= 0+8=8 += +=8 +0= 8 http://users.uom.gr/~cg 98 http://users.uom.gr/~cg 99 http://users.uom.gr/~cg 00 Επίλυση παραδείγματος,προδρομικά ( = s (s, = p( + (s- 0 (s 0+8=8 8+= +=8 +0= +0= +0= ή Προσοχή: s = (μόνο?? Άριστη τιμή Άριστη απόφαση για = Εύρεση της άριστης λύσης (προδρομικά Μέγιστο αναμενόμενο κέρδος = ( = Άριστη λύση η : = για s = = = για s = - = = = για s = - = 0 0 Άριστη λύση η : = για s = = = για s = - = = = για s = - = = Παράδειγμα (relibility: Tο σύστημα ελέγχου της τροχιάς ενός δορυφόρου ρυθμίζεται από μία συστοιχία τριών κυκλωμάτων συλλογής και επεξεργασίας δεδομένων. Όταν ένα από τα τρία παρουσιάσει βλάβη, τα υπόλοιπα είναι ικανά (ακόμα και αν παραμείνει μόνο ένα σε λειτουργία να διατηρήσουν το δορυφόρο σε τροχιά. Αν όμως και τα τρία πάψουν να λειτουργούν, τότε το σύστημα υφίσταται ολική πτώση με καταστροφικές συνέπειες για το δορυφόρο. Η ενέργεια που είναι απαραίτητη για τη απρόσκοπτη λειτουργία των τριών κυκλωμάτων συλλέγεται από φωτοβολταϊκά στοιχεία (φ.σ τα οποία μπορούν να είναι συνολικά το πολύ πέντε. εδομένα σχετικά με την αξιοπιστία των κυκλωμάτων Πιθανότητα βλάβης Κύκλωμα Πλήθος φ.σ. ο ο ο 0.00.00.00 0.0 0.0 0.0 0. 0.0 0. 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 Ποιο είναι το πρόβλημα?? http://users.uom.gr/~cg 0 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg 0
http://users.uom.gr/~cg 0 Συμβολισμοί και στοιχεία του παραδείγματος Στάδια: τα κυκλώματα (=,, Καταστάσεις: s το πλήθος των φωτοβολταϊκών στοιχείων που είναι διαθέσιμα για εγκατάσταση, από το στάδιο μέχρι το τέλος (οπισθοδρομική επίλυση. Μεταβλητές απόφασης: ο αριθμός φ.σ. που εγκαθίστανται στο κύκλωμα, =,,. Πιθανότητα βλάβης: p(, η πιθανότητα ολικής βλάβης του κυκλώματος όταν εκχωρούνται φ.σ. σ' αυτό. Στόχος: Να ελαχιστοποιήσουμε τη συνολική πιθανότητα βλάβης εντοπίζοντας το άριστο πλήθος φ.σ. ( για κάθε κύκλωμα Ο στόχος είναι: Να προσδιοριστούν οι άριστες τιμές των,, ώστε: Mi P = p ( = με περιορισμούς: και 0, ακέραιοι = Η αναδρομική σχέση του προβλήματος είναι: ( s = mi + = 0,,..., s { p ( ( s } ηλαδή: η ελάχιστη πιθανότητα ολικής βλάβης που προκύπτει, όταν από το -οστό μέχρι το τελευταίο κύκλωμα, διαθέτω προς κατανομή s φωτοβολταϊκά στοιχεία. Επίλυση παραδείγματος = Οριακή συνθήκη s ( s (κατάσταση (βέλτιστη τιμή (βέλτιστη απόφαση 0.00 0 0.0 0. 0.0 0.0 0.0 = (s, = p( (s- s (s 0 0.00 - - - - - 0 0.0 0.=0.0 - - - - 0. 0 0. 0.0.=0. 0.=0. - - - 0. 0.0 0.0.=0. 0.0.=0.08 0.=0. - - 0.08 0.0 0.0.=0.0 0.0.=0.0 0.0.=0.0 0.0=0.0-0.0 0.0 0.0.0= 0.0 0.0.= 0.0 0.0.= 0.0 0.00.= 0.0 0.0= 0.0 0.0 0 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg 08 = (s, = p( (s- s 0 0.0 0.0.0 0.0.08 0.00. 0.00. 0.0 =0.0 =0.0 =0.0 =0.008 =0.008 =0.0 (s 0.008 ή Ελάχιστη πιθανότητα συνολικής πτώσης = ( 0. 008 = Άριστη λύση η : = για s = = = για s = - = = για s = - = 0 0 Άριστη λύση η : = για s = = για s = - = = 0 = για s = - 0 = Παράδειγμα (resource lloctio persoel, dditiol costrits Μία αλυσίδα καταστημάτων ήχου και εικόνας προτίθεται να ενισχύσει με επιπλέον ανθρώπινο δυναμικό τα τρία υποκαταστήματά της στην περιοχή της Θεσσαλονίκης. Οι αναμενόμενες πωλήσεις παρουσιάζουν ισχυρή θετική συσχέτιση με το πλήθος των διαθέσιμων πωλητών. Σε κάθε κατάστημα πρέπει να εκχωρηθούν τουλάχιστον δύο νέοι πωλητές και η επιχείρηση έχει προσλάβει συνολικά εννέα νέα άτομα (πωλητές. Στον επόμενο πίνακα παρουσιάζονται οι πωλήσεις (προσδοκώμενος ετήσιος τζίρος σε χρηματικές μονάδες ανάλογα με το πλήθος των νέων πωλητών που εκχωρούνται. εδομένα σχετικά με την απόδοση των πωλητών Ετήσιος Τζίρος Νέοι Πωλητές Κατάστημα ο 0 8 90 00 ο 0 0 0 0 ο 0 0 Ποιο είναι το πρόβλημα?? http://users.uom.gr/~cg 09 http://users.uom.gr/~cg 0 http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Συμβολισμοί και στοιχεία του παραδείγματος Ο στόχος είναι: Επίλυση παραδείγματος = Στάδια: τα υποκαταστήματα (=,, Καταστάσεις: s το πλήθος των πωλητών που είναι διαθέσιμοι για εκχώρηση, από το στάδιο μέχρι το τέλος. Μεταβλητές απόφασης: ο αριθμός των πωλητών που εκχωρούνται στο κατάστημα, =,,. Προβλεπόμενος τζίρος: p(, ο προβλεπόμενος τζίρος από την εκχώρηση πωλητών στο κατάστημα. Στόχος : Να μεγιστοποιήσουμε το συνολικό τζίρο εντοπίζοντας Να προσδιοριστούν οι άριστες τιμές των,, ώστε: M P = p ( = με περιορισμούς: 9 και, ακέραιοι = Η αναδρομική σχέση του προβλήματος είναι: ( s = m { p( + + ( s } s = Οριακή συνθήκη s ( s (κατάσταση (βέλτιστη τιμή (βέλτιστη απόφαση 0 0 το άριστο πλήθος νέων πωλητών ( για κάθε κατάστημα ηλαδή: ο μέγιστος προσδοκώμενος τζίρος που προκύπτει, όταν από το -οστό μέχρι το τελευταίο κατάστημα, διαθέτω προς εκχώρηση s πωλητές. Από έως (γιατί?? Από έως?? http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg = Μέγιστος προσδοκώμενος τζίρος Μέγιστος προσδοκώμενος τζίρος = (9 = 0 Άριστη λύση η : = για s = 9 = για s = 9 - = = = για s = - = Άριστη λύση η : = για s = 9 = = για s = 9 - = = για s = - = Παράδειγμα (persoel lloctio Μία διαφημιστική εταιρεία έχει αναλάβει τη διεξαγωγή μίας έρευνας αγοράς με προσωπικές συνεντεύξεις. Η έρευνα πραγματοποιείται ταυτοχρόνως σε τρεις κομβικές περιοχές της πόλης. Επειδή οι προθεσμίες είναι πιεστικές, αποφασίστηκε η διάθεση ακόμα πέντε ( ομάδων λήψης συνεντεύξεων στις τρεις περιοχές, για να βοηθήσουν στη βελτίωση της κατάστασης. Σε κάθε μία από τις περιοχές αυτές μπορούν να διατεθούν μέχρι τρεις το πολύ επιπλέον ομάδες. Έχει εκτιμηθεί ότι το αναμενόμενο κόστος λήψης των απαιτούμενων συνεντεύξεων σε κάθε περιοχή, μετά την τοποθέτηση των επιπλέον ομάδων, διαμορφώνεται σύμφωνα με τον επόμενο πίνακα (χρηματικές μονάδες. εδομένα σχετικά με τις συνεντεύξεις Αναμενόμενο κόστος λήψης των συνεντεύξεων ανά τοποθεσία Περιοχή Πλήθος επιπλέον η η η ομάδων 0 00 0 00 00 0 80 9 8 Ποιο είναι το πρόβλημα?? http://users.uom.gr/~cg http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 0
http://users.uom.gr/~cg Συμβολισμοί και στοιχεία του παραδείγματος Ο στόχος είναι: Επίλυση παραδείγματος = Στάδια: οι περιοχές λήψης συνεντεύξεων (=,, Καταστάσεις: s το πλήθος των επιπλέον ομάδων που είναι διαθέσιμες για εκχώρηση, στο στάδιο μέχρι το τέλος. Μεταβλητές απόφασης: ο αριθμός των ομάδων που εκχωρούνται στην περιοχή, =,,. Αναμενόμενο κόστος: c(, το αναμενόμενο κόστος από την εκχώρηση ομάδων στην περιοχή. Στόχος: Να ελαχιστοποιήσουμε το συνολικό κόστος, εντοπίζοντας το άριστο πλήθος ομάδων ( για κάθε τοποθεσία Να προσδιοριστούν οι άριστες τιμές των,, ώστε: Mi C = c ( = με περιορισμούς: και 0, ακέραιοι = Η αναδρομική σχέση του προβλήματος είναι: ( s = mi 0 mi{, s } + { c ( + ( s } ηλαδή: το ελάχιστο κόστος που προκύπτει, όταν από τη -οστή μέχρι την τελευταία περιοχή, διαθέτω προς εκχώρηση s ομάδες. = Οριακή συνθήκη s ( s (κατάσταση (βέλτιστη τιμή (βέλτιστη απόφαση 0 00 0 80 = (s, = c( + (s- ( s s 0 0+= 0+80=0 +00= ----- 0 0+= 0+= +80= +00= 0+= 0+= +=0 +80=0 0 ή 0+= 0+= +=0 +=0 0 http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg = = (s, = c( + (s- s ( s 0 00+0=0 00+0=0 9+=0 8+0=0 0 0 Ελάχιστο προσδοκώμενο κόστος Ελάχιστο αναμενόμενο κόστος = ( = 0 Άριστη λύση : = για s = 0 = για s = - 0= = για s = - = Παράδειγμα (ivetory cotrol Μία βιοτεχνία παράγει ένα προϊόν και θέλει να προγραμματίσει την παραγωγή της για το επόμενο τρίμηνο (μήνες = =,,. Η παράδοση των προϊόντων πρέπει να γίνεται έγκαιρα (μέχρι το τέλος του μήνα ζήτησης. Η επιχείρηση, έχει τη δυνατότητα να διατηρεί αποθέματα για την ικανοποίηση της ζήτησης. Τα δεδομένα (που ακολουθούν αφορούν μηνιαία ζήτηση (d του μηνός, το μοναδιαίο κόστος κατασκευής ενός τεμαχίου (c τον μήνα και το κόστος διατήρησης ενός τεμαχίου σε απόθεμα κατά τον μήνα (h. Σημειώνεται, ότι η μηνιαία παραγωγική δυναμικότητα δεν ξεπερνά τα τεμάχια και η χωρητικότητα της αποθήκης δεν ξεπερνά τα τεμάχια. εδομένα σχετικά με τη παραγωγή και ζήτηση Μήνας ος ος ος Ζήτηση (τμχ, d Μοναδιαίο Κόστος (χ.μ., c Κόστος διατήρησης τεμαχίου σε απόθεμα (χ.μ., h Παραγωγική δυναμικότητα (τμχ Χωρητικότητα αποθήκης (τμχ Ποιο είναι το πρόβλημα?? http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg 8
http://users.uom.gr/~cg 9 Συμβολισμοί και στοιχεία του παραδείγματος Ο στόχος είναι: Η αναδρομική συνάρτηση (κόστους Επίλυση παραδείγματος Στάδια: οι μήνες (=,, Καταστάσεις: Ι, το πιθανό απόθεμα στο τέλος του σταδίου Μεταβλητές απόφασης: ο αριθμός των προϊόντων που θα παραχθούν το μήνα, =,,. Αναμενόμενο κόστος: το κόστος προκύπτει από το c, και από το h I. ηλαδή: από την παραγωγή τεμαχίων το μήνα και από την παραμονή I τεμαχίων σε απόθεμα στο τέλος του μηνός. Στόχος: Να ελαχιστοποιηθεί το συνολικό κόστος ικανοποίησης της ζήτησης, εντοπίζοντας το άριστο σχέδιο παραγωγής ( και διατήρησης αποθεμάτων (I Να προσδιοριστούν οι άριστες τιμές των,, ώστε: Mi z = ( c + h I = με περιορισμούς: 0, 0 I, ακέραιοι και Ι- + = d + I?? Η βασική σχέση μετασχηματισμού της κάθε κατάστασης I είναι: Απόθεμα (- + Παραγωγή ( = Ζήτηση ( + Απόθεμα ( ηλαδή: Ι- + = d + I Το κόστος για δεδομένη κατάσταση I και απόφαση είναι (I, = c + h I + -(I- και η άριστη τιμή θα δίνεται από την ακόλουθη: (I = mi {(I, } με αναδρομική σχέση (προδρομική, για I και Ι- + = d + I: { c + h I + ( I + d } ( I = mi ηλαδή: το ελάχιστο κόστος που προκύπτει, όταν στο -οστό μήνα ολοκληρώνω την παραγωγή αφήνοντας απόθεμα Ι τεμάχια. = Οριακή συνθήκη για Ι και για Ι0 + = d + I δηλαδή: = + I για < θα πρέπει I < 0, που δεν επιτρέπεται, οπότε εξετάζουμε τις περιπτώσεις όπου που έχουν νόημα (ώστε να είναι I 0 (I=0 = mi {c + h 0 + 0} = + 0=, = (I= = mi {c + h + 0} = + =0, = (I= = mi {c + h + 0} = + =, = για I θα πρέπει >, που δεν επιτρέπεται, οπότε οι υπόλοιπες περιπτώσεις δεν έχουν νόημα (ώστε να είναι http://users.uom.gr/~cg 0 http://users.uom.gr/~cg http://users.uom.gr/~cg = για Ι και για Ι + = d + I δηλαδή: I + = + Ι = (Ι, = c + h I + (I + ( I I 0 +0+ +0+ - - - 8 0 - - +0+ =8 0=88 - - - ++ = =89 ++ 0= - - - - ++ =0 ++ =8 ++ 0=0 - - ++ =0 - - - - - ++ ++ ++ = 0= = - - - - - - ++ ++ = 0= - - - - - - ++ =8-0 8 = για Ι και για Ι + = d + I δηλαδή: I + = + Ι = (Ι, = c + h I + (I - + ( I I 0 +0 +0 +0+ - - - - 0 0+0 += +0= +=0 8= 0+ += 0+ +8=8 + +=8 + +=9 - + +8=80 + ++ +0= =0 + += + +=8 - - + +8=89 ++ 0= ++ =8 ++ =88 - - - ++ 8=98 ++ 8=9 ++ =8 ++ 0=89 ++ =880 ++ =9 - - - 9 ++ 8= ++ =8 ++ 0=8 ++ =9 - - ++ 8=80 ++ =8 ++ 0=9-80 ++ 8=89 ++ =90 89 90 Ελάχιστο αναμενόμενο κόστος Προκύπτει για Ι = 0 και = και είναι ίσο με: (0 = Άριστη λύση : Απόθεμα σταδίου Παραγωγή = προκύπτει για I = 0 = = για I = I - + d = 0 + = 0 = για I = I - + d = 0 + = = Σχόλια: Χρειάζονται όλες οι σειρές του σταδίου = ; Τελικά, υπάρχει περίπτωση να είναι το Ι διάφορο του μηδενός; Αν θέλουμε να έχουμε τελικό απόθεμα > 0 τι πρέπει να κάνουμε; Το γραμμικό μοντέλο του παραδείγματος Mi z= + + + I + I + I μ.π. = + I δηλ. ( I= + I = + I δηλ. ( + I Ι = + I = + I δηλ. ( + I Ι = I 8 I 9 I 0 Ι? και I 0, ακέραιοι Ακολουθεί η επίλυση για I = 0,,,,, να γίνει ΕΠΑΛΗΘΕΥΣΗ! http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg
http://users.uom.gr/~cg Η επίλυση με το WiQSB για Ι αδιάφορο Η επίλυση με το WiQSB για Ι Η επίλυση με το WiQSB για Ι Η επίλυση με το WiQSB για Ι http://users.uom.gr/~cg 8 http://users.uom.gr/~cg 9 http://users.uom.gr/~cg 0 Η επίλυση με το WiQSB για Ι Η επίλυση με το WiQSB για Ι Παράδειγμα εδομένα σχετικά με την απόδοση των μηνυμάτων Ένα πολυκατάστημα σχεδιάζει μία διαφημιστική εκστρατεία με μηνύματα σε τέσσερα ΜΜΕ: Ημερήσια Εφημερίδα (ΗΕ, Κυριακάτικη Εφημερίδα (ΚΕ, Ραδιόφωνο (Ρ και Τηλεόραση (Τ. Το συνολικό ποσό που θα διατεθεί είναι 800.000 χ.μ. σε ακέραια πολλαπλάσια των 00.000. Ο στόχος είναι η μεγιστοποίηση της συνολικής (αθροιστικής αποτελεσματικότητας (που εκφράζεται από τους επιμέρους δείκτες κάθε μέσου ενημέρωσης, με βάση το άριστο σχέδιο τοποθέτησης των χ.μ. στα ΜΜΕ. Από σχετικές έρευνες, εκτιμήθηκαν οι δείκτες απόδοσης ανά 00.000 χ.μ. που διατίθενται σε κάποιο μέσο και τα στοιχεία παρουσιάζονται στον επόμενο πίνακα. Αναμενόμενος δείκτης απόδοσης Ποσό που διατίθεται (00.000 ΜΜΕ 0 8 ΗΕ 0 9 80 8 8 ΚΕ 0 0 90 9 9 9 Ρ 0 0 0 0 Τ 0 0 0 0 0 0 0 Ποιο είναι το άριστο σχέδιο της διαφημιστικής εκστρατείας; Αν ο προϋπολογισμός μειωθεί στα 00.000 απαντήστε στο ( Αν δεν είναι διαθέσιμη η Ημ. Εφ., απαντήστε στα ( και ( Αν υποτεθεί ότι σε κάθε διαφημιστικό μέσο πρέπει να διατεθούν τουλάχιστον 00.000, απαντήστε στα ερωτήματα ( και ( http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg http://users.uom.gr/~cg