ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Μαθηματική τεχνική για αντιμετώπιση προβλημάτων λήψης πολυσταδιακών αποφάσεων Συστηματική διαδικασία εύρεσης εκείνου του συνδυασμού αποφάσεων που βελτιστοποιεί τη συνολική απόδοση (σύμφωνα με κάποιο κριτήριο Πολυσταδιακές αποφάσεις: Ακολουθία αποφάσεων που σχετίζονται μεταξύ τους
ΕΦΑΡΜΟΓΕΣ Προγραμματισμός Παραγωγής Προγραμματισμός Επενδύσεων Προβλήματα Διατήρησης Αποθεμάτων Προβλήματα Αντικατάστασης Συντήρησης Εξοπλισμού Προβλήματα Βέλτιστης Διαδρομής Γενικότερα ο Δ.Π. Χρησιμοποιείται όταν: δεν μπορεί να διαμορφωθεί μαθηματικό μοντέλο το μαθηματικό μοντέλο είναι σύνθετο και δεν μπορεί να λυθεί με αναλυτικές μεθόδους
ΠΟΛΥΣΤΑΔΙΑΚΕΣ ΑΠΟΦΑΣΕΙΣ Παράδειγμα: Προγραμματισμός Παραγωγής Σε μια παραγωγική μονάδα λαμβάνονται κατά τακτά χρονικά διαστήματα αποφάσεις για: τη στάθμη απασχόλησης του προσωπικού τη στάθμη απασχόλησης των μηχανημάτων την αποθεματική πολιτική τις προσλήψεις απολύσεις τυχόν έκτακτου προσωπικού Κάθε τέτοια χρονική περίοδος αποτελεί και ένα στάδιο Στην αρχή κάθε περιόδου το σύστημα βρίσκεται σε μια κατάσταση που περιγράφεται με: το ύψος της παραγωγής το ύψος των αποθεμάτων τον αριθμό των εργαζόμενων Μετά από μια απόφαση το σύστημα μεταβαίνει σε μια διαφορετική κατάσταση.
ΠΑΡΑΔΕΙΓΜΑ Προγραμματισμός Επενδύσεων Μια επιχείρηση θέλει να καταστρώσει επενδυτικό πλάνο για τα επόμενα 5 χρόνια Το ύψος των διαθέσιμων πόρων (κατάσταση είναι ορισμένο Στην αρχή κάθε χρονιάς λαμβάνονται αποφάσεις για τιςεπενδύσειςεκείνηςτηςχρονιάς Ζητείται να μεγιστοποιηθεί η απόδοση του συνόλου των επενδύσεων
ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ (. ΣΤΑΔΙΑ Το πρόβλημα χωρίζεται σε διαδοχικά στάδια. ΚΑΤΑΣΤΑΣΕΙΣ Κάθε στάδιο έχει ένα αριθμό καταστάσεων που συνδέονται μ αυτό. Καθορίζονται με τις τιμές μιας μεταβλητής. ΑΠΟΦΑΣΕΙΣ Έχουν σαν αποτέλεσμα τη «μεταφορά» του συστήματος από την παρούσα κατάσταση σε μια άλλη στο επόμενο στάδιο. ΙΔΙΟΤΗΤΑ MARKOV Όταν δίνεται η κατάσταση του συστήματος σε κάποιο στάδιο, η βέλτιστη πολιτική για τα επόμενα στάδια είναι ανεξάρτητη από την πολιτική που ακολουθήθηκε στα προηγούμενα στάδια Σύστημα χωρίς μνήμη 5
ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ( Σκοπός του προγραμματισμού είναι η ελαχιστοποίηση του συνολικού κόστους που σχετίζεται με τις αποφάσεις, για μια μεγάλη χρονική περίοδο. Άρα Στάδια Αποφάσεις Καταστάσεις του συστήματος Ελαχιστοποίηση συνολικού κόστους 6
ΣΧΗΜΑΤΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΠΟΛΥΣΤΑΔΙΑΚΗΣ ΔΙΑΔΙΚΑΣΙΑΣ ΑΠΟΦΑΣΕΩΝ Απόφαση Απόφαση - Στάδιο Κατάσταση S Στάδιο - Κατάσταση S - Απόδοση/ Κόστος C s Απόδοση/ Κόστος C s Απόφαση Απόφαση Στάδιο Κατάσταση S Στάδιο Κατάσταση S Κατάσταση S 0 Απόδοση/ Κόστος C s Απόδοση/ Κόστος C s, = = C s + ma/ mi{,, } 7
ΕΠΙΛΥΣΗ ΠΡΟΒΛΗΜΑΤΩΝ Εύρεση της βέλτιστης πολιτικής για κάθε δυνατή κατάσταση του τελευταίου σταδίου Ορισμός αναδρομικής σχέσης που καθορίζει τη βέλτιστη πολιτική για κάθε κατάσταση όταν απομένουν ακόμα στάδια, με δεδομένη τη βέλτιστη πολιτική για κάθε κατάσταση όταν απομένουν - στάδια, = Cs + ( S, = ma/ mi{ : συνάρτηση βελτιστοποίησης S : μεταβλητή κατάστασης : μεταβλητή απόφασης, Με τη χρήση της αναδρομικής σχέσης προχωράμε από το τέλος προς την αρχή 8
ΠΑΡΑΔΕΙΓΜΑ : ΒΕΛΤΙΣΤΗ ΔΙΑΔΡΟΜΗ ( IV III II I 6 7 5 5 6 6 7 8 9 0 9
ΠΑΡΑΔΕΙΓΜΑ : ΒΕΛΤΙΣΤΗ ΔΙΑΔΡΟΜΗ ( Στάδια: =,,, Μεταβλητή απόφασης:, ο αμέσως επόμενος προορισμός Μεταβλητή κατάστασης: S, ηπολιτείαστηνοποία βρίσκεται ο έμπορος Αναδρομική σχέση:, = = C mi s { + ( S (, } C s, : το κόστος ασφάλισης για τη διαδρομή s Το συνολικό κόστος ασφάλισης για τα τελευταία στάδια θα ισούται με το κόστος της βέλτιστης πολιτικής για τα τελευταία - στάδια ( συν το κόστος της διαδρομής s Σχέση μεταξύ S και : Ο προορισμός του σταδίου είναι αφετηρία του σταδίου - = S 0
ΠΑΡΑΔΕΙΓΜΑ : ΒΕΛΤΙΣΤΗ ΔΙΑΔΡΟΜΗ ( = S 8 9 0 0, = Cs + ( = S 8 9 ( 5 8 8 6 9 7 7 9 7 6 7 6 8 =, = Cs ( + S 5 6 7 5 ή 6 7 9 0 7 5 8 8 8 5 ή 6 = S, = Cs ( + ( S ή
ΠΑΡΑΔΕΙΓΜΑ : ΒΕΛΤΙΣΤΗ ΔΙΑΔΡΟΜΗ ( Παράδειγμα: = S =, = C s + ( = 5 C s = Κόστος ( 5 = 7 Βέλτιστο κόστος για τη διαδρομή από S 0 βρίσκεται από τον πίνακα = για S = =5 και είναι: (5 = Άρα (,5 = C + (5 = 7 + Βέλτιστη πολιτική 5 = 5 8 0 ή 5 8 0 ή 6 9 0 Συνολικό Κόστος ( =
ΠΑΡΑΔΕΙΓΜΑ : ΕΠΕΝΔΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ( Ποσό που επενδύεται 0 5 6 7 8 ος Χρόνος 0 6 6 0 80 90 95 98 00 ος Χρόνος 0 5 5 60 70 7 7 75 ος Χρόνος 0 6 0 5 50 5 5 5
ΠΑΡΑΔΕΙΓΜΑ : ΕΠΕΝΔΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ( Στάδια: = : ος χρόνος = : ος χρόνος = : ος χρόνος Μεταβλητή απόφασης: Πόσα επενδύονται στο στάδιο ( Μεταβλητή κατάστασης: Πόσα είναι διαθέσιμα κατά το στάδιο (S Σχέση μεταξύ s και : Τα διαθέσιμα κατά το στάδιο - είναι όσα ήταν διαθέσιμα κατά το στάδιο μείον όσα επενδύθηκαν κατά το στάδιο. Αναδρομική σχέση: S, = P ( + = S S P - ( : το κέρδος από την επένδυση κατά το στάδιο (έτος - ποσου. : το κέρδος της βέλτιστης πολιτικής μέχρι το στάδιο -, αν τα διαθέσιμα είναι S - = S -. = ma{, }
ΠΑΡΑΔΕΙΓΜΑ : ΕΠΕΝΔΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ( = S 0 5 6 7 8 0 6 0 5 50 5 5 5 0 5 6 7 8, = P ( + = S 0 5 6 7 8 0 0 0 0 5 5 6 9 6 0 0 6 5 0 0 5 5 8 9 60 60 5 50 50 5 6 6 70 70 5 6 5 55 57 75 86 7 7 86 7 5 56 6 80 00 96 77 7 00 8 5 57 6 85 05 0 99 78 75 0 5, = P ( + = S 0 5 6 7 8 8 0 06 0 0 0 0 0 00 0 5
ΠΑΡΑΔΕΙΓΜΑ : ΕΠΕΝΔΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ( Παράδειγμα: = S =, = P ( + = P ( = Κέρδος από επένδυση = κατά τον = χρόνο = 5 Βέλτιστο κέρδος αν επενδυθούν κατά τον επόμενο χρόνο (ο = τα χρήματα που περίσσεψαν: s = = Από πίνακα = ( = 6 Άρα (, = P ( + ( = 5 + 6 = Βέλτιστη Πολιτική 0 Συνολικό κέρδος: 0 6
ΠΑΡΑΔΕΙΓΜΑ : ΣΤΑΤΙΣΤΙΚΟΛΟΓΟΣ ( ποντάρει Κ μάρκες P=/ P=/ Κερδίζει άλλες τόσες Κ Τις χάνει -Κ Στάδια: =,, Μεταβλητή Απόφασης: Μεταβλητή Κατάστασης: = Μάρκες που ποντάρει στο στάδιο s = Μάρκες που έχει στο στάδιο s - = s + s (p=/ (p=/ Αναδρομική σχέση:, = + + 7
ΠΑΡΑΔΕΙΓΜΑ : ΣΤΑΤΙΣΤΙΚΟΛΟΓΟΣ ( = S 0 5 0 0 0 / / - - - s -5 S =, = + + 0 0 0 0-0 0 0-0 /9 /9 /9, / /9 / / / 0,, / 8/9 / / / 8/9 5 0 ( s -5 = S, = + + 0 / 0/7 / / 0/7 8
ΠΑΡΑΔΕΙΓΜΑ : ΣΤΑΤΙΣΤΙΚΟΛΟΓΟΣ ( = Κερδίζει Χάνει = Κερδίζει Χάνει Κερδίζει = 0 = ή =,( ή,,, = ή Χάνει χάνει 9