από τις οποίες δεν είναι παράγωγος. Η μεταβλητή ελέγχου u(t)

Σχετικά έγγραφα
ΔΥΝΑΜΙΚΗ ΒΕΛΤΙΣΤΟΠOIΗΣΗ

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

dy df(x) y= f(x) y = f (x), = dx dx θ x m= 1

IV.13 ΔΙΑΦΟΡΙΚΕΣ ΕΞΙΣΩΣΕΙΣ 1 ης ΤΑΞΕΩΣ

1. Ολικά και τοπικά ακρότατα. 2. Εσωτερικά και συνοριακά ακρότατα

1 Μερική παραγώγιση και μερική παράγωγος

III.10 ΠΟΛΛΑΠΛΑΣΙΑΣΤΕΣ LAGRANGE

Πανεπιστήμιο Ιωαννίνων ΟΙΚΟΝΟΜΙΚΑ ΤΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ Διδάσκων:

III.10 ΠΟΛΛΑΠΛΑΣΙΑΣΤΕΣ LAGRANGE

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

13 Μονοτονία Ακρότατα συνάρτησης

ΜΑΘΗΜΑΤΙΚΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ I 22 Διάρκεια εξέτασης: 2 ώρες και 15' 1 (4 μονάδες)

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

1. Κατανομή πόρων σε συνθήκες στατικής αποτελεσματικότητας

Η ΘΕΩΡΙΑ ΤΗΣ ΕΠΙΧΕΙΡΗΣΗΣ

2. ΜΑΘΗΜΑΤΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

I.3 ΔΕΥΤΕΡΗ ΠΑΡΑΓΩΓΟΣ-ΚΥΡΤΟΤΗΤΑ

Κεφάλαιο 2. Τα μαθηματικά της αριστοποίησης ΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ ΑΡΙΣΤΟΠΟΙΗΣΗΣ. Τιμή μιας παραγώγου σ ένα σημείο. Παράγωγοι

I.3 ΔΕΥΤΕΡΗ ΠΑΡΑΓΩΓΟΣ-ΚΥΡΤΟΤΗΤΑ

Επιχειρησιακά Μαθηματικά (1)

ΤΕΣΤ Α2 ΟΜΑΔΑ Ι. παράγωγος είναι αρνητική: f (x) = 1 2x, f

A2. ΠΑΡΑΓΩΓΟΣ-ΚΛΙΣΗ-ΜΟΝΟΤΟΝΙΑ

ΔΙΑΓΩΝΙΣΜΑ 1. Α Μέρος

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ Οι συντεταγμένες ενός σημείου Απόλυτη τιμή...14

5 ΣΥΝΑΡΤΗΣΕΙΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

Εφαρμοσμένη Βελτιστοποίηση

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ

ΔΙΑΓΩΝΙΣΜΑ 12., στο ίδιο σύστημα

Κεφάλαιο 4: Διαφορικός Λογισμός

ΜΑΘΗΜΑΤΙΚΑ Ι Β ΜΕΡΟΣ

Παντελής Μπουμπούλης, M.Sc., Ph.D. σελ. 2 math-gr.blogspot.com, bouboulis.mysch.gr

Α. Αυτάρκης Οικονομία

Αριθμητική Ανάλυση και Εφαρμογές

ΜΑΘΗΜΑΤΙΚΩΝ ΔΑΣΟΛΟΓΙΑΣ

Περίγραμμα διάλεξης 8

Γ. Ν. Π Α Π Α Δ Α Κ Η Σ Μ Α Θ Η Μ Α Τ Ι Κ Ο Σ ( M S C ) ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ. ΠΡΟΓΡΑΜΜΑ: Σπουδές στις Φυσικές Επιστήμες

Θεωρία Καταναλωτή. Υποδειγματοποίηση της συμπεριφοράς του καταναλωτή. Βασική έννοια: Βελτιστοποίηση υπό περιορισμό.

Θεώρημα Βolzano. Κατηγορία 1 η Δίνεται η συνάρτηση:

Αριθμητική Ανάλυση και Εφαρμογές

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΣΤΟΙΧΕΙΑ ΔΙΑΦΟΡΙΚΟΥ ΛΟΓΙΣΜΟΥ ΣΥΝΑΡΤΗΣΕΩΝ ΠΟΛΛΩΝ ΜΕΤΑΒΛΗΤΩΝ 15

Η Θεωρία στα Μαθηματικά κατεύθυνσης της Γ Λυκείου

ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β. Να μελετήσετε ως προς τη μονοτονία και τα ακρότατα τις παρακάτω συναρτήσεις: f (x) = 0 x(2ln x + 1) = 0 ln x = x = e x =

ΤΕΣΤ Β2.λύσεις ΟΜΑΔΑ Ι

Μονοτονία - Ακρότατα Αντίστροφη Συνάρτηση

Δεύτερο πακέτο ασκήσεων. έχει φθίνον τεχνικό λόγο υποκατάστασης (RTS); Απάντηση: Όλες τις τιμές αφού ο RTS = MP 1 MP 2

Για να εκφράσουμε τη διαδικασία αυτή, γράφουμε: :

Εισαγωγή στις Φυσικές Επιστήμες ( ) Ονοματεπώνυμο Τμήμα ΘΕΜΑ 1. x x. x x x ( ) + ( 20) + ( + 4) = ( + ) + ( 10 + ) + ( )

Διάλεξη 5- Σημειώσεις

Σύνολο ασκήσεων 5. = = ( ) = = ( ) = p ln ( ) Για τη συνάρτηση CES (σταθερής ελαστικότητας υποκατάστασης)

7. Αν υψώσουμε και τα δύο μέλη μιας εξίσωσης στον κύβο (και γενικά σε οποιαδήποτε περιττή δύναμη), τότε προκύπτει

Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

g= x + y 1}. Να βρεθεί γραφικά και αναλυτικά η MR Π(Q) = R(Q) C(Q). Στο παραπλεύρως σχήμα

ΜΑΘΗΜΑΤΙΚΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ I ιαγώνισµα 24 ιάρκεια εξέτασης: 2 ώρες Θεωρία. 2 (4 µονάδες)

3.7 Παραδείγματα Μεθόδου Simplex

Σύνολο ασκήσεων 5. Άσκηση 1. Υπολογίστε τις μερικές παραγώγους ως προς 1 ή κτλ (συμβολισμός ή κτλ) για τις παρακάτω συναρτήσεις

(f,g) f(x,y,v, w) = xy v= 0 x (v,y) = = = = = 3. g(x,y,v,w) = x+ 2y w= 0. (x,y) g g 1 2. Λύση 2. Με πλεγμένη παραγώγιση ως προς v, με σταθερό w :

ΚΕΦΑΛΑΙΟ 3ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 8: ΜΟΝΟΤΟΝΙΑ ΣΥΝΑΡΤΗΣΗΣ [Ενότητα Μονοτονία Συνάρτησης του κεφ.2.6 Μέρος Β του σχολικού βιβλίου].

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Ευχαριστίες Δύο λόγια από την συγγραφέα... 17

ΔΙΑΓΩΝΙΣΜΑ 11. (δ). Να βρεθεί η λύση της διαφορικής εξίσωσης: y = xy, που έχει θετικές τιμές: y 0 και ικανοποιεί: y(0) = 1. 2.

Σφαίρα σε ράγες: Η συνάρτηση Lagrange. Ν. Παναγιωτίδης

Συνθήκες Θ.Μ.Τ. Τρόπος αντιμετώπισης: 1. Για να ισχύει το Θ.Μ.Τ. για μια συνάρτηση f σε ένα διάστημα [, ] (δηλαδή για να υπάρχει ένα τουλάχιστον (, )

III.9 ΑΚΡΟΤΑΤΑ ΣΕ ΠΕΡΙΟΧΗ

Εισαγωγή στο Γραμμικό Προγραμματισμό. Χειμερινό Εξάμηνο

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Λογισμός 3 Ασκήσεις. Μιχάλης Μαριάς Τμήμα Α.Π.Θ.

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x

Θεωρία. έχει το γράφηµα του παραπλεύρως σχήµατος.

ΣΥΓΚΡΙΤΙΚΗ ΣΤΑΤΙΚΗ ΑΝΑΛΥΣΗ ΠΑΡΑΓΩΓΟΣ- ΚΑΝΟΝΕΣ ΠΑΡΑΓΩΓΙΣΗΣ

ΑΚΡΟΤΑΤΑ ΣΥΝΑΡΤΗΣΕΩΝ ΠΟΛΛΩΝ ΜΕΤΑΒΛΗΤΩΝ

f(x) Af(x) = και Mf(x) = f (x) x

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

1. Η διαδικασία, με την οποία κάθε στοιχείο ενός συνόλου Α αντιστοιχίζεται σ ένα ακριβώς στοιχείο ενός άλλου συνόλου Β είναι συνάρτηση.

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τµήµα Οικονοµικών Επιστηµών Ακαδηµαϊκό έτος (διαβάζουμε κεφ. 4 από Μ. Χλέτσο και σημειώσεις στο eclass)

Af(x) = και Mf(x) = f (x) x

Ασκήσεις 1. Με τα δεδομένα του παρακάτω πίνακα: Τιμή (Ρ) Ποσότητα (Q D )

2.0. , κ R, η γραφική παράσταση της οποίας διέρχεται από το σημείο Ρ=(1,1). Να βρεθεί η τιμή του αριθμού κ.

ΚΑΜΠΥΛΗ ENGEL ΚΑΙ Ι ΙΟΤΗΤΕΣ ΤΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΖΗΤΗΣΗΣ ΚΑΤΑ MARSHALL ΚΑΙ HICKS. 1. Η καµπύλη Engel

ΔΙΑΓΩΝΙΣΜΑ 14. Μέρος Α

Παράδειγμα 14.2 Να βρεθεί ο μετασχηματισμός Laplace των συναρτήσεων

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Αριθμητική Ανάλυση και Εφαρμογές

Μαθηματικά Θετικής και Τεχνολογικής Κατεύθυνσης Γ Λυκείου ΚΥΡΤΟΤΗΤΑ - ΣΗΜΕΙΑ ΚΑΜΠΗΣ ΣΥΝΑΡΤΗΣΗΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

II.6 ΙΣΟΣΤΑΘΜΙΚΕΣ. 1. Γραφήματα-Επιφάνειες: z= 2. Γραμμική προσέγγιση-εφαπτόμενο επίπεδο. 3. Ισοσταθμικές: f(x, y) = c

1. Τετραγωνικές μορφές. x y 0. 0x y 0 1α 1β 2α 2β 3. 0x + y 0

Πες το με μία γραφική παράσταση

Οι τιμές των αγαθών προσδιορίζονται στην αγορά από την αλληλεπίδραση των δυνάμεων της ζήτησης και της προσφοράς.

Εισαγωγικές έννοιες. Κατηγορίες προβλημάτων (σε μια διάσταση) Προβλήματα εύρεσης μεγίστου. Συμβολισμοί

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

από την ποσοστιαία μεταβολή της ζητούμενης ποσότητας προς την ποσοστιαία Σχέση ελαστικότητας ζήτησης και κλίση της καμπύλης ζήτησης.

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ

4 ΣΥΝΕΧΗ ΣΤΟ ΧΡΟΝΟ ΔΥΝΑΜΙΚΑ ΣΥΣΤΗΜΑΤΑ - ΔΙΑΦΟΡΙΚΕΣ ΕΞΙΣΩΣΕΙΣ

Συνοπτική θεωρία - Τι να προσέχουμε Ασκήσεις Θέματα από Πανελλαδικές. γ) g( x) e 2. ln( x 1) 3. x x. ζ) ( x) ln(9 x2) ια) ( ) ln x 1

4.3 Δραστηριότητα: Θεώρημα Fermat

Πληροφοριακά Συστήματα Διοίκησης. Εισαγωγή στον Γραμμικό Προγραμματισμό

Transcript:

ΜΕΡΟΣ ΙΙ ΒΕΛΤΙΣΤΟΣ ΕΛΕΓΧΟΣ Κεφάλαιο Εισαγωγή Μια εναλλακτική και ίσως πιο παραστατική διατύπωση του λογισμού των μεταβολών είναι γνωστή από.τις αρχές της δεκαετίας του 95 ως Βέλτιστος Έλεγχος. Στον φορμαλισμό αυτό θεωρείται ότι υπάρχουν δύο ομάδες μεταβλητών αυτές του ελέγχου και αυτές της κατάστασης. Θεωρείται ότι η επίδραση στο όλο σύστημα μπορεί να γίνει μόνο έμμεσα μέσω επιλογής των μεταβλητών ελέγχου. Αυτές μέσω ενός συστήματος διαφορικών εξισώσεων επηρεάζουν τις μεταβλητές κατάστασης. Έτσι οι περιορισμοί πάνω στον τρόπο επενέργειας στα διάφορα συστήματα γίνονται διαφανείς. Σημαντική συνεισφορά στη θεμελίωση του Βελτίστου Ελέγχου είχαν οι Ponryagn (Αρχή του Μεγίστου) Bellman (Δυναμικός Προγραμματισμός) και Kalman (Στοχαστικός Βέλτιστος Έλεγχος). Αξιοσημείωτη είναι η σχετικά πρόσφατη εφαρμογή του Στοχαστικού Ελέγχου στη Χρηματοοικονομική από τον Meron. Το απλούστερο πρόβλημα βελτίστου ελέγχου έγκειται στην επιλογή συνάρτησης ελέγχου () συνεχούς τουλάχιστον κατά τμήματα που να λύνει το πρόβλημα όπου g Ma f d (.) (.) δεδομένα και Οι συναρτήσεις f g ελεύθερο ή δεσμευμένο (.3) εξαρτώνται από τρεις μεταβλητές συνεχώς παραγωγίσιμες καμία από τις οποίες δεν είναι παράγωγος. Η μεταβλητή ελέγχου () πρέπει να είναι συνεχής συνάρτηση του χρόνου τουλάχιστον κατά τμήματα ενώ η μεταβλητή κατάστασης () αλλάζει σύμφωνα με τη διαφορική εξίσωση (.). Η μεταβλητή () επηρεάζει την αντικειμενική συνάρτηση (.) άμεσα και έμμεσα μεταβάλλοντας την (). Η

υψηλότερης τάξης παράγωγος είναι πρώτης τάξης και εμφανίζεται στην εξίσωση κατάστασης ή μετάβασης (.). Το σύνολο των προβλημάτων που περιέχουν παραγώγους μεγαλύτερης τάξης μπορούν να μετασχηματιστούν σε προβλήματα που περιέχουν παραγώγους πρώτης τάξης. Το κλασσικό πρόβλημα λογισμού μεταβολών που συνίσταται π.χ στη εύρεση παραγωγίσιμης συνάρτησης () μεγιστοποιεί την παράσταση f ( ( ) ( )) d (.4) όπου ) (.5) ( είναι δυνατό να μετασχηματιστεί σε πρόβλημα βελτίστου ελέγχου. Το ισοδύναμο πρόβλημα βελτίστου ελέγχου είναι ma όπου f ( ( ) ( )) d (.6) ( ) ( ). (.7) Για παράδειγμα το πρόβλημα προγραμματισμού της παραγωγής με στόχο την ελαχιστοποίηση του κόστους εκφράζεται ως εξής: mn c c d (.8) όπου ( ) ( ) ( ) ( ) B ( ) (.9) με μεταβλητή ελέγχου το ρυθμό παραγωγής () και μεταβλητή κατάστασης το απόθεμα (συσσωρευμένη παραγωγή). Επίσης το πρόβλημα μεγιστοποίησης χρησιμότητας του καταναλωτή μπορεί να διατυπωθεί ως εξής: Ma C d r e U (.) Οπου K C( ) bk K F (.) K K K C. (.)

Σε αυτό το πρόβλημα η μεταβλητή κατάστασης είναι K ο ρυθμός μεταβολής της οποίας προσδιορίζεται από την παραπάνω διαφορική εξίσωση πρώτης τάξης μεταβλητή ελέγχου είναι C. και η Γενικά ένα πρόβλημα βελτίστου ελέγχου μπορεί να έχει αρκετές μεταβλητές ελέγχου και κατάστασης. Κάθε μεταβλητή κατάστασης εξελίσσεται σύμφωνα με μια διαφορική εξίσωση. Τέλος οι μεταβλητές ελέγχου και κατάστασης είναι δυνατό να διαφέρουν σε αριθμό. 3

ΚΕΦΑΛΑΙΟ Αναγκαίες συνθήκες Το απλούστερο πρόβλημα βελτίστου ελέγχου είναι της μορφής Ma f ( ( ). ( )) d (.) Όπου ( ) g( ( ) ( )) (.) ( ) δεδομένα ( ) ελεύθερο ή δεσμευμένο (.3) Για την εύρεση συναρτήσεων () () παράσταση (.) ακολουθούμε διαδικασία παρόμοια με εκείνη που μεγιστοποιούν την προβλήματος βελτιστοποίησης με ισοτικούς περιορισμούς (μέθοδος Lagrange) με τη διαφορά ότι ο πολλαπλασιαστής Lagrange δεν είναι παράμετρος αλλά συνεχώς παραγωγίσιμη συνάρτηση. Η λύση του προβλήματος αυτού δε μπορεί να γίνει εύκολα με εξέταση της μεταβλητής που προκύπτει από αλλαγή ενός σε που θα προκύψει στο σαν συνέπεια της και αυτό διότι δεν είναι σαφής η αλλαγή. Χρησιμοποιούμε λοιπόν το παρακάτω τέχνασμα που εξουδετερώνει την αλλαγή. Προσθέτουμε τον μηδενικό όρο g d στο συναρτησιακό οπότε έχουμε f g d f gd d fd. Έστω τώρα ότι εξετάζουμε μια μεταβολή μεταβολή. Η αλλαγή στο συναρτησιακό είναι Το στην οποία αντιστοιχεί μια f f g g d. μπορεί να επιλεγεί ελεύθερα. Αν το επιλέξουμε έτσι ώστε να ικανοποιεί τη διαφορική εξίσωση f g Προφανώς αν τότε η μεταβλητή γίνεται απλώς f g dz. και γενικά τότε η μεταβολή πρώτης τάξης μηδενίζεται αν ισχύουν οι παρακάτω σχέσεις 4

- f g - f - g g - ή ελεύθερο. Οι σχέσεις γράφονται πιο συνοπτικά αν θέσουμε H f g οπότε οι σχέσεις είναι - H - H - H - Προφανώς σε περιπτώσεις ελεύθερου από την. η συνοριακή σχέση αντικαθίσταται Παράδειγμα ΙΙ.. Να λυθεί το πρόβλημα Ma d όπου ( ). Η Χαμιλτονιανή είναι H Αναγκαίες συνθήκες είναι οι εξής: H H ( ) Η σχέση Αρα. Η σχέση. c. c c. (.5). Συνεπώς η (.4). γίνεται 5

3 c. 4 c c c 3 Επομένως οι σχέσεις (.5)-(.6) δίνουν τη λύση του προβλήματος.. (.6) Παράδειγμα ΙΙ.. Το γνωστό πρόβλημα προγραμματισμού της παραγωγής είναι δυνατό να λυθεί με βέλτιστο έλεγχο. Αν θέσουμε ως απόθεμα το πρόβλημα τίθεται ως εξής: mn c c όπου και επίπεδο παραγωγής το d (.7) B. (.8) το Η Χαμιλτονιανή είναι H H c (.9) H c c c. Οι συνθήκες βελτιστοποίησης είναι: B. Η c δίνει και η c συνεπάγεται c c3. Αρα c c c c 3 c c c3 c c c c3 c c 4c c3 c c. Αυτές οι σχέσεις σε συνδυασμό με τους οριακές συνθήκες (.8) δίνουν τα εξής: c( ) 4c B 4 c 4c c B cb c με την προυπόθεση ότι για. Ετσι η λύση συμπίπτει με εκείνη που εξάχθηκε με τις τεχνικές του λογισμού μεταβολών όπως και ήταν αναμενόμενο. Η 6

παραπάνω ανάλυση της περίπτωσης όπου έχουμε μία μεταβλητή κατάστασης και μία μεταβλητή ελέγχου γενικεύεται απευθείας όταν έχουμε n μεταβλητές κατάστασης και m μεταβλητές ελέγχου ως εξής: Ma f...... d n m όπου g... δεδομένο Οι συναρτήσεις f n... ελεύθερο... n j... m. g είναι συνεχώς παραγωγίσιμες. Οι μεταβλητές κατάστασης n δεν είναι γενικά ίσες σε αριθμό με τις μεταβλητές ελέγχου g g......... m g n είναι οι βέλτιστες μεταβλητές κατάστασης και ελέγχου. n m m. Θέτουμε... ως διανύσματα. Τότε τα διανύσματα n Η Χαμιλτονιανή ορίζεται ως H f g ικανοποιούν ταυτόχρονα τις σχέσεις: H j f j n g j n. Τα H f H g n g και/ή ή 7

ΚΕΦΑΛΑΙΟ 3 Η Γενική Μεταβολή στο Βέλτιστο Έλεγχο Εφαρμογές Εξετάζουμε το βασικό πρόβλημα βελτίστου ελέγχου με δεδομένα άκρα J f d g και Η μεταβολή στο J που αντιστοιχεί σε αλλαγή του ελέγχου είναι J H d όπου οι δυϊκές μεταβλητές που ικανοποιούν τις γνωστές σχέσεις H. Η μεταβλητή J μηδενίζεται αν H. Εξετάζουμε τώρα δύο προβλήματα με γειτονικές συνθήκες τερματισμού αφενός και αφ ετέρου. Έστω τερματισμό και S Τότε S η βέλτιστη αξία του J με η αντίστοιχη αξία του προβλήματος με. Έστω η διαφορά των δύο ελέγχων για τα αντίστοιχα προβλήματα. S S - S = H d. (Εννοείται ότι και στα δύο προβλήματα). Αλλά εφόσον και τα δύο προβλήματα αφορούν στην εύρεση βελτίστου H και άρα S του λογισμού μεταβολών με F. y. Ο τύπος είναι ακριβώς ανάλογος με αυτόν Έστω τώρα η γενική μεταβολή μεταβάλλουμε το και το. Προφανώς είναι S S - S S fdz fdz fdz όπου δηλαδή 8

Ο όρος fdz έχει τερματικό σημείο ~ που ισούται σε πρώτη τάξη με. Έτσι έχουμε ~ και άρα g g ~. Έτσι ο όρος fdz (εφόσον προκύπτει από μεταβλητή ελέγχου που προσεγγίζει τη βέλτιστη για το πρόβλημα με τερματικές συνθήκες ) έχει τιμή (σε πρώτη τάξη) Η αρχική γενική μεταβολή fdz S ~ ~ S S S S g S υπολογίζεται ως εξής: S S g f S S S f g όπου χρησιμοποιήσαμε την προφανή προσέγγιση fdz f. Οι παραπάνω υπολογισμοί συνοψίζονται στον τύπο της γενικής μεταβολής S H που είναι ακριβώς ανάλογος με τον αντίστοιχο τύπο του λογισμού των μεταβολών. Ο τύπος της γενικής μεταβολής είναι ιδιαίτερα χρήσιμος για τη διατύπωση συνοριακών συνθηκών. Έτσι π.χ αν ο χρόνος τερματισμού είναι ελεύθερος ενώ η μεταβλητή κατάστασης είναι δεδομένη οι συνοριακές συνθήκες είναι H και. Τα προβλήματα υπολειμματικής αξίας αντιμετωπίζονται με τον ίδιο τρόπο. Έστω το πρόβλημα fdz J με σημείο τερματισμού ο πρώτος όρος είναι βέλτιστος έχουμε ελεύθερα. Εφόσον ανεξάρτητα από το J S και άρα J H H άρα οι συνοριακές συνθήκες είναι H. και 9

Αν ο τερματισμός βρίσκεται σε μια καμπύλη p με ελεύθερο έχουμε πάλι ότι ο έλεγχος είναι βέλτιστος ανεξάρτητα του τερματικού σημείου. Άρα είναι J S p και άρα J H p H p στο να ικανοποιούνται οι δύο συνθήκες και άρα πρέπει H p και p. Ανισοτικοί περιορισμοί στο τερματικό σημείο μπορεί να αντιμετωπισθούν με μεθόδους αντίστοιχες με αυτές που χρησιμοποιούνται στο Μαθηματικό προγραμματισμό. Χωρίς απώλεια γενικότητας έστω ότι στο έχουμε περιορισμό. Έστω λοιπόν ότι εξετάζουμε μία υπουήφια λύση με. Τότε η μεταβολή στο μπορεί να πάρει αυθαίρετο πρόσημο και έτσι η συνθήκη πράγμα που γράφεται και ως S συνεπάγεται ότι. Έστω όμως μία υποψήφια λύση με οπότε η επιτρεπτή μεταβολή μπορεί να είναι μόνο θετική. Αν θεωρήσουμε ότι έχουμε πρόβλημα μεγιστοποίησης του συναρτησιακού J θα πρέπει για βέλτιστο να ικανοποιεί S J ή για ή. Επομένως στην πράξη λύνουμε το πρόβλημα του βέλτιστου ελέγχου με και εξετάζουμε το που προκύπτει από τη λύση των σχετικών διαφορικών εξισώσεων. Θα πρέπει το που προκύπτει έτσι να μην είναι αρνητικό διαφορετικά η υποψήφια βέλτιστη λύση δεν είναι αποδεκτή. Με αντίστοιχο τρόπο προκύπτουν συνθήκες για διάφορα άλλα προβλήματα. Συνοψίζουμε τις συνθήκες ως εξής: Έστω το πρόβλημα Ma d f (3.)... n (3.) Όπου g δεδομένο... n (3.3) δεδομένο... q (3.4) ελεύθερο q... r (3.5)

r... s (3.6) K n... n στο (3.7)...... n q r s n και K υποθέτουμε ότι είναι συνεχώς παραγωγίσιμη συνάρτηση. (3.8) m Oι αναγκαίες συνθήκες για βέλτιστη λύση διανύσματος συνεχών συναρτήσεων... ισχύουν τα ακόλουθα. ) Εξισώσεις κατάστασης g... n. ) Εξισώσεις πολλαπλασιαστών n f g... n. 3) Εξισώσεις βελτιστοποίησης n f g α) j... m. j β) H j μεγιστοποιείται για 4) Συνθήκες ransversaly α) αν. είναι ελεύθερο. β) γ) K p q... n p δ) pk αν K n... n K p q... n αν K n... n n περιλαμβάνουν την ύπαρξη και αριθμών p έτσι ώστε να

n ε) f g αν το είναι ελεύθερο. n στ) f g στο αν. ζ) K p q... n f n K g p p K pk στο s... n αν K n... n. Παράδειγμα ΙΙ.3. Να βελτιστοποιηθεί η παράσταση f d όπου Η Χαμιλτονιανή είναι H f Επίσης τα ικανοποιούν τις σχέσεις R. και ο περιορισμός K R. f H (3.9) H f (3.) p (3.) f pr στο (3.). Αντικαθιστώντας από την (3.9) και (3.) στην (3.) λαμβάνουμε R Συνεπώς από την σχέση. R. Άρα το βέλτιστο μονοπάτι είναι κάθετο στην καμπύλη όπου αυτό πρέπει να βρίσκεται στο τελικό σημείο. Παράδειγμα ΙΙ.3. Έστω το πρόβλημα

Mn dz. Έστω. Τότε H. H και H οπότε. Το έχει λύση σύστημα Ae Be και εφόσον e e είναι e e e e οπότε που είναι e e e e προφανώς αρνητικό. Δεδομένου ότι έχουμε πρόβλημα ελαχιστοποίησης το απαιτούμενο είναι αποδεκτή. πρόσημο είναι αρνητικό και έτσι η λύση με. Αλλά e e 3

ΚΕΦΑΛΑΙΟ 4 Προεξόφληση και συγκριτική δυναμική ανάλυση Στις περιπτώσεις εφαρμογής του βελτίστου ελέγχου που εξετάστηκαν μέχρι τώρα οι μελλοντικές αξίες προεξοφλούνται. Ετσι είχαμε Ma e r f d (4.) Οπου g (4.) r Η Χαμιλτονιανή είναι H e f g συνθήκες είναι H (4.4) H g (4.3) και οι αναγκαίες και H (4.5). Ολες οι αξίες προεξοφλούνται στην περίοδο. Συχνά όμως είναι σκόπιμο να τίθενται τα προβλήματα σε σχέση με αξίες της τρέχουσας περιόδου και όχι της αρχικής περιόδου. Στην περίπτωση μάλιστα που οι συναρτήσεις f g δεν εξαρτώνται άμεσα από το χρόνο οι εξισώσεις που συνδέονται με τη βέλτιστη λύση είναι αυτόνομες με συνέπεια η μελέτη τους να γίνεται ευκολότερη. Η ανάλυση με βάση τρέχουσες αξίες r r Χαμιλτονιανή της (4.3) γράφεται H e f e g m παρουσιάζεται αμέσως παρακάτω. Η (4.6) και ορίζουμε r e (4.7) ως τον πολλαπλασιαστή του προβλήματος με βάση την τρέχουσα r περίοδο και όχι τη περίοδο. Αντίστοιχα θέτουμε h e H f mg (4.8) όπου h καλείται η Χαμιλτονιανή της Τρέχουσας Περιόδου (crren vale Hamlonan). Οι αναγκαίες συνθήκες με βάση τα h m γράφονται ως εξής. Από την (4.7) έχουμε m re r r r e rm e H rm h rm f mg (4.9). Από την H προκύπτει ότι h (4.) και επίσης h m g (4.). Συνοπτικά οι σχέσεις (4.3)-(4.5) διατυπώνονται ως εξής mg h f (4.) h f mg (4.3) 4

m rm h rm f mg (4.4) Οι σχέσεις g h (4.5) δεν μεταβάλλονται. Επιπρόσθετα αν το είναι ελεύθερο τότε r e m (4.6). Αν e r m e r m (4.7). και Οι (4.3)-(4.4) δεν περιλαμβάνουν προεξόφληση ενώ σε περίπτωση που το δεν ανακύπτει στις f g τότε οι σχέσεις (4.) (4.3) και (4.4) γίνονται g h f mg rm f mg m rm h. και συνιστούν ένα αυτόνομο σύστημα εξισώσεων. Αν λύσουμε τη δεύτερη εξίσωση ως προς και αντικαταστήσουμε στις υπόλοιπες δύο λαμβάνουμε ένα αυτόνομο σύστημα διαφορικών εξισώσεων ως προς m του οποίου η λύση είναι ευκολότερη από τη λύση του αντίστοιχου μη αυτόνομου συστήματος. Επιπλέον αν η αναλυτική λύση του συστήματος δεν είναι δυνατή είναι πάντοτε εφικτή η ποιοτική ανάλυση με τη χρήση διαγραμμάτων φάσης (phase dagrams). Παράδειγμα ΙΙ.4. Εστω P το κέρδος επιχείρησης ως συνάρτηση του κεφαλαίου και P P. Ο βαθμός απαξίωσης του κεφαλαίου είναι σταθερός και ίσος με b το κόστος επενδύσεων C είναι αύξουσα κοίλη συνάρτηση των ακαθάριστων επενδύσεων και C C. Ζητείται το ύψος των επενδύσεων που μεγιστοποιεί την. Δηλαδή το πρόβλημα διατυπώνεται ως εξής. παρούσα αξία των κερδών για Ma P C Οπου e r d (4.8) b. (4.9) 5

Η Χαμιλτονιανή σε όρους τρέχουσας περιόδου είναι h P C m b. (4.) Αν η βέλτιστη επένδυση είναι θετική έχουμε C m C m (4.) και m rm h rm P mb m r bm P m (4.3). h (4.) και Αναλυτική λύση των παραπάνω εξισώσεων είναι αδύνατη χωρίς εξειδίκευση των συναρτήσεων P και C αλλά θα επιχειρηθεί ποιοτική επεξεργασία της λύσης. Συγκεκριμένα δεδομένου ότι C η συνάρτηση C είναι γνήσια μονότονη και μπορεί να αντιστραφεί. Ετσι από την (4.) έχουμε C m gm g C. Δεδομένου ότι C g (4.4) όπου (4.5). Επίσης από την (4.) προκύπτει d C d dm gm (4.6). Από τις (4.9) και (4.4) λαμβάνουμε dm C m g b (4.7). Οι σχέσεις (4.) και (4.7) συνιστούν ένα σύστημα διαφορικών εξισώσεων ως προς m. Η (4.7) δίνει για m b g (4.8). Επιπλέον από τις (4.5) και (4.6) έχουμε ότι ο γεωμετρικός τόπος των σημείων για τα οποία ισχύει η (4.8) περνά από την αρχή των αξόνων και είναι αύξων. Αν ένα σημείο πάνω σε αυτόν είναι το m a a g m a b (4.9) ενώ π.χ για σημείο πάνω από αυτόν a ma k k a θα έχουμε gm k εφόσον η g είναι αύξουσα άρα. Με παρόμοιο a b a τρόπο είναι δυνατό να δειχθεί ότι για τα σημεία κάτω από την καμπύλη. Θεωρούμε τώρα τα σημεία όπου m r bm P (4.3). Με ανάλογο σκεπτικό με το παραπάνω εφόσον P η καμπύλη που αντιστοιχεί στην (4.3) παρουσιάζει αρνητική κλίση. Πάνω από την καμπύλη m και το m αυξάνεται ενώ κάτω από την καμπύλη m και το m μειώνεται. Το διάγραμμα που αντιστοιχεί σε αυτή την ανάλυση είναι το ΙΙ.4.. 6

Θα συμπληρωθεί.. ΣΧΗΜΑ ΙΙ.4. Δεδομένου ότι το πρόβλημα χαρακτηρίζεται από άπειρο χρονικό ορίζοντα και είναι αυτόνομο αναζητείται το σημείο σταθερής κατάστασης (seady sae) δηλαδή το σημείο όπου m ή ισοδύναμα αναζητούμε τη λύση του συστήματος των εξισώσεων (4.8) και (4.3). Από το σχετικό διάγραμμα φαίνεται ότι υπάρχει μοναδικό μονοπάτι που συνδέει το σημείο με το σημείο σταθερής κατάστασης m. s m s Προκειμένου να αποδειχθεί αυτό παίρνουμε τους γραμμικούς όρους της προσέγγισης aylor του δεξιού μέλους των σχέσεων (4.) και (4.7) στο σημείο s m s και προκύπτει το εξής b m Οι χαρακτηριστικές ρίζες είναι gm m m s P r bm s k r s s m s s r b 4gm P s s. Δεδομένου ότι g και P οι ρίζες είναι πραγματικές και εφόσον το υπόριζο είναι μεγαλύτερο του r η μικρότερη από αυτές είναι αρνητική. Επιπρόσθετα το άθροισμα τους είναι r άρα θετικό συνεπώς η μεγαλύτερη ρίζα είναι θετική. Συμπερασματικά προκύπτει ότι υπάρχει σαγματικό μονοπάτι που περνά από το σταθερό σημείο που είναι σαγματικό. Γραφικά αν s το σημείο σταθερής κατάστασης προσεγγίζεται μονότονα με αύξηση του και μείωση του m. Δεδομένου ότι τα m έχουν θετική σχέση (βλ. σχέση (4.6)) έχουμε ταυτόχρονα πτώση του δηλαδή των επενδύσεων. Επιπρόσθετα μπορούμε να κάνουμε συγκριτική στατική ανάλυση. Για παράδειγμα μια αύξηση του προεξοφλητικού επιτοκίου r μετακινεί την καμπύλη m προς τα κάτω αριστερά και αφήνει άθικτη την με αποτέλεσμα τη μείωση του κεφαλαίου s του των επενδύσεων s. m s άρα και 7

Συγκριτική δυναμική ανάλυση είναι η ανάλυση μεταβολών στο βέλτιστο μονοπάτι και όχι μόνο στο σημείο σταθερής κατάστασης λόγω αλλαγών των παραμέτρων ενός προβλήματος. Στο παράδειγμα το οποίο αναλύεται θα εξετασθεί η επίδραση της ανόδου του r από r σε r στο βέλτιστο μονοπάτι ενώ προηγουμένως εξετάστηκε το αποτέλεσμα της ίδιας μεταβολής στο σημείο σταθερής κατάστασης. Η διαγραμματική απεικόνιση της ανάλυσης που ακολουθεί αντιστοιχεί στο σχήμα ΙΙ.4.. Καταρχήν έστω m και m s s Θα συμπληρωθεί... ΣΧΗΜΑ ΙΙ.4. s s το αρχικό και τελικό σταθερό σημείο αντίστοιχα. Σαν πρώτη παρατήρηση βλέπει κανείς ότι δεν είναι δυνατό να υπάρχει τομή των σαγματικών μονοπατιών που αντιστοιχούν στα r και r μεταξύ αρχικού και τελικού σταθερού σημείου. Επιπλέον έστω m το σημείο τομής των μονοπατιών αριστερά του m s s. Από το διάγραμμα φαίνεται ότι η κλίση του βέλτιστου μονοπατιού που αντιστοιχεί στο r στο σημείο τομής είναι μεγαλύτερη του μονοπατιού που αντιστοιχεί στο r. Η κλίση του μονοπατιού είναι dm d r bm P gm b m. Στο σημείο τομής τα b m είναι κοινά για τα δύο μονοπάτια με αποτέλεσμα η σχέση των κλίσεων των δύο μονοπατιών να απαιτεί r r ενώ έχει γίνει η υπόθεση r r στην αρχή της ανάλυσης. Αρα τα δύο μονοπάτια δεν είναι δυνατό να τέμνονται και εκείνο που αντιστοιχεί στο r βρίσκεται κάτω από αυτό που αντιστοιχεί στο r. Συνοπτικά αύξηση του προεξοφλητικού επιτοκίου μειώνει το κεφάλαιο και τις επενδύσεις στο σημείο σταθερής κατάστασης και μεταβάλλει το σαγματικό μονοπάτι προς τα κάτω αριστερά. ανάλογο σκεπτικό μπορούν να εξεταστούν οι επιπτώσεις μεταβολών του συντελεστή απόσβεσης b της συνάρτησης οριακού κέρδους P και του οριακού κόστους Με C. 8

ΚΕΦΑΛΑΙΟ 5 Μεταβλητές ελέγχου με περιορισμούς Οι μεταβλητές ελέγχου είναι δυνατό να υπόκεινται σε περιορισμό όπως στο πρόβλημα Ma f d (5.) Οπου g (5.) a b (5.3) και επιπλέον απουσία περιορισμού αντιπροσωπεύει την περίπτωση όπου b. a - ή Εστω J είναι η τιμή του ολοκληρώματος στην (5.) στο οποίο προστίθεται ο περιορισμός (5.) με πολλαπλασιαστή. Η παράσταση που προκύπτει ολοκληρώνεται κατά μέρη και υπολογίζεται η πρώτη μεταβολή με τον ίδιο τρόπο που έγινε σε προηγούμενα κεφάλαια δηλαδή f g f g d J (5.4) Επιλέγουμε το έτσι ώστε να ικανοποιείται η συνθήκη f g (5.5) με συνέπεια η (6.4) να γίνει J f g d (6.6). Δεδομένου ότι J J J όπου J είναι η μέγιστη τιμή της (6.) και J είναι τυχαία τιμή της (5.) έχουμε f g d J. (5.7) Η σχέση (5.7) πρέπει να ισχύει για όλες τις μεταβολές του ελέγχου ο οποίος βέβαια είναι απαραίτητο να ικανοποιεί τον περιορισμό (5.3). Ετσι αν a για κάποιο για οποιαδήποτε αλλαγή του ελέγχου πρέπει. Αν b με το ίδιο σκεπτικό. Συνοπτικά αν a αν b (5.8) αδέσμευτο αν a b. 9

Συνεπώς λόγω των σχέσεων (5.7) (5.8) αν αν αν a πρέπει f g στο b πρέπει f g στο (5.9) a b πρέπει f g στο. Ισοδύναμα με τις σχέσεις (5.9) ισχύουν f f f g a g b (5.) g a b Συνοπτικά αν υπάρχουν συναρτήσεις που ικανοποιούν τις (5.) ως (5.3) πρέπει να υπάρχει συνάρτηση ώστε να ικανοποιούνται οι σχέσεις (5.) (5.3) (5.5) και (5.9). Αυτές οι αναγκαίες συνθήκες μπορούν να εκφρασθούν με τη βοήθεια της Χαμιλτονιανής g H f. Συγκεκριμένα οι συνθήκες (5.9) ισοδυναμούν με μεγιστοποίηση της H με περιορισμό Ma a b. Εξάγουμε λοιπόν το πρόβλημα H f g με τον περιορισμό Η αντίστοιχη συνάρτηση Lagrange είναι g w b w a L f. a b. L Οι αναγκαίες συνθήκες είναι f g w w. w w b w w b a Οι συνθήκες (5.4)-(5.6) είναι ισοδύναμες με τις σχέσεις (5.9). Για παράδειγμα αν a b οπότε η (5.5) συνεπάγεται ότι w. Άρα η (5.4) δίνει συνθήκες είναι f g w. Εφόσον δε w f g. Επομένως a αν f g σύμφωνα και με την πρώτη σχέση της (5.9).

Παράδειγμα ΙΙ.5. Έστω το πρόβλημα προγραμματισμού παραγωγής Mn c c d Οπου B Η Χαμιλτονιανή είναι έχουμε τη συνάρτηση Lagrange H c c με. Με μεταβλητή Lagrange w L H w c c w με w w. Η ικανοποιεί τη σχέση c c ενώ ο βέλτιστος ρυθμός παραγωγής βρίσκεται από τη σχέση H L w c w c. c Εξετάζουμε πρώτα την περίπτωση όπου για όλο το διάστημα w και L c c. Είναι τότε ενώ το πρέπει να είναι αρνητικό εφόσον ή. Το προσδιορίζεται από το ζητούμενο c c d B c και άρα cb c. Για να είναι το θα πρέπει cb c B B 4c c c c. Άρα αν ο στόχος παραγωγής είναι υψηλός η παραγωγή θα είναι πάντοτε θετική και αυξανόμενη γραμμικά για να επιτευχθεί ο στόχος της μικρής αποθεματοποίησης. Σε περίπτωση όμως μικρού στόχου παραγωγής είναι εύλογο να καθυστερήσει η έναρξη της παραγωγής για διάστημα έστω. Δοκιμάζουμε λοιπόν λύση της μορφής Για να είναι στο πρέπει επίσης πρέπει. w θα είναι c και άρα w c w c και εφόσον c c. Στο είναι

. c c Έτσι ο όλος υπολογισμός ανάγεται στην εύρεση του c c. c Πρέπει πάλι B d 4c άρα cb cb c c. Το είναι θετικό λόγω της συνθήκης του μικρού στόχου παραγωγής c B c και άρα η λύση είναι αποδεκτή. Η διάρκεια παραγωγής είναι cb c και σχετίζεται θετικά με το στόχο παραγωγής το κόστος παραγωγής και αρνητικά με το κόστος αποθεματοποίησης. Παρατηρούμε ότι η λύση αυτή δε μπορεί να προκύψει αν λύσουμε το πρόβλημα χωρίς περιορισμό βρούμε το σημείο όπου ~ και παράγουμε στο ~. Το σημείο αυτό αντιστοιχεί σε ~ ~ c ~ c με c c c B οπότε ~ cb. c Έτσι π.χ αν B c αλλά c 6 και 3 8 8 ενώ ~ 3. Διαισθητικά η λύση χωρίς περιορισμό παράγει 6 4 8 αρνητικό απόθεμα και χρειάζεται νωρίτερα έναρξη παραγωγής για αντιστάθμισμα. (βλ. σχήμα ΙΙ.6.) Θα συμπληρωθεί... ΣΧΗΜΑ ΙΙ.6.

ΚΕΦΑΛΑΙΟ 6 Η αρχή του μεγίστου του Ponryagn Η αρχή του μεγίστου του Ponryagn γενικά τίθεται διαφορετικά από ότι έχει χρησιμοποιηθεί ως τώρα. Η μορφή που χρησιμοποιήσαμε είναι ορθή μόνο κάτω από πιο περιοριστικές συνθήκες σε σχέση με αυτές που χρειάζονται γενικά. Σε αυτό το κεφάλαιο θα δώσουμε την αρχή του μεγίστου του Ponryagn στη γενική μορφή της και θα επισημανθούν οι διαφορές με τη μορφή που έχουμε χρησιμοποιήσει ως τώρα. Το πρόβλημα τίθεται ως εξής:... m Να βρεθεί διάνυσμα συνεχές κατά τμήματα και το αντίστοιχο συνεχές και παραγωγίσιμο κατά τμήματα διάνυσμα κατάστασης... με πεδίο ορισμού και Ma f m έτσι ώστε d (6.) Οπου g = n (6.) = n (6.3) = p (6.4) U όπου U σύνολο που ανήκει στο Επιίσης υποθέτουμε ότι οι συναρτήσεις f τις μεταβλητές τους για... n j... n. Θεώρημα Προκειμένου τα =p+ q (6.5) ελεύθερο =q+ n (6.6) m R. (6.7) f g j g j είναι συνεχείς ως προς όλες να είναι βέλτιστα για το παραπάνω πρόβλημα είναι απαραίτητο να υπάρχει σταθερά και συνεχείς συναρτήσεις... και n όπου για ισχύει διάφορο του H H (6.8) 3

n Η Χαμιλτονιανή ορίζεται ως H f g. (6.9) Επίσης εκτός από σημεία ασυνέχειας της συνάρτησης ελέγχου H... n. (6.) Επιπλέον ή και ικανοποιούνται οι συνθήκες ransversaly ελεύθερο... p (= αν q... n. Οι διαφορές μεταξύ αυτής της προσέγγισης ) p... q έχουμε και εκείνης που αναπτύχθηκε στα προηγούμενα κεφάλαια αναλύονται παρακάτω. Καταρχήν το είναι ή ενώ στα προηγούμενα κεφάλαια θέταμε υποθέτοντας ότι το πρόβλημα έχει λύση στην οποία η αντικειμενική συνάρτηση παίζει ρόλο. Υπάρχουν όμως προβλήματα όπου η βέλτιστη λύση απαιτεί. Θα εξακολουθήσουμε όμως να κάνουμε την υπόθεση ότι. Επιπρόσθετα ο έλεγχος ορίζεται στο σύνολο U που ανήκει στο m R και είναι δυνατό να είναι ολόκληρος ο ευκλείδιος χώρος ή ένα γνήσιο υποσύνολό του. Επομένως ο βέλτιστος έλεγχος μπορεί να δοθεί μόνο έμμεσα. Αν κάποιος εξειδικεύσει το U και γνωρίζει κάποια στοιχεία για τις συναρτήσεις... n τότε είναι δυνατό χρησιμοποιώντας το θεώρημα Khn-cker να εξάγει συμπεράσματα για το βέλτιστο f g. Τέλος δεν έχει θιγεί το ζήτημα ικανών συνθηκών για την ύπαρξη λύσης σε προβλήματα βελτίστου ελέγχου. Έτσι αν οι συναρτήσεις f είναι συνεχείς και φραγμένες με φραγμένες παραγώγους και η συνάρτηση f αυστηρά κοίλη ως προς τις μεταβλητές ελέγχου και οι συναρτήσεις τους ελέγχους τότε είναι δυνατό να δειχθεί αν υπάρχει λύση. g g είναι γραμμικές ως προς 4

ΚΕΦΑΛΑΙΟ 7 Δυναμικός προγραμματισμός Μια τρίτη προσέγγιση προβλημάτων δυναμικής βελτιστοποίησης εκτός του λογισμού μεταβολών και βελτίστου ελέγχου είναι ο δυναμικός προγραμματισμός που αναπτύχθηκε από τον Rchard Bellman. Η βασική αρχή του δυναμικού προγραμματισμού (αρχή του βελτίστου) είναι ότι στο βέλτιστο μονοπάτι για οποιεσδήποτε αρχικές συνθήκες και μεταβλητές ελέγχου κάποιας αρχικής περιόδου οι μεταβλητές ελέγχου πρέπει να είναι βέλτιστες για το πρόβλημα στο υπόλοιπο της περιόδου. Για το τελευταίο οι μεταβλητές κατάστασης προκύπτουν από τις μεταβλητές καταστασης και ελέγχου της αρχικής περιόδου. Ετσι θεωρούμε ότι το πρόβλημα έχει ως εξής Ma f d (7.) Οπου g. (7.) Ορίζουμε τη συνάρτηση βέλτιστης τιμής (opmal vale fncon) J ως την καλύτερη τιμή του συναρτησιακού που μπορεί να επιτευχθεί για αρχική συνθήκη. Επομένως έχουμε ότι J Προφανώς ισχύει ma f d (7.3) όπου g. (7.4) J. (7.5) (7.6) Από την (8.3) έχουμε J ma f d f d όπου το Δ είναι μικρός θετικός αριθμός. Με βάση την αρχή του δυναμικού προγραμματισμού η μεταβλητή ελέγχου για είναι βέλτιστη για το πρόβλημα που αρχίζει την περίοδο με μεταβλητή κατάστασης. Η τελευταία εξαρτάται από την κατάσταση και τον έλεγχο κατά την περίοδο όπου και συγκεκριμένα είναι g 5

ma J f d ma f d Αλλά ο δεύτερος όρος εντός των αγκυλών είναι αυτό που ορίστηκε ως J g. (7.7) Άρα J ma f d J g. (7.8) Δηλαδή η τιμή του συναρτησιακού στην περίοδο είναι το μέγιστο άθροισμα των των τιμών του στις περιόδους και επιλογή του ελέγχου περιορίζεται στο διάστημα υπόλοιπο διάστημα ενσωματώθηκε στο J g. Το σημαντικό εδώ είναι ότι η καθώς η επιλογή για το. Αν προσεγγίσουμε τον πρώτο όρο του δεξιού μέλους της εξίσωσης με το γινόμενο του ύψους της καμπύλης f με το πλάτος διαστήματος και λάβουμε την προσέγγιση aylor του δεύτερου όρου της εξίσωσης υποθέτοντας ότι είναι δύο φορές συνεχώς παραγωγίσιμη έχουμε J ma f J J J g O (7.9) Ο τελευταίος όρος συγκεντρώνει τους όρους δεύτερης τάξης. Εδώ πρέπει να επισημανθεί ότι η (8.9) προυποθέτει συνεχή Ιακωβιανή μήτρα του J. Οι όροι δεύτερης τάξης παραβλέπονται και αν απαλείψουμε το J διαιρέσουμε με και θεωρήσουμε ότι η (8.9) γίνεται ma f J J J J g ma f (7.) όπου ο δείκτης έχει αφαιρεθεί για λόγους απλούστευσης και το έχει αντικατασταθεί από το ίσο του g. Η (7.) συναπάγεται ότι J ma f J g (7.). Αυτή είναι η μερική διαφορική εξίσωση Hamlon-Jacob-Bellman (και Καραθεοδωρή) που ισχύει 6

για τη συνάρτηση βέλτιστης τιμής J. Παρατηρούμε ότι το μέγιστο λαμβάνεται ως προς το στιγμιαίο έλεγχο ως προς το στο! Επίσης παρατηρούμε ότι το δεξιό μέλος της (7.) που μεγιστοποιείται ως προς ταυτίζεται με τη Χαμιλτονιανή f g αν H συναρτησιακού λόγω μεταβολής της μεταβλητής κατάστασης J δηλαδή η οριακή μεταβολή του ισούται με το. Αυτό όμως έχει αποδειχθεί ότι ισχύει προηγούμενα. Επομένως η μεγιστοποίηση του δεξιού μέλους της (8.) ταυτίζεται με τη μεγιστοποίηση της Χαμιλτονιανής με τη χρήση της σχέσης H f g. Ακόμη αν παραγωγίσουμε την (7.) ως προς J f J g J g (7.). Η παράγωγος του dj d dj d d d dj d d d J J J J Χρησιμοποιώντας τις σχέση J και (7.3) παίρνουμε J ως προς είναι g f g H f g. (7.3) Συμπερασματικά ο δυναμικός προγραμμοατισμός είναι δυνατό να χρησιμοποιηθεί για την εξαγωγή των αναγκαίων συνθηκών βελτιστοποίησης του βελτίστου ελέγχου. Παράδειγμα II.7. Να λυθεί το πρόβλημα Mn a b e r d (7.4) Οπου k. (7.5) Η (7.) γίνεται J a b J k r mn e. (7.6) Η ελαχιστοποίηση ως προς δίνει r J e be J b r οπότε η (7.) γίνεται J e r a e r J b 4 b J J e b b r 7

J ae r r e J 4b r e J J b ή τελικά J b r Δοκιμάζουμε λύση της μορφής και αντικαθιστώντας στην (7.7) έχουμε ae r J Ae. Τότε είναι J r e J 4b J r rae b (7.7). J Ae r rae r ae r r e 4b r r 4 A e b Ae και διαιρώντας με rae ae r e 4 A e 4b b Ae r r r r e r A A ra a ba r ba a (7.8) b b J Ae r Άρα αν επιλεγεί ένα A που ικανοποιεί την παραπάνω σχέση η μορφή ικανοποιεί την εξίσωση Hamlon-Jacob-Bellman (HJB). Η (7.8) λύνεται ως προς Α και δίνει ρίζες r b r b 4a b b. Από τις δύο ρίζες πρέπει να επιλέξουμε τη θετική εφόσον το συναρτησιακό έχει πάντοτε r 4a Παρατηρούμε επιπλέον ότι το b θετική τιμή. Άρα A b r b b. αρχικό σύστημα b ελέγχεται από ένα που αποτελεί γραμμική ανάδραση (lnear feedback). Συγκεκριμένα είναι J e b r Ae r r e b A b και το όλο σύστημα γίνεται A b b r b 4a b r b ευσταθές.. Για r το σύστημα είναι 8

ΑΣΚΗΣΕΙΣ ΛΟΓΙΣΜΟΣ ΜΕΤΑΒΟΛΩΝ ΚΕΦΑΛΑΙΟ. Να βρεθεί και να λυθεί η εξίσωση Eler για την παράσταση d όπου 3 4.. Να βρεθεί και να λυθεί η εξίσωση Eler χωρίς να υπολογιστούν οι σταθερές ολοκλήρωσης για το b a d όπου a A b B F α. F 3 8 β. F. και 3. Να βρεθεί το πρόγραμμα κατανάλωσης C προεξοφλημένη χρησιμότητα r e C a d απόθεμα κεφαλαίου. όπου C K K K K K που μεγιστοποιεί την a και K είναι το 4. Να βρεθούν συναρτήσεις χωρίς να υπολογιστούν οι σταθερές ολοκλήρωσης που βελτιστοποιούν το συναρτησιακό F d όπου α. F F 4 β. και 9

F 3 γ. δ. F ln F 3 ε. F e. στ. 5. Υποθέστε ότι ορυχείο περιέχει ποσό B μεταλλεύματος (π.χ κάρβουνο). Το κέρδος από την πώληση του ορυκτού με ρυθμό είναι ln. Να βρεθεί ο ρυθμός πώλησής του την περίοδο ώστε να μεγιστοποιείται η παούσα αξία του κέρδους του ορυχείου υποθέτοντας ότι το προεξοφλητικό επιτόκιο είναι σταθερό και ίσο με r και το μετάλλευμα δεν έχει αξία μετά το χρόνο. Υποθέστε επίσης ότι το ποσό που έχει πουληθεί σωρευτικά μέχρι την περίοδο είναι y άρα ο ρυθμός πωλήσεων είναι y. ΚΕΦΑΛΑΙΟ 3. Ν βρεθούν οι συνθήκες πρώτης και δεύτερης τάξης που λύνουν το πρόβλημα Ma r e U C d όπου K w C K K K και K K. ( r :προεξοφλητικό επιτόκιο U :χρησιμότητα με U και U C :κατανάλωση :επιτόκιο δανεισμού K :απόθεμα κεφαλαίου w :μισθοί ).. α. Να βρεθούν οι συναρτήσεις που βελτιστοποιούν με βάση τις συνθήκες πρώτης τάξης την παράσταση a b d (.) όπου a b σταθερές. β. Δείξτε ότι αν b μόνο το ελαχιστοποιεί την παράσταση και δεν υπάρχει συνάρτηση που τη μεγιστοποιεί. a γ. Δείξτε ότι το ακρότατο είναι ελάχιστο αν b. 3

a δ. Υποθέστε ότι b. Βρείτε συνάρτηση που ελαχιστοποιεί το συναρτησιακό b d όπου. Πώς αυτή η συνάρτηση διαφέρει από εκείνη που βελτιστοποιεί την παράσταση (.); Μπορεί να υποστηριχθεί ότι η βέλτιστη συνάρτηση για τη (.) δίνει ελάχιστο; ΚΕΦΑΛΑΙΟ 4. Να βρεθούν ακρότατα για το d όπου d.. Να ελαχιστοποιηθεί το b d όπου d c b b c. ΚΕΦΑΛΑΙΟ 5 Να βρεθούν οι συναρτήσεις που βελτιστοποιούν την παράσταση: d όπου και ελεύθερα. ΚΕΦΑΛΑΙΟ 6. Έστω B η συνολική ποσότητα κάποιου μη ανανεώσιμου πόρου π.χ μεταλλεύματος σε ορυχείο ο οποίος ελέγχεται από μονοπωλητή που προεξοφλεί με ρυθμό r και μεγιστοποιεί την παρούσα αξία των κερδών από το ορυχείο. Επίσης έστω ποσότητα που έχει πουληθεί μέχρι την περίοδο και καθαρή τιμή αφού αφαιρεθεί το κόστος εξόρυξης είναι py. συνεχώς παραγωγίσιμη με p y y η y ο ρυθμός πωλήσεων. Η και υποθέτουμε ότι είναι α. Έστω ο χρόνος εξάντλησης του πόρου. Να επιλεγούν τα y και ώστε να μεγιστοποιείται η παράσταση 3

e r p y y d όπου y() = y()=b. y. Επίσης να δειχθεί ότι ο βέλτιστος ρυθμός πωλήσεων μειώνεται διαχρονικά με β. Να δειχθεί ότι στην τελική περίοδο το μέσο κέρδος ανά εξορυσσόμενη μονάδα ισούται με το οριακό κέρδος. γ. Να λυθεί το πρόβλημα αν py e y ky όπου k και σταθερό. δ. Εστω ότι η καθαρή τιμή εξαρτάται από το συνολικό ποσό που έχει εξορυχθεί εκτός από το ρυθμό παραγωγής γιατί π.χ η εξόρυξη γίνεται πιο ακριβή όσο το κοίτασμα εξαντλείται. Συγκεκριμένα υποθέστε ότι py y a by cy a b c θετικές σταθερές. Να βρεθεί το πρόγραμμα πωλήσεων που μεγιστοποιεί την παρούσα αξία του κέρδους. Οι σταθερές ολοκλήρωσης και το μπορούν να εκφραστούν ως λύση ενός συστήματος εξισώσεων.. Να βρεθούν οι συναρτήσεις για τις οποίες η παράσταση έχει ακρότατα όπου αν α. Το σημείο d βρίσκεται στην ευθεία 5 β. Το σημείο βρίσκεται στον κύκλο 9 9. 3. Να βρεθούν οι συνθήκες ransversaly για το πρόβλημα βελτιστοποίησης του F d G όπου στην περίπτωση που ισχύουν: α. Q β. P. 4. Έστω ένα ερευνητικό πρόγραμμα στο οποίο υπάρχουν φθίνουσες αποδόσεις δαπάνης δηλαδή όσο ταχύτερα ξοδεύονται χρήματα τόσο λιγότερο συμβάλλουν στη συνολική 3

προσπάθεια. Επίσης είναι ο ρυθμός δαπανών και z συμβολίζει τη σωρευτική προσπάθεια που καταβλήθηκε μέχρι το χρόνο. Ακόμη z z z A όπου είναι ο χρόνος ολοκλήρωσης του προγράμματος. Επιπλέον αμοιβή R A λαμβάνεται από τους εκτελεστές του προγράμματος με την περάτωσή του. (Η αμοιβή μπορεί να είναι τα κέρδη που απορρέουν από μια εφεύρεση ή η αξία μιας άδειας ευρεσιτεχνίας που λαμβάνεται ως αποτέλεσμα ενός ερευνητικού επιτεύγματος κ.λ.π). Όλα τα μεγέθη προεξοφλούνται με επιτόκιο r. Να υπολογιστούν τα z που μεγιστοποιούν την καθαρή παρούσα αξία του ερευνητικού προγράμματος καθώς και η συνθήκη η ισχύς της οποίας συνεπάγεται τη σκοπιμότητα ανάληψής του. ΚΕΦΑΛΑΙΟ 7 Να λυθεί το πρόβλημα mn α) d όπου ελεύθερο. 3 Υπόδειξη Η λύση της εξίσωσης Eler είναι όπως και στο αντίστοιχο παράδειγμα που δίνεται στο κείμενο Ae e οριακή συνθήκη είναι να υπάρχει αλλά λόγω της Ae Ae. Η 3 ώστε H F και. Εξετάστε αν ισχύει η συνθήκη αν το A επιλεγεί έτσι ώστε πρέπει για κάποιο. Θα 3 Ae A e. Επιπλέον πρέπει H ή στο. 3 Υπολογίστε τα A και εξετάστε αν το β) ελεύθερο. F έχει το κατάλληλο πρόσημο (μη θετικό). ΚΕΦΑΛΑΙΟ 8 Να βρεθούν τα ακρότατα του προβλήματος 33

4 4 mn d όπου 4 τα οποία εμφανίζουν μόνο ένα ακρότατο. ΚΕΦΑΛΑΙΟ 9 mn 5 4 d όπου 5 6 Να βρεθεί το βέλτιστο εισοδηματικός περιορισμός.. και να συγκριθεί με εκείνο που προκύπτει αν αγνοηθεί ο ΚΕΦΑΛΑΙΟ Να βρεθούν τα ακρότατα για τα παρακάτω προβλήματα με δεδομένο αρχικό και τελικό σημείο: α. y y d β. y y d γ. y y d ΒΕΛΤΙΣΤΟΣ ΕΛΕΓΧΟΣ ΚΕΦΑΛΑΙΟ. Έστω το πρόβλημα λογισμού μεταβολών που συνίσταται στην επιλογή συνεχώς παραγωγίσιμης συνάρτησης () τέτοιας ώστε να έχουμε Ma f d όπου. () Το αντίστοιχο πρόβλημα βελτίστου ελέγχου είναι 34

Ma f d όπου. () Να δεχθεί ότι οι αναγκαίες συνθήκες βελτιστοποίησης στο πρόβλημα () df ισοδυναμούν με τις αναγκαίες συνθήκες του () δηλαδή f και f στο. d. Να λυθεί το πρόβλημα Mn a b c d με τους περιορισμούς '() = () () = o δεδομένο () ελεύθερο c>.. 3. Να λυθεί το πρόβλημα 5 Ma d με τους περιορισμούς '()=()+() ()=. 4. Να λυθεί το πρόβλημα Mn d με τους περιορισμούς '()=()+() ()=. 5. Να λυθεί το πρόβλημα mn d Όπου. 6. Να δειχθεί ότι δεν υπάρχει λύση στο πρόβλημα ma d με τους περιορισμούς '=+ ()= ()=. ΚΕΦΑΛΑΙΟ 3 35

. Να λυθεί το πρόβλημα Ma d Όπου y y y y.. Ν βρεθεί το συντομότερο μονοπάτι που συνδέει τον κύκλο και την ευθεία. ΚΕΦΑΛΑΙΟ 4. Για το παράδειγμα που αναλύθηκε στο κείμενο υποθέστε ότι P c a και C λύστε την άσκηση και συγκρίνετε τα συμπεράσματά σας με εκείνα που εξάγονται στο κείμενο.. Η χρησιμότητα είναι αύξουσα συνάρτηση της κατανάλωσης C και φθίνουσα συνάρτηση της ρύπανσης P. Για C P ισχύουν U U lm U C CC C C U P U PP lm PU P U. Το σταθερό προιόν C κατανέμεται μεταξύ κατανάλωσης και ελέγχου της ρύπανσης. Η κατανάλωση αυξάνει τη ρύπανση ενώ ο έλεγχος της ρύπανσης τη μειώνει. CP Z C είναι η καθαρή συνεισφορά της κατανάλωσης στη ρύπανση με Z C και C Z. Για χαμηλό C λίγη ρύπανση παράγεται και πολλή ρύπανση καταπολεμάται με συνέπεια να έχουμε μείωση τελικά της ρύπανσης δηλαδή Z C ίδια λογική Z C. Έστω. Όταν το C είναι ψηλό με την C κατανάλωση τέτοια ώστε Z C. Επιπλέον το περιβάλλον απορροφά κατανάλωση με σταθερό ρυθμό b. Να υπολογίσετε την κατανάλωση διαχρονικά έτσι ώστε να μεγιστοποιείται η προεξοφλημένη χρησιμότητα: e r U C P d όπου 36

P ZC bp P P C C P. Επίσης να βρεθεί το αντίστοιχο μονοπάτι ρύπανσης και το σημείο σταθερής κατάστασης. ΚΕΦΑΛΑΙΟ 5. Να βρεθεί η συνάρτηση ελέγχου Ma 3 d Όπου 5 που λύνει το πρόβλημα ελεύθερο.. Το εισόδημα ενός ατόμου είναι ανάλογο του γινομένου του ανθρωπίνου κεφαλαίου του K και του ποσοστού του χρόνου του που διαθέτει για εργασία. Το ανθρώπινο κεφάλαιο απαξιώνεται με σταθερό ρυθμό b και είναι αύξουσα κοίλη συνάρτηση του κεφαλαίου και του ποσοστού χρόνου που διαθέτει για εκπαίδευση. Να αναλυθεί το πρόγραμμα εκπαίδευσης και εργασίας που μεγιστοποιεί το αναμενόμενο εισόδημα σε χρονικό ορίζοντα της ζωής του ατόμου δηλαδή να λυθεί το πρόβλημα: r ma e s Kd όπου K AsK a bk K K s A a b. 3. Να βρεθεί συνάρτηση τέτοια ώστε να ελαχιστοποιείται το c c d όπου B και. ΚΕΦΑΛΑΙΟ 7 Να λυθεί με τη μέθοδο του δυναμικού προγραμματισμού το πρόβλημα: Mn c c d 37

Όπου B. h J a b k όπου a b (Σημείωση: Να δοκιμαστεί η λύση της μορφής 3 h k είναι σταθερές που πρέπει να προσδιοριστούν). Επίσης να συγκριθεί η λύση με τις λύσεις που προέκυψαν με άλλες μεθόδους δυναμικής βελτιστοποίησης σε προηγούμενα κεφάλαια. 38