Διάλεξη 1: 08.10.2014 Θεωρία Γραμμικού Προγραμματισμού Γραφέας: Σ. Κ. Διδάσκων: Σταύρος Κολλιόπουλος 1.1 Γραμμική και αφινική ανεξαρτησία Τα διανύσματα x 1,..., x t R n, καλούνται γραμμικά ανεξάρτητα αν t λ j x j = 0, λ 1,..., λ t R λ 1 =... = λ t = 0. j=1 Το σύνολο L R n είναι γραμμικός υπόχωρος αν x, y L, λ 1, λ 2 R, ισχύει ότι λ 1 x + λ 2 y L. Πολλές φορές, θα λέμε απλά «γραμμικός χώρος». Παράδειγμα 1.1 Για κάθε A R m n, το σύνολο {x R n Ax = 0} είναι γραμμικός υπόχωρος. Ορισμός 1.1 Δοθέντος X R n, το γραμμικό κάλυμα (linear hull) του X ορίζεται ως span(x) = { t λ j x j t 0, x 1,..., x t X,, λ 1,..., λ t R}. j=1 Τα διανύσματα x 1,..., x t R n, καλούνται αφινικά ανεξάρτητα (affinely independent) αν t t λ j x j = 0, λ 1,..., λ t R, λ j = 0 λ 1 =... = λ t = 0. j=1 j=1 Το σύνολο L R n είναι αφινικός υπόχωρος αν x, y L, λ R, ισχύει ότι λx + (1 λ)y L. Πολλές φορές, θα λέμε απλά «αφινικός χώρος» ή «αφινικό σύνολο». Παράδειγμα 1.2 Για κάθε A R m n, b R m, το σύνολο {x R n Ax = b} είναι αφινικός υπόχωρος. Κάθε γραμμικός υπόχωρος είναι και αφινικός. Το αντίστροφο δεν ισχύει. Στον ορισμό του αφινικού υπόχωρου χρησιμοποιήσαμε μια ειδική περίπτωση γραμμικού συνδυασμού. Αφινικός συνδυασμός (affine combination) των x 1,..., x t R n, καλείται κάθε διάνυσμα της μορφής λ 1 x 1 +... + λ t x t, λ 1,..., λ t R, t λ j = 1. Προσέξτε τη διαφορά ανάμεσα στους ορισμούς της αφινικής ανεξαρτησίας και του αφινικού συνδυασμού. Στην πρώτη περίπτωση, οι συντελεστές αθροίζουν στο 0, στη δεύτερη στο 1. j=1 1-1
Διάλεξη 1: 08.10.2014 1-2 aff({x 1, x 2 }) x 2 x 1 O O Σχήμα 1.1: Το αφινικό κάλυμα των x 1, x 2 είναι ανεξάρτητο από την αρχή των αξόνων O ή O. Ορισμός 1.2 Δοθέντος X R n, το αφινικό κάλυμα (affine hull) του X ορίζεται ως t aff(x) = { λ j x j t 1, x 1,..., x t X, λ 1,..., λ t R, j=1 t λ j = 1}. j=1 Διαισθητικά, στους αφινικούς συνδυασμούς, μας είναι αδιάφορη η αρχή των αξόνων. Το αποτέλεσμα δεν αλλάζει αν κανείς μετατοπίσει τα διανύσματα, προσθέτοντας σε όλα το ίδιο διάνυσμα b. Π.χ., το αφινικό κάλυμα δύο σημείων x 1, x 2 R 2, x 1 x 2, είναι η ευθεία που ορίζουν τα δύο σημεία. Πιο συγκεκριμένα, για οποιοδήποτε λ R, (1 λ)x 1 + λx 2 = λ(x 2 x 1 ) + x 1. Επιβεβαιώστε ότι το παραπάνω άθροισμα δεν εξαρτάται από το ποιο σημείο επιλέγουμε ως αρχή των αξόνων. Βλέπε Σχήμα 1.1. Το σχήμα αυτό χρησιμεύει και ως παράδειγμα του πώς μπορεί κανείς να ενσωματώσει μαθηματικές εντολές του L A TEX σε ένα σχήμα. Οι επόμενες δύο προτάσεις εμβαθύνουν στην έννοια της αφινικής ανεξαρτησίας. αφήνεται σαν άσκηση. Η απόδειξη τους Πρόταση 1.1 Εστω x 1,..., x t R n αφινικά ανεξάρτητα διανύσματα και w R n. Τα διανύσματα x 1 + w,..., x t + w είναι απίσης αφινικά ανεξάρτητα. Θεώρημα 1.1 Τα διανύσματα x 1,..., x t R n είναι αφινικά ανεξάρτητα αν και μόνο αν τα διανύσματα x 2 x 1,..., x t x 1, είναι γραμμικά ανεξάρτητα. Ενα παράδειγμα εφαρμογής του Θεωρήματος 1.1 βρίσκεται στο Σχήμα 1.2. Το ίδιο σχήμα αποτελεί παράδειγμα του πώς μπορεί κανείς να ενσωματώσει εικόνες σε μορφή pdf στο L A TEX. Σε αυτό το μάθημα, μας ενδιαφέρουν οι αφινικοί χώροι, και όχι μόνο οι γραμμικοί, για τον ίδιο λόγο που μας ενδιαφέρουν συστήματα εξισώσεων της μορφής Ax = b, και όχι μόνο τα ομογενή συστήματα Ax = 0.
Διάλεξη 1: 08.10.2014 1-3 x 2 x 2 x 1 x 2 x 3 x 2 x 1 x 1 x 3 x 1 x 3 x 1 x 3 x 1 Σχήμα 1.2: Τα διανύσματα x 1, x 2, x 3 είναι αφινικά ανεξάρτητα. Figure 3: Affine independence dim. 1 dim. 3 dim. 2 dim. 0 Σχήμα 1.3: Κάποια παραδείγματα Figure συνόλων 4: Dimensions στο R 3 και η διάσταση τους. Dimension: Def.: the dimension of a set S IR n,denotedbydim(s), is the maximal number of affinely independent points in S minus 1. Η αφινική ανεξαρτησία είναι ο σωστός τρόπος να ορίσουμε τη διάσταση ενός συνόλου διανυσμάτων (σημείων). Note: OK for subspace (just add the origin) Affine hull and simplex: Ορισμός 1.3 Η διάσταση ενός συνόλου S R n, συμβολίζεται dim(s), και ορίζεται ως ο μέγιστος αριθμός αφινικά ανεξάρτητων σημείων του S μείον 1. Def.: given S IR n,letc be the set of combinations t j=1 λjx j where t j=1 λ j =1(nosignrestrictionoftheλ s). Then C is an affine set containing S, anditisthesmallestaffine set with this property. C is called the affine hull of S. Στο Σχήμα 1.3 δίνονται κάποια παραδείγματα συνόλων 5 στο R 3 και η διάσταση τους. 1.2 Κυρτά σύνολα, κώνοι, πολύεδρα Κυρτός συνδυασμός (convex combination) των x 1,..., x t R n, καλείται κάθε διάνυσμα της μορφής λ 1 x 1 +... + λ t x t, λ 1,..., λ t R +, t λ j = 1. j=1 Ορισμός 1.4 Δοθέντος X R n, το κυρτό κάλυμα (convex hull) του X ορίζεται ως t conv(x) = { λ j x j t 1, x 1,..., x t X, λ 1,..., λ t R +, j=1 t λ j = 1}. j=1 Ενα σύνολο C R n, καλείται κυρτό αν για κάθε x, y C, λ R, 0 λ 1, ισχύει λx+(1 λ)y C. Αποδεικνύεται εύκολα πως το conv(x) είναι το ελαχιστικό κυρτό σύνολο που περιέχει το X.
Διάλεξη 1: 08.10.2014 1-4 Παράδειγμα 1.3 Εστω A R m n, b R m. Τα σύνολα {x R n Ax = b} και {x R n Ax b} είναι κυρτά. Επίσης η μοναδιαία μπάλα B n = {x R n x 1} είναι κυρτό σύνολο. Κωνικός συνδυασμός (conic combination) των x 1,..., x t R n, καλείται κάθε διάνυσμα της μορφής λ 1 x 1 +... + λ t x t, λ 1,..., λ t 0. Ορισμός 1.5 Δοθέντος X R n, το κωνικό κάλυμα (conic hull) του X ορίζεται ως t cone(x) = { λ j x j t 1, x 1,..., x t X, λ 1,..., λ t 0}. j=1 Ορισμός 1.6 Ενα σύνολο C R n, καλείται κώνος αν για κάθε x, y C, λ R, λ 1, λ 2 0, ισχύει λ 1 x + λ 2 y C. Καμιά φορά χρησιμοποιούμε τον όρο «κυρτός κώνος», αν και όπως δείχνει η επόμενη πρόταση είναι πλεονασμός. Πρόταση 1.2 Κάθε κώνος είναι κυρτό σύνολο. Παράδειγμα 1.4 Εστω A R m n. Το σύνολο {x R n Ax 0} είναι κώνος. Ορισμός 1.7 Για t 1, x 1,..., x t R n, ο κώνος cone({x 1,..., x t }) καλείται πεπερασμένα παραγόμενος (finitely generated). Για A R m n, ο κώνος {x R n Ax 0} καλείται πολυεδρικός. Αργότερα θα δούμε πως οι δύο έννοιες, πεπερασμένα παραγόμενος κώνος και πολυεδρικός συμπίπτουν. Ο χαρακτηρισμός πολυεδρικός πηγάζει από τον παρακάτω ορισμό. Ορισμός 1.8 Πολύεδρο είναι ένα σύνολο της μορφής {x R n Ax b}, A R m n, b R n.
Θεωρία Γραμμικού Προγραμματισμού Διάλεξη 2: 14.10.2014 Διδάσκων: Σταύρος Κολλιόπουλος Γραφείς: Κατερίνα Δρόσου, Γιώργος Παπαδημητρίου 2.1 Πολύεδρα Ορισμός 2.1. Δοθέντος διανύσματος a R n με a 0 και b R καλούμε: 1. Υπερεπίπεδο (hyperplane) ένα σύνολο της μορφής {x R n a T x = b}. 2. Ημίχωρο (halfspace) ένα σύνολο της μορφής {x R n a T x b}. x a x. a T x = b a T x = 0 Σχήμα 2.1: Το διάνυσμα a είναι κάθετο στο υπερεπίπεδο που ορίζει. Στο σχήμα 2.1 τα x, x είναι διανύσματα των οποίων η διαφορά είναι κάθετη στο διάνυσμα a (a T x = a T x a T (x x ) = 0). Πρόταση 2.1. Κάθε πολύεδρο είναι κυρτό σύνολο. Πρόταση 2.2. Κάθε ημίχωρος είναι πολύεδρο Πρόταση 2.3. Κάθε υπερεπίπεδο είναι κι αυτό πολύεδρο (ως τομή δύο ημιχώρων). 2.2 Γραμμικό Πρόγραμμα Ένα πρόβλημα της μορφής: min c T x, Ax b με A R m n, b R m και c R n, καλείται Γραμμικό Πρόγραμμα (LP). 2-1
Διάλεξη 2: 14.10.2014 2-2 Η τομή των περιορισμών ενός LP ορίζουν ένα πολύεδρο. LP σε πρότυπη μορφή ( standard form) καλείται ένα γραμμικό πρόγραμμα της μορφής min c T x, Ax = b x 0. 2.2.1 Μετατροπή Γραμμικού Προγράμματος σε Πρότυπη Μορφή Για την μετατροπή ενος LP σε πρότυπη μορφή (μετατροπή περιορισμών από ανισότητες σε ισότητες), πρέπει να προσθέσουμε μία μεταβλητή (slack variable) σε κάθε ανίσωση και να επιβάλουμε κάθε μεταβλητή να είναι 0. Δηλαδή οι ανισότητες n j=1 a ijx j b i μετατρέπονται σε n j=1 a ijx j s i = b i και προστίθεται ένας περιορισμός για κάθε slack μεταβλητή: s i 0. 2.3 Θεώρημα Καραθεοδωρή Θεώρημα 2.1. Έστω ένα σύνολο S R n. Κάθε x conv(s) μπορεί να γραφεί ως κυρτός συνδυασμός m ( n + 1) αφινικά ανεξάρτητων σημείων του S. y. x z 1 2 x 3 5 4 d b S x. x a c e Πίνακας 2.1: Παραδείγματα σημείων. - κυρτοί συνδυασμοί (Θ. Καραθεοδωρή) Παρατήρηση 2.1.. Στο R n, n+2 ή παραπάνω σημεία είναι πάντα αφινικά εξαρτημένα. Διότι, αν x 1, x 2,..., x n, x n+1, x n+2 αφινικά ανεξάρτητα, τότε x 2 x 1,..., x n+1 x 1, x n+2 x 1 γραμμικά ανεξάρτητα. Απόδειξη. Έστω x conv(s) λ 1,..., λ t > 0 με t j=1 λ j = 1 τ.ω. x = λ 1 x 1 + + λ t x t και x 1,..., x t S. Αν x 1,..., x t αφινικά ανεξάρτητα ισχύει.
Διάλεξη 2: 14.10.2014 2-3 Αν x 1,..., x t αφινικά εξαρτημένα, δηλαδή µ 1,..., µ t με j µ j = 0 και t j=1 µ j = 0 τ.ω. t µ j x j = 0 j=1 Παρατηρούμε ότι τουλάχιστον ένα από τα µ j πρέπει να είναι θετικό. Έστω χβτγ το µ 1 > 0. Διαλέγουμε a 0 και γράφουμε: x = t (λ j aµ j )x j. j=1 Όταν το a = 0, έχουμε τον αρχικό κυρτό συνδυασμό. Αυξάνουμε το a σταδιακά, μέχρι κάποιο λ j aµ j να γίνει 0 για πρώτη φορά. Έστω συμβαίνει αυτό για a = a 0. Επίσης, j : λ j a 0 µ j 0. Οπότε: x = t j=1 (λ j a 0 µ j )x j (αφού j µ jx j = 0). Όλοι οι συντελεστές του γραμμικού συνδυασμού είναι 0 και t (λ j a 0 µ j ) = j=1 t λ j a 0 j=1 t µ j = 1 Επαναλαμβάνουμε την παραπάνω διαδικασία μέχρι τα x 1,..., x t να είναι αφινικά ανεξάρτητα. j=1 Θεώρημα 2.2. Έστω ένα σύνολο S R n. Για x cone(s), υπάρχει λ 1,..., λ m 0, m n, x 1,..., x m S τ.ω. x = m j=1 λ jx j, x 1,..., x m S, x 1,..., x m γραμμικά ανεξάρτητα. 2.4 Ακραία Σημεία, Κορυφές Ορισμός 2.2. Έστω πολύεδρο P. Ένα σημείο x P καλείται ακραίο σημείο (extreme point) του P αν y, z P με y, z x και λ [0, 1], τ.ω. x = λy + (1 λ)z. Στο πολύεδρο του Σχήματος 2.4, τα κυκλωμένα είναι ακραία σημεία. Παρατηρούμε ότι δεν υπάρχουν σημεία z, y που να ανήκουν στο πολύεδρο και το x να είναι κυρτός συνδυασμός αυτών. Ένα σύνολο S R n καλείται φραγμένο αν σταθερά k τ.ω. x S x k. Πολύτοπο καλείται ένα φραγμένο πολύεδρο. Θα αποδείξουμε αργότερα ότι: Πρόταση 2.4. Κάθε πολύτοπο είναι το κυρτό κάλυμμα των ακραίων σημείων του. Δεν ισχύει το ίδιο για τα πολύεδρα. Ορισμός 2.3. Έστω P R n πολύεδρο. Ένα σημείο x P καλείται κορυφή (vertex) του P αν c R n τ.ω. y P, y x : c T x < c T y.
Διάλεξη 2: 14.10.2014 2-4 P x. Σχήμα 2.2: Extreme Point P. (a) (b) (c) (d) Σχήμα 2.3: Παραδείγματα πολυέδρων: τα (a) και (b) πολύτοπα, τα (c) και (d) πολύεδρα.. x c P c T x = 0 c T x = z Σχήμα 2.4: Στην κορυφή x βελτιστοποιείται η αντικειμενική συνάρτηση c T x
Θεωρία Γραμμικού Προγραμματισμού Διάλεξη 3: 15.10.2014 Διδάσκων: Σταύρος Κολλιόπουλος Γραφείς: Κατερίνα Δρόσου, Γιώργος Παπαδημητρίου 3.1 Ακραία Σημεία - Αλγεβρικός Ορισμός Έστω ένα σύνολο P R n και a i R n, b i R τ.ω. a T i x b i, i M 1, a T i x b i, i M 2, a T i x = b i, i M 3, όπου τα M 1, M 2, M 3 είναι πεπερασμένα σύνολα δεικτών. Ορισμός 3.1. Έστω x R n μία λύση που ικανοποιεί τον περιορισμό a T i x = b i για κάποιο i M 1 M 2 M 3, ο αντίστοιχος περιορισμός καλείται ενεργός (active) στο x. Θεώρημα 3.1. Έστω μία λύση x R n προτάσεις είναι ισοδύναμες: και το σύνολο I = {i a T i x = b i }. Οι παρακάτω 1. Υπάρχουν n διανύσματα στο {a i i I} τα οποία είναι γραμμικά ανεξάρτητα. 2. Ο γραμμικός υπόχωρος span i I {a i } είναι ο R n. 3. Το σύστημα a T i x = b i, i I, έχει μοναδική λύση. Απόδειξη: Το ότι η πρόταση (1) ισοδυναμεί με την πρόταση (2) είναι προφανές. Θα δείξουμε ότι το (2) ισοδυναμεί με το (3). Αν δεν ισχύει το (3) τότε δεν ισχύει το (2), διότι: Αν το σύστημα έχει λύσεις τις x 1, x 2 με x 1 x 2, τότε: ορίζουμε d = x 1 x 2 και a T i (x1 x 2 ) = 0, i I. Άρα d a i, i I. Άρα d span i I {a i }. Αν δεν ισχύει το (2) τότε δεν ισχύει το (3), διότι: Αν span i I {a i } R n, δηλαδή span i I {a i } R n, διαλέγουμε d 0 κάθετο στον υπόχωρο. Αν a T i x = b i, i I, τότε a T i ( x + b) = b i, i I. Δηλαδή το συτημα έχει πολλαπλές λύσεις, άρα δεν ισχύει το (3). Επομένως δείξαμε ότι και το (3) είναι ισοδύναμο με το (2). Παρατήρηση 3.1. Θα λέμε ότι οι περιορισμοί είναι γραμμικά ανεξάρτητοι, αν τα αντίστοιχα διανύσματα συντελεστών a i είναι γραμμικά ανεξάρτητα. 3-1
Διάλεξη 3: 15.10.2014 3-2 Παράδειγμα για την έννοια του ενεργού περιορισμού: x 3 A E. C x 1 x 2 Έστω το πολύεδρο του σχήματος, P = {(x 1, x 2, x 3 ) x 1 + x 2 + x 3 = 1 με x 1, x 2, x 3 0}. Στο σημείο C έχουμε 3 ενεργούς περιορισμούς: x 1 + x 2 + x 3 = 1, x 1 = 0 και x 3 = 0. Στο σημείο E έχουμε 2 ενεργούς περιορισμούς: x 1 + x 2 + x 3 = 1 και x 2 = 0. Ορισμός 3.2. Έστω πολύεδρο P R n x R n. Τότε: που ορίζεται από ισότητες και ανισότητες. Έστω 1. Η λύση x καλείται βασική λύση (β.λ.) αν (αʹ) όλες οι ισότητες είναι ενεργές (στο x ). (βʹ) από όλους τους ενεργούς περιορισμούς, n εξ αυτών είναι γραμμικά ανεξάρτητοι. 2. Η λύση x καλείται βασική εφικτή λύση (β.ε.λ.) αν είναι βασική και επιπλέον x P. Παράδειγμα 3.1. Στο σχήμα τα A, B, C, D, E, F είναι β.λ. ενώ (μόνο) τα C, D, E, F β.ε.λ. A B D P C E F. Σχήμα 3.1: Παράδειγμα β.λ. και β.ε.λ.
Διάλεξη 3: 15.10.2014 3-3 Θεώρημα 3.2. Έστω ένα πολύεδρο P R n, με P και x P. Οι παρακάτω προτάσεις είναι ισοδύναμες: 1. x είναι κορυφή του P 2. x είναι ακραίο σημείο του P. 3. x είναι β.ε.λ. Απόδειξη: Χωρίς βλάβη της γενικότητας υποθέτουμε ότι το P ορίζεται από περιορισμούς της μορφής a T i x b i και a T i x = b i. α): (1) (2) Έστω x κορυφή του P. Υπάρχει c R n τ.ω. c T x < c T y, y P και y x. Αν y P, z P, y x, z x με 0 λ 1. Θα δείξουμε ότι το x δεν είναι κυρτός συνδυασμός των y, z. Άρα το x ακραίο σημείο. β): (2) (3) c T x < c T y c T x < c T z. } ct x < c T (λy + (1 λ)z) x λy + (1 λ)z. Έστω x δεν είναι β.ε.λ. Θα δείξουμε ότι δεν είναι ακραίο σημείο. Έστω το σύνολο I = {i a T i x = b i }. Αφού x δεν είναι β.ε.λ. αυτό σημαίνει ότι span{a i i I} R n. Τότε θα υπάρχει d R n με d 0 τ.ω. a T i d = 0, i I. Έστω ε > 0 ένας «μικρός» αριθμός. Ορίζουμε y = x +εd και z = x εd. Έχουμε επίσης ότι το x είναι μεταξύ των y και z, αφού x = y+z 2. Δηλαδή το x είναι κυρτός συνδυασμός των y και z. Αρκεί να δείξουμε ότι τα δύο αυτά σημεία ανήκουν κι αυτά στο P (άρα το x όχι ακραίο σημείο). Διακρίνουμε δύο περιπτώσεις. Για τα i I: a T i y = at i (x + εd) = a T i x = b i = a T i z. Αν i I, έχουμε: a T i x > b i, οπότε a T i y = at i (x + εd) = a T i x + a T i εd. Άρα για "μικρό" ε, a T i y > b i. Άρα το y P. Ομοίως και z P. γ): (3) (1) Έστω x β.ε.λ. Ορίζουμε και πάλι το σύνολο I = {i a T i x = b i }. Επίσης έστω c = i I a i. Έχουμε: c T x = a T i x = b i (3.1) i I i I Επίσης, x P, ισχύει a T i x b i οπότε: c T x = a T i x b i (3.2) i I i I
Διάλεξη 3: 15.10.2014 3-4 Άρα από τις (3.1) και (3.2) προκύπτει ότι η x είναι η βέλτιστη λύση στο πρόβλημα: min {c T x x P }. (3.3) Μένει να δείξουμε ότι το x είναι και μοναδικό. Η σχέση (3.2) ισχύει με ισότητα ανν a T i x = b i, i I και αφού x β.ε.λ., υπάρχουν n γραμμικά ανεξάρτητοι ενεργοί περιορισμοί στο x. Άρα από Θεώρημα 3.1 το x μοναδική λύση στο σύστημα a T i x = b i. Πόρισμα 3.1. Το πολύεδρο P = {x R n Ax b}, A R m n β.ε.λ. έχει πεπερασμένο αριθμό Απόδειξη: Σε κάθε β.ε.λ. αντιστοιχούν n γραμμικά ανεξάρτητοι περιορισμοί που ικανοποιούνται με ισότητα. Οποιοιδήποτε n τέτοιοι ορίζουν ένα μοναδικό σημείο. Επομένως διαφορετικές βασικές λύσεις αντιστοιχούν σε διαφορετικές n-άδες γραμμικά ανεξάρτητων περιορισμών. Άρα έχουμε το πολύ ( m n) βασικές εφικτές λύσεις. Δύο διακεκριμένες β.λ. στο R n καλούνται γειτονικές αν n 1 γραμμικά ανεξάρτητοι περιορισμοί είναι ενεργοί και στις δύο. Παρατήρηση 3.2. Ο Αλγόριθμος Simplex, αυτό που κάνει είναι να επισκέπτεται γειτονικές βασικές εφικτές λύσεις για να βρει την βέλτιστη. Στο Σχήμα 3.1 οι κορυφές D, E είναι γειτονικές στην B και οι A, C γειτονικές στην D.
Διάλεξη 4: 21.10.2014 Θεωρία Γραμμικού Προγραμματισμού Διδάσκων: Σταύρος Κολλιόπουλος Γραφείς: Ζακυνθινού Λυδία & Τζιώτης Ισίδωρος 4.1 Βασικές λύσεις σε πολύεδρα πρότυπης μορφής Θα μελετήσουμε τη μορφή των βασικών λύσεων σε πολύεδρα που βρίσκονται στην πρότυπη μορφή. Υπενθυμίζουμε ότι η πρότυπη μορφή ενός πολυέδρου P ορίζεται ως εξής: P = {x R n Ax = b, x 0}, όπου A R m n, b R m Από εδώ και στο εξής θα λειτουργούμε υπό την υπόθεση ότι οι m γραμμές του πίνακα A είναι γραμμικά ανεξάρτητες ή ισοδύναμα ο βαθμός του A είναι m, δηλαδή rank(a) = m (full row rank hypothesis). Η παραπάνω υπόθεση δεν είναι περιοριστική ως προς τα στιγμιότυπα που εξετάζουμε και αυτό εξασφαλίζεται από το παρακάτω θεώρημα. Θεώρημα 4.1 Εστω μη κενό πολύεδρο P = {x R n Ax = b, x 0}, όπου A R m n με γραμμές a T 1, at 2,..., at m. Εστω, επίσης, rank(a) = k < m και οι γραμμικά ανεξάρτητες γραμμές είναι οι a T i 1, a T i 2,..., a T i k. Θεωρούμε πολύεδρο Q := {x R n a T i j x = b ij, j = 1,..., k, x 0}. Τότε P = Q. Απόδειξη: Ισχύει P Q αφού το Q έχει λιγότερους περιορισμούς. Αρκεί να δείξουμε ότι Q P. Γνωρίζουμε ότι κάθε γραμμή του πίνακα A μπορεί να γραφεί ως γραμμικός συνδυασμός των γραμμικά ανεξάρτητων γραμμών του, δηλαδή = k λ ij a T i j, i {1,..., m}. (4.1) a T i j=1 Εστω σημείο x P. Το x ικανοποιεί τους περιορισμούς του P δηλαδή i {1,..., m}, b i = a T i x (4.1) = ( k λ ij a T i j )x = k λ ij b ij. (4.2) Εστω σημείο y Q. i {1,..., m}, Άρα y P. a T i y = ( k j=1 j=1 λ ij a T i j )y y Q = k j=1 j=1 λ ij b ij (4.2) = b i. Παρατήρηση 4.1 Προφανώς m n αφού οι m το πλήθος γραμμές είναι γραμμικά ανεξάρτητα διανύσματα στο R n άρα δε μπορεί να είναι περισσότερα από n. 4-1
Διάλεξη 4: 21.10.2014 4-2 Από την υπόθεση που κάναμε, το Ax = b προμηθεύει m γραμμικά ανεξάρτητους περιορισμούς. Χρειαζόμαστε ακόμα n m τέτοιους ώστε να ορίσουμε βασική λύση. Δηλαδή τουλάχιστον n m περιορισμοί από αυτούς της μορφής x 0 είναι ενεργοί. Το παρακάτω θεώρημα μας καθοδηγεί ως προς τον τρόπο επιλογής τους. Θεώρημα 4.2 Εστω το σύστημα Ax = b, x 0, A R m n με rank(a) = m. Ενα διάνυσμα x R n είναι βασική λύση ανν ικανοποιεί την Ax = b και υπάρχουν δείκτες B(1),..., B(m) τέτοιοι ώστε: (i) Οι στήλες A B(1),..., A B(m) είναι γραμμικά ανεξάρτητες. (ii) Αν i B(1), B(2),..., B(m), τότε x i = 0. Απόδειξη: ( =) Εστω x R n για το οποίο ισχύει Ax = b και έστω δείκτες B(1),..., B(m) που ικανοποιούν τις συνθήκες (i) και (ii). Πρέπει να δείξουμε ότι το x είναι βασική λύση. Πράγματι, ισχύει: m i=1 x B(i) A B(i) (ii) = n x i A i = Ax = b, i=1 όπου η τελευταία ισότητα ισχύει από την υπόθεση. Αφού οι στήλες A B(1),..., A B(m) είναι γραμμικά ανεξάρτητες ( συνθήκη (i) ), ο τετραγωνικός πίνακας που σχηματίζουν είναι αντιστρέψιμος. Επομένως, τα x B(i) για i = 1,..., m, είναι μοναδικά. Επιπλέον, λόγω της συνθήκης (ii), και τα υπόλοιπα x i ορίζονται μοναδικά. Επομένως, υπάρχουν n ενεργοί περιορισμοί των οποίων το σύστημα έχει μοναδική λύση. Άρα από το Θεώρημα 3.1 οι n αυτοί ενεργοί περιορισμοί είναι γραμμικά ανεξάρτητοι, δηλαδή το x είναι βασική λύση αφού ικανοποιεί και τις δύο συνθήκες του Ορισμού 3.2. (= ) Εστω x βασική λύση. Τότε προφανώς από τον ορισμό θα ικανοποιεί τους περιορισμούς ισότητας, δηλαδή Ax = b. Πρέπει ακόμα να δείξουμε ότι υπάρχουν δείκτες B(1),..., B(m) που ικανοποιούν τις συνθήκες (i) και (ii). Εστω x B(1),..., x B(k) οι μη μηδενικές συνιστώσες του x. Αφού λοιπόν η x είναι βασική λύση, από τους ενεργούς περιορισμούς n i=1 x i A i = b και x i = 0 για i B(1),..., B(k) τουλάχιστον n είναι γραμμικά ανεξάρτητοι άρα έχουν και μοναδική λύση (βλ. Θεώρημα 3.1). Ισοδύναμα, το σύστημα k x B(i) A B(i) = b έχει μοναδική λύση. i=1 Ισχυρισμός 4.1 Οι στήλες A B(1),..., A B(k) είναι γραμμικά ανεξάρτητες. Απόδειξη: Εστω ότι δεν είναι. Τότε υπάρχουν συντελεστές λ 1,..., λ k όχι όλοι μηδέν τέτοιοι ώστε k λ i A B(i) = 0. Άρα k (x B(i) + λ i )A B(i) = b + 0 = b άρα το σύστημα δεν έχει μοναδική λύση. i=1 Άτοπο. i=1
Διάλεξη 4: 21.10.2014 4-3 Ισχύει λοιπόν k m, αφού οι k γραμμικά ανεξάρτητες στήλες είναι διανύσματα του R m επομένως δε μπορεί να είναι περισσότερα από m το πλήθος. Ομως ο A έχει m γραμμικά ανεξάρτητες στήλες λόγω της full rank hypothesis και του βασικού θεωρήματος της άλγεβρας που υποδηλώνει ότι το πλήθος των γραμμικά ανεξάρτητων γραμμών ενός πίνακα είναι ίσο με το πλήθος των γραμμικά ανεξάρτητων στηλών. Επομένως, υπάρχουν m k πρόσθετες στήλες A B(k+1),..., A B(m) τέτοιες ώστε οι A B(1),..., A B(k), A B(k+1),..., A B(m) να είναι γραμμικά ανεξάρτητες. Δηλαδή ισχύει η συνθήκη (i) για αυτούς του δείκτες. Επίσης ισχύει x i = 0 για i B(1),..., B(m), αφού x i = 0 για i B(1),..., B(k) και k m. Δηλαδή, ισχύει και η συνθήκη (ii). 4.2 Αλγόριθμος εύρεσης βασικών λύσεων Το Θεώρημα 4.2 μας βοηθά στην κατασκευή του παρακάτω αλγορίθμου εύρεσης βασικών λύσεων. Αλγόριθμος 1. Διάλεξε m γραμμικά ανεξάρτητες στήλες B(1),..., B(m). 2. Θέσε x i = 0 για i B(1),..., B(m). 3. Λύσε το (m m) σύστημα m x B(i) A B(i) = b. i=1 Αν ο παραπάνω αλγόριθμος επιστρέψει x 0 τότε έχουμε βασική εφικτή λύση. Αντιστρόφως κάθε βασική εφικτή λύση τελικά θα προκύψει από τον αλγόριθμο. Παρότι ο αλγόριθμος δεν είναι αποδοτικός, μπορεί να χρησιμοποιηθεί στην εύρεση κορυφών. 4.3 Βάση και βασικές μεταβλητές Ορισμός 4.1 Οι μεταβλητές x B(1),..., x B(m) του Θεωρήματος 4.2 ονομάζονται βασικές (basic) ενώ οι υπόλοιπες μη βασικές (non basic). Ορισμός 4.2 Ο πίνακας B που σχηματίζεται από τις στήλες A B(1),..., A B(m) του Θεωρήματος 4.2 ονομάζεται βάση ή βασικός πίνακας (basis matrix). Παρατήρηση 4.2 Ο B είναι αντιστρέψιμος ως τετραγωνικός πίνακας με γραμμικά ανεξάρτητες στήλες. Άρα ισχύει Bx B = b όπου x B, το διάνυσμα των βασικών μεταβλητών. Δηλαδή τελικά x B = B 1 b. Παρατήρηση 4.3 Ισχύει η ισοδυναμία x(ax = b x 0) b cone(a 1,..., A n ). Προφανώς οι συντεταγμένες x i παίζουν το ρόλο των συντελεστών λ i του κωνικού συνδυασμού.
Διάλεξη 4: 21.10.2014 4-4 Παράδειγμα 4.1 Στο Σχήμα 4.1 η βάση περιλαμβάνει m = 2 στήλες. Με χρήση της Παρατήρησης 4.3 συμπεραίνουμε ότι μόνο οι βάσεις {A 1, A 4 } και {A 2, A 4 } δίνουν βασικές εφικτές λύσεις γιατί το b ανήκει στο κωνικό τους κάλυμμα. Ολες οι υπόλοιπες (εκτός της {A 1, A 3 } που δε χρησιμεύει για βάση γιατί τα διανύσματα είναι συγγραμμικά) δίνουν μη εφικτές βασικές λύσεις. A 4 n = 4 m = 2 b A 1 A 2 A 3 Σχήμα 4.1: Επιλογή βάσεων που δίνουν εφικτές λύσεις.
Διάλεξη 5: 22.10.2014 Θεωρία Γραμμικού Προγραμματισμού Διδάσκων: Σταύρος Κολλιόπουλος Γραφείς: Ζακυνθινού Λυδία & Τζιώτης Ισίδωρος 5.1 Εκφυλισμένες βασικές λύσεις Ορισμός 5.1 Εστω πολύεδρο P = {x Ax b} και έστω το υποσύστημα A = x b = του οποίου οι περιορισμοί ικανοποιούνται με ισότητα για κάθε σημείο x P. Οι περιορισμοί αυτοί ονομάζονται έμμεσες ισότητες του συστήματος. Στη συνέχεια θα θεωρούμε ότι στα συστήματα που θα μελετήσουμε δεν υπάρχουν έμμεσες ισότητες. Πρόταση 5.1 Εστω διαφορετικές βασικές λύσεις x 1, x 2. επίσης διαφορετικές. Το αντίστροφο δεν ισχύει γενικά. Τότε οι αντίστοιχες βάσεις B 1, B 2 είναι Ορισμός 5.2 Μία βασική λύση x R n καλείται εκφυλισμένη αν περισσότεροι από n περιορισμοί είναι ενεργοί στο x. n = 2 D P E C Σχήμα 5.1: Οι C, D είναι εκφυλισμένες και η E μη εκφυλισμένη βασική λύση. Παρατήρηση 5.1 Εστω πολύεδρο P = {x R n Ax = b, x 0}, A R m n, και x μία βασική λύση. Η x είναι εκφυλισμένη βασική λύση αν περισσότερες από n m συντεταγμένες του x είναι μηδέν. Δηλαδή υπάρχουν βασικές μεταβλητές που είναι μηδέν. 5-1
Διάλεξη 5: 22.10.2014 5-2 Παράδειγμα 5.1 Εστω πολύτοπο P σε πρότυπη μορφή με n = 6, m = 4 και άρα n m = 2. x 3 = 0 A x 6 = 0 x 4 = 0 B P x 5 = 0 x 2 = 0 x 1 = 0 Σχήμα 5.2: Πολύτοπο P στον R 6. Από το σχήμα προκύπτει ότι η διάσταση του πολυτόπου είναι 2. Παρατήρηση 5.2 Οι ανισότητες του συστήματος δεν επηρεάζουν τους αφινικούς συνδυασμούς. Δηλαδή aff(p ) = aff({x Ax = b, x 0}) = aff({x Ax = b}), όπως φαίνεται και από το παράδειγμα του Σχήματος 5.3. aff(p ) P Σχήμα 5.3: Παρότι το P είναι φραγμένο από ανισότητες, το αφινικό κάλυμα του P δεν επηρεάζεται από αυτές.
Διάλεξη 5: 22.10.2014 5-3 Παρατήρηση 5.3 Εστω P = {x R n Ax = b, x 0}. Η διάσταση dim(p ) είναι ίση με: max{#αφινικά ανεξάρτητων διανυσμάτων του P } 1 = (Ορισμός 1.3) max{#αφινικά ανεξάρτητων διανυσμάτων του {x Ax = b}} 1 = (Παρατήρηση 5.2) max{#γραμμικά ανεξάρτητων διανυσμάτων του {x Ax = 0}} = (Σχήμα 5.4) n rank(a) = n m (full rank hypothesis) x 2 x 1 x 2 x 1 Ax = b x 1 x 2 Ax = 0 Σχήμα 5.4: Παράδειγμα στο οποίο max{#αφ.ανεξ.διαν. του {x Ax = b}} 1 = 2 1 = max{#γρ.ανεξ.διαν. του {x Ax = 0}}. Άρα στο Παράδειγμα 5.1, η διάσταση του πολυτόπου είναι όντως n m = 2 όπως φαινόταν κι από το σχήμα. Το σημείο A του πολυτόπου είναι μη εκφυλισμένη βασική λύση γιατί έχει 2 n m συντεταγμένες στο 0, τις x 4 και x 5. Αυτές είναι και οι μη βασικές μεταβλητές της λύσης. Αντίθετα, το σημείο B είναι εκφυλισμένη βασική λύση αφού έχει 3 > n m συντεταγμένες στο 0, τις x( 1,) x 5 και x 6. Εδώ μπορούμε να διαλέξουμε οποιεσδήποτε δύο εξ αυτών ως μη βασικές, δηλαδή έχουμε 3 επιλογές για βάση. Βέβαια, δεν υπάρχει εγγύηση ότι θα είναι όλες οι πιθανές βάσεις και έγκυρες, 2 δηλαδή θα αποτελούνται από γραμμικά ανεξάρτητες στήλες. Πρόταση 5.2 Η ιδιότητα του εκφυλισμού εξαρτάται από την αλγεβρική αναπαράσταση του πολυτόπου. Για παράδειγμα, αν x είναι μία μη εκφυλισμένη βασική λύση του πολυτόπου P = {x Ax = b, x 0}, A R m n, τότε ακριβώς n m συντεταγμένες της είναι 0. Η ίδια λύση στο ίδιο πολύτοπο εκφρασμένο στη μορφή P = {x Ax b, Ax b, x 0} ικανοποιεί 2m + (n m) = n + m > n περιορισμούς με ισότητα, άρα από τον Ορισμό 5.2 είναι εκφυλισμένη.
Διάλεξη 5: 22.10.2014 5-4 5.2 Ακραία σημεία σε πολύεδρα Παρατήρηση 5.4 Υπάρχουν πολύεδρα χωρίς ακραία σημεία. Παράδειγμα 5.2 Νοτηινγ το σεε! 1. P = {x a T x = b} (ευθεία) 2. P = {x Ax b} Αν m < n τότε δεν ικανοποιούνται n γραμμικά ανεξάρτητοι περιορισμοί και ως άμεση συνέπεια του Θεωρήματος 3.2 το πολύτοπο δεν έχει ακραία σημεία. Ορισμός 5.3 Εστω πολύεδρο P R n. Το P περιέχει μία ευθεία αν υπάρχει σημείο x P και μη μηδενικό διάνυσμα d R n τέτοια ώστε: λ R, x + λd R x d O d Σχήμα 5.5: Παράδειγμα πολυτόπου του R 3 που περιέχει ευθεία, με σημείο x και διάνυσμα d τα αντίστοιχα του Ορισμού 5.3. P 1 P 2 Σχήμα 5.6: Το πολύεδρο P 1 δεν περιέχει ευθεία και το ίδιο ισχύει για το P 2 παρότι είναι μη φραγμένο.
Διάλεξη 5: 22.10.2014 5-5 Θεώρημα 5.1 Εστω μη κενό πολύεδρο P = {x R n a T i x b, i = 1,..., m} Τα ακόλουθα είναι ισοδύναμα : (i) Το P έχει τουλάχιστον ένα ακραίο σημείο. (ii) Το P δεν περιέχει ευθεία. (iii) Υπάρχουν n διανύσματα στο σύνολο {a 1,..., a m } τα οποία είναι γραμμικά ανεξάρτητα. Απόδειξη: (ii) = (i) Εστω x P, I = {i a T i x = b i} και A I = {a i }. i I Αν το A I περιέχει n γραμμικά ανεξάρτητα διανύσματα, τότε το x είναι β.ε.λ. και κατ επέκταση ακραίο σημείο. Αν το παραπάνω δεν ισχύει τότε έχουμε span(a I ) R n και άρα υπάρχει μη μηδενικό διάνυσμα d τέτοιο ώστε i I, a T i d = 0. Ορίζουμε ευθεία y = x + λd, λ R. Γνωρίζουμε ότι i I, a T i y = at i (x + λd) = at i x + λat i d = at i x = b i. Ομως αφού δεν υπάρχει ευθεία στο πολύεδρο P, μεταβάλλοντας κατάλληλα το λ θα παραβιάσουμε έναν περιορισμό (Σχήμα 5.7). Στην οριακή τιμή του λ κάποιος περιορισμός j γίνεται ενεργός έτσι ώστε a T j (x + λ d) = b j, j / I. (5.1) x a T j z = b j y = x + λ d Σχήμα 5.7: Ο περιορισμός a T j z = b j είναι ενεργός για το σημείο y = x + λ d της ευθείας. Ισχυρισμός 5.1 Το διάνυσμα a j / span(a I ). Απόδειξη: j / I a T j x b j. (5.2) Από τις (5.1) και (5.2) προκύπει a T j d 0. (5.3) Επομένως, αφού το διάνυσμα d είναι κάθετο στο span(a I ) το a j δεν μπορεί να ανήκει στο span(a I ) γιατί διαφορετικά η (5.3) δε θα ίσχυε. Επαναλαμβάνοντας την παραπάνω διαδικασία προσθέτουμε διαδοχικά νέους γραμμικά ανεξάρτητους ενεργούς περιορισμούς μέχρι το πλήθος τους να γίνει n, δίνοντας μας έτσι β.ε.λ., δηλαδή ακραίο σημείο. (i) = (iii) Προκύπτει με τετριμμένο τρόπο από τον ορισμό του ακραίου σημείου.
Διάλεξη 5: 22.10.2014 5-6 (iii) = (ii) Χωρίς βλάβη της γενικότητας θεωρούμε a 1,..., a n γραμμικά ανεξάρτητα και υποθέτουμε ότι υπάρχει ευθεία y = x + λd, d 0, τα σημεία της οποίας ανήκουν στο πολύεδρο λ R. Άρα i και λ R ισχύει a T i (x + λd) b i. (5.4) Αν a T i d > 0 η (5.4) θα παραβιάζεται για «πολύ αρνητικό» λ ενώ αντίστοιχα αν at i d < 0 η (5.4) θα παραβιάζεται για «πολύ θετικό» λ. Από τα παραπάνω προκύπτει ότι a T i d = 0 δηλαδή υπάρχει d 0 το οποίο είναι κάθετο στο span( n {a i }) άρα span( n {a i }) R n, ολοκληρώνοντας το άτοπο. i=1 i=1
Διάλεξη 6: 29.10.2014 Θεωρία Γραμμικού Προγραμματισμού Γραφέας: Γιαχούδης Νίκος Διδάσκων: Σταύρος Κολλιόπουλος 6.1 Ακραία Σημεία Πόρισμα 6.1 Κάθε μη κενό φραγμένο πολύεδρο και κάθε πολύεδρο σε πρότυπη μορφή έχουν τουλάχιστον ένα ακραίο σημείο. Το Πόρισμα 6.1 προκύπτει από το Θεώρημα 5.1. 6.2 Σχέση Βελτιστοποίησης και Ακραίων Σημείων Θεώρημα 6.1 Ορίζουμε γραμμικό πρόβλημα min{c T x x P }, με το P να είναι ένα πολύεδρο. Εστω το P έχει τουλάχιστον ένα ακραίο σημείο και έστω ότι υπάρχει βέλτιστη λύση. Τότε υπάρχει βέλτιστη λύση που είναι ακραίο σημείο του P. Απόδειξη: Εστω Q το σύνολο βέλτιστων λύσεων και Q. Εστω πολύεδρο P = {x R n Ax b}. Θέτουμε v = min x P ct x. Ετσι έχουμε Q = {x R n Ax b, c T x = v}. Άρα το Q είναι πολύεδρο και ισχύει ότι Q P Q. Άρα το Q δεν περιέχει ευθείες. Επομένως το Q έχει τουλάχιστον ένα ακραίο σημείο.
Διάλεξη 6: 29.10.2014 6-2 Εστω x είναι ακραίο σημείο του Q. Και έστω x δεν είναι ακραίο σημείο του P. Άρα y, z P, y x, z x, τέτοια ώστε x = λy + (1 λ)z με λ [0, 1]. Επομένως: Επίσης ξέρουμε ότι το v είναι βέλτιστο κόστος: v = c T x = λc T y + (1 λ)c T z (6.1) v c T y, v c T z (6.2) Από (6.1), (6.2) έχουμε: v = c T y = c T z y, z Q το οποίο είναι άτοπο γιατί x είναι ακραίο σημείο του Q. Άρα το x είναι ακραίο σημείο του P. Θεώρημα 6.2 Ορίζουμε γραμμικό πρόγραμμα min{c T x x P }, όπου το P είναι ένα πολύεδρο. Εστω ότι το P έχει τουλάχιστον ένα ακραίο σημείο. Τότε είτε το βέλτιστο κόστος είναι, είτε υπάρχει ακραίο σημείο του P το οποίο είναι βέλτιστη λύση. Απόδειξη: Λέμε ότι το x P έχει βαθμό (rank) k αν ακριβώς k γραμμικά ανεξάρτητοι περιορισμοί είναι ενεργοί στο x. Υποθέτουμε ότι το βέλτιστο κόστος είναι πεπερασμένο. Εστω πολύεδρο P = {x R n Ax b} και x P, τότε rank(x) = k < n. Ισχυρισμός 6.1 Θα δείξουμε ότι y P, τέτοιο ώστε rank(y) > rank(x) και c T y c T x Απόδειξη: Ορίζουμε I = {i a T i x = b i} Αφού k < n, το span{a i i I} R n, τότε d 0, τέτοιο ώστε a T i d = 0 i I. Χωρίς βλάβη της γενικότητας υποθέτουμε ότι c T d 0 (αν όχι θεωρούμε d := d). Περίπτωση Ι: c T d < 0 Εστω ημιευθεία y = x+λd, λ > 0, όλα τα σημεία της ημιευθείας ικανοποιούν a T i y = b i i I. Αν όλη η ημιευθεία ανήκει στο P τότε το c T y. Άρα λ > 0 και j / I, τέτοιο ώστε a T j (x + λ d) = b j και y = x + λ d, c T y < c T x. Περίπτωση ΙΙ: c T d = 0 Ομοίως, απλά στο τέλος θα έχουμε c T y = c T x. Αφού το P δεν περιέχει ευθείες για πολύ μεγάλο λ, το x + λ d, ή το x λ d θα «χτυπήσει» σε κάποιο καινούριο «τοίχωμα» a T j x = b j, j / I. Επαναλαμβάνουμε όσες φορές χρειάζεται για να βρούμε σημείο w, τέτοιο ώστε c T w c T x και rank(w) = n οπότε το w είναι βασική εφικτή λύση. Εστω w 1,..., w r είναι βασικές εφικτές λύσεις στο P και w = P w i, τέτοιο ώστε c T w i c T x. Επομένως c T w c T x, συνεπάγεται ότι το w είναι βέλτιστη λύση. arg min c T x. Δείξαμε ότι x x {w 1,...,w r }
Διάλεξη 6: 29.10.2014 6-3 Πόρισμα 6.2 Εστω γραμμικό πρόγραμμα min{c T x x P } με το P να είναι μη κενό πολύεδρο. Τότε είτε το βέλτιστο κόστος είναι, είτε υπάρχει βέλτιστη λύση. Το Πόρισμα 6.2 προκύπτει από το Θεώρημα 6.2, γιατί κάθε γραμμικό πρόγραμμα μπορεί να γραφεί σε πρότυπη μορφή, αυτό σημαίνει ότι το πολύεδρο θα έχει πάντα ακραία σημεία που είναι και εφικτές λύσεις. 6.3 Απαλοιφή Fourier - Motzkin Ζητάμε λύση για το Ax b, A R m lin. Εχουμε n μεταβλητές. Χωρίς βλάβη της γενικότητας μπορούμε να «πειράξουμε» τη σειρά των γραμμών του πίνακα A και φυσικά να κάνουμε την αντίστοιχη αλλαγή στο b. Κάνουμε μια ανακατανομή έτσι ώστε στις πρώτες m γραμμές το x 1 να έχει θετικούς συντελεστές, στις επόμενες m m γραμμές να έχει αρνητικούς συντελεστές και στις τελευταίες m m οι συντελεστές να είναι 0. Άρα το σύστημα Ax b θα είναι ισοδύναμο με: όπου οι συμβολισμοί είναι οι εξής: x := x 1 + (a i) T x b i, i {1,..., m } x 1 + (a i) T x b i, i {m + 1,..., m } (a i) T x b i, i {m + 1,..., m} x 2. x n για την πρώτη ανίσωση ορίζουμε το (a i )T ως 1 a i1 [a i2,..., a in ] για τη δεύτερη ορίζουμε το (a i )T ως 1 a i1 [a i2,..., a in ] και για την τρίτη ορίζουμε το (a i )T ως [a i2,..., a in ]. Οι παραπάνω ανισώσεις γράφονται ισοδύναμα ως εξής Ισοδύναμα θα έχουμε x 1 (a i) T x + b i, i {1,..., m } x 1 (a i) T x b i, i {m + 1,..., m } (a i) T x b i, i {m + 1,..., m} (a j) T x b j (a i) T x + b i, i {1,..., m }, j {m + 1,..., m } (a i) T x b i, i {m + 1,..., m} Ισοδύναμα (a j + a i) T x b i + b j, i {1,..., m }, j {m + 1,..., m } (a i) T x b i, i {m + 1,..., m}
Διάλεξη 6: 29.10.2014 6-4 Ετσι καταλήγουμε σε ένα καινούριο σύστημα της μορφής A x b, που είναι ισοδύναμο με το αρχικό. Εχουμε δηλαδή απαλείψει την μεταβλητή x 1. Μπορούμε να επαναλάβουμε τη διαδικασία και να απαλείψουμε όλες τις μεταβλητές εκτός από μία. Τότε μπορούμε να λύσουμε εύκολα το σύστημα. Βρίσκουμε τη λύση για τη μία μεταβλητή και μετά αντικαθιστούμε την τιμή της στα προηγούμενα συστήματα. Παρατήρηση 6.1 Σε κάθε στάδιο της απαλοιφής Fourier - Motzkin οποιαδήποτε από τις καινούριες ανισώσεις είναι γραμμικός συνδυασμός των αρχικών Ax b.
JewrÐa GrammikoÔ ProgrammatismoÔ Diˆlexh 7: 04.11.2014 Didˆskwn: StaÔroc Kolliìpouloc GrafeÐc: Zugom troc Euˆggeloc & Mpˆkac Dhm trioc 7.1 Apaloif Fourier - Motzkin To sôsthma Ax b mporeð na grafteð isodônama wc Ax b. Kˆje nèa isìthta eðnai grammikìc (kwnikìc) sunduasmìc twn arqik n anisot twn. x 1 x i1 x 2 An x =.. tìte x x i2 =. me k < n.. x n x ik Orismìc 7.1 'Estw P polôedro, me P R k+n. kai metablhtèc x 1,..., x n, y 1,..., y n. OrÐzoume proj x P = {x R n y R k tètoio ste (x, y) P }. Parˆdeigma 7.1 Me èna gôro thc apaloif c Fourier - Motzkin, upologðzoume thn probol proj (x1,...,x t){x R n Ax b} Genikˆ, h apaloif Fourier - Motzkin upologðzei thn probol tou arqikoô poluèdrou se opoiod pote uposônolo twn metablht n. 'Eqoume apodeðxei loipìn kataskeuastikˆ to ex c je rhma. 7-1
Diˆlexh 7: 04.11.2014 7-2 Je rhma 7.1 'Estw polôedro P R n+k. To sônolo proj x P eðnai ki autì èna polôedro. Je rhma 7.2 'Estw polôedro P R n kai A R m n ènac pðnakac. To sônolo Q = {Ax x P } eðnai epðshc polôedro (grammikìc metasqhmatismìc tou P ). Apìdeixh: 'Eqoume Q = {y R m x R n, Ax = y, x P }. }{{} Dhlad, Q = proj y {x, y R n+m Ax = y, x P }. Apì to Je rhma 7.1, to Q eðnai polôedro. polôedro To parapˆnw je rhma isqôei kai gia afinikoôc metasqhmatismoôc, me parìmoia apìdeixh. Je rhma 7.3 'Estw polôedro P R n kai A R m n ènac pðnakac. To sônolo Q = {Ax + b, b R m x P } eðnai epðshc polôedro. Apìdeixh: OrÐzoume Q = {y R m x R n, Ax + b = y, x P }. Q = proj y {x, y R n+m Ax + b = y, x P }. Apì to Je rhma 7.1, to Q eðnai polôedro. 7.2 L mmata Farkas 'Estw y R m kai A R m n. Tìte y T A = c T me c R n. 'Eqoume y T [ ] }{{} (1 m) A [ ] }{{} (m n) = ct [ ] }{{} (1 n) y T A = [y T A 1, y T A 2,..., y T A n ] ìpou A i h i-ost st lh tou pðnaka A. Enallaktikˆ, to y T A orðzei grammikì sunduasmì twn gramm n tou A. y T Ax = (y 1 A 11 + y 2 A 21 +... + y m A n1 )x 1 + (y 1 A 12 + y 2 A 22 +... + y m A n2 )x 2 +... + (y 1 A 1n + y 2 A 2n +... + y m A nn )x n 'Ara, gia y 0, h y T Ax y T b eðnai mia kainoôria anisìthta pou eðnai grammikìc (kwnikìc) sunduasmìc twn m anisot twn Ax b. Ax b èqei lôsh ann diˆ- Je rhma 7.4 (L mma Farkas gia anisìthtec) To sôsthma nusma y R m tètoio ste y 0, y T A = 0 T, y T b < 0.
Diˆlexh 7: 04.11.2014 7-3 Apìdeixh: EujeÐa kateôjunsh: Upojètoume pwc x, A x b. 'Estw oti ỹ 0 tètoio ste ỹ T A = 0 T kai ỹ T b < 0. Tìte, èqoume 0 > ỹ T b ỹ T (A x) = (ỹ T A) x = 0. 'Atopo. AntÐstrofh kateôjunsh: 'Estw oti to sôsthma Ax b den èqei lôsh (n = 1). An o A èqei mìno mia st lh, h apìdeixh eðnai arketˆ eôkolh. To sôsthma eðnai isodônamo me : 'Atopo. x 1 u 1 x 1 u 2 u 2 > u 1 = x 1 u 1 x 1 u 2 } = 0 u 1 u 2 < 0 Eidˆllwc, (n > 1), efarmìzoume apaloif Fourier - Motzkin gia na pˆroume isodônamo sôsthma me 1 metablht ligìterh, A x b. Efarmìzoume thn Epagwgik Upìjesh sto anèfikto A x b. pou shmaðnei ìti y 0, (y ) T A = 0 T, (y ) T b < 0. Kˆje anisìthta sto A x b eðnai ˆjroisma jetik n pollaplasðwn anisot twn tou Ax b, ˆra apo to y mporoôme na ftiˆxoume èna y pou na ikanopoieð tic sunj kec tou jewr matoc. Pio sugkekrimèna, Me thn apaloif F-M, ìpou λ 1, λ 2,..., λ M R m 0. Opìte me A x b, A x b èstw o A èqei M grammèc (λ 1 ) T Ax (λ 1 ) T b (λ 2 ) T Ax (λ 2 ) T b. (λ M ) T Ax (λ M ) T b (y ) T A x (y ) T b y T Ax y T b, y R m y = y 1 λ 1 +... + y Mλ M Pìrisma 7.1 (L mma Farkas gia isìthtec, 1894) To sôsthma Ax = b, A R m n èqei lôsh x 0 ann diˆnusma y R m tètoio ste y T A 0 T, y T b < 0.
Diˆlexh 7: 04.11.2014 7-4 Gewmetrik ErmhneÐa tou L mmatoc: Ax = b, x 0 èqei lôsh b cone(a 1,..., A n ) Sq ma 7.1: UperepÐpedo pou diaqwrðzei ton k no apo to b: {x R m y T x = y T A 1 } Sto Sq ma 7.1 parathroôme oti y T A 0, y T b < 0, [y T A 1,..., y T A n ] 0 T ] Ja apodeðxoume to Pìrisma 7.1 sthn epìmenh diˆlexh.
JewrÐa GrammikoÔ ProgrammatismoÔ Diˆlexh 8: 05.11.2014 Didˆskwn: StaÔroc Kolliìpouloc GrafeÐc: Zugom troc Euˆggeloc & Mpˆkac Dhm trioc 8.1 L mma tou Farkas gia isìthtec Je rhma 8.1 (L mma Farkas gia isìthtec) To sôsthma Ax = b, A R m n èqei lôsh x 0 ann diˆnusma y R m tètoio ste y T A 0 T, y T b < 0. Apìdeixh: To Ax = b, x 0 èqei lôsh ann to A x b èqei lôsh x R m A = A A I b = b b 0 O A èqei 2m + n grammèc. Apo L mma Farkas gia anisìthtec, to A x b èqei lôsh ann y R 2m+n, tètoio ste y 0, (y ) T A = 0 T, (y ) T b < 0 Pio analutikˆ, y 0, (y ) T A = 0 T, (y ) T b < 0 y 0, (y ) T A A I = 0 T, (y ) T b b 0 < 0 ìpou (y ) T = [ y }{{} A, y A, y }{{} I ] }{{} m m n 'Ara èqoume (y ) T A = 0 T yaa T y AA T = yi T 0 T, afoô y 0 yab T y Ab T < 0 Epomènwc, arkeð na jèsoume y = y A y A. Orismìc 8.1 'Egkurh anisìthta gia to P eðnai mia anisìthta pou ikanopoieðtai apì ìla ta shmeða tou P. Pìrisma 8.1 'Estw polôedro P = {x Ax b}. y 0 t.w. y T A = c T kai y T b δ. Tìte kˆje x P ikanopoieð c T x δ ann 8-1
Diˆlexh 8: 05.11.2014 8-2 Apìdeixh: An tètoio y, tìte x, Ax b y T (Ax) y T b c T x y T b c T x δ. Antistrìfwc, upojètoume c T x δ ègkurh anisìthta. Upojètoume ìti tètoio y, dhlad to sôsthma y T A = c T y T b + λ = δ y 0, λ 0 den èqei lôsh. IsodÔnama, [ y T λ ] [ ] A b = [ c 0 1 T δ ], y 0, λ 0 den èqei lôsh. To [ y T λ ] [ ] A b = [ c 0 1 T δ ] grˆfetai isodônama [ ] z Apì to Je rhma 8.1, upˆrqei diˆnusma ìpou µ Prèpei µ 0. PerÐptwsh 1 µ = 0 [ z T µ ] [ ] T A b [ 0 0 1 T 0 ] [ z T µ ] [ ] c < 0 δ [ A b 0 1 ] T [ ] y = λ [ ] [ ] A b z 0 1 µ [ c T δ ] [ ] z µ [ ] c, kai den èqei lôsh. δ [ 0 0 ] < 0 Tìte Az 0 kai c T z < 0. GnwrÐzoume ìti x 0 t.w. Ax 0 b. Gia arketˆ megˆlo τ R + èqoume ìti } Ax 0 b τaz 0 = A(x 0 τz) b kai } c T x 0 δ τc T z > 0 = c T (x 0 τz) > δ 'Atopo, den isqôei h arqik upìjesh ìti h c T x δ eðnai ègkurh anisìthta. PerÐptwsh 2 µ > 0 } Az + bµ 0 c T z + δµ < 0 = } Az bµ 0 c T z δµ > 0 } = µ 1 Az b 0 µ 1 c T z δ > 0 } = A(µ 1 z) b c T (µ 1 z) > δ 'Atopo, parabiˆzetai pˆli h ègkurh anisìthta.
Diˆlexh 8: 05.11.2014 8-3 8.2 Duðkìthta max c T x Ax b PRWTEUON min y T b y T A = c T y 0 DUÛKO Je rhma 8.2 (Asjen c Duðkìthta) 'Estw A R m n, b R m, c R n. Ax b kai ỹ efiktì gia y 0, y T A = c T, tìte c T x ỹb. An x efiktì gia Apìdeixh: c T x = (ỹ T A) x = ỹ T (A x) ỹ T b Pìrisma 8.2 i) An to bèltisto kìstoc tou prwteôontoc eðnai +, to duðkì eðnai anèfikto. ii) An to bèltisto kìstoc tou duðkoô eðnai, to prwteôon eðnai anèfikto. Apìdeixh: i) 'Estw OP T primal = + kai ỹ lôsh tou duðkoô. Tìte + ỹb. 'Atopo. ii) OmoÐwc. Je rhma 8.3 (Isqur Duðkìthta, Von Neumann 1947) 'Estw A R m n, b R m, c R n. Tìte max{c T x Ax b} = min{y T b y T A = c T, y 0} upì th sunj kh ìti kai ta dôo sônola eðnai mh kenˆ. Apìdeixh: Apì thn asjen duðkìthta èqoume OrÐzoume sup{c T x Ax b} inf{y T b y 0, y T = c T } (8.1) δ := sup{c T x Ax b} Apì thn (8.1), èqoume δ inf{y T b y 0, y T A = c T }. Apì ton orismì tou δ, Ax b = c T x δ. Apì to Pìrisma 8.1 èqoume ìti c T x δ eðnai ègkurh anisìthta gia {x Ax b} ann y 0 tètoio ste y T A = c T kai y T b δ. 'Ara, to inf sthn (8.1) mporoôme na to piˆsoume kai eðnai Ðso me δ, dhlad min{y T b y 0, y T A = c T } = δ Ja deðxoume t ra ìti x : Ax b, c T x δ, dhlad x : Ax b, c T x δ. Upojètoume ìti den upˆrqei tètoio x. Apì L mma Farkas gia anisìthtec, z 0, λ 0, λ R, t.w. z T A λc T = 0 T, z T b λδ < 0
Diˆlexh 8: 05.11.2014 8-4 Apì upìjesh, x 0 tètoio ste Ax 0 b, ˆra λ > 0 (an λ = 0 apì L mma Farkas gia anisìthtec, Ax b anèfikto). 'Estw y := z λ, tìte y 0. 'Ara, yt A = c T kai y T b < δ. 'Atopo, giatð gnwrðzoume apì thn 8.1 ìti inf δ. 'Ara, δ = max{c T x Ax b}
Θεωρία Γραμμικού Προγραμματισμού Διάλεξη 9: 11.11.2014 Διδάσκων: Σταύρος Κολλιόπουλος Γραφείς: Ευάγγελος Αναγνωστόπουλος, Πέτρος Μπαρμπαγιάννης 9.1 Ισχυρή Δυϊκότητα Στην προηγούμενη διάλεξη αποδείξαμε το Θεώρημα Ισχυρής Δυϊκότητας, δηλαδή, αν A R m n, b R m, c R n, τότε max{c T x Ax b} = min{b T y y T A = c, y 0} υπό τη συνθήκη ότι και τα δύο σύνολα είναι μη κενά. Πόρισμα 9.1 Εστω A R m n και y R m. Τότε max{c T x Ax = b, x 0} = min{b T y y T A c T }. Απόδειξη: Ορίζουμε τα παρακάτω: A Ã := A, I b b := b 0 Τότε ισχύει ότι max{c T x Ax = b, x 0} = max{c T x Ãx b}. Διαισθητικά, αυτό που μας λέει το παραπάνω είναι ότι το διάνυσμα κόστους του πρωτεύοντος γραμμικού προγράμματος μας δίνει τους σταθερούς όρους στους περιορισμούς του δυϊκού. Θεώρημα 9.1 (Συμπληρωματική Χαλαρότητα) Εστω x γραμμικό πρόγραμμα max c T x και y εφικτή λύση για το δυϊκό Ax b min b T y y T A = c T y 0 εφικτή λύση για το πρωτεύον Οι x, y είναι βέλτιστες λύσεις αν και μόνο αν ισχύει ότι, για κάθε i, y i = 0 ή at i x = b i. Η παραπάνω συνθήκη καλείται συνθήκη συμπληρωματικής χαλαρότητας (complementary slackness condition). 9-1
Διάλεξη 9: 11.11.2014 9-2 Απόδειξη: Εστω x, y βέλτιστες λύσεις και για i {1,..., m}, a T i x < b i. Τότε yi = 0. (y ) T b c T x = (y ) T b (y ) T Ax = (y ) T (b Ax ) t = yi (b i a T i x ) i=1 yi (b i a T i x ) Αν yi > 0 τότε y i (b i a T i x ) > 0, το οποίο όμως είναι άτοπο από το Θεώρημα Ισχυρής Δυϊκότητας. Αντιστρόφως, έστω ότι για κάθε i {1,..., m}, είτε yi = 0 ή at i x = b i. Τότε (y ) T b c T x = (y ) T (b Ax ) m = yi (b i a T i x ) = 0 Επομένως, από το Θεώρημα Ασθενούς Δυϊκότητας οι δύο λύσεις x, y είναι βέλτιστες. i=1 9.2 Γεωμετρική Ερμηνεία της Δυϊκότητας Εστω πρωτεύον γραμμικό πρόγραμμα min c T x a T i x b i, i = i,..., m, x R n και δυϊκό max b T y y T A = c T y 0. m y i a i = c i=1 Εστω I {1,..., m}, I = n, τέτοιο ώστε τα a i, i I, είναι γραμμικά ανεξάρτητα. Το σύστημα a T i x = b i, i I έχει μοναδική λύση, τη x I, η οποία είναι βασική λύση του πρωτεύοντος γραμμικού προγράμματος. Επιπλέον, υποθέτουμε ότι a T i xi b i, για κάθε i / I, δηλαδή η x I είναι μη εκφυλισμένη. Για να είναι τα x I, y βέλτιστες λύσεις για το πρωτεύον και το δυϊκό αντίστοιχα θα πρέπει να ισχύουν οι ακόλουθες συνθήκες: (i) a T i xi b i, για κάθε i (ii) y i = 0, για κάθε i / I (εφικτότητα πρωτεύοντος) (συμπληρωματική χαλαρότητα) (iii) m i=1 y ia i = c (εφικτότητα δυϊκού) (iv) y 0 (εφικτότητα δυϊκού)
Διάλεξη 9: 11.11.2014 9-3 c a 3 a 5 A c a 4 c B C c c D a1 a 2 Σχήμα 9.1: Παράδειγμα γραμμικού προγράμματος με δύο μεταβλητές και πέντε περιορισμούς ανισότητας. Από τις συνθήκες (i) και (ii) προκύπτει η y i a i = c (1) i I Εφόσον τα διανύσματα a i, i I είναι γραμμικά ανεξάρτητα, η (1) έχει μοναδική λύση, την y I. Ετσι, τα a i, i I αποτελούν μια βάση για το δυϊκό πρόβλημα και η y I είναι η αντίστοιχη βασική λύση. Τα παραπάνω απεικονίζονται στο Σχήμα 9.1. Στο παράδειγμα, κάθε υποσύνολο του I, το οποίο περιέχει ακριβώς δύο στοιχεία του, μας δίνει βασικές λύσεις x I και y I για το πρωτεύον και το δυϊκό αντίστοιχα. Αν I = {1, 2}, (σημείο A) τότε το διάνυσμα x I είναι μη εφικτή λύση για το πρωτεύον και το y I είναι μη εφικτή λύση για το δυϊκό διότι το c δεν μπορεί να εκφραστεί ως κωνικός συνδυασμός των a 1 και a 2. Αν I = {1, 3} (σημείο B) τότε το διάνυσμα x I είναι εφικτή λύση για το πρωτεύον και το y I είναι μη εφικτή λύση για το δυϊκό. Αν I = {1, 4} (σημείο C) τότε το x I είναι εφικτή λύση για το πρωτεύον και το y I είναι εφικτή λύση για το δυϊκό. Συγκεκριμένα, τα x I και y I είναι βέλτιστες λύσεις. Τέλος, Αν I = {1, 5} (σημείο D) τότε το x I είναι μη εφικτή λύση για το πρωτεύον και το y I είναι εφικτή λύση για το δυϊκό. 9.3 Θεώρημα Minkowski-Weyl για Κώνους Στη συνέχεια, υπενθυμίζουμε τους ορισμούς του πολυεδρικού κώνου και του πεπερασμένα παραγόμενου κώνου ενώ δίνουμε και ένα νέο ορισμό αυτόν του ζεύγους διπλής περιγραφής. Οι ορισμοί αυτοί είναι χρήσιμοι για τη διατύπωση και απόδειξη του Θεωρήματος Minkowski-Weyl για κώνους. Ορισμός 9.1 Ενα σύνολο P R d καλείται πολυεδρικός κώνος αν υπάρχει πίνακας A R m d, για κάποιο m, τέτοιος ώστε P = {x Ax 0}. Ορισμός 9.2 Ενα σύνολο P R d καλείται πεπερασμένα παραγόμενος κώνος αν υπάρχει πίνακας R R d t, για κάποιο t, τέτοιος ώστε P = {x x = Rλ, λ 0}. Ορισμός 9.3 Ενα ζεύγος πινάκων (A, R) καλείται ζεύγος διπλής περιγραφής (double description pair) [DD-pair ή ΔΠ-ζεύγος] αν οι πίνακες αναπαριστούν τον ίδιο κώνο, δηλαδή Ax 0 x = Rλ, λ 0
Διάλεξη 9: 11.11.2014 9-4 Λήμμα 9.1 Εστω δύο πίνακες A R m d και R R d t. Το ζεύγος (A, R) είναι ΔΠ-ζεύγος αν και μόνο αν το (R T, A T ) είναι ΔΠ-ζεύγος. Απόδειξη: Λόγω συμμετρίας, αρκεί να δείξουμε τη μία κατεύθυνση. Εστω ότι το (A, R) είναι ΔΠ-ζεύγος, δηλαδή Ax 0 x = Rλ, λ 0 (1) Θα δείξουμε ότι (R T, A T ) είναι επίσης ΔΠ-ζεύγος. R T y 0 λ T R T y 0, λ 0 (Rλ) T y 0, λ 0 (1) (Ax 0 x T 0) µ T A = y T, για κάποιο µ 0 (Θεώρημα 8.1) Θεώρημα 9.2 (Minkowski-Weyl για κώνους) Εστω P R d. Τα παρακάτω είναι ισοδύναμα: 1. Το P είναι πολυεδρικός κώνος. 2. Το P είναι πεπερασμένα παραγόμενος κώνος. Απόδειξη: (2) (1) Εστω πολύεδρο P = {x x = Rλ, λ 0} όπου R R d t. Το σύστημα x = Rλ, λ 0 έχει μεταβλητές x και λ. Με απαλοιφή Fourier-Motzkin διώχνουμε τις μεταβλητές λ 1,..., λ t και παίρνουμε ένα ισοδύναμο σύστημα μόνο με μεταβλητές x. Το σύστημα αυτό θα είναι της μορφής Ax 0 για κάποιο πίνακα A. Για τη συνεπαγωγή (1) (2) αρκεί να δείξουμε ότι για κάθε πίνακα A, υπάρχει ένας πίνακας R τέτοιος ώστε το (A, R) είναι ΔΠ-ζεύγος. Ετσι, δοθέντος κάποιου πίνακα A ψάχνουμε έναν πίνακα? για τον οποίο να ισχύει το παραπάνω. Από το Λήμμα 9.1, το (A,?) είναι ΔΠ-ζεύγος αν το (? T, A T ) είναι ΔΠ-ζεύγος. Από την απόδειξη της αντίστροφης κατεύθυνσης, δοθέντος ενός A T φτιάχνουμε έναν R T τέτοιο ώστε (R T, A T ) είναι ΔΠ-ζεύγος. Από το Λήμμα 9.1, αν το (R T, A T ) είναι ΔΠ-ζεύγος, τότε και το (A, R) είναι ΔΠ-ζεύγος. Τη συνεπαγωγή (1) (2) του Θεωρήματος 9.2 απέδειξε ο Minkowski ενώ τη συνεπαγωγή (2) (1) απέδειξε ο Weyl.
Θεωρία Γραμμικού Προγραμματισμού Διάλεξη 10: 12.11.2014 Διδάσκων: Σταύρος Κολλιόπουλος Γραφείς: Ευάγγελος Αναγνωστόπουλος, Πέτρος Μπαρμπαγιάννης Ορισμός 10.1 Αν το ζεύγος πινάκων (A, R) είναι ΔΠ-ζεύγος για έναν κώνο P, τότε και το ζεύγος πινάκων (R T, A T ) είναι ΔΠ-ζεύγος για έναν κώνο P. Σε αυτή τη περίπτωση, ο κώνος P καλείται ο δυϊκός (ή ο πολικός) κώνος του P. Από τον Ορισμό 8.3 του ζεύγους διπλής περιγραφής προκύπτει ότι: P = {y R d R T y 0} = {y R d y = A T µ, µ 0} Χρήσιμη άσκηση: Δείξτε ότι P = {y R d x P, y T x 0}. Σχηματικά, ένα παράδειγμα ενός κώνου C με τον δυϊκό του C είναι το ακόλουθο:. Σχήμα 10.1: Ενας κώνος C με τον δυϊκό του C Σημείωση: είναι εύκολο να παρατηρήσουμε ότι, P = R d P =. Ορισμός 10.2 Εστω δύο πολύεδρα V, R R n. Το άθροισμα Minkowski των V και R ορίζεται ως το σύνολο V + R = {x R n v V, r R : x = v + r}. Αν οποιοδήποτε από τα δύο σύνολα V, R είναι το κενό σύνολο, τότε V + R =. Ορισμός 10.3 Ενα σύνολο σημείων καλείται πολύτοπο αν είναι το κυρτό κάλυμμα πεπερασμένων το πλήθος διανυσμάτων. Θεώρημα 10.1 (Θεώρημα Minkowski-Weyl για πολύεδρα) Ενα σύνολο P R n είναι πολύεδρο ανν P = Q + C για κάποιο πολύτοπο Q R n και κάποιον πεπερασμένα παραγόμενο κώνο C R n. 10-1
Διάλεξη 10: 12.11.2014 10-2 Απόδειξη: ( ): {( Εστω ένα πολύεδρο P = {x R n Ax b}. Ο πολυεδρικός κώνος P = x ) λ x R n, λ R 0 : Ax λb 0 }, από το θεώρημα Minkowksi-Weyl για κώνους (Θεώρημα 9.2), παράγεται από πεπερασμένο πλήθος διανυσμάτων ( x 1 ) ( λ 1, x2 ) ( λ 2,..., xm ) λm. Υποθέτουμε, χωρίς βλάβη της γενικότητας, ότι τα διανύσματα ( x i ) λ i έχουν λi = 0 ή λ i = 1. Ορίζουμε: {( ) } xi Q = conv i = 1,..., m & λ i = 1 λ i {( ) } xi C = cone i = 1,..., m & λ i = 0 Θα δείξουμε ότι το αρχικό πολύεδρο P μπορεί να γραφτεί ως P = Q + C. ( ) ( ) {( ) ( ) x x x P P x1 x2 cone,,..., 1 1 Υποχρεωτικά, m 1 i λ i =1 λ i ρ 1,..., ρ m R 0 τ.ω. λ 1 ( ) x = 1 ρ i = 1, επειδή λ i = 1 ή λ i = 0. Δηλαδή: ( ) xi ρ i = ( ) xi ρ i + ( ) xi ρ i λ i λ i λ i i λ i =1 i λ i 1 10.1 = ( ) x = 1 m 1 λ 2 i λ i =1 ( ) xi ρ i λ i ( xm ( ) xi ρ i λ i λ m }{{} κυρτός συνδυασμός από το Q )} + i λ i 1 (10.1) ( ) xi ρ i λ i }{{} κωνικός συνδυασμός από το C Οπότε P = Q + C. ( ): Αντιστρόφως, έστω το σύνολο P = Q + C, όπου Q πολύτοπο και C πεπερασμένα παραγόμενος κώνος. Δηλαδή: Οπότε, x 0 P Q = conv{x 1, x 2,..., x m } C = cone{y 1, y 2,..., y t } ( ) {( ) x0 x1 cone,..., 1 1 ( xm 1 ), ( ) y1,..., 0 ( )} yt := D (10.2) 0 και σύμφωνα με το Θεώρημα Minkowski-Weyl για κώνους (θεώρημα 9.2), ο πεπερασμένα παραγόμενος κώνος D είναι και πολυεδρικός. Δηλαδή της μορφής: {( ) } x D = Ax + λb 0 για κάποια A, b λ Άρα,: x 0 P 10.2 = Άρα το σύνολο P είναι πολύεδρο. ( ) x0 D Ax 0 + 1 b 0 Ax 0 b 1 Πόρισμα 10.1 (Θεώρημα πεπερασμένης βάσης για πολύτοπα) Ενα σύνολο P είναι πολύτοπο ανν το P είναι ένα φραγμένο πολύεδρο, δηλαδή γράφεται ως P = Q + C, όπου C = { 0}.
Διάλεξη 10: 12.11.2014 10-3 Ορισμός 10.4 Ο χαρακτηριστικός κώνος (characteristic or recession cone) ενός πολυέδρου P = {x Ax b}, P είναι ο κώνος: rec(p ) = {y x + y P, x P } = {y Ay 0} Ιδιότητες του χαρακτηριστικού κώνου: i) y rec(p ) x P τ.ω. x + λy P, λ 0 ii) P + rec(p ) = P iii) P φραγμένο rec(p ) = {0} iv) Αν P = Q + C, όπου Q πολύτοπο και C πολυεδρικός κώνος, τότε C = rec(p ) Ορισμός 10.5 Κάθε διάνυσμα x rec(p ) \ { 0} καλείται άπειρη διεύθυνση του P ή ακτίνα (ray). Q P C Σχήμα 10.2: Η διάσπαση ενός πολυέδρου P στις συνιστώσες του Q και C. Παρατηρούμε ότι υπάρχουν άπειρες επιλογές για το πολύτοπο Q, αλλά ο χαρακτηριστικός κώνος είναι μοναδικός. Βλέπουμε επίσης και την ιδιότητα (i) του χαρακτηριστικού κώνου ότι, αν είμαστε μέσα στο P και προχωράμε σύμφωνα με το κώνο C, θα παραμένουμε πάντα μέσα στο πολύεδρο. Τέλος, προφανώς : lin(p ) = { 0}. Ορισμός 10.6 Το lineality space του πολυέδρου P = {x Ax b} ορίζεται ως το σύνολο lin(p ) = rec(p ) rec(p ) = {y Ay = 0} = nullspace(a). Παρατηρήσεις: Τετριμμένα, P, 0 lin(p ). Για ένα διάνυσμα y, y lin(p ) y rec(p ) & y rec(p ) (βλ. Σχήμα 10.3). Αν rec(p ) { 0}, τότε το P περιέχει σίγουρα ημιευθείες (ιδιότητα (iii) χαρακτηριστικού κώνου). Αν lin(p ) { 0}, τότε το P περιέχει σίγουρα ευθείες (βλ. Σχήμα 10.3).
Διάλεξη 10: 12.11.2014 10-4 a T x = b 2 y Q y P a T x = b 1 a T x = 0 = rec(p ) Σχήμα 10.3: Θεωρούμε το πολύεδρο P = {x b 1 a T x b 2 }. Παρατηρούμε ότι y rec(p ) y rec(p ). Άρα σε αυτή τη περίπτωση, lin(p ) = rec(p ). Ορισμός 10.7 Αν lin(p ) = { 0} για κάποιο πολύεδρο P, τότε το P καλείται μυτερό (pointed). Παρατήρηση: Το P είναι μυτερό ανν το P δεν περιέχει ευθεία (βλ. Σχήμα 10.2). Επιπλέον, με βάση το Θεώρημα 5.1, παίρνουμε το εξής: Πρόταση 10.1 Το P έχει τουλάχιστον ένα ακραίο σημείο ανν το P είναι μυτερό.