Επιστηµονικός Υπολογισµός ΙΙ

Σχετικά έγγραφα
Επιστηµονικός Υπολογισµός ΙΙ

Γραµµική Αλγεβρα. Ενότητα 6 : Ιδιοτιµές & Ιδιοδιανύσµατα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Επιστηµονικός Υπολογισµός ΙΙ

Γραµµική Αλγεβρα. Ενότητα 2 : Επίλυση Γραµµικών Εξισώσεων. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

QR είναι ˆx τότε x ˆx. 10 ρ. Ποιά είναι η τιµή του ρ και γιατί (σύντοµη εξήγηση). P = [X. 0, X,..., X. (n 1), X. n] a(n + 1 : 1 : 1)

Επιστηµονικός Υπολογισµός Ι

Γραµµική Αλγεβρα. Ενότητα 6 : Ιδιοτιµές & Ιδιοδιανύσµατα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Εφαρμοσμένα Μαθηματικά ΙΙ

Γραµµική Αλγεβρα. Ενότητα 6 : Ιδιοτιµές & Ιδιοδιανύσµατα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Επιστηµονικός Υπολογισµός ΙΙ

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (2 Ιουλίου 2009) ΕΠΙΛΕΓΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ

Στοχαστικά Σήµατα και Εφαρµογές

Γραµµική Αλγεβρα. Ενότητα 6 : Ιδιοτιµές & Ιδιοδιανύσµατα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΚΕΦΑΛΑΙΟ 3 ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. nn n n

Επίλυση Γραµµικών Συστηµάτων

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (Εξ. Ιουνίου - 02/07/08) ΕΠΙΛΕΓΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ

Εφαρμοσμένα Μαθηματικά ΙΙ

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και2015 Ιδιοδιανυσµάτων 1 / 50

Ορίζουσες ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ. Προηγείται της Γραµµικής Αλγεβρας. Εχει ενδιαφέρουσα γεωµετρική ερµηνεία. ΛΥ.

Αριθµητική Ανάλυση. 27 Οκτωβρίου Αριθµητική Ανάλυση 27 Οκτωβρίου / 72

Γραµµική Αλγεβρα. Ενότητα 6 : Ιδιοτιµές & Ιδιοδιανύσµατα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Επιστηµονικός Υπολογισµός ΙΙ

Κεφάλαιο 6 Ιδιοτιµές και Ιδιοδιανύσµατα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Γραµµική Αλγεβρα. Ενότητα 1 : Εισαγωγή στη Γραµµική Αλγεβρα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΛΥΣΕΙΣ 6 ης ΕΡΓΑΣΙΑΣ - ΠΛΗ 12,

Επιστηµονικός Υπολογισµός ΙΙ


5.1 Ιδιοτιµές και Ιδιοδιανύσµατα

Γραµµική Αλγεβρα. Ενότητα 2 : Επίλυση Γραµµικών Εξισώσεων. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Αριθμητική Ανάλυση και Εφαρμογές

ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ ΕΞΙΣΩΣΕΩΝ

ΜΑΣ 371: Αριθμητική Ανάλυση ΙI ΑΣΚΗΣΕΙΣ. 1. Να βρεθεί το πολυώνυμο Lagrange για τα σημεία (0, 1), (1, 2) και (4, 2).

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Γραµµικη Αλγεβρα ΙΙ Ασκησεις - Φυλλαδιο 10

Γραµµική Αλγεβρα. Ενότητα 1 : Εισαγωγή στη Γραµµική Αλγεβρα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ = U1SV 1 V 2 A = [U1 U2] S = diag(σ 1,...,σ r ) R r r. και σ 1 σ r > 0. Ειδικότερα,

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

x 2 = b 1 2x 1 + 4x 2 + x 3 = b 2. x 1 + 2x 2 + x 3 = b 3

1 Μέθοδοι ελαχιστοποίησης

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

ΚΕΦ.6:ΤΕΤΡΑΓΩΝΙΚΕΣ ΜΟΡΦΕΣ. ΣΥΜΜΕΤΡΙΚΟΙ ΠΙΝΑΚΕΣ

Επιστηµονικός Υπολογισµός Ι

8.1 Διαγωνοποίηση πίνακα

Γραµµική Αλγεβρα. Ενότητα 3 : ιανυσµατικοί Χώροι και Υπόχωροι. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

1 Επανάληψη εννοιών από τον Απειροστικό Λογισμό

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΠΙΛΥΣΗΣ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Αριθμητική Ανάλυση 4.5 Ιδιοτιμές και ιδιοδιανύσματα πινάκων. Γ. Παπαευαγγέλου, ΕΔΙΠ, ΤΑΤΜ/ΑΠΘ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

[ ] και το διάνυσµα των συντελεστών:

Λύσεις και Υποδείξεις Επιλεγµένων Ασκήσεων

Kεφάλαιο 4. Συστήµατα διαφορικών εξισώσεων

Ασκήσεις3 Διαγωνισιμότητα Βασικά σημεία Διαγωνίσιμοι πίνακες: o Ορισμός και παραδείγματα.

Απαντήσεις στα Θέµατα Ιουνίου 2012 (3 και 4)

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ( , c Ε. Γαλλόπουλος) ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ. Ε. Γαλλόπουλος. ΤΜΗΥΠ Πανεπιστήµιο Πατρών. ιαφάνειες διαλέξεων 28/2/12

Παναγιώτης Ψαρράκος Αν. Καθηγητής

Κεφάλαιο 6 Ιδιοτιμές και Ιδιοδιανύσματα

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα

Γραµµική Αλγεβρα. Ενότητα 3 : ιανυσµατικοί Χώροι και Υπόχωροι. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΘΕΩΡΙΑ ΠΙΝΑΚΩΝ. Ορισμός 1: Ένας πίνακας Α με m γραμμές και n στήλες,

Επιστηµονικοί Υπολογισµοί Μέθοδοι µεταβλητής παρεκτροπής (Variable Extrapolation)

ΜΕΜ251 Αριθμητική Ανάλυση

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Ασκησεις - Φυλλαδιο 9 Επαναληπτικες Ασκησεις

7 ΑΛΓΕΒΡΑ ΜΗΤΡΩΝ. 7.2 ΜΗΤΡΕΣ ΕΙΔΙΚΗΣ ΜΟΡΦΗΣ (Ι)

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

Ασκήσεις3 Διαγωνίσιμες Γραμμικές Απεικονίσεις

Θέµατα ( ικαιολογείστε πλήρως όλες τις απαντήσεις σας)

2 3x 5x x

1 ιαδικασία διαγωνιοποίησης

Εφαρµογες Της Ψηφιακης Επεξεργασιας Σηµατων. Εκτιµηση Συχνοτητων Με ΙδιοΑναλυση του Μητρωου ΑυτοΣυσχετισης

Kεφάλαιο 4. Συστήµατα διαφορικών εξισώσεων.

Παναγιώτης Ψαρράκος Αν. Καθηγητής

Κεφάλαιο 7 Ορθογώνιοι Πίνακες

Ιδιάζουσες τιμές πίνακα. y έχουμε αντίστοιχα τις σχέσεις : Αυτές οι παρατηρήσεις συμβάλλουν στην παραγοντοποίηση ενός πίνακα

Κεφ. 3: Παρεμβολή. 3.1 Εισαγωγή. 3.2 Πολυωνυμική παρεμβολή Παρεμβολή Lagrange Παρεμβολή Newton. 3.3 Παρεμβολή με κυβικές splines

Γραµµική Αλγεβρα. Ενότητα 7 : Γραµµικοί Μετασχηµατισµοί. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ιδάσκοντες :Τµήµα Α ( Αρτιοι) : Καθηγητής Ν. Μισυρλής,Τµήµα Β (Περιττοί) : Αριθµητική Επίκ.

ιδάσκοντες :Τµήµα Α ( Αρτιοι) : Καθηγητής Ν. Μισυρλής,Τµήµα Β (Περιττοί) : Αριθµητική Επίκ.

21 a 22 a 2n. a m1 a m2 a mn

Χαρακτηριστική Εξίσωση Πίνακα

Επίλυση ενός τριδιαγώνιου γραµµικού συστήµατος Ax = d µε τη µέθοδο απαλοιφής του Gauss (µέθοδος του Thomas)

ΜΕΜ251 Αριθμητική Ανάλυση

Διανύσµατα στο επίπεδο

Η ΚΑΝΟΝΙΚΗ ΜΟΡΦΗ JORDAN

Στοχαστικά Σήματα και Τηλεπικοινωνιές

Γραµµική Αλγεβρα. Ενότητα 5 : Ορίζουσες. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Παναγιώτης Ψαρράκος Αν. Καθηγητής

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑΤΙΚΑ Ι ΕΡΓΑΣΙΑ 6 ΛΥΣΕΙΣ

x 2 = x x 2 2. x 2 = u 2 + x 2 3 Χρησιµοποιώντας το συµβολισµό του ανάστροφου, αυτό γράφεται x 2 = x T x. = x T x.

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Ασκησεις - Φυλλαδιο 3

{ } ΠΛΗ 12: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗ ΠΛΗΡΟΦΟΡΙΚΗ Ι 2 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ. Απαντήσεις. 1. (15 µονάδες)

Επιστηµονικός Υπολογισµός ΙΙ

3. Γραμμικά Συστήματα

[A I 3 ] [I 3 A 1 ].

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑ ΓΕΝΙΚΑ ΜΑΘΗΜΑΤΙΚΑ

Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 4

Transcript:

Επιστηµονικός Υπολογισµός ΙΙ Ε. Γαλλόπουλος 1 1 Τµήµα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πολυτεχνική Σχολή, Πανεπιστήµιο Πατρών 5/5/13

Συµµετρικός αλγόριθµος Lanczos Αν ο A = A, τότε το άνω Hessenberg µητρώο H m που υπολογιζεται από τον Arnoldi είναι συµµετρικό και εποµένως τριδιαγωνιο. Εποµένως µπορούµε να γράψουµε τον H m ως α 1 β 2 0. β 2 α 2 β.. 3 T m =. 0..... β m 1 α m 1 β m... 0 βm α m Προσέξτε ότι από τη σχέση για την τελευταία στήλη του AV m = AV m e m έχουµε Av m = V m T m e m + h m 1,m v m+1 e m e m = β m v m 1 + α m v m + h m 1,m v m+1 = β m v m 1 + α m v m + β m v m+1

Arnoldi όταν A = A συµµετρικός Lanczos Ο (τροποποιηµένος) αλγόριθµος Arnoldi για την περίπτωση αυτή ονοµάζεται αλγόριθµος Lanczos και έχει ως εξής: v 1 := v/ v 2, β 1 = 0, v 0 = 0 for j = 1,...,m w j := Av j β j v j 1 α j = (w j,v j ), w j := w j α j v j β j+1 = w j if β j+1 = 0 Stop v j+1 = w j /β j+1 end Το κόστος πολύ µικρότερο από Arnoldi Τα διανύσµατα ϐάσης είναι ορθογώνια... αν και, η α.κ.υ. οδηγεί σε γρήγορη απώλεια της ορθογωνιότητας των v j, οπότε χρησιµοποιείται: επαναρθογωνιοποίηση: πλήρης, µερική ή επιλεκτική

Συµµετρικός FOM Συµµετρικός αλγόριθµος Lanczos Εφαρµόζουµε την παραπάνω ιδέα στον FOM και παίρνουµε τον αλγόριθµο επίλυσης «συµµετρικός Lanczos». r (0) = b Ax (0), β := r (0) 2, v 1 := r (0) /β. for j = 1,...,m w j := Av j β j v j 1 α j = (w j,v j ), w j := w j α j v j β j+1 = w j if β j+1 = 0 then m := j; break; end v j+1 = w j /β j+1 end T m = trid(β i,α i,β i+1 ), V m = [v 1,...,v m ]. y m := Tm 1 (βe 1 ) και x (m) = x (0) + V m Οπως και στον FOM, το νέο κατάλοιπο έχει την κατεύθυνση του v m+1 : εποµένως r (m) = β m+1 e T m y mv m+1 r (m) r (m j),j = 1,...,m

Αµεσος αλγόριθµος Lanczos: D-Lanczos Αντιστοιχεί στον Lanczos όπως και η DIOM στην IOM. T m = L m U m όπου L m, U m κάτω και άνω διδιαγώνια: L m = trid[λ j,1,0],u m = trid[0,η j,β j+1 ] x (m) = x (0) + V m H 1 m (βe 1 ) = x (0) + V m U 1 1 m Lm (βe }{{} 1 ) }{{} z m P m = x (0) + P m z m Ο υπολογισµός µπορεί να γίνει σταδιακά χωρίς να χρησιµοποιήσουµε όλα τα διανύσµατα του V m : Από τη σχέση V m = P m U m v m = η m p (m) + β }{{} m p (m 1) από Lanczos

Ιδέα Αλγόριθµος στον οποίο x (m+1) = x (m) + α m p (m), τα υπόλοιπα είναι ορθογώνια και τα διανύσµατα p είναι A-συζυγή: Εποµένως: και r (m+1) = r (m) α m Ap (m) 0 = (r (m+1),r (m) ) = (r (m),r (m) ) α m (Ap (m),r (m) ) α m = (r(m),r (m) ) (Ap (m),r (m) ) εφόσον (Ap (m),r (m) ) 0.

Επίσης Ap (m) = 1 α m (r (m+1) r (m) ) Τα p (m+1) r (m+1),p (m) είναι A-ορθογώνια, εποµένως αν γράψουµε p (m+1) = r (m+1) + β m p (m) ισχύει (Ap (m),r (m) ) = (Ap (m),p (m) β m 1 p (m 1) ) = (Ap (m),p (m) ) 0

Εποµένως, αν A ΣΘΟ, ο α m µπορεί να υπολογιστεί: α m = (r (m),r (m) ) (Ap (m),p (m) ) 0 = (p (m+1),ap (m) ) = (r (m+1) + β m p (m),ap (m) ) = (r (m+1),ap (m) ) + β m (p (m),ap (m) ) β m = (r(m+1),ap (m) ) (p (m),ap (m) ) = 1 α m (r (m+1),r (m+1) r (m) ) (p (m),ap (m) ) = (Ap(m),p (m) ) (r (m+1),r (m+1) ) (r (m),r (m) ) (p (m),ap (m) ) = (r(m+1),r (m+1) ) (r (m),r (m) ) και ο β m µπορεί επίσης να υπολογιστεί. Επιλέγοντας τις παραµέτρους α m,β m και τα διανύσµατα x (m),p (m),r (m) µε τον παραπάνω τρόπο, οδηγούµαστε στον αλγόριθµο ϐλυεconjugate Gradient.

Μέθοδος Conjugate Gradient Ο πιο σηµαντικός και αποτελεσµατικός επαναληπτικός αλγόριθµος για τη λύση ΣΘΟ συστηµάτων. Η ϐασική ιδέα και περιγραφή οφείλεται στους Hestenes και Stiefel (εργασία του 1952!) αλλά για δεκαετίες ϑεωρείτο µη πρακτική σε σύγκριση µε την απαλοιφή Gauss και επαναληπτικές µεθόδους. r (0) = b Ax (0), p (0) = r (0) for j = 1,...,m Compute Ap (j 1), α j 1 = (r(j 1),r (j 1) ) (p (j 1),Ap (j 1) ) x (j) = x (j 1) + α j 1 p (j 1), r (j) = r (j 1) α j 1 Ap (j 1), β j 1 = (r(j),r (j) ) (r (j 1),r (j 1) ) p (j) = r (j) + β j 1 p (j 1) end

Χρήσιµες ιδιότητες Θεώρηµα Εστω ότι εφαρµόζουµε τη CG σε ΣΘΟ µητρώο A. Μέχρι τη σύγκλιση (οπότε και r (j) 0) ισχύουν τα παρακάτω: K m (A,r (0) ) = x (1),x (2),,x (m) = p (0),p (1),,p (m 1) = r (0),r (1),,r (m 1) Τα υπόλοιπα είναι ορθογώνια: (r (j),r (k) ) = 0, Οι κατευθύνσεις είναι A ορθογώνιες (συζυγείς): (p (j),p (k) ) A = 0, j k j k

Σύγκλιση CG Γνωρίζουµε ότι 1) Η CG είναι µέθοδος ΟΠ µε K = K m (A;r (0) ). Εποµένως η προσέγγιση x (m), m = 1,2,... ελαχιστοποιεί την A-νόρµα του σφάλµατος επί του x (0) + K m, δηλ. x (m) := arg min (A(x sol x),x sol x) 1/2 x x (0) +K m 2) Αν x (m) := x (0) + δ τότε δ είναι η A-ΟΠ του e (0) επί του K. 3) e (m) = p(a)e (0) για p Π m και p(0) = 1 εποµένως x sol x (m) A = min p Π m p(0) = 1 p(a)(x sol x (0) ) A

Η µελέτη της σύγκλισης της CG χρησιµοποιεί την έννοια των ενεργών ιδιοτιµών και ιδιοδιανυσµάτων: Αν A = QΛQ T τότε είναι τα (q j,λ j ),j = 1 : m που συµµετέχουν στο e (0) = n j=1 γ j q j, Ισχύει ότι για το πολυώνυµο υπολοίπου p(a) έχουµε p(0) = 1 και p(a)e (0) 2 A = n j=1 λ j (p(λ j )) 2 γ 2 j max(p(λ j )) 2 e (0) 2 A j max(p(λ j )) 2 e (0) 2 A j max λ [λ min,λ max ] (p(λ))2 e (0) 2 A

Εστω ότι A ΣΘΟ. Τότε σε αριθµητική άπειρης ακρίβειας ο αλγόριθµος παράγει τη λύση σε n κατά µέγιστο ϐήµατα. Ισχύουν οι συνθήκες: (e (k+1),ap (j) ) = (p (k+1),ap (j) ) = (r (k+1),r (j) ) = 0, j k και από όλα τα διανύσµατα στο χώρο e (0) + span{ae (0),,A k+1 e (0) } το e (k+1) έχει την ελάχιστη A-νόρµα. Επίσης e (k) A κ(a) 1 e (0) 2( ) k A κ(a) + 1

Παρατηρήσεις υλοποίησης σε α.κ.υ. Αν γίνουν «αρκετά» ϐήµατα η CG ϑα υπολογίσει εντέλει αποδεκτή προσέγγιση στην ακριβή λύση αλλά: «Αρκετά» µπορεί να είναι πάνω από n Ο αριθµός ϐηµάτων δεν προβλέπεται µε ακρίβεια από το παραπάνω ϕράγµα για το e(k) A e (0) A. είτε σχετικές εργασίες της Anne Greenbaum. Η «ακριβής λύση» της CG προσεγγίζεται χρησιµοποιώντας συµµετρικό αλγόριθµο Lanczos και περαιτέρω ορθογωνιοποίηση.

Πείραµα Μητρώο 500 500, διαγώνια όλα ίσα µε 1, εκτός διαγωνίου οµοιόµορφα κατανεµηµένα στο [ 1,1], µηδέν όποτε α i,j > τ.

Η υπεργραµµική σύγκλιση της CG Αν παρατηρήσει κανείς τις καµπύλες σύγκλισης της CG για διάφορα µητρώα, παρουσιάζεται η εξής γενική συµπεριφορά, που µπορούµε να συνοψίσουµε σε 3 ϕάσεις: κατˆαρχήν γρήγορη πτώση του σφάλµατος ως ένα σηµείο καµπής σχετική καθυστέρηση - στασιµότητα, αργή σύκγλιση πολύ γρήγορη πτώση του σφάλµατος σε αποδεκτά όρια Η συµπεριφορά αυτή αναλύθηκε πειστικά από τους van der Sluis και van der Vorst.

Πότε µπορούµε να κατασκευάσουµε οικονοµικές και ϐέλτιστες µεθόδους Krylov; Βέλτιστες: Σε κάθε ϐήµα m, µεταξύ όλων των δυνατών επιλογών από τον υπόχωρο K m (A,b), η προσεγγιστική λύση οδηγεί στο ελάχιστο κάποιου µέτρου σφάλµατος ή υπολοίπου. Οικονοµικές Οτι σε κάθε ϐήµα m, η νέα προσέγγιση της λύσης υπολογίζεται από µια «κοντή αναδροµή» µεγέθους το πολύ s n (π.χ. το µητρώο Hessenberg έχει το πολύ s µη µηδενικά σε κάθε στήλη.) Ως «οικονοµικές» εννοούµε µεθόδους που ϐασίζονται σε κοντές αναδροµές για την κατασκευή κάθε νέας εκτίµησης, π.χ. νέα εκτίµηση λύσης (ϐήµα j + 1) = F ( (τρέχουσα εκτίµηση), (υπολογίσιµη διόρθωση)

Το ϑέµα της ύπαρξης επαναληπτικών µεθόδων Krylov µε ϐέλτιστο σφάλµα και κοντή αναδροµή για γενικά (µη κανονικά) µητρώα απαντήθηκε - αρνητικά - από τους Faber και Manteuffel στα µέσα του 1980. Γενικά, η κατασκευή είναι δυνατή για κανονικά µητρώα ή γενικεύσεις τους. Εχει αποδειχθεί ότι υπάρχει µέθοδος ϐραχείας αναδροµής µήκους 1 (όπως η CG) αν και µόνον αν συµβαίνει ένα από τα παρακάτω: 1 το ελάχιστο πολυώνυµο του A είναι 0 ή 1 ή 2 το A είναι ερµιτιανό, ή 3 A = e ιθ (ρi + B) όπου θ,ρ R και B = B (αντιερµιτιανό).

Μέθοδος CGN (CG Normal) Υπάρχουν οικονοµικές µέθοδοι για µη συµµετρικά/ερµιτιανά προβλήµατα; Ιδέα: Ax = b }{{} A A x = A b συµµετρικό εποµένως αν x (0) = 0 χρησιµοποιούµε µέθοδο ΟΠ για το χώρο K := K m (A A,A b) οπότε αν A αντιστρέψιµο, σε κάθε ϐήµα m = 1,... ελαχιστοποιείται επί του K m (A A,A b) e (m) e (m) A A = (e (m) ) A Ae (m) 2 = (r (m) ) r (m) 2

Παρατηρήσεις Σε κάθε ϐήµα ελαχιστοποιείται η 2-νόρµα του υπολοίπου επί του K m (A A,A b) ενώ στη GMRES η ελαχιστοποίηση είναι επί του K m (A,b). Η ανάλυση σύγκλισης γίνεται όπως και στη CG αλλά r (m) 2 r (0) 2 2( κ(a) 1 κ(a) + 1 )m εποµένως η σύγκλιση µπορεί να είναι πολύ πιο αργή γιατί εξαρτάται από το κ(a) και όχι από το κ(a) Η σύγκλιση εξαρτάται από την κατανοµή των ιδιαζουσών τιµών παρά από την κατανοµή των ιδιοτιµών

Μέθοδοι διορθογωνιοποίησης (biorthogonalization) Η Arnoldi ανάγει µη συµµετρικά µητρώα σε άνω Hessenberg AV m = V m H m + h m+1,m v m+1 e m H m = V m AV m Μία σηµαντική κατηγορία µεθόδων ϐασίζεται στη (µερική) αναγωγή (µη συµµετρικών) µητρώων σε τριδιαγώνια µορφή. Ιδέα Οποιοδήποτε αντιστρέψιµο µητρώο είναι όµοιο µε τριδιαγώνιο! det(a) 0 υπάρχει αντιστρέψιµο Q τ.ώ. Q 1 AQ = T = trid[β j 1,α j,β j ] Αν ϑέσουµε Q 1 = P οπότε QAP = T και P Q = I

Επαναληπτική εκδοχή Αν εφαρµόσουµε Arnoldi για να υπολογίσουµε ϐάσεις: span{v 1,...,v m } = K m (A,v), span{w 1,...,w m } = K m (A,w) AV m = V m H m + h m+1,m v m+1 e m, A W m = W m Hm + hm+1,m w m+1 e m Αναστρέφοντας την 2η σχέση W m A = H m W m + hm+1,m e m w m+1 Επιλέγουµε τις στήλες των V m,w m να είναι διορθογώνιες, δηλ. W m V m = I (τα W m,v m λέγονται συζυζή). οπότε πολλαπλασιάζοντας την πρώτη σχέση από τις παραπάνω µε W m και την προηγούµενη σχέση µε το V m απο τα δεξιά, Τότε εποµένως W m AV m = (W m V m)h m + h m+1,m W m v m+1e m W m AV m = H m (W m V m) + hm+1,m e m w m+1 V m W m AV m = H m = H m άρα H m = H m είναι τουλάχιστον τριδιαγώνιο.

Αλγόριθµος ισυζυγών Κλίσεων BiConjugate Gradients (BCG) r (0) = b Ax (0), αρχικοποίηση s (0) τ.ώ. (s (0) )r (0) 0 p (0) = r (0),q (0) = s (0) for m = 0,... και όσο δεν ικανοποιείται το κριτήριο σύγκλισης do α m = (s (m) r (m) )/(q (m) Ap (m) ) x (m+1) = x (m) + α m p (m) r (m+1) = r (m) α m Ap (m) s (m+1) = s (m) α m A q (m) β m = (s (m+1) r (m+1) )/(s (m) r (m) ) p (m+1) = r (m+1) + β m p (m) q (m+1) = s (m+1) + β m q (m) end for Κόστη/επανάληψη 2 MV, 2 DOT, 5 SAXPY

Πείραµα (Trefethen)

Παρατηρήσεις Η BiCG µπορεί να ϑεωρηθεί ως ϕυσική επέκταση της συµµετρικής Lanczos για ταυτόχρονη επίλυση των συστηµάτων ( ) ( Ax = b και A ˆx 0 A )(ˆx bˆb) = ˆb A = 0 x το τελευταίο σύστηµα είναι 2n 2n, συµµετρικό αλλά µη ορισµένο άρα δεν µπορούµε να εφαρµόσουµε CG v 1 = b K = K m (A,b), x (m) K m (A,b), r (m) L = K m (A,w 1 ) για να πετύχουµε w 1 v 1 = 1, µπορούµε να ϑέσουµε w 1 = v 1 / v 1. Σε κάθε ϐήµα χρειάζεται πολλαπλασιασµός µε το ανάστροφο A. Πώς αποφεύγεται; Transpose-free methods

Βασική ιδέα για transpose-free και r (m) = φ m (A)r (0), p (m) = π m (A)r (0) s (m) = φ m (A )s (0), q (m) = π m (A )s (0) α m = (s (m) r (m) )/(q (m) Ap (m) ) = s(0) (φ m (A )) φ m (A)r (0) s (0) (π m (A )) Aπ m (A)r (0) = s(m) φ 2 m(a)r (0) s (0) Aπ 2 m(a)r (0) και αντίστοιχα για το β m. Κλειδί: εν υπάρχουν πια MV µε A. Υλοποίηση: Αλγόριθµος που στηρίζεται στις σχέσεις r (m) = φ 2 m(a)r (0), p (m) = π 2 m(a)r (0) q (m) = φ m+1 (A)π m (A)r (0)

εποµένως φ m+1 (z) = φ m (z) α m zπ m (z) π m+1 (z) = φ m+1 (z) + β m π m (z) φ 2 m+1 = φ 2 m 2α m zπ m φ m + α 2 m zπ2 m π m+1 = φ 2 m+1 + 2β m φ m+1 π m + β 2 mπ 2 m και µπορούµε να κατασκευάσουµε την αναδροµή φ 2 m+1 = φ 2 m α m z(2φ 2 m + 2β m 1 φ m π m 1 α m zπ 2 m) φ m+1 π m = φ 2 m + β m 1 φ m π m 1 α m zπ 2 m π 2 m+1 = φ 2 m+1 + 2β m φ m+1 π m + β 2 mπ 2 m φ m π m = φ 2 m + β m 1 φ m π m 1

Αλγόριθµος: Τετραγωνισµένος συζυγών κλίσεων Conjugate Gradient Squared (CGS) r (0) = b Ax (0), αυθαίρετο s (0) p (0) = r (0),u (0) = r (0) for m = 0,1,... και όσο δεν ικανοποιείται το κριτήριο σύγκλισης do α m = (s (0) r (m) )/(s (0) Ap (m) ) q (m) = u (m) α m Ap (m) x (m+1) = x (m) + α m (u (m) + q (m) ) r (m+1) = r (m) α m A(u (m) + q (m) ) β m = (s (0) r (m+1) )/(s (0) r (m) ) u (m+1) = r (m+1) + β m q (m) p (m+1) = u (m+1) + β m (q (m) + β m p (m) ) end for Κόστη/επανάληψη 2 MV, 2 DOT, 7 SAXPY

BiCGStab Βασική ιδέα Εξοµάλυνση καταλοίπων. r (m) CGS = ιδέαcgs {}}{ φ 2 m(a) r (0), r (m) BiCGStab = ψ m (A)φ m (A)r (0), επιλέγοντας κατάλληλο ψ

Αλγόριθµος BiCGStab r (0) = b Ax (0), αυθαίρετο s (0) p (0) = r (0) for m = 0,1,... και όσο δεν ικανοποιείται το κριτήριο σύγκλισης do α m = (s (0) r (m) )/(s (0) Ap (m) ) q (m) = r (m) α m Ap (m) ω m = (q(m) ) Aq (m) (Aq (m) ) Aq (m) x (m+1) = x (m) + α m p (m) + ω m q (m) ) r (m+1) = q (m) ω m Aq (m) β m = (s (0) r (m+1) )/(s (0) r (m) ) α m ω m p (m+1) = r (m+1) + β m (p (m) ω m Ap (m) ) end for Κόστη/επανάληψη 2 MV, 4 DOT, 6 SAXPY

BiCGStab

BiCGStab

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Μη αρνητικά µητρώα Θεωρία Perron-Frobenius για το ϕάσµα Θέµα: Στις εφαρµογές τα µητρώα συχνά είναι µη αρνητικά ή αυστηρά ϑετικά. Τότε διαθέτουν πολλές απροσδόκητες και χρήσιµες ιδιότητες.

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Μη αρνητικά µητρώα Θεωρία Perron-Frobenius για το ϕάσµα Θέµα: Στις εφαρµογές τα µητρώα συχνά είναι µη αρνητικά ή αυστηρά ϑετικά. Τότε διαθέτουν πολλές απροσδόκητες και χρήσιµες ιδιότητες. Κάθε A > 0 R n n έχει τουλάχιστον µία µηδενική ιδιοτιµή. Απόδειξη Εστω A > 0. Τότε Αν όλες οι ιδιοτιµές ήταν 0... η κανονική µορφή Jordan του X 1 AX = J ϑα είχε µηδενική διαγώνιο,... οπότε οπωσδήποτε A n = 0, που είναι αδύνατο καθώς A > 0. O. Perron, In Zur Theorie der Matrizen, Math. Ann. 64 (1907), 248-263.

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Πείραµα Μητρώα µε τυχαία στοιχεία από U(0, 1) (MATLAB rand(n)) n = 3

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Πείραµα Μητρώα µε τυχαία στοιχεία από U(0, 1) (MATLAB rand(n)) n = 3,5

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Πείραµα Μητρώα µε τυχαία στοιχεία από U(0, 1) (MATLAB rand(n)) n = 3,5,7

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Πείραµα Μητρώα µε τυχαία στοιχεία από U(0, 1) (MATLAB rand(n)) n = 3,5,7,40

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Πείραµα Μητρώα µε τυχαία στοιχεία από U(0, 1) (MATLAB rand(n)) n = 3,5,7,40,100

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Θεώρηµα Perron για ϑετικά µητρώα [Perron 1905] Μερικά αποτελέσµατα Αν A > 0 και r = ρ(a) (ϕασµατική ακτίνα) τότε: 1 r > 0 2 r λ(a) 3 Η αλγεβρική πολλαπλότητα του ρ(a) είναι 1. 4 Υπάρχει ιδιοδιάνυσµα x > 0 τ.ώ. Ax = rx. 5 Το διάνυσµα Perron p είναι το µοναδικό διάνυσµα για το οποίο ισχύει ότι Ap = rp,p > 0, και p 1 = 1. 6 r είναι η µοναδική ιδιοτιµή του A µε µέτρο r = 1.

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Μη αρνητικά µητρώα Πρόκληση: Να επεκταθούν οι παραπάνω ιδιότητες σε µη αρνητικά µητρώα;

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Μη αρνητικά µητρώα Πρόκληση: Να επεκταθούν οι παραπάνω ιδιότητες σε µη αρνητικά µητρώα; Μη προφανές! Αν ( 0 1 A = 0 0 ) τότε Αν r = 0 (παραβαίνει την 1η ιδιότητα Perron) η αλγεβρική πολλαπλότητα είναι 2 (παραβαίνει την 3η ιδιότητα Perron) x = [1,0] είναι το µοναδικό ιδιοδιάνυσµα για το οποίο e x = 1, αλλά το x δεν είναι ϑετικό (παραβαίνει την 4η ιδιότητα Perron) ( 0 1 A = 1 0 ) τότε λ(a) = ±i άρα υπάρχουν 2 ιδιοτιµές ίσες µε 1 σε απόλυτη τιµή (παραβαίνει την 6η ιδιότητα Perron).

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Η µάχη δεν χάθηκε Χωρίς περαιτέρω υποθέσεις µπορούµε να δείξουµε ότι Αν A 0 R n n και r = ρ(a) τότε r λ(a) και υπάρχει αντίστοιχο ιδιοδιάνυσµα x 0 τέτοιο ώστε Ax = rx. Ο Frobenius συνειδητοποίησε ότι τα προβλήµατα οφείλονταν όχι µόνον στην ύπαρξη µηδενικών, αλλά στη ϑέση αυτών µέσα στο µητρώο (G. Frobenius, em Ueber Matrizen aus nicht negativen Elementen, S.-B. Preuss Acad. Wiss. Berlin (1912), 456-477.)

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Αναγωγήσιµα µητρώα Ορισµός Ενα µητρώο A καλείται αναγωγήσιµο αν υπάρχει µεταθετικό µητρώο P ώστε το P AP να είναι κατά πλοκάδες άνω τριγωνικό, διαφορετικά καλείται µη αναγωγήσιµο. δηλ. ανν P AP = ( ) A11 A 12 0 A 22 Αν ένα µητρώο είναι µη αναγωγήσιµο, κάθε γραµµή και κάθε στήλη ϑα έχει τουλάχιστον ένα µη µηδενικό στοιχείο πέραν της διαγωίου. A R n n 0 είναι µη αναγωγήσιµο ανν (I + A) n 1 > 0. Υπάρχουν αλγόριθµοι κόστους αναγωγής µητρώου σε σε κατά πλοκάδες άνω τριγωνική µορφή (Tarjan, ϐασισµένες σε γραφοθωρία µε DFS κόστους O(n + nnz) Αναγωγησιµότητα αναγωγή ορισµένων προβληµάτων σε µικρότερα αλλά περισσότερα.

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Επέκταση ϕασµατικών ιδιοτήτων [Frobenius 12] Θεώρηµα Perron-Frobenius Αν A 0 και µη αναγωγήσιµο ισχύουν τα παρακάτω: 1 r = ρ(a) λ(a) και r > 0. 2 Η αλγεβρική πολλαπλότητα του ρ(a) είναι 1. 3 Υπάρχει ιδιοδιάνυσµα x > 0 τέτοιο ώστε Ax = rx. 4 Το διάνυσµα Perron είναι το µοναδικό διάνυσµα p που ικανοποιεί Ap = rp,p > 0, και p 1 = 1. εν υπάρχουν άλλα µη αρνητικά ιδιοδιανύσµατα του A εκτός από ϑετικά πολλαπλάσια του p. 5 Το ρ(a) αυξάνει αν αυξήσουµε οποιοδήποτε στοιχείο του A.

Θεωρία Perron-Frobenius για µη αρνητικά µητρώα Στοχαστικά µητρώα Κίνητρο: Πολλές εφαρµογές οδηγούν σε µητρώα µε στοιχεία που είναι πιθανότητες. Αυτά είναι ϑετικά και στοχαστικά (κατά στήλες ή κατά γραµµές). Ορολογία: Ενα διάνυσµα ή µητρώο, A 0, καλείται στοχαστικό κατά γραµµές όταν το άθροισµα των στοιχείων κάθε γραµµής ισούται µε 1. Παραδείγµατα: Στοχαστικές διαδικασίες, ουρές Markov Υπενθύµιση: Perron-Frobenius Αν A R n n είναι στοχαστικό τότε ρ(a) = 1 = λ max όπου το λ max αποκαλείται ϱίζα Perron και ικανοποιεί Ap = λ max (A)p όπου p > 0 είναι στοχαστικό. Εργοδικό ϑεώρηµα Αν ένα µητρώο είναι µη αναγωγήσιµο, στοχαστικό κατά στήλες (δηλ e A = e ) και η µοναδική ιδιοτιµή λ max = 1 είναι µεγαλύτερη όλων των άλλων σε µέτρο, τότε lim k Ak = pe