Numerička analiza 26. predavanje Saša Singer singer@math.hr web.math.hr/~singer PMF Matematički odjel, Zagreb NumAnal 2009/10, 26. predavanje p.1/21
Sadržaj predavanja Varijacijske karakterizacije svojstvenih vrijednosti hermitskih matrica: Rayleigh Ritzov teorem. Courant Fischerov teorem. Weylov teorem. Lokacija svojstvenih vrijednosti: Geršgorinov teorem. Cassinijevi ovali. NumAnal 2009/10, 26. predavanje p.2/21
Varijacijska karakterizacija svojstvenih vrijednosti hermitskih matrica NumAnal 2009/10, 26. predavanje p.3/21
Rayleigh Ritzov teorem Prisjetimo se, hermitske matrice imaju samo realne svojstvene vrijednosti, mogu se dijagonalizirati unitarnim sličnostima, bez obzira jesu li svojstvene vrijednosti različite ili ne, uvijek postoji ortogonalna baza svojstvenih vektora. U ovom poglavlju, svojstvene su vrijednosti hermitske matrice A, reda n, uvijek poredane tako da vrijedi: λ min := λ 1 λ 2 λ n =: λ max. Najmanja i najveća svojstvena vrijednost lako se mogu karakterizirati kao rješenje problema uvjetne minimizacije, odnosno, maksimizacije. NumAnal 2009/10, 26. predavanje p.4/21
Rayleigh Ritzov teorem Teorem (Rayleigh Ritz). Neka je A hermitska matrica sa svojstvenim vrijednostima poredanim od najmanje do najveće. Tada je za sve x C n. Nadalje, λ 1 x x x Ax λ n x x, λ max = λ n = max x =0 λ min = λ 1 = min x =0 x Ax x x = max x x=1 x Ax, x Ax x x = min x x=1 x Ax. NumAnal 2009/10, 26. predavanje p.5/21
Rayleigh Ritzov teorem Dokaz. Budući da je A hermitska, postoji unitarna matrica U koja dijagonalizira A A = UΛU, Λ = diag(λ 1,...,λ n ). Za proizvoljni x C n vrijedi x Ax = (x U)Λ(U x) = λ i (U x) i 2. U ovoj linearnoj kombinaciji svojstvenih vrijednosti λ i, za koeficijente vrijedi (U x) i 2 0. Iz λ min λ i λ max slijedi λ min (U x) i 2 x Ax λ max (U x) i 2. NumAnal 2009/10, 26. predavanje p.6/21
Rayleigh Ritzov teorem Budući da je U unitarna, onda je (U x) i 2 = (x U)(U x) = x x. Dakle, dokazali smo da je λ min x x x Ax λ max x x. Primijetite da je ocjena oštra (tj. ne može se poboljšati) i dostiže se ako je x svojstveni vektor matrice A za λ min, odnosno, λ max. Rayleigh Ritzov teorem daje varijacijsku karakterizaciju dvije rubne svojstvene vrijednosti. Što je s ostalima? NumAnal 2009/10, 26. predavanje p.7/21
Courant Fischerov teorem Ideja. Promatrajmo sve vektore x koji su ortogonalni na svojstveni vektor u 1. Za takve x-ove, zbog u 1x = 0, vrijedi sljedeća modifikacija: x Ax = λ i (U x) i 2 = λ i u ix 2 = λ i u ix 2. i=2 Zbog nenegativnosti ove linearne kombinacije vrijednosti λ 2,...,λ n i njihovog poretka, imamo λ i u ix 2 λ 2 u ix 2 = λ 2 (U x) i 2 = λ 2 x x. i=2 i=2 Nejednakost će postati jednakost, ako izaberemo x = u 2. NumAnal 2009/10, 26. predavanje p.8/21
Courant Fischerov teorem Dakle, dobili smo varijacijsku karakterizaciju za drugu najmanju svojstvenu vrijednost λ 2 : min x Ax x 0 x x = min x Ax = λ 2. x x=1 x u 1 x u 1 Dodatno, ako na lijevoj strani ovog izraza, umjesto svojstvenog vektora u 1 za vrijednost λ 1, uzmemo bilo koji vektor w 1 C n, onda se taj izraz može samo smanjiti, tj. njegov maksimum se dotiže baš za w 1 = u 1. Dokaz ide projekcijom w 1 na u 1. Na sličan se način mogu izvesti i općenitije karakterizacije. NumAnal 2009/10, 26. predavanje p.9/21
Courant Fischerov teorem Teorem (Courant Fischer). Neka je A hermitska matrica sa svojstvenim vrijednostima λ i, poredanim od najmanje do najveće λ 1 λ 2 λ n. Neka je k cijeli broj za koji vrijedi 1 k n. Tada je min w 1,w 2,...,w n k n max w 1,w 2,...,w k 1 n max x Ax n x x = λ k, x 0,x x w 1,w 2,...,w n k min x Ax n x x = λ k. x 0,x x w 1,w 2,...,w k 1 NumAnal 2009/10, 26. predavanje p.10/21
Primjene varijacijske karakterizacije Teorem (Weyl). Neka su A i B hermitske matrice istog reda n, i neka su λ i (A), λ i (B), λ i (A + B) svojstvene vrijednosti u rastućem poretku. Za svaki k = 1,...,n vrijedi λ k (A) + λ 1 (B) λ k (A + B) λ k (A) + λ n (B). Dokaz. Krenimo od Rayleigh Ritzovog teorema za matricu B. Za proizvoljni x C n, x 0, imamo ogradu λ 1 (B) x Bx x x λ n(b). Sad iskoristimo Courant Fischerov teorem za matricu A + B. NumAnal 2009/10, 26. predavanje p.11/21
Primjene varijacijske karakterizacije Za bilo koji k = 1,...,n, iz prve karakterizacije imamo redom λ k (A + B) = min w 1,w 2,...,w n k n = min w 1,w 2,...,w n k n min w 1,w 2,...,w n k n = λ k (A) + λ 1 (B). max x (A + B)x n x x 0,x x x w 1,w 2,...,w n k max x 0,x n x w 1,w 2,...,w n k max x 0,x n x w 1,w 2,...,w n k Na isti način dobivamo i gornju ogradu. ( ) x Ax x x + x Bx x x ( ) x Ax x x + λ 1(B) NumAnal 2009/10, 26. predavanje p.12/21
Lokacija svojstvenih vrijednosti NumAnal 2009/10, 26. predavanje p.13/21
Geršgorinov teorem Neka je A kvadratna matrica. Ako je možemo napisati kao pri čemu je D dijagonalna, B ima nul-dijagonalu, a ε je neki mali broj, A = D + εb, onda se svojstvene vrijednosti matrice A nalaze u maloj okolini oko dijagonalnih elemenata matrice D. Ovakovo razmišljanje može se formalizirati Geršgorinovim teoremom. NumAnal 2009/10, 26. predavanje p.14/21
Geršgorinov teorem Teorem (Geršgorin). Neka je A kvadratna matrica reda n i neka je R i(a) = a ij, 1 i n. j i R i(a) je suma apsolutnih vrijednosti elemenata u i-tom retku, bez dijagonalnog. Sve svojstvene vrijednosti matrice A nalaze se u uniji od n diskova n G(A) := {z C z a ii R i(a)}. Nadalje, ako unija k tih diskova tvori povezano područje koje nema presjeka s ostalih n k diskova, tada se točno k svojstvenih vrijednosti nalazi unutar tog područja. NumAnal 2009/10, 26. predavanje p.15/21
Geršgorinov teorem Dokaz. Neka je λ bilo koja svojstvena vrijednost od A i neka je Ax = λx. Medu elementima svojstvenog vektora x postoji najveći element po apsolutnoj vrijednosti, takav da je x p x i, i = 1,...,n, i mora biti x p 0, zbog x 0. Pretpostavka Ax = λx daje λx p = [λx] p = [Ax] p = a pj x j, ili, ekvivalentno, x p (λ a pp ) = a pj x j. j p NumAnal 2009/10, 26. predavanje p.16/21
Geršgorinov teorem Iz ove jednadžbe, korištenjem nejednakosti trokuta, dobivamo x p λ a pp = a pj x j j p a pj x j = j p a pj x j j p x p j p a pj = x p R p(a). Zbog x p 0, slijedi da je λ a pp R p(a), za taj indeks p. Drugi dio teorema bavi se lokacijom nultočaka, ako postoji presjek više krugova (v. Horn Johnson, Matrix Analysis). NumAnal 2009/10, 26. predavanje p.17/21
Geršgorinov teorem Geršgorinov teorem može se primijeniti i na matricu A T. Definiramo C j(a) = a ij, 1 i n. i j C j(a) je suma apsolutnih vrijednosti elemenata u j-tom stupcu od A, bez dijagonalnog. Korolar. Sve svojstvene vrijednosti kvadratne matrice A leže u uniji od n diskova n { G(A T ) := z C z ajj C j(a) }. Ako je unija od k diskova povezana i odvojena od ostatka, unutar nje se nalazi točno k svojstvenih vrijednosti. NumAnal 2009/10, 26. predavanje p.18/21
Geršgorinov teorem Iz prethodnih rezultata slijedi da se sve svojstvene vrijednosti matrice A nalaze u presjeku G(A) G(A T ). Postoji nekoliko poboljšanja ovog rezultata. Prvi od njih se dobiva korištenjem sličnosti: Za regularan S, matrice A i S 1 AS imaju jednake svojstvene vrijednosti. Za S je najbolje/najlakše uzeti dijagonalnu matricu S = D = diag(p 1,p 2,...,p n ), p i > 0. Elementi slične matrice su (D 1 AD) ij = a ij p j /p i. Primijenimo Geršgorinov teorem na D 1 AD. NumAnal 2009/10, 26. predavanje p.19/21
Geršgorinov teorem Korolar. Neka je A kvadratna matrica i neka su p 1,...,p n pozitivni realni brojevi. Sve svojstvene vrijednosti matrice A leže u području i u G(D 1 AD) := G((D 1 AD) T ) := n { z C z a ii 1 p i n { z C z a jj p j j i } p j a ij, i j } 1 a ij. p i NumAnal 2009/10, 26. predavanje p.20/21
Cassinijevi ovali Teorem (Cassinijevi ovali). Svaka svojstvena vrijednost matrice A leži unutar barem jednog od n(n 1)/2 Cassinijeva ovala λ a kk λ a ll R k(a) R l(a) = i unutar barem jednog ovala ( j k λ a kk λ a ll C k (A) C l (A) = ( i k gdje je 1 k,l n i k l. ) a kj ) a ik ( j l ( i l ) a lj, ) a il, NumAnal 2009/10, 26. predavanje p.21/21