Podmienenost problému a stabilita algoritmu

Σχετικά έγγραφα
Matematika Funkcia viac premenných, Parciálne derivácie

Numerická lineárna algebra. Zobrazenie

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

7. FUNKCIE POJEM FUNKCIE

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

Riešenie sústavy lineárnych rovníc. Priame metódy.

Ekvačná a kvantifikačná logika

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

Komplexné čísla, Diskrétna Fourierova transformácia 1

Cvičenie č. 4,5 Limita funkcie

6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu

x x x2 n

Metódy numerickej matematiky I

Vektorový priestor V : Množina prvkov (vektory), na ktorej je definované ich sčítanie a ich

Obvod a obsah štvoruholníka

VLASTNÉ ČÍSLA A JORDANOV KANONICKÝ TVAR. Michal Zajac. 3 T b 1 = T b 2 = = = 2b

Numerické metódy matematiky I

Matematika 2. časť: Funkcia viac premenných Letný semester 2013/2014

Obsah. 1.1 Reálne čísla a ich základné vlastnosti Komplexné čísla... 8

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

FUNKCIE N REÁLNYCH PREMENNÝCH

ARMA modely čast 2: moving average modely (MA)

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Motivácia pojmu derivácia

MIDTERM (A) riešenia a bodovanie

Lineárna algebra I - pole skalárov, lineárny priestor, lineárna závislosť, dimenzia, podpriestor, suma podpriestorov, izomorfizmus

BANACHOVE A HILBERTOVE PRIESTORY

ARMA modely čast 2: moving average modely (MA)

7 Derivácia funkcie. 7.1 Motivácia k derivácii

Matematika 2. časť: Analytická geometria

Funkcie - základné pojmy

Tomáš Madaras Prvočísla

1 Úvod Predhovor Sylaby a literatúra Základné označenia... 3

Prechod z 2D do 3D. Martin Florek 3. marca 2009

G. Monoszová, Analytická geometria 2 - Kapitola III

Gramatická indukcia a jej využitie

Spojitosť a limity trochu inak

4. Výrokové funkcie (formy), ich definičný obor a obor pravdivosti

Kompilátory. Cvičenie 6: LLVM. Peter Kostolányi. 21. novembra 2017

2 Chyby a neistoty merania, zápis výsledku merania

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

Lineárne kódy. Ján Karabáš. Kódovanie ZS 13/14 KM FPV UMB. J. Karabáš (FPV UMB) Lineárne kódy Kodo ZS 13/14 1 / 19

Definícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

Prednáška Fourierove rady. Matematická analýza pre fyzikov IV. Jozef Kise lák

Goniometrické substitúcie

Návrh vzduchotesnosti pre detaily napojení

23. Zhodné zobrazenia

Reálna funkcia reálnej premennej

Príklady na precvičovanie Fourierove rady

Úvod do lineárnej algebry. Monika Molnárová Prednášky

1 Prevod miestneho stredného slnečného času LMT 1 na iný miestny stredný slnečný čas LMT 2

NUMERICKÁ MATEMATIKA. Moderné vzdelávanie pre vedomostnú spoločnosť/ Projekt je spolufinancovaný zo zdrojov EÚ. Fakulta elektrotechniky a informatiky

MATEMATICKÁ ANALÝZA 1

Numerické metódy Učebný text pre bakalárske štúdium

Úvod. Na čo nám je numerická matematika? Poskytuje nástroje na matematické riešenie problémov reálneho sveta (fyzika, biológia, ekonómia,...

PREHĽAD ZÁKLADNÝCH VZORCOV A VZŤAHOV ZO STREDOŠKOLSKEJ MATEMATIKY. Pomôcka pre prípravný kurz

Učební texty k státní bakalářské zkoušce Matematika Vektorové prostory. študenti MFF 15. augusta 2008

Kontrolné otázky na kvíz z jednotiek fyzikálnych veličín. Upozornenie: Umiestnenie správnej a nesprávnych odpovedí sa môže v teste meniť.

KATALÓG KRUHOVÉ POTRUBIE

MATEMATICKÁ OLYMPIÁDA

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

Vzorové príklady s riešeniami k lineárnej algebre a geometrie pre aplikovaných informatikov k písomke

Nelineárne optimalizačné modely a metódy

Margita Vajsáblová. ρ priemetňa, s smer premietania. Súradnicová sústava (O, x, y, z ) (O a, x a, y a, z a )

zlomok poznatel nej časti skutočnosti. Robí tak prostredníctvom svojich pojmov (tento proces môžeme nazvat formalizácia), jej hlavnou úlohou je potom

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Integrovanie racionálnych funkcií

množiny F G = {t1, t2,, tn} T a pre ľubovoľný valec C so základňou B1, B2,, Bn v bodoch t1, t2,, tn, takou, že pre t G - F je Bt = E, platí PF(C) = PG

Odporníky. 1. Príklad1. TESLA TR

Deliteľnosť a znaky deliteľnosti

Symbolická logika. Stanislav Krajči. Prírodovedecká fakulta

viacrozmerných a nekonečnorozmerných priestoroch. A ako nasvedčuje jej názov, pôjde o rovnice nelineárne.

AerobTec Altis Micro

Prirodzené čísla. Kardinálne čísla

1 Polynómy a racionálne funkcie Základy Polynómy Cvičenia Racionálne funkcie... 17

Mini minimaliz acia an BUˇ Koˇ sice 2011

3. Striedavé prúdy. Sínusoida

Diferenciálny a integrálny počet funkcií viac premenných v príkladoch

PageRank algoritmus. Univerzita Komenského v Bratislave Fakulta Matematiky, Fyziky a Informatiky

Planárne a rovinné grafy

Úvod 2 Predhovor... 2 Sylaby a literatúra... 2 Označenia... 2

Spojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.

Analýza údajov. W bozóny.

Metódy vol nej optimalizácie

2. prednáška. Teória množín I. množina operácie nad množinami množinová algebra mohutnosť a enumerácia karteziánsky súčin

Obyčajné diferenciálne rovnice

p(α 1 ) = u 1. p(α n ) = u n. Definícia (modulárna reprezentácia polynómu). Zobrazenie

24. Základné spôsoby zobrazovania priestoru do roviny

Derivácia funkcie. Pravidlá derivovania výrazov obsahujúcich operácie. Derivácie elementárnych funkcií

TECHNICKÁ UNIVERZITA V KOŠICIACH STROJNÍCKA FAKULTA MATEMATIKA 1. Funkcia jednej premennej a jej diferenciálny počet

1.1 Zobrazenia a funkcie

DOMÁCE ZADANIE 1 - PRÍKLAD č. 2

Metodicko pedagogické centrum. Národný projekt VZDELÁVANÍM PEDAGOGICKÝCH ZAMESTNANCOV K INKLÚZII MARGINALIZOVANÝCH RÓMSKYCH KOMUNÍT

Pevné ložiská. Voľné ložiská

Iterativno reševanje sistemov linearnih enačb. Numerične metode, sistemi linearnih enačb. Numerične metode FE, 2. december 2013

ZADANIE 1_ ÚLOHA 3_Všeobecná rovinná silová sústava ZADANIE 1 _ ÚLOHA 3

Numerické metódy, pravdepodobnosť a matematická štatistika

Transcript:

Podmienenost problému a stabilita algoritmu Ing. Gabriel Okša, CSc. Matematický ústav Slovenská akadémia vied Bratislava Stavebná fakulta STU G. Okša: Podmienenost a stabilita 1/19

Obsah 1 Vektorové a maticové normy 2 Podmienenost problému 3 Stabilita algoritmu 4 Príklady G. Okša: Podmienenost a stabilita 2/19

Vektorové normy Norma n-rozmerného vektora je funkcia : C n R, ktorá spĺňa nasledujúce tri podmienky pre všetky vektory x a y a skaláry α C: 1 x 0, a x = 0 práve vtedy, ak x = 0; 2 x + y x + y (trojuholníková nerovnost ); 3 α x = α x. Najdôležitejšie normy: x 1 = n i=1 x i, x 2 = ( n i=1 x i 2) 1/2 = x x, x = max 1 i n x i. Trieda p-noriem pre 1 p < : x p = ( n i=1 x i p) 1/p. Vážená p-norma: Nech W = diag(w 1,..., w n ) je diagonálna matica reálnych váh. Potom: x W = ( n i=1 w i x i p) 1/p. G. Okša: Podmienenost a stabilita 3/19

Maticové normy - 1/3 Indukovaná maticová norma: Každá matica A C m n reprezentuje lineárne zobrazenie A : C n C m, t.j. zo svojho definičného oboru do oboru hodnôt. Nech sú v C n a C m dané vektorové normy (n) a (m). Potom indukovaná maticová norma A (m,n) je najmenšie číslo C také, že pre všetky x C n platí: Ax (m) C x (n). Vd aka vlastnosti č. 3 v definícii vektorovej normy je akcia A na l ubovol ný vektor určená jej akciou na jednotkové vektory. Preto: A (m,n) = Ax (m) sup = max x C n, x 0 x Ax (m). (n) x C n, x (n) =1 Príklad: A 1 = max 1 j n m i=1 a ij... max. stĺpcová suma; A = max 1 i m n j=1 a ij... max. riadková suma. G. Okša: Podmienenost a stabilita 4/19

Maticové normy - 2/3 A nemusí byt indukovaná vektorovou normou, t.j. akciou matice na jednotkové vektory. Maticová norma je funkcia : C m n R, ktorá spĺňa nasledovné axiómy pre všetky matice A, B a skaláry α C: 1 A 0, a A = 0 práve vtedy, ak A = 0; 2 A + B A + B (trojuholníková nerovnost ); 3 α A = α A ; 4 A B A B. Príklad: Frobeniova norma matice nie je indukovaná vektorovou normou: 1/2 m n A F = a ij 2. i=1 j=1 G. Okša: Podmienenost a stabilita 5/19

Maticové normy - 3/3 Základné vlastnosti vektorových a maticových noriem (A C m n, x C n ): x y x 2 y 2 (Cauchy Schwartz); x x 2 ; x 2 n x ; A n A 2 ; A 2 m A ; A 2 = sup x 2 =1 Ax 2 je tzv. 2-norma (tiež spektrálna norma) matice A. Nie je to Frobeniova norma, pretože je to vektorovo indukovaná norma! Pre symetrické matice je A 2 = λ max, kde λ max je najväčšie vlastné číslo matice A v absolútnej hodnote. G. Okša: Podmienenost a stabilita 6/19

Podmienenost problému Problém, ktorý treba vyriešit, možno modelovat ako vektorovú funkciu f : X Y z normovaného vektorového priestoru vstupných dát X do normovaného vektorového priestoru riešení Y. Obvykle je f nelineárna funkcia, ale je často aspoň spojitá. Skúmame chovanie f v danom dátovom vektore x X vzhl adom na malé zmeny (perturbácie) bodu x. Ked urobím malú zmenu v x, ako sa táto perturbácia prenesie na riešenie f (x) v Y? Dobre podmienený problém má tú vlastnost, že všetky malé perturbácie bodu x vedú iba k malým zmenám f (x). Zle podmienený problém: niektoré malé perturbácie bodu x vedú k vel kým zmenám f (x). G. Okša: Podmienenost a stabilita 7/19

Absolútne a relatívne číslo podmienenosti - 1/3 Nech δx je malá perturbácia x a δf = f (x + δx) f (x). Absolútne číslo podmienenosti ˆκ = ˆκ(x) problému f v bode x je definované ako: ˆκ = sup δx δf δx pri δx 0. Relatívne číslo podmienenosti κ = κ(x) problému f v bode x je definované ako: ( / ) δf δx κ = sup pri δx 0. δx f (x) x G. Okša: Podmienenost a stabilita 8/19

ˆκ a κ - 2/3 Ak je f diferencovatel ná, definujme Jakobián J(x) funkcie f v bode x ako maticu, ktorej prvok (i, j) je parciálna derivácia f i / x j vypočítaná v bode x. Potom: ˆκ = J(x), κ = J(x) f (x) / x, kde maticová norma J(x) je indukovaná vektorovými normami na X a Y. κ (rel.) je vhodnejšie ako ˆκ (abs.), pretože počítanie v pohyblivej rádovej čiarke vnáša do výpočtu relatívne chyby (nie absolútne). Dobre podmienená úloha: κ = 1, 10, 10 2. Zle podmienená úloha: κ = 10 6, 10 12. G. Okša: Podmienenost a stabilita 9/19

ˆκ a κ - 3/3 Príklad 1: Je daná funkcia f : R 2 R, f (x) = x 1 x 2, kde x = (x 1, x 2 ) T. Číslo podmienenosti κ s použiím -normy v R 2 i v R: Jakobián: J(x) = κ = [ f x 1 J(x) 2 f (x) / x = x 1 x 2 / max{ x 1, x 2 }. f x 2 ] = [1, 1], t.j. J(x) = 2. Takže κ je vel ké, ak x 1 x 2 0, t.j. problém je zle podmienený, ak x 1 x 2 ( katastrofické odčítanie dvoch čísiel). Príklad 2: Nech x > 0 a f (x) = x. Zistite κ. Jakobián: J(x) = f (x) = 1/(2 x) = J(x). Ďalej: f (x) = x, x = x (lebo x > 0). Takže: κ = J(x) f (x) / x = 1/(2 x) x/x dobre podmienený pre všetky x > 0. = 1 2, t.j. problém výpočtu x je G. Okša: Podmienenost a stabilita 10/19

Problém versus algoritmus Zopakujme, že matematický problém je zobrazenie f : X Y z vektorového priestoru dát X do vektorového priestoru riešení Y. Algoritmus na riešenie f možno chápat ako iné zobrazenie f : X Y medzi tými istými vektorovými priestormi. Spresnenie definície algoritmu: Nech je pevne daný problém f, počítač s floating-point aritmetikou podl a IEEE FPS (1985), algoritmus pre riešenie problému f a implementácia tohto algoritmu vo forme programu na danom počítači. Zoberme vstupné dáta (vektor) x X, vložme ich do počítača ako vstup pre program (t.j. v tom momente ich zaokrúhlime: fl(x i ) = x i (1 + ɛ i ), ɛ i µ). Potom vykonajme program v počítači. Výsledkom je množina vypočítaných floating-point čísiel z Y, ktorú označíme f (x). G. Okša: Podmienenost a stabilita 11/19

Presnost algoritmu Na výstup algoritmu f (x) vplývajú minimálne zaokrúhl ovacie chyby počas behu programu, ktorý implementuje daný algoritmus. Dokonca na dvoch rôznych počítačoch a na rovnakých vstupných dátach môže ten istý algoritmus (program) dat rôzne výsledky. Dobrý algoritmus pre problém f by mal dat presný výsledok. Absolútna chyba výpočtu: f (x) f (x) by mala byt malá pre každé x X. Relatívna chyba výpočtu: f (x) f (x) f (x) by mala byt malá pre každé x X, t.j. = O(µ) ( rádovo µ ), kde µ je jednotka zaokrúhl ovania. Pre zle podmienené problémy je táto požiadavka príliš silná. Už samotné zaokrúhlenie vstupných dát môže podstatne zmenit výsledok. G. Okša: Podmienenost a stabilita 12/19

Stabilita algoritmu Namiesto požiadavky na vysokú relatívnu presnost výpočtu nastupuje požiadavka na stabilitu algoritmu. Algoritmus je stabilný, ak pre každý vstup x X platí f (x) f ( x) f ( x) = O(µ) pre nejaké x relatívne blízke k x: x x x = O(µ). Slovne: Stabilný algoritmus dáva takmer správny výsledok pre takmer správne vstupné dáta. G. Okša: Podmienenost a stabilita 13/19

Spätná stabilita algoritmu Mnohé algoritmy v NLA spĺňajú podmienku, ktorá je silnejšia a jednoduchšia ako stabilita. Algoritmus f pre problém f je spätne stabilný ( backward stable ), ak pre každý vstup x X platí: f (x) = f ( x) pre nejaké x relatívne blízke k x: x x x = O(µ). Slovne: Spätne stabilný algoritmus dáva presne správny výsledok pre takmer správne vstupné dáta. G. Okša: Podmienenost a stabilita 14/19

Zmysel symbolu O(µ) - 1/2 Označenie φ(t) = O(ψ(t)) znamená, že existuje konštanta C > 0 tak, že pre t dostatočne blízko ku stanovenej limite (napr. t 0 alebo t ) platí: φ(t) C ψ(t). Príklad: sin 2 t = O(t 2 ) pri t 0 znamená, že existuje C > 0 tak, že pre dostatočne malé t je sin 2 t C t 2. Iný druh označenia: φ(s, t) = O(ψ(t)) rovnomerne vzhl adom na s. Znamená to, že konštanta C > 0 nezávisí od s. Príklad: (sin 2 t) (sin 2 s) = O(t 2 ) rovnomerne vzhl adom na s pri t 0. G. Okša: Podmienenost a stabilita 15/19

Zmysel symbolu O(µ) - 2/2 Takže v NLA tvrdenie: computed = O(µ) znamená tri veci: 1 computed reprezentuje normu vypočítaného výsledku pri použití algoritmu f na problém f, pričom výsledok závisí od vstupných dát x X a od µ. 2 Implicitný limitný proces je µ 0. To znamená, že ak by algoritmus bežal na viacerých počítačoch s hodnotou µ klesajúcou k nule, potom computed musí klesat proporcionálne s µ (alebo rýchlejšie). 3 Označenie O( ) platí rovnomerne vzhl adom na x X. Príklad: Nech vypočítané riešenie x lin. sústavy Ax = b s regulárnou maticou A rádu m má relatívnu chybu: x x x = O(κ(A) µ), kde κ(a) = A A 1 je tzv. číslo podmienenosti matice A. Konštanta C > 0 nezávisí od A a b, ale závisí od m, pretože zmena m znamená zmenu dimenzie priestoru vstupov X a priestoru riešení Y! G. Okša: Podmienenost a stabilita 16/19

Presnost versus spätná stabilita Je spätne stabilný algoritmus aj presný? Závisí to od čísla podmienenosti κ(x) problému. Veta: Nech je na riešenie problému f : X Y s číslom podmienenosti κ(x) použitý spätne stabilný algoritmus f : X Y, ktorý je implementovaný na počítači spĺňajúcom IEEE Floating Point Standard (1985). Potom relatívna chyba výpočtu je: f (x) f (x) f (x) = O(κ(x) µ). Takže ak je κ(x) malé, potom výsledok výpočtu bude presný v relatívnom zmysle. Ak je κ(x) vel ké, potom relatívna presnost výsledku môže byt nízka (t.j. nemáme zaručenú vysokú relatívnu presnost ). G. Okša: Podmienenost a stabilita 17/19

Príklady 1. Spätná stabilita odčítania dvoch floating-point čísiel: f (x 1, x 2 ) = x 1 x 2 : C 2 C, takže algoritmus pre f je f (x1, x 2 ) = fl[fl(x 1 ) fl(x 2 )]; fl(x 1 ) = x 1 (1 + ɛ 1 ), fl(x 2 ) = x 2 (1 + ɛ 2 ), ɛ i µ; fl[fl(x 1 ) fl(x 2 )] = [x 1 (1 + ɛ 1 ) x 2 (1 + ɛ 2 )] (1 + ɛ 3 ) = x 1 (1 + ɛ 1 ) (1 + ɛ 3 ) x 2 (1 + ɛ 2 ) (1 + ɛ 3 ) = x 1 (1 + ɛ 1 + ɛ 3 + ɛ 1 ɛ 3 ) x 2 (1 + ɛ 2 + ɛ 3 + ɛ 2 ɛ 3 ) = x 1 (1 + ɛ 4 ) x 2 (1 + ɛ 5 ), ɛ 4, ɛ 5 2µ + O(µ 2 ). Takže f (x 1, x 2 ) sa presne rovná rozdielu x 1 x 2, kde: x 1 x 1 x 1 = O(µ), x 2 x 2 x 2 = O(µ), a akékol vek C > 2 je použitel né vnútri O( ) symbolov. Potom pre euklidovskú normu na C 2 : = O(µ). x x x G. Okša: Podmienenost a stabilita 18/19

Príklady 2. Je pravda alebo nie? a) sin x = O(1) pre x + ; b) sin x = O(1) pre x 0; c) ln x = O(x 1/100 ) pre x + ; d) n! = O((n/e) n ) pre n + ; e) S = O(V 2/3 ) pre V +, kde S je plocha a V je objem gule. 3. Nech pre x R sa súčet 1 + x počíta pomocou algoritmu f (x) = fl(1 + fl(x)) (t.j. číslo 1 je v počítači reprezentované presne). Ukážte, že pre tento algoritmus je absolútna chyba O(µ), ale algoritmus nie je spätne stabilný. (Návod: uvažujte prípad x 0). G. Okša: Podmienenost a stabilita 19/19