Izeljava Jensenove in Hölderjeve neenakosti ter neenakosti Minkowskega
1. Najosnovnejše o konveksnih funkcijah Definicija. Naj bo X vektorski rostor in D X konveksna množica. Funkcija ϕ: D R je konveksna, če za oljubna a,b D ter oljuben θ [0,1] velja: ϕ ( (1 θ)a+θb ) (1 θ)ϕ(a)+θϕ(b) (1.1) Funkcija ϕ je torej konveksna, če za oljubna a in b graf njene zožitve na daljico ab leži od daljico s krajiščema ( a,ϕ(a) ) in ( b,ϕ(b) ). Slika! Konveksne funkcije, definirane na intervalih na realni osi, lahko karakteriziramo kot funkcije, ki imajo naraščajoč diferenčni količnik. Trditev 1.1. Naj bo I R interval in naj bo dana funkcija ϕ: I R. Naslednje trditve so ekvivalentne. (1) Funkcija ϕ je konveksna na intervalu I. (2) Za oljubna števila a < b in c [a,b] iz intervala I velja: ϕ(c) b c c a ϕ(a)+ ϕ(b) (1.2) b a b a (3) Za oljubna števila a 1,a 2,b 1,b 2 I, za katera je a 1 a 2, b 1 b 2, a 1 < b 1 in a 2 < b 2, velja (slika!): ϕ(b 1 ) ϕ(a 1 ) ϕ(b 2) ϕ(a 2 ) (1.3) b 1 a 1 b 2 a 2 Dokaz. (1) (2): V enačbo (1.1) vstavimo θ := (c a)/(b a) in dobimo (1.2). (2) (1): V enačbo (1.2) vstavimo c := (1 θ)a+θb in dobimo (1.1). (2) (3): Za a < c b iz (1.2) dobimo (slika!): ϕ(c) ϕ(a) c a za a c < b a rav tako iz (1.2) dobimo (slika!): ϕ(b) ϕ(a) b a (1.4) Iz (1.4) in (1.5) zdaj izeljemo: ϕ(b) ϕ(a) b a ϕ(b) ϕ(c) b c (1.5) ϕ(b 1 ) ϕ(a 1 ) b 1 a 1 ϕ(b 2) ϕ(a 1 ) b 2 a 1 ϕ(b 2) ϕ(a 2 ) b 2 a 2 kar je natančno (3). (3) (2): V (1.3) vstavimo nr. a 1 = a, a 2 = b 1 = c in b 2 = b, a dobimo (1.2). Posledica 1.2. Funkcija, ki je definirana na odrtem intervalu in tam odvedljiva, je konveksna natanko tedaj, ko je njen odvod naraščajoča funkcija. 1
Posledica 1.3. Funkcija ϕ, ki je definirana na odrtem intervalu in tam dvakrat odvedljiva, je konveksna natanko tedaj, ko je ϕ 0. Trditev 1.4. Naj bo I R interval, ϕ: I R a konveksna funkcija. Tedaj za vsak c iz notranjosti intervala I obstaja taka linearna funkcija l: R R, da velja l(c) = ϕ(c) in l(x) ϕ(x) za vsak x I. Slika! Dokaz. Iz neenačbe (1.3) sledi: α := su a<c ϕ(a) ϕ(c) a c ϕ(b) ϕ(c) inf b>c b c =: β (1.6) Izberimo oljubno število α k β in definirajmo: l(x) := ϕ(c)+k(x c) Brez težav reverimo, da funkcija l izolnjuje zahtevana ogoja. Oomba. Iz slednjega dokaza je razvidno, da ima vsaka konveksna funkcija realne sremenljivke v notranjih točkah definicijskega območja levi in desni odvod: to sta namreč koeficienta α in β iz (1.6). Trditev 1.5. Če je I R odrt interval, je vsaka konveksna funkcija ϕ: I R zvezna. Dokaz. Naj bo c I. Ker je interval I odrt, obstajata taki števili a,b I, da je a < c < b. Naj bo c < x < b. Po trditvi 1.1 velja: ϕ(c) ϕ(a) c a ϕ(x) ϕ(c) x c ϕ(b) ϕ(c) b c od koder sledi, da je ϕ v točki c zvezna z desne (slika!). Podobno dokažemo, da je ϕ zvezna tudi z leve. 2. Jensenova neenakost Izrek 2.1 (Jensenova neenakost). Naj bo (X, F) merljiv rostor s ozitivno mero µ, za katero velja µ(x) = 1. Dan naj bo še interval I R, merljiva funkcija g: X I in konveksna funkcija ϕ: I R. Tedaj velja: ( ) ϕ gdµ (ϕ g)dµ (2.1) če seveda integrala obstajata. 2
Oomba. Iz redostavk izreka avtomatično sledi, da je tudi funkcija ϕ g merljiva, saj je funkcija ϕ vsaj v notranjosti intervala I zvezna in zato merljiva. Prav tako sledi, da je gdµ I. Dokaz izreka 2.1. Najrej oazimo, da v (2.1) velja enakost, če je funkcija ϕ linearna. Po trditvi 1.4 obstaja taka linearna funkcija l, da velja l( gdµ) = ϕ( gdµ) in l(x) ϕ(x) za vsak x I. Sledi: ( ) ( ) ϕ gdµ = l gdµ = (l g)dµ (ϕ g)dµ in izrek je dokazan. Jensenova neenakost je oslošitev številnih drugih neeenakosti. V klasični, manj slošni obliki je Jensenova neenakost formulirana na naslednji način. Posledica 2.2. Naj bo I R interval, ϕ: I R a konveksna funkcija. Tedaj za oljubne točke x 1,...x n I in oljubna števila α 1,...α n 0 z vsoto 1 velja: ϕ(α 1 x 1 +...α n x n ) α 1 ϕ(x 1 )+...+α n ϕ(x n ) (2.2) Kot zgled lahko vzamemo eksonentno funkcijo ϕ(x) = e x, ki je očitno konveksna, saj ima ozitiven drugi odvod. Če vstavimo še x i = lny i, kjer so y i ozitivna realna števila, dobimo neenakost med aritmetično in geometrično sredino: Zgornja enakost velja za oljubne y 1,...y n 0. y α 1 1...y αn n α 1 y 1 +...α n y n (2.3) 3. Hölderjeva neenakost Naj bo (X,F) merljiv rostor s ozitivno mero µ in naj bo f: X F, kjer je F {R,C}, merljiva funkcija. Za 1 < označimo: ( f := ) 1/ f dµ Označimo še: Nadalje označimo: f := esssu f L (µ) := {f: X F merljiva ; f < } Definicija. Naj bo 1,q,. Števili in q imenujemo konjugirana eksonenta, če je bodisi eden od njiju enak 1, drugi a, bodisi 1/+1/q = 1. 3
Izrek 3.1 (Hölderjeva neenakost). Naj bosta in q konjugirana eksonenta, dani a naj bosta še funkciji f L (µ) in g L q (µ). Tedaj je funkcija fg absolutno integrabilna glede na µ in velja: fgdµ f g q (3.1) Preden gremo dokazat izrek, bomo izeljali še eno neenakost. Naj bo x,y 0 in naj bosta 1 <,q < konjugirana eksonenta. Če v neenakost (2.3) vstavimo n = 2, y 1 = x, y 2 = y q, α 1 = 1/ in α 2 = 1/q, dobimo Youngovo neenakost: xy x + yq q (3.2) Zgornjo neenakost a lahko še malo izostrimo: vzemimo k > 0 in sremenljivko x omnožimo, y a delimo s k. Dobimo: xy k x + 1 qk qyq (3.3) Zgornja ocena je maksimalna možna izostritev ocene (3.2), saj velja naslednja trditev. Trditev 3.2. Za oljubni števili x,y 0 in konjugirana eksonenta 1 <,q < velja: [ k xy = inf k>0 x + 1 ] (3.4) qk qyq Dokaz. Dovolj je dokazati, da za oljubna x,y 0 v oceni (3.3) za neki k > 0 ali vsaj v limiti velja enakost. Če je x = 0, velja enakost v limiti, ko gre k roti neskončno; če je y = 0, velja enakost v limiti, ko gre k roti nič. Za x,y > 0 a enakost velja, če ostavimo: k := y1/ x 1/q Dokaz izreka 3.1. Dovolj je dokazati neenakost (3.1), in sicer le za rimer, ko je f, g 0. Za rimer, ko je kateri od konjugiranih eksonentov neskončen, je neenakost očitna. Za 1 <,q < a o (3.3) za vsak x X in vsak k > 0 velja: f(x)g(x) k f(x) + 1 qk qg(x)q Ko neenakost integriramo o µ, dobimo: fgdµ k f + 1 qk q g q q Ko naredimo infimum o k in uorabimo trditev 3.2, dobimo natančno to, kar smo iskali. Hölderjeva neenakost nam da še drugačno karakterizacijo količin f, ki je tesno ovezana z dualnostjo rostorov L in L q. 4
Trditev 3.3. Naj bosta 1 < in 1 < q konjugirana eksonenta. Tedaj za vsako funkcijo f L (µ) velja enakost: { } f = su fgdµ ; g q = 1 (3.5) Oomba. Za = in q = 1 enakost ne velja vedno. Kot rotirimer vzemimo za X oljubno neštevno množico, za σ-algebro F a vzamemo vse odmnožice množice X, ki so bodisi končne ali števno neskončne bodisi so taki njihovi komlementi. Mera µ naj bo na končnih in števno neskončnih množicah enaka 0, sicer a. Če vzamemo f(x) = 1 za vsak x X, ta funkcija očitno riada L (µ) in velja f = 1, enakost 3.5 a ne velja, saj rostor L 1 (µ) vsebuje le funkcije, ki so skoraj ovsod enake 0. Dokaz trditve 3.3. Dovolj se je omejiti na rimer, ko funkcija f ni skoraj ovsod enaka 0. V tem rimeru je f > 0. Dovolj je dokazati, da obstaja taka funkcija g z g q = 1, za katero v oceni (3.1) velja enakost. Ločimo dva rimera. = 1,q =. V tem rimeru ostavimo: { f(x) g(x) := ; f(x) 0 f(x) 0; sicer Očitno je g = 1 in velja fg = f, zato v (3.1) velja enakost. 1 <,q <. V tem rimeru ostavimo: Tedaj za vsak x X velja: g(x) := { f(x) f(x) f /q ; f(x) 0 0; sicer g(x) q = f(x) ( 1)q f Ker sta in q konjugirana, je ( 1)q =, zato je g q = 1. Prav tako za vsak x X a velja tudi: f(x)g(x) = f(x) f /q zato je končno: Trditev je dokazana. fgdµ = f f /q = f Vaja. Dokaži, da trditev 3.3 velja tudi za rimer, ko je =, q = 1, mera µ a je σ-končna. 5
4. Neenakost Minkowskega Izrek 4.1 (Neenakost Minkowskega). Naj bo (X, F) merljiv rostor s ozitivno mero µ. Tedaj za vsak 1 in oljubni funkciji f,g L (µ) velja: f +g f + g (4.1) Neenakost Minkowskega torej ove, da je redis f f seminorma na rostoru L (µ). Seveda to ni vedno norma, saj je enaka 0 na rostoru N(µ) vseh funkcij, ki so skoraj ovsod glede na µ enake 0. Pač a naša seminorma inducira normo na kvocientnem rostoru L (µ) = L (µ)/n(µ). Dokaz izreka 4.1. Za = je enakost očitna. Naj bo zdaj 1 <. Najrej bomo okazali, da je sloh f +g L (µ). Iz neenakosti (2.2) za ϕ(x) = x sledi: f +g 2 f + g 2 torej je f +g 2 1 ( f + g ) <. Zdaj, ko vemo, da so vse tri funkcije v L (µ), a lahko uorabimo trditev 3.3. Po Hölderjevi neenakosti za vsako funkcijo h, za katero je h q = 1, velja: (f +g)hdµ fhdµ + ghdµ f + g Ko naredimo suremum o h, dobimo natančno to, kar smo iskali. 6