Int. J. Dynam. Control 04) :6 84 DOI 0.007/40435-03-0040-y On mean-field tochatic maximum principle for near-optimal control for Poion jump diffuion with application Mokhtar Hafayed Abdelmadjid Abba Syed Abba Received: 4 September 03 / Revied: 0 November 03 / Accepted: November 03 / Publihed online: 3 December 03 Springer-Verlag Berlin Heidelberg 03 Abtract In thi paper, we tudy mean-field type tochatic control problem for ytem decribed by mean-field tochatic differential equation with jump procee, in which the coefficient contain not only the tate proce but alo it marginal ditribution. Moreover, the cot functional i alo of mean-field type. We derive neceary a well a ufficient condition of near-optimality for our model, uing keland variational principle, pike variation method and ome etimate of the tate and adjoint procee. Under certain concavity condition with non-negative derivative, we prove that the near-maximum condition on the Hamiltonian function in integral form i a ufficient condition for nearoptimality. Our reult differ from the claical one in the ene that here the adjoint equation ha a mean-field type, while the econd-order adjoint equation remain the ame a in the claical cae. A an application, our reult are applied to a mean-variance portfolio election where explicit expreion of the near-optimal portfolio election trategy i obtained in the tate feedback form involving both tate proce and it marginal ditribution, via the olution of Riccati ordinary differential equation. M. Hafayed Laboratory of Applied Mathematic, Bikra Univerity, Po Box 45, 07000 Bikra, Algeria e-mail: hafayedmokhtar@yahoo.com A. Abba B) Departement of Mathematic, Univerity of Bikra, 07000 Bikra, Algeria e-mail: abdelmadjidabba@yahoo.com S. Abba School of Baic Science, Indian Intitute of Technology Mandi, Mandi 7500, HP, India e-mail: abba.iitk@gmail.com Keyword Stochatic control Controlled mean-field jump diffuion procee Near-optimization Neceary and ufficient condition keland principle McKean Vlaov ytem Time-inconitent olution Feedback control Mathematic Subject Claification Introduction 60H0 930 We conider a tochatic control problem for ytem driven by a nonlinear controlled jump diffuion procee of meanfield type, which i alo called McKean Vlaov equation, where the coefficient depend on the tate of the olution proce a well a of it expected value. More preciely, the ytem under conideration evolve according to the meanfield jump diffuion proce dx u t) = f t, x u t), x u t)), ut))dt σt, x u t), x u t)), ut))dwt) g t, x u t ), ut), θ ) ) Ndθ,dt), x u ) = ζ, for ome function f,σ,g. Thi mean-field jump diffuion proce i obtained a the mean-quare limit, when n of a ytem of interacting particle of the form dx j,u n t) = f t, xn j,u t), n n i= σt, xn j,u t), n xn i,u t), ut))dt n i= xn i,u t), ut))dw j t) gt, x j,u n t ), ut), θ)n dθ,dt), 3
On mean-field tochatic maximum principle 63 where W j ) : j ) i a collection of independent Brownian motion. The expected cot to be near-minimized over the cla of admiible control i alo of mean-field type, which ha the form J,ζ u )) = h x u T ), x u T ) )) lt, x u t), x u t) ), ut))dt. ) It worth mentioning that ince the cot functional J,ζ i poibly a nonlinear function of the expected value tand in contrat to the tandard formulation of a control problem. Thi lead to a o called time-inconitent control problem where the Bellman dynamic programming doe not hold. The reaon for thi i that one cannot apply the law of iterated expectation on the cot functional. The value function i defined a V,ζ) = inf J,ζ u )), u ) U where the initial time and the initial tate ζ of the ytem are fixed. It i well-known that near-optimization i a enible and important a optimization for both theory and application. Since the recent work by Zhou ], the concept of nearoptimal control wa introduced for a cla of tochatic control problem. Variou kind of near-optimal tochatic control problem have been invetigated in 8]. In Hafayed et al. ], the author extended Zhou maximum principle of near-optimality ] to ingular tochatic control. The nearoptimal tochatic control problem for ytem governed by diffuion with jump procee, with application to finance ha been invetigated by Hafayed et al. 3]. The neceary and ufficient condition of near-optimal mean-field ingular tochatic control have been tudied in Hafayed and Abba 4]. Near-optimality neceary and ufficient condition for ingular control in jump diffuion procee ha been invetigated in Hafayed and Abba 5]. The neceary and ufficient condition for near-optimality for forward-backward tochatic differential equation with ome application have been tudied in Huang et al. 6]. The near-optimal control problem for recurive tochatic problem ha been tudied in Huietal.7]. The tochatic optimal control problem for jump procee ha been invetigated by many author, ee for intance 9 7]. The general cae, where the control domain i not necearily convex and the diffuion coefficient depend explicitly on the control variable, wa derived via pike variation method by Tang and Li 9]. Thee condition are decribed in term of two adjoint procee, which are linear claical backward SD. A good account and an extenive lit of reference on tochatic optimal control for jump procee can be founded in 3,8]. Mathematical mean-field problem play an important role in different field of, economic, finance, phyical, chemitry and tochatic game theory. Many author made contribution on mean-field ytem and application, ee for intance 4,0,7,9 5]. The exitence and uniquene reult of mean-field backward tochatic differential equation MF-BSD) a limit approach have been invetigated in Buckdanh et al. 9]. The maximum principle for SD of mean-field type wa introduced in 0]. Under ome convexity aumption, the mean-field type ufficient condition for optimality have been etablihed by Shi ]. In Mayer-Brandi et al. 5] a tochatic maximum principle of optimality for ytem governed by controlled Itô-Levy proce of mean-field type wa proved by uing Malliavin calculu. Variou local maximum principle of optimality for mean-field tochatic control problem have been derived in,3]. Our main goal in thi paper i to etablih neceary a well a ufficient condition of near-optimality for mean-field jump diffuion procee, in which the coefficient depend on the tate of the olution proce a well a of it expected value. Moreover, the cot functional i alo of mean-field type. The proof of our main reult i baed on ome tability reult with repect to the control variable of the tate proce and adjoint procee, along with keland variational principle 6] and pike variation method. Thi near-optimality neceary and ufficient condition differ from the claical one in the ene that here the firt-order adjoint equation turn out to be a linear mean-field backward tochatic differential equation, while the econd-order adjoint equation remain the ame a in tochatic maximum principle for jump diffuion developed in Tang and Li 9]. The control domain under conideration i not necearily convex. It i hown that tochatic optimal control may fail to exit even in imple cae, while near-optimal control alway exit. Thi jutifie the ue of near-optimal tochatic control, which exit under minimal condition and are ufficient in mot practical cae. Moreover, ince there are many near-optimal control, it i poible to elect among them appropriate one that are eaier for analyi and implementation. Finally, for the reader convenience we give ome analyi reult ued in thi paper in the Appendix. The ret of the paper i organized a follow. Section begin with a general formulation of a Mean-field control problem with jump procee and give the notation and aumption ued throughout the paper. In Sect. 3 and 4,we derive neceary and ufficient condition for near-optimality repectively, which are our main reult. An example of thi kind of mean-field control problem i alo given in the lat ection. 3
64 M. Hafayed et al. Problem formulation and preliminarie Throughout thi paper, we let, F, F t ) t 0,T ], P) be a fixed filtered probability pace equipped with a P completed right continuou filtration on which a d dimenional Brownian motion W = W t)) t 0,T ] i defined. Let η be a homogeneou F t )-Poion point proce independent of W. We denote by Ñdθ,dt) the random counting meaure induced by η, defined on R, where i a fixed nonempty ubet of R k with it Borel σ -field B ). Further, let μ dθ) be the local characteritic meaure of η, i.e. μ dθ) i a σ -finite meaure on,b )) with μ ) <. We then define Ndθ,dt) = Ñdθ,dt) μ dθ) dt, where N i Poion martingale meaure on B ) B R ) with local characteritic μ dθ) dt. We aume that F t ) t 0,T ] i P-augmentation of the natural filtration F t W,N) ) t 0,T ] defined a follow F W,N) t = σ {W ) : 0 t} σ Ndθ,dr) : 0 t, B B ) G, 0 B where G denote the totality of P-null et, and σ σ denote the σ -field generated by σ σ. Baic Notation We lit ome notation that will be ued throughout thi paper.. Any element x R d will be identified to a column vector with i th component, and the norm x = d i= x i.. The calar product of any two vector x and y on R d i denoted by x, y. 3. We denote A the tranpoe of any vector or matrix A. 4. For a et B, we denote by B the indicator function of B and co B) the cloure convex hull of B and Sgn ) the ign function. 5. For a function, we denote by x rep. xx ) the gradient or Jacobian rep. the Heian) of a calar function with repect to the variable x. We denote x the Clarke generalized gradient of with repect to x. 6. We denote by L F, T ], Rn ) the Hilbert pace of F t - adapted procee x ) uch that xt) dt <. 7. For convenience, we will ue x t) = t, xt), x xt)), ut)), xx t) = t, xt), xt)), ut)). x Baic Aumption Throughout thi paper we aume the following. Aumption H) The function f :, T ] R n R n A R n,σ :, T ] R n R n A M n d R) and l :, T ] R n R n A R are meaurable in t, x, y, u) and twice continuouly differentiable in x, y), g :, T ] R n A R n m i twice continuouly differentiable in x, and there exit a contant C > 0 uch that, for ϕ = f,σ,l: ϕt, x, y, u) ϕt, x, y, u) ϕx t, x, y, u) ϕ x t, x, y, u) C x x y y ]. 3) ϕt, x, y, u) C x y ). 4) up θ g t, x, u,θ) g t, x, u,θ ) up gx t, x, u,θ) g x t, x, u,θ ) θ C x x 5) up g t, x, u,θ) C x ). 6) θ Aumption H) The function h : R n R n R i twice continuouly differentiable in x, y), and there exit a contant C > 0 uch that hx, y) hx, y )) hx x, y) h x x, y )) C x x y y ]. 7) hx, y) C x y ). 8) Under the above aumption, the SD-) ha a unique trong olution x u t) which i given by t x u t) = ζ t t f r, x u r), x u r)), ur) ) dr σ r, x u r), x u r)), ur) ) dwr) g t, x u r ), ur), θ ) N dθ,dr), and by tandard argument it i eay to how that for any q > 0, it hold that x u t) ) q < C q), up t,t ] where C q) i a contant depending only on q and the functional J,ζ i well defined. We introduce the adjoint equation a follow. The firt-order adjoint equation turn out to be a linear mean-field backward SD, while the econd-order adjoint equation remain the ame a in Tang and Li 9]. Definition. Adjoint equation for mean-field jump diffuion procee) For any u ) U and the correponding 3
On mean-field tochatic maximum principle 65 tate trajectory x ), we define the firt-order adjoint proce ), K ), γ )) and the econd-order adjoint proce Q ), R ), Ɣ )) a the one atifying the following equation: ) Firt-order adjoint equation: linear Backward SD of mean-field type with jump procee dt) = { fx t, xt), xt), ut)) t) ] fy t, xt), xt), ut)) t) σx t, xt), xt), ut)) K t) ] σy t, xt), xt), ut)) K t) l x t, xt), xt), ut)) l y t, xt), xt), ut)) ] g x t, xt ), ut), θ ) γ t θ)μdθ) } dt K t)dwt) γ t θ)ndt, dθ) T ) = h x xt ), xt )) h y xt ), xt )) ]. 9) ) Second-order adjoint equation: claical linear Backward SD with jump procee dqt) = { fx t, xt), xt)), ut)) Qt) Q t fx t, xt), xt), ut)) σx t, xt), xt)), ut)) Qt)σ x t, xt), xt)), ut)) σx t, xt), xt)), ut)) Rt) Rt)σ x t, xt), xt)), ut)) g x t, xt ), ut), θ ) Ɣ t θ) Qt)) g x t, xt ), ut), θ ) μdθ) Ɣ t θ)g x t, xt ), ut), θ ) g x t, xt ), ut), θ ) Ɣ t θ)μdθ) H xx t, xt), xt)), ut), t), K t), γ t θ)) } dt Rt)dWt) Ɣ t θ)ndt, dθ) QT ) = h xx xt ), xt ))), 0) A it i well known that under condition H) and H) the firt-order adjoint equation 7) admit one and only one F t -adapted olution pair ), K ), γ )) L F, T ] ; Rn ) L F, T ] ; R n d ) L F, T ] ; R n m). Thi equation reduce to the tandard one, when the coefficient do not explicitly depend on the expected value or the marginal law) of the underlying diffuion proce. Alo the econd-order adjoint equation 8) admit one and only one F t -adapted olution pair Q ), R ), Ɣ )) L F, T ] ; R n n ) L F, T ] ; R n n) d ) L F, T ] ; R n n ) m). Moreover, ince f x, f y,σ x,σ y,l x,l x and h x are bounded, by C by aumption H) and H), we have the following etimate up t) t T K t) dt γ t θ) μdθ)dt up Qt) t T Rt) dt Ɣ t θ) μdθ)dt C. ) Definition. Uual Hamiltonian and H-function). We define the uual Hamiltonian aociated with the mean-field tochatic control problem 3) 4) afollow H t, X, X), u, p, q,ϕ) = pf t, X, X), u) qσ t, X, X), u) ϕg t, xt ), ut), θ ) μdθ) l t, X, X), u), where t, X, u), T ] R n A and X i a random variable uch that X L, T ] ; R n ). Furthermore, we define the H- function correponding to a given admiible pair z ),v )) a follow H z ),v )) t, x, u) = H t, x, x), u,t), K t) Qt)σ t, zt), zt)),vt)), γ t θ) Qt) γ t θ)) g t, zt ), vt), θ )), σ t, x, x), u) Qt)σ t, x, x), u) g t, x, u,θ)qt) γ t θ)) g t, x, u,θ) μdθ). Thi how that H z.),v )) t, x, u) = H t, x, x), u,t), K t), γ t θ)) σ t, x, x), u) Qt)σ t, zt), zt)),vt)) σ t, x, x), u) Qt)σ t, x, x), u) g t, x, u,θ)qt) γ t θ)) g t, zt), vt), θ) μdθ) g t, x, u,θ)qt) γ t θ)) g t, x, u,θ) μdθ), where t), K t), γ t θ) and Qt) are determined by adjoint equation 9) and 0) correponding to z ),v )). Before concluding thi ection, let u recall the definition of near-optimal control a given in Zhou ], Definition.).)), and keland variational principle, which will be ued in the equel. 3
66 M. Hafayed et al. Definition.3 Near-optimal control of order ε λ.)fora given ε > 0 the admiible control u ε ) i near-optimal with repect,ζ) iff J,ζ u ε ) ) V,ζ) O ε), ) where O ) i a function of ε atifying lim ε 0 O ε) = 0. The etimator O ε) i called an error bound.. If O ε) = Cε λ for ome λ > 0 independent of the contant C then u ε ) i called near-optimal control of order ε λ.. If O ε) = Cε,the admiible control u ε ) called ε- optimal. Lemma. keland Variational Principle 6]) Let F, d F ) be a complete metric pace and f : F R be a lower emi-continuou function which i bounded from below. For a given ε > 0, uppoe that u ε F atifying f u ε ) inf u F f u) ε. Then for any δ>0, there exit u δ F uch that. f u δ) f u ε ).. d F u δ, u ε) δ. 3. f u δ) f u) ε δ d F u, u δ ), for all u F. Now, in order to apply keland principle to our Mean-field control problem, we have to endow the et of admiible control U with an appropriate metric. We define a ditance function d on the pace of admiible control U uch that U, d) become a complete metric pace. For any u ) and v ) U we et d u ), v )) = P dt {w, t), T ] : u w, t) = v w, t)}, 3) where P dt i the product meaure of P with the Lebegue meaure dt on, T ]. Moreover, it ha been hown in the book by Yong and Zhou 7], 46 47) that. U, d) i a complete metric pace. The cot function J,ζ i continuou from U into R. 3 Neceary condition of near-optimality for mean-field jump diffuion procee In thi ection, we obtain a Zhou-type neceary condition of near-optimality, where the ytem i decribed by nonlinear controlled jump diffuion procee of mean-field type. The control domain i not need to be convex. a general action pace). The proof follow the general idea a in,9]. The following theorem contitute the main contribution of thi paper. Let ε ), K ε ), γ ε )) and Q ε ), R ε ), Ɣ ε )) be the olution of adjoint equation 7) and 8) repectively, correponding to u ε ). Theorem 3. Mean-field tochatic maximum principle for any near-optimal control). For any δ 0, 3 ), and any nearoptimal control u ε ) there exit a poitive contant C = C δ, μ)) uch that for each ε>0it hold that { σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) )] Q ε t)σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) ] ε t) f t, x ε t), x ε t)), u ) f t, x ε t), x ε t)), u ε t) ) ]K ε t)σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) ] γ ε t)g t, x ε t), u,θ ) g t, x ε t), u ε t), θ ) μdθ) g t, x ε t), u,θ ) g t, x ε t), u ε t), θ ) ) Q ε t) γ ε t θ)) g t, x ε t), u,θ ) g t, x ε t), u ε t), θ ) )μdθ), l t, x ε t), x ε t)), u ) l t, x ε t), x ε t)), u ε t) ) } dt Cε δ. 4) Corollary 3. Under the aumption of Theorem 3. it hold that H xε ),u ε ) t, x ε t), x ε t)), u ε t))dt up H xε ),u ε )) t, x ε t), x ε t)), ut))dt Cε δ. u ) U 5) To prove Theorem 3. and Corollary 3., we need the following auxiliary reult on the tability of the tate and adjoint procee with repect to the control variable. In what follow, C repreent a generic contant, which can be different from line to line. Our firt Lemma below deal with the continuity of the tate procee under ditance d. Lemma 3. If x u t) and x v t) be the olution of the tate equation ) aociated repectively with ut) and vt). For any α 0, ) and 0 atifying α <, there exit a poitive contant C = C T,α,,μ)) uch that up t T x u t) x v t) ) Cd α u ), v )). 6) 3
On mean-field tochatic maximum principle 67 Proof Cae. Firt, we aume that. Uing Burkholder Davi Gundy inequality for the martingale part and Propoition 6. ee Appendix ) we can compute, for any r : up x u t) x v t) ] t r r C f t, x u t), x u t)), ut)) f x v t), x v t)), vt)) σ t, x u t), x u t) ), ut) ) σx v t), x v t) ),vt) g t, x u t), u,θ ) g t, x v t), vt), θ ) μdθ) dt I I, where r I C { f x u t), x u t)), ut) ) f x u t), x u t)), vt) ) σ x u t), x u t)), ut) ) σ x u t), x u t)), vt) ) μ) up g t, x u t), ut), θ ) θ g t, x v t), vt), θ ) } {ut) =vt)} t) dt and I C r f x u t), x u t) ),vt) f x v t), x v t) ),vt) ) r σ x u t), x u t) ),vt) ) σ x v t), x v t)), v t) ) μ) g t, x u t), vt), θ ) up θ g t, x v t), vt), θ ) ) Now arguing a in ], Lemma 3.) taking b = α > and a > uch that a b =, and applying Cauchy Schwarz inequality, we get r f t, x u t), x u t) ), ut) ) f x u,η t), x u t) ),vt) ) {ut) =vt)} t) dt r f t, x u t), x u t) ), ut) ) f t, x u t), x u t) ),vt) ) a dt r {ut) =vt)} t) dt by uing definition of d and linear growth condition on f with repect to x and y, Aumption 4) we obtain r f t, x u t), x u t) ), ut) ) f t, x u t), x u t) ),vt) ) {ut) =vt)} t) dt C r b, } a x u t) a x u t) ) a )dt d u ), v )) α Cd u ), v )) α. Similarly, the ame inequality hold if f above i replaced by σ and g then we get r σ t, x u t), x u t) ), ut) ) σ t, x u t), x u t) ),vt) ) {ut) =vt)} t) dt Cd u ), v )) α. and r g t, x u t), u,θ ) g t, x v t), vt), θ ) up θ a ) {ut) =vt)} t) dt Cd u ), v )) α. Thi implied that I Cd u ), v )) α. Since the coefficient f,σ and g are Lipchitz with repected to x and y aumption H)) we conclude that up x u t) x v t) ) t r C up t T r up x u t) x v t) dτ d u ), v )) α r τ Hence 6) follow immediately from Gronwall inequality. Cae. Now we aume 0 <. Since α > then the Cauchy Schwarz inequality yield x u t) x v t) ) x u t) x v t) ] ) up t T Cd u ), v )) α] Cd u ), v )) α. Thi complete the proof of Lemma 3.. 3
68 M. Hafayed et al. The next reult give the th moment continuity of the olution to adjoint equation with repect to the metric d. Thi Lemma i an extenion of Lemma 3. in Zhou ] to meanfield SD with jump procee. Lemma 3. For any α 0, ) and, ) atifying α) <, there exit a poitive contant C = C α,, μ)) uch that for any u ), v ) U, along with the correponding trajectorie x u ), x v ) and the olution u ), K u ), γ u ), Q u ), R u ), Ɣ u )) and v ), K v ), γ v ), Q v ), R v ), Ɣ v )) of the correponding adjoint equation 9) 0), it hold that u t) v t) K u t) K v t) ) dt and γ u t θ) γ v t θ) μdθ)dt Cd u ), v )) α, Q u t) Q v t) R u t) R v t) )dt 7) Ɣ u t θ) Ɣ v t θ) μdθ)dt Cd u ), v )) α. 8) Proof Note that t) = u t) v t), K t) = K u t) K v t) and γ t θ) = γt uθ) γ t v θ) atified the following Backward SD: d t) = fx t, xu t), x u t)), ut)) t) σ x t, xu t), x u t)), ut)) K t) ] g x t, xu t), u,θ) γ t θ)μdθ) Lt) dt K t)dwt) γ tθ)ndθ,dt) T ) = h x x u T ), x u T ))) h x x v T ), x v T ))) h y x u T ), x u T ))) h y x v T ), x v T ))], where the proce Lt) i given by Lt) =fx t, x u t), x u t)), ut) ) fx t, x v t), x v t)), vt) ) ] v t) σx t, x u t), x u t)), ut) ) σx t, x v t), x v t)), vt) ) ]K v t) l x t, x u t), x u t)), ut) ) 9) l x t, x v t), x v t)), vt) ) ] fy t, x u t), x u t)), ut) ) u t) fy t, x v t), x v t)), vt) ) v t)] σy t, x u t), x u t)), ut) ) K u t) σy t, x v t), x v t)), vt) ) K v t)] l y t, x u t), x u t)), ut) ) l y t, x v t), x v t)), vt) ) ] t, x u t ), u,θ ) g x gx t, x v t ), v, θ ) )γt v θ)μdθ). 0) Let φ ) be the olution of the following linear SD dφt) = f x t, x u t), x u t)), ut)) φt) t) ] Sgn t)) dt σ x t, x u t), x u t)), ut)) φt) K t) ] ) Sgn K t)) dwt) g x t, xu t ), u,θ) φt) ] γ t θ) Sgn γ t θ)) Ndθ,dt), φ) = 0, where Sgn a) Sgna ), Sgna ),...,Sgna n )) for any vector a = a, a,...,a n ). It i worth mentioning that ince f x σ x and g x are bounded and the fact that { t) Sgn t)) K t) Sgn K t)) } dt γ t θ) Sgn γ t θ)) μdθ)dt <, ) then the SD ) ha a unique trong olution. Let η uch that η =,, ) then we get up φt) ) C η t T γ t θ) η η μdθ)dt { t) η η K t) η η} dt C t) K t) γ t θ) μdθ) dt. Note that the right hand ide term of the above inequality i bounded due to 9), then we get 3
On mean-field tochatic maximum principle 69 up t T φt) η ) <. 3) By applying Itô formula for jump procee ee Appendix Lemma 6.) to t)φt) on, T ] and taking expectation, we get t) t) Sgn t)) K t) K t) Sgn K t)) γ t θ) γ t θ) Sgn γ t θ))μdθ) dt = Lt)φt)dt T )φt ) = Lt)φt)dt {h x x u T ), x u T )) ) h x x v T ), x v T )) ) )φt )}h y x u T ), x u T )) ) h y x v T ), x v T ) ) ] φt)). Since t) t) Sgn t)) K t) K t) Sgn K t)) γ t θ) γ t θ) Sgn γ t θ))μdθ) dt = t) K t) γ t θ) μdθ) dt, and fact that Lt)φt)dt h x x u T ), x u T )) ) h x x v T ), x v T )) )) h y x u T ), x u T )) ) h y x v T ), x v T ) ))] φt)) Lt) dt φt) η dt h x x u T ), x u T )) ) h x x v T ), x v T ) )) h y x u T ), x u T )) ) h y x v T ), x v T ) )) ] η ] φt ) η] η, then according to 3) we deduce η t) K t) γ t θ) μdθ) dt C Lt) dt { hx C x u T ), x u T ))) h x x v T ), x v T ))) h y x u T ), x u T )))) h y x v T ), x v T )))) }. 4) We proceed to etimate the right hand ide of 4). Firt noting that α < < then by uing aumption H) and Lemma 3., we obtain hx x u T ), x u T ))) h x x v T ), x v T ))) C x u T ) x v T ) Cdu ), v )) α. h y x u T ), x u T )))) h y x v T ), x v T )))) Cdu ), v )) α. 5) Now, to prove inequality 7) it ufficient to etimate Lt) dt. By repeatedly uing Cauchy Schwarz inequality and aumption H) we can etimate f x t, x u t), x u t)), ut) ) fx t, x v t), x v t)), vt) ) v t) dt { C f x t, x u t), x u t)), ut) ) fx t, x u t), x u t)), vt) ) v t) f x t, x u t), x u t)), vt) ) f x C t, x v t), x v t)), vt) ) v t) } dt { {ut) =vt)} t) v t) x u t) x v t) x u t)) x v t)) ] v t) } dt T C v t) dt du.), v.)) T C v t) T dt x u t)x v t) dt By uing the fact that du ), v )) and α <, the firt term of the right ide of the above inequality i dominated by du ), v )) α. Since α < and we have from Lemma 3. that. 3
70 M. Hafayed et al. x u t) x v t) dt du ), v )) α, then we have T C v t) dt du ), v )) T v t) T dt x u t) x v t) Cd u ), v )) α, we conclude that f x t, x u t), x u t)), ut) ) dt fx x v t), x v t)), vt) ) v t) dt Cd u ), v )) α. 6) A imilar argument how that σ x t, x u t), x u t)), ut) ) σ x t, x v t), x v t)), vt) ) K v t) dt Cd u ), v )) α, 7) and lx t, x u t), x u t)), ut) ) l x t, x v t), x v,ξ t)), vt) ) dt Cd u ), v )) α. 8) Now, by uing imilar argument developed above and 9) we get { f y t, x u t), x u t)), ut) ) fy x v t), x v t)), vt) ) ] v t) } dt C fy t, x u t), x u t)), ut) ) fy x v t), x v t)), vt) ) v t) ] dt C fy t, x u t), x u t)), ut) ) fy x v t), x v t)), vt) ) dt Cd u ), v )) α. 9) A imilar argument how that {σy t, x u t), x u t)), ut) ) σ y x v t), x v t)), vt) ) ] v t)} dt Cd u ), v )) α, 30) { fy t, x u t), x u t)), ut) ) f y x v t), x v t)), vt) ) ] v t)} dt Cd u ), v )) α, 3) and l y t, x u t), x u t)), ut) ) l y x v t), x v t)), vt) ) ] dt Cd u ), v )) α. 3) Next, by applying Cauchy Schwarz inequality, we get g x t, x u t), ut), θ ) gx t, x v t), vt), θ ) )γt v θ)μdθ) dt = g x t, x u t), ut), θ ) gx t, x u t ), vt), θ ) )γt v θ)μdθ) dt g x t, x u t), vt), θ ) gx t, x v t ), vt), θ ) )γt v θ)μdθ) dt I I, where I = g x t, x u t ), ut), θ ) gx t, x u t ), vt), θ ) )γt v θ)μdθ) {ut) =vt)} t)dt, and I = g x up g x t, x u t), ut), θ ) θ t, x u t), vt), θ ) ) ) t θ)μdθ) dt. γ v 3
On mean-field tochatic maximum principle 7 By uing the fact that g x i bounded, du ), v )) and α <, then due to ) we get I C C γt v θ) μdθ) {ut) =vt)} t)dt γ v t θ) μdθ) d u ), v )) Cd u ), v )) α. 33) Further, ince α ) that I C < we conclude from Lemma 3. and x u t) x v t) t θ)μdθ) dt γ v dt It follow from 33) and 34) that g x Cd u ), v )) α, t, x u t), ut), θ ) gx t, x v t), vt), θ ) ) 34) γ v t θ)μdθ) dt Cd u ), v )) α. 35) We conclude from 6) 35) that Lt) dt Cd u ), v )) α. 36) Finally, combining 4) 5) and 36), the proof of 7) i complete. Similarly one can prove 9). Thi complete the proof of Lemma 3.. Now, let ε ), K ε ), γ ε )) and Q ε ), R ε ), Ɣ ε )) be the olution of adjoint equation 9) 0) correponding to x ε ), x ε )), u ε )). Lemma 3.3 For any ε>0, there exit near-optimal control u ε ) uch that for any u A: { σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )) Q ε t) σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )) ε t) f t, x ε t), x ε t)), u ) f t, x ε t), x ε t)), u ε t) )) K ε t) σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )) γ ε t)g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ) μdθ) g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ) ) Q ε t)γ ε t θ))g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ) )μdθ), l t, x ε t), x ε t)), u ) l t, x ε t), x ε t)), u ε t) )) } dt ε 3, 37) Proof By uing keland variational principle with λ = ε 3, there i an admiible control u ε ) uch that for any u ) U : d u ε ), u ε ) ) ε 3, 38) and J,ζ u ε ) ) J,ζ u ε ) ) ε 3 d u ), u ε ) ). Notice that u ε ) which i near-optimal for the initial cot J,ζ defined in ) i an optimal control for the new cot J,ζ,ε given by J,ζ,ε u )) = J,ζ u )) ε 3 d u ), u ε ) ). Therefore we have J,ζ,ε u ε ) ) J,ζ,ε u )) for any u ) U. Next, we ue the pike variation technique for u ε ) to derive the variational inequality a follow. For h > 0, we chooe a Borel ubet h, T ] uch that h = h, and we conider the control proce which i the pike variation of u ε ) : u ε, h t) = { u : t h, u ε t) : t, T ] h, where u i an arbitrary element of A be fixed. By uing the fact that J,ζ,ε u ε )) J,ζ,ε u ε, h )), and du ε, h ), u ε )) = du ε, h ), u ε )) h, we get J,ζ u ε, h )) J,ζ u ε )) ε /3 du ε ), u ε, h )) ε /3 h. 39) Arguing a in Hafayed and Abba 7], Theorem 3.), the left-hand ide of 39) i equal to 3
7 M. Hafayed et al. h { σ t, x ε t), x ε t)), u ) ) σt, x ε t), x ε t)), u ε t))] Q ε t) σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )] ε t) f t, x ε t), x ε t)), u ) f t, x ε t), x ε t)), u ε t) ) ] K ε t)σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) ] γ ε t)g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ) μdθ) g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ) ] Q ε t) γ ε t θ))g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ) ]μdθ)l t, x ε t), x ε t)), u ) l t, x ε t), x ε t)), u ε t) ) } ] dt τ h), 40) where τ h) 0a h 0. Finally, replacing 40)in39), then dividing inequality 39) by h and ending h to zero, the near-maximum condition 37) follow. Proof of Theorem 3. Firt, we are about to derive an etimate for the term imilar to the left ide of inequality 34) and 35) with all the x ε ), x ε )), u ε )) etc. replaced by x ε ), x ε )), u ε )) etc,. Now, to prove 4) it remain to etimate the following difference S ε) = K ε t)σ t, x ε t), x ε t)), u ) S ε) = 3 σ t, x ε t), x ε t)), u ε t) ) ) K ε t)σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) ) dt, 4) { σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) ) Q ε t) σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )) σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )) Q ε t)σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) ] ε t) f t, x ε t), x ε t)), u ) f t, x ε t), x ε t)), u ε t) ) ] ε t) f t, x ε t), x ε t)), u ) f t, x ε t), x ε t)), u ε t) ) ] l t, x ε t), x ε t)), u ) l t, x ε t), x ε t)), u ε t) ) ] l t, x ε t), x ε t)), u ) l t, x ε t), x ε t)), u ε t) ) } ] dt. 4) and S 3 ε) = γ ε t θ) g t, x ε t ), u,θ ) Then we have S ε) = g t, x ε t ), u ε t) )) γ ε t θ) g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ ))] μdθ)dt, 43) K ε ] σ t) K ε t) t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) )] K ε t)σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ) ]dt K ε t)σ t, x ε t), x ε t)), u ε t) ) σ t, x ε t), x ε t)), u ε t) ) ]dt = I ε) I ε) I 3 ε). We etimate the firt term on the right-hand ide I ε) = T K ε ] t) K ε t) σ t, x ε t), x ε t)), u) σ t, x ε t), x ε t)), u ε t))]. For any δ 0, 3 ) o that α = 3δ 0, ). Now, let be a fixed real number uch that <<o that α) <. Taking q > uch that q = then by uing Hô lder inequality, Lemma 3. and note 4) we obtain I ε) K ε t) K ε t) dt σ t, x ε t), x ε t)), u ) σ t, x ε t), x ε t)), u ε t) ) q dt ] q
On mean-field tochatic maximum principle 73 ] C du ε ), u ε )) α I 3 ε) K ε t) dt σ t, x ε t), x ε t)), x ε t) q x ε t)) q q )dt ] C ε α. u ε t) ) σt, x ε t), x ε t)), u ε t)) 4 dt 3 = Cε δ. We etimate now the econd term I ε). Then by applying Cauchy Schwarz inequality, note 9), aumption H), and T Lemma 3., we get {u ε ) =u ε )} t) dt Cε δ I ε) K ε t) dt σ t, x ε t), x ε t)), u ) ] C du ε ), u ε )) Cε δ Cε δ, thu, we have proved that σ t, x ε t), x ε t)), u ) dt S ε) = I ε) I ε) I 3 ε) Cε δ. 44) By uing imilar argument developed above, we can prove C x ε t) x ε t) x ε t) x ε t)] that )dt S ε) Cε δ. 45) C du ε ), u ε )) α] Cε 3 ) α α = Cε 3 = Cε δ Now, let u turn to etimate the third term S 3 ε). By applying. the Cauchy Schwarz inequality, we get Now, let u turn to etimate the third term I 3 ε). By adding and ubtracting σt, x ε t), x ε t)), u ε t)) then we have I 3 ε) = K ε t)σ t, x ε t), x ε t)), u ε t) ) σt, x ε t), x ε t)), u ε t))]dt K ε t)σ t, x ε t), x ε t)), u ε t) ) σ t, x ε t), x ε t)), u ε t) ) )dt, then by uing Cauchy Schwarz inequality, we have I 3 ε) K ε t) dt σ t, x ε t), x ε t)), u ε t) ) σt, x ε t), x ε t)), u ε t)) {u ε ) =u ε )} t) dt ] K ε t) σ t, x ε t), x ε t)), u ε t) ) σ t, x ε t), x ε t)), u ε t) ) ] dt. We proceed a in I ε) to etimate the econd term in the right of above inequality, then by applying Cauchy Schwartz inequality, Aumption H) and 9) we obtain S 3 ε) γ ε t θ) γ ε t θ)) g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ )) μdθ)dt γ ε t θ)g t, x ε t ), u,θ ) g t, x ε t ), u ) ]μdθ)dt γ ε t θ)g t, x ε t ), u ε t), θ ) g t, x ε t ), u ε t), θ ) )μdθ)dt, = J ε) J ε) J 3 ε). For any δ 0, 3 ) o that α = 3δ 0, ). Now, let be a fixed real number uch that, ) o that α) <. Taking q > uch that q =. By Hôlder inequality, Lemma 3. and 5) we obtain J ε) = γ ε t θ) γ ε t θ)) g t, x ε t ), u,θ ) g t, x ε t ), u ε t), θ )) μdθ)dt T γ ε t θ) γ t ε θ μdθ)dt up g t, x ε t), u,θ ) θ 3
74 M. Hafayed et al. g t, x ε t), u ε t), θ ) ) q dt ] C du ε ), u ε )) α q μ) q T x ε t) q x ε t)) q )dt Cε 3 ) α. = Cε α 3. Applying aumption H3), Cauchy Schwarz inequality, Lemma 3., note 0) and the fact that μ) < we get J ε) γ ε t θ μdθ)dt up g t, x ε t), u,θ ) θ } g t, x ε t), u ε t), θ ) ) dt C x ε t) x ε t) dt C du ε ), u ε )) α]. by uing 38) we get du ε ), u ε )) α μ)] q ε 3 ) α, it hold that J ε) Cε α α 3 ) = Cε 3 = Cε δ. We proceed to etimate J 3 ε). By adding and ubtracting g t, x ε t), u ε t), θ) and Cauchy Schwarz inequality we obtain J 3 ε) = γ ε t θ)g t, x ε t), u ε t), θ ) g t, x ε t), u ε t), θ ) {u ε ) =u ε )} t) μdθ)dt γ ε t θ)g t, x ε t ), u ε t), θ ) g t, x ε t ), u ε t), θ ) )μdθ)dt γ ε t θ) μdθ)dt μ)] up θ g t, x ε t), u ε t), θ ) g t, x ε t), u ε t), θ ) {u ε ) =u ε )} }] t) dt γ t ε θ) μdθ)dt x ε t) x ε t) dt, by applying Cauchy Schwarz inequality, Lemma 3. and ) it follow that J 3 ε) C x ε t) 4 )dt Thu, we have proved that x ε t) x ε t) dt du ε ), u ε )) Cε δ. S 3 ε) = J ε) J ε) J 3 ε) Cε δ. 46) The deired reult 4) follow immediately by combining 44), 45), 46) and 34). Thi complete the proof of Theorem 3.. Proof of Corollary 3. In the pike variation technique for the perturbed control u ε,θ ) in 37) the point u A may be replaced by any admiible control u ) U, and the ubequent argument till goe through. So the inequality in the etimate 5) hold for any u ) U and the ubequent argument till goe through. So the inequalitie in the etimate 5) hold for any u ) U. 4 Sufficient condition of near-optimality for mean-field jump diffuion procee We will how in thi ection, that under certain concavity condition on the Hamiltonian H and ome convexity condition on the function h, ), the ε-maximum condition on the Hamiltonian function H in the integral form i ufficient for near-optimality. We aume: Aumption H3) ψ i differentiable in u for ψ =: f,σ,l,g and there i a contant C > 0 uch that ψt, x, y, u) ψt, x, y, u ) ψu t, x, y, u) ψ u t, x, y, u ) C u u, up θ up θ gt, x, u,θ) gt, x, u,θ) gu t, x, u,θ) g u t, x, u,θ) C u u. 47) h, ) convex with repect to x, y). 48) H t,,,, ε ), K ε ), γ ε ) ) i concave with repect to x, y, u), for a.e.t 0, T ], P a.. 49) The derivative f y,σ y, h y l y are non-negative. 50) Now we are able to tate and prove the ufficient condition for near-optimality for ytem governed by mean-field SD with jump procee, which i the econd main reult of thi paper. 3
On mean-field tochatic maximum principle 75 Let u ε ) be an admiible control and ε ), K ε ), γ ε )), Q ε ), R ε ), Ɣ ε )) be the olution of the adjoint equation 9) 0) correponding to u ε ). Theorem 4. Sufficient condition for near-optimality of order ε ). Let condition 47) 49) hold. If for ome ε>0 and for any u ) U : H xε ),u ε )) t, x ε t), x ε t)), u ε t))dt ε up H xε ),u ε )) t, x ε t), x ε t)), ut))dt, u ) U 5) then u ε ) i a near-optimal control of order ε, i.e., J,ζ u ε ) ) inf J,ζ u )) Cε, u ) U where C > 0 i a poitive contant independent of ε. Corollary 4. Sufficient Condition for ε-optimality) Under the aumption of Theorem 4. a ufficient condition for an admiible control u ε ) to be ε-optimal for our mean-field control problem ) )i H xε ),u ε ε ) )) t, x ε t), x ε t)), u ε t))dt C up H xε ),u ε )) t, x ε t), x ε t)), ut))dt. u ) U Proof of Theorem 4. The key tep in the proof i to how that H u t, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) i very mall and etimate it in term of ε. Wefirtfixanε>0 and define a new metric d on U, by etting: for any u ) and v ) U : du ), v )) = where ut) vt) ε t)dt, ε t) = ε t) K ε t) Q ε t) x ε t) x ε t)) ] Q ε t) γt ε θ)μdθ) x ε t) ]. Obviouly d i a metric on U atified ε t) >, and it i a complete metric a a weighted L -norm. Define a functional g on U a follow g u )) = H xε ),u ε )) t, x ε t), x ε t)), ut) ) dt. By uing aumption 47) then a imple computation how that g u )) g v )) = {H xε ),u ε )) t, x ε t), x ε t)), ut) ) H xε ),u ε )) t, x ε t), x ε t)), vt) )} dt. H t, x ε t), x ε t) ), ut), ε t), K ε t), γt ε θ)) H t, x ε t), x ε t) ),vt), ε t), K ε t), γt ε θ)) dt σ t, x ε t), x ε t) ), ut) ) σ t, x ε t), x ε t) ),vt) ) Q ε t) σ t, x ε t), x ε t) ), u ε t) ) dt T σ t, x ε t), x ε t) ), ut) ) Qt) σ t, x ε t), x ε t) ), ut) ) σ t, x ε t), x ε t) ),vt) ) Q ε t) σ t, x ε t), x ε t) ),vt) ) dt g t, x ε t), ut), θ ) g t, x ε t), vt), θ ) Q ε t) γt ε θ)) g t, x ε t ), u ε t), θ ) μdθ)dt T g t, x ε t), ut), θ ) Q ε t) γt ε θ)) g t, x ε t), ut), θ ) g t, x ε t), vt), θ ) Q ε t) γt ε θ)) g t, x ε t), vt), θ ) μdθ)dt, = I ε Iε Iε 3 Iε 4 Iε 5 Now, by uing Definition. and aumption H3) T I ε = H t, x ε t), x ε t) ), u, ε t), K ε t), γ ε t θ)) H t, x ε t), x ε t) ),v, ε t), K ε t), γt ε θ)) dt C ut) vt) ε t) K ε t) 3
76 M. Hafayed et al. C t θ)μdθ) dt γ ε ut) vt) ε t)dt. 5) Since σ i linear growth with repect to x and y then by uing aumption 47) we get T I ε = σ t, x ε t), x ε t) ), u ) σ t, x ε t), x ε t) ),v ) Q ε t)σ t, x ε t), x ε t) ), u ε t) ) dt C ut) vt) Q ε t) x ε t) x ε t) ) ] dt C ut) vt) ε t)dt. 53) and I5 ε = T g t, x ε t), u,θ ) Q ε t) γ ε t θ)) g t, x ε t), u,θ ) g t, x ε t), v, θ ) Q ε t) γ ε t θ)) g t, x ε t), v, θ ) μdθ)dt, C C ut) vt) Q ε t) γ ε t θ) x ε t) ] dt ut) vt) ε t)dt, 56) By combining 5) 56) we conclude that g u )) g v )) C d u ), v )), which implie that g i continuou on U with repect to d. Now by uing 5) and keland Variational Principle Lemma.), there exit u ε ) U uch that du ε ), u ε )) ε, 57) Similarly, ince g i linear growth with repect to x then by aumption 47) we can prove that T I4 ε = g t, x ε t), u,θ ) g t, x ε t), v, θ ) Q ε t) γt ε θ)) g t, x ε t ), u ε t), θ ) μdθ)dt C ut) vt) Q ε t) γt ε θ)μdθ) x ε t) ] dt C ut) vt) ε t)dt. 54) Next, ince σ i linear growth with repect to x and y then we deduce that I3 ε = T C C σ t, x ε t), x ε t) ), u ) Q ε t) σ t, x ε t), x ε t) ), u ) σ t, x ε t), x ε t) ),v ) Q ε t)σ t, x ε t), x ε t) ),v ) dt ut) vt) Q ε t) x ε t) x ε t) ) ] dt ut) vt) ε t)dt, 55) and Ht, x ε t), x ε t)), u ε t))dt = max u ) U where Ht, x ε t), x ε t)), ut))dt, 58) Ht, x, y, u) = H xε ),u ε )) t, x, y, u) ε u u ε t) ε t). 59) The maximum condition 58) implie a pointwie maximum condition namely, for P a., and a.e., t, T ] Ht, x ε t), x ε t)), u ε t)) = max Ht, x ε t), x ε t)), u). u A Uing Item 3, Propoition 6.], then we have 0 u Ht, x ε t), x ε t)), u ε t)). 60) Since the function u : u u ε t) i locally Lipchitz but not differentiable in u ε t), then Clarke generalized gradient ee Propoition 6., xample, Appendix ) how that ε u u ε t) ε t) ) = co { ε t) ε, ε t) ε } u = ε t) ε, ε t) ε ]. 6) By uing 6) and fact that the Clarke generalized gradient of the um of two function i contained in the um of the 3
On mean-field tochatic maximum principle 77 Clarke generalized gradient of the two function, Item 5, Propoition 6.] we get u Ht, x ε t), x ε t)), u ε t)) u Hxε.),u ε.)) t, x ε t), x ε t)), u ε t)) ε ε t), ε ε t) ]. By applying aumption 47), the Hamiltonian H i differentiable in u, then Item 4, Propoition 6.] how that u Ht, x ε t), x ε t)), u ε t)) H ut, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) { σu t, xε t), x ε t)), u ε t))q ε t) σ t, x ε t), x ε t)), u ε t))) σt, x ε t), x ε t)), u ε t))) } gu t, x ε t ), u ε t), θ ) Q ε t) γt ε θ)) g t, x ε t), u ε t), θ ) g t, x ε t), u ε t), θ ) )μdθ) ε ε t), ε ε t) ]. Next, the differential incluion 60) implie that there i τ ε t) ε ε t), ε ε t) ], uch that H u t, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) σu t, xε t), x ε t)), u ε t))q ε t) σ t, x ε t), x ε t)), u ε t))) σt, x ε t), x ε t)), u ε t))) gu t, x ε t), u ε t), θ ) Q ε t) γt ε θ)) g t, x ε t), u ε t), θ ) g t, x ε t), u ε t), θ ) } )μdθ) τ ε t) = 0. 6) By uing aumption 47) we can prove that Hu t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) H u t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) C u ε t) u ε t) ε t), 63) hence from 6) and 63), aumption 47) and the fact that τ ε t) ε ε t) we get Hu t, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) C u ε t) u ε t) ε t) σ u t, x ε t), x ε t)), u ε t))q ε t) σ t, x ε t), x ε t)), u ε t))) σt, x ε t), x ε t)), u ε t))) g u t, x ε t ), u ε t), θ ) Q ε t) γt ε θ)) g t, x ε t ), u ε t), θ ) g t, x ε t ), u ε t), θ ) )μdθ) τ ε t) C u ε t) u ε t) ε t) τ ε t) C u ε t) u ε t) ε t) ε ε t), 64) Now, uing 49), we obtain for any u ) U Ht, xt), xt)), ut), ε t), K ε t), γ ε t θ)) Ht, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) H x t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) xt) x ε t)) H y t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) xt) x ε t)) H u t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) ut) u ε t)). 65) Integrating thi inequality with repect to t and taking expectation we obtain from 5) and 64) Ht, xt), xt)), ut), ε t), K ε t), γ ε t θ)) Ht, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ))] dt H x t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) xt) x ε t))dt H y t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) xt) x ε t))dt C du ε ), u ε )) ε ) H x t, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) xt) x ε t))dt H y t, x ε t), x ε t)), u ε t), ε t), K ε t), γ ε t θ)) xt) x ε t))dt Cε. 66) On the other hand, by uing 48) we get h xt ), xt ))) hx ε T ), x ε T ) ) ) hx x ε T ), x ε T ))) h y x ε T ), x ε T ))) ] xt ) x ε T )]. 3
78 M. Hafayed et al. Noting that ince ε T ) = h x x ε T ), x ε T ))) h y x ε T ), x ε T ))) ) then we have { h xt ), xt ))) hx ε T ), x ε T ) ) ) } { ε T )xt ) x ε T )) } 67) By integration by part formula for jump proce ε t)xt) x ε t)) ee Lemma 6.) we get ε T )xt ) x ε T )) ] = xt) x ε t))d ε t) K ε t)σ t, xt), xt)), ut)) σt, x ε t), x ε t)), u ε t)))dt γt ε θ)g t, xt), ut), θ) g t, x ε t), u ε t), θ ) )μdθ)dt, ε t)dxt) x ε t)) with the help of ), and 9) we obtain { ε T )xt ) x ε T )) } = H xt, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) H y t, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)))] xt) x ε t)) ε t) f t, xt), xt)), ut)) f t, x ε t), x ε t)), u ε t))] K ε t)σt, xt), xt)), ut)) σt, x ε t), x ε t)), u ε t))] γt ε θ)g t, xt), ut), θ) g t, x ε t), u ε t), θ ) ]μdθ) dt, then from 49) and 66) we get { ε T )xt ) x ε T )) } Ht, xt), xt)), ut), ε t), K ε t), γ ε t θ)) Ht, x ε t), x ε t)), u ε t), ε t), K ε t), γt ε θ)) ε t) f t, xt), xt)), ut)) f t, x ε t), x ε t)), u ε t))] K ε t)σt, xt), xt)), ut)) σt, x ε t), x ε t)), u ε t))] γt ε θ)g t, xt), ut), θ) g t, x ε t), u ε t), θ ) ]μdθ) dt Cε = l t, x ε t), x ε t)), u ε t) ) l t, xt), xt)), ut))]dt Cε. 68) Combining 67) and 68) we get { h xt ), xt ))) hx ε T ), x ε T ) ) ) } l t, x ε t), x ε t)), u ε t) ) l t, xt), xt)), ut))]dt Cε, then by uing definition of J,ζ we conclude J,ζ u )) J,ζ u ε ) ) Cε. Finally, ince u ) i arbitrary element of U, the deired reult follow. 5 Application to finance: penalized mean-variance portfolio election In thi ection, we will apply our neceary and ufficient condition of near-optimality to tudy a penalized mean-variance portfolio election and we derive the explicit expreion of the optimal portfolio election trategy. Our method inpired from Zhou ], xample 6.). Suppoe that we have a mathematical market coniting of two invetment poibilitie: The firt aet i a bond whoe price P 0 t) evolve according to the ordinary differential equation Rik-free ecurity: e.g., a bond), where the price P 0 t) at time t i given by the following equation: { dp0 t) = P 0 t) ρt)dt, t 0, T ] 69) P 0 0) > 0, where ρ ) i a bounded determinitic function. Riky ecurity e.g. a tock), where the price P t) at time t i given by P t) = P t) ςt)dt σ t dwt)p t) P t) ξ t θ) N dθ,dt), 70) P 0) > 0, where ςt), σ t and ξ t θ) are bounded determinitic function uch that ςt) = 0,σ t = 0 and ςt) >ρt). and a above Ndθ,dt) i a compenated random meaure. 3
On mean-field tochatic maximum principle 79 Aumption. In order to enure that P t) > 0 for all t 0, T ] we aume that:. ξ t θ) > for any θ.. The function t ξ t θ) μdθ) i a locally bounded Portfolio and wealth dynamic: A portfolio i a predictable proce πt) = π 0 t), π t)) giving the number of unit held at time t of the bond and the tock. The correponding wealth proce x π t), t 0 i then given by x π t) = π 0 t)p 0 t) π t)p t). 7) The portfolio π ) i called Self-financing if t x π t) = x π 0) We denote by 0 t π 0 r)dp 0 r) 0 π r)dp r). 7) vt) = π t)p t), 73) the amount inveted in the riky ecurity. Now, by combining 7) and 7) together with 73) we introduce the wealth dynamic a follow dx v t) = ρt)x v t) ςt) ρt))vt)] dt σ t vt)dwt) ξ t θ) vt)n dθ,dt), 74) x v 0) = ζ, where ζ R. If the correponding wealth proce x v ) given by SD-74) i quare integrable, the control variable v ) i called tame. We denote U the et of admiible portfolio valued in A = R. Mean-variance portfolio election.we aume that we have a family of optimization problem parameterized by ε, where ε i a mall parameter ε>0may be repreent the complexity of the cot functional J ζ,ε v )) = x v T ) x v T )) ε ) ) 0 ε Lvt))dt, 75) 4 ubject to x v T ) olution of SD-74) at time T given by x v T ) = ζ 0 0 ρt)x v t) ςt) ρt))vt) ] dt σ t vt)dwt) 0 ξ t θ) vt)n dθ,dt), where L ) i a nonlinear, convex and bounded function, atifying aumption 47) and independent of ε. Inpired from Zhou ], example 6.), our objective i to find an admiible portfolio v ) which minimize the cot function 75) of mean-field type i.e., with l ε 4 Lvt)), = 0, h xt), xt))) = xt) xt)) ) ε ). xplicit olution of problem 74) 75), called P ε, may be a difficult problem. The idea i to how that we can eaily get a near-optimal control in feedback form) analytically baed on the optimal control of the impler problem, called P 0 which i obtained by etting ε = 0in75), then we get { x J ζ 0 v )) = v T ) x v T )) ) }, 76) We tudy the optimal control problem where the tate i governed by SD-74) with a new cot function 76). In a econd tep, we olve the control problem 74) 76), and obtain an optimal olution explicitly. Finally, inpired by Zhou ], xample 6.), we olve the control problem P ε of nearoptimally. Problem P 0 :Optimal olution of mean-field tochatic control problem 74) 76)). By a tandard argument, problem P 0 can be olved a follow. Since f t, xt), xt), vt)) = ρt)xt) ςt) ρt)) vt), σ t, xt), xt), vt)) = σ t vt), g t, xt), vt), θ) = vt)ξ t θ), then the Hamiltonian H get the form H t, x, x),vt), t), K t), γ t θ)) = t) ρt)xt) ςt) ρt))vt)] K t)σ t vt) vt) γ t θ) ξ t θ) μdθ) = t)ρt)xt) vt) t)ςt) ρt)) K t)σ t γ t θ) ξ t θ) μdθ). Conequently, ince thi i a linear expreion of v ) then it i clear that the upremum i attained at v t) atifying t)ςt) ρt)) K t)σ t γ t θ) ξ t θ) μdθ) = 0. 77) Since h x xt ), xt )) = xt ) xt )), h y xt ), xt )) = xt ) xt )) then a imple computation how that the firt-order adjoint equation 9) aociated with v t) get the form d t) = ρt) t)dt K t)dwt) γ t θ)ndt, dθ) 78) T ) = x T ) x T )). In order to olve the above q. 78) and to find the expreion of v t) we conjecture a proce t) of the form t) = t)x t) t) x t) ) 3 t), 79) 3
80 M. Hafayed et al. where ), ) and 3 ) are determinitic differentiable function. ee 4,,5,] for other model of conjecture). Applying Itô formula to 79), in virtue of SD-74), we get d t) = t) ρt)x t) ςt) ρt))v t) ] dt σ t v t)dwt) v t)ξ t θ) N dθ,dt) x t) t)dt t)ρt)x t)) ςt) ρt))v t)]dt x t) ) t)dt 3 t)dt = { t) ρt)x t) ςt) ρt))v t) ] x t) t) t) ρt)x t)) ςt) ρt))v t) ] t) x t) ) 3 t) } dt t)σ t v t)dwt) t)v t)ξ t θ) N dθ,dt), T )= T )x T ) T ) x T ) ) 3 T ). 80) Next, comparing 80) with 78), we get ρt) t) = t) ρt)x t) ςt) ρt))v t) ] x t) t) t) ρt)x t)) ςt) ρt))v t) ] t) x t) ) 3 t), 8) K t) = t)σ t v t), 8) γt θ) = t)v t)ξ t θ), 83) and T ) =, T ) =, 3 T ) = 0. 84) Combining 8) and 84) together with 77) we get v ςt) ρt)) t) t) = t) σt ξ t ]. 85) θ) μdθ) We denote At) = σ t ξ t θ) μdθ), 86) by uing 77) together with 85) and 86) then we can get 3 t) = 0fort 0, T ],v t) = ρt) ςt)) At)) t)x t) t) x t))). t) { = ρt) ςt)) At)) } x t) { ρt) ςt)) At)) } t) x t) ). 87) t) Now combining 8) with 79) we deduce v t) t) t)) ρt) ςt)) = ρt) t) t) ] x t) ρt) t) t) ] x t)). 88) By comparing the term containing x t) and x t)), we obtain from 87) with 88) the two ordinary differential equation OD in hort): ] ρt) ςt)) At)) ρt) t) ρt) ςt)) At)) t) = t). ] ρt) ςt)) At)) ρt) t) ρt) ςt)) At)) t) t) = t), 89) a imple computation from 89) we obtain t) t) = t) t), 90) Since T ) =, T ) =, ee 84)) we deduce t) = t), 9) Let u turn to calculate explicitly t) and t).bydividing the firt OD in 89) by t) and the econd OD by t) we get t) = ρt) t), T ) =, t) = ρt) t), T ) =. We now try to olve the above OD See the book by Boyce and DiPrima 8], Chapter ). By imple computation how that for any t 0, T ] ] T t) = exp t ρ)d ] T t) = exp t ρ)d. 9) With thi choice of t) and t), we conclude that v t) i given by v t) = ρt) ςt)) At)) ] x t) ρt) ςt)) At)) ] x t) ), 93) and the adjoint procee t) = t)x t) t) x t) ), K t) = t)σ t v t), γt θ) = t)ξ t θ) v t), atifying the adjoint equation 9). Moreover, with thi choice of v t), the maximum condition 4) of Theorem 3. hold. 3
On mean-field tochatic maximum principle 8 Since h xt), xt)) = xt) xt)) i convex and H,,,t), K t), γ t θ)) i concave, we can aert that our admiible portfolio v t) i optimal and the ufficient condition in Theorem 4. are atified where v t) achieve the maximum. Finally, we give the explicit optimal portfolio in the tate feedback form in the following theorem. Theorem 5. The optimal olution of our mean-field tochatic control problem P 0 i given in the tate feedback form by v t, x t), x t) ) ) = ρt) ςt)) At)) ] x t) ρt) ςt)) At)) ] x t) ), 94) where At) i given by 86). Problem P ε : The Hamiltonian function H for the problem P i H z ),v )) t, x, u) = t)ρt)xt) ut) t)ςt) ρt)) K t)σ t γ t θ) ξ t θ) μdθ) σt vt)ut)qt) σ t u t)qt) ut)vt) ξ t θ)) Q t) γt θ)) μdθ) vt) ξ t θ)) Q t) γ t θ)) μdθ), where Q ) i given by econd-order adjoint equation dq t) = ρt)q t)dt R t)dwt) Ɣ t θ)ndθ,dt) Q T ) =. By uniquene of the olution of the above claical backward SD it i eay to how that Q t), R t), Ɣt θ)) = exp ρr)dr, 0, 0, then we get H x.),v ) t, x,v) = t)ρt)xt) vt) t)ςt) ρt)) K t)σ t t θ) ξ t θ) μdθ) γ t σt v t)vt)q t) σ t v t)q t) vt)v t) ξ t θ)) Q t) γt θ)) μdθ) v t) ξ t θ)) Q t) γ t θ)) μdθ). 95) Since v ) i optimal, by tochatic maximum principle, it neceary that v ) maximize the H-function a.. namely, t)ςt) ρt)) K t)σ t γt θ) ξ t θ) μdθ) = 0. P a., a.e.t. 96) The Hamiltonian H ε for the problem P ε i H x ),v )) ε t, x,v) = t)ρt)xt) vt) t)ςt) ρt)) K t)σ t t θ) ξ t θ) μdθ) γ σt v t)vt)q t) σ t v t)q t) vt)v t) ξ t θ)) Q t) γt θ)) μdθ) v t) ξ t θ)) Q t) γ t θ)) μdθ) ε Lvt)). 97) 4 The above function i maximized at v ε t) which atifie t)ςt) ρt)) K t)σ t γt θ) ξ t θ) μdθ) σt v t)q t) σt vε t)q t) v t) ξ t θ)) Q t) γt θ)) μdθ) v ε t) ε 4 Lv ε t)) = 0, P a., a.e.t. ξ t θ)) Q t) γ t θ)) μdθ) 3