Nguyên lý quy hoạch động và phương trình Hamilton-

Một phần của tài liệu Nghiệm nhớt của phương trình đạo hàm riêng cấp 1 và bài toán điều khiển tối ưu với thời gian vô hạn (Trang 40)

Jacobi-Bellman đối với nghiệm nhớt

Gắn với hệ (2.14), ta xét phiếm hàm chi phí (cost functional) sau đây:

J(x, α) := Z ∞ 0 l(yx(t), α(t))e−λtdt, trong đó l : RN ×A→ R là hàm đã cho, và hằng số λ >0 có tính chất            l liên tục;

tồn tại một mô đun ωl và một hằng số M sao cho

|l(x, a)−l(y, a)| ≤ ωl(|x−y|) và

|l(x, a)| ≤ M,∀x, y ∈ RN, a ∈ A.

(A4)

Chúng ta muốn cực tiểu hóa phiếm hàm chi phí theo α(.) ∈ A.

Định nghĩa 2.2.1. Nếu phiếm hàm chi phí đạt cực tiểu tại điều khiển

α∗(.) thì α∗(.) được gọi là một điều khiển tối ưu ứng với vị trí ban đầu x. Việc cực tiểu hóa các phiếm hàm chi phí đề cập ở trên dẫn tới hàm giá trị (value function) sau đây:

v(x) := inf

α∈AJ(x, α).

Mệnh đề sau chỉ ra một điều kiện đủ để có tính liên tục Lipschitz, H¨older của v.

Mệnh đề 2.2.2. [[4], Mệnh đề 2.1, trang 99] Giả sử ta có các giả thiết(A0),

(A1), (A3) và (A4). Khi đó v ∈ BU C(RN). Nếu thêm giả thiết ωl = Llr

(tức là l Lipschitz theo y, đều theo a) thì v liên tục H¨older với số mũ γ :

γ =      1 nếu λ > L, bất kì γ < 1 nếu λ = L, λ/L nếu λ < L,

trong đó L là hằng số Lipschitz của f đã nêu trong (2.13).

Giả sử K ⊂ RN là tập con sao cho:

∃C, γ > 0 và với mỗi x, z ∈ K, một điều khiển

α1 ∈ A sao cho yx(t−1, α1) = z với một t1 ≤ C|x−z|γ. (2.19)

Nói cách khác quỹ đạo của hệ có thể đạt tới điểm bất kì thuộc K trong khoảng thời gian tỷ lệ với lũy thừa của khoảng cách từ điểm đó tới điểm xuất phát. Chú ý rằng, nếu K lồi thì (2.19) hiển nhiên đúng với γ = 1 nếu

f(x, A) ⊃B(0,1/C).

Mệnh đề 2.2.3. [[4], Mệnh đề 2.3, trang 101] Cho các giả thiết (A0),(A1),

(A3), (A4) và (2.19) trong K. Khi đó với mọi x, z ∈ K ta có |v(x)−v(z)| ≤ M C|x−z|γ.

Tiếp theo ta đưa ra phương trình hàm, tương ứng thỏa mãn bởi các hàm giá trị trên đây, phương trình đó diễn tả một cách trực quan rằng: để đạt được chi phí cực tiểu ta cần thực hiện các bước sau:

• Cho hệ vận hành đến một thời gian nhỏ t với một điều khiển α(.) tùy ý trên đoạn [0, t];

• Thanh toán chi phí tương ứng đến thời điểm t;

• Thanh toán chi phí còn lại (cho thời gian sau t) với một điều khiển tốt nhất có thể;

• Cực tiểu hóa tổng hai khoản đã thanh toán trên tất cả các điều khiển có thể trên đoạn [0, t].

Mệnh đề 2.2.4. [Nguyên lý quy hoạch động] Giả sử ta có các giả thiết

(A0),(A1),(A3) và (A4). Khi đó với mọi x ∈ RN và t >0, v(x) := inf α∈A    t Z 0 l(yx(s), α(s))e−λsds+v(yx(t, α))e−λt    . (2.20) Chứng minh. Gọi vế phải của (2.20) là ω(x). Trước hết ta chứng minh rằng

v(x) ≥ω(x). Với α ∈ A ta có J(x, α) = t Z 0 l(yx(s), α(s))e−λsds+ ∞ Z t l(yx(s), α(s))e−λsds (2.21) = I1 + ∞ Z 0 l(yx(s+t), α(s+t))e−λse−λtds = I1 + e−λtJ(yx(t),α˜) ≥ I1 + e−λtv(yx(t)) ≥ω(x),

trong đó I1 là tích phân đầu tiên ở vế phải của (2.21) và α˜(s) := α(s+t).

Lấy infimum trên A ta nhận được v(x) ≥ ω(x).

Để chứng minh bất đẳng thức ngược lại, ta cố định α ∈ A, đặt z :=

yx(t, α), và cố định ε > 0, α1 ∈ A sao cho

v(z) ≥ J(z, α1)−ε.

Định nghĩa điều khiển

α(s) =

(

α(s) nếu s ≤t, α1(s−t) nếu s > t.

và gọi y và y1 là các quỹ đạo tương ứng với α và α1. Khi đó

v(x) ≤ J(x, α) = t Z 0 l(yx(s), α(s))e−λsds+ ∞ Z t l(yx(s), α(s))e−λsds (2.22) = I1 +e−λt ∞ Z 0 l(yz1(τ), α1(τ))e−λτdτ = I1 +e−λtJ(z, α1) ≤ I1 + e−λtv(yx(t, α)) +ε,

trong đó I1 là tích phân đầu tiên ở vế phải của (2.22). Do ε và α là tùy ý nên v(x) ≤ ω(x).

Nhận xét 2.2.5. Nếu có một điều khiển tối ưu α∗ đối với x, tức là,

v(x) = J(x, α∗), thì cực tiểu trong (2.20) đạt được tại α∗ :

v(x) =

t

Z

0

l(yx(s, α∗),α∗(s))e−λsds+v(yx(t, α∗))e−λt (2.23) với mọi t > 0. Trên thực tế, những tính toán sau (2.21) cho ta

v(x) =

t

Z

0

l(yx(s, α∗),α∗(s))e−λsds+e−λtJ(yx(t, α∗), α∗(·+t)).

Vậy ta có bất đẳng thức ≥ trong (2.23). Đồng thời ta cũng có:

v(yx(t, α∗)) = J(yx(t, α∗), α∗(·+ t))

tức là, một điều khiển tối ưu đối với x, là tối ưu đối với mọi điểm của quỹ đạo tương ứng, nếu ta dịch chuyển thời gian một cách thích hợp. Đây là cách Bellman thiết lập "Nguyên lý tối ưu": "Một chính sách tối ưu là chính sách có tính chất: với bất cứ trạng thái ban đầu và quyết định ban đầu nào thì các quyết định còn lại phải tạo ra một chính sách tối ưu đối với trạng thái dẫn đến bởi quyết định ban đầu đó". Cần lưu ý rằng (2.23) suy ra hàm: t 7→ t Z 0 l(yx(s, α), α(s))e−λsds+v(yx(t, α))e−λt

là hằng số nếu và chỉ nếu α là tối ưu.

Nhận xét 2.2.6. Mệnh đề 2.2.2 được thỏa mãn bởi ω(x) = infα∈BJ(x, a) với bất kỳ B ⊂ A. Mệnh đề 2.2.4 được thỏa mãn bởi bất kỳ tập B có các tính chất sau:

(ii) Nếu α1, α2 ∈ B, s > 0, α(t) := ( α1(t) nếu t≤ s α2(t−s) nếu t > s, thì α ∈ B.

Do đó, chẳng hạn hàm v(x) = infα∈PJ(x, a) thỏa mãn (2.20) với A thay thế bởi P.

Hàm Hamiltonian trong phương trình Hamilton-Jacobi-Bellman của bài toán với thời gian vô hạn là: H :RN ×RN →R xác định bởi

H(x, p) := sup

a∈A

{−f(x, a)·p−l(x, a)} (2.24) Chú ý rằng H(x, p) < +∞ với mọi x và p, do (A1) và (A4).

Từ nguyên lý quy hoạch động ta có

Mệnh đề 2.2.7. Cho các giả thiết (A0) - (A4). Khi đó hàm giá trị v là một nghiệm nhớt của

λv +H(x, Dv) = 0 trong RN. (2.25) Chứng minh. Lấy φ ∈ C1(RN) và x là một điểm cực đại địa phương của

v−φ,tức là, có một sốτ > 0 : v(x)−v(z) ≥ φ(x)−φ(z) với mọiz ∈ B(x, r). Chọn tùy ý a ∈ A và gọi yx(t) là nghiệm ứng với điều khiển không đổi

α(t) =a với mọi t. Với t đủ nhỏ thì yx(t) ∈ B(x, r) (theo (2.16)) và khi đó

φ(x)−φ(yx(t)) ≤ v(x)−v(yx(t)), với mọi 0≤ t ≤t0.

Bằng cách sử dụng bất đẳng thức ” ≤ ” trong nguyên lý quy hoạch động (2.20) ta nhận được φ(x)−φ(yx(t)) ≤ t Z 0 l(yx(s), a)e−λsds+v(yx(t))(e−λt−1);

do vậy, chia hai vế cho t > 0 rồi cho t→ 0, chúng ta thu được, do tính khả vi của φ và tính liên tục của v, yx, f và l,

Do a ∈ A tùy ý nên chúng ta đã chứng minh được rằng

λv(x) + sup

a∈A

{−f(x, a)·Dφ(x)−l(x, a)} ≤ 0,

hay v là một nghiệm nhớt dưới của (2.25).

Tiếp theo, giả sử x là một điểm cực tiểu địa phương của v−φ, tức là, có một số r > 0 sao cho

v(x)−v(z) ≤ φ(x)−φ(z), với mọi z ∈ B(x, r). (2.26) Với mỗi ε > 0 và t > 0, bất đẳng thức ”≥ ” trong nguyên lý quy hoạch động (2.20), tồn tại α ∈ A (chỉ phụ thuộc vào ε và t) sao cho

v(x) ≥ t

Z

0

l(yx(s), α(s))e−λsds+v(yx(t))e−λt −tε, (2.27) trong đó yx(s) = yx(s, α) là quỹ đạo của (S) ứng với α. Bây giờ để ý rằng, từ (2.16) và (A4) suy ra

|l(yx(s), α(s))−l(x, α(s))| ≤ ωl(Mxs), với 0≤ s ≤t0, (2.28) và (2.16) và (A2) suy ra

|f(yx(s), α(s))−f(x, α(s))| ≤ωf(Mxs,|x|+Mxt0) với 0≤ s ≤t0, (2.29) trong đó t0 không phụ thuộc vào α, εvà t. Theo (2.28), tích phân ở vế phải của (2.27) có thể viết như sau

t

Z

0

l(x, α(s))e−λsds+o(t), khi t →0,

trong đó o(t) là một hàm g(t) sao cho limt→0+|g(t)|/t = 0, và trong trường hợp này |g(t)| ≤ tωl(Mxt). Do đó (2.26) với z = yx(t) và (2.27) cho ta

φ(x)−φ(yx(t)) − t Z 0 l(x, α(s))e−λsds+v(yx(t))(1−e−λt) ≥ −tε+ o(t). (2.30)

Hơn nữa, φ(x)−φ(yx(t)) = − t Z 0 d dsφ(yx(s))ds = − t Z 0 Dφ(yx(s))·f(yx(s), α(s))ds = − t Z 0 Dφ(x)·f(x, α(s))ds+ o(t), (2.31)

trong đó ta đã sử dụng (2.16), (2.29) và φ ∈ C1 trong đẳng thức cuối để ước lượng sự thay đổi của Dφ·f tại yx(s) và tại x. Thay (2.31) vào (2.30) rồi cộng với ± t R 0 l(x, α(s))ds ta có t Z 0 {−Dφ(x)·f(x, α(s))−l(x, α(s))}ds+ t Z 0 l(x, α(s))(1−e−λs)ds +v(yx(t))(1−e−λt) ≥ −tε+o(t). (2.32)

Số hạng trong ngoặc trong tích phân đầu tiên có cận trên là sup

a∈A

{−Dφ(x)·f(x, a)−l(x, a)}

và tích phân thứ hai là o(t) bởi vì l bị chặn theo (A4), do vậy chúng ta có thể chia (2.32) cho t > 0 và chuyển qua giới hạn để có được

sup

a∈A

{−Dφ(x)·f(x, a)−l(x, a)}+λv(x) ≥ −ε,

ở đó ta đã sử dụng tính liên tục của v tại x và của yx tại 0. Do ε là tùy ý nên chứng minh rằng v là một nghiệm trên.

Nhận xét 2.2.8. Chứng minh của Mệnh đề 2.2.7 cho thấy, một hàm bất kỳ thỏa mãn nguyên lý quy hoạch động (2.20) với A thay thế bởi B ⊆ A, bất kỳ sao cho B chứa các hàm hằng đều là nghiệm nhớt của (2.25). Chẳng hạn hàm v# thỏa mãn (2.25) theo Nhận xét 2.2.6.

Hệ quả 2.2.9. Cho các giả thiết (A0)-(A4) và tồn tại r > 0 sao cho

B(0, r) ⊆ cof(x, A). Khi đó hàm giá trị v liên tục Lipschitz trong RN.

Chứng minh. Do v là nghiệm bị chặn của (2.25) nên ta có thể áp dụng Mệnh đề 1.3.2. Thực vậy, theo các giả thiết hiện tại ta có

H(x, p) ≥ sup a∈A {−f(x, a)·p} −M = sup q∈cof(x,a) {−q ·p} −M ≥ sup |q|≤τ {−q ·p} − M = τ |p| −M.

Chúng ta đã biết từ phần bất đẳng thức vi phân theo nghĩa nhớt trong Chương 1, hàm giá trị v thỏa mãn v(x) ≥ u(x) tại mọi x, với mọi nghiệm dướiu của (2.25). Do đó, theo Mệnh đề 2.2.7,v là nghiệm dưới lớn nhất của (2.25), nên v được đặc trưng bởi phương trình Hamilton-Jacobi-Bellman. Thật vậy, do v cũng là nghiệm trên của (2.25) nên v được đặc trưng là nghiệm nhớt duy nhất của (2.25). Chúng ta thực hiện điều này nhờ một nguyên lý so sánh, từ đó suy ra v là một nghiệm trên nhỏ nhất. Trước hết chúng ta cần một bổ đề mang tính kỹ thuật về tính chính quy của hàm Hamiltonian H xác định bởi (2.24)

Bổ đề 2.2.10. Cho các giả thiết (A0)-(A4). Khi đó H liên tục và thỏa mãn

H(y,µ(x−y)−τ y)−H(x, µ(x−y) +γx)

≤ µL|x−y|2 +τ K(1 +|y|2) +γK(1 +|x|2) +ωl(|x−y|)

(2.33)

với mọi µ, τ, γ > 0, x, y ∈ RN, ở đó K := L+ sup{|f(0, a)| : a ∈ A}.

Hơn nữa nếu (2.13) thỏa mãn, thì H thỏa mãn

|H(x, p)−H(y, p)| ≤ |p|L|x−y|+ωl(|x−y|) (2.34)

với mọi x, y, p ∈ RN. Nếu thêm giả thiết

∃M0 : |f(x, a)| ≤M0, với mọi x ∈ RN, a∈ A, (2.35)

thì

Chứng minh. Trước hết để ý rằng, (A3) suy ra

f(z, a)·z ≤ L|z|2 + sup

a∈A

|f(0, a)| |z| ≤K(1 +|z|2) (2.37) với mọi z ∈ RN, a ∈ A. Bây giờ cố định ε > 0 và a sao cho

H(y, µ(x, y)−τ y) ≤ −f(y, a)·(µ(x, y)−τ y)−l(y, a) + ε.

Khi đó vế trái của (2.33) được làm trội bởi

µ(f(x, a)−f(y, a))·(x−y) +τ f(y, a) +γf(x, a)·x−l(y, a) +l(x, a) +ε,

mà biểu thức này nhỏ hơn hoặc bằng vế phải của (2.33) cộng với ε nhờ (A3), (A4) và (2.37). Do ε tùy ý nên ta có (2.33). Hai khẳng định còn lại có thể chứng minh tương tự.

Bổ đề 2.2.10 cho thấy, nếu f thỏa mãn (A0) ,(2.35) và (2.13) thì Hamil- tonian H thỏa mãn các giả thiết của Định lý 1.2.4, nên nghiệm dưới của (2.25) luôn nhỏ hơn hoặc bằng nghiệm trên của phương trình đó nếu cả hai thuộc BU C(RN). Do theo Mệnh đề 2.2.7, hàm giá trị v vừa là nghiệm nhớt dưới vừa là nghiệm nhớt trên của (2.25) nên v nhỏ hơn một nghiệm nhớt trên bất kỳ trong BU C(RN) và lớn hơn một nghiệm nhớt dưới bất kỳ thuộc BU C(RN). Do đó v là nghiệm nhớt duy nhất của (2.25) trong

BU C(RN), chính xác hơn nó đồng thời là nghiệm dưới lớn nhất và nghiệm trên nhỏ nhất. Trong trường hợp này ta nói rằng v là một nghiệm đầy đủ của (2.25) trong BU C(RN). Tất cả điều này vẫn đúng dưới các giả thiết tổng quát hơn (A0)-(A4) như chỉ ra trong định lý sau:

Định lý 2.2.11. Giả sử H : R2N → Rlà hàm liên tục và thỏa mãn (2.33). Nếu u1, u2 ∈ BU C(RN) tương ứng nghiệm nhớt dưới và nghiệm nhớt trên của

u+H(x, Du) = 0, trong RN, (2.38)

thì u1 < u2 trong RN. Đặc biệt, nếu H cho bởi (2.24) và có các giả thiết (A0)-(A4) thì hàm giá trị v là nghiệm đầy đủ của (2.25) trong BU C(RN)

Chứng minh. Phần thứ hai của định lý suy ra từ Mệnh đề 2.2.7 và Bổ đề 2.2.10 như sau: chia (2.25) cho λ > 0 và để ý rằng H/λ thỏa mãn các giả thiết cấu trúc (2.33) (với các hằng số và mô đun ωl) được chia cho λ, mà không ảnh hưởng đến chứng minh sau đó).

Để chứng minh phần so sánh nghiệm, chúng ta xét Φ : R2N → R, Φ(x, y) := u1(x)−u2(y)− |x−y|

2

2ε −β(hxim +hyim),

trong đó hxi := (1 +|x|2)12, và ε, β, m là các tham số dương được lựa chọn phù hợp.

Ta giả sử ơhanr chứng rằng, tồn tạiδ > 0và exsao chou1(xe)−u2(xe) = δ. Ta chọn β > 0 sao cho 2β(xe) ≤ δ/2,, do đó với mọi 0< m ≤ 1,

δ

2 < δ −2βhxeim = Φ(x,e ex) ≤sup Φ(x, y). (2.39) Vì Φ là liên tục và lim|x|+|y|→∞Φ(x, y) =−∞ nên tồn tại x, y sao cho

Φ(x, y) = sup Φ(x, y). (2.40) Từ bất đẳng thức Φ(x, x) + Φ(y, y) ≤ 2Φ(x, y) chúng ta dễ dàng có

|x−y|2

ε ≤ u1(x)−u1(y) +u2(x)−u2(y). (2.41) Khi đó từ tính bị chặn của u1, u2 suy ra

|x−y| ≤ c√

ε (2.42)

với một hằng số c thích hợp. Thế (2.42) vào (2.41) và sử dụng tính liên tục đều của u1, u2, ta có

|x−y|2

ε ≤ω(√

ε), (2.43)

với ω là một mô đun.

Tiếp theo, ta xây dựng các C1 hàm thử

ϕ(x) := u2(y) + |x−y|2

2ε +β(hxim +hyim)

ψ(y) := u1(x)− |x−y|

2

và để ý rằng, từ định nghĩa của x, y, u1 −ϕ đạt lớn nhất tại x và u2 −ψ đạt nhỏ nhất tại y. Dễ dàng tính được Dϕ(x) = |x−y| ε +γx,γ = βmhxim−2 Dψ(y) = |x−y| ε −τ y,τ = βmhyim−2.

Theo định nghĩa của nghiệm dưới và nghiệm trên,

u1(x) +H(x, Dϕ(x)) ≤0 ≤ u2(y) +H(y, Dψ(y)), (2.44) và bằng cách sử dụng (2.33) với µ = 1/ε, τ, γ như trên và định nghĩa của

hxi, ta có u1(x)−u2(y) ≤ L ε|x−y|2 +τ Khyi2 +γKhxi2 +ωl(|x−y|) ≤ Lω(√ ε) +βmK(hxim+ hyim) +ωl(c√ ε), trong đó để có bất đẳng thức cuối chúng ta đã sử dụng (2.42) và (2.43). Lúc này, bằng cách chọn 0 < m≤ 1/K ta có được Φ(x, y) ≤u1(x)−u2(y)−β(hxim +hyim) ≤Lω(√ ε) +ωl(c√ ε),

và vế phải của bất đẳng thức cuối này có thể làm nhỏ hơn δ/2 với ε đủ nhỏ. Điều này mâu thuẫn với (2.39) và (2.40).

Nhận xét 2.2.12. Giả thiết về tính liên tục đều của u1, u2 trong Định lý 2.2.11 có thể thay thế bởi tính liên tục. Khi đó v vẫn là nghiệm đầy đủ của (2.25) trong lớp BC(RN) (các hàm liên tục và bị chặn từ RN → R). Để chứng minh điều này, khi đã chọn β ta có ước lượng

hxim+ hyim < supu1 −infu2

β =: c0

với mọi ε > 0, m ∈ [0,1], vì nếu không thì Φ(x, y) ≤ 0, mâu thuẫn với (2.39) và (2.40). Khi đó với mọi ε > 0, x, y thuộc tập compact B(0, c10/m), ở đó m = min{1,1/K}, tính liên tục đều của u1, u2 trên tập hợp đó là đủ để suy ra (2.43) từ (2.41) và (2.42). Đó là bước duy nhất mà chúng ta đã sử dụng tính liên tục đều của u1, u2.

Nhận xét 2.2.13. Định lý 2.2.11 và Nhận xét 2.2.12 có thể dễ dàng mở rộng thành một kết quả so sánh cho bài toán biên Dirchlet. Nếu H là hàm liên tục và thỏa mãn (2.43), Ω ⊆RN là một tập mở u1, u2 ∈ BC(Ω) tương ứng là nghiệm nhớt dưới và nghiệm nhớt trên của u+H(x, Du) = 0 trong Ω và u1 ≤ u2 trên ∂Ω thì

u1 ≤ u2

trong Ω. Khác biệt duy nhất trong chứng minh là điểm cực đại của Φ,(x, y) có thể không thuộc Ω×Ω. Nếu x ∈ ∂Ω thì ta có

Φ(x, y) ≤ u1(x)−u2(x) +u2(x)−u2(y) ≤ ω(c√

ε),

ở đó (Ω là mô đun liên tục của u2 trong B(0, c10/m) (xem chứng minh của Nhận xét 2.2.12) và ta đã sử dụng (2.42). Bằng cách chọn ε đủ nhỏ ta suy ra mâu thuẫn với (2.39) và (2.40). Nếu x ∈ Ω và y ∈ ∂Ω thì ta thêm bớt

u1(y) và sử dụng tính liên tục của u1 để suy ra mấu thuẫn.

Nhận xét 2.2.14. Một hệ quả trực tiếp của Định lý 2.2.11 và Nhận xét 2.2.6 và 2.2.8 là đẳng thức v = v#, tức là lớp các hàm điều khiển đo được và lớp các hàm điều khiển hằng từng khúc sinh ra cùng một hàm giá trị.

Chúng ta kết thúc phần này với một vài bình luận về tính tối ưu của các giả thiết trong Định lý so sánh 2.2.11 đối với hàm Hamiltonian có dạng (2.24). Trước tiên chú ý rằng, chúng ta không thể bỏ giả thiết u1 và u2 đồng thời bị chặn bởi vì phương trình tuyến tính một chiều u−xux = 0 trong R có các nghiệm cổ điển liên tục đều u1 ≡ 0 và u2 = x. Nó cũng có các nghiệm nhớt u3(x) = |x| và u4(x) = − |x| tương ứng bị chặn dưới và bị chặn trên và vẫn là các nghiệm của phương trình hữu hạn chiều tùy ý

u−x·Du = 0 trong RN.

Tuy nhiên chúng ta vẫn có các kết qủa so sánh và tính duy nhất trong lớp nghiệm không bị chặn với các giả thiết thích hợp về độ tăng tại vô cực (xem Nhận xét 1.2.5).

Giả thiết về tính liên tục đều củal trong (A4) cũng có thể lới lỏng thành tính liên tục tuy nhiên chúng tôi không đề cập chi tiết ở đây.

Bây giờ chúng ta tập trung vào giả thiết (A3) thông qua trường hợp một chiều N = 1 , A là tập một điểm, do đó phương trình Hamilton- Jacobi- Bellman là tuyến tính và f(x) là một lũy thừa của x.

Với "trường hợp f giảm"

f(x) := −sgnx|x|b, x ∈ R

thỏa mãn (A3) với bất kỳ b > 0(với L = 0), do vậy Định lý 2.2.11 áp dụng với phương trình

u+ sgnx|x|bux = 0 trong R và u ≡ 0 là nghiệm bị chặn duy nhất.

Với "trường hợp f tăng "

Một phần của tài liệu Nghiệm nhớt của phương trình đạo hàm riêng cấp 1 và bài toán điều khiển tối ưu với thời gian vô hạn (Trang 40)

Tải bản đầy đủ (PDF)

(57 trang)