1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiệm nhớt của phương trình đạo hàm riêng cấp 1 và bài toán điều khiển tối ưu với thời gian vô hạn

56 539 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 56
Dung lượng 7,12 MB

Nội dung

Trang 1

LỜI CẢM ƠN

Luận văn được hoỏn thỏnh tại Trường Đại học Sư phạm Hỏ Nội 2 dưới sự hướng dẫn của TS Trần Văn Bằng

Tõc giả xin được gửi lời cảm ơn chón thỏnh tới thầy giõo, tiến sĩ Trần

Văn Bằng, cõc thầy cừ giõo trong nhỏ trường vỏ cõc thầy cừ giõo giảng dạy chuyởn ngỏnh Toõn Giải tợch đọ giỷp đỡ tõc giả trong suốt quõ trớnh học

tập vỏ lỏm luận văn

Cuối cỳng, tõc giả xin được cảm ơn tới gia đớnh, bạn bộ, đồng nghiệp đọ động viởn vỏ tạo mọi điều kiện thuận lợi để tõc giả hoỏn thỏnh bản

luận văn nỏy

Hỏ Nội, thõng 05 năm 2018 Tõc giả

Trang 2

LỜI CAM ĐOAN

Từi xin cam đoan Luận văn lỏ cừng trớnh của nghiởn cứu của cõ nhón

từi, dưới sự hướng dẫn của TS Trần Văn Bằng

Trong khi nghiởn cứu luận văn, từi đọ kế thừa thỏnh quả khoa học của,

cõc nhỏ khoa học vỏ đồng nghiệp với sự trón trọng vỏ biết ơn

Hỏ Nội, thõng 05 năm 2018 Tõc giả

Trang 3

Mục lục

Mở đầu

Chương 1 Kiến thức chuẩn bị

1.1 Nghiệm nhớt của phương trớnh đạo hỏm riởng phi tuyến cấp 1 1.11 Định nghĩa vỏ cõc tợnh chất cựbản 1.1.2 Phờp toõn trởn cõc nghiệm nhụớt 113 Hỏm lề Ặ 1.2 Tợnh duy nhất vỏ sự so sõnh nghiệm 1.3 Tợnh chợnh quy của nghiệm nhớt 1.3.1 Tợnh liởn tục Lipschitz 1.3.2 Tợnh nửa lửm .Ặ.Ặ.ẶẶẶẶ 1.3.3 Tinhkhavi 2 0

Chương 2 Bỏi toõn điều khiển tối ưu với thời gian vừ hạn 2.1 Bỏi toõn điều khiển tối ưu với thời gian vừ hạn

2.1.1 Hệ điều khiển

2.1.2 Nguyởn lý quy hoạch động

2.1.3 Phuong trinh Hamilton-Jacobi-Bellman

2.1.4 Dịnhlýkiểm định

2.2 Ung dụng của nghiệm nhớt đối với bỏi toõn điều khiển tối ưu với thời gian vừ hạn ỏo 2.2.1 Nguyởn lý quy hoạch động vỏ phương trớnh Hamilton- Jacobi-Bellman đối với nghiệm nhớt

2.2.2 Dịnh lý kiểm định qua nghiệm nhớt

Trang 4

MỞ ĐẦU

1 Lý do chọn đề tỏi

Bỏi toõn điều khiển tối ưu xuất hiện trong rất nhiều lĩnh vực khoa học

cũng như thực tiễn (xem [1, 4, 5]) Một trong những phương phõp tiếp cận quan trọng của lý thuyết cõc bỏi toõn điều khiển tối ưu lỏ phương phõp

quy hoạch động Theo phương phõp đụ hỏm giõ trị của bỏi toõn (nếu khả vi) sẽ lỏ nghiệm cổ điển của phương trớnh Hamilton-Jaeobi-Bellman liởn kết, đụ lỏ một phương trớnh đạo hỏm riởng phi tuyến cấp một Tuy nhiởn

trong đa số cõc tớnh huống thớ hỏm giõ trị nụi chung khừng khả vi, vớ thế

một vấn đề quan trọng đặt ra lỏ: hỏm giõ trị cụ thỏa mọn phương trớnh Hamilton-Jacobi-Bellman hay khừng? Nếu cụ thớ thỏa mọn theo nghĩa nỏo? Đầu những năm 80 của thế kỉ trước, M G Crandall đọ đề xuất một khõi niệm nghiệm suy rộng mới cho phương trớnh đạo hỏm riởng phi tuyến cấp một, đụ lỏ nghiệm nhớt Cho đến nay khõi niệm nỏy đọ được chứng minh lỏ đặc biệt hữu dụng đối với lý thuyết điều khiển tối ưu, lý thuyết

trú chơi vi phón, (xem [7, 6, 3])

Xuất phõt từ lý do trởn vỏ được sự định hướng của TS Trần Văn Bằng em chọn đề tỏi:

“Nghiệm nhớt của phương trớnh đạo hỏm riởng cấp 1 vỏ bỏi toõn điều khiển tối ưu với thời gian vừ hạn” Nội dung của Luận văn gồm hai chương:

Chương 1, trớnh bỏy cõc kiến thức chuẩn bị về nghiệm nhớt của phương

trớnh đạo hỏm riởng cấp một, bao gồm: khõi niệm, cõc tợnh chất, cõc phờp toõn,

Trang 5

2 Mục đợch nghiởn cứu

Tớm hiểu Nghiởn cứu ứng dụng của nghiệm nhớt liởn tục của

phương trớnh đạo hỏm riởng cấp 1 đối với bỏi toõn điều khiển tối ưu thời gian vừ hạn

3 Nhiệm vụ nghiởn cứu

-Tớm hiểu về nghiệm nhớt liởn tục của phương trớnh đạo hỏm riởng

cấp 1;

-Tớm hiểu về bỏi toõn điều khiển tối ưu nụi chung;

-Tớm hiển về bỏi toõn điều khiển tối tu thời gian vừ hạn

4 Đối tượng vỏ phạm vi nghiởn cứu

+ Đối tượng nghiởn cứu: Đối tượng nghiởn cứu: Cõc điều kiện tối

ưu cho bỏi toõn điều khiển tối ưu thời gian vừ hạn

+ Phạm vi nghiởn cứu: Nghiởn cứu bỏi toõn điều khiển tối ưu tất định với hỏm giõ trị liởn tục số khừng gian hỏm

5 Phương phõp nghiởn cứu

Sử dụng một số phương phõp của Giải tợch hỏm, phương trớnh đạo hỏm riởng vỏ lý thuyết điều khiển tối ưu

6 Đụng gụp mới của luận văn

+ Luận văn lỏ một tỏi liệu tổng quan về ứng dụng của nghiệm nhớt

Trang 6

Chương 1

Kiến thức chuẩn bị

Nội dung của chương nỏy chủ yếu được tham khảo từ cõc tỏi liệu [3]-[7]

1.1 Nghiệm nhớt của phương trớnh đạo hỏm riởng phi tuyến cấp 1

1.1.1 Định nghĩa vỏ cõc tợnh chất cơ bản

Mục nỏy trớnh bỏy khõi niệm nghiệm nhớt của phương trớnh đạo hỏm riởng (ĐHR) cấp một vỏ một số tợnh chất cơ bản dựa vỏo nguyởn lý so sõnh nghiệm cũng như mối quan hệ với khõi niệm nghiệm cổ điển của phương trớnh đụ

Cho O C RŸ lỏ một tập mở, F:Q x Rx RY > R lỏ một hỏm liởn tục của ba biến (z,z,p) Kợ hiệu:

Œ(Ẫ) lỏ khừng gian tất cả cõc hỏm thực liởn tục trởn O;

Œ!(O),k = 1,2, lỏ khừng gian tất cả cõc hỏm thuộc Œ(Ẫ) cụ cõc đạo hỏm riởng đến cấp k liởn tục trởn 9

Với một hỏm œ € Œ1(ể), thớ Du(z) lỏ gradient của wu tai x € Q

Xờt phương trớnh ĐHR, phi tuyến cấp một (thường gọi lỏ phương trớnh

Hamilton-Jacobi):

F(a,u(x),Du(z))=0, c9 (HJ)

Dinh nghĩa 1.1.1 Hỏm u € C(Q) lỏ một nghiệm nhớt dưới của phương trớnh (HJ) nếu với mọi Ò € Œ1(Ẫ) ta cụ:

P(œo, u(#o), Dụ(zo)) < 0 (1.1)

Trang 7

Ham u € C(Q) 1a một nghiệm nhờt trờn cia phuong trớnh (HJ) nếu với mọi @ € C1(Q) ta cụ:

Tt(œi,0(#ớ), De(3i)) > 0 (1.2) tại mọi điểm cực tiểu địa phương zâ € Ẫ của u — ỵ

Hỏm wu lỏ một nghiệm nhớt nởu nụ vừa lỏ nghiệm nhớt trởn vừa lỏ

nghiệm nhớt dưới của phương trớnh đụ

Ham Ò(z) trong định nghĩa trởn thường được gọi lỏ hỏm thử

Vợ dụ 1.1.2 Hỏm số u(x) = |z| lỏ một nghiệm nhớt của phương trớnh:

—|u'(x)|+1=0, z€(-I,I)

Thật vậy, ta xờt hai trường hợp: nếu + # 0 lỏ một cực trị địa phương của — Ò@ thớ Ò'(#) = w/(z) = ê1 Vi vay tại những điểm nỏy điều kiện nghiệm nhớt trởn, nghiệm nhớt dưới được thỏa mọn

Nếu 0 lỏ cực tiểu địa phương của u— y, thi ta tợnh được |Ò'(0)| < 1 nởn

điều kiện nghiệm nhớt trởn vẫn đỷng Bóy giờ ta chứng minh 0 khừng thể lỏ cực đại địa phương của — œ với Ò € Œ!(|0, 1]) Thật vậy, nếu 0 lỏ cực

dai địa phương của — y thi ta c6 (u — y)(0) > (u— y)(x) trong mot lan cận cha 0, hay v(x) — Ò(0) > u(x) trong một lón cận của 0, từ đụ ta cụ: " ` z— 0# x—0 230* va y'(0) = lim #ữ) = e0) < lim u(z) =—-l, —0= œ—0 „0# x

Vo ly, vay 0 khong thờ 1A cuc dai dia phugng cha u — Ò

Dờ ơ rang, ham sờ u(x) = |z| khừng phải lỏ nghiệm nhớt của phương

trớnh:

|u(z)|—1=0, z€ (—1,1)

Thật vậy điều kiện nghiệm trởn khừng thỏa mọn tai zy = 0 1A điểm cực

Trang 8

Chỷ ý: Đối với cõc phương trớnh tiến hụa cụ dạng:

u(t, y) + H(t,y, u(t, y), Dyu(t,y)) = 0, (t,y) € (0,T) x D

thi ta chi viờc dat:

r= (t,y)€Q=(0,T) x DCRẼ*, F(a,r,p) = avai t+ A(a,7,@, 5 aN)

với q = (1, 5 Gv, Gv+1) € RẼ*1

Nhận xờt 1.1.3 Trong định nghĩa nghiệm nhớt dưới ta luừn cụ thể giả sử rằng zạ lỏ điểm cực đại địa phương ngặt của hỏm œ — Ò (nếu khừng ta

cụ thể thay Ò(#) bởi v(x) + |# — zo|”) Hơn nữa do (1.1) chỉ phụ thuộc vỏo

giõ trị của Dy tại zạ, nởn khừng mất tợnh tổng quõt ta cụ thể giả sử rằng

u(zo) = @(œạ) Đối với định nghĩa nghiệm nhớt trởn ta cũng cụ nhận xờt tương tự

Về mặt hớnh học thớ điều đụ cụ nghĩa rằng: cõc hỏm thử trong điều kiện nghiệm nhớt dưới (1.1) đối với w lỏ tiếp xỷc trởn với đồ thị của wu

Ta cũng chỷ ý rằng khừng gian C1(O) cõc hỏm thử trong Dịnh nghĩa

1.1.1 eụ thể được thay thế bằng Œ%(Ẫ)

Mệnh đề sau đóy sẽ thể hiện những đặc trưng cơ bản của nghiệm nhớt vỏ mối quan hệ của nụ với nghiệm cổ điển:

Mệnh đề 1.1.4 (a) Nếu hỏm + € Œ(Ẫ) lỏ một nghiệm nhớt của (H1) trong Ẫ, thớ u lỏ nghiệm nhụt của (H1) trong Q, với mọi tập con mở Q CQ;

(b) Giả sử hỏm u € C(Q) la một nghiệm cổ điển của (H1), tức lỏ w khả vi tai moi diờm x € Q va:

F(z,u(x), Du(z)) = 0, Ve EQ (1.3)

Khi đụ u lỏ nghiệm nhớt của (H1);

(c) Nờu hỏm u € Œ1(Q) lỏ một nghiệm nhớt của (HJ), thớ u lỏ nghiệm cổ

Trang 9

Mệnh đề (a) cho thấy khõi niệm nghiệm nhớt cụ tợnh địa phương Vớ

vậy ta cụ thể lấy cõc hỏm thử trong (1.1) vỏ (1.2) 1A mot C!—ham trởn IRỲ hoặc trởn một hớnh cầu bất kỳ ệ(z,r) với tóm z € 9

Dịnh nghĩa nghiệm nhớt cụ liởn quan chặt chẽ đến hai tợnh chất được nởu trong lý thuyết của phương trớnh eliptie - parabolie đụ lỏ nguyởn ly cực đại vỏ nguyởn lý so sõnh Với phương trớnh (HJ) hai tợnh chất nỏy được xóy dựng tương ứng như sau

Định nghĩa 1.1.5 Một hỏm số € C(Q) thờa man nguyởn lý so sõnh với

cõc nghiệm nhớt trởn trơn ngặt nếu với mọi @ € Œ1{) vỏ tập mở @ì C Ẫ sao cho F(x, p(x), Dy(x)) > 0, Vz € O,u < y trờn 0O thi wu < y trong O Ta nụi rằng ham sờ u € C(Q) thoa man nguyờn ly cuc dai nởu với mọi ep € Œ1(9) vỏ tập mở O CQ sao cho: F(x, y(x),Dy(x))>0, Vee O

thớ œ — Ò khừng thể cụ cực đại khừng óm trong O

Dễ thấy rằng nếu hỏm + € Œ(O) thỏa mọn nguyởn lý cực đại thớ nụ thỏa mọn nguyởn lý so sõnh Mối quan hệ giữa chỷng với khõi niệm nghiệm nhớt dưới của phương trớnh (HJ) sẽ được trớnh bỏy ở mệnh đề sau đóy

Mệnh đề 1.1.6 Nếu ham sờ u € C(O) thỏa mọn nguyởn lý so sõnh thớ u

lỏ một nghiệm nhụt dưới của phương trớnh (HJ) Ngược lại, nếu u lỏ một

nghiệm nhớt dưới của phương trinh (HJ) var > F(a,r,p) lA mờt ham

khừng giảm với mọi z,p thớ u thỏa mọn nguyởn lý cực đại vỏ nguyởn lý so

sõnh

Kết quả tương tự cũng đỷng với nghiệm nhớt trởn Khi đụ ta chỉ cần

đổi chiều cõc bất đẳng thức trong nguyởn lý so sõnh vỏ nguyởn lý cực đại

Trang 10

Một điều cần lưu ý lỏ nghiệm nhớt khừng được bảo toỏn khi ta đổi dấu

của phương trớnh Thực tế, vớ bất kỳ cực đại địa phương nỏo của — Ò

đều lỏ cực tiểu địa phương của —% — (—ựœ), nởn œ lỏ nghiệm nhớt dưới của phương trớnh (HJ) nếu vỏ chỉ nếu ự = —%w lỏ nghiệm nhớt trởn của phương

trớnh —#(z,—0(z),— Do(z)) = 0 trong Ẫ; tương tự œ lỏ nghiệm nhớt trởn của phương trớnh (HJ) nếu vỏ chỉ nếu = —w lỏ nghiệm nhớt dưới của phương trớnh —#'(z,—ự0(z),— Do(z)) = 0 trong 2

Bóy giờ ta đưa ra một đặc trưng của nghiệm nhớt của phương trớnh

(HJ) thong qua trởn vi phón vỏ dưới vi phón Cho hỏm số u € C(Q) vỏ x €Q, xờt cõc tập hợp: D*u(z) := {p ER : lim sụp Wy) = ue) = ply = 2) < of ; yor yea ly — z| D~w(x) := ụ ER” : timing WW) — Pw) ` 0} ->z,uceQ ly — x|

Cõc tập hợp trởn được gọi tương ứng lỏ trờn vi phan va dudi vi phón (gọi chung lỏ bõn vi phan) cia u tai x

Vợ dụ 1.1.7 Cho z(z) = |z|, z €lR Khi đụ ta dễ dỏng kiểm tra được: D*u(0) = ĩ, D~u(0) = [=1, 1

Những bổ đề sau day sờ m6 ta D*u(x) va D~ u(x) qua cdc ham thit va

một số tợnh chất của chỷng:

B6 dờ 1.1.8 Cho u € C(Q) Khi đụ:

(a)p€ D*u(z) nếu vỏ chỉ nếu tồn tại p € Œ1(Q) thỏa mọn Dọ(z) = p

vỏ u — yp dat cực đại địa phương tại #;

(b)p€ D~u(z) nếu vỏ chỉ nếu tồn tại € Œ!(Q) thỏa mọn Dẹ(z) = p vỏ w — Ò đạt cực tiểu địa phương tại z

Bổ đề 1.1.9 Cho u € C(Q), 2 € Q Khi do:

Trang 11

(c) Cõc tập A* = {z€ Q9: D*u(z) # ĩ} vỏ A" ={zcQ:D u(z) # ĩ}

lỏ trỳ mật trong Ẫ

Như một hệ quả trực tiếp của Bồ đề 1.1.8, ta cụ đặc trưng sau của

nghiệm nhớt

Dinh ly 1.1.10 Ham s6 € Œ(Ẫ) lỏ nghiệm nhớt dưới của phương trớnh (HJ) trong Ẫ khi vỏ chỉ khi:

†{œ,u(z),p) < 0, Va €0,Vp € D'u(a); (1.4)

la nghiờm nhờt trờn cia phuong trinh (HJ) trong 2 khi va chi khi:

F(a,u(x),p) > 0, VzreẪ,Vp€ D u(z) (1.5)

Sử dụng đặc trưng nỏy, ta cụ thể chứng minh một số tợnh chất quan trọng sau đóy của nghiệm nhớt

Mờnh dờ 1.1.11 (a) Nờuu € C(Q) lỏ một nghiệm nhớt của phương trớnh

(HJ) thớ:

F(x,u(x), Du(x)) = 0 tai moi diờm ma u kha vi

(b) Nếu u lỏ một hầm liởn tục Lipschitz địa phương vỏ nụ lỏ nghiệm nhớt

của (HJ) thớ:

F(œ,u(z), Du(z)) = 0 hầu khắp nơi trong Ẫ

Nhận xờt 1.1.12 Phần (b) của Mệnh đề 1.1.11 thể hiện rằng mọi nghiệm nhớt đều lỏ nghiệm tổng quõt (hỏm số œ liởn tục Lipschitz địa phương lỏ

nghiệm tổng quõt nếu:

F(œ,u{(z), Du(z)) =0 h.k.n trong 2

Ngược lại nụi chung lỏ khừng đỷng: cụ nhiều nghiệm tổng quõt khừng

Trang 12

Vợ dụ 1.1.13 Ta thấy hỏm #(z) = |z| thỏa mọn:

lứ(Œ)|~1=0— trong (-1,1)\ {0}

do đụ œ lỏ nghiệm tổng quõt của |w'(z)| — l = 0 trong (—1,1) nhưng nụ khừng phải lỏ nghiệm nhớt của phương trớnh trởn (theo Vợ dụ 1.1.2)

1.1.2 Phờp toõn trởn cõc nghiệm nhớt

Trong mục nỏy ta sẽ trớnh bỏy một vỏi tợnh chất quan trọng về cõc phờp toõn trởn cõc nghiệm nhớt Để trớnh bỏy cõc kết quả trong phần nỏy chỷng

ta cần tới khõi niệm mừ đun vỏ mừ đun liởn tục của một hỏm:

Mừ đun lỏ một hầm liởn tục, đơn điệu tăng bất kớ ự : [0, +) — [0, +oe) thỏa mọn ự(0) = 0

Mừ đun liởn tục cha mot ham u € C(Q) lỏ một mừ đun ự„ sao cho |u(z) — u()| < ự„(|# — yl), Vz,cQ

Nờu u(z,y) € C(Q, x Q2) thi mừ đun liởn tục (địa phương) của œ lỏ hỏm hai biến liởn tục ự : [0,+œ) x [0,+œ) — [0,+Ẫo) lỏ mừ đun theo

từng biến vỏ

|u(Œ, 0ớ)—8(32, 02) Š p(#ớ—I|, |#2—|).— Vi), (2s,a) € Ox Do

Vợ dụ 1.1.14 Nếu œ lỏ hỏm Lipschitz với hằng sờ Lipschitz L (xem Dinh nghĩa 1.1.24) thớ ta cụ thể chọn mừ đun liởn tục của wu 1A p,(r) = Lr

Cho u(x), v(x) € C(O) Ta ký hiệu:

(uV 0)(z) = max {u(z),0(#)}, (uA v)(x) = min {u(z), 0(+)}

Mệnh dờ 1.1.15 Ta cụ cõc khẳng định sau:

(a) Cho u(x), v(x) € C(Q) lỏ nghiệm nhụt dưới của phương trớnh (H1)

Khi đụ u V 0ú cũng lỏ một nghiệm nhớt dưới của phương trớnh (H))

Trang 13

cũng lỏ một nghiệm nhụt trởn của phương trớnh (HJ)

(c) Nờu u € C(Q) 1a nghiệm nhụt dưới của phương trớnh (HJ) mỏ u > 0

với mọi nghiệm dưới u € C(Q) của phương trớnh (HJ) Khi đụ u lỏ nghiệm nhụt trởn vỏ do đụ lỏ nghiệm nhớt của phương trớnh (H1)

Mệnh đề 1.1.16 [Tợnh ổn định của nghiệm nhớt] Cho u„ € C(Q)(n € N)

lỏ một nghiệm nhớt của phương trớnh:

F(x, n(x), Du,(x)) =0 trong 9 (1.6) Giả sử rằng:

Un — hội tụ đều trong Q, F, + u hội tu dờu trong 2 x R x IR"

Khi đụ u lỏ một nghiệm nhớt cia phuong trinh (HJ) trong Ẫ

Chứng mớnh Cho Ò € C1(Q) va zo 1A cuc dai dia phương của u— ọ Khừng mất tợnh tổng quõt ta cụ thể giả sử:

u(xo) — p(xo) > u(x) — v(x)

vời x # x trong mờt lan can cia xp Tit tinh hoi tụ đều ta cụ với ự đủ lớn

uạ — @ đạt cực đại địa phương tại #„ + xy (xem Bờ dờ 1.1.18) Khi dờ Fi (@n, Un(tn), Dp(an)) < 0 Từ z„ —> zọ, qua giới hạn bat dang thitc trờn khi n —> +00 ta duge: F,,(29, u(x%o), De(ao)) < 0 vậy œ lỏ nghiệm nhớt dưới Chứng minh tương tự ta cũng cụ lỏ nghiệm nhớt trởn L]

Trang 14

Vi du 1.1.17 Xờt dọy hỏm răng cưa lỏ dọy hỏm +„ được xõc định bởi: u(r) = 1— z vỏ với n > 2 thớ

27+2 Ay - ; n ; n

“pT, neu a € [(27 + 1)/2", (27 + 2)/2"),

u(t) = hỏ nếu z € [27/2",(27 + 1)/2"]

trong đụ j = 0,1, ,2"=1— 1 Với z € [0, 1] rử rỏng lỏ |z/(z)|— I = 0 hầu khắp nơi trong [0,1], mặc dỳ w, IA nghiệm cổ điển (nởn cũng lỏ nghiệm

nhớt) nhưng 1„ khừng phải lỏ nghiệm nhớt với ự > 2 Giới hạn của dọy hỏm lỏ bằng 0 vỏ khừng thỏa mọn phương trớnh |ư(z)| — 1 = 0 tại moi

2

diờm

Trong chứng minh Mệnh đề 1.1.16 chỷng ta đọ sử dụng kết quả cơ bản

sau:

Bổ đề 1.1.18 Cho v € C(Q) va gia sit rang xy € Q 1A mot diờm cực đại địa phương ngặt của 0 trong B(x, 6) CQ Nờu v, € Œ(Ẫ) hội tụ đều địa phương tới u € Ẫ, thớ khi đụ tồn tại dọy {z„} thỏa man:

In > Xo, Un(@n) > n(x), We € B(x, 9) (1.7) Mờnh dờ 1.1.19 (Quy tac dời biờn trong phuong trinh Hamilton-Jacobi)

Cho u € C(Q) 1a nghiờm nhờt cia phuong trinh (HJ) va Ẽ € C'(R) thoa mọn Ẽ'{ê) >0 Khi dờ v = Ẽ(u) lỏ một nghiệm nhớt của phương trớnh:

Trang 15

Khi dờ ham v € C(Q) duge xac dinh bdi

lỏ một nghiệm nhớt của phương trớnh

F(œ,0(œ), Du(z)) = 0 trong Q, (1.9) vời F(x,r,p) = F(a, 0(x,r), D,Ẽ(x,r) + Ẫ, (2, r)p)

Mệnh đề tiếp theo nởu nởn một số dạng của bõn vi phón trong cõc trường hợp thừng dụng

Mệnh dờ 1.1.21 [xem [2], Proposition 2.7] Cho u € C(Q) Khi dờ

(1) với 0(z,r) = p(r)u(z) (c@ € Q,r € R) va p € C'(R), g(r) > 0, với mọi re; ta cụ

D*ự(z,r) = {(q,ự) €R"”!:q€ ự(r)Dˆu(),ự = ỵ (#)u(3)}:

(ii) với u(z) = v(T(x)), v € C(Q); ta cụ (cừng thức đổi biến)

p € D*v(yo) nếu vỏ chỉ nếu (DT(zụ))'p € D*u(z), trong đụ T: Q — ệ lỏ

một vi phừi, A' lỏ chuyển vị của A vỏ ty = T(œg);

(i1) với n(r) = u(y(2)), ụ € C1(R,Ẫ) ta cụ (cừng thức đạo hỏm hỏm hợp)

Dn(r) 5 D”u(w(r)) - 0)

Nhận xờt 1.1.22 Cõc kết quả tương tự vẫn đỷng với D~ Từ cừng thức

“đổi biến” (ii) ta cụ w lỏ một nghiệm dưới của phương trớnh (HJ) trong Ẫ nếu vỏ chỉ nếu 0(#) = w(T'”!{ê)) lỏ một nghiệm dưới của phương trớnh:

F(TT'(2),Í(&), DT(T"'(ó))Do(ê)) =0, — &cễ

Bóy giờ ta sẽ đi tớm điều kiện để một hỏm khả vi liởn tục từng mảnh

Trang 16

Bồ đề 1.1.23 Ta giả sử rằng

pi E> F(Œ,T, Đi, Pa : DA ) (1.10)

lỏ khừng giảm với mọi điểm #, F, Ba, ., 0y Cũng gia sit rang Q = (a, b] x 0,

với Q' lỏ tập con mở của RŸ~!, Nếu u € Ở(ệ) lỏ một nghiệm nhớt dưới (tương ứng nghiệm nhớt trởn) của phương trớnh (HJ) thi

Œ,u(),Dw(#)) <0, (tương ứng > 0) (1.11)

tại mọi điểm cực đại địa phương (tương ứng cực tiểu địa phương) # của

u— @ trởn (a,b} x Q' với mọi p € Cl((a, b] x 0’)

1.1.3 Hỏm lề

Định nghĩa 1.1.24 Cho hỏm số ự : 9 x B + RY, Q CR" 1A mot tap mở

vỏ lỏ một khừng gian topo Hỏm số (+) được xõc định bởi: u(x) = inf g(x, b), (1.12) beB được gọi lỏ hỏm lở Một số vợ dụ rất cơ bản về hỏm lề: đụ lỏ hờm khoảng cõch đến một tập hợp 9 C RỶ được xõc định bởi: d(z, S) := inf |# — sỊ ses

Trong chương sau ta cũng đề cập đến một vi du khõc về hỏm lề đụ lỏ phờp chập-inƒ của một hỏm +œ được xõc định bởi:

u„(#) := inf fu(y) + |x — yl? /2e], e>0,

c0

Ta ký hiệu ẵ7(z) lỏ tập hợp (cụ thể rỗng):

M(x) = argmin,.pự(z,b) := {b € B: u(x) = g(z,b)}

vỏ giả sử rằng ự(z, ệ) bị chặn với mọi ự € Ẫ vỏ z —> ự(z,b) lỏ liởn tục đều

tại z đối với b€ HD; tức lỏ:

Trang 17

với mọi |z|, |u| < R,b€ với mừ đun w nỏo đụ

Một kết quả đầu tiởn về hỏm lề đụ lỏ mối quan hệ giữa cõc bõn vi phón

của hỏm + vỏ cõc bõn vi phón của hỏm ự theo biến z (ký hiệu lỏ D?ự)

Bổ dờ 1.1.25 Cho giả thiết (1.13) Khi đụ u € Ẫ vỏ g(z,ỉ), D*u(+) 2 D;g(, D -gle.b) 2 D- 21D u), với mọi b € M(z) Nhận xờt 1.1.26 Từ bổ đề trởn ta cụ 2†(z) # ẻ tại những điểm z mỏ g kha vi va M(x) 4 0

Dờ nghiởn cứu sóu hơn ta giả sử ự(-,b) khả vi đều tại z, tức lỏ với mừ đun ơâ nỏo đụ,

lự(z + h„b) — g(ự,8)— D,g(ự,9).h| < |h|sa(lh|)—— (119

với mọi b€ vỏ h đủ nhỏ Ta cũng giả sử rằng

b— D„g(z,b) liởn tục (1.15)

b — g(z,b) nửa liởn tục dưới (1.16)

Trang 18

D-uls) = i" nờu ơ (0) = {y} = 2 1.19 ĩ nếu Y(z) khừng phải lỏ tập một điểm ( )

Đặc biệt, u khả vi tại z nếu vỏ chỉ nếu Y (a) 1a tap một điểm Hơn nữa, u

cụ đạo hỏm theo hướng (một phợa) theo mọi hướng q, được cho bởi Ou —(r)= min y-q= min y-g Oq yeY (2) peD*u(x) Tiếp theo õp dụng Mệnh đề 1.1.27 ta tợnh cõc bõn vi phón của hỏm khoảng cõch từ tập bất kỳ 9 € RỶ, 9 Z ĩ xõc định bởi d(z, S) := inf |x — z| = min |z — z| (1.20) z€ Ze

Biểu thức sau của đ(z) thuận tiện hơn trong tợnh toõn vỏ liởn quan đến

việc xờt tập hớnh chiến của z lởn ì cụ dạng P(z) := {z€ 95: d(z) = |z — z|} # 0 Mệnh đề 1.1.28 Với 9 Z ĩ, d€ Œ(R") bất kỳ vỏ với mọi z đ S va vector đơn vị q Khi đụ vz D*d(x) - of se Pl} jr — z| œ~p(+) 4 —— ; D-d(z) = 4 ca TT P(x) = {p(z)} 0 nếu P(z) lỏ tập một điểm, Ou gz _\#) = mm oq reP(x) |# — 2| qd :

Nhan xờt 1.1.29 Ti Mờnh dờ 1.1.28 va Bờ dờ 1.1.8 ta c6 d kha vi tai x

nếu vỏ chỉ nếu hớnh chiếu của z lởn S$ 1A duy nhat Mot kờt qua noi tiờng

trong giải tợch lồi (định lý Motzkin) khẳng định rằng tập hớnh chiến p(z) lỏ tập một điểm nếu vỏ chỉ nếu S$ lỏ tập lồi Khi đụ Š lỏ tập lồi nếu vỏ

chỉ nếu đ khả vi trong RŸ \ ư Trong trường hợp nỏy hớnh chiếu p(z) phụ

Trang 19

Dễ biết rằng nếu ìẼ trơn thớ hỏm khoảng cõch lỏ trơn ở gan 0S va thỏa

man phuong trinh eikonal

|Du| = 1 trong RY \ 9 (1.21)

một cõch địa phudng quanh 0S Nờu phương trớnh nỏy xờt theo nghĩa nhớt

thớ nụ lỏ nghiệm toỏn cục với mọi Ẽ

Hệ quả 1.1.30 Hỏm khoảng cõch đ đến Š lỏ nghiệm nhớt của phương

trớnh (1.21) trong S ẹụ cũng lỏ nghiệm nhớt dưới, nhưng khừng lỏ nghiệm nhớt trởn trong cả RŸ,

Một khõi niệm khõc liởn quan mật thiết đến tợnh chất của hỏm khoảng

cõch đụ lỏ vờc tơ phõp tuyến ngoỏi đơn vị ự(#) của S tai x € ì9 Trong trường hợp ì5 trơn, hỏm ự lỏ mở rộng duy nhất của Dd lởn OS, voir đ đủ gần ì8 ta cụ

r= p(x) + s(x)n(p(x)), Dd(z) = n(p(3)), (1.22)

trong d6 p(x) biờu thi hinh chiờu duy nhất của z lởn Š Điều nỏy dẫn đến định nghĩa sau:

Định nghĩa 1.1.31 Cho 9 C IRŸ lỏ một tập khừng rỗng Một vector đơn vị v IA mot vector phap tuyến ngoỏi (suy rộng) của Š tại z € ì5 (ta ký

Trang 20

20

1.2 Tợnh duy nhất vỏ sự so sõnh nghiệm

Trong mục nỏy ta đề cập đến vấn đề tợnh duy nhất vỏ sự so sõnh nghiệm

của nghiệm nhớt Đóy lỏ một vấn đề lớn trong lý thuyết vỏ cụ mối liởn hệ với cõc điều kiện đủ trong bỏi toõn điều khiển tối ưu

Xờt hỏm #' cụ dạng F'{z,r,p) =r + H(z,p)

Định lý 1.2.1 [Sự so sõnh nghiệm trởn tập bị chăn] Cho Ẫ lỏ một tập

con mở bị chặn của RỶ Giả sử ,u;Ò € C() tương ứng lỏ nghiệm nhớt

trởn vỏ dưới của

u(x) + H(z, Du(+)) = 0, rE, (1.24)

va

tị < Ue trởn ì9 (1.25)

Cũng giả sử rằng thỏa mọn:

|H(x,p) — H(y,p)| < ựâ(|# — |(1+ |p|)) (1)

với z, c€ Ẫ, p€ RŸ, trong đụ ứy : [0, +oo) — [0, +Ẫ) lỏ liởn tục khừng giảm với œâ(0) = 0 Khi đụ uw, < up trong 2

Nhận xờt 1.2.2 Nếu wâ, ự; đều lỏ nghiệm nhớt của (1.24), theo Định lý 1.2.1 thớ điều kiện = 1 trởn ìŠ sẽ kờo theo u, = uy trờn 8

Nhận xờt 1.2.3 Khẳng định trong Định lý 1.2.1 cũng đỷng với phương trớnh

Au(z) + H(z, Du(z)) = 0 reEQ,

với á > 0 Mặt khõc đối với phương trinh H(z, Du(x)) = 0 thớ kết qua trởn khừng đỷng Thật vậy, với phương trớnh H(z,p) = 0 với mọi # vỏ p thớ ham wu € Œ(Ẫ) bất kỳ đều lỏ nghiệm nhớt

Trang 21

Ta giả sử điều kiện sau trởn H:

H(y, My — 2) +p) — H(a,A(y — 2) +q) < œ›(|z — | + á|w — z|”, R)

+ ws(|p — 4è) (H:)

với mọi á > 1, p, g€ (0,1), z, y € B(0,R), VR > 0, trong đụ œự;, Ò lỏ

cõc mừ đun Dễ thấy rằng (Hâ) vỏ (H;) xõc định bởi

LH(z,p) — H(z,g)| < ự(ẻp— |) Yz,p,q€ RỲ (Hs)

thỏa mọn (Hỏ) với œ = œ vỏ a(r, R) = œựâ(2r) với mọi r, R > 0

Định lý 1.2.4 [Sự so sõnh nghiệm trởn toỏn khừng gian] Giả sử rằng trị, uạ C BƠ(IRỶŸ) tương ứng lỏ nghiệm nhớt dưới vỏ nghiệm nhớt trởn của

phương trớnh

u(x) + H(x2, Du(x)) = 0, zcRỲ, (1.26) với H thỏa mọn (H;) Khi đụ u, < uy trong RX

Định lý 1.2.4 cụ thể được khõi quõt cho trường hợp tập mở 9 € R#

khừng bị chặn Thật vậy, ta cụ thể chứng minh được rằng nếu 0!4,uạ € BGC(9) tương ứng lỏ nghiệm nhớt dưới, nghiệm nhớt trởn của phương

trớnh

u{#) + H(x, Du(x)) = 0, z(C€9, với H thỏa mọn Hy va uw, < uạÒ trởn ìO thớ ứị < ue trong Q

Nhận xờt 1.2.5 Một biến thể rất hữu dụng của Dịnh lý 1.2.4 cụ được

khi ta thay giả thiết về tợnh bị chặn của ự;,0; bằng tợnh liởn tục đều của chỷng Người ta cụ thể chứng minh được rằng nếu ,ạ € ƯC(RŸ) tương

ứng lỏ nghiệm nhớt dưới, trởn của phương trớnh (1.26) với H thoa man A, vỏ H; thớ „ < uạ trong RỶ,

Một kết quả về sự so sõnh nghiệm tiếp theo liởn quan phương trớnh tiến

Trang 22

Cauchy

u(x,t) + H(t, Du(t,x)) =0 (f,z) c[0,T] x RỲ

u(0, 2) = uo() xe RN

với điều kiện ban đầu up € UC(RẼ)

Định lý 1.2.6 [Sự so sõnh nghiệm của phương trớnh tiến hụa} Giả sử H cC(0,T] x RỲ) Cho œâ,uạ € ƯỚƠ([0,7] x RỶ) tương ứng lỏ nghiệm

nhụt dưới, nghiệm nhớt trởn của phương trớnh

u(œ,ê) + H(t,D,u(f,#z)) =0 trong [0,7] x R” khi đụ sup (1 — uz) < sup (w(0,+) — u2(0,-)) {0.7]xIR* RN Nhận xờt 1.2.7 Dịnh lý về sự so sõnh nghiệm 1.2.6 cụ thể được mở rộng cho phương trớnh u, + H(t,z, Du) =0

nếu hỏm Hamilton H € UC([0,T] x RẼ x B(0,R)) voi moi R > 0 va H

thỏa mọn (Hâ) với một mừ đun œ độc lập của ê € [0,7]

Nhận xờt 1.2.8 Nguyởn lý so sõnh cụ thể được sử dụng để chỉ ra khoảng bị chặn của nghiệm nhớt của phương trớnh (HJ) Để chỉ ra điều nỏy ta xờt

u„ € BƠ(RŸ),nự € ẹ lỏ nghiệm nhớt của phương trớnh

tạ() + H,(œ, Du,(z)) = 0, +cRỲ, (1.27) trong đụ H„ thỏa mọn (Hi), (H;) với mỗi n € ẹ Cũng giả sử rằng

sup |H„(z,0)|<Œ < +œ

zeR#

với hằng số Œ nỏo đụ rử rỏng lỏ Œ vỏ —C tương ứng lỏ nghiệm trởn vỏ nghiệm dưới của ( 1.27) với mọi ự € ẹ Khi đụ theo Định lý 1.2.4 thớ

~C < u(x) <C,

Trang 23

23

1.3 Tợnh chợnh quy của nghiệm nhớt

Trong mục nỏy ta giới thiệu hai kết quả (Mệnh đề 1.3.2 vỏ Mệnh

đề 1.3.3) Chỷng chỉ ra rằng với những giả thiết thợch hợp trởn thớ nghiệm nhụt của phương trớnh

(HJ) Au(#) + H(œ,Du(z)) =0, 2 € RY

lỏ liởn tục Lipschitz, cỳng với một số tợnh chất khả vi của hỏm liởn tục

Lipschitz

Tiếp đến lỏ một số định lý cơ bản về hỏm nửa lửm vỏ mối liởn hệ với phờp chập-inf Kết quả quan trọng trong phần nỏy đụ lỏ Định lý 1.3.11, trong đụ khẳng định rằng: với những điều kiện thợch hợp trởn thớ nghiệm

nhớt liởn tục Lipschitz của phương trớnh (H1) lỏ nửa lửm va Mờnh dờ 1.3.14 chỉ ra rằng một nghiệm nhớt dưới của phương trớnh (HJ) cụ thể được xấp

xỉ đều từ dưới bởi một nghiệm dưới nửa lửm +„ của một phương trớnh xấp xi

1.3.1 Tinh liờn tuc Lipschitz

Định nghĩa 1.3.1 Giả sử u 1A mot hỏm số xõc định trởn tập mở Ẫ € RỲ

uw được goi la ham Lipschitz (hay ham liờn tuc Lipschitz) trờn lón cận

V CQ (vdi hang 86 Lipschitz K > 0) nởu

lu(z) — uly) < lel, Ve,y€V:

Ham wu duge goi lA ham Lipschitz dia phương (hay liởn tục Lipschitz dia phương) trởn Q nờu vời mời x € Ẫ tồn tại lón cận mờ U, cia x trong 2

sao cho u la ham Lipschitz trờn U,

Ta giả sử rằng H thỏa mọn điều kiện sau

H(z,p) —> +o khi |p| —> +Ẫ (H.) Khi H cụ dạng

H(x,p) = sup {—f(x,a).p — I(x, a)}, (1.28)

Trang 24

điều kiện đủ để (H,) đỷng lỏ tợnh bị chặn của ỉ cỳng với giả thiết

1r>0: B(0,r) C cof(2, A), Vr ER” (1.29)

Mệnh đề 1.3.2 Cho điều kiện (H,) Khi đụ mọi nghiệm nhớt dưới u €

BC(R*) của phương trớnh (H1) lỏ liởn tục Lipschitz

Một điều kiện khõc trởn ủ đảm bảo tợnh liởn tục Lipschitz cha nghiđờm nhớt đụ lỏ aC > 0: H(x,C=—*) — Ay,c2—) > -c |x yl, Vz,€ RỲ, |z — ự| |z — 0| (Hs) Với H cụ dạng (1.28), điều kiện (H;) đỷng với Œ > ẵƒ/(1— L), trong đụ ƒ,l thỏa mọn (ƒ(œ,a) — ƒ(w,a)).(œ— y) < L|z— é, >1, |é(œ,ự) — l(u,ự)|<M |z— 0|, Vz,,a

Mệnh đề 1.3.3 Cho cõc điều kiện (H.), (H;), (H;), á > 1 vỏ u € UC(R*)

lỏ nghiệm nhớt của phương trớnh (HJ) Khi đụ

u(x) — u(y)| SC a — yl

Bóy giờ ta nởu một cõch ngắn gọn một số tợnh chất khả vi của hỏm liởn tục Lipsehitz địa phương Theo định lý Rademacher, mọi hỏm liởn

tục Lipschitz địa phương đều khả vi hầu khắp nơi với gradient bị chặn

địa phương Do đụ, nếu u € Lipu.(ễ) (tập cõc hỏm liờn tuc Lipschitz dia phương trong Ẫ), thớ tập hợp

D”u(z) = Ũ ERY: p= lim Du(z,),z„ 9 o}

n— +00

lỏ tập khừng rỗng vỏ đụng với mọi z € Q Ký hiệu coJ2”u lỏ bao lồi của nụ Một kết quả khõ nổi tiếng trong giải tợch khừng trơn đụ lỏ

Trang 25

trong đụ ìu(+) lỏ gradient tong quat hay gradient Clarke cia u tai x dude xõc định bởi ìu(z) := {p ER : u°(x;p) > p.q, Va € R*} = {p ER :uo(z;p) < p.q, Vạ € R*} Với 0Ẽ(z;p) vỏ tọ(#;p) lỏ cõc đạo hỏm theo hướng tổng quõt được xõc định bởi u(y + tq) — uly) u(x; q) : = lim sup ; —>z,t—>0* | tg) —u

u°(e;q): = liminf uly + tg) = uly) —>z,t—>0* t

Mot khai niờm liờn quan ntta d6 la dao ham Dini theo hudng, cu thể lỏ | tq) —u O° u(a;q) : = lim sup We + ta) — 1Œ) >0? t “ t — ⁄ 0 u(x;q) : = lim ing Ue + ta) = ule) t0+ t

Từ những định nghĩa trởn ta thấy rằng

ug(#;g) < 9” u(œ,g) < ì*u(œ,g) < 0?(;g), Ve €2,đER*, (1.31)

vỏ điều nỏy cụ nghĩa lỏ với € Lip.(Ẫ),

D-u(x)U Dru(r) C ìu(z), Vr EQ (1.32) Cũng thấy rằng D*%(z), D”u(z) lỏ cõc tập bị chặn

Kết quả tiếp theo về sự tồn tại của đạo hỏm theo hướng cổ điển (một phợa) của cõc hỏm liởn tục Lipschitz địa phương, đụ lỏ

Trang 26

Mệnh đề trởn cho phờp ta chứng minh một biến thể rất hữu ợch của Mệnh đề 1.1.27 đối với cõc bõn vi phón vỏ đạo hỏm theo hướng của hỏm

lề œ được xõc định bởi

u(x) := inf g(x, 6)

beB

Mệnh đề 1.3.5 Giả sử B lỏ tập compact, g liởn tục trởn Q x B, kha vi theo + với D„g liởn tục trởn Qx B Khi đụ u € Lipy.(Q), De u(x) = ìu(z, q)

với moi x va kết luận của Mệnh đề 1.1.27 vẫn đỷng 1.3.2 Tợnh nửa lửm

Định nghĩa 1.3.6 Ta nụi rang ham wu: Ẫ — R 1A ham mửa lốm trởn tập

lồi đụng Ẫ nếu cụ một hằng số Œ > 0 thỏa mọn

p(n) + (1 wu(y) < ulm + (L— py) + CHC — p)le yP (Lk9)

vdi moi z,y € 2 va pw € [0, 1]

Diờu nay dan dờn tinh lom cia ham x + u(x) — $C |zl” Nếu w liởn tục thớ ta cụ một điều kiện tương đương với (1.34) đụ lỏ

u(œ + h) — 9u(#) + u(œ — h) < Ơ|hỈ, (1.35)

với mọi z € Q vỏ h ERX, với |h| đủ nhỏ Tất nhiởn hỏm lửm lỏ hỏm nửa lửm Một lớp cõc hỏm nửa lửm khừng tầm thường đụ lỏ lớp cõc hỏm khả vi liởn tục với gradient Lipschitz địa phương Một lớp cõc hỏm nửa lửm

khừng khả vi đụ lỏ cõc ham u(x) = infycg g(z, b) với z => ự(z, b) thỏa mọn

(1.34)

Vợ dụ 1.3.7 Cho 9 C RỲ, S 49,

d(x) = dist(x,S) = inf |x — s] ses

Khi đụ đ# lỏ hỏm nửa lửm trong RŸ vớ z r> |z — s|” thuộc Œ* với cõc đạo hỏm cấp hai lỏ hằng số Mặt khõc, bản thón đ cũng lỏ hỏm nửa lửm trong mọi tập compact cụ khoảng cõch dương đối với 9, bởi vớ z => |œ — s{ cụ

Trang 27

Những tợnh chất chợnh của hỏm nửa lửm sẽ được trớnh bỏy trong Mệnh đề 1.3.8 vỏ Mệnh đề 1.3.9 sau đóy

Mệnh đề 1.3.8 Cho ham u JA ham nửa lửm trong Q Khi đụ u lỏ liởn tục Lipschitz dia phuong trong Q

Chitng minh Vời x € 2 va v6i moi h thỏa mọn z + h € Ẫ,

C u(t +h) — u(x) = (Ậ+ h) — U(z) + Cz-h+ 5 lhl’,

trong d6 u(x) = u(x) — đ |z|’ IA ham lom va do đụ liởn tuc Lipschitz địa

phương Vậy mệnh đề được chứng minh L]

Trong Mục 1.3.1 ta biết rằng D*u(z) €C ìu(z) = coD*"u(z) với mọi w € Lipe(O) Nếu thởm giả thiết œ lỏ hỏm nửa lửm thớ D†(z) = ìu(z) Điều nỏy vỏ một số tợnh chất khả vi khõc của cõc hỏm nửa lửm được trớnh bỏy trong mệnh đề sau

Mệnh đề 1.3.9 Cho w lỏ hỏm nửa lửm trong Q Khi đụ với mọi z € Ẫ thớ

(a) D*u(z) = ìu(z) = coD*u(z);

(b) — hoặc Du(z) = ĩ hoặc u khả vi tại z;

(c) — nếu D*w(z) lỏ tập một điểm thớ u kha vi tai 2;

(d) (2) = min,cp+u(x) P*q Vi moi vector dan vi q Op

Mệnh đề 1.3.10 Cho u lỏ một hỏm nửa lửm vỏ thỏa mọn

†(œ,u(œ, Du(z))) > 0 h.k.n trong Q, (1.36)

trong do F liờn tuc Khi dờ u lỏ nghiệm nhớt trởn của phương trớnh

F(œ,u(œ, Du(z))) = 0 trong Q (1.37)

Kết quả tiếp theo lỏ về tợnh nửa lửm của nghiệm nhớt của phương trớnh

Trang 28

Dinh ly 1.3.11 Cho u € BC(RY) NM Lip(RŸ) lỏ một nghiệm nhớt của phương trớnh u(x) + H(2, Du(z)) = 0, +zc RẺ, (HJ) vời hang sờ Lipschitz L„ Giả sử H thỏa mọn |H(z,p) = Hữ,q)| < ự|p— q|, Vz,p,g€ RỲ (H;) với Œ > ĩ vỏ ỉ > 2L„, (Hạ) xõc định bởi H(a+h,p+Ch) —2H(Ậ,q) + H(œ — h,p— Ch) > —C|h|P” — (Hạ)

đỷng với mọi z,b € R*,p € Z(0, '') Khi đụ â lỏ hỏm nửa lửm trởn JR*

Một cõch rất thuận tiện để xấp xỉ nửa lửm của một hỏm cho trước lỏ

dựa vỏo phờp chập-inƒ, đóy lỏ một cừng cụ rất cơ bản trong giải tợch lồi

vỏ giải tợch khừng trơn Cho Ẫ lỏ một tập con của RỶ vỏ ự lỏ một hỏm bị chặn Với mọi e > 0, đặt

tu;() s=int fy) + |z —vỈ :ự af (1.38)

ham u- duge goi la đ—chờp-inf của u Tương tự,

ul (a) = sup { uly) = 3 kev Ly co} (1.39)

lỏ e— chập-sup của u

Bổ đề 1.3.12 Cho u liởn tục vỏ bị chặn trong {) Khi đụ (a) u, vỏ uŸ lỏ nửa lửm trong Q;

(b) uz AuuẼ \u, khie > 0°, hội tụ đều địa phương trong Q;

Trang 29

B6 dờ 1.3.13 Chou € Ở(Ẫ) lỏ hỏm bị chặn, z € Ẫ vỏ e < d?(z,ì9)/(4 ||n|| )-

Khi đụ, hoặc D~u„() = ĩ hoặc D~u„(œ) = {(x — y-)/e}, trong dờ {y-} = M,(z) (tương ứng, hoặc DTuấ() = I hoặc D*uấ() = {—(œ — :)/e}, trong đụ {ụ.} = MI°(+)) Hơn nữa, với mọi ụ € M,(z) (tương ứng, M°(z)), () lÒ—w.|< 9vzl|ullý°:

(ii) |x —y.| /e — 0 khi e — ĩ*, trởn cõc tập con compaet của Ẫ;

(iii) (x —y-) /e € D (ye) (tutong ting — (x — y-) /e € D* (ye)

Cõc Bổ đề 1.3.12 va 1.3.13 cho thấy, nghiệm nhớt liởn tục của phương trớnh (HJ) cụ một xấp xỉ đều từ hai phợa bởi nghiệm nhớt liởn tục Lipschitz

địa phương của phương trớnh xấp xỉ Chợnh xõc hơn, ta cụ Mệnh đề 1.3.14 Giả sử H thỏa mọn

|H(x,p) — H(y,p)| < wi(|x — 0| (1 + |p])) (71)

vời x,y € Q,p € RẼ, trong dờ w, 1A mot m6 dun Nờu u € C(Q) lỏ một nghiệm nhờt dudi cia (HJ) trong Q, thiuẼ € Lip,.(Q) la một nghiệm nhớt

dưới của phương trớnh

Au‘ (a) + H(+, Duấ(z)) = 6 (2) trong ì, (HJ.) với

6° ={z €0: d(z,09) > 2/2 |Iu|}

vỏ ự(z) —> U* khi e — U, trởn cõc tập con compac của Ẫ

1.3.3 Tợnh khả vỉ

Để cụ điều kiện đủ về tợnh khả vi của nghiệm nhớt, chỷng ta cần tới giả

thiết về tợnh lồi chặt của hỏm Hamilton

Mệnh dờ 1.3.15 Gid situ € Œ(Ẫ) lỏ một nghiệm nhớt của phương trớnh

áu(z) + H(z, Du(z)) =0 trong Q,

Trang 30

Chỷng mớnh Trước hết ta chứng mớnh rằng khả vớ tại mọi z € Q Theo

Mệnh đề 1.3.9 (c), ta chỉ phải chứng minh rằng 2? (—)(z) lỏ tập một điểm với mọi ự € Theo Mệnh đề 1.3.9 (a), điều đụ lỏ đỷng nếu D*(—%)(z) lỏ tập một điểm

Giả sử ngược lại, tồn tại p!,p? € D*(—u)(z),p' # p? Khi đụ tồn tại cõc

day {x,}, {Ym} trong Q sao cho, tai dờ u kha vi va

x= lim a,= lim ym, p' = lim D(-u)(x,), p? = lim D(—u)(ym) n> +00 m— +00 n— +00 m— +00 Theo Mờnh dờ 1.1.11 (a), Nu(an) + A (an, Du(an)) = AUYm) + HY; DU(Ym)) = 0 Do tợnh liởn tục ta nhận được Au(z) + H(z,—p') = Au(z) + H(z, —p”) = 0 (1.40) Đặt 1, 1, sử dụng tợnh lồi chặt, từ (1.40) ta suy ra 1 1 2 Au(z) + H(z,—P) < áu(z) + gi lz, —p') + gH lz, —p )=0 (1.41)

Mặt khõc, theo Mờnh dờ 1.3.9 (a), p € coD*(—u)(x) = D*(—u)(x) =

D-(-u)(z) Vi u lỏ nghiệm nhớt của (HJ) nởn

Au(z) + H(œ,~P) > 0,

móu thuẫn với (1.41) Vậy œ khả vi tại mọi điểm thuộc Ẫ

Tợnh liởn tục của 2w lỏ hệ quả của tợnh nửa liởn tục trởn của hỏm da

trị D*u với w nửa lửm, tức lỏ tợnh chất:

In 2, Pn Ẫ D'U(tn), Pn + p> pe D*u(z)

Trang 31

Nhận xờt 1.3.16 Giả thiết về tợnh lồi chặt lỏ khừng thể thiếu vớ u(z) = |z| lỏ nghiệm nhớt khừng khả vi của phương trớnh

a(z)(|Du(z)—1)=0, trong R,

trong đụ a lỏ một hỏm liởn tục vỏ a(z) > a(0) > ĩ với mọi z Trong vợ

dụ nỏy —u nửa lửm, nhưng õnh xạ p> H{(z,p) = a(z)(|p|? — L) khừng lồi

Trang 32

Chương 2 Bỏi toõn điều khiển tối ưu với thời gian vừ hạn 2.1 Bỏi toõn điều khiến tối ưu với thời gian vừ hạn 2.1.1 Hệ điều khiển Xờt hệ điều khiển xõc định bởi phương trớnh trạng thõi ti = f(y(t),a(t)),t > 0, (0) => "

Trong đụ, điều khiển œ lỏ một hỏm đo được của ê € [0,+oẪ) với giõ trị trong khừng gian điều khiển A (thường lỏ một tập con đụng, bị chặn của

IR”“ hoặc tổng quõt hơn lỏ một khừng gian topo)

Giả sử hệ động lực ƒ : RỶ x A — RŸ cụ tợnh chất sao cho với mọi sự lựa chọn của điều khiển œ vỏ vị trợ ban đầu z € RŸ, phương trớnh trạng

thõi (2.1) cụ một nghiệm duy nhất xõc định với mọi ê € [0,+œ), kợ hiệu

lỏ „(f, œ)

Gắn với hệ điều khiển (2.1) cụ một chợ phợ biến động (running cost) xõc

dinh bời mờt ham 7: RY x A> R

Phiếm hỏm chợ phợ cần cực tiểu hụa lỏ

J(z,œ) := [ I(w,(),a())e" "4t, (2.2) trong đụ á > 0 lỏ một nhón tử chiết khấu cỗ định

Bước thứ nhất của cõch tiếp cận quy hoạch động đối với bỏi toõn điều khiển tối ưu nởu trởn lỏ xờt hỏm giõ trị xõc định bởi

0(z) := inf J(z, a), (2.3)

Trang 33

Ý tưởng cơ bản của quy hoạch động lỏ hỏm ự thỏa mọn một phương trớnh hỏm, gọi lỏ nguyởn lỷ quy hoạch động, vỏ khi 0 đủ trơn thớ mừ hớnh

vi phón của nụ lỏ phương trớnh Hamilton-Jacobi-Belinan (HJB) Phuong trớnh nỏy chứa tất cả cõc thừng tin cần thiết cho việc thiết kế một õnh ra

phan hồi tối ưu (optimal feedback map) cho bỏi toõn đọ nởu 2.1.2 Nguyởn lý quy hoạch động

Tạm thời ta giả sử một điều khiển tối ưu a* tồn tại với mỗi z, tức lỏ +00 v(x) = J(x, ak) = J tucl0).e% eat 0 Để ý rằng, với mỗi 7' > 0 cố định, T +00 (v.02) = [ tyeltsa%),03())e™at + [ 1uitt.a2),a:00)c tõt 0 T

Lập luận đơn giản dựa trởn tợnh chất nửa nhụm

„(+ s,a7) = Yy, (tar) ($5 0%, (- +t)), Vt,s>0 (2.4)

ta cụ đẳng thức

#)= Nụ (u„(t, aŸ), 0% (t))e “dt + u(y, (T, a%))e 7 (2.5)

thỏa mọn với mọi 7' > 0 var € RX

Trong trường hợp sự tồn tại của điều khiển tối ưu chưa được giả thiết thớ (2.5) được thay bởi

acA

= inf t/t (y(t, v), a(t))e “dt + v(y,(T, a))e ar (2.6)

J

Phương trớnh hỏm (2.6) bao gồm khẳng định của nguyởn lý quụ hoạch động

Trang 34

những điều kiện rất rộng của cõc dữ kiện (xem Chương 2) Khi ? bị chặn thi v bi chan, phương trớnh (2.6) đặc trưng hỏm giõ trị ự theo nghĩa: nếu

+ lỏ một hỏm bị chặn thỏa mọn (2.6) với mọi 7' > 0 vỏ z € RŸ thớ u = 0

2.1.3 Phương trớnh Hamilton-Jacobi-Bellman

Để cụ mừ hớnh vi phón của nguyởn lý quy hoạch động, ta giả thiết hỏm giõ trị v kha vi Khi do chia hai vờ (2.6) cho T > 0 rời cho T > 0, - ta

chỉ ra được thỏa mọn phương trớnh Hamilton-Jacobi-Bellman sau đóy

áự(z) + sup{—ƒ(z,a).Du(z) — l{z, a)} = 0 (2.7)

acA

Tuy nhiởn yởu cau tinh kha vi cia v 1A quõ chặt Dưới đóy lỏ một vợ dụ

cụ thể

Vợ dụ 2.1.1 Xờt bỏi toõn điều khiển tối ưu với thời gian vừ hạn với

N=1,A={-I1,1},ƒ(œ,a) = a Giả sử i(œ,a) = i(+) lỏ một hỏm trơn vỏ

cụ cõc tợnh chất

I(x) =I(—z), I= 0 nếu |z| > ũR, max = l(0) >0, zƑ{z) < 0 nếu |z| << R

Cụ thể thấy bỏi toõn nỏy cụ một điều khiển tối ưu lỏ a‡(#) = sgnz nếu

x #0 Nờu x = 0 thi ca a*(t) = 1 vA a*(t) = —1 đều lỏ cõc điều khiển tối

Trang 35

Do vậy +00 ' (0) = lim 1) — +00) _ Tre, x07 x v_(0) = lim sứ) - +00) = [rne Mỏ (—z) = —F'(z) nởn khừng khả vi tại z = ĩ

Phương trớnh (HJB) cho vợ dụ nỏy lỏ

Av(x) + |v'(x)| — U(x) = 0;

tất nhiởn khừng cụ nghĩa tại z = 0 theo nghia co diờn vi v khong kha vi tại đụ

Trong những tớnh huống thế nỏy, phương trớnh (HJB) cần được hiển theo một "nghĩa yếu" nỏo đụ Trong luận văn nỏy chỷng ta sẽ hiểu phương trớnh (HJB) theo nghĩa nhớt như đọ trớnh bỏy trong Chương 1 (xem Mục 2.2) 2.1.4 Định lý kiểm định Giả sử hỏm giõ trị ự khả vi Theo cõch dẫn ra nguyởn lý quy hoạch động, hỏm t h(t) := v(y*(t))e™ + [te ).0° (eas 0

khong dời vời moi t > 0 khi va chi khi a*,y* 1A cap diờu khiển-quỹ đạo tối ưu đối với vị trợ ban đầu z Do đụ, nếu v tron thớ điều kiện tối ưu lỏ

h' <0, tức lỏ

e*|Au°(9) — Fy" (8), 0° (t)) Do(y"(t)) — Uy" (4), a())] = 0

Vớ trong trường hợp nỏy œ lỏ nghiệm cổ điển của phương trớnh (HJB)

Trang 36

VỚI

HữŒ,p) := sup{— ƒ(, a).p — l(z, a)},

acA

nởn điều khiển a* lỏ tối ưu đối với trạng thõi ban đầu z nếu vỏ chỉ nếu

a*(t) = S(y*(t)) tai hau hết ê > 0, (2.8)

với bất kỳ sự lựa chọn $(z) sao cho S(z) € aremax{—f(z,a).Dv(z) — I(z,a)}, (2.9) aca tức lỏ nếu va chỉ nếu A(y"(t), Do(y"(t))) = —=ƒ00):a70)).Du(°()) — ly ),a*0)): tại hầu hết # > 0

Đặc trưng nỏy của điều khiển tối ưu lặp mở cung cấp cho ta một phương phõp xóy dựng một cặp điều khiển-quỹ đạo tối ưu đối với mọi trạng thõi ban đầu Bước thứ nhất lỏ tớm õnh xạ Š : RỶ — A cụ tợnh chất (2.9) Nếu hỏm v đọ biết thớ đóy lỏ một bỏi toõn quy hoạch toõn học hữu hạn chiều

ạnh xạ $ như vậy được gọi lỏ õnh xa phan hoi toi vu Bước thứ hai lỏ giải

bỏi toõn

{" =ƒu,8(0)), +>0 (2.10)

y(0) = 2,

tớm một nghiờm y*(t) Khi d6 ta sẽ cụ điều khiển œ*(#) := ư(*(#) Đụ lỏ một cặp tối ưu đối với trạng thõi ban đầu z

Để thực hiện phương phõp nỏy chỷng ta cần cụ tợnh khả vi của hỏm giõ tri v để đặc trưng điều khiển tối ưu vỏ cần tợnh chợnh quy nhất định của

õnh xạ phản hồi Š để giải được (2.10) Cõch tiếp cận trong trường hợp v

khừng khả vi cũng sẽ được đề cập trong Chương 2

Một cõch tiếp cận khõc một chỷt của điều kiện đủ tối ưu trong trường hợp hỏm giõ trị chỉ liởn tục lỏ dựa trởn khõi niệm hỏm kiểm định Theo nghĩa cổ điển, hỏm kiểm định lỏ một C!—ham, bi chan vỏ thỏa mọn

Aw(#) + sup{— ƒ(,ự).Du(#) — l(z,a)} <0, Vze RỲ, (2.11)

Trang 37

Giả sử a* lỏ một điều khiển chấp nhận được vỏ " lỏ quỹ đạo tương ứng xuất phõt từ z Một kết quả kiểm định đơn giản khẳng định: ự* lỏ điều

khiển tối ưu, nếu tồn tại một hỏm kiểm định + sao cho

Auly"(t)) — F(y"(t), e*(t)).Du(y"(t)) — Uy" (t),a*(t)) = 0, Vt € [0, +00)

(2.12)

Thật vậy, với điều khiển a € A bat ki, goi y(t) IA quy đạo tương ứng xuất phõt từ z, theo định nghĩa hỏm kiểm định nởu trởn ta cụ

Au(y(t)) — ƒ0),a(f)).Du(y0)) < I(u0),a@)), Vợ € [0, +00)

Dờ ơ rằng, vế phải của bất đẳng thức trởn chợnh lỏ

_e ft (eM uly(t)))

Do đụ tợch phón hai về bất đẳng thức đụ trởn khoang [0, +00) ta dan dờn

u(x) < Jhu0).a(0e 4 =J(œ,a), VaecA 0

Đặc biệt với điều khiển a*, ta cụ

u() = J(œ,o”),

hay œ* lỏ điều khiển tối ưu

Ngược lại, nếu luật điều khiển z r> œ„ € 4 lỏ tối ưu với mọi # vỏ u(x) := J(%, a„) khả vi thớ lỏ một hỏm kiểm định vớ theo định nghĩa nởu

trởn thớ = ự nởn trong trường hợp nỏy nụ lỏ nghiệm cổ điển của phương

trớnh (HJB), do đụ thỏa mọn (2.11)

Sự mở rộng kỹ thuật nỏy theo nghĩa nghiệm nhớt cũng sẽ được đề cập

trong mục tiếp theo Cụ thể khi đụ â được gọi lỏ hỏm kiếm định (suy rộng)

nếu œ lỏ nghiệm nhớt của (2.11) Khi đụ chỷng ta cụ kết quả kiểm định

Trang 38

Thật vậy, nếu lỏ một hỏm kiểm định suy rộng thớ theo định lý so sõnh nghiệm ta cụ u(x) < v(x) nờn

J(x,a*) < u(x) < v(x) < J(x,0*) > v(x) = J(œ,œ”)

hay œ* lỏ điều khiển tối ưu Ngược lại, nếu a* lỏ một điều khiển tối ưu thớ 0(#) = J(œ,œ*) chợnh lỏ một nghiệm nhớt dưới của phương trớnh (HJB),

do đụ lỏ một hỏm kiểm định suy rộng

2.2_ Ứng dụng của nghiệm nhớt đối với bỏi toõn điều khiển tối ưu với thời gian vừ hạn

Trước hết ta trớnh bỏy một số khõi niệm vỏ kết quả cần thiết về hệ phương trớnh vi phón phi tuyến mỏ chỷng ta muốn điều khiển Ta giả thiết

rằng: hỏm ƒ(z,ựa) với z € RŸ,a € 4 (tương ứng được gọi lỏ biến trạng thõi vỏ biến điều khiển), thỏa mọn cõc giả thiết sau:

A lỏ một khừng gian từ pừ, (A0)

ƒ:RŸ x A — RŸ lỏ một hỏm liởn tục;

ƒ bị chặn trởn ì(0, R) x A, vời moi R > 0; (AT) (tợnh bị chặn địa phương của ƒ đều theo biến điều khiển a})

tồn tại một mừ đun wy sao cho

If(y,@) — ƒ(œ,a)| < ựr(|z — 0|, R), (A2)

với mọi z, € (0, R) vỏ J > 0,

(tợnh liởn tục đều địa phương của ƒ, đều theo biến điều khiển a), trong đụ

mo dun la mot ham w:R, x R, — R, sao cho vời moi R > 0, w(., R) liởn

tục, khừng giảm vỏ œ(0, R) = 0

Ta sẽ chủ yếu quan tóm tới trường hợp 4 C IR” lỏ tập compac Khi đụ

(A1) vỏ (A2) lỏ cõc hệ quả của (A0) Ta cũng giả thiết

Trang 39

tức lỏ, tồn tại một số L € IR sao cho ƒ(z,ựa) — LT, với T lỏ toõn tử đồng nhất, lỏ một õnh xạ đơn điệu (khừng tăng) với mọi a

Trong luận văn nỏy ta chỉ xờt trường hợp ƒ liởn tuc Lipschitz toan cuc

theo biến trạng thõi, đều theo biến điều khiển, tức lỏ

|f(,a)T— ƒ(u,a)|< T|z — w|,Vz, RỶ,ac A (2.13) Khi đụ, tự nhiởn ƒ thỏa mọn (A3) vỏ (A2)

Chỷng ta quan tóm tới nghiệm (hay quỹ đạo) của hệ phi tuyến

tạ = f(y(t),a(t)),t > 0,

yi0) =z er)

với cõc hỏm điều khiển a(.) (gọi lỏ điều khiển lặp mở (open loop), vớ khừng phụ thuộc vỏo biến trạng thõi) thuộc tập tất cả cõc điều khiển:

A := {a: [0;+00) —> A đo được}

(về hỏm đo được vỏ cõc tợnh chất liởn quan cụ thể xem [2])

Kợ hiệu ;(.,ự) = „(.) lỏ nghiệm của (2.14) ứng với điều khiển œ, theo nghĩa ự„(.,œ) lỏ nghiệm của phương trớnh tợch phón

y(t) =a+ J fo).als)as, t> 0 (2.15)

Như vậy „(.,ự) lỏ một hỏm liởn tục tuyệt đối trởn cõc tập con compac

của [0,+oo) vỏ thỏa mọn (2.14) hầu khắp nơi

Theo [4], Dinh lý 5.4, 5.5, trang 219, với cõc giả thiết (A0), (A1), (A3)

tồn tại duy nhất nghiệm „(ê, œ) của (2.14), tức lỏ của (2.15) xõc định với mọi ý € [0,+oo) vỏ thỏa mọn cõc đõnh giõ

|u„(f,œ) — z| < M,„t, với moia € A,t € [0,1/M,], (2.16)

trong dờ M, := sup{|f(z,a)| :|z —2| < 1,a € A};

Trang 40

trong đụ := L + sup„cx |ƒ(0, a)|

Nếu ự; lỏ nghiệm thỏa mọn điều kiện ban đầu z;(0) = z thớ

|u.(ê,œ) — 0;(,œ)| < e”l‡—z|, Vae A,t>0 (2.18)

Chỷng ta cũng thường sử dụng cõc tập con đặc biệt của 4 lỏ tập cõc điều khiển hằng từng khỷc

7? :={a€ 4: tồn tại một dọy tăng f„ sao cho

lim‡„ = +œo vỏ œ lỏ hằng số trởn (f„,f„;â), n vỏ tập cõc cõc điều khiển đơn điệu khi A C R,

4„ := {œ €4: œ khừng giảm

2.2.1 Nguyởn lý quy hoạch động vỏ phương trớnh Hamilton- Jacobi-Bellman đối với nghiệm nhớt

Gắn với hệ (2.14), ta xờt phiếm hỏm chỉ phợ (cost ƒunctional) sau đóy:

J(z,a) := [ U(yx(t), a(t))e dt,

trong đụ !: RŸ x A4 R1A ham da cho, va hằng số \ > 0 cụ tợnh chất

[ liởn tục;

tồn tại một mừ đun Ò vỏ một hằng số ẵƒ sao cho

IHœ,a) — lĩu,a)[ < wi(|2 — yl) vỏ

|Iie.s) < M,Vr,y eR ae

(A4)

Chỷng ta muốn cực tiểu hụa phiếm hỏm chi phi theo a(.) € A

Định nghĩa 2.2.1 Nếu phiếm hỏm chi phợ đạt cực tiểu tại điều khiển a*(.) thớ a*(.) được gọi lỏ một điều khiển tối ưu ứng với vị trợ ban đầu z

Việc cực tiểu hụa cõc phiếm hỏm chỉ phợ đề cập ở trởn dẫn tới hỏm giõ tri (value function) sau day:

v(x) := InfJ(z, a)

acA

Ngày đăng: 17/10/2014, 19:23

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w