luận văn thạc sĩ toán học tìm hiểu lý thuyết điều khiển tối ưu , giúp người học có hiểu biết mới về điều khiển tối ưu đa mục tiêu
Trang 1Luận văn được hoàn thành tại trường Đại học sư phạm Hà Nội 2dưới sự hướng dẫn của TS Nguyễn Quang Huy.
Tác giả xin được gửi lời cảm ơn chân thành tới các thầy cô giáotrong nhà trường và các thầy cô giáo dạy cao học chuyên ngành Toángiải tích đã giúp đỡ tác giả trong suốt quá trình học tập
Tác giả xin chân thành cảm ơn Ban giám hiệu trường Đại học sưphạm Hà Nội 2, phòng Sau đại học đã tạo điều kiện thuận lợi trong quátrình tác giả học tập và nghiên cứu
Hà Nội, ngày 13 tháng 9 năm 2009
Tác giả
Phạm Thị Diệu Thùy
i
Trang 2Luận văn được hoàn thành tại trường Đại học sư phạm Hà Nội 2dưới sự hướng dẫn của TS Nguyễn Quang Huy.
Một số kết quả đã đạt được trong luận văn là mới và chưa từngđược công bố trong bất kỳ công trình khoa học nào của ai khác
Hà Nội, ngày 13 tháng 9 năm 2009
Tác giả
Phạm Thị Diệu Thùy
ii
Trang 3Rn không gian Euclid n-chiều
C[a, b] không gian các hàm liên tục trên [a, b]
C⊕[a, b] tập các độ đo Radon dương trên C[a, b]
W1,1([a, b]; Rn) không gian các hàm liên tục tuyệt đối x : [a, b] → Rn
L1[a, b] không gian các hàm khả tích trên [a, b]
Limsup giới hạn trên theo nghĩa Painlevé - Kuratowski
N (¯x; Ω) nón pháp tuyến Mordukhovich của Ω tại ¯x
b
N (¯x; Ω) nón pháp tuyến Fréchet của Ω tại ¯x
∂f (x) dưới vi phân Mordukhovich của f tại x
∂∞f (x) dưới vi phân suy biến của f tại x
Trang 4Mở đầu 1
1.1 Nón pháp tuyến qua giới hạn 41.2 Nguyên lý biến phân Ekeland 91.3 Dưới vi phân qua giới hạn 14
2.1 Điều khiển tối ưu một mục tiêu 222.2 Điều khiển tối ưu đa mục tiêu 25
iv
Trang 5ở đó g : Rn × Rn
→ Rm
là một hàm đã cho, F : [a, b] × Rn ⇒ Rn làmột ánh xạ đa trị, C tập đóng trong Rn × Rn và W1,1([a, b], Rn) khônggian các hàm liên tục tuyệt đối x : [a, b] → Rn với chuẩn kxk1,1 :=
|x(a)| +Rb
a | ˙x(t)|dt, | · | kí hiệu chuẩn Euclid trong Rn
Như chúng ta đã biết rằng một trong những vấn đề nghiên cứuquan trọng trong Lý thuyết điều khiển tối ưu được quan tâm nghiêncứu sâu sắc là các điều kiện cần tối ưu Đã có nhiều ấn phẩm khoa họcđược xuất bản trong sự phát triển nghiên cứu các điều kiện cần tối ưucho các bài toán điều khiển tối ưu (xem, chẳng hạn, [3-24] và các tàiliệu tham khảo đã được trích dẫn trong đó); tuy nhiên trong số đó córất ít các nghiên cứu cho lớp các bài toán điều khiển tối ưu đa mục tiêu[3, 8, 9, 24]
Với bài toán tối ưu một mục tiêu (hàm mục tiêu là hàm số), Ioffe[5] đã đưa ra các điều kiện cần dạng Euler-Lagrange và Hamilton chobài toán điều khiển tối ưu không có ràng buộc trạng thái Trong bài báonày [5, p 2878], Ioffe đã đưa ra ba bài toán mở mà hai trong ba bàitoán đó có thể phát biểu như sau: kết luận về các điều kiện cần điềukhiển tối ưu của Định lý 1 (Theorem 1) trong [5] có còn đúng hay không
Trang 6tính dưới Lipschitz (sub-Lipschitzness) hoặc tính giả Lipschitz Lipschitzness)?
(pseudo-Với bài toán tối ưu đa mục tiêu (hàm mục tiêu là hàm vector),Zhu [24] lần đầu tiên thiết lập được các điều kiện cần tối ưu cho các bàitoán điều khiển tối ưu đa mục tiêu với nón thứ tự thỏa mãn một số điềukiện chính quy thích hợp Trên cơ sở phân tích lược đồ chứng minh củaIoffe trong [5], Bellaassali và Jourani [3] đã mở rộng các kết quả tươngứng trong bài báo vừa nhắc đến ở trên của Zhu dưới các điều kiện chínhquy nhẹ hơn đặt trên nón thứ tự Gần đây, Kien, Wong và Yao [8, 9]
đã đưa ra các điều kiện cần tối ưu cho các bài toán điều khiển tối ưu
đa mục tiêu với ràng buộc trạng thái; các kết quả này mở rộng các kếtquả tương ứng trong [3, 24] Lưu ý rằng các kết về các điều kiện cần tối
ưu đã đạt được trong các bài báo vừa nêu ở trên luôn đòi hỏi giả thiết
về tính dưới Lipschitz khả tích của F và các điều kiện chính quy thíchhợp trên nón thứ tự (dưới các điều kiện chính quy đó thì nón thứ tựthường là lồi và nhọn) Trong [16], Mordukhovich [16, Definition 5.55]
đã đề xuất một quan hệ thứ tự tối ưu tổng quát mà nó không đòi hỏiphải lồi, đóng, nhọn hay có phần trong khác rỗng Một câu hỏi tự nhiênnảy sinh rằng: có thể thiết lập được hay không các điều kiện cần tối ưucho bài toán đều khiển tối ưu đa mục tiêu (VOP) với thứ tự tổng quát
đã được đề xuất bởi Mordukhovich ?
Đề tài “Điều kiện cần tối ưu cho bài toán điều khiển tối
ưu đa mục tiêu ” nhằm mục đích tìm hiểu lý thuyết điều khiển tối ưu
và tìm hiểu câu trả lời cho hai câu hỏi vừa nêu ở trên
Trang 72 Mục đích nghiên cứu
Đưa ra các điều kiện cần tối ưu cho bài toán điều khiển tối ưu đamục tiêu có ràng buộc trạng thái
3 Nhiệm vụ nghiên cứu
Nghiên cứu tính các bài toán điều khiển tối ưu, tối ưu đa mục tiêu,bao hàm thức vi phân, điều kiện cần tối ưu, các phép tính dưới vi phân
và nguyên lý cực đại
4 Đối tượng và phạm vi nghiên cứu
Điều khiển tối ưu, tối ưu đa mục tiêu, bao hàm thức vi phân vàcác nguyên lí biến phân
5 Phương pháp nghiên cứu
Sử dụng các phương pháp nghiên cứu của giải tích không trơn, giảitích biến phân và lý thuyết tối ưu
6 Giả thiết khoa học (hay những đóng góp mới)
Nếu giải đáp được các câu hỏi đã nêu trong Mục 1 thì đây sẽ làđóng góp giúp ta có hiểu biết mới về điều khiển tối ưu đa mục tiêu
Trang 8Nón pháp tuyến và dưới vi phân
Trong chương này chúng ta sẽ trình bày các khái niệm cơ bảnnhất về nón pháp tuyến và dưới vi phân giới hạn Nguyên lý biến phânEkeland và một số kết quả về các dạng biểu diễn của nón pháp tuyếntrong không gian hữu hạn chiều, biểu diễn nón pháp tuyến qua dưới viphân của hàm khoảng cách hay quy tắc tổng của dưới vi phân được sửdụng để thiết lập điều kiện cần tối ưu trong Chương 2 cũng được nhắclại với chứng minh chi tiết
Trong luận văn chúng ta sẽ sử dụng các khái niệm, kí hiệu của giảitích biến phân, đạo hàm suy rộng và lý thuyết tối ưu Chi tiết đọc giả cóthể tham khảo bộ sách của Mordukhovich [15, 16] và Vinter [20] Mộtkhông gian Banach bất kì X với chuẩn k · k ta xét không gian đối ngẫucủa nó X∗ với tôpô yếu∗ được kí hiệu bởi w∗ Như thường lệ, BX và BX ∗
kí hiệu tương ứng là hình cầu đơn vị đóng trong không gian Banach X
và không gian đối ngẫu của nó Kí hiệu A∗ toán tử liên hợp của toán tửtuyến tính liên tục A Hình cầu đóng tâm x bán kính ρ được kí hiệu bởi
Bρ(x)
Trang 9Với mỗi tập Ω ⊂ X, cl Ω, int Ω, co Ω và cone Ω kí hiệu tương ứng
là bao đóng, phần trong, bao lồi và nón lồi sinh của Ω Ta nhắc lại rằng
Ω ∈ X là đóng địa phương tại ¯x ∈ Ω nếu có một lân cận U của ¯x saocho Ω ∩ clU là tập đóng
Cho F : X ⇒ X∗ ánh xạ đa trị giữa một không gian Banach X
và không gian đối ngẫu X∗ của nó Giới hạn trên theo dãy theo nghĩaPainlevé - Kuratowski đối với tôpô chuẩn của X và tôpô yếu* của X∗tại ¯x được xác định bởi
(i) Tập các ε - véctơ pháp tuyến Fréchet của Ω tại ¯x được xác định bởi
N0(¯x; Ω) nón pháp tuyến Fréchet của Ω tại ¯x
(ii) Nón pháp tuyến Mordukhovich hay nón pháp tuyến qua giới hạn của
ở đó có thể đặt ε = 0 khi Ω là tập đóng trong lân cận của ¯x và X làkhông gian Asplund
Trang 10Tiếp theo chúng ta sẽ trình bày hai dạng biểu diễn tương đươngkhác của nón pháp tuyến Mordukhovich trong không gian hữu hạn chiều
X = Rn (trong trường hợp này X∗ = X = Rn) mà chúng hữu ích trongviệc thiết lập điều kiện cần tối ưu ở Chương 2 Do tất cả các chuẩntrong không gian hữu hạn chiều là tương đương nên ta có thể chọnchuẩn Euclid
kxk =
q
x21 + + x2
n, x ∈ Rn.Cho một tập không rỗng Ω ⊂ Rn Khoảng cách được xác định bởi
dΩ(x) = dist(x; Ω) := inf
u∈Ωkx − uk , x ∈ R
và hình chiếu Euclid của x trên Ω
Π(x; Ω) := {¯x ∈ Ω| kx − ¯xk = dist(x; Ω)} Nếu Ω là đóng thì tập Π(x; Ω) luôn khác rỗng đối với mỗi x ∈ Rn.Định lý 1.1 (Nón pháp tuyến trong không gian hữu hạn chiều)[15, Theorem 1.6] Cho Ω ⊂ Rn tập đóng địa phương tại ¯x ∈ Ω Khi đócác khẳng định sau là đúng:
ta suy ra rằng có dãy εk ↓ 0, xk → ¯x và x∗k → x∗ sao cho xk ∈ Ω và
x∗k ∈ ˆNεk(xk; Ω) với mọi k ∈ N Lấy X = X∗ = Rn và Ω là tập đóng địaphương của ¯x, cho mỗi k = 1, 2, ta xét xk + αx∗k với α > 0 và chọn
ωk ∈ Π(xk + αx∗k; Ω) từ hình chiếu Euclid Do cách chọn ωk ta có bấtđẳng thức
kxk+ αx∗k − ωkk2 6 α2kx∗kk2
Trang 11và vì chuẩn là Euclidean nên
Trang 13Điều này và định nghĩa của bN (x; Ω) suy ra rằng
coneΠ−1(x; Ω) − x ⊂ N (x; Ω), ∀x ∈ Ω,b
và do đó suy ra bao hàm thức “⊃” trong (1.5) bởi việc sử dụng giới hạntrên Painlevé - Kuratowski khi x −→ ¯Ω x và sử dụng (1.4) Định lý đượcchứng minh
Nguyên lý Ekeland là một công cụ để thiết lập các định lý ánh xạ
mở, định lý hàm ẩn, định lý hàm ngược trong giải tích không trơn vàgiải tích biến phân
Định lý 1.2 (Nguyên lý biến phân Ekeland) [2, Định lý 2.1.1] Cho(X, d) là một không gian metric đủ, f : X → R ∪ {+∞} là hàm số nửaliên tục dưới, bị chặn trong X Khi đó, nếu ¯x thoả mãn
là một qua hệ thứ tự Thật vậy, tính phản xạ được suy ra trực tiếp từ
Trang 14(x, y) 6α (x, y) với mọi (x, y) ∈ X × R Để kiểm tra tính phản xứng, tagiả sử rằng (x1, y1) 6α (x2, y2) và (x2, y2) ≤α (x1, y1) Do (2.2)
(x1, y1) 6α (x2, y2) ⇐⇒ d(x1, x2) 6 y
1 − y2
α .Theo giả thiết ta có
Trang 15Lấy M ⊂ X × R là tập đóng sao cho tồn tại γ > 0 để y > γvới mọi (x, y) ∈ M Ta khẳng định rằng với mỗi (x1, y1) ∈ M tồn tại(¯x, ¯y) ∈ M sao cho (x1, y1) 6α (¯x, ¯y) và (¯x, ¯y) là một phần tử cực đạitrong M theo thứ tự ” 6α ” (tức là, nếu (x, y) ∈ M và (¯x, ¯y) 6α (x, y)thì (x, y) = (¯x, ¯y)) Bắt đầu từ (x1, y1) ∈ M ta xây dựng dãy (xk, yk) như sau: giả sử (xk, yk) đã được xác định Đặt
Mk = (x, y) ∈ M : (xk, yk) 6α (x, y)
Rõ ràng, Mk là tập đóng Mặt khác, vì (xk, yk) ∈ Mk nên Mk 6= ∅.Đặt
γk = inf y : ∃x ∈ X, (x, y) ∈ Mk Hiển nhiên, γk > γ và γk 6 yk Chọn (xk+1, yk+1) ∈ Mk sao cho
(xk, yk) 6α (xk+1, yk+1) 6α (x, y),
và do đó (x, y) ∈ Mk Điều này suy ra rằng dãy Mk là các tập đónglồng nhau: Mk+1 ⊂ Mk
với mọi k ∈ N Đặtd((x, y), (x0, y0)) = d(x, x0) + |y − y0|
Trang 17y − f (¯x) + αd(¯x, ˆx) 6 0 (1.14)Giả sử ˆy > f (ˆx) Khi đó d(ˆx, ˆx) < y−f (ˆˆ 2 x)
Suy ra (ˆx, ˆy) 6α (ˆx, f (ˆx)) và (ˆx, ˆy) 6= (ˆx, f (ˆx)), đồng thời chứng tỏ (ˆx, ˆy)không thể là phần tử cực đại, mâu thuẫn với giả thiết Vậy
ˆ
Thay (2.8) vào (2.7), ta có
f (ˆx) − f (¯x) + αd(¯x, ˆx) 6 0 (1.16)
Trang 18Suy ra f (ˆx) − f (¯x) 6 0, tức là tính chất (i) trong kết luận của định lýnghiệm đúng Do đó
x ∈ X\ {ˆx} Nếu f (x) = +∞ thì bất đẳng thức chặt trong (iii) là đúng.Giả sử f (x) ∈ R Vì (x, f (x)) ∈ M, (x, f (x)) 6= (ˆx, f (ˆx)) và (ˆx, f (ˆx)) làphần tử cực đại trong M, nên bất đẳng thức (ˆx, f (ˆx)) 6α (x, f (x)) làsai Do đó
f (x) − f (ˆx) + αd(x, ˆx) > 0
hay
f (x) − f (ˆx) + ε
λd(x, ˆx) > 0.
Vậy tính chất (iii) nghiệm đúng Định lý được chứng minh
Định nghĩa 1.2 Cho X là không gian Banach và f : X → ¯R hàm nhậngiá trị trong tập số thực suy rộng, hữu hạn tại ¯x Với mỗi ε > 0, đặt
Các phần tử của tập hợp ở vế trái công thức này được gọi là các ε− dướigradient Fréchet của f tại ¯x, còn bản thân tập hợp đó được gọi là ε−dưới gradient Fréchet của f tại ¯x
Trang 19Tập hợp
ˆ
∂f (¯x) := ˆ∂0f (¯x)được gọi là dưới vi phân Fréchet dưới (thường gọi là dưới vi phân Fréchet )của f tại ¯x Rõ ràng, ˆ∂f (¯x) ⊂ ˆ∂εf (¯x) với mọi ε > 0
Định nghĩa 1.3 Tập hợp
∂f (¯x) := Limsup
x−→f x ¯ ε↓0
được gọi là dưới vi phân qua giới hạn hay dưới vi phân Mordukhovich
Ta nhận thấy rằng x∗ ∈ ∂f (¯x) khi và chỉ khi tồn tại các dãy
xk −→ ¯f x, εk ↓ 0, và x∗k ∈ ˆ∂fεkf (xk) sao cho x∗k ω
∗
−→ x∗ Hiển nhiên ta cóˆ
∂f (¯x) ⊂ ∂f (¯x)
Tập hợp
∂∞f (¯x) := Limsup
x−→f x ¯ ε,λ↓0
λ ˆ∂εf (x) (1.19)
được gọi là dưới vi phân qua giới hạn suy biến (thường gọi tắt là dưới viphân suy biến) của f tại ¯x Như vậy x∗ ∈ ∂∞f (¯x) khi và chỉ khi tồn tạicác dãy xk −→ ¯f x, εk ↓ 0, λk ↓ 0, và x∗k ∈ λk∂fˆ εkf (xk) sao cho x∗k ω
Trang 20Ta có thể chứng minh được rằng
∂f (¯x) = {x∗ ∈ X∗|(x∗, −1) ∈ N ((¯x, f (¯x)); epif )} ,
∂∞f (¯x) = {x∗ ∈ X∗|(x∗, 0) ∈ N ((¯x, f (¯x)); epif )} Định lý sau đây cho ta một biểu diễn khác của nón pháp tuyếnMordukhovich qua dưới vi phân của hàm khoảng cách
Định lý 1.3 (Nón pháp tuyến qua dưới vi phân của hàm khoảngcách) [15, Theorem 1.97] Cho Ω là tập khác rỗng và đóng trong khônggian Banach X Khi đó
Tiếp theo ta chứng minh bao hàm thức ngược lại trong (1.20) khi
Ω là tập đóng Lấy tùy ý x∗ ∈ ∂dΩ(¯x) Khi đó tồn tại dãy xk → ¯x và
x∗k −→ ¯ω∗ x∗ với x∗k ∈ ˆ∂4εkdΩ(xk) Bởi [15, Proposition 1.95], ta có
Trang 21Chọn ρk ↓ 0 với ρk < min{ηk2,k1dΩ(xk)} và lấy νk ↓ 1 sao cho (νk −1)dΩ(xk) < ρ2k Khi đó lấy cố định ˜xk ∈ Ω thỏa mãn k˜xk−xkk ≤ νkdΩ(xk)
và quan sát rằng
hx∗k, ui ≤ dΩ(xk + u) − νk−1kxk − ˜xkk + εkkuk
≤ dΩ(˜xk + u) + (1 − νk−1)kxk − ˜xkk + 2εkkuknếu kuk ≤ ηk Suy ra
Ω ∩ Bηk(˜xk) Khi đó tồn tại ˆxk ∈ Ω ∩ Bηk(˜xk) sao cho kˆxk− ˜xkk ≤ γk vàh−x∗k, ˆxk− ˜xki+2εkkˆxk− ˜xkk ≤ −hx∗k, xk− ˜xki+2εkkxk− ˜xkk+γkx− ˆxkk.Đặt rk := ρk − γk Vì γ2 ≤ νk(1 − νk−1)dΩ(xk) ≤ ρ2 nên
Trang 22Cho không gian Banach X Tập Ω ⊂ X là compắc pháp tuyếntheo dãy (SNC) tại ¯x nếu với mọi dãy εk ↓ 0, xk −→ ¯Ω x và x∗k ∈ bNεk(xk, Ω)có
εk ↓ 0, (xk, yk) → (¯x, ¯y), (x∗k, −yk∗) ∈ bNεk((xk, yk); gphF ), x∗k −→ 0ω∗
và kyk∗k → 0, ta có kx∗kk → 0 khi k → ∞
Cho ϕ : X → ¯R hữu hạn tại ¯x ϕ được gọi là epi-compact pháptuyến theo dãy (SNEC) tại (¯x, ϕ(¯x)) nếu trên đồ thị của nó là SNC tại(¯x, ϕ(¯x))
Ta có quy tắc tổng sau đây cho dưới vi phân Mordukhovich.Định lý 1.4 (Quy tắc tính tổng cho dưới vi phân) [15, Theo-rem 3.36] Cho X là một không gian Asplund, fi : X → ¯R, i = 1, 2, , n
là các hàm nửa liên tục dưới trong một lân cận của ¯x và có ít nhất mộthàm số là SNEC tại ¯x Giả sử rằng điều kiện sau được thỏa mãn
[x∗i ∈ ∂∞fi(¯x) , i = 1, , n, x∗1 + + x∗n = 0] =⇒ x∗1 = = x∗n = 0
(1.21)Khi đó ta có các bao hàm thức
∂(f1 + + fn)(¯x) ⊂ ∂f1(¯x) + + ∂fn(¯x), (1.22)
∂∞(f1 + + fn)(¯x) ⊂ ∂∞f1(¯x) + + ∂∞fn(¯x) (1.23)
Trang 23Hơn nữa, nếu tất cả fi là chính quy dưới tại ¯x thì tổng f1+ + fn cũngchính quy dưới tại điểm đó, và bao hàm thức trong (1.21) trở thành đẳngthức.
Chứng minh Trước tiên chúng ta xét trường hợp cho hai hàm f1, f2 vàchứng minh bao hàm thức (1.22) Với điều kiện xác định chúng ta giả sửrằng f1 là SNEC tại ¯x Lấy x∗ ∈ ∂(f1 + f2)(¯x) Bởi biểu diễn (1.18) ta cóthể tìm được các dãy xk → ¯x và x∗k ω
∗
−→ ¯x∗ thỏa mãn fi(xk) → fi(¯x), i =
1, 2 và x∗k ∈ ˆ∂(f1 + f2)(xk), k = 1, 2 Chọn một dãy tùy ý εk ↓ 0 khi
k → ∞ và sử dụng (1.17) tại xk với ε = 0, chúng ta tìm được một lâncận Uk của xk ở đó
(f1 + f2)(x) − (f1 + f2)(xk) − hx∗k, x − xki + εkkx − xkk > 0 ∀x ∈ Uk
(1.24)Không mất tính tổng quát, chúng ta giả sử rằng f1 và f2 là nửa liên tụcdưới trên X Do đó các tập
Ω1k := {(x, µ) ∈ X × R|f1(x) − f1(xk) 6 µ} (1.25)và
Trang 24(˜x∗k, αk) ∈ bN ((x1k, µ1k − f1(xk)); Ω1k), (1.28)(˜yk∗, βk) ∈ bN ((x2k, −µ2k + f2(xk) + hx∗k, x2k − xki − εkkx2k − xkk); Ω2k),
(1.29)k(˜x∗k, αk) + (˜y∗k, βk)k 6 εk (1.30)Suy ra (xik, µik) −epi f−−→ (¯i x, fi(¯x)) khi k → ∞ với i = 1, 2 Do X là khônggian Asplund và các dãy {(˜x∗k, αk)} và {(˜yk∗, βk)} là bị chặn, chúng ta cóthể giả sử khi k → ∞ rằng
(βkx∗k + ˜yk∗, −βk) ∈ bN˜k ((x2k, µ2k) ; epi f2) (1.33)với ˜εk := εk(1 + kx∗kk + εk + |βk|), k = 1, 2 Cho qua giới hạn trong(1.33) khi k → ∞ ta có, bởi (1.30), (βx∗+ ˜y∗, −β) ∈ N ((¯x, f2(¯x)); epi f2),
ở đó ˜y∗ = −˜x∗ và β = −α Do đó, chúng ta thu được bao hàm thức
(−αx∗ − ˜x∗, α) ∈ N ((¯x, f2(¯x)); epi f2) (1.34)Tiếp theo chúng ta chứng minh rằng α 6= 0 Thật vậy, nếu α = 0 thì
từ (1.32) và (1.34) suy ra (˜x∗, 0) ∈ N ((¯x, f1(¯x)); epi f1) và (−˜x∗, 0) ∈
Trang 25x nên ta có thể khẳng định rằng (˜x∗k, αk) → (0, 0) đối tôpô chuẩn trong
X∗ × R khi k → ∞ Điều này mâu thuẫn với (1.27) Do đó α 6= 0 Từ(1.32) và (1.34) ta có