Bài toán điều khiển tối ưu không trơn

Một phần của tài liệu Phương pháp xấp xỉ trơn cho bài toán tối ưu không trơn (Trang 26 - 50)

Xét bài toán điều khiển tối ưu thời gian cố định I = [a, b] ⊂ R không trơn với ràng buộc trạng thái :

Minimize x∈X,u∈U F(x, u) := Z I f(t, x(t), u(t))dt, Dx(t) =m(t, x(t), u(t)) (t∈ I), x(a) = x0, u(t) ∈ Γ(t) (t∈ I); n(t, x(t)) ∈ Π(t) (t ∈ I). (1.27)

Ở đây X là không gian của các hàm trạng thái trơn từng khúc x :

I →Rn với chuẩn ||x|| = ||x||∞+||Dx||∞; U là không gian các hàm điều khiển liên tục từng khúc u : I → Rr, với chuẩn ||u||∞. Ràng buộc đẳng thức Dx(t) = m(t, x(t)) có nghĩa là

x(t) = x0 +

Z t

0

m(s, x(s), u(s))ds (t ∈ I), (1.28) các hàm f, m và g đo được với f(t, ., .), m(t, ., .) và n(t, ., .) Lipschitz địa phương trên X×U, và f(t, x(t), u(t)) được trội bởi một hàm khả tích khi

(x, u) ở trong một lân cận W của (¯x,u¯) ∈ X ×U; Π(t) là nón lồi đóng trong Rp. Các điều kiện cần phải tìm để bài toán (1.27) có cực tiểu địa phương (¯x,u¯). Chứng minh các điều kiện cần cho bài toán (1.27) tương tự Định lý 1.2, cho xấp xỉ bài toán (1.27) bằng bài toán trơn thích hợp mà ta có thể áp dụng được lí luận Pontryagin. Kết quả sẽ được phát biểu dưới ngôn ngữ phương trình liên hợp:

−Dλ(t) ∈ ∂x[f(t,x¯(t),u¯(t)) +λ(t)m(t,x¯(t),u¯(t))−v(t)n(t,x¯(t))], λ(b) = 0, v(t) ∈ (Π(t))∗, v(t)n(t,x¯(t)) = 0, (1.29)

với hầu hết t∈ I, với các nhân tử Lagrange λ : I → Rn và v : I →Rp, và một nguyên lý cực đại: với hầu hết t ∈ I,

(∀w ∈ Γ(t))f(t,x¯(t), w) +λ(t)m(t,x¯(t), w) = f(t,x¯(t),u¯(t)) +λ(t)m(t,x¯(t),u¯(t)).

(1.30)

Ở đây ∂x[f(t,x,¯ u¯) nghĩa là ∂x[f(t, .,u¯) tại x. Bài toán được xây dựng¯

tương tự bài toán (1.17) với f(t, ξ, ζ :σ) :=

Z

Rn×Rn

f(t, ξ −α, ζ −β)ϕ(α)ϕ(β)dαdβ,

ϕ(.) := Φ(σ−1||.||)σ−1, (1.31) với σ > 0 đủ nhỏ, và Φ có trong (1.2); và tương tự cho m và n. Khi đó, bài toán trơn tương ứng với (1.28) sẽ là bài toán:

Minimize x∈X,u∈U F(x, u :: η) := Z I f(t, x(t), u(t) : q(t :η))dt, Dx(t) =m(t, x(t), u(t) :: η) (t ∈ I), x(0) = x0; u(t) ∈ Γ(t) (t ∈ I); n(t, x(t) :: η) ∈ Π(t) (t ∈ I). (1.32)

Ở đây Φ là hàm trơn; q(. : .) > 0 được chọn, trong chứng minh của Định lý (1.4) và m(t, x(t), u(t) :: η)) vàn(t, x(t) :: η) được xác định tương tự (1.17).

Bài toán điều khiển (1.27) có thể viết dưới dạng:

MinimizeF(z), R(z) = 0, z ∈ K,

trong đóz = (x, u) ∈ X×U và R(z) = 0 biểu diễn phương trình vi phân. Gọi z¯= (¯x,u¯). Xét điều kiện Slater:

(∀Φ ∈ Nk(¯z)) (∃ϑ ∈ int cone(K −z¯)) Φϑ = 0. (1.34) Ở đây cone (K −z¯) là nón sinh ra bởi K −z.¯

Định lí 1.4 (Điều kiện Pontryagin không trơn).

Giả sử bài toán điều khiển không trơn (1.27) đạt cực tiểu địa phương tại (x, u) = (¯x,u¯) ∈ X ×U. Hàm F(., .) là Lipschitz địa phương. Khi đó, tồn tại τ = 0 và hàm khả tích λ : I → Rn và v : I → Rp, không đồng thời bằng 0, sao cho phương trình liên hợp (1.29) (với τ f thay cho f) và nguyên lý cực đại (1.30) (với τ f thay cho f) đúng, với hầu hết t∈ I. Hơn nữa, τ = 1 nếu ràng buộc trạng thái n(t, x(t)) ∈ Π(t) không có trong bài toán, hoặc nếu điều kiện chính quy (1.34) đúng.

Chứng minh

Như trong chứng minh Định lý (1.2), giả sử (1.28) đạt cực tiểu địa phương chặt, hoặc thêm số hạng γ(||x−x¯||2+||u−u¯||2) vào hàm mục tiêu để có cực tiểu địa phương chặt. Theo Bổ đề (1.5) và định lý Ekeland, tương tự chứng minh Định lý (1.2), ta suy ra tồn tại dãy qj(.) := q(. : 1/j) > 0, sao cho

c

Fj(x, u) := F(x, u :: 1/j) +j−1(||x−x∗j||+||u−u∗j||) (1.35) đạt cực tiểu địa phương trên các tập chấp nhận được của (1.33), tại (adsbygoogle = window.adsbygoogle || []).push({});

(x∗j, u∗j) ∈ X ×U, trong đó

||x∗j −x¯||+||u∗j −u¯| → 0khi j → ∞. Với mỗi j cố định, bài toán điều khiển này có dạng:

Minimize Fv(z, u), Dvz = Mv(z, u), u ∈ Γ.

(1.36)

Chú ý rằng Fv(z, u)là tổng của C2−hàm của (z, u) và số hạng chuẩn j−1[(||x−x∗j||+||u−u∗j||] khả vi theo phương (không khả vi Fréchet), và Mv(., .) là hàm C2 từ xây dựng trơn (1.31), (1.32). Đặt

H(z, u) := Fv(z, u) +µjMv(z, u), (1.37) trong đó µj là hàm tuyến tính.

Nếu số hạng chuẩn vắng mặt, thì (xem [7]) H(z, u) = Z I hv(t, x(t), u(t))dt, trong đó hv(t, x(t), u(t)) = f(t, x(t), u(t) : q(t: 1/j)) +λj(t)m(t, x(t), u(t) : q(t: 1/j))−νj(t)n(t, x(t) : (t : 1/j)). (1.38)

Ở đây µj là nhân tử Lagrangian (λj(t), νj(t)) khả tích trên I, với νj(t) ∈ (Π(t))∗. Khi đó, theo [7], điều kiện cần Pontryagin đúng: phương trình liên hợp −Dλj(t) = hvx(t, x∗j(t), u∗j(t)), λj(b) = 0, νj(t)n(t, x∗j(t)) = 0, νj(t) ∈ (Π(t))∗, (1.39) và với hầu hết t∈ I, (∀w ∈ Γ(t)) hv(t, x∗j(t), w)) = hv(t, x∗j(t), u∗j(t)), (1.40)

βj(t) ∈ hvu(t, x∗j(t), u∗j(t));

βj(t) ∈ NΓ(t)(u∗j(t)).

(1.41)

Khi số hạng chuẩn được thay thế, các chứng minh vẫn đúng miễn là đạo hàm riêng hvx(.) bây giờ được thay thế bởi đạo hàm theo phương.

Bây giờ ta thay nhân tử f bởi τj > 0 trong (1.38), và thay τjλj bởi λj và τjνj bởi νj. Thiết lập (1.40) và (1.41) với f thay thế bởi τjf. Cố định t∈ I mà (1.39) và (1.40) đúng,τj được chọn sao cho||(τj, λj(t), νj(t))|| = 1

trong R1+n+p. Chọn dãy con liên tiếp như trong chứng minh của Định lý (2.1) ta suy ra tồn tại dãy K ⊂ N sao cho {τj|j ∈ K} → τ,{λj(t)|j ∈ K} → λ(t) và {νj(t)|j ∈ K} → ν(t) với ||(τ, λ(t), ν(t))|| = 1. Bởi vì {x∗j(t)} → x¯(t) và {uj∗(t)} → u¯(t), (1.40) và (1.41) khi j → ∞, j ∈ K ta nhận được (1.29) và (1.30) nhưng vớiτ f thay chof. Ở đây,(τ, λ(.), ν(.)) 6= 0. Một cách tương tự, khi sử dụng (1.40), ta có thể giả sử rằng (τ, β) 6= 0, trong đó β là giới hạn của dãy con của {βj}.

Nếu τ 6= 0, ta chia cho τ và nhận được (1.40) và (1.41), đòi hỏi. Nếu τ = 0 thì λ(.) và ν(.) không thể đồng thời triệt tiêu. Trong trường hợp không có ràng buộc trạng thái thì (1.30) với τ = 0 trở thành

−Dλ(t) = ∂x[λ(t)m(t, x(t), u(t))] = 0, λ(b) = 0. (1.42) Khi đó, (1.42) đòi hỏi λ(.) = 0: mâu thuẫn. Vì vậy, τ 6= 0. Trong trường hợp có ràng buộc trạng thái (1.39), (1.40) và (1.41), với τ f thay thế f, ta lấy giới hạn của dãy con để có (1.29) (với τ f), và với hầu hết t∈ I,

với τ f in hv. Theo [3,trang 17], điều kiện F.John của bài toán (1.27) có thể viết dưới dạng:

β ∈ ∂(τ F +λR)(¯z), β ∈ NK(¯z), (1.44) với τ và β không đồng thời bằng 0. Nếu τ = 0 thì β 6= 0 và β = λ% với % nào đó ∈ ∂K(¯z). Khi giả thiết điều kiện chính quy (1.34) đúng thì ta

Chương 2

PHƯƠNG PHÁP XẤP XỈ TRƠN CHO BÀI TOÁN MINIMAX

VECTƠ KHÔNG TRƠN

Chương 2 trình bày các điều kiện cần và đủ Lagrange cho bài toán minimax vectơ không trơn với các ràng buộc nón, với các hàm Lipschitz địa phương bằng phương pháp xấp xỉ trơn. Các kết quả trong chương này là của B.D.Craven và D.V.Lưu [9].

2.1 Các kiến thức bổ trợ

Giả sửf, hvà g là hàm Lipschitz địa phương tương ứng từRn×Rn,Rm và Rn vào Rr ,Rp và Rn. Q ⊂ Rr, T ⊂ Rs và S ⊂ Rp là các nón lồi đóng, với intQ 6= ∅. Xét bài toán minimax giá trị vectơ:

(W M M1)

W M INx{W M AXyf(x, y) : −h(y) ∈ S}, −g(x) ∈ T,

ở đây WMIN kí hiệu cực tiểu địa phương yếu, và WMAX kí hiệu cực đại địa phương yếu theo nón Q. Ở đây cực tiểu yếu của hàm vectơ Θ tại điểm a có nghĩa là với hàm ρ(.) =o(||.−a||) nào đó,

Θ(z)−Θ(a)−ρ(z) 6∈ −intQ khiz → a, z là các điểm chấp nhận được. Cực đại yếu của Θ(.) là cực tiểu yếu của −Θ(.).

Với S ⊂ Rp và K ⊂ Rr, ta kí hiệu L(S, K) là tập các ánh xạ tuyến tính từ Rp và Rr mà S ánh xạ vào K. Nếu b ∈ Rr, ta kí hiệu Kb := (adsbygoogle = window.adsbygoogle || []).push({});

{γ(t−b) : t ∈ K, γ ≥ 0}. Nón lồi K ⊂ Rr được gọi là nón cơ bản nếu K có đúng r phần tử sinh, và là một cở sở của Rr. Đặt W := Rr\(− intQ)

và U := W ∩ (−W); Q∗ là nón đối ngẫu của Q, f(x, y) là vectơ cột, và các phần tử của Q∗ là các vectơ hàng.

2.1.1 Bài toán minimax đã làm trơn

Với các tham số dương đủ nhỏ α và β, ta định nghĩa (xem [8])

f(x, y : α, β) := Z Rm Z Rn f(x−s, y−t)φ(s|α)ψ(t|β)dsdt; (2.1) h(y : β) := Z Rm h(y −t)ψ(t|β)dt; g(x : α) := Z Rn g(x−s)φ(s|α)ds,

trong đó ds và dt là các độ đo Lebesgue trên Rn và Rm (tương ứng); φ(s|α) := α−1Φ(α−1||s||), ψ(t|β) :=β−1Ψ(β−1||t||), ở đây Φ và Ψ là hàm lớp C∞ với giá trị trong (-1,1) sao cho R

Rφ(z)dz = 1 = R

Rψ(z)dz. Nếu f = (f1, f2, ...) thì f φ là vectơ(f1φ, f2φ, ...). Chú ý rằng f(., . : α, β), h(. :

khi α, β → 0. Nếu f, g, h có hằng số Lipschitz Kf, Kg, Kh trong lân cận N0 của điểm (¯x,y¯) thì với (x, y) ∈ N0,

||g(x :α)−g(x)|| ≤ Z Rn ||g(x−s)−g(x)||φ(s|α)ds ≤Kg Z Rn ||s||φ(s|α)ds 5 Kg, (2.2)

chú ý rằng φ(.) ≥ 0 và có giá compact. Một cách tương tự ta có ||h(y :β)−h(y)|| ≤ Khβ,

||f(x, y : α, β)−f(x, y)|| ≤ Kf(α+β).

(2.3)

Theo định lý Redemacher, hàm Lipschitz g là khả vi Fréchet trừ ra một tập N1 có độ đo không. Khi đó (xem [5]),

g0(x : α) =

Z

Rn

g0(x−s)φ(s|α)ds ∈ Cg(α) := co{g0(s) : s 6∈ N1,||s−x|| < α, trong đó co kí hiệu bao lồi đóng, bởi vì lấy tích phân trên N1 không ảnh hưởng đến tích phân. Với α đủ nhỏ Cg(α) là compact và

\

α>0

Cg(α) = ∂g(x)

là Jacobian suy rộng Clarke.

Giả sử với (WMM1) đạt được minimax địa phương yếu tại (x, y) = (¯x,y¯). Đặt eh(y : β) := h(y : β)−h(¯y : β) + h(¯y), e g(x : β) := g(x : β)−g(¯x : β) +g(¯x). Khi đó, e h(¯y :β) =h(¯y), e g(¯x : β) = g(¯x).

Khi đó, bài toán (WMM1) được xấp xỉ bởi bài toán minimax trơn: (WMM2) W M INx{W M AXyf(x, y : α, β) : −eh(y : β) ∈ S},

−ge(x : α) ∈ T.

Theo cách xây dựng của eg và eh, điểm (¯x,y¯) là chấp nhận được của (WMM2). Kí hiệu (IP(α, β)) là bài toán trong của (WMM2).

Mệnh đề 2.1

Giả sử f và g là các hàm Lipschitz địa phương, thỏa mãn điều kiện ổn định:

(∀ξ ∈ ∂h(¯y)) 0 ∈ int[h(¯y) +ξ(Rm) +S],

và điều kiện tăng trưởng tuyến tính, với 0 6= τ nào đó ∈ Q∗ và r > 0 nào đó, (adsbygoogle = window.adsbygoogle || []).push({});

(∀χ > 0)(∀y,||y−y¯|| ≤ r,−h(y) ∈ S) τ f(¯x, y) ≤ τ f(¯x, Cy¯)−χ||y−y¯||. Khi đó, với ||x−x¯||, α và β đủ nhỏ, bài toán (IP (α, β)) đạt cực đại địa phương yếu tại điểm y = yb(x;α, β) và với 0< ρ < ∞ nào đó,

||yb(x;α, β)−yb(¯x; 0,0)|| ≤ρ||(x, α, β)−(¯x,0,0)||. Chứng minh

Bởi vì h là hàm Lipschitz địa phương trên không gian hữu hạn chiều, ánh xạ y 7→ ∂h(y) là nửa liên tục trên tại y¯ (do [4, Mệnh đề 2.1.5]). Chú ý rằng tất cả giả thiết của [6, Bổ đề 4] thỏa mãn cho cực tiểu hóa τ f(x, .;α, β) với ràng buộc −he(.;β) ∈ S . Bài toán này đạt được cực đại địa phương tại điểm yb(x;α, β) thỏa mãn điều kiện Lipschitz. Khi đó,

b

y(x;α, β) là điểm cực đại địa phương yếu của (IP (α, β)). Đặt m(x;α, β) := f(x,yb(x;α, β) : α, β), và với σ ∈ intQ, đặt

b

Nếu 06= τ ∈ Q∗ thế thì τ σ > 0. Bây giờ xét các bài toán sau: (OP(α, β)) W M INxmb(x;α, β), −eg(x :α) ∈ T; (OP(α, β)τ) M INxτme(x;α, β), −eg(x : α) ∈ T. Mệnh đề 2.2

Giả sử g là Lipschitz địa phương; x¯là cực tiểu địa phương của bài toán (OP (0,0):τ), và các giả thiết của Mệnh đề 2.1 đúng. Khi đó, mb(x;α, β)

đạt cực tiểu địa phương yếu, với ràng buộc −eg(x : α) ∈ T, tại điểm

x = xb(α, β), trong đó xb(α, β) →x¯ khi α, β → 0.

Chứng minh

Theo Mệnh đề (2.1), bài toán (IP (α, β)) đạt cực đại địa phương yếu

b

y(x;α, β) trong đó yb(.;., .) là Lipschitz tại (¯x; 0,0). Từ (2.2) và tất cả giả thiết của [6, Bổ đề 3] thỏa mãn cho bài toán (OP (α, β);τ). Vì vậy, τxb(.: α, β) đạt cực đại địa phương với ràng buộc −ge(x : α) ∈ T, tại điểm

b

x(α, β), trong đó bx(α, β) → x¯ khi α, β → 0. Khi đó, bx(α, β) là cực tiểu địa phương yếu của bài toán (OP (α, β)).

2.1.2 Làm trơn hàm lồi bất biến địa phương

Hàm khả vi F : Rn → Rr là lồi bất biến tại p ∈ Rn theo nón thứ tự Q⊂ Rn nếu với tồn tại hàm η(x, p) sao cho

(∀x)F(x)−F(p)−F0(p)η(x, p) ∈ Q.

Ta có thể giả sử rằng, với p cố định , η(x, p) =x−p+o(||x−p||). Vì thế, η(., p) liên tục, và η(p, p) = 0. Hàm Lipschitz F : Rn → Rr là Q- lồi

bất biến tại p nếu

(∀x)(∀ξ ∈ F(p))F(x)−F(p)−ξη(x, p) ∈ Q,

trong đó ∂F(p) là Jacobian suy rộng Clarke của F tại p. Theo định lý Rademacher F khả vi trừ ra tập N0 của độ đo Lebesgue 0.

Định nghĩa 2.1

Hàm Lipschitz F : R → Rr là Q- quy lồi bất biến ở gần p, nếu tồn tại hàm liên tục η(., .) sao cho với mỗi u trong lân cận nào đó của p và

u 6∈ N0,

(∀x)F(x)−F(u)−F0(u)η(x−u+ p, p) ∈ Q.

Rõ ràng là Q- quy lồi bất biến ở gần p kéo theo Q- bất biến tại p.

Mệnh đề 2.3

Giả sử F(.) là Q- quy lồi bất biến ở gần p. Khi đó, hàm trơn sau đây là Q− lồi bất biến tại p: (adsbygoogle = window.adsbygoogle || []).push({});

F(x, α) :=

Z

Rn

F(x−s)φ(s|α)ds,

trong đó φ được chọn trong phần 2.1.1, với hàm scale như F(.) khi α là đủ nhỏ.

Nhận xét 2.1

Kết luận này không đúng nếu giả thiết "Q- lồi bất biến ở gần p" được thay bằng lồi bất biến tại mỗi điểm trong lân cận của p, bởi vì tổng của hàm lồi bất biến không nhất thiết là lồi bất biến nếu các hàm scale khác nhau.

Đặc biệt, với C1- hàm F, nếu tính lồi bất biến tại p được tăng cường thành

trong đó σ ∈ Q thì F- bất biến ở gần p. Khi đó,

(∀x)F(x)−F(p)−F0(p)η(x, p) ∈ intQ, cho nên với δ đủ nhỏ,

(∀x)(∀u,||u−p|| < δ) F(x)−F(u)−F0(u)η(x−u+p, p) ∈ Q. Với hàm F lớp C∞, để đơn giản lấy p= 0 và F(p) = 0 và xét

F(z) = Az+ 1 2z TB.z; và η(z,0) = z+ 1 2z TD.z.

Ở đây B. là tập các ma trận Hessian thành phần Bk của F, và một cách tương tự cho D.. Khi đó, theo định nghĩa của tính lồi bất biến ở gần 0 đòi hỏi ma trận B.−(A−uTB.)D. bán xác định dương, khi ||u− || đủ nhỏ, ở đây AD. biểu diễn ma trận P

sAskDk. Vì thế ma trận B.−AD. phải xác định dương, và kéo theo F trở thành lồi bất biến ở gần 0.

Chứng minh của Mệnh đề 2.3

Sử dụng tính khả vi của F(. :α) và tính chất Lipschitz của F(.) ta có F0(x, α) :=

Z

Rn

F0(x−s)φ(s|α)ds,

bởi vì F0(x−s) chỉ không xác định trên tập có độ đo không. Vì thế, với {uj} → p với uj 6∈ N0, và φ(.|α) ≥0 ta có F(uj +y : α)−F(uj : α)−F0(uj : α)η(p+y, p) = Z Rn [F(uj +y −s)−F(uj −s)−F0(uj −s)η(p+y, p)]φ(s|α)ds với [...] ∈ Q với hầu hết s, với uj và uj −s ở trong một lân cận của p. Do đó,

Vì vậy,

F(p+ y :α)−F(p : α)−F0(p : α)η(p+y, p) ∈ Q. Nhận xét

Giả sử F : R → Rr (ở đây r < n) là lồi bất biến tại mỗi điểm trong hình cầu B tâm p, theo nón thứ tự Q ⊂Rr. Nếu F là khả vi tại u ∈ B|{p} thì F(u+z :α)−F(u : α) = Z [F(u+ z−s)−F(u−s)]φ(s|α)ds = Z F0(u−s)ω(z, u−s)φ(s|α)ds = F0(u|α)θ(z, u) (ở đây ω(z, u−s) := η(z+u−s, s)),

nếu tồn tại θ(z, u) thỏa mãn phương trình tuyến tính:

Mθ(z, u) ≡ " Z F0(u−s)φ(s|α)ds]θ(z, u) = Z F0(u−s)ω(z, u)−φ(s|α)ds. Xét giả thiết sau: với mỗi δ > 0 đủ nhỏ, tồn tại s, với ||s|| < δ sao cho F0(u −s) có hạng đầy. Điều này kéo theo, tồn tại hàm φ(.) ≥ 0 với giá nằm trong hình cầu bán kính δ, sao cho M có hạng đầy. Vì vậy, θ(z, u)

tồn tại, và θ(z, p) là giới hạn của nó. Vì vậy, F(. : α) là lồi bất biến. Nếu f khả vi tại p, và p là điểm Karush- Kuhn- Tucker làm cực tiểu hàm F1(.) sao cho Fj(.) ≤ 0(j = 2,3, ..., r), thì F0(p) không có hạng đầy, nhưng F0(p−s) có thể có hạng đầy, với ||s|| > 0 đủ nhỏ.

2.2 Điều kiện cần cho minimax

Giả sử bài toán trong của (WMM1):

đạt cực đại địa phương (không duy nhất) tại y = yb(x), với yb(¯x) = ¯y và các ràng buộc của (IPx¯) là tích cực tại y. Theo [10], ta xây dựng bài toán¯ (M Px¯) bằng cách thêm p−k ràng buộc vào (IPx¯):

φ(j)(y−y¯) := aTj (y−y¯)+1 (adsbygoogle = window.adsbygoogle || []).push({});

2(y−y¯)TAj(y−y¯) ≤ 0 (j = 1,2, ..., p−k). (2.5) Ma trận Aj chọn (xem [10]) sao cho φ(j) thỏa mãn tính chất lồi bất biến. Khi đó, y¯ cũng là cực đại yếu của (M Px¯). Tương tự, các hàm:

ψ(j)(y −y¯) := bTj(y −y¯) + 1

2(y−y¯)TBj(y−y¯) 5 0 (j = 1,2, ..., s−l)

được chọn trong Định lý 2.2, với Bj được chọn để thỏa mãn tính chất lồi bất biến. Chú ý rằng φ(j)(0) = 0 và ψ(j)(0) = 0.

Với giả thiết của Mệnh đề 2.1, bài toán trơn (IP(α, β)) đạt được cực đại địa phương yếu tại y = yb(x;α.β), trong đó yb(.;., .) thỏa mãn điều kiện Lipschitz. Ta xét dạng trơn của bài toán (M Px):

W M AXyf(x, y : α, β), (2.6)

(M IP(α, β)) : −eh(j)(y : β ≤ 0) (i = 1,2, ..., p)

φ(j)(y −yb(x;α, β)) ≤0 (j = 1,2, .., p−k). Khi đó, by(x;α, β) cũng là cực đại địa phương yếu của (M IP(α, β)). Với điều kiện chính quy thì điều kiện Karush- Kuhn- Tucker yếu [5, định lí 1] đúng: (WKT) τ(x :α, β)fy(x,yb(x : α, β) : α, β) = X j λj(x :α, β)ehj(j)(yb(x;α, β) : β) +X j µj(x;α, β)aTj ; λi(x;α, β)eh(i)(yb(x;α, β) : β) = 0,

với các nhân tử Lagrangian không âm τ(x;α, β), λj(x;α, β), µj(x;α, β)

nào đó. Lấy tổng P

j trên các ràng buộc tích cực ( h(i)(¯y) = 0), và P

j = 1, ..., k −p. Định lí 2.1

Giả sử (¯x,y¯) là minimax địa phương yếu của bài toán (WMM1). Giả sử rằng:

(i) Giả thiết của các Mệnh đề 2.1 và 2.2 là đúng;

(ii) Với mỗi ξi ∈ ∂h(i)(¯y) mà h(i)(¯y) = 0, tập các gradient ξi cùng với gradient aTj(j = 1, ..., p − k) của ràng buộc đã thêm vào, là tập độc lập tuyến tính;

(iii) Hàm vectơH(.)bao gồm −f(x, .),h(i)(.) màh(i)(¯y) = 0, và φ(i)(.)(j = 1,2, ..., k−p), là Q×Rp- lồi bất biến ở gần mỗi điểm y0 trong lân cận của

¯

y, khi ||x−x¯|| là đủ nhỏ;

(iv) Các nhân tử Lagrangian trong (WKT) là liên tục tại (¯x,0,0); (v) Các nhân tử Lagrangian trong (OP(α, β)) là liên tục tại (0,0); (vi) (∀η ∈ ∂g(¯x))0∈ int[g(Cx) +η(Rn) +T].

Khi đó, với nón cơ bản K ⊃Q và với δ > 0 nào đó,

(∀x,−g(x) ∈ T),||x−x¯||< δ)(∃∧b(x) ∈ L(Rp+, K)), c M(x) ∈ L(Rp−k+ , K),bπ ∈ L(T−g(¯x), Q),ξb∈ ∂xf(¯x,y¯),ηb∈ ∂g(¯x), 0∈ ∂y[f(x,by(x))−∧bh(yb(x))]−Mc(x)a; b ∧(x)h(yb(x)) = 0; ran[ξb+πbηb] ⊂U. Chứng minh

Từ (iii) và Mệnh đề 2.3, hàm vectơ Hb(.) bao gồm hàm mục tiêu −f(x, . : α, β),eh(i)(.;β) mà h(i)(¯y) = 0, và φ(i)(.) (j = 1,2, .., k − p)

nhỏ. Từ Mệnh đề 2.1, bài toán (IP(α, β)) đạt được cực đại địa phương yếu tại y = yb(x;α, β) khi α và β và ||x−x¯|| là đủ nhỏ.

Từ (ii), điều kiện ổn định Robinson (xem [14] và [16]) đúng cho(IP Cx). Bởi vì điều kiện này đòi hỏi 0 thuộc phần trong của một tập bao gồm các gradients, dưới vi phân suy rộng Clarke mà nó là nửa liên tục trên cho nên, điều kiện ổn định mở rộng được cho (M IP(α, β)) với ||x − x¯|| đủ nhỏ. Khi đó, ta áp dụng [10, Mệnh đề 1] cho (M IP(α, β)) mà nó đòi hỏi giả thiết tính lồi bất biến (iii), sẽ tồn tại nón cơ bản K ⊃ Q sao cho các điều kiện Karush- Kuhn- Tucker mạnh đúng:

fy(x,yb(x;α, β) : α, β)− ∧(x;α, β)hey(yb(x;α, β) : β)−M(x;α, β)α = 0;

(2.7) ∧(x;α, β)eh(ye(x;α, β) : β) = 0,

với các nhân tử Lagrangian

∧ (x;α, β) ∈ L(Rp+, K)

và M(x;α, β) ∈ L(Rp−k+ , K).

Theo Mệnh đề 2.2, hàmmb(., α, β)đạt được cực tiểu địa phương yếu với ràng buộc −eg(.;α) ∈ T tại xb(α, β), trong đó xb(α, β) → x¯ khi α, β → 0. Từ (vi), hàm trơn eg thỏa mãn điều kiện Robison: (adsbygoogle = window.adsbygoogle || []).push({});

0 ∈ int[eg(¯x;α) +egx(¯x;α)(Rn) +T] khiα đủ nhỏ.

Từ [6, Định lý 1] ta suy ra tồn tại nhân tử Lagrangian π(α, β) ∈

L(Rs,Rr) thỏa mãn

ran[mbx(¯x;α, β) +π(α, β)egx(¯x;α)] ⊂ U;

π(α, β)(T−

e

Từ [11, Mệnh đề 2] ta suy ra

mx(¯x;α, β) =fx(¯x,y¯: α, β). Do đó,

ran[fx(¯x,y¯: α, β) +π(α, β)egx(¯x;α) ⊂U. (2.8) Cho α, β → 0 ta có ∧(x;α, β) → ∧e(x) và M(x;α, β) → Mf(x) (các giới hạn này tồn tại do (iv)), π(α, β) → π¯ (do giả thiết (v)). Vế trái của (2.7) tiến đến một phần tử của∂y(f−∧b(x)h−Mc(x)a)(x,yb(x)), fx(¯x,y¯;α, β)

và egx(¯x, α) tến đến các phần tử của ∂xf(¯x,y¯) và ∂g(¯x). Vì thế kết quả đạt được suy ra khi lấy giới hạn từ (2.7) và (2.8). Nhận xét 2.3

Nếu giả thiết (vi) thay thế bởi giả thiết: với mỗi ηj ∈ ∂gi(¯x), tập các ηi của ràng buộc tích cực cùng với bTj (j = 1,2, ..., s −l) là độc lập tuyến tính, thì kết luận đúng; trong đó bao hàm thức ran[ ¯ξ+ ¯πη¯] ⊂ U được thay thế bởi:

0∈ ∂x[f(¯x,y¯) + ¯πg(¯x)] + ¯Ξb,

¯

πg(¯x) = 0,

trong đó π¯ ∈ L(Rs+, H),Ξ¯ ∈ L(Rs−l, H), H là nón cơ bản thỏa mãn Q⊂ K ⊂H.

Định lý 2.1 giả sử rằng các nhân tử Lagrangian là các hàm liên tục

Một phần của tài liệu Phương pháp xấp xỉ trơn cho bài toán tối ưu không trơn (Trang 26 - 50)