Chương 3. ỨNG DỤNG CỦA JACOBIAN XẤP XỈ 56 3.1. Bài toán tối ưu tổng quát
3.5. Điều kiện tối ưu cấp hai của bài toán tối ưu vectơ
Trong mục này ta sử dụng khái niệm Jacobian xấp xỉ và Hessian xấp xỉ của ánh xạ để xây dựng một số điều kiện cần, điều kiện đủ cấp 2 về sự tồn tại nghiệm hữu hiệu (hữu hiệu yếu) của bài toán tối ưu liên quan tới các hàm khả vi liên tục trong không gian hữu hạn chiều.
Trước hết ta nhắc lại một số khái niệm và kí hiệu cần thiết sau: Cho A ⊆ Rn là tập con khác rỗng. Nón lùi xa của tập A, kí hiệu A∞, là tập hợp tất cả các giới hạn lim
i→∞tiai, với ai ∈ A, và {ti} là dãy số dương tiến dần tới không. Từ định nghĩa, ta thấy ngay một tập hợp là giới nội khi và chỉ khi nón lùi xa của nó chỉ gồm một phần tử {0}.
Các phần tử nón lùi xa của Hessian xấp xỉ ∂2f(x) được gọi là ma trận Hessian lùi xa.
Cho D ⊂ Rn là tập con khác rỗng và x0 ∈ D. Nón tiếp tuyến cấp 1, kí hiệu T1(D, x0), và nón tiếp tuyến cấp 2, kí hiệu T2(D, x0), của D tại x0
được định nghĩa như sau:
T1(D, x0) = {u∈ Rn :∃ti > 0, xi = x0 +tiu+o(ti) ∈ D}, T2(D, x0) =
(u, v) ∈ Rn ×Rn : ∃ti > 0, xi = x0 +tiu+ 1
2t2iv +o(t2i) ∈ D
. Đặt
Λ = n
ξ ∈ C/ : kξk = 1o , với C/ là nón cực của nón C trong Rm và δ > 0,
Dδ(x0) = {t(x−x0) : t ≥0, x ∈ D, kx−x0k ≤ δ}. Ta xét bài toán tối ưu không ràng buộc
s.t.xmin∈Df(x), (P)
với f : Rn → Rm là hàm liên tục, D ⊆ Rn là tập hợp khác rỗng và Rm được sắp thứ tự bởi nón lồi đóng, nhọn C có intC 6= φ. Ta nói rằng, x0 là nghiệm hữu hiệu (hữu hiệu yếu) của bài toán (P), nếu
f (D) ∩(f (x0)−C) = {f (x0)},
(tương ứng f (D)∩(f (x0)−intC) = {φ}).
Ta có điều kiện cần cấp hai cho bài toán (P) như sau:
Định lí 3.5.1. Giả thiết rằng, f là hàm khả vi liên tục, x0 ∈ D là nghiệm hữu hiệu yếu địa phương của (P) và ∂2f là ánh xạ Hessian xấp xỉ của f, là nửa liên tục trên. Khi đó, với mỗi (u, v) ∈ T2(D, x0), ta khẳng định:
i) Tồn tại λ ∈ Λ sao cho
hλ,∇f (x0) (u)i ≥ 0.
ii) Nếu ∇f (x0) (u) = 0, tồn tại λ/ ∈ Λ sao cho Dλ/,∇f (x0) (v) +M (u, u)E
≥ 0, với M nào đó thuộc co ∂2f (x0)
, hoặc Dλ/, M∗(u, u)E
≥ 0, với M∗ nào đó thuộc co∂2f (x0)
∞\ {0}.
Hơn nữa, nếu nónC là nón đa diện thì (i) đúng và nếuhλ,∇f (x0) (u)i ≥ 0, thì bất đẳng thức (ii) cũng đúng, với λ/ = λ.
Chứng minh: Lấy (u, v) ∈ T2(D, x0), ta có xi = x0 +tiu+ 1
2t2iv +o(t2i) ∈ D, (3.3)
trong đó {ti} là một dãy số dương tiến tới 0. Vìx0 là nghiệm hữu hiệu yếu địa phương, nên tồn tại i0 ≥ 1 sao cho
f (xi)−f (x0) ∈ (−intC)c, i ≥i0. (3.4) Do f khả vi liên tục, ta có thể viết
f (xi)−f (x0) = ∇f (x0) (xi−x0) +o(xi −x0). Kết hợp với (3.4) ta suy ra
∇f (x0) (u) ∈ (−intC)c.
Điều này chứng tỏ tồn tại λ ∈ Λ sao cho
hλ,∇f (x0) (u)i ≥ 0.
Giả sử ∇f (x0) (u) = 0. Do ∂2f là nửa liên tục trên tại x0, nên với ε > 0, tồn tại δ > 0 sao cho
∂2f (x) ⊆ ∂2f (x0) +εB, với mọi x mà kx−x0k < δ.
B là hình cầu đơn vị đóng trong không gian L(Rn, L(Rn, Rm)). Do đó, tồn tại i1 ≥i0 sao cho
co∂2f [x0, xi] ⊆ co ∂2f (x0)
+ 2εB, với mọi i ≥ i1. Tiếp theo, áp dụng khai triển Taylor ta tìm được Mi ∈ co ∂2f (x0)
+ 2εB sao cho
f (xi)−f (x0) = ∇f (x0) (x−x0) + 1
2Mi(xi −x0, xi −x0), i ≥ i1. Thay (3.3) vào đẳng thức trên, ta suy ra
f (xi)−f (x0) = 1
2t2i (∇f (x0) (v) +Mi(u, v)) +αi, với
αi = 1 2Mi
1
2t2iv+o t2i
, tiu+ 1
2t2iv +o t2i
+∇f (x0) o t2i . Kết hợp với (3.4), ta được
∇f (x0) (v) +Mi(u, v) + αi
t2i ∈ (−intC)c, i ≥ i1. (3.5)
Xét dãy {Mi}. Nếu dãy {Mi} là giới nội, ta có thể giả thiết rằng, {Mi} tiến tới M0, với M0 ∈ co∂2f (x0) + 2εB. Vì αt2i
i → 0 khi i → ∞ và (3.4), ta suy ra
∇f (x0) (v) +M0(u, v) ∈ (−intC)c.
Do ε là bất kì, ta khẳng định tồn tại M ∈ co∂2f (x0) sao cho
∇f (x0) (v) +M (u, u) ∈ (−intC)c.
Điều này tương đương với việc tồn tại λ/ ∈ Λ sao cho Dλ/,∇f (x0) (v) +M (u, u)E
≥ 0.
Nếu dãy {Mi} không giới nội, tức là lim
i→∞kMik= ∞, ta có thể giả thiết
ilim→∞
Mi
kMik = M∗ ∈ co∂2f (x0)
∞\ {0}.
Bằng cách chia (3.5) cho kMik và qua giới hạn khi i → ∞, ta được M∗(u, u) ∈ (−intC)c.
Điều này chứng tỏ tồn tại λ/ ∈ Λ sao cho Dλ/, M∗(u, u)E
≥ 0.
Bây giờ giả sử C là nón đa diện. Từ (3.4) suy ra tồn tại λ ∈ Λ sao cho Dλ/, f (xi)−f (x0)E
≥ 0, i ≥ i0.
Bằng cách lấy dãy con, ta có thể giả thiết điều này đúng với mọi i = 1,2, ....
Vì f là khả vi liên tục nên
hλ,∇f (x0) (u)i ≥ 0.
Khi hλ,∇f (x0) (u)i = 0, bằng cách lí luận như ở trên, ta tìm được Mi ∈ co∂2f (x0) + 2εB sao cho
0 ≤ hλ, f (xi)−f (x0)i =
λ, 1
2t2i (∇f (x0) (v) +Mi(u, v)) +αi
. Hai bất đẳng thức của (ii) cũng đúng khi thay λ/ = λ.
Các định lí sau cho ta điều kiện đủ cấp hai.
Định lí 3.5.2. Cho f là hàm khả vi liên tục và ∂2f, Hessian xấp xỉ của f, là ánh xạ nửa liên tục trên tại x0 ∈ D. Một trong các điều kiện sau là điều kiện đủ để x0 là nghiệm hữu hiệu địa phương duy nhất của (P):
i) Với mỗi u ∈ T1(D, x0)\ {0}, tồn tại ξ ∈ Λ sao cho hξ,∇f (x0) (u)i > 0.
ii) Tồn tại δ > 0 sao cho, với mỗi v ∈ Dδ(x0), và u ∈ T1(D, x0), ta có hξ0,∇f (x0) (v)i ≥ 0, với ξ0 nào đó thuộc Λ,
hξ, M (u, u)i > 0, với mọi ξ ∈ Λ, và
M ∈ co∂2f (x0)∪
co∂2f (x0)
∞\ {0} .
Chứng minh: Giả sử ngược lại, x0 không là nghiệm hữu hiệu địa phương duy nhất của (P). Khi đó, tồn tại xi ∈ D, xi →x0, sao cho
f (xi)−f (x0) ∈ −C. (3.6) Ta có thể giả thiết
xi−x0
kxi−x0k → u ∈ T1(D, x0),khii → ∞.
Bằng cách chia (3.6) cho kxi−x0k và chuyển qua giới hạn, ta suy ra
∇f (x0) (u) ∈ −C.
Điều này mâu thuẫn với i). Điều kiện đủ thứ nhất được chứng minh.
Xét điều kiện đủ thứ hai. Với ε > 0 cho trước, áp dụng khai triển Taylor, ta tìm được Mi ∈ co ∂2f (x0)
+ 2εB sao cho f (xi)−f (x0) =∇f (x0) (x−x0) + 1
2Mi(xi−x0, xi−x0). (3.7) Từ bất đẳng thức thứ nhất của ii), ta có
∇f (x0) (xi −x0) ∈ (−intC)c, với i đủ lớn.
Với mỗi i tồn tại ξi ∈ Λ sao cho
hξi,∇f (x0) (xi −x0)i ≥ 0. (3.8) Từ (3.6) suy ra
hξi, f (xi)−f (x0)i ≤ 0.
Kết hợp (3.7) và (3.8), ta được
hξi, Mi(xi−x0, xi −x0)i ≤ 0, với i đủ lớn.
Hơn nữa, do Λ là compact, ta có thể giả thiết ξi → ξ ∈ Λ. Xét các trường hợp {Mi} như ở Định lí 3.5.1, ta suy ra
hξ, M (u, u)i ≤ 0, vớiM nào đó thuộcco∂2f (x0)∪
co∂2f (x0)
∞\ {0}
.Điều này mâu thuẫn với giả thiết ii). Định lí được chứng minh.
Định lí 3.5.3. Cho f là hàm khả vi liên tục với ∂2f, Hessian xấp xỉ của f. Nếu tồn tại δ > 0 sao cho, với mọi v ∈ Dδ(x0),
hξ0,∇f (x0) (v)i ≥ 0, với ξ0 ∈ Λ và
hξ, M (v, v)i ≥ 0, với mọi ξ ∈ Λ, M ∈ ∂2f(x), với kx−x0k < δ, thì x0 là nghiệm hữu hiệu yếu địa phương của (P).
Chứng minh: Giả sử x0 không là nghiệm hữu hiệu yếu địa phương của (P). Khi đó, tồn tại x ∈ D, với kx−x0k ≤ δ, sao cho
f (x)−f (x0) ∈ −intC (3.9)
Lấy v = x−x0, ta suy ra v ∈ Dδ(x0). Từ các bất đẳng thức trên ta khẳng định
∇f (x0) (v) ∈ (−intC)c,
M (v, v) ∈ C, với mọi M ∈ ∂2f(x), kx−x0k < δ.
Vì C là nón lồi, đóng, nên từ các bao hàm thức trên ta kết luận co∂2f (x) ⊆C.
Và khai triển Taylor cho ta
f (x)−f (x0) ∈ ∇f (x0) (v) + 1 2co
∂2f [x0, x] (v, v)
⊆ (−intC)c +C ⊆(−intC)c. Điều này trái với (3.9). Định lí được chứng minh.
Xét bài toán tối ưu có ràng buộc
minx∈D f(x), (CP) với D là tập ràng buộc
D = {x ∈ Rn|g(x) ≤ 0, h(x) = 0}
và g : Rn → Rk, h : Rn → Rl là các ánh xạ cho trước. Với ξ ∈ C/, β ∈ Rk, γ ∈ Rl, hàm Lagrange được xác định:
L(x, ξ, β, γ) = hξ, f(x)i+hβ, g(x)i+hγ, h(x)i. Đặt
D0 =
x ∈ Rn : gi(x) = 0, nếu βi > 0, gi(x) ≤ 0, nếu βi = 0; h(x) = 0 . Với(ξ, β, γ)cho trước, ta viết L(x)thay choL(x, ξ, β, γ) và ∇Llà gradient của L(., ξ, β, γ) theo biến x. Ta có điều kiện cần cấp hai sau đây.
Định lí 3.5.4. Giả sử rằng f, g, h là các hàm khả vi liên tục, C là nón đa diện lồi, ∂2L, Hessian xấp xỉ của L là nửa liên tục trên tại x0. Nếu x0
là nghiệm hữu hiệu yếu địa phương của (CP), thì tồn tại vectơ khác không (ξ0, β, γ) ∈ C/ ×Rk+×Rl sao cho
∇L(x0, ξ0, β, γ) = 0
và với mỗi (u, v) ∈ T2(D0, x0), tồn tại ξ ∈ Λ sao cho
∇L(x0, ξ, β, γ) (u) ≥ 0.
Trong trường hợp ∇L(x0, ξ, β, γ) (u) = 0, ta có
∇L(x0, ξ, β, γ) (v) + M (u, u) ≥ 0, với M nào đó thuộc co∂2L(x0, ξ, β, γ), hoặc
M∗(u, u) ≥0, với M∗ nào đó thuộc co∂2L(x0, ξ, β, γ)
∞\ {0}.
Chứng minh:Ta dễ dàng thấy rằng, với nón lồi đóng, có phần trong khác rỗng C và x0 là nghiệm hữu hiệu yếu của bài toán (CP), tồn tại (ξ0, β, γ) để
∇L(x0, ξ0, β, γ) = 0.
Lấy (u, v) ∈ T2(D0, x0) và
xi = x0 +tiv + 1
2t2iv +o t2i
∈ D0, với ti > 0, khi i → ∞.
Vì x0 là nghiệm hữu hiệu yếu địa phương của bài toán (CP), nên tồn tại i0 ≥ 1 sao cho
f (xi)−f (x0) ∈ (−intC)c, với mọi i ≥i0. Hơn nữa, do C là đa diện, nên tồn tại ξ ∈ Λ sao cho
hξ, f(xi)−f(x0)i ≥ 0 (3.10)
với i đủ lớn. Ta có thể giả thiết điều này đúng với mọi i ≥ i0. Vì ∂2L là nửa liên tục trên tại x0, với ε > 0 tùy ý cho trước, áp dụng khai triển Taylor cho L ta tìm được
Mi ∈ co∂2L(x0) + 2εB sao cho
L(xi)−L(x0) = ∇L(x0) (xi−x0) + 1
2Mi(xi −x0, xi −x0), với i đủ lớn. Thay biểu thức
xi −x0 = tiu+ 1
2t2iv +o t2i
vào đẳng thức trên và sử dụng bất đẳng thức (3.10), ta được 0≤ ti∇L(x0) (u) + t2i
2 (∇L(x0) (v) +Mi(u, u)) +αi, trong đó
αi = 1 2Mi
1
2t2iv +o t2i
, tiu+ 1
2t2iv+o t2i
+1 2Mi
tiu, 1
2t2iv+o t2i
+ ∇L(x0) o t2i .
Chia bất đẳng thức này cho ti và lấy giới hạn khi ti → 0, ta được
∇L(x0) (u) ≥ 0.
Khi ∇L(x0) (u) = 0, từ bất đẳng thức trên, ta có 0≤ ∇L(x0) (v) +Mi(u, u) + αi
t2i .
Bằng cách lập luận tương tự như Định lí 3.5.1, ta chứng minh được các bất đẳng thức còn lại. Định lí được chứng minh.
Ta có điều kiện đủ sau cho bài toán có ràng buộc.
Định lí 3.5.5. Giả sử rằng f, g, h là các hàm khả vi liên tục và, với mỗi u ∈ T1(D, x0)\ {0}, tồn tại bộ (ξ, β, γ) ∈ Λ×R+k ×Rl sao cho
∇L(x0, ξ0, β, γ) = 0,hβ, g(x0)i = 0, M (u, u) > 0, với mọi M ∈ co∂2L(x0)∪ co∂2L(x0)
∞\ {0} ,
và ∂2L, Hessian xấp xỉ của L, là nửa liên tục trên tại x0. Khi đó, x0 là nghiệm hữu hiệu địa phương duy nhất của (CP).
Chứng minh: Nếu x0 không là nghiệm hữu hiệu địa phương duy nhất của (CP), thì tồn tại xi ∈ D, xi →0, sao cho
f (xi)−f (x0) ∈ −C.
Ta có thể giả thiết
xi−x0
kxi−x0k →u ∈ T1(D, x0). Từ đó suy ra
L(xi)−L(x0) ≤ 0, với mọi i ≥ 1.
Sử dụng khai triển Taylor cho L và tính nửa liên tục trên của ∂2L, ta được L(xi)−L(x0)− ∇L(x0) (xi−x0) ∈ 1
2co ∂2L[x0, xi] (xi−x0, xi−x0)
⊆ 1
2 co∂2L(x0) +kxi−x0k.B
(xi −x0, xi−x0), với i đủ lớn. Hệ thức này chứng tỏ
Mi(xi−x0, xi−x0) ≤ 0, với
Mi ∈ co∂2L(x0) +kxi −x0kB
và i đủ lớn. Bằng cách lập luận tương tự như chứng minh định lí 3.5.1, ta suy ra tồn tại ma trận
M ∈ co∂2L(x0)∪ co∂2L(x0)
∞\ {0} sao cho
M (u, u) ≤ 0.
Điều này trái với giả thiết. Ta có định lí được chứng minh.
Định lí 3.5.6. Giả sử f, g, h khả vi liên tục và tồn tại δ > 0 sao cho với mỗi v ∈ Dδ(x0), tồn tại vectơ (ξ, β, γ) ∈ Λ×R+k ×Rl và Hessian xấp xỉ
∂2L(., ξ, β, γ) của L để
∇L(x0, ξ, β, γ) = 0,hβ, g(x0)i = 0,
M (u, u) ≥ 0, với mọi M ∈ ∂2L(x, ξ, β, γ),kxi −x0k ≤ δ.
Khi ấy, x0 là nghiệm hữu hiệu yếu địa phương của (CP) Định lí này được chứng minh tương tự như định lí 3.5.2.
Trong phần cuối mục này ta đưa ra ví dụ minh họa cho Định lí 3.5.4 về điều kiện cần của bài toán tối ưu có ràng buộc. Các định lí khác về điều kiện đủ có thể xây dựng tương tự.
Xét bài toán tối ưu hai mục tiêu sau:
s.t.−minx2+y4≤0
x, x43 −y4 .
Không gian R2 được sắp thứ tự từng phần bởi nón R2+.
Ta thấy rằng (0, 0) là nghiệm hữu hiệu địa phương của bài toán. Lấy
ξ0 = (0, 1) và β = 1, hàm Lagrange của bài toán là
L((x, y), ξ0, β) =x43 −y4 −x2 +y4 = x43 −x2. Từ đó suy ra
L((0,0), ξ0, β) = (0, 0). Và tập D0 được xác định:
D0 =
(x, y) ∈ R2 : x2 = y4 .
Lấy u = (0, 1) và v = (−2,0). Hiển nhiên (u, v) ∈ T2(D0,(0,0)). Như vậy, theo định lí 3.5.4, tồn tại ξ = (ξ1, ξ2) ∈ R2+, với kξk = 1, sao cho
∇L((0,0), ξ, β) (u) ≥ 0.
Bằng tính toán ta có
∇L((0,0), ξ, β) = (ξ1,0), cho nên
∇L((0,0), ξ, β) (u) = 0.
Như vậy, kết luận trên là đúng. Hơn nữa, bất đẳng thức trên xảy ra dấu bằng, nên tồn tại M ∈ co∂2L(0,0), hoặc M∗ ∈ co∂2L(x0)
∞\ {0} thỏa mãn kết luận còn lại của định lí 3.5.4. Với ξ như trên, ta chọn ξ2 > 0 và định nghĩa
∂2L(x, y) =
4
9ξ2x−23 −2 0
0 12 (1−ξ2)y2
, với x 6= 0
và
∂2L(0, y) =
4
9ξ2α−2 0
0 12 (1−ξ2)y2 − α1
, với α ≥ 9 ξ2
.
Khi đó ánh xạ đa trị (x, y) →∂2L(x, y) là ánh xạ Hessian xấp xỉ của L và nó là nửa liên tục trên tại (0,0). Hơn nữa, với mỗi M ∈ co∂2L(0,0), ta có:
∇L(0,0) (v) +M (u, u) = −2ξ1− 1 α < 0.
Như vậy, bất đẳng thức thứ nhất của điều kiện cấp hai của định lí không đúng.
Do
∂2L(0,0) =
4
9ξ2α−2 0 0 −α1
, với α ≥ 9 ξ2
, nên nón lùi xa của ∂2L(0,0) được xác định bởi:
∂2L(0,0)
∞ =
α 0 0 0
, α ≥ 0
. Lấy
M∗ =
1 0 0 0
∈ co∂2L(0,0)
∞\ {0},
ta có M∗(u, u) ≥ 0. Như vậy, điều kiện còn lại của định lí cũng đúng.
KẾT LUẬN
Luận văn đã trình bày lý thuyết về Jacobian xấp xỉ của hàm liên tục trong không gian hữu hạn chiều. Sử dụng Jacobian xấp xỉ ta đã xây dựng được một số kiện cần và đủ cấp hai cho bài toán tối ưu đối với hàm vectơ khả vi liên tục trong không gian hữu hạn chiều.
Có thể nói Jacobian xấp xỉ là một công cụ hữu hiệu được ứng dụng trong bài toán tối ưu.Việc nghiên cứu Jacobian xấp xỉ đã mở rộng, thống nhất và làm sâu sắc nhiều kết quả trong giải tích không trơn và tối ưu hoá.
Tuy nhiên, ngoài những vấn đề đã đề cập trong luận văn, Jacobian xấp xỉ còn được dùng trong một số khía cạnh khác, như dùng Jacobian xấp xỉ có thể đặc trưng cho tính tựa lồi, tính lồi, tính đơn điệu của hàm liên tục.Và còn rất nhiều câu hỏi được đặt ra đối với Jacobian xấp xỉ, chẳng hạn như có thể mở rộng các khái niệm và kết quả đã có trong không gian vô hạn chiều được không?...Đó là các vấn đề cần tiếp tục nghiên cứu.