Cho C ⊂ X, fi :X →R, i= 0,1, ..., N. Xét bài toán tối ưu hóa sau: P : minf0(x)
với điều kiện:
fi(x) ≤ 0, i = 1,2, ..., M fi(x) = 0, i = M + 1, ..., N x ∈ C.
Như thường lệ, các nhân tử tương ứng với các ràng buộc bất đẳng thức là không âm, các nhân tử tương ứng với các ràng buộc đẳng thức thì không có điều kiện gì. Để đơn giản hóa kí hiệu ta đưa vào các đại lượng τi, i = 0, N. Trong đó các τi ứng với các ràng buộc bất đẳng thức
và hàm mục tiêu luôn bằng 1, tức là τi = 1,∀i = 0, M (chúng tương ứng với các nhân tử không âm), các τi ứng với các ràng buộc đẳng thức hoặc bằng 1 hoặc bằng −1 (ứng với các nhân tử có dấu bất kỳ), tức là
τi ∈ {1,−1}, i= M + 1, N.
Định lý 2.3 (Quy tắc nhân tử hóa mờ, [6], Định lý 3.1). Cho C là một tập con đóng của X, fi là các hàm l.s.c. với i = 0, M , fi liên tục với
i = M + 1, N , x là một nghiệm địa phương của P. Giả sử
lim inf x→x d(D−fi(x),0)> 0, i = 1, M , lim inf x→x d(D−fi(x)∪D−(−fi) (x),0) > 0, i = M + 1, N (2.5)
Khi đó với mọi ε > 0, mọi lân cận yếu V của 0 trong X∗, đều tồn tại (xi, fi(xi)) ∈ (x, fi(x)) +εBX×R, i= 0, N và xN+1 ∈ x+εBX sao cho 0∈ D−f0(x0) + N X i=1 µiD−(τifi) (xi) + N(C, xN+1) +V
trong đó µi > 0, i = 1, N N (C, xN+1) là nón pháp của tập C tại điểm
xN+1.
Nhận xét 2.4. (a) Dễ thấy là nếu f0 là C1 thì có thể thay D−f0(x0) trong kết luận bởi ∇f0(x).
(b) Các điều kiện (2.5) được coi là các “hạn chế ràng buộc” để bắt hệ số của D−f0 = 1. Các ràng buộc đó là không cần thiết nếu ta không cố gắng cho hệ số của D−f0 khác không. Thật vậy, nếu ràng buộc đó không đúng đối với một fi nào đó thì ta có thể gán nhân tử tương ứng với fi
đó bằng 1 còn các nhân tử khác bằng không. Khi đó ta có quy tắc nhân tử sau:
Định lý 2.5 ([6], Định lý 3.3). Cho X là không gian Banach phản xạ,
C là tập con đóng của X, fi là các hàm l.s.c. với i = 0, M , fi liên tục với i = M + 1, N . Giả sử x là một nghiệm địa phương của P. Khi đó với mọi ε > 0, mọi lân cận yếu V của 0 trong X∗, đều tồn tại (xi, fi(xi)) ∈ (x, fi(x)) +εBX×R, i= 0, N và xN+1 ∈ x+εBX sao cho 0 ∈ N X i=1 µiD−(τifi) (xi) +N (C, xN+1) +V
với µi ≥ 0, i = 0, N không đồng thời bằng 0.
Chứng minh. [Định lý 2.3] Vì x là nghiệm địa phương của P nên nó là cực tiểu địa phương của
f0 + δC∩(∩N i=1Si) = f0 + N X i=1 δSi +δC, trong đó Si = {x : fi(x) ≤ 0}, i = 1, M {x : fi(x) = 0}, i = M + 1, N Do đó 0∈ D− f0 + N X i=1 δSi +δC ! (x)
Áp dụng quy tắc tổng mờ địa phương yếu (Định lý 1.31) ta có điều kiện theo dưới vi phân của f0 và các nón pháp của Si, i = 1, N và nón pháp của C. Vấn đề còn lại là biểu diễn nón pháp của Si theo dưới vi phân của các hàm fi tương ứng. Điều này là không tầm thường và nó được cho trong hai định lý sau:
Định lý 2.6 ([6], Định lý 3.4). ChoX là không gian Banach phản xạ, f :
Khi đó hoặc (C1) : ∀ε, η > 0;∃(x, f (x)) ∈ (x, f (x)) + ηBX×R sao cho D−f (x) ∩ εBX∗ 6= ∅ hoặc (C2) : ∀ε > 0;∃(x, f(x)) ∈ (x, f (x))+εBX×R,∃ζ ∈ D−f (x) và λ >0 sao cho kλζ −ξk < ε.
Định lý 2.7 ([6], Định lý 3.5). Cho X là không gian Banach phản xạ,
f : X → R liên tục, ξ ∈ N (S, x) với S = {x : f (x) ≤0}. Khi đó hoặc (D1) : ∀ε, η > 0;∃(x, f(x)) ∈ (x, f (x)) +ηBX×R sao cho D−f (x)∪D−(−f) (x)∩ εBX∗ 6= ∅ hoặc (D2) : ∀ε > 0;∃(x, f (x)) ∈ (x, f (x)) + εBX×R, ζ ∈ D−f(x) ∪ D−(−f)(x) và λ > 0 sao cho kλζ −ξk < ε.
Dưới đây chúng ta sẽ chứng minh một dạng Định lý 2.6 và Định lý 2.7 trong không gian Hilbert bằng cách sử dụng dưới vi phân gần kề và nón pháp gần kề. Chứng minh đầy đủ của các định lý này có thể tìm thấy trong [7].
Định nghĩa 2.8. Cho X là không gian Hilbert, f :X →Rlà hàm l.s.c.,
S ⊂ X là tập con đóng. Ta nói, f là dưới khả vi gần kề với dưới đạo hàm gần kề x∗ tại x nếu tồn tại δ > 0 sao cho g(x) = hx∗, xi −δkxk2
gần kề gọi là dưới vi phân gần kề (proximal subdifferential) của f tại x
và ký hiệu là DP−f(x).
Nón pháp gần kề của một tập đóng S tại x là:
NP(S, x) := D−PδS(x).
Với định nghĩa này ta có mô hình của Định lý 2.6, 2.7 trong không gian Hilbert như sau X :
Định lý 2.9 ([6], Định lý 3.6). Cho X là không gian Hilbert, f : X →R
là hàm nửa liên tục dưới, ξ ∈ NP (S, x) với S = {x : f (x) ≤ 0}. Khi đó hoặc (C1) : ∀ε, η > 0;∃(x, f (x)) ∈ (x, f (x)) + ηBX×R sao cho DP−f (x) ∩ εBX∗ 6= ∅ hoặc (C2) : ∀ε > 0;∃(x, f(x)) ∈ (x, f (x))+εBX×R,∃ζ ∈ DP−f (x) và λ >0 sao cho kλζ −ξk < ε.
Chứng minh.Giả sử(C1)không đúng. Khi đó06∈ Dp−f(x).Lấyr, σ > 0 sao cho với mọi x ∈ S ∩ (x+ rkξkBX),
0 ≥ hξ, x−xi −σkx−xk2.
Vì f nửa liên tục dưới nên bằng cách lấy r nhỏ nếu cần, ta có thể giả sử rằng f bị chặn dưới bởi −m trên x+rkξkBX với hằng số dương m nào đó. Chọn η ∈ (0, r/4) là hằng số sao cho hξ, x−xi − σkx−xk2 dương trên (x+ 2ηξ + 2ηkξkBX)\ {x} thì f cũng dương trên đó.
Với α <min{η,1/m}, đặt
hα(x) := α−1max{0,kx−x−ηξk −ηkξk}2.
Chú ý rằnghαlà hàm trơn Lipschitz của x,tức là nó có đạo hàm Lipschitz và bằng 0 tại những x sao cho hα(x) = 0 (đặc biệt là tại x). Xét
pα(z) := f(z) +hα(z) + δx+rkξkBX(z).
Vì 0 không là một dưới đạo hàm gần kề của f tại x nên
inf
X pα < 0.
Đặteα := min{α/2,−infX pα/2}.Theo nguyên lý biến phân trơn Borwein- Preiss, Định lý 1.23 với p = 2, λ = p2eα/α ≤ 1 và ε = eα, tồn tại
yα, ωα ∈ X với kyα−ωαk < 2 sao cho
pα(yα) < inf
X pα+eα < 0 và
z 7→ pα(z) + α
2 kz −ωαk2
đạt cực tiểu toàn cục tại yα.
Vì pα(yα) < 0 nên yα ∈ x+rkξkBX và
hα(yα) ≤hα(yα) + α
2 kyα−ωαk2 < −f(yα) ≤m.
Do vậy,
kyα−x−ηξk ≤ √mα+ηkξk.
Nghĩa là yα nằm bên trong hình cầu x+ηξ + (√
Mặt khác, f(yα) < 0 (vì pα(yα) < 0) nên yα nằm ngoài hình cầu
x+ 2ηξ + 2ηkξkBX. Từ đây ta suy ra lim
α→0yα = x.
Hơn nữa,
f(yα) ≤pα(yα) ≤ inf
X pα+eα ≤ f(x) +eα,
và sử dụng tính l.s.c. của f ta suy ra f(yα) →f(x) khi α → 0. Dễ thấy rằng, khi α đủ nhỏ thì yα thuộc phần trong của hình cầu x+ rkξkBX
nên
z 7→f(z) +hα(z) + α
2 kz −ωαk2
đạt cực tiểu địa phương tại yα. Hệ quả là véctơ k(α) là một dưới đạo hàm gần kề của f tại yα, trong đó
k(α) := 2α−1(kyα−x−ηξk −ηkξk)/kyα−x−ηξk, nếu hα(yα) > 0, 0, nếu hα(yα) = 0.
Do (C1) không đúng nên ta phải có lim infα→0k(α) ≥ 0 vì nếu trái lại thì sẽ tồn tại dãy αj → 0 làm cho DP−f(yα) 3 ζαj → 0. Do vậy
ζα := ηk(α) = ξ +o(1) khi α →0. Chọn α đủ nhỏ sao cho (yα, f(yα)) ∈
(x, f(x)) +εBX×R và kζα/ηk(α)−ξk < ε. Đặt x := yα, λ:= 1/ηk(α) và
ζ := ζα ta có điều phải chứng minh.
Theo cách tương tự chúng ta có thể chứng minh được
Định lý 2.10([6], Định lý 3.7). Cho X là không gian Hilbert,f : X →R
liên tục, ξ ∈ NP (S, x) với S = {x : f (x) ≤0}. Khi đó hoặc (D1) : ∀ε, η > 0;∃(x, f(x)) ∈ (x, f (x)) +ηBX×R sao cho
hoặc
(D2) : ∀ε > 0;∃(x, f (x)) ∈ (x, f (x)) + εBX×R, ζ ∈ D−Pf(x) ∪
DP−(−f)(x) và λ > 0 sao cho
kλζ −ξk < ε.