xấp xỉ của các hàm lồi
Trong chương này chúng tôi trình bày một quy tắc để tính toán dưới vi phân xấp xỉ của tổng hai hàm lồi, chính thường. Phần cuối chương chúng tôi có nghiên cứu điều kiện cần và đủ cực trị cho bài toán tối ưu lồi tổng quát và bài toán tối ưu lồi có ràng buộc tập. Nội dung chính của chương được tham khảo từ Mục 3 của bài báo [3].
3.1 Quy tắc tổng cho dưới vi phân xấp xỉ
Trong Giải tích lồi, Định lý Moreau–Rockafellar là một kết quả quen thuộc cho ta quy tắc tính toán dưới vi phân của tổng hai hàm lồi, chính thường. Bằng cách sử dụng kết quả về tổng chập (infimal convolution) của hai hàm lồi, chúng ta thu được quy tắc tính tổng dưới vi phân xấp xỉ như sau.
không gian tôpô lồi địa phương Hausdorff X và điều kiện chính quy
(f1 +f2)∗(x∗) = min
f1∗(x∗1)+f2∗(x∗2)| x∗1, x2∗ ∈ X∗, x∗1 + x∗2 = x∗} (∀x∗ ∈ X∗)
(3.1)
được thỏa mãn. Khi đó, với mọi x¯ ∈ domf1 ∩domf2 và ε > 0, ta có
∂ε(f1 +f2)(¯x) = [ ε1≥0, ε2≥0,
ε1+ε2=ε
∂ε1f1(¯x) +∂ε2f2(¯x) .
Ta cùng phân tích chi tiết điều kiện chính quy (3.1). Đầu tiên ta nhận thấy điều kiện (3.1) có nghĩa là với mọi x∗ ∈ X∗, ta có
(f1+f2)∗(x∗) = inf
f1∗(x∗1) +f2∗(x∗2) | x1∗, x∗2 ∈ X∗, x1∗ +x∗2 = x∗},
(3.2)
và infimum này đạt được, hay nói cách khác, tồn tại x¯∗1, x¯∗2 thuộc X∗
mà x¯∗1 + ¯x∗2 = x∗ sao cho
f1∗(¯x∗1) +f2∗(¯x∗2) = inf
f1∗(x∗1) +f2∗(x∗2) | x∗1 +x∗2 = x∗}. (3.3) Để hiểu sâu hơn về điều kiện (3.1), ta tìm hiểu thêm khái niệm "Tổng chập" [6, tr. 168] của các hàm lồi.
Tổng chập f1 ⊕f2 của hai hàm lồi chính thường f1 : X → R và
f2 : X → R được định nghĩa bởi
(f1 ⊕f2)(x) := inf
f1(x1) +f2(x2) | x1 +x2 = x} (x ∈ X).
Bây giờ ta áp dụng công thức này cho hàmf1∗ : X∗ → Rvàf2∗ : X∗ → R, ta được
(f1∗ ⊕f2∗)(x∗) = inf
Cách viết
(f1∗ ⊕f2∗)(x∗) = min
f1∗(x∗1) +f2∗(x2∗) |x∗1 + x∗2 = x∗}
có nghĩa là tồn tại x¯∗1, x¯∗2 thuộc X∗ mà x∗ = ¯x∗1 + ¯x∗2 và
(f1∗ ⊕f2∗)(x∗) =f1∗(¯x∗1) +f2∗(¯x∗2).
Theo định nghĩa của hàm liên hợp, ta có
(f1 +f2)∗(x∗) = sup x∈X
hx∗, xi −(f1 + f2)(x) .
Bằng cách viết x∗ = x∗1 +x∗2 với x∗1 ∈ X∗ và x∗2 ∈ X∗ ta được
(f1 +f2)∗(x∗) = sup x∈X hx∗1 +x∗2, xi −f1(x)−f2(x) = sup x∈X hx∗1, xi −f1(x) +hx∗2, xi −f2(x) ≤ sup x∈X hx∗1, xi −f1(x) + sup x∈X hx∗2, xi −f2(x) . Vậy, bất đẳng thức (f1 +f2)∗(x∗) ≤ f1∗(x∗1) +f2∗(x∗2) (3.4) đúng với mọi x∗, x∗1, x∗2 ∈ X∗ với x∗ = x∗1 +x∗2. Với bất kì x∗ ∈ X∗, lấy infimum cả hai vế của (3.4) theo (x∗1, x∗2) mà x∗1 +x∗2 = x∗, ta được
(f1 +f2)∗(x∗) ≤ (f1∗ ⊕f2∗)(x∗); (3.5) xem [6, tr. 181]. Vì (3.2) có thể được viết lại như sau
(f1 + f2)∗(x∗) = (f1∗ ⊕f2∗)(x∗), (3.6) điều kiện (3.1) thỏa mãn khi với các hàm f1 và f2 như trong giả thiết, bất đẳng thức (3.5) nghiệm đúng dấu bằng với mọi x∗ ∈ X∗. May mắn thay, yêu cầu này có thể được thỏa mãn dưới một số điều kiện. Sau đây, chúng tôi tổng hợp được một số điều kiện như vậy.
Định lý 3.2. Giả sử rằng f1, f2 là các hàm lồi chính thường. Nếu
một trong hai hàm f1, f2 liên tục tại một điểm thuộc miền hữu hiệu của hàm kia
(3.7)
thì đẳng thức (f1 + f2)∗(x∗) = (f1∗ ⊕f2∗)(x∗) đúng với mọi x∗ ∈ X∗. Hơn nữa, với mọi x∗ ∈ dom (f1 + f2)∗, tồn tại x¯∗i ∈ domfi∗, i = 1,2, sao cho x¯∗1 + ¯x∗2 = x∗ và
f1∗(¯x∗1) +f2∗(¯x2∗) = (f1 +f2)∗(x∗).
Nhận xét 3.1. Dưới những điều kiện của Định lý 3.2, điều kiện chính quy (3.1) được thỏa mãn. Thật vậy, giả sử rằng một trong hai hàm lồi chính thường f1, f2 liên tục tại một điểm x0 thuộc vào miền hữu hiệu của hàm còn lại. Khi đó, ta có x0 ∈ dom (f1 + f2). Điều đó suy ra
(f1 + f2)∗(x∗) lớn hơn −∞ với mọi x∗ ∈ X∗. Nếu x∗ ∈/ dom (f1 +f2)∗, thì (f1 +f2)∗(x∗) = +∞. Chọn x¯∗1, x¯∗2 ∈ X∗ sao cho x∗ = ¯x∗1 + ¯x∗2. Từ (3.4),
+∞ = (f1 +f2)∗(x∗) ≤ f1∗(¯x∗1) +f2∗(¯x∗2).
Chú ý rằng f1∗(¯x∗1) > −∞ và f2∗(¯x∗2) > −∞ vì f1, f2 là hai hàm chính thường, từ đó ta thấy rằng ít nhất một trong các giá trịf1∗(¯x∗1) vàf2∗(¯x∗2)
phải bằng +∞. Kết hợp điều này với (3.4) ta được (3.3). Vì (3.2) tương đương với (3.6), và đẳng thức cuối nghiệm đúng. Theo Định lý 3.2, ta chứng minh được rằng (3.1) thỏa mãn với mọi x∗ ∈/ dom (f1+f2)∗. Nếu
x∗ ∈ dom (f1 + f2)∗, khi đó đẳng thức trong (3.1) được suy ra ngay từ Định lý 3.2.
Định lý 3.2, ở đó f1 và f2 được giả thiết là đóng. Nhắc lại rằng
R+(A) := {ta∈ X | t∈ R+, a ∈ A}
là nón sinh bởi tập A.
Định lý 3.3. Giả sử các hàm f1, f2 : X → R là lồi, chính thường xác định trên không gian Banach X. Giả sử thêm rằng
R+(domf1 −domf2) là không gian con đóng khác rỗng của X. (3.8) Khi đó, với mọi x∗ ∈ X∗, ta có (f1+f2)∗(x∗) = (f1∗⊕f2∗)(x∗). Hơn nữa, với mọi x∗ ∈ dom (f1 +f2)∗ tồn tại x∗1, x∗2 ∈ X∗ sao cho x∗ = x∗1 +x∗2
và
(f1 +f2)∗(x∗) = f1∗(x∗1) +f2∗(x∗2).
Sau đây là một phiên bản khác của Định lý 3.2, ở đó dùng điều kiện chính quy hình học.
Định lý 3.4. Cho f1, f2 : X → R là các hàm lồi, đóng, chính thường xác định trên không gian Banach X. Nếu điều kiện chính quy
0∈ int (domf1 −domf2) (3.9) được thỏa mãn, khi đó (f1 + f2)∗(x∗) = (f1∗ ⊕ f2∗)(x∗) đúng với mọi
x∗ ∈ X∗. Hơn nữa, nếu x∗ là điểm sao cho (f1 + f2)∗(x∗) hữu hạn, khi đó tập các điểm x∗1 thỏa mãn (f1∗ ⊕f2∗)(x∗) = f1∗(x∗1) +f2∗(x∗ −x∗1) là khác rỗng, compắc yếu ∗.
Nhận xét 3.2. Dưới các giả thiết của Định lý 3.3 (tương ứng, của Định lý 3.4), điều kiện chính quy (3.1) được thỏa mãn. Thật vậy, giả sử rằng f1, f2 : X → R là các hàm lồi, đóng, chính thường xác định trên không gian BanachX, và (3.8) (tương ứng, (3.9)) được thỏa mãn. Ta có
0∈ domf1 −domf2. Vì vậy, tồn tại x0 ∈ X mà x0 ∈ domf1∩domf2. Khi đóx0
∈ dom (f1+f2). Áp dụng Định lý 3.3 (tương ứng, Định lý 3.4) và các lập luận như ở Nhận xét 3.1, ta được (3.1).
Bây giờ, chúng ta nghiên cứu mối quan hệ giữa các điều kiện chính quy (3.7), (3.8) và (3.9).
Mệnh đề 3.1. Cho f1, f2 : X →R là các hàm lồi, đóng, chính thường xác định trên không gian tôpô lồi địa phương Hausdorff X. Khi đó, (3.7) suy ra (3.8) và (3.9).
Chứng minh. Không giảm tổng quát, giả sử rằng f1 liên tục tại một điểm x¯ ∈ domf2. Khi đó, tồn tại lân cận U của 0 sao cho x¯ + U ⊂
domf1. Vì vậy, U = (¯x+ U) −x¯ ⊂ domf1 −domf2. Điều này suy ra (3.9) và đẳng thức
R+(domf1 −domf2) = X,
chứng tỏ (3.8) được thỏa mãn.
Điều kiện (3.9) ⇒ (3.8) là hiển nhiên. Sau đây, chúng tôi đưa ra hai ví dụ đơn giản để chỉ ra rằng (3.8) ⇒ (3.9) và (3.9) ⇒ (3.7) có thể không đúng.
Ví dụ 3.1. Cho X = R2, f1(x) = x2
1 với mọi x = (x1,0), f1(x) = +∞
với mọi x = (x1, x2) mà x1 6= 0, và lấy f2 ≡ f1. Khi đó,
R+(domf1 −domf2) = domf1 −domf2 = R× {0}
là không gian con đóng củaX. Tuy nhiên, cả hai điều kiện (3.7) và (3.9) đều bị vi phạm.
Ví dụ 3.2. Cho X và f1 tương tự như trong Ví dụ 3.1. Đặt f2(x) =x2 2
với mọi x = (0, x2), f2(x) = +∞ với mọi x = (x1, x2) mà x2 6= 0. Khi đó (3.9) được thỏa mãn, nhưng (3.7) không nghiệm đúng.
3.2 Áp dụng
Cho X là không gian vectơ tôpô lồi địa phương Hausdorff với không gian đối ngẫu là X∗, hàm ϕ : X → R là hàm lồi trên X. Xét bài toán tối ưu không có ràng buộc:
ϕ(x) → inf.
Cho trước ε ≥ 0, điểm x¯ ∈ domϕ được gọi là ε-nghiệm (nghiệm xấp xỉ) của ϕ nếu
ϕ(¯x) ≤ ϕ(x) +ε, ∀x ∈ X.
Trong mục này, chúng tôi trình bày các kết quả về điều kiện cần và đủ để một điểm x¯ là nghiệm xấp xỉ của bài toán tối ưu lồi không có ràng buộc và bài toán tối ưu lồi có ràng buộc.
Đầu tiên ta có kết quả sau:
Định lý 3.5. Với ε ≥ 0, điểm x¯ ∈ X là nghiệm xấp xỉ của hàm lồi ϕ
khi và chỉ khi
0∈ ∂εϕ(¯x).
Chứng minh. Với ε≥ 0 cho trước. Giả sử x¯ là nghiệm xấp xỉ của hàm
ϕ trên X. Khi đó
ϕ(¯x) ≤ ϕ(x) +ε, ∀x ∈ X,
hay ta có thể viết
Bất đẳng cuối có nghĩa là 0 ∈ ∂εϕ(¯x).
Ngược lại, giả sử 0∈ ∂εϕ(¯x), ta cần chứng minh x¯ là nghiệm xấp xỉ của ϕ. Thật vậy, theo định nghĩa dưới vi phân xấp xỉ, ta có
0∈ ∂εϕ(¯x) ⇒ h0, x−x¯i ≤ ϕ(x)−ϕ(¯x) +ε, x ∈ X.
Từ bất đẳng thức cuối ta có ϕ(¯x) ≤ ϕ(x) + ε, x ∈ X. Chứng tỏ x¯ là nghiệm xấp xỉ của hàm lồi ϕ trên X.
Bằng cách sử dụng Định lý 3.5 và quy tắc tổng cho dưới vi phân xấp xỉ ở Mục 3.1 (Định lý 3.1), ta thu được kết quả sau cho bài toán tối ưu lồi có ràng buộc
ϕ(x) → inf, x ∈ C,
(3.10)
ở đó C là tập con lồi khác rỗng của X.
Định lý 3.6. Cho x¯ ∈ X. Nếu ít nhất một trong các điều kiện sau đây được thỏa mãn
(a) intC ∩ domϕ 6= ∅,
(b) ϕ liên tục tại một điểm thuộc miền trong của tập C.
Khi đó x¯ là nghiệm xấp xỉ của bài toán (3.10) nếu và chỉ nếu
0 ∈ [
ε1≥0, ε2≥0, ε1+ε2=ε
{∂ε1ϕ(¯x) +Nε2(¯x;C)}.
Chứng minh. Xét hàm Φ(x) = ϕ(x) + δC(x), ở đó δC(·) là hàm chỉ của tập lồi C. Khi đó ta thấy, x¯ là nghiệm xấp xỉ của bài toán (3.10) nếu và chỉ nếu x¯ là nghiệm xấp xỉ của hàm Φ(·). Khi đó theo Định lý
3.5, x¯ là nghiệm xấp xỉ của bài toán (3.10) khi và chỉ khi 0 ∈ ∂εΦ(¯x) = ∂ε ϕ+ δC(·) (¯x). (3.11) Vì C là tập lồi nên δC(·) là hàm lồi. Hiển nhiên δC(·) liên tục tại mọi điểm thuộc phần trong của tập C. Khi đó, nếu điều kiện (a) được thỏa mãn thì δC(·) liên tục tại một điểm thuộc miền hữu hiệu của hàm ϕ. Xét trường hợp điều kiện (b) được thỏa mãn. Vì domδC(·) = C và ϕ
liên tục tại một điểm thuộc domδC(·). Theo Định lý 3.1, từ (3.11) ta có
0∈ ∂εΦ(¯x) = ∂ε ϕ+ δC(.) (¯x) = [ ε1≥0, ε2≥0, ε1+ε2=ε {∂ε1ϕ(¯x) + ∂ε2δC(¯x)} = [ ε1≥0, ε2≥0, ε1+ε2=ε {∂ε1ϕ(¯x) + Nε2(¯x;C)}.
Định lý 3.7. ChoX là không gian Banach, C là tập đóng vàϕ : X → R
là hàm lồi, đóng, chính thường. Xét x¯ ∈ X sao cho hoặc
R+(domϕ−C) là không gian con đóng khác rỗng của X,
hoặc điều kiện
0∈ int (domϕ−C)
được thỏa mãn. Khi đó, x¯ là nghiệm xấp xỉ của bài toán (3.10) nếu và chỉ nếu
0 ∈ [
ε1≥0, ε2≥0, ε1+ε2=ε
Chứng minh. Chứng minh tương tự như Định lý 3.6. Chú ý rằng, ở đây domδC = C và vì C là tập lồi, đóng nên hàm chỉ δC là hàm lồi, đóng.
Kết luận
Luận văn này đã trình bày những nội dung cơ bản sau:
- Hai phiên bản khác nhau của Định lý Moreau - Rockafellar dùng để tính tổng dưới vi phân của các hàm lồi, chính thường.
- Áp dụng các quy tắc tổng tính dưới vi phân vào nghiên cứu điều kiện cần và đủ cực trị cho bài toán tối ưu lồi có ràng buộc tập.
- Quy tắc tổng tính dưới vi phân xấp xỉ của tổng hai hàm lồi, chính thường.
- Áp dụng các quy tắc tổng tính dưới vi phân xấp xỉ vào nghiên cứu điều kiện cần và đủ cực trị cho bài toán tối ưu lồi tổng quát và bài toán tối ưu lồi với ràng buộc tập.