Dưới vi phân của hàm lồi và một số ứng dụng trong tối ưu .pdf
Trang 1Đại học thái nguyênTrường đại học sư phạm- - - -
Nông Thị Mai
Dưới vi phân của hàm lồi và một sốứng dụng trong tối ưu
Chuyên ngành: Giải tíchMã số:60.46.01
Luận văn thạc sĩ toán học
Người hướng dẫn khoa học:GS -TSKH Lê Dũng Mưu
Thái nguyên - Năm 2008
Trang 21.1 Tập lồi 5
1.2 Hàm lồi 11
1.2.1 Hàm lồi 11
1.2.2 Tính liên tục của hàm lồi 15
1.2.3 Các phép toán bảo toàn tính lồi 15
2.2.3 Tính đơn điệu của dưới vi phân 35
2.2.4 Tính liên tục của dưới vi phân 39
2.2.5 Phép tính với dưới đạo hàm 43
2.3 Dưới vi phân xấp xỉ 45
Chương3 Một số ứng dụng của dưới vi phân trong tối ưu hoá 523.1 Các khái niệm 52
3.2 Bài toán lồi không có rằng buộc 53
3.3 Bài toán lồi với rằng buộc đẳng thức 53
3.4 Bài toán lồi với rằng buộc bất đẳng thức 54
Trang 3Danh mục các ký hiệu, các chữ viết tắt
Với n là số nguyên dương, ký hiệu:
Rn: không gian Euclide n-chiều trên trường số thực;
Rn+: góc không âm của Rn (tập các véc-tơ có mọi toạ độ đều không âm );R: trục số thực (R = R1);
R: trục số thực mở rộng (R = R ∪ {−∞, +∞});N: tập hợp số nguyên dương;
2Rn: tập hợp tất cả các tập con của Rn;Với mọi véc-tơ x, y ∈ Rn, ký hiệu:xi: toạ độ thứ i của x;
xT: véc-tơ hàng (chuyển vị của x);hx, yi = xTy = xy := Pn
j=1xjyj: tích vô hướng của hai véc-tơ x và y;||x|| = qPn
j=1x2j: chuẩn Euclide của x;[x, y]: đoạn thẳng đóng nối x và y;
(x, y): đoạn thẳng mở nối x và y;Với tập A, ký hiệu:
A: bao đóng của A;coA: bao lồi của A;aff A: bao a-phin của A;
intA: tập hợp các điểm trong của A;
ri A: tập hợp các điểm trong tương đối của A;Với hàm f của n biến, ký hiệu:
f: hàm bao đóng của f;dom f: tập hữu dụng của f;f∗: hàm liên hợp của f;epi f: trên đồ thị của f;
∂f (x): dưới vi phân của f tại x;∂f (x): - dưới vi phân của f tại x;Of (x) hoặc f0(x): đạo hàm của f tại x;f0(x, d): đạo hàm theo phương d của f tại x;
Trang 4Lời nói đầu
Giải tích lồi là một bộ môn quan trọng trong giải tích phi tuyến hiện đại.Giải tích lồi nghiên cứu những khía cạnh giải tích của tập lồi và hàm lồi.Dưới vi phân là một khái niệm cơ bản của giải tích lồi Đây là mở rộng chođạo hàm khi hàm không khả vi Điều này cho thấy vai trò của dưới vi phântrong giải tích hiện đại cũng có tầm quan trọng như vai trò của đạo hàm tronggiải tích cổ điển Dưới vi phân của hàm lồi có rất nhiều ứng dụng trong giảitích phi tuyến và đặc biệt trong các bộ môn toán ứng dụng, như tối ưu hoá,bất đẳng thức biến phân, cân bằng v v.
Mục đích của luận văn là trình bày một cách có hệ thống, các kiến thứccơ bản và quan trọng nhất về dưới vi phân của hàm lồi và xét một số ứngdụng điển hình của dưới vi phân trong tối ưu hoá.
Luận văn gồm 3 chương Trong chương 1 sẽ trình bày những kiến thứccơ bản về tập lồi và hàm lồi Đây là các kiến thức bổ trợ cho chương 2 và dođó sẽ không được chứng minh trong luận văn này Trong chương 2 sẽ đề cậpvề đạo hàm theo phương, dưới vi phân, dưới vi phân xấp xỉ và một số tínhchất cơ bản của chúng Dựa trên các kết quả đã nghiên cứu trong các chươngtrước, trong chương 3 sẽ trình bày các điều kiện cực trị cho các bài toán quyhoạch lồi với các rằng buộc khác nhau (không rằng buộc, rằng buộc đẳngthức, rằng buộc bất đẳng thức).
Bản luận văn này được hoàn thành dưới sự hướng dẫn khoa học của GS-TSKH Lê Dũng Mưu Nhân đây em xin chân thành cảm ơn thầy đã hướngdẫn, động viên, khuyến khích em học tập, nghiên cứu để hoàn thành luậnvăn này.
Trang 5Chương 1
Các kiến thức cơ bản về tập lồi và hàmlồi
Trong luận văn này, chúng ta sẽ làm việc với không gian euclid-n chiều trêntrường số thực R Không gian này được kí hiệu là Rn Chương này nhằmgiới thiệu những khái niệm cơ bản nhất của tập lồi và hàm lồi cùng với nhữngtính chất đặc trưng của nó Các kiến thức ở trong chương này đuợc lấy ở tàiliệu :
+ Giáo trình "Nhập môn giải tích lồi ứng dụng" của tác giả Lê Dũng Mưuvà Nguyễn Văn Hiền.
+ Cuốn "Convex Analysis" của tác giả T.Rockafellar.
Do chương này chỉ mang tính chất bổ trợ, nên ta không chứng minh cáckết quả nêu ở đây.
Trang 6Ví dụ 1.1 (Về tập lồi).a) Tập C = R2
+ là tập lồi.b) Tập C = [−2; 3) là tập lồi.
c) Tập C ≡ oxy trong R3 là tập lồi.
d) Các tam giác, hình tròn trong mặt phẳng là các tập lồi.Ví dụ 1.2 (Về tập không lồi).
Véc-tơ a thường được gọi là véc-tơ pháp tuyến của siêu phẳng Một siêuphẳng sẽ chia không gian ra hai nửa không gian Nửa không gian được địnhnghĩa như sau:
Định nghĩa 1.5 Nửa không gian là một tập hợp có dạng{x | aTx > α},
trong đó a 6= 0 và α ∈ R Đây là nửa không gian đóng.Định nghĩa 1.6 Cho C ⊆ Rn là một tập lồi và x ∈ C Tập
NC(x) := {ω | hω, y − xi 6 0 , ∀y ∈ C},được gọi là nón pháp tuyến ngoài của C tại x.
Nhận xét NC(x) là một nón lồi đóng.
Trang 7Ví dụ 1.3 Trong R2, xét tập C = R2+.
NC(0) = {ω | hω, y − 0i 6 0 , ∀y ∈ C}= {ω |
ωiyi 6 0}= {ω | ωi 6 0}.
Định nghĩa 1.7 Một điểm a ∈ C được gọi là điểm trong tương đối của Cnếu nó là điểm trong của C theo tô-pô cảm sinh bởi aff C.
Ta sẽ ký hiệu tập hợp các điểm trong tương đối của C là ri C Theo địnhnghĩa trên ta có:
ri C := {a ∈ C | ∃B : (a + B) ∩ aff C ⊂ C},trong đó B là một lân cận mở của gốc Hiển nhiên
{x ∈ Rn | x = αa + βb , α , β ∈ R , α + β = 1}.
Định nghĩa 1.9 Một tập C được gọi là tập a-phin nếu nó chứa mọi đườngthẳng đi qua hai điểm bất kỳ của nó, tức là
∀x, y ∈ C , ∀λ ∈ R =⇒ λx + (1 − λ)y ∈ C.Ví dụ 1.4 (Về tập a-phin).
Tập C = R2 là tập a-phin, không gian con là một tập affine
Trang 8Nhận xét Tập a-phin là một trường hợp riêng của tập lồi.
Định nghĩa 1.10 Bao lồi của một tập E là giao của tất cả các tập lồi chứaE Bao lồi của một tập E sẽ được ký hiệu là coE.
Bao lồi đóng của một tập E là tập lồi đóng nhỏ nhất chứa E Ta sẽ kýhiệu bao lồi đóng của một tập E là coE.
Bao a-phin của E là giao của tất cả các tập a-phin chứa E Bao a-phincủa một tập E sẽ được ký hiệu là aff E.
Tập E được gọi là bị chặn, nếu tồn tại một hình cầu chứa E.
Trong Rn tập E được gọi là tập compắc nếu E là một tập đóng và bị chặn.Định nghĩa 1.12 Cho C là một tập lồi.
Một tập F ⊂ C được gọi là một diện của một tập lồi C nếu
F là tập lồi và ∀x, y ∈ C , tx + (1 − t)y ∈ F , 0 < t < 1 =⇒ [x, y] ⊂ F.Ví dụ 1.5 Cho C := {(x, y, z) ∈ R3 | x, y, z ∈ [0, 1]}.
Tập F1 := {(x, y, z) ∈ R3 | x, y ∈ [0, 1], z = 0} là một diện của tập C.Tập F2 := {(x, y, z) ∈ R3 | y ∈ [0, 1], x = 1, z = 0} là một diện của tậpC.
Điểm cực biên là diện có thứ nguyên (chiều) bằng 0.
Trang 9Định nghĩa 1.13 Cho x0 ∈ C Ta nói aTx = α là siêu phẳng tựa của C tạix0, nếu
Định lý 1.2 (Xấp xỉ tuyến tính tập lồi).
Mọi tập lồi đóng khác rỗng và không trùng với toàn bộ không gian đềulà giao của tất cả các nửa không gian tựa của nó.
Định nghĩa 1.14 Cho hai tập C và D khác rỗng.Ta nói siêu phẳng aTx = α tách C và D nếu
aTx 6 α 6 aTy , ∀x ∈ C , ∀y ∈ D.Ta nói siêu phẳng aTx = α tách chặt C và D nếu
aTx < α < aTy , ∀x ∈ C , ∀y ∈ D.Ta nói siêu phẳng aTx = α tách mạnh C và D nếu
Supx∈C aTx < α < infy∈DaTy.Ví dụ 1.6 (Tách nhưng không tách chặt).
Cho tập
C = {(x, y) ∈ R2 | x2 + y2 6 1},và
D = {(x, y) ∈ R2 | − 1 6 x 6 1, 1 6 y 6 3}.Ta có:
Trang 10+ C và D khác rỗng.
+ C, D tách được vì tồn tại siêu phẳng (0, 1)(x, y) = 1 thoả mãn(0, 1)(x, y) 6 1 6 (0, 1)(x0, y0) ∀(x, y) ∈ C, ∀(x0, y0) ∈ D.Hay
y 6 1 6 y0 ∀(x, y) ∈ C, ∀(x0, y0) ∈ D.+ C, D không tách chặt được vì không tồn tại siêu phẳng(a1, a2)(x, y) = α nào thoả mãn
(a1, a2)(x, y) < α < (a1, a2)(x0, y0) ∀(x, y) ∈ C, ∀(x0, y0) ∈ D.Ví dụ 1.7 (Tách nhưng không tách mạnh).
Cho tập
C = {(x, y) ∈ R2 | x > 0, y = 0},và
D = {(x, y) ∈ R2 | y > 1
x, y > 0, x > 0}.Ta có:
+ C và D khác rỗng.
+ C, D tách được vì tồn tại siêu phẳng (0, 1)(x, y) = 0 thoả mãn(0, 1)(x, y) = 0 6 (0, 1)(x0, y0) ∀(x, y) ∈ C, ∀(x0, y0) ∈ D.Hay
y = 0 6 y0 ∀(x, y) ∈ C, ∀(x0, y0) ∈ D.+ C, D không tách mạnh được vì
Sup(x,y)∈C(0, 1)(x, y) = 0,inf(x0,y0)∈D(0, 1)(x0, y0) = 0.Định lý 1.3 (Định lý tách 1).
Cho C và D là hai tập lồi khác rỗng trong Rn sao cho C ∩ D = ∅ Khiđó có một siêu phẳng tách C và D.
Trang 11Hệ quả 1.1 (Bổ đề liên thuộc).
Cho C ⊂ Rn là một tập lồi khác rỗng Giả sử x0 6∈ C Khi đó tồn tạit ∈ Rn , t 6= 0 thoả mãn
ht, xi > ht, x0i ∀x ∈ C.Định lý 1.4 (Định lý tách 2).
Cho C và D là hai tập lồi đóng khác rỗng sao cho C ∩ D = ∅ Giả sửcó ít nhất một tập là compắc Khi đó hai tập này có thể tách mạnh được bởimột siêu phẳng.
Hệ quả 1.2 Cho C ⊂ Rn là một tập lồi đóng khác rỗng sao cho 0 6∈ C Khiđó tồn tại một véc-tơ t ∈ Rn , t 6= 0 và α > 0 sao cho
Định nghĩa 1.15 Cho ∅ 6= C ⊆ Rn lồi và f : C −→ R ∪ {−∞, +∞} Tanói f là hàm lồi trên C nếu epi f là một tập lồi trong Rn+1.
Sau đây ta sẽ chủ yếu làm việc với hàm f : Rn −→ R ∪ {+∞}.Trongtrường hợp này, định nghĩa trên tương đương với:
Trang 12Hµm f : Rn −→ R ∪ {+∞} lµ hµm låi trªn C nÕu
f [λx + (1 − λ)y] 6 λf (x) + (1 − λ)f (y) , ∀x, y ∈ C , ∀λ ∈ (0, 1)Hµm f : Rn −→ R ∪ {+∞} lµ hµm låi chÆt trªn C nÕu
f [λx + (1 − λ)y] < λf (x) + (1 − λ)f (y) , ∀x, y ∈ C , ∀λ ∈ (0, 1)Hµm f : Rn −→ R ∪ {+∞} lµ hµm låi m¹nh trªn C víi hÖ sè låi η > 0nÕu
f [λx + (1 − λ)y] 6 λf (x) + (1 − λ)f (y) − 1
2ηλ(1 − λ)||x − y||
2 ,∀x, y ∈ C , ∀λ ∈ (0, 1).
Hµm f ®îc gäi lµ mét hµm lâm trªn C, nÕu −f lµ hµm låi trªn C.VÝ dô 1.8 Hµm a-phin f(x) = aTx + α, a ∈ Rn, α ∈ R
∀x, y ∈ Rn, ∀λ ∈ (0, 1), ta cã
f [λx + (1 − λ)y] = aT[λx + (1 − λ)y] + α= λaTx + (1 − λ)aTy + α
= λaTx + λα + (1 − λ)aTy + (1 − λ)α= λ(aTx + α) + (1 − λ)(aTy + α)= λf (x) + (1 − λ)f (y).
VËy f lµ mét hµm låi trªn Rn.∀x, y ∈ Rn, ∀λ ∈ (0, 1), l¹i cã
−f [λx + (1 − λ)y] = −aT[λx + (1 − λ)y] − α= −λaTx − (1 − λ)aTy − α
= −λaTx − λα − (1 − λ)aTy − (1 − λ)α= −λ(aTx + α) − (1 − λ)(aTy + α)= −λf (x) − (1 − λ)f (y).
VËy −f lµ mét hµm låi trªn Rn Suy ra f lµ mét hµm lâm trªn Rn.
Trang 13VÝ dô 1.9 Hµm chØ Cho C 6= ∅ lµ mét tËp låi §Æt δC(x) :=
Suy ra δC[λx + (1 − λ)y] = 0 = λδC(x) + (1 − λ)δC(y).+ ∀x ∈ C, ∀y 6∈ C, ∀λ ∈ (0, 1), ta cã :
δC(x) = 0 , δC(y) = +∞ , δC[λx + (1 − λ)y] 6 +∞.Suy ra δC[λx + (1 − λ)y] 6 λδC(x) + (1 − λ)δC(y).+ ∀x, y 6∈ C, ∀λ ∈ (0, 1), ta cã :
δC(x) = +∞ , δC(y) = +∞ , δC[λx + (1 − λ)y] 6 +∞.Suy ra δC[λx + (1 − λ)y] 6 λδC(x) + (1 − λ)δC(y).VËy δC lµ hµm låi trªn Rn.
VÝ dô 1.10 Hµm tùa.
§Æt SC(y) := Supx∈Chy, xi.Ta nãi SC lµ hµm tùa cña C.∀x, y ∈ C, ∀λ ∈ (0, 1), ta cã
SC[λx + (1 − λ)y] = Supz∈Chλx + (1 − λ)y, zi
= Supz∈C{hλx, zi + h(1 − λ)y, zi}6 Supz∈Chλx, zi + Supz∈Ch(1 − λ)y, zi= λ Supz∈Chx, zi + (1 − λ) Supz∈Chy, zi= λSC(x) + (1 − λ)SC(y).
Trang 14Nếu η = 0 thì f lồi trên C.
Nếu f có hệ số lồi trên C là η > 0, thì f lồi mạnh trên C với hệ số η.Định nghĩa 1.17 Một hàm f : Rn −→ R ∪ {+∞} được gọi là chính thườngnếu dom f 6= ∅ và f(x) > −∞ với mọi x.
Định nghĩa 1.18 Hàm f : Rn −→ R ∪ {+∞} được gọi là đóng, nếu epi flà một tập đóng trong Rn+1
Chú ý 1.1 1 Nếu f là một hàm lồi trên một tập lồi C, thì có thể thác triểnf lên toàn không gian bằng cách đặt
fe(x) =(
Hiển nhiên fe(x) = f (x) với mọi x ∈ C và fe lồi trên Rn Hơn nữa fe
là chính thường khi và chỉ khi f chính thường Tương tự fe đóng khi và chỉkhi f đóng.
2 Nếu f là một hàm lồi trên Rn thì dom f là một tập lồi vì dom f chínhlà hình chiếu trên Rn của epi f, tức là:
dom f = {x|∃à ∈ R : (x, à) ∈ epi f }.Định nghĩa 1.19 Cho f : Rn −→ R ∪ {+∞}.
Hàm f được gọi là thuần nhất dương (bậc 1) trên Rn nếuf (λx) = λf (x) ∀x ∈ Rn, ∀λ > 0.
Hàm f được gọi là dưới cộng tính nếu f(x + y) 6 f(x) + f(y) ∀x, y.Hàm f được gọi là dưới tuyến tính nếu f là thuần nhất dương và dướicộng tính.
Ví dụ 1.11 Hàm chuẩn f(x) = kxk là hàm dưới tuyến tính Thật vậy,∀x ∈ Rn, ∀λ > 0, ta có: f(λx) = kλxk = |λ|.kxk = λkxk = λf(x).∀x, y ∈ Rn, ta có: f(x + y) = kx + yk 6 kxk + kyk = f(x) + f(y).Mệnh đề 1.2 Cho f : Rn −→ R ∪ {+∞} là một hàm thuần nhất dươngtrên Rn.
Khi đó: f lồi khi và chỉ khi f là dưới cộng tính.
Trang 151.2.2 Tính liên tục của hàm lồi
Định nghĩa 1.21 Cho hai hàm f và g xác định trên Rn.
Ta nói g là bao đóng của f, nếu epi g = epi f Bao đóng của f sẽ đượckí hiệu là f Vậy epi f = epi f.
Hàm f được gọi là đóng nếu epi f = epi f.1.2.3 Các phép toán bảo toàn tính lồi
Định nghĩa 1.22 Giả sử {fα}α∈I là một họ tuỳ ý các hàm số trên Rn vàE ⊆ Rn Hàm cận trên của họ hàm này trên coE, ký hiệu là Vα∈Ifα là hàmsố được định nghĩa như sau:
(Vα∈Ifα)(x) := Supα∈I fα(x)với mỗi x ∈ coE.
Trang 16Định nghĩa 1.24 Cho f : Rn −→ [−∞, +∞] là một hàm bất kỳ Hàmf∗(x∗) := Sup{hx∗, xi − f (x) | x ∈ Rn}
được gọi là hàm liên hợp của f.
Chú ý 1.2 Như thường lệ, trong định nghĩa trên ta qui ước cận trên đúngtrên một tập rỗng là −∞ Như vậy nếu f ≡ +∞, thì f∗ ≡ −∞, ngoài ranếu f có nhận giá trị −∞ thì f∗ ≡ +∞.
Để khỏi phải làm việc với hàm liên hợp đồng nhất bằng +∞ hoặc đồngnhất bằng −∞, ta sẽ hạn chế việc xét hàm liên hợp trong lớp hàm có tínhchất sau:
f 6≡ +∞ và tồn tại một hàm non a-phin của f.
Trang 17Ví dụ 1.12 Xét hàm chỉδC(x) =
Mệnh đề 1.6 Giả sử f 6≡ +∞ và tồn tại một hàm non a-phin của f Khi đóepi f∗∗ = co(epi f ).
Hệ quả 1.3 f ≡ f∗∗ khi và chỉ khi f là hàm lồi, đóng.
Định nghĩa 1.25 Hàm l là hàm non a-phin của một hàm f trên Rn nếul là hàm a-phin trên Rn và l(x) 6 f(x) ∀x ∈ Rn.
Trang 18Chương 2
Dưới vi phân của hàm lồi
Phép tính vi phân là một trong những đề tài cơ bản nhất của giải tích cổ điển.Trong giải tích lồi, lý thuyết này lại càng trở nên phong phú nhờ những tínhchất đặc biệt của tập lồi và hàm lồi Mục đầu tiên của chương này sẽ xét đếnđạo hàm theo phương của một hàm lồi Tiếp đến ở mục 2, sẽ đưa ra địnhnghĩa về dưới vi phân và các tính chất của nó như: Xét tính khả vi của hàmlồi, khảo sát tính đơn điệu của dưới vi phân, khảo sát tính liên tục của ánhxạ dưới vi phân và một số phép tính với dưới vi phân Mục cuối của chươngsẽ giới thiệu về dưới vi phân xấp xỉ và một số tính chất của nó.
2.1 Đạo hàm theo phương
Cho một hàm n-biến f : Rn −→ R ∪ {+∞} Khi cố định một phương và xéthàm nhiều biến trên phương đó , thì ta có một hàm một biến Giả sử y 6= 0 làmột phương cho trước xuất phát từ điểm x0 Khi đó mọi điểm x thuộc đườngthẳng đi qua x0 và có phương y đều có dạng x = x0 + λy với λ ∈ R Nếuđặt ξ(λ) = f(x0 + λy) thì ξ lồi trên R khi và chỉ khi f lồi trên Rn.
Định nghĩa 2.1 Cho f : Rn −→ R ∪ {+∞} và x0 ∈ Rn sao chof (x0) < +∞.
Nếu với một véc-tơ y ∈ Rn mà giới hạn lim
Trang 19Ví dụ 2.1 Giả sử f được cho như sau:f (x) =
λ = −∞,f0(0, 0) = lim
f (0+λ0)−f (0)
λ = 0,f0(0, 1) = lim
f (0+λ1)−f (0)
λ = +∞.Suy ra f0(0, ) không là hàm chính thường.
Mệnh đề 2.1 Cho f : Rn −→ R ∪ {+∞} lồi Khi đó với mọi x ∈ dom fvà mọi y ∈ Rn ta có:
i) ϕ là hàm đơn điệu không giảm trên (0; +∞) , trong đóϕ(λ) := f (x + λy) − f (x)
và do đó f0(x, y) tồn tại với mọi y ∈ Rn và
f0(x, y) := infλ>0 f (x + λy) − f (x)
ii) Hàm f0(x, ) thuần nhất dương bậc 1.
Ngoài ra nếu f0(x, ) > −∞ thì hàm f0(x, ) là dưới tuyến tính trên Rn
(do đó nó là hàm lồi chính thường trên Rn).iii) −f0
Trang 20Định nghĩa hàm h : R −→ R ∪ {+∞} xác định bởih(λ) = f (x + λ.y) − f (x).Khi đó h(0) = 0.
λh(λ) + (1 −λ0
λ)h(0)= λ
Do ϕ(λ) = f (x+λy)−f (x)λ = h(λ)λ nên ϕ(λ0) 6 ϕ(λ).Vậy ϕ là hàm không giảm trên miền (0; +∞).
Suy ra f0(x, y) = lim
λ→0ϕ(λ) tồn tại vàlim
λ→0ϕ(λ) = infλ>0ϕ(λ) = infλ>0 f (x + λ.y) − f (x)
f (x + λ0y) − f (x)
0(x, y).Vậy f0(x, ) thuần nhất dương.
Chứng minh tính dưới tuyến tính.
Trang 21Giả sử f0(x, ) > −∞, với mọi u và v ta có:f0(x, u + v) = infλ>0 f [x +
2(u + v)] − f (x)
(theo i)= infλ>0 f [(
2 + λ2u) + (x2 + λ2v)] − 12f (x) − 12f (x)
.Do f là hàm lồi không nhận giá trị −∞ ,nên
f [(x2 +
2u) + (x2 +
λ2v)] −
2f (x) −12f (x)6 1
2[f (x + λu) − f (x)] +1
2[f (x + λv) − f (x)].Do đó
f0(x, u + v) 6 infλ>0
f (x + λu)
λ + infλ>0
f (x + λv)λ= f0(x, u) + f0(x, v).
(f0(x, u) + f0(x, v) có nghĩa vì f0(x, ) > −∞).
Vậy f0(x, ) là hàm dưới cộng tính Suy ra f0(x, )là hàm dưới tuyến tínhtrên Rn.
Vì f0(x, ) > −∞, f0(x, 0) = 0 và f0(x, )là dưới tuyến tính trên Rn, nênnó là hàm lồi, chính thường trên toàn không gian.
iii) Do f0(x, 0) = 0 và theo tính chất dưới cộng tính, ta có:
0 = f0(x, 0) = f0(x, y − y) 6 f0(x, y) + f0(x, −y) ∀y ∈ Rn.Suy ra −f0
(x, −y) 6 f0(x, y) với mọi y ∈ Rn.
iv) Giả sử x ∈ ri(dom f) Ta cần chứng tỏ f0(x, ) hữu hạn trên F Từ iii) suy ra f0(x, ) > −∞ Vậy cần chỉ ra f0(x, y) < +∞ với mọiy ∈ F.
Do x ∈ ri(dom f), nên ∀y ∈ F , x + λ.y ∈ dom f ∀λ > 0 đủ nhỏ.Do đó f0(x, y) = infλ>0 f (x+λ.y)−f (x)λ < +∞.
Ngược lại, giả sử f0(x, y) hữu hạn với mọi y ∈ F Ta cần chứng tỏx ∈ ri(dom f ).
Trang 22Thật vậy, nếu trái lại sẽ tồn tại y ∈ F và một dãy {λk} các số dương hộitụ đến 0 và x + λk.y 6∈ dom f với mọi k đủ lớn Trong trường hợp này
f (x + λk.y) − f (x) = +∞ với mọi k đủ lớn.
Do đó f0(x, y) = +∞ Mâu thuẫn với giả thiết Vậy x ∈ ri(dom f).
Theo định nghĩa, một điểm x∗ ∈ ∂f (x) khi và chỉ khi nó thoả mãn mộthệ vô hạn các bất đẳng thức tuyến tính Như vậy ∂f(x) là giao của các nửakhông gian đóng Vậy ∂f(x) luôn là một tập lồi đóng (có thể rỗng).
Kí hiệu dom(∂f) := {x|∂f(x) 6= ∅}.
Ví dụ 2.2 1) Hàm chuẩn f(x) = kxk, x ∈ Rn.Tại điểm x = 0, ta có
∂f (0) = {x∗|hx∗, xi 6 kxk, ∀x}.Vậy hàm f(x) khả dưới vi phân.
Lại cólim
Trang 232) Hàm chỉ
f (x) = δC(x) :=(
+∞ nếu x 6∈ C.Trong đó C là một tập lồi khác ∅.
Khi đó với x0 ∈ C, ta có
∂f (x0) = ∂δC(x0) = {x∗|hx∗, x − x0i 6 δC(x), ∀x}.Với x 6∈ C thì δC(x) = +∞, nên bất đẳng thức này luôn đúng.Vậy ∂f(x0) = ∂δC(x0) = {x∗|hx∗, x − x0i 6 0, ∀x ∈ C} = NC(x0).Vậy dưới vi phân của hàm chỉ của một tập lồi C khác ∅ tại một điểmx0 ∈ C chính là nón pháp tuyến ngoài của C tại x0.
hx∗, λ.yi + f (x) 6 f (x + λ.y).Từ đây suy ra
hx∗, yi 6 f (x + λ.y) − f (x)
Theo định nghĩa của f0(x, y), suy ra ngay hx∗
, yi 6 f0(x, y) ∀y.Ngược lại, giả sử (2.1) thoả mãn.
Lấy z bất kì và áp dụng (2.1) với y = z − x và λ = 1, ta cóhx∗, z − xi 6 f (z) − f (x) ∀z.
Vậy x∗ ∈ ∂f (x).
ii) Cho x ∈ dom(∂f), thì ∂f(x) 6= ∅, tức là tồn tại x∗ ∈ ∂f (x).
Trang 24Theo định nghĩa của f, ta có epi f = epi f.
Mặt khác, ta lại có epi f ⊂ epi f, suy ra epi f ⊂ epi f Vậy
Ta lấy y∗ ∈ ∂f (x) thì ∀z tacó
hy∗, z − xi + f (x) 6 f (z).Mặt khác
f (z) > f (z) > hy∗, z − xi + f (x) = hy∗, z − xi + f (x).Suy ra y∗ ∈ ∂f (x) Vậy
Ngược lại, lấy z0 ∈ ri(dom f ) Với mọi z ta cóf (z) = f (z) = lim
t→0f [(1 − t).z + t.z0].Vậy theo định nghĩa của dưới vi phân ta có :
x∗ ∈ ∂f (x) ⇔ hx∗, (1 − t).z + t.z0 − xi + f (x) 6 f[(1 − t).z + t.z0].Cho t → 0 ta được :
hx∗, z − xi + f (x) 6 f (z).
Trang 25hx∗, z − xi + f (x) 6 f (z)Chứng tỏ x∗ ∈ ∂f (x) Vậy
Từ (2.5) và (2.6) ta có ∂f(x) = ∂f(x).
Mệnh đề 2.3 Cho f : Rn −→ R ∪ {+∞} lồi, khi đó :i) Nếu x 6∈ dom f, thì ∂f(x) = ∅.
ii) x ∈ ri(dom f) khi và chỉ khi ∂f(x) 6= ∅ và compắc.
Chứng minh i) Cho z ∈ dom f, thì f(z) < +∞ Vậy nếu x 6∈ dom f thìf (x) = +∞ và do đó không thể tồn tại x∗ tho mãn
hx∗, z − xi + f (x) 6 f (z) < +∞.Vậy ∂f(x) = ∅.
ii) Giả sử x ∈ ri(dom f) Ta có điểm (x, f(x)) nằm trên biên của epi f.Do f lồi, chính thường, nên tồn tại siêu phẳng tựa của epi f đi qua(x, f (x)).
Tức là tồn tại p ∈ Rn, t ∈ R không đồng thời bằng 0 sao cho
hp, xi + t.f (x) 6 hp, yi + t.à , ∀(y, à) ∈ epi f (2.7)Ta có t 6= 0, vì nếu t = 0 thì hp, xi 6 hp, yi , ∀y ∈ dom f.
Hay hp, x − yi 6 0 , ∀y ∈ dom f.
Nhưng do x ∈ ri(dom f), nên điều này kéo theo p = 0 Mâu thuẫn vớip, tkhông đồng thời bằng 0 Vậy t 6= 0.
Hơn nữa t > 0, vì nếu t < 0 thì trong bất đẳng thức (2.7), khi cho à → ∞ta suy ra mâu thuẫn vì vế trái cố định.
Chia hai vế của (2.7) cho t > 0, ta được:hp
t, xi + f (x) 6 hp
t, yi + à ∀y ∈ dom f.
Trang 26Thay à = f(y), ta đượchp
Bây giờ ta chỉ ra tập ∂f(x) compắc.Do x ∈ ri(dom f), theo mệnh đề (2.2)
x∗ ∈ ∂f (x) ⇐⇒ f0(x, d) > hx∗, di ∀d (2.8)Gọi F là không gian tuyến tính của dom f Lấy ei là véc-tơ đơn vị thứ i(i=1, ,n) của Rn (toạ độ thứ i của ei bằng 1 và mọi toạ độ khác là 0) Khônggiảm tổng quát, ta giả sử rằng các véc-tơ đơn vị e1, ek ∈ F, áp dụng (2.8)lần lượt với d = ei với i=1, k, ta có x∗
i 6 f0(x, ei).Tương tự , áp dụng với d = −ei với i=1, k, ta có −x∗
i 6 f0(x, −ei) Hayx∗i > −f0(x, −ei).
Tóm lại −f0(x, −ei) 6 x∗i 6 f0(x, ei) ,với mọi i=1, k.
Theo (iv) mệnh đề (2.1), do x ∈ ri(dom f) và F là không gian concủa dom f, nên f0(x, y) hữu hạn với mọi y ∈ F Nói riêng f0(x, −ei) vàf0(x, ei) hữu hạn với mọi i=1, k Vậy ∂f(x) bị chặn , và do tính đóng nênnó là compắc.
Ngược lại, giả sử rằng ∂f(x) 6= ∅ và ∂f(x) compắc Ta chỉ ra rằngx ∈ ri(dom f ).
Do ∂f(x) 6= ∅ nên x ∈ dom f Nếu trái lại x 6∈ ri(dom f), thì x ở trênbiên tương đối của dom f.
Trang 27Do dom f lồi, theo mệnh đề về siêu phẳng tựa, tồn tại một siêu phẳng tựacủa dom f tại x, tức là tồn tại vectơ p ∈ Rn, p 6= 0 sao cho
Điều này mâu thuẫn với tính bị chặn của ∂f(x) Vậy x ∈ ri(dom f).Ví dụ 2.3 Cho hàm một biến
f (x) =(
−2x12 nếu x > 0,+∞ nếu x < 0.Ta có
dom f = [0; +∞) , 0 6∈ int(dom f ).x∗ ∈ ∂f (0) ⇔ hx∗, xi + f (0) 6 f (x) , ∀x
⇔ x∗.x 6 −2x12, ∀x > 0 (2.9)Nếu x∗ < 0 , ta chọn x = 0.01 thì (2.9) không thoả mãn.
Nếu x∗
6 0 thì (2.9) không thoả mãn.Vậy ∂f(0) = ∅.
Ví dụ trên cho thấy nếu x 6∈ int(dom f) thì tập ∂f(x) có thể bằng rỗng.Mệnh đề 2.4 Cho f : Rn −→ R ∪ {+∞} và x ∈ dom f Khi đó
i) Nếu x ∈ ri(dom f), thì f0(x, y) = maxx∗∈∂f (x)hx∗, yi , ∀y.ii) Với mọi tập bị chặn C ⊂ int(dom f), tập ∪x∈C∂f (x) bị chặn iii) Nếu có thêm f đóng, thì
f∗(x∗) + f (x) = hx∗, xi ⇐⇒ x∗ ∈ ∂f (x), x ∈ ∂f (x∗).
Trang 28Chứng minh i) Do f0(x, ) là hàm lồi, thuần nhất dương, nên mọi hàm nona-phin của f0(x, )đều tuyến tính, tức là có dạng hp, i Vậy nếu hp, i là hàmnon a-phin của f0(x, )trên Rn, thì
hp, yi 6 f0(x, y) , ∀y.Theo mệnh đề 2.2 ta có p ∈ ∂f(x).
Hơn nữa, do f0(x, ) là một hàm lồi đóng, nên theo định lý xấp xỉ tập lồinó là bao trên của các hàm non a-phin của nó Vậy
f0(x, y) = Supp∈∂f (x)hp, yi.ii) Giả sử C ⊆ int(dom f).
ξ = Supx∗∈∂f (C)kx∗k = Supx∈CSupx∗∈∂f (C)kx∗k (2.10)Xét ánh xạ tuyến tính hx∗, zi Chuẩn của ánh xạ tuyến tính này là
kx∗k = Supkzk=1hx∗, zi.Thay vào (2.10) ta có :
ξ = Supx∈CSupx∗∈∂f (C)Supkzk=1hx∗, zi.Do
f0(x, z) = Supx∗∈∂f (x)hx∗, zinên ta có tiếp
ξ = Supkzk=1Supx∈C f0(x, z).Đặt g(z) = Supx∈Cf0(x, z).
Do x ∈ C ⊆ int(dom f), nên hàm f0(x, ) lồi trên Rn ( do đó liên tục ).Suy ra hàm g liên tục vì là bao trên của một họ hàm lồi liên tục trên Rn.
ξ = Supkzk=1g(z) = maxkzk=1g(z) < +∞.Chứng tỏ ∂f(C) bị chặn.
Trang 29iii) Theo định nghĩa hàm liên hợp, ta có
f∗(x∗) = Supx{hx∗, xi − f (x)}.Điều này tương đương với
f∗(x∗) > hx∗, yi − f (y) , ∀y.Do đó
f∗(x∗) + f (x) = hx∗, xi⇔ hx∗, yi − f (y) + f (x) 6 hx∗, xi , ∀y.Hay
hx∗, y − xi + f (x) 6 f (y) , ∀y.Vậy x∗ ∈ ∂f (x).
Do f đóng, nên theo hệ quả 1.1, ta có f = f∗∗.Theo định nghĩa của hàm liên hợp, ta có:
f∗∗ = Supx∗{hx, x∗i − f∗(x∗)}.Điều này tương đương với
f∗∗(x) > hx, yi − f∗(y) , ∀y.Hay
f (x) > hx, yi − f∗(y) , ∀y.Do đó
f∗(x∗) + f (x) = hx∗, xi⇔ hx, yi − f∗(y) + f∗(x∗) 6 hx∗, xi , ∀y.Hay
hx, y − x∗i + f∗(x∗) 6 f∗(y) , ∀y.Vậy x ∈ ∂f∗(x∗).
Trang 30Mệnh đề 2.5 Giả sử f : Rn −→ R ∪ {+∞} lồi, chính thường và
x ∈ dom f Khi đó f khả vi tại x khi và chỉ khi tồn tại x∗ ∈ Rn sao chof0(x, y) = hx∗, yi , ∀y.
Ngoài ra x ∈ int(dom f) và Of(x) = x∗.
Chứng minh Nếu f khả vi tại x thì như ở trên, ta đã chỉ ra rằngf0(x, y) = hOf (x), yi , ∀y.
Trang 31Vậy f0(x, y) hữu hạn trên toàn Rn, nên x ∈ int(dom f).Ngược lại f0
(x, y) = hOf (x), yi , ∀y Trước hết ta có x ∈ int(dom f ) vìf0(x, ) hữu hạn trên toàn Rn Để chứng minh tính khả vi của f tại x, ta lấy
Trước hết từ f0(x, y) = hx∗, yi, theo định nghĩa của f0(x, y), ta cóg(y) > 0 , ∀y và g(0) = 0.
βivi,trong đó vi(i ∈ I) là các đỉnh của H.
Ta có
g(y) := g(kyk y
kyk) = g(kykX
βivi) = g(X
βikykvi).Theo tính lồi của g thì
kyk → 0.
Chứng tỏ f khả vi tại x và do đó Of(x) = x∗.
Trang 32f (y) − f (x) > f [ty + (1 − t)x] − f (x) +
2t(1 − t)kx − yk2t
f (y) − f (x) > f0(x, y − x) + η
2kx − yk2.(b)→(a):
Cho t ∈ (0; 1) và ω = (1 − t)x + ty Khi đóy = ω + (1 − t)(y − x),x = ω + (−t)(y − x).Ap dụng (b), ta được:
f (y) > f (ω) + hf0(ω), y − ωi + η
2kω − yk2,f (x) > f (ω) + hf0(ω), x − ωi + η
2kω − xk2.Hay
f (y) > f (ω) + hf0(ω), (1 − t)(y − x)i + η
2(1 − t)
2ky − xk2,f (x) > f (ω) + hf0(ω), (−t)(y − x)i + η
ky − xk2.