Trong đó ý tưởng cơ bản của lý thuyết này là xấp xỉ hàm lồi hoặc hàm Lipschitz cho trước bằng cảmột tập hợp, được gọi là tập dưới vi phân, nằm trong không gian đốingẫu, thay vì chỉ có vớ
Trang 1Luận văn được hoàn thành tại trường Đại học sư phạm Hà Nội 2 dưới
sự hướng dẫn của PGS.TS Nguyễn Năng Tâm
Tác giả xin bày tỏ lòng biết ơn chân thành, sâu sắc tới PGS.TS NguyễnNăng Tâm, người đã luôn quan tâm, động viên và tận tình hướng dẫntác giả trong quá trình thực hiện luận văn
Tác giả xin được gửi lời cảm ơn chân thành Ban giám hiệu trườngĐại học sư phạm Hà Nội 2, phòng Sau đại học, các thầy cô giáo trongnhà trường và các thầy cô giáo dạy cao học chuyên ngành Toán giải tích
đã tạo điều kiện thuận lợi trong quá trình tác giả học tập và nghiên cứu.Tác giả xin bày tỏ lòng biết ơn tới gia đình, người thân đã động viên
và tạo mọi điều kiện để tác giả có thể hoàn thành bản luận văn này
Hà Nội, ngày 10 tháng 9 năm 2009
Tác giả
Lê Chí Thanh
Trang 2Tác giả xin cam đoan luận văn là công trình nghiên cứu của riêng tácgiả dưới sự hướng dẫn của PGS.TS Nguyễn Năng Tâm.
Hà Nội, ngày 10 tháng 9 năm 2009
Tác giả
Lê Chí Thanh
Trang 3Mở đầu 1
1.1 Khái niệm không gian Banach và một số tính chất 31.2 Đạo hàm Fréchet và Gâteaux 71.3 Kết luận 18
2.1 Khái niệm mở đầu về dưới vi phân hàm lồi 192.1.1 Định nghĩa và những khái niệm cơ bản của hàm lồi 192.1.2 Dưới vi phân hàm lồi 222.2 Dưới vi phân của hàm lồi liên tục và nửa liên tục dưới 282.2.1 Dưới vi phân của hàm lồi liên tục 282.2.2 Dưới vi phân của hàm lồi nửa liên tục dưới 322.3 Một số phép toán dưới vi phân và bài toán ứng dụng 352.4 Kết luận 42Chương 3 Dưới vi phân của hàm Lipschitz địa phương 433.1 Khái niệm mở đầu về dưới vi phân của hàm Lipschitz địa
phương 433.1.1 Định nghĩa và những vấn đề cơ bản 433.1.2 Mối liên hệ với đạo hàm và dưới vi phân hàm lồi 50
Trang 43.2 Một số phép toán về dưới vi phân suy rộng 56
3.3 Kết luận 63
Chương 4 Đối đạo hàm và dưới vi phân 64 4.1 Nón pháp tuyến và đối đạo hàm 64
4.1.1 Nón pháp tuyến 64
4.1.2 Đối đạo hàm và một số tính chất cơ bản 72
4.2 Dưới vi phân qua giới hạn 79
4.2.1 Dưới vi phân 79
4.2.2 Một số quy tắc tính toán 80
4.3 Kết luận 93
Trang 5F : X ⇒ Y ánh xạ đa trị từ X vào Y
R = R ∪ {−∞, +∞} tập số thực suy rộng
X∗ không gian đối ngẫu của không gian Banach X
BX hình cầu đơn vị đóng trong không gian X
Bρ(x) hình cầu đóng tâm x, bán kính ρ
limsup giới hạn trên cho dãy số thực
Limsup giới hạn trên theo nghĩa Painlevé - Kuratowski
N (¯x, Ω) nón pháp tuyến Mordukhovich của Ω tại ¯xb
N (¯x, Ω) nón pháp tuyến Fréchet của Ω tại ¯x
f0(x; v) đạo hàm theo hướng của f tại x theo hướng v
f0(x; v) đạo hàm theo hướng suy rộng (đạo hàm Clarke)
của f tại x theo hướng v
∂∞f (x) dưới vi phân suy biến của f tại x
D∗F (¯x, ¯y) đối đạo hàm Mordukhovich của F tại (¯x, ¯y)b
D∗F (¯x, ¯y) đối đạo hàm Fréchet của F tại (¯x, ¯y)
xk −→ xω hội tụ theo tôpô yếu
x∗k −→ xω∗ ∗ hội tụ theo tôpô yếu∗
x −→ ¯Ω x hội tụ trong Ω
x −→ ¯f x x → ¯x, f (x) → f (¯x)
Trang 61 Lý do chọn đề tài
Sự phát minh ra các phép tính vi-tích phân vào cuối thế kỷ XVII của
I Newton và G M Leibniz đã đưa toán học sang một giai đoạn mới.Trải qua thời gian, lý thuyết phép tính vi-tích phân được phát triểnmạnh mẽ do những vấn đề toán học được đặt ra Như ta đã biết, tronggiải tích cổ điển, ngay cả trong R1 nhiều hàm từ khoảng (a, b) vào R1không khả vi Vì vậy rất khó xấp xỉ hàm này bởi một hàm tuyến tính
Để giải quyết vấn đề này, những năm 60 của thế kỷ XX, R T afellar đã xây dựng lý thuyết dưới vi phân cho hàm lồi Đến những năm
Rock-70, F H Clarke đã xây dựng lý thuyết dưới vi phân và dưới vi phânsuy rộng của hàm Lipschitz địa phương Trong đó ý tưởng cơ bản của
lý thuyết này là xấp xỉ hàm lồi (hoặc hàm Lipschitz) cho trước bằng cảmột tập hợp, được gọi là tập dưới vi phân, nằm trong không gian đốingẫu, thay vì chỉ có với một hàm tuyến tính như trong trường hợp khả
vi Ngay sau sự ra đời lý thuyết vi phân của Clarke, năm 1976 B S.Mordukhovich đã đề xuất và xây dựng lý thuyết vi phân với cách tiếpcận:
- Định nghĩa khái niệm dưới vi phân của các hàm số nhận giá trị trongtập số thực suy rộng;
- Sử dụng dưới vi phân để định nghĩa nón pháp tuyến (nói chung làkhông lồi) của các tập hợp;
- Sử dụng nón pháp tuyến (không lồi) để định nghĩa đối đạo hàm củaánh xạ đa trị;
- Phát triển các quy tắc tính toán;
- Áp dụng các khái niệm và quy tắc tính toán nói trên để chứng minhcác định lý cơ bản, nghiên cứu hoặc đặc trưng các tính chất đáng quan
Trang 7tâm của ánh xạ và hàm số trong các lý thuyết toán học, đưa ra các thuậttoán giải quyết các bài toán khác nhau.
Với mong muốn được tìm hiểu sâu hơn về sự phát triển của phép tínhvi-tích phân và một số ứng dụng của nó, tôi đã chọn nghiên cứu đề tài
"Đạo hàm suy rộng và ứng dụng"
2 Mục đích nghiên cứu
Đề tài nghiên cứu các kết quả đạt được về đạo hàm suy rộng và vớimột số ứng dụng vào bài toán tối ưu
3 Nhiệm vụ nghiên cứu
Việc nghiêu cứu luận văn với nhiệm vụ hệ thống, làm rõ các kháiniệm đạo hàm và trình bày một số ứng dụng của từng khái niệm trongmột số bài toán
4 Đối tượng và phạm vi nghiên cứu
- Vi phân Fréchet, Gâteaux
- Dưới vi phân của hàm lồi
- Dưới vi phân của hàm địa phương
- Đối đạo hàm Mordukhovich
5 Phương pháp nghiên cứu
- Đọc sách, nghiên cứu lý luận, tài liệu chuyên khảo
- Tổng hợp kiến thức, vận dụng cho mục đích nghiên cứu
6 Những đóng góp của đề tài
Trình bày một cách có hệ thống các kiến thức cơ bản về lý thuyếtđạo hàm suy rộng cùng với một số bài toán ứng dụng
Trang 8Một số kiến thức cơ bản
1.1 Khái niệm không gian Banach và một số tính
chất
Mục này trình bày một số tính chất cơ bản của không gian Banach
và đạo hàm Fréchet, Gâteaux sẽ được sử dụng về sau
Định nghĩa 1.1.1 (Không gian định chuẩn) Một không gian địnhchuẩn thực (phức) là một không gian vectơ thực (phức) X cùng với mộtánh xạ X → R, được gọi là chuẩn và kí hiệu k.k, thỏa mãn:
kxm − xnk < ε, ∀m, n > M
Định lý 1.1.1 Ta có những điều kiện sau là tương đương:
(a) (xn) là một dãy Cauchy;
(b) kxpn − xqnk → 0 khi n → ∞, với mỗi cặp dãy tăng của những sốnguyên dương (pn) và (qn);
(c) xpn−1 − xpn → 0 khi n → ∞, với mỗi dãy tăng của những số nguyêndương (pn)
Trang 9Nhận xét 1.1 Rõ ràng mỗi dãy hội tụ đều là dãy Cauchy.
Thật vậy, nếu kxn− xk → 0 thì kxpn − xqnk ≤ kxpn − xk+kxqn − xk → 0với mỗi cặp dãy tăng của chỉ số (pn) và (qn)
Điều ngược lại trong trường hợp tổng quát không đúng
Ví dụ 1.1.1 Cho P ([0, 1]) là không gian các đa thức trên [0, 1] vớichuẩn kP k = max
Thì (Pn) là một dãy Cauchy, nhưng nó không hội tụ trong P ([0, 1])
Bổ đề 1.1 Nếu (xn) là một dãy Cauchy của một không gian định chuẩn,thì dãy của chuẩn (kxnk) là hội tụ
Lưu ý rằng bổ đề này kéo theo mỗi dãy Cauchy là bị chặn, tức là nếu(xn) là một dãy Cauchy, thì có một số M thỏa mãn kxnk ≤ M với ∀n.Định nghĩa 1.1.3 (Không gian Banach) Một không gian định chuẩn
X được gọi là đủ nếu mỗi dãy Cauchy trong X hội tụ tới một phần tử của
X Một không gian định chuẩn đủ được gọi là một không gian Banach
Ví dụ 1.1.2 Chúng ta sẽ chỉ ra rằng không gian l2 bao gồm tất cảnhững dãy số phức x = (xn) sao cho chuỗi
|xn|2 là không gian Banach
Lấy (an) là một dãy Cauchy trong l2 Giả sử (an) = (αn,1, αn,2, ) Với
ε > 0 tùy ý, tồn tại một số N0 thỏa mãn
Trang 10Nhưng điều này cũng có nghĩa là, với mỗi k dãy (αn,k) là một dãy Cauchytrong C và vì vậy nó hội tụ.
∞
X
k=1
(|αk − αn,k|)2 = 0,
tức là dãy (an) hội tụ tới a trong l2
Ví dụ 1.1.3 Một ví dụ quan trọng khác của không gian Banach là khônggian C([a,b]) những hàm liên tục (giá trị thực hoặc phức) trên một đoạn[a, b] Nhắc lại rằng chuẩn trên C([a,b]) được định nghĩa kf k = max
[a,b] |f (x)|.Lấy (fn) là một dãy Cauchy trong C([a,b]) Với ε > 0 tùy ý tồn tại N0 ∈ Nsao cho
kfn − fmk < ε, ∀m, n ≥ N0;
Trang 11và vì vậy cũng có
|fn(x) − fm(x)| < ε, ∀m, n ≥ N0, ∀x ∈ [a, b] (1.3)Điều này kéo theo rằng (fn(x)) là một dãy Cauchy với mỗi x ∈ [a, b] Tính đủ của R (hoặc C) cho phép ta xác định
f (x) = lim
n→∞fn(x), x ∈ [a, b]
Bây giờ, cho m → ∞ trong (1.3) ta được
|fn(x) − f (x)| ≤ ε, ∀n ≥ N0, ∀x ∈ [a, b] (1.4)Lấy x0 ∈ [a, b] Khi đó fN0 là liên tục trên [a, b], tồn tại một số δ > 0 thỏamãn |fN0(x0) − fN0(y)| < ε, với mỗi y ∈ [a, b] thỏa mãn |x0 − y| < δ.Suy ra
|f (x0) − f (y)| ≤ |f (x0) − fN0(x0)| + |fN0(x0) − fN0(y)| + |fN0(y) − f (y)|
< ε + ε + ε = 3ε,
ở đó |x0 − y| < δ Do đó ta có tính liên tục của f Rõ ràng, (1.4) kéotheo
kfn− f k ≤ ε, ∀n ≥ N0,nên dãy (fn) hội tụ đều tới f
Định nghĩa 1.1.4 (Chuỗi hội tụ và hội tụ tuyệt đối) Một chuỗi
∞
P
n=1
xntrong không gian định chuẩn X được gọi là hội tụ nếu dãy những tổngriêng hội tụ trong X, tức là tồn tại x ∈ X thỏa mãn
Trong trường hợp tổng quát, một chuỗi hội tụ tuyệt đối không nhấtthiết hội tụ
Trang 12Định lý 1.1.2 Một không gian định chuẩn là không gian Banach nếu
và chỉ nếu mỗi chuỗi hội tụ tuyệt đối là hội tụ
Định lý 1.1.3 Một không gian vectơ con đóng của một không gianBanach là một không gian Banach
Nhận xét 1.2 Một số không gian nảy sinh tự nhiên trong ứng dụng làkhông đủ Nó có thể được bổ sung (thêm những phần tử mới) thànhmột không gian đủ
Cho (E, k.k) là một không gian định chuẩn không đủ Một không gianđịnh chuẩn
∼
E, k.k1
được gọi là không gian định chuẩn đủ của (E, k.k)nếu:
(a) Tồn tại một ánh xạ 1 − 1 : ω : E → E thỏa mãn∼
1.2 Đạo hàm Fréchet và Gâteaux
Gọi B1, B2 là những không gian Banach trên một trường F (có thể làthực hoặc phức) Giả sử rằng T : B1 → B2 là một toán tử (không nhấtthiết tuyến tính) với miền xác định D(T ) = B1
Định nghĩa 1.2.1 (Đạo hàm Gâteaux) Giả sử x là một phần tử cốđịnh của B1 Toán tử T : B1 → B2 được gọi là khả vi Gâteaux tại x nếutồn tại một toán tử tuyến tính liên tục A thỏa mãn
lim
t→0
T (x + th) − T (x)
Trang 13với mỗi h ∈ B1, ở đó t → 0 trong F.
Toán tử A được gọi là đạo Gâteaux của T tại x, và giá trị của nó tại hđược kí hiệu bởi A(h) = dT (x, h)
Từ định nghĩa trên, đạo hàm Gâteaux của một toán tử từ B1 vào B2tại x ∈ B1 là một toán tử tuyến tính từ B1 vào B2 Chú ý rằng nếu T
là một toán tử tuyến tính, thì dT (x, h) = T (h), tức là dT (x) = T với
Ví dụ 1.2.4 Cho B1 = RN và cho f là một hàm trên B1, tức là
f : B1 → R Lấy x = (x1, x2, , xN) ∈ B1 và h = (h1, h2, , hN) ∈ B1.Nếu f có đạo hàm riêng liên tục theo từng điểm thì vi phân Gâteauxcủa f là
Trang 14Với một x0 ∈ B1 cố định, đạo hàm Gâteaux
mà chính là gradient của f tại x0, kí hiệu Of (x0)
∂xj = aij.Với mỗi i = 1, , M và j = 1, , N , đạo hàm Gâteaux của f tại x có
Trang 15Ví dụ 1.2.6 Cho B = C[a,b] là không gian định chuẩn của hàm liên tụcgiá trị thực trên [a, b] với chuẩn được định nghĩa bởi kxk = sup
t∈[a,b]
|x(t)|.Lấy K(s, t) là một hàm liên tục giá trị thực được xác định trên [a, b]×[a, b], và lấy g(t, x) là một hàm liên tục giá trị thực trên [a, b] × R vớiđạo hàm riêng liên tục ∂g
∂x trên [a, b] × R Định nghĩa ánh xạ f : B → Bbởi
df (x, h) =
ddα
Vì vậy, đạo hàm Gâteaux của toán tử tích phân (1.9) là toán tử tíchphân tuyến tính (1.10) và hạch của nó là K(s, t)gx(t, x)
Định lý 1.2.2 (Định lý giá trị trung bình)[10, Theorem 8.2.2] Giả sửhàm f có đạo hàm Gâteaux df (x, h) tại mỗi điểm x ∈ B Khi đó với bất
kì hai điểm x, x + h ∈ B tồn tại một hằng số ξ ∈ (0, 1) thỏa mãn
f (x + h) − f (x) = df (x + ξh, h) (1.11)Chứng minh Đặt Φ(t) = f (x + th) Khi đó
Trang 16Áp dụng định lý giá trị trung bình với hàm một biến cho Φ ta đượcΦ(1) − Φ(0) = Φ0(ξ) với ξ ∈ (0, 1).
khi giới hạn tồn tại
Định nghĩa này không thể được sử dụng trong trường hợp của ánh
xạ được xác định trên một không gian Banach, bởi vì h là một vectơ,
và phép chia cho một vectơ là vô nghĩa Mặt khác, phép chia cho mộtvectơ có thể dễ dàng tránh được khi viết lại (1.12) là:
Định nghĩa cơ sở trên (1.14) có thể được suy rộng cho bao gồm ánh
xạ từ một không gian Banach vào một không gian Banach Điều nàydẫn đến khái niệm vi phân Fréchet và đạo hàm Fréchet
Định nghĩa 1.2.2 (Đạo hàm Fréchet) Cho x là một điểm cố định trongkhông gian Banach B1 Một toán tử tuyến tính liên tục A : B1 → B2được gọi là đạo hàm Fréchet của toán tử T : B1 → B2 tại x nếu:
T (x + h) − T (x) = Ah + Φ(x, h); (1.15)và
lim
khk→0
kΦ(x, h)k
Trang 17hay tương đương
lim
khk→0
kT (x + h) − T (x) − Ahk
Đạo hàm Fréchet tại x được kí hiệu là T0(x) hay dT (x)
Trong trường hợp của một hàm giá trị thực f : R → R, đạo hàmthông thường tại x là một số biểu diễn độ dốc của đồ thị hàm số tại x.Đạo hàm Fréchet của f không là một số nhưng là một toán tử tuyếntính từ R vào R Sự tồn tại đạo hàm thông thường f0(x) kéo theo sự tồntại đạo hàm Fréchet tại x
Trong giải tích cổ điển, tiếp tuyến của một đường cong là một đườngthẳng được hình thành bằng cách xấp xỉ tốt nhất với đường cong tronglân cận của điểm tiếp xúc Tương tự, đạo hàm Fréchet của một toán tử
f có thể được giải thích là phép xấp xỉ tuyến tính địa phương tốt nhất
Ta xét biến đổi trong f khi đối số của nó thay đổi từ x tới x + h, và sau
đó ta xấp xỉ thay đổi này bởi một toán tử tuyến tính A tức là:
f (x + h) = f (x) + Ah + ε, (1.18)
ở đó ε là sai số trong xấp xỉ tuyến tính Vì vậy, ε có bậc giống như độ lớn
h, trừ trường hợp khi A là bằng đạo hàm Fréchet của f Trong trườnghợp như vậy, ε = O(h), tức là ε nhỏ thua h khi h → 0 Trong nghĩa này,đạo hàm Fréchet đưa đến xấp xỉ tuyến tính tốt nhất của f gần x Cuốicùng, nếu A là một toán tử tuyến tính, thì đạo hàm của A chính là A
và xấp xỉ tuyến tính tốt nhất của A là A
Định lý 1.2.3 Nếu một ánh xạ có đạo hàm Fréchet tại một điểm, thì
nó có đạo hàm Gâteaux tại điểm đó và cả hai đạo hàm là bằng nhau
Chứng minh Lấy T : B1 → B2, và x ∈ B1 Nếu T có đạo hàm Fréchettại x thì:
lim
khk→0
kT (x + h) − T (x) − Ahk
Trang 18với toán tử tuyến tính liên tục A : B1 → B2 Đặc biệt, với bất kì h ∈ B1khác không cố định, ta có:
Vì vậy A là đạo hàm Gâteaux của T tại x
Hệ quả 1.1 Nếu đạo hàm Fréchet tồn tại, nó là duy nhất
Ví dụ 1.2.7 Cho f : R2 → R được định nghĩa
1 + h41 =
1
2 6= 0
Do đó f không khả vi Fréchet tại (0, 0)
Ví dụ 1.2.8 Xét toán tử T : C[a,b] → C[a,b] được định nghĩa
ở đó K : [a, b] × [a, b] → R và f : [a, b] × R → R là những hàm được đưa
ra Nếu f là đủ trơn, thì
= (T u) (x) + Ah + O(h),
Trang 19ở đó đạo hàm Fréchet A = T0(u) là
Chứng minh Cho Ω là một tập mở trong không gian Banach B1, và lấy
T1 là một toán tử từ Ω vào không gian Banach B2 Lấy x ∈ Ω và ε > 0thỏa mãn x + h ∈ Ω ở đó khk < ε Thì:
kT (x + h) − T (x)k = kAh + Φ(x, h)k → 0,khi khk → 0 Điều này chứng minh rằng T là liên tục tại x
Nhiều định lý, kết quả, và thuật toán của giải tích thông thường cóthể dễ dàng mở rộng cho đạo hàm Fréchet Ví dụ, quy tắc thường dùngcho phép tính vi phân của tổng và tích (trong trường hợp của hàm) củahai hay nhiều hàm áp dụng cho đạo hàm Fréchet
Định lý 1.2.5 (Chain Rule)[10, Theorem 8.2.5] Cho B1, B2, B3 là nhữngkhông gian Banach thực Nếu g : B1 → B2 là khả vi Fréchet tại x ∈ B1
Trang 20ở đó d = g(x + h) − g(x) Vì vậy
kΦ(x + h) − Φ(x) − f0(y)dk = O(kdk)
Trong biểu diễn của kd − g0(x)hk = O(khk), ta thu được
kΦ(x + h) − Φ(x) − f0(y)g0(x)hk = O(khk) + O(kdk)
Khi đó g là liên tục tại x, bởi Định lý 1.2.4 ta có kdk = O(khk) và vìvậy
Φ0(x)h = f0(g(x))g0(x)h
Định lý 1.2.6 Một toán tử tuyến tính T từ một không gian Banach vàomột không gian Banach là khả vi Fréchet nếu và chỉ nếu T là bị chặn.Trong trường hợp đó, T0 = T
Định nghĩa 1.2.3 (Đạo hàm Fréchet cấp hai) Nếu T : B1 → B2 là khả
vi Fréchet trên một tập mở Ω ⊂ B1 và T0 là khả vi Fréchet tại x ∈ Ω, thì
T được gọi là khả vi Fréchet cấp hai tại x Đạo hàm Fréchet của T0 tại
x được gọi là đạo hàm Fréchet cấp hai của T và được kí hiệu là T00(x).Chú ý rằng nếu T : B1 → B2 là khả vi Fréchet trên một tập mở
Ω ⊂ B1, thì T0 là một ánh xạ từ B1 vào B(B1, B2) (trong đó B(B1, B2)
kí hiệu không gian tất cả những ánh xạ tuyến tính bị chặn từ B1 vào
B2).Từ đó, nếu T00(x) tồn tại thì nó là một ánh xạ tuyến tính bị chặn
từ B1 vào B(B1, B2) Nếu T00 tồn tại tại mỗi điểm của Ω thì T00 : B1 →B(B1, B(B1, B2))
Trong giải tích cổ điển, sự tương tự của công thức (1.13) cho đạo hàmcấp hai có thể được viết là
Trang 21của h Điều đó nói lên rằng f0(x) là hệ số của số hạng tuyến tính h và
khk2 → 0khi h → 0
Trang 22f00(x)(h, k) trong những số hạng của f00(x)(h, h).
Ví dụ 1.2.10 Xét một toán tử tích phân không tuyến tính T : C[a,b] →
C[a,b] được định nghĩa bởi
+1
2Kuu(t, s, x(s))h
2(s) +
ds
Trang 23Vế trái của (1.28) biểu diễn giá trị tại t của hàm T00(x)(h, h) thu đượcbởi ứng dụng của toán tử song tuyến tính T00(x) cho cặp của hàm (h, h).
Rõ ràng, T00(x) được áp dụng cho một cặp tổng quát của những hàm(h, k) cho
Trong chương này chúng ta đã trình bày định nghĩa, một số tính chất
cơ bản của không gian Banach, đạo hàm Fréchet (đạo hàm mạnh), đạohàm Gâteaux (đạo hàm yếu) cùng với một số ví dụ minh họa
Một trong những ứng dụng chính của lý thuyết vi phân là tìm cực trịcủa các phiếm hàm Tuy nhiên vấn đề nảy sinh là khi tìm cực trị củamột số phiếm hàm không trơn (không khả vi) tại một số điểm thì lýthuyết vi phân nêu trên không vận dụng được Do đó, trong chương tiếptheo ta sẽ mở rộng khái niệm vi phân cho dưới vi phân của hàm lồi
Trang 24Dưới vi phân hàm lồi
Trong chương này chúng ta sẽ trình bày những kiến thức cơ bản củahàm lồi và dưới vi phân của hàm lồi cần dùng trong quá trình nghiêncứu một số bài toán tối ưu không trơn
2.1 Khái niệm mở đầu về dưới vi phân hàm lồi
2.1.1 Định nghĩa và những khái niệm cơ bản của hàm lồiCho X là không gian tôpô tuyến tính lồi địa phương Hausdorff vàhàm f : X → R, trong đó R = R ∪ {−∞, +∞}, các tập
dom f = {x ∈ X| f (x) < +∞} ,epi f = {(x, α) ∈ X × R| f (x) ≤ α} ,được gọi lần lượt là miền hữu hiệu và trên đồ thị của hàm f
Định nghĩa 2.1.1 Hàm f : X → R được gọi là lồi nếu trên đồ thị của
nó là một tập lồi trong X × R Nếu dom f 6= ∅ và f (x) > −∞ với mọi
Trang 25Định nghĩa 2.1.2 (Hàm nửa liên tục trên, nửa liên tục dưới) Một hàm
f : X → R được gọi là nửa liên tục dưới tại một điểm x ∈ X nếu
Một hàm mà nửa liên tục trên và nửa liên tục dưới tại x là liên tục tại
x theo nghĩa thông thường
Định nghĩa 2.1.3 Cho X là không gian định chuẩn
1) Ta nói rằng f là hàm Lipschitz trên tập D ⊂ X, nếu tồn tại số k saocho
|f (x) − f (x0)| ≤ kkx − x0k, x, x0 ∈ D
2) Hàm f được gọi là Lipschitz địa phương tại x ∈ X, nếu tồn tại số
ε > 0 sao cho f là Lipschitz trên B(x, ε) ∩ D
3) Hàm f được gọi là Lipschitz địa phương trên D, nếu nó Lipschitz địaphương tại mọi điểm của D
Mệnh đề 2.1.1 [24, Proposition 2.3] Một hàm lồi chính thường f trên
X là liên tục tại mỗi điểm trong của miền hữu hiệu của nó
Định lý 2.1.1 [24, Theorem 2.2] Cho một hàm lồi chính thường f trên
X Ta có các khẳng định sau là tương đương:
i) f là liên tục tại điểm x0 ∈ X;
ii) f là bị chặn trên tại lân cận của x0 ∈ X;
Trang 26Chứng minh [(i) ⇒ (ii)] Nếu f là liên tục tại một điểm x0 thì tồn tạimột lân cận U của x0 thỏa mãn f (x) < f (x0) + 1 với mọi ∀x ∈ U [(ii) ⇒ (iii)] Từ giả thiết suy ra tồn tại lân cận U của x0 và c > 0 saocho f (x) ≤ c, ∀x ∈ U Đặt
V = {(x, α) ∈ X × R| x ∈ U, α > c} ,
ta có V ⊂ epif và V là tập mở, nên ta suy ra int(epif ) 6= ∅
[(iii) ⇒ (iv)] Nếu int(epif ) 6= ∅ thì tồn tại một tập mở U và mộtkhoảng mở I ⊂ R thỏa mãn U × I ⊂ epif , do đó U ⊂ domf , tức làint(domf ) 6= ∅ Xét tập compact bất kì C ⊂ int(domf ) và lấy B làhình cầu đơn vị trong X Với mỗi r > 0, tập C + rB là compact, và
họ những tập đóng {(C + rB)\int(domf ), r > 0} có một giao là rỗng.Trong biểu diễn của tính compact của C + rB một họ con hữu hạn củanhững họ này phải có một giao bằng rỗng, do đó với r > 0 ta phải có(C + rB)\int(domf ) = ∅, nghĩa là (C + rB) ⊂ int(domf ) Bởi Mệnh đề2.1.1 hàm f là liên tục trên int(domf ) Kí hiệu µ1 và µ2 là cực đại vàcực tiểu của f trên C + rB Lấy x, x0 là hai điểm phân biệt trong C vàlấy z = x + r(x − x
x, x0 thỏa mãn x ∈ C, x0 ∈ C
|f (x) − f (x0)| ≤ k kx − x0k ,
Trang 27điều này chứng minh cho tính Lipschitz của f trên C.
(iv) ⇒ (v) và (v) ⇒ (i) : là rõ ràng
2.1.2 Dưới vi phân hàm lồi
Khái niệm hàm khả vi nhiều biến được biết đến bởi Jacobi và hàmkhả vi trong không gian định chuẩn bởi Fréchet và Gâteaux Nếu hàm
f đạt cực trị tương ứng tại x, gradient của f là bằng 0 tại điểm đó Vấn
đề nảy sinh trong lý thuyết tối ưu, lý thuyết trò chơi dẫn đến nhữnghàm không khả vi mà ta phải tìm cực tiểu của những hàm đó Ví dụnhư, ta nói đến hàm f (x) = |x| không khả vi tại x = 0, nhưng nó làhình bao trên (upper envelope) của hàm khả vi x → αx khi α biến thiêntrên [−1, 1] Như vậy chúng ta sẽ thấy rằng bất kì hàm nửa liên tục lồi
có thể được xấp xỉ bởi một hàm khả vi, ví dụ hàm x → |x| có thể đượcxấp xỉ bởi hàm fλ được xác định bởi
∂(f + g)(x0) = ∂f (x0) + ∂g(x0)
∂(f ◦ A)(x0) = AT∂f (Ax0),
Định nghĩa 2.1.4 Cho f : X → R với f (x0) hữu hạn tại x0 ∈ X, và
X∗ là không gian đối ngẫu của không gian tôpô tuyến tính lồi địa phương
Trang 28Hausdorff X Một phần tử p ∈ X∗ được gọi là một dưới gradient của ftại điểm x0 nếu
f (x) − f (x0) ≥ hp, x − x0i, ∀x ∈ X (2.2)Tập tất cả dưới gradient của f tại x0 được gọi là dưới vi phân của f tại
x0 và được kí hiệu là ∂f (x0)
Hàm f được gọi là dưới khả vi tại x0 nếu ∂f (x0) 6= ∅
Nhận xét 2.4 Rõ ràng rằng p ∈ X∗ là một dưới gradient của f tại x0
nếu và chỉ nếu tồn tại α ∈ R sao cho hàm affine x → hp, xi + α khôngtrội hơn f khắp nơi và bằng f (x0) tại điểm x0
Định lý 2.1.2 [20, Proposition 1.26] Cho f : X → R là lồi và x ∈domf , thì
Chứng minh Ta biết rằng nếu x0 ∈ int(domf ) thì f có một hàm affineh(x) thỏa mãn h(x0) = f (x0), tức là h(x) = hp, x − x0i + f (x0) với
p ∈ ∂f (x0) Vì vậy ∂f (x0) 6= ∅ với mỗi x0 ∈ int(domf ) Bây giờ ta xéttập bị chặn bất kì C ⊂ int(domf ) Khi đó theo chứng minh trong Định
lý 2.1.1 ta có r > 0 thỏa mãn C + rB ⊂ int(domf ), ở đó B kí hiệu hìnhcầu đơn vị trong X Bởi định nghĩa, với bất kì x ∈ C và p ∈ ∂f (x) ta
Trang 29có hp, y − xi + f (x) ≤ f (y) với mọi y Nhưng theo Định lý 2.1.1 thì tồntại γ > 0 thỏa mãn
|f (x) − f (y)| ≤ γky − xk, ∀y ∈ C + rB
Do đó |hp, y − xi| ≤ γ ky − xk với ∀y ∈ C + rB, tức là |hp, ui| ≤ γ kukvới ∀u ∈ B
Lấy u = p
kpk kéo theo kpk < γ, nên tập x∈C∪ ∂f (x) là bị chặn
Hệ quả 2.1 Cho f là một hàm lồi chính thường trên X Với bất kì tậpcon lồi bị chặn C của int(domf ) tồn tại một hằng số dương γ thỏa mãn
f (x) = sup {h(x)| h ∈ Q0} , ∀x ∈ C,
ở đó mỗi h ∈ Q0 có dạng h(x) = ha, xi − α với kak ≤ γ
Ta xét một số ví dụ về dưới vi phân hàm lồi
Ví dụ 2.1.11 Cho f : Rn → R là một hàm thuần nhất dương, nghĩa làmột hàm lồi f : Rn → R thỏa mãn f(λx) = λf(x), λ > 0 Khi đó
∂f (x0) = {p ∈ Rn| hp, x0i = f (x0), hp, xi ≤ f (x), ∀x} (2.3)Thật vậy, sử dụng dưới vi phân hàm lồi ta tính dưới vi phân của hàmtrên
Trang 30Nhận xét 2.5 Nếu ta thêm vào điều kiện f (−x) = f (x) ≥ 0 thì điềukiện hp, xi ≤ f (x) tương đương với |hp, xi| ≤ f (x), ∀x ∈ Rn.
Ví dụ 2.1.12 Tính dưới vi phân của hàm f (x) = kxk trong không gianBanach X
Ta thấy ngay f (x) là hàm lồi
∀x ∈ X, p ∈ ∂f (x0) ⇔ f (x) − f (x0) ≥ hp, x − x0i
⇔ kxk − kx0k ≥ hp, x − x0i
Thay x = 0 vào ta có − kx0k ≥ hp, −x0i = −hp, x0i ⇔ kx0k ≤ hp, x0i.Thay x = 2x0, ta có kx0k ≥ hp, x0i ⇒ kx0k = hp, x0i ≤ kpk kx0k (bấtđẳng thức Schwart)
Trang 31Ví dụ 2.1.13 Cho C là một tập lồi đóng trong Rn, và
f (x) = minky − xk với y ∈ C
Kí hiệu πC(x) là hình chiếu của x trên C, nên ta có: kπC(x) − xk =minky − xk với y ∈ C và hx − πC(x), y − πC(x)i ≤ 0, ∀y ∈ C Khi đó
ở đó NC(x0) kí hiệu nón chuẩn tắc của C tại x0 và B(0, 1) là hình cầuEuclide đơn vị
Nón chuẩn tắc NC(x0) của một tập lồi C ∈ Rn tại một điểm x0 ∈ Rn
được xác định bởi công thức
NC(x0) =
({x∗ ∈ Rn : hx∗, x − x0i ≤ 0, ∀x ∈ C} nếu x0 ∈ C,
0 nếu x0 ∈ C./Thật vậy, lấy x0 ∈ C, ta có f (x0) = 0 Khi đó p ∈ ∂f (x0) kéo theo
hp, x − x0i ≤ f (x), ∀x ∈ Rn Do vậy, trong trường hợp đặc biệt thì
Trang 32hp, x0 − πC(x0)i ≤ kπC(x0) − x0k
Suy ra hp, x0 − πC(x0)i = kπC(x0) − x0k, và do đó p = x0 − πC(x0)
kx0 − πC(x0)k.Ngược lại, từ
hp, x0 − πC(x0)i = kπC(x0) − x0k = f (x0)và
Trang 332.2 Dưới vi phân của hàm lồi liên tục và nửa liên
tục dưới
2.2.1 Dưới vi phân của hàm lồi liên tục
Định nghĩa 2.2.1 (Đạo hàm theo hướng) Cho f : X ∈ R là hàm bất
kì và lấy x0 là một điểm ở đó f là hữu hạn Nếu với u 6= 0 giới hạn
lim
t↓0
f (x0 + tu) − f (x0)
ttồn tại, thì nó được gọi là đạo hàm theo hướng của f tại x0 trong hướng
u và được kí hiệu: f0(x0, u)
(Ở đây khi t → 0+ ta còn gọi là đạo hàm theo hướng bên phải và có kíhiệu khác d+f (x0)(u))
Định lý 2.2.1 [24, Proposition 2.20] Cho f là một hàm lồi chính thường
u ∈ X, dưới vi phân ∂f (x0) là compact và
Trang 34(iii) Nếu f là liên tục tại x0 thì có một lân cận U của x0 sao cho f (x0+u)
bị chặn trên ở trên U Khi đó, bởi (i), có f0(x0; u) ≤ f (x0 + u) − f (x0),theo đó f0(x0; u) cũng bị chặn trên ở trên U , và do vậy là hữu hạn và liêntục trên X Điều kiện (2.5) khi đó kéo theo rằng ∂f (x0) là đóng, và do
đó compact vì nó bị chặn bởi Định lý 2.1.3 Trong tính thuần nhất của
Trang 35f0(x0; u), một hàm affine (affine minorant) mà đạt được tại điểm đó phải
có dạng hp, ui, với hp, ui ≤ f0(x0; u), ∀u, nghĩa là bởi (ii), p ∈ ∂f (x0).Bởi Hệ quả 2.1, ta có f0(x0, u) = max {hp, ui |p ∈ ∂f (x0)}
Bây giờ ta tìm mối liên hệ giữa dưới vi phân hàm lồi và vi phânGâteaux Nhắc lại rằng cho f : V → R với V ⊂ X, trong đó X là mộtkhông gian Banach Nếu x0 ∈ V , với v ∈ X thì
Định lý 2.2.2 (Mối liên hệ với vi phân Gâteaux)[11, Proposition 5.3]Cho f là một hàm lồi từ V vào R Nếu f là khả vi Gâteaux tại x0 ∈ V ,thì nó là dưới khả vi tại x0 và ∂f (x0) = {f0(x0)} Ngược lại, nếu tạiđiểm x0 ∈ V , f là liên tục và hữu hạn và dưới gradient chỉ có một phần
tử, thì f là khả vi Gâteaux tại x0 và ∂f (x0) = {f0(x0)}
Trang 36Tiếp theo ta sẽ tìm hiểu mối liên hệ giữa dưới vi phân của hàm lồiliên tục và toán tử đơn điệu Các kết quả này đã được trình bày trong[18].
Định nghĩa 2.2.2 Một ánh xạ đa trị T từ không gian Banach E vàonhững tập con của không gian đối ngẫu E∗ được gọi là toán tử đơn điệunếu
hx∗, y − xi ≤ f (y) − f (x) và − hy∗, y − xi = hy∗, x − yi ≤ f (x) − f (y);cộng vế với vế hai bất đẳng thức ta được điều cần chứng minh
Định nghĩa 2.2.3 Một tập con G của E × E∗ được gọi là đơn điệu khi
hx∗ − y∗, x − yi ≥ 0 ở đó (x, x∗), (y, y∗) ∈ G
Một ánh xạ đa trị T : E ⇒ 2E∗ là một toán tử đơn điệu nếu đồ thị củanó
G(T ) = {(x, x∗) ∈ E × E∗ : x∗ ∈ T (x)} ,
là một tập đơn điệu Một tập đơn điệu được gọi là đơn điệu cực đại nếu
nó là cực đại trong họ của những tập con đơn điệu của E × E∗ Ta nóirằng một toán tử đơn điệu T là đơn điệu cực đại khi đồ thị của nó làmột tập đơn điệu cực đại
Định lý 2.2.3 [20, Theorem 2.25] Cho E là một không gian Banach.Nếu f là hàm lồi và liên tục trên E, thì ánh xạ dưới vi phân của nó làđơn điệu cực đại
Trang 37Chứng minh Để chứng minh ∂f là cực đại theo định nghĩa ta sẽ chứngminh rằng với y ∈ E, y∗ ∈ E∗ mà y∗ ∈ ∂f (y), thì tồn tại x ∈ E và/
x∗ ∈ ∂f (x) thỏa mãn hy∗ − x∗, y − xi < 0 Để đơn giản chứng minh
ta có thể thay thế f bởi hàm lồi liên tục g được xác định bởi g(x) =
f (x + y) − hy∗, xi
Ta thấy rằng khi x∗ ∈ ∂g(x) nếu và chỉ nếu x∗ + y∗ ∈ ∂f (x + y) Vìvậy, nếu y∗ ∈ ∂f (y) thì 0 // ∈ ∂g(0) và nếu tồn tại x∗ và x với x∗ ∈ ∂g(x)thỏa mãn hx∗, xi < 0, thì với z = x + y và z∗ = x∗ + y∗ ta có z∗ ∈ ∂f (z)
và hy∗ − z∗, y − zi = hx∗, xi < 0 Giả sử rằng y = 0 và y∗ = 0, ta muốnthu được x ∈ E và x∗ ∈ ∂f (x) thỏa mãn hx∗, xi < 0
Ta biết rằng khi 0 không là một cực tiểu toàn cục của f , thì tồn tại mộtđiểm x1 ∈ E thỏa mãn f (0) > f (x1) Xét hàm lồi h(t) = f (tx1), 0 ≤
t ≤ 1 Khi đó đạo hàm theo hướng tại một điểm t0 ∈ (0; 1) rõ ràng bằng
f0(t0x1; x1) Giả sử lượng này là không âm với mỗi t0, bởi một dạng củađịnh lý giá trị trung bình, điều này có thể kéo theo rằng h(0) ≤ h(1),điều này là mâu thuẫn
Vì vậy lượng này âm với 0 < t0 < 1, nên bởi tính thuần nhất ( vàlấy x = t0x1), ta có f0(x, x) < 0 Bởi Định lý 2.2.1(iii), phải tồn tại
x∗ ∈ ∂f (x) thỏa mãn hx∗, xi = f0(x, x) < 0 Chứng minh được hoànthành
2.2.2 Dưới vi phân của hàm lồi nửa liên tục dưới
Định nghĩa 2.2.4 Cho X là không gian tôpô tuyến tính lồi địa phươngHausdorff, f : X → R là hàm lồi chính thường nửa liên tục dưới
Trang 38b) Nếu x ∈ domf ta định nghĩa như trước đó:
hp, yi ≤ d+f (x)(y) với ∀y ∈ X
Ví dụ 2.2.15 Từ ví dụ đưa ra trong nhận xét ở trên f (x) = −√
x với
x ≥ 0 ta có được rằng ∂f (0) = ∅ Tiếp theo ta lấy ví dụ để thấy rằng cóthể có ∂f (0) = ∅ cho một tập trù mật của những điểm x ∈ domf Cho C là tập con lồi đóng (compact) của l2 được xác định bởi
Chú ý rằng nếu ta mở rộng (cho f = +∞ với x ∈ l2\C) thì f là nửa liêntục dưới, nhưng không liên tục tại bất kì điểm nào của C
Định nghĩa 2.2.5 (ε− dưới vi phân) Cho f là một hàm lồi chínhthường nửa liên tục dưới và giả sử rằng x ∈ domf Với bất kì ε > 0 địnhnghĩa ε− dưới vi phân ∂εf (x) bởi
∂εf (x) = {p : hp, yi ≤ f (x + y) − f (x) + ε, ∀y ∈ X}
Trang 39f (x0) ≤ inf {f (x) : x ∈ X} + ε Thì với bất kì λ > 0 tồn tại một điểm
z ∈ domf thỏa mãn:
i) λ kz − x0k ≤ f (x0) − f (z),
ii) kz − x0k ≤ ε
λ,iii) λ kx − zk + f (x) > f (z) với x 6= z
Bổ đề 2.2 [20, Lemma 3.22] Giả sử rằng f là một hàm lồi chính thườngnửa liên tục dưới trên X Nếu α, β > 0, x0 ∈ X và f (x0) < infX f + αβ,thì tồn tại x ∈ X và p ∈ ∂f (x) thỏa mãn kx − x0k < β và kpk < α
Bổ đề 2.3 [20, Lemma 3.23] Với hàm f cho thỏa mãn như trên, giả
sử rằng x ∈ X (không nhất thiết ở trong domf ) và rằng infX f < f (x).Khi đó tồn tại z ∈ domf và z∗ ∈ ∂f (z) thỏa mãn f (z) < f (x) và
hz∗, x − zi > 0
Định lý 2.2.4 (Brφndsted - Rockafellar)[20, Theorem 3.17] Giả sử rằng
f là một hàm lồi chính thường nửa liên tục dưới trên không gian Banach
X Lấy điểm bất kì x0 ∈ domf , ε > 0, λ > 0 và bất kì x0∗ ∈ ∂εf (x0), thìtồn tại x ∈ domf và x∗ ∈ X∗ thỏa mãn:
x∗ ∈ ∂f (x), kx − x0k ≤ ε
λ và kx
∗ − x0∗k ≤ λ
Đặc biệt, miền xác định của ∂f là trù mật trong domf
Chứng minh Bởi giả thiết hx∗0, x − x0i ≤ f (x) − f (x0) + ε, ∀x ∈ X nên
g(x) = f (x) − hx∗0, xi , x ∈ X,
Trang 40là chính thường và nửa liên tục dưới, với domg = domf Hơn nữa g(x0) ≤infX g + ε Bởi Bổ đề 2.1 tồn tại z ∈ domf thỏa mãn λ kz − x0k ≤ ε
và λ kx − zk + g(x) ≥ g(z) với mọi x ∈ X Lấy h(x) = λ kx − zk (x ∈X), bất đẳng thức cuối cùng này kéo theo rằng 0 ∈ ∂(g + h)(z) =
∂g(z) + ∂h(z) (Định lý về lấy tổng dưới vi phân ta sẽ chứng minh ởphần sau) Vì vậy tồn tại z∗ ∈ ∂g(z) = ∂f (z) − x∗0 thỏa mãn −z∗ ∈
Vì vậy, ∂f là đơn điệu cực đại
2.3 Một số phép toán dưới vi phân và bài toán ứng
dụng
Trong phần này ta sẽ mở rộng tính toán từ vi phân theo nghĩa thôngthường cho dưới vi phân Trong các mục trên ta xét X là một khônggian tôpô tuyến tính lồi địa phương Hausdorff, để đơn giản ta sẽ xét ở