Tính toán dưới vi phân
2.2 Các quy tắc tính toán dưới vi phân
Bổ đề 2.5. Giả sử f : Rn →R là một hàm lồi, α > 0, và h(x) = αf(x). Khi đó h lồi và ∂h(x) = α∂f(x), với mọi x.
Chứng minh. Vì h(x) = αf(x), mà f là hàm lồi nên h cũng là hàm lồi. Ta có g ∈ ∂f(x) nếu và chỉ nếu với mọi y
h(y) = αf(y) ≥ α[f(x) +hg, y−xi] = h(x) +hαg, y−xi,
tương đương với αg ∈ ∂h(x).
Bổ đề 2.6. Giả sử f : Rn → R là một hàm lồi, A là ma trận có kích thước m×n và h(x) =f(Ax). Khi đó ∂h(x) =AT∂f(Ax), với mọi x.
Chứng minh. Ta có g ∈ ∂f(Ax) nếu và chỉ nếu
h(y) =f(Ay) ≥ f(Ax) +hg, Ay −Axi = h(x) + hATg, y−xi,
tương đương với ATg ∈ ∂h(x).
Ví dụ 2.5. Xét hàm
h(x) =phx, Axi,
trong đó A là ma trận đối xứng xác định dương. Nhân tử hóa A = UTU, với U không suy biến, ta thấy rằng
h(x) = kU xk.
Do đó, từ Ví dụ 2.1 và Bổ đề 2.6 ta được:
∂h(0) = {UTg : kgk ≤ 1}
= {v : k(UT)−1vk ≤ 1} = {v : hv, A−1vi ≤ 1}.
Mà h(x) là một chuẩn có chuẩn đối ngẫu là kvkA−1 = phv, A−1vi.
Định lý 2.2. Giả sử f = f1 +f2 trong đó f1 : Rn → R và f2 : Rn →R
là các hàm lồi chính thường. Nếu tồn tại một điểm x0 ∈ domf sao cho
fi liên tục tại x0, thì
∂f(x) = ∂f1(x) +∂f2(x), với mọi x ∈ domf.
Chứng minh. Giả sử g1 ∈ ∂f1(x) và g2 ∈ ∂f2(x). Khi đó, với mọi y f(y) = f1(y) +f2(y) ≥f1(x) +hg1, y−xi+f2(x) +hg2, y −xi
Suy ra
∂f(x) ⊃ ∂f1(x) +∂f2(x).
Giả sử một dưới-gradient g ∈ ∂f(x) tồn tại sao cho g /∈ ∂f1(x) + ∂f2(x). Để áp dụng định lý tách [3, Theorem 2.14] ta cần chứng minh
rằng ∂f1(x) +∂f2(x) là một tập lồi đóng. Từ tính lồi của dưới vi phân
∂f1(x) và ∂f2(x) (xem Định lý 2.1 và nhận xét sau khi chứng minh nó)
và [3, Lemma 2.3] thì ∂f1(x) + ∂f2(x) là một tập lồi.
Cả hai dưới vi phân đều đóng và tổng ∂f1(x) +∂f2(x) đóng. Chúng
ta chứng minh tính chất kĩ thuật sau ý chính của chứng minh.
Nếu ∂f1(x) +∂f2(x) đóng, chúng ta có thể kết hợp [3, Theorem 2.14]
và tách g từ tổng ∂f1(x) +∂f2(x). Khi đó, tồn tại một hướng d ∈ Rn và
ε > 0 sao cho
hg, di ≥ hg1 + g2, di+ε, (2.9) với mọi g1 ∈ ∂f1(x) và g2 ∈ ∂f2(x). Suy ra hg1, di bị chặn với mọi
g1 ∈ ∂f1(x). Do đó, theo Bổ đề 2.2 ta được f10(x;d) = max g1∈∂f1(x) hg1, di < ∞. Tương tự f20(x;d) = max g2∈∂f2(x) hg2, di < ∞.
Lấy cận trên đúng của bên phải (2.9) trên g1 ∈ ∂f1(x) và g2 ∈ ∂f2(x) ta được
hg, di ≥ max
g1∈∂f1(x)hg1, di+ max
Mặt khác, hg, di ≤ f0(x;d) nên
f0(x;d) ≥ f10(x;d) +f20(x;d) +ε,
mâu thuẫn. Do đó một dưới-gradient g ∈ ∂f(x)\(∂f1(x) +∂f2(x)) không thể tồn tại.
Nếu một trong các hàm f1, f2 liên tục tại x, thì dưới vi phân của nó
là compact, và tổng ∂f1(x) + ∂f2(x) đóng. Nếu cả hai dưới vi phân đều
không bị chặn. Xét hai dãy g1k ∈ ∂f1(x) và g2k ∈ ∂f2(x) sao cho
gk1 +g2k → s, khi k → ∞.
Giả sử g /∈ ∂f1(x) +∂f2(x). Vì tất cả các điểm giới hạn của các dãy này phải là các phần tử của các phép tương ứng dưới vi phân nên kg1kk → ∞
và kg2kk → ∞. Xét dãy zk = g k 1 kgk1k. Giả sử zk có giới hạn z. Ta có f1(x0)−f1(x) ≥ hg1k, x0 −xi.
Chia chokgk1kvà qua giới hạn vớik → ∞ta kết luận rằng hz, x0−xi ≤ 0. Ta cũng có g2k = s−gk1 và do đó
f2(x0)−f2(x) ≥ hs−g1k, x0 −xi.
Chia cho kg1kk và qua giới hạn ta được hz, x0 −xi. Do đó
Vì f1 liên tục tại x0, tồn tại ε > 0 sao cho f1(x0 +εz) < ∞. ta được
f1(x0 +εz)−f1(x) ≥ hg1k, x0 + εz−xi.
Chia cho kg1kk và qua giới hạn ta kết luận rằng
0 ≥ hz, x0 −x+ εzi = εkzk2 = ε,
mâu thuẫn. Do đó, tổng ∂f1(x) +∂f2(x) đóng.
Định lý này được gọi là Định lý Moreau-Rockafellar.
Ví dụ 2.6. Xét tập
K = K1 ∩K2 ∩. . .∩Km,
trong đó mỗi Ki, i = 1,2, . . . , m là một nón lồi. Từ Ví dụ 2.4 ta biết rằng
∂δK(0) = K◦.
Mặt khác,
δK(x) =δK1(x) +δK2(x) +. . .+ δKm(x).
Nếu K1 ∩intK2 ∩. . .∩ intKm 6= ∅, sử dụng Định lý 2.2 ta được
∂δK(0) = ∂δK1(0) +∂δK2(0) +. . .+∂δKm(0) = K1◦ +K2◦ +. . .+Km◦.
Tổng quát hơn, cho Xi, i= 1,2, . . . , m là các tập lồi đóng, và cho
Ta có
∂δX(x) = NX(x).
Nếu X1 ∩intX2 ∩. . .∩intXm 6= ∅, Định lý 2.2 suy ra
NX(x) =NX1(x) +NX2(x) +. . .+NXm(x).