Giả sửf là một hàm lồi, chính thường trên không gian lồi địa phương
X và x0 ∈ domf. Một phiếm hàm x∗ ∈X∗ được gọi là dưới gradient của
f tại x0 nếu
f(x)≥f(x0) +hx−x0, x∗i, ∀x ∈X.
Về mặt hình học, điều đó có nghĩa rằng hàm affine
ϕ(x) := f(x0) +hx−x0, x∗i, x ∈ X
có đồ thị là một siêu phẳng tựa của epif tại điểm (x0, f(x0)) (xem thêm Hình 4.6). Tập hợp tất cả các dưới gradient của f tại x0 được gọi là dưới vi phân của f tại điểm đó và được kí hiệu là ∂f(x0). Vậy,
∂f(x0) = {x∗ ∈ X∗ | f(x)−f(x0)≥ hx−x0, x∗i, ∀x ∈X}.
Nếu ∂f(x0) là tập khác rỗng ta nói f khả dưới vi phân tại x0. Để thuận tiện ta cũng quy ước ∂f(x0) = ∅ nếu x0 6∈ domf. Dễ thấy ∂f(x0) là tập lồi đóng yếu∗ vì đó là giao của các nửa không gian đóng yếu∗:
∂f(x0) = \
x∈X
116 5.1. Định nghĩa dưới vi phân
Mệnh đề 5.1. Ba phát biểu sau là tương đương:
a) f(x0) +f∗(x∗) = hx0, x∗i; b) x∗ ∈ ∂f(x0); c) (x∗,−1) ∈Nepif(x0, f(x0)). Chứng minh. a)⇐⇒ hx0, x∗i −f(x0) =f∗(x∗) ⇐⇒ hx0, x∗i −f(x0)≥ hx, x∗i −f(x), ∀x ∈X ⇐⇒ f(x)−f(x0)≥ hx−x0, x∗i, ∀x ∈X ⇐⇒b) ⇐⇒ γ−f(x0)≥ hx−x0, x∗i, ∀(x, γ)∈ epif ⇐⇒ h(x, γ)−(x0, f(x0)),(x∗,−1)i ≤ 0, ∀(x, γ)∈ epif ⇐⇒c).
Định lí 5.2. Nếu f lồi, chính thường và liên tục tại một điểm nào đó, thì tại mọi điểm x0 ∈ int(domf), ∂f(x0) là tập lồi, compact yếu*, khác rỗng.
Chứng minh. Từ Định lí 4.13 ta có int(epif)6= ∅ và f liên tục tại x0. Vì (x0, f(x0))không thuộc int(epif)nên, theo Định lí Tách, tồn tại(x∗, β)6= (0,0) sao cho
hx0, x∗i+βf(x0)≤ hx, x∗i+βγ, ∀(x, γ)∈epif.
Cố định x ∈ domf và cho f(x)≤ γ → +∞ ta có thể khẳng định β ≥ 0. Lại thay γ = f(x) với x∈ domf ta nhận được
hx0, x∗i+βf(x0)≤ hx, x∗i+βf(x), ∀x ∈domf.
Nếu β = 0 thì do x0 ∈ int(domf) suy ra x∗ = 0 mâu thuẫn. Vậy β > 0. Chia hai vế của bất đẳng thức trên cho β và đặt x∗
0 =−xβ∗ ta nhận được
f(x)−f(x0)≥ hx−x0, x∗
Vậy x∗
0 ∈ ∂f(x0), tức là ∂f(x0)6=∅. Tính lồi của tập này suy ra trực tiếp từ định nghĩa còn tính compact yếu* nhận được từ Hệ quả 3.10.
Ví dụ 5.1.
a) Nếu f là hàm affine liên tục: f(x) = hx, x∗i+α, thì
∂f(x0) ={x∗}, ∀x0 ∈ X. b) Nếu C là tập lồi và x0 ∈C, thì
∂δC(x0) ={x∗ ∈ X∗ | hx−x0, x∗i ≤ 0, ∀x∈ C} =NC(x0). c) Nếu X là không gian định chuẩn và f(x) =kxk, thì
∂f(x0) = {x∗ | kx∗k= 1, hx0, x∗i =kx0k}, x0 6= 0; {x∗ | kx∗k ≤1}= B∗, x0 = 0. Thật vậy, ∂f(0) = {x∗ ∈ X∗ | kxk ≥ hx, x∗i, ∀x ∈ X} = B∗. Với x0 6= 0 ta có x∗ ∈ ∂f(x0)⇒ hx−x0, x∗i ≤ kxk − kx0k ≤ kx−x0k, ∀x∈ X. (5.1) Thay x lần lượt bởi 2x0 và 1
2x0 ta nhận được hx0, x∗i = kx0k, suy ra
kx∗k ≥1. Mặt khác, từ (5.1) ta cũng có kx∗k ≤1. Vậy kx∗k = 1.
Ngược lại, nếu kx∗k= 1 và hx0, x∗i=kx0k thì với mọi x∈ X ta có
kxk − kx0k ≥ hx, x∗i − kx0k= hx−x0, x∗i,
nên x∗ ∈ ∂f(x0).