Dưới vi phân của hàm max

Một phần của tài liệu Các quy tắc tính toán dưới vi phân của hàm lồi (Trang 40 - 46)

Xét hàm

F(x) = sup

y∈Y

f(x, y).

Giả sử f : Rn×Y →R thỏa mãn các điều kiện sau:

(i) f(ã, y) lồi với mọi y ∈ Y;

(ii) f(x,ã) là nửa liờn tục trờn với mọi x trong một lõn cận xỏc định của một điểm x0;

(iii) Tập Y ⊂ Rm compact.

Hàm F là lồi theo công thức ở Bổ đề 1.4. Nó là chính thường do (ii).

Mục đích của chúng ta trong phần này là đưa ra công thức tính dưới vi phân của hàm F tại x0. Kí hiệu Yb(x) là tập các phần tử y ∈ Y mà f(x, y) = F(x). Vỡ f(x,ã) là nửa liờn tục trờn và Y là compact, nờn tập Yb(x) không rỗng và compact, với mỗi x trong một lân cận xác định của x0.

Kớ hiệu ∂xf(x0, y) là dưới vi phõn của hàm f(ã, y) tại x0. Định lý 2.3. Giả sử có điều kiện (i)−(iii). Khi đó

∂F(x0) ⊃ conv( [

y∈Yb(x0)

∂xf(x0, y)).

Ngoài ra nếu hàm f(ã, y) liờn tục tại x0 với mọi y ∈ Y, thỡ

∂F(x0) = conv( [

y∈Yb(x0)

∂xf(x0, y)). (2.10)

Chứng minh. Giả sử g ∈ ∂xf(x0, y0) cho một số y0 ∈ Yb(x0). Khi đó, với mỗi x ta có

F(x) = sup

y∈Y

f(x, y) ≥ f(x, y0) ≥f(x0, y0) + hg, x−xoi.

Do đó g ∈ ∂F(x0). Vì dưới vi phân lồi nên khẳng định đầu tiên của chúng ta đúng.

Ta chứng minh tập bên phải của (2.10) đóng. Xét một dãy hội tụ của vector sk ∈ ∂xf(x0, xk), với yk ∈ Yb(x0) và cho s∗ = limk→∞sk. Vì tập Yb(x0) là compact, ta giả sử rằng chuỗi yk hội tụ. Giới hạn của nó, y∗, là một phần tử của Yb(x0). Với mỗi x trong một lân cận nhỏ của x0, nửa liờn tục trờn f(x,ã) và sk là một dưới-gradient suy ra

f(x, y∗) ≥lim sup

k→∞

f(x, yk) ≥ lim sup

k→∞

[f(x0, yk) +hsk, x−x0i]

= f(x0, y∗) + hs∗, x−x0i.

Trong phép biến đổi cuối cùng, ta sử dụng f(x0, yk) =F(x0) = f(x0, y∗) suy ra s∗ ∈ ∂f(x0, y∗).

Giả sử khẳng định thứ hai của chúng ta là sai, tức là, tồn tại g ∈

∂F(x0) sao cho

g /∈ conv( [

y∈Yb(x0)

∂xf(x0, y)).

Vì tập bên phải là lồi và đóng, từ [3, Theorem 2.14] suy ra tồn tại d 6= 0

và ε > 0 sao cho

hg, di ≥ hs, di+ε (2.11) với mọi s ∈ ∂xf(x0, y) và mọi y ∈ Yb(x0). Xét các điểm của công thức x0 +τkd, trong đó τk ↓ 0. Vì tính lồi của F ta có

F(x0 +τkd)−F(x0)

τk ≥ hg, di.

Định nghĩa các tập

Yk = {y ∈ Y : f(x0 + τkd, y)−F(x0)

τk ≥ hg, di}, k = 1,2, . . .

Chỳng đúng vỡ f(x,ã) nửa liờn tục trờn. Chỳng khụng rỗng, vỡ Yb(x0 + τkd) ⊂ Yk. Hơn nữa, với mọi y ∈ Y đẳng thức

f(x0 +τ d, y)−F(x0)

τ = f(x0 + τ d, y)−f(x0, y)

τ + f(x0, y)−F(x0) τ

định nghĩa một hàm tăng của τ. Thật vậy, phân số đầu tiên là thương của một hàm lồi (xem công thức (1.8)) và phân số thứ hai có tử số không dương cố định. Điều này suy ra được

Y1 ⊃Y2 ⊃ Y3 ⊃ . . .

Các tập Yk compact và không rỗng, và do đó tồn tại một điểm y thuộc tất cả các tập. Khi đó

f(x0 +τkd, y)−F(x0)

τk ≥ hg, di, k = 1,2, . . .

Bởi vìf(x0+τkd, y) →f(x0, y)khik → ∞, chúng ta có f(x0, y) = F(x0),

nghĩa là,y ∈ Yb(x0). Đi qua giới hạn trong bất đẳng thức cuối với k → ∞ và sử dụng Định lý 2.1 ta kết luận rằng

k→∞lim

f(x0 +τkd, y)−F(x0)

τk = hs, di ≥ hg, di, với một số s ∈ ∂xf(x0, y). Điều này mâu thuẫn với (2.11).

Vớ dụ 2.7. Xột hàm giỏ trị riờng lớn nhất λmax(ã) được xỏc định trờn không gian Sn của các ma trận đối xứng có kích thước n× n. Nó lồi (xem Ví dụ 1.4). Vì

λmax(A) = max

kyk=1hy, Ayi,

Chúng ta có thể tính toán dưới vi phân của nó bởi Định lý 2.3, Tập

Yb(A) = {y ∈ Rn : hy, Ayi = λmax(A),kyk = 1},

là tập tất cả các vector riêng của A tương ứng với giá trị riêng lớn nhất và có chiều dài 1.

Trong [3, Example 2.31], ta sử dụng tích trong Frobenius,

hA, HiS = tr(AH) =

n

X

i=1 n

X

i=1

aijhij,

và ta viết lại các hàm như sau:

λmax(A) = max

kyk=1hyyT, AiS.

Với mỗi y ∈ Rn hàm fy(A) +hyyT, AiS là tuyến tính và gradient của nó

bằng ∇fy(A) = yyT. Do đó

∂λmax(A) = conv{yyT : Ay = λmax(A)y,kyk= 1}.

Khi đó, tập các ma trận có dạng W = yyT có thể được đặc trưng như sau: W có hạng 1 và W ∈ Sn+. Khi đó

tr(W) =kyk2 và hA, WiS = λmax(A).

Ta được

∂λmax(A) = conv{W ∈ Sn+ : hA, WiS = λmax,tr(W) = 1,rank(W) = 1}.

Ta có thể bỏ qua bao lồi và hạn chế hạng trong biểu diễn cuối của dưới vi phân:

∂λmax(A) ={W ∈ Sn+ :hA, WiS = λmax,tr(W) = 1}.

Thật vậy, mỗi phần tử của tập này có dạng W = Pn

j=1àjyjyTj , với vector riờng trực giaoyj củaW cú chuẩn 1, và với giỏ trị riờng tướng ứngàj ≥0.

Điều kiện tr(W) = 1 đưa ra Pn

j=1àj = 1. Do đú, hA, WiS =

n

X

j=1

àjhyj, Ayji ≤

n

X

j=1

àjλmax(A) =λmax(A).

Bất đẳng thức xảy ra nếu và chỉ nếu tương ứng của yj với àj dương là các vector riêng của A tương ứng với giá trị riêng lớn nhất của nó. Khi đó W là một tổ hợp lồi của hạng ma trận yjyjT hình thành từ các vector riờng của chỳng, với trọng lượng àj.

Khóa luận này trình bày một cách có hệ thống các khái niệm, tính chất cơ bản của tập lồi và hàm lồi. Sau đó đề cập về dưới-gradient, dưới vi phân, tính toán dưới vi phân và chứng minh một cách cụ thể một số tính chất của chúng. Cuối cùng khóa luận trình bày về dưới vi phân của hàm max.

Một phần của tài liệu Các quy tắc tính toán dưới vi phân của hàm lồi (Trang 40 - 46)

Tải bản đầy đủ (PDF)

(46 trang)