Tập Affine - Luận văn: VỀ NGUYÊN LÝ NHÂN TỬ LAGRAN- 123docz.net

Định Nghĩa 2.11.

TậpA⊂Rn được gọi làtập affine, nếu

(1−λ)x+λy∈A, (∀x,y∈ A, ∀λ ∈R).

Nhận xét 2.1.

Nếu Alà tập affine, thì vớia∈Rn

A+a={x+a : x∈A}.

là tập affine.

Mệnh Đề 2.1.

TậpM ⊂Rn là một không gian con khi và chỉ khiM là tập affine chứa không.

Định Nghĩa 2.12.

Tập affine A được gọi là song song với tập affineM nếu tồn tạia∈ Rn

sao cho

A=M+a.

Kí hiệu A//M.

Mệnh Đề 2.2.

Mỗi tập affineA6= /0song song với một không gian con duy nhấtLđược xác định bởi

2.1.4. Các định lý tách.

Giả sử X là không gian lồi địa phương, X∗ là không gian liên hợp của

X, tức là không gian các phiếm hàm tuyến tính liên tục trên X.

Định Nghĩa 2.13.

Tập M ⊂ X thỏa mãn: bất cứ đường thẳng nào đi qua hai điểm của M

cũng nằm trọn trong M được gọi là mộtđa tạp tuyến tínhtrong X.

Nhận Xét 2.2.

Khái niệm đa tạp tuyến tính chính là khái niệm tập affine trong không gian hữu hạn chiều.

Lấyx∗ ∈X∗, x∗ 6=0, β ∈Rvà kí hiệu H(x∗,β) ={x∈X :hx∗,xi =β}. H+(x∗,β) ={x∈X :hx∗,xi ≤β}. H−(x∗,β) ={x∈X :hx∗,xi ≥β}. Định Nghĩa 2.14. Với06=x∗ ∈X∗, β ∈Rthì

• TậpH(x∗,β) được gọi là mộtsiêu phẳngtrong X.

• TậpH+(x∗,β)vàH−(x∗,β)được gọi là các nửa không giansinh bởi siêu phẳngH(x∗,β).

Định Nghĩa 2.15.

Cho các tập hợpA,B ⊂X. Ta nói phiếm hàm tuyến tính liên tụcx∗ 6=0

tách A vàB, nếu tồn tại sốα sao cho

hx∗,yi ≤α ≤ hx∗,xi (∀x∈A,∀y∈B). (2.1)

Nếu (2.1) có dạng

thì ta nóix∗ tách ngặt A vàB.

Siêu phẳng đóng

H(x∗,α) ={x∈X :hx∗,xi=α}.

được gọi là siêu phẳng tách AvàB. Các tập Avà Bđược gọi làtách được.

Định Lý 2.1.(Định Lí Tách Thứ Nhất).

Giả SửA vàBlà hai tập lồi, khác rỗng trong không gian lồi địa phương X, A∩B = /0, intA 6= /0 (trong đó kí hiệu intA là phần trong của A). Khi

đó, tồn tại x∗ ∈ X∗,x∗ 6= 0 tách A và B. Tức là, tồn tại x∗ ∈ X∗ sao cho

hx∗,xi ≥ hx∗,yi với (∀x∈A,∀y∈ B).

Định Lý 2.2.(Định Lý Tách Thứ Hai).

Giả sửAlà tập con lồi đóng, khác rỗng trong không gian lồi địa phương

X, x0 ∈/ A. Khi đó, tồn tạix∗ 6=0,x∗ ∈X∗ tách ngặtA vàx0.

2.1.5. Dưới vi phân của hàm lồi.

Cho f là hàm lồi chính thường trênX.

Định Nghĩa 2.16.

Phiếm hàm x∗ ∈ X∗ được gọi là dưới gradient của hàm số f tại điểm

x∈X nếu

f(x)− f(x)≥ hx∗,x−xi, (∀x∈X).

Tập tất cả các dưới gradient của hàm số f tại xđược gọi là dưới vi phân

của hàm f tại điểm x, kí hiệu là∂f(x), tức là:

∂ f(x) ={x∗∈ X∗ : f(x)− f(x)≥ hx∗,x−xi, ∀x∈X}.

Nhận Xét 2.3.

Trong giải tích lồi, dưới vi phân đóng vai trò giống với đạo hàm trong giải tích cổ điển. Nếu hàm f là khả vi Gateaux tại mọi điểm, thì ta có thể chứng minh được rằng: dưới vi phân của hàm f chỉ có một giá trị, và đó chính là đạo hàm Gateaux.

Mệnh Đề 2.3.

Nếu hàm f khả vi tạixthì:∂ f(x) =∇f(x).

Chứng minh

Nếu p∈∂xthì với mọiu∈X,t >0, ta có

f(x+tu)− f(x) ≥thp,ui. Từ đó suy ra f(x+tu)− f(x) t ≥ hp,ui (vì t >0). Chot −→0ta được h5f(x¯),ui ≥ hp,ui. Điều đó có nghĩa là h5f(x¯)−p,ui ≥0 ∀u∈X. Vậy: p=5f(x). Ví Dụ 2.3.Một số ví dụ về dưới vi phân. 1. Cho hàm affine f(x):=hx∗,xi+α (x∗ ∈X∗,α ∈R). thì∂ f(x) ={x∗}, ∀x∈X.

2. Giả sửX là không gian Banach thì dưới vi phân của hàm:

f(x) =||x||là ∂ f(x) =

x∗ ∈X∗ :||x∗|| ≤1 Khi x=0

x∗ ∈X∗ :||x∗||=1,hx∗,xi=||x|| Khi x6=0.

Nói riêng, nếuX =R, f(x) =|x| thì ∂ f(x) =

( x

|x| Khi x6=0

3. Dưới vi phân của hàm chỉδ(x|A)của một tập lồi A là

∂δ(x|A) ={x∗∈ X∗ :hx∗,x−x¯i ≤0, ∀x∈A}=N(x|A).

Thật vậy, vớix∈Athì

x∗ ∈∂δ(x|A) ⇔∂δ(x|A)≥∂δ(x|A) +hx∗,x−xi, ∀x∈X

⇔ hx∗,x−xi ≤0, ∀x∈A.

Điều này có nghĩa rằng, x∗ là vectơ pháp tuyến của A tại x. Như vậy,

∂δ(x|A) là nón pháp tuyến củaA tạix. Do đó

∂δ(x|A) =N(x|A).

Chú ý rằng

• Với x∈/ A thì∂δ(x|A) = /0

• Với ∀x∈A thì∂δ(x|A) 6= /0, vì khix∈Akéo theo 0∈∂δ(x|A). Nếu A=L là một không gian con thì

∂δ(x|L) =N(x|L) =L⊥

trong đóL⊥ ={x∗ ∈X∗:hx∗,xi=0, ∀x∈L}.

2.1.6. Định lý cơ bản về dưới vi phân của tổng các hàm lồi.Định Lý 2.3.(Moreau-Rockafellar). Định Lý 2.3.(Moreau-Rockafellar).

a) Cho các hàm f1 và f2 là những hàm lồi chính thường trên X. Khi đó

∂(f1+ f2)(x)⊃∂ f1(x) +∂f2(x).

b) Nếu một trong các hàm này mà liên tục tại một điểm thuộc miền hữu hiệu của hàm kia thì ta có

∂(f1+ f2)(x) =∂ f1(x) +∂f2(x).

Chứng Minh

a) Lấyx∗i ∈∂ fi(x), i=1,2. Khi đó, với∀z∈X ta có

Suy ra hx∗1+x∗2, z−xi ≤ f1(z) + f2(z)− f1(x) + f2(x). do đó x∗1+x∗2 ⊃∂(f1+ f2)(x). Như vậy ∂(f1+ f2)(x)⊃∂ f1(x) +∂f2(x).

b) Ta chứng minh rằng, nếu f1 liên tục tại x∈domf2 thì

∂(f1+ f2)(x) =∂ f1(x) +∂f2(x).

Ta có, int(epi f1)6= /0

Thật vậy,ε >0, tồn tại lân cận U mở củaxsao cho

|f1(x)− f1(x)|<ε (∀x∈U).

Do đó tập

A={(x,α)∈X×R:α > f1(x) +ε, x∈U} ⊂ epif1.

vàA mở. Suy raint(epi f1)6= /0.

Lấyx∗ ∈∂(f1+ f2)(x). Xét các tập sau

C1 ={(z,α)∈X ×R:α ≥ f1(x+z)− f1(x)}.

C2 ={(z,α)∈X×R:α <hx∗,zi − f2(x+z) + f2(x)}.

Khi đó

C1 =epif1−(x, f1(x)).

Vì vậy:C1 lồi và intC1 6=0.

Mặt khác, ta cũng có tậpC2 là lồi. Thật vậy, lấy(zi,αi)∈C2, (i=1,2) vàλ ∈[0,1], ta có αi<hx∗,zii− f2(x+zi) + f2(x), (i=1,2). (2.2) Do f2 là hàm lồi nên f2 λ(x+z1) + (1−λ)(x+z2)≤ λf2(x+z1) + (1−λ)f2(x+z2). (2.3)

Từ (2.2)và (2.3) suy ra λα1+ (1−λ)α2 <hx∗,λz1+ (1−λ)z2i− −f2 λ(x+z1) + (1−λ)(x+z2) + f2(x). Do đó λ(z1,α1) + (1−λ)(z2,α2)∈C2. Vậy:C2 lồi. Ta lại có:C1∩C2= /0. Thật vậy, nếu ∃(z0,α0)∈C1∩C2, thì hx∗,z0i − f2(x+z0) + f2(x)> f1(x+z0)− f1(x). Suy ra hx∗,z0i> f1(x+z0) + f2(x+z0)− f1(x) + f2(x) .

Điều này mâu thuẫn với giả thiết rằng: x∗ ∈∂(f1+ f2)(x)

VậyC1∩C2= /0.

Theo định lý tách thứ nhất∃x∗1 ∈X∗ và∃β ∈Rvới(x∗1,β)6=0sao cho

sup

(z,α)∈C1{hx∗1,zi+βα} ≤ inf

(z,α)∈C2{hx∗1,zi+βα}. (2.4)

Rõ ràng β ≤0, bởi vì nếu β >0 thì, cận trên trong (2.4) là +∞, còn cận dưới là −∞.

Hơn nữa,β 6=0, vì nếuβ =0thì bất đẳng(2.4) có dạng

sup z∈dom f1−xhx∗1,zi ≤ inf z∈dom f2−xhx1∗,zi. (2.5) Mặt khác,x∗16=0 (do β =0). Vì thế: hx∗1,x¯−xi< sup z∈U−xhx∗1,zi ≤ sup z∈dom f1−xhx∗1,zi. Do đó inf z∈dom f2−xhx∗1,zi ≤ hx∗1,x¯−xi< sup z∈dom f1−xhx∗1,zi.

Điều này mâu thuẫn với (2.5). Vì vậy β 6=0 và ta cóβ <0.

Không làm mất tính chất tổng quát, có thể xemβ =−1. Như vậyC1 và

C2 tách được bởi siêu phẳng

H ={(z,α)∈X×R:hx∗1,zi −α =0}. Do đó từ(2.4) suy ra sup z {hx∗1,zi − f1(x+z) + f1(x)} ≤ ≤inf z {hx∗1−x∗,zi+ f2(x+z)− f2(x)}. (2.6)

Các biểu thức trong ngoặc của cả hai vế trái và phải của (2.6) sẽ triệt tiêu với z=0. Do đó, khi đặtx∗2 =x∗−x∗1, ta nhận được

f1(x+z)− f1(x) ≥ hx∗1,zi, (∀z∈X). f2(x+z)− f2(x) ≥ hx∗2,zi, (∀z∈X). Suy ra x∗i ∈∂ fi(x), (i=1,2). Vậy ∂(f1+ f2)(x) =∂f1(x) +∂f2(x).

Bằng phương pháp quy nạp,định lý Moreau-Rockafellarcó thể mở rộng với số lượng các hàm số bất kỳ.

Hệ Quả 2.1.

a) Giả sử f1, . . . , fn là những hàm lồi chính thường trên X. Khi đó

∂(f1+···+ fn)⊃∂f1(x) +···+∂ fn(x), (∀x∈X).

b) Hơn nữa nếu tại điểm x¯ ∈ Tn

i=1domfi, tất cả các hàm số f1, . . . , fn

đều liên tục (có thể trừ ra một hàm), thì với ∀x∈X ta có

Chứng Minh.

Giả sử,x∗ ∈∂f1(x) +∂f2(x) +···+∂ fn(x) thì

x∗ =x∗1+···+x∗n với x∗i ∈∂ fi(x).

Theo định nghĩa dưới vi phân ta có

hx∗i,z−xi ≤ fi(z)− fi(x), i=1, . . . ,n. Do đó hx∗1+···+x∗n,z−xi ≤[f1(z) +···+ fn(z)]−[f1(x) +···+ fn(x)]. Suy ra x∗ =x∗1+···+x∗n∈∂(f1+···+ fn)(x). Vậy ∂(f1+···+ fn)(x)⊃∂ f1(x) +···+∂ fn(x).

b) Ta chứng minh theo quy nạp.

Trường hợp n=2 chính là định lý Moreau-Rockafellar đã được chứng minh. Giả sử(2.7)đúng vớin=k, tức là, nếu mọi hàm số f1, . . . , fk (có thể trừ ra một hàm) đều liên tục tại

x∈ n \ i=1 domfi. thì ∂(f1+···+ fk)(x) =∂ f1(x) +···+∂ fk(x).

Ta cần chứng minh (2.7) đúng với n= k+1, tức là nếu mọi hàm số

f1, . . . , fk,fk+1 (có thể trừ ra một hàm) đều liên tục tại

x∈ k+1 \ i=1 domfi. thì ∂(f1+···+ fk+1)(x) =∂f1(x) +···+∂ fk+1(x) Thật vậy vì(2.7)đúng với n=2vàn=k, ta có ∂[(f1+ f2+···+ fk) + fk+1](x) =∂(f1+ f2+···+ fk)(x) +∂fk+1(x)

=∂f1(x) +∂f2(x) +···+∂ fk(x) +∂fk+1(x).

Tức là, (2.7)đúng với n=k+1.

Vậy(2.7) đúng với mọi số tự nhiênn.

2.2. Điều kiện cần đủ cho bài toán tối ưu lồi.

Cho X là một không gian tôpô tuyến tính lồi địa phương, A ⊂ X là tập lồi đóng không rỗng. f,gi: X −→Rlà những hàm lồi vàhj: X −→R

là những hàm afin. Xét bài toán quy hoạch lồi tổng quát cho dưới dạng sau

       minf(x) x∈A gi(x)≤0 (i=1,2, . . . ,m) hj(x) =0 (j=1,2, . . . ,p) trong đó: • x∈Agọi là ràng buộc hình học. • gi(x)≤0gọi là ràng buộc bất đẳng thức. • hj(x) =0gọi là ràng buộc đẳng thức. • Ω={x∈ A : gi(x)≤0(i=1, . . . ,n),hj(x) =0(j=1, . . . ,p)} gọi là

tập chấp nhận được. Sử dụng định nghĩa, ta có thể chứng minh tập chấp nhận được là tập lồi.

Định Nghĩa 2.17.

Hàm LagrangeL: A×Rm

+×Rp −→R của bài toán(P) được xác định như sau L(x,λ,µ) =λ0f(x) + m ∑ i=1 λigi(x) + p ∑ j=1 µjhj(x). trong đóx∈A, λ0 ∈R+, λ = (λ1, . . . ,λm)∈ Rm +, µ = (µ1, . . . ,µp)∈Rp. Khi đó, λi gọi là các nhân tử Lagrange ứng với rằng buộcgi(x) ≤0 và µj

2.2.1. Bài toán không có ràng buộc.

Giả sử X là không gian lồi địa phương, f là hàm lồi trên X. Xét bài toán

(P7) f(x)−→inf.

Định Lý 2.4.

Đểx∈X là nghiệm của(P7), điều kiện cần và đủ là 0∈∂f(x)

Chứng minh

Ta có, xlà nghiệm của(P2)khi và chỉ khi

f(x)≤ f(x), (∀x∈X).

Suy ra

0=h0,x−xi ≤ f(x)− f(x), (∀x∈X).

Vậy 0∈ ∂f(x).

2.2.2. Bài toán với ràng buộc đẳng thức.

Giả sử f là một hàm lồi trên X, C là đa tạp tuyến tính song song với không gian conM trongX. Xét bài toán

(P8)

f(x) −→inf x∈C.

Định Lý 2.5.

a) Giả sử f liên tục tại một điểm củaC, x là một nghiệm của bài toán

(P8). Khi đó

∂f(x)∩M⊥ 6= /0. (2.8)

b) Giả sử(2.8) đúng tại∀x∈C. Khi đó xlà nghiệm của bài toán(P8).

Chứng minh

Ta chú ý rằng

a) Xét hàm

L(x) = f(x) +δ(x|C).

trong đó:δ(x|M|) là hàm chỉ của tậpC. Khi đóL(x) là hàm lồi trênX. Rõ ràngx là nghiệm của bài toán (P8) khi và chỉ khi hàmL(x) đạt cực tiểu tại x. Theo định lý (2.4) thì

0∈∂L(x).

Do tính liên tục của f, nên ta có thể áp dụng định lý Moreau-Rockafellar, và nhận được

0∈∂L(x) =∂ f(x) +∂δ(x|C).

Từ ví dụ(2.3.3), ta lại có

∂δ(x|C) =N(x|C) =M⊥.

Do đó ta có: ∂f(x)∩M⊥6= /0.

b) Giả sử∂ f(x)∩M⊥6= /0 vớix∈C. Khi đó,∃x∗ ∈∂f(x)∩M⊥. Vì x−x∈M vớix∈C, cho nên

0=hx∗,x−xi 6= f(x)− f(x), (∀x∈C).

Do đóxlà nghiệm của bài toán(P8).

Định Lý 2.6.

ChoX là không gian Banach, x∗i ∈X∗, αi∈R, (i=1, . . . ,m)và

C ={x∈X :hx∗i,xi=αi, (i=1, . . . ,m)}.

Giả sử f là hàm lồi trên X và liên tục tại một điểm củaC. Khi đó,xđạt cực tiểu của hàm f trênC khi và chỉ khi tồn tại các sốλi∈R, (i=1, . . . ,m)

sao cho

λ1x∗1+···+λmx∗m∈∂ f(x).

Bổ Đề 2.1.

Giả sửX là không gian Banach, x∗i ∈X∗, (i=1, . . . ,m). Đặt

M ={x∈X :hx∗i,xi=0, i=1, . . . ,m}.

Khi đó

M⊥=lin{x∗1, . . . ,x∗m}.

trong đó linlà kí hiệu bao tuyến tính.

Chứng minh

Không mất tính tổng quát, ta có thể xem nhưx∗1, . . . ,x∗n là độc lập tuyến tính. Xét toán tử tuyến tính λ : X −→Rm được xác định như sau

x−→λx= hx∗1,xi, . . . ,hx∗m,xi . Khi đó, Imλ =Rm. Theo bổ đề (1.1) ta có (Kerλ)⊥=Imλ∗. Ta lại có (Kerλ)⊥=M⊥, Imλ∗ =lin{x∗1, . . . ,x∗2}. Do đó M⊥=lin{x∗1, . . . ,x∗m}. Chứng minh định lý 2.6.

Đa tạp tuyến tínhC song song với không gian conM : M ={x∈X :hx∗i,xi=0, i=1, . . . ,m}.

Từ định lý (2.5) suy ra: x đạt cực tiểu hàm f trên C khi và chỉ khi ∃x∗ ∈ ∂ f(x)∩M⊥. Theo bổ đề(2.1), ta có

x∗ ∈M⊥=lin{x∗1, . . . ,x∗2}.

Do đó, tồn tại các số λ1, . . . ,λm sao cho

2.2.3. Bài toán với ràng buộc bất đẳng thức.

Giả sửX là không gian lồi địa phương,A⊂X là một tập lồi đóng không rỗng. f0, . . . , fn: X −→Rlà các hàm lồi. Xét bài toán

(P9)    min f0(x) x∈A (2.9) fi(x) ≤0 (i=1,2, . . . ,m). (2.10) Nhận Xét 2.4.

Quan hệ(2.9)không có đặc trưng hàm, mặc dù nó có thể được viết dưới dạng hàm, ví dụ như trong dạng bất đẳng thức δ(x|A)≤0.

Chúng ta xây dựng hàm Lagrange cho bài toán mà không bao gồm ràng buộc dạng (2.9), đó là L(x,λ0, . . . ,λn) = n ∑ i=0 λifi(x).

Tuy nhiên, chúng ta cũng có thể xét tới việc mở rộng hàm số Lagrange

L(x,λ0, . . . ,λn) =

∑

i=0

λifi(x) +δ(x|A).

Định lý Kuhn-Tucker dưới đây, sẽ đưa ra điều kiện cần và đủ cho điểm chấp nhận được là nghiệm của bài toán(P9). Định lý này có thể được phát biểu dưới hai dạng: dạng toàn cục(định lý 2.7) và dạng địa phươngthông qua dưới vi phân (định lý 2.8).

Định Lý 2.7.(Định Lý Kuhn-Tucker).

Giả sử các hàm f0, . . . , fm và tập A là lồi.xlà điểm chấp nhận được của bài toán(P9). Khi đó

a) Nếu xlà nghiệm của bài toán (P9), thì tồn tại λi≥0, (i=1, . . . ,m)

không đồng thời bằng không sao cho

L(x,λ0, . . . ,λm) =min

x∈AL(x,λ0, . . . ,λm). (2.11)

Hơn nữa, nếu điều kiện Slater sau đây được thỏa mãn:

∃x0 ∈A : fi(x0)<0, (i=1, . . . ,m).

thì λ0 >0và có thể xem nhưλ0=1.

b) Nếu (2.11) và (2.12) thỏa mãn với λ0 =1, thì x là nghiệm của bài toán (P9).

Chứng minh

a) Giả sửxlà nghiệm của(P9). Đặt

C ={(µ0, . . . ,µm)∈ Rm+1:(∀x∈A)

f0(x)− f0(x)<µ0,f1(x) ≤µ1, . . . , fm(x)≤µm}.

Ta có intRm++1 ⊂C.

Thật vậy, lấy (µ0, . . . ,µm) ∈int R+m+1. Khi đó, µi >0, (i=0, . . . ,m). Với x=x, ta có: µ0 > f0(x)− f0(x) =0, µi>0≥ fi(x), (i=1, . . . ,m). Suy ra(µ0, . . . ,µm)∈C, do đó intRm+1 + ⊂C. Vậy intC 6= /0.

Do f0, . . . , fm là hàm lồi, nên tậpC là lồi. Hơn nữa,0∈/C.

Thật vậy, nếu 0∈C thì∃x∈A thỏa mãn

f0(x)< f0(x), fi(x)≤0, (i=1, . . . ,m).

Do đó,xkhông phải là nghiệm của(P9). Điều này mâu thuẫn với giả thiết. Vì vậy 0∈/C.

Theo định lý tách thứ nhất, có thể tách các tậpC và{0}bởi một phiếm

hàm tuyến tính khác không, tức là tồn tại các sốλ0, . . . ,λm không đồng thời bằng không, sao cho

∑

i=0

Do int Rm++1 ⊂C, ta suy raλi≥0, (i=0, . . . ,m). Lấyx∈A sao cho

µi= fi(x), (i=1, . . . ,m). µ0 ↓ f0(x)− f0(x) . Từ (2.13)ta nhận được m ∑ i=0 λifi(x)≥λ0f0(x), (∀x∈A). (2.14) Doxlà điểm chấp nhận được, ta có fi(x)≤0, (i=1, . . . ,m). Nếu ∃i∈ {1, . . . ,m}: fi(x) =−α <0, thì ∀ε >0, 0= f0(x)− f0(x) <ε, fj(x)≤0<ε (j=1, . . . ,i−1,i+1, . . . ,m). Do đó (ε, . . . ,ε,−α,ε, . . . ,ε)∈C, (−α ở vị trí thứ i).

Suy ra −λiα ≥0, (do (2.13)và cho ε →0). Từ đó ta có λi≤0, nên λi=0, (do λi≥0).

Như vậy là, nếu fi(x) <0thìλi=0. Do đó

λifi(x) =0, (i=1, . . . ,m).