Hình chiếu của một điểm xuống một số tập quen thuộ- 123docz.net

2 Phép chiếu xuống tập lồi đóng

2.1.3 Hình chiếu của một điểm xuống một số tập quen thuộc

Trong một số trường hợp thường gặp, tập chiếu là hình hộp chữ nhật, hình cầu đóng hay không gian con thì điểm chiếu có thể tính được một cách tường minh.

Trường hợp 2.1. Chiếu xuống hình hộp chữ nhật.

Khi C là một hình hộp, định nghĩa bởi

C := nx = (x1, x2, ..., xn)T ∈ X

ai ≤ xi ≤bi, i = 1,2, ..., no. a = (a1, a2, ..., an)T ∈ X, b = (b1, b2, ..., bn)T ∈ X

Khi đó, hình chiếu của x xuống C được xác định như sau: (PC(x)) =    ai nếu xi ≤ ai xi nếu xi ∈ [ai, bi] bi nếu xi ≥ bi Trường hợp 2.2. Chiếu xuống hình cầu đóng.

Khi C là hình cầu bán kính R, tâm A = (a1, a2, ..., an)T ∈ X định nghĩa bởi C := ( z = (z1, z2, ..., zn)T ∈ X n X i=1 (zi−ai)2 ≤ R2 ) .

Khi đó, hình chiếu y = PC(x) của x xuống C được xác định như sau: +) Nếu x ∈ C thì y ≡ x.

+) Nếu x 6∈ C thì hình chiếu của xlên C là giao điểm của đường thẳng nối

xvới tâmAcủaC, ký hiệu là∆với mặt cầuC :=

z ∈ X| n P i=1 (zi −ai)2 = R2 . Ta có:∆ := {z = (z1, z2, ..., zn) ∈ X|zi = ai+t(xi−ai), t = 1,2, ..., n, t ∈ R}. Thay zi = ai +t(xi−ai) ta được t2 n X i=1 (zi −ai)2 = R2. Do đó t = R n P i=1 (xi−ai)2 1/2

Vì vậy, tọa độ của y được xác định như sau:

yi = ai +t(xi −ai) R n P i=1 (xi −ai)2 1/2

Trường hợp 2.3. Chiếu xuống không gian con.

Khi C ∈ X là không gian con k chiều với một cơ sở B = {η1, η2, ..., ηk}. Giả sử x ∈ X và y =

j=1

yjηj ∈ C trong đó yj là các hệ số thực sao cho

ω = x−y thỏa mãn hω, ηji = 0,∀j = 1,2, ..., k. Khi đó, y là hình chiếu của x xuống C.

Thật vậy, vì ω trực giao với mọi vectơ trong cơ sở của C nên nó cũng trực giao với mọi vectơ của C. Do đó, với z ∈ C ta có:

kx−zk2 = hx−y +y −z, x−y +y −zi

= hx−y, x −yi+ hy −z, y −zi+ 2hω, y −zi

= kx−yk2 +ky−zk2 ≥ kx−yk2.

Vì vậy, y là hình chiếu của x lên C.

Bây giờ ta sẽ đi xác định vectơ y thỏa mãn điều kiện hω, ηji = 0,∀j = 1,2, ..., k.

Với mọi j = 1,2, ..., k ta có: hx−y, ηji = 0 hay

j=1

hηj, ηjiyj = hx, ηji. Với 1 ≤i, j ≤ k, ta đặt aij = hηj, ηji, và bi = hx, ηji.

Khi đó, ta thu được một hệ tuyến tính k phương trình k ẩn: AyT = y, trong đó A = (aij) và b = (b1, b2, ..., bk)T.

Hơn nữa, theo định nghĩaAlà ma trận xác định dương, nghĩa làdetA 6= 0. Do đó hệ này có đúng một nghiệm.

Vì y =

j=1

yjηj nên khi biết yi ta sẽ xác định được y. Nếu B được chọn là một cơ sở trực chuẩn của C nghĩa là:

hηj, ηji = 0 nếu i 6= j 1 nếu i = j thì A là ma trận đơn vị. Do đó, ta tính được: yi = bi = hx, ηji, i= 1,2, ..., k .

Trường hợp 2.4. Chiếu xuống siêu phẳng.

Cho C là một siêu phẳng định nghĩa bởi C = x ∈ X|aTx = b . Khi đó, hình chiếu vuông góc của điểm x0 xuống siêu phẳng C được xác định bởi:

PC(x0) = x0 + b−aTx0

kak2 .

Trường hợp 2.5. Chiếu xuống nửa không gian.

Cho C là nửa không gian đóng được định nghĩa bởi:

Khi đó, hình chiếu vuông góc của điểm x0 xuống nửa không gian C được xác định bởi: PC(x0) = ( x0 + (b−a Tx0)a kak2 nếu aTx0 > b x0 nếu aTx0 ≤b 2.2 Một số ứng dụng của phép chiếu 2.2.1 Định lý tách tập lồi

Trong giải tích lồi và nhiều lĩnh vực khác như giải tích hàm, giải tích không trơn và giải tích phi tuyến tính,... các định lý tách hai tập lồi có vai trò trung tâm. Về bản chất, các định lý tách trả lời câu hỏi rằng một phần tử có thuộc tập lồi không và nếu không thuộc thì nó có tính chất gì? Chẳng hạn tập lồi là tập nghiệm của hệ phương trình đại số hay vi tích phân, tập các điểm bất động của một ánh xạ hay là tập nghiệm của một bài toán tối ưu... Nếu điểm thuộc tập lồi đó thì dễ giải quyết, trái lại thì sẽ xảy ra điều gì?

Điều này giải thích vì sao các định lý tách thuộc loại các định lý chọn và là công cụ mạnh, thường được dùng để chứng minh sự tồn tại của một đối tượng trong nhiều vấn đề thuộc những lĩnh vực khác nhau. Một mệnh đề thường được dùng làm nền tảng lý thuyết tối ưu hiện đại là định lý tách các tập lồi, mà một dạng tương đương của nó trong giải tích hàm là định lý Han - Banach về khuếch phiếm hàm tuyến tính.

Định nghĩa 2.2. Cho hai tập C và D khác rỗng. i) Ta nói siêu phẳng aTx = α tách C và D nếu

aTx ≤ α ≤aTy,∀x ∈ C,∀y ∈ D

ii) Ta nói siêu phẳng aTx = α tách chặt C và D nếu

aTx < α < aTy,∀x ∈ C,∀y ∈ D

iii) Ta nói siêu phẳng aTx = α tách mạnh C và D nếu

sup

x∈C

aTx < α < inf

y∈DaTy

iv) Ta nói siêu phẳng aTx = α tách đúng hai tập C và D nếu nó tách C

Bổ đề dưới đây cho ta thấy có thể tách một tập lồi và một phần tử không thuộc nó bằng một siêu phẳng.

Bổ đề 2.1. Cho C ⊂ X là một tập lồi khác rỗng. Giả sử x0 6∈ C. Khi đó tồn tại t∈ X, t 6= 0 thỏa mãn ht, xi ≥

t, x0∀x ∈ C. Chứng minh. Ta xét hai trường hợp:

a) Trường hợp 1: Nếu x0 ∈ C thì tồn tại siêu phẳng tựa aTx = α của C

tại x0 hay

aTx0 = α

và

aTx ≥ α,∀x ∈ C

Suy ra aTx ≥ aTx0,∀x ∈ C.

b) Trường hợp 2: Nếu x0 6∈ C. Khi đó,

pC x0−x0, x0 −pC x0 < 0 và pC x0−x0, x0 −pC x0 ≥ 0,∀x ∈ C. Từ đó suy ra: pC x0−x0, x≥ pC x0−x0, pC x0 > pC x0−x0, x0 ≥ 0,∀x ∈ C.

Vậy luôn tồn tại t ∈ X, t 6= 0 sao cho ht, xi ≥ ht, xoi ∀x ∈ C. Từ bổ đề trên ta suy ra định lý sau:

Định lý 2.1. ( Định lý tách I ) Cho C và D là hai tập lồi khác rỗng trong không gian Hilbert X sao cho C ∩ D = ∅. Khi đó có một siêu phẳng tách

C và D.

Chứng minh. Cho C và D là lồi nên D−C = {z = y−x|x∈ C, y ∈ D}

cũng lồi và không chứa0vì nếu0 ∈ D−C tức là0 = y−xvớix ∈ C, y ∈ D. Khi đó, x = y ∈ D −C (trái giả thiết C ∩D = ∅).

Áp dụng bổ đề 2.1 với x0 = 0, tồn tại vectơ t∈ X, t 6= 0 sao cho

Vìz = y−x vớix ∈ C, y ∈ D nên ta có ht, xi ≤ ht, yi với ∀x ∈ C,∀y ∈ D. Lấy α = sup x∈C ht, xi. Khi đó ht, xi ≤ α ≤ ht, yi hay siêu phẳng ht, xi = α tách C và D.

Bổ đề sau đây cho ta thấy có thể tách mạnh một tập lồi, đóng, khác rỗng C ⊂ X và một điểm không thuộc nó.

Bổ đề 2.2. ChoC ⊂ X là một tập lồi, đóng, khác rỗng sao cho 0 6∈ C. Khi đó tồn tại vectơ t∈ X, t 6= 0 và α > 0 thỏa mãn ht, xi ≥ α > 0∀x ∈ C. Chứng minh. Do C là tập đóng và 0 6∈ C nên tồn tại hình cầu B tâm ở gốc, bán kính r > 0 sao cho C ∩B = ∅. Áp dụng định lý tách I cho hai tập C và B, tồn tại t ∈ X, t 6= 0 và α ∈ R sao cho ht, xi ≤ α ≤ ht, yi với

∀x ∈ C,∀y ∈ B.

Bằng cách chuẩn hóa ta có thể xem ktk = 1 và do đó khoảng cách từ gốc

0 đến siêu phẳng ht, xi = α ít nhất là bằng α ≥ 0. Vậy thì

ht, xi ≥ α ≥ r > 0∀x ∈ C

Từ bổ đề trên ta suy ra định lý sau:

Định lý 2.2. ( Định lý tách II ) Cho C và D là hai tập lồi, đóng, khác rỗng trong không gian Hilbert X sao cho C∩D = ∅. Giả sử có ít nhất một tập là com -pắc. Khi đó hai tập này có thể tách mạnh bởi một siêu phẳng. Chứng minh. Giả sử C là tập com - pắc. Ta cần chứng minh C−D là tập đóng.

Thật vậy, giả sửzk = xk−yk ∈ C−D với xk ∈ C, yk ∈ D vàzk → z. DoC

là tập com - pắc nên có thể trích một dãy con xkj →x ∈ C khi j →+∞. Do vậy, ykj = xkj −zkj → x−z ∈ D, mà D đóng nên y = limyk ∈ D. Vậy, z = x−y ∈ C −D. Do đó, C −D là đóng.

Vì 06∈ C −D nên theo bổ đề 2.2, tồn tại t6= 0 sao cho

ht, x−yi ≥ α > 0,∀x ∈ C, y ∈ D. Vậy, inf x∈Cht, xi − α 2 ≥ sup y∈D ht, yi+ α2. Điều đó chứng tỏ C và D có thể tách mạnh được.

Mệnh đề 2.1. Cho C và D là hai tập lồi khác rỗng trong không gian Hilbert X. Điều kiện cần và đủ để hai tập này tách đúng được là riC ∩

riD = ∅.

Chứng minh. Điều kiện đủ: Giả sử riC∩riD = ∅. Mặt khác, vì C và D

là các tập lồi nên 0 ∈/ (riC −riD) =ri(C −D). Ta xét hai trường hợp: a) Trường hợp 1: int(C −D) 6= ∅. Khi đó, 0 ∈/ int(C −D). Vậy, tồn tại

t6= 0 sao cho tTx < tTy,∀x ∈ intC, y ∈ intD. Đặt

α = suptTx|x ∈ intC , β = inf tTy|y ∈ intD

thì α ≤ β.

Lấy γ sao cho α ≤ γ ≤ β. Khi đó, siêu phẳng tTx = γ sẽ tách C và D

nhưng không thể đồng thời chứa cả C và D.

b) Trường hợp 2: int(C −D) = ∅. Đặt A = C −D và F là không gian con song song với af f A. Khi đó, áp dụng lập luận ở phần trên cho không gian F sẽ tồn tại một siêu phẳng F0 ⊂F tách đúng hai tập C và D. Gọi t0 : F → R là phiếm hàm tuyến tính xác định siêu phẳng F0. Goi F⊥ là không gian vuông góc với F.

Với mỗi x ∈ X, đặt t(x) là hàm hợp giữa t0 và p, trong đó p là ánh xạ chiếu xuống không gian con F. Do p là ánh xạ tuyến tính nên dễ thấy t

và t0 cũng là tuyến tính và là siêu phẳng tách đúng hai tập C và D.

Điều kiện cần: Giả sử có siêu phẳng tTx = γ sẽ tách C và D, tức là

t0Tx ≤ γ ≤ tT,∀x ∈ C, y ∈ D.

Giả sử siêu phẳng này không chứa tậpD. Khi đó,tTy > γ với mọiy ∈ riD. Vậy, riC ∩ riD = ∅.

2.2.2 Sự tồn tại dưới vi phân

Phép tính vi phân là một trong những vấn đề cơ bản của giải tích cổ điển. Trong giải tích lồi, lý thuyết này rất phong phú nhờ những tính chất của tập lồi và hàm lồi. Trong phần này chúng ta mở rộng khái niệm đạo hàm bằng khái niệm dưới vi phân và một số tính chất cơ bản của nó. Đặc biệt áp dụng tính chất của phép chiếu và siêu phẳng tựa để chứng minh sự tồn tại của dưới vi phân của hàm f trong trường hợp hàm f lồi.

Khi đó, ta nói x∗ ∈ X là dưới đạo hàm của f tại x nếu

hx∗, z −xi+f(x) ≤ f(z),∀z ∈ X

Tương tự như đối với hàm lồi khả vi thông thường, biểu thức này có nghĩa như là phương trình tiếp tuyến nằm dưới đồ thị của hàm số. Tuy nhiên khác với trường hợp khả vi, tiếp tuyến ở đây có thể không tồn tại duy nhất.

Ký hiệu tập tất cả các dưới đạo hàm của f tại x là ∂f (x) và được gọi là dưới vi phân. Đây là một tập (có thể bằng rỗng trong R).

Khi ∂f (x) 6= ∅ thì ta nói hàm f khả dưới vi phân tại x. Trong trường hợp tập ∂f(x) chỉ gồm duy nhất một điểm ta nói hàm f khả vi tại x.

Theo định nghĩa, một điểm x∗ ∈ ∂f (x) khi và chỉ khi nó thỏa mãn một hệ vô hạn các bất đẳng thức tuyến tính. Như vậy, ∂f(x) là giao của các nửa không gian đóng. Vậy, ∂f (x) luôn là tập lồi đóng (có thể rỗng). Ký hiệu:

dom(∂f) = {x|∂f(x) 6= ∅}

Ví dụ 2.1. f(x) =kxk với x ∈ Rn.

Tại điểm x = 0 hàm này không khả vi nhưng nó khả dưới vi phân và

∂f (0) = {x∗| hx∗, xi ≤ kxk,∀x ∈ Rn} Ví dụ 2.2. Cho C ⊂ Rn là một tập lồi, khác rỗng. f (x) =δC(x) = 0 nếu x ∈ C +∞ nếu x /∈ C là hàm chỉ của C. Khi đó, với x0 ∈ C ta có: ∂f x0 = x∗| x∗, x −x0 ≤ δC(x),∀x

Với x 6∈ Cthì δC = +∞ nên bất đẳng thức này luôn đúng. Vậy

∂δCf x0= x∗|

x∗, x−x0≤ 0∀x = NC(x0)

Vậy dưới vi phân của hàm chỉ của một tập lồi C khác rỗng tại một điểm

Định nghĩa 2.4. Cho X là không gian Hilbert, ánh xạ f : X → R ∪ {+∞} và x0 ∈ X sao cho f(x0) < +∞. Nếu với y ∈ X mà giới hạn

lim

λ→0

f(x0+λy)−f(x0)

λ tồn tại (hữu hạn hay vô hạn), thì ta nói f có đạo hàm theo phương y tại điểm x0.

Giới hạn này ký hiệu là f0(x0, y). Vậy,

f0(x0, y) = lim

λ→0

f x0 +λy−f x0

λ .

Mệnh đề dưới đây cho ta một điều kiện cần và đủ để một điểm x∗ ∈

∂f(x).

Mệnh đề 2.2. Cho X là không gian Hilbert, f : X → R∪ {+∞} là hàm lồi, chính thường. Khi đó:

i) x∗ ∈ ∂f (x) khi và chỉ khi f0(x, y) ≥ hx∗, yi,∀y

ii) Nếu f là hàm lồi chính thường trên X thì với mọi x ∈ dom∂f (x) ta có

f (x) = f (x), ∂f (x) = ∂f(x)

Chứng minh. i) Theo định nghĩa x∗ ∈ ∂f(x). Khi đó,

hx∗, z −xi+f(x) ≤ f(z),∀z ∈ X.

Với bất kỳ y, lấy z = x+ λy, λ > 0 ta có

hx∗, λyi+f(x) ≤ f(x+λy)

Từ đây suy ra

hx∗, yi ≤ f (x+λy)−f (x)

λ ,∀λ >0 (2.1)

Theo định nghĩa của f0(x, y) ta suy ra ngay

hx∗, yi ≤ f0(x, y),∀y (2.2)

Ngược lại, giả sử (2.2) thỏa mãn. Lấy z bất kỳ và áp dụng (2.1) với

y = z −x và λ = 1 ta có

Vậy x∗ ∈ ∂f (x).

ii) Cho x ∈ dom∂f (x) và x∗ ∈ ∂f(x). Theo định nghĩa của hàm liên hợp

f và do x∗ ∈ ∂f (x) ta có

f (x) ≥ f (x) = f∗∗(x) ≥ hx∗, xi −f∗(x∗) = f (x)

Suy ra f (x) =f (x).

Nếu y∗ ∈ ∂f (x) thì với mọi z ta có

f (z) ≥ f (z) ≥f (x) +hy∗, z −xi = f (x) +hy∗, z −xi

Suy ra ∂f (x) ⊆ ∂f(x).

Để chứng minh điều ngược lại, lấy z0 ∈ ri(domf). Với mọi z ta có

f (z) = lim

t&0f (1−t)z +tz0

Vậy theo định nghĩa của dưới vi phân có

f (1−t)z+tz0 ≥f (x) +x∗,(1−t)z+ tz0 −x

Cho t &0 ta được

f (x) ≥ f (x) +hx∗, z −xi = f (x) +hx∗, z −xi

Chứng tỏ x∗ ∈ ∂f (x). Suy ra ∂f (x) ⊆ ∂f(x). Vậy ∂f(x) =∂f (x).

Mệnh đề 2.3. Cho X là không gian Hilbert, f : X → R∪ {+∞} là hàm lồi, chính thường. Khi đó:

i) Nếu x 6∈ domf thì ∂f (x) = ∅.

ii) Nếu x ∈ int(domf) thì ∂f (x) 6= ∅ và com-pắc. Ngược lại nếu ∂f(x) 6=

∅ và com-pắc thì x ∈ ri(domf).

Chứng minh. i) Cho z ∈ domf thì f(z) < +∞. Vậy nếu x 6∈ domf thì

f(x) = +∞ và do đó không thể tồn tại x∗ thỏa mãn

f (x) +hx∗, z −xi ≤ f (z) < +∞

Vậy ∂f(x) =∅.

ii) Trước hết, giả sửx ∈ int(domf). Khi đó ta có điểm (x, f(x)) nằm trên biên của epif. Do f là hàm lồi, chính thường nên epif là tập lồi, khác

rỗng. Khi đó tồn tại siêu phẳng tựa của epif đi qua (x, f(x)), tức là tồn tại p∈ X, t ∈ R không đồng thời bằng 0 sao cho

hp, xi+tf(x) ≤ hp, yi+tµ,∀(y, µ) ∈ epif (2.3) Nếu t = 0 thì hp, xi ≤ hp, yi,∀y ∈ domf.

Nhưng do x ∈ int(domf) nên điều này kéo theo p= 0. Vậy t 6= 0.

Nếu t < 0 thì trong bất đẳng thức (2.3) khi cho µ → ∞ ta suy ra mâu thuẫn vì vế trái cố định, vế phải dần tới −∞. Do đó, t > 0.