Đạo hàm theo hướng, dưới vi phân Clarke

Một phần của tài liệu Hàm khoảng cách và một số ứng dụng (LV00979) (Trang 41)

2 Hàm khoảng cách và một số ứng dụng

2.4 Đạo hàm theo hướng, dưới vi phân Clarke

Trong phần này ta qui ước : Cho X là không gian tuyến tính định chuẩn thực và X∗ là không gian topo đối ngẫu của nó. Các không gian X và X∗

hai không gian đối ngẫu liên hệ với nhau bởi song tuyến tính liên tục. Hàm khoảng cách của một tập hợp A ∈ X là Lipschitz với hằng số Lipschitz tổng quát 1. Do đó đạo hàm theo hướng Clarke của nó tồn tại và hữu hạn tại mỗi điểm theo tất cả các hướng.

hx∗;xi := x∗(x).

được xác định trên X∗×X. Kí hiệu chuẩn trên X và X∗ là k.k và k.k∗, tương ứng. Các hình cầu đơn vị đóng ký hiệu là B và B0 tương ứng. Cho hai tập hợp A và B của X (hoặc X∗) và β ∈ R, ta có định nghĩa

A±βB := {a±βb : a ∈ A, b ∈ B}. A\B := {a ∈ A : a /∈ B}.

Nếu A ⊂ X, thì đối cực của A được định nghĩa là tập

A0 := {x∗ ∈ X∗ : hx∗, xi ≤ 1,∀x ∈ A}.

Nếu B ⊂ X∗, thì hàm giả sử liên kết với B được cho bởi

Định lý 2.4.1. Cho C là một tập hợp con lồi, đóng, khác rỗng của X. Khi đó dC là một hàm lồi trên X với dưới vi phân lồi

∂dC(x) =

bdry B0∩NCx(x) khi x /∈ C,

B0 ∩ NC (x) khi x ∈ C. (2.22)

Ở đó Cx = C +dC(x)B. Nếu nó được giả sử thêm rằng X là một không gian Banach phản xạ, thì tập hợp các điểm

PC(x) := {¯x ∈ C : dC(x) = kx−xk}¯

là khác rỗng và với bất kỳ x¯∈ PC(x), có công thức

∂dC(x) =∂kx−xk ∩¯ NCx(x) (2.23)

= ∂kx−xk ∩¯ NC(¯x) . (2.24)

Chứng minh. Trường hợp x ∈ C công thức (2.22) đã biết. Trường hợp còn lại của (2.22) được thành lập trong [16, phần 2].

Thực tế tập PC(x) là khác rỗng khi X là phản xạ theo nghĩa cổ điển. Công thức (2.24) là một hệ quả trực tiếp của [17, bổ đề 3.3]. Từ định nghĩa của một ∂k.k và công thức (2.22), ta biết rằng vế phải của công thức (2.23) chứa trong ∂dC(x). Do đó, chúng ta chỉ cần chỉ ra vế phải của (2.24) được chứa trong vế phải của (2.23).

Thật vậy, mọi w ∈ C, z ∈ B và u ∈ ∂kx−xk ∩¯ NC(¯x), ta có

hu, w+ dC (x)z−xi = hu,x¯−xi+ hu, w−xi¯ + dC(x)hu, zi ≤ −dC(x) +dC(x)hu, zi+ hu, w−xi¯ ≤ hu, w−xi¯

≤ 0,

nhờ đó bao hàm được kéo theo và định lý được chứng minh.

Hệ quả 2.4.1. Cho C và X như trong lý 2.4.1. Khi đó d0C(x;h) tồn tại với mọi x, h ∈ X và

Hơn nữa, nếu x ∈ C thì đẳng thức xảy ra,

d0C(x;h) = dTC(x)(h) (2.26)

Chứng minh. Ta nhớ lại từ [18, Định lý 3.1] nếu K ⊂ X là một nón lồi khác rỗng và đóng, thì dK(x) = ψ∗K0∩B0(x).

Kết quả này được kéo theo từ công thức (2.22) và thực tế là

d0C(x;h) = ψ∂d∗

C(x)(h).

Trong phần còn lại ta bỏ qua giả thiết C là lồi và chỉ giả sử rằng

C là một tập con đóng, khác rỗng của X. Trước tiên ta nghiên cứu các trường hợp x ∈ C. Do dC là Lipschitz với hằng số 1, ta biết rằng từ Clarke [10, mệnh đề 2.1.2] , ta có ∂dC (x) ⊂ B0. Cũng lại do Clarke [10, mệnh đề 2.4.2] ta có ∂dC(x) ⊂ NC(x). Do đó

∂dC(x) ⊂ B0 ∩NC(x), (2.27)

hoặc tương đương

d0C(x;.) ≤dTC(x)(.). (2.28)

Tuy nhiên, trong trường hợp tổng quát, có thể không có bất đẳng thức này để dấu 0 =0 xảy ra như trong (2.22).

Ví dụ 2.4.1. Cho C ⊂ R2 = R2+ ∪R2

− theo chuẩn Euclide. Khi đó, đơn giản để chỉ ra rằng B0 ∩NC(x) = {(u, v) : u2 +v2 ≤ 1} tại x = (0,0), nhưng ∂dC(x) ={(u, v) : |u|+|v| ≤ 1}.

Dù nó không thể thu được một công thức tổng quát song song công thức chung (2.22) về dưới vi phân Clarke và nón tiếp tuyến, nhưng nó lại có thể, ít nhất là trong hữu hạn chiều, để có được một công thức liên quan chặt chẽ đến nón contigent và đạo hàm contigent.

(2.26) là tương đương. Điều này không đúng với các tập không lồi C khi ta sử dụng nón contigent và đạo hàm contigent, vì không được đảm bảo là lồi. Tuy nhiên, trong các tính toán contigent, người ta có thể thu được (2.25) và (2.26) trong hữu hạn chiều.

Định lý 2.4.2. Nếu x ∈ C thì

d−C(x;h) ≤ dKC(x)(h), (2.29) với ∀h ∈ X. Nếu giả thiết X là hữu hạn chiều, thì đẳng thức (2.29) xảy ra.

Chứng minh. Chọnh ∈ X và v ∈ KC(x)sao cho kh−vk−ε ≤dKC(x)(h). Khi đó tồn tại vn ∈ t1n(C −x) với tn ↓0, vn → v. Do đó

d−C(x;h) ≤ lim n→∞infd(t−1 n (C−x)) (h) ≤ lim n→∞kh−vnk = kh−vk ≤ dKC(x)(h) +ε.

Cho ε ↓ 0 ta thu được bất đẳng thức (2.29).

Tiếp theo ta giả sử rằng X là hữu hạn chiều và cho (hn, tn) là dãy thu được do định nghĩa của d−C(x;h). Cho vn ∈ t−n1(C −x) sao cho

d(t−1 n (C−x)) (hn) ≥ khn−vnk −tn, thì d−C(x;h) = lim n→∞inf dC(x+tnhn)−dC (x) t = lim n→∞infd(t−1 n (C−x)) (hn) ≥ lim n→∞infkhn −vnk.

Vì d−C(x;h) < ∞ theo công thức (2.29) và {hn} hội tụ, dãy {vn} bị chặn. Do đó dãy con hội tụ đến v ∈ KC (x) và bởi vậy

d−C(x;h) ≥ kh−vk ≥ dKC(x)(h)

Hệ quả 2.4.2. Nếu x ∈ C thì

KC(x) ⊂ {h : d−C(x;h) ≤0}. (2.30)

Đẳng thức xảy ra nếu X là hữu hạn chiều.

Trong trường hợp hữu hạn chiều có thể thu được một kết quả song song công thức (2.22) cho dưới vi phân Clarke nếu có điều kiện chính qui.

Mệnh đề 2.4.1. Cho C là tập con đóng, khác rỗng của X. Nếu dC là chính qui tại x ∈ C thì C là chính qui tại x.

Chứng minh. Từ bao hàm (2.30) và định nghĩa của TC(x) ta có

KC(x) ⊂ {h : d−C(x;h) ≤0} = {h :d0C(x;h) ≤ 0} ⊂ TC(x)

⊂ KC(x).

Định lý 2.4.3. Cho C là tập con đóng, khác rỗng của X. Nếu X là hữu hạn chiều và dC là chính qui tại x ∈ C, thì

∂dC(x) =B0 ∩ NC(x), (2.31)

d0C(x;.) =dTC(x)(.). (2.32)

Chứng minh. Từ mệnh đề trước, KC(x) = TC(x) và do định lý 2.4.2,

d−C(x;.) = dKC(x)(.). Điều này thiết lập phương trình (2.32). Phương trình (2.31) được kéo theo bởi tính lồi.

Hệ quả 2.4.3. Cho C là tập con đóng, khác rỗng của X và x ∈ C. Nếu

X là hữu hạn chiều thì C là chính qui tại x khi và chỉ khi dC là chính qui tại x.

Chứng minh. Thực tế tính chính qui của dC kéo theo tính chính qui C tại

x đã được thiết lập trong mệnh đề 2.4.1. Mặt khác nếu C là chính qui tại

x, thì do (2.28) và Định lý 2.4.2,

d−C(x;h) ≤ d0C(x;h) ≤ dTC(x)(h) = dKC(x)(h) = d−C(x;h).

Từ đó ta có điều phải chứng minh.

Bổ đề 2.4.1. Cho C là một tập hợp con đóng, khác rỗng của không gian tuyến tính định chuẩn X. Khi đó với mỗi x ∈ C và α ≥ 0 có

dC(x) ≤ d(C+xB)(x) +α

Chứng minh. Cho u ∈ B, do tính liên tục Lipschitz của dC, ta có

dC(x) = dC((x+αu)−(αu)) ≤ dC(x+αu) +α

Do đó dC(x) ≤ inf u∈BdC(x+αu) +α = d(C+xB)(x) + α.

Bằng cách lấy α = dC(x) trong bổ đề trên thu được

dC(y) ≤ dCx(y) +dC(x). (2.33) Bất đẳng thức này cho phép ta mở rộng một số các kết quả ở phần trước đó.

Định lý 2.4.4. Cho C là một tập con đóng, khác rỗng của X. Khi đó với mọi x ∈ X, có

d−C(x;.) ≤ dKCx(x)(.), (2.34)

d0C(x;.) ≤ dTCx(x)(.), (2.35)

KCx(x) ⊂ {h : d−C(x;h) ≤0}, (2.36) và ∂dC(x) ⊂ B0 ∩NCx(x). (2.37)

Chứng minh. Khi x ∈ C, kết quả này đã thu được trong phần trước. Từ (2.33), ta luôn luôn có bất đẳng thức

d−C(x;.) ≤ d−C

x(x;.),

Bất đẳng thức (2.34) và (2.35) là hệ quả trực tiếp của những bất đẳng thức ở (2.29) và (2.28). Bao hàm (2.36) được kéo theo trực tiếp từ (2.34) và bao hàm (2.37) được suy ra từ (2.35) và [18, Định lý 3.1] như trong Hệ quả 2.4.1

Kết luận

Chương 2 đã trình bày định nghĩa khoảng cách từ môt điểm đến một tập cố định, các tính chất và một số ứng dụng của nó.

Chương 3

Dưới Gradient của hàm khoảng cách có nhiễu và ứng dụng

Chương 3 sẽ trình bày một số kết quả về dưới gradient của hàm khoảng cách có nhiễu và một số ứng dụng.

3.1 Một số khái niệm cơ bản

Trừ khi có qui định khác, tất cả các không gian dưới đây được xét là không gian Banach X với X∗ là không gian đối ngẫu của X. Như thường lệ, B và B∗ là các hình cầu đơn vị đóng của không gian đang bàn đến và đối ngẫu của nó, trong khi S và S∗ được định nghĩa là các mặt cầu đơn vị tương ứng.

Trước tiên ta nhắc lại định nghĩa hàm khoảng cách tiêu chuẩn.

Định nghĩa 3.1.1. Cho không gian Banach X với chuẩn k.k; C là một tập con cố định trong X, khoảng cách từ một điểm x ∈ X đến C. Kí hiệu:

dC(x) hay d(x;C).

dC(x) = inf

y∈Ckx−ykhay d(x;C) = inf

y∈Ckx−yk. (I) Nếu C là đóng thì x ∈ C nếu dC(x) = 0.

Định nghĩa 3.1.2. Cho F : Z→→X là một ánh xạ đa trị giữa các không gian Banach. Khoảng cách giữa x và một tập chuyển động F(z) được định

nghĩa bởi

ρ(z;x) := inf

y∈F(z)

kx−yk = d(x;F (z)). (II)

Định nghĩa này là sự mở rộng của hàm khoảng cách tiêu chuẩn (I), điều đó tương ứng với (II) khi F (z) ≡C.

Có 2 sự khác biệt căn bản về dưới vi phân của hàm khoảng cách (II) tại một điểm (z, x) và của (I) tại x tương ứng là:

(a) (z, x) ∈ gphF cho (II), tương ứng với x ∈ C đối với (I).

(b) (z, x) ∈/ gphF cho (II), tương ứng với x /∈ C đối với (I).

Một số quan hệ giữa dưới gradient kiểu Fréchet của (I) tại x và pháp tuyến tương ứng với sự mở rộng

Cr := {x ∈ X|d(x;C) ≤ r} với r = d(x;C) (3.1) đã thu được bởi Bounkhel và Thibault [9], kết quả được cải thiện bởi Kruger trong không gian Banach nói chung.

Ví dụ 3.1.1. Cho hàm số F : N ⇒ R z 7→[−z, z] Khi đó, hàm khoảng cách dF(z)(x) =    0 nếu −z ≤ x ≤ z, |x+z| nếu x < −z, |x−z| nếu x > z. Ví dụ 3.1.2. Cho hàm số F : R2 ⇒ R2 z 7→ B(z; 1)

B(z; 1) là hình tròn tâm z, bán kính bằng 1. Khi đó hàm khoảng cách từ

x ∈ R2, x = (x1, x2) đến F(z), với z = (z1, z2) dF(z)(x) = ( 0 nếu x ∈ B, p (x1 −z1)2 + (x2 −z2)2 −1 nếu x /∈ B.

Định nghĩa 3.1.3. Đồ thị mở rộng Fr : Z ⇒ X của F được định nghĩa bởi

Fr(z) := {x ∈ X|d(x;F (z)) ≤ r} với r = d(x;F (z)). (3.2)

Tập phép chiếu PF(¯z)(x) khi đó là khác rỗng và các nhiễu nhỏ của nó trong các trường hợp tổng quát hơn. Việc làm rõ và mở rộng những kết quả sau này được bắt đầu trong trường hợp của các không gian phản xạ với chuẩn Kadec cũng như Hilbert và các không gian hữu hạn chiều. Ta cũng sẽ đề cập đến mối liên hệ giữa dưới građien suy biến của hàm khoảng cách ρ và đối đạo hàm hỗn hợp của F. Ta thiết lập đẳng thức

∂∞ρ(z, x) = {(z∗,0) ∈ Z∗ × X∗|Z∗ ∈ DM∗ F (z, x) (0)}, (3.3) với là ρ liên tục quanh (z, x) ∈ gphF và D∗MF (z, x) (0) trong định nghĩa 3.1.6.

Định nghĩa 3.1.4. Cho C ⊂ X và ε ≥0, định nghĩa ε - pháp tuyến (tựa Fréchet) đến C tại x ∈ C bởi

ˆ Nε(x;C) := {x∗ ∈ X∗|lim C x→x¯ < x∗, x−x > kx−xk ≤ ε}, (3.4)

ở đây x→C x nghĩa là x → x với x ∈ C.

Khi ε = 0, tập Nˆ (x;C) := ˆN0(x;C) trong (3.4) là một nón gọi là nón

tiền pháp tuyến hoặc là nón pháp tuyến Fréchet với C tại x.

Nón pháp tuyến cơ sở N (x;C) thu được từ Nˆε(x;C) bằng cách lấy giới

hạn trên dãy Painlevé-Kuratowski trong topo yếu* của X∗ N (x;C) := Lim

C

x→x¯

ε↓0

sup ˆNε(x;C), (3.5)

ở đó có thể lấy ε = 0 khi C là đóng quanh x và khi không gian X là Asplund; tức là, X một không gian Banach mà mọi không gian con khả li

Y của X đều có Y∗ khả li. Lớp các không gian này là đủ lớn, đặc biệt là gồm tất cả các không gian phản xạ.

Để tiện theo dõi, ta nhắc lại một số kí hiệu ε - dưới vi phân (tựa Fréchet ) của f tại x.

ˆ

∂εf (x) := {x∗ ∈ X∗|lim

x→xinf f (x)−f (x)− < x∗, x−x >

kx−xk ≥ −ε} (3.6)

Dưới vi phân cơ bản qua giới hạn của f tại x được xác định bởi

∂f (x) := lim x→f ε↓0x sup ˆ∂εf (x), (3.7) ở đây x→f x, nghĩa là x → x và f(x) → f(x). Chú ý rằng ∂ˆ

εf có thể thay thế bằng ∂fˆ := ˆ∂f trong (3.7) khi X là

Asplund và f là nửa liên tục dưới (l.s.c) quanh x. Từ (3.7) luôn có

b

∂f(x) ⊂ ∂f(x). (3.8)

Định nghĩa 3.1.5. Định nghĩa hình học tương đương của dưới vi phân cơ bản (3.7) bởi

∂f(x) ={x∗ ∈ X∗|(x∗,−1) ∈ N((x, f(x));epif}

với epif là trên đồ thị của f.

Dưới vi phân suy biến của f : X → R¯ tại x được xác định bởi

∂∞f(x) = lim sup

x →f

ε,λ↓0x

λ∂bεf(x). (3.9)

Xây dựng này chỉ có ý nghĩa với các hàm không Lipschitz, vì∂∞f(x) = {0}

nếu f là liên tục Lipschitz quanhx. Chú ý rằng ε > 0 có thể bỏ qua trong (3.9) nếuX là Asplund vàf là l.s.c quanh x. Trong trường hợp sau dưới vi phân suy biến (3.9) được thừa nhận bởi sự miêu tả hình học tương đương.

Định nghĩa 3.1.6. Cho F : X ⇒ Y là một ánh xạ đa trị giữa các không gian Banach với đồ thị

gphF := {(x, y) ∈ X×Y |y ∈ F(x)}.

Đối đạo hàm pháp tuyến DN∗ F(x, y) : Y∗ ⇒ X∗ của F tại (x, y) được định nghĩa bởi

D∗NF(x, y)(y∗) := {x∗ ∈ X∗|(x∗,−y∗) ∈ N((x, y);gphF)}

và đối đạo hàm hỗn hợp tương ứng là

DM∗ F(x, y)(y∗) :=      x∗ ∈ X∗ ∃εk ↓ 0,(xk, yk)gphF→ (x, y), x∗k w ∗ →x∗, yk∗→k.ky∗; (x∗k,−y∗ k) ∈ N εb k((xk, yk);gphF)      , (3.11) ở đó w ∗

→ có nghĩa là dãy hội tụ yếu * trong X∗, trong khi →k.k là sự hội tụ theo chuẩn trong không gian đối ngẫu.

Chúng ta bỏ qua k.k trong phần sau. Có thể lấy εk = 0 trong (3.11) nếu X và Y là Asplund và nếu đồ thị của F là đóng quanh (x, y). Rõ ràng

DM∗ F(x, y)(y∗) ⊂ DN∗ F(x, y)(y∗), ở đó đẳng thức xảy ra nếu dimY < ∞.

Nhận xét 1. Dưới vi phân cơ bản và suy biến trong (3.7) và (3.10) có thể mô tả như sau

∂f (x) =D∗Ef (x, f(x)) (1) và ∂∞f (x) =D∗Ef (x, f(x)) (0)

qua đối đạo hàm của đồ thị hàm đa trị Ef : X ⇒ R với

Ef (x) := {µ∈ R|µ ≥ f (x)}.

Định nghĩa 3.1.7. Một tập C là compact pháp tuyến theo dãy (SNC) tại

x nếu với bất kỳ dãy εk ↓ 0, xk→C x và x∗k ∈ Nˆεk(xk;C) đều có h

x∗k w

ở đó εk có thể được bỏ qua nếu X là Asplund và nếu C là đóng địa phương quanh x.

Điều kiện SNC là mặc định khi C thỏa mãn thuộc tính “Compact epi- Lipschitzian” theo nghĩa của Borwein và Strojwas, đặc biệt khi nó là lồi và hữu hạn chiều với phần trong tương đối khác rỗng.

Định nghĩa 3.1.8. Ta nói rằng một tập C ⊂ X×Y là SNC đối với X

tại (x, y) ∈ C nếu (3.12) đúng với mọi dãy εk ↓ 0, (xk, yk)→C (¯x,y)¯ và x∗k, yk∗ ∈ Nˆεk ((xk, yk) ;C) khi k ∈ N.

Định nghĩa 3.1.9. Ta nói rằng F là PSNC tại (¯x,y)¯ ∈ gphF nếu với bất kì dãy εk ↓ 0, (xk, yk)gphF→ (¯x,y)¯ và (x∗k, y∗k) ∈ Nˆεk ((xk, yk) ;gphF) đều có h x∗k w ∗ →0,kyk∗k → 0 i ⇒ [kx∗kk → 0] khi k → ∞

ở đây εk = 0 trong không gian Asplund và đồ thị là đóng.

Tính chất PSNC luôn đúng khi F là tựa Lipschitz quanh (¯z,x)¯ theo nghĩa của Aubin [5]: tồn tại các lân cận V của z và W của x với mođun

l ≥0 sao cho

F(u)∩W ⊂ F(v) + lku−vkB, ở đó u, v ∈ V.

Điều này qui về dáng điệu Lipschitz địa phương cổ điển của F quanh

z với W = X. Thuộc tính tựa Lipschitz của F là tương đương với tính chính qui metric và tính chất tuyến tính mở của ánh xạ ngược F−1.

3.2 Dưới gradient tựa Fréchet của hàm khoảng cách Trong phần này là những công thức khác nhau để tính toán và ước lượngε- dưới gradient của hàm khoảng cách tổng quát (II) và hàm khoảng cách tiêu chuẩn (I) tại các điểm bên trong và bên ngoài tập hợp.

ε - pháp tuyến đến đồ thị mở rộng (3.2) trong các không gian Banach bất kì. Trường hợp r = 0 tương đương x ∈ F(z) nếu F(z) đóng, trường hợp này ta không xét đến.

Định lý 3.2.1. Cho F : Z ⇒ X là một ánh xạ đa trị giữa các không gian Banach và cho Fr là mở rộng (3.2) của nó với r := d(¯x, F (¯z)) đối với

(¯z,x)¯ ∈ Z ×X, những mệnh đề sau là đúng với mọi ε≥ 0. (i) Nếu r = 0 thì ∂ˆ ερ(¯z,x)¯ ⊂ {(z∗, x∗) ∈ Nˆε((¯z,x) ;¯ gphFr),kx∗k ≤ 1 +ε}. (ii) Nếu r > 0 thì ∂ˆ ερ(¯z,x)¯ ⊂ {(z∗, x∗) ∈ Nˆε((¯z,x);¯ gphFr),1− ε ≤ kx∗k ≤ 1 +ε}.

Chứng minh. Chúng ta tiến hành theo cùng một cách cho cả 2 trường hợp (i) và (ii).

Chọn (z∗, x∗) ∈ ∂ˆερ(¯z,x)¯ và do định nghĩa của ε - dưới građien, với

∀γ > 0,∃δ > 0 sao cho hz∗, z −zi¯ +hx∗, x−xi ≤¯ ρ(z, x)−ρ(¯z,x) + (ε¯ +γ) (kz−zk¯ +kx−xk),¯ (3.13) ở đó kz −zk¯ < δ và kx−xk¯ < δ. Với bất kì (z, x) ∈ gphFr, ta có ρ(z, x) ≤ r = ρ(¯z,x)¯ , do đó hz∗, z −zi¯ +hx∗, x−xi ≤¯ (ε+γ) (kz−zk¯ +kx−xk)¯

tức là, (z∗, x∗) ∈ Nˆε((¯z,x) ;¯ gphFr), do định nghĩa của ε- pháp tuyến. Đặt z = ¯z trong (3.13), ta nhận thấy x∗ ∈ ∂ˆεd(¯x;C) với C := F(¯z). Điều này gợi ra rằng kx∗k ≤ 1 + ε trong cả 2 trường hợp (i) và (ii), vì

Một phần của tài liệu Hàm khoảng cách và một số ứng dụng (LV00979) (Trang 41)

Tải bản đầy đủ (PDF)

(79 trang)