Hàm phạt không khả vi cho bài toán phi tuyến tính- 123docz.net

Ta xét bài toán (ICP)

min f(x) g(x) ≤0.

Thay vì xét bài toán trực tiếp, chúng ta xét bài toán không khả vi (NDP)c, với một số thực c > 0 nào đó:

min {f(x) +cP(x)},

với x ∈ Rn.

Trong đó, hàm số P(x) được xác định như sau:

P(x) = max{0, g1(x), ..., gr(x)}. (3.12) Cho x ∈ Rn, d ∈ Rn, ta kí hiệu

J(x) ={j|gj(x) =P(x)}. (3.13)

θc(x;d) = max{(∇f(x) +c∇gj(x))T.d|j ∈ J(x)}. (3.14) Định nghĩa 3.2.1. [1] x∗ ∈ Rn được gọi là một điểm tới hạn của f +cP

nếu mọi d ∈ Rn ta có

θc(x∗;d) ≥ 0.

Kí hiệu θc(x∗;d) trong định nghĩa trên có thể xem là vi phân Gateaux của f +cP (Ortega and Rheinboldt, 1970, p.65, Leenberger, 1969, p.171) tại x∗ theo chiều d. Định nghĩa về điểm tới hạn phù hợp với các định nghĩa tương tự cho các hàm không khả vi mà các hàm không khả vi đó là không khả vi Gateaux. Các hướng có thể được tính từ (QP)c(x, H, J), theo (d, ξ) ∈ Rn+1,

min ∇f(x)0d+ 12d0Hd+cξ gj(x) + ∇gj(x)0d≤ ξ, ∀j ∈ J,

trong đó H là một ma trận xác định dương và J là một tập chỉ số chứa

J(x), nghĩa là:

Mệnh đề 3.2.2. (a) Với mọi x ∈ Rn, d ∈ Rn và α > 0,

f(x+αd) +cP(x+αd)−f(x)−cP(x) = αθc(x;d) + 0(α), (3.16) trong đó lim

α→0+0(α)/α = 0. Nếu θc(x;d) < 0 thì tồn tại α >¯ 0 sao cho

f(x+αd) +cP(x+ αd) < f(x) + cP(x), ∀α ∈ (0,α¯].

(b) Cho bất kỳ x ∈ Rn, H > 0 và J với J(x) ⊂ J ⊂ {0,1, ..., r}. Nếu

(d, ξ) là nghiệm tối ưu của (QP)c(x, H, J) và d 6= 0, thì

θc(a;d) ≤ −d0Hd < 0. (3.17) Chứng minh: a) Ta có với mọi α > 0 và f ∈ J(x),

f(x+αd) +cgj(x+αd) =f(x) +α∇f(x)0d+c[gj(x) +α∇gj(x)0d] + 0j(α), trong đó lim α→0+0j(α)/α = 0. Do đó f(x+ αd) +cmax{gj(x+αd)|j ∈ J(x)} = f(x) +α∇f(x)0d+cmax{gj(x) +α∇gj(x)0d|j ∈ J(x)}+ 0(α), = f(x) +cP(x) +αθc(x;d) + 0(α) (3.18) trong đó lim α→0+0(α)/α = 0. Ta có với mọi α đủ nhỏ max{gj(x+αd)|j ∈ J(x)} = max{gj(x+αd)|j = 0,1, ..., r} = P(x+αd).

Kết hợp với hai quan hệ ở trên ta có được phương trình (3.16).

b) Ta có gj(x) +∇gj(x)0d ≤ ξ với mọi j ∈ J. Vì gj(x) = P(x) với mọi

j ∈ J(x), suy ra ∇gj(x)0d ≤ ξ−P(x) với mọi j ∈ J(x) và khi đó sử dụng định nghĩa θc ta có

θc(x;d) ≤ ∇f(x)0d+c[ξ −P(x)]. (3.19) Đặt {µj|j ∈ J} là một tập các nhân tử Lagrange (QP)c(X, H, J). Các điều kiện K-T được viết là

∇f(x) +Hd+X j∈J µj∇gj(x) = 0, (3.20) c−X j∈J µj = 0, (3.21)

gj(x) +∇gj(x)0d ≤ ξ, µj ≥0, ∀j ∈ J, (3.22) µj[gj(x) + ∇gj(x)0d−ξ] = 0, ∀j ∈ J. (3.23) Từ (3.20) ta có ∇f(x)0d+d0Hd+X j∈J µj∇gj(x)0d = 0 (3.24) từ các phương trình (3.21), (3.23) và thực tế gj(x) ≤ P(x) với mọi j ∈ J

ta có X j∈J µj∇gj(x)0d = X j∈J µjξ −X j∈J µjgj(x) ≥X j∈J µj[ξ −P(x)] = c[ξ −P(x)]. (3.25) Kết hợp (3.24) và (3.25) ta được ∇f(x)0d+d0Hd+c[ξ −P(x)] ≤ 0 (3.26) Từ (3.19) và (3.26) ta được θc(x;d) +d0Hd ≤0

điều phải chứng minh.

Mệnh đề 3.2.3. (a) Nếu x∗ là một điểm tới hạn của f + cP, thì quy hoạch toàn phương (QP)c(x∗, H, J) có {d = 0, ξ = P(x∗)} là nghiệm tối ưu với mọi J và H với

0 < H, J(x∗) ⊂ J ⊂ {0,1, ..., r}. (3.27) (b) Nếu {d = 0, ξ = P(x∗)} là nghiệm tối ưu của quy hoạch toàn phương

(QP)c(x∗, H, J) trong đó H và J thỏa mãn phương trình (3.27), thì x∗ là một điểm tới hạn của f +cP.

Giống như quy hoạch toàn phương (QP)c(x∗, H, J) liên quan đến bài toán không khả vi (NDP)c, mà ở đó lập trình bậc hai liên kết với bài toán phi tuyến tính (ICP). Lập trình (QP)0(x, H, J) đó là:

min ∇f(x)0d+ 12d0Hd

gj(x) +∇gj(x)0d ≤ 0, ∀j ∈ J,

trong đó

Mệnh đề 3.2.4. Nếu một cặp {x∗,(µ∗1, µ∗2, ..., µ∗n)} là một cặp K-T của (ICP), khi đó tồn tại một µ∗0 ≥ 0 sao cho {d∗ = 0,{µ∗j|∀j ∈ J}} là một cặp K-T cho (QP)0(x∗, H, J) với mọi H và J thỏa mãn (3.28). Ngược lại, nếu {d∗ = 0,{µ∗j|∀j ∈ J}} là một cặp K-T của (QP)0(x∗, H, J) với H

và J thỏa mãn (3.28), thì {x∗,(µ1∗, µ∗2, ..., µ∗n)} là một cặp K-T của (ICP), trong đó chúng ta định nghĩa µ∗j = 0,∀j /∈ J.

Chứng minh: Các điều kiện K-T của (ICP) là

∇f(x∗) + r X j=1 µ∗j∇gj(x∗) = 0, (3.29) g(x∗) ≤ 0, µj∗ ≥0, ∀j = 1,2, ..., r. (3.30) Lấy µ∗0 = 0 và sử dụng g0(x) , 0, ta thấy từ các điều kiện trên suy ra

{0,{µ∗j|j ∈ J}} thỏa mãn các điều kiện K-T của (QP)0(x∗, H, J). Tương tự, nếu chúng ta viết các điều kiện {0,{µ∗

j|j ∈ J}} là một cặp K-T của (QP)0(x∗, H, J), chúng ta suy ra (3.29) và (3.30). Mệnh đề 3.2.5. Nếu{d,{µj|∀j ∈ J}}là một cặp K-T của (QP)0(x∗, H, J) và c ≥ X j∈J j6=0 µj, thì {d, ξ = 0,{µ¯j|∀j ∈ J}}¯ là một cặp K-T của (QP)0(x∗, H,J¯) trong đó ¯ J = J ∪ {0}, µ¯j = µj, ∀j ∈ J , j¯ 6= 0, µ¯0 = c−X j∈J j6=0 µj.

Chứng minh: Từ giả thiết ta suy ra

∇f(x) +X

j∈J

µj∇gj(x) +Hd = 0, gj(x) +∇gj(x)0d ≤ 0, ∀j ∈ J, µj ≥ 0, µj[gj(x) +∇gj(x)0d] = 0,∀j ∈ J.

Sử dụng định nghĩa của J ,¯ µ¯j và thực tế g0(x) , 0, ta thấy từ có mối quan hệ suy ra ∇f(x) +X j∈J ¯ µj∇gj(x) +Hd = 0, c = X j∈J ¯ µj, gj(x) +∇gj(x)0d ≤ 0, ∀j ∈ J ,¯

µj ≥ 0, µ¯j[gj(x) +∇gj(x)0d] = 0, ∀j ∈ J .¯

Đây đúng là các điều kiện K-T của {d, ξ = 0,{µ¯j|j ∈ J¯}} trong sự liên quan với (QP)c(x, H,J¯).

Mệnh đề 3.2.6. Nếu {x∗,(µ1∗, ..., µ∗r)} là một cặp K-T của (ICP), thì x∗

được gọi là một điểm tới hạn của f +cP với mọi c thỏa mãn:

c ≥

r X

j=1

µ∗j.

Chứng minh: Theo Mệnh đề 3.2.4, tồn tại µ∗0 ≤ 0, sao cho {d∗ = 0,(µ∗0, µ∗1, ..., µ∗r)}là một cặp K-T của (QP)0(x∗, H,{0,1, ..., r}). Từ Mệnh đề 3.2.5, nếu c ≤

r P j=1

µ∗j, thì {d∗ = 0, ξ∗ = 0} là nghiệm tối ưu của (QP)c(x∗, H,{0,1, ..., r}). Theo Mệnh đề 3.2.3, x∗ là một điểm tới hạn của f +cP.

Bổ đề 3.2.7. Nếu X là một tập compact, thì với mỗi x ∈ X tồn tại duy nhất vector µ¯(x) = [¯µ1(x), ...,µ¯r(x)] cực tiểu trên µ = (µ1, ..., µr) hàm số

qx(µ) =|∇f(x) + r X j=1 µj∇gj(x)|2 + r X j=1 [P(x)−gj(x)]2µ2j. (3.31) Hàm µ¯(.) liên tục trên X, và nếu (x∗, µ∗) là một cặp K-T của (ICP) với x∗ ∈ X, thì

µ(x∗) = µ∗.

Chứng minh: Để thấy được tính duy nhất vector cực tiểu ở phương trình (3.31), dạng bậc hai của qx(µ) sẽ là | r X j=1 µj∇gj(x)|2 + r X j=1 [P(x)−gj(x)]2µ2j,

không thể bằng 0 trừ µ = 0. Thật vậy, nếu dạng này bằng 0, thì µj = 0,

∀j = 1, ..., r với P(x) > gj(x) trong khi đồng thời Prj=1µj∇gj(x) = 0. Vì vậy

1≤j≤r j∈J(x)

Vì {∇gj(x)| j ∈ J(x)} là một tập độc lập tuyến tính theo giả thuyết điều đó cho thấy µj = 0 với mọi j với gj(x) = P(x). Vì vậy µ= 0.

Tính liên tục của µ¯ theo sau tính liên tục của ∇f,∇gj, và P. Nếu

(x∗, µ∗) là một cặp K-T của (ICP), thì qx∗(µ∗) = 0. Vì vậy µ∗ cực tiểu

qx∗(·) và cho thấy µ∗ = ¯µ(x∗).

Mệnh đề 3.2.8. ChoX ⊂ Rn là một tập compact sao cho, với mọix ∈ X, tập các gradient

{∇gj(x)| j ∈ J(x)},

là độc lập tuyến tính. Khi đó tồn tại số thực c∗ ≥ 0 sao cho với mọi c > c∗:

a) Nếu x∗ là một điểm tới hạn của f + cP và x∗ ∈ X, thì tồn tại một

µ∗ ∈ Rr sao cho (x∗, µ∗) là một cặp K-T của (ICP).

b) Nếu (x∗, µ∗) là một cặp K-T của (ICP) và x∗ ∈ X, thì x∗ là một điểm tớn hạn của f + cP. Chứng minh: Giả sử c∗ = max x∈X r X j=1 ¯ µj(x),

phương trình trên đạt cực đại vì theo giả thuyếtX là tập compact và µ¯j(.)

liên tục theo Bổ đề 3.2.7.

(a) Nếu x∗ ∈ X là một điểm tới hạn của f + cP, thì theo Mệnh đề 3.2.3, {d = 0, ξ = P(x∗)} là nghiệm tối ưu của (QP)c(x∗, H,{0,1, ..., r}). Vì vậy, tồn tại µ∗0, µ∗1, ..., µ∗r sao cho

∇f(x∗) + r X j=0 µ∗j∇gj(x∗) = 0, c = r X j=0 µ∗j, (3.32) µ∗j ≥ 0, µ∗j[gj(x∗)−P(x∗)] = 0, ∀j = 0,1, ..., r. (3.33) Vì g0(x) , 0, ta được: ∇f(x∗) + r X j=1 µ∗j∇gj(x∗) = 0, µ∗j[gj(x∗)−P(x∗)] = 0, ∀j = 1, ..., r.

Sử dụng các phương trình trên và Bổ đề 3.2.7, thì µ∗j = ¯µj(x∗) với mọi j = 1, ..., r. Nếu c > c∗, thì ta có µ∗0 = c− r X j=1 µ∗j = c− r X j=1 ¯ µj(x∗) ≥ c−c∗ > 0. Vì 0 = µ∗0[g0(x∗) − P(x∗)] = −µ∗0P(x∗), khi đó P(x∗) = 0 và x∗ có thể thực hiện được cho bài toán (ICP). Khi đó từ phương trình (3.32) và (3.33), {x∗,(µ∗1, ..., µ∗r)} là một cặp K-T cho (ICP).

(b) Nếu (x∗, µ∗) là một cặp K-T cho (ICP) và x∗ ∈ X, thì theo Bổ đề 3.2.7, ta có µ∗ = µ(x∗). Nếu c > c∗ thì c > r X j=1 µ∗j,

và sử dụng Mệnh đề 3.2.6, ta được x∗ là một điểm tới hạn của f +cP.

Hai mệnh đề tiếp theo cũng tương tự Mệnh đề 3.1.7 nhưng sử dụng giả thiết lồi ở vị trí giả định độc lập tuyến tính.

Bổ đề 3.2.9. Giả sử X ⊂ R∗ là một tập thỏa mãn với mỗi x ∈ R hệ bất phương trình trong d

gj(x) +∇gj(x)0d ≤ 0, ∀j ∈ J(x),

có ít nhất một nghiệm. Cố định H > 0, và giả sử tồn tại số thực c ≥0 có tính chất sau:

Với mọi x ∈ X, (QP)0(x, H, J(x)) có một tập các nhân tử Lagrange

{µj(x)|∀j ∈ J(x)},

thỏa mãn

c∗ ≥ X

j∈J(x)

µj(x).

Khi đó với mọi c > c∗, ta có:

(a) Nếu x∗ ∈ X là một điểm tới hạn của f +cP và x∗ ∈ X, thì tồn tại một µ∗ ∈ Rr sao cho (x∗, µ∗) là một cặp K-T cho (ICP).

(b) Nếu(x∗, µ∗) là một cặp K-T cho (ICP) và x∗ ∈ X, thì x∗ là một điểm tới hạn của f +cP.

Chứng minh: a) Giả sử x∗ ∈ X là điểm tới hạn. Đặt {d∗,{µj(x∗)|j ∈ J(x∗)}} tương ứng cặp K-T của (QP)0(x∗, H, J(x∗)). Đặt c > c∗, vì

c > P j∈J(x∗)

µj(x∗), từ Mệnh đề 3.2.5 {d∗, ξ = 0} là nghiệm tối ưu của (QP)c(x∗, H, J(x∗)). Vì x∗ là điểm tới hạn, Mệnh đề 3.2.3 cho thấy

d∗ = 0, P(x∗) = 0. Từ Mệnh đề 3.2.4, {x∗,(µ∗1, ..., µ∗r)}, trong đó µ∗j = µj(x∗) với j ∈ J(x∗), j 6= 0, 0 với j 6= J(x∗), j 6= 0. là một cặp K-T của (ICP).

b) Giả sử {x∗,(µ∗1, ..., µ∗r)} là một cặp K-T của (ICP) và x∗ ∈ X. Khi đó theo Mệnh đề 3.2.4, d∗ = 0 là nghiệm tối ưu của (QP)0(x∗, H, J(x∗)). Giả sử µj(x∗) là các nhân tử Lagrange thỏa mãn c∗ ≥ P

j∈J(x∗)

µj(x∗) theo giả thiết. Từ Mệnh đề 3.2.5 {d∗ = 0, ξ∗ = 0} là một nghiệm tối ưu của (QP)c(x∗, H, J(x∗)) với mọi c ≥ c∗. Sử dụng Mệnh đề 3.2.3, ta có x∗ là điểm tới hạn của f + cP với mọi c ≥ c∗.

Mệnh đề 3.2.10. Giả sử g1, ..., gr là lồi trên Rn và tồn tại một vector x¯

sao cho:

gj(¯x) < 0,∀j = 1, ..., r.

Khi đó với mỗi tập compact X, tồn tại số thực c∗ > 0 sao cho với mọi

c > c∗:

(a) Nếu x∗ là một điểm tới hạn của f + cP và x∗ ∈ X, thì tồn tại một

µ∗ ∈ Rr sao cho (x∗, µ∗) là một cặp K-T cho (ICP).

(b) Nếu(x∗, µ∗) là một cặp K-T cho (ICP) và x∗ ∈ X, thì x∗ là một điểm tới hạn của f +cP.

Chứng minh: Cố định H > 0, theo tính lồi của gj, ta có

gj(x) +∇gj(x)0(¯x−x) ≤ gj(¯x) < 0, ∀x ∈ Rn, j = 1, ..., r.

Do đó với mọi x ∈ Rn, (QP)0(x, H, J(x)) có d¯= (¯x−x) như một nghiệm xác định. Giả sử d(x) là nghiệm tối ưu và {µj(x)|j ∈ J(x)} là một tập

các nhân tử Lagrange tương ứng. Ta có d(x) cực tiểu ∇f(x)0d+ 1 2d 0Hd+ X j∈J(x) µj(x)[gj(x) +∇gj(x)0d]

với mọi d, trong đó

µj(x)[gj(x) + ∇gj(x)0d(x)] = 0, ∀j ∈ J(x). Do đó ∇f(x)0d(x) + 1 2d(x) 0Hd(x) ≤ ∇f(x)0(¯x−x) + 1 2(¯x−x)0H(¯x−x) + X j∈J(x) µj(x)[gj(x) +∇gj(x)0(¯x−x)] ≤ ∇f(x)0(¯x−x) + 1 2(¯x−x)H(¯x−x) + X j∈J(x) µj(x)gj(¯x) ≤ ∇f(x)0(¯x−x) + 1 2(¯x−x)0H(¯x−x)−b X j∈J(x) µj(x), (3.34) trong đó b = min{−gj(¯x)|j = 1, ..., r} > 0 Ta cũng có 0 ≤ 1 2|H−1/2∇f(x) +H1/2d(x)|2 = 1 2∇f(x)0H−1∇f(x) +∇f(x)0d(x) + 1 2d(x) 0Hd(x). (3.35) Kết hợp (3.34) và (3.35), ta có X j∈J(x) µj(x) ≤c(x), ∀x ∈ Rn, trong đó c(x) = [1 2∇f(x)0H−1∇f(x) + ∇f(x)0(¯x−x) + 1 2(¯x−x)0H(¯x−x)]/b. Cho một tập compact X và cố định H > 0, xác định c∗ = max x∈X c(x),

và chú ý rằng

c∗ ≥ c(x) ≥ X

j∈J(x)

µj(x), ∀x ∈ X.

Mệnh đề 3.2.11. Giả sử rằng f, g1, ..., gr là các hàm lồi trênRn và (ICP) có ít nhất một vector nhân tử Lagrange µ∗ = (µ∗1, ..., µ∗r), theo nghĩa µ∗j ≥ 0, ∀j = 1, ..., r, và

inf

x∈Rn{f(x) +µ∗0g(x)}= inf

g(x)≤0f(x).

Khi đó, với mọi c > Pr

j=1µ∗j, một vector x∗ là cực tiểu toàn cục của

f +cP nếu và chỉ nếu x∗ là cực tiểu toàn cục của (ICP). Ví dụ 3.2.12. Cho n = 2, r = 1, và với mọi x = (x1, x2),

f(x) = (x1 −1)2 +x22, g1(x) = x21.

Trong đó, f và g1 là các hàm lồi và (ICP) có nghiệm tối ưu duy nhất là {x∗1 = 0, x∗2 = 0}. Xét hàm số:

f(x) +cP(x) = (x1 −1)2 +x22 +cmax{0, x21} = (x1 −1)2 +x22 +cx21.

(3.36) Với mọi số thựcc > 0, hàm số có một điểm tới hạn duy nhất{x1(c), x2(c)}

là

x1(c) = 1/(1 +c), x2(c) = 0.

Như vậy nghiệm tối ưu {x∗1 = 0, x∗2 = 0} của (ICP) không là điểm tới hạn của f+cP với một số thựcc > 0dương nào đó. Ngược lại, không một điểm nào trong số các điểm tới hạn {x1(c), x2(c)}, c > 0 là một nghiệm tối ưu của (ICP). Do đó, {x∗1 = 0, x∗2 = 0} không là điểm chính quy

[∇g1(x∗) = 0], và nó có thể được xác định là không có nhân tử Lagrange tương ứng µ∗1. Như vậy Mệnh đề 3.2.8 không thể áp dụng cho một tập compact chứa {x∗

1 = 0, x∗2 = 0}, và giả thiết của Mệnh đề 3.2.11 bị vi phạm. Bởi vì tại đó không tồn tạix¯ sao cho g1(¯x) < 0, giả thiết của Mệnh đề 3.2.10 cũng bị vi phạm.

Ví dụ 3.2.13. Cho n = 1, r = 2, và với mọi x

Hàm số P(x) có dạng:

P(x) = max{0,−x,1−x2},

Vì f(x) , 0 là các điểm tới hạn của f + cP không phụ thuộc vào c. Chúng là

x = 1

2(1−√5), x = 0, 1≤ x.

Trong số này, chỉ cóx≥ 1tương ứng là các cặp K-T của (ICP). Mệnh đề 3.2.8 áp dụng cho những điểm này với c∗ = 0. Các điểm tới hạn 12(1−√5)

và 0 là không bao hàm Mệnh đề 3.2.8 vì các tập tương ứng của gradient

{∇gj(x)|gj(x) =P(x), j = 1,2} là phụ thuộc tuyến tính. Mệnh đề 3.2.10 và 3.2.11 không áp dụng vì g2 là hàm không lồi.

KẾT LUẬN VÀ KIẾN NGHỊ

Sau một thời gian tìm hiểu, nghiên cứu từ một số tài liệu tác giả đã hoàn thành luận văn và thu được những kết quả sau:

- Luận văn hệ thống một số kết quả quan trọng trong không gian tôpô. Cụ thể, định nghĩa tập mở, tập đóng, tập compact, tập lồi; định lí hàm ẩn, định lí giá trị trung bình và sự mở rộng của chuỗi Taylor.

- Luận văn nghiên cứu các bài toán tối ưu có điều kiện cho bởi phương trình và bất phương trình, và trình bày phương pháp hàm phạt để giải các bài toán này.

Đề tài này dự kiến sẽ đóng góp một phần nhỏ vào việc giải quyết các bài toán cực trị có điều kiện cho bởi phương trình và bất phương trình. Trong tương lai, nghiên cứu có thể áp dụng rộng rãi và mở rộng phạm vi nghiên cứu trên nhiều bài toán phức tạp khác.

TÀI LIỆU THAM KHẢO

[1] David G. Luenberger (1973), Introduction to Linear and Nonlinear Programming, Addison Wesley Publishing Company.

[2] Dimitri P. Bertsekas (1996), Constrained Optimization and Lagrange multiplier methods, Athena Scientific, Belmont, Massachusetts.

[3] Daryoush Behmardi and Encyeh Dehgha Nayeri (2008), “Introduction of Fréchet and Gâteaux Derivation”, Applied Mathematical Science, Vol. 2, no. 20, 975-980.

Hàm phạt không khả vi cho bài toán phi tuyến tính (ICP)