Như chúng ta biết rằng một nghiệm tối ưu địa phương x∗ của bàitoán P thỏa mãn điều kiện cần bậc nhất và bậc hai kiểu Fritz-Johnnhư sau: Điều kiện này có hai hạn chế.. Trên cơ sở các tài
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
=== ===
BÙI ANH ĐỨC
VỀ ĐIỀU KIỆN TỐI ƯU BẬC HAI CỔ ĐIỂN CỦA
CÁC BÀI TOÁN TỐI ƯU PHI TUYẾN
LUẬN VĂN THẠC SĨ TOÁN HỌC
HÀ NỘI - 2018
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
=== ===
BÙI ANH ĐỨC
VỀ ĐIỀU KIỆN TỐI ƯU BẬC HAI CỔ ĐIỂN CỦA
CÁC BÀI TOÁN TỐI ƯU PHI TUYẾN
Chuyên ngành: Toán Giải tích
Mã số: 8 46 01 02
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: TS NGUYỄN VĂN TUYÊN
HÀ NỘI - 2018
Trang 3Lời cảm ơn
Luận văn “Về điều kiện tối ưu bậc hai cổ điển của các bài toán tối
ưu phi tuyến” là kết quả của quá trình cố gắng không ngừng của bảnthân tác giả và được sự giúp đỡ, động viên khích lệ của các thầy cô, bạn
bè đồng nghiệp và người thân
Tác giả xin bày tỏ lòng biết ơn sâu sắc đối với T.S Nguyễn VănTuyên đã trực tiếp tận tình hướng dẫn, cũng như cung cấp tài liệu thôngtin khoa học cần thiết cho luận văn này
Tác giả xin chân thành cảm ơn toàn thể các thầy cô giáo giảng viênKhoa Toán, các thầy cô phòng Sau Đại học và các thầy cô của TrườngĐại Học Sư Phạm Hà Nội 2 đã giảng dạy cũng như đã tạo điều kiện đểcho tác giả hoàn thành tốt công việc nghiên cứu khoa học của mình
Cuối cùng tác giả xin chân thành cảm ơn đồng nghiệp, đơn vị côngtác, gia đình và bạn bè đã động viên, tạo điều kiện giúp đỡ tôi trong quátrình học tập và thực hiện luận văn
Trang 4Lời cam đoan
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luậnvăn này là trung thực và không trùng lặp với các đề tài khác Tôi cũngxin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đãđược cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõnguồn gốc
Tác giả luận văn
Bùi Anh Đức
Trang 5Mục lục
1.1 Tập lồi và hàm lồi 8
1.1.1 Các khái niệm cơ bản 8
1.1.2 Hàm lồi trơn 11
1.2 Nón tiếp tuyến 11
1.2.1 Định nghĩa 11
1.2.2 Ràng buộc trơn và tính chính quy metric 13
1.3 Điều kiện tối ưu bậc nhất 20
1.3.1 Bài toán trơn không có ràng buộc 20
1.3.2 Bài toán trơn có ràng buộc 22
2 Điều kiện tối ưu bậc hai cổ điển 28 2.1 Điều kiện MFCQ và điều kiện tối ưu bậc hai cổ điển 28
2.2 Điều kiện MFCQ cải biên và điều kiện tối ưu bậc hai cổ điển 36
2.2.1 Mở rộng của bổ đề Hestenes 38
Trang 62.2.2 Mở rộng bổ đề Yuan 42
2.2.3 Kết quả tổng quát 43
2.2.4 Kết quả chính 44
2.2.5 Một điều kiện chính quy mới 50
Trang 7hj: Rn → R là các hàm số thực và khả vi liên tục đến cấp hai trên Rn.
Hàm Lagrange suy rộng của bài toán (P) được định nghĩa bởiL(x, λ0, λ, µ) = λ0f (x) +
pXi=1
λigi(x) +
qXj=1
I(x) = {i ∈ I | gi(x) = 0},C(x) = {d | ∇f (x)td 5 0, ∇gi(x)td 5 0, i ∈ I(x), ∇hj(x)td = 0, j ∈ J },
Trang 8Λ0(x) = {(λ0, λ, µ) 6= 0 | ∇xL(x, λ0, λ, µ) = 0,
(λ0, λ) ∈ Rp+1+ , λigi(x) = 0, i ∈ I},Λ(x) = {(λ, µ) | (1, λ, µ) ∈ Λ0(x)}
Như chúng ta biết rằng một nghiệm tối ưu địa phương x∗ của bàitoán (P) thỏa mãn điều kiện cần bậc nhất và bậc hai kiểu Fritz-Johnnhư sau:
Điều kiện này có hai hạn chế Hạn chế thứ nhất đó là nhân tử Lagrange
λ0 của hàm mục tiêu có thể bằng không; tức là khi đó hàm mục tiêukhông đóng vai trò gì trong điều kiện tối ưu này Hạn chế thứ hai đó lànhân tử (λ0, λ, µ) không nhất thiết giống nhau cho tất cả các hướng tớihạn Muốn kiểm tra được điều kiện (0.2) ta phải kiểm tra tính nửa xácđịnh dương của cận trên đúng trên tập tất cả các nhân tử Lagrange củamột dạng toàn phương Tuy nhiên, việc tính toán tập tất cả các nhân tửLagrange của (P) là một bài toán khó Quan trọng hơn nữa đó là mộtthuật toán chỉ đảm bảo được tính xấp xỉ nghiệm cho một cặp nhân tửLagrange
Trang 9Khi nhân tử Lagrange λ0 của hàm mục tiêu khác không, thì ta nói
x∗ thỏa mãn điều kiện tối ưu kiểu Karush–Kuhn–Tucker (KKT) Để đạtđược điều này thì x∗ phải thỏa mãn một điều kiện chính quy nào đó
Như chúng ta đã biết, x∗ thỏa mãn điều kiện chuẩn hóa ràng buộcđộc lập tuyến tính (LICQ); tức là nếu các véctơ
∇gi(x∗), i ∈ I(x∗), ∇hj(x∗), j ∈ J,độc lập tuyến tính, thì Λ(x∗) = {(λ, µ)} là tập một điểm và ta có
dt∇2xxL(x∗, λ, µ)d = 0 ∀d ∈ C(x∗) (0.3)Điều kiện (0.3) được gọi là điều kiện cần tối ưu bậc hai cổ điển cho Bàitoán (P) Như đã phân tích ở trên, các điều kiện tối ưu kiểu này đóng vaitrò quan trọng về cả phương diện lý thuyết và ứng dụng của lý thuyết tối
ưu Điều kiện (LICQ) là một điều kiện đủ để đảm bảo điều kiện cần tối
ưu bậc hai cổ điển Tuy nhiên, trong nhiều trường hợp, điều kiện (LICQ)
là rất chặt Nếu điều kiện (LICQ) không thỏa mãn, thì tập các nhân tử(KKT) có thể không là tập một điểm và khi đó điều kiện (0.3) khôngđược thỏa mãn Điều kiện tối ưu (0.3) đúng trong một số trường hợp đặcbiệt sau (xem [3]):
Trang 10buộc Mangasarian–Fromovitz (MFCQ) thỏa mãn tại x∗ thì điều kiện(0.3) chỉ đúng trong một số trường hợp như sau:
(C1) n 5 2,
(C2) px∗ 5 2, ở đó px∗ là số ràng buộc hoạt bất đẳng thức tại x∗
Sau đó, Baccari và Trad [2] đã đề xuất một số điều kiện mới đượcgọi là điều kiện chuẩn hóa ràng buộc Mangasarian-Fromovitz cải biên(MMF) và điều kiện bù chặt (GSCS) Các tác giả đã chỉ ra rằng các điềukiện (MMF) và (GSCS) là đủ để đảm bảo cho tính đúng đắn của cácđiều kiện tối ưu bậc hai cổ điển
Trên cơ sở các tài liệu tham khảo được trích dẫn ở trên, trong luậnvăn này chúng tôi sẽ khảo sát các điều kiện tối ưu bậc hai cổ điển chocác bài toán tối ưu phi tuyến với dữ liệu trơn C2
2 Mục đích nghiên cứu
Nghiên cứu các điều kiện tối ưu bậc hai cổ điển cho các bài toántối ưu phi tuyến
3 Nhiệm vụ nghiên cứu
Nghiên cứu các điều kiện chính quy và các điều kiện cần tối ưu bậchai cho các bài toán tối ưu phi tuyến với dữ liệu trơn C2
Trang 114 Đối tượng và phạm vi nghiên cứu
• Đối tượng nghiên cứu: Điều kiện tối ưu bậc hai
• Phạm vi nghiên cứu: Lý thuyết tối ưu
5 Phương pháp nghiên cứu
Tham khảo và cập nhật những nghiên cứu của các tác giả trongnước cũng như ngoài nước liên quan đến đề tài
6 Dự kiến đóng góp mới
Luận văn sẽ trình bày một cách hệ thống về các điều kiện tối ưubậc hai cổ điển cho các bài toán tối ưu phi tuyến
Trang 13Định nghĩa 1.4 Một tập K ⊂ Rn được gọi là một nón nếu αx ∈ K vớimọi α > 0 và x ∈ K.
Bổ đề 1.1 Giả sử X là một tập lồi Khi đó tập
cone(X) = {γx : x ∈ X, γ ≥ 0}
là một nón lồi
Định nghĩa 1.5 Cho K là một nón Tập hợp
K◦ := {y ∈ Rn : hy, xi ≤ 0, ∀x ∈ K}
được gọi là nón cực của K
Định nghĩa 1.6 Cho X là một tập lồi đóng và x ∈ X Tập hợp
NX(x) = {v ∈ Rn : ΠX(x + v) = x}
được gọi là nón pháp tuyến của X tại x
Theo định nghĩa, dễ dàng chứng minh được rằng
NX(x) = [cone(X − x)]◦.Định nghĩa 1.7 Một hàm số f được gọi là lồi nếu epif là một tập lồi.Định nghĩa 1.8 Một hàm f được gọi là lõm nếu −f lồi
Định nghĩa 1.9 Một hàm f được gọi là chính thường nếu f (x) > −∞với mọi x và f (x) < +∞ với ít nhất một x
Bổ đề 1.2 Một hàm f là lồi khi và chỉ khi với mọi x1, x2 và 0 ≤ α ≤ 1
ta có
f (αx1 + (1 − α)x2) ≤ αf (x1) + (1 − α)f (x2) (1.1)
Trang 14Định nghĩa 1.10 Một hàm f được gọi là lồi chặt nếu bất đẳng thức(1.1) là chặt với mọi x1 6= x2 và 0 < α < 1.
Bổ đề 1.3 Nếu f lồi thì domf là một tập lồi
Chứng minh Nếu x1 ∈ domf và x2 ∈ domf , thì theo Bổ đề 1.2, ta có
f (αx1 + (1 − α)x2) < +∞
Khi đó αx1 + (1 − α)x2 ∈ domf , nên domf là một tập lồi
Bổ đề 1.4 Nếu fi, i ∈ I, là một họ các hàm lồi, thì
f (x) = sup
i∈Ifi(x)
là tập lồi
Trang 15ở đây x1, x2, , xn biểu thị tọa độ của véctơ x.
Định lý 1.1 Giả sử rằng hàm f khả vi liên tục Khi đó
(i) f lồi nếu và chỉ nếu với mọi x và y
Định nghĩa 1.11 Một phương d được gọi là phương tiếp tuyến của tập
X ⊂ Rn tại điểm x ∈ X nếu tồn tại dãy các điểm xk ∈ X và các vôhướng τk > 0, k = 1, 2, , sao cho τk ↓ 0 và
d = limk→∞
xk − x
τk .
Từ định nghĩa này ta suy ra rằng xk → x vì nếu trái lại thì giớihạn ở trên không tồn tại
Trang 16Bổ đề 1.8 Cho X ⊂ Rn và x ∈ X Tập TX(x) của tất cả các phươngtiếp tuyến của X tại x là một nón đóng.
Chứng minh Giả sử d ∈ TX(x) Với mọi β > 0 ta có
βd = lim
k→0
xk − x(τk/β),
vì vậy dãy xk và τk/β thỏa mãn Định nghĩa 1.11 với phương βd Do đó
TX(x) là một nón
Lấy dj là một phương tiếp tuyến của X tại x và các dãy xj,k và
phương tiếp tuyến, với mọi j, tồn tại k(j) sao cho
Các nón tiếp tuyến đóng vai trò quan trọng trong các điều kiện tối
ưu cho các bài toán tối ưu phi tuyến Trong Định lí 1.4 (xem Mục 1.3.1.),chúng ta chỉ ra rằng một tối ưu địa phương của bài toán
minx∈X f (x)thỏa mãn hệ thức
−Of(ˆx) ∈ [TX(ˆx)]◦.Nói chung, các nón tiếp tuyến có thể không lồi Điều này làm choviệc phân tích các điều kiện tối ưu trở nên khó khăn Tuy nhiên, trong
Trang 17một số trường hợp đặc biệt và có ý nghĩa trong ứng dụng các nón này làlồi.
Để thuận tiện ta kí hiệu
KX(x) = {d ∈ Rn : d = β(y − x), y ∈ X, β ≥ 0},
và gọi là nón của các hướng chấp nhận được tại x ∈ X
Bổ đề 1.9 Cho X ⊂ Rn là tập lồi và x ∈ X Khi đó
TX(x) = KX(x)
Chứng minh Với mỗi d ∈ KX(x) là phương tiếp tuyến được định nghĩa.Hơn nữa, KX(x) là nón lồi Vì nón tiếp tuyến là đóng,
KX(x) ⊂ TX(x)
Nếu các tập này không bằng nhau, thì tồn tại h ∈ TX(x)\KX(x) Từ Định
lí tách [6, Theorem 2.14] tồn tại y 6= 0 sao cho hy, hi > 0 và hy, di ≤ 0với tất cả d ∈ KX(x) Từ h là phương tiếp tuyến của X tại x, tồn tạimột dãy các điểm xk của X và một dãy các vô hướng τk ↓ 0 thỏa mãnĐịnh nghĩa 1.11 với phương h Do đó, ta được
hy, hi = hy, lim
1.2.2 Ràng buộc trơn và tính chính quy metric
Trong các ứng dụng, ta thường gặp các tập hợp được định nghĩabởi một giao của một họ tập hợp có dạng sau
X = X1 ∩ X2 ∩ ∩ Xm
Trang 18Với một điểm x ∈ X ta luôn có
TX(x) ⊂ Tx1(x) ∩ TX2(x) ∩ ∩ TXm(x)
nhưng dấu đẳng thức không được đảm bảo Mục đích chính của phầnnày là đưa ra các điều kiện để đảm bảo đẳng thức này, cho các dạngđặc biệt của tập Xi Hơn nữa, chúng ta tính toán được nón cực [TX(x)]◦trong trường hợp này
Tập hợp chấp nhận được của các bài toán tối ưu phi tuyến thườngđược định nghĩa bởi hệ các bất phương trình và phương trình:
gi(x) ≤ 0, i ∈ I,
hj(x) = 0, j ∈ J
Ngoài ra, chúng ta có thể có các ràng buộc trừu tượng với dạng x ∈ X0
Để thuận tiện ta xét một hệ ràng buộc có dạng tổng quát sau
g(x) ∈ Y0
x ∈ X0,
(1.2)
ở đó g : Rn → Rm là khả vi liên tục, Y0 là tập lồi đóng trong Rm và X0
là tập lồi đóng trong Rn Ví dụ, khi Y0 = {y ∈ Rp : y ≤ 0}, hệ (1.2) chỉ
có những ràng buộc về bất đẳng thức Khi Y0 = {0} hệ chỉ có các ràngbuộc đẳng thức Sự kết hợp của các ràng buộc về bất đẳng thức và đẳngthức có thể nhận được bằng cách biểu diễn Y0 như là tích của các nửađường thẳng và các số 0
Chúng ta sử dụng kí hiệu g0(x) để biểu thị Jacobian của hàm g(·)
Trang 19Kí hiệu X là tập hợp được định nghĩa bởi hệ (1.2),
X = {x ∈ X0 : g(x) ∈ Y0},
và xét điểm x0 ∈ X Cho d là một phương tiếp tuyến của X tại x0, điều
đó suy ra d ∈ TX0(x0) Hơn nữa, khi x0 bị nhiễu theo phương d, thì g(x0)
bị nhiễu theo phương g0(x0)d Do đó, g0(x0)d ∈ TY0(y0) Vì vậy,
g(xR) − ˜u ∈ Y0,
và sao cho
kxR − ˜xk ≤ C(dist(˜x, X0) + dist(g(˜x) − ˜u), Y0))
Trong [6, Theorem A.10] đã chỉ ra rằng tính chính quy metric tươngđương với điều kiện Robinson sau:
{g0(x0) − υ : d ∈ KX0(x0), υ ∈ KY0(g(x0))} = Rm (1.3)
Trang 20Ta thấy rằng tập hợp vế trái của (1.3) là một nón, và do đó một cáchkhác để biểu diễn điều kiện Robinson là
0 ∈ int{g0(x0)(x − x0) − (y − g(x0)) : x ∈ X0, y ∈ Y0)}
Đối với hệ chỉ gồm các ràng buộc đẳng thức g(x) = 0, khi X0 = Rn và
Y0 = 0, tính chính quy metric tương đương với độc lập tuyến tính củacác gradient của các ràng buộc
Ogi(x0), i = 1, , m
Vai trò của tính chính quy metric được thể hiện trong định lí sau.Định lý 1.2 Nếu hệ (1.2) là chính quy metric, thì
TX(x0) = {d ∈ Rn : d ∈ TX0(x0), g0(x0)d ∈ TY0(g(x0))} (1.4)Chứng minh Trước tiên chúng ta hãy chứng minh rằng mọi phương tiếptuyến d là một phần tử của tập hợp ở vế bên phải của (1.4) Do X ⊂ X0,phương d là một phần tử của Tx0(x0) Từ Định nghĩa 1.11 tồn tại cácđiểm xk ∈ X và đại lượng vô hướng τk ↓ 0 sao cho
d = limk→∞
xk − x
τk .Đặt yk = g(xk), y0 = g(x0) Ta có
Trang 21Chúng ta cần chứng minh điều ngược lại Cho d là một phươngtrong tập hợp ở vế phải của (1.4) Xét các điểm có dạng
x(τ ) = x0 + τ d, τ > 0
Do d ∈ TX0(x0),
dist(x(τ ), X0) = o1(τ ), (1.5)với o1(τ )/τ → 0, khi τ ↓ 0 Như vậy,
g(x(τ )) = g(x0) + τ g0(x0)d + o2(τ ),với ko2(τ )k/τ → 0, khi τ ↓ 0 Từ g0(x0)d ∈ TY0(g(x0)), ta suy ra rằngdist(g(x(τ )), Y0) ≤ ko2(τ )k + dist(g(x0) + τ g0(x0)d, Y0) = o3(τ ) (1.6)với o3(τ )/τ → 0, khi τ ↓ 0 Do đó, các điểm x(τ ) "hầu hết" thuộc về X0
và "hầu hết" thỏa mãn các ràng buộc g(x) ∈ Y0 Sai số không đáng kểđối với τ Bây giờ, ta có thể sử dụng tính chất của tính chính quy metric.Đặt ˜x = x(τ ) và ˜u = 0 trong Định nghĩa 1.12, ta suy ra rằng τ đủ nhỏ
τ > 0 ta có thể tìm các điểm xR(τ ) ∈ X sao cho
kxR(τ ) − x(τ )k 6 C (dist(x(τ ), X0) + dist(g(x(τ )), Y0))
Do đó d là một phương tiếp tuyến của X tại x0
Bây giờ chúng ta có thể dễ dàng đưa ra các dạng đại số của nóntiếp tuyến của hệ gồm các phương trình và bất phương trình Xét hệ
gi(x) ≤ 0, i = 1, , p,
hj(x) = 0, j = 1, , q,
x ∈ X0,
(1.7)
Trang 22với các hàm số khả vi liên tục g : Rn → Rp
và h : Rn → Rq và một tậplồi đóng X0 Ta xét một điểm x0 thỏa mãn (1.7) và ta xác định tập hợpcác ràng buộc bất đẳng thức hoạt
Vì tập hợp vế bên trái là một nón, nó tương đương với yêu cầu rằng 0
là một điểm trong của tập hợp này Một điều kiện đủ đơn giản hơn củatính chính quy metric có thể nhận được như sau
Bổ đề 1.10 Giả sử rằng tồn tại một điểm xM F ∈ intX0 sao cho
hOgi(x0), xM F − x0i < 0, i ∈ I(x0)hOhj(x0), xM F − x0i = 0, j = 1, , q
(1.9)
và gradient Ohj(x0), j = 1, , q là độc lập tuyến tính Khi đó, hệ (1.7)
là chính quy metric tại x0
Chứng minh Từ xM F là một điểm trong, tồn tại ε > 0 sao cho hìnhcầu tâm xM F bán kính ε cũng bao gồm các điểm trong của X Kí hiệu
B = {s ∈ Rn : ksk ≤ ε} Khi đó
xM F − x0 + B ⊂ Kx0(x0)
Trang 23Theo (1.9) ta có thể chọn ε đủ nhỏ luôn dương và δ dương, sao cho
hOgi(x0), xM F − x0 + si < −δ, ∀i ∈ I(x0), s ∈ B (1.10)
Vì các gradient Ohi(x0), i = 1, , p là độc lập tuyến tính, ta có
0 ∈ {h0(x0)s : s ∈ B} (1.11)Chọn δ > 0 đủ nhỏ, ta có thể đảm bảo rằng hình cầu bán kính δ bao hàmtrong tập hợp bên vế phải của (1.11) Để kiểm nghiệm chính thức điềukiện Robinson (1.11), chọn bất kì hy, zi ∈ Rp× Rq sao cho k(y, z)k 6 δ
Từ (1.11), ta tìm s ∈ B sao cho h0(x0)s = z Khi đó, hệ thức thứ hai của(1.9) cho
Bổ đề 1.11 Hệ (1.7) với X0 = Rn thỏa mãn điều kiện điều kiện chuẩnhóa ràng buộc Mangasarian–Fromovitz tại một điểm x0 nếu và chỉ nếu
nó là chính quy metric tại x0
Trang 241.3 Điều kiện tối ưu bậc nhất
1.3.1 Bài toán trơn không có ràng buộc
Trong mục này chúng ta trình bày các điều kiện cần để cho mộtđiểm là tối ưu địa phương của các bài toán tối ưu Cho f : Rn → R,
X ⊂ Rn và chúng ta xét bài toán
minx∈X f (x)Một điểm ˆx ∈ X được gọi là tối ưu địa phương của bài toán này nếu tồntại ε > 0 sao cho
f (y) ≥ f (ˆx), với mọi y ∈ X sao cho k y − ˆx k≤ ε
Nếu f (y) ≥ f (ˆx) với mọi x ∈ X, điểm ˆx được gọi là tối ưu toàn cục
Khi X = Rn, thì bài toán trên được gọi là bài toán tối ưu không
Chứng minh (i) Từ định nghĩa về gradient, với mọi y ∈ Rn
f (y) = f (ˆx) + hOf (ˆx), y − x)i + r(ˆx, y)trong đó
limy→ˆ xr(ˆx, y)
ky − ˆxk = 0.
Trang 25Điều này có thể biểu diễn tương đương là
r(ˆx, y(τ )) ≤ 1
2kOf(ˆx)k2.Thay thế bất đẳng thức cuối vào (1.13) ta kết luận rằng với mọi τ ∈ (0, ¯τ )
f (y(τ )) − f (ˆx) ≤ −1
2τ kOf (ˆx)k2
Do đó, ˆx không thể là nghiệm tối ưu địa phương
(ii) Nếu f (·) là lồi thì với mọi y ∈ Rn ta có
f (y) ≥ f (ˆx) + hOf (ˆx, y − ˆx)i = f (ˆx)
Vì vậy, ˆx là nghiệm tối ưu toàn cục
Các điểm thỏa mãn điều kiện (1.12) được gọi là điểm dừng củahàm f
Trang 261.3.2 Bài toán trơn có ràng buộc
Xét bài toán tối ưu có ràng buộc
min
với một hàm khả vi f : Rn → R và một tập X ⊂ Rn Nếu nghiệm ˆx làmột điểm biên của tập chấp nhận được X, điều kiện cần tối ưu trongĐịnh lí 1.3 không được thỏa mãn Lí do là khi nhiễu điểm ˆx có thể văng
ra khỏi tập chấp nhận được X, và vì thế chúng có thể tương ứng với sựgiảm của hàm mục tiêu Để nhận được các điều kiện cần tối ưu cho bàitoán này, chúng ta hạn chế tập hợp các nhiễu có thể trên các phươngtiếp tuyến tại ˆx
Định lý 1.4 Giả sử ˆx là nghiệm tối ưu địa phương của bài toán (1.14)
và f (·) khả vi tại ˆx Cho TX(ˆx) là nón tiếp tuyến của tập X tại ˆx Khiđó
−Of(ˆx) ∈ [TX(ˆx)]◦ (1.15)Ngược lại, nếu hàm f (·) là lồi, tập X là lồi, và một điểm ˆx ∈ X thỏamãn hệ thức (1.15), thì ˆx là nghiệm tối ưu toàn cục của bài toán (1.14).Chứng minh Giả sử phản chứng
−Of(ˆx) /∈ [TX(ˆx)]◦.Điều này có nghĩa là tồn tại một phương d ∈ TX(ˆx) sao cho
Với d là một phương tiếp tuyến, tồn tại một dãy các điểm xk ∈ X hội tụđến ˆx và một dãy các vô hướng τk ↓ 0 sao cho
limk→∞
xk − ˆx
Trang 27Vì f (·) khả vi tại ˆx,
f (xk) − f (ˆx) = hOf (ˆx), xk − ˆxi + αk,trong đó αk/kxk− ˆxk → 0, khi k → ∞ Chia cả hai vế của phương trìnhcuối cho τk ta được
f (xk) − f (ˆx)
τk = hOf (ˆx), di < 0
Mặt khác, tất cả các điểm xk là chấp nhận được và chúng gần ˆx Vì ˆx lànghiệm tối ưu địa phương, f (xk) ≥ f (ˆx) với mọi k đủ lớn Do đó
lim
k) − f (ˆx)
τk ≥ 0,mâu thuẫn Vì vậy, hệ thức (1.15) là đúng
Bây giờ, giả sử hàm f (·) và tập X là lồi, và (1.15) được thỏa mãntại điểm ˆx ∈ X Vì X là tập lồi, với mọi y ∈ Y phương
f (y) ≥ f (ˆx) + hOf (ˆx), y − xi
Vì vậy f (y) ≥ f (ˆx) với mọi y ∈ X Định lý được chứng minh
Trang 28Nếu hàm f (·) chỉ có đạo hàm theo hướng tại ˆx, thì điều kiện cầntối ưu là
f0(ˆx, d) ≥ 0, ∀d ∈ TX(ˆx)
Chứng minh của điều kiện này có thể dễ dàng đạt được bởi các lập luậntương tự trong chứng minh của Định lí 1.4, sau công thức (1.17) Chúng
ta chỉ cần sử dụng đạo hàm theo hướng f0(ˆx, d) thay thế cho hOf (ˆx), di
Sự phát triển của các điều kiện cần tối ưu cho các lớp khác nhaucủa các bài toán tối ưu phi tuyến chính là sự giải mã điều kiện (1.15)cho các tập chấp nhận được X khác nhau Các công thức về nón cực củanón tiếp tuyến của X tại ˆx đóng vai trò then chốt ở đó
Bây giờ chúng ta xét các bài toán tối ưu phi tuyến dạng tổng quát
min f (x)với giả thiết gi(x) ≤ 0, i = 1, , p,
Các điều kiện tối ưu của Định lí 1.4 cho bài toán (P) bao hàm nóntiếp tuyến của tập chấp nhận được X tại điểm tối ưu ˆx Trong Định lí1.2, chúng ta đã thiết lập rằng nếu các ràng buộc của bài toán (P) làchính quy metric tại một điểm ˆx, thì nón tiếp tuyến của tập chấp nhậnđược X có dạng
TX(ˆx) = {d ∈ TX0(ˆx) :hOgi(ˆx), di ≤ 0, i ∈ I(ˆx),
hOhj(ˆx), di, j = 1, , p}
(1.18)
Trang 29Công thức (1.18) là đúng, nếu tất cả các hàm ràng buộc gi(·) và hi(·)
là affine và tập X là tập lồi đa diện Trong trường hợp phi tuyến tính,điều kiện Robinson (1.8), là tương đương với tính chính quy metric,
là đủ cho (1.18) đúng Khi X0 = Rn điều kiện chuẩn hóa ràng buộcMangasarian–Fromovitz là đủ (xem Bổ đề 1.11) Ta cũng biết rằng côngthức (1.18) là đúng nếu bài toán (P) thỏa mãn điều kiện Slater, tức là,các hàm gi(·), i = 1, , p là lồi, các hàm hj(·), j = 1, , q là affine, vàtồn tại một điểm chấp nhận được xS sao cho gi(xS) < 0, i = 1, , m và
xS ∈ int X0 nếu p > 0; xem [6]
Nếu bất kì các điều kiện đủ cho (1.18) được thỏa mãn, ta nói rằngbài toán (P) thỏa mãn điều kiện chuẩn hóa ràng buộc
Định lý 1.5 Cho ˆx là một nghiệm tối ưu địa phương của bài toán (P).Giả sử rằng tại ˆx điều kiện chuẩn hóa ràng buộc được thỏa mãn Khi đótồn tại các nhân tử ˆλi ≥ 0, i = 1, , p, và ˆµj ∈ R, j = 1, , q, sao cho
0 ∈ Of (ˆx) +
pXi=1
ˆ
λiOgi(ˆx) +
qXj=1
Trang 30của [6, Theorem 2.36] được thỏa mãn với
(Ogp0(ˆx))T(Oh1(ˆx))T
ˆ
µjOhj(ˆx) + [TX0(ˆx)]◦
Với i /∈ I(ˆx) chúng ta đặt ˆλi = 0 Từ [TX0(ˆx)]◦ = NX0(ˆx), hệ thức cuốicùng trở thành đồng nhất với (1.19) Đòi hỏi rằng các nhân tử λi là 0với các ràng buộc không hoạt có thể được viết như (1.20)
Các hệ số ˆλi, i = 1, , p và ˆµj, j = 1, , q trong (1.19)–(1.20)được gọi là các nhân tử Lagrange Các điều kiện (1.19)–(1.20) được gọi
là điều kiện Karush-Kuhn-Tucher (KKT)
Bổ đề sau cho ta một số tính chất của tập các nhân tử Lagrangecủa một bài toán tối ưu phi tuyến và đóng vai trò quan trọng trongchương sau của luận văn này
Bổ đề 1.12 (xem [6, Lemma 3.26]) Cho ˆx là nghiệm tối ưu địa phương