Chương 1 “Kiến thức chuẩn bị” nhắc lại một số kiến thức cơ sở về giải tíchlồi tập lồi, hàm lồi cùng một số tính chất cơ bản của chúng, định lý tách cáctập lồi và về bài toán quy hoạch ph
Trang 2Mục lục
Lời cảm ơn ii
Lời nói đầu iii
1 Kiến thức chuẩn bị 1 1.1 Tập afin và tập lồi 1
1.1.1 Tập afin 1
1.1.2 Tập lồi 2
1.2 Hàm lồi, lồi chặt và lồi mạnh 4
1.2.1 Hàm lồi và tính chất 4
1.2.2 Hàm lồi khả vi 6
1.2.3 Hàm lồi mạnh và tính chất 7
1.2.4 Cực trị của hàm lồi 8
1.3 Bài toán tối ưu phi tuyến 9
1.4 Tốc độ hội tụ 11
2 Bài toán với ràng buộc đẳng thức 14 2.1 Khái niệm và định nghĩa 14
2.2 Điều kiện tối ưu cần và đủ 15
2.3 Phương pháp nhân tử Lagrange 26
3 Bài toán với ràng buộc bất đẳng thức 31 3.1 Phương pháp hàm phạt 31
3.2 Phương pháp điểm trong 37
Kết luận 44
Tài liệu tham khảo 45
Trang 3Luận văn được hoàn thành tại Viện Toán học, Viện Hàn lâm Khoa học vàCông nghệ Việt Nam, dưới sự hướng dẫn của GS TS Trần Vũ Thiệu.
Tác giả xin bày tỏ lòng biết ơn sâu sắc nhất tới GS TS Trần Vũ Thiệu,người đã định hướng chọn đề tài và tận tình hướng dẫn để tác giả hoàn thànhluận văn này
Tác giả xin bày tỏ lòng biết ơn chân thành tới Trung tâm đào tạo, các thầy
cô giáo dạy cao học chuyên ngành Toán Ứng dụng, Viện Toán học đã giúp đỡtác giả trong suốt quá trình học tập và hoàn thành luận văn cao học
Tác giả xin được gửi lời cảm ơn chân thành tới gia đình, bạn bè, người thân
đã luôn động viên, cổ vũ, tạo mọi điều kiện thuận lợi cho tác giả trong quátrình học tập và hoàn thành luận văn
Hà Nội, tháng 8 năm 2013
Tác giả
Trần Quốc Toản
Trang 4Lời nói đầu
Các bài toán tối ưu đã khá quen thuộc và là những bài toán rất hay gặptrong lý thuyết và ứng dụng Khi giải một bài toán người ta thường tìm cáchđưa nó về các bài toán đơn giản hơn: với số biến hoặc số ràng buộc ít hơn,thậm chí không có ràng buộc càng tốt Ý tưởng này được thể hiện rõ nét trongphương pháp nhân tử Lagrange, phương pháp hàm phạt và phương pháp hàmchắn Đó là các phương pháp giải tiêu biểu trong lý thuyết tối ưu phi tuyến.Mục tiêu của luận văn này là tìm hiểu và trình bày các loại phương phápnêu trên, cho phép đưa bài toán tối ưu có ràng buộc về dãy bài toán khôngràng buộc hoặc có ràng buộc đơn giản hơn Các phương pháp và thuật toánnêu trong luận văn được trình bày chặt chẽ bằng ngôn ngữ toán học chính xác
và được minh hoạ qua các ví dụ bằng số cụ thể
Nội dung luận văn được chia thành ba chương
Chương 1 “Kiến thức chuẩn bị” nhắc lại một số kiến thức cơ sở về giải tíchlồi (tập lồi, hàm lồi cùng một số tính chất cơ bản của chúng, định lý tách cáctập lồi) và về bài toán quy hoạch phi tuyến: sự tồn tại nghiệm của bài toán,các điều kiện tối ưu cần và đủ Cuối chương đề cập tới sự hội tụ của dãy điểmlặp
Chương 2 “Bài toán với ràng buộc đẳng thức” đề cập tới kết quả lý thuyết
về điều kiện tối ưu cần và đủ (cấp 1 và cấp 2) cho nghiệm cực tiểu của bài toánquy hoạch phi tuyến với ràng buộc đẳng thức và trình bày phương pháp nhân
tử Lagrange đưa bài toán có ràng buộc đẳng thức về bài toán cực tiểu (khôngràng buộc) của hàm Lagrange (bằng hàm mục tiêu ban đầu cộng với các hàmràng buộc, sau khi đã nhân với các hệ số gọi là các nhân tử Lagrange)
Chương 3 “Bài toán với ràng buộc bất đẳng thức” đề cập tới phương pháphàm phạt và phương pháp hàm chắn Ý tưởng cơ bản của hai phương pháp này
Trang 5là đưa bài toán tìm cực tiểu hàm f (x) : Rn → R với các ràng buộc (tuyến tínhhay phi tuyến) về dãy bài toán cực tiểu không ràng buộc của hàm f (x)+µP (x).Trong phương pháp hàm phạt, P (x) là hàm phạt có dạng P (x) = 0 khi xthỏa mãn mọi ràng buộc, P (x) > 0 khi x vi phạm ràng buộc và tham số phạt
µ tăng dần Phương pháp này cho phép các điểm cực tiểu không ràng buộc
có thể không thuộc (ở ngoài) miền ràng buộc của bài toán ban đầu Vì thếphương pháp này còn có tên gọi là phương pháp hàm phạt điểm ngoài
Còn trong phương pháp hàm chắn, P (x) ≥ 0 khi x ở phần trong của miềnràng buộc và P (x) → ∞ khi x tiến ra biên của miền ràng buộc, tham số phạt
µ giảm dần tới 0 Hàm chắn có tác dụng ngăn điểm cực tiểu không ràng buộcvượt ra ngoài miền ràng buộc của bài toán (chỉ ở phần trong), vì thế phươngpháp này còn được gọi là phương pháp điểm trong hay phương pháp hàm phạtđiểm trong Hàm chắn hay được sử dụng là hàm chắn lôga và hàm chắn nghịchđảo
Do thời gian có hạn nên luận văn mới chỉ dừng lại ở việc tìm hiểu, tập hợptài liệu, sắp xếp và trình bày các kết quả đã có theo chủ đề đặt ra Trong quátrình viết luận văn cũng như trong việc xử lý văn bản chắc chắn không tránhkhỏi có những thiếu xót nhất định Tác giả luận văn rất mong nhận được sựgóp ý của các thầy cô, các bạn đồng nghiệp để luận văn được hoàn thiện hơn
Trang 6Chương 1
Kiến thức chuẩn bị
Chương này nhắc lại vắn tắt một số kiến thức cơ bản cần thiết về giải tíchlồi (tập lồi, hàm lồi và tính chất), về bài toán tối ưu phi tuyến (sự tồn tạinghiệm, các điều kiện tối ưu cần và đủ) và về sự hội tụ của dãy điểm lặp Nộidung trình bày ở chương này chủ yếu dựa trên các tài liệu [1], [2], [4] và [5]
1.1.1 Tập afin
Trước hết là những khái niệm liên quan tới tập afin
Định nghĩa 1.1 Một tập M ⊆ Rn được gọi là tập afin nếu
∀a, b ∈ M, λ ∈ R thì λa + (1 − λ)b ∈ M,tức là hễ M chứa hai điểm nào đó thì M chứa cả đường thẳng đi qua hai điểmấy
Một số tính chất cơ bản của tập afin:
• Nếu M là tập afin thì a + M = {a + x : x ∈ M } cũng là tập afin ∀a ∈ Rn
• M là tập afin chứa gốc khi và chỉ khi M là một không gian con của Rn
• Giao của một họ bất kỳ các tập afin cũng là một tập afin
1
Trang 7• Nếu x1, , xk thuộc tập afin M thì mọi tổ hợp afin của các điểm nàycũng thuộc M , nghĩa là
xi ∈ M (i = 1, , k), λ1+ + λk = 1 ⇒ λ1x1+ + λkxk ∈ M
• Một tập afin bất kỳ có dạng M = {x : Ax = b} với A ∈ Rm×n
, b ∈ Rm.Ngược lại, mọi tập có dạng trên đều là tập afin (Đó là tập nghiệm củamột hệ phương trình tuyến tính)
Bao afin của một tập E là giao của tất cả các tập afin chứa E, ký hiệuaff (E) Đó cũng là tập afin nhỏ nhất chứa E
Từ các tính chất của tập afin suy ra:
Có thể thấy: một tập M 6= ∅ là afin khi và chỉ khi M = x0+ L với x0 ∈ M
và L là một không gian con L được xác định duy nhất và được gọi là khônggian con song song với M (M nhận được bằng cách tịnh tiến L tới x0)
Thứ nguyên (hay số chiều) của một tập afin M được định nghĩa bằng sốchiều của không gian con song song với M
Định nghĩa 1.2 Một tập afin trong Rn có thứ nguyên n − 1 được gọi là mộtsiêu phẳng Có thể thấy siêu phẳng là tập có dạng H = {x : aTx = α} với
a ∈ Rn (a 6= 0), α ∈ R (Đó là tập nghiệm của một phương trình tuyến tínhtrong Rn)
Một tập k điểm x1, x2, , xk gọi là độc lập afin nếu k − 1 véctơ x2 −
x1, , xk− x1 độc lập tuyến tính Có một siêu phẳng duy nhất đi qua n điểmđộc lập afin cho trước trong Rn Một tập có dạng H = {x : aTx ≤ α} (hay
H = {x : aTx < α}) được gọi là một nửa không gian đóng (mở )
1.1.2 Tập lồi
Sau đây là một số khái niệm liên quan đến tập lồi
Trang 8Định nghĩa 1.3 Tập C ⊆ Rn được gọi là tập lồi nếu
∀a, b ∈ C, 0 ≤ λ ≤ 1 thì λa + (1 − λ)b ∈ C,tức là hễ C chứa hai điểm nào đó thì nó chứa cả đoạn thẳng nối hai điểm ấy
Có thể thấy tập hợp rỗng, toàn không gian Rn, mọi tập afin, siêu phẳng,nửa không gian (đóng, mở), hình cầu, đều là những tập lồi Trong R2, cáchình tam giác, hình vuông, hình tròn, hình êlip đều là các tập hợp lồi Tuynhiên, đường tròn hay hình vành khăn không phải là tập hợp lồi
Thứ nguyên hay số chiều của một tập lồi C là thứ nguyên của bao afin của
C Trong Rn một tập lồi thứ nguyên n được gọi là tập lồi có thứ nguyên đầyđủ
Sau đây là một số tính chất cơ bản của các tập lồi:
• Giao của một họ bất kỳ các tập lồi cũng là một tập lồi
• Nếu C, D là tập lồi thì C+D = {x+y : x ∈ C, y ∈ D}, αC = {αx : x ∈ C}
và C − D = C + (−1)D cũng là tập lồi Nếu C ⊂ Rn, D ⊂ Rm là tập lồithì tích C × D = {(x, y) : x ∈ C, y ∈ D} ⊂ Rn× Rm cũng là tập lồi
• Nếu x1, x2, , xk thuộc một tập lồi thì mọi tổ hợp lồi của các điểm nàycũng thuộc C, nghĩa là
xi ∈ C, λi ≥ 0 (i = 1, , k) λ1+ + λk = 1 ⇒ λ1x1+ λkxk ∈ C
• Nếu tập lồi C ⊂ Rn
không bị chặn thì có véctơ t ∈ Rn (t 6= 0) sao cho vớimọi x ∈ C tia x + λt, λ ≥ 0 nằm trọn trong C Một véctơ t như thế gọi làmột phương vô hạn của tập lồi C
Cho một tập bất kỳ E ⊂ Rn Giao của tất cả các tập lồi chứa E được gọi làbao lồi của E, ký hiệu conv (E) Đó là tập lồi nhỏ nhất chứa E Có thể thấy:
• conv (E) trùng với tập tất cả các tổ hợp lồi của các phần tử thuộc E
• Bao đóng của một tập lồi cũng là tập lồi
Trang 9Cho C ⊂ Rn là một tập lồi Điểm x ∈ C gọi là một điểm cực biên của Cnếu x không thể biểu diễn dưới dạng một tổ hợp lồi của hai điểm phân biệtbất kỳ khác của C, nghĩa là không tồn tại hai điểm y, z ∈ C, y 6= z sao cho
x = λy + (1 − λ)z với 0 < λ < 1
Mệnh đề 1.1 (Định lý tách) Hai tập lồi khác rỗng, không có điểm chung
C, D trong Rn(C ∩ D = ∅) có thể tách được bởi một siêu phẳng, nghĩa là tồntại véctơ t ∈ Rn(t 6= 0) và số α ∈ R sao cho các bất đẳng thức sau được thỏamãn
tTx ≥ α ≥ tTy với mọi x ∈ C và mọi y ∈ D
1.2.1 Hàm lồi và tính chất
Định nghĩa 1.4 Một hàm f (x) xác định trên một tập lồi C ⊂ Rn được gọi
là hàm lồi trên C nếu với mọi x, y ∈ C và mọi số thực λ ∈ [0, 1] ta có
f [λx + (1 − λ)y] ≤ λf (x) + (1 − λ)f (y)
Nếu bất đẳng thức trên thỏa mãn với dấu < với mọi x 6= y, 0 < λ < 1 thì
f (x) được gọi là lồi chặt Hàm f (x) gọi là lõm (lõm chặt ) nếu −f (x) là lồi (lồichặt)
Có thể chứng minh rằng hàm f (x) là lồi trên C khi và chỉ khi
a) Tập epif ≡ {(x, α) ∈ Rn+1 : x ∈ C, f (x) ≤ α} lồi, hoặc
Một số ví dụ quen thuộc về hàm lồi:
• Hàm tuyến tính afin l(x) ≡ cTx + α là hàm vừa lồi, vừa lõm Tuy nhiênhàm này không lồi chặt hay lõm chặt
• Dạng toàn phương nửa xác định dương q(x) ≡ xTCx là một hàm lồi
Trang 10• Hàm chuẩn f (x) ≡ kxk = phx, xi, x ∈ Rn là hàm lồi.
• Hàm khoảng cách từ điểm x ∈ Rn tới một tập lồi, đóng cho trước C ⊂
Vì thế, người ta mở rộng khái niệm hàm lồi thành hàm tựa lồi, đó là các hàm
f : Rn → [−∞, +∞] sao cho các tập mức dưới Lα = {x ∈ Rn : f (x) ≤ α} làlồi với mọi α ∈ R Hàm f (x) gọi là tựa lõm nếu −f (x) là tựa lồi Tất nhiênhàm lồi (lõm) cũng là tựa lồi (tựa lõm), nhưng điều ngược lại nói chung khôngđúng
Với x, d ∈ Rn cố định, ta ký hiệu ϕ(λ) ≡ f (x + λd) Khi đó ta có
Mệnh đề 1.2 Hàm f (x) là lồi khi và chỉ khi hàm một biến ϕ(x) ≡ f (x + λd)
là lồi theo λ với mọi x, d ∈ Rn
Trang 11Ta gọi đạo hàm theo hướng d ∈ Rn của hàm f tại điểm x ∈ Rn là giá trị số
δf (x, d) = lim
λ→0 +
f (x + λd) − f (x)
λnếu giới hạn này tồn tại (hữu hạn hay vô hạn) Có thể thấy rằng nếu hàm fkhả vi liên tục thì
là ma trận vuông đối xứng cấp n, gọi là ma trận Hess của f tại x
Để nhận biết hàm lồi, người ta còn sử dụng các tiêu chuẩn sau đây:
Mệnh đề 1.3 Các điều sau đây là tương đương:
a) f (x) là hàm lồi trên toàn Rn
b) Hàm số ϕ0(λ) ≡ ∇f (x + λd)Td không giảm theo λ
c) f (y) − f (x) ≥ ∇f (x)T(y − x) với mọi x, y ∈ Rn
d) Ma trận các đạo hàm riêng cấp hai ∇2f (x) nửa xác định dương với mọi x,nghĩa là dT∇2
f (x)d ≥ 0, ∀x, d ∈ Rn.Với hàm lồi chặt ta cũng có các tính chất tương tự như trong Mệnh đề 1.3
Trang 12Mệnh đề 1.4 Các điểu sau đây là tương đương:
Có thể chứng minh rằng hàm f (x) lồi mạnh khi và chỉ khi hàm f (x) − ηkxk2
là lồi Rõ ràng hàm lồi mạnh thì lồi chặt, nhưng điều ngược lại không chắc đúng.Các hàm lồi mạnh có vai trò đặc biệt quan trọng trong nghiên cứu các bàitoán tối ưu Sau đây sẽ xét các hàm lồi mạnh hai lần khả vi liên tục
Mệnh đề 1.6 Nếu f (x) là hàm hai lần khả vi liên tục thì điều kiện lồi mạnh(1.1) tương đương với điều kiện
dT∇2f (x)d ≥ mkdk2, m > 0 với mọi x, d ∈ Rn (1.2)
Mệnh đề 1.7 Hàm toàn phương f (x) = pTx + 1
2x
TCx là hàm lồi mạnh trêntoàn Rn khi và chỉ khi ma trận C xác định dương
Tập C ⊂ Rn được gọi là lồi chặt nếu ∀x, y ∈ C, x 6= y, mọi điểm
λx + (1 − λ)y với 0 < λ < 1,đều là điểm trong của C
Trang 13Tập C ⊂ Rn gọi là lồi mạnh nếu tồn tại hằng số η > 0 sao cho
∀x, y ∈ C và kzk ≤ ηkx − yk2 ⇒ 1
2(x + y) + z ∈ C.
Có thể thấy tập lồi mạnh thì lồi chặt, nhưng ngược lại không chắc đúng Vídụ: tập C = {(x, y) ∈ R2 : y ≥ ex} là tập lồi chặt nhưng không lồi mạnh.Cho trước điểm tùy ý x0 ∈ Rn
dT∇2f (x)d ≤ M kdk2,thì
dT[∇2f (x)]−1d ≥ m
M2kdk2.1.2.4 Cực trị của hàm lồi
Cho hàm số thực f (x) xác định trên một tập khác rỗng C ⊂ Rn Ta có
x0 ∈ C là điểm cực tiểu địa phương của f trên C nếu tồn tại số ε > 0 sao cho
f (x0) ≤ f (x) với mọi x ∈ C thỏa mãn kx − x0k < ε Ta nói x0 ∈ C là điểmcực tiểu toàn cục của f trên C nếu f (x0) ≤ f (x) với mọi x ∈ C
Các khái niệm cực đại địa phương, cực đại toàn cục được định nghĩa tương
tự Mệnh đề sau đây nêu một tính chất rất đáng chú ý của hàm lồi:
Mệnh đề 1.10 Cho f (x) là một hàm lồi xác định trên tập lồi C Nếu x0 ∈ C
là một điểm cực tiểu địa phương của f trên C thì x0 cũng là điểm cực tiểu toàncục của f trên C
Hơn nữa:
Trang 14• x0 ∈ C là điểm cực tiểu của f trên C khi và chỉ khi
∇f (x0
)T(x − x0) ≥ 0 với mọi x ∈ C
• Hàm lồi chặt có nhiều nhất một điểm cực tiểu
Mệnh đề 1.11 Cho f (x) là một hàm khả vi liên tục trên một tập mở chứa C.Nếu C là tập lồi đóng, khác rỗng và f lồi mạnh trên C (nói riêng, f là dạngtoàn phương xác định dương) thì f có duy nhất một cực tiểu trên C
Xét bài toán quy hoạch tuyến tính
min{f (x) : gi(x) ≤ 0, i = 1, , m; hj(x) = 0, j = 1, , p}, (P)trong đó f, gi, i = 1, , m và hj, j = 1, , p, là các hàm hai lần khả viliên tục (thuộc lớp C2) Ký hiệu g(x) = (g1(x), , gm(x))T ∈ Rm và h(x) =(h1(x), , hp(x))T ∈ Rp Điểm x thỏa mãn g(x) ≤ 0 và h(x) = 0 gọi là mộtđiểm (lời giải ) chấp nhận hay một phương án của bài toán (P) Tập các phươngán
D = {x ∈ Rn : g(x) ≤ 0, h(x) = 0}
gọi là miền chấp nhận của bài toán Đó là một tập lồi khi gi (i = 1, , m) làcác hàm lồi và hj (j = 1, , p) là các hàm afin Giả thiết D khác rỗng Mộtphương án đạt cực tiểu của hàm f được gọi là một phương án (nghiệm, lờigiải ) tối ưu
Khi đó, ta nói mỗi bất phương trình gi(x) ≤ 0 là một ràng buộc bất đẳngthức và mỗi phương trình hj(x) = 0 là một ràng buộc đẳng thức
Bài toán (P) có thể viết gọn lại thành
min{f (x) : x ∈ D}
Ta nhắc lại một số điều kiện đủ đảm bảo cho (P ) có nghiệm tối ưu:
• Nếu f là một hàm liên tục (hoặc nửa liên tục dưới) trên một tập compact
D 6= ∅ thì chắc chắn (P ) có nghiệm tối ưu (nghiệm đạt cực tiểu)
Trang 15• Nếu hàm f liên tục (hoặc nửa liên tục dưới) trên một tập đóng D 6= ∅
mà bức trên D, nghĩa là f (x) → +∞ khi x ∈ D, kxk → ∞, thì (P ) cónghiệm tối ưu
• Nếu f là một hàm tuyến tính hoặc hàm toàn phương mà bị chặn dướitrên một tập lồi đa diện D 6= ∅ thì (P ) có nghiệm tối ưu
Hàm Lagrange tương ứng với bài toán (P ) được xác định như sau:
L(x, µ, λ) = f (x) + g(x)Tλ + h(x)Tµ,trong đó x ∈ Rn, λ ∈ Rm, λ ≥ 0 và µ ∈ Rp
Giả sử x∗ là một nghiệm chấp nhận của (P ), ta ký hiệu
I(x∗) = {i : 1 ≤ i ≤ m, gi(x∗) = 0}
Bài toán (P ) được gọi là chính quy tại điểm x∗ (hay x∗ là điểm chính quy của(P )) nếu hệ {∇gi(x∗), i ∈ I(x∗) và ∇h1(x∗), , ∇hm(x∗)} độc lập tuyến tính.Điều kiện cần tối ưu (Định lý Karush - Kuhn - Tucker) Giả sử
x∗ ∈ D là điểm cực tiểu địa phương của f trên D và x∗ là điểm chính quy của(P ) Khi đó, có những nhân tử λ∗ ∈ Rm và µ∗ ∈ Rp thỏa mãn:
g(x∗) ≤ 0, h(x∗) = 0 ( do x∗ ∈ D)
với ∇g(x) = (∇g1(x), , ∇gm(x))n×m, ∇h(x) = (∇h1(x), , ∇hp(x))n×p.Điều kiện đủ tối ưu cấp hai Nếu (x∗, λ∗, µ∗) thỏa mãn các điều kiện
Trang 16• dT∇2
xxL(x∗, λ∗, µ∗)d > 0, ∀d ∈ D(x∗), d 6= 0,
trong đó D(x∗) = {d ∈ Rn : ∇gi(x∗)Td = 0, i ∈ I(x∗), ∇h(x∗)Td = 0} thì x∗ làmột điểm cực tiểu địa phương chặt của bài toán (P )
Hiện có nhiều thuật toán mạnh và hiệu quả giải các bài toán quy hoạch phituyến Các kỹ thuật giải thường là các thuật toán lặp (iterative algorithms),theo nghĩa: cho trước điểm ban đầu x0, một dãy điểm lặp {xk} được sinh ra nhờ
áp dụng lặp đi lặp lại các quy tắc nêu trong thuật toán Mục tiêu là làm saocho dãy điểm lặp hội tụ tới một điểm x thuộc tập nghiệm định trước, thườngđược xác định bởi các điều kiện tối ưu (chẳng hạn, điều kiện KKT đối với bàitoán quy hoạch phi tuyến có ràng buộc)
Với các thuật toán lặp, có hai câu hỏi căn bản đặt ra Câu hỏi thứ nhấtmang tính định tính: liệu thuật toán (theo nghĩa nào đó) có hội tụ tới nghiệmcủa bài toán ban đầu hay không, ít ra là ở giới hạn? Câu hỏi thứ hai mangtính định lượng hơn: thuật toán hội tụ tới nghiệm nhanh hay chậm? Các định
lý hội tụ và định lý đánh giá tốc độ hội tụ của thuật toán sẽ trả lời các câu hỏinày Mục này sẽ đề cập tới khái niệm liên quan đến sự hội tụ và tốc độ hội tụcủa thuật toán
Thuật toán lặp gọi là hội tụ tiệm cận (asymptotic convergence) nếu thuậttoán đó không cho nghiệm của bài toán sau một số hữu hạn lần lặp Trừ ramột số bài toán đặc biệt, như quy hoạch tuyến tính và quy hoạch toàn phương,còn nói chung sự hội tụ của các thuật toán giải quy hoạch phi tuyến là hội tụtiệm cận
Định nghĩa 1.6 Thuật toán gọi là hội tụ toàn cục (global convergence) nếuvới điểm ban đầu bất kỳ x0 thuật toán sinh ra dãy điểm lặp hội tụ tới mộtđiểm x thuộc tập nghiệm định trước Thuật toán gọi là hội tụ địa phương (localconver-gence) nếu tồn tại số ε > 0 sao cho với bất kỳ điểm ban đầu x0 thỏamãn kx0− xk < ε thuật toán sinh ra dãy điểm lặp hội tụ tới điểm x thuộc tậpnghiệm
Trang 17Phần lớn các thuật toán quy hoạch toán học hiện đại là các thuật toán hội
tụ toàn cục Các thuật toán hội tụ địa phương ít được dùng trong thực tiễn,bởi vì lân cận hội tụ không biết trước và có thể rất nhỏ
Sau đây sẽ đề cập tới bậc hội tụ của các thuật toán (tối ưu) hội tụ toàn cục.Định nghĩa 1.7 Giả sử {xk} ⊂ Rn là dãy điểm hội tụ tới x Bậc hội tụ (order
of convergence) của {xk → x} là số nguyên dương lớn nhất p sao cho
Tốc độ hội tụ tùy thuộc vào p và β Giá trị p và β phụ thuộc không chỉ vàothuật toán mà còn vào tính chất của từng bài toán cụ thể Rõ ràng, sự hội tụ
sẽ nhanh hơn khi p lớn hơn và β nhỏ hơn Dù β thế nào thì suy cho cùng sự hội
tụ bậc hai bao giờ cũng nhanh hơn sự hội tụ tuyến tính Một dãy hội tụ bậchai sẽ hội tụ trên tuyến tính và một dãy hội tụ trên tuyến tính sẽ hội tụ tuyếntính Ta cũng có thể định nghĩa tốc độ hội tụ bậc cao hơn (bậc ba, bậc bốn, ), nhưng đó không phải là các thuật ngữ hay được dùng trong thực tiễn.Tổng quát, sự hội tụ là bậc p (với p > 2), nếu có hằng số dương β sao cho
kxk+1− xk
kxk− xkp ≤ β < ∞ với mọi k đủ lớn
Khi ở gần nghiệm, nếu tốc độ hội tụ là tuyến tính thì khoảng cách tớinghiệm giảm dần, do sau mỗi lần lặp giảm ít nhất một hằng số β < 1 Ví dụ,dãy xk = 1 + 1
2
k
hội tụ tuyến tính tới x = 1
Dãy xk = 1 + k−k hội tụ trên tuyến tính tới x = 1 Thật vậy, ta có
Trang 18= 1
k + 1 × 1
k+1 k
2
2k
hội tụ bậc hai tới x = 1
Cuối cùng, ta xét bài toán tìm cực tiểu f (x) = x2 với điều kiện x ≥ 1.Giả sử ánh xạ thuật toán (điểm - điểm) M1 được xác định như sau: M1(x) =1
2(x + 1) Có thể kiểm tra lại rằng dãy nhận được bằng cách áp dụng ánh xạthuật toán M1 với điểm ban đầu bất kỳ x0 ≥ 1 sẽ hội tụ tới nghiệm tối ưu
x = 1, tức M1 là thuật toán hội tụ toàn cục Chẳng hạn, với x0 = 4, thuật toánsinh ra dãy điểm {4; 2, 5; 1, 75; 1, 375; 1, 1875; } Ta có (xk+1− 1) = 1
2(x
k− 1),
vì thế giới hạn trong Định nghĩa 1.7 là β = 1
2 với p = 1 Hơn nữa, với p > 1,giới hạn này bằng vô cùng Như vậy, xk → 1 với bậc hội tụ tuyến tính và tốc
độ hội tụ = 1
2.Bây giờ xét ánh xạ thuật toán (điểm - điểm) M2 được xác định như sau:
M2(x, k) = 1 + 1
2k(x − 1) Cũng vậy, dãy điểm nhận được bằng cách áp dụngthuật toán M2 hội tụ tới x = 1 từ điểm ban đầu bất kỳ x0 ≥ 1 Tuy nhiên,bây giờ ta có (xk+1 − 1) = 1
2k(xk − 1) và tỉ số x
k+1 − 1
xk − 1 =
1
2k hội tụ tới 0 khi
k → ∞ Do vậy, xk → 1 với bậc hội tụ trên tuyến tính Với x0 = 4, thuật toánsinh ra dãy {4; 2, 5; 1, 375; 1, 046875; }
Tóm lại, chương này đã nhắc lại các khái niệm cơ bản về tập lồi, hàm lồi(lồi chặt, lồi mạnh), về bài toán quy hoạch phi tuyến (sự tồn tại nghiệm củabài toán, điều kiện tối ưu cần và đủ) và về tốc độ hội tụ của dãy điểm lặp(tuyến tính, trên tuyến tính, bậc hai, bậc p)
Trang 19Bài toán với ràng buộc đẳng thức
Chương này xét bài toán quy hoạch phi tuyến ràng buộc đẳng thức có dạng
min{f (x) : hj(x) = 0, j = 1, , p},trong đó f, hj : Rn → R (j = 1, , p) là các hàm khả vi liên tục cho trước.Trình bày các điều kiện cần tối ưu, điều kiển đủ tối ưu (cấp 1, cấp 2) và phươngpháp nhân tử Lagrange tìm nghiệm cực tiểu của bài toán Nội dung của chươngđược tham khảo chủ yếu từ các tài liệu [2], [4], [5] và [7]
Các ràng buộc hj(x) = 0, j = 1, , p có thể viết gọn lại thành h(x) = 0với h(x) = (h1(x), , hp(x))T : Rn → Rp Ràng buộc đẳng thức h(x) = 0 xácđịnh một tập trong Rp, được xem như một mặt cong (hypersurface) Ký hiệu
S = {x ∈ Rn : hj(x) = 0, j = 1, , p}
Ta giả thiết hj(x) khả vi và tập S = {x ∈ Rn : hj(x) = 0, j = 1, , p}được gọi là đa tạp khả vi (differentiable manifold) hay đa tạp trơn (smoothmanifold) Tại mỗi điểm trên đa tạp khả vi có tập tiếp xúc (tangent set) tạiđiểm đó Để hình thức hóa khái niệm này, ta bắt đầu từ định nghĩa đườngcong (curve) trên đa tạp Đường cong ξ trên đa tạp S là một ánh xạ liên tục
ξ : I ∈ R → S, tức là tập hợp các điểm ξ(t) ∈ S phụ thuộc liên tục vào tham
số t trong khoảng I của R Đường cong gọi là đi qua điểm x nếu x = ξ(t) với
14
Trang 20t nào đó thuộc I Đạo hàm của đường cong tại t được định nghĩa bằng giá trịsau (nếu tồn tại):
˙ξ(t) = lim
θ→0
ξ(t + θ) − ξ(t)
Đường cong gọi là khả vi hay trơn nếu đạo hàm tồn tại tại mọi t ∈ I
Định nghĩa 2.1 Cho S là một đa tạp khả vi trong Rn và giả sử x ∈ S Xét
họ tất cả các đường cong khả vi liên tục trên S đi qua x Khi đó, tập tất cảcác véctơ tiếp xúc với các đường cong này tại x được gọi là tập tiếp xúc của Stại x, ký hiệu là T (x)
Nếu các ràng buộc là chính quy (regular) theo định nghĩa dưới đây thì S
có thứ nguyên (địa phương) bằng (n − p) và T (x) tạo nên một không gian conthứ nguyên (n − p) gọi là không gian tiếp xúc (tangent space) của S tại x
Định nghĩa 2.2 Giả sử hj : Rn → R, j = 1, , p, là các hàm khả vi trên Rnvàtập S = {x ∈ Rn : hj(x) = 0, j = 1, , p} Điểm x ∈ S gọi là điểm chính quy(regular point) nếu các véctơ gradient ∇hj(x), j = 1, , p độc lập tuyến tính,tức là rank{∇h1(x), , ∇hp(x)} = p Ký hiệu ∇h(x) = (∇h1(x), , ∇hp(x))
Bổ đề 2.1 Giả sử hj : Rn → R, j = 1, , p, là các hàm khả vi trên Rn và tập
S = {x ∈ Rn : hj(x) = 0, j = 1, , p} Tại điểm chính quy x ∈ S, không giantiếp xúc bằng
T (x) = {d ∈ Rn : ∇h(x)Td = 0}
Ý tưởng phương pháp Lagrange giải bài toán
min{f (x) : hj(x) = 0, j = 1, , p},
là tìm điểm cực tiểu của f (x) trên đa tạp S = {x ∈ Rn : hj(x) = 0, ∀j =
1, , p} Ta sẽ khảo sát giá trị của hàm mục tiêu f dọc theo các đường cong
đi qua điểm tối ưu trên đa tạp S để rút ra điều kiện tối ưu, tức là các điềukiện buộc điểm tối ưu địa phương (do đó cả tối ưu toàn cục) phải thỏa mãn
Trang 21Định lý sau cho thấy không gian tiếp xúc R(x) tại điểm cực tiểu (địa phương)chính quy x trực giao với gradient của hàm mục tiêu f (x) tại x Sự kiện quantrọng này được minh họa ở Hình 2.1 cho trường hợp chỉ có một ràng buộc đẳngthức.
Định lý 2.1 (Điều kiện cần dạng hình học cho cực tiểu địa phương) Cho
f : Rn → R và hj : Rn → R, j = 1, , p là các hàm khả vi liên tục trên Rn.Giả sử x∗ là điểm cực tiểu địa phương của bài toán min{f (x) : h(x) = 0} Khi
đó, ∇f (x∗) trực giao với không gian tiếp xúc T (x∗) của S tại x∗, tức là
T0(x∗) ∩ T (x∗) = ∅ với T0(x∗) = {d ∈ Rn : ∇f (x∗)Td < 0}
Hình 2.1: Điều kiện cần tối ưu với ràng buộc đẳng thức
Chứng minh Giả thiết phản chứng, có d ∈ T (x∗) sao cho ∇f (x∗)Td 6= 0 Giả
sử ξ : I = [−a, a] → S, a > 0 là đường cong trơn bất kỳ đi qua x∗ với ξ(0) = x∗
và ξ(0) = d Giả sử ϕ là hàm xác định theo công thức ϕ(t) = f (ξ(t)), ∀t ∈ I
Do x∗ là cực tiểu địa phương của f trên S = {x ∈ Rn : h(x) = 0} nên theođịnh nghĩa cực tiểu địa phương, ta có
Trang 22Tiếp theo, ta sử dụng đặc trưng hình học vừa nêu để rút ra điều kiện cầntối ưu cấp 1 cho điểm cực tiểu địa phương của bài toán quy hoạch phi tuyếnNLP ràng buộc đẳng thức.
Định lý 2.2 (Điều kiện cần cấp 1) Cho f : Rn → R và hj : Rn → R, j =
1, , p là các hàm khả vi liên tục trên Rn Xét bài toán min{f (x) : h(x) = 0}.Nếu x∗ là cực tiểu địa phương và x∗ là điểm chính quy thì tồn tại duy nhấtvéctơ λ∗ ∈ Rp sao cho
C1 = {(z1, z2) ∈ R × Rp : z1 = ∇f (x∗)Td, z2 = ∇h(x∗)Td},
C2 = {(z1, z2) ∈ R × Rp : z1 < 0, z2 = 0}
Rõ ràng C1, C2 là các tập lồi và C1 ∩ C2 = ∅ Theo định lý tách (Mệnh đề1.1), tồn tại véctơ không âm (µ, λ) ∈ R × Rp sao cho
µ∇f (x∗)Td + λT[∇h(x∗)Td] ≥ µz1+ λTz2, ∀d ∈ Rn và ∀(z1, z2) ∈ C2.Cho z2 = 0 và do z1 có thể là số âm nhỏ tùy ý nên suy ra µ ≥ 0 Cũngvậy, cho (z1, z2) = 0 ta có [µ∇f (x∗) + ∇h(x∗)λ]Td ≥ 0, ∀d ∈ Rn Nói riêng, với
d = −[µ∇f (x∗) + ∇h(x∗)λ] suy ra −[µ∇f (x∗) + ∇h(x∗)λ]2 ≥ 0 và vì thế
µ∇f (x∗) + ∇h(x∗)λ = 0 với (µ, λ) 6= 0
Cuối cùng, phải có µ > 0 vì nếu µ = 0 thì đẳng thức trên sẽ mâu thuẫn vớigiả thiết ∇hj(x∗), j = 1, , p, độc lập tuyến tính Bằng cách đặt λ∗ = λ/µ và
để ý rằng giả thiết độc lập tuyến tính còn kéo theo tính duy nhất của các nhân
tử Lagrange, ta suy ra kết luận của định lý
Trang 23
Nhận xét 2.1 Điều kiện cần tối ưu cấp 1
∇f (x∗) + ∇h(x∗)λ∗ = 0kết hợp với ràng buộc
h(x∗) = 0tạo ra hệ (n + p) phương trình (nói chung, phi tuyến) theo (n + p) ẩn số(x∗, λ∗) Các điều kiện này là đầy đủ theo nghĩa chúng xác định, ít nhất tại địaphương, một nghiệm duy nhất Tuy nhiên, cũng như trong trường hợp khôngràng buộc, một điểm thỏa mãn điều kiện cần cấp 1 không nhất thiết là cựctiểu (địa phương) của bài toán ban đầu mà nó có thể là một điểm cực đại (địaphương) hay một điểm yên ngựa Ví dụ 2.1 nêu dưới đây sẽ minh họa cho điềunhận xét này
Nhận xét 2.2 Cần chú ý là để cho điểm cực tiểu địa phương thỏa mãn điềukiện cần cấp 1 nêu trên và hơn nữa, để cho véctơ nhân tử Lagrange tồn tại vàduy nhất thì các ràng buộc đẳng thức phải thỏa mãn điều kiện chính quy Nóicách khác, điều kiện cần cấp 1 có thể không đúng tại những điểm cực tiểu địaphương không chính quy, như được chỉ ra ở Ví dụ 2.2 dưới đây
Nhận xét 2.3 Để thuận tiện, ta xét hàm Lagrange L : Rn× Rp
→ R tươngứng với bài toán ràng buộc đẳng thức (liên kết hàm mục tiêu với hàm ràngbuộc)
Trang 24Ví dụ 2.1 (Trường hợp chính quy) Xét bài toán
min{f (x) = x1+ x2 : h(x) = x21+ x22− 2 = 0}
Trước hết ta nhận thấy rằng mỗi điểm chấp nhận được đều là điểm chínhquy Vì thế theo Định lý 2.2, mỗi điểm cực tiểu địa phương là một điểm dừngcủa hàm Lagrange L(x, λ) = x1+ x2+ λ(x21+ x22− 2)
là x∗ là điểm cực tiểu toàn cục duy nhất của bài toán Tuy nhiên, tại điểm này
ta có
∇f (x∗) = −1
0
!, ∇h1(x∗) = 0
1
!, ∇h2(x∗) = 0
−1
!
Do đó điều kiện cấp 1
λ1
01
!+ λ2
Trang 25Định lý sau nêu điều kiện cần cấp 2 cho điểm cực tiểu địa phương của bàitoán quy hoạch phi tuyến (bài toán NLP) ràng buộc đẳng thức.
Định lý 2.3 (Điều kiện cần cấp 2) Cho f : Rn → R và hj : Rn → R, j =
1, , p là các hàm hai lần khả vi liên tục trên Rn Xét bài toán min{f (x) :h(x) = 0} Nếu x∗ là cực tiểu địa phương và x∗ là điểm chính quy thì tồn tạiduy nhất véctơ λ∗ ∈ Rp sao cho
Chứng minh Để ý là ∇f (x∗) + ∇h(x∗)λ∗ = 0 suy ra từ Định lý 2.2 Giả sử
d là một hướng bất kỳ trong T (x∗), tức là ∇h(x∗)Td = 0 do x∗ là điểm chínhquy (xem Bổ đề 2.1) Xét đường cong hai lần khả vi bất kỳ ξ : I = [−a, a] →
S, a > 0, đi qua x∗ với ξ(0) = x∗ và ˙ξ(0) = d Giả sử ϕ là hàm xác định theocông thức ϕ(t) = f (ξ(t)), ∀t ∈ I Do x∗ là cực tiểu địa phương của f trên
S = {x ∈ Rn : h(x) = 0} nên t∗ = 0 là điểm cực tiểu (địa phương) không ràngbuộc của ϕ Từ điều kiện cần tối ưu không ràng buộc cấp 2 suy ra
0 ≤ ∇2ϕ(0) = ˙ξ(0)T∇2f (x∗) ˙ξ(0) + ∇f (x∗)Tξ(0).˙Hơn nữa, lấy vi phân hai lần hệ thức h(ξ(t))Tλ = 0 ta nhận được
˙ξ(0)T
p
X
j=1
λ∗j∇2hj(x∗)ξ(0) + (∇h(x˙ ∗)λ)Tξ(0) = 0.˙Cộng hai phương trình cuối với nhau ta nhận được