3 Phương pháp giải quy hoạch lồi có ràng buộc
3.2 Phương pháp hàm phạt giải quy hoạch lồi có ràng buộc
3.2.1 Phương pháp hàm phạt điểm trong
Hàm phạt điểm trong thường dùng khi biết trước một điểmx0 ∈ intD. Người ta xây dựng một hàm phạt sao cho nó hữu hạn trong miền intD, nhưng trên biên của D nó sẽ là +∞ (bị “phạt nặng”). Cụ thể, ta giả thiết hàm p thỏa mãn các tính chất sau:
(a) p liên tục trên tập D0 := {x ∈ Rn :gj(x) < 0,∀j = 1, ....., m}. (b) Với mọi dãy xk ⊂ D0 hội tụ đến một điểm x /∈ D0 ta có
limkp(xk) = +∞.
Hai hàm phạt điểm trong được sử dụng nhiều, do Fiacco và McCormick đưa ra là p(x) = − m X j=1 log(−gj(x)) hoặc p(x) =− m X j=1 1 gj(x).
Rõ ràng khi x ∈ D và gj(x) → 0 với một j nào đó thì p(x) → +∞.
Cho s(t) là hàm số một biến, có miền xác định và miền giá trị là các số dương, ngồi ra cịn thỏa mãn tính chất.
(i) s liên tục và s(t) →0 khi t→ +∞.
(ii) s(t) > s(t’) với mọi t0 > t > 0 (đơn điệu giảm). Ví dụ s(t) = 1/t hoặc
s(t) = 1/t2
Xây dựng hàm phạt bằng cách đặt
F(x, t) := f(x) + s(t)p(x) (5.2)
Với mỗi t >0, xét bài tốn phụ khơng điều kiện:
min
x { F(x, t) : x∈ Rn} ≡ min{ F(x, t) : x ∈ D0} (Bt)
Mệnh đề 3.1. Giả sử các điều kiện (a), (b), và (i), (ii) thỏa mãn, và các bài tốn (Bt) có nghiệm với mọi t > 0. Khi đó nếu 0 < t1 < t2 và xi là nghiệm của (Bt) ( i=1.2) thì
(1) p(x1) 6 p(x2).
(2) f(x1) > f(x2).
Chứng minh. Gọi lời giải của (Bti) là xi. Để đơn giản ký hiệu, đặt s(ti) = si, p(xi) =pi, f(xi) =fi (i = 1,2). Khi đó
f1 +s1p1 6 f2 +s1p2 (5.3)
f2 +s2p2 6 f1 +s2p1. (5.4)
Cộng hai bất đẳng thức và ước lược, ta có
s1p1 +s2p2 6 s1p2 +s2p1. Chuyển vế và nhóm lại, ta được
(s1 −s2)(p1 −p2) 6 0.
Định lý 3.7. Nếu dãy {tk} đơn điệu tăng dần đến +∞ và xk là nghiệm của (Btk) thì dãy số f(xk) hội tụ giảm đến f∗ (trị tối ưu). Ngoài ra mọi điểm tụ của dãy xk đều là nghiệm của (5.1).
Chứng minh. Theo mệnh đề (5.1) dãy f(xk) đơn điệu giảm. Do đó dãy này hội tụ.
Trước hết giả sử rằng bài tốn có một lời giảix∗ ∈ D0. Doxk là nghiệm của bài toán (Btk) nên
f(xk) +s(tk)p(xk) 6 f(x∗) + s(tk)p(x∗). (5.5)
Do D compact, ta có thể giả sử rằng, nếu cần qua dãy con, dãy xk hội tụ đến u∗ nào đó.
Nếu u∗ ∈ D0 thì qua giới hạn, chú ý rằng s(tk) → 0 và p(x∗), p(u∗)
hữu hạn ta có ngay f(u∗) 6 f(x∗). Vậy u∗ là nghiệm. Do tính đơn điệu suy ra tồn bộ dãy f(xk) hội tụ đến trị tối ưu f∗.
Nếu u∗ ∈/ D0 thì theo (b) tồn tại một chỉ số K1 sao chos(tk)p(xk) > 0
với mọi k > K1. Khi đó theo (5.5) có f(xk) 6 f(x∗) + s(tk)p(x∗) với mọi k > K1. Qua giới hạn có
lim
k f(xk) 6 f(x∗).
Thế nhưng do xk ∈ D nên f(xk) > f(x∗). Vậy limkf(xk) = f(x∗).
Bây giờ xét trường hợp bài tốn khơng có nghiệm thuộc D0. Gọi β = limkf(xk). Giới hạn tồn tại vì dãy này đơn điệu. Ta cóf∗ 6 β, do f(xk) >
f∗ với mọi k. Nếu f∗ < β do tính liên tục của f trên D, tồn tạiu ∈ D0 sao cho f∗ < f(u) < β. Từ bất đẳng thức
f(xk) +s(tk)p(xk) 6 f(u) + s(tk)p(u).
Lập luận như trên, suy ra tồn tại chỉ số K1 sao cho f(xk) 6 f(u)
với mọi k > K1. Mâu thuẫn với việc f(xk) > β > f(u) với mọi k. Vậy
Theo định lý này, để giải bài tốn có rằng buộc (5.1), ta chọn một dãy số dương {tk} tăng dần đến +∞ và giải một dãy các bài tốn khơng điều kiện (Btk).
Chú ý 3.4. Loại hàm phạt điểm trong tuy đã được Fiacco và McCormick đưa từ những năm 1960, nhưng gần đây người ta nhận thấy rằng phương pháp của Karmarkar cho qui hoạch tuyến tính thực chất cũng là một phương pháp điểm trong. Nhận xét này đã đưa đến việc sử dụng loại hàm phạt điểm trong để xây dựng những thuật toán đa thức giải quy hoạch lồi.