Định lý Kuhn-Tucker

Xét bài toán quy hoạch phi tuyến

minf(x) v.đ.k x∈D, (*) trong đó D⊂Rn là tập nghiệm của hệ

       gi(x)60, i= 1, .., m, hj(x) = 0, j = 1, ..., k, với f, gi, i= 1, .., m và hj, j = 1, ..., k là các hàm số khả vi bất kì xác định trên Rn, có thể không lồi. Như thường lệ, mỗi hệ thức gio, io ∈ {1, ..., m} hoặc hjo, jo ∈ {1, ..., k}, được gọi là một ràng buộc.

Định nghĩa 1.20. Cho x0 là một điểm chấp nhận được. Giả sử các hàm gj(x) 6

0,(j = 1, m); hi(x) = 0,(i= 1, k) là các hàm khả vi xác định trong tập mở chứa D, với D là một tập lồi. Ký hiệu S x0 là tập các vector d thỏa mãn hệ tuyến tính:

h∇hj x0, di= 0, j = 1, k;

h∇gi x0, di60, i∈A x0. Trong đó Ai x0 là tập chỉ số i có gi x0= 0. Cho x0

∈D. Ta nói rằng: điều kiện chính quy được thỏa mãn tại x0 nếu D x0=S x0.

Bổ đề 1.1. ∀x0 ∈D có D x0⊂S x0.

Định lý 1.16. Điều kiện chính quy được thỏa mãn tại x0 nếu có một trong các điều kiện sau:

i. Các hàm hj, j = 1, .., k và gi = 1, ..., m đều là các hàm affine;

ii. Các hàm hj, j = 1, .., k là affine; các hàm gi= 1, ..., m là lồi và điều kiện Slater sau đây thỏa mãn

∃x∈Rn :gi(x)<0, i= 1, ...m, và hj(x) = 0, j = 1, ..., k;

iii. Các vector ∇gi x0, i∈Ai x0 và ∇hj x0, j = 1, ..., k là độc lập tuyến tính. Điều kiện thứ nhất hoặc thứ hai của Định lý 1.13 đảm bảo điều kiện chính quy được thỏa mãn tại mọi điểm chấp nhận được của bài toán đang xét mà không cần chỉ rõ điểm x0 còn điều kiện thứ ba đòi hỏi phải biết điểm x0.

Định lý 1.17. (Định lý Karush- Kuhn- TucKer)

Cho x∗ là cực tiểu địa phương của bài toán (*) và điều kiện chính quy được thỏa mãn tại x∗. Khi đó điều kiện KKT sau đúng:

i. gi(x∗

)60, i= 1, ..., m và hj(x∗

) = 0, j = 1, ..., k;

ii. Tồn tại các số λi60, i= 1, ..., m và các số µj, j = 1, ..., k sao cho

∇f(x∗ ) + m X i=1 λi∇gi(x∗ ) + k X j=1 µj∇hj(x∗ ) = 0 iii. λigi(x∗ ) = 0,∀i= 1, ..., m. Xét bài toán quy hoạch lồi

min f(x) v.đ.k. x∈D, trong đó

D={x|gi(x)60, i= 1, ..., m},

với f vàgi, i= 1,2, ..., m, là các hàm lồi, khả vi liên tục trên một tập mở chứa D. Trong bài toán quy hoạch lồi, nếu xuất hiện ràng buộc hj(x) = 0 thì hj(x)phải là hàm affine. Hơn nữa, vì

hj(x) = 0⇒hj(x)60, −hj(x)60, nên ta chỉ cần xét ràng buộc dạng bất đẳng thức.

Định lý 1.18. (Định lí Karush- Kuhn- TucKer cho quy hoạch lồi). Giả sử các hàm

f, gi, i = 1, ..., m là các hàm lồi khả vi trên một tập mở chứa D và điều kiện Slater được thỏa mãn. Khi đó x∗

∈Rn là nghiệm cực tiểu của bài toán trên khi và chỉ khi x∗

thỏa mãn điều kiện KKT: i. gi(x∗

ii Tồn tại các số λi>0, i= 1, ..., m, λ= (λ1.λ2, ..., λi, ..., λm)6= 0 sao cho: ∇f(x∗ ) + m P i=1 λi∇gi(x∗ ) = 0 và iii. λigi(x∗ ) = 0,∀i= 1, ..., m.

CHƯƠNG2

ÁP DỤNG PHƯƠNG PHÁP TỐI ƯU GIẢI CÁC BÀI TOÁN CỰC TRỊ HÌNH HỌC PHỔ THÔNG

Chương này trình bày các bài toán toán cực trị trong hình học phẳng và hình học không gian, một số yếu tố như khoảng cách, góc, diện tích, thể tích, và sử dụng các phương pháp tối ưu đã nêu ở chương 1 để giải.

2.1. Áp dụng trong hình học phẳng 2.1.1. Một số bài toán cực trị về khoảng cách

Bài toán 2.1. (Bài toán Steiner). Tìm trong mặt phẳng một điểm sao cho tổng khoảng cách từ điểm đó tới ba điểm khác nhau đã cho là nhỏ nhất?

Lời giải:

Gọi 3 điểm đã cho có dạng: x1 = (x11, x21), x2 = (x21, x22), x3 = (x1, x3 32),∈ R2 và cho điểm tối ưu cần tìm là x = (x1, x2) ∈ R2. Khi đó tổng khoảng cách từ điểm cần tìm tới 3 điểm đã cho là:

kx−x1k+kx−x2k+kx−x3k. Lúc này ta sẽ giải tích hóa lại bài toán dưới dạng như sau:

minf(x) =kx−x1k+kx−x2k+kx−x3k.

Có thể thấy bài toán trên là bài toán tối ưu lồi không có ràng buộc, hàm mục tiêu f(x) là hàm liên tục và bức trên R2 nên bài toán tồn tại nghiệm cực tiểu x= (x1, x2)

Điều kiện tối ưu ở đây: 0∈∂f(x).

Ta chia bài toán trên thành hai trường hợp như sau:

1. Điểm cần tìm x không trùng với ba điểm đã cho: x6=xi, i= 1,2,3. 2. Điểm cần tìm x trùng với một trong ba điểm đã cho: x∈ {x1, x2, x3}. Với trường hợp 1, từ điều kiện tối ưu ta có:

∂f(x) = x−x1 kx−x1 k+ x−x2 kx−x2 k + x−x3 kx−x3 k = 0,

để cho đẳng thức trên đúng thì ta chọn 3 vector đơn vị từ điểm x tới x1, x2, x3 phải có tổng bằng vector 0. Suy ra từ điểm x ta sẽ nhìn các đoạn thẳng

x1, x2,

x2, x3,

x1, x3 đều dưới một góc 120o. Nếu góc lớn nhất của tam giác có ba đỉnh là x1, x2, x3 không quá 120o thì có thể dựng được điểm x bằng phương pháp hình học như sau: 1. Cho tam giác ABC dựng các tam giác đều ABO, BCN, ACM bên ngoài tam giác

ABC.

2 Dựng các đường tròn ngoại tiếp các tam giác đềuABO,BCN,ACM. Ba đường tròn này cắt nhau tại một điểm, ký kiệu là T. Điểm T chính là điểm có tổng khoảng cách đến ba điểm A, B, C ngắn nhất và điểm này được gọi là điểm Torricelli. Với trường hợp 2, giả sử x=x1, từ điều kiện tối ưu ta có:

∂f(x) = p+ x−x2 kx−x2 k + x−x3 kx−x3 k = 0,

trong đóp∈∂|x| tại điểm x= 0, tức là |p|<1. Lúc tày, tổng của hai vector đơn vị từ x1 tới x2 và từ x1 tới x3 với vector thứ ba có chuẩn nhỏ 1 hơn bằng vector 0. Từ đó suy ra được x\2x1x3 6120o.

Vậy nếu các góc của tam giác tạo bởi ba điểm x1, x2 và x3 đều nhỏ hơn 120o

Hình 2.1

hơn hoặc bằng120o thì nghiệm tối ưu là một trong ba đỉnh của tam giác.

Bài toán 2.2. (Bài toán Steiner mở rộng). Tìm trong mặt phẳng một điểm sao cho tổng khoảng cách theo các trọng số dương từ điểm đó tới ba điểm khác nhau đã cho là nhỏ nhất?

Lời giải:

Ta cũng gọi các yếu tố trong bài toán này giống như bài toán trên:

x1 = (x11, x12), x2 = (x21, x22), x3 = (x1, x3 32),∈ R2 và cho điểm tối ưu cần tìm là x= (x1, x2)∈R, trọng số của xi là mi >0, i= 1,3, bài toán được giải tích hóa lại như sau:

minf(x) = m1kx−x1k+m2kx−x2k+m3kx−x3k.

x cũng thuộc một trong các điểm dừng 0∈∂f(x).

Giả sử tồn tại tam giác có độ dài ba cạnh là m1, m2 vàm3, góc αij là góc của tam giác đó tạo bởi hai cạnh mi và mj i, j ∈ {1,2,3}. Vẽ các cung tròn gồm các điểm nhìn đoạn thẳng

xi, xj một góc π−αij tương ứng.

Nếu các cung tròn này cắt nhau tại một điểm bên trong tam giác thì giao điểm đó chính là nghiệm tối ưu cần tìm.

Còn nếu các cung tròn cắt nhau ở phía ngoài tam giác hoặc không tồn tại tam giác với độ dài các cạnh m1, m2 và m3 thì ngiệm tối ưu của bài toán trùng với một đỉnh của tam giác, x∈ {x1

, x2 , x3

Bài toán 2.3. Cho hai điểm ngoài hình tròn đơn vị (tâm ở gốc tọa độ và bán kính bằng 1). Tìm một điểm thuộc hình tròn đó sao cho tổng khoảng cách đến hai điểm ấy là nhỏ nhất.

Ta có thể đưa bài toán trên về dạng giải tích như sau:

minf0(x) = kx−yk+kx−zk, f1(x) = kxk −1<0,

trong đó |y|>1, |z |>1 là hai điểm cho trước. Đây là bài toán cực tiểu của hàm liên tục trên tập compact với ràng buộc bất đẳng thức nên luôn tồn tại nghiệm.

Vì điều kiện Slater thỏa mãn (f1(0) <−1 <0) nên ta sử định lí Kuhn-Tucker với λ0= 1. Lúc đó tồn tại λ1>0 sao cho

0∈δkx∗ −yk+δkx∗ −zk+λ1kx∗ k λ1(kx∗ k −1) = 0.

Hình 2.2 0 hướng tới điểm ấy. Vì vậy, khi kx∗

k= 1 ta có: x∗ −y kx∗ −yk+ x∗ −z kx∗ −zk +λ1x ∗ = 0. Điều này có nghĩa là góc giữa hai đoạn [0, x∗

] và [y, x∗

] bằng góc giữa hai đoạn

[0, x∗

] và [z, x∗

]. Như vậy ta được ba phương trình với ba ẩn số, do đó có thể giải đề tìmx∗.

Trong trường hợp kx∗

k<1, điều kiện bù kéo theo λ1 = 0, khi đó x∗ −y |x∗−y| + x∗ −z |x∗−z| = 0,

nghĩa làx∗ nằm trên đoạn[y, z]. Điều đó chỉ xảy ra khi đoạn[y, z] cắt đường tròn đơn vị đã cho. Lúc đó giao giữa [y, z] và hình tròn đơn vị là tập nghiệm tối ưu.

Bài toán 2.4. Trong không gian Rn, cho một điểm nằm ngoài một siêu phẳng cho trước, tìm trên siêu phẳng đó một điểm sao khoảng cách từ điểm đó tới điểm đã cho là ngắn nhất.

Lời giải:

siêu phẳng cho trước trong không gian Rn. Giả sử điểm x∗ = (x∗ 1, x∗ 2, ..., x∗ n)∈Rn và một siêu phẳng có dạng :a1x1+a2x2+...+

anxn =α, với {a1, a2, ..., an} là độc lập tuyến tính và α là một số cho trước. Ta giải tích hóa lại bài toán như sau:

minf(x) = (x1−x∗

1)2+...+ (xn−x∗ n)2

với ràng buộc

H ={a1x1+a2x2+...+anxn =α}

vì H là siêu phẳng trong Rn nên H là một tập lồi đóng, cùng với f(x) =kx−x∗ k2 là một hàm lồi chặt nên nghiệm cực tiểu (nếu có) là duy nhất, ta thiết lập hàm Lagrange:

L= (x1−x∗

1)2+...+ (xn−x∗

n)2+λ(a1x1+a2x2+...+anxn−α). Ta có điều kiện tối ưu của bài toán như sau:

(1) Pn j=1

(xj−x∗

j) +λaj.

(2) aTx=a1x1+a2x2+...+anxn =α.

Tiếp theo ta sẽ đi tìm điểm dừng của bài toán dựa vào hai điều kiện tối ưu trên. Ta nhân hai vế của (1) với ai rồi cộng lại theo mọi i, kết hợp với điều kiện (2) ta được: 2aT (x−x∗ ) +λ a21+a22+...+a2n= 0 ⇒2 α−aTx∗ ) +λkak2 = 0⇒λ= −2 α−aTx∗ kak2 ⇒xi =x∗ i − λ 2ai= x∗ i + α−aTx∗ai kak2 .

Ta tìm được một điểm dừng duy nhất đó là x= (x1;x2;...;xn), với mỗi xi=x∗

i −λ2ai=x∗

i + α−aTx∗ai

kak2 , i= 1, n và λ= −2 α−aTx∗ kak2 .

Ta tìm được fmin = α−aTx∗2

kak2 . Vậy khoảng cách từ một điểm x∗ tới siêu phẳng H đã cho là: d(x∗ , H) = α−aTx∗ kak .

Với n = 2 hoặc n = 3 ta sẽ nhận được các công thức tính khoảng cách rất quen thuộc trong chương trình hình học phổ thông.

Chẳng hạn, với n= 2, x∗

= (1,2)T, a= (6; 8)T, α= 32, ta được aTx∗

= 22, kak= 10. Suy ra α−aTx0 = 10, d = 1. Điểm trên đường thẳng gần x∗ nhất là x = (8

5; 14

5 ), hay nói cách khác hình chiếu của điểm x∗

(1; 2) xuống đường thẳng 6x1+ 8x2= 32 là điểm x= (8

5; 14

5 ).

Qua bài toán này ta có thể áp dụng công thức trên để tìm tọa độ hình chiếu của một điểm xuống một đường thẳng hoặc mặt phẳng trong chương trình hình học phổ thông.

2.1.2. Một số bài toán cực trị về chu vi và diện tích

Bài toán 2.5. Cho hình vuông ABCD có cạnh là a. Trên cạnh CD, DA, AB, BC lấy lần lượt các điểm E, F, G, H sao cho AF =BG =CH =DE. Tính độ dài đoạn DE sao cho tứ giác EF GH có chu vi nhỏ nhất.

Lời giải:

Ta thấy HE = EF = F G = GH nên tứ giác EF GH là hình vuông, từ đó chu vi EF GH nhỏ nhất khi một trong bốn cạnh là nhỏ nhất. Ở đây ta chọn cạnh EF.

Đặt DE =x thì DF =a−x, áp dụng định lí Pythagoras ta tính được: EF2=DE2+DF2 = 2x2+ 8x+ 16.

Hình 2.3

min P(x) = 2x2−2ax+a2, với ràng buộc bất đẳng thức 0< x < a

Gọi x là nghiệm tối ưu cần tìm, ta có x 6= 0, x 6= a và hàm P(x) > 0,∀x ∈ (0;a). Ta thấy hàm S là liên tục và miền tìm nghiệm là một tập compact nên x tồn tại.

Theo điều kiện của hàm liên tục, khả vi và xác định dương nên theo điều kiện tối ưu:

P′

(x) = 0⇒4x−2a= 0⇒x= a 2.

Vậy AE = a

2 hay điểm E chính là trung điểm của đoạn CD.

Bài toán 2.6. (Bài toán Fermat). Tìm tam giác vuông có diện tích lớn nhất, biết tổng độ dài hai cạnh góc vuông bằng số a > 0 cho trước. Fermat đã dùng bài toán này để minh họa phương pháp tìm cực tiểu - Định lý Fermat năm 1638.

Giải: Nếu gọi độ dài một cạnh góc vuông là x thì cạnh còn lại sẽ có độ dài là a−x (0 < x < a). Khi đó diện tích của tam giác sẽ là một hàm phụ thuộc theo x S(x) = 1

2(a−x)x, và bài toán cực trị đặt ra có dạng:

max S(x) = 1

Hình 2.4: Bài toán 2.1.8

Giả sử x là nghiệm tối ưu cần tìm, hiển nhiên x6= 0 , x6=a và hàm S(x)>0,∀x∈

(0;a).

Ta thấy hàm S là liên tục và miền tìm nghiệm là một tập compact nênx tồn tại. Theo điều kiện của hàm liên tục, khả vi và xác định dương nên theo điều kiện tối ưu S′

(x) = 0⇒ 1

2a−x= 0⇒x= a 2.

Ở đây bài toán chỉ có một điểm dừng là x = a

2 và bài toán luôn có nghiệm nên nghiệm cực đại của nó sẽ là x= a

Vậy tam giác cần tìm thỏa mãn đề bài chính là tam giác vuông cân có độ dài cạnh góc vuông là a

Bài toán 2.7. Trong các tam giác nội tiếp trong một đường tròn cho trước, hãy tìm tam giác có diện tích lớn nhất.

Lời giải: Không mất tính tổng quát ta xét tam giác ABC nội tiếp trong một đường tròn đơn vị cho trước, chọn điểm A cố định thuộc đường tròn đơn vị có tọa độ

(0,1), điểm B(x1, y1), C(x2, y2), trong đó x21+y21 = 1, x22+y22= 1.

−→

AB = (x1−1, y1), AC−→= (x2−1, y2) Ta tính được diện tích của tam giác ABC theo công thức

[ABC] = 1

2|(x1−1)y2−y1(x2−1)|, công thức trên có thể coi là một hàm với bốn ẩn

S(x1, x2, y1, y2) = 1

2|(x1−1)y2−y1(x2−1)|. Ta giải tích hóa lại bài toán trên dưới dạng như sau:

max S(x1, x2, y1, y2)

với ràng buộc x21+y22= 1, x22+y22= 1.

Bài toán cực trị trên có bốn biến, để dễ dàng trong việc giải nó ta có thể đưa về hai

Ví dụ cho thuật toán

Bài toán cắt vật liệu tiết kiệm nhất