Dạng rút gọn của bài toán (3.1)

3 Giải bài toán tối ưu trên tập Pareto bằng phương pháp

3.2 Dạng rút gọn của bài toán (3.1)

Như đã biết, chi phí tính toán (như thời gian, bộ nhớ) để thuật toán giải bài toán tối ưu đa cực trị hội tụ sẽ tăng rất nhanh khi số các biến không lồi tăng. Do đó, vấn đề đặt ra là làm thế nào để giảm số biến không lồi. Giả sửrankC = k. Bằng cách dùng các biến đổi tuyến tính, λTCx có thể biến đổi thành dạng Pk

biến đổi tuyến tính nên bài toán (3.2) trở thành max{f1(x)−N g1(λ) +N k X j=1 ξjλjxj : (λ, x) ∈ Λ1 ×X1}, (3.3)

trong đó Λ1 và X1 là các đa diện, g1 là hàm lồi, f1 là hàm lồi hoặc lõm. Trong bài toán (3.3), số hạng song tuyến tính Pk

j=1ξjλjxj chỉ phụ thuộc vào xj và λj (j = 1,· · · , k).

Nhắc lại rằng, nón lùi xa (recession cone) của tập lồi K, ký hiệu là

Rec(K), được xác định như sau:

Rec(K) := {y ∈ Rn|x+ty ∈ K,∀x ∈ K và t≥ 0}.

Không gian con lớn nhất nằm trongRec(K)được gọi là không gian tuyến tính (lineality space) của K. Không gian con này bao gồm véc tơ không và tất cả các véc tơ y khác không thỏa mãn với mỗi x ∈ K, đường thẳng qua x theo hướng y đều nằm trong K.

Số chiều của không gian tuyến tính của K được gọi là số chiều tuyến tính (lineality) của K.

Định lý 3.1 [14] Nếu F là một hàm lồi chính thường đóng thì tất cả các tập mức dưới khác rỗng có dạng {x : F(x) ≤ α}, α ∈ R, đều có cùng không gian tuyến tính. Không gian tuyến tính này thường được gọi là không gian bất biến (constancy space) của F.

Gọi C0 là nón lồi đa diện có đỉnh tại gốc O được xác định bởi

Bổ đề 3.3 i. G(X) =C0 + X;

ii. C0 ⊂Rec(G(X));

iii. Không gian bất biến của hàm −r là ker(C) := {y : Cy = 0}.

Chứng minh.

i. Lấy a ∈ G(X). Theo định nghĩa củaG(X), tồn tạib ∈ X thỏa mãn C(a−b) ≤0. Khi đó, z := a−b ∈ C0. Do đó, a ∈ C0 +X. Ngược lại, nếu a := d+b với d ∈ C0, b ∈ X thì C(d+b) = Cd+Cb ≤Cb, tức là d+b ∈ G(X).

ii. Lấy tùy ý điểm x ∈ G(X). Theo định nghĩa của G(X), tồn tại z ∈ X thỏa mãn Cx ≤ Cz. Như vậy, với bất kỳ số t > 0 và bất kỳ véc tơ y thỏa mãn Cy ≤ 0, ta có

Cx+tCy ≤ Cx≤ Cz,

tức là x+ty ∈ G(X). Do đó, C0 ⊂ Rec(G(X)).

iii. Rõ ràng rằng hàm−r là hàm lồi chính thường đóng và dom(−r) =

G(X). Do G(X) = {x : −r(x) ≤ 0} nên theo Định lý 3.1, không gian bất biến của −r là không gian tuyến tính của G(X), tức là bằng −Rec(G(X))∩Rec(G(X)). Từ [i.], ta cóker(C) ⊂Rec(G(X)). Ta cần chứng minh ker(C) ⊂ −Rec(G(X)). Thật vậy, lấy x ∈ G(X). Theo định nghĩa của G(X), tồn tại z ∈ X thỏa mãn

Cz ≥ Cx. Khi đó, với mỗi t ≥0, y ∈ ker(C), ta có

C(x−ty) =Cx−tCy = Cx≤ Cz,

tức là x−ty ∈ G(X). Điều này đúng với mọi t≥ 0 và y ∈ ker(C).

Từ Bổ đề 3.3, ta thấy r là hằng số trên không gian con

ker(C) := {x : Cx = 0}. Như vậy, nếu với x ∈ ker(C) và x ∈ X, ta có

r(x) := max{eTC(x−x) : Cx≥ Cx, x ∈ X} = 0,

thì mỗi điểm x ∈ X ∩Ker(C) đều thỏa mãn x ∈ XE. Ngược lại, ker(C)

không chứa các điểm hữu hiệu. Do rankC = k nên ta có dim(ker(C)) =

n−k.

Không mất tính tổng quát, giả thiết rằng k hàng đầu tiên c1,· · · , ck của ma trận C là độc lập tuyến tính và rankC = k . Ký hiệu L là không gian tuyến tính được sinh bởi c1,· · · , ck

L := span{c1,· · · , ck}. Khi đó

Rn = L⊕ker(C).

Vậy mỗi x ∈ Rn có thể được viết duy nhất dưới dạng x = x1+x2, trong đó x1 ∈ L, x2 ∈ ker(C).

Bổ đề 3.4 Cho x = x1 +x2, trong đó x1 ∈ L, x2 ∈ ker(C). Khi đó

r(x) = max{eTC(x−x1) : Cx ≥ Cx1} := r(x1).

Chứng minh. Đặt

X(x) := {x ∈ X : Cx ≥Cx},

Vì x = x1 +x2 và Cx2 = 0, nên X(x) = X(x1) và

eTC(x−x) =eTC(x−x1).

Như vậy, theo định nghĩa của r(x) và r(x1), ta có r(x) = r(x1).

Cho c1,· · · , ck, bk+1,· · · , bn là một cơ sở của Rn, trong đó bk+1,· · · , bn là một cơ sở của ker(C). Do các phép biến đổi tuyến tính bảo toàn tính lồi nên có thể giả thiết rằng toàn bộ dữ liệu đều được cho trong cơ sở này. Đặt x = x1 +x2, trong đó x1 ∈ L, x2 ∈ ker(C). Khi đó, x1 và x2 được viết duy nhất dưới dạng

x1 = k X i=1 uici, x2 = n X i=k+1 uibi.

Như vậy, ta có thể đồng nhất x với véc tơ (u, v), trong đó u:= (u1,· · · , uk), và v := (vk+1,· · · , vn). Từ đây, giả thiết rằng X là tập lồi đa diện được xác định bởi

X = {x ∈ Rn : Ax+ b ≤0}, (3.4)

trong đó A là ma trận cỡ (m×n), b ∈ Rm. Ký hiệu A1 và A2 tương ứng là các ma trận thu được từ ma trận A bằng cách lấy k cột đầu tiên và

(n−k) cột cuối cùng của ma trận A. Khi đó, X có thể được biểu diễn

X = {(u, v) : A1u+A2v +b ≤0}. Đặt s(u) := r k X j=1 ujcj.

Khi đó, bài toán (3.1) trở thành

Bài toán tối ưu trên tập Pareto