tiêu tuyến tính
Trong phần này ta xét M OLP tổng quát
M in Cx (2.17)
với
(
Ax = b x ≥ 0.
Cho λ ∈ Rp>, ta ký hiệu LP(λ) là bài toán tối ưu tuyến tính
min {λT C x : A x = b , x ≥ 0}. (2.18) Ta ký hiệu C = C − CBA−B1A là ma trận thu gọn đối với cơ sở B và R := ¯CN là phần phi cơ sở của ma trận thu gọn. Chú ý rằng C¯B = 0. Các kết quả ở phần này tương tự như các kết quả đã biết về bài toán tuyến tính hoặc mở rộng để giải quyết sự phức tạp của bài toán đa mục tiêu so với bài toán tuyến tính đơn trị.
Bổ đề 2.3.1. Nếu S(X , C x) 6= ∅ thì Xcó nghiệm cơ sở chấp nhận được là nghiệm hữu hiệu.
Chứng minh. Do Định lý 2.1.3, tồn tại λ ∈ Rp> sao cho min
x∈X λT C x có một nghiệm tối ưu. Từ Định lý 2.2.1, LP(λ) : min
x∈X λT C x có một nghiệm cơ sở chấp nhận được là nghiệm tối ưu, cũng chính là nghiệm hữu hiệu của M OLP(2.17) do Định lý 2.1.1.
Định nghĩa 2.3.1. Một cơ sở chấp nhận được B được gọi là cơ sở hữu hiệu nếu B là một cơ sở tối ưu của LP(λ) với λ ∈ Rp>.
Ta nói rằng một trục là trục chấp nhận được nếu nghiệm thu được sau bước trục là chấp nhận được, ngay cả khi phần tử trục A˜rs < 0. Định nghĩa 2.3.2. Hai cơ sở B và Bˆ được gọi là liên kết nếu cái này thu được từ cái kia bởi một bước trục riêng lẻ.
Định nghĩa 2.3.3.
1. Cho B là một cơ sở hữu hiệu. Biến xj, j ∈ N được gọi là biến phi cơ sở hữu hiệu tại cơ sở B nếu tồn tại λ ∈ Rp> sao cho λT R ≥ 0 và λT rj = 0, ở đó rj là cột của R tương ứng với biến xj.
2. Cho B là một cơ sở hữu hiệu và cho xj là một biến phi cơ sở hữu hiệu. Khi đó, một trục chấp nhận được từ B với xj vào cơ sở được gọi là một trục hữu hiệu đối với B và xj. Hệ λT R ≥ 0, λT rj = 0 là dạng tổng quát của các phương trình mà ta sử dụng để tính λ trong bài toán tuyến tính tham số.
Mệnh đề 2.3.1. Cho B là một cơ sở hữu hiệu. Ở đó, tồn tại một biến phi cơ sở hữu hiệu tại cơ sở B.
Chứng minh. Do B là cơ sở hữu hiệu nên ∃λ > 0 sao cho λT R ≥ 0. Do đó, ta có
L := {λ > 0 : λT R ≥ 0} 6= ∅
Ta phải chỉ ra rằng tồn tại λ ∈ L và j ∈ N sao cho λT rj = 0.
Trước tiên, ta nhận thấy rằng không có cột r của R sao cho r 0. Phải có ít nhất một cột với các phần tử dương và âm do giả thiết tổng quát ∩p
k=1Xk = ∅. Cho λ∗ ∈ L. Trong trường hợp riêng, λ∗T ≥ 0. Cho λ0 ∈ Rp> sao cho I := {i ∈ N : λ0Trj < 0} 6= ∅. Do R chứa ít nhất một cột có phần tử âm nên λ0 phải tồn tại.
Ta ký hiệu: φ : R →R|N |, φi(t) : = (t λ∗T + (1 − t)λ0T)rj , i∈ N . Ta có, φ(0) = λ0T R và φ(1) = λ∗T R ≥ 0. Với i ∈ N \ I ta có φi(t) ≥ 0 ∀t ∈ [0,1]. Với mọi i ∈ I, tồn tại ti ∈ [0,1] sao cho
φi(t) < 0 , t ∈ [0, ti) = 0 , t = ti ≥ 0 , t ∈ [ti,1]
với t∗ := max{ti : i ∈ I} ta có φi(t∗) ≥ 0 và φi(t∗) = 0 với mỗi i ∈ I. Do đó
ˆ
λ := t.λ∗ + (1 −t).λ0 ∈ L
Định lý đã được chứng minh.
Bổ đề 2.3.2. Cho B là một cơ sở hữu hiệu và xj là một biến phi cơ sở hữu hiệu. Khi đó, bất kì một bước trục hữu hiệu nào từ cơ sở B đều dẫn đến một cơ sở hữu hiệu liên kết Bˆ.
Chứng minh. Cho xj là biến vào ở cơ sở B. Do xj là một biến phi cơ sở hữu hiệu, ta có λ ∈ Rp> mà λT R ≥ 0 và λT rj = 0. Do đó, xj là một biến phi cơ sở hữu hiệu với giá thu gọn 0 trong LP(λ). Nghĩa là, các vectơ giá thu gọn của LP(λ) không thay đổi sau một bước trục với biến vào xj. Cho Bˆ là cơ sở thu được với bước trục chấp nhận được và biến vào xj. Khi đó, λT R ≥ 0 và λT rj = 0 ở cơ sở Bˆ, nghĩa là, Bˆ là một cơ sở tối ưu của LP(λ) và do đó, Bˆ là một cơ sở hữu hiệu liên kết của
B.
Ta cần kiểm tra một biến phi cơ sở ở một cơ sở hữu hiệu là hữu hiệu. Điều này có thể được làm nhờ việc thực hiện một bước kiểm tra trong giải một LP.
Định lý 2.3.2. <Evans và Steuer (1973)>
Cho B là một cơ sở hữu hiệu và cho xj là một biến phi cơ sở. Biến xj là một biến phi cơ sở hữu hiệu nếu và chỉ nếu LP:
max etv (2.19)
với
(
R z − rjδ + Iv = 0
z, δ, v ≥ 0
Chứng minh. Do định nghĩa 2.3.3, xj là một biến phi cơ sở hữu hiệu nên LP: min 0T λ = 0 (2.20) với RT λ ≥ 0 (rj)T λ = 0 I λ ≥ e λ ≥ 0
có giá trị mục tiêu tối ưu là 0 nếu nó thực hiện được. Hai ràng buộc đầu của (2.20) cùng tương đương với RT λ ≥ 0 ; (rj)T λ ≤ 0 hoặc RT λ ≥ 0 ; (−rj)T λ ≥ 0 mà cho LP min 0T λ = 0 (2.21) với RT λ ≥ 0 −(rj)T λ ≥ 0 I λ ≥ e λ ≥ 0
Đối ngẫu của (2.21) là
max eT v (2.22)
với
(
R z − rjδ + Iv + It = 0
z , δ, v, t ≥ 0
Do nghiệm tối ưu của (2.22) sẽ luôn chứa t tại giá trị 0, điều này tương đương với max eT v với ( R z − rjδ + Iv = 0 z , δ, v ≥ 0 mà là (2.19).
Chú ý rằng (2.19) luôn luôn thực hiện được do(z, δ, v) = 0 có thể được chọn. Chứng minh ở định lý 2.3.2 cũng dẫn đến (2.19) có nghiệm tối ưu với v = 0 (giá trị mục tiêu của (2.20) là 0) hoặc không bị chặn. Từ nhận xét này rút ra kết luận
• xj là một biến phi cơ sở hữu hiệu nếu và chỉ nếu (2.19) bị chặn và có giá trị tối ưu là 0.
• xj là một biến phi cơ sở không hữu hiệu nếu và chỉ nếu (2.19) không bị chặn.
Thuật toán đơn hình được thực hiện bởi việc di chuyển các cơ sở liên kết cho đến khi một cơ sở tối ưu được tìm. Ta sử dụng nguyên tắc này để xác định tất cả các cơ sở hữu hiệu, nghĩa là, ta muốn di chuyển từ cơ sở hữu hiệu này đến cơ sở hữu hiệu khác. Do đó, ta phải chứng minh rằng việc di chuyển thực sự có thể dẫn tới các cơ sở hữu hiệu liên kết. Định nghĩa 2.3.4. Hai cơ sở hữu hiệu B và Bˆ được gọi là liên kết nếu cái này có được từ cái kia bởi việc thực hiện các bước trục hữu hiệu.
Ta chứng minh rằng tất cả các cơ sở hữu hiệu đều liên kết bởi việc sử dụng bài toán tham số.
Định lý 2.3.3. <Steuer (1985)>
Tất cả các cơ sở hữu hiệu đều liên kết với nhau.
Chứng minh. Cho B và Bˆ là hai cơ sở hữu hiệu. Cho λ, λˆ ∈ Rp> là các vectơ trọng dương với B và Bˆ là các cơ sở tối ưu của LP(λ) và LP(ˆλ). Ta xét LP tham số với hàm mục tiêu
C(Φ) = ΦˆλTC + (1−Φ)λTC (2.23)
với Φ ∈ [0,1].
Cho Bˆlà cơ sở đầu tiên (với Φ = 1). Sau một số bài toán tham số và các trục tối ưu, ta nhận được một cơ sở B˜mà là cơ sở tối ưu của LP(λ).
Do λ∗ = Φ ˆλ + (1−Φ)λ ∈ Rp>, ∀Φ ∈ [0,1], tất cả các cơ sở trung gian là tối ưu cho LP(λ∗) với λ∗ ∈ Rp>, nghĩa là, chúng là các cơ sở hữu hiệu. Tất cả các tham số và các trục tối ưu là hữu hiệu như đã giải thích ở trên. Nếu B˜ = B, ta thực hiện được. Ngược lại, B có thể có được từ
˜
B bởi các bước trục hữu hiệu (cụ thể là các trục tối ưu của LP(λ)), bởi vì B và B˜ là các cơ sở tối ưu của LP.
Bây giờ có thể giải thích tại sao giả thiết không tầm thường là cần thiết mà không có nó thì sự tồn tại của các biến phi cơ sở hữu hiệu không được đảm bảo và do đó, định lý 2.3.3 có thể sai. Ví dụ dưới đây chứng minh một bài toán là M OLP suy biến.
Ví dụ 2.3.4. <Steuer (2002)> Ta muốn giải M OLP sau
min −2x2 + x3 min −x1 −2x2 + x3 với x2 + 4x3 ≤ 8 x1 + x2 ≤ 8 x1, x2, x3 ≥ 0.
Ta đưa vào thêm hai biến x4, x5 để viết LP dưới dạng đẳng thức. Dễ dàng thấy rằng cả hai hàm mục tiêu trên đạt cực tiểu tại cùng một nghiệm xˆ = (0,8,0,0,0). Do đó, S(X, Cx) = {ˆx}. Do chỉ có một biến của xˆ là khác 0, có 4 cơ sở phân biệt xác định cùng một nghiệm cơ sở chấp nhận được hữu hiệu, đó là {1,2}, {2,3}, {2,4} và {2,5}(bài toán là suy biến). Dưới đây ta biểu diễn các bảng đơn hình cho 4 cơ sở này.
c1 0 0 7 2 0 16 c2 0 0 8 9 4 −1 4 16 x1 1 0 -1 −1 4 1 4 0 x2 0 1 4 1 0 8 c1 7 0 0 1 4 7 4 16 c2 8 0 0 1 4 7 4 16 x3 -1 0 1 1 4 −1 4 0 x2 4 1 0 0 0 8 c1 8 0 -1 0 2 16 c2 9 0 -1 0 2 16 x4 -4 0 4 1 -1 0 x2 4 1 0 0 1 8 c1 0 0 7 2 0 16 c2 1 0 7 2 0 16 x2 0 1 4 1 0 8 x5 4 0 -4 -1 1 0
Cơ sở {1,2} và {2,4} là không hữu hiệu tương ứng với định nghĩa
(2.3.1) do R chứa các cột không có phần tử dương. Do đó, các cơ sở này suy biến mặc dù BF S là hữu hiệu (tối ưu).
Hơn nữa, cơ sở {2,3} và {2,5} là hữu hiệu, định nghĩa được thỏa mãn ∀λ ∈ R2
tất cả các cột, do đó không có biến phi cơ sở hữu hiệu tồn tại. Ví dụ cho thấy rằng giả thiết ∩p
k=1Xk = φ là cần thiết để đảm bảo sự tồn tại của biến phi cơ sở hữu hiệu và tính giá trị của Định lý 2.3.3.
Từ Định lý 2.3.2 ta biết rằng phải xem xét các phần tử trục âm, nghĩa là A˜rj < 0. Điều gì sẽ xảy ra nếu biến phi cơ sở xj là hữu hiệu và cột j của A˜ chứa tất cả các phần tử không dương? Khi đó, sự tăng của xj không bị chặn, thực tế cho thấy bài toán tuyến tính đơn trị không bị chặn. Tuy nhiên, từ λT rj = 0, tính không bị chặn không là trường hợp trong LP đa mục tiêu. Hơn nữa, tính không bị chặn của S(X, Cx) được nhận ra trong hướng d được cho bởi vectơ với thành phần −˜bi/A˜ij, i ∈ B, xj = 1. Tất nhiên, đây không là trục chấp nhận được do nó không dẫn đến cơ sở khác.
Các kết quả cho đến nay cho phép ta di chuyển từ cơ sở hữu hiệu này đến cơ sở hữu hiệu khác. Để xây dựng thuật toán đơn hình đa trị, ta cần một cơ sở hữu hiệu để bắt đầu.
Cho M OLP:
M in {C x : A x = b, x ≥ 0}
Một và chỉ một trong các trường hợp sau xảy ra
• M OLP không có phương án chấp nhận được, nghĩa là X = ∅,
• M OLP có phương án chấp nhận được, tức là (X 6= ∅) nhưng không có nghiệm hữu hiệu S(X, Cx) = ∅,
• M OLP có phương án chấp nhận được và có nghiệm hữu hiệu, nghĩa là S(X, Cx) 6= ∅.
Thuật toán đơn hình đa trị giải quyết các tình huống này trong 3 giai đoạn như sau
GĐ1 : Xây dựng một nghiệm cơ sở chấp nhận được ban đầu hoặc dừng với kết luận rằng X = ∅. Giai đoạn này không liên quan đến ma trận hàm mục tiêu C và thông thường LP(2.16) được sử dụng.
GĐ2 : Xây dựng một cơ sở hữu hiệu ban đầu hoặc dừng với kết luận rằng S(X, Cx) = ∅.
GĐ3 : Trục giữa các cơ sở hữu hiệu để xác định tất cả các cơ sở hữu hiệu và điều khiển tính không bị chặn của S(X, Cx).
Trong GĐ2, nghiệm của LP(λ) tổng trọng với λ > 0 sẽ sinh ra một cơ sở hữu hiệu làm cho LP(λ) bị chặn. Trước đó, ta không biết rằng nó cần thiết để đạt được kết luận S(X, Cx) = ∅ hoặc quay lại một λ thích hợp mà LP(λ) có nghiệm tối ưu. Giả thiết rằng X 6= ∅, giai đoạn
1 quay lại một nghiệm cơ sở chấp nhận được x0 ∈ X mà có thể hoặc không thể là hữu hiệu. Ta tiếp tục hai bước sau: đầu tiên, LP phụ (2.6)
được giải để kiểm tra liệu S(X, Cx) = ∅. Mệnh đề 2.1.4 và đối ngẫu hàm ý rằng S(X, Cx) 6= ∅ nếu và chỉ nếu (2.6) có một nghiệm tối ưu. Trong trường hợp này, nghiệm tối ưu của (2.6) quay lại một vectơ trọng tương thích ω, tương tự argument mà ta sử dụng trong chứng minh củaˆ
định lý 2.1.3.
Từ Bổ đề 2.1.1, M OLP min{Cx : A x = b, x ≥ 0} có một nghiệm hữu hiệu nếu và chỉ nếu LP
max {eT z : A x = b, C x + I z = C x0, x, z ≥ 0} (2.24) có một nghiệm tối ưu. Hơn nữa, xˆ trong nghiệm tối ưu của (2.24) là nghiệm hữu hiệu của M OLP. Tuy nhiên, ta không biết rằng nếu xˆ là một nghiệm cơ sở chấp nhận được củaM OLP và trong trường hợp tổng quát, ta có thể không chọn xˆ để bắt đầu GĐ3 của thuật toán.
Thay vì áp dụng bài toán đối ngẫu (định lý 2.1.2): (2.24) có một nghiệm tối ưu nếu và chỉ nếu đối ngẫu của nó là
min uT b + ωTC x0 : uTA + ωTC ≥ 0, ω ≥ e (2.25) có môt nghiệm tối ưu (ˆu, ωˆ) với uˆT A + ˆωT C x0 = eT z. Khi đó,ˆ uˆ cũng
là nghiệm tối ưu của LP
min {uT b : ωT A ≥ −ωˆT C} (2.26) mà từ (2.25) cho ω = ˆω cố định. Như trong chứng minh của định lý
2.1.3, đối ngẫu của (2.26) có một nghiệm tối ưu và do đó, một nghiệm tối ưu cơ sở chấp nhận được là hữu hiệu. Đối ngẫu của (2.26) là tương đương với LP(ˆω) tổng trọng
min ωˆT C x : A x = b, x ≥ 0
Dưới đây ta chỉ ra rằng LP(2.25) và LP(ˆω) là các công cụ cần thiết cho GĐ2. Nếu (2.25) không thực hiện được, S(X, Cx) = ∅. Ngược lại, một nghiệm tối ưu của (2.25) chỉ ra vectơ trọng thích hợp λ = ˆω mà LP(λ) có nghiệm tối ưu cơ sở chấp nhận được mà là nghiệm cơ sở chấp nhận được hữu hiệu ban đầu của M OLP.
Dưới đây diễn tả thuật toán đơn hình đa mục tiêu để tìm tất cả các cơ sở hữu hiệu và tất cả các nghiệm cơ sở chấp nhận được hữu hiệu, ta cần phải tích trữ vào L1 là tập các cơ sở hữu hiệu trong quá trình thực hiện, L2 là tập các cơ sở hữu hiệu cho ra và εN là tập các biến phi cơ sở hữu hiệu.
Thuật toán 2.3.1. < Thuật toán đơn hình cho bài toán tối ưu đa mục tiêu tuyến tính>
Vào : Dữ liệu A, b, c của một M OLP Khởi tạo : Tập L1 := ∅, L2 := ∅. Giai đoạn 1:
Giải LP min {eT z : A x + Iz = b, x , z ≥ 0}. Nếu giá trị tối ưu của LP này là khác không, dừng, X = ∅. Ngược lại, cho x0 là một nghiệm cơ sở chấp nhận được của M OLP.
Giải LP min{uT b + ωT C x0 : uT A + ωT C ≥ 0, ω ≥ e}.
Nếu bài toán này không thực hiện được, dừng S(X, C x) = ∅. Ngược lại, cho (ˆu, ωˆ) là một nghiệm tối ưu.
Tìm một cơ sở tối ưu B của LP min {ωˆT C x : A x = b , x ≥ 0}.
L1 := { B}, L2 := ∅. Giai đoạn 3: Khi L1 6= ∅ Chọn B trong L1, cho L1 := L1\ {B}, L2 := L2 ∪ {B}. Tính A,˜ b và R tương ứng với B εN := N. Với mọi j ∈ N Giải LP max{eT v : R y − rjδ + I v = 0 ; y, δ, v ≥ 0}
Nếu bài toán này không bị chặn εN := εN \ {j}
Kết thúc
Với mọi j ∈ εN
Với mọi i ∈ B
Nếu B0 = (B\ {i}) ∪ {j} là thực hiện được và B0 ∈ L/ 1 ∪ L2 thì