Bài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụngBài toán bù tuyến tính và ứng dụng
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC VƯƠNG THỊ HUỆ CHI BÀI TỐN BÙ TUYẾN TÍNH VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ TOÁN HỌC Thái Nguyên - 2014 Mục lục Lời nói đầu Chương Bài tốn bù tuyến tính 1.1 Bài tốn bù tuyến tính (LCP) 1.1.1 Mô tả toán 1.1.2 Nguồn gốc tốn bù tuyến tính 1.2 Quan hệ với toán VI MPEC 1.2.1 Bài toán bất đẳng thức biến phân 1.2.2 Bài toán qui hoạch toán học với ràng buộc cân 1.3 Sự tồn nghiệm toán LCP 4 12 12 15 18 Chương Phương pháp giải toán 2.1 Phương pháp Lemke 2.1.1 Phương pháp Lemke 2.1.2 Ví dụ minh họa 2.1.3 Sự hội tụ hữu hạn 2.2 Phương pháp điểm 21 21 21 24 27 31 Chương Một số ứng dụng toán bù tuyến tính 3.1 Trò chơi Steckelberg 3.2 Trò chơi song ma trận 3.2.1 Trò chơi song ma trận 3.2.2 Nghiệm trò chơi song ma trận 35 35 36 36 39 Kết luận 40 Tài liệu tham khảo 41 bù tuyến tính Lời nói đầu Bài tốn bù tuyến tính (Linear Complementarity Problem, viết tắt LCP), R W Cottle G B Dantzig đề xuất năm 1968, tốn tổng qt mơ tả thống tốn qui hoạch tuyến tính, qui hoạch tồn phương trò chơi song ma trận Các nghiên cứu tốn bù tuyến tính đem lại nhiều lợi ích, vượt ngồi khn khổ tốn bù Chẳng hạn, thuật toán xoay bù (comple-mentarity pivot algorithm) lúc đầu đề xuất cho tốn bù tuyến tính mở rộng trực tiếp để tạo thuật tốn hiệu tính điểm bất động Brouwer Kakutani, tính trạng thái cân kinh tế, giải hệ phương trình phi tuyến tìm nghiệm tối ưu cho toán qui hoạch phi tuyến Bài toán bù tuyến tính tốn tìm véctơ z ∈ Rn nghiệm hệ z ≥ 0, q + M z ≥ 0, z T (q + M z) = rõ hệ vô nghiệm, với véctơ q ∈ Rn ma trận M ∈ Rn×n cho trước Ký hiệu toán LCP (q, M) hay đơn giản LCP không cần rõ q M (T ký hiệu chuyển vị vectơ hay ma trận) Bài tốn bù tuyến tính LCP (q, M) có nhiều ứng dụng lý thuyết thực tiễn, qui hoạch tồn phương, trò chơi song ma trận, cân thị trường nhiều tốn kinh tế, cơng nghiệp vật lý khác Mục tiêu luận văn tìm hiểu trình bày khái qt tốn bù tuyến tính, mối quan hệ tốn bù tuyến tính với toán bất đẳng thức biến phân toán qui hoạch tốn học với ràng buộc cân Tìm hiểu phương pháp giải số ứng dụng tốn bù tuyến tính vào mơ hình trò chơi Luận văn viết thành ba chương Chương “Bài tốn bù tuyến tính" trình bày khái niệm tốn bù tuyến tính, nguồn gốc toán tồn nghiệm tốn Bài tốn bù có nhiều ứng dụng liên quan chặt chẽ với số toán dạng tổng quát hơn, quan tâm nghiên cứu, tốn bất đẳng thức biến phân toán qui hoạch toán học với ràng buộc cân Vì chương đề cập tới hai toán Chương “Phương pháp giải tốn bù tuyến tính” giới thiệu hai phương pháp tiêu biểu giải tốn bù tuyến tính: phương pháp Lemke (1968) phương pháp điểm (Kojima, 1988) Phương pháp Lemke có nhiều điểm giống với phương pháp đơn hình qui hoạch tuyến tính, khác cách chọn biến để đưa vào sở, phương pháp cho phép giải tốn bù tuyến tính khơng suy biến sau số hữu hạn bước Tuy vậy, trường hợp xấu thời gian chạy hàm mũ Phương pháp điểm dựa ý tưởng thuật toán điểm giải qui hoạch tuyến tính, cho phép giải tốn bù tuyến tính với ma trận M nửa xác định dương thời gian đa thức Chương "Một số ứng dụng tốn bù tuyến tính" trình bày hai mơ hình trò chơi thường gặp ứng dụng tốn bù tuyến tính: trò chơi Stackelberg trò chơi song ma trận Trò chơi Stackelberg liên quan chặt chẽ với toán qui hoạch toán học với ràng buộc cân (MPEC) mở rộng ý tưởng trò chơi Nash Có thể tìm nghiệm cân Nash trò chơi song ma trận nhờ lập giải tốn bù tuyến tính thích hợp Do thời gian kiến thức hạn chế nên chắn luận văn có thiếu sót định, kính mong q thầy bạn đóng góp ý kiến để tác giả tiếp tục hồn thiện luận văn sau Nhân dịp tác giả luận văn xin bày tỏ lòng biết ơn sâu sắc tới GS TS Trần Vũ Thiệu tận tình giúp đỡ suốt trình làm Luận văn Tác giả trân trọng cảm ơn giảng viên Trường Đại học Khoa học – Đại học Thái Nguyên, Viện Toán học – Viện Hàn lâm Khoa học Công nghệ Việt Nam tạo điều kiện thuận lợi trình tác giả học tập nghiên cứu Thái Nguyên, tháng năm 2014 Tác giả Vương Thị Huệ Chi Chương Bài tốn bù tuyến tính Chương trình bày khái niệm toán bù tuyến tính, nguồn gốc tốn tồn nghiệm tốn Bài tốn bù có nhiều ứng dụng liên quan chặt chẽ với số toán dạng tổng quát hơn, quan tâm nghiên cứu, tốn bất đẳng thức biến phân toán qui hoạch toán học với ràng buộc cân bằng, chương giới thiệu hai toán Nội dung chương tham khảo từ tài liệu [3], [4], [6] [7] 1.1 1.1.1 Bài tốn bù tuyến tính (LCP) Mơ tả tốn Bài tốn bù tuyến tính (Linear Complementarity Problem, viết tắt LCP) tốn tìm véctơ không gian véctơ thực hữu hạn chiều thỏa mãn hệ bất đẳng thức Cụ thể, tốn bù tuyến tính phát biểu sau Định nghĩa 1.1.([3], tr.1) Cho véctơ q ∈ Rn ma trận M ∈ Rn×n , tìm véctơ z ∈ Rn cho: z≥0 (1.1) q + Mz ≥ (1.2) z T (q + M z) = (1.3) véctơ z không tồn Ta ký hiệu toán LCP (q, M ) Trong tài liệu tốn, tìm thấy trường hợp riêng tốn bù tuyến tính sớm từ năm 1940, nhiên toán bù bắt đầu thu hút ý từ năm 1960, toán trở thành chủ đề nghiên cứu riêng Sau số thuật ngữ thường dùng tốn bù tuyến tính: Véctơ z thỏa mãn bất đẳng thức (1.1) (1.2) gọi chấp nhận Nếu véctơ chấp nhận z thỏa mãn chặt (như bất đẳng thức) bất đẳng thức (1.1 ) - (1.2) gọi chấp nhận chặt Bài toán LCP (q, M ) gọi chấp nhận (hay chấp nhận chặt) có tồn véctơ chấp nhận (hay chấp nhận chặt) Tập tất véctơ chấp nhận toán LCP (q, M ) gọi miền chấp nhận ký hiệu FEA (q, M ) Đặt w = q + Mz (1.4) Véctơ chấp nhận z LCP (q, M ) thỏa mãn (1.3) zi wi = với i = 1, 2, , n (1.5) Điều kiện (1.5) thường dùng thay cho điều kiện (1.3) zi wi gọi cặp bù chúng gọi bù Véctơ z thỏa mãn (1.5) gọi véctơ bù Vì thế, LCP tốn tìm véctơ chấp nhận bù Một véctơ gọi nghiệm (solution) LCP Bài toán LCP (q, M ) gọi giải (solvable) có nghiệm Ký hiệu tập nghiệm LCP (q, M ) SOL (q, M ) Chú ý q ≥ LCP (q, M ) giải với véctơ nghiệm tầm thường Cách xác định w thường dùng để diễn đạt theo cách khác toán LCP (q, M ), thuận tiện cho xây dựng thuật tốn giải Cụ thể tốn tìm véctơ không âm w z Rn thỏa mãn (1.4) (1.5) Để tiện cho trích dẫn sau, ta viết lại điều kiện (1.1) - (1.4) toán LCP dạng w ≥ 0, z ≥ 0, w = q + M z, z T w = Ràng buộc z T w = gọi ràng buộc bù (Complementarity Constraint) viết dạng z⊥w, ⊥ ký hiệu "vng góc" Trường hợp riêng tốn LCP (q, M ) q = đáng ý Bài toán gọi toán bù tuyến tính tương ứng với ma trận M Một tính chất đặc thù tốn LCP (0, M ) z ∈ SOL(0, M ) λz ∈ SOL(0, M ) với số thực λ ≥ Bài tốn bù tuyến tính có véctơ nghiệm tầm thường Câu hỏi "liệu tốn đặc biệt có nghiệm khác thường hay khơng" có ý nghĩa quan trọng lý thuyết thuật tốn Ví dụ 1.1(Bài tốn chiều) Cho trước hai số thực q, m ∈ R, tìm hai biến số z, w ∈ R cho z ≥ 0, w ≥ 0, w = q + mz z(q + mz) = Đó tốn bù tuyến tính R Hình 1.1 minh họa hình ảnh hình học tốn trường hợp q > 0, m < Bài tốn Hình 1.1 có nghiệm: q (z = 0, w = q) (z = − , w = 0) m Nói chung, tốn có nghiệm? Câu trả lời cho bảng sau (tùy thuộc giá trị q m) Có thể phát biểu tốn bù (Complementarity Problem, viết tắt CP) dạng tổng quát sau Định nghĩa 1.2 (xem [4], tr 4-5) Cho nón K ⊆ Rn (tức x ∈ K ⇒ λx ∈ K với số λ ≥ 0) hàm F : K → Rn Bài toán bù, ký hiệu CP (K, F ), toán tìm véctơ z ∈ Rn thỏa mãn điều kiện: K z⊥F (z) ∈ K ∗ ⊥ ký hiệu "vng góc" K ∗ nón đối ngẫu (dual cone) K xác định K ∗ = d ∈ Rn : z T d ≥ với z ∈ K , tức K ∗ gồm tất véctơ không tạo thành góc tù với véctơ K Thay cho ký hiệu ⊥ , ta viết toán bù CP (K, F ) dạng z ∈ K, F (z) ∈ K ∗ z T F (z) = Bài tốn bù tuyến tính LCP trường hợp riêng toán bù CP K = Rn+ (do K ∗ = Rn+ ) F (z) = q + M z với q ∈ Rn M ∈ Rn×n Luận văn chủ yếu tập trung xét tốn bù tuyến tính LCP 1.1.2 Nguồn gốc tốn bù tuyến tính Về lịch sử, toán LCP xem diễn đạt thống toán qui hoạch tuyến tính, qui hoạch tồn phương tốn trò chơi song ma trận Thực ra, tốn qui hoạch tồn phương tiếp tục nguồn ứng dụng quan trọng toán LCP Một số thuật tốn có hiệu cao để giải qui hoạch toàn phương dựa cách diễn đạt tốn LCP Còn tốn trò chơi song ma trận, toán LCP phương tiện để khám phá cơng cụ hiệu quả, có tính chất kiến thiết, để tính tốn nghiệm cân Bài tốn bù tuyến tính có nhiều ứng dụng phong phú đa dạng Trong mục ta mô tả số ứng dụng cổ điển ứng dụng số tính chất đặc biệt ma trận M toán LCP tương ứng • Qui hoạch tồn phương Xét tốn qui hoạch tồn phương (Quadratic Program, viết tắt QP) f (x) = cT x + xT Qx → với điều kiện Ax ≥ b, x ≥ 0, Q ∈ Rn×n đối xứng, c ∈ Rn , A ∈ Rm×n b ∈ Rm Trường hợp Q = ta nhận tốn qui hoạch tuyến tính (Linear Program, viết tắt LP) Nếu x nghiệm tối ưu địa phương tốn QP tồn véctơ y ∈ Rm cho cặp (x, y) thỏa mãn điều kiện Karush-Kuhn-Tucker, gọi tắt điều kiện KKT : u = c + Qx − AT y ≥ 0, x ≥ 0, xT u = 0, (1.6) v = −b + Ax ≥ 0, y ≥ 0, y T v = (1.7) Thêm vào đó, Q ma trận nửa xác định dương, nghĩa hàm mục tiêu f (x) lồi (1.6) - (1.7) điều kiện đủ véctơ x nghiệm tối ưu tồn cục tốn qui hoạch tồn phương lồi Các điều kiện (1.6) - (1.7) xác định tốn bù tuyến tính LCP (q, M ) với c Q −AT q= M = −b A Để ý ma trận M không đối xứng (trừ A khơng có 0) Q đối xứng Tuy thế, M có tính chất gọi song đối xứng (bisymmetry) Theo định nghĩa, ma trận vuông N song đối xứng sau hoán vị tập hàng cột, đưa ma trận dạng G −AT N= A H với G H đối xứng Nếu Q nửa xác định dương qui hoạch tồn phương lồi M ma trận song đối xứng (Nhớ ma trận vuông Q nửa xác định dương z T Qz ≥ với véctơ z) Một trường hợp riêng quan trọng tốn tồn phương QP có ràng buộc dấu biến x Khi đó, tốn QP có dạng đơn giản f (x) = cT x + xT Qx → với điều kiện x ≥ Nếu Q nửa xác định dương tốn dạng đơn giản hồn tồn tương đương với tốn LCP (c, Q) Có nhiều ứng dụng cơng nghiệp vật lý dẫn tới mơ hình qui hoạch toàn phương lồi dạng đặc biệt mà ta vừa tương đương với toán bù tuyến tính LCP (c, Q) Các ứng dụng bao gồm toán tiếp xúc, toán chất lỏng nhớt, toán vật cản, toán xoắn chất dẻo đàn hồi nhiều toán biên tự khác LCP có vai trò quan trọng việc giải số tốn ứng dụng • Trò chơi song ma trận Trò chơi song ma trận (Bimatrix Game), ký hiệu G(A, B), gồm hai người chơi, gọi người chơi I người chơi II Mỗi người chơi (Player) có số hữu hạn hành động (actions), gọi chiến lược đơn (pure strategies), quyền lựa chọn Trong loại trò chơi khơng thiết người thắng, người thua Vì thế, thuật ngữ trò chơi song ma trận thường có nghĩa trò chơi hữu hạn (finite), hai người (two-person), tổng khác không (nonzero-sum) Trò chơi đối kháng hai người với tổng khơng thường xét qui hoạch tuyến tính Ta hình dung người chơi I có m chiến lược đơn, người chơi II có n chiến lược đơn Các chữ A B ký hiệu trò chơi G(A, B) ma trận cấp m × n với phần tử biểu thị chi phí hai người chơi phải trả Như vậy, người chơi I chọn chiến lược đơn i (i = 1, , m) người chơi II chọn chiến lược đơn j (j = 1, , n) người chơi phải trả chi phí tương ứng aij bij Do khơng đòi hỏi tổng hai chi phí nên có aij + bij = Chiến thuật hỗn hợp (mixed strategy) hay chiến thuật ngẫu nhiên (randomized strategy) người chơi I véctơ x ∈ Rm với thành phần xi biểu thị xác suất chọn chiến lược đơn i, tức x ≥ m i=1 xi = Chiến lược hỗn hợp người chơi II định nghĩa tương tự Do đó, x y cặp chiến lược hỗn hợp tương ứng người chơi I II 27 Lúc đưa ys = z4 vào sở Kiểm tra tỉ số nhỏ , , = cho thấy w3 bị loại khỏi sở Vì vòng lặp 4 sau ta chọn ys = z3 để đưa vào sở Biến đổi bảng theo phần tử trụ hàng cột z4 (ơ tơ đậm) Chuyển sang vòng lặp với ys = z3 Vòng lặp 2: Lúc cần đưa ys = z3 vào sở Tuy nhiên, phần tử cột z3 (tô đậm) không dương Vì thuật tốn dừng tia (vơ hạn) Kết quả, ta gặp tia: R= (z0 , z, w) = 3, 0, 0, 0, , , 8, 0, + λ(0, 0, 0, 1, 1, 0, 1, 0, 0) : λ ≥ 2 điểm tia thỏa mãn (2.3), (2.4) (2.5) 2.1.3 Sự hội tụ hữu hạn Bổ đề sau toán bù suy rộng khơng suy biến thuật tốn nêu phải dừng sau số hữu hạn bước nghiệm chấp nhận sở bù hay tia miền xác định (2.3) (2.5) Bổ đề 2.2 ([2], tr 663) Giả sử nghiệm chấp nhận sở gần bù hệ (2.3) - (2.5) không suy biến, nghĩa biến sở nghiệm có giá trị dương Khi thuật tốn Lemke sinh 28 nghiệm chấp nhận sở gần bù khác thuật tốn dừng sau hữu hạn bước Chứng minh Giả sử (z0 , z, w) nghiệm chấp nhận sở gần bù với zs ws biến phi sở Khi (z0 , z, w) thường có hai nghiệm chấp nhận sở gần bù kề nó, nghiệm nhận cách đưa zs vào sở nghiệm nhận cách đưa ws vào sở Theo giả thiết không suy biến, nghiệm kề nhận khác (z0 , z, w) (Cũng xảy trường hợp (z0 , z, w) có hai nghiệm chấp nhận sở gần bù kề Đó trường hợp véctơ cột hệ số zs hay ws nhỏ hay trường hợp đưa zs hay ws vào sở biến z0 bị đẩy khỏi sở sinh nghiệm chấp nhận sở bù) Bây ta tất nghiệm chấp nhận sở gần bù thuật toán sinh khác Ký hiệu (z0 , z, w)k cặp điểm thuật toán sinh vòng lặp thứ k Giả sử trái lại có (z0 , z, w)k+t = (z0 , z, w)k với k, t nguyên dương k +t số nhỏ xảy trùng lặp Từ giả thiết không suy biến suy t > Hơn nữa, theo qui tắc thuật tốn t > Nhưng (z0 , z, w)k+t−1 kề với (z0 , z, w)k+t nên kề với (z0 , z, w)k Xét hai khả năng: • Nếu k = (z0 , z, w)k có nghiệm chấp nhận sở gần bù kề nên (z0 , z, w)k+t−1 = (z0 , z, w)k+1 trùng lặp xảy vòng lặp k + t − 1, trái với giả thiết trùng lặp xảy vòng lặp k + t • Nếu k ≥ (z0 , z, w)k+t−1 kề (z0 , z, w)k phải (z0 , z, w)k+1 hay (z0 , z, w)k−1 Dù trường hợp trùng lặp xảy vòng lặp k + t − 1, trái với giả thiết trùng lặp xảy vòng lặp k + t Vì cặp điểm thuật toán sinh khác Do có số hữu hạn nghiệm chấp nhận sở gần bù không gặp lại nghiệm chấp nhận sở gần bù q trình thực thuật tốn nên thuật tốn phải dừng sau số hữu hạn bước nghiệm chấp nhận sở bù tia vơ hạn Bổ đề chứng minh Để hồn thành chứng minh định lý hội tụ thuật toán ta cần 29 tới bổ đề sau số hệ việc dừng thuật toán tia khái niệm "ma trận đồng dương cộng" Bổ đề 2.3 ([2], tr 664) Giả thiết nghiệm chấp nhận sở gần bù hệ (2.3) - (2.5) khơng suy biến Giả sử thuật tốn xoay bù dùng để giải hệ thêm giả sử xảy trường hợp thuật toán dừng tia Cụ thể, giả thiết thuật toán dừng ta nhận nghiệm chấp nhận sở gần bù (¯ z0 , z¯, w) ¯ phương cực biên (ˆ z0 , zˆ, w) ˆ Từ nhận tia R = {(¯ z0 , z¯, w) ¯ + λ (ˆ z0 , zˆ, w) ˆ : λ ≥ 0} Khi đó, ta có kết luận sau: (ˆ z0 , zˆ, w) ˆ = 0, (ˆ z0 , zˆ, w) ˆ ≥ 0, wˆ − M zˆ − eˆ z0 = T T z¯ w¯ = z¯ wˆ = zˆT w¯ = zˆT wˆ = zˆ = zˆT M zˆ = −eT zˆzˆ0 ≤ Chứng minh Do (ˆ z0 , zˆ, w) ˆ phương cực biên tập xác định (2.3) - (2.4) nên kết luận suy từ định nghĩa phương cực biên Nhớ điểm tia R thỏa mãn (2.5) nên = (¯ z + λˆ z )T (w¯ + λw) ˆ với λ ≥ Từ kết hợp với tính khơng âm z¯, zˆ, w¯ wˆ suy z¯T w¯ = z¯T wˆ = zˆT w¯ = zˆT wˆ = 0, (2.6) nghĩa kết luận Bây ta chứng minh kết luận phản chứng Thật vậy, giả sử zˆ = Lúc phải có zˆ0 > zˆ0 = từ kết luận suy wˆ = 0, nghĩa (ˆ z0 , zˆ, w) ˆ = 0, trái với kết luận Như ta zˆ = zˆ0 > wˆ = eˆ z0 Theo (2.6) ta có = z¯T wˆ = z¯T eˆ z0 Từ eT z¯ = z¯ ≥ nên z¯ = Theo giả thiết không suy biến, biến thành phần z¯ biến phi sở Hơn nữa, z¯0 biến sở nên phải có n - biến thành phần w¯ biến sở Nói riêng, w¯ − M z¯ − e¯ z0 = q z¯ = nên z¯0 = max {−qi : ≤ i ≤ n} Điều chứng tỏ nghiệm chấp nhận sở gần bù (¯ z0 , z¯, w) ¯ nghiệm ban đầu mà theo Bổ đề 2.2, điều xảy Vì phải có zˆ = Cuối cùng, nhân zˆT với wˆ − M zˆ − eˆ z0 ý zˆT wˆ = theo (2.6), ta nhận zˆT M zˆ = −eT zˆzˆ0 ≤ 0, nghĩa kết luận 30 Đến bổ đề chứng minh đầy đủ Định nghĩa 2.3 Cho M ma trận cấp n × n Ta gọi M ma trận đồng dương (copositive) z T M z ≥ với z ≥ gọi M ma trận đồng dương cộng (copositive-plus) M đồng dương z ≥ 0, z T M z = kéo theo M + M T z = Định lý sau hệ w − M z = q, z ≥ 0, w ≥ tương thích ma trận M đồng dương cộng thuật tốn Lemke cho nghiệm chấp nhận sở bù sau số hữu hạn bước Định lý 2.1 ([2], tr 666) Giả thiết nghiệm chấp nhận sở gần bù hệ xác định (2.3) - (2.5) không suy biến giả thiết M ma trận đồng dương cộng Khi đó, thuật tốn Lemke dừng sau số hữu hạn bước Nói riêng, hệ w − M z = q, z ≥ 0, w ≥ 0, tức hệ (2.1), tương thích thuật tốn dừng nghiệm chấp nhận sở bù hệ xác định (2.1) - (2.2), tức nghiệm tốn LCP (q, M) Còn hệ (2.1): w − M z = q, z ≥ 0, w ≥ khơng tương thích thuật toán dừng tia Chứng minh Theo Bổ đề 2.2, thuật toán xoay bù dừng sau hữu hạn bước Giả sử thuật toán dừng tia Cụ thể, giả sử (¯ z0 , z¯, w) ¯ nghiệm chấp nhận sở gần bù (ˆ z0 , zˆ, w) ˆ phương cực biên tương ứng với bảng cuối Theo Bổ đề 2.3, ta có zˆ ≥ 0, zˆ = zˆT M zˆ = −eT zˆzˆ0 ≤ (2.7) Nhưng M ma trận đồng dương cộng nên zˆT M zˆ ≥ Từ (2.7) suy = zˆT M zˆ = −eT zˆzˆ0 Do zˆ = nên zˆ0 = Nhưng (ˆ z0 , zˆ, w) ˆ phương cực biên tập xác định (2.3) - (2.4) nên wˆ − M zˆ − eˆ z0 = wˆ = M zˆ (2.8) Bây ta chứng minh q T zˆ < Do zˆT M zˆ = M ma trận đồng dương cộng nên M + M T zˆ = Kết hợp điều với kết luận Bổ đề 2.3 w¯ = q + M z¯ + e¯ z0 cho thấy = zˆT w¯ = zˆT (q + M z¯ + e¯ z0 ) = q T zˆ − z¯T M zˆ + z¯0 eT zˆ (2.9) Theo (2.8) M zˆ = wˆ từ kết luận Bổ đề 2.3 suy z¯T M zˆ = z¯T wˆ = Hơn nữa, z¯0 > eT zˆ > theo (2.7) Thay vào (2.9) ta nhận q T zˆ < 31 Tóm lại, ta chứng minh M zˆ = wˆ ≥ Do M + M T zˆ = nên M T zˆ = −M zˆ ≤ 0, −I zˆ ≤ q T zˆ < Chứng tỏ hệ M T y ≤ 0, −Iy ≤ q T y < có nghiệm, chẳng hạn y = zˆ Theo Định lý Farkas (xem [2], tr 55), hệ w − M z = q, z ≥ 0, w ≥ 0, tức hệ (2.1), vô nghiệm Bây hệ (2.1) tương thích thuật tốn phải dừng nghiệm chấp nhận sở bù, khơng thuật tốn dừng tia chứng minh, điều xảy hệ (2.1) vô nghiệm Nếu hệ (2.1) khơng tương thích hiển nhiên thuật tốn dừng nghiệm chấp nhận sở bù nên phải dừng tia Định lý chứng minh đầy đủ Từ định lý suy Hệ 2.1 Nếu M ma trận không âm (mọi phần tử không âm) phần tử đường chéo dương thuật tốn xoay bù dừng sau số hữu hạn bước nghiệm chấp nhận sở bù Chứng minh Từ giả thiết nêu M thấy hệ w − M z = q, (z, w) ≥ có nghiệm Chẳng hạn, cách chọn z đủ lớn để w = q + M z ≥ Kết luận hệ qủa suy từ Định lý 2.1 nhận xét M ma trận đồng dương cộng Cần ý thêm thuật tốn Lemke giải tốn LCP khơng suy biến tình định Hiện tượng suy biến toán LCP làm cho thuật tốn dẫn đến xoay vòng thuật tốn khơng thể dừng sau hữu hạn bước Nhiều phương pháp khác đề xuất để khắc phục xoay vòng Hai cách tiếp cận hoá giải tượng suy biến theo tự vựng theo số nhỏ Mô tả chi tiết phương pháp chống xoay vòng tìm tài liệu [3], tr 336 - 352 2.2 Phương pháp điểm Phương pháp điểm giải toán LCP Kojima đề xuất năm 1988, dựa ý tưởng thuật toán điểm giải qui hoạch tuyến tính Phương pháp điểm trình bày mục có độ phức tạp tính tốn O(n3,5 ) Tuy nhiên cải tiến để thuật tốn có độ phức tạp 32 thấp O(n3 ) phép toán (xem [7], tr 10) Sau giả thiết tốn LCP (q, M), q ∈ Rn M ∈ Rm×n , giải theo phương pháp điểm trong: a) n ≥ Trường hợp n = LCP (q, M) giải dễ dàng nên không cần xét (xem Ví dụ 1.1, Chương 1) b) Các phần tử q M số nguyên c) M ma trận nửa xác định dương, nghĩa z T M z ≥ với z ∈ Rn d) Mỗi hàng M có phần tử khác Trước trình bày thuật tốn, ta đề cập tới hệ phương trình mà dùng thường xuyên thuật toán Xét ánh xạ (véctơ hàm) n n H : R+ × R2n + R ìR xỏc nh bi H(à, z, w) = (ZW e − µe, w − q − M z) với (µ, z, w) ∈ R1+2n , Z = diag(z) ma trận đường chéo + z, W = diag(w) ma trận đường chéo w e ∈ Rn véctơ có thành phần Dễ kiểm tra thấy toán LCP (q, M) tương đương với phương trình H(0, z, w) = (z, w) ∈ R2n + Ta dùng ký hiệu S để tập nghiệm chấp nhận toán LCP (q, M), Sint phần S Scp tập nghiệm LCP (q, M), nghĩa S = (z, w) ∈ R2n + : w = q + Mz , Sint = (z, w) ∈ R2n ++ : w = q + M z , Scp = {(z, w) ∈ S : zi wi = 0, i = 1, , n} , Rn+ = {z ∈ Rn : z ≥ 0} orthant không âm Rn Rn++ = {z ∈ Rn : z > 0} orthant dương Rn Xét hệ phương trình H(µ, z, w) = (z, w) ∈ R2n + (2.10) 33 Mỗi cặp (x, y) ∈ R2n + thỏa mãn hệ phương trình (2.10) với µ > gọi tâm điểm (center) miền chấp nhận S Tập tâm điểm ký hiệu Scen xác định Scen = (x, y) ∈ R2n + : H(µ, z, w) = với µ > Thuật tốn điểm áp dụng phương pháp Newton để giải hệ phương trình (2.10) phụ thuộc tham số µ ≥ 0, µ ngày nhỏ dần sau phép lặp, đạt nghiệm đủ xác Độ xác nghiệm đánh giá số L dùng tiêu chuẩn dừng thuật tốn Kojima xác định L theo cơng thức n n+1 log (|aij | + 1) + log(n2 ) + 1, L= i=1 j=1 aij phần tử hàng i cột j ma trận A = [q M ] cấp n × (n + 1) t số nguyên lớn không vượt t ∈ Rn+ (tức t ≥ 0) Ký hiệu z k , wk giá trị z, w vòng lặp k thuật tốn Cho trước điểm lặp ban đầu (z , w1 ) Các bước thuật toán điểm sau: Bước Chọn số dương α ≤ 0,1 δ = 1/(1 − α) Đặt số lặp k = T Bước Nếu z k wk ≤ 2−2L dừng thuật tốn Trái lại, chuyển sang Bước √ Bước Đặt µ = (1 − δ/ n)(z k )T wk /n (z, w) = (z k , wk ) Lập ma trận đường chéo Z W Bước Tìm hướng Newton (∆z, ∆w) nhờ dùng hai biểu thức ∆z = (µ + Z −1 W )−1 (µZ −1 e − W e), ∆w = M ∆z sau tính điểm lặp (z k+1 , wk+1 ) = (z k , wk ) + (∆z, ∆w) Bước Đặt k ← k + Quay lại Bước 34 Thuật toán lặp lại đạt tiêu chuẩn dừng nêu Bước Bằng cách điều chỉnh L, làm cho nghiệm nhận đạt độ xác cần thiết Tóm lại, chương giới thiệu hai phương pháp tiêu biểu giải toán bù tuyến tính LCP Phương pháp Lemke (1968) tiện dùng tính tốn nên trình bày chi tiết với đầy đủ sở lý luận, bước thực ví dụ số minh họa Phương pháp điểm (Kojima, 1988) có ưu điểm chạy thời gian đa thức, nhiên phức tạp nên trình bày ý tưởng bước thuật tốn 35 Chương Một số ứng dụng tốn bù tuyến tính Chương trình bày số ứng dụng tốn bù tuyến tính, cụ thể trò chơi Stackelberg trò chơi song ma trận Trò chơi Stackelberg liên quan chặt chẽ với tốn qui hoạch toán học với ràng buộc cân (MPEC) mở rộng ý tưởng trò chơi Nash Nội dung chương tham khảo từ tài liệu [7] 3.1 Trò chơi Steckelberg Trong trò chơi Nash khơng cho phép có hợp tác người chơi người chơi lựa chọn chiến lược cách độc lập với Giả thiết người chơi lựa chọn chiến lược hy vọng đem lại cho lợi ích lớn Giả sử có N người chơi hàm trả tiền người chơi thứ i gi (x), i = 1, , N, x = (x1 , , xN ) véctơ biến định với xi biến định người chơi i Không gian chiến lược người chơi i cho tập Xi ⊂ Rni , ni số nguyên biểu thị số chiến lược mà người chơi i lựa chọn Giả sử gi = Rni +nN → R biến định người chơi i, xi ∈ Xi với i = 1, , N Trong trò chơi Nash hàm mục tiêu người chơi i gi (x) thực sau max gi (x) , i = 1, , N xi ∈Xi (3.1) Nói cách khác, người chơi cố gắng làm cực đại hàm mục tiêu riêng Tuy nhiên, giá trị hàm mục tiêu người chơi phụ thuộc hành động người chơi khác Trong trò chơi Stackelberg, có người chơi làm chủ (leader), người lại người chơi thứ cấp (followers) "Chủ cái" chọn hành động trước Sự lựa chọn chiến lược chủ chịu ảnh hưởng người chơi khác hành động hành động chủ Những người chơi khác cố gắng tìm hành động làm cực đại lợi nhuận họ tình tạo sau hành động 36 chủ Chủ ký hiệu số người chơi khác ký hiệu số −1, tức x−1 = (x2 , , xN ) Về mặt toán học, trò chơi Stackelberg tương tự trò chơi Nash, với hàm mục tiêu ràng buộc bổ sung mới: max g1 (x) (3.2) x−1 ∈ arg max {g−1 : x−1 ∈ X−1 } (3.3) x1 ∈X1 với điều kiện Trong trò chơi Stackelberg, chủ làm cực đại hàm mục tiêu Hàm mục tiêu có điều kiện ràng buộc hành động chủ cái, người chơi thứ cấp lựa chọn hành động làm cực đại hàm mục tiêu riêng Trò chơi Stackelberg tốn tối ưu hai cấp, theo nghĩa có tốn mức (chủ hành động trước, cố gắng làm cực đại lợi ích mình) tốn mức (những người chơi thứ cấp hành động sau chủ cái, tìm cực đại lợi ích riêng họ) Trong thực tế, thường chủ hãng lớn trội thị trường kinh doanh người chơi lại hãng cạnh tranh nhỏ thị trường Cách diễn đạt toán theo (3.2) (3.3) toán qui hoạch toán học với ràng buộc cân MPEC, biểu thức (3.3) có vai trò giống ràng buộc y ∈ S(x) toán MPEC nêu mục 1.2.2 Trái lại, trò chơi song ma trận trò chơi hai người với tổng khác khơng, theo nghĩa số tiền thắng người chơi không số tiền thua người chơi Trò chơi song ma trận trình bày kỹ mục sau 3.2 3.2.1 Trò chơi song ma trận Trò chơi song ma trận Ví dụ sớm ứng dụng tốn bù tuyến tính trò chơi song ma trận Trò chơi song ma trận nghiên cứu lý thuyết trò chơi, trò chơi gồm hai người chơi Mục đích người chơi tìm chiến lược chơi đem lại lợí ích cao (hay chi phí thấp nhất) cho 37 người chơi Cả hai người tham gia chơi sử dụng số, khơng tất cả, hành động Chiến lược người chơi chiến lược đơn hay chiến lược ngẫu nhiên Chiến lược đơn có nghĩa người chơi lựa chọn hành động tiến hành trò chơi Chiến lược ngẫu nhiên có nghĩa hành động gắn với xác suất đó, tức xác suất mà người chơi lựa chọn hành động Có thể mơ tả trò chơi song ma trận sau Cho hai ma trận A ∈ Rm×n B ∈ Rm×n Chi phí người chơi I cho phần tử aij ma trận A chi phí người chơi II cho phần tử bij ma trận B, i chiến lược đơn người chơi I j chiến lược đơn người chơi II, i = 1, , m, j = 1, , n Thành phần xi véctơ chiến lược ngẫu nhiên x ∈ Rm người chơi I xác suất mà người chơi I chọn chiến lược đơn i Véctơ chiến lược ngẫu nhiên người chơi II y ∈ Rn Từ suy m x ≥ 0, xi = i=1 n y ≥ 0, yj = j=1 Như vậy, chi phí kỳ vọng (trung bình) người chơi I xT Ay người chơi II xT By Ta ký hiệu trò chơi song ma trận G(A, B), A B ma trận chi phí người chơi I người chơi II Để làm ví dụ ta xét trò chơi G(A, B) với A = BT = 10 20 30 15 (3.4) Phần tử aij hàng i cột j ma trận A biểu thị chi phí người chơi I Chi phí người chơi II xác định phần tử bij ma trận B, tức phần tử aji ma trận A Ở i biểu thị phần tử i tập chiến lược đơn người chơi I j biểu thị phần tử j tập chiến lược đơn người chơi II Nói cách khác, i j chiến lược đơn mà người chơi I người chơi II lựa chọn Ma trận A B (3.4) lấy từ tài liệu [3], tr 287 Nghiệm trò chơi cho mục sau 38 Trạng thái trò chơi mà khơng người chơi lợi ích cao người thay đổi chiến lược ngẫu nhiên mình, đối phương giữ nguyên chiến lược họ, gọi nghiệm cân Nash (Nash equilibrium) Định nghĩa 3.1 (Cân Nash) Cặp chiến lược ngẫu nhiên (x∗ , y ∗ ), x∗ ∈ Rm y ∗ ∈ Rn , gọi nghiệm cân Nash m ∗ T ∗ ∗ T (x ) Ay ≤ x Ay với x ≥ xi = 1, (3.5) i=1 n ∗ T ∗ ∗ T (x ) By ≤ (x ) By với y ≥ yj = (3.6) j=1 Trò chơi song ma trận G(A, B) đưa tốn bù tuyến tính LCP với giả thiết phần tử A B dương Giả thiết không làm ảnh hưởng tới nghiệm cân trò chơi Nếu ma trận A B có phần tử âm thêm vào phần tử hai ma trận số dương đủ lớn làm cho hai ma trận trở thành dương Bài tốn LCP có dạng u = −em + Ay ≥ 0, x ≥ 0, xT u = 0, (3.7) v = −en + B T x ≥ 0, y ≥ 0, y T v = (3.8) em ∈ Rm en ∈ Rn véctơ có thành phần Nếu (x∗ , y ∗ ) nghiệm cân Nash (x , y ) nghiệm (3.7) - (3.8) với x = x∗ (x∗ )T By ∗ y = y∗ (x∗ )T Ay ∗ Ngược lại, (x , y ) nghiệm (3.7) - (3.8) (x∗ , y ∗ ) nghiệm cân Nash với x∗ = x y ∗ y = eTm x eTn y x y khác không giả thiết A B dương Véctơ q ma trận M tương ứng với tốn bù tuyến tính (3.7) - (3.8) có dạng q= −em −en ,M = A BT (3.9) 39 Khi tốn bù nhận viết thành w = q + M z, z ≥ 0, w ≥ 0, z T w = 0, z= 3.2.2 x y u v w = Nghiệm trò chơi song ma trận Thuật tốn Lemke-Howson ([3], tr 284 - 287) phương pháp hay dùng để tìm nghiệm cân Nash trò chơi song ma trận Đây thuật toán tổ hợp có dạng tương tự thuật tốn Lemke mơ tả chương trước để tìm nghiệm tốn bù tuyến tính LCP Định lý 3.1 ([7], tr 22) Thuật tốn Lemke-Howson cho phép tìm nghiệm tốn bù khơng suy biến LCP(q, M) tương ứng với trò chơi song ma trận Bây ta trở lại xét ví dụ (3.4) nêu mục (3.2) Áp dụng thuật tốn Lemke - Howson vào ví dụ ta nhận nghiệm z= 1 , 0, , 10 10 z˜ = 0, 1 , 0, 15 15 Nghiệm đầu biểu thị tình x = (1, 0) y = (1, 0), nghiệm thứ hai biểu thị tình x = (0, 1) y = (0, 1) Trong hai trường hợp người chơi chấp nhận chiến lược đơn, tức họ luôn chọn hành động Phương pháp Lemke - Howson khơng đảm bảo tìm nghiệm cân trò chơi song ma trận Trong ví dụ cho (3.4) có nghiệm mà thuật tốn Lemke - Howson khơng thể đạt tới, cụ thể 2 4 nghiệm z¯ = , , , nghĩa x = , y = , 90 45 90 45 5 5 Tóm lại, chương trình bày hai mơ hình trò chơi thường gặp ứng dụng tốn bù tuyến tính: trò chơi Stackelberg trò chơi song ma trận Có thể tìm nghiệm cân Nash trò chơi song ma trận nhờ giải tốn bù tuyến tính thích hợp 40 Kết luận Luận văn đề cập tới tốn bù tuyến tính LCP trường hợp riêng toán qui hoạch toán học với ràng buộc cân MPEC MPEC mơ tả tốn tối ưu, ràng buộc chủ chốt xác định bất đẳng thức biến phân hay hệ bù phụ thuộc tham số Bài tốn bù tuyến tính LCP có nhiều ứng dụng lý thuyết thực tiễn, đặc biệt qui hoạch tồn phương, trò chơi song ma trận, cân thị trường nhiều tốn kinh tế, kỹ thuật, cơng nghiệp vật lý khác Hai phương pháp tiêu biểu giải toán bù tuyến tính LCP trình bày: Phương pháp Lemke (1968) phương pháp điểm (Kojima, 1988) Phương pháp điểm chạy thời gian đa thức, thời gian chạy phương pháp Lemke hàm mũ (trường hợp xấu nhất) Luận văn kết thúc hai mơ hình trò chơi thường gặp ứng dụng tốn bù tuyến tính: Trò chơi Steckelberg trò chơi song ma trận Trò chơi Stackelberg liên quan chặt chẽ với toán qui hoạch toán học với ràng buộc cân MPEC mở rộng ý tưởng trò chơi Nash Nghiệm cân Nash trò chơi song ma trận tìm nhờ thiết lập giải toán bù tuyến tính thích hợp Tác giả luận văn hy vọng có dịp tiếp tục tìm hiểu sâu thêm toán bù với nhiều phương pháp ứng dụng khác tốn bù tuyến tính phi tuyến 41 Tài liệu tham khảo [1] T V Thiệu, Ng T T Thủy Giáo trình tối ưu phi tuyến Nxb Đại học Quốc gia Hà Nội, 2011 [2] M S Bazara et al., Nonlinear Programming: Theory and Algorithms 3rd Edition A John Willey & Sons, Inc., Publication, 2006 [3] R W Cottle, J-S Pang, and R E Stone The Linear Complementarity Problem Academic Press, San Diego, 1992 [4] O Facchinei and J-S Pang Finite-Dimensional Variational Inequalities and Complementarity Problems, Volume I Springer-Verlag, 2000 [5] S Leyffer Mathematical Programs with Complementarity Constraints SIAG/OPT Views-and-News, 14:15–18, 2003 [6] Z-Q Luo, J-S Pang, and D Ralph Mathematical Programs with Equili-brium Constraints Cambridge University Press, 1996 [7] D Olsson The Linear Complementarity Problem: Methods and Applications SF2827 Topics in Optimization, Spring 2010 ... Luận văn viết thành ba chương Chương Bài tốn bù tuyến tính" trình bày khái niệm tốn bù tuyến tính, nguồn gốc toán tồn nghiệm tốn Bài tốn bù có nhiều ứng dụng liên quan chặt chẽ với số toán dạng... quả, có tính chất kiến thiết, để tính tốn nghiệm cân Bài tốn bù tuyến tính có nhiều ứng dụng phong phú đa dạng Trong mục ta mô tả số ứng dụng cổ điển ứng dụng số tính chất đặc biệt ma trận M toán. .. nói đầu Chương Bài tốn bù tuyến tính 1.1 Bài tốn bù tuyến tính (LCP) 1.1.1 Mô tả toán 1.1.2 Nguồn gốc tốn bù tuyến tính 1.2 Quan hệ với toán VI MPEC