1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Các mô hình mạng 9 ppt

11 319 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 11
Dung lượng 237,26 KB

Nội dung

Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ……………………………… 180 Chú ý: Có thể chứng minh ñược rằng nếu hàm thỏa dụng u(.) là hàm lồi (lồi ngặt) thì π ≤ 0 (< 0) với mọi cuộc xổ số. Còn nếu hàm thỏa dụng u(.) là hàm lõm (lõm ngặt) thì π ≥ 0 (> 0) với mọi cuộc xổ số. Quay lại ví dụ ñang xét, do hàm u(.) với ñồ thị u 1 ñã xây dựng là lồi ngặt nên ta luôn có π = E(x/p) – u −1 (E(u/p)) < 0. ðiều này cũng có nghĩa là u(E(x/p)) < E(u/p), tức là ñộ thỏa dụng của kì vọng lợi nhuận là nhỏ hơn kì vọng thỏa dụng do cuộc xổ số mang lại. Trong trường hợp hàm thỏa dụng có ñồ thị u 3 (trên hình V.4) thì π > 0 và do ñó u(E(x/p)) > E(u/p), tức là ñộ thỏa dụng của kì vọng lợi nhuận là lớn hơn kì vọng thỏa dụng do cuộc xổ số mang lại. Từ các phân tích trên, ta thấy nếu người ra quyết ñịnh có hàm thỏa dụng u(.) lồi thì người ñó có tính “hướng mạo hiểm” (Risk Prone), còn nếu trái lại, u(.) lõm thì có tính “tránh mạo hiểm” (Risk Averse). Với u(.) tuyến tính, người ra quyết ñịnh có tính hợp lí (Risk Neutral). ðiều này ñược thể hiện khá trực quan trên hình V.4 nếu ta quy lại thang bậc giải thưởng: thay vì các cuộc xổ số “bảo hiểm” ñã nói tới trong ví dụ, chúng ta xét các cuộc xổ số thật sự với giải thưởng (ñược quy lại gốc tọa ñộ) thuộc vào khoảng 0 USD tới 150000 USD. Với ñồ thị u 1 ta thấy, ở các giải thưởng khá cao người ra quyết ñịnh có tính “hướng mạo hiểm” vẫn chỉ có ñộ thỏa dụng (mức ñộ thỏa mãn) thấp, chẳng hạn giải thưởng 149500 USD chỉ mang lại ñộ thỏa dụng là 0,7 và ñộ thỏa mãn tăng rất nhanh khi mức giải thưởng tăng sát 150000 USD. ðồ thị u 3 cũng có thể ñược phân tích tương tự ñể thấy tính “tránh mạo hiểm” của người ra quyết ñịnh. Ví dụ 2: Một nhà ñầu tư có 10000 USD có thể ñầu tư vào thị trường chứng khoán. Anh ta có thể lựa chọn hai công ti X và Y ñể ñầu tư (giả sử rằng hai công ti X và Y là hoàn toàn ñộc lập với nhau). Theo tính toán sơ bộ và dự ñoán của chuyên gia thì nhà ñầu tư có thể nhận ñược gấp ñôi số tiền ñầu tư với xác suất 0,6 và có thể mất ñi một nửa số tiền ñầu tư với xác suất 0,4 khi ñầu tư vào một trong hai công ti trên. Anh ta xem xét các lựa chọn sau: - ðầu tư toàn bộ số tiền vào một trong hai công ti (phương án A). - ðầu tư 5000 USD vào công ti X (phương án B). - ðầu tư 5000 USD vào công ti X và 5000 USD vào công ti Y (phương án C). - Không ñầu tư vào hai công ti trên (phương án D). Ngoài ra, giả sử ñã biết hàm thoả dụng của người ñầu tư tại một số mức lợi nhuận: u(−5000) = 0; u(−2500) = 0,2; u(0) = 0,4; u(2500) = 0,7; u(5000) = 0,9; u(10000) = 1. Hãy xác ñịnh phương án ñầu tư dựa trên tiêu chuẩn kì vọng thoả dụng tối ña. Tính kì vọng thoả dụng cho phương án A: E(u/p A ) = 0,6×u(10000) + 0,4×u(−5000) = 0,6. Tương tự, E(u/p B ) = 0,6×u(5000) + 0,4×u(−2500) = 0,6×0,9 + 0,4×0,2 = 0,62 Nhằm tính kì vọng thoả dụng cho phương án C, chúng ta sử dụng hàm sinh (0,6a 1 + 0,4 b 1 )(0,6a 2 + 0,4 b 2 ) = 0,36 a 1 a 2 + 0,24a 1 b 2 + 0,24b 1 a 2 + 0,16b 1 b 2 ñể xác ñịnh ñược các xác suất: xác suất ñầu tư vào cả hai công ti cùng lãi là 0,36; xác suất ñầu tư vào công ti X lãi và công ti Y lỗ là 0,24; xác suất ñầu tư vào công ti X lỗ và công ti Y lãi là 0,24; xác suất ñầu tư vào cả hai công ti cùng lỗ là 0,16. Vậy E(u/p C ) = 0,36×u(10000) + 0,24×u(2500) + 0,24×u(2500) + 0,16×u(−5000) = 0,36×1 + 0,24×0,7 + 0,24×0,7 + 0,16×0 = 0,696. Dễ thấy E(u/p D ) = 0,4. Do ñó, dựa trên tiêu chuẩn kì vọng thỏa dụng tối ña, ta chọn phương án C ñể ñầu tư. Chú ý: Ra quyết ñịnh dựa trên tiêu chuẩn kì vọng thoả dụng tối ña là một phương pháp ra quyết ñịnh trong môi trường rủi ro. Cái khó nhất trong phương pháp này là thiết lập ñược hàm thoả dụng. Ví dụ 3: Một nhà ñầu tư nghiên cứu về cổ phiếu của một công ti và ñánh giá rằng các cổ phiếu sẽ tăng giá trong thời gian tới. Hiện tại một cổ phiếu ñược bán ra với giá 50 USD. Thông qua người môi giới, nhà ñầu tư ñược giới thiệu ñể mua một hợp ñồng như sau: mua 4 USD/quyền mua một cổ phiếu với giá 48 USD/cổ phiếu trong vòng hai tháng nữa. Nhà ñầu tư cũng ñược ñề nghị một hợp ñồng khác: mua 8 USD/quyền mua một cổ phiếu với giá 48 USD/cổ phiếu trong vòng bốn tháng nữa. Nhà ñầu tư thu thập ñược thông tin về phân phối xác suất của giá cổ phiếu và tổng hợp trong bảng VI.9. Bảng VI.9. Bảng phân phối xác suất giá cổ phiếu Xác suất của giá cổ phiếu Giá cổ phiếu Sau hai tháng Sau bốn tháng 42 0,05 0,00 48 0,10 0,05 52 0,15 0,10 56 0,20 0,15 60 0,50 0.30 64 0,00 0,40 Nhà ñầu tư muốn xem xét việc mua quyền mua một số cổ phiếu trong thời hạn các hợp ñồng trên. Nếu giá cổ phiếu trên thị trường chứng khoán là cao hơn 48 USD nhà ñầu tư sẽ mua với giá 48 USD/cổ phiếu (ñã mua quyền mua) và bán ngay chúng theo giá thị trường. Còn nếu giá cổ phiếu không vượt quá 48 USD/cố phiếu trong thời hạn hợp ñồng thì toàn bộ số tiền mua quyền mua các cổ phiếu sẽ bị thất thu. Nhà ñầu tư muốn lựa chọn một trong ba phương án sau: Phương án A: Mua quyền mua 100 cổ phiếu trong hợp ñồng thứ nhất. Phương án B: Mua quyền mua 100 cổ phiếu trong hợp ñồng thứ hai. Phương án C: Không mua gì cả. Nhà ñầu tư là người tương ñối bảo thủ, có tính cách “tránh mạo hiểm” với hàm thỏa dụng ñược xác ñịnh tại một số mức lợi nhuận như trong bảng VI.10. Bảng VI.10. Giá trị hàm thỏa dụng Lợi nhuận ðộ thoả dụng 1200 1 800 0,8 400 0,7 Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ……………………………… 182 0 0,6 -400 0,1 -800 0 Xét phương án A, ta có E(u/p A ) = 0,05×u(−400) + 0,1×u(−400) + 0,15×u(0) + 0,20×u(400) + 0,50×u(800) + 0×u(1200) = 0,645. Xét phương án B, ta có E(u/p B ) = 0×u(−800) + 0,05×u(−800) + 0,1×u(−400) + 0,15×u(0) + 0,30×u(400) + 0,40×u(800) = 0,63. Với phương án C, E(u/p C ) = 0,6.Vậy nhà ñầu tư quyết ñịnh chọn phương án A. Chú ý: Việc dự báo phân phối xác suất của giá các cổ phiếu cũng là một vấn ñề khá phức tạp, nếu các xác suất này chưa biết thì có thể coi là chúng bằng nhau theo nguyên lí lí lẽ không ñầy ñủ. Ngoài ra, với số liệu của ví dụ trên cũng có thể xem xét ñể lựa chọn nhiều phương án ñầu tư khác. 5. LÍ THUYẾT TRÒ CHƠI VÀ ỨNG DỤNG 5.1. Một số khái niệm cơ bản của lí thuyết trò chơi Ở mục 1, các tiêu chuẩn ra quyết ñịnh ñã giúp người ra quyết ñịnh ñưa ra các lựa chọn hợp lí khi ñối diện với ñối thủ là môi trường bất ñịnh, không có trí tuệ. Trong lí thuyết trò chơi, ta sẽ học cách ñưa quyết ñịnh khi phải ñối diện với một hay nhiều ñối thủ có trí thông minh. Trong các trò chơi, ñược hiểu theo nghĩa rộng, các ñối thủ cạnh tranh nhau ñều coi là có trí thông minh như nhau, ñều mong muốn lựa chọn cho mình từ một số hữu hạn hoặc vô hạn các phương án hành ñộng một phương án hành ñộng hợp lí nhằm ñạt ñược thành tích tốt nhất hay lợi nhuận tốt nhất. Tuy nhiên, lí thuyết trò chơi, trước hết là một lĩnh vực toán học, không có mục tiêu nghiên cứu về việc làm thế nào ñể thắng ñược ñối thủ, mà tập trung nghiên cứu khảo sát các mâu thuẫn ñối kháng khách quan của trò chơi, nhằm giải quyết ñược vấn ñề phát sinh ñứng trên quyền lợi của tất cả các bên tham gia. Các ví dụ ñiển hình về lí thuyết trò chơi là về các chiến lược phát triển sản phẩm, dịch vụ, thị trường trong nền kinh tế hàng hóa cạnh tranh khu vực và toàn cầu, các chiến lược quân sự Sau ñây là một số khái niệm cơ bản hay các thuật ngữ then chốt của lí thuyết trò chơi: − ðối thủ gọi là người chơi. − Một phương án hành ñộng của một người chơi ñược gọi là một chiến lược. − Khi các ñối thủ ñã lựa chọn các chiến lược hành ñộng thì trò chơi cho ta một kết cục thường ñịnh lượng bằng các số ñược gọi là một pay-off. Những tổ hợp chiến lược khác nhau từ phía các người chơi có thể dẫn tới các kết cục hay các pay-off khác nhau của trò chơi. − Một trò chơi với hai người chơi tham gia, mà trong ñó lợi nhuận mà người này thu ñược chính bằng thất thu của người kia, ñược gọi là trò chơi hai người - tổng không. Ví dụ 1: Hai người chơi A và B tham gia vào trò chơi, mỗi người có quyền chọn một trong hai mặt của ñồng xu: chọn mặt có số S (chiến lược 1) hoặc mặt không có số N (chiến lược 2). Khi ñó có thể xảy ra các kết cục sau: (S, S) - tức là người thứ nhất và người thứ hai ñều chọn mặt có số, (S, N) - người thứ nhất chọn mặt có số và người thứ hai chọn mặt không có số, (N, S) và (N, N). Các kết cục này ñược ñịnh lượng bởi các pay-off: Nếu kết cục là (S, S) hoặc (N, N) thì A ñược coi là thắng 1 ñiểm và B bị mất 1 ñiểm. Còn nếu kết cục là (S, N) hoặc (N, S) thì A mất 1 ñiểm và B ñược 1 ñiểm. ðây là trò chơi hai người - tổng không, với các dữ kiện ñược tổng hợp bởi ma trận cỡ 2×2 như sau: Người chơi B S N Người chơi A S N 1 1 1 1 + −     − +   = ij 2 2 a ×     , v ớ i các pay-off mang d ấ u + bi ể u th ị A th ắ ng (do B thua), còn các pay-off mang d ấ u - bi ể u th ị anh thua (do B th ắ ng). − Ma tr ậ n sau ñ ây ñượ c g ọ i là ma trận trò chơi c ủ a trò ch ơ i hai ng ườ i - t ổ ng không, khi ng ườ i ch ơ i th ứ nh ấ t có th ể l ự a ch ọ n hành ñộ ng theo m ộ t trong m chi ế n l ượ c t ạ i m ỗ i th ờ i ñ i ể m, còn ng ườ i ch ơ i th ứ hai có th ể l ự a ch ọ n hành ñộ ng theo m ộ t trong n chi ế n l ượ c t ạ i m ỗ i th ờ i ñ i ể m: G = 11 12 1n 21 22 2n m1 m2 mn a a a a a a a a a             = ij m n a ×     trong ñ ó a ij là pay-off khi ng ườ i th ứ nh ấ t ch ơ i chi ế n l ượ c i còn ng ườ i th ứ hai ch ơ i chi ế n l ượ c j c ủ a mình. a ij có d ấ u + n ế u ng ườ i th ứ nh ấ t th ắ ng và có d ấ u - n ế u ng ườ i th ứ nh ấ t thua. Không làm gi ả m tính t ổ ng quát, ta gi ả s ử trong ma tr ậ n trò ch ơ i G không có hai hàng hay hai c ộ t gi ố ng h ệ t nhau. − N ế u a kj ≥ a sj , ∀ j = 1, 2, , n, k ≠ s và có ít nh ấ t m ộ t ch ỉ s ố j* sao cho kj* sj* a a > thì ta nói hàng k là trội hơn hàng s . Lúc ñ ó có th ể b ỏ hàng s ra kh ỏ i ma tr ậ n trò ch ơ i G, vì ng ườ i th ứ nh ấ t s ẽ không bao gi ờ ch ơ i chi ế n l ượ c s. Còn n ế u a ik ≥ a is , ∀ i = 1, 2, , Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ……………………………… 184 n, k ≠ s và có ít nh ấ t m ộ t ch ỉ s ố i* sao cho i*k i*s a a > thì ta nói cột k là trội hơn cột s . Lúc ñ ó có th ể b ỏ c ộ t k ra kh ỏ i ma tr ậ n trò ch ơ i G, vì ng ườ i th ứ hai s ẽ không bao gi ờ ch ơ i chi ế n l ượ c k. Ví dụ 2: Xét trò chơi hai người - tổng không cho bởi ma trận trò chơi sau Người chơi B Người chơi A 8 2 9 6 5 7 3 2 6 7 3 4      −  9 8 8 3 − 5 18 10 10       . Lúc ñó, có thể gạch bỏ hàng 3 ra khỏi ma trận trò chơi, sau ñó cột 4 ra khỏi ma trận trò chơi ñể rút gọn ma trận trên. 5.2. Trò chơi hai người - tổng không với chiến lược thuần nhất Ví dụ 3: Xét trò chơi hai người - tổng không cho bởi ma trận trò chơi sau Người chơi B Người chơi A 8 2 9 6 5 7 7 3 4     −  5 18 10      Giải thích: Trong ma trận trò chơi trên a 11 = 8, tức là nếu A chơi chiến lược 1 của mình và B chơi chiến lược 1 của mình thì A thắng 8 còn B thua 8 (ñơn vị). Các pay-off khác ñược giải thích tương tự. Ở ñây, m = 3 và n = 4. Ta thấy nếu A chơi chiến lược 1 của mình thì B sẽ chơi chiến lược 2 ñể giảm thiểu tối ña lợi nhuận của A và thất thu của B với pay - off tương ứng là 4 j 1 Min = {a 1j } = 2. Nếu A chơi chiến lược 2 thì với lí do tương tự B chơi chiến lược 2 ñể có pay - off là 4 j 1 Min = {a 2j } = 5. còn nếu A chơi chiến lược 3 thì B chơi chiến lược 3 dẫn tới pay - off là 4 j 1 Min = {a 3j } = -4. Do ñó ñể lợi nhuận là lớn nhất có thể, A phải thực hiện quy tắc Maximin như sau: Chọn chiến lược k ứng với a kl = 3 i 1 Max = { 4 j 1 Min = {a ij }} = 3 i 1 Max = {2, 5, -4} = 5 = a 22 . Như vậy A lựa chọn chiến lược 2. Chiến lược này ñược gọi là chiến lược Maximin. Về phía người chơi B, bằng lập luận tương tự, ñể thất thu là ít nhất có thể, phải thực hiện quy tắc Minimax như sau: Chọn chiến lược s ứng với a qs = 4 j 1 Min = { 3 i 1 Max = {a ij }} = 4 j 1 Min = {8, 5, 9, 10} = 5 = a 22 . Do ñó, B lựa chọn chiến lược 2. Chiến lược này ñược gọi là chiến lược Minimax. ðịnh lí 1: Với mọi ma trận trò chơi G = ij m n a ×     c ủ a trò ch ơ i hai ng ườ i - t ổ ng không, b ấ t ñẳ ng th ứ c sau ñ ây luôn ñ úng: n j 1 Min = { m i 1 Max = {a ij }} ≥ m i 1 Max = { n j 1 Min = {a ij }} (*) Hệ quả 1: N ế u v = n j 1 Min = { m i 1 Max = {a ij }} = m i 1 Max = { n j 1 Min = {a ij }} = a ks (**) thì ng ườ i ch ơ i th ứ nh ấ t s ẽ quy ế t ñị nh ch ơ i chi ế n l ượ c k, còn ng ườ i ch ơ i th ứ hai s ẽ quy ế t ñị nh ch ơ i chi ế n l ượ c s. N ế u ñ i ề u ki ệ n (**) ñượ c th ỏ a mãn thì trò ch ơ i ñượ c g ọ i là trò ch ơ i v ớ i chi ế n l ượ c thu ầ n nh ấ t ( Pure Strategy ), v ñượ c g ọ i là giá tr ị c ủ a trò ch ơ i ( Game Value ), còn a ks ñượ c g ọ i là ñ i ể m yên ng ự a ( Saddle Point ). Có th ể ch ỉ ra các ví d ụ khi ma tr ậ n trò ch ơ i có nhi ề u h ơ n m ộ t ñ i ể m yên ng ự a. 5.3. Trò chơi hai người - tổng không với chiến lược hỗn hợp Ví dụ 4: Xét trò chơi hai người - tổng không cho bởi ma trận trò chơi sau ñây (với m = n = 3). Người chơi B Người chơi A 6 2 0 0 6 2 1 0 6         −   Chúng ta dễ dàng tính ñược ngay: v = n j 1 Min = { m i 1 Max = {a ij }} = 6, còn v = m i 1 Max = { n j 1 Min = {a ij }} = 0. Do v > v , nên trong ví dụ này ñ i ể m yên ng ự a không t ồ n t ạ i và trò ch ơ i không ph ả i là trò ch ơ i v ớ i chi ế n l ượ c thu ầ n nh ấ t. Gi ả s ử r ằ ng trò ch ơ i trong ví d ụ này ñượ c l ặ p l ạ i nhi ề u l ầ n. Lúc ñ ó, n ế u A luôn ch ỉ ch ơ i chi ế n l ượ c Maximin thì anh ta ch ỉ luôn thu ñượ c l ợ i nhu ậ n là 0. Còn n ế u B luôn ch ỉ ch ơ i chi ế n l ượ c Minimax thì anh ta s ẽ luôn b ị th ấ t thu là 6. Nh ư v ậ y, ñể t ă ng l ợ i nhu ậ n trung bình trong m ộ t l ầ n ch ơ i lên trên 0, A có th ể ngh ĩ t ớ i m ộ t chi ế n l ượ c h ỗ n h ợ p: th ự c hi ệ n m ộ t trong b ố n chi ế n l ượ c c ủ a mình m ộ t cách xen k ẽ v ớ i các t ầ n su ấ t (xác xu ấ t th ự c nghi ệ m) nh ấ t ñị nh, lúc chi ế n l ượ c này lúc chi ế n l ượ c khác. V ề ph ầ n B, ñể gi ả m th ấ t thu trung bình trong m ộ t l ầ n ch ơ i xu ố ng d ướ i 6, m ộ t chi ế n l ượ c h ỗ n h ợ p c ũ ng c ầ n ñượ c xem xét. Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ……………………………… 186 ðịnh nghĩa 1: Xét trò chơi hai người - tổng không. Tại mỗi thời ñiểm, người thứ nhất có thể hành ñộng theo một trong m chiến lược a 1 , a 2 , , a m , còn người thứ hai có thể hành ñộng theo một trong n chiến lược b 1 , b 2 , , b n . Một chiến lược hỗn hợp của người thứ nhất là: chơi chiến lược a 1 với xác suất x 1 , chiến lược a 2 với xác suất x 2 , , chiến lược a m với xác suất x m , với m i i i 1 x 1, i, x 0 = = ∀ ≥ ∑ . Còn một chiến lược hỗn hợp của người thứ hai là: chơi chiến lược b 1 với xác suất y 1 , chiến lược b 2 với xác suất y 2 , , chiến lược b n với xác suất y n với n j j j 1 y 1, j, y 0 = = ∀ ≥ ∑ . Quay l ạ i ví d ụ nêu trên, ñể xác ñị nh ñượ c chi ế n l ượ c h ỗ n h ợ p t ố t nh ấ t c ủ a mình, ng ườ i ch ơ i A c ầ n tìm ñượ c phân ph ố i xác su ấ t x = (x 1 , x 2 , , x m ) ñể c ự c ñạ i hóa kì v ọ ng pay − off th ấ p nh ấ t trong các c ộ t, t ứ c là c ầ n gi ả i bài toán sau: 1 m m m m i1 i i2 i in i x =(x , ,x ) i 1 i 1 i 1 a x , a x , , a x , Max Min = = =     ∑ ∑ ∑         (***) ð ây là tiêu chu ẩ n Maximin kì v ọ ng l ợ i nhu ậ n c ủ a t ừ ng c ộ t. ð i ề u này có ngh ĩ a là: N ế u m ộ t phân ph ố i xác su ấ t x = (x 1 , x 2 , , x m ) ñ ã ñượ c ch ọ n thì ng ườ i ch ơ i B luôn ch ọ n ch ơ i chi ế n l ượ c ứ ng v ớ i c ộ t có kì v ọ ng pay − off th ấ p nh ấ t ñể gi ả m thi ể u th ấ t thu c ủ a mình. Do ñ ó, ng ườ i ch ơ i A b ắ t bu ộ c ph ả i ch ọ n phân ph ố i xác su ấ t x theo tiêu chu ẩ n Maximin. Còn ñể xác ñị nh ñượ c chi ế n l ượ c h ỗ n h ợ p t ố t nh ấ t c ủ a mình, ng ườ i ch ơ i B c ầ n tìm ñượ c phân ph ố i xác su ấ t y = (y 1 , y 2 , , y n ) ñể c ự c ti ể u hóa kì v ọ ng pay − off cao nh ấ t trong các hàng, t ứ c là c ầ n gi ả i bài toán sau: 1 n n n n 1j j 2 j j mj j y =(y , ,y ) j 1 j 1 j 1 a y , a y , , a y , MaxMin = = =                 ∑ ∑ ∑ (****) ð ây là tiêu chu ẩ n Minimax kì v ọ ng th ấ t thu c ủ a t ừ ng hàng. ð i ề u này có ngh ĩ a là: N ế u m ộ t phân ph ố i xác su ấ t y = (y 1 , y 2 , , y n ) ñ ã ñượ c ch ọ n thì ng ườ i ch ơ i A luôn ch ọ n ch ơ i chi ế n l ượ c ứ ng v ớ i c ộ t có kì v ọ ng pay - off cao nh ấ t ñể t ă ng l ợ i nhu ậ n c ủ a mình. Do ñ ó, ng ườ i ch ơ i B b ắ t bu ộ c ph ả i ch ọ n phân ph ố i xác su ấ t y theo tiêu chu ẩ n Maximin. Chú ý: N ế u ch ỉ xét các tr ườ ng h ợ p véc t ơ phân ph ố i xác su ấ t x = (x 1 , x 2 , , x m ) có ñ úng m ộ t t ọ a ñộ b ằ ng 1, còn các t ọ a ñộ b ằ ng 0 thì (***) chính là quy t ắ c Maximin trong m ụ c 5.2. Còn n ế u ch ỉ xét các tr ườ ng h ợ p véc t ơ phân ph ố i xác su ấ t y = (y 1 , y 2 , , y n ) có ñ úng m ộ t t ọ a ñộ b ằ ng 1, còn các t ọ a ñộ b ằ ng 0 thì (****) chính là quy t ắ c Minimax trong m ụ c 5.2. ðịnh lí 2: V ớ i m ọ i phân ph ố i xác su ấ t x = (x 1 , x 2 , , x m ) và m ọ i phân ph ố i xác su ấ t y = (y 1 , y 2 , , y n ) ta luôn có: 1 n n n n 1j j 2 j j mj j y =(y , ,y ) j 1 j 1 j 1 a y , a y , , a y , Max Min = = =                 ∑ ∑ ∑ ≥ 1 m m m m i1 i i2 i in i x =(x , ,x ) i 1 i 1 i 1 a x , a x , , a x , Max Min = = =             ∑ ∑ ∑ . Ngoài ra, d ấ u b ằ ng trong b ấ t ñẳ ng th ứ c trên x ả y ra n ế u 1 2 m x* (x ,x , , x ) ∗ ∗ ∗ = và 1 2 n y* (y , y , , y ) ∗ ∗ ∗ = là các phân ph ố i xác su ấ t t ố i ư u c ủ a hai bài toán (***) và (****). Hệ quả 2: N ế u 1 2 m x* (x ,x , , x ) ∗ ∗ ∗ = và 1 2 n y* (y , y , , y ) ∗ ∗ ∗ = là các phân ph ố i xác su ấ t t ố i ư u c ủ a hai bài toán (***) và (****) thì: v* = 1 n n n n 1j j 2j j mj j y =(y , ,y ) j 1 j 1 j 1 a y , a y , , a y , Max Min = = =                 ∑ ∑ ∑ = 1 m m m m i1 i i2 i in i x =(x , ,x ) i 1 i 1 i 1 a x , a x , , a x , Max Min = = =             ∑ ∑ ∑ = m n ij i j i=1 j=1 a x y ∗ ∗ ∑ ∑ . Giá tr ị v* trên ñ ây ñượ c g ọ i là giá tr ị c ủ a trò ch ơ i hai ng ườ i - t ổ ng không v ớ i chi ế n l ượ c h ỗ n h ợ p ( Mixed Strategies ). ðể xác ñị nh chi ế n l ượ c h ỗ n h ợ p t ố i ư u 1 2 m x* (x ,x , , x ) ∗ ∗ ∗ = , chúng ta c ầ n l ầ n l ượ t xét các bài toán sau: Bài toán 1a: 1 m m m m i1 i i2 i in i x =(x , ,x ) i 1 i 1 i 1 a x , a x , , a x , Max Min = = =     ∑ ∑ ∑         v ớ i m i i i 1 x 1, i, x 0 = = ∀ ≥ ∑ . ðư a bài toán 1a v ề bài toán sau: Bài toán 1b: Max z = v, v ớ i các ràng bu ộ c m ij i i 1 a x v = ≥ ∑ , ∀ j; m i i i 1 x 1, i, x 0 = = ∀ ≥ ∑ . Không làm gi ả m tính t ổ ng quát, gi ả s ử v > 0 (n ế u trái l ạ i, có th ể c ộ ng vào t ấ t c ả các ph ầ n t ử c ủ a ma tr ậ n trò ch ơ i m ộ t s ố d ươ ng thích h ợ p). Th ự c hi ệ n phép ñổ i bi ế n X i = x i /v, ∀ i = 1, 2, , m, v ớ i chú ý r ằ ng do m i i 1 x 1 = = ∑ nên 1/v = u = m i i 1 X = ∑ . V ậ y cu ố i cùng chúng ta có bài toán sau: Bài toán 1c: Min u = m i i 1 X = ∑ , v ớ i các ràng bu ộ c m ij i i 1 a X 1 = ≥ ∑ , ∀ j; i i, X 0 ∀ ≥ . Bài toán 1c là BTQHTT có th ể gi ả i ñượ c v ớ i ph ầ n m ề m thích h ợ p s ẵ n có. ðể xác ñị nh chi ế n l ượ c h ỗ n h ợ p t ố i ư u 1 2 n y* (y , y , , y ) ∗ ∗ ∗ = chúng ta c ầ n xem xét l ầ n l ượ t các bài toán sau: Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ……………………………… 188 Bài toán 2a: 1 n n n n 1j j 2 j j mj j y =(y , ,y ) j 1 j 1 j 1 a y , a y , , a y , Max Min = = =     ∑ ∑ ∑         v ớ i n j j j 1 y 1, j, y 0 = = ∀ ≥ ∑ . ðư a bài toán 2a v ề bài toán sau: Bài toán 2b: Min z = w, v ớ i các ràng bu ộ c n ij j j 1 a y w = ≤ ∑ , ∀ i; n j j j 1 y 1, j, y 0 = = ∀ ≥ ∑ . Không làm gi ả m tính t ổ ng quát, gi ả s ử w > 0 (n ế u trái l ạ i, có th ể c ộ ng vào t ấ t c ả các ph ầ n t ử c ủ a ma tr ậ n trò ch ơ i m ộ t s ố d ươ ng thích h ợ p). Th ự c hi ệ n phép ñổ i bi ế n Y j = y j/ w, ∀ j = 1, 2, , n, v ớ i chú ý r ằ ng do n j j 1 y 1 = = ∑ nên 1/w = u’ = n j j 1 Y = ∑ . V ậ y cu ố i cùng chúng a có bài toán sau: Bài toán 2c: Max u’ = n j j 1 Y = ∑ , v ớ i các ràng bu ộ c n ij j j 1 a Y 1 = ≤ ∑ , ∀ i; j j, Y 0 ∀ ≥ . Bài toán 2c c ũ ng là BTQHTT nên có th ể gi ả i ñượ c v ớ i ph ầ n m ề m thích h ợ p s ẵ n có. Ta th ấ y bài toán 2c và bài toán 1c t ạ o thành c ặ p bài toán ñố i ng ẫ u, nên theo các ñị nh lí ñố i ng ẫ u ta s ẽ có Max u’ ≤ Min u, d ấ u b ằ ng x ả y ra t ạ i các c ặ p ph ươ ng án t ố i ư u t ươ ng ứ ng. D ự a trên nh ậ n xét này có th ể ch ứ ng minh ñượ c ñị nh lí ñ ã nêu trên ñ ây. Quay l ạ i ví d ụ ñ ã xét, v ớ i trò ch ơ i hai ng ườ i - t ổ ng không cho b ở i ma tr ậ n trò ch ơ i sau Ng ườ i ch ơ i B Ng ườ i ch ơ i A 6 2 0 0 6 2 1 0 6         −   Tr ướ c h ế t, ñể cho v > 0 c ũ ng nh ư w > 0 chúng ta c ộ ng t ấ t c ả các pay − off v ớ i 2, ñể ñượ c ma tr ậ n trò ch ơ i sau ñ ây: 8 4 2 2 8 4 1 2 8           ðể gi ả i trò ch ơ i, c ầ n thi ế t l ậ p các bài toán t ươ ng ứ ng (v ớ i các bài toán 1c và 2c): Bài toán 1: Min u = X 1 + X 2 + X 3 , v ớ i các ràng bu ộ c 1 2 3 1 2 3 1 2 3 1 2 3 8X 2X X 1 4X 8X 2X 1 2X 4X 8X 1 X ,X , X 0 + + ≥   + + ≥   + + ≥   ≥  Bài toán 2: Max u’= Y 1 + Y 2 + Y 3 , v ớ i các ràng bu ộ c 1 2 3 1 2 3 1 2 3 1 2 3 8Y 4Y 2Y 1 2Y 8Y 4Y 1 Y 2Y 8Y 1 Y ,Y ,Y 0 + + ≤   + + ≤   + + ≤   ≥  K ế t qu ả gi ả i các bài toán này b ằ ng ph ầ n m ề m Lingo nh ư sau: Objective value u: 0.2295918 Variable Value Reduced Cost X1 0.1020408 0.0000000E+00 X2 0.5612245E–01 0.0000000E+00 X3 0.7142857E–01 0.0000000E+00 Objective value u’: 0.2295918 Variable Value Reduced Cost Y1 0.7142857E–01 0.0000000E+00 Y2 0.5612245E–01 0.0000000E+00 Y3 0.1020408 0.0000000E+00 V ậ y giá tr ị c ủ a trò ch ơ i trên là v* = 1/ Min u − 2 =1/ Max u ′ − 2 = 2.355556252 = 106/45. Chi ế n l ượ c h ỗ n h ợ p c ủ a ng ườ i ch ơ i th ứ nh ấ t ñượ c tìm theo công th ứ c: 3 * i i i i 1 x X / X ∗ ∗ = = ∑ v ớ i i =1, 2, 3. T ừ ñ ó có: 1 x ∗ = 0.44444441 = 20/45, 2 x ∗ = 0.24444447 = 11/45, 3 x ∗ = 0.31111113 = 14/45. Chi ế n l ượ c h ỗ n h ợ p c ủ a ng ườ i ch ơ i th ứ hai ñượ c tìm theo công th ứ c: 3 j j j j 1 y Y / Y ∗ ∗ ∗ = = ∑ v ớ i i =1, 2, 3. T ừ ñ ó có: 1 y ∗ = 0.31111113 = 14/45, 2 y ∗ = 0.24444447 = 11/45, 3 y ∗ = 0.44444441 = 20/45. 5.4. Lời giải bằng ñồ thị cho các trò chơi cỡ 2× ×× ×N hoặc M× ×× ×2 Ví dụ 5: Xét trò chơi hai người - tổng không với ma trận trò chơi cỡ 2×4 sau [...]... x1), chúng ta có các kì v ng pay − off c a ngư i chơi A khi ngư i chơi B chơi các chi n lư c (thu n nh t) khác nhau như sau: − N u B chơi chi n lư c 1 (b1) thì kì v ng pay − off c a A là E(X/b1) = 2x1 + 3(1−x1) = −x1 + 3 − N u B chơi chi n lư c 2 (b2) thì kì v ng pay − off c a A là E(X/b2) = x1 + 2 − N u B chơi chi n lư c 3 (b3) thì kì v ng pay − off c a A là E(X/b3) = −7x1 + 6 V ñ th c a các kì v ng pay... kì v ng pay − off trên (hình VI.5) ta th y ñư ng vi n ñ m nét phía dư i cho bi t Min {E(X/b1), E(X/b2), E(X/b3)} tùy theo x1 ñã ch n Như v y ph i ∗ ch n x1 ng v i Max {Min {E(X/b1), E(X/b2), E(X/b3)} V y x1 = 0,5 như ñã ch ra ∗ trên ñ th Do ñó x ∗ = 1 − x1 = 0,5 và giá tr c a trò chơi trên là 5/2 2 E 6 §iÓm Maximin E(X/b3) 3 E(X/b2) E(X/b1) 5/2 • 2 0 0.5 1 x Hình VI.5 ð th các kì v ng pay − off E(X/bi)... h n h p (y1, y2, y3) cho ngư i chơi B, ta nh n th y các u ñi qua ñi m cao nh t (1/2, 5/2) c a ñư ng vi n ñ m nét xây d ng chi n lư c h n h p d a trên c b1, b2 l n b3 Có ng kì v ng pay − off b t kì v i các h s góc trái d u ñ u i ưu c a B Như v y, ch c n xét hai trư ng h p sau: Trư ng ð i h c Nông nghi p Hà N i – Giáo trình V n trù h c ……………………………… 190 . sát các mâu thuẫn ñối kháng khách quan của trò chơi, nhằm giải quyết ñược vấn ñề phát sinh ñứng trên quyền lợi của tất cả các bên tham gia. Các ví dụ ñiển hình về lí thuyết trò chơi là về các. 1, các tiêu chuẩn ra quyết ñịnh ñã giúp người ra quyết ñịnh ñưa ra các lựa chọn hợp lí khi ñối diện với ñối thủ là môi trường bất ñịnh, không có trí tuệ. Trong lí thuyết trò chơi, ta sẽ học cách. − Khi các ñối thủ ñã lựa chọn các chiến lược hành ñộng thì trò chơi cho ta một kết cục thường ñịnh lượng bằng các số ñược gọi là một pay-off. Những tổ hợp chiến lược khác nhau từ phía các người

Ngày đăng: 22/07/2014, 19:21

TỪ KHÓA LIÊN QUAN

w