Chiến lƣợc từng bƣớc có thể xem là chiến thuật của mỗi ngƣời chơi sau khi phân tích hành vi của đối phƣơng sẽ cố gắng có biện pháp tốt nhất đáp ứng lại sao cho thắng lợi của mình lớn nhất hoặc thất bại của mình ít nhất.
Ngƣời chơi thứ nhất (ngƣời đi bƣớc đầu) sử dụng một trong các chiến lƣợc của mình. Ngƣời chơi thứ hai đáp lại bằng chiến lƣợc sao cho cực tiểu hóa thắng lợi của ngƣời thứ nhất. Đến lƣợt mình ngƣời thứ nhất lại tìm chiến lƣợc sao cho cực đại hóa tổng thắng lợi của mình, và ngƣời thứ hai lại tìm chiến lƣợc sao cho cực tiểu hóa tổng thắng lợi trƣớc đó của ngƣời thứ nhất...
Một cách tổng quát, mỗi ngƣời chơi đều đáp lại từng bƣớc đi của đối phƣơng bằng chiến lƣợc từng bƣớc của mình sao cho nó là tối ƣu theo nghĩa là tổng thắng lợi qua các đi trƣớc đó của mình là lớn nhất, hoặc tổng thất bại của mình nhỏ nhất đối với mọi bƣớc đi trƣớc đó của đối phƣơng.
Phƣơng pháp lặp Brown đƣợc trình bày nhƣ sau: Cho ma trận trò chơi A có m dòng và n cột:
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 11 12 1 j 1n 21 22 2 j 2 n i1 i 2 ij in m1 m 2 mj mn a a ... a ... a a a ... a ... a ... A = a a ... a ... a ... a a ... a ... a
1. Giả sử ngƣời thứ nhất chọn dòng i1. Ta viết dòng i1 xuống dƣới ma trận A và gọi nó là dòng (m + 1), tức là
1
m+1. j i j
a = a ; j = 1, n.
2. Để cực tiểu hóa thắng lợi của ngƣời thứ nhất, ngƣời thứ hai chọn cột
1 j , trong đó: 1 m+1. j m+1. j 1 a = min a j n Phần tử 1 m+1. j a đƣợc đánh dấu thành ' 1 * m+1. j
a và cột j1 đƣợc viết vào bên phải ma trận A thành cột thứ (n + 1), tức là:
1
. 1 ij
i n
a a , i 1, m
3. Thấy ngƣời thứ hai chọn cột j1 nên để cực đại hóa tổng thắng lợi của mình sau 2 bƣớc ngƣời thứ nhất chọn dòng i2 mà: i .n+12 i.n+1
1 a = max a i m Phần tử 2 i .n+1 a đƣợc đánh dấu thành ' 2 * i .n+1 a và ta viết thêm một dòng thứ (m + 2) trong đó: 2 m+2. j m+1. j i j a = a + a ; j = 1, n
4. Để cực tiểu hóa tổng thắng lợi của ngƣời thứ nhất qua 2 bƣớc, ở bƣớc 2 của mình ngƣời thứ hai chọn cột j2, trong đó: m+2. j2 m+2. j
1 a = mina j n Phần tử 2 m+2. j
a đƣợc đánh dấu * và ta viết cột thứ (n + 2) (bên phải ma trận A), trong đó:
2
i.n+2 i.n+1 ij
a = a + a ; i 1, m
5. Tiếp tục ngƣời thứ nhất lại chọn dòng i3 mà: 3 i .n+2 i.n+2 1 a = max a i m và ngƣời thứ hai chọn cột j3mà: 3 m+3. j m+3. j 1 a = min a j n
Bằng các chiến lƣợc này cả hai bên tham gia trò chơi đã qua 3 bƣớc. Giả sử trò chơi đƣợc tiếp tục tiến hành cho đến bƣớc thứ (k-1), và dến bƣớc thứ k là bƣớc kết thúc trò chơi, ngƣời thứ nhất lại áp dụng chiến lƣợc
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
tƣơng tự nhƣ trên sao cho cực đại hóa tổng thắng lợi qua (k-1) bƣớc, ngƣời thứ hai áp dụng chiến lƣợc cực tiểu hóa tổng thắng lợi của ngƣời thứ 1.
Gọi si ; i 1, m; là số lần ngƣời chơi thứ nhất áp dụng chiến lƣợc i (dòng i) trong k bƣớc chơi. Khi đó i
1
s = k
m i
và phân phối tần suất: s1 s2 sm
, ,...,
k k k là
chiến lƣợc hỗn hợp xấp xỉ tối ƣu của ngƣời chơi thứ nhất, còn phần tử có dấu * xác định tổng thắng lợi (có thể có) của ngƣời đó qua k bƣớc.
Tƣơng tự gọi tj ; j = 1, n; là số lần ngƣời thứ hai áp dụng chiến lƣợc j (chọn cột j) trong k bƣớc chơi. Khi đó j
1
t k
n j
và phân phối tần suất:
1 2 n
t t t
, ,...,
k k k là chiến lƣợc hỗn hợp xấp xỉ tối ƣu của ngƣời chơi thứ hai. Gọi
v là tổng thắng lợi của ngƣời thứ nhất qua k bƣớc chơi thì: k * * m+k. j m+k.n+k 1 1 (a ) v (a ) k k
Rõ ràng rằng mức xấp xỉ giữa các chiến lƣợc này với chiến lƣợc tối ƣu phụ thuộc vào bƣớc đi ban đầu (vào việc chọn dòng i1 của ngƣời thứ nhất) và vào số bƣớc chơi k. Nếu cả hai ngƣời đều tuân thủ qui tắc Brown thì xấp xỉ càng cao khi k càng tăng lên, nói cách khác, quá trình hội tụ.
Ví dụ:
Input: Cho ma trận trò chơi:
3 2 4 1 A 1 4 2 2 2 3 3 4
Out put: Hãy tìm lời giải xấp xỉ theo phƣơng pháp Brown qua 10 bƣớc và qua 20 bƣớc, cho biết bƣớc đầu ngƣời chơi thứ nhất chọn chiến lƣợc 1.
Thuật toán giải:
Ghi dòng 1 xuống dƣới ma trận A thành dòng 4. Vì trên dòng thứ 4 đó: min (3,2,4,1) = 1
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
nằm ở cột 4, nên ngƣời 2 chọn cột 4, và số 1 ở dòng 4 dƣợc đánh dấu *. Cột 4 của A đƣợc ghi bên phải của A thành cột 5.
Ngƣời 1 chọn dòng 3 ở bƣớc 2 vì ở cột 5: max (1 , 2, 4) = 4 nằm ở dòng 3, và số 4 ở cột 5 đƣợc đánh dấu *. Cộng dòng 3 của A với dòng 4 đƣợc dòng 5. Ngƣời 2 chọn cột 2 vì ở dòng 5: min (5, -1,4, 5) = -1 nằm ở cột đó. Số -1 ở dòng 5 đƣợc đánh dấu *. Cộng cột 2 của A với cột 5 (cột 4 + 1) thành cột 6.
Ngƣời thứ nhất lại thấy trên cột 6: max (3, 6, 1) = 6 nên chọn dòng 2 .v.v.. Tiếp tục quá trình chọn đó cho đến bƣớc thứ 10 và bƣớc thứ 20, ta đƣợc bảng ở trang 42, trong đó ma trận A nằm ở góc Tây bắc, còn mỗi dòng thêm là một bƣớc đi của ngƣời 1theo thứ tự từ trên xuống, mỗi cột thêm là một bƣớc đi của ngƣời 2 theo thứ tự từ trái sang phải.
Nhƣ vậy qua 10 bƣớc thì:15 v 21 10 10
Chiến lƣợc của ngƣời thứ nhất là p 7 , 2 , 1
10 10 10
Chiến lƣợc của ngƣời thứ hai là q 2 , 2 , 1 , 5 10 10 10 10 Qua 15 bƣớc thì: 25 v 30
15 15
Chiến lƣợc của ngƣời thứ nhất là p 9 , 4 , 2 15 15 15
Chiến lƣợc của ngƣời thứ hai là q 2 , 5 , 1 , 7 15 15 15 15
Qua 20 bƣớc thì: 32 v 38 20 20
Chiến lƣợc của ngƣời 1 trong 20 bƣớc là : p 12, 6 , 2 20 20 20
Chiến lƣợc của ngƣời 2 là: q 5 , 5 , 1 , 9 20 20 20 20
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Chỉ mô tả sự hội tụ đều của thuật toán lặp Brown trong ví dụ này, ta có: - Ở bƣớc 10: 21 15 0, 60 10 10 - Ở bƣớc 15: 30 25 0,34 15 15 - Ở bƣớc 20: 38 32 0,30 20 20
Hiệu giữa giới hạn trên và giới hạn dƣới của v (khoảng ƣớc lƣợng của v) giảm đơn điệu.
Đánh giá kết quả:
Phƣơng pháp Brown đƣợc trình bày nhƣ là một phƣơng pháp cạnh tranh từng bƣớc (có thể kéo dài trong một khoảng thời gian nào đó) giữa hai đối thủ “cao tay” nhất. Nhƣng nó cũng đƣợc xem là phƣơng pháp tiếp cận dần tới chiến lƣợc tối ƣu của hai đối thủ. Chẳng hạn, trong sản xuất nông nghiệp đó là chiến lƣợc gieo trồng của ngƣời nông dân nhằm đạt giá trị sản phẩm đảm bảo cao nhất, khi thiên nhiên “tinh quái” luôn tác động vào chỗ yếu nhất của mỗi phƣơng thức gieo trồng.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Cột 4 2 2 3 1 1 4 4 4 4 2 2 2 4 4 1 4 1 1 4 3 2 4 1 1 3 5 9* 12* 15* 16* 17* 18* 19 21* 23* 25 26 27 30* 31 34* 37* 38* Dòng -1 4 -2 2 2 6* 10* 8 7 6 8 10 12 14 18 22 26* 28* 30* 29 31* 30 29 31 2 -3 3 4 4* 1 -2 1 3 5 9 13 17 21* 18 15 12 16 20 22 26 28 30 34 1 3 2 4 1* 3 5 1* 7 5 2 4 3* 5 7 2 3 7 3* 9 1 6* 9 7 10 1 9* 11 11 11 1 12 13 15 12* 1 15 15 19 13* 1 18 17 23 14* 1 21 19 27 15* Bƣớc 10 3 23 16* 30 19 1 26 18* 34 20 1 29 20* 38 21 2 28 24 36 23* 2 27 28 34 25* Bƣớc 15 2 26* 32 32 27 1 29 34 36 28* 2 28* 38 34 30 1 31* 40 38 31 1 34 42 42 32* Bƣớc 20
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
KẾT LUẬN
Qua quá trình nghiên cứu và thực hiện, luận văn đã đạt đƣợc một số kết quả sau:
- Nghiên cứu và trình bày một cách có hệ thống về lý thuyết trò chơi. - Nghiên cứu về trò chơi ma trận và các chiến lƣợc trong trò chơi ma trận. - Giải đƣợc một số bài toán sử dụng các chiến lƣợc trong trò chơi ma trận. Vì lý thuyết trò chơi là một kiến thức khá rộng và mới mẻ nên sự cảm nhận của tôi về nó chắc chắn còn rất hạn hẹp. Tuy nhiên đây là đề tài hay, có ý nghĩa ứng dụng thực tế cao nếu phát triển đƣợc đầy đủ. Rất mong đƣợc sự quan tâm đóng góp ý kiến của các thầy cô giáo để bài viết đƣợc hoàn thiện hơn!
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
TÀI LIỆU THAM KHẢO
1. Tô Cẩm Tú (1997), Một số phương pháp tối ưu hóa trong kinh tế, NXB Khoa học và kỹ thuật.
2. A.M. Brandenburger, Bary J.Nalebuff (2007), Lý thuyết trò chơi trong kinh doanh, NXB Tri thức
3. Bierman, H. S. and L. Fernandez (1998), Game Theory with economic applications, Addison-Wesley.
4. Don Ross (2010), Games Theory
5. Fudenberg (1991), Drew and Jean Tirole: Game Theory, MIT Press. 6. Jim Ratliff (1997), Strategic form Games.
7. Osborne (1994), Martin and Ariel Rubinstein: A Course in Game Theory, MIT Press.