Sự tồn tại cân bằng Nash chiến lược hỗn hợp B... A-Sự tồn tại cân bằng nash chiến lược hỗn hợp• Ví dụ về thiết lập bài toán để tìm chiến lược cân bằng • Bài toán tổng quát • Định nghĩa
Trang 1GAME THEORY
Trang 2Nội dung thảo luận
1 Giới thiệu chung
2 Sự tồn tại chiến lược cân bằng Nash
3 Bài toán 2.6
2
Trang 31.Giới thiệu chung
1 Nhà toán học Nash
• Người Mỹ (1928)
• Chuyên ngành LTTC và hình học vi phân.
• Năm 1944 đạt giải nobel về kinh tế.
2 Cân bằng Nash (NE)
• Trò chơi dạng chuẩn: G={S,u}.
• Vectơ chiến lược (s*1,…,s*n) là 1 cân
Trang 42.Sự Tồn Tại Cân Bằng Nash
• Nội Dung
A Sự tồn tại cân bằng Nash chiến lược hỗn
hợp
B Trình bày ví dụ 2.6
Trang 5A-Sự tồn tại cân bằng nash chiến lược hỗn hợp
• Ví dụ về thiết lập bài toán để tìm chiến
lược cân bằng
• Bài toán tổng quát
• Định nghĩa
Trang 6
+Giả sử có 2 đấu thủ:
Thu hoạch của mỗi đối thủ được cho ở bảng:
+ Giả sử (pt,pb) là xác suất để đối thủ hàng
chơi chiến lược (T,B);(pl,pr) là xác suất để
đối thủ cột chơi chiến lược (L,R)
=> Lợi ích kỳ vọng của đấu thủ hàng là: pt*[pl*2+pr*0]+pb*[pl*0+pr*1]
Lợi ích kỳ vọng của đấu thủ cột là : pl*[pt*1+pb*0]+pr*[pt*0+pb*2]
=>Bài toán tìm lợi ích cực đại lợi ích kỳ vọng của đấu thủ hàng:
thủ hàng
T 2,1 0,0
B 0,0 1,2
6
Trang 7 Bài toán tổng quát
• Kí hiệu J là số chiến lược thuần túy trong và K là số chiến lược thuần túy trong
• Ta viết ; và sd ,
để kí hiệu các chiến lược thuần túy tùy ý trong và
• Nếu đấu thủ 1 tin rằng đấu thủ 2 sẽ chơi các chiến lược với các xác suất => thu hoạch kỳ vọng của đấu thủ 1 với chiến lược thuần túy là:
và thu hoạch kỳ vọng của đấu thủ 1 chơi chiến lược hỗn hợp là :
• Để chiến lược hỗn hợp là phàn ứng tốt nhất của đấu thủ 1 đối với chiến lược hỗn hợp của đấu thủ 2 thì phải có
>0 chỉ nếu
với mọi trong
Trang 8Bài toán tổng quát (tiếp)
• Làm tương tự đấu thủ 2 như đấu thủ 1
• là cân bằng Nash chiến lược
hỗn hợp nếu chúng là nghiệm của bài toán :
Trang 9 Định nghĩa :
Cân bằng nash chiến lược hỗn hợp
• Trong trò chơi dạng chuẩn của hai đấu thủ
G={ S1,S2;u1,u2},các chiến lược hỗn hợp
(p*1,p*2) là một cân bàng Nash nếu chiến lược hỗn hợp của mỗi đấu thủ là một phàn ứng tốt
nhất đối với chiến lược của đối thủ kia.
Trang 103-Ví dụ 2.6
• Xét bài toán 2 người chơi, mỗi người 2
chiến lược thuần túy
Xét các thu hoạch của đấu thủ 1 ở bảng:
T(q) P(1-q) (1) L(r) x,? y,?
X(1-r) z,? w,?
10
Trang 12r
q r*(q)
12
Trang 13Ta có thu hoạch kì vọng của (1).
Thu hoạch kì vọng khi chọn L: q.x + (1 - q).y
Thu hoạch kì vọng khi chọn X: q.z + (1 - q).w
• Gọi A là chênh lệch của thu hoạch kì vọng của (1)
( ) ( )
y q
Trang 14-• Trong trường hợp này Lên và Xuống đều không bị trội ngặt Như vậy lên phải tối ưu với một số giá trị của q và Xuống tối ưu với một số giá trị khác của q
Trang 15TH4:x<z và y>w
• Trường hợp này tương tự th3, xét mức
q’=(w-y)/((x-z)+(w-y))
Với q<q’ thì L phản ứng tốt nhất, q>q’ thì X phản ứng tốt nhất; q=q’ thì bàng quan.
(iv)
Trang 17• Tương tự, Xét thu hoach của người chơi thứ 2
• Cũng như trên mỗi người chơi
đều có 2 chiến lược thuần túy
và chiến lược hỗn hợp của:
X(1-r) ?,z’ ?,w’
Trang 18Ta có các đồ thị biểu diễn các TH trên như sau:
r
q
r
q r
Trang 19Biện luận điểm cân bằng Nash
• Ta cho bất kỳ 1 trong 4 hàm phản ứng tốt nhất của đấu thủ 1( r*(q)) kết hợp với bất kỳ 1 trong 4 hàm phản ứng tốt
nhất của đấu thủ 2 ( q*(r)).
• Ta thấy cặp phản ứng tốt nhất này cho ít nhất 1 giao
điểm, do đó trò chơi có ít nhất 1 cân bằng Nash.
• Kiểm tra 16 cặp phản ứng có thể có ,ta có thể phân ra
làm các TH để xét cân bằng Nash:
1 Một cân bằng Nash thuần túy:
Điểm NE
Trang 202 Một cân bằng Nash hỗn hợp (NE)
3 Hai NE thuần, một NE hỗn hợp
1 điểm NE hỗn hợp
20
Trang 224- Vài mẩu truyện vui-thảo luận
• 1-Đi thẳng vào tù (Câu chuyện 2 người tù)
Người nhạc trưởng dàn giao hưởng ở Liên Xô (vào thời kỳ Stalin) đang trên tàu đến nơi biểu diễn tiếp theo của mình và ông ta chăm chú nhìn vào bản nhạc mà ông ta sẽ chỉ huy dàn nhạc biểu diễn vào tối hôm đó Hai sĩ quan KGB nhìn thấy ông ta đang đọc và họ cho rằng các nốt nhạc mang một mật mã bí mật nào đó nên đã bắt ông
ta như một gián điệp Ông ta cố phản đối, nói rằng bản nhạc đó là bản concerto dành cho violon của Traicôpxki, nhưng vô ích Vào
ngày thứ hai trong tù, người thẩm vấn với một vẻ tự mãn bước vào
và nói với ông ta: “Tốt nhất là hãy khai tất cả đi Chúng ta đã bắt
được bạn của mày, Traicôpxki, và hắn ta đã khai rồi đó”
• 2- Thảo luận tình huống : Đỏ tôi thắng, đen anh thua
22
Trang 23Vào cuối khóa học, Barry đã kỷ niệm ngày ra trường tại một trong các dạ tiệc khiêu vũ của trường tổng hợp Cambridge Một phần của buổi dạ tiệc là casinô Mỗi người chơi được tặng cho một số thẻ chơi tương đương 20 đôla và cuối buổi người nào tích lũy được một số lượng thẻ có giá trị lớn nhất sẽ được tặng vé miễn phí dạ tiệc năm sau Khi đến vòng quay cuối cùng của bàn rulô, một sự may mắn tình cờ đã khiến Barry dẫn đầu với số thẻ có tổng trị giá 700 đôla, người tiếp theo là một phụ
nữ Anh với 300 đôla Số còn lại gần như đã bỏ cuộc Ngay trước khi vòng quay cuối bắt đầu, người phụ nữ Anh nọ đề nghị chia đôi chiếc vé dạ tiệc năm sau nhưng
Barry đã từ chối Với việc đang dẫn đầu vói khoảng cách bỏ xa như vậy, chẳng có lý
do gì để phải chia đôi giải thưởng
Để hiểu rõ hơn về bước chiến lược tiếp theo, chúng tôi sẽ giải thích qua về quy tắc chơi trò quay rulô Chiến thắng trong trò chơi này phụ thuộc vào vị trí quả bóng sẽ lăn vào khi vòng bánh xe tròn dừng lại Thường sẽ có các số từ 0 đến 36 trên vòng tròn quay Khi quả bóng lăn vào số (0), nhà cái sẽ thắng Cách đặt cược an toàn nhất trong trò rulô là đánh cược vào số chẵn hoặc lẻ (được biểu thị bằng màu đen hoặc đỏ) Đánh cược kiểu này sẽ thu về một số tiến chẵn: cứ 1 đôla đánh cược
thắng sẽ thu về 2 đô la trong khi cơ hội để thắng là 18/37 Ngay cả khi đánh cược toàn bộ số tiền mình có thì người phụ nữ cũng vẫn không thể thắng theo cách này;
do vậy cô ta buộc phải chơi một trò chơi rủi ro hơn là đặt cược toàn bộ bộ số tiền của mình vào các bội số của 3 Chơi theo cách này, người phụ nữ sẽ nhận được tiền gấp ba nếu thắng (số tiền 300 đô la sẽ trở thành 900 đô la) Tuy nhiên cơ hội thắng chỉ còn 12/37 Người phụ nữ đã đặt tiền của mình lên bàn như vậy, vào thời
Trang 24Bài thuyết trình của nhóm đến
đây là kết thúc!
Cám ơn mọi người đã lắng nghe!
24