Tìm cân bằng Nash với chiến lược hỗn hợp

Một phần của tài liệu giáo trình KINH TẾ HỌC VI MÔ NÂNG CAO (chương trình dành cho cao học) (Trang 135 - 137)

D P S P SP t Lấy đạo hàm hai vế theo t ta được:

4.1.4Tìm cân bằng Nash với chiến lược hỗn hợp

T R= (300-3Q)Q =300Q 3Q2 MR = R’ = 300 6Q

4.1.4Tìm cân bằng Nash với chiến lược hỗn hợp

Trong nhiều trò chơi, cân bằng Nash không thể đạt được với chiến lược thuần. Tuy nhiên, người ta đã chứng minh rằng luôn tồn tại cân bằng Nash với chiến lược hỗn hợp. Với những trò chơi có cân bằng Nash với chiến lược thuần, ta cũng có thể tìm được cân bằng Nash với chiến lược hỗn hợp. Hãy lấy ví dụ với trò chơi cuộc chiến giới tính (Battle of the Sexes) sau:

Có hai vợ chồng cùng ngồi xem Tivi. Họ phải lựa chọn nên xem phim Hàn hay xem bóng đá. Giả sử người vợ thích xem phim Hàn, người chồng thích

136

xem bóng đá. Nếu cả hai không thể thống nhất được xem gì, thì sẽ tắt Tivi không ai được xem cả. Ma trận phần thưởng của trò chơi này được trình bày ở dưới đây.

Xem phim Hàn Xem bóng đá

Xem phim Hàn 2,1 0,0

Xem bóng đá 0,0 1,2

Bảng 4.2 Ma trận phần thưởng trò chơi cuộc chiến giới tính

Rõ ràng, trò chơi này có 2 cân bằng Nash với chiến lược thuần. Đó là cùng xem phim Hàn (2,1) hoặc cùng xem bóng đá (1,2). Vậy có cân bằng Nash với chiến lược hỗn hợp không?

Để tìm cân bằng Nash với chiến lược hỗn hợp ta xét lựa chọn của người vợ và người chồng:

Người vợ

Gọi xác suất người vợ chọn xem phim Hàn là p, như vậy xác suất người vợ chọn xem bóng đá là (1-p). Nếu chiến lược hỗn hợp của người chồng là chiến lược hỗn hợp tốt nhất, chiến lược của người vợ phải khiến người chồng dù chọn xem phim Hàn hay xem bóng đá cũng thu được phần thưởng như nhau. Lý do là vì nếu người chồng thấy chọn xem phim Hàn hoặc xem bóng đá có lợi hơn, anh ta sẽ gắn chặt với lựa chọn đó và khi đó, chiến lược của anh ta không còn là chiến lược hỗn hợp nữa.

Phần thưởng của người chồng khi chọn phim Hàn là: 1*p + 0*(1-p)

Phần thưởng của người chồng khi chọn Bóng đá là: 0*p + 2*(1-p)

Để dù lựa chọn phim Hàn hay lựa chọn bóng đá đều có phần thưởng như nhau, ta có:

137

1*p + 0*(1-p) = 0*p + 2(1-p) p=2/3

Như vậy, chiến lược hỗn hợp của người vợ phải là (2/3; 1/3); nghĩa là xác xuất 2/3 xem phim Hàn, 1/3 xem bóng đá.

Người chồng

Tương tự, gọi xác suất người chồng chọn xem phim Hàn là q, xác suất người chồng xem bóng đá là (1-q). Nếu người chiến lược hỗn hợp của người vợ là tốt nhất ở cân bằng Nash, thì chiến lược người chồng phải khiến người vợ thu được phần thưởng như nhau, dù chọn phim Hàn hay Bóng đá. Ta có phương trình:

2*q + 0*(1-q) = 0*q + 1*(1-q) q=1/3

Như vậy, chiến lược hỗn hợp của người chồng là (1/3, 2/3): xác xuất 1/3 xem phim Hàn và 2/3 xem bóng đá.

 Như vậy, trong chiến lược hỗn hợp, cả hai đều ưu tiên sở thích của mình. Cân bằng Nash đạt được tại [(2/3,1/3);(1/3,2/3)]

Thực hành: Tìm cân bằng Nash với chiến lược hỗn hợp trong trò chơi hai con dê qua cầu không có cân bằng Nash với chiến lược thuần.

Một phần của tài liệu giáo trình KINH TẾ HỌC VI MÔ NÂNG CAO (chương trình dành cho cao học) (Trang 135 - 137)