EUtr ne^ = (0.33)(3) + (0.67)(−2) EUtr ne^ =−0.35
phải với tần suất 0.67, phản ứng tốt nhất của người chơi 1 đó là chọn dưới là chiến lược thuần túy vì -0.33 lớn hơn -0.35. Kết quả là gần với nhau thế nhưng dưới dù sao vẫn là tốt hơn. Để cho đầu ra là không có gì khác biệt thì tần số phải là chính xác 1/3 và chính xác 2/3.
Hãy nhớ luôn viết câu trả lời dưới dạng phân số ! Bởi số thập phân làm mất đi sự chính xác cần thiết của phép tính toán lý thuyết trò chơi và phân số thì thật là hoàn hảo.
Chiến lược hỗn hợp trong bài toán săn nai
Có những trò chơi mà có cả trạng thái cân bằng Nash thuần túy và trạng thái cân bằng Nash hỗn hợp. Và bài toán săn nai là một trò chơi như thế.
Thay đổi payoffs ảnh hưởng như thế nào tới chiến lược cân bằng Nash hỗn hợp
Khi mà giải quyết bài toán thế lưỡng nan của người tù ta thấy được rằng thay đổi payoffs không ảnh hưởng nhiều. Thực vậy, miễn là vị trí của các số giữ nguyên- tức là, chúng ta đổi vị trí số lớn nhất từ tập hợp payoffs thứ nhất với số lớn nhất từ tập hợp payoffs thứ hai, ta đổi vị trí của số lớn thứ hai từ tập hợp payoffs thứ nhất với số lớn thứ hai của tập payoffs thứ hai, trong chừng mực này thì trạng thái cân bằng vẫn không thay đổi. Bất kể là giá trị cá nhân như thế nào thì miễn là vị trí của các số còn lại giữ nguyên thì thú tộ vẫn là chiến lược thống trị im lặng, và do vậy <thú tội, thú tội> là chiến lược cân bằng Nash thuần túy duy nhất của trò chơi.
Trạng thái cân bằng Nash hỗn hợp khá không chắc chắn. Dù là MSNE (Mixed Strategies Nash Equilibrium) sẽ luôn xuất hiện miễn là cùng một vị trí, dù là ngay cả khi có những sự xáo trộn nhỏ trong các giá trị tương đối cũng thay đổi sự phân phối xác suất chính xác tìm được trong MSNE Để hiểu rõ hơn thì hãy xem qua sự thay đổi nhỏ trong bài toán săn nai:
Ta tìm kiếm chiến lược hỗn hợp của người chơi 1 trước và điều này yêu cầu chúng ta phải định nghĩa lợi ích dự kiến của người chơi 2 cho mỗi
chiến lược thuần túy của cô ấy như một hàm số của chiến lược hỗn hợp của người chơi 1. Bắt đầu bằng lợi ích dự kiến của cô ấy cho trái được coi như là chiến lược thuần túy:
→ Người chơi 2 sẽ nhận được 4 với xác suất và không với xác suất . Vì vậy nên lợi ích dự kiến của cô ấy là:
Và lợi ích dự kiến của cô ấy với lựa chọn phải là:
Lưu ý rằng lợi ích dự kiến cho việc lựa chọn phải giống như cũ nhưng lợ ích dự kiến cho việc lựa chọn trái thì đã thay đổi.
→ Cuối cùng ta cho hai lợi ích dự kiến và bằng nhau ta thu được kết quả là .
Do đó người chơi 1 sẽ chọn trên với tần suất là 1/3 và chọn dưới với tần suất là 2/3 trong trạng thái chiến lược cân bằng Nash hỗn hợp. Làm tương tự cũng sẽ cho ra sự thay đổi như trong trường hợp của người chơi 2, khi đó ta trộn hai xác suất 1/3 cho trái và 2/3 cho phải lại với nhau. Hỗn hợp này có sự khác biệt trong khi mà kết quả <nai, nai> có giá trị là 3 cho mỗi người chơi. Vậy nên chúng ta phải tính toán lại chiến lược cân bằng Nash hỗn hợp mọi lúc ta thay đổi payoffs.
Chiến lược hỗn hợp không hợp lệ
Không phải tất cả các trò chơi đều có trạng thái cân bằng Nash hỗn hợp. Tắc nghẽn là một bài toán như vậy. Thử tìm kiếm lời giải cho trạng thái cân bằng Nash hỗn hợp của bài toán này bằng thuật toán và chúng ta sẽ thấy được vấn đề.
Ma trận của trò chơi "Tắc nghẽn" như sau:
Tìm chiến lược của người chơi 2 mà sẽ làm cho người chơi 1 không đạt được gì khác biệt giữa hai chiến lược thuần túy của anh ta: