Trò chơi tĩnh với thông tin đầy đủ
3.3 Phát triển cân bằng Nash
3.3.1 Định nghĩa cân bằng Nash
Trước hết ta hãy đi tìm phản ứng tốt nhất của mỗi đấu thủ trước các chiến lược của các đấu thủ còn lại trong trò chơi gồm hai đấu thủ sau:
Các chiến lược của đấu thủ 2
L C R Các chiến lược của đấu thủ 1 T (0, 4) (4; 0) (5 ; 3) M (4, 0) (0; 4) (5; 3) B (3, 5) (3, 5) (6, 6)
Nếu đấu thủ 2 chọn chiến lược L, thì phản ứng tốt nhất của đấu thủ 1 là chiến lược M vì
u1(M, L) = 4 > u1(T, L) = 0 và u1(M, L) = 4 > u1(B, L) = 3.
Nếu đấu thủ 2 chọn chiến lược C, thì phản ứng tốt nhất của đấu thủ 1 là chiến lược T vì
u1(T, C) = 4 > u1(M, C) = 0 và u1(T, C) = 4 > u1(B, C) = 3.
Nếu đấu thủ 2 chọn chiến lược R, thì phản ứng tốt nhất của đấu thủ 1 là chiến lược B vì
u1(B, R) = 6 > u1(T, R) = 5 và u1(B, R) = 4 > u1(M, R) = 5.
Nếu đấu thủ 1 chọn chiến lược T, thì phản ứng tốt nhất của đấu thủ 2 là chiến lược L vì
u2(T, L) = 4 > u2(T, C) = 0 và u2(T, L) = 4 > u2(T, R) = 3.
Nếu đấu thủ 1 chọn chiến lược M, thì phản ứng tốt nhất của đấu thủ 2 là chiến lược C vì
u2(M, C) = 4 > u2(M, L) = 0 và u2(M, C) = 4 > u2(M, R) = 3.
Nếu đấu thủ 1 chọn chiến lược B, thì phản ứng tốt nhất của đấu thủ 2 là chiến lược R vì
Đánh dấu gạch dưới vào chiến lược phản ứng tốt nhất của mỗi đấu thủ; cặp chiến lược trong đó tất cả các đấu thủ đều chọn là chiến lược phản ứng tốt nhât của mình trước chiến lược đã cho của đấu thủ còn lại chính là cân bằng Nash, trong ví dụ này chính là cặp chiến lược (B, R).
Định nghĩa 2.4: Trong trò chơidạng chuẩn n đấu thủ G = {S1, S2, …, Sn; u1, u2, …, un}, các chiến lược (s1*, s2*, …, sn*) là một cân bằng Nash nếu với mỗi đấu thủ i, si* là phản ứng tốt nhất của đấu thủ i trước các chiến lược đã cho của n-1 đấu thủ còn lại (s1*, s2*, …, si-1*, si+1*, …, sn*), hay
ui(s1*, s2*, …, si-1*, si*,si+1*, …, sn*) ≥ ui(s1*, s2*, …, si-1*, si, si+1*, …, sn*) với mọi chiến lược khả thi si∈ Si;
tức là si* là nghiệm tối ưu của bài toán:
Max ui(s1*, s2*, …, si-1*, si, si+1*, …, sn*) si∈ Si