2 BÀI TOÁN TRÒ CHƠI MA TRẬN
2.2.2 CHIẾN LƯỢC TỐI ƯU
Định nghĩa 2.6. Nghiệm của trò chơi ma trận là cặp chiến lược hỗn hợp X = (x , x , ... , x ), Y = (y , y , ... , y ) và số thực v sao cho:
a) E X, Y= v và
b) E X, j≥ v với mọi chiến lược đơn j = 1, 2, ..., n, c) E i, Y≤ v với mọi chiến lược đơn i =1 , 2, ..., m.
X, Y gọi là chiến lược tối ưu của P1 và P2 tương ứng. Số v gọi là giá
của trò chơi.
Định nghĩa trên cho thấy nếu P1 chọn cách chơi theo tỉ lệ cho bởi chiến lược tối ưu X thì dù P2 chơi như thế nào, P1 vẫn luôn thắng ít nhất là v. Cũng vậy, nếu P2 chọn cách chơi theo tỉ lệ cho bởi chiến lược tối ưu Y thì dù P1 chơi như thế nào, P2 chỉ thua nhiều nhất là v. Giá v có thể dương, âm hay bằng 0. Với trò chơi chọn bi nêu ở phần mở đầu thì giá của trò chơi v = 0 và các chiến lược tối ưu là X = 12,12 và Y = 12, 12.
Định lý sau đây cho thấy mọi trò chơi ma trận đều có nghiệm.
Định lý minimax. Đối với mọi trò chơi ma trận bao giờ cũng tồn tại
max
X min
Y E(X, Y),min
Y max
X E(X, Y) và hai giá trị này bằng nhau.
Nói cách khác, mọi trò chơi ma trận đều có nghiệm X, Y , v sao cho:
E(X, Y) ≤ E X, Y = v ≤ E(X, Y) với mọi cặp chiến lược hỗn hợp X, Y.
Như vậy, với trò chơi ma trận bất kỳ mỗi đối thủ đều có chiến lược tối ưu X, Y sao cho số tiền thắng nhỏ nhất của P1 bằng số tiền thua lớn nhất của P2 và bằng v.
Nhận xét. Nếu ma trận trả tiền A có phần tử âm thì ta có thể thay nó bằng ma trận Aα = [aij+α] > 0 (mọi phần tử của Aα đều dương) bằng cách chọn số α thích hợp, chẳng hạn α > −min{aij : aij < 0}. Có thể chứng minh rằng các chiến lược tối ưu trong cả hai trò chơi (vói ma trận trả tiền A và Aα) là như nhau, đồng thời vα = v+ α >0.