Cân bằng Nash

D P S P SP t Lấy đạo hàm hai vế theo t ta được:

T R= (300-3Q)Q =300Q 3Q2 MR = R’ = 300 6Q

4.1.3. Cân bằng Nash

Nếu cả hai người chơi trong trò chơi đều có chiến lược thống trị, cả hai người chơi sẽ chọn chiến lược này, bất kể lựa chọn đối phương. Khi đó, ta có một cân bằng trong trò chơi: không người chơi nào muốn thay đổi lựa chọn của họ. Mặc dù cân bằng với chiến lược thống trị là tình huống hấp dẫn, nhưng nó lại không thường xuyên xảy ra. Tình huống cân bằng dễ xảy ra hơn là cân bằng Nash

Cân bằng Nash:

Cân bằng Nash là tình huống xảy ra khi lựa chọn của người chơi này là tối ưu, trên cơ sở lựa chọn của người chơi kia và ngược lại. Cân bằng Nash được đặt theo tên nhà toán học Mỹ John Nash.

Chẳng hạn, trong trò chơi 2 con dê, lựa chọn của dê Đen là “đi thẳng” nếu dê Trắng chọn “tránh đường”. Đó là lựa chọn tối ưu của dê Đen. Ngược lại,

134

lựa chọn của dê Trắng là “tránh đường” nếu dê Đen chọn “đi thẳng”. Như vậy, rõ ràng cả hai lựa chọn của dê Trắng và dê Đen là tối ưu trong trường hợp này, nếu biết lựa chọn của đối phương. Lựa chọn “đi thẳng” – “tránh đường” này là một cân bằng Nash.

Đặc điểm của cân bằng Nash:

 Cân bằng Nash là trạng thái ổn định, trong đó không người chơi nào có động cơ để thay đổi chiến lược

 Trong cân bằng Nash, chiến lược của mỗi người chơi là chiến lược tốt nhất ứng với chiến lược của đối thủ.

 Người chơi phải “dự đoán” lựa chọn của đối thủ.

 Lựa chọn tốt nhất sẽ thay đổi khi “dự đoán” hay thông tin về đối thủ thay đổi

 Một trò chơi có thể có nhiều cân bằng Nash. Ví dụ với trò chơi 2 con dê qua cầu, dê Đen “đi thẳng” – dê Trắng “tránh đường” là một cân bằng Nash. Dê Đen “tránh đường” – dê Trắng “đi thẳng” cũng là một cân bằng Nash

 Một trò chơi cũng có thể không có cân bằng Nash. Ví dụ như trong trò chơi hai con dê qua cầu có ma trận phần thưởng sau:

135 Hình 4.4

Chiến lược thuần (pure strategy) và chiến lược hỗn hợp (mixed strategy)

Trong các ví dụ trò chơi ở trên, người chơi lựa chọn một trong số các chiến lược, ví dụ “đi thẳng” hoặc “tránh đường”. Một chiến lược như vậy gọi là chiến lược thuần. Chiến lược thuần là chiến lược mà người chơi gắn bó trong suốt trò chơi.

Tuy nhiên, người chơi không nhất thiết phải chọn một chiến lược chơi. Thay vào đó, anh ta có thể chọn cùng lúc nhiều chiến lược và thực hiện mỗi chiến lược với một xác suất nào đó. Ví dụ, người chơi có thể chọn xác xuất 50/50 với hai chiến lược “đi thẳng” và “tránh đường”. Trong trường hợp đó, ta có chiến lược hỗn hợp. Phần thưởng trong chiến lược hỗn hợp không thể hiện trong ma trận phần thưởng. Phần thưởng trong chiến lược hỗn hợp là tổng phần thưởng theo xác suất của mỗi chiến lược trong chiến lược hỗn hợp. Giả sử có hai chiến lược được thực hiện với xác xuất P1 và P2 (P1+P2=1). Phần thưởng cho chiến lược hỗn hợp này sẽ là:

Phần thưởng = Phần thưởng1*P1 + phần thưởng2*P2

Trong đó Phần thưởng 1 và phần thưởng 2 là phần thưởng ứng với hai chiến lược 1 và 2.

Với chiến lược hỗn hợp, người chơi có vô tận các chiến lược chơi khác nhau

CÁC ĐƯỜNG CHI PHÍ SẢN XUẤT

Dịch chuyển đường cung, đường cầu