D P S P SP t Lấy đạo hàm hai vế theo t ta được:
T R= (300-3Q)Q =300Q 3Q2 MR = R’ = 300 6Q
4.1.7 Trò chơi tuần tự (Sequential game)
Các trò chơi mà chúng ta xét cho đến nay, những người chơi luôn đồng thời lựa chọn các chiến lược. Trong nhiều trò chơi thực tế, người chơi không thực hiện các bước đi đồng thời. Thay vào đó, họ “chơi” lần lượt, người này “chơi” tiếp theo người kia. Chẳng hạn, trong trò chơi đánh cờ, quân trắng sẽ đi trước, quân đen đi sau, rồi lại quân trắng, rồi lại quan đen, cứ tiếp tục như vậy. Người chơi biết đối thủ vừa có bước đi gì trước khi quyết định bước đi của mình và họ phải cân nhắc nếu mình lựa chọn bước đi này, đối thủ sẽ phản ứng ra sao? Như vậy, người chơi phải suy tính hành động của họ sẽ ảnh hưởng thế nào tới các hành động của đối thủ và của chính họ trong tương lai.Trong các thị trường độc quyền nhóm ở mô hình chỉ đạo giá và chỉ đạo sản lượng, ta cũng giả định một doanh nghiệp “đi” trước bằng quyết định giá hoặc sản lượng.
Giả sử ta có trò chơi trong đó có 2 người chơi A và B. A có 2 lựa chọn “trên” hoặc “dưới”, B có hai lựa chọn “trái” và “phải”. Nếu A và B thực hiện các lựa chọn đồng thời, ta có trò chơi đồng thời và trò chơi này có 2 cân bằng Nash (trên, trái) và (dưới, phải). Tuy nhiên, nếu như A đi trước, B đi sau, cân bằng sẽ thay đổi. Để tiện biểu diễn trình tự thực hiện và lựa chọn của mỗi người chơi, với trò chơi tuần tự, người ta sử dụng một dạng biểu đồ gọi là cây trò chơi (game tree) hay dạng mở rộng (extensive form) của trò chơi.
Cây trò chơi
Cây trò chơi minh hoạt tất cả các lựa chọn có thể thực hiện bởi các người chơi cũng như các kết quả có thể của trò chơi ứng với các lựa chọn đó. Hình 5.1 thể hiện cây trò chơi của trò chơi trên. Trò chơi bắt đầu bằng điểm lựa chọn của
142
A hay còn gọi là nốt A (node), cũng là nốt khởi đầu hay gốc của cây trò chơi. Tại nốt này, A có hai lựa chọn “Trên” hoặc “Dưới”. Hai lựa chọn được minh họa như là “nhánh” (branch) mọc ra từ gốc của cây trò chơi. Mỗi lựa chọn tại một nốt được gọi là một bước đi (move). Nếu A chọn “Trên”, đến lượt B lựa chọn. Tại nốt của B, B có hai lựa chọn là “Trái” hoặc “Phải”, cả hai đều đem đến kết quả cho B là 9 và cho A là 1. Tương tự, nếu A chọn “dưới”, B cũng có hai lựa chọn “Trái” hoặc “Phải” và nếu chọn “Trái”, kết quả là B được 0 và A được 0. Nếu chọn “phải”, B sẽ được 1 và A được 2. Cây trò chơi còn kéo dài nhiều nốt và nhánh nữa nếu trò chơi tiếp tục qua nhiều bước. Nốt cuối cùng của mỗi nhánh được gọi là nốt kết thúc (terminal node), tại đó, không hành động nào được thực hiện nữa (khác với nốt hành động). Trong trò chơi tuần tự, chiến lược bao gồm toàn bộ các phương án bước đi mà người chơi có thể lựa chọn cho đến khi kết thúc trò chơi. Mỗi
143
Tìm cân bằng trong trò chơi tuần tự với cây trò chơi
Vậy đâu là cân bằng của trò chơi? Rõ ràng “trên”-“trái” không còn là cân bằng của trò chơi. Nếu A chọn “trên”, A luôn chỉ có phần thưởng là 1. Nếu A chọn ‘dưới” anh ta có thể có phần thưởng là 2. Rõ ràng, với A, “dưới” là chiến lược tốt nhất. Khi A chọn “dưới”, B sẽ chọn “phải” do chọn “phải” sẽ cho phần thưởng cao hơn chọn “trái”. Vì vậy, “dưới” – “trái” sẽ là cân bằng Nash trong trò chơi này.
Với trò chơi đơn giản trên, việc tìm ra cân bằng của trò chơi khá dễ dàng. Tuy nhiên, nó minh họa nguyên tắc quan trọng để “giải” trò chơi tuần tự với cây trò chơi: Phân tích cây trò chơi từ kết quả trò chơi tại các nốt kết thúc để lựa chọn nốt kết thúc cho kết quả tốt nhất cho người chơi. Trong ví dụ trên, nốt kết thúc có kết quả tốt nhất với A là nốt dưới cùng với A được 2, B được 1. Sau đó suy ngược lại theo cây trò chơi. Để có nốt kết thúc tốt nhất đó, nốt phía đó phải là nốt nào? Bằng cách suy ngược từ nốt kết thúc có kết quả tốt nhất, có thể tìm ra chiến lược tốt nhất cho người chơi. Phương pháp này được gọi là suy luận ngược (backward induction hay rollback). Khi mỗi người chơi đều tìm ra chiến lược tối ưu bằng suy luận ngược, ta sẽ tìm được các cân bằng suy ngược của trò chơi (rollback equilibrium).
Trong ví dụ trên, lựa chọn cân bằng là A “dưới”, B “phải”. Tuy nhiên, lựa chọn này là tốt nhất cho A chứ không phải B, vì nếu A chọn “trên” thì B hoàn toàn có thể kết quả là 9. Trong trò chơi này, sở dĩ B không thu được kết quả là 9 vì B là người đi sau. Trong một số trò chơi tuần tự, người đi trước có lợi thế quyết định. Tuy nhiên, trong nhiều trường hợp, lợi thế lại rơi vào người đi sau. Ví dụ, Google không phải là người đầu tiên trên thị trường tìm kiếm internet nhưng hiện tại đang là công ty dẫn đầu ngành này. Lợi thế của người đi đầu là lựa chọn một phương án lợi thế và buộc người đi sau phải điều chỉnh theo đó. Lợi thế của người đi sau là sự linh hoạt trong phương án điều chỉnh với lựa chọn của người đi đầu.
144