Thế lưỡng nan của người tù – hợp tác và trừng phạt- 123docz.net

D P S P SP t Lấy đạo hàm hai vế theo t ta được:

T R= (300-3Q)Q =300Q 3Q2 MR = R’ = 300 6Q

4.15. Thế lưỡng nan của người tù – hợp tác và trừng phạt

Một trò chơi điển hình xuất hiện trong hầu như tất cả các sách giới thiệu lý thuyết trò chơi là trò chơi thế lưỡng nan của người tù (prisoners’ dilemma). Nội dung trò chơi như sau:

138

Có hai tên trộm cùng phạm tội và bị bắt giam. Cảnh sát tách riêng hai tên để tra hỏi. Mỗi tên trộm có hai lựa chọn: khai hết tội để được khoan hồng và chối tội. Nếu chỉ một tên trộm khai nhận, hắn sẽ được tự do và tên kia sẽ chịu hết tội trạng và phạt tù 6 tháng. Nếu cả hai cùng chối tội, họ sẽ bị tạm giữ 1 tháng và được thả ra vì cảnh sát không đủ chứng cứ buộc tội. Nếu cả hai cùng nhận tội, cả hai sẽ cùng bị phạt tù 3 tháng. Vậy tên trộm nên khai nhận tội hay chối tội?

Để hiểu rõ các chiến lược lựa chọn, ta hãy xem ma trận phần thưởng của trò chơi:

139

Nhìn vào ma trận phần thưởng, dễ nhận thấy bất kể tên trộm kia lựa chọn thế nào, thì thú tội vẫn là lựa chọn tốt nhất của mỗi tên trộm. Nói khác đi, “thú tội” là chiến lược thống trị của cả hai tên trộm. Cân bằng Nash do đó đạt được tại phương án “thú tội – thú tội” với phần thưởng là ba tháng tù cho mỗi tên trộm.

Tuy nhiên, đây lại không phải là một cân bằng hiệu quả cho cả hai. Nếu như cả hai tên trộm đều chối tội, mỗi tên sẽ chỉ bị 1 tháng tù giam. Đây chính là lựa chọn có hiệu quả Pareto. Vậy tại sao hai tên trộm không chọn chiến lược này? Vấn đề là không tên trộm nào dám chắc tên kia có thú tội hay không? Nếu có cách nào đó biết chắc tên kia sẽ chối tội, tên trộm chắc chắn cũng sẽ chọn chối tội. Nếu hai tên trộm có niềm tin rằng đồng bọn sẽ chối tội, anh ta cũng sẽ chối tội. Như vậy, vấn đề thông tin và niềm tin khiến cho hai tên trộm không thể hợp tác với nhau để có được kết quả tốt nhất cho cả hai.

Trong thực tế, việc các trò chơi phi hợp tác không mang lại cân bằng hiệu quả diễn ra phổ biến. Chẳng hạn như việc chạy đua vũ trang giữa các quốc gia, hiện tượng chặt chém khi bán hàng,…

Vậy có cách nào để hai người tù hợp tác với nhau hay không? Có cách nào để đưa các trò chơi phi hợp tác thành các trò chơi hợp tác?

Trở lại trò chơi thế lưỡng nan của người tù, điều gì sẽ xảy ra nếu như trước khi bị bắt, giữa hai tên trộm có một thỏa thuận hoặc tồn tại một qui tắc bất thành văn rằng nếu bị bắt, kẻ nào thú tội là kẻ phản bội và sẽ bị trừng phạt. Trong trường hợp này, nhiều khả năng mỗi tên trộm sẽ lựa chọn cách chối tội do lo sợ sự trừng phạt nếu thú tội. Như vậy, bằng cách đưa ra một sự trừng phạt tiềm tàng, kết cục của trò chơi thế lưỡng nan của người tù đã có thể thay đổi theo kết cục có hiệu quả Pareto và có lợi cho cả hai tên trộm. Tuy nhiên, việc áp đặt trừng phạt chỉ khả thi khi trò chơi mà chúng ta đang xét được kéo dài hay được lặp lại.

Thế lưỡng nan của người tù – hợp tác và trừng phạt

CÁC ĐƯỜNG CHI PHÍ SẢN XUẤT

Dịch chuyển đường cung, đường cầu