Chương trình Giảng dạy Kinh tế Fulbright tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tập lớn về tất cả...
Bài giảng 23 Lý thuyết trò chơi Lê Thị Quỳnh Trâm Nội dung Giới thiệu Các yếu tố trò chơi Cân chiến lược Chiến lược áp đảo Chiến lược bị áp đảo Cân Nash Trò chơi với cân Nash Trò chơi với nhiều cân Nash Trò chơi hợp tác Trò chơi khơng có cân Nash (thuần túy) Chiến lược hỗn hợp Giới thiệu Trò chơi chiến lược (strategic game) gì? Xảy định người chơi: Bị ảnh hưởng với định người chơi khác Ảnh hưởng lên định người chơi khác Tại cần nghiên cứu lý thuyết trò chơi? Trong đa số trường hợp, việc định có liên quan đến nhiều bên định bên ảnh hưởng chịu ảnh hưởng định bên khác Hành vi chiến lược (strategic behavior)? Việc người chơi ý thức tồn người chơi khác cố gắng phán đoán hành động họ Có tính đến hành động người chơi khác: “Tôi biết biết biết biết….” Trích đoạn phim “Cơ dâu cơng chúa” Vizzini Wesley • Vizzini nghĩ Wesley bỏ độc vào cốc A nên uống cốc B • Wesley cho Vizzini nghĩ Wesley bỏ độc vào cốc A nên uống cốc B nên bỏ độc vào cốc B • Vizzini tin Wesley cho Vizzini nghĩ Wesley bỏ độc vào cốc A nên uống cốc B nên bỏ độc vào cốc B nên uống cốc A • … Hành vi chiến lược Vizzini Nếu Wesley sử dụng lập luận cụ thể đó, Vizzini dự đốn uống ly rượu lại Wesley đốn suy luận ta bỏ thuốc độc vào ly lại Vizzini nghĩ Wesley bỏ độc vào cốc A nên uống cốc B Wesley cho Vizzini nghĩ Wesley bỏ độc vào cốc A nên uống cốc B nên bỏ độc vào cốc B Vizzini tin Wesley cho Vizzini nghĩ Wesley bỏ độc vào cốc A nên uống cốc B nên bỏ độc vào cốc B nên uống cốc A … Hành vi chiến lược Vizzini Điều có nghĩa khơng thể ứng dụng lý thuyết trò chơi? KHƠNG Chiến lược Wesley ngẫu nhiên phi hệ thống Tại Vizzini chết? Vizzini nghĩ chơi trò chơi khác! Bài học: Hiểu trò chơi mà tham gia Suy nghĩ “Hành động tối ưu người lý gì?” Nếu tin đối thủ khơng phải người lý, cần suy nghĩ “Ta phải làm đối thủ kiểu người mà ta tin họ thuộc kiểu đó?” Các yếu tố trò chơi Môi trường chiến lược Luật chơi Giả định Môi trường chiến lược (strategic environment) Người chơi Tất có ảnh hưởng đến phúc lợi bạn Không gian chiến lược Cách hành động bên Payoffs Phản ảnh lợi ích người chơi Là lợi ích người chơi ứng với kết cục trò chơi Các yếu tố trò chơi Luật chơi (the rules) Thời điểm hành động Bản chất mâu thuẩn chất tương tác Thông tin đầy đủ hay không đầy đủ Khả cưỡng chế thỏa thuận/hợp đồng Trò chơi có tổng phúc lợi cố định hay thay đổi Trò chơi lặp lại hay không lặp lại Điều kiện thông tin Hành động đồng thời, hay Trò chơi hợp tác/ khơng hợp tác Giả định Tính lý Kiến thức phổ thơng Phân loại trò chơi Trò chơi Games Thơng tin đẩy đủ Complete (symmetric) info Trò chơi khơng lặp lại One-shot games Trò chơi lặp lại Repeated games Trò chơi đồng thời Simultaneous-move games Thơng tin khơng đầy đủ Incomplete (asymmetric) info Trò chơi đồng thời Simultaneous-move games Trò chơi Sequential-move games Trò chơi Sequential-move games Trò chơi kết hợp (đồng thời tuần tự) simultaneous & sequential -moves games Vì gọi “lưỡng nan”? Kết cục trạng thái cân >< Kết cục tối ưu (Khai, Khai) (Không khai, Không khai) Khai Ất Giáp Không khai Khai -3, -3 0, -6 Không khai -6, -1, -1 Goden ball: Split or Steal? SHE HE Split Steal Split 50K, 50K -X, 100K Steal 100K, -X 0, Chiến lược áp đảo người “Steal” Cân bằng: (Steal, Steal) Trạng thái tối ưu: (Split, Split) Đây tình lưỡng nan Chiến lược bị áp đảo Một chiến lược gọi bị áp đảo sử dụng chiến lược lại ln đem lại kết cục tốt hơn, hành động đối thủ Trong ví dụ Ất-Giáp: chiến lược bị áp đảo Ất Giáp “Không khai” Ngay khơng có chiến lược áp đảo, có chiến lược bị áp đảo Loại bỏ chiến lược bị áp đảo làm giảm độ lớn trò chơi Ví dụ Đâu chiến lược bị áp đảo người chơi người chơi 2? Người chơi Giữa Phải Trên 10, 10 14, 12 14, 15 Giữa 12, 14 20, 20 28, 15 Dưới 15, 14 25, 28 25, 25 Người chơi Trái Ví dụ Người chơi 1: “Trên” bị áp đảo “Giữa” “Dưới” Người chơi Giữa Phải Giữa 12, 14 20, 20 28, 15 Dưới 15, 14 25, 28 25, 25 Người chơi Trái Ví dụ Người chơi 2: “Trái” bị áp đảo “Giữa” “Phải” Người chơi Người chơi Giữa Phải Giữa 20, 20 28, 15 Dưới 25, 28 25, 25 Ví dụ Người chơi 2: “Phải” bị áp đảo “Giữa” Cân bằng: (Dưới, Giữa) Người chơi Người chơi Giữa Giữa 20, 20 Dưới 25, 28 Câu hỏi? Trong trò chơi, người tham gia trò chơi có chiến lược áp đảo Và ta ln tìm cân chiến lược áp đảo? Một người chơi khơng có chiến lược áp đảo khơng thể có chiến lược bị áp đảo? Một người chơi ln có chiến lược áp đảo chiến lược bị áp đảo? Cân Nash (Nash equilibrium) Cân Nash: tập hợp chiến lược (mỗi người chơi có chiến lược) cho khơng người chơi có động đơn phương thay đổi hành động họ Trong cân này, người chơi thay đổi chiến lược, người nhận kết cục thấp Tìm cân Nash Đối với người chơi, tìm phản ứng tốt (best response) trước chiến lược đối phương Cân Nash cân tạo với chiến lược phản ứng tốt tất người chơi Tính chất: Ổn định bền vững mặt chiến lược (strategically stable) Có tính tự chế tài (self-enforcement) Các trường hợp xảy ra? Trong trò chơi, có thể: Có cân Nash Cân chiến lược áp đảo cân Nash (ví dụ: Ất Giáp) (Điều ngược lại chưa đúng) Có nhiều cân Nash Trò chơi hợp tác Khơng có cân Nash Chiến lược hỗn hợp Trò chơi hợp tác (Stag Hunt game - J J Rousseau) Thợ săn Thợ săn Hươu Thỏ Hươu 3, 0, Thỏ 2, 1, Hai cân Nash: (Hươu, Hươu) (Thỏ, Thỏ) Săn hươu đem lại lợi ích cho người cao đòi hỏi phải có lòng tin vào hợp tác bên Trò chơi hợp tác “Beautiful Blonde” game – Phim “A beautiful mind” Cân Nash Anh chàng Anh chàng Người đẹp tóc vàng Bạn tóc vàng Người đẹp tóc vàng 0, 3, Bạn tóc vàng 2, 2, Cân Russell Crowe (trong phim đưa ra) Trò chơi khơng có cân Nash Nhà quản lý Giám sát Làm việc Công nhân Trốn việc Không giám sát Làm nhiều Làm nhiều, trốn việc Lãng phí chi phí Khơng tốn chi phí mà cty hoạt động Không làm việc không lãnh lương Tốn chi phí phát trốn việc Khơng phải làm mà có lương Khơng tốn chi phí giám sát bị lỗ Trò chơi khơng có cân Nash Cơng nhân Lương: 100 $ (nếu bị bắt gặp trốn việc khơng nhận) Chi phí lao động: 50$ Nhà quản lý Nhà quản lý Giá trị sản phẩm lao động tạo ra: 200$ Chi phí kiểm tra: 10$ Nếu công nhân không làm việc, lợi nhuận: 0$ Nhà quản lý Công nhân Giám sát Không giám sát Làm việc 50, 90 50, 100 Trốn việc 0, -10 100, -100