LÝ THUYẾT TRÒ CHƠI GAME THEORY (Slide bài giảng dành cho sinh viên các ngành kinh tế và toán ứng dụng trong kinh tế) TS. Lê Minh Hiếu

70 7 0
LÝ THUYẾT TRÒ CHƠI GAME THEORY (Slide bài giảng dành cho sinh viên các ngành kinh tế và toán ứng dụng trong kinh tế) TS. Lê Minh Hiếu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LÝ THUYẾT TRÒ CHƠI GAME THEORY (Slide giảng dành cho sinh viên ngành kinh tế toán ứng dụng kinh tế) Biên soạn: TS Lê Minh Hiếu  TL1- Essential of game theory, Keyton Leyton-Brown, Morgan and Claypool Company, Inc  TL2 - Avinash K Dixit & Bary J Nalebuff (2002), Tư chiến lược, Nguyễn Tiến Dũng dịch, NXB Tri thức, Hà Nội Tài liệu tham khảo:  TK1 - Durlauf, S (2010) Game theory Basingstoke, Hampshire [u.a.]: Palgrave Macmillan  TK2 - Kelman, M (1999) Strategy or principle? Ann Arbor: University of Michigan Press TÀI LIỆU  Chương 1: Khái niệm  Chương 2: Trò chơi người tổng hữu hạn  Chương 3: Trò chơi người hữu hạn  Chương 4: Một số tốn điển hình kinh tế  Chương 5: Trò chơi dạng mở rộng hữu hạn  Chương 6: Trò chơi lặp lại NỘI DUNG  1.1 Khái niệm môn học  1.2 Các yếu tố trò chơi  1.3 Trò chơi tĩnh động  1.4 Thơng tin trị chơi CHƯƠNG – KHÁI NIỆM CƠ BẢN Lý thuyết trò chơi (LTTC) gì?  Là hệ thống nghiên cứu mơ hình tốn học đặc tả xung đột hợp tác “các cá nhân định cách khơn ngoan”;  Gọi lý thuyết, lĩnh vực cung cấp kỹ thuật toán học để phân tích tình hai cá nhân, đông nữa, tiến hành định, mà định gây ảnh hưởng lên lợi ích (những) người khác có mặt tình (trị chơi);  Khái niệm “trò chơi” quy ước mặt ngôn ngữ, nhằm ám tình xã hội có liên quan tới người Do cách gọi, cá nhân liên quan tới trị chơi gọi “người chơi”  Điều kiện để nghiên cứu giả thuyết: người chơi có tính hợp lý người chơi sử dụng trí khơn để định 1.1 KHÁI NIỆM MÔN HỌC  Hai người bị bắt, thẩm vấn riêng, không trao đổi với  Nếu hai nhận tội, người tháng tù  Nếu hai chối, người tháng tù  Nếu người nhận, người chối, người nhận thả ngay, người chối tháng tù  Câu hỏi: Hành động tốt cho người tù, hai lý trí? VÍ DỤ 1: BÀI TỐN THẾ LƯỠNG NAN CỦA NGƯỜI TÙ (1950)  Tình xảy chàng trai cô gái, muốn hẹn gặp nhau, xem trận bóng đá, dự buổi diễn ba-lê Hai người không nhớ định đâu lần hẹn Họ khác chỗ phải tự định đâu; dĩ nhiên giả sử khơng có phương tiện thơng tin để liên lạc Mục tiêu phải gặp Chàng trai thích bóng đá hơn, ngược lại gái thích ba-lê  Trong tốn này, NC1 khơng biết liệu NC2 (cơ gái) muốn hị hẹn với hay khơng, nghĩa khơng thể chắn thân muốn lựa chọn Yes hay No Mơ hình viết lại cho tính bất trắc chiến lược sau: Trong đó, S xem đá bóng (viết tắt chữ Soccer) B ba-lê Chàng trai người chơi theo hàng (NC1) gái theo cột (NC2) VÍ DỤ 2: XUNG ĐỘT SỞ THÍCH GIỚI TÍNH Gồm yếu tố bản: (1) Người chơi:  Là tác nhân định nhận kết định (người, công ty, …)  Tập người chơi N = {1, 2, …, n}, n >  Tập người chơi hữu hạn vơ hạn 1.2 CÁC YẾU TỐ CỦA TRÒ CHƠI (2) Chiến lược:  Mỗi người chơi có kế hoạch hành động khả thi, gọi chiến lược  Tất chiến lược người chơi thứ i tạo thành khơng gian chiến lược, kí hiệu Si  Mỗi chiến lược kí hiệu sj: sj  Si  Tập hợp không gian chiến lược: S = S1  …  Sn  Vecto chiến lược (s1  …  sn) người chơi gọi danh mục chiến lược  Khi đó: (s1  …  sn)  S  Phân loại: hai loại chiến lược: chiến lược hồn hảo chiến lược thơng minh Chiến lược hoàn hảo chiến lược mà đem lại lợi ích cao cho người tham gia chơi, không phụ thuộc vào hành động phản ứng đối phương Nói đơn giản cho dù đối thủ có làm nữa, phần thắng thuộc Ngược lại, chiến lược thơng minh hướng tới mục tiêu giảm thiểu mức độ rủi ro cho người tham gia chơi Nói đơn giản chiến lược giúp người chơi chọn đường tới đích an toàn với rủi ro thấp YẾU TỐ CƠ BẢN CỦA TRÒ CHƠI (3) Thu hoạch (payoff):  Khi người chơi i chọn chiến lược sj người chơi khác chơi chiến lược họ, người có lợi ích thu vào cuối trị chơi, gọi thu hoạch, kí hiệu ui  Thu hoạch hàm: ui : S  R  Người chơi lý trí/sáng suốt họ hành động với mục tiêu đạt thu hoạch tối đa YẾU TỐ CƠ BẢN CỦA TRỊ CHƠI 4.2 BÀI TỐN COURNOT VỚI THƠNG TIN KHƠNG ĐẦY ĐỦ 4.2 BÀI TỐN COURNOT VỚI THÔNG TIN KHÔNG ĐẦY ĐỦ 4.3 CÂN BẰNG STACKELBERG Xét lại trò chơi Cournot đầu tiên, ta giả định tình khác (hàm lợi ích vậy) rằng, NC1 chuyển động trước, NC2 quan sát chuyển động  5.1 Trò chơi dạng mở rộng với thông tin đầy đủ  5.2 Trị chơi dạng mở rộng với thơng tin KHƠNG đầy đủ CHƯƠNG – TRÒ CHƠI DẠNG MỞ RỘNG HỮU HẠN 5.1 TRỊ CHƠI DẠNG MỞ RỘNG VỚI THƠNG TIN ĐẦY ĐỦ  Trò chơi dạng mở rộng đặc tả nút nhánh;  Mỗi nút nút định, nút kết thúc (đưa giá trị lợi ích với quy ước: giá trị đầu NC1, giá trị sau NC2);  Mỗi nhánh tương ứng với hành động người chơi;  Hành động chiến lược: - NC1 có hành động A,B,C,D - NC2 có hành động M,N,P,Q  Chiến lược chơi dãy hành động, tập thơng tin người chơi hành động thực hiện; - Trong sơ đồ chiến lược chơi NC1 có hành động, NC1 có tập thơng tin tầm thường: Tập thơng tin có hành động A, B Tập thơng tin có hành động C, D Suy tập chiến lược NC1 {AC, AD, BC, BD} 5.1 TRÒ CHƠI DẠNG MỞ RỘNG VỚI THÔNG TIN ĐẦY ĐỦ  Tương tự, NC2 có tập thơng tin tầm thường: Tập thơng tin có hành động M, N Tập thơng tin có hành động P, Q Suy tập chiến lược NC2 {MP, MQ, NP, NQ} 5.1 TRỊ CHƠI DẠNG MỞ RỘNG VỚI THƠNG TIN ĐẦY ĐỦ  Xác định cân hồn hảo trị chơi phụ: - Khái niệm trò chơi phụ: trò chơi bên phân trị chơi phụ (1) tồn trị chơi (2) trị chơi (3) trị chơi (4) trị chơi 5.1 TRỊ CHƠI DẠNG MỞ RỘNG VỚI THÔNG TIN ĐẦY ĐỦ  Xác định cân hồn hảo trị chơi phụ: (đi từ gốc) Xét nhánh Nếu NC2 chọn M thu hoạch Nếu NC2 chọn N thù hoạch -> PƯ TN NC2 N Xét nhánh dưới: Nếu NC1 chọn C thu hoạch Nếu NC1 chọn D thu hoạch -> PƯ TN NC1 C 5.1 TRỊ CHƠI DẠNG MỞ RỘNG VỚI THƠNG TIN ĐẦY ĐỦ Xét nhánh dưới: Nếu NC1 chọn C thu hoạch Nếu NC1 chọn D thu hoạch -> PƯ TN NC1 C Đối với NC2: Nếu NC2 chọn P thu hoạch Nếu NC2 chọn Q (ứng vs PƯ TN NC1 C trên) thu hoạch -> PƯ TN NC2 P 5.1 TRÒ CHƠI DẠNG MỞ RỘNG VỚI THÔNG TIN ĐẦY ĐỦ Xét gốc: Nếu NC1 chọn A thu hoạch Nếu NC1 chọn B thu hoạch -> PƯ TN NC1 B Vậy cân trò chơi phụ (B,P)  Đưa trò chơi dạng Bimatrix tìm cân Nash: Tập chiến lược NC1 {AC, AD, BC, BD} Tập chiến lược NC2 {MP, MQ, NP, NQ} MP MQ NP NQ AC 1, 1, 2,3 2,3 AD 1, 1, 2,3 2,3 BC 4,5 5, 4,5 5, BD 4,5 4,3 4,5 4,3 CB Nash là: (BC, MP), (BC, NP) (BD, MP), (BD, NP) 5.2 TRÒ CHƠI MỞ RỘNG VỚI THÔNG TIN KHÔNG ĐẦY ĐỦ  Cặp nút nối gạch đứt nét gọi tập thơng tin KHƠNG tầm thường NC2  Với tập thơng tin này, NC2 khơng thể đốn biết bước chơi trước NC1 A hay B Xác định tập hợp chiến lược có người chơi: - Tập chiến lược NC1 là: {AE, AF, BE, BF} - Tập chiến lược NC2 {M, N}  Nếu khơng có nét đứt (tức tốn với thơng tin đầy đủ) tập chiến lược NC2 {MM, MN, NM, NN}  Ma trận lợi ích CB Nash: AE AF BE BF M 5, 5, 6, 5, N 7, 7, 4, 4, CB Nash (BE, M) BÀI TẬP VỀ CÂN BẰNG NASH-BAYES  Một kĩ sư A lựa chọn việc ứng tuyển vào công ty B mở doanh nghiệp riêng Công ty B lựa chọn việc thuê không thuê kĩ sư A Tuy nhiên lực nghề nghiệp người kĩ sư thông tin cá nhân biết Công ty B biết A có lực kiểu với xác suất 1/3 có lực kiểu với xác suất 2/3  Ma trận lợi ích thể bảng sau: (số đứng trước lợi ích A, số đứng sau lợi ích B) Tổ hợp chiến lược (chiến lược A; chiến lược B) sau cân Nash Bayes chiến lược (có thể có nhiều lựa chọn)? Giải thích a) (Nhận việc B/Kiểu 1, Nhận việc B/ Kiểu 2; không thuê) b) (Nhận việc B/Kiểu 1, Lập doanh nghiệp/ Kiểu 2; thuê) c) (Lập doanh nghiệp/Kiểu 1, Nhận việc B/ Kiểu 2; không thuê) d) (Lập doanh nghiệp/Kiểu 1, Nhận việc B/ Kiểu 2; thuê) BÀI TẬP VỀ CÂN BẰNG NASH-BAYES  Vì cơng ty B biết A có lực kiểu với xác suất 1/3 có lực kiểu với xác suất 2/3, nên tính lợi ích B phải tính theo xác suất a) (Nhận việc B/Kiểu 1, Nhận việc B/ Kiểu 2; khơng th)  Nếu B chọn KHƠNG TH thì: + A thuộc KIỂU PƯ TN A + A thuộc KIỂU PƯ TN A Lập doanh nghiệp Nhận việc Lập doanh nghiệp Nhận việc Suy “Nhận việc/kiểu 1, nhận việc/kiểu 2” PƯ TN A a) (Nhận việc B/Kiểu 1, Nhận việc B/ Kiểu 2; khơng th)  Nếu B chọn KHƠNG TH thì: + A thuộc KIỂU PƯ TN A + A thuộc KIỂU PƯ TN A Lập doanh nghiệp Nhận việc Lập doanh nghiệp Nhận việc Suy “Nhận việc/kiểu 1, nhận việc/kiểu 2” PƯ TN A  Ngược lại, A chọn chiến lược “Nhận việc/kiểu 1, nhận việc/kiểu 2” thì: + Lợi ích kì vọng B B chọn KHÔNG THUÊ là: 1/3*0 + 2/3*0 = + Lợi ích kì vọng B B chọn THUÊ là: 1/3*0 + 2/3*(-1) = - 2/3 Vậy PƯ TN B KHÔNG THUÊ Kết luận: tổ hợp chiến lược (Nhận việc B/Kiểu 1, Nhận việc B/ Kiểu 2; không thuê) cân Nash-Bayes b) (Nhận việc B/Kiểu 1, Lập doanh nghiệp/ Kiểu 2; thuê)  Nếu B chọn THUÊ thì: + A thuộc KIỂU PƯ TN A Lập doanh nghiệp Nhận việc + A thuộc KIỂU PƯ TN A “Nhận việc” Suy “Nhận việc/kiểu 1, lập doanh nghiệp/kiểu 2” PƯ TN A Kết luận: Tổ hợp chiến lược câu (b) CB Nash-Bayes c) (Lập doanh nghiệp/Kiểu 1, Nhận việc B/ Kiểu 2; không thuê)  Nếu B chọn KHƠNG TH … (giải thích giống câu a), chiến lược “Lập doanh nghiệp/Kiểu 1, Nhận việc B/ Kiểu 2” PƯ TN A  Ngược lại, A chọn chiến lược “Lập doanh nghiệp/kiểu 1, nhận việc/kiểu 2” thì: + Lợi ích kì vọng B B chọn KHÔNG THUÊ là: 1/3*0 + 2/3*0 = + Lợi ích kì vọng B B chọn TH là: 1/3*0 + 2/3*(-1) = - 2/3 Vậy PƯ TN B KHÔNG THUÊ Kết luận: tổ hợp chiến lược (Lập doanh nghiệp/Kiểu 1, Nhận việc B/ Kiểu 2; không thuê) cân Nash-Bayes d) (Lập doanh nghiệp/Kiểu 1, Nhận việc B/ Kiểu 2; thuê) CB Nash-Bayes

Ngày đăng: 16/03/2022, 16:05

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan