1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phần 1: Nhập môn lý thuyết trò chơi

10 7 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 298,68 KB

Nội dung

Giới thiệu lý thuyết trò chơi và một số ứng dụng trong kinh tế học vi mô. Mời các bạn cùng tham khảo.

Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần GIỚI THIỆU LÝ THUYẾT TRÒ CHƠI VÀ MỘT SỐ ỨNG DỤNG TRONG KINH TẾ HỌC VI MÔ Cho đến nay, nghiên cứu bốn hình thái cấu trúc thị trường cạnh tranh hoàn hảo, độc quyền, cạnh tranh độc quyền, độc quyền nhóm Nguyên tắc tối đa hóa lợi nhuận doanh nghiệp hoạt động loại thị trường đầu quy tắc quen thuộc MR = MC Trong đó, thị trường độc quyền nhóm (oligopoly), doanh nghiệp thị trường có lực định, đồng thời tồn tương tác chiến lược (về định giá sản lượng chẳng hạn) với doanh nghiệp khác công thức MR = MC không thích hợp Vì vậy, để nghiên cứu ứng xử doanh nghiệp loại hình cấu trúc thị trường này, phải sử dụng công cụ có khả phân tích tương tác chiến lược doanh nghiệp tham gia thị trường Công cụ lý thuyết trò chơi.1 Lý thuyết trò chơi nghiên cứu tình định có liên quan tới nhiều người định người ảnh hưởng tới lợi ích định người khác Có số phương pháp phân loại trò chơi Nếu vào khả hợp đồng chế tài hợp đồng người chơi chia trò chơi thành hai loại: trò chơi hợp tác (cooperative games) trò chơi bất hợp tác (non-cooperative games) Trong trò chơi hợp tác, người chơi có khả lập chương trình (kế hoạch) hành động từ trước, đồng thời có khả chế tài thỏa thuận chung Còn trò chơi bất hợp tác, người chơi tiến tới hợp đồng (khế ước) trước hành động, có hợp đồng hợp đồng khó chế tài Phương pháp phân loại trò chơi thứ hai vào thông tin vào thời gian hành động người chơi Căn vào thông tin trò chơi chia thành trò chơi với thông tin đầy đủ (complete information) không đầy đủ (incomplete information) Trò chơi với thông tin đầy đủ trò chơi mà người chơi tính toán kết (payoff) tất người lại Căn vào thời gian hành động lại chia trò chơi thành hai loại, tónh động Trong trò chơi tónh (static game), người chơi hành động đồng thời, kết cuối người phụ thuộc vào phối hợp hành động tất người Trò chơi động (dynamic game) diễn nhiều giai đoạn, số người chơi hành động giai đoạn.2 Phối hợp hai tiêu thức phân loại ta có bốn hệ trò chơi tương ứng với Lý thuyết trò chơi từ lâu trở thành lónh vực quan trọng kinh tế học nói chung Nó có ứng dụng rộng rãi kinh tế học vi mô, vó mô, tài chính, quản trị, ngân hàng, thương mại quốc tế, trị, khoa học chiến tranh, ngoại giao … nói chung môi trường có tương tác chiến lược Nếu người chơi thời điểm phải định mà biết toàn toàn lịch sử trò chơi thời điểm ta nói trò chơi có thông tin hoàn hảo (perfect information), không nói trò chơi có thông tin không hoàn hảo (imperfect information) Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần bốn khái niệm điểm cân bằng, khái niệm cân sau mạnh khái niệm cân trước theo chiều mũi tên (xem Bảng 1) Thông tin đầy đủ Thông tin không đầy đủ Tónh Động Cân Nash – NE Subgame Perfect Nash Equilibrium -SPNS Bayesian Nash Equilibrium - BNE Perfect Bayesian Equilibrium - PBE Bảng 1: Bốn hệ trò chơi khái niệm cân tương ứng Phần 1: Trò chơi tónh với thông tin đầy đủ Dạng thức trò chơi người chơi đồng thời định (hay hành động) để tối ưu hóa kết (có thể độ thỏa dụng, lợi nhuận, v.v.); người chơi biết người khác cố gắng để tối đa hóa kết thu Kết cuối cho người phụ thuộc vào phối hợp hành động họ Biểu diễn trò chơi dạng chuẩn tắc (normal-form representation) Ví dụ 1: Thế “lưỡng nan người tù” Giả sử Giáp t ăn cắp, nhiên công an lại chưa tìm đủù chứng để luận tội hai người Mặc dù công an tạm giam hai người chưa thể kết tội Giáp t không nhận tội Công an nghó cách sau khiến Giáp t phải cung khai thật Công an giam Giáp t vào hai phòng tách biệt, không cho phép họ thông tin cho thông báo với người rằng: Nếu hai không chịụ nhận tội người bị giữ thêm tháng để thẩm tra tìm thêm chứng Nếu hai khai nhận tội người phải ngồi tù tháng Nếu có người nhận tội người ngoan cố không chịu nhận tội người thành khẩn cung khai hưởng khoan hồng ngồi tù, người chịu hình phạt nặng tháng tù giam Các khả kết cục trình bày cách chuẩn tắc Bảng đây.3 Một cách khác, dạng chuẩn tắc trò chơi tónh với thông tin đầy đủ biểu diễn daïng G = {S1, S2, …, Sn; u1, u2, …, un} đọc thông tin số người chơi (n), không gian chiến lược (hay chiến lược Si), kết cục (payoff) tương ứng (ui) Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Giáp Ất Khai Khoâng khai Khai -3, -3 0, -5 Khoâng khai -5, -1, -1 Bảng 2: Thế lưỡng nan người tù Chiến lược áp đảo (dominant strategy) chiến lược bị áp đảo (dominated strategy) Trong chơi này, Giáp t người lựa chọn hai chiến lược (hành động): Khai không khai Giáp tư “Nếu thằng t nhận tội mà lại không nhận tội trắng án phải ngồi bóc lịch tháng Như nhận tội để phải ngồi tù tháng hơn” Rồi Giáp lại nghó, “nhưng thằng t ngoan cường không khai nên nhỉ? Nếu không khai mà không khai phải ngồi tù tháng, mà khai tha bổng mà Như tốt mặc kệ thằng t, thật khai báo hơn.” Như vậy, dù t có lựa chọn phương án tốt Giáp khai nhận tội Tương tự vậy, dù t có lựa chọn phương án tốt Giáp khai nhận tội Nói cách khác, Giáp t chiến lược “khai nhận tội” chiến lược áp đảo (ưu - dominant strategy) so với chiến lược “không khai”; ngược lại, chiến lược “không khai” chiến lược bị áp đảo (khiếm - dominated strategy) so với chiến lược “khai nhận tội.” Trong ví dụ người chơi có hai chiến lược lựa chọn, chiến lược áp đảo đồng thời chiến lược tốt Trong toán có nhiều người chơi với không gian chiến lược lớn để tìm điểm cân trò chơi, phải loại trừ tất chiến lược bị áp đảo Tuy nhiên trò chơi phức tạp điều không đơn giản, chí loại hết chiến lược bị áp đảo chưa thể tìm điểm cân Trong ví dụ trình bày Bảng 3, có hai người chơi, người có lựa chọn Sau loại hết chiến lược bị áp đảo chưa thể tìm điểm cân Xuất phát từ hạn chế phương pháp loại trừ chiến lược bị áp đảo, Nash đưa khái niệm cân mạnh Trái Giữa Phải Trái 0, 4, 5, Giữa 4, 0, 5, Phaûi 3, 3, 6, Bảng 3: Loại trừ chiến lược bị áp đảo cân Nash Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Trong ví dụ Bảng 3, cân Nash (phải, phải) với kết cục (6,6) dùng phương pháp loại trừ chiến lược bị áp đảo kết luận đâu điểm cân Cân Nash: Trong trò chơi dạng chuẩn tắc G = {S1, S2, …, Sn; u1, u2, …, un}, Si ui không gian chiến lược (strategy space) độ thỏa dụng người chơi thứ i, tổ hợp chiến lược (s*1, s*2, …, s*n) cân Nash nếu, với người chơi i đó, s*i (chiến lược người thứ i lựa chọn) phản ứng tốt người chơi chiến lược (n-1) người chơi lại (s*1, s*2, …, s*i-1, s*i+1, …, s*n) (ký hiệu s*-i) Nói cách khác, ui(s*i, s*-i) ≥ ui(si, s*-i) * Về mặt toán học, s*i nghiệm toán tối ưu: max u i ( s i , s − i ) si ∈Si Trong ví dụ Giáp Ất, điểm cân trò chơi (“khai”, “khai”) Giáp Ất khai nhận tội, cân Nash trò chơi Lưu ý cân Nash tạo chiến lược phản ứng tốt tất người chơi (ứng với chiến lược tối ưu người chơi lại) nên có tính ổn định bền vững mặt chiến lược (strategically stable), đồng thời có tính chất tự chế tài (self-enforcement) – tức người chơi, cực đại hóa lợi ích (trong người khác cố làm vậy), tự nguyện tuân thủ cân Nash, đồng thời họ động để di chuyển khỏi điểm cân Sau dự báo ứng xử người chơi khác người chơi chọn chiến lược (quyết định) để tối ưu hóa lợi ích Chiến lược (quyết định) gọi phản ứng tốt (best response) Quay lai toán người tù, lập luận phần trên, “nhận tội” phản ứng tốt Giáp t, phản ứng tốt không phụ thuộc vào hành động cụ thể người (nhớ lại “nhận tội” chiến lược áp đảo) Một số ứng dụng trò chơi tónh với thông tin đầy đủ Ứng dụng 1: Độc quyền song phương Cournot (1838) Giả sử có công ty hoạt động thị trường độc quyền song phương theo kiểu Cournot sản xuất sản phẩm đồng Sản lượng hai hãng q1 q2 Tổng cung thị trường Q = q1 + q2 Để đơn giản, giả sử hàm cầu có dạng tuyến tính: P(Q) = a – Q = a – (q1 + q2) Cuối cùng, giả sử chi phí cận biên chi phí trung bình hãng số c, tức là: Ci(qi) = c.qi , c < a Bài toán hãng chọn sản lượng để tối đa hóa lợi nhuận • Bài toán dạng chuẩn tắc: Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 i) Số người chơi: ii) Không gian chiến lược: Si = [0, a] iii) Kết Nhập môn Lý thuyết trò chơi Phần Π1(q1, q2) = q1[P(Q) – c ] = q1 [ a – (q1 + q2) -c] Π2(q1, q2) = q2[P(Q) – c ] = q2 [ a – (q1 + q2) -c] • Định nghóa cân Nash: Cặp (s1*, s2*) cân Nash Ù u1(s1*, s2*) ≥ u1(s1, s2*) vaø u2(s1*, s2*) ≥ u2(s1*, s2) * a − c − q2 Ù max u ( s1 , s ) = Π(q1, q2) = q1[a –(q1 + q2*) -c] => q1 = s1 ∈ S * q1* = q2* = a−c a − c − q1 max u ( s 1* , s ) = Π(q1, q2) = q2[a–(q1* + q2) -c] => q2 = s2 ∈ S * vaø Π 1* = Π *2 = (a − c) q2 (a-c) (a-c)/2 (a-c)/3 (a-c)/3 (a-c)/2 (a-c) q1 Hình 1: Cân Nash cạnh tranh độc quyền song phương Cournot So với trường hợp cạnh tranh hồn hảo, rõ ràng hai cơng ty có vị độc quyền song phương chúng hạn chế sản lượng, đồng thời giữ mức giá cao thu lợi nhuận độc quyền dài hạn.4 Điều kiện định giá thị trường cạnh tranh hoàn toàn P1 = MC1 hay a – (q1 + q*2) = c; P2 = MC2 hay a – (q*1 + q2) = c Giải hệ ẩn phương trình ta q*1 = q*2 = (a-c)/2 P1 = P2 = c Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Bây xem xét trường hợp công ty cấu kết với hoạt động công ty độc quyền Khi ấy, chúng phải giải chọn Q cho: Max Π m = Q[ P ( Q ) − c ] = Q[ a − Q − c ] Q∈[ ,a ] Qm* a −c a −c a −c * * * * → Qm = ⇒ qm = qm = = < = q1 = q , giả sử hai 2 hãng chia đôi sản lượng a −c ( a −c )2 ( a −c )2 * * * * * * Thay q1 = q = ⇒ Πm = Πm = > = Π = Π ; 2 * * Π vaø Π lợi nhuận hai công ty chúng cạnh tranh với theo kiểu Cournot * q m* = q m* = a−c a−c < q1* = q 2* = Π *m1 = Π *m = (a − c) (a − c) > Π 1* = Π *2 = Từ kết thấy hai công ty có động cấu kết với để kiềm chế sản lượng và chia sẻ lợi nhuận độc quyền Một câu hỏi đặt liệu thỏa thuận có ổn định có khả tự chế tài hay không? Tại điểm cân thị trường độc quyền (Em), độ co dãn cầu với giá|Ed| > Ù%∆Q/%∆P > 1, hay %∆Q > %∆P Vì doanh nghiệp tăng sản lượng lượng đủ nhỏ mức giảm giá nhỏ mức tăng sản lượng; điều có nghóa doanh nghiệp tăng sản lượng có lợi tất nhiên doanh nghiệp giữ cam kết bị thiệt a Em a/2 MR Q (a-c)/2 a/2 a Hình 2: Sự không bền vững thỏa thuận cấu kết Một cách khác, xác hơn, để thấy thỏa thuận cấu kết khả tự chế tài sử dụng phép chứng minh toán Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Ta biết: Π1 = q1[a – c – (q1 + q2)] Baây giả sử q = q m* = a−c 3(a − c) => Π1 = q1.[ − q1 ] 4 dΠ1 3(a − c) 3(a − c) = − q1 − q1 = − 2q1 dq1 4 Neáu q1 = q m* = ∂Π a−c >0 ⇒ ∂q1 Như vậy, doanh nghiệp tăng Π1 cách tăng q1 Trong aáy: a − c  3(a − c)  − q1  Π*m2 = qm2[a – c – (q1 + qm2)] =    dΠ *m ⇒ < , tức doanh dq1 nghiệp tăng q1 lợi nhuận doanh nghiệp giảm Chúng ta kết luận biện pháp chế tài đáng tin cậy thỏa thuận thông đồng có nhiều khả bị phá vỡ cách đơn phương song phương Đây ví dụ khác “thế lưỡng nan người tù” Ứng dụng 2: “Cha chung khơng khóc” (Hardin 1968) Quay trở lại ví dụ thảo luận chương “Ngoại tác hàng hóa cơng” Bài tốn trình bày dạng chuẩn tắc sau: - Số người tham gia : n - Không gian chiến lược : {Si : ≤ gi ≤ Gmax} - Kết : Vi = gi.v(g1 + g2 + … + gi-1 + gi + gi+1 + … + gn) – cgi = gi.v(gi + g-i) cgi Điều kiện tối ưu người thứ i: * * v ( g i + g − i ) + g i v '( g i + g − i ) − c = (1) Ý nghĩa kinh tế đẳng thức (1) v(gi + g-i) = v(G) = doanh thu người thứ i tăng thêm chăn thả thêm bò v’(gi + g-i) = doanh thu người thứ i bị giảm ngoại tác tiêu cực có thêm bị cuối v(gi + g-i) - gi.v’(gi + g-i) = doanh thu biên người thứ i c = chi phí biên người thứ i Như vậy, người thứ i “nội hóa ngoại tác” đàn bị khơng quan tâm đến ngoại tác gây cho đàn bị người khác Vũ Thaønh Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Cộng vế theo vế điều kiện tối ưu cho n hộ gia đình, sau chia vế cho n ta * * * có: v ( G ) + G v '( G ) − c = n Bây giả sử định số bò chăn thả định cá nhân người mà định tập thể làng Khi toán làng chọn G để tối đa hóa V, V = G.v(G) – G.c ** ** ** Điều kiện tối ưu : v ( G ) + G v '( G ) − c = (2) Ý nghĩa kinh tế: Điều kiện (2) tương tự điều kiện (1), diễn giải công thức MR = MC Tuy nhiên, (1) (2) có khác biệt bản, đẳng thức (1), người thứ i nội hóa ngoại tác cho đàn bị mà mặc kệ đàn bị người khác (hệ số 1/n), đẳng thức (2), có người định (già làng) nên người nội hóa ngoại tác tồn đàn bị làng Từ phân biệt này, ta phán đoán G* > G**, tức số bò chăn thả định có tính cá nhân lớn số bị chăn thả định mang tính chất tập thể Hay nói cách khác, tài sản chung không quản lý đắn bị lợi dụng Đây lại ví dụ minh họa lưỡng nan Để chứng minh G* > G**, ta sử dụng giả thiết ban đầu: v(0) = 0, v’(G) > G nhỏ, sau G vượt qua mức v’(G) < Tuy nhiên v”(G) < với giá trị G Những giả thiết ngụ ý hàm v(G) hàm parabol có mặt lồi hướng lên Giá trị v(G) + G.v’(G)/n v(G) + G.v’(G) C G** Vũ Thaønh Tự Anh G* G Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Chủ đề nâng cao: Chiến lược hỗn hợp5 Ví dụ: Trong tình đá phạt đền, thường thủ môn phải phán đoán hướng sút cầu thủ, cầu thủ phải phán đoán hướng bay thủ môn Trong trường hợp người chơi phán đoán trước chiến lược (hành động) người chơi khác cân Nash túy (pure Nash strategy) Tuy nhiên trường tìm cân Nash hỗn hợp (mixed strategy) Cũng toán tìm cân Nash bình thường (thuần túy), tìm cân Nash hỗn hợp phải tìm phản ứng tốt người chơi ứng với phản ứng tốt người chơi lại Điểm khác biệt quan trọng chỗ, tìm cân Nash hỗn hợp, cần sử dụng thông tin có tính tiên đoán người chơi ứng xử người chơi lại Giả sử cầu thủ đoán trước thủ môn Thủ môn bay sang trái với xác suất q, sang phải Trái Phải với xác suất (1- q) Quy ước “phải”, Trái -1 , 1 , -1 “trái” theo chiều sút cầu thủ Cầu thủ Với niềm tin này, kết kỳ vọng Phải , -1 -1 , cầu thủ đá sang traùi = q(-1) + (1- q)1 = - 2q; kết kỳ vọng cầu thủ đá sang phaûi = q + (1- q)(-1) = 2q –1 Như vậy, phản ứng tốt cầu thủ là: Nếu q > 1/2 => Phải Nếu q < 1/2 => Trái Nếu q = 1/2 => Bên Tương tự thủ môn: Giả sử thủ môn dự đoán cầu thủ đá sang trái với xác suất r, sang phải với xác suất (1-r) Với niềm tin này, kết kỳ vọng thủ môn bay sang trái = r(1) + (1- r)(-1) = 2r -1 Còn kết kỳ vọng thủ môn bay sang phải = r (-1) + (1- r)(1) = -2r +1 Như vậy, phản ứng tốt cầu thủ là: Nếu r > 1/2 => Trái Nếu r < 1/2 => Phải Nếu r = 1/2 => Bên Kết hợp hai phản ứng chiến lược ta có điểm cân Nash hỗn hợp (r=1/2, q=1/2) biểu diễn hình vẽ đây: Chủ dề cân Nash hỗn hợp liên quan trực tiếp đến việc chứng minh tồn cân Nash trò chơi tónh với thông tin đầy đủ Vũ Thành Tự Anh Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2008 – 2009 Kinh tế vi mô MPP 511 Nhập môn Lý thuyết trò chơi Phần Hình 3: Cân Nash hỗn hợp r Trái 1/2 Phải Phải 1/2 Trái q Tài liệu tham khảo Robert Gibbons, “Game Theory for Applied Economists”, Princeton University Press, 1992 Vũ Thaønh Tự Anh 10 ... Perfect Bayesian Equilibrium - PBE Bảng 1: Bốn hệ trò chơi khái niệm cân tương ứng Phần 1: Trò chơi tónh với thông tin đầy đủ Dạng thức trò chơi người chơi đồng thời định (hay hành động) để tối... 511 Nhập môn Lý thuyết trò chơi Phần Trong ví dụ Bảng 3, cân Nash (phải, phải) với kết cục (6,6) dùng phương pháp loại trừ chiến lược bị áp đảo kết luận đâu điểm cân Cân Nash: Trong trò chơi. .. 511 Nhập môn Lý thuyết trò chơi Phần Chủ đề nâng cao: Chiến lược hỗn hợp5 Ví dụ: Trong tình đá phạt đền, thường thủ môn phải phán đoán hướng sút cầu thủ, cầu thủ phải phán đoán hướng bay thủ môn

Ngày đăng: 14/05/2021, 22:01

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w