Chương trình giảng dạy kinh tế fulbright kinh tế học vi mô nhập môn lý thuyết trò chơi bài giảng phần 1 lý thuyết trò chơi và một số ứng dụng trong kinh tế vi mô
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 1 G G I I Ớ Ớ I I T T H H I I Ệ Ệ U U L L Ý Ý T T H H U U Y Y Ế Ế T T T T R R Ò Ò C C H H Ơ Ơ I I V V À À M M Ộ Ộ T T S S Ố Ố Ứ Ứ N N G G D D Ụ Ụ N N G G T T R R O O N N G G K K I I N N H H T T Ế Ế H H Ọ Ọ C C V V I I M M Ô Ô tra ba MC. (oligopoly), g này tham gia 1 Lý thuyết trò chơi n êên các bên khác. - trò hành g (complete information) (incomplete information). T 2 1 Lý thuyết trò chơi từ lâu đã trở thành một lĩnh vực quan trọng của kinh tế học nói chung. Nó có ứng dụng rộng rãi trong kinh tế học vi mô, vĩ mô, tài chính, quản trị, ngân hàng, thương mại quốc tế, chính trị, khoa học về chiến tranh, ngoại giao … nói chung là trong các môi trường có tương tác chiến lược. 2 Nếu mỗi người chơi ở thời điểm phải ra quyết định mà biết toàn toàn lịch sử của trò chơi cho đến thời điểm đó thì ta nói rằng trò chơi này có thông tin hoàn hảo (perfect information), bằng không chúng ta nói rằng trò chơi có thông tin không hoàn hảo (imperfect information). Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 2 Tĩnh Động Thông tin đầy đủ Nash Equilibrium – NE Subgame Perfect Nash Equilibrium -SPNS Thông tin không đầy đủ Bayesian Nash Equilibrium - BNE Perfect Bayesian Equilibrium - PBE Bảng 1: Phần 1: Trò chơi tĩnh với thông tin đầy đủ Dạng thức của trò chơi này là đồng thời ra quyết định (hay ) tối ưu hóa kết quả đều biết Biểu diễn trò chơi dưới dạng chuẩn tắc (normal-form representation) Ví dụ 1: Thế “lưỡng nan của người tù” . vào hai cho nhau và tù thay c ph c kia v th gian 6 thángheo 3 3 Một cách khác, dạng chuẩn tắc của trò chơi tĩnh với thông tin đầy đủ có thể được biểu diễn dưới dạng G = {S 1 , S 2 , …, S n ; u 1 , u 2 , …, u n } trong đó chúng ta có thể đọc được các thông tin về số người chơi (n), không gian chiến lược (hay các chiến lược có thể S i ), và các kết cục (payoff) tương ứng (u i ). Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 3 Giáp Khai Không khai Ất Khai -3, -3 0, -6 Không khai -6, 0 -1, -1 Bảng 2 Chiến lược áp đảo (dominant strategy) và chiến lược bị áp đảo (dominated strategy) Trong trò Nếu thằng Ất nhận tội tháng. thà mình cũng nhận tội 3 Nếu nó không khai tù à , mình cứ thật thà khai báo là hơndù t ca dù ca thì áp đảo (- dominant strategy) bị áp đảo (- dominated strategy) . Trái Trái 0, 4 4, 0 5, 3 4, 0 0, 4 5, 3 3, 5 3, 5 6, 6 Bảng 3 Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 4 Cân bằng Nash: G = {S1, S2n; u1, u2n}, Si và ui không gian chiến lược i, * 1, s * 2 * n) i * i i phản ứng tốt nhất n-1 * 1, s * 2 * i-1, s * i+1 * n) ( s * -i). Nói cách khác, ui(s * i, s * -iui(si, s * -i). s * i * max ( , ) i i i ii u s s sS , , t là Giáp và t tính ổn định và bền vững trategically stable tự chế tài (self-enforcement) mình Sau khi dự báo được ứng xử hành . hành phản ứng tốt nhất (best response). Quay la , và ph không phụ thuộc khai Một số ứng dụng của trò chơi tĩnh với thông tin đầy đủ Ứng dụng 1: Độc quyền song phương Cournot (1838) q1 và q2Q = q1 + q2 P(Q) = a Q = a (q1 + q2 cCi(qi) = c.qi , trong c < a. là Bài i) Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 5 ii) : Si = [0, a] iii) 1(q1, q2) = q1[P(Q) c ] = q1 [ a (q1 + q2) -c] 2(q1, q2) = q2[P(Q) c ] = q2 [ a (q1 + q2) -c] 1*, s2 u1(s1*, s2*) u1(s1, s2*) và u2(s1*, s2*) u2(s1*, s2) 11 * 211 ),(max Ss ssu = (q1, q2) = q1[a (q1 + q2*) -c] => q1 = 2 * 2 qca 3 * 2 * 1 ca qq 22 2 * 12 ),(max Ss ssu = (q1, q2) = q2[a(q1* + q2) -c] => q2 = 2 * 1 qca và 9 )( 2 * 2 * 1 ca Hình 1 , chúng có 4 2 công ty cấu kết với nhau và hoạt động như 1 công ty độc quyền 4 Điều kiện định giá trong thị trường cạnh tranh hoàn hảo là P 1 = MC 1 hay a – (q 1 + q * 2 ) = c; v P 2 = MC 2 hay a – (q * 1 + q 2 ) = c. Giải hệ 2 ẩn 2 phương trình này ta được q * 1 = q * 2 = (a-c)/2 và P 1 = P 2 = c. (a-c) (a-c)/2 (a-c)/3 q2 q1 (a-c)/3 (a-c) (a-c)/2 Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 6 [0, ] [ ( ) ] [ ] m Qa Max Q P Q c Q a Q c → 12 * * * * * * 12 2 2 4 3 m m m m Q a c a c a c Q q q q q Thay 22 * * * * * * 12 1 2 1 2 ( ) ( ) 4 8 9 mm a c a c a c qq * 1 và * 2 4 * 2 * 1 ca qq mm < 3 * 2 * 1 ca qq 8 )( 2 * 2 * 1 ca mm > 9 )( 2 * 2 * 1 ca liệu thỏa thuận này có ổn định và có khả năng tự chế tài hay không? mco giãn |Ed| > 1 %Q/%P > 1, hay %Q > %P 1 d nào thì doanh nghi v khi a a/2 Q a/2 a (a-c)/2 MR Em Hình 2 1 = q1[a c (q1 + q2)]. Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 7 4 * 22 ca qq m => ] 4 )(3 .[ 111 q ca q 111 1 1 2 4 )(3 4 )(3 q ca qq ca dq d 0 4 1 1 * 11 q ca qq m 1 1. : *m2 = qm2[a c (q1 + qm2)] = 0 4 )(3 4 1 * 2 1 dq d q ca ca m 1 Ứng dụng 2: “Cha chung không ai khóc” (Hardin 1968) tác và hàng hóa công - : n - Khô : {Si i Gmax} - : Vi = gi.v(g1 + g2 + gi-1 + gi + gi+1 n) cgi = gi.v(gi + g-i) - cgi i: ** ( ) '( ) 0 i i i i i v g g g v g g c (1) Ý nghĩa kinh tế của đẳng thức (1) v(gi + g-i) i êm bò. gi + g-i bò ùng v(gi + g-i) - gigi + g-i) = doanh thu biên i c ã nội hóa ngoại tácbò âbò ì có: * * * 1 ( ) '( ) 0v G G v G c n Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 8 .v(G) G.c : ** ** ** ( ) '( ) 0v G G v G c (2) Ý nghĩa kinh tế: àó ô Tuy nhiêà (2) có áà i óa ábò à không quan tâ bò áâó à làng) nêà bò làâày, ta pháoán * > G ** , tà bò ò nói cách khác, tài sản chung khi không được quản lý đúng đắn sẽ bị lợi dụng. â * > G ** ào 0. Tuy nhiê ààm v(G) là àm parabol có ên trên. G ** G * C v(G) + G.v’(G)/n v(G) + G.v’(G) G Giá trị Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 9 Chủ đề nâng cao: Chiến lược hỗn hợp 5 Ví dụ (pure Nash strategy). Tuy nhiên trong mixed strategy). xác t đoán trước bay sang q1- q) -1) + (1- q)1 = 1 - 2q; còn sang - q)(-1) = 2q 1 : q < 1/2 => Trái dự đoán -r) khi bay sang trái = r(1) + (1- r)(-1) = 2r -1. Còn -1) + (1- r)(1) = -2r +1. 5 Chủ đề về cân bằng Nash hỗn hợp này liên quan trực tiếp đến việc chứng minh sự tồn tại của cân bằng Nash đối với các trò chơi tĩnh với thông tin đầy đủ. Trái Trái -1 , 1 1 , -1 1 , -1 -1 , 1 Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi Niên khóa 2011 – 2012 Bài giảng Phần 1 Vũ Thành Tự Anh 10 Hình 3 Tài liệu tham khảo . q r Trái Phải 1/2 1/2 Trái Phải