Một số thuật toán trong lý thuyết trò chơi

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KHOA HỌC PHẠM THỊ THU PHƢƠNG MỘT SỐ THUẬT TOÁN TRONG LÝ THUYẾT TRỊ CHƠI LUẬN VĂN THẠC SĨ TỐN HỌC THÁI NGUYÊN – 2014 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KHOA HỌC PHẠM THỊ THU PHƢƠNG MỘT SỐ THUẬT TOÁN TRONG LÝ THUYẾT TRỊ CHƠI Chun ngành: TỐN ỨNG DỤNG Mã số: 60.46.01.12 LUẬN VĂN THẠC SĨ TOÁN HỌC NGƢỜI HƢỚNG DẪN KHOA HỌC TS VŨ MẠNH XUÂN THÁI NGUYÊN– 2014 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn MỤC LỤC MỤC LỤC LỜI CẢM ƠN MỞ ĐẦU Chƣơng 1: SƠ LƢỢC VỀ LÝ THUYẾT TRÒ CHƠI 1.1 Xuất xứ 1.2 Một số toán 1.2.1 Bài toán 1.2.2 Bài toán 1.3 Một số khái niệm 10 Chƣơng 2: MỘT SỐ THUẬT TỐN TRỊ CHƠI 14 2.1 Trò chơi ma trận 14 2.2 Các chiến lƣợc trò chơi ma trận 16 2.2.1 Các chiến lƣợc túy trò chơi ma trận 16 2.2.2 Các chiến lƣợc hỗn hợp trò chơi ma trận 20 2.2.3 Lý thuyết trò chơi dƣới dạng qui hoạch tuyến tính 32 2.2.4 Chiến lƣợc bƣớc phƣơng pháp Brown 37 KẾT LUẬN 43 TÀI LIỆU THAM KHẢO 44 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn LỜI CẢM ƠN Sau thời gian nghiên cứu tìm hiểu, em hồn thành Luận văn Thạc sỹ tốn học chun ngành Toán ứng dụng với đề tài: “Một số thuật toán lý thuyết trò chơi” Lời em xin bày tỏ lòng biết ơn sâu sắc tới Thầy giáo TS Vũ Mạnh Xuân tận tình hƣớng dẫn em suốt trình nghiên cứu thực luận văn Em xin chân thành cảm ơn Quý thầy tham gia giảng dạy,các thầy phịng đào tạo Nguyễn Thị Thu Thủy trƣởng khoa Tốn Tin trƣờng Đại học Khoa học – Đại học Thái Nguyên hƣớng dẫn, truyền đạt kiến thức, tạo điều kiện giúp đỡ cho em suốt thời gian theo học thực luận văn Qua việc nghiên cứu hồn thành luận văn, em có thêm nhiều kiến thức bổ ích chun mơn nhƣ phƣơng pháp luận nghiên cứu khoa học Trong khuôn khổ luận văn, chắn chƣa đáp ứng đƣợc đầy đủ vấn đề đặt Vì điều kiện nghiên cứu hạn chế, nên cố gắng nhiều nhƣng luận văn không tránh khỏi thiếu sót Em mong nhận đƣợc đóng góp ý kiến, phê bình quý báu nhà khoa học, thầy cô bạn đồng nghiệp Một lần em xin chân thành cảm ơn ! Thái Nguyên, tháng 09 năm 2014 Học viên Phạm Thị Thu Phƣơng Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn MỞ ĐẦU Lý thuyết trò chơi nhánh Toán học ứng dụng Ngành nghiên cứu tình chiến thuật đối thủ lựa chọn hành động khác để cố gắng làm tối đa kết nhận đƣợc Lý thuyết trò chơi nghiên cứu định đƣợc đƣa mơi trƣờng gồm có đối thủ tƣơng tác với nghiên cứu cách lựa chọn hành vi tối ƣu chi phí lợi ích lựa chọn không cố định mà phụ thuộc vào lựa chọn cá nhân khác Mặc dù lĩnh vực mẻ, song lý thuyết trò chơi đƣợc sử dụng nhiều ngành khoa học, từ Sinh học, Triết học, khoa học máy tính, kinh tế học trị, quân văn hóa Trong trƣờng đại học, lý thuyết trị chơi chủ yếu đƣợc giới thiệu sơ lƣợc với số ngành thuộc lĩnh vực kinh tế Mục đích đề tài nhằm nghiên cứu khái quát lý thuyết trò chơi, số chiến lƣợc trò chơi ma trận minh họa ví dụ cụ thể Kết cấu luận văn phần mở đầu kết luận đƣợc chia làm hai chƣơng nhƣ sau: Chƣơng 1: Trình bày sơ lƣợc lý thuyết trị chơi từ đời phát triển nhƣ lĩnh vực ứng dụng Một số ví dụ khái niệm Chƣơng 2: Trình bày số thuật tốn trị chơi ma trận minh họa ví dụ cụ thể Do hạn chế thời gian điều kiện nghiên cứu nhƣ khó khăn thân nên luận văn chắn cịn nhiều khiếm khuyết Số hố Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Chƣơng 1: SƠ LƢỢC VỀ LÝ THUYẾT TRỊ CHƠI Chƣơng trình bày lý thuyết trị chơi xuất xứ nó, toán nhƣ khái niệm ứng dụng lý thuyết trò chơi thực tế Các kiến thức chƣơng đƣợc tham khảo sử dụng tài liệu:  Don Ross (2010), Games Theory  Jim Ratliff (1997), Strategic form Games  Fudenberg (1991), Drew and Jean Tirole: Game Theory, MIT Press 1.1 Xuất xứ Lý thuyết trị chơi nhánh Tốn học ứng dụng Ngành nghiên cứu tình chiến thuật đối thủ lựa chọn hành động khác để cố gắng làm tối đa kết nhận đƣợc Việc phân tích tình cạnh tranh có hai mục tiêu Mục tiêu thứ tìm hiểu đƣợc bên tham gia trị chơi tình cạnh tranh lại ứng xử nhƣ họ làm Mục tiêu thứ hai có tính thực dụng có khả gợi cho ngƣời chơi cách chơi cách chơi tốt Mục tiêu thứ đặc biệt quan trọng trò chơi mức rộng, có nhiều ngƣời chơi có quy tắc chơi phức tạp Theo đuổi mục tiêu thứ hai cho phép mơ tả cho ngƣời chơi chiến lƣợc tốt mà ngƣời ta chơi Những thảo luận đƣợc biết đến lý thuyết trò chơi xuất thƣ viết James Waldegrave vào năm 1713 Trong thƣ này, Waldegrave đƣa lời giải chiến thuật hỗn hợp minimax cho trò đánh hai ngƣời chơi Le Her Chỉ đến xuất “Nghiên cứu Định luật toán học lý thuyết Tài sản” Antoine Augustin Cournot vào năm 1838 phân tích chung lý thuyết trị chơi đƣợc theo đuổi Mặc dù phân tích Cournot tổng quát Waldegrave, lý thuyết trò chơi chƣa thật tồn nhƣ ngành John von Neumann xuất loạt báo vào năm 1928 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Những kết sau đƣợc mở rộng thêm sách xuất năm 1944 “Lý thuyết trò chơi hành vi kinh tế” von Neumann Oskar Morgenstern Tác phẩm uyên thâm chứa đựng phƣơng pháp tìm lời giải tối ƣu cho trị chơi tổng không với hai ngƣời chơi Trong suốt khoảng thời gian này, tác phẩm lý thuyết trò chơi chủ yếu tập trung vào lý thuyết trị chơi hợp tác, phân tích chiến thuật tối ƣu cho nhóm cá nhân, giả sử họ bảo đảm thỏa thuận giữ họ với chiến thuật thích hợp Vào năm 1950, thảo luận Prisoner's dilemma xuất hiện, thí nghiệm đƣợc làm trị chơi cơng ty RAND Vào khoảng thời gian đó, John Nash phát triển định nghĩa chiến thuật "tối ƣu" cho trò chơi với nhiều ngƣời chơi, đƣợc biết đến nhƣ cân Nash Cân đủ tổng quát, cho phép phân tích trị chơi khơng hợp tác thêm vào trị chơi có hợp tác Lý thuyết trị chơi trải qua thời gian sôi động năm 1950, năm khái niệm cốt lõi, dạng trò chơi bao quát, trò chơi giả, trò chơi lặp, giá trị Shapley đƣợc phát triển Thêm vào đó, ứng dụng lý thuyết trị chơi vào triết học khoa học trị diễn thời gian Vào năm 1965, Reinhard Selten giới thiệu khái niệm lời giải cân lý tƣởng trị chơi con, làm xác thêm cân Nash Vào năm 1967, John Harsanyi phát triển khái niệm thơng tin hồn tồn trị chơi Bayesian Ông ta, với John Nash Reinhard Selten, đoạt giải thƣởng Nobel kinh tế vào năm 1994 Trong năm 1970, lý thuyết trò chơi đƣợc áp dụng rộng rãi vào sinh học, chủ yếu kết cơng trình John Maynard Smith chiến lƣợc tiến hóa bền vững ơng Thêm vào đó, khái niệm Số hố Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn cân liên quan, hoàn toàn rung tay, kiến thức chung đƣợc giới thiệu phân tích Vào năm 2005, lý thuyết gia trò chơi Thomas Schelling Robert Aumann đoạt giải thƣởng Nobel kinh tế Schelling mơ hình động, ví dụ ban đầu lý thuyết tiến hóa trị chơi Aumann đóng góp thêm vào trƣờng cân (equilibrium school), phát triển cân làm thô cân liên quan phát triển phân tích chi tiết giả sử kiến thức chung Năm 2012, hai ngƣời Mỹ Alvin Roth Lloyd Shapley đƣợc trao giải Nobel kinh tế nhờ cơng trình lý thuyết phân phối ổn định thực tiễn tạo lập thị trƣờng, sở sử dụng lý thuyết trò chơi thực nghiệm Ngày nay, sống có nhiều ví dụ liên quan đến áp dụng lý thuyết trò chơi nhƣ: - Chơi cờ, chơi bài, đánh bạc chơi xổ số nghiên cứu tần số xuất số - Thi đấu thể thao - Chiến thuật, chiến lƣợc quân - Cạnh tranh kinh tế doanh nghiệp với chiến lƣợc sản xuất nghiên cứu thị trƣờng tiêu thụ - Cạnh tranh với thời tiết nói chung với thiên nhiên sản xuất nơng nghiệp nói riêng hay kinh tế nói chung - Phƣơng án vận chuyển tuyến đƣờng tình khẩn cấp với thời tiết thay đổi vvv Từ ta thấy rằng, lý thuyết trị chơi đƣợc ứng dụng rộng khắp tất lĩnh vực từ văn hóa, trị, quân sự, kinh tế nhiều ngành khác Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 1.2 Một số toán 1.2.1 Bài toán Bài tốn trị chơi qua sơng: Giả sử bạn muốn ngang qua sơng có ba cầu (Giả sử việc bơi, lội, thuyền khơng thể đƣợc) Chiếc cầu an tồn khơng có trở ngại Chiếc cầu thứ hai nằm dƣới chân mỏm đá có tảng đá lớn rơi xuống Chiếc cầu thứ ba có rắn hổ mang độc sống Giả sử bạn ngƣời trốn chạy ngƣời có súng đợi bạn bên bờ sông Hắn ta đuổi kịp, bắn bạn, giả định nhƣ vậy, ta đợi cầu an toàn mà bạn cố vƣợt qua Vấn đề đặt bạn chọn cho cầu để vƣợt qua sơng? Bài tốn bạn nhận rằng: bạn phải chọn lối an tồn cho cho tránh đƣợc chƣớng ngại vật nhƣ tránh đƣợc ngƣời truy đuổi Dƣờng nhƣ bạn bị rơi vào bẫy tình khơng thể định đƣợc Tồn an ủi bạn là: bờ sông bên ngƣời săn đuổi bạn bị mắc vào bẫy khó xử đó, khơng thể định đƣợc nên đợi cầu nào,vì ta hình dung phải đợi cầu ta lại nhận ta tìm lý tốt để chọn đƣợc cầu, bạn đốn trƣớc đƣợc lý để lại tránh ta Vì trị chơi ngƣời chạy trốn lẫn kẻ truy đuổi có vận động ngƣời lựa chọn vận động họ mà ngƣời lựa chọn vận động Ba chiến lƣợc ngƣời chạy – qua cầu an toàn, tảng đá có nguy bị rơi nguy gặp rắn hổ mang – tạo thành hàng ma trận Tƣơng tự nhƣ ba chiến lƣợc ngƣời săn đuổi - đợi cầu an toàn, đợi cầu có đá rơi, đợi cầu có rắn hổ mang – tạo thành Số hố Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn cột ma trận Mỗi ô ma trận rõ rõ ma trận hoàn thiện – kết đƣợc xác định khuôn khổ khoản trả ngƣời chơi Một khoản đƣợc trả ngƣời chơi đơn giản số đƣợc ấn định hàm tiện ích thứ tự ngƣời săn đuổi cho trạng kiện phù hợp với kết Đối với kết quả, khoản đƣợc trả Hàng luôn đƣợc kê trƣớc hết, sau đến khoản đƣợc trả Cột Vì chẳng hạn nhƣ góc trái cho thấy ngƣời chạy trốn qua cầu an tồn cịn ngƣời săn đuổi chờ ngƣời chạy trốn nhận đƣợc khoản đƣợc trả 0, ngƣời săn đuổi nhận đƣợc khoản đƣợc trả Chúng ta lý giải điều cách qui chiếu vào hàm tiện ích họ mà chơi đơn giản Nếu ngƣời chạy trốn qua sơng đƣợc an tồn nhận đƣợc khoản đƣợc trả 1; khơng an tồn đƣợc Nếu ngƣời chạy trốn khơng thực đƣợc bị bắn bị đá rơi vào bị rắn hổ mang cơng ngƣời săn đuổi nhận đƣợc khoản đƣợc trả ngƣời chạy trốn Bất ngƣời săn đuổi đợi cầu mà ngƣời chạy trốn lựa chọn ngƣời chạy trốn bị bắn Tất kết tạo vector khoản đƣợc trả (0, 1) Bạn tìm chúng cách vạch chéo xuống qua ma trận từ góc phía bên trái xuống Bất mà ngƣời bỏ trốn chọn cầu an toàn nhƣng ngƣời săn đuổi lại đợi chỗ khác ngƣời chạy trốn qua sơng đƣợc an toàn, cách nhận đƣợc khoản đƣợc trả theo vector (1, 0) Hai kết đƣợc rõ hai ô thứ hai hàng đầu Đến lúc tồn cịn lại đƣợc đánh dấu dấu hỏi Tại sao? Vấn đề ngƣời bỏ trốn qua sông chỗ cầu đá rơi chỗ cầu có rắn hổ mang đƣa yếu tố tham số vào trò chơi Trong trƣờng hợp hứng lấy rủi ro bị giết, mà tạo vector khoản đƣợc trả (0,1), có nghĩa độc lập với ngƣời săn Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 30 Bài toán 3: 2  Input: Cho ma trận trò chơi: A   1 1 10  Out put: Tìm chiến lƣợc tối ƣu ngƣời chơi giá trò chơi Thuật tốn giải: Khơng có lời giải chiến lƣợc túy, vì: v  max aij  max 1, 1,1  1i 3 1 j 6 v  max aij  3, 4,6,9,9,10  1 j  1i 3 Nhƣ v  v Do ta tìm đƣợc lời giải chiến lƣợc hỗn hợp Trƣớc hết ta loại bỏ chiến lƣợc thừa: - So sánh cột cột ta thấy < 3, < 4, < tức a i1 < a i với i = 1,3 Vậy bỏ cột chiến lƣợc thừa ngƣời - Vì a i1 < a i5 với i = 1,3 nên bỏ cột (vì chiến lƣợc thừa ngƣời 2) 2  - Trong ma trận lại:  1 1 10  Vì dịng thứ nhỏ ( 2 1 dòng thứ hai + dòng thứ ba ) cụ thể: 2 1 1 (3  1) ,  (6  4) ,  (2  9) ,  ( 1  10) nên ta loại bỏ dòng 1, 2 2 3 1 lại ma trận: A    1 10  Nhƣng cịn cột thứ hai lớn cột thứ ( > 3, > 1), 3 1 nên sau loại cột thứ hai ta ma trận: A    1 10  Với ma trận giải phƣơng pháp đồ thị Ta có: Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 31 v1  3p (1  p)  p v2  p 9(1  p)  7 p v3   p 10(1  p)  11p 10 v1 = v2 : 2p  7 p p  25 v1 = v  , v3 = 9 v1 = v3 : 2p  11p 10 p  31 54 v1 = v3  , v = 13 13 13 v2 = v3 : 7 p  11p 10 p  29 v = v3  , v1 = 4 Trên bảng sau với giá trị tăng dần p: P v1 v2 v3   31 13 10 29 29 54 13 31 13  1  14 13 89 Ta có: với  p  Với 25 25 9 31 v1  min(v1 , v2 , v3 ) max v1  v1    13  13  13   31  p  v3  min(v1 , v , v3 ) max v3  v3    13  13  13 Vậy giá chơi là: max v j  0 p 1 1 j 3 31 đạt p  13 13 Chiến lƣợc tối ƣu ngƣời thứ : - Theo ma trận A  ,   13 13  - Theo ma trận A  0, ,   13 13  Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 32 Để tìm chiến lƣợc tối ƣu ngƣời thứ hai ta giải hệ: 31  3q1 + 2q  (1  q1  q )  13  q + 9q  10(1  q  q )  31 2  13 Giải ta đƣợc q1  253 , q2 = , 299 q3  46 299 Nhƣ chiến lƣợc tối ƣu ngƣời thứ hai: 253 46  - Theo ma trận A  , 0,  299 299   253 46  - Theo ma trận ban đầu A  , 0, 0, 0, 0,  299 299   2.2.3 Lý thuyết trò chơi dƣới dạng qui hoạch tuyến tính Nếu tốn lý thuyết trị chơi dƣới dạng ma trận khơng có lời giải theo chiến lƣợc túy không giải đƣợc phƣơng pháp đồ thị để tìm lời giải thích xác trò chơi ngƣời ta sử dụng phƣơng pháp qui hoạch tuyến tính m Gọi: v j   a ijpi ; pi  ; i1 m p i 1 i1 Là thắng lợi đảm bảo chiến lƣợc hỗn hợp (p1 , p , , p m ) ngƣời chơi thứ nhất, ngƣời chơi thứ hai sử dụng chiến lƣợc j ; j 1, n gọi: m v  min(v1 , v , , v n )   a ijpi  1 j  n i 1 Thì chiến lƣợc maximin ngƣời chơi thứ tìm (p1 , p , , p m ) nhằm đạt max v n Gọi: u i   a ijq j ; q j  ; j1 n q j 1 j 1 Là thất bại đảm bảo với chiến lƣợc (q1 , q , , q n ) ngƣời chơi thứ hai, ngƣời chơi thứ sử dụng chiến lƣợc i ; i  1, m gọi: Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 33 n n j 1 j1 u  max(u1 , u , , u m )  max  a ijq j tức u   a ijq j với i  1, m chiến 1i  m lƣợc minimax ngƣời chơi thứ hai tìm vectơ (q1 , q , , q n ) nhằm đạt u Bài toán cực đại hóa thắng lợi đảm bảo ngƣời chơi thứ tốn cực tiểu hóa thất bại đảm bảo ngƣời chơi thứ hai dẫn tới cặp toán đối ngẫu sau qui hoạch tuyến tính Với ngƣời thứ Với ngƣời thứ hai F = v  max G = u  n m a  a ijpi  v ; j = 1, n i1 j1 m n ij q j  u ; i  1, m  pi  q pi  ; i  1, m q j  ; j = 1, n j 1 i1 j 1 - Nếu a ij  với i  1, m j = 1, n cách đổi biến: xi = q pi ; i  1, m y j = j ; j = 1, n v u Q trình giải tốn trở nên đơn giản Vì m  xi = i 1 m a p i 1 ij i m pi   v i 1 v n ; j 1 n m  v  a ij x i  yj = ; i 1 a j 1 n qj   u j 1 u n ij q j  u  a ij y j j 1 Nên cặp toán trở thành cặp đối ngẫu sau: m 1  f   x i     v  i1 n 1  g   y j  max   max  u  j1 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 34 m a n a ij x i  ; j = 1, n ij y j  ; i  1, m j1 i1 x i  ; i  1, m y j  ; j = 1, n (Vì a ij  với i j nên v  u  , x i  ( i  1, m ) y j  ( j = 1, n )) - Chiến lƣợc tối ƣu hai ngƣời chơi không đổi phần tử a ij ma trận trò chơi A ƣợc công thêm số C Giá trị chơi trƣờng hợp tăng thêm lƣợng C, tức v + C hay u + C Nhƣ ma trận A có a ij  cách lấy: c  max a ij ta đƣa đƣợc ma trận A = a ij  ma trận A = a ij + c  a ij 0 phần tử khơng âm, áp dụng đƣợc phép đổi biến nhƣ nêu phần Bằng cách giải theo thuật tốn đơn hình tốn dạng chuẩn tắc tức là: g'   g   n   y j số kiểm tra  j  ta đƣợc phƣơng án tối ƣu u j1 (y1* , y*2 , , y*n ) tốn g, tính chất đối ngẫu ta đƣợc phƣơng án tối ƣu (x1* , x*2 , , x*m ) toán f nằm dòng số kiểm tra, tất nhiên lấy dấu ngƣợc lại Giá trò chơi u – c (nếu cộng thêm vào phần tử a ij A lƣợng c), u   g ' Trở công thức đổi biến, chiến lƣợc tối ƣu: - Của ngƣời thứ là: pi  ux*i ; i  1, m - Của ngƣời thứ hai là: q j = uy*j ; j = 1, n Ví dụ: Hãy tìm chiến lƣợc tối ƣu cho bên chơi cho biết Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 35  2  A   2 1  1  Giải: v  max(2, 2, 1)  1 v  min(4,1, 7, 2)  Ma trận A khơng có điểm n ngựa Mặt khác khơng áp dụng đƣợc phƣơng pháp đồ thị, A khơng có chiến lƣợc thừa để đƣa dòng  n cột m dòng  cột Do ta giải qui hoạch tuyến tính a ij  2 đặt c = ta đƣợc Trong ma trận A ta có: a 0 ij   2     6  A   2    1    0     1  2   3  Cặp toán đối ngẫu là: Với ngƣời thứ Với ngƣời thứ hai f = x1 + x + x  g = y1 + y + y3 + y  max x1  3x  y1 + y3 + y  x  x3  y + y3 + y  x1  x  x  y1 + y + y3 + y  x1  x  x  y1  ; y  ; y3  ; y  x1  ; x  ; x  Để đơn giản giải toán ngƣời chơi thứ hai Dạng chuẩn tắc là: g '   y1  y  y3  y + oy5 + oy + oy  y1 + y3 + y + y5  y + y3 + y + y  y1 + y2 + y3 + y4 + y7  y j  ; j = 1, Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 36 Bảng đơn hình Hệ Cơ sở số Phƣơng -1 -1 -1 -1 0 y1 y2 y3 y4 y5 y6 y7 án y5 0 y6 1 0 y7 0 1 1 0 0 y5 0 -1 y2 13 13 13 0 y7 13 -3 10 2 1 -1 23 1 0 y5 13 0 15 14 43 -2 -1 y2 13 13 13 -1 y1 19 -1 10 2 13 4 0 4 1 1 Mọi số kiểm tra  j  , j = 1, Vậy phƣơng án tối ƣu toán dạng 1 chuẩn tắc là:  , , 0, 0, , 0,  9 3  Từ suy phƣơng án tối ƣu toán g  max là: 1   , , 0,   (y1 , y , y3 , y ) 9  Các thành phần phƣơng án tối ƣu toán đối ngẫu f  đƣợc xác định số kiểm tra:  1 (5 , 6 ,  )   0, ,   (x1 , x , x )  3 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 37 u Vì max  y j  max = j1 u   g '  c = nên giá chơi là: u      v max  4 Chiến lƣợc tối ƣu ngƣời thứ là: p1   , p2   4 ; p3   Chiến lƣợc tối ƣu ngƣời thứ hai là: q1   ; 4 q2   4 ; q3  ; q4  2.2.4 Chiến lƣợc bƣớc phƣơng pháp Brown Chiến lƣợc bƣớc xem chiến thuật ngƣời chơi sau phân tích hành vi đối phƣơng cố gắng có biện pháp tốt đáp ứng lại cho thắng lợi lớn thất bại Ngƣời chơi thứ (ngƣời bƣớc đầu) sử dụng chiến lƣợc Ngƣời chơi thứ hai đáp lại chiến lƣợc cho cực tiểu hóa thắng lợi ngƣời thứ Đến lƣợt ngƣời thứ lại tìm chiến lƣợc cho cực đại hóa tổng thắng lợi mình, ngƣời thứ hai lại tìm chiến lƣợc cho cực tiểu hóa tổng thắng lợi trƣớc ngƣời thứ Một cách tổng quát, ngƣời chơi đáp lại bƣớc đối phƣơng chiến lƣợc bƣớc cho tối ƣu theo nghĩa tổng thắng lợi qua trƣớc lớn nhất, tổng thất bại nhỏ bƣớc trƣớc đối phƣơng Phƣơng pháp lặp Brown đƣợc trình bày nhƣ sau: Cho ma trận trị chơi A có m dịng n cột: Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 38 a11 a12 a1 j a1n    a 21 a 22 a j a 2n     A= a i1 a i a ij a in      a m1 a m a mj a mn    Giả sử ngƣời thứ chọn dòng i1 Ta viết dòng i1 xuống dƣới ma trận A gọi dịng (m + 1), tức a m+1 j = a i j ; j = 1, n Để cực tiểu hóa thắng lợi ngƣời thứ nhất, ngƣời thứ hai chọn cột j1 , đó: a m+1 j1 = a m+1 j 1 j  n Phần tử a m+1 j đƣợc đánh dấu thành a *m+1 j cột j1 đƣợc viết vào bên 1' phải ma trận A thành cột thứ (n + 1), tức là: ai.n 1  aij , i  1, m Thấy ngƣời thứ hai chọn cột j1 nên để cực đại hóa tổng thắng lợi sau bƣớc ngƣời thứ chọn dòng i mà: a i n+1 = max a i.n+1 1i  m Phần tử a i n+1 đƣợc đánh dấu thành a *i n+1 ta viết thêm dòng thứ ' 2 (m + 2) đó: a m+2 j = a m+1 j + a i j ; j = 1, n Để cực tiểu hóa tổng thắng lợi ngƣời thứ qua bƣớc, bƣớc ngƣời thứ hai chọn cột j2 , đó: a m+2 j = 1mina m+2 j  j n Phần tử a m+2 j đƣợc đánh dấu * ta viết cột thứ (n + 2) (bên phải ma trận A), đó: a i.n+2 = a i.n+1 + a ij ; i  1, m Tiếp tục ngƣời thứ lại chọn dòng i mà: a i n+2 = max a i.n+2 ngƣời 1 i  m thứ hai chọn cột j3 mà: a m+3 j = a m+3 j 1 j n Bằng chiến lƣợc hai bên tham gia trò chơi qua bƣớc Giả sử trò chơi đƣợc tiếp tục tiến hành bƣớc thứ (k-1), dến bƣớc thứ k bƣớc kết thúc trò chơi, ngƣời thứ lại áp dụng chiến lƣợc Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 39 tƣơng tự nhƣ cho cực đại hóa tổng thắng lợi qua (k-1) bƣớc, ngƣời thứ hai áp dụng chiến lƣợc cực tiểu hóa tổng thắng lợi ngƣời thứ Gọi s i ; i  1, m ; số lần ngƣời chơi thứ áp dụng chiến lƣợc i (dòng i) k bƣớc chơi Khi m s i i1 s  s s = k phân phối tần suất:  , , , m  k  k k chiến lƣợc hỗn hợp xấp xỉ tối ƣu ngƣời chơi thứ nhất, cịn phần tử có dấu * xác định tổng thắng lợi (có thể có) ngƣời qua k bƣớc Tƣơng tự gọi t j ; j = 1, n ; số lần ngƣời thứ hai áp dụng chiến lƣợc j (chọn cột j) k bƣớc chơi Khi n t j  k phân phối tần suất: j1 tn   t1 t  , , ,  chiến lƣợc hỗn hợp xấp xỉ tối ƣu ngƣời chơi thứ hai Gọi k k k v tổng thắng lợi ngƣời thứ qua k bƣớc chơi thì: * (a m+k jk )  v  (a *m+k.n+k ) k k Rõ ràng mức xấp xỉ chiến lƣợc với chiến lƣợc tối ƣu phụ thuộc vào bƣớc ban đầu (vào việc chọn dòng i1 ngƣời thứ nhất) vào số bƣớc chơi k Nếu hai ngƣời tuân thủ qui tắc Brown xấp xỉ cao k tăng lên, nói cách khác, q trình hội tụ Ví dụ: Input: Cho ma trận trị chơi:  1 A   1 2   3  Out put: Hãy tìm lời giải xấp xỉ theo phƣơng pháp Brown qua 10 bƣớc qua 20 bƣớc, cho biết bƣớc đầu ngƣời chơi thứ chọn chiến lƣợc Thuật tốn giải: Ghi dịng xuống dƣới ma trận A thành dịng Vì dịng thứ đó: (3,2,4,1) = Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 40 nằm cột 4, nên ngƣời chọn cột 4, số dòng dƣợc đánh dấu * Cột A đƣợc ghi bên phải A thành cột Ngƣời chọn dịng bƣớc cột 5: max (1 , 2, 4) = nằm dòng 3, số cột đƣợc đánh dấu * Cộng dòng A với dòng đƣợc dòng Ngƣời chọn cột dịng 5: (5, -1,4, 5) = -1 nằm cột Số -1 dòng đƣợc đánh dấu * Cộng cột A với cột (cột + 1) thành cột Ngƣời thứ lại thấy cột 6: max (3, 6, 1) = nên chọn dịng v.v Tiếp tục q trình chọn bƣớc thứ 10 bƣớc thứ 20, ta đƣợc bảng trang 42, ma trận A nằm góc Tây bắc, cịn dịng thêm bƣớc ngƣời 1theo thứ tự từ xuống, cột thêm bƣớc ngƣời theo thứ tự từ trái sang phải Nhƣ qua 10 bƣớc thì: 15 21 v 10 10 Chiến lƣợc ngƣời thứ p   , ,   10 10 10  Chiến lƣợc ngƣời thứ hai q   2 5 , , ,   10 10 10 10  Qua 15 bƣớc thì: 25 30 v 15 15 Chiến lƣợc ngƣời thứ p   , ,   15 15 15  Chiến lƣợc ngƣời thứ hai q   , , ,   15 15 15 15  Qua 20 bƣớc thì: 32 38 v 20 20 Chiến lƣợc ngƣời 20 bƣớc : p   12  , ,   20 20 20  Chiến lƣợc ngƣời là: q   , , ,   20 20 20 20  5 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 41 Chỉ mô tả hội tụ thuật tốn lặp Brown ví dụ này, ta có: - Ở bƣớc 10: 21 15   0, 60 10 10 - Ở bƣớc 15: 30 25   0,34 15 15 - Ở bƣớc 20: 38 32   0,30 20 20 Hiệu giới hạn giới hạn dƣới v (khoảng ƣớc lƣợng v ) giảm đơn điệu Đánh giá kết quả: Phƣơng pháp Brown đƣợc trình bày nhƣ phƣơng pháp cạnh tranh bƣớc (có thể kéo dài khoảng thời gian đó) hai đối thủ “cao tay” Nhƣng đƣợc xem phƣơng pháp tiếp cận dần tới chiến lƣợc tối ƣu hai đối thủ Chẳng hạn, sản xuất nông nghiệp chiến lƣợc gieo trồng ngƣời nơng dân nhằm đạt giá trị sản phẩm đảm bảo cao nhất, thiên nhiên “tinh quái” tác động vào chỗ yếu phƣơng thức gieo trồng Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 42 Cột 2 1 4 4 2 4 1 4 1 9* 12* 15* 16* 17* 18* 19 21* 23* 25 26 27 30* 31 34* 37* 38* -1 -2 2 6* 10* 8 10 12 14 18 22 26* 28* 30* 29 31* 30 29 31 -3 4* -2 13 17 21* 18 15 12 16 20 22 26 28 30 34 1* 1* 3* 7 3* 6* 10 9* 11 11 11 12 13 15 12* 15 15 19 13* 18 17 23 14* 21 19 27 15* 23 16* 30 19 26 18* 34 20 29 20* 38 21 28 24 36 23* 27 28 34 25* 26* 32 32 27 29 34 36 28* 28* 38 34 30 31* 40 38 31 34 42 42 32* Dòng Bƣớc 10 Bƣớc 15 Bƣớc 20 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 43 KẾT LUẬN Qua trình nghiên cứu thực hiện, luận văn đạt đƣợc số kết sau: - Nghiên cứu trình bày cách có hệ thống lý thuyết trò chơi - Nghiên cứu trò chơi ma trận chiến lƣợc trò chơi ma trận - Giải đƣợc số tốn sử dụng chiến lƣợc trị chơi ma trận Vì lý thuyết trị chơi kiến thức rộng mẻ nên cảm nhận tơi chắn cịn hạn hẹp Tuy nhiên đề tài hay, có ý nghĩa ứng dụng thực tế cao phát triển đƣợc đầy đủ Rất mong đƣợc quan tâm đóng góp ý kiến thầy giáo để viết đƣợc hồn thiện hơn! Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 44 TÀI LIỆU THAM KHẢO Tô Cẩm Tú (1997), Một số phương pháp tối ưu hóa kinh tế, NXB Khoa học kỹ thuật A.M Brandenburger, Bary J.Nalebuff (2007), Lý thuyết trò chơi kinh doanh, NXB Tri thức Bierman, H S and L Fernandez (1998), Game Theory with economic applications, Addison-Wesley Don Ross (2010), Games Theory Fudenberg (1991), Drew and Jean Tirole: Game Theory, MIT Press Jim Ratliff (1997), Strategic form Games Osborne (1994), Martin and Ariel Rubinstein: A Course in Game Theory, MIT Press Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ... LƢỢC VỀ LÝ THUYẾT TRÒ CHƠI 1.1 Xuất xứ 1.2 Một số toán 1.2.1 Bài toán 1.2.2 Bài toán 1.3 Một số khái niệm 10 Chƣơng 2: MỘT SỐ THUẬT... trình lý thuyết phân phối ổn định thực tiễn tạo lập thị trƣờng, sở sử dụng lý thuyết trò chơi thực nghiệm Ngày nay, sống có nhiều ví dụ liên quan đến áp dụng lý thuyết trò chơi nhƣ: - Chơi cờ, chơi. .. khuyết Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Chƣơng 1: SƠ LƢỢC VỀ LÝ THUYẾT TRỊ CHƠI Chƣơng trình bày lý thuyết trị chơi xuất xứ nó, tốn nhƣ khái niệm ứng dụng lý thuyết trò chơi

Định dạng
Số trang	47
Dung lượng	0,98 MB