Mở đầuLý thuyết trò chơi là một nhánh của toán học ứng dụng nghiên cứu về các tình huống, chiến thuật trong đó các đối thủ lựa chọn các chiếnlược khác nhau để cố gắng làm tối đa thắng lợ
Trang 2NGƯỜI HƯỚNG DẪN KHOA HỌC
TS NGUYỄN VĂN MINH
Thái Nguyên - 2016
Trang 3Mục lục
1.1 Khái niệm mở đầu 3
1.2 Trò chơi ma trận 6
1.3 Chiến lược đơn trong trò chơi ma trận 9
1.3.1 Chiến lược maximin của người chơi thứ nhất 9
1.3.2 Chiến lược minimax của người chơi thứ hai 10
1.4 Các chiến lược hỗn hợp trong trò chơi ma trận 11
1.4.1 Phần thắng trung bình của người chơi thứ nhất 13
1.4.2 Nghiệm của trò chơi trong chiến lược hỗn hợp 14
1.4.3 Chiến lược thừa 16
1.4.4 Phương pháp Quy hoạch tuyến tính 19
1.5 Trò chơi ma trận với tổng bất kỳ 21
1.5.1 Khái niệm mở đầu 21
1.5.2 Cân bằng Nash trong chiến lược đơn 22
1.5.3 Cân bằng Nash trong chiến lược hỗn hợp 23
1.5.4 Chiến lược maximin 25
1.5.5 Chiến lược thừa trong trò chơi ma trận kép 26
1.5.6 Trò chơi hợp tác 27
2 Các thí dụ và ứng dụng của Lý thuyết trò chơi 31 2.1 Các thí dụ 31
2.1.1 Ma trận có điểm yên ngựa 31
2.1.2 Ma trận không có điểm yên ngựa 32
Trang 42.2 Các ứng dụng của lý thuyết trò chơi 41
2.2.1 Khó tăng giá trong thị trường cạnh tranh hoàn hảo 41 2.2.2 Hiện tượng trong thế giới động vật 42
2.2.3 Giải trừ vũ khí hạt nhân 43
2.2.4 Tình thế lưỡng nan của hai nghi can 45
2.2.5 Ứng dụng của trò chơi hợp tác 46
Trang 5Danh sách hình vẽ
1.1 Minh họa ví dụ 1.11 18
1.2 Trò chơi hợp tác 30
2.1 Ví dụ 2.3 34
2.2 Minh họa ví dụ 2.4 36
Trang 6Lời cảm ơn
Luận văn này được thực hiện tại Trường Đại học Khoa học - Đại họcThái Nguyên và hoàn thành dưới sự hướng dẫn của thầy TS Nguyễn VănMinh Tôi xin được bày tỏ lòng biết ơn chân thành và sâu sắc tới ngườithầy, người đã dìu dắt tôi từ buổi đầu tiên cho đến khi hoàn thành luậnvăn
Tác giả xin trân trọng cảm ơn Ban Giám hiệu Trường Đại học Khoahọc - Đại học Thái Nguyên, Ban Chủ nhiệm Khoa Toán-Tin, cùng cácthầy, các cô đã tham gia giảng dạy, đã tạo mọi điều kiện tốt nhất để tôihọc tập và nghiên cứu Nhân đây tôi xin có lời cảm ơn tới tập thể lớp caohọc Toán K8C (khóa 2014-2016) đã động viên và giúp đỡ tôi rất nhiềutrong quá trình học tập, nghiên cứu
Tôi xin chân thành cảm ơn gia đình và bạn bè Đã động viên tôi về tinhthần và giúp đỡ về vật chất kể từ khi ôn thi đến ngày hôm nay
Thái Nguyên, tháng 11 năm 2016
Đàm Thị DưỡngHọc viên Cao học Toán K8cChuyên ngành Toán ứng dụngTrường Đại học Khoa học - Đại học Thái Nguyên
Trang 7Mở đầu
Lý thuyết trò chơi là một nhánh của toán học ứng dụng nghiên cứu
về các tình huống, chiến thuật trong đó các đối thủ lựa chọn các chiếnlược khác nhau để cố gắng làm tối đa thắng lợi cho bản thân Ban đầu lýthuyết trò chơi được phát triển như một công cụ để nghiên cứu các hành
vi kinh tế học, ngày nay lý thuyết trò chơi được sử dụng trong rất nhiềunghành khoa học từ sinh học, quân sự,triết học, chính trị học, đạo đứchọc gần đây lý thuyết trò chơi thu hút được sự chú ý của các nhà khoahọc máy tính do ứng dụng của nó trong trí tuệ nhân tạo và điều khiển học.Năm 1950 đến năm 1951 John Nash đã phát triển định nghĩa về một chiếnthuật tối ưu cho trò chơi sau này được biết đến đó là "cân bằng Nash"năm 1994 ông cùng hai nhà kinh tế học khác đã đạt giải Nobel kinh tế vìnhững đóng góp trong lĩnh vực lý thuyết trò chơi
Trong khuôn khổ luận văn này tác giả trình bày một số khái niệm cơbản về lý thuyết trò chơi và một số ứng dụng có tranh chấp trong kinh tế.Nội dung Luận văn gồm 2 chương
• Chương 1.Trong chương này tác giả trình bày những khái niệm cơbản về lý thuyết trò chơi như: trạng thái chấp nhận được, trạng tháicân bằng Một trường hợp riêng quan trọng có ý nghĩa thực tiễn lớnđược trình bày tương đối đầy đủ, đó là Trò chơi ma trận Trò chơi
ma trận cũng có hai loại, đó là trò chơi ma trận đơn và trò chơi matrận kép
Khái niệm điểm yên trong chiến lược đơn và điểm yên trong chiếnlược hỗn hợp trong trò chơi ma trận đơn
Cuối chương tác giả trình bày trò chơi ma trận kép Khái niệm trạngthái Cân bằng Nash được nói tới Đây là trạng thái rất đặc trưng của
Trang 8trò chơi ma trận kép, nó cho ta cơ sở toán học để giải thích một sốhiện tượng trong tự nhiên, trong kinh tế, quân sự, ngoại giao
• Chương 2 Trong chương này tác giả trình bày một số ví dụ và ứngdụng của lý thuyết trò chơi trong kinh tế và một số lĩnh vực khácthông qua các ví dụ cụ thể Một trường hợp điển hình của trạng tháicân bằng Nash là tình thế lưỡng nan của hai nghi can Rất nhiềutrường hợp trong tự nhiên và trong xã hội đưa về bài toán này.Mặc dù đã cố gắng hết sức thực hiện luận văn nhưng chắc chắn luậnvăn vẫn còn thiếu sót Tác giả kính mong sự góp ý của các thầy cô,các bạn và các anh chị đồng nghiệp để luận văn này được hoàn chỉnh
Thái Nguyên, tháng 11 năm 2016
Đàm Thị DưỡngHọc viên Cao học Toán K8cChuyên ngành Toán ứng dụngTrường Đại học Khoa học - Đại học Thái Nguyên
Trang 9Chương 1
Lý thuyết trò chơi
1.1 Khái niệm mở đầu
Lý thuyết trò chơi là lý thuyết toán học mô tả và giải quyết các tìnhthế tranh chấp giữa các bên
Ví dụ 1.1 -) Chơi cờ, xổ số, thi đấu thể thao
-) Chiến tranh quân sự, cạnh tranh kinh tế, cạnh tranh giữa con người vớithiên nhiên
Mỗi cuộc chơi có thể
-) Có hai đấu thủ (trò chơi đôi);
-) Có n đấu thủ (chơi tập thể)
Định nghĩa 1.1 Cuộc chơi được gọi là đối kháng khi quyền lợi các bêntham gia trái ngược nhau Phần thắng của mỗi người dẫn đến thiệt hại ítnhất một người khác
Cuộc chơi được gọi là không đối kháng, nếu một nhóm trong số nhữngngười chơi có lợi ích chung ngoài lợi ích riêng
Trong suốt cuộc chơi, mỗi bước đi, mỗi bên đều tìm cách chơi sao cho-) Phần thắng cho bản thân lớn nhất (kể cả trò chơi đối kháng và khôngđối kháng)
-) Tổn thất cho bản thân nhỏ nhất (trò chơi đối kháng và không đối kháng).-) Tổn thất cho đối phương lớn nhất (trò chơi đối kháng)
Trang 10Định nghĩa 1.2 [Chiến lược của người chơi] Là một tập hợp các quy tắc,các chọn lựa của mỗi người chơi được xác định duy nhất trong hành vi củangười chơi ở mỗi bước chơi, phụ thuộc vào mỗi trạng thái xảy ra trong quátrình chơi Nó phụ thuộc vào kết quả ở mỗi bước do hành vi của đối phươnggây ra.
Giả sử có N người chơi trong một trò chơi Gọi Ti; i = 1 N là tập hợpmọi chiến lược có thể có của người chơi thứ i Quá trình chơi thể hiện ởchỗ: người chơi i chọn cho mình một chiến lược ti ∈ Ti trong suốt quátrình chơi Kết quả là đạt được trạng thái s, do đó người chơi thứ i thuđược phần thắng là Vi(s)
Trò chơi cũng có thể được tiến hành theo nhiều bước, mà ở bước thứ j
người i có thể áp dụng chiến lược tij ∈ Ti, và người chơi i thu được phầnthắng là Vi(sj) Lại áp dụng chiến lược ti,j+1 ∈ Ti ở bước j + 1 Tổng hợptất cả phần thắng của người chơiitại mọi bước sẽ là phần thắng của người
đó trong suốt quá trình chơi
Định nghĩa 1.3 [Trạng thái chấp nhận được] Trạng thái s trong trò chơiđược gọi là chấp nhận được đối với người chơi i, nếu trong trạng thái đóngười chơi i đổi từ chiến lược đang sử dụng ti sang bất cứ chiến lược t′i nàokhác cũng không tăng thêm thắng lợi cho bản thân
Định nghĩa 1.4 [Trạng thái cân bằng] Trạng thái s được gọi là trạng tháicân bằng, nếu nó là trạng thái chấp nhận được với mọi người chơi
Khái niệm trạng thái cân bằng ở đây giống như khái niệm điểm Paretotrong kinh tế thị trường (hiệu quả Pareto xảy ra trong một phân bố xácđịnh tài nguyên hoặc lợi ích giữa các thành viên, mà bất cứ một thànhviên nào muốn tăng thêm lợi ích cho mình đều làm giảm lợi lợi ích của ítnhất một thành viên khác)
Trong trò chơi không liên hiệp thì quá trình giải trò chơi chính là quá trìnhtìm trạng thái cân bằng
Định nghĩa 1.5 [Trò chơi với tổng hằng số] Trò chơi được gọi là trò chơivới tổng hằng số nếu tại mỗi bước chơi tổng phần thắng của tất cả ngườichơi không đổi và luôn bằng một số C nào đó Nói cách khác, tồn tại số
Trang 11Người ta cũng đã chứng minh được định lý sau đây (xem [4]).
Định lý 1.1 Mọi trò chơi có tổng C 6= 0, luôn luôn đưa về trò chơi cótổng bằng không
Ví dụ 1.2 Có N doanh nghiệp, gọi C là mức thuế mà Nhà nước ấn địnhcho các doanh nghiệp này trong một kỳ ngân sách Đây là trò chơi vớitổng là hằng C, mà những người chơi là các doanh nghiệp mà Nhà nước
ấn định mức thuế
Trò chơi có 2 người chơi là trò chơi mà người này thắng bao nhiêu thìngười kia thua bấy nhiêu, vì vậy trò chơi mà chỉ có hai người chơi luônluôn là trò chơi đối kháng
Định nghĩa 1.6 Chiến lược đơn là chiến lược xác định riêng biệt và ngườichơi có thể chọn với tần suất (xác suất) bằng 1
Định nghĩa 1.7 Chiến lược hỗn hợp là chiến lược kết hợp các chiến lượcđơn, mà mỗi chiến lược đơn này được sử dụng với một tần suất (xác suất)nào đó
Ví dụ 1.3 Giả sử theo TCVN bóng đèn sợi đốt dùng cho gia đình có baloại, đó là loại có công suất tiêu thụ 15 w, 30 w và60 w Một nhà máy sảnxuất bóng đèn trong một năm đã sản xuất 10000 bóng loại 15w, 50000
Trang 121.2 Trò chơi ma trận
Trong mục này ta xét trò chơi chỉ có hai người chơi Ta sẽ ký hiệu P1
là người chơi thứ nhất, P2 là người chơi thứ hai Ký hiệu T1 và T2 tươngứng là tập hợp các chiến lược đơn của P1 và P2
Định nghĩa 1.8 Trò chơi được gọi là trò chơi ma trận nếu thỏa mãn cácđiều kiện
1 Trò chơi có hai người chơi,
2 Mỗi người có hữu hạn chiến lược đơn,
3 Nếu người thứ nhất chọn chiến lược i trong tập T1 và người chơi thứhai chọn j trong tập T2 thì người thứ nhất thắng người thứ hai một
số tiền là aij
Giả sử người chơi thứ nhất có m chiến lược đơn, còn người chơi thứ hai
có n chiến lược đơn, khi đó trò chơi hoàn toàn được xác định bởi ma trận
Ma trận A được gọi là ma trận thanh toán hoặc ma trận trả tiền, nghĩa
là với cặp chiến lược hi, ji người chơi P2 phải trả cho người chơi P1 mộtlượng tiền là aij Ma trận A còn được gọi là ma trận thắng của người chơi
P1 đồng thời là ma trận thua của người chơi P2 với nghĩa như sau:
-) Nếu aij > 0, thì người chơi P1 thắng, còn P2 thua theo nghĩa thôngthường, P2 phải trả aij đơn vị tiền cho P1
-) Nếu aij < 0, thì thực chất là người chơi thứ hai thắng còn người chơithứ nhất thua theo nghĩa thông thường, P1 phải trả |aij| cho P2
-) Nếu aij = 0, P1 hòa P2
Trang 13Vì những lý do nêu trên, ta luôn luôn quy ước gọi người chơi thứ nhất làngười thắng, người chơi thứ hai là người thua.
Ví dụ 1.4 [Trò chơi oản tù tỳ (One Two Three)] (xem [3]) Trò chơidân gian có hai người chơi, mỗi người có tập chiến lược đơn giống nhau
T1 = T2 = {Giấy, Búa, Kéo} Luật chơi là Giấy thắng Búa, Búa thắngKéo, Kéo thắng Giấy, Giấy hòa Giấy, Búa hòa Búa, Kéo hòa Kéo
Hãy lập ma trận của trò chơi
Giải
P 2 Giấy Búa Kéo
hô 1, 2, 3 chẳng hạn) mỗi người chọn đặt lên bàn một mảnh bìa
Nếu tổng các số trên hai mảnh bìa là số lẻ thì P2 trả cho P1 số tiền là
3 U SD
Nếu tổng các số trên hai mảnh bìa là số chẵn thì P1 trả cho P2 lượng tiền
là 2 U SD Hãy lập ma trận của trò chơi
Giải Mỗi người có một tập hợp các chiến lược đơn T1 = {1, 2};
T2 = {1, 2, 3}, mỗi người chơi có thể chọn trong các mảnh bìa của mìnhmột mảnh, tất nhiên đã chọn mảnh này thì không chọn mảnh khác
Trang 14P 2
P 1 1 -2 3 -2
2 3 -2 3 Bảng 1.2: Trò chơi Chẵn lẻ
Ví dụ 1.6 [Đối với xí nghiệp] Giả sử trên thị trường tồn tại 3 kiểu máyphục vụ cùng một mục đích với công suất như nhau Nhà máy Z có khảnăng sản xuất 3 kiểu máy đó Qua thăm dò thị trường, biết rằng trongnăm t cần N máy Biết rằng chi phí sản xuất mỗi máy kiểu j là rj và đơngiá bán dự định là pj, j = 1 3 Đương nhiên là pj > rj
Hãy lập bài toán để có thể tìm chiến lược sản xuất tối ưu cho nhà máy
Z theo nghĩa lợi nhuận cao nhất, khi chưa xác định được thị hiếu của thịtrường đối với mỗi kiểu máy
Giải Nếu máy kiểu j được thị trường chấp nhận αN cái
(0 ≤ α ≤ 1), thì nhà máy Z thu được lợi nhuận N (αpj − rj) đồng
Đây là một trò chơi, người chơi thứ nhất là nhà máy Z với 3 chiến lượcthuần túy: sản xuất máy 1, máy 2 hay máy 3, còn người chơi thứ hai làmức nhu cầu sử dụng máy kiểu j trên thị trường là α Để đơn giản, ta cho
α nhận các giá trị: 0 (không sử dụng), 1/2 sử dụng một nửa và 1 (sử dụngtoàn bộ máy kiểu j) Người chơi thứ hai là thị trường có 6 chiến lược đơn
Giải Người chơi thứ nhất là nông dân, có 2 chiến lược đơn là trồngngô hoặc lúa Người chơi thứ hai là thời tiết, cũng có 2 chiến lược đơn là
Trang 15mưa ít hoặc mưa nhiều Ma trận thu nhập của nông dân là
Giải Trong điều kiện nhu cầu và thị hiếu của người tiêu dùng khôngđược xác định thì cuộc đụng độ giữa các kiểu nhập hàng vào cửa hàng tạothành trò chơi mà người thứ nhất là cửa hàng, còn người chơi thứ hai làthị hiếu khách hàng
Mỗi bên đều có n chiến lược đơn, chiến lược i của người chơi thứ nhất lànhập kiểu i Chiến lược j của người chơi thứ hai (thị trường) là tiêu thụhàng hóa kiểu j
−qn −qn −qn pn
1.3 Chiến lược đơn trong trò chơi ma trận
1.3.1 Chiến lược maximin của người chơi thứ nhất
Khi người chơi thứ nhất (P1 ) chọn hàng thứ i hay là chọn chiến lược
i, phần thằng của người đó sẽ là một trong các số ai1, ai2, , ain, tùy theongười chơi P2 chọn cột nào Trường hợp xấu nhất cho P1 nhận được phầnthắng là số
Trang 16đối phương chọn chiến lược nào vd gọi là giá dưới của trò chơi.
Chiến lược đơn i0 mà với nó
αi 0 = vd = max
1≤i≤m{αi}
gọi là chiến lược maximin của người chơi thứ nhất
1.3.2 Chiến lược minimax của người chơi thứ hai
Đối phó với chiến lược của P1, người chơi P2 trước hết tìm xem nếu sửdụng chiến lược j, thì phần thua lớn nhất là bao nhiêu? Trường hợp xấunhất cho P2 là bị thua một lượng
βj = max
1≤i≤m{aij}
Hợp lý nhất là P2 tìm cách cực tiểu hóa phần thua lớn nhất của mình, tức
là trong mọi chiến lược j = 1 n, tìm chiến lược j0 sao cho
vt = βj 0 = min
1≤j≤n{βj} = min
1≤j≤n max
1≤i≤n{aij} (1.3)Đại lượng vt = βj 0 gọi là giá trên của trò chơi
Chiến lược đơn j0 mà với nó
Một số tính chất của điểm yên ngựa
Trang 171 Ma trận có điểm yên ngựa khi và chỉ khi tồn tại phần tử ai 0 j 0 vừa là
số nhỏ nhất trong hàng i0 vừa là số lớn nhất trong cột j0, tức là
Từ tính chất trên, ta có quy tắc tìm điểm yên ngựa trong ma trận
Bước 1 Trong mỗi cột của ma trận A tìm tất cả các phẩn tử lớn nhất,
Bất đẳng thức thứ hai trong (1.5) cho thấy khi P1 đã chọn hàng i0, thì
P2 dù chọn bất cứ cột nào, phần thua cũng không nhỏ hơn khi chọn j0.Điểm yên ngựa còn gọi là điểm cân bằng của trò chơi Quá trình giải tròchơi chính là quá trình tìm điểm cân bằng Trường hợp ma trận có điểmyên ngựa, thì điểm yên ngựa đó chính là trạng thái cân bằng (người chơi
P1 không thể tăng phần thắng của bản thân còn người chơi P2 không thểgiảm phần thua của bản thân)
1.4 Các chiến lược hỗn hợp trong trò chơi ma trận
Trang 18Ở mục trên ta đã xét trường hợp cả hai người chơi đều chỉ áp dụng chiếnlược đơn, nghĩa là khi đã sử dụng hàng nào (cột nào), thì sử dụng hàng đó(cột đó) với tần suất 100% Nếu chỉ sử dụng chiến lược đơn sẽ không giảithích được ví dụ 2.2 vì ở ví dụ này, người chơi P1 có phần thắng chắc chắn
là 1, còn người chơi P2 lại có phần thua chắc chắn là 3 Mà trò chơi matrận là trò chơi đối kháng, nghĩa là người này thua bao nhiêu thì người kiathắng bấy nhiêu Người chơi P1 tìm cách nâng phần thắng của bản thânlên, và người chơi P2 tìm cách hạ phần thua của bản thân xuống Muốnvậy cả hai người chơi phải tìm cách pha trộn các chiến lược đơn để đượcchiến lược gọi là chiến lược hỗn hợp:
Xét trò chơi có ma trận trả tiền là A = [aij]m×n Người chơi P1 sử dụnghàng thứ nhất với tần suấtp1%, sử dụng hàng thứ hai với tần suấtp2%, ,
sử dụng hàng thứ m với tần suất pm%, ta thấy
0 ≤ pi ≤ 1, ∀i = 1 m; p1 + p2 + + pm = 1
Từ đây ta có vector
p = (p1, p2, , pm)
Vector p gọi là vector chiến lược hỗn hợp của người chơi thứ nhất
Tương tự, người chơi thứ hai sử dụng cột thứ nhất với tần suất q1%, sửdụng cột thứ hai với tần suất q2%, ,sử dụng cột thứ n với tần suất qn%.Cũng nhận được
Trang 19-) Mỗi người chơi có hữu hạn chiến lược đơn nhưng có vô hạn chiến lượchỗn hợp.
Mỗi người chơi có bài toán cho riêng mình, đó là
1 Bài toán của người chơi P1 là tìm chiến lược
p∗ = (p∗1, p∗2, , p∗m) ∈ T1
sao cho cực đại thắng lợi của mình trong khi không có thông tin về
sự lựa chọn chiến lược của P2
2 Bài toán của người chơi P2 là tìm chiến lược
q∗ = (q1∗, q2∗, , qn∗) ∈ T2
sao cho cực tiểu thắng lợi của P1, đồng nghĩa với cực tiểu hóa phầnthua của bản thân, trong khi không có thông tin về lựa chọn của P1.1.4.1 Phần thắng trung bình của người chơi thứ nhất
Định nghĩa 1.10 Nếu người chơi P1 chọn vector chiến lược p, người chơi
P2 chọn vector chiến lược q thì thắng lợi trung bình của người chơi P1 là
M(p, q) = (p, AqT
) = (pA, qT)
với các quy ước
-) p, q, qT tùy từng trường hợp có thể hiểu là ma trận hoặc vector.-) Ma trận chỉ có một phần tử [a] được xem là số thực a
Trang 20Định nghĩa 1.11 (Xem [3], trang 171-172) Nghiệm của trò chơi ma trận
là cặp chiến lược hỗn hợp (p∗, q∗) sao cho
M(i, q∗) ≤ M(p∗, q∗); ∀i = 1, 2, , m (1.7)
M(p∗, j) ≥ M(p∗, q∗); ∀j = 1, 2, , n (1.8)
ở đây i = (0, 0, , 0, 1, 0 0) là vector đơn vị thứ i trong không gian
Rm; j = (0, 0, , 0, 1, 0 0) là vector đơn vị thứ j trong không gian Rn
Giá trị M(p∗, q∗) được gọi là giá của trò chơi, ký hiệu là v Bất đẳngthức (1.7) có nghĩa là khi P2 sử dụng chiến lược q∗, thì P1 sử dụngbất cứ chiến lược nào cũng không làm cho phần thắng của P1 vượt quá
v = M(p∗, q∗)
Bất đẳng thức (1.8) có nghĩa là khi P1 sử dụng chiến lược p∗ thì P2 dù
áp dụng bất cứ chiến lược nào cũng không làm cho phần thua của P2 nhỏhơn v = M(p∗, q∗) Cặp vector (p∗, q∗) còn được gọi là điểm yên ngựacủa trò chơi Người ta đã chứng minh được định lý sau
Trang 21Định lý 1.2 [minimax] Mọi trò chơi ma trận đều có điểm yên ngựa trongcác chiến lược hỗn hợp.
Nói cách khác, tồn tại cặp chiến lược (p∗, q∗) sao cho các bất đẳng thức(1.7), (1.8) thỏa mãn
Phần thắng bảo đảm của P1 khi sử dụng chiến lược p là
Trang 221.4.3 Chiến lược thừa
Định nghĩa 1.12 Chiến lược i0 của người chơi thứ nhất được gọi là chiếnlược thừa, nếu
a) Tồn tại chiến lược i1 sao cho ai 1 j ≥ ai 0 j, ∀j = 1, n,
Ý nghĩa của Định nghĩa 1.12 trên là ở chỗ: Người chơi P1 là người thắng
có mong muốn phần thắng càng lớn càng tốt, đáng lẽ sử dụng chiến lược
i0 người chơi P1 sử dụng chiến lược hỗn hợp là tổ hợp các chiến lược đơncòn lại mà phần thắng không bị giảm đi
Định nghĩa 1.13 Chiến lược j0 của người chơi thứ hai được gọi là chiếnlược thừa, nếu
a) Tồn tại chiến lược đơn j1 sao cho aij 1 ≤ aij 0; ∀i = 1, m,
Trang 23Ví dụ 1.10 Hãy bỏ đi các chiến lược thừa trong ma trận
Giải Đây chính là ma trận trong Ví dụ 2.3 Ta thấy là ma trận không
có hàng thừa Sau đây ta tìm cột thừa Không thể khẳng định ngay cộtnào thừa, vì vậy ta xét lần lượt các cột
vẫn không phải là cột thừa Trở lại Ví dụ 2.3 có cột thứ nhất và cột thứ
tư có tần suất sử dụng bằng 0, nhưng chỉ có cột thứ nhất là cột thừa
Ví dụ 1.11 Bỏ đi các chiến lược thừa rồi giải bài toán
Trang 25Ma trận cuối cùng là ma trận vuông có hai hàng và hai cột Ta giải bằngphương pháp đồ thị
v1 = 3p + 1(1 − p) = 2p + 1
v2 = −p + 10(1 − p) = −11p + 10 (1.9)
Vẽ hai đường thẳng (1.9) trên mặt phẳng tọa độOpv Chov1 = v2 ta được
p = 9/13, và v1 = v2 = 31/13 Để tìm chiến lược tối ưu của người chơi
P2 ta giải hệ
3p + (−1)(1 − p) = 31/131p + 10(1 − p) = 31/131.4.4 Phương pháp Quy hoạch tuyến tính
(Xem [4]) Nếu trò chơi không có lời giải trong các chiến lược đơn, khônggiải được bằng đồ thị và cũng không là ma trận vuông thì sử dụng phươngpháp quy hoạch tuyến tính
u = max (u1, um) = max
Trang 26Với người chơi thứ nhất Với người chơi thứ hai
Với người chơi thứ nhất Với người chơi thứ hai
i,j aij và thay ma trận A = [aij] bởi ma trận A′ = [aij + |c|], ta được
ma trận không âm Với cách đổi biến này, chiến lược tối ưu của mỗi bênkhông thay đổi, do đó áp dụng được phép đổi biến ở nhận xét 1, còn giácủa trò chơi lúc này tăng thêm một lượng C
Ta nên giải bài toán đối ngẫu (bài toán của người chơi thứ II) và nhớ thaycho việc tìm g = 1
Trang 27(x∗1, x∗2, x∗m) của bài toán f nằm trong các số kiểm tra, tất nhiên lấy dấungược lại (xem QHTT).
Giá của trò chơi ban đầu là u − C, trong đó g = − 1
gmin′ .
Trở về công thức đổi biến, chiến lược tối ưu là:
-) Trở về biến ban đầu:
+) Của người chơi thứ nhất: pi = vx∗i; i = 1 m
+) Của người chơi thứ hai: qj = uy∗j; j = 1 n
1.5 Trò chơi ma trận với tổng bất kỳ
1.5.1 Khái niệm mở đầu
Định nghĩa 1.14 Trò chơi ma trận với tổng bất kỳ (còn gọi là "trò chơi
ma trận kép"), được xác định bởi cặp ma trận
A = [aij]m×n; B = [bij]m×n
Khi người chơi P1 chọn chiến lược đơn là hàng thứ i, còn người chơi P2
chọn chiến lược đơn là cột thứ j, thì người chơi P1 có phần thắng là aij
bm1 bm2 bmn
Ma trận A gọi là ma trận phần thắng của người chơi thứ nhất; Ma trận
B gọi là ma trận phần thắng của người chơi thứ hai
Hai ma trận A và B còn được viết theo cặp như sau:
Trang 28Chú ý 1.4 -) Khi A = −B trò chơi trở thành trò chơi đối kháng, đây làtrường hợp duy nhất trò chơi ma trận kép là trò chơi đối kháng Haynói cách khác là trò chơi ma trận đơn là trường hợp riêng của trò chơi
1.5.2 Cân bằng Nash trong chiến lược đơn
Định nghĩa 1.15 Cặp chiến lược đơn hi∗, j∗i là cân bằng Nash của tròchơi nếu
ai ∗ j ∗ ≥ aij ∗ ∀i = 1 m (1.10a)
bi ∗ j ∗ ≥ bi ∗ j ∀j = 1 n (1.10b)Nhận xét 1.1 1 Bất đẳng thức (1.10a) cho thấy, khi người chơi P2 đãchọn cột j∗, thì người chơi P1 dù có sử dụng bất cứ hàng nào, phầnthắng cũng không vượt quá ai ∗ j ∗ Đó chính là lý do người chơi P1
chọn chiến lược đơn i∗ mà không chọn chiến lược khác
2 Bất đẳng thức (1.10b) cho thấy, khi người chơi P1 đã chọn hàng i∗,thì người chơi P2 dù có sử dụng bất cứ cột nào, phần thắng cũngkhông vượt quá bi ∗ j ∗ Đó chính là lý do người chơi P2 chọn chiến lượcđơn j∗ mà không chọn chiến lược khác
Từ định nghĩa trên ta có ngay quy tắc tìm tất cả các điểm cân bằngNash trong chiến lược đơn như sau
1) Tìm tất cả các phần tử lớn nhất trong mỗi cột của ma trận A, các phần
tử này được đánh dấu ∗
2) Tìm tất cả các phần tử lớn nhất trong mỗi hàng của ma trận B, cácphần tử này được đánh dấu ∗