1. Trang chủ
  2. » Luận Văn - Báo Cáo

Lý thuyết trò chơi và ứng dụng trong kinh tế

57 935 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 304,99 KB

Nội dung

Mở đầuLý thuyết trò chơi là một nhánh của toán học ứng dụng nghiên cứu về các tình huống, chiến thuật trong đó các đối thủ lựa chọn các chiếnlược khác nhau để cố gắng làm tối đa thắng lợ

Trang 2

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS NGUYỄN VĂN MINH

Thái Nguyên - 2016

Trang 3

Mục lục

1.1 Khái niệm mở đầu 3

1.2 Trò chơi ma trận 6

1.3 Chiến lược đơn trong trò chơi ma trận 9

1.3.1 Chiến lược maximin của người chơi thứ nhất 9

1.3.2 Chiến lược minimax của người chơi thứ hai 10

1.4 Các chiến lược hỗn hợp trong trò chơi ma trận 11

1.4.1 Phần thắng trung bình của người chơi thứ nhất 13

1.4.2 Nghiệm của trò chơi trong chiến lược hỗn hợp 14

1.4.3 Chiến lược thừa 16

1.4.4 Phương pháp Quy hoạch tuyến tính 19

1.5 Trò chơi ma trận với tổng bất kỳ 21

1.5.1 Khái niệm mở đầu 21

1.5.2 Cân bằng Nash trong chiến lược đơn 22

1.5.3 Cân bằng Nash trong chiến lược hỗn hợp 23

1.5.4 Chiến lược maximin 25

1.5.5 Chiến lược thừa trong trò chơi ma trận kép 26

1.5.6 Trò chơi hợp tác 27

2 Các thí dụ và ứng dụng của Lý thuyết trò chơi 31 2.1 Các thí dụ 31

2.1.1 Ma trận có điểm yên ngựa 31

2.1.2 Ma trận không có điểm yên ngựa 32

Trang 4

2.2 Các ứng dụng của lý thuyết trò chơi 41

2.2.1 Khó tăng giá trong thị trường cạnh tranh hoàn hảo 41 2.2.2 Hiện tượng trong thế giới động vật 42

2.2.3 Giải trừ vũ khí hạt nhân 43

2.2.4 Tình thế lưỡng nan của hai nghi can 45

2.2.5 Ứng dụng của trò chơi hợp tác 46

Trang 5

Danh sách hình vẽ

1.1 Minh họa ví dụ 1.11 18

1.2 Trò chơi hợp tác 30

2.1 Ví dụ 2.3 34

2.2 Minh họa ví dụ 2.4 36

Trang 6

Lời cảm ơn

Luận văn này được thực hiện tại Trường Đại học Khoa học - Đại họcThái Nguyên và hoàn thành dưới sự hướng dẫn của thầy TS Nguyễn VănMinh Tôi xin được bày tỏ lòng biết ơn chân thành và sâu sắc tới ngườithầy, người đã dìu dắt tôi từ buổi đầu tiên cho đến khi hoàn thành luậnvăn

Tác giả xin trân trọng cảm ơn Ban Giám hiệu Trường Đại học Khoahọc - Đại học Thái Nguyên, Ban Chủ nhiệm Khoa Toán-Tin, cùng cácthầy, các cô đã tham gia giảng dạy, đã tạo mọi điều kiện tốt nhất để tôihọc tập và nghiên cứu Nhân đây tôi xin có lời cảm ơn tới tập thể lớp caohọc Toán K8C (khóa 2014-2016) đã động viên và giúp đỡ tôi rất nhiềutrong quá trình học tập, nghiên cứu

Tôi xin chân thành cảm ơn gia đình và bạn bè Đã động viên tôi về tinhthần và giúp đỡ về vật chất kể từ khi ôn thi đến ngày hôm nay

Thái Nguyên, tháng 11 năm 2016

Đàm Thị DưỡngHọc viên Cao học Toán K8cChuyên ngành Toán ứng dụngTrường Đại học Khoa học - Đại học Thái Nguyên

Trang 7

Mở đầu

Lý thuyết trò chơi là một nhánh của toán học ứng dụng nghiên cứu

về các tình huống, chiến thuật trong đó các đối thủ lựa chọn các chiếnlược khác nhau để cố gắng làm tối đa thắng lợi cho bản thân Ban đầu lýthuyết trò chơi được phát triển như một công cụ để nghiên cứu các hành

vi kinh tế học, ngày nay lý thuyết trò chơi được sử dụng trong rất nhiềunghành khoa học từ sinh học, quân sự,triết học, chính trị học, đạo đứchọc gần đây lý thuyết trò chơi thu hút được sự chú ý của các nhà khoahọc máy tính do ứng dụng của nó trong trí tuệ nhân tạo và điều khiển học.Năm 1950 đến năm 1951 John Nash đã phát triển định nghĩa về một chiếnthuật tối ưu cho trò chơi sau này được biết đến đó là "cân bằng Nash"năm 1994 ông cùng hai nhà kinh tế học khác đã đạt giải Nobel kinh tế vìnhững đóng góp trong lĩnh vực lý thuyết trò chơi

Trong khuôn khổ luận văn này tác giả trình bày một số khái niệm cơbản về lý thuyết trò chơi và một số ứng dụng có tranh chấp trong kinh tế.Nội dung Luận văn gồm 2 chương

• Chương 1.Trong chương này tác giả trình bày những khái niệm cơbản về lý thuyết trò chơi như: trạng thái chấp nhận được, trạng tháicân bằng Một trường hợp riêng quan trọng có ý nghĩa thực tiễn lớnđược trình bày tương đối đầy đủ, đó là Trò chơi ma trận Trò chơi

ma trận cũng có hai loại, đó là trò chơi ma trận đơn và trò chơi matrận kép

Khái niệm điểm yên trong chiến lược đơn và điểm yên trong chiếnlược hỗn hợp trong trò chơi ma trận đơn

Cuối chương tác giả trình bày trò chơi ma trận kép Khái niệm trạngthái Cân bằng Nash được nói tới Đây là trạng thái rất đặc trưng của

Trang 8

trò chơi ma trận kép, nó cho ta cơ sở toán học để giải thích một sốhiện tượng trong tự nhiên, trong kinh tế, quân sự, ngoại giao

• Chương 2 Trong chương này tác giả trình bày một số ví dụ và ứngdụng của lý thuyết trò chơi trong kinh tế và một số lĩnh vực khácthông qua các ví dụ cụ thể Một trường hợp điển hình của trạng tháicân bằng Nash là tình thế lưỡng nan của hai nghi can Rất nhiềutrường hợp trong tự nhiên và trong xã hội đưa về bài toán này.Mặc dù đã cố gắng hết sức thực hiện luận văn nhưng chắc chắn luậnvăn vẫn còn thiếu sót Tác giả kính mong sự góp ý của các thầy cô,các bạn và các anh chị đồng nghiệp để luận văn này được hoàn chỉnh

Thái Nguyên, tháng 11 năm 2016

Đàm Thị DưỡngHọc viên Cao học Toán K8cChuyên ngành Toán ứng dụngTrường Đại học Khoa học - Đại học Thái Nguyên

Trang 9

Chương 1

Lý thuyết trò chơi

1.1 Khái niệm mở đầu

Lý thuyết trò chơi là lý thuyết toán học mô tả và giải quyết các tìnhthế tranh chấp giữa các bên

Ví dụ 1.1 -) Chơi cờ, xổ số, thi đấu thể thao

-) Chiến tranh quân sự, cạnh tranh kinh tế, cạnh tranh giữa con người vớithiên nhiên

Mỗi cuộc chơi có thể

-) Có hai đấu thủ (trò chơi đôi);

-) Có n đấu thủ (chơi tập thể)

Định nghĩa 1.1 Cuộc chơi được gọi là đối kháng khi quyền lợi các bêntham gia trái ngược nhau Phần thắng của mỗi người dẫn đến thiệt hại ítnhất một người khác

Cuộc chơi được gọi là không đối kháng, nếu một nhóm trong số nhữngngười chơi có lợi ích chung ngoài lợi ích riêng

Trong suốt cuộc chơi, mỗi bước đi, mỗi bên đều tìm cách chơi sao cho-) Phần thắng cho bản thân lớn nhất (kể cả trò chơi đối kháng và khôngđối kháng)

-) Tổn thất cho bản thân nhỏ nhất (trò chơi đối kháng và không đối kháng).-) Tổn thất cho đối phương lớn nhất (trò chơi đối kháng)

Trang 10

Định nghĩa 1.2 [Chiến lược của người chơi] Là một tập hợp các quy tắc,các chọn lựa của mỗi người chơi được xác định duy nhất trong hành vi củangười chơi ở mỗi bước chơi, phụ thuộc vào mỗi trạng thái xảy ra trong quátrình chơi Nó phụ thuộc vào kết quả ở mỗi bước do hành vi của đối phươnggây ra.

Giả sử có N người chơi trong một trò chơi Gọi Ti; i = 1 N là tập hợpmọi chiến lược có thể có của người chơi thứ i Quá trình chơi thể hiện ởchỗ: người chơi i chọn cho mình một chiến lược ti ∈ Ti trong suốt quátrình chơi Kết quả là đạt được trạng thái s, do đó người chơi thứ i thuđược phần thắng là Vi(s)

Trò chơi cũng có thể được tiến hành theo nhiều bước, mà ở bước thứ j

người i có thể áp dụng chiến lược tij ∈ Ti, và người chơi i thu được phầnthắng là Vi(sj) Lại áp dụng chiến lược ti,j+1 ∈ Ti ở bước j + 1 Tổng hợptất cả phần thắng của người chơiitại mọi bước sẽ là phần thắng của người

đó trong suốt quá trình chơi

Định nghĩa 1.3 [Trạng thái chấp nhận được] Trạng thái s trong trò chơiđược gọi là chấp nhận được đối với người chơi i, nếu trong trạng thái đóngười chơi i đổi từ chiến lược đang sử dụng ti sang bất cứ chiến lược t′i nàokhác cũng không tăng thêm thắng lợi cho bản thân

Định nghĩa 1.4 [Trạng thái cân bằng] Trạng thái s được gọi là trạng tháicân bằng, nếu nó là trạng thái chấp nhận được với mọi người chơi

Khái niệm trạng thái cân bằng ở đây giống như khái niệm điểm Paretotrong kinh tế thị trường (hiệu quả Pareto xảy ra trong một phân bố xácđịnh tài nguyên hoặc lợi ích giữa các thành viên, mà bất cứ một thànhviên nào muốn tăng thêm lợi ích cho mình đều làm giảm lợi lợi ích của ítnhất một thành viên khác)

Trong trò chơi không liên hiệp thì quá trình giải trò chơi chính là quá trìnhtìm trạng thái cân bằng

Định nghĩa 1.5 [Trò chơi với tổng hằng số] Trò chơi được gọi là trò chơivới tổng hằng số nếu tại mỗi bước chơi tổng phần thắng của tất cả ngườichơi không đổi và luôn bằng một số C nào đó Nói cách khác, tồn tại số

Trang 11

Người ta cũng đã chứng minh được định lý sau đây (xem [4]).

Định lý 1.1 Mọi trò chơi có tổng C 6= 0, luôn luôn đưa về trò chơi cótổng bằng không

Ví dụ 1.2 Có N doanh nghiệp, gọi C là mức thuế mà Nhà nước ấn địnhcho các doanh nghiệp này trong một kỳ ngân sách Đây là trò chơi vớitổng là hằng C, mà những người chơi là các doanh nghiệp mà Nhà nước

ấn định mức thuế

Trò chơi có 2 người chơi là trò chơi mà người này thắng bao nhiêu thìngười kia thua bấy nhiêu, vì vậy trò chơi mà chỉ có hai người chơi luônluôn là trò chơi đối kháng

Định nghĩa 1.6 Chiến lược đơn là chiến lược xác định riêng biệt và ngườichơi có thể chọn với tần suất (xác suất) bằng 1

Định nghĩa 1.7 Chiến lược hỗn hợp là chiến lược kết hợp các chiến lượcđơn, mà mỗi chiến lược đơn này được sử dụng với một tần suất (xác suất)nào đó

Ví dụ 1.3 Giả sử theo TCVN bóng đèn sợi đốt dùng cho gia đình có baloại, đó là loại có công suất tiêu thụ 15 w, 30 w và60 w Một nhà máy sảnxuất bóng đèn trong một năm đã sản xuất 10000 bóng loại 15w, 50000

Trang 12

1.2 Trò chơi ma trận

Trong mục này ta xét trò chơi chỉ có hai người chơi Ta sẽ ký hiệu P1

là người chơi thứ nhất, P2 là người chơi thứ hai Ký hiệu T1 và T2 tươngứng là tập hợp các chiến lược đơn của P1 và P2

Định nghĩa 1.8 Trò chơi được gọi là trò chơi ma trận nếu thỏa mãn cácđiều kiện

1 Trò chơi có hai người chơi,

2 Mỗi người có hữu hạn chiến lược đơn,

3 Nếu người thứ nhất chọn chiến lược i trong tập T1 và người chơi thứhai chọn j trong tập T2 thì người thứ nhất thắng người thứ hai một

số tiền là aij

Giả sử người chơi thứ nhất có m chiến lược đơn, còn người chơi thứ hai

có n chiến lược đơn, khi đó trò chơi hoàn toàn được xác định bởi ma trận

Ma trận A được gọi là ma trận thanh toán hoặc ma trận trả tiền, nghĩa

là với cặp chiến lược hi, ji người chơi P2 phải trả cho người chơi P1 mộtlượng tiền là aij Ma trận A còn được gọi là ma trận thắng của người chơi

P1 đồng thời là ma trận thua của người chơi P2 với nghĩa như sau:

-) Nếu aij > 0, thì người chơi P1 thắng, còn P2 thua theo nghĩa thôngthường, P2 phải trả aij đơn vị tiền cho P1

-) Nếu aij < 0, thì thực chất là người chơi thứ hai thắng còn người chơithứ nhất thua theo nghĩa thông thường, P1 phải trả |aij| cho P2

-) Nếu aij = 0, P1 hòa P2

Trang 13

Vì những lý do nêu trên, ta luôn luôn quy ước gọi người chơi thứ nhất làngười thắng, người chơi thứ hai là người thua.

Ví dụ 1.4 [Trò chơi oản tù tỳ (One Two Three)] (xem [3]) Trò chơidân gian có hai người chơi, mỗi người có tập chiến lược đơn giống nhau

T1 = T2 = {Giấy, Búa, Kéo} Luật chơi là Giấy thắng Búa, Búa thắngKéo, Kéo thắng Giấy, Giấy hòa Giấy, Búa hòa Búa, Kéo hòa Kéo

Hãy lập ma trận của trò chơi

Giải

P 2 Giấy Búa Kéo

hô 1, 2, 3 chẳng hạn) mỗi người chọn đặt lên bàn một mảnh bìa

Nếu tổng các số trên hai mảnh bìa là số lẻ thì P2 trả cho P1 số tiền là

3 U SD

Nếu tổng các số trên hai mảnh bìa là số chẵn thì P1 trả cho P2 lượng tiền

là 2 U SD Hãy lập ma trận của trò chơi

Giải Mỗi người có một tập hợp các chiến lược đơn T1 = {1, 2};

T2 = {1, 2, 3}, mỗi người chơi có thể chọn trong các mảnh bìa của mìnhmột mảnh, tất nhiên đã chọn mảnh này thì không chọn mảnh khác

Trang 14

P 2

P 1 1 -2 3 -2

2 3 -2 3 Bảng 1.2: Trò chơi Chẵn lẻ

Ví dụ 1.6 [Đối với xí nghiệp] Giả sử trên thị trường tồn tại 3 kiểu máyphục vụ cùng một mục đích với công suất như nhau Nhà máy Z có khảnăng sản xuất 3 kiểu máy đó Qua thăm dò thị trường, biết rằng trongnăm t cần N máy Biết rằng chi phí sản xuất mỗi máy kiểu j là rj và đơngiá bán dự định là pj, j = 1 3 Đương nhiên là pj > rj

Hãy lập bài toán để có thể tìm chiến lược sản xuất tối ưu cho nhà máy

Z theo nghĩa lợi nhuận cao nhất, khi chưa xác định được thị hiếu của thịtrường đối với mỗi kiểu máy

Giải Nếu máy kiểu j được thị trường chấp nhận αN cái

(0 ≤ α ≤ 1), thì nhà máy Z thu được lợi nhuận N (αpj − rj) đồng

Đây là một trò chơi, người chơi thứ nhất là nhà máy Z với 3 chiến lượcthuần túy: sản xuất máy 1, máy 2 hay máy 3, còn người chơi thứ hai làmức nhu cầu sử dụng máy kiểu j trên thị trường là α Để đơn giản, ta cho

α nhận các giá trị: 0 (không sử dụng), 1/2 sử dụng một nửa và 1 (sử dụngtoàn bộ máy kiểu j) Người chơi thứ hai là thị trường có 6 chiến lược đơn

Giải Người chơi thứ nhất là nông dân, có 2 chiến lược đơn là trồngngô hoặc lúa Người chơi thứ hai là thời tiết, cũng có 2 chiến lược đơn là

Trang 15

mưa ít hoặc mưa nhiều Ma trận thu nhập của nông dân là

Giải Trong điều kiện nhu cầu và thị hiếu của người tiêu dùng khôngđược xác định thì cuộc đụng độ giữa các kiểu nhập hàng vào cửa hàng tạothành trò chơi mà người thứ nhất là cửa hàng, còn người chơi thứ hai làthị hiếu khách hàng

Mỗi bên đều có n chiến lược đơn, chiến lược i của người chơi thứ nhất lànhập kiểu i Chiến lược j của người chơi thứ hai (thị trường) là tiêu thụhàng hóa kiểu j

−qn −qn −qn pn

1.3 Chiến lược đơn trong trò chơi ma trận

1.3.1 Chiến lược maximin của người chơi thứ nhất

Khi người chơi thứ nhất (P1 ) chọn hàng thứ i hay là chọn chiến lược

i, phần thằng của người đó sẽ là một trong các số ai1, ai2, , ain, tùy theongười chơi P2 chọn cột nào Trường hợp xấu nhất cho P1 nhận được phầnthắng là số

Trang 16

đối phương chọn chiến lược nào vd gọi là giá dưới của trò chơi.

Chiến lược đơn i0 mà với nó

αi 0 = vd = max

1≤i≤m{αi}

gọi là chiến lược maximin của người chơi thứ nhất

1.3.2 Chiến lược minimax của người chơi thứ hai

Đối phó với chiến lược của P1, người chơi P2 trước hết tìm xem nếu sửdụng chiến lược j, thì phần thua lớn nhất là bao nhiêu? Trường hợp xấunhất cho P2 là bị thua một lượng

βj = max

1≤i≤m{aij}

Hợp lý nhất là P2 tìm cách cực tiểu hóa phần thua lớn nhất của mình, tức

là trong mọi chiến lược j = 1 n, tìm chiến lược j0 sao cho

vt = βj 0 = min

1≤j≤n{βj} = min

1≤j≤n max

1≤i≤n{aij} (1.3)Đại lượng vt = βj 0 gọi là giá trên của trò chơi

Chiến lược đơn j0 mà với nó

Một số tính chất của điểm yên ngựa

Trang 17

1 Ma trận có điểm yên ngựa khi và chỉ khi tồn tại phần tử ai 0 j 0 vừa là

số nhỏ nhất trong hàng i0 vừa là số lớn nhất trong cột j0, tức là

Từ tính chất trên, ta có quy tắc tìm điểm yên ngựa trong ma trận

Bước 1 Trong mỗi cột của ma trận A tìm tất cả các phẩn tử lớn nhất,

Bất đẳng thức thứ hai trong (1.5) cho thấy khi P1 đã chọn hàng i0, thì

P2 dù chọn bất cứ cột nào, phần thua cũng không nhỏ hơn khi chọn j0.Điểm yên ngựa còn gọi là điểm cân bằng của trò chơi Quá trình giải tròchơi chính là quá trình tìm điểm cân bằng Trường hợp ma trận có điểmyên ngựa, thì điểm yên ngựa đó chính là trạng thái cân bằng (người chơi

P1 không thể tăng phần thắng của bản thân còn người chơi P2 không thểgiảm phần thua của bản thân)

1.4 Các chiến lược hỗn hợp trong trò chơi ma trận

Trang 18

Ở mục trên ta đã xét trường hợp cả hai người chơi đều chỉ áp dụng chiếnlược đơn, nghĩa là khi đã sử dụng hàng nào (cột nào), thì sử dụng hàng đó(cột đó) với tần suất 100% Nếu chỉ sử dụng chiến lược đơn sẽ không giảithích được ví dụ 2.2 vì ở ví dụ này, người chơi P1 có phần thắng chắc chắn

là 1, còn người chơi P2 lại có phần thua chắc chắn là 3 Mà trò chơi matrận là trò chơi đối kháng, nghĩa là người này thua bao nhiêu thì người kiathắng bấy nhiêu Người chơi P1 tìm cách nâng phần thắng của bản thânlên, và người chơi P2 tìm cách hạ phần thua của bản thân xuống Muốnvậy cả hai người chơi phải tìm cách pha trộn các chiến lược đơn để đượcchiến lược gọi là chiến lược hỗn hợp:

Xét trò chơi có ma trận trả tiền là A = [aij]m×n Người chơi P1 sử dụnghàng thứ nhất với tần suấtp1%, sử dụng hàng thứ hai với tần suấtp2%, ,

sử dụng hàng thứ m với tần suất pm%, ta thấy

0 ≤ pi ≤ 1, ∀i = 1 m; p1 + p2 + + pm = 1

Từ đây ta có vector

p = (p1, p2, , pm)

Vector p gọi là vector chiến lược hỗn hợp của người chơi thứ nhất

Tương tự, người chơi thứ hai sử dụng cột thứ nhất với tần suất q1%, sửdụng cột thứ hai với tần suất q2%, ,sử dụng cột thứ n với tần suất qn%.Cũng nhận được

Trang 19

-) Mỗi người chơi có hữu hạn chiến lược đơn nhưng có vô hạn chiến lượchỗn hợp.

Mỗi người chơi có bài toán cho riêng mình, đó là

1 Bài toán của người chơi P1 là tìm chiến lược

p∗ = (p∗1, p∗2, , p∗m) ∈ T1

sao cho cực đại thắng lợi của mình trong khi không có thông tin về

sự lựa chọn chiến lược của P2

2 Bài toán của người chơi P2 là tìm chiến lược

q∗ = (q1∗, q2∗, , qn∗) ∈ T2

sao cho cực tiểu thắng lợi của P1, đồng nghĩa với cực tiểu hóa phầnthua của bản thân, trong khi không có thông tin về lựa chọn của P1.1.4.1 Phần thắng trung bình của người chơi thứ nhất

Định nghĩa 1.10 Nếu người chơi P1 chọn vector chiến lược p, người chơi

P2 chọn vector chiến lược q thì thắng lợi trung bình của người chơi P1 là

M(p, q) = (p, AqT

) = (pA, qT)

với các quy ước

-) p, q, qT tùy từng trường hợp có thể hiểu là ma trận hoặc vector.-) Ma trận chỉ có một phần tử [a] được xem là số thực a

Trang 20

Định nghĩa 1.11 (Xem [3], trang 171-172) Nghiệm của trò chơi ma trận

là cặp chiến lược hỗn hợp (p∗, q∗) sao cho

M(i, q∗) ≤ M(p∗, q∗); ∀i = 1, 2, , m (1.7)

M(p∗, j) ≥ M(p∗, q∗); ∀j = 1, 2, , n (1.8)

ở đây i = (0, 0, , 0, 1, 0 0) là vector đơn vị thứ i trong không gian

Rm; j = (0, 0, , 0, 1, 0 0) là vector đơn vị thứ j trong không gian Rn

Giá trị M(p∗, q∗) được gọi là giá của trò chơi, ký hiệu là v Bất đẳngthức (1.7) có nghĩa là khi P2 sử dụng chiến lược q∗, thì P1 sử dụngbất cứ chiến lược nào cũng không làm cho phần thắng của P1 vượt quá

v = M(p∗, q∗)

Bất đẳng thức (1.8) có nghĩa là khi P1 sử dụng chiến lược p∗ thì P2 dù

áp dụng bất cứ chiến lược nào cũng không làm cho phần thua của P2 nhỏhơn v = M(p∗, q∗) Cặp vector (p∗, q∗) còn được gọi là điểm yên ngựacủa trò chơi Người ta đã chứng minh được định lý sau

Trang 21

Định lý 1.2 [minimax] Mọi trò chơi ma trận đều có điểm yên ngựa trongcác chiến lược hỗn hợp.

Nói cách khác, tồn tại cặp chiến lược (p∗, q∗) sao cho các bất đẳng thức(1.7), (1.8) thỏa mãn

Phần thắng bảo đảm của P1 khi sử dụng chiến lược p là

Trang 22

1.4.3 Chiến lược thừa

Định nghĩa 1.12 Chiến lược i0 của người chơi thứ nhất được gọi là chiếnlược thừa, nếu

a) Tồn tại chiến lược i1 sao cho ai 1 j ≥ ai 0 j, ∀j = 1, n,

Ý nghĩa của Định nghĩa 1.12 trên là ở chỗ: Người chơi P1 là người thắng

có mong muốn phần thắng càng lớn càng tốt, đáng lẽ sử dụng chiến lược

i0 người chơi P1 sử dụng chiến lược hỗn hợp là tổ hợp các chiến lược đơncòn lại mà phần thắng không bị giảm đi

Định nghĩa 1.13 Chiến lược j0 của người chơi thứ hai được gọi là chiếnlược thừa, nếu

a) Tồn tại chiến lược đơn j1 sao cho aij 1 ≤ aij 0; ∀i = 1, m,

Trang 23

Ví dụ 1.10 Hãy bỏ đi các chiến lược thừa trong ma trận

Giải Đây chính là ma trận trong Ví dụ 2.3 Ta thấy là ma trận không

có hàng thừa Sau đây ta tìm cột thừa Không thể khẳng định ngay cộtnào thừa, vì vậy ta xét lần lượt các cột

vẫn không phải là cột thừa Trở lại Ví dụ 2.3 có cột thứ nhất và cột thứ

tư có tần suất sử dụng bằng 0, nhưng chỉ có cột thứ nhất là cột thừa

Ví dụ 1.11 Bỏ đi các chiến lược thừa rồi giải bài toán

Trang 25

Ma trận cuối cùng là ma trận vuông có hai hàng và hai cột Ta giải bằngphương pháp đồ thị



v1 = 3p + 1(1 − p) = 2p + 1

v2 = −p + 10(1 − p) = −11p + 10 (1.9)

Vẽ hai đường thẳng (1.9) trên mặt phẳng tọa độOpv Chov1 = v2 ta được

p = 9/13, và v1 = v2 = 31/13 Để tìm chiến lược tối ưu của người chơi

P2 ta giải hệ



3p + (−1)(1 − p) = 31/131p + 10(1 − p) = 31/131.4.4 Phương pháp Quy hoạch tuyến tính

(Xem [4]) Nếu trò chơi không có lời giải trong các chiến lược đơn, khônggiải được bằng đồ thị và cũng không là ma trận vuông thì sử dụng phươngpháp quy hoạch tuyến tính

u = max (u1, um) = max

Trang 26

Với người chơi thứ nhất Với người chơi thứ hai

Với người chơi thứ nhất Với người chơi thứ hai

i,j aij và thay ma trận A = [aij] bởi ma trận A′ = [aij + |c|], ta được

ma trận không âm Với cách đổi biến này, chiến lược tối ưu của mỗi bênkhông thay đổi, do đó áp dụng được phép đổi biến ở nhận xét 1, còn giácủa trò chơi lúc này tăng thêm một lượng C

Ta nên giải bài toán đối ngẫu (bài toán của người chơi thứ II) và nhớ thaycho việc tìm g = 1

Trang 27

(x∗1, x∗2, x∗m) của bài toán f nằm trong các số kiểm tra, tất nhiên lấy dấungược lại (xem QHTT).

Giá của trò chơi ban đầu là u − C, trong đó g = − 1

gmin′ .

Trở về công thức đổi biến, chiến lược tối ưu là:

-) Trở về biến ban đầu:

+) Của người chơi thứ nhất: pi = vx∗i; i = 1 m

+) Của người chơi thứ hai: qj = uy∗j; j = 1 n

1.5 Trò chơi ma trận với tổng bất kỳ

1.5.1 Khái niệm mở đầu

Định nghĩa 1.14 Trò chơi ma trận với tổng bất kỳ (còn gọi là "trò chơi

ma trận kép"), được xác định bởi cặp ma trận

A = [aij]m×n; B = [bij]m×n

Khi người chơi P1 chọn chiến lược đơn là hàng thứ i, còn người chơi P2

chọn chiến lược đơn là cột thứ j, thì người chơi P1 có phần thắng là aij

bm1 bm2 bmn

Ma trận A gọi là ma trận phần thắng của người chơi thứ nhất; Ma trận

B gọi là ma trận phần thắng của người chơi thứ hai

Hai ma trận A và B còn được viết theo cặp như sau:

Trang 28

Chú ý 1.4 -) Khi A = −B trò chơi trở thành trò chơi đối kháng, đây làtrường hợp duy nhất trò chơi ma trận kép là trò chơi đối kháng Haynói cách khác là trò chơi ma trận đơn là trường hợp riêng của trò chơi

1.5.2 Cân bằng Nash trong chiến lược đơn

Định nghĩa 1.15 Cặp chiến lược đơn hi∗, j∗i là cân bằng Nash của tròchơi nếu

ai ∗ j ∗ ≥ aij ∗ ∀i = 1 m (1.10a)

bi ∗ j ∗ ≥ bi ∗ j ∀j = 1 n (1.10b)Nhận xét 1.1 1 Bất đẳng thức (1.10a) cho thấy, khi người chơi P2 đãchọn cột j∗, thì người chơi P1 dù có sử dụng bất cứ hàng nào, phầnthắng cũng không vượt quá ai ∗ j ∗ Đó chính là lý do người chơi P1

chọn chiến lược đơn i∗ mà không chọn chiến lược khác

2 Bất đẳng thức (1.10b) cho thấy, khi người chơi P1 đã chọn hàng i∗,thì người chơi P2 dù có sử dụng bất cứ cột nào, phần thắng cũngkhông vượt quá bi ∗ j ∗ Đó chính là lý do người chơi P2 chọn chiến lượcđơn j∗ mà không chọn chiến lược khác

Từ định nghĩa trên ta có ngay quy tắc tìm tất cả các điểm cân bằngNash trong chiến lược đơn như sau

1) Tìm tất cả các phần tử lớn nhất trong mỗi cột của ma trận A, các phần

tử này được đánh dấu ∗

2) Tìm tất cả các phần tử lớn nhất trong mỗi hàng của ma trận B, cácphần tử này được đánh dấu ∗

Ngày đăng: 08/12/2016, 08:42

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w