CƠ SỞ2 LÝ THUYẾT Lý thuyết trò chơi game theory: là một lĩnh vực nghiên cứu toán học và kinh tế, nó t p trung vào vi c nghiên c u các tình huậ ệ ứ ống tương tác giữa các người tham gia
Trang 1ĐẠ I H C QU C GIA TP H CHÍ MINH Ọ Ố Ồ
TRƯỜ NG Đ I H C BÁCH KHOA Ạ Ọ
🙞 ···☼···🙜 🙜
BÁO CÁO BÀI T P L N Ậ Ớ MÔN ĐẠ I S TUY N TÍNH Ố Ế
ĐỀ TÀI: Game theory
LỚP L12, NHÓM 16 Giảng viên hướng dẫn: ThS Nguyễn Hữu Hiệp
STT Sinh viên thực hi nệ Mã s sinh viên ố
Thành ph H Chí Minh 2023 ố ồ –
Trang 2i
L I CỜ ẢM ƠN
Chúng em xin gửi l i cờ ảm ơn đến th y ThS Nguy n H u Hi p, giầ ễ ữ ệ ảng viên môn Đại sốtuyến tính l p L12 ớ
Thông qua đề tài bài tập l n, chúng em nhớ ận thấy đó chính là cơ hội để sinh viên tự
học tập, h c h i và tìm kiọ ỏ ếm thông tin; cũng như là cơ hội để chúng em kết bạn và giúp đỡ nhau trong quá trình làm việc, từ đó nâng cao khả năng giao tiếp, làm việc nhóm và tinh th n trách nhiầ ệm
Trong suốt quá trình chu n b ẩ ị cho đề tài, thầy dành thời gian để hướng d n và giẫ ải đáp thắc m c cắ ủa chúng em Chính vì vậy mà chúng em có thể hiểu rõ vấn đề để hoàn thiện đề tài của nhóm hơn
Chúng em nh n th y qua bài báo cáo, nhóm còn nhi u thi u sót v ậ ấ ề ế ề chất lượng thông tin, chi tiết gi i thích ví dả ụ,… Vì vậy, nhóm chân thành đón nhậ ờn l i nhận xét và đóng góp đến từ thầy nhằm để rút kinh nghiệm cho những bài tập của các môn khác sau này
Trang 3DANH M C HÌNH Ụ ẢNH
Hình 1 Đề bài t p áp d ng (1) ậ ụ 16
Hình 2 K t qu ế ả chạy chương trình (1) 16
Hình 3 K t qu ế ả chạy chương trình (2) 16
Hình 4 K t qu ế ả chạy chương trình (3) 17
Hình 5 K t qu ế ả chạy chương trình (4) 17
Hình 6 K t qu ế ả chạy chương trình (5) 17
Hình 7 K t qu ế ả chạy chương trình (6) 18
Hình 8 Đề bài t p áp d ng (2) ậ ụ 18
Hình 9 K t qu ế ả chạy chương trình (7) 19
Hình 10 Kết qu ả chạy chương trình (8) 19
Trang 4iii
MỤC LỤC
DANH M C HÌNH Ụ ẢNH ii CHƯƠNG 1 PHẦN MỞ ĐẦU 1 1.1 Yêu cầu đề tài 1CHƯƠNG 2 CƠ SỞ LÝ THUY T 2Ế2.1 Cơ sở lý thuyết c a ma tr n vào game theory 2ủ ậ2.1.1 Bi u di n chiể ễ ến lược 22.1.2 Payoff và l i ích 2ợ2.1.3 Tr ng thái Nash và ạ ổn định 22.1.4 Chia s lẻ ợi ích và xung đột 2 2.1.5 Chiến lược ti p c n ho c lo i bế ậ ặ ạ ỏ 3 2.1.6 Trò chơi lặp l i 3ạ2.1.7 Tính toán và phân tích 3 2.2 ng d ng c a ma tr n vào lý thuyỨ ụ ủ ậ ết trò chơi 32.3 ng d ng c a thu t toán 5Ứ ụ ủ ậ2.3.1 Kinh t và Kinh doanh 5ế2.3.2 Chính tr và Quan h qu c tị ệ ố ế 6 2.3.3 An ninh m ng 6ạ2.3.4 Sinh h c và Ti n hóa 6ọ ế2.3.5 Qu n lý tài nguyên t nhiên 6ả ự2.3.6 Chơi trò chơi 7 2.3.7 Qu n lý d án và s n xu t 7ả ự ả ấCHƯƠNG 3 VÍ DỤ MINH HOẠ 8 3.1 Ví d 1 8ụ3.2 Ví d 2 9ụ3.3 Ví d 3 10ụ3.4 Ví d 4 14ụCHƯƠNG 4 CHẠY CODE PYTHON 16 CHƯƠNG 5 KẾT LUẬN 20 TÀI LIỆU THAM KH O 21 Ả
Trang 5CHƯƠNG 1 PHẦ N M ĐẦU Ở
1.1 Yêu cầu đề tài
• Trình bày cơ sở lý thuyết các ứng dụng c a ma trủ ận vào Game theory
• Trình bày thuật toán và ví d c ụ ụ thể
• Lập trình b ng Matlab ho c Python 4 bài toán trong ằ ặ tài liệu tham kh o s 1 ả ố(trang 209-220)
Trang 62
CHƯƠNG CƠ SỞ2 LÝ THUYẾT
Lý thuyết trò chơi (game theory): là một lĩnh vực nghiên cứu toán học và kinh tế, nó
t p trung vào vi c nghiên c u các tình huậ ệ ứ ống tương tác giữa các người tham gia (người chơi) và cách họ đưa ra quyết định dựa trên mục tiêu và tương tác với người khác
2.1 Cơ sở lý thuy t c a ma tr n vào game theory ế ủ ậ
2.1.1 Biểu diễn chiến lược
Ma trận được sử dụng để biểu diễn chiến lược của mỗi người chơi trong trò chơi
Mỗi người chơi có mộ ật t p h p các chiợ ến lược có th lể ựa chọn, và ma tr n payoff (ma ậtrận th hi n l i ích) mô t kể ệ ợ ả ết quả ủa mỗ ặ c i c p chiến lược
2.1.2 Payoff và l i ích ợ
Mỗi ô trong ma trận th hi n lể ệ ợi ích (payoff) tương ứng cho mỗi người chơi dựa trên
s kự ết hợp c a chiủ ến lược của họ và đối thủ
Payoff có th bi u th lể ể ị ợi ích, chi phí, hoặc điểm số mà người chơi nhận được d a trên ựquyết định của họ và đối thủ
2.1.3 Trạng thái Nash và ổ n đ nh ị
Các tr ng thái Nash trong ma tr n là nh ng trạ ậ ữ ạng thái mà không có người chơi nào có động cơ để thay đổi chiến lược của mình khi biết chiến lược của đối thủ
S ự cân bằng Nash là một trạng thái mà mỗi người chơi đều đang chọn chiến lược tối
ưu dựa trên chiến lược của đối thủ
Ví dụ: Xét hai nhà hàng g n nhau N u c hai nhà hàng ch n giá c c nh tranh, ở ầ ế ả ọ ả ạkhông có ai có lợi ích gì khi thay đổi chiến lược Điều này là m t cân b ng ộ ằ Nash 2.1.4 Chia s lẻ ợi ích và xung đột
Ma trận cho phép mô hình hóa c ả các trò chơi hợp tác và xung đột
Trong trò chơi hợp tác, các người chơi cố gắng tối đa hóa lợi ích chung
Trong trò chơi xung đột, lợi ích của mỗi người chơi có thể đối lập
Trang 72.1.5 Chiến lược tiếp cận hoặc loại bỏ
Ma trận cho phép mô hình hóa c ả các trò chơi hợp tác và xung đột
Trong trò chơi hợp tác, các người chơi cố gắng tối đa hóa lợi ích chung
Trong trò chơi xung đột, lợi ích của mỗi người chơi có thể đối lập
2.1.6 Trò chơi lặ ạp l i
Ma trận có th ể mô hình hóa trò chơi lặ ại, trong đó lợp l i ích có th ể thay đổi qua các
lượt chơi và người chơi có thể điều chỉnh chiến lược của mình dựa trên kết qu ảtrước
2.2 ng dỨ ụng của ma tr n vào lý thuyậ ết trò chơi
• Ví dụ 1: Thế lư ng nan c a tù nhân ỡ ủ
Hai tù nhân bị b t gi ắ ữ và đưa vào hai phòng riêng biệt để đối diện với quyết định của mình Họ có hai lựa chọn: im l ng ho c khai N u c hai h p tác, h s nh n mặ ặ ế ả ợ ọ ẽ ậ ột hình
phạt nhỏ N u mế ột người hợp tác và người kia ph n bả ội, người hợp tác s nh n hình ẽ ậ
phạt lớn và người phản bội sẽ không b ị phạt N u c hai ph n b i, c ế ả ả ộ ả hai đều nh n mậ ột hình ph t mạ ức vừa Trong ngôn ng ữ ma trận, điều này có th ể được biểu diễn như sau:
Tù nhân 2 im lặng Tù nhân 2 tố cáo
Tù nhân 1 im lặng (-1; -1) (-3; 0)
Tù nhân 1 tố cáo (0; -3) (-2; -2)
Trang 84
Nhận xét: Một chiến lược cân bằng Nash trong trò chơi tù nhân là cả hai tù nhân đều chọn khai Mặc dù h có thể có lợi ích tốt hơn nếọ u cả hai im lặng, nhưng sự không chắc chắn và lợi ích cá nhân thường khiến cho chiến lược này tr nên h p lý ở ợ
• Ví dụ2: Trò chơi kéo - búa – bao
Ma trận payoff: với hàng i là người 1 ch n, cọ ột j là người 2 ch n ọ
S 0 th hi n tình hu ng hòa; 1 là chi n th ng; -1 là thua ố ể ệ ố ế ắ
Chiến lược cân bằng Nash có thể là chọn mỗi lựa chọn với xác suất 1/3, làm cho đối
thủ không thể tận d ng chiến lược c ể ụ ụth
• Ví dụ 3: Trò chơi hạnh phúc
Một cặp đôi nam và nữ phải quyết định điều h ọ muốn làm trong m t tình hu ng nhộ ố ất
định Cặp đôi này có hai lựa chọn: Đi xem phim hoặc xem một trận bóng đá
Nếu c hai chả ọn đi xem phim, họ ẽ s có một đêm yên ổn với l i ích lợ ớn hơn chung (Ví
Trang 9Thể hi n tình hu ng khi có nhi u l a ch n và mệ ố ề ự ọ ỗi người chơi có mộ ựa chọn ưa t lthích Trong môi trường này, việc đạt được sự ng thuđồ ận là quan trọng để ối ưu hóa t
lợi ích chung Trò chơi này có thể áp d ng cho các tình hu ng trong mụ ố ối quan hệ, lên
lịch giải trí, ho c quyặ ết định chung trong cu c s ng hàng ngày ộ ố
2.3 ng dỨ ụng của thuật toán
2.3.1 Kinh t và Kinh doanh ế
Quyết định đầu tư: Doanh nghiệp sử dụng lý thuy t trò chơi đ ế ểđánh giá tình huống cạnh tranh và quyết định đầu tư vào các dự án
Định giá sản phẩm: Lý thuyết trò chơi giúp dự đoán cách cạnh tranh và định giá sản
tư vào dự án
Trang 106
2.3.2 Chính tr và Quan h quị ệ ốc tế
Điều này bao g m viồ ệc nghiên cứu các tình huống tương tác giữa các quốc gia, tổ ch c ứ
quốc tế và chính tr gia Lý thuyị ết trò chơi được áp dụng để phân tích các cuộc đàm phán, xung đột và quyết định chính trị quốc tế
VÍ DỤ: Các cuộc đàm phán thương mại giữa các quốc gia thường dựa trên lý thuyết trò chơi Các quốc gia phải xem xét các tùy chọn về thuế quan, chính sách thương mại,
và các bi n pháp phòng ngệ ừa trả đũa để ả b o v lệ ợi ích quốc gia c a hủ ọ
C nh tranh giạ ữa các loài: Trong lĩnh vực sinh học và tiến hóa, lý thuyết trò chơi được
áp dụng để nghiên cứu cách các loài cạnh tranh cho tài nguyên và áp lực tiến hóa
VÍ DỤ: Trong m t qu n th ộ ầ ể động vật, đặc biệt trong trường h p các loài có hình thợ ức
xã hội hoặ ổ chức t c xã hội, cá nhân đực thường phải cạnh tranh để có quy n sinh s n ề ả
hoặc truyền gen c a h S c nh tranh có th xủ ọ ự ạ ể ảy ra qua các phương thức khác nhau 2.3.5 Qu n lý tài nguyên t nhiên ả ự
Quản lý tài nguyên thiên nhiên: Lý thuyết trò chơi giúp nghiên cứu cách qu n lý tài ảnguyên t ự nhiên, như nước, rừng, và động v t hoang dã, trong bậ ối cảnh c nh tranh và ạ
h n ch tài nguyên ạ ế
VÍ DỤ: Quản lý r ng và chừ ặt cây: trong quản lý r ng, quyừ ết định v t n suề ầ ất và
phương pháp chặt cây có thể có ảnh hưởng lớn đến sức kháng của rừng và tài nguyên
g ỗ trong tương lai Các quản lý c n xem xét nhi u y u t , ch ng hầ ề ế ố ẳ ạn như tài nguyên
hiện có, môi trường t nhiên, k vự ỳ ọng tương lai, và quy định pháp luật
Trang 112.3.6 Chơi trò chơi
E-sports: Trò chơi video và e-sports dựa trên lý thuyết trò chơi để phát tri n chiể ến lược
và c nh tranh vạ ới người chơi khác
VÍ DỤ: Các người chơi và đội tuyển e-sports s d ng lý thuyử ụ ết trò chơi để phát tri n ểchiến lược trong các trò chơi video đa cầu, như League of Legends hoặc Dota 2 Họ
phải tối ưu hóa sử ụng tài nguyên và tương tác với đố d i th chi n th ng ủ để ế ắ
2.3.7 Qu n lý d án và sả ự ản xuất
Lập lịch sản xu t: Lý thuyấ ết trò chơi được sử ụng để ối ưu hóa lị d t ch trình s n xuả ất và phân chia tài nguyên trong qu n lý d ả ự án
VÍ DỤ: Trong qu n lý d ả ự án, lý thuyết trò chơi có thể được áp dụng để lên lịch sản
xuất, phân chia tài nguyên và đưa ra quy t đế ịnh v ph m vi và ngân sách d ề ạ ự án
Trang 124 6 2
Nhận xét: Điểm yên ngựa (giá trị của trò chơi) là 2 và người chơi A có lợi thế Cách hành động tốt nhất cho A là là đi nước thứ 2, người chơi A sẽ ắng đượ th c ít nhất hai đơn vị từ B, bất k lựa chọn cể ủa B Cách hành động tốt nhất đối với B là đi nước thứ 3, người chơi B sẽ giới hạn mức thua của mình không quá hai đơn vị, bất kể lựa chọn của
A
Chú thích:
Trang 13Payoff matrix (ma trận tỷ lệ): trò chơi gồm 2 người chơi với ma tr n m×n, v i A có ậ ớ
m nước đi và B có n nư c đi; đểớ thể hi n lựa ch n cệ ọ ủa người chơi Người chơi A sẽ tối
đa hóa phần thắng cho mình, trong khi người chơi B sẽ giảm thiểu tổn thất lớn nhất của mình Ma trận t l không bao g m luỷ ệ ồ ật chơi như thay phiên nhau thực hiện hành
động, hoặc người chơi phải đưa ra hành động mà không biết ngư i kia sẽ đưa ra lựa ờchọn nào
Saddle point (điểm yên ngựa): là mức tối đa theo cột và mức tối thiểu theo hàng Nếu trò chơi có một saddle point (điểm yên ngựa) thì chiến lược hàng và cột tương ứng là chiến lượ ối ưu.c t
Zero-sum game (tổng trò chơi bằng 0):trò chơi được cho là công b ng ằ
Bước 1: Lập ma trận m r ng [A|B] c a hệ (A là ma trận hệ s , B là c t tự do) ở ộ ủ ố ộ
Bước 2: BĐSC (trên các dòng của) ma trận mở rộng để đưa nó về dạng bậc thang Từđó tính đuợc hạng của A và [A| B]
+ N u rank(A) < rank([A|B]) thì k t lu n h vô nghi m Thu t toán d ng ế ế ậ ệ ệ ậ ừ
+ N u rank(A) = rank([A|B]) = r thì h có nghiế ệ ệm Làm tiếp bước 3
Bước 3: Viết lại hệ mới tương đương với hệ đã cho nhưng đơn giản hơn Giữ lại ở vế trái r ẩn ng vứ ới các hệ s u tiên khác không trên m i dòng khác không c a ma tr n ố đầ ỗ ủ ậ
bậc thang và gọi chúng là các ẩn chính (có đúng r ẩn chính) Các n còn lẩ ại chuyển sang vế phải làm ẩ ựn t do (có n – r ẩ ựn t do)
Bước 4: Ta sẽ cho luôn các ẩn tự do bằng 0 Sau đó ta sẽ thử lạ ệi h phương trình:
Trang 15(Chà, đó là phóng đại, b n s ạ ẽkhông đạt được bất kỳ điều gì trong toán học, nhưng câu
hỏi này đ thú vịủ )
Vì vậy, b n có t ng cạ ổ ộng 5 người bạn (nam) và b n có 5 cô gái trong l p hạ ớ ọc c a bủ ạn
Bây gi , mờ ỗi người quyết định lên giường, hoặc ít nhất là có bạn gái đi chơi với nhau Làm thế nào để ạ b n quyết định ai s nhẽ ận được cái nào?
Hãy để tôi b t đ u bắ ầ ằng cách xác định 5 chàng trai và 5 cô gái
A: Chàng trai đẹp trai nh t ấ
B: anh chàng đẹp trai
C: Anh chàng đẹp trai vừa ph i ả
D: Chàng trai có vẻ ngoài trung bình
E: Chàng trai có vẻ ngoài dưới trung bình
a: Cô gái xinh đẹp nhất
b: Cô gái xinh đẹp
c: cô gái đẹp vừa ph i ả
d: Cô gái có v ngoài trung bình ẻ
e: Cô gái có v ẻ ngoài dưới trung bình
Bây gi , tôi vi t câu tr lờ ế ả ời này dựa trên quan điểm và giả đị nh c a các chàng trai ủ
Giả đị nh
# 1: Kh ả năng của mỗi người để có được một đối tác dựa trên s h p d n v ự ấ ẫ ề thể chất, không ph i bả ất kỳ ế ố y u t nào khác
# 2: Đây là một trò chơi một chọi một, trong đó mỗi chàng trai chỉ có thể nhận được
một cô gái và ngược lại
# 3 Không ai nên mở ột mình
Trang 16h p d n v ngoấ ẫ ề ại hình: Câu tr l i là KHÔNG ả ờ
Tuy nhiên, tất cả các chàng trai ABCDE s c gẽ ố ắng đạt điểm 'a' trước Vì cô gái 'a'
nhận được quá nhi u yêu c u cùng m t lúc nên cô y s t ề ầ ộ ấ ẽ ừ chối t t cấ ả vì không mu n ốlàm tổn thương ai
Sau đó, tất cả các chàng trai sẽ chọn cô gái "b"
Điều tương tự sẽ xảy ra lần nữa Cô gái "b" bị từ chối vì lý do tương tự
Ngay cả "e" cũng sẽ ừ chối t t c t ấ ả ọi ngườ m i vì cô y không ph i là mấ ả ột con điếm!
Chuyện gì đang xảy ra? Sự bế tắc
Tất cả các chàng trai đấu tranh với nhau để đạt được điều tốt nhất thay vì c gố ắng đạt được những gì h xọ ứng đáng sẽ chắc chắn khiến h thất v ng ọ ọ
Đáng lẽ h phọ ải làm gì? L ẽra họ nên đi như A:a, B:b, E:e
Đây (có thể) là cách John Forbes Nash, Jr nảy ra ý tưởng phát triển khái ni m 'nhỏ' v ệ ề
Lý thuyết trò chơi Một số chàng trai ngồi trong quán bar quyết định tán tỉnh một số cô gái và John Nash đã tìm ra một lý thuyết từ đó Để biết thêm về nó, hãy xem phim của Russel Crow: A Beautiful Mind
Trang 17Đây là cảnh tượng xảy ra ở quán bar
Bây gi b n s ờ ạ ẽ nghĩ,
'Này, nó không khó lắm đâu Ngay cả tôi cũng đã nghĩ đến điều này!'
Tuy nhiên, những gì Nash đã làm với Lý thuyết trò chơi sau này đã trở thành huyền tho i.ạ
Một ví dụ đơn giản khác (m c dù tôi s không giặ ẽ ải thích tính toán học của nó, nhưng đây là một ví dụ thú vị và bạn sẽ thấy, ngoài việc có B n gái, Lý thuyếạ t Trò chơi có th ểđược sử d ng trong các vụ ấn đề thực tế như thế nào) như sau:
Cuộc chiến giữa quân A và quân B
Và đây là tình huống
Nếu Quân đoàn B tấn công các căn cứ không quân nhỏ hơn và Quân đoàn A bảo vệ các sân bay nhỏ hơn, cả hai sẽ s ng sót ố
Nếu Quân đoàn B tấn công các căn cứ không quân lớn hơn và Quân đoàn A ngu ngốc
b o v ả ệ các căn cứ nhỏ hơn, thì các căn cứ ớn hơn sẽ ị l b phá hủy
Nếu Quân đoàn B tấn công các căn cứ không quân nhỏ hơn và Quân đoàn A bảo vệ các căn cứ lớn hơn, thì các căn cứ nh ỏ hơn sẽ ị b phá h y ủ
Nếu Quân đoàn B tấn công các căn cứ không quân lớn hơn và Quân đoàn A bảo vệ các căn cứ lớn hơn, cả hai sẽ t n tồ ại
Trang 1814
Bây gi , gi s b n là ch huy cờ ả ử ạ ỉ ủa Quân đoàn A, nhưng bạn không biết Quân đoàn B
s t n công ẽ ấ ở đâu Bạn s quyẽ ết định làm th ế nào để phân b ổ Quân đội A của mình để
giảm thiểu thiệt hại?
Tôi sẽ không viết ra cách để làm điều đó, nhưng, câu trả ời là, l
Đó là cách bạn s phân b ẽ ổ quân đội của mình làm ch huy cỉ ủa Quân đoàn A
Một đầu là 3/4 lính và đầu kia là 1/4 lính
3.4 Ví d 4 ụ
Loại b chiỏ ến lược lép v ế
Cho ma tr n bimatrix sau ậ
W X Y Z 𝑇
𝐵 [4,5 6,6 2,8 4,4]6,6 4,4 1,2 8,5Tìm các chiến lược thuần của NC1 và NC2 b lép v so v i m t chiị ế ớ ộ ến lược thuần khác Tìm các điểm cân bằng của trò chơi này
B1: Tìm chiến lược thu n c a NC1: ầ ủ
Xét t ng hàng c a ma tr n tìm giá tr lừ ủ ậ ị ớn nhất trong hàng đó:
W X Y Z 𝑇
𝐵 [6,6 4,4 1,2 8,54,5 6,6 2,8 4,4] 8,5 6,6B2: Tìm chiến lược thu n c a NC2: ầ ủ
Xét t ng c t cừ ộ ủa ma trận và tìm giá tr l n nh t trong cị ớ ấ ột đó: