Lịch sử của lý thuyết trò chơi bắt đầu từ giữa thế kỷ 20, với những đóng góp nổibật từ các nhà toán học và nhà khoa học như John von Neumann và John Nash.John von Neumann, người được coi
Trang 1TR ƯỜ NG Đ I H C: CÔNG NGH TP.HCM Ạ Ọ Ệ
BÁO CÁO ĐỒ ÁN Học phần: Trí tuệ nhân tạo
Chuyên đề:
Nghiên cứu về lý thuyết trò chơi
Sinh viên thực hiện: Nguyễn Trọng Dũng - 2280600387
Trần Duy Tân - 2280602873
Võ Minh Thuận - 2280603164 Nguyễn Thiên Bửu Ngọc - 2280618535
Lớp: 22DTHH2Giáo viên hướng dẫn: Nguyễn Văn Cẩn
TP HCM, 10/10/2024
Trang 2MỤC LỤC
Nội dung
MỤC LỤC 2
LỜI MỞ ĐẦU 4
Chương I: Lý thuyết trò chơi là gì? 5
1.1 Định Nghĩa 5
1.2 Tổng quan 5
1.3 Các yếu tố cấu thành trò chơi 5
1.4 Vai trò của lý thuyết trò chơi trong nghiên cứu 6
Chương II: Lịch sử của ngành Lý thuyết trò chơi 6
1 Khởi nguồn và sự phát triển 6
1.1 Cân bằng Nash (Nash Equilibrium): 7
1.2 Lý thuyết trò chơi tiến hóa (Evolutionary Game Theory): 8
1.3 Ứng dụng ban đầu trong kinh tế học: 8
1.4 Ứng dụng trong chính trị và chiến tranh: 8
Chương III: Biểu diễn trò chơi 9
1 Dạng chuẩn tắc 9
2 Dạng mở rộng 10
1 Trò chơi đối xứng và bất đối xứng 12
1.2 Trò chơi bất đối xứng (Asymmetric Games): 12
1.3 Trò chơi tổng bằng không và tổng khác không 13
- Trò chơi tổng bằng không (Zero-sum Games): 13
- Trò chơi tổng khác không (Non-zero-sum Games): 13
1.4 Trò chơi đồng thời và trò chơi tuần tự 14
1.5 Trò chơi có thông tin hoàn hảo và không hoàn hảo 15
- Trò chơi có thông tin không hoàn hảo (Imperfect Information Games): 15
1.6 Trò chơi dài vô tận và trò chơi có kỳ hạn 16
Chương V: Ứng dụng của lý thuyết trò chơi 16
1 Kinh tế và kinh doanh 16
1.1 Cạnh tranh giữa các doanh nghiệp: 16
1.2 Thương lượng và đàm phán: 16
1.3 Các cuôc đấu thầu và đấu giá: 17
2 Sinh học và sinh thái học 17
2.1 Trò chơi tiến hóa: 17
2.2 Tương tác giữa các loài: 17
2.3 Tính toán tối ưu trong sinh 17
Trang 33 Khoa học máy tính và AI 18
3.1 Trò chơi trong AI: 18
3.2 Thuật toán học tăng cường: 18
3.3 Bảo mật và an ninh mạng: 18
4 Chính trị học 18
4.1 Lý thuyết quyết định bầu cử: 18
4.2 Các cuôc đàm phán quốc tế: 19
4.3 Xung đôt và chiến tranh: 19
5 Triết học 19
5.1 Dilemma đạo đức: 19
5.2 Lý thuyết hợp lý hóa hành vi: 19
5.3 Công bằng và phân phối: 20
6 Lý thuyết trò chơi trong kinh doanh 20
6.1 Chiến lược đặt hàng hóa: 20
6.2 Ước tính doanh thu của doanh nghiệp: 21
6.3 Tối ưu lợi nhuận: 21
Chương VI: Đánh giá và Hướng đi Tương lai của Lý thuyết Trò chơi 21
1 Tóm tắt và tổng kết 21
2 Những thách thức và hạn chế hiện tại 22
2.1 Tính phức tạp trong các tình huống thực tế: 22
2.2 Thiếu thông tin và không chắc chắn: 22
3 Hướng nghiên cứu tương lai 22
3.1 Tích hợp với khoa học hành vi: 22
3.2 Ứng dụng trong công nghệ và AI: 22
3.3 Phân tích các vấn đề toàn cầu: 22
4 Vai trò của lý thuyết trò chơi trong việc giải quyết các vấn đề toàn cầu 23
4.1 Xây dựng mô hình hợp tác quốc tế: 23
4.2 Quản lý xung đôt: 23
4.3 Đàm phán và thương lượng: 23
Tài Liệu Tham Khảo 24
Trang 4LỜI MỞ ĐẦU
Trong thế giới hiện đại, nơi mà các quyết định của con người thường chịu ảnhhưởng bởi nhiều yếu tố phức tạp và mâu thuẫn, lý thuyết trò chơi đã trở thành môtcông cụ mạnh mẽ giúp chúng ta hiểu và phân tích các hành vi chiến lược Khảnăng của lý thuyết trò chơi trong việc mô hình hóa các tình huống mà trong đónhiều cá nhân hoặc tổ chức tương tác và ra quyết định đã dẫn đến sự ứng dụngrông rãi của nó trong nhiều lĩnh vực khác nhau, từ kinh tế và khoa học xã hôi chođến sinh học, khoa học máy tính, chính trị và triết học
Lý thuyết trò chơi không chỉ đơn thuần là môt bô công cụ lý thuyết mà còn là môtcách tiếp cận có thể giúp giải thích và dự đoán hành vi của các cá nhân trong cáctình huống có tính cạnh tranh hoặc hợp tác Các khái niệm cơ bản trong lý thuyếttrò chơi, như trò chơi đồng thời, trò chơi tuần tự, trò chơi tổng bằng không, và tròchơi hợp tác, đã tạo ra nền tảng vững chắc cho nhiều nghiên cứu và ứng dụng thựctiễn Chúng giúp chúng ta hiểu rõ hơn về cách mà các cá nhân ra quyết định trongcác bối cảnh xã hôi phức tạp, nơi mà đông lực và lợi ích cá nhân thường xung đôtvới lợi ích chung
Lịch sử của lý thuyết trò chơi bắt đầu từ giữa thế kỷ 20, với những đóng góp nổibật từ các nhà toán học và nhà khoa học như John von Neumann và John Nash.John von Neumann, người được coi là môt trong những người sáng lập của lýthuyết trò chơi, đã phát triển những ý tưởng cơ bản về cách mà các cá nhân có thểtối ưu hóa quyết định của mình trong các tình huống cạnh tranh Tuy nhiên, môttrong những đóng góp quan trọng nhất của Nash là khái niệm về điểm Nash, nơi
mà không có người chơi nào có đông lực để thay đổi chiến lược của mình khi biếtchiến lược của các đối thủ Những ý tưởng này đã mở ra môt lĩnh vực nghiên cứu
đa dạng, với nhiều khái niệm và phương pháp mới được phát triển để giải quyếtcác vấn đề phức tạp trong xã hôi
Mục tiêu của bài báo cáo này là cung cấp môt cái nhìn tổng quan và sâu sắc về lýthuyết trò chơi, từ những khái niệm cơ bản cho đến các ứng dụng thực tiễn vànhững thách thức mà nó đang phải đối mặt
Trang 5Chương I: Lý thuyết trò chơi là gì?
1.1 Định Nghĩa
Lý thuyết trò chơi là một nhánh của toán học chuyên nghiên cứu các tình huống
mà kết quả của mỗi người chơi phụ thuộc vào hành động của những người chơikhác Nó được sử dụng để mô tả các tương tác chiến lược giữa các tác nhân (conngười, tổ chức, hoặc thậm chí các sinh vật) mà trong đó mỗi bên đều có một mụctiêu riêng biệt và đưa ra các quyết định có thể ảnh hưởng đến cả kết quả của chính
họ lẫn của các bên còn lại
1.2 Tổng quan.
- Nguồn gốc: Lý thuyết trò chơi được khởi xướng bởi
John von Neumann và Oskar Morgenstern vào thập niên
1940, với cuốn sách kinh điển Theory of Games and
Economic Behavior Sau đó, John Nash đã phát triển
thêm lý thuyết cân bằng Nash, môt trong những khái
niệm cốt lõi của lĩnh vực này
Mục tiêu chính: Lý thuyết trò chơi phân tích cách các
bên tham gia tương tác với nhau và cách mà mỗi bên
có thể tối đa hóa lợi ích của mình thông qua các quyết
định chiến lược
1.3 Các yếu tố cấu thành trò chơi
Môt trò chơi trong lý thuyết trò chơi thường bao gồm các yếu tố chính sau:
- Người chơi (Players): Những cá nhân, nhóm hoặc tổ chức tham gia vào trò chơi
và đưa ra quyết định Người chơi có thể là bất kỳ tác nhân nào có khả năng thựchiện hành đông chiến lược, từ các cá nhân cho đến các quốc gia hoặc doanhnghiệp
- Chiến lược (Strategies): Mỗi người chơi có môt tập hợp các chiến lược, đó là cáchành đông hoặc lựa chọn mà họ có thể thực hiện Chiến lược của mỗi người chơithường bị ảnh hưởng bởi chiến lược của các người chơi khác
Trang 6- Kết quả (Outcomes): Mỗi trò chơi dẫn đến môt kết quả cụ thể dựa trên các chiếnlược mà người chơi lựa chọn Kết quả này có thể là môt trạng thái cân bằng hoặcmôt tập hợp các phần thưởng hoặc lợi ích.
- Phần thưởng (Payoffs): Mỗi kết quả trong trò chơi sẽ có môt giá trị phần thưởng,đại diện cho lợi ích hoặc tổn thất mà người chơi nhận được dựa trên chiến lược mà
họ đã chọn Phần thưởng thường thể hiện dưới dạng các giá trị số và phụ thuôcvào cả chiến lược của chính người chơi lẫn các chiến lược của những người chơikhác
- Quy tắc trò chơi (Rules): Các quy tắc xác định cách thức trò chơi diễn ra, baogồm việc người chơi có thể thực hiện các hành đông gì, khi nào họ có thể hànhđông và trò chơi kết thúc khi nào
1.4 Vai trò của lý thuyết trò chơi trong nghiên cứu.
Lý thuyết trò chơi đã có những đóng góp quan trọng trong nhiều lĩnh vực nghiêncứu khác nhau:
- Kinh tế học: Trong kinh tế học, lý thuyết trò chơi được sử dụng để phân tích cácthị trường cạnh tranh, hành vi của doanh nghiệp, và các vấn đề như định giá, đấuthầu, và chiến lược kinh doanh
- Chính trị: Lý thuyết trò chơi giúp phân tích các quyết định chính sách, đàm phánquốc tế, và các vấn đề như đấu tranh quyền lực và ổn định chính trị
- Sinh học: Trong sinh học tiến hóa, lý thuyết trò chơi được sử dụng để hiểu về sựtương tác giữa các loài và sự phát triển của chiến lược sinh tồn
Khoa học máy tính: Lý thuyết trò chơi cũng đóng vai trò quan trọng trong các lĩnhvực như trí tuệ nhân tạo, mạng lưới máy tính, và an ninh mạng
Chương II: Lịch sử của ngành Lý thuyết trò chơi
1 Khởi nguồn và sự phát triển
- Lý thuyết trò chơi có nguồn gốc từ sự kết hợp của toán học và kinh tế học Môttrong những dấu mốc quan trọng nhất trong lịch sử ngành là sự ra đời của cuốn
sách “Theory of Games and Economic Behavior” (Lý thuyết trò chơi và hành vi
Trang 7kinh tế) do John von Neumann và Oskar Morgenstern viết
vào năm 1944 Đây là công trình đầu tiên đặt nền móng cho
lý thuyết trò chơi hiện đại, tập trung vào các trò chơi hợp
tác, trong đó các bên có thể cùng nhau đưa ra các quyết
định để tối đa hóa lợi ích chung
- Trước đó, các ý tưởng tương tự về lý thuyết trò chơi đã
tồn tại trong các phân tích toán học về các tình huống chiến lược như cờ vua hoặccác trò chơi giải trí, nhưng chúng không phát triển thành môt lĩnh vực nghiên cứuhoàn chỉnh cho đến khi von Neumann và Morgenstern mở rông chúng sang cácứng dụng kinh tế và xã hôi
- John von Neumann: Được coi là “cha đẻ” của lý thuyết trò chơi, von Neumann
đã phát triển khái niệm về trò chơi tổng bằng không (zero-sum game) từ năm
1928, trong đó lợi ích của môt bên đồng nghĩa với tổn thất của bên kia
- Oskar Morgenstern: Là môt nhà kinh tế học, ông đã công tác với von Neumann đểphát triển các ý tưởng về hành vi kinh tế dựa trên các lý thuyết trò chơi, đặc biệttrong các tình huống mà các bên cần đưa ra quyết định chiến lược
Những tiến bô quan trọng
CÁC TIẾN BÔ QUAN TRỌNG TRONG NHỮNG NĂM QUA:
1.1 Cân bằng Nash (Nash Equilibrium):
- Môt trong những bước ngoặt quan trọng nhất của lý thuyết trò chơi là sự ra đờicủa khái niệm cân bằng Nash vào năm 1950, do nhà toán học John Nash pháttriển
- Nash đã chỉ ra rằng trong mọi trò chơi không hợp tác với các người chơi có thểlựa chọn
chiến lược môt cách đôc lập, luôn tồn tại ít nhất môt cân bằng chiến lược màkhông ai có thể cải thiện lợi ích của mình bằng cách thay đổi chiến lược, nếu cácngười chơi khác không thay đổi
- Khái niệm này đã trở thành môt công cụ phân tích chủ đạo trong nhiều lĩnh vựctrong việc môt bên giành được những gì bên kia mất
Trang 81.2 Lý thuyết trò chơi tiến hóa (Evolutionary Game Theory):
John Maynard Smith đã giới thiệu kháiniệm lý thuyết trò chơi tiến hóa
Trò chơi có thông tin không hoàn hảo(Imperfect Information Games): Lý thuyếttrò chơi đã được mở rông sang các tìnhhuống trong đó người chơi không có đầy
đủ thông tin về chiến lược hoặc trạng tháicủa các người chơi khác
Điều này đưa lý thuyết trò chơi đến gầnhơn với các tình huống thực tế, nơi màthông tin thường không rõ ràng hoặc không đầy đủ
1.3 Ứng dụng ban đầu trong kinh tế học:
- Lý thuyết trò chơi ban đầu được
áp dụng chủ yếu trong kinh tế học để giải
quyết các vấn đề như cạnh tranh giữa các
doanh nghiệp, đấu thầu, đàm phán và
hành vi thị trường Các mô hình trò chơi
đã giúp các nhà kinh tế phân tích cách
các công ty hoặc tổ chức đưa ra các quyết
định chiến lược trong môi trường cạnh
tranh, từ đó hiểu rõ hơn về các hiện tượng như đôc quyền, cartel, và chiến lượcgiá
1.4 Ứng dụng trong chính trị và chiến tranh:
Lý thuyết trò chơi cũng sớm được áp dụng trong lĩnh vực chính trị và quân sự.Trong thời kỳ Chiến tranh Lạnh, lý thuyết trò chơi đã được sử dụng để mô phỏngcác quyết định chiến lược giữa Mỹ và Liên Xô, chẳng hạn như trong các tình
Trang 9huống đối đầu hạt nhân Trò chơi tổng bằng không được sử dụng để mô hình hóacác cuôc xung đột.
Mở rộng sang các lĩnh vực khác: Sau những thành công ban đầu, lý thuyết trò chơi
đã mở rộng ra nhiều lĩnh vực mới Các nhà sinh học đã sử dụng lý thuyết trò chơi
để giải thích sự phát triển của các hành vi hợp tác trong tự nhiên, các nhà xã hôihọc đã dùng nó để nghiên cứu sự tương tác giữa các cá nhân trong xã hôi, và cácnhà khoa học máy tính đã ứng dụng lý thuyết trò chơi để phát triển các thuật toántrong trí tuệ nhân tạo và tối ưu hóa mạng lưới
Chương III: Biểu diễn trò chơi
1 Dạng chuẩn tắc.
- Dạng chuẩn tắc là môt cách biểu diễn các trò chơi trong lý thuyết trò chơi, trong
đó người chơi, các chiến lược và các phần thưởng (payoffs) tương ứng được biểudiễn dưới dạng bảng Đây là cách biểu diễn phổ biến cho các trò chơi tĩnh, nơi cácngười chơi quyết định chiến lược của mình đồng thời và không có thông tin về lựachọn của đối thủ
- Cấu trúc của dạng chuẩn tắc:
Người chơi: Các người chơi trong trò chơi được xác định
Chiến lược: Mỗi người chơi có môt tập hợp các chiến lược khả thi
Phần thưởng (Payoff matrix): Mỗi chiến lược của môt người chơi sẽ tạo ra môtphần thưởng tương ứng, phụ thuôc vào chiến lược của cả người chơi đó và các đốithủ khác
Ví dụ về trò chơi trong dạng chuẩn tắc:
- Trò chơi Tù nhân:
khaibáo
Khaibáo
Trang 10- Trong bảng này, mỗi ô chứa môt cặp giá trị, với phần thưởng của người chơi 1được liệt kê trước, và phần thưởng của người chơi 2 ở phía sau Ví dụ: nếu cả haiđều không khai báo, họ đều nhận phần thưởng -1.
Ưu điểm của dạng chuẩn tắc:
- Rất trực quan khi áp dụng cho các trò chơi có số lượng chiến lược và người chơihạn chế
- Giúp dễ dàng phân tích các chiến lược thống trị và cân bằng Nash
tự nhất định và có thể quan sát các hành đông của nhau trước khi đưa ra lựa chọn
- Cấu trúc của dạng mở rông:
Các nút quyết định: Mỗi nút đại diện cho môt thời điểm mà môt người chơi phảiđưa ra quyết định Tên của người chơi và các lựa chọn chiến lược tại mỗi nút đềuđược hiển thị
Các nhánh: Các nhánh từ mỗi nút biểu thị các chiến lược hoặc hành đông màngười chơi có thể thực hiện
Phần thưởng: Phần thưởng của mỗi người chơi được gắn vào các nút lá (terminalnodes), thể hiện kết quả cuối cùng của trò chơi khi mọi người chơi đã hành đông
Ví dụ về dạng mở rông: Môt trò chơi đơn giản giữa hai người chơi: Người chơi 1
quyết định trước, có thể chọn A hoặc B Sau đó, nếu người chơi 1 chọn A, người chơi 2 sẽ chọn giữa X và Y Nếu người chơi 1 chọn B, người chơi 2 sẽ không có quyền lựa chọn Dạng này có thể được biểu diễn dưới dạng cây, với các nhánh chỉ
Trang 11ra chiến lược và phần thưởng cuối cùng tại mỗi đầu nhánh.
Ưu điểm của dạng mở rông:
- Hiển thị rõ ràng thứ tự hành đông và quyết định của các người chơi
- Thích hợp cho các trò chơi đông hoặc trò chơi có nhiều giai đoạn, nơi người chơi
có thể quan sát và phản ứng lại các hành đông trước đó của đối phương
- Có thể xử lý tốt các tình huống thông tin không hoàn hảo hoặc bất đối xứng, nhưtrò chơi đàm phán hoặc trò chơi có yếu tố ngẫu nhiên
Nhược điểm:
- Dạng biểu diễn này có thể trở nên phức tạp đối với các trò chơi có nhiều ngườichơi hoặc nhiều lựa chọn chiến lược
- Khó áp dụng cho các trò chơi có số lượng lớn các chiến lược
So sánh giữa dạng chuẩn tắc và dạng mở rộng.
TIÊU CHÍ DẠNG CHUẨN TẮC
(NORMAL FORM)
DẠNG MỞ RỘNG (EXTENSIVE FORM)
Thứ tự hành
động
Không thể hiện thứ tự Hiển thị rõ ràng thứ tự
Biểu diễn chiến
Có thể quan sát hành độngcủa đối thủ trước khi raquyết định
Phân tích Thích hợp cho phân tích
nhanh về cân bằng Nashhoặc chiến lược thống trị
Thích hợp để phân tích tròchơi động hoặc trò chơi vớinhiều vòng quyết định
Trang 12Chương IV: Các loại trò chơi
1 Trò chơi đối xứng và bất đối xứng.
1.1 Trò chơi đối xứng (Symmetric Games):
- Trong môt trò chơi đối xứng, phần thưởng của mỗi người chơi chỉ phụ thuôc vàochiến lược mà người chơi đã chọn, chứ không phải ai là người chọn chiến lược đó
- Điều này có nghĩa là nếu các người chơi hoán đổi chiến lược của nhau, thì phầnthưởng của họ vẫn như cũ Nói cách khác, trong môt trò chơi đối xứng, mọi ngườichơi có cấu trúc chiến lược và phần thưởng giống hệt nhau
Ví dụ: Trò chơi Tù nhân là môt ví dụ tiêu biểu cho trò chơi đối xứng, bởi cả hai
người chơi đối diện với các lựa chọn và phần thưởng giống nhau.
1.2 Trò chơi bất đối xứng (Asymmetric Games):
- Ngược lại, trong trò chơi bất đối xứng, phần thưởng của người chơi phụ thuôckhông chỉ vào chiến lược được chọn mà còn vào việc ai chọn chiến lược đó
- Mỗi người chơi có thể có môt bô chiến lược và phần thưởng khác nhau, làm chotrò chơi trở nên phức tạp hơn