1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo Đồ Án trí tuệ nhân tạo tìm hiểu lý thuyết trò chơi và Ứng dụng thuật toán minimax, cắt tỉa alph beta trong trò chơi cờ tướng

25 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm hiểu lý thuyết trò chơi và ứng dụng thuật toán minimax, cắt tỉa alpha-beta trong trò chơi cờ tướng
Tác giả Lê Minh Khánh, Nguyễn Thùy Học, Nguyễn Quý Hưng
Người hướng dẫn ThS. Vũ Thanh Hiền
Trường học Trường Đại học Công nghệ Tp. HCM
Chuyên ngành Công nghệ thông tin
Thể loại Đồ án trí tuệ nhân tạo
Năm xuất bản 2023
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 25
Dung lượng 5,15 MB

Nội dung

Tối ưu hóa chiến thuật chơi cờ tướng: Nghiên cứu cách thuật toán minimax có thể được áp dụng để tối ưu hóa quyết định của máy tính trong việc di chuyển các quân cờ và phát triển chiến th

Trang 1

e) HUTECH BỘ GIÁO DỤC VÀ ĐÀO TẠO

Đại học Công nghệ Tp.HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM

BÁO CÁO ĐỎ ÁN TRÍ TUỆ NHÂN TẠO

TIM HIEU LY THUYET TRO CHOI VA UNG

DUNG THUAT TOAN MINIMAX, CAT TIA

ALPH-BETA TRONG TRO CHOI CO TUONG

Nganh: CONG NGHE THONG TIN Giảng viên hướng dẫn: ThS Vũ Thanh Hiền

Nhóm Sinh viên thực hiện:

Tên Lớp MSSV

TP Hồ Chí Minh, 2023

Trang 2

LOI CAM ON

Lời đầu tiên, chúng em xin chân thành cảm ơn Thầy Vũ Thanh Hiền hướng dẫn

đỗ án chuyên ngành cho chúng em

Sau thời gian học tập và và tìm hiểu dưới sự hướng dẫn của thầy, chúng em đã rút ra được rất nhiều kinh nghiệm cũng như kỹ năng làm việc mà không chỉ đơn giản

là đọc trong sách vở có thê có được và một lần nữa, chúng em xin gửi lời cảm ơn sâu sắc nhất đến Thầy đã dạy bảo và hướng dẫn những kiến thức chuyên môn cần có để chúng em áp dụng tốt nhất những gì đã được học suốt những thời gian qua

Trong quá trình thực hiện và làm báo cáo, do còn thiếu nhiều kinh nghiệm thực

tế nên không tránh khỏi những sai sót Chúng em rất mong nhận được những ý kiến đóng góp của Thây để giúp chúng em trong lĩnh vực này được hoàn thiện hơn Đó là hành trang quý giá giúp chúng em hoàn thiện kiến thức của mình sau này

Chúng em xin chân thành cảm ơn và trân trọng kính chào!

Trang 3

NHAN XET & DANH GIA CUA GIANG VIEN HUONG DAN

Qua qua trinh hoc tap:

Giáo viên hướng dẫn có một số nhận xét, đánh giá như sau:

ThS Vũ Thanh Hiền

Ul

Trang 4

MUC LUC

Contents

NHẬN XÉT & ĐÁNH GIÁ CỦA GIẢNG VIÊN HƯỚNG DÂN ii

MUC LUC sssssscssscssessssssscsseseessseeseessnersessesesssssessessseeseessnessessesseessessssessesesssnsaes ses iii

LỜI MỞ ĐẦU s°©+esSEYxesEEEASE+LSEETkEETrktrtrkesrtrrkerrkerrrerr 1

1 CHƯƠNG I: LÝ THUYẾT TRÒ CHƠI -s°©cvxsscrxssrxe 3

nc.o.n 0 1S 3

1.2 Biểu diễn trò chơi -s:-222:22221112221112211121 2111 110.111 1ee 3

1.2.1 Dang CHUAN CCl ccccccccccccecececscecsesesesesecevevevssesscssvessseavevevssesesstevessevecsevsnsess 4 1.2.2 Dạng mở rỘng: 2 1 2200112 121111221 115211111111 1101 1111111111181 kg 4

2_ CHƯƠNG 2: TRÒ CHƠI CỜ TƯỚNG 6

2.2 Muc vì 0 2n n ai 7 2.3 Bàn cờ vả QUẬn CỜ: - 01012211111 2211 111511111211 1155111125111 111101 1111 key 8

3 CHUONG 3: THUAT TOAN MINIMAX VA CAT TiA ALPHA-BETA 10

3.1 Thuật toán minimax 1a ØÌ? - 5 2c 2211120111 1211 1111111111111 111 1111011101111 10 3.1.1 Tại sao phải cần dùng miniimax? - 5 E11 2511111117721 111 tt 10

3.1.3 Giải thuật Mimiimax ác: 2c 212112111111 111 1111111101 1011111101 111111111 xkt 10

3.2 Thuật toán cắt tỉa Alpha-Beta: .- 20112201121 111211 12211 121111211 120111811 11

E No c ÝỀẼẼÝIÝÝÁÝÝẢ II

3.2.2 Thuật toán cắt tỉa Alpha-Beta: 0 0200012011101 1111111111111 112111 se II 3.2.3 Điều kiện để có cắt tỉa Alpha-Beta là: 0 Q2 2.1222 21 nHHHxớ II 3.2.4 Những điểm chính về việc Alpha-Beta Pruning: -5sc sccczxrxcszszce 12 3.2.5 Làm việc của Alpha-Beta: - L 2 2.11210112011111 1111111111111 11 111111 k2 12

4_ CHƯƠNG 4: ÁP DỤNG THUẬT TOÁN MINIMAX VÀ CÁT TỈA ALPHA- BETA VÀ TRÒ CHƠI CỜ TƯỚNG -cs-csscrxeserrxessrrresrrsosrrsee 17

4.1 Xác định hàm đánh giá: 5 0 0 2202222111511 1211 11211122111 11111118 1110111181111 17 4.2 Thuật toán minimax trong CO tưỚig: - - : c2: 2221212231123 11 1531151111 11553 111115512 17 4.3 Cắt Tỉa Alpha-Beta Trong Cờ Tướng: 5s sS211111111111211 11 121 1E errg 18

ll

Trang 5

NGUON THAM KHAO NGAY 20/12/2023

IV

Trang 6

Tối ưu hóa chiến thuật chơi cờ tướng:

Nghiên cứu cách thuật toán minimax có thể được áp dụng để tối ưu hóa quyết định của máy tính trong việc di chuyển các quân cờ và phát triển chiến thuật

Xem xét cách minimax có thê được cải tiễn đề đảm bảo chon lựa những nước đi có lợi nhất cho người chơi máy tính

Tối ưu hóa hiệu suất của thuật toán:

Nghiên cứu cách để cải thiện hiệu suất của thuật toán minimax trong môi trường cờ tướng, bao gồm việc giảm độ phức tạp thời gian tính toán

Xem xét các phương pháp tối ưu hóa hoặc các biến thê như cắt tỉa Alpha- Beta dé giam sô lượng nút can kiêm tra

Ý nghĩa của việc nghiên cứu:

Việc nghiên cứu về thuật toán minimax trong trò chơi cờ tướng mang lại nhiều ý nghĩa quan trọng, không chỉ trong lĩnh vực giải trí mà còn trong nhiều lĩnh vực khác, bao gồm khoa học máy tính, trí tuệ nhân tạo và chiến lược chơi game Dưới đây là một sô ý nghĩa của việc nghiên cứu này:

Phát triển công nghệ AI trong trò chơi:

Nghiên cứu về thuật toán minimax mở ra cánh cửa cho việc phát triển các

mô hình trí tuệ nhân tạo trong lĩnh vực chơi game Nâng cao khả năng của máy tính trong việc đưa ra quyết định thông minh và chiến thuật trong cờ tướng

¿Ấp dụng vào các lĩnh vực khác:

Trang 7

Kiên thức từ nghiên cứu có thê được áp dụng vào cac linh vuc khac ngoai trò chơi, như trong quyết định chiến lược trong kinh đoanh, quân sự, hoặc các ứng dụng y tế

Nang cao hiểu biết về trí tệ nhân tạo:

Nghiên cứu thuật toán minimax cung cập một cơ hội đê hiệu rõ hơn về cách

mà máy tính có thê "suy nghĩ" trong việc đưa ra quyết định đựa trên thông tin có sẵn

Giáo dục va dao tao:

Các két qua từ nghiên cứu có thê được sử dụng trong việc giáo dục và đào tạo, giúp sinh viên và những người quan tâm đên lĩnh vực này có cơ hội hiệu rõ hơn về ứng dụng của trí tuệ nhân tạo trong trò chơi và các lĩnh vực khác

3 Kết cấu đề tài:

LỜI MỞ ĐẦU CHƯƠNG |: LY THUYET TRO CHOI CHƯƠNG 2: TRÒ CHƠI CỜ TƯỚNG CHƯƠNG 3: THUẬT TOÁN MINIMAX VA CAT TIA ALPHA-BETA CHUONG 4: AP DUNG THUAT TOAN MINIMAX VA CAT TIA ALPHA-BETA VA TRO CHOI CO TƯỚNG

CHƯƠNG § : KẾT LUẬN

Trang 8

CHUONG 1: LY THUYET TRO CHOI

Lí thuyết trò chơi chủ yếu nghiên cứu tác dụng tương hỗ giữa các kết cầu phân khích đã được công thức hoá, là lí luận và phương pháp toán học đề nghiên cứu hiện tượng có sẵn tính chất đấu tranh hoặc cạnh tranh Lí thuyết trò chơi đắn đo suy xét hành vi dự liệu và hành vi thực tế, đồng thời nghiên cứu sách lược ưu hoá của chúng Các nhà sinh vật học sử dụng lí thuyết trò chơi để lí giải và suy đoán một số kết quả của học thuyết tiến hoá

Lí thuyết trò chơi đã trở thành một trong những công cụ phân tích tiêu chuẩn của kinh tế học Trước mắt đều có ứng dụng rộng khắp ở tài chính học, chứng khoán học, sinh vật học, kinh tế học, quan hệ quốc tế, khoa học máy tính, chính trị học, chiến lược quân sự và rất nhiều ngành học khác Nguồn gốc của lí thuyết trò chơi hiện đại là

do John von Neumann đưa ra ý tưởng và chứng minh điểm cân bằng của sách lược hỗn hợp đối với trò chơi có tông bằng không của hai người

1.2 Biếu diễn trò chơi

Các trò chơi được nghiên cứu trong lý thuyết trò chơi là các đối tượng toán học được xác định rõ ràng Đề được xác định đầy đủ, một trò chơi phải xác định các yếu tố sau: người chơi của trò chơi, thông tin và hành động có sẵn cho mỗi người chơi tại mỗi thời điểm quyết định, và payoff cho mỗi kết quả Một nhà lý thuyết trò chơi thường

sử đụng các yếu tố này, cùng với giải pháp mà họ lựa chọn, để suy ra một tập hợp các điểm cân bằng chiến lược cho mỗi người chơi sao cho khi các chiến lược này được sử dụng, không người chơi nào có thể kiếm lợi bang cach đơn phương đi chệch khỏi chiến lược của họ Các chiến lược cân bằng này xác định trạng thái cân bằng cho trò chơi — một trạng thái ôn định trong đó một kết quả xảy ra hoặc một tập hợp các kết quả xảy ra với xác suât đã biết

Trang 9

Hầu hết các trò chơi hợp tác được trình bày ở dạng chức năng đặc trưng, trong khi dạng mở rộng và dạng bình thường được sử dụng đề xác định các trò chơi bất hợp tác

1.21 Dang chuẩn tắc:

Trò chơi chuân tắc (hoặc dạng chiến lược (strategic form)) là một ma trận cho biết thông tin về các đầu thủ, chiến lược, và cơ chế thưởng phạt (xem ví dụ bên dưới) Trong ví dụ, có hai đấu thủ, một người chọn hàng, người kia chọn cột Mỗi đấu thủ có hai chiến lược, mỗi chiến lược được biểu điễn bởi một ô được xác định bởi số hiệu hang va số hiệu cột của nó Mức thưởng phạt được ghi trong ô đó Giá trị thử nhất là mức thưởng phạt cho đấu thủ chơi theo hàng (trong ví dụ là Đấu thủ L); giá trị thứ hai

là mức thưởng phạt cho đấu thủ chơi theo cột (trong ví đụ là Đầu thủ 2) Giả sử Đầu

thủ 1 chơi hàng trên và Đầu thủ 2 chơi cột trái Khi đó, Đâu thủ 1 nhận 4 điểm và Dau thủ 2 nhận 3 điểm

Khi một trò chơi được biểu diễn bằng dạng chuẩn tắc, người ta coi rằng mỗi đầu thủ hành động một cách đồng thời, hoặc ít nhất không biết về hành động của người kia Nếu các đấu thủ có thông tin về lựa chọn của các đấu thủ khác, trò chơi thường được biểu diễn bằng dạng mở rộng

Các trò chơi dạng mở rộng cô găng mô tả các trò chơi có thứ tự quan trọng Ở đây, các trò chơi được biểu diễn bằng cây (như trong hình bên đưới) Mỗi đỉnh (hoặc nút) biểu diễn một điểm mà người chơi có thể lựa chọn Người chơi được chỉ rõ bằng một số ghi cạnh đỉnh Các đoạn thăng di ra từ đỉnh đó biểu diễn các hành động có thể cho người chơi đó Mức thưởng phạt được ghi rõ tại đáy cây

Trang 10

Trong trò chơi trong hình, có hai người chơi Đấu thủ | đi trước và chọn F hoặc

U Đấu thủ 2 nhìn thấy nước đi của Đầu thủ I và chọn A hoặc R Giả sử Đấu thủ I

chon U và sau đó Đấu thủ 2 chọn A Khi đó, Đấu thủ l được 8 điểm và Đấu thủ 2 được 2 điểm

Các trò chơi mở rộng còn có thể mô tả các trò chơi đi-đồng-thời Hoặc có một đường cham cham hoặc một đường tròn vẽ quanh hai đỉnh khác nhau đề biểu diễn rằng chúng đều thuộc cùng một tập hợp thông tin (nghĩa là, người chơi không biết họ dang 6 diém nao)

cơ 0.0 2 O.0O

Miột tro choi dang mo réng ¿3

Trang 11

CHUONG 2: TRO CHOI CO TUONG

họ là: các quân đặt ở giao điểm các đường thay vì đặt vào ô, quân Pháo phải nhảy qua

l quân khi ăn quân, các khái niệm sông và cung nhằm giới hạn các quân Tướng, Sĩ và Tượng Cờ tướng với phiên bản hiện đại mà chúng ta biết ngày nay có từ thời kỳ nhà Tống

Trang 12

Kỹ năng Chiến thuật, Chiến lược

Bộ môn yêu câu suy nghĩ cao

Trang 13

mỗi người là tìm mọi cách đi quân trên bàn cờ theo đúng luật để chiếu bí hay bắt Tướng (hay Soái) của đối phương

Trang 14

Mỗi ván cờ lúc bắt đầu phải có 32 quân cờ chia đều cho mỗi bên gồm 16 quan

Đỏ và I6 quân Đen (Xanh lam hoặc Xanh lục hoặc Trắng), gồm bảy loại quân Tuy tên quân cờ của mỗi bên có thê viết khác nhau (ký hiệu theo chữ Hán) nhưng giá trị và cách đi quân của chúng lại giống nhau hoản toàn bảy loại quân có ký hiệu và số lượng cho mỗi bên như sau:

Trang 15

CHUONG 3: THUAT TOAN MINIMAX VA CAT TIA

ALPHA-BETA

3.1 Thuật toán minimax là gì?

Minimax là giải thuật là một thuật toán đệ quy lựa chọn bước di kế tiếp trong một trò chơi có hai người bằng cách định giá trị cho các Node trên cây trò chơi sau đó tìm Node có giá trị phù hợp để đi bước tiếp theo

31.1 Tai sao phai can dang minimax?

Như các bạn đã biết thì có rất nhiều thuật toán tìm kiếm để làm AI trong game như A, Heuristic Mỗi thuật toán thì sẽ phù hợp với từng loại game cho nó Những game đối kháng trong đối người chơi luân phiên đánh như cờ vua, cờ tường, caro

Khi chơi bạn có thê khai triển hết không gian trạng thái nhưng khó khăn chủ yếu là

bạn phải tính toán được phản ứng và nước đi của đối thủ mình như thế nào? Cách xử

lý đơn giản là bạn giả sử đối thủ của bạn cũng sử dụng kiến thức về không gian trạng

thái giống bạn Giải thuật Minimax áp dụng giả thuyết này để tìm kiếm không gian

trang thai cua tro choi Truong hop nay thuật toán minimax sẽ đáp ứng những øì mình cần

có thê thắng, thua hoặc hòa)

3.1.3 Giải thuật Minimax

Hai người chơi trong game được đại diện là MAX và MIN MAX đại diện cho người chơi luôn muốn chiến thắng và cô gắng tối ưu hóa ưu thế của mình còn MIN dai diện cho người chơi cố gắng cho người MAX giành số điểm càng thấp càng tốt Giải thuật Minimax thê hiện bằng cách định trị các Node trên cây trò chơi: Node thuộc lớp MAX thì gán cho nó giá trị lớn nhất của con Node đó Node thuộc lớp MIN thì gán

14

Trang 16

cho nó giá trị nhỏ nhat của con Node do Từ các giá trị nay người chơi sẽ lựa chọn cho mình nước đi tiếp theo hợp lý nhất

3.2 Thuật toán cắt tỉa Alpha-Beta:

3.2.7 Giới thiệu:

Cắt tỉa Alpha-Beta là một phiên bản sửa đổi của thuật toán minimax Nó là một

kỹ thuật tối ưu hóa cho thuật toán minimax

Như chúng ta đã thấy trong thuật toán tìm kiếm minimax răng số lượng trạng thái trò chơi mà nó phải kiếm tra là cấp số nhân theo chiều sâu của cây Vì chúng ta không thể loại bỏ số mũ, nhưng chúng ta có thể cắt nó thành một nửa Do đó, có một

kỹ thuật mà không cần kiểm tra từng nút của cây trò chơi, chúng ta có thé tính ra quyết

định minimax chính xác và kỹ thuật này được gọi là cắt tỉa

3.2.2 Thuật toán cắt tia Alpha-Beta:

Cắt tỉa Alpha — beta là một thuật toán tìm kiếm nâng cao của minimax, thuật toán này làm giảm số lượng các node cây được đánh giá bởi thuật toán minimax trong cây tìm kiếm Thuật toán này dựa theo tìm kiếm đối nghịch trong một số trò chơi với máy (Tic-tac-toe, Cờ vua, v.v.)

Cắt tỉa Alpha-Beta có thê được áp dụng ở bất kỳ độ sâu nào của cây, và đôi khi

nó không chỉ cắt tỉa lá cây mà còn cắt tỉa toàn bộ cây phụ

Hai tham số có thể được định nghĩa là:

Alpha: Sự lựa chọn tốt nhất (giá trị cao nhất) mà chúng tôi đã tìm thấy cho đến nay tại bất kỳ điểm nào trên con đường của Maximizer Giá trị ban đầu của alpha là -œ

Beta: Lựa chọn tốt nhất (giá trị thấp nhất) mà chúng tôi đã tìm thấy cho đến nay tại bất kỳ điểm nào dọc theo đường dẫn của Minimizer Giá trị ban đầu của beta là + œ,

Việc Cắt tỉa Alpha-Beta thành một thuật toán minimax tiêu chuẩn trả lại cùng một động thái như thuật toán tiêu chuẩn, nhưng nó loại bỏ tất cả các nút không thực sự ảnh hưởng đến quyết định cuỗi cùng nhưng làm cho thuật toán bị chậm Do đó, bằng cách lược bỏ các nút này, thuật toán sẽ nhanh hơn

Ngày đăng: 28/10/2024, 12:13

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN