1. Trang chủ
  2. » Công Nghệ Thông Tin

Chương 4 - Tìm Kiếm Có Đối Thủ pot

21 989 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 501,43 KB

Nội dung

*** Mục tiêu: nghiên cứu chiến lượt chọn nước đi cho MAX MAX là máy tính chơi Chơi cờ được xem là tìm kiếm các không gian trạng thái, mỗi trạng thái là một tình thế.. • Một hàm kết thúc

Trang 2

4.1 VẤN ĐỀ CHƠI CỜ

Trong chương này ta chỉ quan tâm nghiên cứu các trò chơi có hai người tham gia vd: cờ tướng, ca rô,…

Một người chơi gọi là MAX, đối thủ của MAX là MIN.

*** Mục tiêu: nghiên cứu chiến lượt chọn nước đi cho MAX (MAX là máy tính

chơi)

Chơi cờ được xem là tìm kiếm các không gian trạng thái, mỗi trạng thái là một tình thế.

• Trạng thái ban đầu: sự xắp xếp các quân cờ lúc bắt đầu.

• Các toán tử là các nước đi hợp lệ.

• Trạng thái kết thúc là tình thế dừng cuộc chơi.

• Một hàm kết thúc (payoff function) ứng với mỗi trạng thái kết thúc với một giá trị nào đó.

EX

Trang 3

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

4.2.1 Cây trò chơi.

Để thuận tiện cho việc nghiên cứu các chiến lượt chọn

nước đi, ta biểu diển không gian trạng thái dưới dạng cây trò

chơi

Cây trò chơi được biểu diễn dưới dạng:

• Gốc của cây ứng với trạng thái ban đầu

• Đỉnh ứng với trạng thái mà MAX (MIN) đưa ra nước đi là MAX (MIN)

• Các lá cây ứng với trạng thái kết thúc

Nếu đặt một đỉnh là MAX (MIN) ứng với trạng thái u, thì các đỉnh con của nó là tất cả các đỉnh biểu diễn trạng thái

v, v nhận được từ u do MAX (MIN) thực hiện nướ đi hợp lệ nào đó

 Trên cùng một mức của cây các đỉnh đều là MAX hoặc đều là MIN

Trang 4

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

4.2.1 Cây trò chơi.

*** Ví dụ: Trò chơi DODGEM:

Giới thiệu:

• Đối thủ MAX cầm 2 quân trắng Đối thủ MIN cầm 2 quân đen.

• Quân cờ được xếp như hình bên.

Cách đi:

• Quân đen có thể đi tới bên phải,

ở trên hoặc ở dưới.

• Quân trắng có thể đi tới bên phải,

bên trái hoặc ở trên.

Các trường hợp kết thúc:

• Đưa quân của mình ra khỏi bàn cờ trước:

• Nếu quân đen ở cột ngoài cùng bên phải có thể ra khỏi bàn cờ.

• Nếu quân trăng ở hàng trên cùng có thể ra khỏi bàn cờ.

• Tạo ra tình thế đối phương không đi được.

Trang 5

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

4.2.1 Cây trò chơi.

*** Ví dụ: Trò chơi DODGEM:

Ta có cây trò chơi được biểu diễn như hình:

Trang 6

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

4.2.2 Hàm đánh giá.

Hàm đánh giá eval ứng với mỗi trạng thái u của trò chơi với

một giá trị số eval(u).

Giá trị này đánh giá độ lợi thế của trạng thái u.

• Trạng thái u càng thuận lợi cho MAX  eval(u) là số dương càng lớn.

• Trạng thái u càng thuận lợi cho MIN  eval(u) là số âm càng nhỏ.

• eval(u) = 0: trạng thái u không thuận lợi cả MAX và MIN.

• eval(u) = +∞ nếu u là trạng thái thắng cho MAX

• eval(u) = - ∞ nếu u là trạng thái thắng cho MIN

Trang 7

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

*** Ví dụ: trò chơi tic-tac-toe:

Chỉ số eval có thể tính như sau:

eval(u) = (số dòng, số cột, số đường chéo còn mở đối với MAX)

= (số dòng, số cột, số đường chéo còn mở đối với MIN)

Trang 8

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

4.2.2 Hàm đánh giá.

*** Ví dụ:trò chơi tic-tac-toe:

eval(u) = 6 – 5 = 1

X O

X O

Số dòng, số cột, số đường chéo còn mở lối đối với MIN là 5

Số dòng, số cột, số đường chéo

còn mở lối đối với MAXlà 6

Trang 9

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

4.2.2 Hàm đánh giá.

*** Ví dụ 2: trở lại trò chơi Dodgem

Mỗi quân trắng và quân đen ở trên một vị trí trên bàn cờ được cho một giá trị như hình sau:

Giá trị quân trắng giá trị quân đen

Trang 10

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

đen được thêm 40 Trắng cản gián tiếp đen được thêm 30 Đen cản trực tiếp trắng được thêm -40 Đen cản gián tiếp trắng được thêm -30

Trang 11

4.2 CÂY TRÒ CHƠI VÀ HÀM ĐÁNH GIÁ

Trang 12

4.3 CHIẾN LƯỢC MINIMAX

Quá trình chơi cờ là quá trình Max và Min thay phiên nhau đưa ra quyết định thực hiện một trong các nước đi hợp lệ Trên cây trò chơi quá trình đó sẽ tạo ra đường đi từ gốc tới lá.

Giả sử Max cần tìm nước đi tại đỉnh u, Nước tối ưu cho Max là nước

đi dần tới đỉnh con của v là đỉnh tốt nhất(v là đỉnh con(đỉnh Min) của u)cho Max trong số các đỉnh con của u.Giả thiết rằng đến lượt đối thủ chọn nước đi từ v, Min cũng sẽ chọn nước đi tốt nhất cho mình

 Như vậy, để chọn nước đi tối u cho Max tại u, ta cần xác định giá trị của cây trò chơi tại gốc u.

• Giá trị của các đỉnh lá(trạng thái kết thúc) là giá trị của hàm kết thúc.

• Đỉnh có giá trị càng lớn càng tốt cho trắng.

• Để xác định giá trị của các đỉnh ta bắt đầu từ mức thấp nhất lên gốc.

Trang 13

4.3 CHIẾN LƯỢC MINIMAX

Trang 14

4.3 CHIẾN LƯỢC MINIMAX

Trang 15

4.3 CHIẾN LƯỢC MINIMAX

End;

Thủ tục chọn nước đi trên gọi là chiến lược Minimax, bởi vì Max đã chọn được nước đi dẫn tới đỉnh con có giá trị là Max của các đỉnh con, và Đen đáp lại bằng nước đi tới tỉnh có giá trị là Min của các giá trị các đỉnh con.

Trang 16

4.4 PHƯƠNG PHÁP CẮT CỤT ALPHA - BETA

Khi đánh giá đỉnh u tới độ sâu h, thuật toán Minimax đòi hỏi ta phải đánh giá tất cả các đỉnh của cây gốc u tới độ sâu

h Dùng phương pháp cắt cụt alpha- beta để giảm bớt số đỉnh cần đánh giá mà không ảnh hưởng đến sự đánh giá đỉnh u

Ý tưởng của phương pháp:

* Chiến lược tìm kiếm Minimax là tìm kiếm theo chiều sâu Giả sử trong quá trình tìm kiếm ta đi xuống đỉnh a là đỉnh MAX, đỉnh a có anh em là v đã đc dánh giá Giả sử cha của a

là b và b có anh em là u đã đc đánh giá, và giả sử cha của b

là c, Khi đó ta có giá trị đỉnh c – đỉnh MAX ít nhất là gía trị của đỉnh u, giá trị của đỉnh b – MIN nhiều nhất là v Do đó nếu evalue(u)> evalue(v), ta không cần đi xuống để đánh giá đỉnh a nữa mà vẫn không ảnh hưởng đến đánh giá đỉnh c Nói cách khác là cắt bỏ gốc a

Trang 17

4.4 PHƯƠNG PHÁP CẮT CỤT ALPHA - BETA

Ngày đăng: 11/08/2014, 00:20

TỪ KHÓA LIÊN QUAN

w