Thuật toán minimax game tìm kiếm đối kháng

14 2 0
Thuật toán minimax game tìm kiếm đối kháng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trò chơi Trang 1 TìmThuật toán minimax game tìm kiếm đối khángThuật toán minimax game tìm kiếm đối khángThuật toán minimax game tìm kiếm đối khángThuật toán minimax game tìm kiếm đối kháng kiếm đối kháng – Trò chơi Tô Hoài Việt Khoa Công nghệ Thông tin Đại học Khoa học Tự nhiên TPHCM thvietfit hcmuns edu vn Trang 2 Tổng quan • Trò chơi • Quyết định tối ưu trong Trò.

Tìm kiếm đối kháng – Trị chơi Tơ Hồi Việt Khoa Công nghệ Thông tin Đại học Khoa học Tự nhiên TPHCM thviet@fit.hcmuns.edu.vn Trang Tổng quan • • • • • Trò chơi Quyết định tối ưu Trò chơi Thuật toán MINIMAX Tỉa nhánh α-β Hàm lượng giá, Tìm kiếm cắt nhánh Trang Trị chơi • Là đặc tính xem “thơng minh” người • Các trị chơi đời gần lúc với AI • Đã dành thành tựu đáng kể • Ở ta xem xét dạng trị chơi trí tuệ (board game) Trang Trị chơi • Checkers: – Hai người chơi – Người chơi di chuyển quân theo đường chéo, lần – Nếu có qn đối phương trước mặt, nhảy qua (nếu có trống) ăn – Ván cờ kết thúc hai người khơng cịn nước Trang Trị chơi • Checker – Năm 1952, Arthur Samuel (IBM) viết chương trình chơi cờ – Năm 1994, Chinook đánh bại Tinsley, vô địch giới, thua ván 42 năm! – Bí quyết: • Tìm kiếm tất nước có hay qn • Tất nhận diện thơng tin thắng, thua, hịa hồn hảo • Lưu trữ 444 tỷ vị trí với hàng tetrabyte nhớ Trang Trị chơi • Cờ vua – 1997, DeepBlue đánh bại Gary Kasparov trận đấu ván – Bí quyết: • Tìm kiếm vét cạn với độ sâu cao • Tính 200.000.000 nước giây so với Kasparov • (99.99% nước xem ngu ngốc) • Hàm lượng giá phức tạp Trang Trị chơi • Một số khác: – Othello: năm 1997, chương trình Logistello đánh bại vơ địch giới – Cờ vây (GO): chưa có chương trình hiệu (do độ phân nhánh lớn, b> 300) Trang Quyết định tối ưu Trò chơi • Lời giải tối ưu: đường bảo đảm chiến thắng cho người chơi • Hai người chơi: MAX vs MIN • Các thành phần: – Trạng thái ban đầu (initial state) – Trạng thái kết thúc (terminal state) – Hàm succs(s): nước hợp lệ – Hàm lợi ích (utility function): đánh giá trạng thái kết thúc Trang Ví dụ tìm kiếm trị chơi TicTacToe MAX(x) MIN(o) MAX(x) Các nước X X XO … KẾT THÚC Lợi ích XOX OX O -1 X … X O X … … X Các trạng thái … XOX OOX XXO X XOX X XOO +1 Trang Thuật tốn MINIMAX • Những người chơi tối ưu – MAX tối đa hóa hàm lợi ích – MIN tối thiểu hóa hàm lợi ích – Chiến lược MAX phụ thuộc vào chiến lược MIN bước sau • Giá trị MINIMAX-VALUE: tiện ích trạng thái kết thúc tương ứng đường đi, giả sử người chơi tối ưu Trang 10 Giá trị MINIMAX • MINIMAX-VALUE(n) = – Utility(n) n trạng thái kết thúc – max{MINIMAX-VALUE(s) | s∈succs(n)} n nút MAX – min{MINIMAX-VALUE(s) | s∈succs(n)} n nút MIN Trang 11 Giá trị MINIMAX (vd) MAX MIN A B 12 C D 14 Ở trạng thái kết thúc, giá trị MINIMAXVALUE(n) = Utility(n) Trang 12 Giá trị MINIMAX (vd) MAX MIN A B 12 C D 14 Tại trạng thái có thể, MIN ln chọn đường tối thiểu hóa giá trị tiện ích trạng thái kết thúc Tải FULL (28 trang): https://bit.ly/3Aq59YU Dự phòng: fb.com/TaiHo123doc.net Trang 13 Giá trị MINIMAX (vd) A MAX MIN Đến lượt mình, MAX tìm cách tối đa hóa giá trị MINIMAX B 12 C D 14 Và MAX chọn chiến lược đến B ứng với giá trị MINIMAX tối đa Trang 14 3126302 ...Tổng quan • • • • • Trị chơi Quyết định tối ưu Trị chơi Thuật tốn MINIMAX Tỉa nhánh α-β Hàm lượng giá, Tìm kiếm cắt nhánh Trang Trị chơi • Là đặc tính xem “thơng minh” người • Các... Trang Ví dụ tìm kiếm trị chơi TicTacToe MAX(x) MIN(o) MAX(x) Các nước X X XO … KẾT THÚC Lợi ích XOX OX O -1 X … X O X … … X Các trạng thái … XOX OOX XXO X XOX X XOO +1 Trang Thuật tốn MINIMAX •... Giá trị MINIMAX- VALUE: tiện ích trạng thái kết thúc tương ứng đường đi, giả sử người chơi tối ưu Trang 10 Giá trị MINIMAX • MINIMAX- VALUE(n) = – Utility(n) n trạng thái kết thúc – max {MINIMAX- VALUE(s)

Ngày đăng: 12/11/2022, 16:18

Tài liệu cùng người dùng

Tài liệu liên quan