Bài giảng Trí tuệ nhân tạo: Chương 3 - Nguyễn Văn Hòa

43 45 0
Bài giảng Trí tuệ nhân tạo: Chương 3 - Nguyễn Văn Hòa

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 3 giúp người học hiểu về "Các chiến lược tìm kiếm Heuristics". Nội dung trình bày cụ thể gồm có: Khái niệm, tìm kiếm tốt nhất trước, phương pháp leo đồi, cài đặt hàm đánh giá, thu giảm ràng buộc, giải thuật cắt tỉa α-β,...

Chương 3: Các chiến lược tìm kiếm Heuristics Nội dung Khái niệm Tìm kiếm tốt trước Phương pháp leo đồi Cài đặt hàm đánh giá Thu giảm ràng buộc Giải thuật cắt tỉa α-β Giới hạn không gian hệ thống 8-puzzle Lời giải cần trung bình 22 cấp (depth) Độ rộng bước ~ Tìm kiếm vét cạn cho 22 cấp cần 3.1 x 1010 states Nếu giới hạn d=12, cần trung bình 3.6 triệu trạng thái [24 puzzle có 1024 trạng thái] ⇒ Cần chiến lược tìm kiếm heuristic Tìm kiếm Heuristics Any estimate of how close a state is to a goal Designed for a particular search problem Examples: Manhattan distance, Euclidean distance 10 11.2 Tìm kiếm Heuristic (tt) Có nhiều phương pháp để xây dựng thuật giải Heuristic, người ta thường dựa vào số nguyên lý sau: Nguyên lý vét cạn thông minh: Trong tốn tìm kiếm đó, khơng gian tìm kiếm lớn, ta thường tìm cách giới hạn lại khơng gian tìm kiếm thực kiểu dò tìm đặc biệt dựa vào đặc thù tốn để nhanh chóng tìm mục tiêu Ngun lý tham lam (Greedy): Lấy tiêu chuẩn tối ưu (trên phạm vi tồn cục) tốn để làm tiêu chuẩn chọn lựa hành động cho phạm vi cục bước (hay giai đoạn) trình tìm kiếm lời giải Tìm kiếm Heuristic (tt) Nguyên lý thứ tự: Thực hành động dựa cấu trúc thứ tự hợp lý không gian khảo sát nhằm nhanh chóng đạt lời giải tốt Hàm Heuristic: hàm đánh giá thô, giá trị hàm phụ thuộc vào trạng thái toán bước giải, giúp chọn cách hành động tương đối hợp lý bước thuật giải Giải thuật tìm kiếm heuristic: Giải thuật leo núi (hill-climbing) Greedy, TK tốt (best-first search) A* search, … Ví dụ phép đo Heuristics Ví dụ phép đo Heuristics (tt) Heuristic “Số đường thắng nhiều nhất” (theo đường chéo bàn cờ) áp dụng cho cờ đầu tên đặt vào bàn cờ bàn cờ tic-tac-toe Ví dụ phép đo Heuristics (tt) Tìm kiếm leo đồi – Hill Climbing Search (Pearl, 1984) Chọn trạng thái tốt trạng thái khảo sát để phát triển Nếu khơng có thuật tóan phải dừng Nếu chọn trạng thái tốt hơn: leo đồi đơn giản, trạng thái tốt nhất: leo đồi dốc đứng Sử dụng hàm H để biết trạng thái tốt Khác với tìm kiếm sâu, leo đồi khơng lưu tất mà lưu trạng thái chọn có 10 Đánh giá giải thuật A* Một hàm đánh giá h(n) gọi chấp nhận hàm đánh giá thấp h(n)2) đồng xu Mỗi nước đi, người chơi chia đồng xu thành hai đống nhỏ có số lượng đống khác Người thua người cuối không chia theo u cầu tốn Phân tích Tính tốn phản ứng đối thủ khó khăn chủ yếu toán Cách giải giả thiết đối thủ sử dụng kiến thức khơng gian trạng thái 31 Trò Chơi NIM: giá trị nút MIN MAX MIN MAX MIN MAX 1 1 0 1 KẾT QUẢ CỦA MAX KẾT QUẢ CỦA MIN 32 Trò Chơi NIM Hai đấu thủ: MIN MAX Trong MAX ln tìm cách tối đa ưu MIN tìm cách để đưa MAX vào khó khăn Mỗi mức KGTT ứng với đấu thủ Để dẫn cách đi, gán cho nút MAX thắng, MIN thắng Gán giá trị cho nút Truyền ngược trị từ nút gốc theo qui tắc: Nếu đỉnh mức MAX, gán trị cho đỉnh giá trị lớn giá trị của Nếu đỉnh mức MIN, gán trị cho đỉnh giá trị bé trị của 33 Minimax với độ sâu lớp cố định Minimax KGTT giả định giá trị max nút giá trị nút Các nút gán giá trị heuristic Còn giá trị nút giá trị nhận dựa giải thuật Minimax (min hay max cua nút con) 34 Heuristic trò chơi tic-tac-toe Hàm Heuristic: E(n) = M(n) – O(n) Trong đó: M(n) tổng số đường thẳng tơi O(n) tổng số đường thẳng đối thủ E(n) trị số đánh giá tổng cộng cho trạng thái n 35 Giải thuật cắt nhánh alpha-beta Hạn chế với số mức d số trạng thái lớn Cờ vua: nhân tố nhánh b=35; d=3 có 35*35*35=42.785 trạng thái Giảm bớt trạng thái cần khảo sát mà khơng ảnh hưởng đến việc giải tốn Cắt bỏ nhánh khơng cần khảo sát 36 Giải thuật cắt nhánh alpha-beta Tìm kiếm theo kiểu depth-first Nút MAX có giá trị α (ln tăng) Nút MIN có giá trị β (ln giảm) Tìm kiếm kết thúc bất kỳ: Nút MIN có β ≤ α nút cha MAX Nút MAX có α ≥ β nút cha MIN Giải thuật cắt tỉa α-β thể mối quan hệ nút lớp n n+2, mà tồn có gốc lớp n+1 cắt bỏ 37 Cắt nhánh α (vị trí MAX) MAX MIN S Có giá trị >= α giá A Có trị = α MAX Điều kiện 1: Chỉ cần biết giá trị A B Điều kiện 2: Giá trị A > giá trị B Điều kiện 3: X, Y, , Z vị trí Max Bỏ có gốc X,Y,…, Z C Có giá trị

Ngày đăng: 27/06/2020, 08:54

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan