1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Lec 4 Tìm kiếm kinh nghiệm

21 351 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 271,5 KB

Nội dung

Lec Tìm kiếm kinh nghiệm Lec 4-TTNT p.1 Tìm kiếm kinh nghiệm (heuristic) Heuristics: đoán, ước chừng dựa kinh nghiệm, trực giác  Các hệ giải AI sử dụng heuristic hai tình bản:  – Bài toán định nghĩa xác chi phí tìm lời giải TK vét cạn chấp nhận VD: Sự bùng nổ KGTT trò chơi cờ vua – Vấn đề với nhiều mơ hồ lời phát biểu toán hay liệu tri thức sẵn có VD: Chẩn đoán y học TTNT p.2 Giải toán tìm kiếm heuristic Tìm biểu diễn thích hợp mô tả trạng thái toán tử toán  Xây dựng hàm đánh giá  Thiết kế chiến lược chọn trạng thái để phát triển bước  TTNT p.3 Giải thuật Heuristic  Một giải thuật heuristic xem gồm phần: – Phép đo heuristic: thể qua hàm đánh giá heuristic (evaluation function), dùng để đánh giá đặc điểm trạng thái KGTT – Giải thuật tìm kiếm heuristic: • Tìm kiếm tốt nhất-đầu tiên (best-first search): Tìm kiếm theo chiều rộng + hàm đánh giá • Tìm kiếm leo đồi (hill-climbing): Tìm kiếm theo chiều sâu + hàm đánh giá TTNT p.4 KGTT tic-tac-toe thu nhỏ nhờ tính đối xứng trạng thái TTNT p.5 Phép đo heuristic Heuristic “Số đường thắng nhiều nhất” áp dụng cho nút tic-tac-toe TTNT p.6 Tìm kiếm tốt nhất-đầu tiên Procedure Best-first search; Begin Khởi tạo danh sách L chứa trạng thái đầu; Loop 2.1 If L rỗng then {thông báo thất bại; stop}; 2.2 Loại trạng thái u đầu danh sách L; 2.3 If u trạng thái kết thúc then {thông báo thành công; stop}; 2.4 For trạng thái v kề u Chèn v vào danh sách L cho L theo thứ tự tăng dần hàm đánh giá; End; TTNT p.7 10 F Ví dụ:tìm kiếm tốt nhất-đầu tiên A 20 A 20 15 C E D I B 15 C H E D K 12 K 12 G 10 F I Đồ thị không gian trạng thái B G H Cây tìm kiếm tốt nhất-đầu tiên TTNT p.8 Giải thuật Leo đồi  Giải thuật: – Mở rộng trạng thái đánh giá trạng thái hàm đánh giá heuristic – Con “tốt nhất” chọn để tiếp Procedure Hill-Climbing_search; Begin Khởi tạo danh sách L chứa trạng thái đầu; Loop 2.1 If L rỗng then {thông báo thất bại; stop}; 2.2 Loại trạng thái u đầu danh sách L; 2.3 If u trạng thái kết thúc then {thông báo thành công; stop}; 2.4 For trạng thái v kề u đặt v vào L1; 2.5 Sắp xếp L1 theo thứ tự tăng dần hàm đánh giá cho trạng thái tốt đầu danh sách L1; 2.6 Chuyển danh sách L1vào đầu danh sách L cho L1 đầu danh sách L; End; TTNT p.9 Giải thuật Leo đồi  Giới hạn: – Giải thuật có khuynh hướng bị sa lầy cực đại cục bộ:  Lời giải tìm không tối ưu  Không tìm lời giải có tồn lời giải – Giải thuật gặp vòng lặp vô hạn không lưu giữ thông tin trạng thái duyệt TTNT p.10 Ví dụ: tìm kiếm leo đồi A 20 A 20 15 C 15 C E D I F B H E D K 12 G Đồ thị không gian trạng thái 10 F I B G Cây tìm kiếm leo đồi TTNT p.11 KGTT thu nhỏ áp dụng heuristic TTNT p.12 Giải thuật TK tốt open = [A5]; closed = [] Đánh giá A5; open = [B4,C4,D6]; closed = [A5] Đánh giá B4; open = [C4,E5,F5,D6]; closed = [B4,A5] Đánh giá C4; open = [H3,G4,E5,F5,D6]; closed = [C4,B4,A5] Đánh giá H3; open = [O2,P3,G4,E5,F5,D6]; closed = [H3,C4,B4,A5] Đánh giá O2; open = [P3,G4,E5,F5,D6]; closed = [O2,H3,C4,B4,A5] Đánh giá P3; tìm lời giải! TTNT p.13 Giải thuật Beam Tìm kiếm beam (beam search) giống tìm kiếm theo chiều rộng Tuy nhiên, tìm kiếm Beam mức hạn chế phát triển k đỉnh tốt (các đỉnh xác định hàm đánh giá) A 20 Ví dụ: Trong ví dụ lấy k=2 15 C E D K 12 10 F I B G B G H Cây tìm kiếm Beam TTNT p.14 Cài Đặt Hàm Đánh Giá (Evaluation Function) Xét trò chơi 8-puzzle Cho trạng thái n giá trị f(n): f(n) = g(n) + h(n) g(n) = khoảng cách thực từ n đến trạng thái bắt đầu h(n) = hàm heuristic đánh giá khoảng cách từ trạng thái n đến start mục tiêu g(n) = 5 goal h(n): số lượng vị trí sai g(n) = f(n) = 7 8 TTNT p.15 Khó khăn thiết kế hàm heuristic Ba heuristic áp dụng vào trạng thái trò chơi ô đố số TTNT p.16 Heuristic trò chơi đối kháng  Giải thuật minimax: – Hai đấu thủ trò chơi gọi MIN MAX – Mỗi nút có giá trị: • MAX thắng, • MIN thắng – Minimax truyền giá trị lên cao dần đồ thị, qua nút cha mẹ theo luật sau: • Nếu trạng thái cha mẹ MAX, gán cho giá trị lớn có trạng thái • Nếu trạng thái bố, mẹ MIN, gán cho giá trị nhỏ có trạng thái TTNT p.17 Hãy áp dụng GT Minimax vào Trò Chơi NIM TTNT p.18 Minimax với độ sâu lớp cố định  Minimax KGTT giả định Các nút gán giá trị heuristic  Còn giá trị nút giá trị nhận dựa giải thuật Minimax  TTNT p.19 Heuristic trò chơi tic-tac-toe Hàm Heuristic: E(n) = M(n) – O(n) Trong đó: M(n) tổng số đường thắng O(n) tổng số đường thắng đối thủ E(n) trị số đánh giá tổng cộng cho trạng thái n TTNT p.20 Minimax lớp áp dụng vào nước mở đầu tic-tac-toe Trích từ Nilsson (1971) TTNT p.21

Ngày đăng: 22/12/2016, 12:50

TỪ KHÓA LIÊN QUAN

w