Bài giảng Trí tuệ nhân tạo: Tác tử - Nguyễn Nhật Quang (ĐH Bách khoa Hà Nội)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	34
Dung lượng	466,66 KB

Nội dung

Bài giảng "Trí tuệ nhân tạo: Tác tử" cung cấp cho người học các kiến thức: Định nghĩa, môi trường công việc, các kiểu môi trường, các kiểu tác tử. Đây là một tài liệu hữu ích dành cho các bạn sinh viên và những ai quan tâm dùng làm tài liệu học tập và nghiên cứu.

Trí Tuệ Nhân Tạo (IT4040) Nguyễn Nhật Quang quang.nguyennhat@hust.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ Thông tin Truyền thông Năm học 2018-2019 Nội dung môn học: ◼ Giới thiệu Trí tuệ nhân tạo ◼ Tác tử ❑ Định nghĩa ❑ Môi trường công việc ❑ Các kiểu môi trường ❑ Các kiểu tác tử ◼ Giải vấn đề: Tìm kiếm, Thỏa mãn ràng buộc ◼ Logic suy diễn ◼ Biểu diễn tri thức ◼ Biểu diễn thông tin không chắn ◼ Học máy Trí tuệ nhân tạo – Artificial intelligence Tác tử - Định nghĩa ◼ Tác tử (con người, người máy, software robots, ổn nhiệt,…) có khả cảm nhận (nhận biết) mơi trường xung quanh thơng qua phận cảm biến (sensors) hành động phù hợp theo môi trường thơng qua phận hoạt động (actuators) ◼ Tác tử người ❑ ❑ ◼ Các phận cảm biến: mắt, tai, số phận thể khác Các phận hoạt động: tay, chân, miệng, số phận thể khác Tác tử người máy ❑ ❑ Các phận cảm biến: máy quay (cameras), truy tìm tín hiệu hồng ngoại Các phận hoạt động: loại động (motors) Trí tuệ nhân tạo – Artificial intelligence Tác tử Môi trường ◼ Hàm tác tử: hàm ánh xạ từ lịch sử nhận thức tới hành động: f: P* → A ◼ Chương trình tác tử: hoạt động (chạy) dựa kiến trúc thực tế hàm f ◼ Tác tử = Kiến trúc + Chương trình Trí tuệ nhân tạo – Artificial intelligence Ví dụ: Thế giới máy hút bụi ◼ Các nhận thức ❑ ❑ ◼ Ví trí mức độ Ví dụ: [A, Bẩn], [B, Bẩn] Các hành động ❑ Di chuyển (máy hút bụi) sang trái, sang phải, hút bụi, khơng làm Trí tuệ nhân tạo – Artificial intelligence Tác tử máy hút bụi Bảng hành động tác tử máy hút bụi Chuỗi nhận thức Hành động [A, Sạch] Di chuyển sang phải [A, Bẩn] Hút bụi [B, Sạch] Di chuyển sang trái [B, Bẩn] Hút bụi [A, Sạch], [A, Sạch] Di chuyển sang phải [A, Sạch], [A, Bẩn] Hút bụi function Reflex-Vacuum-Agent( [location, status]) returns an action if status = Dirty then return Suck else if location = A then return Right else if location = B then return Left Trí tuệ nhân tạo – Artificial intelligence Tác tử hợp lý (1) ◼ Tác tử cần phấn đấu để “làm việc cần làm”, dựa nhận thức (nhận biết) dựa hành động mà thực ◼ Một hành động (hợp lý) hành động giúp cho tác tử đạt thành công cao mục tiêu đặt ◼ Đánh giá hiệu hoạt động: tiêu chuẩn để đánh giá mức độ thành công hoạt động tác tử ❑ Ví dụ: Tiêu chí đánh giá hiệu hoạt động tác tử máy hút bụi là: mức độ làm sạch, thời gian hút bụi, mức độ điện tiêu tốn, mức độ tiếng ồn gây ra, … Trí tuệ nhân tạo – Artificial intelligence Tác tử hợp lý (2) ◼ Tác tử hợp lý ❑ ❑ ❑ Với chuỗi nhận thức có được, Một tác tử hợp lý cần phải lựa chọn hành động giúp cực đại hóa tiêu chí đánh giá hiệu hoạt động tác tử đó, Dựa thơng tin cung cấp chuỗi nhận thức tri thức sở hữu tác tử Trí tuệ nhân tạo – Artificial intelligence Tác tử hợp lý (3) ◼ Sự hợp lý  Sự thông suốt thứ ❑ ❑ Sự thông suốt thứ = Biết tất thứ, với tri thức vơ hạn Vì nhận thức khơng cung cấp tất thơng tin liên quan ◼ Các tác tử thực hành động nhằm thay đổi nhận thức tương lai, với mục đích thu thơng tin hữu ích (ví dụ: thu thập thơng tin, khám phá tri thức) ◼ Tác tử tự trị (autonomous agent) tác tử mà hành động định kinh nghiệm tác tử (cùng với khả học thích nghi) Trí tuệ nhân tạo – Artificial intelligence Mơi trường công việc – PEAS (1) ◼ ◼ PEAS ❑ Performance measure: Tiêu chí đánh giá hiệu hoạt động ❑ Environment: Môi trường xung quanh ❑ Actuators: Các phận hành động ❑ Sensors: Các phận cảm biến Để thiết kế tác tử thông minh (hợp lý), trước tiên cần phải xác định (thiết lập) giá trị thành phần PEAS Trí tuệ nhân tạo – Artificial intelligence 10 Các kiểu tác tử ◼ kiểu tác tử ❑ ❑ Tác tử phản xạ đơn giản (simple reflex agents) Tác tử phản xạ dựa mơ hình (model-based reflex agents) ❑ Tác tử dựa mục tiêu (goal-based agents) ❑ Tác tử dựa lợi ích (utility-based agents) Trí tuệ nhân tạo – Artificial intelligence 20 Tác tử phản xạ đơn giản (1) Tác tử phản xạ đơn giản: → Hành động theo quy tắc (luật) có điều kiện phù hợp với trạng thái thời (của môi trường) function SIMPLE-REFLEX-AGENT(percept) static: rules (tập luật có dạng: điều kiện-hành động) state  INTERPRET-INPUT(percept) rule  RULE-MATCH(state, rules) action  RULE-ACTION[rule] return action Trí tuệ nhân tạo – Artificial intelligence 21 Tác tử phản xạ đơn giản (2) Trí tuệ nhân tạo – Artificial intelligence 22 Tác tử phản xạ dựa mơ hình (1) Tác tử phản xạ dựa mơ hình: ❑ ❑ Sử dụng mơ hình nội để giám sát trạng thái môi trường Lựa chọn hành động: giống tác tử phản xạ đơn giản function REFLEX-AGENT-WITH-STATE(percept) static: state (mô tả trạng thái môi trường) rules (tập luật có dạng: điều kiện-hành động) action (hành động gần nhất) state  UPDATE-STATE(state, action, percept) rule  RULE-MATCH(state, rules) action  RULE-ACTION[rule] return action Trí tuệ nhân tạo – Artificial intelligence 23 Tác tử phản xạ dựa mơ hình (2) Trí tuệ nhân tạo – Artificial intelligence 24 Tác tử dựa mục tiêu (1) ◼ Biết trạng thái môi trường: chưa đủ → Cần biết thêm thông tin mục tiêu ❑ ❑ ◼ Trạng thái môi trường: Ở ngã tư, xe taxi rẽ trái, rẽ phải, thẳng Thông tin mục tiêu: xe taxi cần tới đích đến hành khách Tác tử dựa mục tiêu ❑ Theo dõi trạng thái môi trường ❑ Lưu giữ tập mục tiêu (cần đạt được) ❑ Chọn hành động cho phép (rốt cuộc) đạt đến mục tiêu Trí tuệ nhân tạo – Artificial intelligence 25 Tác tử dựa mục tiêu (2) Trí tuệ nhân tạo – Artificial intelligence 26 Tác tử dựa lợi ích (1) ◼ Trong nhiều môi trường, thông tin mục tiêu không đủ để đánh giá hiệu hành động ❑ ❑ Có nhiều chuỗi hành động cho phép taxi đến đích (tức đạt đến mục tiêu) Nhưng: chuỗi hành động nhanh hơn, an tồn hơn, đáng tin cậy hơn, chi phí thấp hơn? ◼ Cần đánh giá lợi ích tác tử ◼ Hàm lợi ích (utility function) ❑ Ánh xạ từ chuỗi trạng thái môi trường tới giá trị số thực (thể mức lợi ích tác tử) Trí tuệ nhân tạo – Artificial intelligence 27 Tác tử dựa lợi ích (2) Trí tuệ nhân tạo – Artificial intelligence 28 Tác tử có khả học (1) ◼ Khả học cho phép tác tử cải thiện hiệu hoạt động ◼ thành phần tạo nên tác tử có khả học ❑ Thành phần hành động: đảm nhiệm việc lựa chọn hành động ❑ Thành phần đánh giá (bình luận): đánh giá hiệu hoạt động ❑ ❑ Thành phần học: giúp cải thiện hiệu hoạt động - dựa đánh giá, để thay đổi (cải thiện) thành phần hành động Thành phần sản sinh kinh nghiệm: có nhiệm vụ đề xuất hành động giúp sản sinh (dẫn đến) kinh nghiệm Trí tuệ nhân tạo – Artificial intelligence 29 Tác tử có khả học (2) Trí tuệ nhân tạo – Artificial intelligence 30 Cơ sở tri thức tác tử ◼ ◼ ◼ Một sở tri thức (a knowledge base) tập mệnh đề (phát biểu) biểu diễn ngơn ngữ hình thức, cung cấp tri thức (hiểu biết) cho tác tử Tác tử khai thác sở tri thức (mà sở hữu) trình đưa hành động Các tác tử xem xét mức ❑ ❑ ◼ Tri thức: Tác tử biết gì? Các mục tiêu tác tử gì? Cài đặt hệ thống: Các cấu trúc liệu sở tri thức? Các giải thuật sử dụng tri thức này? Tác tử cần có khả ❑ ❑ ❑ ❑ Thu thập (cập nhật) tri thức Cập nhật việc biểu diễn (bên tác tử) môi trường xung quanh Suy diễn thuộc tính ẩn môi trường xung quanh Suy luận để đưa hành động hợp lý Trí tuệ nhân tạo – Artificial intelligence 31 Đa tác tử (1) ◼ Môi trường hoạt động: Cộng tác (hợp tác) Cạnh tranh (đối kháng)? ◼ Trong nhiều tốn thực tế, mơi trường hoạt động thay đổi (biến động) → tác tử cần cập nhật ◼ Cần mơ hình biểu diễn kế hoạch tác tử khác ◼ Các tác tử cộng tác ❑ ❑ ❑ Cùng chia sẻ mục tiêu kế hoạch Ví dụ: Lập kế hoạch (cho hoạt động nhóm) trò chơi tennis đánh đôi Các chế cộng tác: Phân tách phân phối nhiệm vụ cho tác tử Trí tuệ nhân tạo – Artificial intelligence 32 Đa tác tử (2) ◼ Các tác tử cạnh tranh ❑ ❑ ❑ ❑ ❑ Ví dụ: chơi cờ Mỗi tác tử phải nhận biết tồn (và hoạt động) tác tử khác Mỗi tác tử tính tốn (dự đốn) kế hoạch (một số) tác tử khác Mỗi tác tử tính tốn (dự đốn) ảnh hưởng kế hoạch tác tử khác kế hoạch thân Mỗi tác tử định hành động tối ưu dự đốn ảnh hưởng Trí tuệ nhân tạo – Artificial intelligence 33 Tác tử - Tổng kết ◼ Tác tử tương tác với môi trường thông qua phận cảm biến phận hành động ◼ Một tác tử hợp lý cực đại hóa hiệu hoạt động ◼ Hàm tác tử mơ tả hành động mà tác tử thực tình ◼ Các chương trình tác tử cài đặt (thực hiện) hàm tác tử ◼ Các mô tả PEAS xác định môi trường công việc ◼ Các môi trường phân loại dựa theo tiêu chí: Có thể quan sát được? Xác định? Phân đoạn? Tĩnh? Rời rạc? Tác tử đơn lẻ? ◼ Các kiến trúc tác tử bản: Phản xạ đơn giản, Dựa mô hình, Dựa mục tiêu, Dựa lợi ích Trí tuệ nhân tạo – Artificial intelligence 34 ... mức lợi ích tác tử) Trí tuệ nhân tạo – Artificial intelligence 27 Tác tử dựa lợi ích (2) Trí tuệ nhân tạo – Artificial intelligence 28 Tác tử có khả học (1) ◼ Khả học cho phép tác tử cải thiện... trường ◼ Hàm tác tử: hàm ánh xạ từ lịch sử nhận thức tới hành động: f: P* → A ◼ Chương trình tác tử: hoạt động (chạy) dựa kiến trúc thực tế hàm f ◼ Tác tử = Kiến trúc + Chương trình Trí tuệ nhân. .. kiểu tác tử ❑ ❑ Tác tử phản xạ đơn giản (simple reflex agents) Tác tử phản xạ dựa mơ hình (model-based reflex agents) ❑ Tác tử dựa mục tiêu (goal-based agents) ❑ Tác tử dựa lợi ích (utility-based

Ngày đăng: 27/06/2020, 08:30