Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 16 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
16
Dung lượng
1,93 MB
Nội dung
Tác tử thông minh Nội dung • Tác tử môi trường • Một số đặc điểm tác tử • PEAS - Những yếu tố cần xem xét thiết kế tác tử • Đặc điểm môi trường • Phân loại tác tử Tác tử môi trường Một tác tử - agent : thứ cảm nhận môi trường quanh thông qua cảm biến tác động trở lại môi trường thông qua kích hoạt Ví dụ 1: người - tác tử Cảm biến: mắt, tai, … Bộ kích hoạt: tay, chân, … Ví dụ 2: Người máy Aishimo • Cảm biến: camera, dò đường hồng ngoại • Bộ kích hoạt: mô tơ Tác tử môi trường • Hàm tác tử: ánh xạ từ tập cảm nhận khứ tới hành động tương ứng: f: P* Æ A Chương trình tác tử chạy kiến trúc vật lý để tạo hàm f Chương trình tác tử dựa bảng điều kiện Function TABLE-DRIVEN-AGENT(percept) returns action static: percepts, dãy cảm nhận, khởi đầu rỗng table, bảng hành động ứng với chuỗi cảm nhận Thêm percept vào cuối dãy percepts Return action action ← LOOKUP(percepts, table) Nhược điểm: bùng nổ kích thước table Ví dụ: tác tử hút bụi thông minh Cảm nhận: vị trí (A B), trạng thái (sạch bẩn) Hành động: qua trái, qua phải, hút bụi, NoOp Dãy cảm nhận Action [A,Clean] [A, Dirty] [B, Clean] [B, Dirty] [A, Clean],[A, Clean] Right Hút bụi Left Hút bụi Right [A, Clean],[A, Dirty] Hút bụi … … Đặc điểm tác tử Với dãy trạng thái cảm nhận với tri thức sẵn có, tác tử phải lựa chọn hành động cho tối đa hóa hàm đánh giá hiệu Cho đích cần đạt tri thức sẵn có, tác tử cần: Sử dụng thông tin thu từ quan sát để cập nhật lại tri thức Trên sở tri thức nó, thực thi hành động nhằm đạt mục tiêu đề giới Một tác tử tự trị hành vi xác định kinh nghiệm thân (với khả học thích nghi) PEAS - Yếu tố xem xét thiết kế Khi thiết kế, xây dựng tác tử, phải xem xét yếu tố: – Performance measure: hàm đo hiệu – Enviroment: môi trường – Actuator: kích hoạt – Sensor: cảm biến PEAS: số ví dụ Tác tử lái xe tự động Tác tử mua hàng Tác tử lọc thư rác Hàm đánh giá độ an toàn, tốc độ, luật, lợi ích giá, chất lượng, độ tin cậy đơn hàng #phân loại sai Môi trường đường, giao thông, người bộ, lái xe người bán hàng, tác tử vận chuyển, khách hàng phần mềm email server/client Bộ kích hoạt bánh xe, chân ga, phanh trình bày hoá đơn, điền HĐ, gửi HĐ thư gán nhãn Bộ cảm biến camera, máy đo tốc độ trang HTML, form giao diện với KH nội dung thư, tiêu đề, thời gian Đặc điểm môi trường Tính quan sát được: đầy đủ - phận Tính xác định được: trạng thái môi trường hoàn toàn xác định dựa trạng thái hành động thực tác tử hay không? Tính động: môi trường tĩnh hay thay đổi tác tử hoạt động? Tính liên tục hay rời rạc: cảm nhận hành vi có phân biệt cách rõ ràng không? Đơn tác tử hay đa tác tử: môi trường, có hay nhiều tác tử hoạt động? Phân loại tác tử Dựa vào đặc điểm hàm tác tử, ánh xạ dãy cảm nhận tới hành động tương ứng, chia tác tử thành loại: – Tác tử phản xạ đơn giản – Tác tử phản xạ có trạng thái – Tác tử hướng mục đích – Tác tử hướng lợi ích Tác tử phản xạ đơn giản • • • • • • Function SIMPLE-REFLEXAGENT(percept) returns action static: rules, tập luật dạng điều kiện-hành động state ← INTERPRETINPUT(percept) rule ← RULE-MATCH(state, rules) action ← RULE-ACTION[rule] Return action Tác tử phản xạ có trạng thái • To tackle partially observable environments – Maintain internal state – Over time update state using world knowledge – How does the world change – How actions affect world ⇒ Model of World Tác tử hướng mục đích Các dạng đích: –Một trạng thái –Tập trạng thái thỏa mãn số tính chất –Một phép thử áp dụng vào trạng thái thông báo có thỏa đích hay không –Đích khiến tác tử phải suy luận tương lai trạng thái khác Có thể có trường hợp không hành động đưa đến đích Tác tử hướng lợi ích • Các tác tử thực hành động cho có lợi lâu dài • Các tác tử muốn thực hành động đem lại lợi ích lớn • Có thể suy luận nhiệm vụ có nhiều đích, xung đột đích, tình không chắn Tác tử với khả học • All previous agentprograms describe methods for selecting actions – Yet it does not explain the origin of these programs – Learning mechanisms can be used to perform this task – Teach them instead of instructing them – Advantage is the robustness of the program toward initially unknown environments