Bài giảng Tác tử thông minh bao gồm những nội dung về tác tử và môi trường, một số đặc điểm của tác tử, PEAS - Những yếu tố cần xem xét khi thiết kế tác tử; đặc điểm của môi trường; phân loại tác tử. Mời các bạn tham khảo.
Tác tử thơng minh Nội dung • Tác tử mơi trường • Một số đặc điểm tác tử • PEAS - Những yếu tố cần xem xét thiết kế tác tử • Đặc điểm mơi trường • Phân loại tác tử Tác tử môi trường Một tác tử - agent : thứ cảm nhận mơi trường quanh thơng qua cảm biến tác động trở lại môi trường thông qua kích hoạt Ví dụ 1: người - tác tử Cảm biến: mắt, tai, … Bộ kích hoạt: tay, chân, … Ví dụ 2: Người máy Aishimo • Cảm biến: camera, dò đường hồng ngoại • Bộ kích hoạt: mơ tơ Tác tử mơi trường • Hàm tác tử: ánh xạ từ tập cảm nhận khứ tới hành động tương ứng: f: P* Æ A Chương trình tác tử chạy kiến trúc vật lý để tạo hàm f Chương trình tác tử dựa bảng điều kiện Function TABLE-DRIVEN-AGENT(percept) returns action static: percepts, dãy cảm nhận, khởi đầu rỗng table, bảng hành động ứng với chuỗi cảm nhận Thêm percept vào cuối dãy percepts Return action action LOOKUP(percepts, table) Nhược điểm: bùng nổ kích thước table Ví dụ: tác tử hút bụi thơng minh Cảm nhận: vị trí (A B), trạng thái (sạch bẩn) Hành động: qua trái, qua phải, hút bụi, NoOp Dãy cảm nhận Action [A,Clean] [A, Dirty] [B, Clean] [B, Dirty] [A, Clean],[A, Clean] [A, Clean],[A, Dirty] Right Hút bụi Left Hút bụi Right … Hút bụi … Đặc điểm tác tử Với dãy trạng thái cảm nhận với tri thức sẵn có, tác tử phải lựa chọn hành động cho tối đa hóa hàm đánh giá hiệu Cho đích cần đạt tri thức sẵn có, tác tử cần: Sử dụng thơng tin thu từ quan sát để cập nhật lại tri thức Trên sở tri thức nó, thực thi hành động nhằm đạt mục tiêu đề giới Một tác tử tự trị hành vi xác định kinh nghiệm thân (với khả học thích nghi) PEAS - Yếu tố xem xét thiết kế Khi thiết kế, xây dựng tác tử, phải xem xét yếu tố: – Performance measure: hàm đo hiệu – Enviroment: môi trường – Actuator: kích hoạt – Sensor: cảm biến PEAS: số ví dụ Tác tử lái xe tự động Tác tử mua hàng Tác tử lọc thư rác Hàm đánh giá độ an toàn, tốc độ, luật, lợi ích giá, chất lượng, độ tin cậy đơn hàng #phân loại sai Môi trường đường, giao thông, người bộ, lái xe người bán hàng, tác tử vận chuyển, khách hàng phần mềm email server/client Bộ kích hoạt bánh xe, chân ga, phanh trình bày hố đơn, điền HĐ, gửi HĐ thư gán nhãn Bộ cảm biến camera, máy đo tốc độ trang HTML, form giao diện với KH nội dung thư, tiêu đề, thời gian Đặc điểm mơi trường Tính quan sát được: đầy đủ - phận Tính xác định được: trạng thái mơi trường hồn tồn xác định dựa trạng thái hành động thực tác tử hay khơng? Tính động: môi trường tĩnh hay thay đổi tác tử hoạt động? Tính liên tục hay rời rạc: cảm nhận hành vi có phân biệt cách rõ ràng không? Đơn tác tử hay đa tác tử: mơi trường, có hay nhiều tác tử hoạt động? Phân loại tác tử Dựa vào đặc điểm hàm tác tử, ánh xạ dãy cảm nhận tới hành động tương ứng, chia tác tử thành loại: – Tác tử phản xạ đơn giản – Tác tử phản xạ có trạng thái – Tác tử hướng mục đích – Tác tử hướng lợi ích Tác tử phản xạ đơn giản • • • • • • Function SIMPLE-REFLEXAGENT(percept) returns action static: rules, tập luật dạng điều kiện-hành động state INTERPRETINPUT(percept) rule RULE-MATCH(state, rules) action RULE-ACTION[rule] Return action Tác tử phản xạ có trạng thái • To tackle partially observable environments – Maintain internal state – Over time update state using world knowledge – How does the world change – How actions affect world – Model of World Tác tử hướng mục đích Các dạng đích: –Một trạng thái –Tập trạng thái thỏa mãn số tính chất –Một phép thử áp dụng vào trạng thái thơng báo có thỏa đích hay khơng –Đích khiến tác tử phải suy luận tương lai trạng thái khác Có thể có trường hợp khơng hành động đưa đến đích Tác tử hướng lợi ích • Các tác tử thực hành động cho có lợi lâu dài • Các tác tử muốn thực hành động đem lại lợi ích lớn • Có thể suy luận nhiệm vụ có nhiều đích, xung đột đích, tình khơng chắn Tác tử với khả học • All previous agentprograms describe methods for selecting actions – Yet it does not explain the origin of these programs – Learning mechanisms can be used to perform this task – Teach them instead of instructing them – Advantage is the robustness of the program toward initially unknown environments ...Nội dung • Tác tử mơi trường • Một số đặc điểm tác tử • PEAS - Những yếu tố cần xem xét thiết kế tác tử • Đặc điểm môi trường • Phân loại tác tử Tác tử môi trường Một tác tử - agent : thứ... có hay nhiều tác tử hoạt động? Phân loại tác tử Dựa vào đặc điểm hàm tác tử, ánh xạ dãy cảm nhận tới hành động tương ứng, chia tác tử thành loại: – Tác tử phản xạ đơn giản – Tác tử phản xạ có... động thực tác tử hay khơng? Tính động: mơi trường tĩnh hay thay đổi tác tử hoạt động? Tính liên tục hay rời rạc: cảm nhận hành vi có phân biệt cách rõ ràng không? Đơn tác tử hay đa tác tử: mơi