TRÍ TUỆ NHÂN TẠO

Trí Tuệ Nhân Tạo Nguyễn Nhật Quang quangnn-fit@mail.hut.edu.vn Viện Cơng nghệ Thông tin Truyền thông Trường Đại học Bách Khoa Hà Nội Năm học 2009-2010 Nội dung môn học: Giới thiệu Trí tuệ nhân tạo Tác tử Định nghĩa Môi trường công việc Các kiểu môi trường g Các kiểu tác tử Giải vấn đề: Tìm kiếm, Thỏa mãn ràng buộc Logic suy diễn Biểu diễn tri thức Suy diễn ễ với tri thức không ắ chắn ắ Học máy Lập kế hoặch Trí tuệ nhân tạo Tác tử - Định ị nghĩa g Tác tử (con người, người máy, software robots,, ộ ổn nhiệt,…) ệ , ) có khả g cảm nhận ậ ((nhận ậ biết)) mơi trường xung quanh thơng qua phận cảm biến (sensors) hành động phù hợp theo mơi trường thơng qua phận hoạt động (actuators) Tác tử người Các phận cảm biến: mắt, tai, số phận thể khác Các phận hoạt động: tay, chân, miệng, số phận thể khác Tác tử người máy Các phận cảm biến: máy quay (cameras), truy tìm tín hiệu hồng ngoại Các phận hoạt động: động loại động (motors) Trí tuệ nhân tạo Tác tử Môi trường g Hàm tác tử: hàm ánh xạ từ lịch sử nhận thức tới hành động: f: P* → A Chương trình tác tử: hoạt động (chạy) dựa kiến trúc thực tế hàm f Tác tử = Kiến ế trúc + Chương trình Trí tuệ nhân tạo Ví dụ: Thế giới máy hút bụi Các nhận thức Ví trí mức độ Ví dụ: [A, Bẩn], [B, Sạch] Các hành động Di chuyển (máy hút bụi) sang trái, sang phải, hút bụi, khơng làm Trí tuệ nhân tạo Tác tử máy y hút bụi ụ Bảng hành động tác tử máy hút bụi Chuỗi nhận ậ thức Hành động ộ g [A, Sạch] Di chuyển sang phải [A, Bẩn] Hút bụi [[B,, Sạch] ] Di chuyển y sang g trái [B, Bẩn] Hút bụi [A, Sạch], [A, Sạch] Di chuyển sang phải [A, Sạch], [A, Bẩn] Hút bụi function Reflex-Vacuum-Agent( g ( [[location,status]) , ]) returns an action if status = Dirty then return Suck else if location = A then return Right else if location = B then return Left Trí tuệ nhân tạo Tác tử hợp ợp lý ý (1) ( ) Tác tử cần phấn đấu để “làm việc cần làm”, dựa nhận thức (nhận biết) dựa hành động mà thực Một ộ hành động ộ g g (hợp ( ợp lý) ý) hành động ộ gg giúp p cho tác tử đạt thành công cao mục tiêu đặt Đánh giá hiệu hoạt động: tiêu chuẩn để đánh giá mức ứ độ thành h công ô ttrong h hoạtt động độ ủ ột tác tá tử Ví dụ: Tiêu chí đánh giá hiệu hoạt động tác tử máy hút bụi là: mức độ làm sạch, thời gian hút bụi, mức độ điện tiêu tốn, ố mức độ tiếng ế ồn gây ra, … Trí tuệ nhân tạo Tác tử hợp lý (2) Tác tử hợp ợp lý ý Với chuỗi nhận thức có được, Một tác tử hợp lý cần phải lựa chọn hành động giúp cực đại hóa tiêu chí đánh giá hiệu hoạt động tác tử đó, Dựa thông tin cung cấp chuỗi nhận thức tri thức sở hữu tác tử Trí tuệ nhân tạo Tác tử hợp lý (3) Sự hợp lý ≠ Sự thông suốt thứ Sự thông suốt thứ = Biết tất thứ thứ, với tri thức vô hạn Vì nhận thức khơng cung cấp tất thông tin liên quan Các tác tử ể thực hành động nhằm thay đổi ổ nhận thức tương lai, với mục đích thu thơng g tin hữu ích ((ví dụ: ụ thu thập ập thông g tin, khám p phá tri thức) Tác tử tự trị (autonomous agent) tác tử mà hà h động hành độ ủ ó đ ết định đị h hí h ki kinh h nghiệm tác tử (cùng với khả học thích nghi) Trí tuệ nhân tạo Mơi trường cơng việc – PEAS (1) PEAS Performance measure: Tiêu chí đánh giá hiệu hoạt động Environment: Môi trường xung quanh Actuators: Các phận hành động Sensors: Các phận cảm biến Để thiết kế ột tác tá tử thông thô minh i h (h (hợp lý), lý) ttrước tiê tiên cần ầ phải xác định (thiết lập) giá trị thành phần PEAS Trí tuệ nhân tạo 10 Các kiểu tác tử kiểu tác tử Tác tử phản xạ đơn giản (simple reflex agents) Tác tử phản Tá xạ dựa d t ê mơ hì hình h ((model-based d lb d reflex fl agents) Tác tử dựa mục tiêu (goal-based agents) Tác tử dựa lợi ích ((utility-based y agents) g ) Trí tuệ nhân tạo 19 Tác tử p phản xạ đơn giản g (1) ( ) Trí tuệ nhân tạo 20 Tác tử phản xạ đơn giản (2) Tác tử phản xạ đơn giản: → Hành Hà h động độ theo th ột quy tắc tắ (luật) (l ật) có ó điều điề kiện kiệ phù hù hợp h với trạng thái thời (của môi trường) function SIMPLE-REFLEX-AGENT(percept) static: rules (tập luật có dạng: điều kiện-hành động) state ← INTERPRET-INPUT(percept) rule ← RULE-MATCH(state, rules) action ← RULE-ACTION[rule] return action Trí tuệ nhân tạo 21 Tác tử phản xạ dựa mơ hình (1) Trí tuệ nhân tạo 22 Tác tử phản xạ dựa mơ hình (2) Tác tử phản xạ dựa mơ hình: Sử dụng mơ hình nội để giám sát trạng thái môi trường Lựa chọn hành động: giống tác tử phản xạ đơn giản function REFLEX-AGENT-WITH-STATE(percept) static: state (mô tả trạng thái môi trường) rules (tập luật có dạng: điều kiện-hành kiện hành động) action (hành động gần nhất) state ← UPDATE-STATE(state, UPDATE-STATE(state action, action percept) rule ← RULE-MATCH(state, rules) action ← RULE-ACTION[rule] return action Trí tuệ nhân tạo 23 Tác tử dựa mục tiêu (1) Biết trạng thái môi trường: chưa đủ → Cần biết thêm thông tin mục tiêu Trạng thái môi trường: Ở ngã tư, xe taxi rẽ trái, rẽ phải, thẳng Thông tin mục tiêu: xe taxi cần tới đích đến hành khách Tác tử dựa mục tiêu Theo dõi trạng thái môi trường Lưu ưu g giữ ữ ột tập mục ục tiêu t (cần (cầ đạt được) Chọn hành động cho phép (rốt cuộc) đạt đến mục tiêu Trí tuệ nhân tạo 24 Tác tử dựa ự mục ụ tiêu (2) ( ) Trí tuệ nhân tạo 25 Tác tử dựa lợi ích (1) Trong nhiều mơi trường, thơng tin mục tiêu không đủ để đánh giá hiệu hành động Có nhiều chuỗi hành động cho phép taxi đến đích (tức đạt đến mục tiêu) Nhưng: chuỗi hành động nhanh hơn, an toàn hơn, đáng tin cậy hơn, chi phí thấp hơn? Cần đánh giá lợi ích tác tử Hàm lợi ích (utility function) Ánh xạ từ chuỗi trạng thái môi trường tới giá trị số thực (thể mức lợi ích tác tử) Trí tuệ nhân tạo 26 Tác tử dựa ự lợi ợ ích ((2)) Trí tuệ nhân tạo 27 Tác tử có khả học (1) Khả học cho phép tác tử cải thiện hiệu hoạt động thành phần tạo nên tác tử có khả học Thành phần hành động: đảm nhiệm việc lựa chọn hành động Thành phần đánh giá (bình luận): đánh giá hiệu hoạt động Thành phần ầ học: giúp cải thiện hiệu hoạt động - dựa đánh giá, để thay đổi (cải thiện) thành phần hành động Thành p phần ầ sả sản sinh s kinh nghiệm: g ệ có nhiệm ệ vụ ụ đề xuất uất hành động giúp sản sinh (dẫn đến) kinh nghiệm Trí tuệ nhân tạo 28 Tác tử có khả g học ọ ((2)) Trí tuệ nhân tạo 29 Cơ sở tri thức tác tử Một sở tri thức (a knowledge base) tập mệnh đề (phát biểu) biểu diễn ngơn ngữ hình thức, cung cấp ấ tri thức (hiểu ể biết) ế cho tác tử Tác tử khai thác sở tri thức (mà sở hữu) trình đưa hành động Các tác tử xem xét mức Tri thức: Tác tử biết gì? Các mục tiêu tác tử gì? Cài đặt hệ thống: Các cấu trúc liệu sở tri thức? Các giải thuật sử dụng tri thức này? Tác tử cần có khả Thu thậ Th thập (cập ( ậ nhật) hật) ttrii thứ thức ới Cập nhật việc biểu diễn (bên tác tử) môi trường xung quanh Suy diễn thuộc tính ẩn mơi trường xung quanh S luận Suy l ậ để đưa đ hà hành h động độ hợp h lý Trí tuệ nhân tạo 30 Đa tác tử (1) Môi trường hoạt động: Cộng tác (hợp tác) Cạnh tranh (đối kháng)? Trong nhiều toán thực tế, môi trường hoạt động thay đổi (biến động) → tác tử cần cập nhật Cần mơ hình biểu diễn kế hoặch tác tử khác Các tác tử cộng tác Cùng chia sẻ mục tiêu kế hoặch Ví dụ: Lập kế hoặch (cho hoạt động nhóm) trị chơi tennis đánh đơi Các chế cộng tác: Phân tách phân phối nhiệm vụ cho tác tử Trí tuệ nhân tạo 31 Đa tác tử (2) Các tác tử cạnh tranh Ví dụ: chơi cờ Mỗi tác tử phải nhận biết tồn (và hoạt động) tác tử khác Mỗi tá tác tử tí tính h toán t (dự (d đ đoán) )đ kế h hoặch ặ h ủ ((một ột số) ố) tác tử khác Mỗi tác tử tính tốn (dự đốn) ảnh hưởng kế hoặch ủ tá tác tử khác ới kế h hoặch ặ h ủ bả thân thâ ó Mỗi tác tử định hành động tối ưu dự đoán ảnh hưởng Trí tuệ nhân tạo 32 Tác tử - Tổng g kết Tác tử tương tác với môi trường thông qua phận cảm biến ộp phận ậ hành động ộ g Hàm tác tử mô tả hành động mà tác tử thực tình Một tác tử hợp lý cực đại hóa hiệu hoạt động Các chương trình tác tử cài đặt (thực hiện) hàm tác tử Cá mô Các ô tả PEAS xác định đị h môi ôi ttrường công ô việc iệ Các môi trường phân loại dựa theo tiêu chí: Có thể quan sát được? q ợ Xác định? ị Phân đoạn? tĩnh? Rời rạc? Tác tử đơn lẻ? Các kiến trúc tác tử bản: Phản xạ, Phản xạ theo trạng thái Dựa mục tiêu, thái, tiêu Dựa lợi ích Trí tuệ nhân tạo 33

Định dạng
Số trang	33
Dung lượng	480,84 KB