Học (learning) là bất cứ sự thay đổi nào trong một hệ thống cho phép nó tiến hành tốt hơn trong lần thứ hai khi lặp lại cùng một nhiệm vụ hoặc với nhiệm vụ khác từ cùng một quần thể đó. (Herbert Simon). Để nắm bắt được nội dung chi tiết mời các bạn cùng tham khảo Bài giảng Trí tuệ nhân tạo - Chương 10: Học máy.
Chương 10: Máy Học Học Máy (Machine Learning) Học (learning) thay ñổi hệ thống cho phép tiến hành tốt lần thứ hai lặp lại nhiệm vụ với nhiệm vụ khác từ quần thể ñó (Herbert Simon) Học liên quan ñến vấn ñề khái quát hóa từ kinh nghiệm (dữ liệu rèn luyện) => tốn quy nạp (induction) Vì liệu rèn luyện thường hạn chế, nên thường khái quát hóa theo số khía cạnh (heuristic) => tính thiên lệch quy nạp (inductive bias) Có ba tiếp cận học: Các phương pháp học dựa ký hiệu (symbol-based): ID3 Tiếp cận kết nối: Các mạng neuron sinh học Tiếp cận di truyền hay tiến hóa: giải thuật genetic Cây ñịnh (ID3) Là giải thuật học ñơn giản thành cơng Cây định (Qð) cách biểu diễn cho phép xác ñịnh phân loại ñối tượng cách kiểm tra giá trị số thuộc tính Giải thuật có: ðầu vào: Một đối tượng hay tập hợp thuộc tính mơ tả tình ðầu ra: thường ñịnh yes/no, phân loại Trong ñịnh: Mỗi nút biểu diễn kiểm tra thuộc tính đó, giá trị tương đương với nhánh Các nút thể phân loại Kích cỡ Qð tùy thuộc vào thứ tự kiểm tra thuộc tính Ví dụ Cây Qð: Chơi Tennis Mục đích: học để xem có chơi Tennis khơng? Cây định: nắng Quang cảnh Âm u ðộ ẩm cao No Trung bình Yes mưa Yes Gió mạnh No nhẹ Yes Quy nạp Qð từ ví dụ Ví dụ (hay liệu rèn luyện cho hệ thống) gồm: Giá trị thuộc tính + Phân loại ví dụ Ngày Quang cảnh Nhiệt độ ðộ ẩm Gió Chơi Tennis D1 Nắng Nóng Cao nhẹ Khơng D2 Nắng Nóng Cao Mạnh Khơng D3 Âm u Nóng Cao Nhẹ Có D4 Mưa ấm áp Cao nhẹ Có D5 Mưa Mát TB nhẹ Có D6 Mưa Mát TB Mạnh Khơng D7 Âm u Mát TB Mạnh Có D8 Nắng ấm áp Cao nhẹ Không D9 Nắng Mát TB nhẹ Có D10 Mưa ấm áp TB nhẹ Có D11 Nắng ấm áp TB Mạnh Có D12 Âm u ấm áp Cao Mạnh Có D13 Âm u Nóng TB nhẹ Có D14 Mưa ấm áp Cao Mạnh khơng Làm ñể học ñược Qð Tiếp cận ñơn giản Học mà có cho ví dụ Học thuộc lịng cách hồn tồn ví dụ Có thể khơng thực tốt trường hợp khác Tiếp cận tốt hơn: Học nhỏ xác phù hợp với ví dụ Occam’s razor – ñơn giản thường tốt nhất! Giả thuyết có khả giả thuyết ñơn giản thống với tất quan sát Xây dựng Qð: Trên - xuống Vịng lặp chính: A giả thuyết chắn thuộc KG ðầu giả thuyết (cây Qð) =>Cây nào? Không thể chọn với 20 câu hỏi Khơng quay lui => cực tiểu địa phương Lựa chọn tìm kiếm dựa thống kê => chịu liệu nhiễu Thiên lệch quy nạp: thích ngắn 17 Chuyển thành luật Quang cảnh nắng Âm u ðộ ẩm cao No Trung bình Yes mưa Yes Gió mạnh No nhẹ Yes If (Quang-cảnh =nắng) ∧ (ðộ ẩm = Cao) Then Chơi-Tennis = No If (Quang-cảnh =nắng) ∧ (ðộ ẩm = TB) Then Chơi-Tennis = Yes If (Quang-cảnh =Âm u) Then Chơi-Tennis = Yes … 18 Khi nên sử dụng Qð Các ví dụ mơ tả cặp “thuộc tính – giá trị”, vd: Gió - mạnh, Gió - nhẹ Kết phân loại giá trị rời rạc, vd: Yes, No Dữ liệu rèn luyện chứa lỗi (bị nhiễu) Dữ liệu rèn luyện thiếu giá trị thuộc tính Ví dụ: Phân loại bệnh nhân theo bệnh họ Phân loại hỏng hóc thiết bị theo nguyên nhân Phân loại người vay tiền theo khả chi trả 19 Ví dụ: ước lượng độ an tồn tài khoản tín dụng Table 13.1: Data from credit history of loan applications 20 Figure:Một Qð cho tốn đánh giá độ an tồn tín dụng 21 Figure :Một Qð ñơn giản 22 Figure : Một Figure 13.16: Qð ñang xây dựng Một Qð khác ñang xây dựng 23 ... D11, D13 -: D1, D2, D8, D14 -: D6 +: D3, D4, D5, D7, D9, D10, D11, D12, D13 -: D1, D2, D6, D8, D14 Quang cảnh? Nắng Âm u +: D9, D11 +: D3, D7, D12, D13 -: D1, D2, D8 -: +: -: D1, D2, D8 -: Gió?... xác ñịnh thuộc tính cho khả chia tốt Thuộc tính tốt hơn? [29+, 3 6-] [21+, 6-] A1 = ? [29+, 3 6-] A2 = ? [8+, 3 0-] [18+, 3 4-] [11+, 2-] 13 Entropy Entropy(S) = số lượng mong ñợi bit cần thiết để mã... Entropy ( S ) − ∑ Entropy ( S v ) v∈Values ( A ) | S | [29+, 3 6-] [21+, 6-] A1 = ? [29+, 3 6-] A2 = ? [8+, 3 0-] [18+, 3 4-] [11+, 2-] 15 Chọn thuộc tính S: [9+,5 – ] S: [9+,5 – ] E = 0.940 E = 0.940