Chương 4 - Các phương pháp học có giám sát. Chương này trình bày những nội dung chính sau: Ví dụ về các phương pháp học có giám sát, hàm đánh giá lỗi, hồi quy tuyến tính, quy tắc delta, cập nhật theo đợt, các điều kiện kết thúc học. Mời các bạn cùng tham khảo nội dung chi tiết.
Học Máy (IT 4862) Nguyễn ễ Nhật hậ Quang quangnn-fit@mail.hut.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin truyền thông Năm học 2011-2012 Nội dung d môn ô học: h Giới thiệu chung g Đánh giá hiệu hệ thống học máy Cá phương Các h pháp há h học dựa d t ê xác suất ất Các phương pháp học có giám sát Hồi quy tuyến tính (Linear regression) Các phương pháp học không giám sát Lọc cộng tác H tăng Học tă cường Học Máy – IT 4862 Hồi qquy tuyến tính – Giới thiệu Với ví dụ đầu vào, dự đoán giá trị đầu kiểu số thực Một phương pháp học máy đơn đơn-giản-nhưng-hiệu-quả giản hiệu phù hợp hàm mục tiêu (cần học) hàm tuyến tínhh n f ( x) = w0 + w1 x1 + w2 x2 + + wn xn = w0 + ∑ wi xi (wi,xi ∈R) i =1 Cần học (xấp xỉ) hàm mục tiêu f f: X → Y • X: Miền không gian đầu vào (không gian vectơ n chiều – Rn) gg gian đầu ((miền g giá trịị số thực ự – R)) • Y: Miền khơng • f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính) Thực chất, học vectơ trọng số: w = (w0, w1, w2, …,wn) Học Máy – IT 4862 Hồi qquy tuyến tính – Ví dụ Hàm tuyến tính f(x) phù hợp? x f(x) 0.13 -0.91 1.02 -0.17 3.17 1.61 -2.76 -3.31 1.44 0.18 5.28 3.36 -1.74 -2.46 93 7.93 56 5.56 f(x) x Ví dụ: ụ f(x) = -1.02 + 0.83x Học Máy – IT 4862 Các ví dụ học/kiểm thử Đối với ví dụ học x=(x1,x2, ,xn), xi∈R • Giá trị đầu mong muốn cx (∈R) • Giá trị đầu thực tế (tính hệ thống) n y x = w0 + ∑ wi xi i =1 → wi đánh giá thời hệ thống giá trị trọng số thuộc tính thứ i → Giá trị đầu thực tế yx mong muốn (xấp xỉ) cx Đối với ví dụ kiểm thử z=(z =( 1,z2, ,zn) • Cần dự đốn (tính) giá trị đầu • Bằng cách áp dụng hàm mục tiêu học f Học Máy – IT 4862 Hàm đánh ggiá lỗi Giải thuật học hồi quy tuyến tính cần phải xác định hàm đá h giá đánh iá lỗi → Đánh giá mức độ lỗi hệ thống giai đoạn huấn luyện Định nghĩa hàm lỗi E • Lỗi hệ thống ví dụ học x: n ⎞ 1⎛ ⎜ E ( x) = (c x − y x ) = ⎜ c x − w0 − ∑ wi xi ⎟⎟ 2⎝ i =1 ⎠ • Lỗi hệ thống toàn tập huấn luyện D: n ⎞ 1 ⎛ E = ∑ E ( x) = ∑ (c x − y x ) = ∑ ⎜⎜ c x − w0 − ∑ wi xi ⎟⎟ x∈D x∈D⎝ x∈D i =1 ⎠ Học Máy – IT 4862 Hồi qquy tuyến tính – Giải thuật Việc học hàm mục tiêu f tương đương với việc học vectơ trọng ọ g số w cho cực ự tiểu hóa giá g trịị lỗi huấn luyện yệ E → Phương pháp có tên gọi “Least-Square Linear Regression” Giai đoạn huấn luyện • Khởi tạo vectơ trọng số w • Tính tốn giá trị lỗi huấn luyện E • Cập nhật vectơ trọng số w theo quy tắc delta (delta rule) • Lặp lại, hội tụ giá trị lỗi nhỏ (cục bộ) E Giai đoạn dự đoán Đối với ví dụ z, giá trị đầu dự đoán bằng: n f ( z ) = w *0 + ∑ w *i zi i =1 Học Máy – IT 4862 Trong w*=(w*0,w*1, , w*n) vectơ trọng số học Quy tắc delta Để cập nhật vectơ trọng số w theo hướng giúp giảm bớt giá trị lỗi huấn luyện E • η tốc độ học (là số dương) → Xác định mức độ thay đổi giá trị trọng số bước học • Cập nhật theo ví dụ (Instance-to-instance/incremental update): wi ← wi + η(cx-yx)xi • Cập nhật theo đợt (Batch update): wi ← wi + η ∑ (c x − y x ) xi x∈D Các tên gọi khác quy tắc delta • LMS (least mean square) rule • Adaline rule • Widrow-Hoff Widrow Hoff rule Học Máy – IT 4862 LSLR_batch(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) khởi tạo ngẫu nhiên while not CONVERGENCE for each thuộc tính fi delta_wi ← for each ví dụ học x∈D Tính tốn giá trị đầu thực tế yx for each thuộc tính fi delta_wi ← delta_wi + η(cx-yx)xi for each thuộc tính fi wi ← wi + delta_wi end while return w Học Máy – IT 4862 Cập p nhật theo đợt/theo từngg ví dụ Giải thuật tuân theo chiến lược cập nhật theo đợt Cập nhật theo đợt (Batch update) • Tại bước học, giá trị trọng số cập nhật sau tất ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi tính tích lũy tất ví dụ học - Các giá trị trọng số cập nhật theo giá trị lỗi tích lũy tổng thể Cập nhật theo ví dụ (Instance-to-instance/ incremental update) • T Tạii ỗi b bước h học, giá iá ttrịị trọng t số ố đ cập ậ nhật hật lập lậ tứ tức sau ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi (riêng biệt) tính cho ví dụ học đưa vào - Các giá trị trọng số cập nhật theo giá trị lỗi Học Máy – IT 4862 10 LSLR_incremental(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) khởi tạo ngẫu nhiên while not CONVERGENCE for each ví dụ học x∈D Tính tốn giá trị đầu thực tế yx for each thuộc tính fi wi ← wi + η(cx-yx)xi end while return w Học Máy – IT 4862 11 Các điều kiện kết thúc học Trong giải thuật LSLR_batch LSLR_incremental, S i l ttrình ì h học h kết thúc thú điều điề kiện định CONVERGENCE thỏa mãn Các điề Cá điều kiện kiệ kết thúc thú học h thường th đ định đị h nghĩa hĩ dựa d số tiêu chí đánh giá hiệu hệ thống • Kết thúc,, giá g trịị lỗi nhỏ giá g trịị ngưỡng g g • Kết thúc, giá trị lỗi bước học lớn giá trị lỗi bước học trước • Kết thúc, thú ế khác biệt iữ giá iá ttrịị lỗi b bước học h liên liê tiếp nhỏ giá trị ngưỡng • Học Máy – IT 4862 12 ... 1.02 -0 .17 3.17 1.61 -2 .76 -3 .31 1 .44 0.18 5.28 3.36 -1 . 74 -2 .46 93 7.93 56 5.56 f(x) x Ví dụ: ụ f(x) = -1 .02 + 0.83x Học Máy – IT 48 62 Các ví dụ học/ kiểm thử Đối với ví dụ học x=(x1,x2, ,xn),... cập nhật theo đợt Cập nhật theo đợt (Batch update) • Tại bước học, giá trị trọng số cập nhật sau tất ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi tính tích lũy tất ví dụ học - Các... lậ tứ tức sau ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi (riêng biệt) tính cho ví dụ học đưa vào - Các giá trị trọng số cập nhật theo giá trị lỗi Học Máy – IT 48 62 10 LSLR_incremental(D,