Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 12 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
12
Dung lượng
346,52 KB
Nội dung
Học Máy (IT4866) Nguyễn ễ Nhật hậ Quang quang.nguyennhat@hust.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin truyền thông Năm học 2013-2014 Nội dung d môn ô học: h Giới thiệu chung g Đánh giá hiệu hệ thống học máy Cá phương Các h pháp há h học dựa d t ê xác suất ất Các phương pháp học có giám sát Hồi quy tuyến tính (Linear regression) Các phương pháp học không giám sát Học Máy – IT4866 Hồi qquy tuyến tính – Giới thiệu Với ví dụ đầu vào, dự đốn giá trị đầu kiểu số thực Một phương pháp học máy đơn đơn-giản-nhưng-hiệu-quả giản hiệu phù hợp hàm mục tiêu (cần học) hàm tuyến tínhh n f ( x) = w0 + w1 x1 + w2 x2 + + wn xn = w0 + ∑ wi xi (wi,xi ∈R) i =1 Cần học (xấp xỉ) hàm mục tiêu f f: X → Y • X: Miền khơng gian đầu vào (không gian vectơ n chiều – Rn) gg gian đầu ((miền g giá trịị số thực ự – R)) • Y: Miền khơng • f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính) Thực chất, học vectơ trọng số: w = (w0, w1, w2, …,wn) Học Máy – IT4866 Hồi qquy tuyến tính – Ví dụ Hàm tuyến tính f(x) phù hợp? x f(x) 0.13 -0.91 1.02 -0.17 3.17 1.61 -2.76 -3.31 1.44 0.18 5.28 3.36 -1.74 -2.46 93 7.93 56 5.56 f(x) x Ví dụ: ụ f(x) = -1.02 + 0.83x Học Máy – IT4866 Các ví dụ học/kiểm thử Đối với ví dụ học x=(x1,x2, ,xn), xi∈R • Giá trị đầu mong muốn cx (∈R) • Giá trị đầu thực tế (tính hệ thống) n y x = w0 + ∑ wi xi i =1 → wi đánh giá thời hệ thống giá trị trọng số thuộc tính thứ i → Giá trị đầu thực tế yx mong muốn (xấp xỉ) cx Đối với ví dụ kiểm thử z=(z =( 1,z2, ,zn) • Cần dự đốn (tính) giá trị đầu • Bằng cách áp dụng hàm mục tiêu học f Học Máy – IT4866 Hàm đánh ggiá lỗi Giải thuật học hồi quy tuyến tính cần phải xác định hàm đá h giá đánh iá lỗi → Đánh giá mức độ lỗi hệ thống giai đoạn huấn luyện Định nghĩa hàm lỗi E • Lỗi hệ thống ví dụ học x: n ⎞ 1⎛ ⎜ E ( x) = (c x − y x ) = ⎜ c x − w0 − ∑ wi xi ⎟⎟ 2⎝ i =1 ⎠ • Lỗi hệ thống toàn tập huấn luyện D: n ⎞ 1 ⎛ E = ∑ E ( x) = ∑ (c x − y x ) = ∑ ⎜⎜ c x − w0 − ∑ wi xi ⎟⎟ x∈D x∈D⎝ x∈D i =1 ⎠ Học Máy – IT4866 Hồi qquy tuyến tính – Giải thuật Việc học hàm mục tiêu f tương đương với việc học vectơ trọng ọ g số w cho cực ự tiểu hóa giá g trịị lỗi huấn luyện yệ E → Phương pháp có tên gọi “Least-Square Linear Regression” Giai đoạn huấn luyện • Khởi tạo vectơ trọng số w • Tính tốn giá trị lỗi huấn luyện E • Cập nhật vectơ trọng số w theo quy tắc delta (delta rule) • Lặp lại, hội tụ giá trị lỗi nhỏ (cục bộ) E Giai đoạn dự đốn Đối với ví dụ z, giá trị đầu dự đoán bằng: n f ( z ) = w *0 + ∑ w *i zi i =1 Học Máy – IT4866 Trong w*=(w*0,w*1, , w*n) vectơ trọng số học Quy tắc delta Để cập nhật vectơ trọng số w theo hướng giúp giảm bớt giá trị lỗi huấn luyện E • η tốc độ học (là số dương) → Xác định mức độ thay đổi giá trị trọng số bước học • Cập nhật theo ví dụ (Instance-to-instance/incremental update): wi ← wi + η(cx-yx)xi • Cập nhật theo đợt (Batch update): wi ← wi + η ∑ (c x − y x ) xi x∈D Các tên gọi khác quy tắc delta • LMS (least mean square) rule • Adaline rule • Widrow-Hoff Widrow Hoff rule Học Máy – IT4866 LSLR_batch(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) khởi tạo ngẫu nhiên while not CONVERGENCE for each thuộc tính fi delta_wi ← for each ví dụ học x∈D Tính tốn giá trị đầu thực tế yx for each thuộc tính fi delta_wi ← delta_wi + η(cx-yx)xi for each thuộc tính fi wi ← wi + delta_wi end while return w Học Máy – IT4866 Cập p nhật theo đợt/theo từngg ví dụ Giải thuật tuân theo chiến lược cập nhật theo đợt Cập nhật theo đợt (Batch update) • Tại bước học, giá trị trọng số cập nhật sau tất ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi tính tích lũy tất ví dụ học - Các giá trị trọng số cập nhật theo giá trị lỗi tích lũy tổng thể Cập nhật theo ví dụ (Instance-to-instance/ incremental update) • T Tạii ỗi b bước h học, giá iá ttrịị trọng t số ố đ cập ậ nhật hật lập lậ tứ tức sau ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi (riêng biệt) tính cho ví dụ học đưa vào - Các giá trị trọng số cập nhật theo giá trị lỗi Học Máy – IT4866 10 LSLR_incremental(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) khởi tạo ngẫu nhiên while not CONVERGENCE for each ví dụ học x∈D Tính toán giá trị đầu thực tế yx for each thuộc tính fi wi ← wi + η(cx-yx)xi end while return w Học Máy – IT4866 11 Các điều kiện kết thúc học Trong giải thuật LSLR_batch LSLR_incremental, S i l ttrình ì h học h kết thúc thú điều điề kiện định CONVERGENCE thỏa mãn Các điề Cá điều kiện kiệ kết thúc thú học h thường th đ định đị h nghĩa hĩ dựa d số tiêu chí đánh giá hiệu hệ thống • Kết thúc,, giá g trịị lỗi nhỏ giá g trịị ngưỡng g g • Kết thúc, giá trị lỗi bước học lớn giá trị lỗi bước học trước • Kết thúc, thú ế khác biệt iữ giá iá ttrịị lỗi b bước học h liên liê tiếp nhỏ giá trị ngưỡng • Học Máy – IT4866 12 ... regression) Các phương pháp học khơng giám sát Học Máy – IT4 866 Hồi qquy tuyến tính – Giới thiệu Với ví dụ đầu vào, dự đoán giá trị đầu kiểu số thực Một phương pháp học máy đơn đơn-giản-nhưng-hiệu-quả... ự – R)) • Y: Miền khơng • f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính) Thực chất, học vectơ trọng số: w = (w0, w1, w2, …,wn) Học Máy – IT4 866 Hồi qquy tuyến tính – Ví dụ Hàm tuyến tính... -1.74 -2.46 93 7.93 56 5.56 f(x) x Ví dụ: ụ f(x) = -1.02 + 0.83x Học Máy – IT4 866 Các ví dụ học/ kiểm thử Đối với ví dụ học x=(x1,x2, ,xn), xi∈R • Giá trị đầu mong muốn cx (∈R) • Giá trị đầu