1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÀI GIẢNG HỌC MÁY IT 4866

12 100 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 346,52 KB

Nội dung

Học Máy (IT4866) Nguyễn ễ Nhật hậ Quang quang.nguyennhat@hust.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin truyền thông Năm học 2013-2014 Nội dung d môn ô học: h „ Giới thiệu chung g „ Đánh giá hiệu hệ thống học máy „ Cá phương Các h pháp há h học dựa d t ê xác suất ất „ Các phương pháp học có giám sát „ „ Hồi quy tuyến tính (Linear regression) Các phương pháp học không giám sát Học Máy – IT4866 Hồi qquy tuyến tính – Giới thiệu „ Với ví dụ đầu vào, dự đốn giá trị đầu kiểu số thực „ Một phương pháp học máy đơn đơn-giản-nhưng-hiệu-quả giản hiệu phù hợp hàm mục tiêu (cần học) hàm tuyến tínhh n f ( x) = w0 + w1 x1 + w2 x2 + + wn xn = w0 + ∑ wi xi (wi,xi ∈R) i =1 „ Cần học (xấp xỉ) hàm mục tiêu f f: X → Y • X: Miền khơng gian đầu vào (không gian vectơ n chiều – Rn) gg gian đầu ((miền g giá trịị số thực ự – R)) • Y: Miền khơng • f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính) ƒ Thực chất, học vectơ trọng số: w = (w0, w1, w2, …,wn) Học Máy – IT4866 Hồi qquy tuyến tính – Ví dụ Hàm tuyến tính f(x) phù hợp? x f(x) 0.13 -0.91 1.02 -0.17 3.17 1.61 -2.76 -3.31 1.44 0.18 5.28 3.36 -1.74 -2.46 93 7.93 56 5.56 f(x) x Ví dụ: ụ f(x) = -1.02 + 0.83x Học Máy – IT4866 Các ví dụ học/kiểm thử „ Đối với ví dụ học x=(x1,x2, ,xn), xi∈R • Giá trị đầu mong muốn cx (∈R) • Giá trị đầu thực tế (tính hệ thống) n y x = w0 + ∑ wi xi i =1 → wi đánh giá thời hệ thống giá trị trọng số thuộc tính thứ i → Giá trị đầu thực tế yx mong muốn (xấp xỉ) cx „ Đối với ví dụ kiểm thử z=(z =( 1,z2, ,zn) • Cần dự đốn (tính) giá trị đầu • Bằng cách áp dụng hàm mục tiêu học f Học Máy – IT4866 Hàm đánh ggiá lỗi „ Giải thuật học hồi quy tuyến tính cần phải xác định hàm đá h giá đánh iá lỗi → Đánh giá mức độ lỗi hệ thống giai đoạn huấn luyện „ Định nghĩa hàm lỗi E • Lỗi hệ thống ví dụ học x: n ⎞ 1⎛ ⎜ E ( x) = (c x − y x ) = ⎜ c x − w0 − ∑ wi xi ⎟⎟ 2⎝ i =1 ⎠ • Lỗi hệ thống toàn tập huấn luyện D: n ⎞ 1 ⎛ E = ∑ E ( x) = ∑ (c x − y x ) = ∑ ⎜⎜ c x − w0 − ∑ wi xi ⎟⎟ x∈D x∈D⎝ x∈D i =1 ⎠ Học Máy – IT4866 Hồi qquy tuyến tính – Giải thuật „ Việc học hàm mục tiêu f tương đương với việc học vectơ trọng ọ g số w cho cực ự tiểu hóa giá g trịị lỗi huấn luyện yệ E → Phương pháp có tên gọi “Least-Square Linear Regression” „ Giai đoạn huấn luyện • Khởi tạo vectơ trọng số w • Tính tốn giá trị lỗi huấn luyện E • Cập nhật vectơ trọng số w theo quy tắc delta (delta rule) • Lặp lại, hội tụ giá trị lỗi nhỏ (cục bộ) E „ Giai đoạn dự đốn Đối với ví dụ z, giá trị đầu dự đoán bằng: n f ( z ) = w *0 + ∑ w *i zi i =1 Học Máy – IT4866 Trong w*=(w*0,w*1, , w*n) vectơ trọng số học Quy tắc delta „ Để cập nhật vectơ trọng số w theo hướng giúp giảm bớt giá trị lỗi huấn luyện E • η tốc độ học (là số dương) → Xác định mức độ thay đổi giá trị trọng số bước học • Cập nhật theo ví dụ (Instance-to-instance/incremental update): wi ← wi + η(cx-yx)xi • Cập nhật theo đợt (Batch update): wi ← wi + η ∑ (c x − y x ) xi x∈D „ Các tên gọi khác quy tắc delta • LMS (least mean square) rule • Adaline rule • Widrow-Hoff Widrow Hoff rule Học Máy – IT4866 LSLR_batch(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) khởi tạo ngẫu nhiên while not CONVERGENCE for each thuộc tính fi delta_wi ← for each ví dụ học x∈D Tính tốn giá trị đầu thực tế yx for each thuộc tính fi delta_wi ← delta_wi + η(cx-yx)xi for each thuộc tính fi wi ← wi + delta_wi end while return w Học Máy – IT4866 Cập p nhật theo đợt/theo từngg ví dụ „ Giải thuật tuân theo chiến lược cập nhật theo đợt „ Cập nhật theo đợt (Batch update) • Tại bước học, giá trị trọng số cập nhật sau tất ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi tính tích lũy tất ví dụ học - Các giá trị trọng số cập nhật theo giá trị lỗi tích lũy tổng thể „ Cập nhật theo ví dụ (Instance-to-instance/ incremental update) • T Tạii ỗi b bước h học, giá iá ttrịị trọng t số ố đ cập ậ nhật hật lập lậ tứ tức sau ví dụ học đưa vào (được học bởi) hệ thống - Giá trị lỗi (riêng biệt) tính cho ví dụ học đưa vào - Các giá trị trọng số cập nhật theo giá trị lỗi Học Máy – IT4866 10 LSLR_incremental(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) khởi tạo ngẫu nhiên while not CONVERGENCE for each ví dụ học x∈D Tính toán giá trị đầu thực tế yx for each thuộc tính fi wi ← wi + η(cx-yx)xi end while return w Học Máy – IT4866 11 Các điều kiện kết thúc học „ Trong giải thuật LSLR_batch LSLR_incremental, S i l ttrình ì h học h kết thúc thú điều điề kiện định CONVERGENCE thỏa mãn „ Các điề Cá điều kiện kiệ kết thúc thú học h thường th đ định đị h nghĩa hĩ dựa d số tiêu chí đánh giá hiệu hệ thống • Kết thúc,, giá g trịị lỗi nhỏ giá g trịị ngưỡng g g • Kết thúc, giá trị lỗi bước học lớn giá trị lỗi bước học trước • Kết thúc, thú ế khác biệt iữ giá iá ttrịị lỗi b bước học h liên liê tiếp nhỏ giá trị ngưỡng • Học Máy – IT4866 12 ... regression) Các phương pháp học khơng giám sát Học Máy – IT4 866 Hồi qquy tuyến tính – Giới thiệu „ Với ví dụ đầu vào, dự đoán giá trị đầu kiểu số thực „ Một phương pháp học máy đơn đơn-giản-nhưng-hiệu-quả... ự – R)) • Y: Miền khơng • f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính) ƒ Thực chất, học vectơ trọng số: w = (w0, w1, w2, …,wn) Học Máy – IT4 866 Hồi qquy tuyến tính – Ví dụ Hàm tuyến tính... -1.74 -2.46 93 7.93 56 5.56 f(x) x Ví dụ: ụ f(x) = -1.02 + 0.83x Học Máy – IT4 866 Các ví dụ học/ kiểm thử „ Đối với ví dụ học x=(x1,x2, ,xn), xi∈R • Giá trị đầu mong muốn cx (∈R) • Giá trị đầu

Ngày đăng: 14/03/2019, 12:40

TỪ KHÓA LIÊN QUAN