Học máy các kỹ thuật cơ bản và hiện đại

HỌC MÁY ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÕNG NGHỆ Đinh Mạnh Tường HỌC MÁY Các kỹ thuật đại NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI MỤC LỤC ■ • Lờinóiứầu Chương Các nguyên lý lý thuyết học thống kê 1.1 Mơ hình tống qt học từ ví d ụ 20 1.2 Sai số sai số thực nghiệm 23 1.3 Nguyên lý quy nạp cực tiểu sai số thực nghiệm 25 1.4 Phân lớp Bayes hàm hồi quy 28 1.5 Học khơng có giám sát 37 1.6 Phương pháp maximum - likelihood 39 1.7 Maximum - likelihood cực tiểu lỗitổng bình phương 47 1.8 Phương pháp Bayes 50 1.9 Đánh giá giả thuyết 55 1.10 Tính chất phù hợp thuật toán họ c .61 1.11 Sai số thực nghiệm điều ch ỉn h 70 1.12 Định lý bữa ăn khòng miễn p h í 71 Chương Các mơ hình tuyến tính 2.1 Mơ hình tuyến tính cho hổi quy 76 2.2 Mò hình tuyến tính tổng qt mạng R B F 82 2.3 Mò hình hàm phân biệt cho phân lớ p .86 HỌC MÁY 2.4 Hàm phân biệt tuyến tính cho phân lớp nhị phân .91 2.5 Các hàm phân biệt tuyến tính cho nhiểu lớp .100 2.6 Mơ hình logistic 103 Chương Mạngnơron 3.1 Nơron mạng nơron 115 3.2 Mạng truỵển thẳng đa tầng 121 3.3 Thuật toán truyền ngược 125 3.4 Các kỹ thuật huấn luyện mạng nơron 135 3.5 Mạng nơron biểu diễn xác suất hậunghiệm 141 3.6 Thiết kế mạng nơron cho ứng dụng 146 Chương Các phương pháp dựa vào nhớ 4.1 Phương pháp K - láng giểng gần cho hồi q u y 152 4.2 Hổi quy địa phương 156 4.3 Đánh giá mật độ xác suất 158 4.4 Phương pháp K - láng giềng gần nhấtcho phân lớ p 164 4.5 Phân lớp Bayes ngây th 166 Chương Các phương pháp 5.1 Cây đ ịn h 170 5.2 Cây cho hổi quy 174 5.3 Cây cho phân lớp 180 5.4 T h u â tto n lD 189 Mục lục Chương Máyvectorhỗtrợ 6.1 Hàm nhân phương pháp n h ân .201 6.2 Phương pháp nhân tử Lagrange 210 6.3 Siêu phẳng tách tối ưu 214 6.4 Máy vector h ỗ trợ 220 6.5 Siêu phẳng lề m ềm .223 6.6 Vấn đề phân lớp đa lớ p 229 6.7 Máy vector hổ trợcho hồi quy 232 Chương? Cácmơ hình xác suất đổ thị 7.1 Các luật xác suất 240 7.2 Mơ hình đồ thị định hướng 243 7.3 Học mạng Bayes .252 7.4 Mơ hình đổ thị khơng định hướng .255 7.5 Đổ thị nhân tử 259 7.6 Suy diễn mơ hình đồ thị Thuật tốn loại trừ biến 263 7.7 Thuật tốn tổ n g - tíc h 267 7.8 Thuật toán m a x - tổ n g 279 Chương Mơ hình biến ẩn thuật tốn EM 8.1 Mơ hình hổn hợp 286 8.2 Maximum - likelihood cho phân phối hỗnhợp Gauss 294 8.3 Thuật toán EM 299 8.4 Áp dụng thuật toán EM cho hỗn hợp G auss .308 HỌC MÁY Chương Các mơ hình cho dãy liệu 9.1 Mơ hình khơng gian trạng thái 312 9.2 Mò hình Markov ẩ n 316 9.3 Thuật toán tiến - lùi .321 9.4 Thuật toán Viterbi 329 9.5 Đánh giá tham biến HMM 334 9.6 Các mò hình Markov ẩn mở rộ ng 342 9.7 Hệ động tuyến tín h 346 Chương 10 Trường ngẫu nhiên có điều kiện 10.1 Tổng quan vể mơ hình gắn nhãn liệu 359 10.2 Trường ngẫu nhiên có điểu kiện dây chuyền tuyến tín h 369 10.3 Đánh giá tham biến CRF dây chuyển tuyến t ín h 372 10.4 Suy diễn CRF dây chuyền tuyến tính 375 10.5 Các mơ hình trường ngẫu nhiên có điều kiện mở rộng 378 Chương 11 Đánh giá, lựa chọn kết hợp mơ hình 11.1 Độ phức tạp mơ hình: bias variance 384 11.2 So sánh mò hình: phương pháp Bayes 386 11.3 Đánh giá chéo 390 11.4 Học tập th ể 393 11.5 Kết hợp mơ hình xác suất có điều kiện 402 Mục lục ề • Chương 12 Các phưưng pháp suy diễn xấp xỉ 12.1 X ấ p xỉLa p la c e 412 12.2 Phương pháp Monte Carlo 417 12.3 Phương pháp Monte Carlo dây chuyển M arkov 425 12.4 Phương pháp biến phân 438 12.5 Phương pháp truyền kỳ v ọ n g 468 Chương 13 Phân cụm 13.1 Cụm g ì? 468 13.2 Độ đo tương tự 471 13.3 Phân cụm phân hoạch 475 13.4 Phân cụm phân cấp .487 13.5 Phân cụm dựa vào mật đ ộ 490 13.6 Phân cụm dựa vào mò hình 495 13.7 Phân cụm dựa vào đồ th ị 449 13.8 Đánh giá sựxác thực phân cụ m 507 Chương 14 Rút gọn chiều liệu 14.1 Phân tích thành phần 521 14.2 Phân tích nhân t 529 14.3 Phân tích thành phần độc lập .532 14.4 Phân tích nhân tử độc lập 535 14.5 Phân tích thành phẩn n h ân 539 HỌC MÁY Chương 15 Học bán giám sát 15.1 Vấn đề học bán giám sát 546 15.2 Tự huấn lu yện 549 15.3 Cùng huấn lu yệ n 551 15.4 Mơ hình sinh thuật toán EM 553 15.5 Các phương pháp dựa vào đổ th ị 558 15.6 Phân cụm bán giám sát 567 Tài liêu tham khảo 571 LỜI NÓI ĐẨU Học m áy (Machine Leaming) lĩnh vực Trí tuệ nhân tạo liên quan đê'n việc nghiên cứu phương pháp thuật tốn đ ể máy (Computer) học đ ợ c từ ví dụ, tứ c đ ế máy tự động phát ra, suy diễn quy luật, mẫu quan hệ vốn có ví dụ (trong liệu) Đây dạng học phô biến mà người thường thực Chăng hạn, em bé lên ba học khái niệm "cái bàn" người lớn cho em bé biết số đồ vật bàn số đổ vật khơng phải bàn (các ví dụ), mà khơng cần giải thích Học máy lĩnh vực phát triển mạnh mẽ Trí tuệ nhân tạo, đóng vai trò quan trọng phát triến ngành Trí tuệ nhân tạo Đó vì, phương pháp thuật tốn Học máy sử dụng công cụ nghiên cứu quan trọng hiệu lĩnh vực khác Trí tuệ nhân tạo xử lý ngơn ngữ tự nhiên (natural language Processing), nhìn máy (Computer Vision), robotics Chẳng hạn, xử lý ngôn ngữ tự nhiên, thuật toán học máy sử dụng để gắn nhãn tù’ loại, phân tích cú pháp, dịch từ ngôn ngữ sang ngôn ngữ khác, Học máy có phạm vi ứng dụng rộng lớn Các phương pháp thuật toán Học máy áp dụng nhiều lĩnh vực, đặc biệt nhận dạng mẫu (pattem recognition), khai thác liệu ịdata minìng), tin sinh học (bioin/ormatics), HỌC MÁY 560 N hiệm vụ tìm ỳị (i = 1, , m+n) nghiệm hệ phư ong trình (15.10) (15.11) Có thuật tốn lặp đ ể tìm nghiệm hệ (15.10) (15.11), thuật toán A Blum T M itchell đ ề xuất (xem [39]) gọi th u ậ t toán truyền nhãn (labeỉ propagation algorithm) Thuật tốn truyền nhãn • (Khởi tạo) Đặt ỳ; = yi (i = ĩ, , m) ỳ (0) (j = m + 1, , m + n) nhận m ột giá trị bâ't kỳ [-1, +1], đặt t = 0; • (Bước lặp) Lặp lại bước sau hội tụ ỳ, = = m); m+n " (0 ý,"*" = (j - m + 1,-., m + n); k:-l t = t + l; Thuật toán lặp chứng minh hội tụ tới nghiệm cúa hệ phương trình (15.10) (15.11) khơng phụ thuộc vào giá trị khởi tạo cho đinh khơng có nhãn (xem [39]) Chú ý rằng, nghiệm tìm được, ỳ, (i = 1, , m+n), nhãn -1 +1, mà số thực khoảng [-1, +1] D o lấy làm ngư ỡng đ ể gắn nhãn cho đinh i (j = m + 1, , m + n): N ếu ỳ - > (i = m + 1, , m + n) đỉnh i gắn nhãn +1, nêu ỳ < gắn nhãn -1 Sau ng tỏ rằng, tìm nghiệm hệ (15.10) (15.11) dạng m ột công thức tính Viê't phương trình (15.11) dạng Chương 15 HỌCBÁNGIÁMSÁT m+n I ỹj (15.12) (j = m + l, , m + n) k=i ‘í.u Trong đó, dịj = ^ w (bậc đỉnh i) Ta ký hiệu D ma trận k=l đường chéo, với phần tử thứ i đường chéo djj (j = ĩ, , m+n) C húng ta phân tách ma trận D ma trận trọng s ố đồ thị w = (vvịk) thành ma trận sau (D m 0^ lo D„y Trong đó, ma trận Dm m V w nm w ^ w j mn (ma trận VVm) ma trận vu ông câ'p m góc bên trái ma trận D (ma trận W), Dn vu ơn g cấp n góc bên phải D (W), (Wn) ma trận Wmn ma trận m w, W n m ma trận n dòng w Ký hiệu vector cột d òn g n cột góc bên phải m cột góc bên trái Ỳ,, =( ỳ, , - , ỹn, ) ' ^ Ỳ„ = ( ỳ , „ , ỳ , Khi phương trình (15.12) viết dạng ma trận Ỳn = D n ' (V w nm w ) ( Ỳ m Ỳn y^ II ỵ Ỳ n = D n ' yí w ,n m Ỳ,m + w n Ỷn ^] Từ phư ơn g trình trên, tính tốn đơn giản, ta có (15.13) (D ^ n - w n )Ỷ ' n = w n m Ỷin Ký hi ệu L = D - w, ma trận Laplace chưa chuẩn hóa đổ thị (chúng ta biết ma trận m ục 13.6) Khi đó, Dn - Wn ma trận vu ơn g cấp n góc bên phải tách m£i trận Laplace dạng Ln phân HỌC MAY 562 L= 'L V m Lmii ^ Lnm Ln / Phương trình (15.13) viết thành (15.14) LnỲ„=W„„Ỳ„ N hư ng (15.10) ta có vector (yi, , y m )‘ = = ( ỳ, , , ỳ„) ' = (yi, , ym)‘, ta ký hiệu Từ (15.14), ta suy cơng thức tính nghiệm (15.15) Ỳ =L Bước ngẫu nhiên M arkov đồ thị C húng ta có thê dẫn đến phương trình (15.10) (15.11) cách sử d ụ n g bước ngẫu nhiên Markov đổ thị Chúng ta xét bước ngẫu nhiên Markov đồ thị với xác suất chuyển dịch từ đỉnh i tới đỉnh j w (15.16) m+n ịk=l w Jk Với đỉnh i (i = ì, , m+n), ta xét xác suất đ ể xuất phát từ đỉnh i theo bước ngẫu nhiên ta đạt tới đỉnh có nhãn 1, ta ký hiệu xác suất P(1 / i) Các xác suâ't P(1 / i) xác định sau Đ ối với đửứi gắn nhãn i (i = ì, , m) P(1 / i) = yi = P(1 / i) = yi = -1 Đ ối với đỉnh khơng có nhãn m fn p(i/j)=i;pjkP(i/k) k=l Đặt Zi = P(1 / i), ta có hệ phương trình (15.17) Chương 15 HỌCBÁNGIÁMSÁT 563 Zi = yi = = nêu y\ = -1 (15.18) (i = 1, , m) z.i = z P.ik^k (Ì = m+n) (15.19) k =l Thay pij (15.16), phương trình (15.10) (15.11), khác Zi nhãn mà xác suâ't Khi tìm xác suâ't Zj (ị = m+n), ta sử dụng ngưỡng 0,5 đ ể gắn nhãn cho đỉnh j: z >0 , đỉnh j gắn nhãn 1, nêb khác gắn nhãn -1 15.5.2 Tối ưu hàm giá Phương pháp chung đ ể thiêt kê' thuật toán gắn nhãn đỉnh đổ thị là, xây d ụn g hàm giá nhãn đỉnh quy việc tìm nhãn đỉnh v ề việc tìm cực tiểu hàm giá Giả sử ỳj nhãn (giá trị thực) đỉnh i (i = m+n) Giả thiêt quan trọng đ ể thiêt k ế hàm giá là, đỉnh tương tự cần phải có nhãn gần nhau, tức cạnh (i, i) có trọng SỐ Wij (độ đo tương tự i i) lớn nhãn ỳj ỹ cần phải gần Điều dẫn ta đêh xây dựng hàm giá m+n f(ỷp-ỹm+n) = ^ Z w , j ( ỹ , - ỷ j ) ' ^ i.H N hư vậy, C ầ n tìm (15.20) s a o c h o h mg i áf ( ỷ, , , ỳ ^ ^ J đạt cực tiểu, thòi đỉnh có nhãn ỳị = y i (i = ĩ, , m) H ay nói cách khác, phải giải vâh đ ề tơi ưu có ràng bc sau Ị m +n Tìm m in -ỳj)' ^ ij= l HỌC MÁY 56 Các ràng buộc: ỳ| = yi (i = 1, , m); Khơng khó khăn chứng m inh (bằng cách lấy đạo hàm riêng hàm giá đặt 0), nghiệm vâh đ ề tơì Lai nghiệm hệ (15.11) (15.10) Bây m uốn dẫn vấn đ ề gắn nhãn đỉnh đổ thị v ề vân đ ề tìm cực tiểu hàm giá tổng quát Trên ta đòi hỏi nhãn cần tìm phải trùng khớp với nhãn đỉnh có nhãn: đòi hỏi (15.10) Trong thực tiễn, liệu gắn nhãn (xi, Ỵi) (i = 1, , m) có lỗi, thê'thay cho đòi hỏi phải trùng khớp, ta chi cần ỳị (i = ĩ, , m) gần với yi (i = 1, , m) Các điều kiện (15.10) tuơng đương với điều kiện: ^ ( ỳ - y )^ = Đòi i-1 hỏi gần ỳj yi (i = 1, , m) có nghĩa ta đòi hỏi lượng ^ ( ỳ - y )^cần phải nhỏ Thay cho tìm cực tiểu i=i hàm giá (15.20) với ràng buộc ỳ| = yi (i = 1, , m), tìm cực tiểu hàm giá sau m nj n A Ẽ

Định dạng
Số trang	571
Dung lượng	12,55 MB