1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Học máy: Bài 7 - Nguyễn Hoàng Long

87 32 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Bài giảng Học máy - Bài 7: Học máy không giám sát cung cấp cho người học các kiến thức: Phân tích cụm, phương pháp phân cấp, thuật toán K-means, khởi tạo tâm cụm, phân đoạn, nén ảnh,... Mời các bạn cùng tham khảo nội dung chi tiết.

Học máy không giám sát Nguyễn Thanh Tùng Khoa Công nghệ thông tin – Đại học Thủy Lợi tungnt@tlu.edu.vn Website mơn học: https://sites.google.com/a/wru.vn/cse445fall2016/ Bài giảng có sử dụng hình vẽ sách “An Introduction to Statistical Learning with Applications in R” với cho phép tác giả, có sử dụng slides khóa học CME250 ĐH Stanford IOM530 ĐH Southern California CSE 445: Học máy | Học kỳ 1, 2016-2017 Học máy không giám sát • Học khơng giám sát: tập cơng cụ thống kê xử lý liệu có biến đầu vào, khơng có biến đích – Ta có X’s mà khơng có nhãn Y – Mục tiêu: phát mẫu/các đặc tính liệu • vd trực quan hóa diễn giải liệu nhiều chiều CSE 445: Học máy | Học kỳ 1, 2016-2017 Học có giám sát vs khơng giám sát Học máy có giám sát: X Y biết Học máy khơng giám sát: biết X Học có giám sát Học không giám sát CSE 445: Học máy | Học kỳ 1, 2016-2017 Học không giám sát • Ví dụ ứng dụng: – Biết mơ ung thư n bệnh nhân bị ung thư vú, cần xác định nhóm nhỏ (subtypes) chưa biết gây nên ung thư vú – Các thí nghiệm biểu diễn Gen chứa hàng ngàn biến Figure1.3, ESL CSE 445: Học máy | Học kỳ 1, 2016-2017 Học không giám sát • Ví dụ ứng dụng: – Cho tập tài liệu văn bản, cần xác định tập tài liệu có chung chủ đề thể thao, trị, ca nhạc, – Cho ảnh khn mặt có số chiều cao, tìm biểu diễn đơn giản/thu gọn ảnh để đưa vào phân lớp nhận dạng khuôn mặt CSE 445: Học máy | Học kỳ 1, 2016-2017 (AT&T Laboratories Cambridge) Học không giám sát • Tại học khơng giám sát ln thách thức lớn? – Phân tích khám phá liệu (Exploratory data analysis) – mục tiêu không định nghĩa rõ ràng – Khó đánh giá hiệu – khơng biết đáp án (“right answer” unknown) – Xử lý liệu với số chiều lớn CSE 445: Học máy | Học kỳ 1, 2016-2017 Học không giám sát • Hai cách tiếp cận: – Phân tích cụm (Cluster analysis) • Xác định nhóm mẫu đồng (có đặc tính chung) – Giảm chiều liệu (Dimensionality Reduction) • Tìm cách biểu diễn với số chiều thấp dựa tính chất trực quan hóa liệu CSE 445: Học máy | Học kỳ 1, 2016-2017 Phân tích cụm & K means CSE 445: Học máy | Học kỳ 1, 2016-2017 Phân cụm • Phân cụm: tập phương pháp nhằm tìm nhóm liệu – Các mẫu có đặc điểm chung nhóm khác với mẫu ngồi nhóm – Việc gom nhóm phân tích cấu trúc liệu nội tại, điều khác với phân lớp CSE 445: Học máy | Học kỳ 1, 2016-2017 ... CSE 445: Học máy | Học kỳ 1, 201 6-2 0 17 Học có giám sát vs khơng giám sát Học máy có giám sát: X Y biết Học máy không giám sát: biết X Học có giám sát Học khơng giám sát CSE 445: Học máy | Học kỳ... chiều thấp dựa tính chất trực quan hóa liệu CSE 445: Học máy | Học kỳ 1, 201 6-2 0 17 Phân tích cụm & K means CSE 445: Học máy | Học kỳ 1, 201 6-2 0 17 Phân cụm • Phân cụm: tập phương pháp nhằm tìm nhóm... ảnh để đưa vào phân lớp nhận dạng khuôn mặt CSE 445: Học máy | Học kỳ 1, 201 6-2 0 17 (AT&T Laboratories Cambridge) Học khơng giám sát • Tại học khơng giám sát ln thách thức lớn? – Phân tích khám

Ngày đăng: 26/10/2020, 15:56

Xem thêm:

TỪ KHÓA LIÊN QUAN