Bài giảng Khai phá dữ liệu: Bài 5 Phân lớp dữ liệu cung cấp cho người học những kiến thức như: Tổng quan; Các phương pháp phân lớp dữ liệu. Mời các bạn cùng tham khảo!
KHAI PHÁ DỮ LIỆU Bài Phân lớp liệu Giáo viên: TS Trần Mạnh Tuấn Bộ môn: Hệ thống thông tin Khoa: Công nghệ thông tin Email: tmtuan@tlu.edu.vn Điện thoai: 0983.668.841 Nội dung • Tổng quan • Các phương pháp phân lớp liệu Tổng quan Tổng quan Tổng quan Tổng quan Tổng quan Phân lớp liệu (Data classification) xếp đối tượng DL vào lớp xác định trước Phân lớp gồm bước: B c : Xây dựng mơ hình B c : Vận hành mơ hình Tổng quan Quy trình phân lớp B1: xây dựng mơ hình Mơ tả tập lớp xác định trước Tập học/huấn luyện: mẫu dành cho xây dựng mơ hình Mỗi mẫu thuộc lớp định nghĩa trước Tìm luật phân lớp, định cơng thức tốn mơ tả lớp B2: Vận hành mơ hình Phân lớp đối tượng chưa biết: Xác định độ xác mơ hình, sử dụng tập liệu kiểm tra độc lập Độ xác chấp nhận -> áp dụng mơ hình để phân lớp mẫu chưa xác định nhãn lớp Tổng quan Tổng quan Một số phương pháp phân lớp Phân lớp định 35 Một số phương pháp phân lớp Phân lớp định 36 Một số phương pháp phân lớp Phân lớp định 37 Một số phương pháp phân lớp Phân lớp định 38 Một số phương pháp phân lớp Phân lớp định 39 Một số phương pháp phân lớp Phân lớp Bayesian 40 Một số phương pháp phân lớp Phân lớp Bayesian Bộ phân lớp Nạve Bayes Cho V1,V2,…,Vm phân hoạch khơng gian mẫu V, Vi lớp Không gian thể X gồm thể mô tả tập thuộc tính A1,A2,…,An Khơng gian thể X tập học Khi với giá trị , phân lớp xuất giá trị hàm phân lớp f(x) Vi 41 Một số phương pháp phân lớp Phân lớp Bayesian Lấy giá trị có xác suất cao VMAP cho thể (MAP - Maximun A Posterior) VMAP = max P(v j | a1 , a2 , , an ) v j V Sử dụng Bayes, ta có: V = max v j V P(v j )P(a1 , a2 , ,an | v j ) P(a1 , a2 , ,an ) = max P(v j )P(a1 , a2 , ,an | v j ) 42 Một số phương pháp phân lớp Phân lớp Bayesian Tính P(vj) cách đếm số lần xuất giá trị đích vj tập học Tính P(a1,a2,…,an):G/S thuộc tính độc lập Xác suất thể quan sát < a1,a2,…,an> lớp vj tích khả thuộc tính riêng biệt vj P(a1 , a2 , ,an | v j ) = i P(ai | v j ) 43 Một số phương pháp phân lớp Phân lớp Bayesian Viết lại công thức (NB - Naive Bayes): Bộ phân lớp Bayes liên quan đến bước học P(vj) P(a1,a2,…,an) tính dựa tập học 44 Một số phương pháp phân lớp Phân lớp KNN 45 Một số phương pháp phân lớp Phân lớp KNN 46 Một số phương pháp phân lớp Phân lớp KNN 47 Một số phương pháp phân lớp Phân lớp KNN 48 Trao đổi, câu hỏi? 49 ... phương pháp phân lớp Phân lớp định 35 Một số phương pháp phân lớp Phân lớp định 36 Một số phương pháp phân lớp Phân lớp định 37 Một số phương pháp phân lớp Phân lớp định 38 Một số phương pháp phân... {P,N} 27 Một số phương pháp phân lớp Thuật toán ID3 28 Một số phương pháp phân lớp Thuật tốn ID3 Tính Entropy cho thuộc tính Thời tiết: E(Thời tiết)= (5/ 14)I(2,3)+(4/14)I(4,0)+ (5/ 14)I(3,2) = 0.694... 44 Một số phương pháp phân lớp Phân lớp KNN 45 Một số phương pháp phân lớp Phân lớp KNN 46 Một số phương pháp phân lớp Phân lớp KNN 47 Một số phương pháp phân lớp Phân lớp KNN 48 Trao đổi, câu