Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 55 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
55
Dung lượng
1,28 MB
Nội dung
Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp Hồ Chí Minh Chương 4: Phân loại liệu Khai phá liệu (Data mining) Nội dung 4.1 Tổng quan phân loại liệu 4.2 Phân loại liệu với định 4.3 Phân loại liệu với mạng Bayesian 4.4 Phân loại liệu với mạng Neural 4.5 Các phương pháp phân loại liệu khác 4.6 Tóm tắt Tài liệu tham khảo [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006 - Classification by Decision Tree Induction (291 -> 306) - Bayesian Classification (310 -> 315) - Classification by Backpropagation ( 327 -> 334) 4.0 Tình Tid Refund Marital Status Taxable Evade Income Yes Single 125K No No Married 100K No No Single 70K No Yes Married 120K No No Divorced 95K Yes No Married No Yes Divorced 220K No No Single 85K Yes No Married 75K No 10 No Single 90K Yes 60K Ông A (Tid = 100) có khả trốn thuế??? 10 4.0 Tình Với thơng tin applicant A, xác định liệu ngân hàng có cho A vay khơng? 4.0 Tình Khóa MãSV MơnHọc1 MơnHọc2 … TốtNghiệp 2004 9.0 8.5 … Có 2004 6.5 8.0 … Có 2004 4.0 2.5 … Không 2004 5.5 3.5 … Không 2004 14 5.0 5.5 … Có … … … … … … 2005 90 7.0 6.0 … Có 2006 24 9.5 7.5 … Có 2007 82 5.5 4.5 … Khơng 2008 47 2.0 3.0 … Không … … … … … … Làm xác định liệu sinh viên A tốt nghiệp? 4.0 Tình … Cho trước tập huấn luyện (training set), dẫn mô tả class A class B? Cho trước mẫu/đối tượng mới, xác định class cho mẫu/đối tượng đó? Liệu class có thực phù hợp/đúng cho mẫu/đối tượng đó? 4.1 Tổng quan phân loại liệu Phân loại liệu (classification) Dạng phân tích liệu nhằm rút trích mơ hình mơ tả lớp liệu dự đoán xu hướng liệu Quá trình gồm hai bước: Bước học (giai đoạn huấn luyện): xây dựng phân loại (classifier) việc phân tích/học tập huấn luyện Bước phân loại (classification): phân loại liệu/đối tượng độ xác phân loại đánh giá chấp nhận (acceptable) y = f (X) với y nhãn (phần mô tả) lớp (class) X liệu/đối tượng - Bước học: X tập huấn luyện, trị y cho trước với X xác định f - Bước phân loại: đánh giá f với (X’, y’) X’ X tập huấn luyện; acceptable dùng f để xác định y’’ cho X’’ (mới) 4.1 Tổng quan phân loại liệu Bước học/huấn luyện Bước phân loại (đánh giá áp dụng) 4.1 Tổng quan phân loại liệu Phân loại liệu Dạng học có giám sát (supervised learning) Environment state X Teacher Learning System desired response Y actual response - + Σ error signal 10