1. Trang chủ
  2. » Công Nghệ Thông Tin

Phân loại dữ liệu Khai thác dữ liệu data mining

35 1K 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Chương 3: Phân loại liệu Ví dụ Khóa MãSV MơnHọc1 MơnHọc2 … TốtNghiệp 2004 9.0 8.5 2004 6.5 8.0 … Có 2004 4.0 2.5 2004 5.5 3.5 … Có 2004 14 5.0 5.5 … … … … … Không 2005 90 7.0 6.0 2006 24 9.5 7.5 … Không 2007 82 5.5 4.5 2008 47 2.0 3.0 … Có … … … … … … … Có … Có … Không … Không … … Làm xác định liệu sinh viên A tốt nghiệp? Ví dụ Cho trước tập huấn luyện (training set), dẫn mô tả class A class B? Cho trước mẫu/đối tượng mới, xác định class cho mẫu/đối tượng đó? Liệu class có thực phù hợp/đúng cho mẫu/đối tượng đó? Tổng quan phân loại liệu  Phân loại liệu (classification)  Dạng phân tích liệu nhằm rút trích mơ hình mơ tả lớp liệu dự đoán xu hướng liệu  Quá trình gồm hai bước:  Bước học (giai đoạn huấn luyện): xây dựng phân loại (classifier) việc phân tích/học tập huấn luyện  Bước phân loại (classification): phân loại liệu/đối tượng độ xác phân loại đánh giá chấp nhận (acceptable) y = f (X) với y nhãn (phần mô tả) lớp (class) X liệu/đối tượng - Bước học: X tập huấn luyện, trị y cho trước với X  xác định f - Bước phân loại: đánh giá f với (X’, y’) X’ X tập huấn luyện; acceptable dùng f để xác định y’’ cho X’’ (mới) Tổng quan phân loại liệu BBưướớcchpọhcâ/hnulấonạil(uđyáệnnh giá áp dụng) Tổng quan phân loại liệu  Phân loại liệu  Dạng học có giám sát (supervised learning) state X desired Environment response Y Teacher Learning actual + System response-  error signal Tổng quan phân loại liệu  Các giải thuật phân loại liệu  Phân loại với định (decision tree)  Phân loại với mạng Bayesian  Phân loại với mạng neural  Phân loại với k phần tử cận gần (k-nearest neighbor)  Phân loại với suy diễn dựa tình (case- based reasoning)  Phân loại dựa tiến hoá gen (genetic algorithms)  Phân loại với lý thuyết tập thô (rough sets)  Phân loại với lý thuyết tập mờ (fuzzy sets) … Phân loại liệu với định Cơ sở liệu khách hàng AllElectronics dùng cho bước học Phân loại liệu với định  Cây định (decision tree) – mơ hình phân loại  Node nội: phép kiểm thử (test) thuộc tính  Node lá: nhãn/mô tả lớp (class label)  Nhánh từ node nội: kết phép thử thuộc tính tương ứng Cây định học từ CSDL huấn luyện AllElectronics 4.2 Phân loại liệu với định  Giải thuật xây dựng định  ID3, C4.5, CART (Classification and Regression Trees – binary decision trees) 10 ... Tổng quan phân loại liệu  Các giải thuật phân loại liệu  Phân loại với định (decision tree)  Phân loại với mạng Bayesian  Phân loại với mạng neural  Phân loại với k phần tử... tượng đó? Liệu class có thực phù hợp/đúng cho mẫu/đối tượng đó? Tổng quan phân loại liệu  Phân loại liệu (classification)  Dạng phân tích liệu. .. neighbor)  Phân loại với suy diễn dựa tình (case- based reasoning)  Phân loại dựa tiến hoá gen (genetic algorithms)  Phân loại với lý thuyết tập thô (rough sets)  Phân loại với lý

Ngày đăng: 10/02/2017, 07:47

Xem thêm: Phân loại dữ liệu Khai thác dữ liệu data mining

TỪ KHÓA LIÊN QUAN

Mục lục

    Chương 3: Phân loại dữ liệu

    1. Tổng quan về phân loại dữ liệu

    2. Phân loại dữ liệu với cây quyết định

    4.2. Phân loại dữ liệu với cây quyết định

    3. Phân loại dữ liệu với mạng Bayesian

    4. Các phương pháp phân loại dữ liệu khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w