Hình ảnh demo

Một phần của tài liệu Báo cáo thực tập khai phá dữ liệu bằng cây quyết định và ứng dụng (Trang 40 - 45)

41

42

Hình 3. 3 Tiến hành cắt tỉa cây

43

Hình 3. 5 Rút ra luật từ cây quyết định

44

KẾT LUẬN

Những nghiên cứu về khai phá dữ liệu và ứng dụng trong nhiều lĩnh vực khác nhau nhằm khai thác nguồn dữ liệu phong phú đƣợc lƣu trữ trong các hệ thống thông tin. Khai phá dữ liệu cũng đƣợc áp dụng nhiều trong việc tƣ vấn, dự báo , giáo dục.

Trong khuôn khổ khóa luận tốt nghiệp này, em đã nghiên cứu, phân tích, đánh giá các thuật toán phân lớp dữ liệu dựa trên cây quyết định. Tiêu biểu là các thuật toán CLS, ID3 và C4.5. Các thuật toán này có cách thức lƣu trữ dữ liệu và xây dựng cây quyết định dựa trên những độ đo khác nhau. Do đó các thuật toán này có phạm vi ứng dụng vào các cơ sở dữ liệu có kích thƣớc khác nhau.

C4.5 là thuật toán xửlý đầy đủ các vấn đề của quá trình phân lớp dữ liệu: lựa chọn thuộc tính tốt nhất, lƣu trữ phân chia dữ liệu, xử lý giá trị thiếu, tránh quá vừa, cắt tỉa cây,…Với những lý do đó C4.5 đã trở thành thuật toán phổ biến nhất trong những ứng dụng vừa và nhỏ. Quá trình triển khai, cài đặt thử nghiệm cùng với các đánh giá hiệu năng mô hình phân lớp C4.5 đã đƣợc tiến hành. Và đã thu đƣợc nhiều kết quả có ý nghĩa thực tiến, cũng nhƣ các kết quả gợi mở những hƣớng nghiên cứu tiếp theo.

45

TÀI LIỆU THAM KHẢO

[1]. Anurag Srivastava, Eui- Hong Han, Vipin Kumar, Vieet Singh. Parallel

Formulations of Decision-Tree Classification Algorithm. Kluwer Academic Publisher,

1999.

[2]. Anurag Srivastava, Vineet Singh, Eui- Hong (Sam) Han, Vipin Kumar. An Efficient, Scalable, Parallel Classifier for Data mining.

[3]. Ron Kohavi, J. Ross Quinlan. Decision Tree Discovery, 1999.

[4]. Vanden Berghen Frank (2003), C4.5 – Classification Tree, Universit Libre de bruxelles.

[5]. Vũ Tiến Thành –Lƣu Công Tố - Thuật toán cây quyết định C4.5.

[6]. Huỳnh Trâm Võ - Học liệu mở Việt Nam - Tiếp cận ký hiệu: Giải thuật quy nạp cây quyết định ID3.

[7]. Lê Văn Dực (2006), Hệ hỗ trợ ra quyết định, NXB Đại học Quốc gia TP Hồ Chí Minh.

[8]. Khoa khoa học & Kỹ thuật máy tính - Slide & bài giảng Data mining – Trƣờng Đại học quốc gia TP Hồ Chí Minh.

[9]. http://vi.wikipedia.org/wiki/Khai_phá_dữ_liệu tháng 3/2013.

[10]. Cây quyết định - http://vi.wikipedia.org/wiki/Cây_quyết_định tháng 3/2013. [11]. http://en.wikipedia.org/wiki/C4.5_algorithm tháng 3/2013.

Một phần của tài liệu Báo cáo thực tập khai phá dữ liệu bằng cây quyết định và ứng dụng (Trang 40 - 45)

Tải bản đầy đủ (PDF)

(45 trang)