Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010..[r]
(1)1
Ch
Chươươngng 8: 8: ỨỨngng ddụụngng khaikhai pháphá dữ
dữ liliệệuu
Học kỳ – 2011-2012
Khoa
Khoa KhoaKhoa HHọọcc & & KKỹỹ ThuThuậậtt MáyMáy TínhTính Tr
Trưườờngng ĐĐạạii HHọọcc BáchBách KhoaKhoa TpTp HHồồ ChíChí MinhMinh
Cao
Cao HHọọcc NgànhNgành KhoaKhoa HHọọcc MáyMáy TínhTính Giáo
Giáo trìnhtrình đđiiệệnn ttửử
Biên
Biên sosoạạnn bbởởii: TS : TS VõVõ ThThịị NgNgọọcc ChâuChâu (
(2)Tài liệu tham khảo
[1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and
Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006
[2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data
Mining”, MIT Press, 2001
[3] David L Olson, Dursun Delen, “Advanced Data Mining
Techniques”, Springer-Verlag, 2008
[4] Graham J Williams, Simeon J Simoff, “Data Mining: Theory,
Methodology, Techniques, and Applications”, Springer-Verlag, 2006
[5] Hillol Kargupta, Jiawei Han, Philip S Yu, Rajeev Motwani, and
Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009
[6] Daniel T Larose, “Data mining methods and models”, John Wiley
& Sons, Inc, 2006
[7] Ian H.Witten, Eibe Frank, “Data mining : practical machine
learning tools and techniques”, Second Edition, Elsevier Inc, 2005
[8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire,
“Successes and new directions in data mining”, IGI Global, 2008
[9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge
(3)3
Nội dung
Chương 1: Tổng quan về khai phá dữ liệu Chương 2: Các vấn đề tiền xử lý dữ liệu Chương 3: Hồi qui dữ liệu
Chương 4: Phân loại dữ liệu Chương 5: Gom cụm dữ liệu Chương 6: Luật kết hợp
Chương 7: Khai phá dữ liệu và công nghệ cơ sở
dữ liệu
Chương 8: Ứng dụng khai phá dữ liệu
Chương 9: Các đề tài nghiên cứu khai phá
dữ liệu
(4)Chương 8: Ứng dụng khai phá dữ liệu
8.1 Tổng quan về vấn đề phát triển ứng
dụng khai phá dữ liệu
8.2 Qui trình phát triển ứng dụng khai
phá dữ liệu
8.3 Các chuẩn dành cho khai phá dữ liệu 8.4 Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
(5)5
8.1 Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu
Vấn đề dữ liệu
Lượng chất lượng dữ liệu Kiểu dữ liệu
Vấn đề tri thức từ quá trình khai phá
Biểu diễn tích hợp vào ứng dụng
Vấn đề kỹ thuật khai phá
Lựa chọn giải thuật khai phá
Vấn đề hiệu quả (effective) hiệu suất
(6)8.2 Qui trình phát triển ứng dụng khai phá dữ liệu
Qui trình phát triển ứng dụng
Qui trình phát triển ứng dụng khai phá
dữ liệu
(7)7
8.3 Các chuẩn dành cho khai phá dữ liệu
The Predictive Model Markup Language (PMML
– www.dmg.org)
Standard application programming interfaces
(APIs)
The Cross-Industry Standard Process for Data
Mining (CRISP-DM – www.crisp-dm.org) Nguồn: R L Grossman, M F Hornick, G
Meyer, Data Mining Standards Initiatives,
(8)8.3 Các chuẩn dành cho khai phá dữ liệu
The Predictive Model Markup Language (PMML
– www.dmg.org)
Chuẩn dựa XML
Mơ tả các mơ hình thống kê khai phá dữ liệu, tác
vụ làm sạch biến đổi dữ liệu
Các thành phần của PMML
Data dictionary Mining schema
Transformation dictionary Model statistics
(9)9
(10)