Bài giảng Khai phá dữ liệu: Chương 8 - TS. Võ Thị Ngọc Châu

10 13 1
Bài giảng Khai phá dữ liệu: Chương 8 - TS. Võ Thị Ngọc Châu

Đang tải... (xem toàn văn)

Thông tin tài liệu

Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010..[r]

(1)

1

Ch

Chươươngng 8: 8: ngng ddngng khaikhai pháphá d

d liliuu

Học kỳ – 2011-2012

Khoa

Khoa KhoaKhoa HHọọcc & & KKỹỹ ThuThuậậtt MáyMáy TínhTính Tr

Trưườờngng ĐĐạạii HHọọcc BáchBách KhoaKhoa TpTp HHồồ ChíChí MinhMinh

Cao

Cao HHọọcc NgànhNgành KhoaKhoa HHọọcc MáyMáy TínhTính Giáo

Giáo trìnhtrình đđiiệệnn ttửử

Biên

Biên sosoạạnn bbởởii: TS : TS VõVõ ThThịị NgNgọọcc ChâuChâu (

(2)

Tài liệu tham khảo

‡ [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and

Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006

‡ [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data

Mining”, MIT Press, 2001

‡ [3] David L Olson, Dursun Delen, “Advanced Data Mining

Techniques”, Springer-Verlag, 2008

‡ [4] Graham J Williams, Simeon J Simoff, “Data Mining: Theory,

Methodology, Techniques, and Applications”, Springer-Verlag, 2006

‡ [5] Hillol Kargupta, Jiawei Han, Philip S Yu, Rajeev Motwani, and

Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009

‡ [6] Daniel T Larose, “Data mining methods and models”, John Wiley

& Sons, Inc, 2006

‡ [7] Ian H.Witten, Eibe Frank, “Data mining : practical machine

learning tools and techniques”, Second Edition, Elsevier Inc, 2005

‡ [8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire,

“Successes and new directions in data mining”, IGI Global, 2008

‡ [9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge

(3)

3

Nội dung

‡ Chương 1: Tổng quan về khai phá dữ liệu ‡ Chương 2: Các vấn đề tiền xử lý dữ liệu ‡ Chương 3: Hồi qui dữ liệu

‡ Chương 4: Phân loại dữ liệu ‡ Chương 5: Gom cụm dữ liệu ‡ Chương 6: Luật kết hợp

‡ Chương 7: Khai phá dữ liệu và công nghệ cơ sở

dữ liệu

‡ Chương 8: ng dng khai phá d liu

‡ Chương 9: Các đề tài nghiên cứu khai phá

dữ liệu

(4)

Chương 8: Ứng dụng khai phá dữ liệu

‡ 8.1 Tổng quan về vấn đề phát triển ứng

dụng khai phá dữ liệu

‡ 8.2 Qui trình phát triển ứng dụng khai

phá dữ liệu

‡ 8.3 Các chuẩn dành cho khai phá dữ liệu ‡ 8.4 Các công cụ hỗ trợ phát triển ứng

dụng khai phá dữ liệu

(5)

5

8.1 Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu

‡ Vấn đề dữ liệu

„ Lượng chất lượng dữ liệu „ Kiểu dữ liệu

‡ Vấn đề tri thức từ quá trình khai phá

„ Biểu diễn tích hợp vào ứng dụng

‡ Vấn đề kỹ thuật khai phá

„ Lựa chọn giải thuật khai phá

‡ Vấn đề hiệu quả (effective) hiệu suất

(6)

8.2 Qui trình phát triển ứng dụng khai phá dữ liệu

‡ Qui trình phát triển ứng dụng

‡ Qui trình phát triển ứng dụng khai phá

dữ liệu

(7)

7

8.3 Các chuẩn dành cho khai phá dữ liệu

‡ The Predictive Model Markup Language (PMML

– www.dmg.org)

‡ Standard application programming interfaces

(APIs)

‡ The Cross-Industry Standard Process for Data

Mining (CRISP-DM – www.crisp-dm.org) Nguồn: R L Grossman, M F Hornick, G

Meyer, Data Mining Standards Initiatives,

(8)

8.3 Các chuẩn dành cho khai phá dữ liệu

‡ The Predictive Model Markup Language (PMML

– www.dmg.org)

„ Chuẩn dựa XML

‡ Mơ tả các mơ hình thống kê khai phá dữ liệu, tác

vụ làm sạch biến đổi dữ liệu

„ Các thành phần của PMML

‡ Data dictionary ‡ Mining schema

‡ Transformation dictionary ‡ Model statistics

(9)

9

(10)

Ngày đăng: 09/03/2021, 06:25

Tài liệu cùng người dùng

Tài liệu liên quan