Hiểu các bước trong quá trình khám phá tri thức Mô tả được các khái niệm, công nghệ, và ứng dụng. của khai phá dữ liệu[r]
(1)Khai
Khai pháphá ddữữ liliệệuu (Data mining)
(Data mining)
Cao
Cao HHọọcc NgànhNgành KhoaKhoa HHọọcc MáyMáy TínhTính
Giáo
Giáo trìnhtrình đđiiệệnn ttửử
Biên
Biên sosoạạnn bbởởii: TS : TS VõVõ ThThịị NgNgọọcc ChâuChâu (
(2)2
Khai phá dữ liệu???
Data
Data
Mining
Mining
Information/
(3)Tài liệu tham khảo
[1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and
Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006
[2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data
Mining”, MIT Press, 2001
[3] David L Olson, Dursun Delen, “Advanced Data Mining
Techniques”, Springer-Verlag, 2008
[4] Graham J Williams, Simeon J Simoff, “Data Mining: Theory,
Methodology, Techniques, and Applications”, Springer-Verlag, 2006
[5] Hillol Kargupta, Jiawei Han, Philip S Yu, Rajeev Motwani, and
Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009
[6] Daniel T Larose, “Data mining methods and models”, John Wiley
& Sons, Inc, 2006
[7] Ian H.Witten, Eibe Frank, “Data mining : practical machine
learning tools and techniques”, Second Edition, Elsevier Inc, 2005
[8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire,
“Successes and new directions in data mining”, IGI Global, 2008
[9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge
(4)4
Nội dung
Chương 1: Tổng quan về khai phá dữ liệu Chương 2: Các vấn đề tiền xử lý dữ liệu Chương 3: Hồi qui dữ liệu
Chương 4: Phân loại dữ liệu Chương 5: Gom cụm dữ liệu Chương 6: Luật kết hợp
Chương 7: Khai phá dữ liệu và công nghệ sở
dữ liệu
Chương 8: Ứng dụng khai phá dữ liệu
Chương 9: Các đề tài nghiên cứu khai phá
dữ liệu
(5)Nội dung – Tài liệu tham khảo
Chương 1: Tổng quan khai phá liệu [1, 2, 7, 9] Chương 2: Các vấn đề tiền xử lý liệu [1, 9]
Chương 3: Hồi qui liệu [1-7]
Chương 4: Phân loại liệu [1-7, 9] Chương 5: Gom cụm liệu [1-7, 9] Chương 6: Luật kết hợp [1-7, 9]
Chương 7: Khai phá liệu công nghệ sở
liệu [1, 2]
Chương 8: Ứng dụng khai phá liệu [3, 5, 9]
Chương 9: Các đề tài nghiên cứu khai phá
liệu [5, 8, 9]
(6)6
Nội dung - Lịch học
Chương 1: Tổng quan về khai phá dữ liệu (T.1) Chương 2: Các vấn đề tiền xử lý dữ liệu (T.2-3) Chương 3: Hồi qui dữ liệu (T.4-5)
Chương 4: Phân loại dữ liệu (T.6-7) Chương 5: Gom cụm dữ liệu (T.8-9) Chương 6: Luật kết hợp (T.10-11)
Chương 7: Khai phá dữ liệu và công nghệ sở
dữ liệu (T.12)
Chương 8: Ứng dụng khai phá dữ liệu (T.13) Chương 9: Các đề tài nghiên cứu khai phá
dữ liệu (T.14)
(7)KPDL – Lĩnh vực liên ngành
Phân tích - thiết kế giải thuật (algorithm design
and analysis)
Quản lý dữ liệu (data management)
Truy hồi thông tin (information retrieval) Máy học (machine learning)
Thống kê (statistics)
(8)8
Hiểu biết - Kỹ năng đạt được
Hiểu bước trình khám phá tri thức Mô tả khái niệm, công nghệ, ứng dụng
của khai phá liệu
Giải thích tác vụ khai phá liệu phổ biến
như hồi qui, phân loại, gom cụm, khai phá luật kết hợp
Nhận dạng vấn đề liệu giai
đoạn tiền xử lý cho tác vụ khai phá liệu
Hiểu cách sử dụng khai phá liệu để có
quyết định tốt
Sử dụng giải thuật công cụ khai phá
liệu để phát triển ứng dụng khai phá liệu
Được chuẩn bị kiến thức để nghiên cứu
(9)Đánh giá kết quả học tập
Tiểu luận: 30% Kiểm tra: 20% Thi cuối kỳ: 50%
Ỉ Đạt: 30%*Tiểu luận + 20%*Kiểm tra +
(10)10
Hình thức đánh giá kết quả học tập
Tiểu luận: 30%
Nội dung báo cáo: 15% Nội dung trình bày: +5% Nội dung sản phẩm: 15%
Kiểm tra: 20%
kiểm tra vào tuần 6, 13
10%/bài, 10 câu trắc nghiệm/bài/20 phút, 1đ/câu
Thi cuối kỳ: 50%