Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010..[r]
(1)1
Ch
Ch
ươ
ươ
ng
ng
8:
8:
Ứ
Ứ
ng
ng
d
d
ụ
ụ
ng
ng
khai
khai
phá
phá
d
ữ
d
ữ
li
li
ệ
ệ
u
u
Học kỳ – 2011-2012
Khoa
Khoa KhoaKhoa HHọọcc & & KKỹỹ ThuThuậậtt MáyMáy TínhTính Tr
Trưườờngng ĐĐạạii HHọọcc BáchBách KhoaKhoa TpTp HHồồ ChíChí MinhMinh
Cao
Cao
H
H
ọ
ọ
c
c
Ngành
Ngành
Khoa
Khoa
H
H
ọ
ọ
c
c
Máy
Máy
Tính
Tính
Giáo
Giáo
trình
trình
đ
đ
i
i
ệ
ệ
n
n
t
t
ử
ử
Biên
Biên
so
so
ạ
ạ
n
n
b
b
ở
ở
i
i
: TS
: TS
Võ
Võ
Th
Th
ị
ị
Ng
Ng
ọ
ọ
c
c
Châu
Châu
(
(2)Tài li
ệ
u tham kh
ả
o
[1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and
Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006
[2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data
Mining”, MIT Press, 2001
[3] David L Olson, Dursun Delen, “Advanced Data Mining
Techniques”, Springer-Verlag, 2008
[4] Graham J Williams, Simeon J Simoff, “Data Mining: Theory,
Methodology, Techniques, and Applications”, Springer-Verlag, 2006
[5] Hillol Kargupta, Jiawei Han, Philip S Yu, Rajeev Motwani, and
Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009
[6] Daniel T Larose, “Data mining methods and models”, John Wiley
& Sons, Inc, 2006
[7] Ian H.Witten, Eibe Frank, “Data mining : practical machine
learning tools and techniques”, Second Edition, Elsevier Inc, 2005
[8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire,
“Successes and new directions in data mining”, IGI Global, 2008
[9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge
(3)3
N
ộ
i dung
Ch
ươ
ng 1: T
ổ
ng quan v
ề
khai phá d
ữ
li
ệ
u
Ch
ươ
ng 2: Các v
ấ
n
đề
ti
ề
n x
ử
lý d
ữ
li
ệ
u
Ch
ươ
ng 3: H
ồ
i qui d
ữ
li
ệ
u
Ch
ươ
ng 4: Phân lo
ạ
i d
ữ
li
ệ
u
Ch
ươ
ng 5: Gom c
ụ
m d
ữ
li
ệ
u
Ch
ươ
ng 6: Lu
ậ
t k
ế
t h
ợ
p
Ch
ươ
ng 7: Khai phá d
ữ
li
ệ
u v
à công ngh
ệ
c
ơ
s
ở
d
ữ
li
ệ
u
Ch
ươ
ng 8:
Ứ
ng d
ụ
ng
khai phá d
ữ
li
ệ
u
Ch
ươ
ng 9: Các
đề
tài nghiên c
ứ
u khai phá
d
ữ
li
ệ
u
(4)Ch
ươ
ng 8:
Ứ
ng d
ụ
ng khai phá d
ữ
li
ệ
u
8.1 T
ổ
ng quan v
ề
v
ấ
n
đề
phát tri
ể
n
ứ
ng
d
ụ
ng khai phá d
ữ
li
ệ
u
8.2 Qui trình phát tri
ể
n
ứ
ng d
ụ
ng khai
phá d
ữ
li
ệ
u
8.3 Các chu
ẩ
n dành cho khai phá d
ữ
li
ệ
u
8.4 Các công c
ụ
h
ỗ
tr
ợ
phát tri
ể
n
ứ
ng
d
ụ
ng khai phá d
ữ
li
ệ
u
(5)5
8.1 T
ổ
ng quan v
ề
v
ấ
n
đề
phát tri
ể
n
ứ
ng
d
ụ
ng khai phá d
ữ
li
ệ
u
Vấn
đề
dữ
liệu
L
ượ
ng ch
ấ
t l
ượ
ng d
ữ
li
ệ
u
Ki
ể
u d
ữ
li
ệ
u
Vấn
đề
tri thức từ
quá trình khai phá
Bi
ể
u di
ễ
n tích h
ợ
p vào
ứ
ng d
ụ
ng
Vấn
đề
kỹ
thuật khai phá
L
ự
a ch
ọ
n gi
ả
i thu
ậ
t khai phá
Vấn
đề
hiệu quả
(effective) hiệu suất
(6)8.2 Qui trình phát tri
ể
n
ứ
ng d
ụ
ng khai
phá d
ữ
li
ệ
u
Qui trình phát tri
ể
n
ứ
ng d
ụ
ng
Qui trình phát tri
ể
n
ứ
ng d
ụ
ng khai phá
d
ữ
li
ệ
u
(7)7
8.3 Các chu
ẩ
n dành cho khai phá d
ữ
li
ệ
u
The Predictive Model Markup Language (PMML
– www.dmg.org)
Standard application programming interfaces
(APIs)
The Cross-Industry Standard Process for Data
Mining (CRISP-DM – www.crisp-dm.org)
Nguồn: R L Grossman, M F Hornick, G
Meyer, Data Mining Standards Initiatives,
(8)8.3 Các chu
ẩ
n dành cho khai phá d
ữ
li
ệ
u
The Predictive Model Markup Language (PMML
– www.dmg.org)
Chu
ẩ
n d
ự
a XML
Mơ t
ả
các mơ hình th
ố
ng kê khai phá d
ữ
li
ệ
u, tác
v
ụ
làm s
ạ
ch bi
ế
n
đổ
i d
ữ
li
ệ
u
Các thành ph
ầ
n c
ủ
a PMML
Data dictionary
Mining schema
Transformation dictionary
Model statistics
(9)9
(10)