nghiên cứu bài toán gom cụm dữ liệu

12 415 1
nghiên cứu bài toán gom cụm dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH BÁO CÁO ĐỀ TÀI SỐ 8: NGHIÊN CỨU BÀI TOÁN GOM CỤM TRONG KHAI PHÁ DỮ LIỆU  FUZZY C-MEANS   !"#$ Châu Vĩnh Tuân 50802429 Phạm Nguyên Trình 50802353 %&'(')&& Bài toán gom cụm *!+,!-+ /(0123 MỤC LỤC Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 2 Bài toán gom cụm *!+,!-+ /(0123 I. LÝ THUYẾT GOM CỤM: 1. Khái niệm gom cụm: 4 #5 62/78#5 9:;$+;<=+%!>?78#2 @!!,7 :;$+A2BC+!<#%##5 :;$+!D2 E#%#BF+G$ - %#BH!I!>4#J @!#5 K!L!"M2+F @!3H !+#N<4BO - %#BH!IG%##5 !?KGP!L!"M2+O =+/Q!#%#RBF!? GQ S7%!$#%##5 S#%# +: ;$+!>4 @!!,7I7A2BC+#%#:;$+GP#EO  T;< @!!,7#%#BU :;$+!>#G4 #5  V;<#%#!,7BU :;$+32+G4 #5   #5 !W   Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 3 Bài toán gom cụm *!+,!-+ /(0123 2. Vai trò của gom cụm: 4 #5 :;$+B2!>X=+2!>*!>4#%#<G42*# - *#O - YP75#:;$+ - Z"A%4![!Q! - 8 ;\*#<*# - Y42 4 #5 :;$+ 2;]#%#!$N# - ^GQ! - _ - ? GQ GQ!=+CR! 3. Một số độ đo trong gom cụm: - Minkowski - Euclidean – p = 2 - Độ đo tương tự: cosin hai vectơ  4. Mục đích của gom cụm: `%#BaBI#A#R!#b2$#4 !< #%#BH !I!>4 @!!,7:;$+GP#EO YP#!+#+c#+<4BU4 #5 :;$+S4 #5 "2<4!+#N[J#+#R7!>4!d!>[ I7O 5. Một số phương pháp gom cụm điển hình: • 4 #5 784]# • 4 #5 78#R7 • 4 #5 "2!> ,!B@ • 4 #5 "2!>; • 4 #5 "2!> P? • 4 #5 #><A+@#  6. Một số mô hình cụm dữ liệu: • e8!%# Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 4 Bài toán gom cụm *!+,!-+ /(0123 • +/ + • fg!a • Z"2!> ,!B@ • 23h Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 5 Bài toán gom cụm *!+,!-+ /(0123 II. FUZZY C-MEANS (FCM): 1. Tìm hiểu Fuzzy C-Means: a. Fuzzy logic: o -+ /4#;< @!?!W#;4##F+%!>aO o VQ-+ /4##!U# @!%!>a#8;\24B@ :2i)S&j b. Tập Fuzzy: o <!,7I7 <#%#7C!k# @! W#B@!< R!Ba o ,7-+ /BI#Bal2;<#m76TS 9S!>4BT;< !,7I7< ;<%n] T  i)S&j  o p7C!kSBI#*;<$3H!< #b2n!>46TS 9O4!,7:+]Tqrn&SOOOSnsS !,7-+ /6TS 9![  BI# P!t32+ r 6n&9un&SOOOS 6n9unsO  6n9q)nGP!+@#6TS 9  6n9q&n4<!4<!+@#6TS 9 c. Fuzzy C-Means: o -+ /(01236-09;< @!7L7%7#b278  #47_7 @!7C:;$+!+@#F24m# F+#5 o [n+/BI#3k5!>4,] + o -0BI#$!"#"2!><  >4B  ;<AR!Gv3H!"#;L&  +w;< W#B@#b2#%#!<#b2n!>4 #5 w  n;<#F+!W#b2:;$+B4(#F+  #w;<!>+!8 #b2#5 GN#!#(#F+  xxyxx<AR!Gv#z!+<4!U$3"H 2+:2:;$+B4 2. Giải thuật: -0BI#!"#$;C;I!!14#%#A# - V#&Y{!]4 2!>,qi+ w jS6)9 Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 6 Bài toán gom cụm *!+,!-+ /(0123 - V#'];C;m7!WG!N!4%_#(!L!>+!8 6G9qi# w j 6G9 - V#|,7,!6G9<6G}&9 - V#~YU !>2 Q+GQ!#2!D2S!2=+2/;]A#'SQ+BE!D2 ES !2GQ!!•#!N!4%O 3. Ưu và nhược điểm: a. Ưu điểm: o +#R7#4GQ!=+!H!R!#4:;$+#g#_4 <!LBH!H!L!+,!!4%Y(0123O o YPHY(0123S:;$+BU +/R!7 !+@#F @!#5 +/R!S{ pBU BI#78<4 #5 "2<4GQ!=+!N!4%< !<S?,/S @!BU #!U!+@#FF+L @!#5 O b. Nhược điểm: o C!$ 3H;I#%##5 O o €#<!R7GQ!=+,BI##<!H!#7N !N!4%#<F+O o Y4#%#•+#;1#%#/Q+!H#LA#!UGP BgBF+O Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 7 Bài toán gom cụm *!+,!-+ /(0123 III. CHƯƠNG TRÌNH MẪU: 1. Hướng dẫn sử dụng phần mềm Fuzzy C-Mean Analyst: a. Yêu cầu hệ thống: o $BF+<‚4ƒ3„uo3!2u`e6|'A!9 o 0%/4…226…o097A&O†!>{; o Z23%#‡;16/+#C+GP!2/B^$!H‡;1 </9 12/05/2011 04:05 PM 71,225 FuzzyCMeanAnalyst.jar 03/03/2011 06:57 AM 9,728 gluegen-rt.dll 03/03/2011 06:57 AM 416,768 jogl_desktop.dll 03/03/2011 06:57 AM 73,216 jogl_es1.dll 03/03/2011 06:57 AM 77,312 jogl_es2.dll 12/05/2011 04:23 PM <DIR> lib 03/03/2011 06:57 AM 10,240 nativewindow_awt.dll 03/03/2011 06:57 AM 36,864 nativewindow_win32.dll 03/03/2011 06:57 AM 41,984 newt.dll ./lib 12/05/2011 04:05 PM 110,455 gluegen-rt.jar 12/05/2011 04:05 PM 2,419,760 jogl.all.jar 12/05/2011 04:05 PM 128,511 nativewindow.all.jar 12/05/2011 04:05 PM 176,393 newt.all.jar b. Hướng dẫn chạy phần mềm: "#$!14#%#A#32+ o Y{B@7C F Aˆ#%##]/‡;1 FuzzyCMeanAnalyst.jar o *‡;17+!Aˆ#%##;#G<4A+!!4Browse Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 8 Bài toán gom cụm *!+,!-+ /(0123 o Q!;,7#%#!P3H6Number of clusters, m value, Random seed, Epsilon9!N#I7  Numberofclusters3H;I#;+3!1> +H78 !N#  mvalue%!>a #b2#P!W#!>4A<!4% -+ /(012  Random311%!>aBU3+ 2!>, A2BC+  EpsilonB@#Nn%##b2!+,! o ;#GA+!!4RunBU!"#$$#!N!4%< P! ? *2 o YQ!=+ o ;#GA+!!4•n74>!BUn+R!>2‡;1Ba]7;2!1n! #%#!P3H#b2!+,!O Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 9 Bài toán gom cụm *!+,!-+ /(0123 o fUn1 ? *2{#?G%#S#!U!"#$ #;#G#+@!<G_4!> <? P7D4m#R #%#7N eSZ‰‚S•-SŠ6Q+GP#!%# 5!?#;#G @!;C; <? P7D<!" $;]!24!%#9O o fUF;]#?A2BC+SRŠ131! Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 10 [...].. .Bài toán gom cụm 2 Kết quả chạy với dữ liệu mẫu: Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 11 Họ giải thuật Fuzzy C-Means Bài toán gom cụm IV Họ giải thuật Fuzzy C-Means TÀI LIỆU THAM KHẢO: - Data Mining: Concepts and Techniques (Second Edition) – Jiawei Han and Micheline Kamber - Fuzzy... Fuzzy Cluster Analysis – John Wiley and Sons - Algorithms for Fuzzy Cluster, Methods in c-Means Clustering with Applications - Sadaaki Miyamoto,Hidetomo Ichihashi, KatsuhiroHonda Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 12 . fUF;]#?A2BC+SRŠ131! Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 10 Bài toán gom cụm *!+,!-+ /(0123 2. Kết quả chạy với dữ liệu mẫu: Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 11 Bài toán gom cụm *!+,!-+. 50802353 %&'(')&& Bài toán gom cụm *!+,!-+ /(0123 MỤC LỤC Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 2 Bài toán gom cụm *!+,!-+ /(0123 I. LÝ THUYẾT GOM CỤM: 1. Khái niệm gom cụm: 4. hình cụm dữ liệu: • e8!%# Báo cáo bài tập lớn bộ môn Khai Phá Dữ Liệu 4 Bài toán gom cụm *!+,!-+ /(0123 • +/ + • fg!a • Z"2!> ,!B@ • 23h Báo cáo bài tập

Ngày đăng: 10/01/2015, 09:46

Từ khóa liên quan

Mục lục

  • I. LÝ THUYẾT GOM CỤM:

    • 1. Khái niệm gom cụm:

    • 2. Vai trò của gom cụm:

    • 3. Một số độ đo trong gom cụm:

    • 4. Mục đích của gom cụm:

    • 5. Một số phương pháp gom cụm điển hình:

    • 6. Một số mô hình cụm dữ liệu:

    • II. FUZZY C-MEANS (FCM):

      • 1. Tìm hiểu Fuzzy C-Means:

      • 2. Giải thuật:

      • 3. Ưu và nhược điểm:

      • III. CHƯƠNG TRÌNH MẪU:

        • 1. Hướng dẫn sử dụng phần mềm Fuzzy C-Mean Analyst:

        • 2. Kết quả chạy với dữ liệu mẫu:

        • IV. TÀI LIỆU THAM KHẢO:

        • Data Mining: Concepts and Techniques (Second Edition) – Jiawei Han and Micheline Kamber

        • Fuzzy Cluster Analysis – John Wiley and Sons

        • Algorithms for Fuzzy Cluster, Methods in c-Means Clustering with Applications - Sadaaki Miyamoto,Hidetomo Ichihashi, KatsuhiroHonda

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan