Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 19 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
19
Dung lượng
74,14 KB
Nội dung
MỤC LỤC LỜI NÓI ĐẦU ! "#$%&'()*+,- ./ 0!*12*34 56728 .,9:#0;2<(=* 3%4 5>64)?(/) ' (@0A-B#C! 50?D: C "C E0FGD:"50. <" 80*5:, -H#(E 5<?. , 50CE08IJ)C E0850<50!17,K ! 1*5C" #+50/ 0?)8 D#F +!, L8%8F?14 CM6N NO?"<P0Q #?10 # 'R#S)!/"1?6 2#4 >6&HT"T)B"U=0HVBT&" +!.9+WX 6-?(.9+KWY6 M8%>Z4 0C6[+<?#:> 65)(/) '(!0" 5#, !1"/"1+>6\# 2#8#10"*C/"1!*, M)5')3:< >6]##2#%) ':=J"=<"/ 4 , Y>6J(0'"C6"+![?1 >Z:>65:,/"1!* ^\^^<6"<I)5,-1? 0?%554 "C6"+, KMHH"U=0HVBT PHẦN I. GIỚI THIỆU BÀI TOÁN BÀI TOÁN 1: PHÂNCỤM Khái niệm và nhiệm vụ của phân cụm. _"0A`30#/"1 0?2# C "302#I 0[A PY"030'% , PY"<"301<6'% , ,M034 30AX(/)10<)0"" 30"0F2#0? C"2#<65 [, 1.1.2 Một số độ đo phân cụm. 9:30. (10":J"a<(" 2 ",9#"0:% 2 "G 2#, Y"8J"a<6 0 ,b<6 0 ?#0?55J"a"<("2 &G CE, Y?2#c80dGJc5J"aQ0/ ^50%W#<("2 J, N^!I 0[ A P)J, P)Je, P80WJ, K0W#00 ?4 <6 ,Y"CE4 c W#":04 <6 , <(A 94 2#JJ"a"0 <(" A P _("b<f<AgJhe5#%! ', P _("i#Q #.G4 <(" b<f<<eHAgJhe, P _("b #.G4 <(" b<f<<eBAgJheh, P _(" %+#.G 4 <(" b<f<<AgJhe, Mục đích của phân cụm. P c"a(4 50"0? 2#<65[, P `30<6% !0!j0(% !!0.7&., Một số phương pháp phâncụm điển hình. P `30#^)0?2#[0 >51+, P `30% !0?#50"Q00?, P `30% !#8#% !>2##8: 302#, P `30+30!061305 , Nghiên cứu phương pháp phâncụmphân hoạch. P k"A`0302#5CE8< ?2#g<lh0d?:030, P Y"301!'R#0"a'% A m Y"030'% , m Y""30<" #<6'% , P 9G:0Am bd\030, m bd305:0, Ứng dụng của phâncụm trong một số lĩnh vực. • b <QAc"a"50<"g<"0=<" "a#+%"<"nhE3( j0 a34 6:>65)#< /('o • k#A`?50?%?% "4 >o • p QAQ;("%"C4 (no • q Qr QA`50"E3(:0" a3%"J8gQh4 <"" #?gQss ho • tttA `#+#g0Q# s ho #+. 7fQg#QfQ#hon Kiểm định giả thiết. • `'"#+#Q , X(E0FF!@0/ ^ 8+(2?8/ ^6*guh#,p+061? W#061"6F!, X(E#^/ *<6guh , 0JvJQ0%)D%34 "a1,X(E 5A\3* \3* -8()155$ #"4 ** "a1 5*# <65%" #F , ./ 08 A _OW"5 <6w Y"5<OW"W < Y5@+*52 <OW" W4 ""<6w5" <"2 ""5%" #F <6w k(#/ "8 ,,,,,, ,,,,, ,,,, ,,,,, ,,,,,, _ ee ,,ee #D4 0"a/ "#8* # 64 0d Qx #D4 0"a/ "#8*u #D0dQ k(' , y%" y?% D1' k1 ' 1 zr X2 " gxh X2 " gkh ' " 2 , y , D PB PB gPBhJ JgPBh g0PBh 0PB k`ek`YKPk`KPk`YPk`yy kkyye PhH ek`YK B e H e gThe gUh e e e !"#"$%&' "(%"$%)*) "+, /&'0'&)#"12"3%&045-&6 "1"78(%"$% 95-:- --"1"7;0<5-&6&#&=5-&6>=5-&6&0% ?4=5-&6@%AB(%"$%9#"C/&'0'& 12"D7%-;< #"C"+"&0=EF>"@F&9""$%=&0 )G"&DAH5"9#"C "1"7 /&'0'& --D7%-7%719 --"1"712"5-:-& IJ#"$%- 2"?+% 5-:- J#"C/&'0'& H"+"&0 K4F>"@F&9" "$% K0 )G" &D 5-&6&#& 5-&6> L L 5-&6&0% ?4 5-&6>MF L NN 2"<N=NOM&O'F#"C&0%?46)P--Q%)#"12"5- :- FR""1"7> J#"C&0%?46)P--Q%)#"12"D7%-> S"$%-Q:&&-9 "T5-:-19--D7%-&07> SC""+" S6?+U-" J:& V6-&: KG?4 V4 &0%?4 KW#X H"T--9 = = N= H"T---Y& = = = H"T-- = =Z NZZZ J"# =Z =Z Z KG-% ZN=LZ K0?+#"X&)P-XBBN=N<BXBBN=N<BXBBN=N< X[<N= XV<= X[V<N=ZZZ 1.2 BÀI TOÁN 2: XÁC ĐỊNH PHẦN TỬ BẤT KỲ THUỘC CỤM. Các bước thực hiện bài toán: P&"B 5"50[ P Y"G[505j80 ? 8_50[ , P 0 ? 8"A 5#"a1"G, 0 ?a(, _A egeg A ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, P _50)y oeBH,,,,,,,,,,,,,_ y e# B x{# H k{# T Y{,,,,,,,,,,{# NPg# B {# H {,,,,,,,{# h{# P -8":5"G!, 8&.4 y , N [...]...- Si > max => cá thể được xếp vào nhóm có hàm phân biệt tuyến lớn nhất Xếp được nhóm cho cá thể đó PHẦN II PHƯƠNG PHÁP 2.1 BÀI TOÁN 1: SỬ DỤNG THUẬTTOÁN K- MEAN 2.1.1 Khái niệm thuậttoán k- mean Phát biểu bài toán: Đầu vào Tập các đối tượng X = , Số cụmk Đầu ra Các cụm ( i = 1 k ) tách rời và hàm tiêu chuẩn E đạt giá trị tối thiểu Thuậttoán hoạt động trên một tập vector d chiều,... liệu không phân cấp và không bị chồng chéo dữ liệu lên nhau • Mọi thành viên của một cụm là gần chính cụm đó hơn các cụm khác Nhược điểm của thuậttoán • Không có khả năng tìm ra cac cụm không lồi hoặc các cụm có hình • • dạng phức tạp Khó khăn trong việc xác định trọng tâm cụm ban đầu Khó để chọn ra được số lượng cụm tối ưu ngay từ đầu, mà phải qua • • nhiều lần thử để tìm ra số lượng cụm tối ưu... điều kiện dừng Lặp lại các bước 2 và 3 cho tới khi không có sự thay đổi trong trọng tâm của cụm 2.1.3 Ưu điểm nhược điểm của thuậttoán k- mean Ưu điểm thuật toán • Độ phức tạp với một số lần lặp • Có khả năng mở rộng, có thể dễ dàng sửa đổi với những dữ liệu mới • Bảo đảm hội sau một số bước lặp hữu hạn • Luôn có Kcụm dữ liệu • Luôn có ít nhất một điểm dữ liệu trong một cũm dữ liệu • Các cụm dữ liệu không... liệu X gồm N phần tử: X= K- MEAN lặp lại nhiều lần quá trình: o Gán dữ liệu o Cập nhật lại vị trí trọng tâm Quá trình dừng lại khi trọng tâm hội tụ và mỗi đối tượng là một bộ phận của một cụm Hàm đo độ tương tự sử dụng khoảng cách Euclidean E= Trong đó là trong tâm của cụm 2.1.2 Các bước của thuật toán k- mean Bước 1 – khởi tạo Chọn k trọng tâm {} Bước 2 – tính toán khoảng cách : Bước 3 – cập... myclafy(X ,k) f0 = Initial(X ,k) ; d=nhom(X,f0); f1=tammoi(X,d ,k) ; er=0; for i =1:1 :k er = er +kc(f0(i,:),f1(i,:)); end while ~(er ==0) f0 = f1; d=nhom(X,f0); f1=tammoi(X,d ,k) ; 16 er=0; for i =1:1 :k er = er +kc(f0(i,:),f1(i,:)); end end y = d; 2.1.5 Giải thích hoạt động của code Trình tự các bước chạy thuật toán : Hàm compare: kiểm tra phần tử đầu có khác 0 hay bằng 0.Nếu khác không... for j=2:1:n for k = j:1:s(1) if (compare(u(j-1,:),X (k, :)) ==0) u(j,:)=X (k, :); break end end end +khoảng cách.m function y=kc(a,b) u=(a-b); v=size(u); f=0; 13 for i=1:1:v(2) f=f+(u(1,i))^2; end y=sqrt(f); mymin.m( KHOẢNG CÁCH NHỎ NHẤT) function [m,n] = mymin(d) s=size(d); q=s(2); m=d(1); for i=2:1:q if (m>d(i)) m=d(i); end end for i=1:1:q if (d(i) == m) n = i; break end end + nhom.m( PHÂN NHÓM) function... số lượng cụm tối ưu Nhạy cảm với nhiễu vàphần tử ngoại lai trong dữ liệu Không phải lúc nào mỗi đối tượng chỉ thuộc về một cụm, chỉ phù hợp với đường biên giữa các cụm 2.1.4 Code thuật toán k- mean Compare( HÀM SO SÁNH) function y = compare(x,t) u=x-t; v=size(u); f=0; for i=1:1:v(2) 12 f=f+(u(1,i))^2; end if ~(f==0) y=0; elseif (f==0) y=1; end end + initial.m( KHỞI TẠO) function u = Initial(X,n) u(1,:)... Phần tử thứ 2,6,7: thuộc nhóm 2 Phần tử thứ 3,9 thuộc nhóm 3 Phần tử thứ 4 thuộc nhóm 4 Phần tử thứ 5 ,10 thuộc nhóm 5 18 5 TÀI LIỆU THAM KHẢO http://en.wikipedia.org/wiki /K- means_clustering http://vi.wikipedia.org/wiki/Học_không_có_giám_sát http://doc.edu.vn http://vnlp.net http://tailieu.vn http://bis.net.vn/forums/t/374.aspx 19 ... nhom(x,f) s=size(f); s1=s(1); 14 t=size(x); t1=t(1); for k= 1:1:t1 for i=1:1:s1 d(1,i)= kc(x (k, :),f(i,:)); [m,n] = mymin(d); y (k) =n; end end + ss.m ( SO SÁNH LẦN THỨ 2) function d=ss(X,f) r=X(1,:)-f(i,:); for i=2:1:n if(kc(r>0) X(1,:)=f(i,:); end end + tammoi.m(XÁC ĐỊNH LẠI TÂM) function y= tammoi(x,d ,k) h= size(d); h1=h(2); h2=size(x); q=h2(2); 15 for j=1:1 :k s=zeros(1,q); n=0; for i=1:1:h1 if(d(1,i)==j) s=s+x(i,:);... myclafy: cho ra k ́t quả các phần tử thuộc nhóm nào 2.5.6 ví dụ minh họa thuật toán Ví dụ minh họa thuật toán Ví dụ minh họa: Nhập từ file exel và chạy code trên matlab ta chia được nhóm cho các phần tử như sau: x= 1 2 1 2 1 1 3 1 1 1 3 2 2 1 3 3 1 1 17 1 1 2 2 2 1 2 2 2 1 1 2 1 2 3 2 1 1 2 1 2 2 2 3 2 2 2 3 2 3 2 2 3 2 3 1 1 1 3 2 2 2 >> myclafy(x,5) ans = 1 2 3 4 5 2 2 5 3 Từ k ́t quả . "C6"+, KMHH"U=0HVBT PHẦN I. GIỚI THIỆU BÀI TOÁN BÀI TOÁN 1: PHÂN CỤM Khái niệm và nhiệm vụ của phân cụm. _"0A`30#/"1 0?2#. Je|":J)5050)#8 , c)50":5, PHẦN II. PHƯƠNG PHÁP 2.1 BÀI TOÁN 1: SỬ DỤNG THUẬT TOÁN K-MEAN 2.1.1 Khái niệm thuật toán k-mean `":"A 9C ?"ce . ZN=LZ K0?+#"X&)P-XBBN=N<BXBBN=N<BXBBN=N< X[<N= XV<= X[V<N=ZZZ 1.2 BÀI TOÁN 2: XÁC ĐỊNH PHẦN TỬ BẤT KỲ THUỘC CỤM. Các bước thực hiện bài toán: P&"B 5"50[