1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

phân cụm và thuật toán k MEAN

19 321 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 19
Dung lượng 74,14 KB

Nội dung

MỤC LỤC LỜI NÓI ĐẦU  ! "#$%&'()*+,-  ./ 0!*12*34 56728 .,9:#0;2<(=* 3%4 5>64)?(/) ' (@0A-B#C! 50?D: C "C E0FGD:"50. <" 80*5:, -H#(E 5<?. , 50CE08IJ)C E0850<50!17,K ! 1*5C" #+50/ 0?)8  D#F +!, L8%8F?14 CM6N NO?"<P0Q  #?10 # 'R#S)!/"1?6 2#4 >6&HT"T)B"U=0HVBT&" +!.9+WX 6-?(.9+KWY6 M8%>Z4 0C6[+<?#:> 65)(/) '(!0" 5#, !1"/"1+>6\#  2#8#10"*C/"1!*, M)5')3:< >6]##2#%)  ':=J"=<"/ 4 , Y>6J(0'"C6"+![?1 >Z:>65:,/"1!* ^\^^<6"<I)5,-1? 0?%554 "C6"+, KMHH"U=0HVBT   PHẦN I. GIỚI THIỆU BÀI TOÁN  BÀI TOÁN 1: PHÂN CỤM  Khái niệm nhiệm vụ của phân cụm.  _"0A`30#/"1 0?2# C "302#I 0[A PY"030'% , PY"<"301<6'% , ,M034 30AX(/)10<)0"" 30"0F2#0? C"2#<65 [, 1.1.2 Một số độ đo phân cụm. 9:30. (10":J"a<(" 2 ",9#"0:% 2 "G 2#, Y"8J"a<6 0  ,b<6  0 ?#0?55J"a"<("2 &G CE, Y?2#c80dGJc5J"aQ0/ ^50%W#<("2 J, N^!I 0[ A  P)J, P)Je, P80WJ, K0W#00 ?4 <6 ,Y"CE4 c W#":04 <6 ,  <(A  94  2#JJ"a"0   <(" A P _("b<f<AgJhe5#%! ', P _("i#Q #.G4 <(" b<f<<eHAgJhe, P _("b   #.G4 <(" b<f<<eBAgJheh, P _(" %+#.G 4 <(" b<f<<AgJhe,  Mục đích của phân cụm. P c"a(4 50"0? 2#<65[, P `30<6% !0!j0(% !!0.7&.,  Một số phương pháp phân cụm điển hình. P `30#^)0?2#[0 >51+, P `30% !0?#50"Q00?, P `30% !#8#% !>2##8: 302#, P `30+30!061305 ,  Nghiên cứu phương pháp phân cụm phân hoạch. P k"A`0302#5CE8< ?2#g<lh0d?:030,  P Y"301!'R#0"a'%  A m Y"030'% , m Y""30<" #<6'%  , P 9G:0Am bd\030, m bd305:0,  Ứng dụng của phân cụm trong một số lĩnh vực. • b <QAc"a"50<"g<"0=<" "a#+%"<"nhE3( j0 a34 6:>65)#<  /('o • k#A`?50?%?% "4 >o • p QAQ;("%"C4 (no • q Qr QA`50"E3(:0" a3%"J8gQh4 <""  #?gQss ho • tttA `#+#g0Q# s ho #+. 7fQg#QfQ#hon  Kiểm định giả thiết. • `'"#+#Q ,  X(E0FF!@0/ ^ 8+(2?8/  ^6*guh#,p+061? W#061"6F!,  X(E#^/ *<6guh , 0JvJQ0%)D%34   "a1,X(E  5A\3* \3*  -8()155$ #"4  ** "a1 5*# <65%" #F ,  ./ 08 A  _OW"5 <6w  Y"5<OW"W <  Y5@+*52 <OW" W4 ""<6w5" <"2 ""5%" #F <6w  k(#/ "8    ,,,,,, ,,,,, ,,,, ,,,,,   ,,,,,,    _ ee ,,ee  #D4 0"a/ "#8* # 64 0d Qx #D4 0"a/ "#8*u #D0dQ  k(' , y%" y?%  D1' k1  '   1 zr  X2 " gxh X2 " gkh '  "  2  , y , D PB PB gPBhJ JgPBh g0PBh 0PB  k`ek`YKPk`KPk`YPk`yy kkyye PhH ek`YK B e H e gThe gUh e e e   !"#"$%&' "(%"$%)*) "+, /&'0'&)#"12"3%&045-&6 "1"78(%"$% 95-:- --"1"7;0<5-&6&#&=5-&6>=5-&6&0% ?4=5-&6@%AB(%"$%9#"C/&'0'& 12"D7%-;< #"C"+"&0=EF>"@F&9""$%=&0 )G"&DAH5"9#"C "1"7 /&'0'& --D7%-7%719 --"1"712"5-:-& IJ#"$%- 2"?+% 5-:- J#"C/&'0'& H"+"&0 K4F>"@F&9" "$% K0 )G" &D 5-&6&#&           5-&6>          L L 5-&6&0% ?4           5-&6>MF L               NN 2"<N=NOM&O'F#"C&0%?46)P--Q%)#"12"5- :- FR""1"7> J#"C&0%?46)P--Q%)#"12"D7%-> S"$%-Q:&&-9 "T5-:-19--D7%-&07> SC""+" S6?+U-" J:& V6-&: KG?4  V4  &0%?4 KW#X H"T--9  = = N= H"T---Y&  = = = H"T--  = =Z NZZZ J"#  =Z =Z Z KG-%  ZN=LZ  K0?+#"X&)P-XBBN=N<BXBBN=N<BXBBN=N< X[<N= XV<= X[V<N=ZZZ 1.2 BÀI TOÁN 2: XÁC ĐỊNH PHẦN TỬ BẤT KỲ THUỘC CỤM.  Các bước thực hiện bài toán: P&"B 5"50[ P Y"G[505j80 ?   8_50[ , P 0 ?  8"A 5#"a1"G, 0 ?a(, _A egeg A ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, P _50)y  oeBH,,,,,,,,,,,,,_ y  e# B x{# H k{# T Y{,,,,,,,,,,{#  NPg# B {# H {,,,,,,,{#  h{# P -8":5"G!, 8&.4 y  , N [...]...- Si > max => cá thể được xếp vào nhóm có hàm phân biệt tuyến lớn nhất  Xếp được nhóm cho cá thể đó PHẦN II PHƯƠNG PHÁP 2.1 BÀI TOÁN 1: SỬ DỤNG THUẬT TOÁN K- MEAN 2.1.1 Khái niệm thuật toán k- mean Phát biểu bài toán: Đầu vào   Tập các đối tượng X = , Số cụm k Đầu ra   Các cụm ( i = 1 k ) tách rời hàm tiêu chuẩn E đạt giá trị tối thiểu Thuật toán hoạt động trên một tập vector d chiều,... liệu không phân cấp không bị chồng chéo dữ liệu lên nhau • Mọi thành viên của một cụm là gần chính cụm đó hơn các cụm khác Nhược điểm của thuật toán • Không có khả năng tìm ra cac cụm không lồi hoặc các cụm có hình • • dạng phức tạp Khó khăn trong việc xác định trọng tâm cụm ban đầu Khó để chọn ra được số lượng cụm tối ưu ngay từ đầu, mà phải qua • • nhiều lần thử để tìm ra số lượng cụm tối ưu... điều kiện dừng Lặp lại các bước 2 3 cho tới khi không có sự thay đổi trong trọng tâm của cụm 2.1.3 Ưu điểm nhược điểm của thuật toán k- mean Ưu điểm thuật toán • Độ phức tạp với một số lần lặp • Có khả năng mở rộng, có thể dễ dàng sửa đổi với những dữ liệu mới • Bảo đảm hội sau một số bước lặp hữu hạn • Luôn có K cụm dữ liệu • Luôn có ít nhất một điểm dữ liệu trong một cũm dữ liệu • Các cụm dữ liệu không... liệu X gồm N phần tử: X=    K- MEAN lặp lại nhiều lần quá trình: o Gán dữ liệu o Cập nhật lại vị trí trọng tâm Quá trình dừng lại khi trọng tâm hội tụ mỗi đối tượng là một bộ phận của một cụm Hàm đo độ tương tự sử dụng khoảng cách Euclidean E= Trong đó là trong tâm của cụm 2.1.2 Các bước của thuật toán k- mean  Bước 1 – khởi tạo Chọn k trọng tâm {}  Bước 2 – tính toán khoảng cách :  Bước 3 – cập... myclafy(X ,k) f0 = Initial(X ,k) ; d=nhom(X,f0); f1=tammoi(X,d ,k) ; er=0; for i =1:1 :k er = er +kc(f0(i,:),f1(i,:)); end while ~(er ==0) f0 = f1; d=nhom(X,f0); f1=tammoi(X,d ,k) ; 16 er=0; for i =1:1 :k er = er +kc(f0(i,:),f1(i,:)); end end y = d; 2.1.5 Giải thích hoạt động của code Trình tự các bước chạy thuật toán :      Hàm compare: kiểm tra phần tử đầu có khác 0 hay bằng 0.Nếu khác không... for j=2:1:n for k = j:1:s(1) if (compare(u(j-1,:),X (k, :)) ==0) u(j,:)=X (k, :); break end end end +khoảng cách.m function y=kc(a,b) u=(a-b); v=size(u); f=0; 13 for i=1:1:v(2) f=f+(u(1,i))^2; end y=sqrt(f); mymin.m( KHOẢNG CÁCH NHỎ NHẤT) function [m,n] = mymin(d) s=size(d); q=s(2); m=d(1); for i=2:1:q if (m>d(i)) m=d(i); end end for i=1:1:q if (d(i) == m) n = i; break end end + nhom.m( PHÂN NHÓM) function... số lượng cụm tối ưu Nhạy cảm với nhiễu phần tử ngoại lai trong dữ liệu Không phải lúc nào mỗi đối tượng chỉ thuộc về một cụm, chỉ phù hợp với đường biên giữa các cụm 2.1.4 Code thuật toán k- mean Compare( HÀM SO SÁNH) function y = compare(x,t) u=x-t; v=size(u); f=0; for i=1:1:v(2) 12 f=f+(u(1,i))^2; end if ~(f==0) y=0; elseif (f==0) y=1; end end + initial.m( KHỞI TẠO) function u = Initial(X,n) u(1,:)... Phần tử thứ 2,6,7: thuộc nhóm 2 Phần tử thứ 3,9 thuộc nhóm 3 Phần tử thứ 4 thuộc nhóm 4 Phần tử thứ 5 ,10 thuộc nhóm 5 18 5 TÀI LIỆU THAM KHẢO       http://en.wikipedia.org/wiki /K- means_clustering http://vi.wikipedia.org/wiki/Học_không_có_giám_sát http://doc.edu.vn http://vnlp.net http://tailieu.vn http://bis.net.vn/forums/t/374.aspx 19 ... nhom(x,f) s=size(f); s1=s(1); 14 t=size(x); t1=t(1); for k= 1:1:t1 for i=1:1:s1 d(1,i)= kc(x (k, :),f(i,:)); [m,n] = mymin(d); y (k) =n; end end + ss.m ( SO SÁNH LẦN THỨ 2) function d=ss(X,f) r=X(1,:)-f(i,:); for i=2:1:n if(kc(r>0) X(1,:)=f(i,:); end end + tammoi.m(XÁC ĐỊNH LẠI TÂM) function y= tammoi(x,d ,k) h= size(d); h1=h(2); h2=size(x); q=h2(2); 15 for j=1:1 :k s=zeros(1,q); n=0; for i=1:1:h1 if(d(1,i)==j) s=s+x(i,:);... myclafy: cho ra k ́t quả các phần tử thuộc nhóm nào 2.5.6 ví dụ minh họa thuật toán Ví dụ minh họa thuật toán Ví dụ minh họa: Nhập từ file exel và chạy code trên matlab ta chia được nhóm cho các phần tử như sau: x= 1 2 1 2 1 1 3 1 1 1 3 2 2 1 3 3 1 1 17 1 1 2 2 2 1 2 2 2 1 1 2 1 2 3 2 1 1 2 1 2 2 2 3 2 2 2 3 2 3 2 2 3 2 3 1 1 1 3 2 2 2 >> myclafy(x,5) ans = 1 2 3 4 5 2 2 5 3 Từ k ́t quả . "C6"+, KMHH"U=0HVBT   PHẦN I. GIỚI THIỆU BÀI TOÁN  BÀI TOÁN 1: PHÂN CỤM  Khái niệm và nhiệm vụ của phân cụm.  _"0A`30#/"1 0?2#. Je|":J)5050)#8 ,  c)50":5, PHẦN II. PHƯƠNG PHÁP 2.1 BÀI TOÁN 1: SỬ DỤNG THUẬT TOÁN K-MEAN 2.1.1 Khái niệm thuật toán k-mean `":"A 9C  ?"ce . ZN=LZ  K0?+#"X&)P-XBBN=N<BXBBN=N<BXBBN=N< X[<N= XV<= X[V<N=ZZZ 1.2 BÀI TOÁN 2: XÁC ĐỊNH PHẦN TỬ BẤT KỲ THUỘC CỤM.  Các bước thực hiện bài toán: P&"B 5"50[

Ngày đăng: 06/05/2014, 09:44

TỪ KHÓA LIÊN QUAN

w