Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 134 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
134
Dung lượng
7,04 MB
Nội dung
!"# $%&' &!(#!! )&*+#,-#(# ! /0 1#%&' 23240"21 56!0!"1 # 7#8 799:99;< !=> 7?@ABCDAE?F G?HI 7thanhauco@gmail.com #& 7JK ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT !"#$#%$# &'&(&)$#%*!+#!", %- ./#%&0#%1.2&1.34&!#% 5,$67#.8#%1.2&09$)3&$&.:1 2 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT ;$<=7 S !"#$%&'()*+,-.$,-/( 0,.1'%234567,..189:; .<=<:5>14 ?!48@:'%,-A..1 B!CDEF"GHFI,-J2 KL7!M"NC'8O:' 8+P,7Q"0=!R'+S-9N:8:(7 $M<MA(1:PT":5UO! ',L ,1T :+%-P(1"<1:JA' 2=<2TCC4'%!,-.!V*$:5W+.S, 01 ,/(C<!/X.11!,- "$''%!1,+!30'+:Y30! .BYZZ[Y\??Z?1ZUI5 Y30!.$,-4 !X,+4"+ LW]'!301,/K'+'^14) ,-4T,5_,+(7=(81Y. BZU`ZUI P,a,-..bD.cdZeO *.!V*!5f=V4"+$!0! .L%C#=!'8$,-.-b+5], ',-: '87C0(C8!( 75W801 0&1 CN0+!30,gY. :hJLBciIhJ'Bc?1c?j1I5 _<MX'L@A@LML'NAOC$1L4+ ?'(1" <'ML1Y?dkUS1"'L]?5UOgMTO!: !& ,!"(C?'$O'LY?dkU UL1,-B ?CD P@>?Q?R@LIM%JLh??BMPCM>SP@LI?TTHUMPIP<4: ,lcc? 0L!S."1 #=#@'m cTTML?'8M1S1"/XY.S1"/Xa ?',/8,hJL. hJ'. 'L]?Y?` dkU5hTn+O,/85] ?')8M1!"(C '!L1,/88CL!L%+ !5 oJ1 ?')#X'/J"NAOC ,$0J'1L. !"C/MCP?''7pY.q5 3 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT rJ'/s #VHLAAWLAX99YZ:9Z 4 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT 5& 5 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT Zj]6Utccuc>vWwx>>y> G5 Yh>> Y' z5 YhZe YhZ.e {5 cdZe c/X. |5 c]>> c E5 hcZe hJ'. n5 dWU dW?U? }5 j]] ji]?]?\! ~5 _U• _?U• €5 dkU d?•`k‚U _C*V GH5 kcf kc?f? ]0L!S( 6 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT Zj]6Utccuc6ƒ]6Uw]66„j 3#.>?>o8Yh>> 3#.>?@o8YhZe 3#.>?Ac:4+YhZe 3#.@?>raSJL. 3#.@?@l>0.cJ1(1"< 3#.@?Al !"" #$% &'%()*+(,-#./0%"1.2 .31. 3#.A?>lUC.1-,-J{' 3#.A?@lc",-J'J= 3#.A?Alc=PJ= 3#.A?Blc'':, 3#.B?>lU8'L]? 3#.B?@lU%/7 3#.B?Ald4!"/ 3#.B?BlU8'%/JL 3#.B?Cl…*<L'1 3#.B?DlUL/{+ 3#.B?ElU%L'L/ 3#.B?Flc=P'L6i? 3#.B?Glc=P_jU 3#.B?>Hlc=P=1'L/ 3#.B?>>l67:'B???I 3#.B?>@l67!:'B•???I 3#.B?>Ald/*=P(87 3#.B?>BlUL{+1,- 3#.C?>lZ5>?Y?[c^'LY?dkU 7 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT 3#.C?@lU8'L/Y? 3#.C?Ald/*!(8=1'L/Y? 3#.C?BlU8dkU 3#.C?ClcTaJ0U_• 3#.C?DlcbLM!bJ0 3#.D?>l†'LdkU/C+?T 3#.D?@ld??,/8‡???dkU 3#.D?AlULY?dkU+g1M" 3#.D?Bld??,/8Y?dkU 3#.D?Clc,/80L."gdkU 3#.D?Dl_ˆ!S‡?'0E#}#? 3#.D?Eld??,/8kcfdkU 3#.D?Fld??,/8cc?Y?dkU 3#.D?Gl†'L1,-‰'#=#@' 3#.D?>Hld??,/8j#' 3#.D?>>l_%JLh??/C 3#.D?>@lU8h?? 3#.D?>Ald??,/8h??ci? 3#.E?>lc,/8dkU!L1+?! 3#.E?@lc,/8Y?dkU!L1+! 3#.E?AlY"(C0L!S!kcfdkU 3#.E?BlW!"(C!L1,/8cc?+'! 3#.E?ClW!"(C!L1,/8Šj#'+i?'?! +'L! 3#.E?DlW!"(C!L1,/8h??ci?+'Q! 8 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT 9 ĐẠI HỌC QUỐC GIA TPHCM CHƯƠNG TRÌNH THẠC SĨ CNTT G [97\#.$$%#$&]!^ 1.1 (^#.#&! ]"9 a1bMC=!7a 8. 4''%'+4 :!' !.5 >, P,'%‹M O!S1p ,-q+'%S:!,-a'%,/8,+'%L=<5cM ,,-a45 #?':,.$,-LMATaD OL P7+'O,'%/MC.56.7,-#?', 2- M*'!'(.P $,-0 !' O 45]:! :,-.X'%D,- V(5 Y'1cdZe'%(180M"'QO' 8.+2&lhJ2 V- - !Cb:,-5 Y.'%M,+(8!' *'0!. 14g,+'%(<(C2=0,-‰''QO' 8.5]:! '4Y.‰'!"''QO'8* LcdZe,;!,-+.5 10 [...]... Phân cụm ràng buộc: Nhiều ứng dụng thực tế có thể cần thực hiện phân cụm dưới các loại ràng buộc khác nhau Một nhiệm vụ đặt ra là đi tìm những nhóm dữ liệu có trạng thái phân cụm tốt và thỏa mãn các ràng buộc Dễ hiểu và dễ sử dụng: Người sử dụng có thể chờ đợi những kết quả phân cụm dễ hiểu, dễ lý giải và dễ sử dụng Nghĩa là, sự phân cụm có thể cần được giải thích ý nghĩa và ứng dụng rõ ràng Với những... theo quy tắc và các chiến lược thống kê tinh vi khác Thay đổi dữ liệu và tri thức: Thay đổi nhanh chóng dữ liệu (động) có thể làm cho các mẫu được phát hiện trước đó không còn hợp lệ Thêm vào đó, các biến đã đo trong một cơ sở dữ liệu ứng dụng cho trước có thể bị sửa đổi, xoá bỏ hay tăng thêm các phép đo mới Các giải pháp hợp lý bao gồm các phương pháp tăng trưởng để cập nhật các mẫu và xử lý thay... THẠC SĨ CNTT Hiện nay, các phương pháp phân cụm trên đã và đang được phát triển và áp dụng nhiều trong các lĩnh vực khác nhau và đã có một số nhánh nghiên cứu được phát triển trên cơ sở của các phương pháp đó như: Phân cụm thống kê: Dựa trên các khái niệm phân tích hệ thống, nhánh nghiên cứu này sử dụng các độ đo tương tự để phân hoạch các đối tượng, nhưng chúng chỉ áp dụng cho các dữ liệu có thuộc tính... liệu này Khám phá các cụm với hình dạng bất kỳ: Nhiều thuật toán phân cụm xác định các cụm dựa trên các phép đo khoảng cách Euclidean và khoảng cách Manhattan Các thuật toán dựa trên các phép đo như vậy hướng tới việc tìm kiếm các cụm hình cầu với mật độ và kích cỡ tương tự nhau Tuy nhiên, một cụm có thể có bất cứ một hình dạng nào Do đó, việc phát triển các thuật toán có thể khám phá ra các cụm có hình... áp dụng cho dữ liệu hạng mục, chúng phân cụm các đối tượng theo các khái niệm mà chúng xử lí Phân cụm mờ: Sử đụng kỹ thuật mờ để PCDL Các thuật toán thuộc loại này chỉ ra lược đồ phân cụm thích hợp với tất cả các hoạt động đời sống hàng ngày, chúng chỉ xử lí các dữ liệu thực không chắc chắn Phân cụm mạng Kohonen: Loại phân cụm này dựa trên khái niệm của các mạng nơron Mạng Kohonen có tầng nơron vào và. .. thu hút được khá nhiều nhà nghiên cứu nhờ vào những ứng dụng thực tiễn của nó Sau đây là một số lĩnh vực ứng dụng thực tế điển hình của KPDL: - Phân tích dữ liệu và hỗ trợ ra quyết định - Phân lớp văn bản, tóm tắt văn bản, phân lớp các trang Web và phân cụm ảnh màu - Chuẩn đoán triệu chứng, phương pháp trong điều trị y học - Tìm kiếm, đối sánh các hệ Gene và thông tin di truyền trong sinh học - Phân... trường: Các thuộc tính hay các giá trị có cấu trúc phân cấp, các quan hệ giữa các thuộc tính và các phương tiện tinh vi hơn cho việc biểu diễn tri thức về nội dung của một cơ sở dữ liệu sẽ đòi hỏi các giải thuật phải có khả năng sử dụng hiệu quả các thông tin này Về mặt lịch sử, các giải thuật khai phá dữ liệu được phát triển cho các bản ghi có giá trị thuộc tính đơn giản, mặc dầu các kỹ thuật mới bắt nguồn... CHƯƠNG TRÌNH THẠC SĨ CNTT 3.4 NHỮNG KỸ THUẬT TIẾP CẬN TRONG PHÂN CỤM DỮ LIỆU Các kỹ thuật phân cụm có rất nhiều cách tiếp cận và các ứng dụng trong thực tế, nó đều hướng tới hai mục tiêu chung đó là chất lượng của các cụm khám phá được và tốc độ thực hiện của thuật toán Hiện nay, các kỹ thuật phân cụm có thể phân loại theo các cách tiếp cận chính sau : 3.4.1 Phương pháp phân cụm phân hoạch Kỹ thuật này... ra dữ liệu và tri thức Người dùng tương tác và tri thức sẵn có: Nhiều phương pháp KDD hiện hành và các công cụ không tương tác thực sự với người dùng và không thể dễ dàng kết hợp chặt chẽ với tri thức có sẵn về một bài toán loại trừ theo các cách đơn giản Việc sử dụng của miền tri thức là quan trọng trong toàn bộ các bước của xử lý KDD Tích hợp với các hệ thống khác: Một hệ thống phát hiện ứng một mình... đề khó và mở, vì phải giải quyết nhiều vấn đề cơ bản một cách trọn vẹn và phù hợp với nhiều dạng dữ liệu khác nhau, đặc biệt là đối với dữ liệu hỗn hợp đang ngày càng tăng trong các hệ quản trị dữ liệu và đây cũng là một trong những thách thức lớn trong lĩnh vực KPDL 3.2 CÁC ỨNG DỤNG CỦA PHÂN CỤM DỮ LIỆU Phân cụm dữ liệu có thể được ứng dụng trong nhiều lĩnh vực như: Thương mại: Tìm kiếm nhóm các khách