Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 197 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
197
Dung lượng
1,64 MB
Nội dung
SỞ GIÁO DỤC VÀ ĐÀO TẠO HÀ TÂY é TRƯỜ NG THPT PHÚ XUYÊ N B l l GIÁO ÁN TIN HỌC LỚP 11 l l l Năm học 2007-2008 l Biê n soạ n: z p l p Trầ n Ng u yê n Hươ ng e p l c h m p p c -1- Mụ c lụ c k k y Mụ c lụ c y DANH SÁCH HÌNH VẼ l l BẢNG TỪ VIẾT TẮT l TỪ KHOÁ .5 LỜI CẢ M ƠN k k l MỞ ĐẦU é Chươ n g TỔNG QUAN VỀ PHÂN CỤ M TRONG KHAI PHÁ DỮ LIỆU VÀ CÁC KHÁI NIỆ M CƠ BẢN p c l l l l k k l l 1.1 G iớ i th iệ u ch u n g z z v z h h p c 1.2 Kh a i phá l iệ u gì? .10 x z s g y z h y c 1.3 Qú a t rì nh kh a i phá t r i thứ c t ro n g sở l iệ u 10 x v e p o x z s v e z v v e p c l g y z h 1.4 Cá c kỹ th uậ t p dụ n g t ro n g kh a i phá l iệ u 11 o v h v s g p c v e p c o x z s g y z h 1.4.1 Cá c kỹ th uậ t t iếp cậ n t ro n g kh a i phá l iệ u 11 o v h v v z s p v e p c o x z s g y z h 1.4.2 Cá c n g l iệ u kh a i phá 12 g p c g y z h v o x z s 1.5 Ứ n g dụ n g củ a kh a i phá l iệ u 13 p c g p c x o x z s g y z h 1.6 Phâ n cụm l iệ u ứ n g dụ n g 13 p l g y z h i p c g p c 1.6.1 Mụ c đí ch củ a phâ n cụm l iệ u 13 k p 3 x s p l g y z h 1.6.2 Cá c bướ c bả n để phâ n cụm 14 @ 3 @ p p s p l 1.6.3 Cá c loạ i đặ c t rư n g 15 y z p v e p c 1.6.4 Cá c ứ n g dụ n g củ a phâ n cụm .16 p c g p c x s p l 1.6.5 Phâ n loạ i cá c th uậ t toá n phâ n cụm 17 p y z 3 v h v v p s p l 1.7 Cá c i n iệm đị nh n ghĩ a 20 o z p z l i p p p c x 1.7.1 Cá c đị nh n ghĩ a phâ n cụm 20 p p p c x s p l 1.7.2 Cá c độ đo gầ n gũ i 21 p p c p c z Chươ n g CÁC THUẬT TOÁN PHÂN CỤ M TUẦN TỰ 33 p c l l k l 2.1 Số cá c cá ch phâ n cụm 33 3 3 s p l v 2.2 Th uậ t toá n phâ n cụm t uầ n tự - BSAS 34 h v v p s p l v h p v 2.3 Ướ c lượ n g số cụm 36 y p c l l 2.4 Sử a đổ i th uậ t toá n BSAS - Th uậ t toá n MBSAS 37 x p z v h v v p h v v p k -22.5 Th uậ t toá n phâ n cụm t uầ n tự h a i n gưỡ n g - TTSAS 39 h v v p s p l v h p v x z p c p c 2.6 G i a i đoạ n t i nh chế 42 z x z p p v z p Chươ n g CÁC THUẬT TOÁN PHÂN CỤ M PHÂN CẤP 44 p c l l k l 3.1 G iớ i th iệ u 44 z z v z h 3.2 Cá c th uậ t tố n tí ch tụ - GAS 45 v h v v p v v 3.2.1 Mộ t số đị nh n ghĩ a 46 k v l p p p c x 3.2.2 Mộ t số th uậ t tố n tí ch tụ dự a t rê n lý th u yế t m a t rậ n 49 k v l v h v v p v v g x v e p y v h m v l x v e p 3.2.3 Mo no to n i c i t y C ro ssov e r 56 k p v p z z v m i e l l i e e 3.2.4 Mộ t sơ th uậ t tố n tí ch tụ dự a t rê n lý th u yế t đồ thị .59 k v l v h v v p v v g x v e p y v h m v p v 3.2.5 Ả nh hưở n g củ a m a t rậ n gầ n gũ i tớ i sơ đồ phâ n cụm 70 p p c x l x v e p c p c z v z l p s p l 3.3 Cá c th uậ t toá n phâ n rã - GDS .73 v h v v p s p e 3.3.1 Cả i t iế n sơ đồ GDS 76 z v z p l p 3.4 Lự a chọ n phâ n cụm tố t nhấ t .80 x p s p l v v p v Chươ n g CÁC THUẬT TOÁN PHÂN CỤ M QUA TỐI ƯU HOÁ .82 p c l l k 4.1 Tổ n g q u a n tố i u hoá cá c i n iệm bả n 82 p c h x p i v z h i 3 o z p z l @ p 4.1.1 Mộ t số i n iệm t ro n g g iả i tí ch lồ i 82 k v l o z p z l v e p c c z z v y z 4.1.2 Cá c bà i toá n tố i u .84 @ z v p v z h 4.1.3 Mộ t số phươ n g phá p g iả i q u yế t bà i toá n tố i u 86 k v l s p c s s c z z h m v @ z v p v z h 4.2 Bà i toá n phâ n cụm th eo tâm .93 z v p s p l v e v l 4.2.1 Phâ n cụm q u a q u y hoạ ch toá n họ c 93 p l h x h m v p 4.2.2 Phâ n cụm q u a tố i u hoá d c .98 p l h x v z h g Chươ n g PHÂN TÍCH VÀ CÀI ĐẶT THỬ NGHIỆ M .108 p c l é l k 5.1 Cà i đặ t .108 z p v 5.1.1 MBSAS 109 k 5.1.2 TTSAS 109 5.1.3 GAS 110 5.1.4 GDS 111 5.2 Mô phỏ n g cá c cụm 112 k s p c 3 l 5.2.1 S i nh l iệ u khở i tạo th uậ t toá n 113 z p g y z h i o z v v h v v p 5.3 Kế t q uả thử n gh iệm 114 v h v p c z l 5.3.1 Ả nh hưở n g củ a cá c th am số 115 p p c x 3 v x l l KẾT LUẬN 117 l Hướ n g phá t t riể n củ a đề tà i .118 p c s v v e z p x p v z -3- TÀI LIỆU DẪN 119 l PHỤ LỤC: MÃ NGUỒN CỦA MỘT SỐ THUẬT TOÁN 121 k l l k l DANH SÁCH HÌNH VẼ l l Hì nh 1-1 Cá c bướ c thự c h iệ n t ro n g q uá t rì nh kh a i phá t r i thứ c 11 p @ v z p v e p c h v e p o x z s v e z v Hì nh 1-2 Cá c bướ c t ro n g q uá t rì nh phâ n cụm 15 p @ v e p c h v e p s p l Hì nh 1-3 Hì nh n g cá c loạ i cụm 20 p p g p c 3 y z l Hì nh 1-4 Phâ n bố cá c v e c to r rờ i rạ c t rê n lướ i ℓ - ch iề u 25 p p @ 3 i e v e e z e v e p y z z h Hì nh 1-5 Cá c loạ i cụm đạ i d iệ n củ a 30 p y z l i p z g z p x p Hì nh 2-1 Sự phụ th uộ c củ a số cụm đượ c tạo r a số cụm lớ n nhấ t đượ c phé p q 35 p s v h 3 x l l p v e x i l l y p p v p s s Hì nh 2-2 Đồ thị ướ c lượ n g số cụm 37 p é v y p c l l Hì nh 2-3 M i nh hoạ phâ n cụm bằ n g th uậ t toá n MBSAS ( a) bằ n g th uậ t toá n TTSAS ( b) 42 p k z p s p l @ p c v h v v p k x i @ p c v h v v p @ Hì nh 3-1 Sơ đồ phâ n cụm phâ n cấ p vớ i tậ p l iệ u X t ro n g ví dụ 3.2 47 p p s p l s p s i z v s g y z h v e p c i g Hì nh 3-2 M i nh hoạ sơ đồ tươ n g tự khô n g tươ n g tự 48 p k z p l p v p c v i o p c v p c v Hì nh 3-3 Tậ p l iệ u X ( a) Sơ đồ khô n g tươ n g tự s i nh r a bở i th uậ t toá n l iê n kế t n ( b), p s g y z h x i p o p c v p c v l z p e x @ z v h v v p y z p o v p p @ th uậ t toá n l iê n kế t đầ y đủ ( c) .51 v h v v p y z p o v p m p Hì nh 3-4 Sơ đồ khơ n g tươ n g tự s i nh r a bở i th uậ t toá n L iê n kế t n, L iê n kế t đầ y đủ, p p o p c v p c v l z p e x @ z v h v v p z p o v p p z p o v p m p UPG MC WPG MC vớ i h iệ n tượ n g c rossov e r 57 k i k i z z p v p c e l l i e e Hì nh 3-5 M i nh hoạ đườ n g đ i cá c loạ i đồ thị 60 p k z p p p c p z i 3 y z p v Hì nh 3-6 Cá c đồ thị n gưỡ n g đồ thị gầ n gũ i xâ y dự n g từ m a t rậ n khô n g tươ n g tự P(X) p p v p c p c i p v c p c z p m g p c v l x v e p o p c v p c v củ a ví dụ 3.2 61 x i g Hì nh 3-7 Đồ thị vớ i khả nă n g l iê n kế t cạ nh đỉ nh bằ n g bậ c củ a đỉ nh 62 p é v i z o p p c y z p o v p i p p @ p c i @ 3 x p p y Hì nh 3-8 Cá c đồ thị n gưỡ n g củ a m a t rậ n khô n g tươ n g tự P t ro n g ví dụ 3.5 .65 p p v p c p c x l x v e p o p c v p c v v e p c i g Hì nh 3-9 Đồ thị gầ n gũ i G(13) s i nh r a từ m a t rậ n khô n g tươ n g tự P t ro n g ví dụ 3.6 67 p é v c p c z l z p e x v l x v e p o p c v p c v v e p c i g Hì nh 3-10 Cá c sơ đồ phâ n cụm dù n g th uậ t toá n GTAS thoả th uộ c tí nh h( k) củ a ví dụ 3.6 .68 p l p s p l g p c v h v v p v v h v p o x i g Hì nh 3-11 Sơ đồ n gưỡ n g củ a ví dụ 3.6 vớ i th uộ c tí nh bậ c củ a đỉ nh k =3 69 p p p c p c x i g i z v h v p @ 3 x p p o Hì nh 3-12 Câ y kh u n g nhỏ nhấ t củ a m a t rậ n khô n g tươ n g tự ( a) Sơ đồ khô n g tươ n g tự p m o h p c p p v x l x v e p o p c v p c v x i p o p c v p c v tươ n g ứ n g kh i p dụ n g th uậ t toá n dự a t rê n MST ( b) cho t ro n g ví dụ 3.7 70 v p c p c o z s g p c v h v v p g x v e p k @ v e p c i g Hì nh 3-13 Cá c sơ đồ m i nh hoạ cho t rườ n g hợ p m a t rậ n khô n g tươ n g tự có h a i phầ n tử p l p l z p v e p c s l x v e p o p c v p c v x z s p v bằ n g nh a u t ro n g ví dụ 3.8 71 @ p c p x h v e p c i g Hì nh 3-14 Sơ đồ khô n g tươ n g tự đạ t đượ c bở i th uậ t toá n l iê n kế t n ( a) th uậ t toá n l iê n p p o p c v p c v p v p @ z v h v v p y z p o v p p x i v h v v p y z p kế t đầ y đủ ( b) vớ i m a t rậ n P1 72 o v p m p @ i z l x v e p Hì nh 3-15 M i nh hoạ cá c bướ c phâ n cụm củ a sơ đồ GDS 79 p k z p 3 @ s p l x l p Hì nh 3-16 Sơ đồ t ro n g t rườ n g hợ p có h a i cụm chí nh ( a) có cụm d u y nhấ t ( b) t ro n g tậ p p p v e p c v e p c s x z l p x i 3 l g h m p v @ v e p c v s l iệ u .80 g y z h Hì nh 3-17 Ví dụ độ đo “Tự - tươ n g tự” ( a) mô phỏ n g đ iề u k iệ n kế t thú c củ a phươ n g p g s i p p v p c v x i l s p c p z h o z p o v v 3 x s p c phá p II ( b) .81 s @ Hì nh 4-1 Sơ đồ nhá nh cậ n 92 p p p p p Hì nh 4-2 Cá c đườ n g co n g số n g só t đạ i d iệ n cho cụm củ a 194 bệ nh nhâ n u n g thư kh i p p p p c p c l p c l v p z g z p 3 l x @ p p p h p c v o z s dụ n g th uậ t toá n k- M e d i a n 97 g p c v h v v p o k e g z x p Hì nh 4-3 Cá c đườ n g co n g số n g só t đạ i d iệ n cho cụm củ a 194 bệ nh nhâ n u n g thư kh i p p p p c p c l p c l v p z g z p 3 l x @ p p p h p c v o z s dụ n g th uậ t toá n k- M e a n 98 g p c v h v v p o k e x p Hì nh 5-1 Q u a n sá t cụm đượ c tạo r a 113 p h x p l v l p v e x Hì nh 5-2: Mà n hì nh s i nh l iệ u .114 p k p p l z p g y z h Hì nh 5-3 Mà n hì nh th iế t lậ p thơ n g số cho cá c th uậ t toá n .114 p k p p v z v y s v p c l 3 v h v v p Hì nh 5-4 Ý n ghĩ a củ a v iệ c chọ n th am số đú n g đắ n 115 p p c x x i z 3 p v x l l p p c p p Hì nh 5-5 Ý n ghĩ a đú n g đắ n củ a số cụm tạo r a 116 p p c x p p c p p x l l v e x DANH SÁCH BẢNG BIỂU l l Bả n g 3-1 Cá c kế t q uả củ a th uậ t toá n thảo l uậ n kh i p dụ n g m a t rậ n gầ n gũ i củ a ví dụ p c o v h x v h v v p p v y h p o z s g p c l x v e p c p c z x i g 3.4 56 Bả n g 5-1: Thờ i g i a n thự c h iệ n củ a cá c th uậ t toá n vớ i l iệ u c nh a u 115 p c z c z x p v z p x 3 v h v v p i z g y z h o p x h BẢNG TỪ VIẾT TẮT l Từ t iế n g A nh Từ hoặ c cụ m từ 3 l v v BLP p z e v z l e v l e x l p e e p v l x y z x l z y p c c e z v l z h 3 p l y e x v e z v m p k e y z e g c y z e g z x c l h y i e l e e v z i e KDD c z v l h p v c v v p h m p s v p p l v h p l z g y h x z h z l y z Độ đo khô n g tươ n g tự Sơ đồ tí ch tụ tổ n g q uá t é e p o p e x i z l z i e e l p v c v v p v p c v c h v Sơ đồ phâ n rã tổ n g q uá t e p x s e e l e m @ x l e g y c e z v l z s p e p p e v p c h v v x p y e g c e z l i e e m z x LP v z MBSAS x p e x x l e e c e x l l z p z p z z x z e g x v l l v e h z e z z l z 3 e l s p s l l z e h e y x e e z v h g v m e x x p v k z z h l p p e e x z e p v z x y z s v m e z p e p c e c x y l l y y v v e p c l g v h m p v p e v e c e z v m v l z h v l l o h v p x p p c s p l v h p z p p v Sơ đồ th uậ t toá n b iế n đổ i m a t rậ n p v h v v p @ z p p z l x v h e é y e z v l z v p c v Sơ đồ th uậ t toá n t uầ n tự n gưỡ n g g c p p v h v v p v h p v p c p e e z p c x y c e W e i gh t e d P a i r G ro u p M e tho d Av e r a g e Phươ n g phá p t r u n g bì nh th eo cặ p t rọ n g số W e i gh t e d P a i r G ro u p M e tho d C e n t ro i d Phươ n g phá p t rọ n g tâ m th eo cặ p t rọ n g số z e z v e z e v e g e x e v e v e g e h e c s p o s h e e z c p v s e p v e v c e h p c @ p v e z v l l e h e p v z x y y h l v e e z p c x y c e z s v p e p c v l v e h l v e e z p c x y c e z v l l y h l v e e z p c y c e z v s c s v e h p c @ p v e s s v e p c v l v e l l l l z e e x e z x y l x l e g p l v h p O p t im iz a t io n, C l us t e r i n g v i a s v z l z x v z p y h l v e e z p c i z x D.C O p t im iz a t io n, C l us t e r i n g v i a M a th e m a t i c a l P ro g r am m i n g, M a th em a t i c a l s v z l z x v z p y h l v e e z p c i z x k x v e l x v z x y e c e x l l z p c k x v e l x v z P ro g r am m i n g i n d a t a m i n i n g, O p t im iz a t io n G lo b a l, C l us t e r i n g sof tw a r e… e c e x l l z p c z p g x v x l z p z p c s v z l z x v z p y @ x y y h l v e s l s l c v s l s c c p p p g s e c c p v s c p s h p o e e v h g e x z p e e z z e x e e e e g z c e v x i x z p g g c e v g c x i c v e v C l us t e r i n g a l go r i th ms, C l us t e r i n g A l go r i th ms B as e d o n Cos t F u n c t io n y c C l us t e r i n g a l go r i th ms, S eq u e n t i a l C l us t e r i n g a l go r i thm s, H i e r a r ch i c a l v p Độ đo tươ n g tự e TỪ KHOÁ l e Phươ n g phá p t rọ n g tâ m th eo cặ p khô n g chọ n số c g e e k h v U nw e i gh t P a i r G ro u p M e tho d C e n t ro i d k y m Phươ n g phá p t r u n g bì nh th eo cặ p khô n g t rọ n g số z v p k v e e e k WPG MC p l p k y U nw e i gh t e d P a i r G ro u p M e tho d Av e r a g e k WPG MA p e e k e h h Two – Th r esho l d S eq u e n t i a l A l go r i thm i c S ch e m e UPG MC z c S im i l a r i t y M e a s u r e k v Câ y kh u n g nhỏ nhấ t z e UPG MA x p M a t r i x U p d a t i n g A l go r i th m i c S ch e m e TTSAS g M i n im um S p a n n i n g T r e e k k p l e c k SM v Sơ đồ th uậ t toá n phâ n cụm t uầ n tự sở sử a đổ i g y MUAS v Mo d if i e d B as i c S eq u e n t i a l A l go r i th m i c S ch em e k MST @ h v y k p e e k z G r a ph Th eo r y – b a s e d A l go r i th m i c Sơ đồ th uậ t toá n dự a t rê n lý th u yế t S ch e m e đồ thị Kh a i phá t r i thứ c t ro n g sở K now l e d g e D i s cov e r y i n l iệ u D a t a b as e s L i n e a r P ro g r a mm i n g Q u y hoạ ch t u yế n tí nh GTAS k v l p x p e e m v e p z e e e e l e l z z p c h x e e x p e e l e h x e z GDS v Cơ sở l iệ u H iệ u h a i hà m lồ i l x k Từ t iế n g V iệ t p D at a B ase D iff e r e n c e of two Co nv e x f u n c t io ns D i ss i m i l a r i t y M e as u r e G e n e r a l iz e d A g g lo m e r a t i v e S ch e m e G e n e r a l iz e d D iv is i v e S ch e m e x DM GAS c Q u y hoạ ch so n g t u yế n tí nh Sơ đồ th uậ t toá n phâ n cụm t uầ n tự sở z CSDL D.C p B iL i n e a r P ro g r a mm i n g B a s i c S eq u e n t i a l A l go r i th m i c S ch e m e z BSAS z e z p c l v x e e x y v z p s Th a n k yo u fo r ev a l u a ti n g A n yB izSof t PDF S p li tt e r x p o m h e e i x y h x v z p c p m z v s y z v v A w a t e rm a r k is a d d e d a t th e e n d of e a ch o u t p u t PDF f i l e x v e e l x e o z l x g g e g x v v e e p g e x h v s h v z y e To r emov e th e w a t e rm a r k, yo u n e e d to p u r ch as e th e sof tw a r e f rom e e l i e v e x v e e l x e o m h p e e g v s h e x l e v e l v h t t p://www a n y p df too ls com/ b u y/ b u y- p df-s p l i t t e r.h tm l v v s x p m s g v y l l @ h m @ h m s g l s y z v v e e v l y x e e e l e e -7- MỞ ĐẦU k é N gà y n a y, cù n g vớ i phá t t r iể n mạ nh mẽ củ a cô n g n ghệ phầ n n g t r u yề n thô n g, cá c hệ thố n g l iệ u phụ c vụ cho cá c lĩ nh vự c k i nh tế - xã hộ i cũ n g khô n g n gừ n g tă n g lê n, lượ n g l iệ u đượ c tạo r a n gà y cà n g lớ n Sự n g phú l iệ u, thô n g t i n cù n g vớ i khả nă n g kị p thờ i kh a i thá c n g m a n g đế n nhữ n g nă n g s uấ t chấ t lượ n g mớ i cho cô n g tá c q uả n lý, hoạ t độ n g k i nh a nh, …Như n g rồ i cá c yê u cầ u thô n g t i n t ro n g cá c lĩ nh vự c hoạ t độ n g đó, đặ c b iệ t t ro n g lĩ nh vự c r a m q u yế t đị nh, n gà y cà n g đò i hỏ i c ao hơ n, n gườ i q u yế t đị nh khô n g nhữ n g cầ n l iệ u mà cị n cầ n có thêm nh iề u h iể u b iế t, nh iề u t r i thứ c để hỗ t rợ cho v iệ c r a q u yế t đị nh củ a mì nh Cho đế n nhữ n g năm 90 củ a kỷ t rướ c, nh u cầ u khám phá t r i thứ c mớ i thự c bù n g nổ, th eo đó, hà n g loạ t cá c lĩ nh vự c n gh iê n u tổ c cá c kho l iệ u kho thô n g t i n, cá c hệ t rợ g iú p q u yế t đị nh, cá c th uậ t toá n nhậ n n g mẫ u phâ n lớ p mẫ u, …và đặ c b iệ t kh a i phá l iệ u (D a t a M i n i n g) r a đờ i l v e h m c p o p g y c p c o p p 3 h z p y z z h x e z p z p z p p e x p v p c p e p c v p l y l @ z h p h c i i v v p y c p c z l z p h c p c h x v y v i v p z @ v y v p v p e p z z p v i s y p @ v z c z m e p x o e p g h c i p p c p v i p p z c s x z 3 o c v c l c p l p p p p p p v c p p p p s p p z s v @ p p h p v v z e s p y x h p p z 3 p o s z p o i z c y p p p c v p z l p z h p c 3 x y p i m o 3 p c 3 p y p v c 3 x z c x v p g g e s m p l o p c z v 3 v p l o c x c z p l v p i c p p p l p z 3 h l p p z p p z p v p e s y l v h c v h v p m v o i v k z m v v v h v h x x s i v y z g z h h g c y l p y i v g c v h y c s p x l y p i e z p m e h i p p l 3 g i z o p p c y v p c v i c v p h z p e c e p c l p v c c c h c p p y p v p p m v p e x c c h l v p p z p p v c p m h o x m z v s z Từ kh i r a đờ i, kh a i phá l iệ u t rở nh mộ t t ro n g nhữ n g hướ n g n gh iê n u phổ b iế n t ro n g lĩ nh vự c kho a họ c má y tí nh n g n ghệ t r i thứ c Nh iề u kế t q uả n gh iê n u, ứ n g dụ n g củ a kh a i phá l iệ u t ro n g cá c lĩ nh vự c kho a họ c, k i nh tế, xã hộ i Kh a i phá l iệ u b ao hàm nh iề u hướ n g n gh iê n u q u a n t rọ n g, mộ t t ro n g số phâ n cụm l iệ u (D a t a C l us t e r i n g) Phâ n cụm l iệ u q uá t rì nh tìm k iếm phá t h iệ n r a cá c cụm hoặ c cá c mẫ u l iệ u tự nh iê n t ro n g sở l iệ u lớ n Cá c kỹ th uậ t chí nh đượ c p dụ n g t ro n g phâ n cụm l iệ u phầ n lớ n đượ c kế thừ a từ lĩ nh vự c thố n g kê, họ c má y, nhậ n n g, lượ n g hoá, Đế n n a y, có nh iề u ứ n g dụ n g phâ n cụm l iệ u cho v iệ c g iả i q u yế t cá c vấ n đề t ro n g cá c lĩ nh vự c tà i chí nh, thơ n g t i n đị a lý, s i nh họ c, nhậ n n g ả nh,… T ro n g thờ i g i a n gầ n đâ y, t ro n g lĩ nh vự c phâ n cụm l iệ u, n gườ i t a tậ p t r u n g chủ yế u vào n gh iê n u, phâ n tí ch cá c mơ hì nh l iệ u phứ c tạ p l iệ u vă n bả n, W e b, hì nh ả nh,…và đặ c b iệ t mơ hì nh l iệ u hỗ n hợ p để p dụ n g n g t ro n g phâ n cụm l iệ u o p c z l p z h o h o y z v e x v h p p p c h v p @ s c z h l c y z p c x p z p c p p p m h v s v @ y v y 3 p i c v z y p p l p z l y y z z g z e z p p p v c p y h p p v x g g p c z i p z h p c v z y s y p c p v g g g h l l v 3 p m p v y i z h c v p c z z y c z s e p p z p v p p p c c c s c s s p g c z p c g c h p h e 3 c p p z s e p z p e l p y h h v c p v p i l l c v p h h m y g g y p l x h z x g h p s l s p v e z p 3 g y l o l g x v i l v p s h p c v x z l m z @ y x p p h p v p z p l x g v o y e v c z e x l v p p p s c z v x h c p g i p e p p p z p v v g v g h o p o y z s s v i s i h z y l y p h x i g g y p z c l y c p p s z v p p e h h p i p c p p @ c v p e p c h Ở V iệ t N am, t ro n g nhữ n g năm t rở lạ i đâ y, nh u cầ u tự độ n g khám phá t r i thứ c từ cá c l iệ u sẵ n có nhằm tă n g nă n g lự c cạ nh t r a nh củ a cá c n gà nh k i nh tế đ a n g phá t t r iể n nh a nh Vì vậ y, tơ i chọ n hướ n g n gh iê n u " Mộ t số th uậ t toá n phâ n cụm l iệ u t ro n g kh a i phá l iệ u" làm đề tà i n gh iê n u cho l uậ n vă n củ a mì nh L uậ n vă n t rì nh bà y có hệ thố n g mộ t số họ th uậ t toá n phâ n cụm l iệ u đ iể n hì nh, b ao gồm cá c cá ch t iếp cậ n đặ c đ iểm ứ n g dụ n g z v e z v v s z p e z o o x x p l p z v p i c p p y p z e v y p z v p 3 i e e o p v p z v g m z c p p p m x c e v p p l l y p e c p @ z h c s o p y p é e x h p e s v x h v z p x p p p x z c v l x v e @ x v y z y h l g g p p l s l p v v p z p h p p e c p c p o x @ 3 p z v z p z s p y c z p p p c y z i c p y l p z h c l v p p h p m y p v s e g v v v m m l l i p v p p e p c l x v l p h p i c z e p p v c z p z v l p c e p x h z v v c p c p v p h g i x p v l h k p s c v p p p l h o c v o h y s p p l l v h z v p p g p i y p z h Cấ u t rú c nộ i d u n g củ a l uậ n vă n b ao gồm cá c phầ n s a u: h v e p z g h p c x y h p i p @ x c l 3 s p p l x h Chươ n g 1: T rì nh bà y tổ n g q u a n kh a i phá l iệ u, phâ n cụm, cá c th uậ t p c e p @ m v p c h x p i o x z s g y z h s p l 3 v h v toá n phâ n cụm phâ n loạ i t ro n g kh a i phá l iệ u đồ n g thờ i t rì nh bà y cá c i n iệm bả n mộ t số độ đo tươ n g tự, khô n g tươ n g tự… v p p z s p l 3 l @ p i i s l p v y l z p v e p p c v o p x c z s v g o p y c z h v p p c p c v z v e p @ m 3 o z v Chươ n g chươ n g 3: T rì nh bà y cá c th uậ t toá n phâ n cụm t r u yề n thố n g p c i p c e p @ m i 3 v h v v p s p l v e h m p v p c gồm họ cá c th uậ t toá n phâ n cụm t uầ n tự th uậ t toá n phâ n cụm phâ n cấp đ iể n hì nh r a cá c u đ iểm, nhượ c đ iểm củ a n g c l p i v e h x v v p h s p p z l l v p h p p z v l i v x h v p v p s p l s p s p z p c Chươ n g 4: Tậ p t r u n g n gh iê n u g iả i q u yế t bà i toá n cụm th eo tâm dự a p c s v e h p c p c z p h i c z z h m v @ z v p l v e v l g x vào tố i u hố Có h a i cá ch t iế p cậ n đượ c đư a r a phâ n cụm q u a q u y hoạ ch toá n họ c phâ n cụm q u a tố i u hoá d c Để khẳ n g đị nh tí nh h iệ u q uả củ a cá ch t iế p cậ n, l uậ n vă n t rì nh bà y lạ i cá c kế t q uả thí n gh iệm phâ n cụm cá c bệ nh nhâ n u n g thư vú t ro n g sở l iệ u củ a đạ i họ c W is co ns i n Đâ y cá c cô n g t rì nh n gh iê n u củ a GS TSKH Hoà n g T uỵ ( v iệ n Toá n họ c V iệ t N am), GS M a n g as a r i a n ( đạ i họ c W is co ns i n, M a d iso n) cá c cộ n g i v 3 z h i s p y v h p h p i x v 3 i e l p p v c z h e x p 3 v @ l z m g y l p l z p k x g z z l s p h 3 p 3 p z p e p v z x o h z i p é v h i 3 o x c p p g z p z z h y x v l c y c z s p c p p p x p p 3 m v l h z p é z l p s z v l l p x h h 3 m h l y x 3 x @ l k p p c x e c v p p x l p p v p v p x e z z h p c x s c z p p p z l Chươ n g 5: Phâ n tí ch cà i đặ t thử n gh iệm phâ n cụm tậ p l iệ u cá c p i c p v i z p v v p c z l s p l v s g y z h y 3 v e c to r t ro n g khô n g g i a n b a ch iề u sử dụ n g mộ t số th uậ t toá n t iê u b iể u MBSAS, TTSAS, GAS, GDS Chú n g t a đư a r a cá ch cà i đặ t cá c kế t q uả đạ t đượ c e v e v e p c o p c c z x p @ x z h l k p p g c v p x c p l x e v x l v h v z v p p v v i z h @ o z h v p h p v Phầ n kế t l uậ n t rì nh bà y tóm tắ t cá c nộ i d u n g thự c h iệ n t ro n g l uậ n vă n, đồ n g thờ i đư a r a cá c vấ n đề n gh iê n u t iếp cho tươ n g l a i Phầ n phụ lụ c t rì nh bà y mộ t số mo d u l chươ n g t rì nh cà i đặ t cho cá c th uậ t toá n MBSAS, TTSAS, GAS, GDS p p p @ m c v z l o v p v y x l h e p x l v g h e y p @ i m p v p p p c v e l v c z v p p i 3 h z v p v p z s z g h p c v v 3 p v c h y v z x p v z e p p v p c y s h p y i v p e p k Do thờ i g i a n n gh iê n u t rì nh độ có hạ n, l uậ n vă n khơ n g t rá nh khỏ i có nhữ n g hạ n chế th iế u só t Tô i x i n đượ c t iế p th u ý k iế n, đá nh g iá, bảo củ a cá c thầ y g iáo cũ n g cá c bạ n bè đồ n g n gh iệ p Tô i x i n châ n nh cảm n v p p c v p m c z c z z x p i p v p c c z p z h p l h v i z @ p v p @ z e p i p p p 3 p p v c p z p s c v z y h s h p o i z z p p p o p p z p c p c p v e p z o v z @ p l 3 x p Hà Nộ i, thá n g 10 năm 2007 l z v p c p l Họ c v iê n i z p T rầ n N g u yê n Hươ n g e p l c h m p p c