Chỉ số Jaccard là một chỉ số trong thống kê dùng để so sánh độ giống nhau và sự đa dạng giữa các bộ mẫu. Trong bài báo này chúng tôi đề xuất một độ đo tương tự mới giữa các tập mờ bức tranh dựa trên chỉ số Jaccard. Sau đó chúng tôi đưa ra một số ví dụ cho thấy độ đo tương tự mới đã khắc phục được những hạn chế của các độ đo tương tự đã có. Cuối cùng chúng tôi sử dụng độ đo tương tự mới vào bài toán phân cụm dữ liệu.
Vietnam J Agri Sci 2019, Vol 17, No 5: 386-396 Tạp chí Khoa học Nơng nghiệp Việt Nam 2019, 17(5): 386-396 www.vnua.edu.vn ĐỘ ĐO TƯƠNG TỰ MỚI TRÊN CÁC TẬP MỜ BỨC TRANH VÀ ỨNG DỤNG TRONG PHÂN CỤM DỮ LIỆU Lê Thị Diệu Thùy*, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ Khoa Công nghệ thông tin, Học viện Nông Nghiệp Việt Nam * Tác giả liên hệ: ltdthuy@vnua.edu.vn Ngày chấp nhận đăng: 26.08.2019 Ngày nhận bài: 08.07.2019 TÓM TẮT Chỉ số Jaccard số thống kê dùng để so sánh độ giống đa dạng mẫu Trong báo đề xuất độ đo tương tự tập mờ tranh dựa số Jaccard Sau chúng tơi đưa số ví dụ cho thấy độ đo tương tự khắc phục hạn chế độ đo tương tự có Cuối chúng tơi sử dụng độ đo tương tự vào toán phân cụm liệu Từ khóa: Tập mờ tranh, độ đo tương tự, toán phân cụm A New Similarity Measure of Picture Fuzzy Sets and Its Application to Data Clustering ABSTRACT The Jaccard index is a statistic used for comparing the similarity and diversity of sample sets In this paper, we proposed a new similarity measure for picture fuzzy sets based on the Jaccard index We then compared the proposed similarity measure with some existing similarity measures and showed that the new similarity measure overcomes the restrictions of the existing similarity measures Finally, we used this new similarity measure for the data clustering problem Keywords: Picture fuzzy set, similarity measure, fuzzy clustering ĐẶT VẤN ĐỀ Zadel (1965) læn đæu tiờn ỵa khỏi nim v lý thuyt v tờp m thụng qua bi bỏo Fuzzy Set ỵc ởng trờn täp chí Information and Control, mć đỉu cho să phát triển Āng dýng cûa lý thuyết Ngày lý thuyết têp mą vén không ngÿng phát triển v ó ỵc ng dýng nhiu lùnh vc nghiờn cu nhỵ lý thuyt iu khin, trớ tu nhõn tọo, khai phá dĂ liệu,„ Đðnh nghïa têp mą cûa Zadel sā dýng hàm thuộc để mô tâ cho mĀc độ cûa phæn tā thuộc têp Atanasov (1986) mć rộng khái niệm têp mą bìng khái niệm têp mą trăc câm (Intuitionistic fuzzy sets), hàm thuộc, ông sā dýng thêm hàm không thuộc để biểu thð độ khơng thuộc cûa phỉn tā vào tờp hp Bựi Cụng Cỵng (2014) gii thiu khỏi nim têp 386 mą bĀc tranh vĆi ba hàm thành viên hàm thuộc khỵng đðnh, hàm thuộc phû đðnh hàm thuộc trung lêp Về cĄ bân, lý thuyết mą bĀc tranh phù hợp vĆi tình vỗn cú nhiu cõu trõ li, ũ lý thuyết têp mą têp mą trăc câm không giâi quyt ỵc Chợng họn cỏc tỡnh tng hp ý kin cỷa mi ngỵi v mt vỗn đị cị cåu trâ ląi cĄ bân: có, khơng, khụng bit v khụng ỵa cồu trõ li Bổu c l mt vớ dý in hỡnh, ngỵi bú phiu ỵc phõn lm bn nhúm: ỷng h, phõn i, bú phiếu tríng phiếu khơng hợp lệ khơng bó phiếu Hiện lý thuyết têp mą bĀc tranh v ang ỵc cỏc nh nghiờn cu tip týc tỡm hiểu, khai thác có nhiều Āng dýng thăc tiễn Phäm Huy Thơng & Lê Hồng SĄn (2014) phát triển mơ hình lai mĆi giĂa têp mą bĀc tranh têp mą Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ trăc câm để chuèn đoán y tế Āng dýng vào hệ thống chëm sịc sĀc khóe Nguyễn Đình Hịa & cs (2014) xuỗt phỵng phỏp mi d bỏo thi tit tÿ hình ânh vệ tinh bìng cách sā dýng kết hợp phân cým mą bĀc tranh hồi quy Phäm Hồng Phong & cs (2014) kiểm tra số tớnh chỗt cỷa phộp hp thnh quan h m bc tranh v xuỗt mt cỏch tip cờn mi chn đốn y khoa bìng cách sā dýng phép hợp thnh quan h m bc tranh Bựi Cụng Cỵng v Phäm Vën Hâi (2015) nghiên cĀu toán tā logic m Phọm Vởn Vit & cs (2015) ó ỵa hệ thống suy luên mą bĀc tranh dăa vào biểu thnh viờn Singh (2015) xuỗt h s tỵng quan cho têp mą bĀc tranh Āng dýng hệ s tỵng quan vo bi toỏn phõn cým m bc tranh Lê Hoàng SĄn (2015) giĆi thiệu số thuêt toán phân cým mą bĀc tranh Āng dýng dă báo thąi tiết, dă báo chuỗi thąi gian Nguyễn Xuõn Thõo & Nguyn Vởn nh (2015) ỵa khỏi niệm têp mą bĀc tranh - thô nghiên cĀu cỗu trỳc tụ pụ cỷa tờp m bc tranh - thô Nguyễn Vën Đðnh & cs (2015) nghiên cĀu cĄ sć dĂ liệu mą bĀc tranh Lê Hoàng SĄn (2016) ỵa o khoõng cỏch tng quỏt cho têp mą bĀc tranh Āng dýng phân cým Nguyn ỡnh Hũa & cs (2017) ỵa mt số câi tiến cho tht tốn phân cým mą bìng cách sā dýng têp mą bĀc tranh Āng dýng phân cým dĂ liệu đða lý Phäm huy Thơng (2016; 2017) cị nhiều nghiên cĀu phân cým dĂ liệu mą bĀc tranh Garg (2017) trình bày số toán tā tổng hợp mą bĀc tranh Āng dýng đðnh đa tiêu chí Lê Hồng Sn & cs (2017) ó xuỗt h thng suy luên mĆi têp mą bĀc tranh Lê Hoàng SĄn (2017) ỵa cỏc o mi trờn cỏc tờp m bĀc tranh, đị độ đo không cách tổng quát độ đo kết hợp bĀc tranh Peng & Dai (2017) xuỗt o khoõng cỏch mi cho cỏc tờp m bc tranh v ỵa thuờt tốn cho tốn đðnh đa tiêu chí mą bĀc tranh dăa độ đo Nguyễn Vën nh & Nguyn Xuõn Thõo (2018) xuỗt cỏc o khoõng cỏch, o khụng tỵng t trờn tờp mą bĀc tranh Āng dýng đðnh đa tiờu Phọm Th Minh Phỵng & cs (2018) nghiờn cĀu cĄ sć lý thuyết cho thuêt toán phân cým m bc tranh Zeng & cs (2019) xuỗt đo phån kỳ mü Jensen cho têp mą bĀc tranh Āng dýng đðnh đa tiêu chí„ o tỵng t l mt cụng cý hu ớch xỏc nh s ging gia hai i tỵng Nhiu o tỵng t khỏc trờn cỏc tờp m trc cõm ó ỵc nghiờn cu, nhỵ cỏc nghiờn cĀu cûa Szmidt & Kacorhot (2000), Li & Cheng (2002), Dengfeng (2002), Mitchell (2003), Liu (2005), Szmidt (2005), Hung & Yang (2007), Xu & Xia (2010), Ye (2011, 2012), Shi & Ye (2013), Tian (2013), Szmidt (2014), Ye (2016), SĄn & Phong (2016), Wei (2017),„ Trên têp mą bĀc tranh cỹng ó cũ mt s o tỵng t ỵc xuỗt v ng dýng cỏc bi toỏn khỏc Wei (2017, 2018) xuỗt mt s o tỵng t cho tờp m bc tranh v ng dýng toán đðnh Joshi & Kumar (2018) ỵa o tỵng t cho tờp m bc tranh da trờn chợ s Dice Wei (2018) ỵa mt s o tỵng t Dice tng quỏt Tuy nhiên độ đo vén số họn ch, nhng họn ch ũ s ỵc chợ ć phỉn cûa báo Chỵ số Jaccard chỵ số thống kê dùng để so sánh să giống să đa däng cûa méu Dăa vào chỵ số gỉn đåy, Hwang & cs (2018) ó ỵa mt s o tỵng t mi têp mą trăc câm Trên cĄ sć đò, chúng tụi mun nghiờn cu xuỗt o tỵng t mĆi têp mą bĀc tranh dăa chỵ số Jaccard Āng dýng độ đo toán phân cým PHƯƠNG PHÁP NGHIÊN CỨU Trong báo ny chỳng tụi s dýng phỵng phỏp nghiờn cu lý thuyt, phỵng phỏp phõn tớch v tng hp lý thuyt thông qua tài liệu têp mą, têp mą bc tranh, o tỵng t trờn tờp m bc tranh, tht tốn phân cým dĂ liệu Chúng tơi nghiờn cu cỏc o tỵng t ó cũ trờn tờp m bc tranh, phõn tớch ỵu nhỵc im cỷa chỳng, t ũ xuỗt o tỵng t mi têp mą bĀc tranh dăa chỵ số Jaccard tính tốn vĆi ví dý để so sánh độ đo mĆi vĆi độ đo cò Sau đị chúng tơi xây dăng tht tốn phân cým cho tờp m bc tranh da ma trờn kt hp tỵng ỵng v ỏp dýng o mi vo thuờt toỏn 387 Độ đo tương tự tập mờ tranh ứng dụng phân cụm liu Dỵi ồy l cỏc khỏi nim c bõn v tờp m bc tranh, o tỵng t trờn tờp mą bĀc tranh chỵ số Jaccard 2.2 Độ đo tương tự tập mờ tranh 2.1 Tập mờ bc tranh [0;1] gi l o tỵng t gia A, B nu S(A, B) Bựi Cụng Cỵng (2014) ó ỵa khỏi nim tờp m bc tranh nhỵ sau: Định nghĩa Cho hai têp mą bĀc tranh A,B PFS(X) Ánh xä S : PFS(X) PFS(X) thóa mãn điều kiện sau: (1) S(A,B) (2) S(A,A) Định nghĩa Cho têp X = x1 ,x2 , , , (3) S(A,B) S(B,A) x n têp mą bĀc tranh A trờn X ỵc xỏc nh bi A x, x , x , x A A A (4) Nếu A B C S(A,C) S(A,B); S(A,C) S(B,C) A,B,C PFS(X) xX VĆi A: X [0;1] hàm thuộc khỵng đðnh, A: X [0;1] hàm thuộc trung lêp, A: X [0;1] hàm thuộc phû đðnh thóa mãn điều kiện A(x) + A(x) + A(x) x X Ta kí hiệu PFS(X) l tờp hp tỗt cõ cỏc tờp m bc tranh X Định nghĩa Cho hai têp mą bĀc tranh A,B PFS(X): (1) A B A (x) B (x), A (x) B (x), A (x) B (x) x X Mt s o tỵng t trờn tờp m bc tranh ó ỵc xuỗt: o tỵng t Cosine (Wei, 2017) theo cụng thc (1) o tỵng tă dăa lý thuyết têp hợp (Wei, 2018) theo cụng thc (2) o tỵng t Grey (Wei, 2018) theo cụng thc (3) Cỏc o tỵng t da hàm cosin (Wei, 2017) theo công thĀc (4) (5) o tỵng t da trờn hm cotan (Wei, 2017) theo công thĀc (6) (2) A B A (x) B (x), A (x) B (x), A (x) o tỵng t Dice (Joshi & Kumar, 2018) theo công thĀc (7) B (x) x X PFC1 (A,B) A (x i )B (x i ) A (x i )B (x i ) A (x i )B (x i ) n n i 1 2 (x ) 2 (x ) 2 (x ) 2 (x ) 2 (x ) (x ) A i A i A i B i B i B i (1) PFC2 (A,B) A (x i )B (x i ) A (x i )B (x i ) A (x i ) B (x i ) n n i 1 max(2A (x i ) 2A (x i ) 2A (x i ), B2 (x i ) 2B (x i ) B2 (x i )) (2) PFC3 (A,B) n min max min max min max 3n i 1 i max i max i max (3) VĆi: i |A (xi ) B (xi )|, min |A (xi ) B (xi )| , max max |A (xi ) B (xi )| i i max | (x )| i |A (xi ) B (xi )|, min |A (xi ) B (xi )| , max max |A (xi ) B (xi )| i i |A (xi ) B (xi )|, min | A (x i ) B (x i )| , max i 388 i i A (xi ) B i PFCS1 (A,B) n cos [| A (x i ) B (x i )| | A (x i ) B (x i )| | A (x i ) B (x i )|] n i 1 2 (4) PFCS2 (A,B) n cos [| A (x i ) B (x i )| | A (x i ) B (x i )| | A (x i ) B (x i )|] n i 1 4 (5) Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ PFCT(A,B) DPFS (A,B) J PFS (A,B) e e 2 A ( x i ) e e A ( xi ) B ( xi ) e 2 B ( x i ) e e A ( x i ) B ( x i ) e (8) (1 A ( x i )) (1 B ( x i )) e 2(1 B ( x i )) (1 A ( x i ) A ( xi ) A ( x i )) e (1 A ( x i )) (1 B ( xi )) e 1 (1 A ( x i ) A ( xi ) A ( xi )) (1 B ( x i ) B ( x i ) B ( x i )) 2 e e (1 B ( x i ) B ( x i ) B ( x i )) e 1 (1 A ( x i ) A ( xi ) A ( x i )) (1 B ( x i ) B ( x i ) B ( x i )) 2 Chợ s Jaccard l chợ s ỵc s dýng thng kờ o mc tỵng t giĂa hai méu Cho hai méu A B, chợ s Jaccard gia A v B ỵc xỏc đðnh bći công thĀc: |A B| |A B| |A B| |A| |B| |A B| Ta có J(A,B) J(A,B) ln thỡ mc tỵng ng gia A, B cng lĆn Nếu xét hai véc tĄ n chiều X = (x1, x2,„, xn), Y = (y1, y2,„, yn) chợ s Jaccard gia XA, XB xỏc nh nhỵ sau: J(X, Y) x ,( (x ), (x ), (x )) |x X, B x ,( (x ), (x ), (x )) |x X A j A j j B j x y n i 1 n i i 1 i 1 i i n i 1 B A j B j j j j B ỵc xỏc nh nhỵ sau nhỵ cụng thc (8) Ta chng minh JPFS (A,B) thúa tớnh chỗt cỷa o tỵng t: Xột hm f(x,y) J PFS (A,B) xy x y2 xy f e f e Ta có : n ( x ) ( x ) f e A i ,e B i 4n i 1 A ( xi ) ,e B ( xi ) (1 A ( x i )) ,e (1 B ( x i )) (1A ( xi )A ( xi )A ( xi )) (1B ( xi )B ( xi )B ( xi )) f e ,e x y x y i j X Y XY A hai têp mą bĀc tranh têp X x1 ,x , ,x n Khi ũ o tỵng t gia A, XY n e Cho: 2.3 Chỉ số Jaccard J(A,B) (7) ( x ) ( x ) n e A ie B i 4n i 1 e 2A ( xi ) e 2B ( xi ) e A ( xi ) e B ( xi ) e e (6) n A (x i )B (x i ) A (x i )B (x i ) A (x i )B (x i ) n i 1 2A (x i ) 2A (x i ) 2A (x i ) B2 (x i ) B2 (x i ) B2 (x i ) e 2(1 A ( x i )) n cot [|A (xi ) B (xi )| |A (xi ) B (xi )| | A (xi ) B (xi )|] n i 1 i i KẾT QUẢ VÀ THẢO LUẬN 3.1 Độ đo tương tự dựa số Jaccard tập mờ tranh Dăa chỵ số Jaccard, chúng tụi xuỗt o tỵng t gia cỏc tờp m bc tranh bỡng cỏch o mc tỵng t gia ba hàm thành viên hai têp mą bĀc tranh nhỵ sau: (1) D thỗy f(x,y) x,y , đò f e f e 0f e A ( xi ) ,e A ( xi ) ,e B ( xi ) B ( xi ) (1 A ( xi )) ,e 1, 1, (1B ( xi )) 1, (1A ( xi )A ( xi )A ( xi )) f e , i 1,2, ,n (1 B ( xi ) B ( xi ) B ( xi )) e 389 Độ đo tương tự tập mờ tranh ứng dụng phân cụm liệu Vêy JPFS (A,B) A (x i ) B (x i ) C (x i ), A (x i ) B (x i ) C (x i ), A (x i ) B (x i ) C (x i ) (2) Giâ sā A = B, tĀc A(xi) = B(xi), A(xi) = A(xi) , A(xi) = B(xi) Khi đò e A ( xi ) B (xi ) e B ( x i ) ,e e B ( xi ) e (1 B ( xi )) e ,e e A ( x i ) ,e (1 A ( xi ) A ( x i ) A ( x i )) f e f e A ( xi ) A ( xi ) ,e (1 A ( xi )) 1, 1, 1, B ( xi ) B ( xi ) ,e (1 B ( xi )) (1A ( xi )A ( xi ) A ( xi )) f e , = i 1,n (1 B ( x i ) B ( x i ) B ( x i )) e Suy JPFS(A,B) = Ngỵc lọi giâ sā JPFS(A,B) = 1, đò f e f e f e A ( xi ) A ( xi ) ,e ,e (1 A ( xi )) 1, 1, 1, , B ( xi ) B ( xi ) ,e e (1A ( xi ) A ( xi ) A ( xi )) f e , = i 1,n (1 B ( xi ) B ( x i ) B ( x i )) e xy x y2 xy f e f e f e C ( xi ) A ( xi ) ,e C ( xi ) (1 A ( xi )) ,e e C (xi ) (1 B ( x i )) e ,e e A ( xi ) (1 C ( x i )) B (x i ) B (x i ) C (x i ) ,e f e ,e f e ,e f e A ( xi ) B ( xi ) A ( xi ) B ( xi ) (1C ( xi )) (1 A ( xi )) , , ,e (1B ( x i )) , (1A ( xi ) A ( xi ) A ( xi )) (1C ( xi )C ( xi )C ( xi )) f e ,e 1 (1A ( xi )A ( xi )A ( xi )) (1B ( xi )B ( xi )B ( xi )) f e ,e Do đò ta cò JPFS (A,C) JPFS (A,B) Tỵng t cú JPFS (A,C) JPFS (B,C) 3.2 Một số ví dụ Ví dụ Xột bi toỏn y t Dutta (2017) nhỵ sau: giâ sā têp X x1 ,x ,x ,x ,x có têp mą bĀc tranh A1 y(y x2 ) Do đò f(x) (x y xy) đồng biến (0,y) nghðch biến (y,1) Giâ sā A B C , tĀc vĆi i 1,n x ,0.4,0,0 , x ,0.3,0.2,0.4 , x3 , 0.1,0.35,0.5 , x , 0.4,0.3,0.2 , x5 ,0.1,0.25,0.5 A2 (3) D thỗy JPFS (A,B) JPFS (B, A) 390 A ( xi ) x ,0.7,0,0 , x , 0.2,0.4,0.35 , x3 , 0,0.4,0.5 , x , 0.7,0.1,0 , A (xi ) B (xi ) , hay A= B e Tÿ đò ta cò A (xi ) B (xi ), A (xi ) B (xi ), (1 A ( x i )) B (xi ) A (xi ) A (xi ) A (x i ) C (xi )C (xi )C (xi ) (x-y)2 = x=y (4) Ta cú f '(x) ,e e Dỵi ồy l mt s vớ dý so sỏnh o tỵng t mi vi cỏc o tỵng t ó cũ (1 B ( xi )) Mà f(x,y) e A (xi ) Do đò (1 B ( xi ) B ( xi ) B ( xi )) ,e e e C (xi ) (1 A ( xi )) Mặt khác x = y f(x,y) =1 Do đị: f e Suy x5 ,0.1,0.3,0.5 A3 x ,0.3,0.4,0.3 , x ,0.6,0.2,0.1 , x3 ,0.2,0.3,0.4 , x , 0.2,0.35,0.3 , x5 ,0.1,0.2,0.6 , Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ x ,0.1,0.3,0.5 , x ,0.2,0.4,0.3 , A4 A2 lĆn nhỗt, ũ xp B vo lp cỷa A2 Vớ d Xột d liu Singh (2015) nhỵ x3 ,0.8,0,0 , x , 0.2,0.4,0.3 , x5 ,0.2,0.35,0.3 sau: giâ sā têp X x1 ,x ,x ,x ,x A2 A3 x3 0.2,0.4,0.4 , x 0.6,0.15,0.1 , x3 0.1,0.4,0.4 2 x , 0.8,0,0.1 , x ,0.6,0.3,0.1 , 1 Giâ sā có têp mą bĀc tranh mĆi là: B x , 0.4,0.5,0.1 , x , 0.7,0.1,0.1 , x , 0.3,0.3,0.2 x , 0.5,0.4,0.1 , x , 0.7, 0.2,0.1 , x , 0.4,0.3,0.1 , x ,0.4,0.5,0.1 , x ,0.7,0.1,0.1 , x ,0.4,0.3,0.2 A1 x3 ,0.2,0.3,0.5 , x , 0.2,0.35, 0.4 , x5 ,0.8,0,0.1 có têp mą bĀc tranh x ,0.1,0.3,0.5 , x ,0,0.5,0.35 A5 Giâ sā có têp mą bĀc tranh mĆi là: Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) o tỵng t giĂa B Ai (i =1, 2, 3, 4, 5) ta ỵc kt quõ nhỵ bõng B x ,0.1,0.1,0.4 , x ,1,0,0 , x 0,1,0 Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) o tỵng t giĂa A1 B, giĂa A2 B, giĂa A3 v B ta ỵc kt quõ nhỵ bõng Nhỵ vờy o mi cú cựng kt quõ vi tỗt cõ cỏc o củn lọi, ũ l tỵng t gia B v Bng So sỏnh đo tương tự xếp hạng kết phân lớp ví dụ Độ đo tương tự Độ đo tương tự B Ai = (i = 1, 2) A1 A2 A3 A4 A4 Kết luận PFC 0.9167 0.9193 0.8191 0.5875 0.5098 B vào lớp A2 PFC 0.7517 0.8301 0.712 0.4841 0.4551 B vào lớp A2 PFC 0.7703 0.8089 0.7899 0.7571 0.7336 B vào lớp A2 PFCS 0.9222 0.9446 0.8885 0.7295 0.6585 B vào lớp A2 PFCS 0.9353 0.952 0.8807 0.7053 0.667 B vào lớp A2 PFCT 0.6983 0.7597 0.6717 0.4876 0.4337 B vào lớp A2 DPFS 0.8701 0.9132 0.8077 0.5754 0.5033 B vào lớp A2 JPFS 0.969 0.9786 0.96 0.9063 0.8921 B vào lớp A2 Bảng So sánh độ đo tương tự xếp hạng kết phân lớp ví dụ Độ đo tương tự Độ đo tương tự B Ai (i =1, 2) A1 A2 A3 Kết luận PFC 0.6975 0.6712 0.67 PFC 0.4365 0.4365 0.4365 Null PFC 0.8628 0.8844 0.8489 B vào lớp A2 B vào lớp A1 PFCS 0.718 0.718 0.718 Null PFCS 0.7396 0.7286 0.7178 B vào lớp A1 PFCT 0.4541 0.4541 0.4541 Null DPFS 0.6174 0.6062 0.6085 B vào lớp A1 JPFS 0.9019 0.9001 0.8892 B vào lớp A1 Ghi chú: Null nghĩa ta khơng có kết xếp lớp 391 Độ đo tương tự tập mờ tranh ng dng phõn cm d liu Nhỵ vờy cỏc độ đo PFC2, PFCS1, PFCT khơng có kết q phân lĆp, độ đo PFC3 cho kết quâ B vào lĆp cûa A2, cđn độ đo mĆi có kết q vĆi độ đo PFC1, PFCS2, DPFS, đò B vào lĆp cûa A1 Ví dụ Giâ sā têp X x1 ,x ,x3 Nhỵ vờy chợ cũ o mi JPFS phõn lp ỵc B vo nhúm no, cý th B vo lp cûa A1 Ví dụ Giâ sā têp X x1 ,x ,x3 có têp mą bĀc tranh: x ,0.3,0.5,0.2 , x ,0.1,0.1,0.5 , x ,0.6,0.1,0.1 , x ,0.15,0.3,0.45 , x ,0.3,0.3,0.3 , x ,0.6,0.15,0.15 1 A2 Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) o tỵng t gia A1 v B, gia A2 v B ta ỵc kt quõ nhỵ bõng Giõ s cú mt têp mą bĀc tranh mĆi là: B Giâ sā có têp mą bĀc tranh mĆi là: x ,0.4,0.4,0.1 , x ,0.2,0.2,0.4 , x ,0.35,0.2,0.35 3 B 3 A2 x ,0.4,0.4,0.1 , x ,0.3,0.4,0.1 , , x ,0.1,0.3,0.4 x ,0.5,0.2,0.2 , x ,0.5,0.1,0.0 , x ,0.4,0.1,0.3 A1 có têp mą bĀc tranh: A1 x ,0.3,0.3,0.3 , x ,0.3,0.1,0.3 , x ,0.2,0.2,0.2 Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) o tỵng t gia A1 v B, gia A2 v B ta ỵc kt quõ nhỵ bõng Nhỵ vờy chợ cũ o mi phõn lp ỵc B vo nhúm no, cý thể B thuộc vào nhóm cûa A2 Bảng So sánh độ đo tương tự xếp hạng kết phân lớp ví dụ Độ đo tương tự Độ đo tương tự B Ai (i=1, 2) Kết luận A1 A2 0.8209 0.8209 Null 0.5833 0.5833 Null 0.8329 0.8329 Null 0.891 0.891 Null PFC PFC PFC PFCS PFCS 0.902 0.902 Null PFCT 0.6128 0.6128 Null DPFS 0.7396 0.7396 Null JPFS 0.9672 0.9603 B vào lớp A1 Ghi chú: Null nghĩa ta khơng có kết xếp lớp Bảng So sánh độ đo tương tự xếp hạng kết phân lớp ví dụ Độ đo tương tự Độ đo tương tự B Ai (i=1, 2) A2 0.8434 0.8434 Null 0.683 0.683 Null 0.8519 0.8519 Null 0.931 0.931 Null PFC PFC PFCS PFCS 0.942 0.942 Null PFCT 0.6887 0.6887 Null DPFS 0.8177 0.8177 Null JPFS 0.9712 0.9744 B vào lớp A2 Ghi chú: Null nghĩa ta khơng có kết xếp lớp 392 Kết luận A1 PFC Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ 3.3 Ứng dụng độ đo vào toán phân cụm liệu Xu & cs (2018) ó ỵa thuờt toỏn phõn cým m trc cõm bỡng ma trờn kt hp tỵng ỵng, trờn c s ũ chỳng tụi ỏp dýng o tỵng t mi vào toán phân cým cho têp mą bĀc tranh Định nghĩa Cho A1 , A , , A n têp ChĀng minh: VĆi k = ta có C2 C C , đðnh lý nên C2 ma kết hợp h1 Giâ sā C2 h 2 Ta chĀng minh C2 mãn cỏc tớnh chỗt sau: h ũ theo nh lý C2 thành cûa C, nn vĆi Định lý Cho C (cij )nn ma kết hợp Khi đò ma hợp thành C2 cüng ma kết hợp c i, j 1, ,n k k ChĀng minh VĆi i, j xét dãy số c(2 ij k ik k kj chỵ tồn täi k {1,2, ,n} cho cik ckj max min c max min c cij max cik ,ckj k k ,c jk ki k jk ,cki c k1 k C2 k ) ) k 1 dãy không giâm bð chặn, k Mặt khác dãy c (2k ) ij chỵ nhên hĂu hän k 1 giá trð khác thuộc têp phæn tā cûa ) c(2 ma C, đò vĆi k đû lĆn c(2 ij ij k ) c(2 Vêy vĆi k đû lĆn c(2 ij ij k k k1 k 1 ) k 1 ) i, j , tĀc k C2 C2 v C2 l ma trờn kt hp tỵng ỵng trờn kt hp tỵng ỵng Khi ũ ma trờn C ( cij )nn ỵc gi l ma trờn _lỏt cít cûa ji i, j 1,2, ,n hợp Khi ũ vi mi s nguyờn dỵng k, ma trờn vi C2 k Định nghĩa Cho C (cij )nn ma Định lý Cho C (cij )nn ma kết k 1 k 1 , ć đò c(2 ij k Do C ma kết hợp nên điều xây chỵ Ai = Ak = Aj iii) Do cij c ji i, j 1, ,n nên: k ) đò tồn täi c*ij limc(2 ij ij ) phæn tā thuộc hàng i, cột j cûa ma C2 Do cách xây dăng ma thành phæn ć đðnh nghïa k i, j 1, ,n c max min c ,c vào k 1 đò C2 l ma trờn kt hp tỵng ỵng i) Do cij i, j 1, ,n nên c ij ii) Ta có ln tn tọi s nguyờn dỵng k cho C2 C2 , ta có c(2 ij k tĀc C gọi ij ChĀng minh: C2 C , Nếu C C2 C4 C2 max cik ,ckj C2 max cik ,ckj cij max cik ,ckj ,i, j 1, ,n k hợp k kết hợp Khi đò ma C C C cij hợp kết kết hợp Khi đò dãy ma kết hợp ma kết hợp Định lý Cho C (cij )nn ma Định nghĩa Cho C (cij )nn ma ma h1 C2 , ma kt hp tỵng ỵng iii) cij c ji i, j 1, ,n h1 C2 Định nghĩa Cho C (cij )nn ma ii) cij A i A j gọi ma kết hợp Thêt h2 k i) cij i, j 1, ,n h C2 ma kết hợp vêy theo Đðnh nghïa ta cò C2 mą bĀc tranh, đò C (cij )nn gọi ma kết hợp mą bĀc tranh cij c(A i ,A j ) thóa h C2 C2 cüng ma kết hợp C, ć đò 0, cij cij 1, cij i, j 1,2, ,n gọi mĀc tin cêy vĆi [0,1] 393 Độ đo tương tự tập mờ tranh ứng dụng phân cụm liệu Sā dýng khái niệm nêu chỳng tụi xuỗt thuờt toỏn phõn cým da trờn ma trờn kt hp tỵng ỵng nhỵ sau: Thuờt toỏn phân cým: Đæu vào: Cho A1 , A , , A n têp mą bĀc tranh têp X x1 , x , , x n Đỉu ra: kết q phân tích cým: phân hoäch cûa họ A1 , A , , A n Cỏc bỵc cỷa thuêt toán: Bước Xây dăng ma kết hợp C (cij )nn vĆi cij JPFS (A i , A j ) ỵc tớnh vi cụng thc (8) Bước Nếu C (cij )nn ma kt hp tỵng ỵng thỡ ta xồy dng ma trờn _lát cít C ( cij )nn theo đðnh nghïa Nếu không ta xây dăng dãy ma 2k C C C C theo đðnh lý để cú ma trờn kt hp tỵng ỵng C , sau xây dăng ma lát cít C cûa C Bước Nếu phæn tā thuộc hàng (cột) thĀ i cûa C (hoặc C ) giống cỏc phổn t tỵng ng thuc hng (ct) th j cûa C (hoặc C ) A i , A j ỵc xp vo mt cým Sau ồy chỳng ta xét ví dý Āng dýng tht tốn phân cým ó xuỗt trờn Vớ d Xột bi tốn phân cým xe hĄi (Singh, 2015), kí hiệu xe hĄi A1 ,A2 ,A3 ,A4 Mỗi xe ta xét thuộc tính: tiết kiệm nhiên liệu (x1), giá câ (x2), an tồn (x3) Thơng tin ỵc th hin bỡng tờp m bc tranh nhỵ sau: x ,0.3,0.2,0.1 , x ,0.8,0.1,0.1 , x ,0.1,0,0.9 x ,0.4,0.1,0.5 , x ,0,0.7,0.1 , x ,0.3,0.2,0.4 x ,0.2,0.6,0.1 , x ,0.9,0.1,0 , x ,0.7,0.1,0.2 A1 A2 A3 394 A4 x ,0.7,0.3,0 , x ,0.5,0.1,0.3 , x ,0.6,0,0.3 Bước Sā dýng cơng thĀc (8) tính JPSF (A i , A j ) , ta có ma kết hợp 0.8582 0.9035 0.9055 0.8582 0.8750 0.8912 C 0.9035 0.8750 0.9414 0.9055 0.8912 0.9414 Bước Tính ma hợp thành 0.8912 0.9055 0.9055 0.8912 0.8912 0.8912 C2 0.9055 0.8912 0.9414 0.9055 0.8912 0.9414 Ta thỗy C khụng phõi l ma trờn kt hp tỵng ỵng 0.8912 0.9055 0.9055 0.8912 0.8912 0.8912 C4 0.9055 0.8912 0.9414 0.9055 0.8912 0.9414 Ta có C4 = C2, đị C2 ma trờn kt hp tỵng ỵng Bc Xõy dýng ma _lát cít cûa C2 ta có khâ nởng phồn cým nhỵ sau: Vi 0.8912: ta có cým {A1, A2, A3, A4} VĆi 0.8912 < < 0.905: ta có hai cým{A1, A3, A4}, {A2} VĆi 0.905 < 0.9414: ta có ba cým {A1}, {A2}, {A3, A4} VĆi 0.9414 < 1: ta có cým {A1}, {A2}, {A3}, {A4} KẾT LUN Trong bi bỏo ny chỳng tụi ó xuỗt mt o tỵng t mi cho cỏc tờp m bĀc tranh dăa chỵ số Jaccard Bìng số ví dý, chúng tơi chỵ rìng nhiều trỵng hp vic s dýng o tỵng t mi ó khớc phýc ỵc nhng họn ch cỷa cỏc o tỵng t ó cũ Chỳng tụi cỹng ó s dýng o tỵng t mi vo bi toỏn phõn cým têp mą bĀc tranh dăa thuêt toán phân cým ma kết hợp Lê Thị Diệu Thùy, Nguyễn Hu Hi, Nguyn Vn Hnh, Th Hu tỵng ỵng, iu ny cho thỗy tớnh khõ dýng cỷa o tỵng t mi ỵc xuỗt Trong tỵng lai o tỵng t ỵc xuỗt cổn ỵc tip týc nghiên cĀu Āng dýng nhiều hĄn toán nhên däng méu, phân cým, đðnh đa tiêu chí,„ v nghiờn cu m rng hỵng ny trờn cỏc dọng têp mą khác TÀI LIỆU THAM KHẢO Atanassov K.T (1986) Intuitionistic fuzzy sets Fuzzy sets and Systems 20(1): 87-96 Cuong B.C (2014) Picture fuzzy sets Journal of Computer Science and Cybernetics 30(4): 409- 420 Cuong B.C & Hai P.V (2015) Some fuzzy logic operators for picture fuzzy sets Seventh International Conference on Knowledge and Systems Engineering pp 132-137 Dengfeng L & Chuntian C (2002) New similarity measures of intuitionistic fuzzy sets and application to pattern recognitions Pattern Recogn Lett 23: 221-225 Dinh N.V & Thao N.X (2018) Some Measures of Picture Fuzzy Sets and Their Application in Multiattribute Decision Making I.J Mathematical Sciences and Computing 3: 23-41 Dinh N.V., Thao N.X & Chau N.M (2015) On the picture fuzzy database: theories and application Việt Nam National University of Agriculture, J Sci & Devel 13(6): 1028-1035 Dutta P (2017) Medical Diagnosis via Distance Measures on Picture Fuzzy Sets Amse JournalsAmseiieta publication 54(2): 137-152 Garg H (2017) Some picture fuzzy aggregation operators and their applications to multicriteria decision-making Arabian Journal for Science Engineering 42(12): 5275-5290 Hoa N.D., Son L.H & Thong P.H (2014) Weather nowcasting from satellite image sequences using the combination of picture fuzzy clustering and spatiotemporal regression Proceeding of Conference of GISIDEAR Đà Nẵng, Việt Nam Hoa N.D., Son L.H & Thong P.H (2016) Some improvements of fuzzy clustering algorithms using picture fuzzy sets and applications for geographic data clustering VNU Journal of Science: Computer Science and Communication Engineering 32(3): 32-38 Hung W.L & Yang M.S (2004) Similarity measures of intuitionistic fuzzy sets based on Hausdorff distance Pattern Recognition Letters 25: 1603-1611 Hung W.L & Yang M.S (2007) Similarity measures of intuitionistic fuzzy sets based on Lpmetric International Journal of Approximate Reasoning 46: 120-136 Hwang C.M., Yang M.S & Hung W.L (2018) New similarity measures of intuitionistic fuzzy sets based on the Jaccard index with its application to clustering International Journal of Intelligent Systems 33(8): 1672-1688 Joshi D & Kumar S (2018) An Approach to Multicriteria Decision Making Problems Using Dice Similarity Measure for Picture Fuzzy Sets Mathematics and Computing Springer, Singapore Li D.F & Cheng C (2002) New similarity measures of intuitionistic fuzzy sets and application to pattern recognitions Pattern Recognition Letters 23: 221-225 Liu H.W (2005) New similarity measures between intuitionistic fuzzy sets and between elements Mathematical and Computer Modelling 42: 61-70 Mitchell H.B (2003) On the Dengfeng-Chuntian similarity measure and its application to pattern recognition Pattern Recognition Letters 24: 3101-3104 Peng X & Dai J (2017) Algorithm for picture fuzzy multiple attribute decision making based on new distance measure International Journal for Uncertainty Quantification 7: 177-187 Phong P.H., Hieu D.T., Ngan R.T.H & Them P.T (2014) Some compositions of picture fuzzy relations, in: Proceedings of the 7th National Conference on Fundamental and Applied Information Technology Research, FAIR’7, Thai Nguyen pp 19-20 Singh P (2015) Correlation coefficients for picture fuzzy sets Journal of Intelligent & Fuzzy Systems 28(2): 591-604 Son L.H (2015) DPFCM: A novel distributed picture fuzzy clustering method on picture fuzzy sets Expert System with Applications 42(1): 51-66 Son L.H (2016) Generalized picture distance measure and applications to picture fuzzy clustering Applied Soft Computing 46: 248-295 Son L.H (2017) Measuring analogousness in picture fuzzy sets: from picture distance measures to picture association measures Fuzzy Optimization and Decision Making 16(3): 359-378 Son L.H., Phong P.H (2016) On the performance evaluation of intuitionistic vector similarity measures for medical diagnosis Journal of Intelligent and Fuzzy Systems 31: 1597-1608 Son L.H., Viet P.V & Hai P.V (2017) Picture inference system: a new fuzzy inference system on picture fuzzy set Applied Intelligence 46(3): 652-669 395 Độ đo tương tự tập mờ tranh ứng dụng phân cụm liệu Szmidt E (2014) Distances and Similarities in Intuitionistic Fuzzy Sets Springer International Publishing Switzerland p 307 Thao N.X & Dinh N.V (2015) Rough picture fuzzy set and picture fuzzy topologies Journal of Computer Science and Cybernetics 31(3): 245 Thong P.H & Son L.H (2014) A new approach to multi-variable fuzzy forecasting using picture fuzzy clustering and picture fuzzy rule interpolation method Knowledge and Systems Engineering, Springer, Cham pp 679-690 Thong P.H (2016) Picture fuzzy clustering: a new computational intelligence method Soft Computing 20(9): 3549-3562 Thong P.H (2016) Picture fuzzy clustering for complex data Engineering Applications of Arti_cial Intelligence 56: 121-130 Thong P H (2017) Some novel hybrid forecast methods based on picture fuzzy clustering for weather now-casting from satellite image sequences Applied Intelligence 46(1):1-15 Viet P.V., Chau H.T.M & Hai P.V (2015) Some extensions of membership graphs for picture inference systems Seventh International Conference on Knowledge and Systems Engineering, (KSE), IEEE pp 192-197 Wei G.W (2017) Some similarity measures for picture fuzzy sets and their applications to strategic decision making Informatica 28: 547-564 Wei G.W (2017) Some cosine similarity measures for picture fuzzy sets and their applications to strategic decision making Informatica 28(3): 547-564 396 Wei G.W (2018) Some similarity measures for picture fuzzy sets and their applications Iranian Journal of Fuzzy Systems 15(1): 77-89 Wei G.W (2018) The Generalized Dice Similarity Measures for Picture Fuzzy Sets and Their Applications Informatica 29(1): 107-124 Xu Z.S., Chen J & Wu J.J (2008) Clustering algorithm for intuitionistic fuzzy sets Information Sciences 178: 3775-3790 Xu Z.S & Xia M.M (2010) Some new similarity measures for intuitionistic fuzzy values and their application in group decision making Journal of System Science and Engineering 19: 430-452 Ye J (2011) Cosine similarity measures fot intuitionistic fuzzy sets and their applications Mathematical and Computer Modelling 53: 91-97 Ye J (2012) Multicriteria decision-making method using the Dice similarity measure based on the reduct intuitionistic fuzzy sets of interval-valued intuitionistic fuzzy sets Applied Mathematical Modelling 36: 4466-4472 Ye J (2016) Similarity measures of intuitionistic fuzzy sets based on cosine function for the decision making of mechanical design schemes Journal of Intelligent and Fuzzy Systems 30: 151-158 Zadeh L.A (1965) Fuzzy sets Information and control 8(3): 338-353 Zeng S., Asharf S., Arif M & Abdullah S (2019) Application of Exponential Jensen Picture Fuzzy Divergence Measure in Multi-Criteria Group Decision Making Mathematics 7(2): 191-207 ... so sánh độ đo mĆi vĆi độ đo cị Sau đị chúng tơi xây dăng thuêt toán phân cým cho têp mą bĀc tranh da ma trờn kt hp tỵng ỵng v ỏp dýng độ đo mĆi vào thuêt toán 387 Độ đo tương tự tập mờ tranh ng... gia B Bảng So sánh độ đo tương tự xếp hạng kết phân lớp ví dụ Độ đo tương tự Độ đo tương tự B Ai = (i = 1, 2) A1 A2 A3 A4 A4 Kết luận PFC 0.9167 0.9193 0.8191 0.5875 0.5098 B vào lớp A2 PFC 0.7517... B vào lớp A2 DPFS 0.8701 0.9132 0.8077 0.5754 0.5033 B vào lớp A2 JPFS 0.969 0.9786 0.96 0.9063 0.8921 B vào lớp A2 Bảng So sánh độ đo tương tự xếp hạng kết phân lớp ví dụ Độ đo tương tự Độ đo