TNU Journal of Science and Technology 227(16) 107 114 http //jst tnu edu vn 107 Email jst@tnu edu vn COMPUTATIONAL SEMANTIC REPRESENTATION GUARANTEES INTERPRETABILITY OF FUZZY RULE BASED CLASSIFIER Ph[.]
TNU Journal of Science and Technology 227(16): 107 - 114 COMPUTATIONAL SEMANTIC REPRESENTATION GUARANTEES INTERPRETABILITY OF FUZZY RULE BASED CLASSIFIER Pham Dinh Phong, Hoang Van Thong*, Nguyen Duc Du University of Transport and Communications ARTICLE INFO Received: 26/9/2022 Revised: 19/10/2022 Published: 20/10/2022 KEYWORDS Hedge algebras Order-based semantics Classifier Interpretability Fuzzy rule-based systems ABSTRACT The fuzzy rule-based classifier design methods have been widely studied by the research community due to many practical applications in the real life The quality of a classifier clearly depends on the semantic representations of linguistic words in the rule bases Hedge algebra allows to the creation of a formal formalism for designing the fuzzy sets-based computational semantics of linguistic words from their inherent semantics However, the existing design methods of fuzzy sets-based computational semantics of linguistic words not guarantee the interpretability of the fuzzy rule-based classifiers Specifically, the designed multi-granularity representation does not retain the generality-specificity relation of linguistic terms This paper presents a fuzzy sets-based computational semantic representation that guarantees the interpretability of the fuzzy rule-based classifier Experimental results on 23 real-world datasets have shown that the proposed method gives better classification accuracy while not increasing the complexity of the fuzzy rule-based systems in comparison with the existing methods BIỂU DIỄN NGỮ NGHĨA TÍNH TỐN ĐẢM BẢO TÍNH GIẢI NGHĨA CỦA HỆ PHÂN LỚP DỰA TRÊN LUẬT MỜ Phạm Đình Phong, Hồng Văn Thơng*, Nguyễn Đức Dư Trường Đại học Giao thông vận tải THƠNG TIN BÀI BÁO Ngày nhận bài: 26/9/2022 Ngày hồn thiện: 19/10/2022 Ngày đăng: 20/10/2022 TỪ KHÓA Đại số gia tử Thứ tự ngữ nghĩa Hệ phân lớp Tính giải nghĩa Hệ dựa luật mờ TÓM TẮT Phương pháp thiết kế hệ phân lớp dựa luật mờ nghiên cứu rộng rãi có nhiều ứng dụng thực tiễn Chất lượng hệ phân lớp phụ thuộc vào biểu diễn ngữ nghĩa từ ngôn ngữ sở luật Đại số gia tử cho phép tạo sở hình thức thiết kế ngữ nghĩa tính tốn dựa tập mờ từ ngôn ngữ sở luật từ ngữ nghĩa vốn có chúng Tuy nhiên, phương pháp thiết kế ngữ nghĩa tính tốn dựa tập mờ chưa đảm bảo tính giải nghĩa hệ phân lớp dựa luật mờ Cụ thể, biểu diễn đa thể hạt khung nhận thức ngôn ngữ chưa đảm bảo tính chung - riêng từ ngơn ngữ Bài báo trình bày phương pháp biểu diễn ngữ nghĩa tính tốn dựa tập mờ đảm bảo tính giải nghĩa hệ phân lớp Kết thực nghiệm với 23 tập liệu chuẩn cho thấy phương pháp đề xuất cho độ xác phân lớp tốt khơng làm tăng độ phức tạp hệ luật so với phương pháp công bố DOI: https://doi.org/10.34238/tnu-jst.6566 * Corresponding author Email: thonghv@utc.edu.vn http://jst.tnu.edu.vn 107 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 227(16): 107 - 114 Giới thiệu Phương pháp thiết kế hệ phân lớp dựa luật mờ (Fuzzy rule based classifiers – FRBCs) nghiên cứu rộng rãi có nhiều ứng dụng thực tế lĩnh vực khai phá liệu [1] – [5] Phương pháp thiết kế FRBC theo tiếp cận lý thuyết tập mờ [1] – [5] sử dụng tập mờ để phân hoạch miền giá trị thuộc tính dựa tri thức chuyên gia Do đó, số tập mờ sử dụng bị giới hạn 7±2 tập mờ thường biểu diễn dạng phân hoạch Bên cạnh đó, khơng có cầu nối hình thức ngữ nghĩa từ ngơn ngữ với tập mờ nên tập mờ thu sau q trình tối ưu khơng phản ánh ngữ nghĩa thực từ ngôn ngữ theo ý đồ thiết kế chuyên gia làm giảm tính giải nghĩa hệ luật phân lớp Đại số gia tử (ĐSGT) [6] – [8] Nguyễn Cát Hồ cộng giới thiệu vào năm 1990 ứng dụng hiệu nhiều lĩnh vực khác khai phá liệu [9] – [14], điều khiển mờ [15], xử lý ảnh [16], ĐSGT cung cấp sở toán học cho việc liên kết ngữ nghĩa tính tốn dựa tập mờ với ngữ nghĩa vốn có từ ngơn ngữ sở khai thác tính thứ tự ngữ nghĩa từ miền giá trị ngôn ngữ, cho phép tạo sở hình thức sinh ngữ nghĩa tính tốn dựa tập mờ từ ngữ nghĩa định tính vốn có từ ngơn ngữ Dựa sở hình thức này, Nguyễn Cát Hồ cộng lần ứng dụng ĐSGT để thiết kế tối ưu từ ngôn ngữ với ngữ nghĩa tính tốn dựa tập mờ cho FRBC cách hiệu [9], [10], ngữ nghĩa dựa tập mờ hình thang chứng minh hiệu ngữ nghĩa tính tốn dựa tập mờ tam giác Dựa ĐSGT, phương pháp luận tính tốn trực tiếp từ ngơn ngữ để thiết kế hệ dựa luật mờ có tính giải nghĩa theo quan điểm Tarski đề xuất áp dụng hiệu toán hồi quy [13], [17] tóm tắt ngơn ngữ từ liệu [14] Phương pháp luận đảm bảo cấu trúc đa thể hạt mờ phải hình ảnh đẳng cấu cấu trúc đa ngữ nghĩa tập từ tương ứng thuộc tính Trong báo này, chúng tơi áp dụng phương pháp luận nói giải toán phân lớp dựa luật mờ (FRBC) Phương pháp nghiên cứu 2.1 Cấu trúc đa ngữ nghĩa miền hạng từ 2.1.1 Tính giải nghĩa Tính giải nghĩa Tarski cộng [18] định nghĩa toán học logic sau: Lý thuyết S gọi giải nghĩa lý thuyết T tồn dịch T từ ngơn ngữ hình thức L(S) S sang ngơn ngữ hình thức L(T) T thỏa mãn điều kiện, với mệnh đề p ∈ L(S) p chứng minh S T(p) ∈ L(T) chứng minh T Theo khái niệm này, thay giải toán cho Ps lý thuyết S người ta giải lý thuyết T khác cách biến đổi PS sang T phép biến đổi T S giải nghĩa T phép biến đổi T Như vậy, lý thuyết T thỏa mãn điều kiện T gọi giải nghĩa S Trong mục khẳng định rằng, cấu trúc đa ngữ nghĩa SA = (XA, ≤, g) miền từ A X thuộc tính A với quan hệ thứ tự ngữ nghĩa ≤ quan hệ khái qt-đặc tả g tính tốn với từ ngơn ngữ thơng qua tập mờ tương ứng chúng giải nghĩa theo khái niệm Tarski tập mờ tạo thành cấu trúc ảnh đẳng cấu cấu trúc đa ngữ nghĩa SA = (XA, ≤, g) Khi cấu trúc tập mờ giải nghĩa cho SA 2.1.2 Đại số gia tử mở rộng biểu diễn lõi ngữ nghĩa từ ngôn ngữ ĐSGT mở rộng Nguyễn Cát Hồ cộng giới thiệu [10] mở rộng ĐSGT truyền thống việc bổ sung gia tử nhân tạo h0 nhằm mơ hình hóa lõi ngữ nghĩa http://jst.tnu.edu.vn 108 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 227(16): 107 - 114 từ ngôn ngữ Nhờ đó, ĐSGT mở rộng đáp ứng yêu cầu đa dạng biểu diễn cấu trúc đa ngữ nghĩa ứng dụng thực tiễn Cho ĐSGT tuyến tính 𝒜A = (XA, G, C, H, ≤) biến ngôn ngữ A Một gia tử nhân tạo h0 H bổ sung để sinh lõi ngữ nghĩa từ x ∊ XA Về mặt cú pháp, h0x XA đặt = XA {h0x: x ∊ XA} Ta có ĐSGT mở rộng 𝒜A =( , G, C, Hen, ≤), đó, Hen = H {h0}, = C Hen(G) = C {hn … h1c: c G, hj Hen, với j = 1, …, n} Do đó, ta có, XA = C H(G) = C Hen(G) Đặt = {x ∈ : |x| = k}, |x| độ dài x, tập từ có độ đặc tả k (kspecificity) = {x ∈ : |x| ≤ k} = ⋃ tập từ có độ đặc tả khơng lớn k Khi đó, = G C với k ≥ = {h0u: u }, tức với k > bao gồm tất từ có mức đặc tả k, lõi ngữ nghĩa chúng tất từ có mức đặc tả thấp k Ngoài cấu trúc ngữ nghĩa dựa thứ tự, ký hiệu =( , ≤), miền từ XA bao hàm cấu trúc ngữ nghĩa khác thể thông qua quan hệ khái quát-đặc tả (generalityspecificity), tức từ x có tính khái quát từ y ký hiệu g(x, y) ngược lại, y gọi có tính đặc tả x Cấu trúc gọi cấu trúc khái quát-đặc tả ký hiệu GA = ( , g) Như vậy, miền từ XA bao gồm hai cấu trúc: =( , ≤) GA = ( , g), tức biến ngôn ngữ A khơng có cấu trúc ngữ nghĩa theo thứ tự quan niệm trước mà nhiều vấn đề phức tạp Kết hợp cấu trúc thứ tự cấu trúc khái quát-đặc tả GA ta có cấu trúc ngữ nghĩa đa mức hay cấu trúc đa ngữ nghĩa biểu thị SA = ( , ≤, g) 2.1.3 Biểu diễn cấu trúc đa ngữ nghĩa miền từ dựa ĐSGT Muốn cấu trúc T(XA) biểu diễn cấu trúc 𝒮A = (XA, ≤, g) bảo tồn cấu trúc 𝒮A hay nói cách khác T(XA) giải nghĩa cần định nghĩa hai quan hệ ký hiệu ≤ T(XA) 𝒮A có quan hệ thứ tự ≤ khái quát-đặc tả g Ký hiệu tập mờ hình thang ba (a, b, c), a, c ∈ [0, 1], b khoảng [0, 1] đóng vai trị lõi ba a < b < c Định nghĩa Với tập mờ hình thang xây dựng T(XA), định nghĩa: 1) Quan hệ thứ tự ≤ T(XA): hai ba t t' với t = (a, b, c) t' = (a', b', c') thỏa mãn t ≤ t' lõi chúng thỏa mãn b = b' b < b' thỏa bất đẳng thức a ≤ a' c ≤ c' 2) Quan hệ bao hàm T(XA): hai ba t t' gọi thỏa mãn t t' đáy lớn t bao hàm đáy lớn t', tức (a, c) (a', c') Tập T(XA) với hai quan hệ ≤ ký hiệu = (T(XA), ≤, ), gọi cấu trúc đa thể hình thang A Trong thực tế ứng dụng, miền từ sử dụng biến thường giới hạn với mức đặc tả tối đa k Định nghĩa Với số nguyên k > 1, k-section cấu trúc ngữ nghĩa 𝒮A = (XA, ≤, g) cấu trúc =( , ≤k, gk) thỏa mãn điều kiện sau: A (i) = {x ∈ X : |x| ≤ k}, tập hợp từ có mức độ đặc tả không lớn k; (ii) Các quan hệ ≤k gk quan hệ ≤ g bị giới hạn tập từ Định nghĩa Với số nguyên k > 1, k-section cấu trúc đa thể hình thang = A (T(X ), ≤, ) A cấu trúc = (T( ), ≤k, k), gọi cấu trúc đa thể hình thang mức k thỏa mãn điều kiện sau: (i) T( ), định nghĩa Định nghĩa tập tập mờ hình thang từ xây dựng theo mức từ l = đến k; (ii) Các quan hệ ≤k k quan hệ ≤ bị giới hạn T( ) http://jst.tnu.edu.vn 109 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 227(16): 107 - 114 Trong [14], cấu trúc Hình chứng minh hình ảnh đẳng cấu cấu trúc ngữ nghĩa 𝒮A = (XA, ≤, g), tức 𝒮A giải nghĩa Hình Cấu trúc phân hoạch đa thể hình thang biểu diễn cấu trúc ngữ nghĩa 𝒮A = (XA, ≤, g) biến A 2.2 Thiết kế hệ phân lớp dựa luật mờ sở cấu trúc đa ngữ nghĩa Bài toán thiết kế hệ phân lớp dựa luật mờ P định nghĩa sau: Một tập P = {(dp, Cp) | dp D, Cp C, p = 1, …, m} gồm m mẫu liệu, dp = [dp,1, dp,2, , dp,n] dòng thứ pth, C = {Cs | s = 1, …, M} tập gồm M nhãn lớp, n số thuộc tính Hệ sở luật cho toán phân lớp sử dụng báo tập luật có số dạng: Luật Rq: If X1 is Aq,1 and and Xn is Aq,n then Cq with CFq, for q=1, …, N (1) đó, X = {Xj, j = 1, , n} tập n biến ngôn ngữ ứng với n thuộc tính tập liệu P; Aq,j giá trị ngơn ngữ thuộc tính thứ j, Fj; Cq nhãn lớp CFq trọng số luật Rq Luật Rq viết gọn lại sau: Aq Cq with CFq, với q=1, …, N (2) Aq tiền đề luật thứ q Giải tốn P trích xuất từ tập liệu P tập luật S có dạng (1) nhỏ gọn, dễ hiểu với người dùng có độ xác phân lớp cao Cấu trúc đa thể hình thang biểu diễn cấu trúc đa ngữ nghĩa miền hạng từ sinh Hình Như đề cập trên, cấu trúc đảm bảo tính giải nghĩa, hệ phân lớp dựa hệ luật mờ với ngữ nghĩa tính tốn từ ngôn ngữ biểu diễn cấu trúc đảm bảo tính giải nghĩa hệ phân lớp Thủ tục sinh luật [9] sử dụng sinh tập luật mờ từ liệu Một thuật toán tối ưu áp dụng để tìm tham số ngữ nghĩa tối ưu chúng sử dụng để sinh tập luật khởi đầu làm đầu vào cho thủ tục lựa chọn tập luật nhỏ gọn dễ hiểu cho hệ phân lớp sở thỏa hiệp độ xác độ phức tạp hệ phân lớp Kết thực nghiệm thảo luận Mục trình bày kết thực nghiệm phương pháp biểu diễn ngữ nghĩa tính tốn từ ngơn ngữ dựa tập mờ hình thang theo cấu trúc đa ngữ nghĩa sinh ĐSGT AXen, đảm bảo tính giải nghĩa hệ phân lớp chứng minh tính hiệu hệ phân lớp so với cấu trúc đa thể hạt cũ tiếp cận lý thuyết tập mờ http://jst.tnu.edu.vn 110 Email: jst@tnu.edu.vn 227(16): 107 - 114 TNU Journal of Science and Technology 3.1 Cài đặt thực nghiệm Các thực nghiệm cài đặt ngôn ngữ C# chạy Windows 10 với cấu hình máy Intel Core i5-8250U 1,8GHz, 8GB RAM Các tập liệu dùng thực nghiệm lấy từ nguồn KEEL-Dataset địa http://sci2s.ugr.es/keel/datasets.php Phương pháp kiểm tra chéo 10 nhóm (ten-folds cross-validation) áp dụng để huấn luyện kiểm tra Phương pháp kiểm định giả thuyết thống kê Wilcoxon [19] sử dụng để kết luận ý nghĩa so sánh phương pháp Nhằm giảm khơng gian tìm kiếm q trình huấn luyện, ràng buộc giá trị tham số ngữ nghĩa áp dụng sau: số gia tử âm số gia tử dương 1, gia tử âm “Less” (L) gia tử dương “Very” (V); ≤ kj ≤ 3; 0,2 ≤ - ( ) ( ) ≤ 0,7; 0,00001 ≤ {fm(0j), fm(1j)} ≤ 0,1; 0,0001 ≤ fm(Wj) ≤ 0,2; ( ) ( ) ( ) ; 0,2 ≤ {(Lj), (Vj)} ≤ 0,7; 0,01 ≤ (h0,j) ≤ 0,5; (Lj) + (Vj) + (h0,j) = Để tối ưu tham số ngữ nghĩa lựa chọn hệ luật tối ưu cho hệ phân lớp, thuật toán tối ưu bầy đàn đa mục tiêu (PSO) [20] sử dụng Trong tối ưu tham số ngữ nghĩa, giá trị tham số thuật toán: số hệ 250; số cá thể hệ 600; hệ số Inertia 0,4; hệ số nhận thức cá nhân 0,2; hệ số nhận thức xã hội 0,2; số luật khởi tạo số thuộc tính; độ dài tối đa luật Trong tối ưu hệ luật, giá trị tham số thuật toán: số hệ 1000; số luật khởi tạo |S0| = 300 × số lớp; độ dài tối đa luật Phương pháp lập luận phân lớp sử dụng tất thực nghiệm single winner rule [3, 4], tiêu chuẩn sàng luật tích độ tin cậy độ hỗ trợ tương ứng theo công thức (4) (5) [4] trọng số luật tính tốn theo cơng thức (10) [4] 3.2 Kết thực nghiệm Bảng ết thực nghiệm hệ phân lớp FRBC_GS FRBC_AXen STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Tập liệu Appendicitis Australian Bands Bupa Cleveland Dermatology Glass Haberman Hayes-roth Heart Hepatitis Ionosphere Iris Mammogr Newthyroid Pima Saheart Sonar Tae Vehicle Wdbc Wine Wisconsin Trung bình http://jst.tnu.edu.vn #R 3,93 4,80 6,00 9,77 13,93 12,20 14,53 3,00 9,57 7,50 4,00 8,53 4,00 6,97 6,00 6,40 6,60 6,00 9,47 11,17 4,73 5,67 7,90 FRBC_GS #R×C Ptr 18,35 92,52 48,34 88,53 56,22 76,44 186,31 77,28 410,52 68,97 259,86 96,88 443,60 78,91 9,60 77,20 110,06 88,31 87,53 88,46 19,48 93,51 85,90 95,17 16,00 98,00 78,55 85,64 52,20 97,57 55,49 78,23 64,88 75,86 48,42 88,16 142,71 69,91 195,81 70,13 40,82 97,42 34,98 99,73 75,29 97,92 110,47 86,12 Pte 88,52 87,54 74,32 72,44 62,17 95,62 72,33 76,77 85,00 84,57 89,93 91,84 98,00 84,33 96,46 76,95 70,49 79,75 62,07 68,52 96,78 98,70 97,09 83,05 111 #R 3,67 5,00 6,00 8,97 14,57 10,43 14,23 3,00 9,80 8,37 3,70 8,63 5,30 7,10 5,33 5,97 5,63 5,87 10,90 11,23 4,00 5,77 7,87 FRBC_AXen #R×C Ptr 92,38 16,77 88,56 46,50 58,20 78,19 79,78 181,19 468,13 66,64 96,37 182,84 474,29 78,78 10,80 77,60 114,66 89,40 123,29 89,19 25,53 93,68 88,03 94,69 30,37 98,25 85,49 73,84 96,76 39,82 56,12 78,69 75,51 59,28 49,31 87,59 210,70 68,97 70,74 195,07 97,08 25,04 40,39 99,60 97,78 69,81 114,78 86,16 ≠Pte ≠R×C Pte 88,15 0,37 1,58 87,15 0,39 1,84 73,46 0,86 -1,98 72,38 0,06 5,12 62,39 -0,22 -57,62 94,40 1,22 77,02 72,24 0,09 -30,68 -1,20 77,40 -0,63 84,17 0,83 -4,60 84,57 0,00 -35,77 89,28 0,65 -6,05 91,56 0,28 -2,13 97,33 0,67 -14,37 84,2 0,13 4,71 95,67 0,79 12,38 -0,63 77,01 -0,06 70,05 0,44 5,59 78,61 1,14 -0,89 61,00 1,07 -67,98 68,20 0,32 0,74 96,78 0,00 15,78 98,49 0,21 -5,41 96,95 0,14 5,48 82,67 Email: jst@tnu.edu.vn 227(16): 107 - 114 TNU Journal of Science and Technology Ký hiệu hệ phân lớp đề xuất FRBC_GS ký hiệu hệ phân lớp sử dụng cấu trúc đa thể hạt cũ khơng đảm bảo tính giải nghĩa hệ phân lớp [10] FRBC_AXen Bảng thể kết thực nghiệm so sánh hai hệ phân lớp FRBC_GS FRBC_AXen, đó, ký hiệu #R số luật trung bình, #R×C độ phức tạp hệ phân lớp tính tích số luật trung bình #R số điều kiện luật trung bình C, Ptr Pte độ xác phân lớp trung bình tập huấn luyện tập kiểm tra, ≠Pte ≠R×C tương ứng chênh lệch độ xác tập kiểm tra độ phức tạp hai hệ phân lớp so sánh Trực giác quan sát kết thực nghiệm Bảng cho thấy, hệ phân lớp FRBC_GS có độ xác phân lớp tập kiểm tra cao so với hệ phân lớp FRBC_AXen 20 số 23 tập liệu thực nghiệm Xét độ xác phân lớp trung bình của 23 tập liệu, hệ phân lớp FRBC_GS có độ xác phân lớp trung bình 83,05%, tốt so với hệ phân lớp FRBC_AXen có độ xác phân lớp trung bình 82,67%, có độ phức tạp trung bình thấp chút (110,47 so với 114,78) Bảng So sánh độ xác hai hệ phân lớp FRBC_GS FRBC_AXen Wilcoxon Signed Rank test với α = 0,05 So sánh (α = 0,05) FRBC_GS vs FRBC_AXen R+ 247,0 R29,0 Exact P-value 4,08E-4 Hypothesis Rejected Bảng So sánh độ phức tạp hai hệ phân lớp FRBC_GS FRBC_AXen Wilcoxon Signed Rank test với α = 0,05 So sánh (α = 0,05) FRBC_GS vs FRBC_AXen R+ R158,0 118,0 Exact P-value ≥ 0,2 Hypothesis Not Rejected Thực kiểm định giả thuyết thống kê Wilcoxon [19] với độ tin cậy 95% (α = 0,05) sử dụng liệu Bảng với giả thiết độ xác phân lớp độ phức tạp tương ứng hai hệ phân lớp tương đương Trong Bảng 2, ta thấy giá trị Exact p-value < 0,05 nên giả thuyết tương đương độ xác phân lớp hai hệ phân lớp FRBC_GS FRBC_AXen bị bác bỏ Trong Bảng 3, giá trị Exact p-value > 0,05 nên giả thuyết tương đương độ phức tạp hai hệ phân lớp không bị bác bỏ Với kết kiểm định này, ta khẳng định phương pháp thiết kế ngữ nghĩa tính tốn dựa cấu trúc đa ngữ nghĩa khơng có biểu diễn phân hoạch mờ đảm bảo tính giải nghĩa FRBC mà cịn có độ xác phân lớp cao so với phương pháp biểu diễn đa thể hạt cũ Hơn nữa, kết thực nghiệm so sánh cho thấy việc đảm bảo tính giải nghĩa FRBC đóng vai trị quan trọng đảm bảo ngữ nghĩa tính tốn phản ánh tính mờ thơng tin làm tăng hiệu suất hệ phân lớp Để tính hiệu hệ phân lớp đề xuất, kết thực nghiệm hệ phân lớp FRBC_CS so sánh với kết hệ phân lớp theo tiếp cận lý thuyết tập mờ đề xuất [1] [2] tương ứng Product-1-ALL TUN PAES-RCS Kết thực nghiệm Bảng cho thấy, hệ phân lớp FRBC_CS cho độ xác phân lớp cao hai hệ phân lớp Product-1-ALL TUN PAES-RCS 22 23 tập liệu thử nghiệm Xét giá trị trung bình độ xác phân lớp, hệ phân lớp FRBC_CS có giá trị trung bình 83,05%, cao 2,48% 2,39% tương ứng so với hệ phân lớp Product-1-ALL TUN PAES-RCS Xét độ phức tạp hệ phân lớp, hệ phân lớp FRBC_CS có độ phức tạp phân lớp thấp nhiều so với hai hệ phân lớp lại, tương ứng 110,47 so với 163,40 355,23 Kết kiểm định giả thuyết thống kê Wilcoxon với độ tin cậy 95% (α = 0,05) sử dụng liệu Bảng độ xác phân lớp độ phức tạp hệ luật tương ứng thể Bảng Bảng Do giá trị Exact p-value nhỏ 0,05 nên giả thuyết tương đương độ xác phân lớp độ phức tạp hệ phân lớp FRBC_CS so với Product-1-ALL TUN PAES-RCS bị bác bỏ Do đó, ta khẳng định hệ phân lớp FRBC_CS tốt hai hệ phân lớp lại hai tiêu chí độ xác phân lớp độ phức tạp hệ phân lớp http://jst.tnu.edu.vn 112 Email: jst@tnu.edu.vn 227(16): 107 - 114 TNU Journal of Science and Technology Bảng ết thực nghiệm hệ phân lớp FRBC_CS, Product-1-ALL TUN PAES-RCS STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Tập liệu FRBC_CS #R×C Appendicitis 18,35 Australian 48,34 Bands 56,22 Bupa 186,31 Cleveland 410,52 Dermatology 259,86 Glass 443,60 Haberman 9,60 Hayes-roth 110,06 Heart 87,53 Hepatitis 19,48 Ionosphere 85,90 Iris 16,00 Mammogr 78,55 Newthyroid 52,20 Pima 55,49 Saheart 64,88 Sonar 48,42 Tae 142,71 Vehicle 195,81 Wdbc 40,82 Wine 34,98 Wisconsin 75,29 Trung bình 110,47 PAES-RCS Pte #R×C 88,52 35,28 87,54 329,64 74,32 756,00 72,44 256,20 62,17 1140,00 95,62 389,40 72,33 487,90 76,77 202,41 85,00 120,00 84,57 300,30 89,93 300,30 91,84 670,63 98,00 69,84 84,33 132,54 96,46 97,75 76,95 270,64 70,49 525,21 79,75 524,60 62,07 323,14 68,52 555,77 96,78 183,70 98,70 170,94 97,09 328,02 83,05 355,23 ≠Pte ≠R×C Pte 85,09 3,43 -16,93 85,80 1,74 -281,30 67,56 6,76 -699,78 68,67 3,77 -69,89 59,06 3,11 -729,48 95,43 0,19 -129,54 72,13 0,20 -44,30 72,65 4,12 -192,81 84,03 0,97 -9,94 83,21 1,36 -212,78 83,21 6,72 -280,82 90,40 1,44 -584,73 95,33 2,67 -53,84 83,37 0,96 -53,99 95,35 1,11 -45,55 74,66 2,29 -215,15 70,92 -0,43 -460,33 77,00 2,75 -476,18 60,81 1,26 -180,43 64,89 3,63 -359,96 95,14 1,64 -142,88 93,98 4,72 -135,96 96,46 0,63 -252,73 80,66 Product-1-ALL TUN ≠Pte #R×C Pte 20,89 87,30 1,22 62,43 85,65 1,89 104,09 65,80 8,52 210,91 67,19 5,25 1020,66 58,80 3,37 185,28 94,48 1,14 534,88 71,28 1,05 21,13 71,88 4,89 158,52 78,88 6,12 164,61 82,84 1,73 20,29 88,53 1,40 86,75 90,79 1,05 18,54 97,33 0,67 106,74 80,49 3,84 56,47 94,60 1,86 57,20 77,05 -0,10 110,84 70,13 0,36 47,59 78,90 0,85 215,92 60,78 1,29 382,12 66,16 2,36 44,27 94,90 1,88 58,99 93,03 5,67 69,11 96,35 0,74 163,40 80,57 ≠R×C -2,54 -14,10 -47,87 -24,60 -610,14 74,58 -91,28 -11,53 -48,47 -77,09 -0,81 -0,85 -2,54 -28,18 -4,27 -1,71 -45,96 0,83 -73,20 -186,31 -3,45 -24,00 6,18 Bảng So sánh độ xác hệ phân lớp FRBC_CS so với Product-1-ALL TUN PAES-RCS kiểm định Wilcoxon với α = 0,05 So sánh (α = 0,05) FRBC_CS vs PAES-RCS FRBC_CS vs Product-1-ALL TUN R+ 273,0 275,0 R3,0 1,0 Exact P-value 1.192E-6 4.768E-7 Hypothesis Rejected Rejected Bảng So sánh độ phức tạp hệ phân lớp FRBC_CS so với Product-1-ALL TUN PAES-RCS kiểm định Wilcoxon với α = 0,05 So sánh (α = 0,05) FRBC_CS vs PAES-RCS FRBC_CS vs Product-1-ALL TUN R+ 276,0 246,0 R- Exact P-value 0,0 2.384E-7 30,0 4.752E-4 Hypothesis Rejected Rejected Kết luận Đảm bảo tính giải nghĩa hệ dựa luật mờ nói chung hệ phân lớp dựa luật mờ nói riêng đóng vai trị quan trọng đảm bảo ngữ nghĩa tính tốn phản ánh tính mờ thơng tin q trình xử lý thơng tin qn Bài báo trình bày phương pháp thiết kế ngữ nghĩa tính tốn dựa tập mờ từ ngơn ngữ đảm bảo tính giải nghĩa hệ phân lớp dựa luật mờ Bằng kết thực nghiệm kết luận so sánh phương pháp kiểm định giả thuyết thống kê Wilcoxon cho thấy tính hiệu phương pháp biểu diễn áp dụng thiết kế hệ phân lớp dựa luật mờ Lời cám ơn Nghiên cứu tài trợ Trường Đại học Giao thông vận tải đề tài mã số T2022CN-001TĐ http://jst.tnu.edu.vn 113 Email: jst@tnu.edu.vn ... jst@tnu.edu.vn 227 (16 ): 10 7 - 11 4 TNU Journal of Science and Technology Bảng ết thực nghiệm hệ phân lớp FRBC_CS, Product -1- ALL TUN PAES-RCS STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Tập liệu... 21, 13 71, 88 4,89 15 8,52 78,88 6 ,12 16 4, 61 82,84 1, 73 20,29 88,53 1, 40 86,75 90,79 1, 05 18 ,54 97,33 0,67 10 6,74 80,49 3,84 56,47 94,60 1, 86 57,20 77,05 -0 ,10 11 0,84 70 ,13 0,36 47,59 78,90 0,85 215 ,92... 60,78 1, 29 382 ,12 66 ,16 2,36 44,27 94,90 1, 88 58,99 93,03 5,67 69 ,11 96,35 0,74 16 3,40 80,57 ≠R×C -2,54 -14 ,10 -47,87 -24,60 - 610 ,14 74,58 - 91, 28 -11 ,53 -48,47 -77,09 -0, 81 -0,85 -2,54 -28 ,18 -4,27