Bài viết này trình bày phương pháp thiết kế ngữ nghĩa tính toán dựa trên tập mờ dạng hàm S được sinh bởi đại số gia tử mở rộng và được biểu diễn dưới dạng cấu trúc phân hoạch mờ đảm bảo tính giải nghĩa được của hệ phân lớp dựa trên luật mờ.
Tập 2020, Số 1, Tháng Một phương pháp thiết kế ngữ nghĩa tính tốn từ ngơn ngữ giải toán phân lớp dựa luật mờ Nguyễn Đức Dư1 , Phạm Đình Phong1 , Phạm Đình Vũ2 , Nguyễn Đức Thảo3 Khoa Công nghệ thông tin, Trường Đại học Giao thông vận tải Cục Công nghệ thông tin Thống kê hải quan, Tổng cục Hải quan Viện Khoa học Công nghệ quân Tác giả liên hệ: Nguyễn Đức Dư, nducdu@utc.edu.vn Ngày nhận bài: 20/01/2020, ngày sửa chữa: 17/06/2020 Định danh DOI: 10.32913/mic-ict-research-vn.vyyyy.nx.xyz Tóm tắt: Thiết kế ngữ nghĩa tính tốn từ ngôn ngữ sở luật biểu diễn cấu trúc chúng đóng vai trị quan trọng việc nâng cao hiệu suất tính giải nghĩa hệ dựa luật mờ Bài báo trình bày phương pháp thiết kế ngữ nghĩa tính toán dựa tập mờ dạng hàm S sinh đại số gia tử mở rộng biểu diễn dạng cấu trúc phân hoạch mờ đảm bảo tính giải nghĩa hệ phân lớp dựa luật mờ Kết thực nghiệm với 23 tập liệu chuẩn cho thấy hệ phân lớp với ngữ nghĩa tính tốn dựa tập mờ dạng hàm S cho độ xác phân lớp tốt so với ngữ nghĩa tính tốn dựa tập mờ tam giác hình thang tính hiệu biểu diễn cấu trúc phân hoạch mờ đảm bảo tính giải nghĩa hệ phân lớp so với cấu trúc phân hoạch đề xuất trước Từ khóa: đại số gia tử, thứ tự ngữ nghĩa, hàm thuộc, hệ phân lớp dựa luật mờ Title: Abstract: Keywords: A Design Method of Computational Semantics of Linguistic Words for Fuzzy Rule-based Classifier The design of computational semantics of linguistic terms in the fuzzy rule bases and structural representation of them play important roles in improving the performance and the interpretability of fuzzy rule-based systems This paper presents a method of designing computational fuzzy sets-based semantics in form of S-shape membership function generated by the enlarged hedge algebras and represented as fuzzy partition structure to ensure the interpretability of the fuzzy rule-based classifiers Experimental results over 23 real-world datasets have shown that the classifier with the fuzzy set-based computational semantics in form of S-shape membership function gives better classification accuracy than the ones previously proposed with triangular and trapezoidal fuzzy sets based semantics as well as shown the efficiency of the fuzzy partition structure representation which ensures the interpretability of the fuzzy rule-based classifiers in comparison with the existing ones hedge algebras, order-based semantics, membership function, fuzzy rule-based classifier I GIỚI THIỆU dụng số kỹ thuật khai phá liệu độ tin cậy, độ hỗ trợ trọng số luật kết hợp với thuật toán di truyền đa mục tiêu Alcalá cộng đề xuất [1] số phương pháp lựa chọn đơn thể hạt tốt số thể hạt thiết kế sẵn ban đầu họ quan niệm cấu trúc phân hoạch mờ đa thể hạt không giải nghĩa Sau thuật tốn di truyền áp dụng để lựa chọn hệ luật tối ưu đồng thời với tối ưu tham số hàm thuộc Một giản đồ tiến hóa đa mục tiêu nhanh hiệu Antonelli cộng đề xuất [2] có tên PAES-RCS Đây tiếp cận tiến hóa đa mục tiêu thực Hệ phân lớp dựa luật mờ (Fuzzy Rule Based Classifier – FRBC) có nhiều ứng dụng lĩnh vực khai phá liệu [1–4, 18–22] mơ hình phân lớp có ưu điểm dễ hiểu với người dùng sử dụng tri thức dạng luật if-then trích rút tự động từ liệu tri thức họ Trong [4, 5], Ishibuchi Yamamoto đề xuất phương pháp trích rút hệ luật mờ tối giản cho FRBC từ cấu trúc phân hoạch mờ đa thể hạt thiết kế sẵn cách áp 10 Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thông huấn luyện đồng thời sở luật sở liệu FRBC Trong pha đầu, tập luật mờ ứng cử viên sinh từ phân hoạch mờ thiết kế sẵn thuật tốn C4.5 Sau đó, thuật tốn tiến hóa đa mục tiêu thực để lựa chọn tập luật mờ từ tập luật ứng cử viên đồng thời với lựa chọn điều kiện luật mờ hiệu chỉnh tham số hàm thuộc Trong [5], Rey cộng đề xuất thêm mục tiêu tính thích hợp luật (rule relevance) bên cạnh hai mục tiêu tính xác (accuracy) tính giải nghĩa (interpretability) cho giải thuật tiến hóa đa mục tiêu lựa chọn hệ luật tối ưu cho hệ dựa luật mờ Trong [18], Rudzinski đề xuất thuật tốn tiến hóa đa mục tiêu thiết kế hệ phân lớp dựa luật mờ hướng tính giải nghĩa Trong trình huấn luyện, tham số hàm thuộc cấu trúc sở luật tiến hóa đồng thời Các độ đo số tập mờ hoạt động số biến đầu vào hoạt động (tức sử dụng luật) với độ dài trung bình luật sử dụng để đánh giá tính giải nghĩa hệ phân lớp Một mở rộng giải thuật Chi tiếng thiết kế hệ phân lớp dựa luật mờ phân tán cho phân lớp liệu lớn cách áp dụng khung làm việc liệu lớn phổ biến Apache Hadoop, đề xuất Elkanoa cộng [19] Trong [20] [21] tác giả đề xuất xây dựng hệ phân lớp dựa luật mờ đặc thù áp dụng lĩnh vực y tế đánh giá rủi ro tín dụng Một phương pháp thiết kế FRBC sử dụng giải thuật tiến hóa lượng tử đa dân số (Multi-population quantum evolutionary algorithm) với tái tạo lại luật mâu thuẫn Zhang cộng đề xuất [22] toán dựa tập mờ hình thang có ưu điểm so với hình tam giác biểu diễn lõi ngữ nghĩa khoảng từ ngôn ngữ Tuy nhiên, hai dạng tập mờ có cạnh biểu diễn hàm tuyến tính có độ dốc lớn nên chưa thật mềm dẻo gây mát thông tin lớn Một phương pháp thiết kế ngữ nghĩa tính tốn dựa tập mờ dạng hàm S sinh ĐSGT mở rộng [10] cho FRBC trình bày báo Do hàm S hàm phi tuyến nên phù hợp với biến thiên ngữ nghĩa vốn có từ ngơn ngữ biểu diễn lõi ngữ nghĩa khoảng từ ngôn ngữ Mặt khác, để đảm bảo tính giải nghĩa hệ dựa luật mờ thiết kế theo tiếp cận ĐSGT, [11] tác giả đưa bốn ràng buộc ngữ nghĩa tính tốn từ ngơn ngữ Các phương pháp thiết kế ngữ nghĩa tính tốn dựa tập mờ cho FRBC công bố [9, 10] chưa thỏa tất bốn ràng buộc Cụ thể, từ ngôn ngữ hx sinh từ từ ngơn ngữ x gia tử h có ngữ nghĩa cụ thể x giữ nguyên ngữ nghĩa gốc x Ví dụ, từ ngơn ngữ “rất trẻ” sinh từ từ ngôn ngữ “trẻ” gia tử có ngữ nghĩa cụ thể “trẻ” giữ ngữ nghĩa gốc “trẻ” Do đó, để thỏa ràng buộc thứ ba [11], biểu diễn cấu trúc phân hoạch mờ sử dụng tập mờ độ hỗ trợ tập mờ ứng với từ ngôn ngữ hx phải nằm trọn độ hỗ trợ tập mờ ứng với từ ngôn ngữ x Tuy nhiên, thiết kế phân hoạch mờ [9, 10] khơng thỏa tính chất Bài báo trình bày phương pháp biểu diễn cấu trúc phân hoạch mờ sử dụng tập mờ có dạng hàm S thỏa tất bốn ràng buộc [11], tức đảm bảo tính giải nghĩa hệ phân lớp dựa luật mờ Phần lại báo bố cục sau: mục trình bày tóm tắt ĐSGT mở rộng hệ phân lớp dựa luật mờ với ngữ nghĩa dựa tập mờ dạng hàm S; mục trình bày kết thực nghiệm thảo luận; số kết luận rút mục Như trình bày trên, phương pháp thiết kế FRBC sở lý thuyết tập mờ [1–4, 18–22] trích rút luật mờ từ phân hoạch mờ thiết kế sẵn miền giá trị thuộc tính sử dụng tập mờ Để nâng cao hiệu phân lớp, giá trị tham số hàm thuộc hiệu chỉnh thích nghi giải thuật tối ưu Do khơng có sở hình thức kết nối ngữ nghĩa từ ngôn ngữ với tập mờ nên ngữ nghĩa tính tốn dựa tập mờ khơng phản ảnh ngữ nghĩa thực ngôn ngữ sau trình tối ưu làm ảnh hưởng đến tính giải nghĩa hệ luật phân lớp II NỘI DUNG NGHIÊN CỨU Một số khái niệm đại số gia tử mở rộng ĐSGT mở rộng [10] xây dựng việc bổ sung gia tử nhân tạo ℎ0 nhằm mơ hình hóa lõi ngữ nghĩa từ ngôn ngữ Một cấu trúc AX 𝑒𝑛 = (𝑋𝑒𝑛 , 𝐺, 𝐶, 𝐻𝑒𝑛 , ≤) gọi ĐSGT mở rộng (ĐSGTMR) ĐSGT tuyến tính sinh tự AX thỏa tiên đề bổ sung sau: Đại số gia tử (ĐSGT) [6–8] có ứng dụng hiệu khai phá liệu [9–12], điều khiển mờ [13], xử lý ảnh [14], lập lịch [15], ĐSGT khai thác tính thứ tự ngữ nghĩa từ miền giá trị ngôn ngữ biến ngơn ngữ để hình thành sở hình thức tốn học cho việc liên kết ngữ nghĩa tính tốn dựa tập mờ với ngữ nghĩa vốn có từ ngơn ngữ Trên sở đó, ĐSGT ứng dụng hiệu để thiết kế tối ưu từ ngôn ngữ với ngữ nghĩa tính tốn dựa tập mờ hình tam giác [9] hình thang [10] cho FRBC Ngữ nghĩa tính (A1) ℎ0 𝑥 ∉ 𝐻 (𝐺) = {𝜎c |𝑐 ∈ 𝐺} ℎℎ0 𝑥 = ℎ0 𝑥 điểm bất động (A2) ℎ 𝑝 𝑥 ≥ 𝑥 ⇒ ℎ−𝑞 𝑥 ≤ ≤ ℎ−1 𝑥 ≤ ℎ0 𝑥 ≤ ℎ1 𝑥 ≤ ≤ ℎ 𝑝 𝑥 ℎ 𝑝 𝑥 ≤ 𝑥 ⇒ ℎ 𝑝 𝑥 ≤ ≤ ℎ1 𝑥 ≤ ℎ0 𝑥 ≤ ℎ–1 𝑥 ≤ ≤ ℎ–𝑞 𝑥 Một hàm 𝑓 𝑚: 𝑋𝑒𝑛 → [0, 1] gọi độ đo tính mờ ĐSGTMR AX 𝑒𝑛 thỏa tính chất sau: 11 Tập 2020, Số 1, Tháng (F1): 𝑓 𝑚(0) + 𝑓 𝑚(𝑐− ) + 𝑓 𝑚(𝑊) + 𝑓 𝑚(𝑐+ ) + 𝑓 𝑚(1) = 1; A𝑞 ⇒ 𝐶𝑞 with 𝐶𝐹𝑞 , với 𝑞 = 1, , 𝑁 𝑓 𝑚(ℎ𝑥) = 𝑓 𝑚(𝑥) với ∀𝑥 ∈ 𝐻 (𝐺); (F2): A𝑞 tiền đề luật thứ 𝑞 ℎ ∈𝐻𝑒𝑛 Giải tốn P trích xuất từ tập liệu P tập luật S có dạng (1) nhỏ gọn, dễ hiểu với người dùng có độ xác phân lớp cao Phương pháp thiết kế hệ phân lớp dựa luật mờ theo tiếp cận ĐSGT gồm hai bước (xem Hình 1): (F3): ∀𝑥, 𝑦 ∈ 𝐻 (𝐺), ∀ℎ ∈ 𝐻𝑒𝑛 tỷ lệ 𝑓 𝑚(ℎ𝑥)/ 𝑓 𝑚(ℎ𝑦) = 𝑓 𝑚(𝑥)/ 𝑓 𝑚(𝑦) không phụ thuộc vào từ ngôn ngữ 𝑋𝑒𝑛 gọi độ đo tính mờ gia tử ℎ ký hiệu 𝜇(ℎ) Độ đo tính mờ từ ngơn ngữ ĐSGTMR 𝑋𝑒𝑛 thỏa tính chất sau: 1) Thiết kế tối ưu từ ngôn ngữ với ngữ nghĩa tính tốn dựa tập mờ chúng sử dụng giải thuật tối ưu Sau bước ta thu tham số ngữ nghĩa tối ưu 2) Trích xuất từ tập liệu huấn luyện tập luật tối ưu cho hệ phân lớp sở thỏa hiệp tính dễ hiểu độ xác hệ phân lớp sử dụng giải thuật tối ưu 𝑓 𝑚 (𝑥) = 1, 𝑘 > Với 𝑘 = 𝑓 𝑚(0) + (1) 𝑥 ∈𝑋 (𝑘) 𝑓 𝑚(𝑐− ) + 𝑓 𝑚(𝑊) + 𝑓 𝑚(𝑐+ ) + 𝑓 𝑚(1) = 1; 𝜇 (ℎ) = (2) (2) ℎ ∈𝐻𝑒𝑛 (3) 𝑓 𝑚(ℎ𝑥) = 𝜇(ℎ) 𝑓 𝑚(𝑥), với ∀ℎ ∈ 𝐻𝑒𝑛 , ∀𝑥 ∈ 𝐻 ({𝑐− , 𝑐+ }) ℎ𝑥 ≠ 𝑥; (4) 𝑓 𝑚(𝑥) = 𝜇(ℎ 𝑛 ) 𝜇(ℎ1 ) 𝑓 𝑚(𝑐), 𝑥 = ℎ 𝑛 ℎ1 𝑐, 𝑐 ∈ {𝑐− , 𝑐+ }, biểu diễn tắc 𝑥 ∈ 𝑋𝑒𝑛 Cho độ đo tính mờ 𝑓 𝑚 : 𝑋𝑒𝑛 → [0, 1] ĐSGTMR AX 𝑒𝑛 biến ngữ X từ 𝑥 ∈ 𝑋𝑒𝑛 liên kết với khoảng (𝑥) ⊆ [0, 1] Các khoảng gọi khoảng tính mờ ứng với từ X thỏa điều kiện sau: (FI1): | (𝑥)| = 𝑓 𝑚(𝑥) với ∀𝑥 ∈ 𝑋𝑒𝑛 | (𝑥)| biểu thị độ dài khoảng (𝑥); Bắt đầu Đọc giá trị tối ưu tham số ngữ nghĩa Đọc liệu Sinh tập luật khởi đầu S0 từ liệu thủ tục IFRG Tối ưu tham số ngữ nghĩa với trình sinh luật sử dụng thủ tục IFRG (FI2): Tập { (ℎ𝑥)|𝑥 ∈ 𝑋𝑒𝑛 } tạo thành phân hoạch (𝑥) có thứ tự tương đồng với thứ tự từ ngơn ngữ liên kết với chúng Khoảng tính mờ mức 𝑘 𝑥 ký hiệu 𝑘 (𝑥) Quy ước khoảng tính mờ mở phải đóng trái, khoảng tính mờ tử đóng hai phía Xuất giá trị tham số ngữ nghĩa tối ưu Ánh xạ ngữ nghĩa định lượng khoảng 𝑓 (𝑥) từ ngôn ngữ 𝑥 xác định hàm 𝑓 (𝑥) = (ℎ0 𝑥), 𝑥 ∈ 𝑋𝑒𝑛 khẳng định chứng minh [10] Giai đoạn 1: tối ưu tham số ngữ nghĩa Tối ưu tập luật khởi đầu S0 sử dụng thuật toán tối ưu Xuất hệ luật tối ưu S cho FRBC Kết thúc Giai đoạn 2: tối ưu hệ luật Hình Phương pháp hai bước thiết kế FRBC Thiết kế FRBC với ngữ nghĩa tính toán dựa tập mờ dạng hàm S ĐSGTMR cung cấp sở hình thức cho phép ngữ nghĩa định tính xác định giá trị ngữ nghĩa định lượng khoảng từ ngôn ngữ, sở ngữ nghĩa dựa tập mờ có lõi khoảng chúng xây dựng Trong báo sử dụng ĐSGTMR để sinh ngữ nghĩa dựa tập mờ có dạng hàm 𝑆 có lõi khoảng cho hệ phân lớp dựa luật mờ Bài toán thiết kế hệ phân lớp dựa luật mờ P định nghĩa sau: Một tập P = {(d 𝑝 , 𝐶 𝑝 )| d 𝑝 ∈ D, 𝐶 𝑝 ∈ C, 𝑝 = 1, , 𝑚} gồm 𝑚 mẫu liệu, d 𝑝 = [𝑑 𝑝,1 , 𝑑 𝑝,2 , , 𝑑 𝑝,𝑛 ] dòng thứ 𝑝 𝑡 ℎ , C = {𝐶𝑠 |𝑠 = 1, , 𝑀} tập gồm 𝑀 nhãn lớp, 𝑛 số thuộc tính Hệ sở luật cho toán phân lớp sử dụng báo tập luật có số dạng: Mỗi ĐSGT AX 𝑒𝑛 𝑗 liên kết với thuộc tính thứ 𝑗 tập liệu cảm sinh từ ngơn ngữ 𝑋 𝑗, (𝑘 𝑗 ) có độ dài lớn 𝑘 𝑗 theo thứ tự ngữ nghĩa chúng Vì ngữ nghĩa định lượng khoảng 𝑓 (𝑥 𝑗,𝑖 ) = (ℎ0 𝑥 𝑗,𝑖 ) ⊆ (𝑥 𝑗,𝑖 ) biểu thị lõi ngữ nghĩa từ ngôn ngữ 𝑥 𝑗,𝑖 nên dùng để biểu diễn đỉnh tập mờ dạng hàm 𝑆 ứng với từ 𝑥 𝑗,𝑖 Các giá trị khoảng đỉnh tập mờ phù hợp với ngữ nghĩa định tính từ nên có giá trị Luật 𝑅𝑞 : If X1 is 𝐴𝑞,1 and and X𝑛 is 𝐴𝑞,𝑛 then 𝐶𝑞 with CF 𝑞 , for q = 1, , N (1) 𝜒 = {X 𝑗 , 𝑗 = 1, , 𝑛} tập 𝑛 biến ngơn ngữ ứng với 𝑛 thuộc tính tập liệu P; 𝐴𝑞, 𝑗 giá trị ngơn ngữ thuộc tính thứ 𝑗, 𝐹 𝑗 ; 𝐶𝑞 nhãn lớp 𝐶𝐹𝑞 trọng số luật 𝑅𝑞 Luật 𝑅𝑞 viết gọn lại sau: 12 Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thơng Ký kiệu L(•) R(•) điểm mút trái mút phải khoảng Giả sử đặt 𝑎 = R ( 𝑓 (𝑥 𝑗,𝑖−1 )), 𝑐 = L ( 𝑓 (𝑥 𝑗,𝑖 )), 𝑑 = R ( 𝑓 (𝑥 𝑗,𝑖 )), 𝑔 = L ( 𝑓 (𝑥 𝑗,𝑖+1 )), 𝑏 = 𝑎 + (𝑐 − 𝑎)/4, 𝑒 = 𝑑 + (𝑔 − 𝑒)/4 𝑣 điểm liệu Ta có hàm biểu diễn độ thuộc 𝑣 vào nửa trái hàm 𝑆, 𝑆𝑙𝑒 𝑓 𝑡 sau: 0, 0≤𝑣≤𝑎 (𝑣−𝑎) (𝑏−𝑎) , 𝑎 ≤𝑣≤𝑏 (𝑐−𝑎) 𝑆𝑙𝑒 𝑓 𝑡 = (𝑣−𝑐) − (𝑐−𝑏) (𝑐−𝑎) , 𝑏≤𝑣≤𝑐 1, 𝑣≥𝑐 hàm biểu diễn độ thuộc 𝑣 vào nửa phải hàm 𝑆, 𝑆𝑟 𝑖𝑔ℎ𝑡 sau: 1, 0≤𝑣≤𝑑 (𝑣−𝑑) − (𝑑−𝑒) (𝑑−𝑔) , 𝑑≤𝑣≤𝑒 𝑆𝑟 𝑖𝑔ℎ𝑡 = (𝑣−𝑔) 𝑒≤𝑣≤𝑔 (𝑒−𝑑) (𝑔−𝑑) , 0, 𝑣≥𝑔 Tập mờ dạng hàm 𝑆 biểu diễn Hình k0 , sử dụng tập mờ dạng hàm 𝑆 với độ dài tối đa từ ngơn ngữ 𝑘 𝑗 = Trong đó, tập mờ ứng với từ 𝐿𝑐+ có mút trái 𝑎 = R ( 𝑓 (𝐿𝑐− )) mút phải 𝑔 = L ( 𝑓 (𝑉 𝑐+ )), tương tự với tập mờ khác Với giá trị cụ thể tham số ngữ nghĩa bao gồm 𝑓 𝑚(𝑐− ), 𝑓 𝑚(𝑊 𝑗 ), 𝑓 𝑚(0 𝑗 ), 𝑓 𝑚(1 𝑗 ), 𝜇(ℎ 𝑗,𝑖 ), 𝜇(ℎ 𝑗,0 ) độ đo tính mờ tương ứng 𝑐−𝑗 , 𝑊 𝑗 , 𝑗 , 𝑗 , ℎ 𝑗,𝑖 , ℎ 𝑗,0 với giá trị cụ thể 𝑘 𝑗 , khoảng tính mờ 𝑘 (𝑥 𝑗,𝑖 ), 𝑥 𝑗,𝑖 ∈ 𝑋 𝑗,𝑘 , 𝑘 ≤ 𝑘 𝑗 ngữ nghĩa định lượng khoảng 𝑓 (𝑥 𝑗,𝑖 ) tính tốn Các khoảng tính mờ 𝑘 𝑗 (𝑥 𝑗,𝑖 ) tạo thành phân hoạch mức 𝑘 𝑗 miền giá trị thuộc tính 𝑗 Có khoảng tính mờ số khoảng tính mờ 𝑘 𝑗 (𝑥 𝑗,𝑖 ) chứa điểm liệu 𝑑 𝑝, 𝑗 mẫu liệu 𝑑 𝑝 Tất khoảng tính mờ mức 𝑘 𝑗 chứa 𝑑 𝑝, 𝑗 (0 ≤ 𝑗 ≤ 𝑛) tạo thành siêu hộp H 𝑝 sinh luật mờ từ siêu hộp loại Luật mờ sở có độ dài 𝑛 sinh từ H 𝑝 với nhãn lớp 𝐶 𝑝 mẫu liệu 𝑑 𝑝 có dạng sau: if X1 is 𝑥1,𝑖 (1) and and X 𝑛 is 𝑥 𝑛,𝑖 (𝑛) then 𝐶 𝑝 (𝑅𝑏 ) Trong báo này, tập mờ dạng hàm 𝑆 sử dụng để phân hoạch miền giá trị thuộc tính tập liệu dạng cấu trúc đa thể hạt đề xuất [10], gọi phân hoạch k1 dạng cấu trúc đa thể hạt đề xuất [11] với mức 𝑘 = tách thành hai mức 1, gọi phân hoạch k0 Các luật mờ thứ cấp có độ dài 𝐿 ≤ 𝑛 thu cách bỏ bớt 𝑛 − 𝐿 thuộc tính có dạng sau: if X 𝑗1 is 𝑥 𝑗1,𝑖 ( 𝑗1) and and X 𝑗𝑡 is 𝑥 𝑗𝑡 ,𝑖 ( 𝑗𝑡) then 𝐶𝑞 (𝑅𝑠𝑛𝑑 ) ≤ 𝑗 ≤ ≤ 𝑗 𝑡 ≤ 𝑛 Nhãn lớp 𝐶𝑞 luật 𝑅𝑞 xác định độ tin cậy 𝑐(A𝑞 ⇒ 𝐶ℎ ) [3, 4] 𝑅𝑞 : ên sở khoảng y chúng tập hệ phân 𝐶𝑞 = argmax(𝑐(A𝑞 ⇒ 𝐶ℎ ) | ℎ = 1, , 𝑀) (3) Độ tin cậy luật mờ tính sau: a b c d e g 𝑐(A𝑞 ⇒ 𝐶ℎ ) = ∑︁ 𝜇A𝑞 (𝑑 𝑝 )/ 𝑑 𝑝 ∈𝐶ℎ Hình Biểu diễn tập mờ dạng hàm 𝑆 𝑚 ∑︁ 𝜇A𝑞 (𝑑 𝑝 ) (4) 𝑝=1 𝜇A𝑞 𝑑 𝑝 độ đốt cháy mẫu liệu 𝑑 𝑝 tiền đề luật 𝑅𝑞 thường tính biểu thức tốn tử nhân theo cơng thức sau: Trong cấu trúc phân hoạch k1 thể hạt phân hoạch tập mờ ứng với từ ngơn ngữ có độ dài hai phần tử 1, theo thứ tự ngữ nghĩa từ ngôn ngữ tương ứng Cấu trúc phân hoạch k0 khác với k1 mức 𝑘 = gồm từ ngơn ngữ có độ dài tách thành hai thể hạt: thể hạt thứ (mức 𝑘 = 0) gồm tử 00 , 𝑊 10 , thể hạt thứ hai (mức 𝑘 = 1) gồm từ ngôn ngữ 01 , 𝑐− , 𝑐+ 11 Với cách thiết kế này, độ hỗ trợ tập mờ ứng với từ ngơn ngữ 𝑥 hồn tồn chứa độ hỗ trợ từ ngôn ngữ ℎ𝑥 [11] chứng minh phân hoạch k0 đảm bảo tính giải nghĩa hệ dựa luật mờ 𝑛 𝜇 A𝑞 𝑑 𝑝 = 𝜇𝑞, 𝑗 𝑑 𝑝, 𝑗 (5) 𝑗=1 với 𝜇𝑞, 𝑗 (𝑑 𝑝, 𝑗 ) độ thuộc điểm liệu 𝑑 𝑝, 𝑗 vào tập mờ 𝐴𝑞, 𝑗 Tập luật ứng viên thu sau sàng lọc luật không quán độ hỗ trợ Tiếp theo, tiêu chuẩn sàng sử dụng để chọn tập luật khởi đầu S0 gồm 𝑁 𝑅0 = 𝑁 𝐵0 × 𝑀 luật với 𝑀 số nhãn lớp 𝑁 𝐵0 số luật dành cho lớp Tiêu chuẩn sàng chọn độ tin cậy 𝑐 (công thức (4)), độ hỗ trợ 𝑠 tích 𝑐 × 𝑠 Độ hỗ trợ tính theo cơng thức sau [3]: Với từ ngôn ngữ tử 1, giá trị 𝑎 giá trị đầu mút phải giá trị định lượng khoảng từ gần bên trái có độ dài giá trị 𝑔 đầu mút trái giá trị định lượng khoảng từ gần bên phải có độ dài Ví dụ, Hình biểu diễn cấu trúc phân hoạch k1 Hình biểu diễn cấu trúc phân hoạch 𝑠(A𝑞 ⇒ 𝐶ℎ ) = ∑︁ 𝑑 𝑝 ∈𝐶ℎ 13 𝜇A𝑞 (𝑑 𝑝 )/𝑚 (6) Tập 2020, Số 1, Tháng f(Vc-) 02 Vc- f(0) 01 f(Lc-) f(Lc+) f(Vc+) Lc- Lc+ Vc+ f(c-) f(W) c- W f(c+) 12 f(1) c+ 11 = Hình Cấu trúc phân hoạch k1 với tập mờ dạng hàm 𝑆 𝑘 𝑗 = f(Vc-) 02 f(0) 01 Vc- f(Lc-) f(Lc+) f(Vc+) Lc- Lc+ Vc+ f(c-) f(c+) c- c+ f(W) f(0) Hình Cấu trúc phân hoạch k0 với tập mờ dạng hàm 𝑆 𝑘 𝑗 = 11 = 10 = H H Mỗi luật gán trọng số để nâng cao độ xác phân lớp Trong báo này, trọng số luật tính theo công thức [3]: 𝐶𝐹𝑞 = 𝑐 A𝑞 ⇒ 𝐶𝑞 − 𝑐 𝑞,2𝑛𝑑 , f(1) f(1) W 00 12 lớp Do đó, thuật tốn tối ưu áp dụng để tìm tham số ngữ nghĩa tối ưu chúng sử dụng để sinh tập luật khởi đầu làm đầu vào cho thủ tục lựa chọn tập luật nhỏ gọn dễ hiểu cho hệ phân lớp sở thỏa hiệp độ xác độ phức tạp hệ phân lớp (7) 𝑐 𝑞,2𝑛𝑑 độ tin cậy lớn luật có tiền đề 𝐴𝑞 khác kết luận 𝐶𝑞 : III KẾT QUẢ THỰC NGHIỆM VÀ THẢO LUẬN Mục trình bày kết thực nghiệm hệ c( Acấu trúc C phân hoạch k0 phân lớp dựa luật mờ sử dụng c(trên A tập Cmờ có dạng hàm k1 với ngữ nghĩa tính tốn dựa 𝑆 từ ngôn ngữ so sánh đánh giá với hệ phân lớp khác để minh chứng tính hiệu hệ phân lớp đề xuất 𝑐 𝑞,2𝑛𝑑 = max(𝑐(A𝑞 ⇒ 𝐶𝑙𝑎𝑠𝑠 ℎ) | ℎ = 1, , 𝑀; ℎ ≠ 𝐶𝑞 ) (8) Quá trình sinh luật thủ tục sinh tập luật khởi đầu IFRG(Π, P, 𝑁 𝑅0 , 𝐿) [9], Π tập giá trị tham số ngữ nghĩa 𝐿 số tiền đề tối đa luật Thủ tục trực quan hóa thể Hình Độ phức tạp thủ tục sinh tập luật khởi đầu IFRG đa thức số mẫu số thuộc tính tập liệu D chứng minh [9] Cài đặt thực nghiệm Các thực nghiệm được cài đặt ngôn ngữ C# chạy Windows Các tập liệu thực nghiệm lấy từ nguồn KEEL-Dataset địa http://sci2s.ugr.es/keel/datasets.php Phương pháp kiểm tra chéo 10 nhóm áp dụng để huấn luyện kiểm tra Mỗi loại liệu có phân bố liệu khác cần tham số ngữ nghĩa phù hợp để nâng cao hiệu suất phân 14 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông tối đa luật Phương pháp lập luận phân lớp sử dụng tất thực nghiệm single winner rule [3, 4], tiêu chuẩn sàng luật 𝑐 × 𝑠 trọng số luật tính tốn theo cơng (7) Bắt đầu Sinh khoảng tính mờ mức kj, ánh xạ ngữ nghĩa định lượng khoảng tập mờ từ giá trị tham số ngữ nghĩa cho tất thuộc tính Kết thực nghiệm Ký hiệu hệ phân lớp với ngữ nghĩa tính tốn dựa tập mờ dạng hàm 𝑆 với phân hoạch k0 [11] phân hoạch k1 [10] tương ứng FRBC_S_k0 FRBC_S, hệ phân lớp với ngữ nghĩa tính tốn dựa tập mờ hình thang với phân hoạch k0 phân hoạch k1 tương ứng FRBC_TRA_k0 FRBC_TRA, hệ phân lớp với ngữ nghĩa tính tốn dựa tập mờ tam giác [9] FRBC_TRI Bảng I thể kết thực nghiệm so sánh hệ phân lớp nêu trên, chữ đậm thể kết tốt so với hệ phân lớp lại Ký hiệu #R×C độ phức tạp hệ phân lớp (tích số luật trung bình số điều kiện trung bình luật), 𝑃𝑡𝑒 độ xác phân lớp trung bình tập kiểm tra Sinh luật sở độ dài n từ khoảng tính mờ mức kj chứa liệu Tính độ tin cậy độ hỗ trợ luật sinh luật thứ cấp độ dài L từ luật sở độ dài n Sàng luật với tiêu chuẩn sàng cụ thể để thu tập luật khởi đầu S0 Các kết thực nghiệm Bảng I cho thấy, hệ phân lớp FRBC_S_k0 có độ xác phân lớp tập kiểm tra cao so với hệ phân lớp FRBC_S, FRBC_TRA_k0, FRBC_TRA FRBC_TRI tương ứng 15, 18, 17 20 số 23 tập liệu thực nghiệm So sánh dựa độ xác phân lớp trung bình 23 tập liệu thực nghiệm, hệ phân lớp FRBC_S_k0 có độ xác phân lớp trung bình 83,04%, cao so với hệ phân lớp lại So sánh dựa độ phức tạp hệ phân lớp, hệ phân lớp khơng có chênh lệch nhiều Ngồi ra, hệ phân lớp FRBC_S có độ xác phân lớp trung bình 82,79%, cao so với hệ phân lớp FRBC_TRA FRBC_TRI có độ xác phân lớp trung bình 82,67% 81,92% Các kết kiểm định giả thuyết thống kê Wilcoxon [16] với độ tin cậy 90% (𝛼 = 0, 1) sử dụng liệu Bảng I với giả thiết độ xác phân lớp độ phức tạp tương ứng hai hệ phân lớp tương đương (Giả thuyết 𝐻0 ) thể Bảng II Bảng III Các giá trị Exact p-value Bảng II nhỏ 𝛼 = 0, cho biết giả thuyết tương đương 𝐻0 độ xác phân lớp hệ phân lớp so sánh bị bác bỏ Điều có nghĩa hệ phân lớp FRBC_S_k0 có độ xác phân lớp cao so với hệ phân lớp FRBC_S, FRBC_TRA_k0, FRBC_TRA FRBC_TRI; hệ phân lớp FRBC_S có độ xác phân lớp cao so với hai hệ phân lớp sử dụng cấu trúc phân hoạch k1 FRBC_TRA FRBC_TRI Các giá trị Exact p-value Bảng III lớn 𝛼 = 0, nên giả thuyết tương đương 𝐻0 độ phức tạp hệ phân lớp khơng bị bác bỏ Do đó, ta khẳng định rằng, với cách biểu diễn phân hoạch mờ hệ phân lớp dựa luật mờ với ngữ nghĩa tính tốn dựa tập mờ Tính trọng số cho luật tập luật khởi đầu S0 Kết thúc Hình Lưu đồ thủ tục sinh tập luật khởi đầu ` Để đảm bảo khác biệt kết thực nghiệm hệ phân lớp so sánh có ý nghĩa, phương pháp kiểm định giả thuyết thống kê Wilcoxon [16] sử dụng để kiểm tra giả thuyết 𝐻0 (null hypothesis) có độ tin cậy 90% (𝛼 = 0, 1) với giả định kết phương pháp so sánh tương đương Nhằm giảm khơng gian tìm kiếm q trình huấn luyện, ràng buộc giá trị tham số ngữ nghĩa áp dụng sau: số gia tử âm số gia tử dương 1, gia tử âm “Less” (𝐿) gia tử dương “Very” (𝑉); ≤ 𝑘 𝑗 ≤ 3; 0, ≤ 𝑓 𝑚 𝑐−𝑗 , 𝑓 𝑚 𝑐+𝑗 ≤ 0, 7; 0, 00001 ≤{fm(0 𝑗 ), fm(1 𝑗 )} ≤ 0, 01; 0, 0001 ≤ 𝑓 𝑚(𝑊 𝑗 ) ≤ 0, 2; 𝑓 𝑚 𝑗 + 𝑓 𝑚 𝑐−𝑗 + 𝑓 𝑚 𝑊 𝑗 + 𝑓 𝑚 𝑐+𝑗 + 𝑓 𝑚 𝑗 = 1; 0, ≤ {𝜇(𝐿 𝑗 ), 𝜇(𝑉 𝑗 )} ≤ 0, 7; 0, 01 ≤ 𝜇(ℎ0, 𝑗 ) ≤ 0, 5; and 𝜇(𝐿 𝑗 ) + 𝜇(𝑉 𝑗 ) + 𝜇(ℎ0, 𝑗 ) = Thuật toán tối ưu bầy đàn đa mục tiêu (PSO) [17] sử dụng cho toán tối ưu Trong tối ưu tham số ngữ nghĩa: số hệ 250; số cá thể hệ 600; hệ số Inertia 0.4; hệ số nhận thức cá nhân 0,2; hệ số nhận thức xã hội 0,2; số luật khởi tạo số thuộc tính; độ dài tối đa luật Trong tối ưu hệ luật: số hệ 1500; số luật khởi tạo |S0 | = 300 × số lớp; độ dài 15 Tập 2020, Số 1, Tháng KẾT QUẢ THỰC NGHIỆM CỦA STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Trung Tập liệu Appendicitis Australian Bands Bupa Cleveland Dermatology Glass Haberman Hayes-roth Heart Hepatitis Ionosphere Iris Mammogr Newthyroid Pima Saheart Sonar Tae Vehicle Wdbc Wine Wisconsin bình CÁC HỆ PHÂN LỚP FRBC_S_k0 #R×C 𝑃𝑡𝑒 23,30 88,73 46,23 87,54 59,40 73,00 177,72 72,03 509,54 61,73 240,11 96,26 467,18 72,97 12,00 77,42 117,14 85,21 117,24 84,94 26,10 91,22 98,81 92,32 16,52 98,00 77,87 84,36 44,55 96,59 62,11 76,45 95,24 71,07 59,29 77,98 163,80 61,22 177,29 68,48 27,88 96,19 36,73 98,87 91,27 97,34 119,45 83,04 Bảng I FRBC_S_K0, FRBC_S, FRBC_TRA_K0, FRBC_TRA VÀ FRBC_TRI FRBC_S #R×C 17,35 35,93 55,80 221,65 433,16 254,98 364,08 16,00 136,65 95,25 36,63 92,83 17,76 76,84 49,98 47,55 68,13 62,32 176,48 207,91 35,85 46,79 73,66 114,07 FRBC_TRA_k0 #R×C 𝑃𝑡𝑒 19,90 88,64 46,16 87,49 61,80 72,95 186,05 71,97 703,17 61,14 216,50 96,17 400,20 72,32 12,00 77,41 128,44 84,58 124,75 85,43 25,95 91,22 96,91 92,22 21,73 97,78 49,67 84,33 41,50 96,00 57,70 77,09 89,79 70,71 53,86 77,95 176,06 61,43 163,80 68,41 28,00 96,72 36,37 98,50 79,82 97,05 122,61 82,94 𝑃𝑡𝑒 88,48 87,25 73,40 72,19 61,86 94,50 72,30 77,43 84,36 84,69 89,99 91,65 97,33 84,25 95,84 77.17 70,42 79,43 61,44 68,88 95,90 98,51 96,80 82,79 FRBC_TRA #R×C 𝑃𝑡𝑒 16,77 88,15 46,50 87,15 58,20 73,46 181,19 72,38 468,13 62,39 182,84 94,40 474,29 72,24 10,80 77,40 114,66 84,17 123,29 84,57 25,53 89,28 88,03 91,56 30,37 97,33 73,84 84,2 39,82 95,67 56,12 77,01 59,28 70,05 49,31 78,61 210,70 61,00 195,07 68,20 25,04 96,78 40,39 98,49 69,81 96,95 114,78 82,67 FRBC_TRI #R×C 21,32 36,20 52,20 187,20 657,43 198,05 343,60 10,20 122,27 122,72 26,16 90,33 26,29 92,25 45,18 60,89 86,75 79,76 261,00 242,79 37,35 35,82 74,36 126,53 𝑃𝑡𝑒 87,55 86,38 72,80 68,09 62,19 96,07 72,09 75,76 84,17 84,44 88,44 90,22 96,00 84,20 94,42 76,18 69,33 76,80 59,47 67,62 96,96 98,30 96,74 81,92 Bảng II SO SÁNH ĐỘ CHÍNH XÁC GIỮA CÁC HỆ PHÂN LỚP FRBC_S_K0, FRBC_S, FRBC_TRA_K0, FRBC_TRA VÀ FRBC_TRI BẰNG PHƯƠNG PHÁP KIỂM ĐỊNH WILCOXON VỚI 𝛼 = 0, So sánh (𝛼 = 0,1) FRBC_S_k0 vs FRBC_S FRBC_S_k0 vs FRBC_TRA_k0 FRBC_S_k0 vs FRBC_TRA FRBC_S vs FRBC_TRA FRBC_S vs FRBC_TRI R+ 196,0 188,0 208,0 188,5 240,0 R− 80,0 65,0 68,0 64,5 36,0 Exact 𝑃-value 0,0802 0,04616 0,03266 0,04433 0,0011184 Giả thuyết H0 Bị bác bỏ Bị bác bỏ Bị bác bỏ Bị bác bỏ Bị bác bỏ Bảng III SO SÁNH ĐỘ PHỨC TẠP GIỮA CÁC HỆ PHÂN LỚP FRBC_S_K0, FRBC_S, FRBC_TRA_K0, FRBC_TRA VÀ FRBC_TRI BẰNG PHƯƠNG PHÁP KIỂM ĐỊNH WILCOXON VỚI 𝛼 = 0, So sánh (𝛼 = 0,1) FRBC_S_k0 vs FRBC_S FRBC_S_k0 vs FRBC_TRA_k0 FRBC_S_k0 vs FRBC_TRA FRBC_S vs FRBC_TRA FRBC_S vs FRBC_TRI R+ 133,0 126,0 99,0 115,0 161,0 R− 143,0 150,0 177,0 161,0 115,0 Exact 𝑃-value ≥ 0, ≥ 0, ≥ 0, ≥ 0, ≥ 0, Giả thuyết H0 Không bị bác bỏ Không bị bác bỏ Không bị bác bỏ Không bị bác bỏ Không bị bác bỏ mờ, kết thực nghiệm hệ phân lớp FRBC_S so sánh với kết hai hệ phân lớp PAESRCS FURIA [2] Kết so sánh Bảng IV cho thấy, hệ phân lớp FRBC_S cho độ xác phân lớp tập kiểm tra cao hệ phân lớp PAES-RCS FURIA 21 15 23 tập liệu thử nghiệm Xét giá trị trung bình độ xác phân lớp, hệ phân lớp FRBC_S có giá trị trung bình 82,79%, cao 2,13% 2,45% so với hệ phân lớp PAESRCS FURIA có giá trị trung bình 80,66% 80,34% Phân tích độ phức tạp hệ phân lớp, hệ từ ngơn ngữ có dạng hàm 𝑆 sinh ĐSGT mở rộng cho độ xác phân lớp cao so với dạng hình tam giác hình thang hàm 𝑆 biểu diễn biến thiên ngữ nghĩa tốt Ngoài ra, cấu trúc phân hoạch 𝑘 cho hiệu suất phân lớp tốt cấu trúc phân hoạch 𝑘 đồng thời đảm bảo tính giải nghĩa hệ phân lớp chứng minh [11] Nhằm thể tính hiệu hệ phân lớp với ngữ nghĩa tính tốn dựa tập mờ dạng hàm 𝑆 sinh ĐSGT mở rộng đề xuất so với tiếp cận lý thuyết tập 16 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông Bảng IV KẾT QUẢ THỰC NGHIỆM CỦA STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Trung Tập liệu Appendicitis Australian Bands Bupa Cleveland Dermatology Glass Haberman Hayes-roth Heart Hepatitis Ionosphere Iris Mammogr Newthyroid Pima Saheart Sonar Tae Vehicle Wdbc Wine Wisconsin bình FRBC_S #R×C 17,35 35,93 55,80 221,65 433,16 254,98 364,08 16,00 136,65 95,25 36,63 92,83 17,76 76,84 49,98 47,55 68,13 62,32 176,48 207,91 35,85 46,79 73,66 114,07 𝑃𝑡𝑒 88,48 87,25 73,40 72,19 61,86 94,50 72,30 77,43 84,36 84,69 89,99 91,65 97,33 84,25 95,84 77.17 70,42 79,43 61,44 68,88 95,90 98,51 96,80 82,79 HỆ PHÂN LỚP PAES-RCS #R×C 35,28 329,64 756,00 256,20 1140,00 389,40 487,90 202,41 120,00 300,30 300,30 670,63 69,84 132,54 97,75 270,64 525,21 524,60 323,14 555,77 183,70 170,94 328,02 355,23 FRBC_S, PAES-RCS VÀ FURIA ≠P𝑡𝑒 𝑃𝑡𝑒 85,09 85,80 67,56 68,67 59,06 95,43 72,13 72,65 84,03 83,21 83,21 90,40 95,33 83,37 95,35 74,66 70,92 77,00 60,81 64,89 95,14 93,98 96,46 80,66 3,39 1,45 5,84 3,52 2,80 -0,93 0,17 4,78 0,33 1,48 6,78 1,25 2,00 0,88 0,49 2,51 -0,50 2,43 0,63 3,99 0,76 4,53 0,34 ≠R×C -17,93 -293,71 -700,20 -34,55 -706,84 -134,42 -123,82 -186,41 16,65 -205,05 -263,67 -577,80 -52,08 -55,70 -47,77 -223,09 -457,08 -462,28 -146,66 -347,86 -147,85 -124,15 -254,36 FURIA #R×C 19,00 89,60 535,15 324,12 134,67 303,88 474,81 22,04 188,10 193,64 52,38 372,68 31,95 16,83 100,82 127,50 50,88 309,96 43,00 2125,97 356,12 80,00 521,10 281,49 𝑃𝑡𝑒 85,18 85,22 64,65 69,02 56,20 95,24 72,41 75,44 83,13 80,00 84,52 91,75 94,66 83,89 96,30 74,62 69,69 82,14 43,08 71,52 96,31 96,60 96,35 80,34 ≠P𝑡𝑒 3,30 2,03 8,75 3,17 5,66 -0,74 -0,11 1,99 1,23 4,69 5,47 -0,10 2,67 0,36 -0,46 2,55 0,73 -2,71 18,36 -2,64 -0,41 1,91 0,45 ≠R×C -1,65 -53,67 -479,35 -102,47 298,49 -48,90 -110,73 -6,04 -51,45 -98,39 -15,75 -279,85 -14,19 60,01 -50,84 -79,95 17,25 -247,64 133,48 -1918,06 -320,27 -33,21 -447,44 Bảng V SO SÁNH ĐỘ CHÍNH XÁC CỦA HỆ PHÂN LỚP FRBC_S SO VỚI PAES-RCS VÀ FURIA BẰNG PHƯƠNG PHÁP KIỂM ĐỊNH W ILCOXON VỚI 𝛼 = 0, So sánh (𝛼 = 0,1) FRBC_S vs PAES-RCS FRBC_S vs FURIA R+ 275,0 227,0 R− 1,0 49,0 Exact 𝑃-value 2,622E-5 0,005414 Giả thuyết H0 Bị bác bỏ Bị bác bỏ Bảng VI SO SÁNH ĐỘ PHỨC TẠP CỦA HỆ PHÂN LỚP FRBC_S SO VỚI PAES-RCS VÀ FURIA BẰNG PHƯƠNG PHÁP KIỂM ĐỊNH W ILCOXON VỚI 𝛼 = 0, So sánh (𝛼 = 0,1) FRBC_S vs PAES-RCS FRBC_S vs FURIA R+ 275,0 225,0 R− 1,0 51,0 Exact 𝑃-value 4,768E-7 0,00671 Giả thuyết H0 Bị bác bỏ Bị bác bỏ phân hoạch k0 tốt so với hệ phân lớp FRBC_S sử dụng phân hoạch k1 so sánh nên ta kết luận hệ phân lớp FRBC_S_k0 tốt hai hệ phân lớp PAES-RCS FURIA phân lớp FRBC_S có độ phức tạp phân lớp thấp nhiều so với hai hệ phân lớp lại, tương ứng 114,07 so với 355,23 281,49 Các kết kiểm định giả thuyết thống kê Wilcoxon với độ tin cậy 90% (𝛼 = 0, 1) sử dụng liệu Bảng IV độ xác phân lớp độ phức tạp hệ phân lớp thể tương ứng Bảng V Bảng VI Ta thấy rằng, giá trị giá trị Exact p-value nhỏ 𝛼 = 0, nên giả thuyết tương đương độ xác phân lớp độ phức tạp hệ phân lớp FRBC_S tương ứng so với hai hệ phân lớp đối sánh PAES-RCS FURIA bị bác bỏ Do đó, ta khẳng định hệ phân lớp FRBC_S tốt hai hệ phân lớp cịn lại hai tiêu chí độ xác phân lớp độ phức tạp hệ phân lớp Do hệ phân lớp FRBC_S_k0 sử dụng cấu trúc IV KẾT LUẬN Ngữ nghĩa định tính từ ngôn ngữ sở luật hệ phân lớp dựa luật mờ khơng dùng để tính tốn Do đó, việc biểu diễn ngữ nghĩa tính tốn phù hợp với ngữ nghĩa định tính từ ngơn ngữ đóng vai trị quan trọng Bài báo trình bày phương pháp biểu diễn ngữ nghĩa tính tốn dựa tập mờ dạng hàm 𝑆 sinh ĐSGTMR cho từ ngôn ngữ sử dụng để biểu diễn cấu trúc phân hoạch đa thể hạt dạng k0 k1 Các kết thực nghiệm kiểm định giả thuyết thống 17 Tập 2020, Số 1, Tháng kê Wilcoxon cho thấy tính hiệu phương pháp đề xuất áp dụng cho hệ phân lớp dựa luật mờ [14] N H Huy, N C Ho, N V Quyen, “Multichannel image contrast enhancement based on linguistic rule-based intensificators,” Applied Soft Computing Journal, vol 76, pp 744–762, 2019 [15] D T Long, “A genetic algorithm based method for timetabling problems using linguistics of hedge algebra in constraints,” Journal of Computer Science and Cybernetics, vol 32, no 4, pp 285–301, 2016 [16] J Dem⑩sar, “Statistical Comparisons of Classifiers over Multiple Data Sets,” Journal of Machine Learning Research, vol 7, pp 1–30, 2006 [17] P D Phong, N C Ho, N T Thuy, “Multi-objective Particle Swarm Optimization Algorithm and its Application to the Fuzzy Rule Based Classifier Design Problem with the Order Based Semantics of Linguistic Terms,” In Proceedings of The 10th IEEE RIVF International Conference on Computing and Communication Technologies (RIVF2013), Hanoi, Vietnam, pp 12–17, 2013 [18] F Rudzinski, “A multi-objective genetic optimization of interpretability-oriented fuzzy rule-based classifiers,” Applied Soft Computing, vol 38, pp 118–133, 2016 [19] M Elkanoa, M Galara, J Sanza, H Bustince, “CHIBD: A fuzzy rule-based classification system for Big Data classification problems,” Fuzzy Sets and Systems, vol 348, pp 75–101, 2018 [20] M Pota, M Esposito, G D Pietro, “Designing rule-based fuzzy systems for classification in medicine,” KnowledgeBased Systems, vol 124, pp 105–132, 2017 [21] M Soui, I Gasmi, S Smiti, K Ghédira, "Rule-based credit risk assessment model using multi-objective evolutionary algorithms," Expert Systems With Applications, vol 126, pp 144–157, 2019 [22] Y Zhang, X Qian, J Wang, M Gendeel1, "Fuzzy rulebased classification system using multi-population quantum evolutionary algorithm with contradictory rule reconstruction," Applied Intelligence, vol 49, pp 4007–4021, 2019 LỜI CẢM ƠN Nghiên cứu tài trợ Trường Đại học Giao thông vận tải đề tài mã số T2020-CN-002 TÀI LIỆU THAM KHẢO [1] R Alcalá, Y Nojima, F Herrera, H Ishibuchi, “Multiobjective genetic fuzzy rule selection of single granularitybased fuzzy classification rules and its interaction with the lateral tuning of membership functions,” Soft Computing, vol 15, no 12, pp 2303–2318, 2011 [2] M Antonelli, P Ducange, F Marcelloni, “A fast and efficient multi-objective evolutionary learning scheme for fuzzy rule-based classifiers,” Information Sciences, vol 283, pp 36–54, 2014 [3] H Ishibuchi, T Yamamoto, “Fuzzy Rule Selection by Multi-Objective Genetic Local Search Algorithms and Rule Evaluation Measures in Data Mining,” Fuzzy Sets and Systems, vol 141, no 1, pp 59-88, 2014 [4] H Ishibuchi, T Yamamoto, “Rule weight specification in fuzzy rule-based classification systems,” IEEE Transactions on Fuzzy Systems, vol 13, no 4, pp 428–435, 2005 [5] M I Rey, M Galende, M J Fuente, G I SainzPalmero, “Multi-objective based Fuzzy Rule Based Systems (FRBSs) for trade-off improvement in accuracy and interpretability: A rule relevance point of view,” Knowledge-Based Systems, vol 127, pp 67–84, 2017 [6] N C Ho, W Wechler, “Hedge algebras: an algebraic approach to structures of sets of linguistic domains of linguistic truth variables,” Fuzzy Sets and Systems, vol 35, no 3, pp 281-293, 1990 [7] N C Ho, W Wechler, “Extended hedge algebras and their application to fuzzy logic,” Fuzzy Sets and Systems, vol 52, pp 259–281, 1992 [8] N C Ho, N V Long, “Fuzziness measure on complete hedges algebras and quantifying semantics of terms in linear hedge algebras,” Fuzzy Sets and Systems, vol 158, pp 452-471, 2007 [9] N C Ho, W Pedrycz, D T Long, T T Son, “A genetic design of linguistic terms for fuzzy rule based classifiers,” International Journal of Approximate Reasoning, vol 54, no 1, pp 1-21, 2013 [10] N C Ho, T T Son, P D Phong, “Modeling of a semantics core of linguistic terms based on an extension of hedge algebra semantics and its application,” Knowledge-Based Systems, vol 67, pp 244–262, 2014 [11] N C Ho, H V Thong, N V Long, “A discussion on interpretability of linguistic rule based systems and its application to solve regression problems,” KnowledgeBased Systems, vol 88, pp 107–133, 2015 [12] T T Son, N T Anh, “Partition fuzzy domain with multigranularity representation of data based on hedge algebra approach,” Journal of Computer Science and Cybernetics, vol 34, no 1, pp 63–75, 2018 [13] B H Le, L T Anh, B V Binh, “Explicit formula of hedge-algebras-based fuzzy controller and applications in structural vibration control,” Applied Soft Computing, vol 60, pp 150–166, 2017 18 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông SƠ LƯỢC VỀ CÁC TÁC GIẢ Nguyễn Đức Thảo Nhận Kỹ sư, Thạc sĩ Tiến sỹ Công nghệ thông tin Trường Đại học Tổng hợp Nga năm 1996, 2001 Hiện cán nghiên cứu Viện Khoa học Công nghệ quân sự/ Bộ Quốc phịng Lĩnh vực nghiên cứu: khai phá liệu, lơ gic mờ, hệ mờ, tính tốn mềm, tính tốn với từ, học máy, trí tuệ nhân tạo, hệ thống thơng tin, hệ chuyên gia Nguyễn Đức Dư Nhận Cử nhân Toán tin ứng dụng, Thạc sĩ Toán ứng dụng Trường Đại học khoa học tự nhiên, Đại học Quốc gia Hà Nội năm 2001, 2005 Hiện giảng viên Khoa Công nghệ thông tin, Trường Đại học Giao thông vận tải Lĩnh vực nghiên cứu: khai phá liệu, lơ gic mờ, hệ mờ, tính tốn mềm, tính tốn với từ, học máy Phạm Đình Phong Nhận Thạc sĩ Công nghệ thông tin Tiến sĩ Khoa học máy tính Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội năm 2011, 2018 Hiện giảng viên Khoa Công nghệ thông tin, Trường Đại học Giao thông vận tải Lĩnh Vực nghiên cứu: khai phá liệu, hệ mờ, tính tốn mềm, học máy Phạm Đình Vũ Nhận kỹ sư Công nghệ thông tin Trường Đại học Bách khoa Hà Nội năm 2003, Thạc sỹ Hệ thống thơng tin Học viện Cơng nghệ Bưu Viễn thông năm 2015 Hiện công tác Cục Công nghệ thông tin Thống kê hải quan, Tổng cục Hải quan Lĩnh vực nghiên cứu: khai phá liệu, hệ mờ, tính tốn mềm, học máy 19 ... hình thức kết nối ngữ nghĩa từ ngôn ngữ với tập mờ nên ngữ nghĩa tính tốn dựa tập mờ khơng phản ảnh ngữ nghĩa thực ngôn ngữ sau trình tối ưu làm ảnh hưởng đến tính giải nghĩa hệ luật phân lớp II... tính tốn từ ngơn ngữ Các phương pháp thiết kế ngữ nghĩa tính tốn dựa tập mờ cho FRBC công bố [9, 10] chưa thỏa tất bốn ràng buộc Cụ thể, từ ngôn ngữ hx sinh từ từ ngơn ngữ x gia tử h có ngữ nghĩa. .. sử dụng luật) với độ dài trung bình luật sử dụng để đánh giá tính giải nghĩa hệ phân lớp Một mở rộng giải thuật Chi tiếng thiết kế hệ phân lớp dựa luật mờ phân tán cho phân lớp liệu lớn cách áp