(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử(Luận án tiến sĩ) Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM ĐÌNH PHONG PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Hà Nội - 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Đình Phong PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ Chuyên ngành: Khoa học máy tính Mã số: 62 48 01 01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: GS TS Nguyễn Thanh Thủy PGS TSKH Nguyễn Cát Hồ Hà Nội – 2017 LỜI CAM ĐOAN Tôi xin cam đoan rằng, ngoại trừ nội dung trích từ tài liệu tham khảo cơng trình khác ghi rõ luận án, kết trình bày luận án cơng trình nghiên cứu tơi hồn thành hướng dẫn GS TS Nguyễn Thanh Thủy PGS TSKH Nguyễn Cát Hồ Các kết nghiên cứu trung thực, chưa công bố trước Các kết viết chung với tác giả khác đồng ý đồng tác giả trước đưa vào luận án Tác giả luận án Phạm Đình Phong ii LỜI CẢM ƠN Với lịng biết ơn sâu sắc, tơi xin chân thành cảm ơn thầy GS TS Nguyễn Thanh Thủy PGS TSKH Nguyễn Cát Hồ trực tiếp bảo tận tình hướng dẫn tơi hồn thành luận án Tôi chân thành cảm ơn thầy TS Trần Thái Sơn có nhiều hỗ trợ q trình nghiên cứu có nhận xét, đánh giá trình hồn thiện luận án Tơi xin bày tỏ lịng biết ơn thầy giáo, giáo Bộ mơn Khoa học máy tính, Khoa Cơng nghệ thơng tin, Phòng đào tạo, Ban giám hiệu Trường Đại học Cơng nghệ tận tình bảo, giảng dạy tạo điều kiện thuận lợi suốt thời gian học tập, nghiên cứu hồn thành luận án Tơi xin cảm ơn tất người thân, bạn bè đồng nghiệp tạo điều kiện, động viên hỗ trợ mặt Cuối cùng, xin được bày tỏ tình cảm lịng biết ơn vô hạn tới bố mẹ người thân gia đình, đặc biệt vợ tơi – Phan Thị Quế Anh, người ln động viên, khích lệ, chia sẻ gánh vác cơng việc để tơi có thời gian học tập, nghiên cứu hoàn thành luận án iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT vii DANH MỤC CÁC BẢNG ix DANH MỤC CÁC HÌNH VẼ, BIỂU ĐỒ xiii MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ HỆ DỰA TRÊN LUẬT NGÔN NGỮ MỜ 1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN 1.1.1 Tập mờ 1.1.2 Biến ngôn ngữ .9 1.1.3 Phân hoạch mờ 10 1.1.4 Luật ngôn ngữ mờ hệ luật ngôn ngữ mờ 11 1.1.5 Bài toán phân lớp liệu 12 1.2 HỆ DỰA TRÊN LUẬT NGÔN NGỮ MỜ 12 1.2.1 Cấu trúc hệ dựa luật ngôn ngữ mờ 13 1.2.2 Bài toán thiết kế hệ phân lớp dựa luật ngôn ngữ mờ 14 1.2.3 Những vấn đề tồn 19 1.3 ĐẠI SỐ GIA TỬ 19 1.3.1 Đại số gia tử biến ngôn ngữ 20 1.3.2 Lượng hóa đại số gia tử 22 1.3.3 Ý nghĩa ứng dụng đại số gia tử 25 1.3.4 Những vấn đề tồn 28 1.4 KẾT LUẬN CHƯƠNG 29 CHƯƠNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG CỦA KHUNG NHẬN THỨC NGÔN NGỮ VÀ ỨNG DỤNG GIẢI BÀI TOÁN PHÂN LỚP .30 2.1 MỞ RỘNG ĐẠI SỐ GIA TỬ CHO VIỆC MƠ HÌNH HĨA LÕI NGỮ NGHĨA CỦA CÁC TỪ NGÔN NGỮ 30 iv 2.2 MỞ RỘNG KHÁI NIỆM ĐỘ ĐO TÍNH MỜ 37 2.3 HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ CỦA CÁC TỪ NGƠN NGỮ 40 2.4 ÁNH XẠ ĐỊNH LƯỢNG NGỮ NGHĨA KHOẢNG 44 2.5 MỞ RỘNG ĐỘ ĐO TÍNH MỜ CỦA CÁC PHẦN TỬ VÀ 46 2.6 ỨNG DỤNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG TRONG THIẾT KẾ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ 49 2.6.1 Thiết kế ngữ nghĩa tính tốn dựa tập mờ từ ngôn ngữ 50 2.6.2 Sinh tập luật khởi đầu từ liệu dựa ngữ nghĩa ĐSGT mở rộng 56 2.6.3 Tối ưu tham số ngữ nghĩa tìm kiếm hệ luật tối ưu 59 2.6.4 Đánh giá kết ứng dụng lõi ngữ nghĩa ngữ nghĩa hình thang thiết kế hệ phân lớp dựa luật ngôn ngữ mờ 61 2.6.4.1 Dữ liệu phương pháp thực nghiệm 61 2.6.4.2 So sánh đánh giá hai cấu trúc phân hoạch mờ đơn đa thể hạt 63 2.6.4.3 So sánh đánh giá hai phương pháp lập luận single winner rule weigted vote 69 2.6.4.4 So sánh đánh giá phương pháp thiết kế hệ phân lớp theo tiếp cận đại số gia tử 71 2.6.4.5 So sánh đánh giá với số phương pháp theo tiếp cận lý thuyết tập mờ 73 2.6.4.6 So sánh đánh giá với số tiếp cận khác 77 2.6.5 Biểu diễn ngữ nghĩa tính tốn dựa tập mờ hình thang đảm bảo tính giải nghĩa khung nhận thức ngôn ngữ .79 2.7 KẾT LUẬN CHƯƠNG 84 CHƯƠNG THIẾT KẾ HIỆU QUẢ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ SỬ DỤNG KỸ THUẬT TÍNH TỐN MỀM 85 3.1 THIẾT KẾ HIỆU QUẢ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ SỬ DỤNG CÁC THUẬT TOÁN TỐI ƯU 85 3.1.1 Đánh giá tính hiệu thuật toán MOPSO so với thuật toán GSA 88 v 3.1.1.1 Thuật toán tối ưu bầy đàn đa mục tiêu .88 3.1.1.2 Ứng dụng thuật toán MOPSO tối ưu tham số ngữ nghĩa tìm kiếm hệ luật tối ưu 92 3.1.1.3 Thực nghiệm so sánh thuật toán MOPSO so với thuật toán GSA 94 3.1.2 Đánh giá tính hiệu thuật tốn MOPSO-SA so với thuật toán MOPSO 96 3.1.2.1 Thuật toán tối ưu đa mục tiêu lai MOPSO-SA 96 3.1.2.2 Ứng dụng thuật toán MOPSO-SA tối ưu tham số ngữ nghĩa tìm kiếm hệ luật tối ưu 99 3.1.2.3 Thực nghiệm so sánh thuật toán MOPSO-SA so với thuật toán MOPSO 101 3.2 NÂNG CAO HIỆU QUẢ SINH LUẬT MỜ VỚI NGỮ NGHĨA DỰA TRÊN ĐẠI SỐ GIA TỬ SỬ DỤNG KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG103 3.2.1 Một số khái niệm lý thuyết thông tin 104 3.2.2 Kỹ thuật lựa chọn đặc trưng sử dụng trọng số động 105 3.2.3 Ứng dụng thuật DWFS thiết kế FLRBC sở ĐSGT .107 3.2.4 Kết thực nghiệm thảo luận .109 3.3 KẾT LUẬN CHƯƠNG 113 KẾT LUẬN CỦA LUẬN ÁN .115 DANH MỤC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN .117 TÀI LIỆU THAM KHẢO .119 PHỤ LỤC A vi DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu Đại số gia tử tuyến tính mp Đại số gia tử mở rộng mrtp Đại số gia tử mở rộng toàn phần μ(h) Độ đo tính mờ gia tử h fm(x) Độ đo tính mờ từ ngơn ngữ x f(x) Hàm định lượng khoảng từ ngôn ngữ x μA(x) Hàm xác định độ thuộc giá trị x vào tập mờ A |x| Độ dài từ ngôn ngữ x Xk Tập các từ có độ dài k X(k) Tập các từ có độ dài nhỏ k Biến ngôn ngữ H Tập gia tử |H| Số lượng gia tử H Hmr Tập gia tử mở rộng (bổ sung thêm gia tử h0) H+ Tập gia tử dương H- Tập gia tử âm H(x) Tập từ cảm sinh từ x tác động gia tử Ák(x) Khoảng tính mờ mức k x RMSR Root mean squared residual Các từ viết tắt ĐSGT Đại số gia tử DB Database (Cơ sở liệu) FLRBC Fuzzy linguistic rule-based classifier (Hệ phân lớp dựa luật ngôn ngữ mờ) vii FLRBS fuzzy linguistic rule-based system (Hệ dựa luật ngôn ngữ mờ) FURIA Fuzzy unordered rules induction algorithm (Giải thuật cảm sinh luật mờ khơng có thứ tự) GSA Genetic simulated annealing (Tôi luyện mô di truyền) KB Knowledge base (Cơ sở tri thức) LFoC Linguistic frames of cognition (Khung nhận thức ngôn ngữ) MOO Multi-objective optimization (Tối ưu đa mục tiêu) MOPSO Multi-objective particle swarm optimization (Giải thuật tối ưu bầy đàn đa mục tiêu) PAES Pareto archived evolution strategy (Chiến lược tiến hóa lưu trữ Pareto) PI Power set of intervals (Tập khoảng có thể) PSO Particle swarm optimization (Tối ưu bầy đàn) RCS Rule and condition selection (Lựa chọn luật điều kiện luật) RIPPER Repeated incremental pruning to produce error reduction (Giảm lỗi lặp lại cắt tỉa gia tăng) SVM Support vector machine (Máy véc-tơ hỗ trợ) SWR Single winner rule (Luật thắng đơn) WV Weighted vote (Bầu cử có trọng số) viii DANH MỤC CÁC BẢNG TRONG NỘI DUNG CHÍNH Bảng 2.3 So sánh độ xác hệ phân lớp sử dụng cấu trúc đa thể hạt đơn thể hạt sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ………… 68 Bảng 2.4 So sánh độ phức tạp hệ phân lớp sử dụng cấu trúc đa thể hạt đơn thể hạt sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ………… 68 Bảng 2.6 So sánh độ xác hệ phân lớp thiết kế sở ĐSGT mr mrtp sử dụng phương pháp lập luận SWR WV phương pháp kiểm định Wilcoxon Signed Rank với α = 0,05 ………………………… …… 70 Bảng 2.7 So sánh độ phức tạp hệ phân lớp thiết kế sở ĐSGT mr mrtp sử dụng phương pháp lập luận SWR WV phương pháp kiểm định Wilcoxon Signed Rank với α = 0,05 ………………………………… 70 Bảng 2.9 So sánh độ xác FRBC_ mrtp, FRBC_ mr FRBC_ sử dụng phương pháp kiểm định Wilcoxon Signed Rank với α = 0,05 …………… 72 Bảng 2.10 So sánh độ phức tạp FRBC_ mrtp, FRBC_ mr FRBC_ sử dụng phương pháp kiểm định Wilcoxon Signed Rank với α = 0,05 …………… 72 Bảng 2.11 So sánh độ xác FRBC_ mrtp FRBC_ mr so với All Granularities Product-1-ALL TUN sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 …… ……………………………………………………………… 74 Bảng 2.12 So sánh độ phức tạp FRBC_ mrtp FRBC_ mr so với All Granularities Product-1-ALL TUN sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ……………………………………………………………………… 75 Bảng 2.14 So sánh độ xác FRBC_ mrtp FRBC_ mr so với hệ phân lớp PAES-RCS sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 …… 77 Bảng 2.15 So sánh độ phức tạp FRBC_ mrtp FRBC_ mr so với hệ phân lớp PAES-RCS sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ……… 77 Bảng 2.16 So sánh độ xác FRBC_ mrtp FRBC_ mr so với FURIA C4.5 sử dụng kiểm tra Wilcoxon Signed Rank với α = 0,05 ………………… 79 Bảng 2.17 So sánh độ phức tạp FRBC_ mrtp FRBC_ mr so với FURIA C4.5 sử dụng kiểm tra Wilcoxon Signed Rank với α = 0,05 ……………… 79 Bảng 2.18 So sánh kết thực nghiệm hai hệ phân lớp FRBC_ mrtp_k0 FRBC_ mrtp………………………………………………………………… 82 ix 65 Ishibuchi H., Murata T., Türkşen I B (1997), “Single-objective and two-objective genetic algorithms for selecting linguistic rules for pattern classification problems”, Fuzzy Sets and Systems 89 (2), pp 135–150 66 Ishibuchi H., Nakashima T., Murata T (2001), “Three-objective genetics based machine learning for linguistic rule genetics-extraction”, Information Sciences 136, pp 109–133 67 Ishibuchi H., Yamamoto T (2004), “Fuzzy Rule Selection by Multi-Objective Genetic Local Search Algorithms and Rule Evaluation Measures in Data Mining”, Fuzzy Sets and Systems 141 (1), pp 59–88 68 Ishibuchi H., Yamamoto T (2005), “Rule weight specification in fuzzy rule-based classification systems”, IEEE Transactions on Fuzzy Systems 13 (4), pp 428–435 69 Ishibuchi H., Nojima Y (2007), “Analysis of interpretability-accuracy tradeoff of fuzzy systems by multiobjective fuzzy genetics-based International Journal of Approximate Reasoning 44, pp 4–31 machine learning”, 70 Ishibuchi H (2007), "Evolutionary Multiobjective Optimization for Fuzzy Knowledge Extraction", 8th International Symposium on Advanced Intelligent Systems, Sokeho, Korea, pp 58-62 71 Jahromi M Z., Taheri M (2008), “A proposed method for learning rule weights in fuzzy rule-based classification systems”, Fuzzy Sets and Systems 159 (4), pp 449– 459 72 Jang J S R (1993), “ANFIS: Adaptive-network-based fuzzy inference system”, IEEE Trans on Systems, Man and Cybernetics 23 (3), pp 665–685 73 Jiménez F., Sánchez G., Juárez J M (2014), “Multi-objective evolutionary algorithms for fuzzy classification insurvival prediction”, Artificial Intelligence in Medicine 60, pp 197–219 74 Ji-lin C., Yuan-long H., Zong-y X., Li-min J., Zhong-zhi T (2006), “A Multi- objective Genetic-based Method for Design Fuzzy Classification Systems”, IJCSNS International Journal of Computer Science and Network Security (8A), pp 110– 118 75 Kennedy J., Eberhart R C (1995), “Particle Swarm Optimization”, In Proceedings of the IEEE International Conference on Neural Networks, Piscataway, New Jersey IEEE Service Center, pp 1942–1948 76 Kevin L., Olivier S (2006), "Fuzzy Histograms and Density Estimation", Advances in Soft Computing, pp 45-52 77 King P J., Mamdani E H (1977), “The application of fuzzy control systems to industrial processes”, Automatica 13 (3), pp 235–242 78 Kirkpatrick S., Gelatt C D., Vecchi M P (1983), "Optimization by simulated annealing", Science 220 (4598), pp 671-680 124 79 Knowles J., Corne D (1999), “The Pareto Archived Evolution Strategy: A New Baseline Algorithm for Pareto Multiobjective Optimisation”, In Proceedings of the Congress on Evolutionary Computation, Mayflower Hotel, Washington D.C., USA IEEE Press, volume 1, pp 98–105 80 Langseth H., Nielsen T D (2006), Classification using Hierarchical Naïve Bayes models, Machine Learning 63 (2), pp 135–159 81 Le B H., Ho N C., Pedrycz W., Trung T D., Lan V N (2012), “Active control of earthquake-excited structures with the use of hedge-algebras-based controllers”, Journal of Science and Technology 50 (6), pp 705–734 82 Le B H., Ho N C., Lan V N., Hung N C (2015), “General design method of hedge- algebras-based fuzzy controlers and an application for structural active control”, Applied Intelligence 43 (2), pp 251–275 83 Lechuga M S (2006), Multi-Objective Optimisation using Sharing in Swarm Optimisation Algorithms, Doctor thesis, School of Computer Science, The University of Birmingham 84 Li X (2003), “A non-dominated sorting particle swarm optimizer for multi-objective optimization”, in: Proceedings of the Genetic and Evolutionary Computation Conference, Lecture Notes in Computer Science 2723, pp 37–48 85 Liu J., Yu Z., Ma D (2012), “An Adaptive Fuzzy Min-Max Neural Network Classifier Based on Principle Component Analysis and Adaptive Genetic Algorithm”, Mathematical Problems in Engineering 2012, pp 1–21 86 López V., Fernández A., delJesus M J., Herrera F (2013), “A hierarchical genetic fuzzy system based on genetic programming for addressing classification with highly imbalanced and borderline data-sets”, Knowledge-Based Systems 38, pp 85–104 87 López V., Triguero I., Carmona C J., García S., Herrera F (2014), “Addressing imbalanced classification with Neurocomputing 126, pp 15–28 instance generation techniques: IPADE-ID”, 88 Luengo J., Sáez J A., Herrera F (2012), “Missing data imputation for fuzzy rule- based classification systems”, Soft Computing 16 (5), pp 863-881 89 Mamdani E H (1974), “Application of fuzzy algorithms for control of simple dynamic plants”, in: Proceedings of the IEEE 121, pp 1585–1588 90 Mamdani E H., Assilian S (1975), “An experiment in linguistic synthesis with a fuzzy logic controller”, International Journal of Man-Machine Studies (1), pp 1– 13 91 Mansoori E G., Zolghadri M J., Katebi S D (2007), “A weighting function for improving fuzzy classification systems performance”, Fuzzy Sets and Systems 158, pp 583– 591 125 92 Mansoori E G., Zolghadri M J., Katebi S D (2008), “SGERD: A Steady-State Genetic Algorithm for Extracting Fuzzy Classification Rules From Data”, IEEE Transaction on fuzzy systems 16 (4), pp 1061-1071 93 Mostaghim S., Teich J (2003), “Strategies for Finding Good Local Guides in Multi- objective Particle Swarm Optimization (SIS’03)”, IEEE Service Center, Inidanapolis, Indiana, USA, pp 26–33 94 Miller G A (1956), “The magical number seven plus or minus two: some limits on our capacity for processing information”, The Psychological Review 63, pp 81–97 95 Nakashima T., Schaefer G., Yokota Y., Ishibuchi H (2007), A weighted fuzzy classifier and its application to image processing tasks, Fuzzy Sets and Systems 158, pp 284–294 96 Nauck D., Kruse R (1995), “NEFCLASS: A neuro-fuzzy approach for the classification of data”, In Proc of the 1995 ACM Symposium on Applied Computing, Nashville, TN, pp 461–465 97 Nauck D., Kruse R (1997), “A neuro-fuzzy method to learn fuzzy classification rules from data”, Fuzzy Sets and Systems 89 (3), pp 277–288 98 Nauck D., Kruse R (1998), “How the learning of rule weights affects the interpretability of fuzzy systems”, in Proc 7th IEEE Int Conf Fuzzy Systems, Anchorage, AK, pp 1235–1240 99 Pakhira M K., Bandyopadhyay S., Maulik U (2004), “Validity index for crisp and fuzzy clusters”, Pattern Recognition 37, pp 487–501 100 Pakhira M K., Bandyopadhyay S., Maulik U (2005), “A study of some fuzzy cluster validity indices, genetic clustering and application to pixel classification”, Fuzzy Sets and Systems 155, pp 191–214 101 Prusty M R., Jayanthi T., Chakraborty J., Seetha H., Velusamy K (2015), “Performance analysis of fuzzy rule based classification system for transient identification in nuclear power plant”, Annals of Nuclear Energy 76, pp 63–74 102 Quinlan J R (1993), C4.5: Programs for Machine Learning, Morgan Kauffman Publishers, San Mateo, California, USA 103 Pulkkinen p., Koivisto H (2008), "Fuzzy classifier identification using decision tree and multiobjective evolutionary algorithms", International Journal of Approximate Reasoning 48, pp 526–543 104 Puranik P., Bajaj P., Abraham A., Palsodkar P., Deshmukh P (2011), “Human Perception-based Color Image Segmentation Using Comprehensive Learning Particle Swarm Optimization”, Journal of Information Hiding and Multimedia Signal Processing (3), pp 227-235 126 105 Rao A R M., Sivasubramanian K (2008), “Multi-objective optimal design of fuzzy logic controller using a self configurable swarm intelligence algorithm”, Comput Struct 86, pp 2141–2154 106 Roh S B., Pedrycz W., Ahn T C (2014), “A design of granular fuzzy classifier”, Expert Systems with Applications 41, pp 6786–6795 107 Roubos J A., Setnes M., Abonyi J (2003), “Learning fuzzy classification rules from labeled data”, Information Sciences 150, pp 77–93 108 Salehi S., Selamat A., Mashinchi M R., Fujita H (2015), "The synergistic combination of particle swarm optimization and fuzzy sets to design granular classifier", Knowledge-Based Systems 76, pp 200–218 109 Sanjeevi S G., Nikhila A N., Khan T., Sumathi G (2012), “Comparison of Hybrid PSO-SA Algorithm and Genetic Algorithm for Engineering and Intelligent Systems, (2), pp 37-45 Classification”, Computer 110 Sanz J., Fernández A., Bustince H., Herrera F (2011), “A genetic tuning to improve the performance of Fuzzy Rule-Based Classification Systems with Interval-Valued Fuzzy Sets: Degree of ignorance and lateral position”, International Journal of Approximate Reasoning 52 (6), pp 751–766 111 Setiono D (1999), “Generating concise and accurate classification rules for breast cancer diagnosis”, Artificial Intelligence in Medicine 18, pp 205–219 112 Setnes M., Roubos H (2000), “GA-fuzzy modeling and classification: Complexity and performance”, IEEE Trans on Fuzzy Systems (8), pp 509–522 113 Shi Y., Eberhart R., Chen Y (1999), “Implementation of evolutionary fuzzy systems”, IEEE Trans on Fuzzy Systems (2), pp 109–119 114 Simpson P K (1992), “Fuzzy min-max neural networks - I: Classification”, IEEE Transactions on Neural Networks (5), pp 776–786 115 Sun S., Zhang C., Zhang D (2007), “An experimental evaluation of ensemble methods for EEG signal classification”, Pattern Recognition Letters 28 (15), pp 2157–2163 116 Sun X., Liu Y., Xu M., Chen H., Han J., Wanga K (2013), “Feature selection using dynamic weights for classification”, Knowledge-Based Systems 37, pp 541–549 117 Takagi T., Sugeno M (1985), “Fuzzy identification of systems and its applications to modeling and control”, IEEE Trans on Systems, Man, and Cybernetics 15 (1), pp 116–132 118 Tao J., Li Q., Zhu C., Li J (2012), “A hierarchical naive Bayesian network classifier embedded GMM for textural image”, International Journal of Applied Earth Observation and Geoinformation 14 (1), pp 139–148 127 119 Tripathi P K., Bandyopadhyay S., Pal S K (2007), “Multi-Objective Particle Swarm Optimization with time variant inertia and acceleration coefficients”, Information Sciences 177, pp 5033–5049 120 Vuorimaa P (1994), “Fuzzy self-organizing map”, Fuzzy Sets and Systems 66 (2), pp 223–231 121 Wang L X., Mendel J M (1992), “Generating fuzzy rules by learning from examples”, IEEE Trans on Systems, Man and Cybernetics 22 (6), pp 1414–1427 122 Wu C., Lin C J., Lee C Y (2011), “A functional neural fuzzy network for classification applications”, Expert Systems with Applications 38 (5), pp 6202–6208 123 Zadel L A (1965), “Fuzzy sets”, Information and Control 8, pp 338–353 124 Zadeh L A (1975), “The concept of a linguistic variable and its application to approximate reasoning – I–III”, Inf Sci (3), pp 199–249; Zadeh L A (1975), “The concept of a linguistic variable and its application to approximate reasoning – I–III”, Inf Sci (4), pp 301–357; Zadeh L A (1975), “The concept of a linguistic variable and its application to approximate reasoning – I–III”, Inf Sci (1), pp 43–80 125 Zhang Y., Lu Z., Li J (2010), “Fabric defect classification using radial basis function network”, Pattern Recognition Letters 31 (13), pp 2033–2042 126 Zhao Z., Wang G., Zhao W., Chen H., Zhao W., Li L (2011), “A Fuzzy Adaptive Multi-Population Parallel Genetic Algorithm for Spam Filtering”, Journal of Convergence Information Technology (2), pp 172–182 127 Zhou E., Khotanzad A (2007), “Fuzzy classifier design using genetic algorithms”, Pattern Recognition 40 (12), pp 3401–3414 128 http://sci2s.ugr.es/keel/datasets.php 128 PHỤ LỤC PHỤ LỤC Thuật toán sinh tập luật khởi đầu Thuật toán 2.2 E_IFRG [57, CT4] //Thuật toán sinh tập luật khởi đầu Input: Tập mẫu liệu D = {(dl, Cl) | l = 1, …, mt}, M lớp kết luận, n thuộc tính Các tham số ngữ nghĩa Л, NR số luật khởi đầu, K giới hạn độ dài từ ngôn ngữ, λ độ dài tối đa luật Output: Tập luật khởi đầu S0 = {R1, …, RNR} Begin //Bước 1: Xây dựng tập từ ngơn ngữ, khoảng tính mờ, giá trị định lượng khoảng tập mờ hình thang Xj,(kj) For j = to n begin Sinh tập từ ngơn ngữ có độ dài tối đa kj ≤ K; For k = to kj begin For each x Ỵ Xj,k begin // Xj,k theo thứ tự ngữ nghĩa Tính độ đo tính mờ fm(x); //Tính chất (2) Mệnh đề 2.1 Xây dựng khoảng tính mờ Áj,k(x) x; Tính ánh xạ định lượng khoảng f(x) x; // Định lý 2.6 End; End; For each x Ỵ ,( ) Xây dựng tập mờ hình thang cho x; //Mục 2.6.1 End; //Bước 2: Xây dựng tập luật ứng viên từ D dựa khoảng tính mờ mức kj Rcnd = Ø; //Khởi tạo tập luật ứng viên rỗng For each pl = (dl, Cl) Ỵ D begin Atn = Ø;//Khởi tạo tập tiền đề luật rỗng For j = to n begin A Tìm từ ngơn ngữ , ∈ , mà , ∈ℑ , , ; Sinh điều kiện tiền đề luật aj,i = “Xj is xj,i”; Atn = Atn È aj,i ; //Thêm aj,i vào tập tiền đề Atn; End; Sinh luật sở Rb: ⇒ ; //Rb có độ dài n For k = to λ begin Sinh tất k-tổ hợp n phần tử lưu vào tập Comb; For each Combq Ỵ Comb begin Sinh luật r: Aq ⇒ Cl có tiền đề luật tổ hợp Combq từ tiền đề Rb; Tính độ tin cậy độ hỗ trợ luật r; //công thức (1.3), (1.4); Xác định lại nhãn lớp luật r: Aq ⇒ Cq;//cơng thức (1.6); Tính trọng số luật r; //công thức (1.7), (1.8), (1.9), (1.10); Rcnd = Rcnd È r; End; End; End; //Bước 3: Sàng luật theo tiêu chuẩn sàng S0 = Ø; //Khởi tạo tập luật khởi tạo rỗng For i =1 to M begin Ri = {Rcnd: Aq Þ Cq, Cq = Ci}; //Nhóm luật ứng viên theo nhãn lớp Sắp xếp Ri giảm dần theo tiêu chuẩn sàng; Thêm NR/M luật Ri vào S0; End; Return S0; End B PHỤ LỤC Mô tả tập liệu thực nghiệm Bảng 2.1 Các tập liệu mẫu sử dụng thực nghiệm STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Tập liệu Appendicitis Australian Bands Bupa Cleveland Dermatology Glass Haberman Hayes-roth Heart Hepatitis Ionosphere Iris Mammographic Newthyroid Pima Saheart Sonar Tae Vehicle Wdbc Wine Wisconsin Ký hiệu Số thuộc tính Số lớp Số mẫu liệu App Aus Ban Bup Cle Der Gla Hab Hay Hea Hep Ion Iri Mam New Pim Sah Son Tae Veh Wdb Win Wis 14 19 13 34 13 19 34 5 60 18 30 13 2 2 6 2 3 2 106 690 365 345 297 358 214 306 160 270 80 351 150 830 215 768 462 208 151 846 569 178 683 Sau mô tả ngắn gọn đặc điểm tập liệu bảng trên: - Tập liệu Appendicitis có thuộc tính (có giá trị từ 0,0 đến 1,0) biểu diễn tiêu chuẩn y tế thực qua 106 bệnh nhân, nhãn lớp tương ứng biểu thị bệnh nhân bị không bị việm ruột thừa - Australian tập liệu ứng dụng thẻ tín dụng Tất thuộc tính chuyển thành ký hiệu khơng có nghĩa nhằm bảo vệ liệu mật - Tập liệu Bands liên quan đến in quay với nhiệm vụ xác định phần định có phải dải hình trụ hay không C - Tập liệu Bupa liên quan đến việc phân tích số rối loạn chức gan phát sinh từ uống rượu mức Năm thuộc tính đầu tất xét nghiệm máu cho nhạy cảm với rối loạn chức gan Thuộc tính cuối số lượng panh (tương đương với nửa lít) rượu uống ngày - Tập liệu Cleveland liên quan đến bệnh tim gồm 14 thuộc tính với nhiệm vụ dị xét diện bệnh tim bệnh nhân Nhãn lớp số nguyên từ (không diện) đến - Dermatology tập liệu chẩn đoán bệnh vảy ban đỏ Bệnh nhân trước tiên đánh giá lâm sàng với 12 thuộc tính sau mẫu da lấy để đánh giá với 22 thuộc tính mơ học Thuộc tính lịch sử gia đình có giá trị bệnh quan sát thấy gia đình có giá trị trường hợp ngược lại Ngồi thuộc tính tuổi, tất thuộc tính khác có mức độ khoảng từ đến Giá trị thuộc tính không diện, giá trị lớn 1, giá trị trung gian tương đối - Tập liệu Glass dùng để phân lớp loại kính tìm thấy trường tội phạm xác định theo hàm lượng ơxít (K, Na, Fe, Al, …) - Tập liệu Haberman bao gồm ca từ nghiên cứu thực từ năm 1958 đến năm 1970 Đại học Chicago's Billings Hospital sống sót bệnh nhân sau phẫu thuật ung thư vú Việc phân lớp liệu nhằm xác định bệnh nhân sống thêm từ năm trở lên (“positive”) hay năm (“negative”) - Hayes-roth tập liệu nhân tạo có thuộc tính dùng để thử nghiệm hệ phân lớp dựa nguyên mẫu (prototype classifier) - Tập liệu Heart có 13 thuộc tính dùng để phát bệnh nhân bị bệnh tim (nhãn 2) hay không bị bệnh tim (nhãn 1) - Tập liệu Hepatitis có 19 thuộc tính chứa đựng thông tin bệnh nhân bị ảnh hưởng bệnh viêm gan - Ionosphere tập liệu đa thu thập hệ Goose Bay, Labrador Hệ bao gồm dàn 16 ăng ten mảng pha tần số cao với tổng công suất phát 6,4KW Mục tiêu electron tự tầng điện ly Ra đa trả lại nhãn “Good” cho chứng vài cấu trúc tầng điện ly, ngược lại nhãn “Bad” khơng, tức tín hiệu xun qua tầng điện ly D - Iris tập liệu phân loại hoa diên vĩ bao qua thuộc tính độ dài độ rộng đài hoa cánh hoa Mỗi nhãn lớp ứng với loại hoa Iris Setosa, Iris Versicolour Iris Virginica - Mammographic tập liệu sử dụng để dự đốn mức độ nghiêm trọng (lành tính ác tính) khối X quang vú dựa thuộc tính BI-RADS tuổi bệnh nhân - Newthyroid tập liệu tuyến giáp sử dụng để phát bệnh nhân bình thường (nhãn 1), có hoạt động mức (nhãn 2) hay giảm hoạt động (nhãn 3) tuyến giáp - Pima tập liệu cho phép phân phụ nữ có độ tuổi 21 thành hai nhóm: bị đái tháo đường (tested_positive) chưa bị đái tháo đường (tested_negative) - Saheart tập liệu giúp xác định người có bị mắc bệnh tim mạch vành (postive) hay không (negative) - Sonar tập liệu chứa tín hiệu thu từ nhiều góc độ khác nhau, trải 90 độ cho mỏ quặng 180 độ cho đá Mỗi mẫu liệu gồm 60 thuộc tính có giá trị từ 0,0 đến 1,0, đó, giá trị số biểu thị lượng bên dài tần số định, tích hợp với qua quãng thời gian định Nhãn R M thể đối tượng phát đá khối kim loại - Tae tập liệu đánh giá hiệu suất giảng dạy qua học kỳ bình thường kỳ hè 151 trợ lý giảng dạy Khoa thống kê, Đại học Wisconsin-Madison Kết đánh giá gồm loại ứng với nhãn: low (1), medium (2) high (3) - Vehicle tập liệu dùng để phân loại hình bóng cụ thể cho bốn loại xe (van, saab, bus, opel) sử dụng tập đặc trưng trích xuất từ hình bóng Xe nhìn từ góc độ khác - Wdbc tập liệu bao gồm 30 thuộc tính tính tốn từ ảnh số hút kim nhỏ khối vú Chúng mô tả đặc điểm nhân tế bào xuất ảnh nhằm phát khối u lành tính (B) hay ác tính (M) - Wine tập liệu dùng để phân loại rượu qua việc phân tích định lượng 13 thành phần tìm thấy trong ba loại rượu - Wisconsin bao gồm liệu ca phẫu thuật ung thư vú nghiên cứu tiến hành Đại học Wisconsin Hospitals, Madison nhằm xác định khối u phát lành tính (nhãn 2) hay ác tính (nhãn 4) E ...ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Đình Phong PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ Chuyên ngành:... đánh giá phương pháp thiết kế hệ phân lớp theo tiếp cận đại số gia tử 71 2.6.4.5 So sánh đánh giá với số phương pháp theo tiếp cận lý thuyết tập mờ 73 2.6.4.6 So sánh đánh giá... x Xk Tập các từ có độ dài k X(k) Tập các từ có độ dài nhỏ k Biến ngôn ngữ H Tập gia tử |H| Số lượng gia tử H Hmr Tập gia tử mở rộng (bổ sung thêm gia tử h0) H+ Tập gia tử dương H- Tập gia tử âm