Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 153 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
153
Dung lượng
2,39 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM ĐÌNH PHONG PHÁTTRIỂNMỘTSỐPHƯƠNGPHÁPTHIẾTKẾHỆPHÂNLỚPTRÊNCƠSỞLÝTHUYẾTTẬPMỜVÀĐẠISỐGIATỬ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Hà Nội - 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Đình Phong PHÁTTRIỂNMỘTSỐPHƯƠNGPHÁPTHIẾTKẾHỆPHÂNLỚPTRÊNCƠSỞLÝTHUYẾTTẬPMỜVÀĐẠISỐGIATỬ Chuyên ngành: Khoa học máy tính Mã số: 62 48 01 01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: GS TS Nguyễn Thanh Thủy PGS TSKH Nguyễn Cát Hồ Hà Nội – 2017 LỜI CAM ĐOAN Tôi xin cam đoan rằng, ngoại trừ nội dung trích từ tài liệu tham khảo công trình khác ghi rõ luận án, kết trình bày luận án công trình nghiên cứu hoàn thành hướng dẫn GS TS Nguyễn Thanh Thủy PGS TSKH Nguyễn Cát Hồ Các kết nghiên cứu trung thực, chưa công bố trước Các kết viết chung với tác giả khác đồng ý đồng tác giả trước đưa vào luận án Tác giả luận án Phạm Đình Phong ii LỜI CẢM ƠN Với lòng biết ơn sâu sắc, xin chân thành cảm ơn thầy GS TS Nguyễn Thanh Thủy PGS TSKH Nguyễn Cát Hồ trực tiếp bảo tận tình hướng dẫn hoàn thành luận án Tôi chân thành cảm ơn thầy TS Trần Thái Sơn có nhiều hỗ trợ trình nghiên cứu có nhận xét, đánh giá trình hoàn thiện luận án Tôi xin bày tỏ lòng biết ơn thầy giáo, cô giáo Bộ môn Khoa học máy tính, Khoa Công nghệ thông tin, Phòng đào tạo, Ban giám hiệu Trường Đại học Công nghệ tận tình bảo, giảng dạy tạo điều kiện thuận lợi suốt thời gian học tập, nghiên cứu hoàn thành luận án Tôi xin cảm ơn tất người thân, bạn bè đồng nghiệp tạo điều kiện, động viên hỗ trợ mặt Cuối cùng, xin được bày tỏ tình cảm lòng biết ơn vô hạn tới bố mẹ người thân gia đình, đặc biệt vợ – Phan Thị Quế Anh, người động viên, khích lệ, chia sẻ gánh vác công việc để có thời gian học tập, nghiên cứu hoàn thành luận án iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT vii DANH MỤC CÁC BẢNG ix DANH MỤC CÁC HÌNH VẼ, BIỂU ĐỒ xiii MỞ ĐẦU .1 CHƯƠNG TỔNG QUAN VỀ HỆ DỰA TRÊN LUẬT NGÔN NGỮ MỜ 1.1 MỘTSỐ KHÁI NIỆM CƠ BẢN 1.1.1 Tậpmờ 1.1.2 Biến ngôn ngữ .9 1.1.3 Phân hoạch mờ 10 1.1.4 Luật ngôn ngữ mờhệ luật ngôn ngữ mờ 11 1.1.5 Bài toán phânlớp liệu 12 1.2 HỆ DỰA TRÊN LUẬT NGÔN NGỮ MỜ 12 1.2.1 Cấu trúc hệ dựa luật ngôn ngữ mờ 13 1.2.2 Bài toán thiếtkếhệphânlớp dựa luật ngôn ngữ mờ 14 1.2.3 Những vấn đề tồn 19 1.3 ĐẠISỐGIATỬ 19 1.3.1 Đạisốgiatử biến ngôn ngữ 20 1.3.2 Lượng hóa đạisốgiatử .22 1.3.3 Ý nghĩa ứng dụng đạisốgiatử .25 1.3.4 Những vấn đề tồn 28 1.4 KẾT LUẬN CHƯƠNG 29 CHƯƠNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG CỦA KHUNG NHẬN THỨC NGÔN NGỮ VÀ ỨNG DỤNG GIẢI BÀI TOÁN PHÂNLỚP .30 2.1 MỞ RỘNG ĐẠISỐGIATỬ CHO VIỆC MÔ HÌNH HÓA LÕI NGỮ NGHĨA CỦA CÁC TỪ NGÔN NGỮ 30 iv 2.2 MỞ RỘNG KHÁI NIỆM ĐỘ ĐO TÍNH MỜ 37 2.3 HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ CỦA CÁC TỪ NGÔN NGỮ 40 2.4 ÁNH XẠ ĐỊNH LƯỢNG NGỮ NGHĨA KHOẢNG 44 2.5 MỞ RỘNG ĐỘ ĐO TÍNH MỜ CỦA CÁC PHẦNTỬVÀ 46 2.6 ỨNG DỤNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG TRONG THIẾTKẾHỆPHÂNLỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ 49 2.6.1 Thiếtkế ngữ nghĩa tính toán dựa tậpmờtừ ngôn ngữ 50 2.6.2 Sinh tập luật khởi đầu từ liệu dựa ngữ nghĩa ĐSGT mở rộng 56 2.6.3 Tối ưu tham số ngữ nghĩa tìm kiếm hệ luật tối ưu 59 2.6.4 Đánh giá kết ứng dụng lõi ngữ nghĩa ngữ nghĩa hình thang thiếtkếhệphânlớp dựa luật ngôn ngữ mờ 61 2.6.4.1 Dữ liệu phươngpháp thực nghiệm 61 2.6.4.2 So sánh đánh giá hai cấu trúc phân hoạch mờ đơn đa thể hạt 63 2.6.4.3 So sánh đánh giá hai phươngpháp lập luận single winner rule weigted vote 69 2.6.4.4 So sánh đánh giáphươngphápthiếtkếhệphânlớp theo tiếp cận đạisốgiatử 71 2.6.4.5 So sánh đánh giá với sốphươngpháp theo tiếp cận lýthuyếttậpmờ 73 2.6.4.6 So sánh đánh giá với số tiếp cận khác .77 2.6.5 Biểu diễn ngữ nghĩa tính toán dựa tậpmờ hình thang đảm bảo tính giải nghĩa khung nhận thức ngôn ngữ .79 2.7 KẾT LUẬN CHƯƠNG 84 CHƯƠNG THIẾTKẾ HIỆU QUẢ HỆPHÂNLỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ SỬ DỤNG KỸ THUẬT TÍNH TOÁN MỀM 85 3.1 THIẾTKẾ HIỆU QUẢ HỆPHÂNLỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ SỬ DỤNG CÁC THUẬT TOÁN TỐI ƯU 85 3.1.1 Đánh giá tính hiệu thuật toán MOPSO so với thuật toán GSA .88 v 3.1.1.1 Thuật toán tối ưu bầy đàn đa mục tiêu .88 3.1.1.2 Ứng dụng thuật toán MOPSO tối ưu tham số ngữ nghĩa tìm kiếm hệ luật tối ưu .92 3.1.1.3 Thực nghiệm so sánh thuật toán MOPSO so với thuật toán GSA 94 3.1.2 Đánh giá tính hiệu thuật toán MOPSO-SA so với thuật toán MOPSO 96 3.1.2.1 Thuật toán tối ưu đa mục tiêu lai MOPSO-SA 96 3.1.2.2 Ứng dụng thuật toán MOPSO-SA tối ưu tham số ngữ nghĩa tìm kiếm hệ luật tối ưu 99 3.1.2.3 Thực nghiệm so sánh thuật toán MOPSO-SA so với thuật toán MOPSO 101 3.2 NÂNG CAO HIỆU QUẢ SINH LUẬT MỜ VỚI NGỮ NGHĨA DỰA TRÊNĐẠISỐGIATỬ SỬ DỤNG KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG103 3.2.1 Mộtsố khái niệm lýthuyết thông tin 104 3.2.2 Kỹ thuật lựa chọn đặc trưng sử dụng trọng số động 105 3.2.3 Ứng dụng thuật DWFS thiếtkế FLRBC sở ĐSGT .107 3.2.4 Kết thực nghiệm thảo luận .109 3.3 KẾT LUẬN CHƯƠNG 113 KẾT LUẬN CỦA LUẬN ÁN .115 DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN .117 TÀI LIỆU THAM KHẢO .119 PHỤ LỤC A vi DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu AX Đạisốgiatử tuyến tính AXmp Đạisốgiatửmở rộng AXmrtp Đạisốgiatửmở rộng toàn phần μ(h) Độ đo tính mờgiatử h fm(x) Độ đo tính mờtừ ngôn ngữ x f(x) Hàm định lượng khoảng từ ngôn ngữ x μA(x) Hàm xác định độ thuộc giá trị x vào tậpmờ A |x| Độ dàitừ ngôn ngữ x Xk Tập các từcó độ dài k X(k) Tập các từcó độ dài nhỏ k X Biến ngôn ngữ H Tậpgiatử |H| Số lượng giatử H Hmr Tậpgiatửmở rộng (bổ sung thêm giatử h0) H+ Tậpgiatử dương H- Tậpgiatử âm H(x) Tậptừ cảm sinh từ x tác động giatử k(x) Khoảng tính mờ mức k x RMSR Root mean squared residual Các từ viết tắt ĐSGT Đạisốgiatử DB Database (Cơ sở liệu) FLRBC Fuzzy linguistic rule-based classifier (Hệ phânlớp dựa luật ngôn ngữ mờ) vii FLRBS fuzzy linguistic rule-based system (Hệ dựa luật ngôn ngữ mờ) FURIA Fuzzy unordered rules induction algorithm (Giải thuật cảm sinh luật mờ thứ tự) GSA Genetic simulated annealing (Tôi luyện mô di truyền) KB Knowledge base (Cơ sở tri thức) LFoC Linguistic frames of cognition (Khung nhận thức ngôn ngữ) MOO Multi-objective optimization (Tối ưu đa mục tiêu) MOPSO Multi-objective particle swarm optimization (Giải thuật tối ưu bầy đàn đa mục tiêu) PAES Pareto archived evolution strategy (Chiến lược tiến hóa lưu trữ Pareto) PI Power set of intervals (Tập khoảng có thể) PSO Particle swarm optimization (Tối ưu bầy đàn) RCS Rule and condition selection (Lựa chọn luật điều kiện luật) RIPPER Repeated incremental pruning to produce error reduction (Giảm lỗi lặp lại cắt tỉa gia tăng) SVM Support vector machine (Máy véc-tơ hỗ trợ) SWR Single winner rule (Luật thắng đơn) WV Weighted vote (Bầu cử có trọng số) viii DANH MỤC CÁC BẢNG TRONG NỘI DUNG CHÍNH Bảng 2.3 So sánh độ xác hệphânlớp sử dụng cấu trúc đa thể hạt đơn thể hạt sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ………… 68 Bảng 2.4 So sánh độ phức tạphệphânlớp sử dụng cấu trúc đa thể hạt đơn thể hạt sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ………… 68 Bảng 2.6 So sánh độ xác hệphânlớpthiếtkếsở ĐSGT AXmr AXmrtp sử dụng phươngpháp lập luận SWR WV phươngpháp kiểm định Wilcoxon Signed Rank với α = 0,05 ………………………… …… 70 Bảng 2.7 So sánh độ phức tạphệphânlớpthiếtkếsở ĐSGT AXmr AXmrtp sử dụng phươngpháp lập luận SWR WV phươngpháp kiểm định Wilcoxon Signed Rank với α = 0,05 ………………………………… 70 Bảng 2.9 So sánh độ xác FRBC_AXmrtp, FRBC_AXmr FRBC_AX sử dụng phươngpháp kiểm định Wilcoxon Signed Rank với α = 0,05 …………… 72 Bảng 2.10 So sánh độ phức tạp FRBC_AXmrtp, FRBC_AXmr FRBC_AX sử dụng phươngpháp kiểm định Wilcoxon Signed Rank với α = 0,05 …………… 72 Bảng 2.11 So sánh độ xác FRBC_AXmrtp FRBC_AXmr so với All Granularities Product-1-ALL TUN sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 …… ……………………………………………………………… 74 Bảng 2.12 So sánh độ phức tạp FRBC_AXmrtp FRBC_AXmr so với All Granularities Product-1-ALL TUN sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ……………………………………………………………………… 75 Bảng 2.14 So sánh độ xác FRBC_AXmrtp FRBC_AXmr so với hệphânlớp PAES-RCS sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 …… 77 Bảng 2.15 So sánh độ phức tạp FRBC_AXmrtp FRBC_AXmr so với hệphânlớp PAES-RCS sử dụng kiểm định Wilcoxon Signed Rank với α = 0,05 ……… 77 Bảng 2.16 So sánh độ xác FRBC_AXmrtp FRBC_AXmr so với FURIA C4.5 sử dụng kiểm tra Wilcoxon Signed Rank với α = 0,05 ………………… 79 Bảng 2.17 So sánh độ phức tạp FRBC_AXmrtp FRBC_AXmr so với FURIA C4.5 sử dụng kiểm tra Wilcoxon Signed Rank với α = 0,05 ……………… 79 Bảng 2.18 So sánh kết thực nghiệm hai hệphânlớp FRBC_AXmrtp_k0 FRBC_AXmrtp………………………………………………………………… 82 ix ...ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Đình Phong PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ Chuyên ngành:... đại số gia tử Dựa phân tích ưu nhược điểm phương pháp thiết kế FLRBC để đặt vấn đề cần nghiên cứu giải luận án 1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN 1.1.1 Tập mờ Lý thuyết tập mờ Zadeh giới thiệu vào năm... CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu AX Đại số gia tử tuyến tính AXmp Đại số gia tử mở rộng AXmrtp Đại số gia tử mở rộng toàn phần μ(h) Độ đo tính mờ gia tử h fm(x) Độ đo tính mờ từ ngôn ngữ