Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 148 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
148
Dung lượng
1,1 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Trần Thanh Đại RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ TRỰC CẢM VÀ TÔPÔ SUY RỘNG LUẬN ÁN TIẾN SĨ NGÀNH HỆ THỐNG THÔNG TIN Hà Nội - Năm 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Trần Thanh Đại RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ TRỰC CẢM VÀ TÔPÔ SUY RỘNG LUẬN ÁN TIẾN SĨ NGÀNH HỆ THỐNG THÔNG TIN Mã số: 48 01 04 Xác nhận Học viện Khoa học Công nghệ Người hướng dẫn (Ký, ghi rõ họ tên) Người hướng dẫn (Ký, ghi rõ họ tên) Hà Nội - Năm 2023 i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng hướng dẫn PGS TS Nguyễn Long Giang GS TS Vũ Đức Thi Viện Công nghệ thông tin - Viện Hàn lâm Khoa học Công nghệ Việt Nam Các kết nghiên cứu lý thuyết thực nghiệm luận án trình bày xác, trung thực khơng chép từ nguồn tài liệu hình thức Việc tham khảo nguồn liệu trích dẫn ghi nguồn đầy đủ Hà Nội, ngày tháng 10 năm 2023 Trần Thanh Đại ii LỜI CẢM ƠN Luận án hoàn thiện với nỗ lực cố gắng không ngừng tác giả với ân cần bảo, giúp đỡ thầy hướng dẫn, góp ý xác đáng chuyên gia, nhà khoa học, động viên tinh thần gia đình, bạn bè đồng nghiệp suốt trình học tập nghiên cứu tác giả Trước tiên, tác giả xin bày tỏ lòng biết ơn đến PGS TS Nguyễn Long Giang, GS TS Vũ Đức Thi tận tình bảo, hướng dẫn động viên tác giả hoàn thành luận án mục tiêu tiến độ Tác giả xin bày tỏ lời cảm ơn sâu sắc đến PGS TS Lê Hồng Sơn có góp ý quý giá suốt trình thực luận án Tác giả xin gửi lời cảm ơn tới thầy, giáo cán phịng quản lý nghiên cứu sinh Học viện Khoa học Công nghệ, Viện Hàn lâm Khoa học Công nghệ Việt Nam Đặc tác giả xin trân trọng cảm ơn phịng quản lý sau đại học Viện Cơng nghệ thơng tin nhiệt tình giúp đỡ, tạo mơi trường nghiên cứu thuận lợi cho tác giả hoàn thành luận án tiến độ quy định Học viện Tác giả xin chân thành cảm ơn nhóm nghiên cứu AI 4.0 Viện Công nghệ thông tin (ITI) - Đại học Quốc gia Hà Nội giúp đỡ tác giả mặt chuyên môn tinh thần nghiên cứu suốt trình trao đổi nghiên cứu học thuật ITI Tác giả xin chân thành cảm ơn tới Ban Giám Hiệu Trường Đại học Kinh tế Kỹ thuật Công nghiệp động viên tinh thần tạo nhiều điều kiện thuận lợi suốt trình học tập nghiên cứu Đặc biệt tác giả xin bày tỏ lòng biết ơn sâu sắc tới Gia đình người thân hi sinh vơ điều kiện, tạo điều kiện tốt tinh thần thời gian cho tác giả suốt trình học tập làm nghiên cứu NCS Trần Thanh Đại iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC v DANH MỤC CÁC THUẬT NGỮ, CÁC CHỮ VIẾT TẮT vi DANH MỤC CÁC KÝ HIỆU vii DANH MỤC HÌNH VẼ ix DANH MỤC BẢNG BIỂU xi MỞ ĐẦU CHƯƠNG TỔNG QUAN BÀI TỐN RÚT GỌN THUỘC TÍNH THEO TIẾP CẬN RS VÀ TÔPÔ 1.1 Mở đầu 1.2 Các khái niệm 10 1.3 1.4 1.5 1.2.1 Hệ thông tin mơ hình RS truyền thống 10 1.2.2 RS mờ trực cảm 12 1.2.3 Không gian tôpô 16 1.2.4 Tập rút gọn 17 Một số cơng thức tính tốn độ thành viên 18 1.3.1 Chuẩn hóa liệu 18 1.3.2 Độ đo độ tương tự 19 Phương pháp đánh giá reduct 21 1.4.1 Các tiêu chí đánh giá 21 1.4.2 Mơ hình liệu đánh giá 22 1.4.3 Chỉ số đánh giá 22 Một số phương pháp giảm thuộc tính 24 iv 1.6 1.5.1 Phương pháp giảm thuộc tính theo tiếp cận ma trận phân biệt 24 1.5.2 Phương pháp giảm thuộc tính theo tiếp cận độ đo 26 1.5.3 Phương pháp giảm thuộc tính theo tiếp cận tơpơ 31 Kết luận Chương 34 CHƯƠNG PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN RS MỜ TRỰC CẢM 35 2.1 Mở đầu 35 2.2 Xây dựng độ đo khoảng cách mờ trực cảm 36 2.3 2.2.1 Khoảng cách hai tập mờ trực cảm 36 2.2.2 Khoảng cách hai phân hoạch mờ trực cảm 38 Giảm thuộc tính bảng định sử dụng độ đo khoảng cách mờ trực cảm 40 2.3.1 Đề xuất thuật tốn tìm reduct theo phương pháp lai ghép filter - wrapper, sử dụng độ đo khoảng cách mờ trực cảm 40 2.3.2 2.4 Thực nghiệm đánh giá thuật toán 45 Kết luận Chương 61 CHƯƠNG PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN TÔPÔ MỜ TRỰC CẢM 62 3.1 Mở đầu 62 3.2 Đề xuất cấu trúc tôpô mờ trực cảm 63 3.3 Đề xuất độ đo tương đồng hai tôpô mờ trực cảm 67 3.4 Giảm thuộc tính bảng định theo tiếp cận tơpơ mờ trực cảm 3.4.1 68 Đề xuất thuật tốn tìm reduct bảng định theo phương pháp filter, sử dụng cấu trúc tôpô mờ trực cảm 68 3.4.2 Đề xuất thuật tốn tìm reduct bảng định theo phương pháp lai ghép filter - wrapper, sử dụng cấu trúc tôpô mờ trực cảm 71 v 3.4.3 3.5 Thực nghiệm đánh giá thuật toán 75 Kết luận Chương 89 CHƯƠNG PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN TÔPÔ HAUSDORFF 90 4.1 Mở đầu 90 4.2 Đề xuất cấu trúc tôpô từ không gian xấp xỉ mờ ngưỡng β 91 4.3 Đề xuất cấu trúc tôpô Hausdorff 97 4.4 Giảm thuộc tính bảng định theo tiếp cận tơpơ Hausdorff 98 4.4.1 Đề xuất thuật tốn tìm reduct bảng định theo phương pháp lai ghép filter - wrapper, sử dụng cấu trúc tôpô Hausdorff 98 4.4.2 4.5 Thực nghiệm đánh giá thuật toán 101 Kết luận Chương 117 KẾT LUẬN 118 DANH MỤC CÁC CƠNG TRÌNH NGHIÊN CỨU 120 TÀI LIỆU THAM KHẢO 121 vi DANH MỤC CÁC THUẬT NGỮ, CÁC CHỮ VIẾT TẮT IS Hệ thông tin (Information System) DT Bảng định (Decision Table) FN False Negative (Phủ định sai) FP False Positive (Khẳng định sai) TN True Negative (Phủ định đúng) TP True Positive (Khẳng định đúng) Base Cơ sở Subbase Cơ sở IF-base Cơ sở mờ trực cảm (Intuittionistic Fuzzy Base) IF-subbase Cơ sở mờ trực cảm (Intuittionistic Fuzzy Subbase) FRS Tập thô mờ (Fuzzy Rough Set) IFRS Tập thô mờ trực cảm (Intuitionistic Fuzzy Rough Set) IFS Tập mờ trực cảm (Intuitionistic Fuzzy Set) IFT Tôpô mờ trực cảm (Intuitionistic Fuzzy Topology) NRS Tập thô lân cận (Neighborhood Rough set) PRS Tập thô xác suất (Probality Rough set) VPRS Tập thơ điều chỉnh xác (Variable Precision Rough Set) IFIE Entropy thông tin mờ trực cảm (Intuitionistic Fuzzy Information Entropy) IFD khoảng cách mờ trực cảm (Intuitionistic Fuzzy Distance) Hybrid lai ghép k-NN k- láng giềng gần (k - Nearest Neighbor) SVM Máy vector hỗ trợ (Supper Vector Meachine) vii DANH MỤC CÁC KÝ HIỆU C Tập thuộc tính điều kiện D Tập thuộc tính định U Tập đối tượng O Big-O R Tập số thực T Thời gian thực mơ hình phân lớp M Ma trận quan hệ MT Ma trận chuyển vị Model Mơ hình phân lớp R Quan hệ tương đương R≥ Quan hệ ưu tiên CLS Miền đóng INT Miền ACC Độ xác (Accuracy) WA wrapper thuộc tính (wrapper attribute) Wδ wrapper theo giá trị delta RAW Dữ liệu ban đầu |C| Số lượng thuộc tính điều kiện tập C |U| Số lượng đối tượng tập U viii DANH MỤC CÁC HÌNH VẼ 2.1 Tác động δ tới số lượng phần tử khả phân lớp mơ hình phân lớp SVM 46 2.2 Tác động δ tới số lượng phần tử khả phân lớp mơ hình phân lớp KNN 47 2.3 Sự tương quan số lượng phần tử khả phân lớp xác reduct thu từ thuật tốn mơ hình phân lớp SVM 55 2.4 Sự tương quan số lượng phần tử khả phân lớp xác reduct thu từ thuật tốn mơ hình phân lớp KNN 56 3.1 Tập rút gọn thu từ thuật toán F_IFT 77 3.2 Sự tương quan số lượng phần tử khả phân lớp xác reduct thu từ thuật tốn so với F_IFT mơ hình phân lớp KNN 78 3.3 Sự tương quan số lượng phần tử khả phân lớp xác reduct thu từ thuật tốn so với F_IFT mơ hình phân lớp SVM 79 3.4 Biểu đồ đánh giá tương quan số lượng phần tử reduct (trái) chi phí tính tốn (phải) với số lượng thuộc tính ban đầu thuật toán F_IFT so với thuật toán khác 82 3.5 Sự tương quan số lượng phần tử khả phân lớp xác reduct thu từ thuật toán so với FW_IFT mơ hình phân lớp KNN 84 3.6 Sự tương quan số lượng phần tử khả phân lớp xác reduct thu từ thuật toán so với FW_IFT mơ hình phân lớp SVM 85 35 CHƯƠNG PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN RS MỜ TRỰC CẢM 2.1 Mở đầu Để giảm thuộc tính trực tiếp bảng định miền giá trị số liên tục Khoảng mười năm trở lại đây, nhà nghiên cứu thường mở rộng mơ hình RS truyền thống sang mơ hình RS lân cận [75], [80], [81], [85], [125], mơ hình RS mờ [33], [56], [59], [99], [126] Bên cạnh đó, mơ hình RS xác suất [29], [127], [128], mơ hình tập thơ biến thiên độ xác [89], [129] nhà nghiên cứu mở rộng cho trường hợp liệu nhiễu Tuy nhiên khả cải thiện nhiễu tiếp cận chưa hiệu Gần đây, mơ hình RS mờ trực cảm [27], [34], [93] nhiều nhà nghiên cứu quan tâm cải thiện chất lượng phân lớp reduct liệu nhiễu Trên sở khung kiến trúc [34] IFRS, nhiều mơ hình suy rộng từ RS mờ trực cảm đề xuất mô hình RS lân cận mờ trực cảm [27], [34], [93], mơ hình RS biến thiên mờ trực cảm[108], mơ hình RS xác suất mờ trực cảm [128] Từ đó, nhiều phương pháp giảm thuộc tính cho bảng định miền giá trị số đề xuất [36], [102], [103], [128], [130] Gần phương pháp giảm thuộc tính theo tiếp cận IFRS Tan công đề xuất [36], [131] chứng minh cải thiện nhiễu cho reduct hiệu số liệu so với mơ hình mở rộng khác IFRS Tuy nhiên không gian xấp xỉ mờ trực cảm tác giả đề xuất phức tạp chưa mô tả đầy đủ thông tin quan hệ đối tượng theo góc nhìn tập mờ trực cảm Hơn độ đo đánh giá độ quan trọng tác giả đề xuất phức tạp, chiếm nhiều chi phí tính 36 tốn thực tế Trong phần luận án trình bày phương pháp giảm thuộc tính theo tiếp cận RS mờ trực cảm Trong đó, đề xuất độ đo đánh giá độ quan trọng thuộc tính sở mở rộng độ đo khoảng cách không gian xấp xỉ mờ trực cảm Trên sở đề xuất thuật tốn giảm thuộc tính theo phương pháp lai ghép filter - wrapper hai bước Trong bước Wδ sử dụng để xác định reduct ứng viên mức δ , bước WA sử dụng để xác định reduct thực thuật toán Các kết thực nghiệm cho thấy thuật toán đề xuất cho reduct hiệu số lượng phần tử khả phân lớp hầu hết tập liệu so với tập liệu gốc Hơn số tập liệu nhiễu cải thiện tốt so với thuật toán so sánh Các kết nghiên cứu cơng bố cơng trình nghiên cứu [CT3, CT4] 2.2 Xây dựng độ đo khoảng cách mờ trực cảm 2.2.1 Khoảng cách hai tập mờ trực cảm Bổ đề 2.1 [Số mờ trực cảm] Cho ba số thực a, b, c ∈ [0, 1] Khi đó: 1) Nếu a ≥ b a − b ≥ (a, c) − (b, c) 2) Nếu a ≤ b a − b ≤ max (a, c) − max (b, c) ≈ ≈ ≈ Mệnh đề 2.1 (Quan hệ IFS) Cho X , Y , Z tập mờ trực cảm xác định U, với U tập khơng rỗng đối tượng Khi đó: ≈ ≈ ≈ ≈