Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 117 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
117
Dung lượng
1,93 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… NGUYỄN VĂN THIỆN MỘT SỐ PHƢƠNG PHÁP LAI GHÉP TRONG RÚT GỌN THUỘC TÍNH THEO TIẾP CẬN TẬP THÔ MỜ LUẬN ÁN TIẾN SĨ MÁY TÍNH VÀ CƠNG NGHỆ THƠNG TIN Hà Nội – 2018 VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… NGUYỄN VĂN THIỆN MỘT SỐ PHƢƠNG PHÁP LAI GHÉP TRONG RÚT GỌN THUỘC TÍNH THEO TIẾP CẬN TẬP THƠ MỜ LUẬN ÁN TIẾN SĨ MÁY TÍNH VÀ CƠNG NGHỆ THƠNG TIN Chuyên ngành : Hệ thống thông tin Mã số: 48 01 04 Ngƣời hƣớng dẫn khoa học: PGS.TS Nguyễn Long Giang TS Nguyễn Nhƣ Sơn Hà Nội – 2018 i MỤC LỤC MỤC LỤC .i Danh mục thuật ngữ iii Bảng ký hiệu, từ viết tắt iv Danh sách bảng v Danh sách hình vẽ vi MỞ ĐẦU Chương TỔNG QUAN VỀ RÚT GỌN THUỘC TÍNH THEO TIẾP CẬN TẬP THƠ MỜ 1.1 Một số khái niệm lý thuyết tập thô 1.1.1 Hệ thông tin bảng định 1.1.2 Quan hệ tương đương 1.1.3 Các tập xấp xỉ tập thô 1.2 Một số khái niệm lý thuyết tập thô mờ 1.2.1 Quan hệ tương đương mờ 1.2.2 Ma trận tương đương mờ 10 1.2.3 Phân hoạch mờ 12 1.2.4 Các tập xấp xỉ mờ tập thô mờ .15 1.3 Tổng quan rút gọn thuộc tính 16 1.3.1 Rút gọn thuộc tính 16 1.3.2 Tiếp cận filter, wrapper rút gọn thuộc tính .17 1.4 Các nghiên cứu liên quan đến rút gọn thuộc tính theo tiếp cận tập thơ mờ 19 1.4.1 Rút gọn thuộc tính bảng định mờ theo tiếp cận tập thô mờ 20 1.4.2 Rút gọn thuộc tính trực tiếp bảng định theo tiếp cận tập thô mờ 22 1.4.3 Phương pháp gia tăng rút gọn thuộc tính bảng định thay đổi theo tiếp cận tập thô mờ .30 1.5 Tóm tắt đóng góp luận án 35 1.6 Kết luận 35 Chương RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH SỬ DỤNG ĐỘ PHỤ THUỘC MỜ VÀ KHOẢNG CÁCH MỜ 36 2.1 Mở đầu 36 ii 2.2 Rút gọn thuộc tính sử dụng độ phụ thuộc mờ 37 2.2.1 Rút gọn thuộc tính sử dụng độ phụ thuộc theo tiếp cận filter 37 2.2.2 Rút gọn thuộc tính sử dụng độ phụ thuộc mờ theo tiếp cận filter 39 2.2.3 Rút gọn thuộc tính sử dụng độ phụ thuộc mờ theo tiếp cận filter-wrapper .44 2.2.4 Thực nghiệm thuật toán .46 2.3 Rút gọn thuộc tính sử dụng khoảng cách mờ 53 2.3.1 Xây dựng khoảng cách mờ hai tập mờ 54 2.3.2 Xây dựng khoảng cách mờ hai phân hoạch mờ .57 2.3.3 Rút gọn thuộc tính sử dụng khoảng cách mờ theo tiếp cận filter 60 2.3.4 Rút gọn thuộc tính sử dụng khoảng cách mờ theo tiếp cận filter-wrapper .64 2.3.5 Thực nghiệm thuật toán .67 2.4 Kết luận chương 71 Chương RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THAY ĐỔI SỬ DỤNG KHOẢNG CÁCH MỜ 73 3.1 Mở đầu 73 3.2 Thuật toán gia tăng filter-wrapper tìm tập rút gọn xấp xỉ bổ sung tập đối tượng 75 3.2.1 Cơng thức gia tăng tính khoảng cách mờ bổ sung tập đối tượng 75 3.2.2 Thuật tốn gia tăng filter-wrapper tìm tập rút gọn bổ sung tập đối tượng 78 3.2.3 Thực nghiệm thuật toán 82 3.3 Thuật tốn filter-wrapper tìm tập rút gọn loại bỏ tập đối tượng 89 3.3.1 Công thức cập nhật khoảng cách mờ loại bỏ tập đối tượng 89 3.3.2 Thuật tốn filter-wrapper tìm tập rút gọn loại bỏ tập đối tượng 92 3.4 Kết luận chương 96 KẾT LUẬN .97 Danh mục cơng trình tác giả 98 Tài liệu tham khảo 99 iii Danh mục thuật ngữ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh Tập thô Rough Set Tập thô mờ Fuzzy Rough Set Hệ thông tin Information System Bảng định Decision Tables Bảng định mờ Fuzzy Decision Tables Quan hệ tương đương Equivalence Relation Quan hệ tương đương mờ Fuzzy Equivalence Relation Phân hoạch mờ Fuzzy Partition Ma trận tương đương mờ Fuzzy Equivalence Matrix Lớp tương đương mờ Fuzzy equivalence Classes Xấp xỉ mờ Fuzzy Lower Approximation Xấp xỉ mờ Fuzzy Upper Approximation Miền dương mờ Fuzzy Positive Region Độ phụ thuộc mờ thuộc tính Fuzzy Dependency Degree Rút gọn thuộc tính Attribute Reduction Tập rút gọn Reduct Phương pháp gia tăng Incremental Methods Khoảng cách mờ Fuzzy Distance Lọc Filter Đóng gói Wrapper iv Bảng ký hiệu, từ viết tắt Ký hiệu, từ viết tắt IS U , A Diễn giải Hệ thông tin DS U , C D Bảng định U Số đối tượng C Số thuộc tính điều kiện bảng định u a Giá trị đối tượng u thuộc tính a IND B Quan hệ tương đương B U/P u B Phân hoạch U P Lớp tương đương chứa u phân hoạch U / P R Quan hệ tương đương mờ R RP Quan hệ tương đương mờ R tập thuộc tính P M RP Ma trận tương đương mờ R P RP Phân hoạch mờ R P xi P Lớp tương đương mờ xi thuộc phân hoạch mờ RP xi P Lực lượng lớp tương đương mờ xi P RP X Tập xấp xỉ mờ X R P RP X Tập xấp xỉ mờ X R P POSR P RQ Miền dương mờ R Q R P R D Độ phụ thuộc mờ P D dựa quan hệ R P P D R P , RQ Khoảng cách mờ hai phân hoạch mờ R P RQ v Danh sách bảng Bảng 1.1 Bảng định Ví dụ 1.1 14 ản ảng định mờ 21 Bảng 2.1 Bảng định Ví dụ 2.1 42 Bảng 2.2 Bộ liệu thử nghiệm thuật toán F_FRSAR, FW_FRSAR 47 Bảng 2.3 Độ xác phân lớp F_FRSAR RSAR 49 Bảng 2.4 Độ xác phân lớp GAIN_RATIO_AS_FRS F_FRSAR 50 Bảng 2.5 Độ xác phân lớp FW_FRSAR, F_FRSAR, GAIN_RATIO_AS_FRS 52 Bảng 2.6 Thời gian thực FW_FRSAR, F_FRSAR, GAIN_RATIO_AS_FRS 53 Bảng 2.7 Bảng định Ví dụ 2.3 63 Bảng 2.8 Bộ liệu thử nghiệm thuật toán FW_FDAR 68 Bảng 2.9 Độ xác phân lớp FW_FDAR, FEBAR, FPDAR 70 Bảng 2.10 Thời gian thực FW_FDAR, FEBAR, FPDAR 71 Bảng 3.1 Bộ liệu thử nghiệm thuật toán IFW_FDAR_AdObj 83 Bảng 3.2 Thời gian thực IFW_FDAR_AdObj, FW_FDAR, FEBAR (s) 85 Bảng 3.3 Độ xác phân lớp IFW_FDAR_AdObj, FW_FDAR, FEBAR 86 Bảng 3.4 Thời gian thực IFW_FDAR_AdObj, IV-FS-FRS-2, IARM 87 Bảng 3.5 Độ xác phân lớp IFW_FDAR_AdObj, IV-FS-FRS-2, IARM 88 vi Danh sách hình vẽ Hình 1.1 Quy trình rút gọn thuộc tính 18 Hình 1.2 Cách tiếp cận filter wrapper rút gọn thuộc tính 19 Hình 2.1 Độ xác phân lớp F_FRSAR RSAR 49 Hình 2.2 Độ xác phân lớp GAIN_RATIO_AS_FRS F_FRSAR 51 MỞ ĐẦU Với phát triển mạnh mẽ công nghệ thông tin, sở liệu ngày gia tăng dung lượng liệu số lượng thuộc tính, gây nhiều khó khăn cho việc thực thi thuật toán khai phá liệu Vấn đề đặt phải tìm cách rút gọn số lượng thuộc tính mà không làm mát thông tin cần thiết phục vụ nhiệm vụ khai phá liệu Do đó, rút gọn thuộc tính (cịn gọi rút gọn chiều hay rút gọn đặc trưng) đề tài thu hút quan tâm nhiều nhà nghiên cứu thuộc lĩnh vực nhận dạng thống kê, học máy, khai phá liệu Rút gọn thuộc tính tốn quan trọng bước tiền xử lý liệu với mục tiêu loại bỏ thuộc tính dư thừa, khơng liên quan nhằm tăng tính hiệu thuật tốn khai phá liệu Hiện có hai cách tiếp cận tốn rút gọn thuộc tính [43, 44]: filter (lọc) wrapper (đóng gói) Cách tiếp cận filter thực việc rút gọn thuộc tính độc lập với thuật khai phá liệu sử dụng sau Các thuộc tính chọn dựa độ quan trọng chúng việc phân lớp liệu Trong đó, cách tiếp cận wrapper tiến hành việc lựa chọn cách áp dụng thuật khai phá, độ xác kết lấy làm tiêu chuẩn để lựa chọn tập thuộc tính Lý thuyết tập thô (Rough set) Pawlak đề xuất [101] cơng cụ hiệu giải tốn rút gọn thuộc tính cộng đồng nghiên cứu tập thô thực lâu Các phương pháp rút gọn thuộc tính theo tiếp cận tập thơ truyền thống tập thô dung sai nghiên cứu đầy đủ luận án tiến sĩ [4, 5, 6, 11, 13], bao gồm phương pháp như: phương pháp dựa miền dương, phương pháp sử dụng ma trận không phân biệt được, phương pháp sử dụng entropy thông tin, phương pháp sử dụng độ đo tinh toán hạt, phương pháp sử dụng metric (khoảng cách) Gần đây, luận án tiến sĩ [7] nghiên cứu phương pháp gia tăng tìm tập rút gọn bảng định thay đổi theo tiếp cận tập thô truyền thống Tuy nhiên, phương pháp rút gọn thuộc tính theo tiếp cận tập thơ truyền thống, tập thô dung sai luận án tiến sĩ nêu nghiên cứu liên quan theo hướng tiếp cận filter thực bảng định có miền giá trị rời rạc (bảng định sau thực phương pháp rời rạc hóa liệu) Các phương pháp rời rạc hóa liệu khơng bảo tồn khác ban đầu đối tượng liệu gốc Do đó, phương pháp rút gọn thuộc tính theo tiếp cận tập thơ, tập thơ dung sai trình bày giảm thiểu độ xác mơ hình phân lớp liệu gốc Nhằm nâng cao độ xác mơ hình phân lớp, nhà nghiên cứu đề xuất phương pháp rút gọn thuộc tính theo tiếp cận tập thô mờ Lý thuyết tập thô mờ (Fuzzy rough set) Dubois cộng [22, 23] đề xuất kết hợp lý thuyết tập thô lý thuyết tập mờ nhằm xấp xỉ tập mờ dựa quan hệ tương đương mờ (fuzzy equivalent relation) xác định miền giá trị thuộc tính Ban đầu, tập thơ mờ cơng cụ giải tốn rút gọn thuộc tính bảng định mờ [40, 41, 76, 77, 78, 79, 81] Về sau, nhà nghiên cứu tập trung giải tốn rút gọn thuộc tính trực tiếp bảng định gốc (bảng định không qua bước rời rạc hóa liệu) theo tiếp cận tập thơ mờ nhằm nâng cao độ xác mơ hình phân lớp Các phương pháp rút gọn thuộc tính bảng định gốc theo tiếp cận tập thô mờ nghiên cứu mở rộng phương pháp rút gọn thuộc tính theo tiếp cận tập thơ truyền thống nghiên cứu lâu Đây phương pháp heuristic theo tiếp cận filter, bao gồm bước xây dựng độ đo, định nghĩa tập rút gọn độ quan trọng thuộc tính sử dụng độ đo xây dựng, sở xây dựng thuật tốn heuristic tìm tập rút gọn theo tiêu chuẩn độ quan trọng thuộc tính Việc đánh giá độ xác mơ hình phân lớp thực sau tìm tập rút gọn Cho đến nay, nghiên cứu liên quan đến rút gọn thuộc tính trực tiếp bảng định gốc theo tiếp cận tập thơ mờ tập trung vào phương pháp như: phương pháp sử dụng miền dương mờ [2, 72, 80, 92], phương pháp sử dụng ma trận phân biệt mờ [34, 42, 29, 30, 69], phương pháp sử dụng entropy mờ [45, 70, 71, 74, 91, 75, 33, 55], phương pháp sử dụng khoảng cách mờ [3, 8, 18] Gần đây, số nhà nghiên cứu đề xuất phương pháp mở rộng dựa độ đo khác định nghĩa [14, 19, 21, 30, 33, 35, 46, 47, 59, 68, 85, 90, 100] Kết thử nghiệm 95 Tiếp theo, đánh giá độ phức tạp thuật toán UFW_FDAR_DelObj Giả sử D d ký hiệu C , U , U tương ứng số thuộc tính điều kiện, số đối tượng số đối tượng bị loại bỏ khỏi U Độ phức tạp vòng lặp For câu lệnh số O U * U Trong trường hợp tốt nhất, thuật toán kết thúc câu lệnh (tập rút gọn không thay đổi) Khi đó, độ phức tạp thuật tốn UFW_FDAR_DelObj O U * U Ngược lại, độ phức tạp tính khoảng cách phân hoạch mờ ban đầu câu lệnh số O U Xét vòng lặp While từ câu lệnh đến 20, độ phức tạp tính khoảng cách phân hoạch mờ xóa U câu lệnh O U * U Để tính SIGBa a ta phải tính DU U R Ba , R Bad D R , R tính bước U U trước Độ phức tạp tính DU U R Ba , R Bad B d B O U * U Do đó, độ phức tạp vòng lặp While O B * U * U Do đó, độ phức tạp giai đoạn filter trường hợp xấu O B * U * U Độ phức tạp giai đoạn wrapper phụ thuộc vào độ phức tạp phân lớp sử dụng Giả sử độ phức tạp phân lớp O T , độ phức tạp giai đoạn wrapper O B * T Vì vậy, độ phức tạp thuật toán UFW_FDAR_DelObj O B * U * U O B * T Nếu thực thuật toán FW_FDAR trực tiếp bảng định có số đối tượng U U , theo mục 3.3 độ phức tạp thuật toán FW_FDAR là O C * U U Do đó, U nhỏ, thuật tốn theo tiếp cận tính tốn gia tăng 2 UFW_FDAR_DelObj tốt thuật toán FW_FBAR Tuy nhiên, U lớn B lớn việc tính lại tập rút gọn trực tiếp sau xóa tập đối tượng tỏ hiệu thời gian thực 96 3.4 Kết luận chương Trong chương 3, luận án xây dựng cơng thức gia tăng tính khoảng cách mờ trường hợp bổ sung, loại bỏ tập đối tượng Khoảng cách mờ đề xuất chương Dựa cơng thức gia tăng tính khoảng cách phân hoạch mờ, luận án đề xuất hai thuật toán gia tăng filter-wrapper: 1) Thuật tốn gia tăng filter-wrapper IFW_FDAR_AdObj tìm tập rút gọn trường hợp bổ sung tập đối tượng 2) Thuật tốn gia tăng filter-wrapper UFW_FDAR_DelObj tìm tập rút gọn trường hợp loại bỏ tập đối tượng Luận án tiến hành thực nghiệm thuật toán liệu mẫu từ kho liệu UCI [61] để đánh giá tính hiệu thuật tốn gia tăng filter- wrapper IFW_FDAR_AdObj So với hai thuật toán khơng gia tăng filter-wrapper FW_FDAR FEBAR [91], thuật tốn IFW_FDAR_AdObj giảm thiểu đáng kể thời gian thực So với hai thuật toán gia tăng filter IV-FS-FRS-2 [99] IARM [98], thuật tốn IFW_FDAR_AdObj có độ xác phân lớp cao hơn, số thuộc tính tập rút gọn hơn, giảm thiểu đáng kể độ phức tạp mơ hình Tuy nhiên, thuật tốn IFW_FDAR_AdObj có thời gian thực lớn phải tính toán phân lớp Các kết nghiên cứu Chương cơng bố cơng trình 7, phần “Danh mục cơng trình tác giả” 97 KẾT LUẬN 1) Những kết luận án: Luận án nghiên cứu hướng tiếp cận filter-wrapper tìm tập rút gọn bảng định nhằm giảm thiểu số lượng thuộc tính tập rút gọn, từ giảm thiểu độ phức tạp mơ hình phân lớp Kết luận án bao gồm: 1) Đề xuất hai thuật tốn filter-wrapper tìm tập rút gọn bảng định theo tiếp cận tập thơ mờ: Thuật tốn FW_FRSAR sử dụng độ phụ thuộc mờ Thuật toán FW_FDAR sử dụng khoảng cách mờ Khoảng cách mờ đề xuất mở rộng khoảng cách cơng trình [48] Kết thử nghiệm số liệu mẫu từ kho liệu UCI [103] cho thấy, hai thuật toán đề xuất giảm thiểu đáng kể số lượng thuộc tính tập rút gọn nâng cao độ xác phân lớp so với thuật tốn filter cơng bố, từ giảm thiểu độ phức tạp mơ hình phân lớp Với thuật tốn filter-wrapper FEBAR [91] cơng bố gần đây, thuật tốn đề xuất FW_FDAR hiệu FEBAR thời gian thực 2) Đề xuất hai thuật toán gia tăng filter-wrapper: Thuật tốn IFW_FDAR_AdObj tìm tập rút gọn trường hợp bổ sung tập đối tượng Thuật tốn UFW_FDAR_DelObj tìm tập rút gọn trường hợp loại bỏ tập đối tượng Cả hai thuật toán sử dụng khoảng cách mờ đề xuất Kết thử nghiệm số liệu mẫu từ kho liệu UCI [103] cho thấy, thuật toán đề xuất IFW_FDAR_AdObj giảm thiểu số lượng thuộc tính tập rút gọn nâng cao độ xác phân lớp so với thuật toán gia tăng cơng bố, từ giảm thiểu độ phức tạp mơ hình phân lớp 2) Hướng phát triển luận án: (1) Tiếp tục nghiên cứu, đề xuất thuật tốn gia tăng filter-wrapper tìm tập rút gọn theo tiếp cận tập thô mờ trường hợp bổ sung, loại bỏ tập thuộc tính (2) Tiếp tục nghiên cứu, đề xuất thuật tốn gia tăng filter-wrapper tìm tập rút gọn theo tiếp cận tập thô mờ trường hợp cập nhật tập đối tượng, cập nhật tập thuộc tính 98 Danh mục cơng trình tác giả Nguyễn Văn Thiện, Nguyễn Long Giang, Nguyễn Như Sơn, “Về phương pháp rút gọn thuộc tính bảng định với miền trị thuộc tính nhận giá trị số theo tiếp cận tập thơ mờ”, Chun san Các cơng trình nghiên cứu, phát triển ứng dụng CNTT&TT, Tạp chí thơng tin khoa học công nghệ Bộ thông tin Truyền thông, Tập V-2, số 16 (36), 12-2016, Tr 40-49 Nguyen Van Thien, Janos Demetrovics, Vu Duc Thi, Nguyen Long Giang, Nguyen Nhu Son, “A Method to Construct an Extension of Fuzzy Information Granularity Based on Fuzzy Distance”, Serdica Journal of Computing 10 (2016), Sofia, Bulgarian Academy of Sciences, No 1, 2016, pp 13-30 Nguyễn Long Giang, Nguyễn Văn Thiện, Cao Chính Nghĩa, “Về phương pháp rút gọn thuộc tính bảng định có miền giá trị liên tục theo tiếp cận tập thô mờ”, Kỷ yếu Hội thảo quốc gia lần thứ XVIII: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông-TP HCM,05-06/11/2015 Nguyễn Văn Thiện, Nguyễn Như Sơn, Nguyễn Long Giang, Cao Chính Nghĩa, “Về phương pháp xây dựng độ phân hạt mờ mở rộng dựa khoảng cách mờ”, Kỷ yếu Hội thảo Quốc gia lần thứ XIX - Một số vấn đề chọn lọc CNTT TT, Hà Nội, 01-02/10/2016, Tr 371-376 Nguyễn Long Giang, Nguyễn Văn Thiện, Cao Chính Nghĩa, “Về phương pháp rút gọn thuộc tính trực tiếp bảng định sử dụng khoảng cách mờ”, Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu ứng dụng CNTT (FAIR’9), Cần Thơ, 04-05/08/2016, Tr 825-835 Nguyen Van Thien, Nguyen Long Giang, Nguyen Nhu Son , “Fuzzy Partition Distance based Attribute Reduction in Decision Tables”, IJCRS'2018: International Joint Conference on Rough Sets 2018, Quy Nhon, Viet Nam, August 20-24, 2018 (Accepted) Nguyen Van Thien, Nguyen Long Giang, Nguyen Nhu Son, “Phương pháp gia tăng rút gọn thuộc tính bảng định sử dụng khoảng cách mờ”, Hội thảo Quốc gia lần thứ XXI - Một số vấn đề chọn lọc CNTT TT, Thanh Hóa, 27-28/07/2018, Tr 296- 302 99 Tài liệu tham khảo Tài liệu tiếng Việt [1] Cao Chính Nghĩa, “Nghiên cứu phương pháp rút gọn thuộc tính sinh luật định theo tiếp cận tập thô mờ”, Luận án Tiến sĩ Kỹ thuật, Học viện Cơng nghệ Bưu Viễn thơng, 2018 [2] Cao Chính Nghĩa, Vũ Đức Thi, Tân Hạnh, Nguyễn Long Giang (2016), “Rút gọn thuộc tính bảng định sử dụng miền dương mờ”, Tạp chí Khoa học Cơng nghệ thông tin Truyền thông, Học viện Công nghệ Bưu viễn thơng, số 2, tr 3-10 [3] Cao Chinh Nghia, Vu Duc Thi, Nguyen Long Giang, Tan Hanh, “Fuzzy distance based attribute reduction in decision tables”, Journal on Information Communications Technology, Research and Development on Information & Communications Technology, Vietnam, Vol V-2, No 16 (36), pp 104-111, 2016 [4] Hồng Thị Lan Giao, “Khía cạnh đại số lơgic phát luật theo tiếp cận tập thô”, Luận án Tiến sĩ Tốn học, Viện Cơng Nghệ Thơng Tin, 2007 [5] Nguyễn Đức Thuần, “Phủ tập thô độ đo đánh giá hiệu tập luật định”, Luận án Tiến sĩ Tốn học, Viện Cơng Nghệ Thơng Tin, 2010 [6] Nguyễn Long Giang, “Nghiên cứu số phương pháp khai phá liệu theo tiếp cận lý thuyết tập thơ”, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ thông tin, 2012 [7] Nguyễn Thị Lan Hương, “Rút gọn thuộc tính bảng định động theo tiếp cận tập thơ”, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ thơng tin, 2017 [8] Nguyễn Long Giang, Cao Chính Nghĩa, Nguyễn Quang Huy, Nguyễn Thị Lan Hương, Nguyễn Ngọc Cương, Trần Anh Tú, Về độ đo khoảng cách mờ ứng dụng rút gọn thuộc tính bảng định, Kỷ yếu Hội thảo Quốc gia lần thứ XX - Một số vấn đề chọn lọc CNTT TT, Quy Nhơn, 2324/11/2017, Tr 404-409 100 [9] Nguyễn Long Giang, Nguyễn Thanh Tùng, Vũ Đức Thi, Một phương pháp rút gọn thuộc tính bảng định khơng đầy đủ sử dụng metric, Tạp chí Tin học Điều khiển học, T.28, S.2, 2012, tr 129-140 [10] Nguyen Long Giang, Nguyen Thi Lan Huong, Metric Based Attribute Reduction in Incomplete Information Systems, Kỷ yếu Hội thảo Quốc gia lần thứ XV “Một số vấn đề chọn lọc Công nghệ thông tin truyền thông”, Hà Nội 11/2012, 2013, Tr 185-190 [11] Phùng Thị Hiền, “Nghiên cứu rút gọn thuộc tính hệ thơng tin định giá trị tập”, Luận án Tiến sĩ Toán học, Học viện Kỹ thuật quân sự, 2014 [12] Vũ Văn Định, Vũ Đức Thi, Ngô Quốc Tạo, Nguyễn Long Giang, Phương pháp rút gọn thuộc tính bảng định không đầy đủ sử dụng khoảng cách phân hoạch, Các cơng trình nghiên cứu, phát triển ứng dụng CNTT&TT, Tạp chí CNTT&TT, Tập V-2, số 14(34), 12-2015, Trang 23-32 [13] Vũ Văn Định, “Rút gọn thuộc tính bảng định không đầy đủ theo tiếp cận tập thô dung sai”, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ thông tin, 2016 Tài liệu tiếng Anh [14] Anoop Kumar Tiwari , Shivam Shreevastava, Tanmoy Som, K.K Shukla, “Tolerance-based intuitionistic fuzzy-rough set approach for attribute reduction”, Expert Systems With Applications 101, pp 205–212, 2018 [15] A.P Zeng, T.R Li, D Liu, J.B Zhang, H.M Chen, “A fuzzy rough set approach for incremental feature selection on hybrid information systems”, Fuzzy Sets and Systems, Volume 258, pp 39-60, January 2015 [16] A.P Zeng , T.R Li, J Hu, H.M Chen, Chuan Luo, “Dynamical updating fuzzy rough approximations for hybrid data under the variation of attribute values”, Information Sciences 000, pp 1-26, 2016 101 [17] B.W Xu, Y.M Zhou, H.M Lu, “An improved accuracy measure for rough sets”, J Comput Syst Sci., vol 71, pp 163-173, 2005 [18] Cao Chinh Nghia, Demetrovics Janos, Nguyen Long Giang, Vu Duc Thi, “About a fuzzy distance between two fuzzy partitions and attribute reduction problem”, Cybernetics and Information Technologies, Vol 16, No 4, pp 1328, 2016 [19] C Arunkumar, S Ramakrishnan, “Attribute Selection using fuzzy roughset based customized similarity measure for lung cancer microarray gene expression data”, Future Computing and Informatics Journal, In Press, 2018 [20] C.S Zhang, R.J Jing, Y.H Tan, “An Improved Incremental Updating Algorithm for Core Based on Positive Region”, Journal of Computational Information Systems 7: 9, pp 3127-3133, 2011 [21] C.Z Wang, Y.L Qi, M.W Shao, Q.H Hu, D.G Chen, Y.H Qian, Y.J Lin, “A Fitting Model for Feature Selection with Fuzzy Rough Sets”, IEEE Transactions on Fuzzy Systems, Volume: 25, Issue: 4, Page(s): 741-753, Aug 2017 [22] D Dübois, H Prade, “Rough fuzzy sets and fuzzy rough sets”, International Journal of General Systems 17, pp.191-209, 1990 [23] D Dubois, H Prade, “Putting rough sets and fuzzy sets together”, Intelligent Decision Support, Kluwer Academic Publishers, Dordrecht, 1992 [24] Demetrovics Janos, Nguyen Thi Lan Huong, Vu Duc Thi, Nguyen Long Giang, “Metric Based Attribute Reduction Method in Dynamic Decision Tables”, Cybernetics and Information Technologies, Vol.16, No.2, pp 3-15, 2016 [25] Demetrovics Janos, Vu Duc Thi, Nguyen Long Giang, “A Distance-based Method for Attribute Reduction in Incomplete Decision Systems”, Serdica Journal of Computing 7, No 4, pp 355-374, 2013 102 [26] D.G Chen, Q H Hu and Y P Yang, “Parameterized attribute reduction with Gaussian kernel based fuzzy rough sets”, Information Sciences, vol 181, no 23, pp 5169-5179, 2011 [27] D.G Chen, L Zhang, S Y Zhao, Q H Hu, P F Zhu, “A novel algorithm for finding reducts with fuzzy rough sets”, IEEE Transaction on Fuzzy Systems, vol 20, no.2, pp 385-389, 2012 [28] D.G Chen, Y Yang, Z Dong, “An incremental algorithm for attribute reduction with variable precision rough sets”, Appl Soft Comput., vol 45, pp 129-149, 2016 [29] D.G Chen, E.C.C Tsang, S.Y Zhao, “An approach of attributes reduction based on fuzzy TL rough sets”, IEEE International Conference on Systems, Man and Cybernetics, pp 486-491, 2007 [30] D.G Chen, S Y Zhao, “Local reduction of decision system with fuzzy rough sets”, Fuzzy Sets and Systems 161, pp 1871-1883, 2010 [31] D Liu, T Li, J.B Zhang, “Incremental updating approximations in probabilistic rough sets under the variation of attributes”, Knowledge-Based Systems 73, pp 81-96 , 2015 [32] D Yu, Q Hu, C Wu, “Uncertainty measures for fuzzy relations and their applications”, Applied soft computing (3), pp 1135–1143, 2007 [33] D Yu, S An, Q Hu, “Fuzzy mutual information based min-redundancy and max-relevance heterogeneous feature selection”, International Journal of Computational Intelligence Systems 4(4), pp 619–633, 2011 [34] E.C.C Tsang, D.G Chen, D.S Yeung, X.Z Wang, J.W.T Lee, “Attributes reduction using fuzzy rough sets”, IEEETrans Fuzzy Syst 16, pp.1130-1141, 2008 [35] E.C.C Tsang, X.Q Fan, X.F Li, S.Y Zhao, “Weights based ranked fuzzy rough reduction”, International Conference on Machine Learning and Cybernetics (ICMLC), IEEE, 2017 103 [36] F Hu, G.Y Wang, H Huang, Y Wu, “Incremental attribute reduction based on elementary sets”, Proceedings of the 10th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing, Regina, Canada, pp 185-193, 2005 [37] F Hu, J Dai, G.Y Wang, "Incremental algorithms for attribute reduction in decision tables," Control Decis., vol 22, no 3, pp 268, 2012 [38] F Wang, J.Y Liang, Y.H Qian, “Attribute reduction: A dimension incremental strategy”, Knowledge-Based Systems, Volume 39, pp 95-108, 2013 [39] F Wang, J.Y Liang, C.Y Dang, “Attribute reduction for dynamic data sets”, Applied Soft Computing, 13(1), pp 676-689, 2013 [40] F Xu, D Miao, L Wei, “An Approach for Fuzzy-Rough Sets Attributes Reduction via Mutual Information”, In FSKD (3), pp 107-112, 2007 [41] F Xu, D.Q Miao, L Wei, “Fuzzy-rough attribute reduction via mutual information with an application to cancer classification”, Computers and Mathematics with Applications 57, pp 1010 -1017, 2009 [42] G.C.Y Tsang, D.G Chen, E.C.C Tsang, J.W.T Lee, D.S Yeung, “On attributes reduction with fuzzy rough sets”, IEEE International Conference on Systems, Man and Cybernetics, 2005 [43] Guyon, Isabelle; Elisseeff, André, “An Introduction to Variable and Feature Selection”, Journal of Machine Learning Research, pp 1157-1182, 2003 [44] H Liu, L Yu, “Toward integrating feature selection algorithms for classification and clustering”, IEEE Transactions on knowledge and data engineering, 17(4), pp 491-502, 2005 [45] J.H Dai, Q Xu, “Attribute selection based on information gain ratio in fuzzy rough set theory with application to tumor classification”, Applied Soft Computing 13, pp 211-221, 2013 104 [46] J.H Dai, H Hu, W.Z Wu,Y.H Qian, D.B Huang, “Maximal Discernibility Pairs Based Approach to Attribute Reduction in Fuzzy Rough Sets”, IEEE Transactions on Fuzzy Systems, 30 October 2017 [47] J.H Dai, Y.J Yan, Z.W Li, B.S Liao, “Dominance-based fuzzy rough set approach for incomplete interval-valued data”, Journal of Intelligent & Fuzzy Systems 34, pp 423-436, 2018 [48] J.Y Liang, R Li, Y H Qian, “Distance: A more comprehensible perspective for measures in rough set theory”, Knowledge-Based Systems, Volume 27, pp 126-136, 2012 [49] J.Y Liang, F Wang, C.Y Dang, Y.H Qian, “A group incremental approach to feature selection applying rough set technique”, IEEE Transactions on Knowledge and Data Engineering, 26(2), pp 294-308, 2014 [50] J Y Liang, Z Z Shi, D Y Li, M J Wierman, “The information entropy, rough entropy and knowledge granulation in incomplete information system”, Int J Gen Syst., vol 35, no 6, pp 641-654, 2006 [51] J.Y Liang, Z.Z Shi, “The information entropy, rough entropy and knowledge granulation in rough set theory”, Int J Uncertain., Fuzziness Knowl.-Based Syst., vol 12, no 1., pp 37-46, 2004 [52] J Y Liang, Y H Qian, “Information granules and entropy theory”, Sci China., Ser F, vol 51, no 10, pp 1427-1444, 2008 [53] J Y Liang, Z Z Shi, D Y Li, and M J Wierman, “The information entropy, rough entropy and knowledge granulation in incomplete information system,” Int J Gen Syst., vol 35, no 6, pp 641–654, 2006 [54] J Zhang, T Li, D Ruan, “Rough sets based matrix approaches with dynamic attribute variation in set-valued information systems”, Int J Approx Reason, Vol.53, pp 620-635, 2012 [55] J Zhao, Z Zhang, C Han, Z Zhou, “Complement information entropy for uncertainty measure in fuzzy rough set and its applications”, Soft Computing 19(7), pp 1997-2010, 2015 105 [56] L.H Guan, “An incremental updating algorithm of attribute reduction set in decision tables”, FSKD'09 Proceedings of the 6th international conference on Fuzzy systems and knowledge discovery, Vol 2, pp 421-425, 2009 [57] Long Giang Nguyen, “Metric Based Attribute Reduction in Decision Tables”, Federated Conference on Computer Science and Information System (FEDCSIS), Wroclaw, Poland, IEEE, pp 311-316, 2012 [58] Long Giang Nguyen, Hung Son Nguyen, “Metric Based Attribute Reduction in Incomplete Decision Tables”, Proceedings of 14th International Conference, Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing, RSFDGrC 2013, Halifax, NS, Canada, Lecture Notes in Computer Science, SpingerLink, Vol 8170, pp 99-110, 2013 [59] L.W Wang, Omar A M Salem, “An improved Fuzzy Mutual Information Feature Selection for Classification Systems”, IEEE/ACIS 16th International Conference on Computer and Information Science (ICIS), 2017 [60] L Zadeh, “Fuzzy logic equals computing with words,” IEEE Trans Fuzzy Syst., vol 4, no 2, pp 103-111, 1996 [61] M.J Wierman, “Measuring uncertainty in rough set theory”, Int J Gen.Syst., vol 28, no 4, pp 283-297, 1999 [62] M Kryszkiewicz, “Rough set approach to incomplete information systems”, Information Science, Vol 112, pp 39-49, 1998 [63] M M Deza, E Deza, “Encyclopedia of Distances”, Springer, 2009 [64] M.R CHMIELEWSKI, J.W GRZYMALABUSSE, “Global discretization of continuous attributes as preprocessing for machine learning”, Int J Approx reasoning 15 (4), pp 319-331, 1996 [65] Nguyen Thi Lan Huong, Nguyen Long Giang, “Incremental algorithms based on metric for finding reduct in dynamic decision tables”, Journal on Research and Development on Information & Communications Technology, Vol.E-3, No.9 (13), pp 26-39, 2016 106 [66] N Li, J.Y Xie, “A feature subset selection algorithm based on neighborhood rough set for incremental updating datasets”, Computer Technology and Development, vol 21, no.11, pp 149-155, 2011 [67] N Long, D Gianola, K.A Weigel, “Dimension reduction and variable selection for genomic selection : application to predicting milk yield in Holsteins”, Journal of Animal Breeding and Genetics 128 (4), pp 247–257, 2011 [68] Pradipta Maji, Partha Garai, “On fuzzy-rough attribute selection: Criteria of Max-Dependency, Max-Relevance, Min-Redundancy, and Max-Significance”, Applied Soft Computing 13, pp 3968-3980, 2013 [69] Q He, C.X Wu, D.G Chen, S.Y Zhao, “Fuzzy rough set based attribute reduction for information systems with fuzzy decisions”, Knowledge-Based Systems 24, pp 689-696, 2011 [70] Q.H Hu, D.R Yu, Z.X Xie, J F Liu, “Fuzzy probabilistic approximation spaces and their information measures”, IEEE Transaction on Fuzzy Systems, vol 14, no 2, pp 191-201, 2006 [71] Q.H Hu, D.R Yu, Z.X Xie, “Information-preserving hybrid data reduction based on fuzzy-rough techniques”, Pattern Recognit Lett 27(5), pp 414–423, 12-2006 [72] Q.H Hu, Z.X Xie, D.R Yu, “Hybrid attribute reduction based on a novel fuzzy-rough model and information granulation”, Pattern Recognition 40, pp 3509-3521, 2007 [73] Q.H Hu , L Zhang , D.G Chen , W Pedrycz , D.R Yu , “Gaussian kernel based fuzzy rough sets: Model, uncertainty measures and applications”, Int J Approx Reason 51, pp 453-471, 2010 [74] Q.H Hu, Z.X Xie, D.R Yu, “Comments on fuzzy probabilistic approximations spaces and their information measures”, IEEE Trans Fuzzy Syst.16, pp 549-551, 2008 107 [75] Q.H Hu, D.R YU, “Entropies of fuzzy indiscrenibility relation and its operations”, International Journal of Uncertainty, Fuzziness and KnowledgeBased Systems, Vol 12 Iss 5, pp 575-589, 2005 [76] Q Shen, R Jensen, “Selecting informative features with fuzzy-rough sets and its application for complex systems monitoring”, Pattern Recognition 37, pp 1351 – 1363, 2004 [77] R Jensen, Q Shen, “Semantics-preserving dimensionality reduction: rough and fuzzy-rough-based approaches”, IEEE Trans Knowl Data Eng 16(12), pp 1457-1471, 2004 [78] R Jensen, Q Shen, “Fuzzy-rough attribute reduction with application to web categorization”, Fuzzy Sets Syst 141, pp 469-485, 2004 [79] R Jensen, Q Shen, “Fuzzy-rough sets assisted attribute reduction”, IEEE Trans Fuzzy Syst 15(1), pp 73-89, 2007 [80] R Jensen, Q Shen, “New approaches to fuzzy-rough feature selection”, IEEE Trans Fuzzy Syst 17(4), pp 824-838, 2009 [81] R.B Bhatt, M Gopal, “On fuzzy-rough sets approach to feature selection”, Pattern Recognit Lett 26, pp 965-975, 2005 [82] R.B Bhatt, M Gopal, “On the compact computational domain of fuzzy rough sets”, Pattern Recognition Lett 26, pp.1632-1640, 2005 [83] S Li, T Li, D Liu, “Incremental updating approximations in dominancebased rough sets approach under the variation of the attribute set”, KnowledgeBased Systems, Vol.40, pp 17-26, 2013 [84] Soumen Ghosh , P.S.V.S Sai Prasad(B), C Raghavendra Rao, “Third Order Backward Elimination Approach for Fuzzy-Rough Set Based Feature Selection”, International Conference on Pattern Recognition and Machine Intelligence, PreMI 2017: Pattern Recognition and Machine Intelligence, pp 254-262, 2017 [85] T.K Sheeja, A Sunny Kuriakose, “A novel feature selection method using fuzzy rough sets”, Computers in Industry 97, pp 111-116, 2018 108 [86] W.H Shu, W.B Qian, “An incremental approach to attribute reduction from dynamic incomplete decision systems in rough set theory”, Data & Knowledge Engineering 100, pp 116-132, 2015 [87] W.H Shu, H Shen, “Updating attribute reduction in incomplete decision systems with the variation of attribute set”, International Journal of Approximate Reasoning, vol 55, no.3, pp 867-884, 2014 [88] W Shu, H Shen, “Incremental feature selection based on rough set in dynamic incomplete data”, Pattern Recognit., vol 47, no 12, pp 3890-3906, 2014 [89] W Wei, X.Y Wu, J.Y Liang, J.B Cui, Y.J Sun, “Discernibility matrix based incremental attribute reduction for dynamic data”, Knowledge-Based Systems, Volume 140, pp 142-157, 15 January 2018 [90] X Zhang, C.L Mei, D.G Chen, Y.Y Yang, “A fuzzy rough set-based feature selection method using representative instances”, Knowledge-Based Systems, 27 March 2018, In Press [91] X Zhang, C.L Mei, D G Chen, J Li, “Feature selection in mixed data: A method using a novel fuzzy rough set-based information entropy”, Pattern Recognition 56, pp 1-15, 2016 [92] Y.H Qian, Q Wang, H.H Cheng, J.Y Liang, C.Y Dang, “Fuzzy-rough feature selection accelerator”, Fuzzy Sets and Systems 258, pp 61-78, 2015 [93] Y.H Qian., J.Y Liang, W.Z Wu, C.Y Dang, “Information Granularity in Fuzzy Binary GrC Model”, IEEE Trans Fuzzy Syst 19, No 2, pp 253-264, 2011 [94] Y H Qian, J Y Liang, W Z Wu, and C Y Dang, “Information granularity in fuzzy binary GrC model”, IEEE Trans Fuzzy Syst., vol 19, no 2, 253-264, 2011 [95] Y Jing., T Li, C Luo, S.J Horng, G Wang, Z Yu, “An incremental approach for attribute reduction based on knowledge granularity”, Knowledge-Based Systems, Vol.104, 2016, pp 24-38 109 [96] Y Ming, “An incremental updating algorithm for attribute reduction based on improved discernibility matrix” Chinese Journal of Computers, 30(5), pp 815-822 , 2007 [97] Y.M Liu, S.Y Zhao, H Chen, C.P Li, Y.M Lu, “Fuzzy Rough Incremental Attribute Reduction Applying Dependency Measures”, APWeb-WAIM 2017: Web and Big Data, pp 484-492, 2017 [98] Y.Y Yang, D.G Chen, H Wang, Eric C.C.Tsang, D.L Zhang, “Fuzzy rough set based incremental attribute reduction from dynamic data with sample arriving”, Fuzzy Sets and Systems, Volume 312, 1, Pages 66-86, April 2017 [99] Y.Y Yang, D.G Chen, H Wang, X.H Wang, “Incremental perspective for feature selection based on fuzzy rough sets”, IEEE TRANSACTIONS ON FUZZY SYSTEMS, TFS-2016-0916, 27 June 2017 [100]Y.W Li , S.X Wu , Y.J Lin, J.H Liu, “Different classes’ ratio fuzzy rough set based robust feature selection”, Knowledge-Based Systems 000 , pp 1-13, 2016 [101]Z Pawlak, Rough sets: Theoretical Aspects of Reasoning about Data, Kluwer Academic Publisher, London, 1991 [102]Z.T Liu, "An incremental attribute arithmetic for the smallest reduction of attributes", Acta Electronoca Sinica, vol 27, no 11, pp 96-98, 1999 [103]The UCI machine http://archive.ics.uci.edu/ml/datasets.html learning repository, ... HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… NGUYỄN VĂN THIỆN MỘT SỐ PHƢƠNG PHÁP LAI GHÉP TRONG RÚT GỌN THUỘC TÍNH THEO TIẾP CẬN TẬP THƠ MỜ LUẬN ÁN TIẾN SĨ MÁY TÍNH VÀ CƠNG NGHỆ THƠNG TIN Chuyên... quan đến rút gọn thuộc tính theo tiếp cận tập thơ mờ 19 1.4.1 Rút gọn thuộc tính bảng định mờ theo tiếp cận tập thô mờ 20 1.4.2 Rút gọn thuộc tính trực tiếp bảng định theo tiếp cận tập thô mờ... sử dụng độ phụ thuộc theo tiếp cận filter 37 2.2.2 Rút gọn thuộc tính sử dụng độ phụ thuộc mờ theo tiếp cận filter 39 2.2.3 Rút gọn thuộc tính sử dụng độ phụ thuộc mờ theo tiếp cận filter-wrapper