Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 133 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
133
Dung lượng
1,29 MB
Nội dung
i MỤC LỤC MỤC LỤC i Danh mục thuật ngữ iii Bảng ký hiệu, từ viết tắt iv Danh sách bảng vii Danh sách hình vẽ viii MỞ ĐẦU CHƯƠNG CÁC KIẾN THỨC CƠ SỞ 1.1 Một số khái niệm tập thô 1.1.1 Hệ thông tin 1.1.2 Các tập xấp xỉ 10 1.1.3 Miền dương 11 1.1.4 Bảng định 11 1.2 Một số khái niệm tập thô mờ xác định bảng định miền giá trị thực 11 1.2.1 Bảng định miền giá trị thực 12 1.2.2 Quan hệ tương đương mờ 12 1.2.3 Ma trận tương đương mờ 13 1.2.4 Phân hoạch mờ lớp tương đương mờ 14 1.2.5 Các tập xấp xỉ mờ 17 1.2.6 Miền dương mờ 17 1.3 Một số khái niệm tập thô mờ xác định bảng định mờ 18 1.3.1 Bảng định mờ 18 1.3.2 Phân hoạch mờ lớp tương đương mờ 20 1.3.3 Các tập xấp xỉ mờ 21 1.3.4 Miền dương mờ 21 1.4 Rút gọn thuộc tính bảng định 23 1.4.1 Tổng quan rút gọn thuộc tính 23 1.4.2 thô Tổng quan rút gọn thuộc tính bảng định theo tiếp cận tập 26 1.4.3 Định hướng nghiên cứu luận án 28 1.5 Kết luận chương 29 ii CHƯƠNG RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH MIỀN GIÁ TRỊ THỰC SỬ DỤNG MIỀN DƯƠNG MỜ VÀ KHOẢNG CÁCH JACCARD MỜ 30 2.1 Đặt vấn đề 30 2.2 Rút gọn thuộc tính sử dụng miền dương mờ 31 2.2.1 Phương pháp rút gọn thuộc tính sử dụng miền dương mờ 32 2.2.2 Thử nghiệm đánh giá kết 37 2.3 Rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ 44 2.3.1 Khoảng cách Jaccard mờ tính chất 44 2.3.2 Phương pháp rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ 52 2.3.3 Thử nghiệm đánh giá kết 56 2.4 Kết luận chương 61 CHƯƠNG RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH MIỀN GIÁ TRỊ THỰC SỬ DỤNG KHOẢNG CÁCH PHÂN HOẠCH MỜ 63 3.1 Đặt vấn đề 63 3.2 Khoảng cách phân hoạch mờ tính chất 64 3.3 Phương pháp rút gọn thuộc tính sử dụng khoảng cách phân hoạch mờ 70 3.4 Thử nghiệm đánh giá kết 77 3.5 Kết luận chương 82 CHƯƠNG RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT TRÊN BẢNG QUYẾT ĐỊNH MỜ 84 4.1 Đặt vấn đề 84 4.2 Phương pháp rút gọn thuộc tính bảng định mờ 87 4.3 Phương pháp sinh luật định bảng định mờ 91 4.3.1 Luật định mờ 92 4.3.2 Sinh luật định từ bảng định mờ 93 4.3.3 Thử nghiệm đánh giá kết 105 4.4 Kết luận chương 110 KẾT LUẬN 112 Danh mục cơng trình tác giả 114 TÀI LIỆU THAM KHẢO 115 iii Danh mục thuật ngữ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh Bảng định Decision Table Bảng định miền giá trị thực Numerical Decision Table Bảng định mờ Fuzzy Decision Table Hệ thông tin Information System Khoảng cách mờ Fuzzy Distance Luật định mờ Fuzzy Decision Rule Ma trận tương đương mờ Fuzzy Equivalent Relational Matrix Miền dương mờ Fuzzy Positive Region Quan hệ tương đương Equivalent Relation Quan hệ tương đương mờ Fuzzy Equivalent Relation Rút gọn thuộc tính Attribute Reduction Tập mờ Fuzzy Set Tập rút gọn Reduct Tập thô Rough Set Tập thô mờ Fuzzy Rough Set Xấp xỉ Lower Approximation Xấp xỉ Upper Approximation Xấp xỉ mờ Fuzzy Lower Approximation Xấp xỉ mờ Fuzzy Upper Approximation iv Bảng ký hiệu, từ viết tắt Ký hiệu, từ viết tắt U IS ,A Diễn giải Hệ thông tin D T U , C D Bảng định D DT U , C Bảng định mờ U Số đối tượng C Số thuộc tính điều kiện bảng định A Số thuộc tính u a Giá trị đối tượng u thuộc tính a P Quan hệ P không phân biệt IN D u P Lớp tương đương chứa u quan hệ IND P Lớp tương đường mờ chứa u quan hệ tương đương mờ ui R P R P U/P Phân hoạch U sinh tập thuộc tính P P Phân hoạch mờ theo tập thuộc tính P PX Pxấp xỉ X PX Pxấp xỉ X PN P X POS P D Pmiền biên X Pmiền dương D S I G P b Độ quan trọng thuộc tính b với tập thuộc tính P A ( u ) Hàm thuộc đối tượng u với tập mờ A H P E P Entropy Shannon Entropy Liang v DNF d NF P , R Q R C , C D P Khoảng cách phân hoạch mờ hai phân hoạch mờ R Q R Khoảng cách phân hoạch mờ hai tập thuộc tính C CD Khoảng cách Jaccard mờ hai tập mờ A B ) D FJ ( A, B d FJ C , C D Khoảng cách Jaccard mờ hai tập thuộc tính C CD F_RSAR1 F_RSAR2 FJ_DBAR FJ_RBAR NF_DBAR Thuật toán rút gọn thuộc tính dựa miền dương mờ F_RSAR1 (Fuzzy Rough Set Based Attribute Reduction 1) Thuật tốn rút gọn thuộc tính dựa miền dương mờ F_RSAR2 (Fuzzy Rough Set Based Attribute Reduction 2) Thuật tốn rút gọn thuộc tính dựa khoảng cách Jaccard mờ (Fuzzy Jaccard Distance Based Attribute Reduction) Thuật toán sinh luật định mờ dựa khoảng cách Jaccard mờ (Fuzzy Jaccard Rule Based Attribute Reduction) Thuật tốn rút gọn thuộc tính dựa khoảng cách phân hoạch mờ (New Fuzzy Distance Based Attribute Reduction) Thuật tốn rút gọn thuộc tính dựa miền dương mờ FAR-VPFRS (Forward Attribute Reduction Based On Variable Precision Fuzzy-Rough Model) Thuật tốn rút gọn thuộc tính dựa miền dương mờ cải FA-FPR tiến (Forward Approximation - Fuzzy Positive Region Reduction) Thuật tốn rút gọn thuộc tính dựa Entropy cải tiến FA-FSCE (Forward Approximation - Fuzzy Conditional Entropy To Design A Heuristic Feature Selection Algorithm) vi Thuật toán rút gọn thuộc tính dựa Entropy tăng thêm GRAF (Attribute Selection Based On Information Gain Ratio In Fuzzy Rough Set Theory) MRBFA MRBBA Thuật toán sinh luật định mờ dựa xấp xỉ tiến (Mine Rules Based On The Forward Approximation) Thuật toán sinh luật định mờ dựa xấp xỉ lùi (Mine Rules Based On The Backward Approximation) vii Danh sách bảng Bảng 1.1 Bảng định miền giá trị thực 12 Bảng 1.2 Bảng định mờ chơi thể thao 18 Bảng 1.3 Bảng định mờ Ví dụ 1.3 22 Bảng 2.1 Bảng định miền giá trị thực Ví dụ 2.1 34 Bảng 2.2 Bộ liệu thử nghiệm 37 Bảng 2.3 Kết thực nghiệm F_RSAR2, FAR-VPFRS 40 Bảng 2.4 Tập rút gọn F_RSAR2, FAR-VPFRS 42 Bảng 2.5 Độ xác phân lớp C4.5 F_RSAR2, FAR-VPFRS 42 Bảng 2.6 Kết thực nghiệm FJ_DBAR GRAF 57 Bảng 2.7 Tập rút gọn thu FJ_DBAR GRAF 59 Bảng 2.8 Độ xác phân lớp C4.5 FJ_DBAR GRAF 59 Bảng 3.1 Mối liên hệ khoảng cách phân hoạch mờ entropy thông tin 69 Bảng 3.2 Kết thực nghiệm FA_FSCE, FA_FPR, NF_DBAR 78 Bảng 3.3 Tập rút gọn FA_FSCE, FA_FPR, NF_DBAR 80 Bảng 3.4 Độ xác phân lớp C4.5 FA_FSCE, FA_FPR, NF_DBAR 80 Bảng 4.1 Bảng định mờ chơi thể thao biểu diễn lại Bảng 1.2 89 Bảng 4.2 Bảng định mờ chơi thể thao rút gọn thuộc tính 97 Bảng 4.3 Khoảng cách Jaccard mờ trực tiếp biến ngôn ngữ Bảng 4.2 98 Bảng 4.4 Kết gán nhãn Bảng 4.2 với (α=0.245; β=0.9) 100 Bảng 4.5 Kết gán nhãn Bảng 4.2 với (α=0.245; β=0.8) 101 Bảng 4.6 Kết gán nhãn Bảng 4.2 với (α=0.26) 103 Bảng 4.7 Kết thực nghiệm MRBFA, MRBBA FJ_RBAR 108 viii Danh sách hình vẽ Hình 1.1 Quá trình lựa chọn thuộc tính 25 Hình 1.2 Lựa chọn thuộc tính theo hướng tiếp cận lọc & đóng gói 26 Hình 1.3 Mơ hình phương pháp heuristic rút gọn thuộc tính 27 Hình 2.1 Thời gian thực F_RSAR2, FAR-VPFRS 41 Hình 2.2 Độ xác phân lớp C4.5 F_RSAR2, FAR-VPFRS 43 Hình 2.3 Thời gian thực FJ_DBAR GRAF 58 Hình 2.4 Độ xác phân lớp C4.5 FJ_DBAR GRAF 61 Hình 3.1 Thời gian thực FA_FSCE, FA_FPR, NF_DBAR 79 Hình 3.2 Độ xác phân lớp C4.5 FA_FSCE, FA_FPR NF_DBAR 81 Hình 4.1 Phân lớp liệu theo luật định mờ 86 Hình 4.2 Độ xác phân lớp MRBFA, MRBBA FJ_RBAR 109 Hình 4.3 Độ phân tán liệu MRBFA, MRBBA FJ_RBAR 109 MỞ ĐẦU Rút gọn thuộc tính sinh luật định (luật phân lớp) hai tốn quan trọng q trình khám phá tri thức từ liệu Rút gọn thuộc tính thuộc giai đoạn tiền xử lý liệu sinh luật định thuộc giai đoạn khai phá liệu Rút gọn thuộc tính bảng định q trình lựa chọn tập nhỏ tập thuộc tính điều kiện, loại bỏ thuộc tính dư thừa mà bảo tồn thơng tin phân lớp bảng định, gọi tập rút gọn (reduct) Kết rút gọn thuộc tính ảnh hưởng trực tiếp đến hiệu thực nhiệm vụ khai phá: Gia tăng tốc độ, cải thiện chất lượng, tính dễ hiểu kết thu Sinh luật định bước rút gọn thuộc tính khai phá liệu nhằm đánh giá chất lượng phân lớp liệu thông qua độ hỗ trợ tập luật định Độ xác phân lớp đánh giá thơng qua tỷ lệ phân lớp theo luật định tổng số lớp tập liệu Các kỹ thuật rút gọn thuộc tính phân thành hai loại: Lựa chọn thuộc tính (Attribute selection) biến đổi thuộc tính (Attribute transformation) [44] Lựa chọn thuộc tính chọn tập tốt (theo nghĩa đó) từ tập liệu ban đầu Biến đổi thuộc tính thực việc biến đổi thuộc tính tập liệu ban đầu thành tập liệu với thuộc tính có số lượng cho bảo tồn thông tin nhiều Các cơng trình nghiên cứu rút gọn thuộc tính thường tập trung vào nghiên cứu kỹ thuật lựa chọn thuộc tính Lựa chọn thuộc tính q trình lựa chọn tập gồm P thuộc tính từ tập gồm A thuộc tính (PA) cho khơng gian thuộc tính thu gọn lại cách tối ưu theo tiêu chuẩn định Hiện có hai cách tiếp cận tốn lựa chọn thuộc tính: Lọc (filter) đóng gói (wrapper) Cách tiếp cận kiểu lọc thực việc lựa chọn thuộc tính độc lập với thuật toán khai phá sử dụng sau Các thuộc tính chọn dựa độ quan trọng chúng việc mô tả liệu Ngược lại với cách tiếp cận lọc, lựa chọn thuộc tính kiểu đóng gói tiến hành việc lựa chọn cách áp dụng kỹ thuật khai phá cụ thể, độ xác kết lấy làm tiêu chuẩn để lựa chọn tập thuộc tính [44] Lý thuyết tập thô (Rough set) Pawlak đề xuất [66] công cụ hiệu giải tốn rút gọn thuộc tính bảng định cộng đồng nghiên cứu tập thô thực lâu Trong lý thuyết tập thô, liệu biểu diễn thông qua hệ thông tin IS U , A với U tập đối tượng A tập thuộc tính Phương pháp tiếp cận lý thuyết tập thơ dựa quan hệ không phân biệt để đưa tập xấp xỉ biểu diễn tập đối tượng cần quan sát Bảng định hệ thông tin IS với tập thuộc tính A chia thành hai tập khác rỗng rời C D , gọi tập thuộc tính điều kiện tập thuộc tính định Nói cách khác, DT U , C D với C D Bảng định mơ hình thường gặp thực tế, mà giá trị liệu thuộc tính điều kiện cung cấp cho ta thông tin giá trị thuộc tính định Các phương pháp rút gọn thuộc tính theo tiếp cận lý thuyết tập thô thực bảng định có miền giá trị rời rạc Trong thực tế, miền giá trị thuộc tính bảng định thường chứa giá trị thực Ví dụ, thuộc tính trọng lượng thể huyết áp bảng liệu bệnh nhân thường giá trị thực, liên tục Để thực phương pháp rút gọn thuộc tính theo tiếp cận tập thơ, miền giá trị thuộc tính thực, liên tục cần rời rạc hóa Tuy nhiên, phương pháp rời rạc hóa khơng bảo tồn khác ban đầu đối tượng liệu gốc làm giảm độ xác phân lớp sau rút gọn thuộc tính Để giải tốn rút gọn thuộc tính trực tiếp bảng định có miền giá trị thực, năm gần nhà nghiên cứu đề xuất hướng tiếp cận sử dụng lý thuyết tập thô mờ Lý thuyết tập thô mờ (Fuzzy rough set) Dubois, D., Prade, H., [32], [33] đề xuất kết hợp lý thuyết tập thô lý thuyết tập mờ nhằm xấp xỉ tập mờ dựa quan hệ tương đương mờ (fuzzy equivalent relation) xác định miền giá trị thuộc tính Lý thuyết tập thơ truyền thống dựa quan hệ tương đương để xấp xỉ tập hợp, độ tương đương hai đối tượng chúng tương đương, ngược lại chúng không tương đương Lý thuyết tập thô 111 cách Jaccard mờ hai tập mờ tính trực tiếp miền giá trị hai tập mờ nên không bị mát thơng tin Trên sở đó, lựa chọn tham số ngưỡng [ , ] [0,1] phù hợp để sinh luật định, kết thu tập luật hỗ trợ phân lớp liệu Phương pháp sinh luật định thực bảng định mờ sau rút gọn thuộc tính nên tập luật thu đơn giản luật sinh phương pháp khác sử dụng bảng định mờ chưa rút gọn thuộc tính Độ xác liệu phân lớp tương đương số phương pháp khác [21], [44], [51] sử dụng số liệu mô thực nghiệm Độ phức tạp tính tốn thuật tốn FJ_RBAR O ( C D U ) nên có khả áp dụng thực tế Do vậy, kết nghiên cứu chương bổ sung làm phong phú thêm sưu tập kỹ thuật rút gọn thuộc tính sinh luật định bảng định mờ 112 KẾT LUẬN 1) Những kết qủa luận án: (1) Với tốn tìm tập rút gọn bảng định miền giá trị thực theo tiếp cận tập thô mờ, luận án nghiên cứu nhóm phương pháp rút gọn thuộc tính sử dụng quan hệ tương đương mờ dựa miền dương mờ, entropy thông tin mờ ma trận phân biệt mờ Trên bảng định miền giá trị thực, luận án đạt kết sau: - Cải tiến phương pháp sử dụng miền dương mờ nhằm khắc phục hạn chế công bố trước tập rút gọn chưa đảm bảo khơng dư thừa thuộc tính bảo toàn miền dương mờ Đây phương pháp rút gọn thuộc tính theo tiếp cận tập thơ mờ Đóng góp trình bày cơng trình [CCN1], [CCN2] - Xây dựng khoảng cách Jaccard mờ đề xuất phương pháp rút gọn thuộc tính bảng định miền giá trị thực sử dụng độ đo khoảng cách Jaccard mờ Dựa vào kết thực nghiệm số liệu lấy từ kho liệu UCI [99], kết luận phương pháp sử dụng khoảng cách Jaccard mờ cải thiện phương pháp sử dụng entropy thơng tin mờ theo hai tiêu chí đánh giá: Độ xác phân lớp thời gian thực thuật toán số số liệu Đóng góp trình bày cơng trình [CCN3] - Đề xuất khoảng cách hai phân hoạch mờ ứng dụng xây dựng phương pháp rút gọn thuộc tính bảng định miền giá trị thực Dựa vào kết thực nghiệm số liệu lấy từ kho liệu UCI [99], kết luận phương pháp sử dụng khoảng cách phân hoạch mờ cải thiện phương pháp sử dụng entropy thông tin mờ miền dương mờ theo hai tiêu chí đánh giá: Độ xác phân lớp thời gian thực thuật toán đa số số liệu thử nghiệm Đóng góp trình bày cơng trình [CCN4] 113 (2) Với tốn rút gọn thuộc tính sinh luật định bảng định mờ, luận án nghiên cứu phương pháp rút gọn thuộc tính sinh luật định dựa phân hoạch mờ xác định trước thuộc tính Đối với bảng định mờ, luận án đạt kết sau: - Cải tiến phương pháp rút gọn thuộc tính dựa miền dương mờ để tìm tập rút gọn không dư thừa bảo toàn miền dương mờ Phương pháp đề xuất cải tiến điều kiện dừng cơng thức tính độ quan trọng thuộc tính thuật tốn FUZZY-QUICKREDUCT, kiểm tra tính dưa thừa tập rút gọn Đóng góp trình bày cơng trình [CCN2] - Đề xuất phương pháp sinh luật định bảng định mờ sử dụng khoảng cách Jaccard mờ trực tiếp biến ngôn ngữ Bằng lý thuyết thực nghiệm, luận án cho thấy phương pháp đề xuất có độ xác phân lớp liệu tương đương phương pháp khác Đóng góp trình bày cơng trình [CCN5] 2) Hướng phát triển luận án: (1) Đối với bảng định có miền giá trị thực, tiếp tục nghiên cứu mối liên hệ tập rút gọn Từ đó, hồn thiện việc phân loại so sánh phương rút gọn thuộc tính bảng định có miền giá trị thực theo tiếp cận tập thô mờ (2) Đối với bảng định mờ, nghiên cứu phương pháp hiệu để rút gọn thuộc tính sinh luật định theo tiêu chí đánh giá độ xác phân lớp liệu thời gian thực Xây dựng độ đo đánh giá hiệu tập luật định bảng định mờ 114 Danh mục cơng trình tác giả TẠP CHÍ KHOA HỌC [CCN1] Cao Chính Nghĩa, Vũ Đức Thi, Nguyễn Long Giang (2016), “Rút gọn trực tiếp thuộc tính bảng định theo tiếp cận tập thơ mờ”, Tạp chí Khoa học cơng nghệ qn sự, số 43, Tr 110-118 [CCN2] Cao Chính Nghĩa, Vũ Đức Thi, Tân Hạnh, Nguyễn Long Giang (2016), “Rút gọn thuộc tính bảng định sử dụng miền dương mờ”, Tạp chí Khoa học Cơng nghệ thơng tin Truyền thơng, Học viện Cơng nghệ Bưu viễn thơng, số 2, Tr 3-10 [CCN3] Cao Chinh Nghia, Vu Duc Thi, Nguyen Long Giang, Tan Hanh (2016), “Fuzzy distance based attribute reduction in decision tables”, Chun san Các cơng trình nghiên cứu, phát triển ứng dụng CNTT&TT số 16 (36), Bộ Thông tin truyền thông, Tr 104112 [CCN4] Cao Chinh Nghia, Demetrovics Janos, Nguyen Long Giang, Vu Duc Thi (2016), “About a fuzzy distance between two fuzzy partitions and attribute reduction problem”, Cybernetics and Information Technologies, Scopus index, Vol 16, No 4, pp 13-28 HỘI NGHỊ KHOA HỌC [CCN5] Nguyễn Quang Huy, Nguyễn Long Giang, Cao Chính Nghĩa, Tân Hạnh, Phạm Văn Dũng (2016), Một phương pháp sinh luật định bảng định mờ sử dụng khoảng cách mờ, Hội thảo quốc gia lần thứ IXX, Một số vấn đề chọn lọc công nghệ thông tin truyền thông, tr 276-281 115 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Hoàng Thị Lan Giao (2009), Một thuật tốn tìm tập rút gọn bảng định khơng đầy đủ, Tạp chí Tin học Điều khiển học 25(1), tr 69-78 [2] Ngọc Minh Châu, Nguyễn Xn Thảo (2013), Một thuật tốn tìm tập rút gọn sử dụng ma trận phân biệt được, tạp chí khoa học phát triển, 11(5), tr 729-734 [3] Nguyễn Đức Thuần (2010), Phủ tập thô độ đo đánh giá hiệu tập luật định, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ thơng tin [4] Nguyễn Long Giang (2012), Nghiên cứu số phương pháp khai phá liệu theo tiếp cận lý thuyết tập thơ, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ thông tin [5] Nguyễn Long Giang, Vũ Đức Thi (2011), Một phương pháp rút gọn thuộc tính dựa entropy cải tiến, Tạp chí Tin học Điều khiển học, 27(2), tr 166-175 [6] Nguyễn Long Giang, Vũ Đức Thi (2011), Thuật tốn tìm tất tập rút gọn bảng định, Tạp chí Tin học Điều khiển học, 27(3), tr 199-205 [7] Phùng Thị Hiền (2014), Nghiên cứu rút gọn thuộc tính hệ thơng tin định giá trị tập, Luận án Tiến sĩ Công nghệ thông tin, Học viện Kỹ thuật quân [8] Vũ Đức Thi (2012), Một số vấn đề tính tốn liên quan đến sở liệu khai phá liệu, Tạp chí Khoa học Cơng nghệ 50(6), tr 679-703 Tài liệu tiếng Anh 116 [9] Al Daoud, E (2015), An efficient algorithm for finding a fuzzy rough set reduct using an improved harmony search, International Journal of Modern Education and Computer Science, 7(2), 16 [10] Aydogan, E K., Gencer, C., & Agirgun, B (2010), An Attribute Reduction Algorithm Based on Fuzzy Rough Set, In 24th mini EURO Conference MEC EurOPT [11] Azhagusundari, B., & Thanamani, D A S (2013), Feature selection based on fuzzy entropy, IJETTCS, 2(2), pp 4-30 [12] Bai, H., Ge, Y., Wang, J., Li, D., Liao, Y., & Zheng, X (2014), A method for extracting rules from spatial data based on rough fuzzy sets, Knowledge-Based Systems, 57, pp 28-40 [13] Beaubouef, T., & Petry, F E (2000), Fuzzy rough set techniques for uncertainty processing in a relational database, International Journal of Intelligent Systems, 15(5), pp 389-424 [14] Bhatt, R B., and Gopal, M (2005), On fuzzy-rough sets approach to feature selection, Pattern recognition letters, 26(7), pp 965-975 [15] Chen, D G., Tsang, E C., and Zhao, S Y (2007, October), An approach of attributes reduction based on fuzzy T L rough sets, In 2007 IEEE International Conference on Systems, Man and Cybernetics (pp 486-491), IEEE [16] Chen, D., Yang, W., & Li, F (2008), Measures of general fuzzy rough sets on a probabilistic space, Information Sciences, 178(16), pp 31773187 [17] Chen, D., Hu, Q., & Yang, Y (2011), Parameterized attribute reduction with Gaussian kernel based fuzzy rough sets, Information Sciences, 181(23), pp 5169-5179 [18] Chen, D., Zhang, L., Zhao, S., Hu, Q., and Zhu, P (2012), A novel algorithm for finding reducts with fuzzy rough sets, IEEE Transactions on Fuzzy Systems, 20(2), pp 385-389 117 [19] Chen, S M., Lee, S H., and Lee, C H (2001), A new method for generating fuzzy rules from numerical data for handling classification problems, Applied Artificial Intelligence, 15(7), pp 645-664 [20] Cheng, Y (2012), A new approach for rule extraction in fuzzy information systems, Journal of Computational Information Systems, 21(8), pp 8795-8805 [21] Cheng, Y (2015), Forward approximation and backward approximation in fuzzy rough sets, Neurocomputing, 148, pp 340-353 [22] Chierichetti, F., Kumar, R., Pandey, S., & Vassilvitskii, S (2010, January), Finding the jaccard median, In Proceedings of the twenty-first annual ACM-SIAM symposium on Discrete Algorithms (pp 293-311), Society for Industrial and Applied Mathematics [23] Cornelis, C., Jensen, R., Hurtado, G., & Śle, D (2010), Attribute selection with fuzzy decision reducts, Information Sciences, 180(2), pp 209-224 [24] Dai, J., and Xu, Q (2013), Attribute selection based on information gain ratio in fuzzy rough set theory with application to tumor classification, Applied Soft Computing, 13(1), pp 211-221 [25] Dai, J., & Tian, H (2013), Fuzzy rough set model for set-valued data, Fuzzy Sets and Systems, 229, pp 54-68 [26] Degang, C., and Suyun, Z (2010), Local reduction of decision system with fuzzy rough sets, Fuzzy Sets and Systems, 161(13), pp 1871-1883 [27] Deng, T., Chen, Y., Xu, W., and Dai, Q (2007), A novel approach to fuzzy rough sets based on a fuzzy covering, Information Sciences, 177(11), pp 2308-2326 [28] Demetrovics, J., Thi, V D., Giang, N L (2013), An Efficient Algorithm for Determining the Set of All Reductive Attributes in Incomplete Decision Table, Cybernetics Technologies, 13(4), pp 118-126 and Information 118 [29] Demetrovics, J., , Thi, V D., Giang, N L (2014), On Finding All Reducts of Consistent Decision Tables, Cybernetics and Information Technologies, 14(4) [30] Demetrovics, J., Huong, N T L., Thi, V D., Giang, N L (2016), Metric Based Attribute Reduction Method in Dynamic Decision Tables, Cybernetics and Information Technologies, 16(2), pp 3-15 [31] Dong, C., Wu, D., & He, J (2008, December), Knowledge reduction of evaluation dataset based on genetic algorithm and fuzzy rough set, In Computer Science and Software Engineering, 2008 International Conference on (Vol 3, pp 889-892), IEEE [32] Dubois, D., and Prade, H (1990), Rough fuzzy sets and fuzzy rough sets, International Journal of General System, 17(2-3), pp 191-209 [33] Dubois, D., and Prade, H (1992), Putting rough sets and fuzzy sets together, Intelligent Decision Support, Kluwer Academic Publishers, Dordrecht [34] Fujita, O (2013), Metrics based on average distance between sets, Japan Journal of Industrial and Applied Mathematics, 30(1), pp 1-19 [35] Gardner, A., Kanno, J., Duncan, C A., & Selmic, R (2014), Measuring distance between unordered sets of different sizes, In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 137-143 [36] He, Q., Wu, C., Chen, D., and Zhao, S (2011), Fuzzy rough set based attribute reduction for information systems with fuzzy decisions, Knowledge-Based Systems, 24(5), pp 689-696 [37] Hong, T P., Wang, T T., & Chien, B C (2001), Learning approximate fuzzy rules from training examples In Fuzzy Systems, 2001, The 10th IEEE International Conference on (Vol 1, pp 256-259), IEEE 119 [38] Hu, Q., Xie, Z., and Yu, D (2007), Hybrid attribute reduction based on a novel fuzzy-rough model and information granulation, Pattern recognition, 40(12), pp 3509-3521 [39] Hu, Q., Yu, D., and Xie, Z (2006), Information-preserving hybrid data reduction based on fuzzy-rough techniques, Pattern recognition letters, 27(5), pp 414-423 [40] Hu, Q., Yu, D., Xie, Z., and Liu, J (2006), Fuzzy probabilistic approximation spaces and their information measures, IEEE transactions on fuzzy systems, 14(2), pp 191-201 [41] Hu, Q., An, S., & Yu, D (2010), Soft fuzzy rough sets for robust feature evaluation and selection, Information Sciences, 180(22), pp 4384-4400 [42] Hu, Q., Zhang, L., Chen, D., Pedrycz, W., & Yu, D (2010), Gaussian kernel based fuzzy rough sets: Model, uncertainty measures and applications, International Journal of Approximate Reasoning, 51(4), pp 453-471 [43] Inuiguchi, M., Greco, S., & Slowinski, R (2004), Fuzzy rough sets, gradual decision rules and approximate reasoning, Mathematical Programming Concerning Decision Makings and Uncertainties [44] Jensen, R., and Q Shen, Q.(2008), Computational Intelligence and Feature Selection, Rough and Fuzzy Approaches, Aberystwyth University, IEEE Computational Intelligence Society, Sponsor [45] Jensen, R., and Shen, Q (2002), Fuzzy-rough sets for descriptive dimensionality reduction In Fuzzy Systems, 2002, FUZZ-IEEE'02, Proceedings of the 2002 IEEE International Conference on (Vol 1, pp 29-34), IEEE [46] Jensen, R., & Shen, Q (2002, September), Aiding fuzzy rule induction with fuzzy-rough attribute reduction, In Proceedings of the 2002 UK Workshop on Computational Intelligence (pp 81-88) 120 [47] Jensen, R., and Shen, Q (2004), Fuzzy–rough attribute reduction with application to web categorization, Fuzzy sets and systems, 141(3), pp 469-485 [48] Jensen, R., and Shen, Q (2004), Semantics-preserving dimensionality reduction: rough and fuzzy-rough-based approaches, IEEE Transactions on knowledge and data engineering, 16(12), pp 14571471 [49] Jensen, R., and Shen, Q (2007), Fuzzy-rough sets assisted attribute selection, IEEE Transactions on fuzzy systems, 15(1), pp 73-89 [50] Jensen, R., and Shen, Q (2009), New approaches to fuzzy-rough feature selection, IEEE Transactions on Fuzzy Systems, 17(4), pp 824838 [51] Jensen, R., Cornelis, C., and Shen, Q (2009, August), Hybrid fuzzyrough rule induction and feature selection In Fuzzy Systems, 2009, FUZZ-IEEE 2009, IEEE International Conference on (pp 1151-1156), IEEE [52] Kohonen, T (1988), An introduction to neural computing, Neural networks, 1(1), 3-16 [53] Kohonen, T (1998), The self-organizing map, Neurocomputing, 21(1), pp 1-6 [54] Kohonen, T (2012), Self-organization and associative memory (Vol.8) Springer Science & Business Media [55] Kumar, M., & Yadav, N (2014), Fuzzy Rough Sets and Its Application in Data Mining Field, Advances in Computer Science and Information Technology (ACSIT), 237 [56] LEVASHENKO, V., and MARTINCOVÁ, P (2005), Fuzzy decision tree for parallel processing support, Journal of Information, Control and Management Systems, Vol 121 [57] Liu, G (2008), Axiomatic systems for rough sets and fuzzy rough sets, International Journal of Approximate Reasoning, 48(3), pp 857-867 [58] Liu, X., Qian, Y., & Liang, J (2014), A rule-extraction framework under multigranulation rough sets, International Journal of Machine Learning and Cybernetics, 5(2), pp 319-326 [59] Maji, P., & Garai, P (2013), On fuzzy-rough attribute selection: criteria of max-dependency, max-relevance, min-redundancy, and maxsignificance, Applied Soft Computing, 13(9), pp 3968-3980 [60] Mageswari, G U., & Devi, M I (2016), Attribute subset selection based on fuzzy rough set and ranking approach, Int J Adv Engg Tech, Vol VII, Issue II, April-June, pp 735-742 [61] Meghabghab, G (2006, June), Fuzzy Rough Sets as a Pair of Fuzzy Numbers: A New Approach and New Findings, In Fuzzy Information Processing Society, 2006 NAFIPS 2006, Annual meeting of the North American (pp 46-51), IEEE [62] Meng, J., Xu, Y., & Zhang, J (2012, August), Comparison of two algorithms of attribute reduction based on fuzzy rough set, In Computational and Information Sciences (ICCIS), 2012 Fourth International Conference on (pp 542-545), IEEE [63] Ming, Z., Zhengbo, Y., Liukun, Z., Huijie, W., and Xiaogang, X (2012), The Extraction Method of the Energy Consumption Characteristics Based on Fuzzy Rough Set, AASRI Procedia, 1, pp 142-149 [64] Nguyen, L G (2012, September), Metric based attribute reduction in decision tables, In Computer Science and Information Systems (FedCSIS), 2012 Federated Conference on (pp 311-316), IEEE [65] Ouyang, Y., Wang, Z., & Zhang, H P (2010), On fuzzy rough sets based on tolerance relations, Information Sciences, 180(4), pp 532-542 122 [66] Pawlak Z (1991), Rough sets: Theoretical Aspects of Reasoning About Data, Kluwer Academic Publishers [67] Pawlak, R., Grzymala-Busse, J.W., Slowinski, R., Ziako, W (1995), Rough sets, Communications, ACM 38(11), pp 89-95 [68] Pawlak, Z (1982), Rough sets, International Journal of Computer & Information Sciences, 11(5), pp 341-356 [69] Qian, Y., Li, Y., Liang, J., Lin, G., and Dang, C (2015), Fuzzy granular structure distance, IEEE Transactions on Fuzzy Systems, 23(6), pp 2245-2259 [70] Qian, Y., Liang, J., and Dang, C (2009), Knowledge structure, knowledge granulation and knowledge distance in a knowledge base, International Journal of Approximate Reasoning, 50(1), pp 174188 [71] Qian, Y., Liang, J., Wei-zhi, Z W., and Dang, C (2011), Information granularity in fuzzy binary GrC model, IEEE Transactions on Fuzzy Systems, 19(2), pp 253-264 [72] Qian, Y., Wang, Q., Cheng, H., Liang, J., and Dang, C (2015), Fuzzyrough feature selection accelerator, Fuzzy Sets and Systems, 258, pp 61-78 [73] Radzikowska, A M., and Kerre, E E (2002), A comparative study of fuzzy rough sets Fuzzy sets and systems, 126(2), pp 137-155 [74] Shen, Q., and Jensen, R (2004), Selecting informative features with fuzzy-rough sets and its application for complex systems monitoring Pattern recognition, 37(7), pp 1351-1363 [75] Sun, R., & Han, R (2009, June), Data mining based on fuzzy rough set theory and its application in the glass identification, In Information and Automation, 2009 ICIA'09 International Conference on (pp 154-157), IEEE 123 [76] Sun, B., and Ma, W (2011), Fuzzy rough set model on two different universes and its application, Applied Mathematical Modelling 35, pp 1798–1809 [77] Tavan, P., Grubmüller, H., & Kühnel, H (1990), Self-organization of associative memory and pattern classification: recurrent signal processing on topological feature maps, Biological Cybernetics, 64(2), pp 95-105 [78] Tsang, G C., Degang, C., Tsang, E C., Lee, J W., and Yeung, D S (2005, October), On attributes reduction with fuzzy rough sets, In 2005 IEEE International Conference on Systems, Man and Cybernetics (Vol 3, pp 2775-2780), IEEE [79] Tsang, E C., and Chen, D G (2006, August), The Fuzzy Rough Set Approaches of Fuzzy Reasoning, In 2006 International Conference on Machine Learning and Cybernetics (pp 1642-1646), IEEE [80] Tsang, E C., Chen, D., Yeung, D S., Wang, X Z., and Lee, J W (2008) Attributes reduction using fuzzy rough sets, IEEE Transactions on Fuzzy systems, 16(5), pp 1130-1141 [81] Tsang, E C., Zhao, S Y., and Lee, J W (2007, August), Rule induction based on fuzzy rough sets, In 2007 International Conference on Machine Learning and Cybernetics (Vol 5, pp 3028-3033), IEEE [82] Wang, X Z., Ha, Y., & Chen, D G (2005, August), On the reduction of fuzzy rough sets, In Machine Learning and Cybernetics, 2005, Proceedings of 2005 International Conference on (Vol 5, pp 31743178), IEEE [83] Wang, X., & Hong, J (1999), Learning optimization in simplifying fuzzy rules, Fuzzy sets and systems, 106(3), pp 349-356 [84] Wang, X., Tsang, E C., Zhao, S., Chen, D., & Yeung, D S (2007), Learning fuzzy rules from fuzzy samples based on rough set technique, Information sciences, 177(20), pp 4493-4514 124 [85] Wei-feng, D., Hai-ming, L., Yan, G., & Dan, M (2005, July), Another kind of fuzzy rough sets, In Granular Computing, 2005 IEEE International Conference on (Vol 1, pp 145-148), IEEE [86] Wu, Q E., Wang, T., Huang, Y X., & Li, J S (2006, August), New research on fuzzy rough sets, In Machine Learning and Cybernetics, 2006 International Conference on (pp 4178-4183) IEEE [87] Wu, W Z., Mi, J S., and Zhang, W X (2003), Generalized fuzzy rough sets.Information sciences, 151, pp 263-282 [88] Xu, F F., Miao, D Q., and Wei, L (2009), Fuzzy-rough attribute reduction via mutual information with an application to cancer classification, Computers and Mathematics with Applications, 57(6), pp 1010-1017 [89] Xu, F., Miao, D., and Wei, L (2007, August), An Approach for FuzzyRough Sets Attributes Reduction via Mutual Information, In FSKD (3) (pp 107-112) [90] Yao, Y Y (1998), A comparative study of fuzzy sets and rough sets, Information sciences, 109(1), pp 227-242 [91] Yeung, D S., Chen, D., Tsang, E C., Lee, J W., and Xizhao, W (2005), On the generalization of fuzzy rough sets, IEEE Transactions on fuzzy systems, 13(3), pp 343-361 [92] Yuan, Y., and Shaw, M J (1995), Induction of fuzzy decision trees, Fuzzy Sets and systems, 69(2), pp 125-139 [93] Zadeh, L A (1965), Fuzzy sets, Information and control, 8(3), pp 338353 [94] Zeng, A., Li, T., Liu, D., Zhang, J., & Chen, H (2015), A fuzzy rough set approach for incremental feature selection on hybrid information systems, Fuzzy Sets and Systems, 258, pp 39-60 [95] Zhang, S., & Sun, J (2009, August), Continuous value attribute decision table analysis method based on fuzzy set and rough set theory, 125 In Fuzzy Systems and Knowledge Discovery, 2009, FSKD'09, Sixth International Conference on (Vol 2, pp 75-79), IEEE [96] Zhang, M., Chen, D G., & Yang, Y Y (2013, July), A new algorithm of attribute reduction based on fuzzy clustering, In Machine Learning and Cybernetics (ICMLC), 2013 International Conference on (Vol 1, pp 155-158), IEEE [97] Zhang, X., Mei, C., Chen, D., and Li, J (2016), Feature selection in mixed data: A method using a novel fuzzy rough set-based information entropy, Pattern Recognition, 56, pp 1-15 [98] Zhao, S., & Tsang, E C (2008), On fuzzy approximation operators in attribute reduction with fuzzy Sciences, 178(16), pp 3163-3176 [99] http://archive.ics.uci.edu/ml/datasets.html [100] https://sourceforge.net/projects/weka rough sets, Information ... thực phương pháp rút gọn thuộc tính Chủ đề nghiên cứu rút gọn thuộc tính theo tiếp cận tập thô mờ thu hút quan tâm nhà nghiên cứu năm gần Các nghiên cứu liên quan đến rút gọn thuộc tính theo tiếp. .. [94]-[98] Các nghiên cứu rút gọn thuộc tính bảng định theo tiếp cận tập thô mờ tập trung giải hai toán: Bài toán rút gọn thuộc tính trực tiếp bảng định miền giá trị thực tốn rút gọn thuộc tính sinh luật. .. bảng định theo tiếp cận tập thô Lý thuyết tập thô xem công cụ hiệu để giải tốn rút gọn thuộc tính cộng đồng nghiên cứu tập thô thực lâu [1]-[8] Các phương pháp rút gọn thuộc tính theo tiếp cận