Nghiên cứu rút gọn tập thuộc tính trong hệ quyết định giá trị tập Nghiên cứu rút gọn tập thuộc tính trong hệ quyết định giá trị tập Nghiên cứu rút gọn tập thuộc tính trong hệ quyết định giá trị tập luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
i BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ - PHÙNG THỊ THU HIỀN NGHIÊN CỨU RÚT GỌN TẬP THUỘC TÍNH TRONG HỆ QUYẾT ĐỊNH GIÁ TRỊ TẬP Chuyên ngành : Cơ sở toán học cho tin học Mã số : 62.46.01.10 LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI – 2014 ii LỜI CAM ĐOAN Tôi xin cam đoan luận án cơng trình nghiên cứu riêng tơi Các kết viết chung với tác giả khác đồng ý đồng tác giả trước đưa vào luận án Các kết trình bày luận án mới, số liệu trung thực chưa công bố cơng trình khác./ Nghiên cứu sinh iii LỜI CẢM ƠN Luận án hoàn thành hướng dẫn, bảo tận tình PGS.TS Nguyễn Bá Tường, người mà từ tác giả học nhiều điều quí giá Tác giả nhận hướng dẫn quan tâm giúp đỡ nhiều mặt, với đòi hỏi nghiêm khắc PGS.TS Hà Quang Thụy Tác giả xin bày tỏ lòng biết ơn sâu sắc chân thành tới người Thầy giúp tác giả hoàn thành mục tiêu đặt luận án Tác giả xin chân thành cảm ơn tới tập thể thầy cô giáo, nhà khoa học thuộc: Học viện Kỹ thuật Quân sự, Trường Đại học Cơng nghệ (đặc biệt Phịng Thí nghiệm Cơng nghệ Tri thức - KTLab) - Đại học Quốc gia Hà Nội, Trường Đại học Kinh tế Kỹ thuật Công nghiệp giúp đỡ chuyên môn tạo điều kiện thuận lợi cho tác giả suốt thời gian học tập nghiên cứu Tác giả xin bày tỏ lòng biết ơn đến bạn đồng nghiệp giúp đỡ có trao đổi, chia sẻ kinh nghiệm chun mơn, có nhiều ý kiến đóng góp q báu cho tác giả q trình nghiên cứu Tác giả biết ơn người thân, đặc biệt chồng con, chia sẻ khó khăn chỗ dựa vững tinh thần tạo điều kiện cho tác giả suốt thời gian hoàn thành luận án iv MỤC LỤC LỜI CẢM ƠN iii DANH MỤC CÁC THUẬT NGỮ vii BẢNG KÝ HIỆU, TỪ VIẾT TẮT viii DANH MỤC BẢNG x DANH MỤC HÌNH VẼ xi MỞ ĐẦU Chương LÝ THUYẾT TẬP THÔ VÀ CÁC MỞ RỘNG .9 1.1 Hệ thông tin tập thô 1.1.1 Hệ thông tin 1.1.2 Quan hệ không phân biệt 10 1.1.3 Các tập xấp xỉ 12 1.1.4 Các tính chất xấp xỉ 15 1.1.5 Độ xác xấp xỉ 16 1.1.6 Bảng định 16 1.1.7 Quan hệ dung sai 18 1.2 Hệ thông tin giá trị tập .19 1.2.1 Khái niệm 19 1.2.2 Quan hệ dung sai hệ thông tin giá trị tập 20 1.2.3 Bảng định giá trị tập 21 1.2.4 Tập thô theo quan hệ dung sai 21 1.3 Kết luận 22 Chương RÚT GỌN THUỘC TÍNH THEO LÝ THUYẾT TẬP THƠ 24 2.1 Giới thiệu chung .24 2.2 Rút gọn thuộc tính hệ thơng tin 25 2.2.1 Tập rút gọn tập lõi 25 2.2.2 Ma trận phân biệt hàm phân biệt 30 2.2.3 Phụ thuộc xấp xỉ 33 2.2.3.1 Hàm thành viên thô 34 v 2.2.3.2 Độ phụ thuộc xấp xỉ 35 2.3 Rút gọn thuộc tính hệ thơng tin giá trị tập 35 2.3.1 Tập rút gọn hệ thông tin (bảng định) giá trị tập 36 2.3.2 Ma trận phân biệt 36 2.3.3 Rút gọn thuộc tính sử dụng đối tượng đại diện 38 2.4 Kết luận 40 Chương RÚT GỌN THUỘC TÍNH TRONG HỆ QUYẾT ĐỊNH GIÁ TRỊ TẬP SỬ DỤNG HÀM PHÂN BIỆT THEO BẢNG PHÂN BIỆT NGẪU NHIÊN 42 3.1 Cơ sở lý thuyết 42 3.1.1 Hàm phân biệt mở rộng 42 3.1.2 Bảng phân biệt ngẫu nhiên 44 3.1.3 Bảng ngẫu nhiên dung sai 49 3.1.4 Dàn giá trị thuộc tính 54 3.2 Thuật toán tìm tập rút gọn thuộc tính bảng định giá trị tập 57 3.2.1 Thuật toán 3.1 tìm tập rút gọn thuộc tính GMDSDT 57 3.2.2 Độ phức tạp thuật toán GMDSDT 58 3.2.3 Ví dụ minh họa 58 3.3 Thực nghiệm thuật toán GMDSDT 61 3.3.1 Cài đặt thuật toán 62 3.3.2 Chuẩn bị số liệu thực nghiệm 62 3.3.3 Thi hành thực nghiệm thuật toán 62 3.4 Thuật tốn tìm tập xấp xỉ hệ thông tin giá trị tập 65 3.4.1 Đặt vấn đề 65 3.4.2 Thuật tốn tìm tập xấp xỉ xấp xỉ VASDT .66 3.4.3 Độ phức tạp thuật toán VASDT 66 3.4.4 Ví dụ minh họa thuật tốn tìm tập xấp xỉ 67 3.5 Kết luận 68 Chương RÚT GỌN THUỘC TÍNH TRONG HỆ QUYẾT ĐỊNH GIÁ TRỊ TẬP SỬ DỤNG HÀM PHÂN BIỆT THEO MA TRẬN PHÂN BIỆT MỞ RỘNG 70 vi 4.1 Chọn mẫu đại diện cho tốn tìm tập rút gọn .70 4.1.1 Đặt vấn đề 70 4.1.2 Chọn tập đối tượng đại diện hệ thông tin giá trị tập 71 4.1.2.1 Cơ sở lý thuyết 71 4.1.2.2 Thuật toán chọn đối tượng đại diện hệ thông tin giá trị tập 73 4.1.2.3 Ví dụ minh họa 74 4.1.3 Chọn tập đối tượng đại diện bảng định giá trị tập 75 4.1.3.1 Cơ sở lý thuyết 75 4.1.3.2 Thuật toán chọn đối tượng đại diện bảng định giá trị tập 78 4.1.3.3 Ví dụ minh họa 79 4.2 Rút gọn thuộc tính bảng định giá trị tập sử dụng hàm phân biệt mở rộng .80 4.2.1 Cơ sở lý thuyết 80 4.2.2 Thuật toán tìm tập rút gọn bảng định giá trị tập sử dụng hàm phân biệt mở rộng 85 4.2.3 Đánh giá độ phức tạp thuật toán RGDSDT 86 4.2.4 Ví dụ minh họa thuật tốn RGDSDT 87 4.3 Rút gọn thuộc tính bảng định giá trị tập bổ sung loại bỏ thuộc tính 89 4.3.1 Cơ sở lý thuyết 89 4.3.2 Một số thuật tốn gia tăng tìm tập rút gọn thuộc tính RSDTAAS RSDTDA 95 4.3.3 Đánh giá độ phức tạp thuật toán RSDTAAS RSDTDAS 96 4.3.4 Ví dụ minh họa thuật toán RSDTAAS RSDTDAS 97 4.4 Thực nghiệm thuật toán RGDSDT 100 4.4.1 Cài đặt thuật toán RGDSDT 100 4.4.2 Thi hành thực nghiệm thuật toán RGDSDT 100 4.5 Kết luận chương 102 KẾT LUẬN VÀ KIẾN NGHỊ 103 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CƠNG BỐ 105 TÀI LIỆU THAM KHẢO 106 vii DANH MỤC CÁC THUẬT NGỮ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh Bảng ngẫu nhiên dựa quan hệ dung sai Tolerance Based Contingency Table Bảng phân biệt Contingency Table Bảng định Decision Table Bảng định giá trị tập Set valued Decision Information System Hàm phân biệt Discernibility Function Hệ thông tin Information System Hệ thông tin đầy đủ Complete Information System Hệ thông tin giá trị tập Set valued Information System Hệ thông tin không quán Inconsistent Information System Ma trận không phân biệt Indiscernibility Matrix Quan hệ dung sai Tolerance Relation Quan hệ không phân biệt Indiscernibility Relation Rút gọn thuộc tính Attribute Reduction Tập lõi Core Tập rút gọn Reduct Tập thô Rough Set Xấp xỉ Lower Approximation Xấp xỉ Upper Approximation viii BẢNG KÝ HIỆU, TỪ VIẾT TẮT Ký hiệu, từ viết tắt Diễn giải S U , A,V , f Hệ thông tin T U,C Bảng định D, V , f IS U , A,V , f DS (U , C Hệ thông tin giá trị tập d ,V , f ) Bảng định giá trị tập |X| Số phần tử (lực lượng) tập X u a Giá trị đối tượng u thuộc tính a IND B Quan hệ B u Lớp tương đương chứa u quan hệ IND B B U/B COVER U B (u ) không phân biệt Phân hoạch U sinh tập thuộc tính B Tập tất phủ U Hàm định suy rộng đối tượng u B BX B xấp xỉ X hệ thông tin BX B xấp xỉ X hệ thông tin BN B X B miền biên X hệ thông tin POS B D B miền dương D hệ thông tin TB Quan hệ dung sai tập thuộc tính B TB ( X ) Xấp xỉ X hệ thông tin giá trị tập TB ( X ) Xấp xỉ X hệ thông tin giá trị tập BNDTB ( X ) Miền biên X hệ thông tin giá trị tập NEGTB ( X ) Miền ngồi X hệ thơng tin giá trị tập POSTB ( X ) Miền dương X hệ thông tin giá trị tập CTB Bảng ngẫu nhiên tập thuộc tính B TCTB M DT Bảng ngẫu nhiên dựa quan hệ dung sai tập thuộc tính B Ma trận phân biệt discern( A) Hàm phân biệt ix IS P Hệ thông tin giá trị tập đại diện DS P Bảng định giá trị tập đại diện UP Tập đối tượng đại diện hệ thông tin giá trị tập RP Tập rút gọn dựa miền dương R Tập rút gọn dựa hàm định suy rộng RM Tập rút gọn dựa ma trận phân biệt RDF Tập rút gọn dựa hàm phân biệt mở rộng RCF Tập rút gọn dựa hàm phân biệt x DANH MỤC BẢNG Bảng 1.1 Một ví dụ hệ thơng tin .10 Bảng 1.2 Bảng định bệnh cúm 17 Bảng 1.3 Hệ thông tin giá trị tập 19 Bảng 2.1 Bảng rút gọn thứ hệ thống bệnh cúm R1 27 Bảng 2.2 Bảng rút gọn thứ hai hệ thống bệnh cúm R2 28 Bảng 2.3 Ma trận phân biệt xây dựng từ Bảng 1.2 .31 Bảng 2.4 Ma trận phân biệt bảng định giá trị tập xây dựng từ Bảng 1.3 .35 Bảng 3.1 Bảng phân biệt ngẫu nhiên biểu diễn giá trị tập thuộc tính 49 Bảng 3.2 Minh họa giá trị hàm phân biệt 54 Bảng 3.3 Bảng định giá trị tập gồm cột thuộc tính (a1 , a2 , a3 , a4 ) 59 Bảng 3.4 Kết thực Thuật toán GMDSDT .64 Bảng 3.5 Tập rút gọn Thuật toán GMDSDT 64 Bảng 3.6 Bảng định giá trị tập gồm cột thuộc tính điều kiện cột d X 67 Bảng 4.1 Bảng định giá trị tập 74 Bảng 4.2 Hệ thông tin giá trị tập đại diện từ Bảng 4.1 75 Bảng 4.3 Bảng định giá trị tập đại diện từ Bảng 4.1 79 Bảng 4.4 Bảng định giá trị tập bổ sung a5 , a6 .90 Bảng 4.5 Kết thực Thuật toán RGDSDT Thuật toán GMDSDT 100 Bảng 4.6 Tập rút gọn Thuật toán RGDSDT Thuật toán GMDSDT 101 99 Vậy ta có: a3a6 (u1 ) a3a6 (u4 ) a3a6 (u6 ) {1}; 0 1 M a3a6 a3 a6 (u2 ) 0 0 1 1 (u5 ) a3 a6 0 0 0 0 1, ; DIS a3 , a6 13 DIS a3 , a4 , a5 DIS a3 , a4 12 12 SIG out a6 a3 , a4 DIS a3 , a4 , a6 DIS a3 , a4 18 12 Chọn thuộc tính a6 có độ quan trọng lớn R 18 ta có DIS a3 , a4 , a6 (u3 ) 0; 0 1 SIG out a5 a3 , a4 Từ DIS a3 , a4 , a6 a3 a6 a3 , a4 , a6 DIS C Chuyển vòng lặp For thực kiểm tra tập R thu Tính DIS a4 , a6 12 , DIS a4 , a6 DIS C Tính DIS a3 , a6 13 , DIS a3 , a6 DIS C 12 , DIS a3 , a4 Theo tính tốn trên, DIS a3 , a4 Do thuật tốn kết thúc R a3 , a4 , a6 rút gọn “tốt nhất” C Ví dụ 4.12 Xét bảng định giá trị tập DS 4.4) với R DIS C U ,C d cho Ví dụ 4.8 (Bảng a3 , a4 , a6 tập rút gọn tốt tìm Ví dụ 4.11 Áp dụng Thuật tốn RSDTDAS tìm tập rút gọn tốt loại bỏ tập thuộc tính P a3 , a5 , ta có: Đặt R DIS C P DIS a4 , a6 12 Từ Ví a4 , a6 , từ Ví dụ 4.9 ta có a3 , a4 , a6 \ a3 , a5 dụ 4.10 ta có DIS a4 , a6 12 , DIS C P Chuyển vòng lặp For thực kiểm tra tập R thu Tính DIS a6 , DIS a6 DIS C P 100 Tính DIS a4 , DIS a4 Do thuật tốn kết thúc R DIS C P a4 , a6 rút gọn “tốt nhất” C P 4.4 Thực nghiệm thuật toán RGDSDT Trong phần này, luận án trình bày kết thực nghiệm Thuật tốn RGDSDT tìm tập rút gọn tốt bảng định giá trị tập sử dụng hàm phân biệt mở rộng tác giả đề xuất Việc thực nghiệm tiến hành liệu tập giá trị chuyển đổi từ liệu lấy từ kho liệu [76] Trên sở đó, luận án so sánh kết thực Thuật toán GMDSDT Thuật tốn RGDSDT tìm tập rút gọn thuộc tính hai phương pháp luận án đề xuất trình bày chi tiết Chương Chương 4.4.1 Cài đặt thuật toán RGDSDT Trước hết, tiến hành cài đặt Thuật tốn RGDSDT ngơn ngữ C#, môi trường cài đặt công cụ Microsoft Visual Studio 2010, với bảng định giá trị tập DS U,C d 4.4.2 Thi hành thực nghiệm thuật toán RGDSDT Mơi trường thực nghiệm máy tính PC với cấu hình Pentium dual core 2.13 GHz CPU, 1GB nhớ RAM, sử dụng hệ điều hành Windows XP Professional Việc thực nghiệm Thuật toán RGDSDT thực số liệu tập giá trị chuyển đổi từ số liệu kho liệu [76] Với số liệu, giả sử U số đối tượng, C số thuộc tính điều kiện, R số thuộc tính tập rút gọn, T thời gian thực thuật toán (đơn vị giây s) Các thuộc tính điều kiện đánh số thứ tự từ đến C Bảng 4.5 Bảng 4.6 sau mô tả kết thực Thuật tốn RGDSDT tìm tập rút gọn tốt sử dụng hàm phân biệt mở rộng Luận án ghi lại kết thực Thuật toán GMDSDT số liệu chọn để thực so sánh thời gian thực kết thực hai thuật toán 101 STT Bộ số liệu U C Thuật toán Thuật toán RGDSDT GMDSDT R T R T Hepatitis.data 155 19 0.531 0.735 Automobile.data 205 25 4.364 4.567 Anneal.data 798 38 27.588 41.256 Abalone.data 4177 127.245 214.114 Iris 150 0.127 0.155 Bảng 4.5 Kết thực Thuật toán RGDSDT Thuật toán GMDSDT STT Bộ số liệu Tập rút gọn Tập rút gọn Thuật Thuật toán RGDSDT toán GMDSDT {2, 15, 16} {2, 15, 16} {1, 2, 7, 14, 20, 21} {1, 2, 7, 14, 20, 21} Hepatitis.data Automobile.data Anneal.data {3, 5, 8, 12, 33, 34, 35} {3, 5, 8, 12, 33, 34, 35} Abalone.data {2, 5, 6} {2, 5, 6} Iris {1,2} {1,2} Bảng 4.6 Tập rút gọn Thuật toán RGDSDT Thuật toán GMDSDT Từ kết thực nghiệm, luận án có nhận xét sau: - Trên số liệu chọn, tập rút gọn thu Thuật toán RGDSDT Thuật toán GMDSDT Điều phù hợp với kết nghiên cứu lý thuyết tập rút gọn thu từ Thuật toán RGDSDT tập rút gọn thu từ Thuật tốn GMDSDT hồn tồn giống - Thời gian thực Thuật toán RGDSDT nhỏ thời gian thực Thuật toán GMDSDT Với số liệu lớn, thời gian thực Thuật toán RGDSDT nhỏ nhiều 102 4.5 Kết luận chương Chương trình bày phương pháp xây dựng hàm phân biệt mở rộng, ma trận phân biệt mở rộng bảng định giá trị tập Hai cấu trúc liệu cơng cụ để xây dựng thuật tốn tìm tập rút gọn bảng định giá trị tập Đồng thời luận án chứng minh việc tìm tập rút gọn bảng định giá trị tập đại diện bảng định giá trị tập ban đầu Sử dụng hàm phân biệt mở rộng, chương trình bày phương pháp tìm rút gọn thuộc tính bảng định giá trị tập Bằng lý thuyết thực nghiệm, chương đề xuất năm thuật toán bảng định giá trị tập 1) Thuật toán 4.1 chọn mẫu đại diện hệ thông tin giá trị tập với độ phức tạp thời gian hàm mũ 2) Thuật toán 4.2 chọn mẫu đại diện bảng định giá trị tập Đây thuật tốn thực có ý nghĩa bước tiền xử lý liệu trước thực nhiệm vụ khai phá liệu 3) Thuật tốn RGDSDT tìm tập rút gọn sử dụng hàm phân biệt mở rộng bảng định giá trị tập 4) Thuật tốn RSDTAAS tìm tập rút gọn sử dụng hàm phân biệt mở rộng bảng định giá trị tập bổ sung tập thuộc tính 5) Thuật tốn RSDTDAS tìm tập rút gọn sử dụng hàm phân biệt mở rộng bảng định giá trị tập loại bỏ tập thuộc tính Chương tiến hành thử nghiệm thuật toán RGDSDT so sánh kết tìm tập rút gọn hai thuật toán RGDSDT thuật toán GMDSDT qua thực nghiệm cho kết 103 KẾT LUẬN VÀ KIẾN NGHỊ I Những kết luận án Định hướng theo kỹ thuật bảng ngẫu nhiên (contingency table) [56], luận án đề xuất hai cấu trúc liệu bảng ngẫu nhiên tổng quát hóa (generalized contingency table) dàn giá trị thuộc tính (lattices of attribute values) hệ thông tin giá trị tập Các cấu trúc liệu cho phép phát triển kỹ thuật bảng ngẫu nhiên để đề xuất thuật tốn tương ứng tìm tập rút gọn bảng định giá trị tập Kết là, luận án đề xuất thuật tốn rút gọn thuộc tính bảng định giá trị tập Thuật toán GMDSVDT (Generalized Maximal Discernibility heuristic for Set valued Decision Tables, Thuật tốn 3.1) Thuật tốn GMDSVDT tác giả cơng bố cơng trình số 1, phần “Danh mục cơng trình tác giả” Hơn nữa, luận án chứng tỏ hai cấu trúc liệu bảng ngẫu nhiên tổng qt hóa dàn giá trị thuộc tính cơng cụ hữu hiệu đề nghị thuật tốn tìm tập xấp xỉ thơ hệ thơng tin giá trị tập Luận án đề xuất thuật toán VASDT (Verifying upper and lower Approximation for Set valued Decision Tables, Thuật tốn 3.2.) tìm tập xấp xỉ hệ thơng tin giá trị tập Ngoài việc áp dụng hai cấu trúc liệu nói trên, Thuật tốn VASDT cịn khai thác ý nghĩa khái niệm hàm phân biệt độ đo bao hàm hệ thông tin giá trị tập Bằng lý thuyết, luận án chứng minh Thuật toán VASDT luận án đề xuất hiệu Thuật tốn tìm tập xấp xỉ cơng trình [74] dựa độ phức tạp tính tốn Thuật tốn VASDT tác giả cơng bố cơng trình số Dựa ý tưởng thu nhỏ kích thước tập liệu ban đầu cơng trình [27], kết là, luận án đề xuất Thuật toán chọn tập đối tượng đại diện (Select a representative object set, Thuật toán 4.1 Thuật tốn 4.2) hệ thơng tin bảng định giá trị tập từ tập đối tượng ban đầu cho tốn tìm tập rút gọn Và chứng minh tập rút gọn tập đối tượng ban đầu tập rút gọn tập đối tượng đại diện qua song ánh hệ thông tin bảng định giá trị tập, từ khẳng định tính đắn phương pháp Các thuật toán chọn tập đối tượng đại diện có ý nghĩa quan trọng bước tiền xử lý số liệu 104 bảng định trước thực nhiệm vụ khai phá liệu Các kết tác giả cơng bố cơng trình số Trong lý thuyết tập thông truyền thống, Skowron Rauszer [52] đưa khái niệm ma trận phân biệt hàm phân biệt để tìm tập rút gọn Dựa cách tiếp cận này, luận án đề xuất hai cấu trúc liệu hàm phân biệt mở rộng ma trận phân biệt mở rộng bảng định giá trị tập Hai cấu trúc liệu công cụ để xây dựng thuật tốn tìm tập rút gọn bảng định giá trị tập Kết là, luận án đề xuất ba thuật tốn tìm tập rút gọn thuộc tính bảng định giá trị tập Thuật toán RGDSDT tìm tập rút gọn thuộc tính bảng định giá trị tập, Thuật toán RSDTAAS Thuật toán RSDTDAS tìm tập rút gọn thuộc tính bổ sung loại bỏ tập thuộc tính bảng định giá trị tập, đồng thời luận án đánh giá độ phức tạp thuật toán Các kết tác giả cơng bố cơng trình số II Hướng phát triển luận án Trên bảng định giá trị tập, tiếp tục nghiên cứu rút gọn thuộc tính trường hợp bổ sung tập đối tượng Tiếp tục nghiên cứu hàm phân biệt khác hệ thông tin giá trị tập Trên sở đó, đề xuất phương pháp hiệu phương pháp có 105 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ Sinh Hoa Nguyen and Thi Thu Hien Phung (2013) Efficient Algorithms for Attribute Reduction on Set-valued Decision Systems, The 14th International Conference of Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing (RSFDGrC 2013), Halifax, NS, Canada, October 11-14, 2013, Lecture Notes of Computer Science, SpingerLink, Volume 8170 (2013), pp 87-98 Thi Thu Hien Phung (2013) Generalized Discernibility Function based Attribute Reduction in Set-valued Decision Systems, The Third World Congress on Information and Communication Technologies (WICT 2013), published by IEEE, pp 225-230 Thi Thu Hien Phung (2013) On Selection of Representative Object Set for Attribute Reduction in Set-valued Information Systems, The Third World Congress on Information and Communication Technologies (WICT 2013), published by IEEE, pp 269-274 Phùng Thị Thu Hiền, Lê Quang Hào, Nguyễn Bá Tường (2011) Những vấn đề trích chọn đặc trưng hệ tin, Tạp chí nghiên cứu Khoa học kỹ thuật cơng nghệ quân (2011), tr 60 - 63 Phùng Thị Thu Hiền, Lê Quang Hào, Nguyễn Quang Khanh, Nguyễn Bá Tường (2010) Định nghĩa tập thô theo hàm thuộc thơ, Tạp chí nghiên cứu Khoa học kỹ thuật công nghệ quân (2010), tr 50 - 54 106 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Nguyễn Long Giang (2012) Nghiên cứu số phương pháp khai phá liệu theo tiếp cận lý thuyết tập thô, Luận án Tiến sĩ, Viện Công Nghệ Thông Tin [2] Hồng Thị Lan Giao (2007) Khía cạnh đại số lôgic phát luật theo tiếp cận tập thô, Luận án Tiến sĩ, Viện Công Nghệ Thông Tin [3] Phùng Thị Thu Hiền, Lê Quang Hào, Nguyễn Quang Khanh, Nguyễn Bá Tường (2010) Định nghĩa tập thô theo hàm thuộc thơ, Tạp chí nghiên cứu Khoa học kỹ thuật công nghệ quân (2010), tr 50 - 54 [4] Phùng Thị Thu Hiền, Lê Quang Hào, Nguyễn Bá Tường (2011) Những vấn đề trích chọn đặc trưng hệ tin, Tạp chí nghiên cứu Khoa học kỹ thuật công nghệ quân (2011), tr 60 - 63 [5] Nguyễn Đức Thuần (2010) Phủ tập thô độ đo đánh giá hiệu tập luật định, Luận án Tiến sĩ, Viện Công Nghệ Thông Tin Tài liệu tiếng Anh [6] Beaubouef T., Petry F.E and Arora G (1998) Information-theoretic measures of uncertainty for rough sets and rough relational databases, Information Sciences, 109, pp 535-563 [7] Jerzy W Grzymala-Busse (2011) Mining Incomplete Data - A Rough Set Approach, RSKT 2011, pp 1-7 [8] Chen Z C, Shi P., Liu P G., Pei Z (2013) Criteria Reduction of Set-Valued Ordered Decision System Based on Approximation Quanlity, International Journal of Innovative Computing, Information and Control, Vol 9, N 6, 2013, pp 2393-2404 [9] D.G Chen, S.Y Zhao, L Zhang, Y.P Yang, X Zhang (2012) Sample pair selection for attribute reduction with rough set, IEEE Transaction on Knowledge and Data Engineering, 24(1), pp 2080-2093 [10] Ivo Düntsch, Wendy MacCaull, Ewa Orlowska (2000) Structures with ManyValued Information and Their Relational Proof Theory ISMVL 2000, pp 107 293-304 [11] I Duntsch, G Gediga, and E Orlowska (2001) Relational attribute systems International Journal of Human-Computer Studies, 55(3):293–309 [12] Qinrong Feng and Rui Li (2013) Discernibility Matrix Based Attribute Reduction in Intuitionistic Fuzzy Decision Systems, RSFDGrC 2013, Halifax, NS, Canada, October 11-14, 2013, Lecture Notes of Computer Science, Volume 8170 (2013), pp 147-156 [13] Ge H., Li L.S and Yang C.J (2009) Improvement to Quick Attribution Reduction Algorithm, Journal of Computers, Vol.30, No.2, pp 308-312 [14] Long Giang Nguyen and Hung Son Nguyen (2013) Metric Based Attribute Reduction in Incomplete Decision Tables, RSFDGrC 2013, Halifax, NS, Canada, October 11-14, 2013, Lecture Notes of Computer Science, Volume 8170 (2013), pp 99-110 [15] Y Y Guan, H K Wang (2006) Set-valued information systems, Information Sciences 176(17), pp 2507-2525 [16] Thi Thu Hien Phung (2013) Generalized Discernibility Function based Attribute Reduction in Set-valued Decision Systems, The Third World Congress on Information and Communication Technologies (WICT 2013), published by IEEE, pp 225-230 [17] Thi Thu Hien Phung (2013) On Selection of Representative Object Set for Attribute Reduction in Set-valued Information Systems, The Third World Congress on Information and Communication Technologies (WICT 2013), published by IEEE , pp 269-274 [18] Sinh Hoa Nguyen and Thi Thu Hien Phung (2013) Efficient Algorithms for Attribute Reduction on Set-valued Decision Systems, The 14th International Conference of Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing (RSFDGrC 2013), Halifax, NS, Canada, October 11-14, 2013, Lecture Notes of Computer Science, SpingerLink, Volume 8170 (2013), pp 87-98 108 [19] Nguyen Sinh Hoa, Nguyen H.Son (1996) Some Efficient Algorithms for Rough Set Methods, The sixth International Conference on Information Processing Management of Uncertainty in Knowledge - Based Systems, pp 1451-1456 [20] Hu X.H and Cercone N (1995) Learning in relational databases, pp a rough set approach, International Journal of computational intelligence, pp 323-338 [21] Hu X.H., Lin T.Y and Han J.C (2004) A new rough sets model based on database systems, Fundamenta Informaticae, 59(1), pp 135-152 [22] Richard Jensen (2005) Combining rough and fuzzy sets for feature selection, PhD Thesis, University of Edinburgh [23] B Kolman, R.C Busby, S.C Ross (2003) Discrete Mathematical Structures ( fifth ed.), Prentice-Hall, Inc., 2003 [24] Jan Komorowski, Zdzislaw Pawlak, Lech Polkowski and Andrzej Skowron (1999) Rough Sets: A Tutorial Rough Fuzzy Hybridization – A New Trend in Decision Making (S.K Pal, A Skowron; Eds,), pp 3-98, Springer [25] M Kryszkiewicz (1998) Rough set approach to incomplete information systems, Information Sciences 112, pp 39-49 [26] Kryszkiewicz, M (1999) Rule in complete information systems, Information Science, (113), pp 271 - 292 [27] Lang G M., Li Q G (2012) Data compression of dynamic set-valued information systems, CoRR abs/1209.6509 [28] Li X.H and Shi K.Q (2006) A knowledge granulation-based algorithm for attribute reduction under incomplete information systems, Computer Science, Vol 33, pp 169-171 [29] Jiye Liang (2011) Uncertainty and feature selection in rough set theory, Proceedings of the 6th international conference on Rough sets and knowledge technology (RSKT'11), pp 8-15 [30] G Liu (2006) The axiomatization of the rough set upper approximation operations, Fundamenta Informaticae 69 (3):331–342 109 [31] Liu Y., Xiong R and Chu J (2009) Quick Attribute Reduction Algorithm with Hash, Chinese Journal of Computers, Vol.32, No.8, pp 1493-1499 [32] Dale E Nelson (2001) High Range Resolution Radar Target Classification, pp A Rough Set Approach, PhD Thesis, Ohio University [33] Senan Norhalina (2013) Feature selection for traditional Malay musical instrument sound classification using rough set, PhD Thesis, Universiti Tun Hussein Onn Malaysia [34] Neil S Mac Parthalain (2009) Rough Set Extensions for Feature Selection, PhD Thesis, Aberystwyth University [35] Zdzislaw Pawlak (1981) Information System Theoretical Foudation, Information Systems, (3):205-218 [36] Zdzislaw Pawlak (1982) Rough sets, International Journal of Computer and Information Sciences, 11 (5), pp 341-356 [37] Zdzislaw Pawlak (1985) Rough sets and fuzzy sets, Fuzzy sets and systems, 17, pp 99-102 [38] Z Pawlak (1991) Rough Sets: Theoretical Aspects of Reasoning about Data, System Theory, Kluwer Academic Publishers, Dordrecht, 1991 [39] Pawlak Z (1998) Rough set theory and its applications in data analysis, Cybernetics and systems 29, pp 661-688 [40] Zdzisław Pawlak (2002) Rough set theory and its applications, Journal of Telecommunications and Information Technology (3/2002), pp 7-10 [41] Z Pawlak (2002) Rough sets and intelligent data analysis, Information Science, 147, pp 1-12 [42] Zdzislaw Pawlak, Andrzej Skowron (2007) Rudiments of rough sets, Information Sciences 177 (1), pp 3-27 [43] Zdzislaw Pawlak, Andrzej Skowron (2007) Rough sets: some extensions, Information Sciences 177 (1), pp 28-40 [44] Y Qian, C Dang, J Liang, D Tang (2009) Set-valued ordered information systems, Information Sciences 179 (16), pp 2809–2832 110 [45] Y H Qian Y H., Liang J Y (2010) On Dominance Relations in Disjunctive Set-Valued Ordered Information Systems, International Journal of Information Technology & Decision Making, Vol 9, No 1, pp 9–33 [46] Yuhua Qian, Jiye Liang, Witold Pedrycz, Chuangyin Dang (2010) Positive approximation: An accelerator for attribute reduction in rough set theory, Artificial Intelligence 174 (2010), pp 597–618 [47] J Qian, D Q Miao, Z H Zhang, W Li (2011) Hybrid approaches to attribute reduction based on indiscernibility and discernibility relation Int J Approx Reasoning 52(2), pp 212-230 [48] Sanchita Mal-Sarkar (2009) Uncertainty Management of Intelligent Feature Selection in Wireless Sensor Networks, PhD Thesis, Cleveland State University [49] Shifei D., Hao D (2010) Research and Development of Attribute Reduction Algorithm Based on Rough Set, IEEE CCDC2010, pp 648-653 [50] Andrzej Skowron and Cecylia Rauszer (1992) The discernibility matrices and functions in information systems Theory and Decision Library, Volume 11, pp 331-362 [51] Skowron, A., Stepaniuk, J (1996) Tolerance approximation spaces Fundamenta Informaticae 27, pp 245-253 [52] Skowron, A., Rauszer, C.: The discernibility matrices and function in infornation systems In:Slowinski (ed.) Intelligent Decision Support, vol 11, pp 331–362 Springer, Netherlands (1992) [53] Andrzej Skowron, Jaroslaw Stepaniuk, Roman W Swiniarski (2012) Modeling rough granular computing based on approximation spaces Inf Sci 184(1), pp 20-43 [54] Andrzej Skowron, Andrzej Jankowski, and Roman Swiniarski (2013) 30 Years of Rough Sets and Future Perspectives, RSFDGrC 2013, Halifax, NS, Canada, October 11-14, 2013, Lecture Notes of Computer Science, Volume 8170 (2013), pp 1–10 111 [55] Hung Son Nguyen (2006) Approximate Boolean Reasoning: Foundations and Applications in Data Mining, Transactions on Rough Sets (J.F Peters and A Skowron (Eds.), V, LNCS 4100, pp 334–506 [56] W Swieboda, H S Nguyen (2012) Rough Set Methods for Large and Spare Data in EAV Format 2012 IEEE RIVF International Conference on Computing and Communication Technologies, Research, Innovation, and Vision for the Future (RIVF), pp 1-6 [57] Roman W Swiniarski, Andrzej Skowron (2003) Rough set methods in feature selection and recognition Pattern Recognition Letters 24(6), pp 833849 [58] Marcin Szczuka (2011) The use of Rough Set methods in KDD (A tutorial), RSFDGrC-2011 [59] Wang G.Y (2003) Rough reduction in algebra view and information view, International Journal of Intelligent System 18, pp 679-688 [60] Wang G.Y., Yu H., Yang D.C and Wu Z.F (2001) Knowledge Reduction Based on Rough Set and Information Entropy, The World Multi-conference on Systemics, Cybernetics and Informatics, Orlando, Florida, pp 555-560 [61] Wang G.Y., Yu H and Yang D.C (2002) Decision table reduction based on conditional information entropy, Journal of Computers, Vol 25 No 7, pp 759-766 [62] Wang C Z., Wua C X., Chenb D G., Duc W J (2008) Some properties of relation information systems under homomorphisms, Applied Mathematics Letters 21, pp 940–945 [63] Wang X.B., Zheng X.F and Xu Z.Y (2008) Comparative Research of Attribute Reductions based on the System Entropy and on the Database System, International Symposium on Computation Intelligence and Design, pp 150-153 [64] Wang C Z., Chen D G., Wuc C., Hu Q H (2011) Data compression with homomorphism in covering information systems, International Journal of Approximate Reasoning 52, pp 519–525 [65] Feng Wang, Jiye Liang, Chuangyin Dang (2013) Attribute reduction for 112 dynamic data sets Appl Soft Comput 13(1), pp 676-689 [66] Feng Wang, Jiye Liang, Yuhua Qian (2013) Attribute reduction: A dimension incremental strategy, Knowl.-Based Syst 39, pp 95-108 [67] Wei Wei, Jiye Liang, Yuhua Qian, Feng Wang, and Chuangyin Dang (2010) Comparative study of decision performance of decision tables induced by attribute reductions, International Journal of General Systems, 39 (8), pp 813-838 [68] Xu Z.Y., Yang B.R and Song W (2006) Complete attribute reduction algorithm based on Simplified discernibility matrix, Computer Engineering and Applications, Vol 42, No 26, pp.167-169 [69] Yao Y.Y., Zhao Y., Wang J (2006) On reduct construction algorithms, Proceedings of International Conference on Rough Sets and Knowledge Technology, pp 297-304 [70] Yiyu Yao, Yan Zhao (2008) Attribute reduction in decision-theoretic rough set models, Inf Sci 178(17), pp 3356-3373 [71] Ye D.Y and Chen Z.J (2002) A new discernibility matrix and computation of a core, Acta Electronica Sinica, Vol 30, No 7, pp 1086-1088 [72] Zadeh L.A (1965) Fuzzy sets, Information and Control, 8, pp 338-353, Academic Press, New York [73] W Zhang, J Mi (2004) Incomplete information system and its optimal selections, Computers & Mathematics with Applications 48 (5–6), pp 691– 698 [74] Junbo Zhang, Tianrui Li, Da Ruan, Dun Liu (2012) Rough sets based matrix approaches with dynamic attribute variation in set-valued information systems, International Journal of Approximate Reasoning, Volume 53, Issue 4, pp 620-635 [75] Zhao M., Luo K and Qin Z (2008) Algorithm for attribute reduction based on granular computing, Computer Engineering and Applications, Vol 44, No 30, pp 157-159 113 [76] The UCI machine learning repository, http://archive.ics.uci.edu/ml/datasets.html [77] Li J.H (2004), “An Absolute Information Quantity-based Algorithm for Reduction of Knowledge in Information Systems”, Computer Engineering and Applications, 39 (28), pp 52-53 [78] Miao D.Q and Hu G.R (1999), “A heuristic algorithm for knowledge reduction”, Computer Research and Development, Vol 36, No 6, pp 681-684 ... 2.3.1 Tập rút gọn hệ thông tin (bảng định) giá trị tập Rút gọn thuộc tính hệ thơng tin tập giá trị định nghĩa dựa quan hệ dung sai trình bày Định nghĩa 2.7 (Tập rút gọn thuộc tính hệ thơng tin giá. .. rủt gọn (super-reduct) Rõ ràng tập thuộc tính siêu rút gọn tối thiểu rút gọn Hơn nữa, tập thuộc tính điều kiện C siêu -rút gọn Rõ ràng tập thuộc tính siêu rút gọn mà tập tối thiểu rút gọn Một tập. .. tiếp cận thuật toán 2.3 Rút gọn thuộc tính hệ thơng tin giá trị tập Tương tự tốn rút gọn thuộc tính hệ thơng tin, rút gọn thuộc tính hệ thơng tin (bảng định) giá trị tập tiến hành theo hai tiếp