1. Trang chủ
  2. » Công Nghệ Thông Tin

Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)

52 442 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 52
Dung lượng 1,7 MB

Nội dung

Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)Rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô mờ (LV thạc sĩ)

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - NGUYỄN QUANG HUY RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI – 2017 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - NGUYỄN QUANG HUY RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN LONG GIANG HÀ NỘI – 2017 i LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu riêng Nội dung luận văn có tham khảo sử dụng tài liệu, thông tin đăng tải tạp chí trang web theo danh mục tài liệu tham khảo Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tôi xin hoàn toàn chịu trách nhiệm chịu hình thức kỉ luật theo quy định cho lời cam đoan Tác giả Nguyễn Quang Huy ii MỤC LỤC LỜI CAM ĐOAN I MỤC LỤC II DANH MỤC HÌNH VẼ IV DANH MỤC BẢNG V DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT VI LỜI MỞ ĐẦU Chương 1: Cơ sở lý thuyết 1.1 Lý thuyết tập thô 1.2 Lý thuyết tập mờ 1.3 Lý thuyết tập thô mờ 10 1.3.1 Quan hệ tương đương mờ .11 1.3.2 Ma trận tương đương mờ 12 1.4 Rút gọn thuộc tính bảng định 13 1.4.1 Tổng quan rút gọn thuộc tính 13 1.4.2 Rút gọn thuộc tính theo tiếp cận tập thô .15 1.4.3 Các phương pháp heuristic rút gọn thuộc tính phổ biến .18 Chương 2: Rút gọn thuộc tính bảng định sử dụng độ đo khoảng cách mờ 21 2.1 Xây dựng độ đo khoảng cách mờ theo tiếp cận tập thô mờ 21 2.1.1 Định nghĩa khoảng cách .21 2.1.2 Khoảng cách Jaccard hai tập mờ 22 iii 2.2 Thuật toán rút gọn thuộc tính sử dụng khoảng cách mờ .26 2.2.1 Định nghĩa tập rút gọn dựa khoảng cách mờ .27 2.2.2 Định nghĩa độ quan trọng thuộc tính 27 2.3 Thuật toán rút gọn thuộc tính sử dụng khoảng cách mờ .27 Chương 3: Thử nghiệm đánh giá kết 32 3.1 Phát biểu toán 32 3.2 Mục tiêu thử nghiệm 32 3.3 Số liệu, công cụ môi trường thử nghiệm 32 3.4 Đánh giá kết thử nghiệm .34 3.4.1 Thử nghiệm 35 3.4.2 Thử nghiệm 37 KẾT LUẬN 41 DANH MỤC TÀI LIỆU THAM KHẢO .42 iv DANH MỤC HÌNH VẼ Hình 1.1 Minh họa tập thô Hình 1.2 Quá trình lựa chọn thuộc tính 15 Hình 1.3 Lựa chọn thuộc tính theo hướng tiếp cận lọc & đóng gói 15 Hình 1.4 hình phương pháp heuristic rút gọn thuộc tính 17 Hình 3.1 Giao diện chương trình thử nghiệm 36 Hình 3.2 Thời gian thực thuật toán FA-FPR FJ_DBAR 37 Hình 3.3 Phương pháp k-fold Cross validation (với k=10) .38 Hình 3.4 Độ xác phân lớp C4.5 thuật toán FA-FPR FJ_DBAR 40 v DANH MỤC BẢNG Bảng 1.1 Bảng thông tin bệnh cúm .6 Bảng 2.1 Bảng định miền giá trị thực 29 Bảng 3.1 Các số liệu thử nghiệm 32 Bảng 3.2 Kết thực nghiệm thuật toán FA-FPR FJ_DBAR 35 Bảng 3.3 Độ xác phân lớp C4.5 FA-FPR FJ_DBAR 39 vi DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Ký hiệu, từ viết tắt Tiếng Anh Tiếng Việt IS  U , A Information system Hệ thông tin DT  U , C  D  Decision table Bảng định Fuzzy decision table Bảng định mờ The value of the object u at Giá trị đối tượng u the attribute a thuộc tính a Equivalence relation Quan hệ P  không phân  DT  U , C  D u a IND  P   biệt  u P ui R P The equivalent class containing Lớp tương đương chứa u of P u quan hệ P The fuzzy equivalent class Lớp tương đường mờ containing u of R P chứa u quan hệ tương đương mờ R P PX P  lower approximation of X P  xấp xỉ X PX P  upper approximation of X P  xấp xỉ X PN P  X  P  border region of X P  miền biên X POS P  D  P  positive region of D P  miền dương D SIGP  b  The importance of attribute b Độ quan trọng thuộc with attribute set P tính b với tập thuộc tính P vii  A (u) d FJ  C , C  D  Dependent function of object Hàm thuộc đối u with fuzzy set tượng u với tập mờ A A Fuzzy Jaccard distance between Khoảng cách Jaccard mờ two attributes C and C  D hai tập thuộc tính C C  D FJ_DBAR Fuzzy Jaccard Distance Based Rút gọn thuộc tính dựa Attribute Reduction khoảng cách Jaccard mờ FA-FPR CSDL Forward Approximation - Rút gọn thuộc tính dựa Fuzzy Positive Region miền dương mờ cải Reduction tiến Database Cơ sở liệu LỜI MỞ ĐẦU Thời gian gần đây, phương pháp tiếp cận dựa tập thô mờ dần nhiều nhóm nghiên cứu quan tâm mở rộng ứng dụng toán rút gọn thuộc tính, sinh luật định Đây toán quan tro ̣ng bước tiền xử lý số liệu với mu ̣c tiêu là nâng cao chấ t lươ ̣ng phân lớp của dữ liê ̣u nhằm tăng tính hiệu thuật toán khai phá liệu học máy Mục đích rút gọn thuộc tính bước tiền xử lý liệu loại bỏ thuộc tính dư thừa nhằm tăng tính hiệu thuật toán trích lọc luật, khai phá tri thức Một phương pháp truyền thống dựa lý thuyết tập thô Pawlak [6] đề xuất đánh giá công cụ hiệu để giải toán rút gọn thuộc tính trích lọc luật bảng định Tuy nhiên, phương pháp phải thực bảng định với miền giá trị thuộc tính rời rạc, nghĩa ta phải thực phương pháp rời rạc hóa liệu trước áp dụng phương pháp rút gọn thuộc tính theo tiếp cần tập thô Do đó, làm giảm thiểu độ xác phân lớp bảng định Lý thuyết tập thô mờ Dubois cộng [3][4] đề xuất xem công cụ hiệu để giải toán rút gọn trực tiếp bảng định có miền giá trị thuộc tính liên tục Ưu điểm dễ thấy phương pháp không cầ n thông qua bước rời ̣c hóa dữ liê ̣u các kỹ thuâ ̣t này tâ ̣p thô truyề n thố ng nên giảm thiể u đươ ̣c sự mấ t mát thông tin Với mục tiêu nghiên cứu phương pháp rút gọn thuộc tính nhằm nâng cao độ xác phân lớp bảng định, học viên chọn đề tài nghiên cứu “Rút gọn thuộc tính bảng định theo tiếp cận tập thô mờ” Luận văn trình bày phương pháp rút go ̣n thuô ̣c tiń h bảng định sử dụng khoảng cách mờ Đô ̣ đo khoảng cách giữa hai tâ ̣p mờ và hai phân hoa ̣ch mờ đươ ̣c xây dựng dựa đô ̣ đo khoảng cách Jaccard giữa hai tâ ̣p hơ ̣p rõ hữu ̣n phầ n tử, đươ ̣c go ̣i là khoảng cách Jaccard mờ Khoảng cách Jaccard mờ sử du ̣ng để rút go ̣n thuô ̣c tin ́ h đươ ̣c xây dựng dựa ma trâ ̣n quan ̣ tương tự mờ, quan ̣ này đươ ̣c đinh ̣ nghiã mề m dẻo miề n giá tri ̣ của các thuô ̣c tiń h nên ̣n chế đươ ̣c sự mấ t mát thông 29 19 End; 20 Return P ; Ví dụ 2.3 Cho bảng định miền giá trị thực DT  U , C  D  (Bảng 2.1) với U  u1, u2 , u3 , u4 , u5 , u6  , C  c1, c2 , c3 , c4 , c5 , c6  Bảng 2.1 Bảng định miền giá trị thực U c1 c2 c3 c4 c5 c6 D u1 0.8 0.2 0.6 0.4 0 u2 0.8 0.2 0.6 0.2 0.8 u3 0.6 0.4 0.8 0.2 0.6 0.4 u4 0.4 0.6 0.4 1 u5 0.6 0.6 0.4 1 u6 0.6 1 Áp dụng bước thuật toán FJ_DBAR, sử dụng quan hệ tương đương mờ theo công thức (1.14) P   , M ( R P )  , d FJ  ,   D   1, tính ma trận tương đương mờ M ( R c1 ), M ( R c2 ), M ( R c3 ), M ( R c4 ), M ( R c5 ), M ( R c6 ), M ( R C ), M ( IND  D ) 1 1  0 M ( R c1 )   0 0  0 1 0 0 0 0 0 0 1 0 1 0  0  1 , 1  1 1  1 0 M ( R c2 )   0 0  0 1 0 0 0 1 0 0 1 0 0 0 1 0  0  0 , 1   30 1 0  0 M ( R c3 )   1 1  0 0 0 0 0 1 0 1 0 1 0  0 , 0  1 0 0 0 1  0.2 0.2 0.2 0 0 0 0 M ( R c5 )   , 1 1 0 0.2 0 0.2 1 1   1 1 0 0.2 1 0  0 M ( RC )   0 0  0 0 0 0 0 0 0 0 0 0 0  0 , 0 0  1 Tính: d FJ  C , C  D   0, d FJ {c1},{c1} {D}  0.38889; d FJ {c2},{c2} {D}  0.5; d FJ {c3},{c3} {D}  0.389; d FJ {c4},{c4} {D}  0.222; d FJ {c5},{c5} {D}  0.23958; d FJ {c6},{c6} {D}  0.23958 1  0 0 M ( R c4 )   1 1  0 0 0 0 0 0 1 0 1 0  0  0 , 0  1 0 0 0 1  0.2 0.2 0.2 0 0 0 0 M ( R c6 )    1 1 0 0.2 0 0.2 1 1   1 1 0 0.2 1 0  1 M ( IND  D )   0 0  1 1 1 0 1 1 0 1 1  1  0 0  1 31 SIGP {c1}  0.61111; SIGP {c2}  0.5 ; SIGP {c3}  0.611 ; SIGP {c4}  0.778 ; SIGP {c5}  0.76042 ; SIGP {c6 }  0.76042 Thuộc tính c4  chọn P  c4  Tính tương tự, ta có: d FJ {c4 , c1},{c4 , c1} {D}  , kiểm tra d FJ {c4 , c1},{c4 , c1}  D   d FJ  C , C  D   , thuật toán dừng kết luận P  c4 , c1 Sau kiểm tra tính dư thừa, kết luận P  c4 , c1 tập rút gọn tốt DT Thuật toán FJ_DBAR tìm tập rút gọn kiểm tra tính dư thừa tập rút gọn Độ phức tạp tính toán ma trận tương đương mờ thuộc tính O( U ) với U số lượng đối tượng, C số lượng thuộc tính điều kiện; độ phức tạp tính toán M ( RC ) O( C U ) Thuật toán có hai vòng lặp lồng theo số lượng thuộc tính điều kiện Do vậy, độ phức tạp tính toán FJ_DBAR O( C U ) 32 CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ Bài toán thử nghiệm có đầu vào liệu từ UCI [11] đầu tập thuộc tính sau rút gọn 3.1 Phát biểu toán Xây dựng chương trình thử nghiệm thuật toán tìm tập rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ (FJ_DBAR) 3.2 Mục tiêu thử nghiệm Đánh giá thời gian thực hiện, tập rút gọn độ xác phân lớp liệu 3.3 Số liệu, công cụ môi trường thử nghiệm  Dữ liệu đầu vào sử dụng liệu có giá trị thuộc tính số lấy từ UCI Một số liệu chỉnh sửa (như: xóa cột ID số thứ tự, đưa cột thuộc tính đích cuối cùng) để phù hợp với chương trình thử nghiệm  thuật toán ngôn ngữ C#, sử dụng thư viện NET Visual Studio 2013  Cấu hính máy tính thử nghiệm: Windows 10 64bit, Bộ xử lý Pentium Core i7, 8GB Ram Bảng 3.1 Các số liệu thử nghiệm STT Bộ liệu Số đối tượng Số thuộc tính Số lớp Banknote authentication 1372 2 Wine recognition 178 13 3 Image Segmentation 2100 19 33 Wisconsin diagnostic breast cancer (wdbc) 569 30 Ionosphere 351 34 Sonar, mines vs rocks 208 60 Các liệu thực nghiệm lựa chọn đa dạng số lượng thuộc tính đối tượng từ tới nhiều Cụ thể sau:  Banknote authentication: Bảng liệu trích từ hình ảnh thực để đánh giá thủ tục xác thực cho tiền giấy, có miền giá trị số thực, phù hợp với toán phân lớp, không tồn giá trị khuyết thiếu Số lượng thuộc tính 4, số lượng đối tượng 1372, số lớp (“1”, “0”) Số đối tượng thuộc lớp cụ thể là: o “1”: 610 đối tượng, tỷ lệ 44.46% o “0”: 762 đối tượng, tỷ lệ 55.54%  Wine recognition: Bảng liệu nhận dạng loại rượu, có miền giá trị số thực, phù hợp với toán phân lớp, không tồn giá trị khuyết thiếu Số lượng thuộc tính 13, số lượng đối tượng 178, số lớp (“1”, “2”, “3”) Số đối tượng thuộc lớp cụ thể là: o “1”: 59 đối tượng, tỷ lệ 33.15% o “2”: 71 đối tượng, tỷ lệ 39.89% o “3”: 48 đối tượng, tỷ lệ 26.97%  Image Segmentation: Bảng liệu rút ngẫu nhiên từ CSDL hình ảnh trời, có miền giá trị số thực, phù hợp với toán phân lớp, không tồn giá trị khuyết thiếu Số lượng thuộc tính 19, số lượng đối tượng 2100, số lớp (“BRICKFACE”, “SKY”, “FOLIAGE”, “CEMENT”, “WINDOW”, “PATH”, “GRASS”) Số đối tượng thuộc lớp cụ thể là: o “BRICKFACE”: 300 đối tượng, tỷ lệ 14.29% o “SKY”: 300 đối tượng, tỷ lệ 14.29% 34 o “FOLIAGE”: 300 đối tượng, tỷ lệ 14.29% o “CEMENT”: 300 đối tượng, tỷ lệ 14.29% o “WINDOW”: 300 đối tượng, tỷ lệ 14.29% o “PATH”: 300 đối tượng, tỷ lệ 14.29% o “GRASS”: 300 đối tượng, tỷ lệ 14.29%  Wisconsin diagnostic breast cancer (wdbc): Bảng liệu chuẩn đoán ung thu vú, có miền giá trị số thực, phù hợp với toán phân lớp, không tồn giá trị khuyết thiếu Số lượng thuộc tính 30, số lượng đối tượng 569, số lớp (“M” - malignant, “B” - benign) Số đối tượng thuộc lớp cụ thể là: o “M”: 212 đối tượng, tỷ lệ 37.26% o “B”: 357 đối tượng, tỷ lệ 62.74%  Ionosphere: Bảng liệu radar trả từ tầng điện ly, có miền giá trị số thực, phù hợp với toán phân lớp, không tồn giá trị khuyết thiếu Số lượng thuộc tính 34, số lượng đối tượng 351, số lớp (“g” - good, “b” bad) Số đối tượng thuộc lớp cụ thể là: o “g”: 225 đối tượng, tỷ lệ 64.1% o “b”: 126 đối tượng, tỷ lệ 35.9%  Sonar, mines vs rocks: Bảng liệu tín hiệu sóng siêu âm, có miền giá trị số thực, phù hợp với toán phân lớp, không tồn giá trị khuyết thiếu Số lượng thuộc tính 60, số lượng đối tượng 208, số lớp (“M” Mine, “R” - Rock) Số đối tượng thuộc lớp cụ thể là: o “M”: 111 đối tượng, tỷ lệ 53.37% o “R”: 97 đối tượng, tỷ lệ 46.63% 3.4 Đánh giá kết thử nghiệm Để đánh giá kết thử nghiệm thuật toán, học viên chọn thuật toán FA-FPR (tìm tập rút gọn dựa miền dương mờ) báo [14] để so sánh với thuật toán FJ_DBAR (tìm tập rút gọn dựa khoảng cách Jaccard mờ) Các tiêu chí 35 đánh giá thời gian thực hiện, số thuộc tính tập rút gọn độ xác phân lớp liệu 3.4.1 Thử nghiệm Trong thử nghiệm này, học viên chạy thực nghiệm thuật toán rút gọn FAFPR FJ_DBAR tập liệu Do chương trình thử nghiệm sử dụng nhớ đệm cho biến mảng để lưu tập mẫu, nên lần chạy sau nhanh lần chạy Do đó, liệu chạy lần lấy thời gian trung bình lần chạy Bảng 3.2 kết thử nghiệm thời gian thực số lượng thuộc tính tập rút gọn hai thuật toán số liệu chọn với U số đối tượng, C số thuộc tính, R số thuộc tính tập rút gọn với thuật toán, t thời gian thực (đơn vị giây) Bảng 3.2 Kết thực nghiệm thuật toán FA-FPR FJ_DBAR TT Bộ số liệu U FA-FPR FJ_DBAR R t R t C Banknote authentication 1372 4 2.61 1.72 Wine recognition 178 13 13 0.95 13 0.13 Image Segmentation 2100 19 15 288.4 18 67.63 wdbc 569 30 22 20.7 30 13.17 Ionosphere 351 34 24 9.04 17 4.20 208 60 20 13.18 58 10.01 Sonar, mines vs rocks Hình ảnh chương trình demo thuật toán FJ_DBAR: 36 Hình 3.1 Giao diện chương trình thử nghiệm Nhận xét: Nhìn chung thuật toán FA-FPR cho tập rút gọn số tập liệu “Sonar”, “wdbc”, “Image Segmentation” nhiều FJ_DBAR tập liệu lại Cả hai thuật toán không tìm tập rút gọn hai liệu: “Banknote authentication” “Wine recognition” FA-FPR; “Wine recognition” “wdbc” thuật toán FJ_DBAR Về thời gian tính toán, FAFPR tỏ chậm hẳn, đặc biệt tập liệu có nhiều đối tượng thuộc tính “Image Segmentation” Điều dễ hiểu thuật toán có thêm bước tiêu chuẩn hóa (normalize) thuộc tính số dạng số thực [0, 1] Hình 3.2 biểu đồ so sánh thời gian thực của hai thuật toán liệu cụ thể 37 350 300 250 200 150 100 50 FA_FPR FJ_DBAR Hình 3.2 Thời gian thực thuật toán FA-FPR FJ_DBAR 3.4.2 Thử nghiệm Thử nghiệm tiến hành để đánh giá khả phân lớp tập rút gọn thu thuật toán nói Để thực đánh giá, học viên sử dụng độ xác phân lớp (Classification Accuracy) qua thuật toán phân lớp C4.5 (J48) WEKA [https://sourceforge.net/projects/weka/] Sử dụng phương pháp k-fold cross-validation để đánh giá độ xác phân lớp 38 Hình 3.3 Phương pháp k-fold Cross validation (với k=10) (Nguồn: Trang web https://codesachin.wordpress.com/2015/08/30/cross-validationand-the-bias-variance-tradeoff-for-dummies/) Ở đây, học viên chọn giá trị phổ biến k 10, nghĩa bảng định chia thành 10 phần nhau, lấy phần làm tập huấn luyện (training set) phần lại làm tập kiểm tra (testing set) Kết thử nghiệm tả bảng 3.3 Dấu “x” thể thuật toán không tìm tập rút gọn, hay tập rút gọn tìm trùng với tập thuộc tính điều kiện ban đầu 39 Bảng 3.3 Độ xác phân lớp C4.5 FA-FPR FJ_DBAR FA-FPR Độ FJ_DBAR xác phân Độ lớp C4.5 TT Bộ số liệu U C bảng R authentication R xác phân lớp C4.5 (%) (%) (%) Banknote xác phân lớp C4.5 định gốc Độ chính 1372 98.8338 x 55.5394 Wine recognition 178 13 39.8876 13 x 13 x Image Segmentation 2100 19 96.1905 15 92.3256 18 96 wdbc 569 30 93.6731 22 81.1565 30 x Ionosphere 351 34 90.8832 24 88.8682 17 87.4644 208 60 71.6346 20 57.4351 58 65.6626 Sonar, mines vs rocks Độ xác phân lớp trung bình 81.8505 79.9464 72.2537 Nhận xét: Nhìn chung, liệu thử nghiệm, hai thuật toán FA-FPR FJ_DBAR cho tập rút gọn có độ xác phân lớp gần tương đương Đối với tập liệu “Banknote authentication”, thuật toán FJ_DBAR cho tập rút gọn có độ xác phân lớp nhiều so với tập mẫu (55.5394% 98.8338%) Tuy nhiên, việc đánh giá độ xác phân lớp thuật toán rút gọn thực nghiệm cần số lượng tập mẫu lớn nhiều sử dụng nhiều phương pháp đánh giá khác 40 Hình 3.4 biểu đồ so sánh độ xác phân lớp hai thuật toán 100 90 80 70 60 50 40 30 20 10 Tập gốc FA_FPR FJ_DBAR Hình 3.4 Độ xác phân lớp C4.5 thuật toán FA-FPR FJ_DBAR Như vậy, kết thực nghiệm số liệu mẫu cho thấy theo tiêu chí tập rút gọn hai thuật toán tương đương nhau; theo tiêu chí độ xác phân lớp thuật toán FA-FPR cho kết tốt chút so thuật toán sử dụng FJ_DBAR; theo tiêu chí thời gian thực thuật toán FJ_DBAR lại tỏ nhanh so với FA-FPR 41 KẾT LUẬN Những kết đạt luận văn Luận văn giải toán rút gọn thuộc tính trực tiếp bảng định theo tiếp cận tập thô mờ với nội dung chính: Tổng hợp nghiên cứu liên quan đến rút gọn thuộc tính theo tiếp cận tập thô mờ; xây dựng phương pháp rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ thử nghiệm tính hiệu phương pháp số liệu mẫu Hướng phát triển luận văn Đối với toán rút gọn thuộc tính, sinh luật định theo tiếp cận tập thô mờ, việc cải tiến phương pháp có, đề xuất phương pháp mở rộng ứng dụng nhà nghiên cứu quan tâm xây dựng Luận văn đạt số kết nêu trên, nhiều hạn chế điều kiện mặt thời gian phạm vi nghiên cứu đề tài Hướng nghiên cứu luận văn nghiên cứu phương pháp rút gọn thuộc tính sử dụng khoảng cách mờ khác, sau tìm hiểu mối liên hệ tập rút gọn Từ đó, hoàn thiện việc phân loại so sánh phương pháp rút gọn thuộc tính bảng định có miền giá trị thực theo tiếp cận tập thô mờ 42 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Nguyễn Long Giang (2012), “Nghiên cứu số phương pháp khai phá liệu theo tiếp cận lý thuyết tập thô”, Luận án Tiến sĩ Toán học, Viện Công nghệ thông tin – Viện Hàn lâm Khoa Học Công nghệ Việt Nam [2] Nguyễn Quang Huy, Nguyễn Long Giang, Cao Chính Nghĩa, Tân Hạnh, Phạm Văn Dũng (10/2016), “Một phương pháp sinh luật định bảng định mờ sử dụng khoảng cách mờ”, Hội thảo quốc gia lần thứ IXX, Một số vấn đề chọn lọc công nghệ thông tin truyền thông Tiếng Anh: [3] D Dubois, and H Prade (1990), “Rough fuzzy sets and fuzzy rough sets”, International Journal of General Systems, 17, pp 191-209 [4] D Dubois and H Prade (1992), “Putting rough sets and fuzzy sets together”, Intelligent Decision Support, Kluwer Academic Publishers,Dordrecht [5] L A Zadeh (1965), “Fuzzy sets”, Information and Control, 8:338-353 [6] Pawlak Z., “Rough sets”, International Journal of Computer and Information Sciences, 11(5), 1982, pp 341-356 [7] X Zhang, C Mei, D Chen and J Li (2016), “Feature selection in mixed data: A method using a novel fuzzy rough set-based information entropy”, Pattern Recognition, 56, 1-15 [8] Q Shen, R Jensen (2002), “Fuzzy-rough sets for descriptive dimensionality reduction”, Proceedings of the 2002 IEEE International Conference on (Vol 1, pp 29-34), IEEE 43 [9] Shyi-Ming Chen, Shao-Hua Lee & ChiaHoang Lee (2010), “A new method for generating fuzzy rules from numerical data for handling classification problems”, Applied Artificial Intelligence: An International Journal [10] Yi Cheng (2015), Forward approximation and backward approximation in fuzzy rough sets, Neurocomputing, Volume 148, pp 340-353 [11] The UCI machine learning repository, http://archive.ics.uci.edu/ml/datasets.html [12] Nguyen, Long Giang (2012), “Metric based attribute reduction in decision tables”, In Computer Science and Information Systems (FedCSIS), 2012 Federated Conference on (pp 311-316), IEEE) [13] Y Qian, Y Li, J Liang, G.Lin and C.Dang (2015), “Fuzzy granular structure distance”, IEEE Transactions on Fuzzy Systems, 23(6), 2245-2259 [14] Qian, Y., Wang, Q., Cheng, H., Liang, J., and Dang, C (2015), Fuzzy-rough feature selection accelerator, Fuzzy Sets and Systems, 258, 61-78 [15] Dai, J., and Xu, Q (2013), Attribute selection based on information gain ratio in fuzzy rough set theory with application to tumor classification, Applied Soft Computing, 13(1), 211-221 [16] https://codesachin.wordpress.com/2015/08/30/cross-validation-and-the-biasvariance-tradeoff-for-dummies/, truy cập ngày 20/05/2017 ... thuyết tập thô, tập mờ tập thô mờ  Chương Rút gọn thuộc tính bảng định sử dụng độ đo khoảng cách mờ Sử dụng độ đo khoảng cách mờ theo tiếp cận tập thô mờ, khoảng cách Jaccard mờ, dùng để rút gọn thuộc. .. nghiên cứu rút gọn thuộc tính theo tiếp cận tập thô truyền thống 21 CHƯƠNG 2: RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH SỬ DỤNG ĐỘ ĐO KHOẢNG CÁCH MỜ Đối với toán tìm tập rút gọn bảng định có miền... thuyết tập thô xem công cụ hiệu để giải toán rút gọn thuộc tính cộng đồng nghiên cứu tập thô thực lâu Mục tiêu rút gọn thuộc tính bảng định theo tiếp cận tập thô sử dụng công cụ tập thô để tìm tập

Ngày đăng: 23/10/2017, 12:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w