Về phương pháp rút gọn thuộc tính trong bảng quyết định với miền trị thuộc tính nhận giá trị số theo tiếp cận tập thô mờ

10 56 0
Về phương pháp rút gọn thuộc tính trong bảng quyết định với miền trị thuộc tính nhận giá trị số theo tiếp cận tập thô mờ

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết trình bày các nội dung chính sau: Rút gọn thuộc tính trong bảng quyết định với miền trị thuộc tính nhận giá trị số, phương pháp rút gọn thuộc tính trong bảng quyết định với miền trị thuộc tính nhận giá trị số theo tiếp cận tập thô mờ.

Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 16 (36), tháng 12/2016 Về phƣơng pháp rút gọn thuộc tính bảng định với miền trị thuộc tính nhận giá trị số theo tiếp cận tập thô mờ Fuzzy Rough Set based Attribute Reduction in Numeric Domain Decision Tables Nguyễn Văn Thiện, Nguyễn Long Giang, Nguyễn Nhƣ Sơn Abstract: Attributes reduction based on rough set is interesting research area However, the attributes reduction algorithms based on rough set is done on the discrete domain decision tables (that is applied discretization methods) In recent years, some researchs on fuzzy rough set based directly attribute reduction in numeric domain decision tables have been studied This paper proposes fuzzy rough set based directly attribute reduction method in numeric domain decision tables The experiment results showed that the fuzzy rough set method has better classification accuracy than rough set theory Keywords: rough set, fuzzy rough set, decision table, fuzzy similarity relation, attribute reduction, reduct I GIỚI THIỆU Rút gọn thuộ t h i t u t ọ g ước tiền xử ý số liệu với mụ tiêu ại bỏ thuộ t h dư thừa nhằm â g t h hiệu thuật t kh i ph liệu Lý thuyết tập thô [13] ô g ụ hiệu giải i t út gọn thuộc t h t g ảng đị h v cộ g đồ g ghiê cứu tập thô thực hiệ âu y Để thực hiệ phươ g ph p út gọn thuộ t h the tiếp cận tập thô, thuộ t h ó miền gi t ị số, iê tục cầ rời rạ hó Tuy hiê , phươ g ph p ời rạ hó liệu khơ g ả t kh h u đầu gi t ị thuộ t h V dụ, với thuộ t h “Nhiệt độ thể”, giả sử h i đối tượng x v y ó hiệt độ thể tươ g ứ g 39.5 độ v 39.6 độ rời rạ hó th h gi t ị “Nhiệt độ cao” T ê ảng định mới, h i đối tượng x v y ó gi t ị bằ g h u t ê thuộ t h "Nhiệt độ thể” v khô g ả t kh h u 0.1 độ t ê ảng đị h đầu D đó, phươ g ph p ời rạ hó liệu khô g ảo t “ gữ ghĩ ” liệu gố v ó thể m giảm độ h h x phâ ớp t ê liệu gố Để giải i t út gọn thuộ t h t ực tiếp t ê ảng đị h ó miền trị thuộ t h hậ gi t ị số, iê tục nhằm khắc phụ hượ điểm t ê , t g ăm gầ g t ì h ghiê ứu đề xuất hướng tiếp cận sử dụ g ý thuyết tập thô mờ Lý thuyết tập thô mờ (Fuzzy Rough Set) D Du is v ộng [4, 5] đề xuất mở hướng ghiê ứu út gọn thuộ t h t ê ảng định mờ v ảng đị h ó miền trị thuộ t h nhậ gi t ị số, iê tục Lý thuyết tập thô mờ kết hợp củ ý thuyết tập thô [13] v ý thuyết tập mờ [11] nhằm xấp xỉ tập mờ dự t ê quan hệ tươ g tự (simi ity e ti ) đượ x định t ê miề gi t ị thuộ t h T g ý thuyết tập thô, h i đối tượ g tươ g đươ g t ê tập thuộ t h R, h y độ tươ g tự 1, ếu gi t ị thuộ t h ủ hú g bằ g h u t ê tất thuộ t h t g R Ngược lại, hú g khô g tươ g đươ g, h y độ tươ g tự T g ý thuyết tập thô mờ, quan hệ tươ g tự thay quan hệ tươ g đươ g hằm x đị h độ tươ g tự h i đối tượ g Độ tươ g tự gi t ị nằm khoảng [0, 1] cho thấy t h gầ h u, h y t h tươ g - 40 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT tự, củ h i đối tượ g C ghiê ứu iê u đến út gọn thuộ t h the tiếp cận tập thô mờ tập trung v h i hướ g h h: hướng thứ sử dụng tập thô mờ để giải i t út gọn thuộ t h t ê ảng định mờ (bảng định với gi t ị thuộ t h tập mờ) t ước thực hiệ thuật t t h ọc hệ luật mờ với g ố điể hì h [6, 7, 8, 15, 18, 19, 20, 24]; hướng thứ hai giải i t út gọn thuộ t h t ực tiếp t ê ảng đị h ó miền trị thuộ t h nhậ gi t ị số, hướ g ghiê ứu củ i y The hướng tiếp cậ út gọn thuộ t h t ực tiếp tê ảng đị h ó miền trị thuộ t h nhận gi t ị số, t ước hết quan hệ tươ g tự đượ định ghĩ t ê miề gi t ị thuộ t h Tiếp the , m trận quan hệ đượ xây dựng Ma trận quan hệ cho phép x định gi t ị h m thuộc củ đối tượ g lớp tươ g tự mờ Từ đó, h m thuộc củ tập xấp xỉ mờ, xấp xỉ t ê mờ, miề dươ g mờ đượ t h dự v t tử xấp xỉ t g ý thuyết tập thô mờ [4, 5] T ê sở đó, phươ g ph p út gọn thuộ t h đượ xây dựng dự t ê ền tảng mở rộng phươ g ph p út gọn thuộ t h the tiếp cận tập thô t uyền thố g Đó g góp u t ọng hướng ghiê ứu y phải kể đế g t ì h [1, 2, 3, 21, 22, 23, 25] T g ô g t ì h y, t giả xây dựng ma trận phâ iệt mờ dự t ê m t ận quan hệ v đề xuất thuật t tìm tất tập út gọn h mở rộ g phươ g ph p út gọn thuộ t h dự t ê ma trậ phâ iệt t g ý thuyết tập thô t uyền thống Tuy hiê , t giả hư ô g ố thuật t heuristic tìm tập út gọn tốt dự t ê tiêu chuẩn chất ượ g phâ ớp h y độ quan trọng thuộ t h T g g t ì h [8, 17], t giả xây dự g phươ g ph p út gọn thuộ t h dự t ê entropy Shannon C t giả t g [8, 17] ũ g mi h chứng thực nghiệm rằ g, phươ g ph p út gọn thuộ t h the tiếp cận tập thô mờ ó độ h h x phâ ớp tốt hơ phươ g ph p út gọn theo tiếp cậ ý thuyết tập thơ t uyền thống (sau rời rạ hó liệu) t ê số liệu thử nghiệm Tập V-2, Số 16 (36), tháng 12/2016 T g i y, hú g đề xuất thuật t heu isti út gọn thuộ t h t g ảng đị h ó miền trị thuộ t h nhậ gi t ị số sử dụ g độ phụ thuộc mờ thuộ t h t g tập thô mờ Thuật t đề xuất tìm tập út gọn tốt the tiêu huẩn chất ượng phâ ớp (độ quan trọng thuộ t h), d hiệu hơ g ố [1, 2, 3, 21, 22, 23, 25] Do sử dụ g độ phụ thuộc mờ củ thuộ t h ê thuật t đề xuất ó khối ượ g t h t hỏ hơ thuật t t g [8, 17] sử dụ g ô g thức entropy Shannon mờ Kết thử nghiệm t ê số số liệu cho thấy, phươ g ph p đề xuất ó độ h h x phâ ớp tốt hơ s với phươ g ph p sử dụ g độ phụ thuộc thuộ t h the tiếp cậ ý thuyết tập thô truyền thố g Hơ ữ , phươ g ph p đề xuất ó độ h h x phâ ớp tốt hơ phươ g ph p dự t ê entropy Shannon mờ [8, 17] Cấu t ú i hư s u Phầ t ì h y số kh i iệm ản t g ý thuyết tập thơ mờ Phầ t ì h y phươ g ph p út gọn thuộ t h sử dụ g độ phụ thuộc mờ thuộ t h the tiếp cận tập thơ mờ Phần t ì h y kết thử nghiệm Cuối ù g kết luậ v hướng ph t t iển II CÁC KHÁI NIỆM CƠ BẢN Phầ y t ì h y số kh i iệm ả t g ý thuyết tập thô t uyề thố g ủ P w k [13] v ý thuyết tập thô mờ d D Du is v ộ g [4, 5] đề xuất Mơ hì h tập thơ t uyền thố g d P w k [13] đề xuất dự t ê u hệ tươ g đươ g để xấp xỉ tập hợp Xét ảng định DS  U , C  D  , Mỗi tập thuộc t h PC x định quan hệ tươ g đươ g   IND  P    u, v  U U a  P, a u   a  v  u, v   IND  P  u v v khơ g phâ thuộ t h t đối tượng  iệt g P Ký hiệu lớp tươ g đươ g u  u P , u P  v U u, v   IND  P   Nếu  Với X  U , tập  CX  u U u C  X v CX  u U u C  X   tươ g - 41 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT ứng gọi C-xấp xỉ dưới, C-xấp xỉ X Ta gọi tập POSC ( D)   CX  C-miền dương D Dễ X U / D thấy POSC ( D) tập đối tượng U đượ phâ với  x  y   R  x, y  , tập mờ xấp xỉ R R  F  v tập mờ xấp xỉ t ê với S h v t U t v C Nếu  k  , D phụ thuộ ộ phậ C Tiếp the , hú g tơi t ì h y kh i iệm t ê g ý thuyết tập thô mờ t g [4, 5] T g mơ hì h tập thô mờ, u (similarity relation) đượ sử dụ g th y tươ g đươ g để xấp xỉ tập mờ Cho đối tượ g, u hệ R đượ đị h ghĩ gọi u hệ tươ g tự ếu R thỏ mã hệ tươ g tự u hệ U tập t ê U đượ t h hất: xạ ( ef exive) R  x, x   , t h đối xứ g (symetric) R  x, y   R  y, x  v t h ắ ầu sup-min (sup-min transitive) R  x, z   R  x, y  , R  y, z  ) với x, y, z U Qu hệ tươ g tự R x đị h phâ h h mờ t ê U, ký hiệu U / R   x R x U  ,  x R yU ớp tươ g đươ g mờ tươ g ứ g với đối tượ g x, h m thuộ đượ x đị h ởi ô g thứ  x  y   R  x, y   R  x, y  với y U Giả sử F tập mờ v R u hệ tươ g tự x đị h t ê U, tập mờ xấp xỉ R  F  v thuộ ủ đối tượ g x U đượ x  R F   x   sup  x  y  ,  F  y  yU tập mờ v h m đị h hư s u: R F   x   inf max 1  R  x, y  , F  y   yU R F   x   sup  R  x, y  , F  y   hư  (3) R  (4) tập thô mờ Dễ thấy ằ g tập hợp (tập õ) ất kỳ X  U ó thể xem tập mờ, h m thuộ  X  y   với y  X v  X  y   với y  X Mơ hì h tập thơ mờ ó thể xem việ sử dụ g u hệ tươ g tự để xấp xỉ tập mờ (h ặ tập õ) ằ g tập mờ xấp xỉ v tập mờ xấp xỉ t ê Ch ả g uyết đị h ó miề t ị thuộ t h hậ gi t ị số DS  U , C  D  với U  u1, , un , C  c1, , cm  Giả sử u x đị h t ê miề gi t ị ủ c  C T ký hiệu ck u hệ tươ g tự R ất kỳ thuộ t h điều kiệ hệ R x đị h t ê thuộ t h điều kiệ ck  C, k  m Khi đó, kh i iệm miề dươ g POSC  D  t g ý thuyết tập thô t uyề thố g đượ mở ộ g th h kh i iệm miề dươ g mờ ủ tập thuộ t h D tập thuộ t h C dự t ê u hệ R, ký hiệu POSC  D  POSC  D  tập mờ m h m thuộ s u [18] POS R tập mờ xấp xỉ t ê R  F  ủ F R Cặp  R  F  , R  F   đượ gọi POSC  D  ự ượ g ủ tập S Nếu k =1 D phụ thuộ t h phả  R F   x   inf max   x  y  , F  y  hư s u: k   C  D  R  F  đượ viết ại sau: lớp đú g v ớp U / D sử dụng tập thuộ t h C Độ phụ thuộc tập thuộ t h C v tập thuộ t h D t g ý thuyết tập thô t uyền thố g, ký hiệu  C  D , đượ đị h ghĩ Tập V-2, Số 16 (36), tháng 12/2016 C ủ  D đối tượ g x U đượ đị h ghĩ  x  sup C  X   x  (5) X U / D Dự t ê kh i iệm miề dươ g mờ, độ phụ thuộ ủ tập thuộ t h điều kiệ C v tập thuộ t h uyết đị h D dự t ê u hệ R đượ đị h ghĩ the tiếp ậ tập thô mờ hư s u [18] (1)  C  D  (2) yU tê - 42 - POS C  D U  x   xU POS  D   x   C (6) U The hướ g tiếp ậ út gọ thuộ t h t ự tiếp ả g uyết đị h thuộ t h số, m t ậ u Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT hệ x đị h t ê thuộ t h ck đượ đị h ghĩ m t ậ vuô g ấp n hư s u [21]   M ck  mijck    nn với mijc  ck  ui , u j  , i  n, j  n Ở đây, ck  ui , u j  k gi t ị ủ u hệ giữ hai đối tượ g ui v u j Khi đó, m t ậ u hệ mờ x đị h t ê tập thuộ t h điều kiệ C đượ đị h ghĩ [21]   M C  mijC    nn    với mijC  mijc  mijc , mijc , , mijc k k 1 m m Dễ thấy ằ g, với phầ tử mijC t ó    ủ m tậ M C mijC  C  ui , u j  , i  n, j  n , C  ui , u j   C  ui , u j   ui   u j  Từ m t ậ với h phép x ui C  C i1 đị h đượ C i1 m m   u1 un   M C C ớp tươ g đươ g mờ thuộ phâ U / C  ui C ui U  Khi đó, h m thuộ h h ủ mờ tập mờ xấp xỉ dưới, tập mờ xấp xỉ t ê , miề dươ g mờ thể đượ t h dự v ô g thứ (3), (4), (5) tươ ứ g v từ t h đượ độ phụ thuộ ủ tập thuộ t điều kiệ C v tập thuộ t h uyết đị h D the thứ (6) ó g h g Tập V-2, Số 16 (36), tháng 12/2016 giả t g [8] ũ g xây dự g thuật t heu isti tìm tập út gọ tốt hất dự t ê ượ g thô g ti tă g thêm mờ T g ả h i g t ì h [8, 17], t giả g mi h ằ g thự ghiệm ằ g út gọ thuộ t h the tiếp ậ thơ mờ ó độ h h x phâ ớp tốt hơ út gọ thuộ t h the tiếp ậ ý thuyết tập thô t uyề thố g Tuy hiê , hượ điểm ủ h i phươ g ph p y sử dụ g ô g thứ e t py Sh để xây dự g đị h ghĩ tập út gọ , d thời gi thự hiệ hiệu uả d phải t h t iểu thứ g it T g i y, hú g sử dụ g độ phụ thuộ mờ ủ thuộ t h th y h độ đ e t py Sh để đị h ghĩ tập út gọ v xây dự g thuật t heu isti tìm tập út gọ tốt hất Vì độ phụ thuộ mờ ủ thuộ t h khô g phải t h t iểu thứ g it ê hiệu uả hơ phươ g ph p dự t ê e t py Sh t g [8, 17] Chú g ũ g g mi h ằ g thự ghiệm ằ g phươ g ph p đề xuất ó độ h h x phâ ớp hơ phươ g ph p dự t ê e t py Sh t g [8, 17] Tươ g tự phươ g ph p út gọ thuộ t h t g ý thuyết tập thô t uyề thố g, phươ g ph p đề xuất gồm ướ : đị h ghĩ tập út gọ dự t ê độ phụ thuộ mờ ủ thuộ t h, đị h ghĩ độ u t ọ g ủ thuộ t h đặ t g h hất ượ g phâ ớp ủ thuộ t h v xây dự g thuật t heu isti tìm tập út gọ tốt hất dự t ê tiêu huẩ độ u t ọ g ủ thuộ t h Định nghĩa Cho bảng định DS  U ,C  D  ó III RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH VỚI MIỀN TRỊ THUỘC TÍNH NHẬN GIÁ TRỊ SỐ Như t ì h y phầ I, t ê ớp i t út gọ thuộ t h t ự tiếp t ê ả g uyết đị h với miề t ị thuộ t h hậ gi t ị số the hướ g tiếp ậ heuristic sử dụ g tập thơ mờ, t g g t ì h [17], t giả đị h ghĩ tập út gọ dự t ê e t py Sh mờ v xây dự g thuật t heu isti tìm tập út gọ tốt hất dự t ê e t py Sh mờ T g g t ì h [8], t giả đị h ghĩ tập út gọ dư t ê độ đ ượ g thô g ti tă g thêm mờ (fuzzy information gain) Lượ g thô g ti tă g thêm mờ đượ xây dự g dự t ê e t py Sh mờ C t miề t ị thuộ t h hậ gi t ị số , u hệ tươ g tự R đượ x đị h t ê miề gi t ị ủ thuộ t h Với P  C , 1)  P ( D)   C ( D) 2) p  P,  P p ( D)   C ( D)   P tập út gọ mờ ủ thuộ t h ủ C dự t ê độ phụ thuộ Từ Đị h ghĩ 1, dễ thấy ằ g tập út gọ dự t ê độ phụ thuộ mờ ủ thuộ t h tươ g đươ g với tập út gọ dự t ê miề dươ g mờ, tập út gọ dự t ê - 43 - Các công trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 16 (36), tháng 12/2016 miề dươ g mờ mở ộ g tập út gọ dự t ê miề dươ g ủ P w k the tiếp ậ ý thuyết tập thơ mờ Ví dụ Xét ả g uyết đị h ó miề gi t ị thuộ t h số DS  U , C  d  h Bả g với Định nghĩa Cho bảng định DS  U , C  D  ó U  u1 , u2 , u3 , u4 , u5 , u6  , C  c1 , c2 , c3 , c4 , c5 , c6  miề gi t ị thuộ t h số v u hệ tươ g tự R x đị h t ê miề gi t ị thuộ t h Với B  C , độ u t ọ g mờ ủ thuộ t h b  C  B tập thuộ t h B đượ đị h ghĩ : SIGB  b    Bb  D    B  D  Độ u ượ g phâ uyết đị h thuộ t h t ọ g ủ thuộ t h đặ t g h ớp ủ thuộ t h điều kiệ v thuộ v đượ sử dụ g m tiêu huẩ ự h thuật t heu isti tìm tập út gọ Bảng Bảng định mơ tả Ví dụ (7) hất t h họ s u Thuật toán F_RSAR (Fuzzy Rough Set based Attribute Reduction) Thuật t heu isti tìm tập út gọ sử dụ g độ phụ thuộ mờ ủ thuộ t h Đầu vào: Bả g uyết đị h gi t ị thuộ t h số DS  U , C  D  , u hệ tươ g tự R đượ x P   ;    D   ; T h m t ậ u   hệ M C ; c2 c3 c4 c5 c6 d u1 0.8 0.2 0.6 0.4 No u2 0.8 0.2 0.6 0.2 0.8 Yes u3 0.6 0.4 0.8 0.2 0.6 0.4 No u4 0.4 0.6 0.4 Yes u5 0.6 0.6 0.4 Yes u6 0.6 1 No Giả sử t ê miề gi t ị ủ thuộ t h ck  C , quan hệ tươ g tự ck đượ đị h ghĩ hư s u [8]  ck  ui   ck  u j  1  * , ck (ui , u j )   max(ck )  min(ck )  0, otherwise ck  ui   ck  u j  max(ck )  min(ck ) Với max  ck  ,  ck  tươ g ứ g đị h t ê miề gi t ị thuộ t h Đầu ra: Một tập út gọ tốt hất P c1  0.25 (8) gi t ị hất v gi t ị hỏ hất ủ miề gi t ị thuộ t h ck Áp dụ g ướ ủ Thuật t F_RSAR tìm tập út gọ ủ ả g uyết đị h T ướ hết, t h m t ậ u hệ t ê thuộ t h điều kiệ M  c1  ,         1 0  0 M (C )   0 0  0 0 0   T h  C  D  ; M c2 , M c3 , M c4 , M c5 , M c6 Từ đó, t h m While  P  D    C  D  tậ M C :   Begin For c  C  P t h SIGP  c    Pc  D    P  D  ; Chọ cm  C  P cho SIGP  cm   Max SIGP  c  ; cC  P P  P  cm  ; 10 T h  P  D ; 11 End; 12 Return P; T ó 0 0 0 0 0 0  0  0 0  1 0 0 U / d   u1 , u3 , u6  , u2 , u4 , u5  X  u1 , u3 , u6  , xấp xỉ mờ C  X  tập mờ với ủ x U t h ởi h m thuộ  Cu ,u ,u   x   inf max   x  y  , u ,u ,u   y  - 44 - yU C Xét  Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT   Từ m t ậ M C t hất ủ C u ,u ,u   u1   inf 1,1,1,1,1,1  , tươ g  6 D tự thuật t ó 0 0       u1 u2 u3 u4 u5 u6 u1 C t ó Cu ,u ,u   u3   , Cu ,u ,u   u2   , 6 Cu ,u ,u   u4   , Cu ,u ,u   u5   , Cu ,u ,u   u6   , Cu ,u ,u   u1   , Cu ,u ,u   u2   , Cu ,u ,u   u3   , Cu ,u ,u   u4   Cu ,u ,u   u5   , 2 6 4 5 5 Cu ,u ,u   u6   Từ đó, h m thuộ dươ g mờ ủ đối tượ g miề POSC d   :  POS d   u1   sup Cu ,u ,u   u1  , Cu ,u ,u   u1   , C POS d   u2   , POS d   u3   , POS d   u4   , C C C POS d   u5   , POS d   u6   C Từ đó: C  C d   Áp dụ g c c ướ ủ Thuật t d   0.167 ,  d   , d   0.5 ,  d   0.467 , c2 c5 Chọ thuộ t h c4 ó độ u F_RSAR t c c ó d   0.167 , d   0.467 tọ g hất v P  c4  Thự hiệ vò g ặp Whi e Xét thuộ t h c1 t ó: SIGc  c1    c ,c d    c d    0.5  0.5 Tươ g tự 4 SIGc  c2   0.5 , SIGc  c3   , SIGc  c5   0.5 , 4 SIGc c6   0.5 Khô g t h tổ g u t, họ thuộ t h c1 ó độ P  c1, c4  Khi t Tập V-2, Số 16 (36), tháng 12/2016 u tọ g ó  c ,c dừ g v P  c1, c4  tập út gọ tốt ả g uyết đị h DS Thuật t F_RSAR tìm đượ tập út gọ ủ ả g uyết đị h dự t ê độ u t ọ g ủ thuộ t h (đặ t g h hất ượ g phâ ớp ủ thuộ t h) ê hiệu uả hơ thuật t tìm tất ả tập út gọ the hướ g tiếp ậ m t ậ phâ iệt t g g t ì h [1, 2, 3, 21, 22, 23, 25] Thuật t F_RSAR sử dụ g độ phụ thuộ ủ thuộ t h để tìm tập út gọ , d ó khối ượ g t h t hỏ hơ thuật t the hướ g tiếp ậ e t py Sh t g [8, 17] Dễ thấy ằ g, tập út gọ thu đượ ủ Thuật t F_RSAR ả t miề dươ g mờ Phầ tiếp the , hú g tiế h h thử ghiệm phươ g ph p đề xuất t ê số ộ iệu thử ghiệm để m õ h i vấ đề s u: 1) T h hiệu uả ủ hướ g tiếp ậ tập thô mờ s với hướ g tiếp ậ tập thô t uyề thố g độ h h x phâ ớp s u út gọ thuộ t h; 2) T h hiệu uả ủ thuật t đề xuất với thuật t t g g t ì h [8] độ h h x phâ ớp VI KẾT QUẢ THỰC NGHIỆM Chú g họ ộ iệu mẫu từ từ kh iệu UCI [26] ó miề t ị thuộ t h hậ gi t ị số h Bả g để tiế h h thử ghiệm Môi t ườ g thử ghiệm m y t h PC với ấu hì h Pe tium du e 2.13 GHz CPU, 1GB ộ hớ RAM, sử dụ g hệ điều h h Wi d ws Bảng Bộ số liệu thử nghiệm TT Bộ liệu Ecoli Ionosphere Wdbc Wpbc Wine Glass Magic04 Page-blocks Số thuộc tính điều kiện 34 30 33 13 10 10 Số đối tƣợng 336 351 569 198 178 214 19020 5473 hất v d     d  , C T ướ hết, hú g tiế h h thử ghiệm hằm đ h gi độ h h x phâ ớp t ê ộ số iệu - 45 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT mẫu s u thự hiệ thuật t F_RSAR v thuật t út gọ thuộ t h sử dụ g độ phụ thuộ ủ thuộ t h t g ý thuyết tập thô t uyề thố g (gọi tắt thuật t RSAR) Để tiế h h thử ghiệm, hú g thự hiệ ô g việ s u: - C i đặt thuật t ời hó iệu ằ g phươ g ph p e u -width [12], thuật t RSAR, thuật t F_RSAR sử dụ g u hệ tươ g tự t g [8], thuật t phâ ớp SVM [9], C4.5 [10] ằ g ô g ụ J v - Thự hiệ thuật t ời hó equal-width v thuật t RSAR để tìm tập út gọ the tiếp ậ tập thô - Thự hiệ thuật t F_RSAR để tìm tập út gọ t ự tiếp từ ả g uyết đị h đầu the tiếp ậ tập thô mờ sử dụ g u hệ tươ g tự g thứ (8) g t ì h [8] - T ê ả g uyết đị h thu đượ ủ h i h tiếp ậ , họ 2/3 đối tượ g đầu tiê để m tập huấ uyệ (t i i g), 1/3 đối tượ g ò ại m tập kiểm t (test) Thự hiệ thuật t SVM, C4.5 t ê tập huấ uyệ v đ h gi độ h h x phâ ớp t ê tập kiểm t Từ đó, đ h gi độ h h x phâ ớp ủ h i h tiếp ậ Bả g kết uả thử ghiệm t ê ộ số iệu đượ họ với U số đối tượ g, C số thuộ t h điều kiệ , R số thuộ t h ủ tập út gọ Tập V-2, Số 16 (36), tháng 12/2016 Bảng Kết thử nghiệm rút gọn thuộc tính theo tiếp cận tập thô tập thô mờ T T S Bộ số U Rút gọn thuộc tính Rút gọn thuộc tính theo theo tiếp cận tập thô tiếp cận tập thô mờ (RSAR) (F_RSAR) R C liệu Độ Độ chính R Độ Độ chính xác xác xác xác phân phân phân phân lớp lớp lớp lớp SVM C4.5 SVM C4.5 Ecoli 336 50.851 0.819 0.865 0.855 Ionos 351 10.814 0.802 15 0.937 0.915 80.795 0.784 19 0.980 0.975 70.718 0.704 19 0.825 0.818 40.814 0.802 10 0.955 0.920 phere Wdbc 569 0 Wpbc 198 Wine 178 Glass 214 50.815 0.795 0.891 0.882 Magic 190 40.745 0.715 0.782 0.765 04 20 Page- 547 50.758 0.725 0.865 0.855 blocks 0 Từ Bả g v Hì h t thấy, tập út gọ ủ F_RSAR hiều thuộ t h hơ RSAR Độ h h x phâ ớp s u út gọ thuộ t h the tiếp ậ tập thô mờ (F_RSAR) hơ độ h h x phâ ớp the tiếp ậ tập thô t uyề thố g (RSAR) Tiếp the , hú g tiế h h thử ghiệm để đ h gi thuật t đề xuất (F_RSAR) với thuật t tìm tập út gọ the tiếp ậ tập thô mờ sử dụ g ượ g thô g ti tă g thêm (i f m ti g i ) dự t ê e t py Sh , gọi thuật t GAIN_RATIO_AS_FRS [8] Để tiế h h thử ghiệm, hú g i đặt thuật t GAIN_RATIO_AS_FRS [8] v thuật t F_RSAR Cả h i thuật t dù g u hệ tươ g tự ô g thức (8) ô g t ì h [8] Chạy 02 thuật t t ê ộ iệu thử ghiệm Kết uả thử ghiệm h Bả g Hình Độ xác phân lớp F_RSAR RSAR - 46 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Bảng Kết thử nghiệm thuật toán GAIN_RATIO_AS_FRS thuật toán F_RSAR Thuật toán V KẾT LUẬN Thuật toán F_RSAR GAIN_RATIO_AS_FR S S T T Bộ số liệu U C R R Độ Độ Độ Độ chính chính xác xác xác xác phân phân phân phân lớp lớp lớp lớp SVM C4.5 SVM C4.5 Ecoli 336 0.814 0.802 0.865 0.855 Ionosp 351 34 13 0.916 0.904 15 0.937 0.915 here Wdbc 569 30 17 0.925 0.917 19 0.980 0.975 Wpbc 198 33 17 0.815 0.804 19 0.825 0.818 Wine 178 13 0.910 0.902 10 0.955 0.920 Glass 214 0.891 0.882 0.891 0.882 Magic 1902 04 10 0.782 0.765 0.782 0.765 10 0.852 0.848 0.865 0.855 Pageblocks 5473 Tập V-2, Số 16 (36), tháng 12/2016 Mơ hì h tập thơ mờ D Du is v ộng [4, 5] đề xuất ô g ụ hiệu để giải i t út gọn thuộ t h t ực tiếp t ê ảng đị h ó miền trị thuộ t h nhậ gi t ị số T g i y, hú g đề xuất thuật t heu isti tìm tập út gọn bảng đị h ó miền trị thuộ t h nhậ gi t ị số sử dụ g độ phụ thuộc mờ thuộc t h the tiếp cận tập thô mờ Độ phụ thuộc mờ thuộ t h đượ x định dựa t ê m t ận quan hệ sinh quan hệ tươ g tự x đị h t ê miề gi t ị thuộ t h Thực nghiệm t ê ộ số liệu UCI cho thấy, độ h h x phâ ớp tập liệu sau thực hiệ phươ g ph p đề xuất hơ độ h h x phâ ớp sau thực hiệ út gọn thuộ t h the tiếp cận tập thô truyền thống Hơ ữ , phươ g ph p đề xuất ó độ h h x phâ ớp hơ phươ g ph p tiếp cận dự t ê e t py Sh t g g t ì h [8] Mặt kh , phươ g ph p đề xuất khô g phải t h ô g thức logarit củ e t py Sh ê thời gian thực hiệu hơ phươ g ph p t g [8] Về đị h hướ g ghiê ứu tiếp theo, thứ tìm kiếm độ đ hiệu để giải i t út gọn thuộ t h the tiếp cận tập thô mờ nhằm â g độ h h x phâ ớp, thứ h i tìm kiếm u hệ tươ g tự kh hằm â g độ h h x phâ ớp s u út gọn thuộ t h TÀI LIỆU THAM KHẢO Hình Độ xác phân lớp GAIN_RATIO_AS_FRS F_RSAR Từ Bả g v Hì h t thấy, t ê ù g u hệ tươ g tự đượ sử dụ g, độ h h x phâ ớp s u thự hiệ thuật t đề xuất F_RSAR hơ độ h h x phâ ớp s u thự hiệ thuật t GAIN_RATIO_AS_FRS t g [8] Bả g ũ g h thấy, tập út gọ ủ thuật t đề xuất F_RSAR ả t miề dươ g mờ v hiều thuộ t h hơ s với thuật t GAIN_RATIO_AS_FRS t g [8] [1] CHEN, D.G., TSANG E.C.C and ZHAO, S.Y, An approach of attributes reduction based on fuzzy TL rough sets, IEEE International Conference on Systems, Man and Cybernetics, pp 486-491, 2007 [2] CHEN D.G, ZHAO S.Y., Local reduction of decision system with fuzzy rough sets, Fuzzy Sets and Systems 161, pp 1871-1883, 2010 [3] CHEN D.G, LEI Z, SUYUN Z, QINGHUA H, and - 47 - PENGFEI Z, A Novel Algorithm for Finding Reducts With Fuzzy Rough Sets, IEEE Transaction on Fuzzy Systems, Vol 20, No 2, pp 385 - 389 , 2012 Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Knowledge-Based Systems 24 (2011), pp 689–696, 2011 [4] DUBOIS D, PRADE H, Putting rough sets and fuzzy sets together, Intelligent Decision Support, Kluwer Academic Publishers,Dordrecht, 1992 Tập V-2, Số 16 (36), tháng 12/2016 [17] QINGHUA HU, DAREN YU, ZONGXIA XIE, rough sets, International Journal of General Systems, 17, pp 191-209, 1990 Information-preserving hybrid data reduction based on fuzzy-rough techniques, Pattern Recognition Letters 27, 2006, pp 414-423 [6] F F XU, D Q MIAO and L WEI, An Approach for [18] R JENSEN, Q SHEN, Fuzzy-Rough Sets for Fuzzy-Rough Sets Attributes Reduction via Mutual Information, Fourth International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2007, Volume 3, pp 107 – 112, 2007 Descriptive Dimensionality Reduction, Proceedings of the 2002 IEEE International Conference on Fuzzy Systems ,FUZZ-IEEE'02, pp 29-34, 2002 [5] DUBOIS D, PRADE H, Rough fuzzy sets and fuzzy [19] R JENSEN, Q SHEN, Fuzzy–rough attribute reduction with application to web categorization, Fuzzy Sets and Systems, Volume 141, Issue 3, pp 469-485,2004 [7] F.F XU, D.Q MIAO and L WEI, Fuzzy-rough attribute reduction via mutual information with an application to cancer classification, Computers and Mathematics with Applications 57, pp 1010 -1017, 2009 [20] RAJEN, B BHATT, M GOPAL., On fuzzy-rough sets approach to feature selection, Pattern Recognition Letters 26, pp 965–975, 2005 [8] J DAI, QING X, Attribute selection based on information gain ratio in fuzzy rough set theory with application to tumor classification, Applied Soft Computing 13, pp 211–221, 2013 [21] TSANG NEUMANN, C SCHNORR, G STEILD, Combined SVM-based feature selection and classification, Mach Learn 61 (2005), pp 129-150 G.C.Y., CHEN DEGANG., TSANG E.C.C, LEE J.W.T and DANIEL S YEUNGA, On attributes reduction with fuzzy rough sets, Proceedings of 2005 IEEE International Conference on Systems, Man and Cybernetics ,Volume 3, pp 2775 - 2780, 2005 [10] J QUINLAN, C4.5: Programs For Machine [22] TSANG E.C.C, DE GANG CHEN, The Fuzzy Rough [9] J Set Approaches of Fuzzy Reasoning, Proceedings of the Fifth International Conference on Machine Learning and Cybernetics, Dalian, pp 1642-1646, 2006 Learning, Morgan kaufmann, 1993 [11] L A ZADEH, Fuzzy sets, Information and Control, 8:338-353, 1965 [12] M.R CHMIELEWSKI, J.W GRZYMALABUSSE, Global discretization of continuous attributes as preprocessing for machine learning, Int J Approx reasoning 15 (4), 1996, pp 319–331 [23] TSANG E.C.C, DEGANG CHEN YEUNG D.S., XI ZHAO WANG and JOHN W T LEE, Attributes Reduction Using Fuzzy Rough Sets, IEEE Transactions on Fuzzy Systems, Volume16, Issue , pp 1130 1141, 2008 [13] PAWLAK Z., Rough sets, International Journal of Computer and Information Sciences, 11(5): 341-356, 1982 [24] YI CHENG, Forward approximation and backward [14] PAWLAK Z., Rough sets: Theoretical Aspects of approximation in fuzzy rough sets, Neurocomputing, Volume 148, pp 340-353, 2015 Reasoning About Data, Kluwer Aca-demic Publishers, 1991 [25] ZHAO MING, YAN ZHENGBO, ZHOU LIUKUN, WANG HUIJIE and XU XIAOGANG, The Extraction Method of the Energy Consumption Characteristics Based on Fuzzy Rough Set, Proceedings of Conference on Computational Intelligence and Bioinformatics (AASRI), pp 142 – 149, 2012 [15] Q SHEN, R JENSEN, Selecting informative features with fuzzy-rough sets and its application for complex systems monitoring, Pattern Recognition, Volume 37, Issue 7, pp 1351–1363, 2004 [16] QIANG HE, CONGXIN WU, DEGANG CHEN, SUYUN ZHAO, Fuzzy rough set based attribute reduction for information systems with fuzzy decisions, [26] The UCI machine learning repository, Ngày nhận bài: 29/02/2016 - 48 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 16 (36), tháng 12/2016 SƠ LƢỢC VỀ TÁC GIẢ NGUYỄN VĂN THIỆN NGUYỄN NHƢ SƠN Si h ăm 1970 Phú Thọ Si h ăm 1974 Nghệ A Tốt ghiệp ĐH B h kh H Nội ăm 1996 Tốt ghiệp Thạ sỹ t ườ g ĐH Sư phạm H Nội ăm 2000 Tốt ghiệp ĐH B h kh H Nội ăm 1995, thạ sĩ CNTT t ườ g ĐH B h kh H Nội ăm 2001 Nhậ ằ g tiế sỹ ĐH Queensland - Aust i ăm 2007, huyê g h Kh họ m y t h Hiệ đ g ô g t : T ườ g ĐH Cô g ghiệp H Nội Hướ g ghiê ứu: Hệ thố g thô g ti , Cơ sở iệu, Kh i ph iệu Điệ th ại: 0902416668 Hiệ ô g t tại: Việ KH&CN Việt N m CNTT, Việ H âm Email: nvthien1970@gmail.com Hướ g ghiê ứu: Hệ thố g thô g ti , Cơ sở iệu, Kh i ph iệu, T h t đ m mây NGUYỄN LONG GIANG Điệ th ại: 0987039966 Email: nnson@ioit.ac.vn Sinh ăm 1975 H Nội Tốt ghiệp ĐH B h kh H Nội ăm 1997, thạ sĩ CNTT ĐH Cô g ghệ, ĐH Quố gi H Nội ăm 2003 Nhậ ằ g tiế sỹ Việ CNTT, Việ H âm KH&CN Việt N m ăm 2012 Hiệ ô g t tại: Việ KH&CN Việt N m Hướ g ghiê họ m y CNTT, Việ H âm ứu: Cơ sở iệu, kh i ph iệu v Điệ th ại: 0904739189 Email: nlgiang@ioit.ac.vn - 49 - ... Kết thử nghiệm rút gọn thuộc tính theo tiếp cận tập thô tập thô mờ T T S Bộ số U Rút gọn thuộc tính Rút gọn thuộc tính theo theo tiếp cận tập thơ tiếp cận tập thô mờ (RSAR) (F_RSAR) R C liệu Độ... tìm tập út gọ tốt hất dự t ê tiêu huẩ độ u t ọ g ủ thuộ t h Định nghĩa Cho bảng định DS  U ,C  D  ó III RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH VỚI MIỀN TRỊ THUỘC TÍNH NHẬN GIÁ TRỊ SỐ Như... u đến út gọn thuộ t h the tiếp cận tập thô mờ tập trung v h i hướ g h h: hướng thứ sử dụng tập thô mờ để giải i t út gọn thuộ t h t ê ảng định mờ (bảng định với gi t ị thuộ t h tập mờ) t ước

Ngày đăng: 12/03/2020, 20:58

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan