Bài viết Đề xuất cải tiến lược đồ độ đo trong lý thuyết tập thô nhằm cải tiến một số độ đo nhằm nâng cao hiệu năng trong lý thuyết tập thô cho bảng quyết định không đầy đủ và chứng minh tính đúng đắn của các độ đo đề xuất. Mời các bạn cùng tham khảo!
Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) Đề Xuất Cải Tiến Lược Đồ Độ Đo Trong Lý Thuyết Tập Thơ Nguyễn Đức Tồn, Vũ Quang Hưng Ngơ Thị Oanh Viện Công Nghệ Thông Tin, Học Viện Phụ Nữ Việt Nam Email: toannd@vwa.edu.vn, hungvq@vwa.edu.vn oanh.ngo@vwa.edu.vn Abstract – Phương pháp giảm bớt thuộc tính Giả sử bước quan trọng khai phá liệu nói chung bảng định khơng đầy đủ nói riêng Nghiên cứu gần đưa số giá trị thuộc tính cho bảng định khơng đầy đủ lý thuyết tập thơ nhằm tìm phương pháp hiệu Trong báo này, tác giả cải tiến số độ đo nhằm nâng cao hiệu lý thuyết tập thô cho bảng định không đầy đủ chứng minh tính đắn độ đo đề xuất Keywords – Độ đo, bảng định khơng đầy đủ, Giảm bớt thuộc tính I 𝑈 𝑆𝐼𝑀 (𝐴) ; 𝑉𝑗 ϵ 𝑈 {𝑏} 𝑈 = {𝑏} 𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 ≠ Ký hiệu 𝑑𝑒𝑠 (𝑆𝐴 (𝑢𝑖 )) 𝑣à 𝑑𝑒𝑠(𝑉𝑗 ) mô tả lớp dung sai 𝑆𝐴 (𝑢𝑖 ) lớp tương đương 𝑉𝑗 (1) 𝑍𝑖𝑗 : 𝑑𝑒𝑠 (𝑆𝐴 (𝑢𝑖 )) → 𝑑𝑒𝑠(𝑉𝑗 ) 𝑉𝑗 (2) 𝑍𝑖𝑗 = 𝑆𝐴 (𝑢𝑖 ) 𝑆𝐴 (𝑢𝑖 ) |𝑆 (𝑢𝑖 ) 𝑉𝑗 | 𝑠(𝑍𝑖𝑗 ) = 𝐴 (3) |𝑈| |𝑆 (𝑢𝑖 ) 𝑉𝑗 | (𝑍𝑖𝑗 ) = 𝐴 (4) |𝑉𝑗 | Giả sử: 𝑈 (5) 𝐹= = {(𝑉1 ), (𝑉2 ), … (𝑉𝑚 ) } {𝑏} phân lớp 𝑈 theo b, độ xác phân lớp F theo 𝐴, ký hiệu 𝐴 𝐹 , [4]: ∑ 𝑈 |𝐴𝑉𝑖 | 𝑉𝑖 ϵ {𝑏} (6) 𝐴 𝐹 = ∑ 𝑈 |𝐴𝑉𝑖 | 𝑉 ϵ GIỚI THIỆU 𝑖 {𝑏} Giả sử : IDS = {(𝑈, 𝐴 {𝑏})} với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } tập luật 𝑅𝑒𝑑 (7) 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑋𝑖 ) → 𝑑𝑒𝑠(𝑉𝑗 ) với 𝑋𝑖 𝑀𝐶𝐴 ; 𝑉𝑗 𝑈 {𝑏} , 𝑖 = … 𝑛, 𝑗 = … 𝑚 Khi đó: Độ chắn IDS: 𝑁𝑖 𝑚 |𝑋𝑖 𝑉𝑗 | 1 𝛼𝐼𝐷𝑆 = ∑ ∑ |𝑋𝑖 | 𝑚 𝑁𝑖 𝑖=1 (8) 𝑗=1 Độ quán 𝛽 IDS: 𝑁𝑖 𝑚 𝛽𝐼𝐷𝑆 = ∑ [1 − ∑|𝑋𝑖 𝑉𝑗 | 𝜇(𝑍𝑖𝑗 )(1 − 𝜇(𝑍𝑖𝑗 ))] |𝑋𝑖 | 𝑚 𝑖=1 𝑗=1 Độ hỗ trợ 𝛾 IDS: 𝑛 𝑁𝑗 𝑗=1 𝑘=1 |𝑉𝑗 | |𝑋𝑘 𝑉𝑗 | 𝛾𝐼𝐷𝑆 = ∑ ∑ |𝑈| 𝑁𝑖 |𝑈| CƠ SỞ TỐN HỌC Trong lý thuyết tập thơ khái niệm báo tham khảo [3] Cho bảng định không đầy đủ 𝐼𝐷𝑆 = {(𝑈, 𝐴 {𝑏})} với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } ISBN 978-604-80-7468-5 = {𝑆𝐴 (𝑥1 ), 𝑆𝐴 (𝑥2 ), … 𝑆𝐴 (𝑥𝑛 ) } {(𝑉1 ), (𝑉2 ), … (𝑉𝑚 ) } với 𝑆𝐴 (𝑢𝑖 ) ϵ Trong lý thuyết tập thô, lựa chọn số tính quan trọng để định có giảm bớt hay khơng cần thiết Giảm bớt đối tượng trình để tìm tập hợp tối ưu thuộc tính, giữ lại thuộc tính quan trọng để đưa định xác Hầu hết thuật tốn giảm bớt đối tượng dựa vào thơng tin thu thập từ miền dương [1] Giảm bớt thuộc tính dựa lý thuyết tập thơ có chứa liêụ đối tượng đặc trưng tập hợp thuộc tính hữu hạn Đối với hệ thống thơng tin, thuộc tính điều kiện thuộc tính định khác nhau, gọi hệ thống định Trong thực tế, có nhiều cách giảm bớt cho bảng định, nhiên mức giảm tối thiểu NP-hard [2] Do đó, có nhiều tác giả đề xuất phương pháp khác để làm giảm thuộc tính lý thuyết tập thô như: dựa miền dương, dựa ma trận, dựa độ đo entropy, tính tốn hạt, dựa độ đo khoảng cách Trong báo này, tác giả đưa cải tiến độ đo lý thuyết tập thô cho bảng định không đầy đủ, nhằm đánh giá phương pháp theo tiêu chuẩn khả phân lớp tập rút gọn Cấu trúc báo sau: Phần I Giới thiệu; Phần II: Cơ sở toán học; Phần III: Cải tiến độ đo để nâng cao hiệu bảng định không đầy đủ Phần IV: Kết luận tài liệu tham khảo II 𝑈 𝑆𝐼𝑀 (𝐴) 421 (9) Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) III ĐỀ XUẤT CẢI TIẾN LƯỢC ĐỒ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ Do đó: 𝐼𝐷𝑆 ≥ 𝐼𝐷𝑆 ′ (Điều phải chứng minh) Giả sử ta có : 𝐼𝐷𝑆 = {(𝑈, 𝐴 {𝑏})} với 𝑈 = {𝑛1 , 𝑛2 , … , 𝑛𝑛 } tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝔍𝑖𝑗 |𝔍𝑖𝑗 :𝑑𝑒𝑠 (𝔑𝑖 ) → 𝑑𝑒𝑠(𝔙𝑗 ) với: 𝔑𝑖 𝔐𝐶𝐴 ; 𝑈 𝔙𝑗 {𝑏} , 𝑖 = … 𝑛, 𝑗 = … 𝑚 3.2.2 Độ quán 𝛽 IDS: Ta có: 3.1 Cải tiến độ đo - Độ chắn IDS: 𝑛 1 ≥ (∑ − ) 𝑛−1 𝑁𝑖 (𝐴) 𝑛 − 𝑗=1 𝑖=1 𝑛 (12) 𝑖=1 𝑗=1 (13) 𝑖=1 𝑗=1 Ký hiệu 𝑁𝑖 số luật định (số lớp định) sinh lớp dung sai 𝑆𝐴 𝑢𝑖 Ta có: - 𝐼𝐷𝑆 đạt giá trị lớn 𝜇(𝔍𝑖𝑗 ) = với ∀ 𝔍𝑖𝑗 𝑅𝑒𝑑, nghĩa 𝐼𝐷𝑆 quán, 𝑖=1 𝑗=1 {𝑏} 𝑗=1 𝑖=1 𝑗=1 𝑛 𝑚 𝑖=1 𝑗=1 𝛾 𝐼𝐷𝑆 ≤ 𝛾𝐼𝐷𝑆 ′ (Điều phải chứng minh) IV ≥ {𝑏} TÀI LIỆU THAM KHẢO [1] 𝑛 [2] [3] 𝑖=1 1 ∑ 𝑛 𝑁𝑖 (𝐴) [4] 𝑖=1 𝑛 𝑁𝑖 (𝐵) 𝑖=1 𝑗=1 [5] |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | 1 = ∑ ∑ = 𝐼𝐷𝑆 ′ |𝑆𝐵 (𝑢𝑖 )| 𝑛 𝑁𝑖 (𝐵) ISBN 978-604-80-7468-5 KẾT LUẬN Trong báo này, tác giả đưa cải tiến số độ đo chứng minh tính đắn độ đo cải tiến, từ lựa chọn nhóm phương pháp cho phù hợp tiến nghiệm đánh giá thay đổi độ đo cải tiến bảng định khơng đầy đủ Trên sở đó, lựa chọn đánh giá phương pháp giảm bớt thuộc tính dựa tiêu chuẩn độ hỗ trợ tập luật Định hướng tiến hành thử nghiệm tập rút gọn miền dương, tập rút gọn dựa hàm định suy rộng, tập rút gọn dựa khoảng cách tập rút gọn phân bố… |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 1 𝛼𝐼𝐷𝑆 = ∑ ∑ = ∑ |𝑆𝐴 (𝑢𝑖 )| 𝑛 𝑁𝑖 𝑛 𝑁𝑖 (𝐴) 𝑛 𝑚 |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | ≤ ∑∑ 𝑛 𝑛 Nếu B A 𝐼𝐷𝑆 ≥ 𝐼𝐷𝑆 ′ ; 𝛽 𝐼𝐷𝑆 ≥ 𝛽 𝐼𝐷𝑆 ′ ; 𝛾 𝐼𝐷𝑆 ≤ 𝛾𝐼𝐷𝑆 ′ 3.2.1 Độ chắn IDS Giả sử 𝑁𝑖 (𝐴), 𝑁𝑖 (𝐵) tương ứng số luật định sinh lớp dung sai: 𝑆𝐴 (𝑢𝑖 ) 𝑆𝐵 (𝑢𝑖 ) Nếu B A 𝑆𝐴 (𝑢𝑖 ) 𝑆𝐵 (𝑢𝑖 ) với 𝑢𝑖 𝑈 Cho nên ta suy ra: 𝑁𝑖 (𝐴) ≤ 𝑁𝑖 (𝐵) Từ ta có: 𝑖=1 𝑛 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | ∑∑ 𝑛 𝑛 𝑖 = … 𝑛, 𝑗 = … 𝑚 𝑁𝑖 3.2.3 Độ hỗ trợ 𝛾 IDS: 𝑛 𝑚 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 𝛾𝐼𝐷𝑆 = ∑ ∑ 𝑛 𝑛 Nếu B A 𝑆𝐴 (𝑢𝑖 ) 𝑆𝐵 (𝑢𝑖 ) với 𝑢𝑖 𝑈 Ta có 𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 với 𝑢𝑖 𝑈, 𝑈 𝑉𝑗 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | ≤ |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | - 𝐼𝐷𝑆 nhỏ : 𝑁𝑖 𝑛 , nghĩa 𝑚 𝑈 𝑛 𝑆𝐴 (𝑢𝑖 ) = 𝑈 với 𝑢𝑖 𝑈 - 𝐼𝐷𝑆 đạt giá trị lớn 𝐼𝐷𝑆 đạt giá trị lớn 1 - 𝐼𝐷𝑆 nhỏ 𝐼𝐷𝑆) đạt giá trị nhỏ 𝑛 - 𝐼𝐷𝑆 đạt giá trị lớn 𝑆𝐴 (𝑢𝑖 ) = 𝑈 với 𝑢𝑖 𝑈 - 𝐼𝐷𝑆 nhỏ 𝑆𝐴 (𝑢𝑖 )𝑢𝑖 với 𝑢𝑖 𝑈 𝑛 3.2 Chứng minh tính đắn độ đo đề xuất Giả sử : 𝐼𝐷𝑆 = {(𝑈, 𝐴 {𝑏})}, 𝐼𝐷𝑆 ′ = {(𝑈, 𝐵 {𝑏})}, với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝔍𝑖𝑗 |𝔍𝑖𝑗 :𝑑𝑒𝑠 (𝔑𝑖 ) → 𝑑𝑒𝑠(𝔙𝑗 ) 𝑈 𝑈 với 𝑆𝐴 (𝑢𝑖 ) ; 𝔙𝑗 , 𝑛 𝑗=1 − ) = 𝛽 𝐼𝐷𝑆 ′ 𝑛−1 Do đó: 𝛽 𝐼𝐷𝑆 ≥ 𝛽 𝐼𝐷𝑆 ′ (Điều phải chứng minh) - Độ hỗ trợ 𝛾 IDS: 𝑛 𝑚 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 𝛾𝐼𝐷𝑆 = ∑ ∑ 𝑛 𝑛 𝑆𝐼𝑀 (𝐴) 𝑁𝑖 (𝐵) |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | 1 = (∑ − ) ∑( |𝑆𝐵 (𝑢𝑖 )| 𝑛−1 𝑁𝑖 (𝐵) 𝑛 − 𝑁𝑖 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 𝛽𝐼𝐷𝑆 = ∑[ ∑ ]− |𝑆𝐴 (𝑢𝑖 )| 𝑛−1 𝑁𝑖 𝑛−1 𝑖=1 𝑗=1 𝑖=1 (11) - Độ quán 𝛽 IDS: 𝑛 𝑖=1 𝑛 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 𝛼𝐼𝐷𝑆 = ∑ ∑ |𝑆𝐴 (𝑢𝑖 )| 𝑛 𝑁𝑖 𝑖=1 𝑁𝑖 1 = (∑ − ) 𝑛−1 𝑁𝑖 (𝐴) 𝑛 − 𝑁𝑖 𝑛 𝑛 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 𝛽𝐼𝐷𝑆 = ∑[ ∑ ]− |𝑆𝐴 (𝑢𝑖 )| 𝑛−1 𝑁𝑖 𝑛−1 Y.H Qian, J.Y Liang, W Pedrycz, C.Y Dang, (2011), “An efficient accelerator for attribute reduction from incomplete data in rough set framework”, Pattern Recogn, pp 1658–1670 A Skowron, C Rauszer, (1992), The discernibility matrices and functions in information systems, Intelligent Decision Support Y.H Qian, J.Y Liang, W Pedrycz, C.Y Dang, (2010), “Positive approximation: an accelerator for attribute reduction in rough set theory”, Artif Intell, pp 597–618 Y Leung, D.Y Li, (2003), “Maximal consistent block technique for rule acquisition in incomplete information systems”, Information Sciences 153 pp85–106 Liang J.Y and Qian Y.H (2008), “Information granules and entropy theory in information systems”, Information Sciences, Vol 51, pp 1-18 422 ...Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) III ĐỀ XUẤT CẢI TIẾN LƯỢC ĐỒ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THƠ Do đó: