Nghiên cứu cải tiến một số độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ

5 26 0
Nghiên cứu cải tiến một số độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ

Đang tải... (xem toàn văn)

Thông tin tài liệu

Trong bài viết này, tác giả cải tiến một số độ đo nhằm nâng cao hiệu năng trong lý thuyết tập thô cho bảng quyết định không đầy đủ và chứng minh tính đúng đắn của các độ đo đề xuất.

ISSN: 1859-2171 e-ISSN: 2615-9562 TNU Journal of Science and Technology 225(06): 200 - 204 NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ Nguyễn Anh Tuấn Trường Cao đẳng Vĩnh Phúc TÓM TẮT Các phương pháp giảm bớt thuộc tính sử dụng độ đo qua lớp dung sai, phương pháp sử dụng độ đo lượng thơng tin (information quantity) Để giải tốn giảm bớt thuộc tính trực tiếp bảng định không đầy đủ đánh giá thay đổi giá trị độ chắn, độ quán, độ hỗ trợ Các độ đo gặp khó khăn việc đánh giá tính hiệu (về khả phân lớp hay độ hỗ trợ tập luật) Trong báo này, tác giả cải tiến số độ đo nhằm nâng cao hiệu lý thuyết tập thô cho bảng định khơng đầy đủ chứng minh tính đắn độ đo đề xuất Từ khóa: Lý thuyết tập thô, Độ đo, bảng định không đầy đủ, nâng cao hiệu năng, Giảm bớt thuộc tính Ngày nhận bài: 23/12/2019; Ngày hoàn thiện: 13/5/2020; Ngày đăng: 20/5/2020 RESEARCH ON IMPROVING SOME MEASUREMENTS IN CRUDE THEORETICAL OF INCOMPLETE DECISION TABLES Nguyen Anh Tuan Vinh Phuc College ABSTRACT Attribute reduction methods uses measurements by tolerance layers, such as the measurement of information quantity To solve the problem of reducing attributes directly on the incomplete decision tables and assessing changes in the value of certainty, consistency, support These measures have difficulty in assessing the effectiveness (in terms of the ability to classify or support the law set) In this paper, the author improved some measurements to improve performance in the crude theoretical for incomplete decision tables and proved the validity of the proposed measurements Keywords: Tolerance Rough Set, measurements, incomplete decision tables, improve performance, attribute reduction Received: 23/12/2019; Revised: 13/5/2020; Published: 20/5/2020 Email: tuanna573@gmail.com 200 http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Nguyễn Anh Tuấn Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN Giới thiệu Trong lý thuyết tập thô, lựa chọn số tính quan trọng để định có giảm bớt hay không cần thiết Giảm bớt đối tượng trình để tìm tập hợp tối ưu thuộc tính, giữ lại thuộc tính quan trọng để đưa định xác Hầu hết thuật tốn giảm bớt đối tượng dựa vào thông tin thu thập từ miền dương [1] Các phương pháp giảm bớt thuộc tính sử dụng độ đo qua lớp dung sai, phương pháp sử dụng độ đo lượng thông tin [2] Giảm bớt thuộc tính dựa lý thuyết tập thơ có chứa liệu đối tượng đặc trưng tập hợp thuộc tính hữu hạn Đối với hệ thống thơng tin, thuộc tính điều kiện thuộc tính định khác nhau, gọi hệ thống định Mục đích việc giảm bớt thuộc tính loại bỏ thuộc tính dư thừa nhằm nâng cao tính hiệu thuật toán J Dai cộng [3] xây dựng độ đo lượng thông tin tăng thêm mờ (fuzzy gain ratio) dựa entropy mờ xây dựng thuật tốn GAIN_RATION_AS_FRS tìm tập giảm bớt sử dụng lượng thông tin tăng thêm mờ Thực nghiệm số liệu mẫu cho thấy, độ xác phân lớp thuật toán FSCE, GAIN_RATION_AS_FRS cao độ xác thuật tốn sử dụng Entropy, lượng thông tin tăng thêm (gain ratio) theo tiếp cận thô truyền thống Trong thực tế, có nhiều cách giảm bớt cho bảng định, nhiên mức giảm tối thiểu NP-hard [4] Do đó, có nhiều tác giả đề xuất phương pháp khác để làm giảm thuộc tính lý thuyết tập thơ như: dựa miền dương, dựa ma trận, dựa độ đo entropy, tính tốn hạt, dựa độ đo khoảng cách Trong báo này, tác giả nghiên cứu cải tiến cải tiến số độ đo lý thuyết tập thô cho bảng định không đầy đủ, nhằm http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 225(06): 200 - 204 đánh giá phương pháp theo tiêu chuẩn khả phân lớp tập rút gọn Cấu trúc báo sau: Phần I Giới thiệu; Phần II: Cơ sở toán học; Phần III: Cải tiến độ đo để nâng cao hiệu bảng định không đầy đủ Phần IV: Kết luận tài liệu tham khảo Cơ sở toán học 2.1.Định nghĩa hệ thông tin[5] Hệ thông tin 𝐼𝑆 = (𝑈, 𝐴) 𝑈 tập hữu hạn, khác rỗng đối tượng; 𝐴 tập hữu hạn, khác rỗng thuộc tính Với 𝑢  𝑈 , 𝑎  𝐴 ký hiệu giá trị thuộc tính 𝑎 đối tượng 𝑢 𝑎 (𝑢) thay (𝑢, 𝑎) Nếu 𝐵 = {𝑏1 , 𝑏2 , … , 𝑏𝑛 }  A tập thuộc tính ký hiệu giá trị 𝑏𝑖 (𝑢) 𝐵(𝑢) Như vậy, 𝑢 𝑣 hai đối tượng, 𝐵 (𝑢) = 𝐵 (𝑣) 𝑏𝑖 (𝑢) = 𝑏𝑖 (𝑣) với =1, , 𝑛 Xét hệ thông tin 𝐼𝑆 = (𝑈, 𝐴) Mỗi tập thuộc tính 𝑃  𝐴 xác định quan hệ hai 𝑈, ký hiệu 𝐼𝑁𝐷 (𝑃) , xác định bởi: 𝐼𝑁𝐷 (𝑃) = (𝑢 𝑣) 𝑈  𝑈|𝑎  𝑃 , 𝑎 (𝑢) = 𝑎 (𝑣) 𝐼𝑁𝐷 (𝑃) quan hệ P- không phân biệt Thấy 𝐼𝑁𝐷 (𝑃) quan hệ tương đương 𝑈 Nếu (𝑢, 𝑣)  𝐼𝑁𝐷 (𝑃) hai đối tượng 𝑢 𝑣 khơng phân biệt thuộc tính P Quan hệ tương đương 𝐼𝑁𝐷 (𝑃) xác định phân hoạch 𝑈, ký hiệu 𝑈 /𝐼𝑁𝐷 (𝑃) hay 𝑈 /𝑃 Ký hiệu lớp tương đương phân hoạch 𝑈 /𝑃 chứa đối tượng 𝑢 [𝑢]𝑝 , đó: [𝑢]𝑝 = {𝑣 𝑈 |(𝑢, 𝑣)  𝐼𝑁𝐷 (𝑃) 2.2 Đặt tốn Cho bảng định khơng đầy đủ 𝐼𝐷𝑆 = {(𝑈, 𝐴  {𝑏})}, với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } Giả sử 𝑈 {𝑏} 𝑈 𝑆𝐼𝑀 (𝐴) = {𝑆𝐴 (𝑥1 ), 𝑆𝐴 (𝑥2 ), … 𝑆𝐴 (𝑥𝑛 ) } = {(𝑉1 ), (𝑉2 ), … (𝑉𝑚 ) } với 201 Nguyễn Anh Tuấn 𝑆𝐴 (𝑢𝑖 ) ϵ 𝑉𝑗 ϵ 𝑈 {𝑏} 𝑈 𝑆𝐼𝑀 (𝐴) Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN ; (𝑍𝑖𝑗 ) = 𝑆𝐴 (𝑢𝑖 )  𝑉𝑗 ≠  Ký hiệu 𝑑𝑒𝑠 (𝑆𝐴 (𝑢𝑖 )) 𝑣à 𝑑𝑒𝑠(𝑉𝑗 ) mô tả lớp dung sai 𝑆𝐴 (𝑢𝑖 ) lớp tương đương 𝑉𝑗 𝑍𝑖𝑗 : 𝑑𝑒𝑠 (𝑆𝐴 (𝑢𝑖 )) → 𝑑𝑒𝑠(𝑉𝑗 )  𝑍𝑖𝑗 𝑉𝑗 = 𝑆𝐴 (𝑢𝑖 )  𝑆𝐴 (𝑢𝑖 ) (1) (2) |𝑆 (𝑢𝑖 )  𝑉𝑗 | 𝑠(𝑍𝑖𝑗 ) = 𝐴 |𝑈| (3) 225(06): 200 - 204 |𝑆𝐴 (𝑢𝑖 )  𝑉𝑗 | (4) |𝑉𝑗 | Giả sử: 𝑈 {𝑏} = {(𝑉1 ), (𝑉2 ), … (𝑉𝑚 ) } (5) 𝐹= phân lớp 𝑈 theo b, độ xác phân lớp F theo 𝐴, ký hiệu  𝐴 ( 𝐹) , [6]:  𝐴 ( 𝐹) = ∑𝑉 𝑖 ϵ {𝑏} 𝑈 |𝐴𝑉𝑖 | ∑𝑉 𝑈 |𝐴𝑉𝑖 | 𝑖 ϵ {𝑏} (6) Giả sử : IDS = {(𝑈, 𝐴  {𝑏})} với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑋𝑖 ) → 𝑑𝑒𝑠(𝑉𝑗 ) với 𝑋𝑖  𝑀𝐶𝐴 ; 𝑉𝑗  𝑈 {𝑏} , 𝑖 = … 𝑛, 𝑗 = … 𝑚 (7) Khi đó: Độ chắn  IDS: 𝑚 𝑁𝑖 𝑖=1 𝑗=1 |𝑋𝑖  𝑉𝑗 | 1 𝛼(𝐼𝐷𝑆) = ∑ ∑ |𝑋𝑖 | 𝑚 𝑁𝑖 (8) Độ quán 𝛽 IDS: 𝑚 𝑁𝑖 𝑖=1 𝑗=1 𝛽(𝐼𝐷𝑆) = ∑ [1 − ∑|𝑋𝑖  𝑉𝑗 | 𝜇(𝑍𝑖𝑗 )(1 − 𝜇(𝑍𝑖𝑗 ))] |𝑋𝑖 | 𝑚 (9) Độ hỗ trợ 𝛾 IDS: 𝑁𝑗 𝑛 |𝑉𝑗 | |𝑋𝑘  𝑉𝑗 | 𝛾(𝐼𝐷𝑆) = ∑ ∑ |𝑈| 𝑁𝑖 |𝑈| 𝑗=1 (10) 𝑘=1 Cải tiến độ đo lý thuyết tập thô cho bảng định không đầy đủ Giả sử ta có : 𝐼𝐷𝑆 = {(𝑈, 𝐴  {𝑏})} với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑋𝑖 ) → 𝑑𝑒𝑠(𝑉𝑗 ) với 𝑋𝑖  𝑀𝐶𝐴 ; 𝑉𝑗  𝑈 {𝑏} , 𝑖 = … 𝑛, 𝑗 = … 𝑚 3.1 Cải tiến độ đo Độ chắn  IDS: 𝑛 𝑁𝑖 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 𝛼(𝐼𝐷𝑆) = ∑ ∑ |𝑆𝐴 (𝑢𝑖 )| 𝑛 𝑁𝑖 𝑖=1 (11) 𝑗=1 Độ quán 𝛽 IDS: 202 http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Nguyễn Anh Tuấn Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN 𝑛 𝑁𝑖 𝑖=1 𝑗=1 225(06): 200 - 204 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 𝛽(𝐼𝐷𝑆) = ∑[ ∑ ]− |𝑆𝐴 (𝑢𝑖 )| 𝑛−1 𝑁𝑖 𝑛−1 (12) Độ hỗ trợ 𝛾 IDS: 𝑛 𝑚 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 𝛾(𝐼𝐷𝑆) = ∑ ∑ 𝑛 𝑛 (13) 𝑖=1 𝑗=1 Ký hiệu 𝑁𝑖 số luật định (số lớp định) sinh lớp dung sai 𝑆𝐴 (𝑢𝑖 ) Ta có:  (𝐼𝐷𝑆) đạt giá trị lớn 𝜇(𝑍𝑖𝑗 ) = với ∀ 𝑍𝑖𝑗  𝑅𝑒𝑑, nghĩa 𝐼𝐷𝑆 quán,  (𝐼𝐷𝑆) nhỏ : 𝑛 𝑁𝑖 = 𝑛 , nghĩa 𝑚 = 𝑈 𝑆𝐴 (𝑢𝑖 ) = 𝑈 với 𝑢𝑖  𝑈  (𝐼𝐷𝑆) đạt giá trị lớn  (𝐼𝐷𝑆 đạt giá trị lớn  (𝐼𝐷𝑆 nhỏ  (𝐼𝐷𝑆) đạt giá trị nhỏ 𝑛  (𝐼𝐷𝑆) đạt giá trị lớn 𝑆𝐴 (𝑢𝑖 ) = 𝑈 với 𝑢𝑖  𝑈  (𝐼𝐷𝑆) nhỏ 𝑛 𝑆𝐴 (𝑢𝑖 )=𝑢𝑖  với 𝑢𝑖  𝑈 3.2 Chứng minh tính đắn độ đo đề xuất Giả sử : 𝐼𝐷𝑆 = {(𝑈, 𝐴  {𝑏})}, 𝐼𝐷𝑆 ′ = {(𝑈, 𝐵  {𝑏})}, với 𝑈 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑆𝐴 (𝑢𝑖 )) → 𝑑𝑒𝑠(𝑉𝑗 ) 𝑈 với 𝑆𝐴 (𝑢𝑖 ) 𝑆𝐼𝑀 (𝐴) ; 𝑉𝑗  𝑈 {𝑏} , 𝑖 = … 𝑛, 𝑗 = … 𝑚 Nếu B  A  (𝐼𝐷𝑆) ≥  (𝐼𝐷𝑆 ′ ) ; 𝛽 (𝐼𝐷𝑆) ≥ 𝛽 (𝐼𝐷𝑆 ′ ) ; 𝛾 (𝐼𝐷𝑆) ≤ 𝛾(𝐼𝐷𝑆 ′ ) + Độ chắn  IDS Giả sử 𝑁𝑖 (𝐴), 𝑁𝑖 (𝐵) tương ứng số luật định sinh lớp dung sai: 𝑆𝐴 (𝑢𝑖 ) 𝑆𝐵 (𝑢𝑖 ) Nếu B  A 𝑆𝐴 (𝑢𝑖 )  𝑆𝐵 (𝑢𝑖 ) với 𝑢𝑖  𝑈 Cho nên ta suy ra: 𝑁𝑖 (𝐴) ≤ 𝑁𝑖 (𝐵) Từ ta có: 𝑛 𝑁𝑖 𝑛 𝑖=1 𝑗=1 𝑛 𝑖=1 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 1 𝛼(𝐼𝐷𝑆) = ∑ ∑ = ∑ |𝑆𝐴 (𝑢𝑖 )| 𝑛 𝑁𝑖 𝑛 𝑁𝑖 (𝐴) ≥ 1 ∑ 𝑛 𝑁𝑖 (𝐴) 𝑖=1 𝑛 𝑁𝑖 (𝐵) 𝑖=1 𝑗=1 |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | 1 = ∑ ∑ =  (𝐼𝐷𝑆 ′ ) |𝑆𝐵 (𝑢𝑖 )| 𝑛 𝑁𝑖 (𝐵) Do đó:  (𝐼𝐷𝑆) ≥  (𝐼𝐷𝑆 ′ ) (Điều phải chứng minh) + Độ quán 𝛽 IDS: Ta có: http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 203 Nguyễn Anh Tuấn Tạp chí KHOA HỌC & CÔNG NGHỆ ĐHTN 𝑛 𝑁𝑖 𝑖=1 𝑗=1 225(06): 200 - 204 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 1 𝛽(𝐼𝐷𝑆) = ∑[ ∑ ]− |𝑆𝐴 (𝑢𝑖 )| 𝑛−1 𝑁𝑖 𝑛−1 𝑛 𝑛 1 1 1 = (∑ − ) ≥ (∑ − ) 𝑛−1 𝑁𝑖 (𝐴) 𝑛 − 𝑛−1 𝑁𝑖 (𝐴) 𝑛 − 𝑖=1 𝑖=1 𝑁𝑖 (𝐵) 𝑛 |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | 1 1 = (∑ − ) ∑( − ) |𝑆 (𝐵) (𝑢 )| 𝑛−1 𝑁𝑖 𝑛−1 𝑛−1 𝐵 𝑖 𝑖=1 Do đó: 𝛽 (𝐼𝐷𝑆) ≥ 𝛽 (𝐼𝐷𝑆 ′ ) + Độ hỗ trợ 𝛾 IDS: 𝑛 𝑗=1 = 𝛽 (𝐼𝐷𝑆 ′ ) (Điều phải chứng minh) 𝑚 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | 𝛾(𝐼𝐷𝑆) = ∑ ∑ 𝑛 𝑛 𝑖=1 𝑗=1 Nếu B  A 𝑆𝐴 (𝑢𝑖 )  𝑆𝐵 (𝑢𝑖 ) với 𝑢𝑖  𝑈 Ta có 𝑆𝐴 (𝑢𝑖 )  𝑉𝑗  𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 với 𝑢𝑖  𝑈, 𝑉𝑗  𝑛 𝑚 𝑛 𝑈 {𝑏}  |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | ≤ |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | 𝑚 |𝑆𝐴 (𝑢𝑖 ) 𝑉𝑗 | |𝑆𝐵 (𝑢𝑖 ) 𝑉𝑗 | 1  ∑∑ ≤ ∑∑ 𝑛 𝑛 𝑛 𝑛 𝑖=1 𝑗=1 𝑖=1 𝑗=1  𝛾 (𝐼𝐷𝑆) ≤ 𝛾(𝐼𝐷𝑆 ′ ) Điều phải chứng minh Kết luận Trong báo này, tác giả nghiên cứu cải tiến số độ đo chứng minh tính đắn, từ lựa chọn nhóm phương pháp cho phù hợp tiến nghiệm đánh giá thay đổi độ đo cải tiến bảng định không đầy đủ Trên sở đó, lựa chọn đánh giá phương pháp giảm bớt thuộc tính dựa tiêu chuẩn độ hỗ trợ tập luật TÀI LIỆU THAM KHẢO/ REFERENCES [1] Y H Qian, J Y Liang, W Pedrycz, and C Y Dang, “Positive approximation: an accelerator for attribute reduction in rough set theory,” Artif Intell, vol 174, pp 597-618, 2010 204 [2] J Y Liang and Y H Qian, “Information granules and entropy theory in information systems,” Information Sciences, vol 51, pp 1-18, 2008 [3] J Dai, and Q Xu, “Attribute selection base on information gain ratio in fuzzy rough set theory with application to tumor classification,” Applied Soft Computing, vol 13, no 2013, pp 211-211, 2013 [4] A Skowron, and C Rauszer, The discernibility matrices and functions in information systems Intelligent Decision Support, 1992 [5] Y Leung, and D Y Li, “Maximal consistent block technique for rule acquisition in incomplete information systems,” Information Sciences, vol 153, pp 85-106, 2003 [6] J Y Liang and Y H Qian, “Information granules and entropy theory in information systems,” Information Sciences, vol 51, pp 1-18, 2008 http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn ... dương, dựa ma trận, dựa độ đo entropy, tính tốn hạt, dựa độ đo khoảng cách Trong báo này, tác giả nghiên cứu cải tiến cải tiến số độ đo lý thuyết tập thô cho bảng định không đầy đủ, nhằm http://jst.tnu.edu.vn;... Kết luận Trong báo này, tác giả nghiên cứu cải tiến số độ đo chứng minh tính đắn, từ lựa chọn nhóm phương pháp cho phù hợp tiến nghiệm đánh giá thay đổi độ đo cải tiến bảng định không đầy đủ Trên...

Ngày đăng: 01/11/2020, 03:10

Hình ảnh liên quan

3. Cải tiến độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ - Nghiên cứu cải tiến một số độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ

3..

Cải tiến độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ Xem tại trang 3 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan