0

NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ

5 9 0
  • NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ  CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ

Tài liệu liên quan

Thông tin tài liệu

Ngày đăng: 14/01/2021, 14:15

Trong bài báo này, tác giả cải tiến một số độ đo nhằm nâng cao hiệu năng trong lý thuyết tập thô cho bảng quyết định không đầy đủ và chứng minh tính đúng đắn của các độ đo đề xuất.. T[r] (1)NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ Nguyễn Anh Tuấn Trường Cao đẳng Vĩnh Phúc TĨM TẮT Các phương pháp giảm bớt thuộc tính sử dụng độ đo qua lớp dung sai, phương pháp sử dụng độ đo lượng thông tin (information quantity) Để giải toán giảm bớt thuộc tính trực tiếp bảng định khơng đầy đủ đánh giá thay đổi giá trị độ chắn, độ quán, độ hỗ trợ Các độ đo gặp khó khăn việc đánh giá tính hiệu (về khả phân lớp hay độ hỗ trợ tập luật) Trong báo này, tác giả cải tiến số độ đo nhằm nâng cao hiệu lý thuyết tập thô cho bảng định khơng đầy đủ chứng minh tính đắn độ đo đề xuất Từ khóa: Lý thuyết tập thô, Độ đo, bảng định không đầy đủ, nâng cao hiệu năng, Giảm bớt thuộc tính. Ngày nhận bài: 23/12/2019; Ngày hồn thiện: 13/5/2020; Ngày đăng: 20/5/2020 RESEARCH ON IMPROVING SOME MEASUREMENTS IN CRUDE THEORETICAL OF INCOMPLETE DECISION TABLES Nguyen Anh Tuan Vinh Phuc College ABSTRACT Attribute reduction methods uses measurements by tolerance layers, such as the measurement of information quantity To solve the problem of reducing attributes directly on the incomplete decision tables and assessing changes in the value of certainty, consistency, support These measures have difficulty in assessing the effectiveness (in terms of the ability to classify or support the law set) In this paper, the author improved some measurements to improve performance in the crude theoretical for incomplete decision tables and proved the validity of the proposed measurements Keywords: Tolerance Rough Set, measurements, incomplete decision tables, improve performance, attribute reduction Received: 23/12/2019; Revised: 13/5/2020; Published: 20/5/2020 (2)1 Giới thiệu Trong lý thuyết tập thơ, lựa chọn số tính quan trọng để định có giảm bớt hay khơng cần thiết Giảm bớt đối tượng trình để tìm tập hợp tối ưu thuộc tính, giữ lại thuộc tính quan trọng để đưa định xác Hầu hết thuật toán giảm bớt đối tượng dựa vào thông tin thu thập từ miền dương [1] Các phương pháp giảm bớt thuộc tính sử dụng độ đo qua lớp dung sai, phương pháp sử dụng độ đo lượng thông tin [2] Giảm bớt thuộc tính dựa lý thuyết tập thơ có chứa liệu đối tượng đặc trưng tập hợp thuộc tính hữu hạn Đối với hệ thống thơng tin, thuộc tính điều kiện thuộc tính định khác nhau, gọi hệ thống định Mục đích việc giảm bớt thuộc tính loại bỏ thuộc tính dư thừa nhằm nâng cao tính hiệu thuật tốn J Dai cộng [3] xây dựng độ đo lượng thông tin tăng thêm mờ (fuzzy gain ratio) dựa entropy mờ xây dựng thuật tốn GAIN_RATION_AS_FRS tìm tập giảm bớt sử dụng lượng thông tin tăng thêm mờ Thực nghiệm số liệu mẫu cho thấy, độ xác phân lớp thuật tốn FSCE, GAIN_RATION_AS_FRS cao độ xác thuật tốn sử dụng Entropy, lượng thơng tin tăng thêm (gain ratio) theo tiếp cận thô truyền thống Trong thực tế, có nhiều cách giảm bớt cho bảng định, nhiên mức giảm tối thiểu NP-hard [4] Do đó, có nhiều tác giả đề xuất phương pháp khác để làm giảm thuộc tính lý thuyết tập thô như: dựa miền dương, dựa ma trận, dựa độ đo entropy, tính tốn hạt, dựa độ đo khoảng cách Trong báo này, tác giả nghiên cứu cải tiến cải tiến số độ đo lý thuyết tập thô cho bảng định không đầy đủ, nhằm đánh giá phương pháp theo tiêu chuẩn khả phân lớp tập rút gọn Cấu trúc báo sau: Phần I Giới thiệu; Phần II: Cơ sở toán học; Phần III: Cải tiến độ đo để nâng cao hiệu bảng định không đầy đủ Phần IV: Kết luận tài liệu tham khảo 2 Cơ sở toán học 2.1.Định nghĩa hệ thông tin[5] Hệ thông tin 𝐼𝑆 = (𝑈, 𝐴) 𝑈 tập hữu hạn, khác rỗng đối tượng; 𝐴 tập hữu hạn, khác rỗng thuộc tính Với 𝑢  𝑈 , 𝑎  𝐴 ký hiệu giá trị thuộc tính 𝑎 đối tượng 𝑢 𝑎 (𝑢) thay (𝑢, 𝑎) Nếu 𝐵 = {𝑏1, 𝑏2, … , 𝑏𝑛}  A tập các thuộc tính ký hiệu giá trị 𝑏𝑖(𝑢) bởi 𝐵(𝑢) Như vậy, 𝑢 𝑣 hai đối tượng, 𝐵 (𝑢) = 𝐵 (𝑣) 𝑏𝑖(𝑢) = 𝑏𝑖(𝑣) với =1, , 𝑛 Xét hệ thông tin 𝐼𝑆 = (𝑈, 𝐴) Mỗi tập thuộc tính 𝑃  𝐴 xác định quan hệ hai 𝑈, ký hiệu 𝐼𝑁𝐷 (𝑃) , xác định bởi: 𝐼𝑁𝐷 (𝑃) = (𝑢 𝑣) 𝑈  𝑈|𝑎  𝑃 , 𝑎 (𝑢) = 𝑎 (𝑣) 𝐼𝑁𝐷 (𝑃) quan hệ P- không phân biệt Thấy 𝐼𝑁𝐷 (𝑃) quan hệ tương đương 𝑈 Nếu (𝑢, 𝑣)  𝐼𝑁𝐷 (𝑃) hai đối tượng 𝑢 𝑣 khơng phân biệt thuộc tính P Quan hệ tương đương 𝐼𝑁𝐷 (𝑃) xác định phân hoạch 𝑈, ký hiệu 𝑈 /𝐼𝑁𝐷 (𝑃) hay 𝑈 /𝑃 Ký hiệu lớp tương đương phân hoạch 𝑈 /𝑃 chứa đối tượng 𝑢 [𝑢]𝑝, đó: [𝑢]𝑝 = {𝑣 𝑈 |(𝑢, 𝑣)  𝐼𝑁𝐷 (𝑃) 2.2 Đặt toán Cho bảng định không đầy đủ 𝐼𝐷𝑆 = {(𝑈, 𝐴  {𝑏})}, với 𝑈 = {𝑥1, 𝑥2, … , 𝑥𝑛} Giả sử 𝑈 𝑆𝐼𝑀 (𝐴)= {𝑆𝐴(𝑥1), 𝑆𝐴(𝑥2), … 𝑆𝐴(𝑥𝑛) } (3) 𝑆𝐴(𝑢𝑖) ϵ 𝑆𝐼𝑀 (𝐴)𝑈 ; 𝑉𝑗 ϵ 𝑈 {𝑏} 𝑆𝐴(𝑢𝑖)  𝑉𝑗 ≠  Ký hiệu 𝑑𝑒𝑠 (𝑆𝐴(𝑢𝑖)) 𝑣à 𝑑𝑒𝑠(𝑉𝑗) các mô tả lớp dung sai 𝑆𝐴(𝑢𝑖) lớp tương đương 𝑉𝑗 𝑍𝑖𝑗 : 𝑑𝑒𝑠 (𝑆𝐴(𝑢𝑖)) → 𝑑𝑒𝑠(𝑉𝑗) (1)  𝑍𝑖𝑗 = 𝑆𝐴(𝑢𝑖)  𝑉𝑗 𝑆𝐴(𝑢𝑖) (2) 𝑠(𝑍𝑖𝑗 ) = |𝑆𝐴(𝑢𝑖)  𝑉𝑗| |𝑈| (3) (𝑍𝑖𝑗 ) = |𝑆𝐴(𝑢𝑖)  𝑉𝑗| |𝑉𝑗| (4) Giả sử: 𝐹 = 𝑈 {𝑏} = {(𝑉1), (𝑉2), … (𝑉𝑚) } (5) là phân lớp 𝑈 theo b, độ xác phân lớp F theo 𝐴, ký hiệu 𝐴( 𝐹) , [6]: 𝐴( 𝐹) = ∑𝑉 |𝐴𝑉𝑖| 𝑖 ϵ {𝑏}𝑈 ∑𝑉 |𝐴𝑉𝑖| 𝑖 ϵ {𝑏}𝑈 (6) Giả sử : IDS = {(𝑈, 𝐴  {𝑏})} với 𝑈 = {𝑥1, 𝑥2, … , 𝑥𝑛} tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑋𝑖) → 𝑑𝑒𝑠(𝑉𝑗) với 𝑋𝑖  𝑀𝐶𝐴; 𝑉𝑗  {𝑏}𝑈 , 𝑖 = … 𝑛, 𝑗 = … 𝑚 (7) Khi đó: Độ chắn  IDS: 𝛼(𝐼𝐷𝑆) = 𝑚∑ 1 𝑁𝑖 𝑚 𝑖=1 ∑|𝑋𝑖  𝑉𝑗 | |𝑋𝑖 | 𝑁𝑖 𝑗=1 (8) Độ quán 𝛽 IDS: 𝛽(𝐼𝐷𝑆) = 𝑚∑ [1 − 4 |𝑋𝑖|∑|𝑋𝑖  𝑉𝑗 | 𝑁𝑖 𝑗=1 𝜇(𝑍𝑖𝑗 )(1 − 𝜇(𝑍𝑖𝑗 ))] 𝑚 𝑖=1 (9) Độ hỗ trợ 𝛾 IDS: 𝛾(𝐼𝐷𝑆) = ∑ |𝑉𝑗 | 𝑁𝑖|𝑈| 𝑛 𝑗=1 ∑|𝑋𝑘  𝑉𝑗 | |𝑈| 𝑁𝑗 𝑘=1 (10) 3 Cải tiến độ đo lý thuyết tập thô cho bảng định không đầy đủ Giả sử ta có : 𝐼𝐷𝑆 = {(𝑈, 𝐴  {𝑏})} với 𝑈 = {𝑥1, 𝑥2, … , 𝑥𝑛} tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑋𝑖) → 𝑑𝑒𝑠(𝑉𝑗) với 𝑋𝑖  𝑀𝐶𝐴; 𝑉𝑗  {𝑏}𝑈 , 𝑖 = … 𝑛, 𝑗 = … 𝑚 3.1 Cải tiến độ đo Độ chắn  IDS: 𝛼(𝐼𝐷𝑆) = 𝑛∑ 1 𝑁𝑖 𝑛 𝑖=1 ∑|𝑆𝐴(𝑢𝑖) 𝑉𝑗 | |𝑆𝐴(𝑢𝑖)| 𝑁𝑖 𝑗=1 (11) (4)𝛽(𝐼𝐷𝑆) = 𝑛 − 1∑ [ 1 𝑁𝑖∑ |𝑆𝐴(𝑢𝑖) 𝑉𝑗 | |𝑆𝐴(𝑢𝑖)| 𝑁𝑖 𝑗=1 ] 𝑛 𝑖=1 − 𝑛 − (12) Độ hỗ trợ 𝛾 IDS: 𝛾(𝐼𝐷𝑆) = 𝑛∑ ∑ |𝑆𝐴(𝑢𝑖) 𝑉𝑗 | 𝑛 𝑚 𝑗=1 𝑛 𝑖=1 (13) Ký hiệu 𝑁𝑖 số luật định (số lớp định) sinh lớp dung sai 𝑆𝐴 (𝑢𝑖 ) Ta có:  (𝐼𝐷𝑆) đạt giá trị lớn 𝜇(𝑍𝑖𝑗 ) = với ∀ 𝑍𝑖𝑗  𝑅𝑒𝑑, nghĩa 𝐼𝐷𝑆 quán,  (𝐼𝐷𝑆) nhỏ : 𝑛1 𝑁𝑖 = 𝑛 , nghĩa 𝑚 = 𝑈 𝑆𝐴(𝑢𝑖) = 𝑈 với 𝑢𝑖  𝑈  (𝐼𝐷𝑆) đạt giá trị lớn  (𝐼𝐷𝑆 đạt giá trị lớn  (𝐼𝐷𝑆 nhỏ  (𝐼𝐷𝑆) đạt giá trị nhỏ 𝑛  (𝐼𝐷𝑆) đạt giá trị lớn 𝑆𝐴(𝑢𝑖) = 𝑈 với 𝑢𝑖  𝑈  (𝐼𝐷𝑆) nhỏ 𝑛 𝑆𝐴(𝑢𝑖)=𝑢𝑖 với 𝑢𝑖  𝑈 3.2 Chứng minh tính đắn độ đo đề xuất Giả sử : 𝐼𝐷𝑆 = {(𝑈, 𝐴  {𝑏})}, 𝐼𝐷𝑆′ = {(𝑈, 𝐵  {𝑏})}, với 𝑈 = {𝑥 1, 𝑥2, … , 𝑥𝑛} tập luật 𝑅𝑒𝑑 𝑅𝑒𝑑 = 𝑍𝑖𝑗 |𝑍𝑖𝑗 :𝑑𝑒𝑠 (𝑆𝐴(𝑢𝑖)) → 𝑑𝑒𝑠(𝑉𝑗) với 𝑆𝐴(𝑢𝑖)  𝑈 𝑆𝐼𝑀 (𝐴) ; 𝑉𝑗  𝑈 {𝑏} , 𝑖 = … 𝑛, 𝑗 = … 𝑚 Nếu B  A  (𝐼𝐷𝑆) ≥  (𝐼𝐷𝑆′) ; 𝛽 (𝐼𝐷𝑆) ≥ 𝛽 (𝐼𝐷𝑆′) ; 𝛾 (𝐼𝐷𝑆) ≤ 𝛾(𝐼𝐷𝑆′) + Độ chắn  IDS Giả sử 𝑁𝑖(𝐴), 𝑁𝑖(𝐵) tương ứng số luật định sinh lớp dung sai: 𝑆𝐴(𝑢𝑖) 𝑆𝐵(𝑢𝑖) Nếu B  A 𝑆𝐴(𝑢𝑖)  𝑆𝐵(𝑢𝑖) với 𝑢𝑖  𝑈 Cho nên ta suy ra: 𝑁𝑖(𝐴) ≤ 𝑁𝑖(𝐵) Từ ta có: 𝛼(𝐼𝐷𝑆) = 𝑛∑ 1 𝑁𝑖 𝑛 𝑖=1 ∑|𝑆𝐴(𝑢𝑖) 𝑉𝑗 | |𝑆𝐴(𝑢𝑖)| 𝑁𝑖 𝑗=1 = 𝑛∑ 1 𝑁𝑖(𝐴) 𝑛 𝑖=1 ≥1 𝑛∑ 1 𝑁𝑖(𝐴) 𝑛 𝑖=1 = 𝑛∑ 1 𝑁𝑖(𝐵) 𝑛 𝑖=1 ∑ |𝑆𝐵(𝑢𝑖) 𝑉𝑗 | |𝑆𝐵(𝑢𝑖)| 𝑁𝑖(𝐵) 𝑗=1 =  (𝐼𝐷𝑆′) Do đó:  (𝐼𝐷𝑆) ≥  (𝐼𝐷𝑆′) (Điều phải chứng minh) (5)𝛽(𝐼𝐷𝑆) = 𝑛 − 1∑ [ 1 𝑁𝑖∑ |𝑆𝐴(𝑢𝑖) 𝑉𝑗 | |𝑆𝐴(𝑢𝑖)| 𝑁𝑖 𝑗=1 ] 𝑛 𝑖=1 − 𝑛 − = 𝑛 − 1(∑ 𝑁𝑖(𝐴) 𝑛 𝑖=1 − 𝑛 − 1) ≥ 𝑛 − 1(∑ 1 𝑁𝑖(𝐴) 𝑛 𝑖=1 − 𝑛 − 1) = 𝑛 − 1(∑ 1 𝑁𝑖(𝐵) 𝑛 𝑖=1 − 𝑛 − 1) ∑ ( |𝑆𝐵(𝑢𝑖) 𝑉𝑗 | |𝑆𝐵(𝑢𝑖)| 𝑁𝑖(𝐵) 𝑗=1 − 𝑛 − 1) = 𝛽 (𝐼𝐷𝑆′) Do đó: 𝛽 (𝐼𝐷𝑆) ≥ 𝛽 (𝐼𝐷𝑆′) (Điều phải chứng minh) + Độ hỗ trợ 𝛾 IDS: 𝛾(𝐼𝐷𝑆) = 𝑛∑ ∑ |𝑆𝐴(𝑢𝑖) 𝑉𝑗 | 𝑛 𝑚 𝑗=1 𝑛 𝑖=1 Nếu B  A 𝑆𝐴(𝑢𝑖)  𝑆𝐵(𝑢𝑖) với 𝑢𝑖  𝑈 Ta có 𝑆𝐴(𝑢𝑖)  𝑉𝑗  𝑆𝐵(𝑢𝑖) 𝑉𝑗 với 𝑢𝑖  𝑈, 𝑉𝑗  {𝑏}𝑈  |𝑆𝐴(𝑢𝑖) 𝑉𝑗 | ≤ |𝑆𝐵(𝑢𝑖) 𝑉𝑗 |  𝑛∑ ∑ |𝑆𝐴(𝑢𝑖) 𝑉𝑗 | 𝑛 𝑚 𝑗=1 𝑛 𝑖=1 ≤ 𝑛∑ ∑ |𝑆𝐵(𝑢𝑖) 𝑉𝑗 | 𝑛 𝑚 𝑗=1 𝑛 𝑖=1  𝛾 (𝐼𝐷𝑆) ≤ 𝛾(𝐼𝐷𝑆′) Điều phải chứng minh 4 Kết luận Trong báo này, tác giả nghiên cứu cải tiến số độ đo chứng minh tính đắn, từ lựa chọn nhóm phương pháp cho phù hợp tiến nghiệm đánh giá thay đổi độ đo cải tiến bảng định không đầy đủ Trên sở đó, lựa chọn đánh giá phương pháp giảm bớt thuộc tính dựa tiêu chuẩn độ hỗ trợ tập luật TÀI LIỆU THAM KHẢO/ REFERENCES [1] Y H Qian, J Y Liang, W Pedrycz, and C Y Dang, “Positive approximation: an accelerator for attribute reduction in rough set theory,” Artif Intell, vol 174, pp 597-618, 2010 [2] J Y Liang and Y H Qian, “Information granules and entropy theory in information systems,” Information Sciences, vol 51, pp 1-18, 2008 [3] J Dai, and Q Xu, “Attribute selection base on information gain ratio in fuzzy rough set theory with application to tumor classification,” Applied Soft Computing, vol 13, no 2013, pp 211-211, 2013 [4] A Skowron, and C Rauszer, The discernibility matrices and functions in information systems Intelligent Decision Support, 1992 [5] Y Leung, and D Y Li, “Maximal consistent block technique for rule acquisition in incomplete information systems,” Information Sciences, vol 153, pp 85-106, 2003
- Xem thêm -

Xem thêm: NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ, NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ

Hình ảnh liên quan

3. Cải tiến độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ - NGHIÊN CỨU CẢI TIẾN MỘT SỐ ĐỘ ĐO TRONG LÝ THUYẾT TẬP THÔ  CHO BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ

3..

Cải tiến độ đo trong lý thuyết tập thô cho bảng quyết định không đầy đủ Xem tại trang 3 của tài liệu.