Mệnh đề 4.5 chứng minh rằng tập rút gọn sử dụng hàm phân biệt mở rộng tương đương với tập rút gọn sử dựa trên hàm quyết định mở rộng.
Định nghĩa 4.8. (Độ quan trọng thuộc tính khi thêm tập thuộc tính điều kiện)
Cho bảng quyết định giá trị tập DS U C, d ,AC và a C A. Độ quan trọng của thuộc tính a đối với tập thuộc tính A được định nghĩa bởi:
out A
SIG a DIS A a DIS A .
Định nghĩa 4.9. (Độ quan trọng thuộc tính khi xóa tập thuộc tính điều kiện)
Cho bảng quyết định giá trị tập DSU C, d , AC và aA. Độ quan trọng của thuộc tính a trong tập thuộc tính A được định nghĩa bởi:
in
\
A
SIG a DIS A DIS A a
Từ Mệnh đề 4.4 ta có out 0 A SIG a và in 0 A SIG a . Do đó, out A SIG a và in A
SIG a được tính bởi lượng thay đổi hàm phân biệt mở rộng khi thêm thuộc tính a
vào A hoặc loại bỏ a khỏi A và out
A
SIG a , in
A
SIG a càng lớn thì lượng thay đổi này càng lớn, hay thuộc tính a càng quan trọng và ngược lại.
4.2.2. Thuật toán tìm tập rút gọn trong bảng quyết định giá trị tập sử dụng hàm phân biệt mở rộng hàm phân biệt mở rộng
Tiếp theo, luận án đề xuất thuật toán heuristic tìm một tập rút gọn tốt nhất theo tiêu chuẩn đánh giá độ quan trọng của thuộc tính. Ý tưởng của thuật toán là xuất phát từ tập thuộc tính rỗng R: , lần lượt bổ sung vào tập R các thuộc tính có độ quan trọng lớn nhất cho đến khi tìm được tập rút gọn. Thuật toán đề xuất sử dụng chiến lược Thêm - Xóa [69].
Thuật toán 4.3. Thuật toán heuristic tìm tập rút gọn dùng hàm phân biệt mở rộng
RGDSDT (heuristic algorithm to find a Reduct based on Generalized Discernibility function in Set-valued Decision Table).
Đầu vào: Bảng quyết định giá trị tập DS U C, d .
Đầu ra: Một tập rút gọn R.
Phương pháp:
1. R ;
// Thêm dần vào R các thuộc tính có độ quan trọng lớn nhất;
2. While DIS R DIS C do 3. Begin
4. For each a C R tính out
R
SIG a DIS R a DIS R ; 5. Chọn am C R sao cho out out
R m R
a C R
SIG a Max SIG a
;
6. R R am ; 7. End;
//Loại bỏ các thuộc tính dư thừa trong R nếu có;
8. For each aR
9. If DIS R \ a DIS R then RR\ a ; 10. Return R;