Trong [7], Huang B và các cộng sự đưa ra khái niệm về tập rút gọn dựa trên lượng thông tin (information quantity). Với B A, lượng thông tin của B đối với
{d} là I B d I B d I B với 2 1 1 1 n B i i I B S u U và 1, 2,..., n
U u u u . Tập rút gọn dựa trên khoảng cách Hamming được định nghĩa như sau: Cho bảng quyết định không đầy đủ IDS U A, d . Nếu R A thỏa mãn:
' ' 1 ; 2 , . I R d I A d R R I R d I A d .
thì R được gọi là một tập rút gọn của IDS dựa trên lượng thông tin.
Trong công trình [7], Huang B và các tác giả cũng trình bày thuật toán tìm một tập rút gọn tốt nhất sử dụng khoảng cách Hamming, gọi là Thuật toán IQBAR.
Thuật toán IQBAR. Tìm tập rút gọn của bảng quyết định không đầy đủ sử dụng lượng thông tin [7]. (Information Quantity Based Algorithm for Reduction of Knowledge)
Input: Bảng quyết định không đầy đủ IDS U A, d .
Output: Một tập rút gọn R.
1. R ;
2. Tính I R d , I A d ;
// Thêm dần vào R các thuộc tính có độ quan trọng lớn nhất
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
4. Begin
5. For each b A R tính SIG bR I B d I B b d ;
6. Chọn bm A R sao cho R m R
b A R
SIG m Max SIG b ;
7. R R bm ;
8. End;
// Loại bỏ các thuộc tính dư thừa trong R nếu có
9. For each b R
10. If I R b d I A d then R R b ; 11. Return R;