Mô tả phương pháp sử dụng độ đo lượng thông tin

Một phần của tài liệu Rút gọn thuộc tính và trích lọc luật trên bảng quyết định không đầy đủ dựa trên mô hình tập thô dung sai (Trang 44 - 45)

Trong [7], Huang B và các cộng sự đưa ra khái niệm về tập rút gọn dựa trên lượng thông tin (information quantity). Với B A, lượng thông tin của B đối với

{d} I B d I B d I B với 2 1 1 1 n B i i I B S u U và 1, 2,..., n

U u u u . Tập rút gọn dựa trên khoảng cách Hamming được định nghĩa như sau: Cho bảng quyết định không đầy đủ IDS U A, d . Nếu R A thỏa mãn:

' ' 1 ; 2 , . I R d I A d R R I R d I A d .

thì R được gọi là một tập rút gọn của IDS dựa trên lượng thông tin.

Trong công trình [7], Huang B và các tác giả cũng trình bày thuật toán tìm một tập rút gọn tốt nhất sử dụng khoảng cách Hamming, gọi là Thuật toán IQBAR.

Thuật toán IQBAR. Tìm tập rút gọn của bảng quyết định không đầy đủ sử dụng lượng thông tin [7]. (Information Quantity Based Algorithm for Reduction of Knowledge)

Input: Bảng quyết định không đầy đủ IDS U A, d .

Output: Một tập rút gọn R.

1. R ;

2. Tính I R d , I A d ;

// Thêm dần vào R các thuộc tính có độ quan trọng lớn nhất

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

4. Begin

5. For each b A R tính SIG bR I B d I B b d ;

6. Chọn bm A R sao cho R m R

b A R

SIG m Max SIG b ;

7. R R bm ;

8. End;

// Loại bỏ các thuộc tính dư thừa trong R nếu có

9. For each b R

10. If I R b d I A d then R R b ; 11. Return R;

Một phần của tài liệu Rút gọn thuộc tính và trích lọc luật trên bảng quyết định không đầy đủ dựa trên mô hình tập thô dung sai (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(52 trang)