u1 Có Bình th−ờng Có Khơng
u2 Có Cao Có Có
u3 Có Bình th−ờng Có Có
u4 Khơng Cao Có Khơng
u5 Khơng Bình th−ờng Khơng Khơng
u6 Có Rất cao Có Có
u7 Khơng Cao Có Có
Các thuộc tính điều kiện là Đau đầu, Nhiệt độ, Mỏi cơ với Vđau đầu={Khơng (0), Có (1)},
Vnhiệt độ={Bình th−ờng(0), Cao (1), Rất cao (2)}, Vmỏi cơ= {Khơng (0), Có (1)}
và thuộc tính quyết định là Bị cúm với Vbị cúm ={ Khơng (0), Có (1)}. Bảng quyết định t−ơng ứng của nó là:
F(x) 0-0-0 0-0-1 ... 1-0-0 ... 1-2-1 *-0-0 1/2 ... 1/2 ..... *-0-1 1/2 ..... *-1-0 ..... *-1-1 ..... *-2-0 ..... *-2-1 ..... 1/2 0-*-0 1/3 ..... ..... ..... .....
1-1-* ..... 1-2-* ..... 1/2 ..... ..... *-*-0 1/6 1/6 ..... ..... ..... ..... 0-*-* 1/6 1/6 ..... 1-*-* 1/6 ..... 1/6
Gọi F(x) là các đối t−ợng có thể (PI) G(x) là các bộ sinh có thể (PG)
G(x) → F(x) là quan hệ xác suất giữa PI và PG:
[ ]{∏ } {∏ } = ∈ = * |PG l l k k PG n N
i là số PI thỏa mãn trong PGi
Độ mạnh của luật: S(X →Y ) ( )=s X (1−r(X →Y )) với s( ) (X =s PGk)
Nếu không sử dụng tri thức kinh nghiệm:
( ) (= )=∑ ( )= l PG k rel ins k l k k N PG N PG PI p PG s X s | _ ( )
Nins_rel(PGk) là số đối t−ợng quan sát đ−ợc là thỏa mãn trong lần thứ i
Nếu sử dụng tri thức kinh nghiệm:
( ) ( ) ( ) ( ) ( )X rel ins l k l l k l bk k N PG PI BKF PG PI p PG s X s _ | | ∑ ∑ = = = Độ nhiễu đ−ợc tính bằng: ( ) ( ) ( ) ( ) X N Y X N X N Y X r rel ins class ins rel ins _ _ _ − , = →
Nins_class(X,Y) là số đối t−ợng thuộc lớp Y trong số các đối t−ợng thỏa mãn X
⎪ ⎩ ⎪ ⎨ ⎧ ∈ = otherwise 0 if 1 ) | ( j i PG j i PG PI N PG PI p i nếu PIj ∈ PGi trong các tr−ờng hợp còn lại
Q trình khai phá trong bảng quyết định có thể phát hiện ra các đối t−ợng ch−a biết và nó dùng độ mạnh của luật để biểu diễn t−ờng minh tính khơng chắc chắn của luật, bao gồm cả khả năng luật dự đốn các đối t−ợng có thể.
Để chọn ra các luật trong bảng quyết định, ta dựa trên các tiêu chuẩn nh−: - Chọn các luật phủ càng nhiều đối t−ợng càng tốt
- Chọn các luật chứa càng ít thuộc tính càng tốt, nếu chúng phủ cùng số đối t−ợng
- Chọn các luật mạnh hơn, nếu chúng có cùng số thuộc tính điều kiện và phủ cùng số đối t−ợng
Các thuộc tính tham gia trong luật cần đ−ợc chọn sao cho số đối t−ợng tăng nhanh hơn, nhằm có tập con các thuộc tính càng nhỏ càng tốt, và chúng nên có số giá trị ít hơn, để đảm bảo số đối t−ợng do luật này bao phủ càng lớn càng tốt.
Xét bảng cơ sở dữ liệu nêu trên:
U Đau đầu đầu Nhiệt độ Mỏi cơ Bị cúm U Đau đầu Nhiệt độ Mỏi cơ Bị cúm u1 Có BT Có Có ⇒ u1’ Có BT Có ⊥ u2 Có Cao Có Có u2 Có Cao Có Có u3 Có BT Có Có u4 Ko Cao Ko Ko u4 Ko Cao Ko Ko u6 Có Rất cao Có Ko u5 Có BT Có Ko u7 Ko Cao Có Có u6 Có Rất cao Có Ko u7 Ko Cao Có Có r(có)(u1') = 1 - 2/3 = 0,33 r(không)(u1') = 1 - 1/3 = 0,67
Đặt Tnhiễu = 0 ⇒ r(có)(u1') > Tnhiễu; r(không) (u1') > Tnhiễu và Bị cúm(u1') = ⊥ Tạo véctơ phân biệt cho u2:
u1’ u2 u4 u6 u7
u2 Nhiệt độ λ Đau đầu, Mỏi cơ Nhiệt độ λ Tìm rút gọn cho u2:
fT(u2) = (Nhiệt độ) ∧ T ∧ (Đau đầu ∨ Mỏi cơ) ∧ (Nhiệt độ) ∧ T = (Nhiệt độ) ∧ (Đau đầu ∨ Mỏi cơ) = (Nhiệt độ) ∧ (Đau đầu ∨ Mỏi cơ)
= (Đau đầu ∧ Nhiệt độ) ∨ (Nhiệt độ ∧ Mỏi cơ)
Tạo luật từ u2: