Làm thô các giá trị thuộc tính điều kiện

Một phần của tài liệu Khai phá luật quyết định trên bảng dữ liệu có các giá trị thuộc tính thay đổi (Trang 29)

Định lý 2.1

Giả sử sau thời điểm t, hai giá trị w, y của thuộc tính a C đƣợc làm thô thành giá trị mới z, z Va. Tại thời điểm t + 1, tồn tại hai lớp tƣơng đƣơng điều kiện Cp, Cq nào đó đƣợc làm thô thành lớp tƣơng đƣơng điều kiện mới Cs, khi và chỉ khi aj a, ft(Cp, aj) = ft(Cq, aj).

Chứng minh: ( ) Do Cp, Cq đƣợc làm thô thành Cs nên aj a, ft(Cp, aj) = ft+1(Cs, aj) và ft(Cq, aj) = ft+1(Cs, aj). Do đó, ft(Cp, aj) = ft(Cq, aj). ( ) Vì aj a, ft(Cp, aj) = ft(Cq, aj) nên ft+1(Cp, aj) = ft+1(Cq, aj) (2.1) Mặt khác, do các giá trị w, y đƣợc làm thô thành giá trị z nên

+ hoặc ft(xp, a) = w do đó ft(Cp, a) = w suy ra ft+1(Cp, a) = z + hoặc ft(xq, a) = y do đó ft(Cq, a) = y suy ra ft+1(Cq, a) = z

Nhƣ vậy, ft+1(Cp, a) = ft+1(Cq, a) (2.2) Từ (2.1) và (2.2) ta có Cp = Cq, nghĩa là hai lớp tƣơng đƣơng điều kiện Cp, Cq đƣợc làm thô thành lớp điều kiện mới Cs.

Hệ quả 2.1 [4]

Nếu sau thời điểm t, hai lớp tƣơng đƣơng điều kiện Cp, Cq nào đó đƣợc làm thô thành lớp điều kiện mới Cs thì tại thời điểm t+1, ta có:

(ii) Dj U/D, Sup(Cp, Dj) + Sup(Cq, Dj) = Sup(Cs, Dj), ở đây j = 1, …, n

Chứng minh

(1)Chứng minh (i)

- Xét x Cp Cq tại thời điểm t. Suy ra x Cp hoặc x Cq Xẩy ra hai trƣờng hợp:

+ Giả sử x Cp khi đó aj a, ft(x, aj) = ft(Cp, aj) = ft+1(Cs, aj) Mặt khác, vì ft(x,a) = ft(Cp, a) =w nên ft+1(x,a) = ft+1(Cs, a) Hoặc ft(x,a) = ft(Cp,a) = y nên ft+1(x,a) = ft+1(Cs, a)

Suy ra x Cs

+ Giả sử x Cq, tƣơng tự ta cũng có ngay x Cs

Suy ra Cp Ck Cs (2.3)

- Xét x Cs tại thời điểm t+1. Ta có aj a: ft(x, aj) = ft+1(Cs, aj) Mặt khác, x Cs nên ft+1(Cs, a) = z nghĩa là ft+1(x, a) = z. Xẩy ra hai trƣờng hợp: + Hoặc ft(x, a) = w khi đó x Cp + Hoặc ft(x, a) = y khi đó x Cq Suy ra: Cs Cp Cq (2.4) Từ (2.3), (2.4) ta có Cs = Cp Cq (2) Chứng minh (ii)

Vì Cp, Cq khác nhau ở giá trị thuộc tính a nên Cp Cq =

Suy ra |Cp Cq| = 0. Khi đó, ta có: Sup(Cs, Dj) = |Cs Dj|

= |(Cp Cq) Dj|

= |(Cp Cq) (Cq Dj)|

= |Cp Dj| + |Cq Dj|

= Sup(Cp, Dj) + Sup(Cq, Dj).

Từ hệ quả này ta có, sau thời điểm t, hai dòng tƣơng ứng với hai lớp tƣơng tƣơng điều kiện Cp, Cq trong ma trận độ hỗ trợ đƣợc kết hợp thành một dòng mới tƣơng ứng với lớp tƣơng đƣơng điều kiện Cs tại thời điểm t+1 với giá trị là tổng giá trị các phần tử của hai dòng này.

Một phần của tài liệu Khai phá luật quyết định trên bảng dữ liệu có các giá trị thuộc tính thay đổi (Trang 29)