Cơ sở toán học

Một phần của tài liệu Khai phá luật dữ liệu trên bảng dữ liệu có thuộc tính thay đổi (Trang 30 - 33)

2.3.2.1. Làm thô các giá trị thuộc tính điều kiện

Định lý 2.1: Giả sử sau thời điểm t, hai giá trị w, y của thuộc tính a C được làm thô thành giá trị mới z, z Va. Tại thời điểm t+1, tồn tại hai lớp tương đương điều kiện Cp, Cq nào đó được làm thô thành lớp tương đương điều kiện mới Cs, khi và chỉ khi aj a, ft(Cp, aj) = ft(Cq, aj);

Hệ quả 2.1:

Nếu sau thời điểm t, hai lớp tương đương điều kiện Cp, Cq nào đó được làm thành lớp điều kiện mới Cs thì tại thời điểm t+1, ta có:

+ Cp Cq = Cs

+ Dj U/D, độ hỗ trợ Sup(Cp, Dj) + Sup(Cq, Dj) = Sup(Cs, Dj), ở đây j = 1,...,n.

Từ đó ta có được sau thời điểm t, hai dòng tương ứng với hai lớp tương đương điều kiện Cp, Cq trong ma trận độ hỗ trợ được kết hợp thành một dòng mới tương ứng với lớp tương đương điều kiện Cs tại thời điểm t+1 với giá trị là tổng giá trị các phần tử của hai dòng này.

2.3.2.2 Làm mịn các giá trị thuộc tính điều kiện:

Định lý 2.2: Giả sử sau thời điểm t, giá trị z của thuộc tính a C được làm mịn thành hai giá trị mới w và y (w, y Va). Tại thời điểm t+1, tồn tại một lớp tương đương điều kiện Cs nào đó được làm mịn thành hai lớp tương đương điều kiện mới Cp, Cq khi vàchỉ khi:

+ Cs W với W = {x Cs: ft+1(x, a)=w} (2) + Cs Y với Y = {x Cs: ft+1(x, a)=y} (3) Chứng minh : (1)

Giả sử ft(Cs, a) z, khi đó mọi giá trị của các phần tử thuộc lớp này đều không đổi. Điều này là vô lý. Do đó ft(Cs, a) = z.

Chứng minh (2)

Giả sử Cs W = , khi đó ta có x Cs ft(x, a) = ft(Cs , a) = z.

Suy ra ft+1(x, a) = y bởi vì nếu ft+1(x, a) = w thì x W. Do vậy Cs W . Điều này trái với giả thiết.

Chứng minh (3)

Giả sử Cs Y = , khi đó ta có x Cs ft(x, a) = ft(Cs , a) = z.

Suy ra ft+1(x, a) = w bởi vì nếu ft+1(x, a) = y thì x Y. Do vậy Cs Y . Điều này trái với giả thiết.

Hệ quả 2.2:

Nếu sau thời điểm t, lớp tương đương điều kiện Cs nào đó được làm mịn thành hai lớp tương đương điều kiện mới Cp, Cq. Tại thời điểm t+1, ta có :

+ Cs = Cp Cq ;

+ Dj U/D, độ chính xác Sup(Cs, Dj) = Sup(Cp, Dj) + Sup(Cq, Dj). Ở đây j = 1,…,n.

Từ đó ta có, sau thời điểm t dòng tương ứng với lớp tương đương điều kiện Cs nào đó trong ma trận độ hỗ trợ sẽ được tách thành hai dòng mới tương ứng với hai lớp tương đương điều kiện mới Cp, Cq tại thời điểm t+1.

2.3.2.3. Làm thô các giá trị thuộc tính quyết định

Tương tự như các kết quả đã thu được khi làm thô các giá trị thuộc tính điều kiện, khi làm thô các giá trị thuộc tính quyết định ta cũng thu được kết quả như sau:

Giả sử sau thời điểm t, hai giá trị w, y của thuộc tính quyết định d được làm thô thành giá trị mới z (z Vd). Tại thời điểm t+1, tồn tại hai lớp tương đương quyết định Dw, Dy nào đó được làm thô thành một lớp tương đương quyết định mới Dz, có nghĩa là Dw Dy = Dz Với Dw={x U:ft(x,d)=w, w Vd}, Dy={x U:ft(x,d)=y, y Vd}.

Từ kết quả trên ta có hệ quả sau.

Hệ quả 2.3 :

Từ kết quả trên ta có, Ci U/C, độ hỗ trợ Sup(Ci, Dw) + Sup(Ci, Dy) = Sup(Ci, Dz), ở đây i = 1,...,m.

Ta dễ thấy rằng: Sau thời điểm t, hai cột tương ứng với hai lớp tương đương quyết định Dw, Dy sẽ kết hợp lại thành một cột tương ứng với Dz tại thời điểm t+1 với giá trị là tổng giá trị của hai cột này.

2.3.2.4. Làm mịn các giá trị thuộc tính quyết định:

Tương tự như trường hợp làm mịn các giá trị thuộc tính điều kiện, khi làm mịn các giá trị thuộc tính quyết định, ta cũng thu được kết quả như sau: (adsbygoogle = window.adsbygoogle || []).push({});

Giả sử sau thời điểm t, giá trị z của thuộc tính quyết định d được làm mịn thành hai giá trị mới w và y (w, y Vd). Tại thời điểm t+1, tồn tại một lớp tương đương quyết định Dz nào đó được làm mịn thành hai lớp tương đương quyết định mới Dw và Dy.

Hệ quả 2.4: Khi đó ta có: Ci U/C, độ hỗ trợ Sup(Ci, Dz) = Sup(Ci, Dw) + Sup(Ci, Dy), ở đây i = 1,...,m.

Ta dễ thấy rằng: Sau thời điểm t, cột tương ứng với lớp tương đương quyết định Dz nào đó trong việc tính độ hỗ trợ sẽ được tách thành hai cột mới tương ứng với hai lớp tương đương quyết định mới Dw, Dy tại thời điểm t+1. Trước tiên ta phải tính giá trị độ hỗ trợ Sup(Ci, Dy) là hiệu giữa giá trị của Sup(Ci, Dz) và Sup(Ci, Dy).

Một phần của tài liệu Khai phá luật dữ liệu trên bảng dữ liệu có thuộc tính thay đổi (Trang 30 - 33)