Cơ sở tiếp cận thuật toán

Một phần của tài liệu Một số thuật toán khai phá luật quyết định trên cơ sở dữ liệu di động (Trang 54)

Ta cũng giả thiết N đối tƣợng mới đƣợc thêm vào sẽ tạo ra 𝑙 phân lớp điều kiện mới 𝐶𝑚 +1 , ..., 𝐶𝑚 +𝑙 và 𝑟 lớp quyết định mới 𝐷𝑛+1, ...., 𝐷𝑛+𝑟. Khi đó, ∀ 𝑥 ∈ 𝑵, ta có thể đƣợc số phần tử 𝑁𝑖 thuộc vào lớp điều kiện 𝐶𝑖 với 𝑖 = 1, . . . , 𝑚 + 𝑙. Và số các phần tử 𝑀𝑖 ra khỏi phân lớp điều kiện 𝐶𝑖 với 𝑖 = 1, . . . , 𝑚 + 𝑙. Trong 𝑁𝑖 đối tƣợng bổ sung vào lớp 𝐶𝑖 có 𝑁𝑖𝑗 đối tƣợng thuộc trong phân lớp quyết định 𝐷𝑗 với 𝑗 = 1, . . . , 𝑛 + 𝑟. Do đó 𝑁𝑖𝑗 là số đối tƣợng đƣợc bổ sung vào cả 𝐶𝑖 và 𝐷𝑗. Số phần tử giao giữa 𝐶𝑖 và 𝐷𝑗 tăng thêm 𝑁𝑖𝑗 đối tƣợng. Do đó, độ hỗ trợ của luật 𝐶𝑖 → 𝐷𝑗 tăng thêm 𝑁𝑖𝑗. Trong 𝑀𝑖 đối tƣợng bị loại ra khỏi phân lớp điều kiện 𝐶𝑖 thì có 𝑀𝑖𝑗 đối tƣợng ra khỏi phân lớp quyết định 𝐷𝑗 với 𝑗 = 1, . . . , 𝑛. Tƣơng tự, ta cũng nhận thấy 𝑀𝑖𝑗 chính là số đối tƣợng bị loại khỏi 𝐶𝑖 và 𝐷𝑗. Số phần tử giao giữa 𝐶𝑖 và 𝐷𝑗 giảm đi 𝑀𝑖𝑗 đối tƣợng. Do đó, độ hỗ trợ của luật 𝐶𝑖 → 𝐷𝑗 giảm đi 𝑀𝑖𝑗.

Từ cơ sở nêu trên ta có công thức: 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖, 𝐷𝑗 = 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖, 𝐷𝑗 + 𝑁𝑖𝑗 − 𝑀𝑖𝑗 với 𝑖 = 1, . . . , 𝑚 + 𝑙; 𝑗 = 1, . . . , 𝑛 + 𝑟; Trong đó, 𝑀𝑖𝑗 = 0 và 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖, 𝐷𝑗 = 0

∀ 𝑖 = 𝑚 + 1, … , 𝑚 + 𝑙; 𝑗 = 𝑛 + 1, … , 𝑛 + 𝑟.

3.2.2.Các tình huống thực hiện mô hình

Cũng giống nhƣ thuật toán của Liu, thuật toán tính toán gia tăng ma trận độ hỗ trợ cũng có các tình huống sau khi bổ sung/ loại bỏ một đối tƣợng ở thởi điểm t+1:

3.2.2.1. Bổ sung đối tượng đơn vào hệ thống

Giả thiết đối tƣợng 𝑥 đƣợc bổ sung vào hệ thống.

Trường hợp 1: Hình thành một lớp điều kiện mới và một lớp quyết định mới.

Trong trƣờng hợp này, ta thấy 𝑥 ∉ 𝐶𝑖 (𝑖 = 1, … , 𝑚) và 𝑥 ∉ 𝐷𝑖 (𝑖 = 1, … , 𝑛). Điều này có nghĩa là việc bổ sung 𝑥 vào hệ thống sẽ hình thành thêm một lớp điều kiện mới 𝐶𝑚 +1 và một lớp quyết định mới 𝐷𝑛+1 ở thời điểm t+1 để tạo ra một luật mới phù hợp. Do đó, ma trận độ hỗ trợ sẽ đƣợc bổ sung một dòng mới (𝑖∗) và một cột mới (𝑗∗). Trong đó, ta thấy chỉ có phần tử giao của dòng 𝑖∗ và cột 𝑗∗ có giá trị bằng 1, còn các phần tử còn lại trên cột và dòng mới này đều bằng 0:

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖∗, 𝐷𝑗∗ = 1

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑢, 𝐷𝑗∗ = 0 với (𝑢 ≠ 𝑖∗)

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖, 𝐷𝑗 = 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖, 𝐷𝑗 với (𝑖 ≠ 𝑖∗, 𝑗 ≠ 𝑗∗)

Trường hợp 2: Chỉ hình thành một lớp điều kiện mới. Trong trƣờng hợp này, ta

thấy 𝑥 ∉ 𝐶𝑖 𝑖 = 1, … , 𝑚 và ∃𝑗∗∈ 1, … , 𝑛 sao cho 𝑥 ∈ 𝐷𝑗∗. Để tạo đƣợc một luật phù hợp thì hệ thống sẽ hình thành một lớp điều kiện mới 𝐶𝑚 +1 và 𝑥 sẽ đƣợc thêm vào một phân lớp quyết định 𝐷𝑗∗ với 𝑗∗ ∈ 1, … , 𝑛 . Do đó, ma trận độ hỗ trợ thời điểm t sẽ có một dòng mới 𝑖∗. Lúc này, ta tăng giá trị của phần tử giao của dòng 𝑖∗ và cột 𝑗∗ lên 1 và các phần tử khác trên dòng 𝑖∗gán bằng 0. Còn giá trị của các phần tử trên cột 𝑗∗

thì không đổi.

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖∗, 𝐷𝑗∗ = 1

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖∗, 𝐷𝑘 = 0 với (𝑘 ≠ 𝑗∗)

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖, 𝐷𝑗 = 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖, 𝐷𝑗 với (𝑖 ≠ 𝑖∗)

Trường hợp 3: Chỉ hình thành một lớp quyết định mới. Trong trƣờng hợp này,

ta thấy ∃𝑖∗ ∈ 1, … , 𝑚 sao cho 𝑥 ∈ 𝐶𝑖∗ và 𝑥 ∉ 𝐷𝑗, 𝑗 = 1, … , 𝑛. Việc bổ sung 𝑥 vào hệ thống đã sinh ra một luật mới chƣa hợp lệ. Do đó ta hình thành thêm một lớp quyết định mới. Khi này, ma trận độ hỗ trợ thời điểm t sẽ đƣợc bổ sung thêm một cột mới 𝑗∗. Lúc này, ta tăng giá trị của phần tử giao của dòng 𝑖∗ và cột 𝑗∗ lên 1 và các phần tử khác trên cột 𝑗∗ gán bằng 0. Còn giá trị của các phần tử trên hàng 𝑖∗ thì không đổi.

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖∗, 𝐷𝑗∗ = 1

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑢, 𝐷𝑗∗ = 0 với (𝑢 ≠ 𝑖∗)

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖, 𝐷𝑗 = 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖, 𝐷𝑗 với ( 𝑗 ≠ 𝑗∗)

Trường hợp 4: Không hình thành lớp quyết định mới và cũng không hình thành lớp điều kiện mới. Trong trƣờng hợp này, ta thấy ∃𝑖∗ ∈ 1, … , 𝑚 sao cho 𝑥 ∈ 𝐶𝑖∗ và ∃𝑗∗ ∈ 1, … , 𝑛 sao cho 𝑥 ∈ 𝐷𝑗∗. Việc bổ sung 𝑥 làm tăng thêm một luật phù hợp 𝐶𝑖∗ → 𝐷𝑗∗ mà không phát sinh thêm lớp điều kiện (quyết định) nào. Điều này có nghĩa là việc thêm 𝑥 ảnh hƣởng tới dòng 𝑖∗ và cột 𝑗∗. Nó làm cho phần tử giao trên ma trận độ hỗ trợ của dòng 𝑖∗ và cột 𝑗∗ sẽ tăng lên 1 còn các phần tử còn lại sẽ không thay đổi.

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖∗, 𝐷𝑗∗ = 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖∗, 𝐷𝑗∗ + 1

 𝑆𝑢𝑝𝑝𝑡+1 𝐶𝑖, 𝐷𝑗 = 𝑆𝑢𝑝𝑝𝑡 𝐶𝑖, 𝐷𝑗 với (𝑖 ≠ 𝑖∗, 𝑗 ≠ 𝑗∗)

3.2.2.2. Loại bỏ đối tượng đơn ra khỏi hệ thống

Giả sử ta có đối 𝑥 ra khỏi hệ thống thông tin. Điều này tƣơng đƣơng với việc sẽ ∃𝑖∗ ∈ 1, … , 𝑚 và ∃𝑗∗ ∈ (1, … , 𝑛) sao cho 𝑥 ∈ 𝐶𝑖∗, 𝑥 ∈ 𝐷𝑗∗. Điều này có nghĩa là việc bỏ 𝑥 sẽ ảnh hƣởng tới dòng 𝑖∗ và cột 𝑗∗. Nó làm cho phẩn tử giao trên ma trận độ hỗ trợ của dòng 𝑖∗ và cột 𝑗∗ sẽ giảm đi 1 còn các phần tử còn lại sẽ không thay đổi.

3.2.3.Thuật toán

3.2.3.1. Các bước thực hiện thuật toán:

Bƣớc 1: Tính ma trận độ hỗ trợ thời điểm t

Từ hệ thống thông tin ban đầu tìm các phân lớp điều kiện và phân lớp quyết định. Sau đó, ta tính ma trận độ hỗ trợ ở thởi điểm t theo công thức ở định nghĩa 1.3: 𝑆𝑢𝑝𝑝 𝐶𝑖, 𝐷𝑗 = |𝐶𝑖 ∩ 𝐷𝑗| cho các luật 𝐶𝑖 → 𝐷𝑗.

Bƣớc 2: Tính ma trận độ hỗ trợ ở thời điểm t+1

Tính toán ma trận độ hỗ trợ thời điểm t+1 tùy thuộc vào việc thêm/ bớt các đối tƣợng vào hệ thống để áp dụng các công thức tính độ hỗ trợ đã nêu ở mục 3.2.2 cho các luật quyết định Ci → Dj .

Xây dựng ma trận hỗ trợ ở thời điểm t+1

Bƣớc 3: Loại bỏ các hàng/cột có giá trị 0 trong ma trận độ hỗ trợ ở thời điểm t+1

Kiểm tra các hàng/ cột trên ma trận 𝑆𝑢𝑝𝑝𝑡+1 𝐶, 𝐷 . Nếu có hàng/ cột nào toàn giá trị không thì ta xóa hàng/ cột này đi.

Bƣớc 4: Tính các ma trận độ chính xác và ma trận độ phủ ở thời điểm t+1:

Theo công thức ở định nghĩa 1.3 tính các ma trận 𝐴𝑐𝑐𝑡+1(𝐶, 𝐷), 𝐶𝑜𝑣𝑡+1 𝐶, 𝐷 . Chọn các luật có bộ độ phủ và độ chính xác đạt ngƣỡng cho phép để trích ra các luật quyết định có ý nghĩa (định nghĩa 1.4).

3.2.3.2. Các thuật toán mô phỏng bằng mã chương trình

Thuật toán 3.2: Thuật toán gia tăng ma trận độ hỗ trợ

Dữ liệu đầu vào:

Các lớp tƣơng đƣơng điều kiện 𝐶𝑖 Các lớp tƣơng đƣơng quyết định 𝐷𝑗 Bộ 2 ngƣỡng độ chính xác α và độ phủ γ

Tập N chứa các phần tử đƣợc bổ sung vào hệ thống Tập M chứa các phần tử loại bỏ khỏi hệ thông

Kết quả đầu ra: Ma trận độ hỗ trợ, ma trận độ chính xác, ma trận độ phủ và các luật

có nghĩa tại thời điểm t+1

//Tính ma trận độ phủ tại thời điểm t

for (int i=1;i<=m;i++)

for (int j=1;j<=n;j++) {

𝑆𝑢𝑝𝑝 𝐶𝑖, 𝐷𝑗 = |𝐶𝑖 ∩ 𝐷𝑗| }

// Tính ma trận độ hỗ trợ thời điểm t+1 khi bổ sung một đối tượng x vào hệ thống

int l=0, r=0,i*, j*;

foreach (int item in N) {

i*= -1; j*=-1;

for (int i=1;i<=m+l; i++) {

// tìm thấy x thuốc lớp Ci

if (x∈ Ci) {

i* =i; //tìm thấy x thuộc một lớp Ci break;

}

// x không thuộc một lớp điều kiện nào, hình thành một lớp điều kiện //mới

if (i* == -1) {

i* =m+l+1; thêm lớp Cm+l+1;

//tạo dòng thứ (m +l+1) mới với các phần tử=0 trong ma trận Supp;

for (int j=0;i<=n+r; j++) { Supp(Dm+l+1, Dj)=0; } p=p+1; } }

//tìm x có thuộc lớp quyết định nào không for (int j=1;j<=n+r;j++) { if (x ∈ Dj) { j* =j;// tìm thấy x thuộc một lớp Dj break; }

// nếu x không thuộc lớp điều kiện nào thì hình thành lớp điều kiện mới: Dn+r+1 if (j==-1)

{

Bổ sung lớp Dn+r+1 ;

//Bổ sung cột thứ (n+r+1) mới với các phẩn tử =0; for (int i=0;i<=m+l; i++)

{ Supp(Ci, Dn+r+1 )=0; } q=q+1; } }

Suppt+1(Ci*, Dj*) =Suppt(Ci*, D j*) +1 ; // cập nhật phần tử ma trận Supp thởi điểm t+1

}

// Tính ma trận độ hỗ trợ thời điểm t+1 khi loại bỏ một đối tượng 𝑥 ra khỏi hệ thống

foreach (int item in M) {

i* = -1; j*=-1;

for (int i=1;i<=m+l; i++) { // tìm thấy x thuốc lớp Ci if (x∈ Ci) { i* =i; break; } } //tìm x có thuộc lớp quyết định Dj for (int j=1;j<=n+r;j++) { if (x ∈ Dj) { j* =j;// tìm thấy x thuộc một lớp Dj break; } }

// cập nhật phần tử ma trận Supp thởi điểm t+1 Suppt+1(Ci*, Dj*) =Suppt(Ci*, D j*) -1 ; }

// Thuật toán xóa bỏ hàng/ cột toàn 0 trên ma trận độ hỗ trợ thời điểm t+1.

//xóa dòng thứ i có các phần tử toàn giá trị 0 for (int i=1;i<=m+l; i++)

{

for (int j=1; j<n=r; j++) {

{

Supp(Ci, Dj)=Supp(Ci+1, Dj)// xóa dòng thứ i l=l-1;

} else break; }

}

//xóa cột thứ j có các phần tử toàn giá trị 0 for (int j=1; j<n=r; j++)

{

for (int i=1;i<=m+l; i++) {

if (Supp(Ci, Dj)==0) {

Supp(Ci, Dj)=Supp(Ci, Dj+1)// xóa cột thứ j r=r-1; } else break; } } 3.2.4.Độ phức tạp tính toán

Độ phức tạp tính toán ma trận độ hỗ trợ thời điểm t: Số phần tử trung bình

của m lớp tƣơng đƣơng điều kiện |𝑈|

𝑚; số phần tử trung bình của n lớp tƣơng đƣơng quyết định |𝑈|

𝑛 . Độ hỗ trợ của một luật tƣơng ứng từ một phần tử trong lớp điều kiện với một phần tử trong lớp quyết định: |𝑈|

𝑚 ∗|𝑈|

𝑛 và số lần thực hiện phép tính này là m*n lần. Vậy ta có độ phức tạp tính toán của ma trận hỗ thời điểm t: |𝑈|

𝑚 ∗|𝑈|

𝑛 ∗ 𝑚 ∗ 𝑛 = 𝑈 2 . Vậy độ phức tạp tính toán 𝑂( 𝑈 2)

Độ phức tạp tính toán khi bổ sung N đối tƣợng vào hệ thống ở thời điểm t+1:

Nếu ta gọi 𝑚∗, 𝑛∗ là số lớp quyết điều kiện, lớp quyết định trƣớc thời điểm so sánh. Khi bổ sung một đối tƣợng 𝑥 vào hệ thống, ta cần 𝑚∗+ 𝑛∗ phép so sánh. Do chƣơng trình cần thực hiện 𝑚∗ phép kiểm tra xem đối tƣợng 𝑥 có thuộc lớp tƣơng đƣơng điều kiện nào không và 𝑛∗ phép kiểm tra xem 𝑥 có thuộc lớp tƣơng đƣơng quyết định nào không. Khi biết x đã thuộc lớp điều kiện, quyết định nào ta chỉ cần cập lại các phần tử có sự thay đổi trên ma trận độ hỗ trợ do việc bổ sung 𝑥. Ta thấy hầu hết phép tính là phép gán và phép cộng nên độ phức tạp của nó là hằng số. Ngoài ra , ta thấy 𝑚∗≤ 𝑚 + 𝑙 ≤ |𝑈|, 𝑛∗≤ 𝑛 + 𝑟 ≤ |𝑈|. Vì vậy, độ phức tạp tính toán khi bổ sung 1 đối tƣợng

𝑥 vào hệ thống là O (|U|). Độ phức tạp tính toán khi bổ sung N đối tƣợng vào hệ thống O (N|U|).

Độ phức tạp tính toán khi loại bỏ M đối tƣợng ra khỏi hệ thống ở thời điểm t+1: Tƣơng tự nhƣ cách tính khi bổ sung N đối tƣợng vào hệ thống. Độ phức tạp tính

toán khi loại bỏ M đối tƣợng ra khỏi hệ thống là O (M|U|).

Độ phức tạp tính toán khi loại bỏ dòng/cột có giá trị các phần tử toàn là 0 trên ma trận độ hỗ trợ thơi điểm t+1: Để kiểm tra hàng/cột có toàn giá trị 0 hay không, ta cần (𝑚 + 𝑙) ∗ (𝑛 + 𝑟) phép tính (thực hiện 2 vòng lặp lồng nhau). Để kiểm tra cả hàng lẫn cột, ta cần 2 ∗ (𝑚 + 𝑙) ∗ (𝑛 + 𝑟) phép tính. Ta cũng dễ thấy 𝑚 ≤ 𝑈 , 𝑛 ≤ |𝑈|. Độ phức tạp của phép toán là O(2|U|2

).

Độ phức tạp tính toán ma trận độ chính xác và độ phủ thời điểm t+1: Để tinh ma trân độ chính xác ta cần m phép tính để đếm các phần tử trong mỗi lớp, |𝑈 2

phép tính độ hỗ trợ và m*n phép tính chia. Vì vậy ta có độ phức tạp tính toán là 𝑚 + 𝑈 2 + 𝑚 ∗ 𝑛 ≤ 𝑈 2 ( do m, n chỉ tối đa bằng |U|). Tƣơng tự ta có độ tính toán ma trận độ phủ: 𝑛 + 𝑈 2 + 𝑚 ∗ 𝑛 ≤ 𝑈 2. Vậy độ phức tạp tính toán của ma trận độ chính xác và ma trận độ phủ 𝑂( 𝑈 2)

Độ phức tạp tính toán khi trích rút các luật có ý nghĩa tại thởi điểm t+1: Với

mỗi phần tử 𝐴𝑐𝑐(𝐶𝑖, 𝐷𝑗) và 𝐶𝑜𝑣(𝐶𝑖, 𝐷𝑗) ta cần so sánh với một bộ 2 ngƣỡng α và γ cho trƣớc vì vậy ta cần 2* m*n phép so sánh. Do m, n chỉ tối đa lớn nhất là bằng |U| nên độ phức tạp tính toán là 𝑂( 𝑈 2)

Qua việc tính độ chính xác, độ phủ và việc trích rút các luật ở thời điểm t+1, ta thấy thuật toán khai phá luật quyết định dựa trên tính toán ma trân độ hộ trợ thời điểm t, ma trận độ hỗ trợ thời điểm t+1, ma trận độ phủ, ma trận độ chính xác theo hƣớng tiếp cận gia tăng ma trận độ hỗ trợ khi bỏ sung/ loại bỏ đối tƣợng ra khỏi hệ thống có độ phức tạp tính toán theo thời gian là 𝑂( 𝑈 2).

3.2.5.Ví dụ minh họa

Ta thực hiện ví dụ ở mục 3.1.5 cho phƣơng pháp theo hƣớng tiếp cận gia tăng ma trận độ hỗ trợ:

Bƣớc 1: Tính ma trận độ hỗ trợ ở thời điểm t Ta áp dụng công thức:

𝑆𝑢𝑝𝑝 𝐶𝑖, 𝐷𝑗 = |𝐶𝑖 ∩ 𝐷𝑗| Xây dựng ma trận độ hỗ thời điểm t:

𝑆𝑢𝑝𝑝 𝐶, 𝐷 = 𝑆𝑢𝑝𝑝 𝐶𝑖, 𝐷𝑗 6×4 𝑆𝑢𝑝𝑝t(C, D) = 20 0 0 0 25 15 0 0 0 35 5 0 0 0 52 0 3 30 57 0 0 15 25 40 (3.15)

Bƣớc 2 xây dựng ma trận độ hỗ trợ thời điểm t+1

Trƣờng hợp (1): Ta thêm 10 đối tƣợng có giá trị thuộc tính là (các dịch vụ giải trí = trung bình, điện tiêu thụ = cao, nƣớc tiêu thụ = trung bình; đánh giá thu nhập = cao). Ta nhận thấy 10 đối tƣợng này chính là 𝑥6. Mà ta thấy 𝑥6 ∈ 𝐶4 và 𝑥6 ∈ 𝐷3, do đó ma trận độ hỗ trợ có sự thay đổi giá trị phẩn tử giao giữa dòng 4 và cột 3. Còn các phần tử khác trên ma trận không đổi so với thời điểm t. Ta có:

𝑆𝑢𝑝𝑝 𝐶′ 4, 𝐷′ 3 = 𝑆𝑢𝑝𝑝 𝐶4, 𝐷3 + 10 Ta cập nhật ma trận độ hỗ trợ (3.15): 𝑆𝑢𝑝𝑝𝑡(𝐶, 𝐷) = 20 0 0 0 25 15 0 0 0 35 5 0 0 0 62 0 3 30 57 0 0 15 25 40 (3.16)

Trƣờng hợp (2): Thêm 20 đối tƣợng có giá trị thuộc tính là (các dịch vụ giải trí = cao, điện tiêu thụ = rất cao, nƣớc tiêu thụ = cao; đánh giá thu nhập = rất cao). Ta thấy các lớp điều kiện của 20 đối tƣợng mới này không thuộc lớp điều kiện nào trong hệ thống. Do đó ta tƣợng trƣng cho 20 đối tƣợng này là 𝑥13 và cần hình thành lớp điều kiện mới 𝐶7. Bên cạnh đó, ta cũng nhận thấy thuộc tính quyết định “đánh giá thu nhập = rất cao” thuộc lớp quyết định 𝐷4 do đó nó ảnh hƣởng đến giá trị các phần tử trên cột 4 của ma trận. Nhƣ vậy phần tử 𝑆𝑢𝑝𝑝(𝐶′7, 𝐷′4) = 𝑆𝑢𝑝𝑝 𝐶7, 𝐷4 + 20. Các phần tử còn lại trên dòng 7 của ma trận độ hỗ trợ đều bằng 0.

Ta cập nhật ma trận độ phủ (3.16): 𝑆𝑢𝑝𝑝𝑡(𝐶, 𝐷) = 20 0 0 0 25 15 0 0 0 35 5 0 0 0 62 0 3 30 57 0 0 15 25 40 0 0 0 20 (3.17)

Trƣờng hợp (3): Loại bỏ 20 đối tƣợng có giá trị thuộc tính là (các dịch vụ giải trí = thấp, điện tiêu thụ = thấp, nƣớc tiêu thụ = thấp; đánh giá thu nhập = thấp). Ta thấy 20 đối tƣợng này chính là 𝑥1. Do 𝑥1 ∈ 𝐶1 và 𝑥1 ∈ 𝐷1, việc loại bỏ 20 đối tƣợng này sẽ ảnh hƣởng tới dòng 1 và cột 1 của ma trận (3.11). Ta có

𝑆𝑢𝑝𝑝 𝐶1′, 𝐷1′ = 𝑆𝑢𝑝𝑝 𝐶1, 𝐷1 − 20. Các phần tử khác trên ma trận không đổi. Cập nhật ma trận (3.17)

Một phần của tài liệu Một số thuật toán khai phá luật quyết định trên cơ sở dữ liệu di động (Trang 54)

Tải bản đầy đủ (PDF)

(71 trang)