Độphức tạp thuật toán

Một phần của tài liệu Khai phá luật dữ liệu trên bảng dữ liệu có thuộc tính thay đổi (Trang 41 - 44)

* Mệnh đề 2.1:

Độ phức tạp thời gian của thuật toán tính ma trận độ hỗ trợ tại thời điểm t là O(|U)2

).

Chứng minh:

Giả sử lực lượng trung bình của lớp điều kiện là

m U | |

và lực lượng trung bình của lớp quyết định là

n U | |

.

Khi đó, để tính độ hỗ trợ của một luật cần thực hiện

m U | | * n U | | phép tính. Có mn phần tử thì cần thực hiện phép tính là: m U | | * n U | | * mn = |U|2. Do vậy độ phức tạp thực hiện thuật toán là: O(|U|2).

* Mệnh đề 2.2:

Độ phức tạp thời gian của thuật toán tính ma trận độ hỗ trợ tại thời điểm t+1 khi làm thô các giá trị thuộc tính điều kiện là O(|U|2

Chứng minh:

Cần m(m-1)/2 phép so sánh để tìm cặp lớp tương đương điều kiện Cp, Cq sẽ được kết hợp thành một lớp tương đương điều kiện mới.

Với mỗi cặp lớp tương đương Cp, Cq cần n phép cộng 2 dòng này để được dòng mới. Hơn nữa, vì có |CC| cặp, nên ta cần n*|CC| phép cộng.

Do vậy cần m*(m-1)/2+n*|CC| phép toán.

Vì |CC| m/2; m,n |U| nên |CC| |U|/2. Suy ra độ phức tạp thời gian thuật toán là O(|U|2).

* Mệnh đề 2.3:

Độ phức tạp thời gian của thuật toán tính ma trận độ hỗ trợ tại thời điểm t+1 khi làm mịn các giá trị thuộc tính điều kiện O(|U|2

).

Chứng minh:

Cần m phép tính để kiểm tra tất cả các lớp tương đương điều kiện mới Cp, Cq.

Với mỗi lớp thỏa mãn, cần n phép tính độ hỗ trợ của mỗi luật, trong đó mỗi phép tính cần m U | | * n U | | phép so sánh, đồng thời cần n phép trừ để tính giá trị các phần tử tại cột j.

Do vậy, số phép tính cần thực hiện là: m + số lớp thỏa mãn *n* m U | | * n U | | +n.

Trong trường hợp tồi nhất, số lớp thỏa mãn sẽ là m. Do đó, cần nhiều nhất là: m+n*n* m U | | * n U | | +n = m+n+|U|2 phép toán.

Vì m, n |U|, suy ra độ phức tạp thời gian của thuật toán là O(|U|2). * Mệnh đề 2.4:

Độ phức tạp thời gian của thuật toán tính ma trận độ hỗ trợ tại thời điểm t+1 khi làm thô các giá trị thuộc tính quyết định là O(|U|).

Chứng minh:

Trường hợp tồi nhất cần 2n phép tính để tìm 2 lớp quyết định được kết hợp thành lớp tương đương quyết định mới.

Để tính độ hỗ trợ của các luật Ci Dz cần m phép cộng. Vậy số phép tính cần thực hiện là 2n+m phép tính.

Vì m,n |U|. Suy ra độ phức tạp thời gian của thuật toán là O(|U|).

* Mệnh đề 2.5:

Độ phức tạp thời gian thuật toán tính ma trận độ hỗ trợ tại thời điểm t+1 khi làm mịn các giá trị thuộc tính quyết định O(|U|2).

Chứng minh:

Cần n phép kiểm tra để tìm lớp quyết định được tách thành 2 lớp mới. Với mỗi lớp, cần m phép tính độ hỗ trợ và m phép trừ. Vậy cần m+n* m U | | * n U | | +m = m+n+ n U |2 | phép tính.

Vì m, n |U|. Suy ra độ phức tạp thời gian của thuật toán là O(|U|2)

* Mệnh đề 2.6:

Độ phức tạp thời gian của thuật toán tính ma trận độ chính xác và độ phủ là O(|U|2).

Chứng minh:

Để tính ma trận độ chính xác Acc cần m(n-1) phép tính tổng dòng, |U|2 phép tính để tính độ hỗ trợ và mn phép chia. Do vậy, cần m(n-1) + |U|2

+ mn phép tính (m, n là kích thước ma trận độ hỗ trợ tại thời điểm t+1).

Tương tự, để tính ma trận độ chính xác Cov cũng cần mn-m-n+2|U|2 phép tính.

Suy ra, để tính ma trận độ chính xác và ma trận độ phủ cần 4mn-m- n+2|U|2 phép tính.

* Mệnh đề 2.7:

Độ phức tạp của thuật toán trích rút luật quyết định có ý nghĩa là O(|U|2).

Chứng minh:

Với mỗi phần từ Acc(Ci, Dj) hoặc Cov(Ci, Dj), ta cần 1 phép so sánh với ngưỡng, có tất cả 2mn phép so sánh.

Vì m, n |U|, nên suy ra thuật toán này có độ phức tạp thời gian O(|U|2)

* Mệnh đề 2.8:

Độphức tạp thuật toán trích rút các luật quyết định có ý nghĩa khi làm thô, làm mịn các giá trị thuộc tính là O(|U|2).

Chứng minh:

Kết quả này được suy ra trực tiếp từ kết quả của các mệnh đề từ 2.1 đến mệnh đề 2.7.

Độ phức tạp không gian:

Trong các thuật toán từ 2.1 đến 2.6 được trình bày ở trên, ngoài m ô nhớ để lưu các lớp tương đương điều kiện và n ô nhớ để lưu các lớp tương đương quyết định, ta chỉ cần thêm mn ô nhớ để lưu một ma trận độ hỗ trợ. Do đó thuật toán cần tất cả mn+m+n ô nhớ. Hơn nữa, vì m,n |U|. Do đó thuật toán có độ phức tạp không gian là O(|U|2

).

Một phần của tài liệu Khai phá luật dữ liệu trên bảng dữ liệu có thuộc tính thay đổi (Trang 41 - 44)