Mô hình thuật toán thử nghiệm

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số phương pháp tìm các luật kết hợp phân lớp trên tập mẫu học và ứng dụng (Trang 59 - 62)

Thuật toán (tìm các luật kết hợp phân lớp) [5]

Input: tập D* là bảng quan hệ có m phần tử trên tập các thuộc tính R = {A,B,C,D,E}, với E là thuộc tính phân lớp;

Output: Tập SCAR, tập các luật kết hợp phân lớp dạng X={A,B,C,D} → E với X là tập con các khoản mục.

Bước 1: Ta tính toán hệ bằng nhau ED* của tập mẫu học như sau: ED* = { Ei,j: 1 ≤ i < j ≤ n và Ei,j = {a ∈ R; ti(a)}; ti,tj∈ D*} Gọi ED* là hệ bằng nhau của D*.

Đối với mỗi Ei,j mà có E ∈ Ei,j đặt Mi,j = { Xi,j∪ y với Xi,j là tập các khoản mục (Ak, ti(Ak)) với Ak ∈ Ei,j; (E = y) với E ∈ Ei,j} là tập các luật kết hợp phân lớp có 2 phần tử.

(Chú ý là: tập Mi,j có thể được xác định Mi,j = { Xi,j∪ y với Xi,j là tập các khoản mục (Ak, tj(Ak)) với Ak∈ Ei,j; (E = y) với E ∈ Ei,j} vì các phần tử ti, tj có cùng giá trị trên các thuộc tính Ak – theo cách xác định tập Ei,j).

Đặt ED = {Mi,j} và gọi ED là hệ luật kết hợp phân lớp 2 phần tử của D. (Vì mỗi Xi,j đại diện cho một cặp có 2 phần tử)

Số phép toán cần thực hiện là: n(m-1)(m-2)…1 = n.m2/2. Độ phức tạp tính toán của Bước 1 là O(n.m2).

Bước 2:

Mz,l như sau:

- Tính độ hỗ trợ Mzl:

+ Ký hiệu số phần tử chứa Mz,l là s+ và tiến hành; + s+ = 1;

+ Nếu Ez,l⊆ Ei,j và thỏa mãn: (z=i) ∨ (z=j) ∨ (l=j) ∨ (l=i) tăng số đếm s+

lên 1 đơn vị (s+ = s+ + 1);

+ Tính số phần tử theo công thức:

Count(Mz,l) = (1 + √1 + 8s+)/2. + Tính độ hỗ trợ cho Mz,l:

supt = count(Mz,l)/m.

- Tính độ chắc chắn cho Mz,l như sau:

+ Ký hiệu số phần tử chứa Xi,j là s- và tiến hành: s- = 1;

+ Nếu Xz,l ⊆ Ei,j và thỏa mãn: (z=i) ∨ (z=j) ∨ (l=j) ∨ (l=i) tăng số đếm s- lên 1 đơn vị (s- = s- + 1);

+ Tính số phần tử chứa Xz,l theo công thức: Count(Xz,l) = (1 + √1 + 8s−)/2. + Tính độ chắc chắn cho Mz,l: confd (Mz,l) = s+/s-

- Nếu supt(Mz,l) ≥Minsup và confd (Mz,l) ≥ Minconfd thì SCAR = SCAR∪ Mz,l

- Tỉa các luật: nếu Mz,l⊆ Mi,j với Mz,l, Mi,j∈ SCAR thì loại Mz,l ra khỏi tập SCAR.

3.3.2. Xác định các luật kết hợp thu được

Sau khi thực hiện các phép tính toán theo thuật toán cải tiến trên, ta thu được bảng tổng hợp sau:

Mục luật s+ count supt Condset s- count confd (Thannhiet,sotnhe),Y 1 2 33% (Thannhiet, sotnhe) 6 4 50% (Thannhiet,sotcao),Y 1 2 33% (Thannhiet, sotcao) 1 2 100% (Ơnlanh,ret),Y 1 2 33% (Ơnlanh,ret) 6 4 50% (Ơnlanh,ret),N 1 2 33% (Ơnlanh,ret) 6 4 50% (đau đầu,dau dữ dội),Y 1 2 33% (Đau đầu,

đaududoi) 1 2 100%

(Thannhiet,sotnhe),(Ơn

lanh,ret),N 1 2 33%

(Thannhiet,sotn

he),(Ơnlanh,ret) 3 3 67% Như vậy nếu Minsup = 30% và Minconfd = 60% ta sẽ thấy có các mục luật sau là vừa phổ biến và chính xác:

(Thannhiet, sotnhe) không bị cúm

(Ơnlanh, ret) không bị cúm

(Thannhiet, sotcao) bị cúm

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số phương pháp tìm các luật kết hợp phân lớp trên tập mẫu học và ứng dụng (Trang 59 - 62)

Tải bản đầy đủ (PDF)

(74 trang)