D trên cơ sở dựa vào việc cải tiến và phát triển thuật toán CHARM.
Chương 3 PHÁT HIỆN LUẬT KẾT HỢP HIẾM TRÊN CƠ SỞ DỮ LIỆU ĐỊNH LƯỢNG
3.3.3. Thuật toán tìm tập Sporadic không tuyệt đối hai ngưỡng mờ
3.3.3.1. Ý tưởng của thuật toán
Quá trình tìm tập Sporadic không tuyệt đối hai ngưỡng mờ được tiến hành tương tự như việc tìm các tập phổ biến mờ nói chung và bao gồm các bước cơ bản:
(a) Xây dựng tập mờ cho các thuộc tính phân loại và thuộc tính số của tập dữ liệu.
(b) Chuyển CSDL ban đầu thành CSDL mờ.
91
3.3.3.2. Thuật toán tìm tập Sporadic không tuyệt đối hai ngưỡng mờ
Hình 3.2: Thuật toán MFISI
Đầu vào: CSDL D, minSup, maxSup
Kết quả: Tập các tập Sporadic không tuyệt đối hai ngưỡng mờFIS
Bước 1: Chuyển CSDL D Í I ´ O ban đầu thành CSDL mờDF Í IF ´ OF trong đó: IF là tập các thuộc tính trong DF, mỗi thuộc tính xj của IF đều
được gắn với một tập mờ. Mỗi tập mờ có một ngưỡng
j x
c
w
Bước 2: Từ tập thuộc tính ban đầu tách thành hai tập: 1. FI = {<Xi,Ai> | sup(<Xi,Ai>) ³ maxSup; <Xi,Ai> ÎIF}
//FI là tập các thuộc tính phổ biến theo maxSup
2. IFI = {<Xj,Aj> | minSup ≤ sup(<Xj,Aj>) < maxSup; <Xj,Aj> ÎIF} //IFI là tập các thuộc tính không phổ biến theo maxSup nhưng có
độ hỗ trợ lớn hơn hoặc bằng minSup
Bước 3: Tìm các tập Sporadic không tuyệt đối hai ngưỡng mờ
// Với mỗi thuộc tính trong FI khởi tạo không gian tìm kiếm như sau:
Kết hợp mỗi thuộc tính trong FI với các thuộc tính khác bên phải thuộc tính đang xét trong FI và với tất cả các thuộc tính trong IFI. Loại bỏ các tập có độ hỗ trợ nhỏ hơn minSup để tạo không gian tìm kiếm.
3. for each <Xi,Ai> in FI do begin
4. Nodes={{<Xi,Ai>,<Yi,Bi>}; (<Yi,Bi>Î FI\<Xi,Ai> or <Yi,Bi>ÎIFI) L sup(<Xi,Ai>,<Yi,Bi>) ³ minSup}
5. MFISI-EXTEND(Nodes,C) //Hàm này thực hiện tìm các tập Sporadic không tuyệt đối hai ngưỡng mờ trên không gian tìm kiếm khởi tạo ở trên.