Sử dụng ràng buộc phần hệ quả của luật

Các phương pháp này đưa ra danh sách các mục sẽ xuất hiện trong một phần

của luật và được sử dụng như là điều kiện trong quá trình sinh luật. Cách tiếp cận

này chỉ hiệu quả khi biết trước được thông tin về các mục dữ liệu, chẳng hạn phải

xác định trước được mục dữ liệu nào sẽ xuất hiện trong phần hệ quả của luật.

Phương pháp phát hiện luật kết hợp hiếm bằng cách cố định phần hệ quả được I. Rahal và cộng sự giới thiệu vào năm 2004 [66]. Các tác giả sử dụng kỹ thuật SE-tree và P-tree nhằm tìm các luật tin cậy nhỏ nhất sử dụng phần hệ quả cố định (fixed-consequent) mà không cần xác định ngưỡng độ hỗ trợ.

Giả sử có hai luật R1 và R2, với độ tin cậy lớn hơn độ tin cậy cực tiểu:

R1: A ® C và R2: AB ® C, R1 được cho là hay hơn vì phần tiền đề của luật R1 là

tập con của phần tiền đề của luật R2. Độ tin cậy của luật R1 là lớn hơn hoặc bằng độ tin cậy của luật R2. R1 được coi là luật nhỏ và R2 được coi là luật không nhỏ (hay

phức hợp).

J. Li và cộng sự [56], giới thiệu hướng tiếp cận khác là tìm các luật có độ tin cậy cao (100%) bằng cách sử dụng kỹ thuật phân hoạch CSDL và đường biên. Theo hướng này, các tác giả chỉ dùng ngưỡng độ tin cậy cực tiểu mà không dùng ngưỡng

độ hỗ trợ cực tiểu. Tuy nhiên phần hệ quả của luật phải được xác định trước. Bằng

cách thực hiện tương tự, phương thức để tìm các luật có độ tin cậy cao (chẳng hạn

90%) hay các luật có độ tin cậy bằng khơng cũng được giới thiệu. Phương pháp này cịn được gọi là phương pháp EP (Emerging Pattern).

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu phát hiện luật kết hợp hiếm và ứng dụng (Trang 39 - 40)

Sử dụng ràng buộc phần hệ quả của luật

Phát hiện luật kết hợp định lượng

Giới thiệu chung về luật kết hợp hiếm