Sử dụng ràng buộc phần hệ quả của luật

Các phương pháp này đưa ra danh sách các mục sẽ xuất hiện trong một phần của luật và được sử dụng như là điều kiện trong quá trình sinh luật. Cách tiếp cận này chỉ hiệu quả khi biết trước được thông tin về các mục dữ liệu, chẳng hạn phải xác định trước được mục dữ liệu nào sẽ xuất hiện trong phần hệ quả của luật.

Phương pháp phát hiện luật kết hợp hiếm bằng cách cốđịnh phần hệ quảđược I. Rahal và cộng sự giới thiệu vào năm 2004 [66]. Các tác giả sử dụng kỹ thuật SE-tree và P-tree nhằm tìm các luật tin cậy nhỏ nhất sử dụng phần hệ quả cố định (fixed-consequent) mà không cần xác định ngưỡng độ hỗ trợ.

Giả sử có hai luật R1 và R2, với độ tin cậy lớn hơn độ tin cậy cực tiểu: R1: A ® C và R2: AB ® C, R1 được cho là hay hơn vì phần tiền đề của luật R1 là tập con của phần tiền đề của luật R2. Độ tin cậy của luật R1 là lớn hơn hoặc bằng độ

tin cậy của luật R2. R1 được coi là luật nhỏ và R2 được coi là luật không nhỏ (hay phức hợp).

J. Li và cộng sự [56], giới thiệu hướng tiếp cận khác là tìm các luật có độ tin cậy cao (100%) bằng cách sử dụng kỹ thuật phân hoạch CSDL và đường biên. Theo hướng này, các tác giả chỉ dùng ngưỡng độ tin cậy cực tiểu mà không dùng ngưỡng

độ hỗ trợ cực tiểu. Tuy nhiên phần hệ quả của luật phải được xác định trước. Bằng cách thực hiện tương tự, phương thức để tìm các luật có độ tin cậy cao (chẳng hạn 90%) hay các luật có độ tin cậy bằng không cũng được giới thiệu. Phương pháp này còn được gọi là phương pháp EP (Emerging Pattern).

Một phần của tài liệu Nghiên cứu phát hiện luật kết hợp hiếm và ứng dụng.PDF (Trang 39 - 40)

Sử dụng ràng buộc phần hệ quả của luật

Phát hiện luật kết hợp định lượng

Khuynh hướng nghiên cứu về luật hiếm