Trong tập phổ biến, chúng ta đã chọn ra các Iterm có minsup > với là một tỉ lệ phần trăm cho trƣớc.
Chẳng hạn với tập luật trên chúng ta đã lấy minsup = 60
Các luật có độ hỗ trợ lớn hơn một giá trị ngƣỡng minsup và độ tin cậy lớn hơn một giá trị ngƣỡng minconf cho trƣớc đƣợc gọi là các luật kết hợp tin cậy. Cụ thể: Nếu có đồng thời sup(X→Y) ≥ minsup và conf(X→Y) ≥ minconf thì X→Y đƣợc gọi là luật kết hợp tin cậy.
Cách tính các thông số sup và conf trên nhƣ sau:
- Độ hỗ trợ của luật: là tỷ lệ hay xác suất xuất hiện cả X và Y trong cùng một giao dịch.
Card(X Y)
Sup(X Y)
| D |
- Độ tin cậy của luật: là tỷ lệ các giao dịch có chứa cả X và Y so với các giao dịch có chứa X.
Card(X Y)
Conf (X Y)
Card(X)
Cho trƣớc hai giá trị số: 0 , 1 ta gọi là minsup và minconf tƣơng ứng. Tập luật kết hợp thỏa sup(X→Y) ≥ minsup và conf(X→Y) ≥ minconf thì X→Y đƣợc gọi là luật kết hợp tin cậy ( , ).
Theo lý thuyết chắc chắn chúng ta có thể lấy CFE = và CFF = để làm độ chắc chắn cho sự kiện E (tức X) và độ chắc chắn cho luật F (tức X Y) tƣơng ứng.
Khi dùng thuật toán khai phá luật kết hợp, về mặt tính toán thì hoàn toàn chính xác nhƣ chính thuật toán thể hiện. Nhƣng về mặt định tính thì đấy là một vấn đề cần xem xét nghiên cứu.
Để làm tăng số lƣợng luật của tập luật chúng ta có thể giảm hoặc hoặc cả hai và ngƣợc lại. Tuy nhiên tăng, giảm bao nhiêu để tập luật còn có ý nghĩa thực tiến và chắc chắn là phải dựa vào các ý kiến chuyên gia.
Vấn đề cơ bản là khi các luật kết hợp (thay đổi cặp số ( , ) để đƣa nó về các luật theo lí thuyết chắc chắn sẽ có nhiều lựa chọn và đặc biệt có thể đƣa vào bộ nhớ tri thức của hệ chuyên gia.