Khai phá dựa vào ràng buộc dạng luật (metarule –guide)

Một phần của tài liệu TIỂU LUẬN MÔN HỌC KHAI PHÁ DỮ LIỆU KHAI PHÁ LUẬT KẾT HỢP VỚI CƠ SỞ DỮ LIỆU LỚN (Trang 40 - 41)

II. NỘI DUNG

2.6.1 Khai phá dựa vào ràng buộc dạng luật (metarule –guide)

Metarule cho phép người dùng xác định cú pháp của luật muốn khai phá. Cú pháp của luật có thể sử dụng như một ràng buộc giúp nâng cao hiệu quả của quá trình khai phá. Metarule có thể được xác định dựa vào kinh nghiệm, mong đợi và trực giác của nhà phân tích dữ liệu.

Metarule có dạng: P1 ∧ P2∧ … ∧ Pl ⇒ Q1∧ Q2 ∧ … ∧ Qr

Trong đó, P1, P2, …, Pl, Q1, Q2, …, Qr: vị từ cụ thể (instantiated predicates) hay biến vị từ (predicate variables).

Để tìm nguyên tắc liên kết giữa các chiều, thực hiện theo các bước sau: - Tìm tất cả các tập p- vị từ thường xuyên, ký hiệu Lp

- Tìm độ hỗ trợ (support) hoặc đếm các vị từ l trong tập con của Lp

để tính toán độ tin cậy (confidence) của luật trong Lp

Ví dụ: Giả sử ta phân tích dữ liệu thị trường cho AllElectronics, chúng ta truy suất các dữ liệu mô tả khách hàng (tuổi, địa chỉ, tín dụng) và xét danh sách các giao tác của khách hàng. Giả sử ta muốn tìm mối quan hệ giữa đặt điểm khách hàng và danh mục mà khách hàng mua. Tuy vậy, thay vì tìm kiếm tất cả các luật kết hợp phản ánh mối quan hệ, ta sẽ đặc biệt quan tâm chỉ trong việc các định những đặc điểm mà các cặp đặt tính của khác hàng thúc đẩy việc bán phầm mềm giáo dục. Một metarule có thể được dùng để xác định thông tin mô tả mẫu của luật mà chúng ta quan tâm. Ví dụ như:

P1(X, Y) P2(X, W) buys(X, “education software”)

P1 và P2 là các biến vị từ, xác định cụ thể các thuộc tính từ cơ sở dữ liệu sẽ được sử dụng trong quá trình khai phá. X là biến mô tả về khách hàng, Y và W là các thuộc tính của khách hàng sẽ được đưa vào các vị từ P1, P2 tương ứng. Thông thường, ta sẽ chỉ ra một sanh sách các thuộc tính sẽ được đưa vào P1 và P2, nếu không thì dùng thuộc tính mặt định.

Hệ thống khai phá sẽ thăm dò và so sách với metarule để tìm ra luật thích hợp. Ví dụ trong trường hợp này, thì luật sau có thể được xác định phù hợp với metarule ở trên:

age(X,“30..39”)income(X,“41k..60k”)buys(X,“education software”)

Một phần của tài liệu TIỂU LUẬN MÔN HỌC KHAI PHÁ DỮ LIỆU KHAI PHÁ LUẬT KẾT HỢP VỚI CƠ SỞ DỮ LIỆU LỚN (Trang 40 - 41)

Tải bản đầy đủ (DOC)

(50 trang)
w