MỞ RỘNG BÀI TOÁN KHAI PHÁ TẬP MỤC THƢỜNG XUYÊN

Một phần của tài liệu nghiên cứu một số thuật toán khai phá tập mục thường xuyên và tập mục cổ phần cao trong cơ sở dữ liệu (Trang 38 - 40)

Mô hình khai phá tập mục thƣờng xuyên cơ bản có nhiều ứng dụng trong thực tế nhƣng nó có những hạn chế, không đáp ứng đầy đủ yêu cầu của ngƣời sử dụng. Ràng buộc về độ hỗ trợ của tập mục thƣờng xuyên chủ yếu mang ngữ nghĩa thống kê, không phản ánh đƣợc vai trò khác nhau của các thuộc tính cũng nhƣ đặc tính dữ liệu vỗn có của chúng trong cơ sở dữ liệu.

Bƣớc 4 Các ứng viên: CBD:2, CD:4, BD:3 D (5 5) B (3 3) C (2 2) A (1 0) C (2 2) B A C

Để đáp ứng yêu cầu của thực tiễn, bài toán khai phá tập mục thƣờng xuyên đã có nhiều cách thức mở rộng và ứng dụng.

Một hƣớng mở rộng bài toán có nhiều ứng dụng là quan tâm đến cấu trúc dữ liệu và mức độ quan trọng khác nhau của các mục dữ liệu, các thuộc tính trong cơ sở dữ liệu. Một số mô hình mở rộng bài toán đã đƣợc nghiên cứu là:

 Quan tâm đến mức độ quan trọng khác nhau của các mục dữ liệu bằng cách gán cho mỗi mục một giá trị đƣợc gọi là trọng số. Độ hỗ trợ và độ tin cậy của luật kết hợp khi đó lần lƣợt trở thành độ hỗ trợ và độ tin cậy có trọng số. Luật kết hợp có độ hỗ trợ và độ tin cậy trọng số hóa đƣợc gọi là luật kết hợp có trọng số. Các thuật toán MINWAL(O), MINWAL(W) giải quyết vấn đề này.

 Quan tâm đến các kiểu thuộc tính khác nhau trong cơ sở dữ liệu nhƣ nhị phân, đa phân, định lƣợng. Luật kết hợp khi đó đƣợc gọi là luật kết hợp định lƣợng. Để tìm các luật kết hợp định lƣợng ngƣời ta đƣa bài toán về dạng nhị phân bằng cách phân khoảng các giá trị thuộc tính, sau đó có thể sử dụng các thuật toán khai phá luật kết hợp nhị phân đã biết.

 Chú ý đến cả cấu trúc dữ liệu lẫn mức độ quan trọng khác nhau của các thuộc tính trong cơ sở dữ liệu. Theo hƣớng này, nhiều nhà nghiên cứu đề xuất các mô hình mở rộng khai phá tập mục cổ phần cao, đánh giá sự đóng gióp của tập mục trong tổng số các mục dữ liệu của cơ sở dữ liệu.

Một phần của tài liệu nghiên cứu một số thuật toán khai phá tập mục thường xuyên và tập mục cổ phần cao trong cơ sở dữ liệu (Trang 38 - 40)

Tải bản đầy đủ (PDF)

(80 trang)