KẾT LUẬT CHƢƠNG

Một phần của tài liệu Hỗ trợ hệ chuyên gia cho khai phá luật kết hợp (LV01063) (Trang 62 - 64)

Chƣơng này đã trình bày về tìm kiếm luật kết hợp, phƣơng pháp suy luận không chắc chắn, thể hiện độ chắc chắn trong sự kiên và nhân vật. Các bài toán trong phát hiện luật kết hợp: Tìm tất cả các tập mục mà có độ hỗ trợ lớn hơn độ hỗ trợ tối thiểu do ngƣời dùng xác định và dùng các tập mục phổ biến để sinh ra các luật mong muốn.

Nội dung trong chƣơng này còn đề cập đến vấn đề phát hiện luật kết hợp trên hệ thông tin nhị phân. Bản chất của hệ thông tin nhị phân là cung cấp một phƣơng pháp liệt kê hiệu quả nhất các tập mục phổ biến, bằng cách xác định “có” hay “không” mục i ở trong giao tác o. Nhƣ vậy tƣơng ứng với các bit nhị phân. Với kho dữ liệu thì số lƣợng các mục là rất lớn trong các giao tác. Nếu có k mục thì ta cần phải xét đến 2k tập mục con. Điều này là khó có thể thực hiện trong thực tế. Thay vì

xem xét trên kho dữ liệu, ta tính toán trên các bit. Các bƣớc liệt kê tiếp theo dựa trên kết quả của bƣớc trƣớc đó, điều này sẽ tiết kiệm thời gian và công sức rất nhiều.

Phân chia không gian tìm kiếm là phƣơng pháp tách các khoản mục trong tập dữ liệu D thành các tập con đơn giản hơn, có cùng độ hỗ trợ. Mục đích để phân nhỏ không gian tìm kiếm các khoản mục (bởi theo lý thuyết, tập D có k khoản mục thì không gian các tập con của D sẽ là 2k tập hợp). Phát hiện các luật kết hợp có thể theo cách: đếm các thuộc tính -thƣờng xuyên, liệt kê tuần tự. Ngoài ra, khai phá luật kết hợp có thể dựa vào sự phân loại thuộc tính hoặc phân hoạch các không gian tìm kiếm.

Bên cạnh đó nội dung chƣơng còn đề cập đến một số thuật toán khai phá luật kết hợp nhƣ: Apriori, AprioriTID, AprioriHyrid, K-Nearest Neighbors (K- láng giềng). Thông qua một số thuật toán, với các ví dụ điển hình, tác giả đã làm rõ: mặc dù độ phức tạp của thuật toán tìm các tập mục phổ biến là NP khó. Nhƣng trong thực tế do các CSDL thƣờng rất thƣa và kỹ thuật tỉa đã đƣợc áp dụng trong các thuật toán tìm tập mục phổ biến nên thời gian tìm frequent Itemset chỉ là tuyến tính.

CHƢƠNG 3

ỨNG DỤNG HỖ TRỢ HỆ CHUYÊN GIA

TRONG KHAI PHÁ DỮ LIỆU TẠI SIÊU THỊ BÁN SÁCH 3.1 LẬP TRÌNH ỨNG DỤNG TẠI SIÊU THỊ BÁN SÁCH

Một phần của tài liệu Hỗ trợ hệ chuyên gia cho khai phá luật kết hợp (LV01063) (Trang 62 - 64)

Tải bản đầy đủ (PDF)

(71 trang)