Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng buộc trọng số khai thác top k mẫu tuần tự p2

5 4 0
Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng buộc trọng số khai thác top k mẫu tuần tự p2

Đang tải... (xem toàn văn)

Thông tin tài liệu

MẪU 14KHCN 13 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT Lĩnh vực khai thác dữ liệu trên CSDL chuỗi là một trong những lĩnh vực đã và đang được nhiều nhà khoa học tập trung nghiên cứu Khai thác dữ liệu chuỗi tuần tự được đề xuất từ năm 1995 1, cho đến nay nhiều kết quả nghiên cứu trong lĩnh vực này đã được công bố và ứng dụng thực tiễn 3, 6, 16, 23, 25, 31, 41 Khai thác mẫu tuần tự trong CSDL chuỗi là xác định những mẫu mà sự xuất hiện của chúng trong CSDL thỏa ngưỡng hỗ trợ tối thiểu Khai thác mẫu tuần tự đ.

CHƯƠNG CƠ SỞ LÝ THUYẾT Lĩnh vực khai thác liệu CSDL chuỗi lĩnh vực nhiều nhà khoa học tập trung nghiên cứu Khai thác liệu chuỗi đề xuất từ năm 1995 [1], nhiều kết nghiên cứu lĩnh vực công bố ứng dụng thực tiễn [3, 6, 16, 23, 25, 31, 41] Khai thác mẫu CSDL chuỗi xác định mẫu mà xuất chúng CSDL thỏa ngưỡng hỗ trợ tối thiểu Khai thác mẫu ứng dụng nhiều lĩnh vực thực tế như: phân tích thị trường, phân tích mẫu truy cập Web, dự đốn nhu cầu mua sắm khách hàng…Từ tập liệu mẫu dùng nhiều thuật tốn khai thác khác để tìm tập luật Luật xem việc biểu diễn mối quan hệ hai loạt kiện, loạt kiện xảy sau loạt kiện 1.1 Khái niệm Itemset: Tập phần tử tập hợp khác rỗng gồm nhiều item Itemset i ký hiệu (i1, i2, …, ik) với ij item Itemset có k item ký hiệu k-itemset Các item itemset xếp theo thứ tự tăng dần Chuỗi: danh sách itemset xếp theo thứ tự Chuỗi s ký hiệu s1 s2… sn s1→ s2→…→ sn với si itemset, n số lượng itemset Kích thước chuỗi số lượng itemset có chuỗi Chiều dài chuỗi tổng số item có chuỗi, ký hiệu Chuỗi có chiều dài k gọi k-sequence Chuỗi con: Chuỗi  = b1 b2 … bm có m itemset gọi chuỗi chuỗi  = a1 a2 … an có n itemset (hay  chuỗi cha , ký hiệu   ) tồn số nguyên 1 j1

Ngày đăng: 18/06/2022, 14:58

Tài liệu cùng người dùng

Tài liệu liên quan