Tóm tắt luận án tiến sĩ máy tính khai phá mẫu dãy có trọng số trong cơ sở dữ liệu dãy

10 4 0
Tóm tắt luận án tiến sĩ máy tính khai phá mẫu dãy có trọng số trong cơ sở dữ liệu dãy

Đang tải... (xem toàn văn)

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ *** TRẦN HUY DƯƠNG KHAI PHÁ MẪU DÃY CÓ TRỌNG SỐ TRONG CƠ SỞ DỮ LIỆU DÃY Chuyên ngành Hệ thống thông ti[.]

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… TRẦN HUY DƯƠNG KHAI PHÁ MẪU DÃY CÓ TRỌNG SỐ TRONG CƠ SỞ DỮ LIỆU DÃY Chuyên ngành: Hệ thống thông tin Mã số: 62 48 01 04 TÓM TẮT LUẬN ÁN TIẾN SỸ NGÀNH MÁY TÍNH Hà Nội – 2021 Cơng trình hồn thành tại: Học viện Khoa học Công nghệ Viện Hàn lâm Khoa học Công nghệ Việt Nam Người hướng dẫn khoa học 1: TS Nguyễn Trường Thắng Người hướng dẫn khoa học 2: GS.TS Vũ Đức Thi Phản biện 1: … Phản biện 2: … Phản biện 3: … Luận án bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp Học viện Khoa học Công nghệ - Viện Hàn lâm Khoa học Công nghệ Việt Nam vào hồi … ’, ngày … tháng … năm 201… Có thể tìm hiểu luận án tại: - Thư viện Học viện Khoa học Công nghệ - Thư viện Quốc gia Việt Nam MỞ ĐẦU Tổng quan Khai phá mẫu dãy thường xuyên vấn đề quan trọng nhiều học giả nghiên cứu lĩnh vực khai phá liệu Trong nhiều lĩnh vực khai phá văn bản, phân tích trình tự gen, chống xâm nhập mạng trái phép dựa phân tích nhật ký truy cập thứ tự mục đóng vai trị quan trọng Để giải vấn đề này, toán khai phá mẫu dãy thường xuyên Agrawal Srikant đề xuất [2] Các mẫu dãy thường xuyên số lần xuất phần tử mà thể thứ tự phần tử Khai phá mẫu dãy thường xuyên ứng dụng nhiều lĩnh vực phân tích hành vi mua sắm, phân tích mẫu truy cập web, phân tích thảm họa tự nhiên, phân tích hình thành chuỗi protein Thông thường, khai phá mẫu dãy thường xuyên cổ điển thực khai phá mẫu dãy thường xun mà khơng có thêm thơng tin mở rộng khác Trong đó, việc mở rộng thơng tin dãy liệu đa dạng đưa thêm thông tin trọng số mục dãy, thông tin định lượng mục dãy, thông tin khoảng cách thời gian thành phần dãy … Đối với CSDL dãy có yếu tố thời gian tức có thêm thông tin khoảng cách thời gian xuất dãy liệu cho phép phân tích xem sau khoảng thời gian mẫu dãy xuất Các nghiên cứu đến tập trung phát mẫu dãy có khoảng cách thời gian xảy thành phần CSDL dãy có khoảng cách thời gian, khoảng cách thời gian giá trị số xác định rõ ràng Các thuật tốn khai phá mẫu dãy cổ điển thơng thường không quan tâm tới mức độ quan trọng mục liệu dãy (trọng số) số lượng liệu mục liệu dãy (định lượng) Tuy nhiên thực tế, dãy liệu có độ quan trọng khác bao gồm giá trị lợi ích (định lượng) lợi ích ngồi (trọng số) dãy liệu CSDL Đến chưa có nhiều nghiên cứu khai phá mẫu dãy có trọng số CSDL dãy có khoảng cách thời gian quan tâm đến đến trọng số mục dãy liệu khoảng cách thời gian dãy Đồng thời chưa có nhiều nghiên cứu khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian quan tâm đến đến trọng số mục dãy liệu, giá trị định lượng mục xuất khoảng cách thời gian dãy CSDL dãy định lượng có khoảng cách thời gian Đó lý đề xuất luận án “Khai phá mẫu dãy có trọng số Cơ sở liệu dãy” Luận án đề xuất giải vấn đề khai phá mẫu dãy thường xuyên trọng số CSDL dãy có khoảng cách thời gian khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian Việc nghiên cứu giải vấn đề thực cần thiết khơng phương diện phát triển lý thuyết mà phương diện ứng dụng thực tế 2 Mục tiêu phạm vi nghiên cứu luận án Mục tiêu luận án đề xuất giải pháp khai phá mẫu dãy có trọng số có khoảng cách thời gian dãy CSDL dãy có khoảng cách thời gian CSDL dãy định lượng có khoảng cách thời gian Cụ thể luận án tập trung đề xuất giải pháp nhằm: • Phát mẫu dãy có trọng số CSDL dãy khoảng cách thời gian Các mẫu dãy tìm gọi mẫu dãy thường xuyên trọng số với khoảng cách thời gian • Phát mẫu dãy có trọng số CSDL dãy định lượng có khoảng cách thời gian Các mẫu dãy tìm gọi mẫu dãy thường xun lợi ích cao với khoảng cách thời gian NCS tập trung vào nghiên cứu đề xuất thuật toán để khai phá mẫu dãy thường xuyên; chứng minh tính đắn tính đầy đủ, phân tích độ phức tạp tính tốn thuật tốn; thử nghiệm phân tích ý nghĩa mẫu dãy thường xuyên khai phá Phương pháp nghiên cứu Luận án nghiên cứu mẫu dãy, trọng số mục dãy, khoảng cách thời gian dãy, CSDL dãy có khoảng cách thời gian CSDL dãy định lượng có khoảng cách thời gian Các nghiên cứu, thuật tốn phương pháp khai phá mẫu dãy CSDL dãy, CSDL dãy định lượng có yếu tố khoảng cách thời gian, trọng số, lợi ích cao Các đóng góp luận án Những đóng góp luận án đề xuất giải vấn đề sau: • Đề xuất 01 thuật tốn khai phá top-k mẫu dãy có tính đến trọng số mục khoảng cách thời gian CSDL dãy có khoảng cách thời gian Kết cơng trình đăng kết [CT1] • Đề xuất 02 thuật tốn khai phá mẫu dãy lợi ích cao có tính đến trọng số mục, giá trị định lượng mục khoảng cách thời gian CSDL dãy định lượng có khoảng cách thời gian Kết cơng trình đăng kết [CT2], [CT3], [CT4], [CT5] Bố cục luận án Luận án gồm phần mở đầu, 03 chương nội dung phần kết luận: • Phần mở đầu: Trình bày tổng quan luận án; mục tiêu, đối tượng, phạm vi nghiên cứu; phương pháp nghiên cứu; đóng góp cấu trúc luận án • Chương 1: Tổng quan tình hình nghiên cứu định nghĩa khai phá mẫu dãy có trọng số CSDL dãy, CSDL dãy có khoảng cách thời gian CSDL dãy định lượng có khoảng cách thời gian • Chương 2: Khai phá mẫu dãy có trọng số CSDL dãy có khoảng cách thời gian Chương nêu vấn đề đề xuất 01 thuật toán khai phá top-k mẫu dãy thường xuyên trọng số CSDL dãy có khoảng cách thời gian Tính đắn đầy đủ thuật toán, việc thực nghiệm thuật toán liệu thực so sánh với nghiên cứu trước 3 • Chương 3: Khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian Chương nêu đặt vấn đề đề xuất 02 thuật toán khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian Tính đắn đầy đủ thuật toán, việc thực nghiệm thuật toán liệu thực so sánh với nghiên cứu trước • Phần kết luận: Trình bày số kết luận đóng góp luận án, hướng phát triển vấn đề quan tâm NCS TỔNG QUAN KHAI PHÁ MẪU DÃY CÓ TRỌNG SỐ TRONG CƠ SỞ DỮ LIỆU DÃY Chương trình bày tổng quan định nghĩa vấn đề khai phá mẫu dãy CSLD dãy, mẫu dãy có trọng số CSDL dãy, mẫu dãy CSDL dãy định lượng mẫu dãy CSDL dãy có khoảng cách thời gian Chương khoảng trống chưa giải để từ xác định vấn đề nghiên cứu luận án 1.1 Khai phá mẫu dãy CSDL dãy CSDL dãy SDB: Gọi I={i1, i2, …, in} tập hợp mục Một tập khác rỗng I gọi tập mục Một dãy liệu S danh sách xếp theo thứ tự tập mục, ký hiệu 𝑆 = 〈(𝑠1 ), (𝑠2 ), … , (𝑠𝑚 )〉, sj tập mục hay phần tử dãy (𝑠𝑗 ⊆ 𝐼) Một sở liệu dãy SDB , sid định danh dãy Sk dãy liệu Kích thước dãy: dãy 𝑆 = 〈(𝑠1 ), (𝑠2 ), … , (𝑠𝑚 )〉 ký hiệu |S| tổng số dãy sj dãy S Ví dụ: dãy S= có kích thước |S| =5 Độ dài dãy: dãy 𝑆 = 〈(𝑠1 ), (𝑠2 ), … , (𝑠𝑚 )〉 sj tập mục hay phần tử dãy (𝑠𝑗 ⊆ 𝐼) ký hiệu l(S) tổng số mục 𝑖𝑗 ∈ 𝐼 có dãy S Một dãy có độ dài l gọi l-sequence Ví dụ: dãy S= có độ dài l(S) =7 Dãy dãy chứa: Dãy α = 〈(𝑆1 ), (𝑆2 ), … , (𝑆𝑚 )〉 gọi dãy dãy 𝛽 = 〈(𝑆′1 ), (𝑆′2 ), … , (𝑆′𝑚 ), … , (𝑆′𝑛 )〉 𝑆𝑖 ⊆ 𝑆 ′ 𝑖 Ký hiệu 𝛼 ≼ 𝛽 Dãy β gọi dãy chứa dãy α Ví dụ: Dãy dãy dãy dãy chứa Độ hỗ trợ dãy: Độ hỗ trợ (tuyệt đối) dãy α CSDL dãy SDB tổng số dịng có chứa α SDB, ký hiệu sup(α) 𝑠𝑢𝑝(𝛼) = |{𝛼|𝛼 ≼ 𝑆𝑖 ∧ 𝑆𝑖 ∈ 𝑆𝐷𝐵}| Một dãy α gọi mẫu dãy thường xuyên độ hỗ trợ α không nhỏ độ hộ trợ cực tiểu minsup cho trước, tức sup(α)  minsup Các thuật toán khai phá mẫu dãy thường xuyên CSDL dãy thường thực theo phương pháp sau: • Thực sinh mẫu dãy phương pháp tìm kiếm theo bề rộng (breath-first search) Các thuật tốn điển hình phát triển theo cách tiếp cận gồm AprioriAll[2], GSP[10] • Thực sinh mẫu dãy phương pháp tìm kiếm theo chiều sâu (depth-first search) theo phương pháp biểu diễn CSDL dọc Các thuật tốn điển hình phát triển theo cách tiếp cận nhóm gồm Spade [11], Spam [30], Lapin-Spam [18], CM-Spade, CM-Spam [17] • Thực tìm kiếm theo chiều sâu sử dụng CSDL chiếu theo tiền tố (projected database) Các thuật tốn điển hình phát triển theo cách tiếp cận nhóm gồm FreeSpan [13], PrefixSpan [31]… 1.2 Khai phá mẫu dãy trọng số CSDL dãy CSDL dãy SDB có trọng số: Gọi I={i1, i2, …, in} tập hợp mục Mỗi mục 𝑖𝑗 ∈ 𝐼 gán giá trị trọng số wj thể mức độ quan trọng mục i Một tập khác rỗng I gọi tập mục Một dãy liệu S danh sách xếp theo thứ tự tập mục, ký hiệu 𝑆 = 〈(𝑠1 ), (𝑠2 ), … , (𝑠𝑚 )〉, sj tập mục hay phần tử dãy (𝑠𝑗 ⊆ 𝐼) Một sở liệu dãy có trọng số SDB , sid định danh dãy Sk dãy liệu, đồng thời mục 𝑖𝑗 ∈ 𝐼 gán giá trị trọng số wj thể mức độ quan trọng mục 𝑖𝑗 CSDL Một số thuật toán khai phá mẫu dãy trọng số CSDL dãy MWSP [32], Wspan [33], WSPM [34]… 1.3 Khai phá mẫu dãy CSDL dãy định lượng CSDL dãy định lượng QSDB: Gọi I={i1, i2, …, in} tập hợp mục Một tập khác rỗng I gọi tập mục Một dãy liệu S danh sách xếp theo thứ tự tập mục, ký hiệu 𝑆 = 〈(𝑠1 ), (𝑠2 ), … , (𝑠𝑚 )〉, sj = (i1[k1], i2[k2], …, in[kn]) với 𝑖𝑗 ∈ 𝐼 kj thể giá trị định lượng mục i xuất giao dịch Một sở liệu dãy định lượng QSDB , sid định danh dãy Sk dãy liệu định lượng Một số thuật toán khai phá mẫu dãy CSDL định lượng UL,US [42], Uspan [43], HuspExt [45], HUSPM [47], PHUS [44] 1.4 Khai phá mẫu dãy CSDL dãy có khoảng cách thời gian CSDL dãy có khoảng cách thời gian iSDB: Gọi I={i1, i2, …, in} tập hợp mục Một tập khác rỗng I gọi tập mục Một dãy liệu S danh sách xếp theo thứ tự tập mục, ký hiệu 𝑆 = 〈(𝑡1,1 , 𝑠1 ), (𝑡1,2 , 𝑠2 ), … , (𝑡1,𝑚 , 𝑠𝑚 )〉, sj tập mục hay phần tử dãy (𝑠𝑗 ⊆ 𝐼) t, khoảng cách thời gian tập mục s s Một sở liệu dãy iSDB có khoảng cách thời gian , sid định danh dãy Sk dãy liệu với khoảng cách thời gian Một số thuật toán khai phá mẫu dãy CSDL dãy có khoảng cách thời gian I-Apriori algorithm, I-PrefixSpan [38], FTI-Apriori FTI-PrefixSpan [39] − Nếu mục I định nghĩa nội dung phần 1.2 ta có dãy liệu trọng số CSDL dãy có khoảng cách thời gian 5 Một số thuật tốn khai phá mẫu dãy trọng số CSDL dãy có khoảng cách thời gian WIPrefixSpan [40], TopKWFP [CT1] − Nếu mục I định nghĩa nội dung phần 1.2 1.3 ta có dãy liệu lợi ích cao CSDL dãy định lượng có khoảng cách thời gian Một số thuật tốn khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian FSPFTIM [48], UIPrefixSpan [CT3], HUISP [CT5]… Kết luận Chương Chương trình bày tổng quan, tóm tắt vấn đề liên quan đến khai phá mẫu dãy CSDL dãy, khai phá mẫu dãy trọng số CSDL dãy, khai phá mẫu dãy CSDL dãy định lượng, khai phá mẫu dãy CSDL dãy có khoảng cách thời gian Hình 1.1 sau mơ tả tổng quan vấn đề nghiên cứu luận án Hình 1.1 Các vấn đề nghiên cứu luận án Hiện chưa có nhiều nghiên cứu khai phá mẫu dãy có trọng số CSDL dãy có khoảng cách thời gian quan tâm đến đến trọng số mục dãy liệu khoảng cách thời gian dãy Tương tự, chưa có nhiều nghiên cứu khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian quan tâm đến đến trọng số mục dãy liệu, giá trị định lượng mục xuất khoảng cách thời gian dãy CSDL dãy định lượng có khoảng cách thời gian Cụ thể, luận án tập trung nghiên cứu đề xuất giải pháp giải vấn đề sau đây: - Vấn đề 1: việc xác định vấn đề nghiên cứu luận án đề xuất 01 thuật toán khai phá top-k mẫu dãy thường xuyên trọng số với khoảng cách thời gian quan tâm đến đến trọng số mục dãy liệu khoảng cách thời gian dãy CSDL dãy có khoảng cách thời gian Nội dung trình bày chi tiết Chương - Vấn đề việc xác định vấn đề nghiên cứu luận án đề xuất 02 thuật toán khai phá mẫu dãy lợi ích cao CSDL dãy định lượng có khoảng cách thời gian quan tâm đến trọng số mục dãy liệu, giá trị định lượng mục liệu khoảng cách thời gian dãy CSDL dãy định lượng có khoảng cách thời gian Nội dung trình bày chi tiết Chương KHAI PHÁ MẪU DÃY CÓ TRỌNG SỐ TRONG CSDL DÃY CÓ KHOẢNG CÁCH THỜI GIAN Trong chương này, luận án tập trung trình bày khai phá top-k mẫu dãy thường xuyên trọng số có khoảng cách thời gian Vấn đề phát top-k mẫu dãy thường xuyên trọng số CSDL dãy có khoảng cách thời gian thực bắt đầu việc nghiên cứu giải toán khai phá top-k mẫu dãy thường xuyên CSDL dãy sử dụng phương pháp biểu diễn CSDL theo chiều dọc TKS [21] Fournier-Viger cộng toán khai phá mẫu dãy thường xuyên trọng số có khoảng cách thời gian WIPrefixSpan [40] NCS đồng đề xuất sau tiếp tục thực nghiên cứu NCS đề xuất thuật toán TopKWFP đăng tạp chí Journal of Computer Science and Cybernetics [CT1] 2.1 Một số khái niệm Dãy dãy chứa với khoảng cách thời gian Dãy α = 〈(𝑡1,1 , 𝑆1 ), (𝑡1,2 , 𝑆2 ), … , (𝑡1,𝑚 , 𝑆𝑚 )〉 gọi dãy dãy 𝛽 = 〈(𝑡′1,1 , 𝑆′1 ), (𝑡 ′1,2 , 𝑆′2 ), … , (𝑡 ′1,𝑚 , 𝑆′𝑚 ), … , (𝑡 ′1,𝑛 , 𝑆′𝑛 )〉 nếu: 𝑆𝑖 ⊆ 𝑆 ′ 𝑖 ⋀ (|𝑡1,1 − 𝑡 ′1,1 | = |𝑡1,2 − 𝑡 ′1,2 |= ⋯ = |𝑡1,𝑚 − 𝑡 ′1,𝑚 |) Ký hiệu 𝛼 ≼ 𝛽 Dãy β gọi dãy chứa dãy α Ví dụ: Dãy dãy dãy dãy S1=, S1 gọi dãy chứa hai dãy Trọng số dãy với khoảng cách thời gian Cho I = {i1, i2, …, in} tập hợp mục liệu Mỗi mục ij  I gán trọng số wj với j = 1, ,n Khi trọng số dãy  = 〈(𝑡1,1 , 𝑠1 ), (𝑡1,2 , 𝑠2 ), … , (𝑡1,𝑚 , 𝑠𝑚 )〉 có độ dài k sj có dạng (i1i2… ik) tính cơng thức 𝑁𝑊() = ∑ 𝑤𝑗 𝑘 𝑖𝑗 ∈  Độ hỗ trợ với trọng số dãy với khoảng cách thời gian Độ hỗ trợ với trọng số dãy ký hiệu 𝑁𝑊𝑠𝑢𝑝𝑝𝑜𝑟𝑡(𝛼): 𝑁𝑊𝑠𝑢𝑝𝑝𝑜𝑟𝑡(𝛼) = 𝑁𝑊(𝛼) ∗ 𝑠𝑢𝑝(𝛼) = ( ∑ 𝑤𝑗 ) ∗ 𝑠𝑢𝑝(𝛼) 𝑘 𝑖𝑗 ∈𝛼 Ràng buộc khoảng cách thời gian Cho dãy S= , ràng buộc khoảng cách thời gian dãy định nghĩa • C1 = min_time_interval giá trị nhỏ hai dãy liền kề, tức ti,i+1C1 • C2 = max_time_interval giá trị lớn hai dãy liền kề, tức ti,i+1≤C2 • C3 = min_whole_interval giá trị nhỏ dãy đầu dãy cuối, tức ti,m  C3 • C4 = max_whole_interval giá trị lớn dãy đầu dãy cuối, tức ti,m ≤ C4 Mẫu dãy thường xuyên trọng số với khoảng cách thời gian Cho CSDL dãy iSDB có khoảng cách thời gian, mục ij  I gán trọng số wj, ngưỡng hỗ trợ tối thiểu wminsup, ràng buộc khoảng cách thời gian C1, C2, C3, C4 Một dãy  gọi mẫu dãy thường xuyên trọng số với khoảng cách thời gian thỏa mãn tính chất: NWSupport()  wminsup ∧  thỏa mãn ràng buộc C1, C2, C3, C4 Tiền tố hậu tố dãy có khoảng cách thời gian Cho dãy  = , thành phần dãy s tập mục ij  I Khi tồn giá trị j (1 ≤ j ≤ m) cho s ⊆ sj t1,  = t1, j Ta định nghĩa tiền tố dãy có khoảng cách thời gian  với giá trị s,t1, sau: Prefix (,s, t1, ) = Khi hậu tố dãy có khoảng cách thời gian  với giá trị s,t1,  định nghĩa sau: Postfix (,s, t1, ) = Với s’j tập sj sau trừ tập s Khi s’j = , hậu tố  với giá trị s , t1,  là: Postfix (,s, t1, ) = Cơ sở liệu chiếu CSDL dãy có khoảng cách thời gian Cho dãy  = CSDL dãy iSDB có khoảng cách thời gian Một CSDL chiếu theo  định nghĩa iSDB|, hậu tố (Postfix) dãy iSDB với tiền tố  Mẫu dãy ứng viên Cho ngưỡng hỗ trợ tối thiểu wminsup MaxW giá trị lớn trọng số mục iSDB.Một dãy α gọi mẫu dãy ứng viên thường xuyên trọng số với khoảng cách thời gian thỏa mãn tính chất Sup(α) * MaxW  wminsup ∧  thỏa mãn tính chất C1, C2, C3, C4 2.2 Thuật toán khai phá top-k mẫu dãy thường xuyên trọng số với khoảng cách thời gian 2.2.1 Bài toán đặt Cho CSDL dãy iSDB có khoảng cách thời gian, mục ij  I gán trọng số wj, số tự nhiên k, ràng buộc khoảng cách thời gian C1, C2, C3, C4 Bài tốn đặt ra: Tìm k- mẫu dãy dãy t gọi dãy thuộc topk mẫu dãy thường xuyên trọng số với khoảng cách thời gian có k dãy có độ hỗ trợ với trọng số chuẩn hóa lớn NWSupport(t) t thỏa mãn ràng buộc thời gian C1, C2, C3, C4 Giá trị wminsup tối ưu định nghĩa là: 𝜀 = min{NWSupport(t)|t ∈ Τ } Với Τ tập top-k mẫu dãy thường xuyên trọng số với khoảng cách thời gian 2.2.2 Ý tưởng thuật toán Đầu tiên đặt wminsup=0 Duyệt CSDL iSDB tìm mẫu dãy thường xuyên cách áp dụng phương pháp tăng trưởng mẫu dãy Mỗi mẫu dãy tìm thấy, đưa vào danh sách L mẫu dãy xếp theo độ hỗ trợ có trọng số NWSupport Danh sách sử dụng để lưu mẫu dãy tìm thấy Khi có đủ k mẫu dãy danh sách L, giá trị wminsup tăng lên với NWSupport mẫu dãy có giá trị NWSupport nhỏ L Việc tăng giá trị wminsup giúp giảm bớt khơng gian tìm kiếm Sau tăng wminsup, mẫu dãy thường xuyên tìm đưa vào L, mẫu dãy L không thỏa mãn giá trị wminsup bị loại khỏi L giá trị wminsup tiếp tục tăng lên với giá trị NWSupport mẫu dãy có NWSupport nhỏ L… Để tăng hiệu suất giải thuật, sử dụng chiến lược tìm cách tăng trưởng mẫu dãy ứng viên hứa hẹn Nghĩa tìm cách tạo ứng viên có NWSupport lớn trước, nhờ ngưỡng hỗ trợ wminsup tăng nhanh khơng gian tìm kiếm giảm xuống Cách làm sử dụng tập ứng viên hứa hẹn R để lưu ứng viên mẫu dãy thường xuyên có trọng số Sau thuật tốn TopKWFP ln mở rộng mẫu dãy ứng viên có NWSupport lớn R trước Thuật tốn tiếp tục đến khơng thể tìm mẫu dãy nữa, thuật tốn kết thúc đưa top-k mẫu dãy thường xuyên 2.2.3 Thuật toán TopKWFP Input: CSDL dãy có khoảng cách thời gian iSDB, W: Bảng giá trị trọng số mục i: wi  W, k: Giá trị số xác định top-k mẫu dãy, C1, C2, C3, C4:Giá trị ràng buộc khoảng cách thời gian ... xuất luận án ? ?Khai phá mẫu dãy có trọng số Cơ sở liệu dãy? ?? Luận án đề xuất giải vấn đề khai phá mẫu dãy thường xuyên trọng số CSDL dãy có khoảng cách thời gian khai phá mẫu dãy lợi ích cao CSDL dãy. .. trình bày tổng quan, tóm tắt vấn đề liên quan đến khai phá mẫu dãy CSDL dãy, khai phá mẫu dãy trọng số CSDL dãy, khai phá mẫu dãy CSDL dãy định lượng, khai phá mẫu dãy CSDL dãy có khoảng cách thời... hướng phát triển vấn đề quan tâm NCS TỔNG QUAN KHAI PHÁ MẪU DÃY CÓ TRỌNG SỐ TRONG CƠ SỞ DỮ LIỆU DÃY Chương trình bày tổng quan định nghĩa vấn đề khai phá mẫu dãy CSLD dãy, mẫu dãy có trọng số CSDL

Ngày đăng: 03/03/2023, 07:36

Tài liệu cùng người dùng

Tài liệu liên quan