Các mơ hình khai thác chuỗi tuần tự nén thường được thực hiện trên các cơ
sở dữ liệu khác nhau trên thế. Tuy nhiên, hầu hết các cơ sở dữ liệu thế giới thực cập nhật với tiến bộ của thời gian. Qua nghiên cứu một số thuật tốn khai thác mẫu tuần
tự nén SeqKrimp và GoKrimp ta nhận thấy, thuật tốn GoKrimp đã đạt được nhiều
cải tiến về mặt thời gian thực hiện các mẫu nén và các mẫu nén được trích ra tỏ ra hữu dụng hơn, giảm thiểu khả năng trùng lắp của các mẫu kết quả. Tác giả luận văn
cũng đã hiểu và xây dựng được các ví dụ cụ thể cho từng thuật tốn nhằm giúp người đọc dễ tiếp cận các thuật tốn hơn.
Từ những nghiên cứu bước đầu này, trong thời gian tới tác giả luận án sẽ tiếp tục nghiên cứu các thuật tốn khai thác mẫu tuần tự nén mới hơn để từ đĩ cĩ thể cải
tiến và xây dựng cho mình một thuật tốn khai thác mẫu tuần tự tối ưu về mặt thời
TÀI LIỆU THAM KHẢO
1. D. Chakrabarti, S. Papadimitriou, D. Modha, and C. Faloutsos, “Fully
automatic cross-associations”, KDD, 2004, 79–88. Statistical Analysis and Data Mining DOI:10.1002/sam 52 Statistical Analysis and Data Mining, Vol. 7 (2014)
2. D. Fradkin and F. Moerchen, Margin-Closed “Frequent Sequential Pattern
Mining”, Workshop on Mining Useful Patterns, KDD, 2010.
3. D. Huffman, “A method for the construction of minimumredundancy codes”,
Proc IRE 40(9) (1952), 1098–1102.
4. H. T. Lam, F. Moerchen, D. Fradkin, and T. Calders , “Mining Compressing
Sequential Patterns”, Statistical Analysis and Data Mining: The ASA Data Science Journal, Volume 7, Issue 1, pages 34–52, February 2014.
5. H. T. Lam, F. Moerchen, D. Fradkin, and T. Calders, “Mining Compressing
Sequential Patterns “, SDM, SIAM, Philadelphia, PA, USA, 2012.
6. J. Vreeken and N. Tatti, “The Long and the Short of It: Summarizing Event
Sequences with Serial Episodes”, SIGKDD, ACM, 2012, 462–470.
7. J. Vreeken, M. van Leeuwen, and A. Siebes, “A. Krimp mining itemsets that
compress”, Data Mining Knowl Discov 23(1) (2011), 169–214.
8. K. Smets and J. V. Slim, “Directly Mining Descriptive Patterns”, SIAM
SDM, 2012, 236–247.
9. N. Castro and P. Azevedo, “Time Series Motifs Statistical Significance”,
SDM, 2011, 687–698
10.N. Tatti and J. Vreeken, “Finding good itemsets by packing data”, ICDM
(2008), 588–597.
11.J. Vreeken and N. Tatti, “The Long and the Short of It: Summarizing Event
Sequences with Serial Episodes”, SIGKDD, ACM, 2012, 462–470.
12.H. T. Lam, F. Moerchen, D. Fradkin, and T. Calders, “Mining Compressing
13.C. Faloutsos and V. Megalooikonomou, “On data mining, compression and Kolmogorov complexity”, Data Mining Knowl Discov 15(1) (2007), 3–20. 14.C. Ambuhl, M. Mastrolilli, and O. Svensson, “Inapproximability results for
maximum edge biclique, minimum linear arrangement, and sparsest cut”, SIAM J Comput 40(2) (2011), 567–596.