KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Một phần của tài liệu Khai thác mẫu tuần tự nén (Trang 56 - 59)

Các mơ hình khai thác chuỗi tuần tự nén thường được thực hiện trên các cơ

sở dữ liệu khác nhau trên thế. Tuy nhiên, hầu hết các cơ sở dữ liệu thế giới thực cập nhật với tiến bộ của thời gian. Qua nghiên cứu một số thuật tốn khai thác mẫu tuần

tự nén SeqKrimp và GoKrimp ta nhận thấy, thuật tốn GoKrimp đã đạt được nhiều

cải tiến về mặt thời gian thực hiện các mẫu nén và các mẫu nén được trích ra tỏ ra hữu dụng hơn, giảm thiểu khả năng trùng lắp của các mẫu kết quả. Tác giả luận văn

cũng đã hiểu và xây dựng được các ví dụ cụ thể cho từng thuật tốn nhằm giúp người đọc dễ tiếp cận các thuật tốn hơn.

Từ những nghiên cứu bước đầu này, trong thời gian tới tác giả luận án sẽ tiếp tục nghiên cứu các thuật tốn khai thác mẫu tuần tự nén mới hơn để từ đĩ cĩ thể cải

tiến và xây dựng cho mình một thuật tốn khai thác mẫu tuần tự tối ưu về mặt thời

TÀI LIỆU THAM KHẢO

1. D. Chakrabarti, S. Papadimitriou, D. Modha, and C. Faloutsos, “Fully

automatic cross-associations”, KDD, 2004, 79–88. Statistical Analysis and Data Mining DOI:10.1002/sam 52 Statistical Analysis and Data Mining, Vol. 7 (2014)

2. D. Fradkin and F. Moerchen, Margin-Closed “Frequent Sequential Pattern

Mining”, Workshop on Mining Useful Patterns, KDD, 2010.

3. D. Huffman, “A method for the construction of minimumredundancy codes”,

Proc IRE 40(9) (1952), 1098–1102.

4. H. T. Lam, F. Moerchen, D. Fradkin, and T. Calders , “Mining Compressing

Sequential Patterns”, Statistical Analysis and Data Mining: The ASA Data Science Journal, Volume 7, Issue 1, pages 34–52, February 2014.

5. H. T. Lam, F. Moerchen, D. Fradkin, and T. Calders, “Mining Compressing

Sequential Patterns “, SDM, SIAM, Philadelphia, PA, USA, 2012.

6. J. Vreeken and N. Tatti, “The Long and the Short of It: Summarizing Event

Sequences with Serial Episodes”, SIGKDD, ACM, 2012, 462–470.

7. J. Vreeken, M. van Leeuwen, and A. Siebes, “A. Krimp mining itemsets that

compress”, Data Mining Knowl Discov 23(1) (2011), 169–214.

8. K. Smets and J. V. Slim, “Directly Mining Descriptive Patterns”, SIAM

SDM, 2012, 236–247.

9. N. Castro and P. Azevedo, “Time Series Motifs Statistical Significance”,

SDM, 2011, 687–698

10.N. Tatti and J. Vreeken, “Finding good itemsets by packing data”, ICDM

(2008), 588–597.

11.J. Vreeken and N. Tatti, “The Long and the Short of It: Summarizing Event

Sequences with Serial Episodes”, SIGKDD, ACM, 2012, 462–470.

12.H. T. Lam, F. Moerchen, D. Fradkin, and T. Calders, “Mining Compressing

13.C. Faloutsos and V. Megalooikonomou, “On data mining, compression and Kolmogorov complexity”, Data Mining Knowl Discov 15(1) (2007), 3–20. 14.C. Ambuhl, M. Mastrolilli, and O. Svensson, “Inapproximability results for

maximum edge biclique, minimum linear arrangement, and sparsest cut”, SIAM J Comput 40(2) (2011), 567–596.

Một phần của tài liệu Khai thác mẫu tuần tự nén (Trang 56 - 59)

Tải bản đầy đủ (PDF)

(59 trang)