Hướng phát triển của đề tài

Một phần của tài liệu Phát hiện mô típ với chiều dài khác nhau trên dữ liệu chuỗi thời gian (Trang 74 - 82)

2.

5.3 Hướng phát triển của đề tài

Đề tài đã sử dụng kết quả của giải thuật chiếu ngẫu nhiên, sau đó sử dụng giải thuật nối mô típ để tiến hành phát hiện mô típ có chiều dài khác nhau. Do thời gian thực hiện đề tài ngắn nên chúng tôi không thể nghiên cứu đề tài này một cách sâu nhất. Chúng tôi thấy có một số hướng phát triển của đề tài trong tương lai như sau:

 Chúng tôi chỉ mới thử nghiệm giải thuật trên một số ít tập dữ liệu mẫu. Do đó, chúng ta cần phải thu thập thêm nhiều nguồn dữ liệu chuỗi thời gian khác để tiến hành thử nghiệm và đưa ra các phân tích và đánh giá nhiều hơn nữa.

 Nghiên cứu cải tiến giải thuật để tăng tốc độ xử lý đối với những tập dữ liệu lớn.

 Việc phát hiện được các mô típ có chiều dài lớn giúp giải thuật có thể ứng dụng vào trong các lĩnh vực dự báo liên quan đến dữ liệu chuỗi thời gian như dự báo giá chứng khoán, dự báo thời tiết, phân tích mô hình tăng trưởng của công ty…

TÀI LIỆU THAM KHẢO

[1] Jessica Lin, Eamonn Keogh, Stefano Lonardi, Bill Chiu, “A Symbolic Representation of Time Series, with Implications for Streaming Algorithms”, in

Proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, San Diego, CA. June 13.

[2] Jeremy Buhler, Martin Tompa, “Finding motifs using random projections”, in

Proceedings of the fifth annual international conference on Computational biology, April 2001.

[3] Eamonn J. Keogh, Michael J. Pazzani, “Dimensionality reduction for fast similarity search in large time series databases”, Journal of Knowledge and Information Systems, Vol. 3, No. 3, 2000, pp. 263-286.

[4] Bill Chiu, Eamonn Keogh, Stefano Lonardi, “Probabilistic discovery of time series motifs”, in Proceedings of the 9th International Conference on Knowledge Discovery and Data mining, Washington, D.C., 2003.

[5] Jessica Lin, Eamonn Keogh, Pranav Patel, Stefano Lonardi, “Finding motifs in time series”, in The 2nd Workshop on Temporal Data Mining, at the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Edmonton, Alberta, Canada.

[6] Abdullah Mueen, Eamonn Keogh, Qiang Zhu, Sydney Cash, “Exact Discovery of Time Series Motifs”, SDM 2009, 473-484.

[7] Heng Tang, Stephen Shaoyi Liao, “Discovering original motifs with different lengths from time series”, in Journal Knowledge-Based Systems, Volume 21 Issue 7, October, 2008.

[8] Berndt, D. and Clifford J., 1994, “Using dynamic time warping to find patterns in time series”, in Proceedings of AAAI Workshop on Knowledge Discovery in Databases, KDD-94, Seattle, Washington, USA, pp. 359-370.

[9] Vlachos, M., Gunopulos, D., Das, G., 2004, “Indexing Time Series under Condition of Noise”, in M. Last, A. Kandel & H. Bunke (Eds.), Data Mining in Time Series Databases, World Scientific Publishing, 2004.

[10] R. Agrawal, C. Faloutsos, A. Swami, “Efficient similarity search in sequence databases”, in Proceedings of the 4th International Conference on Foundations of Data Organization and Algorithms (FODO '93), Chicago, Illinois, USA, October 13-15, 1993, pp. 69-84.

[11] Chan, K., Fu, A. W., 1999, “Efficient time series matching by wavelets”, in

Proceedings of the 15th IEEE International Conference on Data Engineering, Sydney, Australia, pp. 126-133.

[12] E. Keogh, M. J. Pazzani, “An enhanced representation of time series which allows fast and accurate classification, clustering and relevance feedback”, in

Proceedings of the 4th International Conference on Knowledge Discovery and Data Mining, New York City, New York, USA, Aug 27-31, 1998, pp 239-241.

[13] E. Keogh, S. Chu, D. Hart, M. J. Pazzani, “An online algorithm for segmenting time series”, in Proceedings of the IEEE International Conference on Data Mining (ICDM '01), San Jose, California, USA, 29 Nov 2001 - 02 Dec 2001, pp. 289-296. [14] E. Keogh, K. Chakrabarti, M. Pazzani, S. Mehrotra, “Locally adaptive dimensionality reduction for indexing large time series databases”, in Proceedings of the 2001 ACM SIGMOD Conference on Management of Data, May 21-24, 2001, pp. 151-162.

[15] Pevzner, P. A. & Sze, S. H. (2000). “Combinatorial approaches to finding subtle signals in DNA sequences”, in Proceedings of the 8th International Conference on Intelligent Systems for Molecular Biology. La Jolla, CA, Aug 19-23. pp 269-278.

[16] Gruber,C.,M Coduro, Sick,B., “Signature Verification With Dynamic RBF Network and Time Seried Motif” , The 10th International Workshop on Frontiers in Hand Writing Recognition 2006.

[17] Keogh E., “A Tutorial on Indexing and Mining Time Series Data”, in

Proceedings of the 32th International Conference on Very Large Databases, VLDB2006, Seoul, Korea, 2006.

[18] Huỳnh Nguyễn Tín, “Nhận dạng motif trên dữ liệu chuỗi thời gian dựa vào điểm cực trị quan trọng”, Luận văn Thạc sĩ, Khoa Khoa học và Kỹ thuật Máy tính, Trường Đại học Bách Khoa TP. Hồ Chí Minh, 7/2012.

PHỤ LỤC A: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH VIỆT

Thuật ngữ tiếng Anh Thuật Ngữ Tiếng Việt Viết tắt

Non-Trivial match Trùng không tầm thường

Trivial match Trùng tầm thường

Longest Common Subsequence Chuỗi con chung dài nhất LCS Dinamic Time Wraping Xoắn thời gian động DTW Discrete Fourier Transform Biến đổi Fourier rời rạc DFT Discrete Wavelet Transform Biến đổi Wavelet rời rạc DWT Piecewise Linear Approximation Xấp xỉ tuyến tính từng đoạn PLA PiecewiseAggregate Approximation Xấp xỉ gộp từng đoạn PAA Adaptive Piecewise Constant

Approximation

Xấp xỉ hằng số từng đoạn thích nghi

APCA

Motif Mô típ

Dimensionality Reduction Thu giảm số chiều

Discretization Rời rạc hóa

Random Projection Chiếu ngẫu nhiên Collision matrix Ma trận đụng độ

Mask Mặt nạ Motif concatenation Nối mô típ

Segment Phân đoạn

Equivalent class Lớp tương đương

LÝ LỊCH TRÍCH NGANG

Họ và tên: Lê Minh Nhựt Ngày sinh: 02/06/1985 Nơi sinh: TP.HCM

Địa chỉ liên lạc: 152 đường 355, ấp Hậu, xã Tân An Hội, huyện Củ Chi, TP.HCM.

QUÁ TRÌNH ĐÀO TẠO

Thời gian Trường đào tạo Chuyên ngành Trình độ đào tạo

2003-2008 Trường Đại học Bách Khoa TPHCM

Công nghệ Thông tin Kỹ sư

2010-2013 Trường Đại học Bách Khoa TPHCM

QUÁ TRÌNH CÔNG TÁC

Thời gian Đơn vị công tác Vị trí công tác

2008-2009 Công ty Global Cyber Soft, Công viên phần mềm Quang Trung , TP.HCM.

Lập trình viên

2009-2013 Công ty Cổ phần Vân tải và Giao nhận Bia Sài Gòn, 78 Tôn Thất Thuyết, phường 16, quận 4, TP.HCM.

Một phần của tài liệu Phát hiện mô típ với chiều dài khác nhau trên dữ liệu chuỗi thời gian (Trang 74 - 82)

Tải bản đầy đủ (PDF)

(82 trang)