1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện motif trên dữ liệu chuỗi thời gian dựa vào phép biến đổi ESAX

75 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 75
Dung lượng 3 MB

Nội dung

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - VŨ THỊ THÁI LINH PHÁT HIỆN MOTIF TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO PHÉP BIẾN ĐỔI ESAX CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01 LUẬN VĂN THẠC SỸ TP HỐ HỒ CHÍ MINH, tháng 06 năm 2014 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - VŨ THỊ THÁI LINH PHÁT HIỆN MOTIF TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO PHÉP BIẾN ĐỔI ESAX CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01 LUẬN VĂN THẠC SĨ HƯỚNG DẪN KHOA HỌC: PGS TP HỐ HỒ CHÍ MINH, tháng 06 năm 2014 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA – ĐHQG TP HCM Cán hướng dẫn khoa học: PGS TS Dương Tuấn Anh Cán chấm nhận xét 1: Cán chấm nhận xét 2: Luận văn thạc sĩ bảo vệ tại: Trường đại học Bách Khoa – ĐHQG TP.HCM, ngày………tháng………năm……… Thành phần hội đồng đánh giá luận văn thạc sỹ gồm: Xác nhận chủ tịch hội đồng đánh giá luận văn Trưởng khoa quản lý chuyên ngành sau luận văn sữa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: VŨ THỊ THÁI LINH MSHV: 12070516 Ngày, tháng, năm sinh: 12/02/1982 Nơi sinh:TP.HCM Chuyên ngành: Khoa học máy tính Mã số : 60.48.01 I TÊN ĐỀ TÀI: Phát motif liệu chuỗi thời gian dựa vào phép biến đổi ESAX II NHIỆM VỤ VÀ NỘI DUNG: Nghiên cứu so sánh hiệu hai phương pháp rời rạc hóa SAX ESAX áp dụng vào giải thuật phát motif liệu chuỗi thời gian III NGÀY GIAO NHIỆM VỤ : IV NGÀY HOÀN THÀNH NHIỆM VỤ : V CÁN BỘ HƯỚNG DẪN : PGS TS Dương Tuấn Anh Tp HCM, ngày tháng năm 20 CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên chữ ký) PGS TS Dương Tuấn Anh TRƯỞNG KHOA (Họ tên chữ ký) LỜI CẢM ƠN Trước tiên xin gửi lời cảm ơn sâu sắc chân thành đến PGS.TS Dương Tuấn Anh, người thầy tận tình bảo tơi suốt q trình thực luận văn cao học tạo điều kiện tốt để tơi hồn thành luận văn Tơi xin cảm ơn quý thầy cô trực tiếp gián tiếp truyền đạt kiến thức cần thiết q trình học tập trường Tơi xin cảm ơn gia đình, bạn bè động viên tạo điều kiện thuận lợi để tơi tiếp tục theo đuổi việc học tập nghiên cứu Một lần chân thành cảm ơn tất người i TÓM TẮT LUẬN VĂN Biểu diễn liệu chuỗi thời gian ngày đóng vai trị quan trọng toán khai phá liệu chuỗi thời gian Hiện liệu chuỗi thời gian lớn, lĩnh vực ứng dụng ngày phát triển nên phương pháp biểu diễn chuỗi thời gian hợp lý cho loại liệu loại ứng dụng cụ thể nhằm cải thiện tốc độ độ xác hồn thành tốn địi hỏi cần thiết Đề tài tìm hiểu phương pháp rời rạc hóa liệu ESAX (phương pháp xấp xỉ gộp ký hiệu hóa mở rộng), so sánh mức hiệu dụng hai phép rời rạc hoá liệu SAX (phương pháp xấp xỉ gộp ký hiệu hoá) áp dụng vào toán phát motif tận dụng tính tìm kiếm xác phương pháp ESAX (một ưu mà phương pháp SAX được) để rút ngắn thời gian việc phát chuỗi motif Sau đề xuất cách ứng dụng phương pháp ESAX vào giải thuật Random Projection để phát motif Thực nghiệm so sánh, nhận thấy phương pháp đề xuất phát motif phép biến đổi ESAX xác giải thuật Random Projection phép biến đổi SAX với thời gian thực thi tương đương ii ABSTRACT The representation of time series plays more and more important role in time series data mining problems Since time series data have very big size, with many growing applications of time series data, it is necessary to have a suitable representation method for each kind of datasets and each kind of application which aims to improve the speed and the accuracy of the data mining solutions This thesis studies ESAX (Extended SAX) then applies this representation to motif discovery problem After that, we compare the efficiency of ESAX and SAX on the algorithm to discover motif We take advantage of desirable feature of ESAX (which SAX does not have) to shorten CPU time used for finding motif by using Random Projection Algorithm with ESAX representation The experimental results show that the proposed algorithm has the accuracy than the Random Projection algorithm on SAX representation in motif discovery problem while the execution time is equivalent iii LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày……….tháng…………năm…… Vũ Thị Thái Linh iv MỤC LỤC LỜI CẢM ƠN i TÓM TẮT LUẬN VĂN ii ABSTRACT iii LỜI CAM ĐOAN iv CHƯƠNG 1: PHÁT BIỂU VẤN ĐỀ 1.1 Dữ liệu chuỗi thời gian 1.2 Khai phá motif chuỗi liệu thời gian 1.3 Mục tiêu giới hạn đề tài 1.4 Những kết đạt 1.5 Cấu trúc luận văn CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 Một số khái niệm 2.1.1 Chuỗi (Subsequence) 2.1.2 Cửa sổ trượt (Slide window) 2.1.3 Trùng khớp (Match) 2.1.4 Trùng khớp không tầm thường (Non-Self Match) .9 2.1.5 K-motif 2.2 Các cơng trình độ đo tương tự 10 2.2.1 Độ đo Minkowski 10 2.2.2 Độ đo xoắn thời gian động (Dynamic Time Warping- DTW) 11 2.3 Các cơng trình biểu diễn chuỗi thời gian 14 2.3.1 Phép biến đổi Fourier rời rạc DFT 14 2.3.2 Phép biến đổi Wavelet rời rạc DWT 16 2.3.3 Phép xấp xỉ gộp đoạn PAA 17 v 2.3.4 Phép xấp xỉ gộp đoạn mở rộng EPAA (Extended PAA) 18 2.3.5 Phép xấp xỉ gộp ký hiệu hóa SAX 20 2.3.4.1 Chuẩn hóa liệu 20 2.3.4.2 Thu giảm số chiều qua PAA (xem 2.3.3) 21 2.3.4.3 Ký hiệu hóa chuỗi thời gian 21 2.3.4.4 Hàm tính độ đo tương tự 22 2.3.6 Phương pháp xấp xỉ gộp ký hiệu hoá mở rộng ESAX (Extended SAX) 24 2.4.Kết luận 27 CHƯƠNG 3: TỔNG THUẬT CÁC CƠNG TRÌNH LIÊN QUAN 28 3.1 Phát 1-Motif dựa vào giải thuật Brute Force 28 3.2 Phát Motif dựa vào giải thuật Random Projecttion 29 3.3 Kết luận 31 CHƯƠNG 4: PHƯƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ 33 4.1 Dùng cửa sổ trượt rút trích chuỗi 33 4.2 Thu giảm số chiều chuỗi theo phép biến đổi EPAA (xem 2.3.4) 33 4.3 Rời rạc hoá liệu chuỗi theo phép biến đổi ESAX (xem 2.3.6) 34 4.4 Xây dựng giải thuật Random Projection theo phép biến đổi ESAX 34 CHƯƠNG 5: THỰC NGHIỆM 38 5.1 Thực nghiệm giải thuật thực tập liệu 39 5.1.1 Dữ liệu điện tâm đồ (ECG) 7.000 điểm 42 5.1.2 Dữ liệu điện tâm đồ (ECG) 10.000 điểm 43 5.1.3 Dữ liệu điện não đồ (EEG) 12.137 điểm 44 5.1.4 Dữ liệu doanh nghiệp (ERP) 10.120 điểm .45 5.1.5 Dữ liệu MEMORY 12.000 điểm 46 5.1.6 Dữ liệu lượng (POWER) 12.000 điểm 47 5.1.7 Dữ liệu chứng khoán (STOCK) 5.056 điểm 48 vi 5.1.6 Dữ liệu lượng (POWER) 12.000 điểm a Giải thuật RP SAX cho kết Hình 5.12 Hình 5.12 Kết giải thuật RP_SAX liệu POWER 12.000 điểm b Giải thuật RP ESAX cho kết Hình 5.13 Hình 5.13 Kết giải thuật RP_ESAX liệu POWER 12.000 điểm 47 5.1.7 Dữ liệu chứng khoán (STOCK) 5.056 điểm a Giải thuật RP SAX cho kết Hình 5.14 Hình 5.14 Kết giải thuật RP_SAX liệu STOCK 5.056 điểm b Giải thuật RP ESAX cho kết Hình 5.15 Hình 5.15 Kết giải thuật RP_ESAX liệu STOCK 5.056 điểm 48 5.2 So sánh giải thuật dựa kết thực nghiệm Khoảng cách Dữ Kích liệu thước Giải thuật Số lần gọi Số thể hàm khoảng cách motif Euclid Thời gian trung bình thể motif RP_SAX 6728 10 1s 464ms 3.711 RP_ESAX 6329 10 1s 494ms RP_SAX 9499 10 3s 107ms 7.468 RP_ESAX 9235 3s 32ms 4.012 RP_SAX 11327 4s 637ms 34.317 RP_ESAX 11342 4s 606ms RP_SAX 9526 15 3s 446ms 8.375 RP_ESAX 9491 3s 82ms RP_SAX 11091 4s 948ms 7.177 RP_ESAX 11365 4s 646ms 3.932 RP_SAX 10651 4s 603ms 8.769 RP_ESAX 10655 4s 563ms RP_SAX 4394 753ms 23.676 RP_ESAX 4257 725ms ECG 7.000 STOCK POWER MEMORY ERP EEG 10.000 12.137 10.120 12.000 12.000 5.056 Bảng 5.3 Bảng so sánh kết giải thuật RP_SAX giải thuật RP_ESAX dựa kết thực nghiệm 49 6000 5000 4000 Time(ms) 3000 2000 1000 RP_SAX RP_ESAX Hình 5.16 Biểu đồ so sánh thời gian chạy giải thuật Random Projection ESAX giải thuật Random Projection SAX 12000 10000 Distance 8000 6000 4000 2000 RP_SAX RP_ESAX Hình 5.17 Biểu đồ so sánh số lần gọi hàm khoảng cách giải thuật Random Projection ESAX giải thuật Random Projection SAX 50 40 35 30 25 Euclid average 20 motif 15 10 RP_SAX RP_ESAX Hình 5.18 Biểu đồ so sánh khoảng cách Euclid trung bình thể motif tìm giải thuật Random Projection ESAX giải thuật Random Projection SAX 5.3 Nhận xét  Thông qua thực nghiệm, nhận thấy thể motif giải thuật Random Projection phép biến đổi ESAX cho kết xác giải thuật Random Projection phép biến đổi SAX (các thể motif RP_ESAX tương tự với so với thể motif RP_SAX thông qua khoảng cách Euclid trung bình thể motif tìm được) Do phép biến đổi ESAX cho kết tìm kiếm xác nên thể motif xác dẫn đến có lần cập nhật ma trận xung đột phần hậu kiểm so trùng không tầm thường tính hàm khoảng cách ứng viên motif nên giảm thời gian cho phần gọi hàm khoảng cách 51  Trong hàm khoảng cách MINDIST phép biến đổi ESAX, chúng tơi cịn sử dụng kỹ thuật từ bỏ sớm [20] giúp cho việc kết thúc nhanh q trình tính tốn hàm khoảng cách hai chuỗi biểu diễn ESAX  Kết giải thuật Random Projection phép biến đổi ESAX phát motif xác giải thuật Random Projection phép biến đổi SAX với thời gian thực thi tương đương (trong điều kiện có số lần lặp)  Với tập liệu KOSKI, EEG, ERP giải thuật Random Projection phát motif phép biến đổi ESAX xác so với giải thuật Random Projection phép biến đổi SAX (thông qua độ đo khoảng cách Euclid trung bình thể motif tìm được) Riêng với tập liệu POWER, chênh lệch độ hiệu hai giải thuật không nhiều chênh lệch giá trị hàm độ đo khoảng cách không nhiều chênh lệch thể motif khơng nhiều Cịn tập liệu STOCK kết motif tìm thấy giải thuật RP ESAX xác nhanh so với giải thuật RP SAX hàm độ đo khoảng cách chuỗi hai phép biểu diễn chênh lệch nhiều nên thu giảm thời gian tính tốn hàm MINDIST hai chuỗi ESAX  Như vậy, nhìn chung phương pháp rời rạc hóa ESAX cho kết motif xác phương pháp rời rạc SAX áp dụng vào tốn phát motif nhiều phụ thuộc vào liệu Do áp dụng ESAX cho loại liệu khác, ta phải tinh chỉnh thông số phù hợp với loại liệu để ESAX hoạt động cách hiệu 52 CHƯƠNG 6: KẾT LUẬN Chương tổng kết việc làm được, đóng góp luận văn trình bày hướng mở rộng cho nghiên cứu sau 6.1 Tổng kết Luận văn trình bày số phương pháp biểu diễn liệu chuỗi thời gian, hàm tính độ tương tự, cấu trúc mục, định nghĩa chuỗi thời gian, chuỗi motif giải thuật phát motif xấp xỉ motif xác Qua đó, chọn phương pháp biểu diễn, hàm tính độ tương tự giải thuật để giải toán phát motif Sử dụng hàm MINDIST (là hàm chặn hàm Euclid) hai chuỗi thu giảm số chiều theo PAA, EPAA rời rạc hoá liệu theo phép biến đổi SAX, ESAX Giải thuật phát motif chọn Random Projection chúng dễ sử dụng, chúng chạy thực nghiệm thơng qua việc chuẩn hố liệu so sánh thời gian va mức độ xác với giải thuật đề xuất dễ dàng Đề cách ứng dụng đặc tính xác phép biến đổi ESAX vào giải thuật Random Projection để phát motif áp dụng kỹ thuật từ bỏ sớm [20] để làm giảm thời gian tính tốn hàm khoảng cách MINDIST hai chuỗi ESAX Hệ thống chạy thực nghiệm tập liệu: KOSKI, EEG, ERP, POWER, STOCK với chiều dài khác nhau: 7.000, 10.000, 12.137, 10120, 12000, 5056 điểm so sánh độ hiệu dựa hai tiêu chí: tổng số lần gọi hàm tính khoảng cách (hàm MINDIST) thời gian chạy giải thuật độ xác thể motif tìm (chất lượng motif thơng qua khoảng cách Euclid trung bình thể motif tìm được) Qua thực nghiệm, thấy giải thuật Random Projection phép biến đổi ESAX cho kết motif xác 53 giải thuật Random Projection phép biến đổi SAX với thời gian thực thi tương đương (trong điều kiện số lần lặp) 6.2 Những đóng góp luận văn  Luận văn nêu số nhận xét ưu điểm nhược điểm giải thuật phát motif đề cách ứng dụng phương pháp rời rạc hóa ESAX vào tốn phát motif  Xây dựng giải thuật Random Projection phép biến đổi ESAX để phát motif  Sử dụng hệ số thu giảm PAA_Ratio (có thể chỉnh theo u cầu mục đích người dùng) để thu giảm tập liệu phát motif mà kết xác  Để kiểm nghiệm độ hiệu giải thuật Random Projection phép biến đổi ESAX, thực thành hệ thống tổng quát cho toán phát motif thử nghiệm năm liệu khác với thông số khác Kết cho thấy, giải thuật Random Projection phép biến đổi ESAX phát motif với thời gian tương đương xác giải thuật Random Projection phép biến đổi SAX 6.3 Hướng phát triển Đề tài đề cập đến toán khai phá liệu chuỗi thời gian toán biểu diễn liệu chuỗi thời gian Từ đó, đề tài đề cách tiếp cận khác để giải toán phát motif Đề tài thực nghiệm với tập liệu: KOSKI, EEG, ERP, POWER, STOCK, liệu lớn mở rộng thêm tạo từ tập liệu ban đầu với mong muốn tạo chuỗi motif giống để so sánh độ hiệu phương pháp ESAX vào giải thuật Random Projection nên khơng tránh khỏi thiếu sót 54 Các đề xuất mở rộng đề tài sau:  Giải thuật đề xuất thực nghiệm điều kiện kích thước tập ký tự (Alphabetsize α = 6) Chúng nghĩ với α lớn (lớn đến mức độ định 16, 32, 64), độ xác giải thuật cao biểu diễn ESAX gần với liệu gốc  Đối với ngưỡng Rmax nhỏ bỏ qua chuỗi thể motif, cịn Rmax lớn q khơng thu hẹp khơng gian tính tốn hàm MINDIST hai chuỗi ESAX (kỹ thuật từ bỏ sớm) nên cần phải có phương pháp chọn ngưỡng Rmax hợp lý để giải thuật phát hết thể motif 55 TÀI LIỆU THAM KHẢO [1] C Faloutsos, M Ranganathan & Y Manolopoulos (1994) Fast Subsequence Matching in Time-Series Databases In proceedings of the ACM SIGMOD Int’l Conference on Management of Data May 24-27, 1994 Minneapolis, MN pp 419-429 [2] D Berndt and J Clifford (1994) Using dynamic time warping to find patterns in time series In proceedings of AAAI Workshop on Knowledge Discovery in Databases, KDD-94, Seattle, Washington, USA, pp 359-370 [3] E Keogh, K Chakrabarti, M Pazzani and S Mehrotra (2000) Dimensionality reduction for fast similarity search in large time series databases, Journal of Knowledge and Information Systems, Vol 3, No 3, 2000, pp 263-286 [4] J Lin, E Keogh, S Lonardi, & B Chiu (2003) A Symbolic Representation of Time Series, with Implications for Streaming Algorithms In proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery San Diego, CA June 13, 2003 [5] K Chan & A W Fu (1999) Efficient Time Series Matching by Wavelets In proceedings of the 15th IEEE Int'l Conference on Data Engineering Sydney, Australia, Mar 23-26 pp 126-133 [6] R Agrawal, C Faloutsos, A N Swami (1993) Efficient Similarity Search In Sequence Databases In proceedings of the 4th International Conference on Foundations of Data Organization and Algorithms, pp.69-84, October 1315, 1993 [7] S Park, W.W Chu, J Yoon, and C Hsu (2000) Efficient Searches for Similar Subsequences of Different Lengths in Sequence Databases Proc Int'l Conf Data Eng., Feb 2000 56 [8] Dương Tuấn Anh Tổng quan tìm kiếm tương tự liệu chuỗi thời gian (An overview of similarity search in time series data): http://www.cse.hcmut.edu.vn/~dtanh/timeseries/similaritysearch.pdf [9] J Lin, E Keogh, S Lonardi, P Patel (2002) Finding Motifs in Time Series Proceedings of 2nd Workshop on Temporal Data Mining, at the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2002 [10] B Chiu, E Keogh, and S Lonardi (2003) Probabilistic Discovery of Time Series Motifs Proceedings of the th International Conference on Knowledge Discovery and Data Mining (KDD'03), pp 493-498, 2003 [11] A Mueen, E Keogh, Q Zhu, S Cash, and B.West-over (2009) Exact Discovery of Time Series Motifs SIAM International Conference on Data Mining (SDM'09), 2009 [12] M Tompa, J Buhler (2001) Finding motifs using random projections In proceedings of the 5th Int’l Conference on Computational Molecular Biology Montreal, Canada, Apr 22-25 2001, pp 67-74 [13] E Keogh (2006) A Tutorial on Indexing and Mining Time Series Data In Proceedings of the 32th International Conference on Very Large Databases, VLDB2006, Seoul, Korea [14] Colors of noise at http://en.wikipedia.org/wiki/Colors_of_noise [15] R Popivanov, Miller (2002) Similarity Search Over Time Series Data Using Wavelets, ICDE 2002, San Jose, CA, 26/2/2002 - 1/3/2002 [16] E Keogh and S Kasetty (2002) On the Need for Time Series Data Mining Benchmarks: A Survey and Empirical Demonstration In proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining July 23 - 26, 2002 Edmonton, Alberta, Canada pp 102-111 57 [17] E Keogh (2007) Mining shape and time series databases with symbolic representations Tutorial of the 13rd ACM International Conference on Knowledge Discovery and Data Mining, August 12-15, 2007 [18] Time series data: http://www.cs.ucr.edu/~eamonn/discords [19] B Lkhagva, Y Suzuki, K Kawagoe (2006) Extended SAX: Extension of Symbolic Aggregate Approximation for Financial Time SeriesData Representation In Proceedings of DEWS Data Engineering Workshop, DNEWS2006, 4A-i8 [20] Nguyễn Thanh Sơn, Dương Tuấn Anh (2013) Tìm kiếm k-motifs xấp xỉ chuỗi liệu chuỗi thời gian R*-Tree Tạp chí khoa học cơng nghệ trường Đại học kỹ thuật, số 95, 2013, tr.133-139 58 PHỤ LỤC: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH- VIỆT Thuật ngữ tiếng Anh Thuật ngữ tiếng Việt Ad hoc query Approximate search Base cardinality Base line Brand-and-bound search Breakpoint Categorization Classification Clustering Codeword Continuity Data normalization Deviation Dimensionality reduction Discrete Fourier transform Discrete Wavelet transform Discretizeation Distance Dynamic time warping Extended-Piecewise-Aggregate- Truy vấn ngẫu nhiên Tìm kiếm xấp xỉ Lượng số Đường Tìm kiếm nhánh cận Điểm ngắt Phân loại liệu Phân loại Gom cụm Từ mã Tính liên tục Chuẩn hóa liệu Độ lệch Thu giảm số chiều Phép biến đổi Fourier rời rạc Phép biến đổi Wavelet rời rạc Rời rạc hóa Khoảng cách Xoắn thời gian động Xấp xỉ gộp đoạn mở rộng Viết tắt DFT DWT DTW EPAA Approximation Extended Symbolic Aggregate Approximation Feature Lower bound Monotonicity Motif detection Overlapping region Pattern Percentage of disk I/Os Piecewise aggregate approximation Query data processing Random Projection Xấp xỉ gộp ký hiệu hóa mở rộng ESAX Đặc trưng Chặn Tính đơn điệu Phát Motif Vùng phủ lấp Mẫu thức Tỉ lệ phần trăm số lần truy xuất Xấp xỉ gộp đoạn PAA đĩa Truy vấn liệu Chiếu ngẫu nhiên RP A1 Representation of data Segment Similarity measure Similarity search Sliding window Subsequence Summarization Symbolic Aggregate Approximation Time series Time warping Biểu diễn liệu Phân đoạn liệu Độ đo tương tự Tìm kiếm tương tự Cửa sổ trượt Chuỗi Tóm tắt Xấp xỉ gộp ký hiệu hóa Chuỗi thời gian Xoắn thời gian Upper bound Warping window Word Zero-Mean normalization Chặn Cửa sổ xoắn Từ Chuẩn hóa trung bình zero SAX A2 LÝ LỊCH TRÍCH NGANG Họ tên: Vũ Thị Thái Linh Ngày tháng năm sinh : 12/02/1982 Nơi sinh: TP.HCM Địa liên lạc: 295A Đoàn Văn Bơ F18, Q4 Số điện thoại: 0908289414 QUÁ TRÌNH ĐÀO TẠO Thời gian Trường đào tạo 2001-2005 Đại học khoa tự nhiên TP.HCM 2006-2009 Đại học khoa học xã hội nhân văn TP.HCM 2012-2014 Đại học Bách Khoa TP.HCM Bậc đào Chuyên ngành Toán Tin Ngữ văn Anh tạo Cử nhân Cử nhânVB2 Khoa học Máy tính Thạc sỹ Q TRÌNH CƠNG TÁC Thời gian Đơn vị cơng tác Vị trí 2005 - Trường Cao đẳng kỹ thuật Lý Tự Trọng TP.HCM Giảng viên B ... 1: PHÁT BIỂU VẤN ĐỀ 1.1 Dữ liệu chuỗi thời gian Dữ liệu chuỗi thời gian liệu đo đạc cách theo thời gian Đối tượng liệu có hai hay nhiều chiều phải có chiều thời gian Có nhiều liệu có yếu tố thời. .. (anomaly) tìm chuỗi khác biệt với tất chuỗi khác liệu chuỗi thời gian  Phát Motif (Motif detection) cho chuỗi thời gian Q, Motif chuỗi chưa biết trước xuất nhiều lần chuỗi liệu chuỗi thời gian dài... diễn liệu chuỗi thời gian ngày đóng vai trị quan trọng tốn khai phá liệu chuỗi thời gian Hiện liệu chuỗi thời gian lớn, lĩnh vực ứng dụng ngày phát triển nên phương pháp biểu diễn chuỗi thời gian

Ngày đăng: 10/03/2021, 20:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN