Phát hiện chuỗi con bất thường trong dữ liệu chuỗi thời gian dùng giải thuật wat và phương pháp rời rạc hóa isax

109 23 0
Phát hiện chuỗi con bất thường trong dữ liệu chuỗi thời gian dùng giải thuật wat và phương pháp rời rạc hóa isax

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN ĐẶNG KIM KHÁNH PHÁT HIỆN CHUỖI CON BẤT THƢỜNG TRONG DỮ LIỆU CHUỖI THỜI GIAN DÙNG GIẢI THUẬT WAT VÀ PHƢƠNG PHÁP RỜI RẠC HÓA iSAX Chuyên ngành : KHOA HỌC MÁY TÍNH LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng năm 2011 CƠNG TRÌNH ĐƢỢC HOÀN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hƣớng dẫn khoa học: PGS TS Dƣơng Tuấn Anh Cán chấm nhận xét 1: Cán chấm nhận xét 2: Luận văn thạc sĩ đƣợc bảo vệ Trƣờng Đại học Bách Khoa, ĐHQG Tp HCM ngày tháng năm Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Xác nhận Chủ tịch Hội đồng đánh giá LV Trƣởng Khoa quản lý chuyên ngành sau luận văn đƣợc sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA………… ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: NGUYỄN ĐẶNG KIM KHÁNH Phái:Nam Ngày, tháng, năm sinh: 02/08/1987 Nơi sinh:TP.HCM Chuyên ngành: Khoa Học Máy Tính MSHV : 09070962 I TÊN ĐỀ TÀI: PHÁT HIỆN CHUỖI CON BẤT THƢỜNG TRONG DỮ LIỆU CHUỖI THỜI GIAN DÙNG GIẢI THUẬT WAT VÀ PHƢƠNG PHÁP RỜI RẠC HÓA iSAX II NHIỆM VỤ VÀ NỘI DUNG: Nghiên cứu giải thuật WAT áp dụng phƣơng pháp rời rạc hóa iSAX vào giải thuật nhằm cải thiện hiệu III NGÀY GIAO NHIỆM VỤ : IV NGÀY HOÀN THÀNH NHIỆM VỤ: V CÁN BỘ HƢỚNG DẪN: PGS TS Dƣơng Tuấn Anh CÁN BỘ HƢỚNG DẪN (Họ tên chữ ký) CHỦ NHIỆM BỘ MÔN QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) KHOA QL CHUYÊN NGÀNH (Họ tên chữ ký) LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác nhƣ ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chƣa có phần nội dung luận văn đƣợc nộp để lấy cấp trƣờng trƣờng khác Ngày … tháng … năm 2011 Nguyễn Đặng Kim Khánh i LỜI CÁM ƠN Tôi xin gởi lời cám ơn chân thành sâu sắc đến thầy PGS TS Dƣơng Tuấn Anh tận tình hƣớng dẫn tơi suốt trình học Cao học tạo điều kiện để tơi hồn thành luận văn Chúc thầy dồi sức khỏe để tiếp tục hƣớng dẫn hệ sau đƣờng nghiên cứu khoa học Tơi xin cảm ơn gia đình, bạn bè động viên tạo điều kiện tốt để tơi tiếp tục theo đuổi việc học tập nghiên cứu Tôi xin hứa tiếp tục cố gắng phấn đấu để vƣơn cao ii TÓM TẮT LUẬN VĂN Dữ liệu chuỗi thời gian xuất nhiều lĩnh vực Nhiều toán đƣợc đặt nhằm mục đích quản lý, xử lý cách hiệu yêu cầu có liên quan đến liệu chuỗi thời gian Bên cạnh hoạt động so trùng mẫu cịn có hoạt động khác tìm kiếm bất thƣờng Việc phát chuỗi bất thƣờng có nhiều ý nghĩa quan trọng ngày đƣợc quan tâm Giải thuật tìm chuỗi bất thƣờng WAT (Wavelet and Augmented Trie) tận dụng đa mức phân giải phép biến đổi wavelet dạng Haar để tăng tốc việc tìm kiếm chuỗi bất thƣờng Phƣơng pháp rời rạc hóa iSAX (indexable Symbolic Aggregate approXimation – phương pháp xấp xỉ gộp ký hiệu hóa khả mục) hỗ trợ đa mức phân giải có cấu trúc mục hiệu Việc kết hợp giải thuật WAT với phƣơng pháp rời rạc hóa iSAX giúp mang lại hiệu cho thuật toán WAT nguyên thủy Luận văn đề nghị giải thuật WATiSAX (một cách áp dụng phƣơng pháp rời rạc hóa iSAX vào giải thuật WAT nguyên thủy) Qua thực nghiệm cho thấy giải thuật WATiSAX hiệu giải thuật WAT nguyên thủy iii ABSTRACT Time series data presents in many fields More and more problems are discussed in order to manage and process time series data effectively Besides similarity search activity on time series data sets, there is a discord finding activity Finding discord has many important roles and now is paid more and more attention WAT (Wavelet and Augmented Trie) algorithm to find discord makes use of multiresolution in Haar wavelet transform iSAX discretization (indexable Symbolic Aggregate approXimation) also supports multiresolution and has an effective index structure Using WAT algorithm with iSAX discretization will improve the original WAT algorithm The thesis proposes WATiSAX algorithm (an application of iSAX discretization in the original WAT algorithm) The experiments show that WATiSAX algorithm is more effective than original WAT algorithm iv Mục lục LỜI CAM ĐOAN i LỜI CÁM ƠN ii TÓM TẮT LUẬN VĂN iii ABSTRACT .iv Mục lục v Danh mục hình viii Danh mục bảng xi CHƢƠNG PHÁT BIỂU VẤN ĐỀ 1.1 Dữ liệu chuỗi thời gian 1.2 Những yêu cầu dẫn đến việc tìm kiếm chuỗi bất thƣờng .3 1.3 Mục tiêu giới hạn đề tài 1.4 Tóm tắt kết đạt đƣợc .7 1.5 Cấu trúc luận văn CHƢƠNG TỔNG THUẬT VỀ CÁC CƠNG TRÌNH LIÊN QUAN .9 2.1 Các cơng trình phƣơng pháp đo độ tƣơng tự 2.1.1 Độ đo Minkowski 10 2.1.2 Độ đo xoắn thời gian động 11 2.2 Các cơng trình biểu diễn liệu chuỗi thời gian 13 2.3 Các cơng trình việc tìm kiếm chuỗi bất thƣờng .16 2.3.1 Giải thuật hệ miễn nhiễm nhân tạo (IMM) 17 2.3.2 Giải thuật dựa TSA (TSA-Tree) .18 2.3.3 Giải thuật MAPS 18 2.3.4 Giải thuật Tarzan 19 2.3.5 Giải thuật InfoMiner .21 2.3.6 Giải thuật HOT SAX 22 2.3.7 Giải thuật WAT 23 v CHƢƠNG NHỮNG CƠ SỞ LÝ THUYẾT NỀN TẢNG .26 3.1 Định nghĩa toán 26 3.1.1 Lân cận không tầm thƣờng (non-self match) 26 3.1.2 Định nghĩa tốn tìm chuỗi bất thƣờng .26 3.1.3 Định nghĩa tốn tìm K chuỗi bất thƣờng 27 3.2 Phép biến đổi dùng wavelet dạng Haar .28 3.2.1 Công thức chuyển đổi 28 3.2.2 Hàm tính khoảng cách Euclid .31 3.3 Giải thuật vét cạn tìm chuỗi bất thƣờng (Brute Force Discord Discovery) 32 3.4 Giải thuật dùng Heuristic tìm chuỗi bất thƣờng (Heuristic Discord Discovery) 32 3.5 Phƣơng pháp rời rạc hóa SAX .34 3.5.1 Chuẩn hóa liệu 35 3.5.2 Thu giảm số chiều phƣơng pháp PAA 36 3.5.3 Rời rạc hóa liệu 37 3.5.4 Các hàm đo khoảng cách 39 3.6 Giải thuật WAT (Wavelet and Augmented Trie) 41 3.7 Phƣơng pháp rời rạc hóa iSAX 46 3.7.1 So sánh hai từ có mức phân giải khác 47 3.7.2 Xây dựng mục iSAX 48 3.7.3 Tìm kiếm xấp xỉ 49 3.7.4 Tìm kiếm xác 51 CHƢƠNG PHƢƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ VÀ HỆ THỐNG ỨNG DỤNG .54 4.1 Đặt vấn đề 54 4.2 Hƣớng giải vấn đề 55 4.2.1 Giải thuật WATiSAX 55 4.2.2 Cấu trúc mục Haar_iSAX .58 vi 4.2.3 Tìm kiếm xác lân cận gần khơng tầm thƣờng .61 4.2.4 Tìm kiếm xấp xỉ lân cận không tầm thƣờng 66 4.3 Framework chung cho tốn tìm chuỗi bất thƣờng 66 4.4 Kiến trúc hoạt động hệ thống phát chuỗi bất thƣờng .68 4.4.1 Quy trình hoạt động hệ thống .70 4.4.2 Các thành phần hệ thống 70 CHƢƠNG THỰC NGHIỆM 72 5.1 Sự ảnh hƣởng tham số đến hiệu giải thuật WATiSAX .72 5.2 Kết thực nghiêm so sánh giải thuật WAT với giải thuật WATiSAX 75 5.2.1 Thực nghiệm liệu nhu cầu sử dụng điện AEM 76 5.2.2 Thực nghiệm liệu điện tâm đồ ECG 77 5.2.3 Thực nghiệm liệu điện tâm đồ Koski .78 5.2.4 Thực nghiệm liệu điện não đồ EEG 79 5.2.5 Thực nghiệm liệu dự báo kiện ERP .80 5.2.6 Thực nghiệm liệu điện Power 81 5.2.7 Thực nghiệm liệu nhiệt độ khí hậu BoulderDaily 82 5.2.8 Thực nghiệm liệu chứng khoán Stock 83 5.2.9 Nhận xét 84 CHƢƠNG TỔNG KẾT 85 6.1 Tổng kết .85 6.2 Những đóng góp đề tài 86 6.3 Hƣớng phát triển 86 Danh mục tài liệu tham khảo 88 PHỤ LỤC A: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH – VIỆT A PHỤ LỤC B: LÝ LỊCH TRÍCH NGANG D vii 81/91 5.2.6 Thực nghiệm liệu điện Power Hình 5.13 Thời gian thực thi WAT WATiSAX liệu Power Hình 5.14 Số lần gọi hàm tính khoảng cách WAT WATiSAX liệu Power 82/91 5.2.7 Thực nghiệm liệu nhiệt độ khí hậu BoulderDaily Hình 5.15 Thời gian thực thi WAT WATiSAX liệu BoulderDaily Hình 5.16 Số lần gọi hàm tính khoảng cách WAT WATiSAX liệu BoulderDaily 83/91 5.2.8 Thực nghiệm liệu chứng khoán Stock Hình 5.17 Thời gian thực thi WAT WATiSAX liệu Stock Hình 5.18 Số lần gọi hàm tính khoảng cách WAT WATiSAX liệu Stock 84/91 5.2.9 Nhận xét Qua thực nghiệm, nhìn chung, giải thuật WATiSAX hiệu giải thuật WAT mặt thời gian thực thi số lần gọi hàm tính khoảng cách Khi độ dài chuỗi thời gian tăng chênh lệch tăng Ở liệu AEM, ECG, ERP, Power, BoulderDaily giải thuật WATiSAX cải thiện đáng kể giải thuật WAT nguyên thủy Điều lý giải hàm MINDIST_Haar_iSAX cho chặn dƣới chặt so với hàm tính khoảng cách Euclid khơng gian nguyên thủy cấu trúc mục Haar_iSAX phát huy hiệu trình tìm kiếm lân cận không tầm thƣờng gần với chuỗi xét vịng lặp ngồi Riêng liệu EEG Stock giải thuật WATiSAX hiệu giải thuật WAT nguyên thủy lƣợng tƣơng đối Điều lý giải dựa vào hàm MINDIST_Haar_iSAX cho chặn dƣới không chặt liệu Kết cấu trúc mục Haar_iSAX không phát huy tác dụng 85/91 CHƯƠNG TỔNG KẾT Trong chƣơng tổng kết việc làm đƣợc, đóng góp luận văn nhƣ trình bày hƣớng mở rộng cho nghiên cứu sau 6.1 Tổng kết Luận văn trình bày nhu cầu dẫn đến việc tìm kiếm chuỗi bất thƣờng liệu chuỗi thời gian Vấn đề ngày đƣợc nhà khoa học giới quan tâm Họ đƣa định nghĩa hình thức rõ ràng cho tốn tìm kiếm chuỗi bất thƣờng Luận văn giới thiệu giải thuật tìm kiếm bất thƣờng có Trong giải thuật này, giải thuật WAT (Wavelet and Augmented Trie) chứng tỏ hiệu so với giải thuật trƣớc Bên cạnh đó, luận văn tóm lƣợc phƣơng pháp biểu diễu liệu chuỗi thời gian Trong đó, luận văn tập trung trình bày phƣơng pháp rời rạc hóa iSAX (indexable Symbolic Aggregate approXimation) Đây phƣơng pháp rời rạc mới, cải tiến từ phƣơng pháp SAX Đặc điểm quan trọng phƣơng pháp hỗ trợ đa mức phân giải có cấu trúc mục hiệu Ngồi để hiểu rõ giải thuật WAT, luận văn trình bày phƣơng pháp thu giảm số chiều phép biến đổi wavelet dạng Haar Luận văn chọn phƣơng pháp rời rạc hóa iSAX để kết hợp với giải thuật WAT nhằm cải thiện giải thuật WAT ngun thủy Thơng qua đó, luận văn đề xuất cấu trúc mục Haar_iSAX áp dụng cho phép biến đổi wavelet dạng Haar công thức MINDIST_Haar_iSAX hỗ trợ cho việc tìm kiếm cấu trúc mục Haar_iSAX so sánh khoảng cách chuỗi biến đổi wavelet dạng Haar chuỗi đƣợc rời rạc phƣơng pháp iSAX Các kết thực nghiệm cho thấy tính hiệu giải thuật WAT sử dụng phƣơng pháp rời rạc hoá iSAX (WATiSAX) Đồng thời, luận văn đồng ý 86/91 framework mà tác giả Bửu, H T Q [4] (2010) đề cập framework chung cho tốn tìm chuỗi bất thƣờng Và nhƣ vậy, tốn tìm chuỗi tƣơng đồng có vai trị quan trọng tốn tìm kiếm chuỗi bất thƣờng 6.2 Những đóng góp đề tài Đề tài có đóng góp sau: - Đề tài đề xuất cấu trúc mục iSAX áp dụng cho chuỗi đƣợc biến đổi phép biến đổi wavelet Haar - Đề tài đề xuất hàm tính khoảng cách MINDIST_Haar_iSAX chuỗi đƣợc biến đổi phép biến đổi wavelet Haar với chuỗi đƣợc rời rạc hóa phƣơng pháp iSAX Qua hàm đƣợc dùng để hỗ trợ cho việc tìm kiếm xác lân cận gần cấu trúc mục Haar_iSAX - Đề tài kết hợp hiệu giải thuật WAT với phƣơng pháp rời rạc hóa iSAX Qua đó, giải thuật WATiSAX đề nghị có hiệu giải thuật WAT nguyên thủy - Đề tài góp phần khẳng định framework mà tác giả Bửu, H T Q [4] (2010) đề cập framework chung cho tốn tìm chuỗi bất thƣờng - Đề tài nhận xét tốn tìm chuỗi tƣơng đồng có vai trị quan trọng tốn tìm kiếm chuỗi bất thƣờng 6.3 Hƣớng phát triển Đề tài nêu lên vấn đề số cách giải vấn đề tốn tìm kiếm chuỗi bất thƣờng liệu chuỗi thời gian Tuy nhiên nhiều điểm khác cần phải nghiên cứu thêm để đề tài hoàn thiện 87/91 Đề tài thực nghiệm liệu mẫu là: AEM, BoulderDaily, ECG, EEG, ERP, Koski, Power, Stock Do cần phải thực nghiệm nhiều liệu khác để có kết luận xác Đề tài dừng mức tìm kiếm chuỗi bất thƣờng đơn biến Do cần mở rộng cho liệu chuỗi thời gian đa biến Ngoài ra, cần mở rộng liệu luồng (data stream) việc phát bất thƣờng thời gian thực 88/91 Danh mục tài liệu tham khảo [1] Anh, Duong Tuan (2009) An Overview of Similarity Search in Time Series Data Proceedings of the 11th Conference on Science and Technology - Section of Computer Science and Engineering, Ho Chi Minh City University of Technology, pp 86-95 [2] Berndt, D and Clifford J (1994) Using dynamic time warping to find patterns in time series Proceedings of AAAI Workshop on Knowledge Discovery in Databases, KDD-94, Seattle, Washington, USA, pp 359-370 [3] Bu, Y., Leung, T-W., Fu, A., Keogh, E., Pei, J & Meshkin, S (2007) WAT: Finding Top-K Discords in Time Series Database Proceeding of the 2007 SIAM International Conference on Data Mining (SDM'07), Minneapolis, MN, USA [4] Bửu, Huỳnh Trần Quốc (2010) Nghiên cứu phƣơng pháp biểu diễn chuỗi thời gian iSAX ứng dụng phƣơng pháp vào toán nhận dạng chuỗi bất thƣờng liệu chuỗi thời gian Luận văn thạc sĩ, khoa Khoa Học Máy Tính, trường Đại học Bách Khoa Tp.Hồ Chí Minh [5] Chan, K & Fu, A W (1999) Efficient time series matching by wavelets Proceedings of the 15th IEEE Int'l Conference on Data Engineering, Sydney, Australia, Mar 23-26 pp 126-133 [6] Chan, K., Fu, A W & Yu, C (2003) Haar wavelets for efficient similarity search of time-series: with and without time warping IEEE Transactions on Knowledge and Data Engineering, May–June, pp 686–705 [7] Chandola, V., Banerjee, A., & Kumar, V (2009) Anomaly detection: A survey ACM Computing Surveys 89/91 [8] Dasgupta, D & Forrest, S (1999) Novelty detection in time series data using ideas from immunology Proceeding of the 4th International Conference on Intelligent Systems [9] Fu, A., Leung, O., Keogh, E & Lin, J (2006) Finding Time Series Discords Based on Haar Transform Lecture Notes in Computer Science, Advanced Data Mining and Applications, Springer Berlin / Heidelberg, pp 31-41 [10] Gunopulos D., et al (1997) Finding similar time series Proceedings of the 1st European Symposium on Principles of Data Mining and Knowledge Discovery, PKDD97, Trondheim, Norway, pp 88-1001 [11] Keogh, E., (2006), A tutorial on Indexing and Mining Time Series Data Proceedings of the 32th International Conference on Very Large Databases, VLDB2006, Seoul, Korea [12] Keogh, E., Chakrabarti, K., Pazzani, M & Mehrotra, S (2000) Dimensionality reduction for fast similarity search in large time series databases Journal of Knowledge and Information Systems, pp 263-286 [13] Keogh, E., Lin, J & Fu, A (2005) HOT SAX: Efficiently Finding the Most Unusual Time Series Subsequence Proceedings of the 5th IEEE International Conference on Data Mining (ICDM 2005), pp 226-233 [14] Keogh, E., Lonardi, S & Chiu, W (2002) Finding Surprising Patterns in a Time Series Database in Linear Time and Space In the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Edmonton, Alberta, Canada pp 550-556 [15] Keogh E and Pazzani M (1998) An enhanced representation of time series which allows fast and accurate classification, clustering and relevance feedback Proceedings of the 4th International Conference on 90/91 Knowledge Discovery and Data Mining, New York, NY, Aug 27-31 pp 23924 [16] Keogh, E., Wei, L., Xi, X., Lee, S., & Vlachos, M (2006) LB Keogh supports exact indexing of shapes under rotation invariance with arbitrary representations and distance measures International Conference on Very Large Data Bases (VLDB) [17] Kotsakis, E & Wolski, A (2001) MAPS: A method for identifying and predicting aberrant behaviour in time series Proceeding 14th International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems, pp 314-325 [18] Larsen, R J & Marx, M L (1986) An introduction to Mathematical Statistics and its applications Prentice Hall, Englewood, Cliffs, N.J 2nd Edition [19] Lin, J., Keogh, E., Lonardi, S & Chiu, B (2003) A symbolic representation of time series, with implications for streaming algorithms Proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, San Diego, CA June 13 [20] Popivanov, I and Miller, R (2002) Similarity search over time series data using wavelets Proceedings of the 18th International Conference on Data Engineering (ICDE 2002), 26 February - March, pp 212-221 [21] Shahabi, C., Tian, X & Zhao, W (2000) TSA-tree: A Wavelet-Based Approach to Improve the Efficiency of Multi-Level Surprise and Trend Queries Proceedings of the 12th Int’l Conference on Scientific and Statistical Database Management, pp 55-68 [22] Shieh, J & Keogh, E (2008) iSAX: Indexing and mining terabyte sized time series In proceedings of SIGKDD 2008 91/91 [23] Rafiei, D & Mendelzon, A (1997) Similarity-based queries for time series data Proceeding of the ACM SIGMOD Conference, Tucson, AZ, May 1997 [24] Rombo, S & Terracina, G (2004) Discovering Representative Models in Large Time Series Databases Proceedings of the 6th International Conference On Flexible Query Answering Systems, pp 84-97 [25] Vlachos, M., Gunopulos, D., Das, G (2004) Indexing Time Series under Condition of Noise, in M Last, A Kandel & H Bunke (Eds.), Data Mining in Time Series Databases, World Scientific Publishing, 2004 [26] Yang, J., Wang, W., & Yu, P (2001) Info-miner: Mining surprising periodic patterns Proceeding of the 7th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp 395-400 [27] Web Page for Time Series Data Sources: “http://www.cs.ucr.edu/~eamonn/time_series_data” [28] Web Page for Time Series “http://www.esrl.noaa.gov/psd/boulder” for Weather Data: PHỤ LỤC A: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH – VIỆT Thuật ngữ tiếng Anh Thuật ngữ tiếng Việt Viết tắt Adaptive Piecewise Constant Approximation Phƣơng pháp xấp xỉ đoạn thích nghi Approximate search Tìm kiếm xấp xỉ Breakpoint Điểm ngắt Brute Force Discord Discovey Giải thuật tìm kiếm chuỗi bất thƣờng phƣơng pháp vét cạn Classification Phân lớp Clustering Gom cụm Data stream Dữ liệu luồng Discord Bất thƣờng Discrete Cosine Transform Phƣơng pháp biến đổi Cosine rời DCT rạc Discrete Fourier Transform Phƣơng pháp biến đổi Fourier rời rạc Discretizeation Rời rạc hóa Dynamic Time Warping Độ đo xoắn thời gian động Exact search Tìm kiếm xác Heuristic Discord Discovery Giải thuật tìm kiếm chuỗi bất thƣờng dựa vào Heuristic Hidden Markov model Mô hình Markov ẩn indexable Symbolic Aggregate approXimation Phƣơng pháp xấp xỉ gộp ký hiệu hóa khả mục BFDD DFT DTW HDD iSAX A Indexing Lập mục Inner loop Vòng lặp Internal node Nút trung gian Lower bound Cận dƣới Multi-level trend and surprise query Truy vấn đa mức xu hƣớng bất thƣờng Multiresolution Đa mức phân giải Negative Selection Phƣơng pháp lựa chọn âm tính Non-seft match So trùng khơng tầm thƣờng Outer loop Vịng lặp ngồi Overlap Phủ lấp Piecewise Aggregate Approximation Phƣơng pháp xấp xỉ gộp đoạn Scaling Co giãn biên độ Self-nonself discrimination Cơ chế phân biệt tế bào lạ với tế bào thể Shifting Biến đổi tịnh tiến Similarity search Tìm kiếm tƣơng đồng Singular Value Decomposition Phƣơng pháp phân rã giá trị riêng Suffix tree Cây hậu tố Symbolic Aggregate approXimation Phƣơng pháp rời rạc xấp xỉ gộp ký hiệu hóa Summarization Tóm lƣợc Terminal node Nút PAA SVD SAX B Threshold Ngƣỡng giới hạn Time Series Chuỗi thời gian Wavelet and Augmented Trie Giải thuật dùng wavelet cấu trúc trie WAT C PHỤ LỤC B: LÝ LỊCH TRÍCH NGANG Họ tên: Nguyễn Đặng Kim Khánh Ngày, tháng, năm sinh: 02/08/1987 Nơi sinh: Tp Hồ Chí Minh Địa liên lạc: 23/100A đƣờng Nơ Trang Long, phƣờng 7, quận Bình Thạnh Tp.Hồ Chí Minh QUÁ TRÌNH ĐÀO TẠO Năm 2005 – 2009: sinh viên đại học trƣờng Đại học Sƣ Phạm Tp Hồ Chí Minh ngành Sƣ Phạm Tin Học Năm 2009 – nay: học viên cao học trƣờng Đại học Bách Khoa Tp Hồ Chí Minh ngành Khoa Học Máy Tính QUÁ TRÌNH CƠNG TÁC Năm 2009 – nay: giảng viên trƣờng Đại học Sƣ Phạm Tp Hồ Chí Minh, khoa Cơng Nghệ Thông Tin D ... PHÁT HIỆN CHUỖI CON BẤT THƢỜNG TRONG DỮ LIỆU CHUỖI THỜI GIAN DÙNG GIẢI THUẬT WAT VÀ PHƢƠNG PHÁP RỜI RẠC HÓA iSAX II NHIỆM VỤ VÀ NỘI DUNG: Nghiên cứu giải thuật WAT áp dụng... giải thuật WAT với phƣơng pháp rời rạc hóa iSAX giúp mang lại hiệu cho thuật toán WAT nguyên thủy Luận văn đề nghị giải thuật WATiSAX (một cách áp dụng phƣơng pháp rời rạc hóa iSAX vào giải thuật. .. xác chuỗi thời gian tƣơng tự WAT sử dụng ý tƣởng đa mức phân giải để giải tốn tìm chuỗi bất thƣờng Phƣơng pháp iSAX hỗ trợ đa mức phân giải Việc kết hợp giải thuật WAT với phƣơng pháp rời rạc hóa

Ngày đăng: 03/02/2021, 22:57

Tài liệu cùng người dùng

Tài liệu liên quan