Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 95 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
95
Dung lượng
2,96 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - NGUYỄN BÁ THU KHẢO SÁT VÀ ĐÁNH GIÁ HIỆU QUẢ CỦA PHƯƠNG PHÁP PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO MÁY VECTOR HỖ TRỢ Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số : 604801 LUẬN VĂN THẠC SĨ THÀNH PHỐ HỒ CHÍ MINH, tháng năm 2014 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - NGUYỄN BÁ THU KHẢO SÁT VÀ ĐÁNH GIÁ HIỆU QUẢ CỦA PHƯƠNG PHÁP PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO MÁY VECTOR HỖ TRỢ Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số : 604801 LUẬN VĂN THẠC SĨ THÀNH PHỐ HỒ CHÍ MINH, tháng năm 2014 Trang i ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Nguyễn Bá Thu MSHV:12070548 Ngày, tháng, năm sinh:26-1-1985 Nơi sinh: Hà Bắc Chuyên ngành: Khoa Học Máy Tính Mã số : 604801 I TÊN ĐỀ TÀI: KHẢO SÁT VÀ ĐÁNH GIÁ HIỆU QUẢ CỦA PHƯƠNG PHÁP PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO MÁY VECTOR HỖ TRỢ II NHIỆM VỤ VÀ NỘI DUNG: Đề xuất phương pháp bất thường liệu chuỗi thời gian dựa vào máy vector hỗ trợ Hiện thực, thử nghiệm phương pháp đề xuất để đánh giá hiệu phương pháp III NGÀY GIAO NHIỆM VỤ : 20-01-2014 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 14-7-2014 V CÁN BỘ HƯỚNG DẪN: PGS.TS Dương Tuấn Anh Tp HCM, ngày tháng năm 20 CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) TRƯỞNG KHOA….……… (Họ tên chữ ký) PGS.TS Dương Tuấn Anh ……………………………….… Trang ii CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hướng dẫn khoa học : PGS.TS Dương Tuấn Anh Cán chấm nhận xét : TS Võ Thị Ngọc Châu Cán chấm nhận xét : TS Võ Đình Bảy Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 14 tháng năm 2014 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: TS Nguyễn Văn Minh Mẫn TS Lê Thanh Vân PGS.TS Dương Tuấn Anh TS Võ Đình Bảy TS Võ Thị Ngọc Châu Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TS Nguyễn Văn Minh Mẫn TRƯỞNG KHOA………… ……………………………….… Trang iii LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày …20/6/2014… Nguyễn Bá Thu Trang iv LỜI CẢM ƠN Để hồn thành tốt luận văn này, trước tiên xin chân thành gửi lời cảm ơn đến PGS.TS.Dương Tuấn Anh, người Thầy tận tâm bảo hướng dẫn suốt thời gian thực luận văn Tôi xin cảm ơn quý thầy cô, người trực tiếp gián tiếp bảo giảng dạy giúp tơi có kiến thức cần thiết để thực luận văn Tơi xin cảm ơn gia đình bạn bè quan tâm giúp đỡ tạo điều kiện để tơi hồn thành tốt luận văn Tơi xin gửi lời cám ơn chân thành đến tất người Trang v ABSTRACT Novelty subsequence is the subsequence that is most different with the rest of the time series It is the forecast of failures in the system and the sign of human disease or the economic downturn There have been many novelty detection methods are proposed Two most famous methods are Brute-Force algorithm and HOTSAX algorithm Our proposed method uses two-classes support vector machine to detect the novelty in time series In this method, the time series is unfolded into phase space by a time-delay embedding process The result of this step is a set of feature vectors for time series Two-classes support vector machine method requires the training set consist of normal and abnormal vectors Howerver the actual training set has only normal vectors We apply the envelope method to solve this problem This method randomly creates the artificial normal and abnormal vectors from normal vectors in the initial training set These artificial vectors and the initial vectors form the new training set for two-classes support vector machine classifier Experiments on synthetic dataset (Sinusoid) and the standard dataset (Koski, Memory, ERP, Temperatures) demontrated the advantage and the promissing performance of the proposed method In addition, comparison of new method with HOTSAX also demontrated the effectiveness of two-classes support vector machine method Trang vi TÓM TẮT LUẬN VĂN “Bất thường” (novelty) chuỗi mà khác biệt với chuỗi lại “chuỗi thời gian” (time series) Nó dự báo hỏng hóc hệ thống, dấu hiệu bệnh tật người dấu hiệu suy thoái kinh tế Đã có nhiều phương pháp phát bất thường đề xuất Tiêu biểu Brute-Force HOTSAX Phương pháp dùng “máy vector hỗ trợ hai lớp” (two class support vector machine) phương pháp dùng phát bất thường chuỗi thời gian Theo phương pháp liệu chuỗi thời gian “khai triển”(unfold) vào “không gian pha”(phase space) sử dụng “quá trình nhúng thời gian trễ” (time-delay embedding process) để tạo thành tập vector đặc trưng cho chuỗi thời gian Phương pháp máy vector hỗ trợ hai lớp yêu cầu tập huấn luyện gồm vector bình thường vector bất thường Tuy nhiên tập huấn luyện thực tế thường khơng có bất thường Để khắc phục vấn đề phương pháp “vùng bao” (envelope) giới thiệu Phương pháp tạo vector bình thường nhân tạo ngẫu nhiên vector bất thường nhân tạo ngẫu nhiên từ vector bình thường Các vector nhân tạo với vector huấn luyện ban đầu tạo thành tập vector huấn luyện cho máy vector hỗ trợ hai lớp Dữ liệu dùng trình thực nghiệm gồm liệu mơ (dữ liệu hình Sin với bất thường thêm vào) liệu chuẩn (Koski, Memory, ERP, Temperature) thường dùng để kiểm tra phương pháp phát bất thường khác Ngoài để đánh giá hiệu quả, phương pháp máy vector hỗ trợ hai lớp so sánh với phương pháp HOTSAX Phương pháp phát bất thường dùng máy vector hỗ trợ phát bất thường liệu chuỗi thời gian giống phương pháp tham chiếu HOTSAX Ngoài cịn phát tất chuỗi bất thường với chiều dài phương pháp HOTSAX phát chuỗi bất thường có chiều dài kích thước cửa sổ trượt Tuy nhiên phương pháp lại có nhược điểm thời gian tìm thấy bất thường chậm so sánh với HOTSAX Nhưng điều chấp nhận đặc tính vốn có máy vector hỗ trợ Trang vii MỤC LỤC LỜI CAM ĐOAN iv LỜI CẢM ƠN v ABSTRACT vi TÓM TẮT LUẬN VĂN vii MỤC LỤC viii DANH MỤC CÁC CÔNG THỨC xi DANH MỤC CHỮ VIẾT TẮT xiii DANH MỤC HÌNH MINH HỌA xiv DANH MỤC CÁC BẢNG xvi Chương 1: MỞ ĐẦU Chương 2: TỔNG THUẬT VỀ CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Một số định nghĩa: 2.1.1 Dữ liệu chuỗi thời gian 2.1.2 Chuỗi 2.1.3 Cửa sổ trượt 2.1.4 Trùng khớp 2.1.5 Trùng khớp tầm thường 2.1.6 Bất thường 2.1.7 Phương pháp xấp xỉ gộp đoạn 2.1.8 Phương pháp xấp xỉ gộp ký hiệu hóa 2.2 Giải thuật Brute-Force phát chuỗi bất thường 10 2.3 Giải thuật HOTSAX phát chuỗi bất thường 11 2.4 Phương pháp dùng máy vector hỗ trợ lớp để phát bất thường 14 2.5 Phương pháp mạng nơron để phát bất thường 15 2.6 Kết luận 17 Chương : CƠ SỞ L THUYẾT VÀ HƯỚNG TIẾP CẬN 19 3.1 Khái quát máy vector hỗ trợ 19 3.2 Máy vector hỗ trợ hai lớp 20 3.3 Máy vector hỗ trợ với khoảng biên mềm 26 Trang viii Temperature Set 2: Model Creation Time 14000 12414 12000 Time (ms) 10000 7434 8000 6000 7396 4773 3095 4000 2000 0 500 1000 1500 2000 2500 3000 Time Series Length Hình 34 : Biểu đồ thời gian tìm mơ hình với liệu nhiệt độ vùng Vaernes Hình 4.34 thể mối quan hệ thời gian tạo mơ hình với chiều dài chuỗi liệu nhiệt độ đưa vào Temperature Set 2: Test Data Creation Time 600 Time (ms) 500 404 446 415 510 479 533 400 300 200 100 0 500 1000 1500 2000 2500 3000 3500 Time Series Length Hình 35 : Biểu đồ thời gian tạo liệu kiểm tra cho SVM với liệu nhiệt độ vùng Vaernes Trang 63 Temperature Set : Novelty Detection Time 2764 3000 Time (ms) 2500 2000 1690 1500 1198 974 1000 664 500 1009 781 1346 1264 989 HotSax SVM 197 0 500 1000 1500 2000 2500 3000 3500 Time Series Length Hình 36 : Biểu đồ thời gian phát bất thường giải thuật HOTSAX SVM với liệu nhiệt độ vùng Vaernes Trong hình 4.36 ta thấy chiều dài chuỗi liệu 3000, thời gian thực thi giải thuật HOTSAX Vì giải thuật đạt đến trạng thái kết thúc sớm Cũng giống với liệu nhiệt độ 1thời gian phát bất thường giải thuật máy vector hỗ trợ hai với thay đổi Và có lúc thời gian chạy giải thuật máy vector hỗ trợ hai lớp c n HOTSAX hình 4.36 Trang 64 Hình 37 : Kết kiểm tra liệu nhiệt độ vùng Vaernes giải thuật HOTSAX Hình 38 : Kết kiểm tra với liệu nhiệt độ vùng Trondheim/Vaernes với giải thuật SVM Trang 65 Giống liệu 1, hình 4.37 cho thấy đoạn bất thường tìm từ giải thuật HOTSAX đoạn khởi đầu toàn đoạn bất thường Trong giải thuật máy vector hỗ trợ hai lớp tìm thấy tồn đoạn bất thương hình 4.38 4.4.5 Dữ Liệu Hình Sin (Dữ liệu nhân tạo) Dữ liệu hình sin liệu mơ sinh từ hàm sin với hai điểm bất thường có chiều dài 16 thêm vào Do chuỗi liệu kiểm tra có 1200 điểm chuỗi liệu huấn luyện có 400 điểm, nên với loại liệu thực kiểm chứng kết phát bất thường giải thuật máy vector hỗ trợ Hình 4.39 cho thấy giải thuật máy vector hỗ trợ phát xác chuỗi bất thường có chuỗi liệu kiểm tra thể hình 4.40 Hình 39 : Kết kiểm tra với liệu hình sin với giải thuật SVM Trang 66 250 200 150 100 50 -50 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 Hình 40 : Chuỗi liệu hình sin kiểm tra Hình 41 : Kết kiểm tra với liệu hình sin với giải thuật OC SVM Hình 41 cho thấy kết phát bất thường sử dụng máy vector hỗ trợ lớp hoàn toàn phù hợp với kết phát phương pháp máy vector hỗ trợ lớp hình 39 Qua chứng minh phương pháp máy vector hỗ trợ hai lớp cho kết giống với phương pháp mà MA Perkin đưa Trang 67 4.5 Kết luận chương Quá trình thực nghiệm cho thấy khả phát xác đoạn bất thường giải thuật phát bất thường sử dụng máy vector hỗ trợ hai lớp so sánh với giải thuật HOTSAX Nó cho thấy tiềm sử dụng phương pháp máy vector hỗ trợ hai lớp ứng dụng cần phát tất bất thường chuỗi liệu Cũng ứng dụng cần phát toàn đoạn liệu thay đoạn bắt đầu giải thuật HOTSAX Tuy khơng hiệu với chuỗi liệu có chiều dài chuỗi lớn (w = 400 hay w = 320) thời gian thực thi tăng nhanh chiều dài liệu tăng, phương pháp lại hiệu kiểm tra với liệu nhiệt độ có chiều dài chuỗi nhỏ (w = 12) thể qua việc thời gian xử lý nhanh biến đổi chiều dài chuỗi liệu tăng Thư viện LIBSVM chứng minh hiệu việc sử dụng máy vector hỗ trợ để phát bất thường Nó cho thấy khả hỗ trợ người dùng việc sử dụng máy vector hỗ trợ để giải toán phân lớp Phần mềm thiết kế luận văn hỗ trợ tốt q trình kiểm tra tính đắn hiệu phương pháp phát chuỗi bất thường liệu chuỗi thời gian sử dụng máy vector hỗ trợ hai lớp Trang 68 Chương 5: TỔNG KẾT 5.1 Tổng kết Phát bất thường liệu chuỗi thời gian vấn đề quan tâm tính thiết thực kinh tế, sản xuất y tế Đã có nhiều giải thuật đưa để giải vấn đề Tiêu biểu HOTSAX Brute-Force Tuy nhiên phương pháp có tìm chuỗi bất thường có chiều dài kích thước cửa sổ trượt Nhưng chuỗi liệu thường có nhiều bất thường bất thường có chiều dài khác Nên việc tìm giải thuật phát đầy đủ toàn vẹn chuỗi bất thường quan trọng Giải thuật máy vector hỗ trợ đưa giải triệt để vấn đề Chính điều thúc đẩy chúng tơi thực luận văn Qua q trình thực nghiệm với loại liệu kiểm tra khác “giải thuật phát bất thường dòng liệu chuỗi thời gian sử dụng máy vector hỗ trợ” cho thấy hiệu phát xác phát toàn đầy đủ bất thường có chuỗi liệu Tuy thời gian thực thi q trình xử lý, tạo mơ hình phát bất thường lâu, đặc biệt liệu có kích thước lớn số lượng điểm chuỗi nhiều, đồng thời giải thuật bị giới hạn với loại liệu có motif bình thường biến đổi, điều chấp nhận so sánh với hiệu phương pháp mang lại Quá trình tìm tham số (C, ) cho LIBSVM thách thức lớn Dù LIBSVM hỗ trợ đoạn mã “kiểm tra chéo” để tìm tham số này, tham số tìm chưa tối ưu cần trình “thử kiểm tra” để tìm tham số thích hợp Q trình lại khó khăn thời gian thực thi giải thuật máy vector hỗ trợ thường chậm Ngoài việc tìm tham số (p1, p2, n) cho phương pháp “vùng bao” thử thách lớn Việc định hướng theo phương pháp máy vector hỗ trợ lớp giai đoạn đầu trình làm luận văn gây khó khăn q trình thực luân văn Vượt qua tất khó khăn trên, luận văn đạt mục tiêu chứng minh tính đắn giải thuật phát bất thường sử dụng máy vector hỗ trợ Dù tồn nhiều điểm yếu phương pháp máy vector hỗ trợ có điểm mạnh mà phương pháp phát bất thường khác khơng có Ưu điểm phương pháp máy vector hỗ trợ kể đến là: Trang 69 Phát tất bất thường có chuỗi liệu thời gian Phát tồn đoạn bất thường có chiều dài lớn kích thước cửa sổ trượt Hiệu với loại liệu có kích thước chuỗi nhỏ.Ví dụ liệu nhiệt độ Có thư viện LIBSVM mạnh hỗ trợ tốt Nhờ phương pháp vùng bao mà máy vector hỗ trợ hai lớp khơng đ i hỏi có bất thường tập liệu huấn luyên Nhược điểm phương pháp là: Do phương pháp phát bất thường có giám sát nên việc huấn luyện thường tốn nhiều thời gian phải thực lại nhiều lần để tìm mơ hình tối ưu Đặt biệt chậm với loại liệu có kích thước chuỗi lớn Việc chiếu liệu đầu vào lên không gian có số chiều cao làm cho q trình tính tốn trở nên phức tạp tốn thời gian Phương pháp thích hợp với liệu có hình dạng mẫu bình thường thay đổi, liệu có hình dạng mẫu bình thường hay thay đổi việc huấn luyện phân loại sử dụng máy vector hỗ trợ khó khăn 5.2 Những kết đạt Luận văn đáp ứng mục tiêu đặt chứng minh hiệu phương pháp phát chuỗi bất thường sử dụng máy vector hỗ trợ hai lớp với loại liệu thực tế Khắc phục nhược điểm “Phát bất thường liệu chuỗi thời gian sử dụng Máy vector hỗ trợ lớp” [11] mà J Ma and S Perkins đề xuất Khắc phục vấn đề thiếu mẫu bất thường tập liệu kiểm tra chuỗi liệu ban đầu gồm mẫu bình thường dựa phương pháp vùng bao Đề xuất phương pháp 3/4 để xác định chuỗi bất thường từ nhãn vector kiểm tra Phương pháp chứng minh tính hiệu q trình thực nghiệm với loại liệu khác Xây dựng phần mềm hỗ trợ người dùng việc phát bất thường sử dụng máy vector hỗ trợ Trang 70 5.3 Hướng phát triển Trong trình thực nghiệm phương pháp phát bất thường liệu chuỗi thời gian sử dụng máy vector hỗ trợ hai lớp cho thấy nhược điểm thời gian thực thi Do vector huấn luyện kiểm tra có số thuộc tính chiều dài chuỗi w nên giải thuật máy vector hỗ trợ thường chậm chiều dài chuỗi lớn (400 với liệu Koski 320 với liệu Memory , ERP) Nên việc áp dụng phương pháp tiền xử lý để giảm số thuộc tính vector giúp tăng tốc trình Phương pháp PAA, SAX ISAX giải pháp Thời gian thực thi giải thuật cao phần việc gửi liệu đầu vào lấy liệu đầu cho LIBSVM thơng qua file Khi kích thước file lớn trình xử lý file tốn thời gian đáng kể Ngoài việc gọi thư viện LIBSVM thơng qua file thực thi q trình huấn luyện trình kiểm tra làm tăng thời gian chạy toàn giải thuật Nên yêu cầu cải tiến phương pháp gọi LIBSVM đặt Vì thời gian hạn chế nên trình làm luận văn chưa áp dụng giải pháp Trang 71 DANH MỤC CÁC TÀI LIỆU THAM KHẢO [1] A.L.I., Oliveira, F.B.L., Neto and S.R.L Meira Novelty detection in time series by neural networks forecasting with robust confidence intervals Proc Of Brazilian Symposium on Neural Networks (SBRN’2004), São Luis, Maranhão, IEEE Computer Society Press, 2004 [2] A S Weigend and N A Gershenfeld, editors Time-series Prediction: Forecasting the Future and Understanding the Past Addison-Wesley, 1994 [3] B Sch o lkopf, R.C Williamson, A.J Smola, J Shawe-Taylor, J.Platt Support Vector Method for Novelty Dectection Neural Information Processing Systems, 2000 [4]C Bishop, Novelty detection and neural network validation IEE Proceedings on Vision, Image and Signal Processing, 141(4):217–222, 1994 [5] C Campbell, K P.Bennett, A Linear Programming Approach to Novelty Detection, Advances in Neural Information Processing Systems, vol 14, 2001 [6] C Campbell & Y Ying Learning with Support Vector Machines, Morgan & Claypool Publishers, 2011 [7] D.T.Anh Bài Giảng Support vector machine : Concepts and Applications, Khoa Khoa học kỹ thuật máy tính, Đại học Bách Khoa Thành Phố Hồ Chí Minh, 2013 [8] E Keogh, J Jin, and A Fu, HOT SAX: Finding the Most Unusual Time Series Subsequence: Algorithms and Applications, ICDM 2005 [9] E Keogh S Lonardi, and W Chiu Finding Surprising Patterns in a Time Series Database In Linear Time and Space, in Proceedings of the 8th ACM SIGKDD Intercational Conference on Knowledge Discovery and Data Mining, pp 550-556, Edmonton, Alberta, Canada, June 23-26, 2002 [10] I.B,Vapnyarskii “Lagrange multipliers” in Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4, 2001 Trang 72 [11] J Ma, S Perkins Time-series Novelty Detection Using One-Class Support Vector Machines Proceedings of the International Joint Conference on Neural Networks,Vol 3, pp 1741-1745, 2003 [12] J Han, M Kamber, J Pei, Data Mining Concepts and Techniques 3th, Elsevier Inc, 2012 [13] J Lin, E Keogh, S Lonardi, & B Chiu A Symbolic Representation of Time Series, with Implications for Streaming Algorithms In proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery San Diego, CA June 13, 2003 [14] M R Berthold and J Diamond Boosting the performance of RBF networks with dynamic decay adjustment In G Tesauro et al, editor, Advances in Neural Information Processing, volume 7, pages 521–528 MIT Press, 1995 [15] N H Packard, J P Crutchfield, J D Farmer, and R S Shaw Rule discovery from time series”, in Proceedings of the 4th International Conference on Very Large Data Base, pp.606-607, 1998 [16] R Isermann Process Fault Detection and Neural Network Validation, IEEE Proceedings – Vision, Image and Signal Processing, vol 20, pp.387 404, 1984 [17] R Kozma, M Kitamura, M Sakura, and Y Yokayama Anomaly Detection by Neural Network Models and Statistical Time Series Analysis, in Proceeding of IEEE International Conference on Neural Networks, Orlando Florida, June 27-29, 1994 [18] S Albrecht, J Busch, M Kloppenburg, F Metze, and P Tavan Generalised radial basis function networks for classification and novelty detection: Selforganisation of optimal bayesian decision Neural Networks, 13:1075–1093,2000 [19] S.Singh and M Markou An approach to novelty detection applied to the classification of image regions IEEE Transactions on Knowledge and Data Engineering, 16(4):396–406, April 2004 Trang 73 [20] Th Lindblad, G Sz´ekely, M L Padgett, A Eide, and C S Lindsey Implementing the dynamic decay adjustment algorithm in a cnaps parallel computer system Nucl Instr Meth., A381:502–507, 1996 [21] http://datamarket.com/ [22] http://www.csie.ntu.edu.tw/~cjlin/libsvm/ Trang 74 PHỤ LỤC : DANH MỤC CÁC THUẬT NGỮ STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Thuật Ngữ Novelty Time series Support vector machine Unfold Phase space Time-delay embedding process Envelope Data Outliers One class support vector machine Two class support vector machine Subsequence Slide window Match Non-Trivial Match Generics paradigm Piecewise Aggregate Approximation - PAA Symbolic Aggregate approXimation - SAX Vector approximation file Suffix tree Brute-Force Hyperplane Phase space Projected phase space Chaotic time series Multilayer perceptrons MPLs Radial basis function networks RBFNs Hidden layer Radial basis functions RBFs Sigmoidal Dynamic decay adjustment DDA Support vector SV Nghĩa Bất thường Chuỗi thời gian Máy vector hỗ trợ Khai triển Không gian pha Quá trình nhúng thời gian trễ Vùng bao Dữ liệu Đoạn ngoại biên Máy vector hỗ trợ lớp Máy vector hỗ trợ hai lớp Chuỗi Cửa sổ trượt Trùng khớp Trùng khớp tầm thường Mô thức chung Phương pháp xấp xỉ gộp đoạn Phương pháp xấp xỉ gộp ký hiệu hóa Tập tin xấp xỉ hóa vector Cây hậu tố Giải thuật chân phương Bề mặt phân chia Không gian pha Không gian pha chiếu Chuỗi thời gian hỗn loạn Mạng perception đa mức Mạng phân bố chuẩn Một lớp ẩn Hàm phân bố chuẩn Hàm sigmoid Điều chỉnh phân rã động Vector hỗ trợ Trang A1 33 34 35 36 Margin Non-linear decision boundary Feature space Offset 37 38 39 40 41 42 43 44 45 46 47 48 Quadratic program Local maxima and minima Hypothesis modelling the data Non-support vector Soft margin Penalized Embedding dimemsion Adaptively match Negative patterns Negative and positive patterns Learning tasks Cross validation Khoảng biên Biên định phi tuyến Không gian đặc trưng Độ dịch Bài toán quy hoạch tối ưu hóa bậc hai Cực đại hay cực tiểu cục Mơ hình giải thuyết liệu Vector khơng hỗ trợ Khoảng biên mềm Hệ số phạt Số chiều nhúng Trùng khớp thích nghi Mẫu âm Mẫu âm mẫu dương Tác vụ học Kiểm tra chéo Trang A2 PHẦN LÝ LỊCH TRÍCH NGANG Họ tên: Nguyễn Bá Thu Ngày, tháng, năm sinh: 26-01-1985 Nơi sinh: Hà Bắc Địa liên lạc: 137B, Tết Mậu Thân, Phường 4, Mỹ Tho, Tiền Giang Q Á TRÌNH ĐÀO TẠO 2000-2003 : Học sinh trường phổ thông chuyên Tiền Giang, Lớp Chuyên Tin 2003-2008 : Sinh viên trường đại học Bách Khoa Thành Phố Hồ Chí Minh, chuyên ngành Cơ điện tử 2012-2014 : Học viên cao học trường đại học Bách Khoa Thành Phố Hồ Chí Minh, chun ngành Khoa học máy tính Q TRÌNH CƠNG TÁC 2008-Nay : Làm việc công ty APM Việt Nam Trang A3 ... Máy Tính Mã số : 604801 I TÊN ĐỀ TÀI: KHẢO SÁT VÀ ĐÁNH GIÁ HIỆU QUẢ CỦA PHƯƠNG PHÁP PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO MÁY VECTOR HỖ TRỢ II NHIỆM VỤ VÀ... - NGUYỄN BÁ THU KHẢO SÁT VÀ ĐÁNH GIÁ HIỆU QUẢ CỦA PHƯƠNG PHÁP PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRÊN DỮ LIỆU CHUỖI THỜI GIAN DỰA VÀO MÁY VECTOR HỖ TRỢ Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số : 604801... HOTSAX Phương pháp phát bất thường dùng máy vector hỗ trợ phát bất thường liệu chuỗi thời gian giống phương pháp tham chiếu HOTSAX Ngồi cịn phát tất chuỗi bất thường với chiều dài phương pháp HOTSAX