Ứng dụng phát hiện chuỗi con bất thường trong dự báo dữ liệu chuỗi thời gian bằng phương pháp holt winters

85 39 0
Ứng dụng phát hiện chuỗi con bất thường trong dự báo dữ liệu chuỗi thời gian bằng phương pháp holt winters

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - TRẦN DUY LỘC ỨNG DỤNG PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRONG DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƯƠNG PHÁP HOLT-WINTERS CHUYÊN NGÀNH: Khoa học máy tính MÃ SỐ: 60.48.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 09 năm 2014 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - TRẦN DUY LỘC ỨNG DỤNG PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRONG DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƯƠNG PHÁP HOLT-WINTERS CHUYÊN NGÀNH: Khoa học máy tính MÃ SỐ: 60.48.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 09 năm 2014 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học: PGS.TS Dương Tuấn Anh Cán chấm nhận xét 1: TS Võ Thị Ngọc Châu Cán chấm nhận xét 2: TS Võ Đình Bảy Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG TP.HCM ngày 14 tháng 07 năm 2014 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Chủ tịch hội đồng: TS Nguyễn Văn Minh Mẫn Cán hướng dẫn: PGS TS Dương Tuấn Anh Cán chấm nhận xét 1: TS Võ Thị Ngọc Châu Cán chấm nhận xét 2: TS Võ Đình Bảy Thư ký: TS Lê Thanh Vân Xác nhận Chủ tịch Hội đồng đánh giá Luận văn Trưởng khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc Lập – Tự Do – Hạnh Phúc -oOo - NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Trần Duy Lộc MSHV: 12070518 Ngày, tháng, năm sinh: 24/05/1988 Nơi sinh: TP.HCM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 I TÊN ĐỀ TÀI: ỨNG DỤNG PHÁT HIỆN CHUỖI CON BẤT THƯỜNG TRONG DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƯƠNG PHÁP HOLT-WINTERS II NHIỆM VỤ VÀ NỘI DUNG: III NGÀY GIAO NHIỆM VỤ: 20/01/2014 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 20/06/2014 V CÁN BỘ HƯỚNG DẪN: PGS.TS Dương Tuấn Anh TP.HCM, ngày tháng năm 2014 CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) TRƯỞNG KHOA (Họ tên chữ ký) PGS.TS Dương Tuấn Anh LỜI CẢM ƠN Tôi xin gửi lời cảm ơn chân thành sâu sắc đến PGS.TS Dương Tuấn Anh, người thầy ln tận tình hướng dẫn tạo điều kiện để tơi hồn thành luận văn Tơi xin cảm ơn quý thầy cô, người bảo giảng dạy giúp tơi có kiến thức cần thiết để thực luận văn Tôi xin cảm ơn gia đình bạn bè quan tâm giúp đỡ động viên tơi để tơi tiếp tục theo đuổi việc học tập nghiên cứu Tôi xin gửi lời cảm ơn chân thành sâu sắc đến tất người i TÓM TẮT LUẬN VĂN Dữ liệu chuỗi thời gian ngày sử dụng rộng rãi nhiều lĩnh vực đóng vai trị quan trọng Vì dự báo liệu chuỗi thời gian ngày nhận nhiều quan tâm cộng đồng nghiên cứu Nhiều phương pháp mô hình dự báo đề xuất mang lại nhiều kết thiết thực Phương pháp dự báo liệu chuỗi thời gian dùng mơ hình Holt-Winters áp dụng liệu có tính xu hướng (Trend) tính mùa (Seasonal) phương pháp ưu chuộng tính đơn giản, dễ thực, cần liệu khứ để dự báo kết dự báo tốt Tuy nhiên, chuỗi liệu thời gian có chứa đựng yếu tố bất thường chất lượng dự báo mơ hình Holt-Winters bị suy giảm đáng kể Trong luận văn này, đề xuất xây dựng phương pháp cải tiến chất lượng dự báo liệu chuỗi thời gian mơ hình Holt-Winters Ý tưởng cần khắc phục khuyết điểm mơ hình Holt-Winters liệu có chứa đựng yếu tố bất thường Đầu tiên áp dụng giải thuật phát bất thường chân phương để phát bất thường liệu chuỗi thời gian Sau đó, tiến hành xử lý bất thường phát cách làm trơn bất thường phương pháp trung bình di động đơn giản để loại bỏ giảm thiểu yếu tố bất thường khỏi liệu chuỗi thời gian Sau đó, chúng tơi tiến hành dự báo liệu chuỗi thời gian xử lý bất thường mơ hình Holt-Winters Qua thực nghiệm dự báo liệu chuỗi thời gian có chứa đựng yếu tố bất thường, phương pháp đề xuất cho kết dự báo tốt nhiều so với mơ hình Holt-Winters truyền thống ii ABSTRACT Nowadays, time series forecasting is used in several important situations So time series forecasting is getting more attention from the community Numerous methods have been developed to forecast time series data and have been achieved many accomplishments The Holt-Winters method is popular because it is simple, has low data-storage requirements, easy to implement, and has good results It can adapt to changes in trends and seasonal patterns in data when they occur But Holt-Winters has an issue when forecast with time series that contains anomaly The forecast results are worse as a consequence In this thesis, we proposed a method to improve the Holt-Winters's prediction result when the time series contains anomaly First, we use the brute force algorithm to discover time series discords Then we use simple moving average to smooth anomaly The smoothed time series is forecasted using Holt-Winters method The experiments's results show that our method is much better than the classic HoltWinters method when time series has anomaly iii LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày 06 tháng 09 năm 2014 Trần Duy Lộc iv MỤC LỤC MỤC LỤC v DANH MỤC CÁC HÌNH MINH HỌA vii DANH MỤC CÁC BẢNG xi I MỞ ĐẦU II NỘI DUNG Chương 1: Phát biểu vấn đề 1.1 Dữ liệu chuỗi thời gian 1.2 Phát bất thường liệu chuỗi thời gian 1.3 Dự báo liệu chuỗi thời gian 1.4 Mục tiêu giới hạn đề tài 1.5 Cấu trúc luận văn Chương 2: Cơ sở lý thuyết 2.1 Một số khái niệm 2.2 Hệ số tự tương quan, hàm tự tương quan, hàm tự tương quan riêng phần 2.3 Các thành phần chuỗi thời gian 2.4 [5] Dự báo liệu chuỗi thời gian phương pháp làm trơn hàm mũ Holt Winters 11 2.5 Các phương pháp đánh giá sai số dự báo chuỗi thời gian 15 2.6 Kết luận 17 Chương 3: Tổng thuật cơng trình liên quan 18 3.1 Các phương pháp tính độ đo tương tự 18 3.2 Các phương pháp biểu diễn liệu chuỗi thời gian 21 3.3 Các giải thuật phát bất thường 24 3.4 Các mơ hình dự báo chuỗi thời gian khác 27 3.5 Kết luận 31 Chương 4: Hiện thực thực nghiệm 32 4.1 Mô hình thực 32 v 4.2 Thực nghiệm 35 4.3 So sánh đánh giá kết thực nghiệm 62 Chương 5: Kết luận 63 5.1 Tổng kết 63 5.2 Kết đạt 63 5.3 Hướng phát triển 64 III DANH MỤC CÁC TÀI LIỆU THAM KHẢO 65 PHỤ LỤC A: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH-VIỆT A1 PHỤ LỤC B: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH B1 PHỤ LỤC C: LÝ LỊCH TRÍCH NGANG C1 vi Hình 4.33: Kết dự báo xử lý không xử lý bất thường cho liệu Expenditure (có bất thường) - Dữ liệu có hai bất thường (phát xử lý hai bất thường) Thời gian phát bất thường: w = 17 (58ms), w = 12 (58ms) Kết thực nghiệm, kết phát xử lý bất thường kết dự báo thể Bảng 4.17, Hình 4.34 Hình 4.35 Mơ hình Holt-Winters Phát xử w = 17 lý bất thường w = 12 Không phát xử lý bất thường Tham số α 𝛽 𝛾 0.1 0.2 0.1 0.1 0.8 0.1 Sai số dự báo MSE MAE 18443167.96 1829.356 35874344.205 2575.424 MAPE 4.988 7.44 0.1 171779546.471 9.509 1.0 0.1 4748.185 Bảng 4.17: Kết thực nghiệm cho liệu Expenditure (có hai bất thường) Hình 4.34: Kết phát xử lý bất thường cho liệu Expenditure (có hai bất thường) 56 Hình 4.35: Kết dự báo xử lý không xử lý bất thường cho liệu Expenditure (có hai bất thường) Nhận xét: liệu kết dự báo phát xử lý bất thường hai bất thường cho kết dự báo tốt không phát xử lý bất thường Bộ liệu sản lượng bia hàng quý Úc từ năm 1956 đến năm 1994 (BeerProduction) 4.2.11 Đây liệu lấy thư viện liệu chuỗi thời gian giáo sư Rob Hyndman đại học Monash, Úc [13] Bộ liệu chuỗi thời gian có chiều dài 154 điểm vừa có tính xu hướng vừa có tính mùa với chiều dài thành phần mùa Mơ hình Holt-Winters sử dụng mơ hình có tính nhân Phát bất thường với hai kích thước cửa sổ trượt (w) khác - Dữ liệu có bất thường (phát xử lý bất thường) Thời gian phát bất thường: w = 17 (38ms), w = 12 (34ms) Kết thực nghiệm, kết phát xử lý bất thường kết dự báo thể Bảng 4.18, Hình 4.36 Hình 4.37 Mơ hình Holt-Winters Phát xử w = 17 lý bất thường w = 12 Không phát xử lý bất thường Tham số α 𝛽 𝛾 0.4 0.5 0.1 0.5 0.1 0.1 Sai số dự báo MSE MAE 386.621 14.06 428.535 15.01 MAPE 3.28 3.504 0.1 2763.888 5.504 1.0 0.1 26.22 Bảng 4.18: Kết thực nghiệm cho liệu BeerProduction (có bất thường) 57 Hình 4.36: Kết phát xử lý bất thường cho liệu BeerProduction (có bất thường) Hình 4.37: Kết dự báo xử lý không xử lý bất thường cho liệu BeerProduction (có bất thường) - Dữ liệu có hai bất thường (phát xử lý hai bất thường) Thời gian phát bất thường: w = 17 (66ms), w = 12 (64ms) Kết thực nghiệm, kết phát xử lý bất thường kết dự báo thể Bảng 4.19, Hình 4.38 Hình 4.39 Mơ hình Holt-Winters Phát xử w = 17 lý bất thường w = 12 Không phát xử lý bất thường Tham số α 𝛽 𝛾 0.2 0.2 0.1 0.4 0.2 0.1 Sai số dự báo MSE MAE 1278.001 21.404 527.903 15.92 MAPE 4.716 3.687 0.1 8814.117 8.477 1.0 0.1 44.254 Bảng 4.19: Kết thực nghiệm cho liệu BeerProduction (có hai bất thường) 58 Hình 4.38: Kết phát xử lý bất thường cho liệu BeerProduction (có hai bất thường) Hình 4.39: Kết dự báo xử lý không xử lý bất thường cho liệu BeerProduction (có hai bất thường) Nhận xét: liệu kết dự báo phát xử lý bất thường hai bất thường cho kết dự báo tốt không phát xử lý bất thường 4.2.12 Bộ liệu kế hoạch tiêu dùng hàng quý Mỹ từ năm 1964 đếm năm 1976 (Plan) Đây liệu lấy thư viện liệu chuỗi thời gian giáo sư Rob Hyndman đại học Monash, Úc [13] Bộ liệu chuỗi thời gian có chiều dài 52 điểm vừa có tính xu hướng vừa có tính mùa với chiều dài thành phần mùa Mơ hình Holt-Winters sử dụng mơ hình có tính nhân Phát bất thường với hai kích thước cửa sổ trượt (w) khác 59 - Dữ liệu có bất thường (phát xử lý bất thường) Thời gian phát bất thường: w = (2ms), w = (2ms) Kết thực nghiệm, kết phát xử lý bất thường kết dự báo thể Bảng 4.20, Hình 4.40 Hình 4.41 Mơ hình Holt-Winters Phát xử w=9 lý bất thường w=8 Không phát xử lý bất thường Tham số α 𝛽 𝛾 0.1 0.6 0.1 0.1 0.7 0.1 Sai số dự báo MSE MAE 49.769 4.668 51.47 4.643 MAPE 18.948 18.751 0.1 88.808 22.965 0.8 0.1 5.102 Bảng 4.20: Kết thực nghiệm cho liệu Plan (có bất thường) Hình 4.40: Kết phát xử lý bất thường cho liệu Plan (có bất thường) Hình 4.41: Kết dự báo xử lý không xử lý bất thường cho liệu Plan (có bất thường) 60 - Dữ liệu có hai bất thường (phát xử lý hai bất thường) Thời gian phát bất thường: w = (4ms), w = (4ms) Kết thực nghiệm, kết phát xử lý bất thường kết dự báo thể Bảng 4.21, Hình 4.42 Hình 4.43 Mơ hình Holt-Winters Phát xử w=9 lý bất thường w=8 Không phát xử lý bất thường Tham số α 𝛽 𝛾 0.1 0.6 0.1 0.1 0.7 0.1 Sai số dự báo MSE MAE 51.531 5.002 53.736 4.954 MAPE 20.516 20.483 0.1 214.736 46.747 0.1 0.1 12.223 Bảng 4.21: Kết thực nghiệm cho liệu Plan (có hai bất thường) Hình 4.42: Kết phát xử lý bất thường cho liệu Plan (có hai bất thường) Hình 4.43: Kết dự báo xử lý không xử lý bất thường cho liệu Plan (có hai bất thường) 61 Nhận xét: liệu kết dự báo phát xử lý bất thường hai bất thường cho kết dự báo tốt không phát xử lý bất thường 4.3 So sánh đánh giá kết thực nghiệm Qua kết thực nghiệm mười liệu ta thấy kết dự báo có áp dụng phát làm trơn bất thường xác kết dự báo khơng làm trơn bất thường Chúng tơi nhận thấy độ xác dự báo liệu chuỗi thời gian có chứa đựng bất thường bị ảnh hưởng phụ thuộc vào bất thường liệu, yếu tố bất thường lớn mức độ sai số lớn hay nói cách khác kết dự báo tị lệ nghịch với yếu tố bất thường Đối với liệu có chứa bất thường thành phần bất thường khơng rõ rệt mà sai khác không đáng kể so với phần cịn lại độ xác dự báo phát làm trơn bất thường không cải thiện nhiều Ngược lại, với liệu có chứa bất thường bật so với phần cịn lại sau phát làm trơn bất thường độ xác dự báo tăng nhiều Do đó, để tăng tính xác dự báo phương pháp Holt-Winters liệu chuỗi thời gian có chứa đựng bất thường yếu tố quan trọng phải phát xác thành phần bất thường liệu Điều phụ thuộc vào việc chọn kích thước cửa sổ trượt cho giải thuật phát bất thường Chúng nhận thấy chọn kích thước cửa sổ trượt khoảng gấp đơi kích thước đoạn bất thường cho kết phát bất thường tương đối tốt Một yếu tố quan trọng khác ảnh hưởng đế kết dự báo vị trí bất thường nằm xa điểm cần dự báo đoạn bất thường khơng ảnh hưởng nhiều đến kết dự báo mà có tác động làm giảm sai số tổng trình dự báo Nguyên nhân việc mơ hình Holt-Winters mơ hình dự báo ngắn hạn mức độ ảnh hưởng giá trị gần điểm dự báo cao điểm liệu xa điểm dự báo ảnh hưởng đến điểm dự báo Thời gian thực phương pháp đề xuất tốn thời gian dự báo bình thường thời gian cần để phát làm trơn bất thường Đối với dự báo ngắn hạn liệu chuỗi thời gian không lớn (các liệu thực nghiệm 1000 điểm) thời gian phát làm trơn bất thường giây 62 Chương 5: Kết luận 5.1 Tổng kết Dự báo nhu cầu cần thiết nhiều lĩnh vực Do đó, có nhiều phương pháp dự báo khác phù hợp cho lĩnh vực khác Một phương pháp dự báo phổ biến dự báo phương pháp làm trơn hàm mũ theo mơ hình Holt-Winters Phương pháp phổ biến tính đơn giản, dễ thực, cần liệu khứ mà kết dự báo lại tốt Tuy nhiên phương pháp có khuyết điểm định, khuyết điểm kết dự báo bị ảnh hưởng xấu yếu tố bất thường liệu Xuất phát từ khuyết điểm luận văn đề xuất hướng giải để cải thiện kết dự báo phương pháp làm trơn hàm mũ theo mơ hình Holt-Winters dự báo liệu có chứa đựng yếu tố bất thường Để áp dụng giải thuật phát bất thường liệu chuỗi thời gian chuẩn hóa liệu chuỗi thời gian việc quan trọng thiếu Một kinh nghiệm rút từ việc phát bất thường liệu dự báo ngắn hạn liệu thường nhỏ khơng nên áp dụng giải thuật phát bất thường HOTSAX giải thuật cần phải thu giảm rời rạc hóa liệu, điều làm độ chi tiết liệu, kết khơng phát xác phần bất thường (bất thường phát thường lớn nhỏ so với bất thường thực sự) Do đó, kết dự báo khơng cải thiện nhiều Vì vậy, chúng tơi lựa chọn giải thuật phát bất thường chân phương (Brute Force) không yêu cầu phải rời rạc hóa liệu giữ độ chi tiết liệu thời gian thực thi nhanh cần làm việc liệu nhỏ 5.2 Kết đạt Luận văn đề xuất phương pháp hiệu để cải thiện kết dự báo phương pháp làm trơn hàm mũ theo mơ hình Holt-Winters dự báo liệu có chứa đựng yếu tố bất thường  Luận văn lựa chọn giải thuật phát bất thường liệu chuỗi thời gian phù hợp cho phương pháp làm trơn hàm mũ theo mơ hình Holt-Winters giải thuật phát bất thường chân phương (Brute Force)  Luận văn kết hợp thành công giải thuật phát bất thường lĩnh vực khai phá liệu chuỗi thời gian vào phương pháp dự báo lĩnh vực dự báo mơ hình thống kê  63  Kết thực nghiệm mười liệu mẫu cho thấy phương pháp đề xuất cho kết dự báo mơ hình Holt-Winters tốt nhiều so với không xử lý bất thường Hướng phát triển 5.3 Bên cạnh kết đạt luận văn số hạn chế cần xem xét khắc phục như: - Chiều dài bất thường cần phát phải người dùng tự chọn phương pháp thử sửa sai Hướng phát triển cần khắc phục điểm hạn chế so sánh thêm kết đạt với cơng trình tương tự tác giả Sarah Gelper [15] 64 III DANH MỤC CÁC TÀI LIỆU THAM KHẢO [1] J Lin, E Keogh, S Lonardi, B Chiu, A Symbolic representation of Time Series, with Implications for Streaming Algorithms, Proceeding of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, San Diago, CA, June 13, 2003 [2] E Keogh S Lonardi, and B Chiu, Finding Surprising Patterns in a Time Series Database In Linear Time and Space, in the 8th ACM SIGKDD Intercational Conference on Knowledge Discovery and Data Mining, pp 550-556, Edmonton, Alberta, Canada, June 23-26, 2002 [3] E Keogh, K Chakrabarti, M Pazzani, S Mehrotra, Dimensionality reduction for fast similarity search in large time series databases, in Knowledge and Information Systems, vol 3, no 3, pp 263-286, 2000 [4] E Keogh, J Lin and A Fu, HOT SAX: Efficiently Finding the Most Unusual Time Series Subsequence, in Proceedings of the 5th IEEE International Conference on Data Mining ICDM, 2005 [5] P S Kalekar, Time series Forecasting using Holt-Winters Exponential Smoothing Kanwal Rekhi School of Information Technology, 2004 [6] C C Holt, Planning production, inventories and work force, Englewood Cliffs, New Jersey: Prentice Hall, 1957 [7] P R Winters, Forecasting sales by exponentially weighted moving averages, Management Science 6, pp 324–342, 1960 [8] D.T.Anh Bài giảng môn Hệ hỗ trợ định Khoa Khoa học kỹ thuật máy tính Trường ĐH Bách Khoa TPHCM [9] G Zhang, M Qi, Trend Time-Series Modeling And Forecasting With Neural Networks IEEE Transactions on Neural Networks, vol 19, no 5, pp 808-816, 2008 [10] A Azadeh, S.F Ghaderi, S Sohrabkhani, Forecasting electrical consumption by integration of Neural Networks, time series and ANOVA Applied Mathematics and Computation, vol 186, Issue 2, pp 1753-1761, 2007 [11] N Ganesan, Application of Neural Networks in Diagnosing Cancer Disease Using Demographic Data International Journal of Computer Applications, vol 1, no 26, 2010 [12] R.J Hyndman, A.B Koehler, J.K Ord and R.D Snyder, Forecasting with exponential smoothing: the state space approach In Springer-Verlag, 2008 65 [13] R.J Hyndman Time Series Data Library, http://data.is/TSDLdemo Accessed on 15/05/2014 [14] P Goodwin, The Holt-Winters Approach to Exponential Smoothing: 50 Years Old and Going Strong FORESIGHT: The International Journal of Applied Forecasting, 2010 [15] S Gelper, R Fried and C Croux, Robust forecasting with exponential and HoltWinters smoothing Journal of Forecasting, vol 29, Issue 3, pp 285-300, 2010 66 PHỤ LỤC A: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANHVIỆT STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Thuật ngữ Normalization Discretization Text mining Dimensionality reduction Trend Seasonal Cyclical Irregular Symbolic Aggregate approXimation Piecewise Aggregate Approximation Dynamic Time Warping Mean Absolute Percentage Error Mean Absolute Error Mean Square Error Sum Square Error AutoCorrelation AutoCorrelation Function Partial AutoCorrelation Function Simple Exponential Smoothing Multiplicative Seasonal Model Additve Seasonal Model AutoRegressive Moving Average AutoRegressive Integrated Moving Average Seasonal ARIMA Neural Networks Suffix Tree Lag operator Simulated Annealing Ý nghĩa Chuẩn hóa liệu Rời rạc hóa liệu Khai phá liệu văn Thu giảm số chiều Thành phần xu huớng Thành phần mùa Thành phần chu kỳ Thành phần bất thường Phương pháp xấp xỉ gộp ký hiệu hóa Phương pháp xấp xỉ gộp đoạn Độ đo xoắn thời gian động Sai số phần trăm trung bình tuyệt đối Sai số trung bình tuyệt đối Sai số trung bình bình phương Sai số bình phương tổng Hệ số tự tương quan Hàm tự tương quan Hàm tự tương quan riêng phần Chữ viết tắt SAX PAA DTW MAPE MAE MSE SSE ACF PACF Làm trơn theo hàm mũ đơn giản Mơ hình có tính nhân Mơ hình có tính cộng Mơ hình ARMA ARMA ARIMA Mơ hình ARIMA Mơ hình SARIMA Mơ hình mạng Neural Cây hậu tố Tốn tử trễ Mơ luyện kim A1 SARIMA NN SA PHỤ LỤC B: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH Đọc chuẩn hóa liệu Trong phần Data, bấm nút Open File để chọn liệu cần đọc chuẩn hóa (dạng *.txt hay *.dat) Thơng tin Data Points cho biết kích thước chuỗi liệu đầu vào Chuỗi liệu đầu vào minh họa biểu đồ bên đường màu xanh dương Có thể ẩn/hiện đường biểu diễn cách đánh dấu/bỏ chọn vào ô Hide Original Phát xử lý bất thường Bước 1: Trong phần Anomaly, bấm nút mũi tên tăng giảm phần Sliding Window Size để xác định kích thước cửa sổ trượt Bước 2: Bấm nút Find Anomaly để tìm bất thường, bất thường tìm thấy minh họa biểu đồ bên đường màu đỏ Có thể ẩn/hiện đường biểu diễn cách đánh/bỏ dấu chọn vào ô Hide Anomal Bước 3: Sau tìm thấy bất thường, bấm nút Smoothing để xử lý làm trơn bất thường vừa tìm thấy Kết xử lý làm trơn bất thường minh họa biểu đồ bên đường nét đứt màu xanh Có thể ẩn/hiện đường biểu diễn cách đánh dấu/bỏ chọn vào ô Hide Smooth Lưu ý: Để tiếp tục tìm xử lý bất thường khác lặp lại từ bước đến bước 3 Dự báo Bước 1: Trong phần Forecast, chọn chiều dài thành phần mùa chuỗi liệu thời gian đầu vào phần Season Bước 2: Chọn dự báo theo mơ hình nhân (Multiplicative) hay mơ hình cộng (Additive) phần Model Bước 3: Chọn ước lượng tham số dự báo tối ưu giải thuật tìm kiếm chân phương (Brute Force) hay giải thuật mô luyện kim (Simulated Annealing) phần Algorithm Bước 4: Bấm nút Find Param để ước lượng tham số dự báo tối ưu dựa vào tham số thiết lập từ bước đến bước Bộ tham số dự báo tối ưu tìm hiển thị phần Use Estimate Parameters B1 Bước 4: Bấm nút mũi tên tăng giảm phần Alpha, Beta, Gamma để chọn tham số dự báo (α, 𝛽, 𝛾) Nếu muốn dùng tham số dự báo tối ưu tìm đánh đấu chọn vào ô Use Estimate Parameters Lưu ý: không bắt buộc phải sử dụng tham số dự báo tối ưu tìm được, sử dụng tham số khác tùy ý Bước 5: Bấm nút Forecast để dự báo dựa vào tham số thiết lập từ bước đến bước Kết dự báo (giá trị dự báo, sai số dự báo) hiển thị thẻ Forecast Biểu đồ minh họa kết dự báo hiển thị thẻ Actual and Predicted Graph, đó:  Đường nét liền màu xanh dương biểu diễn chuỗi liệu đầu vào  Đường nét đứt màu đỏ biểu diễn kết dự báo khơng xử lý bất thường  Đường nét liền có chấm vuông màu xanh biểu diễn kết dự báo có xử lý bất thường  Có thể ẩn/hiện đường biểu diễn cách đánh dấu/bỏ chọn vào ô Hide Original (chuỗi liệu gốc), Hide Predicted (Original) (chuỗi dự báo không xử lý bất thường), Hide Predicted (Smooth) (chuỗi dự báo có xử lý bất thường) Lưu ý: Nếu liệu đầu vào chưa xử lý bất thường mà tiến hành dự báo dự báo liệu đầu vào khơng xử lý bất thường Nếu xử lý bất thường dự báo liệu làm trơn bất thường Nếu dự báo muốn phát bất thường khác để dự báo lại phải lặp lại bước Đọc chuẩn hóa liệu, Phát xử lý bất thường, Dự báo Nếu muốn dự báo mà không cần phát xử lý bất thường khác cần lặp lại từ bước đến bước B2 PHỤ LỤC C: LÝ LỊCH TRÍCH NGANG Họ tên: Trần Duy Lộc Ngày, tháng, năm sinh: 24/05/1988 Nơi sinh: TP.HCM Địa liên lạc: 2B Tơn Thất Thuyết, P18, Q4, TP.HCM Q TRÌNH ĐÀO TẠO Thời gian 2006 – 2010 2012 – 2014 Trường đào tạo Đại học Khoa học tự nhiên TP.HCM Đại học Bách khoa TP.HCM Chuyên ngành Toán – Tin học Khoa học máy tính Bậc đào tạo Cử nhân Thạc sĩ Q TRÌNH CƠNG TÁC Thời gian 2010 – 2012 Đơn vị cơng tác Vị trí Cơng ty Cổ Phần Đầu tư Phát triển Công nghệ Kỹ sư phần mềm Truyền thông C1 ... tố bất thường khỏi liệu chuỗi thời gian Sau đó, tiến hành dự báo liệu chuỗi thời gian xử lý bất thường mơ hình Holt- Winters Qua thực nghiệm dự báo liệu chuỗi thời gian có chứa đựng yếu tố bất thường, ... gian, dự báo liệu chuỗi thời gian phương pháp làm trơn hàm mũ phương pháp đánh giá sai số dự báo liệu chuỗi thời gian 2.1 Một số khái niệm 2.1.1 Dữ liệu chuỗi thời gian (Time series) Dữ liệu chuỗi. .. hình Holt- Winters để dự báo tốt chuỗi liệu thời gian có chứa bất thường Trong nghiên cứu này, đề xuất phát loại bỏ bất thường khỏi chuỗi thời gian giải thuật phát bất thường để đảm bảo chuỗi liệu

Ngày đăng: 31/01/2021, 23:58

Tài liệu cùng người dùng

Tài liệu liên quan