Nghiên cứu phát triển mô hình dự báo dữ liệu thời gian sử dụng phương pháp cửa sổ dịch chuyển và máy học véc-tơ hỗ trợ được tối ưu bởi thuật toán trí tuệ bầy đàn
Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 36 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
36
Dung lượng
1,59 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG BÁO CÁO TĨM TẮT ĐỀ TÀI KHOA HỌC VÀ CƠNG NGHỆ CẤP ĐẠI HỌC ĐÀ NẴNG NGHIÊN CỨU PHÁT TRIỂN MƠ HÌNH DỰ BÁO DỮ LIỆU THỜI GIAN SỬ DỤNG PHƯƠNG PHÁP CỬA SỔ DỊCH CHUYỂN VÀ MÁY HỌC VÉC-TƠ HỖ TRỢ ĐƯỢC TỐI ƯU BỞI THUẬT TỐN TRÍ TUỆ BẦY ĐÀN Mã số: B2017-ĐN06-02 Chủ nhiệm đề tài: ThS Trương Thị Thu Hà Email: tttha@ute.udn.vn Đà Nẵng, 06/2019 II DANH SÁCH NHỮNG THÀNH VIÊN THAM GIA ĐỀ TÀI VÀ ĐƠN VỊ PHỐI HỢP Thành viên tham gia nghiên cứu đề tài TT Họ tên Đơn vị công tác lĩnh vực chuyên môn TS Ngô Ngọc Tri Khoa Quản lý dự án, Trường Đại học Bách Khoa, Đại học Đà Nẵng ThS Huỳnh Võ Duyên Anh Khoa Kỹ thuật Xây dựng, Trường Đại học Sư phạm Kỹ thuật, Đại học Đà Nẵng III MỤC LỤC MỞ ĐẦU 1 TÍNH CẤP THIẾT CỦA VẤN ĐỀ NGHIÊN CỨU MỤC TIÊU NGHIÊN CỨU CÁCH TIẾP CẬN PHƯƠNG PHÁP NGHIÊN CỨU ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU NỘI DUNG NGHIÊN CỨU CHƯƠNG 1: TỔNG QUAN VỀ DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 1.1 Dự báo liệu chuỗi thời gian: khái niệm phân loại 1.1.1 Khái niệm dự báo liệu chuỗi thời gian 1.1.2 Phân loại dự báo liệu chuỗi thời gian 1.2 Tầm quan trọng dự báo liệu chuỗi thời gian 1.2.1 Trong lĩnh vực lượng 1.2.2 Trong lĩnh vực tài CHƯƠNG 2: CÁC NGHIÊN CỨU VỀ DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 2.1 Dự báo chuỗi thời gian giới 2.1.1 Các mơ hình dự báo lĩnh vực lượng 2.1.2 Các mơ hình dự báo lĩnh vực tài 2.1.3 Dự báo chuỗi thời gian lĩnh vực khác 2.2 Dự báo chuỗi thời gian Việt Nam 2.3 Kết luận CHƯƠNG 3: PHÁT TRIỂN MƠ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN SỬ DỤNG PHƯƠNG PHÁP CỬA SỔ DỊCH CHUYỂN VÀ MÁY HỌC VÉC-TƠ HỖ TRỢ ĐƯỢC TỐI ƯU BỞI THUẬT TOÁN TRÍ TUỆ BẦY ĐÀN 3.1 Phương pháp cửa sổ dịch chuyển 3.2 Mơ hình máy học véc-tơ hỗ trợ tối ưu thuật tốn trí tuệ bầy đàn 10 3.2.1 Mơ hình máy học véc-tơ hỗ trợ 10 3.2.2 Thuật toán đom đóm 11 3.3 Mơ hình dự báo sử dụng phương pháp cửa sổ dịch IV chuyển máy học véc-tơ hỗ trợ tối ưu với thuật tốn đom đóm 11 CHƯƠNG 4: ỨNG DỤNG MƠ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 14 4.1 Thu thập tiền xử lý liệu 14 4.1.1 Bộ liệu – Điện tiêu thụ hàng tháng thành phố Đà Nẵng 14 4.1.2 Bộ liệu – Nhu cầu điện tiêu thụ hàng ngày thành phố Đà Nẵng 14 4.1.3 Bộ liệu – Giá cổ phiếu đóng cửa hàng ngày mã chứng khoán CTD 15 4.2 Thiết lập tham số cho mơ hình dự báo 16 4.3 Kết thảo luận 17 4.3.1 Trình tự thực 17 4.3.2 Kết thảo luận 17 4.3.3 Kết luận 22 KẾT LUẬN VÀ KIẾN NGHỊ 23 Kết luận 23 Kiến nghị 23 TÀI LIỆU THAM KHẢO 25 V BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc THƠNG TIN KẾT QUẢ NGHIÊN CỨU Thơng tin chung: - Tên đề tài: Nghiên cứu phát triển mô hình dự báo liệu thời gian sử dụng phương pháp cửa sổ dịch chuyển máy học véc-tơ hỗ trợ tối ưu thuật tốn trí tuệ bầy đàn - Mã số: B2017-ĐN06-02 - Chủ nhiệm đề tài: ThS Trương Thị Thu Hà - Tổ chức chủ trì: Đại học Đà Nẵng - Thời gian thực hiện: từ 06/2017 đến 05/2019 Mục tiêu: - Phát triển mô hình dự báo tích hợp để dự đốn liệu chuỗi thời gian cách tích hợp phương pháp cửa sổ dịch chuyển mơ hình máy véc-tơ hỗ trợ tối ưu thuật tốn đom đóm Mơ hình dự báo phát triển ngơn ngữ lập trình MATLAB - Nâng cao độ xác độ tin cậy việc dự báo liệu chuỗi thời gian Tính sáng tạo: - Đề tài phát triển mơ hình dự báo chuỗi thời gian cách tích hợp phương pháp cửa sổ dịch chuyển mơ hình máy học tối ưu thuật tốn trí tuệ bầy đàn Mơ hình dự báo đề xuất xây dựng ngơn ngữ lập trình MATLAB; - Mơ hình dự báo đề xuất ứng dụng cho thị trường lượng tài Việt Nam; - Đề tài cần thiết phải sử dụng phương pháp cửa sổ dịch chuyển dự báo chuỗi thời gian Sản phẩm: - Báo cáo tổng kết đề tài; - 01 báo khoa học quốc tế đăng tạp chí thuộc danh mục ISI: N.-T Ngo, T.T.H Truong, Forecasting Time Series Data Using Moving-Window Swarm Intelligence-Optimized Machine Learning VII BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc INFORMATION ON RESEARCH RESULTS General information: - Project title: Research and development a time series forecast model using moving-window concept and support vector machines optimized by swarm intelligence algorithm - Code number: B2017-ĐN06-02 - Coordinator: MSc Thi Thu Ha Truong - Implementing institution: The University of Danang - Duration: from 06/2017 to 05/2019 Objective: - Develop an integrated forecast model for predicting time series data by integrating the moving-window concept and the support vector model that is optimized by the firefly algorithm The forecast model is developed in the MATLAB programming language - Increase the accuracy and the reliability in predicting time series data Creativeness and innovativeness: - The research developed a time series forecast model by integrating the moving-window concept and the machine learning regression that is optimized by the swarm intelligence The proposed model was developed in the MATLAB programming language - The proposed forecast model was adopted to energy and financial markets of Vietnam; - The research indicated a necessity of using the moving-window concept for predicting time series data Research results: The findings in this study indicated the outperformance of the proposed forecast model MFA-LSSVR to other models including MARIMA and MLSSVR in predicting time series data This study also shows the necessity of using the moving-window approach and its effect on the forecast accuracy VIII Products: - Final report; - 01 article published by ISI-indexed journals: N.-T Ngo, T.T.H Truong, Forecasting Time Series Data Using Moving-Window Swarm Intelligence-Optimized Machine Learning Regression, International Journal of Intelligent Engineering Informatics (2019) - 01 article published by the Board of State Professors-rated journal: T.T.H Truong, N.-T Ngo, T.K.V Tang, Electric load consumption forecasting in da nang city using a hybrid of movingwindow concept and swarm intelligence-optimized machine learning regression, Journal of Science and Technology-The University of Danang 11(132) (2018) 108-112 - 01 computer program developed on MATLAB programming language Transfer alternatives, application institutions, impacts and benefits of research results: - Method for transferring research results: Represent in person to Acceptance Board for Scientific and Technological topics of the University of Danang; - Locations for application: Investors, agencies and enterprises of interest; researchers in the field of time series forecasting; - This study will provide a potential solution to time series data forecasting The findings of this study could be applied into practice to forecast time series data in energy, finance, tourism, environment, etc These forecasts help investors, enterprises, and regulators to make right decisions MỞ ĐẦU TÍNH CẤP THIẾT CỦA VẤN ĐỀ NGHIÊN CỨU Dự báo liệu chuỗi thời gian (time series data forecasting) việc sử dụng mơ hình tốn học để dự báo điểm liệu tương lai dựa vào liệu khứ; chẳng hạn dự báo doanh thu bán hàng doanh nghiệp, dự báo lượng điện tiêu thụ hàng tháng, hàng năm, dự báo giá đóng cửa cổ phiếu thị trường chứng khoán, dự báo tỷ giá hối đoái,…Dữ liệu chuỗi thời gian thường phi tuyến, khơng ổn định, phi mùa vụ; vậy, dự báo chuỗi thời gian lĩnh vực đầy thử thách, thu hút quan tâm nhiều nhà nghiên cứu nhiều thập niên qua Tại Việt Nam, nghiên cứu dự báo chuỗi thời gian tập trung lĩnh vực kinh tế, chủ yếu dự báo doanh thu, dự báo thị trường chứng khoán mà chưa tập trung lĩnh vực khác lượng, môi trường.,…Phần lớn nghiên cứu Việt Nam sử dụng phương pháp/mơ hình thống kê hay truyền thống để dự báo Vì vậy, nghiên cứu này, nhóm tác giả phát triển mơ hình dự báo liệu chuỗi thời gian cách tích hợp phương pháp cửa số dịch chuyển (moving-window) máy véc-tơ hỗ trợ tối ưu thuật tốn đom đóm MỤC TIÊU NGHIÊN CỨU - Phát triển mơ hình để dự báo liệu chuỗi thời gian cách tích hợp phương pháp cửa sổ dịch chuyển mơ hình máy véc-tơ hỗ trợ tối ưu thuật toán đom đóm Mơ hình dự báo phát triển ngơn ngữ lập trình MATLAB; - Nâng cao độ xác độ tin cậy việc dự báo liệu chuỗi thời gian CÁCH TIẾP CẬN Quá trình nghiên cứu thực đề tài gồm 04 bước bản: - Bước 1: Thu thập xử lý liệu nghiên cứu; - Bước 2: Phát triển mô hình dự báo liệu chuỗi thời gian ngơn ngữ lập trình MATLAB; 13 3.4 Các tiêu đánh giá kết dự báo Độ xác dự báo mơ hình đánh giá thơng qua sử dụng tập liệu kiểm chứng (test data) Các tiêu sử dụng để đánh giá độ xác dự báo gồm: bậc hai sai số bình phương trung bình (root mean square error – RMSE), sai số tuyệt đối trung bình (mean absolute error – MAE), phần trăm sai số tuyệt đối trung bình (mean absolute percentage error – MAPE) số xếp hạng tổng hợp (synthesis index – SI) RMSE đo lường khác biệt giá trị thực tế với giá trị dự đốn mơ hình RMSE n ( y' y )2 n i 1 (3.5) đó, y giá trị thực tế; y’ giá trị dự đoán, n số lượng liệu dự báo MAE đại lượng phản ánh sai số giá trị thực tế giá trị dự đốn mà khơng quan tâm sai số vượt hay sai số thiếu hụt MAE n y y' n i 1 (3.6) MAPE đại lượng thống kê dùng để đo lường phần trăm sai số tương đối mà mơ hình dự đốn mắc phải n y y' (3.7) MAPE n i 1 y Chỉ số SI dùng để xếp hạng mơ hình dự báo khác kịch khác mơ hình Giá trị SI nằm [0,1], mơ hình có giá trị SI tiến chứng tỏ kết dự đốn mơ hình xác SI m Pi Pmin,i m i 1 Pmax,i Pmin,i Trong đó, m số lượng số đánh giá (gồm RMSE, MAE, MAPE), Pi giá trị số đánh giá thứ i 14 CHƯƠNG 4: ỨNG DỤNG MƠ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 4.1 Thu thập tiền xử lý liệu 4.1.1 Bộ liệu – Điện tiêu thụ hàng tháng thành phố Đà Nẵng Dữ liệu sử dụng điện tiêu thụ (điện thương phẩm) hàng tháng hộ tiêu thụ, sở sản xuất,… địa bàn thành phố Đà Nẵng (chưa tính lượng điện tiêu thụ hầm đèo Hải Vân) Bộ liệu sử dụng nghiên cứu gồm 132 biến quan sát tháng 04/2007 đến tháng 03/2018 chia thành tập con: tập liệu học gồm 108 biến quan sát tập kiểm chứng gồm 24 biến lại Đồ thị liệu mơ tả Hình 4.1 Monthly electric load consumption (kWh) 2.75 x 10 Learning data Test data 2.5 2.25 1.75 1.5 1.25 0.75 0.5 Apr 07 Mar 08 Mar 09 Mar 10 Mar 11 Mar 12 Mar 13 Mar 14 Mar 15 Mar 16 Mar 17 Mar 18 Data points (April 2007 - Mar 2018) Hình 4.1 Đồ thị điện tiêu thụ hàng tháng TP Đà Nẵng 4.1.2 Bộ liệu – Nhu cầu điện tiêu thụ hàng ngày thành phố Đà Nẵng Bộ liệu thu thập thành phố Đà Nẵng nhu cầu điện tiêu thụ hàng ngày Bộ liệu gồm 455 biến quan sát (kéo dài 15 tháng 65 tuần, ngày 01/01/2017 đến 15 ngày 31/03/2018) chia thành tập con: tập liệu học gồm 365 biến quan sát (12 tháng) tập kiểm chứng gồm 90 biến (3 tháng cuối) Đồ thị liệu mô tả Hình 4.2 11000 Daily load demand (kWh) 10000 Learning data Test data 9000 8000 7000 6000 5000 4000 3000 50 100 150 200 250 300 350 400 Data points (January 1st, 2017 - March 31st, 2018) 450 500 Hình 4.2 Đồ thị nhu cầu tiêu thụ điện hàng ngày TP Đà Nẵng 4.1.3 Bộ liệu – Giá cổ phiếu đóng cửa hàng ngày mã chứng khoán CTD Dữ liệu sử dụng giá cổ phiếu đóng cửa hàng ngày Coteccons (mã chứng khoán: CTD) niêm yết Sở Giao dịch Chứng khốn Thành phố Hồ Chí Minh (HOSE) Bộ liệu gồm 316 biến quan sát ngày 01/08/2016 đến ngày 31/10/2017, chia thành tập con: tập liệu học gồm 251 biến quan sát (tương ứng với 12 tháng), tập kiểm chứng gồm 65 biến quan sát (tương ứng với tháng cuối) Đồ thị liệu mơ tả Hình 4.3 16 230 Learning data Test data Daily closing price (1000 VND) 220 210 200 190 180 170 160 150 50 100 150 200 250 Data points (August 1st, 2016 - October 31st, 2017) 300 350 Hình 4.3 Đồ thị giá cổ phiếu đóng cửa hàng ngày mã chứng khốn CTD 4.2 Thiết lập tham số cho mơ hình dự báo Độ xác dự báo mơ hình đề xuất MFA-LSSVR so sánh với mơ hình moving-window ARIMA (MARIMA) moving-window LSSVR (MLSSVR) Sự thiết lập tham số mơ hình MFA-LSSVR trình bày Bảng 4.1 Bảng 4.1 Tham số đầu vào mô hình dự báo đề xuất Tên Giá trị/Thiết lập Phân chia liệu học Tập huấn luyện 70% Tập kiểm thử 30% Tham số mơ hình LSSVR C, [10-3; 1012] Tham số FA Số lượng đom đóm 60 Số vòng lặp lớn 30 Độ sáng βo = 0.1 Hệ số hấp thu γ=1 17 Đối với mơ hình MLSSVR, hai tham số C lấy theo giá trị C = 10; = 0.1 4.3 Kết thảo luận 4.3.1 Trình tự thực Quá trình thực gồm giai đoạn: Xác định giá trị tối ưu lag; Xác định chiều dài tối ưu cửa sổ dịch chuyển; So sánh khả dự báo mơ hình dự báo Bảng 4.2 mô tả việc lựa chọn lag tối ưu liệu Bảng 4.2 Quá trình lựa chọn giá trị lag tối ưu liệu Bộ liệu Số lượng Khoảng Số lượng liệu cửa lựa chọn liệu kiểm sổ dịch chuyển lag chứng Bộ - Điện tiêu thụ hàng tháng thành phố Đà Nẵng 60 [3;20] 12 Bộ - Nhu cầu tiêu thụ điện hàng ngày thành phố Đà Nẵng 364 [3;14] 14 Bộ - Giá cổ phiếu đóng cửa hàng ngày mã chứng khoán CTD 240 [3;15] 20 4.3.2 Kết thảo luận a) Bộ liệu - Điện tiêu thụ hàng tháng TP Đà Nẵng Để xác định giá trị tối ưu lag, cửa sổ gồm 60 biến quan sát (từ tháng 01/2010 đến tháng 12/2014) dùng để kiểm tra khả dự báo mơ hình MFA-LSSVR Giá trị lag lấy khoảng [3; 18]; với lag, 12 biến quan sát năm 2015 dùng liệu kiểm chứng Theo đó, với lag=14 (tháng) mơ hình MFA-LSSVR cho giá trị SI nhỏ (SI=0) Do đó, giá trị tối ưu lag 14 tháng Các cửa sổ có chiều dài khác sử dụng để kiểm tra khả dự báo mô hình MFA-LSSVR Mỗi cửa sổ dùng giá trị lag tối ưu (lag=14) 12 biến quan sát năm 2015 dùng để kiểm tra độ xác dự báo Khi cửa sổ gồm 90 biến quan sát SI có giá trị nhỏ (SI=0); đồng thời số RMSE, MAE 18 MAPE cho giá trị nhỏ Do đó, cửa sổ dịch chuyển tối ưu gồm 90 biến quan sát Bảng 4.3 so sánh độ xác dự báo mơ hình, gồm MARIMA, MLSSVR, MFA-LSSVR Mỗi mơ hình sử dụng cửa sổ dịch chuyển gồm 90 biến quan sát (learning data) lấy giá trị lag tối ưu Đồng thời, 24 biến quan sát (từ tháng 04/2016 đến tháng 03/2018) sử dụng để kiểm tra độ xác dự báo Từ Bảng 4.3 nhận thấy, mơ hình MFA-LSSVR có độ xác dự báo cao Cả số RMSE, MAE MAPE cho giá trị nhỏ Nhìn chung, mơ hình đề xuất MFA-LSSVR cải thiện sai số dự báo từ 65.23% đến 88.14% so với mơ hình lại Bảng 4.3 So sánh độ xác dự báo mơ hình RMSE (kWh) Mơ hình MAE (kWh) MARIMA 29,081.395 21,978.633 (14,0,14) MLSSVR 67,801.103 60,250.023 MFA-LSSVR 10,110.680 7,143.743 MAPE (%) 9.93 Sự cải thiện MFA-LSSVR (%) RMSE MAE MAPE 65.23* 67.50* 66.16* 25.51 85.09* 88.14* 86.83* 3.36 - Ghi chú: * mức ý nghĩa thống kê 99% Monthly electric load consumption (kWh) 2.8 x 10 2.6 2.4 2.2 1.8 1.6 Actual value Predicted value by MARIMA Predicted value by MLSSVR Predicted value by MFA-LSSVR 1.4 1.2 Apr 16 Jun 16 Aug 16 Oct 16 Dec 16 Feb 17 Apr 17 Jun 17 Aug 17 Test data (April 2016 - March 2018) Oct 17 Dec 17 Mar 18 Hình 4.4 Giá trị thực tế dự báo mơ hình sử dụng liệu kiểm chứng 19 Hình 4.4 thể giá trị thực tế dự báo mơ hình sử dụng liệu kiểm chứng Rõ ràng giá trị dự báo (predicted value) mơ hình MFA-LSSVR gần sát với giá thực tế (actual value) so với giá trị dự báo mơ hình MARIMA MLSSVR b) Bộ liệu - Nhu cầu điện tiêu thụ hàng ngày TP Đà Nẵng Một cửa sổ dịch chuyển gồm 364 biến quan sát (tương đương 52 tuần) từ ngày 01/01/2017 đến 30/12/2017 sử dụng để xác định giá trị lag tối ưu Dữ liệu tuần dùng để kiểm tra độ xác dự báo mơ hình MFA-LSSVR Tại lag = (ngày), mơ hình MFA-LSSVR có độ xác dự báo cao (SI=0) Vậy giá trị lag tối ưu liệu ngày Với chiều dài cửa sổ 36 tuần (tương đương 252 biến quan sát), SI = 0; đó, chiều dài tối ưu cửa sổ dịch chuyển trường hợp 252 ngày Để đánh giá khả dự báo mơ hình, liệu kiểm chứng gồm 90 biến quan sát (từ ngày 01/01/2018 đến ngày 31/03/2018) sử dụng Các mơ hình so sánh sở đồng giá trị lag (lag = ngày) chiều dài cửa sổ dịch chuyển (252 ngày) Từ Bảng 4.4 nhận thấy, mơ hình MFA-LSSVR có sai số dự báo thấp Theo đó, giá trị RMSE mơ hình MFA-LSSVR 600.672 kWh, thấp nhiều so với mơ hình lại Một cách tổng thể, mơ hình đề xuất MFA-LSSVR cải thiện từ 33.49% đến 60.55% độ xác dự báo mơ hình lại (MARIMA MLSSVR) Bảng 4.4 So sánh độ xác dự báo mơ hình Sự cải thiện MFARMSE MAE MAPE LSSVR (%) Mơ hình (kWh) (kWh) (%) RMSE MAE MAPE MARIMA (6,0,6) 1,020.578 712.808 12.47 41.14* 33.49* 38.49* MLSSVR 1,505.509 1,080.424 19.44 60.10* 56.12* 60.55* MFA-LSSVR 600.672 474.114 7.67 - Ghi chú: * mức ý nghĩa thống kê 99% Giá trị thực tế dự báo mô hình thể Hình 20 4.5 So với giá trị dự báo mơ hình MARIMA MLSSVR, giá trị dự báo mơ hình MFA-LSSVR gần sát với giá trị thực tế 8500 Daily load consumption (kWh) 8000 7500 7000 6500 6000 5500 5000 4500 4000 3500 Actual value Predicted value by MARIMA Predicted value by MLSSVR Predicted value by MFA-LSSVR 10 20 30 40 50 60 70 Test data (Jan 1st, 2018 - Mar 31st, 2018) 80 90 Hình 4.5 Giá trị thực tế dự báo mơ hình sử dụng liệu kiểm chứng c) Bộ liệu - Giá cổ phiếu đóng cửa hàng ngày mã chứng khoán CTD Để xác định giá trị lag tối ưu, cửa sổ gồm 240 biến quan sát (tương đương 12 tháng) sử dụng Cửa sổ lấy giá trị từ ngày 17/10/2016 đến ngày 29/09/2017 20 giá trị dùng để kiểm tra độ xác dự báo mơ hình MFA-LSSVR Với lag = (ngày), SI = 0; ngày giá trị lag tối ưu Chiều dài tối ưu cửa sổ dịch chuyển xác định thông qua phân tích độ nhạy số SI Với cửa sổ dịch chuyển, 20 biến quan sát (từ ngày 17/07/2017 đến ngày 11/08/2017) sử dụng để kiểm tra độ xác dự báo mơ hình MFA-LSSVR SI đạt giá trị nhỏ (SI = 0.001) cửa sổ chứa 200 biến quan sát (tương đương chiều dài 10 tháng), chiều dài tối ưu cửa sổ dịch chuyển 200 ngày Khả dự báo mơ hình so sánh Bảng 4.5 Các 21 mơ hình sử dụng liệu học chiều dài tối ưu cửa sổ dịch chuyển giá trị lag tối ưu Dữ liệu kiểm chứng gồm 65 biến quan sát, từ ngày 01/08/2017 đến ngày 31/10/2017 Từ Bảng 4.5 nhận thấy, mơ hình MFA-LSSVR tiếp tục thể khả dự báo vượt trội so với mơ hình MARIMA MLSSVR Cả ba số RMSE, MAE, MAPE mơ hình MFA-LSSVR thấp mơ hình lại Một cách tổng thể, mơ hình đề xuất MFA-LSSVR cải thiện từ 27.27% đến 45.15% độ xác dự báo mơ hình MARIMA MLSSVR Bảng 4.5 So sánh độ xác dự báo mơ hình Mơ hình MARIMA (3,0,3) MLSSVR MFA-LSSVR RMSE (1000 đồng) MAE (1000 đồng) MAPE (%) Sự cải thiện MFALSSVR (%) RMSE MAE MAPE 3.743 3.099 2.230 2.773 2.097 1.521 1.31 0.99 0.72 40.42* 45.15* 45.04* 28.04* 27.47* 27.27* - Ghi chú: * mức ý nghĩa thống kê 99% 225 Daily closing price (1000 VND) 220 Actual value Predicted value by MARIMA Predicted value by MLSSVR Predicted value by MFA-LSSVR 215 210 205 200 195 10 20 30 40 50 Test data (Aug 1st, 2017 - Oct 31st, 2017) 60 70 Hình 4.6 Giá trị thực tế dự báo mơ hình sử dụng liệu kiểm chứng 22 Hình 4.6 thể giá trị thực tế dự báo mơ hình Rõ ràng giá trị dự báo mơ hình MFA-LSSVR bám sát giá trị thực tế so với giá trị dự báo mơ hình MARIMA MLSSVR 4.3.3 Kết luận Mỗi liệu có đặc trưng thống kê khác nên có giá trị lag tối ưu cửa sổ dịch chuyển tối ưu khác Trong nghiên cứu này, giá trị xác định phương pháp phân tích độ nhạy Trong liệu, mơ hình MFA-LSSVR thể khả dự báo vượt trội so với mơ hình MARIMA MLSSVR với giá trị kiểm định giả thuyết thống kê p < 0.01 Điều khẳng định tin cậy mơ hình dự báo đề xuất; ứng dụng mơ hình MFA-LSSVR để dự báo liệu chuỗi thời gian lĩnh vực Với liệu điện tiêu thụ mơ hình MARIMA có độ xác dự báo cao mơ hình MLSSVR Với liệu giá đóng cửa mã chứng khốn khả dự báo mơ hình MLSSVR tốt mơ hình MARIMA 23 KẾT LUẬN VÀ KIẾN NGHỊ Kết luận Đề tài phát triển mô hình dự báo chuỗi thời gian tích hợp phương pháp cửa sổ dịch chuyển máy học véc-tơ hỗ trợ tối ưu thuật tốn đóm (mơ hình MFA-LSSVR) Mơ hình dự báo đề xuất xây dựng ngơn ngữ lập trình MATLAB Với việc sử dụng thuật tốn đom đóm, mơ hình MFA-LSSVR cải thiện đáng kể độ xác dự báo LSSVR Đồng thời, phương pháp cửa sổ dịch chuyển sử dụng để lựa chọn liệu lịch sử hợp lý, làm cho việc dự báo trở nên linh hoạt tin cậy Trong nghiên cứu này, hiệu mơ hình đề xuất MFALSSVR đánh giá thơng qua dự báo liệu lượng chứng khốn Độ xác so sánh với mơ hình MARIMA MLSSVR Kết phân tích cho thấy khả dự báo vượt trội mô hình MFA-LSSVR so với mơ hình MARIMA LSSVR Với liệu điện thương phẩm hàng tháng, mô hình MFA-LSSVR cải thiện 65.23-88.14% độ xác dự báo so với mơ hình MARIMA LSSVR; dự báo nhu cầu điện hàng ngày, số 33.49-60.55% Với liệu giá cổ phiếu chứng khốn, mơ hình MFA-LSSVR cải thiện 27.27-45.15% độ xác dự báo so với mơ hình lại Giá trị kiểm định thống kê pvalue trường hợp < 0.01 Vì vậy, mơ hình đề xuất công cụ hiệu tin cậy để dự báo liệu chuỗi thời gian Kiến nghị Nghiên cứu chưa xem xét ảnh hưởng yếu tố bên đến kết dự báo Chẳng hạn yếu tố nhiệt độ, độ ẩm, ngày tuần chưa xem xét dự báo điện thương phẩm nhu cầu điện tiêu thụ Trong dự báo giá cổ phiếu, nghiên cứu chưa xem xét ảnh hưởng yếu tố lãi suất ngân hàng, tâm lý, kiện trị Do đó, cần xem xét ảnh hưởng yếu tố kể nghiên cứu sau Trong tương lai, mô hình dự báo đề xuất cần chứng minh liệu chuỗi thời gian khác chẳng hạn lĩnh vực thời 24 tiết, môi trường, Nghiên cứu ưu điểm mơ hình dự báo dựa máy học véc-tơ tối ưu thuật tốn đom đóm Những nghiên cứu sau cần so sánh độ xác dự báo mơ hình đề xuất MFA-LSSVR với mơ hình máy học tối ưu thuật tốn trí tuệ bầy đàn khác Mặt khác, cần xây dựng giao diện ứng dụng web để mơ hình dự báo phổ biến rộng rãi đến nhà đầu tư, nhà quản trị (vốn hạn chế kiến thức liệu lập trình) 25 TÀI LIỆU THAM KHẢO Li, S., P Wang, and L Goel, A Novel Wavelet-Based Ensemble Method for Short-Term Load Forecasting with Hybrid Neural Networks and Feature Selection IEEE Transactions on Power Systems, 2016 31(3): p 1788-1798 Hong, W.-C., Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model Energy Conversion and Management, 2009 50(1): p 105-117 Kavousi-Fard, A., H Samet, and F Marzbani, A new hybrid Modified Firefly Algorithm and Support Vector Regression model for accurate Short Term Load Forecasting Expert Systems with Applications, 2014 41(13): p 6047-6056 thương, B.C., Thông tư Quy định hệ thống điện phân phối, in 39/2015/TT-BCT 2015, Bộ Công thương: Hà Nội Gia, L.D Vai trò thị trường chứng khoán Việt Nam 2015 [cited 2019 03]; Available from: https://luatduonggia.vn/vai-trocua-thi-truong-chung-khoan-o-viet-nam/ Taylor, J.W., An evaluation of methods for very short-term load forecasting using minute-by-minute British data International Journal of Forecasting, 2008 24(4): p 645-658 Contreras, J., et al., ARIMA Models to Predict Next-Day Electricity Prices IEEE Power Engineering Review, 2002 22(9): p 57-57 Taskaya-Temizel, T and M.C Casey, A comparative study of autoregressive neural network hybrids Neural Networks, 2005 18(5): p 781-789 Hippert, H.S., D.W Bunn, and R.C Souza, Large neural networks for electricity load forecasting: Are they overfitted? International Journal of Forecasting, 2005 21(3): p 425-434 10 Vapnik, V.N., The nature of statistical learning theory 1995, New York: Springer-Verlag 11 Yang, X.-S., Firefly algorithm 2008, Bristol, U.K: Luniver Press 26 12 Fister, I., et al., A comprehensive review of firefly algorithms Swarm and Evolutionary Computation, 2013 13: p 34-46 13 Chou, J.-S., N.-T Ngo, and A.-D Pham, Shear Strength Prediction in Reinforced Concrete Deep Beams Using NatureInspired Metaheuristic Support Vector Regression Journal of Computing in Civil Engineering, 2016 30(11): p 1-9 14 Chou, J.-S and A.-D Pham, Smart Artificial Firefly Colony Algorithm-Based Support Vector Regression for Enhanced Forecasting in Civil Engineering Computer-Aided Civil and Infrastructure Engineering, 2015 30(9): p 715–732 15 Xiong, T., Y Bao, and Z Hu, Multiple-output support vector regression with a firefly algorithm for interval-valued stock price index forecasting Knowledge-Based Systems, 2014 55: p 87-100 16 Castillo, O and P Melin, Hybrid intelligent systems for time series prediction using neural networks, fuzzy logic, and fractal theory IEEE Transactions on Neural Networks, 2002 13(6): p 1395 - 1408 17 Hippert, H.S., C.E Pedreira, and R.C Souza, Neural networks for short-term load forecasting: a review and evaluation IEEE Transactions on Power Systems, 2001 16(1): p 44 - 55 18 Giordano, F., M La Rocca, and C Perna, Forecasting nonlinear time series with neural network sieve bootstrap Computational Statistics & Data Analysis, 2007 51(8): p 3871-3884 19 Alameer, Z., et al., Forecasting gold price fluctuations using improved multilayer perceptron neural network and whale optimization algorithm Resources Policy, 2019 61: p 250-260 20 Huang, W., Y Nakamori, and S.-Y Wang, Forecasting stock market movement direction with support vector machine Computers & Operations Research, 2005 32(10): p 2513-2522 21 Cao, L., Support vector machines experts for time series forecasting Neurocomputing, 2003 51: p 321-339 22 Lau, K.W and Q.H Wu, Local prediction of non-linear time series using support vector regression Pattern Recognition, 27 23 24 25 26 27 28 29 30 31 2008 41(5): p 1539-1547 Min, S.-H., J Lee, and I Han, Hybrid genetic algorithms and support vector machines for bankruptcy prediction Expert Systems with Applications, 2006 31(3): p 652-660 Wu, C.-H., et al., A real-valued genetic algorithm to optimize the parameters of support vector machine for predicting bankruptcy Expert Systems with Applications, 2007 32(2): p 397-408 Akerkar, R., Big data computing 2013, UK: Taylor & Francis Group, LLC 562 Hoang, N.-D., A.-D Pham, and M.-T Cao, A Novel Time Series Prediction Approach Based on a Hybridization of Least Squares Support Vector Regression and Swarm Intelligence Applied Computational Intelligence and Soft Computing, 2014 Min, Z and T Huanq, Short Term Load Forecasting with Least Square Support Vector Regression and PSO, in Communications in Computer and Information Science, J Zhang, Editor 2011, Springer Heidelberg Dordrecht London NewYork p 124-132 Chen, T.-T and S.-J Lee, A weighted LS-SVM based learning system for time series forecasting Information Sciences, 2015 299: p 99-116 Chou, J and T Nguyen, Forward Forecast of Stock Price Using Sliding-Window Metaheuristic-Optimized Machine-Learning Regression IEEE Transactions on Industrial Informatics, 2018 14(7): p 3132-3142 Suykens, J.A.K., et al., Least squares support vector machines 2002, Singapore: World Scientific Wang, H and D Hu, Comparison of SVM and LS-SVM for regression, in International Conference on Neural Networks and Brain 2005, IEEE: Beijing, China p 279-283 ... 3: PHÁT TRIỂN MƠ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN SỬ DỤNG PHƯƠNG PHÁP CỬA SỔ DỊCH CHUYỂN VÀ MÁY HỌC VÉC-TƠ HỖ TRỢ ĐƯỢC TỐI ƯU BỞI THUẬT TỐN TRÍ TUỆ BẦY ĐÀN 3.1 Phương pháp cửa sổ dịch chuyển. .. QUẢ NGHIÊN CỨU Thơng tin chung: - Tên đề tài: Nghiên cứu phát triển mơ hình dự báo liệu thời gian sử dụng phương pháp cửa sổ dịch chuyển máy học véc-tơ hỗ trợ tối ưu thuật tốn trí tuệ bầy đàn. .. VÉC-TƠ HỖ TRỢ ĐƯỢC TỐI ƯU BỞI THUẬT TỐN TRÍ TUỆ BẦY ĐÀN 3.1 Phương pháp cửa sổ dịch chuyển 3.2 Mơ hình máy học véc-tơ hỗ trợ tối ưu thuật tốn trí tuệ bầy đàn 10 3.2.1 Mơ hình