Thử nghiệm chƣơng trình

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình kết hợp arima và mạng nơron cho bài toán dự báo (Trang 38)

7. Bố cục luận văn

3.4. Thử nghiệm chƣơng trình

3.4.1. Tập dữ liệu thực nghiệm

Trong bài luận văn này, các mô hình dự báo chuỗi thời gian sẽ đƣợc cài đặt và thực nghiệm trên tập dữ liệu mực nƣớc sông tại trạm An Hòa (thuộc hệ thống sông Bình Định) đƣợc thu thập từ các ngày trong tháng 9, tháng 10, tháng 11, tháng 12 của các năm 2016, năm 2017, năm 2018, năm 2019 (31/12/2019, 487 ngày) dựa trên số liệu thống kê của Chi cục thủy lợi phòng chống thiên tai Bình Định: https://pcttbinhdinh.gov.vn/chi-cuc-thuy-loi/. Tập dữ liệu thực nghiệm

sẽ đƣợc chia thành hai phần: 80% các điểm thời gian đƣợc sử dụng để huấn luyện, 20% các điểm thời gian còn lại sẽ đƣợc sử dụng cho thử nghiệm mô hình.

Hình 3.3 Dữ liệu mực nƣớc sông

Chú thích: Cột thể hiện mực nước giá trị H(m)

3.4.2. Đánh giá các mô hình dự báo

Để đánh giá chất lƣợng dự báo, bài luận văn sử dụng các độ đo lỗi RMSE (Root Mean Square Error) và MAPE (Mean Absolute Percentage Error):

RMSE = (3-1)

MAPE = *100 (3-2)

với n là số điểm thời gian thử nghiệm. là giá trị thực tế.

là giá trị dự báo từ mô hình.

Để đánh giá hiệu quả của phƣơng pháp kết hợp, sau đây tôi thực hiện việc dự báo cho bài toán trên bằng các mô hình độc lập Arima, mạng nơron và cuối cùng là phƣơng pháp kết hợp hai dạng trên.

3.4.3. Dự báo bằng mô hình Arima

Sử dụng hàm ACF, PACF để xác định các giá trị q, p thích hợp cho mô hình. Kết quả từ chuỗi dữ liệu cho thấy q có thể nhận các giá trị 2, 1, 1 và p có thể nhận các giá trị 3, 1, 1. Chúng ta cần tìm ra một mô hình Arima phù hợp để dự báo mực nƣớc sông.

Dữ liệu đƣợc kết nối nhƣ sau:

Lấy thông số Arima:

Thông số Arima đƣợc thể hiện hai biểu đồ bên dƣới

Chạy Arima: Arima(2,1,1)

Sau khi chạy huấn luyện dữ liệu kiểm tra độ lỗi bằng RMSE ta thấy đƣợc Arima (3,1,1) có độ lỗi thấp hơn Arima (2,1,1) đƣợc thể hiện qua bảng 3.1.

Bảng 3.1. Độ lỗi dự báo của mô hình ARIMA

Mô hình RMSE MAPE

ARIMA (2,1,1) 0.4044582 1.022975

ARIMA (3,1,1) 0.4044367 1.022834

3.4.4. Dự báo bằng mô hình FFNN

Chạy huấn luyện dữ liệu 1 lớp 1 node cho đến node thứ 5. Chạy nơron 1 lớp 1 node

Độ lỗi RMSE và MAPE

Chạy nơron 1 lớp 2 node

Độ lỗi RMSE và MAPE

Chạy nơron 1 lớp 3 node

Độ lỗi RMSE và MAPE

Chạy nơron 1 lớp 4 node

Độ lỗi RMSE và MAPE

Chạy nơ ron 1 lớp 5 node

Độ lỗi RMSE và MAPE

Chạy kiểm tra dữ liệu 1 lớp 1 node cho đến node thứ 5.

Kiểm tra node thứ 1.

Kiểm tra node thứ 3.

Kiểm tra node thứ 5.

Mô hình FFNN (p-r-q) với p là số lớp đầu vào, r là số lớp ẩn và q là số lớp đầu ra, ta chạy kiểm tra bộ dữ liệu l lớp chạy từ node thứ 1 đến node thứ 5 cho thấy đƣợc độ lỗi RMSE và MAPE của mô hình FFNN đƣợc tổng hợp Bảng 3.2.

Bảng 3.2. Độ lỗi dự báo của mô hình FFNN

Mô hình RMSE MAPE

FFNN(1-1-1) 0.1966972 0.0077241

FFNN(1-2-1) 0.1425288 0.0041041

FFNN(1-3-1) 0.1443039 0.0036074

FFNN(1-4-1) 0.1568701 0.0053831

FFNN(1-5-1) 0.1396084 0.0036271

Sau khi huấn luyện tập dữ liệu một lớp chạy từ node 1 đến node thứ 5 ta đo đƣợc độ lỗi RMSE ở node thứ 5 FFNN(1-5-1) là nhỏ nhất 0.1396048 và MAPE 0.0036271.

3.4.5. Kết quả kết hợp mô hình Arima và FFNN

Mô hình kết hợp A-FFNN(p,d,q,r) trong đó mô hình Arima (p,d,q) với p là bậc tự hồi quy, d bậc sai phân chuỗi thời gian khảo sát và q là bậc trung bình

trƣợt kết hợp với các tham số gồm 1 lớp ẩn (r), các node chạy từ 1 đến 5 và 1 lớp đầu ra của FFNN. Kết quả thực nghiệm của các mô hình dự báo mực nƣớc sông trạm An Hòa đƣợc thể hiện ở Bảng 3.3.

Bảng 3.3. Bảng so sánh độ lỗi dự báo của mô hình A-FFNN

Mô hình RMSE MAPE

A-FFNN(3,1,1,1) 0.1308421 0.0058887

A-FFNN(3,1,1,2) 0.1114224 0.0049632

A-FFNN(3,1,1,3) 0.1252366 0.0056757

A-FFNN(3,1,1,4) 0.0338697 0.0013524

A-FFNN(3,1,1,5) 0.0450041 0.0017826

Sau khi kết hợp giữa Arima và FFNN huấn luyện tập dữ liệu của Arima và nơron, ta sử dụng nơron để dự báo độ lỗi cho Arima và kết quả đo đƣợc là tổng giá trị của chúng. Kết quả thực nghiệm cho thấy mô hình kết hợp A- FFNN cho kết quả dự báo tốt hơn các mô hình khác dựa vào độ đo RMSE và MAPE (xem Bảng 3.4).

Bảng 3.4. Bảng so sánh độ lỗi dự báo của các mô hình

Mô hình RMSE MAPE

ARIMA (3,1,1) 0.4044367 1.022834

FFNN(1-5-1) 0.1396084 0.0036271

3.5. KẾT LUẬN CHƢƠNG 3

Trong Chƣơng 3, ngoài việc thử nghiệm dự báo mực nƣớc sông theo thời gian bởi các mô hình độc lập, tôi đã thử nghiệm dự báo bằng mô hình kết hợp giữa ARIMA và Mạng nơron. Kết quả thử nghiệm cho thấy sự kết hợp này ít lỗi hơn so với việc chạy từng mô hình độc lập.

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN

Dự báo chuỗi thời gian là một bài toán khó nhƣng rất quan trọng trong các lĩnh vực kinh tế và tài chính. Gần đây, dự báo về biến động thiên tai nhận đƣợc nhiều quan tâm của các nhà nghiên cứu trong kinh tế và kể cả khoa học máy tính. Với các đặc trƣng của mình, mực nƣớc biến động thƣờng xuyên dẫn đến việc dự báo gặp nhiều khó khăn. Trong bài luận văn thực nghiệm các mô hình dự báo ARIMA, FFNN, A-FFNN để dự báo mực nƣớc sông trong ngày tiếp theo. Kết quả thực nghiệm cho thấy, các mô hình kết hợp Arima và mạng nơron đều có độ lỗi dự báo thấp hơn các mô hình riêng lẻ, chứng tỏ mô hình kết hợp sẽ cho dự báo tốt hơn với các độ đo RMSE và MAPE.

Một số kết quả đạt đƣợc:

- Hiểu đƣợc một số lý thuyết về các mô hình dự báo; - Kết hợp, dự báo các mô hình chuỗi thời gian.

- Thử nghiệm, so sánh kết quả thực hiện các mô hình.

Nhìn chung, với chuỗi dữ liệu biến động lớn, các mô hình Arima và mạng nơron còn gặp nhiều khó khăn trong dự báo trên tập dữ liệu này. Trong tƣơng lai, các mô hình Deep Learning sẽ đƣợc nghiên cứu thử nghiệm với kỳ vọng mang lại kết quả dự báo tốt hơn.

DANH MỤC TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Nguyễn Quốc Dƣơng, Lê Phƣơng Thảo, Đinh Thị Quỳnh Nhƣ, Cao Thị Ái Loan, Phùng Thị Hồng Diễm, Lê Thanh Bính, Ứng dụng Shiny kết hợp với mô hình ARIMA để dự báo đại dịch COVID-19(Khoa Sƣ phạm, Trƣờng Đại học Quy NhơnKhoa Toán và Thống kê, Trƣờng Đại học Quy Nhơn)

[2] Lê Hữu Vinh & Nguyễn Đình Thuân, Kỷ yếu Hội nghị Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR). Huế, 07- 08/06/2019.

[3] Lê Hải Khôi & Trần Đức Minh, Về một phƣơng pháp dự báo dữ liệu sử dụng mạng nơron. (Tạp chí Tin học và Điều khiển học 20(2004), N2). [4] Trần Đức Minh, Trần Huy Dƣơng, Vũ Đức Thi, Kỷ yếu Hội nghị Quốc

gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR).Hà Nội, ngày 09-10/07/2015.

[5] Nguyễn Quang Hoan (2005), Giáo trình mạng nơ ron nhân tạo, Học viện công nghệ bƣu chính viễn thông.

[6] Nguyễn Đình Thúc (2000), Mạng nơ ron nhân tạo – phƣơng pháp và ứng dụng, Nhà xuất bản Giáo dục.

[7] PGS.TS. Lê Văn Nghinh, Ths. Hoàng Thanh Tùng, Ks. Nguyễn Ngọc Hải Nghiên cứu ứng dụng mạng Nơron thần kinh vào dự báo lũ các sông ở tỉnh Bình Định và Quảng Trị.

Tiếng Anh

[8] G. Box and Jenkin (1970), Time Series Analysis, Forecasting and Control, 4 ed., San Francisco: Holden-Day, 1970, pp. 234-239.

Canada: Mc GrawHill, pp. 777-784.

[10] D. Dickey and W. Fuller (1979), “Distribution of the Estimators for Autoregressive Time Series with a Unit Root”, Journal of the American Statistical Association, vol. 74, pp. 427-431.

[11] G. Peter Zhang, “Times series forecasting using a hybrid ARIMA and neural network model”, Neurocomputing, vol. 50, pp. 159–75, 2003. [12] Nitin Merh, Vinod P. Saxena, Kamal Raj Pardasani, “A comparison

between hybrid approaches of ANN and ARIMA for Indian stock trend forecasting”, Journal of Business Intelligence, vol. 3, no. 2, pp. 23–43, 2010.

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình kết hợp arima và mạng nơron cho bài toán dự báo (Trang 38)

Tải bản đầy đủ (PDF)

(81 trang)