Xét quá trình AR(1)

Một phần của tài liệu (TIỂU LUẬN) dự báo mã CHỨNG KHOÁN VCB BẰNG PHƯƠNG PHÁP ARIMA (Trang 30 - 41)

AR(1) dừng khi nghiệm của phương trình đặc trưng: 1 - =0 có giá trị tuyệt đối > 1

Giả sử nghiệm là: >1, khi đó: >1

Khái quát hơn, điều kiện cần ( nhưng chưa đủ ) để mơ hình AR(p) dừng là tổng các hệ số tự hồi quy phải nhỏ hơn 1:

Quá trình Trung bình trượt, Đồng liên kết, Tự hồi quy (ARIMA)

Một chuỗi thời gian có thể tuân theo nhiều mơ hình khác nhau, tuy nhiên, cả | ba mơ hình trên đều địi hỏi chuỗi thời gian phải có tính dừng. Nhưng trong thực tế, tồn tại rất nhiều chuỗi thời gian không dừng. Vậy làm cách nào để ứng dụng các mơ hình trên trong thực tế? Câu trả lời chính là dùng phương pháp lấy sai phân để biến đổi một chuỗi thời gian không dừng thành chuỗi dùng trước khi áp dụng mơ hình ARMA.

Nếu một chuỗi thời gian dừng ở sai phân bậc d, ta nói chuỗi liên kết bậc d. Ký hiệu I(d). Kế hợp với quá trình ARMA ta có được mơ hình Trung bình trượt, Đồng liên kết, Tự hồi quy ARIMA(p,d, q) với p số hạng tự hồi quy và q số hạng trung bình trượt, và cần lấy sai phân bậc d đề chuỗi dừng. Phương trình tổng quát như sau:

Như vậy, xác định được các giá trị p, d, q ta sẽ mơ hình hóa được chuỗi. Đồng thời ta dễ dàng nhận ra, mơ hình ARIMA chỉ sử dụng các giá trị quá khứ của bản thân nó chứ hồn tồn khơng sử dụng thêm một biển độc lập nào khác. Đây chính là triết lý “hãy để dữ liệu tự nói”.

Ứng dụng:

+ Mơ hình ARIMA (2,1,2)(2,1,9):

Xét mơ hình AR:

Tất cả các giá trị Modulus đều <1 => Mơ hình AR dừng Xét mơ hình MA:

Tất cả các giá trị Modulus đều < 1 => Mơ hình MA khả nghịch

Do mơ hình AR dừng và mơ hình MA khả nghịch nên mơ hình (2,1,2) (2,1,9) là mơ hình tốt.

+ Mơ hình ARIMA (2, 1, 2) (2, 1, 29)

Xét mơ hình AR:

Tất cả các giá trị Modulus đều <1 => mơ hình AR dừng Xét mơ hình MA:

Tất cả các giá trị Modulus đều < 1 => mơ hình MA khả nghịch

Do mơ hình AR dừng và MA khả nghịch nên mơ hình ARIMA (2, 1, 2) (2, 1, 29) là mơ hình tốt.

+ Mơ hình ARIMA (2, 1, 2) (3, 1, 3)

Xét mơ hình AR:

Tất cả các giá trị Modulus đều <1 => mơ hình AR dừng. Xét mơ hình MA:

Tất cả các giá trị Modulus đều < 1 => mơ hình MA khả nghịch.

Vì mơ hình AR dừng và mơ hình MA khả nghịch nên mơ hình ARIMA (2, 1, 2) (3, 1, 3) là mơ hình tốt.

Bước 9: Căn cứ trên tiêu chí độ chính xác của dự báo để lựa chọn cịn 1 mơ hình

Lý thuyết:

+ Sai số (Error): là giá trị chênh lệch giữa giá trị đo được hoặc tính được và giá trị

thực hay giá trị chính xác của một đại lượng nào đó. Khi đo đạc nhiều lần một đại lượng nào đó, thơng thường dù cẩn thận đến mấy, vẫn thấy các kết quả giữa các lần đo được hầu như đều khác nhau. Điều đó chứng tỏ rằng trong kết quả đo được ln ln có sai số và kết quả chúng ta nhận được chỉ là giá trị gần đúng của nó mà thơi.

+ MAE

Các lỗi Mean Absolute (MAE) là một KPI rất tốt để đo lường độ chính xác dự báo. Như tên của nó, nó là trung bình của sai số tuyệt đối.

Một trong những vấn đề đầu tiên của KPI này là nó khơng được mở rộng theo nhu cầu trung bình. Nếu ai đó nói với bạn rằng MAE là 10 cho một mặt hàng cụ thể, bạn không thể biết điều này là tốt hay xấu. Nếu nhu cầu trung bình của bạn là 1000, tất nhiên là đáng kinh ngạc, nhưng nếu nhu cầu trung bình là 1, thì đây là một độ chính xác rất kém. Để giải quyết vấn đề này, người ta thường chia mAE cho nhu cầu trung bình để nhận được %.

MAPE/MAE Nhầm lẫn - Có vẻ như nhiều học viên sử dụng cơng thức MAE và gọi nó là MAPE. Điều này có thể gây ra nhiều nhầm lẫn. Khi thảo luận về sai số dự báo với ai

đó, tơi ln khun bạn nên trình bày rõ ràng cách bạn tính tốn sai số dự báo để đảm bảo so sánh quả táo và quả táo.

+ Root Mean Square Error (RMSE): là độ lệch chuẩn của các phần dư ( sai số dự đoán ).

Phần dư là thước đo khoảng cách từ các điểm dữ liệu đường hồi quy; RMSE là thước đo mức độ lan tỏa của những phần dư này. Nói cách khác, nó cho bạn biết mức độ tập trung

của dữ liệu xung quanh dòng phù hợp nhất. Sai số bình phương trung bình gốc thường được

sử dụng trong khí hậu học, dự báo và phân tích hồi quy để xác minh kết quả thực nghiệm.

Một lợi thế khác biệt của RMSE so với MAE là các RMSE tránh sử dụng giá trị tuyệt đối, rất khơng mong muốn trong nhiều tính tốn cao độ. Chẳng hạn, có thể khó tính gradient hoặc độ nhạy của các MAE đối với các thơng số mơ hình nhất định. Hơn nữa, trong trường đồng hóa dữ liệu, tổng lỗi bình phương thường được định nghĩa là hàm chi phí được thu nhỏ bằng cách điều chỉnh các tham số mơ hình. Trong các ứng dụng như vậy, bị phạt các lỗi lớn thông qua các thuật ngữ vuông nhỏ nhất được xác định chứng tỏ là rất hiệu quả trong việc cải thiện hiệu suất mơ hình. Trong các trường hợp tính tốn độ nhạy hoặc dữ liệu của mơ hình tính tốn các ứng dụng đồng hóa, MAE chắc chắn khơng được ưa thích hơn RMSE.

Các lỗi Root Mean Squared (RMSE) là một KPI lạ nhưng rất hữu ích nhưng chúng ta sẽ thảo luận sau. Nó được định nghĩa là căn bậc 2 của hai số bình phương trung bình .

Cũng như đối với MAE, RMSE khơng được mở rộng theo nhu cầu. Sau đó, chúng ta có thể

xác định RMSE% như vậy

Trên thực tế nhiều thuật toán (đặc biệt cho học máy) dựa trên MSE có liên quan trực tiếp đến RMSE

+ MAPE

Mean absolute percentage error (MAPE) là một trong những tiêu chí phổ biến nhất dùng để đo độ chính xác dự báo. MAPE là tổng của sai số tuyệt đối riêng chia cho nhu cầu (từng thời kỳ riêng biệt). Nó là giá trị trung bình của phần trăm lỗi.

MAPE là một KPI dự báo thực sự kỳ lạ.

Nó khá nổi tiếng trong giới quản lý doanh nghiệp, mặc dù là một chỉ số có độ chính xác kém. Như bạn thấy trong cơng thức, MAPE chia từng lỗi riêng lẻ cho nhu cầu, vì vậy nó bị lệch: lỗi cao trong thời gian nhu cầu thấp sẽ ảnh hưởng đáng kể đến MAPE. Do đó, việc tối ưu hóa MAPE sẽ dần đến một dự báo kỳ lạ rất có thể sẽ làm giảm nhu cầu. Chỉ cần tránh nó.

Ứng dụng:

Mơ hình ARIMA (2,1,2) (2,1,9)

+ Mơ hình ARIMA (2, 1, 2) (2, 1, 29)

Mơ hình ARIMA (2, 1, 2) (3, 1, 3)

Mơ hình ARIMA RMSE MAE MAPE

ARIMA (2, 1, 2) 0.9002(*) 0.5396(*) 93.0899

(2, 1, 9)ARIMA (2, 1, 2) ARIMA (2, 1, 2) (2, 1, 29) 0.9029 0.5399 92.4020(*) ARIMA (2, 1, 2) (3, 1, 3) 0.9009 0.5403 94.0024

Bảng so sánh căn cứ trên tiêu chí độ chính xác của dự báo

Vậy nhóm quyết định lựa chọn mơ hình ARIMA (2, 1, 2) (2, 1, 9)

Một phần của tài liệu (TIỂU LUẬN) dự báo mã CHỨNG KHOÁN VCB BẰNG PHƯƠNG PHÁP ARIMA (Trang 30 - 41)

Tải bản đầy đủ (PDF)

(41 trang)