Phương pháp trung bình trượt kết hợp tự hồi quy ARIMA được đưa ra bởi George Box và Gwilym Jenkins (1990), hay còn gọi là phương pháp luận Box- Jenkins, được dùng phổ biến trong việc lập mô hình chuỗi thời gian và là công cụ
dự báo hiệu quả theo nguyên lý “hãy để dữ liệu tự nói”. Với δ là giá trị trung
bình, ARIMA được biết đến với công thức như sau:
Quá trình tự hồi qui AR(p): (Yt– ) =α1(Yt-1– ) + … + αp(Yt-p– ) +ut
Quá trình trung bình trượt MA(q):Yt = + 0ut+ 1ut-1+ … + 1ut-q
Với p=1, q=1, ARIMA(1,d,1) được viết dưới dạng:
Yt =θ+α1(Yt-1– ) + 0ut+ 1ut-1
Tiếp theo nhóm nghiên cứu tiến hành lựa chọn các biến p, q phù hợp, bằng cách kiểm định chuỗi dữ liệu thời gian tỷ suất sinh lợi VN-Index trên nền phần mềm PcGive.
Lựa chọn p
Để lựa chọn độ trễ p, nhóm tiến hành so sánh các giá trị t-prob với các giá trị
p={1,2,…,6}, vì với p≥6, giá trị t-prob của AR(p) lớn hơn 0 rất nhiều, hay nói
cách khác, AR(p) với p≥6 là không phù hợp với chuỗi dữ liệu đang xét.
AR(1) AR(2) AR(3) AR(4) AR(5) AR(6)
AR-1 0.000 0.000 0.093 0.008 0.004 0.007 AR-2 0.000 0.000 0.000 0.000 0.000 AR-3 0.001 0.015 0.056 0.063 AR-4 0.021 0.012 0.018 AR-5 0.255 0.255 AR-6 0.921
Bảng 3.2. So sánh giá trị t-prob giữa các quá trình tự hồi qui AR(p) Nguồn: Tổng hợp khi chạy phần mềm PcGive
Xét bảng 3.2, nhóm nhận thấy tại độ trễ p = 4, các giá trị t-prob vẫn còn khá gần 0, nhưng khi tăng độ trễ p = 5, t-prob của biến AR-5 tăng đột ngột lên 0.255 – rất
lớn hơn 0, nên tại đỗ trễ này chuỗi dữ liệu không còn tính tự tương quan nữa.
Chính vì những lý do này nên nhóm quyết định chọn độ trễp = 4cho quá trình tự
hồi qui AR(p).
Lựa chọn q
Tiến hành tương tự với quá trình lựa chọn độ trễ p ở trên, nhóm nghiên cứu so sánh các giá trị t-prob giữa các mô hình MA(q) để lựa chọn q phù hợp. Nhóm so sánh các mô hình MA(q) với q nhận giá trị q = {1,2,…,6}, vì từ giá trị q = 6, giá trị t-pob tính được rất lớn (t-prob của biến MA-6 bằng 0.721), hay nói cách khác
q≥6 không phù hợp với dữ liệu đang xét.
MA(1) MA(2) MA(3) MA(4) MA(5) MA(6)
MA-1 0.000 0.000 0.039 0.021 0.000 0.001 MA-2 0.113 0.001 0.001 0.035 0.107 MA-3 0.000 0.000 0.002 0.006 MA-4 0.100 0.014 0.014 MA-5 0.004 0.006 MA-6 0.721
Bảng 3.3. So sánh giá trị t-prob giữa các quá trình trung bình trượt MA(q) Nguồn: Tổng hợp khi chạy phần mềm PcGive
Xét bảng 3.3, nhóm nhận thấy tại giá trị q = 3, các giá trị t-prob rất gần 0, trong khi đó với giá trị q = 2 và q = 4, t-prob có lúc đạt hoặc vượt quá 0.1, khá lớn để sử dụng cho chuỗi dữ liệu đang xét. Ngoài q = 3, tại q = 5 cũng cho kết quả t- prob cuả các biến khá thấp, nhưng khi so sánh với q =3, các giá trị t-prob tại q = 3 có xu hướng gần với giá trị 0 hơn. Chính vì những lý do này nên nhóm nghiên cứu quyết định chọn giá trịq = 3cho quá trình trung bình trượt MA(q).