Việc thiết kế thành cơng mơ hình ARIMA phụ thuộc vào sự hiểu biết rõ ràng về vấn đề, về mơ hình, cĩ thể dựa vào kinh nghiệm của các chuyên gia dự báo…
Trong quá trình tìm hiểu, khĩa luận sẽ đƣa ra các bƣớc để xây dựng một mơ hình nhƣ sau :
1. Chọn tham biến 2. Chuẩn bị dữ liệu
Xác định tính dừng của chuỗi dữ liệu Xác định yếu tố mùa vụ
Xác định yếu tố xu thế
3. Xác định các thành phần p, q trong mơ hình ARMA
4. Ƣớc lƣợng các tham số và chẩn đốn mơ hình phù hợp nhất 5. Dự báo ngắn hạn
3.1.3.1 Chọn tham biến
Hƣớng tiếp cận trong dữ liệu tài chính, chứng khốn là tập trung xây dựng mơ hình dự báo tƣơng lai đối với dữ liệu dạng chuỗi thời gian liên tiếp trong quá khứ:
Dự báo lƣợng điện tiêu thụ của tổ dân phố A trong tháng tới
Dự báo chỉ số GDP cho năm tiếp theo qua dữ liệu của nhiều năm trƣớc Dự báo chỉ số giá chứng khốn của một cơng ty…
3.1.3.2 Chuẩn bị dữ liệu
Xác định tính dừng của chuỗi dữ liệu : Dựa vào đồ thị của chuỗi và đồ thị của hàm tự tƣơng quan.
Nếu đồ thị của chuỗi Y = f(t) một cách trực quan nếu chuỗi đƣợc coi là dừng khi đồ thị của chuỗi cho trung bình hoặc phƣơng sai khơng đổi
29
theo thời gian khi đĩ đồ thị của chuỗi dữ liệu sẽ dao động quanh giá trị trung bình của chuỗi.
Dựa vào đồ thị của hàm tự tƣơng quan ACF nếu đồ thị cho ta một chuỗi giảm mạnh và tắt dần về 0 sau q độ trễ.
Nếu chuỗi dữ liệu ban đầu là một chuỗi khơng dừng, cần phải khử tính dừng bằng cách lấy sai phân (2.1.5.) một lần hoặc hai lần (thƣờng chỉ sau hai lần ta sẽ đƣợc một chuỗi mới đã dừng). Tiếp đến, thực hiện các quá trình cịn lại với chuỗi dữ liệu mới (đã dừng). Sau khi đƣa ra đƣợc dự báo với chuỗi dữ liệu mới, cần tích hợp để đƣa ra dự báo với chuỗi dữ liệu ban đầu.
Xác định yếu tố mùa vụ cho chuỗi dữ liệu : Dựa vào đồ thị của chuỗi dữ liệu Y = f(t) (xem 1.2.3. Thành phần mùa) để cĩ thể dự đốn đƣợc dữ liệu chuỗi thời gian cĩ yếu tố mùa vụ? Với những dấu hiệu điển hình khi nhìn vào biểu đồ tự tƣơng quan ACF và tự tƣơng quan từng phần PACF:
Khi biểu đồ tự tƣơng quan ACF cĩ dấu hiệu giảm một cách từ từ
Khi biểu đồ tự tƣơng quan từng phần giảm một cách đột ngột tại các độ trễ thƣờng là 4, 8, 12…hoặc 12, 24,...
Nếu chuỗi dữ liệu ban đầu là một chuỗi cĩ tính mùa vụ, cần xác định bậc mùa vụ của chuỗi dữ liệu (S = ?), sau đĩ thì khử tính mùa vụ (theo 2.1.5) để cĩ đƣợc một chuỗi dữ liệu thời gian khơng cĩ tính mùa vụ.
Xác định yếu tố xu thế cho chuỗi dữ liệu : Xem lại phần 2.1.2 (Trong giới hạn của khĩa luận chúng tơi để đây nhƣ là một hƣớng nghiên cứu tƣơng lai.)
3.1.3.3 Xác định thành phần p, q trong mơ hình ARMA
Sau khi loại bỏ các thành phần : Xu thế, mùa vụ, tính dừng thì dữ liệu trở thành dạng thuần cĩ thể áp dụng mơ hình ARMA cho quá trình dự báo. Việc xác định 2 thành phần p và q.
Chọn mơ hình AR(p) nếu đồ thì PACF cĩ giá trị cao tại độ trễ 1, 2, …, p và giảm nhiều sau p và dạng hàm ACF giảm dần
Chọn mơ hình MA(q) nếu đồ thị ACF cĩ giá trị cao tại độ trễ 1, 2, …, q và giảm nhiều sau q và dạng hàm PACF giảm dần.
30
3.1.3.4 Ƣớc lƣợng các thơng số của mơ hình và kiểm định mơ hình phù hợp nhất
Cĩ nhiều phƣơng pháp khác nhau để ƣớc lƣợng. Ở đây, khĩa luận tập trung vào : Khi đã chọn đƣợc mơ hình, các hệ số của mơ hình sẽ đƣợc ƣớc lƣợng theo phƣơng pháp tối thiểu tổng bình phƣơng các sai số. Kiểm định các hệ số a, b của mơ hình bằng thống kê t. Ƣớc lƣợng sai số bình phƣơng trung bình của phần dƣ S2
: S2= 𝒆𝒕 𝟐 𝒏 𝒕−𝟏 𝒏−𝒓 = (𝒀𝒕−𝒀^𝒕) 𝟐 𝒏 𝒕−𝟏 𝒏−𝒓 2.9
Trong đĩ : et = Yt – Y^t = phần dƣ tại thời điểm t n = số phần dƣ
r = tổng số hệ số ƣớc lƣợng
Tuy nhiên : cơng thức chỉ đƣa ra để tham khảo...Hiện nay phƣơng pháp ƣớc lƣợng cĩ hầu hết trong các phần mềm thống kê : ET, MICRO TSP và SHAZAM, Eviews...
Nếu phần dƣ là nhiễu trắng thì cĩ thể dừng và dùng mơ hình đĩ để dự báo.
3.1.3.5 Kiểm tra mơ hình phù hợp nhất
Dựa vào một số tiêu chuẩn đánh giá:
BIC nhỏ (Schwarz criterion đƣợc xác định bởi : n.Log(SEE) + K.Log(n)) [18] SEE nhỏ [18] SEE = [ 𝒆𝒊 𝟐 𝒏−𝟐]1/2 R2 lớn : R-squared = (TSS-RSS)/TSS [18] TSS = (𝒀𝒊 − 𝒀^)𝟐 RSS = 𝒆𝒊𝟐 = (𝒀𝒊^ − 𝒀𝒊)𝟐[18]
Một mơ hình tốt khi chỉ số BIC nhỏ, SEE nhỏ, và R2
lớn
3.1.3.6 Dự báo ngắn hạn mơ hình
Sau các bƣớc trên giúp xác định đƣợc mơ hình phù hợp cho chuỗi dữ liệu đƣa vào. Dựa vào mơ hình đƣợc chọn là tốt nhất, với dữ liệu quá khứ tới thời điểm t, ta sử dụng để dự báo cho thời điểm kế tiếp t+1.
31