Thiết kế mơ hình ARIMA cho dữ liệu

Một phần của tài liệu LUẬN văn một số PHƯƠNG PHÁP KHAI PHÁ dữ LIỆU QUAN hệ TRONG tài CHÍNH và CHỨNG KHOÁN (Trang 37 - 40)

Việc thiết kế thành cơng mơ hình ARIMA phụ thuộc vào sự hiểu biết rõ ràng về vấn đề, về mơ hình, cĩ thể dựa vào kinh nghiệm của các chuyên gia dự báo…

Trong quá trình tìm hiểu, khĩa luận sẽ đƣa ra các bƣớc để xây dựng một mơ hình nhƣ sau :

1. Chọn tham biến 2. Chuẩn bị dữ liệu

 Xác định tính dừng của chuỗi dữ liệu  Xác định yếu tố mùa vụ

 Xác định yếu tố xu thế

3. Xác định các thành phần p, q trong mơ hình ARMA

4. Ƣớc lƣợng các tham số và chẩn đốn mơ hình phù hợp nhất 5. Dự báo ngắn hạn

3.1.3.1 Chọn tham biến

Hƣớng tiếp cận trong dữ liệu tài chính, chứng khốn là tập trung xây dựng mơ hình dự báo tƣơng lai đối với dữ liệu dạng chuỗi thời gian liên tiếp trong quá khứ:

 Dự báo lƣợng điện tiêu thụ của tổ dân phố A trong tháng tới

 Dự báo chỉ số GDP cho năm tiếp theo qua dữ liệu của nhiều năm trƣớc  Dự báo chỉ số giá chứng khốn của một cơng ty…

3.1.3.2 Chuẩn bị dữ liệu

 Xác định tính dừng của chuỗi dữ liệu : Dựa vào đồ thị của chuỗi và đồ thị của hàm tự tƣơng quan.

 Nếu đồ thị của chuỗi Y = f(t) một cách trực quan nếu chuỗi đƣợc coi là dừng khi đồ thị của chuỗi cho trung bình hoặc phƣơng sai khơng đổi

29

theo thời gian khi đĩ đồ thị của chuỗi dữ liệu sẽ dao động quanh giá trị trung bình của chuỗi.

 Dựa vào đồ thị của hàm tự tƣơng quan ACF nếu đồ thị cho ta một chuỗi giảm mạnh và tắt dần về 0 sau q độ trễ.

Nếu chuỗi dữ liệu ban đầu là một chuỗi khơng dừng, cần phải khử tính dừng bằng cách lấy sai phân (2.1.5.) một lần hoặc hai lần (thƣờng chỉ sau hai lần ta sẽ đƣợc một chuỗi mới đã dừng). Tiếp đến, thực hiện các quá trình cịn lại với chuỗi dữ liệu mới (đã dừng). Sau khi đƣa ra đƣợc dự báo với chuỗi dữ liệu mới, cần tích hợp để đƣa ra dự báo với chuỗi dữ liệu ban đầu.

 Xác định yếu tố mùa vụ cho chuỗi dữ liệu : Dựa vào đồ thị của chuỗi dữ liệu Y = f(t) (xem 1.2.3. Thành phần mùa) để cĩ thể dự đốn đƣợc dữ liệu chuỗi thời gian cĩ yếu tố mùa vụ? Với những dấu hiệu điển hình khi nhìn vào biểu đồ tự tƣơng quan ACF và tự tƣơng quan từng phần PACF:

 Khi biểu đồ tự tƣơng quan ACF cĩ dấu hiệu giảm một cách từ từ

 Khi biểu đồ tự tƣơng quan từng phần giảm một cách đột ngột tại các độ trễ thƣờng là 4, 8, 12…hoặc 12, 24,...

Nếu chuỗi dữ liệu ban đầu là một chuỗi cĩ tính mùa vụ, cần xác định bậc mùa vụ của chuỗi dữ liệu (S = ?), sau đĩ thì khử tính mùa vụ (theo 2.1.5) để cĩ đƣợc một chuỗi dữ liệu thời gian khơng cĩ tính mùa vụ.

 Xác định yếu tố xu thế cho chuỗi dữ liệu : Xem lại phần 2.1.2 (Trong giới hạn của khĩa luận chúng tơi để đây nhƣ là một hƣớng nghiên cứu tƣơng lai.)

3.1.3.3 Xác định thành phần p, q trong mơ hình ARMA

Sau khi loại bỏ các thành phần : Xu thế, mùa vụ, tính dừng thì dữ liệu trở thành dạng thuần cĩ thể áp dụng mơ hình ARMA cho quá trình dự báo. Việc xác định 2 thành phần p và q.

 Chọn mơ hình AR(p) nếu đồ thì PACF cĩ giá trị cao tại độ trễ 1, 2, …, p và giảm nhiều sau p và dạng hàm ACF giảm dần

 Chọn mơ hình MA(q) nếu đồ thị ACF cĩ giá trị cao tại độ trễ 1, 2, …, q và giảm nhiều sau q và dạng hàm PACF giảm dần.

30

3.1.3.4 Ƣớc lƣợng các thơng số của mơ hình và kiểm định mơ hình phù hợp nhất

Cĩ nhiều phƣơng pháp khác nhau để ƣớc lƣợng. Ở đây, khĩa luận tập trung vào : Khi đã chọn đƣợc mơ hình, các hệ số của mơ hình sẽ đƣợc ƣớc lƣợng theo phƣơng pháp tối thiểu tổng bình phƣơng các sai số. Kiểm định các hệ số a, b của mơ hình bằng thống kê t. Ƣớc lƣợng sai số bình phƣơng trung bình của phần dƣ S2

: S2= 𝒆𝒕 𝟐 𝒏 𝒕−𝟏 𝒏−𝒓 = (𝒀𝒕−𝒀^𝒕) 𝟐 𝒏 𝒕−𝟏 𝒏−𝒓 2.9 (adsbygoogle = window.adsbygoogle || []).push({});

Trong đĩ : et = Yt – Y^t = phần dƣ tại thời điểm t n = số phần dƣ

r = tổng số hệ số ƣớc lƣợng

Tuy nhiên : cơng thức chỉ đƣa ra để tham khảo...Hiện nay phƣơng pháp ƣớc lƣợng cĩ hầu hết trong các phần mềm thống kê : ET, MICRO TSP và SHAZAM, Eviews...

Nếu phần dƣ là nhiễu trắng thì cĩ thể dừng và dùng mơ hình đĩ để dự báo.

3.1.3.5 Kiểm tra mơ hình phù hợp nhất

Dựa vào một số tiêu chuẩn đánh giá:

 BIC nhỏ (Schwarz criterion đƣợc xác định bởi : n.Log(SEE) + K.Log(n)) [18]  SEE nhỏ [18] SEE = [ 𝒆𝒊 𝟐 𝒏−𝟐]1/2  R2 lớn : R-squared = (TSS-RSS)/TSS [18] TSS = (𝒀𝒊 − 𝒀^)𝟐 RSS = 𝒆𝒊𝟐 = (𝒀𝒊^ − 𝒀𝒊)𝟐[18]

Một mơ hình tốt khi chỉ số BIC nhỏ, SEE nhỏ, và R2

lớn

3.1.3.6 Dự báo ngắn hạn mơ hình

Sau các bƣớc trên giúp xác định đƣợc mơ hình phù hợp cho chuỗi dữ liệu đƣa vào. Dựa vào mơ hình đƣợc chọn là tốt nhất, với dữ liệu quá khứ tới thời điểm t, ta sử dụng để dự báo cho thời điểm kế tiếp t+1.

31

Một phần của tài liệu LUẬN văn một số PHƯƠNG PHÁP KHAI PHÁ dữ LIỆU QUAN hệ TRONG tài CHÍNH và CHỨNG KHOÁN (Trang 37 - 40)