MÔ HÌNH TỰ HỒI QUY VÀ TRUNG BÌNH TRƯỢT (ARMA)

Một phần của tài liệu Luận văn thạc sĩ Vận dụng mô hình Arma - Garch trong dự báo chỉ số Vnidex (full) (Trang 25)

6. Tổng quan tài liệu

1.4.MÔ HÌNH TỰ HỒI QUY VÀ TRUNG BÌNH TRƯỢT (ARMA)

1.4.1. Hàm tự tương quan

a. Hàm tự tương quan ACF

Khi một biến được đo lường theo thời gian, thì các quan sát ở các giai đoạn thời gian khác nhau thường tương quan với nhau. Sự tương quan này thường được đo bằng hệ số tương quan. Tự tương quan là sự tương quan giữa một biến trễ một hoặc k giai đoạn với chính bản thân biến đó. ACF với đội trễ k, ký hiệu , được xác định như sau:

ρ = ( , )

( ) = , k = 0, ±1, ±2, … ..

Do cả hiệp phương sai và phương sai được tính bằng cùng một đơn vị đo, nên là một đại lượng không có đơn vị đo. Nó nằm trong khoảng từ -1 đến 1. ACF là thống kê thích hợp nhất để xác định số bậc thích hợp cho quá trình MA.

b. Hàm tự tương quan riêng phần PACF

Hệ số tương quan riêng phần ϕ là hệ số tương quan tuyến tính giữa Yt và Yt-k , đo lường mối quan hệ giữa Yt và Yt-k nhưng không tính đến các liên hệ trung gian giữa các biến trung gian yt-1, ..., yt-k+1, nghĩa là PACF đo lường mối quan hệ giữa hai biến khi tất cả những biến không liên quan được loại trừ. ϕ được ước lượng từ hàm hồi quy:

y = μ+ϕ y + ϕ y + . . . + ϕ y +ε

Mục đích phổ biến của việc xác định PACF là để xác định mô hình AP(p) từ đó xác định ARMA thích hợp. Và PACF hầu như chỉ được sử dụng cho mỗi mục đích này trong phân tích chuỗi thời gian.

Tóm lại, hàm tự tương quan ACF và hàm tự tương quan từng phần PACF của chuỗi thời gian tài chính có các đặc tính khác nhau. Hàm tự tương quan ACF đo mức độ phụ thuộc tuyến tính giữa các cặp quan sát. Hàm tự tương quan từng phần PACF đo mức độ phụ thuộc tuyến tính từng phần.

17

ARMA khai thác những điểm khác biệt này để xác định cấu trúc mô hình cho chuỗi thời gian. Xu hướng vận động của hàm tự tương quan từng phần PACF có thể giảm đột ngột (thường sau độ trễ 1 hoặc 2) hay có thể giảm đều. Cũng như hàm tự tương quan ACF, xu hướng giảm đều của hàm tự tương quan từng phần PACF cũng có các dạng phân phối mũ, dạng sóng hình sin hoặc kết hợp cả 2 dạng này tương tự hình 1.4,1.5 và hình 1.6.

- Dạng phân phối mũ

Hình 1.4: Dao động hàm mũ tắt dần

Hình 1.5: Dao động tắt dần theo quy luật số mũ

- Dạng sóng sin

18

1.4.2. Tính dừng của chuỗi thời gian

Khái niệm tính dừng rất quan trọng trong phân tích chuỗi thời gian. Một chuỗi thời gian tài chính dừng có đặc điểm sau:

- E(Xt) = m , giá trị trung bình là một hằng số cho tất cả các thời điểm t. - E(Xt2)< ∞ sự biến động của chuỗi là có giới hạn.

- Cov(Xt,Xt-h) là một hằng số cho tất cả các thời điểm t và h khác 0 nghĩa là hiệp phương sai giữa Xt và Xt-h chỉ phụ thuộc vào khoảng cách của (h) về thời gian giữa t và t-h, không phụ thuộc vào thời điểm t.

Tóm lại, một chuỗi thời gian tài chính dừng nếu trung bình, phương sai của nó không đổi theo thời gian và hiệp phương sai giữa 2 thời đoạn chỉ phụ thuộc vào khoản cách và độ trễ về thời gian giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính.

Tại sao chuỗi thời gian tài chính dừng lại quan trọng? Có 2 lý do quan trọng khi biết một chuỗi thời gian tài chính là dừng hay không.

- Thứ nhất, Gujarati (2003) cho rằng nếu một chuỗi thời gian tài chính không dừng, chúng ta chỉ có thể nghiên cứu hành vi của nó trong thời gian đang xem xét. Mỗi một chuỗi dữ liệu theo thời gian sẽ mang một tình tiết nhất định và chỉ thể hiện những hành vi cụ thể trong khoảng thời gian đó. Kết quả là, chúng ta không thể khái quát hóa cho các giai đoạn khác nghĩa là không thể lấy đặc điểm của chuỗi thời gian tài chính giai đoạn này làm đặc điểm của một chuỗi thời gian tài chính giai đoạn khác. Đối với mục đích dự báo, các chuỗi thời gian tài chính không dừng như vậy có thể sẽ không có giá trị thực tiễn. Vì như chúng ta đã biết, trong dự báo chuỗi thời gian, chúng ta ngầm định xu hướng vận động của dữ liệu trong quá khứ và hiện tại được duy trì cho các giai đoạn trong tương lai. Thế nhưng, nếu bản thân dữ liệu luôn thay đổi thì chúng ta không thể dự báo được điều gì cho tương lai. Hơn nữa, đối với phân tích hồi quy, nếu chuỗi thời gian tài chính không dừng thì tất cả các

19

kết quả điển hình của một phân tích hồi quy tuyến tính cổ điển sẽ không có giá trị cho việc dự báo, và thường được gọi là hiện tượng “hồi quy giả mạo”.

- Thứ hai, khi biết dữ liệu dừng hay không, chúng ta sẽ giới hạn được số mô hình dự báo phù hợp nhất cho dữ liệu. Do vậy, điều kiện cơ bản nhất cho việc dự báo một chuỗi thời gian tài chính là nó phải có tính dừng.

Một cách trực quan, ta hãy xem đồ thị của một chuỗi thời gian tài chính không dừng và chuỗi thời gian tài chính dừng.

Hình 1.7 Chỉ số giá cổ phiếu DHG từ ngày 4/1/2010-29/3/2013- chuỗi không dừng

Hình 1.8 Tỷ suất sinh lời cổ phiếu DHG từ ngày 4/1/2010-29/3/2013- chuỗi dừng (adsbygoogle = window.adsbygoogle || []).push({});

Hình 1.8 thể hiện một chuỗi dừng vì dữ liệu có xu hướng hội tụ xoay quanh một giá trị nhất định. Trong khi đó, hình 1.7 biểu thị xu thế tăng với trung bình tăng theo thời gian. Một chuỗi sữ liệu dừng luôn có xu hướng trở về giá trị trung bình và những dao động xung quanh giá trị trung bình là như nhau. Ta cũng có thể suy ngược lại, một chuỗi thời gian tài chính không dừng theo cách ta đã định nghĩa về chuỗi dừng ở trên sẽ có giá trị trung bình thay

40 50 60 70 80 90 10M07 11M01 11M07 12M01 12M07 13M01 -.06 -.04 -.02 .00 .02 .04 .06 .08 10M07 11M 01 11M07 12M01 12M 07 13M01

20

đổi theo thời gian, giá trị phương sai thay đổi theo thời gian hay cả hai.

1.4.3. Kiểm định tính dừng

Hai phương pháp kiểm định tính dừng thường được sử dụng là giản đồ tương quan (dựa vào thống kê t và thống kê Q) và kiểm định nghiệm đơn vị (dựa vào thống kê tau τ) của Dickey và Fuller.

a. Giản đồ tự tương quan

Giản đồ tương quan là một đồ thị biểu diễn mối quan hệ giữa hệ sô tương quan bậc k với độ trễ k tương ứng. Hệ số tương quan được xác định theo công thức sau:

ρ =Cov(YVar(Y, Y ) ) =γγ , k = 0, ±1, ±2, … ..

Có 2 phương pháp kiểm định thường được sử dụng xem hệ số tương quan có ý nghĩa không: thống kê t và thống kê Q.

- Thống kê t:

Gọi là hệ số tương quan, ta có các giả thiết sau: H0 : ρ = 0 (Yt là chuỗi không dừng) H1 : ρ ≠ 1 (Yt là chuỗi dừng)

Nếu giá trị t tính toán ở mức ý nghĩa xác định lớn hơn giá trị t quan sát ta bác bỏ giả thiết H0.

- Thống kê Q:

Hai cột cuối trong biểu đồ tương quan là thống kê Q của Ljung – Box và giá trị xác suất tương ứng. Thống kê Q kiểm định giả thiết đồng thời là tất cả các hệ số cho tới một độ trễ đồng thời bằng 0. Với cỡ mẫu lớn, Q có phân phối theo Chi bình phương với bậc tự do bằng số độ trễ. Nếu giá trị thống kê Q tính toán lớn hơn giá trị thống kê Q tra bảng ở một mức ý nghĩa xác định, ta bác bỏ giả thiết H0.

21

dừng hay không với ý tưởng như sau: nếu hệ số tương quan đầu tiên khác không nhưng các hệ số tương quan tiếp theo bằng 0 có ý nghĩa thống kê thì đó là chuỗi dừng. Nếu một số hệ số tương quan khác không một cách có ý nghĩa thống kê thì đó là một chuỗi không dừng.

Hình 1.9: Minh họa giản đồ tương quan của một không chuỗi dừng

Hình 1.10: Minh họa giản đồ tương quan của một chuỗi dừng b. Kiểm định nghiệm đơn vị (Unit root test)

Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian tài chính dừng hay không dừng. Vì loại kiểm định này có tính học thuật và chuyên nghiệp cao hơn. Giả sử ta có phương trình tự hồi quy như sau:

22

Trong đó ε là nhiễu trắng. Nếu như ϕ = 1, khi đó yt là một bước ngẫu nhiên và yt là một chuỗi không dừng. Do đó để kiểm định tính dừng của yt ta sẽ kiểm định giả thiết:

H0 : ϕ = 1(Yt là chuỗi không dừng). H1 : ϕ < 1(Yt là chuỗi dừng).

Phương trình (1.1) tương đương với phương trình sau đây :

Δyt =μ+ (ϕ−1) + ε = μ+α + ε với α = ϕ−1 (1.2) Như vậy các giải thiết ở trên có thể được viết lại như sau :

H0 : α = 0 (Yt là chuỗi không dừng). H1 : α < 0 (Yt là chuỗi dừng).

Dickeyvà Fuller cho rằng giá trị t của hệ số Yt-1 sẽ không theo phân phối student mà phụ thuộc vào số lượng thành phần trong các hàm:

Bảng 1.1: Bảng phân phối xác suất tau statistic ( )

5% 10%

Δyt = α + ε -1.95 -2.6 (adsbygoogle = window.adsbygoogle || []).push({});

Δyt =μ+α + ε -2.89 -3.51

Δyt=μ+βt +α + ε -3.45 -4.04

Nếu ε tự tương quan có nghĩa là Δyt phụ thuộc cả các Δyt-i trong quá khứ như Δyt-1, Δyt-2 ...thì cải biên mô hình (1.2) như sau :

Δyt= μ+α +∑ ϕ ∆ + ε

Kiểm định trong trường hợp này được gọi là kiểm định DF bổ sung.

1.4.4. Mô hình tự hồi quy AR(p)

Trong một quá trình tự hồi quy bậc p, số liệu tại thời điểm hiện tại yt được tạo ra bởi một tổng trung bình có trọng số của các giá trị trong quá khứ tính cho đến giá trị quá khứ thứ p (yt-k). Mô hình tự hồi quy tổng quát chỉ có các giá trị hiện tại và quá khứ của Y được sử dụng trong mô hình và không

23

có biến hồi quy nào khác. Giá trị của Y tương lai phụ thuộc vào giá trị của nó trong quá khứ cộng với một yếu tố ngẫu nhiên. Rõ ràng với mô hình tự hồi quy, dữ liệu đã tự nó giải thích cho bản thân nó. Mô hình AR(p) có dạng như sau:

Y = μ + ϕ Y + ϕ Y +⋯+ ϕ Y +ε (1.3)

Trong đó: t là nhiễu trắng, ϕ ,ϕ ,ϕ là những thông số cần tìm, μ là hệ số chặn.

Mô hình AR(p) nếu nó là quá trình dừng đòi hỏi phương trình (1.3) phải có nghiệm nằm ngoài đĩa tròn đơn vị (−1 ≤ϕ ≤1). Nếu giá trị tuyệt đối ϕ > 1, Y sẽ có xu hướng càng ngày càng lớn và vì thế có thể trở thành một chuỗi gia tăng đột biến.

Các mô hình tự hồi quy chỉ phù hợp với các chuỗi dừng và hệ số μ thể hiện mức giá trị trung bình của chuỗi. Nếu dữ liệu dao động xung quanh giá trị 0 hoặc dạng sai phân thì không cần hệ số μ trong mô hình.

Vậy, làm cách nào ta xác định số độ trễ p? Lúc này giản đồ tương quan ngoài việc giúp ta nhận dạng một cách trực quan tính dừng của chuỗi thời gian tài chính còn giúp ta xây dựng mô hình hồi quy, cụ thể xác định p trong mô hình AR(p). Cách thức như sau: ACF sẽ có xu hướng bằng không ngay lập tức, trong khi đó, hệ số tự tương quan riêng phần PACF sẽ có xu hướng khác không một cách có ý nghĩa thống kê cho đến độ trễ p và sẽ bằng không ngay sau độ trễ p đó.

Mô hình AR(p) với ưu điểm là cho phép dự báo giá trị tương lai qua giá trị biến trễ với một yếu tố ngẫu nhiên mà không xét thêm biến vào mô hình hồi quy, nghĩa là tự dữ liệu giải thích cho bản thân nó. Nhược điểm của mô hình này chỉ thích hợp cho việc dự báo đối với những dữ liệu chuỗi thời gian tài chính có sự biến động không đột biến trong thời gian xem xét.

24

1.4.5. Mô hình trung bình trượt MA(q)

Trong một quá trình trung bình trượt bậc q, số liệu tại thời điểm hiện tại yt được tính bởi tổng trung bình có trọng số giá trị của các nhiễu ngẫu nhiên cho đến nhiễu thứ q. Mô hình MA(q) có dạng như sau:

= +θ ε + θ ε + . . . + θ ε (1.4)

Trong đó ε là số hạng nhiễu ngẫu nhiên; θ1, θ2 ..., θq là các hệ số ước lượng; ε là sai số ở giai đoạn t-1, ε là sai số ở giai đoạn t-q.

Điều này có nghĩa, giá trị Yt không chỉ phụ thuộc vào các thông tin hiện tạo mà còn phụ thuộc vào các thông tin trong quá khứ. Tuy nhiên, các thông tin gần nhất có ý nghĩa nhiều hơn thồn tin trước đó. Như vậy, các mô hình MA cung cấp giá trị dự báo của Yt trên cơ sở một kết hợp tuyến tính của các giá tri sai số quá khứ.

Điều kiện để thực hiện quá trình trung bình trượt này là thì phương trình (1.4) phải có nghiệm nằm ngoài đĩa tròn đơn vị (−1 ≤ ϕ≤ 1). Phương pháp bình quân được sử dụng trong các dự báo thống kê. Trên cơ sở xây dựng một dãy số bình quân, để xây dựng mô hình dự báo. Trong mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng các giá trị quá khứ và số hạng ngẫu nhiên hiện hành theo độ trễ.

Để xác định độ trễ q ta sử dụng giản đồ tương quan theo cách: ACF sẽ có xu hướng khác 0 một cách có ý nghĩa thống kê cho đến độ trễ q và sẽ bằng 0 ngay sau độ trễ q đó. Điều này có nghĩa rằng nếu chuỗi thời gian tài chính Yt là một chuỗi theo MA(2) thì các hệ số ACF1 và ACF2 có ý nghĩa thông kê, và các hệ số khác không có ý nghĩa thống kê. Trong khi đóm PACF sẽ có xu hướng bằng 0 ngay lập tức.

Mô hình MA(q) với ưu điểm xác định được những tác động của các cú sốc trong quá khứ và cả hiện tại. Bên cạnh ưu điểm, mô hình MA(q) có nhược điểm đó là mô hình chỉ thích hợp cho việc dự báo trong ngắn hạn.

25

1.4.6. Mô hình tự hồi quy và trung bình trượt ARMA(p,q)

Trên thực tế có những mô hình dự báo cho chuỗi thời gian tài chính là sự kết hợp đồng thời của quá trình trung bình trượt và tự hồi quy với bậc bất kì. Mô hình phối hợp trung bình trượt- tự hồi quy có dạng phương trình sau còn được gọi tổng quát là mô hình ARMA. Các mô hình ARMA chỉ có thể được thực hiện khi chuỗi Yt là chuỗi dừng.

= +ϕ Y + ϕ Y +⋯+ ϕ Y + θ ε + θ ε + … + θ ε + (1.5)

Nhận dạng mô hình ARMA(p,q) là tìm các giá trị thích hợp của p, q. Với p là bậc tự hồi quy và q là bậc trung bình trượt. Việc xác định p,q sẽ phụ thuộc vào đồ thị hàm tự tương quan. Với ACF là hệ số tự tương quan và PACF là hệ số tự hồi quy từng phần mẫu;

- Chọn mô hình AR(p) nếu đồ thị PACF có giá trị cao tại độ trễ 1,2,…,p và giảm nhiều sau p và dạng hàm ACF giảm dần. (adsbygoogle = window.adsbygoogle || []).push({});

- Chọn mô hình MA(q) nếu đồ thị ACF có giá trị cao tại các độ trễ 1,2,…,q và giảm nhiều sau q và dạng hàm PACF giảm dần.

Tóm lại:

Loại mô hình Dạng đồ thị ACF=f(t) Dạng đồ thị PACF=f(t)

AR(p) Giảm dần Có đỉnh ở p

MA(q) Có đỉnh ở q Giảm dần

ARIMA(p,q) Giảm dần Giảm dần

Mô hình ARMA(p,q) được sử dụng phổ biến để dự báo chuỗi thời gian tài chính với những ưu điểm như: Thứ nhất, mô hình giải thích được sự biến động của chuỗi thời gian tài chính bằng cách quan hệ với các giá trị quá khứ và tổng có trọng số các nhiễu ngẫu nhiên hiện hành và các nhiễu ngẫu nhiên có độ trễ nghĩa là mô hình hóa được gần như tất cả các dao động cuẩ chuỗi

26

thời gian tài chính ban đầu; Thứ hai, dự báo từ mô hình ARMA(p,q) có kết quả tương đối chính xác phù hợp với dự đoán trong ngắn hạn với sai số nhỏ. Bên cạnh những ưu điểm kể trên, mô hình có những nhược điểm như sau: mô

Một phần của tài liệu Luận văn thạc sĩ Vận dụng mô hình Arma - Garch trong dự báo chỉ số Vnidex (full) (Trang 25)