Quá trình trung bình trượt tự hồi quy ARMA

Một phần của tài liệu Khoá luận tốt nghiệp mô hình arima và ứng dụng (Trang 25)

5. Khái quát về nội dung và phạm vi nghiên cứu

2.1.3.Quá trình trung bình trượt tự hồi quy ARMA

Cơ chế sản sinh ra Y không chỉ là AR hoặc MA mà có thể kết họp cả hai yếu tố này. Khi kết hợp cả hai yếu tố, mô hình được gọi là mô hình trung bình trượt tích họp tự hồi quy ARMA. Yt là quá trình ARMA(1,1) nếu Y có thể biểu diễn dưới dạng:

trong đó: ut là nhiễu trắng.

Tổng quát, Yt là quá trình ARMA(p,q) nếu Y có biểu diễn dưới dạng:

Yt - 6 + ộ ỵ t_x + ỡ0ut + 6xỉit_x

2.1.4.Quá trình trung bình trượt, tích họp tự hồi quy ARIMA

Một chuỗi thời gian có thể dừng hoặc không dừng. Chuỗi không dừng được gọi là tích hợp bậc 1, được kí hiệu là 1(1), nếu sai phân bậc nhất là chuỗi dừng. Chuỗi được gọi là tích họp bậc d, nếu sai phân bậc d là chuỗi dừng, ký hiệu là I(d). Neu d = 0 thì chuỗi xuất phát là chuỗi dừng.

Neu chuỗi Yt tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi sai phân bậc d thì có quá trình ARIMA(p,d,q). Trong ARIMA(p,d,q), d là số lần lấy sai phân chuỗi Yt để được một chuỗi dừng, p là bậc tự hồi quy, q là bậc trung bình trượt, p và q là bậc tương ứng của chuỗi dừng.

AR(p) là trường họp đặc biệt của ARIMA(p,d,q) với d = 0, q = 0. MA(q) là trường hợp đặc biệt của ARIMA(p,d,q) với d = 0 và p =0.

ARIMA(2,1,2) - nghĩa là chuỗi Yt có sai phân bậc 1 là chuỗi dừng, chuỗi sai phân dừng này có thể biễu diễn dưới dạng ARMA(2,2):

AYt = 6 + ộịAYt_ị + ^A y,_2 + 0{)ut + ỡ\Ut_ị + 6 2ut _ 2

trong đó ut là nhiễu trắng.

Như vậy nếu biết các tham số p, q, d khi đó ta có thể mô hình hóa được chuỗi. Vấn đề đặt ra là xác định p, q, d và các tham số 8 , ộ .

2.1.5. Dự báo

2.1.5.1. Dự báo quá trình AR(p)

Yt là quá trình tự hồi quy bậc p, Yt có dạng:

= ấ) + <№t-\ + ộỉ^t-2 + • • ■ + ộpX-p + ut ệi <h ■■■ ệp-1 ệp 1 0 0 ... 0 0 Đặt F = 0 0 0 0 0 0 0 ... 1 0 khi đó:

Кн, = f i + f . r ’fli-, - и ) + f,(f - и ) + - + - и ) + и„,

là phần tử (i,k) của Fj,

y/j được cho bởi phần tử ( 1,1 ) của FJ: у/j = fị ,0 ). Khi dự báo, các s ố hạng chứa u t+j được bỏ qua. Sai số dự báo là:

Y t+S - Y t + S = y /\U t+s^ + y / 2u t+s-2 + ••• + ¥ s - \ u t+\

Cách đơn giản nhất của dự báo là sử dụng phương pháp đệ quy:

Ỹt+\ - j u = ị { Y t - j u ) + ậ2Ợt-\ - / / ) + ... + ập(Yt. p+] - JLÌ), Ỹt+2 - { i = ệ](ỸÍ+1- j u ) + ậ2(rM - j u ) + ... + ộpỢt_p+2 - ju\

Y t+s - jU = ф \ ( Yг+л-1 - jlì) + (Ị)2( Уt+s-2 - j u ) + . . . + ệ p ( Y t + s - p - JU),

Y к =Yk với к <1 1. 2.1.5.2. Dự báo quá trình MA (q)

Yt là quá trình trung bình trượt bậc q, Yt có dạng:

Yffj. + иf + ỡ]Ut_] + . . . + Qqllt_q , t= 1 ,2,. . .n Hay (Yt - /j) = ut + 6\Ut_x+ ... + 9qut_q, t= l,2,.. .n

+ ¥ \ U t+s-\ + W l Ut+s-2 + • • • + ¥ s - \ Ut+\ » (2.8)

(Y! - j u ) = ạ + ỡịL + ... + eciư ) u ! (2.9)

Khi đó: Y /+.V — jU +---! 1 + ỡịL + ... + ỡaD— ----1— X

Ls

ut =(Yt - j u ) ~ 6ạit_A - 02ut_2 - . . . - 6qut_q. (2.12) Dự báo dài hơn q thời kì đơn giản chỉ là trung bình không điều kiện dàng buộc. (adsbygoogle = window.adsbygoogle || []).push({});

2. ỉ.5.3. Dự báo quá trình ARMA(p,q)

Ta xem xétquá trình dừng và khả nghịch ARMA(p,q):

(1 - - Ộ2Ũ - . ..ậpư ) Ợ t - j u ) = ạ + 6XL + ỡ2L2 + ... + 0qư ) u t (2.13)

Ta có:

? ,+ ! - // = <h (Y, - ụ) + 2 -jU) + ... + ệp(Y,_p+l - ụ ) + Ớ,M| + вги2

+... + equ,_q+ì (2.14)

U , = Y , - Ỹ ,

Giá trị dự báo thời kì s sẽ là:

(Ỹr+s - j u ) =

Ф\(У t+s -1 - ỊLl) + Ф2 (Y t+.V-2 - fù) + ... + Ф P(Ỷ t+s - p - JU)

+ 6SU, + 0s+ỉUl+] + ... + Ỡ(fut+ỵ-q, 5 = 1, 2,..., Ợ

- ju) + ệ 2(Ỹ,„ - 2- n ) + ... + ậ p( Ỹ , » - r - Ị j ) , s = q + \,q + % -

Ỹk = Yk với к < t (2.15)

2. ỉ.5.4. Dự báo quá trình ARIMA(p,d,q)

Yt là chuỗi tích họp bậc d, tức là sai phân bậc d của Yt là quá trình dừng, đặt 17 = Aư(^ ),p là bậc tự hồi quy của Y* và q là bậc trung bình trượt, khi đó chúng ta có mô hình ARIMA(p,d,q).

(1 - (Ị\L - ф21} - . . . - ệpư)(Y* - //) = (1 + 9ịL + 62I} + ... + ỡqU)ut (2.16) (2.16) chính là mô hình ARMA(p,q) đối với chuỗi Y* (Barlett, 1946). Khi dự báo, người ta dự báo cho chuỗi Y* sau đó dự báo cho chuỗi Yt.

2.1.6. Kiểm định nghiệm đơn vị

Kiểm định nghiệm đơn vị là kiểm định quan trọng khi phân tích tính dừng của chuỗi thời gian. Bằng cách dùng kiểm định nghiệmđơn vị có thể kết luận chuỗi có tuân theo bước ngẫu nhiên hay không dừng. Việc tìm ra kiểm nghiệm đơn vị là một trong các phát hiện quan trọng của kinh tế học hiện đại những năm 80 của thế kỷ 20. Với đề tài này em xin trình bày kiếm nghiệm Dickey-Fuller

Kiểm nghiệm Dickey-Fuller

Dickey-Fuller (1979) đã nghiên cún quá trình AR(1):

Yt =ệYt^ + u , (2.17)

trong đó Y() là giá trị xác định hữu hạn, u t ~ KD.Neu như = 1, khi đó Yt là một bước ngẫu nhiên. Yt là một chuỗi không dừng. Do đó để kiểm định tính dừng của Yt ta sẽ kiếm định giả thuyết:

H 0 :0 = l; //, : ộ < \ (2.18)

Ta biến đổi AYt =Yt - = (ệ - 1 )rM + ur AYt = SYt_ị + ur

Bây giờ giả thuyết (1.11) tương đương với

H 0 : ổ = 0; H x : ổ < 0 . (2.19)

Nếu H() được chấp nhận thì: AYt =Yt — Yt_i = u,. Khi đó AYt là chuỗi dừng vì ut là IID.

Đe tìm ra chuỗi Yt là dừng hay không dừng thì hoặc là sẽ ước lượng (2.17) và kiếm định giả thuyết ^ = 0; hoặc là ước lượng (1.12) và kiểm định giả thuyết ổ = 0. Trong cả hai mô hình này đều không dùng được tiêu chuẩn T (Student - test) ngay trong trường hợp mẫu lớn vì Yt có thể là chuỗi không dừng. Dickey-Fuller (DF) đã đưa ra tiêu chuấn đế kiếm định sau đây dựa trên phân phối giới hạn.

H(): = 1 (Chuỗi là không dừng) Hị : ệ < 1 (Chuỗi dừng)

Ta ước lượng mô hình (2.17), T = (ộ - X ) Ị S e { ệ)có phân phối DF. Nếu như: T = {ộ-X)/ Se (ệ) >\ra \ thì bác bỏ H(). Trong trường hợp này chuỗi là chuỗi dừng. (adsbygoogle = window.adsbygoogle || []).push({});

Tiêu chuẩn DF được áp dụng cho các mô hình sau đây:

AYt =ỔY[_] +ut (2.20)

A Y ' = A + Ổ Y ^ + u , (2 .2 1 )

A Y t = f i + p 2t + Ổ V ^ + u t (2 .2 2 )

Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 : = 0;

Hị : s < 0 (Chuỗi không dừng - hay nghiệm đơn vị)

Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới hạn của thống kê (ổ - ô)n = ổn có thể tìm được với giả thiết u t ~ IID và ngay cả trường hợp ut là quá trình tự hồi quy.

Giả sử rằng Yt cho bởi (2.17) và (2.19); ut là quá trình dừng, tự hồi quy bậc q:

Ufỡ \U f_ ị + 0 2 U t-2 + • •. "I" Ỡc/U f_c/ + Sị , (2 .2 3 )

s, ~ IID (2.22) sẽ có dạng:

AY t = f t \ + + S Y t_ị + 0 \U f_ ị + Ớ 2 ^ t- 2 ^ q ^ t - q •> (2 .2 4 )

u, =Yt - thay vào (2.24) được:

A7, = Ị3X + Í32t + ÔYt_x + 3 (F,_, - Yt_2) + 02Ợt_2 - Yt_,) + ... + 0q(Ỵt_q - Yt_q_,) + A Y' = /?, + p 2t + SYt_, + Ỳ , a iầYt-\ +£t (2-25)

Tiêu chuẩn DF áp dụng cho (2.25) được gọi là tiêu chuẩn ADF (Augumented Dickey - Fuller).

2.1.7.Phương pháp Box - Jenkins.

Mô hình ARIMA được sử dụng khá phổ biến trong dự báo ngắn hạn. Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo. Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn. ARIMA không thích hợp để dự báo chính sách. Mô hình ARIMA đôi khi được coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào.

Có hai phương pháp cơ bản để đánh giá sự phù họp của mô hình AR1MA để mô tả một chuỗi thời gian cho trước: phương pháp Box-jenkins và phương pháp lựa chọn tổ họp các tham số (p,q).

Box và Jenkins (1974) đã đưa ra một tập họp các bước, các thủ tục ước lượng mô hình ARIMA cho một chuỗi thời gian. Phương pháp này đã trở nên phổ biến trong nhiều lĩnh vực: kinh tế, y thuật, kĩ thuật,... và được gọi là phương pháp Box-Jenkins.

Phương pháp Box-Jenkins gồm có 3 bước: định dạng mô hình; ước lượng các tham số và kiểm định. Ba bước trên được lặp lại cho đến khi nào được một mô hình tốt.

2.1.7.1. Định dạng mô hình - xác định tham số p, d, CỊ

Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc này 1'ất khó khăn cả về lý thuyết và thực hành.

Đe tìm được d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF hoặc ADF. Neu chuỗi ban đầu không dừng, khi đó ta tính sai phân cap I. Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận được, ta phải tìm các giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho

chuỗi dừng. Có rất nhiều phương pháp để tìm được p và q. Không có phương pháp nào là tối ưu tuyệt đối.

a) Lược đồ tương quan và tự tưong quan

Dùng lược đồ tương quan và tự tương quan riêng là phương pháp hiệu quả đế xác định p và q. Lược đồ vẽ ACF và PACF theo độ dài của trễ. Đồng thời cũng vẽ đường phân giải chỉ khoảng tin cậy 95% cho giá trị bằng 0 của hệ sô tự tương quan ( Bartlett, 1946) và hệ số tự tương quan riêng (+ 1,96/Vĩĩ). Dựa trên các lược đồ này ta biết được các hệ số tương quan và các hệ số tự tương quan riêng khác không với mức ý nghĩa 5%. Từ đó có thể đưa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá trình AR(p) và MA(q).

Do p kk đo mức độ kết họp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hưởng của .,Yt_k+ị do đó nếu Ppp ф 0 và p kk = 0 với к > p và yơ,, i = l , 2 , . . . , giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p).

Neu các p u, i = 1, 2, giảm dần theo hàm mũ hoặc hàm sin, p q Ф 0,

Bảng 1: Bậc p, q của ARIMA

ARIMA AFC PAFC

(p,d,0) Giảm dạng mũ hoặc giảm hình sin (adsbygoogle = window.adsbygoogle || []).push({});

Pkk = 0 với k > p

(0,d,q) p k =0 với k > q Giảm dạng mũ hoặc giảm hình sin

(l,d ,l) P\ = 0

Sau đó giảm dạng mũ hoặc hình sin

P\\ ^ 0

Sau đó giảm dạng mũ hoặc hình sin

(l,d ,2) Pi,p 2* 0

Sau đó giảm dạngmũ hoặc hình sin

P\\ ^ 0

Sau đó giảm dạng mũ hoặc hình sin

(2,d,l) P ị * 0

Sau đó giảm dạng mũ hoặc hình sin

P\1 > P22 ^ 0

Sau đó giảm dạng mũ hoặc hình sin

(2,d,2) P\,P1* 0

Sau đó giảm dạng mũ hoặc hình sin

P\15P22 ^ 0

Sau đó giảm dạng mũ hoặc hình sin

Như vậy phương pháp này Box-Jenkins tính toán các hệ số tương quan mẫu SACF và hệ số tương quan riêng mẫu SPACF, so sánh với các giá trị lý thuyết ACF và PACF. Neu có sự phù họp giữa chúng với nhau thì các tham số của mô hình sẽ được ước lượng. Ưu điểm chủ yếu của phương pháp này là áp dụng một cách hệ thống các bước trong quá trình xây dựng mô hình. Nhược điểm của phương pháp này là trong quá trình xem xét một

cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính chủ quan.

b)Tỉêu chuân Akaike, Schwarz

Phương pháp Вох-Jenkinslà phương pháp phổ biến nhất. Bên cạnh đó người ta còn dùng một số phương pháp khác, kết hợp nhiều phương pháp khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã được xác định.

Một ý tưởng là người ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số được cực tiểu vẫn đảm bảo sự phù họp của mô hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phương sai của phần dư.

Kí hiệu phần dư của mô hình ARMA(p,q) là et(p,q)- Ước lượng phương sai của phần dư tương ứng:

_ 1 " ~

o-p,q = - Y e t ( p , q ) ( 2 . 2 6 )

Neu dựa vào phương sai phần dư để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đưa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đưa vào số tham số bằng số quan sát, khi đó. Các phần dư sẽ bằng không, ước lượng của phương sai bằng không. Nhung mô hình như vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô hình có quá nhiều tham số sẽ không phù họp với thực tế. Trường hợp khác, nếu mô hình có quá ít tham số, hiến nhiên sẽ là không phù họp.

Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phương sai có những khiếm khuyết nhất định. Người ta sẽ đưa ra một số tiêu chuẩn khác để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đưa ra tiêu chuẩn thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh.

Akaike (1974) đề xuất tiêu chuẩn AIC (4):

- 2 (adsbygoogle = window.adsbygoogle || []).push({});

AIC(p,q) = ln(<T (p,q)) + 2 (p + q ) l n .

AIC(pị,q{) = m inA I C ( p , q \ p &P,q<EQ. (2.27)

Khi đó Pi và qi là các giá trị thích hợp của p và q.

Số hạng đầu tiên trong AIC(p,q) đo độ phù họp dựa vào phương sai của sai số ước lượng được, số hạng thứ hai là mức phạt đối với mô hình với số hệ số lớn. Đưa thêm số hạng thứ hai nhằm khắc phục tình trạng quá nhiều tham số. Tuy nhiên tiêu chuẩn này có thể đưa ra số tham số nhiều hơn một so với tham số cực tiểu và nó phụ thuộc vào số liệu có phân bố chuẩn hay không. Bằng phương pháp mô phỏng Monte Carlo, Người ta đã chỉ ra rằng tiêu chuẩn AIC có xu hướng dẫn đến quá nhiều tham số.

Schwarz (1978) đưa ra một tiêu chuẩn BIC (Bayesian Information Criterion):

BIC(p,q) = ln(<7 (p,q)) + (p + q)\n(n)/n (2.28)

Lượng phát trong (2.28) lớn hơn nên tiêu chuẩn Schwarz có xu hướng dẫn đến lựa chọn mô hình có tham số nhỏ hơn AIC.

Tiêu chuẩn AIC hiệu chỉnh AICC (Correctet Akaike Infomation Criterion):

A IC C (p,q) = ln(<T (p,q)) + 2 ( p + q + ì ) / ( n - p - q - 2 ) (2.29)

AICC hiệu chỉnh là ước lượng chệch của AIC. AICC được dùng cho mẫu nhỏ. Khi kích thước mẫu lớn thì hai tiêu chuẩn này là như nhau.

Trong hai tiêu chuẩn trên các tập p và Q đều chưa biết. Hannan (1980)

chỉ ra rằng nếu po và q0 là các giá trị đúng thì Pị > p ữ',ch > q{)

Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne (1987) đưa ra ý tưởng về xây dựng một lóp mô hình. Cơ sở của quan niệm

này là mặc dù Pi và qi đã được xác định, nhưng chưa chắc đã là các giá trị

thực của mô hình và cần phải xem xét thêm bằng các tiêu chuẩn khác đối với các giá trị lân cận của pi và qi. Các tác giả trên đưa ra:

R = exp( - ị n { B I C ( Pl,qi) - BlC (p ,q))) (2.30) Tremayne đề nghị rằng nếu R < 10 thì không đủ chứng cớ để loại bỏ mô hình đã chọn bằng thủ tục Akaike và thủ tục Schwarz. Neu với những cặp (p,q) mà 1 < R < VTÕ thì các cặp này cần phải được xem xét như (pi,qi). Như vậy có thể có một lóp các mô hình ARMA(p,q) mà

1 < R < ^/ĨÕ cần phải cân nhắc thêm bằng các tiêu chuẩn khác.

Neu gọi k là số tham số của mô hình, ta cókAỊC > kAICC > kfíIc. BIC là ước lượng vững. Nó sẽ cho xác định được khá chính xác các tham số của mô hình. Ket quả nhận được theo tiêu chuẩn này sẽ thỏa mãn AIC, AICC. Trên thực tế thường ta chỉ có mẫu có kích thước giói hạn, nên tính vững của ước lượng ít có ý nghĩa.

c)Kiềm nghiêm nhân tử Lagrange (LM)

Kiểm định LM được sử dụng để kiểm định tự tương quan, kiểm định giả thuyết về nhiều điều kiện ràng buộc đối với các hệ số hồi quy, mục này sẽ sử dụng kiểm định LM để kiểm định mô hình ARMA.

Giả thiết: H(): Dạng của mô hình ARMA(p,q). Giả thiết đối có hai dạng sau đây:

HA: Dạng của mô hình ARMA(p+r,q) HB: Dạng của mô hình ARMA(p,q+s)

Đẻ kiểm định các cặp giả thiết trên, trước hết phải ước lượng mô hình ARMA(p,q) đối với chuỗi dừng Y*t( Y*t - là chuỗi Yt nếu Ytlà chuỗi dừng. Nếu Yt không phải là chuỗi dừng thì Y*t sẽ là chuỗi sai phân tương ứng). Từ kết quả thu được ta có các phần dư et.

• H(): Dạng của mô hình ARMA(p,q) HB: Dạng của mô hình ARMA (p+r,q).

Đe kiểm định giả thiết này phải ước lượng mô hình ARMA(p+r,q), tức là:

e t = 6 + Oữu t + Oxu t_x + . . . + ỡ qu t_q + ậ ị Y * _ ị + ệ 2y,-2 + — + ộ p V - p + Ộ Ỵ t - p - \

+ệ2Yt-p-2 + • • • + ệpYt-p-r + £t (2.31)

Từ kết quả ước lượng thu được R2, nếu(77 — p — r)R2 > zl(r) thì H() bị bác bỏ.

• H(): Dạng của mô hình ARMA(p,q)

(adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu Khoá luận tốt nghiệp mô hình arima và ứng dụng (Trang 25)