5. Khái quát về nội dung và phạm vi nghiên cứu
2.1.5.1. Dự báo quá trình AR(p )
Yt là quá trình tự hồi quy bậc p, Yt có dạng:
= ấ) + <№t-\ + ộỉ^t-2 + • • ■ + ộpX-p + ut ệi <h ■■■ ệp-1 ệp 1 0 0 ... 0 0 Đặt F = 0 0 0 0 0 0 0 ... 1 0 khi đó:
Кн, = f i + f . r ’fli-, - и ) + f,(f - и ) + - + - и ) + и„,
là phần tử (i,k) của Fj,
y/j được cho bởi phần tử ( 1,1 ) của FJ: у/j = fị ,0 ). Khi dự báo, các s ố hạng chứa u t+j được bỏ qua. Sai số dự báo là:
Y t+S - Y t + S = y /\U t+s^ + y / 2u t+s-2 + ••• + ¥ s - \ u t+\
Cách đơn giản nhất của dự báo là sử dụng phương pháp đệ quy:
Ỹt+\ - j u = ị { Y t - j u ) + ậ2Ợt-\ - / / ) + ... + ập(Yt. p+] - JLÌ), Ỹt+2 - { i = ệ](ỸÍ+1- j u ) + ậ2(rM - j u ) + ... + ộpỢt_p+2 - ju\
Y t+s - jU = ф \ ( Yг+л-1 - jlì) + (Ị)2( Уt+s-2 - j u ) + . . . + ệ p ( Y t + s - p - JU),
Y к =Yk với к <1 1. 2.1.5.2. Dự báo quá trình MA (q)
Yt là quá trình trung bình trượt bậc q, Yt có dạng:
Yf — fj. + иf + ỡ]Ut_] + . . . + Qqllt_q , t= 1 ,2,. . .n Hay (Yt - /j) = ut + 6\Ut_x+ ... + 9qut_q, t= l,2,.. .n
+ ¥ \ U t+s-\ + W l Ut+s-2 + • • • + ¥ s - \ Ut+\ » (2.8)
(Y! - j u ) = ạ + ỡịL + ... + eciư ) u ! (2.9)
Khi đó: Y /+.V — jU +---! 1 + ỡịL + ... + ỡaD— ----1— X
Ls
ut =(Yt - j u ) ~ 6ạit_A - 02ut_2 - . . . - 6qut_q. (2.12) Dự báo dài hơn q thời kì đơn giản chỉ là trung bình không điều kiện dàng buộc.
2. ỉ.5.3. Dự báo quá trình ARMA(p,q)
Ta xem xétquá trình dừng và khả nghịch ARMA(p,q):
(1 - - Ộ2Ũ - . ..ậpư ) Ợ t - j u ) = ạ + 6XL + ỡ2L2 + ... + 0qư ) u t (2.13)
Ta có:
? ,+ ! - // = <h (Y, - ụ) + 2 -jU) + ... + ệp(Y,_p+l - ụ ) + Ớ,M| + вги2
+... + equ,_q+ì (2.14)
U , = Y , - Ỹ ,
Giá trị dự báo thời kì s sẽ là:
(Ỹr+s - j u ) =
Ф\(У t+s -1 - ỊLl) + Ф2 (Y t+.V-2 - fù) + ... + Ф P(Ỷ t+s - p - JU)
+ 6SU, + 0s+ỉUl+] + ... + Ỡ(fut+ỵ-q, 5 = 1, 2,..., Ợ
- ju) + ệ 2(Ỹ,„ - 2- n ) + ... + ậ p( Ỹ , » - r - Ị j ) , s = q + \,q + % -
Ỹk = Yk với к < t (2.15)
2. ỉ.5.4. Dự báo quá trình ARIMA(p,d,q)
Yt là chuỗi tích họp bậc d, tức là sai phân bậc d của Yt là quá trình dừng, đặt 17 = Aư(^ ),p là bậc tự hồi quy của Y* và q là bậc trung bình trượt, khi đó chúng ta có mô hình ARIMA(p,d,q).
(1 - (Ị\L - ф21} - . . . - ệpư)(Y* - //) = (1 + 9ịL + 62I} + ... + ỡqU)ut (2.16) (2.16) chính là mô hình ARMA(p,q) đối với chuỗi Y* (Barlett, 1946). Khi dự báo, người ta dự báo cho chuỗi Y* sau đó dự báo cho chuỗi Yt.
2.1.6. Kiểm định nghiệm đơn vị
Kiểm định nghiệm đơn vị là kiểm định quan trọng khi phân tích tính dừng của chuỗi thời gian. Bằng cách dùng kiểm định nghiệmđơn vị có thể kết luận chuỗi có tuân theo bước ngẫu nhiên hay không dừng. Việc tìm ra kiểm nghiệm đơn vị là một trong các phát hiện quan trọng của kinh tế học hiện đại những năm 80 của thế kỷ 20. Với đề tài này em xin trình bày kiếm nghiệm Dickey-Fuller
Kiểm nghiệm Dickey-Fuller
Dickey-Fuller (1979) đã nghiên cún quá trình AR(1):
Yt =ệYt^ + u , (2.17)
trong đó Y() là giá trị xác định hữu hạn, u t ~ KD.Neu như ộ = 1, khi đó Yt là một bước ngẫu nhiên. Yt là một chuỗi không dừng. Do đó để kiểm định tính dừng của Yt ta sẽ kiếm định giả thuyết:
H 0 :0 = l; //, : ộ < \ (2.18)
Ta biến đổi AYt =Yt - = (ệ - 1 )rM + ur AYt = SYt_ị + ur
Bây giờ giả thuyết (1.11) tương đương với
H 0 : ổ = 0; H x : ổ < 0 . (2.19)
Nếu H() được chấp nhận thì: AYt =Yt — Yt_i = u,. Khi đó AYt là chuỗi dừng vì ut là IID.
Đe tìm ra chuỗi Yt là dừng hay không dừng thì hoặc là sẽ ước lượng (2.17) và kiếm định giả thuyết ^ = 0; hoặc là ước lượng (1.12) và kiểm định giả thuyết ổ = 0. Trong cả hai mô hình này đều không dùng được tiêu chuẩn T (Student - test) ngay trong trường hợp mẫu lớn vì Yt có thể là chuỗi không dừng. Dickey-Fuller (DF) đã đưa ra tiêu chuấn đế kiếm định sau đây dựa trên phân phối giới hạn.
H(): ệ = 1 (Chuỗi là không dừng) Hị : ệ < 1 (Chuỗi dừng)
Ta ước lượng mô hình (2.17), T = (ộ - X ) Ị S e { ệ)có phân phối DF. Nếu như: T = {ộ-X)/ Se (ệ) >\ra \ thì bác bỏ H(). Trong trường hợp này chuỗi là chuỗi dừng.
Tiêu chuẩn DF được áp dụng cho các mô hình sau đây:
AYt =ỔY[_] +ut (2.20)
A Y ' = A + Ổ Y ^ + u , (2 .2 1 )
A Y t = f i + p 2t + Ổ V ^ + u t (2 .2 2 )
Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 : ổ = 0;
Hị : s < 0 (Chuỗi không dừng - hay nghiệm đơn vị)
Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới hạn của thống kê (ổ - ô)n = ổn có thể tìm được với giả thiết u t ~ IID và ngay cả trường hợp ut là quá trình tự hồi quy.
Giả sử rằng Yt cho bởi (2.17) và (2.19); ut là quá trình dừng, tự hồi quy bậc q:
Uf — ỡ \U f_ ị + 0 2 U t-2 + • •. "I" Ỡc/U f_c/ + Sị , (2 .2 3 )
s, ~ IID (2.22) sẽ có dạng:
AY t = f t \ + + S Y t_ị + 0 \U f_ ị + Ớ 2 ^ t- 2 ^ q ^ t - q •> (2 .2 4 )
u, =Yt - thay vào (2.24) được:
A7, = Ị3X + Í32t + ÔYt_x + 3 (F,_, - Yt_2) + 02Ợt_2 - Yt_,) + ... + 0q(Ỵt_q - Yt_q_,) + A Y' = /?, + p 2t + SYt_, + Ỳ , a iầYt-\ +£t (2-25)
Tiêu chuẩn DF áp dụng cho (2.25) được gọi là tiêu chuẩn ADF (Augumented Dickey - Fuller).
2.1.7.Phương pháp Box - Jenkins.
Mô hình ARIMA được sử dụng khá phổ biến trong dự báo ngắn hạn. Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo. Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn. ARIMA không thích hợp để dự báo chính sách. Mô hình ARIMA đôi khi được coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào.
Có hai phương pháp cơ bản để đánh giá sự phù họp của mô hình AR1MA để mô tả một chuỗi thời gian cho trước: phương pháp Box-jenkins và phương pháp lựa chọn tổ họp các tham số (p,q).
Box và Jenkins (1974) đã đưa ra một tập họp các bước, các thủ tục ước lượng mô hình ARIMA cho một chuỗi thời gian. Phương pháp này đã trở nên phổ biến trong nhiều lĩnh vực: kinh tế, y thuật, kĩ thuật,... và được gọi là phương pháp Box-Jenkins.
Phương pháp Box-Jenkins gồm có 3 bước: định dạng mô hình; ước lượng các tham số và kiểm định. Ba bước trên được lặp lại cho đến khi nào được một mô hình tốt.
2.1.7.1. Định dạng mô hình - xác định tham số p, d, CỊ
Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc này 1'ất khó khăn cả về lý thuyết và thực hành.
Đe tìm được d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF hoặc ADF. Neu chuỗi ban đầu không dừng, khi đó ta tính sai phân cap I. Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận được, ta phải tìm các giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho
chuỗi dừng. Có rất nhiều phương pháp để tìm được p và q. Không có phương pháp nào là tối ưu tuyệt đối.
a) Lược đồ tương quan và tự tưong quan
Dùng lược đồ tương quan và tự tương quan riêng là phương pháp hiệu quả đế xác định p và q. Lược đồ vẽ ACF và PACF theo độ dài của trễ. Đồng thời cũng vẽ đường phân giải chỉ khoảng tin cậy 95% cho giá trị bằng 0 của hệ sô tự tương quan ( Bartlett, 1946) và hệ số tự tương quan riêng (+ 1,96/Vĩĩ). Dựa trên các lược đồ này ta biết được các hệ số tương quan và các hệ số tự tương quan riêng khác không với mức ý nghĩa 5%. Từ đó có thể đưa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá trình AR(p) và MA(q).
Do p kk đo mức độ kết họp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hưởng của .,Yt_k+ị do đó nếu Ppp ф 0 và p kk = 0 với к > p và yơ,, i = l , 2 , . . . , giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p).
Neu các p u, i = 1, 2, giảm dần theo hàm mũ hoặc hàm sin, p q Ф 0,
Bảng 1: Bậc p, q của ARIMA
ARIMA AFC PAFC
(p,d,0) Giảm dạng mũ hoặc giảm hình sin
Pkk = 0 với k > p
(0,d,q) p k =0 với k > q Giảm dạng mũ hoặc giảm hình sin
(l,d ,l) P\ = 0
Sau đó giảm dạng mũ hoặc hình sin
P\\ ^ 0
Sau đó giảm dạng mũ hoặc hình sin
(l,d ,2) Pi,p 2* 0
Sau đó giảm dạngmũ hoặc hình sin
P\\ ^ 0
Sau đó giảm dạng mũ hoặc hình sin
(2,d,l) P ị * 0
Sau đó giảm dạng mũ hoặc hình sin
P\1 > P22 ^ 0
Sau đó giảm dạng mũ hoặc hình sin
(2,d,2) P\,P1* 0
Sau đó giảm dạng mũ hoặc hình sin
P\15P22 ^ 0
Sau đó giảm dạng mũ hoặc hình sin
Như vậy phương pháp này Box-Jenkins tính toán các hệ số tương quan mẫu SACF và hệ số tương quan riêng mẫu SPACF, so sánh với các giá trị lý thuyết ACF và PACF. Neu có sự phù họp giữa chúng với nhau thì các tham số của mô hình sẽ được ước lượng. Ưu điểm chủ yếu của phương pháp này là áp dụng một cách hệ thống các bước trong quá trình xây dựng mô hình. Nhược điểm của phương pháp này là trong quá trình xem xét một
cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính chủ quan.
b)Tỉêu chuân Akaike, Schwarz
Phương pháp Вох-Jenkinslà phương pháp phổ biến nhất. Bên cạnh đó người ta còn dùng một số phương pháp khác, kết hợp nhiều phương pháp khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã được xác định.
Một ý tưởng là người ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số được cực tiểu vẫn đảm bảo sự phù họp của mô hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phương sai của phần dư.
Kí hiệu phần dư của mô hình ARMA(p,q) là et(p,q)- Ước lượng phương sai của phần dư tương ứng:
_ 1 " ~
o-p,q = - Y e t ( p , q ) ( 2 . 2 6 )
Neu dựa vào phương sai phần dư để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đưa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đưa vào số tham số bằng số quan sát, khi đó. Các phần dư sẽ bằng không, ước lượng của phương sai bằng không. Nhung mô hình như vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô hình có quá nhiều tham số sẽ không phù họp với thực tế. Trường hợp khác, nếu mô hình có quá ít tham số, hiến nhiên sẽ là không phù họp.
Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phương sai có những khiếm khuyết nhất định. Người ta sẽ đưa ra một số tiêu chuẩn khác để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đưa ra tiêu chuẩn thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh.
Akaike (1974) đề xuất tiêu chuẩn AIC (4):
- 2
AIC(p,q) = ln(<T (p,q)) + 2 (p + q ) l n .
AIC(pị,q{) = m inA I C ( p , q \ p &P,q<EQ. (2.27)
Khi đó Pi và qi là các giá trị thích hợp của p và q.
Số hạng đầu tiên trong AIC(p,q) đo độ phù họp dựa vào phương sai của sai số ước lượng được, số hạng thứ hai là mức phạt đối với mô hình với số hệ số lớn. Đưa thêm số hạng thứ hai nhằm khắc phục tình trạng quá nhiều tham số. Tuy nhiên tiêu chuẩn này có thể đưa ra số tham số nhiều hơn một so với tham số cực tiểu và nó phụ thuộc vào số liệu có phân bố chuẩn hay không. Bằng phương pháp mô phỏng Monte Carlo, Người ta đã chỉ ra rằng tiêu chuẩn AIC có xu hướng dẫn đến quá nhiều tham số.
Schwarz (1978) đưa ra một tiêu chuẩn BIC (Bayesian Information Criterion):
BIC(p,q) = ln(<7 (p,q)) + (p + q)\n(n)/n (2.28)
Lượng phát trong (2.28) lớn hơn nên tiêu chuẩn Schwarz có xu hướng dẫn đến lựa chọn mô hình có tham số nhỏ hơn AIC.
Tiêu chuẩn AIC hiệu chỉnh AICC (Correctet Akaike Infomation Criterion):
A IC C (p,q) = ln(<T (p,q)) + 2 ( p + q + ì ) / ( n - p - q - 2 ) (2.29)
AICC hiệu chỉnh là ước lượng chệch của AIC. AICC được dùng cho mẫu nhỏ. Khi kích thước mẫu lớn thì hai tiêu chuẩn này là như nhau.
Trong hai tiêu chuẩn trên các tập p và Q đều chưa biết. Hannan (1980)
chỉ ra rằng nếu po và q0 là các giá trị đúng thì Pị > p ữ',ch > q{)
Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne (1987) đưa ra ý tưởng về xây dựng một lóp mô hình. Cơ sở của quan niệm
này là mặc dù Pi và qi đã được xác định, nhưng chưa chắc đã là các giá trị
thực của mô hình và cần phải xem xét thêm bằng các tiêu chuẩn khác đối với các giá trị lân cận của pi và qi. Các tác giả trên đưa ra:
R = exp( - ị n { B I C ( Pl,qi) - BlC (p ,q))) (2.30) Tremayne đề nghị rằng nếu R < 10 thì không đủ chứng cớ để loại bỏ mô hình đã chọn bằng thủ tục Akaike và thủ tục Schwarz. Neu với những cặp (p,q) mà 1 < R < VTÕ thì các cặp này cần phải được xem xét như (pi,qi). Như vậy có thể có một lóp các mô hình ARMA(p,q) mà
1 < R < ^/ĨÕ cần phải cân nhắc thêm bằng các tiêu chuẩn khác.
Neu gọi k là số tham số của mô hình, ta cókAỊC > kAICC > kfíIc. BIC là ước lượng vững. Nó sẽ cho xác định được khá chính xác các tham số của mô hình. Ket quả nhận được theo tiêu chuẩn này sẽ thỏa mãn AIC, AICC. Trên thực tế thường ta chỉ có mẫu có kích thước giói hạn, nên tính vững của ước lượng ít có ý nghĩa.
c)Kiềm nghiêm nhân tử Lagrange (LM)
Kiểm định LM được sử dụng để kiểm định tự tương quan, kiểm định giả thuyết về nhiều điều kiện ràng buộc đối với các hệ số hồi quy, mục này sẽ sử dụng kiểm định LM để kiểm định mô hình ARMA.
Giả thiết: H(): Dạng của mô hình ARMA(p,q). Giả thiết đối có hai dạng sau đây:
HA: Dạng của mô hình ARMA(p+r,q) HB: Dạng của mô hình ARMA(p,q+s)
Đẻ kiểm định các cặp giả thiết trên, trước hết phải ước lượng mô hình ARMA(p,q) đối với chuỗi dừng Y*t( Y*t - là chuỗi Yt nếu Ytlà chuỗi dừng. Nếu Yt không phải là chuỗi dừng thì Y*t sẽ là chuỗi sai phân tương ứng). Từ kết quả thu được ta có các phần dư et.
• H(): Dạng của mô hình ARMA(p,q) HB: Dạng của mô hình ARMA (p+r,q).
Đe kiểm định giả thiết này phải ước lượng mô hình ARMA(p+r,q), tức là:
e t = 6 + Oữu t + Oxu t_x + . . . + ỡ qu t_q + ậ ị Y * _ ị + ệ 2y,-2 + — + ộ p V - p + Ộ Ỵ t - p - \
+ệ2Yt-p-2 + • • • + ệpYt-p-r + £t (2.31)
Từ kết quả ước lượng thu được R2, nếu(77 — p — r)R2 > zl(r) thì H() bị bác bỏ.
• H(): Dạng của mô hình ARMA(p,q) HA : Dạng của mô hình ARMA(p,q+s)
et = ỡ + ỡ()ut + Ỡ\U,_\ +. . . + ỡ(/u{_c/ + ỡq+ìut_q+ị +. . . + Pt+q+sut_q_s + ệ\Yt-\
+ộ2y;_2 + . . . + ộ p y;_p + £ị (2 .3 2 )
Từ kết quả ước lượng thu được/?2 > x l ( s ) thì H() bị bác bỏ.
Ngoài tiêu chuẩn X2 ở trên còn có thể dùng tiêu chuẩn F để kiểm định dựa trên mô hình hồi quy có điều kiện ràng buộc.
2.1.7.2. ước lượng mô hình
Sau khi định dạng mô hình, ra biết được d-bậc của sai phân đối với chuỗi xuất phát để thu được một chuỗi dừng. Đối với chuỗi dừng này ta cũng đã biết các giá trị của p và q.
Vấn đề tiếp theo là ước lượng các tham so ệ và 0 của mô hình ARMA(p,q). Có một số phương pháp để ước lượng.
(a) Phương pháp sử dụng các ước lượng Yule-Walker trong các phương trình YW. Dựa vào các SPACF và hệ phương trình YW để tìm ra ước lượng của quá trình AR. Đối với mô hình ARMA phương trình YW cũng được sử dụng để ước lượng các hệ số của AR. Các hệ số của quá trình MA được ước lượng bằng cách khác.
(b) Phương pháp OLS: Phương pháp này ước lượng các tham số bằng cực tiểu hóa tổng bình phương các phần dư. Nếu chỉ có AR thì OLS dẫn đến các ước lượng tuyến tính. Neu có cả MA thì OLS dẫn đến ước lượng phi tuyến và phải dùng các phương pháp số.
Sừ dụng các phương trình YW hay phương pháp OLS thường chỉ để tính các giá trị ban đầu của các tham số dùng trong phương pháp ước lượng hợp lí cực đại.
(c) Phương pháp ước lượng họp lý cực đại MLE (Svetlozar,Stefan,Frank, Sergio, Teo Jasi, 2007): Phương pháp này cực đại hóa logarit hàm hợp lý gắn với mô hình đã định dạng. Đe sử dụng được phương pháp này phải có giả thiết về phân bố của yếu tố ngẫu nhiên. Thông thường giả thiết: Uf ~ N ( 0 , ơ 2)