Ướclượng mô hình

Một phần của tài liệu Khoá luận tốt nghiệp mô hình arima và ứng dụng (Trang 37)

5. Khái quát về nội dung và phạm vi nghiên cứu

2.1.7.2.Ướclượng mô hình

Sau khi định dạng mô hình, ra biết được d-bậc của sai phân đối với chuỗi xuất phát để thu được một chuỗi dừng. Đối với chuỗi dừng này ta cũng đã biết các giá trị của p và q.

Vấn đề tiếp theo là ước lượng các tham so ệ0 của mô hình ARMA(p,q). Có một số phương pháp để ước lượng.

(a) Phương pháp sử dụng các ước lượng Yule-Walker trong các phương trình YW. Dựa vào các SPACF và hệ phương trình YW để tìm ra ước lượng của quá trình AR. Đối với mô hình ARMA phương trình YW cũng được sử dụng để ước lượng các hệ số của AR. Các hệ số của quá trình MA được ước lượng bằng cách khác.

(b) Phương pháp OLS: Phương pháp này ước lượng các tham số bằng cực tiểu hóa tổng bình phương các phần dư. Nếu chỉ có AR thì OLS dẫn đến các ước lượng tuyến tính. Neu có cả MA thì OLS dẫn đến ước lượng phi tuyến và phải dùng các phương pháp số.

Sừ dụng các phương trình YW hay phương pháp OLS thường chỉ để tính các giá trị ban đầu của các tham số dùng trong phương pháp ước lượng hợp lí cực đại.

(c) Phương pháp ước lượng họp lý cực đại MLE (Svetlozar,Stefan,Frank, Sergio, Teo Jasi, 2007): Phương pháp này cực đại hóa logarit hàm hợp lý gắn với mô hình đã định dạng. Đe sử dụng được phương pháp này phải có giả thiết về phân bố của yếu tố ngẫu nhiên. Thông thường giả thiết: Uf ~ N ( 0 , ơ 2)

Sau đây sẽ trình bày phương pháp MLE. Xét trường họp biến ngẫu nhiên ut có phân phối IID và hàm mật độ xác suất có dạng N ( 0 , ơ 2) .

Y t - ộữ + ộ y t- \ + ậ ĩ Ỵ t - 2 + • • • + ệ p Y t- p + u t + #1W/-1 + ■ • • + @cỊU t-c i

u, ~ yV(0,<T2);

Ut = Y t - á ) - Ộ\Y,- 1 - ộ lY,- 2 - • • • - ệ p Y, - p - 6 \U t-x - . . . - 0 qu ,_ q \

í{ut) = (2;z-)“1/2 exp(-w,2/2). (2.33)

Ký hiệu T là kích thước của mẫu sau khi bỏ đi các quan sát không có do các yếu tố trễ của AR và MA; et là các phần dư, khi đó logarit cơ số e của hàm hợp lý có dạng:

In L(d, ơ2, Yt) = - ĩ- \n(2x) - ^ ln(ơ-2) - ^ ự ớ = ụ>ữ, ệ ị,ậ 2,. .. ,ậ p,0\,02,...,6^)

(2.34)

e , = Y , - ị 0 - ệ X - 1 - № , - 2 - ■ ■ ■ - ị P Y , - p - Ớie,-1 - . . . - ớ,e,_,

Quá trình ước lượng sẽ được thực hiện theo phương pháp lặp, quá trình sẽ kết thúc khi chênh lệch ước lượng các hệ số giữa hai bước kế tiếp nhau không đáng kể.

2. ỉ. 7.3. Kiêm định tính thích hợp của mô hình

Giả thiết cơ bản trong mô hình ARIMA là yếu tố ngẫu nhiên ur phần không giải thích được của Yt với các thông tin đã biết trong quá khứ Yt-1 , Yt_2 và ut_i, ut_2 -không có giải thích (đầy đủ hay từng phần) hoặc dự báo từ các thông tin trong quá khứ. về mặt toán học có nghĩa là ut là nhiễu trắng. Do đó cần phải kiểm định giả thiết “ut là nhiễu trắng”, tức là:

Vẽ lược đồ tương quan SACF và SPACF cho phần dư. Nếu SACF và SPACF không có thành phần có ý nghĩa thống kê thì ut tương tự’ với nhiễu trắng. Khi đó mô hình là chấp nhận được. Trường hợp ngược lại - có phần tử có ý nghĩa thống kê - thì phần dư có chứa những thông tin mà mô hình chưa tách ra khỏi số liệu được, hay trong phần dư còn thông tin.

Có một số kiểm định khác dựa vào hệ số tương quan của các phần dư. Kiểm định được ưa thích là kiểm định Khi bình phương dựa trên thống kê Q của Box-Pierce-BP (1970).

H„ : A,, = A,2 = • • ■ = p s.t =0; H , : có ít nhất p s i =0

p ị là hệ số tự tương quan mẫ bậc i của phần dư;n là kích thước mẫu. k được chọn đủ lớn sao cho ảnh hưởng của hệ số tự tương quan bậc cao có thể được bỏ qua, các hệ số này được giả thiết là dần tới không. Trên thực tế có thể tính Q với một vài giá trị của k. Neu ut là nhiễu trắng thì Q có phân bố tiệm cận ỵ 2 với bậc tự do (k-q-p). Tính toán giá trị Q, so sánh với giá trị tới hạn. Neu giá trị của Q lớn hơn giá trị tới hạn thì bác bỏ giả thuyết H() về phần dư không tương quan.

Q chỉ có phân bố tiệm cận Khi bình phương, cho nên trong trường họp mẫu nhỏ, phân bố của Q có thể hoàn toàn khác Khi bình phương. Trong trường hợp mẫu nhỏ, thống kê Ljung-Box (1978) phù hợp hơn:

Q* = n(n + 2 - i ) p 2£i (2.36)

( = 1

Q* có phân bố Khi bình phương, k bậc tự do.

Tuy nhiên nếu kích thước mẫu là quá nhỏ, tiêu chuẩn LB có mức tin cậy thấp, có thể không phát hiện ra sai lầm định dạng của mô hình.

Hai tiêu chuẩn trên chỉ kiếm định không có tự tương quan của các phần dư mà không phải kiểm định sự độc lập. Granger và Anderson đã đưa ra một số thí dụ trong đó các phần dư không tương quan trong khi bình phương phần dư lại tương quan có ý nghĩa thống kê.

McLeod và Li đã kiểm định giả thuyết:

H o'-Pị.l = P ị l = - - - = PỈ-.t = ữ’

Qz = n(n + 2 ) ^ ( í ĩ - i ) p 2cĩj. (2.37) (adsbygoogle = window.adsbygoogle || []).push({});

/=1

— 2

Trong đó ps2k là hệ sô tự tương quan mâu bậc k của bình phương phần dư.

Một tiêu chuẩn khác dựa vào hệ số tương quan riêng của bình phương phần dư:

p e2A là bình phương hệ số tương quan riêng bậc i của phần dư. Qm có phân bố tiệm cận Khi bình phương với (k-p-q) bậc tự do. Các kết quả mô phỏng của Monti (1994) chỉ ra rằng Qm phù hợp trong trường họp mẫu nhỏ.

Kiểm định tính phân bố chuẩn (Jarque, Bera, 1980)

Phương pháp MLE được sử dụng với giả thiết ut có phân bố IID, trong các phần trên ta giả thiết rằng ut có phân bố chuẩn hóa. Bây giờ ta phải kiểm định giả thiết này. Người ta sử dụng kiểm định Jarque-Bera (JB). Do phân bố chuẩn là đối xứng hình chuông, nên momen cấp ba phải bằng không và momen cấp bốn //4 = 3 a 2, ơ 2 = Var(ut) .

Độ đo của mô mem cấp ba hay hệ số bất đối xứng s (Skewness) của các phần dư được tính:

Ước lượng Momen cấp bốn hay hệ số nhọn K:

trong đó: n là kích thước mẫu, ơ - ước lượng của ơ .

Với giả thiết ut phân bố chuẩn, khi đó s và K có phân bố tiệm cận chuẩn, trung bình bằng không và phương sai bằng 6/n và 8/(3n) tương ứng với Jarque-Bera kiểm định giả thiết:

' •> ỊẦ LÌ^

H0: UL có phân bố chuấn hay —I = 0 và —Ị - 3 = 0.

(2.38)

(2.39)

11 í 3 Y

Thống kê m ẫuẪị = -^3 có phân bố tiệm cậnỵ 2{\)

6 Í=1 V cr / n / 4 Ло = ^ 4 “ 3 có phân bố tiệm cận J 2( l) . 24 ,=1 ^ ơ ) Ầ — Ẫị + Ấỵ — - i + 1 n í 4 _ L ỷ94 [|!__3—4 í=i V СГ .2 Л (2.41) có phân bố tiệm cận ^f2(2) .

Neu với một mẫu cụ thể, Ằ > ỵ ị {2) thì H() bị bác bỏ.

2.1.7.4. Dự báo và sai số dự báo

Giả sử số liệu quan sát đến thời kỳ n(t) được thu thập dưới dạng tập họp thông tin It = {Yr :t < t ) . c ần dự báo giá trị trong tương lai ở thời kỳ h(t+h), Yt+h.

Giả sử đã ước lượng được đường hôi quy mẫu Y t (giả thiêt Yt là dừng, tức là ta đã có ARMA(p,q). Giá trị trong tương lai Y t+h tính tại thời điểm t, dựa vào đường Yt ký hiệu là Yt (h) .

Có ba giá trị cần phải tính toán (Schwarz, 1978): -Giá trị Yt(h)

-Sai số dự báo

-Phương sai của sai số dự báo.

E,(Yl+h) = E ( Y , J I , ) = E(Yl+h/Yl_l,Y,_2,...) (2.42)

ƯỚC lượng của Y t+h là Yt(h). Yt(h) cần phải có sai số dự báo bình phương trung bình (MSE) đạt cực tiểu:

MSE{Ỹtm = E[(Ỵt+h- Ỹ tm 2

= E[(Yt+h - Et(Yt+h) + Et(Yt+h) - Ỹ t(h)2]

Khai triển biểu thức trên dễ dàng nhận thấy (adsbygoogle = window.adsbygoogle || []).push({});

E[(Yt+h - E'(Yt+h))(Et(Yt+h) - Y t(h)2)]=0

do Yt+h- E tỢt+h) chỉ phụ thuộc vào ut+]ĩul+2,...,ut+hĩ E'(Yt+h - Ỹ(h)) chỉ

phụ thuộc vào Yt, YM,...

Khi đó MSE(Ỹr(h)) = E(Yt+h - Et(Ỵt+h) f + E(E,(Yt+h) - Ỹr(h))2

= MSE(Et(Yt+h) + E(Et(Yt+h) - Ỹt{ h ) f

Nếu Ỹt(h) = Et(Yt+h) thì MSE(Ỹt(h)) đạt cực tiểu, ^ ( ỉ ^ l à ước

lượng tốt nhất theo nghĩa có sai số bình phương trung bình cực tiểu.

Dự báo tuyến tính tốt nhất:

Bây giờ ta sẽ tìm dự báo tuyến tính với Yt,Yt-i,.., và ut, Un,... đã biết. Giả sử rằng Yt là chuỗi dừng và khả nghịch, ta có:

Yn k= t2-44)

i=0

00

trong đó { y/ị} là chuỗi các hằng số thỏa mãn ^ \ ụ / t; I < 00.

i=0

Dự báo Yt{h) là tuyến tính và chỉ sử dụng các thông tin Yt,Yt-i,...

00

hoặc các ut, ta có Yt(h) = ^ ụ / ■u,_j. Ta ước lượng các trọng sôụ/.

7=0 sao cho cự tiểu MSE(Ỹt(h)):

MSE(Ỹ,(h)) = E[(Yt+h - Ỹt(h))2] = - Ỵ ỹ ị U . - i ì 1 i=0 j=0 = - ý ^ K - ỳ ) 2] /=0 7=0 = Y y ỉ ® ' + - ỹ j ) & 2 (2.45) i=0 ý=0

MSE(Yt(h)) đạt cực tiêu với ịự . = ụ/j+h.

Dự báo với sai số bình phương trung bình cực tiếu của Y t+h là:

EtỢt+h) = Ỹt{h\

00 00

(2.46)

j=0 j=h

Sai số dự báo ở bước h là: et(h) = Yt+h - E'((Yt ))

i=0 j=h (2.47) /=0 h- 1 _ Var(e,(/í)) = = MSE(Y,(h)) (2.48) i=0 CÓ bốn chú ý:

- Var(e,(/z)) = —h~*B >ỵ0 = Var(Yt), tức là phương sai dự báo ở bước h sẽ dần đến phương sai không điều kiện của Yt khi h —» 00.

- Các ộị^Oị và ^ đ ư ợ c tính đệ quy nên Y t{h) (2.46) được sử dụng cho dự báo nếu tất cả các u t-i , i=0, i=l,... Trừ khi mô hình chỉ có MA, u t-i , i=0,l,...q là đủ để ước lượng.

- Đối với t =1,2,... tìm ut từ: (adsbygoogle = window.adsbygoogle || []).push({});

Các giá trị ban đầu làY^Y.! ...,Ỵ p v à80,8.!,... Đối với mô hình dừng và khả nghịch, th ì^ y — ■/~>ao >0. Do đó trong (2.47) có thể bỏ q u a đ ố i với j đủ lớn.

P

- Thay cho tổng vô hạn (2.47) có thể sử dụng phép đệ quy ARMA cho dự báo: Ỹ,(h) = ỵ íị Ỹ , ( h - i ) + ỵ íd ie , ( h - j ) ,»1=1,2,...

/=0 j=0

trong đó: Ỹt(h-i)=Yt+h_i , i > h ;

Dự báo khoảng:

Yt{h) nói ở trên là dự báo điểm cho Yt+h. cần phải tìm khoảng tin cậy

cho giá trị dự báo. Trước hết giả thiết rằng mô hình ước lượng vẫn đúng trong tương lai.

Do dự báo Yt{h) là tốt hợp tuyến tính của các nhiễu ut, phân bố của

Y,(h)vầ sai số dự báo et(h) được xác định bởi phân bố của ut. Giả thiết

rằng:

Ta có et(h) ~ N ( . Tuy nhiên et(h), h=l,2,.„ không độc lập.

u, ~ (ĨĨD)N(0,ơ2) (2.49)

h- 1

Phân bố của sai số được chuẩn hóa là:

(2.50)

' € (h) € (h)

Khoảng tin cậy đôi xứng(1 - a ) cho -«,_«/2 < < «i-a/2

Hay

Khoảng trên được gọi là khoảng dự báo(l - a Ỵ 100% bước h. Độ dài của khoảng sai số dự báo tăng khi h tăng vìcr(/z) tăng theo h.

2.2. ứng dụng mô hình ARIMA dự báo chỉ số VNINDEX.

Tại thị trường Việt Nam chỉsố VNINDEX phản ánh rủi 1*0 hệ thống vì vậy việc dự báo sự tăng giảm của chỉ số VNINDEX cũng đồng thời giúp các nhà đầu tư nhận biết chiều hướng biến động giá của các cổ phiếu trên thị trường này.

2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX

Nguồn số liệu được lấy tù’ trang web C0phieu68.vn. Một trang web tin cậy chuyên cung cấp số liệu về thị trường chúng khoán Việt Nam.

Dữ liệu dc lấy là giá đóng của của mỗi phiên giao dịch VNINDEX từ ngày 02/01/2013 đến ngày 20/04/1015 bao gồm 567 số liệu.

Trong Eviews vẽ đồ thị của chuỗi VNINDEX bằng lệnh: View -> Graph -> Line and sỉmbol:

V N IN D E X

Hình 1: Đồ thị chuỗi VNINDEX

Tiến hành kiểm nghiệm đơn vị cho chuỗi VNINDEX: Trong Eviews từ chuỗi VNINDEX chọn View -> Unit root test trong mục test stype

chọn kiểu kiểm nghiệm ADF ta có kết quả cho bởi hình 2: (adsbygoogle = window.adsbygoogle || []).push({});

Augmented Dickey-Fuller Unit Root Test on VNINDEX

Null Hypothesis: VNINDEX has a unit root Exogenous: Constant

Lag Length: 0 (Automatic based on SIC, MAXU\G=24)

t-Statistic Prob*

AugmentedDickey-Fullerteststatistic_____________-2.4Ũ9436 0.1395

Test critical values: 1% level -3.441674

5% level -2.866428

10% level -2.569433

t i i . . 1 Si.m - - . . <A n n n . . . . . ; . 1 . .1 . . . . . I . . . .

Hình 2: Kiểm định ADF cho chuỗi VNINDEX

Theo kiểm định ADF ta thấy T . = 2,409436 <1T I tại cả 3 mức ý nghĩa oc= 1%, 5%, 10%. Vậy chuỗi VNINDEX chưa dừng.

Đe khắc phục tính dừng ta lấy sai phân bậc nhất bằng cách gõ: genr dVNINDEX = d(VNINDEX) và tiến hành kiểm định ADF như với chuỗi gốc , kết quả thể hiện trong hình 3:

Augmented Dickey-Fuller Unit Root Test on DVNINDEX

Null Hypothesis: DVNINDEX has a unit root Exogenous: Constant

Lag Length: 0 (Automatic based on SIC, MAXU\G=•24)

t-Statistic Prob*

Auqmented Dickey-Fuller test statistic -23.00151 0.0000

Test critical values: 1% level

5% level 10% level

-3.441695 -2.866437 -2.569437 *MacKinnon (1996) one-sided p-values.

Hình 3: Kiểm định ADF cho chuỗi DVNINDEX

Tiếp đó thực hiện tính toán các hệ số tự tương quan và tự tương quan riêng của chuỗi sai phân và quan sát các biểu đồ tự tương quan, tự tương quan riêng. Thực hiện trong Eviews như sau: View -> correlogram và chọn 30 thời kỳ trễ. Ta được như hình 4:

Sample: 1 567

Included observations: 566

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

1|I 1|I 1 0.031 0.031 0.5368 0.464 1]' 11' 2 0.061 0.060 2.6356 0.268 13 1: 3 0.105 0.102 8.8940 0.031 c 1 t 1 4 -0.069 -0.079 11.583 0.021 1 1 1 1 5 0.003 -0.005 11.588 0.041 ||1 ( 1 6 -0.Ũ65 -0.069 14.042 0.029 1]| 1I 7 0.058 0.079 15.944 0.026 1|I 1|I 8 0.030 0.029 16.465 0.036 : 1 [ 1 9 -0.099 -0.098 22.138 0.008 1|I 1 1 10 0.040 0.019 23.057 0.011 1 1 1 1 11 -0.0 22 -0.0 10 23.342 0.016 1 1 1 1 12 -0.019 0.001 23.552 0.023 1 ] 1 1 13 0.088 0.082 28.003 0.009 1 1 1 1 14 -0.001 -0.0 00 28.003 0.014 1 1 I| 1 15 -0.016 -0.045 28.149 0.021 I|1 I| 1 16 -0.036 -0.039 28.888 0.025 1 1 1|I 17 0.007 0.027 28.919 0.0 35 |[ 1 |[ 1 18 -0.0 62 -0 .0 6 2 31.170 0.028 'ỉ 1 I| 1 19 -0.Ũ66 -0 .0 43 33.695 0.020 1 ]| 1 |I 20 0.041 0.031 34.691 0.0 22 I| 1 I| 1 21 -0.Ũ49 -0 .0 43 36.103 0.021 I| 1 1 1 22 -0.0 39 -0 .0 2 2 36.980 0.024 1 |I 1 |I 23 0.02 9 0.02 8 37 .478 0.02 9 I| 1 I| 1 24 -0.0 36 -0.0 34 38.258 0. 033 I| 1 |[ 1 25 -0.0 49 -0.0 56 39.670 0. 032 1 1 1 || 26 0.01 3 0.02 6 39.771 0.041 1 1 1 1 27 0.01 4 0.0 09 39.891 0.0 52 I| 1 I| 1 28 -0.0 39 -0 .0 42 40.787 0.056 1 1 1 1 29 -0.0 19 - 0.0 04 41.000 0.069 1 |I 1 1 30 0.03 6 0.021 41.799 0.074

Hình 4: Đồ thị của hàm ACF và PACF của chuỗi DVNINDEX Theo đồ thị ở hình 4, tại độ trễ k=3 AC và PAC đạt cực đại sau đó giảm mạnh xuống và đồ thị có xu hướng nằm gọn trong hai đường giới hạn. Do đó p và q có thế nhận các giá trị là 3. Mô hình ARIMA có thế có là ARIMA (3,1,3)

2.2.2. ư ớc lượng các tham số của mô hình

Trong phần mềm Eviews các bước thực hiện ước lượng tham số của mô hình ARIMA như sau:

=>Trên thanh menu chọnQuick -> Estỉmate Equatỉon. (adsbygoogle = window.adsbygoogle || []).push({});

=>Nhập các thông số cần ước lượng vào mục Equatỉon Speccifícation.

4

Hình 5: Các thông số cho mô hình ARIMA(3,1,3)

=>Chọn phương pháp bình phương tối thiếu ta thu được kết quả ước lượng như sau:

Equation Estimation I s ^ - J

Specification Options Equation specification

Dependent variable followed by list of regressors including ARMA

and PDL termSj OR an explicit equation like Y=c(l)+c(2)*X. d(VNINDEX) AR(3) MA(3)

Estimation settings

Method LS - Least Squares (NL5 and ARMA) Sample: 1 567

OK Cancel

DependentVariable: D(VNINDEX) Method: Least Squares

Date: 05/03/15 Time: 15:16 Sample (adjusted): 5 567

Included observations: 563 after adjustments Convergence achieved after 22 iterations MA Backcast: 2 4

Variable Coefficient std. Error t-Statistic Prob.

AR(3) MA(3) -0.766126 0.820957 0.127991 0.113142 -5.985763 7.255966 0.0 0 0 0 0.0 0 0 0 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.012504 0.010744 5.677766 18084.97 -1775.543 1.939138

Mean dependent var S.D. dependentvar Aka ike info criterion Schwarz criterion Hannan-Quinn criter. 0.232327 5.708515 6.314539 6.329932 6.320548 Inverted AR Roots Inverted MA Roots 46+.79Ỉ 47-81 i

Một phần của tài liệu Khoá luận tốt nghiệp mô hình arima và ứng dụng (Trang 37)