Dự báo quá trình ARIMA(p,d,q)

Một phần của tài liệu Mô hình Arima và ứng dụng (Trang 28)

5. Khái quát về nội dung và phạm vi nghiên cứu

2.1.5.4. Dự báo quá trình ARIMA(p,d,q)

Ta có:  1 1( ) 2( 2 ) ( 1 ) 1 1 2 2 t t t p t p Y     Y   Y   Y    u  u 1 q t qu      (2.14)  t t t u  Y Y

Giá trị dự báo thời kì s sẽ là:

 (Yt s )       1 2 1 2 1 1 1 2 1 2 ( ) ( ) ( ) + , ( ) ( ) ( ), t s t s p t s p s t s t q t s q t s t s p t s p Y Y Y u u u Y Y Y                                                       1, 2, , 1, 2, s q s q q        k k YY với k  t (2.15)

2.1.5.4. Dự báo quá trình ARIMA(p,d,q)

Yt là chuỗi tích hợp bậc d, tức là sai phân bậc d của Yt là quá trình dừng, đặtYt  d( )Yt ,p là bậc tự hồi quy của Yt và q là bậc trung bình trƣợt, khi đó chúng ta có mô hình ARIMA(p,d,q).

2 2 1 2 1 2 (1 p)( ) (1 q) p t q t L L L Y L L L u                  (2.16) (2.16) chính là mô hình ARMA(p,q) đối với chuỗi Yt (Barlett, 1946). Khi dự báo, ngƣời ta dự báo cho chuỗi Yt sau đó dự báo cho chuỗi Yt.

22 2.1.6. Kiểm định nghiệm đơn vị

Kiểm định nghiệm đơn vị là kiểm định quan trọng khi phân tích tính dừng của chuỗi thời gian. Bằng cách dùng kiểm định nghiệmđơn vị có thể kết luận chuỗi có tuân theo bƣớc ngẫu nhiên hay không dừng. Việc tìm ra kiểm nghiệm đơn vị là một trong các phát hiện quan trọng của kinh tế học hiện đại những năm 80 của thế kỷ 20. Với đề tài này em xin trình bày kiểm nghiệm Dickey-Fuller

Kiểm nghiệm Dickey-Fuller

Dickey-Fuller (1979) đã nghiên cứu quá trình AR(1):

1

t t t

Y Y u (2.17) trong đó Y0 là giá trị xác định hữu hạn, ut  IID.Nếu nhƣ  = 1, khi đó Yt là một bƣớc ngẫu nhiên. Yt là một chuỗi không dừng. Do đó để kiểm định tính dừng của Yt ta sẽ kiểm định giả thuyết:

0 : 1; 1: 1 H   H   (2.18) Ta biến đổi   Yt Yt Yt1  ( 1)Yt1ut. 1 . t t t YYu   

Bây giờ giả thuyết (1.11) tƣơng đƣơng với

0 : 0; 1: 0.

H   H   (2.19) Nếu H0 đƣợc chấp nhận thì:   Yt Yt Yt1 ut. Khi đó Yt là chuỗi dừng vì ut là IID.

Để tìm ra chuỗi Yt là dừng hay không dừng thì hoặc là sẽ ƣớc lƣợng (2.17) và kiểm định giả thuyết  0; hoặc là ƣớc lƣợng (1.12) và kiểm định giả thuyết  0. Trong cả hai mô hình này đều không dùng đƣợc tiêu chuẩn T (Student – test) ngay trong trƣờng hợp mẫu lớn vì Yt có thể là chuỗi không dừng. Dickey-Fuller (DF) đã đƣa ra tiêu chuẩn để kiểm định sau đây dựa trên phân phối giới hạn.

23

0

H : 1 (Chuỗi là không dừng)

1

H : 1 (Chuỗi dừng)

Ta ƣớc lƣợng mô hình (2.17),  ( 1) Se( ) có phân phối DF. Nếu nhƣ: ( 1) Se( )

       thì bác bỏ H0. Trong trƣờng hợp này chuỗi là chuỗi dừng.

Tiêu chuẩn DF đƣợc áp dụng cho các mô hình sau đây:

1 t t t YYu    (2.20) 1 1 t t t Y  Yu     (2.21) 1 2 1 t t t Y   tYu      (2.22)

Đối với các mô hình trên, giảthuyết cần kiểm định là: H0 : 0;

1: 0

H   (Chuỗi không dừng – hay nghiệm đơn vị)

Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới hạn của thống kê  

(  )nncó thể tìm đƣợc với giả thiết ut  IID và ngay cả trƣờng hợp ut là quá trình tự hồi quy.

Giả sử rằng Yt cho bởi (2.17) và (2.19); ut là quá trình dừng, tự hồi quy bậc q: 1 1 2 2 , t t t q t q t u u  u  u  (2.23) IID t   (2.22) sẽ có dạng: 1 2 1 1 1 2 2 t t t t q t q t Y   tY u  u  u          , (2.24) 1 t t t u  Y Y thay vào (2.24) đƣợc: 1 2 1 1( 1 2) 2( 2 3) ( 1) , t t t t t t q t q t q t Y   tY  YY  YY  YY              1 2 1 1 1 q t t i t t i Y   tY  Y          (2.25)

24

Tiêu chuẩn DF áp dụng cho (2.25) đƣợc gọi là tiêu chuẩn ADF (Augumented Dickey – Fuller).

2.1.7.Phƣơng pháp Box – Jenkins.

Mô hình ARIMA đƣợc sử dụng khá phổ biến trong dự báo ngắn hạn. Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo. Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn. ARIMA không thích hợp để dự báo chính sách. Mô hình ARIMA đôi khi đƣợc coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào.

Có hai phƣơng pháp cơ bản để đánh giá sự phù hợp của mô hình ARIMA để mô tả một chuỗi thời gian cho trƣớc: phƣơng pháp Box-jenkins và phƣơng pháp lựa chọn tổ hợp các tham số (p,q).

Box và Jenkins (1974) đã đƣa ra một tập hợp các bƣớc, các thủ tục ƣớc lƣợng mô hình ARIMA cho một chuỗi thời gian. Phƣơng pháp này đã trở nên phổ biến trong nhiều lĩnh vực: kinh tế, y thuật, kĩ thuật,… và đƣợc gọi là phƣơng pháp Box-Jenkins.

Phƣơng pháp Box-Jenkins gồm có 3 bƣớc: định dạng mô hình; ƣớc lƣợng các tham số và kiểm định. Ba bƣớc trên đƣợc lặp lại cho đến khi nào đƣợc một mô hình tốt.

2.1.7.1. Định dạng mô hình – xác định tham số p, d, q

Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc này rất khó khăn cả về lý thuyết và thực hành.

Để tìm đƣợc d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF hoặc ADF. Nếu chuỗi ban đầu không dừng, khi đó ta tính sai phân cấp I. Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận đƣợc, ta phải tìm các giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho

25

chuỗi dừng. Có rất nhiều phƣơng pháp để tìm đƣợc p và q. Không có phƣơng pháp nào là tối ƣu tuyệt đối.

a) Lược đồ tương quan và tự tương quan

Dùng lƣợc đồ tƣơng quan và tự tƣơng quan riêng là phƣơng pháp hiệu quả để xác định p và q. Lƣợc đồ vẽ ACF và PACF theo độ dài của trễ. Đồng thời cũng vẽ đƣờng phân giải chỉ khoảng tin cậy 95% cho giá trị bằng 0 của hệ sô tự tƣơng quan ( Bartlett, 1946) và hệ số tự tƣơng quan riêng (± 1,96/ n). Dựa trên các lƣợc đồ này ta biết đƣợc các hệ số tƣơng quan và các hệ số tự tƣơng quan riêng khác không với mức ý nghĩa 5%. Từ đó có thể đƣa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá trình AR(p) và MA(q).

Dokk đo mức độ kết hợp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hƣởng của Yt1,,Yt k 1 do đó nếu pp 0và kk 0 với k > p và i, i = 1, 2, …, giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p).

Nếu các ii, i = 1, 2, …, giảm dần theo hàm mũ hoặc hàm sin, q 0, 0

k

26

Bảng 1: Bậc p, q của ARIMA

Nhƣ vậy phƣơng pháp này Box-Jenkins tính toán các hệ số tƣơng quan mẫu SACF và hệ số tƣơng quan riêng mẫu SPACF, so sánh với các giá trị lý thuyết ACF và PACF. Nếu có sự phù hợp giữa chúng với nhau thì các tham số của mô hình sẽ đƣợc ƣớc lƣợng. Ƣu điểm chủ yếu của phƣơng pháp này là áp dụng một cách hệ thống các bƣớc trong quá trình xây dựng mô hình. Nhƣợc điểm của phƣơng pháp này là trong quá trình xem xét một

ARIMA AFC PAFC (p,d,0) Giảm dạng mũ hoặc giảm

hình sin

0

kk

  với k > p

(0,d,q) k 0với k > q Giảm dạng mũ hoặc giảm hình sin

(1,d,1) 1 0

Sau đó giảm dạng mũ hoặc hình sin

11 0

 

Sau đó giảm dạng mũ hoặc hình sin

(1,d,2)  1, 2 0

Sau đó giảm dạngmũ hoặc hình sin

11 0

 

Sau đó giảm dạng mũ hoặc hình sin

(2,d,1) 1  0

Sau đó giảm dạng mũ hoặc hình sin

11, 22 0

  

Sau đó giảm dạng mũ hoặc hình sin

(2,d,2)  1, 2 0

Sau đó giảm dạng mũ hoặc hình sin

11, 22 0

  

Sau đó giảm dạng mũ hoặc hình sin

27

cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính chủ quan.

b)Tiêu chuẩn Akaike, Schwarz

Phƣơng pháp Box-Jenkinslà phƣơng pháp phổ biến nhất. Bên cạnh đó ngƣời ta còn dùng một số phƣơng pháp khác, kết hợp nhiều phƣơng pháp khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã đƣợc xác định.

Một ý tƣởng là ngƣời ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số đƣợc cực tiểu vẫn đảm bảo sự phù hợp của mô hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phƣơng sai của phần dƣ.

Kí hiệu phần dƣ của mô hình ARMA(p,q) là e p qt( , ). Ƣớc lƣợng phƣơng sai của phần dƣ tƣơng ứng:

 , 1 1 ( , ) n p q t t e p q n     (2.26)

Nếu dựa vào phƣơng sai phần dƣ để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đƣa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đƣa vào số tham số bằng số quan sát, khi đó. Các phần dƣ sẽ bằng không, ƣớc lƣợng của phƣơng sai bằng không. Nhƣng mô hình nhƣ vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô hình có quá nhiều tham số sẽ không phù hợp với thực tế. Trƣờng hợp khác, nếu mô hình có quá ít tham số, hiển nhiên sẽ là không phù hợp.

28

Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phƣơng sai có những khiếm khuyết nhất định. Ngƣời ta sẽ đƣa ra một số tiêu chuẩn khác để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đƣa ra tiêu chuẩn thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh.

Akaike (1974) đề xuất tiêu chuẩn AIC (4):

2 ( , ) ln( ( , )) 2( ) AIC p q   p qpq n. 1 1 ( , ) min ( , ), , . AIC p qAIC p q pP qQ (2.27) Khi đó p1 và q1 là các giá trị thích hợp của p và q.

Số hạng đầu tiên trong AIC(p,q) đo độ phù hợp dựa vào phƣơng sai của sai số ƣớc lƣợng đƣợc. Số hạng thứ hai là mức phạt đối với mô hình với số hệ số lớn. Đƣa thêm số hạng thứ hai nhằm khắc phục tình trạng quá nhiều tham số. Tuy nhiên tiêu chuẩn này có thể đƣa ra số tham số nhiều hơn một so với tham số cực tiểu và nó phụ thuộc vào số liệu có phân bố chuẩn hay không. Bằng phƣơng pháp mô phỏng Monte Carlo, Ngƣời ta đã chỉ ra rằng tiêu chuẩn AIC có xu hƣớng dẫn đến quá nhiều tham số.

Schwarz (1978) đƣa ra một tiêu chuẩn BIC (Bayesian Information Criterion):

2

( , ) ln( ( , )) ( )ln( )

BIC p q   p qpq n n (2.28) Lƣợng phát trong (2.28) lớn hơn nên tiêu chuẩn Schwarz có xu hƣớng dẫn đến lựa chọn mô hình có tham số nhỏ hơn AIC.

Tiêu chuẩn AIC hiệu chỉnh AICC (Correctet Akaike Infomation Criterion):

2

( , ) ln( ( , )) 2( 1) ( 2)

AICC p q   p qp q n  p q (2.29) AICC hiệu chỉnh là ƣớc lƣợng chệch của AIC. AICC đƣợc dùng cho mẫu nhỏ. Khi kích thƣớc mẫu lớn thì hai tiêu chuẩn này là nhƣ nhau.

29

Trong hai tiêu chuẩn trên các tập P và Q đều chƣa biết. Hannan (1980) chỉ ra rằng nếu p0 và q0 là các giá trị đúng thì p1  p q0; 1 q0

Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne (1987) đƣa ra ý tƣởng về xây dựng một lớp mô hình. Cơ sở của quan niệm này là mặc dù p1 và q1 đã đƣợc xác định, nhƣng chƣa chắc đã là các giá trị thực của mô hình và cần phải xem xét thêm bằng các tiêu chuẩn khác đối với các giá trị lân cận của p1 và q1. Các tác giả trên đƣa ra:

1 1

1

exp( { ( , ) ( , )}) 2

R   n BIC p qBIC p q (2.30) Tremayne đề nghị rằng nếu R < 10 thì không đủ chứng cớ để loại bỏ mô hình đã chọn bằng thủ tục Akaike và thủ tục Schwarz. Nếu với những cặp (p,q) mà 1 R 10 thì các cặp này cần phải đƣợc xem xét nhƣ (p1,q1). Nhƣ vậy có thể có một lớp các mô hình ARMA(p,q) mà 1 R 10 cần phải cân nhắc thêm bằng các tiêu chuẩn khác.

Nếu gọi k là số tham số của mô hình, ta cókAICkAICCkBIC. BIC là ƣớc lƣợng vững. Nó sẽ cho xác định đƣợc khá chính xác các tham số của mô hình. Kết quả nhận đƣợc theo tiêu chuẩn này sẽ thỏa mãn AIC, AICC. Trên thực tế thƣờng ta chỉ có mẫu có kích thƣớc giói hạn, nên tính vững của ƣớc lƣợng ít có ý nghĩa.

c)Kiểm nghiệm nhân tử Lagrange (LM)

Kiểm định LM đƣợc sử dụng để kiểm định tự tƣơng quan, kiểm định giả thuyết về nhiều điều kiện ràng buộc đối với các hệ số hồi quy, mục này sẽ sử dụng kiểm định LM để kiểm định mô hình ARMA.

Giả thiết: H0: Dạng của mô hình ARMA(p,q). Giả thiết đối có hai dạng sau đây:

HA: Dạng của mô hình ARMA(p+r,q) HB: Dạng của mô hình ARMA(p,q+s)

30

Để kiểm định các cặp giả thiết trên, trƣớc hết phải ƣớc lƣợng mô hình ARMA(p,q) đối với chuỗi dừng Y*

t( Y*t – là chuỗi Yt nếu Ytlà chuỗi dừng. Nếu Yt không phải là chuỗi dừng thì Y*t sẽ là chuỗi sai phân tƣơng ứng). Từ kết quả thu đƣợc ta có các phần dƣ et.

 H0: Dạng của mô hình ARMA(p,q) HB: Dạng của mô hình ARMA (p+r,q).

Để kiểm định giả thiết này phải ƣớc lƣợng mô hình ARMA(p+r,q), tức là: 0 1 1 1 1 2 2 ... 1 1 t t t q t q t t p t p t p e   uuuY  Y  Y Y                 2Yt p 2 p t p rY t             (2.31)

Từ kết quả ƣớc lƣợng thu đƣợc R2, nếu(n p r R) 2  2( )r thì H0 bị bác bỏ.

 H0 : Dạng của mô hình ARMA(p,q) HA : Dạng của mô hình ARMA(p,q+s)

0 1 1 1 1 1 1 t t t q t q q t q t q s t q s t e   uuuuuY                  2Yt 2 p t pY t           (2.32) Từ kết quả ƣớc lƣợng thu đƣợcR2  2( )s thì H0 bị bác bỏ.

Ngoài tiêu chuẩn χ2 ở trên còn có thể dùng tiêu chuẩn F để kiểm định dựa trên mô hình hồi quy có điều kiện ràng buộc.

2.1.7.2. Ước lượng mô hình

Sau khi định dạng mô hình, ra biết đƣợc d-bậc của sai phân đối với chuỗi xuất phát để thu đƣợc một chuỗi dừng. Đối với chuỗi dừng này ta cũng đã biết các giá trị của p và q.

Vấn đề tiếp theo là ƣớc lƣợng các tham số vàcủa mô hình ARMA(p,q). Có một số phƣơng pháp để ƣớc lƣợng.

31

(a) Phƣơng pháp sử dụng các ƣớc lƣợng Yule-Walker trong các phƣơng trình YW. Dựa vào các SPACF và hệ phƣơng trình YW để tìm ra ƣớc lƣợng của quá trình AR. Đối với mô hình ARMA phƣơng trình YW cũng đƣợc sử dụng để ƣớc lƣợng các hệ số của AR. Các hệ số của quá trình MA đƣợc ƣớc lƣợng bằng cách khác.

(b) Phƣơng pháp OLS: Phƣơng pháp này ƣớc lƣợng các tham số bằng cực tiểu hóa tổng bình phƣơng các phần dƣ. Nếu chỉ có AR thì OLS dẫn đến các ƣớc lƣợng tuyến tính. Nếu có cả MA thì OLS dẫn đến ƣớc lƣợng phi tuyến và phải dùng các phƣơng pháp số.

Sử dụng các phƣơng trình YW hay phƣơng pháp OLS thƣờng chỉ để tính các giá trị ban đầu của các tham số dùng trong phƣơng pháp ƣớc lƣợng hợp lí cực đại.

(c) Phƣơng pháp ƣớc lƣợng hợp lý cực đại MLE (Svetlozar,Stefan,Frank, Sergio, Teo Jasi, 2007): Phƣơng pháp này cực đại hóa logarit hàm hợp lý gắn với mô hình đã định dạng. Để sử dụng đƣợc phƣơng pháp này phải có giả thiết về phân bố của yếu tố ngẫu nhiên. Thông thƣờng giả thiết: utN(0,2)

Sau đây sẽ trình bày phƣơng pháp MLE. Xét trƣờng hợp biến ngẫu nhiên ut có phân phối IID và hàm mật độ xác suất có dạng N(0,2).

0 1 1 2 2 1 1 ; t t t p t p t t q t q Y   Y  Y  Y  uu  u 2 (0, ); t uN  0 1 1 2 2 1 1 ; t t t t p t p t q t q u   Y  Y Y    Y u    u

Một phần của tài liệu Mô hình Arima và ứng dụng (Trang 28)

Tải bản đầy đủ (PDF)

(55 trang)