Định dạng mô hình – xác định tham số p,d,q

Một phần của tài liệu Mô hình Arima và ứng dụng (Trang 31)

5. Khái quát về nội dung và phạm vi nghiên cứu

2.1.7.1. Định dạng mô hình – xác định tham số p,d,q

Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc này rất khó khăn cả về lý thuyết và thực hành.

Để tìm đƣợc d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF hoặc ADF. Nếu chuỗi ban đầu không dừng, khi đó ta tính sai phân cấp I. Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận đƣợc, ta phải tìm các giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho

25

chuỗi dừng. Có rất nhiều phƣơng pháp để tìm đƣợc p và q. Không có phƣơng pháp nào là tối ƣu tuyệt đối.

a) Lược đồ tương quan và tự tương quan

Dùng lƣợc đồ tƣơng quan và tự tƣơng quan riêng là phƣơng pháp hiệu quả để xác định p và q. Lƣợc đồ vẽ ACF và PACF theo độ dài của trễ. Đồng thời cũng vẽ đƣờng phân giải chỉ khoảng tin cậy 95% cho giá trị bằng 0 của hệ sô tự tƣơng quan ( Bartlett, 1946) và hệ số tự tƣơng quan riêng (± 1,96/ n). Dựa trên các lƣợc đồ này ta biết đƣợc các hệ số tƣơng quan và các hệ số tự tƣơng quan riêng khác không với mức ý nghĩa 5%. Từ đó có thể đƣa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá trình AR(p) và MA(q).

Dokk đo mức độ kết hợp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hƣởng của Yt1,,Yt k 1 do đó nếu pp 0và kk 0 với k > p và i, i = 1, 2, …, giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p).

Nếu các ii, i = 1, 2, …, giảm dần theo hàm mũ hoặc hàm sin, q 0, 0

k

26

Bảng 1: Bậc p, q của ARIMA

Nhƣ vậy phƣơng pháp này Box-Jenkins tính toán các hệ số tƣơng quan mẫu SACF và hệ số tƣơng quan riêng mẫu SPACF, so sánh với các giá trị lý thuyết ACF và PACF. Nếu có sự phù hợp giữa chúng với nhau thì các tham số của mô hình sẽ đƣợc ƣớc lƣợng. Ƣu điểm chủ yếu của phƣơng pháp này là áp dụng một cách hệ thống các bƣớc trong quá trình xây dựng mô hình. Nhƣợc điểm của phƣơng pháp này là trong quá trình xem xét một

ARIMA AFC PAFC (p,d,0) Giảm dạng mũ hoặc giảm

hình sin

0

kk

  với k > p

(0,d,q) k 0với k > q Giảm dạng mũ hoặc giảm hình sin

(1,d,1) 1 0

Sau đó giảm dạng mũ hoặc hình sin

11 0

 

Sau đó giảm dạng mũ hoặc hình sin

(1,d,2)  1, 2 0

Sau đó giảm dạngmũ hoặc hình sin

11 0

 

Sau đó giảm dạng mũ hoặc hình sin

(2,d,1) 1  0

Sau đó giảm dạng mũ hoặc hình sin

11, 22 0

  

Sau đó giảm dạng mũ hoặc hình sin

(2,d,2)  1, 2 0

Sau đó giảm dạng mũ hoặc hình sin

11, 22 0

  

Sau đó giảm dạng mũ hoặc hình sin

27

cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính chủ quan.

b)Tiêu chuẩn Akaike, Schwarz

Phƣơng pháp Box-Jenkinslà phƣơng pháp phổ biến nhất. Bên cạnh đó ngƣời ta còn dùng một số phƣơng pháp khác, kết hợp nhiều phƣơng pháp khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã đƣợc xác định.

Một ý tƣởng là ngƣời ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số đƣợc cực tiểu vẫn đảm bảo sự phù hợp của mô hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phƣơng sai của phần dƣ.

Kí hiệu phần dƣ của mô hình ARMA(p,q) là e p qt( , ). Ƣớc lƣợng phƣơng sai của phần dƣ tƣơng ứng:

 , 1 1 ( , ) n p q t t e p q n     (2.26)

Nếu dựa vào phƣơng sai phần dƣ để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đƣa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đƣa vào số tham số bằng số quan sát, khi đó. Các phần dƣ sẽ bằng không, ƣớc lƣợng của phƣơng sai bằng không. Nhƣng mô hình nhƣ vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô hình có quá nhiều tham số sẽ không phù hợp với thực tế. Trƣờng hợp khác, nếu mô hình có quá ít tham số, hiển nhiên sẽ là không phù hợp.

28

Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phƣơng sai có những khiếm khuyết nhất định. Ngƣời ta sẽ đƣa ra một số tiêu chuẩn khác để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đƣa ra tiêu chuẩn thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh.

Akaike (1974) đề xuất tiêu chuẩn AIC (4):

2 ( , ) ln( ( , )) 2( ) AIC p q   p qpq n. 1 1 ( , ) min ( , ), , . AIC p qAIC p q pP qQ (2.27) Khi đó p1 và q1 là các giá trị thích hợp của p và q.

Số hạng đầu tiên trong AIC(p,q) đo độ phù hợp dựa vào phƣơng sai của sai số ƣớc lƣợng đƣợc. Số hạng thứ hai là mức phạt đối với mô hình với số hệ số lớn. Đƣa thêm số hạng thứ hai nhằm khắc phục tình trạng quá nhiều tham số. Tuy nhiên tiêu chuẩn này có thể đƣa ra số tham số nhiều hơn một so với tham số cực tiểu và nó phụ thuộc vào số liệu có phân bố chuẩn hay không. Bằng phƣơng pháp mô phỏng Monte Carlo, Ngƣời ta đã chỉ ra rằng tiêu chuẩn AIC có xu hƣớng dẫn đến quá nhiều tham số.

Schwarz (1978) đƣa ra một tiêu chuẩn BIC (Bayesian Information Criterion):

2

( , ) ln( ( , )) ( )ln( )

BIC p q   p qpq n n (2.28) Lƣợng phát trong (2.28) lớn hơn nên tiêu chuẩn Schwarz có xu hƣớng dẫn đến lựa chọn mô hình có tham số nhỏ hơn AIC.

Tiêu chuẩn AIC hiệu chỉnh AICC (Correctet Akaike Infomation Criterion):

2

( , ) ln( ( , )) 2( 1) ( 2)

AICC p q   p qp q n  p q (2.29) AICC hiệu chỉnh là ƣớc lƣợng chệch của AIC. AICC đƣợc dùng cho mẫu nhỏ. Khi kích thƣớc mẫu lớn thì hai tiêu chuẩn này là nhƣ nhau.

29

Trong hai tiêu chuẩn trên các tập P và Q đều chƣa biết. Hannan (1980) chỉ ra rằng nếu p0 và q0 là các giá trị đúng thì p1  p q0; 1 q0

Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne (1987) đƣa ra ý tƣởng về xây dựng một lớp mô hình. Cơ sở của quan niệm này là mặc dù p1 và q1 đã đƣợc xác định, nhƣng chƣa chắc đã là các giá trị thực của mô hình và cần phải xem xét thêm bằng các tiêu chuẩn khác đối với các giá trị lân cận của p1 và q1. Các tác giả trên đƣa ra:

1 1

1

exp( { ( , ) ( , )}) 2

R   n BIC p qBIC p q (2.30) Tremayne đề nghị rằng nếu R < 10 thì không đủ chứng cớ để loại bỏ mô hình đã chọn bằng thủ tục Akaike và thủ tục Schwarz. Nếu với những cặp (p,q) mà 1 R 10 thì các cặp này cần phải đƣợc xem xét nhƣ (p1,q1). Nhƣ vậy có thể có một lớp các mô hình ARMA(p,q) mà 1 R 10 cần phải cân nhắc thêm bằng các tiêu chuẩn khác.

Nếu gọi k là số tham số của mô hình, ta cókAICkAICCkBIC. BIC là ƣớc lƣợng vững. Nó sẽ cho xác định đƣợc khá chính xác các tham số của mô hình. Kết quả nhận đƣợc theo tiêu chuẩn này sẽ thỏa mãn AIC, AICC. Trên thực tế thƣờng ta chỉ có mẫu có kích thƣớc giói hạn, nên tính vững của ƣớc lƣợng ít có ý nghĩa.

c)Kiểm nghiệm nhân tử Lagrange (LM)

Kiểm định LM đƣợc sử dụng để kiểm định tự tƣơng quan, kiểm định giả thuyết về nhiều điều kiện ràng buộc đối với các hệ số hồi quy, mục này sẽ sử dụng kiểm định LM để kiểm định mô hình ARMA.

Giả thiết: H0: Dạng của mô hình ARMA(p,q). Giả thiết đối có hai dạng sau đây:

HA: Dạng của mô hình ARMA(p+r,q) HB: Dạng của mô hình ARMA(p,q+s)

30

Để kiểm định các cặp giả thiết trên, trƣớc hết phải ƣớc lƣợng mô hình ARMA(p,q) đối với chuỗi dừng Y*

t( Y*t – là chuỗi Yt nếu Ytlà chuỗi dừng. Nếu Yt không phải là chuỗi dừng thì Y*t sẽ là chuỗi sai phân tƣơng ứng). Từ kết quả thu đƣợc ta có các phần dƣ et.

 H0: Dạng của mô hình ARMA(p,q) HB: Dạng của mô hình ARMA (p+r,q).

Để kiểm định giả thiết này phải ƣớc lƣợng mô hình ARMA(p+r,q), tức là: 0 1 1 1 1 2 2 ... 1 1 t t t q t q t t p t p t p e   uuuY  Y  Y Y                 2Yt p 2 p t p rY t             (2.31)

Từ kết quả ƣớc lƣợng thu đƣợc R2, nếu(n p r R) 2  2( )r thì H0 bị bác bỏ.

 H0 : Dạng của mô hình ARMA(p,q) HA : Dạng của mô hình ARMA(p,q+s)

0 1 1 1 1 1 1 t t t q t q q t q t q s t q s t e   uuuuuY                  2Yt 2 p t pY t           (2.32) Từ kết quả ƣớc lƣợng thu đƣợcR2  2( )s thì H0 bị bác bỏ.

Ngoài tiêu chuẩn χ2 ở trên còn có thể dùng tiêu chuẩn F để kiểm định dựa trên mô hình hồi quy có điều kiện ràng buộc.

2.1.7.2. Ước lượng mô hình

Sau khi định dạng mô hình, ra biết đƣợc d-bậc của sai phân đối với chuỗi xuất phát để thu đƣợc một chuỗi dừng. Đối với chuỗi dừng này ta cũng đã biết các giá trị của p và q.

Vấn đề tiếp theo là ƣớc lƣợng các tham số vàcủa mô hình ARMA(p,q). Có một số phƣơng pháp để ƣớc lƣợng.

31

(a) Phƣơng pháp sử dụng các ƣớc lƣợng Yule-Walker trong các phƣơng trình YW. Dựa vào các SPACF và hệ phƣơng trình YW để tìm ra ƣớc lƣợng của quá trình AR. Đối với mô hình ARMA phƣơng trình YW cũng đƣợc sử dụng để ƣớc lƣợng các hệ số của AR. Các hệ số của quá trình MA đƣợc ƣớc lƣợng bằng cách khác.

(b) Phƣơng pháp OLS: Phƣơng pháp này ƣớc lƣợng các tham số bằng cực tiểu hóa tổng bình phƣơng các phần dƣ. Nếu chỉ có AR thì OLS dẫn đến các ƣớc lƣợng tuyến tính. Nếu có cả MA thì OLS dẫn đến ƣớc lƣợng phi tuyến và phải dùng các phƣơng pháp số.

Sử dụng các phƣơng trình YW hay phƣơng pháp OLS thƣờng chỉ để tính các giá trị ban đầu của các tham số dùng trong phƣơng pháp ƣớc lƣợng hợp lí cực đại.

(c) Phƣơng pháp ƣớc lƣợng hợp lý cực đại MLE (Svetlozar,Stefan,Frank, Sergio, Teo Jasi, 2007): Phƣơng pháp này cực đại hóa logarit hàm hợp lý gắn với mô hình đã định dạng. Để sử dụng đƣợc phƣơng pháp này phải có giả thiết về phân bố của yếu tố ngẫu nhiên. Thông thƣờng giả thiết: utN(0,2)

Sau đây sẽ trình bày phƣơng pháp MLE. Xét trƣờng hợp biến ngẫu nhiên ut có phân phối IID và hàm mật độ xác suất có dạng N(0,2).

0 1 1 2 2 1 1 ; t t t p t p t t q t q Y   Y  Y  Y  uu  u 2 (0, ); t uN  0 1 1 2 2 1 1 ; t t t t p t p t q t q u   Y  Y Y    Y u    u 1 2 2 f ( )ut (2 )  exp(ut 2). (2.33) Ký hiệu T là kích thƣớc của mẫu sau khi bỏ đi các quan sát không có do các yếu tố trễ của AR và MA; et là các phần dƣ, khi đó logarit cơ số e của hàm hợp lý có dạng:

32 2 2 2 2 1 1 ln ( , , ) ln(2 ) ln( ) 2 2 2 T t t t T T L   Y   e         (2.34)     1, 2 0 1 2 ( , , , , p, , , q)                 1 1 2 1 0 1 2 q t t t t p t p t t q e  Y  Y  Y  Y  e  e

Quá trình ƣớc lƣợng sẽ đƣợc thực hiện theo phƣơng pháp lặp, quá trình sẽ kết thúc khi chênh lệch ƣớc lƣợng các hệ số giữa hai bƣớc kế tiếp nhau không đáng kể.

2.1.7.3. Kiểm định tính thích hợp của mô hình

Giả thiết cơ bản trong mô hình ARIMA là yếu tố ngẫu nhiên ut-phần không giải thích đƣợc của Yt với các thông tin đã biết trong quá khứ Yt-1 , Yt-2 và ut-1, ut-2 ,…-không có giải thích (đầy đủ hay từng phần) hoặc dự báo từ các thông tin trong quá khứ. Về mặt toán học có nghĩa là ut là nhiễu trắng. Do đó cần phải kiểm định giả thiết “ut là nhiễu trắng”, tức là:

2, s=t ( ) 0, ( , ) 0 , s t t s t E u E u u      

Vẽ lƣợc đồ tƣơng quan SACF và SPACF cho phần dƣ. Nếu SACF và SPACF không có thành phần có ý nghĩa thống kê thì ut tƣơng tự với nhiễu trắng. Khi đó mô hình là chấp nhận đƣợc. Trƣờng hợp ngƣợc lại - có phần tử có ý nghĩa thống kê - thì phần dƣ có chứa những thông tin mà mô hình chƣa tách ra khỏi số liệu đƣợc, hay trong phần dƣ còn thông tin.

Có một số kiểm định khác dựa vào hệ số tƣơng quan của các phần dƣ. Kiểm định đƣợc ƣa thích là kiểm định Khi bình phƣơng dựa trên thống kê Q của Box-Pierce-BP (1970). 0 : ,1 ,2 ,k 0 H       ; H1 : có ít nhất ,i 0 2 , 1 Q ; k i i n      (2.35)

33

,i

 là hệ số tự tƣơng quan mẫ bậc i của phần dƣ;n là kích thƣớc mẫu. k đƣợc chọn đủ lớn sao cho ảnh hƣởng của hệ số tự tƣơng quan bậc cao có thể đƣợc bỏ qua, các hệ số này đƣợc giả thiết là dần tới không. Trên thực tế có thể tính Q với một vài giá trị của k. Nếu ut là nhiễu trắng thì Q có phân bố tiệm cận2 với bậc tự do (k-q-p). Tính toán giá trị Q, so sánh với giá trị tới hạn. Nếu giá trị của Q lớn hơn giá trị tới hạn thì bác bỏ giả thuyết H0 về phần dƣ không tƣơng quan.

Q chỉ có phân bố tiệm cận Khi bình phƣơng, cho nên trong trƣờng hợp mẫu nhỏ, phân bố của Q có thể hoàn toàn khác Khi bình phƣơng. Trong trƣờng hợp mẫu nhỏ, thống kê Ljung-Box (1978) phù hợp hơn:

2 , 1 Q ( 2) ( ) k i i n n n i        (2.36)

Q* có phân bố Khi bình phƣơng, k bậc tự do.

Tuy nhiên nếu kích thƣớc mẫu là quá nhỏ, tiêu chuẩn LB có mức tin cậy thấp, có thể không phát hiện ra sai lầm định dạng của mô hình.

Hai tiêu chuẩn trên chỉ kiểm định không có tự tƣơng quan của các phần dƣ mà không phải kiểm định sự độc lập. Granger và Anderson đã đƣa ra một số thí dụ trong đó các phần dƣ không tƣơng quan trong khi bình phƣơng phần dƣ lại tƣơng quan có ý nghĩa thống kê.

McLeod và Li đã kiểm định giả thuyết:

2 2 2 2 2 2 0 : ,1 ,2 ,k 0, H        2 2 2 , 1 Q ( 2) ( ) . k i i n n n i        (2.37) Trong đó  2 2 ,k

 là hệ số tự tƣơng quan mẫu bậc k của bình phƣơng phần dƣ.

34

Một tiêu chuẩn khác dựa vào hệ số tƣơng quan riêng của bình phƣơng phần dƣ:  2 2 , 1 Q ( 2) ( ) , k M i i n n n i       (2.38)  2 2 .i

 là bình phƣơng hệ số tƣơng quan riêng bậc i của phần dƣ. QM có phân bố tiệm cận Khi bình phƣơng với (k-p-q) bậc tự do. Các kết quả mô phỏng của Monti (1994) chỉ ra rằng QM phù hợp trong trƣờng hợp mẫu nhỏ.

Kiểm định tính phân bố chuẩn (Jarque, Bera, 1980)

Phƣơng pháp MLE đƣợc sử dụng với giả thiết ut có phân bố IID, trong các phần trên ta giả thiết rằng ut có phân bố chuẩn hóa. Bây giờ ta phải kiểm định giả thiết này. Ngƣời ta sử dụng kiểm định Jarque-Bera (JB). Do phân bố chuẩn là đối xứng hình chuông, nên momen cấp ba phải bằng không và momen cấp bốn 4 3 2, 2 Var( )ut .

Độ đo của mô mem cấp ba hay hệ số bất đối xứng S(Skewness) của các phần dƣ đƣợc tính:  3 3 1 1 n t t e S n     (2.39) Ƣớc lƣợng Momen cấp bốn hay hệ số nhọn K:  4 4 1 1 ( 1), 3 n t t e K n      (2.40)

trong đó: n là kích thƣớc mẫu,  - ƣớc lƣợng của .

Với giả thiết ut phân bố chuẩn, khi đó S và K có phân bố tiệm cận

Một phần của tài liệu Mô hình Arima và ứng dụng (Trang 31)

Tải bản đầy đủ (PDF)

(55 trang)