THIẾT KẾ NGHIÊN CỨU DỰ BÁO LẠM PHÁT VIỆT NAM BẰNG

Một phần của tài liệu (luận văn thạc sĩ) ứng dụng mô hình arima trong dự báo lạm phát việt nam (Trang 57 - 67)

7. Ý nghĩa khoa học và thực tiễn của đề tài

2.3.THIẾT KẾ NGHIÊN CỨU DỰ BÁO LẠM PHÁT VIỆT NAM BẰNG

BẰNG MÔ HÌNH ARIMA

2.3.1. Phương pháp nghiên cứu

Đề tài sử dụng phương pháp Box-Jenkins để xây dựng mô hình ARIMA dự báo lạm phát Việt Nam. Phương pháp này tiến hành dự báo lạm phát chỉ dựa trên việc xem xét chính chuỗi giá trị lạm phát trong quá khứ. Box – Jenkins (1976) đã đưa ra quy trình dự báo đối với dữ liệu chuỗi thời gian bằng mô hình ARIMA gồm các bước sau:

Bước 1: Nhận dạng mô hình. Bước 2: Ước lượng mô hình. Bước 3: Kiểm định mô hình. Bước 4: Dự báo.

Nếu mô hình ước lượng được không thỏa mãn các kiểm định ở bước 3 thì ta phải tìm mô hình khác bằng cách quay lại bước 1. Quá trình này được lặp lại cho đến khi ta chọn được mô hình phù hợp nhất để tiến hành dự báo. Dữ liệu được nghiên cứu theo phương pháp Box – Jenkins phải là chuỗi dừng. Do vậy, trước khi nhận dạng mô hình, ta cần phải xem xét dữ liệu chuỗi lạm phát có dừng hay không và biến đổi thành chuỗi dừng nếu chưa dừng.

a. Xem xét tính dng ca chui d liu

thời đồ thị của chuỗi thời gian, biểu đồ hàm tự tương quan mẫu (SAC) và kiểm định nghiệm đơn vị của Dickey-Fuller.

- Dựa vào đồ thị của chuỗi dữ liệu:

Chuỗi thời gian có tính dừng nếu như đồ thị chuỗi thời gian = f(t) cho thấy dữ liệu có xu hướng hội tụ xoay quanh một giá trị nhất định và những dao động xung quanh giá trị này là có giới hạn và gần như tương tự nhau. Điều này hàm ý rằng trung bình và phương sai của chuỗi dữ liệu không thay đổi theo thời gian.

- Dựa vào biểu đồ hàm tự tương quan mẫu:

Biểu đồ SAC của một chuỗi dừng có đặc điểm như một trong các trường hợp sau:

Thứ nhất, hệ số SAC ở tất cả độ trễ có thể bằng 0, lúc này chuỗi có sai

số ngẫu nhiên và không có tính xu thế.

Thứ hai, SAC của chuỗi giảm đột ngột về giá trị 0, hệ số SAC rất lớn ở

độ trễ 1, 2 hoặc 3 và có ý nghĩa thống kê. Những SAC lớn này được xem là những đỉnh của biểu đồ và ta nói rằng SAC giảm đột ngột sau độ trễ k nếu không có những đỉnh ở độ trễ lớn hơn k (trừ các đỉnh ở độ trễ mùa, nếu có). Hầu hết, SAC sẽ giảm đột ngột sau độ trễ 1 hoặc 2.[7]

Thứ ba, SAC của chuỗi giảm dần nhanh về giá trị 0 trong vài độ trễ đầu

tiên (thường không nhiều hơn 5 độ trễ đầu), tức là hệ số SAC ở vài độ trễ đầu tiên khác 0 có ý nghĩa thống kê và không có đỉnh ở các độ trễ còn lại. SAC có thể giảm dần nhanh theo vài dạng thường gặp như: Dạng phân phối hàm mũ giảm; Dạng sóng hình sin hoặc kết hợp cả hai dạng này.

Hiện tượng giảm dần nhanh và giảm dần chậm được phân biệt không rõ ràng, không dựa trên các tiêu chí thống kê cụ thể, ta chỉ có thể học hỏi bằng phương pháp thử và sai.

tại các độ trễ không mùa (những độ trễ nhỏ hơn S, với S là số thời đoạn trong một chu kì mùa), SAC giảm đột ngột ở những độ trễ đầu, đồng thời giảm dần nhanh ở những độ trễ mùa (thường ở độ trễ S hoặc 2S). Để kiểm định xem hệ số tự tương quan có ý nghĩa thống kê hay không ta dùng thống kê t.

Nếu chuỗi dữ liệu không dừng, ta sẽ biến đổi chuỗi không dừng thành chuỗi dừng bằng cách lấy sai phân d lần cho đến khi chuỗi dừng. Trường hợp chuỗi có tính xu thế thì nó không dừng. Tính xu thế có thể được loại bỏ bằng cách lấy sai phân bậc 1 hay bậc 2 hoặc lấy logarith rồi tính sai phân.

Chuỗi thời gian tồn tại tính mùa cũng có thể không dừng. Tính mùa được nhận ra dựa vào biểu đồ SAC. Nếu cứ sau s thời đoạn thì SAC lại có giá trị cao (biểu đồ SAC có đỉnh cao) thì đây là dấu hiệu của tính mùa. Phương pháp đơn giản nhất để khử tính mùa là lấy sai phân thứ s, với s là số thời đoạn trong chu kì mùa của chuỗi dữ liệu. Chuỗi lạm phát được quan sát theo tháng thường có tính mùa với chu kì là 12 tháng, nên để chuỗi trở thành chuỗi dừng thì ta lấy sai phân thứ 12 cho chuỗi này.

- Dựa vào kiểm định nghiệm đơn vị:

Giả sử ta có phương trình tự hồi quy như sau:

t t

t Y

Y =r -1+e (2.2) Trong đó, -1£r£1

Phương trình (2.2) tương đương với phương trình (2.3) sau:

( ) t t

t Y

Y = r- +e

D 1 -1 (adsbygoogle = window.adsbygoogle || []).push({});

=dYt-1+et (2.3) Như vậy, để biết được liệu chuỗi Yt có phải là chuỗi không dừng hay không, ta thực hiện kiểm định trên cơ sở thống kê t với cặp giả thiết:

H0: d =0 (Yt là chuỗi không dừng) H1: d ¹0 (Yt là chuỗi dừng).

Dickey và Fuller cho rằng trị thống kê t được tính theo qui ước được biết tới như là trị thống kê tau (t statistic). Kiểm định thống kê tau còn được gọi là kiểm định Dickey-Fuller (DF). Nếu ta tính được t > t tra bảng DF thì bác bỏ H0, nghĩa là Yt là chuỗi dừng.

Kiểm định DF được áp dụng với các hồi quy sau:

t t t t t t t t Y t Y Y Y Y Y e d b m e d m e d + + + = D + + = D + = D - - - 1 1 1 1 ( ) ( ) ( )2.5 4 . 2 3 . 2

Nếu số hạng ngẫu nhiên etlà tự tương quan, ta sẽ biến đổi phương trình (2.5) thành phương trình (2.6) sau: å = - - + D + + = D m i i t i t t t Y Y Y 1 1 a d b m (2.6) Kiểm định DF áp dụng cho mô hình (2.6) được gọi là kiểm định DF mở rộng (kiểm định ADF).

b. Nhn dng mô hình

Khi một chuỗi dữ liệu là chuỗi dừng thì chiều hướng biến đổi của hàm tự tương quan mẫu SAC và hàm tự tương quan riêng phần mẫu SPAC sẽ giúp ta nhận dạng mô hình ARIMA. Nhận dạng mô hình ARIMA là tìm các giá trị thích hợp cho các tham số không mùa: p, d, q và các tham số mùa (nếu có): P, D, Q.

d là số lần lấy sai phân thông thường và D là số lần lấy sai phân mùa để biến đổi chuỗi trở thành chuỗi dừng.

Việc xác định các giá trị p, q, P, Q dựa vào đặc điểm của hàm SAC và hàm SPAC.

- Nếu SAC giảm đột ngột, hàm SAC không có ý nghĩa thống kê kể từ bậc k và hàm SPAC giảm dần thì chọn mô hình MA(q), với q ≥ k.

- Nếu SPAC giảm đột ngột, hàm SPAC không có ý nghĩa thống kê kể từ bậc k và hàm SAC giảm dần thì chọn mô hình AR(p), với p ≥ k.

- Nếu SAC và SPAC đều giảm dần thì chọn mô hình ARMA(p, q). Xu hướng vận động giảm đột ngột hay giảm dần của SPAC cũng có các dạng tương tự như SAC.

Việc khảo sát trên SAC và SPAC tại các độ trễ là bội số của độ dài mùa S sẽ giúp kết luận các giá trị P, Q phù hợp cho mô hình. Nói cách khác, với chuỗi lạm phát quan sát theo tháng, ta cần nghiên cứu đồng thời chiều hướng của SAC và SPAC của chuỗi dữ liệu ở những độ trễ nhỏ hơn 12 (không mùa) cũng như ở những độ trễ 12, 24, 36 và 48 (mùa).

Ngoài những công cụ thống kê trên, quá trình nhận dạng mô hình ARIMA không có tính mùa hay có tính mùa còn phụ thuộc vào hiểu biết về quá trình đang nghiên cứu cũng như đòi hỏi kinh nghiệm và phán đoán tốt (Newbold and Bos, 1994).

c. Ước lượng mô hình

Bước tiếp theo là ước lượng các tham số của các mô hình nhận dạng được. Đề tài sử dụng phương pháp ước lượng bình phương tối thiểu để ước lượng các tham số f,q của mô hình ARIMA. Quy trình ước lượng các tham số của mô hình khá phức tạp và gồm cả việc giải hệ phương trình phi tuyến. Tuy nhiên, với sự trợ giúp của phần mềm Eviews, việc ước lượng mô hình được thực hiện nhanh chóng.

d. Kim định mô hình

Sau khi ước lượng các tham số của mô hình ARIMA nhận dạng thử, đề tài tiến hành kiểm định sự phù hợp của mô hình qua các kiểm định sau:

- Kiểm định phần dư là nhiễu trắng:

phần dư của mô hình có phải là nhiễu trắng không (Bruce and Richard). Nếu phần dư là nhiễu trắng thì chấp nhận mô hình. Trong trường hợp ngược lại, đề tài phải tiến hành lại từ bước nhận dạng mô hình. Các kiểm định được sử dụng là kiểm định Ljung-Box (LB) với trị thống kê Q, hoặc kiểm định LM.

+ Kiểm định Ljung-Box (Phụ lục 3.1) : Một quá trình nhiễu trắng bắt buộc phải có:

0 ...

2

1 =r = =rh =

r

Ta xây dựng cặp giả thiết:

H0: r1 = r2 =...= rm =0 (không có tự tương quan) H1: có ít nhất một hệ số r¹0(có tự tương quan).

Ljung và Box đã đưa ra trị thống kê QLB (gọi là kiểm định LB) như sau:

( )å = ÷÷ ø ö çç è æ - + = m k k LB k T T T Q 1 2 ˆ 2 r (2.7) Nếu QLB > 2( )m a c ở một mức ý nghĩa a xác định, m là số lượng độ trễ, ta bác bỏ H0, nghĩa là chuỗi phần dư là nhiễu trắng. Hai cột cuối trong giản đồ tương quan là thống kê QLB của LB và giá trị xác suất tương ứng. (adsbygoogle = window.adsbygoogle || []).push({});

+ Kiểm định Breusch-Godfrey LM (Phụ lục 3.2): Kiểm định LM được thực hiện với cặp giả thiết:

H0: r1 = r2 =...= rm =0(không có tự tương quan trong chuỗi phần dư) H1: có ít nhất một hệ số r¹0(có tự tương quan trong chuỗi phần dư). Thống kê trong kiểm định này là thống kê LM, tuân theo phân phối chuẩn Chi bình phương với số bậc tự do là p. Nếu LM < 2( )p

a

c ở mức ý nghĩa

a được chọn, ta chấp nhận H0, tức là không có hiện tượng tự tương quan trong chuỗi phần dư. Do đó, phần dư của mô hình là nhiễu trắng.

Kiểm định ARCH cho cặp giả thiết:

H0: Không có phương sai sai số thay đổi. H1: Có phương sai sai số thay đổi.

Thống kê trong kiểm định ARCH LM tuân theo phân phối Chi bình phương với số bậc tự do là độ trễ q. Ta xác định độ trễ q sao cho các hệ số trong mô hình có ý nghĩa thống kê. Nếu giá trị thống kê tính toán lớn hơn giá trị Chi bình phương tra bảng thì ta bác bỏ giả thiết H0 và kết luận rằng chuỗi dữ liệu đang xem xét tồn tại hiện tượng phương sai sai số thay đổi.

- Kiểm định các hệ số của mô hình phải khác 0:

Khi phần dư là nhiễu trắng thì ta có thể sử dụng kiểm định Student với thống kê t (= tham số ước lượng/độ lệch chuẩn của ước lượng) để kiểm định ý nghĩa thống kê của các tham số trong mô hình.

Nếu t ³ta/2tra bảng với mức ý nghĩa a thì ta kết luận tham số ước lượng có ý nghĩa thống kê.

- Kiểm tra hiện tượng thừa biến trong mô hình:

Khi các kiểm định đã thỏa mãn, mô hình ARIMA tốt nhất luôn là mô hình ít tham số nhất (Parsimony). Điều này không những bởi vì yêu cầu mô hình đơn giản để dễ giải thích, trái lại những mô hình ít tham số sẽ tránh được hiện tượng thừa tham số (Pankratz, 1983). Thừa tham số xảy ra khi mô hình bậc cao hơn được sử dụng, trong khi đó mô hình thấp hơn cũng đủ để đáp ứng nhu cầu của dữ liệu.

Đề tài sử dụng ma trận tự tương quan cho các tham số ước lượng để kiểm tra có tồn tại hiện tượng thừa tham số hay không. Mặc dù các ước lượng tham số trong mô hình ARIMA sẽ luôn có tương quan cao (r >0.8 hoặc 0.9) giữa những ước lượng được nghi ngờ là thừa tham số. Khi thừa tham số, mô hình bậc thấp hơn sẽ được lựa chọn.

Sau tất cả các kiểm định trên, nếu tồn tại nhiều hơn một mô hình đúng, ta sẽ lựa chọn mô hình có các tiêu chuẩn thông tin AIC, SIC, RMSE cực tiểu.

T k AIC=lnsˆ2+2 (2.8) T T k SIC=lnsˆ2 +2 ln (2.9) ( ) k T Y Y RMSE T t t t - - = å =1 2 ˆ (2.10) Trong đó, T là số lượng quan sát, k là số lượng tham số trong mô hình.

Trong trường hợp 3 tiêu chuẩn trên không đồng thời cực tiểu, mô hình có AIC nhỏ nhất sẽ được lựa chọn (TS. Nguyễn Thống, 2000).

- Kiểm định tính ổn định cấu trúc của mô hình:

Đề tài sử dụng kiểm định Chow với trị thống kê F để xem liệu có sự thay đổi về mặt cấu trúc của mô hình giữa các giai đoạn khác nhau của chuỗi dữ liệu lạm phát (do thay đổi chính sách hoặc cú sốc kinh tế) hay không.

Cặp giả thiết được xây dựng:

H0: Không có sự thay đổi cấu trúc nào trong 2 thời kỳ. H1: Có sự thay đổi về cấu trúc trong 2 thời kỳ.

Nếu giá trị thống kê F tính toán lớn hơn giá trị Fa(k,T -2k) tra bảng với k là số lượng tham số trong mô hình, thì ta bác bỏ H0, tức là có sự khác biệt giữa hai thời kỳ. Khi đó, đề tài sẽ thực hiện dự báo theo 2 hướng, dự báo mô hình ban đầu và dự báo mô hình kể từ điểm gãy cuối cùng. Từ đó, ta so sánh và đưa ra nhận định mô hình nào là mô hình phù hợp nhất để dự báo lạm phát Việt Nam.

e. D báo

hành xác định giá trị dự báo điểm và khoảng tin cậy của dự báo cho chuỗi lạm phát bằng phần mềm Eviews với độ tin cậy là 95% và k=1.96 như sau:

Dự báo điểm: YÙt

Khoảng tin cậy: YÙt- ks(et) < YÙt < YÙt+ ks(et) (2.11) Nhiều nghiên cứu thực nghiệm đã chứng tỏ kết quả dự báo từ mô hình ARIMA trong nhiều trường hợp có độ tin cậy và chính xác hơn so với các mô hình kinh tế lượng truyền thống. Tuy nhiên, trước khi tiến hành dự báo tiền nghiệm, đề tài vẫn sẽ đánh giá dự báo thông qua dự báo hậu nghiệm. Nghĩa là, ta để dành một phần của mẫu (không sử dụng ước lượng) để dự báo kiểm định, và sau đó so sánh các giá trị dự báo với giá trị thực. Nếu như mô hình không đảm bảo độ chính xác theo yêu cầu thì lúc đó ta cần tìm các giải pháp khác như tìm kiếm mô hình thay thế hoặc mở rộng mẫu dự báo.

Với phương pháp nghiên cứu như trên, đề tài được thực hiện theo quy trình nghiên cứu cụ thể được trình bày ở Hình 2.5, gồm các bước chính sau:

Bước 1: Tìm hiểu cơ sở lý thuyết, lựa chọn mô hình nghiên cứu. Bước 2: Thiết kế nghiên cứu.

Bước 3: Thu thập và xử lí sơ bộ dữ liệu.

Bước 4: Tiến hành xây dựng mô hình ARIMA và dự báo lạm phát. Bước 5: Kết luận và đề xuất. (adsbygoogle = window.adsbygoogle || []).push({});

Hình 2.5: Quy trình nghiên cứu của đề tài Kết luận và đề xuất Lựa chọn mô hình nghiên cứu Tìm hiểu cơ sở lý thuyết Dừng Mô hình phù hợp Mô hình không phù hợp Không dừng Thiết kế nghiên cứu Thu thập, xử lí dữ liệu Kiểm tra tính dừng của chuỗi dữ liệu

Ước lượng mô hình

Kiểm tra mô hình Dự báo Biến đổi chuỗi thành chuỗi dừng: Lấy sai phân Nhận dạng mô hình - Đồ thị chuỗi dữ liệu - Biểu đồ SAC - Kiểm định ADF - Biểu đồ SAC, SPAC

- Phương pháp ước lượng bình phương tối thiểu. - Kiểm định LB, kiểm định LM. - Kiểm định Student - Ma trận tự tương quan của các biến - So sánh: R2, AIC, SIC, RMSE - Kiểm định Chow.

Một phần của tài liệu (luận văn thạc sĩ) ứng dụng mô hình arima trong dự báo lạm phát việt nam (Trang 57 - 67)