Mô hình arima với phương pháp box – jenkins và ứng dụng để dự báo lạm phát của việt nam
Trang 1MÔ HÌNH ARIMA VỚI PHƯƠNG PHÁP BOX – JENKINS VÀ ỨNG DỤNG ĐỂ DỰ BÁO LẠM PHÁT CỦA VIỆT NAM
ARIMA MODELS - THE BOX-JENKINS APPROACH AND ITS APPLICATION TO FORECAST INFLATION IN VIETNAM
ÔNG NGUYÊN CHƯƠNG
Trường Đại học Kinh tế, Đại học Đà Nẵng
TÓM TẮT
Sự tác động của lạm phát có cả tích cực và tiêu cực theo những cách thức khác nhau tùythuộc vào cấu trúc của nền kinh tế, khả năng thích ứng với sự thay đổi liên tục của lạm phátvà mức độ tiên liệu một cách toàn diện về lạm phát Vì vậy, dự báo lạm phát không chỉ có ýnghĩa trong việc cung cấp các thông tin cho những nhà hoạch định chính sách mà còn đối vớicả các nhà kinh doanh trong việc điều chỉnh các chiến lược; Và tính ổn định kinh tế vĩ mô cóliên quan đến mức độ tương đồng hay khác biệt giữa các dự báo về lạm phát của các nhàkinh doanh và của các nhà hoạch định chính sách Mô hình ARIMA với phương pháp Box-Jenkins được ứng dụng để dự báo lạm phát hàng tháng của Việt Nam với dữ liệu từ Tổng cụcThống kê.
Inflation has positive and negative effects on economy in different ways These effects dependon the structure of economy, the adaptability and anticipation of inflation Therefore,forecasting inflation provides useful information for policy makers as well as businessmen; inaddition, macroeconomic stability is associated with the convergence or the divergence ininflation, and expectations of businessmen and policy makers The ARIMA models-The Box-Jenkins approach are applied to forecast monthly inflation in Vietnam based on the data fromthe General Statistics Office of Vietnam (GSO).
1 Giới thiệu
Nhiều nghiên cứu, đặc biệt là các nghiên cứu thực nghiệm cho thấy sự tác động củalạm phát có cả tích cực và tiêu cực theo những cách thức khác nhau tùy thuộc vào cấu trúccủa nền kinh tế, khả năng thích ứng với sự thay đổi liên tục của lạm phát và mức độ tiên liệumột cách toàn diện về lạm phát Lạm phát cao có xu hướng làm thay đổi các cân bằng thựccủa nền kinh tế làm chệch hướng các nguồn lực khi thực hiện các giao dịch; giảm tín hiệuthông tin về giá tương đối vì vậy dẫn đến tình trạng phân bổ nguồn lực không hiệu quả Khilạm phát tăng làm giá trị của tiền giảm khiến chức năng là đơn vị hạch toán của tiền thay đổi,điều này làm cho việc hạch toán chi phí-lợi nhuận của doanh nghiệp trở nên khó khăn; tác hạicủa lạm phát không dự kiến được gia tăng sự bất ổn định, dẫn đến tình trạng tái phân phối củacải một cách tùy tiện (chẳng hạn, khi lạm phát cao hơn so với dự kiến người đi vay được lợivà người cho vay bị thiệt).
Vì vậy, dự báo lạm phát không chỉ có ý nghĩa trong việc cung cấp các thông tin đốivới những nhà hoạch định chính sách kinh tế vĩ mô mà còn đối với cả các nhà kinh doanhtrong việc điều chỉnh các chiến lược kinh doanh.
Có nhiều phương pháp tiếp cận trong phân tích và dự báo lạm phát Mục đích của bàiviết này nhằm ứng dụng mô hình ARIMA với phương pháp Box-Jenkins để dự báo lạm phátở Việt Nam
George Box và Gwilym Jenkins (1976) đã nghiên cứu mô hình ARIMA
(Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình trượt), và tên
của họ thường được dùng để gọi tên các quá trình ARIMA tổng quát, áp dụng vào việc phân
Trang 2tích và dự báo các chuỗi thời gian Phương pháp Box-Jenkins với bốn bước lặp: nhận dạngmô hình thử nghiệm; ước lượng; kiểm định bằng chẩn đoán; và dự báo.
2 Dự báo lạm phát của Việt Nam
2.1 Nhận dạng mô hình
Trong thực tế, chúng ta phải đối mặt với hai câu hỏi quan trọng: (1) Bằng cách nàochúng ta xác định được một chuỗi thời gian là dừng; (2) Nếu chúng ta xác định được mộtchuỗi thời gian không dừng, thì có cách nào để có thể làm cho chúng trở nên dừng.
Mặc dù có nhiều cách để kiểm tra tính dừng, nhưng có hai cách được sử dụng phổbiến nhất là đồ thị (phân tích đồ thị và kiểm định bằng đồ thị tương quan (correlogram) vàkiểm định nghiệm đơn vị (unit root test)1 (Gujarati, 2003).
Toán tử dịch chuyển lùi và sai phân (Back-shift Operator and Differences)
Điều trước tiên cần phải lưu ý là hầu hết các chuỗi thời gian đều không dừng, và cácthành phần AR và MA của mô hình ARIMA chỉ liên quan đến các chuỗi thời gian dừng Chonên, cần phải có một ký hiệu phân biệt những chuỗi thời gian không dừng gốc với nhữngchuỗi tương ứng có tính dừng của nó sau khi biến đổi sai phân.
Một ký hiệu rất hữu ích là toán tử dịch chuyển lùi (trễ), L, được dùng như sau:
LYt=Yt – 1; nói cách khác, L, thực hiện trên Yt, có tác dụng dịch chuyển dữ liệu trở lạimột thời đoạn
Áp dụng L trên Yt hai lần sẽ dịch chuyển dữ liệu trở lại 2 thời đoạn: L(LYt)=L2Yt=Yt - 2
Đối với dữ liệu tháng, nếu dịch chuyển đến “cùng tháng trong năm trước”, thì dùngL12, và ký hiệu là L12Yt = Yt-12.
Toán tử dịch chuyển lùi thuận tiện trong việc mô tả quá trình tính sai phân
Sai phân bậc nhất: Yt = Yt - Yt - 1
Sử dụng toán tử dịch chuyển lùi, có thể viết lại như sau.Yt = Yt - LYt = (1 - L)Yt
Lưu ý rằng sai phân bậc nhất được biểu diễn bởi (1 - L) Tương tự, nếu tính sai phânbậc hai (nghĩa là, sai phân bậc nhất của sai phân bậc nhất), thì:
Sai phân bậc hai
Lưu ý sai phân bậc hai được ký hiệu là (1 - L)2 (Điều quan trọng là phải nhận thấy
được sai phân bậc hai không phải là sai phân thứ hai, được ký hiệu là 1 - L2 Tương tự, sai
phân thứ mười hai sẽ là 1 - L12, nhưng sai phân bậc mười hai sẽ là (1 - L)12)
Mục đích của việc lấy sai phân là để đạt được trạng thái dừng, và tổng quát nếu lấy sai
phân bậc thứ d sẽ đạt được dừng,
dYt = (1 - L)dYt là chuỗi dừng,Phương pháp Box-Jenkins dựa vào:1 Phân tích đồ thị
Vẽ đồ thị dữ liệu chuỗi thời gian, thông qua hình dạng của đồ thị thực nghiệm cung cấpnhững gợi ý ban đầu về bản chất của chuỗi thời gian Đồ thị cung cấp hình ảnh trực quancho phép chúng ta có thể đánh giá một chuỗi thời gian có dừng hay không.
2 Kiểm định bằng đồ thị tương quan thông qua hàm tự tương quan và hàm tự tươngquan từng phần.
Hàm tự tương quan mẫu (Sample Autocorrelation Function-SACF)
Hàm tự tương quan tại độ trễ k (hay bậc trễ k) ký hiệu rk là:
1 Kiểm định được sử dụng phổ biến là kiểm định Dickey-Fuller tăng cường (Augmented Dickey-Fuller-ADF)
Trang 3rk =
(2.1) Trong đó
(2.2) ; Trị thống kê trk là
1 Nếu SACF của chuỗi thời gian zb, zb+1,…, zn hoặc giảm thật nhanh hoặc giảm dầnkhá nhanh thì giá trị của chuỗi thời gian được xem là dừng.
2 Nếu SACF của chuỗi thời gian zb, zb+1 ,…, zn giảm dần thật chậm thì chuỗi thời gianđược xem là không dừng.
Ý nghĩa chính xác của từ “khá nhanh” và “thật chậm” có phần tùy ý và tốt nhất đượcxác định bằng kinh nghiệm Hơn thế nữa, kinh nghiệm chỉ ra rằng với dữ liệu không với tính
mùa, việc SACF giảm khá nhanh, nếu có, thường xảy ra sau một độ trễ k bé hơn hay bằng 2.
Hàm tự tương quan từng phần của mẫu (Sample Partial Autocorrelation
Chúng ta sẽ định nghĩa hàm tự tương quan từng phần của mẫu (SPACF).
1 Giá trị tương quan từng phần của mẫu tại độ trễ k là:
11 1,
11 1,1
4 Hàm tự tương quan từng phần của mẫu (SPACF) là một danh sách hay đồ thị của
các trị số tự tương quan từng phần của mẫu ở các độ trễ k=1,2,…
Đại lượng này mô tả một cách trực giác các trị tự tương quan của mẫu đối với các giá
trị quan sát chuỗi thời gian ngăn cách bằng một độ trễ k lần đơn vị thời gian.
Một lần nữa, để áp dụng phương pháp luận Box-Jenkins, chúng ta phải thử và cố gắngphân loại động thái của SPACF Đầu tiên, SPACF của một chuỗi thời gian không có tính mùa
có thể giảm thật nhanh Điều này có ý nghĩa gì, ta nói rằng một đỉnh nhọn ở độ trễ k tồn tạitrong SPACF nếu rkk, trị tự tương quan từng phần của mẫu ở độ trễ k, là lớn theo nghĩa thốngkê Kết luận rằng rkk là lớn theo nghĩa thống kê một cách cơ bản tương đương với việc loại bỏ
bằng không (H0 :kk= 0) Ta có thể đánh giá một đỉnh nhọn ở độ trễ k tồn tại trong SPACF
Trang 4hay không bằng cách xem trị thống kê t tương ứng với rkk Ở đây ta xem một đỉnh nhọn ở độ
trễ k tồn tại trong SPACF nếu trị tuyệt đối của
t là lớn hơn 2 Hơn thế nữa, chúng tanói rằng SPACF giảm thật nhanh sau độ trễ k nếu không có đỉnh nhọn nào ở các độ trễ lớnhơn k trong SPACF Với dữ liệu không có tính mùa, kinh nghiệm chỉ ra rằng nếu SPACF tắt,
một cách tổng quát nó sẽ giảm thật nhanh sau một độ trễ bé hơn hay bằng 2 Thứ hai, chúng tanói rằng SPACF giảm dần nếu hàm này không giảm thật nhanh nhưng giảm đi theo một“dạng ổn định” SPACF có thể giảm dần theo (1) một dạng hàm mũ tắt dần (không dao độnghoặc có dao động), (2) một dạng sóng hình sin tắt dần hoặc (3) một dạng bị trội bởi một tronghai dạng trên hoặc một tổ hợp của chúng Hơn nữa, SPACF có thể giảm dần khá nhanh hoặcgiảm dần thật chậm.
Quá trình nhận dạng của một mô hình ARIMA không có tính mùa hay có tính mùaphụ thuộc vào những công cụ thống kê - đó là, hệ số tự tương quan, hệ số riêng phần, và đồthị tương quan; và hiểu biết về quá trình đang nghiên cứu cũng như đòi hỏi kinh nghiệm vàphán đoán tốt (Newbold and Bos, 1994)
Mô hình ARIMA mở rộng bao gồm các yếu tố thời vụ được ký hiệu tổng quát là:
ARIMA (p, d, q) (P, D, Q)S
Phần mô hình Phần mô hình S = số đoạn
không có tính mùa có tính mùa mỗi mùa
Dữ liệu được sử dụng là Chỉ số giá tiêu dùng (CPI) hàng tháng theo phương pháp liênhoàn từ tháng 1 năm 1996 đến tháng 12 năm 2006 của Tổng Cục Thống kê công bố.
Tỷ lệ lạm phát hàng tháng sẽ được xác định2:
CPICPICPI
Trang 5Hình 2.2 Đồ thị tương quan của dữ liệu sau khi biến đổi sai phân
Dựa vào hình dạng của đồ thị thực nghiệm của dữ liệu gốc (Hình 2.1) và đồ thị tương quancủa dữ liệu sau khi biến đổi sai phân (Hình 2.2).
Các mô hình được nhận dạng như sau:
Mô hình ARIMA(0,1,1)(0,1,1)12 (Mô hình 1)hoặc
(1 - L)(1 - L12)Yt = (1 - 1L)(1 - 1L12)ut
Sai phân bậc nhất Sai phân bậc nhất MA(1) không MA(1) có
Trang 6không có tính mùa có tính mùa có tính mùa tính mùa Mô hình ARIMA (1,1,0)(1,1,0)12 (Mô hình 2)
hoặc (1 L)(1 L12)(1 L)(1 L12)Yt ut
AR(1) có Sai phân có MA(1) có
2.2 Ước lượng các tham số
Cơ bản có hai cách để ước lượng những tham số , :
1 Thử và sai – Xem xét nhiều giá trị khác nhau và chọn giá trị (hay tập giá trị, nếuước lượng nhiều hơn một tham số) sao cho tổng của những bình phương phần dư đạt giá trịnhỏ nhất.
2 Cải thiện lặp - chọn một ước lượng ban đầu và chạy bằng một chương trình máytính tinh chỉnh ước lượng lặp đi lặp lại3.
DS12.inf Coef z DS12.inf Coef z DS12.inf Coef z
_cons 0.001 0.15 _cons -0.002 -0.05 _cons 0.001 0.36
L1 -0.088 -0.863 Phương pháp Cải thiện lặp được ứng dụng rộng rãi hơn vì giải thuật mạnh.(giải thuật Marquardt)
4 Sử dụng phần mềm Stata
Trang 71 Xem xét những phần dư - để xem nó theo dạng nào chưa được biết không.
2 Xem xét những thống kê lấy mẫu của giải pháp tối ưu hiện tại (sai số chuẩn, ma trậntương quan )-kiểm tra xem có thể đơn giản hoá mô hình không.
Bảng 2.2 Kết quả các thông số kiểm định
Model Obs Chi-Square ll(model) df AIC BICMô hình 1 119 109.42 -85.63 4 169.26 180.38Mô hình 2 119 45.94 -109.78 4 227.55 238.67Mô hình 3 119 115.46 -79.28 5 168.57 182.46
Dựa vào Bảng 2.1 và Bảng 2.2 với các tiêu chuẩn kiểm định được lựa chọn là z, Square ( 2
Chi- ), AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion),mô hình phù hợp nhất và được lựa chọn là Mô hình 1.
2.4 Dự báo bằng mô hình ARIMA
Mô hình ARIMA (0,1,1)(0,1,1)12
Số hạng ut+1 sẽ không biết được vì giá trị kỳ vọng của những sai số ngẫu nhiên tương
lai bằng 0, nhưng từ mô hình đã thích hợp, chúng ta có thể thay thế những giá trị ut, ut-11, và u12 bằng những giá trị được xác định bằng thực nghiệm của chúng - nghĩa là, như những giá trịthu được sau lần lặp sau cùng của giải thuật Marquardt Dĩ nhiên, vì chúng ta dự báo xa hơnnữa trong tương lai, chúng ta sẽ không có những giá trị thực nghiệm cho những số hạng “u”sau một khoảng nào đó, và vì vậy tất cả những giá trị kỳ vọng của chúng sẽ có giá trị làkhông.
t-Đối với những giá trị Y ban đầu của quá trình dự báo, chúng ta sẽ biết những giá trị Yt,Yt-11, và Yt-12 Tuy nhiên, sau một lúc, những giá trị Y trong phương trình (2.10) sẽ là những giá
trị được dự báo chứ không phải là những giá trị quá khứ Vì vậy các giá trị thực tế cần phảiđược cập nhật liên tục để cải thiện độ tin cậy của các giá trị dự báo.
Bảng 2.3 Kết quả dự báo lạm phát hàng tháng từ tháng 1 đến tháng 12 năm 2007
1 Tháng2 Tháng3 Tháng4 Tháng5 Tháng6 Tháng7 Tháng8 Tháng9 Tháng10 Tháng11 Tháng120.79 1.46 -1.06 -0.10 0.60 0.44 0.20 0.31 0.34 0.48 0.89 0.76
Trang 8TÀI LIỆU THAM KHẢO
Chỉ số giá tiêu dùng các tháng trong năm, 2007.
G.M Jenkins, Time Series Analysis: Forecasting and Control, Revised Edition,
Holden Day, San Francisco, 1976.