7. Ý nghĩa khoa học và thực tiễn của đề tài
2.2.1 Sự cần thiết phải áp dụng mô hình định lượng trong dự báo lạm
lạm phát tại Việt Nam
Trước tình hình diễn biến của lạm phát tại Việt Nam trong thời gian hiện nay, thì việc xem xét động thái và dự báo lạm phát là một bài toán khó. Điều này dẫn đến việc tìm ra một mô hình định lượng để từ đó phân tích và dự báo lạm phát là rất cần thiết, nó không những giúp cho các nhà hoạch định chính sách có thể đánh giá lạm phát dựa trên cơ sở khoa học và tin cậy trong
quá trình hoạch định mà còn giúp các doanh nghiệp đưa ra chiến lược phát triển phù hợp.
Dự báo lạm phát bằng phương pháp định lượng được sử dụng khá phổ biến trên thế giới. Hiệu quả từ phương pháp này đã được chứng minh tại rất nhiều quốc gia. Ưu điểm của phương pháp định lượng là phân tích số liệu để đưa ra những dự báo khách quan, dựa vào tiêu chí của các chỉ tiêu thống kê từ mô hình, giảm thiểu rủi ro trong việc phân tích cảm tính của con người. Trong nhiều trường hợp, kết quả dự báo từ các mô hình định lượng có độ chính xác và tin cậy cao hơn các mô hình lý thuyết.
Tuy nhiên, tại Việt Nam, áp dụng phương pháp định lượng trong dự báo lạm phát gặp không ít khó khăn nên việc ứng dụng các mô hình định lượng trong dự báo lạm phát chưa được sử dụng nhiều. Nguyên nhân chính là lực lượng những người làm dự báo có đủ kinh nghiệm và chuyên môn để thực hiện các phân tích phức tạp khá ít. Ngoài ra, do số liệu về kinh tế, doanh nghiệp, thị trường chưa đủ dài và độ tin cậy chưa cao nên việc thực hiện các dự báo trở nên khó khăn hơn.
2.2.2. Ưu điểm của mô hình ARIMA và sự phù hợp của mô hình ARIMA với thực tiễn Việt Nam
Như đã đề cập ở phần trước, các mô hình định lượng phổ biến trong dự báo lạm phát là mô hình ARIMA, mô hình nhân quả và mô hình Neural Network. Trên cơ sở phân tích các ưu, nhược điểm và xem xét sự phù hợp đối với thực tiễn Việt Nam của từng mô hình, đề tài nhận thấy mô hình ARIMA là cách tiếp cận phù hợp trong dự báo lạm phát Việt Nam. Mô hình nhân quả và mô hình Neural Network tuy có thể đưa ra kết quả dự báo tương đối chính xác nhưng hai mô hình này có những hạn chế khi áp dụng tại Việt Nam.
Mô hình nhân quả có thể dự báo một cách khá chính xác xu hướng diễn biến dài hạn của lạm phát. Nhưng, mô hình nhân quả được xây dựng trên cơ
sở hồi quy biến lạm phát theo các biến độc lập khác, nên khi ước lượng bằng mô hình nhân quả, đòi hỏi nhà nghiên cứu phải giả định một dạng hàm ban đầu thể hiện mối quan hệ được nghiên cứu giữa lạm phát và các biến còn lại. Chọn lựa dạng hàm sai sẽ dẫn đến các hệ số ước lượng không chính xác và đưa ra dự báo kém. Ngoài ra, để dự báo giá trị tương lai của lạm phát, ta cần dự báo được giá trị tương lai tương ứng của các biến độc lập trong mô hình. Điều này làm cho việc dự báo trở nên phức tạp, khó khăn và có thể làm tăng sai số trong kết quả dự báo. Đồng thời, phương pháp này đòi hỏi có dữ liệu đầy đủ của tất cả biến, mà việc thu thập dữ liệu của các biến trong mô hình là một công việc không dễ dàng và tốn nhiều chi phí. Tại Việt Nam, dữ liệu về nền kinh tế, thị trường còn ít, thiếu chính xác, trong đó, có những chỉ tiêu không được công khai đầy đủ, rõ ràng như cung tiền, … nên việc áp dụng phương pháp này trong dự báo lạm phát tại Việt Nam cũng trở nên khó khăn hơn.
Mô hình mạng thần kinh cũng được đánh giá cao về tính chính xác trong dự báo. Mô hình mạng thần kinh không cần biết trước dạng hàm của mối quan hệ nghiên cứu. Dữ liệu đầu vào khá đa dạng như mô hình nhân quả, nhưng mô hình mạng thần kinh có khả năng chấp nhận lỗi cao, nó có thể chấp nhận và xử lí các dữ liệu mẫu chưa biết hay không hoàn toàn chính xác tuyệt đối. Tuy nhiên, mô hình này lại khá phức tạp. Trong mô hình mạng thần kinh, các trọng số ước lượng không giải thích được chính xác mối quan hệ giữa các biến đầu vào và đầu ra. Việc xác định mối quan hệ giữa chúng rất phức tạp. Chính sự phức tạp này mà mô hình mạng thần kinh còn được gọi là một “hộp đen”. Mô hình này sử dụng các giá trị đầu vào để tính toán đầu ra, nhưng để hiểu được tại sao có kết quả dự báo như vậy thì không đơn giản. Bên cạnh đó, việc xây dựng cấu trúc tối ưu cho mô hình mạng thần kinh cũng không đơn giản và mất rất nhiều thời gian. Để thực hiện một công tác dự báo chuỗi thời gian bằng mạng thần kinh nhân tạo, ta phải xem xét lựa chọn và thử nghiệm
trên nhiều cấu hình và giải thuật khác nhau để tìm ra một mô hình tốt nhất. Đối với những chuỗi thời gian có xu hướng và tính mùa (thường gặp ở các biến kinh tế), chương trình dự đoán với độ chính xác chưa cao. Do đó, các nhà kinh tế học e ngại việc sử dụng mô hình này như là một công cụ thống kê thay thế trong việc dự báo các biến kinh tế. Tuy hiện nay có khá nhiều phần mềm về Neural Network đăng tải trên mạng internet. Nhưng việc vận dụng thành thạo để dự báo lạm phát là một công việc không đơn giản. Để làm được điều này, người nghiên cứu cần phải có hàng loạt các kiến thức sâu rộng khác bổ trợ. Vì vậy, mô hình Neural Network không phải là lựa chọn thích hợp cho dự báo lạm phát tại Việt Nam.
Trong khi đó, mô hình ARIMA có thể cho dự báo ngắn hạn tốt và có ưu thế hơn những dự báo tạo ra bởi các mô hình kinh tế lượng (Cooper, 1972; Nelson, 1972). Với các ưu điểm của mô hình, mô hình ARIMA khắc phục được những hạn chế đã nêu trên của mô hình nhân quả và mô hình Neural Network khi áp dụng vào dự báo lạm phát tại Việt Nam.
Ưu điểm đầu tiên của mô hình ARIMA là chỉ sử dụng dữ liệu thời gian của chính biến số lạm phát cần dự báo nên việc thu thập dữ liệu không quá khó khăn và tốn ít thời gian hơn so với việc sử dụng nhiều biến số trong các mô hình khác. Bên cạnh đó, các dự báo có thể thực hiện trực tiếp từ mô hình đã xây dựng được, mà không phải tiến hành xây dựng thêm các mô hình khác để dự báo giá trị của các biến số độc lập đưa vào mô hình dự báo lạm phát như ở các mô hình khác. Điều này làm hạn chế sai số trong dự báo. Và không giống với mô hình nhân quả, mô hình ARIMA được xây dựng không dựa trên bất kì lý thuyết kinh tế nào nên việc thiết lập mô hình không đòi hỏi nhiều thời gian ban đầu để nghiên cứu lý thuyết kinh tế liên quan đến lạm phát và lựa chọn dạng hàm thích hợp. Hơn nữa, so với các mô hình định lượng khác, các thủ tục hình thức kiểm định mô hình ARIMA tương đối đơn giản, dễ tiếp
cận hơn. Những ưu điểm này làm tăng khả năng áp dụng của mô hình ARIMA tại Việt Nam.
2.2.3. Một số nghiên cứu thực nghiệm về dự báo lạm phát bằng mô hình ARIMA hình ARIMA
Những nghiên cứu thực nghiệm về lạm phát trước đây đã chứng tỏ sự thành công trong dự báo ngắn hạn lạm phát của mô hình ARIMA.
* Nghiên cứu ở nước ngoài:
Dự báo lạm phát ngày càng được quan tâm, nhiều nơi trên thế giới đã tiến hành nghiên cứu thực nghiệm về dự báo lạm phát.
Muhammad Abdus Salam, Shazia Salam và Mete Feridun (2005) sử dụng mô hình ARIMA phương pháp Box-Jenkins (1976) để dự báo lạm phát trong ngắn hạn ở Pakistan. Nghiên cứu dựa trên chuỗi tỉ lệ lạm phát tháng (tính theo CPI) của Pakistan từ tháng 7/2004 đến tháng 6/2005. Các tiêu chí so sánh để lựa chọn mô hình là: Akaike Information Criterion (AIC), Schwarz Information Criteria (SIC), Root Mean Squared Error (RMSE), Mean Absolute Error (MAE) và Mean Abs. Percent Error (MAPE). Mô hình phù hợp cho dự báo lạm phát Pakistan trong ngắn hạn tìm được gồm các tham số: AR(3), AR(8), SAR(1), MA(1), MA(10).
Samuel Erasmus Alnaa và Ferdinand Ahiakpor (2011) cũng đã sử dụng phương pháp này để xây dựng mô hình dự báo lạm phát ở Ghana. Hai tác giả đã tìm ra mô hình ARIMA(6, 1, 6) thích hợp để dự báo lạm phát 12 tháng tiếp theo ở Ghana với mức tin cậy 95%. RMSE của dự báo là 0.115453 cho thấy mô hình có độ tin cậy cao.
Roland Fannoh, George Otieno Orwa và Joseph K. Mung’atu (2012) đã mô hình hóa tỉ lệ lạm phát của Liberia thông qua mô hình ARIMA mùa với phương pháp Box-Jenkins. Nhóm tác giả tiến hành nghiên cứu động thái của
chuỗi tỉ lệ lạm phát tháng từ tháng 1/2006 đến tháng 12/2013 để đưa ra mô hình phù hợp là ARIMA(0; 1; 0)(2; 0; 0)12. Mô hình này có chỉ số Log- likelihood lớn nhất, có AIC, AIC điều chỉnh (AICc) và Normalized Bayesian Information Criterion (BIC) nhỏ nhất. Kiểm định ARCH-LM và kiểm định Ljung-Box (LB) cho thấy phần dư của mô hình là nhiễu trắng.
Nasiru Suleman và Solomo Sarpong (2012) cũng áp dụng phương pháp tương tự để xây dựng mô hình dự báo lạm phát ở Ghana. Các mô hình nhận dạng thử nghiệm là (p; 1; q)(2; 1; 1)12 với p={1; 3} và q={0; 1; 2; 3}. Sau khi so sánh giữa các mô hình nhận dạng thử nghiệm sao cho tối đa Log-likelihood và tối thiểu AIC, AICc, BIC, RMSE, MAPE, MAE, mô hình phù hợp nhất cho tỉ lệ lạm phát của Ghana là ARIMA(3; 1; 3)(2; 1; 1)12.
* Nghiên cứu tại Việt Nam:
Ông Nguyên Chương (2007) ứng dụng phương pháp Box-Jenkin xây dựng được mô hình ARIMA(0; 1; 1)(0;1;1)12 cho chuỗi CPI hàng tháng được thu thập theo phương pháp liên hoàn từ tháng 1/1996 đến tháng 12/2006. Tác giả kiểm định được chuỗi CPI không dừng, có tính mùa chu kì 12 tháng nên lấy sai phân bậc 1 rồi sai phân thứ 12 thì được chuỗi dừng. Các mô hình nhận dạng thử nghiệm là ARIMA(0; 1; 1)(0; 1; 1)12 , ARIMA(1; 1; 0)(1; 1; 0)12 và ARIMA(1; 1; 1)(1; 1; 1)12 . So sánh các tiêu chuẩn: z, Chi-Square, AIC, BIC, mô hình được lựa chọn để dự báo lạm phát Việt Nam trong 12 tháng tiếp theo là mô hình thứ 1.
Vương Thị Thảo Bình (2008) cũng tiến hành nghiên cứu dự báo lạm phát Việt Nam năm 2009 bằng mô hình ARIMA. Mẫu thống kê là chuỗi CPI theo tháng từ tháng 1/2001 đến tháng 12/2008 với năm gốc là 1994. Tác giả dùng ADF kiểm định thấy log(CPI) không dừng mà sai phân của log(CPI) dừng. Ngoài ra, tính mùa tồn tại trong mô hình. Kiểm định LB cho thấy các chuỗi phần dư là các nhiễu trắng. Xem xét đối chiếu tiêu chuẩn AIC, BIC của
2 mô hình nhận dạng thử: ARIMA(1; 1; 3)(1; 0; 0)12 và ARIMA(1; 1; 5)(1; 0; 0)12 , mô hình thu được là ARIMA(1; 1; 5)(1; 0; 0)12 cho chuỗi CPI đã được logarith hóa. Chỉ số CPI dự báo cho tháng 1, tháng 2 năm 2009 lần lượt là 17.22%, 14.04% so với cùng kì năm trước. Kết quả khá chính xác so với công bố của Tổng cục Thống kê Việt Nam là 17.47% (tháng 1/2009) và 14.76% (tháng 2/2009).
Vương Quốc Duy và Huỳnh Hải Âu (2013) tiến hành nghiên cứu dự báo lạm phát giai đoạn tháng 8/2013-7/2014 trên chuỗi tỉ lệ lạm phát hàng tháng từ tháng 1/2000 đến tháng 8/2013 với phương pháp tương tự. Tỉ lệ lạm phát hàng tháng được tính theo mức thay đổi của CPI so với tháng trước. Chuỗi tỉ lệ lạm phát có tính mùa và là chuỗi dừng qua các kiểm định: ADF, Perron-Phillips và biểu đồ SAC, SPAC. Các giá trị nhận dạng: p={1; 2}, q={1; 2; 3}, P=2, Q=3, S=12. So sánh các tiêu chuẩn: R2 điều chỉnh, Log Likelihood, AIC, BIC và RSS, hai tác giả đã tìm ra mô hình phù hợp cho chuỗi tỉ lệ lạm phát là mô hình ARIMA(1; 0;1)(2;0; 3)12 đã loại bỏ biến SAR(12), MA(1), SMA(12), SMA(36).
Gần đây nhất, phương pháp này cũng được Hà Quỳnh Hoa (2014) vận dụng để xây dựng mô hình dự báo lạm phát ở Việt Nam. Số liệu phục vụ nghiên cứu là chuỗi giá trị CPI theo tháng từ tháng 1/2000 đến tháng 2/2014. Qua kiểm định ADF, tác giả nhận định chuỗi CPI không dừng, chuỗi log(CPI) có tính mùa S=12. Loại bỏ tính mùa và lấy sai phân bậc 1 thì được chuỗi dừng. Hai mô hình nhận dạng được là ARIMA(3; 1; 2)(0; 1; 1)12 và ARIMA(9; 1; 2)(0; 1; 1)12. Tác giả dùng kiểm định DF cho phần dư để kết luận phần dư của 2 mô hình đều tuân theo nhiễu trắng. Giá trị R2 cao, sai số dự báo chấp nhận được nên cả 2 mô hình được tác giả sử dụng để dự báo lạm phát Việt Nam cho năm 2014 và 2015. Tốc độ tăng CPI của tháng 12/2014 so với tháng 13/2013 được dự báo từ 2 mô hình lần lượt là 6.65% và 7.14%.
Như vậy, trước sự cần thiết phải ứng dụng phương pháp định lượng vào dự báo lạm phát tại Việt Nam, với những ưu điểm cùng tính hiệu quả trong dự báo ngắn hạn và sự phù hợp với thực tiễn Việt Nam, mô hình ARIMA là một lựa chọn thích hợp. Bên cạnh đó, các nghiên cứu thực nghiệm trước đây cũng cho thấy tính ứng dụng cao của phương pháp Box-Jenkins. Do đó, đề tài vẫn sử dụng phương pháp này để lập mô hình và dự báo lạm phát Việt Nam trong 12 tháng tới.
2.3. THIẾT KẾ NGHIÊN CỨU DỰ BÁO LẠM PHÁT VIỆT NAM BẰNG MÔ HÌNH ARIMA BẰNG MÔ HÌNH ARIMA
2.3.1. Phương pháp nghiên cứu
Đề tài sử dụng phương pháp Box-Jenkins để xây dựng mô hình ARIMA dự báo lạm phát Việt Nam. Phương pháp này tiến hành dự báo lạm phát chỉ dựa trên việc xem xét chính chuỗi giá trị lạm phát trong quá khứ. Box – Jenkins (1976) đã đưa ra quy trình dự báo đối với dữ liệu chuỗi thời gian bằng mô hình ARIMA gồm các bước sau:
Bước 1: Nhận dạng mô hình. Bước 2: Ước lượng mô hình. Bước 3: Kiểm định mô hình. Bước 4: Dự báo.
Nếu mô hình ước lượng được không thỏa mãn các kiểm định ở bước 3 thì ta phải tìm mô hình khác bằng cách quay lại bước 1. Quá trình này được lặp lại cho đến khi ta chọn được mô hình phù hợp nhất để tiến hành dự báo. Dữ liệu được nghiên cứu theo phương pháp Box – Jenkins phải là chuỗi dừng. Do vậy, trước khi nhận dạng mô hình, ta cần phải xem xét dữ liệu chuỗi lạm phát có dừng hay không và biến đổi thành chuỗi dừng nếu chưa dừng.
a. Xem xét tính dừng của chuỗi dữ liệu
thời đồ thị của chuỗi thời gian, biểu đồ hàm tự tương quan mẫu (SAC) và kiểm định nghiệm đơn vị của Dickey-Fuller.
- Dựa vào đồ thị của chuỗi dữ liệu:
Chuỗi thời gian có tính dừng nếu như đồ thị chuỗi thời gian = f(t) cho thấy dữ liệu có xu hướng hội tụ xoay quanh một giá trị nhất định và những dao động xung quanh giá trị này là có giới hạn và gần như tương tự nhau. Điều này hàm ý rằng trung bình và phương sai của chuỗi dữ liệu không thay đổi theo thời gian.
- Dựa vào biểu đồ hàm tự tương quan mẫu:
Biểu đồ SAC của một chuỗi dừng có đặc điểm như một trong các trường hợp sau:
Thứ nhất, hệ số SAC ở tất cả độ trễ có thể bằng 0, lúc này chuỗi có sai
số ngẫu nhiên và không có tính xu thế.
Thứ hai, SAC của chuỗi giảm đột ngột về giá trị 0, hệ số SAC rất lớn ở
độ trễ 1, 2 hoặc 3 và có ý nghĩa thống kê. Những SAC lớn này được xem là những đỉnh của biểu đồ và ta nói rằng SAC giảm đột ngột sau độ trễ k nếu không có những đỉnh ở độ trễ lớn hơn k (trừ các đỉnh ở độ trễ mùa, nếu có). Hầu hết, SAC sẽ giảm đột ngột sau độ trễ 1 hoặc 2.[7]
Thứ ba, SAC của chuỗi giảm dần nhanh về giá trị 0 trong vài độ trễ đầu
tiên (thường không nhiều hơn 5 độ trễ đầu), tức là hệ số SAC ở vài độ trễ đầu tiên khác 0 có ý nghĩa thống kê và không có đỉnh ở các độ trễ còn lại. SAC có