S D NG MƠ HÌNH ARIMA TRONG D BÁO GIÁ Cao Hào Thi Khoa Quản Lý Công Nghiệp Đại Học Bách Khoa Tp.HCM TÓM T T Mục tiêu nghiên cứu nhằm giới thiệu việc xây dựng mơ hình q trình ngẫu nhiên – Mơ Hình ARIMA, ứng dụng mơ hình việc dự báo Mơ hình giải thích biến động chuỗi thời gian cách quan hệ với giá trị khứ tổng có trọng số nhiễu ngẫu nhiên hành nhiễu ngẫu nhiên có độ trễ Mơ hình ứng dụng cách minh họa nhằm dự báo giá cá sông Thành Phố Hồ Chí Minh ABSTRACT The objective of this reseach is to introduce the construction of the model of stochastic processes – ARIMA model, and their use in forecasting This model explains the movement of the time series by relating it to the own past values and to the weighted sum of current and lagged random disturbances The model is also illustratively applied to forecast the price of riverfish in HoChiMinh City I GI I THIỆU Trong lãnh vực Kinh Tế Lượng, việc dự báo thường dựa hai loại mô hình mơ hình nhân mơ hình chuỗi thời gian Trong mơ hình nhân quả, kỹ thuật phân tích hồi qui sử dụng để thiết lập mối quan hệ biến phụ thuộc biến nguyên nhân Giá trị biến phụ thuộc dự báo theo giá trị biến nguyên nhân Đối với chuỗi thời gian, mơ hình ARIMA sử dụng để dự báo giá trị tương lai Theo mơ hình này, giá trị dự báo phụ thuộc vào giá trị khứ tổng có trọng số nhiễu ngẫu nhiên hành nhiễu ngẫu nhiên có độ trễ Mục tiêu nghiên cứu nhằm giới thiệu việc xây dựng mô hình q trình ngẫu nhiên – Mơ Hình ARIMA, ứng dụng mơ hình việc dự báo Mơ hình ứng dụng cách minh họa nhằm dự báo giá cá sông Thành Phố Hồ Chí Minh II MƠ HÌNH ARIMA Nhằm mục đích giới thiệu mơ hình Tự Hồi Qui Kết Hợp Trung Bình Trượt (ARIMA– AutoRegressive Integrated Moving Average), nội dung phần trình bày tóm lược số sở lý thuyết liên quan đến tính dừng (stationary), tính mùa vụ (seasonality), nguyên lý Box-Jenkin; số nguyên tắc để nhận dạng, xác định thông số và kiểm định mơ hình ARIMA Tính d ng Một trình ngẫu nhiên Yt xem dừng trung bình phương sai q trình khơng thay đổi theo thời gian giá trị đồng phương sai hai thời đoạn phụ thuộc vào khoảng cách hay độ trễ thời gian hai thời đoạn không phụ thuộc vào thời điểm thực tế mà đồng phương sai tớnh C th: ã Trung bỡnh: E(Yt ) = = const • Phương sai: Var (Yt ) = σ2 = const • Đồng phương sai: Covar (Yt , Yt-k ) = gk Tính dừng chuỗi thời gian nhận biết dựa đồ thị chuỗi thời gian, đồ thị hàm tự tương quan mẫu hay kiểm định Dickey-Fuller • Dựa đồ thị Yt = f(t), cách trực quan chuỗi Yt có tính dừng đồ thị cho thấy trung bình phương sai q trình Yt khơng thay đổi theo thời gian • γˆ k = SAC γˆ o Dựa vào hàm tự tương quan mẫu (SAC – Sample Auto Correllation) ρˆ k = γˆ k = E [( Y t − Y )( Y t − k − Y ) = γˆ o = E [( Y t − Y ) ] = ∑ (Y t ∑ (Y − Y )2 n t − Y ) (Y t − k − Y ) n = Cov (Y t , Y t − k ) = Var (Y t ) Nếu SAC = f(t) chuỗi thời gian giảm nhanh tắt dần chuỗi có tính dừng • Kiểm định Dickey-Fuller (kiểm định nghiệm đơn vị) nhằm xác định xem chuỗi thời gian có phải Bước Ngẫu Nhiên (Random Walk; nghĩa Yt = 1*Yt-1 + et) hay không Nếu chuỗi Bước Ngẫu Nhiên khơng có tính dừng Tuy nhiên, Nếu chuỗi khơng có tính dừng chưa Bước Ngẫu Nhiên Để biến đổi chuỗi không dừng thành chuỗi dừng, thông thường lấy sai phân lần hai lần chuỗi kết có tính dừng • Chuỗi gốc: Yt • Chuỗi sai phân bậc 1: Wt = Yt – Yt-1 • Chuỗi sai phân bậc 2: Vt = Wt – Wt-1 Tính mùa v Tính mùa vụ hành vi có tính chu kỳ chuỗi thời gian sở năm lịch Tính mùa vụ nhận dựa vào đồ thị SAC = f(t) Nếu sau m thời đoạn SAC lại có giá trị cao (nghĩa đồ thị SAC có đỉnh cao) dấu hiệu tính mùa vụ Chuỗi thời gian có tồn tính mùa vụ khơng có tính dừng Phương pháp đơn giản để khử tính mùa vụ lấy sai phân thứ m Nếu Yt có tính mùa vụ với chu kỳ m thời đoạn chuỗi Z t = Yt − Yt −m khảo sát thay chuỗi Yt Mơ hình ARIMA Theo Box- Jenkin q trình ngẫu nhiên có tính dừng biểu diễn mơ hình Tự Hồi Qui Kết Hợp Trung Bình Trượt ARIMA • Mơ Hình Tự Hồi Qui Bậc p - AR(p) Trong mơ hình tự hồi qui q trình phụ thuộc vào tổng có trọng số giá trị khứ số hạng nhiều ngẫu nhiên Yt = φ1Yt −1 + φ 2Yt − + + φ p Yt − p + δ + ε t • Mơ Hình Trung Bình Trượt Bậc q – MA(q) Trong mơ hình trung bình trượt, q trình mơ tả hồn tồn tổng có trọng số ngẫu nhiên hành có độ trễ Yt = µ + ε t −θ1ε t −1 −θ 2ε t −2 − −θ qε t −q • Mơ Hình Hồi Quy Kết Hợp Trung Bình Trượt - ARIMA(p,d,q) Phương trình tổng qt mơ hình ARIMA là: Yt = φ1Yt −1 + + φ pYt − p + δ + ε t − θ1ε t −1 − − θ qε t −q Nh n d ng mơ hình Nhận dạng mơ hình ARIMA(p,d,q) tìm giá trị thích hợp p, d, q Với d bậc sai phân chuỗi thời gian khảo sát, p bậc tự hồi qui q bậc trung bình trượt Việc xác định p q phụ thuộc vào đồ thị SPAC = f(t) SAC = f(t) Với SAC giới thiệu SPAC Tự Tương Quan Riêng Phần Mẫu (Sample Partial AutoCorrelation); nghĩa tương quan Yt Yt-p sau loại bỏ tác động Y trung gian • • Chọn mơ hình AR(p) đồ thị SPAC có giá trị cao độ trễ 1, 2, , p giảm nhiều sau p dạng hàm SAC giảm dần Chọn mơ hình MA(q) đồ thị SAC có giá trị cao độ trễ 1, 2, , q giảm nhiều sau q dạng hàm SPAC giảm dần Tóm lại, Dạng đồ thị SAC = f(t) Giảm dần Có đỉnh q Giảm dần Loại mơ hình AR(p) MA(q) ARMA(p, q) cl Dạng đồ thị SPAC = f(t) Có đỉnh p Giảm dần Giảm dần ng thơng số mơ hình ARIMA(p, d, q) Các thơng số fi qj mơ hình ARIMA xác định theo phương pháp bình phương tối thiểu (OLS-Ordinary Least Square) cho: ∑ ( Y t − Yˆ t ) → Min Với ε t = (Yt − Yˆt ) Kiểm tra chẩn đốn mơ hình Sau xác định p, d, q fi , qj; nghĩa xác định phương trình cho mơ hình ARIMA, điều cần phải làm tiến hành kiểm định xem số hạng et mơ hình có phải nhiễu trắng (white noise, nhiễu ngẫu nhiên túy) hay không Đây yêu cầu mơ hình tốt Về mặt lý thuyết, et tạo trình nhiều trắng nếu: E (ε t ) = + ε t ~ N (0, σ ε ) Var ( ε t ) = σ ε2 = const + γ k = Cov(ε t , ε t −k ) = Việc kiểm định tính nhiễu trắng dựa đồ thị SAC chuỗi et D báo Dựa phương trình mơ hình ARIMA, tiến hành xác định giá trị dự báo điểm khoảng tin cậy dự báo • • Dự báo điểm: Yˆt Khoảng tin cậy: Yˆt − k σ ( ε t ) < Y t < Yˆt + k σ ( ε t ) Với độ tin cậy 95%, k =2 III S D NG MƠ HÌNH ARIMA TRONG D BÁO GIÁ Để minh họa, nghiên cứu áp dụng mơ hình ARIMA việc dự báo giá cá sơng thành phố Hồ Chí Minh Nghiên cứu sử dụng chuỗi gồm 111 liệu tháng từ tháng 1/1990 đến tháng 3/1999 phần mềm EVIEWS để dự báo giá trị tháng 4/1999 Các liệu khứ giá cá sông đặt tên RFISH chuỗi sai phân bậc đặt tên DRFISH Đồ thị RFISH = f(t) DRFISH = f(t) trình bày sau: 40000 12000 36000 8000 32000 28000 4000 24000 20000 16000 -4000 12000 -8000 8000 4000 -12000 90 91 92 93 94 95 96 97 98 90 91 92 RFISH 93 94 95 96 97 98 DRFISH Đồ thị RFISH cho thấy chuỗi RFISH khơng có tính dừng Đồ thị DRFISH cho thấy chuỗi DRFISH khơng có tính dừng Qua đồ thị liệu ta nhận thấy chuỗi có tính mùa vụ theo quí Các kiểm định theo hàm tự tương quan mẫu hay kiểm định DickeyFuller EVIEWS cho cho thấy chuỗi RFISH DRFISH khơng có tính dừng liệu có tính mùa vụ Sử dụng phần mềm EVIEW để khử tính mùa vụ tiến hành thử nghiệm cho nhiều mơ hình ARIMA, cuối ta mơ hình tối ưu có dạng ARIMA(2,1,2) với thời đoạn khử tính mùa vụ m = 12 Kết thơng số fi qj trình bày bảng sau: Dependent Variable: D(RFISH) Method: Least Squares Date: 2/3/2002 Time: 18:17 Sample(adjusted): 1991:04 1999:03 Included observations: 96 after adjusting endpoints Convergence achieved after 50 iterations Backcast: 1990:02 1991:03 Variable Coefficien Std Error t t-Statistic Prob C AR(2) SAR(12) MA(2) SMA(12) -283.3601 0.413278 0.963121 -0.846851 -0.781433 1010.997 0.135466 0.044544 0.118603 0.078476 -0.280278 3.050799 21.62164 -7.140218 -9.957634 0.7799 0.0030 0.0000 0.0000 0.0000 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood Durbin-Watson stat 0.614807 0.597875 2248.588 4.60E+08 -874.5842 1.718345 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 203.1250 3545.923 18.32467 18.45823 36.31124 0.000000 Sau xác định phương trình cho mơ hình ARIMA, cần phải tiến hành kiểm định tính nhiễu trắng et Kết kiểm định dựa đồ thị SAC chuỗi et cho thấy et có tính nhiễu trắng trình bày sau: Date: 2/3/2002 Time: 18:20 Sample: 1991:04 1999:03 Included observations: 96 Q-statistic probabilities adjusted for ARMA term(s) Autocorrelation Partial Correlation AC |* .*| | | |* .*| | | | | | | *| | *| | | | | | | | | | 0.108 0.060 0.002 0.107 0.046 0.003 | | | | *| | *| | | | | | | | | | 10 | | | | 11 |* |* .| .*| | | | | |* .| .| .*| | | | | 12 13 14 15 *| | *| | 16 | .| | | | .*| | | 17 18 | .| | | | .*| | | 19 20 *| | *| | 21 *| | *| | 22 *| | *| | 23 *| | **| | 24 |** |* | | |** | | 25 26 | 0.027 0.069 0.040 0.008 0.035 0.176 0.069 0.010 0.059 0.168 0.021 0.050 0.031 0.017 0.112 0.094 0.083 0.177 0.198 0.133 PAC Q-Stat Prob 0.108 1.1485 - 1.5093 0.072 0.013 1.5099 0.115 0.021 0.005 0.031 0.076 0.037 0.011 0.046 0.173 0.011 0.025 0.079 0.133 0.064 0.085 0.057 0.060 0.087 0.099 0.084 0.248 0.221 0.014 2.6913 2.9138 0.088 2.9147 0.233 2.9925 0.393 3.5015 0.478 3.6719 0.598 3.6789 0.720 3.8174 0.801 7.2986 7.8428 7.8547 8.2589 0.505 0.550 0.643 0.690 11.559 0.482 11.614 0.560 11.915 0.613 12.036 0.676 12.072 0.739 13.648 0.692 14.771 0.678 15.649 0.681 19.750 0.474 24.964 0.249 27.356 0.198 .| | *| | 27 | | | | 28 | | *| | 29 | | | | 30 | | *| | 31 | | *| | 32 | | | | 33 *| | *| | 34 | | | | 35 | | |* | 36 0.053 0.039 0.024 0.017 0.005 0.062 0.013 0.070 0.023 27.733 0.226 27.944 0.262 28.023 0.307 28.065 0.355 - 28.069 0.407 0.075 - 28.084 0.460 0.010 0.059 - 0.061 28.084 0.513 0.002 - 28.878 0.524 0.072 0.075 - 29.128 0.563 0.040 0.028 0.045 0.117 29.450 0.596 Kết mô hình dự báo trình bày tập liệu RFISHF Đồ thị RFISH RFISHF trình bày chung sau: 40000 36000 32000 28000 24000 20000 16000 12000 8000 4000 90 91 92 93 94 RFISH 95 96 97 98 RFISHF Dựa phương trình mơ hình ARIMA, tiến hành xác định giá trị dự báo điểm khoảng tin cậy dự báo Dự báo điểm Yˆt = 26267 Đ Khoảng tin cậy 95% [ 21742 Đ, 30792 Đ] Sau có kết dự báo, ta đem so với giá trị thực vào tháng 4/1999 Yt = 26000 Đ Giá trị nằm khoảng tin cậy 95% xấp xỉ với giá trị dự báo điểm Sai số dự báo ( Yˆt -Yt)/ Yt *100 = (26267 – 26000)/26000 * 100 = 1,03% KẾT LU N Kết dự báo cho thấy đồ thị mơ hình dự báo RFISHF bám sát đồ thị chuỗi liệu gốc RFISH Điều chứng tỏ mơ hình ARIMA(2,1,2) giải thích sự biến động chuỗi thời gian giá cá sông Thành Phố Hồ Chí Minh Giá trị dự báo xấp xỉ với giá trị thực tế (sai số dự báo nhỏ) khoảng tin cậy 95% chứa giá trị thực Điều chứng tỏ độ tin cậy mơ hình dự báo Ngồi ví dụ minh họa trên, nghiên cứu áp dụng mơ hình ARIMA để dự báo cho 20 loại mặt hàng Thành Phố Hồ Chí Minh theo qui trình tương tự đạt kết dự báo với độ tin cậy cao Tóm lại, Mơ hình ARIMA mơ hình đáng tin cậy dự báo ngắn hạn TÀI LIỆU THAM KH O Bowerman B.L., and O’Connell R.T., 1993 Forecasting and Time Series 3rd ed., Wadsworth, Inc Cao Hào Thi Các Cộng Sự 1998 Bản Dịch Kinh Tế Lượng Cơ Sở (Basic Econometrics Gujarati D.N.) Chương Trình FulBright Giảng Dạy Kinh Tế Việt Nam EVIEWS, 2000 Quantitative Micro Software Pindyck R.S., and Rubinfeld D.L., 1991 Econometric Models and Economic Forecast 3rd ed., McGraw-Hill Ramanathan R., 2001 Introductory Econometrics with Applications 5th ed., Harcourt College Publishers Liên hệ Địa Tel Fax Email : Cao Hào Thi : Khoa Quản Lý Công Nghiệp, Đại Học Bách Khoa Tp HCM 268 Lý Thường Kiệt, Q.10, Tp HCM : 84 - - 8650460 : 84 -8 - 8635058 : chthi@sim.hcmut.edu.vn ... tin cậy 95%, k =2 III S D NG MƠ HÌNH ARIMA TRONG D BÁO GIÁ Để minh họa, nghiên cứu áp dụng mơ hình ARIMA việc dự báo giá cá sông thành phố Hồ Chí Minh Nghiên cứu sử dụng chuỗi gồm 111 liệu tháng... phương trình mơ hình ARIMA, tiến hành xác định giá trị dự báo điểm khoảng tin cậy dự báo Dự báo điểm Yˆt = 26267 Đ Khoảng tin cậy 95% [ 21742 Đ, 30792 Đ] Sau có kết dự báo, ta đem so với giá trị thực... tính nhiễu trắng dựa đồ thị SAC chuỗi et D báo Dựa phương trình mơ hình ARIMA, tiến hành xác định giá trị dự báo điểm khoảng tin cậy dự báo • • Dự báo điểm: Yˆt Khoảng tin cậy: Yˆt − k σ ( ε