Dự báo với mô hình ARIMA

CHƯƠNG 3: SỬ DỤNG MỘT SỐ MÔ HÌNH DỰ BÁO GIÁ CỔ PHIẾU NGÀNH THẫP TRấN SÀN HOSE

3.2.1. Dự báo với mô hình ARIMA

Số liệu được dùng để xây dựng mô hình ARIMA là chuỗi giá đóng cửa của 3 cổ phiếu từ ngày 4/1/2010 – 23/3/2011 (bao gồm 301 quan sát)

3.2.1.1. Mô hình ARIMA áp dụng cho cổ phiếu HLA

Hình 2: Đồ thị chuỗi HLA 8 12 16 20 24 28 50 100 150 200 250 300 HLA

Từ đồ thị ta có thể thấy chuỗi giá HLA không dừng. Dùng kiểm định nghiệm đơn vị để kiểm tra tính dừng của chuỗi.

ADF Test Statistic -2.810754 1% Critical Value* -3.9922 5% Critical Value -3.4263 10% Critical Value -3.1360

Từ bảng thống kê DF ta thấy: |τ| <|τα| ở cả 3 mức ý nghĩa. Do vậy chuỗi giá HLA không dừng.

Đối với chuỗi giá cp HLA theo thời gian có tồn tại tính mùa vụ sẽ không có tính dừng. Điều này mô tả tương đối chính xác với thực tế của cổ phiếu ngành thép, đó là vào mùa cao điểm về xây dựng ( bắt đầu từ tháng 2, 3, 4) cả giá và sản lượng tiêu thụ tăng mạnh; nhưng vào những tháng cuối năm ngành xây dựng hoạt động chậm do ảnh hưởng của mưa bão nên mức tiêu thụ thép thấp. Đây là nguyên nhân dẫn tới “súng” HLA.

Tính mùa vụ nhận diện dựa vào đồ thị ACF và PACF. Nếu sau m giá trị hàm tự tương quan lại có giá trị cao, đó là dấu hiệu của tính mùa vụ.

Vì vậy, để khử tính mùa vụ cách đơn giản nhất là lấy sai phân. Đặt D_HLA(t) = HLA(t)- HLA(t-1). Ta có đồ thị của chuỗi sai phân D_HLA:

Hình 5: Đồ thị chuỗi sai phân bậc nhất của HLA

-1.5-1.0 -1.0 -0.5 0.0 0.5 1.0 1.5 50 100 150 200 250 300 D_HLA

Bảng 5: Kiểm định tính dừng cho chuỗi sai phân bậc nhất của HLA

ADF Test Statistic -14.39987 1% Critical Value* -2.5725 5% Critical Value -1.9406 10% Critical Value -1.6162 *MacKinnon critical values for rejection of hypothesis of a unit root.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(D_HLA)

Method: Least Squares Date: 04/24/11 Time: 16:17 Sample(adjusted): 3 301

Included observations: 299 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. D_HLA(-1) -0.815170 0.056610 -14.39987 0.0000 R-squared 0.410296 Mean dependent var -0.003679 Adjusted R-squared 0.410296 S.D. dependent var 0.620851 S.E. of regression 0.476765 Akaike info criterion 1.359753 Sum squared resid 67.73688 Schwarz criterion 1.372129 Log likelihood -202.2831 Durbin-Watson stat 1.986725

|τ| = 14.39987 >|τα| ở cả ba mức ý nghĩa α chứng tỏ chuỗi D_HLA là chuỗi dừng. Ta xem xét lược đồ tương quan của chuỗi D_HLA:

Từ lược đồ tương quan, tại k=1 thì SAC và PAC đạt cực đại 0.176 và sau đó giảm mạnh xuống. Do đó p, q có thể nhận giá trị 1. Nên ta ước lượng mô hình ARIMA(1, 1, 0), ARIMA(1, 1, 1) vàARIMA(0, 1, 1).

Mô hình 1:

Bảng 6: Kết quả ước lượng mô hình ARIMA(1, 1, 0) cho chuỗi D_HLA

Dependent Variable: D_HLA Method: Least Squares

Date: 04/24/11 Time: 16:32 Sample(adjusted): 3 301

Included observations: 299 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.

R-squared 0.023497 Mean dependent var -0.051505 Adjusted R-squared 0.023497 S.D. dependent var 0.482467 S.E. of regression 0.476765 Akaike info criterion 1.359753

Sum squared resid 67.73688 Schwarz criterion 1.372129

Log likelihood -202.2831 Durbin-Watson stat 1.986725

Mô hình 2:

Bảng 7: Kết quả ước lượng mô hình ARIMA(1, 1, 1) cho chuỗi D_HLA Dependent Variable: D_HLA

Method: Least Squares Date: 04/24/11 Time: 16:42 Sample(adjusted): 3 301

Included observations: 299 after adjusting endpoints Convergence achieved after 9 iterations

Backcast: 2

Variable Coefficient Std. Error t-Statistic Prob.

D_HLA(-1) 0.066092 0.262985 0.251316 0.8017

MA(1) 0.122705 0.263135 0.466318 0.6413

R-squared 0.024200 Mean dependent var -0.051505 Adjusted R-squared 0.020915 S.D. dependent var 0.482467 S.E. of regression 0.477395 Akaike info criterion 1.365722

Sum squared resid 67.68814 Schwarz criterion 1.390475

Log likelihood -202.1755 Durbin-Watson stat 1.996005

Mô hình 3:

Bảng 8: Kết quả ước lượng mô hình ARIMA(0, 1, 1) cho chuỗi D_HLA Dependent Variable: D_HLA

Method: Least Squares Date: 04/24/11 Time: 16:44 Sample(adjusted): 2 301

Included observations: 300 after adjusting endpoints Convergence achieved after 5 iterations

Backcast: 1

Variable Coefficient Std. Error t-Statistic Prob.

MA(1) 0.182360 0.056815 3.209719 0.0015

R-squared 0.024407 Mean dependent var -0.048333 Adjusted R-squared 0.024407 S.D. dependent var 0.484782 S.E. of regression 0.478830 Akaike info criterion 1.368385

Sum squared resid 68.55414 Schwarz criterion 1.380731 Log likelihood -204.2578 Durbin-Watson stat 1.982080

Bây giờ cần lựa chọn mô hình tốt nhất để dự báo, sử dụng tiêu chuẩn Akaike và Schwarz.

Mô hình Số quan sát AIC Schwarz

ARIMA(1, 1, 0) 299 1.359753 1.372129

ARIMA(1, 1, 1) 299 1.365722 1.390475

ARIMA(0, 1, 1) 299 1.368385 1.368385

Vậy mô hình ARIMA(1,1,0) là phù hợp nhất vì hai chỉ số AIC và Schwarz nhỏ hơn 2 mô hình còn lại.

Tiếp theo, ta sẽ kiểm định tính thích hợp của mô hình này bằng cách kiểm định chuỗi phần dư et có phải là nhiễu trắng hay không? Nếu thỏa mãn thì mô hình này thích hợp.

Bảng 9: Kiểm định tính dừng của et

ADF Test Statistic -17.12663 1% Critical Value* -2.5725 5% Critical Value -1.9406 10% Critical Value -1.6162 *MacKinnon critical values for rejection of hypothesis of a unit root.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(E)

Method: Least Squares Date: 04/24/11 Time: 17:01 Sample(adjusted): 4 301

Included observations: 298 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.

E(-1) -0.993761 0.058024 -17.12663 0.0000

R-squared 0.496884 Mean dependent var 1.11E-05 Adjusted R-squared 0.496884 S.D. dependent var 0.673137 S.E. of regression 0.477460 Akaike info criterion 1.362678 Sum squared resid 67.70657 Schwarz criterion 1.375085 Log likelihood -202.0391 Durbin-Watson stat 1.972237

Từ kết quả ước lượng cho thấy chuỗi phần dư et là nhiễu trắng. Vậy ta thu được kết quả sau:

HLAt- HLAt-1= 0.184830* (HLAt-1- HLAt-2)

Hay HLAt = 1.184830*HLAt-1-0.184830* HLAt-2

Từ đó ta có thể dự báo giá cp HLA cho 10 phiên tiếp theo.

Bảng 10: Kết quả dự báo giá cp HLA theo mô hình ARIMA

Ngày Giá dự báo Giá thực tế Chênh lệch

24/3/2011 9.563034 9.5 0.66% 25/3/2011 9.481517 9.5 0.19% 28/3/2011 9.5 9.4 1.06% 29/3/2011 9.381517 9.2 1.97% 30/3/2011 9.163034 9.1 0.69% 9.081517 9.1 0.20%

31/3/2011

1/4/2011 9.1 9 1.11%

4/4/2011 8.981517 9 0.21%

5/4/2011 9 9 0.00%

6/4/2011 9 9 0.00%

Với độ tin cậy là 95% ta thấy các giá trị dự báo có thể chấp nhận được. Và ở 2 phiên đầu tiên 24/3 và 25/3/2011 cho kết quả chính xác hơn cả. Các giá trị dự báo về sau mức độ chính xác có giảm dần. Tuy nhiên, giá trị dự báo của 3 phiên cuối ( 5/4 và 6/4/2011) cho kết quả giống như giá trị thực tế. Điều này được giải thích là do giá trị dự báo của 2 ngày này phụ thuộc vào 2 ngày trước đó, mà 4 phiên liên tiếp từ 1/4 đến 6/4/2011 giá cp HLA giữ nguyên ở mức giá 9.

3.2.1.2. Mô hình ARIMA áp dụng cho cổ phiếu HPG

2832 32 36 40 44 48 50 100 150 200 250 300 HPG

Dùng kiểm định nghiệm đơn vị để kiểm tra tính dừng của chuỗi giá HPG.

Bảng 11: Thống kê DF của chuỗi HPG

ADF Test Statistic -2.697997 1% Critical Value* -3.9922 5% Critical Value -3.4263 10% Critical Value -3.1360

Từ bảng thống kê DF ta thấy: |τ|< |τα| ở cả 3 mức ý nghĩa. Do vậy chuỗi giá HPG không dừng. Nên kiểm định tính dừng của chuỗi sai phân HPG.

Bảng 12: Kiểm định tính dừng cho chuỗi sai phân bậc nhất của HPG ADF Test Statistic -15.70581 1% Critical Value* -2.5725

5% Critical Value -1.9406 10% Critical Value -1.6162

*MacKinnon critical values for rejection of hypothesis of a unit root.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(D_HPG)

Method: Least Squares Date: 04/24/11 Time: 18:18 Sample(adjusted): 3 301

Included observations: 299 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. D_HPG(-1) -0.894938 0.056981 -15.70581 0.0000

|τ| = 15.70581>|τα| ở cả ba mức ý nghĩa α chứng tỏ chuỗi D_HPG là chuỗi dừng. Ta xem xét lược đồ tương quan của chuỗi D_HPG:

Hình 8: Lược đồ tương quan, tương quan riêng của D_HPG

Bảng 13: Kết quả ước lượng ARMA(3, 0) cho chuỗi D_HPG Dependent Variable: D_HPG

Method: Least Squares Date: 04/25/11 Time: 12:25 Sample(adjusted): 5 301

Included observations: 297 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. D_HPG(-3) -0.130310 0.056448 -2.308502 0.0217 R-squared 0.016310 Mean dependent var -0.026599 Adjusted R-squared 0.016310 S.D. dependent var 0.712105 S.E. of regression 0.706274 Akaike info criterion 2.145735 Sum squared resid 147.6517 Schwarz criterion 2.158172 Log likelihood -317.6416 Durbin-Watson stat 1.758183

Kiểm định chuỗi phần dư et có phải là nhiễu trắng hay không?

Bảng 14: Kiểm định tính dừng của chuỗi et

ADF Test Statistic -15.49355 1% Critical Value* -2.5725 5% Critical Value -1.9406 10% Critical Value -1.6162 *MacKinnon critical values for rejection of hypothesis of a unit root.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(E2)

Method: Least Squares Date: 04/25/11 Time: 12:29 Sample(adjusted): 6 301

Included observations: 296 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.

R-squared 0.448610 Mean dependent var 0.007976 Adjusted R-squared 0.448610 S.D. dependent var 0.938047 S.E. of regression 0.696553 Akaike info criterion 2.118026 Sum squared resid 143.1298 Schwarz criterion 2.130493 Log likelihood -312.4678 Durbin-Watson stat 2.017581

Chuỗi phần dư là nhiễu trắng, nên mô hình là thích hợp. Vậy ta thu được kết quả sau:

HPGt- HPGt-1= -0.889662* (HPGt-3- HPGt-4)

Hay HPGt = -0.889662* (HPGt-3- HPGt-4) + HPGt-1

Vậy ta có thể dự báo giá cp HPG cho 6 phiên tiếp theo.

Bảng 15: Kết quả dự báo giá cp HPG theo mô hình ARIMA

Ngày Giá dự báo Giá thực tế Chênh lệch

18/3/2011 - 35 21/3/2011 - 34.5 22/3/2011 - 35 23/3/2011 - 35.5 24/3/2011 35.94483 35.8 0.405% 25/3/2011 35.35517 36 0.000% 28/3/2011 35.55517 36.1 1.532% 29/3/2011 35.8331 36 0.466% 30/3/2011 35.82207 35.2 1.767%

31/3/2011

35.11103 35 0.317%

3.2.1.3. Mô hình ARIMA áp dụng cho cổ phiếu SMC

Hình 9: Đồ thị chuỗi SMC 16 20 24 28 32 36 50 100 150 200 250 300 SMC

Dùng kiểm định nghiệm đơn vị để kiểm tra tính dừng của chuỗi giá SMC.

Bảng 16: Thống kê DF của chuỗi SMC

ADF Test Statistic -2.769388 1% Critical Value* -3.9922

5% Critical Value -3.4263 10% Critical Value -3.1360

Từ bảng thống kê DF ta thấy: |τ| <|τα| ở cả 3 mức ý nghĩa. Do vậy chuỗi giá SMC không dừng. Nên kiểm định tính dừng của chuỗi sai phân SMC.

ADF Test Statistic -16.41780 1% Critical Value* -2.5725

5% Critical Value -1.9406 10% Critical Value -1.6162

|τ| = 16.41780 >|τα| ở cả ba mức ý nghĩa α chứng tỏ chuỗi D_SMC là chuỗi dừng. Ta xem xét lược đồ tương quan của chuỗi D_SMC:

Hình 9: Lược đồ tương quan, tương quan riêng của D_SMC

Từ đồ thị trên, ta thấy chuỗi sai phân bậc nhất D_SMC không có dấu hiệu của tự tương quan. Nên mô hình ARIMA không thích hợp để dự báo giá cp SMC giai đoạn này.

Nhận xét:

Qua các giá trị dự báo được ở trên, ta thấy các giá trị này xấp xỉ giá trị thực tế. Điều này chứng tỏ độ tin cậy của mô hình ARIMA. Vì trọng tâm của phương pháp này là phân tích tính chất xác suất hay ngẫu nhiên của bản thân các biến theo triết lý “ hãy để dữ liệu tự núi”. Nờn ưu điểm nữa của mô hình này là không cần các biến giải thích khác vẫn có thể dự báo được biến thông qua biến trễ và các sai số ngẫu nhiên. Tuy nhiên, mô hình

ARIMA chỉ là mô hình tốt dự báo trong ngắn hạn ( trong 1, 2 chu kì đầu), còn nếu cho những chu kì xa ngoài mẫu sẽ dẫn tới sai số lớn, kết quả dự báo có độ chính xác không cao. Hoặc trong một vài phiên giao dịch do tác động của các yếu tố ngoại lai lớn như tâm lý nhà đầu tư, tác động của thị trường chứng khoán khác, thông tin về sự thay đổi của chớnh sỏch… cũng sẽ làm cho sai số trong mô hình dự báo tăng cao nên mô hình vẫn chỉ mang tính chất tham khảo nhiều hơn.

Và mô hình ARIMA tiếp cận theo phương pháp Box-Jenkins giới thiệu cách xây dựng mang tính chất đại cương. Do hạn chế về không gian nên phương pháp này có nhiều khía cạnh chưa xem xét như tính biến đổi theo mùa, các cú sốc: lãi suất, áp lực canh tranh… Và tìm cách loại bỏ tác động của các yếu tố này bẳng các cách khác nhau.

Vậy, với mô hình ARIMA này ta đưa ra được kinh nghiệm là chỉ nên dự báo cho ngắn hạn. Còn nếu muốn dự báo cho dài hạn thì ta phải update số liệu liên tục, nguồn dữ liệu đầu vào phải được thu thập một cách khoa học, chính xác. Tuy nhiên, với những người có kinh nghiệm và am hiểu về phương pháp này, thì họ lại biết cách điều chỉnh các hệ số mà vẫn thu được các ước lượng tốt.

Dự báo với mô hình ARCH/ GARCH