Chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình vàphương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phươngsai giữa hai đoạn chỉ ph
Trang 1TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH
BÀI NHÓM Môn: Kinh tế lượng ứng dụng trong tài chính
THÔNG TIN BÀI THI
Bài thi có: (bằng số): 29 trang
(bằng chữ): hai mươi chín trang
NHÓM 6 ST
Trang 2DỰ BÁO MÃ CHỨNG KHOÁN “VCB” BẰNG PHƯƠNG PHÁP ARIMA Bước 1: Xác định chuỗi chứng khoán VCB có phải chuỗi dừng hay không? Chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và
phương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phươngsai giữa hai đoạn chỉ phụ thuộc vào khoảng cách hay độ trễ về thời gian giữa hai thờiđoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính(Ramanathan, 2002)
Cách 1: Căn cứ vào biểu đồ Graph
Điều kiện để chuỗi chứng khoán VCB là chuỗi dừng:
Trang 3Lý thuyết: Xu thế (Trend) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong của
một chuỗi thời gian Thường được ký hiệu là T
Ứng dụng:
Nhìn tổng quan các giai đoạn tại đồ thị hình 1.1, ta thấy chuỗi chứng khoán VCBkhông có trend, cụ thể chuỗi chứng khoán VCB không có trend tại giai đoạn từ 9 – 13nhưng lại có trend tăng vào giai đoạn 18 - 21
Chu kỳ
Lý thuyết: Chu kỳ (Cyclical) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong
của thời kỳ Thông thường là trên 1 năm Người ta thường ký hiệu thành phần chu kỳ làC
Ứng dụng:
Muốn một chu kỳ xảy ra bình quân phải mất 10 năm, vậy để chu kỳ lặp lại bìnhquân cần khoảng 20 năm trở lên Trong hình 1.1, nhóm nhận thấy rằng chuỗi này kéo dàitrong khoảng 11 năm (từ 30/06/2009 đến 29/11/2021), do vậy có thể kết luận rằng chuỗichứng khoán VCB không có tính chu kỳ
Mùa
Lý thuyết:
Mùa (Seasonal) là những dao động mùa vụ rất thường được tìm thấy với dữ liệutheo quý, theo tháng, hoặc thậm chí theo tuần Nếu chỉ có dữ liệu theo năm thì không cóbiến động mùa Sự dao động mùa vụ liên quan đến kiểu thay đổi khá ổn định xuất hiệnhàng năm và kiểu thay đổi đó được lặp lại ở năm sau và các năm sau nữa Thường được
ký hiệu là S
Ứng dụng:
Trang 4Có thể nhận thấy rằng trong giai đoạn 2013 – 2017, không có sự tương đồng giữa cácquý theo từng năm Vì vậy có thể kết luận rằng chuỗi chứng khoán VCB không có tínhmùa.
Irregular Fluctuations
Lý thuyết:
Irregular Fluctuations: Gồm những thay đổi ngẫu nhiên hay không dự đoán trước
Trang 5được Những sự thay đổi bất thường là kết quả của vô số những sự kiện mà nếu xét riêng
lẻ thì không quan trọng gì, còn nếu kết hợp các sự kiện riêng lẻ đó lại thì có thể tạo ramột ảnh hưởng lớn Thành phần này được ký hiệu là u hay I
Ứng dụng: Nhìn vào hình 1.1, có thể nhận thấy rằng chuỗi chứng khoán VCB có tính Irregular Fluctuations
Trung bình:
Lý thuyết:
Giá trị trung bình hay còn được gọi là giá trị kỳ vọng (expected value) là bình quân toán học đơn giản của một tập hợp gồm hai hoặc nhiều số Giá trị trung bình của một tập hợp số đã cho có thể được tính theo nhiều cách, gồm có phương pháp trung bình
số học sử dụng tổng các số trong chuỗi và phương pháp trung bình hình học Tuy nhiên, tất cả các phương pháp chính để tính trung bình đơn giản của một chuỗi số bình thường đều tạo ra kết quả xấp xỉ bằng nhau
Điều kiện:
Ứng dụng:
Bảng thống kê trung bình qua từng giai đoạn
Tại giai đoạn từ 9 – 13, thấy được trung bình của chuỗi chứng khoán VCB là xấp xỉ 18;tuy nhiên vào giai đoạn từ 13 – 18, trung bình của nó lại rơi vào khoảng 41; tại giai đoạn
từ 18 – 21, trung bình của nó là xấp xỉ 82
Từ đó ta có thể thấy được trung bình của từng giai đoạn chênh nhau một khoảng rất lớn,
cụ thể trung bình ở giai đoạn 9 – 13 với giai đoạn 13 – 18 chênh lệch nhau 23; ở giaiđoạn 13 – 18 với giai đoạn 18 – 21 chênh lệch nhau 41; ở giai đoạn 9-13 với 18 - 12chênh lệch nhau 64 Vì thế dễ dàng thấy được trung bình không phải là một hằng số Ta
có thể kết luận trung bình của chuỗi chứng khoán VCB thay đổi
Phương sai:
Trang 6Lý thuyết:
Phương sai (Variance) là phép đo mức chênh lệch giữa các số liê ru trong một tập
dữ liệu trong thống kê Nó đo khoảng cách giữa mỗi số liê ru với nhau và đến giá trị trungbình của tâ rp dữ liê ru
Điều kiện:
Ứng dụng:
Bảng thống kê biên độ dao động của chuỗi VCB qua từng giai đoạn
Xét giai đoạn 9 – 13, ta thấy biên độ giao động của chuỗi chứng khoán VCB là khoảng
từ 10 – 20, nhưng biên độ dao động của chuỗi chứng khoán VCB ở giai đoạn 13 – 18 là
từ 16 – 70 và biên độ dao động của nó trong giai đoạn 18 – 21 rơi vào khoảng 50 – 118
Từ đó ta thấy khoảng dao động của từng giai đoạn chênh lệch nhau rất nhiều, cụ thể ởgiai đoạn 9 – 13 biên độ dao động chênh lệch nhau trong khoảng 10; ở giai đoạn 13 – 18biên độ dao động chênh lệch nhau trong khoảng 54; ở giai đoạn 9 – 13 biên độ dao độngchênh lệch nhau trong khoảng 68 Ta thấy biên độ dao động tại từng khoảng có sự thayđổi Nên có thể kết luận phương sai của chuỗi chứng khoán VCB thay đổi
Hiệp phương sai:
Lý thuyết: Hiệp phương sai (Covariance) là đại lượng phản ánh mức độ tương quan
tuyến tính của hai biến số
Điều kiện:
Ứng dụng:
Ta có: phương sai thay đổi, trung bình thay đổi, vì thế kết luận rằng hiệp phương saithay đổi
Trang 7Kết luận:
Do chuỗi chứng khoán VCB không thỏa mãn đủ cả 3 điều kiện để là chuỗi dừng,
cụ thể là phương sai, trung bình và hiệp phương sai của chuỗi chứng khoán VCB đềuthay đổi nên chuỗi chứng khoán VCB không phải chuỗi dừng
Cách 2: Căn cứ kiểm định nghiệm Dickey and Fuller
Lý thuyết:
Kiểm định nghiệm đơn vị (Unit Root Test) là một kiểm định được sử dụng kháphổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phươngtrình tự hồi quy như sau:
Auto regressive function:
AR(1): Y t Y t 1 u t với u t~iid N0;2
t
u là nhiễu trắng.
Nếu 1:chuỗi dừng
Nếu 1: chuỗi có nghiệm đơn vị (chuỗi không dừng).
Nếu 1: chuỗi bị bùng nổ (explosive series)
Augmented Dickey-Fuller test statistic 0.314102 0.9791
Test critical values: 1% level -3.432269
Trang 8*MacKinnon (1996) one-sided p-values.
Vậy với giá trị Prob > (0.9791 > 0.01) Chưa đủ cơ sở bác bỏ H0
Chuỗi VCB không phải là chuỗi dừng
Bước 2: Xử lí chuỗi VCB không dừng thành chuỗi DVCB là chuỗi dừng.
Hình 1.2
Bước 3: Xác định chuỗi DVCB có phải là chuỗi dừng hay không
Trang 9Chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và
phương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phươngsai giữa hai đoạn chỉ phụ thuộc vào khoảng cách hay độ trễ về thời gian giữa hai thờiđoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính(Ramanathan, 2002)
Cách 1: Căn cứ vào biểu đồ Graph
Điều kiện để chuỗi DVCB là chuỗi dừng:
Lý thuyết: Xu thế (Trend) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong của
một chuỗi thời gian Thường được ký hiệu là T
Trang 10Ứng dụng: Nhìn vào đồ thị hình 1.3, chuỗi DVCB có hướng nằm ngang vậy nên chuỗiDVCB không có trend.
Chu kỳ:
Lý thuyết: Chu kỳ (Cyclical) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong
của thời kỳ Thông thường là trên 1 năm Người ta thường ký hiệu thành phần chu kỳ làC
Ứng dụng:
Muốn một chu kỳ xảy ra bình quân phải mất 10 năm, vậy để chu kỳ lặp lại bìnhquân cần khoảng 20 năm trở lên Trong hình 1.3, nhóm nhận thấy rằng chuỗi DVCB kéodài trong khoảng 11 năm (từ 30/06/2009 đến 29/11/2021), do vậy có thể kết luận rằngchuỗi DVCB không có tính chu kỳ
Mùa:
Lý thuyết:
Mùa (Seasonal) là những dao động mùa vụ rất thường được tìm thấy với dữ liệutheo quý, theo tháng, hoặc thậm chí theo tuần Nếu chỉ có dữ liệu theo năm thì không cóbiến động mùa Sự dao động mùa vụ liên quan đến kiểu thay đổi khá ổn định xuất hiệnhàng năm và kiểu thay đổi đó được lặp lại ở năm sau và các năm sau nữa Thường được
ký hiệu là S
Ứng dụng:
Ta thấy rằng chuỗi DVCB trong giai đoạn 2009 – 2021, tất cả các quý theo các năm đều có sự thay đổi “đi ngang” nên có thể đưa ra kết luận rằng chuỗi DVCB có tính mùa
Irregular Fluctuations:
Lý thuyết:
Trang 11Irregular Fluctuations: Gồm những thay đổi ngẫu nhiên hay không dự đoán trướcđược Những sự thay đổi bất thường là kết quả của vô số những sự kiện mà nếu xét riêng
lẻ thì không quan trọng gì, còn nếu kết hợp các sự kiện riêng lẻ đó lại thì có thể tạo ramột ảnh hưởng lớn Thành phần này được ký hiệu là u hay I
Ứng dụng: Nhìn vào hình 1.3, có thể nhận thấy rằng chuỗi DVCB có tính IrregularFluctuations
Trung bình:
Lý thuyết:
Giá trị trung bình hay còn được gọi là giá trị kỳ vọng (expected value) là bình quân toán học đơn giản của một tập hợp gồm hai hoặc nhiều số Giá trị trung bình của một tập hợp số đã cho có thể được tính theo nhiều cách, gồm có phương pháp trung bình
số học sử dụng tổng các số trong chuỗi và phương pháp trung bình hình học Tuy nhiên, tất cả các phương pháp chính để tính trung bình đơn giản của một chuỗi số bình thường đều tạo ra kết quả xấp xỉ bằng nhau
Điều kiện:
Ứng dụng:
Ta thấy dữ liệu của chuỗi DVCB có xu hướng xoay quanh giá trị 0, cụ thể xéttrung bình ở các giai đoạn: 9 - 13, 13 - 18, 18 – 21, ta có thể nhận thấy rằng trung bìnhcủa các giai đoạn đều gần như bằng 0 Từ đó kết luận trung bình của chuỗi DVCBkhông thay đổi, là một hằng số
Phương sai:
Lý thuyết:
Phương sai (Variance) là phép đo mức chênh lệch giữa các số liê ru trong một tập
dữ liệu trong thống kê Nó đo khoảng cách giữa mỗi số liê ru với nhau và đến giá trị trungbình của tâ rp dữ liê ru
Điều kiện:
Trang 12Ứng dụng:
Chọn khoảng biên độ dao động cho phép là từ -3 tới 3, ta thấy biên độ dao độngqua từng giai đoạn khá đều nhau và vẫn trong khoảng biên độ dao động đã chọn, mặtkhác có một số giai đoạn tồn tại dao động với biên độ vượt quá khoảng biên độ daođộng đã chọn Cụ thể là tại giai đoạn 17 – 21, có những dao động với biên độ từ -4 tới 4,
từ -5 tới 5, Tuy nhiên với những dao động đó, số quan sát vượt qua biên độ (khoảng
200 quan sát) so với tổng số quan sát trong dữ liệu chạy (3103 quan sát) là không đáng
kể, tỷ lệ sai sót chỉ ở mức xấp xỉ 6,5%, vẫn trong mức sai sót chấp nhận được (mức ýnghĩa α = 10%) Vì thế, biên độ dao động chênh lệch không nhiều, ta kết luận phươngsai không thay đổi
Hiệp phương sai:
Lý thuyết: Hiệp phương sai (Covariance) là đại lượng phản ánh mức độ tương quan
tuyến tính của hai biến số
Cách 2: Căn cứ kiểm định nghiệm Dickey and fuller
Lý thuyết:
Kiểm định nghiệm đơn vị (Unit Root Test) là một kiểm định được sử dụng kháphổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phương
Trang 13trình tự hồi quy như sau:
Auto regressive function:
AR(1): Y t Y t 1 u t với u t~iid N0;2
t
u là nhiễu trắng.
Nếu 1:chuỗi dừng
Nếu 1: chuỗi có nghiệm đơn vị (chuỗi không dừng)
Nếu 1: chuỗi bị bùng nổ (explosive series)
Augmented Dickey-Fuller test statistic -55.34086 0.0001
Test critical values: 1% level -3.432269
5% level -2.862274 10% level -2.567205
*MacKinnon (1996) one-sided p-values.
Vậy với giá trị Prob < (0.0001 < 0.01) Bác bỏ H0
Trang 14Mô hình ARIMA là một mô hình phân tích thống kê sử dụng dữ liệu chuỗi thời gian
để hiểu rõ hơn về tập dữ liệu hoặc để dự đoán các xu hướng trong tương lai
Tham số ARIMA: Mô hình ARIMA được biểu diễn dưới dạng ARIMA (p, d, q) trong
đó mỗi chữ cái tương ứng với một trong ba phần được mô tả ở trên Ba chữ cái này đạidiện cho các tham số mà bạn sẽ phải cung cấp và được mô tả như sau:
p xác định số thuật ngữ tự động hồi quy (AR)
d xác định thứ tự của sự khác biệt (I)
q xác định số điều kiện của đường trung bình động (MA)
Mô Hình Tự Hồi Quy Bậc p-AR(p)
Trong mô hình tự hồi qui quá trình phụ thuộc vào tổng có trọng số của các giá trị quákhứ và số hạng nhiễu ngẫu nhiên
Trong đó là nhiễu trắng
Mô Hình Trung Bình Trượt Bậc q – MA(q)
Trong Mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng có trọng
số của các ngẫu nhiên hiện hành có độ trễ
, t = 1,2, ,n
Trong đó ut là nhiễu trắng
Hàm tự tương quan (autocorrelation function, ACF)
Hàm tự tương quan đo lường phụ thuộc tuyến tính giữa các cặp quan sát y(t) vày(t+k), ứng với thời đoạn k = 1, 2, …(k còn gọi là độ trễ) Với mỗi độ trễ k, hàm tựtương quan tại độ trễ k được xác định qua độ lệch giữa các biến ngẫu nhiên so với cácgiá trị trung bình, và được chuẩn hóa qua phương sai
Xác định SACF:
Trang 15SACF có xu hướng giảm dần và tắt nhanh về 0 => chuỗi dừng
Hàm tự tương quan từng phần (Partial autocorrelation, PACF)
Hàm tự tương quan từng phần PACF đo mức độ phụ thuộc tuyến tính từng phần.Hàm tự tương quan từng phần tại độ trễ k được ước lượng bằng hệ số liên hệ y(t) trongmối kết hợp tuyến tính bên dưới Sự kết hợp được tính dựa trên tầm ảnh hưởng của y(t)
và các giá trị trung gian của:
y(t+k) y(t+k) = y(t+k-1) + y(t+k-2) + y(t + 1) + y(t) + e(t)
Trang 16Do nhóm chỉ lấy sai phân bậc 1 (ở bước 2) vì thế dựa trên bảng kết quả chạy trên EVIEW, nhóm đã thống kê được:
p= 2, 3, 4, 6, 9, 12, 19, 29
d= 1
q= 2, 3, 4, 6, 9, 29
Trang 17Từ đó, nhóm chọn ra 10 mô hình ARIMA sau: + Mô hình 1: ARIMA (2, 1, 2)
Included observations: 3100 after adjustments
Convergence achieved after 17 iterations
MA Backcast: 7/01/2009 7/02/2009
Variable Coefficient Std Error t-Statistic Prob
C 0.025859 0.016782 1.540901 0.1234 AR(2) -0.696389 0.106367 -6.547024 0.0000 MA(2) 0.752896 0.097640 7.710959 0.0000 R-squared 0.006211 Mean dependent var 0.026072 Adjusted R-squared 0.005569 S.D dependent var 0.906851 S.E of regression 0.904322 Akaike info criterion 2.637706 Sum squared resid 2532.724 Schwarz criterion 2.643550 Log likelihood -4085.444 Hannan-Quinn criter 2.639804 F-statistic 9.677768 Durbin-Watson stat 1.986567 Prob(F-statistic) 0.000065
2 ARIMA (2, 1, 2) (2, 1, 3)
Trang 18Câu lệnh: LS DVCB C AR(2) MA(2) MA(3)
Dependent Variable: DVCB
Method: Least Squares
Date: 12/12/21 Time: 18:30
Sample (adjusted): 7/03/2009 11/29/2021
Included observations: 3100 after adjustments
Convergence achieved after 14 iterations
MA Backcast: 6/30/2009 7/02/2009
Variable Coefficient Std Error t-Statistic Prob
C 0.025951 0.016454 1.577166 0.1149 AR(2) -0.372654 0.187998 -1.982226 0.0475 MA(2) 0.431097 0.182679 2.359867 0.0183 MA(3) -0.040453 0.016634 -2.431913 0.0151 R-squared 0.006413 Mean dependent var 0.026072 Adjusted R-squared 0.005451 S.D dependent var 0.906851 S.E of regression 0.904376 Akaike info criterion 2.638147 Sum squared resid 2532.208 Schwarz criterion 2.645940 Log likelihood -4085.128 Hannan-Quinn criter 2.640945 F-statistic 6.661308 Durbin-Watson stat 1.986698 Prob(F-statistic) 0.000176
Inverted MA Roots .09 -.05+.66i -.05-.66i
Included observations: 3100 after adjustments
Convergence achieved after 8 iterations
MA Backcast: 6/29/2009 7/02/2009
Variable Coefficient Std Error t-Statistic Prob
C 0.025886 0.016479 1.570858 0.1163 AR(2) -0.614706 0.154830 -3.970215 0.0001 MA(2) 0.661470 0.155479 4.254391 0.0000 MA(4) -0.023079 0.024451 -0.943887 0.3453 R-squared 0.006513 Mean dependent var 0.026072 Adjusted R-squared 0.005550 S.D dependent var 0.906851 S.E of regression 0.904331 Akaike info criterion 2.638047 Sum squared resid 2531.955 Schwarz criterion 2.645840 Log likelihood -4084.973 Hannan-Quinn criter 2.640845 F-statistic 6.765188 Durbin-Watson stat 1.988839 Prob(F-statistic) 0.000152
Inverted MA Roots .18
Trang 19Included observations: 3100 after adjustments
Convergence achieved after 16 iterations
MA Backcast: 6/25/2009 7/02/2009
Variable Coefficient Std Error t-Statistic Prob
C 0.025866 0.016850 1.535049 0.1249 AR(2) -0.664534 0.182455 -3.642172 0.0003 MA(2) 0.720204 0.178089 4.044072 0.0001 MA(6) 0.006587 0.024431 0.269599 0.7875 R-squared 0.006235 Mean dependent var 0.026072 Adjusted R-squared 0.005272 S.D dependent var 0.906851 S.E of regression 0.904458 Akaike info criterion 2.638327 Sum squared resid 2532.663 Schwarz criterion 2.646119 Log likelihood -4085.407 Hannan-Quinn criter 2.641125 F-statistic 6.474566 Durbin-Watson stat 1.987066 Prob(F-statistic) 0.000230
Inverted MA Roots 22+.21i 22-.21i
Included observations: 3100 after adjustments
Convergence achieved after 8 iterations
MA Backcast: 6/22/2009 7/02/2009
Variable Coefficient Std Error t-Statistic Prob
C 0.025854 0.016125 1.603322 0.1090 AR(2) -0.636372 0.077299 -8.232575 0.0000 MA(2) 0.700427 0.070870 9.883229 0.0000 MA(9) -0.069545 0.014427 -4.820646 0.0000 R-squared 0.014185 Mean dependent var 0.026072 Adjusted R-squared 0.013230 S.D dependent var 0.906851 S.E of regression 0.900832 Akaike info criterion 2.630295 Sum squared resid 2512.401 Schwarz criterion 2.638087 Log likelihood -4072.957 Hannan-Quinn criter 2.633093 F-statistic 14.84967 Durbin-Watson stat 1.981732 Prob(F-statistic) 0.000000