Mục đích của bài nghiên cứu này là đo lường và dự báo mức biến động của thị trường chứng khoán Việt Nam. Để tạo ra một cơ sở dự báo vững chắc, thì việc xác định dữ liệu cho mô hình là vô cùng quan trọng. Đặc tính và thống kê mô tả của dữ liệu phải phù hợp với đặc điểm yêu cầu của mô hình. Nguồn dữ liệu được sử dụng trong bài nghiên cứu là bảng giá chứng khoán hàng ngày của thị trường chứng khoán Việt Nam trên HOSE, được lấy từ nguồn dữ liệu của Ủy ban chứng khoán Việt Nam. Tiếp theo nhóm nghiên cứu đi vào những đặc điểm cụ thể của nguồn dữ liệu này.
Chỉ số VN-Index là chỉ số bình quân gia quyền của các công ty niêm yết trên sàn HOSE, trọng số tùy theo mức vốn hóa thị trường của từng mã cổ phiếu. Tháng 7/2000 thị trường chứng khoán Việt Nam bắt đầu ra đời và hoạt động với mức khởi điểm 100 điểm, VN-Index có tính bao quát thị trường khá lớn, nổi bật hơn các nguồn dữ liệu sẵn có khác trên thị trường. Và việc lựa chọn chỉ số VN-Index biến động theo ngày, thay vì theo tuần hoặc theo quý, cũng để đáp ứng tính phù hợp và đặc tính của mô hình GARCH được sử dụng trong bài.
Thông qua bảng chỉ số VN-Index, nhóm nghiên cứu xây dựng bảng tỷ suất sinh lợi từng ngày của thị trường, từ đó xác định mức biến động trong kỳ. Tỷ suất sinh lợi này sẽ được tính toán theo kỳ liên tục, bằng cách sử dụng hàm logarit của chỉ số giá đóng cửa VN-Index của ngày kế tiếp so với ngày hôm nay.
= ln( ) − ln( ) = ln
Nguồn dữ liệu chứng khoán của Vn-Index được quan sát bắt đầu từ giai đoạn 3/2002 đến đầu năm 2011. Mặc dù thị trường chứng khoán Việt Nam bắt đầu từ 7/2000 nhưng chỉ từ tháng 3/2002 thị trường mới được bắt đầu giao dịch theo ngày, chính vì thế để phù hợp với yêu cầu tính tỷ suất sinh lợi theo ngày của mô hình nên nhóm quyết định chọn dãy dữ liệu kể từ 3/2002 trở về sau.
3.2 Lựa chọn mô hình đo lường rủi ro phù hợp cho thị trường Việt Nam 3.2.1 Xác định dạng mô hình đo lường phù hợp
Tuy việc sử dụng độ lệch chuẩn để đo lường rủi ro thị trường được sử dụng phổ biến do đặc thù của thị trường Việt Nam cũng như ưu thế dễ sử dụng của phương pháp này, nhưng vì những nhược điểm đã nêu ở chương 2 nên nhóm nghiên cứu đi tìm một phương pháp cho kết quả chính xác hơn, và vẫn đảm bảo dễ dàng áp dụng vào thị trường Việt Nam.
Theo kết quả phân tích dữ liệu của tỷ suất sinh lợi của TTCK Việt Nam theo từng ngày giai đoạn từ 3/2002 đến 3/2011, nhóm nghiên cứu nhận thấy được những đặc thù cùa thị trường thông qua việc chú ý vào những biến phân phối tỷ suất sinh lợi như: Skewness, Leptokurtosis và mức biến động từng ngày. Bảng thống kê mô tả dãy dữ liệu VN-Index từ 04/03/2002 đến 07/03/2011 như sau:
Số quan sát 2134
Trung bình (Y) 0.01815
Phương sai (Y) 0.49390
Skewness (Y) 0.05327
Kurtosis (Y) 4.32484
Bảng 3.1: Thống kê mô tả dữ liệu VN-Index Nguồn: Kết quả từ chương trình G@RCH 6.0
Giá trị trung bình của tỷ suất sinh lợi VN-Index qua từng ngày là lớn hơn 0, cho thấy tín hiệu lạc quan về khả năng tăng trưởng của thị trường trong giai đoạn tiếp theo. Bên cạnh đó chúng ta cần chú ý 2 biến số đó là Skewness và Kurtosis, nhằm đo lường tính phân phối chuẩn của tỷ suất sinh lợi thị trường. Theo quy ước chuẩn, khi thị trường theo mức phân phối chuẩn thì chỉ số Skewness và Kurtosis phải lần lượt bằng 0 và 3, tuy nhiên nhìn vào kết quả thống kê trên ta có thể biết rằng Skewness là lớn hơn 0 và Kurtosis là lớn hơn 3, cho thấy thị trường chứng khoán Việt Nam có xu hướng nghiêng phải so với tính phân phối chuẩn.
Điều này một lần nữa chứng tỏ rằng thị trường chứng khoán Việt Nam có những đặc tính giống với tình hình của các thị trường mới nổi khác, phân phối tỷ suất sinh lợi không theo một mức phân phối chuẩn. Do đó việc đo lường tỷ suất sinh lợi bằng hệ số độ lệch chuẩn là không thể phù hợp.
Hình 3.1. Phân phối Phương sai của tỷ suất sinh lợi từng ngày của VN-Index Nguồn: Kết quả từ chương trình G@RCH 6.0
Hình 3.2. Độ biến động của TSSL từng ngày của VN-Index 3/2002-3/2011 Nguồn: Kết quả từ chương trình G@RCH 6.0
Với những phân tích như trên, có thể nhận định rằng thị trường chứng khoán Việt Nam cần phải có một mô hình tương đối phù hợp để dự đoán độ biến động trong tương lai.
Bài nghiên cứu so sánh giữa phương pháp đo lường rủi ro thị trường dựa vào các cận biên và các mô hình gốc ARCH. Xét phương pháp đo lường rủi ro thị trường dựa vào các điểm cận biên, phương pháp tuy có độ chính xác cao nhưng yêu cầu kỹ năng và kinh nghiệm cao của người sử dụng. Chính độ khó của nó đã gây trở ngại lớn khi áp dụng vào thị trường Việt Nam. Nhóm nghiên cứu quyết định sử dụng nhóm các mô hình họ ARCH để đo lường rủi ro cho thị trường Việt Nam, chạy trên nền phần mềm G@RCH 6.0.
Trong số các mô hình trong nhóm mô hình ARCH, Dima Alberg, Haim Shalit và Rami Yosef (2008) đã kiểm tra trên thị trường TASE với chỉ số TA25-Index từ 1992 đến 2005, cho thấy với các thị trường phát triển, nơi mà hành vi của nhà đầu tư bị chi phối nhiều bởi các thông tin của thị trường, mô hình EGARCH tuân theo phân phối Skewed Student-t mang lại kết quả dự đoán chính xác nhất. Tuy nhiên, điều này lại không đúng đối với các nền kinh tế mới nổi và còn non trẻ như Việt Nam. Mai Thị Thanh Hiền (2008) đã kiểm tra nhóm mô hình ARCH trên thị trường Việt Nam, với dữ liệu là chỉ số VN-Index từ 03/2002 đến 12/2007, cho thấy với các thị trường mới nổi, nhà đầu tư ít quan tâm đến các thông tin vĩ mô cũng như của doanh nghiệp, mô hình EGARCH trở nên thiếu ý nghĩa kinh tế, và GARCH (2,1) là mô hình phù hợp nhất với thị trường Việt Nam.
Tuy dữ liệu của Mai Thị Thanh Hiền (2008) được lấy trong giai đoạn thị trường chứng khoán Việt Nam bắt đầu đi vào hoạt động ổn định đến đỉnh cao của chỉ số - cuối 2007, nhưng đây là giai đoạn thị trường chứng khoán bùng nổ, giá chứng khoán liên tục tăng cao, xuất hiện bong bóng đầu cơ. Hành vi nhà đầu tư lúc này không phụ thuộc nhiều vào các thông tin trên thị trường, dẫn đến mô hình EGARCH là không phù hợp. Vì vậy, để lựa chọn mô hình phù hợp nhất để đo lường rủi ro cho thị trường Việt Nam, nhóm nghiên cứu so sánh các mô hình
được sử dụng phổ biến trong họ các mô hình ARCH – GARCH, EGARCH, GJR, APARCH.
3.2.2 Chọn các thông số cho mô hình
3.2.2.1 Lựa chọn độ trễ p, q trong mô hình ARIMA(p,q)
Phương pháp trung bình trượt kết hợp tự hồi quy ARIMA được đưa ra bởi George Box và Gwilym Jenkins (1990), hay còn gọi là phương pháp luận Box- Jenkins, được dùng phổ biến trong việc lập mô hình chuỗi thời gian và là công cụ
dự báo hiệu quả theo nguyên lý “hãy để dữ liệu tự nói”. Với δ là giá trị trung
bình, ARIMA được biết đến với công thức như sau:
Quá trình tự hồi qui AR(p): (Yt– ) =α1(Yt-1– ) + … + αp(Yt-p– ) +ut
Quá trình trung bình trượt MA(q):Yt = + 0ut+ 1ut-1+ … + 1ut-q
Với p=1, q=1, ARIMA(1,d,1) được viết dưới dạng:
Yt =θ+α1(Yt-1– ) + 0ut+ 1ut-1
Tiếp theo nhóm nghiên cứu tiến hành lựa chọn các biến p, q phù hợp, bằng cách kiểm định chuỗi dữ liệu thời gian tỷ suất sinh lợi VN-Index trên nền phần mềm PcGive.
Lựa chọn p
Để lựa chọn độ trễ p, nhóm tiến hành so sánh các giá trị t-prob với các giá trị
p={1,2,…,6}, vì với p≥6, giá trị t-prob của AR(p) lớn hơn 0 rất nhiều, hay nói
cách khác, AR(p) với p≥6 là không phù hợp với chuỗi dữ liệu đang xét.
AR(1) AR(2) AR(3) AR(4) AR(5) AR(6)
AR-1 0.000 0.000 0.093 0.008 0.004 0.007 AR-2 0.000 0.000 0.000 0.000 0.000 AR-3 0.001 0.015 0.056 0.063 AR-4 0.021 0.012 0.018 AR-5 0.255 0.255 AR-6 0.921
Bảng 3.2. So sánh giá trị t-prob giữa các quá trình tự hồi qui AR(p) Nguồn: Tổng hợp khi chạy phần mềm PcGive
Xét bảng 3.2, nhóm nhận thấy tại độ trễ p = 4, các giá trị t-prob vẫn còn khá gần 0, nhưng khi tăng độ trễ p = 5, t-prob của biến AR-5 tăng đột ngột lên 0.255 – rất
lớn hơn 0, nên tại đỗ trễ này chuỗi dữ liệu không còn tính tự tương quan nữa.
Chính vì những lý do này nên nhóm quyết định chọn độ trễp = 4cho quá trình tự
hồi qui AR(p).
Lựa chọn q
Tiến hành tương tự với quá trình lựa chọn độ trễ p ở trên, nhóm nghiên cứu so sánh các giá trị t-prob giữa các mô hình MA(q) để lựa chọn q phù hợp. Nhóm so sánh các mô hình MA(q) với q nhận giá trị q = {1,2,…,6}, vì từ giá trị q = 6, giá trị t-pob tính được rất lớn (t-prob của biến MA-6 bằng 0.721), hay nói cách khác
q≥6 không phù hợp với dữ liệu đang xét.
MA(1) MA(2) MA(3) MA(4) MA(5) MA(6)
MA-1 0.000 0.000 0.039 0.021 0.000 0.001 MA-2 0.113 0.001 0.001 0.035 0.107 MA-3 0.000 0.000 0.002 0.006 MA-4 0.100 0.014 0.014 MA-5 0.004 0.006 MA-6 0.721
Bảng 3.3. So sánh giá trị t-prob giữa các quá trình trung bình trượt MA(q) Nguồn: Tổng hợp khi chạy phần mềm PcGive
Xét bảng 3.3, nhóm nhận thấy tại giá trị q = 3, các giá trị t-prob rất gần 0, trong khi đó với giá trị q = 2 và q = 4, t-prob có lúc đạt hoặc vượt quá 0.1, khá lớn để sử dụng cho chuỗi dữ liệu đang xét. Ngoài q = 3, tại q = 5 cũng cho kết quả t- prob cuả các biến khá thấp, nhưng khi so sánh với q =3, các giá trị t-prob tại q = 3 có xu hướng gần với giá trị 0 hơn. Chính vì những lý do này nên nhóm nghiên cứu quyết định chọn giá trịq = 3cho quá trình trung bình trượt MA(q).
3.2.2.2. Lựa chọn biến số trong các mô hình họ ARCHMô hình GARCH(p,q) Mô hình GARCH(p,q)
Để tìm ra mô hình GARCH(p,q) phù hợp nhất cho thị trường Việt Nam, bài nghiên cứu chạy thử các cặp số p, q khác nhau, xét điều kiện tồn tại và các giá trị t-prob của các biến trong mô hình nhằm loại bỏ các cặp giá trị p, q có kết quả không phù hợp. Nhóm nghiên cứu quyết định chọn các cặp giá trị (p,q) = {(2,1), (1,2), (1,3)} để tiến hành so sánh, vì với cặp giá trị (p,q) = (1,1) các biến nhận được không thỏa điều kiện của mô hình, còn các cặp giá trị khác thì t-prob của các biến trong mô hình quá cao (chi tiết xem thêm ở phụ lục 1).
GARCH(2,1) GARCH(1,2) GARCH(1,3) Cst(M) 0.1605 0.1254 0.0980 d-Arfima 0.0061 0.0057 0.0044 AR(1) 0.0000 0.0000 0.0000 AR(2) 0.0000 0.0000 0.0000 AR(3) 0.0000 0.0000 0.0000 AR(4) 0.0000 0.0000 0.0000 MA(1) 0.0000 0.0000 0.0000 MA(2) 0.0000 0.0000 0.0000 MA(3) 0.1079 0.0721 0.0492 Cst(V) 0.0011 0.0495 0.0704 ARCH(Alpha1) 0.0000 0.0000 0.0000 ARCH(Alpha2) 0.0299 0.0446 ARCH(Alpha3) 0.0184 GARCH(Độ lệch chuẩn1) 0.0000 GARCH(Độ lệch chuẩn2) 0.0184 0.0000 0.0000 ARCH-in-mean (VaR) 0.0710 0.0766 0.0405
Bảng 3.4. So sánh giá trị t-prob giữa các mô hình GARCH(p,q) Nguồn: Nhóm nghiên cứu tổng hợp khi chạy phần mềm G@RCH 6.0
Xét bảng 3.4, nhóm nghiên cứu nhận thấy có sự vượt trội về kết quả t-prob của
các biếnα, β trong mô hình ARCH(2,1) so với 2 mô hình còn lại. Các kết quả t-
prob của α, β tiến sát gần 0 hơn các mô hình khác cho nhận định ban đầu rằng
mô hình GARCH(2,1) có hiệu quả trong việc ước lượng chuỗi dữ liệu thời gian đang xét.
Kiểm định lại một lần nữa sự phù hợp của GARCH(2,1) tốt hơn GARCH(1,2) và GARCH(1,3), nhóm nghiên cứu tiến hành so sánh các chỉ số Skewness, Kurtosis và Jarque – Bera, kết quả được thể hiện trong bảng 3.5:
Skewness Kurtosis Jarque - Bera
GARCH (1,2) 0.025708 1.1506 122.88
GARCH (1,3) 0.017097 1.2298 140.18
Bảng 3.5. So sánh các thông số Skewness, Kurtosis, Jarque – Bera các mô mình GARCH(p,q)
Nguồn: Nhóm nghiên cứu tổng hợp từ phần mềm G@RCH 6.0
Bảng 3.5 cho thấy GARCH(2,1) cho kết quả tốt nhất ở 2 trong 3 chỉ tiêu so sánh, kết hợp kết quả t-prob ở trên, nhóm nghiên cứu quyết định chọn mô hình GARCH(2,1) là mô hình GARCH(p,q) phù hợp nhất cho chuỗi dữ liệu tỷ suất sinh lợi của VN-Index.
Mô hình EGARCH(p,q)
Khi xem xét mô hình EGARCH(p,q), nhóm nghiên cứu không thu được kết quả khả quan nào cho tất cả các cặp giá trị (p, q) ở cả 2 dạng phân phối Student và Skewed Student.
Với phân phối Student, chuỗi dữ liệu không hội tụ với tất cả các cặp giá trị (p, q), nên không thể tính các hệ số của mô hình.
Với phân phối Skewed Student, chuỗi chỉ hội tụ khi tính toán EGARCH(p,q) với p=1, q = 2. Tuy nhiên tại cặp giá trị này, t-prob của các biếnα,θtrong mô hình quá cao, không thích hợp để sử dụng.
t-prob t-prob Cst(M) 0.3003 ARCH(Alpha1) 0.1318 d-Arfima 0.0000 ARCH(Alpha2) 0.0010 AR(1) 0.0000 GARCH(Độ lệch chuẩn1) 0.0000 AR(2) 0.0000 EGARCH(Theta1) 0.6702 AR(3) 0.0000 EGARCH(Theta2) 0.0000 AR(4) 0.0000 Asymmetry 0.4851
MA(1) 0.0000 Tail 0.0000
MA(2) 0.0000 ARCH-in-mean(var) 0.0372
MA(3) 0.0000
Cst(V) 0.6308
Bảng 3.6. Giá trị t-prob các biến mô hình EGARCH(1,2) Nguồn: Nhóm nghiên cứu tổng hợp từ phần mềm G@RCH 6.0
Mô hình GJR(p,q)
Khi xem xét mô hình GJR(p,q), nhóm nghiên cứu không thu được kết quả khả quan nào cho tất cả các cặp giá trị (p, q) ở cả 2 dạng phân phối Student và Skewed Student.
Các mô hình GJR(p,q) khi tiến hành tính toán đều xác định được các hệ số trong mô hình, tuy nhiên t-prob của một số chỉ số cho giá trị khá lớn và điều kiện tồn tại của các biến này cũng không được đảm bảo (tham khảo phụ lục 2). Chính vì vậy các mô hình GJR(p,q) không sử dụng được ở thị trường Việt Nam.
Mô hình APARCH(p,q)
Khi xem xét mô hình APARCH(p,q), nhóm nghiên cứu không thu được kết quả khả quan nào cho tất cả các cặp giá trị (p, q) ở cả 2 dạng phân phối Student và Skewed Student.
Với phân phối Student, các biến của mô hình APARCH(1,1) có thể tính toán
được, nhưng t-prob của biến γ quá cao. Với các mô hình APARCH khác nhận
p = 1, q≥2, chuỗi dữ liệu không hội tụ nên không thể tiến hành định lượng đúng
các biến cho mô hình.
t-prob t-prob
Cst(M) 0.2492 ARCH(Alpha1) 0.0000
d-Arfima 0.0227 GARCH(Độ lệch
AR(1) 0.0000 APARCH(Gamma1) 0.6002 AR(2) 0.0000 APARCH(Delta) 0.0000 AR(3) 0.0000 Student(DF) 0.0000 AR(4) 0.0000 ARCH-in-mean(var) 0.1260 MA(1) 0.0000 MA(2) 0.0000 MA(3) 0.0188 Cst(V) 0.0336
Bảng 3.7. Giá trị t-prob các biến mô hình APARCH(1,1) Nguồn: Nhóm nghiên cứu tổng hợp từ phần mềm G@RCH 6.0
Với phân phối Skewed Student, các mô hình APARCH(p,q) đều có chuỗi dữ liệu không hội tụ khi sử dụng GARCH(p,q), nên không có mô hình APARCH(p,q) nào phù hợp để tính toán cho thị trường Việt Nam.
Như vậy, sau khi xem xét từng dạng mô hình họ ARCH, bài nghiên cứu cho thấy mô hình GARCH(2,1) là mô hình phù hợp nhất đối với thị trường tài chính ở Việt Nam. Tiếp theo nhóm nghiên cứu tiến hành kiểm định lại độ chính xác của mô hình trên thực tế.
3.3 Kiểm định mô hình trên thị trường Việt Nam
Để kiểm định mô hình GARCH (2,1) trên thị trường Việt Nam, nhóm nghiên cứu tiến hành kiểm định xem sai số của mô hình có tuân theo phân phối chuẩn hay không, nếu sai số của mô hình tuân theo quy luật phân phối chuẩn thì chứng tỏ mô hình GARCH(2,1) có hiệu quả trong việc đo lường độ biến động.
Với mức ý nghĩa α=5%, tiến hành kiểm định Box – Pierce cho số dư bình phương.
H1: số dư bình phương không tuân theo quy luật phân phối chuẩn Sau khi kiểm định với mô hình GARCH(2,1), giá trị p-value thu được bằng 0.0181743 < α=5%. Như vậy giả thiết sai số của mô hình tuân theo quy luật phân phối chuẩn là đúng, hay mô hình có hiệu quả trong việc đo lường rủi ro thị trường ở Việt Nam.