TRƯỜNG ĐẠI HỌC KINH TẾKHOA TÀI CHÍNH - NGÂN HÀNG KHÓA LUẬN TỐT NGHIỆP ĐỀ TÀI ỨNG DỤNG MÔ HÌNH ARIMA, GARCH TRONG VIỆC DỰ BÁO CHỈ SỐ VNINDEX TRÊN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM Giảng viê
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ
KHOA TÀI CHÍNH - NGÂN HÀNG
KHÓA LUẬN TỐT NGHIỆP
Trang 2TRƯỜNG ĐẠI HỌC KINH TẾ
KHOA TÀI CHÍNH - NGÂN HÀNG
KHÓA LUẬN TỐT NGHIỆP
ĐỀ TÀI
ỨNG DỤNG MÔ HÌNH ARIMA, GARCH TRONG VIỆC DỰ BÁO CHỈ
SỐ VNINDEX TRÊN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM
Giảng viên hướng dẫn: TS Nguyễn Tiến Chương
Sinh viên thực hiện: Đinh Khắc Tuấn
Lớp: QH2019E TCNH CLC 2 Hệ: Chính quy
Hà Nội, 2023
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đề tài nghiên cứu: “Ứng dụng mô hình ARIMA, GARCH trong việc
dự báo chỉ số VN-Index trên Thị trường Chứng khoán Việt Nam” là công trình nghiên cứucủa riêng tôi Mọi kết quả của bài nghiên cứu đều là công sức của quá trình tôi tìm tự tìm
số liệu, tự đọc, dịch tài liệu, chạy phần mềm, tổng hợp và thực hiện Nội dung lý thuyết
trong bài nghiên cứu tôi có sử dụng một số tài liệu tham khảo và đã trích dẫn nguồn đầy
đủ ở mục tài liệu tham khảo.
Tôi xin cam đoan rằng các số liệu và kết quả trong bài nghiên cứu của tôi là trung
thực, khách quan và chưa từng được công bố trong bất kỳ một công trình nào khác
Nếu có bất kỳ sự gian lận nào, tôi xin chịu toàn bộ trách nhiệm
Sinh viên thực hiện
Tuấn
Đinh Khắc Tuấn
Trang 4LỜI CẢM ƠN
Để hoàn thành bài khóa luận này, tôi xin được gửi lời cảm ơn chân thành nhất đến:
Trường Đại học Kinh tế - Đại học Quốc gia Hà Nội đã tạo điều kiện tuyệt vời về cơ
sở vật chất, bao gồm một hệ thống thư viện hiện đại với đa dạng sách và tài liệu nghiêncứu, bài báo khoa học chất lượng cao
Tôi xin bày tỏ lòng biết ơn chân thành đến các thầy cô Trường đại học Kinh tế - Đạihọc Quốc gia Hà Nội nói chung, và thầy cô ở khoa Tài chính - Ngân hàng nói riêng, đã dànhthời gian và tâm huyết để truyền đạt cho tôi những kiến thức quý báu và hữu ích trong
suốt thời gian học tập Nhờ những kiến thức quý giá đó, tôi đã có nền tảng vững chắc để
hoàn thành bài nghiên cứu này.
Tôi muốn đặc biệt bày tỏ lòng biết ơn sâu sắc đến thầy TS Nguyễn Tiến Chương, người đã trực tiếp hướng dẫn tôi trong suốt thời gian thực hiện đề tài khóa luận này Nhờ
sự giúp đỡ tan tâm và hướng dẫn chi tiết của thầy, tôi đã tích lũy thêm nhiều kiến thức va
kinh nghiệm quý giá để hoàn thành đề tài nghiên cứu của mình
Do chưa có nhiều kinh nghiệm phân tích, cũng như còn hạn chế về mặt kiến thức,
nên trong bài nghiên cứu này chắc chắn không tránh khỏi những thiếu sót Rất mong nhận
được những lời góp ý chân thành, quý giá của thầy cô để bài nghiên cứu của tôi được hoàn
thiện hơn.
Lời cuối cùng tôi xin chúc thầy cô sức khỏe, thành công và hạnh phúc
Tôi xin chân thành cảm ơn!
Trang 5LOT CAM ĐOAN HH HH HH HH HH HH HH HH HH HH HH Hit i
LOT CAM ƠN HH HH HH HH HH HH Hghrgrgrgrrtrrtrrrritrttretrrtrirrerer ii
DANH MỤC TỪ VIET TẮTT - 2t .222 224272472.217 7 2 1- 2 1 011 Vv
DANH MỤC HINH VE, DO TH ececscssssssssssssssssssssssesssssussssssssssssasseseeusesisesiseeieesiaseiaseniseetaseiasenusstsesisesieetee Vv DANH MUC CAC BANG BIEU
020/19/0000 ®7
1.1 Tính cấp thiết của đề tài -Ă Q1 HH TT TT TH vkp 1
1.2 Mục tiêu nghiên CỨU cece eect eee ee ee eeeeeaaeaaaaaaaaaaaaaaaeeeeeeeeeeeeeeeeeeeeeeeeenees 2
1.2.1 Muc ti€u tOng QUuat: 117 a4 2
1.3 Đối tượng va phạm Vi nghiên CWU ec eeeeeeeeeeeceeeeeeeeeneeeeeeeeeeeeeeeeeeeeseeaeeeseeeeeseseeeee 2
1.3.1 00 (1-ái 0) na 0n (dŸỶ 2
1.3.2 Phạm vi nghién CỨU - ee « « xxx xxx TT nọ vi 2 1.4 Câu hỏi nghiên CỨU [SH Họ nọ gọn kh 3 1.5 Phương pháp nghiên CỨU - cọ nọ và 3
1.6 Những đóng góp mới của đề tài - + HS k ST TT TT TH HH kh 3 1.7 Cấu trúc bài nghiên cứu - - - c1 vn TK HH 3
CHƯƠNG II TONG QUAN NGHIÊN CỨU :2¿22+.22SE2223E222123112714112211117 1021 1110 110c 5
2.1 Lý luận chung về chứng khoán, thị trường chứng khoán va chỉ số chứng khoán 5
Van 8i 0n eằee e 5 2.1.2 Thị trường chứng khoán
2.1.3 Chỉ số VN-Ïnnex s11 TH TH TH TH HT HH HH TH 2.1.4 Chỉ số Dow Jones
2.2 Bai toAn AU 8o ẶèÈ—=IAaaỖỒỖỒỎỖ 4
2.3 Quan điểm của các hoc giả trên thế giới về dự báo chứng khoán -‹ -«<++-+: 7 2.4 TOng quan nghién CUPU 8 n 8 2.5 Khoảng trống nghiên CỨU + SE T HT KH KH TH HT HH KH TH HH Thành thời 11
CHƯƠNG III PHƯƠNG PHAP NGHIÊN CỨU eeeretrietierrertirrrtrririirirrried 123.1 Phương pháp nghiên CỨU - - S SS 111111 ng gọt ki ki ki kg 12
3.2 Lý thuyết liên quan đến tính dừng trong chuỗi số liệu thời gian - . -< <5 12
KÝ? a 12
3.2.2 Kiểm định tinh dừng - -. S1 11v Sn HT TH TH TH TH TH TH TH TH 13
3.3 Mô hình ARIMA - - - - Ăn nọ kh 14
3.3.1 Mô hình AlR(D) - - 11H KH Hi kh 14 3.3.2 Mô hình MA(Q) << 1 HH KT ni vn 14
Trang 63.3.3 Sai phân I(d| - 22 5s+SE2E2E322E1271221127171121171121111111111112111111 1.1.1 eg 15 3.3.4 Mô hình ARIMA (p, d, QÌ) c1 1S TH kh 15 3.3.5 Phương pháp luận Box-JenkiÏnS + xe rưy 15
3.3.6 Han ché 0i-0u000))() 00.2104) 0-4 16 3.4 Mô hình tự điều chỉnh phương sai với điều kiện khác nhau (GARCH) - 16
3.5 Do lường độ chính xác dự báo của mô hình ARIMA và GARCH -c-<<<<s<s5- 17
4.3 Ước lượng mô hình GARCH - - Ă ST ki ki kvvvH 26
4.3.1 Ước lượng tham số GARCH ((p,Q) - - 5c 232213 +*E*+ 3 SE Hy rên 26
4.3.2 Dự báo trong mẫu + t 1 t1 t1 1121191121121 1 11 1111 11H TH TH TH TH TH Hà ngàn Hàn 28
4.4 Ước lượng mô hình ARIMA và GARCH tại thị trường chứng khoán Mỹ 30
4.4.1 Kiém dinh tinh dtyng 11077 31 4.4.2 Xác định hệ số p,d, q của mô hình ARIMA cccccccesseceesseceeeseeeesseeeeesseeesssaeeessseeeese 32
4.4.3 Ước lượng mô hình ARIMA - - - BS 1S HH ve 33
4.4.4 Dự báo trong mẫu mô hình ARIMA (1,1,2) - - ¿5c 5+ 2+ E3 **EEEeEereererrsrrerrerse 35
4.4.5 Kiém dinh tinh ARCH 000 ốe - 36
4.4.6 Ước lượng mô hình GARCH - - - (0x 0 kh 37
4.4.7 Dự báo trong mẫu đối với mô hình GARCH (1,1)
IV )00)2)040:7)8.47 0< 46
000000 10— ÔỎ 47
iv
Trang 7STT Số hiệu Tên hình Trang
1 Hinh 4.1 Biểu đồ chỉ số VN-Index giai đoạn 2016 - 2023 21
2 Hinh 4.2 Biểu đồ sai phan bậc 1 chuỗi dữ liệu VN-Index 22
3 Hình 4.3 Biểu đồ tương quan cho chuỗi dữ liệu VN-Index 23
4 Hình 4.4 Kết quả dự báo trong mẫu từ 1/2/2023 - 31/3/2023 26
5 Hình 4.5 Do lường kết quả dự báo trong mẫu 27
6 Hình 4.6 Kết quả dự báo trong mẫu mô hình GARCH (1,1) 31
7 Hình 4.7 Do lường kết quả dự báo trong mẫu mô hình GARCH (1,1) 32
8 Hình 4.8 Biểu đồ chỉ số Dow Jones giai đoạn 2016 -2023 33
9 Hình 4.9 Biểu đồ sai phân bậc 1 của chuỗi dữ liệu Dow Jones 34
10 Hình 4.10 Biểu đồ tương quan cho chuỗi dữ liệu Dow Jones 34
11 Hình 4.11 | Kết qua dự báo trong mẫu cho chuỗi dữ liệu Dow Jones 37
12 Hình 4.12 | Do lường kết quả dự báo trong mẫu mô hình ARIMA (1,1,2) 38
13 Hình 4.13 | Kết quả dự báo trong mẫu mô hình GARCH (1,1) đối với chỉ số 39
Dow Jones
14 Hình 4.14 | Do lường kết quả dự báo mô hình GARCH (1,1) 40
15 Hình 4.15 | Biểu đồ kết quả dự báo VN-Index thang 4 năm 2023 43
Trang 8DANH MỤC CÁC BẢNG BIỂU
STT Số hiệu Tên bảng Trang
1 Bang 4.1 Kiểm định tinh dừng của chuỗi thời gian 22
2 Bảng 4.2 Kết quả ước lượng mô hình ARIMA (1,1,1) 23
3 Bảng 4.3 Kết quả kiểm định phần dư của mô hình ARIMA (1,1,1) 24
4 Bảng 4.4 Kết quả kiểm định ARCH-LM 27
5 Bảng 4.5 Kết quả kiểm định AIC và SIC của mô hình GARCH 29
6 Bảng 4.6 Kết quả kiểm định mô hình GARCH (1,1) 29
7 Bảng 4.7 Kiểm định tính ARCH của mô hình GARCH (1,1) 30
§ Bảng 4.8 Kiểm định tính dừng của chỉ số Dow Jones 33
9 Bảng 4.9 Chỉ số AIC và SIC của mô hình ARIMA của chỉ số Dow Jones 35
10 Bảng 4.10 | Kết quả kiểm định mô hình ARIMA (1,1,2) 35
11 Bang 4.11 | Kết quả kiểm định phan dư của mô hình ARIMA (1,1,2) 36
12 | Bảng4.12 | Kết quả kiểm định ARCH-LM mô hình ARIMA (1,1,2) 38
13 Bảng 4.13 | Kết quả kiểm định AIC va SIC của mô hình GARCH 39
14 Bảng 4.14 | Kết quả kiểm định mô hình GARCH (1,1) 39
15 Bảng 4.15 | Tổng hợp kết qua 41
16 Bảng 4.16 | Kết quả dự báo VN-Index tháng 4 năm 2023 42
vi
Trang 9CHƯƠNG I MỞ ĐẦU
1.1 Tính cấp thiết của đề tài
Thị trường chứng khoán Việt Nam ra đời và phát triển đến nay được 23 năm, tuytuổi đời còn non trẻ so với các thị trường chứng khoán quốc tế khác, nhưng thị trường
chứng khoán Việt Nam cũng đã trải qua nhiều thăng trầm như: tăng tốc tăng trưởng nóng,
khủng hoảng hay sideway.
Giai đoạn tăng trưởng mạnh mẽ của TTCK sau khi thành lập, kéo dài từ năm 2000
đến năm 2007 Trong giai đoạn này, thị trường chứng khoán phát triển nhanh chóng, với
sự tăng trưởng đáng kể của số lượng công ty niêm yết và khối lượng giao dịch Tuy nhiên,giai đoạn đó đã kết thúc với cuộc khủng hoảng tài chính toàn cầu vào năm 2008 Thị
trường chứng khoán Việt Nam đã trải qua một giai đoạn khủng hoảng kéo dài trong nhiều
năm Giá trị các cổ phiếu giảm sút, nhiều công ty niêm yết đang gặp khó khăn, và nhà đầu
tư đã mất niềm tin vào thị trường Sau đó, thị trường chứng khoán Việt Nam đã vào giai
đoạn sideway, kéo dài đến năm 2016 Trong giai đoạn này, TTCK không có sự tăng trưởng
đáng kể, với giá trị các cổ phiếu dao động ở mức thấp và sau đó thị trường bắt đầu hồi
phục từ năm 2017
Đầu năm 2020 với sự bùng phát của đại dịch COVID-19 đã gây ra những ảnh hưởng
vô cùng nặng nề cho xã hội, kinh tế bị đình trệ Khi việc kinh doanh bị tắc nghẽn thì các
kênh đầu tư lại được thu hút hơn cả, trong đó thị trường chứng khoán là điểm sáng, theo
số liệu của Trung tâm lưu ký Chứng khoán Việt Nam (VSD) có khoảng 1,09 triệu tài khoảnmới mở trong 10 tháng đầu năm 2021, gấp 3 lần lượng tài khoản mở trong năm 2020.Trong khoảng từ tháng 3 năm 2020 đến cuối tháng 12/2021 chỉ số VNindex đã tăng từ
mức 662 điểm lên khoảng 1500 điểm Ngay sau đà tăng điểm ấn tượng đó là chuỗi điều
chỉnh mạnh của thị trường sau 2 năm tăng trưởng nóng, chỉ số VNIndex giảm từ mức 1500
điểm xuống còn 1026 điểm tương đương mức giảm 32% Mức sụt giảm này lớn hơn rất
nhiều so với mức giảm của chứng khoán Mỹ (S&P500, giảm 20%), hay chứng khoán Châu
Âu (Euro Stoxx600, giảm 14%) Điều này cho thấy TTCK Việt Nam có mức độ rủi ro lớn
hơn nhiều so với các TTCK khác trên Thế giới.
Bước sang năm 2023 tuy chỉ số VN-Index dần có dấu hiệu hồi phục, tâm lý của nhà
đầu tư ngày càng cải thiện, vẫn còn đó sự bất ổn có thể ảnh hưởng mạnh đến thị trường như cuộc chiến giữa Nga-Ukcaina vẫn đang tiếp diễn căng thẳng, tình trạng lạm gia tăng
trên toàn cầu Những biến động này đang tác động mạnh mẽ đến nền kinh tế Việt Nam
1
Trang 10và đặt ra nhiều thách thức cho các nhà đầu tư trên thị trường chứng khoán, đặc biệt là khi
thị trường chứng khoán Việt Nam vẫn còn khá non trẻ và vẫn luôn tiềm ẩn nhiều rủi ro và
có thể gây thiệt hại lớn đến tài sản nếu không có một chiến lược đầu tư hợp lý Do đó việc
dự báo giá chứng khoán là cần thiết, dự báo được các chỉ số tài chính sẽ là một sự giúp đỡ
lớn cho các nhà đầu tư trong việc lập kế hoạch và quản trị rủi ro Với những lý do nên trên,
tôi quyết định nghiên cứu đề tài: “Ứng dụng mô hình Arima, Garch trong việc dự báo chỉ
số VN-Index trên Thị trường Chứng khoán Việt Nam” Qua đó đưa ra một số kiến nghị cho
nhà đầu tư trong việc sử dụng mô hình
1.2 Mục tiêu nghiên cứu
1.2.1 Mục tiêu tổng quát:
Mục tiêu tổng quát của bài nghiên cứu là dự báo được giá trị của chỉ số VN-Index trong
tháng 4 năm 2023 Từ đó đưa ra được những xu hướng biến động của thị trường chứng
khoán, và giúp đưa ra một số kiến nghị cho tổ chức và nhà đầu tư cá nhân
1.2.2 Mục tiêu cụ thể:
Để mang lại hiệu quả của bài nghiên cứu ngoài mục tiêu tổng quát đã được trình bày
ở trên, đề tài cần phải thực hiện các mục tiêu khác sau đây Thứ nhất là đưa ra các lý thuyết
cơ bản về phân tích và ứng dụng chuỗi thời gian trong dự báo Thứ hai là dự báo chỉ số
VN-Index trong tháng 4/2023 thông qua các mô hình, cùng với đó là đánh giá và phân tích
kết quả dự báo Cuối cùng dựa vào kết quả thu được, đề xuất một vài kiến nghị nhằm phục
vụ mục đích đầu tư
1.3 Đối tượng và phạm vi nghiên cứu
1.3.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu của đề tài là chuỗi số liệu quá khứ của chỉ số chứng khoán trên
Sở giao dịch Thành phố Hồ Chí Minh - VNIndex và chỉ số chứng khoán Dow Jones tại thị
trường chứng khoán Mỹ.
1.3.2 Phạm vi nghiên cứu
Phạm vi nội dung: Bài nghiên cứu sẽ tập trung vào chuỗi số liệu quá khứ của chỉ số VNindex trên thị trường chứng khoán Việt Nam, để xây dựng mô hình phù hợp nhằm mục tiêu dự báo chỉ số VNIndex trong ngắn hạn, so sánh mức độ chính xác của mô hình dự báo
giữa 2 TTCK, từ đó đưa ra những kiến nghị cho các nhà đầu tư
Phạm vi không gian: Đề tài được tiến hành nghiên cứu tại TTCK Việt Nam và TTCK Mỹ
2
Trang 11Phạm vi thời gian: Bài nghiên cứu sử dụng thông tin về giá đóng cửa của chỉ số Index và Dow Jones trong khoảng thời gian từ tháng 1 năm 2016 đến tháng 3 năm 2023.
VN-1.4 Câu hỏi nghiên cứu
Tương ứng với các mục tiêu nghiên cứu đã đề ra như trên, đề tài xác định cần trả lời câu
hỏi nghiên cứu sau:
Thứ nhất là ưu điểm và nhược điểm của mô hình ARIMA và mô hình GARCH
Thứ hai là liệu mô hình ARIMA (p,d,q) hay GARCH (p,q) sẽ phù hợp để dự báo chỉ số Index.
VN-Thứ ba là xu hướng của chỉ số VN-Index trong tháng 4/2023
1.5 Phương pháp nghiên cứu
Bài nghiên cứu sẽ sử dụng phương pháp nghiên cứu định lượng qua 2 mô hình dự
báo là ARIMA và GARCH, số liệu trong bài nghiên cứu là dữ liệu quá khứ của chỉ số Index và Dow Jones, dữ liệu này sau đó sẽ được phân tích và kiểm định thông qua phần
VN-mềm Eview 8 từ đó dự báo chỉ số VN-Index trong ngắn hạn.
1.6 Những đóng góp mới của đề tài
Bài nghiên cứu này sẽ cung cấp cho những nhà đầu tư một phương tiện để dự báolợi nhuận của danh mục đầu tư trên thị trường Cùng với đó bài nghiên cứu sẽ đánh giámức độ hiệu quả của mô hình dự báo đối với TTCK Việt Nam và TTCK Mỹ Ngoài ra, các sốliệu trong đề tài được cập nhật trong khoảng thời gian gần nhất vì vậy kết quả của nghiên
cứu sẽ hỗ trợ những nhà đầu tư và nhà hoạch định chính sách đánh giá mức độ sinh lời và
sự biến động của thị trường trong bối cảnh kinh tế hiện nay, từ đó hỗ trợ họ đưa ra các
quyết định chính xác trong việc đầu tư cổ phiếu
1.7 Cấu trúc bài nghiên cứu
Cấu trúc của bài nghiên cứu được chia thành 5 chương chính như sau:
Chương I Mở đầu Chương II Tổng quan nghiên cứu Chương này sẽ tổng kết những khung
lý thuyết cơ bản liên quan đến các vấn đề quan trọng của bài nghiên cứu như: thị trườngchứng khoán, chỉ số chứng khoán VN-Index, các quan điểm về bài toán dự báo của các họcgiả trên Thế giới và cuối cùng là tổng hợp một số nghiên cứu trước đây liên quan tới đềtài Chương III Phương pháp nghiên cứu Phần này tác giả sẽ trình bày rõ hơn về phương
Trang 12pháp và mô hình nghiên cứu của đề tài, cùng với đó là đưa ra những lý thuyết về tính dừng
và mô hình ARIMA, GARCH Tiếp theo là Chương IV Kết quả nghiên cứu Chương này sẽ
kiểm định và lựa chọn mô hình phù hợp nhất với chuỗi dữ liệu nghiên cứu và cuối cùng là
tiến hành dự báo Chương V Kết luận Trình bày kết quả nghiên cứu, những hạn chế và
hướng phát triển tiếp theo cho bài nghiên cứu
Trang 13CHƯƠNG II TỔNG QUAN NGHIÊN CỨU
2.1 Lý luận chung về chứng khoán, thị trường chứng khoán và chỉ số chứng khoán
2.1.1 Chứng khoán
e Khái niệm:
Chứng khoán là một loại giấy tờ có giá trị đại diện cho quyền sở hữu hoặc quyềntham gia trong tài sản của một công ty hoặc tổ chức tài chính Chứng khoán được phát
hành và giao dịch trên các sàn giao dịch chứng khoán, và người mua chứng khoán trở
thành cổ đông hoặc chủ sở hữu một phần tài sản của công ty Chứng khoán có thể là cổ
phiếu, trái phiếu, chứng chỉ quỹ hoặc tùy chọn chứng khoán Giao dịch chứng khoán là một
trong những hoạt động quan trọng nhất của thị trường tài chính, được sử dụng để đầu tư
và giao dịch để kiếm lợi nhuận
2.1.2 Thị trường chứng khoán
e Khái niệm:
Thị trường chứng khoán là nơi giao dịch mua bán, trao đổi các loại cổ phiếu chứng khoán
và thường được thực hiện tại sở giao dịch chứng khoán hoặc thông qua các công ty môi giới chứng khoán.
Thị trường chứng khoán được chia thành 2 loại: thị trường sơ cấp và thị trường thứ cấp
- _ Thị trường sơ cấp là noi mà cổ phiếu được phát hành lần đầu tiên từ công ty để hút
một nguồn vốn đầu tư, giúp họ có thể huy động một số vốn trên thị trường chứngkhoán Thị trường sơ cấp thường thu hút các tổ chức lớn và các quỹ đầu tư Nhữngnhà đầu tư này sẽ mua các cổ phiếu mới phát hành, hi vọng có thể tận dụng cơ hộiđầu tư vào các công ty tiềm năng và tăng giá trị đầu tư của mình trong tương lai
- Thi trường chứng khoán thứ cấp, cổ phiếu được mua bán lại sau khi phát hành sơ
cấp Người mua tại thị trường sơ cấp sẽ tiến hành mua bán đối với các nhà đầu tư chứng khoán khác trên thị trường thứ cấp Chính vì thế sẽ không có tiền mới được
sinh ra mà chỉ là thay đổi quyền sở hữu cổ phiếu giữa người mua và bán Thị trườngchứng khoán thứ cấp cũng là nơi các nhà đầu tư cá nhân có thể tham gia giao dịch
chứng khoán.
Trang 142.1.3 Chỉ số VN-Index
Chỉ số VNINDEX là chỉ số đại diện cho Sở giao dịch Chứng khoán thành phố Hồ Chí
Minh tính từ lúc thị trường chứng khoán bắt đầu đi vào hoạt động vào ngày 28/07/2000,
đây là chỉ số đại diện cho tất cả cổ phiếu được niêm yết trên sàn HOSE
Chỉ số VNIndex được tính bằng phương pháp Passcher và được công bố vào cuối mỗi phiên giao dịch Chỉ số này so sánh giá trị vốn hóa thị trường hiện tại với giá trị thị
trường cơ sở vào ngày 28/7/2000.
VN-Index được tính theo công thức:
Tổng giá trị thị trường của các cổ phiếu niềm yết hiện tại
qui: Khối lượng niêm yết hiện hành của cổ phiếu i
Pii: Giá thị trường hiện tại của cổ phiếu i
doi: Khối lượng niêm yết vào thời kì gốc cổ phiếu i
Poi: Giá thị trường vào thời kì gốc của cổ phiếu i
N: Số cổ phiếu đưa vào tính
2.1.4 Chỉ số Dow Jones
Chỉ số Dow Jones, còn được gọi là chỉ số DJIA (Dow Jones Industrial Average), là
là một trong những chỉ số chứng khoán hàng đầu tại Hoa Kỳ và toàn cầu Chỉ số Dow Jonesđược phát triển và đưa ra sử dụng vào năm 1896 bởi Charles Dow, là một trong những
nhà báo kinh tế đầu tiên tại Mỹ.
Chỉ số Dow Jones bao gồm 30 công ty lớn và có tầm ảnh hưởng trên thị trườngchứng khoán Mỹ, bao gồm các công ty trong các ngành sản xuất, tài chính và dịch vụ Cáccông ty được lựa chọn để đưa vào chỉ số Dow Jones phải đáp ứng một số tiêu chuẩn nhấtđịnh, bao gồm: sự phản ánh của công ty về tình hình kinh tế, sự ổn định tài chính và lịch
sử thanh toán cổ tức cho cổ đông
Trang 15Chỉ số này được tính toán như sau:
Tổng giá trị thị trường của các cổ phiếu niêm yết hiện trong danh sách
DJỊA=—“——————————— (2.3)
2.2 Bài toán dự báo
Bài toán dự báo đã tồn tại từ rất lâu và ngày càng trở nên quan trọng trong môitrường có quá nhiều thông tin như hiện nay Các lĩnh vực khác nhau trong đời sống đềucần đến dự báo, ví dụ như trong khí tượng thủy văn, dự báo thời tiết và nhiệt độ giúp tránh
được thiệt hại do thiên tai và hỗ trợ cho nền kinh tế, hoặc trong lĩnh vực tài chính, dự báo
giá của các loại tiền tệ và chứng khoán có thể mang lại nhiều lợi ích cho các nhà đầu tư
Như chúng ta đã biết, thị trường chứng khoán là một phần không thể thiếu của
nền kinh tế và được xem là một trong những lĩnh vực quan trọng nhất trong ngành tài
chính Trong thị trường chứng khoán, việc dự báo giá trị của các chứng khoán và các chỉ
số chứng khoán là một vấn đề quan trọng để các nhà đầu tư có thể đưa ra quyết định đúng
đắn về việc đầu tư vào các cổ phiếu chứng khoán
Để dự báo giá trị của các chứng khoán và chỉ số chứng khoán, các nhà đầu tư thường
sử dụng các mô hình phân tích kỹ thuật, phân tích cơ bản và mô hình dự báo Trong đó,
mô hình dự báo là một công cụ hữu hiệu giúp các nhà đầu tư có thể đưa ra các dự đoán vềgiá trị của các chứng khoán và chỉ số chứng khoán trong tương lai Một trong những môhình được sử dụng phổ biến trong thị trường chứng khoán là mô hình ARIMA và mô hìnhGARCH Hai mô hình này thường xuyên được sử dụng để dự báo biến động của giá trị củacác chứng khoán và chỉ số chứng khoán trong tương lai dựa trên các biến động của chúng
trong quá khứ.
2.3 Quan điểm của các học giả trên thế giới về dự báo chứng khoán
Cùng với sự phát triển của công nghệ, việc sử dụng các phương pháp định lượngtrong nghiên cứu tài chính-kinh tế đã dần trở nên phổ biến Đặc biệt là việc áp dụng môhình liên quan đến dự báo giá chứng khoán hoặc dự báo biến động giá các tài sản có giátrị khác như giá vàng, giá dầu Các học giả trên thế giới khi nghiên cứu về vấn đề dự báogiá chứng khoán thường chia làm 2 luồng quan điểm chính:
Thứ nhất là những học giả tin vào thuyết “Bước đi ngẫu nhiên” (Random walk
theory - được phát triển bởi nhà kinh tế học Fama vào năm 1965) những nhà nghiên cứu
này cho rằng giá chứng khoán biến động ngẫu nhiên và không thể dự đoán trước được.
7
Trang 16Hiểu về mặt thống kê, thuyết này cho rằng những thay đổi giá liên tiếp là các biến ngẫu nhiên độc lập, có phân phối giống nhau Điều này ám chỉ rằng chuỗi thay đổi giá là “không
có bộ nhớ”, nghĩa là không thể sử dụng dữ liệu quá khứ để dự đoán tương lai
Tuy vậy lại có những học giả tin vào “Thuyết bước đi không ngẫu nhiên”
(Non-random walk theory) Thuyết này được phát triển dựa trên một trong những giả định quan
trọng rằng lợi nhuận hiện tại phụ thuộc vào các quyết định được đưa ra trong quá khứ Sự
liên kết giữa các hành động trong quá khứ và hiện tại mang lại cho các nhà nghiên cứu một
lượng thông tin được gọi là "lịch sử giá" Điều này dẫn đến ý tưởng là “lịch sử lặp lại chính nó” (History repeats itself), trong đó các hành vi giá trong quá khứ sẽ có xu hướng tái diễn
trong tương lai.
2.4 Tổng quan nghiên cứu
Trong những năm qua, đã có nhiều nỗ lực để phát triển các mô hình dự báo trong
lĩnh vực kinh tế, từ dự báo tỷ giá hối đoái và lãi suất cho đến việc sử dụng các mô hình để
dự đoán giá cả hàng hóa và lợi nhuận của các tài sản tài chính Mặc dù một số nghiên cứu
đã thành công trong việc triển khai các mô hình, việc tìm ra một mô hình phù hợp để dự
đoán lợi nhuận trên tài sản tài chính vẫn còn là thách thức lớn đối với các nhà nghiên cứu
và chuyên gia kinh tế tài chính Điều này đã được chứng minh trong nhiều nghiên cứu của
những học giả tin vào “Thuyết bước đi ngẫu nhiên” có thể kể đến:
Bellgard và Goldschmidt (1999) thực hiện tại thị trường Mỹ, hai tác giả đã áp dụng
các phương pháp nghiên cứu định lượng bao gồm làm mịn lũy thừa, bước đi ngẫu nhiên
và mô hình ARIMA để dự đoán tỷ giá hối đoái AUD/USD Tuy nhiên, kết quả cho thấy rằng
sử dụng các biện pháp trong việc dự báo thống kê không ảnh hưởng trực tiếp đến lợi
nhuận và tỷ giá hối đoái Thay vào đó, chuỗi thời gian các mẫu phi tuyến tính được giải
thích tốt hơn bằng cách sử dụng mô hình mạng thần kinh
Một nghiên cứu khác cũng ủng hộ lý thuyết “Bước đi ngẫu nhiên” là của Lock
(2007) Sau khi thực hiện kiểm tra tỷ lệ phương sai Lo và MacKinlay trên lợi nhuận hàng
tuần từ TTCK Đài Loan từ năm 1990 đến giữa năm 2006, tác giả kết luận rằng không chỉ
có chỉ số chứng khoán tổng hợp của Đài Loan (Taiex Index) biến động ngẫu nhiên mà cổ
phiếu cá nhân cũng có xu hướng di chuyển tương tự
Tuy vậy một số nghiên cứu gần đây của các học giả lại ủng hộ giả thuyết “Bước đi
không ngẫu nhiên” (Non-Random walk theory) của giá cổ phiếu, có thể kể đến như:
Trang 17Nghiên cứu của Awazu và Weisang (2008) với đối tượng nghiên cứu là tỷ giá hốiđoái USD/EUR Đề tài nghiên cứu sử dụng mô hình ARIMA trong khoảng thời gian từ tháng
01 năm 1994 đến tháng 10 năm 2007 Kết quả cho thấy mối quan hệ tuyến tính giữa giá
trị hiện tại và các giá trị trước đó là phù hợp nhất để mô hình hóa chuỗi thời gian này.
Ngoài ra, đề tài cũng khẳng định rằng mô hình ARIMA(1,1,1) là phù hợp để dự đoán chuỗi
thời gian nghiên cứu.
Spiesova (2014) đã xác định khả năng dự báo của Mô hình ARIMA (1,1,1) đối với
ty giá hối đoái của đồng Koruna của Séc, Krona của Thụy Điển, Bang Anh, Zloty của Ba Lan,Forint của Hungary và Leu của Romania so với đồng Euro Tuy nhiên, kết quả của nghiên
cứu cho thấy rằng mô hình ARIMA đã gặp một số vấn đề trong việc ước tính và xác thực
mô hình Ngoài ra bài nghiên cứu cũng khẳng định mô hình ARIMA này dự báo hiệu quả nhất trong trung và ngắn hạn.
Paulo R Junior, Fernando L.R Salomon, Edson de Oliveira Pamplon (2014) đã đánh
giá sự hiệu qua của mô hình ARIMA trong việc dự báo chi số chứng khoán Bovespa tai thị
trường Brazil Số liệu trong bài viết được thu thập hàng tháng kể từ 1/2000 đến 12/2012
sau đó kiểm định các dữ liệu này theo phương pháp Box-Jenkins Bằng việc tìm ra mô hình
ARIMA (0, 2, 1) và so sánh kết quả với phương pháp liên tiến lũy thừa đơn và lũy thừa kép,
tác giả đã chỉ ra mô hình ARIMA là phù hợp hơn cả so với hai mô hình còn lại và hoàn toàn
có thể sử dụng được để dự báo các chuỗi thời gian trong tương lai.
Nguyen Vo, Robert Šlepaczuk (2022) đã thực hiện dự báo lợi nhuận của chỉ số
S&P 500 Đề tài này tập trung vào so sánh hiệu suất giữa mô hình tuyến tính ARIMA và các
mô hình kết hợp của mô hình ARIMA và GARCH để dự báo lợi nhuận của chỉ số S&P 500,với dữ liệu được lấy trong khoảng thời gian từ 1/1/2000 đến 31/12/2019 Nghiên cứu đã
sử dụng phương pháp cửa sổ trượt để so sánh hiệu suất dự báo của ARIMA và các mô hình
lai (ARIMA-SGARCH) để kiểm tra xem chúng có thể phản ánh các đặc điểm cụ thể của chuỗi
thời gian và có khả năng dự đoán tốt hơn so với mô hình ARIMA đơn giản Kết quả nghiên
cứu cho thấy mô hình lai ARIMA-GARCH vượt trội so với ARIMA trong thời gian dài Các
kết quả này không bị ảnh hưởng bởi các loại phân phối và loại mô hình GARCH
Nghiên cứu của Zhe Lin (2017) tại TTCK Trung Quốc, tác giả đã chọn chỉ số SSE
Composite làm đối tượng nghiên cứu, áp dụng các mô hình GARCH để phân tích thựcnghiệm Kết quả cho thấy, chỉ số tổng hợp SSE có tính chất biến động theo thời gian và
phân cụm đáng kể Với việc kiểm định chuỗi dữ liệu thời gian cho thấy có phân phối
Trang 18leptokurtosis với hiệu ứng ARCH và GARCH Qua so sánh hiệu suất phù hợp và dự báo giữa
các mô hình GARCH (1,1), TARCH (1,1), và EGARCH (1,1), Tác giả kết luận rằng EGARCH
(1,1) vượt trội hơn so với các mô hình còn lại Bên cạnh đó, bài nghiên cứu cũng đề xuất
để phát triển thị trường chứng khoán của Trung Quốc, cần tăng cường xây dựng hệ thống,giảm sự can thiệp quá mức của chính phủ và ủng hộ triết lý đầu tư hợp lý
Một số đề tài trong nước cũng nghiên cứu về chủ đề này có thể kể đến như:
ThS Đỗ Khắc Hưởng (2013) đã do lường sự giao động của chỉ số chứng khoán
VN-Index thông qua mô hình GARCH Đề tài sử dụng 2692 quan sát được lấy trong suốt
hon 10 năm Ngoài việc sử dụng mô hình GARCH, tac giả còn thực hiện ước lượng mô hình
theo 4 phân phối khác nhau như: Quy luật phân phối t-student, quy luật phân phối chuẩn,phân phối t-student lệch, và phân phối sai số tổng quát Sau quá trình kiểm định tác giả
lựa chọn mô hình GARCH (1,1) là tối ưu nhất trong việc dự báo dãy lợi tức của chỉ số
VNIndex Bên cạnh đó Nghiên cứu đã chỉ ra tính quan trọng của việc áp dụng mô hình VaR
(Value-at-Risk) để quản lý rủi ro trong các danh mục đầu tư dựa trên sự biến động của chỉ
số chứng khoán trên thị trường
Bài nghiên cứu của ThS Phạm Chí Khoa (2017), đề tài này tác giả đã sử dụng dữliệu biến động chỉ số VN-Index từ ngày 15/06/2006 đến ngày 15/06/2016 để dự báo biếnđộng có điều kiện của thị trường chứng khoán Việt Nam Kết quả cho thấy, mô hình GARCH(1,1) phù hợp để ước tính biến động của thị trường chứng khoán trong nước Việc dự báocác biến động của thị trường có thể cung cấp dữ liệu quan trọng trong việc phân bổ tài sản,quản lý rủi ro và quản lý danh mục đầu tư cho các nhà đầu tư trên thị trường chứng khoánViệt Nam, bởi những biến động trong quá khứ có thể lặp lại trong hiện tại
Qua các bài nghiên cứu của các học giả trong và ngoài nước, có thể thấy được rằng
việc nghiên cứu về dự báo chứng khoán và và các tài sản tài chính mặc dù là một đề tàikhông mới nhưng luôn tạo được nguồn cảm hứng cũng như những kết luận khác nhau
xung quanh đề tài này Trên cơ sở của những đề tài nghiên cứu đi trước, bài nghiên cứunày sẽ tiến hành dự báo ngắn hạn chỉ số VNIndex trên thị trường chứng khoán Việt Nam
từ đó đưa ra một số những đúc kết mang tính ứng dụng
10
Trang 192.5 Khoảng trống nghiên cứu
Mặc dù đã có nhiều đề tài đã ứng dụng mô hình ARIMA và GARCH trong giới nghiên
cứu trong và ngoài nước nhưng những đề tài này vẫn chưa thật sự mang tính cập nhật
trong bối cảnh tình hình kinh tế hiện nay Ngoài ra những nghiên cứu này thường chỉ tậptrung trong một thị trường cụ thể, chưa có nhiều đề tài phản ánh liệu chất lượng dự báocủa mô hình có phụ thuộc vào mức độ mạnh yếu của nền kinh tế từng quốc gia, đặc biệt là
với một TTCK đang phát triển là Việt Nam so với TTCK đã phát triển là Mỹ Bài khóa luận
này tác giả sẽ tiếp tục sử dụng mô hình ARIMA, GARCH cùng với đó là phương pháp tiếp
cận Box-Jenkins để tìm ra mô hình dự báo chỉ số VN-Index tốt nhất với chuỗi dữ liệu
nghiên cứu cập nhật ở thời gian gần nhất, cùng với đó là đánh giá mức độ hiệu quả của mô
hình dự báo đối với TTCK Việt Nam và TTCK Mỹ, từ đó nêu lên một vài kiến nghị cho cácnhà đầu tư
11
Trang 20CHƯƠNG III PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Phương pháp nghiên cứu
Đề tài sẽ sử dụng phương pháp nghiên cứu định lượng thông qua 2 mô hình chính làARIMA và GARCH, trong đó các bước thực hiện được tiến hành như sau:
Bước đầu tiên để ước lượng và dự báo chỉ số VN-Index, cần phải kiểm định tính dừng
của chuỗi dữ liệu thời gian nghiên cứu Sau đó, tôi sử dụng chuỗi dữ liệu đã có tính dừng
để ước lượng các mô hình ARIMA thông qua biểu đồ tương quan Các tiêu chí như AIC, SIC
và các chỉ số khác sẽ được sử dụng để lựa chọn mô hình ARIMA tốt nhất từ các mô hình đã
xây dựng Tiếp theo, tiến hành áp dụng mô hình đã chọn để dự báo trong mẫu và kiểm tra
xem liệu mô hình này có mô tả được hiện tượng ARCH hay không.
Tại bước này nếu dự báo trong mẫu cho thấy độ chính xác cao và mô hình ARIMA
không có hiện tượng ARCH, thì có thể áp dụng trực tiếp mô hình này để dự báo chính thứccho chỉ số VN-Index trong tháng 4/2023 Tuy nhiên, nếu xuất hiện tính ARCH trong mô
hình ARIMA đã chọn, cần ước lượng mô hình GARCH để khắc phục vấn đề này Trong đó
quy trình ước lượng và các tiêu chuẩn lựa chọn mô hình GARCH phù hợp tương tự nhưquy trình đối với mô hình ARIMA Cuối cùng, khi đã chọn được mô hình GARCH phù hợp
tôi tiến hành dự báo ngoài mẫu.
Các lý thuyết liên quan đến tính dừng, mô hình ARIMA và GARCH sẽ được tác giảtrình bày kĩ hơn ở phần sau
3.2 Lý thuyết liên quan đến tính dừng trong chuỗi số liệu thời gian
3.2.1 Tính dừng
Theo Gujarati (2003), một chuỗi thời gian Yt được coi là có tính dừng nếu giá trị kỳ vọng và phương sai của chuỗi không thay đổi bất kể thời điểm nào chuỗi được xác định,
và hiệp phương sai giữa hai thời điểm chỉ phụ thuộc vào độ trễ k mà không phụ thuộc vào
thời điểm mà hiệp phương sai được tính
Nói theo cách khác, một chuỗi thời gian Yt có tính dừng nếu đáp ứng đủ những yêu cầu
Sau:
e _ Kỳ vọng không đổi theo thời gian:
E()=, (vt) (3.1)
12
Trang 21e Phuong sai không đổi theo thời gian:
Var(Yt) = 07 (3.2)
© E(W -0)2= 0?
e Hiép phương sai chỉ phụ thuộc va độ trễ k mà không phụ thuộc vào thời điểm
tính toán:
Cov(Yt, Ytek) = E[Yt - E (¥t)] x [Yuk - E (Yek)] =, (3.3)
* Nếu như vi phạm 1 trong 3 điều kiện trên thi chuỗi thời gian Yt sẽ được coi là không có
tính dừng.
Hậu quả của chuỗi không có tính dừng
Khi dữ liệu là một chuỗi thời gian không dừng, các kiểm định t, F mất đi hiệu lực, ước
lượng và dự báo không đạt hiệu quả Do đó, phương pháp OLS không thể áp dụng được
cho những chuỗi không dừng, dẫn đến hiện tượng hồi quy giả mạo hoặc hồi quy vô nghĩa.
Để tránh những hậu quả như trên, việc xác định xem chuỗi thời gian có tính dừng hay không là rất quan trọng Trong thực tế, phần lớn các chuỗi thời gian đều là chuỗi không
dừng Hiện có nhiều cách để xác định một chuỗi thời gian có dừng hay không, trong đó
quan sát đồ thị của hàm tự tương quan là một trong những cách thông dụng và có độ chính
xác cao.
3.2.2 Kiểm định tính dừng
Kiểm nghiệm đơn vị Dickey - Fuller (Unit Root Test)
Sử dụng tiêu chuẩn kiểm định DF ta có:
t= (3.4)
Phân phối theo quy luật DF nếu |r| > |r„| thì ta bác bỏ giả thiết Ho và chấp nhận giả thiết
Hi tức là chuỗi có tính dừng
13
Trang 223.3 Mô hình ARIMA
Mô hình ARIMA (Auto Integrated Moving Average), về cơ bản tao ra một phương trình
tuyến tính trong đó mô tả và dự báo dữ liệu chuỗi thời gian Phương trình này được tạo ra
thông qua ba phần riêng biệt có thể được mô tả như sau:
3.3.1 Mô hình AR(p)
Mô hình tự hồi quy (Autoregressive Model) chỉ ra rằng biến đầu ra phụ thuộc tuyến tính
vào các giá trị trước đó Mô hình có dạng như sau:
Yt=@o + Lh Oj-Ve-j + Ue (3.5)
Trong do:
Yt: Quan sat dừng tai thời điểm
y(_¡: Quan sat dừng quá khứ
ó,: Hệ số phân tích hồi quy
uy: Sai số dự báo ngẫu nhiên tại thời điểm, có giá trị trung bình bằng 0 và phương sai
không đổi
p: Số nguyên dương
3.3.2 Mô hình MA(q)
Mô hình trung bình trượt là sự kết hợp tuyến tính giữa những số hạng nhiễu trắng.
Mô hình có dạng như sau: Yt= 6 + Vhs Ø.ty_j + Ue (3.6)
Trong đó:
Yt: Quan sát dừng tại thời điểm
u;_;: Sai số dự báo quá khứ
6;: Hệ số trung bình trượt
q: Số các sai số quá khứ dùng trong mô hình trung bình trượt
14
Trang 23Uz: Sai số tại thời điểm t
3.3.3 Sai phân I(d)
Sai phân là sự khác nhau giữa giá trị hiện tại và giá trị liền trước đó Lấy sai phân
hay còn gọi là quá trình tích hợp (Integrated) Việc lấy sai phân là một phương pháp hữu
hiệu trong việc biến đổi chuỗi thời gian thành có tính dừng, để thỏa mãn yêu cầu của việc
dự báo chuỗi thời gian.
Sai phân bậc 1: I(1) = Al (xz) = x¢ - Xt-1 (3.7)
Sai phân bậc d: I(d) = A#(x¿) =x(®~9£) - x) — 1) (3.8)
3.3.4 Mô hình ARIMA (p, d, q)
ARIMA (Autoregressive Intergrated Moving Average) hay còn gọi là Mô Hình Tự
Hồi Quy Kết Hợp Trung Binh Trượt, biểu diễn phương trình hồi qui tuyến tinh đa biến
(multiple linear regression) của các biến đầu vào (còn gọi là biến phụ thuộc trong thốngkê) bao gồm 3 thành phần đã được nêu ra ở phần trên và có dạng như sau:
Yt=c+X-¡ Dj-Ye-j + Yet Gj Up_j + Ur (3.9)
Trong đó:
Yt: Quan sát dừng tại thời điểm
y_j: Quan sát dừng quá khứ
u;_;: Sai số dự báo quá khứ
Qj, Ø;: Các hệ số phân tích hồi quy
q: Số các sai số quá khứ dùng trong mô hình trung bình trượt
u¿ : Sai số tại thời điểm t
c: Hằng số
3.3.5 Phương pháp luận Box-Jenkins
Phương pháp Box-Jenkins được đặt theo tên của hai nhà toán học là George Box và
Gwilym Jenkins là phương pháp phổ biến trong mô hình chuỗi thời gian Phương pháp này
15
Trang 24nhằm tìm ra các tham số phù hợp nhất với mô hình ARIMA thông qua một trình tự nhất
định trong việc xác định giá trị các tham số của mô hình, gồm các bước sau:
Nhận dạng mô hình: Tìm kiếm các giá trị phù hợp của p, d và q Yếu tố xu thế được
loại bỏ khỏi dữ liệu (bằng cách lấy sai phân bậc 1 hoặc sai phân bậc 2) Phân tích chiềuhướng biến đổi của hàm tự tương quan ACF hoặc hàm tự tương quan riêng PACF thường
được sử dụng để nhận dạng mô hình
Ước lượng: Ước lượng các tham số của các số hạng tự hồi quy và trung bình trượt
trong mô hình sau khi đã xác định các giá trị phù hợp của p và q Phương pháp ước lượng
hợp lý cực đại (MLE) thường được sử dụng để ước lượng
Chẩn đoán: Kiểm tra xem mô hình ARIMA đã chọn có phù hợp với dữ liệu hay
không Thông qua việc kiểm tra xem các phần dư ước lượng từ mô hình lựa chọn có tính
ngẫu nhiên thuần túy, hay có thể hiểu là phần dư ước lượng từ mô hình có tính dừng hay
không? Nếu có, ta chấp nhận sự phù hợp này của mô hình và ngược lại, ta phải lặp lại cácbước từ đầu cho đến khi mô hình thỏa mãn các điều kiện trên
Dự báo: Khi mô hình đã được kiểm chứng phù hợp với dữ liệu, yếu tố xu thế đượcđưa lại vào mô hình và thực hiện dự báo điểm và dự báo khoảng tin cậy Phương pháp lập
mô hình ARIMA đã được chứng minh là phổ biến và hiệu quả trong việc dự báo, đặc biệt
là trong các trường hợp dự báo ngắn hạn
3.3.6 Hạn chế của mô hình ARIMA
Mô hình ARIMA cung cấp một phương pháp mạnh mẽ để mô hình hóa và dự báo các
chuỗi dữ liệu, tuy vậy nó lại có nhiều những hạn chế Một trong những bất cập có thể kể
đến như:
Không thể mô hình hóa các đặc tính phi tuyến: Mô hình ARIMA là một mô hình tuyến
tính và không thể mô hình hóa các đặc tính phi tuyến của các chuỗi dữ liệu.
Không xử lý được các giá trị ngoại lai: Mô hình ARIMA không xử lý được các giá trị
ngoại lai (outliers) trong dữ liệu chuỗi thời gian, dẫn đến các dự báo không chính xác
3.4 Mô hình tự điều chỉnh phương sai với điều kiện khác nhau (GARCH)
Mô hình GARCH được phát triển bởi Tim Bollersle, là mô hình được phát triển dựa
trên mô hình ARCH, được bổ sung thêm thành phần tự hồi quy (AR) nên có độ tổng quát
16
Trang 25cao hơn Theo Robert F Engle (1995), một trong những nhược điểm của mô hình ARCH là
nó giống với mô hình trung bình di động hơn là mô hình tự hồi quy Một phương pháp mới
đó là thêm các biến trễ của phương sai có điều kiện vào phương trình của phương sai theo dạng tự hồi quy (thêm biến AR), thay vì chỉ đưa những biến trễ của các hạng nhiễu bình
phương như trong mô hình ARCH Mô hình GARH sẽ khắc phục được nhược điểm của mô
hình ARIMA là phương sai sai số thay đổi, do vậy đây thường là mô hình được các nhànghiên cứu sử dụng để dự báo
Mô hình GARCH (p,q) có dạng như sau:
ur ~ N(0,h¿)
h, = V9 + Vins Oihe-i + Diet jue; (3.11)
Trong do:
p,q : la bậc của ARCH và GARCH trong mô hình, và giá tri Tạ 6; > 0
Theo mô hình GARCH, phương sai hiện tại phụ thuộc vào cả giá trị của những cú sốc trong
quá khứ, được đại diện bởi các biến trễ của hạng nhiễu bình phương, và các giá trị quá khứ
của chính nó, được đại diện bởi các biến ht-i i Nếu p =0 thì mô hình GARCH (0, q) sẽ trởthành mô hình ARCH (q) Dạng đơn giản nhất của mô hình GARCH là mô hình GARCH (1,1)
và dạng mô hình này thường được dùng để thay thế cho các mô hình ARCH bậc cao
3.5 Do lường độ chính xác dự báo của mô hình ARIMA và GARCH
Đề tài này sẽ dùng 3 thước đo phổ biến nhất để đo lường độ chính xác của mô hình
dự báo, đó là: Sai số bình phương trung bình MSE (Mean Square Error), Sai số dự báo tuyệt đối trung bình MAE (Mean absolute error), và Sai số phần trăm tuyệt đối MAPE (Mean absolute
Trang 26Trong đó:
y;: Biến độc lập
9;: Giá tri ước lượng
Sai số dự báo tuyệt đối trung bình MAE (Mean absolute error): MAE đo lường mức độ trung bình của mẫu thử nghiệm về sự khác biệt tuyệt đối giữa lượng quan sát thực tế và lượng dự
Nếu giá trị của RMSE,MAE và MAPE càng tiến về không tức là sai số càng bé cho thay mức
độ tin cậy của mô hình càng cao
3.6 Nguồn dữ liệu
Mẫu dữ liệu được lấy trong khoảng thời gian từ 4/1/2016 đến 31/3/2023 Mẫu
nghiên cứu bao gồm giá trị thị trường được cập nhật hàng ngày là: Giá đóng của của chỉ sốchứng khoán VN-INDEX trên Sở Giao dịch chứng khoán Hồ Chí Minh (HOSE) Chỉ số thịtrường VNINDEX được lấy từ website: https://vn.investing.com/indices/vn Giá đóng cửacủa chỉ số Dow Jones được lấy từ trang web: https://vn.investing.com/indices/us-30-
historical-data.
18
Trang 27CHƯƠNG IV KẾT QUẢ NGHIÊN CỨU
4.1 Mẫu quan sát
Số liệu trong bài nghiên cứu được thu thập từ 4/1/2016 đến 31/3/2023 với 1810
mẫu quan sát Giai đoạn từ năm 2016 đến 2023 là khoảng thời gian tương đối biến động
đối với TTCK Việt Nam với hàng loạt những sự kiện như sự bùng phát của đại dịch
Covid-19 (2020), cuộc chiến tranh giữa Nga-Ukcraina (2022).
Chuỗi số liệu lịch sử giá cuối phiên giao dịch của chỉ số VNIndex được chia thành 2 giai đoạn Giai đoạn đầu tiên từ 4/1/2016 đến 31/1/2023 gồm 1767 mẫu quan sát, đây là giai đoạn được sử dụng để ước lượng các mô hình ARIMA và GARCH Giai đoạn 2 bắt đầu
từ ngày 1/2/2023 đến ngày 31/3/2023, giai đoạn này sẽ tập trung vào dự báo ngoài mẫu
và đánh giá mức độ chính xác và phù hợp của mô hình đã được chọn Mục tiêu cuối cùng
là dự báo chỉ số VNIndex trong phiên giao dịch tháng 4/2023
4.2 Ước lượng mô hình ARIMA
800
-600 ea
4.00 Oe}
16 17 18 19 20 21 22
Nguồn: Kết quả nghiên cứu của tác giả
Yêu cầu đầu tiên trong việc ước lượng mô hình là chuỗi dữ liệu cần có tính dừng để
tránh trường hợp hồi quy giả mạo, khiến kết quả dự báo không có ý nghĩa thực tế Dựa vào
biểu đồ trên có thể thấy được chuỗi dữ liệu quá khứ của chỉ số VN-Index có sự biến động
19
Trang 28tăng giảm rõ rệt trong từng thời kì Vì vậy điều kiện về giá trị kì vọng không đổi đã bị vi
phạm và do đó đây là một chuỗi không có tính dừng.
Do đó tôi sẽ tiến hành hiện lấy sai phân bậc 1 của chuỗi dir liệu và sau đó tiến hành
kiểm tra tính dừng thông qua kiểm định Dicky-Fuller
Giả thuyết :
H0: Chuỗi thời gian không có tính dừng.
H1: Chuỗi thời gian có tính dừng
Bảng 4.1 Kiểm định tính dừng của chuỗi thời gian
Null Hypothesis: D(VNINDEX) has a unit root Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=24)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -40.21718 0.0000 Test criticalvalues: 1% level -3.433852
5% level -2.862974 10% level -2.567580
Nguồn: Kết quả nghiên cứu của tác giả
Kết quả sau khi lấy sai phân bậc 1 của chuỗi dữ liệu cho thấy giá trị p-value xấp xỉ bằng 0, nhỏ hơn mức ý nghĩa 5% Do đó bác bỏ giả thuyết H0 và chấp nhận giá thuyết H1 tức là chuỗi dữ liệu đã có tính dừng.
Hình 4.2: Biểu đồ sai phân bậc 1 của chuỗi dữ liệu VN-Index
DVNINDEX
60
-16 17 18 19 20 21 22
20
Trang 29Nguồn: Kết quả nghiên cứu của tác giả
4.2.2 Xác Định Tham Số ARIMA (p, d, q)
Trên thực tế có nhiều cách để lựa xác định các tham số p,d và q trong mô hình ARIMA,
một trong những phương pháp thường được sử dụng nhất đó là dựa biểu đồ độ trễ của
các ham ACF và PACF và đây cũng là cách mà tôi chọn để xác định mô hình
Hình 4.3: Biểu đồ tương quan cho chuỗi dữ liệu VN-Index
0.028 0.025 8.4304 0.134 0.009 0.004 8.5596 0.200
Nguồn: Kết quả nghiên cứu của tác giả
Tham số d trong mô hình ARIMA chính là số lần sai phân của chuỗi hay nói cách khác, do chuỗi
dữ liệu nghiên cứu đã sử dụng sai phân bậc 1 trong việc biến đổi chuỗi có tính dừng, nên giá trị
tham số d = 1
Giá trị p là tự tương quan từng phần được đại diện bởi cột PAC, giá trị q được đại diện
bởi cột AC Theo như hình 4.3, tại giá trị độ trễ bằng 1 ta thấy được giá trị AC và PAC đạt
max và ngay sau đó là giảm dần, do đó giá trị p và q đều bằng 1 Do vậy từ chuỗi dữ liệu
VN-Index nghiên cứu, mô hình ARIMA duy nhất là ARIMA (1,1,1)
Sau khi xác định được các tham số chính của mô hình, tiến hành ước lượng mô hình
và kết quả chạy như sau:
21