Từ những lý do cấp thiết nêu trên, nhóm chúng tôi quyết định lựa chọn đề tài: “ Ứng dụng mô hình ARIMA, ARCH và GARCH trong dự báo chỉ số HNX-Index” để nghiên cứu, dự báo và đưa ra những
NỘI DUNG NGHIÊN CỨU
CƠ SỞ LÝ THUYẾT
Thị trường chứng khoán là một hệ thống giao dịch mua bán các công cụ tài chính như cổ phiếu, trái phiếu, quyền chọn và các sản phẩm tài chính khác Đây là nơi mà các công ty niêm yết trên sàn giao dịch cung cấp cổ phiếu của mình cho nhà đầu tư công chúng Thị trường chứng khoán đóng vai trò quan trọng trong việc huy động vốn và cung cấp cơ hội đầu tư cho các cá nhân và tổ chức.
Mục tiêu chính của thị trường chứng khoán là cung cấp một nền tảng để giao dịch các công cụ tài chính và tạo ra cơ hội đầu tư cho nhà đầu tư Thị trường chứng khoán hoạt động dựa trên nguyên tắc cung cầu Giá cổ phiếu và các công cụ tài chính khác được xác định bởi sự cân nhắc giữa nguồn cung và nguồn cầu Nếu có nhiều người muốn mua một công cụ tài chính cụ thể, giá sẽ tăng lên để cân đối với sự tăng cầu và ngược lại
Ngoài ra, nó còn có tác động quan trọng đến nền kinh tế Khi thị trường chứng khoán phát triển và tăng trưởng, nó có thể hút vốn đầu tư, thúc đẩy hoạt động kinh doanh và tạo ra việc làm
Chứng khoán phái sinh là một loại công cụ tài chính phụ thuộc vào giá trị của một tài sản gốc, được giao dịch trên thị trường chứng khoán Chúng được tạo ra dựa trên hợp đồng phái sinh, trong đó các bên cam kết mua hoặc bán một tài sản cụ thể vào một thời điểm trong tương lai với một giá định trước
Các loại chứng khoán phái sinh phổ biến bao gồm tùy chọn (option), hợp đồng tương lai (futures), hợp đồng chứng chỉ (warrants) và hợp đồng trao đổi (swaps) Mỗi loại chứng khoán phái sinh có các đặc điểm riêng, nhưng chung quy lại, chúng đều dựa trên giá trị của tài sản gốc để xác định giá trị và lợi nhuận
Một trong những đặc điểm quan trọng của chứng khoán phái sinh là tính đòn bẩy (leverage) Nhờ tính chất này, nhà đầu tư có thể kiếm lợi nhuận lớn từ một số tiền đầu tư ban đầu nhỏ Tuy nhiên, điều này cũng có thể tạo ra rủi ro lớn, vì lợi nhuận và lỗ lớn cũng có thể xảy ra nhanh chóng
Chứng khoán phái sinh thường được sử dụng như công cụ giảm rủi ro (hedging) hoặc đầu cơ (speculation) Trong việc giảm rủi ro, các nhà đầu tư sử dụng chứng khoán phái sinh để bảo vệ khỏi biến động giá của tài sản gốc Điều này cho phép họ giữ được sự ổn định trong quản lý rủi ro đầu tư Trong khi đó, đầu cơ là hoạt động mua bán chứng khoán phái sinh với mục tiêu kiếm lợi nhuận từ biến động giá của tài sản gốc
Thị trường chứng khoán phái sinh mang lại nhiều lợi ích cho các nhà đầu tư và các công ty, bao gồm việc cung cấp công cụ phòng ngừa rủi ro, tạo ra khả năng tham gia vào các thị trường mới và tăng tính thanh khoản Tuy nhiên, chứng khoán phái sinh cũng có thể gây ra những tác động tiêu cực nếu không được sử dụng và quản lý một cách đúng đắn và cẩn thận
1.3 Lý thuyết về bài toán dự báo
Ngày nay, hầu như các lĩnh vực của đời sống xã hội đều sử dụng bài toán dự báo
Dự báo là một vấn đề quan trọng trong nhiều lĩnh vực như kinh tế, công nghiệp, y học, khoa học xã hội,… Kết quả dự báo đưa ra những cơ sở được sử dụng để hỗ trợ ra quyết định Trong đó, dự báo chuỗi thời gian là một kỹ thuật dự đoán các sự kiện thông qua một chuỗi thời gian Nó dự đoán các sự kiện trong tương lai bằng cách phân tích các xu hướng trong quá khứ, với giả định rằng các xu hướng giá trị trong tương lai sẽ tương tự như dự báo Trong quá trình phân tích dự báo, việc nắm bắt được thông tin của lĩnh vực mà chúng ta dự báo là một điều rất quan trọng
Mặc dù có rất nhiều tình huống, vấn đề cần dự báo nhưng chỉ có hai kỹ thuật dự báo chính: phương pháp định tính và phương pháp định lượng.
Yêu cầu sự đánh giá từ phía các chuyên gia trong lĩnh vực dự báo Dự báo định tính thường được sử dụng trong các tình huống có ít hoặc không có dữ liệu lịch sử để làm cơ sở cho dự báo
Sử dụng dữ liệu lịch sử và mô hình dự báo, phương pháp dựa trên dữ liệu lịch sử để phát hiện chiều hướng hoạt động của đối tượng phù hợp với mô hình toán học và sử dụng mô hình đó để làm ước lượng Trong phương pháp này, ba mô hình được sử dụng rộng rãi nhất là mô hình hồi quy (regression models), mô hình làm mịn (smoothing models) và mô hình chuỗi thời gian (time series models) Đối với mô hình hồi quy: Các biến giải thích được giả định để mô tả các tác động hoặc sự thúc đẩy các giá trị quan sát được từ biến độc lập Phương pháp bình phương nhỏ nhất là cơ sở của hầu hết các mô hình hồi quy Đối với mô hình làm mịn: Sử dụng các quan sát trước đó để đưa ra dự báo cho biến độc lập Phương pháp này được sử dụng và chứng minh theo kinh nghiệm dự trên cơ sở là chúng dễ sử dụng và tạo ra kết quả khả quan Đối với mô hình chuỗi thời gian: Sử dụng các tính chất thống kê của dữ liệu trong quá khứ để nhận dạng mô hình và ước lượng các tham số chưa biết của mô hình này, thường là bằng bình phương nhỏ nhất
1.3.2 Các bước thực hiện dự báo
Quy trình dự báo chuỗi thời gian gồm các bước sau:
Bước 1: Xác định mục tiêu và đối tượng Việc xác định rõ mục tiêu của dự báo giúp tìm được lời giải tối ưu cho vấn đề
Chính vì vậy, công việc đầu tiên trong quá trình dự báo là phải xác định mục tiêu đang hướng tới Sau đó, dựa vào mục tiêu để tìm được đối tượng cụ thể cho dự báo
Bước 2: Thu thập và xử lý dữ liệu
Dữ liệu là phần rất quan trọng trong quá trình dự báo, chất lượng kết quả dự báo sẽ phụ thuộc vào dữ liệu thu thập Có thể thu thập từ nguồn nội bộ hoặc bên ngoài Sau khi đã thu thập dữ liệu, chuyển đổi dữ liệu để phù hợp với mục đích dự báo dựa trên đầy đủ cơ sở
Bước 3: Phân tích sơ bộ số liệu
Thông qua phân tích sơ bộ để nắm được những thông tin cơ bản của dữ liệu cung cấp về đối tượng phục phụ cho dự báo Thực hiện các thống kê đơn giản như tính toán trung bình, phương sai, độ lệch chuẩn,…
PHƯƠNG PHÁP NGHIÊN CỨU
Nghiên cứu sử dụng dữ liệu là chỉ số của sản chứng khoán Hà Nội HNX từ tháng 05/2022 đến tháng 05/2023 Số liệu được thu thập từ: https://vn.investing.com Số liệu được nhóm nghiên cứu tổng hợp, xử lý bằng phần mềm excel, sau đó tiến hành thực hiện các kiểm định phân tích trên phần mềm Eviews.
Nghiên cứu sử dụng ba mô hình ARIMA, ARCH và GARCH để dự báo chỉ số HNX-Index Thực hiện các kiểm định liên quan và chạy mô hình, từ đó đánh giá, so sánh mức độ phù hợp để dự báo của ba mô hình, cuối cùng đưa ra những kết luận, kiến nghị phù hợp và ứng dụng thực tiễn.
KẾT QUẢ NGHIÊN CỨU
Dữ liệu nghiên cứu được chia thành ba giai đoạn Giai đoạn thứ nhất từ 18/05/2022 đến 10/5/2023 gồm 245 quan sát Đây là giai đoạn thu thập dữ liệu và tạo mẫu, từ đó làm cơ sở cho việc thực hiện ước lượng các mô hình để dự báo ARIMA, ARCH/GARCH Các số liệu được thu thập theo ngày, lấy giá đóng cửa của phiên giao dịch Giai đoạn thứ hai khoảng trong một tuần (từ 11/5/2023 đến 18/5/2023) dùng để dự báo ngoài mẫu và đánh giá mức độ chính xác của mô hình dự báo được chọn Giai đoạn cuối cùng, trong tuần làm việc tiếp theo (từ 20/5/2023 đến 27/5/2023), tiến hành dự báo chỉ số HNX-Index và biến động phương sai của chỉ số này, đưa ra kết quả cuối cho bài nghiên cứu.
Bảng 2: Thống kê chỉ số HNX-Index
Nguồn: Xử lý số liệu Eviews 13
Dựa vào thống kê mô tả về chuỗi số liệu, ta thấy rằng chỉ số HNX-Index dao động quanh giá trị trung bình là 215.3100, có chỉ số cao nhất 315.7600 vào ngày 31/5/2022 và thấp nhất 175.78 vào ngày 15/11/2022
3.2 Ước lượng mô hình ARIMA (p, d, q) 3.2.1 Kiểm định tính dừng của chuỗi HNX-Index
Hình ảnh 1: Biểu đồ biến động chỉ số HNX-Index trong giai đoạn nghiên cứu
Nguồn: Xử lý bằng phần mềm Eviews 13
Ta có thể thấy được qua đồ thị trên, chỉ số HNX-Index có diễn biến tăng và giảm từ tháng 5/2022 đến khoảng tháng 8 và 9 cùng năm Sau đó diễn biến giảm liên tục ở giai đoạn tháng 9/2022 đến tháng 11/2022 và dần ổn định về sau Xét điều kiện về giá trị kỳ vọng không đổi theo thời gian thì chuỗi này đã vi phạm giả thuyết và đây là chuỗi không dừng Dựa vào kiểm định nghiệm đơn vị Augmented Dickey-Fuller của chuỗi cho thấy giá trị p-value lớn hơn 5% nên ta kết luận chuỗi không dừng Kết quả kiểm định nghiệm đơn vị Augmented Dickey-Fuller xem ở phụ lục Hình ảnh 13 Để thực hiện các bước tiếp theo của quá trình ước lượng mô hình dự báo, ta tiến hành chuyển đổi chuỗi dữ liệu gốc thành chuỗi dừng bằng cách lấy sai phân bậc nhất của chuỗi HNX-Index
Hình ảnh 2: Biểu đồ của chuỗi sai phân bậc nhất dữ liệu HNX-Index theo thời gian
Nguồn: Xử lý bằng phần mềm Eviews 13
Nhìn vào dữ liệu, ta thấy chuỗi đã được xử lý tốt và giá trị của chuỗi không còn biến động mạnh Ta tiến hành kiểm định nghiệm đơn vị tương tự như trên bằng phương pháp Augmented Dickey-Fuller để tăng độ chính xác Giá trị kiểm định có p-value < 5% cho ta kết luận rằng chuỗi sai phân bậc nhất của chỉ số HNX-Index đã có tính dừng Do đó, ta sẽ sử dụng chuỗi sai phân này để lựa chọn mô hình ARIMA phù hợp
3.2.2 Xác định mô hình ARIMA (p, d, q)
Có rất nhiều phương pháp để xác định các thông số p,d,q cho mô hình ARIMA Ở bài nghiên cứu này sẽ sử dụng phương pháp căn cứ vào lược đồ ACF và PACF và sử dụng công cụ Automatic ARIMA Forecasting từ phần mềm Eviews 13, từ đó so sánh mô hình để đưa ra mô hình dự báo cuối cùng
3.2.2.1 Sử dụng công cụ Automatic ARIMA Forecasting
Như đã xác định bậc sai phân từ trước, ta sẽ tiến hành kiểm tra mô hình phù hợp dựa trên dữ liệu HNX-Index
Hình ảnh 3: Sử dụng công cụ Automatic ARIMA Forecasting
Nguồn: Xử lý bằng phần mềm Eviews 13
Công cụ được thực hiện trên giá đóng cửa của dữ liệu HNX-Index với bậc sai phần bằng 1, mẫu từ 18/5/2022 đến 10/5/2023 với tổng 244 quan sát Kết quả cho thấy rằng mô hình được chọn là ARIMA (2, 1, 3) với giá trị AIC bằng 5.54197 là mô hình phù hợp
3.2.2.2 Căn cứ vào lược đồ ACF, PACF
Ta sẽ tiến hành xác định thứ tự của p và q bằng việc nhìn vào lược đồ tự tương quan của dữ liệu
Hình ảnh 4: Lược đồ tự tương quan của dữ liệu
Nguồn: Xử lý bằng phần mềm Eviews 13
Dựa vào lược đồ, ta thấy ở dòng ở độ trễ bằng 11 thì cả yếu tố trung bình động (MA) và thành phần tự tương quan (AR) đều nằm ngoài dải tin cậy Vì thế ta lựa chọn mô hình với AR(11) và MA (11) với độ trễ bằng 1 để so sánh
3.2.2.3 Lựa chọn mô hình phù hợp
Dựa vào việc sử dụng Automatic ARIMA Forecasting và lược đồ tự tương quan, ba mô hình ARIMA được chọn là ARIMA (2, 1, 3), ARIMA (11, 1, 11) Ta tiến hành kiểm tra và so sánh các tiêu chí liên quan để chọn ra mô hình phù hợp để tiến hành dự báo Thực hiện thao tác với mô hình, ta được bảng kết quả so sánh như sau:
Bảng 3: Bảng kết quả so sánh tiêu chí chọn mô hình
Nhìn vào bảng trên và so sánh các tiêu chí, ta kết luận mô hình ARIMA (2,1,3) là phù hợp hơn, có phương trình như sau:
𝑙𝑎𝑛𝑐𝑢𝑜𝑖 𝑡 = − 0.393734 − 0.071822 ∗ 𝑙𝑎𝑛𝑐𝑢𝑜𝑖 𝑡 − 1 + 0.027509𝑢 𝑡 − 2 + 𝑢 𝑡 Sau đó ta tiếp tục kiểm định tính dừng trên phần dư và kiểm định nghiệm đơn vị cho mô hình được chọn Sau kết quả kiểm định, với mức ý nghĩa 5% và lược đồ tương quan, ta thấy mô hình ARIMA (2, 1, 3) là phù hợp Ngoài ra, kết quả kiểm tra điều kiện ổn định bằng cách xem các gốc AR nghịch đảo và MA nghịch đảo phải nằm trong vòng tròn đơn vị cũng cho ta kết quả phù hợp
Hình ảnh 5: Kiểm định sự ổn định của mô hình bằng đường tròn đơn vị
Nguồn: Xử lý bằng phần mềm Eviews 13
Sau khi tiến hành lựa chọn mô hình bằng cách chuẩn đoán, ta tiến hành dự báo kết quả ngoài mẫu cho giá trị của HNX-Index từ 10/5/2023 đến 18/05/2023 và thu được kết quả như biểu đồ và bảng như sau:
Hình ảnh 6: Biểu đồ thể hiện giá trị dự báo ngoài mẫu của dữ liệu HNX-Index
Nguồn: Xử lý bằng phần mềm Eviews 13
Ngày Giá trị thực tế
Giá trị dự báo (điểm)
Nguồn: Tổng hợp từ phần mềm Eviews 13
Kết quả dự báo mẫu bằng mô hình ARIMA (2, 1, 3) tương đối sát với giá trị thực tế của chuỗi dữ liệu Mức độ sai số khá thấp (từ 0,68% đến 1,33%) Kết quả này có thể chấp nhận được với độ tin cậy 95% Mô hình ARIMA (2, 1, 3) phù hợp để dự báo chỉ số HNX-Index trong giai đoạn nghiên cứu
Tuy đã lựa chọn được mô hình ARIMA (2,1,3) là tối ưu cho nghiên cứu, thực tế mô hình ARIMA nói chung có một nhược điểm là nó không khắc phục được hiện tượng phương sai sai số thay đổi của dữ liệu chuỗi thời gian Vì thế ta cần kiểm định tính
ARCH cho mô hình ARIMA (2, 1, 3) đối với chuỗi dữ liệu sai phân bậc nhất của HNX- Index với cặp giả thuyết:
H0: Không có hiện tượng ARCH ở độ trễ xác định H1: Có hiện tượng ARCH ở độ trễ xác định
Hình ảnh 7: Bảng kết quả kiểm định tính ARCH Khi cho các độ trễ thay đổi, chạy lần lượt từ 1, để xác định bậc của mô hình ARCH phù hợp Từ kết quả kiểm định ARCH bậc 4, ta có giá trị RESID^2(- 4) = 0.1994 không có ý nghĩa thống kê ở mức ý nghĩa 5% Nên kết luận hiệu ứng ARCH của mô hình bậc 3
Ta có thể sử dụng mô hình ARCH (3) để dự báo và khắc phục hiện tượng phương sai sai số thay đổi Tuy nhiên do mô hình ARCH có quá nhiều độ trễ nên có thể làm ảnh hưởng đến kết quả ước lượng do số bậc tự do bị giảm đáng kể trong mô hình Vì thế, ta tiến hành sử dụng mô hình GARCH để ước lượng
3.4 Ước lượng mô hình GARCH (p, q)
Tương tự như mô hình ARIMA, ta sẽ xác định các giá trị của q và p Theo các nghiên cứu đi trước và kinh nghiệm nghiên cứu trên các dữ liệu tài chính, mô hình GARCH (1, 1) được sử dụng nhiều để nghiên cứu vì tính hiệu quả và đơn giản trong việc mô hình hóa biến động tài chính