Từ những lý do cấp thiết nêu trên, nhóm chúng tôi quyết định lựa chọn đề tài: “ Ứng dụng mô hình ARIMA, ARCH và GARCH trong dự báo chỉ số HNX-Index” để nghiên cứu, dự báo và đưa ra những
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG KHOA
Đề tài:
ỨNG DỤNG MÔ HÌNH ARIMA, ARCH VÀ GARCH TRONG DỰ BÁO CHỈ SỐ HNX-INDEX Môn:
Nhóm sinh viên thực hiện:
TP Hồ Chí Minh, tháng 5 năm 2023
Trang 23 Đối tượng, phạm vi nghiên cứu 7PHẦN II: NỘI DUNG NGHIÊN CỨU 9
1.1 Thị trường chứng khoán 9
1.3 Lý thuyế ề bài toán dự báot v 101.3.1 Phân loạ ự báoi d 101.3.2 Các bước th c hiự ện dự báo 111.3.3 Các chỉ số ống kê độ đo chính xác của dự báoth 11
1.5.1 Khái niệm tính dừng 121.5.2 Kiểm định tính dừng 131.5.3 Biến đổi chuỗi thành chuỗi dừng 161.6 Mô hình ARIMA và phương pháp Box-Jenkins 16
1.7.2 Kiểm định tính ARCH 201.7.3 Một số dạng khác của mô hình ARCH 20
1.8.2 Một số dạng khác của mô hình GARCH 211.9 Các nghiên cứu liên quan 231.9.1 Nghiên cứu trong nước 231.9.2 Nghiên cứu nước ngoài 23CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU 252.1 Phương pháp thu thập dữ liệu 252.2 Phương pháp nghiên cứu 25CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU 25
Trang 33.2 Ước lượng mô hình ARIMA (p, d, q) 263.2.1 Kiểm định tính dừng của chuỗi HNX-Index 263.2.2 Xác định mô hình ARIMA (p, d, q) 273.2.3 Thực hiện dự báo 29
3.4 Ước lượng mô hình GARCH (p, q) 31
PHẦN III: KẾT LUẬN VÀ KIẾN NGHỊ 37
Trang 4DANH MỤ C B ẢNG BIỂU
Bảng 1: Các dạng lý thuyết của ACF và PACF đối với một số dạng mô hình ARIMA
17Bảng 2: Thống kê chỉ số HNX-Index 26Bảng 3: Bảng kết quả so sánh tiêu chí chọn mô hình 29Bảng 4: Kết quả dự báo chỉ số HNX-Index 33
Too long to read on your phone? Save
to read later on your computer
Save to a Studylist
Trang 5DANH MỤC HÌNH Ả NH
Hình ảnh 1: Biểu đồ biến động chỉ số HNX-Index trong giai đoạn nghiên cứu 26Hình ảnh 2: Biểu đồ của chuỗi sai phân bậc nhấ ữ ệu HNX-Index theo thời giant d li 27Hình ảnh 3: Sử dụng công cụ Automatic ARIMA Forecasting 27Hình ảnh 4: Lược đồ tự tương quan của d liệuữ 28Hình ảnh 5: Kiểm định sự ổn định của mô hình bằng đường tròn đơn vị 29Hình ảnh 6: Biểu đồ ể hiện giá trị dự báo ngoài mẫu của dữ ệu HNX-th li Index 30Hình ảnh 7: Bảng kết quả kiểm định tính ARCH 31Hình ảnh 8: Bảng kết quả ước lượng mô hình GARCH (1, 1) 32Hình ảnh 9: Phân phối xác suất phần dư GARCH (1,1) 32Hình ảnh 10: Biểu đồ dự báo chỉ số HNX-Index bằng mô hình GARCH và phương sai
Hình ảnh 11: Đồ ị kết quả dự báo chỉ số HNX-th Index 34Hình ảnh 12: Đồ ị phương sai có điều kiện kếth t quả dự báo chỉ số HNX-Index 35Hình ảnh 13: Kết quả kiểm định nghiệm đơn vị Augmented Dickey-Fuller 40Hình ảnh 14: Kiểm định tham số cho mô hình ARIMA (11, 1, 11) 40Hình ảnh 15: Thực hiện dự báo cho mô hình ARIMA (11, 1, 11) 41Hình ảnh 16: Kiểm định tham số cho mô hình ARIMA (2, 1, 3) 41Hình ảnh 17: Thực hiện dự báo cho mô hình ARIMA (2, 1, 3) 42Hình ảnh 18: Lược đồ tự tương quan đối với mô hình ARIMA (2, 1, 3) 42Hình ảnh 19: Kiểm định tính dừng mô hình ARIMA (2, 1, 3) 43
Trang 6Năm 2020 đã trở thành một năm đầy biến động và thách thức cho thị trường chứng khoán Việt Nam do ảnh hưởng của đại dịch COVID-19 Trong giai đoạn này, chỉ
số HNX-Index đã trải qua sự biến động mạnh mẽ và không thường xuyên, từ việc ghi nhận mức giảm sâu trong giai đoạn ban đầu của đại dịch cho đến sự hồi phục đáng kể trong giai đoạn sau đó Sự biến động này đã tạo ra nhiều cơ hội và rủi ro cho các nhà đầu tư và quản lý rủi ro
Đặc biệt, trong giai đoạn nghiên cứu từ năm 2020, diễn biến thị trường chứng khoán Việt Nam đã phản ánh một số yếu tố đáng chú ý Thị trường đã phản ứng mạnh với các biến động kinh tế và chính trị trong và ngoài nước, bao gồm sự gia tăng của các chính sách và biện pháp kinh tế từ chính phủ, thỏa thuận thương mại quốc tế, và biến động thị trường toàn cầu Đồng thời, tâm lý nhà đầu tư luôn trong trạng thái hoang mang trước những tình hình kinh tế trong và ngoài nước biến đổi liên tục và sự dao động của giá cổ phiếu cũng đã tác động đáng kể đến chỉ số HNX-Index
Do đó, việc nghiên cứu diễn biến và dự báo chỉ số HNX-Index trong giai đoạn này có ý nghĩa quan trọng để cung cấp thông tin hữu ích cho các nhà đầu tư, quản lý
Từ những lý do cấp thiết nêu trên, nhóm chúng tôi quyết định lựa chọn đề tài: “ Ứng dụng mô hình ARIMA, ARCH và GARCH trong dự báo chỉ số HNX-Index” để nghiên cứu, dự báo và đưa ra những phương án có tính hiệu quả cao cho nhà đầu tư
2 Mục tiêu nghiên cứu
Phân tích diễn biến thị trường chứng khoán Việt Nam và chỉ số HNX-Index từ năm 2020 đến nay: Trong mục này, chúng ta sẽ điều tra và phân tích diễn biến thị trường chứng khoán Việt Nam trong giai đoạn từ năm 2020 đến nay, bao gồm các yếu tố kinh
tế, chính trị và xã hội có ảnh hưởng đến sự biến động của thị trường chứng khoán Chúng tôi cũng sẽ xem xét các biến động đáng chú ý của chỉ số HNX-Index trong giai đoạn này
Áp dụng mô hình ARIMA để dự báo chỉ số HNX-Index Chúng tôi mong muốn
sẽ xây dựng mô hình ARIMA cho chỉ số HNX-Index và sử dụng dữ liệu lịch sử để dự báo xu hướng và biến động của chỉ số trong tương lai Mục tiêu là xác định được mức
độ chính xác của mô hình ARIMA trong dự báo chỉ số HNX-Index trong giai đoạn này
Mô hình hóa biến động không đồng nhất và tính toán rủi ro bằng mô hình ARCH
và GARCH: Biến động không đồng nhất là một đặc trưng thường xuyên trong thị trường
Trang 7chứng khoán, đặc biệt trong các giai đoạn biến động mạnh như từ năm 2020 trở đi Chúng tôi sẽ áp dụng mô hình ARCH và GARCH để mô hình hóa biến động không đồng nhất của chỉ số HNX-Index và tính toán rủi ro dựa trên các thành phần autoregressive Mục tiêu là cung cấp thông tin quan trọng về mức độ rủi ro trong thị trường chứng khoán Việt Nam và chỉ số HNX-Index, từ đó hỗ trợ quản lý rủi ro và đưa ra quyết định đầu tư thông minh
So sánh hiệu quả của các mô hình dự báo: Trong giai đoạn từ năm 2020 đến nay, thị trường chứng khoán Việt Nam đã trải qua nhiều biến động và không chắc chắn Mục tiêu của nghiên cứu là so sánh hiệu quả của các mô hình ARIMA, ARCH và GARCH trong dự báo chỉ số HNX-Index trong giai đoạn này Chúng tôi sẽ đánh giá và so sánh
độ chính xác và độ tin cậy của các mô hình này để xác định mô hình nào hiệu quả nhất trong dự báo chỉ số HNX-Index
Đưa ra khuyến nghị và ứng dụng thực tiễn: Kết quả nghiên cứu sẽ cung cấp thông tin quan trọng và những hiểu biết sâu sắc về diễn biến và dự báo chỉ số HNX-Index trong thị trường chứng khoán Việt Nam từ năm 2020 đến nay Dựa trên kết quả nghiên cứu, chúng tôi có thể đưa ra khuyến nghị và ứng dụng thực tiễn cho các nhà đầu tư và quản lý rủi ro trong việc định hình chiến lược đầu tư và quản lý danh mục
Tổng thể, mục tiêu của đề tài là áp dụng và so sánh hiệu quả của các mô hình ARIMA, ARCH và GARCH trong dự báo chỉ số HNX-Index trong giai đoạn từ năm
2020 trở đi Nghiên cứu này sẽ mang lại kiến thức quan trọng về diễn biến thị trường chứng khoán Việt Nam, đánh giá rủi ro và đưa ra những khuyến nghị ứng dụng thực tiễn cho các nhà đầu tư và quản lý rủi ro
3 Đối tượng, phạm vi nghiên cứu
Đối tượng nghiên cứu
Chỉ số HNX-Index: Tập trung vào dự báo chỉ số HNX-Index, một chỉ số quan trọng trong thị trường chứng khoán Việt Nam đại diện cho biến động của các công ty niêm yết trên sàn giao dịch Hà Nội Chỉ số này thường được sử dụng để đánh giá và phản ánh tình hình thị trường chứng khoán Việt Nam
Các mô hình ARIMA, ARCH và GARCH: Áp dụng các mô hình này để phân tích và dự báo chỉ số HNX-Index Mô hình ARIMA sẽ giúp phân tích xu hướng và chu
kỳ của chỉ số, trong khi mô hình ARCH và GARCH sẽ giúp mô hình hóa và tính toán rủi ro
Phạm vi nghiên cứu
Thị trường chứng khoán Việt Nam: Nghiên cứu sẽ tập trung vào thị trường chứng khoán Việt Nam và diễn biến của chỉ số HNX-Index Thị trường chứng khoán Việt Nam
Trang 8đã trải qua nhiều biến động và tác động từ các yếu tố kinh tế, chính trị và xã hội trong giai đoạn từ năm 2020 đến nay
Giai đoạn từ năm 2020 đến nay: Nghiên cứu sẽ tập trung vào diễn biến của chỉ
số HNX-Index trong khoảng thời gian từ năm 2020 đến nay Giai đoạn này đặc biệt quan trọng vì sự ảnh hưởng của đại dịch COVID-19 và các biến động kinh tế toàn cầu đối với thị trường chứng khoán Việt Nam
Phạm vi nghiên cứu sẽ giúp tập trung vào việc áp dụng và so sánh hiệu quả của các mô hình ARIMA, ARCH và GARCH trong dự báo chỉ số HNX-Index trong bối cảnh diễn biến thị trường chứng khoán Việt Nam từ năm 2020 đến nay
Trang 9PHẦN II: NỘI DUNG NGHIÊN CỨU
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 1.1 Thị trường chứng khoán
Thị trường chứng khoán là một hệ thống giao dịch mua bán các công cụ tài chính như cổ phiếu, trái phiếu, quyền chọn và các sản phẩm tài chính khác Đây là nơi mà các công ty niêm yết trên sàn giao dịch cung cấp cổ phiếu của mình cho nhà đầu tư công chúng Thị trường chứng khoán đóng vai trò quan trọng trong việc huy động vốn và cung cấp cơ hội đầu tư cho các cá nhân và tổ chức
Mục tiêu chính của thị trường chứng khoán là cung cấp một nền tảng để giao dịch các công cụ tài chính và tạo ra cơ hội đầu tư cho nhà đầu tư Thị trường chứng khoán hoạt động dựa trên nguyên tắc cung cầu Giá cổ phiếu và các công cụ tài chính khác được xác định bởi sự cân nhắc giữa nguồn cung và nguồn cầu Nếu có nhiều người muốn mua một công cụ tài chính cụ thể, giá sẽ tăng lên để cân đối với sự tăng cầu và ngược lại
Ngoài ra, nó còn có tác động quan trọng đến nền kinh tế Khi thị trường chứng khoán phát triển và tăng trưởng, nó có thể hút vốn đầu tư, thúc đẩy hoạt động kinh doanh
và tạo ra việc làm
1.2 Chứng khoán phái sinh
Chứng khoán phái sinh là một loại công cụ tài chính phụ thuộc vào giá trị của một tài sản gốc, được giao dịch trên thị trường chứng khoán Chúng được tạo ra dựa trên hợp đồng phái sinh, trong đó các bên cam kết mua hoặc bán một tài sản cụ thể vào một thời điểm trong tương lai với một giá định trước
Các loại chứng khoán phái sinh phổ biến bao gồm tùy chọn (option), hợp đồng tương lai (futures), hợp đồng chứng chỉ (warrants) và hợp đồng trao đổi (swaps) Mỗi loại chứng khoán phái sinh có các đặc điểm riêng, nhưng chung quy lại, chúng đều dựa trên giá trị của tài sản gốc để xác định giá trị và lợi nhuận
Một trong những đặc điểm quan trọng của chứng khoán phái sinh là tính đòn bẩy (leverage) Nhờ tính chất này, nhà đầu tư có thể kiếm lợi nhuận lớn từ một số tiền đầu
tư ban đầu nhỏ Tuy nhiên, điều này cũng có thể tạo ra rủi ro lớn, vì lợi nhuận và lỗ lớn cũng có thể xảy ra nhanh chóng
Chứng khoán phái sinh thường được sử dụng như công cụ giảm rủi ro (hedging) hoặc đầu cơ (speculation) Trong việc giảm rủi ro, các nhà đầu tư sử dụng chứng khoán phái sinh để bảo vệ khỏi biến động giá của tài sản gốc Điều này cho phép họ giữ được
sự ổn định trong quản lý rủi ro đầu tư Trong khi đó, đầu cơ là hoạt động mua bán chứng khoán phái sinh với mục tiêu kiếm lợi nhuận từ biến động giá của tài sản gốc
Trang 10Thị trường chứng khoán phái sinh mang lại nhiều lợi ích cho các nhà đầu tư và các công ty, bao gồm việc cung cấp công cụ phòng ngừa rủi ro, tạo ra khả năng tham gia vào các thị trường mới và tăng tính thanh khoản Tuy nhiên, chứng khoán phái sinh cũng
có thể gây ra những tác động tiêu cực nếu không được sử dụng và quản lý một cách đúng đắn và cẩn thận
1.3 Lý thuyế ề bài toán dự báo t v
Ngày nay, hầu như các lĩnh vực của đời sống xã hội đều sử dụng bài toán dự báo
Dự báo là một vấn đề quan trọng trong nhiều lĩnh vực như kinh tế, công nghiệp, y học, khoa học xã hội,… Kết quả dự báo đưa ra những cơ sở được sử dụng để hỗ trợ ra quyết định Trong đó, dự báo chuỗi thời gian là một kỹ thuật dự đoán các sự kiện thông qua một chuỗi thời gian Nó dự đoán các sự kiện trong tương lai bằng cách phân tích các xu hướng trong quá khứ, với giả định rằng các xu hướng giá trị trong tương lai sẽ tương tự
ư dự báo Trong quá trình phân tích dự báo, việc nắm bắt được thông tin của lĩnh vực
mà chúng ta dự báo là một điều rất quan trọng
1.3.1 Phân ại dự báo lo
Mặc dù có rất nhiều tình huống, vấn đề cần dự báo nhưng chỉ có hai kỹ thuật dự báo chính: phương pháp định tính và phương pháp định lượng
Phương pháp định tính
Yêu cầu sự đánh giá từ phía các chuyên gia trong lĩnh vực dự báo Dự báo định tính thường được sử dụng trong các tình huống có ít hoặc không có dữ liệu lịch sử để làm cơ sở cho dự báo
Phương pháp định lượng
Sử dụng dữ liệu lịch sử và mô hình dự báo, phương pháp dựa trên dữ liệu lịch sử
để phát hiện chiều hướng hoạt động của đối tượng phù hợp với mô hình toán học và sử dụng mô hình đó để làm ước lượng Trong phương pháp này, ba mô hình được sử dụng rộng rãi nhất là mô hình hồi quy (regression models), mô hình làm mịn (smoothing models) và mô hình chuỗi thời gian (time series models)
Đối với mô hình hồi quy: Các biến giải thích được giả định để mô tả các tác động hoặc sự thúc đẩy các giá trị quan sát được từ biến độc lập Phương pháp bình phương nhỏ nhất là cơ sở của hầu hết các mô hình hồi quy
Đối với mô hình làm mịn: Sử dụng các quan sát trước đó để đưa ra dự báo cho biến độc lập Phương pháp này được sử dụng và chứng minh theo kinh nghiệm dự trên
cơ sở là chúng dễ sử dụng và tạo ra kết quả khả quan
Đối với mô hình chuỗi thời gian: Sử dụng các tính chất thống kê của dữ liệu trong quá khứ để nhận dạng mô hình và ước lượng các tham số chưa biết của mô hình này, thường là bằng bình phương nhỏ nhất
Trang 111.3.2 Các bướ c th ực hiệ n d ự báo
Quy trình dự báo chuỗi thời gian gồm các bước sau:
Bước 1: Xác định mục tiêu và đối tượng
Việc xác định rõ mục tiêu của dự báo giúp tìm được lời giải tối ưu cho vấn đề Chính vì vậy, công việc đầu tiên trong quá trình dự báo là phải xác định mục tiêu đang hướng tới Sau đó, dựa vào mục tiêu để tìm được đối tượng cụ thể cho dự báo.Bước 2: Thu thập và xử lý dữ liệu
Dữ liệu là phần rất quan trọng trong quá trình dự báo, chất lượng kết quả dự báo
sẽ phụ thuộc vào dữ liệu thu thập Có thể thu thập từ nguồn nội bộ hoặc bên ngoài Sau khi đã thu thập dữ liệu, chuyển đổi dữ liệu để phù hợp với mục đích dự báo dựa trên đầy
đủ cơ sở
Bước 3: Phân tích sơ bộ số liệu
Thông qua phân tích sơ bộ để nắm được những thông tin cơ bản của dữ liệu cung cấp về đối tượng phục phụ cho dự báo Thực hiện các thống kê đơn giản như tính toán trung bình, phương sai, độ lệch chuẩn,…
Bước 4: Xác định mô hình dự báo
Việc lựa chọn mô hình phụ thuộc vào các yếu tố sau: Dạng phân bố của dữ liệu,
số lượng quan sát sẵn có, độ dài của giai đoạn dự báo
Bước 5: Kiểm định sự phù hợp của mô hình
Kiểm định mô hình đã phù hợp với mục đích ban đầu và dữ liệu hay chưa.Bước 6: Sử dụng và đánh giá mô hình dự báo
Khi đã nhận dạng được mô hình phù hợp, sử dụng mô hình để tính toán các giá trị dự báo tương lai của dữ liệu Thông qua các thống kê đã thực hiện, đánh giá độ chính xác của phương pháp dự báo Từ đó lựa chọn mô hình tối ưu để thực hiện dự báo
1.3.3 Các chỉ số ống kê độ đo chính xác của dự th báo
Thông qua các thông số sau để đánh giá độ chính xác của phương pháp dự báo:Với 𝑒𝑡là sai số dự báo tại thời điểm t, 𝑌𝑡là giá trị thực tế tại thời điểm t, 𝑌𝑡 là giá trị dự báo tại thời điểm t
Sai số trung bình (Mean Error):
1
𝑛∑𝑛 𝑒𝑡
𝑡 = 1Sai số dự báo tuyệt đối trung bình (Mean Absolute Error):
1
𝑛∑𝑛 |𝑒𝑡|
𝑡 = 1Sai số phần trăm trung bình (Mean Percentage Error):
1
𝑛∑ (𝑒𝑡
𝑌 𝑡)𝑛
𝑡 = 1
Trang 121.4 Chuỗ i th ời gian
Dữ liệu chuỗi thời gian rất quen thuộc trong các bài toán dự báo, đặc biệt là ở lĩnh vực tài chính Chuỗi thời gian là một chuỗi các điểm dữ liệu, được đo theo từng khoảnh khắc thời gian liền nhau theo một tần suất thời gian thống nhất Các giá trị của chuỗi thời gian của đại lượng Y được ký hiệu là Y …, Y … với Y là giá trị quan sát của biến Y tại thời điểm đầu tiên, Y là giá trị quan sát tại thời điểm t và Y
là giá trị quan sát tại thời điểm thứ n
Dữ liệu chuỗi thời gian thường được các nhà thống kê chia thành bốn phần:Thành phần xu thế (trend component): Chỉ xu hướng tăng hay giảm của biến Y trong thời gian dài
Thành phần mùa (seasonal component): Thể hiện sự biến đổi, giao động của đại lượng Y tính theo mùa như theo quý, tháng, tuần trong năm
Thành phần chu kỳ (cyclical component): Dùng để chỉ sự dao động giống như hình sóng và sự dao động lặp đi lặp lại sau một thời kỳ thường dài hơn một năm.Thành phần bất thường (irregular component): Thể hiện sự thay đổi ngẫu nhiên của các giá trị trong chuỗi thời gian mà không dự báo được
Kỳ vọng không đổi theo thời gian:
μ với ∀Phương sai không đổi theo thời gian:
𝜎2
𝜎2
μ 𝜎2với ∀
Trang 13Hiệp phương sai không phụ thuộc vào thời điểm tính toán mà phụ thuộc vào độ trễ
với ∀Quá trình ngẫu nhiên Y sẽ coi là không dừng nếu vi phạm ít nhất một trong ba điều kiện trên
1.5.2 Kiể m đ ịnh tính dừ ng
1.5.2.1 Dựa trên đồ thị của chuỗi thời gian
Thông qua quan sát đồ thị của chuỗi thời gian, nếu đồ thị Y = f(t) cho thấy trung bình và phương sai của quá trình Y không đổi theo thời gian thì ta có thể kết luận chuỗi
có tính dừng Phương pháp này cho ta cái nhìn trực quan và đánh giá ban đầu về tính dừng của chuỗi thời gian Tuy nhiên, phương pháp này trở nên khó khăn và độ chính xác không cao khi chuỗi thời gian có xu hướng không rõ ràng
1.5.2.2 Dựa trên giản đồ tương quan
Tự tương qua
Ngoài dựa trên quan sát đồ thị, ta có thể sử dụng hàm tự tương quan (ACF Correlation Function) để kiểm định tính dừng ACF với độ trễ k, ký hiện bằng , được xác định như sau:
𝑘 0
Khi vẽ đồ thị của theo k, ta được giản đồ tương quan tổng thể Tuy nhiên, trên thực tế ta chưa có tổng thể mà chỉ có mẫu Do đó, ta xây dựng hàm tự tương quan mẫu Sample Correlation Function) với:
𝑘
∑(𝑌 𝑡 − 𝑌)(𝑌𝑡 = 𝑘− 𝑌 ) 𝑛 0
∑(𝑌 𝑡 − 𝑌 ) 2 𝑛 𝑘 𝑘 0
Trường hợp mẫu có kích thước nhỏ thì mẫu số của 𝑘là n 1 và của 0là n
1 Đồ thị thể hiện ở độ trễ k được gọi là giản đồ tương quan mẫu
Bartlett đã cho thấy nếu một chuỗi là ngẫu nhiên và dừng thì các hệ số tự tương quan mẫu sẽ có xấp xỉ phân phối chuẩn với kỳ vọng bằng 0 và phương sai 1/n với n khá lớn, 𝑘~
Khi đó, ta kiểm định giả thuyết: {H0: k= 0 (chuỗi dừng)
H1: k≠ 0
Trang 14𝜎 𝑘 𝑆𝐸( 𝑘)
𝑘 1/√𝑛Nếu 𝑘thuộc khoảng ( Zα/2/√𝑛, Zα/2/√𝑛) thì chấp nhận giả thuyết H với mức
ý nghĩa α
Ngoài ra, bằng cách quan sát giản đồ tương quan, nếu đồ thị có xu hướng giảm chậm tương đối đều đặn theo độ trễ thì có thể kết luận chuỗi không dừng Ngược lại có thể xác định chuỗi dừng khi đồ thị giảm nhanh, ngẫu nhiên và không theo xu hướng
Tự tương quan từng phần
Các hệ số tự tương quan k ≥ 2) cho thấy mức độ kết hợp tuyến tính của Y và nhiên, mức độ kết hợp giữa hai biến còn có thể do một số biến khác gây ra Xét trường hợp này là ảnh hưởng từ các biến Y …Y Từ đó để đo độ kết hợp riêng lẽ giữa Y và Y ta sử dụng hàm tự tương quan từng phần (PACF
Correlation Function) với hệ số tương quan riêng kkđược ước lượng theo công thức của Durbin:
𝑘𝑘
𝑘 − ∑ 𝑘 − 1 𝑘 − 1,𝑗. 𝑘 − 𝑗
𝑗 = 1 1− ∑ 𝑘 − 1 𝑘 − 1,𝑗. 𝑗
𝑗 = 1
𝑘𝑗 𝑘 − 1,𝑗 𝑘𝑘 𝑘 − 1,𝑗(j = 1, 2, …,
11 1Nếu chuỗi dừng thì các 𝑘𝑘có phân phối chuẩn N(0,1/n), kiểm định giả thuyết đối với kktương tự như với k
~ 𝜒2Bác bỏ H 𝜒2 𝛼
Một dạng khác của Q là thống kê Ljung
∑ 2 𝑘
𝑛 − 𝑘 𝑚
𝑘 = 1Với LB ~ 𝜒2(m), bác bỏ H 𝜒𝛼 2
Thống kê LB được xem là tốt hơn với các mẫu số nhỏ so với thống kê Q
1.5.2.3 Kiểm định nghiệm đơn vị Dickey
Trang 15Nhiễu trắng
Một chuỗi U được gọi là nhiễu trắng khi nó đáp ứng đầy đủ các giả thiết của mô hình hồi quy tuyến tính cổ điển là kỳ vọng bằng không, phương sai không đổi và hiệp phương sai bằng không Một chuỗi nhiều trắng đa số không có một cấu trúc hay hình mẫu rõ rệt nào
Nếu Y với U là nhiễu trắng thì Y được gọi là bước ngẫu nhiên
Với: Y
+ … +
Vì Y là hằng số, các U độc lập với nhau, phương sai không đổi bằng 𝜎2nên
𝜎2(thay đổi theo t) Từ đó chứng tỏ Y là chuỗi không dừng
Kiểm định nghiệm đơn vị Dickey
Kiểm định Dickey Fuller nhằm xác định chuỗi thời gian có phải là random walk hay không Nếu chuỗi là random walk thì không có tính dừng Tuy nhiên lưu ý rằng nếu chuỗi không có tính dừng thì chưa khẳng định đó là random walk
Xét mô hình Y với U là nhiễu trắng Nếu = 1 thì Y là random walk và không dừng Khi đó, để kiểm định tính dừng của Y ta kiểm định giả thuyết: {H0: = 1 (chuỗi không dừng)
H1: ≠ 1
Trong trường hợp này ta không thể sử dụng kiểm định t vì Y có thể là chuỗi không dừng Do đó, ta sử dụng tiêu chuẩn kiểm định DF như sau:
𝜏𝑠𝑒( )Phân phối theo quy luật DF: Nếu |𝜏| |𝜏𝛼|ta bác bỏ giả thuyết H và kết luận chuỗi dừng
Tiêu chuẩn DF cũng được áp dụng cho các mô hình sau:
Trang 161.5.3 Biế n đ ổi chuỗi thành chuỗ i dừng
Trong trường hợp một chuỗi thời gian không có tính dừng thì bắt buộc phải chuyển đổi chuỗi đó thành chuỗi có tính dừng, khi đó mới có thể xây dựng mô hình và thực hiện dự báo
Xét bước ngẫu nhiên: Y = Y + U vớt t - 1 t i Utlà nhiễu trắng
Lấy sai phân cấp I của Yt: D(Yt) = Y - Y = U Khi đó, D(Y ) là chuỗ ừng vì t t - 1 t t i d
Utlà nhiễu trắng
Tổng quát rằng với bất kỳ chuỗi thời gian, nếu sai phân cấp I của Y chưa dừt ng
ta tiếp tục lấy sai phân cấp II, III, … Luôn tồn tại một giá trị d xác định để sao cho sai phân cấp d của Y là một chuỗi dừng Khi đó Y được gọi là liên kết bậc d, ký hiệu là t tI(d)
Từ đó, để biến một chuỗi không dừng thành chuỗi dừng ta áp dụng phương pháp lấy sai phân Một chuỗi thời gian thường dừng ở sai phân cấp I hoặc cấp II
1.6 Mô hình ARIMA và phương pháp Box Jenkins
-Mô hình trung bình trượt đồng liên kết tự hồi quy ARIMA (p, d, q) với p là số hạng tự hồi quy, d là bậc sai phân và q là số hạn trung bình trượt Sở dĩ mô hình ARIMA được sử dụng là bởi vì trong thực tế đa phần các chuỗi dữ ệu thời gian đều có tính likhông dừng mà quá trình tự hồi quy tích hợp trung bình trượt ARMA (p, q) (sự kết hợp của quá trình tự hồi quy AR và trung bình trượt MA) ch áp dỉ ụng khi dữ ệu chuỗli i thời gian có tính dừng Do đó, cần sử dụng phương pháp lấy sai phân chuỗi dữ liệu để chuyển đổi chuỗi dữ ệu không dừng thành chuỗ dừng, khi đó mô hình ARIMA với phương li i pháp Box-Jenkins s được sẽ ử dụng
Hàm tuyến tính của ARMA (p, q) được mô tả như sau:
Yt = 𝜑1yt - 1 + 𝜑 y2 t - 2 + + 𝜑𝑝yt - p + ut + 𝜃1ut - 1 + 𝜃2ut - 2 + + 𝜃𝑞ut - qVới Y tlà biến phản ứng tại thời điểm t
y , yt - 1 t - 2, , y t - plà biến phản ứng tại các độ ễ bằng 1, 2, tr
𝜑1, 𝜑 , , 𝜑2 𝑝là các tham số phân tích hồi quy
utlà sai số dự báo ngẫu nhiên tại thời điểm t (nhiễu trắng)
ut - 1, u , ,t - 2 t - qu là các sai số ở các thời điểm trước
𝜃1, 𝜃2, , 𝜃𝑞là các hệ số trung bình trượ ẽ đượt s c ư c lướ ợng
q là số các sai số quá khứ
Phương pháp Box-Jenkins
Ta cần xác định các giá trị của p, d, q để biết được đặc tính của chuỗi thời gian
mà đề tài nghiên cứu và xác định các đặc tính đó tuân theo quá trình nào và xem xét giá
trị phù hợp nhất với chuỗi dữ ệu thời gian của đề tài Để làm được điều này George li
Trang 17Box và Qwilyn Jenkins đã nghiên cứu và đưa ra phương pháp Box-Jenkins Gồm các bước tiến hành như sau:
Bước 1: Nhận dạng mô hình
Ở bước này ta cần tìm các giá trị thíc
h hợp của p, d và q Để làm được điều đó, ta sử dụng biểu đồ tự tương quan (hay còn gọi là Correlogram, ACF để xác định giá trị q và biểu đồ tự tương quan từng phần (hay ) còn gọi là Partial Correlogram, PACF) để xác định giá trị p
Theo (Cao, P T., & Châu, V M , 2009), ta có các dạng lý thuyết của ACF và PACF đố ới mộ ố dạng của mô hình ARIMA như sau: i v t s
(p, d, 0) Giảm dạng mũ hoặc giảm hình sin 𝜌𝑘𝑘= 0 với k > p
(0, d, q) 𝜌𝑘= 0 với k > q Giảm dạng mũ hoặc giảm hình sin(1, d, 1) 𝜌1 0 sau đó giả≠ m dạng mũ/
giảm hình sin
𝜌11 0 sau đó giả≠ m dạng mũ/ giảm hình sin
(1, d, 2) 𝜌1, 𝜌2 0 sau đó giả≠ m dạng mũ/
giảm hình sin
𝜌11, 𝜌 0 sau đó giả22≠ m dạng mũ/ giảm hình sin
(2, d, 1) 𝜌1 0 sau đó giả≠ m dạng mũ/
giảm hình sin
𝜌11 0 sau đó giả≠ m dạng mũ/ giảm hình sin
(2, d, 2) 𝜌1, 𝜌2 0 sau đó giả≠ m dạng mũ/
giảm hình sin
𝜌11, 𝜌 0 sau đó giả22≠ m dạng mũ/ giảm hình sin
Bảng 1: Các dạng lý thuyế ủa ACF và PACF đố ới mộ ố dạng mô hình ARIMAt c i v t sNgoài ra để có thể lựa chọn một mô hình thích hợp cho đề tài, theo tiêu chuẩn của (Akaike, 1974) và (Schwarz, 1978) như sau:
Theo Akaike ta có:
AIC (p, q) = ln 𝜎2 + 2 𝑝+ 𝑞𝑛
AIC (p1, q1) = min AIC (p, q) với p P, q ∈ ∈ Q
Khi đó p1 và q sẽ là giá trị 1 thích hợp cho p và q
Theo Schwarz ta có:
SIC (p, q) = ln 𝜎2 + 2 (𝑝+ 𝑞 ∗ (𝑛)) ln
𝑛 SIC (p1, q1) = min SIC (p, q) với p P, q ∈ ∈ Q
Trong cả hai tiêu chuẩn Akaike và Schwarz, các tập P và Q đều chưa biết Chính
vì vậy Hanna đã chỉ ra rằng nếu p và q là các giá tị đúng thì p < p và q < q 0 0 0 1 0 1Trên cơ sở từ hai tiêu chuẩn đã nêu, (Poskitt, D S., & Tremayne, A R , 1987)
đã đưa ra ý tưởng về việc xây dựng một lớp mô hình Các tác giả này nhận định rằng p 1
Trang 18và q được xác định ở trên chưa chắc có thể xác định được các giá trị ực cho mô hình, 1 th
do đó cần phải xem xét thêm các tiêu chuẩn khác để có được kết luận phù hợp hơn với các giá trị gần kề p và q , họ đã đề nghị như sau: 1 1
R = exp (- 21 * n * [SIC (p , q - SIC (p, q)])1 1) Nếu R < 10 thì không đủ ứng cứ để ại bỏ mô hình đã chọn bằng ch lo tiêu chuẩn AIC và SIC Với những cặp (p, q) mà có giá trị 1 < R < √10 thì phải được xem xét giống (p1, q1)
Bước 2: Ư c lượng mô hình ớ
Sau khi đã nhận dạng các giá trị p, d và q, tiếp theo ta sẽ ước lượng các hệ số này của mô hình ARIMA Ta có thể sử dụng phương pháp bình phương tối thiểu để ước lượng chúng (một vài trường hợp sử dụng phương pháp ước lượng phi tuyến) Bước 3: Kiểm tra chẩn đoán
Sau khi lựa chọn mô hình cụ thể và ước lượng các tham số, ta sẽ xem xét liệu mô hình đã được chọn có phù hợp với dữ ệu hay không, chúng ta cần thử nhiều mô hình li
để xác định mô hình phù hợp nhất đối với d liữ ệu
Kiểm định độ phù hợp của mô hình là phương pháp kiểm tra các phần dư ước lượng từ mô hình này có phải là nhiễu trắng hay không (có tính dừng) Nếu phần dư et
là nhiễu trắng, kết luận mô hình phù hợp Nếu e không phải là nhiễu trắng ta sẽ t thực hiện lại cho đến khi tìm được mô hình phù hợp và tốt nhất
Có một số tiêu chuẩn để ta lựa chọn mô hình phù hợp có thể kể đến bao gồm: Log likelihood giá trị đạt được càng lớn mô hình càng tốt, Akaike và Schwarz càng đạt giá trị nhỏ mô hình càng tốt
Bước 4: Tiến hành dự báo
Ở bước này ta tiến hành dự báo điểm và dự báo khoảng cho những thời điểm tiếp theo (trong tương lai) dựa trên mô hình phù hợp vừa lựa chọn đượ ở Bước 3 c Phương pháp Box-Jenkins về dự báo có thể được mô tả bằng các bước thực hiện như sau:
Thứ nhất, nhận dạng mô hình dựa trên các hàm tự tương quan và hàm tự tương quan riêng phần
Thứ hai, lựa chọn một mô hình tốt nhất cho chuỗ ữ ệu i d li
Thứ ba, ước lượng các giá trị tham số của mô hình vừa được chọn
Thứ tư, kiểm định độ chính xác của mô hình (nếu độ chính xác không đạt chuẩn quay lại bước thứ hai và thực hiện lại, nếu độ chính xác đạt chuẩn đến bước tiếp theo) Cuối cùng, sử dụng mô hình có độ chính xác cao để dự báo cho chuỗi dữ ệu liNhược điểm khi sử dụng mô hình ARIMA với phương pháp Box-Jenkins để dự báo đó là vi phạm giả thiết phương sai sai số không đổi, bởi vì trong thực tế các bài toán
Trang 19tài chính cho thấy phương sai sai số có thay đổi theo thời gian và điều này không phù hợp với giả ết yêu cầu Chính vì vậy mô hình ARIMA hoạt động tốt trong dự báo kỳ thivọng nhưng lại không phù hợp để dự báo phương sai của dữ ệu chuỗi thời gian trong litài chính
1.7 Mô hình ARCH
1.7.1 Khái niệm
Mô hình ARCH được phát triển thành công và đưa ra bở (Engle, 1982) nhằi m khắc phục được nhược điểm của mô hình ARIMA về phương sai sai số thay đổi theo thời gian Mô hình ARCH hay còn được gọi là mô hình tự hồi quy với phương sai có điều kiện thay đổi (AutoRegressive Conditional Heteroskedasticity)
Mô hình ARCH (1) có dạng như sau:
Yt = B + B1 2 t X+ u t(*)
ut ~ N(0, ht)
ht = 𝛾0 + 𝛾1𝑢2t - 1 (**)Phương trình (*) được gọi là phương trình ước lượng giá trị trung bình Với X tlà vector của các biến giả thích, B là vector của các hệ số và U được giả định có phân i 2 tphối chuẩn với giá trị trung bình bằng 0, phương sai không đổi bằng h t
Phương trình (**) được gọi là phương trình ước lượng phương sai Với 𝛾1 là hệ
số ước lượng và phải có dấu dương, vì phương sai luôn đạt giá trị dương
Mô hình ARCH (1) cho rằng khi có một cú sốc lớn nào đó trong thực tế xảy ra trong bộ dữ ệu chuỗi thời gian ở giai đoạn t - 1 thì giá trị u li tcũng sẽ đạt giá trị lớn hơn Điều này có nghĩa là khi 𝑢2t -1 đạt giá trị lớn/ nhỏ thì phương sai u cũng sẽ đạt giá lớn/ tnhỏ
Trên thực tế, phương sai có điều kiện không chỉ phụ thuộc vào một độ trễ mà còn nhiều độ ễ khác nữa, vì thế mỗi độ ễ sẽ cho một quy trình ARCH khác nhau Và tr trtrường hợp tổng quát của mô hình ARCH (q) đư c mô tợ ả như sau:
Yt = B + B1 2 t X+ u t
ut ~ N(0, ht)
ht = 𝛾0 + ∑𝑞𝑗=1𝑢2t - jVới các hệ số ước lượng 𝛾𝑗 (j = 1, 2, 3, , q) phải đạt giá trị dương vì phương sai luôn dương
Một số nhược điểm của mô hình ARCH, thứ nhất về mặt kỹ thuật mô hình này chưa đảm bảo được “tính nghiệm”, đó là bậc q của mô hình thường đạt giá trị lớn Thứ hai, mô hình ARCH sẽ kém hiệu quả khi có quá nhiều độ ễ xuất hiện trong mô hình, trdẫn đến việc số bậc tự do trong mô hình bị giảm và điều này làm giảm tính chính xác trong quá trình truyền dẫn thông tin từ quá khứ cho đến hiện tại và làm mất đi một số
Trang 20quan sát quan trọng trong dữ ệu Nó sẽ li có ảnh hưởng rất lớn nếu những quan sát này
có ảnh hưởng trực tiếp đến kết quả ước lượng và dự báo của mô hình Thứ ba, khi mô hình càng có nhiều tham số thì càng dễ bị vi phạm các gi thiả ết ràng buộc của mô hình, như là phương sai luôn dương Thứ tư, mô hình ARCH có nhiều điểm tương đồng với
mô hình trung bình trượt, là hồi quy phương sai nhiễu theo bình phương nhiễu, điều này tác giả của mô hình ARCH cũng chưa giải thích được
1.7.2 Kiể m đ ịnh tính ARCH
Trước khi ước lượng mô hình ARCH (q), chúng ta cần thực hiện kiểm định tính ARCH xem có tồn tại các ảnh hưởng ARCH hay không, để xác định được mô hình nào
sẽ cần được chọn để ước lượng (OLS, ARIMA hay ARCH)
Có hai cách thường được sử dụng để kiểm định tính ARCH bao gồm kiểm định Ljung-Box (thông thường phương pháp này được sử dụng nhiều hơn) và kiểm định Lagrange, hai phương pháp này sử dụng lần lượt là thống kê 𝒳2 và thống kê F Kiểm định tính ARCH được th c hiự ện theo các bước sau:
Bước 1: Xác định phương trình trung bình và lưu lại phần dư ut
Biến giải thích ở đây có thể bao gồm cả biến trễ của biến phụ thuộc và các biến giải thích khác có ảnh hưởng đến biến phụ thuộc Y t
Bước 2: Ư c lượng phương trình hồi quy phụ của phần dư ớ
𝑢2t = 𝛾0 + 𝛾1𝑢2t - 1 + + 𝛾𝑞𝑢2
t - qXác định hệ số xác định của mô hình hồi quy phụ của phần dư, ký hiệu là 𝑅2.Bước 3: Thực hiện kiểm định tính ARCH với giả ết như sau: thi
{𝐻0= 𝛾𝑜= 𝛾1= ⋯ = 𝛾𝑞= 0
𝐻1≠ 𝛾𝑜≠ 𝛾1≠ ⋯ ≠ 𝛾𝑞≠ 0Thống kê này theo phân phối 𝒳2 với bậc tự do là số độ ễ q (tr 𝑢2t là một tổng của
q thành phần bình phương) Nếu giá trị ống kê th 𝒳2 lớn hơn giá trị tra bảng 𝒳2, ta bác
bỏ H và kế0 t luận chuỗi dữ ệu có tính ARCH li
1.7.3 Một số dạng khác của mô hình ARCH
Trong các mô hình biến thể của mô hình ARCH có hai mô hình thường được sử dụng phổ biến hơn gồm mô hình ARCH-M và mô hình T-ARCH Ngoài ra còn một số biến thể mô hình khác như: mô hình AARCH, mô hình APARCH,
Mô hình ARCH-M
Mô hình này được phát triển bở (Engle, R F., Lilien, D M., & Robins, R P., i 1987), mô hình ARCH-M có được bằng cách thay thế các biến ngoại sinh , các biến xu thế bằng phương sai có điều kiện vào phương trình trung bình của mô hình ARCH thuần túy Mô hình này thường đượ ứng dụng trong các bài toán về c tài chính mà ở đó doanh lợi của tài sản kỳ vọng có liên quan đến rủi ro về tài sản kỳ vọng
Trang 21Mô hình T ARCH
-Mô hình này đượ (Zakoian, 1994) giới thiệu vào năm 1990, mô hình T-ARCH c còn được gọi là mô hình ARCH bất đối xứng Mô hình này thường được sử dụng khi sự thay đ i cổ ủa giá cổ phiếu trong các phiên giao dịch là bất đ i xố ứng Trong mô hình này, phương sai có điều kiện được xác định như sau:
𝛿2t = 𝜔 + 𝛼𝜀2t - 1 + 𝛾𝜀2t - 1𝜎t - 1 + 𝛽𝛿2t - 1Với 𝜎t =1 nếu < 0 và = 0 (trường hợp khác) 𝜀t 𝜎t
Trong mô hình T-ARCH, tác động tốt sẽ xảy ra khi < 0 Các tác động này có 𝜀tảnh hưởng khác nhau đến phương sai có điều kiện, là tác động tích cực còn 𝛼 𝛼 + 𝛾 là tác động tiêu cực Nếu 0 thì tác động sẽ là bấ𝛾 ≠ t đ i xố ứng
là mô hình được các nhà nghiên cứu dùng để dự báo phổ biến hơn so với mô hình ARCH
Mô hình GARCH với ý tưởng chính là đưa thêm các biến trễ của phương sai có điều kiện vào phương trình phương sai theo dạng tự hồi quy
Với ht củ phương trình (**) phụ thuộc vào cả giá trị quá khứ của những cú sốa c, điều này được đại diệ bởi các biến trễ của hạng nhiễu bình phương và các giá trị quá n khứ của bản thân h , đạt i diện với các biến ht - i
1.8.2 Một số dạng khác của mô hình GARCH
Các biến thể mô hình GARCH thường được sử dụng gồm mô hình E-GARCH,
mô hình T-GARCH, mô hình GARCH-M, mô hình A-GARCH, trong đó phổ biến là
mô hình GARCH-M và mô hình T-GARCH
Mô hình GARCH-M
Mô hình GARCH-M được đề xuất bởi (Engle, R.F., D.M Lilian and R.P Robins, 1987), mô hình này có ý nghĩa là GARCH ở giá trị trung bình Mô hình này cho phép
Trang 22Mô hình T-GARCH ban đầu được phát triển bở (Zakoian, 1994) và sau đó có i nhiều nghiên cứu hơn nghiên cứu và phát triển nó Mô hình này nhằm xem xét tính chất bất cân xứng giữa các cú sốc mang dấu âm và mang dấu dương Để làm được điều đó thì các nhà nghiên cứu đã đề xuất đưa vào phương trình phương sai một biến giả tương tác giữa hạng nhiễu bình phương và biến giả d Nếu u < 0 thì d đạt giá trị bằng 1 và t t tnếu u > 0 thì d đạt giá trị bằng 0 t t
Một cách tổng quát thì phương trình phương sai của mô hình T-GARCH bậc cao được thể hiện như sau:
mô hình GARCH (1, 1) có thể thay thế cho các mô hình ARCH bậc cao vì sẽ giảm bớt
hệ số cần ước lượng hơn và hạn chế việc mất đi một số bậc tự do Đồng thời mô hình GARCH còn có thể tách biệt đượ ảnh hưởng của cú sốc âm và dương ở c thời kỳ hiện tại tuy nhiên lại không thể giải thích được Nhìn chung, mô hình GARCH tuy vẫn còn tồn tại một số nhược điểm nhưng mô hình GARCH và các biến thể của mô hình GARCH
T-đã tối ưu hơn với mô hình ARIMA và mô hình ARCH bằng cách khắc phục đượso c hiện tượng phương sai sai số thay đổ ủa ARIMA và nhiều bậ ự do của ARCH.i c c t