Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 36 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
36
Dung lượng
7,18 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG BÁO CÁO TĨM TẮT ĐỀ TÀI KHOA HỌC VÀ CƠNG NGHỆ CẤP BỘ oc H D NGHIÊN CỨU KHẢ NĂNG SỬ DỤNG TRÍ TUỆ NHÂN TẠO ĐỂ DỰ BÁO BIẾN ĐỘNG CÁC BIẾN SỐ TÀI CHÍNH VĨ MƠ VIỆT NAM g an aN D Mã số: B2019-DNA-08 Chủ nhiệm đề tài: PGS.TS Nguyễn Ngọc Vũ Đà Nẵng, Tháng 3/2021 D H i a D c o aN a g n DANH SÁCH CÁC THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI TT Đơn vị công tác Họ tên Vai trò PGS.TS Nguyễn Ngọc Vũ Đại học Đà Nẵng Chủ nhiệm đề tài TS Nguyễn Thành Đạt Trường Đại học Kinh tếĐại học Đà Nẵng Thành viên chính, Thư ký khoa học PGS.TS Phan Đinh Hoàng Bách Taylor’s University, Malaysia Thành viên ThS Nguyễn Ngọc Trà Trường Đại học Kinh tếĐại học Đà Nẵng Thành viên TS Hồ Phước Tiến Trường Đại học Bách Khoa-Đại học Đà Nẵng Thành viên Nguyễn Thị Thúy Ngân Đại học Đà Nẵng Thành viên g an aN D oc H D i MỤC LỤC DANH SÁCH CÁC THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI i MỤC LỤC ii DANH MỤC CÁC HÌNH iii DANH MỤC CÁC BẢNG iv THÔNG TIN KẾT QUẢ NGHIÊN CỨU v MỞ ĐẦU 1 Tính cấp thiết đề tài Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu an aN D oc H D Phương pháp nghiên cứu Ý nghĩa khoa học thực tiễn đề tài Bố cục đề tài CHƢƠNG 1: BIẾN ĐỘNG BIẾN SỐ TÀI CHÍNH VĨ MƠ 1.1 Dự báo biến số tài vĩ mô 1.2 Dự báo biến động thị trường chứng khoán 1.3 Tổng quan tình hình nghiên cứu nước 1.4 Tổng quan tình hình nghiên cứu ngồi nước CHƢƠNG 2: KỸ THUẬT DỰ BÁO BIẾN ĐỘNG CỦA DỮ LIỆU CHUỖI THỜI GIAN 2.1 Các kĩ thuật liên quan đến hồi quy 2.1.1 Mơ hình bình phương nhỏ (OLS) 2.1.2 Mơ hình phương sai thay đổi có điều kiện tổng quát (GARCH) 2.1.3 Mơ hình bình phương tối thiểu tổng quát khả thi (FGLS) 2.2 Các kỹ thuật học tự động (machine learning) trí tuệ nhân tạo 2.2.1 PCA (Principal Component Analysis) 2.2.2 SVM (Support Vector Machine) 2.2.3 Cây định (Decision Tree) g 2.2.4 Phương pháp mạng neuron CHƢƠNG 3: CƠ SỞ LÝ THUYẾT TRÍ TUỆ NHÂN TẠO TRONG VIỆC DỰ ĐOÁN BIẾN ĐỘNG BIẾN SỐ TÀI CHÍNH 11 3.1 Dữ liệu tài 11 3.2 Tổng quan toán dự báo 12 3.3 Phương pháp machine learning truyền thống cho toán dự báo 13 3.3 Phương pháp học sâu cho toán dự báo biến động số tài 14 3.3.1 Mơ tả tốn .14 3.3.2 Mơ hình dự đốn 14 3.4 Dữ liệu .15 3.4.1 Dữ liệu VNINDEX .15 3.4.2 Dữ liệu HNX 16 CHƢƠNG 4: KẾT QUẢ DỰ BÁO BIẾN ĐỘNG CHỈ SỐ CHỨNG KHOÁN VIỆT NAM 16 4.1 Các yếu tố tác động đến số chứng khoán Việt Nam 16 4.2 Dự báo biến động số chứng khoán Việt Nam Machine Learning 22 4.3 Dự đoán tỷ suất lợi tức ngày HNX Index sử dụng kỹ thuật machine learning 23 KẾT LUẬN 25 ii DANH MỤC CÁC HÌNH Hình 2.1 Lợi suất hàng ngày số VN-Index (hình trái) số HNX Index (hình phải) giai đoạn 2000-2019 Hình 2.2 Khối trích thuộc tính phân loại mơ hình phân loại hay dự báo Hình 2.3 SVM với toán phân loại hai lớp Hình 2.4 Ví dụ định Hình 2.5 Cấu trúc mạng MLP Hình 2.7 Cấu trúc LSTM 11 Hình 3.1 Chỉ số chứng khốn NASDAQ-100 .12 Hình 3.2 Mơ hình machine learning truyền thống 13 Hình 3.3 Mơ hình dự báo dựa kĩ thuật học sâu 15 Hình 3.7 Xây dựng liệu 16 Hình 4.1 Kết mơ hình LSTM theo kích cỡ phần kiểm tra (test size) .22 Hình 4.2 Kết mơ hình theo số lượng tính tăng 23 g an aN D oc H D Hình 4.3 Kết mơ hình theo độ dài huấn luyện 24 iii DANH MỤC CÁC BẢNG Bảng 4.1 Thống kê mô tả 18 Bảng 4.2 Kết sơ tác động giá dầu tỷ giá hối đoái đến số chứng khoán 18 Bảng 4.3 Kết ước lượng tác động giá dầu tỷ giá hối đoái đến số chứng khoán 19 Bảng 4.4 Kiểm định bền vững tác động giá dầu tỷ giá hối đoái đến số chứng khoán 19 Bảng 4.5 Kết dự báo số chứng khoán mẫu 20 Bảng 4.6 Kết dự báo số chứng khốn ngồi mẫu .21 g an aN D oc H D iv D H i a D c o aN a g n D H i a D c o aN a g n INFORMATION ON RESEARCH RESULTS General information: Project title: Research on the possibility of using artificial intelligence to forecast fluctuations in macro-financial variables in Vietnam Code number: B2019-DNA-08 Coordinator: Associate Professor PhD Nguyen Ngoc Vu Implementing institution: The University of Danang Duration: from 2019 to 2020 D Objective(s): Proposing a theoretical framework using artificial intelligence to forecast fluctuations in macro-financial variables and applying artificial intelligence in forecasting fluctuations of macrofinancial variables of Vietnam The specific objectives are as follows: - Proposing the theoretical background of using artificial intelligence in forecasting fluctuations of macro-financial variables - Using proposed models to forecast fluctuations in macro-finance variables in Vietnam - Compare the proposed model with some other econometric models - Contributing to the existing literature on forecasting fluctuations of macro-financial variables H in Vietnam - Providing new findings on forecasting fluctuations of macro-financial variables in Vietnam and implications as well as recommendations an aN D oc Creativeness and innovativeness: This project examines and proposes models for forecasting time-series data, specifically financial indicators These models range from traditional regression methods to machine learning methods For traditional regression techniques, the authors considered the GARCH model and the FGLS model With maching learning approach, models such as LSTM, SVM and decision tree are surveyed and compared with some traditional models g Research results: The research results show that models such as LSTM, SVM and decision trees are able to predict effectively compared to traditional models such as the average model and the logistic regression model The topic also shows that, to design a good predictive model, we need to choose the appropriate network structure and training data Products: 02 publications on Scopus indexed journals: Nguyen Ngoc Tra, Nguyen Thanh Dat, Nguyen Ngoc Vu (2020) The impacts of oil price and exchange rate on Vietnamese stock market Journal of Asian Finance, Economics and Business, vol 7, No (2020), 143-150 Nguyen Ngoc Vu, Nguyen Thanh Dat (2020) Can crude oil price be a predictor of stock index return? Evidence from Vietnamese stock market Asian Economic and Financial Review, vol 10, No 1, 13-21 02 publications on journals listed by the State Council for Professorship: Nguyen Ngoc Tra, Ho Phuoc Tien, Nguyen Thanh Dat Nguyen Ngoc Vu (2019) VN-index trend prediction using Long-short term memory neural networks Journal of Science and Technology: Issue on information and communications technology, vol 17, no 12.2, 2019 vii Nguyen Ngoc Tra, Ho Phuoc Tien, Nguyen Thanh Dat, Mac Nhu Minh (2020) Stock return prediction using machine learning-based techniques Journal of Science and Technology: Issue on information and communications technology 01 master student, 01 scientific report, 01 proposal for application of artificial intelligence to forecast fluctuations of Vietnam's macro-financial variables Transfer alternatives, application institutions, impacts and benefits of research results: Transfer alternatives: Summarized report and proposal for application of artificial intelligence to forecast fluctuations of Vietnam's macro-financial variables are transferred to the University of Danang and enterprises in Da Nang Impacts and benefits of research results - For education and training: Contribute to the development of artificial intelligence in undergraduate and graduate training - For relevant research fields: Expanding applications of artificial intelligence in financial technology - For socio-economic development: The macro-financial variable forecasting has provided more reliable results As a result, the actions to intervene in the economy from policy implications (based on the forecasting results) will be more accurate and timelier g an aN D oc H D viii toán quan trọng liên quan đến liệu chuỗi thời gian dự báo chuỗi thời gian Dự báo dự báo giá trị xác đối tượng mà ta quan tâm thời điểm tương lai, xu hướng biến thiên đối tượng Rất nhiều mơ hình phương pháp dự báo đề xuất lĩnh vực toán học, xử lý tín hiệu, thống kê… Những phương pháp Prony’s method xuất từ hai trăm năm trước (1795) Dữ liệu tài dạng liệu chuỗi thời gian Cùng với phát triển lĩnh vực kinh tế, tài chính, loại liệu trở thành đối tượng nghiên cứu quan trọng Bằng cách xem xét liệu tài theo thời gian, ta tìm mối quan hệ phụ thuộc số kinh tế, góp phần giải thích nhiều tượng lĩnh vực Bên cạnh đó, ta dự báo số kinh tế tương lai, xu hướng biến động Đây tốn có ý nghĩa vô quan trọng hoạt động tổ chức kinh tế quan hoạch định sách Các ngân hàng lớn giới có đội ngũ nghiên cứu dự báo, từ làm sở cho định ngân hàng Hình 3.1 minh họa ví dụ liệu tài chính, cụ thể số chứng khốn NASDAQ-100 khoảng thời gian từ 1/1/2003 đến 31/12/2014 Chú ý đây, số NASDAQ-100 thu thập theo ngày dùng để vẽ đường cong hình 3.1 Tuy nhiên, để thuận tiện cho việc quan sát, ta hiển thị mốc thời gian theo năm oc H D Do liệu tài dạng liệu chuỗi thời gian nên ta sử dụng phương pháp phân tích, xử lý, dự báo chuỗi thời gian cho liệu tài Gần đây, với số lượng liệu tài thu thập ngày lớn, khả tính tốn nâng cao, và, tất nhiên, vai trị hoạt động kinh tế, việc dự báo số tài ngày trở nên quan trọng thu hút quan tâm nhà nghiên cứu, không lĩnh vực kinh tế, mà lĩnh vực liên quan thống kê trí tuệ nhân tạo .NDX(PI) D 5000 aN 4000 3000 an 2000 1000 g Hình 3.1 Chỉ số chứng khốn NASDAQ-100 3.2 Tổng quan tốn dự báo Hầu hết mơ hình dự báo biến động tài trước dựa phương pháp hồi quy truyền thống, giá trị dự báo xem hàm phụ thuộc vào đại lượng khác có dạng: với giá trị cần dự báo biến ảnh hưởng đến giá trị Bằng cách tìm (một xấp xỉ) hàm này, với đạc) ta dự đốn giá trị mà ta quan tâm Một cách tổng quát, hàm phụ thuộc vào giá trị khứ 12 biết (từ kết thu thập, đo khứ giá trị Kết dự báo có cách kết hợp nhiều mơ hình hồi quy đơn giản khác Rõ ràng chất lượng mơ hình dự báo phụ thuộc vào xác việc xấp xỉ hàm Thực tế cho thấy phần lớn mơ hình cho kết tốt dự đoán mẫu, gặp nhiều khó khăn dự đốn ngồi mẫu Ngun nhân đến từ mơ hình hồi quy chưa thật phù hợp với liệu mà ta quan tâm Bên cạnh đó, tương tác biến vấn đề quan trọng, mà mơ hình hồi quy chưa thể tốt Đó lí mà nhiều mơ hình phức tạp khơng thực tốt mơ hình đơn giản, mơ hình thực dự đốn dựa giá trị trung bình giá trị q khứ Một số mơ hình dự báo chuỗi thời gian truyền thống áp dụng cho liệu tài mơ hình AR, ARMA, hay lọc Kalman Thực tế, việc lựa chọn hàm thực khó khăn, nói chung, ta thường khơng nắm rõ ràng tác động yếu tố khác đến giá trị cần dự báo Dưới đây, ta quan tâm đến việc tìm hàm theo cách tiếp cận khác, cụ thể cách tiếp cận dựa machine learning, bao gồm hai nhóm: phương pháp machine learning truyền thống phương pháp mạng neuron học sâu Với phương pháp truyền thống, mơ hình thường đơn giản, số lượng trọng số cần tìm khơng q lớn; nhiên, đơi lúc hữu ích, đặc biệt liệu khơng có nhiều Trong đó, với phương pháp mạng nơ-ron, mối liên hệ đầu vào đầu thể thông qua tham số (trọng số) lớp mạng; trọng số tự động học thơng qua ví dụ biết Hàm biểu diễn mạng neuron hàm phức tạp có tính phi tuyến cao, từ kì vọng “bắt” mối quan hệ giá trị cần dự báo yếu tố đầu vào D 3.3 Phƣơng pháp machine learning truyền thống cho toán dự báo g an aN D oc H Một cách tổng quát, phương pháp machine learning truyền thống tóm tắt hình 3.2 Đầu tiên, đầu vào qua bước tiền xử lý nhằm trích thuộc tính quan trọng liệu Thông thường, bước làm giảm số chiều đầu vào, nhằm giúp khối xử lý nhẹ Kỹ thuật PCA mô tả chương phương pháp phổ biến để thực cơng việc Hình 3.2 Mơ hình machine learning truyền thống Sau đó, kết khối tiền xử lý tiếp tục xử lý để phục vụ mục tiêu dự báo thông qua phân loại hay hồi quy Có nhiều phương pháp lựa chọn cho khối phân loại hay hồi quy Một số phương pháp áp dụng cho hai Ta kể giải thuật phổ biến Logistic Regression, SVM, Decision Trees, KNN (K Nearest Neighbors)… Ở đây, ta sử dụng PCA kết hợp với phương pháp Logistic Regression, SVM Decision Tree để thực toán dự báo Riêng với phương pháp Decision Tree, ta sử dụng hai phiên phổ biến Random Forest Extra Trees Classifier Những phương pháp mô tả chương Cụ thể, phương pháp PCA (hay xác Kernel PCA) dùng để giảm số chiều đầu vào từ 30 xuống k Đồng thời, để đánh giá ảnh hưởng số thuộc tính lên kết dự báo, ta cho k thay đổi từ đến 10 Với trường hợp k, ta huấn luyện đánh giá mơ hình Tương tự, ảnh hưởng khối lượng liệu huấn luyện xem xét Ví dụ, số ngày liệu huấn luyện 20, 30, 40,… Cuối cùng, ta so sánh phương pháp phân loại đề cập Kết thực thử nghiệm trình bày chi tiết chương 13 3.3 Phƣơng pháp học sâu cho toán dự báo biến động số tài 3.3.1 Mơ tả tốn Trong phần này, ta mơ tả chi tiết liệu đầu vào mục tiêu toán dự báo Cụ thể, ta quan tâm đến số chứng khốn Việt Nam (VN-index): giả sử ta có chuỗi giá trị VN-index từ khứ đến dùng thông tin để dự đoán xu hướng tăng/giảm VN-index thời điểm tương lai Ta biểu diễn chuỗi liệu chiều dài p biết đến thời điểm t } Mơ hình dự đốn xu hướng tăng giảm thời điểm sau: { s tương lai (s > t) biểu diễn sau: với thể xu hướng tăng giảm số VN-index Do dự đoán hai xu hướng: tăng giảm, nên xem toán phân loại nhị phân (chỉ gồm hai lớp) Do phương pháp dùng học sâu với mạng nơ-ron, ta cần chuẩn bị liệu cho việc huấn luyện đánh giá (kiểm tra) mô hình Cụ thể, liệu huấn luyện gồm N phần tử có dạng: { } Chú ý, phần tử tập huấn luyện D } nhãn tương ứng Ngoài ra, tập huấn luyện, ta dãy thời gian { biết , nên biết Tuy nhiên, với phần tử (khi kiểm tra) chưa biết, dự đốn thơng qua mơ hình huấn luyện Đó mục tiêu tốn xét 3.3.2 Mơ hình dự đốn aN D oc H Thời điểm dự báo tương lai, tức s, tùy thuộc vào toán cụ thể Ở đây, ta chọn với lí sau Ở thị trường chứng khoán Việt Nam, nhà đầu tư mua cổ phiếu hơm nhà đầu tư phải đợi đến ngày thứ ba (kể từ hôm nay) để bán cổ phiếu Do đó, dự đốn xu hướng tăng/giảm số VN-index hơm sau ba ngày có ý nghĩa quan trọng, đặc biệt với nhà đầu tư có xu hướng đầu tư ngắn hạn g an Mục trình bày mơ hình đề xuất để dự báo xu hướng tăng/giảm VN-index tương lai Mơ hình khai thác kĩ thuật học sâu gần đây: cụ thể, mơ hình sử dụng LSTM kết hợp với lớp FC (fully-connected) Hình 3.3 mơ tả thành phần mơ hình đề xuất Trước hết, ta có số nhận xét mơ hình sau Đây mơ hình xây dựng theo phương pháp học sâu hay mạng nơ-ron Do đó, liệu đầu vào trực tiếp xử lý mơ hình dự báo Điều khác với phương pháp truyền thống, mà liệu đầu vào thường tiền xử lý thơng qua việc trích thuộc tính giảm số chiều, trước đưa vào phân loại Phương pháp PCA trình bày chương phục vụ cho bước trích thuộc tính phương pháp truyền thống Như vậy, có phải khơng có bước trích thuộc tính mơ hình học sâu? Thực ra, khơng hẳn Q trình trích thuộc tính diễn mơ hình học sâu trên, dạng không tường minh, tức không tách biệt rõ ràng phương pháp truyền thống Trích thuộc tính thực thơng qua việc biểu diễn liệu LSTM Bên cạnh đó, mơ hình học sâu đây, LSTM giữ vai trị khai thác thơng tin mặt thời gian liệu đầu vào Cụ thể, LSTM tìm mối liên hệ thành phần thời điểm khác dãy liệu LSTM biết đến với khả lưu giữ thông tin qua nhiều bước thời gian Nhìn chung, khối LSTM cho phép khai thác thông tin mặt thời gian, để sau lớp FC kết hợp thơng tin để thực dự đốn 14 Hình 3.3 Mơ hình dự báo dựa kĩ thuật học sâu Hình 3.3 thể lớp LSTM lớp FC Tuy nhiên, ta dễ dàng mở rộng mơ hình cho nhiều lớp Nói chung, mạng sâu (nhiều lớp hơn) có khả học tốt hơn; nhiên trình huấn luyện lâu yêu cầu cấu hình phần cứng mạnh Ngoài ra, mạng với nhiều lớp yêu cầu lượng liệu lớn đáng kể Ở đây, để phù hợp với liệu có, ta dùng mơ hình gồm LSTM lớp FC Cụ thể LSTM1 có 40 nút đầu ra, tương tự cho LSTM2 LSTM3 Lớp FC gồm nút Các siêu tham số (hyperparameter) chọn thông qua thực nghiệm Ta so sánh mơ hình với kiến trúc khác, sử dụng nhiều LSTM FC Chi tiết kiến trúc khác mạng nơ-ron dựa kiến trúc hình 3.3 trình bày chương 4, với kết tương ứng D 3.4 Dữ liệu 3.4.1 Dữ liệu VNINDEX H oc Dữ liệu chọn giá cuối ngày khối lượng giao dịch VNINDEX từ 2000 đến 2019 Dữ liệu lấy miễn phí từ nhiều nguồn, có https://www.cophieu68.vn/ g an aN D Từ đó, ta tính biến đầu ( ) phản ánh xu hướng thị trường từ thời điểm t đến thời điểm t+3 Như mô tả mục 3.1, nhận hai giá trị -1, thể xu hướng tăng giảm VNINDEX Với giá trị , ta đồng thời tạo dãy giá trị khứ đầu vào mơ hình Cụ thể, dãy thể giá khối lượng giao dịch từ thời điểm đến thời điểm Từ đó, ví dụ huấn luyện có dạng }, thể giá khối lượng giao dịch thời điểm t Ta sau { xây dựng tập liệu gồm N ví dụ (xem thêm minh họa hình 3.7) Sau xếp liệu thành ví dụ trên, ta chia liệu thành hai tập liệu gồm: tập liệu huấn luyện tập liệu kiểm tra Ta định nghĩa tham số “test size” (sẽ dùng cho mô chương 4) tỉ lệ liệu dùng cho việc kiểm tra Ví dụ, test size = 1% có nghĩa 99% liệu dùng cho huấn luyện 1% lại dùng cho kiểm tra mơ hình Để đánh giá tác động tham số “test size” đến chất lượng dự đốn mơ hình, ta thay đổi giá trị test size Tất nhiên, với lần thay đổi test size, mơ hình cần huấn luyện lại sau đánh giá lại Trong chương 4, ta thực điều với test size thay đổi từ 1% đến 25% Ngồi ra, với tốn dự báo yếu tố thời gian có vai trị quan trọng Do đó, ta đặt thêm ràng buộc việc phân chia tập liệu huấn luyện tập liệu kiểm tra Cụ thể, tập liệu kiểm tra phải nằm sau tập liệu huấn luyện mặt thời gian Điều phù hợp với thực tế, ta chọn số ví dụ huấn luyện nằm sau ví dụ kiểm tra điều tương đương với việc người đầu tư biết liệu tương lai 15 Hình 3.7 Xây dựng liệu 3.4.2 Dữ liệu HNX Dữ liệu dùng để để dự đoán intraday return, tức việc dự đoán thực thị trường chứng khốn cịn mở Với liệu HNX, ta sử dụng 30 số cho đầu vào Các số tính dựa liệu từ khứ đến thời điểm oc H D Trong chương 4, ta chia liệu thành tập con, tập bao gồm phần liệu huấn luyện liệu kiểm tra Chiều dài liệu huấn luyện xem xét nhằm đánh giá ảnh hưởng đến chất lượng dự đoán CHƢƠNG 4: KẾT QUẢ DỰ BÁO BIẾN ĐỘNG CHỈ SỐ CHỨNG KHOÁN D VIỆT NAM aN 4.1 Các yếu tố tác động đến số chứng khoán Việt Nam g an Như trình bày chương 1, số thị trường chứng khốn ln mối quan tâm lớn nhà hoạch định sách nhà đầu tư toàn giới Ngoài ra, thực tế, mối liên hệ số số giá dầu tỷ giá hối đoái coi quan trọng vai trò quan trọng chúng phát triển kinh tế Do đó, hiểu mối quan hệ biến số thị trường chứng khoán hỗ trợ nhà đầu tư đưa định đầu tư giúp nhà hoạch định sách thiết kế sách nhằm trì ổn định thị trường Vì vậy, mục tiêu chương xem xét ảnh hưởng giá dầu thơ tỷ giá hối đối đến số chứng khoán Việt Nam, cụ thể số VN Index số HNX Việc nghiên cứu tác động dầu thơ tỷ giá hối đối đến số chứng khoán Việt Nam dựa hai nhánh nghiên cứu Thứ mối quan hệ tỷ giá hối đoái thị trường chứng khoán thứ hai mối quan hệ giá dầu thị trường chứng khoán Tác động tỷ giá hối đoái đến thị trường chứng khoán chủ đề quan tâm nghiên cứu trước Tuy nhiên, kết đa dạng từ nghiên cứu cho thấy khơng có đồng thuận tác động tỷ giá hối đoái đến thị trường chứng khoán Nghiên cứu ban đầu Aggarwal (1981), Giovannini Jorion (1987) cho thấy mối quan hệ tiêu cực tỷ giá hối đoái lợi tức chứng khoán Mỹ Ajayi Mougoue (1996) cho thấy sụt giá tiền tệ có tác động tiêu cực ngắn hạn dài hạn thị trường chứng khốn Tương tự, Kim (2003) tìm thấy mối quan hệ tiêu cực lợi suất số S&P500 tỷ giá hối đối đồng la Chiang cộng (2000) phát tỷ giá hối đối có liên quan tiêu cực đến số thị trường chứng khoán Châu Á cách sử dụng mơ hình GARCH hai biến Mơ hình tương tự tìm thấy Ấn Độ Agrawal (2010) Nigeria Olugbenga (2012) Ngoài ra, Lee Zhao (2014) tìm thấy mối 16 g an aN D oc H D quan hệ nhân tiêu cực dài hạn ngắn hạn từ tỷ giá hối đoái đến số thị trường chứng khoán Trung Quốc Ngược lại, có nghiên cứu mối quan hệ chiều tỷ giá hối đoái lợi tức cổ phiếu Ibrahim Aziz (2003) phát mối quan hệ tích cực giá cổ phiếu Malaysia tỷ giá hối đoái Malaysia giai đoạn 1977-1998 Kurihara (2006) tìm thấy mối quan hệ tích cực tỷ giá hối đối lợi tức cổ phiếu xem xét mối quan hệ chúng trong giai đoạn áp dụng sách nới lỏng định lượng 2001-2006 Nhật Bản Narayan Narayan (2010) điều tra tác động giá dầu tỷ giá hối đoái đến giá chứng khoán Việt Nam Họ phát tỷ giá hối đoái có tác động tích cực đáng kể đến giá cổ phiếu dài hạn Lee Brahmasrene (2019) nhận thấy tỷ giá hối đối (Won/USD) có liên quan tích cực đến giá chứng khốn Hàn Quốc Ngồi ra, số nghiên cứu khác lại khơng tìm thấy mối quan hệ tỷ giá hối đoái lợi tức cổ phiếu Nieh Lee (2001) khơng tìm thấy mối quan hệ lâu dài tỷ giá hối đoái chứng khoán nước G7 Smiech Papiez (2013) nghiên cứu mối quan hệ nhân giá nhiên liệu hóa thạch, tỷ giá hối đối thị trường chứng khốn khơng tìm thấy mối quan hệ nhân có ý nghĩa thống kê tỷ giá hối đoái lợi tức cổ phiếu Tuy nhiên, Wallid cộng (2011), sử dụng mơ hình EGARCH chuyển mạch Markov, cho mối quan hệ hai biến phụ thuộc vào chế điều hành tỷ giá thay đổi giai đoạn khác Một nhánh nghiên cứu khác tìm hiểu truyền biến động tỷ giá hối đoái thị trường chứng khoán Hầu hết nghiên cứu xác nhận tương tác biến động hai thị trường Yang Doong (2004) phân tích truyền biến động thị trường chứng khốn tỷ giá hối đoái cho G7 Họ sử dụng mơ hình EGARCH nhận thấy biến động từ thị trường chứng khoán sang tỷ giá hối đoái truyền tải ngược lại mờ nhạt Aloui (2007) đưa kết luận tương tự thị trường Mỹ EU Bằng cách sử dụng mơ hình MGARCH, Zhao (2010) tìm thấy lan tỏa biến động hai chiều tỷ giá hối đoái thị trường chứng khoán Trung Quốc Phan cộng (2015) thấy biến động giá tỷ giá hối đối sử dụng để dự đoán biến động thị trường chứng khoán ngược lại Bên cạnh tỷ giá hối đoái, tác động giá dầu lên thị trường chứng khoán nghiên cứu rộng rãi Basher Sadorsky (2006), Narayan Narayan (2010), Aloui cộng (2013), Echchabi Azouzi (2017), Youssef Mokni (2019) Basher Sadorsky (2006) điều tra 21 thị trường nhận thấy mối quan hệ dầu chứng khoán tích cực Nghiên cứu Aloui cộng (2013) phát mối tương quan thuận dầu kho dự trữ cho sáu quốc gia Trung Đông Âu Echchabi Azouzi (2017) nhận thấy biến động giá dầu ảnh hưởng đáng kể đến giá thị trường chứng khoán Oman biến động thị trường chứng khốn khơng ảnh hưởng đến giá dầu Gần hơn, Youssef Mokni (2019) nghiên cứu tác động cú sốc dầu thị trường chứng khoán nước xuất nhập dầu cách sử dụng DCC-FIGARCH Họ nhận thấy phản ứng thị trường chứng khoán cú sốc giá dầu thay đổi theo thời gian tích cực nước nhập xuất dầu Tuy nhiên, tác động cú sốc dầu cao nước xuất dầu Trong trường hợp Việt Nam, Narayan Narayan (2010) nhận thấy dầu mỏ, tỷ giá hối đối thị trường chứng khốn có mối liên hệ chặt chẽ với Chính vậy, chương tác giả xem xét tác động giá dầu tỷ giá hối đoái đến hai số chứng khoán Việt Nam VN-Index HNX Việc tìm mối quan hệ biến số thị trường chứng khoán giúp đề xuất mơ hình dự đốn xác Để nghiên cứu tác động giá dầu tỉ giá hối đoái đến số chứng khoán, tác giả sử dụng hai mơ hình GARCH (1, 1) sau: (1) , , ; (2) , , đó, (1) ước tính lợi suất số chứng khốn (2) ước tính biến động lợi suất số chứng khoán t thời gian lợi suất hai số chứng khoán VN-Index HNX, RVNI 17 and RHNX bao gồm lợi suất giá dầu BRENT (RBRENT) lợi suất lại tỷ giá hối đoái USD sang VND (RUS) Dữ liệu nghiên cứu tải xuống từ sở liệu Investing.com Dữ liệu mẫu tác giả tần suất hàng ngày ngày tháng năm 2000 kết thúc vào ngày 25 tháng 10 năm 2019 Cuối cùng, tác giả kết thúc với 7.025 quan sát, ngoại trừ số HNX trở lại, có 5.213 quan sát số mắt vào ngày 18 tháng năm 2005 Bảng 4.1 báo cáo số thống kê mô tả cho số VN-Index, giá dầu Brent giao sau, tỷ giá USD sang Đồng Việt Nam, số HNX, giá dầu WTI tương lai giá Euro sang Đồng Việt Nam Số lượng quan sát, trung bình, trung vị, tối đa, tối thiểu, độ lệch chuẩn (SD), kiểm định Dickey-Fuller (ADF) tăng cường, hệ số AR (1) tự tương quan giá trị p kiểm định LM cho phương sai thay đổi có điều kiện tự hồi quy (ARCH) báo cáo Trung bình 0.0013 0.0009 0.0001 0.0012 0.0010 0.0001 D RVNI RBRENT RUS RHNX RWTI REUR Số quan sát 7025 7025 7025 5213 7025 7025 Bảng 4.1 Thống kê mô tả Trung Max Min SD vị 0.0010 0.0688 -0.0737 0.0151 0.0012 0.1461 -0.1344 0.0212 0.0000 0.0672 -0.0427 0.0022 0.0005 0.1022 -0.1207 0.0188 0.0014 0.1783 -0.1525 0.0230 0.0002 0.0600 -0.0382 0.0064 ADF -45.995 -66.512 -66.140 -46.245 -65.952 -63.050 AR(1) ARCH(1) 0.5370 0.2270 0.2323 0.4180 0.2350 0.2773 0 0 0 aN D oc H Bảng 4.2 trình bày kết hồi quy ảnh hưởng giá dầu / tỷ giá hối đoái số chứng khoán Việt Nam Mơ hình hồi quy có dạng sau: Thống kê kiểm tra LM cho hiệu ứng ARCH (1) phần dư cho hồi quy báo cáo hàng cuối Tuy nhiên, kết thử nghiệm cho thấy hai mơ hình biểu phương sai thay đổi, giá trị thử nghiệm có ý nghĩa mức 1% Do đó, hồi quy tiêu chuẩn không nên áp dụng trường hợp Thay vào đó, mơ hình GARCH nên sử dụng để phân tích g an Bảng 4.2 Kết sơ tác động giá dầu tỷ giá hối đoái đến số chứng khoán I II Biến 0.5336*** 0.4133*** 0.0448*** 0.0777*** -0.0202 -0.0672 Constant 0.0006*** 0.0007*** ARCH(1) 344.682*** 506.075*** *, ** *** biểu thị mức ý nghĩa mức 10%, 5% 1%, tương ứng Do diện phương sai thay đổi, tác giả sử dụng mơ hình GARCH (1, 1) để phân tích ảnh hưởng tỷ suất sinh lợi giá dầu tỷ giá hối đoái tỷ suất sinh lợi biến động số chứng khoán Việt Nam Kết ước lượng cho phương trình trung bình phương sai báo cáo Bảng Tương tự kết sơ bộ, tác giả thấy lợi nhuận giá dầu khứ dự báo tốt lợi nhuận biến động số chứng khoán Kết Bảng A Bảng cho thấy tác động tích cực đáng kể mức tăng giá dầu BRENT lịch sử hai số chứng khoán VN Index HNX index Ảnh hưởng giá dầu có ý nghĩa thống kê mức 1% VN Index HNX index Cụ thể, giá dầu BRENT tăng điểm phần trăm với tỷ suất sinh lợi VN index tăng 2,24 điểm phần trăm số HNX tăng 3,97 điểm phần trăm Những kết phù hợp với nghiên cứu trước Basher Sadorsky (2006), Narayan cộng (2010), Youssef Mokni (2019) Xét mối quan hệ tỷ suất sinh lợi giá dầu biến động số chứng khoán, nhìn vào bảng B Bảng 4, thấy biến động số VN Index số 18 HNX bị tác động tiêu cực trở lại giá dầu Nói cách khác, lợi nhuận giá dầu tăng làm giảm biến động số thị trường chứng khoán Hơn nữa, tác động tỷ suất sinh lợi biến động giá dầu VN-Index mạnh với HNX-index Tóm lại, giá dầu tăng trở lại có tác động tích cực đến số thị trường chứng khoán Việt Nam, lợi suất biến động Ngược lại, tỷ suất sinh lời tỷ giá hối đối có mối tương quan nghịch đáng kể với tỷ suất lợi nhuận số HNX mức tin cậy 1% Tỷ giá hối đoái USD / VND tăng điểm phần trăm khiến lợi nhuận số HNX giảm 0,1197 điểm phần trăm Hệ số tỷ giá hối đối có ý nghĩa thống kê 1% mơ hình (I) 5% mơ hình (II) Kết tương tự tìm thấy Nieh Lee (2001), Gay (2008) Zhao (2010) Vì vậy, trái ngược với tác động giá dầu, tỷ giá hối đối cho thấy có tác động tiêu cực đến lợi suất số chứng khoán biến động chúng g an aN D oc H D Bảng 4.3 Kết ƣớc lƣợng tác động giá dầu tỷ giá hối đoái đến số chứng khoán I II Biến phụ thuộc Bảng A: Phương trình trung bình 0.4312*** 0.2901*** 0.0224*** 0.0397*** -0.0590 -0.1197*** 0.0003*** 0.0006*** Constant (0.0001) (0.0001) Bảng B: Phương trình phương sai -15.3380*** -20.3508*** 50.0413*** 36.6862** -12.6373*** -12.4667*** C *, ** *** biểu thị mức ý nghĩa mức 10%, 5% 1%, tương ứng Lưu ý tất thuật ngữ ARCH GARCH không báo cáo chúng có ý nghĩa mức 1% tất mơ hình hồi quy Các tác giả áp dụng số thiết lập khác để xem liệu kết hồi quy tác giả có cịn áp dụng hay khơng Cụ thể, tác giả sử dụng ba kiểm định bền vững, là: (1) sử dụng giá dầu (WTI) tỷ giá hối đối (EUR/VND); (2) sử dụng mơ hình EGARCH (1, 1); (3) mẫu thời gian khác Các kết báo cáo bảng 4.4 Bảng 4.4 Kiểm định bền vững tác động giá dầu tỷ giá hối đoái đến số chứng khoán Giá dầu tỷ giá hối đoái khác Biến phụ thuộc Bảng A: Phương trình trung bình 0.4336*** 0.2926*** Lợi suất giá dầu 0.0170*** 0.0337*** or Lợi suất tỷ giá 0.0091 0.0162 or C 0.0003*** 0.0006*** Bảng B: Phương trình phương sai -8.4576* -7.4872 -31.8536* 88.6229*** C -12.6459*** -12.6764*** EGARCH (1,1) 0.4432*** Giai đoạn sau khủng hoảng 2007-2009 0.3121*** 0.0190*** 0.2984*** 0.0484*** 0.0500*** 0.2282*** 0.0387*** -0.0700 -0.0561 -0.1411** -0.1053** 0.0003*** 0.0004*** 0.0005*** 0.0005*** -1.2297*** 5.7164 -0.4373*** -1.3525*** 5.9445 -0.3320*** -20.4050*** 39.9110*** -12.0757*** -14.1672** 61.8700*** -12.6690*** *, ** *** biểu thị mức ý nghĩa mức 10%, 5% 1%, tương ứng Trong kết luận tác động giá dầu quán qua ba lần kiểm định bền vững ảnh hưởng tỷ giá đến số thị trường chứng khoán Việt Nam không ổn định 19 D Từ kết phân tích trên, tác giả muốn tìm hiểu liệu việc bổ sung biến số khác vào mô hình dự đốn có làm cho kết dự đốn tốt so với việc sử dụng số chứng khốn để dự đốn cho Cụ thể, tác giả nhằm mục đích kiểm tra xem liệu giá dầu thơ có giúp cải thiện khả dự đoán lợi nhuận số chứng khoán Việt Nam Dự đốn biến số tài khơng phải chủ đề nghiên cứu mới, điều nhiều nhà nghiên cứu hoạch định sách quan tâm Nhiều nghiên cứu trước tập trung vào dự đoán lợi nhuận cổ phiếu thị trường chứng khốn Dự đốn tài biến số nghiên cứu chủ đề, điều nhiều nhà nghiên cứu quan tâm hoạch định sách Rất nhiều nghiên cứu trước tập trung vào dự đoán lợi nhuận cổ phiếu chứng khốn trường nói chung Tuy nhiên, nhiều nghiên cứu cho thấy mơ hình cung cấp dự đoán tốt mẫu, chúng khơng đáng tin cậy sử dụng để dự đốn ngồi mẫu (xem Bossaerts Hillion, 1999; Goyal Welch, 2003; Butler cộng sự, 2005; Ang Bekaert, 2007) Welch Goyal (2008)) nhiều mơ hình dự đốn tạo kết dự đốn chí cịn khơng xác mơ hình trung bình lịch sử Một lý cho kết dự đốn khơng đáng tin cậy ngồi mẫu mơ hình khơng tính đến tồn vấn đề tính bền vững, phương sai thay đổi nội sinh (Stambaugh, 1999); (Westerlund Narayan, 2015) Theo đó, tác giả tập trung vào khả dự đốn ngồi mẫu cách áp dụng cơng cụ ước lượng bình phương nhỏ tổng quát khả thi (FGLS), biết đến nhiều để điều chỉnh tính bền vững, phương sai thay đổi tính nội sinh Cụ thể, tác giả sử dụng mơ hình hồi quy bình phương nhỏ tổng qt khả thi với giá dầu sử dụng làm yếu tố dự đoán sau: , g an aN D oc H với hệ số góc điều chỉnh Trong đó, lợi suất ngày giá dầu BRENT, , giá dầu WTI, Dữ lieu sử dụng kéo dài từ ngày tháng năm 2006 đến ngày 31 tháng 12 năm 2017 Trong đó, mẫu nghiên cứu chia ba giai đoạn mẫu khoảng thời gian mẫu 25%, 50% 75% làm liệu mẫu sử dụng để dự đoán mẫu Bảng 4.5 báo cáo kết hồi quy dự báo mẫu Lợi suất giá dầu thô, , giá dầu WTI, , thể tốt vai trị yếu tố dự đốn lợi suất số chứng khoán Đây chứng khả dự đoán đáng kể hầu hết giai đoạn mẫu, ngoại trừ ba giai đoạn Bảng B, tháng năm 2006 - tháng 12 năm 2008 Tóm lại, hiệu suất dự báo lợi suất số chứng khốn khác hai cơng cụ dự báo dầu thô Chỉ số dầu thô BRENT mạnh chút so với giá dầu thô WTI việc dự đoán lợi nhuận số chứng khoán Việt Nam, bảy số tám kết hồi quy có ý nghĩa thống kê so với sáu tám giá dầu WTI Bảng 4.5 Kết dự báo số chứng khoán mẫu WTI BRENT Chỉ số chứng khoán Hệ số Giá trị p Hệ số Giá trị p Bảng A: Toàn mẫu VN-index 0.060*** 0.000 0.067*** 0.000 HNX-index 0.047*** 0.000 0.063*** 0.000 Bảng B: 01/2006-12/2008 VN-index 0.015 0.340 0.017 0.337 HNX-index 0.022 0.173 0.037** 0.040 Bảng C: 01/2006-12/2011 VN-index 0.048*** 0.000 0.057*** 0.000 HNX-index 0.034*** 0.001 0.043*** 0.000 Bảng D: 01/2006-12/2014 VN-index 0.052*** 0.000 0.063*** 0.000 HNX-index 0.035*** 0.001 0.049*** 0.000 *, ** *** biểu thị ý nghĩa mức 10%, 5% 1%, tương ứng 20 Như Welch Goyal (2008) lập luận nhiều mơ hình dự báo lợi nhuận cổ phiếu hoạt động tốt mơ hình trung bình lịch sử đơn giản, đó, điều quan trọng phải kiểm tra độ xác việc dự đoán lợi suất số chứng khoán giai đoạn mẫu Trong phần này, tác giả báo cáo kết dự đốn ngồi mẫu sử dụng mơ hình hồi quy với bình phương nhỏ tổng qt khả thi so với mơ hình trung bình lịch sử Cụ thể, tác giả so sánh sai số bình phương trung bình hai mơ hình dự báo: mơ hình dự báo dựa giá dầu thơ mơ hình sử dụng giá trị trung bình lịch sử làm giá trị dự đoán Các tác giả sử dụng 25%, 50% 75% mẫu, tương ứng với tháng năm 2006 - tháng 12 năm 2008, tháng năm 2006 - tháng 12 năm 2011 tháng năm 2006 - tháng 12 năm 2014, làm giai đoạn mẫu để tạo dự báo lợi suất số chứng khoán Việt Nam tương ứng cho 75%, 50% 25% mẫu lại Theo đề xuất Narayan cộng (2015) độ tin cậy mơ hình dự đốn tác giả đánh giá cách sử dụng R bình phương mẫu (OOR2) Một cách chi tiết, OOR2 kiểm tra khác biệt sai số bình phương trung bình từ mơ hình dự báo dụng giá dầu mơ hình trung bình lịch sử Ngồi ra, tác giả sử dụng sai số dự báo bình phương trung bình (MSFE) - thống kê điều chỉnh, phát triển Clark West (2007) để kiểm tra xem liệu bình phương R ngồi mẫu có khác hay không, tức kiểm tra giả thuyết không OOR2 = so với giả thuyết thay OOR2 ≠ Mơ hình dự đốn kết luận vượt trội so với mơ hình điểm chuẩn việc dự báo lợi nhuận số chứng khoán hệ số OOR2 dương g an aN D oc H D Bảng 4.6 báo cáo kết dự báo ngồi mẫu tác giả Nhìn chung, mơ hình tác giả cung cấp kết dự báo tốt so với mơ hình trung bình lịch sử hầu hết giai đoạn mẫu Nói cách khác, hệ số OOR2 dương phần lớn mơ hình hồi quy tác giả Đặc biệt, mơ hình sử dụng tỷ suất sinh lợi giá dầu thô WTI làm công cụ dự báo vượt trội so với mơ hình chuẩn, tức mơ hình trung bình lịch sử, tất giai đoạn ngồi mẫu, ngoại trừ mơ hình lợi suất số HNX giai đoạn tháng 1/2006 - 12/2011 Khi sử dụng giá dầu thô BRENT làm công cụ dự báo, tác giả khơng thể kết luận mơ hình cạnh tranh cung cấp kết tốt mơ hình chuẩn việc dự đoán lợi nhuận số HNX giai đoạn tháng 1/2006 - 12/2011 giai đoạn 1/2006 12/2014 Bảng 4.6 Kết dự báo số chứng khốn ngồi mẫu WTI BRENT Chỉ số chứng khốn OOR (%) Giá trị p OOR (%) Giá trị p Bảng A: 01/2006-12/2008 VN-index 2.536*** 0.000 2.078*** 0.000 HNX-index 1.970*** 0.000 1.311*** 0.000 Bảng B: 01/2006-12/2011 VN-index 0.988*** 0.000 0.101*** 0.000 HNX-index -0.026*** 0.000 -0.859*** 0.000 Bảng C: 01/2006-12/2014 VN-index 3.812*** 0.000 0.613*** 0.000 HNX-index 1.330*** 0.000 -1.877*** 0.000 *, ** *** biểu thị ý nghĩa mức 10%, 5% 1%, tương ứng Tóm lại, giá dầu thơ chứng minh hữu ích việc dự đoán lợi nhuận số chứng khoán Việt Nam giai đoạn mẫu Về khả dự đoán mẫu, mười ba số mười sáu hồi quy dự báo có ý nghĩa với số dầu thô BRENT mạnh chút so với giá dầu thơ WTI việc dự đốn lợi nhuận số chứng khoán Việt Nam Về khả dự đốn ngồi mẫu, mơ hình tác giả cung cấp kết dự báo tốt so với mơ hình trung bình lịch sử hầu hết mẫu thơi gian nghiên cứu 21 4.2 Dự báo biến động số chứng khoán Việt Nam Machine Learning Các nghiên cứu trước chủ yếu sử dụng mơ hình hồi quy truyền thống mơ hình tự hồi quy (AR), mơ hình vector tự hồi quy (VAR), hay mơ hình hồi quy logistic Cùng với phát triển cơng nghệ thơng tin, mơ hình dựa kỹ thuật machine learning ngày ứng dụng rộng rãi không ngành khoa học kỹ thuật mà ngành khoa học xã hội kinh tế - tài Các mơ hình có khả tự khai thác thơng tin từ liệu mẫu lớn, tìm mối quan hệ phi tuyến áp dụng cho nhiều dạng liệu khác số, ký tự, hình ảnh Sau đây, tác giả trình bày kết nghiên cứu dự đoán thị trường chứng khoán Việt Nam sử dụng phương pháp machine learning gồm phần: dự đoán xu VN index mơ hình LSTM dự đốn lợi tức ngày HNX sử dụng SVM định (Decision trees) Dự đoán xu VN Index sử dụng mơ hình mạng LSTM: Như đề cập chương 2, LSTM biến thể mạng RNN thường khai thác việc xây dựng mô hình dạng chuỗi thời gian Trong nghiên cứu này, tác giả sử dụng mơ hình mạng LSTM để tiến hành dự báo xu thay đổi lên xuống VN index tính từ ngày hơm đến ba ngày sau Nói cách khác, tốn phân loại nhị phân mà biến phụ thuộc có giá trị sau: { aN D oc H D Pt giá đóng cửa điều chỉnh VN Index vào ngày t Các biến độc lập liệu khứ VN index tính đến ngày t Dữ liệu sử dụng phần giá đóng cửa điều chỉnh khối lượng giao dịch VN index từ năm 2000 đến 2019 Để tiến hành dự đoán, tác giả xây dựng mạng LSTM lớp Độ dài liệu đầu vào 10 ngày Để kiểm tra khả dự đốn ngồi mẫu mơ hình, tác giả chia liệu thành phần gồm phần huấn luyện phần kiểm tra Mơ hình huấn luyện phần liệu huấn luyện, sau dùng để dự đốn phần kiểm tra Độ xác mơ hình mức độ dự đốn xác mơ hình phần kiểm tra Các tác giả định nghĩa kích cỡ phần kiểm tra (test size) tỷ lệ liệu giữ lại để tiến hành dự đốn ngồi mẫu Ví dụ với test size 0.01 99% liệu dùng để huấn luyện 1% dùng để kiểm tra hay dự đoán 58.30% 59.89% g 58.70% an 61.14% 58.04% 52.40% 0.01 0.05 0.1 0.15 0.2 0.25 Test size Hình 4.1 Kết mơ hình LSTM theo kích cỡ phần kiểm tra (test size) Hình 4.1 tổng hợp kết dự đốn mơ hình test size khác Trong test size thực hiện, kết dự đốn xác mơ hình đạt 58% Kết tốt đạt 61.14% test size 15% Kết cho thấy độ xác mơ hình cao trường hợp ngẫu nhiên 50-50 Bên cạnh đó, độ xác mơ hình ổn định cho với test size khác Điều ám mơ hình khơng cần phải huấn luyện lại thường xuyên để đối phó với thay đổi tham số theo thời gian 22 Các tác giả kiểm tra độ xác mơ hình thay đổi số lượng lớp LSTM mạng neuron thay đổi độ dài liệu đầu vào từ 10 ngày lên 20 30 ngày Tuy nhiên kết mơ hình khơng khác biệt so với trường hợp ban đầu Một nguyên nhân liệu đầu vào có biến (giá đóng cửa khối lượng giao dịch) mơ hình ban đầu đủ để khai thác thông tin từ biến Khi so sánh kết mơ hình LSTM với mơ hình xu trung bình, kết mơ hình khơng chênh lệch nhiều Trung bình, độ xác LSTM cao độ xác mơ hình trung bình 0.42% Kết LSTM có hứa hẹn rõ ràng cịn cần cải thiện nhiều Có thể việc liệu đầu vào đơn giản, gồm chuỗi giá khối lượng tần số liệu thấp, chưa đủ để LSTM thể hết khả dự báo 4.3 Dự đốn tỷ suất lợi tức ngày HNX Index sử dụng kỹ thuật machine learning Trong phần này, tác giả trình bày kết sử dụng kỹ thuật machine learning SVM, Random Forest (RF), Extra-trees Classifier (ETC) để dự đoán tỷ suất lợi tức ngày HNX index Kết phương pháp so sánh với mơ hình hồi quy logistic (Logistic regression – LR) Tỷ suất lợi tức ngày HNX định nghĩa tỷ lệ phần trăm chênh lệch giá đóng cửa giá mở cửa ngày Mục tiêu nghiên cứu dự đoán tỷ suất lợi tức ngày HNX Index dương hay âm, hay nói cách khác dự đốn thay đổi giá HNX Index từ lúc mở cửa đến lúc đóng cửa tăng hay giảm aN D oc H D Dữ liệu dùng liệu giao dịch ngày HNX Index từ năm 2010 đến hết năm 2019 Từ liệu giao dịch (giá mở cửa, giá đóng cửa, giá cao ngày, giá thấp ngày, khối lượng giao dịch) tác giả tính tốn báo kỹ thuật dùng phân tích kỹ thuật để làm biến đầu vào cho việc dự báo Sau liệu chia thành mẫu nhỏ phương pháp cửa sổ trượt để tiến hành huấn luyện dự đốn mẫu Độ dài mẫu xác định độ dài huấn luyện cộng với độ dài dự đoán Trong nghiên cứu này, độ dài huấn luyện chọn từ 20 đến 120 ngày với bước nhảy 10 ngày, độ dài dự đốn ngày Ví dụ với độ dài huấn luyện 20 ngày độ dài dự đoán ngày, mơ hình thực huấn luyện 20 ngày mẫu tiến hành dự đoán kết ngày cịn lại Độ xác mơ hình tính trung bình cộng độ xác mẫu Với liệu 10 năm từ 2010 đến 2019, số lượng mẫu dao động từ 475 đến 495 tùy vào độ dài huấn luyện chọn g an Sau có mẫu, việc huấn luyện dự đoán diễn sau Trước tiên, Kernel PCA sử dụng mẫu để trích tính cần thiết (feature) giúp giảm số chiều mô hình Số lượng tính chọn thí nghiệm từ đến 10 Sau mơ hình tiến hành huấn luyện dự đoán mẫu dựa độ dài huấn luyện thiết lập từ trước Việc lặp lại mẫu từ mẫu đến mẫu cuối cho mơ hình SVM, RF, ETC LR Sau đó, độ xác trung bình tất mẫu tính cho mơ hình, độ xác mơ hình Sau tác giả tiến hành so sánh kết tốt mơ hình theo số lượng feature theo độ dài huấn luyện 56 55 54 53 52 51 50 49 Extra Trees Số lượng feature Logistic Regression Random Forest Hình 4.2 Kết mơ hình theo số lƣợng tính tăng 23 10 SVM Hình 4.2 so sánh kết dự báo mơ hình SVM, RF, ETC, LR theo số lượng feature mơ hình Trong mơ hình ETC có kết dự báo tốt với độ xác đạt 54.97%, LR đứng thứ với 54.39%, SVM đứng thứ với 53.67% RF đứng cuối với 53.14% Ta thấy kết mơ hình ETC thể mối quan hệ chiều với số lượng feature mơ hình Trong kết SVM LR lại ổn định không thay đổi nhiều theo số lượng feature Kết RF tăng theo số lượng feature lại giảm số lượng feature cao 56 55 54 53 52 51 50 49 20 30 40 50 60 70 80 90 100 110 120 Training length Extra Trees Logistic Regression Random Forest SVM D Hình 4.3 Kết mơ hình theo độ dài huấn luyện an aN D oc H Hình 4.3 so sánh kết dự báo mơ hình theo độ dài liệu huấn luyện Đầu tiên ta thấy kết RF ETC có di chuyển giống hệt nhau, nhiên kết ETC ln cao RF Do đó, RF ETC, ta ln chọn ETC thay cho RF Ngồi ra, kết mơ hình ETC RF mối quan hệ rõ ràng với độ dài huấn luyện Kết SVM ổn định không thay đổi nhiều theo độ dài liệu huấn luyện Kết LR thể mối quan hệ rõ ràng kết mơ hình độ xác LR có xu tăng với độ dài liệu huấn luyện g Kết nghiên cứu cho thấy ETC phương pháp dự báo tốt nhất, nhiên phương pháp LR truyền thống cho kết tốt thua kết ETC 0.6% cho kết tốt SVM RF mơ hình có độ xác thấp nên thay ETC kết có xu di chuyện gần giống hệt Tuy nhiên nghiên cứu hạn chế chưa giải vấn đề việc tính quan trọng việc dự báo Dữ liệu có tần số thấp ngun nhân khiến kết mơ hình machine learning khơng vượt xa mơ hình LR mong đợi 24 KẾT LUẬN Trong đề tài này, ta khảo sát đề xuất mơ hình để dự báo liệu chuỗi thời gian, cụ thể số tài Các mơ hình từ phương pháp hồi quy truyền thống đến phương pháp dựa kĩ thuật machine learning (học tự động) Với kĩ thuật liên quan đến hồi quy, đề tài đề cập đến mơ mơ hình bình phương nhỏ (OLS), mơ hình phương sai thay đổi có điều kiện (GARCH) mơ hình bình phương tối thiểu tổng quát (FGLS) Tiếp theo đó, tác giả áp dụng hai mơ hình GARCH FGLS để nghiên cứu tác động giá dầu tỷ giá hối đoái đến số chứng khốn Việt Nam Đây mơ hình áp dụng để dự đốn mẫu số chứng khoán Việt Nam Kết nghiên cứu tác giả cho thấy giá dầu có ảnh hưởng đến số chứng khốn VNIndex HNX Index Tuy nhiên, tác giả đưa kết luận tương tự tỷ giá hối đoái oc H D Theo gợi ý Welch Goyal (2008) nhiều mơ hình khơng thể cho kết dự đốn ngồi mẫu đáng tin cậy, chí cịn khơng xác mơ hình trung bình lịch sử Vì vậy, tác giả sử dụng phương pháp ước lượng bình phương nhỏ tổng quát khả thi (FGLS) để dự đoán thay đổi hai số chứng khoán VNIndex HNX Index Mơ hình dự đốn tác giả tính đến tác động giá dầu thô, giá dầu BRENT giá dầu WTI Nhìn chung, mơ hình dự đốn tác giả cung cấp kết dự báo tốt so với mơ hình trung bình lịch sử hầu hết giai đoạn mẫu chọn Đặc biệt, mơ hình sử dụng tỷ suất sinh lợi giá dầu thô WTI làm công cụ dự báo tốt hơn so với mơ hình chuẩn, tức mơ hình trung bình lịch sử, tất giai đoạn mẫu Tuy nhiên, khác biệt độ xác mơ hình đề xuất so với mơ hình trung bình lịch sử cịn chưa đủ lớn Vì vậy, việc tiếp tục xem xét kĩ thuật khác để tìm phương pháp tốt dự đoán số chứng khoán Việt Nam cần thiết, đặc biệt kĩ thuật machine learning aN D Với kĩ thuật machine learning, ta xem xét công cụ truyền thống SVM hay Decision Tree, mơ hình Deep Learning (mạng nơ-ron nhân tạo) bật g an Cụ thể với cách tiếp cận Deep Learning cho việc dự báo biến động số tài chính, ta sử dụng mơ hình LSTM, mơ hình mang lại nhiều thành cơng lĩnh vực xử lý ảnh, xử lý tiếng nói, xử lý ngôn ngữ thời gian qua Bằng cách mở rộng phạm vi ứng dụng LSTM, vốn mạnh việc khai thác mối quan hệ khoảng thời gian tương đối dài, ta thấy LSTM mang lại hiệu việc dự báo số tài Thơng qua liệu VNIndex, mơ hình LSTM đề xuất cho kết dự báo tốt mơ hình đơn giản mơ hình trung bình (average) Từ kết nhiều hứa hẹn này, ta thấy cách tiếp cận theo Deep Learning giải tốn dự báo lĩnh vực kinh tế, tài cách hiệu Bên cạnh đó, ta cần ý đến số điểm quan trọng để thiết kế mô hình Deep Learning tốt Đầu tiên cấu trúc mạng; ta cần chọn cấu trúc có độ phức tạp phù hợp để giải tốn, mạng nơ-ron q lớn gặp vấn đề huấn luyện mạng liên quan đến liệu thời gian hội tụ Thứ hai liệu dùng để huấn luyện Nói chung, mạng nơ-ron đặc biệt mơ hình deep learning cần lượng liệu lớn để huấn luyện Do đó, ta cần thu thập lựa chọn liệu hợp lý để xây dựng mơ hình dự báo hiệu Ngồi ra, tốn khác sử dụng cách tiếp cận deep learning, ta cần ý đến khả tính tốn máy tính, nói chung mơ hình deep learning có độ phức tạp lớn yêu cầu khả tính toán cao Bên cạnh deep learning, vốn thu hút nhiều quan tâm hầu hết lĩnh vực, ta cịn khai thác nhiều cơng cụ machine learning khác, cổ điển không phần hiệu quả, đặc biệt ta khơng có sẵn nhiều liệu việc thu thập liệu tốn khó khăn Khi đó, ta cân nhắc sử dụng phương pháp machine learning SVM hay Decision Tree để xây dựng mơ hình dự báo Trong đề tài, ta xem xét việc dự báo biến thiên số chứng khoán ngày (thông qua liệu HNX) cách so sánh phương pháp truyền thống 25 Logistic Regression, SVM, Random Forest Extra Trees Classifier Kết thực nghiệm cho thấy hiệu cách tiếp cận theo phương pháp Decision Tree Ngoài ra, SVM thể khả dự báo, đặc biệt cho thấy phụ thuộc vào chiều dài liệu Một câu hỏi thú vị đặt công cụ tối ưu để giải toán dự báo? Rất khó để có câu trả lời dứt khốt, nhìn chung ta lựa chọn dựa vào liệu có (hoặc thu thập được) Nếu ta có nhiều liệu, với hệ thống tính tốn lớn, ta khai thác mơ hình mạng nơ-ron nhân tạo deep learning Ngược lại, có liệu hơn, ta thử nghiệm vài phương pháp machine truyền thống để tìm cơng cụ tối ưu nhất; phương pháp SVM hay Decision Tree ứng viên tiềm Ngồi ra, việc xây dựng mơ hình dự báo cần đến kinh nghiệm người thiết kế hiểu biết chuyên sâu toán Việc chọn biến đầu vào có ý nghĩa lớn (trong số nhiều đầu vào có) giúp ích nhiều việc tạo mơ hình dự báo hiệu g an aN D oc H D 26 ... tiêu nghiên cứu Đề tài nhằm mục tiêu đề xuất khung lý thuyết sử dụng trí tuệ nhân tạo để dự báo biến động biến số tài vĩ mơ ứng dụng lý thuyết sử dụng trí tuệ nhân tạo việc dự báo biến động biến. .. tài vĩ mơ Việt Nam Các mục tiêu cụ thể sau : - Đề xuất khung lý thuyết sử dụng trí tuệ nhân tạo dự báo biến động biến số tài vĩ mơ Sử dụng mơ hình để xuất để dự báo biến động biến số tài vĩ mơ... thuyết trí tuệ nhân tạo việc dự đốn biến động biến số tài - Chương 4: Kết dự báo biến động số chứng khoán Việt Nam g CHƢƠNG 1: BIẾN ĐỘNG BIẾN SỐ TÀI CHÍNH VĨ MƠ 1.1 Dự báo biến số tài vĩ mơ Việc dự