Bài nghiên cứu mặc dù đã cho ra được những kết quả nghiên cứu nhất định nhưng do thời gian có hạn, kinh nghiệm và năng lực thực tế chưa đủ nhiều nên nghiên cứu này vẫn còn một số hạn chế cần cải thiện.
Đầu tiên là khả năng dự đoán bị giới hạn, vì trong lĩnh vực dự báo dữ liệu chuỗi thời gian, không có biến đầu vào đa dạng có thể hạn chế khả năng mô hình dự đoán chính xác. Sự biến động của chỉ số VN-Index có thể bị ảnh hưởng bởi nhiều yếu tố khác nhau, nhưng trong bài nghiên cứu này tác giả chỉ sử dụng biến đầu vào là các chỉ báo kỹ thuật, không có các biến khác như giá cổ phiếu của các công ty niêm yết, các chỉ số đại diện hiệu quả thị trường trong và ngoài nước, và các dữ liệu vĩ mô như GDP, CPI,...
Thứ hai, có khả năng mô hình xuất hiện tình trạng quá khớp, phần lớn là vì biến đầu vào không đa dạng nên kết quả từ mô hình dễ bị học quá chi tiết với dữ liệu huấn luyện, tức là mô hình học quá chi tiết về các mẫu cụ thể trong dữ liệu đào tạo và không nắm bắt được các mẫu tổng quát. Một mô hình quá khớp sẽ có hiệu suất kém khi áp dụng cho dữ liệu mới. Nhằm khắc phục các hạn chế nêu trên, nếu tác giả có điều kiện thực hiện các nghiên cứu tiếp theo thì sẽ thực hiện theo hướng như sau:
Nâng cấp cơ sở dữ liệu mở rộng với nhiều biến mô tả hơn, không chỉ dừng lại ở chỉ số chứng khoán trên TTCK Việt Nam mà có thể bổ sung các chỉ số đại diện cho thị trường ở nước ngoài như Dow Jones, S&P500, Nasdaq, Russell 2000 Index,... Mở rộng nội dung theo hướng phân tích thêm nhiều yếu tố nội tại thị trường Việt Nam và vĩ mô ảnh hưởng đến giá cổ phiếu hơn nữa như GPD, tỷ lệ lạm phát, tỷ giá ngoại tệ ... Ngoài ra có thể mở rộng nghiên cứu ở nhiều nhóm ngành khác có mức độ hấp dẫn hơn ở trên TTCK hiện nay.
5.3.2. Hướng nghiên cứu tiếp theo
Ở thời điểm hiện tại, dù đã có nhiều đề tài nghiên cứu ứng dụng mô hình Machine Learning vào dự báo dữ liệu chứng khoán ở Việt Nam, nhưng vẫn chưa được phổ biến rộng rãi. Qua khóa luận này, việc sử dụng các công cụ học máy vào dự báo mở ra nhiều hướng đi tiềm năng và sáng tạo trong các lĩnh vực khác nhau.
Trong lĩnh vực tài chính, học máy có thể được sử dụng để dự báo giá cổ phiếu và thị trường tài chính. Các mô hình học sâu như LSTM (Long Short-Term Memory) và GRU (Gated Recurrent Unit) có khả năng xử lý dữ liệu thời gian phức tạp và dự báo biến động giá cổ phiếu với độ chính xác cao. Ngoài ra, các thuật toán như XGBoost (Extreme Gradient Boosting), Random Forest, và SVM (Support Vector Machine) cũng được ứng dụng rộng rãi trong dự báo tài chính nhờ khả năng xử lý dữ liệu lớn và phức tạp, cũng như khả năng tạo ra các mô hình dự báo chính xác. Việc áp dụng xử lý ngôn ngữ tự nhiên (NLP) để phân tích tin tức tài chính và mạng xã hội giúp hiểu rõ hơn về tâm lý thị trường và dự báo xu hướng một cách hiệu quả. Học máy cũng có thể được sử dụng để phát hiện các giao dịch bất thường và ngăn chặn gian lận tài chính, từ đó đảm bảo an toàn cho các nhà đầu tư. Các mô hình phân cụm như như K-means clustering, Random Forests, ... giúp phát hiện các mẫu giao dịch bất thường trong dữ liệu lớn.
Bên cạnh tài chính, học máy còn có thể áp dụng trong nhiều lĩnh vực khác như y tế, dự báo thời tiết, quản lý chuỗi cung ứng và tiếp thị. Tổng hợp lại, học máy không chỉ giúp cải thiện dự báo mà còn tạo ra các giá trị mới, nâng cao hiệu quả và độ chính xác trong nhiều lĩnh vực khác nhau. Điều này mở ra cơ hội lớn cho việc ứng dụng công nghệ tiên tiến vào thực tiễn, giúp các ngành công nghiệp phát triển mạnh mẽ và bền vững.
KẾT LUẬN CHƯƠNG 5
Căn cứ vào kết luận ở chương 4, chương 5 đưa ra kết luận để trả lời câu hỏi nghiên cứu và đưa ra một số hàm ý chính sách nhằm nâng cao độ phổ biến đối với ứng dụng thuật toán học máy vào lĩnh vực tài chính nói chung và thị trường chứng khoán nói riêng. Chương này cũng sẽ nêu ra những hạn chế của đề tài, từ đó đưa ra các gợi ý cho hướng nghiên cứu tiếp theo liên quan đến thời gian và không gian cũng như nội dung nghiên cứu.