CHƯƠNG 1: ĐÁNH GIÁ CÁC MÔ HÌNH PHÂN TÍCH VÀ DỰ BÁO GIÁ CỔ PHIẾU
1.2. Mô hình dự báo giá cổ phiếu
1.2.3. Mô hình học máy khác
Bên cạnh những mô hình dự báo dựa trên phương pháp hồi quy tuyến tính và phi tuyến cổ điển, kể từ nhiều năm nay, nhiều kỹ thuật mới đã được phát triển để dự đoán giá chứng khoán. Một trong số những kỹ thuật hiện đang được áp dụng trong việc dự báo giá đó là kỹ thuật máy học phi tuyến (non-linear machine learning techniques). Mạng nơ-ron nhân tạo (ANN - Artificial Neural Networks) và Máy vecto hỗ trợ (SVM - Support Vector Machine) là hai thuật toán học máy được sử dụng rộng rãi nhất để dự đoán biến động của chứng khoán và các chỉ số giá chứng khoán. Mỗi thuật toán có một các thức thực hiện riêng. ANN mô phỏng hoạt động của bộ não con người để học bằng cách tạo ra các mạng lưới tế bào thần kinh. Hassan và cộng sự (2007) đã đề xuất triển khai mô hình tổng hợp HMM (Hidden Markov Model), ANN và GA (Genetic Algorithms- thuật toán di truyền) để dự báo hành vi giao dịch của thị trường tài chính. Wang và Leu (1996) đã phát triển một hệ thống dự báo xu hướng giá trung hạn trên thị trường chứng khoán Đài Loan, hệ thống
21
này dựa trên một mang nơ-ron lặp lại được đào tạo bằng cách sử dụng các tính năng từ mô hình ARIMA. Kết quả cho thấy các mạng được đào tạo có khả năng dự đoán xu hướng thị trường lên tới 6 tuần với độ chính xác cho phép.
Vào năm 1996, Roman và Jameel đã sử dụng mô hình Backpropagation (lan truyền ngược) và RNN để dự báo chỉ số CK ở năm thị trường khác nhau. Trong nghiên cứu của 16 cũng ứng dụng mô hình mạng nơ-ron thời gian với độ trễ, lặp lại để dự báo giá chứng khoán giao dịch hàng ngày. Hegazy và cộng sự (2014) cũng áp dụng thuật toán machine learning như PSO và LS-SVM để dự đoán biến động của chỉ số S&P500. Với sự ra đời của LSTM (Hochreiter và Schmudhuber, 1997), việc phân tích dữ liệu thời gian trở nên hiệu quả hơn bởi khả năng lưu trữ thông tin trong quá khứ và sử dụng thông tin này để dự đoán giá CP. Nghiên cứu trên các CP của chỉ số NIFTY 50, Hiransha và cộng sự (2018) đã sử dụng ba cấu trúc học sâu khác nhau bao gồm RNN, LSTM và CNN. Trong đó RNN có thể sử dụng bộ nhớ trong để xử lý chuỗi dữ liệu đầu vào tùy ý. Mỗi đơn vị tính toán trong RNN có thời gian bắt đầu, giá trị và khối lượng có thể thay đổi. LSTM là một trường hợp đặc biệt của RNN được giới thiệu vào năm 1997. Cấu trúc CNN chỉ tập trung vào trình tự đầu vào và không sử dụng lịch sử hoặc thông tin nào trong suốt quá trình học máy. Kết quả nghiên cứu của Hiransha và cộng sự cho thấy mô hình CNN tỏ ra hiệu quả hơn trong việc dự báo giá chứng khoán. Lập luận nhóm tác giả đưa ra cho tính hiệu quả của mô hình CNN là dựa trên những biến động đột ngột trên thị trường chứng khoán không theo trình tự hay xảy ra có tính chu kỳ. Do vậy CNN với khả năng xử lý thông tin đưa ra tại một thời điểm cụ thể để dự báo sẽ khắc phục được vấn đề này.
Mạng nơ-ron nhân tạo – ANN
Mạng nơ-ron nhân tạo như một kỹ thuật tính toán chính xác được sửu dụng rộng rãi trong việc dự báo các vấn đề xã hội, kinh tế, kinh doanh, tài chính chứng khoán (Khashei và Bijari, 2010; Khan, 2020). ANN là một phương pháp tự điều chỉnh theo hướng dữ liệu và giả định cho trước. Phương pháp này dự đoán tốt với khả năng thực hiện các quan sát tổng quát từ các kết quả học máy trên dữ liệu gốc, từ đó cho phép nó suy luận những phần còn thiếu trong mẫu nghiên cứu. ANN được biết tới là một công cụ tương tự vì nó có thể ước lượng một cách hiệu quả trên chuỗi dữ liệu liên tục đạt đến mức độ chính xác mà người
22
dùng mong muốn. ANN còn giải quyết được các bài toán phi tuyến trong thực tế trong khi ngày càng có nhiều vấn đề mang tính phi tuyến với hành vi không chắc chắn và thay đổi theo thời gian (Khan, 2020). Điều này giúp khắc phục những hạn chế của các mô hình truyền thống dự báo chuỗi thời gian như ARIMA.
Trong một số nghiên cứu trước đây đã chỉ ra rằng mô hình dự báo sử dụng ANN cho thấy hiệu quả tốt hơn các mô hình dự báo tuyến tính thông thường (Yao và cộng sự, 1999;
Hansen và cộng sự, 1999, Wijaya và cộng sự, 2010, Adebiyi và cộng sự, 2014).
Chen và cộng sự (2003) đã nghiên cứu mạng nơ-ron xác xuất (probabilistic neural network (PNN) để dự báo xu hướng của chỉ số sau khi được học trên dữ liệu lịch sử. Kết quả thực nghiệm cho thấy các chiến lược đầu tư dựa trên PNN thu được lợi nhuận cao hơn so với các chiến lược đầu tư được hỗ trợ bởi các mô hình dự báo khác.
Máy vecto hỗ trợ - SVM
Thuật toán SVM là một trong những thuật toán nổi tiếng được phát triển bởi Vapnik (1999). Đây là một loại thuật toán rất cụ thể được đặc trưng bởi khả năng kiểm soát của chức năng ra quyết định. Huang và cộng sự (2005) đã nghiên cứu khả năng dự đoán xu hướng của chỉ số Nikkei 225 thông qua SVM. Kết quả nghiên cứu cho thấy SVM vượt trội hơn so với các phương pháp dự báo khác. Nhiều nghiên cứu sau này cũng đã sử dụng thuật toán SVM để dự báo chuỗi tài chính và đạt được độ chính xác cao (Das và Padhy, 2012;
Guo và cộng sự, 2014; Lu và cộng sự, 2009). Kết quả của các nghiên cứu đều chỉ ra tính ưu việt của phương pháp này so với các phương pháp dự báo giá truyền thống (Aydin và Cavdar, 2015; Giovanis, 2009).
Kumar và Thenmozhi (2005) đã thực hiện một số nghiên cứu về hiệu quả của từng phương pháp dự báo giá như ARMA, RF, SVM và MNRNT trong dự đoán xu hướng của chỉ số S&P CNX NIFTY. Kết quả chỉ ra rằng SVM mang lại kết quả chính xác hơn. Một số nghiên cứu tại các TTCK khác nhau cũng cho thấy kết quả khả quan trong việc sự báo giá mà thuật toán SVM mang lại. Giovanis (2009) dự báo biến động giá tại TTCK Athens, Boyacioghe và Baykan (2011) tại thị trường chứng khoán Istanbu, Lee (2009) dự báo chỉ số NASDAQ.
23