Huấn luyện mô hình

Một phần của tài liệu 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam (Trang 54 - 68)

Sau khi lựa chọn các thuật toán phù hợp để xây dựng mô hình, tiếp đó là huấn luyện mô hình. Với các hàm được chọn cho ra tham số loss là 0.0017-0.0019, khi mà tham số loss trả ra giá trị nhỏ thì chứng tỏ các hàm được chọn trong mô hình tương đối phù hợp:

Epoch 300/300

15/15 [==============================] - 1s 44ms/step - loss: 0.0017 - mse: 0.0017 - val_loss: 0.0023 - val_mse: 0.0023

Model: "sequential_8" Total params: 270,643 Trainable params: 270,643 Non-trainable params: 0

Dưới đây là đường dữ liệu train test của các mã cổ phiếu VN30 được lựa chọn. Ta thấy đường dữ liệu gần như khớp nhau, cho thấy bộ dữ liệu chia và mô hình phù

hợp để dự báo. Đầu tiên là đồ thị của mã ACB, sai số MSE của dữ liệu train là 0.33 và test là 0.28 rất nhỏ, đường màu xanh là giá trị thực, đường cam là dự báo. Khi giá trị MSE càng nhỏ thì độ chính xác của dự báo càng tăng.

Hình 33. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu train của mã cổ phiếu ACB

Hình 34. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu test của mã cổ phiếu ACB

Tương tự, với mã cổ phiếu FPT có độ sai số MSE trên tập train là 0.31 và trên tập test là 0.66, với bộ dữ liệu test của mã FPT có MSE cao hơn, đường dự báo khá lệch so với đường giá thật.

Hình 35. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu train của mã cổ phiếu FPT

Hình 36. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu test của mã cổ phiếu FPT

Với mã cổ phiếu MBB, có độ sai số MSE trên tập train là 0.34 và trên tập test là 0.49, với độ sai số như vậy thì đường dự báo của bộ test khá lệch so với đường giá thật.

Hình 37. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu train của mã cổ phiếu MBB

Hình 38. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu test của mã cổ phiếu MBB

Với mã cổ phiếu SSI, có độ sai số MSE trên tập train là 0.37 và trên tập test là 0.45. Với tập chia tỷ lệ này, chúng ta có thể nhận thấy, 2 đường gần như phù hợp để xây dựng mô hình dự báo.

Hình 39. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu train của mã cổ phiếu

' ' ' SSI ' '

Hình 40. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu test của mã cổ phiếu SSI

Với mã cổ phiếu VNM, có độ sai số MSE trên tập train là 0.21 và trên tập test là 0.08. Với tập chia tỷ lệ này, chúng ta có thể nhận thấy, mô hình này rất phù hợp để dự báo.

Hình 41. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu train của mã cổ phiếu

' ' ' ' VNM ' '

Hình 42. Đồ thị thể hiện giá thực và dự đoán trên tập dữ liệu test của mã cổ phiếu

' ' ' VNM ' '

Trong các mô hình dưới đây các đường được biểu diễn như sau:

■ Đường màu xanh thể hiện đường dữ liệu đào tạo (train)

■ Đường màu cam thể hiện giá thực của chứng khoán (val)

Hình 43. Đồ thị thể hiện đường dự đoán của mã cổ phiếu ACB

Hình 44. Đồ thị thể hiện đường dự đoán của mã cổ phiếu FPT

MSE of LSTM MSE of ARIMA ACB 0.1 7 ÕT FPT 0.1 6 15 7 MBB 0.1 8 0.29 SSI 0.1 5 0.6 6 VNM 0.1 7 4.53

Hình 45. Đồ thị thể hiện đường dự đoán của mã cổ phiếu MBB

Hình 46. Đồ thị thể hiện đường dự đoán của mã cổ phiếu SSI Hình 47. Đồ thị thể hiện đường dự đoán của mã cổ phiếu VNM

3.2. Đánh giá mô hình

Để chỉ rõ sự hiệu quả của mô hình LSTM đối với bài toán dự báo giá cổ phiếu, khóa luận này thực hiện thêm một thí nghiệm dự báo giá cổ phiếu bằng mô hình truyền thống ARIMA. Kết quả thực nghiệm của hai phương pháp được thể hiện qua bảng chỉ số MSE dưới đây.

Date Closed Predictions 19-04-21 32.50 33.979195 20-04-21 32.50 33.979195 22-04-21 33.40 32.588326 23-04-21 33.30 33.450748 27-04-21 34.00 33.691101 28-04-21 33.80 34.285011 29-04-21 34.65 34.087299

So sánh MSE của mô hình LSTM với MSE của mô hình Arima, rõ ràng ta nhận thấy chỉ số MSE của mô hình Arima lớn hơn nhiều so với LSTM hay có thể hiểu rằng độ sai trong dự báo của mô hình ARIMA cao hơn mô hình học sâu LSTM. Điều này cho thấy kỹ thuật học sâu LSTM đưa ra giá trị dự báo sát với giá thực hơn. Với bộ dữ liệu chứng khoán tại Việt Nam, chúng ta hoàn toàn có thể đưa kỹ thuật học sâu LTSM vào trong lĩnh vực dự báo tài chính cụ thể chứng khoán hay nhiều các bài toán tài chính khác. Hơn hết mô hình kỹ thuật học LSTM tương đối dễ sử dụng và đọc hiểu, dễ

49

dàng học. Ngoài ra, sự kết hợp các mô hình kỹ thuật học sâu với các mô hình khác cũng là một sự lựa chọn tốt đối với các nhà phân tích và các công ty chứng khoán.

Bảng 2. So sánh kết quả dự báo bằng phương pháp kỹ thuật học sâu LSTM của mã cổ phiếu ACB với giá trị thực tế

Để đầu tư chứng khoán thành công, các nhà đầu tư quan tâm đến dự báo tình hình tương lai của thị trường chứng khoán. Chỉ cần có sự cải tiến nhỏ về hiệu quả dự đoán cũng có thể mang lại lợi nhuận rất cao. Một hệ thống dự đoán tốt sẽ giúp các nhà đầu tư thực hiện đầu tư chính xác hơn và sinh lợi hơn bằng cách cung cấp thông tin hỗ trợ chẳng hạn như hướng tương lai của giá cổ phiếu. Bài nghiên cứu này đã xem xét và so sánh tính năng hiện đại của các thuật toán và kỹ thuật deep learning có được sử dụng trong tài chính, đặc biệt là dự đoán giá cổ phiếu. Kỹ thuật học sâu tiêu biểu như LSTM đã cho ra kết quả đầy mong đợi. Bài toán được mô tả trong bài nghiên cứu này cũng nhằm ủng hộ việc áp dụng các thuật toán và kỹ thuật dựa trên học sâu đến dữ liệu kinh tế và tài chính. Có một số vấn đề dự đoán khác trong tài chính và kinh tế không chỉ chứng khoán có thể được xây dựng bằng cách sử dụng học sâu.

KẾT LUẬN 1. Các kết quả thu được từ bài toán đưa ra:

- Khóa luận đã tìm hiểu nghiên cứu về thị trường chứng khoán và vấn đề dự báo giá cổ phiếu trên thế giới cũng như tại Việt Nam. Qua quá trình này, tác giả đã lựa

chọn phương pháp LSTM để giải quyết vấn đề bài toán đã đặt ra về dự báo giá đóng

cửa của một số mã cổ phiếu.

- Dựa trên cơ sở lý luận về thuật toán học sâu LSTM, khóa luận đã xây dựng mô hình dựa báo giá cổ phiếu dựa trên kỹ thuật này với các tham số phù hợp. Các

kết quả

thực nghiệm trên bộ dữ liệu năm mã cổ phiếu trong nhóm VN30 đã cho thấy phương

pháp lựa chọn hiệu quả hơn so với phương pháp dự báo truyền thống.

2. Một số hạn chế của đề tài:

- Do trong phạm vi bài toán đưa ra, mức độ vĩ mô cũng như thời gian nghiên cứu hạn chế, đề tài nghiên cứu chỉ mới xây dựng mô hình LSTM thuần túy và so

sánh với

một mô hình dự báo truyền thống ARIMA.

- Vấn đề dự báo giá đóng cửa của mã cổ phiếu còn trong phạm vi hẹp vì mới chỉ xây dựng dự báo vào mỗi giá đóng cửa.

3. Ý tưởng phát triển đề tài:

TÀI LIỆU THAM KHẢO

[1] Duc Huu Dat Nguyen, Loc Phuoc Tran and Vu Nguyen, "Predicting Stock Prices

Using Dynamic LSTM Models," in International Conference on Communications

in Computer and Information Science, Madrid, 2019.

[2] Xuan Ji, Jiachen Wang and Zhijun Yan, "A stock price prediction method based on deep learning technology," International Journal of Crowd Science, 2020. [3] David M. Q. Nelson, Adriano C. M. Pereira, Renato A. de Oliveira, "Stock

market’s price movement prediction with LSTM neural networks," in 2017

International Joint Conference on Neural Networks, 2017.

[4] Sreelekshmy Selvin, Vinayakumar R, Gopalakrishnan E.A, Vijay Krishna Menon,

Soman K.P, "Stock price prediction using LSTM, RNN and CNN-sliding window

model," in 2017 International Conference on Advances in Computing,

Communications and Informatics, 2017.

[5] Kai Chen, Yi Zhou and Fangyan Dai, "A LSTM-based method for stock returns prediction: a case," in IEEE International Conference on Big Data (Big Data), 2015.

[6] Yujin Baek, Ha Young Kim, "ModAugNet: A new forecasting framework for stock market index value with an overfitting prevention LSTM module and a prediction LSTM module," Expert Systems with Applications, pp. 457-480, 2018.

[7] Zexin Hu, Yiqi Zhao and Matloob Khushi, "A Survey of Forex and Stock Price Prediction Using Deep Learning," Applied System Innovation, 2021.

[8] M. Tuấn, "Lịch sử thị trường chứng khoán thế giới," 07 08 2009. [Online]. Available: https://cafef.vn/tai-chinh-quoc-te/lich-su-thi-truong-chung-khoan-the- gioi-20090807032914113.chn.

[10] Xiao Ding, Yue Zhang, "Using Structured Events to Predict Stock Price Movement," in Proceedings of the 2014 Conference on Empirical Methods in

Natural Language Processing (EMNLP), 2019, pp. P1415-P1425.

[11] S. Lahmiri, "A Comparison of PNN and SVM for Stock Market Trend Prediction

using Economic and Technical Information," International Journal of Computer

Applications, pp. 24-30, 2011.

[12] Weiling Chen, Chai Kiat Yeo, Chiew Tong Lau, Bu Sung Lee,

"Leveraging social

media news to predict stock index movement using RNN-boost," Data &

Knowledge Engineering, pp. 14-24, 2018.

[13] P. N. H. J. S. S. A. M. Mojtaba Nabipour, "Predicting Stock Market

Trends Using

Machine Learning and Deep Learning Algorithms Via Continuous and Binary Data; a Comparative Analysis”," IEEE Access, pp. 150199-150212, 12 08 2020. [14] Mahla Nikou, Gholamreza Mansourfar, Jamshid Bagherzadeh, "Stock

price

prediction using DEEP learning algorithm and its comparison with machine learning algorithms," Intelligent system in Accounting, Finance and Management,

pp. 1-11, 2019.

[15] M. M. Y. A. A. S. M. Maqsood, "A local and global event sentiment based

efficient stock exchange forecasting using deep learning," International Journal

of Information Management, pp. 432-451, 2020.

[16] Ehsan Hoseinzade, Saman Haratizadeh, "CNNpred: CNN-based stock market

prediction using a diverse set of variables," Expert Systems with Applications,

pp.

273-285, 2019.

[17] Zhichao Zou, Zihao Qu, "Using LSTM in Stock prediction and Quantitative,"

5. Các nội dung đã hoàn thiện theo kết luận của Hội

đNội dung yêu cầu chỉnh ồng:_____________________

sửa của Hội đồng

Nội dung đã chỉnh sửa

của sinh viên (ghi rõ vị trí chỉnh sửa:Ghi chú dòng, mục, trang)__________

Trích dẫn các hình, nguồn lấy, nguồn phần 1.1.2

Nguồn: cafef Chương 3, trang 32,

Chương 2, phần 1.1.2

Cần ghi rõ nguồn thu thập dữ liệu và một số thống kê dữ liệu, ví dụ 576 dòng dữ liệu là tất cả 5 mã CP, hay từng mã, gộp tất cả lại để chia hay là tách riêng

Với tập dữ liệu khoảng 576 dòng dữ liệu của từng mã cổ phiếu

Chương 3, trang 33

Hướng phát triển: Tiếp tục nghiên cứu các kỹ thuật dự báo khác, so sánh đánh giá mô hình trên nhiều phương diện"

→ là những kỹ thuật dự báo gì, những phương diện nào

... như các thuật toán deep learning khác, so sánh đánh giá mô hình trên nhiều phương diện như thông tin tài chính của công ty, quy mô doanh nghiệp,.

Phần kết luận

phieu-dat-gan-64-gdp∕180070.html.

[20] M. Anh, "Nhà đầu tư trong nước tiếp tục mở mới hơn 110.000 tài khoản chứng

khoán trong tháng 4," 10 05 2021. [Online]. Available: https://cafef.vn/nha-dau- tu-trong-nuoc-tiep-tuc-mo-moi-hon- 110000-tai-khoan-chung-khoan-trong- thang-

4-20210510135752532.chn.

[21] Nguyễn Thanh Hương, Bùi Quang Trung, " Ứng dụng mô hình kết hợp ARIMA-

GARCH để dự báo chỉ số VN-Index," Tạp chí Khoa học Công nghệ Đại học Đà

Nang, 2015.

[22] Hồ Thủy Tiên, Hồ Thu Hoài, Ngô Văn Toàn, "Mô hình hóa biến động thị trường

chứng khoán Thực nghiệm từ Việt Nam," Tạp chí Khoa học ĐHQGHN: Kinh tế

và Kinh doanh, pp. 21-31, 22 09 2017.

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM

HỌC VIỆN NGÂN HÀNG

CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc

BẢN GIẢI TRÌNH CHỈNH SỬA KHÓA LUẬN TỐT NGHIỆP

1. Họ và tên sinh viên:.. .Nguyễn Thị Hậu... 2. Mã sinh viên:...20A4040046...

3. Lớp:...K20HTTTB...Ngành:. .Hệ thống thông tin quản lý... 4. Tên đề tài: Ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ

phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán Việt Nam

phiếu còn trong phạm vi

hẹp" → phạm vi hẹp là

sao?

báo vào mỗi giá đóng cửa

Chỉnh sửa lại câu văn cho xuôi Chương 1, 2, 3

55 6. Kiến nghị khác (nếu có):

Giảng viên hướng dẫn (Ký ghi rõ họ tên)

Vũ Duy Hiến

Hà Nội, ngày.... tháng .... năm

Sinh viên (Ký ghi rõ họ tên)

Nguyễn Thị Hậu

Một phần của tài liệu 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam (Trang 54 - 68)