1. Trang chủ
  2. » Luận Văn - Báo Cáo

Dự báo xu hướng của chứng khoán bằng mô hình lai ghép giữa phương pháp máy vector hỗ trợ và mạng neuron nhân tạo

128 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 128
Dung lượng 9,24 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH ĐỒ ÁN TỐT NGHIỆP NGÀNH KỸ THUẬT DỮ LIỆU DỰ BÁO XU HƯỚNG CỦA CHỨNG KHỐN BẰNG MƠ HÌNH LAI GHÉP GIỮA PHƯƠNG PHÁP MÁY VECTOR HỖ TRỢ VÀ MẠNG NEURON NHÂN TẠO GVHD: TS NGUYỄN THÀNH SƠN SVTH: NGUYỄN HỮU NHẬT ĐỖ ĐÌNH PHÙNG SKL009804 Tp Hồ Chí Minh - 2022 Khóa Luận Tốt Nghiệp TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH KHOA CƠNG NGHỆ THƠNG TIN NGÀNH KỸ THUẬT DỮ LIỆU - - KHÓA LUẬN TỐT NGHIỆP NGUYỄN HỮU NHẬT - 18133037 ĐỖ ĐÌNH PHÙNG - 18133040 ĐỀ TÀI: DỰ BÁO XU HƯỚNG CỦA CHỨNG KHỐN BẰNG MƠ HÌNH LAI GHÉP GIỮA PHƯƠNG PHÁP MÁY VECTOR HỖ TRỢ VÀ MẠNG NEURON NHÂN TẠO GIÁO VIÊN HƯỚNG DẪN: TS NGUYỄN THÀNH SƠN TP Hồ Chí Minh, tháng 12 năm 2022 Khóa Luận Tốt Nghiệp TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH KHOA CÔNG NGHỆ THÔNG TIN NGÀNH KỸ THUẬT DỮ LIỆU - - KHÓA LUẬN TỐT NGHIỆP NGUYỄN HỮU NHẬT - 18133037 ĐỖ ĐÌNH PHÙNG - 18133040 ĐỀ TÀI: DỰ BÁO XU HƯỚNG CỦA CHỨNG KHOÁN BẰNG MƠ HÌNH LAI GHÉP GIỮA PHƯƠNG PHÁP MÁY VECTOR HỖ TRỢ VÀ MẠNG NEURON NHÂN TẠO GIÁO VIÊN HƯỚNG DẪN: TS NGUYỄN THÀNH SƠN TP Hồ Chí Minh, tháng 12 năm 2022 Khóa Luận Tốt Nghiệp ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc Lập - Tự Do - Hạnh Phúc ******* ******* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ tên sinh viên 1: Nguyễn Hữu Nhật MSSV 1: 18133037 Họ tên sinh viên 2: Đỗ Đình Phùng MSSV 2: 18133040 Ngành: Kỹ thuật liệu Tên đề tài: DỰ BÁO XU HƯỚNG CỦA CHỨNG KHOÁN BẰNG MƠ HÌNH LAI GHÉP GIỮA PHƯƠNG PHÁP MÁY VECTOR HỖ TRỢ VÀ MẠNG NEURON NHÂN TẠO Họ tên Giáo Viên hướng dẫn: TS Nguyễn Thành Sơn NHẬN XÉT Về nội dung để tài khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đánh giá loại: Điểm: TP Hồ Chí Minh, tháng 12 năm 2022 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) Khóa Luận Tốt Nghiệp ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc Lập - Tự Do - Hạnh Phúc ******* ******* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ tên sinh viên 1: Nguyễn Hữu Nhật MSSV 1: 18133037 Họ tên sinh viên 2: Đỗ Đình Phùng MSSV 2: 18133040 Ngành: Kỹ thuật liệu Tên đề tài: DỰ BÁO XU HƯỚNG CỦA CHỨNG KHỐN BẰNG MƠ HÌNH LAI GHÉP GIỮA PHƯƠNG PHÁP MÁY VECTOR HỖ TRỢ VÀ MẠNG NEURON NHÂN TẠO Họ tên Giáo Viên phản biện: NHẬN XÉT Về nội dung để tài khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đánh giá loại: Điểm: TP Hồ Chí Minh, tháng 12 năm 2022 Giáo viên phản biện (Ký & ghi rõ họ tên) Khóa Luận Tốt Nghiệp LỜI CAM ĐOAN Tơi xin cam đoan rằng, khóa luận “Dự báo xu hướng chứng khốn mơ hình lai ghép phương pháp máy vector hỗ trợ mạng neuron nhân tạo” cơng trình nghiên cứu chúng tơi hướng dẫn TS.Nguyễn Thành Sơn, xuất phát từ nhu cầu thực tiễn nguyện vọng tìm hiểu thân Ngoại trừ kết tham khảo từ cơng trình khác ghi rõ khóa luận, nội dung trình bày luận văn kết nghiên cứu thực kết khóa luận chưa cơng bố trước hình thức TP Hồ Chí Minh, tháng 12 năm 2022 Tác giả Đỗ Đình Phùng Nguyễn Hữu Nhật Khóa Luận Tốt Nghiệp LỜI CẢM ƠN Qua thời gian học tập rèn luyện trường Đại học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh, bảo giảng dạy nhiệt tình q thầy khoa cơng nghệ thơng tin, thầy cô trường Đại Học Sư Phạm kỹ Thuật Thành Phố Hồ Chí Minh tạo điều kiện cho học tập kiến thức quý báu thời gian qua Đặc biệt TS Nguyễn Thành Sơn tận tình hướng dẫn giúp đỡ chúng tơi hồn thành báo cáo khóa luận tốt nghiệp Vì lực có hạn nên q trình làm báo cáo khó tránh sai sót, chúng tơi mong nhận nhận xét q giá thầy để khóa luận tốt nghiệp đạt hiệu cao Lời cuối xin chúc quý thầy cô khoa tất thầy cô trường Đại Học SPKT TP.HCM dồi sức khỏe thành công nghiệp cao quý đường giảng dạy để truyền tải kiến thức bổ ích đến tất sinh viên TP Hồ Chí Minh, tháng 12 năm 2022 Khóa Luận Tốt Nghiệp MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH MỤC BẢNG BIỂU DANH MỤC HÌNH MINH HOẠ DANH MỤC TỪ VIẾT TẮT PHẦN 1: MỞ ĐẦU 11 Tính cấp thiết đề tài 11 Mục tiêu đề tài 11 Nhiệm vụ đề tài 12 Đối tượng mục tiêu nghiên cứu .12 4.1 Đối tượng nghiên cứu 12 4.2 Phạm vi nghiên cứu 12 Phương pháp nghiên cứu 13 PHẦN 2: NỘI DUNG 14 CHƯƠNG 1: TỔNG QUAN VỀ THỊ TRƯỜNG CHỨNG KHỐN 14 1.1 Sự hình thành thị trường chứng khoán 14 1.2 Khái niệm thị trường chứng khoán .17 1.3 Đặc điểm chủ yếu thị trường chứng khoán 18 1.4 Chức thị trường chứng khoán .18 1.5 Vai trò thị trường chứng khốn 20 Khóa Luận Tốt Nghiệp 1.6 Các chủ thể tham gia thị trường chứng khoán 21 1.7 Sơ lược thị trường chứng khoán Việt Nam 24 CHƯƠNG 2: CHỨNG KHOÁN 27 2.1 Khái niệm chứng khoán 27 2.2 Đặc trưng chứng khoán 27 2.3 Phân loại chứng khoán 27 2.4 Chỉ số chứng khoán (index stock market) .30 2.5 Yếu tố tác động đến giá cổ phiếu 34 CHƯƠNG 3: DỰ BÁO 37 3.1 Khái niệm 37 3.2 Vai trò dự báo 37 3.3 Đặc điểm chung dự báo 38 3.4 Phân loại 39 3.5 Độ xác dự báo 41 3.6 Các bước trình dự báo .43 3.7 Xu hướng chứng khoán 44 3.8 Chuỗi thời gian 45 3.9 Dự báo chuỗi thời gian 49 CHƯƠNG 4: SUPPORT VECTOR MACHINE 53 4.1 Khái niệm tổng qt mơ hình Support Vector Machine (SVM) 53 4.2 Ưu nhược điểm SVM 56 4.3 Support Vector Regression (SVR) 56 4.4 Lựa chọn tham số mơ hình 57 4.5 Ứng dụng SVR vào dự báo .64 Khóa Luận Tốt Nghiệp 4.6 Mục đích tập liệu mơ hình 69 CHƯƠNG 5: ARTIFICIAL NEURAL NETWORK 70 5.1 Khái niệm tổng quát mơ hình Artificial Neural Network (ANN) 70 5.2 Mạng thần kinh nhân tạo với mạng thần kinh sinh học 71 5.3 Mơ hình ANN 72 5.4 Cấu tạo ứng dụng ANN 74 5.5 ANN hoạt động nào? 77 5.6 Quá trình huấn luyện ANN 78 5.7 Ứng dụng ANN vào dự báo 81 CHƯƠNG 6: AN HYBRID SVR AND LSTM 87 6.1 Khái niệm Hybrid model 87 6.2 Phương thức kết hợp .87 CHƯƠNG 7: CÀI ĐẶT DEMO VÀ THỰC NGHIỆM ĐÁNH GIÁ MƠ HÌNH 91 7.1 Môi trường liệu thực nghiệm .91 7.2 Cài đặt 94 7.3 Các trường hợp thực nghiệm 97 7.4 Nhận xét kết thực nghiệm tập liệu 117 PHẦN 3: KẾT LUẬN 118 Kết đạt .118 Hạn Chế 118 Hướng Phát Triển 118 TÀI LIỆU THAM KHẢO .119 Khóa Luận Tốt Nghiệp 109 Khóa Luận Tốt Nghiệp Nhận xét: Với kết thực nghiệp chạy tập liệu GOOGL với số nút mơ hình LSTM 64 nút cho thấy thời gian thực thi mơ hình hybid song song cho kết tốt so với mơ hình cịn lại Xét độ xác có phần tương đồng với mơ hình SVR ❖ Trường hợp 128 nút ẩn GOOGL 128 Model RMSE MAPE SVR 8.308804 0.047779 LSTM 21.12872 0.108851 301.699523 301.352815 0.346708 Hybrid song song 8.308787 0.047779 301.419331 301.352815 0.066516 Hybird SVR>LSTM Hybrid LSTM>SVR 6.847614 0.037021 346.980151 346.617438 0.362713 20.75361 0.096471 346.701704 346.617438 0.084265 110 Time (s) 45.339645 Time train Time predict (s) (s) 45.264623 0.075022 Khóa Luận Tốt Nghiệp Bảng 8: Kết thực nghiệm tập liệu GOOGL với 128 nút ẩn 111 Khóa Luận Tốt Nghiệp Nhận xét: Dựa vào kết bảng ta thấy tăng số nút ẩn lên 128 mơ hybrid song song cho thời gian thực thi tốt Trong mơ hình SVR mơ hình LSTM-SVR cho kết thời gian thực thi cải thiện tương đối so với trường hợp 64 nút ẩn phần lớn mơ hình lại cho thấy thời gian training tăng lên đáng kể 7.3.4 Tập liệu VNINDEX 112 Khóa Luận Tốt Nghiệp ❖ Trường hợp 64 nút ẩn Qua thực nghiệm tập liệu VNINDEX cho kết thể thời gian số để đánh giá độ xác mơ sau: Model SVR LSTM Hybrid song song Hybird SVR>LSTM Hybrid LSTM>SVR VNINDEX 64 Time Time train Time predict RMSE MAPE (s) (s) (s) 12.55746 0.007895 54.150284 54.10116 0.049124 20.88285 0.015573 191.265055 191.079926 0.185128 12.532614 0.007912 191.115873 191.079926 0.035947 14.800668 0.009527 245.365827 245.181087 0.18474 15.385889 0.010317 245.232537 245.181087 0.05145 Bảng 3: Kết thực nghiệm tập liệu VNINDEX với 64 nút ẩn 113 Khóa Luận Tốt Nghiệp Nhận xét: Với kết thực nghiệp chạy tập liệu VNINDEX với số nút mơ hình LSTM 64 nút cho thấy thời gian thực thi mơ hình hybid song song cho kết tốt so với mô hình cịn lại Xét độ xác cho kết tốt mơ hình khác ❖ Trường hợp 128 nút ẩn 114 Khóa Luận Tốt Nghiệp Model SVR LSTM Hybrid song song Hybird SVR>LSTM Hybrid LSTM>SVR 12.55746 0.007895 13.468707 0.008838 12.557448 0.007895 VNINDEX 128 Time Time train Time predict (s) (s) (s) 53.574838 53.527628 0.04721 199.98053 199.795913 0.184617 199.8484 199.795913 0.052487 14.43904 253.680346 253.323541 0.356805 19.964578 0.014329 253.380101 253.323541 0.05656 RMSE MAPE 0.0093 Bảng 4: Kết thực nghiệm tập liệu VNINDEX với 128 nút ẩn 115 Khóa Luận Tốt Nghiệp Nhận xét: Dựa vào kết bảng 10 ta thấy tăng số nút ẩn lên 128 mơ hybrid song song lại khơng cho thời gian thực thi nhanh tăng lên so với trường hợp 64 nút ẩn Trong mơ hình SVR cho thời gian thực thi tốt xét độ xác mơ hình hybrid cho số tốt, thời gian thực trình training cho kết có tăng so với trường hợp 64 nút ẩn khơng đáng kể 116 Khóa Luận Tốt Nghiệp 7.4 Nhận xét kết thực nghiệm tập liệu Sau thực nghiệm tập liệu bao gồm liệu chứng khống ngồi nước, tập liệu thực nghiệm qua hai trường hợp cho kết quả sau: ❖ Về thời gian thực thi Qua trường hợp thực nghiệm cho thấy, thời gian thực thi mơ hình phụ thuộc nhiều vào tập liệu, tập liệu nhỏ thời gian thực thi mơ hình khơng thay đổi nhiều, mơ hình Hybrid song song so với mơ hình khác đạt hiệu (nghĩa thời gian thực thi trường hợp với tập liệu khác cho thời gian thực thi nhanh xếp thứ hai sau mơ hình SVR) Tuy nhiên dự báo với số nút lớp ẩn 128 cho thấy thời gian training cao so với trường hợp số lớp ẩn 64 Khi dự báo tập liệu lớn chênh lệch thời gian mơ hình Hybrid song song so với mơ hình SVR-LSTM lớn Điều cho thấy mơ hình Hybrid cso thể ứng dụng nhiều lĩnh vực khác khơng riêng chứng khốn Mơ hình Hybrid nhanh mơ hình kết hợp giữ SVR LSTM trường hợp thực nghiệm ❖ Về độ xác Trong thực nghiệm sử dụng hai giá trị RMSE MAPE để đánh giá độ xác năm mơ hình dự báo Qua thực nghiệm cho thấy mơ hình Hybrid song song đa số cho kết dự báo lỗi thấp bốn mơ hình cịn lại mơ hình dự báo khơng cho kết tốt tập liệu lớn 117 Khóa Luận Tốt Nghiệp PHẦN 3: KẾT LUẬN Kết đạt - Nghiên cứu tổng quan số chứng khoán nước, phương pháp dự báo số chứng khoán - Nghiên cứu mạng nơ-ron nhân tạo mạng Long Short Term Memory (LSTM) - Nắm lý thuyết mơ hình như: Mơ hình Support Vector Regression (SVR), mơ hình Long Short Term Memory (LSTM) - Tìm hiểu thư viện python để xây dựng mạng LSTM – SVR sử dụng dự báo - Nghiên cứu sử dụng mô hình lai ghép song song hai mơ hình SVR LSTM Hạn Chế - Về mặt lý thuyết nắm mô hình, chưa sâu vào việc tìm hiểu chi tiết mơ hình - Về giao diện xây dựng tính bản, đề tài sâu vào việc mơ hình dự đốn chứng khốn giao diện website nên tính thẩm mĩ chưa đáp ứng nhu cầu mong muốn - Chưa thực nghiệm mơ hình tập liệu lớn Hướng Phát Triển - Về lý thuyết cần tìm hiểu kỹ mơ hình dự báo - Về ứng dụng mơ hình cần cải tiến thêm nhiều trường hợp để thấy hiệu mô hình đáp ứng nhu cầu hay chưa - Xây dựng website với giao diện dễ nhìn, dễ sử dụng cho người dùng 118 Khóa Luận Tốt Nghiệp TÀI LIỆU THAM KHẢO [1] VTV, “Kinh tế số Việt Nam tăng trưởng mạnh,” 07 01 2022 [Trực tuyến] Available: https://vtv.vn/kinh-te/kinh-te-so-viet-nam-tang-truong-manh- 20220107202134029.htm [2] T B Đ Hiển, “Thị Trường Chứng Khoán,” Giáo trình, Hà Nội, Nhà Xuất Bản Tài Chính, 2008 [3] P N C LTD, “khoán, Bản chất chức thị trường chứng,” Phương Nam Co LTD, 22 11 2014 [Trực tuyến] Available: http://vietnam12h.com/kinhte/chi-tiet-kinh-te.aspx?baivieturl=ban-chat-va-chuc-nang-cua-thi-truong-chungkhoan-22-11-2014 [Đã truy cập 17 05 2022] [4] wikipedia, “Chứng khoán,” wikipedia, 16 04 2012 [Trực tuyến] Available: https://vi.wikipedia.org/wiki/Ch%E1%BB%A9ng_kho%C3%A1n [Đã truy cập 24 04 2022] [5] N M LỢI, “DỰ ĐOÁN GIÁ CỔ PHIẾU BẰNG PHƯƠNG PHÁP HỌC,” TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT, Bình Dương, 2022 [6] H T Hằng, “Chỉ số index gì? Vấn đề liên quan đến index bạn cần quan tâm?,” timviec365, 04 11 2019 [Trực tuyến] Available: https://timviec365.vn/blog/index-la-gi-new6603.html [Đã truy cập 18 05 2022] [7] xStation5, “gì?, Giao dịch số - Chỉ số thị trường chứng khoán là,” Tập đoàn XTB, [Trực tuyến] Available: https://www.xtb.com/vn/dao-tao/giao-dich-chiso-chung-khoan-la-gi [Đã truy cập 18 2022] 119 Khóa Luận Tốt Nghiệp [8] U b c k n nước, “Phiếu, Phương pháp tính số giá cổ,” Uỷ ban chứng khoán nhà nước, 30 09 2004 [Trực tuyến] Available: http://www.ssc.gov.vn/ubck/faces/vi/vilinks/videtail/vichitietdaotao/vidskienthu cchungkhoan/vichitiet123?dDocName=APPSSCGOVVN162066605&_afrLoop =8363781778000&_afrWindowMode=0&_afrWindowId=2f9lomtw6_129#%40 %3F_afrWindowId%3D2f9lomtw6_129%26_afrLoop%3D83637 [Đã truy cập 18 05 2022] [9] vnexpress, “VN-Index, VN30-Index cách tính tốn,” vnexpress, [Trực tuyến] Available: https://vnexpress.net/vn-index-vn30-index-va-cach-tinh-toan- 4297351.html [Đã truy cập 19 05 2022] [10] VnExpress, "Yếu tố tác động đến giá cổ phiếu?," Bộ Khoa học Công nghệ, [Online] Available: https://vnexpress.net/yeu-to-nao-tac-dong-den-gia-co- phieu-4334093.html [Accessed 26 04 2022] [11] T Đ h k t k t c n Tài liệu học tập Quản trị sản xuất, “Dự báo gì? Vai trị, phân loại nhân tố tác động đến dự báo,” Lý Tưởng, 17 04 2022 [Trực tuyến] Available: https://lytuong.net/du-bao-la-gi/ [Đã truy cập 24 05 2022] [12] L ( Simister, "The Role of Forecasting - Managerial Finance, Vol No 1, pp 2-5," emerald publishing, 1 1981 [Online] Available: https://www.emerald.com/insight/content/doi/10.1108/eb013477/full/html [Accessed 24 05 2022] [13] T D Quang, "MƠ HÌNH CHUỖI THỜI GIAN DÙNG ĐỂ DỰ BÁO BIẾN ĐỘNG GIÁ CHỨNG KHOÁN VÀ ÁP DUNG VÀO THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM," BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐỌI HỌC NGOẠI THƯƠNG, HÀ NỘI, 2008 120 Khóa Luận Tốt Nghiệp [14] A HAYES, "What Is a Time Series?," investopedia, 04 04 2021 [Online] Available: https://www.investopedia.com/terms/t/timeseries.asp [Accessed 28 04 2022] [15] Markowitz, "H Portfolio selection[J]," The Journal of Finance, vol 7(1), pp 7791, 1952 [16] V Shao, "Senior Data Scientist," Senior Data Scientist, 15 09 2020 [Online] Available: https://www.bounteous.com/insights/2020/09/15/forecasting-time- series-model-using-python-part-two/ [Accessed 15 05 2022] [17] Wikipedia, "Support-vector machine," Wikipedia, 2022 [Online] Available: https://en.wikipedia.org/wiki/Support-vector_machine [Accessed 16 05 2022] [18] S T & S Panigrahi, "An SVM—ANN Hybrid Classifier for Diagnosis of Gear Fault," taylor & Francis online, pp 209-231, 02 05 2017 [19] data-flair, "Real-Life Applications of SVM (Support Vector Machines)," dataflair, [Online] Available: https://data-flair.training/blogs/applications-of-svm/ [Accessed 10 05 2022] [20] L M Trung, Giáo trình mạng neuron nhân tạo, Hà Nội: Nhà xuất thống kê, 1999 [21] R M A M R a A L Madhu B, "A Comparative Study of Support Vector Machine and Artificial Neural Network for Option Price Prediction," scientific research, vol 9, pp 78-91, 05 2021 [22] M T.Hagan, Neural Network Design, PWS Publishing Company, 1996 121 Khóa Luận Tốt Nghiệp [23] K A N, On the representation of continuous functions of many variables, vol 114, Russian, 1957, pp 953-956 [24] MBS, “20 năm vận hành Thị trường Chứng khoán Việt Nam, biểu đồ tăng trưởng,” mb securities, [Trực tuyến] Available: https://mbs.com.vn/trung-tamnghien-cuu/tin-tuc-thi-truong/thi-truong-ck/20-nam-van-hanh-thi-truong-chungkhoan-viet-nam-nhung-bieu-do-tang-truong/ [Đã truy cập 19 05 2022] [25] P Đ Khánh, “Dữ liệu chuỗi thời gian,” machinelearningcoban, 2021 [Trực tuyến] Available: https://machinelearningcoban.com/tabml_book/ch_data_processing/timeseries_d ata.html [Đã truy cập 24 05 2022] 122 S K L 0

Ngày đăng: 17/07/2023, 14:08

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w