1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Ứng dụng dự báo giá chứng khoán bằng mô hình lai ghép giữa bộ phân lớp đa thức và mô hình học sâu

80 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Dự Báo Giá Chứng Khoán Bằng Mô Hình Lai Ghép Giữa Bộ Phân Lớp Đa Thức Và Mô Hình Học Sâu
Tác giả Trần Văn Duy, Trần Công Trường
Người hướng dẫn TS. Nguyễn Thành Sơn
Trường học Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án Tốt Nghiệp
Năm xuất bản 2023
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 80
Dung lượng 6,22 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ THÔNG TIN ỨNG DỤNG DỰ BÁO GIÁ CHỨNG KHỐN BẰNG MƠ HÌNH LAI GHÉP GIỮA BỘ PHÂN LỚP ĐA THỨC VÀ MƠ HÌNH HỌC SÂU GVHD: TS NGUYỄN THÀNH SƠN SVTH : TRẦN VĂN DUY TRẦN CƠNG TRƯỜNG SKL011399 Tp Hồ Chí Minh, tháng 05/2023 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KỸ THUẬT DỮ LIỆU TRẦN VĂN DUY - 19133016 TRẦN CÔNG TRƯỜNG - 19133062 Đề tài: ỨNG DỤNG DỰ BÁO GIÁ CHỨNG KHOÁN BẰNG MƠ HÌNH LAI GHÉP GIỮA BỘ PHÂN LỚP ĐA THỨC VÀ MƠ HÌNH HỌC SÂU GIÁO VIÊN HƯỚNG DẪN TS NGUYỄN THÀNH SƠN TP.HCM, THÁNG 5/2023 ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh phúc ******* ********* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ tên Sinh viên 1: Trần Văn Duy MSSV: 19133016 Họ tên Sinh viên 2: Trần Công Trường MSSV: 19133062 Ngành: Kỹ thuật liệu Tên đề tài: Ứng dụng dự báo giá chứng khốn mơ hình lai ghép phân lớp đa thức mơ hình học sâu Họ tên Giáo viên hướng dẫn: TS.Nguyễn Thành Sơn NHẬN XÉT: Về nội dung thực hiện: ………………………………………………………………………………………… ………………………………………………………………………………………… ………… Ưu điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ……………… Khuyết điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ……………… Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày … tháng … năm 2023 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) iii ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh phúc ******* ********* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ tên Sinh viên 1: Trần Văn Duy MSSV: 19133016 Họ tên Sinh viên 2: Trần Công Trường MSSV: 19133062 Ngành: Kỹ thuật liệu Tên đề tài: Ứng dụng dự báo giá chứng khốn mơ hình lai ghép phân lớp đa thức mơ hình học sâu Họ tên Giáo viên phản biện: NHẬN XÉT: Về nội dung thực hiện: ………………………………………………………………………………………… ………………………………………………………………………………………… ………… Ưu điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………… Khuyết điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………… Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày … tháng … năm 2023 Giáo viên phản biện (Ký & ghi rõ họ tên) iv LỜI CẢM ƠN Chúng tơi xin bày tỏ lịng biết ơn đến q Thầy Cô theo dõi, hướng dẫn hỗ trợ suốt thời gian thực đề tài Đầu tiên, có mơi trường học tập chất lượng hiệu để chúng tơi có mơi trường tốt thời gian thực nghiên cứu đề tài, xin gửi lời cảm ơn đến Ban giám hiệu trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh Ngồi ra, chúng tơi xin gửi lời cảm ơn đến Ban chủ nhiệm khoa Công nghệ Thông tin Thầy Cô khoa Công nghệ Thông tin tận tâm dạy suốt năm tháng đại học vừa qua, để chúng tơi có sở kiến thức cần thiết để thực tốt đề tài suốt trình học tập làm việc trường Cuối cùng, xin gửi lời cảm ơn chân thành đến thầy Nguyễn Thành Sơn - Giáo viên hướng dẫn khóa luận tốt nghiệp – Khoa Công nghệ Thông tin – Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh, quan tâm, hướng dẫn, góp ý tận tình dạy suốt thời gian thực nghiên cứu Đề tài chúng tơi khó lịng tránh khỏi hạn chế sai sót định, kính mong Thầy cô bỏ qua mong nhận đóng góp bảo thêm từ Thầy Cơ để rút kinh nghiệm sau Xin chân thành cảm ơn! v MỤC LỤC LỜI CẢM ƠN v MỤC LỤC vi DANH MỤC HÌNH ẢNH viii ĐỀ CƯƠNG KHÓA LUẬN TỐT NGHIỆP x KẾ HOẠCH THỰC HIỆN xi Phần 1: 1 Tính cấp thiết đề tài Error! Bookmark not defined Mục đích đề tài Error! Bookmark not defined Đối tượng phạm vi nghiên cứu Error! Bookmark not defined Dự kiến kết đạt Error! Bookmark not defined Phần 2: NỘI DUNG CHƯƠNG 1: TỔNG QUAN VỀ CHỨNG KHOÁN VÀ THỊ TRƯỜNG CHỨNG KHOÁN 1.1 Tổng quan chứng khoán Error! Bookmark not defined 1.1.1 Khái niệm chứng khoán 1.1.2 Đặc điểm chứng khoán 1.1.3 Cổ phiếu 1.1.4 Trái phiếu 1.2 Tổng quan thị trường chứng khoán 1.2.1 Khái niệm thị trường chứng khoán 1.2.2 Các loại thị trường chứng khoán 1.3 Các khái niệm đặc trưng liên quan đến chứng khoán 1.4 Phương thức khớp lệnh 1.4.1 Khái niệm 1.4.2 Nguyên tắc khớp lệnh CHƯƠNG 2: BỘ PHÂN LỚP ĐA THỨC VÀ ỨNG DỤNG TRONG DỰ BÁO CHỨNG KHOÁN 10 2.1 Bộ phân thức đa lớp 10 2.1.1 Tổng quan đa thức 10 2.1.2 Tổng quan phân lớp đa thức 10 2.2 Ứng dựng phân lớp đa thức dự báo chứng khoán 11 vi 2.3 Cài đặt 17 2.3.1 Các thư viện 17 2.3.2 Các hàm tham số 17 CHƯƠNG 3: CÁC MƠ HÌNH HỌC SÂU VÀ ỨNG DỤNG TRONG DỰ BÁO CHỨNG KHOÁN 22 3.1 Các mơ hình học sâu 22 3.1.1 Mơ hình Recurrent Neural Network (RNN) 22 3.1.2 Mơ hình Long Short-Term Memory (LSTM) 24 3.1.3 Mơ hình Gated Recurrent Unit (Gate Recurrent Unit) 31 3.2 Ứng dụng dự báo chứng khoán 35 3.2.1 Giai đoạn Training 35 3.2.2 Giai đoạn testing 41 CHƯƠNG 4: MƠ HÌNH LAI GHÉP GIỮA POLYNOMIAL CLASSIFER VÀ MƠ HÌNH HỌC SÂU 44 4.1 Lai ghép theo mơ hình cộng 44 4.1.1 Khái niệm 44 4.1.2 Q trình tạo mơ hình lai ghép 45 4.2 Lai ghép song song 45 4.2.1 Khái niệm 45 4.2.2 Q trình tạo mơ hình lai ghép 46 CHƯƠNG 5: ĐÁNH GIÁ VÀ THỰC NGHIỆM 48 5.1 Môi trường thực nghiệm 48 5.2 Các tập liệu thực nghiệm 48 5.2.1 Tập liệu XRX 48 5.2.2 Tập liệu DXC 50 5.3 Các tiêu chí đánh giá 54 5.3.1 Độ xác 54 5.4 Các trường hợp thực nghiệm 55 5.5 Kết thực nghiệm 56 Phần 3: KẾT LUẬN 65 Kết đạt Error! Bookmark not defined Hạn chế Error! Bookmark not defined Hướng phát triển Error! Bookmark not defined Tài liệu tham khảo 67 vii DANH MỤC HÌNH ẢNH Hình 2.1: Ma trận X 11 Hình 2.2: Ma trận T 11 Hình 2.3: Các vector xi tương ứng với ma trận X 12 Hình 2.4: Các vector xi khải triển dạng đa thức bậc 13 Hình 2.5: Ma trận M 13 Hình 2.6: Triển khai phép tính MTM 14 Hình 2.7: Triển khai ma trận W 14 Hình 2.8: Triển khai ma trận Tz 15 Hình 2.9: Ví dụ triển khai ma trận X 16 Hình 2.10: Ví dụ triển khai ma trận T 16 Hình 2.11: Ví dụ triển khai xi dạng đa thức bậc 16 Hình 2.12: Ví dụ ma trận M 17 Hình 2.13: Ví dụ ma trận W 17 Hình 2.14: Ví dụ ma trận Tz 17 Hình 2.15: Hàm convertData 18 Hình 2.16: Hàm convertData 18 Hình 2.17: Hàm twoOrderPoly 19 Hình 2.18: 18Hàm model 20 Hình 2.19: Hàm Predict 21 Hình 3.1: Cấu trúc mạng RNN 22 Hình 3.2: Cấu trúc mạng LSTM 25 Hình 3.3: Q trình tính tốn lượng thông tin giữ lại nhớ dài hạn 26 Hình 3.4: Q trình tính tốn lượng thơng tin thêm vào nhớ dài hạn 27 Hình 3.5: Q tình tính tốn lại nhớ dài hạn 28 Hình 3.6: Q trình tính trạng thái ẩn 28 Hình 3.7: Cấu trúc mạng GRU 32 Hình 3.8: Quá trình hoạt động GRU 32 Hình 3.9: Mơ trình cài đặt giai đoạn training 38 Hình 3.10: Hàm prepareTrainData 40 Hình 3.11: Hàm buildModelRNN 40 Hình 3.12: Hàm buildModelLSTM 40 Hình 3.13: Hàm buildModelGRU 41 Hình 3.14: Hàm trainingTrainData 41 Hình 3.15:Mơ q trình cài đặt giai đoạn testing 42 Hình 3.16: Hàm predict_DL 43 Hình 4.1: Mơ hình lai ghép 44 Hình 4.2: Mơ hình lai ghép song song 46 Hình 5.1: Tổng qua tập liệu XRX 48 Hình 5.2: Biểu đồ thể phân bố giá cổ phiếu tập liệu XRX 49 Hình 5.3: Tổng qua tập liệu DXC 50 Hình 5.4: Biểu đồ thể phân bố giá cổ phiếu tập liệu DXC 51 viii Hình 5.5: Tổng qua tập liệu ARNX 51 Hình 5.6: Biểu đồ thể phân bố giá cổ phiếu tập liệu ARNX 52 Hình 5.7: Tổng qua tập liệu DCO 53 Hình 5.8: Biểu đồ thể phân bố giá cổ phiếu tập liệu DCO 54 Hình 5.9: Cơng thức tính MSE 54 Hình 5.10: Cơng thức tính RMSE 55 Hình 5.11: Cơng thức tính MAE 55 Hình 5.12: Cơng thức tính MAPE 55 ix ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh phúc ******* ********* ĐỀ CƯƠNG KHÓA LUẬN TỐT NGHIỆP Họ tên SV thực hiện: Trần Văn Duy MSSV: 19133016 Họ tên SV thực hiện: Trần Công Trường MSSV: 19133062 Thời gian làm tiểu luận: 30/01/2023 Đến: 12/05/2023 Chuyên ngành: Kỹ Thuật Dữ Liệu Tên đề tài: Ứng dụng dự báo giá chứng khoán mơ hình lai ghép phân lớp đa thức mơ hình học sâu Họ tên Giáo viên hướng dẫn: TS Nguyễn Thành Sơn Nhiệm vụ: Tìm hiểu chứng khoán thị trường chứng khoán Tìm hiểu đa thức phân lớp đa thức áp dụng vào dự đoán chứng khoán Tìm hiểu mơ hình học sâu Tìm hiểu mơ hình lai ghép phân lớp đa thức kết hợp với mơ hình học sâu Xây dựng demo dự đốn chứng khốn dùng mơ hình lai ghép phân lớp đa thức kết hợp với mơ hình học sâu x Hình 5.10: Cơng thức tính RMSE MAE: MAE đo độ lớn trung bình sai số tập hợp dự đoán cách tính tốn giá trị trung bình khác biệt tuyệt đối dự đoán giá trị thực tế mẫu thử nghiệm, với sai số có trọng số So với MSE, MAE cho mạnh việc xử lý giá trị ngoại lai, MSE tính tốn bình phương sai số, làm tăng ảnh hưởng giá trị ngoại lai ảnh hưởng đến tham số mơ hình Hình 5.11: Cơng thức tính MAE MAPE: Mean Absolute Percent Error(MAPE) Trung bình độ lệch tương đối MAPE tính đến độ lớn tương đối độ lệch dự báo so với độ lớn giá trị thực, mô hình có Trung bình độ lệch tương đối MAPE nhỏ dự báo xác Hình 5.12: Cơng thức tính MAPE 5.4 Các trường hợp thực nghiệm Các trường hợp thực nghiệm sau thực mơ hình học sâu lớp input, lớp ẩn lớp output Số noron lớp input chọn cố định 30 (1 tháng), số noron lớp output Trường hợp 1: Chọn lựa mơ hình tốt thay đổi số noron lớp ẩn từ 50 tới 70 step = chạy tập liệu Trường hợp 2: So sánh mơ hình (PC,RNN,GRU,LSTM,tuantu,songsong) với số noron lớp ẩn chọn cố định từ trường hợp So sánh độ xác thời gian thực thi 55 5.5 Kết thực nghiệm Trường hợp 1: Chọn lựa mơ hình tốt thay đổi số noron lớp ẩn từ 50 tới 70 step = chạy tập liệu Kết sai số mơ hình RNN tập liệu với số noron lớp ẩn từ 50 tới 70 Tập liệu ARNC Model Số_Noron MSE RMSE MAE MAPE RNN 55 0.27963 0.528801 0.361856 0.014752 GRU 65 0.28567 0.578801 0.361856 0.014752 LSTM 55 0.26679 0.548955 0.361856 0.014752 Nhận xét: - RNN có giá trị MSE, RMSE MAE tương đối cao so với LSTM GRU, cho thấy mơ hình có sai lệch lớn việc dự đoán giá chứng khoán Tuy nhiên, MAPE RNN thấp, mức 0.014752, cho thấy tỷ lệ lỗi trung bình mơ hình thấp - GRU có giá trị MSE RMSE cao so với LSTM, nhiên, giá trị MAE MAPE GRU không khác biệt so với LSTM Điều cho thấy GRU có hiệu dự đốn tương đương với LSTM, có mức độ phức tạp mạng nơ-ron cao với 65 neurons - LSTM có giá trị MSE, RMSE MAE thấp ba mơ hình, cho thấy có hiệu suất dự đoán tốt so với RNN GRU Mặc dù LSTM sử dụng số lượng neurons với RNN, giá trị MSE RMSE LSTM thấp hơn, cho thấy mơ hình có khả dự đốn xác Tập liệu DCO Model Số Noron MSE RMSE RNN 52 0.654584489 0.809063958 0.434209348 0.017852116 GRU 52 0.663852984 0.818398195 0.424029333 0.017984931 56 MAE MAPE LSTM 56 0.659283389 0.800367487 0.461863741 0.017232322 Nhận xét: - RNN LSTM có giá trị MSE RMSE tương đối gần nhau, GRU có giá trị MSE RMSE cao so với hai mơ hình Điều cho thấy RNN LSTM có khả dự đốn tương đương hiệu so với GRU trường hợp - GRU có giá trị MAE thấp ba mơ hình, cho thấy mơ hình có khả dự đốn gần với giá thực tế Tuy nhiên, giá trị MAPE GRU cao so với RNN LSTM, cho thấy tỷ lệ lỗi trung bình mơ hình cao - LSTM có giá trị MAE cao ba mơ hình, cho thấy mơ hình có sai lệch lớn việc dự đoán giá chứng khoán Tuy nhiên, giá trị MAPE LSTM thấp so với RNN, cho thấy tỷ lệ lỗi trung bình mơ hình thấp Tập liệu DXC Model Số Noron MSE RMSE MAE MAPE RNN 69 0.570746 0.752324 0.444746 0.015475 GRU 60 0.570556 0.782542 0.444647 0.016234 LSTM 62 0.582936 0.763625 0.442377 0.015672 Nhận xét:RNN, GRU LSTM có giá trị MSE RMSE tương đối gần nhau, chênh lệch lớn mơ hình - RNN, GRU LSTM có giá trị MAE tương đương, cho thấy mơ hình có khả dự đốn tương đương độ xác tương tự với - GRU có giá trị MAPE cao ba mơ hình, cho thấy tỷ lệ lỗi trung bình mơ hình cao so với RNN LSTM Tuy nhiên, chênh lệch giá trị MAPE không lớn 57 Tập liệu XRX Model Số_Noron MSE RMSE MAE MAPE RNN 52 2.623455 1.612989 1.004141 0.010642 GRU 55 2.601735 1.612345 1.012361 0.024562 LSTM 60 2.603462 1.614784 1.013625 0.017556 Nhận xét: - RNN, GRU LSTM có giá trị MSE, RMSE MAE tương đối cao, cho thấy mơ hình khơng dự đốn xác giá chứng khốn trường hợp - RNN có giá trị MAPE thấp ba mơ hình, mức 0.010642, cho thấy tỷ lệ lỗi trung bình mơ hình thấp so với GRU LSTM - GRU có giá trị MAPE cao ba mơ hình, mức 0.024562, cho thấy tỷ lệ lỗi trung bình mơ hình cao đáng kể so với RNN LSTM 58 Trường hợp 2: So sánh mơ hình (PC,RNN,GRU,LSTM,tuantu,songsong) với số noron lớp ẩn chọn cố định từ trường hợp So sánh độ xác thời gian thực thi Tập liệu XRX model PC MSE RMSE MAE MAPE Thời gian Thời gian train test 251313.7 501.3120 364.0424 2.618408 2.984416 123.9477 646 431 24 388 246 744 3.070123 1.752176 1.166252 0.012616 0.201365 33.29062 201 704 966 052 709 08 2.673729 1.635154 1.034686 0.011110 0.391250 68.23541 863 385 788 361 849 522 3.144979 1.773409 1.290883 0.025605 0.438135 66.79601 775 083 796 478 862 86 Tuần tự 26055.42 161.4169 116.4524 0.650446 127.2504 20.61367 PC RNN 02 142 771 778 134 989 Tuần tự 2636.711 51.34892 32.55679 0.178497 128.0922 42.69308 PC GRU 86 268 771 351 799 233 Tuần tự 853.7860 29.21961 20.65247 0.118451 128.4068 42.50061 PC LSTM 831 812 343 529 003 417 song song 2.553736 1.598041 1.066302 0.015397 128.0806 32.66371 PC RNN 871 574 741 853 518 107 song song 2.779910 1.667306 1.111542 0.015148 128.8259 66.48371 PC GRU 513 365 64 431 277 911 song song 3.936250 1.983998 1.539214 0.027833 128.7249 64.97817 PC LSTM 267 555 053 096 203 278 RNN GRU LSTM Nhận xét: 59 - Mơ hình tốt sai số tổng quan: Trong mơ hình đơn lẻ, GRU cho thấy hiệu suất tốt với giá trị MSE, RMSE MAE thấp Điều cho thấy GRU có khả dự đốn gần với giá thực tế mơ hình - Mơ hình tốt sai số tương đối: Khi xét đến sai số tương đối (MAPE), mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) cho thấy hiệu suất tốt so với mơ hình đơn lẻ Trong số đó, PCGRU có giá trị MAPE thấp nhất, mức 0.178497351 Điều cho thấy mơ hình kết hợp PCGRU có tỷ lệ lỗi trung bình thấp khả dự đốn tương đối xác - Mơ hình tốt thời gian huấn luyện dự đoán: Khi xét đến thời gian huấn luyện dự đốn, mơ hình đơn lẻ RNN có thời gian huấn luyện dự đốn thấp số mơ hình đơn lẻ Tuy nhiên, mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) có thời gian huấn luyện dự đốn cao phức tạp mơ hình Tập liệu ARNC model MSE RMSE MAE MAPE Thời Thời gian train gian test PC 280.3867 16.74475 16.62941 0.672613 1.063251 15.50238 RNN 0.331808 0.576028 0.409595 0.016581 0.112131 11.9794 GRU 0.308437 0.555371 0.391388 0.015819 0.357973 25.26217 LSTM 0.490785 0.70056 Tuần tự PC 0.294882 0.543031 0.348711 0.015499 16.88849 8.002239 0.482428 0.018091 0.389865 24.41597 RNN Tuần tự PC 0.29635 0.544381 0.362409 0.01592 16.79838 16.14889 GRU Tuần tự PC 0.287065 0.535784 0.34963 0.015411 17.10847 16.26524 LSTM song song PC 0.360694 0.600578 0.441711 0.018322 16.56382 11.67959 RNN 60 song song PC 0.304496 0.551811 0.387509 0.015681 16.90713 24.8594 GRU song song PC 0.29195 0.540324 0.375753 0.015223 16.89239 24.16948 LSTM Nhận xét: - Mơ hình tốt sai số tổng quan: Trong mơ hình đơn lẻ, GRU cho thấy hiệu suất tốt với giá trị MSE, RMSE MAE thấp Điều cho thấy GRU có khả dự đốn gần với giá thực tế mơ hình - Mơ hình tốt sai số tương đối: Khi xét đến sai số tương đối (MAPE), mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) cho thấy hiệu suất tốt so với mơ hình đơn lẻ Trong số đó, PCLSTM có giá trị MAPE thấp nhất, mức 0.015411 Điều cho thấy mơ hình kết hợp PCLSTM có tỷ lệ lỗi trung bình thấp khả dự đốn tương đối xác - Mơ hình tốt thời gian huấn luyện dự đoán: Khi xét đến thời gian huấn luyện dự đốn, mơ hình đơn lẻ RNN có thời gian huấn luyện dự đốn thấp số mơ hình đơn lẻ Tuy nhiên, mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) có thời gian huấn luyện dự đốn cao phức tạp mơ hình 61 Tập liệu DXC model MSE RMSE MAE MAPE Thời Thời gian train gian test PC 12751.14 112.921 54.30104 1.133952 2.603723 83.50339 RNN 1.055513 1.027382 0.587929 0.018013 0.296692 27.27446 GRU 0.759273 0.871363 0.523293 0.017557 0.385569 55.98871 LSTM 1.143223 1.069216 0.649274 0.020733 0.426757 54.52703 Tuần tự PC 3624.534 60.2041 27.68259 0.382745 86.10072 16.7293 RNN Tuần tự PC 579.611 24.07511 11.3248 0.163421 86.94858 35.19797 GRU Tuần tự PC 829.8469 28.80706 12.32358 0.169064 87.09008 34.51247 LSTM song song PC 0.726763 0.852504 0.57022 0.021642 87.30895 27.30007 RNN song song PC 0.696355 0.834479 0.505006 0.018032 86.98999 56.33542 GRU song song PC 0.84144 0.917301 0.567916 0.019837 87.27731 52.25252 LSTM Nhận xét: - Mơ hình tốt sai số tổng quan: Trong mô hình đơn lẻ, GRU cho thấy hiệu suất tốt với giá trị MSE, RMSE MAE thấp Điều cho thấy GRU có khả dự đốn gần với giá thực tế mơ hình - Mơ hình tốt sai số tương đối: Khi xét đến sai số tương đối (MAPE), mô hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) cho thấy hiệu suất tốt so với mơ hình đơn lẻ Trong số đó, PCGRU có giá trị MAPE thấp nhất, mức 0.163421 Điều cho thấy mơ hình kết hợp PCGRU có tỷ lệ lỗi trung bình thấp khả dự đốn tương đối xác - Mơ hình tốt thời gian huấn luyện dự đoán: Khi xét đến thời gian huấn luyện dự đốn, mơ hình đơn lẻ GRU có thời gian huấn luyện dự đốn thấp 62 số mơ hình đơn lẻ Tuy nhiên, mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) có thời gian huấn luyện dự đoán cao phức tạp mơ hình Tập liệu DCO model MSE RMSE MAE MAPE time_train time_test PC 193.0486 13.89419 8.69582 RNN 0.671239 0.819292 0.490308 0.020057 0.107554 11.58597 GRU 0.655903 0.809878 0.468615 0.018385 0.339498 24.84046 LSTM 0.69793 24.44132 Tuần tự 18.33215 4.281606 2.636503 0.064516 16.83457 7.61767 15.50195 3.937252 2.502028 0.061706 16.93174 16.60053 36.62273 6.051671 3.522473 0.084951 16.96743 15.81665 0.299267 1.10821 0.835422 0.481741 0.018757 0.391864 15.63248 PC_RNN Tuần tự PC GRU Tuần tự PC LSTM song song PC 0.708394 0.841662 0.513922 0.0208 16.74673 11.89761 song song PC 0.653833 0.808599 0.466079 0.018506 17.23636 24.86748 RNN GRU song song PC 0.651166 0.806949 0.457799 0.01797 16.94211 24.13733 LSTM Nhận xét: - Mơ hình tốt sai số tổng quan: Trong mơ hình đơn lẻ, GRU cho thấy hiệu suất tốt với giá trị MSE, RMSE MAE thấp Điều cho thấy GRU có khả dự đốn gần với giá thực tế mơ hình - Mơ hình tốt sai số tương đối: Khi xét đến sai số tương đối (MAPE), mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) cho thấy hiệu suất tốt so với mơ hình đơn lẻ Trong số đó, PCGRU có giá trị MAPE thấp nhất, mức 0.061706 Điều cho thấy mô hình kết 63 hợp PCGRU có tỷ lệ lỗi trung bình thấp khả dự đốn tương đối xác - Mơ hình tốt thời gian huấn luyện dự đoán: Khi xét đến thời gian huấn luyện dự đốn, mơ hình đơn lẻ RNN có thời gian huấn luyện dự đốn thấp số mơ hình đơn lẻ Tuy nhiên, mơ hình kết hợp phân lớp đa thức mạng nơ-ron (tự song song) có thời gian huấn luyện dự đoán cao phức tạp mơ hình 64 Phần 3: KẾT LUẬN Kết đạt Dự đoán gần giá chứng khốn: Mục tiêu trang web dự đốn giá chứng khốn với mức độ xác cao Bằng cách kết hợp phân lớp đa thức (Polynomial Classifier) mơ hình học sâu mạng nơ-ron, LSTM (Long Short-Term Memory), GRU (Gated Recurrent Unit )và RNN ( Recurrent Neural Network) chúng em tạo mơ hình dự đốn mạnh mẽ có khả học từ liệu lịch sử dự đoán giá chứng khoán tương lai Ứng dụng thực tế hữu ích: Trang web dự đốn giá chứng khốn cung cấp dự đốn có tính ứng dụng thực tế cho nhà đầu tư nhà giao dịch Thông qua giao diện đơn giản dễ sử dụng, người dùng truy cập tìm hiểu dự đốn giá chứng khốn cho công ty cổ phần quan trọng Điều giúp họ đưa định đầu tư thơng minh tối ưu hóa lợi nhuận Hạn chế Mơ hình cịn đơn giản, chưa kết hợp yếu tố khác thị trường Một hạn chế đáng lưu ý mô đơn giản hóa việc xem xét yếu tố ảnh hưởng đến giá chứng khốn Các mơ hình xem xét biến đầu vào cố định giá trị cổ phiếu, bỏ qua nhiều yếu tố quan trọng khác thông tin kiện, xu hướng thị trường lớn, tình hình kinh tế Độ xác có chênh lệch lớn mơ hình với Mơ hình học sâu mơ hình phân lớp đa thức gặp phải chênh lệch lớn độ xác mơ hình khác Một mơ hình đạt độ xác cao liệu huấn luyện, lại áp dụng tốt liệu Sự kết hợp nhiều mơ hình chưa đem lại hiệu cao Việc kết hợp nhiều mơ hình dự đốn giá chứng khốn để cải thiện độ xác ổn định dự đoán thách thức mơ hình học sâu Mặc dù có kết hợp mơ hình phân lớp đa thức (Polynomial Classifier) mơ hình học sâu dựa đặc tính mơ hình dự đốn điểm liệu tuyến tính dự dốn điểm liệu phi tuyến tính Nhưng kết kết hợp chưa đem lại hiệu cao so với mơ hình riêng lẻ 65 Thời gian huấn luyện lâu Mơ hình học sâu thường địi hỏi thời gian huấn luyện lâu phức tạp kích thước mạng nơ-ron Q trình huấn luyện mơ hình kéo dài đến vài tiếng, tùy thuộc vào khối lượng liệu phức tạp mơ hình Thời gian huấn luyện dài tạo hạn chế việc phát triển thử nghiệm nhanh chóng phiên mơ hình làm chậm q trình tối ưu hóa Hướng phát triển Cải tiến phân lớp đa thức Bộ phân lớp đa thức phương pháp truyền thống dự đoán giá chứng khoán Chúng em cải tiến phân lớp đa thức để đem lại hiệu cao Điều bao gồm việc tăng cường khả tùy chỉnh biến số phân lớp đa thức, cho phép điều chỉnh tham số cho phù hợp với trường hợp liệu cụ thể Chúng em nghiên cứu phương pháp tối ưu hóa để tìm tham số tối ưu cho phân lớp đa thức Kết hợp thêm nhiều mơ hình học sâu khác Mơ hình học sâu chứng tỏ mạnh mẽ việc dự đoán giá chứng khoán Do chúng em kết hợp thêm nhiều mơ hình học sâu khác để tăng cường khả dự đốn giảm phụ thuộc vào mơ hình Chúng tơi nghiên cứu thử nghiệm kiến trúc mơ hình khác Mạng nơ-ron tích chập (CNN), Mạng nơ-ron tích chập 2D (2D CNN), mơ hình chuỗi thời gian (ARIMA)… để đánh giá hiệu suất mơ hình kết hợp chúng cách tối ưu Sử dụng liệu phân tán công cụ xử lý liệu phân tán Để tăng hiệu suất thực thi giảm thời gian huấn luyện dự đoán, chúng em sử dụng hệ liệu phân tán công cụ xử lý liệu phân tán Pyspark Bằng cách xử lý liệu nhiều nút tính tốn song song, chúng tơi nhanh chóng huấn luyện mơ hình tập liệu lớn thực dự đoán liệu cách hiệu Phát triển trang web máy chủ đám mây Điều cho phép người dùng truy cập vào giao diện dự đoán giá chứng khốn từ thiết bị có kết nối Internet Chúng em triển khai ứng dụng dịch vụ đám mây Amazon Web Services Microsoft Azure để đảm bảo ổn định mở rộng hệ thống 66 Tài liệu tham khảo [1] L M Trường, 07 03 2023 [Online] Available: https://luatminhkhue.vn/chung-khoan-la-gi.aspx [2] N V Phi, "Chứng khốn gì? Đặc điểm chứng khoán," 25 05 2022 [Online] Available: https://luathoangphi.vn/chung-khoan-la-gi/#Ban_chat_chung_khoan [3] "Cổ phiếu gì? Phân loại, đặc điểm lưu ý đầu tư," 04 01 2023 [Online] Available: https://stockinsight.hsc.com.vn/co-phieu-la-gi/#co-nhung-loai-co-phieu-nao [4] L M Trường, "Trái phiếu ? Đặc điểm, phân loại trái phiếu ? Phân biệt trái phiếu cổ phiếu," 27 06 2022 [Online] Available: https://luatminhkhue.vn/trai-phieu-la-gi -khai-niemtrai-phieu-duoc-hieu-nhu-the-nao .aspx [5] T Trần, "Thị trường chứng khốn gì?," 01 03 2023 [Online] Available: https://govalue.vn/thitruong-chung-khoan-la-gi/ [6] T Anfin, "Khớp lệnh gì? Nguyên tắc khớp lệnh thực nào?," 20 09 2022 [Online] Available: https://www.anfin.vn/blog/khop-lenh-la-gi [7] wikipedia, "Đa thức," 06 05 2023 [Online] Available: https://vi.wikipedia.org/wiki/%C4%90a_th%E1%BB%A9c [8] Khaled Assaleh, Hazim El-Baz, Saeed Al-Salkhadi, "Predicting Stock Prices Using Polynomial Classifiers: The Case of Dubai Financial Market," p Predicting Stock Prices Using Polynomial Classifiers: The Case of Dubai Financial Market., 10 12 2010 [9] A Biswal, "Recurrent Neural Network(RNN) Tutorial," 10 04 2022 [Online] Available: https://www.simplilearn.com/tutorials/deep-learning-tutorial/rnn [10] "Recurrent Neural Network Tutorial (RNN)," 03 2022 [Online] Available: https://www.datacamp.com/tutorial/tutorial-for-recurrent-neural-network [11] D Blog, "Recurrent Neural Networks Tutorial, Part – Introduction to RNNs," 17 09 2015 [Online] Available: https://dennybritz.com/posts/wildml/recurrent-neural-networks-tutorial-part1/ [12] P Pedamkar, "Recurrent Neural Networks (RNN)," 2015 [Online] Available: https://www.educba.com/recurrent-neural-networks-rnn/ [13] phamdinhkhanh, "Bài - Lý thuyết mạng LSTM part 2," 22 04 2019 [Online] Available: https://phamdinhkhanh.github.io/2019/04/22/Ly_thuyet_ve_mang_LSTM.html [14] T L Team, "What are the advantages and disadvantages of using long short-term memory (LSTM) cells over simple RNN cells?," 2023 [Online] Available: https://www.linkedin.com/advice/1/what-advantages-disadvantages-using-long-short-term [15] C P Van, "GRU - Mạng Neural hồi tiếp với nút có cổng," 08 05 2021 [Online] Available: https://viblo.asia/p/gru-mang-neural-hoi-tiep-voi-nut-co-cong-3P0lPGevZox 67 [16] V Lendave, "LSTM Vs GRU in Recurrent Neural Network: A Comparative Study," 21 08 2021 [Online] Available: https://analyticsindiamag.com/lstm-vs-gru-in-recurrent-neural-network-acomparative-study/ [17] "Descending into ML: Training and Loss," 18 07 2022 [Online] Available: https://developers.google.com/machine-learning/crash-course/descending-into-ml/training-andloss [18] Asilla, "Dataset vai trò quan trọng Machine Learning," 2022 [Online] Available: https://technology.asilla.vn/techblog/tam-quan-trong-cua-dataset-trong-machinelearning#:~:text=Training%20data%20(ho%E1%BA%B7c%20training%20dataset,60%25%20t% E1%BB%95ng%20s%E1%BB%91%20d%E1%BB%AF%20li%E1%BB%87u [19] T V Huu, "Bài 15: Overfitting," 04 03 2017 [Online] Available: https://machinelearningcoban.com/2017/03/04/overfitting/ [20] AWS, "Làm để ngăn ngừa tượng khớp?," 2023 [Online] Available: https://aws.amazon.com/vi/what-is/overfitting/ [21] N T Chung, "Các câu hỏi thường gặp lĩnh vực Deep Learning," 2023 [Online] Available: https://www.thegioimaychu.vn/blog/ai-hpc/cac-cau-hoi-thuong-gap-trong-linh-vuc-deeplearning-p15549/#:~:text=c%E1%BB%A7a%20m%C3%B4%20h%C3%ACnh.,Underfitting%20l%C3%A0%20g%C3%AC%3F,luy%E1%BB%87n%20v%C3%A0%20t%E1% BA%ADp%20ki%E1%BB%83m%20tra [22] M S Minhas, "Techniques for handling underfitting and overfitting in Machine Learning," 06 07 2021 [Online] Available: https://towardsdatascience.com/techniques-for-handling-underfittingand-overfitting-in-machine-learning-348daa2380b9 [23] K Barkved, "The Difference Between Training Data vs Test Data in Machine Learning," 11 01 2022 [Online] Available: https://www.obviously.ai/post/the-difference-between-training-datavs-test-data-in-machinelearning#:~:text=What%20is%20Testing%20Data%3F,optimize%20it%20for%20improved%20r esults [24] Sonal Agarwal, Sandhya Tarar, "A HYBRID APPROACH FOR CROP YIELD PREDICTION USING MACHINE LEARNING AND DEEP LEARNING ALGORITHMS," 2021 [Online] Available: https://iopscience.iop.org/article/10.1088/1742-6596/1714/1/012012 [25] A A Alsuwaylimi, "Comparison of ARIMA, ANN and Hybrid ARIMA-ANN," p https://www.naturalspublishing.com/files/published/hjb7647zy1n6a2.pdf, 2022 [26] V Trevisan, "Comparing Robustness of MAE, MSE and RMSE," 11 01 2022 [Online] Available: https://towardsdatascience.com/comparing-robustness-of-mae-mse-and-rmse6d69da870828 68 S K L 0

Ngày đăng: 08/12/2023, 15:31

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w