1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Ứng dụng dự đoán giá chứng khoán bằng mô hình lai ghép giữa arima và rnn

72 21 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHĨA LUẬN TỐT NGHIỆP NGÀNH CÔNG NGHỆ THÔNG TIN ỨNG DỤNG DỰ ĐỐN GIÁ CHỨNG KHỐN BẰNG MƠ HÌNH LAI GHÉP GIỮA ARIMA VÀ RNN GVHD: TS NGUYỄN THÀNH SƠN SVTH: PHẠM THANH BÁCH BÙI QUỐC KIỆT VÕ THÀNH ĐẠT SKL011039 Tp Hồ Chí Minh, tháng 8/2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH KHOA CƠNG NGHỆ THƠNG TIN  Phạm Thanh Bách: 19133007 Bùi Quốc Kiệt: 19133030 Võ Thành Đạt: 19133019 ĐỀ TÀI: ỨNG DỤNG DỰ ĐỐN GIÁ CHỨNG KHỐN BẰNG MƠ HÌNH LAI GHÉP GIỮA ARIMA VÀ RNN KHÓA LUẬN TỐT NGHIỆP GIÁO VIÊN HƯỚNG DẪN TS NGUYỄN THÀNH SƠN KHÓA 2019 - 2023 ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh Phúc ******** ******** PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ tên Sinh viên 1: Phạm Thanh Bách MSSV: 19133007 Họ tên Sinh viên 2: Bùi Quốc Kiệt MSSV: 19133030 Họ tên Sinh viên 3: Võ Thành Đạt MSSV: 19133019 Ngành: Kỹ thuật liệu Tên đề tài: Ứng dụng dự đoán chứng khốn mơ hình lai ghép ARIMA RNN Họ tên giáo viên hướng dẫn: TS Nguyễn Thành Sơn NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Ưu điểm: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Khuyết điểm ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày tháng năm 2023 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh Phúc ******** ******** PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ tên Sinh viên 1: Phạm Thanh Bách MSSV: 19133007 Họ tên Sinh viên 2: Bùi Quốc Kiệt MSSV: 19133030 Họ tên Sinh viên 3: Võ Thành Đạt MSSV: 19133019 Ngành: Kỹ thuật liệu Tên đề tài: Ứng dụng dự đoán chứng khốn mơ hình lai ghép ARIMA RNN Họ tên giáo viên phản biện: ThS Lê Thị Minh Châu NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Ưu điểm: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Khuyết điểm ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày tháng năm 2023 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) MỤC LỤC MỤC LỤC HÌNH ẢNH .7 PHẦN 1: MỞ ĐẦU 10 Tính cấp thiết đề tài .10 Mục đích nhiệm vụ nghiên cứu .10 Cách tiếp cận phương pháp nghiêm cứu .10 Kết dự kiến 11 Bố cục 11 PHẦN 2: NỘI DUNG 12 CHƯƠNG 1: MƠ HÌNH ARIMA 12 1.1 Khái niệm ARIMA 12 1.2 Mơ hình tự hồi quy AR(p) 13 1.3 Mơ hình trung bình trượt MA(q) .13 1.4 Sai phân I(d) 14 1.5 Mô hình ARMA 14 1.6 Mơ hình ARIMA 14 1.8 Quy trình chọn mơ hình ARIMA .15 1.9 Các bước mơ hình ARIMA 15 1.10 Đánh giá độ xác mơ hình ARIMA 16 CHƯƠNG 2: MÔ HÌNH HỌC SÂU RNN 19 2.1 Khái niệm RNN .19 2.2 Phân loại RNN 19 2.3 Cơng thức thuật tốn RNN 20 2.4 Nguyên lý hoạt động RNN 20 2.5 So sánh CNN, RNN LSTM 21 2.6 Ưu nhược điểm RNN 24 2.7 Các phương pháp tránh overfitting underfitting 24 CHƯƠNG 3: MƠ HÌNH LAI GHÉP KẾT HỢP ARIMA VÀ RNN 27 3.1 Mơ hình lai ghép kết hợp mơ hình ARIMA RNN dự đoán chuỗi thời gian 27 3.2 Mô hình lai ghép kết hợp song song mơ hình ARIMA RNN dự đoán chuỗi thời gian 28 CHƯƠNG 4: CÀI ĐẶT CÁC MƠ HÌNH .29 4.1 Cài đặt jupyter 29 4.2 Mơ hình ARIMA 31 4.3 Mơ hình RNN .37 4.4 Mơ hình lai ghép .44 Theo lai ghép ta có predictions giá trị dự đốn mơ hình ARIMA có từ trước Error! Bookmark not defined 4.5 Mơ hình lai ghép song song 44 4.6 Thời gian thực thi 46 4.7 Độ đánh giá 46 CHƯƠNG 5: THỰC NGHIỆM ĐÁNH GIÁ KẾT QUẢ 48 5.1 Môi trường thực nghiệm .48 5.2 Dữ liệu thực nghiệm 48 5.3 Các tiêu chí đánh giá 51 5.4 Các trường hợp thực nghiệm .54 5.5 Đánh giá kết thực nghiệm .55 5.6 Demo chạy ứng dụng 61 CHƯƠNG 6: PHỤ LỤC HƯỚNG DẪN THỰC HIỆN .65 PHẦN 3: KẾT LUẬN 69 Những kết đạt .69 Những đóng góp, đề xuất 69 Ưu, nhược điểm đề tài .69 Phương hướng phát triển đề tài 69 Tài liệu tham khảo .70 MỤC LỤC HÌNH ẢNH Hình 1.1 Sơ đồ khối phương pháp Box-jenkins 16 Hình 2.1 Các loại mơ hình RNN 19 Hình 2.2 Ví dụ ngun lý hoạt động RNN 21 Hình 2.3 Nguyên lý hoạt động CNN 22 Hình 2.4 Nguyên lý hoạt động LSTM 23 Hình 3.1 Mơ hình lai ghép 27 Hình 3.2 Mơ hình lai ghép song song 28 Hình 4.1 Kết tham số tốt mơ hình ARIMA 34 Hình 5.1 Kết hiển thị chạy demo 61 Hình 5.2 Nhập liệu đầu vào 61 Hình 5.3 Biểu đồ biểu diễn liệu tập liệu đầu vào 62 Hình 5.4 Kết dự đốn mơ hình ARIMA 62 Hình 5.5 Kết dự đốn mơ hình RNN 63 Hình 5.6 Kết dự đốn mơ hình lai ghép 63 Hình 5.7 Kết dự đốn mơ hình lai ghép song song 64 LỜI CAM ĐOAN Tiểu luận chuyên ngành cơng trình q trình nghiên cứu chúng em, tiến hành thực thông qua hướng dẫn thầy Nguyễn Thành Sơn Các tập liệu lấy từ nguồn dự liệu thực, kết dự đoán thị web bước cài đặt chúng em trình bày khóa luận hoàn toàn trung thực Chúng em xin chịu tồn trách nhiệm lời cam đoan khóa luận Chúng em xin hoàn toàn chịu trách nhiệm lời cam đoan Sinh viên thực Sinh viên thực Sinh viên thực (Ký ghi rõ họ tên) (Ký ghi rõ họ tên) (Ký ghi rõ họ tên) LỜI CẢM ƠN Nhóm tiểu luận chuyên ngành chúng em xin gửi lời cảm ơn chân thành gửi đến Thầy Nguyễn Thành Sơn, giáo viên hướng dẫn nhóm chúng em mơn “Khóa luận tốt nghiệp” Thầy người động viên nhắc nhở nhóm chúng em hồn thành tiểu luận, khó khăn vướng mắc nhóm ln thầy hướng dẫn giải đáp kịp thời nguồn động lực lớn để chúng em vượt qua lúc khó khăn Nhóm chúng em chân quý tận tâm, nhiệt huyết cách truyền đạt kiến thức thầy đến với sinh viên cách dễ hiểu thẳng vào vấn đề Cùng với nhóm chúng em xin gửi lời cảm ơn sâu sắc đến với quý Thầy Cô khoa Công nghệ Thông tin dạy nâng cao kiến thức cho chúng em suốt trình học tập làm tiểu luận Chúng em xin cảm ơn nhà trường tạo điều kiện cho chúng em học tập, cung cấp đầy đủ sở vật chất để chúng em thực nghiên cứu cho tiểu luận Đồng thời cảm ơn bạn lớp Kỹ thuật Dữ liệu khóa 2019 có góp ý chân thành đến với nhóm để nhóm cải tiến sản phẩm tốt cho tiểu luận Những giá trị cốt lõi kinh nghiệm trình hoạt động làm Tiểu luận chúng em ghi nhớ để làm động lực thúc đẩy thân phát triển hoàn thiện Cuối cùng, chúng em xin cám ơn đến Thầy Nguyễn Thành Sơn – người gửi tài liệu tham khảo hữu ích hướng dẫn tận tình để chúng em hồn thành thuận lợi tiểu luận Thơng qua tài liệu thầy gửi cách tự nghiên cứu thêm giúp chúng em tiếp thu nhiều kiến thức quan trọng hiểu rõ đề tài nghiên cứu Qua đây, chúng em nhận thấy thân cịn nhiều khuyết điểm thiếu sót cần cố gắng cải thiện để nâng cấp tốt, xác định rõ mục tiêu lớn tương lai Xin chân thành cảm ơn! FPT tỷ lệ 7/3 tỷ lệ 8/2 tỷ lệ 7/3 836,8770013 176,1942837 25,0285245 0,1437872185 1,006656883 0,6120304961 0,3378535622 0,9168594915 0,7379541844 0,3791928513 1,003322921 0,7823237796 + Về tỉ lệ chia tập liệu: Tỷ lệ 7/3 với lỗi đo nhỏ nhất: lần Tỷ lệ 8/2 với lỗi đo nhỏ nhất: lần + Về thời gian: Thời gian thực thi nhanh 1.98s tập liệu UBER (725 dòng), với tỷ lệ 8/2 Thời gian thực thi chậm 37.34s tập liệu GE (14058 dịng), với tỷ lệ 8/2 - Mơ hình RNN Mơ hình RNN upload_DJIA_table UBER BMW.DE GE FPT tỷ lệ tỷ lệ 8/2 tỷ lệ 7/3 tỷ lệ 8/2 tỷ lệ 7/3 tỷ lệ 8/2 tỷ lệ 7/3 tỷ lệ 8/2 tỷ lệ 7/3 tỷ lệ 8/2 tỷ lệ 7/3 Thời gian thực thi 1,5881159 1,7980531 1,4597553 1,4628789 1,4783665 1,5634884 3,3335015 4,3728682 1,8407518 2,4795393 MSE MAE RMSE 0,1385299992 0,3180478813 0,3721961838 0,1406487347 0,1593773743 0,1915064055 0,2306926364 0,1550509626 0,130716418 0,1800406145 0,285069004 0,3548307788 0,3595804382 0,3954494928 0,3232364097 0,2883227734 0,3634968873 0,3750316449 0,3992209593 0,4376144485 0,4803047328 0,3937651109 0,3615472556 0,4243119307 0,112441704 0,2599095208 0,3353232829 0,08240564241 0,201989096 0,2870638299 - Nhận xét: + Về tỉ lệ chia tập liệu: Tỷ lệ 7/3 với lỗi đo nhỏ nhất: lần Tỷ lệ 8/2 với lỗi đo nhỏ nhất: lần + Về thời gian: Thời gian thực thi nhanh 1.46s tập liệu UBER (725 dòng), với tỷ lệ 7/3 Thời gian thực thi chậm 4.37s tập liệu GE (14058 dòng), với tỷ lệ 8/2 - Kết luận chung mơ hình: + Với tỉ lệ 7/3 cho kết dự đoán tốt so với 8/2 57 + Với tỉ lệ 8/2 thời gian thực thi nhanh so với 7/3 + Thời gian chạy phụ thuộc vào độ dài tập liệu Trường hợp 3: Đánh giá ảnh hưởng số lớp ẩn đến kết dự báo RNN thay đổi số lớp ẩn từ đến Với cửa sổ trượt d=60 (ngày), số ngày dự đoán t=5 (ngày), số nơron (unit=50), batch_size=32, epoch=50 - Training - Testing Mơ hình RNN upload_DJIA_table UBER BMW.DE GE FPT số lớp ẩn 5 5 Thời gian thực thi 138,5409447 176,1950109 221,5103039 171,3274264 73,3627026 61,857618 loss 0,002 0,002 0,002 0,0024 0,005 0,0054 epoch 48 49 46 49 49 48 batch_size 32 32 32 32 32 32 97,1596776 65,3889628 74,8353579 126,4275008 158,4266465 109,823545 448,2568406 794,15648 1200,198756 1232,515136 205,6226667 250,7843624 374,5409212 329,6189943 0,0061 0,0065 0,0031 0,0038 0,0035 0,0039 0,00041776 0,00043818 0,0004438 0,00045337 0,00023003 0,00028118 0,00031409 0,00032687 47 49 50 50 49 50 49 43 43 50 46 46 46 47 32 32 32 32 32 32 32 32 32 32 32 32 32 32 - Nhận xét: + Loss cao trường hợp với lớp ẩn + Epoch giao động từ 40 - 50 => epoch max 50 - Kết luận: + Số lớp ẩn tốt dùng cho mơ hình + Lớp ẩn epoch tốt dùng cho mơ hình epoch = 50 Trường hợp 4: Đánh giá ảnh hưởng số nơron đến kết dự báo RNN thay đổi số nơron từ 10 đến 50 58 Với cửa sổ trượt d=60 (ngày), số ngày dự đoán t=5 (ngày), số lớp ẩn = 5, batch_size=32, epoch=50 Mơ hình RNN upload_DJIA_table UBER BMW.DE GE FPT số nơron 10 20 30 40 50 10 20 30 40 50 10 20 30 40 50 10 20 30 40 50 10 20 30 40 50 Thời gian thực thi 190,0656 211,7685 211,3694 247,6045 257,3746 78,2126 77,1105 75,8904 loss 0,0041 0,0028 0,0022 0,002 0,0017 0,0099 0,0073 0,0062 84,849 84,849 117,616 135,0973 141,164 154,2974 156,4721 982,9125 996,1532 1151,4859 1156,6046 1261,4859 328,9065 356,6046 451,4859 508,4806 513,7648 0,0049 0,0048 0,0063 0,0046 0,0035 0,0033 0,0032 0,00632 0,00673 0,00040595 0,00043 0,00031 0,00090908 0,000543 0,00040595 0,00034675 0,00031273 + Lỗi tính nhỏ thay đổi số nơron: 10 nơron: lần 20 nơron: lần 30 nơron: lần 40 nơron: lần 50 nơron: lần - Kết luận chung: Như 100% thực nghiệm với số nơron 50 cho kết lỗi nhỏ Trường hợp 5: Đánh giá thực nghiệm mơ hình ARIMA, RNN, tuần tư, song song (thời gian, lỗi) Với cửa sổ trượt d=60 (ngày), số ngày dự đoán t=5 (ngày), số lớp ẩn = 5, số nơ ron (unit=50), batch_size=32, epoch=50 59 Tập liệu upload_DJIA_table UBER BMW.DE GE FPT Mô hình ARIMA RNN Tuần Tự Song Song ARIMA RNN Tuần Tự Song Song ARIMA RNN Tuần Tự Song Song ARIMA RNN Tuần Tự Song Song ARIMA RNN Tuần Tự Song Song Thời gian train 2,5647 147,8016 150,3664 147,8016 4,0492 52,7028 53,7754 52,7028 1,5922 103,1796 104,7718 103,1796 30,7666 1143,3002 1147,3493 1143,3002 54,2165 297,1611 351,3776 297,1611 Thời gian dự đoán 7,5250 1,9225 7,9752 7,5250 58,1620 1,3782 1,3495 MSE MAE RMSE 0,2156 0,1252 0,3044 0,1249 0,3648 0,1193 0,0939 0,4008 0,3084 0,4940 0,3041 0,5461 0,2678 0,2642 0,4644 0,3539 0,5517 0,3534 0,6040 0,3454 0,3064 1,3782 3,9397 1,4360 4,2055 3,9397 2159,8265 3,5237 2161,3416 58,1620 443,4312 2,1190 444,0433 443,4312 0,0691 0,4244 0,2266 0,2043 0,1324 0,0998 0,1280 0,2482 0,0139 0,0976 0,1074 0,1326 0,1401 0,1978 0,5765 0,4045 0,3746 0,2732 0,2960 0,2910 0,4195 0,0898 0,2354 0,2574 0,2609 0,3082 0,2630 0,6515 0,4760 0,4520 0,3639 0,3159 0,3578 0,4982 0,1180 0,3125 0,3278 0,3641 0,3744 - Nhận xét: + So sánh mơ hình ARIMA vs RNN: RNN chạy lâu cho lỗi nhỏ ARIMA 4/5 tập liệu (1 tập cịn lại tập có 10000 liệu) + Mơ hình kết hợp chạy với thời gian lâu mơ hình kết hợp song song + Mơ hình kết hợp song song cho lỗi nhỏ mơ hình kết hợp tổng số 3/5 tập liệu - Kết luận: - Mơ hình RNN cho kết dự báo tốt ARIMA - Mơ hình kết hợp song song chạy nhanh mơ hình kết hợp - Mơ hình kết hợp song song cho kết dự báo tốt mơ hình kết hợp 60 5.6 Demo chạy ứng dụng Hình 5.1 Kết hiển thị chạy demo Hình 5.2 Nhập liệu đầu vào 61 Hình 5.3 Biểu đồ biểu diễn liệu tập liệu đầu vào Hình 5.4 Kết dự đốn mơ hình ARIMA 62 Hình 5.5 Kết dự đốn mơ hình RNN Hình 5.6 Kết dự đốn mơ hình lai ghép 63 Hình 5.7 Kết dự đốn mơ hình lai ghép song song 64 CHƯƠNG 6: PHỤ LỤC HƯỚNG DẪN THỰC HIỆN Bước 1: Mở cửa sổ window => tìm kiếm “Anaconda Prompt” => bấm enter Bước 2: Gõ dòng lệnh “jupyter notebook” vào cmd => Bấm enter Bước 3: Trình jupyter mở lên trang web, chạy localhost 65 Bước 4: Dẫn tới thư mục lưu trữ code Bước 5: Trước chạy chương trình bạn tải thư viện trước 66 Bước 6: Khi tải đầy đủ thư viện => Bấm chọn vào tệp ipynb để khởi chạy chương trình 67 Bước 7: Chạy chương trình Bước 8: Chạy thực nghiệm kết 68 PHẦN 3: KẾT LUẬN Những kết đạt Bằng việc cải tiến thử nghiệm mô hình RNN chúng em cho kết tốt so với mơ hình cũ ARIMA, kết dự báo chứng khốn tốt mơ hình cũ tập liệu sử dụng cho mơ hình trước Thực lai ghép mơ hình (ARIMA, RNN) lai ghép song song cho kết tốt mô hình riêng lẻ Giao diện demo dễ nhìn, dễ sử dụng, có chức (nhập tập liệu đầu vào, chọn tỉ lệ train/test, đưa tham số tối ưu mơ hình, đưa lỗi dự đốn, dự báo giá chứng khoán tương lai, đưa biểu đồ dự báo,…) Những đóng góp, đề xuất - Thực dự đoán giá chứng khoán tương lai mơ hình RNN, LSTM - Lai ghép mơ hình ARIMA RNN - Cải tiến, hiệu chỉnh trang web thêm chức (hiện biểu đồ dự báo khung cửa sổ mới, đưa toàn khung demo vào chung hình,…) Ưu, nhược điểm đề tài Ưu điểm: - Mơ hình có q trình học tập tương đối nhanh - Độ xác cao chưa đạt mức đưa vào áp dụng thực tiễn - Trang web demo dễ nhìn, dễ sử dụng đầy đủ tính Nhược điểm: - Thời gian dự đốn mơ hình cịn chưa nhanh - Độ xác mơ hình chưa đạt mức để đưa vào thực tiễn 95% Phương hướng phát triển đề tài - Thử nghiệm lai ghép với mô hình khác để tăng độ xác dự đốn (SVM,…) - Phát triển website có đầy đủ giao diện (đăng nhập, đăng ký, thao tác với web,…) - Kết nối API để lấy liệu thời gian thực - Lưu giá trị thực thi 69 Tài liệu tham khảo [1] phamdinhkhanh (2019) Mơ hình ARIMA time series https://phamdinhkhanh.github.io/2019/12/12/ARIMAmodel.html [2] Mohd Zamri Ibrahim, R Z (2019) Forecasting and Time Series Analysis of Air Pollutants in Several Area of Malaysia American Journal of Environmental Sciences (5): 625 – 632 ISSN 1553-345X [3] Huyền, N T (2021) Recurrent Neural Network: Từ RNN đến LSTM https://viblo.asia/p/recurrent-neural-network-tu-rnn-den-lstm-gGJ597z1ZX2 [4] Nttuan8 (2019) Recurrent neural network https://nttuan8.com/bai-13recurrent-neural-network/ [5] Alsuwaylimi, A A (2022) Comparison of ARIMA, ANN and Hybrid ARIMAANN Models for Time Series Forecasting (3.3.1 Additive Hybrid Model) Department of Information Technology, College of Computing and Information Technology, Northern Border University, Saudi Arabia [6] Công, P C (2021) DỰ BÁO TRÊN CHUỖI THỜI GIAN SỬ DỤNG MƠ HÌNH LAI GHÉP ARIMA VÀ RBFNN (3.4 Nghiên cứu cải tiến mơ hình lai ghép cách thực song song hai mô) Luận văn Thạc sĩ, ngành: Khoa học máy tính - 8480101, trường Đại học Sư phạm Kỹ thuật TP HCM 70 S K L 0

Ngày đăng: 08/12/2023, 15:31

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w