1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Dự báo vnindex bằng rnn (recurrent neural network) kết hợp với arima đồ án tốt nghiệp ngành kỹ thuật dữ liệu

100 23 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 100
Dung lượng 2,71 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH ĐỒ ÁN TỐT NGHIỆP NGÀNH KỸ THUẬT DỮ LIỆU DỰ BÁO VNINDEX BẰNG RNN (RECURRENT NEURAL NETWORK) KẾT HỢP VỚI ARIMA GVHD: TS NGUYỄN THÀNH SƠN SVTH: VŨ NGỌC KHANG NGUYỄN PHƯỚC SANG SKL009322 Tp.Hồ Chí Minh, tháng 7/2022 - TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA CÔNG NGHỆ THÔNG TIN NGÀNH KỸ THUẬT DỮ LIỆU - - KHÓA LUẬN TỐT NGHIỆP VŨ NGỌC KHANG - 17133033 NGUYỄN PHƯỚC SANG – 17133055 ĐỀ TÀI: DỰ BÁO VNINDEX BẰNG RNN (RECURRENT NEURAL NETWORK) KẾT HỢP VỚI ARIMA GIẢNG VIÊN HƯỚNG DẪN TS NGUYỄN THÀNH SƠN Tp Hồ Chí Minh, tháng năm 2022 ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập - Tự Hạnh phúc ******* ******* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ tên Sinh viên 1: Vũ Ngọc Khang MSSV 1: 17133033 Họ tên Sinh viên 2: Nguyễn Phước Sang MSSV 2: 17133055 Ngành: Kỹ thuật liệu Tên đề tài: DỰ BÁO VNINDEX BẰNG RNN (RECURRENT NEURAL NETWORK) KẾT HỢP ARIMA Họ tên Giảng viên hướng dẫn: TS Nguyễn Thành Sơn NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày 202 tháng năm Giáo viên hướng dẫn (Ký & ghi rõ họ tên) ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập - Tự Hạnh phúc ******* ******* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ tên Sinh viên 1: Vũ Ngọc Khang MSSV 1: 17133033 Họ tên Sinh viên 2: Nguyễn Phước Sang MSSV 2: 17133055 Ngành: Kỹ thuật liệu Tên đề tài: DỰ BÁO VNINDEX BẰNG RNN (RECURRENT NEURAL NETWORK) KẾT HỢP ARIMA Họ tên Giảng viên phản biện: TS Võ Xuân Thể NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: + Nhóm sinh viên có hiểu biết RNN(mạng Nơ ron hồi quy), ARIMA mơ hình cải tiến lai ghép ARIMA với LSTM (Long-Short Term Memory) + Đề tài vận dụng ARIMA lai ghép LSTN vào toán chuỗi liệu thời gian dự báo số chứng khốn VN-Index + Có cài đặt chương trình thực nghiệm Ưu điểm: + Nhóm sinh viên có kiến thức kỹ đảm bảo yêu cầu chuyên mơn bậc Đại học + Có đầu tư thực đề tài nghiêm túc + Tiếp thu điều chỉnh góp ý phản biện nghiêm túc Khuyết điểm: + Có lẽ giới hạn thời gian, nên nhóm sv chưa mở rộng đề tài nghiên cứu thông qua so sánh đánh giá giải thuật với nhiều toán thực tiễn khác với nhiều giải thuật khác Đề nghị cho bảo vệ Câu hỏi: + Chuỗi thời gian ? minh họa với toán đề tài? + Tại tham số LSTM dùng số unit 128 (64), số lớp NN 6? Dùng số khác không? Đánh giá loại: XUẤT SẮC Điểm: Tp Hồ Chí Minh, ngày 14 tháng 07 năm 2022 Giáo viên phản biện (Ký & ghi rõ họ tên) VÕ XUÂN THỂ LỜI CẢM ƠN Nhóm chúng tơi xin chân thành cảm ơn q thầy cô trường Đại Học Sư phạm kỹ thuật TP Hồ Chí Minh tận tình dạy cho kiến thức sở năm học tập vừa qua tạo điều kiện để thực đề tài Đặc biệt nhóm chúng tơi xin bày tỏ lòng biết ơn T.S Nguyễn Thành Sơn Thầy tận tình hướng dẫn bảo cho thực đề tài Cuối cùng, nhóm chúng tơi xin cảm ơn đến tác giả báo khoa học tham khảo Các báo giúp cho nhóm tiếp thu thêm nhiều kiến thức quan trọng hiểu rõ đề tài nghiên cứu MỤC LỤC DANH MỤC HÌNH ẢNH DANH MỤC BẢNG BIỂU DANH MỤC CÁC TỪ VIẾT TẮT TÓM TẮT PHẦN 1: MỞ ĐẦU TÍNH CẤP THIẾT CỦA ĐỀ TÀI MỤC ĐÍCH CỦA ĐỀ TÀI NHIỆM VỤ CỦA ĐỀ TÀI CÁCH TIẾP CẬN VÀ PHƯỚNG PHÁP NGHIÊN CỨU BỐ CỤC TIỂU LUẬN PHẦN 2: NỘI DUNG CHƯƠNG 1: BÀI TOÁN DỰ BÁO CHUỖI THỜI GIAN 1.1 BÀI TOÁN DỰ BÁO 1.1.1 Dự báo hỗ trợ trình định tình 1.1.2 Chuỗi thời gian (Time Series) 10 1.2 TIẾN TRÌNH CỦA MỘT BÀI TỐN DỰ BÁO 11 1.2.1 Tiến trình chung tốn dự báo 11 1.2.2 Tiêu chuẩn dự báo 11 2.1 CHƯƠNG 2: TỔNG QUAN VỀ CHỨNG KHỐN VÀ CHỈ SỐ VN-INDEX 13 CHỨNG KHỐN LÀ GÌ VÀ TẠI SAO NÊN ĐẦU TƯ CHỨNG KHOÁN?.13 2.2 LỢI NHUẬN RỦI RO VÀ SỐ VỐN ĐỂ BẮT ĐẦU 14 2.3 CƠ HỘI ĐẦU TƯ MÀ CHỨNG KHOÁN MANG LẠI 14 2.4 RỦI RO 15 2.5 VẬY MUỐN ĐẦU TƯ CHỨNG KHỐN THÌ SỐ VỐN CẦN LÀ BAO NHIÊU? 16 2.6 THỜI GIAN MỖI NGÀY VÀ THỜI ĐIỂM ĐẦU TƯ 19 2.7 TỔNG QUAN CHỈ SỐ VN-INDEX 20 2.7.1 Chỉ số VN-Index gì? 20 2.7.2 Ý nghĩa số VN-Index 21 2.7.3 Chỉ số VN-Index qua năm 22 2.7.4 Kết kinh doanh sơ công ty 24 2.7.5 Cách tính số Vn-Index 24 2.7.6 Các cơng trình liên quan 27 2.7.6.1 Phần mềm phân tích chứng khoán Amibroker 27 2.7.6.2 Phần mềm chứng khoán Metastock 27 2.7.6.3 Phần mềm phân tích chứng khốn FireAnt 28 2.7.6.4 Phần mềm chứng khoán SSI Pro Trading 28 CHƯƠNG 3: RECURRENT NEURON NETWORK 29 3.1 GIỚI THIỆU 29 3.2 CÁCH RNN HOẠT ĐỘNG 30 3.2.1 Huấn luyện thông qua RNN 32 3.2.2 Supervised learning (Học có có giám sát) 32 3.2.3 Unsupervised Learning (Học khơng có giám sát) 33 3.2.4 Hàm mục tiêu 33 3.2.5 Thuật toán lan truyền ngược (Backward propagation) 34 3.2.6 Ưu điểm RNN 34 3.2.7 Nhược điểm RNN 35 3.3 LSTM – LONG-SHORT TERM MEMORY 35 3.3.1 Tổng quan 35 3.3.2 Tóm tắt nhanh 35 3.3.3 Sơ lược LSTM 36 3.3.4 Hoạt động bên LSTM 38 3.3.4.1 Cổng đầu vào 39 3.3.4.2 Cổng quên 40 3.3.4.3 Cổng đầu 42 3.4 ỨNG DỤNG RNN VÀO DỰ BÁO CHUỖI THỜI GIAN 42 3.4.1 Cấu trúc hoat động mạng RNN 42 3.4.2 Thiết lập liệu dùng để huấn luyện, thử nghiệm 44 3.4.2.1 Vấn đề Overfiting Underfiting 44 3.4.2.2 Training Set (Tập huấn luyện) 45 3.4.2.3 Testing Set (Tập kiểm thử) 45 3.4.2.4 Validation (Tập kiểm chứng) 47 CHƯƠNG 4: ARIMA 49 4.1 GIỚI THIỆU 49 4.2 MƠ HÌNH TỰ HỒI QUY KẾT HỢP TRUNG BÌNH TRƯỢT (ARIMA) .49 4.2.3 Mơ hình tự hồi quy (AR(p) – Autoregressive model) 49 4.2.4 Mơ hình trung bình trượt (MA (q) – Moving Average Mode) .50 4.2.5 Sai phân I(d) 51 4.2.6 Mơ hình ARMA 53 4.2.7 Mơ hình ARIMA (p,d,q) 53 4.2.8 Cách lựa chọn tham số cho mơ hình ARIMA .55 4.2.9 Các bước phát triển mơ hình ARIMA 55 CHƯƠNG 5: DỰ BÁO TRÊN CHUỖI THỜI GIAN SỬ DỤNG MƠ HÌNH LAI GHÉP ARIMA VÀ LSTM 57 5.1 MƠ HÌNH LAI GHÉP GIỮA ARIMA VÀ LSTM CHO BÀI TOÁN DỰ BÁO TRÊN CHUỖI THỜI GIAN 57 5.2 CẢI TIẾN MƠ HÌNH LAI GHIÉP BẰNG CÁCH THỰC HIỆN SONG SONG HAI MƠ HÌNH ARIMA VÀ LSTM 58 CHƯƠNG 6: TRIỂN KHAI THỰC NGHIỆM VÀ ĐÁNH GIÁ MƠ HÌNH 60 6.1 MƠ HÌNH ARIMA 60 6.2 MƠ HÌNH LSTM 60 6.3.MƠ HÌNH ARIMA-LSTM 62 6.4 MƠ HÌNH ARIMA-LSTM CẢI TIẾN 63 CHƯƠNG 7: CÀI ĐẶT MƠI TRƯỜNG THỰC NGHIỆM MƠ HÌNH 65 7.1 MƠI TRƯỜNG VÀ DỮ LIỆU THỰC NGHIỆM 65 7.2 TIÊU CHÍ ĐÁNH GIÁ 65 7.4 CÁC TRƯỜNG HỢP THỰC NGHIỆM 66 7.4.1 Tập liệu AAPL 69 7.4.2 Tập liệu HSG 71 7.4.3 Tập liệu AGR 74 7.4.4 Tập liệu VNINDEX 76 7.4.5 Tập liệu HPG 79 7.4.6 Tập liệu FTSE-100 82 7.5 NHẬN XÉT KẾT QUẢ THỰC NGHIỆM Ở CÁC TẬP DỮ LIỆU .84 PHẦN 3: KẾT LUẬN 86 KẾT QUẢ ĐẠT ĐƯỢC 86 HẠN CHẾ 86 HƯỚNG PHÁT TRIỂN 86 TÀI LIỆU THAM KHẢO 87 PHỤ LỤC 89 MÔI TRƯỜNG THỰC NGHIỆM 89 CÁC BƯỚC THỰC HIỆN DEMO 89

Ngày đăng: 10/05/2023, 16:22

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w