1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng phương pháp học sâu trong dự báo giá chứng khoán

63 339 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

TRƯỜNG ĐẠI HỌC MỞ CỘNG HÒA XÃ HỘI CHỦ NGHĨAVIỆT NAM THÀNH PHỐ HỒ CHÍ MINH KHOA QUẢN TRỊ KINH DOANH Độc lập – Tự – Hạnh phúc GIẤY XÁC NHẬN Tôi tên là:…Tiêu Khởi Mai…………… ……………………………………… Ngày sinh:……01/12/1998……………… Nơi sinh:……TP HCM…………… Chuyên ngành: Kinh doanh quốc tế Mã sinh viên: …1654020119.……… Tơi đồng ý cung cấp tồn văn thơng tin khóa luận tốt nghiệp hợp lệ quyền cho Thư viện Trường Đại học Mở Thành phố Hồ Chí Minh Thư viện Trường Đại học Mở Thành phố Hồ Chí Minh kết nối tồn văn thơng tin khóa luận tốt nghiệp vào hệ thống thơng tin khoa học Sở Khoa học Công nghệ Thành phố Hồ Chí Minh Ký tên (Ghi rõ họ tên) ………………………………… Ý KIẾN CHO PHÉP BẢO VỆ KHÓA LUẬN TỐT NGHIỆP CỦA GIẢNG VIÊN HƯỚNG DẪN Giảng viên hướng dẫn: Học viên thực Lớp Ngày sinh: Nơi sinh Tên đề tài: Ý kiến giáo viên hướng dẫn việc cho phép sinh viên: bảo vệ khóa luận trước Hội đồng: Thành phố Hồ Chí Minh, ngày .tháng .năm Người nhận xét LỜI CẢM ƠN Đầu tiên, xin gửi lời tri ân đến TS Cao Minh Trí tận tình hướng dẫn tơi suốt q trình thực khoá luận Thầy đưa lời nhận xét để tơi hồn thành đề tài cách tốt Qua q trình thực hồn thành đề tài hướng dẫn Thầy cho học thêm nhiều kiến thức chuyên môn Trong q trình hồn thành đề tài, Tơi cố gắng khơng tránh khỏi thiếu sót Tơi mong nhận đóng góp ý kiến từ Q Thầy Cơ để hồn thiện thêm đề tài nghiên cứu Tôi xin chân thành cảm ơn! MỤC LỤC DANH MỤC BẢNG BIỂU i DANH MỤC HÌNH ii DANH MỤC TỪ VIẾT TẮT iii CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 1.1 Lý chọn đề tài nghiên cứu 1.2 Mục tiêu nghiên cứu 1.3 Phương pháp nghiên cứu 1.3.1 Phương pháp tiếp cận 1.3.2 Quy trình nghiên cứu 1.4 Phạm vi đối tượng nghiên cứu 1.5 Đóng góp nghiên cứu 1.6 Kết cấu đề tài nghiên cứu 10 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 11 2.1 Chuỗi thời gian 11 2.2 Mơ hình ARIMA 12 2.2.1 Tính dừng 12 2.2.1.1 Tính chất tự tương quan 12 2.2.1.2 Kiểm định nghiệm đơn vị 13 2.2.2 Quá trình tự hồi quy AR 14 2.2.3 Quá trình trung bình trượt MA 15 2.2.4 Quá trình trung bình trượt tự hồi quy ARMA 15 2.2.5 Q trình trung bình trượt, tích hợp tự hồi quy ARIMA 15 2.2.6 Định dạng mơ hình – xác định tham số p,d,q 16 2.2.6.1 Lược đồ tương quan tự tương quan 16 2.2.6.2 Tiêu chuẩn Akaike, Schwarz 17 2.2.7 Ước lượng mơ hình 19 2.2.8 Kiểm định tính thích hợp mơ hình 20 2.2.9 Dự báo sai số dự báo 21 2.3 Trích xuất đặc trưng XGBoost 22 2.4 Học sâu 23 2.4.1 Mạng neuron nhân tạo 23 2.4.1.1 Kiến trúc mạng neural nhân tạo 23 2.4.1.2 Mơ hình hoạt động mạng neural nhân tạo 24 2.4.1.3 Ứng dụng 26 2.4.2 Mạng neuron hồi quy 27 2.4.2.1 Kiến trúc mạng neuron hồi quy 27 2.4.2.2 Phân loại toán 28 2.4.2.3 Ứng dụng 28 2.4.3 Mạng LSTM 28 2.4.3.1 Kiến trúc mạng LSTM 28 2.4.3.2 Ứng dụng 31 2.5 Độ đo đánh giá kết mơ hình 32 2.5.1 Sai số tuyệt đối trung bình 32 2.5.2 Sai số tồn phương trung bình 32 2.5.3 Căn bậc hai sai số tồn phương trung bình 32 CHƯƠNG 3: KẾT QUẢ 33 3.1 Giới thiệu liệu 33 3.2 Mơ hình ARIMA 36 3.2.1 Kiểm định tính dừng chuỗi thời gian 36 3.2.2 Ước lượng tham số lựa chọn mơ hình 38 3.2.3 Kiểm định tính dừng phần dư 39 3.2.4 Kết thực nghiệm 39 3.3 Mơ hình LSTM 41 3.3.1 Xây dựng mơ hình dự báo 41 3.3.1.1 Dữ liệu trích xuất đặc trưng 41 3.3.1.2 Cấu trúc mơ hình LSTM 44 3.3.2 Kết thực nghiệm 45 3.4 Đánh giá 48 CHƯƠNG 4: KẾT LUẬN 50 Tài liệu tham khảo 51 i DANH MỤC BẢNG BIỂU Bảng 2.1 Bậc p,q ARIMA 17 Bảng 3.1 Bảng tóm tắt đặc trưng thống kê giá đóng cửa từ thị trường Forex 34 Bảng 3.2 Bảng giá trị ACF PACF giá đóng cửa độ trễ 37 Bảng 3.3 Kết ARIMA (p, d, q) 38 Bảng 3.4 Kết mơ hình ARIMA (0,1,1) 38 Bảng 3.5 Kết mơ hình ARIMA 40 Bảng 3.6 Đánh giá kết dự báo mơ hình ARIMA 41 Bảng 3.7 Bảng mô tả đặc trưng chọn 43 Bảng 3.8 Sai số tập huấn luyện tập đánh giá 46 Bảng 3.9 Kết mơ hình LSTM 48 Bảng 3.10 Đánh giá kết dự báo mơ hình LSTM 48 Bảng 3.11 Kết 49 ii DANH MỤC HÌNH Hình 1.1 Lược đồ mơ phương pháp học sâu Hình 1.2 Lược đồ mô mơ hình ARIMA Hình 2.1 Kiến trúc mạng neural nhân tạo 24 Hình 2.2 Quá trình xử lý thông tin mạng neural nhân tạo 24 Hình 2.3 Cấu trúc mạng RNN 27 Hình 2.4 Các dạng tốn RNN 28 Hình 2.5 Mơ hình LSTM 29 Hình 2.6 Trạng thái tế bào (cell state) LSTM 30 Hình 2.7 Mơ hình LSTM 30 Hình 3.1 Đồ thị giá đóng cửa theo phiên phút giá bid EUR/USD 34 Hình 3.2 Biểu đồ hộp giá đóng cửa theo phiên phút giá bid EUR/USD 35 Hình 3.3 Biểu đồ tần suất giá đóng cửa theo phiên phút giá bid EUR/USD 35 Hình 3.4 Đồ thị sai phân bậc giá đóng cửa 36 Hình 3.5 Hàm tự tương quan hàm tự tương quan riêng 37 Hình 3.6 Đồ thị sai phân bậc phần dư 39 Hình 3.7 Đồ thị thể kết dự báo sử dụng phương pháp ARIMA 40 Hình 3.8 Đồ thị đặc trưng tài 1000 ngày 41 Hình 3.9 Các đặc trưng dùng để dự báo 42 Hình 3.10 Cấu trúc mô hình 45 Hình 3.11 Đồ thị thể xu hướng sai số tập huấn luyện tập đánh giá 47 Hình 3.12 Đồ thị thể kết dự báo sử dụng phương pháp LSTM 47 iii DANH MỤC TỪ VIẾT TẮT ACF Autocorrelation Function Hàm tự tương quan ADF Augmented Dickey–Fuller Thống kê kiểm định Dickey-Fuller AIC Akaike information criterion Tiêu chuẩn thông tin Akaike ANN Artificial Neural Network Mạng Neural nhân tạo AR Auto Regressive Quá trình tự hồi quy ARMA Autoregressive Moving Average Quá trình trung bình trượt tự hồi quy ARIMA Auto Regressive Integrated Mơ hình tự hồi quy tích hợp trung bình Moving Average trượt BIC Bayesian information criterion Tiêu chuẩn thông tin Bayes IID Independent Identically Phân phối đồng độc lập Distributed LSTM Long Short Term Memory Mạng LSTM MAE Mean Absolute Error Sai số tuyệt đối trung bình MLE Maximum likelihood estimation Ước lượng hợp lý cực đại MSE Mean Square Error Sai số tồn phương trung bình OLS Ordinary least squares Phương pháp bình phương nhỏ PACF Partial Autocorrelation Function Hàm tự tương quan riêng RMSE Root Mean Square Error Căn bậc hai sai số toàn phương trung bình RNN Recurent Neural Network Mạng Neural hồi quy TỔNG QUAN VỀ ĐỀ TÀI 1.1 Lý chọn đề tài nghiên cứu Bài toán dự báo giá chứng khoán vấn đề cổ điển nghiên cứu toàn giới Nhiều nghiên cứu giá chứng khoán bị tác động yếu tố vĩ mô lạm phát, tỷ giá hối đoái, tổng sản phẩm quốc nội, cung tiền, lãi suất dài hạn lãi suất ngắn hạn (Gan cộng sự, 2006) Và yếu tố khác tin tức công ty, hiệu suất công ty, hiệu ngành, lãi suất, sách kinh tế, cú sốc kinh tế, cú sốc trị Do đó, việc dự báo giá chứng khốn gặp nhiều khó khăn Tuy vậy, dự báo xác mang lại nhiều lợi ích cho nhà đầu tư Bên cạnh đó, giá chứng khốn nhìn nhận thước đo hiệu hoạt động kinh tế quốc gia Chính vậy, dự báo giá xác cung cấp nhiều thơng tin hữu ích cho nhà hoạch định sách Nghiên cứu thay đổi giá chứng khoán thu hút nhiều ý nhiều học giả Nhiều mơ hình mơ phỏng, dự đoán thay đổi giá chứng khoán đề xuất Vào năm 1990, nhà toán học người Pháp, Louis Bachelier đưa giả định chuyển động giá chứng khoán tuân theo chuyển động Brown (Brownian motion) nhiều nghiên cứu thực nghiệm biến động giá chứng khoán tương lai khơng thể đốn trước Kendall (1953) lần sử dụng thuật ngữ bước ngẫu nhiên lý thuyết tài chính, dựa quan sát 22 số chứng khốn Anh giá hàng hóa Mỹ để tìm chu kỳ giá thường xuyên Osborne (1959) chứng minh giá cổ phiếu Hoa Kỳ chuyển động ngẫu nhiên giống hạt phân tử Vì giá chứng khoán chuyển động theo bước ngẫu nhiên nên nhà nghiên cứu lập luận thông tin tài cơng ty phản ánh theo giá cách có hệ thống Fama (1965) thảo luận số chứng thực nghiệm hỗ trợ lý thuyết bước ngẫu nhiên đưa giả thuyết thị trường hiệu Theo tác giả, thị trường hiệu (Efficient Market Hypothesis – EMH) (Malkiel Fama, 40 Bảng 3.6 trình bày kết dự báo phương pháp ARIMA đánh giá độ đo trình bày mục 2.5 Hình 3.7 thể đường dự báo với màu đỏ đường giá trị thực tế hiển thị màu xanh biểu đồ Có thể thấy giá trị dự báo sát với giá trị thực tế bảng 3.5 Nhìn chung, phương pháp ARIMA phương pháp hồi quy tuyến tính hiệu đem lại chất lượng dự báo cao Bảng 3.5 Kết mơ hình ARIMA Dữ liệu thực tế Dữ liệu dự báo 1.293415 1.294596 1.294630 1.294735 1.294765 ⋮ 1.267252 1.268075 1.267995 1.267935 1.267882 1.267662 1.266994 1.269521 1.292982 1.294977 1.294543 1.294777 ⋮ 1.267472 1.267196 1.268281 1.267924 1.267934 1.267866 1.267610 Hình 3.7 Đồ thị thể kết dự báo sử dụng phương pháp ARIMA 41 Bảng 3.6 Đánh giá kết dự báo mơ hình ARIMA Chỉ số Kết MAE MSE RMSE 0.0004149927 0.0000006114 0.0007819336 3.3 Mơ hình LSTM 3.3.1 Xây dựng mơ hình dự báo 3.3.1.1 Dữ liệu trích xuất đặc trưng Khai khác tạo thêm đặc trưng cho liệu với 200 đặc trưng bao gồm: Open, High, Low, Close, Volumn, body, upper_tail, lower_tail, SMA_50, … Hình 3.8 thể vài đặc trưng tài phạm vi 1000 ngày Hình 3.8 Đồ thị đặc trưng tài 1000 ngày Tác giả tiến hành trích chọn đặc trưng sử dụng XGBoost thu kết đặc trưng tốt theo F score thể hình 3.9 theo thứ tự giảm dần mô tả đặc trưng chọn bảng 3.10 42 Hình 3.9 Các đặc trưng dùng để dự báo 43 Bảng 3.7 Bảng mô tả đặc trưng chọn Đặc trưng Mô tả Open Giá mở cửa High Giá cao theo phiên phút Low Giá thấp theo phiên phút body Chỉ số đo khoảng biến động 50% liệu, nhằm đánh giá sơ lược độ trải liệu Chi tiết hơn, giá trị âm giá mở cửa lớn giá đóng cửa, ngược lại mang giá trị dương body = (Close – Open) * 10.000 upper_tail Giá trị mà quan sát liệu nhỏ giá trị chiếm 25% tổng số quan sát Nếu Open > Close: upper_tail = (High – Open) * 10.000 lower_tail SMA_50 SMA_20 SAR return_94 Ngược lại: upper_tail = (High – Close) * 10.000 Giá trị mà quan sát liệu lớn giá trị chiếm 25% tổng số quan sát Nếu Open > Close: lower_tail = (Close – Low)*10.000 Ngược lại: lower_tail = (Open – Low)*10.000 Giá trị trung bình trượt 50 quan sát gần 𝑃(𝑡 − 1) + 𝑃(𝑡 − 2) + ⋯ + 𝑃(𝑡 − 50) 𝑆𝑀𝐴50 (𝑡) = 50 Giá trị trung bình trượt 20 quan sát gần 𝑃(𝑡 − 1) + 𝑃(𝑡 − 2) + ⋯ + 𝑃(𝑡 − 20) 𝑆𝑀𝐴20 (𝑡) = 20 Chỉ báo Parabolic cho mục đích xác nhận bác bỏ xu hướng 𝑆𝐴𝑅𝑛+1 = 𝑆𝐴𝑅𝑛 + α (EP - 𝑆𝐴𝑅𝑛 ) Suất sinh lợi return Mục đích chuyển suất sinh lợi return nhằm tính tốn kiểm sốt lợi nhuận Ngoài ra, phân phối xác suất suất sinh lợi return xấp xỉ phân phối chuẩn Thông thường, công thức tính suất sinh lợi return có cách tính Cách 1: Đo lợi nhuận tuyệt đối 𝑟𝑒𝑡𝑢𝑟𝑛𝑘 (𝑡) = 𝑃(𝑡) − 𝑃(𝑡 − 𝑘 ∗ 5) Cách 2: Đo lợi nhuận tương đối 𝑟𝑒𝑡𝑢𝑟𝑛𝑘 (𝑡) = 𝑃(𝑡) − 𝑃(𝑡 − 𝑘 ∗ 5) 𝑃(𝑡 − 𝑘 ∗ 5) Cách 3: Đo lợi nhuận tuyệt đối có hiệu chỉnh 𝑃 (𝑡) 𝑟𝑒𝑡𝑢𝑟𝑛𝑘 (𝑡) = 𝑙𝑜𝑔 ( ) 𝑃(𝑡 − 𝑘 ∗ 5) 44 Dựa vào kết trích chọn đặc trưng, tác giả nhận thấy: - Đặc trưng giá High hay giá Low có mức độ quan trọng cao có chênh lệch nhiều so với đặc trưng khác Vì đặc trưng quan trọng liệu tốn thu chạy mơ hình máy học XGBoost - Tiếp theo đặc trưng như: body, lower_tail, upper_tail Open có mức độ quan trọng xấp xỉ ngang - Phần lớn đặc trưng quan trọng hỗn hợp độ đo với ý nghĩa khác như:các số thống kê giá cổ phiếu biểu đồ Candlestick (lower_tail, upper_tail), suất sinh lợi giá trị trung bình trượt Kết biểu đặc trưng quan trọng trải số đo khác mà không tập trung vào đặc trưng giá Cuối cùng, thực nghiệm trích xuất đặc sử dụng thuật tốn máy học XGBoost, tác giả chọn 10 đặc trưng mô tả bảng 3.7 làm ngưỡng giá trị đặc trưng phía sau có mức độ quan trọng khơng đáng kể 3.3.1.2 Cấu trúc mơ hình LSTM Tác giả chia liệu làm hai phần: - Dữ liệu huấn luyện: bao gồm 567,451 quan trắc Ta chia liệu thành tập huấn luyện (training data) tương đương tập test1 tập đánh giá (validation data) tương đương tập test2 với tỉ lệ 7:3 liệu - Dữ liệu kiểm thử: Ta lấy ngẫu nhiên liệu để đánh giá mức độ xác mơ hình Lúc liệu tập kiểm thử bao gồm 141,863 quan trắc Tổng quan lớp cài đặt mơ hình minh họa hình 3.10 với hàm chuyển đổi selu theo công thức (2.28) (2.29) 45 LSTM Đặc trưng đầu vào (n chiều) LSTM layer LSTM layer LSTM layer + Tanh + Tanh + Selu (256) (128) (64) Dense (32) Dense Hình 3.10 Cấu trúc mô hình Các kỹ thuật trình huấn luyện bao gồm: - Adam Optimazation: phần mở rộng cho việc giảm độ dốc ngẫu nhiên, áp dụng rộng rãi cho ứng dụng phương pháp học sâu thị giác máy tính xử lý ngơn ngữ tự nhiên - Early Stopping: Nếu sau số lần chạy định mà độ đo cài đặt mơ hình khơng cải thiện tốt mơ hình kết thúc Tham số giúp làm giảm tốc độ thời gian chạy lần chạy không hiệu - Reduce Learning Rate: sử dụng để giảm tốc độ học với hệ số cài đặt mơ hình khơng cải tiến sau số lần định Tuy nhiên việc dừng sớm tham số Early Stopping huấn luyện khiến cho dự đốn tập kiểm tra bị giảm hồn tồn độ đo, nghiên cứu định số epoch cho mơ hình 50 3.3.2 Kết thực nghiệm Trong trình huấn luyện, tác giả sử dụng độ đo MSE làm hàm mát (loss function) để lựa chọn mơ hình số epoch tối ưu Dựa vào bảng 3.8 hình 3.11, tác giả nhận định mơ hình tốt (good fit) khơng xảy tượng q khớp hay cịn gọi overfitting – tượng không mong muốn thường gặp mơ hình tìm mang kết cao tập huấn luyện khơng có kết tốt tập kiểm tra tức mơ hình q trọng đến việc bắt chước đến tập huấn luyện 46 mà quên việc quan trọng tính tổng quát (Tiệp, 2017) Vì hàm mát tập huấn luyện hay gọi sai số huấn luyện (training loss) khởi đầu thấp so với sai số tập đánh giá (valid loss) Khi số vòng lặp (epoch) tăng lên sai số huấn luyện sai số đánh giá có xu hướng giảm Điều hợp lý qua số lần huấn luyện, việc xấp xỉ dự báo kết xác Khi sai số huấn luyện giảm dần đến điểm ổn định đồng thời sai số kiểm thử giảm đến mức ổn định trì khoảng cách nhỏ với sai số huấn luyện Đồng thời trước hàm mát hội tụ, ta dùng thuật toán kết thúc sớm (early stopping) – giải pháp để giảm tượng q khớp để thu mơ hình tốt thời điểm sai số huấn luyện có xu hướng giảm sai số kiểm thử có xu hướng tăng lên ta kết thúc thuật tốn Bảng 3.8 Sai số tập huấn luyện tập đánh giá Training Loss Valid Loss 4.50 x 10-3 1.40 x 10-3 2.52 x 10-4 2.23 x 10-4 5.14 x 10-6 8.57 x 10-6 1.07 x 10-5 6.65 x 10-7 5.25 x 10-7 4.91 x 10-7 4.79 x 10-7 4.75 x 10-7 4.74 x 10-7 1.12 x 10-2 5.50 x 10-3 3.50 x 10-3 3.90 x 10-3 4.53 x 10-4 7.99 x 10-5 5.50 x 10-5 1.70 x 10-5 1.44 x 10-5 9.06 x 10-6 9.86 x 10-6 9.25 x 10-6 9.51 x 10-6 47 Hình 3.11 Đồ thị thể xu hướng sai số tập huấn luyện tập đánh giá Bảng 3.10 trình bày kết dự báo phương pháp học sâu đánh giá độ đo trình bày mục 2.5 Hình 3.12 thể đường dự báo với màu đỏ đường giá trị thực tế hiển thị màu xanh biểu đồ Có thể thấy giá trị dự báo sát cao với giá trị thực tế với sai số trung bình bình phương thể chênh lệch mức 3.465 x 10-7 độ đo khác với sai số thấp Cấu trúc mạng cài đặt thực nghiệm có lớp ẩn với hàm kích hoạt thể hình 3.10 Hình 3.12 Đồ thị thể kết dự báo sử dụng phương pháp LSTM 48 Bảng 3.9 Kết mơ hình LSTM Dữ liệu thực tế Dữ liệu dự báo 1.267860 1.268110 1.268230 1.268460 1.268660 ⋮ 1.252120 1.252720 1.252480 1.252190 1.252190 1.252210 1.252200 1.251690 1.267744 1.268210 1.268661 1.268563 1.268538 ⋮ 1.251820 1.252840 1.252201 1.252538 1.252215 1.251961 1.252945 1.252231 Bảng 3.10 Đánh giá kết dự báo mơ hình LSTM Chỉ số Kết MAE MSE RMSE 0.0003825957 0.0000003465 0.0005887273 3.4 Đánh giá Các kết thực nghiệm mơ hình ARIMA, LSTM đánh giá độ đo trình bày mục 2.5 trình bày bảng 3.11 Các kết thể độ tương đồng định độ đo Các độ đo với giá trị thấp thể độ xác phương pháp Tác giả nhận thấy phương pháp dự báo chuỗi thời gian ARIMA tập trung vào liệu đơn biến với mối quan hệ tuyến tính phụ thuộc vào thời gian theo trình tự Đồng thời, thực phương pháp ARIMA cần ước lượng thủ công để lựa chọn tham số phù hợp cho liệu 49 Đối với phương pháp học sâu, số lần đào tạo hay gọi số epoch không ảnh hưởng đến hiệu mơ hình Mạng LSTM xử lý với liệu lớn cách chia liệu thành nhiều đợt nhỏ huấn luyện mô hình theo giai đoạn tuỳ vào số kích cỡ mẫu số lần lặp cài đặt Với quan sát thời điểm từ chuỗi, mạng LSTM tìm hiểu quan sát liên quan thấy khứ xác định mức độ phù hợp mơ hình dự báo Vì tìm mối tương quan dài hạn theo trình tự nên mơ hình hóa chuỗi đa biến phức tạp Chính vậy, kết dự báo cho thấy phương pháp học sâu mà cụ thể mô hình LSTM đem lại kết dự báo tốt vượt trội so với ARIMA so sánh dựa ba độ đo đánh giá Kết đồng với liệu nghiên cứu khác Khi áp dụng liệu VN-Index, Son cộng (2020) đưa kết luận mơ hình LSTM giúp đưa dự đốn xác sử dụng liệu khứ kết hợp với đặc trưng báo tài khác liệu giá chứng khốn Việt Nam so sánh với mơ hình phân tích chuỗi thời gian ARIMA Tuy nhiên, nghiên cứu đề cập nhược điểm phương pháp học sâu có độ phức tạp thời gian cao so với phương pháp truyền thống Thay vào đó, mơ hình học sâu đem lại hiệu suất ổn định dài hạn so với mơ hình ARIMA (Nguyen cộng sự, 2019) Bảng 3.11 Kết Phương pháp MSE MAE RMSE ARIMA LSTM 6.114 x 10-7 3.465 x 10-7 4.149 x 10-4 3.825 x 10-4 7.819 x 10-4 5.887x 10-4 50 KẾT LUẬN Đề tài nghiên cứu tổng quan toán liệu chuỗi thời gian khái quát kiến thức kỹ thuật học sâu Kết bật mà đề tài đạt cài đặt xây dựng thành công mơ hình dự báo giá chứng khốn sử dụng mạng nhớ dài ngắn hạn, kết hợp tiền xử lí kĩ thuật trích xuất đặc trưng thuật tốn máy học XGBoost Đồng thời so sánh với mơ hình ARIMA thường sử dụng liệu dạng chuỗi thời gian, cho thấy hiệu phương pháp học sâu vượt trội so với kỹ thuật truyền thống Kết dự báo giúp nhà đầu tư tham khảo để đưa định đầu tư hoạch định thị trường chứng khốn với độ xác tin cậy cao Bên cạnh kết đạt được, đề tài cịn hạn chế, thực nghiệm liệu nên chưa thể tổng quát hóa cho liệu khác Đồng thời hiệu ổn định mơ hình phụ thuộc vào kĩ thuật tiền xử lý thuật tốn trích xuất đặc trưng phù hợp mà kĩ thuật phần lớn thay đổi tùy vào đặc tính thống kê tốn học liệu đầu vào Chính vậy, hướng nghiên cứu mở rộng liệu chuỗi thời gian tương tự để xây dựng kĩ thuật tiền xử lí trích xuất đặc trưng phù hợp Đồng thời, đề tài tiếp tục nghiên cứu mơ hình tiên tiến khác ứng dụng phương pháp học sâu tối ưu hoá tham số để cải thiện độ xác mơ hình 51 Tài liệu tham khảo [1] Adebiyi, A A., Adewumi, A O., & Ayo, C K (2014) Comparison of ARIMA and artificial neural networks models for stock price prediction Journal of Applied Mathematics [2] Ben‐Gal, I (2008) Bayesian networks Encyclopedia of statistics in quality and reliability [3] Box, G E., & Jenkins, G M (1976) Time series analysis: Forecasting and control San Francisco Calif: Holden-Day [4] CBInsight (2018) The Fintech 250: The Top Fintech Startups Of 2018 Truy cập từ [5] Dong, N Q., & Minh, N T (2012) Giáo trình kinh tế lượng Khoa toán Kinh tế, Trường Đại Học Kinh tế Quốc Dân [6] Fischer, T., & Krauss, C (2018) Deep learning with long short-term memory networks for financial market predictions European Journal of Operational Research, 270(2), 654-669 [7] Friedman, J H (2001) Greedy function approximation: a gradient boosting machine Annals of statistics, 1189-1232 [8] Friedman, J., Hastie, T., & Tibshirani, R (2000) Additive logistic regression: a statistical view of boosting (with discussion and a rejoinder by the authors) The annals of statistics, 28(2), 337-407 [9] Gan, C., Lee, M., Yong, H H A., & Zhang, J (2006) Macroeconomic variables and stock market interactions: New Zealand evidence Investment management and financial innovations, (3, Iss 4), 89-101 [10] Hamilton, J D (1994) Time series analysis (Vol 2, pp 690-696) New Jersey: Princeton [11] Hồi, N T., Bình, P T., & Duy, N K (2009) Dự báo phân tích liệu kinh tế tài Nhà xuất Thống kê 52 [12] Hochreiter, S., & Schmidhuber, J (1997) Long short-term memory Neural computation, 9(8), 1735-1780 [13] Hossain, M A., Karim, R., Thulasiram, R., Bruce, N D., & Wang, Y (2018, November) Hybrid deep learning model for stock price prediction In 2018 IEEE Symposium Series on Computational Intelligence (SSCI) (pp 18371844) IEEE [14] Jain, A K., Mao, J., & Mohiuddin, K M (1996) Artificial neural networks: A tutorial Computer, 29(3), 31-44 [15] Jiang, Q., Tang, C., Chen, C., Wang, X., & Huang, Q (2018, August) Stock price forecast based on LSTM neural network In International Conference on Management Science and Engineering Management (pp 393-408) Springer, Cham [16] Kendall, M G., & Hill, A B (1953) The analysis of economic time-seriespart i: Prices Journal of the Royal Statistical Society Series A (General), 116(1), 11-34 [17] Kumar (2017) Man Group Hedge Funds Are Said to Embrace MachineLearning Algos Truy cập từ [18] Malkiel, B G., & Fama, E F (1970) Efficient capital markets: A review of theory and empirical work The journal of Finance, 25(2), 383-417 [19] Milosevic, N (2016) Equity forecast: Predicting long term stock price movement using machine learning arXiv preprint arXiv:1603.00751 [20] Mitchell, T M (1997) Evaluating hypotheses Machine Learning, 128-153 [21] Nelson, D M., Pereira, A C., & de Oliveira, R A (2017, May) Stock market's price movement prediction with LSTM neural networks In 2017 International joint conference on neural networks (IJCNN) (pp 1419-1426) IEEE [22] Nguyen, T P., Van, T D., Le, N T., Mai, T T., & Nguyen-An, K (2019, December) An Intensive Empirical Study of Machine Learning Algorithms for 53 Predicting Vietnamese Stock Prices In International Conference on Computer Science, Applied Mathematics and Applications (pp 291-303) Springer, Cham [23] Osborne, M F (1959) Brownian motion in the stock market Operations research, 7(2), 145-173 [24] Pearl, J., & Russell, S (2001) Bayesian Networks Handbook of Brain Theory and Neural Networks [25] Quang, B (2010) Ứng dụng mơ hình ARIMA để dự báo VNINDEX [26] Rather, A M., Agarwal, A., & Sastry, V N (2015) Recurrent neural network and a hybrid model for prediction of stock returns Expert Systems with Applications, 42(6), 3234-3241 [27] Rumelhart, D E., Hinton, G E., & Williams, R J (1986) Learning representations by back-propagating errors Nature, 323(6088), 533-536 [28] Selvin, S., Vinayakumar, R., Gopalakrishnan, E A., Menon, V K., & Soman, K P (2017, September) Stock price prediction using LSTM, RNN and CNNsliding window model In 2017 International Conference on advances in computing, communications and informatics (icacci) (pp 1643-1647) IEEE [29] Shiller, R J (2003) From efficient markets theory to behavioral finance Journal of economic perspectives, 17(1), 83-104 [30] Siami-Namini, S., Tavakoli, N., & Namin, A S (2018, December) A comparison of ARIMA and LSTM in forecasting time series In 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA) (pp 1394-1401) IEEE [31] Son, H H., Hoang, N T., Lien, T T P., & Ngoc, T M (2020, February) Comparison Between ARIMA and LSTM-RNN for VN-Index Prediction In International Conference on Intelligent Human Systems Integration (pp 1107-1112) Springer, Cham [32] Thomsett, M C (1998) Mastering fundamental analysis Dearborn Trade Publishing 54 [33] Tiệp, V H (2017) Machine Learning [34] Zuo, Y., & Kita, E (2012) Stock price forecast using Bayesian network Expert Systems with Applications, 39(8), 6729-6737 ... việc dự đoán giá chứng khoán ngắn hạn Hiệu phương pháp học sâu – ANN – so sánh với ARIMA thể kết vượt trội dự báo liệu chuỗi thời gian Các phương pháp học sâu ứng dụng dự báo giá chứng khoán. .. ? ?Ứng dụng phương pháp học sâu dự báo giá chứng khoán? ?? Nghiên cứu sử dụng kỹ thuật học sâu để tận dụng ưu toán liệu chuỗi thời gian 1.2 Mục tiêu nghiên cứu Nghiên cứu thực để dự báo giá chứng khoán. .. khoán dựa phương pháp học sâu Hai mục tiêu nghiên cứu đề xuất bao gồm: Sử dụng mơ hình đề xuất để dự báo giá chứng khoán Đánh giá, so sánh mơ hình dự báo 7 1.3 Phương pháp nghiên cứu 1.3.1 Phương

Ngày đăng: 18/11/2020, 10:10

Xem thêm:

TỪ KHÓA LIÊN QUAN

Mục lục

    DANH MỤC BẢNG BIỂU

    DANH MỤC TỪ VIẾT TẮT

    CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI

    1.1 Lý do chọn đề tài nghiên cứu

    1.2 Mục tiêu nghiên cứu

    1.3 Phương pháp nghiên cứu

    1.3.1 Phương pháp tiếp cận

    1.3.2 Quy trình nghiên cứu

    1.4 Phạm vi và đối tượng nghiên cứu

    1.5 Đóng góp của nghiên cứu

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w