Ứng dụng học máy trong nghiên cứu và dự báo giá chứng khoán

78 16 0
Ứng dụng học máy trong nghiên cứu và dự báo giá chứng khoán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG HỌC MÁY TRONG NGHIÊN CỨU VÀ DỰ BÁO GIÁ CHỨNG KHỐN Ngành: Tài – Ngân hàng Mã số: 34 02 01 ĐÀO THANH KIÊN TP HỒ CHÍ MINH, NĂM 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG HỌC MÁY TRONG NGHIÊN CỨU VÀ DỰ BÁO GIÁ CHỨNG KHOÁN Ngành: Tài – Ngân hàng Mã số: 34 02 01 Họ tên sinh viên: ĐÀO THANH KIÊN Mã số sinh viên: 050607190209 Lớp sinh hoạt: HQ7 – GE16 NGƢỜI HƢỚNG DẪN KHOA HỌC TS LƢU THU QUANG TP HỒ CHÍ MINH, NĂM 2023 i TĨM TẮT Dự đốn xác giá thị trường chứng khốn nhiệm vụ khó khăn tính chất khơng ổn định phi tuyến tính cổ phiếu thị trường Tuy nhiên, năm gần đây, với phát triển nhanh chóng cơng nghệ, đặc biệt học máy, học sâu trí tuệ nhân tạo, việc ứng dụng chúng để xử lý lượng lớn liệu phát mơ hình phức tạp mở nhiều hướng đầy tiềm quan trọng lĩnh vực tài Trong nghiên cứu này, tơi xây dựng mơ hình học máy, bao gồm Long short-term memory (LSTM), Rừng ngẫu nhiên (Random Forest), mơ hình dự báo AutoRegressive Integrated Moving Average with eXogenous variables (ARIMAX) để dự đốn giá đóng cửa cơng ty Apple thị trường chứng khoán Mục tiêu nghiên cứu kiểm tra hiệu suất mô hình việc dự đốn giá chứng khốn so sánh chúng với Các mơ hình huấn luyện đánh giá cách sử dụng số tiêu chuẩn Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Median Absolute Error (MedAE), Median Absolute Percentage Error (MedAPE) Những số giúp đánh giá mức độ xác mơ hình xác định mơ hình hoạt động tốt việc dự đoán ứng dụng sâu mơ hình học máy ii ABSTRACT Accurately predicting prices in the stock market is a challenging task due to the volatile and non-linear nature of stocks However, in recent years, with the rapid development of technology, particularly machine learning, deep learning, and artificial intelligence, applying them to process large volumes of data and detect complex patterns has opened up numerous promising and significant avenues in the field of finance In this study, I have constructed machine learning models, including Long short-term memory (LSTM), Random Forest, and the AutoRegressive Integrated Moving Average with eXogenous variables (ARIMAX) forecasting model, to predict the closing price of Apple Inc on the stock market The objective of the research is to assess the performance of these models in stock price prediction and to compare their outcomes The models were trained and evaluated using standard metrics such as Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Median Absolute Error (MedAE), and Median Absolute Percentage Error (MedAPE) These metrics assist us in assessing the accuracy of the models and determining which model performs best in prediction and in exploring further applications of machine learning models iii LỜI CAM ĐOAN Tôi xin cam đoan đề tài “Ứng dụng học máy phân tích dự đốn giá chứng khốn” tơi thực dự hướng dẫn khoa học TS Lưu Thu Quang Bài luận tổng hợp tự nghiên cứu riêng tôi, kết nghiên cứu trung thực, không chứa nội dung công bố từ trước nội dung người khác thực từ trích dẫn trích nguồn luận TP Hồ Chí Minh, ngày tháng năm 2023 Ngƣời thực Đào Thanh Kiên iv LỜI CẢM ƠN Tôi xin gửi lời cảm ơn chân thành sâu sắc đến Ban Giám hiệu Trường Đại học Ngân hàng TP Hồ Chí Minh tổ chức tạo điều kiện thuận lợi cho tơi hồn thành chương trình đào tạo Đại học quy chất lượng cao, chuyên ngành Tài - Ngân hàng Đồng thời, xin gửi lời cảm ơn đến tất giáo viên tham gia dạy, chia sẻ kiến thức cho tôi, thầy cô quản lý thuộc Khoa Đại học suốt thời gian tham gia lớp học Kính chúc tồn thể tồn thể quý thầy cô sức khỏe thật tốt để tiếp tục sứ mệnh truyền đạt kiến thức cho hệ tương lai Đặc biệt, tơi muốn bày tỏ lịng biết ơn tôn trọng ThS Lưu Thu Quang, người tận tâm hướng dẫn, giúp đỡ truyền đạt kiến thức kinh nghiệm quý báu suốt q trình nghiên cứu, giúp tơi hồn thành khóa luận tốt nghiệp cách xuất sắc Cuối cùng, tơi muốn bày tỏ lịng biết ơn sâu sắc đến gia đình tất bạn lớp HQ7 - GE16, người bạn tôi, người ln động viên khích lệ tơi thời điểm khó khăn đồng hành, hỗ trợ tơi trình học tập nghiên cứu trường đại học Các bạn tạo điều kiện tốt để tơi hồn thành thành cơng khóa luận đại học TP Hồ Chí Minh, ngày tháng năm 2023 Ngƣời thực Đào Thanh Kiên v MỤC LỤC DANH MỤC TỪ VIẾT TẮT vii DANH MỤC BẢNG ix DANH MỤC HÌNH x CHƢƠNG 1: GIỚI THIỆU VỀ ĐỀ TÀI NGHIÊN CỨU 1.1 Tính cấp thiết đề tài 1.2 Mục tiêu nghiên cứu .3 1.2.1 Mục tiêu tổng quát 1.2.2 Mục tiêu cụ thể 1.3 Câu hỏi nghiên cứu 1.4 Đối tƣợng phạm vi nghiên cứu 1.4.1 Đối tượng nghiên cứu 1.4.2 Phạm vi nghiên cứu 1.5 Phƣơng pháp nghiên cứu .4 1.6 Đóng góp đề tài .4 1.7 Bố cục nghiên cứu CHƢƠNG 2: TỔNG QUAN LÝ THUYẾT 2.1 Tổng quan dự báo chứng khoán .7 2.1.1 Khái niệm dự báo 2.1.2 Dự báo chứng khoán 2.2 Tổng quan chung liệu 2.2.1 Dữ liệu số 2.2.2 Dữ liệu số kỹ thuật 2.2.3 Dữ liệu vĩ mô 2.2.4 Dữ liệu khác vi 2.3 Tổng quan Python 2.4 Tổng quan Machine Learning 11 2.4.1 Giới thiệu học máy 11 2.4.2 Khai phá liệu 11 2.5 Giới thiệu số máy học 14 2.5.1 Mơ hình mạng nơron nhân tạo 14 2.5.2 Mơ hình Long Short-Term Memory (LSTM) 16 2.5.3 Mơ hình Rừng Ngẫu Nhiên 19 CHƢƠNG 3: Xây dựng MƠ HÌNH NGHIÊN CỨU 22 3.1 Tổng quan xây dựng Machine Learing 22 3.2 Xây dựng mô Machine Learning .23 3.2.1 Thu thập chuẩn bị Dữ liệu 23 3.2.2 Khám phá Tiền xử lý Dữ liệu 31 3.3.3 Xây dựng mơ hình học máy 33 3.3.4 Kiểm định đánh giá mơ hình 36 CHƢƠNG 4: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 38 4.1 Tổng quan liệu phƣơng pháp nghiên cứu 38 4.1.1 Thống kê liệu đầu vào 38 4.1.2 Đánh giá mức độ tương quan hai biến số 41 4.1.3 Chuẩn hóa liệu 42 4.1.4 Chia liệu thành tập huấn luyện kiểm tra 43 4.2 Kết xây đựng mơ hình 43 CHƢƠNG 5: KẾT LUẬN VÀ ĐÁNH GIÁ 47 5.1 Tóm tắt nghiên cứu .47 5.2 Tiềm khai thác 49 vii DANH MỤC TỪ VIẾT TẮT STT TỪ VIẾT TẮT AI ANN ANN CCI CPI DGS EMA GDP KDD 10 LSTM 11 MA 12 MAE 13 MAPE TIẾNG ANH Artificial Intelligence Artificial Neural Network Artificial Neural Network Commodity Channel Index Consumer Price Index Government Securities Yield TIẾNG VIỆT Trí tuệ nhân tạo Mạng lưới thần kinh nhân tạo Mạng lưới thần kinh nhân tạo Chỉ số kênh hàng hóa Chỉ số giá tiêu dùng Độ lợi suất Chính phủ Exponential Moving Đường trung bình động mở Average rộng Gross Domestic Product Tổng sản phẩm nội địa Knowledge Discovery in Databases Khai phá liệu Long short term memory Bộ Nhớ Dài-Ngắn Hạn Moving Average Đường trung bình động Median Absolute Error Lỗi tuyệt đối trung bình Mean Absolute Tỷ lệ phần trăm tuyệt đối Percentage Error trung bình viii Median Absolute Tỷ lệ phần trăm tuyệt đối Percentage Error trung vị Machine Learning Học Máy On-Balance Volume Chỉ số Khối Lượng Dương R2 R-squared R bình phương 18 RF Random Forest Rừng Ngẫu Nhiên 19 RNN 20 RSI 14 MDAPE 15 ML 16 OBV 17 Recurrent Neural Networks Relative Strength Index Mạng nơ-ron hồi quy Chỉ số sức mạnh tương đối Chỉ số thị trường chứng khoán 21 S&P500 Standard & Poor's 500 500 cơng ty lớn uy tín nước Mỹ 22 VWAP Volume Weighted Giá trung bình theo khối Average Price lượng giao dịch

Ngày đăng: 01/12/2023, 08:29

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan