TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI PHÂN HIỆU TẠI THÀNH PHỐ HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ THÔNG TIN BÁO CÁO ĐỒ ÁN TỐT NGHIỆP ĐỀ TÀI NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT LOGISTIC REGRESSION KẾT HỢP MÔ HÌNH LST[.]
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI PHÂN HIỆU TẠI THÀNH PHỐ HỒ CHÍ MINH BỘ MƠN CƠNG NGHỆ THƠNG TIN BÁO CÁO ĐỒ ÁN TỐT NGHIỆP ĐỀ TÀI: NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT LOGISTIC REGRESSION KẾT HỢP MƠ HÌNH LSTM VÀO DỰ ĐỐN THỊ TRƯỜNG CHỨNG KHỐN Giảng viên hướng dẫn: ThS TRẦN PHONG NHÃ Sinh viên thực hiện: ĐỒN LÊ MỸ LINH Lớp: CƠNG NGHỆ THƠNG TIN Khóa: 59 TP Hồ Chí Minh, năm 2022 TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI PHÂN HIỆU TẠI THÀNH PHỐ HỒ CHÍ MINH BỘ MƠN CƠNG NGHỆ THƠNG TIN BÁO CÁO ĐỒ ÁN TỐT NGHIỆP ĐỀ TÀI: NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT LOGISTIC REGRESSION KẾT HỢP MÔ HÌNH LSTM VÀO DỰ ĐỐN THỊ TRƯỜNG CHỨNG KHỐN Giảng viên hướng dẫn: ThS TRẦN PHONG NHÃ Sinh viên thực hiện: ĐỒN LÊ MỸ LINH Lớp: CƠNG NGHỆ THƠNG TIN Khóa: 59 TP Hồ Chí Minh, năm 2022 TRƯỜNG ĐẠI HỌC GIAO THƠNG VẬN TẢI CỘNG HỊA XÃ HỘI CHỦ NGHIÃ VIỆT NAM PHÂN HIỆU TẠI THÀNH PHỐ HỒ CHÍ MINH Độc lập – Tự – Hạnh phúc NHIỆM VỤ THIẾT KẾ TỐT NGHIỆP BỘ MÔN: CÔNG NGHỆ THÔNG TIN -*** Mã sinh viên: 5951071049 Họ tên: Đồn Lê Mỹ Linh Khóa: 59 Lớp: Công nghệ thông tin Tên đề tài: Nghiên cứu ứng dụng kỹ thuật Logistic Regression kết hợp mơ hình LSTM vào dự đốn thị trường chứng khốn Mục tiêu: Tìm hiểu ngơn ngữ Python nghiên cứu số thuật toán máy học phân tích dự đốn kết Logistic Regression, Long – short term memory Từ ứng dụng vào phân tích đưa dự đốn giá dựa dataset chứng khoán Nội dung thực hiện: - Tìm hiểu ngơn ngữ Python thư viện cần sử dụng - Tìm hiểu sơ Machine Learning - Nghiên cứu thuật toán máy học: Logistic Regression mơ hình Long – short term memory - Nghiên cứu tốn phân tích dự đốn giá chứng khốn - Áp dụng kiến thức: ứng dụng ngơn ngữ Python thuật tốn vào phân tích đưa dự đốn giá chứng khốn Cơng nghệ, cơng cụ ngơn ngữ lập trình - Cơng cụ sử dụng: Visual Studio Code - Ngôn ngữ: Python Các kết dự kiến - Hiểu sử dụng ngơn ngữ lập trình Python - Hiểu thuật toán máy học cần sử dụng - Cài đặt môi trường sử dụng ngôn ngữ - Áp dụng kiến thức cho kết Kế hoạch thực - Tuần 1-2 3: Tìm chọn đề tài - Tuần 4: Đưa lựa chọn đề tài Đoàn Lê Mỹ Linh – K59 - Tuần 5-6: Tìm hiểu ngơn ngữ Python, thư viện cần sử dụng, đọc sách ứng dụng AI vào phân tích thị trường chứng khốn - Tuần đến 11: Nghiên cứu thuật toán máy học áp dụng kiến thức vào toán - Tuần 12: Viết báo cáo làm slide - Tuần 13: Nộp báo cáo chờ duyệt Giảng viên cán hướng dẫn Họ tên: ThS TRẦN PHONG NHÃ Đơn vị công tác: Trường Đại học Giao thông Vận tải Phân hiệu TP Hồ Chí Minh Điện thoại: 0906 761 014 Ngày tháng năm 2022 Trưởng BM Công nghệ Thông tin Email: tpnha@utc2.edu.vn Đã giao nhiệm vụ TKTN Giảng viên hướng dẫn Trần Phong Nhã Đoàn Lê Mỹ Linh – K59 LỜI CẢM ƠN Trước hết tơi xin gửi lời cảm ơn bày tỏ lịng biết ơn chân thành đến thầy Trần Phong Nhã, người định hướng, cung cấp cho kiến thức, nguồn tài liệu tận tình hướng dẫn bảo tơi suốt q trình thực đồ án tốt nghiệp Tơi xin chân thành cảm ơn thầy, cô giáo Bộ môn Công Nghệ Thông Tin – Phân hiệu trường Đại học Giao Thông Vận Tải TP Hồ Chí Minh dạy bảo, truyền tải kiến thức, tạo điều kiện tốt suốt q trình tơi học tập trường Tơi xin gửi lời cảm ơn sâu sắc đến gia đình, người thân đồng hành, ủng hộ động viên học tập sống Cuối cùng, xin chân thành cảm ơn bạn sinh viên lớp Công Nghệ Thông Tin K59 giúp đỡ, chia sẻ khuyến khích tơi suốt q trình học tập chung trường Hồ Chí Minh, ngày 10 tháng năm 2022 Sinh viên Đoàn Lê Mỹ Linh Đoàn Lê Mỹ Linh – K59 NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN Tp Hồ Chí Minh, ngày ….… tháng ….… năm ….… Giảng viên hướng dẫn Trần Phong Nhã Đoàn Lê Mỹ Linh – K59 MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT iii DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ iv MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nhiệm vụ đồ án Bố cục đồ án CHƯƠNG 1.1 CƠ SỞ LÝ THUYẾT Chứng khoán thị trường chứng khoán [1] 1.1.1 Chứng khoán 1.1.2 Thị trường chứng khoán 1.2 Mối liên hệ Học máy Thị trường chứng khốn [12] 1.3 Ngơn ngữ Python 1.3.1 Giới thiệu 1.3.2 Một số thư viện ngôn ngữ Python 1.4 Tổng quan Machine Learning 1.4.1 Giới thiệu 1.4.2 Phân loại học máy [13] 1.5 Kỹ thuật học máy Logistic Regression 1.5.1 Giới thiệu Logistic Regression 1.5.2 Hàm Logistic Regression [9] 10 1.5.3 Hồi quy Logistic nhị phân [8] 11 1.5.4 Ưu – nhược điểm [11] 12 1.6 Học sâu (Deep Learning) 13 1.7 Dữ liệu chuỗi thời gian (Time series data) 15 1.8 Mạng RNN 17 1.8.1 Định nghĩa [17] 17 1.8.2 Mơ hình RNN [17] 17 1.8.3 Ưu điểm hạn chế kiến trúc RNN 20 1.9 Mạng LSTM 21 1.9.1 Giới thiệu [15] 21 Đoàn Lê Mỹ Linh – K59 i 1.9.2 Kiến trúc [15] 21 CHƯƠNG PHÂN TÍCH BÀI TỐN 25 2.1 Chuẩn bị phân tích liệu 25 2.2 Xây dựng mơ hình 27 2.3 Phương pháp đánh giá mơ hình 28 CHƯƠNG THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 30 3.1 Dữ liệu thực nghiệm 30 3.2 Môi trường thực nghiệm 30 3.3 Xây dựng thực nghiệm 30 3.3.1 Thực nghiệm với thuật toán Logistic 30 3.3.2 Thực nghiệm với mơ hình LSTM 37 KẾT LUẬN 42 Kết đạt 42 Hạn chế 42 Hướng phát triển 42 TÀI LIỆU THAM KHẢO 44 Đoàn Lê Mỹ Linh – K59 ii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT STT Từ đầy đủ Từ viết tắt AI Artificial Intelligence ANN Autoenconder AT Agorithmic Trading CNN Convolutional Neuron Network CRM Customer Relationship Management DBN Deep Belief Net DNA Deoxyribonucleic Acid DNN Deep Neuron Network GDP Gross Domestic Product 10 GPU Graphics Processing Unit 11 IoT Internet of Things 12 LSTM Long-short Term Memory 13 ML Machine Learning 14 MLE Maximum Likelihood Estimation 15 RNN Recurrent Neural Network Đoàn Lê Mỹ Linh – K59 iii DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1 Lợi ích ứng dụng máy học Hình 1.2 Ứng dụng máy học giao dịch thuật tốn Hình 1.3 Mơ hình hóa hàm Sigmoid 11 Hình 1.4 Ứng dụng Deep learning 14 Hình 1.5 Ví dụ Time series 15 Hình 1.6 Mạng RNN 17 Hình 1.7 Một state mạng RNN 18 Hình 1.8 Các activation functions 19 Hình 1.9 Các kiểu mạng RNN 19 Hình 1.10 Mạng LSTM 21 Hình 1.11 Một state mạng LSTM 22 Hình 1.12 Cổng Forget 22 Hình 1.13 Cổng Input 22 Hình 1.14 Cổng Output 23 Hình 1.15 Giá trị state C 23 Hình 1.16 Ct LSTM 23 Hình 2.1 Ví dụ số mẫu liệu 25 Hình 2.2 Confusion matrix 28 Hình 3.1 Kết đọc file csv 31 Hình 3.2 Tỉ suất lợi nhuận cột Adj Close 31 Hình 3.3 Tỉ suất lợi nhuận ngày 31 Hình 3.4 Dữ liệu volume scale khoảng [0;1] 32 Hình 3.5 Dữ liệu loại bỏ giá trị trống 32 Hình 3.6 Bảng giá trị hàm Logit 32 Hình 3.7 Kết dự đốn tập huấn luyện 33 Hình 3.8 Ma trận lỗi tập huấn luyện 33 Hình 3.9 Ma trận lỗi tập test (biến ngày) 34 Hình 3.10 Tỉ suât lợi nhuận ngày trước ngày dự đốn 35 Hình 3.11 Dữ liệu cho thực nghiệm 35 Hình 3.12 Kết dự đoán tập huấn luyện (thực nghiệm 2) 35 Đoàn Lê Mỹ Linh – K59 iv Hình 3.1 Kết đọc file csv Thực nghiệm 1: Dùng hàm pct_change() Hàm so sánh phần tử với phần tử trước tính tỷ suất lợi nhuận theo công thức 2.1 - Thu kết sau: Hình 3.2 Tỉ suất lợi nhuận cột Adj Close - Tạo cột tên “Today” để lưu giá trị vừa tính - Thực tính Lag, ta thu kết quả: Đặt Lag1,…,Lag5 tỉ suất lợi nhuận ngày liền trước ngày tại, tức ngày cột “Today” Hình 3.3 Tỉ suất lợi nhuận ngày Đoàn Lê Mỹ Linh – K59 31 - Scale khối lượng cổ phiếu cách lấy “số lượng / 100000000”, đặt tên cột “vol”, thu được: Hình 3.4 Dữ liệu volume scale khoảng [0;1] - Sử dụng hàm dropna() để loại bỏ dịng có liệu trống Đồng thời xác định chiều tăng - giảm “Direction” giá chứng khoán dựa theo giá trị cột “Today”, giá trị lớn Direction 1, ngược lại 0, thu được: Hình 3.5 Dữ liệu loại bỏ giá trị trống Sử dụng hàm Logit() với biến đầu “Direction”, biến đầu vào “Lag” từ đến “vol” Kết trả về: - Hình 3.6 Bảng giá trị hàm Logit Đồn Lê Mỹ Linh – K59 32 - Trong bảng kết có hệ số coefficients, sai số chuẩn standard errors, kiểm định z z-statistic, p-values biến có giá trị thống kê - Dữ liệu bảng cho thấy biến “Lag” khơng có giá trị thống kê - Thực huấn luyện mơ hình dự đốn hàm predict(), dự đoán thu giá trị từ đến 1, biểu thị cho xác suất tăng giá cổ phiếu Nên giá trị lớn 0.5 tăng (Up), nhỏ 0.5 giảm (Down) prediction = result.predict(x) với x biến đầu vào “Lag” từ đến “vol” - Thiết lập ma trận lỗi (confusion matrix) dựa chuyển đổi giá trị dự đoán (Predicted) giá trị thật (Real) giá chứng khoán số Up Down để đo lường hiệu suất dự đốn Từ tính độ xác dự đốn def confusion_matrix(real, pred): predtrans = ['Up' if i > 0.5 else 'Down' for i in pred] rl = ['Up' if i > else 'Down' for i in real] confusion_matrix = pd.crosstab(pd.Series(rl), pd.Series(predtrans), rownames=['Real'],colnames=['Predicted']) return confusion_matrix Kết dự đốn: Hình 3.7 Kết dự đoán tập huấn luyện Kết ma trận: Hình 3.8 Ma trận lỗi tập huấn luyện o Độ xác dự đốn Accuracy: 253 + 800 𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = = 0.6240039841 253 + 713 + 242 + 800 Đoàn Lê Mỹ Linh – K59 33 Độ xác dự đốn huấn luyện xấp xỉ 62% Các giá trị tăng thật dự đoán tăng 800 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0.7677543186 242 + 800 Vậy số giá trị tăng thật dự đoán tăng xấp xỉ 77% Thực chia tập liệu để train test o - - Tập x_train biến đầu vào gồm biến Lag biến vol y_train biến Direction x_train = df[df.year < 2020][name] y_train = df[df.year < 2020]['Direction'] x_test = df[df.year >= 2020][name] y_test = df[df.year >= 2020]['Direction'] x_train, y_train lấy giá trị từ 2014 đến cuối năm 2019 x_test, y_test lấy giá trị từ năm 2020 đến hết Huấn luyện tập train sau: - model = sm.Logit(y_train,x_train) rs = model.fit() - Dự đoán tập test: - Ma trận lỗi có dạng: prediction = rs.predict(x_test) Hình 3.9 Ma trận lỗi tập test (biến ngày) o o Độ xác dự đoán Accuracy: 116 + 139 𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = = 0.505952381 116 + 106 + 143 + 139 Độ xác dự đoán thực nghiệm xấp xỉ 50% Các giá trị tăng thật dự đoán tăng 139 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0.4929078014 139 + 143 Vậy số giá trị tăng thật dự đoán tăng xấp xỉ 49% Đoàn Lê Mỹ Linh – K59 34 Thực nghiệm 2: - Tính tỉ suất lợi nhuận ngày trước ngày dự đốn: Hình 3.10 Tỉ st lợi nhuận ngày trước ngày dự đoán - Tương tự thực nghiệm 1, scale volume khoảng [0;1], loại bỏ liệu trống gắn nhãn, ta được: Hình 3.11 Dữ liệu cho thực nghiệm - Kết dự đốn tập huấn luyện: Hình 3.12 Kết dự đoán tập huấn luyện (thực nghiệm 2) Đoàn Lê Mỹ Linh – K59 35 - Ma trận lỗi tập huấn luyện: Hình 3.13 Ma trận lỗi tập huấn luyện (thực nghiệm 2) o - Độ xác dự đốn Accuracy: 149 + 902 𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = = 0.5223658052 149 + 819 + 142 + 902 Độ xác dự đốn tập test xấp xỉ 52% o Các giá trị tăng thật dự đoán tăng 902 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0.8639846743 142 + 902 Vậy số giá trị tăng thật dự đoán tăng xấp xỉ 86% Thực chia tập liệu để train test - Tập x_train biến đầu vào gồm biến Lag biến vol y_train biến tập hợp nhãn Direction Hình 3.14 Ma trận lỗi tập test (biến ngày) o Độ xác dự đốn Accuracy: 155 + 243 𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = = 0.5264550265 155 + 187 + 171 + 243 Độ xác dự đốn tập test xấp xỉ 53% o Các giá trị tăng thật dự đoán tăng 243 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0.5869565217 171 + 243 Vậy số giá trị tăng thật dự đoán tăng xấp xỉ 59% - Nhận xét: Qua kết thực nghiệm ta thấy, lấy biến đầu vào cho thuật toán Logistic Regression ngày trước ngày đốn, độ xác dự đốn cao so với lấy biến đầu vào ngày trước Tuy nhiên, độ xác cịn thấp, chưa có tính tin cậy cao Qua thực nghiệm với thuật toán Logistic Regression cho thấy biến động tăng/giảm giá chứng khoán phụ thuộc vào giá ngày liền trước đó, khơng phụ thuộc vào khối lượng giao dịch Đoàn Lê Mỹ Linh – K59 36 3.3.2 Thực nghiệm với mơ hình LSTM Đọc data từ trang finance.yahoo.com - df = data.DataReader('TSLA', data_source='yahoo', start ='2014-0101', end='2021-12-30') Hình 3.15 Dữ liệu thực nghiệm mơ hình LSTM - Mơ hình hóa cột “Close”: Hình 3.16 Biều đồ cột Close price - Mơ hình hóa cột “Volume” Hình 3.17 Biểu đồ cột Volume Đoàn Lê Mỹ Linh – K59 37 - Tạo Dataframe từ cột “Close”, convert sang mảng numpy Lấy 85% mảng để thực train model, tương đương 1731 mẫu - Scale data khoảng [0;1] Data sau scale: Hình 3.18 Data sau scale khoảng [0;1] Tạo dataset để train, lấy lượng mẫu từ đầu đến mẫu 1731, tất cột Chia làm phần x_train y_train datasets Ta có tập x, y sau: - Hình 3.19 Tập dataset training - Xây model LSTM để dự đoán giá chứng khoán: Thực nghiệm 1: model gồm lớp, lớp 50 neurons, output layer: # Build the LSTM model model = Sequential() # 1st layer model.add(LSTM(50, return_sequences=True, input_shape=(x_train.shape[1], 1))) # 50 neuron model.add(Dropout(0.2)) # 2nd layer model.add(LSTM(50, return_sequences=True)) model.add(Dropout(0.2)) # 3rd layer model.add(LSTM(50, return_sequences= True)) model.add(Dropout(0.2)) # 4th layer Đoàn Lê Mỹ Linh – K59 38 model.add(LSTM(50)) model.add(Dropout(0.2)) #output layer model.add(Dense(1)) o Thực biên dịch train dataset, học 50 lần model, với batches 50 ta thu kết quả: Hình 3.20 Quá trình học model o Tạo tập dataset x_test y_test, định hình chúng thực dự đoán dựa tập test Train thành cơng tính lỗi trung bình bình phương gốc, để đo mức độ hiệu mơ hình ta được: Nó thực điều cách đo khác biệt giá trị dự đoán giá trị thực tế R-MSE nhỏ tức sai số bé mức độ ước lượng cho thấy độ tin cậy mơ hình đạt cao Hình 3.21 Biểu đồ dự đốn thực nghiệm Đoàn Lê Mỹ Linh – K59 39 o Sự chênh lệch thể qua số: Hình 3.22 Sự chênh lệch giá dự đoán giá thực thực nghiệm Nhận xét: đường giá dự đoán thấp so với giá thật cổ phiếu, độ chênh lệch cịn nhiều, cho thấy mơ hình chưa có độ tin cậy cao Thực nghiệm 2: model gồm lớp, lớp 1: 128 neurons, lớp 64 neurons ouptut layer 25 neurons neuron # 1st layer model.add(LSTM(128, return_sequences=True, input_shape=(x_train.shape[1], 1))) # 50 neuron # 2nd layer model.add(LSTM(64, return_sequences=False)) # output layer model.add(Dense(25)) #25 noron model.add(Dense(1)) o Thực biên dịch train dataset, học lần model, với batches Hình 3.23 Quá trình học model thực nghiệm o o Lỗi trung bình bình phương gốc: Biểu đồ dự đốn: Đồn Lê Mỹ Linh – K59 40 Hình 3.24 Biểu đồ dự đốn thực nghiệm o Sự chênh lệch dự đoán thể dạng số: Hình 3.25 Sự chênh lệch giá dự đoán giá thực thực nghiệm Nhận xét: đường dự đốn chênh lệch khơng nhiều so với đường giá thật, cho thấy mức độ tin cậy mơ hình cao Với việc cho học lần model, nhận thấy hiệu mơ hình LSTM - Như ta thấy, việc xây dựng model với layer kết hợp số lần học model khối lượng mẫu lần học nhiều (ở thực nghiệm 2) cho kết tốt so với thực nghiệm Cụ thể đường giá dự đoán thực nghiệm gần đường giá thực tế so với thực nghiệm Đoàn Lê Mỹ Linh – K59 41 KẾT LUẬN Kết đạt Về thân: - Nâng cao kỹ đọc - hiểu, tìm kiếm tài liệu, đặc biệt tài liệu tiếng Anh Từ cải thiện vốn tiếng Anh thân - Nâng cao khả tự học, nghiên cứu tìm cách giải vấn đề Học thêm nhiều kiến thức ứng dụng Biết cách trình bày báo cáo cách xác, rõ ràng, khoa học - Kỹ xếp, phân chia thời gian biểu hợp lý Về nghiên cứu: - Trong nghiên cứu này, thực nghiệm mơ hình học máy học sâu, với mơ hình thực nghiệm Kết cho thấy mơ hình LSTM với thực nghiệm cho kết tốt liệu - Kết thực nghiệm mang tính xác tương đối, khoảng cách giá trị thật giá trị dự đốn cịn xa - Kết mơ hình đánh giá dựa phương pháp khác làm bật lên điểm mạnh mơ hình đề xuất Tuy nhiên, kết thực nghiệm chưa thể ứng dụng vào đời sống mà để phục vụ nghiên cứu Vì thực nghiệm mang tính chủ quan, thực tế giá cổ phiếu cịn bị ảnh hưởng nhiều yếu tố khách quan khác Đòi hỏi người xây dựng mơ hình có kiến thức sâu rộng mảng tài để áp dụng cơng nghệ vào Từ đưa dự đốn đáng tin cậy Hạn chế - Kiến thức mảng chứng khốn cịn hạn hẹp nên chưa thể xây dựng mơ hình có yếu tố ảnh hưởng tới kết dự đốn - Dữ liệu cịn hạn chế chuỗi thời gian liên tục chưa phong phú - Phạm vi sử dụng kết hạn chế, độ xác chưa cao - Chưa thực dự đốn với mốc thời gian ngắn ví dụ 12 tiếng, tiếng - Chưa đánh giá toàn diện phương pháp thử nghiệm Hướng phát triển Đây hướng nhiều tiềm phát triển tương lai Đòi hỏi người xây dựng mơ hình dự đốn khơng có kiến thức cơng nghệ thơng tin, mà cịn cần trau dồi thêm kiến thức tài để phát triển xây dựng - mơ hình cách tốt Đồn Lê Mỹ Linh – K59 42 - Có thể thử nghiệm mơ hình học máy khác so sánh nhìn tổng quan việc dự đốn giá chứng khốn, đồng thời tìm mơ hình tối ưu cho tốn dự đốn giá chứng khốn Tìm cách thu thập liệu chi tiết nữa, cụ thể liệu với chu kỳ thời gian ngắn 24 tiếng, chẳng hạn theo chu kỳ 12 tiếng, tiếng, tiếng - Thêm yếu tố ảnh hưởng đến dự đốn vào mơ hình để kết dự đốn mang tính xác cao - Đồn Lê Mỹ Linh – K59 43 TÀI LIỆU THAM KHẢO [1] Giáo trình Thị trường chứng khoán, chủ biên: TS Bạch Đức Hiển, năm 2009, nhà xuất Tài Chính, chương 1, [2] Master ML Algorithms, Jason Brownlee, © Copyright 2016 Jason Brownlee All Rights Reserved Chapter III.13 [3] Introduction to ML with Python: A guide for Data Scientists, Andreas C Müller & Sarah Guido, Printed in the United States of America, Published by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472 Chapter [4] Giáo trình Python bản, TS Nguyễn Văn Hậu – TS Nguyễn Duy Tân – ThS Nguyễn Thị Hải Năng – ThS Nguyễn Hoàng Hiệp, năm 2019, nhà xuất Đại học Quốc gia Hà Nội Bài [5] Libraries in Python, article contributed by: parthmanchanda81, last update: 18 Oct, 2021 Published in GeeksforGeeks Link: Libraries in Python - GeeksforGeeks [6] Python Keras | keras.utils.to_categorical(), article contributed by: manmayi, last update: 23 Jun, 2021 Published in GeeksforGeeks Link: Python Keras | keras.utils.to_categorical() - GeeksforGeeks [7] Introduction to Seaborn – Python, article contributed by: 09amit, last update: 03 Jun, 2020 Published in GeeksforGeeks Link: Introduction to Seaborn - Python GeeksforGeeks [8] Article “Implement Logistic Regression from scractch in Python”, by Casper Hansen Published February 14, 2022 Link: Implementing logistic regression from scratch in Python - IBM Developer [9] What is Logistic Regression?, viết IBM, truy cập lần cuối ngày: 24/6/2022 Link: What is Logistic regression? | IBM [10] Trang wiki: “Học sâu” Truy cập lần cuối: 20/6/2022 Link: Học sâu – Wikipedia tiếng Việt [11] Bài viết “Mơ hình Logit & Probit – Logistic Regression in Stata”, Tấn Đăng Ngày đăng: 04/01/2022 Truy cập lần cuối: ngày 24/6/2022 Link: Mơ hình Logit & Probit – Logistic Regression in Stata [2022] (mosl.vn) [12] Bài viết “7 Trường Hợp Sử Dụng Machine Learning Trong Ngân Hàng”, ngày đăng: 5/1/2022 Truy cập lần cuối: ngày 24/6/2022 Link: Trường Hợp Sử Dụng Machine Learning Trong Ngân Hàng (akabot.com) Đoàn Lê Mỹ Linh – K59 44 [12] Bài viết “Dữ liệu chuỗi thời gian”, Phạm Đình Khánh Truy cập lần cuối: ngày 24/6/2022 Link: [13] Trang wiki: “Học máy” Truy cập lần cuối: 24/6/2022 Link: Học máy – Wikipedia tiếng Việt [14] Bài viết “Time-series data”, Hoàng Đức Quân Truy cập lần cuối: 24/6/2022 Link: Time-Series Data (viblo.asia) [15] Bài viết “Understanding LSTM Networks”, Posted on August 27, 2015 Truy cập lần cuối: 24/6/2022 Link: Understanding LSTM Networks colah's blog [16] Bài viết “Recurrent Neural Network: Từ RNN đến LSTM”, Nguyễn Thanh Huyền, đăng ngày 24/6//2021 Truy cập lần cuối: 24/6/2022 Link: Recurrent Neural Network: Từ RNN đến LSTM (viblo.asia) [17] Bài viết “Recurrent Neural Networks cheatsheet”, Afshine and Shervine Amidi Truy cập lần cuối: 24/6/2022 Link: CS 230 - Recurrent Neural Networks Cheatsheet (stanford.edu) [18] Bài viết “Stock Market Analysis”, Fares Sayah Truy cập lần cuối: 24/6/2022 Link: Stock Market Analysis + Prediction using LSTM | Kaggle [19] Bài viết “Time-series forecasting: Predicting stock prices using an LSTM model”, Serafeim Loukas, đăng ngày: 10/7/2020 Truy cập lần cuối: 24/6/2022 Link: TimeSeries Forecasting: Predicting Stock Prices Using An LSTM Model | by Serafeim Loukas | Towards Data Science [20] Bài viết “RMSE – Mean Squared Error”, đăng ngày 4/2/2021 Truy cập lần cuối: 24/6/2022 Link: Rmse Là Gì - Mean Squared Error - Thienmaonline [21] Bài viết “Các phương pháp đánh giá mơ hình học máy, học sâu”, Rabiloo, đăng ngày: 3/12/2021 Truy cập lần cuối: 24/6/2022 Link: Các phương pháp đánh giá mô hình học máy, học sâu (Machine learning & Deep learning) (rabiloo.com) Đoàn Lê Mỹ Linh – K59 45