Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 69 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
69
Dung lượng
1,85 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC QUY NHƠN NGUYỄN MINH TIẾN ỨNG DỤNG SVM TRONG DỰ BÁO TÀI CHÍNH THEO CHUỖI THỜI GIAN Chuyên ngành : Khoa học máy tính Mã số : 8.48.01.01 Khóa : 2019 – 2021 Ngƣời hƣớng dẫn: TS LÊ XUÂN VIỆT Bình Định – Năm 2021 LỜI CAM ĐOAN Tôi xin cam đoan toàn nội dung luận văn với đề tài: “Ứng dụng SVM dự báo tài theo chuỗi thời gian” thực dƣới hƣớng dẫn trực tiếp TS Lê Xuân Việt - Trƣờng Đại học Quy Nhơn Phần thực nghiệm chƣơng trình tơi tự xây dựng có hƣớng dẫn giảng viên, có sử dụng số thƣ viện chuẩn thuật toán đƣợc tác giả xuất công khai Kết thực nghiệm đƣợc minh họa luận văn trung thực Nội dung luận văn chƣa đƣợc công bố hay xuất dƣới hình thức Các tài liệu tham khảo đƣợc sử dụng luận văn có nguồn gốc rõ ràng trích dẫn xác, đầy đủ Nếu sai tơi xin hồn tồn chịu trách nhiệm Phù Cát, ngày tháng năm 2021 Ngƣời cam đoan Nguyễn Minh Tiến LỜI CẢM ƠN Trong trình nghiên cứu luận văn, cịn gặp nhiều khó khăn, nhƣng nhận đƣợc quan tâm, giúp đỡ quý thầy cô, bạn bè ngƣời thân Đây nguồn động lực lớn giúp tơi hồn thành đề tài luận văn Tôi xin gửi lời cảm ơn chân thành lòng biết ơn sâu sắc đến quý Thầy (Cô), ngƣời nuôi dƣỡng chắp cánh ƣớc mơ cho thân đến với đƣờng nghiên cứu khoa học đầy đam mê, đặc biệt TS Lê Xuân Việt - Trƣờng Đại học Qui Nhơn Với tâm huyết mình, thầy bảo tận tình chu thân hồn thành tốt cơng việc Và xin cảm ơn cán bộ, nhân viên phòng Đào tạo Sau đại học, trƣờng Đại học Quy Nhơn tạo điều kiện tốt cho tơi suốt q trình học tập trƣờng Cuối cùng, cho đƣợc gửi lời biết ơn đến gia đình, bạn bè tất ngƣời thân, bên cạnh động viên thân suốt thời gian học tập nghiên cứu Kính chúc q Thầy (Cơ) anh chị em lớp cao học ngành Khoa học Máy tính khóa 22 sức khỏe, hạnh phúc thành đạt Xin chân thành cảm ơn! Nguyễn Minh Tiến MỤC LỤC Trang LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC CHỮ VIẾT TẮT DANH MỤC CÁC HÌNH ẢNH MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu Đối tƣợng phạm vi nghiên cứu Phƣơng pháp nghiên cứu Ý nghĩa khoa học thực tiễn đề tài Chƣơng TỔNG QUAN VỀ CHUỖI THỜI GIAN 1.1 Giới thiệu chuỗi thời gian 1.1.1 Độ nhiễu 1.1.2 Tính khơng cố định 1.1.3 Tính khơng chắn 1.1.4 Tính xu hƣớng 1.1.5 Tính chu kỳ 1.2 Các khung dự báo chuỗi thời gian 1.3 Các kỹ thuật xử lý chuỗi thời gian 11 1.3.1 Xử lý liệu 11 1.3.2 Kỹ thuật làm mịn 11 1.3.3 Differencing (Làm khác) 13 1.4 Quy trình dự báo 14 1.5 Một số mơ hình dự báo chuỗi thời gian 15 1.5.1 Mơ hình tuyến tính 15 1.5.2 Mơ hình phi tuyến tính 16 1.5.3 Mơ hình ARMA 18 1.5.4 Mơ hình SMA 19 1.5.5 Mơ hình LSTM 21 1.5.6 Mơ hình SVM 23 1.6 Kết luận chƣơng 24 CHƢƠNG ỨNG DỤNG SVM TRONG DỰ BÁO CHUỖI THỜI GIAN TÀI CHÍNH 25 2.1 Mơ hình SVC 25 2.2 Vector hỗ trợ hồi quy (SVR) 28 2.3 Các loại hàm kernel đƣợc sử dụng SVM 35 2.3.1 Cơ sở toán học hàm kernel 38 2.3.2 Tính chất hàm kernel 41 2.3.3 Một số hàm kernel thông dụng 42 2.4 Các ứng dụng SVR dự đốn chuỗi thời gian tài 43 2.5 Đánh giá độ xác với MAPE 45 2.6 Phƣơng pháp dự báo dựa vào mơ hình SVR 46 2.7 Kết luận chƣơng 49 CHƢƠNG THỬ NGHIỆM 50 3.1 Giới thiệu toán 50 3.2 Chi tiết hóa 50 3.3 Dữ liệu 52 3.4 Cài đặt thực nghiệm 52 3.6 Kết luận chƣơng 56 KẾT LUẬN 57 TÀI LIỆU THAM KHẢO 59 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO) DANH MỤC CÁC CHỮ VIẾT TẮT Chữ tắt Dạng đầy đủ Mô tả SVM Support Vector Machine Máy hỗ trợ vector LSTM Long-short term memory Bộ nhớ dài-ngắn hạn SVC Support Vector Classifier Vector hỗ trợ phân loại SVR Support Vector Regression Vector hỗ trợ hồi quy ANN Artificial neural network Mạng thần kinh nhân tạo SMA Simple moving average Đƣờng trung bình động đơn giản EMA Exponential moving average Đƣờng trung bình động hàm mũ ARIMA AutoRegressive Integrate Trung bình trƣợt kết hợp tự Moving Average hồi quy ARMA Autoregressive moving average Tự hồi quy trung bình trƣợt SNR Signal-To-Noise Ratio Chỉ số đo lƣờng cơng suất tín hiệu độ nhiễu DANH MỤC CÁC HÌNH ẢNH Số hiệu 1.1 1.2 1.3 Tên hình Một chuỗi thời gian điển hình Các giai đoạn xây dựng mơ hình dự báo hệ thống dự báo Giá cổ phiếu McDonalds từ 03/07/1995 đến 31/12/1997 Trang 10 14 1.4 Biểu diễn SMA 21 1.5 Mơ hình mạng LSTM 22 2.1 Bài tốn phân loại nhị phân tuyến tính 25 2.2 Max margin biên SVM 26 2.3 Mơ hình mạng SVR so sánh với SVC 28 2.4 Minh họa hàm lỗi thông thƣờng hàm lỗi độ nhạy 30 2.5 Mơ hình SVR 32 2.6 Ví dụ Kernel SVR 36 2.7 Sơ đồ khối tốn 46 2.8 Mơ hình chuỗi thời gian lịch sử giá cổ phiếu công ty Apple 47 2.9 Sơ đồ sử dụng phƣơng pháp GridSearch 49 3.1 Trích phần liệu AAPL_30.CSV 52 3.2 Mơ hình thể kết dự đoán kernel 55 MỞ ĐẦU Lý chọn đề tài Hiện nay, nghiên cứu liệu chuỗi thời gian đem lại ứng dụng quan trọng, mang tính thực tế cao lĩnh vực nhƣ thống kê, tài chính, dự báo thiên tai, xử lý liệu số,… Một số toán Dự báo chuỗi thời gian (hay dự báo giá trị tƣơng lai chuỗi thời gian từ giá trị khứ) kết hợp xây dựng mơ hình dự báo thích hợp Dự báo tài theo chuỗi thời gian đƣợc coi ứng dụng thách thức dự đoán chuỗi thời gian đại Đã có nhiều nghiên cứu sử dụng mạng nơron nhân tạo (ANN) số lƣợng lớn ứng dụng thành công cho thấy ANN cơng cụ hữu ích để lập mơ hình dự báo chuỗi thời gian Tuy nhiên, số nghiên cứu ANN gặp số hạn chế liệu chứng khốn tài có độ nhiễu lớn số chiều phức tạp Gần đây, máy hỗ trợ vector (SVM), thuật toán mạng nơron mới, đƣợc phát triển Vapnik cộng Không giống mạng nơron truyền thống khác tối thiểu hóa rủi ro tập liệu hữu hạn, SVM thực nguyên tắc giảm thiểu cấu trúc rủi ro cách giảm cận lỗi tổng quát thay lỗi đào tạo Dựa nguyên tắc này, SVM đảm bảo mạng nơron tối ƣu, tạo cân phù hợp lỗi thực nghiệm khoảng tin cậy Vapnik - Chervonenkis (VC)[1] Ngoài ra, giải pháp SVM tổng quát hóa tốt tối ƣu tồn mạng nơron, mơ hình xây dựng mạng khác tối ƣu cục Đề tài tập trung nghiên cứu SVM áp dụng SVM vào dự báo tài theo chuỗi thời gian, đồng thời so sánh tính khả thi với mạng ANN dự báo theo chuỗi thời gian Từ lý trên, chọn đề tài “ỨNG DỤNG SVM TRONG DỰ BÁO TÀI CHÍNH THEO CHUỖI THỜI GIAN” Mục đích nghiên cứu Tìm hiểu nghiên cứu giải pháp SVM Kiểm tra tính khả thi việc ứng dụng SVM dự báo tài cách sử dụng hàm kernel khác nhau, đồng thời so sánh độ xác Ứng dụng SVM dự báo tài theo chuỗi thời gian khảo sát đặc điểm chức đƣợc thể Đối tƣợng phạm vi nghiên cứu 3.1 Đối tƣợng nghiên cứu: Dữ liệu chứng khoán dạng chuỗi thời gian, thuật toán thực dự báo chuỗi thời gian 3.2 Phạm vi nghiên cứu: Phạm vi nghiên cứu đề tài ứng dụng mơ hình SVM vào dự báo liệu chứng khoán chuỗi thời gian Nhƣ vậy, đề tài cần liệu chứng khốn cơng ty sàn chứng khoán để xây dựng sở liệu, từ tiến hành dự báo giá trị chứng khốn cho cơng ty thời điểm tƣơng lai định Phƣơng pháp nghiên cứu Phƣơng pháp nghiên cứu đề tài đƣợc lựa chọn lý thuyết kết hợp với thực nghiệm Các vấn đề cần giải liên quan đến thuật toán lý thuyết chuỗi thời gian, nhƣ học máy mạng nơron nhân tạo Phân tích, dự báo tài chuỗi thời gian đƣợc thực máy tính với đầu vào thơng tin thu nhận đƣợc từ thực tế Ý nghĩa khoa học thực tiễn đề tài Những giá trị khoa học thực tiễn đề tài: - Các mơ hình dựa SVM đƣợc phát triển tính khả thi việc ứng dụng mơ hình vào dự đoán giá chứng khoán đƣợc kiểm chứng - Sự kết hợp tốt thông số SVR đƣợc sử dụng để xây dựng mơ hình SVR đƣợc xác định cho liệu cổ phiếu so sánh điểm tƣơng đồng giá trị - So sánh hiệu suất độ xác hàm kernel mơ hình SVR ứng dụng cho chuỗi thời gian tài NỘI DUNG CHÍNH Nội dung đề tài đƣợc chia thành chƣơng Chƣơng 1: Tổng quan chuỗi thời gian toán dự đoán chuỗi thời gian Trong chƣơng này, đề tài giới thiệu tổng quan khái niệm lĩnh vực chuỗi thời gian, kỹ thuật mơ hình đƣợc sử dụng để phân tích dự đoán chuỗi thời gian Chƣơng 2: Ứng dụng mơ hình SVR vào tốn dự đốn chuỗi thời gian Lý thuyết mơ hình SVM SVR Ứng dụng SVR để dự đoán chuỗi thời gian Kỹ thuật GridSearch tối ƣu tham số MAPE để đánh giá hiệu suất mơ hình Chƣơng 3: Chƣơng trình thử nghiệm Giới thiệu tốn, mơ tả tập liệu đầu vào đƣợc sử dụng, cài đặt thử nghiệm, đánh giá kết thực nghiệm giải toán theo thực tế 48 hƣởng đến độ phức tạp mơ hình cuối Nếu C q lớn ƣu tiên vào phần độ lỗi huấn luyện, dẫn đến mơ hình phức tạp, dễ bị q khớp Cịn C q nhỏ lại ƣu tiên vào phần độ phức tạp mơ hình, dẫn đến mơ hình q đơn giản, giảm độ xác dự đốn Ý nghĩa ε tƣơng tự C Nếu ε q lớn có vectơ hỗ trợ, làm cho mơ hình q đơn giản Ngƣợc lại, ε q nhỏ có nhiều vectơ hỗ trợ, dẫn đến mơ hình phức tạp, dễ bị khớp Việc lựa chọn giá trị tối ƣu cho siêu tham số huấn luyện ( ) đảm bảo mơ hình phức tạp xác Các siêu tham số tham số nằm mơ hình khơng phụ thuộc vào tập liệu huấn luyện, đƣợc thiết lập tùy ý ngƣời phát triển trƣớc đào tạo mơ hình tùy thuộc vào toán giải cụ thể; khác với tham số thơng thƣờng đƣợc sinh từ tập liệu chạy mơ hình Tập siêu tham số tối ƣu khác mơ hình, khác huấn luyện mơ hình nhƣng tập liệu khác Vì vậy, hồn tồn khơng thể biết đƣợc tốn tập liệu cụ thể hyperparameter nhƣ tối ƣu Kĩ thuật để ƣớc lƣợng giá trị tối ƣu cho tập siêu tham số xác thực chéo, kể đến kỹ thuật nhƣ k-fold, hold-out hay phƣơng pháp chúng tơi sử dụng GridSearch 49 Hình 2.9: Sơ đồ sử dụng phƣơng pháp GridSearch GridSearch đƣợc coi phƣơng pháp tối ƣu hóa siêu tham số truyền thống “brute force” tất kết hợp có Sau đó, mơ hình đƣợc đánh giá thơng qua xác nhận chéo Mơ hình có độ xác cao đƣơng nhiên đƣợc coi tốt 2.7 Kết luận chƣơng Chƣơng trình bày tập trung lý thuyết SVM SVR, loại hàm kernel SVR, phƣơng pháp tính tốn tham số SVR, ứng dụng SVR vào liệu chuỗi thời gian tài Kỹ thuật GridSearch tìm tập siêu tham số tối ƣu cho SVR phƣơng pháp đánh giá MAPE nhằm đánh giá hiệu suất, độ xác mơ hình huấn luyện, đƣợc chúng tơi trình bày chƣơng 50 CHƢƠNG THỬ NGHIỆM 3.1 Giới thiệu toán Trong chƣơng này, chúng tơi trình bày ứng dụng mơ hình SVR dự báo giá cổ phiếu chứng khốn thời điểm định Dự đoán giá cổ phiếu tốn có nhiều ứng dụng thực tế, nhận đƣợc quan tâm lớn từ nhà nghiên cứu nhƣ doanh nghiệp Đầu vào: Giá cổ phiếu khứ dạng chuỗi thời gian Đầu ra: Giá cổ phiếu đƣợc dự đoán thời điểm xác định tƣơng lai so sánh độ xác tính tốn mơ hình so với giá thực tế Bài toán dự đoán giá cổ phiếu này, sử dụng liệu giá cổ phiếu tập đoàn Apple (mã cổ phiếu AAPL) từ 01/09/2021 đến 22/09/2021, bao gồm giá đóng cửa, giá mở cửa, giá cao nhất, giá thấp nhất, khối lƣợng giao dịch Ứng dụng mơ hình SVR sử dụng hàm kernel khác nhƣ Linear, Polynomial hay RBF để huấn luyện thực dự đoán Mục tiêu cuối dự đốn giá đóng cửa cổ phiếu vào ngày xác định thuộc chuỗi thời gian tƣơng lai, so sánh với giá thực tế, đồng thời so sánh đánh giá độ xác hàm kernel ứng dụng tốn dự đốn chuỗi thời gian tài Sử dụng bƣớc Chƣơng để thử nghiệm đánh giá kết với độ xác mơ hình đƣợc cho nhƣ 3.2 Chi tiết hóa Chi tiết hóa cho thuật tốn Chƣơng với toán trên: Dữ liệu đầu vào lịch sử giá cổ phiếu cơng ty chứng khốn đƣợc niêm yết sàn chứng khoán nƣớc ngồi nƣớc, 51 chúng tơi lựa chọn công ty Apple với mã cổ phiếu AAPL, đƣợc niêm yết sàn chứng khoán NASDAQ Dữ liệu lịch sử giá cổ phiếu công ty thƣờng đƣợc xuất dƣới dạng file excel có CSV File liệu kiểu phù hợp thuận tiện cho ngơn ngữ Python đọc đƣợc liệu Dữ liệu sau đƣợc load vào đƣợc tiền xử lý liệu để trở thành dạng liệu chuẩn, phù hợp làm liệu đầu vào cho mô hình SVR Với tập liệu chuẩn sau cơng đoạn tiền xử lý, tiến hành xử lý chia tập liệu thành hai tập gồm tập huấn luyện phục vụ cho xây dựng đào tạo mô hình, tập kiểm thử nhằm đánh giá kết đầu mơ hình Với tập liệu huấn luyện, tiến hành đào tạo SVR với ba trƣờng hợp ứng với sử dụng ba hàm kernel khác nhau, lần lƣợt kernel linear, kernel poly kernel RBF Trƣớc tiến hành xây dựng huấn luyện mơ hình kernel SVR, tìm tập siêu tham số tối ƣu cho hàm với kỹ thuật GridSearch Sau tiến hành đào tạo lần lƣợt mơ hình hàm kernel tập liệu huấn luyện với tập siêu tham số cụ thể kernel, ta sử dụng mơ hình huấn luyện để dự đoán giá cổ phiếu vào ngày định tƣơng lai thuộc chuỗi thời gian Với mơ hình hàm kernel giá trị siêu tham số khác mơ hình cho giá trị dự đoán khác So sánh giá dự đoán mơ hình với đối sánh với giá đóng cửa thực cổ phiếu vào thời điểm dự đốn, ta đánh giá đƣợc độ xác hiệu suất mơ hình với kỹ thuật MAPE, từ xác định kỹ thuật tốt làm việc với dự đoán giá cổ phiếu, cụ thể làm việc với liệu AAPL khung thời gian định 52 3.3 Dữ liệu Dữ liệu đƣợc sử dụng lịch sử giá cổ phiếu tập đoàn Apple với mã cổ phiếu AAPL; bao gồm ngày (Date), giá mở cửa (Open), giá đóng cửa (Close), giá cao (High), giá thấp (Low), khối lƣợng giao dịch (Volume) giá đóng cửa điều chỉnh (Adj Close) Hình 3.1 Trích phần liệu AAPL_30.CSV Bộ liệu AAPL có 15 hàng liệu tất cả, lịch sử tháng cổ phiếu AAPL giá từ 01/09/2020 đến 22/09/2021 Ta hồn tồn sử dụng liệu lịch sử giá công ty khác với khung thời gian dài ngắn 3.4 Cài đặt thực nghiệm Để cài đặt chƣơng trình thử nghiệm, yêu cầu máy tính cần: Cấu hình phần cứng: Máy tính cần có cấu hình tối thiểu nhƣ CPU có tốc độ 2.0 GHz, RAM 2GB Ngôn ngữ môi trƣờng cài đặt: 53 Hệ điều hành Windows Linux Ngôn ngữ lập trình Python Đầu tiên, ta tiến hành thiết lập thƣ viện cần thiết cho chƣơng trình: #Import the libraries from sklearn.svm import SVR import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.style.use('seaborn-darkgrid') Sau load file liệu APPL_30.CSV xử lý liệu, ta tiến hành chia thành hai tập liệu huấn luyện kiểm thử Tiếp theo, sử dụng kỹ thuật GridSearch để tìm tập hyperparameter tối ƣu từ tập ứng viên: parameter_candidates = [ {'C': [1, 10, 100, 1000], 'kernel': ['linear']}, {'C': [1, 10, 100, 1000], 'gamma': [0.001, 0.15], 'kernel': ['rbf']}, {'C': [1, 10, 100, 1000], 'degree': [2, 3], 'kernel': ['poly']}, ] # Create a classifier object with the classifier and parameter candidates clf = GridSearchCV(estimator=svm.SVC(), param_grid=parameter_candidates, n_jobs=-1) Với tập siêu tham số tìm đƣợc từ GridSearch, ta xây dựng huấn luyện mơ hình SVR với ba hàm kernel lần lƣợt Linear, RBF Polynomial: #Create and train an SVR model using a linear kernel lin_svr = SVR(kernel='linear', C=1000.0) lin_svr.fit(days,adj_close_prices)#Create and train an SVR model using a polynomial kernel poly_svr = SVR(kernel='poly', C=1000.0, degree=2) poly_svr.fit(days, adj_close_prices)#Create and train an SVR model using a RBF kernel rbf_svr = SVR(kernel='rbf', C=1000.0, gamma=0.15) rbf_svr.fit(days, adj_close_prices) So sánh ba hàm kernel mơ hình liệu: 54 #Plot the models on a graph to see which has the best fit plt.figure(figsize=(16,8)) plt.scatter(days, adj_close_prices, color = 'black', label='Original Data') plt.plot(days, rbf_svr.predict(days), color = 'green', label='RBF Model') plt.plot(days, poly_svr.predict(days), color = 'orange', label='Polynomial Model') plt.plot(days, lin_svr.predict(days), color = 'purple', label='Linear Model') plt.xlabel('Days') plt.ylabel('Adj Close Price') plt.title('Support Vector Regression') plt.legend() plt.show() 3.5 Kết đánh giá Kết dự đoán giá cổ phiếu AAPL ngày 22/09/2021 SVR theo hàm kernel RBF, Linear Polynomial lần lƣợt là: RBF SVR 145.03388846 Linear SVR 143.37998918 Polynomial SVR 140.68903384 Với giá cổ phiếu thực tế AAPL ngày 22/09/2021 145.850006, thấy mơ hình SVR cho kết xác cao đặc biệt mơ hình RBF SVR có kết dự đốn 145.03388846 Biểu diễn so sánh kết dự đoán mơ hình RBF, Linear Poly đƣợc thể Hình 3.2: 55 Hình 3.2: Mơ hình thể kết dự đoán kernel Kết dự đoán khác biệt hàm, với độ xác cao, cụ thể cao mơ hình RBF SVR siêu tham số hyperparameter đƣợc tính tốn GridSearch từ tập ứng viên siêu tham số, tƣơng ứng lần lƣợt với kernel nhƣ sau: Kernel RBF Tập hyperparameter ứng viên [ ] [ [ Linear ] ] [ ] [ [ Polynomial Tập hyperparameter tối ƣu ] ] [ [ ] ] Sử dụng kỹ thuật MAPE với mơ hình kernel, ta xác định đƣợc độ xác mơ hình lần lƣợt nhƣ sau: 56 MAPE with RBF kernel: 0.5595594867333512 MAPE with Linear kernel: 1.693532201906021 MAPE with Polynomial kernel: 3.5385477843993742 3.6 Kết luận chƣơng Trong chƣơng này, luận văn tiến hành cài đặt thử nghiệm hàm kernel mơ hình SVR đƣợc trình bày chƣơng hai nhằm giải toán mục tiêu “Dự đoán giá cổ phiếu dựa vào liệu chuỗi thời gian khứ” Kết đánh giá đạt đƣợc thành công từ ý tƣởng áp dụng mơ hình đề Độ xác nằm mức tƣơng đối cao tập liệu không lớn Trong trƣờng hợp tập liệu lớn với nhiều yếu tố ngoại lai kết không nhƣ mong muốn, cần phải phát triển khắc phục số hạn chế để đạt đƣợc kết tốt 57 KẾT LUẬN Nội dung nghiên cứu kết đạt đƣợc luận văn Bài toán dự đoán giá chứng khoán đƣợc đặt từ lâu hàng loạt nghiên cứu đề tài đƣợc xác lập, ứng dụng đƣợc triển khai Bài tốn ln đặt nhiều thách thức khó khăn Các khó khăn chứng tỏ phƣơng pháp giải tốn khơng thể tránh khỏi số khiếm khuyết định Mỗi hƣớng tiếp cận đƣợc đƣa đạt đƣợc thành định, hƣớng có thành cơng, hạn chế Vì tốn tốn khơng có lời giải tối ƣu cho trƣờng hợp Tuy nhiên, tính cấp thiết từ yêu cầu thực tế mà đề tài hấp dẫn nhà khoa học, chuyên gia nghiên cứu ứng dụng Trong nội dung nghiên cứu đề tài “Ứng dụng SVM dự đốn chuỗi thời gian tài chính” thân tìm hiểu thuật tốn, mơ hình xử lý dự báo chuỗi thời gian, nhƣ áp dụng mơ hình để giải tốn đặt Qua nghiên cứu, kết mà luận văn đạt đƣợc nhƣ sau: - Khái quát chuỗi thời gian, dự báo chuỗi thời gian cụ thể chuỗi thời gian tài - Trình bày số kỹ thuật, hàm kernel mơ hình SVM cụ thể SVR đƣợc dùng để dự đốn chuỗi thời gian tài hiệu - Trình bày kỹ thuật GridSearch để tìm siêu tham số tối ƣu cho SVR phƣơng pháp MAPE dùng để đánh giá hiệu suất mơ hình huấn luyện - Cài đặt thử nghiệm mơ hình SVR áp dụng hàm kernel dự đoán giá trị cổ phiếu vào ngày xác định dựa vào liệu chuỗi thời gian giá trị lịch sử khứ, sử dụng MAPE để đánh giá so sánh hiệu suất mơ hình 58 Kiến nghị hƣớng nghiên cứu Dự đốn chuỗi thời gian tài chính, đặc biệt giá trị cổ phiếu hay cryto tiếp tục toán đƣợc nhiều nhà nghiên cứu cộng đồng quan tâm với nhiều ứng dụng to lớn, có tầm quan trọng khơng khoa học mà thực tiễn Với hạn chế khó khăn cịn gặp q trình phát triển, giải toán, hƣớng nghiên cứu luận văn tiếp tục đào sâu vào mơ hình học máy, học sâu, song song với phiên tiền xử lý liệu để nâng cao hiệu suất đầu toán 59 TÀI LIỆU THAM KHẢO [1] Cherkassky, V., & Mulier, F (1999) Vapnik-Chervonenkis (VC) learning theory and its applications IEEE Transactions on Neural Networks, 10(5), 985- 987 https://doi.org/10.1109/TNN.1999.788639 [2] Aoki, M., (1990) State space modeling of time series Springer-Verlag; NewYork: Springer-Verlag, 2nd edition [3] Chatfield, C., (2001) Time Series Forecasting Chapman and Hall [4] Granger, C.W.J., and Joyeux, R., (1980) An introduction to longmemory time series models and fractional differencing, Journal of Time Series Analysis, vol [5] Priestley, M.B., (1981) Spectral Analysis and Time Series, New York: AcademicPress, London [6] Tong, I., (1990) Non-Linear Time Series Clarendon Press, Oxford [7] Jain, A.K, Murty, M.N., and Flynn, P.J, (1999) Data Clustering: a review, ACM Computing Surveys, Vol 31, No 3: 264 - 323 [8] Baestaens, D.E., (1994) Neural Network Solutions for Trading in Financial Markets, London: Financial Times: Pitman Pub [9] Chatfield, C., (2004) The analysis of time series: an introduction Chapman andHall, Sixth edition [10] S Hochreiter and J Schmidhuber, "Long Short-Term Memory," in Neural Computation, vol 9, no 8, pp 1735-1780, 15 Nov 1997 [11] Cortes C., and Vapnik, V.N (1995) Support-Vector Networks, Machine Learning, Vol.20,No.3: 273 - 297 [12] Burges, C and Crisp, D., (2000) Uniqueness of the SVM Solution, In Solla, S.A.,Leen, T.K., and Muller, K.-R., editors, Advances in 60 Neural InformationProcessing Systems, Vol.12: 223 - 229, Cambridge, MA, MIT Press [13] Burges, C.J.C., (1998) A Tutorial on Support Vector Machines for Pattern Recognition, Data Miningand Knowledge Discovery Vol.2:121 – 167 [14] Mukherjee, S., Osuna E., and Girosi, F.,(1997) Nonlinear prediction of chaotictime series using support vector machines, Proc of IEEENNSP‟97, AmeliaIsland, FL [15] Bennett, K.,and Bredensteiner, E.J.,(2000) Duality andgeometry in SVMclassifiers, In Langley, P., editor, Proc of Seventeenth Intl Conf on MachineLearning, pages 57 - 64, SanFrancisco, Morgan Kaufmann [16] Joachims, I (1997) Text Categorization with Support Vector Machines, Technical Report [17] Schmidt, M., (1996) Identifying speaker with support vector networks, Interface1996 Proceedings, Sydney [18] Scholkopf, B., Burges, C., and Smola, A.,(1999) Advances in Kernel Methods:Support Vector Learning, MIT Press, Cambridge, Massachusetts [19] Harris Drucker, Chris J C Burges, Linda Kaufman, Alex Smola, and Vladimir Vapnik 1996 Support vector regression machines In Proceedings of the 9th International Conference on Neural Information Processing Systems (NIPS'96) MIT Press, Cambridge, MA, USA, 155–161 [20] Siwei Lyu, "Mercer kernels for object recognition with local features," 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), 2005, pp 223-229 vol 61 2, doi: 10.1109/CVPR.2005.223 [21] Lin, H.T., and Lin, C.J., (2003) A study on sigmoid kernels for SVM and thetraining of non-PSD kernels by SMO-typemethods, Technical Report [22] Kwok, J.T., and Tsang I.W., (2003) Linear dependency between & and the input noise in &-support vector regression IEEE Transactions on Neural Networks, Vol XX, No YY: – [23] CherKassky, V., and Mulier, F., (1998).Learning from Data: Concepts, Theory and Methods John Wiley & Sons Inc New York, NY [24] Cherkassky, V., and Ma, Y., (2004) Practical selection of SVM parameters andnoise estimation for SVM regression, Neural Networks,Vol.17,No.1: 113 - 126 [25] Mattera, D., and Haykin, S., (1999) Support vector machines for dynamic reconstruction of a chaotic system [26] Kyoung-jae Kim, Financial time series forecasting using support vector machines, Neurocomputing, Volume 55, Issues 1–2, 2003, Pages 307-319, ISSN 0925-2312 [27] Tay, F.EH., and Cao, L.J., (2001) Application of support vector machines infinancial time series forecasting, Omega Vol 29: 309 317 [28] Tay, F.F.H, Cao, L.J., (2002) Modified support vector machines in financialtime series forecasting, Neurocomputing Vol 48: 847 861 [29] Tay, FEM., Cao, L.J., (2003) &-Descending Support Vector Machines forFinancial Time Series Forecasting, Neural Processing Letters Vol 15:179 – 195 [30] Yang, H., King, I., and Chan, L., (2002a) Non-fixed and asymmetrical 62 marginapproach to stock market prediction using Support Vector Regression, In theProceedings of ICONIP 2002, Singapore [31] Yang, H., Chan, L., and King, I., (2002b) Support vector machine regression forvolatile stock market prediction, Lecture notes in Computer Science, Vol.2412:391 – 396 [32] Thissen, U., Brakel, R.V., de Weijer, A.P., Melssen, W.J., Buydens L.M.C.(2003) Using support vector machines for time series prediction, Chemometrics and Intelligent Laboratory Systems Vol 69, 35 – 49 [33] K Kim, I Han, Genetic algorithms approach to feature discretization in arti-cial neural networks for the prediction of stock price index, Expert Syst Appl 19 (2) (2000) 125–132 [34] Heizer, Jay dan Render, Barry 2015.Manajemen Operasi Jakarta: Salemba Empat.p.129 ... tài chính, dự báo thiên tai, xử lý liệu số,… Một số tốn Dự báo chuỗi thời gian (hay dự báo giá trị tƣơng lai chuỗi thời gian từ giá trị khứ) kết hợp xây dựng mơ hình dự báo thích hợp Dự báo tài. .. với mạng ANN dự báo theo chuỗi thời gian 2 Từ lý trên, chọn đề tài ? ?ỨNG DỤNG SVM TRONG DỰ BÁO TÀI CHÍNH THEO CHUỖI THỜI GIAN? ?? Mục đích nghiên cứu Tìm hiểu nghiên cứu giải pháp SVM Kiểm tra tính... liệu chứng khoán dạng chuỗi thời gian, thuật toán thực dự báo chuỗi thời gian 3.2 Phạm vi nghiên cứu: Phạm vi nghiên cứu đề tài ứng dụng mơ hình SVM vào dự báo liệu chứng khoán chuỗi thời gian