1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) nghiên cứu chuyển đổi ngôn ngữ datalog sang ngôn ngữ truy vấn sparql

69 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 69
Dung lượng 2,04 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC QUY NHƠN NGUYỄN MINH TIẾN lu ỨNG DỤNG SVM TRONG DỰ BÁO TÀI CHÍNH an n va THEO CHUỖI THỜI GIAN p ie gh tn to : Khoa học máy tính Mã số : 8.48.01.01 nl w Chuyên ngành : 2019 – 2021 d oa Khóa u nf va an lu ll Ngƣời hƣớng dẫn: TS LÊ XUÂN VIỆT oi m z at nh Bình Định – Năm 2021 z m co l gm @ an Lu n va ac th si LỜI CAM ĐOAN Tôi xin cam đoan toàn nội dung luận văn với đề tài: “Ứng dụng SVM dự báo tài theo chuỗi thời gian” thực dƣới hƣớng dẫn trực tiếp TS Lê Xuân Việt - Trƣờng Đại học Quy Nhơn Phần thực nghiệm chƣơng trình tơi tự xây dựng có hƣớng dẫn giảng viên, có sử dụng số thƣ viện chuẩn thuật toán đƣợc tác giả xuất công khai Kết thực nghiệm đƣợc minh họa luận văn trung thực lu an Nội dung luận văn chƣa đƣợc công bố hay xuất dƣới bất va n kỳ hình thức Các tài liệu tham khảo đƣợc sử dụng luận văn có gh tn to nguồn gốc rõ ràng trích dẫn xác, đầy đủ Nếu sai tơi xin hoàn toàn p ie chịu trách nhiệm d oa nl w Phù Cát, ngày tháng năm 2021 Ngƣời cam đoan u nf va an lu ll Nguyễn Minh Tiến oi m z at nh z m co l gm @ an Lu n va ac th si LỜI CẢM ƠN Trong trình nghiên cứu luận văn, cịn gặp nhiều khó khăn, nhƣng nhận đƣợc quan tâm, giúp đỡ quý thầy cô, bạn bè ngƣời thân Đây nguồn động lực lớn giúp tơi hồn thành đề tài luận văn Tôi xin gửi lời cảm ơn chân thành lòng biết ơn sâu sắc đến quý Thầy (Cô), ngƣời nuôi dƣỡng chắp cánh ƣớc mơ cho thân đến với đƣờng nghiên cứu khoa học đầy đam mê, đặc biệt TS Lê Xuân lu an Việt - Trƣờng Đại học Qui Nhơn Với tâm huyết mình, thầy bảo va n tận tình chu thân hồn thành tốt cơng việc to gh tn Và xin cảm ơn cán bộ, nhân viên phòng Đào tạo Sau đại học, p ie trƣờng Đại học Quy Nhơn tạo điều kiện tốt cho tơi suốt q nl w trình học tập trƣờng d oa Cuối cùng, cho đƣợc gửi lời biết ơn đến gia đình, bạn bè tất an lu ngƣời thân, bên cạnh động viên thân suốt thời gian u nf va học tập nghiên cứu ll Kính chúc quý Thầy (Cô) anh chị em lớp cao học ngành m oi Khoa học Máy tính khóa 22 sức khỏe, hạnh phúc thành đạt z at nh Xin chân thành cảm ơn! z m co l gm @ Nguyễn Minh Tiến an Lu n va ac th si MỤC LỤC Trang LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC CHỮ VIẾT TẮT DANH MỤC CÁC HÌNH ẢNH MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu lu Đối tƣợng phạm vi nghiên cứu an va Phƣơng pháp nghiên cứu n Ý nghĩa khoa học thực tiễn đề tài 1.1 Giới thiệu chuỗi thời gian p ie gh tn to Chƣơng TỔNG QUAN VỀ CHUỖI THỜI GIAN 1.1.1 Độ nhiễu nl w 1.1.2 Tính khơng cố định d oa 1.1.3 Tính khơng chắn an lu 1.1.4 Tính xu hƣớng u nf va 1.1.5 Tính chu kỳ 1.2 Các khung dự báo chuỗi thời gian ll oi m 1.3 Các kỹ thuật xử lý chuỗi thời gian 11 z at nh 1.3.1 Xử lý liệu 11 1.3.2 Kỹ thuật làm mịn 11 z 1.3.3 Differencing (Làm khác) 13 @ gm 1.4 Quy trình dự báo 14 m co l 1.5 Một số mơ hình dự báo chuỗi thời gian 15 1.5.1 Mơ hình tuyến tính 15 an Lu 1.5.2 Mơ hình phi tuyến tính 16 n va ac th si 1.5.3 Mơ hình ARMA 18 1.5.4 Mơ hình SMA 19 1.5.5 Mơ hình LSTM 21 1.5.6 Mơ hình SVM 23 1.6 Kết luận chƣơng 24 CHƢƠNG ỨNG DỤNG SVM TRONG DỰ BÁO CHUỖI THỜI GIAN TÀI CHÍNH 25 2.1 Mơ hình SVC 25 2.2 Vector hỗ trợ hồi quy (SVR) 28 lu an 2.3 Các loại hàm kernel đƣợc sử dụng SVM 35 n va 2.3.1 Cơ sở toán học hàm kernel 38 2.3.3 Một số hàm kernel thông dụng 42 2.4 Các ứng dụng SVR dự đốn chuỗi thời gian tài 43 p ie gh tn to 2.3.2 Tính chất hàm kernel 41 w 2.5 Đánh giá độ xác với MAPE 45 oa nl 2.6 Phƣơng pháp dự báo dựa vào mơ hình SVR 46 d 2.7 Kết luận chƣơng 49 lu va an CHƢƠNG THỬ NGHIỆM 50 u nf 3.1 Giới thiệu toán 50 ll 3.2 Chi tiết hóa 50 m oi 3.3 Dữ liệu 52 z at nh 3.4 Cài đặt thực nghiệm 52 3.6 Kết luận chƣơng 56 z gm @ KẾT LUẬN 57 TÀI LIỆU THAM KHẢO 59 l m co QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO) an Lu n va ac th si DANH MỤC CÁC CHỮ VIẾT TẮT Chữ tắt Dạng đầy đủ Mô tả SVM Support Vector Machine Máy hỗ trợ vector LSTM Long-short term memory Bộ nhớ dài-ngắn hạn SVC Support Vector Classifier Vector hỗ trợ phân loại SVR Support Vector Regression Vector hỗ trợ hồi quy ANN Artificial neural network Mạng thần kinh nhân tạo SMA Simple moving average Đƣờng trung bình động đơn lu an giản va n EMA Đƣờng trung bình động hàm Exponential moving average tn to mũ Integrate Trung bình trƣợt kết hợp tự p ie gh ARIMA AutoRegressive hồi quy Moving Average Tự hồi quy trung bình trƣợt Chỉ số đo lƣờng cơng suất tín w Signal-To-Noise Ratio d oa SNR Autoregressive moving average nl ARMA ll u nf va an lu hiệu độ nhiễu oi m z at nh z m co l gm @ an Lu n va ac th si DANH MỤC CÁC HÌNH ẢNH Số hiệu Tên hình Trang Một chuỗi thời gian điển hình 1.1 Các giai đoạn xây dựng mơ hình dự báo hệ 1.2 10 thống dự báo Giá cổ phiếu McDonalds từ 03/07/1995 đến 1.3 14 lu 31/12/1997 n va 21 1.5 Mơ hình mạng LSTM 22 2.1 Bài tốn phân loại nhị phân tuyến tính 25 2.2 Max margin biên SVM 26 Mơ hình mạng SVR so sánh với SVC 28 ie gh tn to Biểu diễn SMA p an 1.4 Minh họa hàm lỗi thông thƣờng hàm lỗi độ nhạy 30 2.5 Mơ hình SVR 32 2.6 Ví dụ Kernel SVR 2.7 Sơ đồ khối toán d oa nl 2.4 w 2.3 lu va an 36 u nf 46 Mô hình chuỗi thời gian lịch sử giá cổ phiếu công ty ll 47 oi Apple m 2.8 z at nh Sơ đồ sử dụng phƣơng pháp GridSearch 49 3.1 Trích phần liệu AAPL_30.CSV 52 3.2 Mơ hình thể kết dự đốn kernel 55 z 2.9 m co l gm @ an Lu n va ac th si MỞ ĐẦU Lý chọn đề tài Hiện nay, nghiên cứu liệu chuỗi thời gian đem lại ứng dụng quan trọng, mang tính thực tế cao lĩnh vực nhƣ thống kê, tài chính, dự báo thiên tai, xử lý liệu số,… Một số tốn Dự báo chuỗi thời gian (hay dự báo giá trị tƣơng lai chuỗi thời gian từ giá trị khứ) kết hợp xây dựng mơ hình dự báo thích hợp lu Dự báo tài theo chuỗi thời gian đƣợc coi ứng an Đã có nhiều nghiên cứu sử dụng mạng nơron nhân tạo (ANN) n va dụng thách thức dự đoán chuỗi thời gian đại tn to gh số lƣợng lớn ứng dụng thành công cho thấy ANN cơng cụ p ie hữu ích để lập mơ hình dự báo chuỗi thời gian Tuy nhiên, số nghiên w cứu ANN gặp số hạn chế liệu chứng khốn tài có oa nl độ nhiễu lớn số chiều phức tạp d Gần đây, máy hỗ trợ vector (SVM), thuật toán mạng nơron mới, lu va an đƣợc phát triển Vapnik cộng Không giống mạng nơron truyền u nf thống khác tối thiểu hóa rủi ro tập liệu hữu hạn, SVM thực ll nguyên tắc giảm thiểu cấu trúc rủi ro cách giảm cận lỗi m oi tổng quát thay lỗi đào tạo Dựa nguyên tắc này, SVM đảm bảo z at nh mạng nơron tối ƣu, tạo cân phù hợp lỗi thực nghiệm z khoảng tin cậy Vapnik - Chervonenkis (VC)[1] Ngoài ra, giải pháp SVM @ gm tổng quát hóa tốt tối ƣu tồn mạng nơron, mơ hình l xây dựng mạng khác tối ƣu cục Đề tài tập trung nghiên cứu m co SVM áp dụng SVM vào dự báo tài theo chuỗi thời gian, đồng thời so gian an Lu sánh tính khả thi với mạng ANN dự báo theo chuỗi thời n va ac th si Từ lý trên, chọn đề tài “ỨNG DỤNG SVM TRONG DỰ BÁO TÀI CHÍNH THEO CHUỖI THỜI GIAN” Mục đích nghiên cứu Tìm hiểu nghiên cứu giải pháp SVM Kiểm tra tính khả thi việc ứng dụng SVM dự báo tài cách sử dụng hàm kernel khác nhau, đồng thời so sánh độ xác Ứng dụng SVM dự báo tài theo chuỗi thời gian khảo sát đặc điểm chức đƣợc thể lu an Đối tƣợng phạm vi nghiên cứu 3.1 Đối tƣợng nghiên cứu: n va Dữ liệu chứng khoán dạng chuỗi thời gian, thuật toán thực dự tn to báo chuỗi thời gian Phạm vi nghiên cứu: Phạm vi nghiên cứu đề tài ứng dụng mơ hình SVM vào dự p ie gh 3.2 w báo liệu chứng khoán chuỗi thời gian Nhƣ vậy, đề tài cần liệu oa nl chứng khoán cơng ty sàn chứng khốn để xây d dựng sở liệu, từ tiến hành dự báo giá trị chứng khốn cho cơng ty lu Phƣơng pháp nghiên cứu u nf va an thời điểm tƣơng lai định ll Phƣơng pháp nghiên cứu đề tài đƣợc lựa chọn lý thuyết kết hợp m oi với thực nghiệm Các vấn đề cần giải liên quan đến thuật toán lý z at nh thuyết chuỗi thời gian, nhƣ học máy mạng nơron nhân tạo z Phân tích, dự báo tài chuỗi thời gian đƣợc thực máy tính với @ Ý nghĩa khoa học thực tiễn đề tài Những giá trị khoa học thực tiễn đề tài: m co l gm đầu vào thông tin thu nhận đƣợc từ thực tế an Lu - Các mơ hình dựa SVM đƣợc phát triển tính khả thi việc ứng dụng mơ hình vào dự đốn giá chứng khốn đƣợc kiểm chứng n va ac th si - Sự kết hợp tốt thơng số SVR đƣợc sử dụng để xây dựng mơ hình SVR đƣợc xác định cho liệu cổ phiếu so sánh điểm tƣơng đồng giá trị - So sánh hiệu suất độ xác hàm kernel mơ hình SVR ứng dụng cho chuỗi thời gian tài NỘI DUNG CHÍNH Nội dung đề tài đƣợc chia thành chƣơng Chƣơng 1: Tổng quan chuỗi thời gian toán dự đoán chuỗi thời gian lu Trong chƣơng này, đề tài giới thiệu tổng quan khái niệm an lĩnh vực chuỗi thời gian, kỹ thuật mơ hình đƣợc sử dụng để phân va n tích dự đốn chuỗi thời gian ie gh tn to Chƣơng 2: Ứng dụng mơ hình SVR vào toán dự đoán chuỗi thời gian Lý thuyết mơ hình SVM SVR Ứng dụng SVR để dự đoán chuỗi p thời gian Kỹ thuật GridSearch tối ƣu tham số MAPE để đánh giá hiệu suất nl w mơ hình d oa Chƣơng 3: Chƣơng trình thử nghiệm an lu Giới thiệu tốn, mơ tả tập liệu đầu vào đƣợc sử dụng, cài đặt thử ll u nf va nghiệm, đánh giá kết thực nghiệm giải toán theo thực tế oi m z at nh z m co l gm @ an Lu n va ac th si 48 hƣởng đến độ phức tạp mơ hình cuối  Nếu C lớn ƣu tiên vào phần độ lỗi huấn luyện, dẫn đến mơ hình phức tạp, dễ bị khớp Còn C nhỏ lại ƣu tiên vào phần độ phức tạp mơ hình, dẫn đến mơ hình q đơn giản, giảm độ xác dự đốn  Ý nghĩa ε tƣơng tự C Nếu ε q lớn có vectơ hỗ trợ, làm cho mơ hình q đơn giản Ngƣợc lại, ε q nhỏ có nhiều vectơ hỗ trợ, dẫn đến mơ hình phức tạp, dễ bị khớp lu an Việc lựa chọn giá trị tối ƣu cho siêu tham số huấn luyện va ) đảm bảo mơ hình phức tạp xác n ( tn to gh Các siêu tham số tham số nằm ngồi mơ hình khơng phụ p ie thuộc vào tập liệu huấn luyện, đƣợc thiết lập tùy ý ngƣời phát w triển trƣớc đào tạo mơ hình tùy thuộc vào toán giải cụ thể; khác oa nl với tham số thơng thƣờng đƣợc sinh từ tập liệu chạy mơ hình d Tập siêu tham số tối ƣu khác mơ hình, khác lu va an huấn luyện mơ hình nhƣng tập liệu khác Vì vậy, u nf hồn tồn khơng thể biết đƣợc toán tập liệu cụ ll thể hyperparameter nhƣ tối ƣu Kĩ thuật để ƣớc lƣợng giá m oi trị tối ƣu cho tập siêu tham số xác thực chéo, kể đến kỹ thuật z at nh nhƣ k-fold, hold-out hay phƣơng pháp sử dụng GridSearch z m co l gm @ an Lu n va ac th si 49 lu an n va p ie gh tn to oa nl w Hình 2.9: Sơ đồ sử dụng phƣơng pháp GridSearch d GridSearch đƣợc coi phƣơng pháp tối ƣu hóa siêu tham số an lu truyền thống “brute force” tất kết hợp có u nf va thể có Sau đó, mơ hình đƣợc đánh giá thơng qua xác nhận chéo Mơ hình ll có độ xác cao đƣơng nhiên đƣợc coi tốt oi Kết luận chƣơng m 2.7 z at nh Chƣơng trình bày tập trung lý thuyết SVM SVR, loại hàm z kernel SVR, phƣơng pháp tính tốn tham số SVR, ứng dụng SVR @ l gm vào liệu chuỗi thời gian tài Kỹ thuật GridSearch tìm tập siêu tham số tối ƣu cho SVR phƣơng pháp đánh giá MAPE nhằm đánh giá hiệu suất, m co độ xác mơ hình huấn luyện, đƣợc chúng tơi trình bày an Lu chƣơng n va ac th si 50 CHƢƠNG THỬ NGHIỆM Giới thiệu tốn 3.1 Trong chƣơng này, chúng tơi trình bày ứng dụng mơ hình SVR dự báo giá cổ phiếu chứng khoán thời điểm định Dự đoán giá cổ phiếu tốn có nhiều ứng dụng thực tế, nhận đƣợc quan tâm lớn từ nhà nghiên cứu nhƣ doanh nghiệp Đầu vào: Giá cổ phiếu khứ dạng chuỗi thời gian lu Đầu ra: Giá cổ phiếu đƣợc dự đoán thời điểm xác định an tƣơng lai so sánh độ xác tính tốn mơ hình so với giá va n thực tế to gh tn Bài toán dự đoán giá cổ phiếu này, sử dụng liệu giá ie cổ phiếu tập đoàn Apple (mã cổ phiếu AAPL) từ 01/09/2021 đến p 22/09/2021, bao gồm giá đóng cửa, giá mở cửa, giá cao nhất, giá thấp nhất, nl w khối lƣợng giao dịch d oa Ứng dụng mơ hình SVR sử dụng hàm kernel khác nhƣ an lu Linear, Polynomial hay RBF để huấn luyện thực dự đoán Mục tiêu u nf va cuối dự đốn giá đóng cửa cổ phiếu vào ngày xác định thuộc chuỗi thời gian tƣơng lai, so sánh với giá thực tế, đồng thời so sánh ll oi m đánh giá độ xác hàm kernel ứng dụng toán dự z at nh đoán chuỗi thời gian tài Sử dụng bƣớc Chƣơng để thử nghiệm đánh giá kết với z độ xác mơ hình đƣợc cho nhƣ l gm Chi tiết hóa @ 3.2 m co Chi tiết hóa cho thuật tốn Chƣơng với toán trên: an Lu Dữ liệu đầu vào lịch sử giá cổ phiếu cơng ty chứng khốn đƣợc niêm yết sàn chứng khốn nƣớc ngồi nƣớc, n va ac th si 51 lựa chọn công ty Apple với mã cổ phiếu AAPL, đƣợc niêm yết sàn chứng khoán NASDAQ Dữ liệu lịch sử giá cổ phiếu công ty thƣờng đƣợc xuất dƣới dạng file excel có CSV File liệu kiểu phù hợp thuận tiện cho ngơn ngữ Python đọc đƣợc liệu Dữ liệu sau đƣợc load vào đƣợc tiền xử lý liệu để trở thành dạng liệu chuẩn, phù hợp làm liệu đầu vào cho mơ hình SVR Với tập liệu chuẩn sau cơng đoạn tiền xử lý, tiến hành xử lý chia tập lu liệu thành hai tập gồm tập huấn luyện phục vụ cho xây dựng đào tạo an mơ hình, tập kiểm thử nhằm đánh giá kết đầu mơ hình va n Với tập liệu huấn luyện, tiến hành đào tạo SVR với ba trƣờng hợp gh tn to ứng với sử dụng ba hàm kernel khác nhau, lần lƣợt kernel linear, kernel ie poly kernel RBF Trƣớc tiến hành xây dựng huấn luyện mơ hình p kernel SVR, tìm tập siêu tham số tối ƣu cho hàm với kỹ thuật nl w GridSearch d oa Sau tiến hành đào tạo lần lƣợt mơ hình hàm kernel tập an lu liệu huấn luyện với tập siêu tham số cụ thể kernel, ta sử dụng u nf va mơ hình huấn luyện để dự đoán giá cổ phiếu vào ngày định tƣơng lai thuộc chuỗi thời gian Với mơ hình hàm kernel ll oi m giá trị siêu tham số khác mơ hình cho giá trị dự đoán z at nh khác So sánh giá dự đốn mơ hình với đối sánh với giá z đóng cửa thực cổ phiếu vào thời điểm dự đoán, ta đánh giá đƣợc độ @ l gm xác hiệu suất mơ hình với kỹ thuật MAPE, từ xác định kỹ liệu AAPL khung thời gian định m co thuật tốt làm việc với dự đoán giá cổ phiếu, cụ thể làm việc với an Lu n va ac th si 52 Dữ liệu 3.3 Dữ liệu đƣợc sử dụng lịch sử giá cổ phiếu tập đoàn Apple với mã cổ phiếu AAPL; bao gồm ngày (Date), giá mở cửa (Open), giá đóng cửa (Close), giá cao (High), giá thấp (Low), khối lƣợng giao dịch (Volume) giá đóng cửa điều chỉnh (Adj Close) lu an n va p ie gh tn to oa nl w d Hình 3.1 Trích phần liệu AAPL_30.CSV lu va an Bộ liệu AAPL có 15 hàng liệu tất cả, lịch sử tháng cổ u nf phiếu AAPL giá từ 01/09/2020 đến 22/09/2021 ll Ta hoàn tồn sử dụng liệu lịch sử giá công ty khác m oi với khung thời gian dài ngắn Cài đặt thực nghiệm z at nh 3.4 z Để cài đặt chƣơng trình thử nghiệm, yêu cầu máy tính cần: gm @  Cấu hình phần cứng: RAM 2GB an Lu  Ngơn ngữ môi trƣờng cài đặt: m co l Máy tính cần có cấu hình tối thiểu nhƣ CPU có tốc độ 2.0 GHz, n va ac th si 53 Hệ điều hành Windows Linux Ngôn ngữ lập trình Python Đầu tiên, ta tiến hành thiết lập thƣ viện cần thiết cho chƣơng trình: #Import the libraries from sklearn.svm import SVR import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.style.use('seaborn-darkgrid') Sau load file liệu APPL_30.CSV xử lý liệu, ta tiến hành chia thành hai tập liệu huấn luyện kiểm thử Tiếp theo, sử dụng kỹ lu thuật GridSearch để tìm tập hyperparameter tối ƣu từ tập ứng viên: an n va tn to parameter_candidates = [ {'C': [1, 10, 100, 1000], 'kernel': ['linear']}, {'C': [1, 10, 100, 1000], 'gamma': [0.001, 0.15], 'kernel': ['rbf']}, {'C': [1, 10, 100, 1000], 'degree': [2, 3], 'kernel': ['poly']}, ] p ie gh # Create a classifier object with the classifier and parameter candidates clf = GridSearchCV(estimator=svm.SVC(), param_grid=parameter_candidates, n_jobs=-1) nl w d oa Với tập siêu tham số tìm đƣợc từ GridSearch, ta xây dựng huấn va Polynomial: an lu luyện mơ hình SVR với ba hàm kernel lần lƣợt Linear, RBF ll u nf #Create and train an SVR model using a linear kernel lin_svr = SVR(kernel='linear', C=1000.0) lin_svr.fit(days,adj_close_prices)#Create and train an SVR model using a polynomial kernel poly_svr = SVR(kernel='poly', C=1000.0, degree=2) poly_svr.fit(days, adj_close_prices)#Create and train an SVR model using a RBF kernel rbf_svr = SVR(kernel='rbf', C=1000.0, gamma=0.15) rbf_svr.fit(days, adj_close_prices) oi m z at nh z @ m co l gm So sánh ba hàm kernel mơ hình liệu: an Lu n va ac th si 54 #Plot the models on a graph to see which has the best fit plt.figure(figsize=(16,8)) plt.scatter(days, adj_close_prices, color = 'black', label='Original Data') plt.plot(days, rbf_svr.predict(days), color = 'green', label='RBF Model') plt.plot(days, poly_svr.predict(days), color = 'orange', label='Polynomial Model') plt.plot(days, lin_svr.predict(days), color = 'purple', label='Linear Model') plt.xlabel('Days') plt.ylabel('Adj Close Price') plt.title('Support Vector Regression') plt.legend() plt.show() lu Kết đánh giá an 3.5 n va Kết dự đoán giá cổ phiếu AAPL ngày 22/09/2021 SVR RBF SVR 145.03388846 Linear SVR 143.37998918 p ie gh tn to theo hàm kernel RBF, Linear Polynomial lần lƣợt là: 140.68903384 w Polynomial SVR oa nl Với giá cổ phiếu thực tế AAPL ngày 22/09/2021 d 145.850006, thấy mơ hình SVR cho kết xác cao lu va an đặc biệt mơ hình RBF SVR có kết dự đoán 145.03388846 u nf Biểu diễn so sánh kết dự đốn mơ hình RBF, Linear ll Poly đƣợc thể Hình 3.2: oi m z at nh z m co l gm @ an Lu n va ac th si 55 lu an va n Hình 3.2: Mơ hình thể kết dự đoán kernel tn to Kết dự đoán khác biệt hàm, với độ xác ie gh cao, cụ thể cao mơ hình RBF SVR siêu tham số p hyperparameter đƣợc tính tốn GridSearch từ tập ứng viên siêu tham số, [ ] ] m co l gm ] @ [ ] z [ ] z at nh Polynomial oi m [ [ ] ll [ ] u nf Linear [ va an lu [ Tập hyperparameter tối ƣu ] d RBF Tập hyperparameter ứng viên oa Kernel nl w tƣơng ứng lần lƣợt với kernel nhƣ sau: Sử dụng kỹ thuật MAPE với mơ hình kernel, ta xác định đƣợc độ an Lu xác mơ hình lần lƣợt nhƣ sau: n va ac th si 56 MAPE with RBF kernel: 0.5595594867333512 MAPE with Linear kernel: 1.693532201906021 MAPE with Polynomial kernel: 3.5385477843993742 Kết luận chƣơng 3.6 Trong chƣơng này, luận văn tiến hành cài đặt thử nghiệm hàm kernel mơ hình SVR đƣợc trình bày chƣơng hai nhằm giải toán mục tiêu “Dự đoán giá cổ phiếu dựa vào liệu chuỗi thời gian khứ” Kết đánh giá đạt đƣợc thành công từ ý tƣởng áp lu dụng mơ hình đề Độ xác nằm mức tƣơng đối cao đối an va với tập liệu không lớn Trong trƣờng hợp tập liệu lớn với n nhiều yếu tố ngoại lai kết không nhƣ mong muốn, cần phải phát p ie gh tn to triển khắc phục số hạn chế để đạt đƣợc kết tốt d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 57 KẾT LUẬN Nội dung nghiên cứu kết đạt đƣợc luận văn Bài toán dự đoán giá chứng khoán đƣợc đặt từ lâu hàng loạt nghiên cứu đề tài đƣợc xác lập, ứng dụng đƣợc triển khai Bài tốn ln đặt nhiều thách thức khó khăn Các khó khăn chứng tỏ phƣơng pháp giải toán tránh khỏi số khiếm khuyết định Mỗi hƣớng tiếp cận đƣợc đƣa lu an đạt đƣợc thành định, hƣớng có va n thành cơng, hạn chế Vì tốn tốn khơng có lời giải tối tn to ƣu cho trƣờng hợp Tuy nhiên, tính cấp thiết từ yêu cầu thực tế ie gh mà đề tài hấp dẫn nhà khoa học, chuyên gia nghiên p cứu ứng dụng nl w Trong nội dung nghiên cứu đề tài “Ứng dụng SVM dự đoán chuỗi thời oa gian tài chính” thân tìm hiểu thuật tốn, mơ hình xử lý dự báo d chuỗi thời gian, nhƣ áp dụng mơ hình để giải tốn đặt an lu va Qua nghiên cứu, kết mà luận văn đạt đƣợc nhƣ sau: oi m thời gian tài ll u nf - Khái quát chuỗi thời gian, dự báo chuỗi thời gian cụ thể chuỗi z at nh - Trình bày số kỹ thuật, hàm kernel mơ hình SVM cụ thể SVR đƣợc dùng để dự đốn chuỗi thời gian tài hiệu z - Trình bày kỹ thuật GridSearch để tìm siêu tham số tối ƣu cho SVR @ gm phƣơng pháp MAPE dùng để đánh giá hiệu suất mơ hình huấn luyện m co l - Cài đặt thử nghiệm mơ hình SVR áp dụng hàm kernel dự đốn giá trị cổ phiếu vào ngày xác định dựa vào liệu chuỗi thời gian giá trị lịch sử an Lu khứ, sử dụng MAPE để đánh giá so sánh hiệu suất mơ hình n va ac th si 58 Kiến nghị hƣớng nghiên cứu Dự đoán chuỗi thời gian tài chính, đặc biệt giá trị cổ phiếu hay cryto tiếp tục toán đƣợc nhiều nhà nghiên cứu cộng đồng quan tâm với nhiều ứng dụng to lớn, có tầm quan trọng khơng khoa học mà thực tiễn Với hạn chế khó khăn cịn gặp q trình phát triển, giải toán, hƣớng nghiên cứu luận văn tiếp tục đào sâu vào mơ hình học máy, học sâu, song song với phiên tiền xử lý liệu lu an để nâng cao hiệu suất đầu toán n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 59 TÀI LIỆU THAM KHẢO [1] Cherkassky, V., & Mulier, F (1999) Vapnik-Chervonenkis (VC) learning theory and its applications IEEE Transactions on Neural Networks, 10(5), 985- 987 https://doi.org/10.1109/TNN.1999.788639 [2] Aoki, M., (1990) State space modeling of time series Springer-Verlag; NewYork: Springer-Verlag, 2nd edition lu an Chatfield, C., (2001) Time Series Forecasting Chapman and Hall [4] Granger, C.W.J., and Joyeux, R., (1980) An introduction to long- n va [3] tn to memory time series models and fractional differencing, Journal of gh Time Series Analysis, vol Priestley, M.B., (1981) Spectral Analysis and Time Series, New York: p ie [5] w AcademicPress, London Tong, I., (1990) Non-Linear Time Series Clarendon Press, Oxford [7] Jain, A.K, Murty, M.N., and Flynn, P.J, (1999) Data Clustering: a d oa nl [6] lu Baestaens, D.E., (1994) Neural Network Solutions for Trading in u nf [8] va an review, ACM Computing Surveys, Vol 31, No 3: 264 - 323 ll Financial Markets, London: Financial Times: Pitman Pub m Chatfield, C., (2004) The analysis of time series: an introduction oi [9] z at nh Chapman andHall, Sixth edition [10] S Hochreiter and J Schmidhuber, "Long Short-Term Memory," z gm @ in Neural Computation, vol 9, no 8, pp 1735-1780, 15 Nov 1997 Machine Learning, Vol.20,No.3: 273 - 297 m co l [11] Cortes C., and Vapnik, V.N (1995) Support-Vector Networks, an Lu [12] Burges, C and Crisp, D., (2000) Uniqueness of the SVM Solution, In Solla, S.A.,Leen, T.K., and Muller, K.-R., editors, Advances in n va ac th si 60 Neural InformationProcessing Systems, Vol.12: 223 - 229, Cambridge, MA, MIT Press [13] Burges, C.J.C., (1998) A Tutorial on Support Vector Machines for Pattern Recognition, Data Miningand Knowledge Discovery Vol.2:121 – 167 [14] Mukherjee, S., Osuna E., and Girosi, F.,(1997) Nonlinear prediction of chaotictime series using support vector machines, Proc of IEEENNSP‟97, AmeliaIsland, FL lu [15] Bennett, K.,and Bredensteiner, E.J.,(2000) Duality andgeometry in an SVMclassifiers, In Langley, P., editor, Proc of Seventeenth Intl va n Conf on MachineLearning, pages 57 - 64, SanFrancisco, Morgan to gh tn Kaufmann p ie [16] Joachims, I (1997) Text Categorization with Support Vector Machines, Technical Report oa nl w [17] Schmidt, M., (1996) Identifying speaker with support vector networks, Interface1996 Proceedings, Sydney d an lu [18] Scholkopf, B., Burges, C., and Smola, A.,(1999) Advances in Kernel u nf va Methods:Support Vector Learning, MIT Press, Cambridge, Massachusetts ll oi m [19] Harris Drucker, Chris J C Burges, Linda Kaufman, Alex Smola, and z at nh Vladimir Vapnik 1996 Support vector regression machines In Proceedings of the 9th International Conference on Neural z MA, USA, 155–161 l gm @ Information Processing Systems (NIPS'96) MIT Press, Cambridge, m co [20] Siwei Lyu, "Mercer kernels for object recognition with local features," 2005 IEEE Computer Society Conference on Computer an Lu Vision and Pattern Recognition (CVPR'05), 2005, pp 223-229 vol n va ac th si 61 2, doi: 10.1109/CVPR.2005.223 [21] Lin, H.T., and Lin, C.J., (2003) A study on sigmoid kernels for SVM and thetraining of non-PSD kernels by SMO-typemethods, Technical Report [22] Kwok, J.T., and Tsang I.W., (2003) Linear dependency between & and the input noise in &-support vector regression IEEE Transactions on Neural Networks, Vol XX, No YY: – [23] CherKassky, V., and Mulier, F., (1998).Learning from Data: Concepts, lu Theory and Methods John Wiley & Sons Inc New York, NY an [24] Cherkassky, V., and Ma, Y., (2004) Practical selection of SVM va n parameters andnoise estimation for SVM regression, Neural to gh tn Networks,Vol.17,No.1: 113 - 126 p ie [25] Mattera, D., and Haykin, S., (1999) Support vector machines for dynamic reconstruction of a chaotic system oa nl w [26] Kyoung-jae Kim, Financial time series forecasting using support vector machines, Neurocomputing, Volume 55, Issues 1–2, 2003, Pages d an lu 307-319, ISSN 0925-2312 u nf va [27] Tay, F.EH., and Cao, L.J., (2001) Application of support vector machines infinancial time series forecasting, Omega Vol 29: 309 - ll oi m 317 z at nh [28] Tay, F.F.H, Cao, L.J., (2002) Modified support vector machines in financialtime series forecasting, Neurocomputing Vol 48: 847 - z gm @ 861 [29] Tay, FEM., Cao, L.J., (2003) &-Descending Support Vector Machines l Vol 15:179 – 195 m co forFinancial Time Series Forecasting, Neural Processing Letters an Lu [30] Yang, H., King, I., and Chan, L., (2002a) Non-fixed and asymmetrical n va ac th si 62 marginapproach to stock market prediction using Support Vector Regression, In theProceedings of ICONIP 2002, Singapore [31] Yang, H., Chan, L., and King, I., (2002b) Support vector machine regression forvolatile stock market prediction, Lecture notes in Computer Science, Vol.2412:391 – 396 [32] Thissen, U., Brakel, R.V., de Weijer, A.P., Melssen, W.J., Buydens L.M.C.(2003) Using support vector machines for time series prediction, Chemometrics and Intelligent Laboratory Systems Vol lu 69, 35 – 49 an [33] K Kim, I Han, Genetic algorithms approach to feature discretization va n in arti-cial neural networks for the prediction of stock price index, to gh tn Expert Syst Appl 19 (2) (2000) 125–132 p ie [34] Heizer, Jay dan Render, Barry 2015.Manajemen Operasi Jakarta: d oa nl w Salemba Empat.p.129 ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si

Ngày đăng: 19/07/2023, 05:03

w