1. Trang chủ
  2. » Luận Văn - Báo Cáo

DỰ báo XU HƯỚNG CHỨNG KHOÁN dựa vào TIN tức tài CHÍNH tại sàn GIAO DỊCH TP hồ CHÍ MINH

64 271 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 64
Dung lượng 7,94 MB

Nội dung

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN  HUỲNH ĐỨC HUY DỰ BÁO XU HƯỚNG CHỨNG KHOÁN DỰA VÀO TIN TỨC TÀI CHÍNH TẠI SÀN GIAO DỊCH TP.HỒ CHÍ MINH LUẬN VĂN THẠC SỸ NGÀNH KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: TIẾN SỸ DƯƠNG MINH ĐỨC TP HỒ CHÍ MINH, 2017 LỜI CẢM ƠN  Đầu tiên, tác giả xin gởi lời cảm ơn sâu sắc đến người thân gia đình, người khơng ngại vất vả tác giả theo đuổi đường mà chọn Đặc biệt, tác giả xin gửi lời cảm ơn lòng biết ơn chân thành đến Tiến sĩ Dương Minh Đức, người hướng dẫn khoa học tận tâm nghiêm túc Thầy tạo điều kiện tốt cho tác giả suốt trình thực luận văn tốt nghiệp nhóm nghiên cứu môn, truyền đạt cho tác giả kinh nghiệm quý báu giúp tác giả tự tin bước đường nghiên cứu khoa học Tác giả xin cảm ơn đến thành viên nhóm nghiên cứu môn, thành viên giúp đỡ hỗ trợ nhiều để tác giả hoàn thành luận văn Bên cạnh tác giả xin cảm ơn giáo sư Takasu - viện nghiên cứu quốc gia Nhật Bản, thời gian thực tập phòng thí nghiệm viện có tháng Giáo sư thành viên phòng thí nghiệm tạo điều kiện cho tác giả tiếp xúc với môi trường nghiên cứu khoa học chuyên nghiệp, giúp tác giả định hướng trình thực luận văn Trong thời gian tháng thực đề tài, tác giả cố gắng vận dụng kiến thức tảng tích lũy, đồng thời kết hợp với việc học hỏi nghiên cứu kiến thức Tuy nhiên, chắn tác giả khơng tránh khỏi thiếu sót, tác giả mong nhận góp ý từ phía thầy nhằm hồn thiện kiến thức mà tác giả học tập để làm hành trang thực tiếp đề tài nghiên cứu khác tương lai Những kiến thức tích lũy mà quý thầy cô truyền đạt hành trang quý báu để tác giả tự bước đường mà chọn Xin chân thành tri ân! Tp Hồ Chí Minh, tháng 01 năm 2017 Học viên Huỳnh Đức Huy LỜI CAM ĐOAN  Tác giả xin cam đoan là công trin ̀ h nghiên cứu của bản thân hướng dẫn Tiến sĩ Dương Minh Đức Các số liê ̣u, kế t quả triǹ h bày luâ ̣n văn là trung thực Các tư liê ̣u đươ ̣c sử du ̣ng luâ ̣n văn có nguồ n gố c và trić h dẫn mô ̣t cách rõ ràng, đầ y đủ Tp Hồ Chí Minh, tháng 01 năm 2017 Học viên Huỳnh Đức Huy MỤC LỤC MỤC LỤC .3 Danh mục hình vẽ Danh mục bảng Danh mục từ viết tắt TÓM TẮT 10 MỞ ĐẦU .12 Chương 1.1 TỔNG QUAN 16 Đặt vấn đề .16 1.1.1 Phát biểu toán 16 1.1.2 Dữ liệu đầu vào 16 1.1.3 Dữ liệu đầu 17 1.2 Các nghiên cứu liên quan 17 1.2.1 Trong nước .17 1.2.2 Ngoài nước .17 1.2.3 Những vấn đề tồn .19 Chương CƠ SỞ LÝ THUYẾT .20 2.1 Tổng quan mạng nơ-ron (Neural Network) .20 2.1.1 Kiến trúc mạng nơ-ron kết nối đầy đủ 20 2.1.2 Phương thức suy luận thông tin mạng nơ-ron 22 2.1.3 Hàm kích hoạt 23 2.1.4 Mô hàm xác suất hàm phân loại .23 2.1.5 Phương pháp ước lượng tham số mạng nơ-ron .24 2.1.6 Hàm mát 25 2.1.7 Vấn đề Overfitting 26 2.2 Mạng Nơ-ron hồi quy 28 2.3 Vấn đề nắm bắt thông tin dài hạn (Long-Term Memmory) 30 2.4 Mạng Gated Recurrent Unit (GRU) .31 Chương MƠ HÌNH DỰ ĐOÁN XU HƯỚNG GIÁ CHỨNG KHOÁN BẰNG MẠNG NƠ-RON DỰA TRÊN TIN TỨC TÀI CHÍNH 33 3.1 Đề xuất mơ hình mạng Gated Recurrent Unit hai chiều .33 3.2 Mơ hình dự báo .35 3.2.1 Tiền xử lý văn 36 3.2.2 Word Embedding 38 3.2.3 Máy học với mơ hình BGRU 40 3.2.4 Kỹ thuật Dropout 40 Chương THỰC NGHIỆM 43 4.1 Cài đặt, côngcụ hỗ trợ 43 4.2 Phương pháp đánh giá 43 4.3 Bộ liệu thực nghiệm .44 4.3.1 Sự tác động tin tức lên giá chứng khoán theo thời gian 45 4.3.2 Dự báo chuyển động giá chứng khoán mã S&P500 46 4.3.3 Dự báo mã chứng khoán riêng biệt 49 4.4 Dự báo chuyển động giá VN-INDEX .50 4.5 Đánh giá 53 Chương 5.1 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .54 Kết đạt 54 5.1.1 Về khoa học 54 5.1.2 Về thực tiễn 54 5.2 Hướng phát triển 54 5.3 Kết luận 55 TÀI LIỆU THAM KHẢO 56 PHỤ LỤC 60 A Các khái niệm thị trường chứng khoán .60 B Mạng Long Short Term Memmory (LSTM) 62 Danh mục hình vẽ Hình 2.1 Minh hoạ cho kết nối lớp mạng nơ-ron 21 Hình 2.2 Ví dụ minh họa cho việc tối ưu hàm số 25 Hình 2.3 Một ví dụ overfitting 27 Hình 2.4 Minh hoạ “learning curve” xuất overfitting 28 Hình 2.5 Minh họa mơ hình mạng nơ-ron hồi quy với hàm .30 Hình 2.6 Minh họa mơ hình GRU 32 Hình 3.1 Minh họa mơ hình BGRU 34 Hình 3.2 Minh họa mơ hình dự báo chuyển động giá chứng khốn 35 Hình 3.3 Minh họa trình tiền xử lý văn 36 Hình 3.4 Giao diện tách nội dung tin tức từ file html 36 Hình 3.5 Tin tức sau tách nội dung từ file HTML 37 Hình 3.6 Nội dung tin tức sau tách từ 37 Hình 3.7 Minh họa danh sách “từ dừng” thư viện NLTK 38 Hình 3.8 Minh họa vec-tơ tên “quốc gia” “thủ đô” [29] 40 Hình 3.9 Minh họa kỹ thuật dropout [13] 41 Hình 3.10 So sánh mơ hình BGRU áp dụng Dropout 42 Hình 4.1 Kết thực nghiệm đánh giá tác động tin tức theo thời gian 46 Hình 4.2 Biểu đồ kết độ đo mơ hình LSTM, GRU BGRU .48 Hình 4.3 Biểu đồ đánh giá tác động tin tức lên mã cổ phiếu riêng biệt 49 Hình 4.4 Biểu đồ đánh giá kết thực nghiệm BGRU với SVM 52 Hình 4.5 Biểu đồ thể độ đo theo mẫu thời gian .53 Danh mục bảng Bảng 3.1 So sánh số lượng tham số cần ước lượng mô hình DL 34 Bảng 4.1 Ma trận kết hợp tính độ xác 44 Bảng 4.2 Kết thực nghiệm dự báo chuyển động giá mã S&P500 Index .47 Bảng 4.3 Kết độ đo mơ hình BGRU, GRU LSTM 48 Bảng 4.4 Thống kê số lượng tin tức mã cổ phiếu riêng biệt 49 Bảng 4.5 Chi tiết liệu báo Tiếng Việt 51 Danh mục từ viết tắt ❖ Tiếng Việt STT Ký hiệu/ Chữ viết tắt Ý nghĩa CNTT Công nghệ Thơng tin HoSE Sàn giao dịch chứng khốn TP.HCM KLCP Khối lượng cổ phiếu TTCK Thị trường chứng khoán VN-Index Chỉ số giá cổ phiếu thời gian định (phiên giao dịch, ngày giao dịch) công ty niêm yết sàn giao dịch chứng khoán TP.HCM ❖ Tiếng Anh STT Ký hiệu/ Chữ viết tắt ANN BGRU DNN DL EMH GRU LSTM NLP NLTK Diễn giải Artifical Neural Network Bidirectional Gated Recurrent Unit Deep Neural Network Ý nghĩa Mạng nơ-ron nhân tạo Mạng GRU hai chiều Mạng nơ-ron sâu nhiều lớp Deep Learning phương pháp dựa số ý tưởng từ não tới Deep Learning việc tiếp thu nhiều tầng biểu đạt, cụ thể lẫn trừu tượng, qua làm rõ nghĩa loại liệu Efficient Market Hypothesis Lý thuyết thị trường Một biến thể mạng nơGated Recurrent Unit ron hồi quy (RNN) Long Short Term Một biến thể mạng nơMemmory ron hồi quy (RNN) Natural Language Xử lý ngôn ngữ tự nhiên Processing Thư viện hỗ trợ xử lý ngôn Natural Language Toolkit ngữ tự nhiên Python 10 S&P500 Standard & Poor 500 11 RNN Recurrent Neural Network 12 TF-IDF term frequency – inverse document frequency Chỉ số thị trường chứng khốn dựa thị trường vốn hóa 500 cơng ty lớn có cổ phiếu phổ thơng niêm yết thị trường chứng khoán Hoa Kỳ Mạng nơ-ron hồi quy TF-IDF từ số thu qua thống kê thể mức độ quan trọng từ văn bản, mà thân văn xét nằm tập hợp văn 4.3.3 Dự báo mã chứng khốn riêng biệt Để đánh giá mơ hình dự báo áp dụng cho mã chứng khoán riêng biệt, tác giả thực nghiệm với công ty lĩnh vực khác Tác giả chọn công ty Google đại diện ngành công nghệ thông tin, công ty Wal-Mart 10 đại diện ngành thương mại công ty Boeing11 ngành công nghiệp chế tạo (được phân loại The Global Industry Classification Standard12) Từ liệu tiếng Anh, tác giả trích lọc tất tin tức có đề cập đến cơng ty nêu liệu tiến hành thử nghiệm Chi tiết thống kê số lượng tin tức thể qua bảng 4.4 Bảng 4.4 Thống kê số lượng tin tức mã cổ phiếu riêng biệt Tên công ty Số lượng tập tin huấn luyện Số lượng tập tin kiểm tra Google Inc 2,252 1,124 Wal-Mart 1,484 741 Boeing 2,080 1,039 Độ xác (Accuracy %) 68 66 64 62 LSTM 60 GRU BGRU 58 56 54 Google Wal-mart Boeing Hình 4.3 Biểu đồ đánh giá tác động tin tức lên mã cổ phiếu riêng biệt https://www.google.com/ about/company https://www.walmart.com 11 http://www.boeing.com 12 Global Industry Classification Standard: Chuẩn phân loại ngành cơng nghiệp tồn cầu (GICS) đề xuất vào năm 1999 MSCI Standard & Poor (S & P) sử dụng ngành tài tồn cầu 10 49 Qua kết thực nghiệm thể hình 4.3 thấy độ xác mơ hình BGRU cho kết tốt nhất, kết mơ hình GRU LSTM chênh khơng q đáng kể Đặc biệt, độ xác dự báo cho mã cổ phiếu công ty Wal-Mart đạt 66% 4.4 Dự báo chuyển động giá VN-INDEX Tác giả thực nghiệm với liệu thu thập nhóm nghiên cứu [9] Tin tức tài thu thập từ nguồn trang vietstock.vn khoảng thời gian từ tháng 01/2014 đến tháng 05/2015 với số lượng 2,471 báo Để khớp với so sánh nhóm nghiên cứu [9] tác giả chia liệu thực nghiệm làm mẫu gồm: mẫu chứa tin tức từ tháng 01/2015 đến tháng 04/2015, mẫu chứa tin tức từ tháng 09/2014 đến tháng 04/2015, mẫu chứa tin tức từ tháng 05/2014 đến tháng 04/2015 bảng 4.5 50 Bảng 4.5 Chi tiết liệu báo Tiếng Việt Số lượng báo Mẫu (01/2015-04/2015) Mẫu (09/2014-04/2015) Mẫu (05/2014-04/2015) Tập huấn luyện Tập kiểm tra Tổng 1092 463 1555 1499 640 2139 1715 756 2471 Qua biểu đồ hình 4.4 thấy mơ hình dự báo dựa vào mạng BGRU cho kết cao so với phương pháp SVM kết hợp phương pháp beta TF-IDF từ điển sentiment [9] Với liệu, mẫu số kết cao 4% xác, mẫu số 5% mẫu số 7% Qua đó, nhận định với liệu lớn mơ hình dự báo với phương pháp BGRU có khả dự báo tốt so với SVM Nhìn chung độ xác (accuracy) hệ thống ln mức 70%, độ xác (accuracy) cao thấp mẫu có nhiễu tin tức thu thập 51 Độ xác (%) 100 90 80 70 60 50 40 30 20 10 77.2 73 Mẫu 73.96 74.87 68.6 67.6 Mẫu Mẫu SVM + Delta TFIDF + Sentiment [10] BGRU Hình 4.4 Biểu đồ đánh giá kết thực nghiệm BGRU với SVM Tiếp theo, tác giả tiến hành so sánh độ đo mẫu thời gian ứng với mẫu liệu 1, mẫu liệu mẫu liệu để tìm hiểu độ đo precision recall hệ thống số lượng báo khoảng thời gian tăng lên Ở biểu đồ hình 4.5, độ đo precision thể tỉ lệ xác dự báo xu hướng giá tăng tổng số dự báo tăng mô hình ln cao 75% Riêng mẫu có độ precision đạt tỉ lệ 84%, qua cho thấy tỉ lệ dự báo phân lớp mơ hình đạt tỉ lệ khả quan Bên cạnh kết độ đo recall cho biết tỉ lệ độ phủ dự báo xu hướng giá tăng tổng số báo thực tế làm xu hướng giá tăng cao 75% Đặc biệt mẫu liệu đạt độ phủ 82% Qua kết độ đo tập mẫu dự liệu theo thời gian tăng số lượng tin tức tăng, thấy có biến thiên nhỏ độ xác, độ precision recall Tuy nhiên, mơ hình cho thấy độ ổn định với kết độ đo lớn 70% độ phủ lớn 75% 52 Recall 79.29 75 74.87 75 77.02 74.11 73.96 77.2 80 77.29 85 Tỉ lệ (%) Precision 82.9 Accuracy 70 65 60 Mẫu Mẫu Mẫu Hình 4.5 Biểu đồ thể độ đo theo mẫu thời gian 4.5 Đánh giá Luận văn chứng minh mạng nơ-ron mơ hình đề xuất BGRU công cụ mạnh việc dự báo chuyển động giá chứng khoán dựa vào tin tức nói riêng mơ hình ngơn ngữ nói chung Đồng thời, kết thực nghiệm áp dụng vào thị trường chứng khoán Việt Nam khả thi Để đạt điều đó, tin tức tài với giá chứng khốn đánh giá Và qua q trình thực nghiệm chứng minh tin tức tài có tương quan với giá chứng khoán Cụ thể, nghiên cứu tác giả phản ánh thực trạng sàn HoSE – nơi có số tài tốt tính khoản cao Đặc biệt áp dụng vào rổ VN-INDEX mang lại độ xác cao đáng ghi nhận lớn 70% Tuy nhiên, liệu Tiếng Việt ít, độ nhiễu mức độ phản ánh thị trường tin tức chưa cao lý chủ quan dẫn đến áp dụng vào thị trường Việt Nam chưa mang lại độ tin cậy cao 53 Chương KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết đạt 5.1.1 Về khoa học Trong khóa luận này, tác giả đạt kết mặt khoa học sau: Đề xuất mơ hình mạng nơ-ron nhân tạo đặt tên Bidirectional Gated - Recurrent Unit (BGRU) Mơ hình đặc biệt mạnh việc xử lý liệu dạng chuỗi tuần tự, đồng thời BGRU có khả học đặc trưng chiều ngữ cảnh mơ hình ngôn ngữ Áp dụng kỹ thuật word embedding, dropout, bước tiền xử lý liệu - để tăng độ xác tin cậy cho mơ hình - So sánh mơ hình đề xuất BGRU với mơ hình LSTM, GRU SVM - Xây dựng mơ hình dự báo xu hướng chứng khốn dựa tin tức có độ xác cao, từ kết hợp với tiếp cận phân tích kỹ thuật để giải hiệu vấn đề dự báo chứng khốn nói riêng dự báo tài (vàng, ngoại tệ) nói chung 5.1.2 Về thực tiễn Chứng minh việc sử dụng tin tức tài có ảnh hưởng đến giá cổ phiếu cụ - thể thị trường chứng khoán Việt Nam kết thực nghiệm rổ VNINDEX Cụ thể, kết nghiên cứu phản ánh thực trạng sàn HoSE – nơi có số tài tốt tính khoản cao Đặc biệt áp dụng vào rổ VN-INDEX mang lại độ xác cao đáng ghi nhận (77,2%) Ngoài việc nghiên cứu áp dụng cho thị trường chứng khốn - ngơn ngữ Tiếng Anh tiếng Việt 5.2 Hướng phát triển Việc áp dụng tin tức tài vào dự báo giá chứng khốn mẻ Việt Nam, đồng thời công nghệ deep learning mẻ với tác giả, 54 phạm vi thực đề tài nhiều thiếu sót dự định hướng phát triển thời gian tới - Xây dựng hệ thống dự báo thời gian thực để ứng dụng vào thực tế - Tiếp cận hướng dự báo dựa vào kiện - Áp dụng thêm phương pháp phân tích kỹ thuật nhằm khai thác tối đa liệu lịch sử giá đưa vào mơ hình Áp dụng kỹ thuật tiền xử lý văn để giảm đặc trưng liệu ngoại - lai ảnh hưởng đến kết dự báo Thu thập liệu tiếng Việt với số lượng lớn để tăng độ tin cậy 5.3 Kết luận Ngày nay, hướng dự báo chuyển động dựa vào tin tức tài ứng dụng mơ hình deep learning nhà nghiên cứu quan tâm, chứng nhiều nghiên cứu công bố gần Việc đề xuất áp dụng mơ hình BGRU phạm vi đề tài khóa luận mở hướng tiếp cận mẻ bước đầu có kết đáng khích lệ áp dụng vào thị trường chứng khoán Việt Nam Đề tài luận văn giải mục tiêu đặt từ đầu Song, nhiều điều cần phải cải tiến phía trước để đưa vào ứng dụng thực tế 55 TÀI LIỆU THAM KHẢO [1] Agrawal, J G., Chourasia, V S., & Mittra, A K (2013), “State-of-the-art in stock prediction techniques”, International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering, 2(4), 1360-1366 [2] Akita, R., Yoshihara, A., Matsubara, T., & Uehara, K (2016, June), “Deep learning for stock prediction using numerical and textual information”, In Computer and Information Science (ICIS), 2016 IEEE/ACIS 15th International Conference on (pp 1-6) IEEE [3] Baldi, P., Brunak, S., Frasconi, P., Soda, G., & Pollastri, G (1999), “Exploiting the past and the future in protein secondary structure prediction”, Bioinformatics, 15(11), 937-946 [4] Bar-Haim, R., Dinur, E., Feldman, R., Fresko, M., & Goldstein, G (2011, July), “Identifying and following expert investors in stock microblogs”, In Proceedings of the Conference on Empirical Methods in Natural Language Processing (pp 1310-1319) Association for Computational Linguistics [5] Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y (2014), “Learning phrase representations using RNN encoder-decoder for statistical machine translation” arXiv preprint arXiv:1406.1078 [6] Chung, J., Gulcehre, C., Cho, K., & Bengio, Y (2014), “Empirical evaluation of gated recurrent neural networks on sequence modeling”, arXiv preprint arXiv:1412.3555 [7] Ding, X., Zhang, Y., Liu, T., & Duan, J (2014, October), “Using Structured Events to Predict Stock Price Movement: An Empirical Investigation”, In EMNLP (pp 1415-1425) [8] Dũng, Phạm Xuân, and Hoàng Văn Kiếm (2015) “Vietnamese Stock Market Prediction Using Text Mining”, Kỷ yếu Hội nghị Quốc gia lần thứ VIII Nghiên cứu ứng dụng Công Nghệ thông tin (FAIR) [9] Duong, D., Nguyen, T., & Dang, M (2016, January), “Stock Market Prediction using Financial News Articles on Ho Chi Minh Stock Exchange” In Proceedings of the 10th International Conference on Ubiquitous Information Management and Communication (p 71) ACM [10] Fama, E F (1965), “The behavior of stock-market prices”, The journal of Business, 38(1), 34-105 [11] Goldberg, Y (2016), “A primer on neural network models for natural language processing”, Journal of Artificial Intelligence Research, 57, 345-420 [12] Guresen, E., Kayakutlu, G., & Daim, T U (2011), “Using artificial neural network models in stock market index prediction”, Expert Systems with Applications, 38(8), 10389-10397 56 [13] Srivastava, N., Hinton, G E., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R (2014), “Dropout: a simple way to prevent neural networks from overfitting”, Journal of Machine Learning Research, 15(1), 1929-1958 [14] Hochreiter, S (1998), “The vanishing gradient problem during learning recurrent neural nets and problem solutions”, International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 6(02), 107-116 [15] Hong Phuong Le, Thi Minh Huyen Nguyen, Azim Roussanaly, Tuong Vinh Ho (2008, March), “A hybrid approach to word segmentation of Vietnamese texts”, In International Conference on Language and Automata Theory and Applications (pp 240-249) Springer Berlin Heidelberg [16] Huang, W., Nakamori, Y., & Wang, S Y (2005), “Forecasting stock market movement direction with support vector machine”, Computers & Operations Research, 32(10), 2513-2522 [17] Kaya, M Y., & Karsligil, M E (2010, September), “Stock price prediction using financial news articles”, In Information and Financial Engineering (ICIFE), 2010 2nd IEEE International Conference on (pp 478-482) IEEE [18] Kim, K J., & Han, I (2000), “Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index”, Expert systems with Applications, 19(2), 125-132 [19] Krause, T., Noth, F., & Tonzer, L (2016), “Brexit (probability) and effects on financial market stability” [20] Längkvist, M., Karlsson, L., & Loutfi, A (2014), “A review of unsupervised feature learning and deep learning for time-series modeling”, Pattern Recognition Letters, 42, 11-24 [21] Le-Hong, P., Roussanaly, A., Nguyen, T M H., & Rossignol, M (2010, July), “An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts”, In Traitement Automatique des Langues Naturelles-TALN 2010 (p 12) [22] Lo, A W., & MacKinlay, A C (1988), “Stock market prices not follow random walks: Evidence from a simple specification test”, Review of financial studies, 1(1), 41-66 [23] Malkiel, B G (1989), “Efficient market hypothesis”, The New Palgrave: Finance Norton, New York, 127-134 [24] Mikolov, T., Karafiát, M., Burget, L., Cernocký, J., & Khudanpur, S (2010, September), “Recurrent neural network based language model”, In Interspeech (Vol 2, p 3) [25] Peng, Y., & Jiang, H (2015), “Leverage financial news to predict stock price movements using word embeddings and deep neural networks”, Proceedings of NAACL-HLT 2016, pages 374– 379, 57 [26] Schuster, M., & Paliwal, K K (1997), “Bidirectional recurrent neural networks”, IEEE Transactions on Signal Processing, 45(11), 2673-2681 [27] Si, J., Mukherjee, A., Liu, B., Pan, S J., Li, Q., & Li, H (2014, October), “Exploiting Social Relations and Sentiment for Stock Prediction”, In EMNLP (Vol 14, pp 1139-1145) [28] Wiesmeier, M., Barthold, F., Blank, B., & Kögel-Knabner, I (2011), “Digital mapping of soil organic matter stocks using Random Forest modeling in a semi-arid steppe ecosystem”, Plant and soil, 340(1-2), 7-24 [29] W Mikolov, T., Sutskever, I., Chen, K., Corrado, G S., & Dean, J., (2013), “Distributed representations of words and phrases and their compositionality” In Advances in neural information processing systems (pp 3111-3119) [30] W Bird, S (2006, July), “NLTK: the natural language toolkit” In Proceedings of the COLING/ACL on Interactive presentation sessions (pp 69-72) Association for Computational Linguistics [31] Z Dey, R., & Salem, F M (2017) Gate-Variants of Gated Recurrent Unit (GRU) Neural Networks arXiv preprint arXiv:1701.05923 58 CƠNG TRÌNH CÔNG BỐ [C1] Paper chấp nhận đăng Hội nghị quốc tế lần thứ VII Information Science and Technology (ICIST 2017) tổ chức Đà Nẵng, Việt Nam thời gian từ ngày 16- đến ngày 19 Tháng Tư, 2017 59 PHỤ LỤC Các khái niệm thị trường chứng khoán A ❖ Chứng khoán: Chứng khoán chứng xác nhận quyền lợi ích hợp pháp người sở hữu tài sản phần vốn tổ chức phát hành Chứng khốn thể hình thức chứng chỉ, bút toán ghi sổ liệu điện tử Chứng khoán bao gồm loại: cổ phiếu, trái phiếu, chứng quỹ đầu tư, chứng khoán phát sinh Chứng khoán phương tiện hàng hóa trừu tượng thỏa thuận thay được, đại diện cho giá trị tài Chứng khốn gồm loại: chứng khốn cổ phần (ví dụ cổ phiếu phổ thơng cơng ty), chứng khốn nợ (như trái phiếu nhà nước, trái phiếu công ty ) chứng khoán phát sinh (như quyền chọn, hợp đồng quy đổi, hợp đồng tương lai, hợp đồng kỳ hạn) Ở kinh tế phát triển, loại chứng khoán nợ thứ có tỷ trọng giao dịch áp đảo thị trường chứng khốn Còn kinh tế nơi mà thị trường chứng khoán thành lập, loại chứng khoán cổ phần lại chiếm tỷ trọng giao dịch lớn Chứng khốn cơng cụ hữu hiệu kinh tế thị trường để tạo nên lực lượng vốn tiền tệ khổng lồ tài trợ dài hạn cho mục đích mở rộng sản xuất, kinh doanh doanh nghiệp hay dự án đầu tư Nhà nước tư nhân Ví dụ: - Một số cổ phiếu như: FPT, VNM, REE, … - Các loại trái phiếu doanh nghiệp như: EVN, SHB, T&T Hà Nội, … - Các chứng quỹ quỹ đầu tư như: VDF, VEH, Cũng loại hàng hóa khác, chứng khốn loại hàng hóa đặc biệt lưu thơng thị trường riêng nó: Thị trường chứng khốn ❖ Sàn giao dịch chứng khoán Sàn giao dịch chứng khoán hình thức sàn giao dịch cung cấp dịch vụ cho người môi giới cổ phiếu người mua bán cổ phiếu để trao đổi cổ phiếu, trái phiếu loại chứng khoán khác Sàn giao dịch chứng khoán cung 60 cấp dịch vụ cho việc phát hành thu hồi chứng khoán phương tiện tài kiện việc chi trả lợi tức cổ tức Chứng khoán giao dịch sàn giao dịch chứng khoán gồm: cổ phiếu công ty phát hành, chứng quỹ sản phẩm hợp tác đầu tư trái phiếu Để giao dịch sàn giao dịch cổ phiếu, cổ phiếu cần phải niêm yết Ví dụ: Sàn giao dịch chứng khốn thành phố Hồ Chí Minh (HoSE) thành lập tháng năm 2000, đơn vị trực thuộc Ủy ban Chứng khoán Nhà nước quản lý hệ thống giao dịch chứng khoán niêm yết Việt Nam HoSE hoạt động công ty trách nhiệm hữu hạn thành viên Nhà nước với số vốn điều lệ nghìn tỷ đồng Hiện sở giao dịch chứng khoán giới thường hoạt động dạng công ty cổ phần Chức thị trường chứng khoán - Huy động vốn đầu tư cho kinh tế - Cung cấp môi trường đầu tư cho công chúng - Tạo môi trường giúp phủ thực sách kinh tế vĩ mơ - Tạo tính khoản cho chứng khoán - Đánh giá hoạt động doanh nghiệp ❖ Cổ phiếu Công ty cổ phần loại hình doanh nghiệp đặc biệt, vốn hình thành từ đóng góp vốn nhiều người Khi thành lập, công ty cổ phần chia vốn điều lệ thành phần nhỏ nhau, phần vốn cổ phần (Share), người góp vốn vào công ty qua việc mua cổ phần gọi cổ đông (Shareholder), cổ đông nhận giấy chứng nhận cổ phần gọi cổ phiếu (Stock) có cơng ty cổ phần phát hành cổ phiếu Như vậy, Cổ phiếu giấy chứng nhận cổ phần, xác nhận quyền sở hữu cổ đông công ty cổ phần 61 B Mạng Long Short Term Memmory (LSTM) Mạng Long Short Term Memory thường gọi “LSTM” biến thể đặc biệt RNN, mà có khả học nắm bắt liệu với phụ thuộc dài hạn LSTM giới thiệu Hochreiter Schmidhuber từ năm 1997, nhiên đến năm gần nay, nhà nghiên cứu ứng dụng rộng rãi LSTM vào lĩnh vực máy học bất ngờ trước kết đáng khích lệ LSTM rõ ràng khắc phục khuyết điểm RNN việc nắm bắt thông tin dài hạn Trong phần tiếp theo, tác giả sâu để phân tích kiến trúc LSTM để đặc điểm giúp LSTM nhớ dài hạn Minh họa mơ hình mạng LSTM Trong hình 2.4 Mỗi đơn vị (Unit) LSTM thời điểm t biểu diễn cách công thức đây: 𝑖𝑡 = 𝜎(𝑊 (𝑖) 𝑥𝑡 + 𝑈 (𝑖) ℎ𝑡−1 + 𝑏 (𝑖) ) 𝑓𝑡 = 𝜎(𝑊 (𝑓) 𝑥𝑡 + 𝑈 (𝑓) ℎ𝑡−1 + 𝑏 (𝑓) ) 𝑜𝑡 = 𝜎(𝑊 (𝑜) 𝑥𝑡 + 𝑈 (𝑜) ℎ𝑡−1 + 𝑏 (𝑜) ) 𝑢𝑡 = 𝑡𝑎𝑛ℎ(𝑊 (𝑢) 𝑥𝑡 + 𝑈 (𝑢) ℎ𝑡−1 + 𝑏 (𝑢) ) 𝑐𝑡 = 𝑖𝑡 ⨀ 𝑢𝑡 + 𝑓𝑡 ⨀ 𝑐𝑡−1 ℎ𝑡 = 𝑜𝑡 ⨀ tanh(𝑐𝑡 ) 62 Trong đó: 𝜎 𝑡𝑎𝑛ℎ hàm sigmoid tanh, it xem cổng nhập (input gate) định thành phần cập nhật vào nhớ, ft cổng quên (forget gate) định xem thành phần nhớ cũ quên trước đưa vào nhớ trạng thái ot cổng xuất (output gate) kiểm soát lưu lượng nhớ cập nhật vào trạng thái nhớ thời điểm t, ut ứng cử viên (candidate) cho cho lớp ẩn trạng thái t, ct trạng thái lớp ẩn ht giá trị xuất lớp ẩn thời điểm t 63 ... nơ-ron hồi quy biến thể GRU Chương 3: MƠ HÌNH DỰ ĐỐN XU HƯỚNG CHỨNG KHỐN BẰNG MẠNG NƠ-RON DỰA TRÊN TIN TỨC TÀI CHÍNH: Trình bày mơ hình đề xu t BGRU để giải toán dự đoán xu hướng giá chứng khoán. .. khả dự báo xu hướng chứng khoán rổ VN-Index thuộc sàn chứng khoán HoSE dựa tin tức tài giá lịch sử cổ phiếu theo ngày - Tìm cách tăng độ tin cậy, xác cho chương trình lý hệ thống sử dụng nguồn tin. .. để dự đoán chuyển động giá chứng khoán dựa vào tin tức tài Khóa luận đề xu t giải pháp để giải toán nhỏ cụ thể sau: - Bài toán nguồn liệu tin tức tài đầu vào đa dạng với từ điển lớn Thứ tự xu t

Ngày đăng: 23/12/2018, 06:12

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Agrawal, J. G., Chourasia, V. S., & Mittra, A. K. (2013), “State-of-the-art in stock prediction techniques”, International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering, 2(4), 1360-1366 Sách, tạp chí
Tiêu đề: State-of-the-art in stock prediction techniques”, "International Journal of Advanced Research in Electrical, Electronics and "Instrumentation Engineering
Tác giả: Agrawal, J. G., Chourasia, V. S., & Mittra, A. K
Năm: 2013
[2] Akita, R., Yoshihara, A., Matsubara, T., & Uehara, K. (2016, June), “Deep learning for stock prediction using numerical and textual information”, In Computer and Information Science (ICIS), 2016 IEEE/ACIS 15th International Conference on (pp. 1-6). IEEE Sách, tạp chí
Tiêu đề: Deep learning for stock prediction using numerical and textual information”, "In Computer and Information Science (ICIS), "2016 IEEE/ACIS 15th International Conference
Tác giả: Akita, R., Yoshihara, A., Matsubara, T., & Uehara, K
Năm: 2016
[3] Baldi, P., Brunak, S., Frasconi, P., Soda, G., & Pollastri, G. (1999), “Exploiting the past and the future in protein secondary structure prediction”, Bioinformatics, 15(11), 937-946 Sách, tạp chí
Tiêu đề: Exploiting the past and the future in protein secondary structure prediction”, "Bioinformatics
Tác giả: Baldi, P., Brunak, S., Frasconi, P., Soda, G., & Pollastri, G
Năm: 1999
[4] Bar-Haim, R., Dinur, E., Feldman, R., Fresko, M., & Goldstein, G. (2011, July), “Identifying and following expert investors in stock microblogs”, In Proceedings of the Conference on Empirical Methods in Natural Language Processing (pp. 1310-1319). Association for Computational Linguistics Sách, tạp chí
Tiêu đề: Identifying and following expert investors in stock microblogs”, "In Proceedings of the Conference on Empirical "Methods in Natural Language Processing
Tác giả: Bar-Haim, R., Dinur, E., Feldman, R., Fresko, M., & Goldstein, G
Năm: 2011
[6] Chung, J., Gulcehre, C., Cho, K., & Bengio, Y. (2014), “Empirical evaluation of gated recurrent neural networks on sequence modeling”, arXiv preprint arXiv:1412.3555 Sách, tạp chí
Tiêu đề: Empirical evaluation of gated recurrent neural networks on sequence modeling”, "arXiv preprint arXiv
Tác giả: Chung, J., Gulcehre, C., Cho, K., & Bengio, Y
Năm: 2014
[7] Ding, X., Zhang, Y., Liu, T., & Duan, J. (2014, October), “Using Structured Events to Predict Stock Price Movement: An Empirical Investigation”, In EMNLP (pp. 1415-1425) Sách, tạp chí
Tiêu đề: Using Structured Events to Predict Stock Price Movement: An Empirical Investigation”, "In EMNLP
Tác giả: Ding, X., Zhang, Y., Liu, T., & Duan, J
Năm: 2014
[8] Dũng, Phạm Xuân, and Hoàng Văn Kiếm. (2015). “Vietnamese Stock Market Prediction Using Text Mining”, Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công Nghệ thông tin (FAIR) Sách, tạp chí
Tiêu đề: Vietnamese Stock Market Prediction Using Text Mining”, "Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công
Tác giả: Dũng, Phạm Xuân, and Hoàng Văn Kiếm
Năm: 2015
[9] Duong, D., Nguyen, T., & Dang, M. (2016, January), “Stock Market Prediction using Financial News Articles on Ho Chi Minh Stock Exchange”. In Proceedings of the 10th International Conference on Ubiquitous Information Management and Communication (p. 71). ACM Sách, tạp chí
Tiêu đề: Stock Market Prediction using Financial News Articles on Ho Chi Minh Stock Exchange”. "In Proceedings of the 10th International "Conference on Ubiquitous Information Management and Communication
Tác giả: Duong, D., Nguyen, T., & Dang, M
Năm: 2016
[10] Fama, E. F. (1965), “The behavior of stock-market prices”, The journal of Business, 38(1), 34-105 Sách, tạp chí
Tiêu đề: The behavior of stock-market prices”, "The journal of Business
Tác giả: Fama, E. F
Năm: 1965
[11] Goldberg, Y. (2016), “A primer on neural network models for natural language processing”, Journal of Artificial Intelligence Research, 57, 345-420 Sách, tạp chí
Tiêu đề: A primer on neural network models for natural language processing”, "Journal of Artificial Intelligence Research
Tác giả: Goldberg, Y
Năm: 2016
[12] Guresen, E., Kayakutlu, G., & Daim, T. U. (2011), “Using artificial neural network models in stock market index prediction”, Expert Systems with Applications, 38(8), 10389-10397 Sách, tạp chí
Tiêu đề: Using artificial neural network models in stock market index prediction”, "Expert Systems with Applications
Tác giả: Guresen, E., Kayakutlu, G., & Daim, T. U
Năm: 2011
[13] Srivastava, N., Hinton, G. E., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014), “Dropout: a simple way to prevent neural networks from overfitting”, Journal of Machine Learning Research, 15(1), 1929-1958 Sách, tạp chí
Tiêu đề: Dropout: a simple way to prevent neural networks from overfitting”, "Journal of Machine Learning "Research
Tác giả: Srivastava, N., Hinton, G. E., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R
Năm: 2014
[14] Hochreiter, S. (1998), “The vanishing gradient problem during learning recurrent neural nets and problem solutions”, International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 6(02), 107-116 Sách, tạp chí
Tiêu đề: The vanishing gradient problem during learning recurrent neural nets and problem solutions”, "International Journal of Uncertainty, Fuzziness and Knowledge-Based "Systems
Tác giả: Hochreiter, S
Năm: 1998
[15] Hong Phuong Le, Thi Minh Huyen Nguyen, Azim Roussanaly, Tuong Vinh Ho. (2008, March), “A hybrid approach to word segmentation of Vietnamese texts”, In International Conference on Language and Automata Theory and Applications (pp. 240-249). Springer Berlin Heidelberg Sách, tạp chí
Tiêu đề: A hybrid approach to word segmentation of Vietnamese texts"”, In International "Conference on Language and Automata Theory and Applications
Tác giả: Hong Phuong Le, Thi Minh Huyen Nguyen, Azim Roussanaly, Tuong Vinh Ho
Năm: 2008
[16] Huang, W., Nakamori, Y., & Wang, S. Y. (2005), “Forecasting stock market movement direction with support vector machine”, Computers & Operations Research, 32(10), 2513-2522 Sách, tạp chí
Tiêu đề: Forecasting stock market movement direction with support vector machine"”, Computers & Operations Research
Tác giả: Huang, W., Nakamori, Y., & Wang, S. Y
Năm: 2005
[17] Kaya, M. Y., & Karsligil, M. E. (2010, September), “Stock price prediction using financial news articles”, In Information and Financial Engineering (ICIFE), 2010 2nd IEEE International Conference on (pp. 478-482). IEEE Sách, tạp chí
Tiêu đề: Stock price prediction using financial news articles”, "In Information and Financial Engineering (ICIFE), 2010 2nd IEEE International "Conference on
Tác giả: Kaya, M. Y., & Karsligil, M. E
Năm: 2010
[18] Kim, K. J., & Han, I. (2000), “Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index”, Expert systems with Applications, 19(2), 125-132 Sách, tạp chí
Tiêu đề: Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index”, "Expert systems with Applications
Tác giả: Kim, K. J., & Han, I
Năm: 2000
[19] Krause, T., Noth, F., & Tonzer, L. (2016), “Brexit (probability) and effects on financial market stability” Sách, tạp chí
Tiêu đề: Brexit (probability) and effects on financial market stability
Tác giả: Krause, T., Noth, F., & Tonzer, L
Năm: 2016
[20] Lọngkvist, M., Karlsson, L., & Loutfi, A. (2014), “A review of unsupervised feature learning and deep learning for time-series modeling”, Pattern Recognition Letters, 42, 11-24 Sách, tạp chí
Tiêu đề: A review of unsupervised feature learning and deep learning for time-series modeling”, "Pattern Recognition Letters
Tác giả: Lọngkvist, M., Karlsson, L., & Loutfi, A
Năm: 2014
[21] Le-Hong, P., Roussanaly, A., Nguyen, T. M. H., & Rossignol, M. (2010, July), “An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts”, In Traitement Automatique des Langues Naturelles-TALN 2010 (p. 12) Sách, tạp chí
Tiêu đề: An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts"”, In "Traitement Automatique des Langues Naturelles-TALN 2010
Tác giả: Le-Hong, P., Roussanaly, A., Nguyen, T. M. H., & Rossignol, M
Năm: 2010

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w