Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 30 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
30
Dung lượng
1,67 MB
Nội dung
Dự đoán xu hướng chứng khoán rổ VN30 tại sàn HOSE dựa trên tin tức tài chính Huỳnh Đức Huy Cao Hùng Thiên Bảo Dương Thị Xuân Thoại Trần Thành Tân Trường Đại Học Công Nghệ Thông Tin Nội dung trình bày 1. Đặt vấn đề 2. Mục tiêu nghiên cứu 3. Các phương pháp tiếp cận 4. Phương pháp thực hiện 5. Kết quả thực nghiệm 6. Kết luận 1 Nội dung trình bày 1. Đặt vấn đề 2. Mục tiêu nghiên cứu 3. Các phương pháp tiếp cận 4. Phương pháp thực hiện 5. Kết quả thực nghiệm 6. Kết luận 1 C h ứ n g k h o á n Đặt vấn đề 2 Kênh đầu tư tài chính nghiêm túc Yêu cầu tính chiến lược cao Đem lại lợi nhuận lớn Đặt vấn đề 3 Mô hình dự đoán hiệu quả Quyết định đầu tư đúng đắn Nội dung trình bày 1. Đặt vấn đề 2. Mục tiêu nghiên cứu 3. Các phương pháp tiếp cận 4. Phương pháp thực hiện 5. Kết quả thực nghiệm 6. Kết luận 1 Mục tiêu nghiên cứu 4 • Nghiên cứu, phát triển một hệ thống có khả năng dự báo xu hướng chứng khoán của trong rổ VN30 thuộc sàn chứng khoán HOSE dựa trên tin tức tài chính và giá lịch sử của cổ phiếu theo ngày. • Đảm bảo độ tin cậy, chính xác cho mô hình sử dụng các giải thuật cải tiến. Nội dung trình bày 1. Đặt vấn đề 2. Mục tiêu nghiên cứu 3. Các phương pháp tiếp cận 4. Phương pháp thực hiện 5. Kết quả thực nghiệm 6. Kết luận 1 Các phương pháp tiếp cận 5 Nội dung trình bày 1. Đặt vấn đề 2. Mục tiêu nghiên cứu 3. Các phương pháp tiếp cận 4. Phương pháp thực hiện 5. Kết quả thực nghiệm 6. Kết luận 1 [...]... Độ chính xác và độ phủ ở mẫu 1 là cao nhất • Mẫu 2 và 3 có sự biến đổi không đều do độ nhiễu của tin 16 So sánh theo xu hướng giá Biểu đồ tương quan giữa dự đoán xu hướng và giá thực tế của rổ VN30 Điểm đánh dấu tròn là thời điểm giá chứng khoán thay đổi xu hướng Dự đoán sai Dự đoán đúng 17 Kết quả dự đoán 5 mã có ảnh hướng nhất EIB Ngày MSN STB VIC VNM Mở cửa Đóng cửa Dự đoán Mở cửa Đóng cửa Dự đoán. .. 49.6 49.6 1 108 108 1 Dự đoán đúng Dự đoán sai Kết quả đúng: 32/50 64% 18 Nội dung trình bày 1 Đặt vấn đề 2 Mục tiêu nghiên cứu 3 Các phương pháp tiếp cận 4 Phương pháp thực hiện 5 Kết quả thực nghiệm 6 Kết luận 1 Kết luận Nghiên cứu của nhóm phản ánh đúng thực trạng sàn HOSE – nơi có chỉ số tài chính tốt và tính thanh khoản cao Đặc biệt khi áp dụng vào rổ VN30 mang lại độ chính xác khá cao và... dạng html tin tức (.txt) 2 Tách từ bằng VnTokenizer danh sách các từ 3 Loại bỏ từ dừng (à, ừ,…) danh sách các từ đã được tối ưu 7 Phương pháp gán nhãn văn bản Giá chứng khoán Danh sách từ được tối ưu hóa Văn bản được phân lớp +1: tăng -1: giảm Giá đóng cửa – giá mở cửa Tính vector đặc trưng sử dụng phương pháp Delta TFIDF[7] Phân lớp dựa trên ngày ra bản tin và ngày giao dịch 8 Xây dựng từ điển... 1730 Tập kiểm tra Tổng số 465 640 741 1555 2139 2471 Rổ VN30 BVH, CII, CSM, DPM, DRC, FLC, FPT, GMD, HAG, HCM, HPG, HSG, HVG, IJC, ITA, KBC, KDC, MBB, MSN, OGC, PPC, PVD, PVT, REE, SSI, STB, VCB, VIC, VNM, VSM 01/2014 – 05/2015 12 Các độ đo • Độ chính xác giữa dự đoán so với thực tế • Độ chính xác giữa các phân lớp dự đoán • Độ phủ 13 So sánh các hướng tiếp cận Các phương pháp Độ đo TFIDF Delta TFIDF... khoán thay đổi xu hướng Dự đoán sai Dự đoán đúng 17 Kết quả dự đoán 5 mã có ảnh hướng nhất EIB Ngày MSN STB VIC VNM Mở cửa Đóng cửa Dự đoán Mở cửa Đóng cửa Dự đoán Mở cửa Đóng cửa Dự đoán Mở cửa Đóng cửa Dự đoán Mở cửa Đóng cửa Dự đoán 02/03 13.2 13.1 1 85.5 86.5 1 19.5 19.4 1 49.6 49.9 1 108 107 -1 03/03 13.1 13.1 1 87 90 1 19.5 19.4 -1 49.9 52 1 107 108 1 04/03 13.1 13.2 1 91 89.5 1 19.4 19.5 -1 52 51.5... tăng mà từ t xu t hiện, |N| là số văn bản được gán nhãn giảm mà từ t xu t hiện 9 Đánh trọng số từ Delta TFIDF[7] là thuật toán tăng độ quan trọng của từ được phân bố không đều giữa lớp giảm và lớp tăng và giảm độ quan trọng của từ được phân bố đều giữa lớp giảm và lớp tăng Công thức tính: Trong đó: Ct,d là số lần luật t xu t hiện trong tin tức d, Pt là số văn bản được gán nhãn tăng mà luật t xu t hiện,... trọng số Delta TFIDF Độ chính xác cao TFIDF 14 So sánh các hướng tiếp cận 90 80 Độ chính xác (%) 70 60 50 5 tháng 10 tháng 15 tháng 40 30 20 10 0 TFIDF Delta TFIDF Delta TFIDF + Trọng số Các phương pháp đánh trọng số Biểu đồ so sánh các hướng tiếp cận theo khoản thời gian Phương pháp Delta TFIDF kết hợp với trọng số cho kết quả tốt nhất ở tất cả các khoản thời gian 15 So sánh độ chính xác theo thời gian... centroid feature selection for text categorization.” Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval ACM, 2005 20 Tài liệu tham khảo chính [7] Martineau, Justin, “Delta TFIDF: An Improved Feature Space for Sentiment Analysis.” ICWSM 2009 [8] Lauren, Stefan, “Stock trend prediction using simple moving average supported by news classification.”... xác khá cao và đáng ghi nhận (76,3%) Bằng việc kết hợp phương pháp Delta TFIDF với đánh trọng số từ, nghiên cứu đã cho kết quả cải thiện độ chính xác lên 16,1% so với phương pháp TFIDF thuần và 6,7% so với phương pháp TFIDF cải tiến đã có 19 Tài liệu tham khảo chính [1] Chang, C C., C J Lin, “LIBSVM: a library for support vector machines ACM transactions on intelligent systems and technology 2: 27:...Phương pháp thực hiện Giá cổ phiếu Tin tức HTML Tiền xử lý Độ chính xác OCFS[6 ] Gán nhãn văn bản Đánh trọng số từ Phân lớp Delta TFIDF[7] Mô hình SVM Tách từ, loại từ dừng Kiểm tra Từ điển trọng số Máy học SVM Support vectors[2] Giảm số chiều vector . Dự đoán xu hướng chứng khoán rổ VN30 tại sàn HOSE dựa trên tin tức tài chính Huỳnh Đức Huy Cao Hùng Thiên Bảo Dương Thị Xu n Thoại Trần Thành Tân Trường Đại Học Công Nghệ Thông Tin Nội. có khả năng dự báo xu hướng chứng khoán của trong rổ VN30 thuộc sàn chứng khoán HOSE dựa trên tin tức tài chính và giá lịch sử của cổ phiếu theo ngày. • Đảm bảo độ tin cậy, chính xác cho. tăng -1: giảm Giá chứng khoán Tính vector đặc trưng sử dụng phương pháp Delta TFIDF[7] Giá đóng cửa – giá mở cửa Phân lớp dựa trên ngày ra bản tin và ngày giao dịch Xây dựng từ điển trọng