Sử dụng kỹ thuật tương quan chéo, kỹ thuật phân tích nhân dự đốn xu hướng số chứng khốn dựa phân tích tâm trạng từ phương tiện xã hội Using cross-correlation techniques, causal analysis techniques to predict stock index trend based on the sentiment analysis of social media NXB H : ĐHCN, 2014 Số trang 41 tr + Nguyễn Tiến Tùng Đại học Công nghệ Luận văn ThS ngành: Hệ thống thông tin; Mã số: 11021172 Người hướng dẫn: PGS.TS Hà Quang Thụy Năm bảo vệ: 2014 Keywords: Kỹ thuật tương quan chéo; Kỹ thuật phân tích nhân quả; Chỉ số chứng khốn; Phân tích tâm trạng Content Phương tiện truyền thông xã hội bao gồm ứng dụng tương tác tảng để tạo, chia sẻ trao đổi nội dung người dùng tạo Mười năm qua mang lại tăng trưởng lớn phương tiện truyền thông xã hội, đặc biệt dịch vụ mạng xã hội trực tuyến, thay đổi cách tổ chức giao tiếp [YK12] Nó tập hợp ý kiến cảm xúc nhóm đa dạng người dân với chi phí thấp Khai thác thuộc tính nội dung phương tiện truyền thông xã hội cho hội để khám phá đặc tính cấu trúc xã hội, phân tích mẫu hoạt động chất lượng số lượng, khả dự đoán kiện liên quan đến người tương lai Trong thị trường chứng khoán, nghiên cứu dựa lý thuyết bước ngẫu nhiên giả thuyết thị trường hiệu (EMH) cho thấy giá cổ phiếu khơng thể đốn trước Nhưng nghiên cứu gần đây, từ quan điểm Lý thuyết kinh tế xã hội Tài kinh tế học hành vi, cho giá cổ phiếu dự đốn đến mức độ [YK12] Số lượng lớn thơng tin đăng bảng thơng tin tài chính, chẳng hạn Yahoo! Tài chính, dự đốn lợi nhuận cổ phiếu Mối tương quan chúng có ý nghĩa thống kê Mặc dù hiệu kinh tế nhỏ số lượng viết hữu ích để dự đốn biến động chứng khoán Đối với viết cụ thể bao gồm từ cảm xúc lo lắng, hy vọng sợ hãi, tổng số người số họ tiên đoán số chứng khốn, thơng tin tâm lý thị trường có giá trị tiên đốn Mục tiêu luận văn khảo sát, tìm hiểu để đề xuất mơ hình dự đốn xu hướng số chứng khốn dựa phân tích tâm trạng từ liệu máy tìm kiếm, tin tức Twitter Để tiếp cận mục tiêu này, luận văn nghiên cứu giới thiệu số phương pháp dự đoán chứng khoán quan tâm Từ đó, lựa chọn mơ hình phù hợp để dự đốn xu hướng số chứng khoán DJIA cho ngày miền liệu máy tìm kiếm, tin tức Twitter Nội dung luận văn chia thành chương sau: Chương 1:Trình bày phân tích tâm trạng phương tiện truyền thông Chương 2: Luận văn giới thiệu số kỹ thuật dự đoán xu hướng chứng khoán miền liệu Twitter Chương 3:Luận văn đề xuất mơ hình dự đốn xu hướng số chứng khốn dựa phân tích tâm trạng từ phương tiện xã hội Chương 4:Thực nghiệm, kết đánh giá Phần kết luận: Tóm lược kết đạt luận văn định hướng phát triển References Tiếng Việt: [T14] Phạm Huyền Trang Một mơ hình sử dụng Twitter số phương tiện xã hội khác dự báo xu hướng số chứng khoán APPLE Luận văn thạc sỹ trường Đại học Công nghệ ĐHQGHN, 2014 Tiếng Anh: [VCH12] Tien Thanh Vu, Shu Chang, Quang Thuy Ha and Nigel Collier (2012) An Experiment in Integrating Sentiment Features for Tech Stock Prediction in Twitter, IEEASMD 2012 [KS12] Akshi Kumar and Teeja Mary Sebastian Sentiment Analysis on Twitter IJCSI International Journal of Computer Science Issues, Vol 9, Issue 4, No 3, July 2012 [AA12] Anshul Mittal, Arpit Goel (2012) Stock Prediction Using Twitter Sentiment Analysis Standford University, CS229 [YK12] Sheng Yu, Subhash Kak (2012) A Survey of Prediction Using Social Media, CoRR abs/1203.1647: (2012), http://arxiv.org/abs/1203.1647 [TBP12] Mike Thelwall, Kevan Buckley, and Georgios Paltoglou Sentiment Strength Detection for the SocialWeb, JASIST 63(1): 163-173 (2012) [MCB11] Huina Mao, Scott Counts, Johan Bollen Predicting Financial Markets: Comparing Survey, News, Twitter and Search Engine Data.CoRR abs/1112.1051 (2011) [JYZ11] Long Jiang, Mo Yu, Ming Zhou Target-dependent Twitter Sentiment Classification, Association for Computational Linguistics Stroudsburg, PA, USA ©2011 [CL11] Sang Chung & Sandy Liu Predicting Stock Market Fluctuations from Twitter 2011, Stat 157, Professor Aldous [BMZ11]Johan Bollena,Huina Maoa,Xiaojun Zengb Twitter mood predicts the stock market, Journal of Computational Science2 (2011): 1–8 [ZFG11] Xue Zhang, Hauke Fuehres, Peter A Gloor Predicting Stock Market Indicators Through Twitter “I hope it is not as bad as I fear” Procedia - Social and Behavioral Sciences 26 ( 2011 ): 55 – 62 [LD11] T Loughran and B McDonald When is a liability not a liability? Textualanalysis, dictionaries, and 10-ks Journal of Finance, 66(1):67–97, 2011 [KXM10] Kunlun Li, Xuerong Luo and Ming Jin (2010) Semi-supervised Learning for SVM-KNN Journal of computers, 5(5): 671-678, May 2010 [BF10] Luciano Barbosa and Junlan Feng 2010 Robust SentimentDetection on Twitter from Biased and NoisyData Coling 2010 [DEG10]Z Da, J Engelberand, and P Gao The sum of all fears: investor sentiment and asset prices http://ssrn.com/abstract=1509162, 2010 [GBH09] Alec Go, Richa Bhayani, Lei Huang 2009 Twitter SentimentClassification using Distant Supervision [SC09] R Schumaker and H Chen Textual analysis of stock market prediction using breaking financial news: Theazfintext system ACM Transactionson Information Systems, 27(2), 2009 [CSJ08] M De Choudhury, H Sundaram, A John, and D D Seligmann, “Can blogcommunicationdynamics be correlated with stock market activity?,” HT ’08, 2008, vol 2, no 1, p 55 [TTM08] P C Tetlock, M Saar-Tsechansky, and S Macskassy More than words: Quantifying language to measure firms’ fundamentals Journalof Finance, 63:1437–1467, 2008 [T07] P C Tetlock Giving content to investor sentiment: The role of media in the stock market Journal of Finance, 62(3):1139–1168, 2007 [C03] W Chan Stock price reaction to news and to no-news- drift and reversal after headlines Journal of Financial Economics, 70:223–236, 2003 [H99] Eui-Hong Han, Text Categorization Using Weight Adjusted k-Nearest Neighbor Classification PhD thesis, University of Minnesota, October 1999 [J98] T Joachims, Text categorization with Support Vector Machines: Learningwith many relevant features In Machine Learning: ECML-98, Tenth EuropeanConference on Machine Learning, pp 137-142 [YJ97] Yiming Yang, Jan O.Pedersen (1997) A comparative study on feature selection in text categorization In Proceedings of ICML-97, 14th International Conference on Machine Learning (1997), pp 412-420 ... 3:Luận văn đề xu t mơ hình dự đốn xu hướng số chứng khốn dựa phân tích tâm trạng từ phương tiện xã hội Chương 4:Thực nghiệm, kết đánh giá Phần kết luận: Tóm lược kết đạt luận văn định hướng phát... hình sử dụng Twitter số phương tiện xã hội khác dự báo xu hướng số chứng khoán APPLE Luận văn thạc sỹ trường Đại học Công nghệ ĐHQGHN, 2014 Tiếng Anh: [VCH12] Tien Thanh Vu, Shu Chang, Quang... Eui-Hong Han, Text Categorization Using Weight Adjusted k-Nearest Neighbor Classification PhD thesis, University of Minnesota, October 1999 [J98] T Joachims, Text categorization with Support Vector