Qua bảng đánh giá kết quả thực nghiệm, giá trị nDCG trên 80% cho thấy kết quả thực nghiệm là phù hợp, mô hình thực nghiệm cho độ chính xác tƣơng đối cao.
KẾT LUẬN
Khai phá dữ liệu mạng xã hội là lĩnh vực đƣợc quan tâm trong những năm gần đây. Luận văn tập trung vào nghiên cứu mạng xã hội Twitter, giải quyết bài toán tính hạng đối tƣợng trên Twitter. Kết quả nghiên cứu chính của luận văn đƣợc tổng hợp nhƣ trình bày dƣới đây:
- Phát biểu và nêu lên ý nghĩa bài toán tính hạng đối tƣợng trên mạng xã hội Twitter. Phân tích các nghiên cứu liên quan và hƣớng tiếp cận giải quyết bài toán này.
- Trình bày hai phƣơng pháp giải quyết bài toán: tính hạng tweet bằng phƣơng pháp xét độ tin cậy và độ liên quan và phƣơng pháp tính hạng tweet dựa trên mạng không đồng nhất.
- Đề nghị mô hình thực nghiệm xếp hạng các Tweet dựa trên phƣơng pháp sử dụng mạng không đồng nhất. Kết quả cho thấy hệ thống hoạt động và chứng tỏ tính hiệu quả của phƣơng pháp.
Tuy nhiên, do hạn chế về thời gian nên luận văn vẫn tồn tại những hạn chế nhƣ: số lƣợng dữ liệu để đánh giá còn ít. Mô hình thực nghiệm chƣa kết hợp đƣợc các đặc trƣng về dữ liệu của mạng xã hội Twitter.
Trong thời gian tới, chúng tôi sẽ thực hiện với lƣợng dữ liệu lớn hơn. Đề xuất mô hình để kết hợp đƣợc các đặc trƣng dữ liệu Tweet với sử dụng mạng không đồng nhất nhằm nâng cao hơn kết quả thực nghiệm.
Tài liệu tham khảo
[1] Agichtein E., Castillo C., Donato D. (2008). Finding High-Quality Content in Social Media. WSDM‟08, February 11-12, 2008, Palo Alto, Califor-nia, USA. pp. 183-193. [2] Al-Ani B., Mark G., Chung J., Jones J. (2012), The Egyptian Blogosphere: A Counter- Narrative of the Revolution, Proceedings of the ACM 2012 conference on Computer Supported Cooperative Work. pp. 17-26.
[3] Balakrishnan R., Kambhampati S. (2011), "Sourcerank: Relevance and trust assessment for deep web sources based on inter-source agreement."Proceedings of the 20th international conference on World wide web. ACM.
[4] Bennet S. (2012), Twitter On Track For 500 Million Total Users By March, 250 Million Active Users By End Of 2012, http://www.mediabistro.com/alltwitter/twitter- active-total-users_b17655.
[5] Casilli A. A., Tubaro P. (2012), Social media censorship in times of political unrest: A social simulation experiment on the UK riots, Bulletin of Sociological Methodology, 115. [6] D'Andrea A., Ferri F., Grifoni P., (2009), "An Overview of Methods for Virtual Social Network Analysis". In Abraham, Ajith. Computational Social Network Analysis: Trends, Tools and Research Advances. Springer. pp. 8.
[7] Duan Y., Jiang L., Qin T., Zhou M., Shum H-Y., (2010). "An empirical study on learning to rank of tweets."Proceedings of the 23rd International Conference on Computational Linguistics. Association for Computational Linguistics.
[8] Deng H., Han J., Zhao B., Yu Y., Lin C. (2011). Probabilistic topic models with biased propagation on heterogeneous information networks. In Proc. ACM SIGKDD2011, pp. 1271–1279.
[9] Elizabeth I., (2011), Connecting the National and the Virtual: Can Facebook Activism Remain Relevant After Egypt‟s January 25 Uprising?, International Journal of Communication 5, pp.13-15.
[10] Gupta A., Kumaraguru P., (2012), "Credibility ranking of tweets during high impact events." Proceedings of the 1st Workshop on Privacy and Security in Online Social Media. ACM.
[11] Gupta M., and Han J. (2011), Heterogeneous network-based trust analysis: a survey. ACM SIGKDD Explorations, pp.54.
[12] Gruber D., Introduction in Social Network Analysis. Theoretical Approaches and Empirical Analysis with computer-assisted programmes.
[13] Homero Gil de Zúnĩga H., Jung N., Valenzuela S. (2012). Social Media Use for News and Individuals‟ Social Capital, Civic Engagement and Political Participation,
Journal of Computer-Mediated Communication 17.
[14] Huang M., Yang Y., Zhu X. (2011), "Quality-biased Ranking of Short Texts in Microblogging Services." IJCNLP.
[15] Huang H., Zubiaga A., Ji H., Deng H., Wang D., Le H., Abdelzaher T., Han J., Leung A., Hancock J., Voss C. (2012), "Tweet Ranking Based on Heterogeneous Networks."COLING.
[16] Jarvelin K., Kekalainen J. (2000), IR evaluation methods for retrieving highly relevant documents. Proceedings of the 23rd annual international ACM SIGIR conference on Research and development in information retrieval, pp. 41-48.
[17] Kleinberg J.M. (1999), "Authoritative sources in a hyperlinked environment." Journal of the ACM .
[18] Mendoza M., Poblete B., Castillo C., (2010), Twitter Under Crisis: Can we trust what we RT?. 1st Workshop on Social Media Analytics (SO-MA‟10), July 25, 2010, Washington DC, USA.
[19] Mihalcea R. (2004), Graph-based ranking algorithms for sentence extraction, applied to text summarization. In Proc. ACL2004.
[20] Moreau E., Yvon F., Cappé O., (2008), "Robust similarity measures for named entities matching." Proceedings of the 22nd International Conference on Computational Linguistics-Volume 1. Association for Computational Linguistics.
[21] Nigel C., Son Doan (2011). Syndromic Classification of Twitter Messages, eHealth 2011. pp. 186-195.
[22] O'Connor B., Balasubramanyan R., Routledge B.R., Smith N.A.,(2010), From Tweets to Polls: Linking Text Sentiment to Public Opinion Time Series, ICWSM 2010.
pp. 122-129.
[23] Page L., Brin S., Motwani R., Winograd T. (1998), The pagerank citation ranking: Bringing order to the web. In Proc. the 7th International World Wide Web Conference.
[24] Pinheiro C.A.R. (2011), Social Network Analysis in Telecommunications. John Wiley & Sons. pp. 4.
[25] Ravikumar S., Balakrishnan R., Kambhampati S., (2012), "Ranking tweets considering trust and relevance." Proceedings of the Ninth International Workshop on Information Integration on the Web. ACM.
[26] Sakaki T., Okazaki M., Matsuo Y., (2010), Earthquake shakes Twitter users: real- time event detection by social sensors, WWW 2010. pp. 851-860.
[27] Wilson R.E, Gosling S.D, Graham L.T, (2012), A Review of Facebook Research in the Social Sciences, Perspectives on Psychological Science7.
[28] Trec 2011 microblog track. http://trec.nist.gov/data/tweets/.
[29] Wang D., Abdelzaher T., Ahmadi H., Pasternack J., Roth D., Gupta M., Han J., Fatemieh., Le H. (2011), "On bayesian interpretation of fact-finding in information networks." Information Fusion (FUSION), 2011 Proceedings of the 14th International Conference on. IEEE.
[30] Wasserman S., Katherine F., (1994), "Social Network Analysis in the Social and Behavioral Sciences". Social Network Analysis: Methods and Applications. Cambridge University Press. pp. 1–27.
[31] Zaphiris P., Pfeil U., (2007), “Introduction to Social Network Analysis” Published by the British Computer Society Volume 2 Proceedings of the 21st BCS HCI Group Conference.
[32] Zubiaga A., Spina D., Amigó E., Gonzalo J. (2012), Towards real-time summarization of scheduled events from twitter streams. In Proceedings of the 23rd ACM conference on Hypertext and social media, pp. 319–320.