Kết quả thực nghiệm và đánh giá

Chúng tôi tiến hành đánh giá độ chính xác của mô hình dựa vào 2 phương pháp đánh giá đã được nêu ở mục 3.4:

 Đánh giá mô hình phân tích sở thích dựa vào tính tương đồng chủ đề giữa mối

quan tâm người dùng nhận ra từ lịch sử duyệt web lưu trong máy khách và mối quan tâm người dùng nhận ra từ phiên duyệt web lưu tại máy chủ.

 Đánh giá độ chính xác của mô hình dựa vào đánh giá của người sử dụng: thống

kê các đánh giá trực tiếp của người dùng qua việc kiểm tra thông tin tư vấn là phù hợp hay không phù hợp. Kết quả đo độ chính xác là độ chính xác trung bình

Bảng 9. Đánh giá mô hình phân tích sở thích.

Chủ đề Độ chính xác của chủ đề với mối quan

tâm người dùng Chủ đề đứng đầu 85% Chủ đề đứng thứ hai 79% Chủ đề đứng thứ ba 72% Chủ đề đứng thứ tư 66% Chủ đề đứng thứ năm 57%

Kết quả so sánh độ tương đồng chủ đề giữa phiên duyệt web và các trang web người

dùng truy cập trước và sau phiên duyệt web cho thấy những phân tích về mối quan tâm người dùng có thể sử dụng để tổng hợp các mối quan tâm hiện tại và dự đoán các tin tức

có thể được người dùng ưa thích trong tương lai.

Bảng 10. Độ chính xác của mô hình dựa vào đánh giá của người sử dụng.

Số lượng các tin tức người dùng đã duyệt qua Độ chính xác của 1 kết quả tư vấn Độ chính xác của 3 kết quả tư vấn Độ chính xác của 5 kết quả tư vấn 1 tin tức 70% 68.3% 65.2% 3 tin tức 76.7% 64.3% 66.4% 5 tin tức 83.3% 79.4% 76.5% 7 tin tức 56.7% 43.7% 42%

Từ các số liệu bảng 10, có thể đưa ra các kết luận sau:

 Kết quả tư vấn đạt tốt nhất ở trường hợp phiên duyệt web lưu trữ 5 tin tức. Các trường hợp phiên duyệt web lưu trữ 1 và 3 tin tức hiệu quả thấp hơn là vì

đôi khi người dùng quan tâm đến các tin tức thuộc các lĩnh vực hoàn toàn

độc lập, chưa xuất hiện tính phổ biến trong các chủ đề được phân tích. Ở trường hợp còn lại khi số tin tức lưu trong phiên là 7, nhiễu do một số chủ đề ít được quan tâm trong các tin tức cũ tăng lên. Vì hệ thống chỉ xác định các

trường hợp, những chủ đề ít được quan tâm trở thành phổ biến, làm giảm độ

chính xác của mô hình.

 Nhìn chung, độ chính xác của mô hình tư vấn giảm dần theo số lượng các tin

tức được tư vấn. Tuy nhiên việc đưa ra nhiều tư vấn cung cấp cho người

Kết luận

Các hệ thống tư vấn đã nhận được nhiều quan tâm từ cộng đồng nghiên cứu và các tổ chức kinh tế vì những đóng góp của nó trong giải quyết vấn đề tràn ngập thông tin và cung cấp các dịch vụ hướng cá nhân. Tuy nhiên, đối với lĩnh vực tư vấn tin tức, các hướng

tiếp cận hiện nay vẫn còn nhiều vấn đề cần giải quyết. Nắm bắt được nhu cầu đó, khóa

luận tiến hành nghiên cứu, khảo sát một số hướng tiếp cận giải quyết bài toán tư vấnđã

có. Sau đó, dựa trên các khảo sát này, khóa luận đề xuất một giải pháptư vấn cho các hệ

thống cung cấp tin tức.

Các kết quả chính đạt được

Khóa luận đã tìm hiểu các khái niệm, thuật ngữ, kĩ thuật liên quan đến các hệ thống tư vấn. Dựa vào khảo sát các đặc trưng của tư vấn tin tức, phân tích ưu nhược điểm của

các phương pháp xây dựng hai thành phần chính của hệ tư vấn là mô hình sở thích người

dùng và các thuật toán tư vấn, khóa luận đề xuất một giải pháp tư vấn tin tức dựa trên khai phá ngữ cảnh sử dụng hiện tại của người dùng. Trong đó, hệ thống thực thi một thuật toán tư vấn dựa trên phân tích chủ đề ẩn và các thực thể trong nội dung của những tin tức người dùng vừa truy cập (hướng tiếp cận dựa trên nội dung). Hướng tiếp cận này có nhiều

tiềm năngvà đã được chứng minh thông qua một số số liệu thống kê kết quả ban đầu.

Một số vấn đề cần tiếp tục giải quyết

Tuy mô hình đã bước đầu đạt được một số kết quả khả quan, nhưng vẫn còn tồn tại

nhiều vấn đề cần giải quyết. Đầu tiên, vì chưa có các độ đo ngữ nghĩa cho các hệ thống tư

vấn tương tự, các đánh giá chủ yếu dựa trên các nhận định chủ quan về tính phù hợp hay

không phù hợp của kết quả tư vấn. Thêm vào đó, hạn chế về số lượng và chất lượng của

kho dữ liệu tin tức cũng ảnh hưởng xấu đến chất lượng của sự tư vấn. Cuối cùng, do hệ

thống sử dụng dữ liệu từ phiên duyệt web người dùng, kết quả tư vấn khi người dùng mới

Hướng nghiên cứu tiếp theo

Trong thời gian tới, ngoài việc tiếp tục giải quyết các vấn đề còn tồn tại, chúng

tôi định hướng một số nghiên cứu tiếp theo:

- Nghiên cứu thêm về các yếu tố ngữ cảnh và ảnh hưởng của chúng đến quyết định của người dùng.

- Nghiên cứu các hướng áp dụng của giải pháp mở rộng thông tin ngữ cảnhngười dùng như cung cấp các thông tin quảng cáo phù hợp với ngữ cảnh sử dụng.

Tài liệu tham khảo

Tiếng Việt

[1] Uông Huy Long, Nguyễn Đạo Thái, Trần Xuân Tứ. Mô hình tư vấn dựa trên việc phân tích chủ đề ẩn sự quan tâm của người dùng, Công trình sinh viên nghiên cứu khoa học, Đại học Công Nghệ, ĐHQGHN, 2009.

Tiếng Anh

[2] G.Adomavicius, A.Tuzhilin. Towards the Next Generation of Recommender

Systems:A Survey of the State-of-the-Art and Possible Extensions, IEEE Transactions on Knowledge and Data Engineering, 2005.

[3] Aho, Alfred V.; Margaret J. Corasick. "Efficient string matching: An aid to

bibliographic search". Communications of the ACM 18 (6): 333–340, June 1975.

[4] Ansari, A., S. Essegaier, and R. Kohli. Internet recommendations systems. Journal of Marketing Research, pages 363-375, 2000.

[5] Basu, C., H. Hirsh, and W. Cohen. Recommendation as classification:

Using social and content-based information in recommendation. In Recommender Systems. Papers from 1998 Workshop. Technical Report WS-98-08. AAAI Press, 1998.

[6] Balabanovic, M. and Y. Shoham. Fab: Content-based, collaborative

recommendation. Communications of the ACM, 40(3):66-72, 1997.

[7] Bamshad Mobasher: Data Mining for Web Personalization. The Adaptive

Web 2007:90-135.

[8] Belkin, N.J., Croft, W.B.: Information ﬁltering and information retrieval: two

sides of the same coin?. Communications of the ACM 35(12), 29–38 (1992).

[9] Billsus, D. and M. Pazzani. Learning collaborative information filters.

1998.

[10] Breese, J. S., D. Heckerman, and C. Kadie. Empirical analysis of predictive

algorithms for collaborative filtering. In Proceedings of the Fourteenth Conference on

Uncertainty in Artificial Intelligence, Madison, WI, 1998.

[11] Burke, R. Hybrid Recommender Systems: Survey and Experiments. User Modeling and User-Adapted Interaction 12, 4 (Nov. 2002), 331-370.

[12] Chen, L., Sycara, K.: A Personal Agent for Browsing and Searching. In:

Proceedings of the 2nd International Conference on Autonomous Agents,

Minneapolis/St. Paul, May 9-13, (1998) 132-139.

[13] David M. Blei, Andrew Y. Ng, Michael I. Jordan: Latent Dirichlet Allocation.

Journal of Machine Learning Research (JMLR) 3:993-1022 (2003).

[14] Gauch, S., Speretta, M., Chandramouli, A., Micarelli, A. User profiles for

personalized information access, In: Brusilovsky, P., Kobsa, A., and Neidl, W., Eds.

The Adaptive Web: Methods and Strategies of Web Personalization. Springer- Verlag, Berlin Heidelberg New York, 2007, 54-89.

[15] Gentili, G., Micarelli, A., Sciarrone, F.: Infoweb: An Adaptive Information

Filtering System for the Cultural Heritage Domain. Applied Artificial Intelligence

17(8-9) (2003) 715-744.

[16] Guarino, N., Masolo, C., Vetere, G.: OntoSeek: Content-Based Access to the

Web. IEEE Intelligent Systems, May 14(3) (1999) 70-80.

[17] Heinrich, G., “Parameter Estimation for Text Analysis”, Technical Report.

[18] Herlocker, .L., Konstan, J.A., Terveen, L.G., Riedl, J.T.: Evaluating

Collaborative Filtering Recommender Systems. ACM Transactionson Information Systems 22(1), 5–53(2004).

SIGIR-99, (1999) 35–44.

[20] Kelly, D., Teevan, J.: Implicit feedback for inferring user preference: a

bibliography. ACM SIGIR Forum 37(2) (2003) 18-28.

[21] Le Dieu Thu. Online context advertising, Undergraduate Thesis, College of

Technology, Vietnam National University, Hanoi, 2008.

[22] Nguyen Cam Tu. Hidden Topic Discovery toward Classification and Clustering in Vietnamese Web Documents, Master Thesis, College of Technology, Vietnam

National University, Hanoi, 2008.

[23] Pazzani, M., Muramatsu, J., Billsus, D.: Syskill & Webert: Identifying

Interesting Web Sites. In: Proceedings of the 13th National Conference On Artificial

Intelligence Portland, Oregon, August 4–8 (1996) 54-61.

[24] Pretschner, A.: Ontology Based Personalized Search. Master’s thesis. University of Kan- sas, June (1999).

[25] Popescul, A., L. H. Ungar, D. M. Pennock, and S. Lawrence. Probabilistic

Models for Unified Collaborative and Content-Based Recommendation in Sparse- Data Environments. In Proc. of the 17th Conf. on Uncertainty in Artificial Intelligence, Seattle, WA, 2001.

[26] R.Baeza, F.Silvestri. Web Query Log Mining, ACM SIGIR Conference tutorial, 2009.

[27] G. Salton, A. Wong, C.S. Yang. A Vector Space Model for Automatic Indexing,

Communication of the ACM, 18 (11), 1975.

[28] Sieg, A., Mobasher, B., Burke, R.: Inferring users information context:

Integrating user profiles and concept hierarchies. In: 2004 Meeting of the International Federation of Classification Societies, IFCS, Chicago, July (2004).

text filtering. In 43 IJCAI'99 Workshop: Machine Learning for Information Filtering,

1999.

[30] The Open Directory Project (ODP), http://dmoz.org

[31] Widyantoro, D.H., Yin, J., El Nasr, M., Yang, L., Zacchi, A., Yen, J.: Alipes: A Swift Messenger In Cyberspace. In: Proc. 1999 AAAI Spring Symposium Workshop

Phương pháp định danh người dùng

Mô hình sở thích người dùng