Xây dựng các mô hình

3. 1 Giới thiệu hệ tư vấn sử dụng độ đo tin cậy

4.2. Xây dựng các mô hình

 Hệ tư vấn ngẫu nhiên

Hàm dự đoán

𝑟𝑐,𝑠 = 𝑟𝑎𝑛𝑑𝑜𝑚(1, 5) là một hàm ngẫu nhiên, kết quả dự đoán nằm trong khoảng 1 đến

Hệ tư vấn này không có ý nghĩa trong thực tế, nhưng được dùng làm mốc để đánh giá các mô hình khác

 Hệ tư vấn dựa trên lọc cộng tác

Mô hình giống như trong phần 3.2. Các công thức sử dụng trong mô hình

Bước 1: Sử dụng độ tương đồng Pearson để tìm tập k người tương đồng

𝑠𝑖𝑚 𝑥, 𝑦 = 𝑠∈𝑆𝑥𝑦(𝑟𝑥,𝑠 − 𝑟 ) × (𝑟𝑥 𝑦,𝑠 − 𝑟 )𝑦 (𝑟𝑥,𝑠 − 𝑟 )𝑥 2× (𝑟𝑦,𝑠 − 𝑟 )𝑦 2 𝑠∈𝑆𝑥𝑦 𝑠∈𝑆𝑥𝑦 Bước 2: Sử dụng công thức 𝑟𝑐,𝑠 = 𝑟 + 𝑐 𝑐′∈𝐶𝑛𝑤𝑐,𝑐′(𝑟𝑐′,𝑠− 𝑟 )𝑐′ 𝑤𝑐,𝑐′ 𝑐′∈𝐶𝑛 để tổng hợp tư vấn, với 𝑤𝑐,𝑐′ = 𝑠𝑖𝑚(𝑐, 𝑐′)

Bước 1: Sử dụng độ đo tin cậy để tìm ra k người dùng phù hợp Luận văn tiến hành thực nghiệm với hai độ đo tin cậy đơn giản Độ đo Lazy: Ma trận Estimated trust ≡ Ma trận Trust ban đầu

Độ đo Path Length dựa trên khoảng cách (Mô tả chi tiết trong mục 1.3.1 )

𝑡𝑟𝑢𝑠𝑡 = 𝑑 − 𝑛 + 1 𝑑 Với khoảng cách lớn nhất d=2 Bước 2: Sử dụng công thức 𝑟𝑐,𝑠 = 𝑟 + 𝑐 𝑐′∈𝐶𝑛𝑤𝑐,𝑐′(𝑟𝑐′,𝑠− 𝑟 )𝑐′ 𝑤𝑐,𝑐′ 𝑐′∈𝐶𝑛 Để tổng hợp tư vấn, với 𝑤𝑐,𝑐′ = 𝑡𝑟𝑢𝑠𝑡(𝑐, 𝑐′) 4.3. Dữ liệu thực nghiệm

Dữ liệu thực nghiệm được lấy từ trang web epinions.com. Epinions.com là trang cho phép người dùng đánh giá về nhiều loại sản phẩm (xe hơi, sách, phim ảnh, …). Bên cạnh đó người dùng còn có thể đưa ra đánh giá về độ tin cậy của những người khác dựa trên các đánh giá về sản phẩm trong quá khứ của người đó.

Tập dữ liệu Epinions bao gồm:

- 49,290 người dùng, mỗi người dùng đánh giá ít nhất một sản phẩm - 139,738 sản phẩm khác nhau

Dữ liệu được chia làm hai loại

- Dữ liệu về đánh giá của người về sản phẩm: trong file rating.txt Mỗi dòng của file có dạng: user_id item_id rating_value

o Với user_id là id của người dùng, nằm trong đoạn [1,49290]

o item_id là id của sản phẩm, nằm trong đoạn [1,139738]

o rating_value là giá trị đánh giá của người dùng có có id user_id với sản phẩm có id item_id, giá trị đánh giá là số nguyên trong đoạn [1,5]

- Dữ liệu tin cậy về người dùng: trong file trust.txt

Mỗi dòng của file có dạng: source_user_id target_user_id trust_statement_value

o Với source_user_id là id của người dùng, nằm trong đoạn [1,49290]

o target_user_id là id của người dùng, nằm trong đoạn [1,49290]

o trust_statement_value = 1 thể hiện người dùng có id source_user_id tin tưởng vào người dùng có id target_user_id

4.4. Kết quả thực nghiệm

4.4.1 Thực nghiệm với hệ tư vấn ngẫu nhiên

Kết quả không ngoài dự đoán khi hệ tư vấn ngẫu nhiên có khả năng đưa ra tư vấn cho người dùng trong mọi trường hợp, tuy nhiên chất lượng tư vấn rất hạn chế

 Độ bao phủ người dùng = 100%  Độ lệch trung bình MAE = 1.69

4.4.2 Thực nghiệm với hệ tư vấn dựa trên lọc cộng tác

Bảng 5. Kết quả độ lệch dự đoán MAE của hệ tư vấn dựa trên lọc cộng tác

Lần k Tỉ lệ dữ liệu học/dữ liệu kiểm tra Tỉ lệ người dùng tham gia đánh giá MAE MAE trung bình Thời gian đánh giá 1 3 9/1 30 % 0.81 0.83 21:30.570s 2 3 9/1 30 % 0.84 21:18.427s 3 5 9/1 30 % 1.1 0.92 2:59:59.424s 4 5 9/1 30 % 0.73 3:08:37.676s

Bảng 6. Kết quả độ bao phủ người dùng của hệ tư vấn lọc cộng tác

Lần k Số người dùng tham gia

đánh giá

Độ bao phủ người dùng

1 3 401 13,2 %

2 5 401 30,2 %

3 7 401 49,4 %

Kết quả trong 3 lần thực nghiệm cho thấy khả năng đưa ra tư vấn của hệ tư vấn dựa trên lọc cộng tác rất thấp.

4.4.3 Thực nghiệm với hệ tư vấn sử dụng độ đo tin cậy

Bảng 7. Kết quả độ lệch dự đoán MAE của hệ tư vấn sử dụng độ đo tin cậy Lần K (số người tư vấn) Độ đo tin cậy Tỉ lệ dữ liệu học/dữ liệu kiểm tra Tỉ lệ người dùng tham gia đánh giá Thời gian xử lý MAE MAE Trung bình 1 5 Lazy 9/1 30% 57.374s 0.98 0.97 2 54.600s 0.89 3 1:23.702s 1.26 4 1:45.031s 0.56 5 53.944s 1 6 1:09.218s 1.32 7 1:17.158s 0.86 8 1:02.899s 0.86 9 5 Lazy 9/1 100 % 19:02.899s 0.8635 0.86 10 18:17.158s 0.86035 11 20:29.723s 0.89442 12 20:25.723s 0.85773 13 25:25.002s 0.82 14 7 Lazy 9/1 100 % 22:13.728s 0.82 0.86 15 24:09.906s 0.94 16 21:11.856s 0.83 17 22:09.984s 0.84 18 23:11.825s 0.87 19 5 Độ đo dựa trên khoảng cách 9/1 100% 18:53.014s 0.86 0.86 20 19:23.372s 0.85

21 7 Độ đo dựa trên khoảng cách 9/1 100% 20:27.411s 0.93 0.9 22 18:36.915s 0.91 23 18:10:987 0.879

Bảng 8. Kết quả độ bao phủ người dùng của hệ tư vấn sử dụng độ đo tin cậy

Lần Độ đo k Số người dùng

tham gia đánh giá

Độ bao phủ người dùng

1 Lazy 3 401 74 %

2 Độ đo dựa trên khoảng cách

3 401 54,6 %

3 Lazy 5 401 92 %

4 Độ đo dựa trên khoảng cách

5 401 90%

5 Lazy 7 401 96,5 %

6 Độ đo dựa trên khoảng cách

7 401 98 %

4.4.4 Tổng hợp và đánh giá

Bảng 9. Tổng hợp so sánh kết quả giữa các mô hình

k Hệ tư vấn Coverage MAE

N/A Random 100 % 1.69

3 Lọc cộng tác 13,2 % 0.83

Độ đo lazy 74 % NA

Độ đo dựa trên khoảng cách 54,6 % NA

5 Lọc cộng tác 30,2 % 0.92

Độ đo lazy 92 % 0.86

Độ đo dựa trên khoảng cách 90 % 0.86

Độ đo lazy 96,5 % 0.86 Độ đo dựa trên khoảng cách 98 % 0.9

Đánh giá:

- Hệ tư vấn ngẫu nhiên có khả năng đưa ra tư vấn với mọi người dùng, tuy nhiên chất lượng tư vấn thấp, độ lệch lên tới 1.69 (trong dải đánh giá từ 1-5) nên tư vấn không chính xác, không hữu ích với người dùng

- Hệ tư vấn dự trên lọc cộng tác có chất lượng tốt, độ lệch trung bình 0.83. Tuy nhiên hệ tư vấn dựa trên lọc cộng tác có khả năng đưa ra tư vấn thấp nhất. Với cấu hình sử dụng 7 người láng giềng phù hợp nhất để đưa ra tư vấn, khả năng đưa ra tư vấn chỉ đạt 49,4 %

- Hệ tư vấn sử dụng độ đo tin cậy có khả năng đưa ra tư vấn cho người dùng vượt trội hơn hẳn hệ tư vấn lọc cộng tác. Với cấu hình 7 người láng giềng tin cậy để đưa ra tư vấn, hệ tư vấn sử dụng độ đo tin cậy có khả năng đưa ra tư vấn từ 96.5% – 98 %.

- Chất lượng tư vấn của hệ tư vấn sử dụng độ đo tin cậy xấp xỉ với hệ tư vấn lọc cộng tác

Kết luận

Hệ thống tư vấn sử dụng độ đo tin cậy là nội dung nghiên cứu mới tại Việt Nam. Luận văn đã tập trung nghiên cứu về độ đo tin cậy trong hệ tự vấn và thực hiện việc ứng dụng độ đo tin cậy trong một hệ thống tư vấn. Luận văn đã đạt được các kết quả:

- Trình bày một cách hệ thống các nội dung cơ bản về sự tin cậy, độ đo tin cậy, hệ tư vấn và hệ tư vấn sử dụng độ đo tin cậy.

- Phân tích mô hình hệ tư vấn có sử dụng độ đo tin cậy của Paolo Massa và cộng sự [18-21] nhằm thi hành một hệ tư vấn thực nghiệm với ma trận tin cậy xuất phát được xác định thông qua quan hệ bạn bè do người dùng cung cấp.

- Xây dựng và tiến hành thực nghiệm so sánh hệ thống tư vấn theo các mô hình tư vấn ngẫu nhiên, mô hình tư vấn lọc cộng tác và mô hình tư vấn sử dụng độ đo tin cậy. Kết quả so sánh giữa hai hệ thống tư vấn dựa trên lọc cộng tác và hệ thống tư vấn sử dụng độ đo tin cậy cho thấy, khả năng đưa ra tư vấn của hệ thống tư vấn sử dụng độ đo tin cậy tăng 47 - 49% và còn chất lượng tư vấn vẫn ngang với hệ thống tự vấn dựa trên lọc cộng tác.

Hướng nghiên cứu tiếp theo:

Độ đo tin cậy trong mô hình của luận văn vẫn còn đơn giản. Để nâng cao chất lượng của việc áp dụng tin cậy vào hệ tư vấn cần nghiên cứu, cải tiến các độ đo tin cậy nhằm tối ưu cho hệ tư vấn và áp dụng vào thành phần tư vấn trong các ứng dụng thực tế theo hướng:

- Sử dụng giá trị tin cậy trong khoảng rộng hơn (có thể dùng trong khoảng 1-5 thay vì sử dụng giá trị 0-1 như hiện tại) để thể hiện tốt hơn tin cậy giữa các người dùng. Khi đó có thể áp dụng các độ đo tốt hơn như MoleTrust, TidalTrust,…

- Nghiên cứu thêm về giá trị âm của tin cậy (giá trị âm thể hiện sự đối lập với tin cậy- thường có được từ danh sách đen (back list) của người dùng) và khả năng áp dụng trong các độ đo tin cậy.

Tài liệu tham khảo

[1] G. Adomavicius, A.Tuzhilin. Towards the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions. IEEE Transactions on Knowledge and Data Engineering, 2005

[2] R. Baeza, F. Silvestri. Web query log mining. ACM SIGIR Conference tutorial, 2009

[3] J. Bennett and S. Lanning. The Netfix prize. Proceedings of KDD Cup and Workshop, 2007

[4] HB. Deng. Introduction to Recommendation System. China University of Hongkong seminar, 2006

[5] Deutsch, Morton. Cooperation and Trust. Some Theoretical Notes. In Jones, M.R. (ed) Nebraska Symposium on Motivation. Nebraska University Press, 1962

[6] Deutsch, Morton.The Resolution of Conflict. New Haven and London: Yale University Press, 1973

[7] A. Eaton. RVW module for syndicating and aggregating reviews.

http://www.pmbrowser.info/rvw/0.2, 2004

[8] Jennifer Golbeck, James Hendler, and Bijan Parsia. Trust networks on the Semantic Web. In Proceedings of Cooperative Intelligent Agents, 2003

[9] Jennifer Golbeck. Computing and applying trust in web-based social networks.

PhD Thesis,University of Maryland, USA, 2005

[10] Golebmiewski, R., McConike, M. The centrality of interpersonal trustin group processes. In Cooper, G.L. (Ed.) Theories of Group Processes, NJ: Wiley, 1975

[11] Gray, Elizabeth, Jean-Marc Seigneur, Youg Chen, Christian Jensen. Trust Propagation in Small Worlds. In Proceedings of the First International Conference on Trust Management. LNCS 2692, Springer-Verlag, 2003

[12] Guha, R., R. Kumar, P. Raghavan, A. Tomkins. Propagation of Trust and Distrust. Proceedings of the13th Annual International World Wide Web Conference, New York, NY, 2004

[13] J. L. Herlocker, J. A. Konstan, A. Borchers, and J. Riedl. An algorithmic framework for performing collaborative fltering. In SIGIR ’99: Proceedings of the 22nd annual international ACM SIGIR conference onResearch and development in information retrieval, pages 230–237, New York, NY, USA, ACM, 1999

[14] J.L. Herlocker, J. Konstan, L. Terveen, and J. Riedl. Evaluating collaborative fltering recommender systems. ACM Transactions on Information Systems (TOIS), 22(1):5–53, 2004

[15] JØsang, A. The Right Type of Trust for Distributed Systems. Proceedings of the 1996 New Security Paradigms Workshop, 1996

[16] JØsang, Audun, Elisabeth Gray, Michael Kinateder. Analysing Topologies of Transitive Trust. Proceedings ofthe FirstInternational Workshop on Formal Aspects in Security & Trust (FAST2003), 2003

[17] R.Levien. Attack Resistant Trust Metrics. PhD thesis, UCBerkeley, Berkeley, CA, USA, 2003

[18] Paolo Massa, Paolo Avesani. Trust-aware Collaborative Filtering for Recommender Systems. Proceedings of the International Conference on Cooperative Information Systems (CoopIS) 2004

[19] Massa, P.; Avesani, P. Controversial users demand local trust metrics: an experimental study on epinions.com community. Proceedings of the 25th American Association for Artificial Intelligence Conference, 2005

[20] Massa, P. Avesani, P. and Tiella, R. A Trust-enhanced Recommender System application: Moleskiing. InProcedings of ACM SAC TRECK Track, 2005

[21] Paolo Massa, Kasper Souren. Trustlet, Open Research on Trust Metrics. BIS (Workshops) 2008: 31-43, 2008

[22] M. O’Mahony, N. Hurley, N. Kushmerick, and G. Silvestre. Collaborative recommendation: A robustness analysis. In Proceedings of Int’l Semantic Web Conf. (ISWC-03), 2003

[23] Resnick, N. Iakovou, M. Sushak, P. Bergstrom, and J. Riedl. GroupLens: An open architecture for collaborative filtering of netnews. In Proceedings of the 1994 Computer Supported Cooperative Work Conference, 1994

[24] B. Sarwar, G. Karypis, J. Konstan, and J. Riedl. Analysis of recommendation algorithms for e-commerce. In Proceedings of the 2nd ACM conference on Electronic commerce, pages 158–167, 2000

[25] B. Sarwar, G. Karypis, J. Konstan, J. Riedl, and M. U. M. D. O. C. science. Application of Dimensionality Reduction in Recommender System. A Case Study. Defense Technical Information Center, 2000

[26] B. Sarwar, G. Karypis, J. Konstan, and J. Reidl. Item based collaborative fltering recommendation algorithms. In WWW’01: Proceedings of the 10th international

conference on World Wide Web, pages 285–295, New York, NY, USA, ACM Press, 2001

[27] Oliver Schneider. Trust Aware Social Networking: A Distributed Storage System based on Social Trust and Geographical Proximity. Master Thesis, 2009

[28] Shapiro, Susan. Social Control of Impersonal Trust. The American Journal of Sociology, 93(3): 623-658, 1987

[29] Sztompka, Piotr. Trust: A Sociological Theory. Cambridge University Press, 1999

[30] I. Witten and E. Frank. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2005

PDF Merger

Thank you for evaluating AnyBizSoft PDF Merger! To remove this page, please

Go to Purchase Now>>

 Merge multiple PDF files into one

 Select page range of PDF to merge

 Select specific page(s) to merge

 Extract page(s) from different PDF

files and merge into one

Phương pháp lọc cộng tác

Phương pháp đánh giá hệ tư vấn