So sánh các phương pháp

Một phần của tài liệu Khóa luận tốt nghiệp Nghiên cứu phương pháp lọc cộng tác cho hệ thống tư vấn phim (Trang 61)

Trong khi chúng ta có 3 kỹ thuật thì chúng ta có thể tóm gọn lại chúng trong 2 phƣơng pháp là tƣ vấn dựa trên ngƣời dùng (User-based) và tƣ vấn dựa trên các mặt hàng (Item-based), vì:

- Thứ nhất, kỹ thuật tƣ vấn dựa trên ngƣời dùng (User-based) và tƣ vấn dựa trên các mặt hàng (Item-based) đáp ứng đầy đủ các quá trình tính toán, các kỹ thuật, công thức cơ bản và đƣa ra các kết quả tƣ vấn hiệu quả, phù hợp trong khi kỹ thuật mặt hàng phù hợp (Matching Product) chỉ đƣa ra các kết quả tƣ vấn dựa trên tƣơng quan

NGUYỄN THÙY TRANG – K43 TIN HỌC KINH TẾ Trang 60 các phim và những kết quả nó đƣa ra có thể trùng lặp với các phim ngƣời xem đã xem qua.

- Thứ hai, kỹ thuật mặt hàng phù hợp (Matching Product) chỉ là 1 bƣớc trong kỹ thuật tƣ vấn dựa trên các mặt hàng (Item-based) và nó hỗ trợ đƣa ra kết quả chính xác hơn cho kỹ thuật này.

Nhƣ vậy, ta chỉ cần xem xét tính ƣu việt, vƣợt trội của 2 phƣơng pháp tƣ vấn dựa trên ngƣời dùng (User-based) và tƣ vấn dựa trên các mặt hàng (Item-based). Phƣơng pháp tƣ vấn dựa trên các mặt hàng (Item-based) nhanh hơn đáng kể so với tƣ vấn dựa trên ngƣời dùng (User-based) trong việc đƣa ra một danh sách các tƣ vấn cho một tập dữ liệu lớn do số lƣợng ngƣời sử dụng thƣờng lớn hơn rất nhiều lần số lƣợng mặt hàng cho nên việc tính toán độ tƣơng quan sẽ mất nhiều thời gian hơn. Ngoài ra, có một sự khác biệt trong độ chính xác phụ thuộc vào việc các bộ dữ liệu nhƣ thế nào là "thƣa thớt". Trong bộ dữ liệu phim, vì mỗi ngƣời đánh giá đã đánh giá hầu hết các bộ phim, các bộ dữ liệu này dày đặc (không thƣa thớt). Mặt khác, nó không thể tìm thấy hai ngƣời với cùng một bộ đánh dấu phim yêu thích dẫn đến một bộ dữ liệu thƣa thớt. Phƣơng pháp tƣ vấn dựa trên các mặt hàng (Item-based) thƣờng nhanh hơn so với tƣ vấn dựa trên ngƣời dùng (User-based) trong bộ dữ liệu thƣa thớt, và nhƣ nhau trong bộ dữ liệu dày đặc.

Có thể nói rằng, lọc dựa trên ngƣời dùng (User-based) đơn giản để thực hiện và không có bƣớc mở rộng, vì vậy nó thƣờng là hiệu quả và chính xác hơn với bộ dữ liệu nhỏ với bộ nhớ thay đổi thƣờng xuyên, trong khi lọc dựa trên các mặt hàng (Item- based) lại phù hợp với bộ dữ liệu lớn và bộ nhớ ít thay đổi.

Một phần của tài liệu Khóa luận tốt nghiệp Nghiên cứu phương pháp lọc cộng tác cho hệ thống tư vấn phim (Trang 61)