So sánh các phƣơng pháp gợi ý

Một phần của tài liệu Hệ gợi ý (Trang 35 - 37)

Tất cả các kỹ thuật gợi ý đều cĩ các điểm mạnh và điểm yếu khác nhau. Ph biến nhất là vấn đề “ramp-up” . Thuật ngữ nĩi tới hai vấn đề khác nhau nhƣng cĩ liên quan với nhau trong bài tốn gợi ý.

Ngƣời sử dụng mới (New User): Bởi vì các phƣơng pháp gợi ý theo sau đĩ là sự so sánh giữa ngƣời sử dụng đang cần đƣợc gợi ý và các ngƣời sử dụng khác dựa trên sự tích lũy của những điểm số đánh giá, do đĩ một ngƣời sử dụng với một vài điểm số đánh giá trở nên khĩ khăn để gợi ý.

Đối tƣợng mới (New Item): Tƣơng tự, một đối tƣợng mới chƣa đƣợc nhiều ngƣời sử dụng đánh giá điểm số cũng khơng dễ dàng gợi ý gọi là vấn đề đối tƣợng mới. Vấn đề này xuất hiện trong những lĩnh vực nhƣ các bài báo mới, ở đĩ các đối tƣợng mới (bài báo) xuất hiện liên tục và mỗi ngƣời sử dụng chỉ cĩ một vài đánh giá. Nĩ cũng đƣợc biết đến nhƣ là vấn đề “ngƣời đánh giá sớm” (early rater), bởi vì những ngƣời đầu tiên đánh giá một đối tƣợng cĩ ít sự thuận lợi từ việc này: những điểm số đánh giá sớm nhƣ thế khơng thể tìm thấy đƣợc sự “phù hợp” với những ngƣời dùng khác . Do đĩ các hệ thống gợi ý cần cung cấp các khuyến khích ngƣời sử dụng cung cấp các điểm số đánh giá để xác nhận mức độ ƣa thích.

Hệ thống gợi ý dựa theo lọc cộng tác phụ thuộc trên sự trùng lặp trong các điểm số đánh giá của những ngƣời sử dụng, và trở nên khĩ khăn khi khơng gian này là “rải rác”: một vài ngƣời cùng đánh giá một đối tƣợng. Vấn đề này đƣợc giảm

35

Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1

thiểu trong cách tiếp cận dựa theo mơ hình, nhƣ là sự phân tách giá trị chính tắc (singular value decomposition), nĩ cĩ thể làm giảm số chiều của khơng gian mà trong đĩ những sự so sánh diễn ra . Các vấn đề này chỉ ra rằng, phƣơng pháp gợi ý dựa theo lọc cộng tác là đặc biệt thích hợp cho những bài tốn mà ở đĩ mật độ quan tâm đánh giá của ngƣời sử dụng khá cao qua một khơng gian đối tƣợng nhỏ và n định. Nếu tập đối tƣợng thay đ i quá nhanh, các điểm số đánh giá cũ sẽ ít cĩ giá trị hơn đối với những ngƣời sử dụng mới. Nếu tập đối tƣợng là lớn thì sự quan tâm của ngƣời dùng đƣợc trải mỏng ra, thì xác suất trùng lặp với ngƣời sử dụng sẽ càng nhỏ. Phƣơng pháp gợi ý dựa theo lọc cộng tác đạt kết quả tốt nhất cho những bài tốn mà ở đĩ cĩ nhiều ngƣời sử dụng cùng sở thích. Lọc cộng tác chịu ảnh hƣởng của cả vấn đề ngƣời dùng mới và đối tƣợng mới.

Hệ thống gợi ý dựa theo nội dung cũng cĩ vấn đề trong việc phải tích lũy đủ các điểm số đánh giá (vấn đề ngƣời sử dụng mới) để xây dựng một sự đánh giá đủ tin cậy. Gợi ý dựa theo nội dung cũng cĩ các vấn đề mà chúng bị hạn chế bởi những đặc điểm của đối tƣợng đang đƣợc gợi ý. Điều này dấn đến phƣơng pháp này chỉ áp dụng dựa trên dữ liệu cĩ thể mơ tả đƣợc. Các hệ thống gợi ý theo lọc cộng tác chỉ dựa trên những điểm số đánh giá của ngƣời sử dụng và cĩ thể gợi ý những đối tƣợng mà khơng cần bất cứ dữ liệu nào liên kết với đối tƣợng đĩ. Nĩ khơng bị ảnh hƣởng bởi vấn đề đối tƣợng mới, bởi vì nĩ gợi ý chỉ dựa vào các đặc điểm của đối tƣợng, tuy nhiên nĩ vẫn chịu ảnh hƣởng của vấn đề ngƣời dùng mới. Thậm chí, trong trƣờng hợp đối tƣợng đƣợc miêu tả bởi các đặc điểm liên kết với nĩ một cách rõ ràng, các thực nghiệm chỉ ra rằng các hệ thơng gợi ý dựa theo lọc cộng tác là chính xác hơn các hệ thống gợi ý dựa theo nội dung .

Điểm mạnh của phƣơng pháp gợi ý dựa theo cộng tác so với phƣơng pháp gợi ý dựa theo nội dung là khả năng đa hạng mục (cross-genre hoặc “outside the box” recommendation). Ví dụ, một ngƣời nghe nhạc thích nhạc jazz cũng thƣờng thích nhạc c điển, nhƣng một hệ thống gợi ý dựa theo nội dung đƣợc huấn luyện dựa trên sự quan tâm tới nhạc jazz sẽ khơng thể gợi ý những đối tƣợng trong nhạc c điển bởi vì khơng cĩ đặc điểm nào (features) liên kết những đối tƣợng trong những thể loại nhạc khác nhau này. Tuy nhiên điều này cĩ thể làm đƣợc bởi phƣơng

36

Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1

pháp gợi ý dựa theo lọc cộng tác bởi vì nĩ chỉ liên quan tới các điểm số đánh giá của ngƣời sử dụng mà khơng liên quan tới các đặc điểm biểu diễn các đối tƣợng.

Cả hai kỹ thuật gợi ý dựa theo lọc cộng tác và dựa theo nội dung đều chịu hiệu ứng “portfolio”. Một hệ thống gợi ý lý tƣởng sẽ khơng gợi ý một mã c phiếu mà ngƣời sử dụng đã làm chủ hoặc một bộ phim mà ngƣời sử dụng đã xem. Vấn đề trở nên thật sự nghiêm trọng trong những lĩnh vực nhƣ lọc tin tức, bởi vì cĩ những tin tức mới trơng khá giống những tin tức đã đọc nhƣng vẫn cĩ giá trị với ngƣời sử dụng. Ngƣợc lại, cĩ những tin tức mới nhƣng hồn tồn khơng cĩ ích với ngƣời sử dụng. Hệ thống DailyLearner sử dụng một giới hạn trên của sự tƣơng tự trong hệ thống gợi ý dựa theo nội dung để lọc các đối tƣợng tin tức quá giống với những tin tức mà ngƣời sử dụng đã đọc.

Một phần của tài liệu Hệ gợi ý (Trang 35 - 37)

Tải bản đầy đủ (PDF)

(91 trang)