.7 Bốn kỹ thuật gợi ý cơ bản

Một phần của tài liệu Xây dựng hệ thống gợi ý cho website thương mại điện tử (Trang 37 - 41)

Collaborative: Hệ thống đưa ra gợi ý hồn tồn chỉ dựa trên thơng tin đánh giá lấy từ hồ sơ của khách hàng. Nĩ sẽ tìm thấy người dùng cĩ lịch sử mua bán tương đồng với người dùng hiện thời rồi dựa vào đĩ để đưa ra gợi ý.

Content-based: Hệ thống dạng này hoạt động dựa trên 2 nguồn tri thức: Các thuộc tính đi kèm với sản phẩm và đánh giá của người dùng đối với chúng. Hệ gợi ý dựa trên nội dung đưa ra gợi ý bằng việc “học” những gì người dùng này thích và khơng thích dựa trên các tính năng sản phẩm .

Demographic-based: Hệ gợi ý dựa trên nhân khẩu học đưa ra gợi ý dựa trên Demographic profile – hồ sơ nhân khẩu của người dùng. Gợi ý được tạo ra trên thơng tin nhân khẩu học và kết hợp đánh giá của người dùng.

35

Knowledge-based: Hệ gợi ý dựa trên tri thức gợi ý sản phẩm cho người dùng dựa trên sự suy luận những gì họ thích và ưu tiên, tri thức này đơi khi chứa những hàm hiện để ước lượng mức độ cần thiết của người dùng đối với mĩn hàng.

Tất cả những kỹ thuật trên cơ sở “học” như collaborative, content-based và demographic-based sẽ phải đối mặt với vấn đề khởi động nguội – cold start. Đây là vấn đề xử lý đối với những người dùng mới hoặc người dùng chưa cĩ đủ dữ liệu để đưa ra gợi ý. Chẳng hạn như hệ thống lọc cộng tác, một sản phẩm khơng thể được gợi ý nếu nĩ chưa từng được đánh giá bởi người khác. Gợi ý cho một sản phẩm mới sẽ kém hiệu quả hơn những sản phẩm cũ đã được nhiều khách hàng đánh giá rồi, và hồn tồn thất bại với những người dùng mới.

Đây là vấn đề về việc cân bằng giữa tính mềm dẻo và tính bền vững. Khi hồ sơ của một người dùng đã được thiết lập trong hệ thống, rất khĩ để cĩ thể thay đổi mức độ ưu tiên của họ. Một người thường xuyên đọc tiểu thuyết một thời gian sẽ cứ nhận được những gợi ý về tiểu thuyết từ các hệ thống collaborative hay content-based kể cả khi họ đã chuyển sang đọc sách khoa học, chỉ đến khi những đánh giá mới đủ mạnh để thay đổi điều này. Một số hệ thống sẽ sử dụng những kỹ thuật cắt bớt để làm giảm ảnh hưởng của những đánh giá cũ, những điều này cũng cĩ nghĩa là đối mặt với nguy cơ mất đi thơng tin về những mối quan tâm cĩ tần suất thấp nhưng trong thời gian dài của khách hàng. Chằng hạn như người dùng cĩ thĩi quen xem các bản tin về động đất thiên tai, nhưng rõ ràng là những sự kiện này hiếm khi xảy ra, nếu hạn chế dữ liệu cũ thì chúng ta sẽ mất đi cơ sở để dự đốn về mối quan tâm này. Hệ thống gợi ý dùng kỹ thuật knowledge-based sẽ phản ứng lại với những nhu cầu cấp thiết nhất của người dùng mà khơng cần học lại bất cứ thứ gì khi sở thích người dùng thay đổi.

Nghiên cứu cho thấy rằng các kỹ thuật collaborative hay demographic-based cĩ khả năng kéo người dùng ra khỏi những lựa chọn quen thuộc của mình. Knowledge-based cũng làm được điều tương tự nhưng hạn chế là những thể loại đĩ phải được định nghĩa trước bởi người thiết kế hệ thống. Tuy nhiên thì vấn đề cold-

36

start sẽ ngăn cản người dùng hưởng dụng tối đa những lợi ích mà kỹ thuật collaborative hay content-based mang lại. Hệ thống dựa trên học tập làm việc hiệu quả nhất cho những khách hàng chịu đầu tư thời gian để cung cấp thơng tin cần thiết cho hệ thống. Knowledge-based khơng mắc phải những nhược điểm này vì nĩ khơng cần những thơng tin về sở thích của khách hàng trong quá khứ.

Hệ thống gợi ý lai là kết hợp của các kỳ thuật trên để tăng hiệu quả gợi ý, thường thường là để xử lý vấn đề cold-start. Chương này sẽ giới thiệu về các phương pháp lai ghép giữa các kỹ thuật, làm tiền đề để đưa ra một hệ gợi ý hiệu quả ở chương sau.

2.2.2.Các phương pháp lai ghép

Những nghiên cứu trước đây đã xác định ra 7 loại kết hợp sau [9]:

- Weighted: Kết hợp kiểu đánh trọng số, các gợi ý thành phần sẽ được đánh trọng số theo quy ước cho trước.

- Switching: Hệ thống chọn lựa một trong những gợi ý thành phần và áp dụng. - Mixed: Kết quả của từng gợi ý thành phần sẽ được trộn lẫn với nhau khi hiển

thị ra với người dùng.

- Feature Combination: Đặc trưng của từng nguồn tri thức khác nhau sẽ được tổ hợp để chuyển sang cho một thuật tốn gợi ý duy nhất.

- Feature Augmentation: Một kỹ thuật gợi ý sẽ được sử dụng để tính tốn một đặc trưng hoặc một tập đặc trưng, kết quả sẽ là đầu vào của một kỹ thuật khác. - Cascade: Mơ hình thác, hệ gợi ý đưa ra một thứ tự ưu tiên chặt chẽ, trong đĩ kỹ thuật cĩ thứ tự ưu tiên thấp sẽ khơng thay đổi quyết định của kỹ thuật cao hơn.

- Meta-level: Một hệ gợi ý được sử dụng để tạo ra một vài kiểu mơ hình, đầu ra sẽ được hệ gợi ý tiếp theo sử dụng.

37

Bảng 2.3 - Độ khả thi của từng phép lai với các kỹ thuật gợi ý khác nhau [9]

Các nghiên cứu trước đây đã chỉ ra những hệ thống lai khả thi giữa các cặp kỹ thuật gợi ý với 7 phép lai như bảng trên. Chú ý là một số cặp cịn phân biệt theo thứ tự kết hợp trong phép lai, chẳng hạn cặp content-based /collaborative với phép lai feature augmentation sẽ là hệ thống hồn tồn khác nếu đổi lại thứ tự kết hợp.

Weighted

Hệ thống gợi ý của Moviefinder cĩ 2 thành phần: thành phần thứ nhất sử dụng kỹ thuật lọc cộng tác collaborative, xác định sự tương đồng giữa các profile đánh giá và dựa vào các thơng tin đĩ để đưa ra tiên đốn. Thành phần thứ 2 dựa trên các tri thức ngữ nghĩa căn bản để thu hẹp khơng gian xử lý bằng cách phân tích ngữ nghĩa tiềm ẩn và gợi ý các bộ phim mà người dùng cĩ thể sẽ thích. Đầu ra của 2 bộ phận này được tổ hợp với nhau theo một sơ đồ trọng số tuyến tính.

38

Một phần của tài liệu Xây dựng hệ thống gợi ý cho website thương mại điện tử (Trang 37 - 41)

Tải bản đầy đủ (PDF)

(83 trang)