Các hệ thống gợi ý lai kết hợp hai hoặc nhiều kỹ thuật gợi ý để đạt đƣợc hiệu năng tốt hơn và hạn chế một vài khuyết điểm trong từng kỹ thuật riêng biệt. Ph biến nhất, kỹ thuật gợi ý dựa theo lọc cộng tác đƣợc kết hợp với một kỹ thuật khác để tránh gặp phải vấn đề ramp-up. Sau đây là phân loại các hệ thống gợi ý lai .
37
Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1
2.2.4.1. Trọng số (Weighted).
Một hệ thống gợi ý lai theo trọng số là một hệ thống mà điểm số dự đốn của mỗi đối tƣợng đang xem xét, đƣợc tính từ điểm số dự đốn của tất cả các kỹ thuật gợi ý cĩ trong hệ thống cho đối tƣợng đĩ. Một sự kết hợp đơn giản đĩ là kết hợp tuyến tính điểm số dự đốn của các kỹ thuật gợi ý riêng rẽ cĩ trong hệ thống. Hệ thống P-Tango sử dụng một hệ thống lai ghép theo cách này. Ban đầu, hệ thống sử dụng các phƣơng pháp gợi ý dựa theo lọc cộng tác và dựa theo nội dung với trọng số bằng nhau, nhƣng về sau thay đ i các trọng số khi sự dự đốn điểm số ngƣời dùng đƣợc xác định hoặc khơng xác nhận bởi ngƣời sử dụng.
Sự thuận lợi của hệ thống gợi ý lai ghép dựa theo trọng số là ở chỗ tất cả các phƣơng pháp gợi ý trong hệ thống đều đƣợc sử dụng để sinh ra kết quả gợi ý theo một cách đơn giản. Ngồi ra, nĩ cũng dễ dàng để phân cơng, điều khiển hệ thống tùy theo kết quả gợi ý. Tuy nhiên, hệ thống loại này gặp phải vấn đề, do giá trị dự đốn của các kỹ thuật khác nhau cĩ thể là nhiều hoặc ít đồng nhất trên khơng gian của cá đối tƣợng đang đƣợc gợi ý.
2.2.4.2. Chuyển đổi (Switching).
Một hệ thống gợi ý lai theo chuyển đ i xây dựng điểm số dự đốn của một đối tƣợng theo chiến lƣợc nhƣ sau: hệ thống sử dụng một vài tiêu chuẩn để chuyển qua lại giữa các kỹ thuật gợi ý cĩ trong hệ thống. Kỹ thuật cĩ độ chính xác tốt nhất sẽ đƣợc dùng để gợi ý. Hệ thống DailyLearner sử dụng một hệ thống lai theo kiểu chuyển đ i giữa lọc cộng tác và dựa theo nội dung. Nếu phƣơng pháp gợi ý dựa theo nội dung khơng đủ chính xác, hệ thống sẽ sử dụng phƣơng pháp gợi ý dựa theo lọc cộng tác. Hệ thống lai ghép này khơng tránh đƣợc hồn tồn vấn đề ramp- up, bởi vì cả hai phƣơng pháp lọc cộng tác và dựa theo nội dung đều gặp phải vấn đề ngƣời sử dụng mới. Tuy nhiên, kỹ thuật gợi ý dựa theo nội dung của hệ thống DailyLearner sử dụng láng giềng gần nhất (nearest-neighbor), nĩ khơng yêu cầu một số lƣợng lớn các đánh giá của ngƣời sử dụng để cĩ đƣợc sự chính xác. Một thuận lợi khác của hệ thống DailyLearner là ở khả năng gợi ý đa dạng đối tƣợng. Nĩ kế thừa đặc điểm này từ phƣơng pháp gợi ý dựa theo lọc cộng tác.
38
Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1
Tuy nhiên DailyLearner cũng cĩ một hạn chế, nĩ luơn sử dụng gợi ý dựa theo nội dung trƣớc tiên, và các kỹ thuật khác chỉ đƣợc sử dụng khi mà kỹ thuật này khơng đủ chính xác, đƣa ra hệ thống gợi ý lai ghép chuyển đ i đơn giản hơn. Trong hệ thống này, một quy tắc so sánh giữa các điểm số đánh giá trong quá khứ của ngƣời sử dụng và các kết quả gợi ý của mỗi kỹ thuật đƣợc sử dụng để lựa chọn kỹ thuật đƣợc sử dụng trong hệ thống lai ghép này.
Hệ thống lai ghép theo kiểu chuyển đ i làm phức tạp thêm quá trình gợi ý bởi vì nĩ phải xác định cá tiêu chuẩn chuyển đ i giữa các phƣơng pháp gợi ý. Tuy nhiên, sự thuận lợi là ở chỗ các hệ thống loại này cĩ thể biết đƣợc khả năng của các phƣơng pháp gợi ý cĩ trong hệ thống, từ đĩ cĩ đƣợc một quyết định hiệu quả cho việc chuyển đ i.
2.2.4.3. Kết hợp (Mixed).
Hệ thống gợi ý lai theo kiểu kết hợp sẽ đƣa tất cả các đối tƣợng đƣợc gợi ý bởi mỗi một kỹ thuật riêng rẽ cĩ trong hệ thống. Hệ thống PTV sử dụng cách tiếp cận này để xây dựng ra một ứng dụng gợi ý cho các chƣơng trình truyền hình. Nĩ sử dụng phƣơng pháp gợi ý dựa theo nội dung trên các đoạn văn bản mơ tả chƣơng trình TV và phƣơng pháp lọc cộng tác trên sở thích của những ngƣời sử dụng khác. Các kết quả gợi ý của hai phƣơng pháp này đƣợc hợp nhất trong kết quả gợi ý cuối cùng tới ngƣời sử dụng.
Hệ thống gợi ý lai theo kiểu kết hợp tránh đƣợc vấn đề đối với đối tƣợng mới (new item) do kế thừa từ phƣơng pháp gợi ý dựa theo nội dung. Tuy nhiên vấn đề về ngƣời dùng mới (new user) vẫn cịn tồn tại.
2.2.4.4. Kết hợp các đặc điểm (Fearture Combination).
Một cách khác để kết hợp gợi ý dựa theo nội dung và gợi ý dựa theo lọc cộng tác là xử lý các thơng tin lọc cộng tác nhƣ là các dữ liệu đặc điểm liên kết với các đối tƣợng và sử dụng kỹ thuật gợi ý dựa theo nội dung cho tập dữ liệu vừa mới tăng cƣờng.
39
Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1
Hệ thống gợi ý dựa theo phƣơng pháp này cho phép hệ thống xem xét các dữa liệu của lọc cộng tác mà khơng dựa trên chính kỹ thuật này, do đĩ nĩ làm giảm sự ảnh hƣởng của vấn đề ngƣời sử dụng đã đánh giá ít đối tƣợng. Ngƣợc lại, nĩ cho phép hệ thống cĩ thêm các thơng tin về sự tƣơng tự vốn cĩ giữa những ngƣời sử dụng.
2.2.4.5. Nối tầng (Cascade).
Hệ thống gợi ý lai theo nối tầng bao gồm các bƣớc xử lý. Trong kỹ thuật này, một kỹ thuật gợi ý đƣợc triển khai đầu tiên để sinh ra một tập các ứng viên theo kiểu “chắt lọc thơ” cĩ sự xếp hạng và kỹ thuật thứ hai đƣợc dùng để “tinh lọc” những gợi ý từ tập các ứng viên ở bƣớc một.
Các hệ thống gợi ý lai theo kiểu nối tầng tránh sử dụng phƣơng pháp thứ hai, mức độ ƣu tiên thấp hơn, trên những đối tƣợng quá khác biệt hoặc ít đƣợc đánh giá (poorly-rated) và do đĩ chúng sẽ khơng bao giờ đƣợc gợi ý. Bởi vì bƣớc thứ hai chỉ tập trung trên những đối tƣợng thỏa mãn những tiêu chuẩn ở bƣớc thứ nhất. Do đĩ sẽ hiệu quả hơn, ví dụ đối với hệ thống gợi ý lai theo kiểu trọng số chỉ áp dụng kỹ thuật gợi ý thứ hai này cho tất cả các đối tƣợng.
2.2.4.6. Tăng cƣờng đặc điểm (Fearture Augmention).
Trong hệ thống này, một kỹ thuật đƣợc dùng để sinh ra các điểm số dự đốn (predict) hoặc phân lớp của đối tƣợng và sau đĩ các thơng tin này ( thơng tin đƣợc qua bƣớc xử lý đầu tiên này) đƣợc tích hợp vào trong quá trình sử lý của kỹ thuật gợi ý kế tiếp. Ví dụ, hệ thống Libra gợi ý các cuốn sách dựa theo nội dung dựa trên dữ liệu tìm đƣợc trên Amazon.com, sử dụng phân lớp na ̈ve bayes. Dữ liệu văn bản đƣợc sử dụng bởi hệ thống bao gồm các thơng tin liên quan nhƣ tác giả(authors) và tiêu đề (title) đƣợc Amazon sinh ra sử dụng hệ thống gợi ý theo lọc cộng tác.
Hệ thống lai ghép theo kiểu tăng cƣờng các đặc điểm phân biệt với hệ thống kết hợp các đặc điểm ở chỗ, trong hệ thống kết hợp các thơng tin thơ (raw data) là đƣợc tích hợp để xử lý luơn. Nĩ cũng đƣợc phân biệt với hệ thống nối tầng ở chỗ
40
Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1
trong tăng cƣờng đặc điểm, các đặc điểm đƣợc sử dụng bởi phƣơng pháp thứ hai bao gồm dữ liệu ra của bƣớc đầu tiên( các dữ liệu đặc điểm đƣợc học), trong khi theo phƣơng pháp nối tầng phƣơng pháp gợi ý thứ hai khơng sử dụng bất kì dữ liệu ra nào từ phƣơng pháp gợi ý thứ nhất trong việc đƣa ra các xếp hạng của nĩ và kết quả gợi ý cuối cùng đƣợc kết hợp cĩ ƣu tiên thứ tự.
2.2.4.7. Meta-level.
Một cách khác để kết hợp hai kỹ thuật gợi ý là sử dụng mơ hình đƣợc sinh ra bởi kỹ thuật thứ nhất nhƣ là dữ liệu đầu vào cho kỹ thuật thứ hai. Nĩ phân biệt so với phƣơng pháp tăng cƣờng ở chỗ: trong kỹ thuật tăng cƣờng đặc điểm, chúng ta sử dụng một mơ hình để sinh ra các đặc điểm nhƣ là dữ liệu vào cho thuật tốn thứ hai, trong kỹ thuật lai meta-level tồn bộ mơ hình trở thành dữ liệu đầu vào.