6. Cấu trúc luận văn
1.4.5. Hệ tư vấn lai ghép
Hồ sơ người dùng và thông tin theo ngữ cảnh, dữ liệu cộng đồng, dữ liệu sản phẩm, và các mô hình tri thức là các loại dữ liệu mà hệ tư vấn có thể sử dụng để đưa ra gợi ý. Tuy nhiên, các loại hệ tư vấn được đề cập ở trên chưa khai thác triệt để tất cả các dữ liệu này. Ví dụ, hệ tư vấn lọc cộng tác chỉ sử dụng dữ liệu cộng đồng và hồ sơ người dùng, hệ tư vấn dựa trên nội dung chỉ sử dụng hồ sơ người dùng và dữ liệu sản phẩm. Bên cạnh đó, mỗi loại hệ tư vấn đều có những ưu điểm và hạn chế riêng. Ví dụ, hệ tư vấn dựa trên nội dung không gặp phải vấn đề người dùng mới như hệ tư vấn dựa trên cộng tác. Do đó, các hệ thống tư vấn lai ghép đã được xây dựng nhằm kết hợp sức mạnh của các thuật toán và mô hình khác nhau để khắc phục một số những thiếu sót.
Hệ tư vấn lai ghép là hệ thống kết hợp hai hoặc nhiều kỹ thuật đề xuất để đạt được hiệu suất tốt hơn và để khắc phục những mặt hạn chế của từng kỹ thuật.
Theo tài liệu [19], các hệ thống tư vấn lai có thể được phân thành
những biến thể sau:
Trọng số: điểm số (kết quả) của một số hệ tư vấn được kết hợp thành một điểm số duy nhất dựa trên cách tính trọng số của các điểm số.
Chuyển mạch (switching): thuật toán chuyển đổi giữa các hệ tư vấn khác nhau tùy thuộc vào nhu cầu hiện tại.
Tầng (cascade): một hệ tư vấn sẽ tinh chỉnh các gợi ý của một hệ tư vấn khác.
24
đặc trưng đầu vào cho hệ tư vấn kế tiếp.
Kết hợp đặc trưng: các đặc trưng từ những nguồn dữ liệu khác nhau được kết hợp và sử dụng trong một hệ tư vấn duy nhất.
Meta-level: mô hình được sử dụng bởi một hệ tư vấn được sử dụng làm đầu vào cho một hệ tư vấn khác.
Hỗn hợp: các gợi ý từ một số hệ tư vấn (engines) được trình bày cho người dùng cùng một lúc. Đặc điểm chính của hệ tư vấn hỗn hợp là nó kết hợp điểm số từ các hệ tư vấn khác nhau theo dạng trình bày chứ không phải kết hợp theo dạng điểm dự đoán.
1.4.5.1. Các bước phát triển hệ tư vấn
Một hệ tư vấn lai ghép được phát triển theo hai bước sau:
Chọn các mô hình tư vấn thành phần sẽ được sử dụng. Thông thường, các mô hình tư vấn cơ bản như cộng tác, dựa trên nội dung và dựa trên tri thức sẽ được lựa chọn. Việc lựa chọn này được dựa trên loại dữ liệu đầu vào cũng như ưu điểm và nhược điểm của từng mô hình thành phần.
Thực hiện thiết kế lai ghép bằng cách kết hợp hai hay nhiều mô hình tư vấn thành phần theo một trong ba dạng cơ bản: thiết kế quần thể, thiết kế nguyên khối hay thiết kế hỗn hợp.
1.4.5.2. Các kỹ thuật được sử dụng
Các hệ tư vấn dạng lai được thiết kế theo 3 phương pháp [10]: thiết kế quần thể (ensemble design), thiết kế nguyên khối (monolithic design) và thiết kế hỗn hợp (mixed design). Trong đó, thiết kế quần thể được sử dụng cho các loại biến thể trọng số, chuyển mạch, tầng và bổ sung đặc trưng; thiết kế nguyên khối được sử dụng cho các biến thể: kết hợp đặc trưng và meta-level; và thiết kế hỗn hợp được sử dụng cho biến thể hỗn hợp.
Thiết kế quần thể: các kết quả từ các thuật toán có sẵn (off-the-shelf) được kết hợp thành một kết quả đầu ra duy nhất và mạnh hơn. Thiết kế quần
25
thể có thể ở dạng tuần tự hoặc dạng song song. Trong thiết kế song song, các hệ tư vấn khác nhau hoạt động độc lập với nhau, và các dự đoán của từng hệ riêng lẻ được kết hợp vào cuối. Hệ tư vấn lai trọng số và hệ tư vấn lai chuyển mạch sử dụng thiết kế song song. Trong thiết kế tuần tự, kết quả đầu ra của một hệ tư vấn được sử dụng làm dữ liệu đầu vào cho một hệ tư vấn khác. Hệ tư vấn lai tầng và hệ tư vấn lai meta-level sử dụng thiết kế tuần tự.
Thiết kế nguyên khối: một thuật toán tư vấn tích hợp được tạo ra bằng cách sử dụng các loại dữ liệu khác nhau. Trong thiết kế nguyên khối, hoặc các hệ tư vấn hiện có đều được sửa đổi hoặc các hệ tư vấn mới hoàn toàn được tạo ra bằng cách kết hợp các đặc trưng từ nhiều phương thức dữ liệu.
Thiết kế hệ hỗn hợp: giống như thiết kế quần thể, dạng này sử dụng nhiều thuật toán gợi ý nhưng các mục được gợi ý bởi những hệ thống khác nhau được trình bày cùng nhau. Thiết kế hệ hỗn hợp có thể được xếp vào nhóm thiết kế song song, chỉ khác ở phần trình bày.
1.4.5.3. Các lợi thế và nhược điểm của hệ tư vấn
Hệ tư vấn lai được sử dụng hoặc để tận dụng sức mạnh của nhiều nguồn dữ liệu hoặc để cải thiện hiệu suất của các hệ tư vấn hiện tại trong một phương thức dữ liệu cụ thể. Mỗi một loại hệ tư vấn khác nhau có những điểm mạnh và điểm yếu khác nhau. Hệ tư vấn lai cố gắng tận dụng các thế mạnh của những hệ thống này để tạo ra một hệ thống với sức mạnh tổng thể lớn hơn.
Chưa có một kết luận dựa trên thực nghiệm nào về những ưu điểm và nhược điểm của các biến thể lai ghép khác nhau, nhưng tùy thuộc vào lĩnh vực ứng dụng và loại vấn đề, các biến thể khác nhau nên được khám phá và so sánh.
Thiết kế nguyên khối là phù hợp khi có ít tri thức bổ sung cho cấp độ đặc trưng. Phương pháp này thường chỉ yêu cầu một số bước tiền xử lý bổ sung hoặc các sửa đổi nhỏ trong thuật toán chính và cấu trúc dữ liệu của nó.
26
Thiết kế song song là ít xâm lấn nhất đối với những thực thi hiện có vì nó hoạt động như một bước hậu xử lý bổ sung. Tuy nhiên, nó làm tăng độ phức tạp (thời gian thực thi) và đòi hỏi sự so khớp cẩn thận các điểm gợi ý được tính bằng những thuật toán song song khác nhau.
Thiết kế tuần tự là thiết kế lai ghép đầy tham vọng vì nó đòi hỏi sự hiểu biết sâu về chức năng của thuật toán để đảm bảo các tính toán thời gian thực thi hiệu quả. Tuy nhiên, nó thường hoạt động tốt khi hai mô hình tư vấn tương phản (antithetic), chẳng hạn như lọc cộng tác và dựa trên tri thức, được kết hợp.