6. Điểm: (Bằng chữ: )
5.3.2.3. Cách tiếp cận Item-based
Việc train dữ liệu cho hệ thống gợi ý dựa trên sản phẩm này cũng tương tự như việc train dữ liệu sử dụng cho cách tiếp cận User-base vừa trình bày ở trên, tuy nhiên chúng ta sẽ cần thêm một đoạn dữ liệu là Id của những tag mà từng bài báo có:
Hình 5. 9: Bảng dữ liệu sau khi train dữ liệu (Item-based)
Việc đầu tiên chúng ta cần làm đối với hệ thống gợi ý dựa trên sản phẩm là tìm và lấy ra một số bài báo mà người dùng mục tiêu đã có đánh giá tốt nhất trước đây.
Sau khi đã lấy được danh sách những bài báo có đánh giá tốt nhất, thì chúng ta bắt đầu tìm những bài báo tương tự với từng bài báo đã tìm được sử dụng phương thức so sánh tương tự như như phương thức so sánh của User-base tuy nhiên thay vì dữ liệu truyền vào là bảng dữ liệu sau khi train dữ liệu thì chúng ta sẽ đảo chiều dữ liệu để danh sách người dùng và tag trở thành hàng và danh sách bài báo trở thành cột của mảng.
Sau đó thì chúng ta sẽ nhận được kết quả là danh sách các sản phẩm tương tự với những sản phẩm đã được người dùng đánh giá tốt để gợi ý cho người dùng.
Vì hệ thống gợi ý dựa trên sản phẩm này phải tìm hàng xóm cho nhiều sản phẩm khác nhau nên giải thuật sẽ chạy chậm hơn một chút so với thống gợi ý dựa trên người dùng.
Chương 5: Hiện thực dự án 85
5.3.2.4. Kết quả
Sau khi xây dựng và chạy thử nghiệm với tập dữ liệu mẫu với việc chia tỉ lệ train- test là 90-10 và chạy cả 2 model với việc lấy ra 30 gợi ý một lần ta được kết quả như sau:
Hình 5. 10: Kết quả gợi ý của 2 cách tiếp cận
Hình 5. 11: Kết quả đánh giá giải thuật
Như hình trên ta có thể thấy độ chính xác cũng như tốc độ của hệ thống gợi ý dựa trên người dùng cao hơn một chút so với hệ thống gợi ý dựa trên sản phẩm. Chính vì vậy mà nhóm thực hiện báo cáo đã áp dụng hệ thống gợi ý dựa trên người dùng vào đồ án.