Giải thuật lọc dựa trên nội dung (Content-based Recommendation

Một phần của tài liệu Ứng dụng phân hệ gợi ý vào hệ thống thương mại điện tử (Trang 59 - 60)

4.3.2.1.!Ý tưởng

Mô hình lọc dựa trên nội dung này được sử dụng trong việc đề xuất các sản phẩm tương tự dựa trên một sản phẩm cụ thể nào đó. Ý tưởng chung của hệ thống gợi ý này là nếu một người thích một sản phẩm nào đó, họ cũng sẽ thích một sản phẩm tương tự với nó. Và để gợi ý cho người dùng theo cách thức này, nó sẽ sử dụng thông tin trước đây của người dùng để làm cơ sở đưa ra các gợi ý mà có thể người dùng thích.

Trong hệ thống website của chúng ta, ta sẽ tận dụng mô hình này theo cách là khi một người dùng truy cập và xem một món sản phẩm cụ thể nào đó, nghĩa là ta đã có thông tin về cái sản phẩm mà người dùng đang xem xét, ta sẽ dùng mô hình này để gợi ý ra những sản phẩm gần gũi với sản phẩm này cho người dùng vì có thể người dùng sẽ thích sản phẩm gần gũi với sản phẩm mà người dùng đang xem và có thể phù hợp hơn với nhu cầu sử dụng của người dùng.

Để thực hiện mô hình này, hệ thống sẽ đánh giá các đặc tính của các sản phẩm được gợi ý. Nó sẽ gợi ý các sản phẩm dựa trên hồ sơ của người dùng hoặc dựa vào nội dụng, thuộc tính của những sản phẩm tương tự như sản phẩm mà người dùng đã chọn trong quá khứ.

Ví dụ: khi người dùng xem và quan tâm sản phẩm iPhone XR, hệ thống sẽ gợi ý thêm các sản phẩm tương tự, gần gũi với iPhone XR như iPhone 11 hoặc iPhone 11 pro max chẳng hạn, vì có thể người dùng sẽ quan tâm đến các sản phẩm mà ta gợi ý này hơn vì nó phù hợp hơn với nhu cầu người dùng. Cách tiếp cận này đòi hỏi việc sắp xếp các

sản phẩm vào từng nhóm(ví dụ: điện thoại, laptop, …) hoặc đi tìm các đặc trưng của từng sản phẩm.

4.3.2.2.!Các bước thực hiện

Bước 1: khởi tạo thông tin dữ liệu cho mỗi sản phẩm. Để có thể gợi ý sản phẩm cho người dùng, ta cần phải khởi tạo dữ liệu, xây dựng các thông tin đặc trưng của dữ liệu để từ đó có cơ sở mà sử dụng các thuật toán và gợi ý các sản phẩm tương tự cho người dùng.

Bước 2: thiết lập ma trận TF – IDF:

¥! Như đã đề cập ở trên, chúng ta cần xây dựng một bộ hồ sơ cho mỗi sản phẩm. Các thông tin đặc trưng của hồ sơ được trình bày dưới dạng văn bản, ta cần phải mô hình hoá các thông tin đặc trưng này dưới dạng toán học, mỗi sản phẩm phải là một vector đặc trưng(feature vector).

¥! Ta sẽ biểu diễn mỗi sản phẩm dưới dạng vector đặc trưng TF – IDF, giá trị này là thước đo thống kê đánh giá mức độ liên quan của một từ với một tài liệu trong bộ sưu tập tài liệu.

Bước 3: tính độ tương đồng giữa các sản phẩm:

¥! Ta sẽ sử dụng cosine similarity để tính toán một đại lượng số biểu thị mức độ giống nhau giữa hai sản phẩm.

¥! Ta chọn phương pháp cosine similarity vì nó không phụ thuộc vào độ lớn và tương đối dễ dàng tính toán.

¥! Sau khi mô hình hoá thông tin sản phẩm dưới dạng TF – IDF, khi đó mỗi sản phẩm được mô hình hoá bằng một vector đặc trưng ij nào đó. Giá trị cosine similarity của 2 sản phẩm được tính như sau:

Bước 4: Sau khi đã có ma trận điểm tương đồng của các sản phẩm, chúng ta sẽ lấy ra top các sản phẩm có điểm tương đồng cao nhất so với sản phẩm mà ta đang xem xét và trả về thông tin các sản phẩm có điểm tương đồng cao nhất đó làm sản phẩm gợi ý theo sản phẩm cho người dùng.

Một phần của tài liệu Ứng dụng phân hệ gợi ý vào hệ thống thương mại điện tử (Trang 59 - 60)

Tải bản đầy đủ (PDF)

(159 trang)