Gọi wuk và hik là các phần tử tương ứng của hai ma trận W và H, khi đĩ xếp hạng của người dùng u trên mục tin i được dự đốn bởi biểu thức 2.13:
2.13
Như vậy, vấn đề của kỹ thuật MF là làm sao để tìm được giá trị của hai tham số W và H. Hai tham số này cĩ được bằng cách tối ưu hĩa hàm mục tiêu (objective function). Hàm mục tiêu thơng dụng nhất trong RS tương tự như hàm lỗi RMSE, biểu diễn như biểu thức 2.14:
2.14
Một trong những kỹ thuật cĩ thể dùng để tối ưu hĩa hàm mục tiêu là dùng SGD (Stochastic Gradient Descent) (Koren et al., 2009). Để tối ưu hĩa hàm mục tiêu trên, đầu tiên cần khởi tạo các giá trị ngẫu nhiên cho W và H, sau đĩ từng bước cập nhật giá trị của chúng cho đến khi hàm mục tiêu hội tụ về giá trị nhỏ nhất (lỗi ít nhất).
Để làm được điều đĩ phải biết nên tăng hay nên giảm các giá trị của W và H qua mỗi lần cập nhật, do vậy cần phải tìm đạo hàm tương ứng như hai biểu thức sau:
2.15
2.16 Sau khi tìm đạo hàm, các phần tử của W và H sẽ được cập nhật ngược hướng với giá trị của đạo hàm (Takács et al., 2009), qua hai biểu thức sau:
2.17 2.18 �� ��̂���� = � w���� ℎ���� = (������ )��,�� ��=1 2 �� ������ = � (������ − ������ )2 = � ������� − � ������ ℎ���� � ��=1 ��,��∈������������ ��,��∈������������ �� ������ = −2(������ − ��̂���� )ℎ���� �������� ��ℎ���� ������ = −2(������ − ������ )������ ������������ = ������������ − �� ⋅ ������ = ������������ + 2�� (⋅������ − ��̂���� )ℎ���� � ����� ℎ�������� = ℎ�������� − �� ⋅��ℎ���� ������ = ℎ�������� + 2 (⋅������ − ������ )������
Trong đĩ β là tốc độ học (learning rate, 0 < β < 1). Quá trình cập nhật sẽ được thực hiện đến khi nào hàm mục tiêu đạt được giá trị nhỏ nhất hoặc vượt quá số vịng lặp được quy định trước. Tuy nhiên, để tránh tình trạng mơ hình dự đốn cho kết quả tốt trên tập huấn luyện nhưng cho kết quả thấp trên tập thử nghiệm (overfitting), người ta thêm vào
2.19
Wenzel, 2008),hệtức chínhbậc hĩacủa tổng bình phương chuẩn Frobenius (Bưttchertrận. Theo hàm mục tiêu mới này, giá trị của wuk và hik sẽ được cập nhật theo biểu thức sau:
2.20 2.21
2.5.3.3. Kỹ thuật phân rã ma trận thiên vị
Một lợi thế của hướng tiếp cận phân rã ma trận MF cho lọc cộng tác CF là khả năng linh hoạt của nĩ khi cĩ thêm các điều kiện ràng buộc khác, các điều kiện này cĩ thể liên quan đến quá trình xử lý dữ liệu hoặc đến từng ứng dụng cụ thể. Các đánh giá thực tế đều cĩ những thiên vị về user và item. Cĩ user dễ hay khĩ tính, cũng cĩ những
item được rate cao hơn những item khác chỉ vì user thấy các user khác đã đánh giá item
đĩ cao. Vì thế, kỹ thuật phân rã ma trận thiên vị (Biased matrix factorization - BMF), một biến thể của kỹ thuật MF được đề xuất, theo đĩ giá trị dự đốn sẽ được cộng thêm các giá trị thiên vị hay độ lệch (bias).
Với kỹ thuật BMF, xếp hạng user u cho item i được dự đốn như biểu thức 2.22: 2.22
Trong đĩ:
- µ: giá trị trung bình tồn bộ các rating, được xác định từ tập dữ liệu huấn luyện
|������������ |
-83- bu: độ thiên vị của user u, xác định bởi:
- bi: là |{(thiên��vị của ���������� )| xác=định bởi:
đại lượng gọi là chính tắc hĩa �� (regularization) (Feng et al., 2009) để điều khiển độ lớn các giá trị trong W và H, khi đĩ hàm mục tiêu ������ được biểu diễn như biểu thức 2.19:
������ = � (������ − ������ )2 + ��(‖��‖�� + ‖��‖�� ) (��,��) ∈������������ ������������ = ������������ + ��. (2(������ − ��̂���� )ℎ���� − . λ������������ ) ℎ���������� = ℎ���������� + . (2(������ − ��̂���� )������ − ��. ℎ���������� ) �� ��̂���� = �� + ���� + ���� + � ������ . ℎ���� ��=1 ∑ �����,��,�� ∈������������ � �� = ∑ (�� − ��)���′,��,�� ∈������������ �|��′=��| ���� =
Với λ là sốlà căn tắc hai (0 ≤ λ <1) và ∙‖ ‖2�� là tất cả các phần tử trong ma and
���� = ∑��� ��′,�� , ∈������������ �|��′=��|(�� − ��)
Khi đĩ, hàm mục tiêu của BMF cĩ dạng như biểu thức 2.23:
2.23
Tương tự như kỹ thuật MF, sau khi tối ưu hĩa hàm mục tiêu, ta cũng xác định được các tham số tương ứng và từ đĩ cĩ thể dễ dàng dự đốn kết quả. Thực nghiệm đã cho thấy, trong khá nhiều trường hợp, BMF cho kết quả tốt hơn hẵn so với kỹ thuật MF (Koren et al., 2009; Nguyen-Thai-Nghe et al., 2012).
2.5.3.4. Kỹ thuật phân rã ma trận ba chiều
Trong nhĩm giải thuật CF, kỹ thuật phân rã ma trận (Matrix factorization - MF) là một trong những phương pháp khá thành cơng (state-of-the-art) trong lĩnh vực dự đốn xếp hạng của RS (Koren and Bell, 2011; Koren et al., 2009). Tuy nhiên, kỹ thuật MF chỉ dựa vào sự tương quan giữa user và item để đưa ra dự đốn (User × Item → Rating) mà khơng quan tâm đến yếu tố thời gian khi xây dựng mơ hình gợi ý. Hay nĩi cách khác, các nhĩm giải thuật MF chủ yếu tập trung vào giới thiệu các item phù hợp với user dựa vào tất cả các dữ liệu trong quá khứ của user đĩ, mà khơng xem xét đến yếu tố sở thích của user cĩ thể thay đổi theo thời gian. Chẳng hạn, một số đánh giá khá lâu trước đây sẽ khơng cịn phù hợp với sở thích hiện tại của user.
Trong RS hai chiều, người ta thường biểu diễn dữ liệu vào ma trận user-item do vậy chỉ quan tâm đến user và item chứ khơng quan tâm đến các thơng tin ngữ cảnh (context) bên ngồi cĩ tác động đến quyết định của người dùng hay khơng. Theo nhĩm tác giả Adomavicius and Tuzhilin (2011), thơng tin ngữ cảnh là những thơng tin cĩ thể mơ tả được hồn cảnh của một thực thể, chẳng hạn như thời gian. Với hệ thống gợi ý
(C là thơng tin ngữ cảnh)
Kỹ thuật phân rã ma trận ba chiều (Tensor factorization - TF) là một dạng tổng quát của kỹ thuật phân tích ma trận theo ngữ cảnh (Kolda and Bader, 2009; Dunlavy et
al., 2011). Nếu như MF được biểu diễn bởi dữ liệu cĩ 2 chiều user và item thì TF được
xem là một khối lập phương 3 chiều biểu diễn như Hình 2.11.
Hình 2.11: Minh họa kỹ thuật phân rã ma trận 3 chiều (Dunlavy et al., 2011)
|{(��, �� ′, �� ∈������������ )|�� ′ = ��|}| 2 �� �������� = � ������� − − ���� − ���� − � ������ ℎ���� � + . (‖��‖�� + ‖��‖�� ) ��=1 (��,��) ∈������������
theo ngữ cảnh, hàm dự đốn ��̂ được bổ sung thêm thơng tin ngữ cảnh và biểu diễn thành:
Cho một tensor Z với kích thước U × I × T, với 2 thành phần đầu tiên U và I lần lượt biểu diễn cho ma trận user và item trong kỹ thuật phân rã ma trận (MF). Thành phần thứ ba thể hiện cho ngữ cảnh dự đốn (chẳng hạn thời gian) cĩ kích thước T. Như vậy,
Z cĩ thể được viết lại như biểu thức 2.24:
2.24
nhân Trongtheo RMSEfactors)cách userdụngitemSGD (Stochastic gradient descent)cũng(Koren, 2010). Một minh họa của TF được trình bày trong Hình 2.12.