6. Cấu trúc của đề tài
2.2. Phương pháp nhúng đỉnh đồ thị hai phía đề xuất
2.2.3. Tối ưu hóa mơ hình chung
Để nhúng đỉnh mạng đồ thị hai phía mà vẫn bảo tồn các quan hệ trực tiếp và gián tiếp giữa các đỉnh, ta thực hiện kết hợp các hàm mục tiêu thành một hàm tối ưu hóa chung.
𝑚𝑎𝑥𝑖𝑚𝑖𝑧𝑒 𝐿 = 𝛼 log 𝑂2+ 𝛽 log 𝑂3− 𝛾𝑂1 (2.7) với các tham số 𝛼, 𝛽 và 𝛾 là các tham số huấn luyện cần được xác định để kết hợp các thành phần khác nhau trong hàm tối ưu chung.
Để tối ưu hóa mơ hình chung, ta sử dụng thuật toán lặp Stochastic Gradient Ascent (SGA). Do ba thành phần của hàm tối ưu hóa chung có các định nghĩa khác nhau trong quá trình huấn luyện, cần điều chỉnh thuật toán SGA thực hiện bước gradient như sau [14]:
Bước 1: Đối với một quan hệ trực tiếp ngẫu nhiên, ví dụ một cạnh 𝑒i ∈ 𝐸,
trước tiên thực hiện cập nhật các vector nhúng 𝐮i và 𝐯j bằng cách sử dụng SGA để tối đa hóa thành phần 𝐿1 = −𝛾𝑂1. Quy luật cập nhật 𝐮i và 𝐯j như sau:
𝐮i = 𝐮i + 𝜆{𝛾𝑤𝑖𝑗[1 − 𝜎(𝐮𝑖𝑇𝐯𝑗)] ⋅ 𝐯𝑗},
𝐯𝑗 = 𝐯𝑗 + 𝜆{𝛾𝑤𝑖𝑗[1 − 𝜎(𝐮𝑖𝑇𝐯𝑗)] ⋅ 𝐮𝑖}, (2.8)
Bước 2: Sau đó xem các đỉnh 𝑢i và 𝑣j như là các đỉnh trung tâm, để bảo toàn các quan hệ gián tiếp cần sử dụng SGA để tối đa hóa các hàm mục tiêu 𝐿2 = 𝛼 log 𝑂2 và 𝐿3 = 𝛽 log 𝑂3. Cụ thể, với đỉnh trung tâm 𝑢i (hoặc 𝑣j) và đỉnh ngữ cảnh của nó 𝑢c (hoặc 𝑣c), thực hiện cập nhật vector nhúng 𝐮i (hoặc 𝐯𝑗) như sau:
𝐮i = 𝐮i + 𝜆{∑𝑧∈{𝑢𝑐}∪𝑁𝑆𝑛𝑠(𝑢𝑖)𝛼[𝐼(𝑧, 𝑢𝑖) − 𝜎(𝐮𝑖𝑇𝜽𝑧)] ⋅ 𝜽𝑧},
𝐯𝑗 = 𝐯𝑗 + 𝜆 {∑𝑧∈{𝑣𝑐}∪𝑁𝑆𝑛𝑠(𝑣𝑗)𝛽[𝐼(𝑧, 𝑣𝑗) − 𝜎(𝐯𝑗𝑇𝝑𝑧)] ⋅ 𝝑𝑧} (2.9) với 𝐼(𝑧, 𝑢𝑖) là một hàm chỉ thị xác định đỉnh 𝑧 có trong ngữ cảnh của đỉnh 𝑢𝑖 hay không, tương tự với 𝐼(𝑧, 𝑣𝑗). Các vector ngữ cảnh cũng được cập nhật như
𝜽𝑧 = 𝜽𝑧 + 𝜆{𝛼[𝐼(𝑧, 𝑢𝑖) − 𝜎(𝐮𝑖𝑇𝜽𝑧)] ⋅ 𝐮𝑖},
𝝑𝑧 = 𝝑𝑧 + 𝜆{𝛽[𝐼(𝑧, 𝑣𝑗) − 𝜎(𝐯𝑗𝑇𝝑𝑧)] ⋅ 𝐯𝑗} (2.10) Các vector nhúng thu được chính là kết quả phép nhúng học biểu diễn các đỉnh của mạng đồ thị hai phía cần thực hiện.
2.3. Kết luận
Việc tạo hai bộ ngữ liệu cho hai loại tập đỉnh và tối ưu hóa mơ hình chung là hai q trình quan trọng của phương pháp nhúng đỉnh mạng đồ thị đang xem xét. Các bộ ngữ liệu được tạo ra từ việc áp dụng bước đi ngẫu nhiên như đối với các mạng đồ thị đồng nhất, với sự cải tiến là độ dài mỗi lần bước là không cố định phù hợp với mơ hình thực tế. Q trình mơ hình hóa các mối quan hệ gián tiếp sau khi có hai bộ ngữ liệu được thực hiện tương tự như các phương pháp nhúng trong xử lý ngôn ngữ tự nhiên. Q trình các bước tối ưu hóa chung các thành phần đã bảo toàn được cả đặc trưng quan hệ trực tiếp và quan hệ gián tiếp giữa các đỉnh, đảm bảo được độ chân thực gần nhất sau khi phục dựng lại các phép nhúng đã học so với mạng đồ thị hai phía ban đầu.
CHƯƠNG 3. HỆ THỐNG KHUYẾN NGHỊ VÀ CÁC ĐỘ ĐO ĐÁNH GIÁ HỆ THỐNG KHUYẾN NGHỊ
Mục tiêu chính của chương này trình bày những vấn đề tổng quan về hệ thống khuyến nghị, giới thiệu các hướng tiếp cận phổ biến trong xây dựng hệ thống khuyến nghị cũng như tìm hiểu các phương pháp đánh giá hiệu quả của một hệ thống khuyến nghị. Từ những nghiên cứu này sẽ lựa chọn phương pháp phù hợp để áp dụng vào việc xây dựng hệ thống khuyến nghị thực tế ở phần tiếp theo.