Để thuận lợi cho việc trình bày, trong phần này chúng tôi tóm tắt về
phương pháp học đa nhiệm trước khi chuyển sang trình bày vềđể xuất sử dụng học đa nhiệm dựa trên Boosting cho bài toán lọc cộng tác.
Hầu hết các phương pháp học máy cho lọc cộng tác hiện nay đều thực hiện những nhiệm vụ học đơn lẻ. Kết quả của mỗi nhiệm vụ cụ thể hoàn toàn
độc lập với các nhiệm vụ khác. Trên thực tế, kết quả của mỗi bài toán phân loại cho từng người dùng không hoàn toàn độc lập nhau, kết quả của bài toán phân loại này có thể được dùng làm ví dụ huấn luyện cho bài toán phân loại khác. Chẳng hạn, ta có thể sử dụng kết quả phương pháp học nhận ra quả táo để áp
dụng cho việc học nhận ra quả lê, sử dụng phương pháp học chơi đàn Violin để
học cách chơi đàn Organ. Để thực hiện điều này, trước khi thực hiện nhiệm vụ
nào đó ta thường nhớ lại và chuyển giao những tri thức nhận được để thực hiện những nhiệm vụ khác.
Phương pháp học máy thực hiện đồng thời từ nhiều nhiệm vụ liên quan
để nâng cao kết quả dựđoán được gọi là phương pháp học đa nhiệm [3, 48, 81, 87]. Bằng việc suy diễn đồng thời giữa các nhiệm vụ, học đa nhiệm phát hiện ra những tri thức từ nhiều nhiệm vụ để tăng cường vào kết quả dựđoán cho mỗi nhiệm vụđơn lẻ. Với những bài toán có số lượng nhiệm vụ lớn nhưng có số ví dụ huấn luyện ít, học đa nhiệm nâng cao kết quả dựđoán cho mỗi nhiệm vụ bằng cách chia sẻ thông tin chung giữa các nhiệm vụ.
Hình 2.2 mô tả phương pháp học đơn lẻ cho bốn bài toán phân loại với ma trận đầu vào được cho trong Bảng 3.3. Mỗi bài toán phân loại được xem xét như một nhiệm vụ cần dựđoán. Mỗi nhiệm vụ được biểu diễn như một đồ thị, trong đó các cạnh nối từđỉnh người dùng ui đến đỉnh sản phẩm pj được đánh trọng số là giá trị đặc trưng tương ứng. Các cạnh nối từ đỉnh sản phẩm đến
đỉnh nhiệm vụ tương ứng (Task1, Task2, Task3, Task4) được đánh trọng số là các nhãn phân loại, trọng số được đánh dấu “?” là nhãn chưa biết cần được dự đoán.
Trong ví dụ này, bài toán phân loại cho các người dùng khác nhau được tiến hành huấn luyện độc lập nhau trên cùng một tập thông tin vào. Kết quả
mỗi bài toán phân loại là tập các nhãn đầu ra cho các sản phẩm chưa được người dùng đánh giá. Quá trình huấn luyện và dựđoán không xử lý bất kỳ mối quan hệ nào giữa các nhiệm vụ. Điều này làm cho các phương pháp học đơn lẻ
p1 p2 p3 p4 p5
u1 u2 u3 u4
Task1:Bài toán phân loại cho người dùng u1 +1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1 -1 +1 -1 +1 -1 ? +1 +1 p1 p2 p3 p4 p5 u1 u2 u3 u4
Task2:Bài toán phân loại cho người dùng u2 +1 +1 -1 +1 +1 +1 +1 -1 +1+1-1 -1 +1 -1 ? +1 +1 -1 ? p1 p2 p3 p4 p5 u1 u2 u3 u4
Task3:Bài toán phân loại cho người dùng u3 +1 +1 -1 +1 +1 +1 +1 -1 +1+1-1 -1 +1 -1 +1 +1 -1 ? -1 p1 p2 p3 p4 p5 u1 u2 u3 u4
Task4:Bài toán phân loại cho người dùng u4 +1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1 -1 +1 -1 +1 -1 +1 ? ?
Hình 2.2. Phương pháp STL cho bốn bài toán phân loại độc lập nhau.
Hình 2.3. Phương pháp học MTL cho bốn bài toán phân loại đồng thời
Trái lại, phương pháp học đa nhiệm tiến hành thực hiện huấn luyện đồng thời cho các nhiệm vụ (Hình 2.3). Các nhiệm vụ chia sẻ các giá trịđặc trưng và kết quả huấn luyện thông qua một lớp ẩn. Lớp ẩn được xây dựng từ việc xử lý
các mối quan hệ giữa các nhiệm vụđể tăng cường cho các nhiệm vụđơn lẻ. Đây cũng là trọng tâm nghiên cứu của học đa nhiệm.
Nhiều đề xuất xem xét mối liên hệ giữa các nhiệm vụ trong học đa nhiệm. Hướng tiếp cận phổ biến xem xét các mối liên hệ như những ràng buộc cứng biết trước để thực hiện quá trình huấn luyện. Những đề xuất khác xem xét các nhiệm vụ chia sẻ với nhau thông qua một phần của tham biến [13]. Trong mục tiếp theo, chúng tôi xem xét các bài toán phân loại chia sẻ với nhau thông qua một tập các giá trị đặc trưng chung và tìm chiến lược tối ưu phương pháp dự đoán dựa trên giá trị của các đặc trưng chung.