CHƢƠNG 2 LỌC CỘNG TÁC BẰNG PHƢƠNG PHÁP HỌC ĐA NHIỆM
2.3. PHÂN LOẠI VỚI CÁC ĐẶC TRƢNG CHUNG
2.3.1. Phƣơng pháp học đa nhiệm
Để thuận lợi cho việc trình bày, trong phần này chúng tôi tóm tắt về phƣơng pháp học đa nhiệm trƣớc khi chuyển sang trình bày về để xuất sử dụng học đa nhiệm dựa trên Boosting cho bài toán lọc cộng tác.
Hầu hết các phƣơng pháp học máy cho lọc cộng tác hiện nay đều thực hiện những nhiệm vụ học đơn lẻ. Kết quả của mỗi nhiệm vụ cụ thể hoàn toàn độc lập với các nhiệm vụ khác. Trên thực tế, kết quả của mỗi bài toán phân loại cho từng ngƣời dùng không hoàn toàn độc lập nhau, kết quả của bài toán phân loại này có thể đƣợc dùng làm ví dụ huấn luyện cho bài toán phân loại khác. Chẳng hạn, ta có thể sử dụng kết quả phƣơng pháp học nhận ra quả táo để áp
dụng cho việc học nhận ra quả lê, sử dụng phƣơng pháp học chơi đàn Violin để học cách chơi đàn Organ. Để thực hiện điều này, trƣớc khi thực hiện nhiệm vụ nào đó ta thƣờng nhớ lại và chuyển giao những tri thức nhận đƣợc để thực hiện những nhiệm vụ khác.
Phƣơng pháp học máy thực hiện đồng thời từ nhiều nhiệm vụ liên quan để nâng cao kết quả dự đoán đƣợc gọi là phƣơng pháp học đa nhiệm [3, 48, 81, 87]. Bằng việc suy diễn đồng thời giữa các nhiệm vụ, học đa nhiệm phát hiện ra những tri thức từ nhiều nhiệm vụ để tăng cƣờng vào kết quả dự đoán cho mỗi nhiệm vụ đơn lẻ. Với những bài toán có số lƣợng nhiệm vụ lớn nhƣng có số ví dụ huấn luyện ít, học đa nhiệm nâng cao kết quả dự đoán cho mỗi nhiệm vụ bằng cách chia sẻ thông tin chung giữa các nhiệm vụ.
Hình 2.2 mô tả phƣơng pháp học đơn lẻ cho bốn bài toán phân loại với ma trận đầu vào đƣợc cho trong Bảng 3.3. Mỗi bài toán phân loại đƣợc xem xét nhƣ một nhiệm vụ cần dự đoán. Mỗi nhiệm vụ đƣợc biểu diễn nhƣ một đồ thị, trong đó các cạnh nối từ đỉnh ngƣời dùng ui đến đỉnh sản phẩm pj đƣợc đánh trọng số là giá trị đặc trƣng tƣơng ứng. Các cạnh nối từ đỉnh sản phẩm đến đỉnh nhiệm vụ tƣơng ứng (Task1, Task2, Task3, Task4) đƣợc đánh trọng số là các nhãn phân loại, trọng số đƣợc đánh dấu ―?‖ là nhãn chƣa biết cần đƣợc dự đoán.
Trong ví dụ này, bài toán phân loại cho các ngƣời dùng khác nhau đƣợc tiến hành huấn luyện độc lập nhau trên cùng một tập thông tin vào. Kết quả mỗi bài toán phân loại là tập các nhãn đầu ra cho các sản phẩm chƣa đƣợc ngƣời dùng đánh giá. Quá trình huấn luyện và dự đoán không xử lý bất kỳ mối quan hệ nào giữa các nhiệm vụ. Điều này làm cho các phƣơng pháp học đơn lẻ cho lại kết quả thấp trong trƣờng hợp có ít dữ liệu huấn luyện.
p1 p2 p3 p4 p5
u1 u2 u3 u4
Task1:Bài toán phân loại cho người dùng u1
+1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1-1 +1 -1 +1 -1 ? +1 +1 p1 p2 p3 p4 p5 u1 u2 u3 u4
Task2:Bài toán phân loại cho người dùng u2
+1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1-1 +1 -1 ? +1 +1 -1 ? p1 p2 p3 p4 p5 u1 u2 u3 u4
Task3:Bài toán phân loại cho người dùng u3
+1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1-1 +1 -1 +1 +1 -1 ? -1 p1 p2 p3 p4 p5 u1 u2 u3 u4
Task4:Bài toán phân loại cho người dùng u4
+1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1-1 +1 -1 +1 -1 +1 ? ?
Hình 2.2. Phương pháp STL cho bốn bài toán phân loại độc lập nhau.
Hình 2.3. Phương pháp học MTL cho bốn bài toán phân loại đồng thời
Trái lại, phƣơng pháp học đa nhiệm tiến hành thực hiện huấn luyện đồng thời cho các nhiệm vụ (Hình 2.3). Các nhiệm vụ chia sẻ các giá trị đặc trƣng và kết quả huấn luyện thông qua một lớp ẩn. Lớp ẩn đƣợc xây dựng từ việc xử lý
các mối quan hệ giữa các nhiệm vụ để tăng cƣờng cho các nhiệm vụ đơn lẻ. Đây cũng là trọng tâm nghiên cứu của học đa nhiệm.
Nhiều đề xuất xem xét mối liên hệ giữa các nhiệm vụ trong học đa nhiệm. Hƣớng tiếp cận phổ biến xem xét các mối liên hệ nhƣ những ràng buộc cứng biết trƣớc để thực hiện quá trình huấn luyện. Những đề xuất khác xem xét các nhiệm vụ chia sẻ với nhau thông qua một phần của tham biến [13]. Trong mục tiếp theo, chúng tôi xem xét các bài toán phân loại chia sẻ với nhau thông qua một tập các giá trị đặc trƣng chung và tìm chiến lƣợc tối ƣu phƣơng pháp dự đoán dựa trên giá trị của các đặc trƣng chung.