Trong mã giả của phương pháp EMDD (Hình 2.5), 𝑘 là số túi khác nhau được sử dụng cho khởi đầu của phương pháp EMDD. Xác suất Pr(𝐵𝑖𝑗𝜖ℎ) được tính như sau:
Pr(𝐵𝑖𝑗𝜖ℎ) = 𝑒𝑥𝑝 [− ∑𝑛𝑑=1(𝑠𝑑(𝐵𝑖𝑗𝑑 − ℎ𝑑))2] (2.15) Xác suất Pr(𝑙𝑖 | ℎ, 𝑝𝑖∗) được tính bằng:
hoặc
Pr(𝑙𝑖 | ℎ, 𝑝𝑖∗) = 𝑒𝑥𝑝[−(𝑙𝑖 − 𝑃𝑟(𝑝𝑖∗𝜖ℎ))2] (2.17) Xác suất 𝑃𝑟(𝑝𝑖∗𝜖ℎ) được tính như sau:
𝑃𝑟(𝑝𝑖∗𝜖ℎ) = max
𝐵𝑖𝑗𝜖𝐵𝑖Pr (𝐵𝑖𝑗𝜖ℎ) (2.18)
2.3.3. Phương pháp MISVM
Stuart Andrews và cộng sự đề xuất phương pháp MISVM [3] giải bài toán đa thể hiện trên cơ sở phát triển từ phương pháp máy véc tơ hỗ trợ SVM. Đặc điểm của bài toán đa thể hiện: một túi được gán nhãn “dương” nếu túi đó chứa ít nhất một thể hiện “dương”, túi được gán nhãn “âm” nếu tất cả thể hiện trong túi là “âm”. Ý tưởng chính của đề xuất là chuyển đổi thiết lập dữ liệu đa thể hiện thành thiết lập dữ liệu đơn thể hiện, trong đó gán nhãn của các túi dương cho các thể hiện bên trong túi đó, và nhãn của các thể hiện trong các túi âm đều là nhãn âm. Mục tiêu là xây dựng một siêu phẳng giữa hai lớp sao cho khoảng cách từ siêu phẳng đến các điểm (thể hiện) gần siêu phẳng nhất của hai lớp đạt cực đại.
Ta có tập dữ liệu huấn luyện với cặp thể hiện - nhãn (𝑥𝑖, 𝑦𝑖) ∈ 𝑅𝑑 × 𝑌. Xây dựng hàm ánh xạ 𝑓: 𝑅𝑑 → 𝑌, trong đó 𝑌 = {−1,1}. Các thể hiện được nhóm thành các túi, mỗi túi sẽ được gán tương ứng một nhãn (không phải thể hiện nào cũng có nhãn). Ta có tập các thể hiện 𝑥1, 𝑥2, … , 𝑥𝑛 được nhóm thành các túi 𝐵1, … , 𝐵𝑚, với 𝐵𝐼 = {𝑥𝑖: 𝑖 ∈ 𝐼}, 𝐼 ⊆ {1,2, … , 𝑛}. Mỗi túi 𝐵𝐼 được gán một nhãn 𝑌𝐼. Trong đó, nếu 𝑌𝐼 = −1 thì 𝑦𝑖 = −1 ∀𝑖 ∈ 𝐼 và không có thể hiện dương nào trong túi 𝐵𝐼. Ngược lại, nếu 𝑌𝐼 = 1 thì tồn tại ít nhất một 𝑥𝑖 ∈ 𝐵𝐼 với 𝑦𝑖 = 1. Với lưu ý, nhãn của túi âm là nhãn chung cho tất cả các thể hiện trong túi đó, với túi dương chỉ có thể biết được có ít nhất một thể hiện có nhãn dương. Thông thường, có thể xác định được mối quan hệ giữa nhãn 𝑦𝑖 của thể hiện với nhãn 𝑌𝐼 của túi bằng cách tính 𝑌𝐼 = max
𝑖∈𝐼 𝑦𝑖 hoặc bằng ràng buộc tuyến tính sau: ∑ 𝑦𝑖+1
2
𝑖∈𝐼 ≥ 1, ∀𝐼 sao cho 𝑌𝐼 = 1 và 𝑦𝑖 = −1, ∀𝐼 sao cho 𝑌𝐼 = −1 (*) Xây dựng hàm phân tách đa thể hiện (MI-separating) 𝑓: 𝑋 → 𝑅 đối với tập dữ liệu đa thể hiện nếu 𝑠𝑔𝑛 max