Tri-Train cải tiến

Một phần của tài liệu Một giải thuật tri train chỉnh sửa và ứng dụng vào bài toán phân lớp câu hỏi (Trang 25 - 27)

Trong nghiên cứu [10], Nguyễn Trí Thành cùng nhĩm nghiên cứu của mình đã đưa các đề xuất cải thiện cho thuật tốn Tri-Train như sau:

- Đề xuất sử dụng nhiều hơn một giải thuật cho ba bộ phân lớp, với ràng buộc là cho hiệu quả tương tự nhau đối với cả ba bộ phân lớp.

1 2 3

- Đề xuất sử dụng nhiều hơn một khung nhìn, mỗi bộ phân lớp cĩ thể được luyện từ các tập được gán nhãn gốc với với các khơng gian đặc trưng khác nhau.

b)Tri-Train with multiple learning algorithms (Tri-Train được cải tiến với nhiều giải thuật học)

Tri-Train(L,U,Learn1,Learn2,Learn3)

24 4 hi ← Learni(L) 5 e’i ← 0.5; l’i ← 0 6 end for … 25 hi ← Learni (L∪Li); e’i ← ei; l’i ← |Li| …

Trong giả mã thuật tốn trên:

1 2 3 4 5 6

- Learni: là giải thuật phân lớp thứ i

- Các bước thực hiện giống như ở thuật tốn Tri-Train gốc (a), chỉ khác ở chỗ thay vì sử dụng hàm BootstrapSample(L) để tạo ra tập Si, rồi sử dụng thuật tốn Learn để sinh ra bộ phân lớp hi thì ta sử dụng thuật tốn thứ i để tạo ra hi từ tập nguồn L ban đầu.

c) Tri-Train with multiple learning algorithms and views (Train được cải tiến sử dụng nhiều giải thuật và khung nhìn) Tri-

Train(L,U,Learn1,Learn2,Learn3)

for iє{1 .. 3} do

hi ← Learni(Viewi(L)) e’i ← 0.5; l’i ← 0

end for

25 …

hi ← Learni (Viewi(L∪Li)); e’i ← ei; l’i ← |Li|

Trong giả mã thuật tốn trên: - Viewi: là khung nhìn thứ i

- Các bước thực hiện giống như ở thuật tốn Tri -Train được cải tiến với nhiều giải thuật học (b), chỉ khác ở chỗ thay vì sử dụng thuật tốn Learni để tạo ra hi từ tập nguồn L ban đầu thì ta dùng thuật tốn Learni để tạo ra hi từ Viewi của tập nguồn ban đầu L.

Các thực nghiệm của [10] đã sử dụng hai giải thuật SVM và MEM với hai khung nhìn bag-of-word và bag-of-pos&word. Hai bộ phân lớp đầu tiên sử dụng giải thuật thứ nhất và hai khung nhìn khác nhau, bộ phân lớp thứ ba sử dụng giải thuật cịn lại với đặc trưng bag-of-word:

- Bộ phân lớp thứ nhất: giải thuật SVM, đặc trưng bag-of-word. - Bộ phân lớp thứ hai: giải thuật SVM, đặc trưng bag-of-pos&word. - Bộ phân lớp thứ ba: giải thuật MEM, đặc trưng bag-of-word.

Trong đĩ, bag-of-word: là đặc trưng chỉ bao gồm các từ gốc trong câu, bag- of-pos&word: là đặc trưng bao gồm từ gốc và các cấu trúc của nĩ.

Một phần của tài liệu Một giải thuật tri train chỉnh sửa và ứng dụng vào bài toán phân lớp câu hỏi (Trang 25 - 27)

Tải bản đầy đủ (DOCX)

(40 trang)
w