SVM cho bài toán phân đa lớp

SVM là một máy phân loại hai lớp,tuy nhiên trong thực tếchúng ta phải giải quyết cho các bài toán đa lớp. Từ đó đặt ra yêu cầu xây dựng các bộ phân loại nhiều lớp trên cơ sở SVM, hay ta gọi là đa lớp SVM.

Một cách tiếp cận thường sửdụnglà dùng kbộ nhận dạng SVM để giải quyết bài toán phân loại k lớp.Trong mô hình này,SVM thứ k, hay hàm nhận dạng SVM yk(x) dùng để nhận dạng mẫu x có thuộc lớp thứ k bằng cách huấn luyện như sau: đánh dấu mẫu thuộc lớp k là dương và các mẫu thuộc (k-1) lớp còn lại là âm. Điều này được biết nhưcách tiếp cận one- versus-the-rest(OVR).Trong mô hình này có điều dễ nhận thấy là huấn luyện không cân bằng, về mặt tổng thể, ta đang dùng một lớp dương có x phần tử và lớp ấm có (k-1)*x phần tử. Ví dụ trong trường hợp phân 10 lớp, tập dữ liệu được chia gồm 90% mẫu âm và chỉ có 10% mẫu dương, và sự đối xứng của vấn đề huấn luyện trong SVM bị mất.

Cách tiếp cận khác là dùng K(K-1)/2 bộ SVM để phân biệt k lớp, SVM(i,j)dùng để phân loại lớp i và lớp j, hay chính xác hơn chỉ để trả lời câu hỏi có thuộc lớp i không, thuộc phương pháp này do Jonh Platt và Nello Cristianini [17]đưa ra và thường được gọi là gọi là

one-versus-one (OVO).Theo cách này, các lớp không phải kết quả sẽ được loại trừ dần. Với 2 lớp i, j ta sẽ dùng SVM(i,j)để phân tách chúng, tạo dữ liệu huấn luyện tương ứng là +1 cho lớp i, và -1 cho lớp j. Trong phương pháp VOV, nếu mẫu thử cho kết quả âm thì không kết luận ngay mà chỉ làm căn cứ loại trừ nó không thuộc lớp đó và tiến hành tiếp, kết quả cuối cùng sẽ trên căn cứ kết quả bầu chọn của nhiều bộ phân loại.Các bước của OVO có thể được minh họa như Hình 3.5.

Hình 3.5. Minh họa các bước nhận dạng bằng OVO

Cách huấn luyện này đòi hỏi số lượng SVM lớn, thời gian huấn luyện lớn hơn so với OVR.Trong thực tế, phương pháp OVO được sử dụng phổ biến với độ chính xác cao, các tác giả trong [16] đã một thực nghiệm đưa ra để so sánh các phương pháp và đưa ra nhận định tương tự.

Tổng kết chƣơng 3

Trong chương này, chúng tôi tập trung tìm hiểu lý thuyết cơ bản của SVM. Do mục tiêu của luận văn là trên cơ sở SVM để đề xuất thuật toán nhận dạng cho chữ Nôm, không cải tiến thuật toán SVM, do đó chúng tôi không đi quá sâu vào lý thuyết SVM mà chỉ tiếp cận ở mức độ ý tưởng và các phương pháp giải quyết trong SVM. Trên cơ sở nghiên cứu SVM, chương này tìm hiểu kỹ về phần ứng dụng SVM cho bài toán phân đa lớp, vốn là một trong những hướng nghiên cứu đang còn được quan tâm rất nhiều của SVM. Quá trình tìm hiểu cũng đã làm rõ được một số mô hình đa lớp SVM cho kết quả cao và được áp dụng nhiều trong thực tế, để làm căn cứu vì sao chúng tôi chọn mô hình OVO để đưa vào giải thuật đề xuất của mình.

Chƣơng 4. GIẢI THUẬT KSVM CHO NHẬN DẠNG CHỮ NÔM

Bài toán nhận dạng chữ Nôm

Giải thuậtKSVM cho nhận dạng chữ Nôm