Chiến lược One-against-One (OAO)

Một phần của tài liệu Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng (Trang 36 - 38)

5. Bố cục luận văn

3.5.2Chiến lược One-against-One (OAO)

Trong chiến lược này ta sử dụng n(n-1)/2 bộ phân loại hai lớp được xây dựng bằng cách bắt cặp từng hai lớp một và sử dụng phương pháp lựa chọn theo đa số để kết hợp các bộ phân loại này để xác định được kết quả phân loại cuối cùng. Số lượng các bộ phân loại là n(n-1)/2.

So với chiến lược OAR thì chiến lược này ngoài ưu điểm giảm bớt vùng không thể phân loại mà còn làm tăng độ chính xác của việc phân loại. Trong chiến lược OAR ta phải

xây dựng một siêu phẳng để tách một lớp ra khỏi các lớp còn lại, việc này đòi hỏi sự phức tạp và có thể không chính xác. Tuy nhiên trong chiến lược OAO ta chỉ cần phân tách một lớp ra khỏi một lớp khác mà thôi.

Chiến lược OAR chỉ cần n-1 bộ phân loại cho n lớp. Trong khi đó chiến lược OAO lại cần đến n(n-1)/2 bộ phân loại. Nhưng số mẫu huấn luyện cho từng bộ phân loại trong OAO lại ít hơn và việc phân loại cũng đơn giản hơn. Vì vậy chiến lược OAO có độ chính xác cao hơn nhưng chi phí để xây dựng lại tương đương với chiến lược OAR

Hàm quyết định phân lớp của lớp i đối với lớp j trong chiến lược OAO là: Dij(x) = wtijx + bij

Dij(x) = − Dij(x)

Đối với một véc tơ x ta tính : Di(x) = .q#/,q01sign(Dij(x))

Với sign(x) = 1 với x > 0 hoặc 0 với x<= 0

Hình 3.8 Ví dụ phân lớp sử dụng chiến lược OAO

Trong hình 3.8, chiến lược OAO phải xây dựng siêu phẳng để tách lớp đánh dấu “o” ra khỏi tất cả các lớp khác. Ở trong hình vẽ, bằng sự kết hợp của 5 siêu phẳng,

không gian các giá trị lớp “o” được xác định. Số lượng siêu phẳng để có thể phân biệt 6 lớp như trong hình 3.8 với chiến lược OAR là 15 siêu phẳng. Số lượng siêu phẳng cần thiết để giải bài toán phân lớp khi sử dụng chiến lược OAR sẽ nhiều hơn số lượng siêu phẳng cần khi sử dụng chiến lược OAO. Do đó, thời gian đưa ra kết quả cũng sẽ cần nhiều hơn. Tuy nhiên, chiến lược OAO với việc sử dụng nhiều siêu phẳng hơn, miền không gian của mỗi lớp sẽ có độ chính xác cao hơn nên kết quả thu được sau phân lớp cũng cho độ chính xác tốt hơn việc sử dụng chiến lược OAR.

Với bài toán phân loại đơn xin việc trong luận văn, tác giả đã lựa chọn chiến lược phân loại OAO và sử dụng thư viện LibSVM trong quá trình thực nghiệm.

Một phần của tài liệu Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng (Trang 36 - 38)