Phân rã (Decomposition)

Một phần của tài liệu Nghiên cứu giải thuật naїve bayes trong bài toán phân loại văn bản (Trang 55 - 56)

Kỹ thuật phân rã này do Osuna đề xuất [9]. Trong phương pháp giảm đạo hàm, tại một bước lặp, cập nhật cả l thành phần của vector u. Cịn trong kỹ thuật của Osuna, tại mỗi bước lặp, chỉ cĩ một số cố định các thành phần ui là được cập nhật cịn các thành phần khác được giữ khơng đổi:

Chia vector u làm hai phần uB gồm q thành phần (q là một hằng số) và uN là l –

q thành phần cịn lại. Tại mỗi bước chỉ áp SVM cho q mẫu tương ứng với uB để thay đổi giá trị của ui trong uB. Cịn các mẫu tương ứng với uN thì khơng xét đến do

đĩ uN được giữ khơng đổi. Vì q là một hằng số nhỏ được chọn trước (q: 2 … 500) nên cĩ thể áp dụng các phương pháp giải bài tốn QP truyền thống.

Tại các bước tiếp theo chọn một giá trị ui trong uB để thay bằng một giá trị

trong uN, và sau đĩ lại áp dụng bài tốn QP cho uB mới. Tại mỗi bước lặp giá trị của

bài tốn đối ngẫu F(u) tăng dần nên bảo đảm sau một số bước hữu hạn thì đạt giá trị cực đại cần tìm. Và lúc đĩ u là vector hệ số cần tìm.

Cĩ thể thấy rằng phương pháp phân rã tại mỗi lúc chỉ áp dụng bài tốn QP cho một số q (là hằng số) các mẫu nên phương pháp này cĩ thể được áp dụng để giải các bài tốn cĩ số lượng mẫu rất lớn. Tuy chưa cĩ chứng minh lý thuyết về tính

đúng đắn của phương pháp này (để đảm bảo rằng giá trị E(u) tăng đến đúng theo

Luận văn tốt nghiệp Nghiên cu gii thut NB trong bài tốn TC

Trang 51

Một phần của tài liệu Nghiên cứu giải thuật naїve bayes trong bài toán phân loại văn bản (Trang 55 - 56)

Tải bản đầy đủ (PDF)

(68 trang)