Siêu phẳng với lề cực đại cho một SVM phân tách dữ liệu thuộc hai lớp

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số mô hình học máy trong phân loại câu hỏi (Trang 40 - 43)

trên siêu phẳng H1, và thỏa mãn phương trình w.xi + b +1 thì nằm trên siêu phẳng H2.

Gọi x0 là một điểm nằm trên siêu phẳng H và x1 là điểm nằm trên siêu phẳng H1. Như vậy, (x0-x1 ) vuơng gĩc với 2 siêu phẳng này. Các điểm này thỏa mãn hệ phương trình sau:

Lấy hai đẳng thức của (2.12) trừ cho nhau, ta được:

Vì vuơng gĩc với siêu phẳng H và w cũng vuơng gĩc với siêu phẳng H, do đĩ và w song song với nhau, như vậy một dữ liệu mới thêm vào thỏa mãn:

Từ cơng thức (3.13) và (3.14) ta cĩ được khoảng cách giữa siêu phẳng H và H1 là:

Tương tự như vậy, gọi x0 là một điểm nằm trên siêu phẳng H và x2 là điểm nằm trên siêu phẳng H2. Ta cĩ hệ phương trình sau:

Như vậy, khoảng cách giữa siêu phẳng H và H2 là:

Từ (2.15) và (2.17) suy ra, khoảng cách phân hoạch giữa siêu phẳng H1 và H2 là .

Do đĩ, để cĩ biên lớn nhất thì phải nhỏ nhất hay nĩi cách khác là giải bài tốn tối ưu tìm với ràng buộc gi(x)= yi(w.xi + b) 1 với i=1,2,…,n.

Để giải bài tốn tối ưu tìm với ràng buộc gi(x)=yi(w.xi + b) 1 với i=1,2,…,n. Ta đưa về phương trình Lagrange, bài tốn trên trở thành:

Trong đĩ 0} là các nhân tử Lagrange. Khi đĩ, tất cả các điểm khơng nằm trên lề nghĩa là đều khơng ảnh hưởng đến giá trị hàm mục tiêu vì ta cĩ thể chọn .

Áp dụng điều kiện Karush–Kuhn–Tucker, vector w được tính theo cơng thức sau:

Để dữ liệu cĩ thể tách rời tuyến tính, khơng gian đặc trưng nên được ánh xạ vào khơng gian nhiều chiều. Việc ánh xạ được thực hiện bởi một hàm hạt nhân.

Cho hàm hạt nhân trong đĩ cĩ 2 điểm từ khơng gian đầu vào và ánh xạ nĩ đến 1 số thực chỉ ra độ tương tự của nĩ. Với mọi điểm , hàm hạt nhân thỏa mãn:

Trong đĩ được ánh xạ từ khơng gian đầu vào X đến một điểm dữ liệu của khơng gian đặc trưng H.

Để ứng dụng hàm hạt nhân trong phân lớp SVM, cơng thức (2.18) được viết lại như sau:

Với là hạt nhân đo độ tương tự giữa . Cơng thức (2.21) cĩ thể được viết lại dưới dạng sau:

Cĩ 4 loại hàm hạt nhân được giới thiệu: linear, popynomial, radial basis và sigmoid. Loại đơn giản nhất là hàm hạt nhân tuyến tính cho hai câu hỏi được xác định như sau:

Áp dụng SVM vào phân loại câu hỏi

(1) Thiết kế mơ hình cây phân cấp cho tập lớp câu hỏi.

(2) Xây dựng tập dữ liệu mẫu đã được gán nhãn cho từng loại câu hỏi. Trong bước này, cần lựa chọn đặc trưng để biểu diễn câu hỏi.

Sau khi xây dựng được tập các lớp câu hỏi cùng với tập dữ liệu sẽ tiến hành “học”. Mơ hình học như sau:

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số mô hình học máy trong phân loại câu hỏi (Trang 40 - 43)

Tải bản đầy đủ (PDF)

(61 trang)