Phõn lớp dữ liệu tuyến tớnh và khụng tuyến tớnh

Một phần của tài liệu Nghiên cứu phương pháp nhận dạng chữ viết tay hạn chế bằng mô hình SVM (Support Vector Machines) (Trang 42 - 44)

a. Trƣờng hợp dữ liệu cú thể phõn chia tuyến tớnh đƣợc.

Việc huấn luyện SVM với mục đớch là để tỡm ra cỏc support vectors và MMH. MMH là ranh giới phõn chia tuyến tớnh giữa cỏc lớp và vỡ thế SVM tƣơng ứng cú thể đƣợc sử dụng để phõn lớp dữ liệu mà dữ liệu đú cú thể phõn chia tuyến tớnh. Chỳng ta xem SVM đƣợc huấn luyện là SVM tuyến tớnh.

Sau khi huấn luyện SVM, chỳng ta sẽ phõn loại cỏc bộ mới. Theo Jiawei Han and Micheline Kamber, ta dựa trờn cụng thức Lagrangian nhƣ sau:

Trong đú:

- yi là nhón lớp của support vector Xi

- XT là một bộ test

- α (nhõn tử Lagrangian)

- b0 là biến số đƣợc xỏc định bởi sự tối ƣu húa hay cỏc thuật toỏn SVM - l là số lƣợng cỏc support vectors.

MMH cú thể đƣợc xem nhƣ “ranh giới quyết định” trong việc quyết định xem một bộ test bất kỳsẽ thuộc vào lớp nào. Cho một bộ test XT, chỳng ta gắn nú vào phƣơng trỡnh trờn, và sau đú kiểm tra dấu của kết quả. Từ đú ta sẽ biết đƣợc bộ test sẽ rơi vào mặt nào của siờu phẳng. Nếu dấu là dƣơng, thỡ XT rơi vào phớa trờn của MMH, và SVM đoỏn rằng XT thuộc về lớp +1. Nếu dấu là õm, thỡ XT nằm tại hoặc dƣới MMH và nhón lớp đƣợc đoỏn là -1.

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

b. Trƣờng hợp dữ liệu khụng thể phõn chia tuyến tớnh đƣợc.

Trong phần trờn chỳng ta đề cập đến trƣờng hợp SVM phõn lớp những dữ liệu cú thế phõn chia tuyến tớnh, nhƣng nếu dữ liệu khụng thể phõn chia tuyến tớnh thỡ trong trƣờng hợp này khụng cú đƣờng thẳng nào cú thể vẽ đƣợc để phõn chia cỏc lớp này. SVM tuyến tớnh mà chỳng ta đó học thỡ khụng đem lại lời giải khả thi trong trƣờng hợp này.

Hỡnh 2.8.Trường hợp trờn khụng gian 2 chiều khụng thể vẽ một đường

thẳng phõn chia 2 lớp.

Tuy nhiờn hƣớng tiếp cận của SVM tuyến tớnh cú thể đƣợc mở rộng để tạo ra SVM khụng tuyến tớnh cho việc phõn lớp cỏc dữ liệu khụng thể phõn chia tuyến tớnh (hay gọi tắt là dữ liệu khụng tuyến tớnh). Những SVM nhƣ vậy cú khả năng tỡm những ranh giới quyết định khụng tuyến tớnh (những mặt khụng tuyến tớnh) trong khụng gian đầu vào.

Chỳng ta thu đƣợc SVM phi tuyến bằng cỏch mở rộng SVM tuyến tớnh nhƣ sau. Cú hai bƣớc chớnh:

- Bƣớc 1: Ta chuyển dữ liệu nguồn lờn một khụng gian nhiều chiều hơn bằng cỏch sử dụng ỏnh xạ phi tuyến. Một vài ỏnh xạ phi tuyến thụng thƣờng cú thể đƣợc sử dụng để thực hiện bƣớc này.

- Bƣớc 2: Tỡm những siờu phẳng trong khụng gian mới này. Cuối cựng chỳng ta lại quay lại vấn đề tối ƣu bỡnh phƣơng đó đƣợc giải quyết sử dụng cụng thức SVM tuyến tớnh. Siờu phẳng cú biờn độlớn nhất đƣợc tỡm thấy trong khụng gian mới tƣơng ứng với siờu bề mặt phõn chia khụng tuyến tớnh trong khụng gian ban đầu.

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Một phần của tài liệu Nghiên cứu phương pháp nhận dạng chữ viết tay hạn chế bằng mô hình SVM (Support Vector Machines) (Trang 42 - 44)