Quá trình sử dụng LibSVM

Một phần của tài liệu Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng (Trang 39 - 41)

5. Bố cục luận văn

3.7Quá trình sử dụng LibSVM

Để sử dụng LibSVM, cần chuẩn bị dữ liệu cho quá trình huấn luyện và thử nghiệm. Dữ liệu dùng để huấn luyện và thử nghiệm được lưu trong các tâp tin sao cho mỗi hàng trong tập tin là một mẫu với các thông tin được trình bày theo dạng:

< nhãn > <đặc trưng 1>:<giá trị 1> <đặc trưng2>:<giá trí 2> ….. Trong đó :

- <nhãn> là một giá trị xác định nhãn của lớp, với bài toán phân lớp nó là một số nguyên, đối với hồi quy nó là một số thực bất kỳ

- Mỗi cặp <đặc trưng>:<giá trị> tương ưng một đặc trưng, giá trị <đặc trưng> la một số nguyên bắt đầu từ 1 và <giá trị> là một số thực. LibSVM có một số lệnh cho phép đọc dữ liệu từ tập tin và chuẩn hoá dữ liệu vào như libsvmread, svm_scale ….

Sau khi chuẩn bị dữ liệu, quá trình sử dụng LibSVM gồm 2 bước: Ø Bước 1: Huấn luyện (training)

Sử dụng một tập hợp dữ liệu để huấn luyện :

svm-train [tham số] [tệp huấn luyện] [tệp mô hình]

Trong đó :

- [tham số] : tham số cho phép người dùng lựa chọn các công thức SVM khác nhau, các lớp hàm nhân khác nhau cùng với các thuộc tính cho các hàm nhân

- [tệp huấn luyện] : tệp tin chứa dữ liệu để huấn luyện

- [tệp mô hình] : tệp tin chứa mô hình huấn luyện. Mô hình huấn luyện là một cấu trúc bao gồm các tham số:

§ Số lượng các lớp § Tổng số véc tơ hỗ trợ

§ Các tham số w, -b trong phương trình wx-b § Nhãn cho mỗi lớp

Ø Bước 2: Thử nghiệm mô hình (testing) :

Sử dụng mô hình (ở bước 1) để dự đoán thông tin của một tệp dữ liệu

svm-predict [tham số] [tệp kiểm tra] [tệp mô hình] [tệp đầu ra]

Trong đó :

Ø [tham số] : -b 0 hoặc –b 1 để dự đoán ước lượng xác suất Ø [tệp kiểm tra] : tệp tin chứa dữ liệu thử nghiệm

Ø [tệp mô hình] : mô hình được tạo ra khi huấn luyện

Ø [tệp đầu ra] : tệp tin chứa kết quả của quá trình thực nghiệm bao gồm : § Độ chính xác véc tơ (phân lớp), hệ số lương quan bình phương (hồi

quy)

§ Ma trận chứa các giá trị quyết định hoặc xác suất ước tính § Nhãn dự đoán cho mỗi đặc trưng

CHƯƠNG 4 : Chương trình thc nghim

Một phần của tài liệu Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng (Trang 39 - 41)