Mục tiêu

Một phần của tài liệu Nhận dạng chữ Nôm bằng máy véc - tơ hỗ trợ (SVM) (Trang 50)

Phần thực nghiệm của luận văn nhằm làm rõ các vấn đề:

- Cài đặt Demo quy trình nhận dạng chữ Nôm của đề tài, triển khai các thuật toán trích chọn đặc trưng trọng số vùng, giải thuật nhận dạng KSVM, tiến hành chạy và đánh giá với kho dữ dữ liệu NOM-DB0.

- Đánh giá về ảnh hưởng kích thước ảnh đầu vào với độ chính xác của bộ nhận dạng chữ Nôm. Việc xác định kích thước ảnh tối thiểu cho mỗi ký tự để làm đầu vào huấn luyện cho bộ nhận dạng là một trong những yếu tố cần được làm rõ vì nó ảnh hưởng trực tiếp tới chất lượng của bộ nhận dạng. Mặt khác, do độ phức tạp trong cấu tạo của chữ Nôm so với chữ Hán, nên cần có những thực nghiệm để đưa ra số liệu để hỗ trợ các nghiên cứu sau này.

- Đánh giá ảnh hưởng kích thước lưới nào trong phương pháp trích chọn đặc trưng PD, từ đó chọn ra kích thước phù hợp với nhận dạng chữ Nôm. Kích thước lưới có ảnh hưởng lớn đến tốc độ thực hiện huấn luyện và nhận dạng, độ lớn của cơ sở dữ liệu huấn luyện và đặc biệt độ chính xác của nhận dạng. Nếu kích thước lưới bé có thể không thể hiện hết thông tin đặc trưng của ảnh, nếu kích thước quá lớn thì thể hiện quá rõ, thậm chí nhiễu cũng được đưa vào đặc trưng dẫn đến sai số có thể tăng.

- Đánh giá ảnh hưởng của các tham số SVM trong mô hình nhận dạng KSVM. Các tham số SVM có ảnh hưởng trực tiếp đến độ chính xác của SVM, và với các bộ dữ liệu khác nhau ta cần chọn các tham số thích hợp. SVM tham gia cả 2 bước trong mô hình KSVM, do đó việc chọn tham số lại càng quyết định nhiều đến độ chính xác của hệ thống. Tham số SVM cho 2 bước trong mô hình KSVM có thể là khác nhau do tập dữ liệu huấn luyện là khác nhau.

- Đánh giá ảnh hưởng của việc phân bổ tỉ lệ phân cụm trong lớp thứ nhất mô hình KSVM.

5.3.2.Cách thực hiện

Để thực hiện các tiêu chí đánh giá trên, tác giả tiến hành như sau:

- Phân chia bộ dữ liệu thành 2 tập trainning và testing như miêu tả trong phần 5.1. - Tạo ra các ảnh ký tự với các kích thước khác nhau để tiến hành trích chọn đặc trưng. Trong phần thay đổi kích thước ảnh, luận văn tiến hành xử lý bằng cách dùng hàm resize() với các ảnh đầu vào của thư viện OpenCV để chuyển ảnh về kích thước mong muốn.

- Tiến hành trích chọn đặc trưng với sự thay đổi các tham số về kích thước lưới trong thuật toán trích chọn đặc trưng PD để thu được tập các đặc trưng tương ứng với các bộ tham số cho training và testing.

- Chọn các tham số mô hình cho SVM (bao gồm kiểu SVM, tham số C, các tham số đi kèm kiểu), chọn các tham số về số lần lặp L trong KSVM, số cụm K trong lớp thứ 1 và tiến hành huấn luyện lần lượt các lớp trong mô hình KSVM.

- Các dữ liệu về đặc trưng và tham số mô hình ở các bước được lưu lại để phục vụ các đánh giá tiếp theo và thuận lợi cho quán trình thực nghiệm.

Một phần của tài liệu Nhận dạng chữ Nôm bằng máy véc - tơ hỗ trợ (SVM) (Trang 50)

Tải bản đầy đủ (PDF)

(73 trang)