Chương 7 Kết quả thực nghiệm 7.1 Mô tả chương trình cài đặt

Một phần của tài liệu phương pháp nhận dạng chữ viết tay trực tuyến liền nét (Trang 42 - 46)

7.1. Mô tả chương trình cài đặt

Dựa trên những lí thuyết đã được trình bày, tôi xây dựng một chương trình để thử nghiệm với các bộ dữ liệu chữ viết tay trực tuyến có được. Chương trình được viết bằng ngôn ngữ Java, và sử dụng thư viện JAHMM [25] cho huấn luyện và tính toán xác suất nhận dạng kí tự.

7.2. Kết quả thực nghiệm nhận dạng từng kí tự7.2.1. Mô tả thực nghiệm 7.2.1. Mô tả thực nghiệm

Đầu tiên mô hình Markov ẩn sẽ được thực nghiệm với bài toán nhận dạng từng kí tự viết tay trực tuyến khi viết riêng biệt để kiểm tra khả năng lưu giữ các thông tin đặc trưng được trích chọn theo biến đổi DCT.

Bộ dữ liệu thu thập được sử dụng trong phần này được thu thập từ 45 người viết khác nhau, với các mỗi mẫu là các kí tự tiếng anh (từ "a" đến "z") được viết thường với mục đích kiểm tra tỉ lệ nhận dạng đúng của các thuật toán học máy được sử dụng.

Vì các kí tự được viết riêng biệt nên không có cơ sở chính xác để chuẩn hóa kích thước, trong thực nghiệm này chỉ sử dụng thao tác đơn giản là nhân chiều cao của mỗi kí tự với một hằng số thích hợp để đưa kí tự về chiều cao cố định. Tuy nhiên, cách xử lí này có thể đưa đến một số nhầm lẫn giữa các kí tự mà rõ ràng nhất là giữa hai kí tự "e" và "l".

Thực nghiệm được tiến hành bằng cách, chọn ngẫu nhiên một số lượng mẫu nhất định từ các mẫu có được sử dụng trong huấn luyện. Sau khi được huấn luyện, bộ nhận dạng sẽ sử dụng toàn bộ số lượng mẫu có được để kiểm tra kết quả, kể cả mẫu sử dụng trong training. Ở đây, với mỗi bộ dữ liệu ứng với từng kí tự từ "a" đến "z" tôi chọn số lượng là 50 mẫu.

Với phương pháp sử dụng mô hình Markov ẩn, kết quả tốt nhất đạt được khi thiết lâp mỗi mô hình sẽ có số trạng thái N = 10 và K = 4, số vòng lặp của thuật toán Baum-Welch là 10.

Bảng 7-1: Kết quả thực nghiệm nhận dạng kí tự

a 547 0.84%b 269 0.81% b 269 0.81% c 250 0.95% d 672 0.88% e 582 0.93% f 182 0.82% g 240 0.92% h 250 0.83% i 578 0.73% j 283 0.74% k 238 0.78% l 242 0.65% m 239 0.90% n 237 0.89% o 549 0.91% p 243 0.91% q 244 0.98% r 243 0.36% s 240 0.66% t 245 0.74% u 579 0.66% v 262 0.89% w 178 0.87% x 254 0.83% y 238 0.82% z 154 0.79% Tỉ lệ trung bình 0.81% 7.2.2. Nhận xét kết quả

Phương pháp sử dụng mô hình Markov ẩn với trích chọn đặc trưng theo đặc trưng DCT, đạt được kết quả tốt ở các kí tự "c", "d", "e", "g", "o", "p", "q". Trong số các nhãn còn lại thì, đáng chú ý là chỉ nhận dạng đúng được 36% nhãn kí tự "r", các kí tự "s", "l" cũng đạt kết quả thấp. Ở đây có thể lí giải là do sự đa dạng trong các cách thể hiện kí tự, và do chỉ sử dụng một mô hình Markov ẩn cho mỗi lớp kí tự. Vì mô hình Markov ẩn dựa trên phân bố Gauss nên đối với trường hợp các kí tự huấn luyện không tuân theo phân bố đấy thì xác suất nhận được từ mô hình HMM không thể hiện rõ được đặc trưng của chúng, xác suất này bị che lấp bởi các lớp kí tự khác.

7.3. Kết quả thực nghiệm với nhận dạng một từ hoàn chỉnh7.3.1. Mô tả thực nghiệm 7.3.1. Mô tả thực nghiệm

Với các mô hình Markov ẩn đã được huấn luyện và sử dụng trong thực nghiệm nhận dạng được kí tự được sử dụng làm mô hình xác suất trong thuật toán quy hoạch động phân đoạn kí tự.

Các tham số thể hiện trọng số của nét cắt được chọn lần lượt là α = và β = vì các giá trị thu được từ xác suất phân biệt kí tự của Markov ẩn nằm trong khoảng ). Kết quả sẽ được kiểm tra với các từ: "one", "two", "three", "four", "five", "six", "seven", "eight", "nine", "ten". Để có được kết quả cuối cùng, các kí tự cắt ra theo phương pháp quy hoạch động sẽ được nhận dạng bằng một thuật toán học máy như mô hình mạng nơron (Neural Networks) hoặc máy vector hỗ trợ (Support Vector Machine - SVM) thay vì dùng phương pháp sử dụng mô hình Markov ẩn. Trong thực nghiệm này, tôi sử dụng mô hình SVM đã được đề cập đến ở [24] để nhận dạng các kí tự sau khi được cắt ra.

Bảng 7-2: Kết quả nhận dạng các từ và kết hợp với mô hình SVM

Từ Số lượng mẫu để kiểm tra Số lượng mẫu cắt đúng Số mẫu nhận dạng đúng sau khi sử dụng SVM one 4 4 4 two 4 2 1 three 4 4 2 four 4 2 0 five 4 1 1 six 4 4 0 seven 4 2 1 eight 3 3 1 nine 4 3 1 ten 4 2 2 7.3.2. Nhận xét kết quả

Mặc dù kết quả thực nghiệm đạt được còn hạn chế nhưng phương pháp quy hoạch động được nêu ra có thể giải quyết tốt phần lớn các trường hợp trong bài toán

Hình 7-17: Các trường hợp phân đoạn đúng

Trường hợp a) khi các kí tự được viết rời nhau riêng biệt, trường hợp b) khi các kí tự được viết rời nhau nhưng có phần nhỏ trùng lên nhau. Trường hợp c) khi các kí tự được viết liền nhau bằng một nét. Trường hợp sai của thuật toán xảy ra khi xác suất đưa ra của mô hình Markov ẩn không thể hiện đúng xác suất nhận dạng kí tự, dẫn đến thuật toán quy hoạch động không tìm ra được lời giải tối ưu.

Hình 7-18: Trường hợp thuật toán phân đoạn thực hiện sai.

Một phần của tài liệu phương pháp nhận dạng chữ viết tay trực tuyến liền nét (Trang 42 - 46)