Ðánh giá khả năng nhận dạng của mô hình

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Phương pháp nhận dạng chữ viết tay tiếng Việt dựa trên mô hình mạng nơron Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 76 - 78)

Có thể nói, mô hình nhận dạng được đề xuất bởi luận văn là một hướng tiếp cận khả thi giải quyết vấn đề dính chữ trong nhận dạng chữ viết tay. Chất lượng nhận dạng của mô hình được đảm bảo bởi các lý do sau đây:

 Thuật toán xác định các vị trí cắt khác nhau trên một ảnh đầu vào đảm bảo rằng tất cả các vị trí cắt có thể có trên ảnh đầu vào sẽ được xem xét mà không bỏ qua bất kỳ một vị trí nào.

 Việc kiểm tra mức độ hợp lý của một ký tự trong quá trình nhận dạng sẽ giúp ta phát hiện và loại bỏ được các vị trí cắt không hợp lý (các vị trí cắt sai) ngay trong quá trình nhận dạng.

 Thuật toán chọn từ dựa trên tần suất xuất hiện hoặc xác suất xuất hiện của từ đó cho phép chúng ta luôn luôn chọn được một từ hợp lý nhất.

2.6. Kết luận

Trong chương này, luận văn đề cập một cách chi tiết đến quá trình xây dựng mô hình nhận dạng chữ viết tay hạn chế. Về bản chất, mô hình nhận dạng được đề xuất ở đây gồm ba thành phần chính:

• Trích chọn đặc trưng cho ký tự cần nhận dạng • Mô hình đa mạng nơron

• Bộ thống kê ngữ cảnh.

Chữ viết tay tiếng Việt gặp nhiều khó khăn do sự đa dạng về kiểu, đặc biệt là hệ thống dấu tiếng Việt khiến số kí tự cần nhận dạng tăng lên rất nhiều. Nếu sử dụng mô hình nhận dạng một mạng nơron sẽ tỏ ra kém hiệu quả vì cùng một lúc mạng phải nhớ được đặc điểm của tất cả các kí tự để phân biệt chúng, nghiên cứu này đưa ra một mô hình đa mạng nơron. Mạng đầu tiên có nhiệm vụ phân loại đầu vào (ảnh của kí tự cần nhận dạng) về một nhóm để các mạng tiếp theo tiếp tục phân loại (nhận dạng) và cho ra kết quả cuối cùng. Mỗi mạng này được áp dụng một phương pháp trích chọn đặc trưng ảnh phù hợp để có thể phân biệt các kí tự gần

giống nhau trong cùng một nhóm. Việc dùng nhiều mạng nơron và các phương pháp trích chọn đặc trưng phù hợp với từng nhóm kí tự đã giải quyết được những khó khăn đặc thù của bài toán nhận dạng chữ viết tay tiếng Việt

Bộ thống kê ngữ cảnh được xây dựng nhằm hai mục đích chính:

 Kiểm tra mức độ hợp lý của một ký tự trong một xâu ký tự.

 Chọn ra một từ mà khả năng lựa chọn của từ đó là cao nhất trong danh sách các từ ứng cử viên.

Bộ nhận dạng từ được xây dựng với vai trò làm bộ xử lý trung tâm của mô hình nhận dạng. Với mỗi ảnh đầu vào, Bộ nhận dạng từ sẽ tiến hành quá trình nhận dạng một cách đệ qui trên từng phần của ảnh, mỗi quá trình nhận dạng là sự kết hợp đan xen của ba công đoạn chính: tìm kiếm tất cả các vị trí cắt có thể có trên ảnh đầu vào, nhận dạng kí tự tương ứng với mỗi vị trí được cắt, kiểm tra độ hợp lý của mỗi kí tự ngay sau khi vừa được nhận dạng.

Mô hình nhận dạng được đề xuất bởi luận văn là một cách tiếp cận khả thi để giải quyết vấn đề dính chữ trong nhận dạng chữ viết tay.

CHƢƠNG 3. CÀI ĐẶT HỆ THỐNG NHẬN DẠNG CHỮ VIẾT TAY HẠN CHẾ.

Trong chương này, chúng tôi sẽ mô tả một cách chi tiết nhất có thể các công việc cần thực hiện trong quá trình xây dựng hệ thống nhận dạng chữ viết tay dựa trên mô hình nhận dạng đã được đề xuất ở chương III.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Phương pháp nhận dạng chữ viết tay tiếng Việt dựa trên mô hình mạng nơron Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 76 - 78)

Tải bản đầy đủ (PDF)

(99 trang)