Áp dụng trích chọn đặc trưng ảnh trong nhận dạng chữ viết tay tiếng

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Phương pháp nhận dạng chữ viết tay tiếng Việt dựa trên mô hình mạng nơron Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 49 - 50)

tay tiếng Việt

Phương pháp GSC được nêu ra bởi nhóm nghiên cứu của J.Favata, V.Govindaraju và S.N.Srihari ở trung tâm nghiên cứu về nhận dạng và phân tích ảnh của trường đại học tổng hợp New York, Hoa Kỳ [20]. Phương pháp GSC là tổng hợp của 3 phương pháp trích chọn đặc trưng theo hướng, theo cấu trúc và theo tính lồi lõm. Do vậy, nó có khả năng thể hiện ảnh trên nhiều mức độ, từ mức độ thấp (theo hướng), tới mức độ cao (theo tính lồi lõm). Phương pháp này tỏ ra rất hiệu quả với loại bài toán nhận dạng khi số mẫu đầu vào là đa dạng do vậy rất phù hợp khi áp dụng vào bài toán nhận dạng chữ tiếng Việt. Dựa trên sự kết hợp giữa phương pháp trích chọn đặc trưng GSC và thuật toán nhận dạng là mạng nơron. Nhóm tác giả trên đã xây dựng thực tế hệ thống chuyên nhận dạng các địa chỉ thư ở bưu điện ở Mỹ và cho kết quả khá khả quan 97%.

Khi áp dụng, tùy theo đặc điểm của các ảnh cần lấy đặc trưng, ta có thể kết hợp các phương pháp này với nhau sao cho nó phù hợp nhất với bài toán.

Với bài toán nhận dạng chữ viết tay tiếng Việt dựa trên mô hình liên mạng nơron, chúng ta cần tìm ra cách lấy đặc trưng ảnh hiệu quả đối với từng nhóm kí tự. Nguyên tắc và cách thức thực hiện việc này như sau:

Trích chọn đặc trƣng cho nhóm 0 (ở cấp nhận dạng đầu tiên) có nhiệm vụ tìm ra những đặc trưng là đặc thù cho mỗi nhóm con sau nó để xác định xem kí tự đầu vào thuộc về nhóm nào trong các nhóm con này.

 Từ bảng 2.1 ta có nhận xét sau: nếu ta bóc bỏ phần dấu của các kí tự có dấu thì phần thân (chữ cái) trong các nhóm con là giống nhau (trừ nhóm 0.3 và 0.5 có hai chữ cái). Do vậy, để phân nhóm kí tự trong nhóm 0 chúng ta có thể tách bỏ phần dấu của các kí tự có dấu và chỉ cần phân biệt phần thân của chúng. Khi này chúng ta chỉ cần trích chọn đặc trưng cho phần thân của kí tự.

Trích chọn đặc trƣng cho các nhóm kí tự có dấu cùng gốc: nhiệm vụ của trích chọn đặc trưng trong các nhóm này là tập trung đến phần dấu của kí tự (sau khi cắt bỏ phần thân của chúng), tìm ra đặc trưng trên phần dấu để phân biệt các dấu. Khi đã phân biệt được dấu, tức là ta đã phân biệt được cả kí tự. Cụ thể: chúng ta cần trích chọn đặc trưng cho cả phần dấu trên và phần dấu dưới (dấu nặng) của kí tự.

Trích chọn đặc trƣng cho các nhóm kí tự không dấu: có nhiệm vụ tìm ra những đặc trưng riêng của các kí tự trong cùng một nhóm.

Sau khi đã xác định được phần ảnh cần lấy đặc trưng của kí tự, chúng ta sẽ tiến hành thực nghiệm với các phương pháp trích chọn đặc trưng để tìm ra phương pháp tốt nhất cho từng nhóm kí tự nhằm thu được kết quả nhận dạng đúng cao nhất.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Phương pháp nhận dạng chữ viết tay tiếng Việt dựa trên mô hình mạng nơron Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 49 - 50)

Tải bản đầy đủ (PDF)

(99 trang)