Khó khăn và giải pháp đề xuất

2.2. Mô hình đa mạng nơron áp dụng trong nhận dạng chữ viết tay tiếng

2.2.1. Khó khăn và giải pháp đề xuất

Trong bài toán nhận dạng chữ viết tay tiếng Việt, Bộ nhận dạng ký tự nhận đầu vào là ảnh của từng ký tự tiếng Việt (chữ cái kèm theo dấu). Nhiệm vụ của bộ này là nhận dạng ảnh đầu vào từ đó trở về output là ký tự tương ứng. Như chúng ta đã biết, chữ tiếng Việt là sự kết hợp giữa chữ cái Latinh và hệ thống dấu (sắc, huyền,

hỏi, ngã, nặng). Khi cắt các từ tiếng Việt viết thường ra thành các kí tự, ta sẽ thu được những nhóm ký tự sau:

 18 kí tự có dấu bắt nguồn từ các chữ cái a, ă, â đó là: a, à, á, ã, ạ, ả, â, ầ, ấ, ẫ, ậ, ẩ, ă, ằ, ắ, ẵ, ặ, ẳ. (1)

 12 ký tự có dấu bắt nguồn từ các chữ cái e, ê đó là: e, è, é, ẽ, ẹ, ẻ, ê, ề, ế, ễ, ệ, ể. (2)

 18 ký tự có dấu bắt nguồn từ các chữ cái o, ô, ơ đó là: o, ò, ó, õ, ọ, ỏ, ô, ồ, ố, ỗ, ộ, ổ, ơ, ờ, ớ, ỡ, ợ, ở. (3)

 6 ký tự có dấu bắt nguồn từ chữ cái i là: i, í, ì, ĩ, ị, ỉ. (4)

 12 ký tự có dấu bắt nguồn từ các chữ cái u và ư đó là: u, ù, ú, ũ, ụ, ủ, ư, ừ, ứ, ữ, ự, ử (5)

 6 ký tự có dấu bắt nguồn từ chữ cái y đó là: y, ỳ, ý, ỹ, ỵ, ỷ. (6)

 17 ký tự không dấu còn lại: d, đ, b, c, g, h, k, l, m, n, p, q, r, s, t, v, x. (7)

 Việc phân nhóm kí tự được thực hiện dựa trên cơ sở đặc trưng ảnh theo tiêu chí sau: những kí tự giống nhau, khó phân biệt sẽ được đưa vào cùng một nhóm. Theo quan điểm này, sự giống nhau của các kí tự rơi vào một trong hai trường hợp sau:

 Các kí tự có dấu bắt nguồn từ cùng một chữ cái sẽ được đưa vào cùng một nhóm, ví dụ nhóm các kí tự a, á, à, ă, ắ, ấ ...; o, ô, ố, ồ ... Đặc điểm của các kí tự trong các nhóm này là: có phần thân giống nhau và chỉ khác nhau phần dấu nên để phân biệt các kí tự chúng ta chỉ cần phân biệt phần dấu của chúng.

Với nhận xét và quan sát như vậy, chúng ta có thể chia tập hợp các kí tự tiếng Việt thành các nhóm như bảng dưới đây:

Nhóm 0

0.1 a á à ạ ã ả ă ắ ằ ặ ẵ ẳ â ấ ầ ậ ẫ ẩ 0.2 e é è ẹ ẽ ẻ ê ế ề ệ ễ ể 0.3 o ó ò ọ õ ỏ ô ố ồ ộ ỗ ổ ơ ớ ờ ợ ỡ ở 0.4 i í ì ị ĩ ỉ 0.5 u ú ù ụ ũ ủ ư ứ ừ ự ữ ử 0.6 y ý ỳ ỵ ỹ ỷ d đ m n p r s g q b h k l c x v t

Bảng 2.1: Phân nhóm ký tự tiếng Việt dựa trên đặc trƣng ảnh

Do đó, bên cạnh những khó khăn chung của bài toán nhận dạng chữ viết tay như đã trình bày trong phần giới thiệu, với bài toán nhận dạng chữ viết tay tiếng Việt chúng ta còn gặp những khó khănsau:

 Số các ký tự tiếng việt là rất lớn: 89 ký tự viết thường và 89 ký tự viết hoa chưa kể đến các chữ số và dấu câu. Nếu chỉ sử dụng hệ nhận dạng đơn thuần là nhận dạng một cấp (nhận dạng một lần bởi một mạng nơron) thì số các ký tự cần phân biệt là rất nhiều, do vậy xác suất nhận dạng sai cũng sẽ cao.

 Tập hợp các ký tự tiếng Việt có thể chia thành bảy nhóm như trên, trong đó các nhóm (1), (2), (3), (4), (5) và (6) gồm các kí tự rất giống nhau, chúng chỉ khác nhau về dấu nên rất khó phân biệt. Có thể nói, bên cạnh độ lớn về số lượng ký tự thì đặc điểm này là thử thách lớn nhất đối với các hệ nhận dạng chữ viết tay tiếng Việt.

Nhận biết được những khó khăn này, chúng tôi đề xuất giải phápnhư sau:

 Chia tập hợp toàn bộ ký tự tiếng Việt ra thành các nhóm nhỏ hơn.

 Xây dựng hệ thống mạng nơron gồm nhiều mạng kết hợp. Mạng ưu tiên có nhiệm vụ phân nhóm ký tự đầu vào, các mạng tiếp theo sẽ tiếp tục nhận dạng ký tự trong một nhóm con và đưa ra kết quả ứng với mỗi nhóm ký tự, ta áp dụng một phương pháp trích chọn đặc trưng ảnh phù hợp sao cho mạng nơron có thể phân nhóm, nhận dạng ký tự một cách chính xác nhất. Những nghiên cứu về mạng nơron đã giúp cho chúng tôi có cơ sở để tiến hành việc phân nhóm ký tự

và xây dựng hệ thống đa mạng nơron để giải quyết những khó khăn của bài toán nhận dạng ký tự viết tay tiếng Việt theo giải pháp này.

Xây dựng hệ thống đa mạng

Cấu trúc hệ thống đa mạng