Tất cả các trƣờng hợp không thực hiện đúng các hƣớng dẫn và thời hạn kế trên sẽ không đƣợc xem xét, học viên và cán bộ hƣớng dẫn phải hoàn toàn chịu trách nhiệm về các hậu

Một phần của tài liệu Mạng Nơ Ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in (Trang 85)

đƣợc xem xét, học viên và cán bộ hƣớng dẫn phải hoàn toàn chịu trách nhiệm về các hậu quả có thế xảy ra.

KẾT LUẬN

Mạng nơ ron là một công cụ mạnh mẽ để giải quyết nhiều bài toán đòi hỏi trí tuệ nhân tạo của con ngƣời. Nhiều ứng dụng thành công trong các lĩnh vực xử lý tín hiệu, điều khiển, dự báo, phân tích, phân lớp trong các ngành khoa học vũ trụ, sản xuất ô tô, ngân hàng, quốc phòng, điện tử, giải trí, y học, tài chính, bảo hiểm, ngƣời máy, bƣu chính viễn thông, … đã chứng minh điều đó. Tuy nhiên mạng nơ ron ngày nay đƣợc xây dựng mới chỉ dựa trên những hiểu biết còn hạn chế về cấu tạo và nguyên lý hoạt động của bộ não con ngƣời. Để nâng cao hiệu quả của mạng nơ ron nhân tạo còn cần các nghiên cứu sâu sắc hơn về toán học, sinh học, tâm lý học, vật lý, thần kinh học và nhiều lĩnh vực liên quan đến con ngƣời khác.

Vì mạng nơ ron có khả năng giải quyết rất tốt bài toán phân lớp nên nó đƣợc ứng dụng rất thành công vào bài toán nhận dạng văn bản. Đây là một bài toán khá phức tạp vì các thế hệ máy tính điện tử ngày nay chỉ có khả năng thực hiện các phép tính cơ bản chứ không có khả năng cảm nhận và phân tích nhƣ mắt ngƣời. Vì vậy việc thiết kế một hệ thống hiệu quả thật sự là một bài toán lớn liên quan đến nhiều lĩnh vực, đòi hỏi cách tiếp cận có hệ thống và có phƣơng pháp đúng.

Những nỗ lực của các nhà khoa học trên thế giới đã cho ra đời nhiều mô hình mạng nơ ron hữu ích trong lĩnh vực nhận dạng nói chung. Trong số đó, các mô hình hay sử dụng nhất trong nhận dạng văn bản chữ in là mạng kết hợp tuyến tính, mạng Adaline, mạng SOM, mạng đa tầng truyền thẳng (MLP), mạng RBF. Mỗi loại đều có những thế mạnh riêng và phù hợp với các vấn đề cụ thể.

Bài toán nhận dạng văn bản chữ Việt in, cũng nhƣ bất cứ loại văn bản nào, bao gồm năm giai đoạn. Đó là tiền xử lý, phân tích trang văn bản, trích chọn đặc trƣng, học - nhận dạng và hậu xử lý. Tiền xử lý ảnh văn bản là một khâu rất quan trọng vì nó giảm nhiễu, giảm độ phức tạp cho khâu nhận dạng. Phân tích trang văn bản chia một ảnh văn bản lớn thành các phần tử nhỏ hơn để nhận dạng các phần tử này và để tìm ra cấu trúc văn bản. Trích chọn đặc trƣng tìm ra những đặc điểm để phân biệt các loại ký tự khác nhau đồng thời vẫn linh động bỏ qua những biến thể thuộc cùng một loại. Trích chọn đặc trƣng cũng đóng vai trò trọng yếu vì những đặc trƣng tìm đƣợc phải thể hiện đƣợc bản chất của ký tự. Quá trình học và nhận dạng đòi hỏi xây dựng một mạng nơ ron đủ mạnh cả về kiến trúc và luật học để tối thiểu hoá thời gian học và nhận dạng chính xác một số lớn ký tự chỉ khác nhau rất ít. Hậu xử lý tìm ra và hiệu chỉnh những sai sót của quá trình nhận dạng, đồng thời lắp ráp các đoạn về định dạng văn bản ban đầu.

Luận văn “Mạng nơ ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in” đã trình bày đƣợc các vấn đề sau:

 Giới thiệu sơ lƣợc về mạng nơ ron và tổng quan về hệ thống nhận dạng ký tự.

 Giới thiệu về một số mô hình mạng nơ ron sử dụng phổ biến nhất trong hệ thống phân tích và nhận dạng văn bản chữ in.

 Xây dựng một hệ thống nhận dạng chữ Việt in thử nghiệm sử dụng mạng nơ ron.

Các định hướng nghiên cứu tiếp theo

 Cải thiện hệ thống hiện tại theo hƣớng xây dựng một hệ thống liên mạng nơ ron để giảm thời gian huấn luyện, giảm bớt gánh nặng phải “nhớ” một số lƣợng khá lớn các ký tự tiếng Việt và để tăng số lƣợng font mẫu. Mỗi mạng nơ ron sẽ đƣợc huấn luyện để nhận dạng các ký tự thuộc cùng một nhóm.

 Thử nghiệm các kiến trúc mạng khác nhau để tìm ra loại mạng có khả năng nhận dạng tốt nhất chữ Việt in.

 Thử nghiệm các phƣơng pháp trích chọn đặc trƣng khác nhau để tìm phƣơng pháp thích hợp nhất đối với chữ Việt in.

 Nghiên cứu sâu hơn về các kỹ thuật tiền xử lý nhằm nâng cao chất lƣợng ảnh, xử lý đƣợc các ảnh bị nhiễu nặng, các ký tự bị “vỡ”, xử lý các ký tự dính tốt hơn.

 Việc nhận dạng chữ viết tay trên thế giới mặc dù đã có rất nhiều nghiên cứu và thử nghiệm nhƣng kết quả vẫn rất hạn chế. Luận văn này là cơ sở vững chắc để nghiên cứu nhận dạng chữ viết tay.

Một phần của tài liệu Mạng Nơ Ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in (Trang 85)

Tải bản đầy đủ (PDF)

(93 trang)