Thực nghiệm về phõn đoạn ảnh

Một phần của tài liệu LUẬN VĂN: NGHIÊN CỨU VỀ NHẬN DẠNG CHỮ IN TIẾNG VIỆT pdf (Trang 51 - 55)

6.2.1 Tỏch dũng

Điều kiện thực hiện: trong cài đặt thực nghiệm, chỳng tụi xỏc định tham số

minHeightLine = 7. Chỳng tụi thực nghiệm phõn tỏch 5 văn bản gồm 200 dũng. Cỏc dũng tỏch sai trong trường hợp:

 Vị trớ tỏch dũng khụng đỳng với vị trớ thực tế của dũng đú trong văn bản.

 Cỏc dũng bị gộp với nhau tạo thành một dũng (hỡnh 4.5).

Hỡnh 6.1: Minh họa tỏch dũng văn bản.

Số văn bản Số dũng Số dũng tỏch Chớnh xỏc Tớnh % 5 200 199 99 Bản 6.1 Kết quả thực nghiệm tỏch từ 6.2.3 Tỏch từ

Điều kiện thực nghiệm: trong quỏ trỡnh thực nghiệm, chỳng tụi thử với cỏc

giỏ trị khỏc nhau của tham số k, và với k = 2.75 thỡ cú cho kết quả tốt nhất, tỏch chớnh xỏc gần như tũan bộ văn bản.

Hỡnh 6.2: Minh họa cắt từ.

Kết quả: Chỳng tụi tiến hành tỏch từ trong 5 văn bản gồm 2200 từ. Độ chớnh

xỏc cắt từ là: 99.2%. Một vớ dụ về tỏch từ được minh họa như trong hỡnh 4.6. Số văn bản Số từ Số từ tỏch chớnh xỏc

5 2200 1189

Bảng 6.2 Kết quả thực nghiệm tỏch từ

6.2.4 Tỏch ký tự

Chỳng tụi thực nghiệm việc tỏch kớ tự với đầu vào là cỏc từ đó được tỏch ở giai đoạn trờn. Thỡ kết quả đạt được như sau:

Chương 6:Thực nghiệm Bựi Thế Hõn

Với những từ trong đú cỏc kớ tự tỏch rời nhau, thỡ độ chớnh xỏc của phộp tỏch là rất cao (99.8%). Nhưng với nhưng từ cỏc kớ tự dớnh nhau thỡ khụng chớnh xỏc, chớnh vỡ vậy chỳng tụi đó đưa ra nhiều kết quả cho cỏc nhỏt cắt.

6.2.5 Thực nghiệm nhận dạng

Chỳng tụi thực nghiệm việc nhận dạng với đầu vào là cỏc văn bản. Thỡ kết quả đạt được như sau:

Số văn bản Số từ Số từ tỏch chớnh xỏc

5 2200 1189

Chương 7: Kết Luận

Trong khúa luận này chỳng tụi đó trỡnh bày những lý thuyết cơ bản về phõn đoạn ảnh, nghiờn cứu và so sỏnh một số kỹ thuật phổ biến sử dụng trong phõn đoạn ảnh cho nhận dạng. Đồng thời tụi cũng trỡnh bày một cỏch khỏi quỏt về cỏc phương phỏp trớch chọn đặc trưng và cỏc mụ hỡnh học mỏy được ỏp dụng trong luận văn. Từ đú ỏp dụng vào bài toỏn nhận dạng chữ in tiếng Việt.

Để nõng cao chất lượng trong quỏ trỡnh phõn đoạn ảnh nhằm tăng chất lượng tổng thể của hệ thống nhận dạng, chỳng tụi đó đề xuất phương phỏp văn bản thành cỏc vựng,tỏch dũng dựa vào cỏc phương phỏp trực quan như đó trỡnh bày ở trờn.

Kết quả thực nghiệm trờn cỏc văn bản chữ in thu được là rất khả quan với độ chớnh xỏc tại giai đoạn tỏch dũng là 99,2%, tại giai đoạn tỏch từ là 99,4%. Thực nghiệm trờn văn bản chữ viết tay bước đầu cũng đem lại kết quả khả quan.

Chỳng tụi tiến hành ghộp nối cỏc modun để tạo thành một hệ thống nhận dạng, quỏ trỡnh thực nghiệm thu được độ chớnh xỏc của hệ thống là 90.3%.

Chỳng tụi cũng đó xõy dựng một ứng dụng nhận dạng văn bản chữ in tiếng Việt. Kết quả thu được cho thõy, ứng dụng là cú ớch, cú thể nhận dạng được cỏc văn bản chữ in tiếng Việt với độ chớnh xỏc khỏ cao.

Tuy nhiờn vẫn tồn tại một số hạn chế chưa giải quyết được, đú là chưa giải quyết được khi cỏc dũng cỏc từ bị dớnh vào nhau ...

Trong tương lai chỳng tụi sẽ tiếp tục nghiờn cứu và phỏt triển để nõng cao chất lượng hệ thống cả về độ chớnh xỏc và tốc độ. Đối với khú khăn khi cắt ký tự làm ba phần sẽ giải quyết theo hướng xỏc định cỏc vị trớ cắt cú thể và tiến hành giống với quỏ trỡnh tỏch ký tự. Qua đú mở rộng nghiờn cứu và thực nghiệm trờn cỏc văn bản chữ viết tay tiếng Việt.

Tài liệu tham khảo Bựi Thế Hõn

Tài liệu tham khảo

[1]Lương Mạnh Bỏ, Nguyễn Thanh Thủy, “Nhập Mụn Xử Lý Ảnh Số”, Nhà xuất bản Khoa Học và Kỹ Thuật, 1999.

[2]Ngụ Quốc Đạt , Luận văn “Tớch hợp mụ hỡnh cho nhận dạng tiếng Việt” khoa CNTT Trường đại học Cụng Nghệ đại học QGHN năm 2008.

[3]Hoàng Kiếm, Nguyễn Hồng Sơn, Đào Minh Sơn, “Ứng dụng mạng Nơron nhõn tạo trong hệ thống xử lý biểu mẫu tự động”, Kỷ yếu hội nghị kỷ niệm 25 năm thành lập Viện Cụng Nghệ Thụng Tin, 2001.

[4]http://vi.wikipedia.org

[5] Lakhmi C. Jain (Editor), Beatrice Lazzerini (Editor) Detection technique for Binary Document Images based on Hough transform, International journal of information technology, Volume 3 number 3 2006, ISSN 1305-2403 Knowledge-based-intelligent-techniques-in-character-recognition

[6]Pattern Recognition with Neural Networks in C++.chm.CRC Press

[7]H. Bunke (Editor), P. S. P. Wang (Editor) Handbook of Character Recognition and Document Image Analysis

[8] Bahram Javidi (Author) Image Recognition and Classification

[9] Stephen V. Rice (Author), George Nagy (Author), Thomas A. Nartker (Author) Optical Character Recognition: An Illustrated Guide to the Frontier (The Springer International Series in Engineering and Computer Science) [10]Oliveira Luiz S., Robert Sabourin, Flavio Bortolozzi and Ching Y.Suen.

Automatic Recognition of Handwritten Numerical Strings: A Recognition and Verfication Strategy.

[11] Francis T. S. Yu (Editor), Suganda Jutamulia (Editor) In Stock Optical Pattern Recognition

[12] http://www.ph.tn.tudelft.nl/Courses/FIP/noframes/fipSegmenta.html#Headi ng118

Một phần của tài liệu LUẬN VĂN: NGHIÊN CỨU VỀ NHẬN DẠNG CHỮ IN TIẾNG VIỆT pdf (Trang 51 - 55)

Tải bản đầy đủ (PDF)

(55 trang)