Trong khóa luận này chúng tôi đã trình bày những lý thuyết cơ bản về phân đoạn ảnh, nghiên cứu và so sánh một số kỹ thuật phổ biến sử dụng trong phân đoạn ảnh cho nhận dạng, từ
đó áp dụng vào bài toán nhận dạng chữ in tiếng Việt.
Để nâng cao chất lượng trong quá trình phân
đoạn ảnh nhằm tăng chất lượng tổng thể của hệ
thống nhận dạng, chúng tôi đã đề xuất phương pháp tách dòng dựa vào thành phần liên thông,
đối với mỗi ký tự sẽ chia ra làm ba phần TOP, BODY, và bottom để nhận dạng. Kết quả thu
được là rất khả quan.
Trong tương lai chúng tôi sẽ tiếp tục nghiên cứu và phát triển để nâng cao chất lượng hệ
thống cả vềđộ chính xác và tốc độ. Đối với khó khăn khi cắt ký tự làm ba phần sẽ giải quyết theo hướng xác định các vị trí cắt có thể và tiến hành giống với quá trình tách từ. Qua đó mở
rộng nghiên cứu và thực nghiệm trên các văn bản chữ viết tay tiếng Việt.
Tài liệu tham khảo
[1] Ngô Tiến Đạt.Mô hình tích hợp cho
nhận dạng văn bản tiếng Việt, khóa luận tốt nghiệp đại học, Trường Đại học Công nghệ, 2008.
[2] D. X. Le, G. Thoma, H. Weschler, Automated Page Orientation and Skew Angle Detection for Binary Document Images, Pattern Recognition, Volume 27, Number 10, pp. 1325-1344, October 1994.
[3] D. X. Le, G. Thoma, Document Skew Angle Detection Algorithm, Proc. SPIE
Symposium on Aerospace and Remote Sensing, Visual Information Processing II, Orlando, FL April 14-16, 1993 Vol.
1961, pp. 251-262.
[4] A. Marcolino, V. Ramos, M Ramalho, J.Caldas Pinto, Line and Word Matching
in Old Documents, IDMEC/IST -
Technical University of Lisbon
[5] William K.Pratt, Digital Image Processing, John Wiley & Sons 2001. [6] J. Li, A. Najmi, R. M. Gray, Image
classification by a two dimensional
hidden Markov model, IEEE
Transactions on Signal Processing,
48(2):517-33, February 2000.
[7] Olivier Cappé, Eric Moulines, Tobias Rydén. Inference in Hidden Markov Models, Springer, 2005. ISBN 0-387- 40264-0.
[8] Christopher D. Manning, Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT
Press: 1999. ISBN 0-262-13360-1.
[9] Ted Dunning, Statistical Identification of
Language. Computing Research
Laboratory Memorandum (1994) MCCS-94-273. [10] http://en.wikipedia.org/wiki/Optical_cha racter_recognition#References [11] http://homepages.inf.ed.ac.uk/rbf/HIPR2 /connect.htm.