Hình 4 .15 Phát hiện góc nghiêng và xoay ảnh
Hình 4.22 Trang ảnh văn bản tồn tại nhiều góc nghiêng được phát hiện
KẾT LUẬN
Bên cạnh ngôn ngữ giao tiếp, các thông tin dưới dạng hình ảnh đóng một vai trò rất quan trọng trong việc trao đổi thông tin. Trong công nghệ thông tin, xử lý ảnh và đồ họa đã chiếm một vị trí rất quan trọng bởi vì các đặc tính đầy hấp dẫn đã tạo nên một sự phân biệt với các lĩnh vực khác. Chúng giới thiệu các phương pháp và kỹ thuật để tạo ra các ảnh và xử lý các ảnh này. Ta biết rằng phần lớn các thông tin mà con người thu thập được qua thị giác đều bắt nguồn từ các ảnh. Do đó việc xử lý ảnh và đồ họa là một bộ phận quan trọng trong việc trao đổi thông tin giữa người và máy.
Xử lý ảnh là một lĩnh vực rất rộng lớn gồm nhiều giai đoạn xử lý. Trong mỗi giai đoạn có nhiều vấn đề để nghiên cứu trong đó xử lý ảnh văn bản là một bộ phận quan trọng của ngành xử lý ảnh và có nhiều ứng dụng rộng rãi trong khoa học và đời sống thực tiễn. Một cách tự nhiên và tất yếu, vấn đề đầu tiên và cũng là vấn đề không thể tránh khỏi trong xử lý ảnh văn bản là bài tốn góc nghiêng ảnh văn bản.
Sở dĩ có thể kết luận rằng một văn bản bị nghiêng góc là vì chúng ta đã dựa vào một số đối tượng chủ đạo trong văn bản và quan sát thấy đường nối các điểm giữa đáy của chúng lệch đi một góc. Trên cơ sở nghiên cứu các thuật toán phép chiếu nghiêng, phân cụm láng giềng, biến đối Hough, tôi đã chọn và ứng dụng biến đổi Hough vào việc phát hiện và hiệu chỉnh góc nghiêng văn bản để việc xử lý ảnh văn bản đạt hiệu quả tốt nhất.
Mục tiêu của luận văn là tìm hiểu các kỹ thuật phát hiện góc nghiêng trên cơ sở đó ứng dụng vào hiệu chỉnh văn bản để nâng cao hiệu quả cho quá trình nhận dạng ảnh tiếp theo. Cụ thể luận văn đã đạt được các kết quả sau:
+ Trình bày tổng quan về xử lý ảnh và bài tốn phát hiện góc nghiêng văn bản. Phân tích ưu và nhược điểm và đưa ra nhận xét cụ thể cho mỗi phương pháp trong quá trình nghiên cứu.
+ Trình bày hệ thống những khái niệm cơ bản về biên và các phương pháp phát hiện biên nổi bật dưới góc độ xử lý ảnh.
+ Trên cơ sở những kỹ thuật đã nghiên cứu, tiến hành xây dựng một ứng dụng phát hiện và hiệu chỉnh góc nghiêng văn bản hỗ trợ cơng tác quản lý điểm, chấm thi trắc nghiệm và scan tài liệu điện tử.
Hướng phát triển:
+ Tích hợp thêm các thuật toán nâng cao chất lượng ảnh nhằm tăng khả năng phát hiện góc nghiêng.
+ Cài đặt các phương pháp phát hiện góc nghiêng khác: phân cụm láng giềng, phép tốn hình thái, hình chiếu nghiêng.
+ Thực hiện phát hiện góc nghiêng trên mọi loại ảnh văn bản.
+ Nghiên cứu thực hiện với ảnh văn bản có góc lệch - 200 và 200.
TÀI LIỆU THAM KHẢO
[1] Phạm Việt Bình, Cao Lê Mạnh Hà, Đỗ Năng Tồn, “Một cách tiếp cận mới trong phát hiện biên của ảnh đa cấp xám”. Hội thảo Quốc gia lần thứ 8 - Một số vấn đề chọn lọc của Công nghệ thơng tin và Truyền thơng,
Hải Phịng 25-27/08 /2005. Nxb KH&KT, Hà Nội 2006.
[2] Đỗ Năng Toàn, "Biên ảnh và một số tính chất", Tạp chí Khoa học Công
nghệ, Tập 40, số ĐB, 2002.
[3] Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến trong phát hiện góc nghiêng Văn bản”. Kỷ yếu Hội thảo Quốc
gia lần thứ 7 - Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông, Đà Nẵng 18-20/08 /2004. Nxb KH&KT, Hà Nội 2005.
[4] A Amin and S. Fischer, A Document Skew Detection Method Using the
Hough Transform, Pattern Analysis & Applications, 2000.
[5] H. Baird, “The skew angle of printed documents”. Society of Photographic Scientists and Engineers, 1987.
[6] J. Canny, A Computational Approach To Edge Detection, IEEE Trans.
Pattern Analysis and Machine Intelligence, 1986.
[7] Castan, S.; Zhao, J. and Shen, J."New edge detection methods based on exponential filter", Pattern Recognition, vol.1, Jun 1990.
[8] A.K. Das, B.Chada. A fast algorithm for skew detection of document images using morphological. Proc of International Journal on Document
[9] S. C. Hinds, J. L. Fisher and D. P. D'Amato. A Document Skew Detection
Method Using Run-Length Encoding and the Hough Transform. 10th
International Conference on Pattern Recognition, vol. 1, 1990.
[10] X. Jaing, H. Bunke, D. Widmer-Kljajo. Skew detection of document image by focused nearest-neighbour-clustering. Proc. Of the 5th
International Conference on Document Analysis and Recognition, Bangalore. 1999.
[11] Kimmel, Ron and Bruckstein, Alfred M. "On regularized Laplacian zero crossings and other optimal edge integrators", International Journal of Computer Vision, 2003.
[12] D. X. Le, "Automated Document Skew Angle Detection Using Projection Profiles, Variances, Component Labelling and the Hough Transform," M.S. thesis, Computer Science Department, George Mason University, November 17th, 1992.
[13] Shutao Li, Qinghua Shen and Jun Sun. Recognition Letters, Volume 28, Issue 5, 1 April 2007.
[14] Yue Lu and Chew Lim Tan, “A nearest neighbor chain based approach to skew estimation in document images”, Pattern Recognition Letters 24, 2003.
[15] A. Mahmoud Al-Shatnawi and Khairuddin Omar. “Skew Detection and Correction Technique for Arabic Document Images Based on Centre of Gravity”. Journal of Computer Science 5, 2009.
[16] L. Najman, “Using mathematical morphology for document skew estimation”, In procs. SPIE Document Recognition and Retrieval XI,
volume 5296, 2004.
[17] J.R. Paker, Algorithms for Image processing and Computer Vision. John Wiley & Sons, Inc, 1997.
[18] W. Postl, “Detection of linear oblique structures and skew scan in digitized documents”. Document Analysis and Recognition, 1986.
[19] Tahir Rabbani and Frank van den Heuvel, "Efficient hough transform for automatic detection of cylinders in point clouds", Proceedings of the 11th Annual Conference of the Advanced School for Computing and Imaging (ASCI '05), The Netherlands, June 2005.
[20] John C. Russ, The Image Procesing Handbook. CRC Press, Inc, 1995. [21] AL Shatnawi and K. Omar, Methods of Arabic baseline detection the
state of art. Int. J. Comput. Sci. Network Secur, 2008
[22] S. Srihari and V. Gonvindaraju. Analysis of texual images using hough
transform, 1989.
[23] T. Steinherz, N. Intrator and Rivlin , Skew Detection via Principal Components Analysis, Fifth International Conference on Document