Giả sử chương trình đọc một ảnh và lần lượt thực hiện việc dò biên, phát hiện góc nghiêng và quay lại văn bản.
KẾT LUẬN
Xử lý ảnh văn bản là một bộ phận quan trọng của nghành xử lý ảnh và có nhiều ứng dụng trong khoa học và thực tiễn. Một nhiệm vụ quan trọng của xử lý ảnh văn bản và tự động hoá công việc văn phòng. Một cách tất yếu và tự nhiên, vấn đề đầu tiên trong xử lý ảnh văn bản là bài toán góc nghiêng văn bản, một bài toán kinh điển trong xử lý ảnh văn bản.
Nội dung khoá luận này tìm hiểu bài toán góc nghiêng văn bản và các phương pháp phát hiện và chỉnh sửa góc nghiêng văn bản. Phương pháp dùng biến đổi Hough xác định góc nghiêng là một trong những phương pháp dễ hiểu, phổ biến và đã được nhiều người áp dụng. Tuy nhiên, sự khác nhau quan trọng giữa thuật toán được trình bày ở đây và các phương pháp khác là những cải tiến cho độ chính xác, chi phí tính toán .
Thứ nhất, biến đổi Hough không phải được áp dụng cho tất cả các điểm ảnh của một đối tượng, tức là áp dụng biến đổi Hough cho tất cả các điểm đen của ảnh. Ở đây phương pháp chỉ áp dụng cho những điểm giữa đáy của những hình chữ nhật ngoại tiếp các đối tượng có kích thước chủ đạo trong ảnh, nhờ đó giảm được đáng kể chi phí tính toán mà vẫn đảm bảo được độ chính xác.
Thứ hai, nhờ có các ngưỡng kích thước phân loại chúng ta đã loại bớt đi được một số lượng lớn các đối tượng phi ký tự như nhiễu, picture,…và độ chính xác của thuật toán được củng cố đáng kể và có khả năng cho góc nghiêng chính xác với những trường hợp đặc biệt. Việc dùng ngưỡng để cho ra những đối tượng có kích thước chủ đạo trong ảnh xuất phát từ quan điểm nhìn nhận sự vật của mắt người và đặc trưng của ảnh văn bản là các đối tượng chủ yếu là ký tự. Các ngưỡng kích thước được xác định một cách tự động trong chương trình dựa vào công cụ là biểu đồ tần suất xuất hay histogram các kích thước của đối tượng.
Thuật toán đã được cài đặt bằng công cụ ngôn ngữ lập trình Visual C++
và thử nghiệm nhiều với bộ test đa dạng. Kết quả thử nghiệm đã chứng minh
tính chính xác của thuật toán và khả năng làm việc với nhiều loại văn bản khác nhau cũng như các góc lệch khác nhau.
Trong phần giới thiệu một số phương pháp và thuật toán, đã liệt kê một số kết quả nghiên cứu liên quan, trình bày một số phương pháp giải quyết bài toán góc nghiêng văn bản. Với những phương pháp phổ biến như phương pháp dùng hình chiếu, phương pháp áp dụng biến đổi Hough, phương pháp phân tích láng giềng gần nhất, phương pháp dựa vào đường thẳng đều có những thuật toán kèm theo được trình bày một cách tóm tắt và sau mỗi phương pháp là những nhận xét, so sánh khách quan về ưu điểm và những tồn tại của các phương pháp này với nhau.
Tuy thuật toán đã được cài đặt thành công đối với ảnh đen trắng, nhưng vẫn không tránh khỏi những thiếu sót trong quá trình làm đề tài này và đây cũng là một trong những mặt tồn tại.
* Hướng phát triển trong tương lai:
- Mở rộng chương trình cho tất cả các định dạng ảnh.
- Chương trình được làm với ảnh nhiều màu.
- Hoàn thiện hơn về mặt giao diện.
TÀI LIỆU THAM KHẢO
[1]. Đỗ Năng Toàn, Phạm Việt Bình (2008), Giáo trình xử lý ảnh, Nhà xuất bản Khoa học và Kỹ thuật, 2008.
[2]. Lương Mạnh Bá, Nguyễn Thanh Thủy (2002), Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học và Kỹ thuật, 2002
[3]. A.K. Das, B.Chada. A fast algorithm for skew detection of document images using morphological. Proc of International Journal on Document Analysis and Recognition, vol.4, No.2 pp109-114, 2001.
[4]. G. Bessho, K. Ejiri and J.F.Cullen, “Fast and accurate skew detection alorithm for a text document with straight lines”, Proceedings of the SPIE – The Internation Society for Optical Enginerring, Conference on Document Recognition 2181 (February 9-10, 1994), 133-140.
[5]. S. Hinds, J.Fisher, and D.D'Amato. Document skew detection method using run-length encoding and hough transforms. Proceeding of 10th International Conference on Beijjing Grauate School of China University of Mining and Technology, Beijjing China.
[6]. Yue Lu, Chew Lim Tan. Improved Nearest-Neighbour Based Approach to Accurate Document Skew Estimation. Department of Computer Sience, School of Coputing National University of Singapore, Kent Ridge, Singapore 117543.
[7]. X, Jaing, H, Bunke, D, Widmer-Kljajo. Skew detection of document image by focused nearest-neighbour-clustering. Proc. Of the 5th International Conference on Document Analysis and Recognition, Bangalore. Pp. 629- 632,1999.