Giả sử chƣơng trình đọc một ảnh và lần lƣợt thực hiện việc dò biên, phát hiện góc nghiêng và quay lại văn bản.
62
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
KẾT LUẬN
Xử lý ảnh văn bản là một bộ phận quan trọng của nghành xử lý ảnh và có nhiều ứng dụng trong khoa học và thực tiễn. Một nhiệm vụ quan trọng của xử lý ảnh văn bản và tự động hoá công việc văn phòng. Một cách tất yếu và tự nhiên, vấn đề đầu tiên trong xử lý ảnh văn bản là bài toán góc nghiêng văn bản, một bài toán kinh điển trong xử lý ảnh văn bản.
Nội dung khoá luận này tìm hiểu bài toán góc nghiêng văn bản và các phƣơng pháp phát hiện và chỉnh sửa góc nghiêng văn bản. Phƣơng pháp dùng biến đổi Hough xác định góc nghiêng là một trong những phƣơng pháp dễ hiểu, phổ biến và đã đƣợc nhiều ngƣời áp dụng. Tuy nhiên, sự khác nhau quan trọng giữa thuật toán đƣợc trình bày ở đây và các phƣơng pháp khác là những cải tiến cho độ chính xác, chi phí tính toán .
Thứ nhất, biến đổi Hough không phải đƣợc áp dụng cho tất cả các điểm ảnh của một đối tƣợng, tức là áp dụng biến đổi Hough cho tất cả các điểm đen của ảnh. Ở đây phƣơng pháp chỉ áp dụng cho những điểm giữa đáy của những hình chữ nhật ngoại tiếp các đối tƣợng có kích thƣớc chủ đạo trong ảnh, nhờ đó giảm đƣợc đáng kể chi phí tính toán mà vẫn đảm bảo đƣợc độ chính xác.
Thứ hai, nhờ có các ngƣỡng kích thƣớc phân loại chúng ta đã loại bớt đi đƣợc một số lƣợng lớn các đối tƣợng phi ký tự nhƣ nhiễu, picture,…và độ chính xác của thuật toán đƣợc củng cố đáng kể và có khả năng cho góc nghiêng chính xác với những trƣờng hợp đặc biệt. Việc dùng ngƣỡng để cho ra những đối tƣợng có kích thƣớc chủ đạo trong ảnh xuất phát từ quan điểm nhìn nhận sự vật của mắt ngƣời và đặc trƣng của ảnh văn bản là các đối tƣợng chủ yếu là ký tự. Các ngƣỡng kích thƣớc đƣợc xác định một cách tự động trong chƣơng trình dựa vào công cụ là biểu đồ tần suất xuất hay histogram các kích thƣớc của đối tƣợng.
Thuật toán đã đƣợc cài đặt bằng công cụ ngôn ngữ lập trình Visual C++
và thử nghiệm nhiều với bộ test đa dạng. Kết quả thử nghiệm đã chứng minh tính chính xác của thuật toán và khả năng làm việc với nhiều loại văn bản khác nhau cũng nhƣ các góc lệch khác nhau.
63
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trong phần giới thiệu một số phƣơng pháp và thuật toán, đã liệt kê một số kết quả nghiên cứu liên quan, trình bày một số phƣơng pháp giải quyết bài toán góc nghiêng văn bản. Với những phƣơng pháp phổ biến nhƣ phƣơng pháp dùng hình chiếu, phƣơng pháp áp dụng biến đổi Hough, phƣơng pháp phân tích láng giềng gần nhất, phƣơng pháp dựa vào đƣờng thẳng đều có những thuật toán kèm theo đƣợc trình bày một cách tóm tắt và sau mỗi phƣơng pháp là những nhận xét, so sánh khách quan về ƣu điểm và những tồn tại của các phƣơng pháp này với nhau.
Tuy thuật toán đã đƣợc cài đặt thành công đối với ảnh đen trắng, nhƣng vẫn không tránh khỏi những thiếu sót trong quá trình làm đề tài này và đây cũng là một trong những mặt tồn tại.
* Hƣớng phát triển trong tƣơng lai:
- Mở rộng chƣơng trình cho tất cả các định dạng ảnh. - Chƣơng trình đƣợc làm với ảnh nhiều màu.
64
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
TÀI LIỆU THAM KHẢO
[1]. Đỗ Năng Toàn, Phạm Việt Bình (2008), Giáo trình xử lý ảnh, Nhà xuất bản Khoa học và Kỹ thuật, 2008.
[2]. Lƣơng Mạnh Bá, Nguyễn Thanh Thủy (2002), Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học và Kỹ thuật, 2002
[3]. A.K. Das, B.Chada, A fast algorithm for skew detection of document images using morphological, roc of International Journal on Document Analysis and Recognition, vol.4, No.2 pp109-114, 2001.
[4]. Yang Cao, Shuhua Wang, Heng Li, Skew detection and correction in document images based on straight-line fitting, Pattern Recognition Letters, Inc, August 2003.
[5]. S. Hinds, J.Fisher, and D.D'Amato, Document skew detection method using run- length encoding and hough transforms, roceeding of 10th International Conference on Beijjing Grauate School of China University of Mining and Technology, Beijjing China.
[6]. Yue Lu, Chew Lim Tan, Improved Nearest-Neighbour Based Approach to Accurate Document Skew Estimation, Department of Computer Sience, School of Coputing National University of Singapore, Kent Ridge, Singapore 117543.
[7]. X, Jaing, H, Bunke, D, Widmer-Kljajo, Skew detection of document image by focused nearest-neighbour-clustering, Proc. Of the 5th International Conference on Document Analysis and Recognition, Bangalore. Pp. 629-632,1999.