CHƢƠNG 1 : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ FORM TÀI LIỆU
2.2 PHÁT HIỆN VÀ HIỆU CHỈNH GÓC NGHIÊNG
2.2.2.2. Áp dụng phép chiếu nghiêng trong việc phát hiện và hiệu chỉnh góc nghiêng văn
góc nghiêng văn bản
Áp dụng đặc tính đỉnh của phép chiếu có thể đạt cực đại khi góc nghiêng bằng 0, chúng ta có thể sử dụng phép chiếu cho các góc quay khác nhau đối với ảnh văn bản đầu vào. Đặc tính phép chiếu trích ra từ mỗi góc quay đƣợc so sánh với nhau để xác định đỉnh nào lớn nhất, qua đó xác định góc nghiêng của ảnh văn bản.
Việc ƣớc lƣợng góc nghiêng văn bản dựa trên phƣơng pháp chiếu nghiêng đƣợc thực hiện bởi 3 hàm sau:
Hàm F, dùng để giảm số lƣợng điểm ảnh cơ sở từ ảnh nguồn I, đầu vào là một tập các bộ ba (x, y, w) biểu diễn toạ độ và mức xám của các điểm ảnh. Các điểm ảnh cơ sở sẽ là tập những điểm đƣợc tính toán để thể hiện một số đặc trƣng của ảnh, đây là những điểm mà ta sẽ áp dụng phép chiếu nghiêng để xác định góc nghiêng văn bản. Chúng ta mong muốn những điểm ảnh cơ sở này biểu diễn các ký tự trong ảnh nguồn.
Hàm chiếu P, thực hiện chiếu các điểm ảnh cơ sở giữa những đƣờng thẳng song song vào một mảng tích luỹ A có chiều cao cố định. Góc của phép chiếu, θ, biến thiên trong khoảng [θmin, θmax] và phép chiếu đƣợc thực hiện với mỗi góc mong muốn. Quá trình này sẽ tạo ra một chuỗi các mảng tích luỹ Aθ tƣơng ứng với mỗi góc θ.
Mỗi lần phép chiếu thực hiện xong tại góc θ, hàm tối ƣu ϕ tính toán giá trị giới hạn cho mỗi mảng tích luỹ Aθ. Nếu giá trị giới hạn của mảng tích luỹ Aθ nào đạt cực đại thì góc θ tƣơng ứng với mảng tích luỹ đó sẽ là ƣớc lƣợng góc nghiêng của ảnh văn bản
Nhƣ vậy, việc đầu tiên là phải giảm tập điểm ảnh từ ảnh đầu vào để xác định các điểm cơ sở, việc này có thể thực hiện bằng cách xác định những thành phần liên thông từ ảnh đầu vào thông qua kỹ thuật dò biên đã trình bày ở mục trƣớc, từ đó xác định đƣợc các điểm trọng tâm của hình chữ nhật ngoại tiếp thành phần liên thông, phép chiếu sẽ thực hiện với các điểm trọng tâm này.
Tại mỗi góc quay θ của phép chiếu, thay vì thực hiện quay ảnh theo góc θ rồi áp dụng phép chiếu (vừa tốn bộ nhớ vừa giảm thời gian tính toán), mỗi điểm ảnh cơ sở M(x,y) sẽ đƣợc quay 1 góc θ với tâm O (ứng với điểm thuộc hàng trên cùng và cột đầu tiên) thành điểm M’ nằm trên hàng y’ = y * cos(θ) + x * sin(θ). Sau mỗi
phép chiếu ta thu đƣợc mảng tích luỹ Aθ[p], 0 ≤ p ≤ Height, Height là chiều cao của ảnh đầu vào
Một hàm tiêu chuẩn sẽ tính toán giá trị đỉnh đặc thù của mỗi phép chiếu. Hàm đƣợc lựa chọn trong luận văn này là hàm đƣợc đề xuất bởi Bard, có công thức nhƣ sau: heightA A 0 2
Sau cùng sẽ lựa chọn hàm tiêu chuẩn có giá trị cực đại, góc θ ứng với hàm tiêu chuẩn đó chính là góc nghiêng của ảnh văn bản.
Thuật toán có thể đƣợc mô phỏng nhƣ sau:
find_conn_comp_xy (image[], NROWS, NCOLS, &comp[], &ncomps ); for theta = -angle to +angle by resolution do
{
for i = 0 to ncomps do {
rotate(comp[i].center_y, comp[i].center_x, theta, &new_row); ++proj_prof[new_row];
}
angle_measure[theta] = criterion_function(proj_prof[]); }
skew_angle = choose_skew(angle_measure[]);