1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện và hiệu chỉnh góc nghiêng trong văn bản

60 600 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 60
Dung lượng 808,5 KB

Nội dung

Phát hiệu chỉnh góc nghiêng văn Lời cảm ơn Em xin chân thành cảm ơn tất thầy cô giáo khoa công nghệ thông tin - trường đại học dân lập Hải Phòng nhiệt tình giảng dạy cung cấp cho em nhiều kiến thức quý báu Em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo PGS.TS Ngô Quốc Tạo, người tận tình hướng dẫn tạo điều thuận lợi để em hoàn thành đề tài Xin cảm ơn bạn khoa công nghệ thông tin - trường đại học dân lập Hải Phòng động viên, góp ý, trao đổi hỗ trợ suốt thời gian qua Em xin chân thành cảm ơn! Hải Phòng, tháng 07 năm 2009 Sinh viên Lê Thành Long Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Lời mở đầu .3 Chương I : Tổng quan xử lý ảnh số toán phát góc nghiêng 1.1 Xử lý ảnh 1.2 Các trình xử lý ảnh 1.3 Một số khái niệm liên quan 1.4 Ảnh PCX 10 1.4.1 Cấu trúc ảnh PCX: .10 1.4.2 Kỹ thuật nén ảnh PCX 12 1.4.3 Giải thuật nén ảnh PCX 14 1.5 Một số toán phát góc nghiêng .15 Chương II : Các phương pháp phát góc nghiêng văn 17 2.1 Xác định góc nghiêng dựa vào thuật toán phân cụm láng giềng gần nhất: 17 2.1.1 Thuật toán ước lượng góc nghiêng .19 2.1.2 Kết thử nghiệm 23 2.1.3 Kết luận 24 2.2 Xác định góc nghiêng dựa vào phép biến đổi Morphology 25 2.2.1 Bước tiền xử lý 27 2.2.2 Ước lượng thô 28 2.2.3 Áp dụng phép biến đổi Morphology 30 2.2.4 Ước lượng tinh 34 2.2.5 Kết thực nghiệm 37 2.3 Phương pháp ước lượng góc nghiêng dựa phép chiếu nghiêng 37 2.4 Ứng dụng phép biến đổi Hough để xác định độ nghiêng văn 40 2.4.1 Phép biến đổi Hough cho đường thẳng: .41 2.4.2 Thủ tục xác định độ nghiêng cho trang văn sử dụng phép biến đổi Hough: 48 2.4.3 Thủ tục xác định tâm cạnh dưới: 51 2.4.4 Thủ tục quay: 51 Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Chương III : Cài đặt chương trình 52 Kết Luận 59 Tài liệu tham khảo 60 Lời mở đầu Trong số thông tin người thu nhận từ bên ngoài, cố đến 79% ghi nhận mắt tức dạng ảnh Vì xử lý ảnh ngành khoa học và phát triển mạnh cò ứng dụng rộng rãi khoa học đới sống thực tiễn Các hệ thống xử lý ảnh cho phép người Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn thu nhận lưu trữ, phân tích nhận dạng ảnh Một phận quan trọng xử lý ảnh xử lý văn Một nhiện vụ đối tượng xử lý ảnh văn tự động hoá công việc văn phòng Một vấn đề kinh điển xử lý ảnh văn toán góc nghiêng văn Nguyên nhân đẫn đến văn bị nghiêng góc xuất phát từ trình quét ảnh copy ảnh Do đặt ảnh vào bệ máy quét máy in công đoạn thực tay lên ảnh bị lệch so với bệ máy góc mà mắt thường không nhận thấy được, đẫn đến ảnh bị lệch góc tương ứng Văn bị lệch có ảnh hưởng lớn đến trình xử lý ảnh tiếp theo, việc phát chỉnh sửa góc nghiêng văn nhiệm vụ quan đấu tiên xử lý ảnh văn Từ hai thập kỷ gần đây, với phát triển xử lý ảnh văn bản, có nhiều phương pháp thuật toán cho toán góc nghiêng văn Một cách tiếp cận phổ biến dễ hiểu phương pháp hình chiếu Phương pháp tính histogram cho góc khác góc lệch văn tương ứng góc có histogram lớn Một thuật toàn khác phát góc nghiêng văn dùng biến đổi Hough Biến đôi Hough dụng cho số điểm ảnh đại diện đối tượng dùng mảng tích luỹ để ước lượng góc nghiêng văn Trong số thuật toán xác định góc nghiêng văn cách gom nhóm đối tượng láng giềng ảnh vào sử dụng vector phương cho nhóm Ngoài phương pháp tiếp cận phổ biến toán góc nghiêng văn giải theo số phương pháp khác phương pháp dùng phép toán hình thái, phương pháp dùng logic mờ, phương pháp biến đổi Fourire v.v Khóa luận trình bày vài phương pháp phát góc nghiêng phổ biến Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Cấu trúc khóa luận sau: Chương I: Tổng quan xử lý ảnh số toán phát góc nghiêng Chương II: Trình bày phương pháp phát góc nghiêng Chương III: Cài đặt chương trình Chương I : Tổng quan xử lý ảnh số toán phát góc nghiêng Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn 1.1 Xử lý ảnh Xử lý ảnh (XLA) đối tượng nghiên cứu lĩnh vực thị giác máy, trình biến đổi từ ảnh ban đầu sang ảnh với đặc tính tuân theo ý muốn người sử dụng Xử lý ảnh gồm trình phân tích, phân lớp đối tượng, làm tăng chất lượng, phân đoạn tách cạnh, gán nhãn cho vùng hay trình biên dịch thông tin hình ảnh ảnh Cũng xử lý liệu đồ hoạ, xử lý ảnh số lĩnh vực tin học ứng dụng Xử lý liệu đồ họa đề cập đến ảnh nhân tạo, ảnh xem xét cấu trúc liệu tạo chương trình Xử lý ảnh số bao gồm phương pháp kỹ thuật biến đổi, để truyền tải mã hoá ảnh tự nhiên Mục đích xử lý ảnh gồm: • Biến đổi ảnh làm tăng chất lượng ảnh • Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá nội dung ảnh Nhận biết đánh giá nội dung ảnh phân tích hình ảnh thành phần có ý nghĩa để phân biệt đối tượng với đối tượng khác, dựa vào ta mô tả cấu trúc hình ảnh ban đầu Có thể liệt kê số phương pháp nhận dạng nhận dạng ảnh đối tượng ảnh, tách cạnh, phân đoạn hình ảnh,… Kỹ thuật dùng nhiều y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ văn Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn 1.2 Các trình xử lý ảnh Thu nhận ảnh Tiền xử lý Phân đoạn Tách đặc tính Nhận dạng giải thích Hình 1.1: Các giai đoạn xử lý ảnh Thu nhận ảnh: Đây công đoạn mang tính định trình XLA Ảnh đầu vào thu nhận qua thiết bị camera, sensor, máy scanner,v.v… sau tín hiệu số hóa Việc lựa chọn thiết bị thu nhận ảnh phụ thuộc vào đặc tính đối tượng cần xử lý Các thông số quan trọng bước độ phân giải, chất lượng màu, dung lượng nhớ tốc độ thu nhận ảnh thiết bị Tiền xử lý: Ở bước này, ảnh cải thiện độ tương phản, khử nhiễu, khử bóng, khử độ lệch,v.v… với mục đích làm cho chất lượng ảnh trở lên tốt nữa, chuẩn bị cho bước xử lý phức tạp sau trình XLA Quá trình thường thực lọc Phân đoạn ảnh: phân đoạn ảnh bước then chốt XLA Giai đoạn phân tích ảnh thành thành phần có tính chất dựa theo biên hay vùng liên thông Tiêu chuẩn để xác định vùng liên thông màu, mức xám v.v… Mục đích phân đoạn ảnh để có miêu tả tổng hợp nhiều phần tử khác cấu tạo lên ảnh thô Vì lượng thông tin chứa ảnh lớn, đa số ứng dụng cần trích vài đặc trưng đó, cần có trình để giảm lượng thông tin khổng lồ Quá trình bao gồm phân vùng ảnh trích chọn đặc tính chủ yếu Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Tách đặc tính: Kết bước phân đoạn ảnh thường cho dạng liệu điểm ảnh thô, hàm chứa biên vùng ảnh, tập hợp tất điểm ảnh thuộc vùng ảnh Trong hai trường hợp, chuyển đổi liệu thô thành dạng thích hợp cho việc xử lý máy tính cần thiết Để chuyển đổi chúng, câu hỏi cần phải trả lời nên biểu diễn vùng ảnh dạng biên hay dạng vùng hoàn chỉnh gồm tất điểm ảnh thuộc Biểu diễn dạng biên cho vùng phù hợp với ứng dụng quan tâm chủ yếu đến đặc trưng hình dạng bên đối tượng, ví dụ góc cạnh điểm uốn biên chẳng hạn Biểu diễn dạng vùng lại thích hợp cho ứng dụng khai thác tính chất bên đối tượng, ví dụ vân ảnh cấu trúc xương Sự chọn lựa cách biểu diễn thích hợp cho vùng ảnh phần việc chuyển đổi liệu ảnh thô sang dạng thích hợp cho xử lý sau Chúng ta phải đưa phương pháp mô tả liệu chuyển đổi cho tính chất cần quan tâm đến làm bật lên, thuận tiện cho việc xử lý chúng Nhận dạng giải thích: Đây bước cuối trình XLA Nhận dạng ảnh nhìn nhận cách đơn giản việc gán nhãn cho đối tượng ảnh Ví dụ nhận dạng chữ viết, đối tượng ảnh cần nhận dạng mẫu chữ, ta cần tách riêng mẫu chữ tìm cách gán ký tự bảng chữ tương ứng cho mẫu chữ thu ảnh Giải thích công đoạn gán nghĩa cho tập đối tượng nhận biết Chúng ta thấy rằng, ứng dụng XLA bắt buộc phải tuân theo tất bước xử lý nêu trên, ví dụ ứng dụng chỉnh sửa ảnh nghệ thuật dừng lại bước tiền xử lý Một cách tổng quát chức xử lý bao gồm nhận dạng giải thích thường có mặt hệ thống phân tích ảnh tự động bán tự Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn động, dùng để rút trích thông tin quan trọng từ ảnh, ví dụ ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v… 1.3 Một số khái niệm liên quan Ảnh điểm ảnh: ảnh mảng số thực hai chiều (I i j) có kích thước (m*n), phần tử I i j (i=1 m, j=1 n) biểu thị mức xám ảnh vị trí (i, j) tương ứng Mức xám: số giá trị có điểm ảnh ảnh Các điểm láng giềng: giả sử (i, j) điểm ảnh, điểm 4-láng giềng : N4= {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}, điểm 8láng giềng : N8= N4 ∪ {(i-1, j-1); (i-1, j+1); (i+1, j -1); (i+1, j+1)} P3 P2 P1 P4 P P0 P5 P6 P7 Hình 1.2 Ma trận láng giềng kề Đối tượng ảnh: hai điểm P Pn ∈ E , E ⊆ tập điểm vùng tập điểm nền, gọi 8-liên thông (hoặc 4-liên thông) E tồn tập điểm gọi đường (i 0, j0) (in, jn) cho (i0, j0) = P0 (in, jn)= Pn, (ir, jr) ∈ E (ir, jr) 8-láng giềng (hoặc 4-láng giềng tương ứng) (ir-1, jr-1) với r= 1,2,…,n Quan hệ k-liên thông E (k=4,8) quan hệ phản xạ, đối xứng bắc cầu Bởi quan hệ tương đương Mỗi lớp tương đương gọi thành phần k-liên thông ảnh Về sau ta gọi thành phần k-liên thông ảnh đối tượng ảnh Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn 1.4 Ảnh PCX 1.4.1 Cấu trúc ảnh PCX: Phần đầu với số bytes 128 đến 127 Khoảng cố định cho file ảnh PCX Thông tin phần đầu có tác dụng chương trình đọc file phát dấu hiệu đắn file ảnh PCX đọc thông tin ảnh cần đọc Phần đầu file định nghĩa nhiều thông số ảnh kích thước ảnh, bảng màu (nếu ảnh nhị phân) số thông tin khác Đối với phần đầu file PCX có tương đối nhiều khoảng trống mà không sử dụng Cấu trúc phần đầu file PCX gồm 16 thành phần chiếm 128 bytes Tên thành phần Số bytes manufacturer Vecsion Encoding bits_per_pixel Xmin Ymin Xmax Ymax Bres Vres Pallette n_server 2 48 Sinh viên thực hiện: Lê Thành Long Mô tả (Hãng sản xuất )luôn A0h Số hiệu phiên Dấu hiệu nén ảnh (Luôn 1) Số bits để mã hoá pixel Toạ độ góc bên trái theo chiều x Toạ độ góc bên trái theo chiều y Toạ độ góc bên phải theo chiều x Toạ độ góc bên phải theo chiều y Độ phân giải ngang Độ phân giải dọc Bảng màu Dự trữ Ngành Công Nghệ Thông Tin 10 Phát hiệu chỉnh góc nghiêng văn tính được xét miền không gian, bước (5) -chính bước này- lặp lại thường xuyên với tham số có thay đổi chút ít, ví dụ để tránh đạt dòng gần song song bắt buộc ứng dụng cụ thể 6) Dừng quay lại bước (3) Cấu trúc điều khiển: Mảng liệu đòi hỏi: Hough(1 Hx_max,1 Hy_max) với trị nguyên Nhập khởi tạo không gian Hough: Nhập tham số MAX_NUM S_inkr (cp.below); α_step := 5; d_step :=3; Hx_max:=dmax/d_step; Hy_max:=180/α_step; {Trong số trường hợp phải thay 180 360, chẳng hạn cần phân biệt phần với phần đường thẳng} array Hough(1 Hx_max, Hy_max):integer; for Hx:=1 to Hx_max for Hy:=1 to Hy_max Hough(Hx, Hy):=0; Xếp tất điểm ảnh (x,y) phù hợp vào không gian Hough: MAX:=0; {Đếm giá trị lớn thời không gian Hough} for (tất điểm (x,y) phù hợp ảnh) for Hy:=1 to Hy_max begin {Lần lượt với tất giá trị α, d tính theo α} α:=(Hy-1) α_step; {α tính theo độ} d:=x.cosα + y.sinα; Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 46 Phát hiệu chỉnh góc nghiêng văn {Nếu cần đổi α sang radian} Hx:=integer(d/d_step + 1.5); {d 0, Hx 1} if ((Hx >= 1) and (Hx = S then begin Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 47 Phát hiệu chỉnh góc nghiêng văn α := (Hy-1).α_step; d := (Hx-1).d _step; đường thẳng d:=x.cosα + y.sinα xác định không gian x,y (α d xác định) NUM:=NUM+1; End; {then} Until NUM Baird sử dụng kích thước hộp (bin size) tương ứng với 1/3 kích thước ký tự điểm độ phân giải tiêu biểu, Pi(q) giá trị (bin) thứ i tìm với góc θ 4) Cực đại hoá hàm: n A(θ ) = ∑ Pi (θ ) i =1 Với n số hộp (bin) góc cho giá trị cực đại góc nghiêng Một lần ước lượng góc nghiêng có ích, giảm số phép tìm kiếm cần thiết để tìm giá trị cực đại Nếu sẵn ước lượng, tìm kiếm sử dụng, tốn thời gian Tuy nhiên, lân cận đúng, dùng phép tìm kiếm thô đến mịn (coarse to fine) Phương pháp bình phương tối thiểu phi tuyến đề xuất Sự xác thu từ thuật toán đạt tới 1/30 độ, với 1/2 độ điển hình Sơ đồ 2.13 cung cấp ví dụ phương pháp ứng dụng để quay ảnh- thực để nhận biết góc nghiêng, so sánh với giá trị tìm thuật toán Sơ đồ 2.13a phần văn Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 49 Phát hiệu chỉnh góc nghiêng văn bản quay 10°, sơ đồ 2.13b cho thấy phép quay 15° Sau phân ngưỡng (sơ đồ 2.13c-d), hai bước đầu thuật toán Baird áp dụng, điểm tâm hợp biên vẽ điểm ảnh đen (sơ đồ 2.13e-f) đường thẳng khớp (best-fit) qua pixel đen nằm góc nghiêng văn Hình 2.14 Thuật toán Hough cho xác định độ nghiêng Tuy vậy, thay thực hết thuật toán xác định góc tốt nhờ sử dụng phép chiếu, histogram tính toán bình phương tối thiểu, người ta thử phương pháp khác để ước lượng góc Sau cùng, tiêu chuẩn bình phương tối thiểu dùng nhiều lần Thuật toán Baird trình bày sử dụng phép biến đổi Hough cho đường thẳng để xác định góc nghiêng trang ảnh tài liệu Để cài đặt thuật toán cần phải thực thêm thủ tục xác định tâm cạnh hình hộp bao quanh ký tự Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 50 Phát hiệu chỉnh góc nghiêng văn 2.4.3 Thủ tục xác định tâm cạnh dưới: Thủ tục nhằm xác định điểm đại diện cho ký tự dùng thuật toán Baird sử dụng phép biến đổi Hough cho đường thẳng xác định góc nghiêng ảnh văn Thuộc tính: ảnh (Image): ảnh bilevel ảnh đa cấp xám với điểm ảnh gán nhãn ( BACK-nền, OBJECT-thuộc ký tự) Đầu vào: File ảnh có thuộc tính phù hợp Thủ tục nhằm xác định điểm đại diện cho ký tự dùng thuật toán Baird sử dụng phép biến đổi Hough cho đường thẳng xác định góc nghiêng ảnh văn Để xác định tâm cạnh thủ tục thực bước sau: (a) Dò từ xuống từ trái qua phải để tìm điểm thuộc ký tự (b) Đánh dấu “điểm ký tự” liên thông với điểm tìm (a) (c) Xác định hộp biên quanh vùng liên thông (b) (d) Xác định đánh dấu tâm cạnh đáy hộp biên (c) (e) Xoá thành vùng liên thông tìm (b) (f)Thoát quay lại (a) 2.4.4 Thủ tục quay: Trong luận văn có đưa số thủ tục quay cho ảnh đen trắng, ảnh đa cấp xám Nói chung thủ tục quay dừng lại mức tham khảo, chủ yếu thủ tục quay dùng để quay lại ảnh văn xác định góc nghiêng qua thủ tục phần 2.4.3 Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 51 Phát hiệu chỉnh góc nghiêng văn Đối với thủ tục quay góc đặc biệt (±90°, 180°), dùng đặc điểm quan hệ ảnh trước sau quay: - Quay 90°: I(x, y)  I(y, width –x) - Quay -90°: I(x, y)  I(height –y, x) - Quay 180°: I(x, y)  I(height- x, width- y) Trong (height, width) kích thước ảnh sau quay Do dùng đặc điểm nên thủ tục có tốc độ tương đối nhanh, đồng thời phép quay cho ánh xạ một nên độ mịn ảnh quay tuyệt đối Chương III : Cài đặt chương trình 3.1 Sơ lược chương trình cài đặt Ảnh đầu vào sau đọc xử lý qua giai đoạn tìm tâm cạnh đáy phục vụ cho giai đoạn xử lý góc nghiêng sau Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 52 Phát hiệu chỉnh góc nghiêng văn Tạo buffer pbuff1[1 h_max][1 w_max] để lưu thông tin phần ảnh, thao tác ảnh chuyển buffer Tạo buffer pbuff2[1 h_max][1 w_max] lưu tâm cạnh đánh dấu Thủ tục Markcc đánh dấu tâm cạnh hộp biên: int ulr, ulc, lrr, lrc; for i:=1 to h_max for j=0 to w_max {Dò từ xuống, từ trái qua phải điểm ảnh thuộc ký tự} if (pBuff1[i][j] == OBJECT) { Mark(pBuff1, i, j, 2); {Đánh dấu “điểm ký tự” liên thông với điểm (i,j)} bBox(pBuff1, i, j, 2, &ulr, &ulc, &lrr, &lrc); {Xác định hộp biên quanh ký tự} pBuff2[lrr][(lrc + ulc)/2] = BACK; {Đánh dấu tâm cạnh đáy hộp biên} UnMark(pBuff1, ulr, ulc, lrr, lrc, 2); {Xoá thành “điểm ký tự” đẫ đánh dấu} } return(pBuff2); /* -*/ Thủ tục Mark: Thủ tục đệ quy đánh dấu “điểm ký tự” liên thông với điểm (i,j): pBuff1[row][col] = (BYTE)MARK ; {MARK: mầu đánh dấu} if (row-1>=1 and col-1>=1 and pBuff1[row-1][col-1]== OBJECT) Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 53 Phát hiệu chỉnh góc nghiêng văn Mark(pBuff1, row-1, col-1, MARK); if (row-1>=1 and pBuff1[row-1][col]==OBJECT) Mark(pBuff1, row-1, col, MARK); if (row-1>=1 and col+1=1 and pBuff1[row][col-1]==OBJECT) Mark(pBuff1, row, col-1, MARK); if (col+1 < w_max and pBuff1[row][col+1]==OBJECT) Mark(pBuff1, row, col+1, MARK); if (row+1=1 and pBuff1[row+1][col-1]== OBJECT) Mark(pBuff1, row+1, col-1, MARK); if (row+1 < h_max and pBuff1[row+1][col] == OBJECT) Mark(pBuff1, row+1, col, MARK); if (row+1 w_max) je = w_max; else je = J+SIZE; {Tìm toạ lớn , nhỏ theo hàng cột} for i := is to ie for j := js to je if (pBuff1[i][j] == MARK) { if (i < ip1) ip1=i; if (i > ip2) ip2=i; if (j < jp1) jp1=j; if (j > jp2) jp2=j; } *ulr = ip1; {i min} *ulc = jp1; {j min} *lrr = ip2; {i max} *lrc = jp2; {j max} /* -*/ Thủ tục UnMark: Xoá vùng liên thông xác định tâm cạnh đáy for i := is to ie for j := js to je {is, ie, js, je: cửa sổ xác định bBox} if (pBuff1[i][j] == MARK) pBuff1[i][j] = BACK; Thủ tục Hough: Xác định góc nghiêng dựa buffer pbuff2 lưu tâm cạnh Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 55 Phát hiệu chỉnh góc nghiêng văn for (int omega=0; omega < 180; omega++) for (int r=0; r < 2*rmax+1; r++) z[omega][r] = (BYTE)0; {Mảng z mảng histogram lưu số điểm đại diện góc omega} {rmax: bán kính cực đại từ tâm đến góc bên trái} for (i=0; i[...]... Công Nghệ Thông Tin 16 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản Chương II : Các phương pháp phát hiện góc nghiêng trong văn bản 2.1 Xác định góc nghiêng dựa vào thuật toán phân cụm láng giềng gần nhất: Thuật toán láng giềng gần nhất dựa vào phương pháp phát hiện góc nghiêng tài liệu không yêu cầu sự hiện diện của một vùng văn bản nổi bật và không tùy thuộc vào hạn chế góc nghiêng Tuy nhiên, nói... cơ bản của toàn văn bản sẽ được chọn ra Cuối cùng, góc nghiêng của toàn văn bản sẽ được ước lượng từ các hướng đã Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 25 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản chọn ra này Tuy nhiên, phương pháp này chỉ áp dụng được cho các văn bản có độ nghiêng là ±5o và độ chính xác là 0.5o Das và Chanda cũng dùng các phép đóng, mở trên các dòng văn. .. để ước lượng góc nghiêng của ảnh văn bản Tuy nhiên, khác với các phương pháp khác, phương pháp này có thể phù hợp với tất cả các loại văn bản với bất kì góc nghiêng Hơn thế nữa, trong phương pháp này hầu hết tất cả các tham số Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 26 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản được tính toán dựa trên ảnh văn bản đầu vào Do đó trong phương... thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 24 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản nghiêng của các tài liệu khác nhau, mà không giới hạn góc nghiêng, và không có yêu cầu của vùng văn bản nổi bật Nó có khả năng giải quyết với các tài liệu của các chữ viết khác nhau và thậm chí với các hướng văn bản khác nhau xuất hiện trên cùng một ảnh Vì vậy, nó có khả năng giải quyết các vấn đề góc. .. nghiêng của văn bản rơi vào Cuối cùng, với những tham số tìm thấy ở bước đầu tiên, sẽ thực hiện các phép đóng và mở cho các dòng văn bản để tạo thành các vệt tạo thuận lợi cho bước xác định góc nghiêng tiếp theo Sau đó một thuật toán đơn giản sẽ được dùng để xác định góc của mỗi dòng văn bản và góc nghiêng của toàn bộ văn bản cũng sẽ được tìm thấy dựa trên góc nghiêng của các dòng văn bản 2.2.1 Bước... dưới) Trong mỗi profile (bottom hay left), góc của mỗi cặp điểm lân cận được tính và thống kê vào trong lược đồ góc Lân cận của một điểm p trong Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 28 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản ảnh profile được xác định bằng cách quét tất cả các điểm (trừ p) trong một hình chữ nhật có kích thước (2W, 2H) với tâm là điểm p, trong đó W và. .. vấn đề ước lượng góc nghiêng của những văn bản có góc nghiêng tùy ý Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 32 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản (a) (b) (c) Hình 2.9 Ví dụ của việc sử dụng phép đóng và mở với những phần tử cấu trúc nghiêng Hình 2.9a là những ảnh đưa vào ban đầu Hình 2.9b là kết quả của việc áp dụng bước tiền xử lý, ước lượng thô, và phép đóng tương... tích lớn nhất trong 9 khoảng của đồ thị tương ứng sẽ được chọn ra Trong hai khoảng vừa tìm được, ta chọn khoảng có diện tích lớn hơn và đó cũng chính là khoảng mà góc nghiêng văn bản thuộc về Trong hình 2.6, khoảng được chọn là khoảng tìm thấy từ left profile (hình 2.6(c)) (a) Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 29 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản (b) (c) (d)... Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin 30 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản (4) I • E = ( I ⊕ E ) Θ E Phép tự giãn (k-fold dilation) của tập hợp các thành phần cấu trúc E là: (⊕ k E ) = ( E ⊕ E ⊕ ⊕ E ) / k , k ≥ 1 Trong bước này, chúng ta sẽ thực hiện các phép đóng và mở cho các (5) dòng văn bản Phép đóng dùng để nối các kí tự trong một từ, và các từ trong một dòng,... Tin 15 Phát hiện và hiệu chỉnh góc nghiêng trong văn bản Biến đổi Hough ánh xạ một đường thẳng trong mặt phẳng thành các cặp (r,ϕ) trong không gian Hough với r là khoảng cách từ gốc tọa độ tới đường thẳng đó và ϕ là góc nghiêng của đường thẳng đó so với trục hoành Góc nghiêng văn bản tương ứng là góc có tổng số điểm lớn nhất nằm trên những đường thẳng cùng lệch góc Sinh viên thực hiện: Lê Thành Long ... giềng: giả sử (i, j) điểm ảnh, điểm 4-láng giềng : N4= {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}, điểm 8láng giềng : N8= N4 ∪ {(i-1, j-1); (i-1, j+1); (i+1, j -1 ); (i+1, j+1)} P3 P2 P1 P4 P P0 P5... (a-c) hình 2.3 (a-c) minh họa K-NNC với K = 2; K = 3, K ≥ tương ứng Nói ngắn gọn trình K - NNC với tất K ≥ đưa vào hình Hình 2.2 (d-f) hình 2.3 (d-f) cho thấy đường kết nối NNC hình 2.2 (a-c)... gọi 8-liên thông (hoặc 4-liên thông) E tồn tập điểm gọi đường (i 0, j0) (in, jn) cho (i0, j0) = P0 (in, jn)= Pn, (ir, jr) ∈ E (ir, jr) 8-láng giềng (hoặc 4-láng giềng tương ứng) (ir-1, jr-1) với

Ngày đăng: 25/01/2016, 15:35

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1) Lương Mạnh Bá, Nguyễn Thanh Thủy, Nhập môn xử lý ảnh số, Nhà xuất bản Khoa Học và Kỹ Thuật Sách, tạp chí
Tiêu đề: Nhập môn xử lý ảnh số
Nhà XB: Nhà xuất bản Khoa Học và Kỹ Thuật
2) Đỗ Năng Toàn, Phạm Việt Bình, Giáo trình môn học xử lý ảnh, Đại Học Thái Nguyên Sách, tạp chí
Tiêu đề: Giáo trình môn học xử lý ảnh
3) Yang Cao, Heng Li, Skew detection and correction in document images based on straight-line fitting, Building &amp; Real Estate Department, the Hong Kong Polytechnic University, Hong Kong Sách, tạp chí
Tiêu đề: Skew detection and correction in document images based on straight-line fitting
4) Yue Lu, Chew Lim Tan, Improved Nearest Neighbor Based Approach to Accurate Document Skew Estimation, Department of Computer Science, School of Computing National University of Singapore, Kent Ridge, Singapore 117543 {fluy,tanclg}@comp.nus.edu.sg Sách, tạp chí
Tiêu đề: Improved Nearest Neighbor Based Approach to Accurate Document Skew Estimation
5) L.Najman, Using Mathematical Morphology for Document Skew Estimation, Laboratoire A2SI, Groupe ESIEE Cité Descartes, BP99 93162 Noisy-le-Grand Cedex France l.najman@esiee.fr Sách, tạp chí
Tiêu đề: Using Mathematical Morphology for Document Skew Estimation
6) Kanai, J., Bagdanov, A.D, Projection Profile Based Skew Estimation Algorithm for JBIG Compressed Images, Int. J. Document Analysis and Recognition Sách, tạp chí
Tiêu đề: Projection Profile Based Skew Estimation Algorithm for JBIG Compressed Images

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w