1. Trang chủ
  2. » Thể loại khác

Luận văn Phát hiện và hiệu chỉnh góc nghiêng trong văn bản

20 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG………………… Luận văn Phát hiệu chỉnh góc nghiêng văn Phát hiệu chỉnh góc nghiêng văn Lời cảm ơn Em xin chân thành cảm ơn tất thầy cô giáo khoa công nghệ thông tin - trường đại học dân lập Hải Phòng nhiệt tình giảng dạy cung cấp cho em nhiều kiến thức quý báu Em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo PGS.TS Ngô Quốc Tạo, người tận tình hướng dẫn tạo điều thuận lợi để em hoàn thành đề tài Xin cảm ơn bạn khoa công nghệ thông tin - trường đại học dân lập Hải Phòng động viên, góp ý, trao đổi hỗ trợ tơi suốt thời gian qua Em xin chân thành cảm ơn! Hải Phòng, tháng 07 năm 2009 Sinh viên Lê Thành Long Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thơng Tin Phát hiệu chỉnh góc nghiêng văn Lời mở đầu Chương I : Tổng quan xử lý ảnh số tốn phát góc nghiêng 1.1 Xử lý ảnh 1.2 Các trình xử lý ảnh 1.3 Một số khái niệm liên quan 1.4 Ảnh PCX 10 1.4.1 Cấu trúc ảnh PCX: 10 1.4.2 Kỹ thuật nén ảnh PCX 12 1.4.3 Giải thuật nén ảnh PCX 14 1.5 Một số tốn phát góc nghiêng 15 Chương II : Các phương pháp phát góc nghiêng văn 17 2.1 Xác định góc nghiêng dựa vào thuật toán phân cụm láng giềng gần nhất: 17 2.1.1 Thuật tốn ước lượng góc nghiêng 19 2.1.2 Kết thử nghiệm 23 2.1.3 Kết luận 24 2.2 Xác định góc nghiêng dựa vào phép biến đổi Morphology 25 2.2.1 Bước tiền xử lý 27 2.2.2 Ước lượng thô 28 2.2.3 Áp dụng phép biến đổi Morphology 311 2.2.4 Ước lượng tinh 34 2.2.5 Kết thực nghiệm 37 2.3 Phương pháp ước lượng góc nghiêng dựa phép chiếu nghiêng 37 2.4 Ứng dụng phép biến đổi Hough để xác định độ nghiêng văn 40 Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn 2.4.1 Phép biến đổi Hough cho đường thẳng: 41 2.4.2 Thủ tục xác định độ nghiêng cho trang văn sử dụng phép biến đổi Hough: 48 2.4.3 Thủ tục xác định tâm cạnh dưới: 511 2.4.4 Thủ tục quay: 522 Chương III : Cài đặt chương trình 53 3.1 Sơ lược chương trình cài đặt 53 3.2 Chương trình thực nghiệm 57 Kết Luận 59 Tài liệu tham khảo 60 Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Lời mở đầu Trong số thông tin người thu nhận từ bên ngoài, cố đến 79% ghi nhận mắt tức dạng ảnh Vì xử lý ảnh ngành khoa học và phát triển mạnh cò ứng dụng rộng rãi khoa học đới sống thực tiễn Các hệ thống xử lý ảnh cho phép người thu nhận lưu trữ, phân tích nhận dạng ảnh Một phận quan trọng xử lý ảnh xử lý văn Một nhiện vụ đối tượng xử lý ảnh văn tự động hố cơng việc văn phịng Một vấn đề kinh điển xử lý ảnh văn tốn góc nghiêng văn Ngun nhân đẫn đến văn bị nghiêng góc xuất phát từ trình quét ảnh copy ảnh Do đặt ảnh vào bệ máy quét máy in công đoạn thực tay lên ảnh bị lệch so với bệ máy góc mà mắt thường không nhận thấy được, đẫn đến ảnh bị lệch góc tương ứng Văn bị lệch có ảnh hưởng lớn đến q trình xử lý ảnh tiếp theo, việc phát chỉnh sửa góc nghiêng văn nhiệm vụ quan đấu tiên xử lý ảnh văn Từ hai thập kỷ gần đây, với phát triển xử lý ảnh văn bản, có nhiều phương pháp thuật tốn cho tốn góc nghiêng văn Một cách tiếp cận phổ biến dễ hiểu phương pháp hình chiếu Phương pháp tính histogram cho góc khác góc lệch văn tương ứng góc có histogram lớn Một thuật tồn khác phát góc nghiêng văn dùng biến đổi Hough Biến đôi Hough dụng cho số điểm ảnh đại diện đối tượng dùng mảng tích luỹ để ước lượng góc nghiêng văn Trong số thuật tốn xác định góc nghiêng văn cách gom nhóm đối tượng láng giềng Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thơng Tin Phát hiệu chỉnh góc nghiêng văn ảnh vào sử dụng vector phương cho nhóm Ngồi phương pháp tiếp cận phổ biến tốn góc nghiêng văn cịn giải theo số phương pháp khác phương pháp dùng phép tốn hình thái, phương pháp dùng logic mờ, phương pháp biến đổi Fourire v.v Khóa luận trình bày vài phương pháp phát góc nghiêng phổ biến Cấu trúc khóa luận sau: Chương I: Tổng quan xử lý ảnh số tốn phát góc nghiêng Chương II: Trình bày phương pháp phát góc nghiêng Chương III: Cài đặt chương trình Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Chương I : Tổng quan xử lý ảnh số tốn phát góc nghiêng 1.1 Xử lý ảnh Xử lý ảnh (XLA) đối tượng nghiên cứu lĩnh vực thị giác máy, trình biến đổi từ ảnh ban đầu sang ảnh với đặc tính tuân theo ý muốn người sử dụng Xử lý ảnh gồm q trình phân tích, phân lớp đối tượng, làm tăng chất lượng, phân đoạn tách cạnh, gán nhãn cho vùng hay q trình biên dịch thơng tin hình ảnh ảnh Cũng xử lý liệu đồ hoạ, xử lý ảnh số lĩnh vực tin học ứng dụng Xử lý liệu đồ họa đề cập đến ảnh nhân tạo, ảnh xem xét cấu trúc liệu tạo chương trình Xử lý ảnh số bao gồm phương pháp kỹ thuật biến đổi, để truyền tải mã hoá ảnh tự nhiên Mục đích xử lý ảnh gồm: Biến đổi ảnh làm tăng chất lượng ảnh Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá nội dung ảnh Nhận biết đánh giá nội dung ảnh phân tích hình ảnh thành phần có ý nghĩa để phân biệt đối tượng với đối tượng khác, dựa vào ta mơ tả cấu trúc hình ảnh ban đầu Có thể liệt kê số phương pháp nhận dạng nhận dạng ảnh đối tượng ảnh, tách cạnh, phân đoạn hình ảnh,… Kỹ thuật dùng Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn nhiều y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ văn 1.2 Các trình xử lý ảnh Thu nhận ảnh Tiền xử lý Phân đoạn Tách đặc tính Nhận dạng giải thích Hình 1.1: Các giai đoạn xử lý ảnh Thu nhận ảnh: Đây cơng đoạn mang tính định trình XLA Ảnh đầu vào thu nhận qua thiết bị camera, sensor, máy scanner,v.v… sau tín hiệu số hóa Việc lựa chọn thiết bị thu nhận ảnh phụ thuộc vào đặc tính đối tượng cần xử lý Các thông số quan trọng bước độ phân giải, chất lượng màu, dung lượng nhớ tốc độ thu nhận ảnh thiết bị Tiền xử lý: Ở bước này, ảnh cải thiện độ tương phản, khử nhiễu, khử bóng, khử độ lệch,v.v… với mục đích làm cho chất lượng ảnh trở lên tốt nữa, chuẩn bị cho bước xử lý phức tạp sau trình XLA Quá trình thường thực lọc Phân đoạn ảnh: phân đoạn ảnh bước then chốt XLA Giai đoạn phân tích ảnh thành thành phần có tính chất dựa theo biên hay vùng liên thông Tiêu chuẩn để xác định vùng liên thơng màu, mức xám v.v… Mục đích phân đoạn ảnh để có miêu tả tổng hợp nhiều phần tử khác cấu tạo lên ảnh thơ Vì lượng thơng tin chứa ảnh lớn, đa số ứng dụng cần trích vài đặc trưng đó, cần có q trình Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thơng Tin Phát hiệu chỉnh góc nghiêng văn để giảm lượng thơng tin khổng lồ Q trình bao gồm phân vùng ảnh trích chọn đặc tính chủ yếu Tách đặc tính: Kết bước phân đoạn ảnh thường cho dạng liệu điểm ảnh thơ, hàm chứa biên vùng ảnh, tập hợp tất điểm ảnh thuộc vùng ảnh Trong hai trường hợp, chuyển đổi liệu thô thành dạng thích hợp cho việc xử lý máy tính cần thiết Để chuyển đổi chúng, câu hỏi cần phải trả lời nên biểu diễn vùng ảnh dạng biên hay dạng vùng hoàn chỉnh gồm tất điểm ảnh thuộc Biểu diễn dạng biên cho vùng phù hợp với ứng dụng quan tâm chủ yếu đến đặc trưng hình dạng bên ngồi đối tượng, ví dụ góc cạnh điểm uốn biên chẳng hạn Biểu diễn dạng vùng lại thích hợp cho ứng dụng khai thác tính chất bên đối tượng, ví dụ vân ảnh cấu trúc xương Sự chọn lựa cách biểu diễn thích hợp cho vùng ảnh phần việc chuyển đổi liệu ảnh thơ sang dạng thích hợp cho xử lý sau Chúng ta phải đưa phương pháp mô tả liệu chuyển đổi cho tính chất cần quan tâm đến làm bật lên, thuận tiện cho việc xử lý chúng Nhận dạng giải thích: Đây bước cuối q trình XLA Nhận dạng ảnh nhìn nhận cách đơn giản việc gán nhãn cho đối tượng ảnh Ví dụ nhận dạng chữ viết, đối tượng ảnh cần nhận dạng mẫu chữ, ta cần tách riêng mẫu chữ tìm cách gán ký tự bảng chữ tương ứng cho mẫu chữ thu ảnh Giải thích cơng đoạn gán nghĩa cho tập đối tượng nhận biết Chúng ta thấy rằng, khơng phải ứng dụng XLA bắt buộc phải tuân theo tất bước xử lý nêu trên, ví dụ ứng dụng chỉnh sửa ảnh nghệ thuật dừng lại bước tiền xử lý Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Một cách tổng qt chức xử lý bao gồm nhận dạng giải thích thường có mặt hệ thống phân tích ảnh tự động bán tự động, dùng để rút trích thơng tin quan trọng từ ảnh, ví dụ ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v… 1.3 Một số khái niệm liên quan Ảnh điểm ảnh: ảnh mảng số thực hai chiều (Ii j) có kích thước (m*n), phần tử Ii j (i=1 m, j=1 n) biểu thị mức xám ảnh vị trí (i, j) tương ứng Mức xám: số giá trị có điểm ảnh ảnh Các điểm láng giềng: giả sử (i, j) điểm ảnh, điểm 4-láng giềng : N4= {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}, điểm 8láng giềng : N8= N4 {(i-1, j-1); (i-1, j+1); (i+1, j -1); (i+1, j+1)} P3 P2 P1 P4 P P0 P5 P6 P7 Hình 1.2 Ma trận láng giềng kề Đối tượng ảnh: hai điểm P0 Pn E,E tập điểm vùng tập điểm nền, gọi 8-liên thông (hoặc 4-liên thông) E tồn tập điểm gọi đường (i0, j0) (in, jn) cho (i0, j0) = P0 (in, jn)= Pn, (ir, jr) E (ir, jr) 8-láng giềng (hoặc 4-láng giềng tương ứng) (ir-1, jr-1) với r= 1,2,…,n Quan hệ k-liên thông E (k=4,8) quan hệ phản xạ, đối xứng bắc cầu Bởi quan hệ tương đương Mỗi lớp tương đương gọi thành phần k-liên thông ảnh Về sau ta gọi thành phần k-liên thông ảnh đối tượng ảnh Sinh viên thực hiện: Lê Thành Long Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn 1.4 Ảnh PCX 1.4.1 Cấu trúc ảnh PCX: Phần đầu với số bytes 128 đến 127 Khoảng cố định cho file ảnh PCX Thông tin phần đầu có tác dụng chương trình đọc file phát dấu hiệu đắn file ảnh PCX đọc thông tin ảnh cần đọc Phần đầu file định nghĩa nhiều thơng số ảnh kích thước ảnh, bảng màu (nếu ảnh nhị phân) số thông tin khác Đối với phần đầu file PCX có tương đối nhiều khoảng trống mà không sử dụng Cấu trúc phần đầu file PCX gồm 16 thành phần chiếm 128 bytes Tên thành phần Số bytes manufacturer Vecsion Encoding bits_per_pixel Xmin Ymin Xmax Ymax Sinh viên thực hiện: Lê Thành Long Mô tả (Hãng sản xuất )luôn A0h Số hiệu phiên Dấu hiệu nén ảnh (Luôn 1) Số bits để mã hố pixel Toạ độ góc bên trái theo chiều x Toạ độ góc bên trái theo chiều y Toạ độ góc bên phải theo chiều x Toạ độ góc bên phải theo chiều y 10 Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn Bres Độ phân giải ngang Vres Độ phân giải dọc Pallette 48 Bảng màu n_server Dự trữ color_planes Số mặt phẳng màu bytes_per_line pallett_type Filler 58 Số bytes dòng quét Sử dụng bảng màu hay mức xám Số bytes cịn lại header Hình 1.3 Sơ đồ cấu trúc phần đầu file PCX Phần lưu trữ điểm ảnh: Phần nằm sau phần header Vì ảnh PCX đựoc lưu trữ theo kiểu nén nên kích thước ảnh phụ thuộc vào trình nén ảnh Đối với ảnh có kích thước, số bít mã hố cho điểm ảnh kích thước lưu trữ liệu cho ảnh tuỳ thuộc vào hiệu nén ảnh Phần bảng màu mở rộng: Vị trí bảng màu hay bảng mức xám mở rộng nằm cuối tệp Bảng sử dụng bảng màu hay bảng mức xám tuỳ thuộc vào trường (int)pallet_type phần PCXHEADER Bảng sử dụng cho loại file PCX đựơc mã hố bits/1 pixel.Vị trí bảng màu mở rộng nằm cuối tệp, sau phần nén điểm màu Kích thước phần 768 bytes Dấu hiệu thứ để nhận biết có bảng màu mở rộng hay khơng trường (char)version=5; dấu hiệu thứ hai bytes Sinh viên thực hiện: Lê Thành Long 11 Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn đứng đằng trước bảng màu phải 0xC0 Hội đủ bảng màu mở rộng hoạt động HEADER (128 bytes) Image Extended color Patlette (768 Bytes) Hình 1.4 Sơ đồ phân bố vùng thơng tin ảnh PCX 1.4.2 Kỹ thuật nén ảnh PCX a) Kiểu nén: Thông tin giá trị điểm xám cho điểm ảnh PCX lưu trữ theo kiểu nén, lưu trữ theo kiễu nén file phải tuân theo quy luật định: ma trận hai chiều để lưu trữ thông tin liên quan giá trị mức xám Kỹ thuật dùng để nén ảnh PCX kỹ thuật Run Length Encode (RLE), phần tử thông tin cần nén bytes b) Tỷ số nén: Trong kỹ thuật nén ảnh người ta quan tâm nhiều đến tỷ số nén Tỷ số nén ảnh tính tỷ số kích thước lưu trữ ảnh sau nén kích thước cần thiết để lưu trữ ảnh không nén Giá trị tỷ số phụ thuộc vào file ảnh, ảnh pcx 1,4 bits, xét yếu tố ảnh hưởng đến tỷ số nén ta thấy: Ảnh bits (hay ảnh nhị phân) bytes lưu trữ bits khả xuất mức xám lớn (50% cho mức xám) làm cho tần xuất lặp bits lớn, yếu tố làm tăng khả nén Nhưng phải bytes liên tiếp giống dịng qt có hiệu cho việc nén tức tần xuất lặp cho pixel mà gói pixel lặp giống nhau, yếu tố làm giảm khả Sinh viên thực hiện: Lê Thành Long 12 Ngành Công Nghệ Thông Tin Phát hiệu chỉnh góc nghiêng văn nén Vậy việc nén ảnh nhị phân có ý nghĩa ảnh có nền, cịn số ảnh nhị phân khác việc nén khơng có ý nghĩa có càn làm tăng thêm kích thưóc ảnh Ảnh bits (hay 16 màu) tương ứng với bits mã hố pixel, ảnh có pixel chứa bytes Khả xuất cho mức màu 1/16 Yếu tố làm giảm khả nén so với ảnh nhị phân Cần có bytes liên tiếp giống dịng qt có hiệu nén, tần số lặp pixel lặp gói gồm hai pixel, yếu tố làm tăng khả nén so với ảnh nhị phân Ảnh bits (hay ảnh 256 màu) tương ứng với bits hay bytes mã hoá pixel Khả xuất cho mức màu 1/256, yếu tố làm giảm khả nén so với ảnh nhị phân ảnh bits cần bytes (hay pixel) liên tiếp giống mà nằm dòng qt có hiệu nén Như ảnh Pcx 1,4,8 bits màu loại có yếu tăng giảm khả nén ảnh sử dụng dùng số mức màu định bảng màu có khả nén cao c) Dấu hiệu nén file ảnh PCX: Cấu trúc nén dòng ảnh bao gồm hai bytes, bytes đầu dấu hiệu nén số bytes nén, bytes chứa số màu bytes Bytes dùng làm dấu hiệu nén bytes đặc biệt chia làm hai phần hình vẽ sau: phần cố định 1 x x x x x x phần ghi số đếm Hỉnh 1.5 Cấu trúc bytes dấu hiệu Sinh viên thực hiện: Lê Thành Long 13 Ngành Công Nghệ Thơng Tin Phát hiệu chỉnh góc nghiêng văn Phần cố định C0h (1100 0000b), có bits cao 1, số bits thấp lại (gồm bits) dùng để số bytes giống liên tiếp Như cấu trúc ghi tối đa 63 bytes giống Đọc dòng ảnh vào mảng chiều p t:=0; Gọi số bytes cho dòng quét Bytes i = 0; ((P[t+i]=P[t+i+1]) and (t+i=C0h? Y N Write(C1h) t

Ngày đăng: 14/02/2023, 13:23

w