1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng

72 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 72
Dung lượng 0,92 MB

Nội dung

ĐẠI HỌC THÁI NGUN KHOA CƠNG NGHỆ THƠNG TIN Hồng Thị Vân Anh TÌM HIỂU MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN VÀ ỨNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGƠ QUỐC TẠO Thái Ngun - 2010 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên Tai ngay!!! Ban co the xoa dong chu nay!!! http://www.lrc-tnu.edu.vn LỜI CẢM ƠN Em xin trân trọng cảm ơn thầy giáo, cô giáo Viện Công nghệ thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên nhiệt tình giảng dạy hết lịng giúp đỡ em trình học tập nghiên cứu đề tài Luận văn hồn thành Khoa Cơng nghệ thơng tin hướng dẫn PGS.TS Ngô Quốc Tạo Em xin bày tỏ lịng kính trọng biết ơn sâu sắc tới thầy Em xin chân thành cảm ơn bạn đồng nghiệp phịng Khảo thí & Đảm bảo chất lượng trường Đại học Hải Phòng tạo điều kiện giúp đỡ q trình hồn thành luận văn Sự quan tâm, giúp đỡ gia đình bạn bè, đặc biệt lớp Cao học K7 Khoa Công nghệ thông tin cổ vũ, động viên em suốt thời gian học tập thực đề tài Mặc dù có nhiều cố gắng song luận văn khơng thể tránh khỏi thiếu sót, tác giả mong nhận đóng góp ý kiến thầy cô bạn Xin chân thành cảm ơn! Thái Nguyên, tháng 11 năm 2010 Tác giả Hoàng Thị Vân Anh Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Tìm hiểu số kỹ thuật phát góc nghiêng văn ứng dụng” tơi tự tìm hiểu đƣợc hồn thành dƣới hƣớng dẫn thầy giáo PGS TS Ngô Quốc Tạo Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i MỤC LỤC Trang Trang phụ bìa Lời cam đoan Mục lục i Danh mục bảng iv Danh mục hình vẽ iv MỞ ĐẦU CHƢƠNG I TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN 1.1 Xử lý ảnh vấn đề xử lý ảnh 1.1.1 Xử lý ảnh gì? Hình 1.2: Các giai đoạn xử lý ảnh 1.1.2 Các vấn đề xử lý ảnh 1.1.2.1 Nắn chỉnh biến dạng 1.1.2.2 Khử nhiễu 1.1.2.3 Chỉnh mức xám 1.1.2.4 Phân tích ảnh 1.1.2.5 Nhận dạng ảnh 1.1.2.6 Nén ảnh 1.2 Bài tốn phát góc nghiêng văn 1.2.1 Giới thiệu tốn phát góc nghiêng văn 1.2.2 Biên phƣơng pháp phát biên 1.2.2.1 Biên đối tƣợng ảnh 1.2.2.2 Phƣơng pháp phát biên trực tiếp 1.2.2.3 Phƣơng pháp phát biên gián tiếp 11 1.2.2.4 Thuật tốn dị biên tổng qt 12 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ii CHƢƠNG II 15 MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN 15 2.1 Biến đổi Hough 15 2.1.1 Đƣờng thẳng Hough 15 2.1.2 Áp dụng biến đổi Hough xác định góc nghiêng văn .19 2.1.3 Thuật tốn phát góc nghiêng văn 20 2.1.4 Chỉnh sửa góc nghiêng văn 22 2.2 Phƣơng pháp hình chiếu 23 2.2.1 Thuật toán Postl 25 2.2.2 Thuật toán Baird 25 2.2.3 Thuật toán Nakano 26 2.3 Phép toán hình thái - Morphology 26 2.3.1 Phƣơng pháp .26 2.3.2 Bƣớc tiền xử lý .28 2.4 Phƣơng pháp phân tích láng giềng 35 2.4.1 Phƣơng pháp .35 2.4.2 Thuật toán Yue Lu Chew Lim Tan 37 2.5 Phƣơng pháp đƣờng thẳng 38 2.5.1 Tƣ tƣởng thuật tốn phát góc nghiêng văn .39 2.5.1.1 Chọn miền xác định đối tƣợng 39 2.5.1.2 Lựa chọn đối tƣợng 40 2.5.2 Bó cụm điểm chủ đạo 41 2.5.2.1 Định nghĩa 41 2.5.2.2 Phân cụm điểm chủ đạo 42 2.5.3 Lựa chọn đƣờng sở 42 2.5.3.1 Phân loại điểm chủ đạo 42 2.5.3.2 Xác định đƣờng thẳng sử dụng phƣơng pháp bình phƣơng nhỏ 44 2.5.4 Thuật tốn phát góc nghiêng .45 2.5.4.1 Thuật tốn định hƣớng góc nghiêng đơn giản 45 2.5.4.2 Thuật tốn 46 2.5.5 Thuật tốn sửa góc nghiêng 47 2.5.5.1 Mơ hình qt dòng văn 47 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iii 2.5.5.2 Thuật toán chỉnh sửa góc nghiêng 48 2.5.5.3 Kết thử nghiệm 49 Bảng 1: Kết thực nghiệm phƣơng pháp phát góc nghiêng 49 2.6 Một vài phƣơng pháp khác 50 CHƢƠNG 51 NÂNG CAO TỐC ĐỘ VÀ CHẤT LƢỢNG 51 PHÁT HIỆN GÓC NGHIÊNG 51 3.1 Xử lý ảnh có độ phân giải thấp 51 3.2 Tự động xác định ngƣỡng phân loại 52 3.2.1 Mục đích ý nghĩa việc dùng ngƣỡng 52 3.2.2 Ý tƣởng xuất phát 53 3.2.3 Phƣơng pháp thực .53 3.3 Một vài trƣờng hợp ngoại lệ 56 CHƢƠNG 59 CÀI ĐẶT THỬ NGHIỆM 59 4.1 Sơ đồ chức chƣơng trình 59 4.2 Thiết kế Menu 60 4.3 Giao diện chƣơng trình 61 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 64 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iv DANH MỤC BẢNG BIỂU Bảng 1: Kết thực nghiệm phƣơng pháp phát góc nghiêng………………………………………………………………… 49 DANH MỤC HÌNH VẼ Hình 1.1 Q trình xử lý ảnh Hình 1.2: Các giai đoạn xử lý ảnh Hình 1.3a Hình 1.3b Hình 1.4a: Các 4- láng giềng điểm ảnh P 11 Hình 1.4b: Các 8- láng giềng điểm ảnh P 11 Hình 1.5a.Chu tuyến ngồi 12 Hình 1.5b Chu tuyến 12 Hình 1.6: Chu tuyến chu tuyến đối tƣợng 12 Hình 1.7: Hƣớng láng giềng điểm ảnh 13 Hình 1.8a: Hƣớng xác định cặp vùng xuất phát 14 Hình 1.8b: Hƣớng xác định cặp vùng 14 Hình 2.1: Biến đổi Hough cho đƣờng thẳng 16 Hình 2.2: Tham số r – φ đƣờng thẳng 16 Hình 2.3: Biến đổi Hough khơng gian r-  17 Hình 2.4: Các hình chữ nhật ngoại tiếp 18 Hình 2.5 : Áp dụng biến đổi Hough phát góc nghiêng văn 19 Hình 2.6 Quay điểm ảnh quanh gốc tọa độ 22 Hình 2.7 Hiện tƣợng rỗ ảnh sau quay 23 Hình 2.8 a Ảnh gốc 23 Hình 2.8b Ảnh bị nghiêng 50 23 Hình 2.8 Phƣơng pháp hình chiếu đƣợc tính từ ảnh hình 2.8a, 2.8b 24 Số hóa Trung tâm Học liệu - Đại học Thái Ngun http://www.lrc-tnu.edu.vn v Hình 2.9 Một ví dụ dịng văn có xu hƣớng dính lại với ảnh hƣởng dấu 27 Hình 2.10: Các điểm left most bottom bottom most left 28 Hình 2.11: Những khoảng góc nghiêng khác đƣợc sử dụng để ƣớc lƣợng góc nghiêng phù hợp cho phần tử cấu trúc 31 Hình 2.12: Một vài ví dụ việc sử dụng phép đóng mở với phần tử cấu trúc nghiêng 32 Hình 2.13: Một thành phần liên thông dài với hệ tọa độ ảnh 33 Hình 2.14a Định nghĩa điểm chủ đạo 41 Hình 2.14b Định hƣớng góc nghiêng 41 Hình 2.15: Điểm chủ đạo dòng văn 43 Hình 2.16: Quan hệ láng giềng điểm chủ đạo 43 Hình 2.17: Định hƣớng thuật tốn phát góc nghiêng 45 Hình 2.18: Mơ hình qt dịng văn 47 Hình 3.1 Một ảnh văn nghiêng có độ phân giải thấp 51 Hình 3.2: Ví dụ ảnh văn nghiêng với nhiều đối tƣợng phức tạp ký tự 52 Hình 3.3: Sơ đồ phân bố histogram chu vi trƣớc gom 55 Hình 3.4: Sơ đồ phân bố histogram chu vi sau gom 56 Hình 3.5 Ví dụ ảnh nghiêng có ký tự chữ 56 Hình 3.6 : Ví dụ văn nghiêng có đối tƣợng bao 57 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỞ ĐẦU Lý chọn đề tài Thông tin ngƣời thu nhận từ giới bên ngoài, đến 80% đƣợc ghi nhận mắt tức dạng ảnh Vì xử lý ảnh ngành khoa học đã, phát triển mạnh có ứng dụng rộng rãi khoa học đời sống thực tiễn nhƣ vẽ đồ, lĩnh vực quảng cáo, siêu thị, quân sự… Các hệ thống xử lý ảnh cho phép ngƣời thu nhận lƣu trữ, phân tích nhận dạng ảnh, phận quan trọng xử lý ảnh xử lý văn Một nhiệm vụ đối tƣợng xử lý ảnh văn tự động hóa cơng việc văn phịng Hiện phần lớn lƣợng thơng tin cịn đƣợc lƣu trữ, trình bày phân phối thơng qua phƣơng tiện chủ yếu giấy ngƣời tin tƣởng nhận đƣợc văn giấy Tuy nhiên có xu hƣớng phát triển để chia sẻ trao đổi thơng tin điện tử, cần thiết để chuyển đổi từ tài liệu giấy sang tài liệu điện tử để lƣu trữ, khơi phục bảo trì ngày tăng lên Để chuyển đổi từ tài liệu giấy sang dạng điện tử kỹ thuật thƣờng gồm ba bƣớc: quét công nghệ kỹ thuật số, phân tích bố cục nhận dạng ký tự Khi văn đƣợc quét vào máy, văn bị nghiêng tránh khỏi yếu tố khác đƣa ảnh vào Hầu hết thuật toán nhận dạng ký tự, phân tích bố cục phổ biến nhƣng lại nhạy cảm biến dạng ảnh văn văn bị nghiêng gây lỗi nghiêm trọng cho việc phân tích văn Do phát chỉnh sửa ảnh văn bị nghiêng cần thiết giai đoạn tiền xử lý để tránh nhiễu trình xử lý nghiêng Một vấn đề xử lý ảnh văn tốn góc nghiêng văn Nguyên nhân dẫn đến văn bị nghiêng góc xuất phát từ q trình qt ảnh copy ảnh, dẫn đến ảnh bị lệch góc tƣơng Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ứng Văn bị lệch có ảnh hƣởng lớn đến q trình xử lý ảnh tiếp theo, việc phát chỉnh sửa góc nghiêng văn nhiệm vụ quan trọng xử lý ảnh văn Với lý nên em chọn đề tài: “Tìm hiểu số kỹ thuật phát góc nghiêng văn ứng dụng” Mục tiêu nghiên cứu Hiểu đƣợc phƣơng pháp phát góc nghiêng văn Từ đƣa nhận xét, so sánh phƣơng pháp Lựa chọn công cụ phát triển phù hợp cài đặt ứng dụng Đối tƣợng phạm vi nghiên cứu Tìm hiểu vài kỹ thuật phát góc nghiêng văn mặt lý thuyết, từ lựa chọn phƣơng pháp cài đặt ứng dụng vào thực tế Áp dụng ảnh văn đen trắng Ý nghĩa khoa học thực tiễn đề tài Hệ thống hoá kiến thức kỹ thuật phát góc nghiêng văn Việc tìm hiểu phát triển ứng dụng thành cơng giúp cho việc xử lý ảnh trở nên đơn giản dễ dàng số trƣờng hợp nhƣ: xử lý ảnh ban đầu ảnh theo mong muốn ngƣời dùng (ví dụ nhƣ ảnh bị nghiêng cần xử lý để thu đƣợc ảnh xác hơn…) Phƣơng pháp nghiên cứu 5.1 Dựa tài liệu - Tìm hiểu lý thuyết liên quan đến xử lý ảnh - Tìm hiểu lý thuyết kỹ thuật phát góc nghiêng văn chỉnh sửa 5.2 Phương pháp toán học - Xử lý số liệu thống kê Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 50 Adobe Photoshop 5.0, phần mềm ứng dụng xử lý ảnh 24s Một ví dụ kết chỉnh sửa theo phƣơng pháp đƣợc thực hình 2.19 Hình 2.19 Kết chỉnh sửa góc nghiêng văn 2.6 Một vài phƣơng pháp khác Năm 1998, nhóm tác giả Ogleg Okun, Pietikainen, Jaakko Sauvola thuộc khoa kỹ nghệ điện điện tử công nghệ thông tin trƣờng đại học Oulu Finland đề xuất phƣơng pháp phân loại đối tƣợng dùng logic mờ ( Fuzzy logic ) để loại bỏ bớt đối tƣợng phi ký tự sau dùng vector phƣơng tƣơng tự nhƣ phƣơng pháp phân tích láng ghiềng để góc lệch cho văn Zhixin Shi Govindaraju thuộc trung tâm phân tích nhận dạng văn trƣờng đại học quốc gia Mỹ Buffalo đề xuất phƣơng pháp phát góc nghiêng văn phƣơng pháp nén chạy dài mờ (Fuzzy Runlength) Nhóm tác giả E Kavallieratou, N Fakotakis G Kokkinakis thuộc trƣờng đại học Patras Hy lạp đề xuất phƣơng pháp hồn tồn mới, dùng tích phân lớp Cohen xác định góc nghiêng văn Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 51 CHƢƠNG NÂNG CAO TỐC ĐỘ VÀ CHẤT LƢỢNG PHÁT HIỆN GĨC NGHIÊNG 3.1 Xử lý ảnh có độ phân giải thấp Mục đích giai đoạn biến đổi ảnh có độ phân giải thấp tức đối tƣợng bị phân đoạn Sau đƣa đƣợc ảnh nhiều màu phức tạp ảnh thứ cấp với đối tƣợng ký tự đơn sắc, độ phân giải ảnh thấp ký tự bị phân thành nhiều vùng đối tƣợng, hình minh họa ảnh văn nghiêng có độ phân giải thấp Từ hình vẽ ta thấy, số ký tự bị chia cắt thành nhiều phần riêng biệt Nhiệm vụ ta nối chúng lại với để đƣợc ký tự Tuy vùng đối tƣợng ký tự có màu nhƣng chúng khơng liên thơng nên lẽ phải áp dụng biến đổi Hough cho ký tự, nhƣng chia cắt ta lại áp dụng cho phần ký tự dẫn đến đƣa góc lệch sai cho văn Để khắc phục phần rời rạc đối tƣợng ta dùng phép tốn hình thái để hàn gắn đoạn đứt đối tƣợng Trƣớc hết ta định nghĩa phép tốn hình thái Hình 3.1 Một ảnh văn nghiêng có độ phân giải thấp Sử dụng ý tƣởng phép giản ảnh, thuật toán để hàn đoạn đứt ký tự lại với ta duyệt ảnh hai lần theo hai chiều dọc ngang Một điểm ảnh đƣợc gán lại giá trị màu thỏa mãn điều kiện hai điểm ảnh trực tiếp bên bên dƣới có màu gán lại giá trị màu cho điểm ảnh Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 52 Tƣơng tự hai điểm bên trái bên phải có màu gán lại màu cho điểm ảnh 3.2 Tự động xác định ngƣỡng phân loại Sau xây dựng đƣợc hàm dò biên tổng quát cho đối tƣợng Bƣớc ta dùng hàm để xác định đối tƣợng ảnh với biên chúng Một cách trực tiếp giống nhƣ số thuật toán khác, ta dùng biến đổi Hough áp dụng lên đáy hình chữ nhật ngoại tiếp đối tƣợng ƣớc lƣợng góc nghiêng cho văn Tuy nhiên, không làm nhƣ vậy, biến đổi Hough đƣợc áp dụng sau loại bớt số đối tƣợng ngƣỡng kích thƣớc 3.2.1 Mục đích ý nghĩa việc dùng ngưỡng Mục đích việc dùng ngƣỡng dựa vào thƣớc đo kích thƣớc để phân loại đối tƣợng Nói cách khác, dùng ngƣỡng phân loại ta phân biệt đƣợc cách tƣơng đối đối tƣợng ký tự đối tƣợng phi ký tự Nhờ biết phân biệt đối tƣợng, ta làm việc với đối tƣợng có kích thƣớc chủ đạo ảnh độ xác thuật tốn đƣợc cải thiện đáng kể Hình 3.2: Ví dụ ảnh văn nghiêng với nhiều đối tƣợng phức tạp ký tự Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 53 3.2.2 Ý tưởng xuất phát Giả sử ta có ảnh văn nghiêng nhƣ hình 3.2 Rõ ràng ảnh văn phức tạp với nhiều đối tƣợng phi ký tự số ký tự chữ ảnh Mặc dù vậy, cho ảnh bị nghiêng Vậy ta vào đâu kết luận ảnh bị nghiêng ? Đây quan điểm nhìn nhận vật mắt ngƣời Nếu ta lấy chữ làm chủ đạo ảnh vào chúng ta thấy ảnh bị nghiêng Nhƣng ta vào đối tƣợng nhà góc trái bên dƣới ảnh ta nói ảnh hồn tồn khơng nghiêng Nhƣ vậy, việc ảnh nghiêng hay không ta chọn đối tƣợng làm chủ đạo ảnh vào chúng để kết luận Trong ảnh văn bản, thông thƣờng đối tƣợng ký tự chiếm nhiều đối tƣợng khác Xuất phát từ quan điểm nhìn nhận vật mắt ngƣời đặc thù ảnh văn bản, gợi ý cho hƣớng giải tốn góc nghiêng xác định đối tƣợng chủ đạo ảnh ký tự, vào chúng để ƣớc lƣợng góc nghiêng Ý tƣởng để xác định đối tƣợng có kích thƣớc chủ đạo ảnh dùng kỹ thuật lập biểu đồ tần xuất hay histogram kích thƣớc để ƣớc lƣợng ký tự có tần số xuất nhiều văn mà ta gọi đối tƣợng chuẩn Với ảnh đầu vào, ta xác định đối tƣợng chuẩn riêng tự động chƣơng trình Sau đó, lấy đối tƣợng làm chuẩn so sánh đối tƣợng cịn lại với Những đối tƣợng có kích thƣớc xấp xỉ kích thƣớc đối tƣợng đƣợc chọn để áp dụng biến đổi Hough Một đối tƣợng đƣợc xem xấp xỉ kích thƣớc đối tƣợng khác chênh lệch kích thƣớc chúng bé ngƣỡng đƣợc định nghĩa trƣớc 3.2.3 Phương pháp thực Trƣớc xác định đối tƣợng chuẩn, ta loại bớt đối tƣợng có kích thƣớc đƣợc xem kỳ lạ nhiễu, chúng đối tƣợng bé lớn so với ký tự bình thƣờng văn Thực nghiệm cho thấy, ảnh văn bản, dù font chữ nào, cỡ chữ 10 ký tự có Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 54 chiều rộng lớn pixel, chiều cao lớn chu tuyến có 12 pixel Tƣơng tự nhƣ văn bình thƣờng, ký tự có chiều rộng chiều cao bé 50 pixel với font chữ 48 Nhƣ vậy, loại trừ mà ta dễ dàng có đƣợc bỏ qua đối tƣợng trình xác định chu tuyến Và lƣu lại đối tƣợng có kích thƣớc thõa mãn điều kiện cho trình xử lý Đối tƣợng chuẩn đƣợc đặc trƣng ba kích thƣớc chiều rộng, chiều dài chu vi đƣợc ký hiệu WidAvr, HeiAvr PrmAvr Để ƣớc lƣợng đƣợc kích thƣớc đối tƣợng chuẩn, ta dùng kỹ thuật lập biểu đồ tần xuất hay histogram kích thƣớc đối tƣợng Giả sử tất đối tƣợng đƣợc xác định chu tuyến sau loại bỏ đối tƣợng có kích thƣớc kỳ lạ, ta đƣợc mảng Rec[N] chứa hình chữ nhật ngoại tiếp đối tƣợng Những hình chữ nhật mang ba thông tin Rec[i].Wid, Rec[i].Hei Rec[i].Prm tƣơng ứng chiều rộng, chiều cao chu vi đối tƣợng đƣợc dò biên lần thứ i Ta dùng mảng để xác định kích thƣớc WidAvr, HeiAvr PrmAvr Phƣơng pháp xác định giá trị tƣơng tự nhƣ Chẳng hạn, để xác định giá trị cho PrmAvr từ mảng Rec[N] ta thực theo bƣớc sau: Bước 1: Từ mảng Rec[N], tính histogram cho phần tử Rec[i].Prm tƣơng tự nhƣ histogram màu ảnh Histogram Rec[i].Prm cho biết số đối tƣợng có chu vi chu tuyến ngồi Rec[i].Prm ảnh Ta ký hiệu His[Rec[i].Prm] Bước 2: Dùng kỹ thuật gom histogram theo phân đoạn Ví dụ histogram giá trị phân đoạn từ đến 30 đƣợc cộng dồn vào histogram 20 theo công thức: His[20]=His[20]+ His[Rec[i].Prm] His[Rec[i].Prm] đƣợc gán lại Rec[i].Prm thuộc khoảng từ tới 30 với i từ đến N Bước 3: Sắp xếp mảng His [M] lại theo chiều tăng dần Giá trị chu vi ứng với His lớn đƣợc chọn làm chu vi trung bình Trong thuật toán, phân đoạn dùng gom histogram chu vi đƣợc chọn có độ dài 16, nghĩa đối tƣợng có Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 55 chu vi miền có độ rộng 16 đƣợc gom lại cho đối tƣợng có giá trị chu vi nằm miền Cách xác định WidAvr HeiAvr hồn tồn tƣơng tự nhƣ cách xác định PrmAvr nhƣng khoảng giá trị gom histogram đƣợc dùng Hình vẽ 3.3, 3.4 dƣới minh hoạ sơ đồ phân bố histogram Prm[i] trƣớc sau gom histogram 400 350 300 250 200 150 100 50 30 60 90 120 150 chu vi Hình 3.3: Sơ đồ phân bố histogram chu vi trƣớc gom Sau có giá trị ngƣỡng, việc dùng chúng để phân loại đối tƣợng đơn giản so sánh kích thƣớc đối tƣợng với ngƣỡng Một đối tƣợng đƣợc áp dụng biến đổi Hough chiều rộng chiều cao khơng lớn lần chiều rộng chiều cao đối tƣợng trung bình có chu vi bé lần chu vi đối tƣợng trung bình Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 56 histogram 1000 800 600 400 200 30 60 90 120 150 chu vi PrmAvr Hình 3.4: Sơ đồ phân bố histogram chu vi sau gom 3.3 Một vài trƣờng hợp ngoại lệ Ảnh có q ký tự Trƣờng hợp thứ ảnh có ký tự chữ cái, chƣa đủ để xác định đƣợc góc nghiêng Các đối tƣợng ảnh chủ yếu picture nhiễu, đặc biệt ký tự nghiêng góc khác đặc thù riêng ảnh Hình vẽ dƣới minh hoạ ảnh văn nghiêng với số ký tự Hình 3.5 Ví dụ ảnh nghiêng có ký tự chữ Nhƣ vậy, sau loại bỏ đối tƣợng từ hàm xác định chu tuyến dùng ngƣỡng kích thƣớc số đối tƣợng đƣợc lựa chọn để áp dụng biến đổi Hough cịn lại Nếu tiếp tục bƣớc đƣa kết luận góc nghiêng Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 57 cho văn rõ ràng độ xác khơng đƣợc đảm bảo Lý đơn giản đối tƣợng đƣợc lựa chọn chƣa ký tự Chúng đối tƣợng phi ký tự nhƣng đƣợc lựa chọn kích thƣớc chúng thoả mãn ngƣỡng Việc xác định đối tƣợng chủ đạo ln mang tính tƣơng đối xác số đối tƣợng ký tự ảnh nhiều, ảnh có ký tự chắn đƣợc đối tƣợng đƣợc chọn ký tự Vì vậy, ta đƣa kết luận góc nghiêng cho văn trƣờng hợp số lƣợng đối tƣợng phải lớn ngƣỡng Trong chƣơng trình số lƣợng đƣợc chọn 70 đối tƣợng Các đối tượng bao Trƣờng hợp ngoại lệ khác đối tƣợng bao Đây cản trở thuật tốn xác định góc nghiêng khác đặc biệt thuật tốn theo phƣơng pháp phân tích láng giềng thân cận nhƣ đƣợc đề cập Mặc dù số ký tự văn nhiều nhƣng ký tự hầu hết bị chứa đối tƣợng khác lớn nhiều chẳng hạn nhƣ picture hay bảng biểu Hình vẽ dƣới minh họa cho cho trƣờng hợp ký tự bị bao đối tƣợng ảnh Hình 3.6 : Ví dụ văn nghiêng có đối tƣợng bao Khi đó, nhiệm vụ phải nhận đƣợc bao hàm đối tƣợng tách, lấy đƣợc đối tƣợng ký tự bị bao đối tƣợng lớn Ở đây, ta Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 58 dùng kỹ thuật bóc dần đối tƣợng lớn ngoại cỡ để xác định ký tự Một đối tƣợng đƣợc gọi có kích thƣớc ngoại cỡ đƣợc quy ƣớc đối tƣợng có chiều rộng chiều cao lớn 200 pixel Nếu q trình dị biên ta gặp đối tƣợng nhƣ vậy, ta cách li ra khỏi tập đối tƣợng xét Các đối tƣợng đƣợc dùng đến cuối số đối tƣợng đƣợc chọn để áp dụng biến đổi Hough bé 70 Ta xem nhƣ đối tƣợng ảnh tiếp tục duyệt đối tƣợng bên để lấy đối tƣợng ký tự Trong cài đặt, ta dùng kỹ thuật gọi bóc dần Bình thƣờng, sau xác định đƣợc chu tuyến cho đối tƣợng ta không duyệt điểm ảnh bên đối tƣợng cách đánh dấu lại đối tƣợng Nhƣng đối tƣợng có kích thƣớc lớn, ta lờ khơng đánh dấu Thay đánh dấu đối tƣợng ta thay đổi màu cho điểm biên thành màu nền, xem nhƣ chƣa xét đối tƣợng tiếp tục xét đối tƣợng bên Kỹ thuật gọi bóc dần lần xác định đƣợc biên đối tƣợng lớn ta thay đổi màu điểm biên thành màu tƣơng tự nhƣ bóc dần đối tƣợng để trật ký tự bên Để đánh dấu đối tƣợng, ta dùng phƣơng pháp gán nhãn cho đối tƣợng Mỗi đối tƣợng điểm cô lập mang nhãn số nguyên dƣơng Các đối tƣợng khác mang nhãn khác Những phần tử thuộc biên đối tƣợng đƣợc gán nhãn nhãn đối tƣợng Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 59 CHƢƠNG CÀI ĐẶT THỬ NGHIỆM Thuật tốn đƣợc cài đặt ngơn ngữ C ++ Windows môi trƣờng visual C ++ Microsoft 4.1 Sơ đồ chức chƣơng trình Ảnh gốc Dò biên Hệ thống Chỉnh văn Mở tệp Quay ngƣợc kim đồng hồ Đóng tệp Quay chiều kim đồng hồ Phóng to ảnh Thốt Thu nhỏ ảnh Làm béo Làm gầy Tăng ảnh Giảm ảnh Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 60 4.2 Thiết kế Menu Menu chƣơng trình Menu chi tiết chƣơng trình Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 61 4.3 Giao diện chƣơng trình Giả sử chƣơng trình đọc ảnh lần lƣợt thực việc dò biên, phát góc nghiêng quay lại văn Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 62 KẾT LUẬN Xử lý ảnh văn phận quan trọng nghành xử lý ảnh có nhiều ứng dụng khoa học thực tiễn Một nhiệm vụ quan trọng xử lý ảnh văn tự động hố cơng việc văn phòng Một cách tất yếu tự nhiên, vấn đề xử lý ảnh văn tốn góc nghiêng văn bản, tốn kinh điển xử lý ảnh văn Nội dung khoá luận tìm hiểu tốn góc nghiêng văn phƣơng pháp phát chỉnh sửa góc nghiêng văn Phƣơng pháp dùng biến đổi Hough xác định góc nghiêng phƣơng pháp dễ hiểu, phổ biến đƣợc nhiều ngƣời áp dụng Tuy nhiên, khác quan trọng thuật toán đƣợc trình bày phƣơng pháp khác cải tiến cho độ xác, chi phí tính tốn Thứ nhất, biến đổi Hough khơng phải đƣợc áp dụng cho tất điểm ảnh đối tƣợng, tức áp dụng biến đổi Hough cho tất điểm đen ảnh Ở phƣơng pháp áp dụng cho điểm đáy hình chữ nhật ngoại tiếp đối tƣợng có kích thƣớc chủ đạo ảnh, nhờ giảm đƣợc đáng kể chi phí tính tốn mà đảm bảo đƣợc độ xác Thứ hai, nhờ có ngƣỡng kích thƣớc phân loại loại bớt đƣợc số lƣợng lớn đối tƣợng phi ký tự nhƣ nhiễu, picture,…và độ xác thuật tốn đƣợc củng cố đáng kể có khả cho góc nghiêng xác với trƣờng hợp đặc biệt Việc dùng ngƣỡng đối tƣợng có kích thƣớc chủ đạo ảnh xuất phát từ quan điểm nhìn nhận vật mắt ngƣời đặc trƣng ảnh văn đối tƣợng chủ yếu ký tự Các ngƣỡng kích thƣớc đƣợc xác định cách tự động chƣơng trình dựa vào công cụ biểu đồ tần suất xuất hay histogram kích thƣớc đối tƣợng Thuật tốn đƣợc cài đặt cơng cụ ngơn ngữ lập trình Visual C++ thử nghiệm nhiều với test đa dạng Kết thử nghiệm chứng minh tính xác thuật toán khả làm việc với nhiều loại văn khác nhƣ góc lệch khác Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 63 Trong phần giới thiệu số phƣơng pháp thuật toán, liệt kê số kết nghiên cứu liên quan, trình bày số phƣơng pháp giải tốn góc nghiêng văn Với phƣơng pháp phổ biến nhƣ phƣơng pháp dùng hình chiếu, phƣơng pháp áp dụng biến đổi Hough, phƣơng pháp phân tích láng giềng gần nhất, phƣơng pháp dựa vào đƣờng thẳng có thuật tốn kèm theo đƣợc trình bày cách tóm tắt sau phƣơng pháp nhận xét, so sánh khách quan ƣu điểm tồn phƣơng pháp với Tuy thuật toán đƣợc cài đặt thành công ảnh đen trắng, nhƣng khơng tránh khỏi thiếu sót trình làm đề tài mặt tồn * Hƣớng phát triển tƣơng lai: - Mở rộng chƣơng trình cho tất định dạng ảnh - Chƣơng trình đƣợc làm với ảnh nhiều màu - Hoàn thiện mặt giao diện Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 64 TÀI LIỆU THAM KHẢO [1] Đỗ Năng Tồn, Phạm Việt Bình (2008), Giáo trình xử lý ảnh, Nhà xuất Khoa học Kỹ thuật, 2008 [2] Lƣơng Mạnh Bá, Nguyễn Thanh Thủy (2002), Nhập môn xử lý ảnh số, Nhà xuất Khoa học Kỹ thuật, 2002 [3] A.K Das, B.Chada, A fast algorithm for skew detection of document images using morphological, roc of International Journal on Document Analysis and Recognition, vol.4, No.2 pp109-114, 2001 [4] Yang Cao, Shuhua Wang, Heng Li, Skew detection and correction in document images based on straight-line fitting, Pattern Recognition Letters, Inc, August 2003 [5] S Hinds, J.Fisher, and D.D'Amato, Document skew detection method using runlength encoding and hough transforms, roceeding of 10th International Conference on Beijjing Grauate School of China University of Mining and Technology, Beijjing China [6] Yue Lu, Chew Lim Tan, Improved Nearest-Neighbour Based Approach to Accurate Document Skew Estimation, Department of Computer Sience, School of Coputing National University of Singapore, Kent Ridge, Singapore 117543 [7] X, Jaing, H, Bunke, D, Widmer-Kljajo, Skew detection of document image by focused nearest-neighbour-clustering, Proc Of the 5th International Conference on Document Analysis and Recognition, Bangalore Pp 629-632,1999 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Ngày đăng: 30/10/2023, 17:14

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w