tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng

72 434 0
tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN Hoàng Thị Vân Anh TÌM HIỂU MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN VÀ ỨNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGÔ QUỐC TẠO Thái Nguyên - 2010 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CẢM ƠN Em xin trân trọng cảm ơn các thầy giáo, cô giáo trong Viện Công nghệ thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên đã nhiệt tình giảng dạy và hết lòng giúp đỡ em trong quá trình học tập và nghiên cứu đề tài. Luận văn được hoàn thành tại Khoa Công nghệ thông tin dưới sự hướng dẫn của PGS.TS Ngô Quốc Tạo. Em xin bày tỏ lòng kính trọng và biết ơn sâu sắc tới thầy. Em cũng xin chân thành cảm ơn các bạn đồng nghiệp phòng Khảo thí & Đảm bảo chất lượng trường Đại học Hải Phòng đã tạo điều kiện giúp đỡ trong quá trình hoàn thành luận văn này. Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K7 Khoa Công nghệ thông tin đã cổ vũ, động viên em trong suốt thời gian học tập và thực hiện đề tài. Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu sót, tác giả mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn. Xin chân thành cảm ơn! Thái Nguyên, tháng 11 năm 2010 Tác giả Hoàng Thị Vân Anh Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng” là do tôi tự tìm hiểu và đƣợc hoàn thành dƣới sự hƣớng dẫn của thầy giáo PGS. TS Ngô Quốc Tạo. i Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỤC LỤC Trang Trang phụ bìa Lời cam đoan Mục lục i Danh mục các bảng iv Danh mục các hình vẽ iv MỞ ĐẦU 1 CHƢƠNG I 3 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN 3 GÓC NGHIÊNG VĂN BẢN 3 1.1. Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh. 3 1.1.1. Xử lý ảnh là gì? 3 Hình 1.2: Các giai đoạn trong xử lý ảnh 3 1.1.2. Các vấn đề cơ bản trong xử lý ảnh 4 1.1.2.1. Nắn chỉnh biến dạng 5 1.1.2.2. Khử nhiễu 5 1.1.2.3. Chỉnh mức xám 5 1.1.2.4. Phân tích ảnh 6 1.1.2.5. Nhận dạng ảnh 6 1.1.2.6. Nén ảnh 6 1.2. Bài toán phát hiện góc nghiêng văn bản 7 1.2.1. Giới thiệu bài toán phát hiện góc nghiêng văn bản. 7 1.2.2. Biên và phƣơng pháp phát hiện biên 8 1.2.2.1 Biên của đối tƣợng ảnh 8 1.2.2.2 Phƣơng pháp phát hiện biên trực tiếp 9 1.2.2.3 Phƣơng pháp phát hiện biên gián tiếp 11 1.2.2.4. Thuật toán dò biên tổng quát 12 ii Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn CHƢƠNG II 15 MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN 15 2.1 Biến đổi Hough 15 2.1.1 Đƣờng thẳng Hough 15 2.1.2 Áp dụng biến đổi Hough xác định góc nghiêng văn bản 19 2.1.3 Thuật toán phát hiện góc nghiêng văn bản 20 2.1.4 Chỉnh sửa góc nghiêng văn bản 22 2.2 Phƣơng pháp hình chiếu 23 2.2.1 Thuật toán Postl 25 2.2.2 Thuật toán Baird 25 2.2.3 Thuật toán Nakano 26 2.3 Phép toán hình thái - Morphology 26 2.3.1 Phƣơng pháp 26 2.3.2 Bƣớc tiền xử lý 28 2.4 Phƣơng pháp phân tích láng giềng 35 2.4.1 Phƣơng pháp 35 2.4.2 Thuật toán Yue Lu và Chew Lim Tan 37 2.5 Phƣơng pháp đƣờng thẳng 38 2.5.1 Tƣ tƣởng thuật toán phát hiện góc nghiêng văn bản 39 2.5.1.1 Chọn các miền xác định và các đối tƣợng 39 2.5.1.2 Lựa chọn các đối tƣợng 40 2.5.2 Bó cụm điểm chủ đạo 41 2.5.2.1 Định nghĩa 41 2.5.2.2 Phân cụm các điểm chủ đạo 42 2.5.3 Lựa chọn đƣờng cơ sở 42 2.5.3.1 Phân loại điểm chủ đạo 42 2.5.3.2 Xác định đƣờng thẳng sử dụng phƣơng pháp bình phƣơng nhỏ nhất 44 2.5.4 Thuật toán phát hiện góc nghiêng 45 2.5.4.1 Thuật toán định hƣớng góc nghiêng đơn giản 45 2.5.4.2 Thuật toán chính 46 2.5.5. Thuật toán sửa góc nghiêng 47 2.5.5.1 Mô hình quét dòng văn bản 47 iii Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2.5.5.2 Thuật toán chỉnh sửa góc nghiêng 48 2.5.5.3 Kết quả thử nghiệm 49 Bảng 1: Kết quả thực nghiệm của các phƣơng pháp phát hiện góc nghiêng 49 2.6 Một vài phƣơng pháp khác 50 CHƢƠNG 3 51 NÂNG CAO TỐC ĐỘ VÀ CHẤT LƢỢNG 51 PHÁT HIỆN GÓC NGHIÊNG 51 3.1 Xử lý ảnh có độ phân giải thấp 51 3.2 Tự động xác định ngƣỡng phân loại 52 3.2.1. Mục đích và ý nghĩa việc dùng ngƣỡng. 52 3.2.2 Ý tƣởng xuất phát 53 3.2.3 Phƣơng pháp thực hiện 53 3.3 Một vài trƣờng hợp ngoại lệ 56 CHƢƠNG 4 59 CÀI ĐẶT THỬ NGHIỆM 59 4.1 Sơ đồ chức năng của chƣơng trình 59 4.2. Thiết kế Menu 60 4.3. Giao diện chính của chƣơng trình 61 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 64 iv Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn DANH MỤC BẢNG BIỂU Bảng 1: Kết quả thực nghiệm của các phƣơng pháp phát hiện góc nghiêng………………………………………………………………… 49 DANH MỤC HÌNH VẼ Hình 1.1 Quá trình xử lý ảnh 3 Hình 1.2: Các giai đoạn trong xử lý ảnh 3 Hình 1.3a 7 Hình 1.3b 7 Hình 1.4a: Các 4- láng giềng của điểm ảnh P 11 Hình 1.4b: Các 8- láng giềng của điểm ảnh P 11 Hình 1.5a.Chu tuyến ngoài 12 Hình 1.5b. Chu tuyến trong 12 Hình 1.6: Chu tuyến trong và chu tuyến ngoài của một đối tƣợng 12 Hình 1.7: Hƣớng các láng giềng của một điểm ảnh 13 Hình 1.8a: Hƣớng xác định cặp vùng nền xuất phát 14 Hình 1.8b: Hƣớng xác định cặp vùng nền tiếp theo 14 Hình 2.1: Biến đổi Hough cho đƣờng thẳng 16 Hình 2.2: Tham số r – φ của đƣờng thẳng 16 Hình 2.3: Biến đổi Hough trong không gian r-  17 Hình 2.4: Các hình chữ nhật ngoại tiếp 18 Hình 2.5 : Áp dụng biến đổi Hough phát hiện góc nghiêng văn 19 Hình 2.6 Quay một điểm ảnh quanh gốc tọa độ 22 Hình 2.7 Hiện tƣợng rỗ ảnh sau khi quay 23 Hình 2.8 a Ảnh gốc 23 Hình 2.8b Ảnh bị nghiêng 5 0 23 Hình 2.8 Phƣơng pháp hình chiếu đƣợc tính từ ảnh trong hình 2.8a, 2.8b 24 v Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình 2.9 Một ví dụ các dòng văn bản có xu hƣớng dính lại với nhau do ảnh hƣởng của dấu 27 Hình 2.10: Các điểm left most bottom và bottom most left 28 Hình 2.11: Những khoảng góc nghiêng khác nhau đƣợc sử dụng để ƣớc lƣợng góc nghiêng phù hợp cho phần tử cấu trúc 31 Hình 2.12: Một vài ví dụ của việc sử dụng phép đóng và mở với những phần tử cấu trúc nghiêng 32 Hình 2.13: Một thành phần liên thông dài với hệ tọa độ ảnh 33 Hình 2.14a. Định nghĩa điểm chủ đạo 41 Hình 2.14b. Định hƣớng góc nghiêng 41 Hình 2.15: Điểm chủ đạo trên dòng văn bản 43 Hình 2.16: Quan hệ láng giềng giữa các điểm chủ đạo 43 Hình 2.17: Định hƣớng thuật toán phát hiện góc nghiêng 45 Hình 2.18: Mô hình quét dòng văn bản 47 Hình 3.1 Một ảnh văn bản nghiêng có độ phân giải thấp 51 Hình 3.2: Ví dụ về một ảnh văn bản nghiêng với nhiều đối tƣợng phức tạp và ít ký tự 52 Hình 3.3: Sơ đồ phân bố histogram chu vi trƣớc khi gom 55 Hình 3.4: Sơ đồ phân bố histogram chu vi sau khi gom 56 Hình 3.5 Ví dụ về một ảnh nghiêng có ít ký tự chữ cái 56 Hình 3.6 : Ví dụ về văn bản nghiêng có các đối tƣợng bao nhau 57 1 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỞ ĐẦU 1. Lý do chọn đề tài Thông tin con ngƣời thu nhận từ thế giới bên ngoài, đến hơn 80% đƣợc ghi nhận bằng mắt tức là ở dạng ảnh. Vì vậy xử lý ảnh là một ngành khoa học đã, đang và sẽ phát triển mạnh có ứng dụng rộng rãi trong khoa học và đời sống thực tiễn nhƣ vẽ bản đồ, trong lĩnh vực quảng cáo, siêu thị, trong quân sự…. Các hệ thống xử lý ảnh cho phép con ngƣời thu nhận lƣu trữ, phân tích và nhận dạng ảnh, một bộ phận quan trọng của xử lý ảnh là xử lý văn bản. Một trong những nhiệm vụ chính cũng là đối tƣợng của xử lý ảnh văn bản là tự động hóa công việc văn phòng. Hiện nay phần lớn lƣợng thông tin vẫn còn đƣợc lƣu trữ, trình bày và phân phối thông qua phƣơng tiện chủ yếu là giấy bởi con ngƣời tin tƣởng hơn khi nhận đƣợc văn bản giấy. Tuy nhiên có xu hƣớng đang phát triển để chia sẻ và trao đổi thông tin điện tử, vì thế sự cần thiết để chuyển đổi từ tài liệu giấy sang tài liệu điện tử để lƣu trữ, khôi phục và bảo trì ngày càng tăng lên. Để chuyển đổi từ tài liệu giấy sang dạng điện tử thì kỹ thuật thƣờng gồm ba bƣớc: quét và công nghệ kỹ thuật số, phân tích bố cục và nhận dạng ký tự. Khi văn bản đƣợc quét vào máy, văn bản bị nghiêng là không thể tránh khỏi do các yếu tố khác nhau khi đƣa ảnh vào. Hầu hết các thuật toán nhận dạng ký tự, phân tích bố cục là phổ biến nhƣng lại rất nhạy cảm đối với sự biến dạng của ảnh văn bản và văn bản bị nghiêng có thể gây ra lỗi nghiêm trọng cho việc phân tích văn bản. Do đó phát hiện và chỉnh sửa ảnh văn bản bị nghiêng là cần thiết ở giai đoạn tiền xử lý để tránh nhiễu trong quá trình xử lý nghiêng. Một trong những vấn đề đầu tiên trong xử lý ảnh văn bản là bài toán góc nghiêng văn bản. Nguyên nhân dẫn đến văn bản bị nghiêng một góc xuất phát từ quá trình quét ảnh hoặc copy ảnh, dẫn đến ảnh bị lệch đi một góc tƣơng 2 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ứng. Văn bản bị lệch có ảnh hƣởng rất lớn đến các quá trình xử lý ảnh tiếp theo, vì vậy việc phát hiện và chỉnh sửa góc nghiêng văn bản là nhiệm vụ quan trọng đầu tiên trong xử lý ảnh văn bản. Với những lý do trên đây nên em đã chọn đề tài: “Tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng”. 2. Mục tiêu nghiên cứu Hiểu đƣợc các phƣơng pháp phát hiện góc nghiêng văn bản. Từ đó đƣa ra những nhận xét, so sánh giữa các phƣơng pháp. Lựa chọn công cụ phát triển phù hợp cài đặt ứng dụng. 3. Đối tƣợng và phạm vi nghiên cứu Tìm hiểu một vài kỹ thuật phát hiện góc nghiêng văn bản về mặt lý thuyết, từ đó lựa chọn phƣơng pháp cài đặt ứng dụng vào thực tế. Áp dụng đối với ảnh văn bản đen trắng. 4. Ý nghĩa khoa học và thực tiễn của đề tài Hệ thống hoá các kiến thức về kỹ thuật phát hiện góc nghiêng văn bản. Việc tìm hiểu và phát triển ứng dụng thành công giúp cho việc xử lý ảnh trở nên đơn giản và dễ dàng hơn đối với một số trƣờng hợp nhƣ: xử lý ảnh ban đầu để cho ra ảnh mới theo mong muốn của ngƣời dùng (ví dụ nhƣ ảnh bị nghiêng cần xử lý để thu đƣợc ảnh chính xác hơn…). 5. Phƣơng pháp nghiên cứu 5.1 Dựa trên các tài liệu - Tìm hiểu lý thuyết liên quan đến xử lý ảnh. - Tìm hiểu lý thuyết các kỹ thuật phát hiện góc nghiêng văn bản và chỉnh sửa. 5.2 Phương pháp toán học - Xử lý các số liệu thống kê [...]... theo Khi xem xét một văn bản, để kết luận văn bản có bị nghiêng hay không cách làm của con ngƣời là căn cứ vào một số đối tƣợng chủ đạo và góc nghiêng văn bản đƣợc ƣớc lƣợng dựa vào đƣờng nối các điểm giữa đáy của các đối tƣợng này Xuất phát từ nhận xét trên, luận văn sẽ trình bày một phƣơng pháp phát hiện góc nghiêng văn bản từ kỹ thuật xác định chu tuyến một đối tƣợng ảnh và áp dụng biến đổi Hough... máy quét là phát hiện và chỉnh sửa góc nghiêng một cách tự động Ví dụ đầu vào đƣợc thể hiện nhƣ hình Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 8 1.3b và đầu ra đƣợc thể hiện nhƣ hình 1.3a Thuật toán phát hiện góc nghiêng đƣợc ứng dụng cho ảnh văn bản và xác định đƣợc góc nghiêng (có thể là 0) khi đã đƣợc số hóa Một giải pháp đơn giản để phát hiện góc nghiêng là xác... văn bản đầu vào Sau đó, thuật toán ƣớc lƣợng thô sẽ xác định đƣợc khoảng mà góc nghiêng của văn bản rơi vào Cuối cùng, với những tham số tìm thấy ở bƣớc đầu tiên, sẽ thực hiện các phép đóng và mở cho các dòng văn bản để tạo thành các vệt tạo thuận lợi cho bƣớc xác định góc nghiêng tiếp theo Sau đó một thuật toán đơn giản sẽ đƣợc dùng để xác định góc của mỗi dòng văn bản và góc nghiêng của toàn bộ văn. .. Fractal: sử dụng tính chất Fractal của các đối tƣợng ảnh, thể hiện sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lƣu trữ phần gốc của ảnh và quy luật sinh ra ảnh theo nguyên tắc Fractal 1.2 Bài toán phát hiện góc nghiêng văn bản 1.2.1 Giới thiệu bài toán phát hiện góc nghiêng văn bản Một hệ thống xử lý văn bản thƣờng giải quyết bài toán góc nghiêng văn bản nhƣ bƣớc đầu tiên và tất yếu... vậy tổng số phần tử của một hàng chính là tổng số điểm ảnh thuộc các đƣờng thẳng tƣơng ứng đƣợc biểu diễn bởi góc  của hàng đó Do đó, góc nghiêng của văn bản chính là hàng có tổng giá trị các phần tử mảng tích lũy lớn nhất 2.1.3 Thuật toán phát hiện góc nghiêng văn bản Thuật toán phát hiện góc nghiêng văn bản gồm các bƣớc sau: Bƣớc 1: Với mỗi điểm ảnh ta duyệt ảnh theo thứ tự từ trên xuống và từ trái... ảnh văn bản có thể bị quay hoặc nghiêng một góc bất kỳ có thể do nó đƣợc đặt trên trục quay khi quét ảnh hoặc do sự cố đặt văn bản Ảnh văn bản bị nghiêng đƣợc hiển thị nhƣ trong hình 1.3b Hình 1.3a Hình 1.3b Ảnh văn bản bị nghiêng một góc tƣơng ứng là 50 Trong thực tế, có thể nhìn thấy văn bản bị nghiêng với độ nghiêng ít nhất là 0,10 Nhƣ vậy, một chức năng mong muốn trong máy Photo hoặc máy quét là phát. .. U(Aφ[p]) = 0 Phát hiện góc lệch văn bản bằng cách chiếu các góc là một phƣơng pháp đơn giản và dễ hiểu Tuy nhiên, những thuật toán dựa trên phƣơng pháp này còn hạn chế nhiều về độc chính xác với các góc lệch lớn Baird cho rằng để thuật toán cho kết quả có độ chính xác cao thì góc lệch văn bản phải giới hạn trong khoảng (-150, +150) Nếu văn bản có nhiều nhiễu và các đối tƣợng phi văn bản nhƣ bảng biểu,... 2.1.2 Áp dụng biến đổi Hough xác định góc nghiêng văn bản Dùng một mảng tích lũy để đếm số điểm ảnh nằm trên một đƣờng thẳng trong không gian ảnh, với chỉ số hàng cho biết góc lệch  của đƣờng thẳng và chỉ số cột là r – khoảng cách từ gốc tọa độ tới đƣờng thẳng đó Sau đó tính tổng số điểm ảnh nằm trên đƣờng thẳng song song nhau theo các góc lệch thay đổi Góc nghiêng văn bản tƣơng ứng với góc có tổng... Histogram cho tất cả các góc lệch Histogram của một góc là số điểm đen trong ảnh sao cho các điểm này nằm trên những đƣờng thẳng có cùng một hƣớng tƣơng ứng với góc đó Sau đó dùng một hàm chi phí áp dụng cho các giá trị Histogram này Góc nghiêng văn bản tƣơng ứng với góc giá trị hàm chi phí cực đại Histogram này có biên độ và tần xuất lớn nhất khi văn bản có độ nghiêng bằng 0 với số điểm đen là lớn nhất... lại hƣớng đi hiện cho dir và quay lại bƣớc 3 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 15 CHƢƠNG II MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN 2.1 Biến đổi Hough Một phƣơng pháp cơ bản mà chúng ta có thể mô tả các đối tƣợng bởi các hàm toán học mà các hàm này miêu tả biên đƣờng thẳng, đó là biến đổi Hough; đƣợc phát hiện vào năm 1962 do Paul Hough phát minh Mặc . đặt ứng dụng. 3. Đối tƣợng và phạm vi nghiên cứu Tìm hiểu một vài kỹ thuật phát hiện góc nghiêng văn bản về mặt lý thuyết, từ đó lựa chọn phƣơng pháp cài đặt ứng dụng vào thực tế. Áp dụng. việc phát hiện và chỉnh sửa góc nghiêng văn bản là nhiệm vụ quan trọng đầu tiên trong xử lý ảnh văn bản. Với những lý do trên đây nên em đã chọn đề tài: Tìm hiểu một số kỹ thuật phát hiện góc. 15 MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN 15 2.1 Biến đổi Hough 15 2.1.1 Đƣờng thẳng Hough 15 2.1.2 Áp dụng biến đổi Hough xác định góc nghiêng văn bản 19 2.1.3 Thuật toán phát hiện

Ngày đăng: 03/10/2014, 23:10

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan