NGHIÊN CỨU MỘT SỐ KỸ THUẬT HIỆU CHỈNH GÓC NGHIÊNG CỦA ẢNH
TRƯỜNG ĐẠI HỌC LẠC HỒNG TRUNG TÂM THÔNG TIN TƯ LIỆU BÁO CÁO NGHIÊN CỨU KHOA HỌC ĐỀ TÀI: NGHIÊN CỨU MỘT SỐ KỸ THUẬT HIỆU CHỈNH GÓC NGHIÊNG CỦA ẢNH NGUYỄN TRỌNG VINH ĐỒNG NAI, THÁNG 06/2011 TRƯỜNG ĐẠI HỌC LẠC HỒNG TRUNG TÂM THÔNG TIN TƯ LIỆU BÁO CÁO NGHIÊN CỨU KHOA HỌC ĐỀ TÀI: NGHIÊN CỨU MỘT SỐ KỸ THUẬT HIỆU CHỈNH GÓC NGHIÊNG CỦA ẢNH Thực hiện: NGUYỄN TRỌNG VINH TRẦN ĐỨC TOÀN Chủ nhiệm đề tài: Huỳnh Cao Tuấn ĐỒNG NAI, THÁNG 06/2011 LỜI CẢM ƠN Chúng tôi xin chân thành cảm ơn lãnh đạo và các Thầy Cô ở Trung tâm Thông tin Tư liệu – Đại học Lạc Hồng, nơi tôi công tác, đã tạo mọi điều kiện thuận lợi cho chúng tôi trong suốt thời gian hoàn thành báo cáo. Bên cạnh đó, chúng tôi cũng gửi lời cảm ơn đến Ban Khảo thí – Đại học Lạc Hồng đã tạo điều kiện thuận lợi cho chúng tôi trong quá trình thực hiện luận văn cũng như ứng dụng sản phẩm nghiên cứu vào thực tế. Cuối cùng, chúng tôi xin cảm ơn gia đình và bạn bè, những người đã luôn ủng hộ và động viên để chúng tôi yên tâm nghiên cứu và hoàn thành báo cáo nghiên cứu khoa học. Nguyễn Trọng Vinh, Trần Đức Toàn MỤC LỤC Trang LỜI CẢM ƠN i MỤC LỤC ii DANH MỤC HÌNH ẢNH iii MỞ ĐẦU 1 CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN. 4 1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh. 4 1.1.1. Xử lý ảnh là gì? 4 1.1.2. Quá trình xử lý ảnh 4 1.1.2.1. Thu nhận ảnh 5 1.1.2.2. Tiền xử lý 6 1.1.2.3. Phân đoạn ảnh 6 1.1.2.4. Hệ quyết định 7 1.1.2.5. Trích chọn đặc điểm 7 1.1.2.6. Nhận dạng 8 1.1.3. Một số vấn đề cơ bản trong xử lý ảnh. 9 1.1.3.1. Ảnh 9 1.1.3.2. Điểm ảnh 9 1.1.3.3. Mức xám 9 1.1.3.4. Các điểm 4 láng giềng 9 1.1.3.5. Các điểm 8 láng giềng 9 1.1.3.6. Đối tượng ảnh 10 1.1.3.7. Kỹ thuật phóng to, thu nhỏ ảnh 10 1.1.4. Tổng quan về ảnh văn bản. 11 1.2. Tổng quan về bài toán phát hiện góc nghiêng văn bản 12 1.2.1. Góc nghiêng và vai trò việc phát hiện góc nghiêng văn bản 12 1.2.2. Phương pháp phân tích hình chiếu (Profile Projection) 12 1.2.2.1. Thuật toán Postl 14 1.2.2.2. Thuật toán Baird 14 1.2.2.3. Thuật toán Nakano 14 1.2.2.4. Nhận xét 15 1.2.3. Phương pháp phân tích dựa vào trọng tâm (Center of Gravity) 15 1.2.4. Phương pháp phân tích láng giềng (Nearest Neighbour Clustering) 19 1.2.4.1. Thuật toán Yue Lu và Chew Lim Tan 20 1.2.4.2. Nhận xét 21 1.2.5. Phương pháp dùng phép toán hình thái (Morphology) 22 1.2.5.1. Thuật toán L. Najman 22 1.2.5.2. Nhận xét 24 1.2.6. Phương pháp dùng biến đổi Hough (Hough Transform) 24 1.2.6.1. Đường thẳng Hough trên tọa độ cực 24 1.2.6.2. Nhận xét 27 CHƯƠNG 2. BIÊN VÀ CÁC PHƯƠNG PHÁP DÒ BIÊN 28 2.1. Biên của đối tượng ảnh 28 2.1.1. Biên và các kiểu biên cơ bản trong ảnh 28 2.1.1.1. Biên lý tưởng 28 2.1.1.2. Biên dốc 29 2.1.1.3. Biên không trơn 30 2.1.2. Vai trò của biên trong nhận dạng 31 2.2. Các phương pháp dò biên trực tiếp 32 2.2.1. Phương pháp Gradient 32 2.2.2. Phương pháp Laplace 34 2.3. Phương pháp dò biên tổng quát 34 2.3.1. Khái niệm chu tuyến 34 2.3.2. Phương pháp dò biên tổng quát 36 2.4. Một số phương pháp dò biên nâng cao 38 2.4.1. Phương pháp Canny 38 2.4.2. Phương pháp Shen – Castan 39 CHƯƠNG 3. ỨNG DỤNG BIẾN ĐỔI HOUGH PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN. 40 3.1. Tiền xử lý và phát hiện góc nghiêng văn bản từ biên của đối tượng 40 3.2. Xác định đường thẳng Hough trên trang văn bản 41 3.3. Áp dụng biến đổi Hough phát hiện góc nghiêng văn bản 42 3.4. Thuật toán phát hiện góc nghiêng văn bản 44 3.5. Chỉnh sửa góc nghiêng văn bản 51 CHƯƠNG 4. XÂY DỰNG CHƯƠNG TRÌNH THỰC NGHIỆM 53 4.1. Sơ đồ khối. 53 4.2. Thiết kế chương trình 54 4.2.1. Module giao diện chính 54 4.2.2. Module chuyển đổi ảnh gốc và biểu đồ mức xám 56 4.2.3. Module dò biên 58 4.2.4. Module biểu diễn biến đổi Hough 60 4.2.5. Module hiệu chỉnh góc nghiêng văn bản 61 4.3. Đánh giá kết quả 61 KẾT LUẬN 67 TÀI LIỆU THAM KHẢO 69 DANH MỤC HÌNH ẢNH Hình 1.1. Sơ đồ quá trình xử lý ảnh 5 Hình 1.2 Ma trận 8 láng giềng 10 Hình 1.3 Tổng quan quá trình tạo ảnh tài liệu 12 Hình 1.4 Đa giác 6 đỉnh và trọng tâm được xác định 16 Hình 1.5 Hình chữ nhật ngoại tiếp ảnh văn bản thay cho đa giác 16 Hình 1.6 Ảnh đầu vào và kết quả sau khi áp dụng thuật toán 17 Hình 1.7 Tìm các điểm xa nhất theo các hướng trên ảnh 18 Hình 1.8 Trọng tâm được xác định dựa vào các điểm xa nhất 18 Hình 1.9 Đường cơ sở được nối từ trọng tâm đến gốc tọa độ 18 Hình 1.10 Xác định góc nghiêng ảnh văn bản 18 Hình 1.11 Phân tích láng giềng 19 Hình 1.12 Các K-NN và vector chỉ phương ứng với K=2,3,4 21 trong thuật toán Yue Lu-Chew Lim Tan 21 Hình 1.13 Đường thẳng Hough và trục tọa độ 25 Hình 1.14 Biểu diễn đường thẳng Hough đi qua 3 điểm 26 Hình 2.1 Đường biên lý tưởng 29 Hình 2.2 Đường biên dốc 29 Hình 2.3 Đường biên không trơn 30 Hình 2.4 Sơ đồ phân tích ảnh 31 Hình 2.5 Các 4- láng giềng của điểm ảnh P 35 Hình 2.6 Các 8- láng giềng của điểm ảnh P 35 Hình 2.7 Ví dụ về các chu tuyến đối ngẫu 36 Hình 2.8 Chu tuyến trong và chu tuyến ngoài của một đối tượng 36 Hình 3.1 Xác định hình chữ nhật ngoại tiếp các đối tượng 40 Hình 3.2 Đường thẳng trong toạ độ cực 41 Hình 3.3 Đường thẳng Hough trên trục tọa độ 43 Hình 3.4 Ví dụ về một ảnh nghiêng có ít ký tự chữ cái 45 Hình 3.5 Ví dụ về văn bản nghiêng có các đối tượng bao nhau 46 Hình 3.6 Sơ đồ giải thuật tổng quát 50 Hình 3.7 Xoay một điểm ảnh quanh gốc tọa độ 51 Hình 4.1 Sơ đồ tổng quát 53 Hình 4.2 Giao diện chính của chương trình 54 Hình 4.3 Sơ đồ module xử lý cơ bản 55 Hình 4.4 Màn hình giao diện chương trình khi chọn chức năng Open 55 Hình 4.5 Sơ đồ thao tác xử lý trên ảnh 56 Hình 4.6 Sơ đồ convert ảnh sang nhị phân và đa cấp xám 56 Hình 4.7 Giao diện biểu diễn Histogram của ảnh 57 Hình 4.8 Giao diện convert ảnh sang nhị phân và ảnh đa cấp xám 57 Hình 4.9 Sơ đồ chức năng dò biên 58 Hình 4.10 Dò biên bằng phương pháp Sobel 58 Hình 4.11 Dò biên bằng phương pháp Canny 59 Hình 4.12 Dò biên bằng phương pháp Emboss Laplacian 59 Hình 4.13 Dò biên bằng phương pháp Gradient 60 Hình 4.14 Biểu diễn biến đổi Hough của ảnh 60 Hình 4.15 Phát hiện góc nghiêng và xoay ảnh 61 Hình 4.16 Một ảnh bị nghiêng góc có các đối tượng xen lẫn văn bản, bảng biểu và ảnh kết quả sau khi hiệu chỉnh 1 góc 12.9 o 63 Hình 4.17 Một ảnh bị nghiêng góc tiếng Nhật có xen lẫn hình ảnh, ký tự và ảnh kết quả sau khi hiệu chỉnh 1 góc 11.3 o 64 Hình 4.18 Một bảng điểm bị nghiêng góc không thể nhận dạng được của hệ thống quản lý điểm và ảnh kết quả sau khi hiệu chỉnh 1 góc 7.61 o 64 Hình 4.19 Một mẫu phiếu đánh giá chất lượng giảng dạy bị nghiêng góc không thể nhận dạng được và ảnh kết quả sau khi hiệu chỉnh 1 góc 9.72 o 65 Hình 4.20 Một ảnh màu tài liệu bị nghiêng và ảnh kết quả sau khi hiệu chỉnh 1 góc 10.82 o 65 Hình 4.21 Một ảnh màu tài liệu bị nghiêng gồm nhiều biểu đồ và ảnh kết quả sau khi hiệu chỉnh 1 góc 17.6 o 66 1 MỞ ĐẦU Ngày nay việc sử dụng máy tính để lưu trữ tài liệu không còn là vấn đề mới mẻ và cần phải chứng minh tính an toàn, thuận tiện của nó. Tuy nhiên việc sử dụng giấy để lưu trữ tài liệu trong một số mục đích vẫn không thể thay thế được (như báo, sách, công văn, hợp đồng, …). Hơn nữa, lượng tài liệu được tạo ra từ nhiều năm trước vẫn còn rất nhiều mà không thể bỏ đi được vì tính quan trọng của chúng. Để có thể có được một “văn phòng không giấy” khi đó hàng tỉ trang tài liệu sẽ được cất chỉ trong một ổ cứng kích thước bằng một cuốn sách nhỏ và để tìm kiếm thông tin trong đó người ta chỉ cần tốn vài giây với một cái gõ phím Enter thì chắc chắn phải chuyển toàn bộ dữ liệu từ các trang giấy vào máy tính. Đây cũng là cách đáp ứng nhu cầu tra cứu tài liệu điện tử càng tăng và trở thành nhu cầu cấp thiết của mọi người trong đời sống. Thông thường người ta sẽ phải tốn rất nhiều thời gian và công sức mới có thể nhập vào máy tính được hết lượng tài liệu đó. Hiện nay, chúng ta đã có các máy Scan với tốc độ cao, công nghệ xử lý của máy tính ngày càng siêu việt với tốc độ tính toán vượt cả tốc độ ánh sáng, vậy tại sao chúng ta không quét toàn bộ các trang văn bản giấy vào máy tính và chuyển chúng thành tài liệu số? Bằng cách đó tốc độ và tính chính xác sẽ tăng hàng trăm lần trong khi chi phí lại là cực tiểu. Vấn đề là khi quét vào máy tính chúng ta không thể thu nhận được tài liệu như mong muốn được bởi nhiều lý do khách quan khiến cho trang tài liệu bị nghiêng ngả, mờ nhoè,…. Tất cả những gì thu được chỉ là các tấm ảnh của các trang văn bản. Máy tính không có “mắt” như chúng ta để biết đâu là file ảnh ngay ngắn, đúng chuẩn và đâu là file ảnh có chất lượng 2 thấp, nghiêng cần được hiệu chỉnh cho nên chúng đối xử công bằng như nhau với mọi điểm ảnh. Một giải pháp được nghĩ đến ngay đó là xây dựng các hệ thống hiệu chỉnh góc nghiêng văn bản đối với cả ảnh màu và ảnh trắng đen thuần tuý. Từ đó có thể biên soạn thành những tài liệu số hoàn chỉnh và bỏ qua thao tác lưu trữ hàng khối giấy tờ chiếm nhiều không gian và thời gian như trước đây. Khi xem xét một văn bản, để kết luận văn bản có bị nghiêng hay không cách làm của chúng ta là căn cứ vào một số đối tượng chủ đạo và góc nghiêng văn bản được ước lượng dựa vào đường nối các trung điểm cạnh đáy của các đối tượng này. Xuất phát từ nhận xét trên, tôi sẽ trình bày một phương pháp phát hiện góc nghiêng văn bản từ kỹ thuật xác định chu tuyến một đối tượng ảnh và biến đổi Hough nhưng có điểm khác là sẽ dựa trên những điểm đặc trưng có kích thước chủ đạo trong ảnh. Từ đó áp dụng biến đổi Hough lên các điểm ảnh đại diện cho chúng. * Cấu trúc của luận văn gồm 4 chương như sau: - Chương 1: Tổng quan về xử lý ảnh và bài toán góc nghiêng văn bản: Chương này đề cập đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh. Bên cạnh đó là sự phân tích, đánh giá đối với một số phương pháp phát hiện góc nghiêng văn bản. - Chương 2: Biên và các phương pháp dò biên: Chương này gồm các khái niệm cơ bản về biên của đối tượng ảnh và vai trò của việc dò biên trong xác định góc nghiêng văn bản . Toàn bộ chương tập trung vào việc làm rõ các khái niệm cơ bản cũng như đi sâu vào phân tích các phương pháp dò biên như: phương pháp trực tiếp (Gradient, Laplace), phương pháp dò biên tổng quát dựa vào chu tuyến, phương pháp dò biên nâng cao (Canny, Shen – Castan). [...]... phát hiện góc nghiêng văn bản 1.2.1 Góc nghiêng và vai trò việc phát hiện góc nghiêng văn bản Góc nghiêng văn bản là một bài toán kinh điển trong xử ý ảnh văn bản Giải quyết bài toán góc nghiêng là nhiệm vụ tiên quyết và cũng không thể tránh khỏi của bất kỳ một hệ thống xử lý ảnh văn bản nào Vì lẽ đó, cùng với sự phát triển của xử lý ảnh nói chung và xử lý ảnh văn bản nói riêng, bài toán góc nghiêng. .. K liên thông của ảnh là một đối tượng ảnh 1.1.3.7 Kỹ thuật phóng to, thu nhỏ ảnh: Khi ảnh quá lớn chúng ta muốn nhìn toàn bộ ảnh thì chúng ta phải thu nhỏ ảnh lại và ngược khi ta muốn xem chi tiết một bộ phận nào đó của ảnh thì ta phải phóng to nó lên + Kỹ thuật phóng to ảnh: Khi phóng to ảnh với một tỉ lệ k nào đó ta thu được ảnh mới to gấp k lần ảnh cũ (k là độ phóng của ảnh) như thế ảnh mới sẽ có... mã hoá các ảnh tự nhiên 1.1.2 Quá trình xử lý ảnh Quá trình xử lý ảnh là một quá trình thao tác nhằm biến đổi một ảnh đầu vào để cho ra một ảnh kết quả như mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh "tốt hơn" hoặc một kết luận Mục đích của xử lý ảnh gồm: Biến đổi ảnh, làm tăng chất lượng ảnh Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội dung của ảnh 5 Nhận... 9 1.1.3 Một số vấn đề cơ bản trong xử lý ảnh 1.1.3.1 Ảnh : Ảnh là một mảng số thực hai chiều (Ii j) có kích thước (m*n), trong đó mỗi phần tử Ii j (i=1 m, j=1 n) biểu thị mức xám của ảnh tại vị trí (i, j) tương ứng 1.1.3.2 Điểm ảnh: Gốc của ảnh là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính, ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập... các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức: xp=x/k yp=y/k + Kỹ thuật thu nhỏ ảnh: Tương tự như phóng to ảnh, khi thu nhỏ ảnh ta thu được ảnh mới giống ảnh cũ nhưng có kích thước nhỏ hơn ảnh cũ Kích thước của ảnh mới là : Height=Height/k Width=Width/k Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức: xp=x*k yp=y*k 1.1.4 Tổng quan về ảnh văn bản Trang ảnh văn... toán góc nghiêng văn bản 1.2.2 Phương pháp phân tích hình chiếu (Profile Projection) Đây là một trong những phương pháp phổ biến nhất trong phát hiện góc nghiêng văn bản Ý tưởng chính của phương pháp này là tính histogram cho tất cả các góc lệch Histogram của một góc là số điểm ảnh đen trong ảnh sao cho các điểm này nằm trên những đường thẳng có cùng một hướng tương ứng 13 với góc đó Sau đó, dùng một. .. Chương 3: Ứng dụng biến đổi Hough phát hiện góc nghiêng văn bản: Trên cơ sở các thuật toán đã tìm hiểu, toàn bộ chương này nêu rõ từng bước thực hiện việc áp dụng biến đổi Hough vào xác định góc nghiêng và tiến hành hiệu chỉnh góc nghiêng văn bản - Chương 4: Xây dựng chương trình thực nghiệm: Tiến hành xây dựng chương trình thực nghiệm để phát hiện và hiệu chỉnh góc nghiêng văn bản dựa trên cơ sở lý thuyết... áp dụng thuật toán cho từng trường hợp cụ thể Hình chữ nhật được thay thế cho đa giác như trong hình 1.5 cũng được mô tả như là một cách để xây dựng đường cơ sở giúp xác định góc nghiêng văn bản Hình 1.5 Hình chữ nhật ngoại tiếp ảnh văn bản thay cho đa giác 17 * Thuật toán gồm các bước: + Đầu vào: ảnh văn bản bị nghiêng giống như hình 1.6 + Đầu ra: ảnh đã được hiệu chỉnh góc nghiêng Hình 1.6 Ảnh đầu... trung bình + Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh + Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện tử có thể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này 1.1.2.3 Phân đoạn ảnh: Phân đoạn ảnh có nghĩa là chia một ảnh đầu... Dùng một hàm rút gọn F để chuyển ảnh đầu vào thành một tập các bộ ba (x,y,w) trong đó (x,y) là tọa độ của một điểm ảnh đại diện cho một đối tượng và w là trọng số của điểm đó Ở đây, điểm đại diện được hiểu theo nghĩa là điểm biểu diễn các ký tự trong các đối tượng của ảnh Trọng số w thường phụ thuộc vào từng thuật toán + Một hàm P dùng chiếu các điểm tìm được ở trên vào một mảng đếm A[] theo các góc . 4.20 Một ảnh màu tài liệu bị nghiêng và ảnh kết quả sau khi hiệu chỉnh 1 góc 10.82 o 65 Hình 4.21 Một ảnh màu tài liệu bị nghiêng gồm nhiều biểu đồ và ảnh kết quả sau khi hiệu chỉnh 1 góc. TRUNG TÂM THÔNG TIN TƯ LIỆU BÁO CÁO NGHIÊN CỨU KHOA HỌC ĐỀ TÀI: NGHIÊN CỨU MỘT SỐ KỸ THUẬT HIỆU CHỈNH GÓC NGHIÊNG CỦA ẢNH Thực hiện: NGUYỄN TRỌNG VINH TRẦN. đổi Hough của ảnh 60 Hình 4.15 Phát hiện góc nghiêng và xoay ảnh 61 Hình 4.16 Một ảnh bị nghiêng góc có các đối tượng xen lẫn văn bản, bảng biểu và ảnh kết quả sau khi hiệu chỉnh 1 góc 12.9 o