Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 81 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
81
Dung lượng
4,26 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG *** NGUYỄN TRỌNG VINH NGHIÊNCỨUMỘTSỐKỸTHUẬTHIỆUCHỈNHBIỂUMẪUVÀỨNGDỤNGLuậnvănThạc sỹ Công nghệ Thông tin ĐỒNG NAI, 2011 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG *** NGUYỄN TRỌNG VINH NGHIÊNCỨUMỘTSỐKỸTHUẬTHIỆUCHỈNHBIỂUMẪUVÀỨNGDỤNG Chuyên ngành: Công nghệ Thông tin Mã số: 60.48.05 LuậnvănThạc sỹ Công nghệ Thông tin Người hướng dẫn khoa học: PGS. TS NGÔ QUỐC TẠO ĐỒNG NAI, 2011 LỜI CAM ĐOAN - Tôi xin cam đoan luậnvănthạc sỹ công nghệ thông tin: “Nghiên cứumộtsố phương pháp hiệuchỉnhbiểumẫuvàứng dụng” là kết quả của quá trình học tập, nghiêncứu khoa học độc lập, nghiêm túc. - Các số liệu trong luậnvăn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiêncứu đã được công bố, các website, … - Các phương pháp nêu trong luậnvăn được rút ra từ những cơ sở lý luậnvà quá trình nghiêncứu tìm hiểu của tác giả. Đồng Nai, tháng 06 năm 2011. Tác giả Nguyễn Trọng Vinh LỜI CẢM ƠN Trước hết tôi xin gửi lời cảm ơn sâu sắc đến Thầy hướng dẫn khoa học PGS. TS Ngô Quốc Tạo về những chỉ dẫn khoa học, định hướng nghiêncứuvà tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn. Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn thành luậnvăn này. Bên cạnh đó, tôi cũng muốn gửi lời cảm ơn đến các thầy cô đang làm việc tại khoa Công nghệ Thông tin trường Đại học Lạc Hồng đã quan tâm chỉ bảo và trực tiếp giảng dạy khóa cao học chúng tôi. Tôi xin chân thành cảm ơn lãnh đạo và các Thầy Cô ở Trung tâm Thông tin Tư liệu – Đại học Lạc Hồng, nơi tôi công tác, đã tạo mọi điều kiện thuận lợi cho tôi hoàn thành các môn học cũng như suốt thời gian làm luậnvăn tốt nghiệp. Bên cạnh đó, tôi gửi lời cảm ơn đến Ban Khảo thí – Đại học Lạc Hồng đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện luậnvăn cũng như ứngdụng sản phẩm nghiêncứu vào thực tế. Cuối cùng, tôi xin cảm ơn gia đình và bạn bè, những người đã luôn ủng hộ và động viên để tôi yên tâm nghiêncứuvà hoàn thành luận văn. Nguyễn Trọng Vinh MỤC LỤC Trang LỜI CAM ĐOAN . i LỜI CẢM ƠN ii MỤC LỤC . iii DANH MỤC HÌNH ẢNH iv DANH MỤC BẢNG BIỂU v MỞ ĐẦU 1 CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN. . 4 1.1. Xử lý ảnh vàmộtsốvấn đề cơ bản trong xử lý ảnh. . 4 1.1.1. Xử lý ảnh là gì? . 4 1.1.2. Quá trình xử lý ảnh 4 1.1.2.1. Thu nhận ảnh 5 1.1.2.2. Tiền xử lý 6 1.1.2.3. Phân đoạn ảnh . 6 1.1.2.4. Hệ quyết định 7 1.1.2.5. Trích chọn đặc điểm 7 1.1.2.6. Nhận dạng . 8 1.1.3. Mộtsốvấn đề cơ bản trong xử lý ảnh. . 9 1.1.3.1. Ảnh . 9 1.1.3.2. Điểm ảnh 9 1.1.3.3. Mức xám 9 1.1.3.4. Các điểm 4 láng giềng 9 1.1.3.5. Các điểm 8 láng giềng 9 1.1.3.6. Đối tượng ảnh . 10 1.1.3.7. Kỹthuật phóng to, thu nhỏ ảnh . 10 1.1.4. Tổng quan về ảnh văn bản. 11 1.2. Tổng quan về bài toán phát hiện góc nghiêng văn bản 12 1.2.1. Góc nghiêng và vai trò việc phát hiện góc nghiêng văn bản . 12 1.2.2. Phương pháp phân tích hình chiếu (Profile Projection) 12 1.2.2.1. Thuật toán Postl 14 1.2.2.2. Thuật toán Baird . 14 1.2.2.3. Thuật toán Nakano 14 1.2.2.4. Nhận xét 15 1.2.3. Phương pháp phân tích dựa vào trọng tâm (Center of Gravity) 15 1.2.4. Phương pháp phân tích láng giềng (Nearest Neighbour Clustering) . 19 1.2.4.1. Thuật toán Yue Lu và Chew Lim Tan . 20 1.2.4.2. Nhận xét . 21 1.2.5. Phương pháp dùng phép toán hình thái (Morphology) . 22 1.2.5.1. Thuật toán L. Najman . 22 1.2.5.2. Nhận xét . 24 1.2.6. Phương pháp dùng biến đổi Hough (Hough Transform) . 24 1.2.6.1. Đường thẳng Hough trên tọa độ cực 24 1.2.6.2. Nhận xét 27 CHƯƠNG 2. BIÊN VÀ CÁC PHƯƠNG PHÁP DÒ BIÊN . 28 2.1. Biên của đối tượng ảnh . 28 2.1.1. Biên và các kiểu biên cơ bản trong ảnh 28 2.1.1.1. Biên lý tưởng 28 2.1.1.2. Biên dốc 29 2.1.1.3. Biên không trơn 30 2.1.2. Vai trò của biên trong nhận dạng 31 2.2. Các phương pháp dò biên trực tiếp . 32 2.2.1. Phương pháp Gradient . 32 2.2.2. Phương pháp Laplace . 34 2.3. Phương pháp dò biên tổng quát 34 2.3.1. Khái niệm chu tuyến 34 2.3.2. Phương pháp dò biên tổng quát 36 2.4. Mộtsố phương pháp dò biên nâng cao . 38 2.4.1. Phương pháp Canny . 38 2.4.2. Phương pháp Shen – Castan . 39 CHƯƠNG 3. ỨNGDỤNG BIẾN ĐỔI HOUGH PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN. 40 3.1. Tiền xử lý và phát hiện góc nghiêng văn bản từ biên của đối tượng 40 3.2. Xác định đường thẳng Hough trên trang văn bản 41 3.3. Áp dụng biến đổi Hough phát hiện góc nghiêng văn bản 42 3.4. Thuật toán phát hiện góc nghiêng văn bản 44 3.5. Chỉnh sửa góc nghiêng văn bản 51 CHƯƠNG 4. XÂY DỰNG CHƯƠNG TRÌNH THỰC NGHIỆM 53 4.1. Sơ đồ khối. . 53 4.2. Thiết kế chương trình . 54 4.2.1. Module giao diện chính . 54 4.2.2. Module chuyển đổi ảnh gốc vàbiểu đồ mức xám . 56 4.2.3. Module dò biên 58 4.2.4. Module biểu diễn biến đổi Hough 60 4.2.5. Module hiệuchỉnh góc nghiêng văn bản 61 4.3. Đánh giá kết quả . 61 KẾT LUẬN 67 TÀI LIỆU THAM KHẢO . 69 DANH MỤC HÌNH ẢNH Hình 1.1. Sơ đồ quá trình xử lý ảnh . 5 Hình 1.2 Ma trận 8 láng giềng . 10 Hình 1.3 Tổng quan quá trình tạo ảnh tài liệu 12 Hình 1.4 Đa giác 6 đỉnh và trọng tâm được xác định . 16 Hình 1.5 Hình chữ nhật ngoại tiếp ảnh văn bản thay cho đa giác . 16 Hình 1.6 Ảnh đầu vào và kết quả sau khi áp dụngthuật toán . 17 Hình 1.7 Tìm các điểm xa nhất theo các hướng trên ảnh 18 Hình 1.8 Trọng tâm được xác định dựa vào các điểm xa nhất 18 Hình 1.9 Đường cơ sở được nối từ trọng tâm đến gốc tọa độ . 18 Hình 1.10 Xác định góc nghiêng ảnh văn bản 18 Hình 1.11 Phân tích láng giềng 19 Hình 1.12 Các K-NN và vector chỉ phương ứng với K=2,3,4 21 trong thuật toán Yue Lu-Chew Lim Tan . 21 Hình 1.13 Đường thẳng Hough và trục tọa độ 25 Hình 1.14 Biểu diễn đường thẳng Hough đi qua 3 điểm . 26 Hình 2.1 Đường biên lý tưởng . 29 Hình 2.2 Đường biên dốc 29 Hình 2.3 Đường biên không trơn . 30 Hình 2.4 Sơ đồ phân tích ảnh . 31 Hình 2.5 Các 4- láng giềng của điểm ảnh P 35 Hình 2.6 Các 8- láng giềng của điểm ảnh P 35 Hình 2.7 Ví dụ về các chu tuyến đối ngẫu 36 Hình 2.8 Chu tuyến trong và chu tuyến ngoài của một đối tượng . 36 Hình 3.1 Xác định hình chữ nhật ngoại tiếp các đối tượng . 40 Hình 3.2 Đường thẳng trong toạ độ cực . 41 Hình 3.3 Đường thẳng Hough trên trục tọa độ . 43 Hình 3.4 Ví dụ về một ảnh nghiêng có ít ký tự chữ cái 45 Hình 3.5 Ví dụ về văn bản nghiêng có các đối tượng bao nhau 46 Hình 3.6 Sơ đồ giải thuật tổng quát . 50 Hình 3.7 Xoay một điểm ảnh quanh gốc tọa độ . 51 Hình 4.1 Sơ đồ tổng quát . 53 Hình 4.2 Giao diện chính của chương trình 54 Hình 4.3 Sơ đồ module xử lý cơ bản 55 Hình 4.4 Màn hình giao diện chương trình khi chọn chức năng Open 55 Hình 4.5 Sơ đồ thao tác xử lý trên ảnh . 56 Hình 4.6 Sơ đồ convert ảnh sang nhị phân và đa cấp xám 56 Hình 4.7 Giao diện biểu diễn Histogram của ảnh . 57 Hình 4.8 Giao diện convert ảnh sang nhị phân và ảnh đa cấp xám . 57 Hình 4.9 Sơ đồ chức năng dò biên . 58 Hình 4.10 Dò biên bằng phương pháp Sobel 58 Hình 4.11 Dò biên bằng phương pháp Canny 59 Hình 4.12 Dò biên bằng phương pháp Emboss Laplacian 59 Hình 4.13 Dò biên bằng phương pháp Gradient . 60 Hình 4.14 Biểu diễn biến đổi Hough của ảnh . 60 Hình 4.15 Phát hiện góc nghiêng và xoay ảnh . 61 Hình 4.16 Một ảnh bị nghiêng góc có các đối tượng xen lẫn văn bản, bảng biểuvà ảnh kết quả sau khi hiệuchỉnh 1 góc 12.9 o 63 Hình 4.17 Một ảnh bị nghiêng góc tiếng Nhật có xen lẫn hình ảnh, ký tự và ảnh kết quả sau khi hiệuchỉnh 1 góc 11.3 o 64 Hình 4.18 Một bảng điểm bị nghiêng góc không thể nhận dạng được của hệ thống quản lý điểm và ảnh kết quả sau khi hiệuchỉnh 1 góc 7.61 o 64 Hình 4.19 Mộtmẫu phiếu đánh giá chất lượng giảng dạy bị nghiêng góc không thể nhận dạng được và ảnh kết quả sau khi hiệuchỉnh 1 góc 9.72 o 65 Hình 4.20 Một ảnh màu tài liệu bị nghiêng và ảnh kết quả sau khi hiệuchỉnh 1 góc 10.82 o 65 Hình 4.21 Một ảnh màu tài liệu bị nghiêng gồm nhiều biểu đồ và ảnh kết quả sau khi hiệuchỉnh 1 góc 17.6 o 66 Hình 4.22. Trang ảnh văn bản tồn tại nhiều góc nghiêng được phát hiện 66 DANH MỤC BẢNG BIỂU Bảng 1. So sánh hiệu quả giữa các phương pháp phát hiện góc nghiêng . 27 Bảng 2. Kết quả thực nghiệm trên mộtsố ảnh văn bản 62