1. Trang chủ
  2. » Luận Văn - Báo Cáo

nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân

82 766 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 82
Dung lượng 2,57 MB

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG  ĐOÀN DUY THƢỜNG NGHIÊN CỨU PHƢƠNG PHÁP PHÂN TÍCH CẤU TRÚC ẢNH MÀU, ỨNG DỤNG TRONG NHẬN DẠNG CHỨNG MINH NHÂN DÂN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN- 2014 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG  ĐOÀN DUY THƢỜNG NGHIÊN CỨU PHƢƠNG PHÁP PHÂN TÍCH CẤU TRÚC ẢNH MÀU, ỨNG DỤNG TRONG NHẬN DẠNG CHỨNG MINH NHÂN DÂN Chuyên ngành : Mã số: Khoa học máy tính 60 48 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC: TS Nguyễn Thị Thanh Tân THÁI NGUYÊN - 2014 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi hồn thành dƣới hƣớng dẫn khoa học TS Nguyễn Thị Thanh Tân Nếu có vi phạm tơi xin hoàn toàn chịu trách nhiệm Học viên thực luận văn Đồn Duy Thƣờng Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn chân thành tới TS Nguyễn Thị Thanh Tân có dẫn, động viên q báu suốt trình thực luận văn Đồng thời xin chân thành cảm ơn thầy giáo Ban giám hiệu, phịng Đào tạo, thầy cô giáo trƣờng Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên thầy cô giáo Viện Công nghệ Thông Tin - Viện Hàn lâm Khoa học Việt Nam quan tâm, tạo điều kiện thuận lợi, nhiệt tình giảng dạy hƣớng dẫn tơi suốt q trình học tập hồn thiện luận văn Cuối tơi xin cảm ơn giúp đỡ từ ngƣời thân, đồng nghiệp ngƣời ủng hộ, hỗ trợ suốt trình thực luận văn Mặc dù có nhiều cố gắng, nhiên luận văn tơi khơng thể tránh khỏi thiếu sót, tơi mong nhận đƣợc ý kiến đánh giá, bổ sung để tơi hồn thiện luận văn mình./ Thái Nguyên, ngày tháng Tác giả năm 2014 Đồn Duy Thƣờng Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT vi DANH MỤC BẢNG BIỂU ix DANH MỤC THUẬT TOÁN x PHẦN MỞ ĐẦU 1 Đặt vấn đề Mục tiêu luận văn Tính cấp thiết luận văn Bố cục luận văn CHƢƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG VĂN BẢN VÀ BÀI TỐN PHÂN TÍCH CẤU TRÚC 1.1 Tổng quan nhận dạng văn 1.2 Bài toán phân tích cấu trúc trang 1.2.1 Giới thiệu chung 1.2.2 Một số kỹ thuật tiền xử lý phân tích cấu trúc trang ảnh 10 1.2.2.1 Nhị phân ảnh 10 1.2.2.2 Căn chỉnh độ nghiêng trang ảnh 13 1.2.2.3 Lọc nhiễu 14 1.2.2.4 Tách 16 1.2.2.5 Các tốn tử hình thái 16 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ iv 1.2.3 Một số hƣớng tiếp cận phân tích cấu trúc trang văn 19 1.3 Kết luận 20 CHƢƠNG 2: MỘT SỐ KỸ THUẬT PHÂN TÍCH CẤU TRÚC, ỨNG DỤNG TRONG PHÁT HIỆN VÀ BÓC TÁCH CÁC TRƢỜNG THÔNG TIN TRÊN ẢNH TÀI LIỆU 21 2.1 Kỹ thuật X-Y Cut 21 2.2 Kỹ thuật Smearing 23 2.3 Kỹ thuật Whitespace 26 2.4 Kỹ thuật Docstrum 27 2.5 Kỹ thuật dựa lƣợc đồ Voronoi 29 2.6 Kỹ thuật phát ràng buộc dòng văn 32 2.7 Kỹ thuật phân tích cấu trúc ảnh tài liệu 33 2.7.1 Đặc trƣng ảnh tài liệu cần nhận dạng 33 2.7.2 Phát trƣờng số ảnh 35 2.7.2.1 Xác định vùng trƣờng số ảnh 36 2.7.2.2 Tìm tách trƣờng số 37 2.7.2.3 Phân đoạn vùng số 38 2.7.3 Phân tích cấu trúc bảng 40 2.7.4 Tách trƣờng thơng tin cịn lại 42 2.7.4.1 Tách đối tƣợng thuộc dòng 44 2.7.4.2 Xóa tiêu đề 45 2.7.4.3 Lấy lại ký tự bị 47 2.8 Kết luận 48 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ v CHƢƠNG 3: CHƢƠNG TRÌNH ỨNG DỤNG 50 3.1 Mơ tả tốn 50 3.2 Phân tích, cài đặt chƣơng trình thử nghiệm 51 3.2.1 Tiền xử lý ảnh mặt trƣớc CMND 54 3.2.2 Tiền xử lý ảnh mặt sau CMND 62 3.2.3 Các độ đo đánh giá hiệu phƣơng pháp 63 3.2.4 Dữ liệu thử nghiệm 64 3.3 Kết thực nghiệm 65 3.4 Kết luận 66 PHẦN KẾT LUẬN 68 DANH MỤC TÀI LIỆU THAM KHẢO 69 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ vi DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT OCR Optical Character Recognition CMND Chứng minh nhân dân RLSA The run-length smearing algorithm Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ vii DANH MỤC HÌNH VẼ Hình 1 Thu nhận ảnh tài liệu Hình Quy trình chung hệ thống OCR Hình Một số tài liệu có cấu trúc phức tạp Hình 1.4 Quy trình phân tích cấu trúc trang ảnh Hình b- Cấu trúc vật lý; c,d - Cấu trúc logic tài liệu 10 Hình 1.6 Phần tử cấu trúc 3 17 Hình 1.7 Phép giãn ảnh với phần tử cấu trúc 3x3 18 Hình 1.8 Phép co ảnh với phần tử cấu trúc 3x3 18 Hình a) Ảnh gốc b) Kết thực thuật tốn X-Y Cut 23 Hình 2 Kết thực kỹ thuật Smearing 25 Hình Tài liệu ảnh trƣớc xử lý Tài liệu ảnh sau đƣợc xử lý 27 Hình Xác định thành phần liên thơng, trọng tâm dịng 28 Hình Sơ đồ Voronoi 30 Hình Kết thực kỹ thuật sử dụng lƣợc đồ Voronoi 30 Hình Mẫu “Giấy Chứng minh nhân dân” 34 Hình Xác định vùng Số CMND 37 Hình Phân đoạn vùng số Chứng minh Nhân dân 39 Hình 10 Xác định cấu trúc bảng 42 Hình 11 Mặt nạ dịng mặt trƣớc 44 Hình Quy trình nhận dạng thơng tin CMND 50 Hình Quy trình thực chƣơng trình thử nghiệm 51 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ viii Hình 3 Tiền xử lý ảnh mặt trƣớc CMND 55 Hình Nhị phân ảnh CMND 60 Hình Phƣơng pháp tia quay 61 Hình Ảnh CMND 65 Hình Một số trƣờng hợp khó phát 66 Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 56 nhiễu Do đó, luận văn đề xuất phƣơng thức kết hợp đƣợc ƣu điểm hai phƣơng pháp Các bƣớc thực nhƣ sau: Nhị phân ảnh phƣơng pháp Otsu đƣợc ảnh IO (Thuật toán 1) Nhị phân ảnh phƣơng pháp Niblack đƣợc ảnh IS(Thuật toán 2) Áp dụng toán tử AND hai ảnh IO IS để đƣợc ảnh nhị phân cần tìm: IB = IO AND IS a) Nhị phân ảnh phƣơng pháp Otsu Đây phƣơng pháp xác định ngƣỡng cho toàn ảnh Phƣơng pháp tìm ngƣỡng để phân chia điểm ảnh vào hai lớp tiền cảnh (đối tƣợng) Giá trị ngƣỡng đƣợc xác định cho “khoảng cách” điểm ảnh lớp nhỏ nhất, điều tƣơng đƣơng với khoảng hai lớp lớn Việc phân chia dựa giá trị histogram ảnh Các bƣớc để xác định ngƣỡng tOtsu ảnh đƣợc tiến hành nhƣ sau: Thuật toán 1: Thuật toán nhị phân ảnh Otsu Input : Ảnh đa cấp xám Output: Ngƣỡng nhị phân cho toàn ảnh: tOtsu Tính histogram ảnh: {pi} Duyệt tất mức xám ảnh: t t t 2.1 Tính lũy tích cho PB tiền cảnh PF t B 2.2 Tính trị số trung bình 2.3 Tính độ lệch chuẩn t B tiền cảnh t 2.4 Xác định hàm khảng cách: varbetween class t 2.5 Ngƣỡng tOtsu đối số để hàm varbetween t Hoặc hàm varwithin Số hóa Trung tâm Học liệu class t F tiền cảnh t F t varwithin class class lớn đạt giá trị nhỏ http://www.lrc-tnu.edu.vn/ 57 Với ảnh đầu vào ảnh đa cấp xám, điểm ảnh có giá trị cƣờng độ nằm khoảng [0, L] (L= 255) Giả định {pi} (i = [0, L-1]) lƣợc đồ mức xám ảnh tỷ số số lƣợng điểm ảnh có mức xám I so với tồn ảnh t giá trị mức xám ngƣỡng lựa chọn Sử dụng F B để ký hiệu cho lớp tiền cảnh nền, việc tính xác suất tiền cảnh ngƣỡng t đƣợc xác định bởi: Hàm lũy tích tiền cảnh nền: t t B L t F P t B pi P P pi i i t Độ lệch chuẩn tiền cảnh nền: t PBt t B t B i pi i L 1 PFt t F t F i pi i t Giá trị trung bình tiền cảnh nền: t PBt t B ipi L 1 PFt t F i ipi i t Từ ta xác định đƣợc khoảng cách lớp khoảng cách lớp nhƣ sau: t varbetween class PBt t varwint hin class PBt Trong đó: L t B t B PFt PFt t F PBt PFt ( t B t F ) t F ipi giá trị trung bình tồn ảnh i t Khi ngƣỡng tOtsu đƣợc xác định đối số để hàm var between t trị lớn hàm varwint hin class Số hóa Trung tâm Học liệu class đạt giá trị nhỏ nhất: http://www.lrc-tnu.edu.vn/ đạt giá 58 tOtsu t arg{max t L (varbetween class } t arg{min x1 t L (varwithin class } Đây phƣơng pháp đƣợc sử dụng phổ biến xử lý ảnh phân đoạn làm bật ảnh tốt Tuy nhiên, phƣơng pháp thất bại số điểm ảnh tiền cảnh nhỏ 5% b) Nhị phân ảnh phƣơng pháp Niblack Đây phƣơng pháp xác định ngƣỡng cục dựa việc tính tốn giá trị trung bình độ lệch chuẩn cục Thuật tốn đƣợc mơ tả nhƣ sau: Thuật toán 2.Thuật toán nhị phân ảnh Niblack Input: Giá trị mức xám điểm ảnh g(x, y) Output: Ngƣỡng nhị phân cho điểm ảnh T(x, y) Duyệt tất điểm ảnh: Xác định cửa sổ (w × w) bao quanh 2.Tính giá trị trung bình m(x, y) Tính độ lệch chuẩn σ(x, y) Xác định ngƣỡng T(x, y) Với điểm ảnh, xác định cửa sổ kích thƣớc (w x w) bao quanh Giá trị ngƣỡng đƣợc tính tốn dựa tên giá trị trung bình độ lệch chuẩn cửa sổ Với điểm ảnh vị trí (x, y) giá trị ngƣỡng đƣợc xác định nhƣ sau: Trong đó: m(x, y) (x, y) tƣơng ứng giá trị trung bình độ lệch chuẩn cục cửa sổ (w × w) với tâm vị trí (x, y), đƣợc xác định nhƣ sau: Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 59 x w y m ( x, y ) w g (i, j ) w w i x j y 2 ( x, y ) w2 x i x w y w g (i, j ) m ( x, y ) w w j y 2 k tham số dùng để xác địng đƣờng biên đối tƣợng chiếm phần đối tƣợng trả Kích thƣớc cửa sổ phải đủ nhỏ để giữ lại chi tiết phải đủ lớn để khử điểm nhiễu Tham số k = -0.2, kích thƣớc cửa sổ w = 15 Dựa phƣơng pháp Niblack, Sauvola đƣa công thức xác định ngƣỡng nhƣ sau [12][19]: Trong đó: R giá trị lớn độ lệch chuẩn (với ảnh đa cấp xám: R =128), k tham số nằm khoảng [0.2, 0.5], m(x, y) σ(x, y) giá trị đáp ứng ngƣỡng khác tùy theo điểm lân cận Với vài vùng ảnh có độ tƣơng phản cao σ(x, y) ≈ R, T(x, y) ≈ m(x, y) Kết giống nhƣ phƣơng pháp Niblack Trong trƣờng hợp T(x, y) nhỏ giá trị trung bình xóa vài vùng tối Tham số k dùng để điều chỉnh giá trị ngƣỡng so với giá trị trung bình m(x, y) (lớn hay nhỏ tỷ lệ k) Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 60 a) Ảnh gốc b) Kết thuật toán Niblackc) Kết phƣơng pháp Otsu Hình Nhị phân ảnh CMND Nhƣ ngƣỡng điểm ảnh đƣợc xác định dựa việc đánh giá giá trị điểm ảnh lân cận với nó, thích hợp cho ảnh có độ sáng thay đổi (ví dụ nhƣ ảnh chụp từ camera) Nhƣng thời gian tính tốn chậm, tùy thuộc vào kích thƣớc cửa sổ.Hình mô tả kết phân ngƣỡng hai phƣơng pháp hai ảnh có tính chất khác 3.2.1.3 Căn chỉnh độ nghiêng ảnh CMND Trong trình thu nhận ảnh không tránh khỏi việc ảnh thu nhận đƣợc bị nghiêng Do đó, bƣớc phân tích ảnh đƣợc xác ảnh sau phân đoạn phải đƣợc chỉnh độ nghiêng Trong số phƣơng pháp chỉnh độ nghiêng văn bản, nhận thấy rằng: Phƣơng pháp dựa vào biến đổi Hough có thời gian tính tốn lâu, áp dụng cho ảnh có kích thƣớc lớn phải tính tốn cho điểm ảnh một; Phƣơng pháp láng giềng gần khơng phù hợp ảnh có chứa ký tự Tiếng Việt có dấu Do phƣơng pháp đƣợc áp dụng phƣơng pháp chiếu nghiêng Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 61 Đây phƣơng pháp thƣờng đƣợc sử dụng hệ thống thƣơng mại Project profile biểu đồ giá trị điểm đen đƣợc tích lũy theo dịng qt song song với phƣơng xác định toàn ảnh Biểu đồ thƣờng đƣợc ghi theo phƣơng ngang dọc ảnh, gọi histogram chiếu ngang histogram chiếu dọc (xem Hình 5) Hình Phƣơng pháp tia quay Từ histogram theo chiều ngang ta thấy, đƣờng thuộc vào dịng văn nằm ngang có giá trị cao dịng thuộc vào khoảng dòng với Dựa vào tính chất để xác định góc nghiêng ảnh Thuật toán 3 sau đây: Thuật toán 3 Thuật toán Sử dụng tia quay để xác định góc nghiêng Input: Ảnh (nhị phân) bị nghiêng I Output: Góc nghiêng Duyệt số góc nghiêng: 1.1 Xoay ảnh với góc nghiêng 1.2 Tính biểu đồ histogram theo phƣơng ngang 1.3 Tính độ biến thiên histogram Góc nghiêng α góc tƣơng ứng với độ biến thiên lớn Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 62 H.S.Braid [8]đã tiến hành cải biến phƣơng pháp project profile Đầu tiên, tìm thành phần liên thông, thành phần liên thông đƣợc đại diện tâm đáy hình chữ nhật bao quanh Tiếp theo, thành phần liên thông đƣợc nối với nhau.Sau đó, tiến hành xoay văn số vị trí tính biểu đồ histogram Vị trí có độ biến thiên lớn histogram vị trí góc nghiêng cần tìm Cải biến làm tăng đáng kể tốc độ phƣơng pháp Project profile, đồng thời độ xác đạt cao (~0.50), thích hợp với trang có độ nghiêng khoảng ~100 Phƣơng pháp cho kết tốt thời gian thực tƣơng đối nhanh Ảnh màu đầu vào đƣợc sử dụng để tách trƣờng Số CMND, việc hiệu chỉnh độ nghiêng đƣợc thực ảnh nhị phân ảnh màu dựa vào góc nghiêng xác định đƣợc ảnh nhị phân 3.2.2 Tiền xử lý ảnh mặt sau CMND Mặt sau CMND khơng có hoa văn phức tạp nhƣ mặt trƣớc CMND mà chữ màu đen trắng Tuy nhiên lại có dấu màu đỏ, dấu đè lên trƣờng Ngày cấp Nơi cấp Mặt khác, trình sử dụng ảnh bị suy thoái chất lƣợng: bị ố, mốc, nhàu,… hay bị nghiêng Do đó, cần thao tác tiền xử lý ảnh để khử thành phần dấu màu đỏ nhƣ chỉnh độ nghiêng Chuyển ảnh màu ảnh đa cấp xám: cách tách lấy kênh màu Red Điều loại bỏ đƣợc dấu màu đỏ, mà đƣợc đặc trƣng nét bút Nhị phân ảnh: Vì mặt sau có cấu trúc đơn giản nên cần áp dụng phƣơng pháp phân ngƣỡng Niblack để khử Căn chỉnh độ nghiêng: Việc chỉnh độ nghiêng ảnh mặt sau CMND đƣợc thực phƣơng pháp chiếu nghiêng tƣơng tự nhƣ ảnh mặt trƣớc CMND Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 63 3.2.3 Các độ đo đánh giá hiệu phƣơng pháp Trong phạm vi nghiên cứu luận văn, độ đo Precision (độ xác), recall (khả tìm hết) F- measure (độ đo F) đƣợc xác định dựa số khối phát đƣợc (bao gồm số khối phát đúng, số khối phát sai) số khối chƣa đƣợc xác định, cụ thể nhƣ sau: Độ xác (Precision): Khả tìm hết (Recall): Độ đo F (F-measure): Trong đó, gọi V vùng cần đƣợc phát (đã đƣợc xác định file ground-truth) V ' vùng đƣợc phát (bởi chƣơng trình) khái niệm vùng khơng đƣợc phát hiện, vùng phát vùng phát sai đƣợc định nghĩa cụ thể nhƣ sau: + Vùng không phát hiện: Một vùng đƣợc coi không đƣợc phát tọa độ vùng đƣợc xác định file ground-truth nhƣng chƣơng trình bỏ qua, khơng phát đƣợc hay nói cách khác + Vùng phát đúng:Vùng V ' đƣợc coi vùng đƣợc phát diện tích phần giao V ' với vùng cần phát V thỏa mãn điều kiện: Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 64 Trong đó: + S (.) diện tích + C1 ,C2 số tùy chọn, chọn C1 C / + (V V ' ) phần giao vùng cần phát V vùng đƣợc phát V ' + Vùng phát sai:Vùng V ' đƣợc coi vùng đƣợc phát sai không rơi vào hai trƣờng hợp nêu Cụ thể: Với số C1 ,C2 đƣợc xác định nhƣ 3.2.4 Dữ liệu thử nghiệm Hiệu phƣơng pháp đƣợc kiểm nghiệm tập liệu đầu vào bao gồm 1856 trang ảnh nhị phân tƣơng ứng với 928 trang ảnh mặt trƣớc 928 trang ảnh mặt sau CMND Các mẫu CMND đƣợc thu thập từ nhiều tỉnh thành, đa dạng chất lƣợng kích cỡ font chữ, kiểu in ấn, đƣợc quét với ngƣỡng độ phân giải 200dpi, 300dpi 400 dpi Để phục vụ cho việc đánh giá thực nghiệm, ảnh mẫu CMND đƣợc cung cấp kèm file ground-truth, lƣu trữ thơng tin vùng thơng tin cần phát Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 65 ảnh nhƣ tổng số vùng, tọa độ vùng thông tin cần phát Cụ thể, luận văn xem xét trƣờng mặt trƣớc CMND bao gồm số CMND, họ tên, ngày sinh, nguyên quán, nơi thƣờng trƣờng thông tin mặt sau CMND bao gồm dân tộc, tơn giáo, ngày cấp, nơi cấp (xem Hình 6) a) Ảnh CMND mặt trƣớc b) Ảnh CMND mặt sau Hình Ảnh CMND 3.3 Kết thực nghiệm Để thuận tiện cho việc trình bày, gọi NT số vùng phát đúng, NM số vùng không đƣợc phát NF số vùng phát sai Kết thực nghiệm phƣơng pháp đƣợc thể cụ thể Bảng 3.1 Precision Recall F-Measure (%) (%) (%) 100 99,68 99,84 11 98,82 99,46 99,14 921 15 98,40 99,25 98,82 Nguyên quán 917 11 16 98,29 98,81 98,55 Nơi thƣờng trú 915 13 14 98,49 98,60 98,55 Trƣờng thông tin NT NM NF Số CMND 925 Họ tên 923 Ngày sinh Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 66 Dân tộc 911 17 21 97,75 98,17 97,96 Tôn giáo 912 16 19 97,96 98,28 98,18 Ngày cấp 889 39 21 97,69 95,80 96,74 Nơi cấp 886 42 23 97,47 95,47 96,46 Bảng 3.1 Kết thực nghiệm Từ kết thực nghiệm cho thấy phƣơng pháp phát dựa vào việc tách kênh màu cho độ xác (precision) tuyệt đối trƣờng số CMND vùng có độ tƣơng phản rõ rệt so với vùng bên cạnh Việc bỏ sót (khơng phát hiện) đƣợc trƣờng số CMND thƣờng xảy trƣờng hợp ảnh CMND cũ mờ, vùng thông tin cần phát bị trình tiền xử lý Hình Một số trƣờng hợp khó phát Đối với trƣờng thơng tin cịn lại, việc bỏ sót xác định sai vùng thƣờng nguyên nhân vùng thơng tin bị lệch, xiên, dính chồng lên (xem Hình 7) 3.4 Kết luận Trong chƣơng này, luận văn tập trung phân tích, thiết kế cài đặt chƣơng trình thử nghiệm Trên sở đó, hiệu phƣơng pháp đƣợc kiểm nghiệm tập liệu đủ lớn với với 928 trang ảnh mặt trƣớc 928 trang ảnh mặt sau CMND Để đánh giá hiệu Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 67 phƣơng pháp, luận văn sử dụng độ đo độ xác (precision), khả tìm hết (recall) độ đo hiệu (F-Measure) Các kết thực nghiệm cho thấy phƣơng pháp đạt đƣợc độ xác trung bình 97%, khả tìm hết 95% độ đo hiệu 96% tất trƣờng thơng tin cần xác định Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 68 PHẦN KẾT LUẬN Trong trình tìm hiểu, luận văn đạt đƣợc số kết nhƣ sau: Xử lý ảnh vấn đề rộng lớn cần đƣợc đầu tƣ, quan tâm nghiên cứu Đồng thời, tìm hiểu nắm đƣợc số hƣớng tiếp cận phân tích cấu trúc trang văn Đã đề xuất giải pháp tổng thể cho việc phát bóc tách trƣờng thơng tin ảnh CMND dựa kỹ thuật phân tích cấu trúc ảnh màu kết hợp với kỹ thuật tiền xử lý ảnh nhƣ: lọc nhiễu, nhị phân ảnh, chỉnh độ nghiêng trang văn bản, tốn tử hình thái Từ vận dụng vào tốn luận văn đƣa giải pháp thực cho toán Đã tiến hành cài đặt thử nghiệm chƣơng trình bóc tách trƣờng thơng tin cần nhận dạng CMND Chƣơng trình đạt đƣợc kết tốt có khả ứng dụng vào tốn thực tế Tuy nhiên, thời gian thực luận văn cịn có hạn, khối lƣợng cơng việc lớn nên nhiều vấn đề tồn chƣa thể giải quyết: Chƣơng trình dạng thử nghiệm, chƣa hoàn chỉnh nên chƣa thể áp dụng vào thực tế Chƣơng trình dừng lại việc bóc tách trƣờng thông tin cần nhận dạng CMND nhận dạng đƣợc CMND Để phát triển cần phải tiếp tục tìm hiểu, nghiên cứu hồn thiện chƣơng trình để ứng dụng vào thực tế Đồng thời, khái quát hóa để xử lý đƣợc dạng ảnh thẻ Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 69 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đỗ Năng Tồn, Phạm Việt Bình, “Giáo trình xử lý ảnh”, Đại học Thái Nguyên, NXB Khoa học Kỹ thuật, 2008 [2] Hồ Đức Lĩnh, “Xử lý hình thái học ảnh ứng dụng”, Khoa Công nghệ Thông tin - Đại học Đông Á [3] Lê Đức Hiếu (2012), “Ứng dụng số kỹ thuật xử lý ảnh phân tích chứng minh nhân dân”, Luận văn thạc sĩ Công nghệ Thông tin, trƣờng Đại học Công nghệ [4] Nghị định số: 577-TTg “Đặt giấy chứng minh quy định thể lệ cấp phát giấy chứng minh”, Chính phủ, Hà Nội, ngày 27 tháng 11 năm 1957 [5] Nghị định số: 05/1999/NĐ-CP “Về chứng minh nhân dân”, Chính phủ, Hà Nội, ngày 03 tháng 02 năm 1999 [6] Nghị định số: 170/2007/NĐ-CP “Sửa đổi, bổ sung số điều nghị định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 phủ chứng minh nhân dân”, Hà Nội, ngày 19 tháng 11 năm 2007 Tiếng Anh [7] Anoop M Namboodiri and Anil Jain, “Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B B Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1-84628-501-1), Jan 2007 [8] Baird, U.S and Jones, S.E and Fortune, S.J.: “Image Segmentation by Shape-Directed Covers”, in Proceedings of International Conference on Pattern Recognition, Atlantic City, NJ (1990), 820-825 [9] Baird, H.S.: Background structure in document images In: Document Image Analysis, World Scientific, (1994) 17–34 [10] G Nagy, S Seth and M Viswanathan, "A Prototype Document ImageAnalysis System for Technical Journals", Computer 25, (1992), 10–22 [11] JIANG Ren-jie, QI Fei-hu, XU Li, WU Guo-rong, ZHU Kai-hua “Alearning-based method to detect and segment text from scene Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 70 images”, Department of Computer Science and Technology, Shanghai Jiao Tong University, Shanghai 200240, China, 2006 [12] J Sauvola, M Pietikainen, “Adaptive Document Image Binarization”, Pattern Recognition, 33, 2000, pp 225-236 [13] K Kpalma and J Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007 [14] Kise, K and Sato, A and Iwata, M.: “Segmentation of Page Images using the Area Voronoi Diagram”, Computer Vision and Image Understanding 70 (1998), 370-382 [15] Koichi Kise, Motoi Iwata and Keinosuke Matsumoto, “On the Application of Voronoi Diagrams to Page Segmentation”, Department of Computer and Systems Sciences, College of Engineering, Osaka Prefecture University 1-1 Gakuencho, Sakai, Osaka 599-8531 [16] Mehmet Sezgin & Bülent Sankur, “Survey over image thresholding techniques and quantitative performance evaluation”, Journal of Electronic Imaging 13(1), 146– 165 (January 2004) [17] O’Gorman, L.: The Document Spectrum for Page Layout Analysis IEEE Transactions on Pattern Analysis and Machine Intelligence 15 (1993), 1162-1173 [18] Toyohide WATANABE, “Document Analysis and Recognition”, IEICE TRANS INF & SYST., vol.e82-d, no.3 [19] W Niblack, “An Introduction to Digital Image Processing”, pp 115116, Prentice Hall, 1986 [20] Wong, K.Y., Casey, R.G., Wahl, F.M.: Document analysis system IBM Journal of Research and Development 26 (1982) 647–656 [21] http://www.leptonica.com/ Số hóa Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ... TRUYỀN THÔNG  ĐOÀN DUY THƢỜNG NGHIÊN CỨU PHƢƠNG PHÁP PHÂN TÍCH CẤU TRÚC ẢNH MÀU, ỨNG DỤNG TRONG NHẬN DẠNG CHỨNG MINH NHÂN DÂN Chuyên ngành : Mã số: Khoa học máy tính 60 48... lập 2.7 Kỹ thuật phân tích cấu trúc ảnh tài liệu 2.7.1 Đặc trƣng ảnh tài liệu cần nhận dạng (ảnhCMND) Theo quy định phủ năm 2007 [6] giấy chứng minh nhân dân hay chứng minh nhân dân (CMND) loại... dòng “GIẤY CHỨNG MINH NHÂN DÂN” dập/in bị chờm lên (hoặc sát vào) dịng “GIẤY CHỨNG MINH NHÂN DÂN” sử dụng trƣờng Số CMND bị nh lên dịng “GIẤY CHỨNG MINH NHÂN DÂN” Đồng thời, trình sử dụng trƣờng

Ngày đăng: 18/12/2014, 00:19

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đỗ Năng Toàn, Phạm Việt Bình, “Giáo trình xử lý ảnh”, Đại học Thái Nguyên, NXB Khoa học và Kỹ thuật, 2008 Sách, tạp chí
Tiêu đề: “Giáo trình xử lý ảnh”
Nhà XB: NXB Khoa học và Kỹ thuật
[2] Hồ Đức Lĩnh, “Xử lý hình thái học trên ảnh và ứng dụng”, Khoa Công nghệ Thông tin - Đại học Đông Á Sách, tạp chí
Tiêu đề: “Xử lý hình thái học trên ảnh và ứng dụng”
[3] Lê Đức Hiếu (2012), “Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích chứng minh nhân dân”, Luận văn thạc sĩ Công nghệ Thông tin, trường Đại học Công nghệ Sách, tạp chí
Tiêu đề: “Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích chứng minh nhân dân”
Tác giả: Lê Đức Hiếu
Năm: 2012
[4] Nghị định số: 577-TTg “Đặt giấy chứng minh và quy định thể lệ cấp phát giấy chứng minh”, Chính phủ, Hà Nội, ngày 27 tháng 11 năm 1957 Sách, tạp chí
Tiêu đề: “Đặt giấy chứng minh và quy định thể lệ cấp phát giấy chứng minh”
[5] Nghị định số: 05/1999/NĐ-CP “Về chứng minh nhân dân”, Chính phủ, Hà Nội, ngày 03 tháng 02 năm 1999 Sách, tạp chí
Tiêu đề: “Về chứng minh nhân dân”
[6] Nghị định số: 170/2007/NĐ-CP “Sửa đổi, bổ sung một số điều của nghị định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 của chính phủ về chứng minh nhân dân”, Hà Nội, ngày 19 tháng 11 năm 2007.Tiếng Anh Sách, tạp chí
Tiêu đề: “Sửa đổi, bổ sung một số điều của nghị định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 của chính phủ về chứng minh nhân dân”
[7] Anoop M Namboodiri and Anil Jain, “Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B. B. Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1-84628-501-1), Jan. 2007 Sách, tạp chí
Tiêu đề: Document Structure and Layout Analysis”, in "Digital Document Processing
[8] Baird, U.S. and Jones, S.E. and Fortune, S.J.: “Image Segmentation by Shape-Directed Covers”, in Proceedings of International Conference on Pattern Recognition, Atlantic City, NJ (1990), 820-825 Sách, tạp chí
Tiêu đề: “Image Segmentation by Shape-Directed Covers”
Tác giả: Baird, U.S. and Jones, S.E. and Fortune, S.J.: “Image Segmentation by Shape-Directed Covers”, in Proceedings of International Conference on Pattern Recognition, Atlantic City, NJ
Năm: 1990
[10] G. Nagy, S. Seth and M. Viswanathan, "A Prototype Document Image- Analysis System for Technical Journals", Computer 25, (1992), 10–22 Sách, tạp chí
Tiêu đề: A Prototype Document Image-Analysis System for Technical Journals
Tác giả: G. Nagy, S. Seth and M. Viswanathan, "A Prototype Document Image- Analysis System for Technical Journals", Computer 25
Năm: 1992
[12] J. Sauvola, M. Pietikainen, “Adaptive Document Image Binarization”, Pattern Recognition, 33, 2000, pp. 225-236 Sách, tạp chí
Tiêu đề: “Adaptive Document Image Binarization”
[13] K. Kpalma and J. Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007 Sách, tạp chí
Tiêu đề: “An Overview of Advances of Pattern Recognition Systems in Computer Vision”
[14] Kise, K. and Sato, A. and Iwata, M.: “Segmentation of Page Images using the Area Voronoi Diagram”, Computer Vision and Image Understanding 70 (1998), 370-382 Sách, tạp chí
Tiêu đề: Segmentation of Page Images using the Area Voronoi Diagram”, "Computer Vision and Image Understanding
Tác giả: Kise, K. and Sato, A. and Iwata, M.: “Segmentation of Page Images using the Area Voronoi Diagram”, Computer Vision and Image Understanding 70
Năm: 1998
[15] Koichi Kise, Motoi Iwata and Keinosuke Matsumoto, “On the Application of Voronoi Diagrams to Page Segmentation”, Department of Computer and Systems Sciences, College of Engineering, Osaka Prefecture University 1-1 Gakuencho, Sakai, Osaka 599-8531 Sách, tạp chí
Tiêu đề: “On the Application of Voronoi Diagrams to Page Segmentation”
[16] Mehmet Sezgin & Bülent Sankur, “Survey over image thresholding techniques and quantitative performance evaluation”, Journal of Electronic Imaging 13(1), 146– 165 (January 2004) Sách, tạp chí
Tiêu đề: “Survey over image thresholding techniques and quantitative performance evaluation”
[17] O’Gorman, L.: The Document Spectrum for Page Layout Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence 15 (1993), 1162-1173 Sách, tạp chí
Tiêu đề: The Document Spectrum for Page Layout Analysis
Tác giả: O’Gorman, L.: The Document Spectrum for Page Layout Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence 15
Năm: 1993
[18] Toyohide WATANABE, “Document Analysis and Recognition”, IEICE TRANS. INF. &. SYST., vol.e82-d, no.3 Sách, tạp chí
Tiêu đề: “Document Analysis and Recognition”
[19] W. Niblack, “An Introduction to Digital Image Processing”, pp. 115- 116, Prentice Hall, 1986 Sách, tạp chí
Tiêu đề: “An Introduction to Digital Image Processing”
[20] Wong, K.Y., Casey, R.G., Wahl, F.M.: Document analysis system. IBM Journal of Research and Development 26 (1982) 647–656 Sách, tạp chí
Tiêu đề: Document analysis system
[9] Baird, H.S.: Background structure in document images. In: Document Image Analysis, World Scientific, (1994) 17–34 Khác
[11] JIANG Ren-jie, QI Fei-hu, XU Li, WU Guo-rong, ZHU Kai-hua “Alearning-based method to detect and segment text from scene Khác

HÌNH ẢNH LIÊN QUAN

Hình 1. 1. Thu nhận ảnh tài liệu - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1. 1. Thu nhận ảnh tài liệu (Trang 17)
Hình 1. 2. Quy trình chung của một hệ thống OCR - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1. 2. Quy trình chung của một hệ thống OCR (Trang 18)
Hình 1. 3. Một số tài liệu có cấu trúc phức tạp - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1. 3. Một số tài liệu có cấu trúc phức tạp (Trang 19)
Hình 1.4. Quy trình phân tích cấu trúc trang ảnh - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1.4. Quy trình phân tích cấu trúc trang ảnh (Trang 20)
Hình 1. 5.b- Cấu trúc vật lý; c,d - Cấu trúc logic của một tài liệu - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1. 5.b- Cấu trúc vật lý; c,d - Cấu trúc logic của một tài liệu (Trang 22)
Bảng 1. 1. Bảng mã 4 màu - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Bảng 1. 1. Bảng mã 4 màu (Trang 23)
Hình 1.7. Phép giãn ảnh với phần tử cấu trúc 3x3 - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1.7. Phép giãn ảnh với phần tử cấu trúc 3x3 (Trang 30)
Hình 1.8. Phép co ảnh với phần tử cấu trúc 3x3 - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 1.8. Phép co ảnh với phần tử cấu trúc 3x3 (Trang 30)
Hình 2. 2. Kết quả thực hiện của kỹ thuật Smearing - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 2. Kết quả thực hiện của kỹ thuật Smearing (Trang 37)
Hình 2. 3. Tài liệu ảnh trước khi xử lý     Tài liệu ảnh sau khi được xử lý  2.4. Kỹ thuật Docstrum - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 3. Tài liệu ảnh trước khi xử lý Tài liệu ảnh sau khi được xử lý 2.4. Kỹ thuật Docstrum (Trang 39)
Hình 2. 4. Xác định các thành phần liên thông, trọng tâm của các dòng - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 4. Xác định các thành phần liên thông, trọng tâm của các dòng (Trang 40)
Hình 2. 6. Kết quả thực hiện của kỹ thuật sử dụng lƣợc đồ Voronoi - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 6. Kết quả thực hiện của kỹ thuật sử dụng lƣợc đồ Voronoi (Trang 42)
Hình 2. 5. Sơ đồ Voronoi - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 5. Sơ đồ Voronoi (Trang 42)
Bảng 2. 1. Thông tin mặt trước CMND - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Bảng 2. 1. Thông tin mặt trước CMND (Trang 46)
Hình 2. 7. Mẫu “Giấy Chứng minh nhân dân” - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 7. Mẫu “Giấy Chứng minh nhân dân” (Trang 46)
Hình 2. 8. Xác định vùng Số CMND - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 8. Xác định vùng Số CMND (Trang 49)
Hình 2. 9. Phân đoạn vùng số Chứng minh Nhân dân - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 9. Phân đoạn vùng số Chứng minh Nhân dân (Trang 51)
Hình 2. 10. Xác định cấu trúc bảng - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 10. Xác định cấu trúc bảng (Trang 54)
Hình 2. 11. Mặt nạ dòng mặt trước  2.7.4.1. Tách các đối tƣợng thuộc mỗi dòng - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 2. 11. Mặt nạ dòng mặt trước 2.7.4.1. Tách các đối tƣợng thuộc mỗi dòng (Trang 56)
Hình 3. 1. Quy trình nhận dạng thông tin trên CMND - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 1. Quy trình nhận dạng thông tin trên CMND (Trang 62)
Hình 3. 2. Quy trình thực hiện của chương trình thử nghiệm - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 2. Quy trình thực hiện của chương trình thử nghiệm (Trang 63)
Hình 3. 3. Tiền xử lý ảnh mặt trước CMND  3.2.1.1 Làm trơn ảnh CMND - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 3. Tiền xử lý ảnh mặt trước CMND 3.2.1.1 Làm trơn ảnh CMND (Trang 67)
Hình 3. 4. Nhị phân ảnh CMND - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 4. Nhị phân ảnh CMND (Trang 72)
Hình 3. 5. Phương pháp tia quay - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 5. Phương pháp tia quay (Trang 73)
Hình 3. 6. Ảnh CMND - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 6. Ảnh CMND (Trang 77)
Hình 3. 7. Một số trường hợp khó phát hiện - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Hình 3. 7. Một số trường hợp khó phát hiện (Trang 78)
Bảng 3.1. Kết quả thực nghiệm - nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân
Bảng 3.1. Kết quả thực nghiệm (Trang 78)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w