1. Trang chủ
  2. » Ngoại Ngữ

Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích chứng minh thư nhân dân

16 25 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Một trong những ứng dụng phổ biến hiện nay của nhận dạng mẫu là phân tích và nhận dạng ảnh tài liệu (có nguồn gốc từ hệ thống nhận dạng ký tự quang học), nhằm số hoá các trang tài liệu[r]

(1)

Ứng dụng số kỹ thuật xử lý ảnh phân tích chứng minh thƣ nhân dân

Apply some image processing techniques in the analysis of people's identity card NXB H : ĐHCN, 2012 Số trang 60 tr +

Lê Đức Hiếu Trƣờng Đại học Công nghệ

Luận văn ThS ngành: Công nghệ thông tin; Mã số: 60 48 10 Cán hƣớng dẫn khoa học: PGS TS Ngô Quốc Tạo

Năm bảo vệ: 2012

Abstract Tổng quan phân tích ảnh tài liệu: giới thiệu hệ thống nhân dạng ảnh tài liệu nói chung hệ thống phân tích ảnh tài liệu nói riêng; giới thiệu hƣớng tiếp cận phân tích bố cục cấu trúc ảnh tài liệu Nghiên cứu số thuật toán tiền xử lý ảnh: giới thiệu số thuật toán tiền xử lý ảnh thƣờng đƣợc áp dụng hệ thống phân tích nhận dạng ảnh tài liệu nhƣ nhị phân ảnh, chỉnh độ nghiêng, tốn tử hình thái Nghiên cứu phƣơng pháp phân tích giấy chứng minh nhân dân: giới thiệu toán vấn đề cần giải quyết, từ áp dụng kỹ thuật xử lý ảnh phân tích tài liệu để phân tích ảnh chứng minh nhân dân Tiến hành cài đặt thử nghiệm để đánh giá hiệu giải pháp đƣa tập ảnh chứng minh nhân dân

Keywords: Cơng nghệ phần mềm; Xử lý ảnh; Thuật tốn; Giấy chứng minh nhân dân

Content

I MỞ ĐẦU

Nhận dạng mẫu ngành khoa học học máy (hay trí tuệ nhân tạo) nhằm phân loại liệu (các mẫu) vào số lớp Một ứng dụng phổ biến nhận dạng mẫu phân tích nhận dạng ảnh tài liệu (có nguồn gốc từ hệ thống nhận dạng ký tự quang học), nhằm số hoá trang tài liệu giấy nhƣ sách, báo, tạp chí,… Bên cạnh lớp tốn chung cịn có lớp toán riêng biệt cho ngành, lĩnh vực cụ thể, nhƣ: phân tích nhận dạng bảng biểu, phiếu điều tra, mẫu điền thông tin, danh thiếp, hộ chiếu,… Đối với lớp tốn việc phân tích cấu trúc ảnh tài liệu đặc biệt quan trọng, định đến việc tách nhận dạng xác trƣờng thơng tin cần thiết cho tƣờng ứng dụng

(2)

phân tích ảnh CMT dựa việc phân tích nhận dạng biểu mẫu Luận văn gồm bốn chƣơng với nội dung nhƣ sau:

Chƣơng 1: Tổng quan phân tích ảnh Chƣơng 2: Một số thuật tốn tiền xử lý ảnh

Chƣơng 3: Thuật tốn phân tích chứng minh thƣ nhân dân Chƣơng 4: Cài đặt thử nghiệm đánh giá

II CHƢƠNG 1: TỔNG QUAN VỀ PHÂN TÍCH ẢNH

A. 1.1 Tổng quan hệ thống nhận dạng

Một hệ thống nhận dạng ảnh tài liệu gồm bƣớc sau (Hình 1):

Hình 1 Sơ đồ hệ thống nhận dạng

B. 1.2 Phân tích ảnh tài liệu

Q trình phân tích ảnh tài liệu là việc cố gắng phân ly tài liệu thành vùng hiểu vai trò chức nhƣ mối quan hệ vùng (Hình 2)

1) 1.2.1 Bố cục tự nhiêu cấu trúc lôgic

Bố cục tự nhiêncủa ảnh tài liệu đề cập đến hình bao vị trí tự nhiên vùng khác ảnh tài liệu Phân tích bố cục tự nhiên trình phân ly ảnh tài liệu thành dãy vùng đồng nhất, nhƣ: hình ảnh, khối văn bản, dòng văn bản, từ, ký tự,…

Ngồi bố cục tự nhiên, tài liệu cịn chứa thông tin bổ xung nội dung nhƣ: nhan đề, tiêu đề,… Một tập thực thể logic chức tài liệu, với quan hệ bên đƣợc hiểu cấu trúc lơgic tài liệu Phân tích cấu trúc lơgic việc biểu diễn kết phân tích cấu trúc bố cục

Ảnh

Thu nhận lƣu trữ ảnh Tiền xử lý ảnh

Phân tích ảnh Nhận dạng

Hậu xử lý Lƣu văn

(3)

Hình Sơ đồ hệ thống phân tích bố cục cấu trúc tài liệu

2) 1.2.2 Phân loại ảnh tài liệu

Dựa mức độ phụ thuộc tài liệu vào bố cục tự nhiên hay cấu trúc lôgic, ngƣời ta chia làm loại ảnh tài liệu (Hình 3):

Hình Các loại tài liệu

C. 1.3 Phân tích bố cục

Mục đích phân tích bố cục xác định vùng tự nhiên khác tài liệu đặc trƣng nó, bao gồm:

Phân đoạn vùng: Là việc chia hình ảnh tài liệu thành vùng thành phần, mà thuộc tính tính đồng khơng cịn thoả mãn

Phân loại vùng: Là việc định xem vùng phân đoạn đƣợc thuộc loại

1) 1.3.1 Hướng tiếp cận trên-xuống

Bắt đầu từ trang ảnh tài liệu, cố gắng chia thành vùng nhỏ dựa vào hình chiếu ngang/dọc (nhƣ X-Y Cut) hay phân tích cấu trúc ảnh (nhƣ Whitespace)

2) 1.3.2 Hướng tiếp cận dưới-lên

Bắt đầu từ thành phần nhỏ tài liệu (nhƣ điểm ảnh, thành phần liên thông), lặp lặp lại q trình gom nhóm chúng thành khối đồng lớn hơn, nhƣ thuật toán Docstrum Voronoi

biểu mẫu ứng dụng, ngân phiếu,

danh sách câu hỏi,… [Loại 1]

bảng biểu,… [Loại 3] thẻ danh mục, thƣ từ, danh thiếp,…

[Loại 2] trang báo, báo, …

[Loại 4] Bố cục

tự nhiên

Cấu trúc lôgic Nhị phân ảnh Ảnh tài liệu Chỉnh độ nghiêng Xố nhiễu Phân tích cấu trúc Tài liệu phân đoạn Phân tích bố cục Đánh giá hiệu Tập mẫu

Tiền xử lý ảnh

(4)

D. 1.4 Phân tích cấu trúc

Phân tích cấu trúc q trình gán nhãn lôgic cho vùng tự nhiên xác định bƣớc phân tích bố cục dựa vào phân tích cú pháp kết nhận dạng

III CHƢƠNG 2: MỘT SỐ THUẬT TOÁN TIỀN XỬ LÝ ẢNH

A. 2.1 Nhị phân ảnh

Nhị phân ảnh (hay gọi phân ngưỡng) thao tác chuyển từ ảnh mầu, ảnh đa cấp xám ảnh nhị phân cách tìm ngƣỡng: tổng quát cục

1) 2.1.1 Phân loại

Căn vào phƣơng pháp đƣợc áp dụng, chia làm nhóm sau:

 Các phƣơng pháp dựa vào hình dạng histogram (Histogram Shape-Based Thresholding Methods)

 Các phƣơng pháp dựa vào việc chia nhóm (Clustering-Based Thresholding Methods)

 Các phƣơng pháp dựa vào entropy (Entropy-Based Thresholding Methods)

 Các phƣơng pháp dựa vào thuộc tính giống (Thresholding Based on Attribute Similarity)

 Các phƣơng pháp vào không gian (Spatial Thresholding Methods)

 Các phƣơng pháp ngƣỡng thích ứng cục (Locally Adaptive Thresholding)

2) 2.1.2 Một số phương pháp a) 1/ Phương pháp Niblack

Đây phƣơng pháp xác định ngƣỡng cục dựa việc tính tốn giá trị trung bình độ lệch chuẩn cục

b) 2/ Phương pháp Otsu

Đây phƣơng pháp xác định ngƣỡng toàn cục dựa vào histogram để phân chia điểm ảnh vào hai lớp tiền cảnh (đối tƣợng) cho “khoảng cách” điểm ảnh lớp nhỏ

3) 2.1.3 Kết luận

Bảng So sánh phƣơng pháp Niblack Otsu

Tiêu chí Niblack Otsu

Thời gian thực Chậm Nhanh

Độ phức tạp thuật tốn O(N2)O(W2) O(N2)

Ảnh có độ sáng thay đổi Tốt Không tốt (Mất số vùng thơng tin)

Phụ thuộc vào kích thƣớc đối

tƣợng ảnh Có Khơng

(5)

B. 2.2 Chỉnh độ nghiêng trang văn

Trong q trình thu thập, ảnh bị nghiêng cần phải chỉnh độ nghiêng ảnh xác định góc nghiêng xoay ảnh trở lại nhƣ ảnh gốc

1) 2.2.1 Phương pháp dựa biến đổi Hough

Biến đổi Hough phép biến đổi điểm ảnh từ hệ tọa độ x-y sang hệ tọa độ ρ-θ hữu ích cho việc dị tìm đƣờng thẳng ảnh thích hợp cho việc xác định góc nghiêng ảnh có chứa thành phần dòng văn

2) 2.2.2 Phương pháp láng giềng gần (nearest neighbours)

Phƣơng pháp dựa nhận xét trang văn bản, khoảng cách kí tự từ kí tự từ dịng nhỏ khoảng cách hai dòng văn bản, kí tự, láng giềng gần kí tự liền kề dòng văn

3) 2.2.3 Phương pháp sử dụng tia quay (project profile)

Dựa vào hình chiếu ngang/dọc ảnh để tìm góc nghiêng

4) 2.2.4 Kết luận

 Phƣơng pháp dựa vào biến đổi Hough tốt cho việc xác định góc nghiêng đƣờng thẳng ảnh Nhƣng lại thất bại ảnh có q đối tƣợng (sự thƣa thớt ký tự) thời gian thực lâu phải thao tác trực tiếp điểm ảnh

 Phƣơng pháp láng giềng gần cho kết tốt nhƣng thời gian tính tốn cịn chậm Mặt khác đối trang văn Tiếng Việt có dấu, phƣơng pháp thƣờng cho kết khơng xác

 Phƣơng pháp sử dụng tia qua cho kết tƣơng đối xác thời gian thực nhanh Thƣờng đƣợc sử dụng sản phẩm thƣơng mại

C. 2.3 Các tốn tử hình thái (Morphological operations)

Đầu vào tốn tử hình thái thƣờng ảnh nhị phân (một số trƣờng hợp ảnh đa cấp xám) phần tử cấu trúc (structuring element), kết hợp với việc sử dụng toán tử tập hợp: hợp, giao, trừ lấy phần bù Tất tốn tử hình thái phối hợp hai toán tử bản: giãn ảnh (dilation) co ảnh (erosion) Hiệu ứng toán tử giãn ảnh mở rộng đƣờng biên đối tƣợng ảnh, kích thƣớc đối tƣợng ảnh tăng lên lỗ hổng bên đối tƣợng khoảng cách đối tƣợng giảm xuống Ngƣợc lại, phép co ảnh làm cho đƣờng biên đối tƣợng bị “bào mòn”, dẫn đến kích thƣớc đối tƣợng ảnh giảm đi, khoảng cách đối tƣợng tăng lên lỗ hổng đối tƣợng đƣợc mở rộng

Nếu sử dụng phép co ảnh giãn ảnh cách riêng lẻ làm đặc trƣng (hình dạng, kích thƣớc) ảnh Do ngƣời ta thƣờng kết hợp hai phép toán với nhau, cách: co lần giãn nhiêu lần ngƣợc lại Một số cách kết hợp đƣợc gọi phép

opening closing, hai phép toán đối xứng nhau: phép tốn opening “co trƣớc giãn sau” cịn

(6)

D. 2.4 Kết chương

Trong chƣơng này, luận văn đã trình bầy ba kỹ thuật tiền xử lý ảnh quan trọng, thƣờng xuyên đƣợc sử dụng hệ thống nhận dạng: nhị phân ảnh, chỉnh độ nghiêng ảnh số phép tốn hình thái

IV CHƢƠNG 3: THUậT TỐN PHÂN TÍCH CHứNG MINH THƢ NHÂN DÂN

Giấy chứng minh nhân dân hay chứng minh thư (CMT) loại giấy tờ tùy thân công dân Việt Nam, đƣợc xác nhận quan nhà nƣớc có thẩm quyền lý lịch ngƣời đƣợc cấp

a) Mặt trƣớc b) Mặt sau

Hinh Mẫu “Giấy chứng minh thư nhân dân”

CMT yêu cầu bắt buộc nhiều giao dịch nhƣ thủ tục hành chính,… Ví dụ, muốn mở tài khoản ngân hàng hay đăng ký thuê bao điện thoại, cần photo CMT, đến địa điểm giao dịch điền thông tin cá nhân vào biểu mẫu có sẵn Việc nhiều thời gian phiền phức cho ngƣời làm thủ tục Cùng với q trình tin học hố, đơn giản thủ tục hành chính, yêu cầu đặt là: cần có hệ thống tự động tách nhận dạng trƣờng thông tin CMT để điền vào biểu mẫu có sẵn Nhƣ cần tách xác trƣờng thơng tin yêu cầu trƣớc chuyển cho phần nhận dạng, nhiện việc gặp số vấn đề khó khăn sau:

 Vì trƣờng thơng tin đƣợc dập/in mẫu có sẵn nên bị lệch so với dòng chuẩn chờm lên phần tiêu đề đƣợc in trƣớc

 Đối với trƣờng hợp CMT chữ dập, nét chữ không CMT, chí CMT Có trƣờng hợp nét chữ đậm, chí bị nhoè, có trƣờng hợp nét chữa mờ

 Trong q trình sửa dụng, CMT bị ố, mốc, nhàu, nát,… nét chữ bị mờ, nhoè,…

 Ở mặt trƣớc, số trƣờng hợp hoa văn rõ nét nét chữ lại mờ, khó phân biệt đâu nét chữ đâu hoa văn

 Ở mặt sau, nhiều trƣờng hợp dấu mầu đỏ đè lên phần Ngày cấp Nơi cấp, làm mờ phần thông tin hai trƣờng

Yêu cầu toán: Từ ảnh CMT mầu đƣợc quét máy quét với độ phân giải 300 dpi, tách lấy trƣờng thông tin: Số CMT, Họ tên, Ngày sinh, Nguyên quán, Nơi thường trú, Dân tộc, Ngày cấp

(7)

A. 3.1 Tách trường thông tin mặt trước

Nhận thấy rằng, trƣờng Số CMT có mầu đỏ bật so với trƣờng khác nên dựa vào để tách trƣờng Số CMT trƣớc, sau tách trƣờng cịn lại dựa vào vị trí tƣơng đối so với trƣờng Số CMT Mặt khác, mặt trƣớc CMT có hoa văn (mầu xanh – green) rõ nét nên cần thao tác tiền xử lý ảnh hiệu để khử thành phần phức tạp Cụ thể, thuật toán bao gồm bƣớc sau:

Tiền xử lý ảnh: Chuyển ảnh mầu ảnh đen trắng cho vừa khử đƣợc mà giữ đƣợc đặc trƣng nét chữ, đồng thời thực chỉnh độ nghiêng ảnh

Tách trường Số CMT: Dựa vào đặc điểm bật riêng để tách, loại bỏ đƣờng lƣợn sóng xong phải giữ lại đặc trƣng nét chữ

Tách trường lại: Tách lấy dòng thơng tin sau loại bỏ phần tiêu đề trƣờng

1) 3.1.1 Tiền xử lý ảnh

a) Ảnh đầu vào b) Ảnh đa cấp xám c) Ảnh nhị phân Hinh Tiền xử lý ảnh mặt trước CMT

a) 1/ Chuyển ảnh mầu ảnh đa cấp xám

Nhận thấy rằng, với điểm sảnh giá trị thành phần mầu Green chênh lệch lớn so với thành phần mầu Red Do đó, để chuyển đổi từ ảnh mầu ảnh đa cấp xám, ta lấy thành phần mầu Green cộng với độ chênh lệnh hai thành phần mầu Green Red:

Cường độ xám = G + |G – R|

Điều làm bật đƣợc nét chữ (hoa văn mờ đi, đặc trƣng nét chữ khơng đổi) mà cịn làm mờ mực nhoè mầu đỏ trƣờng Số CMT lên trƣờng Họ tên

b) 2/ Làm trơn ảnh

Ảnh đa cấp xám thu đƣợc bƣớc thƣờng khơng đƣợc “mịn”, cịn “ráp” số thành phần rõ nét, để làm mịn ảnh loại bỏ nhiễu cần áp dụng phép lọc để làm trơn ảnh Ở đây, áp dụng thuật tốn làm trơn thích ứng:

c) 3/ Nhị phân ảnh

Các phƣơng pháp trình bầy trên, số trƣờng hợp cho kết tốt, số trƣờng hợp khác lại cho kết không tốt:

 Phƣơng pháp Otsu: Khử ảnh tốt, nhƣng không làm rõ nét chữ

(8)

Do đó, tơi đề xuất phƣơng thức kết hợp đƣợc ƣu điểm hai phƣơng pháp Các bƣớc thực nhƣ sau:

 Nhị phân ảnh phƣơng pháp Otsu đƣợc ảnh IO  Nhị phân ảnh phƣơng pháp Sauvola đƣợc ảnh IS

 Áp dụng toán tử AND hai ảnh IO IS để đƣợc ảnh nhị phân cần tìm:

IB = IO AND IS

d) 4/ Căn chỉnh độ nghiêng

Sử dụng phƣơng pháp tia quay

2) 3.1.2 Tách trường Số CMT

Trong ảnh mầu chỉnh độ nghiêng phần trên, trƣờng Số CMT có mầu đỏ mầu với vùng: dịng “GCMND”, hình quốc huy đơi vùng mặt ngƣời hay mầu áo ảnh chân dung Để tách trƣờng Số CMT, trƣớc tiên cần làm mổi bật vùng này, sau tìm tách vùng Số CMT, cuối loại bỏ đƣờng lƣợn sóng

a) 1/ Xác định vùng trường Số CMT

Với điểm ảnh ảnh mầu đầu vào, lấy thành phần mầu Red trừ thành phần mầu Green (nếu nhỏ khơng gán khơng) đƣợc ảnh đa cấp xám, vùng sáng tƣơng ứng với vùng mầu đỏ vùng tối tƣơng ứng với vùng ảnh mầu (Hinh 3a) Tiếp theo, áp dụng phép biến đổi hình thái closing để “nối” ký tự (các thành phần) liền kề thành dịng (các khối) Sau đó, sử dụng phƣơng pháp phân ngƣỡng Otsu đảo ngƣợc mức xám để chuyển ảnh đa cấp xám ảnh nhị phân, vùng mầu đen vùng vùng Số CMT (Hinh 3b) Cuối cùng, tách lấy thành phần liên thông miêu tả chúng hình bao chữ nhật

a) IRed – IGreen b) Các vùng Số CMT

Hinh 3 Xác định vùng Số CMT

b) 2/ Tìm tách trường Số CMT

(9)

c) 3/ Phân đoạn vùng Số CMT

Trong phần tiến hành phân đoạn để loại bỏ đƣờng lƣợn sóng nằm ngang phải giữ đƣợc đặc trƣng nét bút chữ số Việc khó khăn, chữ số bị nh mờ nét chữ có độ đậm nhạt thay đổi, đƣờng lƣợn sóng lại có bề dày khác nhau, chí tƣơng đồng với bề dày nét bút Do đó, cần ƣớc lƣợng bề dày làm mờ đƣờng lƣợn sóng trƣớc tiến hành phân đoạn

Để ƣớc lƣợng đƣợc bề dày đƣờng lƣợn sóng cần phân đoạn “thô” cho đƣợc đƣờng lƣợn sóng Sau “đo” bề dày đƣờng lƣợn sóng tất lát dọc để thống kê chọn lấy bề dày thích hợp Từ làm mờ đƣờng lƣợn sóng phép lọc trung vị (median), cuối phân đoạn “tinh” để khử thành phần [Hinh 4]

a) Vùng Số CMT

b) Làm mờ đƣờng lƣợn sóng

c) Kết phân đoạn

Hinh Phân đoạn vùng Số CMT

3) 3.1.3 Tách trường thơng tin cịn lại

Các trƣờng thơng tin lại (bao gồm trƣờng: Họ tên, Ngày sinh, Nguyên quán, Nơi thƣờng trú) đƣợc phân bố dòng, dòng cách nằm bên dƣới dòng “GCMND” Số CMT, việc tách trƣờng thơng tin cịn lại thực chất việc tách lấy dịng thơng tin Để tách dịng này, từ ảnh nhị phân thu đƣợc bƣớc tiền xử lý vị trí dịng “GCMND” xác định bƣớc trên, xác định “mặt nạ” dòng sau cố gắng lọc lấy đối tƣợng (ký tự) thuộc mặt nạ dịng

a) 1/ Tìm mặt nạ dịng

Vị trí dịng thơng tin cịn lại đƣợc xác định thơng qua vị trí tƣơng đối chúng so với dòng “GCMND” xác định đƣợc Để thuận tiện, ta biểu diễn dịng hình chữ nhật – gọi mặt nạ dòng – nhƣ [Hinh 5], đó:

(10)

Hinh Mặt nạ dòng mặt trƣớc

Nhƣ vậy, để xác định mặt nạ dòng cần xác định dy, dy đƣợc xác định dựa vào phân bố điểm ảnh vùng mặt nạ:

dy = arg{maxy[dy1, dy2](count(y))}

Trong đó: count(y) số lƣợng điểm ảnh vùng mặt nạ, tƣơng ứng với y = dy

b) 2/ Tách đối tượng thuộc dòng

Từ ảnh nhị phân thu đƣợc bƣớc tiền xử lý, tách lấy đối tƣợng (các thành phần liên thơng) chia làm lớp dựa kích thƣớc đối tƣợng:

Nhỏ: Lớp đối tƣợng dấu ký tự, dấu chấm đƣờng sở, nhiễu,…

Lớn: Lớp đối tƣợng ảnh chân dung đƣờng viền

Vừa: Gồm đối tƣợng lại, lớp đối tƣợng ký tự

Từ đối tƣợng thuộc lớp vừa, lọc lấy đối tƣợng thuộc mặt nạ dòng Một đối tƣợng đƣợc cho thuộc mặt nạ dòng tâm nằm hình chữ nhật mặt nạ dịng Lúc dịng đƣợc biểu diễn danh sách đối tƣợng

c) 3/ Xoá phần tiêu đề nhiễu

Trong dòng tìm đƣợc trên, có dịng có chứa phần tiêu đề (tƣơng ứng với trƣờng thông tin), dịng thứ 1, 2, 4, Để loại bỏ phần tiêu đề cần xác định vị trí phân tách phần tiêu đề phần thơng tin dịng Do phần thơng tin đƣợc dập/in vào mẫu có sẵn (đã có phần tiêu đề) nên phần hai phần có đặc điểm khác sau:

 Chiều cao trung bình ký tự phần tiêu đề thƣờng nhỏ chiều cao trung bình ký tự phần thông tin

 Theo phƣơng dọc, phần thông tin bị lệch so với phần tiêu đề (dịch lên dịch xuống)

 Theo phƣơng ngang, phần thơng tin phần tiêu đề thƣờng có khoảng cách lớn khoảng cách ký tự (các từ) dòng

 Ký tự cuối phần tiêu đề chữ in thƣờng, ký tự phần thông tin chữ in hoa nên có khác lớn chiều cao

(11)

Hinh Xoá phần tiêu đề

d) 5/ Lấy lại ký tự bị

Trong trình tách lấy đối tƣợng thuộc dịng, số ký tự thuộc dịng nhƣng khơng đƣợc chọn, ngun nhân do:

 Các ký tự nằm vùng mặt nạ dịng (khơng đƣợc dập/in vào vùng thơng tin đƣợc định trƣớc) lƣợng thông tin nhiều nên “tràn” khỏi vùng đƣợc định trƣớc [Hinh 7a]

 Các ký tự thuộc vùng mặt nạ dịng nhƣng tâm khơng nằm mặt nạ dòng, ký tự hai dịng dính dính vào đƣờng viền [Hinh 7b]

Từ nguyên nhân trên, có giải pháp khác để lấy lại ký tự bị mất:

 Với nguyên nhân thứ nhất: Mở rộng mặt nạ dịng hai phía, lấy lại ký tự nhƣ bƣớc

 Với nguyên nhân thứ hai: Tìm phần giao hình bao dòng với đối tƣợng, phần giao có chiều cao lớn nửa chiều cao dịng ký tự bị

a) Nằm vùng mặt nạ

b) Hai ký tự dính

Hinh Lấy lại ký tự bị

B. 3.2 Tách trường thông tin mặt sau

Mặt sau CMT có cấu trúc dạng bảng, trƣờng thông tin đƣợc phân bổ vào ô bảng: trƣờng Dân tộc ô cùng, trƣờng Ngày cấp Nơi cấp ô dƣới bên phải Do vậy, để tách đƣợc trƣờng thông tin yêu cầu cần xác định đƣợc cấu trúc bảng sau tách trƣờng thơng tin này, thuật tốn gồm bƣớc:

Tiền xử lý ảnh: Khử thành phần ảnh, đặc biệt dấu đỏ

Xác định cấu trúc bảng: Tìm đƣờng kẻ ngang/dọc để xây dựng lại cấu trúc bảng

Tách trường thông tin: Loại bỏ phần tiêu đề dòng

1) 3.2.1 Tiền xử lý ảnh

Các thao tác tiền xử lý mặt sau là:

1 dTitle1

(12)

Chuyển ảnh mầu ảnh đa cấp xám: cách tách lấy kênh mầu Red Điều loại bỏ đƣợc dấu mầu đỏ, mà đƣợc đặc trƣng nét bút

Nhị phân ảnh: Vì mặt sau có cấu trúc đơn giản nên cần áp dụng phƣơng pháp phân ngƣỡng Sauvola để khử

Căn chỉnh độ nghiêng: Áp dụng phƣơng pháp nhƣ mặt trƣớc

a) Ảnh đầu vào b) Ảnh đa cấp xám c) Ảnh nhị phân

Hinh Tiền xử lý mặt sau CMT

2) 3.2.2 Xác định cấu trúc bảng

Cấu trúc bảng đƣợc tạo đƣờng kẻ ngang dọc liền nét nhƣng trình sử dụng đƣờng kẻ bị mờ đứt nét Mặt khác, lúc dập/in thông tin lăn tay, ký tự dấu vân tay chờm lên đƣờng kẻ, gây khó khăn cho việc xác định cấu trúc bảng Nhƣ vậy, để xác định đƣợc cấu trúc bảng cần xác định đƣợc đƣờng kẻ ngang dọc bảng Vì đƣờng kẻ ngang dọc có tính chất nhƣ nên phần trình bầy thuật tốn xác định đƣờng kẻ ngang bảng, việc xác định đƣờng kẻ dọc tƣơng tự

Thuật toán xác định đƣờng kẻ ngang cấu trúc bảng đƣợc chia làm hai phần chính:

 Đầu tiên áp dụng phép biến đổi hình thái để làm bật đƣờng kẻ ngang, sau phân tích thành phần liên thơng để tách lấy đường kẻ ngang ảnh Các đƣờng kẻ đƣờng kẻ ngang bảng khơng, có đƣờng kẻ đƣợc tạo dấu chấm liền đƣờng sở đƣờng gạch chân chữ ký,… [Hinh 9b]

 Dựa vào khoảng cách tƣơng đối đƣờng kẻ ngang, tìm đường kẻ ngang bảng từ đƣờng kẻ ngang ảnh, cách loại bỏ đƣờng kẻ ngang bảng bổ sung đƣờng ngang thiếu [Hinh 9c]

a) Ảnh nhị phân đầu vào b) Các đƣờng kẻ ngang

(13)

d) Các vùng thông tin Hinh Xác định cấu trúc bảng

Sau xác định đƣợc đƣờng kẻ ngang dọc bảng (tức xác định đƣợc cấu trúc bảng), tách lấy vùng chứa trƣờng thơng tin cần tìm từ ảnh: vùng Dân tộc nằm đƣờng kẻ ngang thứ thứ hai; vùng Ngày cấp Nơi cấp nằm đƣờng kẻ ngang thứ tƣ thứ sáu, đƣờng kẻ dọc thứ ba thứ bốn [Hinh 9d] Từ vùng này, bƣớc tách lấy trƣờng thơng tin cần tìm

3) 3.2.3 Tách trường thông tin

Việc tách trƣờng tin mặt sau tƣơng tự nhƣ mặt trƣớc V CHƢƠNG 4: CÀI ĐặT THử NGHIệM VÀ ĐÁNH GIÁ

Trong chƣơng luận văn mơ tả cách chi tiết q trình cài đặt thử nghiệm thuật toán, nhƣ đánh giá kết đạt đƣợc liệu khác

A. 4.1 Môi trường cài đặt

Thuật tốn thử nghiệm đƣợc cài đặt ngơn ngữ lập trình C/C++ (Microsoft Visual Studio 2008), sử dụng thƣ viện xử lý ảnh Leptonica cho việc đọc/ghi ảnh thao tác xử lý ảnh Chƣơng trình đƣợc thử nghiệm máy PC, tốc độ 3,4GHz, nhớ RAM 1,0 GB

B. 4.2 Dữ liệu kiểm thử

Chƣơng trình đƣợc thử nghiệm tập 926 ảnh CMT đƣợc quét với độ phân giải 300dpi, kiểu ảnh mầu Các mẫu CMT đƣợc lấy từ nhiều tỉnh thành khác nhau, đơn vị cấp CMT khác Mặc dù CMT đƣợc in theo mẫu chung nhƣng có khác đơn vị cấp kích thƣớc kiểu chữ, vị trí tƣơng đối trƣờng thông tin,…

C. 4.3 Kết thực nghiệm

Có nhiều phƣơng pháp đánh giá độ xác việc tách trƣờng thơng tin, luận văn sử dụng diện tích miền bao phủ để tính tham số Precesion Recall Kết đánh giá nhƣ Bảng

D. 4.4 Đánh giá

Thuật toán đƣa luận văn tách đƣợc gần nhƣ 100% trƣờng thông tin yêu cầu Một số trƣờng hợp bị phần thông tin coi nhiễu nhƣ phần thơng tin trƣờng Thuật tốn thất bại trƣờng hợp trƣờng thông tin in/dập vào CMT bị lệch góc đánh kể so với dịng in sẵn CMT

Bảng Kết phân tích ảnh CMT

Precesion (%) Recall (%)

Số CMT 100,00 100,00

(14)

Ngày sinh 99,41 99,21

Nguyên quán 97,91 96,58

Nơi thƣờng trú 94,61 84,53

Dân tộc 95,99 95,82

Ngày cấp 97,83 97,46

Nơi cấp 78,56 86,08

Cả CMT 95,25 92,89

VI KẾT LUẬN

Trong trình nghiên cứu thực luận văn, nhận thấy đạt đƣợc số kết sau:

 Nắm bắt đƣợc bƣớc hệ thống xử lý ảnh, hiểu đƣợc khái niệm xử lý ảnh Thấy đƣợc vai trò quan trọng xử lý ảnh hệ nhận dạng, bƣớc tiền xử lý nhằm nâng cao chất lƣợng nhận dạng

 Tìm hiểu đƣợc số thuật tốn xử lý ảnh hay đƣợc dùng bƣớc tiền xử lý hệ thống nhận dạng hồn chỉnh Đó phƣơng pháp nhị phân ảnh, chỉnh độ nghiêng trang văn bản, tốn tử hình thái Trên cở sở hiểu biết vận dụng đƣợc vào tốn khác

 Tìm hiểu tổng qt hố phƣơng pháp phân tích ảnh tài liệu, nhƣ nắm đƣợc ƣu nhƣợc điểm phƣơng pháp Từ đƣa đƣợc giải pháp cho toán đặt luận văn

 Đã áp dụng thành cơng kiến thức tìm hiểu đƣợc vào cài đặt thử nghiệm chƣơng trình phân tích ảnh CMT Kết chƣơng trình đạt đƣợc tốt áp dụng vào thực tế Đây tốn khó, chƣa có giải pháp khác đƣợc đƣa gia để giải toán Đó đóng góp lớn luận văn

Tuy nhiên, thời gian làm luận văn hạn chế, khối lƣợng cơng việc lớn nên cịn nhiều vấn đề tồn chƣa đƣợc giải quyết:

 Chƣơng trình dừng lại bƣớc thử nghiệm, chƣa phải chƣơng trình hồn chỉnh, đầy đủ tính

(15)

References Tiếng Việt

[1] Nghị định số: 577-TTg “Đặt giấy chứng minh quy định thể lệ cấp phát giấy chứng minh”, Chính phủ, Hà Nội, ngày 27 tháng 11 năm 1957

[2] Nghị định số: 05/1999/NĐ-CP “Về chứng minh nhân dân”, Chính phủ, Hà Nội, ngày 03 tháng 02 năm 1999

[3] Nghị định số: 170/2007/NĐ-CP “Sửa đổi, bổ sung số điều nghị định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 phủ chứng minh nhân dân”, Hà Nội, ngày 19 tháng 11 năm 2007

Tiếng Anh

[4] K Kpalma and J Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007

[5] Anoop M Namboodiri and Anil Jain,“Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B B Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1-84628-501-1), Jan 2007

[6] Toyohide WATANABE, “Document Analysis and Recognition”, IEICE TRANS INF & SYST., vol.e82-d, no.3

[7] G Nagy, S Seth and M Viswanathan, "A Prototype Document Image-Analysis System for Technical Journals", Computer 25, (1992), 10–22

[8] Baird, U.S and Jones, S.E and Fortune, S.J.: Image Segmentation by Shape-Directed Covers in Proceedings of International Conference on Pattern Recognition, Atlantic City, NJ (1990), 820-825 [9] Pavlidis, T and Zhou, J.: Page Segmentation by White Streams Proceedings of International

Conference on Document Analysis and Recognition, Saint-Malo, France (1991), 945-953

[10] Breuel, T.M.: Two Geometrie Algorithms for Layout Analysis, in Proceedings of the Fifth International Workshop on Document Analysis Systems, Princeton, NY (2002), LNCS 2423, 188-199

[11] O‟Gorman, L.: The Document Spectrum for Page Layout Analysis IEEE Transactions on Pattern Analysis and Machine Intelligence 15 (1993), 1162-1173

[12] Kise, K and Sato, A and Iwata, M.: Segmentation of Page Images using the Area Voronoi Diagram Computer Vision and Image Understanding 70 (1998), 370-382

[13] Mehmet Sezgin & Bülent Sankur, “Survey over image thresholding techniques and quantitative performance evaluation”, Journal of Electronic Imaging 13(1), 146– 165 (January 2004)

[14] W Niblack, “An Introduction to Digital Image Processing”, pp 115-116, Prentice Hall, 1986 [15] Z Zhang and C L Tan, “Restoration of images scanned from thick bound documents”, Proc Int

(16)

[16] N Otsu, „„A threshold selection method from gray-level histograms‟‟ IEEE Trans Syst Man

Cybern 9(1), 62–66 (1979)

[17] Yichao Ma, Chunheng Wang, Baihua Xiao, et Ruwei Dai “Usage-oriented performance evaluation for text localization algorithms” In Document Analysis and Recognition, 2007 ICDAR 2007 Ninth International Conference on, volume 2, page(s) 1033-1037, 2007

[18] Xian-Sheng Hua, Liu WenYin, and Hong-Jiang Zhang, “An Automatic Performance Evaluation Protocol for Video Text Detection Algorithms” In IEEE Transactions on circuits and systems for video technology, vol.14, no.4, avril 2004

Ngày đăng: 14/05/2021, 10:30

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w