Dữ liệu thử nghiệm

Một phần của tài liệu nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân (Trang 76 - 82)

4. Bố cục của luận văn

3.2.4. Dữ liệu thử nghiệm

Hiệu quả của phƣơng pháp đƣợc kiểm nghiệm trên một tập dữ liệu đầu vào bao gồm 1856 trang ảnh nhị phân tƣơng ứng với 928 trang ảnh mặt trƣớc và 928 trang ảnh mặt sau của CMND. Các mẫu CMND đƣợc thu thập từ nhiều tỉnh thành, đa dạng về chất lƣợng và kích cỡ font chữ, kiểu in ấn, đƣợc quét với các ngƣỡng độ phân giải 200dpi, 300dpi và 400 dpi. Để phục vụ cho việc đánh giá thực nghiệm, mỗi ảnh mẫu CMND đƣợc cung cấp kèm một file ground-truth, trong đó lƣu trữ thông tin về các vùng thông tin cần phát hiện

trên ảnh nhƣ tổng số vùng, tọa độ của các vùng thông tin cần phát hiện. Cụ thể, ở đây luận văn sẽ xem xét 5 trƣờng ở mặt trƣớc CMND bao gồm số CMND, họ tên, ngày sinh, nguyên quán, nơi thƣờng chú và 4 trƣờng thông tin đối với mặt sau CMND bao gồm dân tộc, tôn giáo, ngày cấp, nơi cấp

(xem Hình 3. 6).

a) Ảnh CMND mặt trƣớc b) Ảnh CMND mặt sau

Hình 3. 6. Ảnh CMND 3.3. Kết quả thực nghiệm

Để thuận tiện cho việc trình bày, gọi NT là số vùng phát hiện đúng, NM là số vùng không đƣợc phát hiện và NF là số vùng phát hiện sai. Kết quả thực nghiệm của phƣơng pháp đƣợc thể hiện cụ thể trên Bảng 3.1.

Trƣờng thông tin NT NM NF Precision (%) Recall (%) F-Measure (%) Số CMND 925 3 0 100 99,68 99,84 Họ và tên 923 5 11 98,82 99,46 99,14 Ngày sinh 921 7 15 98,40 99,25 98,82 Nguyên quán 917 11 16 98,29 98,81 98,55 Nơi thƣờng trú 915 13 14 98,49 98,60 98,55

Dân tộc 911 17 21 97,75 98,17 97,96

Tôn giáo 912 16 19 97,96 98,28 98,18

Ngày cấp 889 39 21 97,69 95,80 96,74

Nơi cấp 886 42 23 97,47 95,47 96,46

Bảng 3.1. Kết quả thực nghiệm

Từ các kết quả thực nghiệm cho thấy phƣơng pháp phát hiện dựa vào việc tách kênh màu cho độ chính xác (precision) tuyệt đối trên trƣờng số CMND do vùng này có độ tƣơng phản rõ rệt so với các vùng bên cạnh. Việc bỏ sót (không phát hiện) đƣợc trƣờng số CMND thƣờng xảy ra trong trƣờng hợp ảnh CMND quá cũ và mờ, vùng thông tin cần phát hiện đã bị mất đi trong quá trình tiền xử lý.

Hình 3. 7. Một số trƣờng hợp khó phát hiện

Đối với các trƣờng thông tin còn lại, việc bỏ sót hoặc xác định sai các vùng thƣờng do nguyên nhân các vùng thông tin bị lệch, xiên, dính hoặc chồng lên nhau (xem Hình 3. 7).

3.4. Kết luận

Trong chƣơng này, luận văn tập trung phân tích, thiết kế và cài đặt chƣơng trình thử nghiệm. Trên cơ sở đó, hiệu quả của phƣơng pháp đã đƣợc kiểm nghiệm trên một tập dữ liệu đủ lớn với với 928 trang ảnh mặt trƣớc và 928 trang ảnh mặt sau của CMND. Để đánh giá hiệu quả của

phƣơng pháp, luận văn đã sử dụng 3 độ đo là độ chính xác (precision), khả năng tìm hết (recall) và độ đo hiệu quả (F-Measure). Các kết quả thực nghiệm cho thấy phƣơng pháp đạt đƣợc độ chính xác trung bình trên 97%, khả năng tìm hết trên 95% và độ đo hiệu quả trên 96% đối với tất cả các trƣờng thông tin cần xác định.

PHẦN KẾT LUẬN

Trong quá trình tìm hiểu, luận văn đã đạt đƣợc một số kết quả nhƣ sau:

1. Xử lý ảnh là một vấn đề rất rộng lớn cần đƣợc đầu tƣ, quan tâm và nghiên cứu hơn nữa. Đồng thời, tìm hiểu và nắm đƣợc một số các hƣớng tiếp cận trong phân tích cấu trúc trang văn bản.

2. Đã đề xuất một giải pháp tổng thể cho việc phát hiện và bóc tách các trƣờng thông tin trên ảnh CMND dựa trên kỹ thuật phân tích cấu trúc ảnh màu kết hợp với các kỹ thuật tiền xử lý ảnh cơ bản nhƣ: lọc nhiễu, nhị phân ảnh, căn chỉnh độ nghiêng trang văn bản, các toán tử hình thái... Từ đó có thể vận dụng vào bài toán của luận văn và đƣa ra giải pháp thực hiện cho bài toán.

3. Đã tiến hành cài đặt thử nghiệm chƣơng trình bóc tách trƣờng thông tin cần nhận dạng trên CMND. Chƣơng trình đạt đƣợc kết quả tốt và có khả năng ứng dụng vào bài toán thực tế.

Tuy nhiên, do thời gian thực hiện luận văn còn có hạn, trong khi khối lƣợng công việc rất lớn nên còn nhiều vấn đề còn tồn tại chƣa thể giải quyết:

Chƣơng trình mới chỉ ở dạng thử nghiệm, chƣa hoàn chỉnh nên chƣa thể áp dụng vào thực tế.

Chƣơng trình chỉ dừng lại ở việc bóc tách trƣờng thông tin cần nhận dạng của CMND và chỉ nhận dạng đƣợc CMND.

Để có thể phát triển cần phải tiếp tục tìm hiểu, nghiên cứu và hoàn thiện chƣơng trình để có thể ứng dụng vào thực tế. Đồng thời, khái quát hóa để có thể xử lý đƣợc mọi dạng ảnh thẻ.

DANH MỤC TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Đỗ Năng Toàn, Phạm Việt Bình, “Giáo trình xử lý ảnh”, Đại học Thái

Nguyên, NXB Khoa học và Kỹ thuật, 2008.

[2] Hồ Đức Lĩnh, “Xử lý hình thái học trên ảnh và ứng dụng”, Khoa Công

nghệ Thông tin - Đại học Đông Á.

[3] Lê Đức Hiếu (2012), “Ứng dụng một số kỹ thuật xử lý ảnh trong phân

tích chứng minh nhân dân”, Luận văn thạc sĩ Công nghệ Thông tin, trƣờng Đại học Công nghệ.

[4] Nghị định số: 577-TTg “Đặt giấy chứng minh và quy định thể lệ cấp

phát giấy chứng minh”, Chính phủ, Hà Nội, ngày 27 tháng 11 năm 1957.

[5] Nghị định số: 05/1999/NĐ-CP “Về chứng minh nhân dân”, Chính phủ,

Hà Nội, ngày 03 tháng 02 năm 1999.

[6] Nghị định số: 170/2007/NĐ-CP “Sửa đổi, bổ sung một số điều của nghị

định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 của chính phủ về

chứng minh nhân dân”, Hà Nội, ngày 19 tháng 11 năm 2007.

Tiếng Anh

[7] Anoop M Namboodiri and Anil Jain, “Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B. B. Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1-84628-501-1), Jan. 2007.

[8] Baird, U.S. and Jones, S.E. and Fortune, S.J.: “Image Segmentation by

Shape-Directed Covers”, in Proceedings of International Conference on

Pattern Recognition, Atlantic City, NJ (1990), 820-825.

[9] Baird, H.S.: Background structure in document images. In: Document Image Analysis, World Scientific, (1994) 17–34.

[10]G. Nagy, S. Seth and M. Viswanathan, "A Prototype Document Image- Analysis System for Technical Journals", Computer 25, (1992), 10–22.

[11]JIANG Ren-jie, QI Fei-hu, XU Li, WU Guo-rong, ZHU Kai-hua

images”, Department of Computer Science and Technology, Shanghai Jiao Tong University, Shanghai 200240, China, 2006.

[12]J. Sauvola, M. Pietikainen, “Adaptive Document Image Binarization”, Pattern Recognition, 33, 2000, pp. 225-236.

[13]K. Kpalma and J. Ronsin, “An Overview of Advances of Pattern

Recognition Systems in Computer Vision”, 2007.

[14]Kise, K. and Sato, A. and Iwata, M.: “Segmentation of Page Images

using the Area Voronoi Diagram”, Computer Vision and Image

Understanding 70 (1998), 370-382.

[15]Koichi Kise, Motoi Iwata and Keinosuke Matsumoto, “On the

Application of Voronoi Diagrams to Page Segmentation”, Department of

Computer and Systems Sciences, College of Engineering, Osaka Prefecture University 1-1 Gakuencho, Sakai, Osaka 599-8531.

[16]Mehmet Sezgin & Bülent Sankur, “Survey over image thresholding

techniques and quantitative performance evaluation”, Journal of

Electronic Imaging 13(1), 146– 165 (January 2004).

[17]O’Gorman, L.: The Document Spectrum for Page Layout Analysis. IEEE

Transactions on Pattern Analysis and Machine Intelligence 15 (1993), 1162-1173.

[18]Toyohide WATANABE, “Document Analysis and Recognition”, IEICE

TRANS. INF. &. SYST., vol.e82-d, no.3.

[19]W. Niblack, “An Introduction to Digital Image Processing”, pp. 115- 116, Prentice Hall, 1986.

[20]Wong, K.Y., Casey, R.G., Wahl, F.M.: Document analysis system. IBM

Journal of Research and Development 26 (1982) 647–656. [21]http://www.leptonica.com/

Một phần của tài liệu nghiên cứu phương pháp phân tích cấu trúc ảnh màu, ứng dụng trong nhận dạng chứng minh nhân dân (Trang 76 - 82)

Tải bản đầy đủ (PDF)

(82 trang)