Thành phần Cấu hình
Loại máy tính Lenovo
Hệ điều hành Windows 10.
Kiến trúc Hệ điều hành 64-bit.
Vi xử lý Intel core I3
RAM 4 GB RAM.
Ổ cứng 256GB
Graphics adapter Card đồ họa hỗ trợ xử lý ảnh 128-bit
Chúng tôi xây dựng một ứng dụng để thử nghiệm trên tập dữ liệu A (gồm 100 ảnh CCCD) chụp đầy đủ mặt trước CCCD và mặt sau CCCD. Mỗi dữ liệu chúng tôi thử nghiệm 10 lần. Giao diện chương trình thực nghiệm như hình 4.3.
74
Hình 4.3. Giao diện chương trình thực nghiệm
Để chương trình đạt kết quả tốt chúng tôi yêu cầu dữ liệu đầu vào được định dạng.
+ Kích thước ảnh dài 85,6mm dài 53,89mm độ phân dãy màu 1024 dpi
+ Ảnh chụp là ảnh màu chụp thẳng, rõ, đầy đủ dữ liệu, khơng q mờ, khơng cong, vênh, móp, méo.
Tập tin đầu vào ảnh thẻ CCCD chụp hoặc quét trên máy hai mặt, mặt trước và
mặt sau.
Dữ liệu xuất ra tập tin ảnh và tập tin văn bản.
+ Tập tin ảnh gồm: Ảnh chân dung, ngón trỏ phải, ngón trỏ trái
+ Tập tin văn bản gồm có: số CCCD, Họ và tên, ngày tháng năm sinh, giới
tính, quốc tịch, quê quán, nơi thường trú, đặc điểm nhân dạng của người được cấp thẻ ngày, tháng, năm cấp thẻ CCCD, ngày hết hạn.
75
4.3. Thời gian thực nghiệm
Chương trình thực nghiệm 100 ảnh CCCD, mỗi ảnh CCCD thực nghiệm 10 lần. Thời gian trung bình xử lý xong hai mặt trước và sau một ảnh CCCD là 575mms/ảnh. Thời gian trung bình xử lý ảnh mặt trước thẻ CCCD là 325mms/ảnh, thời gian trung bình xử lý ảnh mặt sau thẻ CCCD là 250mms/ảnh.Tốc độ thời gian xử lý nhanh hay chậm của chương trình phụ thuộc vào cấu hình máy tính và định dạng hình ảnh ban đẩu.
4.4. Kết quả thực nghiệm
Kết quả thực nghiệm chương trình trên tập dữ liệu A 100 ảnh CCCD cho kết quả nhận diện vùng ảnh như bảng 4.2. Bảng 4.2. Kết quả trích vùng của ảnh CCCD STT Vùng dữ liệu Số vùng ảnh trích được Số vùng ảnh khơng trích được Tỉ lệ 1 Ảnh chân dung 100 0 100% 2 Số CCCD 100 0 100% 3 Họ và Tên 100 0 100% 4 Ngày sinh 100 0 100% 5 Giới tính 100 0 100% 6 Quốc tịch 100 0 100% 7 Quê quán 100 0 100% 8 Nơi cư trú 100 0 100% 9 Thời hạn sử dụng 100 0 100% 10 Đặc điểm nhận dạng 100 0 100% 11 Ngón trỏ phải 100 0 100% 12 Ngón trỏ trái 100 0 100% 13 Ngày cấp thẻ 100 0 100% Trung bình 100%
76
4.4.1. Kết quả trên tập dữ liệu A1
Trong tập dữ liệu A1 (74 ảnh) chuẩn, chụp, hoặc quét đúng kích thước, dữ liệu trong các ảnh đầy đủ. Tất cả các vùng dữ liệu trên tập A1 kết quả đều đạt 100%, kết quả thực nghiệm như bảng 4.3.
Bảng 4.3. Kết quả thực nghiệm trên tập dữ liệu A1
STT Tên vùng Kết quả vùng ảnh đúng Kết quả vùng ảnh sai Kết quả nhận dạng dữ liệu đúng Kết quả nhận dạng dữ liệu sai 1 Số CCCD 100% 0 100% 0 2 Họ và Tên 100% 0 100% 0 3 Ngày sinh 100% 0 100% 0 4 Giới tính 100% 0 100% 0 5 Quốc tịch 100% 0 100% 0 6 Quê quán 100% 0 100% 0 7 Nơi cư trú 100% 0 100% 0 8 Thời hạn S/D 100% 0 100% 0 9 ĐĐnhận dạng 100% 0 100% 0 10 Ngày cấp thẻ 100% 0 100% 0
4.4.2. Kết quả trên tập dữ liệu A2
Tập dữ liệu A2 có 26 ảnh khi chụp bị mờ (5 ảnh), số ảnh bị nhòe (18 ảnh), số ảnh bị cong vênh (1 ảnh) , số ảnh bị biến dạng (2 ảnh). Kết quả thực nghiệm trích xuất trong tin như bảng 4.4.
Trong tập dữ liệu A2 chúng tôi nhận thấy trong 26 ảnh CCCD chụp không đúng chuẩn như đã phân tích có kết quả nhận đượcnhư sau:
Dữ liệu ảnh CCCD chụp bằng máy ảnh 5 ảnh đúng 100%, dữ liệu ảnh CCCD chụp bằng điện thoại di động 5 ảnh đúng 100%, dữ liệu ảnh CCCD bằng máy quét 16 ảnh đúng 100%, dữ liệu ảnh CCCD là nam 21 ảnh đúng 100%, dữ liệu
77 ảnh CCCD là nữ 5 ảnh đúng 100%. Kết quả nhận diện vùng ảnh đạt 100% có 10/10 vùng nhận diện đúng. Kết quả nhận dạng dữ liệu đúng 9/10 đạt 100% chỉ có 1 vủng nhận diện bị sai một kí tự duy nhất, đó là vùng đặt điểm nhận dạng do ảnh chụp bị quá mờ, chữ viết bị dính liền như hình 4.4.
Bảng 4.4. Kết quả thực nghiệm trên tập dữ liệu A2
STT Tên vùng Kết quả vùng ảnh Kết quả vùng ảnh sai Kết quả nhận dạng dữ liệu đúng Kết quả nhận dạng dữ liệu sai 1 Số CCCD 100% 0 100% 0 2 Họ và Tên 100% 0 100% 0 3 Ngày sinh 100% 0 100% 0 4 Giới tính 100% 0 100% 0 5 Quốc tịch 100% 0 100% 0 6 Quê quán 100% 0 100% 0 7 Nơi cư trú 100% 0 100% 0 8 Thời hạn SD 100% 0 100% 0 9 ĐĐ nhận dạng 100% 0 99,8% 0,2% 10 Ngày cấp thẻ 100% 0 100% 0
Kết quả xử lý dữ liệu tính trung bình trên tập A 100 ảnh CCCD gồm có kết quả trung tập ảnh A1 và kết quả trung bình tập ảnh A2 là TB=(A1 + A2)/2. Dữ liệu đạt kết quả chính xác trên 99,9%.
4.5. Đánh giá 4.5.1. Ưu điểm 4.5.1. Ưu điểm
Phương pháp đề xuất trong luận văn có độ chính xác trên 99,9%. Trong đó, các trường chính xác 100% là trường số CCCD, Họ và tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán, nơi thường trú, ngày, tháng, năm cấp thẻ CCCD, ngày hết hạn. Trường đặc điểm nhận dạng có độ chính xác thấp nhất
78 (trên 99,8%) bởi vì trường này thường bị mờ, lem mực, do chữ nhỏ một số ký tự không rõ ràng.
Thời gian xử lý rất nhanh, thời gian trung bình xử lý hai mặt trước và mặt sau là 575mms/ ảnh CCCD.
4.5.2. Khuyết điểm
Trong 100 ảnh thực nghiệm chỉ có 2 ảnh bị sai ở trường đặc điểm nhận dạng, và chỉ sai một ký tự duy nhất chữ cm (om) như (hình 4.4) và (4.5). Lỗi này khơng phải do hệ thống chương trình mà do lỗi in thẻ CCCD, ảnh chụp không đúng chuẩn, bị lem mực chữ viết dích liền mắt thường chúng ta khơng phân biệt được kí tự rõ ràng giữa chữ c và chữ o.
Chương trình chưa tích hợp kiểm tra lỗi chính tả cho do in thẻ CCCD.
79
Hình 4.5. Thẻ mặt sau CCCD chụp không đúng chuẩn
4.6. Hướng phát triển
- Đề tài này hướng phát triển và ứng dụng vào thực tế rất cao sau khi được hoàn thiện.
- Để tài áp dụng trong thực tiễn nhiều lĩnh vực có liên quan đến thẻ CCCD, có nhiều lợi ít, tiện lợi trong cải cách thủ tục hành chính, giảm giấy tờ, giảm thời gian, công sức, tiền bạc, hiệu quả công việc nâng cao, đặc biệt là áp dụng cho chính phủ điện tử trong tương lai.
- Các lĩnh vực có thể áp dụng như: sân bay, nhà ga, khách sạn, ngân hàng, bảo hiểm, bệnh viện, văn phịng cơng an, văn phòng UBND các cấp, văn phòng các sở ban ngành …vv
Tiếp tục nghiên cứu hồn thiện chương trình để có thể áp dụng vào thực tế. Mở rộng các tính năng của chương trình (như thêm phần nhận dạng, kiểm lỗi chính tả) để thành một chương trình hồn chỉnh. Khái qt hố thuật tốn để có thể xử lý được ảnh thẻ bất kỳ như bằng lái xe, thẻ đoàn viên, thè cơng đồn , thẻ thành viên, siêu thị, câu lạc bộ, hộ chiếu và đề tài còn hướng nghiên cứu mở rộng ứng dụng trên các thiết bị điện thoại di động, ...vv.
80
4.7. Kết luận
Trong quá trình nghiên cứu và thực hiện luận văn, tôi nhận đã đạt được một số kết quả chính sau:
Nắm bắt được các bước chính trong một hệ thống xử lý ảnh, hiểu được các khái niệm cơ bản trong xử lý ảnh. Thấy được vai trò quan trọng của xử lý ảnh đối với một hệ nhận dạng, đó là bước tiền xử lý nhằm nâng cao chất lượng của nhận dạng.
Tìm hiểu xây dựng được một số thuật toán xử lý ảnh hay được dùng trong bước tiền xử lý của một hệ thống nhận dạng hồn chỉnh. Đó là các phương pháp nhị phân ảnh, căn chỉnh độ nghiêng của trang văn bản, máy học chuyên sâu, mạng nơnron. Trên cở sở hiểu biết đó có thể vận dụng được vào các bài tốn khác.
Tìm hiểu và tổng qt hố các phương pháp phân tích ảnh tài liệu, cũng như nắm được các ưu nhược điểm của từng phương pháp. Từ đó đưa ra được các giải pháp cho bài toán đặt ra trong luận văn, áp dụng thành cơng các kiến thức tìm hiểu được vào cài đặt thử nghiệm chương trình phân tích ảnh CCCD. Kết quả của chương trình đạt được là tốt (99.9%) và có thể áp dụng vào thực tế. Đây là bài tốn khó, hiện nay chưa có giải pháp nào khác được đưa gia để giải quyết bài tốn này. Đó là đóng góp lớn nhất của luận văn.
Tuy nhiên, do thời gian làm luận văn hạn chế, trong khi khối lượng cơng việc lớn nên cịn nhiều vấn đề tồn tại chưa được giải quyết:
+Chương trình mới dừng lại ở bước thử nghiệm, chưa phải là một chương trình hồn chỉnh, đầy đủ các tính năng
+Thuật toán mới chỉ dừng lại ở việc phân tích ảnh CCCD, chưa khái q hố cho các ảnh thẻ bất kỳ.
Chúng tôi rất mong được sự đánh giá góp ý của quý Thầy cô, giúp tôi hồn thành luận văn này, để tơi sớm đưa kết quả ứng dụng vào thực tế.
81
TÀI LIỆU THAM KHẢO Việt ngữ
1. Luật căn cước cơng dân ngày 20/11/2014 của chính phủ nước Cộng hòa xã hội chủ nghĩa Việt nam.
2. Nghị định số 137/2015/NĐ-CP ngày 31 tháng 12 năm 2015 quy định chi tiết một số điều và biện pháp thi hành Luật căn cước công dân.
3. Thông tư 07/2016/TT-BCA quy định chi tiết một số điều của luật căn cước công dân.
4. GS. TS. Đỗ Hồng Tồn (2006), Giáo trình lý thuyết nhận dạng ứng dụng
trong quản lý, NXB Khoa học và Kỹ thuật.
5. Lê Đức Hiếu, Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích giấy chúng minh nhân dân, ĐH QG hà nội 2012.
6. Trần Văn Nam, Nhận dạng ký tự bằng mạng neural lan truyền ngược, Tạp chí khoa học và cơng nghệ số 14 tháng 6/2014
Anh ngữ
7. Anoop M Namboodiri and Anil Jain,“Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B. B. Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1- 84628-501-1), Jan. 2007.
8. Chris Solomon, Toby Breckon (2011), Fundamentals of Digital Image Processing:Practical Approach with Examples in Matlab, Wiley
9. Frank Y. Shih (2010), Image processing and Pattern recognition: Fundamentals and Techniques, Wiley.
10. K. Kpalma and J. Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007
11. Pierre Soille (2002), Morphological image analysis: principles and application 2nd, Springer.
12. Michael A. Nielsen (2013), Neural Networks And Deep Learning,
82 13. Rafael C. Gonzalez, Richard E. Woods, Steven L. Eddins (2008), Digital
Image Processing using Matlab, Gatesmark.
14. Wilhelm Burger, Mark J. Burge (2009), Principles of igital Image Processing: Fundamental Techniques, Sprigner. Satish Pawar and V. K.
Banga, “Morphology Approach in Image Processing”, (ICICS'2012) Jan. 7-8, 2012 Dubai.