Tuy nhiên, để xây dựng được một hệ thống nhận dạng vân tay tự động đủ tin cậy, có khả năng trích chọn đặc điểm và đối sánh với độ chính xác cao, đạt tốc độ xử lý nhanh trên CSDL hàng chụ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ HƯƠNG THỦY
nghiªn cøu x©y dùng thuËt to¸n ph©n m¶nh chØ b¶n m-êi ngãn dùa trªn
kü thuËt vÐct¬ ho¸ ¶nh ®-êng nÐt vµ øng dông
LUẬN VĂN THẠC SĨ
HÀ NỘI - 2008
Trang 2- 1 –
MỤC LỤC
Lời cam đoan
Danh mục các bảng biểu
Danh mục các hình vẽ
Mục lục
MỞ ĐẦU 3
CHƯƠNG I: TỔNG QUAN VỀ HỆ THỐNG NHẬN DẠNG VÂN TAY TỰ ĐỘNG 5
1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN 5
1.2 HỆ THỐNG NHẬN DẠNG VÂN TAY TỰ ĐỘNG 18
1.2.1 Mô hình của hệ thống nhận dạng vân tay tự động 18
1.2.2 Nguyên lý hoạt động của một hệ nhận dạng vân tay tự động 19
1.3 TÌNH HÌNH NGHIÊN CỨU, ỨNG DỤNG CÁC HỆ THỐNG NHẬN DẠNG VÂN TAY TỰ ĐỘNG TRÊN THẾ GIỚI VÀ NƯỚC TA 27
CHƯƠNG II: PHƯƠNG PHÁP PHÂN MẢNH ẢNH CHỈ BẢN 10 NGÓN, PHÂN LOẠI VÂN TAY VÀ KIỂM TRA VỊ TRÍ CÁC NGÓN 31
2.1 BÀI TOÁN PHÂN MẢNH ẢNH VÂN TAY TỰ ĐỘNG 31
2.1.1 Khái niệm về phân mảnh ảnh 31
2.1.2 Bài toán phân mảnh ảnh chỉ bản vân tay tự động 32
2.1.3 Một số giải thuật phân mảnh ảnh 37
2.1.4 Đề xuất thuật toán phân mảnh ảnh dựa trên cơ sở nhận biết vùng vân 43
2.2 BÀI TOÁN PHÂN LOẠI VÂN TAY TỰ ĐỘNG THEO DẠNG CƠ BẢN 43
2.2.1 Phân loại vân tay 43
2.2.2 Một số phương pháp phân loại vân tay tự động 44
2.2.3 Dạng vân cơ bản và các điểm đặc trưng 46
2.2.4 Điều kiện nhận biết những dạng vân cơ bản 48
2.2.5 Đề xuất phương pháp nhận biết các dạng vân cơ bản dựa trên một số đặc trưng tổng quát 53
2.2.6 Xây dựng sơ đồ thuật toán phân mảnh chỉ bản 10 ngón và phân loại vân tay 54
CHƯƠNG III: LẬP TRÌNH CÀI ĐẶT PHẦN MỀM PHÂN MẢNH CHỈ BẢN 10 NGÓN, PHÂN LOẠI VÂN TAY TỰ ĐỘNG VÀ KIỂM TRA VỊ TRÍ CÁC NGÓN TRÊN CHỈ BẢN 57
Trang 3- 2 – 3.1 LẬP TRÌNH CÀI ĐẶT THUẬT TOÁN PHÂN ĐOẠN, PHÂN LOẠI VÂN TAY
THEO DẠNG CƠ BẢN VÀ KIỂM TRA VỊ TRÍ NGÓN 57
3.1.1 Phân mảnh chỉ bản 10 ngón 57
3.1.2 Phân mảnh mịn và phân loại vân tay tự động 58
3.1.3 Lập trình cài đặt thuật toán 62
3.2 TÍNH NĂNG ĐẠT ĐƯỢC CỦA PHẦN MỀM 70
3.3 HƯỚNG DẪN SỬ DỤNG PHẦN MỀM 71
3.4 THỬ NGHIỆM VÀ ĐÁNH GIÁ 71
3.5 MỘT SỐ HƯỚNG CẢI TIẾN THUẬT TOÁN 80
3.6 ỨNG DỤNG KẾT QUẢ NGHIÊN CỨU ĐỂ CẢI TIẾN , BỔ SUNG TÍNH NĂNG MỚI CHO PHÂN HỆ THU NHẬN CHỈ BẢN VÂN TAY C@FRIS Scan 84
KẾT LUẬN 86
Trang 4- 3 –
MỞ ĐẦU
Ngày nay, vân tay được thừa nhận rộng rãi trên thế giới như một căn cứ tin cậy
và hiệu quả nhất để truy nguyên danh tính con người Với sự phát triển mạnh mẽ của công nghệ tin học, đặc biệt là sự ra đời của các phần mềm nhận dạng và truy nguyên vân tay tự động cùng các thiết bị đọc vân tay sống, vân tay đã và đang trở thành một phương tiện nhận dạng sinh trắc học thông dụng nhất
Ứng dụng truyền thống và nổi bật nhất của công nghệ nhận dạng vân tay tự động
là lĩnh vực pháp lý bởi tác dụng không thể phủ nhận được vai trò của nó trong việc xây dựng các hệ thống căn cước can phạm và điều tra tội phạm theo dấu vết hiện trường Tuy nhiên, ngày nay công nghệ truy nguyên danh tính con người bằng vân tay đã vượt
ra ngoài khuôn khổ các ứng dụng truyền thống và xâm nhập sang nhiều lĩnh vực khác như: Căn cước công dân, kiểm soát truy cập logic như xác thực và kiểm soát giao dịch thương mại điện tử trên mạng máy tính, kiểm soát truy cập vật lý như quản lý cửa khẩu, quản lý thời gian làm việc và nhiều loại hình dịch vụ khác cần xác định danh tính con người với độ tin cậy cao
Để xây dựng một hệ thống nhận dạng vân tay tự động, cần phải giải quyết một vấn đề có ý nghĩa mấu chốt nhất và cũng là khó khăn nhất của kỹ thuật đồng nhất vân
tay, đó là thuật toán đối sánh Chúng ta biết rằng việc đối sánh trực tiếp hai ảnh vân
tay không thể mang lại kết quả do ảnh vân tay của một người qua mỗi lần lăn tay đều sai khác nhau và rất nhạy cảm với các thiết bị thu nhận, điều kiện chiếu sáng, vết bụi bẩn, vết bong da, vết sẹo, sự xê dịch vị trí hay sự biến dạng trong quá trình lăn tay Hiện nay đã có rất nhiều phương pháp nhận dạng vân tay được đề xuất để giải quyết vấn đề này dựa trên việc ứng dụng các phương pháp xử lý ảnh số và nhận dạng Ý tưởng kinh điển để xây dựng thuật toán nhận dạng vân tay dựa trên việc mô phỏng cách thức phân biệt các dấu vân tay của các giám định viên đường vân Để so sánh hai dấu vân tay, các giám định viên tìm cách định vị các điểm đặc trưng chi tiết hay còn gọi là các đặc điểm như các điểm cụt, rẽ nhánh (minutia) trên mỗi ảnh vân tay rồi tiến hành đối sánh trực tiếp hai tập các đặc điểm chi tiết tương ứng của chúng Hiện nay trên thế giới đã có rất nhiều thuật toán đối sánh vân tay ra đời và từ năm 2002, cứ hai năm một lần, người ta lại tổ chức cuộc thi kiểm thử thuật toán để đánh giá sự tiến bộ công nghệ Nhìn chung đa số thuật toán nhận dạng vân tay hoạt động hiệu quả với chất lượng chỉ bản tốt, chẳng hạn các chỉ bản thu nhận bằng các thiết bị thu nhận vân tay sống (life scanner) Tuy nhiên, trên thực tế vân tay quá khô, hay quá ướt, vân tay chỉ bản lăn bằng mực trên giấy, … thường có chất lượng không cao nên việc nhận dạng các vân tay chất lượng kém vẫn còn là một bài toán rất nan giải
Ở nước ta, Phòng Thí nghiệm Mô phỏng và Tích hợp hệ thống Tổng cục Kỹ thuật
Bộ Công an là một trong những đơn vị đã giải quyết thành công bài toán nhận dạng
Trang 5- 4 – vân tay tự động, bước đầu đã xây dựng được sản phẩm C@FRIS và đưa vào ứng dụng thực tế đạt kết quả rất khả quan Tuy nhiên, để xây dựng được một hệ thống nhận dạng vân tay tự động đủ tin cậy, có khả năng trích chọn đặc điểm và đối sánh với độ chính xác cao, đạt tốc độ xử lý nhanh trên CSDL hàng chục triệu chỉ bản, còn có rất nhiều vấn đề kỹ thuật cần tiếp tục cải tiến
Luận văn này sẽ trình bày một số kết quả thu được trong quá trình nghiên cứu triển khai ứng dụng thực tế công nghệ nhận dạng vân tay tự động C@FRIS hiện đang được đưa vào ứng dụng trong Ngành Công an, đề xuất một số giải pháp nhằm cải tiến, nâng cao hiệu quả một số công đoạn của hệ nhận dạng vân tay tự động C@FRIS, bao gồm các phần sau:
Chương 1: Tổng quan về hệ thống nhận dạng vân tay tự động Trong phần này báo cáo
trình bày các khái niệm cơ bản về vân tay, các đặc trưng của vân tay và hai lĩnh vực ứng dụng quan trọng nhất trong ngành cảnh sát là xác minh danh tính hay truy nguyên căn cước đối tượng và điều tra dấu vết hiện trường Tiếp theo , báo cáo trình bày nguyên lý hoa ̣t đô ̣ng cơ bản và các thành phần chủ yếu của một hệ nhận dạng vân tay
tự động, có điểm qua một số hệ nhận dạng vân tay hiện đang được sử dụng phổ biến trên thế giới và trong nước
Chương 2: Sau phần tổng quan, báo cáo tập trung vào nội dung chính là xây dựng
thuật toán phân mảnh ảnh chỉ bản 10 ngón, phân loại vân tay tự động và đối sánh vân tay để kiểm tra vị trí ngón trên chỉ bản
Chương 3: Sau phần xây dựng thuật toán, báo cáo tập trung vào nội dung cài đặt phần
mềm phân mảnh ảnh, phân loại vân tay tự động, đối sánh vân tay để kiểm tra vị trí ngón trên chỉ bản
Luận văn tiếp cận một hướng nghiên cứu quan trọng và nếu giải quyết thành công
sẽ đem lại một bước cải tiến đáng kể cho phân hệ nhập liệu tự động, góp phần nâng cao hiệu quả cũng như làm phong phú thêm tính năng của hệ thống nhận dạng vân tay
tự động C@FRIS nói riêng và các hệ AFIS nói chung
Đây là một chủ đề liên tục phát triển, khá đa dạng và phức tạp Trong thời gian làm luận văn tốt nghiệp, tôi đã tìm hiểu và tiếp tục hoàn thiện thêm một số giải thuật phân mảnh ảnh chỉ bản 10 ngón và phân loại vân tay nhằm mục đích cài đặt một thư viện phần mềm tự động phân mảnh ảnh chỉ bản và nhận biết các dạng vân cơ bản Tuy nhiên, trong quá trình cài đặt thực tế, tôi đã phát hiện và tính toán thêm nhiều đặc trưng quan trọng khác như ma trận hướng, đường biên, rất hữu ích cho giai đoạn xử lý trích chọn các đặc điểm chi tiết tiếp theo
Trang 6- 5 –
CHƯƠNG I
TỔNG QUAN VỀ HỆ THỐNG NHẬN DẠNG VÂN TAY TỰ ĐỘNG
1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN
Chỉ bản vân tay
Vân tay là những vết lằn tạo nên các hoa văn trên bề mặt da đầu các ngón tay, chúng gồm hệ thống các đường cong uốn lượn vòng vèo mà ta quen gọi là các dòng đường vân Để thu thập một bộ chỉ bản vân tay đối tượng, người ta thiết kế một thẻ mẫu dùng để ấn hay lăn các đốt ngoài cùng của mỗi ngón tay sau khi tẩm mực Một thẻ mẫu đã được in vân tay (bằng cách ấn tay hoặc lăn tay), được gọi là một chỉ bản (Hình 1.1)
Hình 1.1: Thẻ chỉ bản vân tay mười ngón
Thông thường một chỉ bản vân tay mười ngón gồm hai loại vân tay: Vân tay lăn (rolled) và vân tay ấn (plain) Trong vùng giữa chỉ bản dùng để chứa 10 dấu vân tay của 10 ngón tay cần được thu nhận bằng cách lăn tay, tức là mỗi đầu ngón tay sau khi tẩm một lớp mực mỏng sẽ được lăn lên giấy và để lại vết lăn có độ trải rộng từ gờ móng tay bên này sang đến gờ móng tay bên kia Còn bốn vùng dưới của chỉ bản dùng
để chứa các dấu vân tay ấn, bao gồm: 2 dấu vân tay ấn đồng thời của 2 ngón tay cái, dấu ấn 4 ngón chụm của tay trái và dấu ấn 4 ngón chụm của tay phải Mặc dù độ trải rộng của dấu vân tay ấn không rộng bằng dấu vân tay lăn nhưng nó thường thể hiện rõ
Trang 7- 6 – hơn các đặc điểm chi tiết của các đầu mút ngón tay Các vùng vân tay ấn còn được dùng để kiểm tra các dấu vân tay đã được lăn có đúng vị trí ô hay không
Hình 1.2: Ảnh mực, (a) ảnh lăn tay, (b) ảnh ấn tay
Khi có một bộ chỉ bản vân tay đã được thu thập, ta cần lưu ý phân biệt một đặc trưng quan trọng của nó là chúng được thu thập cho một mục đích cụ thể nhất thời nào
đó hay được thu thập một cách bài bản, theo đúng yêu cầu kỹ thuật để nhập bổ sung vào hệ thống
Mặc dù hiện nay, các hệ thống thu nhận vân tay sống đang được phổ biến rộng rãi, nhưng chỉ bản vân tay giấy đang được sử dụng rộng rãi nhất Các thiết bị thu nhận vân tay sống có ưu điểm là sử dụng các công nghệ quang điện tử để thu nhận, số hóa và lưu trữ vân tay một cách trực tiếp, không cần giai đoạn trung gian in lên giấy Để thu trực tiếp ảnh vân tay trên máy thu vân tay sống ta chỉ cần ấn đầu ngón tay trực tiếp lên cửa sổ thu nhận của máy và thực hiện một số thao tác điều khiển phần mềm Chất lượng của ảnh vân tay loại này phụ thuộc vào điều kiện thu nhận, ví dụ: chất lượng của máy, tay sạch hay bẩn, tay khô hay ướt, Tuy nhiên, do thu nhận trực tuyến nên ta có thể quan sát trực tiếp vân tay được thu nhận, do đó có thể điều chỉnh được chất lượng của ảnh vân tay
Hình 1.3: Ảnh thu trực tiếp từ máy thu nhận vân tay sống
Ảnh vân tay sống nói chung là có chất lượng tốt hơn nhiều so với ảnh lăn mực và ảnh thu thập từ hiện trường vụ án Tuy nhiên, do hiện nay trong Ngành Công an nuớc
ta, còn có cả một hệ thống tàng thư từ Trung ương đến địa phương với hàng chục triệu chỉ bản bằng giấy nên việc duy trì cả hai phương pháp thu nhận vân tay vẫn là một thực tế lâu dài
Trang 8- 7 –
Dấu vết hiện trường
Hình 1.4: Ảnh dấu vết vân tay thu thập từ hiện trường vụ án
Khi một ngón tay tiếp xúc vào một vật nào đó thì nó có thể để lại dấu vết đường vân lên vật đó Dấu vết để lại đó được gọi là dấu vết vân tay hiện trường hay còn gọi là dấu vân tay ẩn do chưa rõ người nào để lại Dấu vết này được hình thành do những lớp
mỡ hoặc lớp mồ hôi mỏng trên bề mặt da ngón tay để lại sau khi ngón tay tiếp xúc với các vật thể nhẵn bóng, có khi trên các tài liệu hay tấm séc thanh toán Dấu vết hiện trường thường được thu thập và xử lý bởi các phương pháp hóa lý khác nhau nhằm làm cho chúng hiện lên rõ hơn, dễ quan sát hơn và có thể chụp được ảnh
Đặc trưng cơ bản của dấu vết vân tay hiện trường là nó thường không đầy đủ, phần lớn các trường hợp chỉ để lại dấu vết của một phần ngón tay, nhiều khi bị mờ, nhòe, lẫn với vết bẩn hoặc bề mặt các hoa văn của đồ vật Tuy vậy, trong nhiều trường hợp vẫn còn rất nhiều đặc điểm chi tiết đủ để xác định chính xác chủ nhân đã để lại những dấu vết đó
Cấu trúc ảnh vân tay
Ảnh vân tay có cấu trúc bề mặt khá đặc biệt Một cấu trúc đường vân lý tưởng bao gồm các dòng đường vân và các dòng đường rãnh chạy xen kẽ nhau, ―song song‖ với nhau, một đường vân bị kẹp giữa hai đường rãnh, và ngược lại, một đường rãnh bị kẹp giữa hai đường vân
Trang 9Về mặt chất lượng, có thể phân chia một dấu vân tay bất kỳ thành 3 loại:
Vùng có cấu trúc rõ ràng: là vùng mà mỗi đường vân và đường rãnh là phân biệt
nhau một cách rõ ràng với các đường vân và các rãnh khác, và do đó việc trích chọn đặc trưng dễ đảm bảo chính xác
Hình 1.7: Cấu trúc vân tay rõ ràng
Vùng bị phá hủy nhưng có thể khôi phục lại được: là vùng mà các đường vân
và các rãnh bị phá hủy bởi một số lượng nhỏ các vết gợn, các vết nhòe, ., nhưng chúng ta vẫn có thể xác định và vẽ lại được các vùng vân lân cận cùng các thông tin hữu ích về cấu trúc các đường vân
Hình 1.8: Vùng bị phá huỷ nhưng có thể khôi phục lại được
Vùng bị phá hủy không thể khôi phục được: là vùng mà các đường vân và các
đường rãnh bị phá hủy bởi một số lượng lớn các nhiễu Các đường vân và các đường rãnh này là không thể xác định được, các vùng lân cận cũng không cung cấp được thông tin gì đáng kể để có thể khôi phục lại cấu trúc các đường vân Chúng ta gọi hai loại đầu là vùng có thể khôi phục lại được và vùng thứ ba là vùng không thể khôi phục lại được Trong bài toán nhận dạng vân tay, chúng ta chỉ sử dụng vùng có thể khôi
Trang 10- 9 – phục được, vùng không thể khôi phục được xếp và loại ―vùng không xác định‖ Các đặc điểm chi tiết do máy phát hiện trên các vùng không xác định thường không được xét đến
Hình 1.9: Vùng bị phá huỷ nặng, không thể khôi phục lại được
Đặc trưng của vân tay
Quan sát các dấu vân tay Hình 1.10, chúng ta thấy có nhiều hình dạng rất phong phú, song vẫn có thể phân loại chúng theo các lớp khác nhau Có những lớp ở đó đường vân chạy từ một phía, đến giữa nhô lên rồi lại chạy tiếp sang phía bên kia tạo thành một mẫu vân có hình dáng như những chiếc cung chồng lên nhau (a) Song cũng
có những dòng vân sau khi chạy nhô lên ở giữa rồi lại quay trở về nơi xuất phát ban đầu (b) Lại có những dòng đường vân chạy vòng quanh một điểm, giống như những dòng nước xoáy khi chảy qua một chướng ngại vật nào đó (c)
(a) Hình cung (b) Hình quai (c) Hình xoáy
Hình 1.10: Một số dạng hình vân thường gặp
Để thuận tiện cho phân loại người ta quy ước với nhau một số khái niệm cơ bản
Đường bao và vùng vân trung tâm
Vùng vân trung tâm dùng để phân loại là vùng vân nằm chính giữa một dấu vân tay được giới hạn bởi đường bao trên và đường bao dưới Các đường bao là các đường vân bao vùng vân trung tâm, được quy ước là một cặp đường vân lúc đầu chạy song song với nhau sau đó đến tam phân điểm bên ngoài nhất (có thể ở bên trái hay bên phải) thì chạy tách ra, một chạy lên phía trên, một chạy xuống phía dưới và cùng bao bọc lấy vùng trung tâm Khi dò theo nét vân, người ta qui ước nếu gặp điểm cụt, phải
Trang 11- 10 – chuyển ngay sang đường vân liền ngoài để tiếp tục Hình dưới cho ta thấy ví dụ về vùng vân trung tâm được giới hạn bởi các đường bao trên A và đường bao dưới B
Hình 1.11: Mô tả đường bao và vùng vân trung tâm
(Focus hay Singular point)
Trên nhiều mẫu vân tay, chúng ta dễ thấy có những điểm đặc biệt có thể quy ước lấy làm điểm tham chiếu để phân loại Những điểm đó thường nằm trên vùng tam giác chỗ giao nhau của ba dòng vân hoặc điểm quay gấp của một dòng đường vân nào đấy Một vân tay có thể có hai, ba, có khi bốn điểm như thế, song cũng có vân chẳng có điểm nào Điểm gặp nhau của ba dòng vân khác nhau được gọi là tam phân điểm (delta), còn điểm mà quanh nó có một dòng vân chạy vòng quanh được gọi là tâm điểm Tâm điểm thường nằm ở vùng trung tâm của một dấu vân tay Sau đây là một số
ví dụ về tâm điểm và tam phân điểm
Tam phân điểm (Delta)
Tam phân điểm là còn được qui định là điểm phân kỳ của đường bao trên và đường bao dưới khi ta xét từ trái sang phải và từ phải sang trái Những vân tay có nhiều tam phân điểm, thì ta ưu tiên chọn tam phân điểm ngoài cùng để giới hạn vùng trung tâm Tam phân điểm có thể định vị bởi điểm đầu tiên rẽ nhánh, điểm kết thúc, điểm giao nhau, điểm chấm hay đoạn vân ngắn nằm trên vùng phân kỳ
Trang 12- 11 –
Tâm điểm (Core)
Tâm điểm là điểm nằm gần vị trí trung tâm của vân tay Trong vân tay, tâm điểm được qui ước chọn một điểm nằm trên đường vân mà tại đó độ cong của đường vân là lớn nhất
Các dạng cơ bản của vân tay
Vân tay được phân loại thành các dạng cơ bản căn cứ vào cách sắp xếp chung của các dòng đường vân Có ba dạng cơ bản chủ yếu đó là dạng hình cung, dạng hình quai
và dạng hình xoáy Mỗi dạng này còn có thể chia chi tiết hơn nữa, thậm chí có thể phân loại mịn hơn bằng việc đưa thêm số đếm vân Bởi vì có một mức độ độc lập nhất định giữa các dạng cơ bản trên mười đầu ngón tay, phương pháp phân loại vân tay theo dạng cơ bản khi áp dụng cho cả 10 ngón sẽ có giá trị phân một tập chỉ bản thành nhiều nhóm nhỏ, mỗi nhóm nhỏ bao gồm những người có cùng một tổ hợp dạng cơ bản như nhau Như vậy, việc phân nhóm theo dạng cơ bản sẽ rất hữu ích vì nó cho phép giảm số lượng các phép đối sánh khi ta đối sánh một chỉ bản vân tay với một tập chỉ bản cho trước nào đó Để thủ tục phân loại vân tay theo các dạng cơ bản đảm bảo tính tin cậy cao, cần phải tiến hành thận trọng và phải được những chuyên gia vân tay
có kinh nghiệm kiểm tra kỹ lưỡng
Trang 13- 12 –
- Dạng vân hình cung (ARCH): Chiếm khoảng 3-5% tổng số vân tay
Hình 1.15: Mô tả loại vân hình cung
- Dạng vân hình quai (LOOP) :
Dạng vân hình quai là loại thường gặp nhất trong các mẫu vân tay, chiếm khoảng 60-65 % số vân tay
Hình 1.16: Mô tả loại vân hình quai
- Dạng vân hình xoáy (WHORL)
Loại vân hình xoáy còn được gọi là hoa tay, chiếm khoảng 30 – 35 % trong số các vân tay Ở loại này, có ít nhất một đường vân tạo thành một vòng tròn đóng hay một đường vân hình chữ S
Hình 1.17: Mô tả loại vân hình xoáy
Bảng sau đây chỉ ra cho ta tần suất xuất hiện các dạng cơ bản của vân tay trên 10 đầu ngón tay:
Trang 14Bảng 1: Tần suất xuất hiện dạng cơ bản
Trong đó CP, TP, GP, NP, UP lần lượt là các ngón tay cái, trỏ, giữa, nhẫn và út của bàn tay phải còn CT, TT, GT, NT, UT là các ngón tay cái, trỏ, giữa, nhẫn và út của bàn tay trái Qua bảng này ta thấy chỉ có 2.4% dạng cơ bản hình cung trên ngón cái phải trong khi đó có 33% dạng cơ bản hình xoáy trên ngón đeo nhẫn trái Những chỉ số phần trăm này hầu như là giống nhau đối với đa số dân tộc trên thế giới mặc dù vẫn có một vài sự khác biệt nhỏ đối với từng dân tộc cụ thể
Trên thực tế, những dạng cơ bản xuất hiện trên mười đầu ngón tay không hoàn toàn độc lập với nhau Chẳng hạn có thể kiểm tra được rằng xác suất xuất hiện dạng hình xoáy trên mỗi ngón tay, nếu chúng độc lập với nhau, sẽ là 0.398 x 0.316 x 0.183
x đây là một con số rất nhỏ khoảng một phần triệu Thế nhưng, thực tế là số các chỉ bản có 10 ngón đều thuộc dạng xoáy lại khá phổ biến, chiếm khoảng 1.86 %
Tổ hợp dạng cơ bản Tần suất xuất hiện
Trang 15- 14 – Bảng 2 chỉ ra cho ta thấy mười hai tổ hợp các dạng vân tay cơ bản trên hai bàn tay
có tần suất xuất hiện cao nhất Cột thứ nhất chỉ ra các tổ hợp dạng cơ bản của 10 ngón tay bắt đầu từ ngón cái phải và kết thúc là ngón út trái Những chữ cái R, L, W và A kí hiệu tương ứng cho các dạng cơ bản quai phải, quai trái, xoáy và cung Cột thứ hai chỉ
ra số phần trăm Tổ hợp phổ biến nhất, ước tính khoảng 6% số chỉ bản, là 5 ngón tay phải đều có dạng quai phải và 5 ngón tay trái đều có dạng quai trái
Do vậy, bằng cách kiểm tra dạng cơ bản của mười ngón tay, một chuyên gia vân tay có thể phân loại một người cụ thể vào một lớp nào đó (có cùng tổ hợp dạng cơ bản) Tuy nhiên, nhóm này vẫn còn bao gồm hàng nghìn người Để đồng nhất một cá nhân cụ thể, cần thiết phải đối sánh theo những đặc điểm chi tiết hơn
Đặc điểm chi tiết của các dòng đường vân
Trong mỗi dấu vân tay có một số đường vân đang chạy liên tục rồi đến một vị trí nào đó hoặc bị phân ra hai, ba nhánh (điểm rẽ nhánh) hoặc có khi bị đột ngột kết thúc (điểm cụt) Các điểm kết thúc hay rẽ nhánh này phân bố ngẫu nhiên trên một dấu vân tay và được gọi là những đặc điểm chi tiết (đôi khi còn gọi là những điểm đặc trưng chi tiết hay những chi tiết minutiae)
Hình sau cho ta thấy điểm kết thúc đường vân (ridge ending) xuất hiện khi đường vân đột ngột kết thúc Điểm rẽ nhánh của đường vân là điểm tại đó đường vân rẽ ra làm hai nhánh
Tuy nhiên các cách kết hợp khác nhau của hai loại đặc điểm cơ bản này cũng tạo
ra các biến thể khác nhau như các chấm nhỏ, các đoạn đường vân ngắn, đường hình mắt (lòng hồ), móc, đoạn, cầu nối
+ Những chấm nhỏ: Gồm một số điểm đen gộp lại thành một dấu chấm, chẳng hạn như do mực rơi khi lăn tay
+ Đoạn đường vân ngắn: Một đoạn đường vân ngắn, nhưng không quá ngắn để có thể coi là một điểm Đoạn vân ngắn được thể hiện bởi hai điểm cụt nguợc chiều nhau
+ Đường hình mắt: Một đường vân rẽ ra làm hai nhánh sau đó khép lại tạo thành một vòng kín Vân hình mắt thể hiện bởi hai điểm rẽ nhánh ngược chiều nhau
Trang 16- 15 –
+ Nhánh móc: Đường vân tách ra như một cái móc ngắn
+ Đoạn cầu nối: Do một móc kéo dài làm thành cầu nối hai đường vân kề nhau
Những đặc điểm chi tiết này nằm rải rác tại các vị trí khác nhau trong mối tương quan lẫn nhau và mỗi đặc điểm được đặc trưng bởi một hướng xác định Trừ khi một ngón tay bị phá hủy nặng để lại sẹo, các đặc điểm nhìn chung sẽ vẫn không thay đổi đối với một người trong suốt cả cuộc đời từ khi sinh ra cho đến khi chết
Có thể dễ dàng nhận thấy hai ngón tay khác nhau luôn tạo ra những dấu vân tay chứa tập các đặc điểm sắp xếp khác nhau Một thực tế được thừa nhận rộng rãi là hai dấu vân tay cùng có bộ ít nhất từ 10 đến 13 đặc điểm chi tiết cùng các tương quan vị trí giống nhau thì coi như đồng nhất, tức là do cùng một ngón tay in ra
Vân tay được sử dụng như thế nào?
Các cơ quan cảnh sát thường sử dụng vân tay vào 2 mục đích chính:
+ Xác định danh tính hay căn cước của một người bị bắt giữ
+ Truy tìm thủ phạm gây án theo dấu vết hiện trường
Xác định danh tính của một người bị bắt giữ
Với mục đích thứ nhất, cần phải tra cứu chỉ bản vân tay mười ngón của nghi can bị bắt giữ với hệ thống thẻ chỉ bản để xác minh xem nghi can đó đã có tên trong hồ sơ cảnh sát hay không
Ở hầu hết các nước, công việc này thuộc phạm vi trách nhiệm của Trung tâm căn cước quốc gia Ở đấy người ta có thể đối chiếu chỉ bản vân tay 10 ngón của nghi can với bộ chỉ bản vân tay 10 ngón được lưu trữ trong hồ sơ vân tay của Trung tâm căn cước
Chẳng hạn, năm 1990, Trung tâm căn cước của Bộ Nội vụ Anh lưu trữ khoảng 4,2 triệu thẻ chỉ bản vân tay mười ngón, gọi là Tàng thư chỉ bản vân tay quốc gia, và mỗi ngày tàng thư này phải giải quyết khoảng 2400 yêu cầu tra cứu Đến năm 2005, số lượng của hồ sơ lưu trữ đã lên tới khoảng 6 triệu thẻ và mỗi ngày cần phải tra cứu khoảng 4500 yêu cầu
Trang 17- 16 – Trong đại đa số trường hợp (khoảng 75%), các nhân viên cảnh sát địa phương đều
có thể xác minh được danh tính của các nghi can bị bắt giữ bằng cách kiểm tra các thông tin thuộc tính cá nhân thông thường nhất (họ-tên, ngày tháng năm sinh) bằng công cụ tìm kiếm trên hệ thống máy tính của cơ quan cảnh sát Trong trường hợp này, sau khi tra cứu theo họ tên, các chuyên gia vân tay chỉ cần kiểm chứng hay đối sánh một - một mẫu vân tay của nghi can với những mẫu vân tay lưu trong hồ sơ Nếu hai mẫu là đồng nhất thì đối tượng đó đã có trong hồ sơ tội phạm và nhân viên tra cứu tiến hành thông báo kết quả và làm các thủ tục bổ sung, cập nhật hồ sơ
Đối với những nghi can chưa xác định được danh tính (khoảng 25%) bằng phương pháp xác minh thông tin thuộc tính thông thường, kể cả các trường hợp xác minh sai (khoảng 1%), thì phương pháp tra cứu theo chỉ bản vân tay mới được sử dụng để tra tìm trên tàng thư căn cước Đây là một công việc tốn kém, tiêu phí nhiều công sức và thời gian, vì các chuyên gia vân tay phải xác định, kiểm tra vân tay của tất cả các ngón trên chỉ bản 10 ngón Nếu chỉ phân loại một cách khái quát theo dạng cơ bản cung, quai, xoáy, , thì kết quả tìm kiếm sẽ đưa ra một danh sách kết quả khá lớn (chẳng hạn khoảng 6% trong số hơn 4 triệu tội phạm, theo Bảng 2) Do đó cần phải ứng dụng các phương pháp phân loại thật chi tiết để khi tra cứu đưa ra kết quả trung bình khoảng
10 chỉ bản Những kết quả đó tiếp tục được các chuyên gia vân tay kiểm tra theo các đặc điểm chi tiết để đưa ra quyết định có đồng nhất hay không
Truy tìm tội phạm
Khác với việc xác minh danh tính nghi can bị bắt giữ được thực hiện chủ yếu bằng cách tra cứu trên cơ sở dữ liệu trung tâm hay tàng thư căn cước, thì việc truy tìm tội phạm được thực hiện theo một cách khác, trong đại đa số trường hợp phải tiến hành ngay tại địa phương
Những dấu vết vân tay thu được tại hiện trường vụ án hay từ các tài liệu được gửi đến các cơ quan giám định vân tay của địa phương để xem xét Ở đây, các giám định viên vân tay tìm mọi cách tốt nhất có thể để xác định xem chúng thuộc loại nào, ngón nào Trong hầu hết các trường hợp người ta chỉ thu được dấu vết của một hoặc hai ngón tay và chúng thường có chất lượng rất thấp
Để tránh phải tìm kiếm trên toàn bộ tàng thư quốc gia, người ta cố gắng tìm mọi cách khác nhau để giảm thiểu danh sách kết quả tra cứu đưa ra Cách thứ nhất là sàng lọc theo địa lý, tức là chỉ tìm kiếm các bản ghi của tội phạm tại một vài địa phương nào đó Ý nghĩa của việc giới hạn địa phương là có thể hạn chế tìm trong một vài địa phương đến nhiều địa phương tùy thuộc mức độ quan trọng của vụ án
Một cách sàng lọc khác là theo loại tội phạm hay tội danh, chẳng hạn như dấu vết
từ một vụ trộm cắp thì chỉ nên tìm kiếm trong số tội danh ―trộm‖
Trang 18- 17 – Còn có các cách chọn lọc khác, phụ thuộc vào thông tin cụ thể từ các nhân chứng hay chứng cứ thu thập được từ hiện trường Theo đó, những nghi phạm đang tìm kiếm
có thể được giới hạn về giới tính, độ tuổi hay nhân dạng đặc điểm cụ thể nào đó
Tất nhiên, nếu càng giới hạn số lượng đối sánh thì khả năng sót lọt tội phạm sẽ càng cao
Khi số lượng của các bản ghi cần tra tìm được hạn chế một cách thích hợp bằng cách sử dụng các sàng lọc nêu trên, các chuyên gia vân tay tiến hành khảo cứu, thẩm định lần lượt từng chỉ bản một để đối sánh với những đặc điểm trên dấu vết tra cứu Đây là một công việc tiêu phí thời gian bởi vì chất lượng của những dấu vết khả nghi thường rất thấp và việc so sánh do vậy cũng thực hiện rất khó khăn Các cơ quan cảnh sát thường đã lưu trữ những chỉ bản vân tay 10 ngón của tội phạm trên tàng thư căn cước can phạm địa phương, do đó các nhân viên cảnh sát rất ít khi phải cần đến tàng thư căn cước trung ương để làm công việc này
Đôi khi có những trường hợp có thể thực hiện đơn giản hơn vì cảnh sát có thể chỉ quan tâm đến một hay vài đối tượng nghi vấn cụ thể Trong những trường hợp như thế, chuyên gia vân tay chỉ phải thực hiện việc xác minh dấu vết trong một số lượng nhỏ các phép đối sánh có thể Chỉ những trường hợp không đưa ra được danh sách đối tượng nghi vấn thì họ mới phải tiến hành hàng trăm thậm chí hàng nghìn phép so sánh (đối với các vụ án quan trọng) Cách thức tra cứu như thế thường được gọi là tra cứu nguội (cold search) Trong công việc tra tìm và đối sánh, các chuyên gia vân tay thường không thể sắp xếp danh sách đầu ra theo một trật tự ưu tiên nào Chẳng hạn, trong trụ sở cảnh sát hồ sơ thường được lưu trữ, sắp xếp theo thứ tự số hồ sơ tội phạm Thứ tự này dĩ nhiên không hề có mối liên quan nào đến tầm quan trọng vụ án
Dấu vết vân tay hiện trường
Không phải dấu vết hiện trường
Tổng số vụ
Số vụ án có thu dấu vết 300.000 46.000 350.000 Tra cứu với đối tượng nghi vấn
có khoảng chừng 350.000 vụ có thu được dấu vết vân tay hiện trường (thường là một
số vụ có nhiều hơn một dấu vết) Có gần 33.000 trường hợp đối sánh thành công được thực hiện qua việc tra cứu với đối tượng nghi vấn nóng Và hơn 27.000 vụ đối sánh thành công bằng phương pháp tra cứu nguội (cold searching)
Trang 19- 18 – 1.2 HỆ THỐNG NHẬN DẠNG VÂN TAY TỰ ĐỘNG
1.2.1 Mô hình của hệ thống nhận dạng vân tay tự động
Ở nước ta hiện nay, tại hầu hết các địa phương cấp tỉnh, công việc phân loại và tra cứu vân tay chủ yếu vẫn còn phải thực hiện bằng các phương pháp thẻ phiếu thủ công Các chuyên gia phải phân loại, xem xét, so sánh các chỉ bản vân tay bằng mắt thường, với các dụng cụ như kính lúp, bút chì, compa, thước kẻ, Việc tổ chức các bộ thẻ và tra tìm, đối sánh thủ công như vậy mất nhiều thời gian và công sức, chỉ thích hợp với
số lượng vân tay nhỏ, do đó thường không đạt được hiệu quả mong muốn
Ngày nay, với sự phát triển nhanh chóng của công nghệ thông tin, nhiều hệ thống phần mềm nhận dạng vân tay tự động đã ra đời và trong tương lai gần sẽ là công cụ chủ yếu cho phép người sử dụng có thể tra tìm xác minh vân tay nghi vấn trên các hệ thống cơ sở dữ liệu lớn với thời gian nhanh và độ chính xác cao
Một hệ thống nhận dạng vân tay tự động thông thường phải có hai chức năng cơ bản: xây dựng cơ sở dữ liệu (CSDL) và tra tìm chỉ bản vân tay Xây dựng CSDL vân tay tức là thực hiện các công việc: Thu thập chỉ bản của các đối tượng quản lý, quét chỉ bản, nhập thông tin thuộc tính (số đối tượng, họ tên, năm sinh, nơi sịnh, ), phân loại vân tay theo dạng cơ bản, xử lý trích chọn tự động các đặc điểm chi tiết, lưu và tổ chức CSDL Tra tìm chỉ bản vân tay là xác định xem đối tượng có chỉ bản vân tay đó
đã có trong cơ sở dữ liệu hay chưa, số hồ sơ đối tượng đăng ký là bao nhiêu Khi xây dựng CSDL vân tay cũng như khi tra tìm đều đòi hỏi phải phân loại và trích chọn các điểm đặc trưng trước khi tiến hành đối sánh
Sau đây là sơ đồ khối tổng quát của hệ thống nhận dạng vân tay
Hình 1.18: Sơ đồ khối tổng quát một hệ AFIS
Các khối chức năng trên hình vẽ có ý nghĩa như sau:
Trang 20- 19 –
Khối Thu nhận ảnh, nhập thông tin thuộc tính và tiền xử lý: Khối này có ý nghĩa
rất lớn trong mô hình nhận dạng vân tay tự động Nhiệm vụ của nó là thu nhận vân tay đăng ký và vân tay cần tra cứu cùng một số thông tin cá nhân liên quan Ảnh vân tay thu nhận có chất lượng khác nhau, tuỳ thuộc vào cách lấy mẫu vân và tuỳ thuộc vào tay người lấy mẫu Ảnh lấy mẫu trên các máy lăn tay sống chuyên dụng có chất lượng tốt hơn nhiều so với ảnh lăn mực Nếu tay ướt, bẩn thì chất lượng ảnh cũng kém hơn là lấy mẫu với tay khô, sạch Vì vậy, để xử lý tự động cần phải tiến hành tiền xử lý ảnh, tức là chuyển ảnh vân tay từ dạng đa cấp xám ban đầu sang một dạng phù hợp, có chất lượng tốt hơn để phục vụ cho giai đoạn trích chọn điểm đặc trưng
Khối Phân loại vân tay tự động: Phân loại vân tay tự động là xây dựng thuật toán
phân tích ảnh vân tay để phân chia chúng thành một số dạng cơ bản Phân loại là bước lọc thô nhằm phân hoạch các vân tay cần đối sánh, vì hai vân tay thuộc hai loại khác nhau được coi là khác nhau, không cần phải đối sánh nữa Với việc phân loại vân tay, khâu đối sánh chỉ phải thực hiện trên các vân tay cùng một loại Điều này làm cho thời gian tìm kiếm vân tay trên một cơ sở dữ liệu giảm đi rất nhiều
Khối Trích chọn đặc điểm tự động: Các vân tay phân biệt nhau bởi tổ hợp vị trí
các điểm đặc trưng Để phục vụ cho bài toán nhận dạng, cần phải tìm ra được thuật toán hiệu quả để tự động trích chọn các điểm đặc trưng này Trích chọn đặc trưng tự động và đối sánh tự động là hai chức năng cốt lõi nhất của một hệ thống nhận dạng
vân tay tự động Đối sánh tự động là so sánh tự động hai tập đặc trưng của vân tay
thay vì phải đối sánh hai ảnh của chúng Việc đối sánh thường được tiến hành theo hai chế độ: Đối sánh 1-1 (đối sánh 2 vân tay với nhau) và 1: n (Tra tìm vân tay trên CSDL vân tay và lọc ra những vân tay gần giống nhất để đối sánh)
Tổ chức Cơ sở dữ liệu: CSDL của hệ nhân dạng vân tay tự động chứa dữ liệu hình ảnh về chỉ bản đăng ký vào hệ thống, dữ liệu thuộc tính (số đối tượng, họ tên, ngày sinh, địa phương, ) của đối tượng và dữ liệu phân loại vân tay như dạng cơ bản và các đặc điểm chi tiết của vân tay Trong khi tổ chức dữ liệu vân tay, cần phải tiến hành các kỹ thuật đánh chỉ số theo dạng cơ bản và một số thông tin cơ bản khác có tính phụ trợ như địa phương, năm sinh, giới tính, độ tuổi
1.2.2 Nguyên lý hoạt động của một hệ nhận dạng vân tay tự động
Các hệ thống nhận dạng vân tay tự động với sự trợ giúp của máy tính được phổ biến trên thị trường được biết đến với nhiều cách gọi khác nhau Ở nước Anh người ta gọi là Hệ thống nhận dạng vân tay tự động: Automatic Fingerprint Recognition (AFR)
và ở trong hầu hết các nước khác được gọi là Hệ thống đồng nhất vân tay tự động: Automatic Fingerprint Identification System (AFIS) Tên gọi AFIS đã trở thành phổ biến để diễn tả hoạt động thật sự của hệ thống Thực ra, không một cách gọi nào ở trên
là thật sự chính xác, vì nhiều hệ thống hiện nay chủ yếu chỉ đơn giản là một cơ chế
Trang 21- 20 – chọn lọc, sắp xếp và tìm kiếm vân tay Nó chưa làm được gì nhiều theo nghĩa nhận dạng cũng như chưa hoàn toàn truy nguyên đồng nhất được chỉ bản một cách tự động Một số tổ chức thương mại đã tung ra thị trường các sản phẩm AFR hay AFIS, và rất nhiều trong số chúng được sử dụng rộng rãi trên toàn thế giới Bộ Công an Việt Nam cũng đã nhập phần mềm MORPHO AFIS của hãng SAGEM (Pháp) và cũng đã
tự tổ chức phát triển phần mềm C@FRIS để ứng dụng cho các đơn vị và địa phương
Nguyên lý hoạt động
Về nguyên tắc chung thì mọi hệ thống nhận dạng vân tay tự động đều phải trích chọn một lượng thông tin hạn chế từ ảnh vân tay, thường gọi là bộ đặc điểm chi tiết hay bộ mã vân tay (minutiae template) Những bộ đặc điểm này được lưu trữ trong cơ
sở dữ liệu máy tính Khi một chỉ bản mới muốn so sánh với những chỉ bản lưu trữ, hệ thống sẽ trích chọn bộ đặc điểm từ chỉ bản yêu cầu và so sánh chúng với các mã của chỉ bản lưu trên cơ sở dữ liệu Kết quả của mỗi lần so sánh cụ thể sẽ đem lại một điểm
số đánh giá sự giống nhau của 2 bộ đặc điểm theo những quy tắc riêng của từng hệ thống Khi công việc so sánh được hoàn tất, các hệ thống thường đưa ra danh sách các đối tượng sắp xếp theo điểm số giảm dần
Để việc nhận dạng đạt được độ tin cậy cần thiết, các chuyên gia vân tay vẫn phải
so sánh, thẩm định lại bằng mắt thường chỉ bản tra cứu với chỉ bản nghi can Đặc trưng quan trọng của việc đối sánh chỉ bản tra cứu với chỉ bản nghi can trên hệ thống AFR là những chỉ bản nghi can tìm thấy có thể được xem xét theo một thứ tự ưu tiên, cụ thể là theo độ giống với chỉ bản tra cứu Với phương pháp thủ công truyền thống không có
sự hỗ trợ của máy tính thì việc tìm kiếm theo thứ tự ưu tiên như trên là không thể thực hiện được
Như đã nêu trên, khi một kẻ bị bắt giữ cần được xác minh danh tính, những nhân viên vân tay của tàng thư căn cước thực hiện hoặc bằng cách thẩm tra thông tin cơ bản hoặc thông qua việc tra cứu chỉ bản, nghĩa là họ sẽ so sánh chỉ bản nghi vấn với các chỉ bản lưu trong hồ sơ Để giải quyết vụ án, có thể thực hiện ba cách tra cứu khác nhau Cách tra cứu dấu vết với chỉ bản (mark-to-print) là cách đã được mô tả ở trên trong đó những dấu vết cần tra cứu sẽ được so sánh với chỉ bản gốc của những can phạm đã biết Tuy nhiên, cũng có thể tra tìm chỉ bản của những kẻ mới bị bắt giữ với
bộ những dấu vết đã có, để biết xem người đó có dính líu vào vụ án nào trong số các
vụ chưa giải quyết hay không, bằng cách đó có thể làm rõ chúng hơn Đó là cách tìm kiếm chỉ bản với dấu vết (print-to-mark) Cuối cùng, có thể tìm kiếm sự liên quan giữa một số vụ án khác nhau chưa được giải quyết, dấu vết từ một vụ án này có thể đem so sánh với dấu vết của những vụ án khác, đó là cách tìm kiếm dấu vết với dấu vết (mark-to-mark) Cách tìm kiếm cuối cùng này thường gặp nhiều khó khăn, bởi vì các dấu vết thường có chất lượng thấp nên tỉ lệ thành công thường sẽ không thể cao
Trang 22- 21 –
Tính chính xác
Kể cả một hệ thống AFR tốt nhất cũng không thể luôn đưa ra được kết quả đối sánh ngay ở đầu trong danh sách (giả sử chỉ bản đã có trong CSDL) Trong chế độ tìm kiếm chỉ bản với chỉ bản (print-to-print) thường có những ảnh chỉ bản đạt chất lượng cao, những chỉ bản đối sánh được có thể hi vọng sẽ xuất hiện ở vị trí thứ nhất hoặc thứ hai Nhưng trong chế độ tra tìm dấu vết với chỉ bản, chỉ bản kết quả có thể nằm phía dưới của danh sách, để kiểm chứng có thể sẽ phải tra cứu hết cả một danh sách dài, do
đó một nhân viên vân tay thường chỉ tìm kiếm một số bản ghi đầu tiên (khoảng 100) trước khi dừng lại, vì thời gian của họ còn phải dành cho các vụ án tiếp theo
Một lý do mà hệ thống AFR không thể đạt chính xác hơn là vì chúng chỉ làm việc với bộ đặc điểm của AFR Chúng bỏ qua những khối lượng thông tin khổng lồ khác, nhất là các hình dạng chi tiết, sự sắp xếp của các đường vân, độ dày mỏng của đường nét, các lỗ chân lông và các đặc điểm khác Chúng chỉ sử dụng dữ liệu về vị trí tương đối của các điểm đặc trưng như các điểm rẽ nhánh và các điểm cụt
Một lý do quan trọng khác nữa là những bộ đặc điểm vân tay thu được không hoàn toàn chính xác Nói chung, các hệ thống AFR ít chú ý đến việc xác định độ tin cậy của từng bộ mã cụ thể cũng như không tính đến sự khác nhau của các bộ mã – chúng chỉ quan tâm sự đến độ giống nhau Các phép toán trích chọn bộ đặc điểm thường rất nhạy cảm với chất lượng của ảnh gốc và độ chiếu sáng khi thu nhận cũng như dễ bỏ qua những đặc điểm có tính xác thực cao hay các lỗi khi trích chọn Vì vậy trong nhiều trường hợp, nhất là trong việc tra cứu dấu vết hiện trường, thường gặp một số đặc trưng đường vân của chỉ bản tra cứu khác xa với chỉ bản tra cứu
500 hay 250.000 ô Mỗi ô nhỏ này thì được gọi là 1 phần tử của ảnh (pixel) hay nói cách tổng quát hơn là 1 điểm ảnh Trong ví dụ ở trên độ phân giải sẽ là 500 điểm trên 1 inch Hiển nhiên là độ phân giải càng cao thì số chi tiết thể hiện hay được ghi lại càng
ít
Cần lưu ý rằng ảnh vân tay không đơn giản là ảnh của các đường hai màu đen và trắng Bởi có sự khác biệt của những lần ấn ngón tay tẩm mực lên giấy cũng như chính cấu trúc và màu sắc của mực và giấy, nên một ảnh vân tay gốc sẽ chứa nhiều cấp độ
Trang 23- 22 – xám khác nhau Và dĩ nhiên là những dấu vết của hiện trường vụ án cũng thậm chí không hoàn toàn rõ ràng đen, trắng
Như vậy việc số hóa sẽ phải đo cả cấp độ xám của mỗi điểm ảnh và gán cho chúng một con số Những điểm đen sẽ gán giá trị 0, còn vùng hoàn toàn trắng có giá trị 255 Còn những mức độ xám khác nhau sẽ được gán bằng những con số trong khoảng giữa
2 giá trị trên Nói một cách khác, một điểm ảnh vân tay sẽ có giá trị từ 0 đến 255
Cải thiện và làm sạch ảnh
Trước khi trích chọn được các đặc điểm của đường vân, ảnh vân tay phải được làm sạch Và một phần của quá trình này là chuyển đổi chúng về ảnh nhị phân hay ảnh đen trắng, tức là một hình thức lý tưởng hóa, không có trong thực tế Với một số lý do nào đó, chủ yếu liên quan đến cường độ chiếu sáng khác nhau trên ảnh khi thu nhận, việc chuyển đổi này sẽ không đơn giản là coi những điểm có giá trị trên một ngưỡng nào đó (ngưỡng toàn phần) là trắng còn các điểm khác là đen Một thủ tục khá dài và phức tạp thực hiện như sau
Ảnh vân tay một lần nữa được chia thành các khối hình vuông, nhưng lần này là các khối lớn hơn, khoảng 20 khối trên một inch của ảnh Chương trình mã hóa sẽ ước lượng hướng trung bình của phần đường vân trong mỗi khối, và bỏ trắng nếu hướng không xác định được Một quy trình khác sẽ kiểm tra hướng của tất cả các đường vân này, và sẽ loại bỏ hoặc sửa đổi những chi tiết vụn vặt, dựa theo đường chạy của đường vân thực
Chương trình mã hóa kiểm tra sơ đồ các hướng đường vân, và ảnh số vân tay gốc, cũng như các thông tin thu được khác để xóa bỏ các vết đứt trên đường vân (chẳng hạn như một vết sẹo dài) hay các nhiễu nhìn thấy được Với các thao tác xử lý như vậy, ta
có thể đưa ra một ảnh vân tay nhị phân đã được làm sạch
/ / / | \ \ \ \ / / / — \ \ \ \ / / / — — — \ \ / / / — — \ \ \
⁄ ⁄ — — | \ \ \
⁄ — — ⁄ ⁄ \ \ \
⁄ — ⁄ ⁄ \ \ \ \
⁄ — ⁄ ⁄ \ \ \ \
Trang 24- 23 – Sau đây là thí dụ về kết quả cải thiện ảnh và chuyển đổi sang dạng nhị phân:
Hình 1.19: Kết quả xử lý biến đổi nhị phân hóa từ ảnh vân tay đa cấp xám (bên trái)
để đạt được ảnh vân tay nhị phân (bên phải)
Định vị các đặc điểm chi tiết
Bộ mã hóa sau đó được dùng để kiểm tra độ trơn của các đường vân và định vị những điểm rẽ nhánh hoặc kết thúc Hệ thống vẽ, đánh dấu các đặc điểm của những đường vân này trên một sơ đồ, có chú giải hướng của các đường vân liên thuộc và đo khoảng cách giữa các đặc điểm chi tiết tới điểm chuẩn (tâm điểm) Chương trình mã hóa khi bắt đầu xây dựng sơ đồ đặc điểm được thực hiện một cách tự nhiên song ở công đoạn sau cần xem xét lại và nếu thấy nghi ngờ thì sẵn sàng bỏ qua
Công đoạn cuối cùng là xem xét lại từng đặc điểm, bắt đầu từ trái sang phải của ảnh vân tay, ghép chúng với năm điểm láng giềng gần nhất bên phải và tạo thành các
nhóm điểm đặc trưng Đặc điểm đầu tiên của nhóm được gọi là điểm sơ cấp còn năm điểm láng giềng liên đới được gọi là điểm thứ cấp (trong sơ đồ ở đây mỗi điểm sơ cấp
được ghép với chỉ ba điểm thứ cấp, để làm cho sơ đồ đỡ phức tạp) Những điểm thứ
1 nhóm gồm 1 điểm sơ cấp và 3 điểm thứ cấp
Trang 25- 24 – cấp của tất cả các nhóm trừ những điểm mà ở cạnh phía bên phải của dấu vân tay thì bản thân chúng lại là những điểm sơ cấp của các nhóm tiếp theo Kết quả của việc phân nhóm này là tạo thành một mạng lưới liên kết các đặc điểm và tạo thành các đường kết nối
Đó chính là các bộ mã vân tay của hệ thống AFR, đã nói ở trên, nó bao gồm vị trí
và loại các đặc điểm (điểm kết thúc hoặc điểm rẽ nhánh), độ nghiêng lệch của các đặc điểm cùng với số đếm vân mà mỗi đường kết nối đi qua
Sau khi kết thúc quá trình mã hóa, bộ mã sẽ được lưu trữ trong cơ sở dữ liệu và ảnh gốc có thể tạm thời loại bỏ Thường không có cách nào có thể khôi phục lại ảnh gốc từ bộ mã của AFR nên hầu hết các hệ thống của AFR lưu trữ ảnh trong một bộ hồ
sơ khác, để các nhân viên vân tay có thể tìm kiếm khi cần chẳng hạn để đối chiếu chỉ bản so sánh với chỉ bản các đối tượng trong danh sách kết quả tra cứu
Đối sánh
Thủ tục đối thường rất phức tạp; chương trình máy tính phải tiến hành rất nhiều vòng lặp, cái nọ lồng trong cái kia Rất khó để hiểu rõ các thủ tục này Sau đây là một phần của thủ tục đối sánh được thường được thực hiện
Khảo sát ban đầu
Ta hãy xét một phép so sánh một mẫu đang cần tra cứu với mẫu khả nghi nhất đã
có sẵn trong CSDL Bước đầu tiên là so sánh từng đặc điểm trên mẫu cần kiểm tra với mỗi đặc điểm của mẫu khả nghi, coi chúng như các đối tượng so sánh riêng biệt, hay nói cách khác ta lờ đi các mối liên kết giữa chúng với nhau Nếu điểm trên mẫu khả nghi ở cùng vị trí so với tâm giống như điểm ở trên mẫu đang cần kiểm tra thì điểm trên mẫu khả nghi sẽ được ghi nhận như là một trường hợp đối sánh có khả năng nhất Thông thường có rất nhiều trường hợp như vậy nhưng hệ thống chỉ ghi nhận sáu điểm trên mẫu khả nghi giống nhất tương ứng với sáu điểm trên mẫu đang cần kiểm tra Nếu có tồn tại các điểm đặc trưng trên hai mẫu kiểm tra được xác định là hoàn toàn khác nhau ngay cả sau khi đã mở rộng dung sai, bộ đối sánh sẽ quyết định hai mẫu vân này không có khả năng sánh được với nhau và sẽ không tiếp tục xử lý nữa
Trang 26- 25 –
Đối với trường hợp của dấu vết hiện trường, cần phải có quá trình kiểm tra sơ bộ trước khi tiến hành khảo cứu ban đầu Trường hợp những dấu vết hiện trường được thu thập không đúng hướng chuẩn thì hệ thống sẽ xoay lại theo hướng chuẩn giúp cho việc
sử dụng lược đồ kiểm tra ban đầu được chính xác nhất
Kiểm tra mối liên hệ đầu tiên
Nếu mẫu khả nghi thỏa mãn điều kiện kiểm tra ban đầu, hệ thống sẽ chọn điểm đầu tiên trên mẫu cần kiểm tra (điểm gần phía bên trái ảnh nhất) và so sánh với những điểm trên mẫu khả nghi Như đã nói ở trên ứng với mỗi điểm trên chỉ bản yêu cầu, hệ thống sẽ giữ lại sáu cặp điểm tương ứng trên mẫu chỉ bản tìm thấy
Điểm tra cứu đầu tiên là đặc điểm sơ cấp và được nối với năm điểm lân cận gần nhất, hay nói cách khác là 5 đặc điểm thứ cấp nằm phía bên phải của nó Tất nhiên, mỗi trong số sáu đặc điểm tương ứng trên mẫu khả nghi cũng phải được nối với năm điểm lân cận gần nhất của nó Có thể có một đoạn nối (giữa điểm chọn với năm điểm lân cận) hoặc không đoạn nối nào trên mẫu khả nghi giống với đoạn nối trên mẫu đang cần kiểm tra Vì vậy hệ thống sẽ đối chiếu đoạn nối giữa điểm sơ cấp với điểm láng giềng gần nhất bên phải của nó trên mẫu cần kiểm tra và mẫu khả nghi tương ứng
Độ dài của đường nối cũng như là góc giữa điểm sơ cấp và điểm thứ cấp gần nhất bên phải của nó được đo trên mẫu cần tra cứu Số đếm vân của đoạn nối đó và các góc lệch tương đối giữa điểm sơ cấp và các điểm thứ cấp cũng sẽ được xác định Các số đo tương ứng trên mẫu nghi vấn cũng được tính và một độ đo sự giống nhau giữa các độ dài và các góc sẽ được qui thành một điểm số Nếu các điểm số này gần giống nhau, trong một dung sai cho phép, lúc đó đoạn nối này được coi là ―vượt qua vòng kiểm tra‖ và hệ thống sẽ tiếp tục so sánh tương tự như thế với điểm sơ cấp tương ứng có thể tiếp theo trên mẫu vân tình nghi Có thể phải tiến hành so sánh đến 6 lần
Trang 27- 26 –
có tới sáu phép so sánh cần thực hiện Theo cách đó, tất cả năm đoạn kết nối trong nhóm giữa một điểm sơ cấp với năm điểm đặc trưng thứ cấp sẽ đều được so sánh Những điểm số của những đoạn kết nối ―chấp nhận được‖ trên mẫu nghi vấn, tức
là nó ở trên một ngưỡng nhất định, thì được lưu trữ trong một bảng liên thuộc với nhóm này được gọi là bảng nhóm (group table) và một điểm số chung cho toàn nhóm cũng sẽ được tính, gọi là điểm nhóm
Như vậy đặc trưng thứ nhất của mẫu yêu cầu đã được xử Bộ đối sánh bây giờ tiếp tục chuyển sang xử lý điểm đặc trưng tiếp theo và cứ như vậy thực hiện cùng một phép
so sánh như trên cho đến khi duyệt hết toàn bộ chỉ bản yêu cầu và gom góp được một
số lượng lớn các bảng nhóm và các điểm nhóm được tính
Đến lúc này hệ thống đã làm việc với điểm đầu tiên trên mẫu cần kiểm tra Sau đó
hệ thống sẽ tiếp tục làm việc với những điểm khác của mẫu cần kiểm tra tiến hành Nhiệm vụ cuối cùng của bước này là hệ thống sẽ đánh giá toàn bộ điểm của các nhóm và loại bỏ những nhóm có điểm số thấp hơn mức định trước Trong thực tế, phần còn lại của quá trình đối sánh chủ yếu ưu tiên vào việc loại bỏ các nhóm không đạt tiêu chuẩn để cuối cùng chỉ còn lại sự tương ứng 1-1 giữa mỗi nhóm trên mẫu tra cứu với từng nhóm trên mẫu nghi vấn
Các mối liên kết
Cho đến lúc này hệ thống chỉ mới xử lý các nhóm như những chủ thể riêng biệt
Để xem xét các mối liên kết, hệ thống sẽ xem xét lần lượt từng Bảng nhóm để xem liệu có cặp điểm thứ cấp nào không (là cặp điểm gồm một điểm ở mẫu cần tra cứu và một điểm ở mẫu nghi vấn) xuất hiện trên nhóm tiếp theo như là một cặp của điểm sơ cấp Hệ thống sẽ giảm số lượng các đặc trưng và các đoan nối cần phải xử lý, đầu tiên bằng cách loại bỏ tất cả những điểm thứ cấp không nối với các điểm sơ cấp tiếp theo
và sau đó loại bỏ tất cả các nhóm mà có từ 3 hoặc nhiều hơn các điểm thứ cấp bị loại
bỏ Lúc này chỉ còn lại những nhóm có điểm số cao được kết nối với những nhóm có điểm số cao khác Tất cả những nhóm có điểm số thấp và những nhóm biệt lập đã bị loại bỏ
Trang 28- 27 – Sau đó hệ thống sẽ ―tỉa tót‖ mạng liên kết gọn hơn nữa bằng việc cho điểm đối với nhiều tổ hợp kết nối và gán điểm cục bộ trong mỗi nhóm Sau đó một lần nữa các nhóm điểm thấp sẽ bị loại bỏ sao cho đến giai đoạn này chỉ còn lại khoảng 200 nhóm hoặc ít hơn nữa
Tính điểm đối sánh tổng thể
Bước cuối cùng hệ thống sẽ loại bỏ tất cả các trường hợp trừ những nhóm có quan
hệ liên kết tốt nhất trên mẫu nghi vấn Hệ thống tiến hành việc này bằng việc tính tổng lũy tiến các điểm số liên kết cục bộ của mỗi nhóm, và bắt đầu duyệt từ trái sang phải
và sau đó từ phải sang trái trên toàn vân tay và chỉ giữ lại trường hợp có điểm số cao nhất Sau các lần kiểm tra lại như vậy, những liên kết còn lại lại được tính điểm một lần nữa và cuối cùng điểm số đối sánh tổng thể được tính bằng tổng các điểm mới này Đấy là toàn bộ quá trình đối sánh mạng các đặc điểm đặc trưng trên mẫu tra cứu với mạng các đặc điểm đặc trưng trên từng mẫu nghi vấn và tính ra được một điểm số thể hiện mức độ trùng khớp, quá trình đó được gọi là một quá trình so sánh
Khi hệ thống tiến hành tìm kiếm trên cơ sở dữ liệu, tại mỗi phép so sánh mà nó tiến hành hệ thống sẽ ghi lại điểm số trùng khớp Khi kết thúc việc tìm kiếm, nó sẽ liệt
kê số chỉ bản đối tượng tham chiếu cùng với các điểm số đạt được và hiển thị danh sách này theo điểm số giảm dần Thông thường, phụ thuộc vào một số điều kiện hoạt động nào đấy, thì các chuyên gia khảo cứu dấu vân tay thường mong muốn chỉ xử lý một số đối tượng có điểm số cao nhất, bởi vậy họ hạn chế số lượng các chỉ bản trong danh sách
1.3 TÌNH HÌNH NGHIÊN CỨU, ỨNG DỤNG CÁC HỆ THỐNG NHẬN DẠNG VÂN TAY TỰ ĐỘNG TRÊN THẾ GIỚI VÀ NƯỚC TA
Công nghệ nhận dạng vân tay tự động nói chung trên thế giới đã được nghiên cứu phát triển từ khá lâu Ngay từ những năm sáu mươi của thế kỷ trước nhiều hệ thống đã được đưa vào hoạt động tại hàng trăm cơ quan cảnh sát trên thế giới Phổ biến nhất vẫn là sản phẩm của ba công ty lớn, đó là Morpho của Pháp, NEC của Nhật, và PRINTRAK của Mỹ Nhiều ứng dụng được triển khai theo nhiều qui mô khác nhau, từ hàng triệu bản ghi (NEWYORK, TOKYO, Cảnh sát CANADA) đến các hệ qui mô nhỏ hàng nghìn bản ghi Ngoài các hãng lớn trên, ở nhiều nước, người ta cũng đã tự xây dựng các hệ AFR dùng riêng cho cơ quan cảnh sát của họ
Ở nước ta, từ những năm 90, cơ quan cảnh sát cũng đã nhập, và đưa vào sử dụng
hệ thống nhận dạng vân tay Morpho AFIS của hãng SAGEM của Pháp Qua 10 năm
sử dụng đã xây dựng và đưa vào khai thác một cơ sở dữ liệu qui mô 1,3 triệu chỉ bản, trong khi nhu cầu thực tế ở Trung ương phải xây dựng được CSDL khoảng 3 triệu chỉ bản Còn tại hầu hết các địa phương, công việc phân loại và tra cứu vân tay tội phạm chủ yếu hiện nay vẫn phải thực hiện bằng phương pháp thủ công Việc mở rộng hệ
Trang 29- 28 – thống để ứng dụng cho qui mô cả nước sẽ cần phải đầu tư tiếp rất nhiều ngoại tệ và chắc chắn nếu tiếp tục nhập ngoại sẽ càng ngày càng bị lệ thuộc nhiều hơn vào công nghệ nước ngoài
Để nâng cao tính chủ động công nghệ, Bộ Công an đã chủ trương và tạo điều kiện cho Phòng Thí nghiệm Mô phỏng và Tích hợp hệ thống phát huy nội lực để tự xây dựng cho Công an Việt Nam một sản phẩm AFIS dùng cho toàn ngành Được tạo điều kiện về cơ sở vật chất khá thuận lợi, Nhóm tác giả thuộc Phòng Thí nghiệm Mô phỏng và Tích hợp hệ thống đã cho ra đời một sản phẩm AFIS mang tên C@FRIS Sản phẩm C@FRIS được xây dựng dưa trên các nguyên lý phổ biến của một hệ nhận dạng vân tay, có đầy đủ tính năng cơ bản như:
- Tra tìm, đối sánh chỉ bản 10 ngón trên CSDL chỉ bản 10 ngón, để dùng cho mục đích xác minh căn cước
- Tra tìm, đối sánh dấu vết hiện trường theo các chế độ: dấu vết với chỉ bản, chỉ bản với dấu vết và dấu vết với dấu vết để dùng cho mục đích điều tra các vụ án
Ngoài ra, sản phẩm này cho phép trao đổi dữ liệu vân tay số hóa với hệ MORPHO AFIS của hãng SAGEM cũng như với các hệ AFIS nổi tiếng khác Nhờ tính chất phù hợp chuẩn này, nhiều kết quả trung gian của các hệ AFIS có thể chuyển đổi qua lại cho nhau và mỗi sản phẩm thành phần của nó cũng là một sản phẩm có thể tham gia hội nhập quốc tế
Sản phẩm C@FRIS là một hệ thống thống nhất được hợp thành từ một số phân
hệ chủ yếu sau đây:
+ Phân hệ “Nhập và mã hoá chỉ bản 10 ngón” có nhiệm vụ nhập chỉ bản từ các
loại scanner tiêu chuẩn, nhập các thông tin thuộc tính và tự động cắt ảnh chỉ bản thành mười ngón riêng rẽ, xử lý trích chọn đặc điểm, đánh giá chất lượng ảnh và xử lý nén khoảng 15 lần để lưu vào CSDL gốc Qua một số lần cải tiến, phân hệ này đến nay có thể đạt công suất nhập liệu 500 chỉ bản/ngày/máy Nếu dùng loại scanner cao tốc, công suất này còn có thể nâng lên đến 1000 chỉ bản/ngày/máy Việc xử lý trích chọn đặc điểm được thực hiện hoàn toàn tự động với tốc độ 10.000 đối tượng/ngày/máy
Tuy nhiên, cũng như hầu hết các hệ AFIS hiện nay, chẳng hạn hệ SAGEM MORPHO AFIS, phân hệ này còn có hạn chế là chưa ứng dụng giải pháp xử lý phân mảnh ảnh và tự động nhận biết dạng cơ bản Ảnh các ngón cắt ra từ chỉ bản 10 ngón cần được cắt hợp lý hơn nữa Việc nhập số chỉ bản đối tượng và phân loại dạng cơ bản vẫn còn phải tiến hành tương tác, không kiểm soát được độ chính xác Vì vậy, việc tự động hóa các thao tác đọc số đối tượng dùng mã vạch, tự động hóa phân mảnh chỉ bản, nhận dạng dạng cơ bản và kiểm tra vị trí các ngón vẫn là một yêu cầu bức thiết
Trang 30- 29 –
+ Phân hệ “Kiểm tra chất lượng mã hoá và Biên tập ”: Sau giai đoạn nhập dữ
liệu ảnh và mã hoá, trích chọn đặc điểm tự động, những chỉ bản có chỉ số chất lượng dưới một ngưỡng xác định được sàng lọc để đưa ra kiểm tra chất lượng, biên tập, chỉnh sửa trực tiếp trên màn hình
+ Phân hệ “CSDL”: Để tránh phải duyệt tìm trên toàn bộ CSDL chỉ bản người ta
phân loại dữ liệu và tổ chức CSDL thành nhiều bảng dẫn xuất áp dụng kỹ thuật đánh chỉ số phân cấp, vừa giải quyết được việc tăng tốc truy xuất dữ liệu, vừa nâng cao khả năng quản lý CSDL dung lượng lớn của hệ thống Việc đánh chỉ số CSDL chỉ bản vân tay vẫn là một nội dung nghiên cứu thu hút sự quan tâm của nhiều nhà nghiên cứu Muốn nâng cao độ tin cậy và khả năng quản lý CSDL dung lượng lớn lên tới hàng chục triệu chỉ bản của hệ thống cần phải có phương pháp đánh chỉ số tốt
Hình 1.20: Màn hình chính của Phân hệ Nhập và mã hóa chỉ bản (10 ngón)
+ Phân hệ “Tra tìm, Đối sánh”: Để xác minh căn cước, hệ thống hoàn toàn có
khả năng đáp ứng bốn dạng yêu cầu chủ yếu sau: (1) Xác minh theo chỉ bản 10 ngón, (2) Xác minh theo họ tên, ngày tháng năm sinh, (3) Xác minh theo dạng cơ bản 10 ngón, kiểm chứng theo 2 ngón trỏ hoặc theo hai ngón cái (4) Xác minh theo số căn cước Ngoài ra, phân hệ này còn đảm bảo việc phân loại và kiểm tra thường xuyên trên từng nhóm phân loại, nhằm sàng lọc để loại bỏ trùng thừa, đảm bảo mỗi đối tượng chỉ được cấp một số căn cước duy nhất Qui trình tra cứu xác minh căn cước được thực hiện tương tự như khi cập nhật bổ sung chỉ bản vào hệ thống, bắt đầu bằng việc quét chỉ bản 10 ngón bằng scanner hoặc bằng các thiết bị lăn tay sống (booking station), xử
lý trích chọn đặc điểm và tra tìm trên CSDL, trường hợp tìm thấy thì thông báo kết quả tra tìm được số căn cước đã cấp, cập nhật thông tin liên quan, trường hợp không tìm thấy thì thông báo chưa cấp và sẽ được cấp số căn cước mới, khởi tạo hồ sơ mới
Trang 31- 30 – Năm 2004, hệ thống C@FRIS đã được đưa vào triển khai ứng dụng thử nghiệm tại Phòng hồ sơ nghiệp vụ cảnh sát Công an Hà Nội Một mạng LAN gồm 7 máy trạm, một máy chủ, trong đó khoảng 5 máy trạm + 5 scanners thường xuyên làm nhiệm vụ quét và mã hoá chỉ bản với công suất mỗi máy trạm 500 chỉ bản/ngày, 2 máy trạm làm nhiệm vụ biên tập và kiểm tra chất lượng mã hóa kiêm tra cứu, xác minh căn cước Sau chỉ 3 tháng triển khai, hệ thống đã nhập và mã hoá được 101.500 chỉ bản 10 ngón của số đối tượng có nhiều tiền án tiền sự đã được cấp số và lập hồ sơ Với công suất này, nếu trang bị cho mỗi quận huyện một bộ thiết bị như trên, công đoạn nhập chỉ bản
và mã hoá của 3 triệu công dân TP Hà Nội chỉ giải quyết trong khoảng thời gian từ 9 -
12 tháng
Hình 1.21: Màn hình chính của phân hệ Tra tìm, Đối sánh
(Bên trái là chỉ bản cần tra tìm, bên phải là kết quả tra tìm được)
Qua tra cứu thử 250 yêu cầu nhập vào từ các chỉ bản chọn ngẫu nhiên trong số chỉbản đã đăng ký, hệ thống đã đạt được tốc độ tra cứu nhanh: 15 s/1 yêu cầu với tỷ lệ tìm thấy cao: 99.7 %
Hệ thống C@FRIS hiện nay đang được tiếp tục cải tiến và nâng cấp theo hướng vừa nâng cao độ chính xác nhận dạng vừa nâng cao hiệu năng tính toán để có đủ khả năng tổ chức quản lý CSDL cỡ hàng chục đến hàng trăm triệu chỉ bản, đáp ứng kịp thời đòi hỏi của công tác tự động hóa hệ thống tàng thư căn cước công dân và hệ thống tàng thư căn cước can phạm qui mô cả nước
***
Trang 32- 31 –
CHƯƠNG II
PHƯƠNG PHÁP PHÂN MẢNH ẢNH CHỈ BẢN 10 NGÓN, PHÂN LOẠI VÂN TAY VÀ KIỂM TRA VỊ TRÍ CÁC NGÓN
2.1 BÀI TOÁN PHÂN MẢNH ẢNH VÂN TAY TỰ ĐỘNG
2.1.1 Khái niệm về phân mảnh ảnh
Trong các hệ thống nhận dạng ảnh nói chung, phân mảnh ảnh (image segmentation) là một bước xử lý rất quan trọng Nhiệm vụ của thuật toán phân mảnh ảnh là quyết định vùng ảnh nào thuộc vùng cần quan tâm, vùng ảnh nào thuộc vùng nền bao quanh và vùng ảnh nào thuộc vùng biên hay nhiễu của ảnh Việc xác định vùng vân chính xác không chỉ đơn thuần là thu nhỏ kích thước ảnh, giảm thiểu bộ nhớ
mà còn góp phần vào việc đánh giá, sàng lọc các điểm đặc trưng trích chọn được trên ảnh Hầu hết các thuật toán trích chọn các điểm đặc trưng đều trích chọn sai khi gặp vùng nhiễu và vùng biên của ảnh Bởi vậy, các thuật toán phân mảnh hoạt động tốt sẽ góp phần loại bỏ được các sai sót đó Trong giai đoạn đối sánh ảnh thông qua các bộ điểm đặc trưng cũng vậy, nếu loại được các điểm đặc trưng trích chọn sai thì hiệu quả đối sánh cũng sẽ tốt hơn
Phân mảnh ảnh chỉ bản vân tay 10 ngón mà luận văn này đề cập là một ứng dụng của kỹ thuật phân mảnh ảnh cho trường hợp cụ thể đang đặt ra đối với hệ C@FRIS Nhiệm vụ đặt ra là phát hiện và tách vùng đường vân của các đầu ngón tay ra khỏi vùng nền trên các ô của chỉ bản 10 ngón Công việc này là cần thiết, một mặt nhằm thay thế thao tác thủ công trong khi quét ảnh, cắt ảnh, mặt khác nhằm thu hẹp vùng xử
lý trên ảnh vân tay Nhờ đó, vừa có thể giảm thiểu được thời gian nén, thời gian truyền ảnh cũng như dung lượng lưu trữ trong cơ sở dữ liệu, vừa có cơ sở để đánh giá và tuyển chọn các đặc trưng trích chọn trên vùng ảnh quan tâm Vì vậy, việc phân mảnh ảnh góp phần nâng cao độ chính xác, tăng hiệu quả thuật toán trích chọn đặc trưng và đối sánh Hơn nữa, kỹ thuật phân mảnh khi được áp dụng để phân vùng chỉ bản giấy
và chỉ bản lăn tay sống sẽ nâng cao trình độ tự động hóa, năng suất nhập liệu, và cuối cùng là đem lại hiệu quả chung cho toàn hệ thống
Trong luận văn này ta sẽ chọn một cách tiếp cận mới để giải quyết bài toán phân mảnh chỉ bản vân tay 10 ngón Phương pháp đề xuất bao gồm hai công đoạn: Công đoạn phân mảnh thô chỉ bản vân tay 10 ngón thành các các ảnh con riêng rẽ và phân mảnh mịn hơn dựa trên kỹ thuật véc tơ hóa đường biên, làm trơn đường biên bằng phương pháp xấp xỉ tuyến tính từng đoạn và gán giá trị phân loại vùng vân cho từng ô vuông trên ảnh Phương pháp được đề xuất dựa trên một số nhận xét dưới đây:
- Ảnh các dòng đường nét có tính xen kẽ giữa vân và rãnh như vân tay thường tuân thủ luật cân bằng trắng đen, tức là nếu ta phân ngưỡng địa phương thích hợp thì tổng số điểm trên rãnh vân cũng gần xấp xỉ với số điểm trên đường vân do tính xen kẽ
Trang 33- 32 – giữa các dòng vân và các dòng rãnh Điều này cho phép tiến hành biến đổi ảnh vân tay
đa cấp xám thành ảnh vân tay nhị phân dùng ngưỡng địa phương
- Nếu tiến hành véc tơ hóa đường biên ảnh nhị phân và xấp xỉ tuyến tính từng đoạn các đường biên dò được ta sẽ thu được đường cong dưới dạng đa tuyến (polyline) Do các vùng nhiễu thường thể hiện bằng các đoạn đường biên phức tạp, có nhiều đoạn ngắn chạy ngoằn ngoèo, còn các vùng vân chất lượng tốt thường có các đoạn biên dài, thẳng hoặc nhiều đoạn kế tiếp nhau đổi hướng đồng đều, nên nếu kết hợp vừa véc tơ hóa đường biên, vừa xấp xỉ tuyến tính từng đoạn rồi sau đó tính hướng, tính góc đổi hướng cho từng đoạn đường biên và chọn ra những đoạn biên đặc trưng cho vùng vân chất lượng tốt Các đoạn biên tốt là đoạn thẳng đủ dài (trên một ngưỡng xác định, 3 bước vân chẳng hạn) hoặc nhiều đoạn thẳng kế tiếp nhau đổi hướng đều
- Bằng kỹ thuật tính vùng đệm cho các đoạn biên tốt theo một bán kính chừng 1 buớc vân ta có thể lần lượt phân loại và gán nhãn cho từng pixel trên ảnh vân tay thuộc vùng vân tốt hay không Phương pháp này còn giúp cập nhật được hướng vân cho ma trận hướng, một đầu ra rất hữu ích cho các bước trích chọn đặc điểm chi tiết về sau
2.1.2 Bài toán phân mảnh ảnh chỉ bản vân tay tự động
Bài toán được phát biểu như sau: Cho một chỉ bản vân tay 10 ngón như hình dưới đây:
Hình 2.1: Mẫu chỉ bản vân tay 10 ngón
Hãy xây dựng thuật toán tự động định vị và tách từ chỉ bản vân tay 10 ngón thành
22 vùng riêng rẽ như sau: 2 vùng ảnh chứa mã vạch và phần đầu chỉ bản; 10 vùng ảnh cho 10 ngón lăn, 10 vùng cho 10 ngón ấn (gồm 2 vùng nhỏ cho 2 ngón cái phải, cái trái và 4 vùng lưu 4 ngón chụm trái và 4 vùng cho 4 ngón chụm phải)
Bài toán phân mảnh ảnh chỉ bản 10 ngón hoàn toàn không đơn giản như chúng ta nghĩ Trên thực tế có một số chỉ bản dùng giấy chất lượng quá thấp, cũ kỹ, thậm chí có những chỉ bản dùng giấy nền màu tím, màu xanh, trên đó còn nhiều vết nhiễu như: các
số hiệu phân loại, vết mực bẩn, các vết linh tinh khác
Trang 34- 33 –
Hình 2.2: Mẫu chỉ bản vân tay 10 ngón chất lượng kém
Không những đối với chỉ bản giấy truyền thống, mà bài toán phân mảnh ngay cả với chỉ bản thu nhận bằng thiết bị vân tay sống cũng đang là một vấn đề thời sự mà thế giới đang quan tâm Nội dung của những bài toán phân mảnh này nhằm tách phần 2 ngón cái và phần 4 ngón lăn đồng thời thành từng ngón riêng rẽ khi lập chỉ bản vân tay sống tại các trạm đăng ký, kiểm tra thị thực nhập cảnh
Viện Tiêu chuẩn và Công nghệ Mỹ đã đưa ra đặc tả kỹ thuật để tổ chức đánh giá các thuật toán phân mảnh như sau:
Đầu vào: ảnh nhiều (4) ngón, format: *.wsq hoặc uncompressed raw data (không có
header) Độ phân giải cả chiều ngang và chiều dọc = 500 dpi Kích thước ảnh đầu vào tối đa: 83.8 mm x 76.2 Ngoại lệ có thể có một ít ảnh lên tới 4 inch (2000 pixels).Tên tệp dưới dạng command lines: /share/data/slap999.wsq hay slap999.wsq
Các tham số đầu vào:
+ Chỉ số bàn tay: R: tay phải; L: tay trái; U: không xác định
+ Nguồn thu nhận: L: livescan, P: chỉ bản giấy; U: không xác định
+ Đường dẫn đầu ra: Thư mục đầu ra
+ Tên tệp vân tay ấn (slap): có thể có thêm tham số chiều cao, chiều rộng ảnh
(nói chung là dưới dạng tường minh command lines)
Thí dụ minh họa:
Linux:
Segment –h ID –s Source [-o Dir] image.wsq
Hoặc:
Segment –h ID –s Source [-o Dir] image.wsq HEIGHT WIDTH
h ID: L, R ỏ U tay trái, tay phải hay không xác định tay nào;
s SOURCE: L, P hoặc U;
0 DIR: thư mục đầu ra chứa kết quả phân mảnh (các files segmented);
image.wsq: File ảnh với khuông dạng WSQ;
image.raw HEIGHT WIDTH
Các tham số đầu ra:
Trang 35- 34 – File ảnh kết quả phân mảnh: được lưu ở khuôn dạng RAWDATA, grayscale 1 pixel 8 bit, độ phân giải giữ nguyên như ảnh đầu vào BLACK: 0; WHITE: 255; dòng ảnh từ trái qua phải, từ trên xuống dưới
Tên file ảnh đầu ra:
Tên ảnh để ở thư mục hiện hành và nối theo 2 tham số:
Vị trí mảnh: A, B, C, D, E
Vị trí ngón:
Số TT Nhãn
00 U không xác định 06 LT cái trái
File lưu thông tin về các ảnh kết quả (meta information file)
Qui ước đặt tên: lấy cùng tên file đầu ra, đổi đuôi file thành * nsm File txt này chứa các cặp giá trị thuộc tính, mỗi giá trị một dòng, tối thiểu phải có các cặp giá trị thuộc tính sau đây:
OUTPUT_ROTATED = (TRUE or FALSE) : có quay so với bản đầu vào hay không BOUNDINDBOX=(X,Y) topleft , (X,Y)topright, (X,Y)bottomleft, (X,Y)bottomright Tọa độ pixel của 4 góc ảnh được cắt trên ảnh đầu vào
Thí dụ:
PIX_HEIGHT = 200
PIX_WIDTH = 120
Trang 36- 35 – SEG_QUAL = 0.82;
1 không đọc được file đầu vào 12 chỉ 2 ngón được phân vùng
2 không mở được hoặc không giải
nén được file WSQ đầu vào 13
So với bài toán phân mảnh chỉ bản vân tay sống trên đây, bài toán phân mảnh chỉ bản vân tay trên giấy phức tạp hơn nhiều Do đó, nếu giải được vấn đề phân mảnh tự động ảnh vân tay trên giấy thì cũng sẽ giải quyết được vấn đề phân mảnh vân tay sống nói trên
Hiện nay, đa số phần mềm quét nhập chỉ bản thường hoạt động theo các bước sau: 1- Quét chỉ bản vân tay 10 ngón, kết quả là một ảnh số 256 mức xám, độ phân giải
Trang 37- 36 – Ảnh của mười ngón trên được chương trình xử lý tách tự động thành 10 ảnh của từng ngón riêng biệt và lưu trữ trên cơ sở dữ liệu Nhưng việc tách này vẫn được thực hiện bằng cách chia đều vùng 10 ngón trên thành 2 dòng và 5 cột Kết quả là các ô hình chữ nhật trên chỉ bản được thể hiện sau khi cắt như sau:
Hầu hết các hệ thống nhận dạng vân tay tự động trên thế giới như AFIX TRACKER, MORPHO AFIS đều phân tách ảnh chỉ bản vân tay theo cách thức trên Như ta thấy, cách cắt ảnh này vẫn còn nhiều hạn chế, nó để lại nhiều vùng dư thừa trên ảnh, trên đó thường có nhiều vết bụi bẩn Nếu đưa ra được cách cắt ảnh hợp lý hơn, sẽ góp phần tiết kiệm được ít nhất 1/3 dung lượng lưu trữ của mỗi ngón và loại bỏ được các vết bẩn trên vùng nền Không những tiết kiệm được về dung lượng ảnh mà việc phân mảnh còn ảnh hưởng trực tiếp đến chất lượng bộ điểm đặc trưng trích chọn được
(a) Bộ đặc điểm chất lượng kém
(trường hợp vùng nền có nhiều nhiễu tạp)
(b) Bộ đặc điểm chất lượng tốt (trường hợp vùng nền không có nhiễu)
Do vậy, cần phải cải tiến công đoạn cắt ảnh này theo hướng ứng dụng các phương pháp phân mảnh để tự động phân vùng và tách các ngón trên chỉ bản 10 ngón sao cho với mỗi ảnh của một ngón tay riêng rẽ được tách ra chỉ gồm vùng ảnh còn vùng nền sẽ
bị loại bỏ
Trang 38- 37 –
(a)
(b)
Hình 2.3: (a) Ảnh vân tay ban đầu, (b) Kết quả phân mảnh: Vùng nền đã bị cắt xén bớt
2.1.3 Một số giải thuật phân mảnh ảnh
Hiện nay đã có rất nhiều bài báo quan tâm đến vấn đề phân mảnh ảnh Nhiều tác giả đã đưa ra các giải thuật để phân mảnh ảnh khác nhau, mỗi giải thuật đều có các ưu nhược điểm và đạt được một số kết quả nhất định Chẳng hạn là giải thuật phân mảnh ảnh của Liu Jixiang dựa trên năng lượng của các ảnh sau khi lọc Gabor [18], giải thuật phân mảnh dựa trên sự biến đổi của trường hướng trong các ô vuông của một số tác giả [19], giải thuật phân mảnh ảnh của Lin Hong dựa trên độ chắc chắn của trường hướng [20]
Thuật toán phân mảnh ảnh của Liu Jinxiang
Liu Jinxiang đã đưa ra giải thuật phân mảnh gồm những bước sau đây:
- Cải thiện, làm sạch ảnh bằng bộ lọc Gabor
- Phân mảnh ảnh dựa trên các ảnh năng lượng của các ảnh sau khi lọc
Cải thiện ảnh dùng bộ lọc Gabor
Vân tay là một kết cấu có hướng, và mức xám của ảnh vân tay trên một mặt vuông góc với đường vân là biến đổi theo dạng hình sin theo một tần số nhất định Bộ lọc Gabor là bộ lọc có thể điều chỉnh theo hướng và theo miền tần số là thích hợp với lớp bài toán về vân tay nhằm loại bỏ nhiễu và khôi phục lại cấu trúc đường vân Khi phân tích phổ của ảnh vân tay, phổ của ảnh tập trung xung quanh gốc toạ độ theo một hình vành khăn trong một dải tần số nhất định, các thành phần tần số nằm ngoài hình vành khăn đó là của nhiễu trong ảnh vân tay
Trang 39- 38 –
Vì vậy, giải thuật của Liu dùng bộ lọc Gabor như một bộ lọc dải thông, chỉ cho các thành phần trong miền tần số trong hình vành khăn đó đi qua, để loại bỏ đi các cấu trúc đường vân không đúng đắn
Đáp ứng của bộ lọc Gabor (phương trình bộ lọc Gabor trong miền không gian) được cho bởi phương trình sau:
2
2 '
2
2 '
2 cos 2
1 exp ,
,
x g
y x
cossin
' '
y x
y
y x
f là tần số trung tâm của bộ lọc
x và y là các hằng số không gian theo trục x và trục y
Biến đổi Fourier của bộ lọc Gabor (đáp ứng tần số của bộ lọc) được cho bởi công thức sau:
2 2
2
1exp2
1exp
,
v u
v u
v f u v
f u v
2
1
Hình 2.5: (a) Đáp ứng không gian của bộ lọc Gabor, (b) Đáp ứng tần số của bộ lọc Gabor
Hình 2.4: Phổ của ảnh vân tay
Trang 40- 39 –
Quy trình cải thiện ảnh dùng bộ lọc Gabor
I là ảnh đầu vào, lọc I qua 6 băng của bộ lọc Gabor, ta thu được 6 ảnh, trong đó g i
là bộ lọc Gabor với hướng của bộ lọc là 0