Để phát hiện các chi tiết sai làm ảnh hởng đến các ảnh vân tay nhị phân đợc làm mảnh, có thể sử dụng vài luật cấu trúc đơn giản. Xiao (1991) xác định hầu hết các cấu trúc chi tiết sai và đa ra phơng pháp loại bỏ chúng. Thuật toán sử dụng dựa trên các luật, yêu cầu các đặc tính số học liên quan đến các chi tiết: chiều dài các vân liên quan (s), góc chi tiết, và số các chi tiết đối diện gần kề trong lân cận.
Hình 2.13: Các cấu trúc sai cơ bản (hàng đầu tiên) và cấu trúc sau khi sửa lỗi (hàng thứ hai)
Farina, Kovacs-Vajina, và Leone (1999) đã đa ra vài luật và thuật toán tiền xử lý chi tiết.
Các cầu bị loại bỏ khi nhìn nhận chúng trong một điểm chẻ hai sai, chỉ có hai nhánh đợc căn chỉnh, còn nhánh thứ ba thờng vuông góc với hai nhánh còn lại.
Các vân quá ngắn đợc loại bỏ dựa vào khi so sánh chiều dài vân với khoảng cách trung bình giữa các vân.
Các điểm kết thúc và rẽ hai đợc kiểm tra: chúng đợc loại bỏ nếu không thỏa mãn tính hình học topo.
Hình 2.14: Tiền xử lý chi tiết theo phơng pháp của Farina, Kovacs - vajina, và Leone (1999). ở ảnh bên phải, hầu hết các chi tiết sai đã bị loại bỏ từ ảnh vân bên trái
CHƯƠNG 3:
Các kĩ thuật ĐốI SáNH VÂN TAY 3.1. ĐặT VấN Đề
Một thuật toán đối sánh vân tay so sánh hai vân tay cho trớc và trả về độ tơng tự (không làm mất tính tổng quát, có giá trị giữa 0 và 1) hoặc một quyết định hai ngôi (khớp hoặc không khớp). Chỉ một vài thuật toán hoạt động trực tiếp trên ảnh vân cấp xám; hầu hết chúng yêu cầu một biểu diễn vân trung gian đợc dẫn xuất qua giai đoạn trích chọn đặc trng. Không làm mất tính tổng quát, từ đây về sau chúng ta kí hiệu biểu diễn của vân tay có đợc qua quá trình tuyển chọn nh là mẫu (T) và biểu diễn của vân tay đợc đối sánh nh là đầu vào (I). Trong trờng hợp không có giai đoạn trích chọn đặc trng, biểu diễn vân tay đồng nhất với chính ảnh cấp xám vân tay. Chúng ta kí hiệu cả ảnh vân tay và các vector đặc trng ảnh (nh các chi tiết) là T và I.
Trích chọn đặc trng vân tay và các thuật toán đối sánh khá giống nhau cho các bài toán nhận dạng và kiểm tra vân tay. Bới vì bài toán nhận dạng vân tay (tìm kiếm một vân tay đầu vào trong một cơ sở dữ liệu có N vân tay) có thể đợc thực hiện nh là thực hiện tuần tự đối sánh một - một (kiểm tra) giữa các cặp vân tay. Sự phân loại vân tay và các kĩ thuật đánh chỉ số thờng đợc sử dụng để tăng tốc độ tìm kiếm trong các bài toán nhận dạng vân tay.
Đối sánh hai ảnh vân tay là một bài toán cực kì khó, chủ yếu do sự thay đổi dấu in của cùng một vân tay. Các yếu tố chính làm các dấu in khác nhau đợc tổng kết dới đây:
Sự đổi chỗ: Một ngón tay có thể đặt ở các vị trí khác nhau trên bộ cảm biến
làm tịnh tiến ảnh vân tay. Một ngón tay thay đổi chỉ 2mm làm tịnh tiến khoảng 40 điểm ảnh trong cùng một vân tay đợc quét ở độ phân giải 500dpi.
Sự quay: Cùng một vân tay có thể quay ở các góc khác nhau trên bề mặt bộ
cảm biến. Mặc dù bộ hớng dẫn ngón tay đợc gắn trên các máy quét thơng mại, nhng trong thực tế tồn tại sự quay không cố ý lên tới ± 20o theo chiều dọc.
Sự chồng chéo từng phần: Sự đổi chỗ và sự quay vân tay thờng làm cho một
phần vân tay bị đổ ra ngoài vùng nhìn thấy của bộ cảm biến, kết quả là xuất hiện sự chồng chéo giữa các vùng cận cạnh của mẫu vân và các vân tay đầu vào
Sự nhiễu phi tuyến: liên quan đến việc ánh xạ hình ảnh ba chiều sang hình ảnh hai chiều trên bề mặt bộ cảm biến. ánh xạ này gây ra nhiễu phi tuyến trong việc đọc vân tay do sự mềm dẻo của ngón tay. Thông thờng, các thuật toán đối sánh vân tay không quan tâm đến các đặc tính nh ánh xạ và xem một ảnh vân tay là không bị nhiễu bằng cách cho rằng: ảnh vân tay đợc cung cấp khi ngời dùng đặt đúng vị trí ngón tay:
1.- Tiếp cận ngón tay vuông góc với bộ cảm biến.
2.- Khi ngón tay chạm bề mặt bộ cảm biến, ngời dùng không ấn mạnh hay xoắn ngón tay
Do sự mềm dẻo của bề mặt da, các phần lực không vuông góc với bề mặt bộ cảm biến gây ra các nhiễu không tuyến tính (nén lại hay kéo dãn ra) trong quá trình lấy vân. Nhiễu làm mất khả năng đối sánh các vân tay nh là các mẫu cứng.
Điều kiện áp lực và da: Cấu trúc các vân của một vân tay có thể thu đợc chính
xác nếu nh phần ngón tay đợc lấy ảnh tiếp xúc đúng quy cách với bề mặt bộ cảm biến. Một số điều kiện nh áp lực ngón tay, ngón tay khô, bệnh ngoài da, - ớt, bẩn, độ ẩm không khí - gây ra sự tiếp xúc không đúng quy cách. Hệ quả là, ảnh vân tay lấy đợc rất nhiễu và mức độ các nhiễu này phụ thuộc vào mức độ các nguyên nhân nêu trên.
Các lỗi trích chọn đặc trng: Các thuật toán trích chọn đặc trng là không hoàn
hảo và thờng có các lỗi số đo. Các lỗi có thể tạo ra ở trong bất kì giai đoạn nào trong quá trình trích chọn đặc trng (chẳng hạn: ớc lợng ảnh hớng và tần suất, phát hiện số lợng, dạng, vị trí các vùng đơn, phân đoạn vùng vân tay từ nền...). Cặp ảnh trong Hình 3.1 thể hiện tính thay đổi cao có thể đặc tính hóa hai vết hằn khác nhau của cùng một ngón tay
Các ảnh vân tay từ các ngón tay khác nhau có thể xuất hiện khá giống nhau (tính thay đổi thấp), đặc biệt trong bối cảnh cấu trúc tổng thể (vị trí các vùng đơn, h- ớng vân cục bộ) Mặc dù khả năng một lợng lớn các chi tiết từ các vết ấn của hai vân tay khác nhau có thể so khớp là cực kì nhỏ, những ngời đối sánh vân tay hớng tới việc sử dụng các phép căn chỉnh tốt nhất. Họ thờng xuyên có ý định khai báo các cặp chi tiết so khớp thậm chí ngay cả khi chúng không trùng khớp hoàn hảo.
Một lợng lớn các thuật toán đối sánh vân tự động đã đợc đề nghị trong các tài liệu nhận dạng mẫu. Hầu hết các thuật toán này không gặp khó khăn trong đối sánh các ảnh vân tay chất lợng tốt. Nhng trong đối sánh vân tay tồn tại thách thức ở các ảnh chất lợng thấp và vấn đề đối sánh từng vùng vân tay. Trong trờng hợp hệ thống trợ giúp con ngời, AFIS - một thuật toán kiểm tra chất lợng đợc sử dụng để chỉ lấy và chèn vào cơ sở dữ liệu các ảnh vân tay tốt. Hơn nữa, quá trình xử lý các mẫu vân khó có thể đợc quản lý. Dù sao, sự can thiệp là không thể trong các hệ thống nhận dạng trực tuyến tự động - những hệ thống này đang có nhu cầu ngày càng tăng trong các ứng dụng thơng mại.
Thống kê các lỗi không - đối sánh sai xuất hiện nhiều trong các thuật toán đối sánh tham dự vào FVC2000 cho thấy hầu hết các lỗi đợc tạo ra trên 15-20% các ảnh vân tay chất lợng kém. Nói một cách khác, 20% mẫu trong cơ sở dữ liệu chịu trách nhiệm cho khoảng 80% các lỗi không - đối sánh sai. Vài cải tiến trong công nghệ nhận dạng vân tay đợc chứng minh sau đó hai năm ở FVC2002, nơi mà vài thuật toán đợc đa ra đối sánh đúng nhiều ảnh vân tay chất lợng kém. Tuy vậy vẫn có nhu cầu
Hỡnh 3.1: Cỏc dấu võn tay
thu được của cựng một ngún tay khụng đối sỏnh được với nhau do nhiễu phi tuyến ở cặp đầu tiờn và do cỏc điều kiện da ở cặp thứ hai bờn dưới
tiếp tục phát triển các hệ thống mạnh có khả năng làm việc với các ảnh vân tay chất lợng kém.
Các phơng pháp đối sánh vân tay có thể đợc phân loại thô vào ba họ:
Đối sánh dựa độ tơng quan: Hai ảnh vân tay đợc đặt chồng lên và độ tơng
quan giữa các điểm ảnh tơng ứng đợc tính với sự căn chỉnh khác nhau (ví dụ với các vị trí và độ quay khác nhau). Các kĩ thuật dựa độ tơng quan đợc mô trả trong phần 4.2.
Đối sánh dựa vào chi tiết: Đây là kĩ thuật phổ biến nhất và đợc sử dụng rộng
rãi nhất. Chi tiết đợc trích chọn từ hai vân tay đợc lu giữ nh là tập các điểm trong một bề mặt hai chiều. Đối sánh dựa chi tiết cơ bản bao gồm tìm kiếm sự căn chỉnh giữa tập chi tiết mẫu và tập chi tiết đầu vào dẫn tới sự so khớp lớn nhất các cặp chi tiết.
Đối sánh dựa đặc tính vân: trong các ảnh vân tay chất lợng thấp, việc trích
chọn chi tiết rất khó khăn. Khi các đặc trng khác của mẫu vân tay (ví dụ: hớng và tần suất cục bộ, hình dạng vân, thông tin kết cấu) có thể đợc trích chọn một cách tin cậy hơn chi tiết, sự khác biệt của chúng là không cao. Các phơng pháp thuộc họ này so sánh các vân tay với các đặc trng đợc trích chọn từ các mẫu vân. Về nguyên lý, đối sánh dựa độ tơng quan và đối sánh dựa vào chi tiết có thể xem nh là một phần của đối sánh dựa đặc trng vân, theo cách hiểu mật độ điểm ảnh, vị trí chi tiết là những đặc trng của mẫu vân ngón tay.
Nhiều kĩ thuật khác cũng đã đợc đề nghị chính thức, về nguyên lý có thể đợc xếp vào các họ trên theo các đặc trng đợc sử dụng, nhng chúng ta đề cập để phân loại chúng tách biệt trên cơ sở các kĩ thuật đối sánh. Chúng bao gồm các phơng pháp dựa mạng thần kinh và các cố gắng thực hiện đối sánh vân sử dụng các bộ xử lý song song hoặc với các kiến trúc dành riêng khác.
3.2. CáC Kĩ THUậT DựA Độ TƯƠNG QUAN
Để T và I là hai ảnh vân tay tơng ứng với vân tay mẫu và vân tay đầu vào. Một số đo trực quan về sự đa dạng (SSD) đợc tính bằng tổng các bình phơng khác nhau của các cờng độ các điểm ảnh tơng ứng:
SSD(T,I) = ||T-I||2
=(T-I)T(T-I) = ||T||2 + ||I||2 -2TTI (1)
Trong đó chỉ số trên T kí hiệu sự hoán vị của một vector. Nếu ||T||2 và ||I||2 là hằng số, sự đa dạng giữa hai ảnh đợc tối thiểu khi độ tơng quan (CC) giữa T và I đợc cực đại:
CC(T,I) = TTI. (2)
Đại lợng -2.CC(T,I) xuất hiện nh là đại lợng thứ ba của biểu thức (1). Độ tơng quan chéo (hay gọi đơn giản là độ tơng quan) là độ đo tính tơng tự giữa hai ảnh. Do sự đổi chỗ và sự quay là không thể tránh khỏi đặc tính vết ấn của một ngón tay cho trớc, tính tơng tự giữa chúng không thể đơn giản đợc tính bằng cách đặt chồng T và I áp dụng biểu thức (2).
Kí hiệu I(∆x, ∆y,θ) thể hiện một sự quay của ảnh đầu vào I bởi một góc θ quanh điểm đầu (thờng là trung tâm ảnh) và dịch một đoạn ∆x, ∆y dọc theo trục x và y; khi đó độ tơng tự giữa hai ảnh T và I có thể đợc đo nh sau:
S(T,I) = max CC(T, I(∆x, ∆y,θ)). (3)
ứng dụng trực tiếp của đẳng thức (3) hiếm khi dẫn tới các kết quả chấp nhận đợc chủ yếu là do các vấn đề sau:
Các nhiễu phi tuyến làm cho các vết ấn của cùng một ngón tay khác nhau trong cấu trúc toàn cục; Sự nhiễu mềm dẻo không thay thế mẫu vân tay ở các vị trí cục bộ, nhng các hiệu ứng của nhiễu đợc tích hợp trong không gian ảnh, mẫu vân tay toàn cục không thể đợc tơng quan một cách đáng tin cậy.
Điều kiện da và áp lực ngón tay làm cho độ sáng, độ tơng phản, độ giày vân thay đổi trong các vết ấn khác nhau. Sử dụng các số đo độ tơng quan phức tạp hơn nh độ tơng quan chéo đợc chuẩn hóa hay độ tơng quan chéo đợc chuẩn hóa 0 - Trung bình có thể bỏ qua sự thay đổi độ sáng, độ tơng phản để áp dụng các bớc tăng cờng ảnh, nhị phân hóa và làm mảnh (thực hiện trên cả ảnh T và I) có thể hạn chế độ dày vân. Hatano (2002) đã đa ra giả thuyết sử dụng độ t- ơng quan khác nhau, đợc tính nh là độ tơng quan lớn nhất trừ đi độ tơng quan nhỏ nhất, trong một lân cận điểm nơi mà độ tơng quan là lớn nhất. Trong thực tế, do tính chu kì của các mẫu vân tay, nếu hai phần tơng ứng của cùng một vân tay không đợc căn chỉnh tơng ứng với vị trí đối sánh tối u, giá trị độ tơng quan hạ thấp trong khi hai vị trị không tơng quan thể hiện một giá trị tơng quan phẳng hơn trong lân cận của vị trí so khớp tối u. Hantano đã báo cáo một sự cải thiện độ chính xác tơng ứng với phơng pháp độ tơng quan truyền thống. Để ứng dụng trực tiếp biểu thức (3) đòi hỏi chi phí rất lớn. Ví dụ xem xét hai ảnh 400x400, sau đó sự tính toán độ tơng quan ở đẳng thức (2) cho một giá trị đơn của (∆x, ∆y,θ) yêu cầu 16000 phép nhân và 16000 phép cộng. Nếu ∆x, ∆y đều đợc lấy mẫu trong miền [-200, 200] và θ đợc lấy mẫu từng 1 độ trong miền [-30o, 30o]
chúng ta phải tính 401x401x61 độ tơng quan, kết quả là gần 1569 tỉ phép nhân và phép cộng (vậy là cần hơn 1h với máy tính 500MIPS).
Vấn đề nhiễu ảnh vân tay (điểm 1 trong danh sách trên) thờng đợc đặt ra khi tính độ tơng quan cục bộ thay vì toàn cục: một tập các miền cục bộ (mà cỡ điển hình có thể là 24x24 hoặc 32x32) đợc trích chọn từ ảnh mẫu T và mỗi chúng đợc tơng quan độc lập với toàn bộ ảnh đầu vào I (Bazen 2000). Các miền cục bộ có thể đợc tính bằng vài cách:
Hợp của chúng hoàn toàn che phủ T và giao của chúng là rỗng.
Hợp của chúng hoàn toàn che phủ T và chúng cục bộ đè chồng.
Chỉ các vùng “thú vị” đợc lựa chọn từ T. Ví dụ: Yahagi, Igaki chọn các cửa sổ nhỏ quanh các chi tiết, trong khi Bazen (2000) xem xét các miền đợc chọn phân biệt cục bộ trên ảnh đầu vào (phù hợp ở vị trí bên phải, nhng không phù hợp với các vị trí khác). Các hạng mục đợc đa ra bởi Bazen để nhận dạng các vùng đợc chọn này trong ảnh mẫu: Các vùng quanh chi tiết, các vùng có các vân có độ cong cao, và các vùng thể hiện độ tơng quan thấp ở các vị trí trong chính ảnh mẫu.
Khi độ tơng quan đợc tính một cách cục bộ, ớc lợng độ tơng quan ở các vùng khác có thể đợc tính bằng cách kết hợp để nhận đợc độ đo tính tơng tự (ví dụ: số các ớc lợng vợt quá một ngỡng cho trớc đợc chia ra bởi tổng các ớc lợng). Bổ sung vào giá trị của độ tơng quan, sự đồng bộ của các điểm nơi mà mỗi vùng có độ tơng quan lớn nhất có thể đợc sử dụng để tăng cờng đối sánh: trong thực tế, mối liên hệ không gian (khoảng cách, góc...) giữa các vùng trong mẫu và các vùng tơng ứng trong ảnh đầu vào đợc giữ lại. Trong bất kì trờng hợp nào, không có sự bảo đảm khi sử dụng b- ớc hợp nhất là thực sự thuận lợi.
Để tính độ phức tạp của kĩ thuật dựa độ tơng quan, các phơng pháp thông minh có thể đợc sử dụng để đạt đợc sự thi hành hiệu quả:
Định lý độ tơng quan (Gonzales và Woods, 1992) phát biểu rằng: tính toán độ tơng quan trên các miền không gian (toán tử...) là tơng đơng với thực hiện một phép nhân miền điểm trên miền Fourier, trong thực tế:
( )
1 *
( ) ( )
T⊗ =I F− F T xF I (4)
Trong đó: F(.)là biến đổi Fourier của một ảnh, F-1(.)là biến đổi Fourier ngợc, * kí hiệu liên hợp phức, và “x” là kí hiệu nhân điểm với điểm của hai vector. Kết quả của đẳng thức (4) là ảnh độ tơng quan mà các giá trị ở các điểm [x,y] thể hiện độ tơng
quan giữa T và I trong khi sự đổi chỗ là ∆x = x, ∆y = y. Đẳng thức (4) không xem xét sự quay, phải đợc giải quyết tách ra; trong bất kì trờng hợp nào, tiết kiệm tính toán là rất cao trong khi độ tơng quan đợc thực hiện một cách toàn cục (Coezteen và