Tính toán độ tƣơng đồng

Một phần của tài liệu Đối sánh vân tay dựa trên thuật toán MCC minutiae cylinder code 04 (Trang 25)

Các hệ thống đối sánh tự động cần chuyển số lƣợng các điểm trạc có thể đối sánh giữa hai vân tay sang một giá trị chỉ độ tƣơng đồng giữa hai vân tay. Điều này thƣờng đƣợc thực hiện bởi công thức sau:

với k là số lƣợng điểm trạc có thể đối sánh, mn là số lƣợng điểm trạc tƣơng ứng của hai vân tay tham gia quá trình đối sánh.

Bên cạnh đó, các thông tin khác có thể đƣợc khai thác đặc biệt trong trƣờng hợp ảnh nhiễu và sự hạn chế trong của vùng trùng nhau giữa hai vân tay. Chất lƣợng điểm trạc có thể sử dụng nhƣ trọng số để đánh giá độ tin cậy hay không tin cậy của điểm trạc. Việc đóng góp của các cặp điểm trạc tin cậy nên cao hơn so với đóng góp của các cặp điểm trạc có chất lƣợng thấp hơn. Chất lƣợng của điểm trạc có thể đƣợc xác định dựa trên chất lƣợng vùng ảnh mà điểm trạc thuộc vào.

Việc chuẩn hóa theo công thức trong hình trên có xu hƣớng phạt các cặp vân tay có độ chồng lên nhau một số đề xuất việc chuẩn hóa hiệu quả hơn, xem xét số lƣợng điểm trạc thuộc vào vùng giao của hai vân tay sau khi quá trình căn chỉnh tối ƣu đã đƣợc xác định.

1.5. Kết luận

Nội dung Chƣơng 1 giới thiệu một cách khái quát nhất về bài toán đối sánh vân tay, các mô hình hệ thống nhận dạng vân tay từ đó đánh giá kết quả

của hệ thống nhận dạng, quy trình chi tiết nhận dạng vân tay. Từ đó có cơ sở nghiên cứu một số thuật toán đối sánh vân tay.

Chƣơng 2. MỘT SỐ THUẬT TOÁN ĐỐI SÁNH VÂN TAY 2.1. Giới thiệu

Đối sánh vân tay dựa trên điểm trạc là cách tiếp cận phổ biến nhất trong các thuật toán đối sánh vân tay. Chuẩn ISO cũng xác định sử dụng các đặc trƣng này. Mỗi điểm trạc có thể đƣợc mô tả bởi các thuộc tính nhƣ vị trí của điểm trong ảnh, hƣớng của điểm trạc và kiểu của điểm trạc (đƣờng kết thúc - ridge ending hay đƣờng rẽ nhánh - ridge bifurcation), một trọng số chỉ chất lƣợng của ảnh xung quanh điểm trạc. Hầu hết các thuật toán đối sánh vân tay coi mỗi điểm trạc gồm 3 thông tin (triplet).

m = {x, y, θ}, với x, y là vịtrí của điểm trạc và góc hƣớng của điểm trạc θ.

Nhƣ minh họa trong Hình 2.1:

Hình 2.1. Các loại điểm trạc và thông tin về điểm trạc

Bài toán đối sánh dựa trên điểm trạc là tìm ra phép sắp đặt (alignment) giữa hai tập đặc trƣng điểm trạc của hai vân tay sao cho tối đa số lƣợng các cặp điểm trạc có thể đối sánh.

Hình 2.2. Đối sánh các điểm trạc giữa hai vân tay

Có nhiều cách tiếp cận khác nhau trong việc giải quyết bài toán đối sánh trên, phần sau sẽ trình bày hai phƣơng pháp là đối sánh toàn cục (Global Minutia

Matching) và đối sánh dựa trên cấu trúc cục bộ (Local Minutiae Matching).

2.2. Các phƣơng pháp đối sánh vân tay 2.2.1. Đối sánh toàn cục

Bài toán đối sánh tập các điểm trạc trong đối sánh vân tay đƣợc quy về lớp đối sánh toàn cục. Có thể giả thiết hai tập điểm có quan hệ bởi vài quan hệ hình học, trong hầu hết các trƣờng hợp, một vài điểm tƣơng ứng đƣợc biết trƣớc, bài toán trở thành tìm phép biến đổi hình học tối ƣu liên quan đến hai tập. Tuy nhiên, trong bài toán đối sánh vân tay, điểm tƣơng ứng giữa hai vân tay thƣờng không đƣợc biết, điều này làm cho bài toán đối sánh vân tay trở thành bài toán tổ hợp khó. Một số kỹ thuật đối sánh điểm đƣợc áp dụng. Ratha và cộng sự (1996) [6] đề xuất cách tiếp cận đối sánh điểm trạc dựa trên phép biến đổi Hough tổng quát.

Không gian biến đổi bao gồm các bộ tứ (Δx, Δy, θ, s), trong đó mỗi tham số đƣợc rời rạc hóa thành các tập giá trị:

Một mảng bốn chiều A trong đó mỗi phần tử cho một tham số đƣợc rời rạc hóa. Thuật toán sau đƣợc sử dụng để tổng hợp việc đề cử cho mỗi bộ giá trị:

Bộ tham số tối ƣu cuối cùng (∆x*, ∆y*, ∆θ*, ∆s*) đƣợc xác định bởi:

Để nâng cao độ độ chính xác của biến đổi Hough, một phƣơng pháp thƣờng dùng là không chỉ bầu cho một ô rời rạc mà còn các ô lân cận. Một phƣơng pháp song song hóa thuật toán ở trên đƣợc đề xuất bởi Ratha, Rover, và Jain (1995), đƣợc cứng hóa bao gồm bộ xử lý dựa trên Field Programmable Gate

Array (FPGA).

2.2.2. Đối sánh cục bộ

2.2.2.1. Cấu trúc cục bộ

Các cấu trúc cục bộ (Local Description Structure) sử dụng các thông tin xung quanh điểm trạc để làm thông tin mô tả cho điểm trạc. Đối sánh cục bộ bao gồm việc so sánh các cấu trúc cục bộ của các điểm trạc. Đối sánh các cấu trúc cục bộ cho phép nhanh chóng xác định các cặp điểm trạc có thể đối sánh với nhau và sử dụng các cặp này nhƣ là ứng cử viên cho việc căn chỉnh hai vân tay.

Có khá nhiều các phƣơng pháp đƣợc đề xuất để mô tả cấu trúc cục bộ cho điểm trạc:

- Sử dụng các điểm trạc xung quanh. Ví dụ biểu diễn K-plet (2006) sử dụng K điểm lân cận gần nhất để biểu diễn điểm trạc.

- Sử dụng các điểm thuộc các đƣờng vân bao quanh, ví dụ Tico (2003) [7].

- Kết hợp cả các điểm trạc và đƣờng vân bao quanh, Feng (2008) [5]. - Sử dụng thông tin ảnh xung quanh điểm trạc, ví dụ biểu diễn FingerCode [8] sử dụng các biến đổi Garbo để trích xuất các thông tin ảnh xung quanh điểm trạc.

Hình 2.4. Biểu diễn cục bộ sử dụng K-plet (adsbygoogle = window.adsbygoogle || []).push({});

Hình 2.5. Biểu diễn vân tay sử dụng FingerCode

2.2.2.2. Giai đoạn gia cố

Bƣớc tiếp theo đối sánh cục bộ là bƣớc gia cố (consolidation) nhằm mục đích xác thực xem các cấu trúc phù hợp cục bộ còn phù hợp ở mức toàn cục sau khi đã căn chỉnh. Bƣớc này có thể không cần thiết nếu việc đối sánh cục bộ có thể loại bỏ các trƣờng hợp các vân tay có sự khác biệt lớn. Quá trình gia cố liên quan đến các phép biến đổi xoay và dịch chuyển nhƣ thể hiện trong Hình 2.6.

Kỹ thuật gia cố đơn giản nhất sử dụng cặp điểm đối sánh cục bộ có giá trị tƣơng đồng lớn nhất làm cặp điểm căn chỉnh hai vân tay trong bƣớc đối sánh toàn cục.

Hình 2.6. Bước gia cố liên quan đến việc căn chỉnh biến đổi xoay và dịch chuyển

Sau bƣớc căn chỉnh, tất cả các cấu trúc cục bộ đƣợc xác định lại xem liệu có còn thỏa mãn các ràng buộc sau:

- Khoảng cách giữa hai điểm trạc sau khi căn chỉnh không vƣợt quá ngƣỡng ts xác định trƣớc.

- Sự khác nhau giữa hƣớng của hai điểm trạc sau khi căn chỉnh không vƣợt quá ngƣỡng tθ.

Hai tham số ts thể hiện cửa sổ chịu lỗi và giá trị của chúng đƣợc quyết định thông qua các thí nghiệm. Ví dụ, trong thuật toán MTK [8], ngƣỡng khoảng cách ts= 12 và ngƣỡng góc tθ= π/6 cho kết quả tốt trong đối sánh vân tay.

Tuy nhiên, việc biến đổi dựa trên cặp điểm trạc có giá trị tƣơng đồng lớn nhất có thể không là biến đổi tốt nhất ở mức toàn cục. Ví dụ trong Hình 2.7 chỉ ra một cặp điểm đối sánh có giá trị tƣơng đồng lớn nhất là cặp điểm đối sánh sai. Một vài tác giả đã sử dụng biến đổi dựa trên nhiều cặp ứng cử viên cho quá trình căn chỉnh. Cuối cùng chọn ra biến đổi có số lƣợng cặp đối sánh ở mức toàn cục là lớn nhất. Ví dụ Medina và cộng sự [8] giảm số cặp đối sánh cục bộ bằng cách với mỗi điểm trạc p và điểm trạc q, chỉ chọn ra các điểm trạc có giá trị tƣơng đồng lớn nhất, sau đó thực hiện phép biến đổi dựa trên tập hạn chế này. Feng và cộng sự [5] sắp xếp các cặp điểm đối sánh cục bộ theo thứ tự giảm dần sau đó chọn ra T cặp điểm đối sánh cho quá trình căn chỉnh. Thông thƣờng, các cách tiếp cận này cho độ chính xác tốt hơn so với cách tiếp cập dựa trên biến đổi đơn.

Hình 2.7. Một cặp điểm đối sánh sai có giá trị tương đồng lớn nhất

Xa hơn theo [11], trong quá trình gia cố theo cách tiếp cận truyền thống, sau bƣớc căn chỉnh, các cặp điểm đối sánh cục bộ chỉ kiểm tra với cặp điểm dùng làm căn chỉnh, mặc dù các cặp điểm phù hợp với cặp điểm căn chỉnh, nhƣng có thể không phù hợp với nhau.

Các tác giả đã đề xuất, sau bƣớc căn chỉnh, các cặp điểm cục bộ ngoài kiểm tra sự phù hợp với cặp điểm căn chỉnh, bổ xung thêm bƣớc kiểm tra sự phù hợp với nhau giữa các cặp điểm này. Hình 2.8 cho thấy sau khi áp dụng thêm bƣớc kiểm tra sau quá trình căn chỉnh, kết quả đã loại bớt đƣợc một số cặp điểm trạc không phù hợp với nhau.

2.3. Hạn chế của một số biểu diễn truyền thống

Các cấu trúc dựa trên láng giềng gần nhất (Nearest neighbor-based structures):

Các láng giềng của điểm trạc trung tâm đƣợc tạo bởi K điểm trạc gần nhất. Một hạn chế của lớp thuật toán này là khả năng thay đổi cấu trúc cục bộ do tìm thiếu hoặc sai điểm trạc. Hình 2.9 minh họa việc cấu trúc cục bộ bị thay đổi do tìm thiếu hay tìm ra điểm trạc sai.

Hình 2.9. Cấu trúc không phù hợp do phát hiện điểm trạc thiếu hoặc sai

Các cấu trúc dựa trên bán kính cố định (Fixed radius-based structures):

Các điểm láng giềng đƣợc định nghĩa là tất cả các điểm trạc có khoảng cách với điểm trạc trung tâm nhỏ hơn một bán kính R cho trƣớc, điều này có thể dẫn đến đối sánh cục bộ phức tạp hơn, tuy nhiên phƣơng pháp này chịu lỗi tốt hơn với trƣờng hợp điểm trạc sai hoặc thiếu.

Đối sánh dựa trên cấu trúc có bán kính cố định có thể dẫn đến lỗi ở đƣờng biên bao. Ví dụ do sự khác nhau của sự vặn méo khi lấy mẫu vân tay, sự xác định không chính xác vị trị, có thể dẫn đến cùng một điểm trạc bị dời ra ngoài vùng cục bộ của vân tay thứ hai.

Hình 2.10 minh họa một số điểm trạc bị thay đổi dời ra ngoài vùng cục bộ của hai vân tay dẫn đến việc sai khác trong cấu trúc cục bộ.

Phần tiếp theo của luận văn sẽ trình bày biểu diễn của cấu trúc cục bộ mới, cho kết quả tốt hiện nay là Minutia Cylinder-Code (MCC).

Hình 2.10. Cấu trúc cục bộ không phù hợp do vấn đề biên

2.4. Biểu diễn dựa trên MCC

Hiện nay, theo các nghiên cứu khác nhau, biểu diễn cấu trúc cục bộ dựa trên MCC [2] là một trong những mô tả dựa trên điểm trạc chính xác nhất. Ƣu điểm chính của biển diễn này so với các biểu diễn cục bộ khác đó là:

- MCC là cách tiếp cận dựa trên cách tiếp cận sử dụng bán kính cố định (fixed-radius) do đó chịu lỗi tốt hơn đối với tình huống phát hiện thiếu điểm trạc hoặc điểm trạc sai so với cách tiếp cận dựa trên láng giềng gần nhất (neighbor-based).

- Không giống nhƣ các cách tiếp cận sử dụng bán kính cố định truyền thống, MCC dựa vào mã hóa có độ dài cố định, điều này giúp việc tính toán độ tƣơng đồng cục bộ đơn giản.

- Vấn đề đƣờng bao biên giới đƣợc giải quyết đơn giản nhờ kết hợp thêm không gian xung quanh.

- Cài đặt dựa trên bit giúp việc đối sánh hình trụ nhanh và đơn giản, giúp giảm thời gian và có thể thực thi hiệu quả trên các CPU đơn giản.

2.4.1. Mô tả biểu diễn MCC (adsbygoogle = window.adsbygoogle || []).push({});

MCC gắn các biểu diễn cục bộ cho mỗi điểm trạc. Mô tả này bao gồm cả quan hệ về khoảng cách và hƣớng giữa điểm trạc và các điểm trạc lân cận và đƣợc biểu diễn nhƣ là một hình trụ với đáy và chiều cao liên quan đến khoảng cách và hƣớng.

Hình 2.11. Biểu diễn hình trụ MCC cho điểm trạc

Hình trụ đƣợc rời rạc hóa thành NC = NSxNSxND hình khối, mỗi khối sẽ có kích thƣớc đáy là SxS và chiều cao là D , trong đó S= 2R/NS và D= 2π/ND.

Hình 2.12. Chi tiết tính toán cho hình trụ

Với mỗi ô (i, j, k), sẽ gắn với một giá trị Cm(i, j, k) đƣợc tính toán bằng cách tổng hợp các đóng góp của các điểm trạc mt thuộc vào hàng xóm của pim,j . Các điểm trạc đƣợc xác định trong vòng bán kính 3 so với điểm tâmp m. s i,

j

Hình 2.14. Tập các điểm trạc đóng góp vàopim,j

Đóng góp theo khoảng cách của mt vào pim,j đƣợc định nghĩa theo công thức trong Hình 2.15, sử dụng hàm phân phối chuẩn Gausian với kỳ vọng 0 và phƣơng sai S.

Đóng góp của mt theo hƣớng tới dk đƣợc định nghĩa thông qua công thức:

Với GD() là phân phối chuẩn Gausian:

Hình 2.16. Đóng góp của mttheo hướng tớidk

Công thức tính giá trị Cm(i, j, k) theo khoảng cách CmS và đóng góp theo hƣớng CmD đƣợc tổng kết theo công thức sau:

Một khối đƣợc coi là hợp lệ (valid) nếu pim,j đƣợc chứa trong vùng giao của hình trụ với bao lồi ngoài của tất cả các điểm trạc T của vân tay. Điều kiện này để đảm bảo tránh xem xét các phần của hình trụ nằm ra ngoài vùng của vân tay do đó có thể chứa các thông tin không thích hợp.

 là hàm sigmoid dùng để giới hạn kết quả trả về trong khoảng [0, 1].

Hình 2.17. Hàm sigmoid

Hình 2.18 minh họa kết quả tính toán hình trụ biểu diễn cho một điểm trạc, các ô sáng màu thể hiện các giá trị tại đó cao hơn.

Hình 2.18. Minh họa các ô của hình trụ thể hiện cho điểm trạc m, ô sáng hơn chỉ giá trị cao hơn

Một biểu diễn hình trụ cho một điểm trạc đƣợc coi là không hợp lệ nếu: - Có ít hơn minVC ô hợp lệ trong hình trụ.

- Có ít hơn minM điểm trạc đóng góp vào hình trụ.

Sau khi loại đi các hình trụ không hợp lệ, sẽ còn lại tập các hình trụ biểu diễn cho các điểm trạc của vân tay.

Hình 2.19. Minh họa ba hình trụ biểu diễn cho ba điểm trạc của vân tay

2.4.2. Tính độ tƣơng đồng giữa các hình trụ

Với hai điểm trạc ab, cacb là hai vector tƣơng ứng đƣợc suy ra các hình trụ biểu diễn hai điểm trạc. Độ tƣơng đồng giữa hai hình trụ đƣợc định nghĩa theo công thức trong Hình 2.20:

Hình 2.20. Độ tương đồng giữa các biểu diễn hình trụ

Nhờ vào biểu diễn vector có độ dài cố định giúp cho quá trình tính toán độ tƣơng đồng giữa các điểm trạc nhanh và đơn giản.

2.5. Ứng dụng của biểu diễn dựa trên Bit

Với thẻ thông minh, bộ xử lý có hạn chế, thích hợp với xử lý trên dấu phẩy tĩnh, và hạn chế việc tính toán trên dấu phẩy động. Các thuật toán đối sánh sử dụng phổ biến trên môi trƣờng máy tính cá nhân hoặc server thƣờng yêu cầu sử dụng các phép toán trên dấu phẩy động nên không thích hợp với ứng dụng sử dụng trên thẻ thông minh.

Biểu diễn MCC hình trụ có thể biểu diễn bởi dãy các bit 0, 1 nhờ vào thay đổi hàm sigmoid bởi hàm chuyển đơn vị.

Hình 2.21. Hàm chuyển về giá trị bit

Điều này cho phép so sánh các cấu trúc cục bộ MCC nhanh chóng bởi so sánh giá trị tƣơng đồng giữa các hình trụ quy về việc so sánh một chuỗi các bit. (adsbygoogle = window.adsbygoogle || []).push({});

Hình 2.22. Đối sánh trên thẻ Match on card sử dụng biểu diễn Bit của MCC

2.6. Kết luận

Nội dung Chƣơng 2 đã nghiên cứu một số thuật toán đối sánh vân tay: đối sánh dựa trên điểm trạc, đối sánh toàn cục, đối sánh cục bộ, từ đó đƣa ra hạn chế của một số biểu diễn truyền thống. Đồng thời đƣa ra biểu diễn cục bộ dựa trên

Một phần của tài liệu Đối sánh vân tay dựa trên thuật toán MCC minutiae cylinder code 04 (Trang 25)