2.2.2.2.Giai đoạn gia cố
Bƣớc tiếp theo đối sánh cục bộ là bƣớc gia cố (consolidation) nhằm mục đích xác thực xem các cấu trúc phù hợp cục bộ còn phù hợp ở mức toàn cục sau khi đã căn chỉnh. Bƣớc này có thể không cần thiết nếu việc đối sánh cục bộ có thể loại bỏ các trƣờng hợp các vân tay có sự khác biệt lớn. Quá trình gia cố liên quan đến các phép biến đổi xoay và dịch chuyển nhƣ thể hiện trong Hình 2.6.
Kỹ thuật gia cố đơn giản nhất sử dụng cặp điểm đối sánh cục bộ có giá trị tƣơng đồng lớn nhất làm cặp điểm căn chỉnh hai vân tay trong bƣớc đối sánh toàn cục.
Hình 2.6. Bước gia cố liên quan đến việc căn chỉnh biến đổi xoay và dịch chuyển
Sau bƣớc căn chỉnh, tất cả các cấu trúc cục bộ đƣợc xác định lại xem liệu có còn thỏa mãn các ràng buộc sau:
- Khoảng cách giữa hai điểm trạc sau khi căn chỉnh không vƣợt quá ngƣỡng ts xác định trƣớc.
- Sự khác nhau giữa hƣớng của hai điểm trạc sau khi căn chỉnh không vƣợt quá ngƣỡng tθ.
Hai tham số ts và tθ thể hiện cửa sổ chịu lỗi và giá trị của chúng đƣợc quyết định thông qua các thí nghiệm. Ví dụ, trong thuật toán MTK [8], ngƣỡng khoảng cách ts= 12 và ngƣỡng góc tθ= π/6 cho kết quả tốt trong đối sánh vân tay.
Tuy nhiên, việc biến đổi dựa trên cặp điểm trạc có giá trị tƣơng đồng lớn nhất có thể không là biến đổi tốt nhất ở mức toàn cục. Ví dụ trong Hình 2.7 chỉ ra một cặp điểm đối sánh có giá trị tƣơng đồng lớn nhất là cặp điểm đối sánh sai. Một vài tác giả đã sử dụng biến đổi dựa trên nhiều cặp ứng cử viên cho quá trình căn chỉnh. Cuối cùng chọn ra biến đổi có số lƣợng cặp đối sánh ở mức toàn cục là lớn nhất. Ví dụ Medina và cộng sự [8] giảm số cặp đối sánh cục bộ bằng cách với mỗi điểm trạc p và điểm trạc q, chỉ chọn ra các điểm trạc có giá trị tƣơng đồng lớn nhất, sau đó thực hiện phép biến đổi dựa trên tập hạn chế này. Feng và cộng sự [5] sắp xếp các cặp điểm đối sánh cục bộ theo thứ tự giảm dần sau đó chọn ra T cặp điểm đối sánh cho quá trình căn chỉnh. Thông thƣờng, các cách tiếp cận này cho độ chính xác tốt hơn so với cách tiếp cập dựa trên biến đổi đơn.
Hình 2.7. Một cặp điểm đối sánh sai có giá trị tương đồng lớn nhất
Xa hơn theo [11], trong quá trình gia cố theo cách tiếp cận truyền thống, sau bƣớc căn chỉnh, các cặp điểm đối sánh cục bộ chỉ kiểm tra với cặp điểm dùng làm căn chỉnh, mặc dù các cặp điểm phù hợp với cặp điểm căn chỉnh, nhƣng có thể không phù hợp với nhau.
Các tác giả đã đề xuất, sau bƣớc căn chỉnh, các cặp điểm cục bộ ngoài kiểm tra sự phù hợp với cặp điểm căn chỉnh, bổ xung thêm bƣớc kiểm tra sự phù hợp với nhau giữa các cặp điểm này. Hình 2.8 cho thấy sau khi áp dụng thêm bƣớc kiểm tra sau quá trình căn chỉnh, kết quả đã loại bớt đƣợc một số cặp điểm trạc không phù hợp với nhau.
2.3.Hạn chế của một số biểu diễn truyền thống
Các cấu trúc dựa trên láng giềng gần nhất (Nearest neighbor-based structures):
Các láng giềng của điểm trạc trung tâm đƣợc tạo bởi K điểm trạc gần nhất. Một hạn chế của lớp thuật toán này là khả năng thay đổi cấu trúc cục bộ do tìm thiếu hoặc sai điểm trạc. Hình 2.9 minh họa việc cấu trúc cục bộ bị thay đổi do tìm thiếu hay tìm ra điểm trạc sai.
Hình 2.9. Cấu trúc không phù hợp do phát hiện điểm trạc thiếu hoặc sai
Các cấu trúc dựa trên bán kính cố định (Fixed radius-based structures):
Các điểm láng giềng đƣợc định nghĩa là tất cả các điểm trạc có khoảng cách với điểm trạc trung tâm nhỏ hơn một bán kính R cho trƣớc, điều này có thể dẫn đến đối sánh cục bộ phức tạp hơn, tuy nhiên phƣơng pháp này chịu lỗi tốt hơn với trƣờng hợp điểm trạc sai hoặc thiếu.
Đối sánh dựa trên cấu trúc có bán kính cố định có thể dẫn đến lỗi ở đƣờng biên bao. Ví dụ do sự khác nhau của sự vặn méo khi lấy mẫu vân tay, sự xác định không chính xác vị trị, có thể dẫn đến cùng một điểm trạc bị dời ra ngoài vùng cục bộ của vân tay thứ hai.
Hình 2.10 minh họa một số điểm trạc bị thay đổi dời ra ngoài vùng cục bộ của hai vân tay dẫn đến việc sai khác trong cấu trúc cục bộ.
Phần tiếp theo của luận văn sẽ trình bày biểu diễn của cấu trúc cục bộ mới, cho kết quả tốt hiện nay là Minutia Cylinder-Code (MCC).
Hình 2.10. Cấu trúc cục bộ không phù hợp do vấn đề biên
2.4.Biểu diễn dựa trên MCC
Hiện nay, theo các nghiên cứu khác nhau, biểu diễn cấu trúc cục bộ dựa trên MCC [2] là một trong những mô tả dựa trên điểm trạc chính xác nhất. Ƣu điểm chính của biển diễn này so với các biểu diễn cục bộ khác đó là:
- MCC là cách tiếp cận dựa trên cách tiếp cận sử dụng bán kính cố định (fixed-radius) do đó chịu lỗi tốt hơn đối với tình huống phát hiện thiếu điểm trạc hoặc điểm trạc sai so với cách tiếp cận dựa trên láng giềng gần nhất (neighbor-based).
- Không giống nhƣ các cách tiếp cận sử dụng bán kính cố định truyền thống, MCC dựa vào mã hóa có độ dài cố định, điều này giúp việc tính toán độ tƣơng đồng cục bộ đơn giản.
- Vấn đề đƣờng bao biên giới đƣợc giải quyết đơn giản nhờ kết hợp thêm không gian xung quanh.
- Cài đặt dựa trên bit giúp việc đối sánh hình trụ nhanh và đơn giản, giúp giảm thời gian và có thể thực thi hiệu quả trên các CPU đơn giản.
2.4.1. Mô tả biểu diễn MCC
MCC gắn các biểu diễn cục bộ cho mỗi điểm trạc. Mô tả này bao gồm cả quan hệ về khoảng cách và hƣớng giữa điểm trạc và các điểm trạc lân cận và đƣợc biểu diễn nhƣ là một hình trụ với đáy và chiều cao liên quan đến khoảng cách và hƣớng.
Hình 2.11.Biểu diễn hình trụ MCC cho điểm trạc
Hình trụ đƣợc rời rạc hóa thành NC = NSx NSx ND hình khối, mỗi khối sẽ có kích thƣớc đáy là S x S và chiều cao là D , trong đó S = 2R/NS và D = 2π/ND.
Hình 2.12.Chi tiết tính toán cho hình trụ
Với mỗi ô (i, j, k), sẽ gắn với một giá trị Cm(i, j, k) đƣợc tính toán bằng cách tổng hợp các đóng góp của các điểm trạc mtthuộc vào hàng xóm của pim,j. Các điểm trạc đƣợc xác định trong vòng bán kính 3sso với điểm tâm pim,j. Hình 2.14 minh hoạ chi tiết tập các điểm trạc có thể đóng góp vào pim,j.
Hình 2.14.Tập các điểm trạc đóng góp vào m
j i
p,
Đóng góp theo khoảng cách của mtvào pim,j đƣợc định nghĩa theo công thức trong Hình 2.15, sử dụng hàm phân phối chuẩn Gausian với kỳ vọng 0 và phƣơng sai S.
Hình 2.15. Đóng góp theo khoảng cách của mt vào m
j i
Đóng góp của mttheo hƣớng tới dk đƣợc định nghĩa thông qua công thức:
Với GD() là phân phối chuẩn Gausian:
Hình 2.16.Đóng góp của mt theo hướng tới dk
Công thức tính giá trị Cm(i, j, k) theo khoảng cách CmS và đóng góp theo hƣớng D
m
C đƣợc tổng kết theo công thức sau:
Một khối đƣợc coi là hợp lệ (valid) nếu pim,j đƣợc chứa trong vùng giao của hình trụ với bao lồi ngoài của tất cả các điểm trạc T của vân tay. Điều kiện này để đảm bảo tránh xem xét các phần của hình trụ nằm ra ngoài vùng của vân tay do đó có thể chứa các thông tin không thích hợp.
Hình 2.17.Hàm sigmoid
Hình 2.18 minh họa kết quả tính toán hình trụ biểu diễn cho một điểm trạc, các ô sáng màu thể hiện các giá trị tại đó cao hơn.
Hình 2.18.Minh họa các ô của hình trụ thể hiện cho điểm trạc m, ô sáng hơn chỉ giá
trị cao hơn
Một biểu diễn hình trụ cho một điểm trạc đƣợc coi là không hợp lệ nếu: - Có ít hơn minVCô hợp lệ trong hình trụ.
- Có ít hơn minM điểm trạc đóng góp vào hình trụ.
Sau khi loại đi các hình trụ không hợp lệ, sẽ còn lại tập các hình trụ biểu diễn cho các điểm trạc của vân tay.
Hình 2.19.Minh họa ba hình trụ biểu diễn cho ba điểm trạc của vân tay
2.4.2. Tính độ tƣơng đồng giữa các hình trụ
Với hai điểm trạc a và b, ca và cb là hai vector tƣơng ứng đƣợc suy ra các hình trụ biểu diễn hai điểm trạc. Độ tƣơng đồng giữa hai hình trụ đƣợc định nghĩa theo công thức trong Hình 2.20:
Hình 2.20. Độ tương đồng giữa các biểu diễn hình trụ
Nhờ vào biểu diễn vector có độ dài cố định giúp cho quá trình tính toán độ tƣơng đồng giữa các điểm trạc nhanh và đơn giản.
2.5.Ứng dụng của biểu diễn dựa trên Bit
Với thẻ thông minh, bộ xử lý có hạn chế, thích hợp với xử lý trên dấu phẩy tĩnh, và hạn chế việc tính toán trên dấu phẩy động. Các thuật toán đối sánh sử dụng phổ biến trên môi trƣờng máy tính cá nhân hoặc server thƣờng yêu cầu sử dụng các phép toán trên dấu phẩy động nên không thích hợp với ứng dụng sử dụng trên thẻ thông minh.
Biểu diễn MCC hình trụ có thể biểu diễn bởi dãy các bit 0, 1 nhờ vào thay đổi hàm sigmoid bởi hàm chuyển đơn vị.
Hình 2.21.Hàm chuyển về giá trị bit
Điều này cho phép so sánh các cấu trúc cục bộ MCC nhanh chóng bởi so sánh giá trị tƣơng đồng giữa các hình trụ quy về việc so sánh một chuỗi các bit.
Hình 2.22. Đối sánh trên thẻ Match on card sử dụng biểu diễn Bit của MCC
2.6.Kết luận
Nội dung Chƣơng 2 đã nghiên cứu một số thuật toán đối sánh vân tay: đối sánh dựa trên điểm trạc, đối sánh toàn cục, đối sánh cục bộ, từ đó đƣa ra hạn chế của một số biểu diễn truyền thống. Đồng thời đƣa ra biểu diễn cục bộ dựa trên Minutia Cylinder-Code (MCC) là một trong những mô tả dựa trên điểm trạc chính xác nhất. Từ đó có cơ sở thử nghiệm thuật toán đối sánh dựa vào biểu diễn MCC.
Chƣơng 3. THỬ NGHIỆM THUẬT TOÁN ĐỐI SÁNH VÂN TAY DỰA TRÊN BIỂU DIỄN MCC
Trong chƣơng này, luận văn sẽ tiến hành thực nghiệm đánh giá ba biểu diễn vân tay phổ biến, bao gồm: biểu diễn K-plet [3], MTK [9] và MCC trong quá trình đối sánh vân tay để rút ra kết luận.
Để đánh giá các thuật toán khách quan, các thử nghiệm với các thuật toán đối sánh vân tay cùng sử dụng một tập dữ liệu để đánh giá, cùng sử dụng tập các đặc trƣng đƣợc trích xuất từ tập ảnh vân tay và các tham số đƣợc sử dụng trong các thuật toán đối sánh. Chi tiết các bƣớc tiến hành đƣợc trình bày trong các phần tiếp theo:
3.1.Mục đích thử nghiệm
Mục đích thử nghiệm nhằm đƣa ra kết quả so sánh độ chính xác và tốc độ xử lý của biểu diễn MCC so với các biểu diễn K-plet và MTK trên cùng một tập dữ liệu. Nhƣ vậy, nếu sau quá trình thử nghiệm, biểu diễn MCC cho kết quả có độ chính xác và tốc độ xử lý cao hơn hai biểu diễn còn lại thì có thể hiểu biểu diễn MCC có thể áp dụng đƣợc trong thực tế, còn nếu đạt kết quả thấp hơn cần xem xét lại biểu diễn MCC có phù hợp và thỏa mãn nhu của ngƣời sử dụng.
3.2.Quy trình thử nghiệm
Quy trình thử nghiệm ba thuật toán đối sánh vân tay gồm các bƣớc nhƣ Hình 3.1:
Trong bƣớc trích chọn các đặc trƣng điểm trạc: luận văn sử dụng bộ công cụ VeriFinger để trích chọn các đặc trƣng điểm trạc từ ảnh vân tay.
Trong bƣớc xây dựng cấu trúc cục bộ cho biểu diễn K-plet, MTK, MCC: luận văn sử dụng bộ công cụ Miguel [12] để xây dựng các cấu trúc cục bộ.
Trong bƣớc gia cố của các thuật toán đối sánh, luận văn sử dụng phƣơng pháp gia cố biến đổi dựa trên nhiều ứng cử viên [9], cộng với bổ sung kiểm tra các điểm trạc sau quá trình biến đổi đƣợc đề xuất bởi [11].
3.3.Môi trƣờng thử nghiệm
Các thực nghiệm đƣợc tiến hành trên cùng máy laptop với bộ xử lý Intel Celeron Core Duo processor (1.5 GHz), 1GB RAM.
Trong bƣớc gia cố, các thuật toán đối sánh đều sử dụng chung các tham số về ngƣỡng để coi các điểm trạc có thể đối sánh với nhau. Luận văn sử dụng ngƣỡng khoảng cách ts= 12 và ngƣỡng góc lệnh tθ= π/6 theo đề xuất bởi Miguel và cộng sự [9].
Tập dữ liệu đánh giá
Thử nghiệm các thuật toán đối sánh đƣợc thực hiện trên CSDL FVC2002 DB1 gồm 800 ảnh vân tay lấy từ 100 vân tay khác nhau (mỗi vân tay đƣợc lấy mẫu 8 lần). Hình 3.2 minh họa một số vân tay trong CSDL:
Hình 3.2. Một số ảnh vân tay từ CSDL vân tay FVC2002
Từ tập vân tay mẫu tạo ra
các thể hiện còn lại của vân): 100x8x7/2.
- 4950 so sánh các vân tay khác nhau (so sánh các thể hiện đầu tiên của mỗi vân tay với các thể hiện đầu tiên của các vân tay khác): 100x99/2.
Trích chọn thuộc tính
Ảnh vân tay thƣờng có nhiễu, để giảm nhiễu và làm nổi đƣờng vân, luận văn sử dụng công cụ VeriFinger để nâng cao chất lƣợng ảnh cho tập dữ liệu. Hình 3.3 mô tả một số vân tay đã đƣợc nâng cao chất lƣợng sử dụng công cụ VeriFinger.
Hình 3.3. Vân tay được lọc nhiễu và nổi vân sử dụng công cụ VeriFinger
Các ảnh vân tay sau khi đƣợc lọc nhiễu và làm nổi các đƣờng vân sẽ đƣợc sử dụng để trích chọn tập các điểm trạc đặc trƣng đƣợc sử dụng trong thuật toán đối sánh vân tay.
Hình 3.4. Tập các điểm trạc được trích xuất từ vân tay sử dụng công cụ VeriFinger
Tính toán độ tƣơng đồng
Các hệ thống đối sánh tự động cần chuyển số lƣợng các điểm trạc có thể đối sánh giữa hai vân tay sang một giá trị chỉ độ tƣơng đồng giữa hai vân tay. Công thức đánh giá độ tƣơng đồng sau đƣợc sử dụng trong đánh giá:
với k là số lƣợng điểm trạc có thể đối sánh, m và n là số lƣợng điểm trạc tƣơng ứng của hai vân tay tham gia quá trình đối sánh.
3.4.Đánh giá kết quả
Hình 3.5. Độ đo sử dụng trong đánh giá thuật toán
Kết quả đánh giá đƣợc thể hiện thông qua các chỉ số EER, FMR100, FMR1000 và ZeroFMR. Thời gian đối sánh đƣợc thể hiện theo milliseconds.
False Match Rate (FMR): là tỷ lệ loại lỗi xác định nhầm là cùng của một vân tay khi so sánh hai vân tay khác nhau.
cùng một ngón tay là không phù hợp.
FMR100 là tỷ lệ lỗi FNMR mà tại đó FMR là 1% FMR1000 là tỷ lệ lỗi FNMR mà tại đó FMR là 0,1% FMRZero là tỷ lệ lỗi FNMR mà tại đó FMR là 0%
Kết quả đánh giá kết quả của các biểu diễn đƣợc thể hiện trong Bảng 3.1:
Biểu diễn EER FMR 100 FMR 1000 FMR Zero Time (ms)
K-plet 1.52% 1.61% 2.61% 4.42% 29
MTK 1.78% 3.46% 4.14% 5.96% 12
MCC 1.36% 1.61% 2.21% 3.7% 3.45
Bảng 3.1. So sánh độ chính xác và tốc độ xử lý của các biểu diễn
Từ bảng kết quả cho thấy sử dụng biểu diễn MCC cho kết quả chính xác cao hơn và tốc độ xử lý nhanh hơn so với một số biểu diễn khác.
3.5.Kết luận
Nội dung Chƣơng 3 với mục đích quan trọng là tiến hành thử nghiệm