Giới thiệu
Nhận dạng vân tay là phương pháp lâu đời nhất trong nhận dạng sinh trắc học Nó có lịch sử cách đây ít nhất 2200 năm trước công nguyên Từ xa xưa, người Assyri, Trung Quốc và Nhật Bản đã biết sử dụng vân tay để phân biệt cá nhân Năm 1897, nhận dạng vân tay đã được sử dụng để xác minh tội phạm Cho đến nay, ứng dụng nhận dạng vân tay đã vượt ra ngoài phạm vi của khoa học hình sự và được sử dụng ngày càng nhiều trong đời sống xã hội với nhiều mục đích khác nhau, đặc biệt là bảo mật hệ thống Nội dung chương này bao gồm các vấn đề sau đây:
- Giới thiệu khái quát về lịch sử của vân tay
- Sự hình thành và các đặc điểm của vân tay
- Các vấn đề chung của hệ thống nhận dạng vân tay tự động
- Các ứng dụng của nhận dạng vân tay.
Lịch sử của vân tay
Dấu vân tay trên các đầu ngón tay liên quan đến lịch sử lâu đời của loài người Từ thời xa xưa, con người còn là phải trực tiếp dùng tay để săn bắn và hái lượm cũng như leo trèo Các vân tay sẽ giúp ta cầm hoặc nắm chắc các vật trong tay Các vân tay, chỉ tay, gồ nổi và đường rãnh trên da của mỗi người sẽ do các nhân tố di truyền và môi trường quyết định, vì vậy vân tay của mỗi người có thể coi là duy nhất, không ai giống ai Thậm chí ở các cặp song sinh vân tay cũng không giống nhau.
Những khắc họa của vân tay đã được tìm thấy rất nhiều trên các đồ vật của người cổ đại Đây là bằng chứng cho thấy người cổ đại đã có nhận thức về sự khác nhau của các dấu vân tay, tuy nhiên vẫn chưa có cơ sở khoa học cho những nhận thức đó (Lee &
Gaensslen, 2001; Moenssens, 1971) Mãi cho đến thế kỉ 16, kĩ thuật xác định vân tay hiện đại mới ra đời (Cummins & Midlo, 1961; Galton, 1892; Lee & Gaensslen, 2001)
Năm 1684, nhà hình thái học thực vật người Anh, Nehemiah Grew, đã công bố một bài báo khoa học đầu tiên, trong đó báo cáo những nghiên cứu của ông về các đường vân, rãnh vân, và cấu trúc lỗ chân lông trên các vân tay (Lee & Gaensslen, 2001)
Kể từ đó, rất nhiều nhà nghiên cứu đã đầu tư công sức vào nghiên cứu vân tay
Năm 1788, công trình nghiên cứu của Mayer đã mô tả chi tiết về sự hình thành cấu trúc của vân tay, ông còn xác định và đặc trưng hóa một số các đặc điểm của đường
Chương 1 Tổng quan về nhận dạng vân tay đăng ký thương mại, đây là một trong những cột mốc quan trọng nhất trong nghiên cứu khoa học về nhận dạng vân tay Purkinje, 1823, là người đầu tiên đã đề xuất một phương pháp phân loại vân tay, ông chia vân tay thành chín loại dựa trên cấu trúc của các đường vân Henry Fauld, 1980, lần đầu tiên gợi ý tính duy nhất của vân tay dựa trên kinh nghiệm quan sát của ông (Moenssens, 1971) Cùng thời điểm đó, Herschel đã khẳng định rằng ông đã có kinh nghiệm 20 năm về nhận dạng vân tay (Lee &
Gaensslen, 2001; Moenssens, 1971) Những sự nghiên cứu này đã tạo nền tảng cho nhận dạng vân tay hiện đại Vào thế kỷ 19, Francis Galton đã thực hiện một nghiên cứu quy mô về vân tay (Galton, 1982) Vào năm 1888, ông đã giới thiệu các đặc trưng của minutiae được sử dụng cho so sánh vân tay
Một tiến bộ quan trọng trong nhận dạng vân tay là vào năm 1899, Edward Henry đã thiết lập một “hệ thống Henry” về phân loại vân tay (Lee & Gaensslen, 2001) Đầu thế kỷ hai mươi, các dạng vân tay đã được nghiên cứu một cách thấu đáo Các nguyên lý của vân tay (Moenssens, 1971) được tóm tắt dưới đây:
1 Các đường vân và rãnh vân có những đặc trưng khác nhau đối với các vân tay khác nhau;
2 Hình dạng vân tay có thể khác nhau với mỗi người, nhưng chỉ trong giới hạn cho phép để có thể phân loại một cách hệ thống;
3 Hình dạng và những chi tiết minutiae của các đường vân và rãnh vân của một người là không bao giờ thay đổi
Nguyên lý đầu tiên là cơ sở cho nhận dạng vân tay, và nguyên lý thứ hai là cơ sở của phân loại vân tay Đầu thế kỷ hai mươi, nhận dạng vân tay được chấp nhận như một phương pháp xác minh cá nhân và trở thành thủ tục pháp lý chuẩn Các cơ quan xác định vân tay được triển khai trên toàn cầu và cơ sở dữ liệu vân tay tội phạm được thiết lập (Lee &
Gaensslen, 2001) Các kỹ thuật nhận dạng vân tay khác nhau, bao gồm thu nhận vân tay, phân loại vân tay, và khớp phân tay được phát triển Chẳng hạn, cơ quan xác định vân tay của FBI được thành lập năm 1924 với cơ sở dữ liệu gồm 810,000 thẻ vân tay (Federal Bureau of Investigation, 1984, 1981)
Với sự phát triển nhanh chóng của ứng dụng nhận dạng vân tay trong pháp lý, các cơ sở dữ liệu vân tay trở nên lớn đến mức việc xác định vân tay thủ công là không thể làm được Lấy ví dụ, tổng số vân tay trong cơ sở dữ liệu của FBI hiện tại trên 200 triệu và còn tiếp tục tăng Với hàng nghìn các yêu cầu được nhận hàng ngày, thì thậm trí với một đội hơn 1300 chuyên gia vân tay cũng không thể phản hồi các yêu cầu này kịp
Chương 1 Tổng quan về nhận dạng vân tay thời (Lee & Gaensslen, 2001) Đầu những năm 1960, FBI, cùng với Home Office ở Anh, và cảnh sát Paris đã đầu tư với quy mô lớn để phát triển các hệ thống nhận dạng vân tay tự động (AFIS) (Lee & Gaensslen, 2001) Dựa trên những quan sát xem các chuyên gia vân tay thực hiện nhận dạng vân tay thế nào, ba vấn đề chủ yếu trong thiết kế AFIS được xác định và nghiên cứu: thu nhận vân tay kỹ thuật số, lấy các đặc trưng của đường vân cục bộ, và khớp các mẫu đặc trưng của đường vân Nỗ lực của họ đã thành công đến mức ngày nay hầu hết các cơ quan thi hành luật pháp trên toàn cầu đều sử dụng AFIS Các hệ thống này đã cải thiện đáng kể năng suất của các cơ quan giám định vân tay, đồng thời giảm chi phí thuê và đào tạo các chuyên gia vân tay
Công nghệ nhận dạng vân tay tự động đã phát triển nhanh chóng, vượt ra ngoài phạm vi ứng dụng của pháp lý và có mặt cả ở các ứng dụng đời thường Trên thực tế, các hệ thống sinh trắc học cho nhận dạng vân tay đã trở nên phổ biến đến mức khi ta nói đến hệ thống sinh trắc học thì cũng đồng nghĩa với việc nói đến hệ thống nhận dạng vân tay.
Sự hình thành các vân tay
Vân tay được hình thành hoàn thiện sau bảy tháng phát triển của bào thai và hình dạng các đường vân tay không thay đổi trong suốt cuộc đời của mỗi người ngoại trừ tai nạn làm biến dạng hoặc mất các ngón tay (Babler, 1991) Có những trường hợp tội phạm đã dùng đá nhám mài cho mất dấu vân tay nhưng vô ích, lớp da mới mọc lên lại mang đầy đủ dấu ấn của vân tay cũ Thuộc tính này làm cho vân tay là một đặc điểm nhận dạng sinh trắc học rất hiệu quả
Nói chung, cơ cấu sinh học của vân tay là hệ quả của sự tương tác giữa các gen và môi trường Các vân tay bắt đầu khác nhau từ khi con người còn là bào thai Thứ nhất là do sự phát triển kích thước của gan bàn tay, các ngón tay, lòng bàn chân, các ngón chân Thứ hai là do sự tác động của môi trường trong dạ con đến các bàn tay, bàn chân là không giống nhau Tóm lại, có rất nhiều sự biến đổi trong quá trình hình thành vân tay, và làm cho các vân tay không thể tuyệt đối giống nhau.
Tính duy nhất của các vân tay
Mặc dù vân tay vẫn được biết đến như một thẻ căn cước chứng minh nhân dân, nhưng tính duy nhất của nó vẫn chỉ dựa trên những kinh nghiệm quan sát Do vậy, với sự ứng dụng ngày càng rộng rãi của vân tay, người ta cũng lo ngại về cơ sở khoa học của nó Sự sai sót trong nhận dạng vân tay có thể dẫn đến hậu quả nặng nề, đặc biệt là trong giám định hình sự Hơn nữa, các hệ thống nhận dạng vân tay tự động không sử
Chương 1 Tổng quan về nhận dạng vân tay dụng toàn bộ thông tin trong các vân tay, mà chỉ trích chọn một phần các đặc điểm trong đó và không có sự giám sát của các chuyên gia vân tay (Maltoni, et al., 2003)
Phần này sẽ giới thiệu một số quan điểm về tính duy nhất của vân tay
Vài năm sau khi Galton (1892) và Henry (1900) công bố rộng rãi những nghiên cứu đầu tiên về vân tay, báo chí lại một lần nữa đã khẳng định rằng dấu vân tay thực sự là duy nhất (Cole, 2001):
“Khả năng hai người sinh ra có cùng dấu vân tay chỉ xuất hiện một lần trong suốt quá trình tồn tại của hệ mặt trời.” – dòng tít trên tờ Harper (1910)
“Cứ 10 48 năm mới tìm thấy hai vân tay giống nhau” – Scientific American, 1911
Tính duy nhất của vân tay đã được chấp nhận một thời gian dài do thiếu những quan điểm đối lập Kết quả là, nhận dạng bằng vân tay được xem như một phương pháp nhận dạng cá nhân hoàn hảo Tuy nhiên, gần đây đã xuất hiện những nghi vấn về tính duy nhất của vân tay Năm 1993, sau vụ kiện của Daubert với công ty dược Merrel Dow, tòa án tối cao Mĩ đã đòi hỏi phải thiết lập độ tin cậy cho các chứng cớ khoa học Điều này có ảnh hưởng sâu sắc đến việc thừa nhận các bằng chứng giám định vân tay trong các tòa án Tòa án này đã tuyên bố rằng trước khi quyết định công nhận bất kỳ bằng chứng khoa học nào, thì phải xem xét các nhân tố sau (Maltoni, et al., 2003):
1 Kỹ thuật hoặc phương pháp luận liên quan đến bằng chứng khoa học đó có phụ thuộc vào một giả thiết thống kê nào không?
2 Đã xây dựng một phương pháp đánh giá lỗi cho chứng cớ khoa học chưa?
3 Đã có các tiêu chuẩn để thẩm định các quá trình của kỹ thuật đó hay không và đã được xác nhận chưa?
4 Nó đã được xem xét và công bố chưa?
5 Nó có được chấp nhận rộng rãi không?
Sau đó, lần đầu tiên nhận dạng vân tay đã bị các luật sư bào chữa phản bác trong một phiên tòa tại Mĩ (1999), với quan điểm rằng giả thuyết cơ sở về tính duy nhất của vân tay không được kiểm tra một cách khách quan và không có phương pháp đánh giá lỗi tiềm tàng trong quá trình so sánh vân tay Dù sao, lời bào chữa trên nhằm bác bỏ chứng cớ vân tay đã bị từ chối 7-1-2002, một thẩm phán của toà án liên bang đã phán quyết rằng, thiếu những sự đánh giá tin cậy về độ chính xác trong khi so sánh vân tay, các chuyên gia vân tay không thể chứng tỏ chắc chắn được hai dấu vân tay có phải từ
Chương 1 Tổng quan về nhận dạng vân tay cùng một ngón tay hay không Mặc dù vậy sau đó, cũng chính ông ta bỏ phán quyết này vào ngày 13-3-2002 (Maltoni, et al., 2003)
Nhận dạng vân tay dựa trên hai giả thuyết cơ bản sau: các chi tiết vân tay tồn tại vĩnh viễn, và vân tay của một người là duy nhất Tính đúng đắn của giả thuyết đầu tiên đã được thẩm định dựa trên những quan sát kinh nghiệm cũng như dựa trên giải phẫu và sự tạo thành hình thái của bề mặt da vân tay bị chà sát Nhưng giả thiết thứ hai đã gặp phải không ít sự nghi ngờ trong một số phiên tòa Khái niệm tính duy nhất của vân tay đã được các chuyên gia chấp nhận rộng rãi dựa trên sự kiểm tra trực tiếp trên hàng triệu các vân tay Tuy nhiên, cơ sở khoa học nền tảng của tính duy nhất vẫn chưa được nghiên cứu hoặc thẩm định một cách rõ ràng Tháng 3-2000, bộ tư pháp Mỹ đã thừa nhận là chưa có cuộc kiểm tra nào được thực hiện và công nhận sự cần thiết của một nghiên cứu như vậy (www.ojp.usdoj.gov) Viện tư pháp quốc gia đã phản hồi lại bằng việc xác định hai chủ đề nghiên cứu cơ bản chính sau: đo lường số chi tiết có thể so sánh trong một vân tay, và đo lường số chi tiết phù hợp giữa hai vân tay
Với sự đòi hỏi cấp bách cần có một cơ sở khoa học cho vấn đề duy nhất của vân tay, nhiều giải pháp đã được đề xuất Đa số các giải pháp này đều có tư tưởng chung là đánh giá xác suất để hai vân tay thuộc hai ngón tay khác nhau bị khớp thành giống nhau (xác suất khớp sai) Khi so sánh vân tay bằng hệ thống tự động, thì xác xuất khớp sai cũng đồng nhất với tỉ lệ khớp sai (FMR) Nếu tỉ lệ lỗi trong so sánh vân tay được đánh giá một cách tin cậy, thì đó sẽ là cơ sở để nhận dạng vân tay được chấp nhận trong các tòa án luật pháp như một bằng chứng xác đáng Để giải quyết vấn đề duy nhất, cần định nghĩa một biểu diễn của vân tay và phương pháp so sánh độ tương tự giữa hai vân tay Vân tay có thể được biểu diễn dựa trên một số đặc trưng khác nhau, ví dụ như hình dáng của các đường vân, tần số vân, số lượng vùng đặc biệt (vòng lặp, hoặc các điểm delta), kiểu vân, hướng vân, vị trí các minutiae, số đường vân giữa các cặp minutiae, vị trí của các điểm lõi Tất cả những đặc điểm này góp phần tạo nên tính duy nhất của vân tay (Maltoni, et al., 2003).
Hệ thống nhận dạng vân tay tự động
Kiến trúc chung của một hệ thống nhận dạng vân tay tự động được mô tả như hình 1.1, bao gồm 4 phần sau (Jain & Pankanti, 2000):
- Giao diện đọc vân tay: cung cấp một cơ cấu để thu nhận ảnh vân tay đầu vào
- Cơ sở dữ liệu hệ thống: lữu trữ thông tin về các dấu vân tay
Chương 1 Tổng quan về nhận dạng vân tay
- Mô đun kết nạp vân tay: có nhiệm vụ kết nạp các dấu vân tay của các đối tượng vào cơ sở dữ liệu của hệ thống Khi một ảnh vân tay của một đối tượng được kết nạp, một thuật toán trích chọn minutiae sẽ được áp dụng để tìm các mẫu minutiae Sau đó một thuật toán kiểm tra chất lượng được sử dụng để đảm bảo trong cơ sở sữ liệu chỉ bao gồm những vân tay có chất lượng tốt (phải tìm thấy một lượng tối thiểu các minutiae trong ảnh vân tay) Nếu ảnh vân tay có chất lượng xấu, thì sẽ được nâng cao để cải thiện tính rõ ràng của các cấu trúc vân và đánh dấu các vùng không thể khôi phục được Ảnh nâng cao sẽ được trích chọn minutiae
- Mô đun xác thực vân tay: so sánh vân tay của đối tượng cần xác thực với các vân tay trong cơ sở dữ liệu của hệ thống Ảnh vân tay cần xác thực được thu nhận, sau đó các mẫu minutiae được trích chọn và được so sánh với các mẫu minutiae có trong cơ sở dữ liệu
Hình 1.1: Kiến trúc chung của hệ thống nhận dạng vân tay tự động.
Thu nhận và lưu trữ vân tay
Một ảnh vân tay có thể được phân thành hai loại là off-line và live-scan Ảnh off- line được tạo ra bằng cách bôi mực lên các ngón tay và nhấn các ngón tay đó lên giấy
Sau đó mẫu vân tay được số hóa bằng cách dùng máy scan hoặc máy ảnh có độ phân giải cao Ảnh live-scan được thu nhận bằng cách dùng một bộ cảm biến quét trực tiếp các đầu ngón tay Một loại ảnh vân tay off-line đặc biệt nữa gọi là latent, được lấy mẫu tại các hiện trường Chất nhờn trên da làm vân tay bị in lên bề mặt của vật mà tay chạm vào Các mẫu vân tay có thể được lấy từ bề mặt bằng cách dùng các kỹ thuật hóa học (Maltoni, et al., 2003) Đọc vân tay
Trích chọn minutiae CSDL vân tay
Mô đun kết nạp vân tay
Mô đun xác thực vân tay
Chương 1 Tổng quan về nhận dạng vân tay
Các tham số chính tạo nên đặc điểm của ảnh vân tay số là: độ phân giải, vùng cảm biến vân tay, số điểm ảnh, độ chính xác hình học, độ tương phản, độ méo hình học
Nhằm mục đích làm tăng sự tương thích giữa các ảnh vân tay, và đảm bảo các ảnh vân tay thu nhận được có chất lượng tốt, FBI đã phát hành một tập các đặc tả quy định chất lượng, khuôn dạng cho cả ảnh vân tay và các máy scan off-line/live-scan theo chuẩn của FBI Đa số các thiết bị quét live-scan sử dụng cho mục đích thương mại đều không theo các chuẩn đặc tả của FBI, nhưng nhỏ gọn, rẻ và thân thiện hơn với người dùng (Maltoni, et al., 2003)
Ngoài các máy quét quang học, hiện nay còn có các cảm biến bán dẫn cho phép thu nhận vân tay, có thể dễ dàng đưa vào các máy tính laptop, điện thoại di động,…
Hình 1.2: Cảm biến vân tay
Vấn đề lưu trữ các ảnh vân tay dạng thô là một bài toán khó đối với các hệ thống nhận dạng vân tay tự động lớn Năm 1995, FBI lưu trữ trên 200 triệu thẻ vân tay, và con số này tăng rất nhanh với số lượng 30,000 đến 50,000 thẻ mới mỗi ngày Mặc dù giải pháp số hóa các thẻ vân tay có thể là sự lựa chọn tốt nhất, nhưng việc lưu trữ có thể trở nên quá cồng kềnh Trên thực tế, mỗi thẻ vân tay khi số hóa ở độ phân giải 500 dpi yêu cầu khoảng 10 Mbytes bộ nhớ Như vậy 200 triệu thẻ sẽ cần khoảng 2000 terabytes Do vậy, rất cần phải có một kĩ thuật nén hiệu quả Không may là các phương pháp nén không mất thông tin được biết đến và các phương pháp JPEG đều không giải quyết được vấn đề này một cách triệt để Một kỹ thuật nén mới (với lượng thông tin mất mát nhỏ có thể chấp nhận được), gọi là WSQ (Wavelet Scalar Quantization), trở thành chuẩn FBI cho nén ảnh vân tay 500 dpi (Maltoni, et al., 2003).
Biểu diễn vân tay và nhận dạng đặc điểm
Biểu diễn vân tay là phần cốt lõi trong thiết kế một hệ thống nhận dạng vân tay và có ảnh hưởng nhiều đến việc thiết kế các phần sau của hệ thống Các giá trị cường độ
Chương 1 Tổng quan về nhận dạng vân tay những đặc điểm nổi bật của ảnh đầu vào mà có thể phân biệt giữa các vân tay cũng như bất biến đối với mỗi người
Một biểu diễn ảnh vân tay tốt phải hội tụ đủ hai thuộc tính sau: tính nổi bật (saliency) và tính tương thích (suitability) Tính nổi bật có nghĩa là một biểu diễn nên chứa thông tin riêng biệt vân tay Tính tương thích nghĩa là biểu diễn có thể được trích chọn, lưu trữ dễ dàng dưới một dạng nén, và thuận lợi cho việc so sánh vân tay (Maltoni, et al., 2003)
Biểu diễn vân tay bằng ảnh, là biểu diễn dựa trên thông tin cường độ sáng của các điểm ảnh Đây là loại biểu diễn phổ biến trong các hệ thống nhận dạng Tuy nhiên loại biểu diễn này có thể bị giới hạn bởi các nhân tố như sự biến đổi độ sáng, biến đổi chất lượng ảnh, các vết bẩn, và độ méo trong ảnh vân tay Hơn nữa, biểu diễn dựa trên ảnh đòi hỏi cần không gian lưu trữ rất lớn Mặt khác, biểu diễn bằng ảnh sẽ đảm bảo lưu được nhiều thông tin tối đa, miền ứng dụng rộng hơn
Một mẫu vân tay khi được phân tích ở các cấp độ khác nhau, sẽ biểu lộ ra các loại đặc điểm khác nhau Ở mức độ bao quát, sự bố trí của các đường vân tạo ra một số điểm đặc biệt như điểm lặp, và điểm delta Các điểm đặc biệt và hình dạng các đường vân đóng vai trò rất quan trọng trong phân loại (classfication) và chỉ mục (indexing) vân tay, tuy vậy chúng chưa đủ để nhận dạng chính xác một vân tay Ở mức này, còn có một số đặc điểm khác của vân tay như hình dạng bên ngoài của vân, hướng vân, và tần số vân
Hình 1.3: Các hình dạng của vân tay; (a) hình cung; (b) hình lều; (c) lặp trái; (d) lặp phải; (e) hình xoắn; (f) lặp kép; các vị trí có hình tam giác là các điểm delta
Chương 1 Tổng quan về nhận dạng vân tay Ở mức cục bộ, có tổng cộng 150 đặc điểm vân cục bộ khác nhau, gọi là các minutiae (chi tiết vụn vặt) (Moenssens, 1971) Các đặc điểm này phục thuộc vào điều kiện nhấn tay mạnh hay nhẹ và chất lượng ảnh vân tay, và hiếm khi ta quan sát thấy trên các vân tay Có hai đặc điểm dễ nhận thấy nhất của vân tay là: điểm kết thúc vân (ridge ending), và điểm rẽ nhánh của vân (ridge bifurcation) Điểm kết thúc vân được định nghĩa là vị trí đường vân bị cụt đột ngột Điểm rẽ nhánh của vân là điểm mà đường vân bị tách ra làm các nhánh Nói chung, các minutiae trong vân tay có tính ổn định cao và ít phụ thuộc vào các điều kiện nhấn tay Mặc dù biểu diễn dựa trên minutiae có tính nổi bật cao, nhưng việc trích chọn các minutiae tự động sẽ khó đạt được độ tin cậy cao đối với những vân tay chất lượng thấp
Hình 1.4: Minutiae; (a) hai loại minutiae chính, là điểm kết thúc và điểm rẽ nhánh; (b) vị trí các minutiae trong một ảnh vân tay Ở mức độ cao hơn, ta có thể tìm thấy các chi tiết bên trong đường vân Đó thường là các lỗ chân lông mồ hôi (pore), các vị trí và hình dạng của nó có sự phân biệt khá lớn Tuy nhiên, việc trích chọn các đặc điểm này chỉ khả thi đối với các ảnh vân tay có độ phân giải cao (1000 dpi) Vì vậy loại biểu diễn này không phổ biến trong hầu hết các ứng dụng
Hình 1.5: Các chi tiết lỗ chân lông ở ảnh vân có độ phân giải 1000 dpi
Chương 1 Tổng quan về nhận dạng vân tay
So sánh vân tay
So sánh các ảnh vân tay là một vấn đề rất khó, bởi có sự thay đổi rất lớn trong các lần nhấn tay khác nhau Các nhân tố chính gây ra sự thay đổi này là: sự dịch chuyển, góc xoay, các vân bị chồng một phần lên nhau, độ méo không tuyến tính, độ nhấn tay thay đổi, điều kiện da thay đổi, nhiễu, và các lỗi trích chọn đặc điểm Vì vậy đôi khi các vân tay từ một ngón tay trông rất khác nhau, trong khi đó các vân tay từ các ngón khác nhau lại có thể rất giống nhau Để có thể khẳng định hai vân tay có giống nhau hay không, phải đánh giá các nhân tố sau (Maltoni, et al., 2003):
- Sự tương đồng về hình dạng mẫu của toàn bộ vân tay: nghĩa là hai vân tay phải có cùng kiểu giống nhau
- Phù hợp định tính: đòi hỏi các minutiae tương ứng với nhau thì phải giống nhau
- Phù hợp định lượng: nghĩa là phải tìm thấy một số tối thiểu các minutiae tương ứng với nhau (theo quy định luật ở Mỹ, tối thiểu là 12 chi tiết)
- Các chi tiết minutiae tương ứng với nhau phải có sự tương quan giống nhau
Trong thực tế, vân tay được so sánh thông qua các giao thức phức tạp Những chuyên gia vân tay phải tuân theo một biểu đồ tiến trình có sẵn để thực hiện so sánh vân tay
So sánh vân tay tự động không cần thiết phải theo các nguyên tắc giống nhau Mặc dù khớp vân tay tự động có quy trình giống với quy trình khớp vân tay thủ công, song một số lượng lớn cách tiệp cận đã được thiết kế cách đây hơn 40 năm, và nhiều hệ thống đã được thiết kế để thực hiện trên máy tính Các cách tiếp cận so sánh vân tay được phân loại như sau (Maltoni, et al., 2003):
- So sánh dựa trên sự tương quan: hai ảnh vân tay được đặt chồng lên nhau và sự khác nhau trong tương quan của các điểm ảnh tương ứng sẽ được tính toán (sự dịch chuyển, góc xoay);
- So sánh dựa trên minutiae: các minutiae được tìm thấy từ hai vân tay và được lưu thành một tập các điểm trên mặt phẳng hai chiều Sau đó khớp các minutae tương ứng giữa vân tay mẫu và vân tay đầu vào, tạo thành một tập gồm tối đa các cặp minutiae tương ứng nhau
Chương 1 Tổng quan về nhận dạng vân tay
- So sánh dựa trên đặc điểm của đường vân: Tìm minutiae sẽ khó khăn trong các ảnh vân tay chất lượng tồi, trong khi đó các đặc điểm của đường vân (như hướng và tần số cục bộ, hình dạng vân, thông tin kết cấu) có thể đáng tin cậy hơn, mặc dù tính phân biệt của các đặc điểm này hơi thấp.
Phân loại và chỉ mục vân tay
Hàng ngày, các hệ thống nhận dạng vân tay phải thu thập và lưu trữ một số lượng lớn các vân tay Để tìm vân tay tự động, vân tay đầu vào phải so sánh với rất nhiều vân tay trong cơ sở dữ liệu Để giảm thời gian tìm kiếm và độ phức tạp tính toán, cần thiết phải phân loại những vân tay theo một cách nhất quán và chính xác, để ảnh vân tay đầu vào chỉ phải so sánh với một tập con của cơ sở dữ liệu vân tay Phân loại vân tay là kỹ thuật để gán một vân tay vào một trong các loại vân đã được xác định trước
Phân loại vân tay có thể được xem như giai đoạn so sánh vân ở mức thô Chẳng hạn, nếu cơ sơ dữ liệu vân tay được chia thành năm lớp, và một bộ phân loại vân tay đưa ra kết quả ảnh vân tay đầu vào có thể thuộc một trong hai lớp với mức độ chính xác rất cao, khi đó hệ thống nhận dạng chỉ cần tìm hai trong năm lớp, do đó theo lý thuyết sẽ giảm không gian tìm kiếm đi 2.5 lần Đáng tiếc là chỉ có một số lượng hạn chế các loại vân tay chính (khoảng 5 loại), việc phân vân tay thành các loại là không nhất quán, và có nhiều vân tay nhập nhằng Trên thực tế, định nghĩa của mỗi loại vân tay rất phức tạp và mập mờ Một chuyên gia vân tay phải có rất nhiều kinh nghiệm mới có thể phân loại vân tay một cách hợp lý Khoảng 17% trong số 4000 ảnh vân tay trong cơ sở dữ liệu NIST 4 có hai sự phân loại khác nhau (Watson & Wilson, 1992) Điều này có nghĩa là ngay cả các chuyên gia cũng không đồng ý về phân loại vân tay chuẩn của khoảng 17% ảnh vân tay trong cơ sở dữ liệu này Do đó trong thực tế, phân loại vân tay không tránh khỏi các lỗi, và việc tìm kiếm vân tay trong các cơ sở dữ liệu lớn có tính chọn lọc thấp Để khắc phục điều này, một số tác giả đã đề xuất các phương pháp dựa trên “phân loại liên tục” hoặc dựa trên các kĩ thuật chỉ mục khác nhau Trong phân loại liên tục, vân tay không được chia thành các lớp độc lập nhau, mà được đặc trưng hóa bởi một vector, trong đó tổng kết các đặc điểm chính của vân tay đó Các đặc trưng liên tục được sử dụng cho quá trình chỉ mục các vân tay trong các cấu trúc dữ liệu không gian và cho quá trình truy lục vân tay bằng các phương tiện truy vấn không gian
Chương 1 Tổng quan về nhận dạng vân tay
Ứng dụng của nhận dạng vân tay
Công nghệ nhận dạng vân tay đã phát triển rất nhanh chóng và được sử dụng rộng rãi trong ngành pháp lý như nhận dạng tội phạm và đảm bảo an ninh trong các nhà tù
Ngày nay nhận dạng vân tay có tiềm năng ứng dụng rất lớn trong các lĩnh vực dân sự
Bảng 1.1 nêu một số ứng dụng của nhận dạng vân tay trong các lĩnh vực khác nhau:
Pháp lý Chính phủ Thương mại
Nhận dạng tử thi, Điều tra tội phạm, Tìm trẻ thất lạc,…
Chứng minh thư, Bằng lái xe, Bảo hiểm xã hội,
Hộ chiếu,… Đăng nhập vào mạng, Bảo mật dữ liệu, Thương mại điện tử, Truy cập Internet, ATM, thẻ tín dụng, Điện thoại di động, Đào tạo từ xa, Khóa,…
Bảng 1.1 Khi công nghệ vân tay trở nên hoàn thiện, thì sự tương tác giữa thị trường, công nghệ, và các ứng dụng sẽ gia tăng nhanh chóng Sự tương tác này ảnh hưởng bởi giá trị gia tăng của công nghệ, sự nhạy bén của người dùng, và sự tin tưởng của người dùng với các nhà cung cấp dịch vụ Ta chưa đoán trước được trong tương lai công nghệ vân tay sẽ phát triển thế nào, nhưng có thể chắc chắn rằng các ứng dụng của nhận dạng vân tay sẽ ảnh hưởng sâu rộng đến công việc và đời sống hàng ngày của con người.
NÂNG CAO CHẤT LƯỢNG ẢNH VÂN TAY
Giới thiệu
So sánh vân tay tự động phụ thuộc vào việc so sánh đặc điểm của các đường vân cục bộ và các mối quan hệ giữa các đường vân để nhận diện một cá nhân Một bước quan trọng trong so sánh vân tay là tự động trích chọn các minutiae từ ảnh vân tay với độ tin cậy cao, tuy nhiên đây là một vấn đề khó Quá trình trích chọn các minutiae phụ thuộc nhiều vào chất lựợng của ảnh vân tay đầu vào Trong một ảnh vân tay lý tưởng, các đường vân và rãnh vân nằm xen kẽ nhau và có hướng cục bộ giống nhau, còn các minutiae là các điểm dị thường của đường vân, ví dụ như điểm kết thúc và điểm rẽ nhánh Trong trường hợp này, các đường vân có thể được phát hiện dễ dàng và các minutiae có thể được định vị một cách chính xác từ các đường vân nhị phân Hình 1.4b là một ví dụ về ảnh vân tay chất lượng tốt Tuy nhiên trong thực tế, do có sự khác nhau trong các lần nhấn ngón tay, hình dạng đường vân, điều kiện của da tay, các thiết bị thu nhận vân, và thái độ thiếu hợp tác của những đối tượng cần lấy vân, dẫn tới một lượng đáng kể các vân tay có chất lượng kém Các cấu trúc vân trong các ảnh vân tay chất lượng kém không lúc nào cũng rõ ràng và do đó chúng không được phát hiện một cách chính xác Điều này dẫn tới một số vấn đề sau (Hong, Wan, Jain, 1998):
- Phát sinh một số lượng đáng kể các minutiae sai,
- Nhiều minutiae đúng không được nhận dạng,
- Phát sinh nhiều lỗi định vị (vị trí và hướng)
Hình 2.1: Các ảnh vân tay có chất lượng kém
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.1 là một ví dụ về các ảnh vân tay chất lượng rất kém, các cấu trúc vân bị sai hoàn toàn Để đảm bảo thuật toán trích chọn minutiae hoạt động tốt, thì cần thiết phải có một giai đoạn nâng cao ảnh để cải thiện sự rõ ràng của các cấu trúc vân
Hình 2.2: Các loại vùng vân tay; (a) vùng vân tốt; (b) vùng vân xấu có thể khôi phục; (c) vùng vân xấu không thể khôi phục
Một chuyên gia vân tay có thể xác định chính xác các minutiae theo nhiều phương pháp khác nhau, ví dụ như xét hướng cục bộ, tính liên tục của vân, xu hướng đi của đường vân,…, chỉ cần cấu trúc các đường vân và rãnh vân không bị mất hoàn toàn Ta có thể phát triển một thuật toán nâng cao ảnh dựa theo những phương pháp này để cải thiện sự rõ ràng của cấu trúc vân Nói chung, với một ảnh vân tay, các vùng trên ảnh có thể được chia làm 3 loại (Hong, Wan, Jain, 1998) (hình 2.2):
- Vùng vân tốt: là vùng có các đường vân và rãnh vân rõ ràng, phân biệt với nhau, nhờ đó thuật toán nhận dạng minutiae có thể làm việc hiệu quả
- Vùng vân xấu có thể khôi phục: là nơi các đường vân và rãnh vân bị lỗi bởi một số ít các vết gấp hoặc vết nhòe Nhưng vẫn nhìn được và các vùng lân cận có thể cung cấp đủ thông tin chính xác về cấu trúc vân và rãnh
- Vùng vân xấu không thể khôi phục: là vùng mà các đường vân và rãnh vân bị lỗi do nhiều nhiễu hoặc bị méo, do đó không thể nhìn được các đường vân và rãnh vân Các vùng lân cận không cung cấp đủ thông tin về cấu trúc vân và rãnh đúng
Mục đích của thuật toán nâng cao là cải thiện tính rõ ràng của các cấu trúc vân trong các vùng vân có thể khôi phục, mặt khác xóa các vùng vân không thể khôi phục
Quá trình nâng cao không được làm sai lệch cấu trúc của đường vân Điều này rất quan trọng, vì sự sai lệch có thể dẫn đến nhận dạng sai người sở hữu vân tay đó
Nâng cao ảnh vân tay có thể trên hai loại ảnh là ảnh vân nhị phân và ảnh cấp xám Ảnh vân nhị phân là ảnh mà các điểm trên đường vân được gán giá trị 1 và không phải
Chương 2 Nâng cao chất lượng ảnh vân tay vân thì gán giá trị 0 Ảnh nhị phân thu được bằng cách sử dụng một thuật toán trích chọn vân trên một ảnh đa cấp xám Do các đường vân và rãnh vân trong ảnh vân tay thay đổi và chạy song song với nhau trong một vùng cục bộ, nên một số phương pháp đơn giản có thể được sử dụng để tách các vân sai khỏi cấu trúc vân đúng trong ảnh vân nhị phân Tuy nhiên, sau khi sử dụng thuật toán trích chọn vân trên các ảnh cấp xám gốc, thông tin về cấu trúc vân chính xác thường bị mất phụ thuộc vào độ tin cậy của thuật toán Vì vậy, nâng cao trên ảnh vân nhị phân có nhiều hạn chế
Trong ảnh vân cấp xám, các đường vân và rãnh trong một vùng cục bộ tạo nên một mặt sóng dạng sin có hướng và tần số xác định Một số kỹ thuật tận dụng những thông tin này đã được đề xuất để nâng cao ảnh vân cấp xám Tuy nhiên, các thuật toán trích chọn các thông tin hướng và tần số thường giả định rằng các hướng vân cục bộ có thể được đánh giá tin cậy Trên thực tế, đối với các ảnh có chất lượng xấu thì giả định này không đúng
Nội dung chương này gồm các phần chính sau:
- Phân tích các đặc điểm của vân tay và ảnh vân tay, biểu diễn ảnh vân tay
- Giới thiệu một số kỹ thuật và thuật toán nâng cao ảnh vân tay thông dụng.
Ảnh vân tay
Một ảnh vân tay được mô tả dựa trên các tham số chính sau: Độ phân giải: chỉ số điểm ảnh trong mỗi inch (dpi) 500 dpi là độ phân giải nhỏ nhất của các máy scan theo chuẩn FBI và nhiều loại máy thương mại khác; 250 đến
300 dpi là độ phân giải tối thiểu cho phép các thuật toán trích chọn định vị các minutiae trong ảnh vân tay Giảm độ phân giải của ảnh vân tay đồng nghĩa với việc tìm các đường vân và rãnh vân khó khăn hơn, tách các điểm minutiae cũng trở nên phức tạp hơn Các ảnh ở độ phân giải từ 200 đến 300 dpi chỉ thích hợp đối với các kỹ thuật tìm độ tương quan (Wilson, Watson, & Paek, 2000)
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.3: Các ảnh vân tay có độ phân giải khác nhau
Vùng cảm biến vân tay: Kích thước vùng cảm biến vân tay của máy quét vân là một tham số cơ bản Nếu vùng cảm biến càng lớn thì càng thu nhận được nhiều đường vân và rãnh vân, do đó càng tăng độ tin cậy của nhận dạng vân tay Với một vùng lớn hơn hoặc bằng 1 x 1 inch vuông (theo chuẩn FBI) là đủ để thu nhận đầy đủ một vân tay trong một lần nhấn ngón tay
Số điểm ảnh: Số điểm ảnh trong một ảnh vân tay có thể được tính toán từ độ phân giải và vùng thu nhận vân tay: một máy quét vân tay làm việc ở độ phân giải r dpi trên một vùng cảm biến có kích thước height(h) x width(w) inch sẽ có rh x rw điểm ảnh
Nếu kích thước của vùng cảm biến được đo lường bằng mm , thì số điểm ảnh sẽ là: r(h/25.4) x r(w/25.4) Ví dụ, một máy quét làm việc ở độ phân giải 500 dpi trên vùng cảm ứng rộng 20.32 x 15.24 mm , thì ảnh thu nhận sẽ có 500(20.32/25.4) x 500(15.24/25.4)@0 x 300 điểm ảnh
2 Độ sâu bit: là số bit được sử dụng để biểu diễn giá trị cường độ trên mỗi điểm ảnh
Thông tin màu của vân tay được đánh giá không quan trọng trong nhận dạng vân tay, vì vậy hầu hết các máy quét ảnh vân tay thu nhận các ảnh cấp xám Chuẩn FBI cho độ sâu bit là 8 bit, tức là biểu diễn được 256 mức xám Trên thực tế, một số bộ cảm biến chỉ thu thông tin vân tay thực sự ở độ sâu 2 hoặc 3 bit, và biến đổi thành ảnh 8 bit (Xia
& O’Gorman, 2003) Chưa có một nghiên cứu rõ ràng nào chỉ rằng độ tin cậy của nhận dạng sẽ giảm khi độ sâu bit giảm Tuy nhiên một điều hiển nhiên rằng, độ sâu bit lớn hơn 1 bit là cần thiết cho các thuật toán trích chọn đặc trưng Độ chính xác hình học: nói chung là độ méo hình học của các thiết bị thu nhận, được biển diễn bằng tỉ lệ phần trăm tương ứng với các hướng x và y
Chất lượng ảnh: không phải dễ để có thể định nghĩa chính xác chất lượng của ảnh vân tay, và càng khó khăn hơn để phân biệt chất lượng ảnh vân tay với chất lượng hay
Chương 2 Nâng cao chất lượng ảnh vân tay trạng thái nội tại của ngón tay Trên thực tế, nếu bề mặt nhô lên của các đường vân thấp (đặc biệt ở các công nhân thủ công hay người già), khi các ngón tay quá ẩm ướt hoặc quá khô,…, thì hầu hết các máy quét đều cho ra những ảnh vân có chất lượng kém
Hình 2.4: Ví dụ về chất lượng vân tay; (a) vân tay chất lượng tốt; (b) vân tay của một ngón tay khô; (c) vân tay của một ngón tay ẩm
Tất cả các đặc điểm trên đều liên quan đến độ chính xác của hệ thống nhận dạng, và chúng có ảnh hưởng tương hỗ nhau đến sự tin cậy hệ thống Ví dụ, giả sử rằng việc giảm độ phân giải từ 500 dpi xuống 400 dpi làm độ chính xác của hệ thống giảm 1%, và giảm độ sâu bit từ 8 bit xuống còn 4 bit sẽ làm độ chính xác giảm 1% Khi đó, nếu đồng thời giảm độ phân giải xuống 400 dpi và độ sâu bit thành 4 bit, sẽ làm độ chính xác giảm đi hơn 2%.
Các đặc điểm của vân tay
Vân tay được sinh ra từ biểu bì của đầu ngón tay, khi ngón tay được nhấn lên một bề mặt trơn Một đặc điểm dễ nhận thấy nhất của cấu trúc vân là sự xen kẽ giữa các đường vân và rãnh vân Trong ảnh vân tay, các đường vân thường có màu tối, còn rãnh vân có màu sáng (hình 2.5) Độ rộng các đường vân biến đổi trong khoảng 100 μmđối với vân mỏng, cho đến 300 μm đối với vân dày Nói chung, chu kỳ của đường vân/rãnh là khoảng 500 (Stosz & Alyea, 1994) Các thương tật như đốt cháy, trầy da, hoặc cắt đều không làm ảnh hưởng tới cấu trúc vân, mà sẽ hình thành y nguyên sau khi lớp biểu bì da mới phát triển μm
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.5: Đường vân và rãnh vân
Các vân và rãnh vân thường song song với nhau; đôi khi có rẽ nhãnh hoặc có điểm kết thúc Khi phân tích vân tay ở mức bao quát, vân tay có thể có một hoặc một số vùng có hình dạng đặc trưng (có đặc điểm như độ uốn cong cao, gặp điểm kết thúc thường xuyên hơn,…) Những vùng này có thể được phân loại thành ba loại: vòng (loop), delta, và xoắn (whorl) (hình 2.6) Các vùng đặc biệt này có hình dạng tương ứng giống với , , và O (Maltoni, et al., 2003) Một số thuật toán so sánh ảnh vân tay còn sử dụng một điểm trung tâm của vân tay, gọi là điểm lõi (core), nhằm điều chỉnh hướng của các ảnh vân tay Henry (1900) định nghĩa điểm lõi là điểm ở phía bắc nhất của đường vân nằm trong nhất
Hình 2.6: Các vùng đặc biệt; ô vuông biểu thị vùng đặc biệt, chấm nhỏ biểu thị điểm lõi
Xét ở mức cục bộ, ta xét đến các đặc điểm quan trọng khác, đó là các chi tiết nhỏ trên vân tay gọi là minutiae Trong phạm vi của vân tay, đây là các chi tiết làm cho các đường vân bị ngắt quãng Ví dụ như đường vân có thể đột ngột gặp điểm kết thúc, hoặc điểm rẽ nhánh Francis Galton (1822-1911) là người đầu tiên đã phân loại các minutiae và thấy rằng chúng không thay đổi trong suốt đời người (Galton, 1892) Hình 2.7 minh họa một số các minutiae thường gặp (Maltoni, et al., 2003)
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.7: Một số các minutiae thường gặp
Nếu ảnh vân tay được quét với độ phân giải cao (1000 dpi), ta có thể nhìn thấy rõ cả các lỗ chân lông (Stosz & Alyea, 1994), có kích thước từ 60 đến 250 (hình 2.8)
Mặc dù thông tin của các lỗ chân lông (số lượng, vị trí, hình dạng,…) là rất khác nhau, tuy nhiên rất ít kỹ thuật so sánh vân tự động sử dụng chúng, vì ảnh vân tay đòi hỏi phải có chất lượng và độ phân giải rất cao μm
Hình 2.8: Các chi tiết lỗ chân lông ở ảnh vân có độ phân giải cao
Hai đặc điểm gián tiếp nhưng rất quan trọng của vân tay là hướng vân cục bộ và tần số vân cục bộ Xét trong một vùng nhỏ, các đường vân và rãnh vân song song với nhau theo cùng một hướng, tạo nên một mặt dạng sóng với tần số xác định Các hướng và tần số này thay đổi chậm trong một vùng nhỏ của ảnh vân tay Cả hai đặc điểm này đều được sử dụng triệt để trong quá trình nâng cao chất lượng ảnh vân tay, để làm tăng sự rõ ràng giữa các đường vân và rãnh vân của vân tay
Chương 2 Nâng cao chất lượng ảnh vân tay
Biểu diễn ảnh vân tay
Ảnh vân tay thường được biểu diễn bằng một ma trận hai chiều Gọi I là một ảnh vân tay cấp xám với g mức xám, và I(x,y) là mức xám của điểm (x,y) trong I Gọi z=S(x,y) là bề mặt rời rạc tương ứng với ản I: S(x,y)=I(x,y) Nếu mức xám của các điểm sáng được gán gần với 0 và của điểm tối gần g-1, thì các đường vân tay (màu tối) sẽ tương ứng với các đỉnh, và giữa các đường vân (màu sáng) sẽ tương ứng với các thung lũng) (Maltoni, et al., 2003) (hình 2.9) đường rãnh
Hình 2.9: Bề mặt S ứng với một vùng vân nhỏ.
Các bước trong nâng cao ảnh vân tay
Có rất nhiều phương pháp nâng cao chất lượng ảnh vân tay khác nhau Trong chương này cũng như toàn bộ khóa luận, ta chỉ đề cập đến phương pháp nâng cao ảnh vân tay phổ biến, đó là sử dụng bộ lọc theo ngữ cảnh Giai đoạn nâng cao ảnh sử dụng bộ lọc theo ngữ cảnh điển hình gồm các bước được mô tả ở hình 2.10 Trong các phần tiếp theo, chúng ta sẽ lần lượt tìm hiểu chức năng cũng như các thuật toán trong mỗi bước ảnh vân tay gốc Tiền xử lý ảnh vân tay
Nâng cao ảnh dùng bộ lọc ngữ cảnh Phân vùng
Tìm tần số vân cục bộ
Tìm hướng vân cục bộ ảnh nâng cao Hình 2.10: Các bước trong nâng cao ảnh vân tay
Chương 2 Nâng cao chất lượng ảnh vân tay
Các bộ lọc theo ngữ cảnh
Kỹ thuật được sử dụng rộng rãi nhất trong nâng cao ảnh vân tay là các bộ lọc theo ngữ cảnh Đối với lọc các ảnh thông thường, thường chỉ sử dụng một bộ lọc đơn cho cuộn trên toàn ảnh Trong lọc theo ngữ cảnh, các đặc điểm của bộ lọc thay đổi theo ngữ cảnh cục bộ Thông thường, một tập các bộ lọc được tính toán trước, sau đó tùy theo từng vùng ảnh mà ta chọn một bộ lọc cụ thể Trong nâng cao ảnh vân tay, ngữ cảnh thường được định nghĩa bởi hướng vân cục bộ và tần số vân cục bộ Trên thực tế, các đường vân và rãnh vân tạo nên các sóng dạng sin, có các hướng cục bộ và tần số cục bộ và thay đổi chậm theo từng vùng của vân tay Một bộ lọc thích hợp với các tần số và hướng cục bộ sẽ rất hiệu quả trong việc loại bỏ các nhiễu không mong muốn và bảo toàn cấu trúc của đường vân và rãnh vân
Một số loại bộ lọc theo ngữ cảnh đã được đề xuất cho nâng cao ảnh vân tay Mặc dù chúng có các định nghĩa khác nhau, song đều có một quy tắc giống nhau (Maltoni, et al., 2003):
1 Cung cấp một hiệu ứng thông thấp (low-pass) dọc theo hướng vân, nhằm mục đích liên kết các kẽ hở nhỏ và làm mất các vết do lỗ chân lông hoặc nhiễu tạo ra
2 Thực hiện một hiệu ứng dải thông (band-pass) theo hướng trực giao với các đường vân để làm tăng sự phân biệt giữa các đường vân và rãnh vân và tách các đường vân song song nhau
Phương pháp dùng bộ lọc theo ngữ cảnh cho nâng cao ảnh vân tay lần đầu tiên được đề xuất bởi O’Gorman và Nickerson (1988, 1989); các tác giả định nghĩa một bộ lọc mẹ dựa trên bốn tham số chính của các ảnh vân tay đối với một độ phân giải xác định: độ rộng nhỏ nhất và lớn nhất của đường vân, độ rộng nhỏ nhất và lớn nhất của rãnh vân Bộ lọc được minh họa như hình 2.11, kéo dài dọc theo hướng vân, và có dạng sin theo hướng trực giao với hướng vân Tần số vân cục bộ được giả sử là hằng số, và do đó ngữ cảnh chỉ phụ thuộc vào hướng vân cục bộ Như vậy, một bộ lọc mẹ dẫn suất thành 16 bộ lọc tương ứng với các hướng cục bộ khác nhau Ảnh nâng cao thu được bằng cách cuộn mỗi điểm trong ảnh với bộ lọc có hướng phù hợp với hướng tại điểm đó Tùy theo một số tham số đầu vào, mà ảnh đầu ra có thể là ảnh cấp xám hoặc nhị phân
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.11: Hình dạng của bộ lọc được đề xuất bởi O’Gorman và Nickerson
Sherlock, Monro, và Millard (1992, 1994) thực hiện lọc theo ngữ cảnh trong miền Fourier; như ta đã biết phép cuộn trong miền không gian ứng với phép nhân thông thường (điểm-điểm) trong miền Fourier (Gonzales & Woods, 1992) Bộ lọc được định nghĩa trong miền tần số bởi hàm sau: radial angle
H( , ) Hρ θ = ( ).Hρ ( )θ trong đó Hradial chỉ phụ thuộc vào khoảng cách vân cục bộ ρ =1/ f và Hangle chỉ phục thuộc vào hướng vân Cả hai θ H radial ( )ρ và H angle ( )θ được định nghĩa là các bộ lọc dải thông Một tập gồm n bộ lọc rời rạc được sinh ra từ bộ lọc định nghĩa Để làm giảm số bộ lọc, giả sử tần số vân cục bộ là ổn định trong các vùng, do vậy ngữ cảnh của bộ lọc chỉ được xác định dựa trên hướng vân cục bộ Đầu tiên, biến đổi Fourier Pi
(i=1 n) của các bộ lọc được tính toán và lưu trữ Sau đó một ảnh vân tay đầu vào được lọc thông qua các bước sau:
Hình 2.12: Nâng cao ảnh vân tay theo phương pháp của Sherlock, Monro, và Millard
Chương 2 Nâng cao chất lượng ảnh vân tay
1 Tính FFT (Fast Fourier Transform) F của I;
2 Với mỗi bộ lọc Pi, ta nhân điểm-điểm với F, và thu được n ảnh lọc (ở miền Fourier) là PFi, i=1 n;
3 Thực hiện biến đổi FFT ngược với mỗi PFi, kết quả được n ảnh lọc (ở miền không gian) PIi, i=1 n Ảnh nâng cao Ienh thu được bằng cách: với mỗi điểm (x,y), Ienh(x,y)=PIk(x,y), với k là chỉ số của bộ lọc mà có hướng gần với θ xy nhất
Hong, Wan, và Jain (1998) đề xuất một phương pháp hiệu quả dựa trên bộ lọc Gabor Mục 2.11 sẽ trình bày chi tiết hơn về bộ lọc này.
Tiền xử lý ảnh vân tay
Đầu vào của thuật toán nâng cao thường là một ảnh cấp xám Nếu áp dụng các kỹ thuật nâng cao ảnh thông thường cho ảnh vân tay sẽ không cho kết quả thỏa đáng Tuy nhiên, một số các kỹ thuật như tăng độ tương phản, thao tác histogram, chuẩn hóa (Hong, Wan, Jain, 1998), và lọc Wiener (Greenberg et al., 2000) được sử dụng như bước tiền xử lý hiệu quả cho thuật toán nâng cao ảnh vân tay
1998, Hong, Wan và Jain đề xuất một cách tiếp cận chuẩn hóa để để xác định giá trị cường độ mới của một điểm ảnh trong ảnh như sau:
(2.1) trong đó M và V tương ứng là trung bình và độ lệch của ảnh I (kích thước m x n), được định nghĩa như sau: m 1 n 1 i 0 j 0
M0 và V0 tương ứng là trung bình và độ lệch mong muốn sau khi chuẩn hóa Quá trình chuẩn hóa này không làm ảnh hưởng đến cấu trúc của các đường vân và rãnh vân (hình 2.13)
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.13: Ví dụ về phương pháp chuẩn hóa (Hong, Wan, Jain, 1998) với M00 và
V00; (a) ảnh đầu vào; (b) ảnh sau khi chuẩn hóa.
Đánh giá hướng vân cục bộ
Hướng vân cục bộ là thuộc tính của vân tay, là thông tin rất hữu dụng trong nâng cao và phân vùng ảnh, phân loại và dò tìm đường vân Do vậy độ chính xác của hướng vân cục bộ có ảnh hưởng rất lớn đến độ tin cậy hệ thống nhận dạng Trong phần này sẽ giới thiệu khái quát một số kỹ thuật tìm hướng vân thông dụng
Với (x,y) là tọa độ một điểm trong ảnh vân tay Hướng vân cục bộ tại điểm (x,y) là góc nằm giữa đường vân đi qua lân cận của (x,y) và trục hoành nằm trong khoảng [ θxy θ xy
Hình 2.14: Hướng vân tương ứng với tọa độ (x,y)
Thay vì tính toán hướng vân cục bộ tại mỗi điểm ảnh, hầu hết các phương pháp xử lý vân tay đều ước lượng hướng vân cục bộ tại các vị trí rời rạc nhau (điều này nhằm giảm thời gian tính toán) Một bản đồ hướng, được giới thiệu đầu tiên bởi Grasselli
(1969), là một ma trận O mà các phần tử của nó là các hướng cục bộ của các đường vân tay Mỗi phần tử , tương ứng với điểm , biểu thị hướng trung bình của các đường vân nằm trong lân cận của θij (x i ,y j )
Chương 2 Nâng cao chất lượng ảnh vân tay
2.8.1 Phương pháp dựa trên Gradient
Một cách tiếp cận tự nhiên và đơn giản nhất để lấy hướng vân cục bộ là dựa trên việc tính các gradient của ảnh vân tay Gradient ∇(x i ,y j ) tại điểm của I, là một vector hai chiều
[∇ x i j ∇ y i j , trong đó ∇ x và ∇ y là các đạo hàm của I tại tương ứng với các trục x và y Như chúng ta đã biết, góc gradient biểu thị hướng có thay đổi cường độ cấp xám lớn nhất Do đó, hướng
) y , x ( i j θij của các đường vân đi qua lân cận (x i ,y j ) là góc trực giao với ϕ, là góc gradient trung bình trong lân cận
Mặc dù phương pháp này đơn giản và hiệu quả, song gặp một số trở ngại Thứ nhất, dùng các phương pháp cuộn Sobel hoặc Prewitt (Gonzales & Woods, 1992) để xác định các thành phần và
∇ x ∇ y của gradient, và tính θ ij bằng cách lấy arctang của / , sẽ không tuyến tính và không liên tục xung quanh góc 90 Thứ hai, phương pháp này rất nhạy cảm với nhiễu trong ảnh vân tay Mặt khác, phương pháp không thể đánh giá được gradient trung bình do tính tuần hoàn của góc, ví dụ: hướng trung bình giữa 5 và 175 không phải là 90 (tính theo phương pháp này) mà là 0 Hơn nữa, khái niệm hướng trung bình không được định nghĩa rõ ràng Chẳng hạn với hai hướng trực giao nhau là 0 và 90 D , ta không biết hướng trung bình chính xác là 45 hay
Một vấn đề khác, một đường vân luôn có hai cạnh ở hai bên, các vector gradient ở hai bên đường vân là đối nhau Nếu ta muốn tính ϕ bằng cách lấy trung bình các góc gradient trong một vùng cục bộ, thì các gradient đối nhau ở hai bên đường vân sẽ triệt tiêu lẫn nhau Để giải quyết các vấn đề này, Kass và Witkin (1987) đã đề xuất ra một giải pháp đơn giản nhưng khá sáng tạo cho phép tính trung bình các gradient cục bộ Ý tưởng là nhân đôi các góc gradient trước khi tính trung bình Khi đó ( ϕ + π ) sẽ thành ( 2 ϕ + 2 π ), và bằng 2ϕ
Ta dùng vector gradient bình phương [ g sx , g sy ] T , được tính từ vector [∇ x ,∇ y ] theo công thức sau (Bazen & Gerez, 2002):
Vector gradient bình phương trung bình [g sx ,g sy ] trong một khối được xác định
Chương 2 Nâng cao chất lượng ảnh vân tay
Nói chung, các phương pháp dựa trên gradient chia ảnh vân tay thành các khối có kích thước bằng nhau N x N pixel, và tính góc trung bình trên mỗi khối đó một cách độc lập Hướng trong một khối B được tính theo công thức sau (Bazen & Gerez, 2002):
∑∑ (2.6) Để đo độ tin cậy của việc đánh giá góc θ, Kass và Witkin đưa ra một khái niệm gọi là coherence, dùng để tính “độ mạnh” của gradient trung bình trong sự phân bố của các vector gradient cục bộ Coherence của khối B được ước lượng bởi công thức sau (Kass & Witkin, 1987):
2.8.2 Phương pháp dựa trên Gradient cải tiến (Wang, Hu, Han, 2007)
Wang, Hu, Han đã đề xuất một thuật toán dựa trên gradient cải tiến, trong đó sử dụng các cửa sổ chồng nhau Do tính chất song song và không đẳng hướng, các mẫu vân từ bốn láng giềng chồng nhau của cửa sổ vân trung tâm có sự tương quan cao đến nhau Nếu kích thước của cửa sổ nhỏ, thì các đường vân trên cửa sổ và các khối láng giềng là song song với nhau và thay đổi chậm
Hình 2.15: Minh họa site gồm 3 x 3 khối kề nhau
Chương 2 Nâng cao chất lượng ảnh vân tay
Các tiếp cận này khai thác đặc điểm song song của các đường vân, vì vậy nâng cao phương pháp dựa trên gradient truyền thống Thuật toán được mô tả như sau Nhóm các 2 x 2 khối kề nhau thành một láng giềng D, và nhóm 3 x 3 khối kề nhau thành một vùng gọi là site có 4 láng giềng chồng nhau như trong hình 2.15
Ta xét khối trung tâm V trong hình mà tại đó hướng vân cục bộ sẽ được đánh giá
Các khối {I,II,IV,V} tạo thành một láng giềng gọi là D1 Tương tự {II,III,V,IV} tạo thành D2, {IV,V,VII,VIII} tạo thành D3, {V,VI,VIII,IX} tạo thành D4 (hình 2.16) Từ các phương trình (2.6) và (2.7), các gradient bình phương trung bình và các coherence tương ứng sẽ được tính cho các láng giềng D1, D2, D3, D4 tương ứng Kết quả thu được hai vector θ = θ θ θ θ{ , , , } 1 2 3 4 và Coh={Coh1, Coh2, Coh3, Coh4} Ta sẽ tìm phần tử lớn nhất trong Coh và gán góc tương ứng trong θ vào khối trung tâm V Ví dụ nếu Coh2={Coh1, Coh2, Coh3, Coh4} thì góc được chọn là θ 2
Hình 2.16: Các láng giềng D1, D2, D3, D4 trong một site
2.8.3 Phương pháp của Stock và Swonger (1969)
Năm 1969, Stock và Swonger đã đánh giá hướng vân cục bộ bằng cách xem xét sự thay đổi cấp xám của các điểm ảnh theo các hướng khác nhau Họ dựa trên nhận xét rằng sự thay đổi bất thường của cấp xám nói chung sẽ nhỏ nhất nếu hướng dọc theo đường vân, và lớn nhất nếu là hướng trực giao với các đường vân.
Đánh giá tần số vân cục bộ
Trong một vùng cục bộ của ảnh vân tay, nếu không có sự xuất hiện của các minutiae và các điểm đặc biệt, thì các đường vân và rãnh vân song song với nhau và cấp xám của các đường vân và rãnh vân có thể được mô hình hóa như một sóng dạng sin Vì vậy, tần số vân cục bộ là một thuộc tính nội tại của ảnh vân tay
Tần số vân cục bộ f tại điểm (x,y) là nghịch đảo của số đường vân trong một
Chương 2 Nâng cao chất lượng ảnh vân tay θxy Một bản đồ tần số F là một ma trận mà các phần tử của nó là các tần số cục bộ của các đường vân tay Mỗi phần tử , tương ứng với pixel , biểu thị tần số trung bình của các đường vân nằm trong vùng lân cận của fij (x i ,y j )
) y , x ( i j x-signature cửa sổ 32 x 16 khối 16 x 16 hướng vân cục bộ
Hình 2.17: Cửa sổ hướng và x-signature
2.9.1 Phương pháp của Hong, Wan, Jain (1998)
Tần số vân cục bộ là khác nhau với các vân tay khác nhau, và cũng có thể khác nhau đối với các vùng khác nhau trong cùng một vân tay Hong, Wan, Jain (1998), đánh giá tần số vân cục bộ bằng cách đếm số pixel trung bình giữa hai đỉnh cấp xám của hai đường vân liên tiếp nhau (hình 2.15) Tần số tại f ij (x i ,y j )được tính như sau:
1 Chia ảnh vân tay thành các khối w x w (16 x 16)
2 Với mỗi khối có tâm là , ta định nghĩa một cửa sổ l x w (32x16) có hướng, cũng có tâm là , được đặt sao cho hướng chiều rộng trùng với hướng của đường vân tại vùng lân cận của (xoay hệ tọa độ sao cho trục y trùng với hướng vân cục bộ)
3 Với mỗi khối có tâm là (x i ,y j ), tính x-signature={X 0 ,X1,…,Xl-1}, là tổng các cấp xám được tích lũy theo trục x trong cửa sổ Cách làm này có tác dụng loại bỏ ảnh hưởng của các nhiễu nhỏ, giúp sự tích lũy cấp xám được làm trơn hơn
Chương 2 Nâng cao chất lượng ảnh vân tay w 1 k d 0 i i j j i j
∑ i j i j với O là bản đồ hướng, và O(xi,yj) là hướng tại điểm (xi,yj)
4 được tính bằng nghịch đảo của khoảng cách trung bình giữa hai đỉnh liên tiếp của x-signature fij
Nếu không có các minuiae và các điểm đặc biệt xuất hiện trong cửa sổ hướng, thì x-signature sẽ hình thành một sóng dạng sin rời rạc và có cùng tần số với các đường vân và rãnh vân trong cửa sổ đó Gọi Tij là khoảng cách trung bình giữa hai đỉnh liên tiếp của x-signature, khi đó tần số fij được tính như sau: ij ij f 1
Nếu không có đỉnh nào được tìm thấy trong x-signature, thì tần số được gán giá trị -1 để phân biệt với các tần số đúng khác
Phương pháp này đơn giản và nhanh Tuy nhiên, nhược điểm là khó tìm được hai đỉnh cấp xám liên tiếp nhau trong các ảnh vân tay có nhiễu Trong trường hợp này, tác giả gợi ý dùng một nội suy và bộ lọc thông thấp
Năm 2000, Jiang cũng tính toán tần số vân cục bộ bằng cách sử dụng x-signatures
Tuy nhiên, thay vì tính khoảng cách trong miền không gian, Jiang đã sử dụng một kĩ thuật phổ bậc cao gọi là mix-spectrum Các mẫu vân trong ảnh vân tay là các tín hiệu tuần hoàn có nhiễu; khi bị sai lệch với hình dạng sin ban đầu, năng lượng của chúng bị phân bổ thành các hàm điều hòa và tần số cơ bản Kĩ thuật mix-spectrum nâng cao tần số cơ bản của tín hiệu bằng cách khai thác thông tin chứa trong hàm điều hòa thứ hai và thứ ba
2.9.3 Phương pháp của Maio và Maltoni (1998)
Trong phương pháp đề xuất bởi Maio và Maltoni (1998), mẫu vân cục bộ được mô hình như một bề mặt dạng sin, và dùng định lý biến thiên để đánh giá tần số Biến thiên V của hàm h trong đoạn [x1,x2] là lượng thay đổi theo trục tung của h:
Chương 2 Nâng cao chất lượng ảnh vân tay
Nếu hàm h là tuần hoàn trong đoạn [x1,x2] hoặc sự thay đổi biên độ trong đoạn [x1,x2] là nhỏ, thì sự biến thiên có thể được biểu diễn như một hàm của biên độ trung bình α m và tần số trung bình f (hình 2.18)
Hình 2.18: Biến thiên của hàm h trong khoảng [x1,x2] là tổng các biên độ α α 1 , 2 , ,α 8 Như vậy, tần số cần tìm có thể được đánh giá bằng công thức:
Maio và Maltoni đề xuất một phương pháp thực nghiệm dựa trên lý thuyết này Sự biến thiên và biên độ trung bình của một mẫu vân hai chiều được đánh giá từ các đạo hàm thành phần bậc nhất và bậc hai, và tần số vân cục bộ được tính từ phương trình (2.12).
Phân vùng
Như đã đề cập trong phần đầu của chương, một điểm (hoặc một vùng trong ảnh vân tay gốc) có thể là vùng vân có thể khôi phục hoặc vùng không thể khôi phục Phân vùng ảnh vân tay nhằm mục đích tránh cho việc trích chọn các đặc trưng không rơi vào vùng nhiễu hoặc vùng nền Ảnh vân tay là các mẫu vân dạng sóng, do vậy dùng các kỹ thuật phân ngưỡng cục bộ hoặc toàn cục (Gonzales & Woods, 1992) sẽ không cho kết quả tốt Trên thực tế, cường độ ảnh trung bình không phải là yếu tố quyết định phân biệt giữa nền và vân, mà là sự hiện diện của các mẫu có hướng và có dạng sóng trong vùng vân, và của mẫu đẳng hướng đối với vùng nền Nếu nền ảnh luôn đồng nhất và sáng hơn các vùng vân,
Chương 2 Nâng cao chất lượng ảnh vân tay thì cách tiếp cận dựa trên cường độ cục bộ để tách vùng nền và vùng vân có thể hiệu quả; tuy nhiên trong thực tế, sự có mặt của nhiễu (do bụi hoặc các vết dầu mỡ trên máy quét ảnh vân tay) đòi hỏi phải có các kỹ thuật phân vùng mạnh hơn
2.10.1 Phương pháp của Mehtre, et al (1987)
Mehtre, et al (1987) tách vùng vân tay bằng cách sử dụng các histogram cục bộ của các hướng vân Tại mỗi điểm, hướng vân được đánh giá và một histogram của hướng được tính cho các khối 16 x 16 Nếu trong histogram có một đỉnh đáng kể thì chứng tỏ đó là một mẫu có hướng, ngược lại nếu histogram có dạng phẳng hoặc gần phẳng thì đó là đặc điểm của tín hiệu đẳng hướng Phương pháp này sẽ bị lỗi nếu một khối có cường độ đồng nhất (ví dụ một khối trắng trong vùng nền), bởi vì không có hướng vân cục bộ nào được tìm thấy Để giải quyết trường hợp này, Mehtre và Chatterjee (1989) đề xuất một phương pháp kết hợp, vừa sử dụng các histogram hướng, vừa tính độ lệch cấp xám của mỗi khối Với các khối có thông tin histogram không đủ tin cậy và có độ lệch cấp xám thấp thì sẽ được coi là vùng nền
2.10.2 Phương pháp của Ratha, Chen, và Jain (1995)
Ratha, Chen, và Jain (1995) gán mỗi khối 16 x 16 là vùng vân hay vùng nền dựa theo độ lệch của mức xám theo hướng trực giao với hướng vân Họ cũng sử dụng độ lệch cường độ trong khối để đánh giá chất lượng Thuật toán giả định rằng các vùng nhiễu là đẳng hướng, trong khi các vùng vân sẽ có độ lệch cường độ rất cao theo hướng trực giao với hướng vân, và độ lệch rất thấp nếu dọc theo hướng vân
Thực nghiệm cho thấy phương pháp này không mang lại hiệu quả cao, nhất là khi các đường vân tay bị đứt nét, hoặc ảnh có độ tương phản thấp
2.10.3 Phương pháp của Maio và Maltoni (1997)
Maio và Maltoni (1997) phân biệt các vùng vân và nền bằng cách sử dụng biên độ trung bình của gradient trong mỗi khối của ảnh; trên thực tế, do sự thay đổi cường độ cấp xám giữa các đường vân và rãnh vân nên vùng vân có biên độ gradient cao và vùng nền có biên độ gradient thấp
2.10.4 Phương pháp của Shen, Kot, và Koo (2001)
Trong phương pháp được đề xuất bởi Shen, Kot, và Koo (2001), tám bộ lọc Gabor được cuộn với các khối của ảnh, và độ lệch của các phản hồi từ bộ lọc được dùng cho cả phân vùng vân tay và phân loại các khối theo chất lượng của chúng, ví dụ như tốt,
Chương 2 Nâng cao chất lượng ảnh vân tay
2.10.5 Phương pháp của Bazen và Gerez (2001)
Bazen và Gerez (2001) đề xuất một kĩ thuật phân vùng dựa trên từng điểm ảnh, trong đó ba đặc điểm (độ gắn kết gradient, trung bình cường độ, độ lệch cường độ) được tính trên từng điểm ảnh, và sử dụng phân loại tuyến tính để phân điểm ảnh thành vùng nền hay vùng vân Một kỹ thuật giám sát được sử dụng để chọn các tham số tối ưu cho bộ phân loại tuyến tính đối với mỗi loại cảm biến cụ thể Bước hậu xử lý hình thái cuối cùng (Gonzales và Woods, 1992) được thực hiện để loại các lỗ hổng trong các vùng vân và vùng nền Kết quả thực nghiệm của họ cho thấy phương pháp này khá chính xác; tuy nhiên, độ phức tạp tính toán cao hơn đáng kể so với các cách tiếp cận theo khối được trình bày ở trên.
Bộ lọc Gabor
Việc xác định tốt các hướng và tần số của các đường vân tay sẽ cung cấp thông tin hữu ích giúp loại bỏ được các nhiễu trên ảnh vân tay Các sóng dạng sin của vân tay thay đổi chậm trong một vùng nhỏ Vì vậy, một bộ lọc thông có hướng và tần số phù hợp sẽ loại bỏ rất hiệu quả các nhiễu không mong đợi mà không phá hỏng cấu trúc các đường vân và rãnh vân Bộ lọc Gabor có cả hai thuộc tính hướng và tần số Do đó, bộ lọc Gabor thích hợp cho việc loại bỏ nhiễu và bảo toàn cấu trúc của đường vân và rãnh vân (Hong, Wan, và Jain, 1998)
Hình 2.19: Bộ lọc Gabor đối xứng chẵn: (a) bộ lọc Gabor với tần số 0.1 và hướng 0 ; (b)
Bộ lọc Gabor đối xứng chẵn có dạng chung như sau:
Trong đó là hướng của bộ lọc, và θ (xθ,yθ ) là tọa độ của (x,y) sau khi xoay trục tọa độ theo chiều kim đồng hồ một góc θ
Chương 2 Nâng cao chất lượng ảnh vân tay x cos sin x y sin cos θ θ θ θ
Trong biểu thức trên, f là tần số của sóng dạng sin δ x và là các hằng số độ lệch chuẩn của vỏ bọc Gaussian tương ứng theo trục x và trục y δy Để sử dụng bộ lọc Gabor đối với ảnh, có ba tham số cần phải được xác định là tần số của sóng dạng sin, hướng của bộ lọc, và độ lệch chuẩn của vỏ bọc Gaussian δ x và Dễ nhận thấy rằng thuộc tính tần số f của bộ lọc hoàn toàn xác định bởi tần số vân cục bộ, và thuộc tính hướng được xác định bởi hướng vân cục bộ Các giá trị của δy δ x và được lựa chọn sao cho cân bằng Giá trị càng lớn, thì tính khử nhiễu của bộ lọc càng mạnh, nhưng bộ lọc sẽ tạo ra nhiều vân và rãnh ảo Ngược lại, với các giá trị càng nhỏ, các vân và rãnh ảo sẽ ít hơn, nhưng tính khử nhiễu lại kém hiệu quả hơn
Dựa trên kinh nghiệm, và được lấy bằng 4 (Hong, Wan, và Jain, 1998) δy δ x δ y
Giả sử G là ảnh vân tay đã được chuẩn hóa, O là bản đồ hướng, F là bản đồ tần số, và R là bản đồ vùng có thể khôi phục, khi đó ảnh nâng cao E sẽ thu được bằng cách sau:
Trong đó wg là kích thước của bộ lọc Gabor Để quá trình nâng cao nhanh hơn, thay vì tính các bộ lọc theo ngữ cảnh thích hợp nhất cho mỗi điểm ảnh, ta tính toán và lưu trữ trước một tập các bộ lọc {gij(x,y) | i=1 no, j=1 nf), với no là số hướng rời rạc {θ i | i=1 no} và nf là số tần số rời rạc {fj | j=1 nf} Sau đó mỗi điểm (x,y) sẽ được cuộn với một bộ lọc gij(x,y) mà thỏa mãn điều kiện gần góc θ i θ xy nhất và f j gần với tần số fxy nhất Hình duới là một ví dụ về tập bộ lọc với no=8 và nf=3 (Maltoni, et al., 2003)
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.20: Minh họa tập bộ lọc với no=8 và nf=3
2.11.1 Phương pháp lọc Gabor nhanh (Areekul, et al., 2004)
Areekul, Watchareeruetai và Tantaratana (2004) đã đề xuất một phương pháp để tăng tốc độ tính toán của bộ lọc Gabor bằng cách tách bộ lọc Gabor hai chiều thành hai bộ lọc một chiều Ý tưởng như sau:
Xét bộ lọc Gabor hai chiều trong phương trình (2.13), nếu , phương trình (2.13) sẽ trở thành: θ = ° 90
= ° = ⎨⎪⎩− ⎜⎜⎝σ +σ ⎟⎟⎠⎬⎪⎭ π 0 (2.16) Phương trình này có thể được tách thành hai phương trình độc lập sau:
Ta thấy GBP trong phương trình (2.17) là một hàm dải thông Gaussian theo trục x, và GLP là hàm thông thấp Gaussian theo trục y Do f0 có thể được xác định bởi tần số vân cục bộ, nên ta coi f0 là một hằng số Do đó phương trình (2.17) có thể được tách ra thành các hàm một biến (theo biến x hoặc y), hay nói cách khác là được tách thành các bộ lọc Gabor một chiều (1-D) Như vậy, với hướng θ = ° 90 , thì bộ lọc Gabor có thể thực hiện bằng hai phép cuộn một chiều độc lập Đối với mỗi khối trong ảnh vân tay, đầu tiên ta cuộn bộ lọc Gabor dải thông 1-D (GBP) theo các hàng, sau đó cuộn bộ lọc Gabor thông thấp 1-D (G ) dọc theo các cột
Chương 2 Nâng cao chất lượng ảnh vân tay
Sử dụng bộ lọc Gabor 2-D sẽ có độ phức tạp tính toán rất cao Do đó, nếu ta dùng bộ lọc dải thông Gabor 1-D cuộn theo hướng θ cho tất cả các điểm trong khối đang xét, sau đó bộ lọc thông thấp Gabor 1-D được cuộn theo hướng trực giao với hướng θ cho tất cả các điểm trong khối đó, thì độ phức tạp sẽ giảm đáng kể Nhưng có một khó khăn là các điểm ảnh dọc theo hướng θ không liên tục (vì các điểm ảnh được lấy mẫu vuông) Bởi vậy, vị trí các điểm ảnh theo hướng θ phải được tính toán lại Điều này làm cách tiếp cận trở nên phức tạp hơn
May mắn là trong thực nghiệm, bộ lọc Gabor được sử dụng với 8 hướng là 0°, 22.5 , 45°, 67.5 , 90 , 112.5 , 135 , 157.5 Đối với các bộ lọc Gabor 1-D, ta chọn các hướng sao cho hướng đi qua vị trí chính xác của các điểm ảnh (hình 2.21), và kết quả thu được 8 hướng xấp xỉ là 0°, 26.6 , 45 , 63.4°, 90 , 116.6 , 135°, 153.4° Nhìn hình, ta thấy vị trí các điểm ảnh trên các 8 hướng cụ thể này đều đã được xác định, do đó sẽ làm giảm độ phức tạp tính toán của phép cuộn các bộ lọc với các khối
Tuy nhiên, do cách lấy mẫu như vậy nên khoảng cách giữa các mẫu theo các góc khác nhau có thể không giống nhau Ví dụ, giả sử khoảng cách các mẫu đối với hai hướng
0 và 90° là 1 đơn vị, thì khoảng cách các mẫu đối với các hướng 45° và 135 là ° ° ° ° ° ° ° ° ° ° ° °
2 và đối với các hướng 26.6 , 63.4 , 116.6° ° °, và 153.4° là 1.25 Vì vậy, phương trình (2.17) sẽ được chỉnh lại bằng cách thêm một tham số khoảng cách a như sau:
= ⎨⎪⎩ ⎜⎜⎝ σ ⎟⎟⎠⎬⎪⎭ (2.18) với n là thứ tự rời rạc của điểm ảnh theo hướng 1-D, a biểu thị khoảng cách giữa hai điểm ảnh trong các hướng cụ thể, ví dụ a=1 với hướng 0 và 90 , a=° ° 2 với hướng 45 và 135 , và a=° ° 1.25 với hướng 26.6 , 63.4° °, 116.6 , và 153.4° °
Chương 2 Nâng cao chất lượng ảnh vân tay
Hình 2.21: Các mẫu vuông của ảnh với 8 hướng khác nhau
Phương pháp này có độ phức tạp tính toán thấp, tuy nhiên độ chính xác kém hơn so với phương pháp sử dụng bộ lọc Gabor hai chiều.
CẢI TIẾN VÀ THỰC NGHIỆM
Giới thiệu
Trong chương hai, chúng ta đã hiểu được rõ hơn về chức năng của nâng cao chất lượng ảnh vân tay, đó là tìm các vùng có thể khôi phục được trong ảnh vân tay, khử nhiễu, và làm tăng sự rõ ràng giữa các đường vân và rãnh vân Chương hai cũng đi sâu mô tả chi tiết từng bước trong một giai đoạn nâng cao nói chung, giới thiệu các thuật toán đã được đề xuất cho mỗi bước, đồng thời phân tích các nhược điểm và ưu điểm của các thuật toán đó Chương này sẽ trình bày những kết quả đạt được về nâng cao chất lượng ảnh vân tay trong quá trình làm luận văn, cụ thể bao gồm những nội dung sau:
- Trình bày những nghiên cứu và nhận xét trong mỗi bước của kỹ thuật nâng cao ảnh vân tay
- Đề xuất một số thuật toán cải tiến trong mỗi bước đó
- Trình bày và đánh giá kết quả cài đặt thực nghiệm của các thuật toán cải tiến.
Trình tự các bước trong mô hình thực nghiệm
Trong phạm vi của luận văn, thực nghiệm áp dụng mô hình nâng cao chất lượng ảnh vân tay bao gồm các bước sau: chỉnh độ tương phản, tìm hướng vân cục bộ, tìm tần số vân cục bộ, tìm vùng vân, và nâng cao ảnh bằng bộ lọc Gabor Giai đoạn có đầu vào là một ảnh vân tay gốc và đầu ra là ảnh đã được nâng cao (hình 3.1) bản đồ hướng O bản đồ tần số F bản đồ vùng R Ảnh gốc I Ảnh nâng cao E
Tính hướng vân cục bộ
Tính tần số vân cục bộ
Hình 3.1: Trình tự các bước trong giai đoạn nâng cao ảnh vân tay
Chương 3 Cải tiến và thực nghiệm
Tiêu chuẩn của ảnh đầu vào
Như đã trình bày trong chương trước, thuật toán nhận dạng sẽ làm việc tốt ở ảnh vân có độ phân giải là 500 dpi và độ sâu bit là 8 bit (theo chuẩn FBI) Do vậy trong thực nghiệm, yêu cầu ảnh đầu vào của giai đoạn nâng cao ảnh vân tay phải là ảnh cấp xám 8 bit và có độ phân giải 500 dpi Trong trường hợp ảnh không phải cấp xám, hệ thống phải chuyển ảnh về dạng cấp xám (hình 3.2)
Hình 3.2: Minh họa chuyển từ ảnh màu (a) sang ảnh cấp xám (b).
Điều chỉnh độ tương phản
Với đầu vào một ảnh vân cấp xám, cấu trúc vân trong ảnh đôi khi không rõ ràng
Vì vậy trong quá trình nâng cao ảnh, cần thiết phải có một bước tiền xử lý để làm cấu trúc vân rõ ràng hơn, nói cách khác là làm ảnh gốc có độ tương phản cao hơn Ở đây, ta dùng kỹ thuật cân bằng histogram
Trên thực tế, ảnh gốc có thể có độ tương phản cao hoặc thấp Ta chỉ cần tăng độ tương phản trong trường hợp ảnh có độ tương phản thấp Do vậy cần có một phương pháp để đánh giá chất lượng độ tương phản của ảnh Ta có một nhận xét rằng, với ảnh có độ tương phản thấp thì histogram của ảnh đó thường chỉ có một đỉnh, hoặc các đỉnh của histogram khá gần nhau (hình 3.3) Còn với các ảnh có độ tương phản cao, thường histogram sẽ có hai đỉnh cách xa nhau, một đỉnh ở phía có cường độ cấp xám tối hơn và đỉnh còn lại ở phía có cường độ cấp xám sáng hơn Nói cách khác, khi độ tương phản cao thì mật độ cường độ cấp xám sẽ tập trung chủ yếu về hai phía tối hẳn và sáng
Chương 3 Cải tiến và thực nghiệm hẳn Từ nhận xét này, tôi đề xuất một phương pháp đơn giản để đánh giá độ tương phản như sau:
Hình 3.3: Minh họa độ tương phản; (a) ảnh có độ tương phản thấp, mật độ cấp xám tập trung về phía cường độ sáng; (b) ảnh có độ tương phản cao, histogram có hai đỉnh ở cường độ tối và sáng
Thuật toán đề xuất Đầu vào: ảnh vân tay cấp xám I
1 Tính histogram H của I, H(i) là mật độ của cấm xám i trong I, i [ , trong đó N là số cấp xám của I
2 Chia histogram H thành ba khoảng bằng nhau (hình 3.4), khoảng tối có cường độ điểm ảnh thuộc [0,N/3-1], khoảng giữa thuộc [N/3,2N/3-1], và khoảng sáng thuộc [2N/3,N-1]
Chương 3 Cải tiến và thực nghiệm
Hình 3.4: Histogram được chia làm 3 khoảng bằng nhau
3 Tính mật độ tổng của các cường độ cấp xám nằm trong mỗi khoảng Giả sử m1, m2, m3 tương ứng là mật độ các cấp xám nằm trong khoảng tối, khoảng giữa, và khoảng sáng:
4 Nếu ảnh có độ tương phản tốt thì: m1>m, m2m, với m là ngưỡng cân bằng Trong thực nghiệm, ta chọn N 1 i 0 m 1 H
Ngược lại, nếu không thỏa điều kiện trên, thì độ tương phản của ảnh là thấp, khi đó ta sẽ dùng kỹ thuật cân bằng histogram đề nâng cao độ tương phản của ảnh
Có thể tham khảo kỹ thuật cân bằng histogram trong phần phụ lục Đầu ra: ảnh G đã được nâng cao độ tương phản trong trường hợp độ tương phản thấp
Chương 3 Cải tiến và thực nghiệm
Hình 3.5: Minh họa cân bằng histogram; (a) ảnh gốc DB2_B/104_8; (b) kết quả.
Đánh giá hướng vân cục bộ
Để tìm hướng vân cục bộ, ta dùng phương pháp dựa trên gradient Thực nghiệm cho thấy phương pháp đánh giá các hướng cục bộ dựa trên gradient thông thường khá nhạy cảm với các nhiễu Ở đây, ta dùng biện pháp lai giữa phương pháp thông thường và phương pháp nâng cao
Nhận xét và cải tiến
Tư tưởng cốt lõi của phương pháp này là: ta chia ảnh thành các khối vuông có kích thước như nhau là w x w (16 x 16) Với mỗi khối B, tính hướng vân cục bộ , và độ tin cậy coh θB
B tương ứng Nếu B θ B đủ tin cậy (nghĩa là có cohB cao) thì được chọn là hướng vân cục bộ trong khối B Ngược lại, nếu θB θB không đủ tin cậy (cohB B thấp) thì ta xét tiếp hướng cục bộ trên các cửa sổ Dk (k=1 8) nằm chồng một phần với B và có kích thước là wD x wD (24 x 24) với wD=3w/2 (hình 3.6) Với khối B có tọa độ tâm là (i,j), thì tọa độ tâm của các cửa sổ Dk tương ứng là (i 3w/4,j 3w/4)± ± , ,
(i 3w/4,j)± (i,j 3w/4)± k đều giao một phần với khối B (không chứa hoàn toàn khối
B như phương pháp của Wang, Hu và Han) Điều này nhằm hai mục đích:
Chương 3 Cải tiến và thực nghiệm
1 Lấy thêm thông tin hướng từ các vùng lân cận của khối B
2 Chỉ lấy một phần thông tin hướng của khối B do độ tin cậy hướng của B thấp, như vậy độ tin cậy hướng của các cửa sổ Dk không bị ảnh hưởng nếu khối B có nhiễu
Hình 3.6: Minh họa khối B nằm ở trung tâm, và các cửa sổ D1, D2,…, D8 Để hiểu rõ hơn về mục đích thứ hai, ta xem một ví dụ minh họa ở hình 3.7
Hình 3.7: Minh họa trường hợp khi hướng cục bộ ở khối B không đủ độ tin cậy
Chương 3 Cải tiến và thực nghiệm
Nhìn hình ta thấy thông tin đường vân ở khối B hầu như đã bị mất, chỉ còn ở góc trên trái của khối, do vậy độ tin cậy của hướng trong khối B thấp Nhưng thông tin vân trong khối D1 thì vẫn còn nguyên vẹn, nên độ tin cậy hướng của khối D1 cao
Xuất phát từ ý tưởng trên, thuật toán đánh giá hướng vân cục bộ của ảnh vân tay gồm các bước sau: Đầu vào: ảnh G đã được nâng cao độ tương phản
1 Tính các gradient của ảnh G theo trục x và trục y, thu được gx và gy tương ứng
Các gradient này được tính theo phương pháp Sobel (tham khảo phần phụ lục)
2 Chia ảnh thành các khối w x w (16 x 16)
3 Với mỗi khối B có tâm là điểm (i,j), đánh giá hướng cục bộ theo phương trình sau: w w i j
(3.4) Đánh giá coherence của B theo phương trình sau: w w i j
Chương 3 Cải tiến và thực nghiệm
Miền giá trị của cohB nằm trong đoạn [0 1], thực nghiệm cho thấy hướng cục bộ là tin cậy nếu cohB>0.6 Ngược lại thì độ tin cậy của hướng thấp Vì vậy ta chọn ngưỡng cho coherence là th
4 Đối với các khối B có coherence thấp hơn thcoh, hướng được tính lại bằng phương pháp dựa trên gradient nâng cao Ta tính hướng và coherence cho các cửa sổ Dk (k=1 8), bằng cách sử dụng các công thức (3.4) và (3.5) nhưng với kích thước cửa sổ là wD Ta thu được 2 vector coh={cohk} và (k=1 8)
{ }k θ = θ max=max{cohk}, khi đó hướng θ B tương ứng với cohmax sẽ được chọn là hướng của khối B Đầu ra: bản đồ hướng O của ảnh vân tay G, tại mỗi điểm (i,j) ta có O(i,j)= θ ij
Hình 3.8 minh họa kết quả của 3 thuật toán Nếu dùng thuật toán dựa trên gradient thông thường, thì các hướng tìm được ở vùng hình chữ nhật bị sai lệch (hình 3.8b)
Thuật toán của Wang-Hu-Han và thuật toán cải tiến ở trường hợp này đều cho kết quả khá tốt (hình 3.8c và 3.8d)
Chương 3 Cải tiến và thực nghiệm
Hình 3.8: Minh họa thuật toán đánh giá hướng; (a) ảnh gốc 105_4; (b) ảnh hướng dùng thuật toán dựa trên gradient bình thường; (c) ảnh hướng dùng thuật toán dựa trên gradient nâng cao của Wang-Hu-Han; (d) ảnh hướng dùng thuật toán dựa trên gradient nâng cao đề xuất
Chương 3 Cải tiến và thực nghiệm
Đánh giá tần số vân cục bộ
Việc tìm tần số cục bộ dựa trên một đặc điểm quan trọng của vân tay, đó là các đường vân và rãnh vân song song với nhau trong một vùng nhỏ, và tạo nên các sóng dạng sin Hong-Wan-Jain đã đề xuất thuật toán sử dụng x-signature để đánh giá tần số cục bộ của đường vân (ta gọi tắt là thuật toán HWJ) Thuật toán tìm các đỉnh của x- signature và tính khoảng cách trung bình giữa các đỉnh này, tần số cục bộ thu được chính là nghịch đảo của khoảng cách trung bình Phương pháp này đơn giản và có độ phức tạp tính toán thấp, tuy nhiên rất khó để tìm các đỉnh của x-signature khi có nhiễu
Sau một thời gian nghiên cứu, tôi đề xuất một phương pháp cũng sử dụng x-signature, nhưng hạn chế tối đa ảnh hưởng của nhiễu
Nhận xét và đề xuất Để thấy rõ hơn nhược điểm của thuật toán đánh giá tần số cục bộ HWJ, ta xét một ví dụ đơn giản của x-signature như sau:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 position x- si gn at ur e
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 position x- si gna tu re
Hình 3.9: Biểu đồ minh họa ví dụ của x-signature; (a) dạng rời rạc; (b) dạng liên tục
Nhìn hình 3.9, ta thấy x-signature có dạng hình sin với chu kỳ là 6, và có một điểm nhiễu ở vị trí 13 Tuy nhiên theo thuật toán HWJ, ta sẽ tìm được 4 đỉnh ở các vị trí 4,
Chương 3 Cải tiến và thực nghiệm
10, 13, 16 Nên khoảng cách trung bình thu được giữa hai đỉnh liên tiếp là 4 Nói cách khác chu kỳ của x-signature thu được từ HWJ là 4, không đúng với chu kỳ thật
Hình 3.10: Minh họa cửa sổ K
Nhằm khắc phục nhược điểm của thuật toán HWJ, tôi đề xuất một thuật toán cải tiến nâng cao độ chính xác của tần số tìm được khi có ảnh hưởng của nhiễu Để thuận tiện, ta đặt f=x-signature Thuật toán giả sử f(x) là một hàm có dạng hình sin Ta sử dụng một cửa sổ K có độ rộng là b, cho trượt trên f(x) Vị trí của cửa sổ K là một điểm x0 sao cho với ∀ ∈ x [ x 0 − b / 2, x 0 + b / 2 ] thì x∈K Tại mỗi vị trí x0 của K, gb(x0) được định nghĩa là tổng tất cả các f(x) với x∈K:
Nếu f(x) có dạng hình sin và với b nhỏ hơn chu kỳ của f(x), ta có một số nhận xét về gb(x) như sau:
- Hàm gb(x) cũng có dạng sin
- Tần số của gb(x) giống tần số của hàm f(x)
- Với mọi x0, nếu gb(x ) đạt giá trị cực đại, thì f(x ) cũng đạt giá trị cực đại 0 0
- gb(x) có hình dạng trơn hơn f(x), nghĩa là gb(x) ít bị ảnh hưởng bởi nhiễu hơn so với f(x)
- Với b=T/2, T là chu kỳ của f(x), thì biên độ của gb(x) đạt giá trị cực đại Để chứng minh nhận xét là đúng đắn, giả sử f(x) là liên tục, và f(i)=x-signature(i)
Hàm f(x) có dạng như sau: f (x) a(sin( x) 1) n(x)= ω + + (3.8)
Chương 3 Cải tiến và thực nghiệm a: biên độ của f(x), a 0 ≥ ω: tần số góc của f(x) và 2
T ω = π, trong đó T là chu kỳ của f(x) n(x): nhân tố nhiễu Khi đó tại mỗi vị trí x0, gb(x0) được tính bằng công thức sau:
Như vậy, hàm gb(x) cũng có dạng sin, có cùng tần số góc ω và cùng pha với f(x)
Do đó tần số của gb(x) giống tần số của hàm f(x), và với mọi x0, nếu gb(x0) đạt giá trị cực đại, thì f(x ) cũng đạt giá trị cực đại0
Theo phương trình (3.10), N(x) là nhân tố nhiễu của gb(x) Tại mỗi điểm x0, gb(x0) thu được bằng việc tích lũy các giá trị f(x) trong lân cận [ x 0 − b / 2, x 0 + b / 2 ] Các nhiễu trong lân cận thường bị triệt tiêu nhau khi lấy tổng, do đó N(x0) nhỏ so với gb(x0) Nói cách khác, gb(x) có hình dạng trơn hơn f(x)
Ta thấy gb(x) có biên độ là A b 2asin b
= ω ω , để biên độ đạt cực đại thì sin b 1
Chương 3 Cải tiến và thực nghiệm
Do b0, do vậy chỉ k=0 là thỏa mãn Ta thu được kết quả: b T
= 2, gb(x) sẽ đạt biên độ cực đại
Do đó, ta chỉ cần tìm một giá trị b trong khoảng [bmin, bmax] sao cho biên độ của gb(x) đạt giá trị lớn nhất, rồi nhân đôi thì thu được chu kỳ cần tìm Với ảnh có độ phân giải 500 dpi, khoảng cách giữa các vân nằm trong khoảng [3, 25] (Hong, Wan, Jain,
1998) Do vậy ta chỉ cần cho b chạy trong khoảng [1.5,12.5]
Trên thực tế, do x-signature bao gồm các giá trị rời rạc, nên f(x) và g(x) là các hàm rời rạc Do vậy tại mỗi điểm x0, ta định nghĩa lại gb(x0) như sau: gb(x0) = 0 nếu b=k (3.1
− − + − + + ∑ nếu b=k+0.5 trong đó q=[b/2] (phần nguyên) và k N∈ *
Sở dĩ ta định nghĩa gb(x0) với hai trường hợp b=k và b=k+0.5 là để chu kỳ T tìm được có thể nhận giá trị chẵn hoặc lẻ (vì T+)
Biên độ của gb(x) được đánh giá như sau:
Gọi {pb} là tập np đỉnh và thung lũng liên tiếp nhau của gb(x), khi đó biên độ trung bình của gb(x) được tính bằng công thức sau: n p b b p i 2
Gọi posb(i) là vị trí của đỉnh pb(i) trên gb(x), nghĩa là gb(posb(i))= pb(i) Độ lệch bình phương của b được định nghĩa là: n p
Khi b=T/2 (T là chu kỳ cần tìm), thì khoảng cách giữa các đỉnh đều nhau hơn và xấp xỉ bằng b, do đó Vb nhỏ Gọi Vmax là ngưỡng trên của Vb, nghĩa là chỉ xét những giá trị của b làm cho V ≤V Dựa trên thực nghiệm, ta chọn V =3
Chương 3 Cải tiến và thực nghiệm
Trở lại ví dụ đầu, xét các trường hợp với b=2 và với b=3,b=4 (hình 3.11)
Hình 3.11: Đồ thị của g(x) trong các trường hợp b=2,3 và 4
Chương 3 Cải tiến và thực nghiệm b n p A b V b
Bảng 3.1 Nhìn bảng 3.1, ta thấy với b=3, g(x) đạt biên độ cao nhất và có độ lệch giữa các đỉnh là thấp nhất
Từ những nhận xét trên, ta có thuật toán tìm tần số như sau: Đầu vào: ảnh G, bản đồ hướng O
1 Chia ảnh G thành các khối wf x wf (11 x 11)
2 Với mỗi khối B có tâm là , ta định nghĩa một cửa sổ l x w (48 x 16) có hướng, cũng có tâm là , được đặt sao cho hướng chiều rộng trùng với hướng của đường vân tại vùng lân cận của (xoay hệ tọa độ sao cho trục y trùng với hướng vân cục bộ)
3 Với mỗi khối B có tâm là (x i ,y j ), tính x-signature={X 0 ,X1,…,Xl-1}, là tổng các cấp xám được tích lũy theo trục x trong cửa sổ Cụ thể ta có: w 1 k d 0 i i j j i j
4 Với mỗi x-signature, ta tính chu kỳ theo thuật toán sau:
Chương 3 Cải tiến và thực nghiệm b r =0 // lưu giá trị tốt nhất của b b=b min
A max =0 while b≤b max { Tính g b (x) theo b Tìm {p b } theo g b
Tính A b và V b if A max 0 f B =1/(2b r ) else f B =0 // không phải vùng vân, hoặc là vùng không thể khôi phục Đầu ra: Bản đồ tần số F của ảnh vân tay G, tại mỗi điểm (i,j) ta có F(i,j)=fij
Chương 3 Cải tiến và thực nghiệm
Hình 3.12 mô tả một ví dụ về bản đồ tần số F Với ảnh đầu vào (a), thuật toán tìm tần số cục bộ HWJ cho kết quả ở hình (b), và thuật toán đề xuất cho kết quả ở hình (c)
Các lỗ hổng màu đen trên bản đồ tần số là các vị trí lỗi mà thuật toán không tìm được tần số Rõ ràng bản đồ tần số (c) có ít tần số lỗi hơn và trơn hơn (độ lệch giữa các tần số thấp) so với bản đồ tần số (b)
Hình 3.12: Minh họa thuật toán đánh giá tần số; (a) ảnh gốc DB2_B/107_3; (b) bản đồ tần số dùng phương pháp của HWJ; (c) bản đồ tần số dùng phương pháp cải tiến.
Sửa tần số lỗi
Tần số vân cục bộ biến đổi chậm trên một vùng nhỏ của vân tay Sau khi đánh giá tần số vân cục bộ, do một số vùng có nhiễu nên tần số tìm được có thể không chính xác hoặc không tìm được, hậu quả là gây ra thay đổi đột ngột so với tần số ở các vùng lân cận Do vậy cần phải có bước làm “trơn” bản đồ tần số Thuật toán như sau:
Thuật toán đề xuất Đầu vào: Bản đồ tần số F
1 Khi đánh giá tần số vân cục bộ, ảnh vân tay được chia thành các khối có kích thước wf x wf (11 x 11), và các giá trị tần số trong mỗi khối là như nhau Gọi
Bf(u,v) là giá trị tần số của khối B có tâm là (i,j), trong đó u=i/wf, v=j/wf
Chương 3 Cải tiến và thực nghiệm
2 Với mỗi Bf(u,v), giá trị tần số mới Bfnew(u,v) được tính lại như sau: s=0 c=0 for (k=u-1; k u+1; k=k+1) ≤ for (l=v-1; l v+1; l=l+1) ≤ if B f (k,l)>0 { s=s+ B B f (k,l) c=c+1
} if c>c min // c min là ngưỡng tối thiểu của c, trong thực nghiệm c min =4
3 Gán lại Bf=Bfnew Đầu ra: Bản đồ tần số F đã được sửa lỗi
Hình 3.13a là bản đồ tần số gốc, và hình 3.13b là bản đồ tần số sau khi sửa
(a) (b) Hình 3.13: Minh họa thuật toán sửa tần số; (a) bản đồ tần số; (b) bản đồ tần số sau khi sửa
Chương 3 Cải tiến và thực nghiệm
Đánh giá vùng bất thường
Vùng bất thường được định nghĩa là những vùng mà thuộc tính hướng hoặc tần số không ổn định, chẳng hạn như vùng delta, vùng có các đường vân bị uốn cong đột ngột, hoặc vùng có nhiều nhiễu
Trong khi tiến hành thực nghiệm, ta nhận thấy rằng thuật toán nâng cao áp dụng trên các vùng bất thường rất không hiệu quả do độ tin cậy của hướng và tần số cục bộ ở đây khá thấp Điều này càng khó khăn hơn khi chúng ta sử dụng bộ lọc gabor để nâng cao ảnh, vì hướng và tần số là hai thuộc tính rất quan trọng của bộ lọc này Nếu hướng và tần số không chính xác, thì việc sử dụng bộ lọc Gabor có thể sản xuất ra những đường vân ảo và làm mất thông tin của ảnh gốc Do vậy cần phải có phương pháp xác định các vùng bất thường để ta có biện pháp nâng cao hiệu quả hơn cho các vùng này
Các hướng vân cục bộ tại các vùng bất thường không kiên định nên độ tin cậy coherence của hướng trong các vùng này rất thấp Do vậy, để tìm các vùng bất thường, ta sẽ tính coherence cho từng vùng Vùng có coherence thấp sẽ được đánh dấu là vùng bất thường
Thuật toán đề xuất Đầu vào: ảnh G
1 Chia ảnh thành các khối w x w (16 x 16)
2 Với mỗi khối B có tâm (i,j), xét cửa sổ U có kích thước wU x wU (48 x 48) và cũng có tâm là (i,j) Tính độ tin cậy cohU của U (tương tự như tính coherence trong phần đánh giá hướng cục bộ) Nếu cohU rất nhỏ thì U là vùng bất thường
Dựa trên thực nghiệm, ta chọn ngưỡng trên của cohU là 0.2 Đầu ra: các vùng bất thường
Chương 3 Cải tiến và thực nghiệm
Hình 3.14a là ảnh gốc, kết quả tìm được hai vùng bất thường được khoanh bởi các ô vuông (hình 3.14b) vùng bất thường
Hình 3.14: Minh họa thuật toán tìm vùng bất thường; (a) ảnh gốc DB4_B/107_2; (b) hai vùng bất thường tìm được.
Phân vùng
Như đã đề cập trong phần đầu của chương, một điểm (hoặc một vùng) trong ảnh vân tay gốc có thể là vùng vân có thể khôi phục hoặc vùng không thể khôi phục Phân loại các vùng này có thể dựa trên việc đánh giá hình dạng các sóng mà được tạo nên bởi các đường vân và rãnh vân Ở đây, ta sử dụng bản đồ tần số F để phân vùng ảnh vân tay Tại mỗi điểm (i,j), nếu F(i,j)>0 thì điểm (i,j) thuộc vùng vân tay có thể khôi phục, ngược lại nếu F(i,j)=0 thì điểm (i,j) thuộc vùng nền hoặc vùng vân không thể khôi phục
Gọi R là bản đồ vùng của ảnh vân tay G Tại mỗi điểm (i,j):
R(i,j) = 0 nếu điểm (i,j) thuộc vùng không thể khôi phục;
1 nếu điểm (i,j) thuộc vùng có thể khôi phục;
2 nếu điểm (i,j) thuộc vùng bất thường
Chương 3 Cải tiến và thực nghiệm
Nâng cao ảnh
Ta sử dụng bộ lọc Gabor để nâng cao chất lượng của ảnh vân tay Với mỗi hướng là và tần số f, bộ lọc Gabor h được tính như sau: θ
⎪ ⎪ θ δ δ = ⎨⎪⎩− ⎢⎢⎣δ +δ ⎥⎥⎦⎬⎪⎭ π với x cos sin x y sin cos θ θ θ θ
Bộ lọc Gabor có cả hai thuộc tính hướng và tần số, nên khi các tham số được lựa chọn phù hợp, các bộ lọc này được sử dụng rất tốt trong khử nhiễu và làm thông tin các đường vân và rãnh vân rõ hơn Tuy nhiên đối với các vùng bất thường, nơi có hướng và tần số vân cục bộ không ổn định, thì bộ lọc Gabor tỏ ra kém hiệu quả hơn, và thường tạo ra thông tin đường vân không chính xác Do vậy đối những vùng bất thường, ta phải điều chỉnh các tham số của bộ lọc sao cho mức độ sai lệch thông tin là ít nhất Như chúng ta đã biết bộ lọc Gabor có hai tham số là δ x và Nếu các tham số này lớn, thì tính khử nhiễu của bộ lọc rất mạnh, nhưng dễ bỏ xót các chi tiết vân
Ngược lại khi các tham số này nhỏ, tính khử nhiễu kém hơn, nhưng bộ lọc sẽ bảo toàn được những chi tiết vân δy
Dựa trên kinh nghiệm, Hong, Wan, Jain (1998) chọn δ = x 4 và Các tham số này chạy khá tốt trong trường hợp vùng vân là ổn định Đối với các vùng bất thường, từ nhận xét trên và bằng thực nghiệm, ta chọn y 4 δ x 3 δ = và δ = y 2 Đầu vào là ảnh G, bản đồ vùng R, bản đồ hướng O, bản đồ tần số F Ảnh nâng cao
E thu được bằng cách sau:
E(xi,yj) = 255 nếu R(xi,yj) = 0, g g g g w / 2 w / 2 u =− w / 2 v =− w / 2 h(u, v : O(i, j), F(i, j), 4, 4)G(i u, j v) − −
Chương 3 Cải tiến và thực nghiệm
Hình 3.15: Minh họa thuật toán nâng cao; (a) ảnh gốc DB1_B/101_3; (b) ảnh sau khi nâng cao và nhị phân hóa.
Đánh giá thực nghiệm
Để đánh giá mức độ hiệu quả của các thuật toán đề xuất trong giai đoạn nâng cao ảnh, ta sử dụng cơ sở dữ liệu ảnh vân tay mẫu của FVC2002 Đây là một cơ sở dữ liệu vân tay được cung cấp bởi 11 tổ chức, với nhiều ảnh vân tay khác nhau được quét từ nhiều loại cảm biến (http://bias.csr.unibo.it/fvc2002/) Rất nhiều bài báo về nhận dạng vân tay dùng cơ sở dữ liệu này để đánh giá thuật toán của mình Các ảnh vân tay được lựa chọn với các loại nhiễu khác nhau như các nếp gấp, vết nhòe, vân tay ẩm hoặc khô
Các thuật toán đề xuất sẽ được thử nghiệm trên những ảnh này, và so sánh với các thuật toán phổ biến khác
Xét trên mức độ quan trọng và ảnh hưởng của các thuật toán đối với giai đoạn nâng cao ảnh, ta tập trung vào các thuật toán đánh giá hướng vân cục bộ, tần số vân cục bộ, và nâng cao ảnh dùng bộ lọc Gabor Để có thể đánh giá chính xác sự hiệu quả của kỹ thuật nâng cao ảnh vân tay, ta phải dựa vào tỉ lệ trích chọn minutiae đúng Tuy nhiên, trong phạm vi của luận văn này, tôi chỉ tập trung nghiên cứu về kỹ thuật nâng cao ảnh vân tay, không thực nghiệm giai đoạn trích chọn minutiae của vân tay Trên thực tế, cũng chưa có một thước đo chuẩn nào để đánh giá hướng vân cục bộ (Ratha, 1995; Zhou, 2004) hay tần sồ vân cục bộ cho vân tay Do vậy, ta đánh giá các thuật toán cải tiến dựa trên sự quan sát các kết quả thực nghiệm
Chương 3 Cải tiến và thực nghiệm
3.11.1 Đánh giá thuật toán tìm hướng vân cục bộ
Ta sẽ so sánh kết quả của ba thuật toán tìm hướng dựa trên gradient bằng thực hiện trên 3 loại ảnh vân tay khác nhau: ảnh trong hình 3.16 có nhiều nếp gấp, hình 3.17 là ảnh của vân tay bị ẩm, hình 3.18 là ảnh vân tay khô và chất lượng xấu Trong mỗi hình, (a) là ảnh gốc, (b) là ảnh hướng dùng thuật toán gradient thông thường, (c) là ảnh hướng dùng thuật toán của Wang, Hu, và Han (2007), (d) dùng thuật toán cải tiến
(c) (d) Hình 3.16: Đánh giá thuật toán tìm hướng vân trên ảnh có nhiều nếp gấp (DB1_B/105_6)
Chương 3 Cải tiến và thực nghiệm
(c) (d) Hình 3.17: Đánh giá thuật toán tìm hướng vân trên ảnh có vân tay ẩm (DB3_B/103_5)
Chương 3 Cải tiến và thực nghiệm
(c) (d) Hình 3.18: Đánh giá thuật toán tìm hướng vân trên ảnh có vân tay khô (DB4_B/108_2)
Rõ ràng, thuật toán cải tiến cho kết quả hướng ổn định và tốt hơn nhiều so với thuật toán tìm hướng dựa trên gradient thông thường, và nhỉnh hơn một chút so với thuật toán tìm hướng của Wang, Hu, và Han
Chương 3 Cải tiến và thực nghiệm
3.11.2 Đánh giá thuật toán tìm tần số vân cục bộ Để đánh giá thuật toán tìm tần số vân cục bộ, ta so sánh kết quả giữa thuật toán của Hong, Wan, Jain (1998) và thuật toán cải tiến Kết quả được đánh giá trên nhiều loại ảnh vân tay khác nhau Dưới đây là minh họa kết quả đánh giá trên hai loại ảnh: ảnh trong hình 3.19 có nhiều nếp gấp (sử dụng ảnh gốc DB1_B/105_6 ở hình 3.16a), hình 3.20 là ảnh của vân tay bị ẩm (sử dụng ảnh gốc DB3_B/103_5 ở hình 3.17a)
Trong mỗi hình, (a) là ảnh tần số dùng thuật toán của Hong, Wan, Jain (1998), (b) là ảnh tần số dùng thuật toán cải tiến Trong hai ví dụ này, ta đều thấy ảnh tần số của thuật toán cải tiến trơn hơn so với ảnh tần số của thuật toán Hong, Wan, Jain (1998) Đối với hình 3.20, ta nhận thấy tần số vân cục bộ ở vùng giữa của ảnh tần số 3.20a rất không ổn định và không tin cậy Đó là do ảnh vân tay gốc có các đường vân nằm quá sít nhau, thậm trí không phân biệt được ranh rới giữa chúng Trong khi đó, ảnh tần số được đánh giá bởi thuật toán cải tiến (hình 3.20b) có vùng giữa với tần số được đánh giấu là lỗi (các ô đen), chứng tỏ thuật toán cải tiến có độ tin cậy cao hơn
(a) (b) Hình 3.19: Đánh giá thuật toán tìm tần số vân trên ảnh có nhiều nếp gấp (DB1_B/105_6)
Chương 3 Cải tiến và thực nghiệm
(a) (b) Hình 3.20: Đánh giá thuật toán tìm hướng vân trên ảnh có vân tay ẩm (DB3_B/103_5)
3.11.3 Đánh giá thuật toán nâng cao ảnh
Dưới đây là minh họa kết quả của thuật toán nâng cao trên ba loại ảnh: ảnh có nếp gấp (hình 3.21), ảnh vân tay ẩm (hình 3.22) và ảnh vân tay khô (hình 3.23) Với mỗi hình, (a) là ảnh gốc, (b) là ảnh nâng cao dùng bộ lọc Gabor, (c) là ảnh nâng cao sau khi nhị phân hóa Trong các ảnh nâng cao, đa số các đường vân được làm rõ hơn, trơn hơn, và các nét đứt được nối lại Tuy nhiên thuật toán nâng cao dùng bộ lọc Gabor chưa hiệu quả tại một số vùng nhiễu, do các đường vân quá sít nhau, hoặc hướng và tần số vân cục bộ biến đổi đột ngột Hình 3.24 cho thấy ảnh hưởng của việc đánh giá vùng bất thường
Chương 3 Cải tiến và thực nghiệm
(a) (b) (c) Hình 3.21: Đánh giá thuật toán nâng cao trên ảnh có nếp gấp (DB2_B/103_2)
(a) (b) (c)Hình 3.22: Đánh giá thuật toán nâng cao trên ảnh có vân tay ẩm (DB1_B/103_5)
Chương 3 Cải tiến và thực nghiệm
(a) (b) (c) Hình 3.23: Đánh giá thuật toán nâng cao trên ảnh có vân tay khô (DB1_B/101_4)
(a) (b) (c) Hình 3.24: Hiệu quả của việc đánh giá vùng bất thường; (a) ảnh gốc DB1_B/102_7; (b) ảnh nâng cao không có đánh giá vùng bất thường; (c) ảnh nâng cao có đánh giá vùng bất thường
Chương 3 Cải tiến và thực nghiệm
3.11.4 Đánh giá thời gian của các thuật toán
Thực nghiệm chạy trên máy có cấu hình CPU 1.6 Ghz, RAM 512 Mb Với ảnh
350 x 350, thời gian trung bình của các thuật toán như sau:
Thuật toán Thời gian (s) Đánh giá hướng 0.43 Đánh giá tần số 0.21 Nâng cao ảnh 1.47
Một số thuật toán cải tiến trong nâng cao chất lượng ảnh vân tay