2.2.1 Nhị phân hóa [2] [12]
Nhị phân hóa ảnh vân tay là đưa mức xám của điểm ảnh về 0 hoặc 1 (0 - mức xám của nền, 1 - mức xám của ảnh) thông thường trong kỹ thuật nhị phân hóa ảnh ta chọn một ngưỡng toàn cục t và được thực hiện bằng cách lập các điểm ảnh có mức xám nhỏ hơn t thì đưa về 0, ngược lại các điểm ảnh còn lại có ngưỡng lớn hơn hoặc bằng t thì đưa về 1. Nhưng trong thực tế, ảnh có chất lượng thấp thường có độ tương phản và cường độ khác nhau. Do đó, một ngưỡng t ở trên là không đủ để nhị phân hóa ảnh một cách chính xác. Trong luận văn này tác giả đề xuất kỹ thuật chọn ngưỡng thích nghi cục bộ. Bằng cách điều chỉnh giá của nó theo cường độ cục bộ trung bình bằng cách:
- Tính giá trị ngưỡng trên mỗi dòng bằng trung bình giá trị lớn nhất max (đỉnh rãnh), và nhỏ nhất min (đỉnh của vân).
- Tìm phần tử trung vị của các ngưỡng thuộc mỗi dòng này là ngưỡng cuối của khối. ) 22 2 ( ), cos fx 2 cos( ) sin y ( ) cos x ( 2 1 exp ) f , : y , x ( h 2 y 2 2 x 2 (a) (b)
Kết quả việc sử dụng ngưỡng cục bộ thích nghi là hiệu quả hơn, đường vân đúng với thực tế hơn là sử dụng ngưỡng toàn cục (Hình 2-8 minh họa ảnh nhị phân dùng ngưỡng cục bộ thích nghi).
Hình 2-6: (a) Ảnh gốc, (b) Ảnh nhị phân theo cách chọn ngưỡng cục bộ thích nghi.
Tuy nhiên đối với ảnh chất lượng thấp, kỹ thuật ngưỡng cục bộ không phải lúc nào cũng cho kết quả tốt mà có sự xuất hiện các cựa gà (spur) hay dạng đảo (island) hay cầu (bridge), …
Hình 2-7: Ảnh nhị phân hóa và làm mảnh có thể chứa một số minutiae giả: (a) Đường vân dạng bridge, (b) Đường vân dạng cựa gà (Spur), (c) Đường vân dạng đảo (Island), (d) Đường
vân bị đứt (Break) [4].
2.2.2 Làm mảnh ảnh vân tay
Mục đích của giai đoạn làm mảnh đường vân tay là làm cho đường vân có độ dày là một điểm ảnh mà cấu trúc vân tay vẫn được đảm bảo. Có nhiều phương pháp được sử dụng làm mảnh đường vân. Một trong những phương pháp của các tác giả A.Rosenfeld và A. Kak (1982) là nhị phân hóa ảnh trước khi làm mảnh [1]. Giá trị của từng điểm ảnh là 0 hay 1 sẽ dựa trên vùng lân cận 8 của điểm ảnh đó. Trong phương pháp này, nhóm tác giả Rosenfeld và Kak đưa định nghĩa 8-simple để chỉ tính chất của 1 điểm ảnh P có thể bị xoá mà không làm mất tính liên thông các điểm ảnh trong lân cận 8 với P. Nói
cách khác, các điểm ảnh trong lân cận 8 với P vẫn liên thông với nhau mà không cần có P. Để có được khung xương nằm ở giữa, ta duyệt hình xoay lần lượt theo trình tự các hướng trái-phải, phải-trái, trên-xuống, rồi dưới-lên. [Hình 2-10] .
Hình 2-8: (a, b) Không là 8 simple, (c,d) Là 8 simple
Thuật toán làm mảnh được trình bày tóm tắt như sau:
- Đánh dấu các điểm ảnh 8-simple nằm ở biên và pixel này không phải là pixel kết thúc (điểm ảnh kết thúc có một pixel duy nhất trong lân cận 8).
- Xoá các điểm ảnh đã đánh dấu.
- Lặp lại bước 1 cho đến khi không có pixel bị đánh dấu.
Phương pháp này làm mảnh được đường vân về còn 1 điểm mà vẫn giữ được câu trúc của vân tay [ Hình 2-11].
Hình 2-9: (a) Ảnh được nâng cao chất lượng, (b) Ảnh được nhị phân hóa, (c) ảnh được làm mảnh [2].
2.2.3 Rút trích minutiae [2], [14]
Giả sử (x,y) là một điểm trên đường vân đã được làm mỏng và N0, N1, …, N7 là 8 điểm xung quanh nó thì:
- (x,y) là một điểm kết thúc nếu: 7 0 i i 1 N
- (x,y) là điểm rẽ nhánh nếu:
7 0 i i 3 N
- (x,y) là điểm liên kết nếu: 7 0 i i 2 N
- (x,y) là điểm giao nhau nếu: 7 0 i i 4 N
- (x,y) là điểm cô lập nếu: 7 0 i i 0 N Hình 2-12 và 2-13
Hình 2-10: (a) Một phần của ảnh vân tay, (b) Điểm kết thúc, (c) Điểm rẽ nhánh.
Hình 2-11: Đặc điểm của một điểm ảnh dựa vào 8 điểm xung quanh.
Trong thuật toán này giúp tìm ra được tất cả các đặc điểm trên ảnh vân tay có thể là minutiae của ảnh vân tay, tuy nhiên trong số các minutiae thu được xuất hiện một số minutiae giả (hình 2-9). Do vậy để nhận dạng ảnh vân tay một cách chính xác ta cần loại bỏ các minutiae giả.
2.2.4 Sử dụng mô hình Artmap để loại bỏ minutiae giả mạo
Trên ảnh vân tay sau khi nhị phân hóa thường xuất hiện một số minutiae giả như: dạng spur, dạng bridge, dạng Island,…Vì vậy, để trích chọn minutiae một cách chính xác nhằm phục vụ cho việc nhận dạng ảnh vân tay chúng ta cần thực hiện bước loại bỏ minutiae giả sau: (Hình 2-14)
Hình 2-12: Cấu trúc vân lỗi được điều chỉnh thành cấu trúc vân đúng [1]
Luận văn đề cập tới phương pháp sử dụng mô hình Artmap để loại bỏ minutiae giả của Mai Thị Hải và Lê Hoàng Thái [4], các bước thực hiện của phương pháp được đề xuất như sau: Đầu tiên, thuật toán Crossing number được sử dụng cho tập minutiae ban đầu. Tiếp theo, một số đặc điểm không phải là đặc trưng sẽ bị loại bỏ nhờ lọc sơ bộ. Cuối cùng, mạng norron Artmap xử lý trên minutiae còn lại để cho ra tập minutiae đại diện cuối cùng.
2.2.4.1 Cấu trúc mạng Artmap [4]
Mạng Artmap là một trong số mô hình thuộc họ mạng noron Art (Adaptive resonance theory). Mạng được thiết kế như mạng học giám sát cho sự đối sánh giữa vector đầu vào và vector đầu ra. Kiến trúc mạng ARTMAP được xây dựng bao gồm hai mạng Art kết hợp với nhau thông quan một module điều khiển so khớp gọi là Mapfield (Hình 2-15 minh họa cấu trúc mạng noron Artmap)
Cấu trúc của Norron Artmap bao gồm các lớp:
- Lớp đầu vào (F0): Lớp này nhận giá trị của mẫu đầu vào, được biểu diễn dưới dạng vector nhị phân.
- Lớp so sánh (F1): So khớp mẫu nhận từ lớp F0 với các vector đại diện cho các phân nhóm trong lớp F2 nhằm tìm ra nơron chiến thắng. các bước thực hiện như sau:
(a) Nhận và sao chép mẫu từ lớp F0
(b) So sánh mẫu với các tập vector đại diện của các vector trong lớp F2. Từ đó kích hoạt noron chiến thắng trong F2.
- Lớp nhận dạng F2: Mỗi nơron của lớp này đại diện cho một phân nhóm trong không gian đặc tính. Nhiệm vụ của lớp này là cung cấp vector đại diện ứng với từng nơron trong nó để so khớp với mẫu đầu vào trong lớp F1.
- MapField (MF): Mạng nơron trong lớp này đại diện cho một lớp dữ liệu. nhiệm vụ của lớp này là đối chiếu giữa nơron chiến thắng trong lớp F2 với nơron đại diện trong lớp đầu ra (OL) để xác định lớp đầu ra cuối cùng cho mẫu nhận.
- Lớp đầu ra (OL): Mỗi nơron trong lớp này đại diện cho một lớp đã được định nghĩa trong tập dữ liệu.
2.2.4.2 Áp dụng mạng Artmap cho phân lớp minutiae [4] * Tập huấn luyện của mạng Artmap * Tập huấn luyện của mạng Artmap
Mỗi mẫu đưa vào mạng bao gồm một vector nhị phân đầu vào với N thành phần tương ứng với kích thước ma trận của minutiae (sử dụng mặt nạ 5 x 5 nên kích thước N=5x5 = 25). Mỗi thành phần trong vector đầu vào mang giá trị 0 hoặc 1 tương ứng với giá trị trên mỗi pixel ảnh. Trong hình 2-16, mô tả một mẫu đầu vào của mạng có vector tương ứng (1000001000001000101001010).
Đầu ra của mạng được biểu diễn là vector có số thành phần tương ứng với số lớp cần phân lớp cho mẫu đầu vào. Mạng Artmap được dùng để phân chia minutiae thành 3 lớp: điểm kết thúc (ending), điểm rẽ nhánh (bifurcation), và minutiae sai. Do đó, mẫu đầu ra có vector tương ứng là (1 2 0) trong đó 1 là lớp ending, 2 là lớp bifurcation và 0 là lớp minutiae sai.
Trong quá trình xây dựng mẫu, mạng nơron Artmap cần biến đổi mẫu đầu vào thành vector bù (a,1 –a) do đó mẫu nhận vào mạng sẽ được biến đổi như sau:
Hình 2-15: Một số mẫu dạng rẽ nhánh trong tập huấn luyện mạng nơron Artmap * Cấu trúc và hoạt động của mạng Artmap cho phân lớp minutiae.
- Đầu vào: Mỗi nơron đầu vào tương ứng cho một minutiae có số thành phần là 25 + 25 nơron (25 thuộc tính của mặt nạ 5x5 và 25 thuộc tính cho phần bù của nó).
- Lớp so sánh: có số thành phần bằng với số thành phần của lớp đầu vào là 50 nơron.
- Lớp nhận dạng: Tổng số minutiae được huấn luyện cho mạng là 583 mẫu minutiae, tương ứng với số nơron trong mạng là: 583 x 50 = 29.150 nơron (50 là số thuộc tính của một minutiae).
- Mapfield: số lớp phân chia là 3 lớp tương ứng với số nơron trong lớp này 3 (thuộc tính của lớp này là 1 tương ứng với lớp điểm kết thúc của đường vân, 2 tương ứng với điểm rẽ nhánh, 0 tương ứng với lớp minutiae sai).
- Đầu ra: Gồm 3 nơron tương ứng với 3 lớp phân chia (1: ending; 2: bifurcation; 0: minutiae sai).
2.3 Phương pháp rút trích minutiae từ ảnh xám
2.3.1 Phương pháp rút trích đặc trưng từ ảnh xám bằng thuật toán “dò theo đường vân” [2] vân” [2]
Ý tưởng của phương pháp này là dựa vào thuật toán “Dò theo đường vân” (rigde line following) [7]. Từ ảnh vân tay đã được tăng cường, thuật toán sẽ dò các đường vân để tìm ra các đặc trưng rẽ nhánh và các đặc trưng kết thúc. Mặc dù độ phức tạp khái niệm của phương pháp này nhiều hơn, nhưng phương pháp này có độ tính toán ít phức tạp hơn so với phương pháp rút trích các đặc trưng từ ảnh đã được nhị phân hóa.
* Dò theo đường vân
Giả sử I là một ảnh xám có kích thước là a×b, và z là giá trị mức xám tại điểm (i,j) thì bề mặt của ảnh vân tay I , với ảnh I có kích thước i=1, …a; j=1, ..b; có dạng như trong hình 2-16.
Hình 2-16: Các đường vân (ridge) và rãnh (ravine) trên bề mặt vân tay
Về mặt toán học, đường vân là tập hợp các điểm cực đại dọc theo cùng một hướng xác định. Việc rút trích các đặc trưng trực tiếp từ ảnh xám dựa vào thuật toán “Dò theo đường vân”. Trong đó, thuật toán này dựa vào việc xác định các điểm cực đại trục giao với hướng của đường vân, bằng cách kết nối các điểm cực đại ta thu được đường vân trên ảnh vân tay.
Các bước chính rút trích đặc trưng bằng thuật toán “Dò theo đường vân” được thực hiện như sau:
• Lấy một điểm bất kỳ (is,js) trên ảnh I. • Xác định hướng φs tại điểm (is,js).
• Tìm điểm cực đại (ic,jc) mà gần với (is,js) nhất (hình 2-19). • Xác định hướng φc tại điểm (ic,jc).
• Dịch chuyển một đoạn μ theo hướng φc (hình 2.20). • Điều chỉnh lại điểm cực đại (ic,jc) và hướng φc.
• Tiếp tục dò theo đường vân cho đến khi không phát hiện được điểm cực đại (ic,jc) thì đó là điểm đặc trưng (có thể là điểm kết thúc hay điểm rẽ nhánh).
• Tiếp theo chọn một điểm (is,js) khác và thực hiện lại quá trình trên cho đến khi dò hết tất cả các đường vân.
Hình 2-17: Điểm cực đại (ic,jc) tương ứng với (is,,js)
Hình
2-18: Dịch chuyển một đoạn theo đường vân [7]
Thuật toán xác định điểm cực đại:
Giả sử (Ω (it,jt),φ, σ) là thiết diện của đường vân có điểm chính giữa là (it, jt), hướng của thiết diện φ = φt +π / 2 (φt là hướng của đường vân tại (it, jt) và
bề rộng của thiết diện m = 2σ +1 điểm ảnh (hình 3-4). Khi đó, Ω được xác định như sau:
={(i,j) | (i,j) I,(i,j) segment((istart, jstrart), (iend, jend))} (istart, jstrart)= (round(it - σ), round(jt - σsin))
(iend, jend)= (round(it + σ), round(jt + σsin))
Điểm cực đại được xác định bằng cách so sánh mức xám giữa các điểm trong Ω.
Hình 2-19: Thiết diện của đường vân [7]
2.3.2 Đánh giá hiệu quả rút trích minutiae bằng thuật toán “dò theo đường vân”. Để thực hiện được phương pháp rút trích từ ảnh xám sử dụng “thuật toán dò theo Để thực hiện được phương pháp rút trích từ ảnh xám sử dụng “thuật toán dò theo đường vân” cần phải thực hiện bước nhằm nâng cao chất lượng ảnh vân tay như: chuẩn hóa, phân đoạn ảnh, ước lượng hướng, tính khoảng cách đường vân, nâng cao chất lượng ảnh như đã trình bày ở phần 2.2 đã nêu trên, sau đó mới thực hiện theo “thuật toán dò theo đường vân”. Phương pháp này có ưu điểm là: thực hiện tính toán không phức tạp so với phương pháp nhị phân, thời gian rút trích nhanh. Tuy nhiên nhược điểm của phương pháp này là hiệu quả rút trích không cao do chưa đánh giá độ tin cậy của đặc trưng sau khi rút trích (vì các đặc trưng rút trích được có các đặc trưng giả mạo mà phương pháp này chưa loại bỏ được). Đặc biệt là đối với ảnh vân tay có chất lượng thấp, phương pháp này chưa phát hiện được một số đặc trưng như: rẽ ba, dạng đảo, dạng cựa gà, dạng cầu ….
2.4 Kết luận
Trong chương 2, tác giả đã trình bày hai phương pháp nâng cao chất lượng ảnh vân tay và trích chọn minutiae thông dụng: phương pháp rút trích minutiae thông qua giai đoạn làm mảnh và phương pháp phát hiện đặc trưng trực tiếp từ ảnh xám, song phải thực hiện nhiều công đoạn phức tạp và hiệu quả mang lại hiệu quả chưa cao. Cụ thể: nâng cao chất lượng ảnh vân tay bằng phương pháp lọc Gabor sau đó rút trích chọn minutiae thông qua giai đoạn nhị phân hóa và làm mảnh hay rút trích minutiae bằng cách dò theo đường vân đều làm xuất hiện một số minutiae giả, cần phải loại bỏ, mặt khác trải qua nhiều công đoạn phức tạp như: phân đoạn và chuẩn hóa ảnh, ước lượng hướng, tính khoảng cách đường vân sau đó mới nâng cao chất lượng ảnh, việc trích chọn minutiae phải thông qua giai đoạn nhị phân hóa nên dễ phát sinh các minutiae giả mạo và cần phải loại bỏ chúng. Trong chương tiếp theo tác giả xin trình bày phương pháp trích chọn minutiae từ ảnh xám, cụ thể nâng cao chất lượng ảnh dựa vào tháp phân rã và trích chọn minutiae bằng phép lọc đối xứng xoay của nhóm Bigun - 2008. Phương pháp này đã khắc phục được những hạn chế của phương pháp trình bày ở trên.
CHƯƠNG 3: RÚT TRÍCH ĐẶC TRƯNG TỪ ẢNH XÁM
3.1 Mô hình của nhóm Bigun
Trong luận văn, tác giả trình bày mô hình nâng cao chất lượng ảnh vân tay và rút trích minutiae bỏ qua bước nhị phân hóa và làm mảnh ảnh vân tay. Mô hình được trình bày trong hình 3.1.
Hình 3-1: Mô hình nâng cao chất lượng ảnh vân tay và trích chọn minutiae.
Hình 3-1: Mô hình rút trích điểm đặc trựng từ ảnh xám
Trong mô hình này, việc trích chọn minutiae từ ảnh xám qua ba bước: Chuẩn hóa và phân đoạn ảnh; Nâng cao chất lượng ảnh vân tay dựa vào tháp lọc phân rã; Trích chọn minutiae bằng phương pháp lọc đối xứng xoay (2.2 Chuẩn hóa và phân đoạn ảnh đã được trình bày trong chương 2)
3.2 Nâng cao chất lượng ảnh dựa vào tháp phân rã [8]
Phương pháp này được nhóm Bigun đề xuất sử dụng tháp lọc Laplace – bộ lọc hướng không gian chỉ cho phép các tần số trong một khoảng nhất định đi qua và đề xuất phương pháp lọc có hướng của Gauss để nâng cao chất lượng ảnh vân tay. Các hướng lọc được khôi phục tại các mức tháp [hình 3-2]
Ảnh vân tay
Tập minutiae của ảnh vân tay
Chuẩn hóa và phân đoạn ảnh Nâng cao chất lượng ảnh bằng tháp lọc phân rã Rút trích minutiae bằng phép lọc đối xứng xoay
Hình 3-2 : Sơ đồ nâng cao chất lượng ảnh bằng tháp phân rã
Tháp phân rã:
Một tháp phân rã đòi hỏi phải thay đổi kích thước (thay đổi tỉ lệ hình học). Để tạo ra tháp phân rã Laplacian, nhóm Bigun định nghĩa ảnh I được thay đổi theo hệ số k, thu nhỏ reduce(I,k) và mở rộng expand(I,k). Trong quá trình thu nhỏ ảnh theo hệ số k, ảnh ban đầu được lọc loại bỏ tần số thấp để ngăn chặn răng cưa bằng cách sử dụng hàm Gaussian. Độ lệch chuẩn của thao tác thu giảm phụ thuộc vào yếu tố thay đổi hệ số k, mà ở đây được tính theo xấp xỉ bên dưới của bộ lọc giải tần thấp lý tưởng tương ứng, σ=(0.75.k)/2. Khởi tạo quá trình thu giảm ảnh ban