Tuy nhiên đối với ảnh chất lượng thấp, kỹ thuật ngưỡng cục bộ không phải lúc nào cũng cho kết quả tốt mà có sự xuất hiện các cựa gà (spur) hay dạng đảo (island) hay cầu (bridge), …
Hình 2-7: Ảnh nhị phân hóa và làm mảnh có thể chứa một số minutiae giả: (a) Đường vân dạng bridge, (b) Đường vân dạng cựa gà (Spur), (c) Đường vân dạng đảo (Island), (d) Đường
vân bị đứt (Break) [4].
2.2.2 Làm mảnh ảnh vân tay
Mục đích của giai đoạn làm mảnh đường vân tay là làm cho đường vân có độ dày là một điểm ảnh mà cấu trúc vân tay vẫn được đảm bảo. Có nhiều phương pháp được sử dụng làm mảnh đường vân. Một trong những phương pháp của các tác giả A.Rosenfeld và A. Kak (1982) là nhị phân hóa ảnh trước khi làm mảnh [1]. Giá trị của từng điểm ảnh là 0 hay 1 sẽ dựa trên vùng lân cận 8 của điểm ảnh đó. Trong phương pháp này, nhóm tác giả Rosenfeld và Kak đưa định nghĩa 8-simple để chỉ tính chất của 1 điểm ảnh P có thể bị xố mà khơng làm mất tính liên thơng các điểm ảnh trong lân cận 8 với P. Nói
cách khác, các điểm ảnh trong lân cận 8 với P vẫn liên thơng với nhau mà khơng cần có P. Để có được khung xương nằm ở giữa, ta duyệt hình xoay lần lượt theo trình tự các hướng trái-phải, phải-trái, trên-xuống, rồi dưới-lên. [Hình 2-10] .
Hình 2-8: (a, b) Khơng là 8 simple, (c,d) Là 8 simple
Thuật tốn làm mảnh được trình bày tóm tắt như sau:
- Đánh dấu các điểm ảnh 8-simple nằm ở biên và pixel này không phải là pixel kết thúc (điểm ảnh kết thúc có một pixel duy nhất trong lân cận 8).
- Xoá các điểm ảnh đã đánh dấu.
- Lặp lại bước 1 cho đến khi khơng có pixel bị đánh dấu.
Phương pháp này làm mảnh được đường vân về còn 1 điểm mà vẫn giữ được câu trúc của vân tay [ Hình 2-11].
Hình 2-9: (a) Ảnh được nâng cao chất lượng, (b) Ảnh được nhị phân hóa, (c) ảnh được làm mảnh [2].
2.2.3 Rút trích minutiae [2], [14]
Giả sử (x,y) là một điểm trên đường vân đã được làm mỏng và N0, N1, …, N7 là 8 điểm xung quanh nó thì:
- (x,y) là một điểm kết thúc nếu: 7 0 i i 1 N
- (x,y) là điểm rẽ nhánh nếu:
7 0 i i 3 N
- (x,y) là điểm liên kết nếu: 7 0 i i 2 N
- (x,y) là điểm giao nhau nếu: 7 0 i i 4 N
- (x,y) là điểm cơ lập nếu: 7 0 i i 0 N Hình 2-12 và 2-13
Hình 2-10: (a) Một phần của ảnh vân tay, (b) Điểm kết thúc, (c) Điểm rẽ nhánh.
Hình 2-11: Đặc điểm của một điểm ảnh dựa vào 8 điểm xung quanh.
Trong thuật tốn này giúp tìm ra được tất cả các đặc điểm trên ảnh vân tay có thể là minutiae của ảnh vân tay, tuy nhiên trong số các minutiae thu được xuất hiện một số minutiae giả (hình 2-9). Do vậy để nhận dạng ảnh vân tay một cách chính xác ta cần loại bỏ các minutiae giả.
2.2.4 Sử dụng mơ hình Artmap để loại bỏ minutiae giả mạo
Trên ảnh vân tay sau khi nhị phân hóa thường xuất hiện một số minutiae giả như: dạng spur, dạng bridge, dạng Island,…Vì vậy, để trích chọn minutiae một cách chính xác nhằm phục vụ cho việc nhận dạng ảnh vân tay chúng ta cần thực hiện bước loại bỏ minutiae giả sau: (Hình 2-14)
Hình 2-12: Cấu trúc vân lỗi được điều chỉnh thành cấu trúc vân đúng [1]
Luận văn đề cập tới phương pháp sử dụng mơ hình Artmap để loại bỏ minutiae giả của Mai Thị Hải và Lê Hoàng Thái [4], các bước thực hiện của phương pháp được đề xuất như sau: Đầu tiên, thuật toán Crossing number được sử dụng cho tập minutiae ban đầu. Tiếp theo, một số đặc điểm không phải là đặc trưng sẽ bị loại bỏ nhờ lọc sơ bộ. Cuối cùng, mạng norron Artmap xử lý trên minutiae còn lại để cho ra tập minutiae đại diện cuối cùng.
2.2.4.1 Cấu trúc mạng Artmap [4]
Mạng Artmap là một trong số mơ hình thuộc họ mạng noron Art (Adaptive resonance theory). Mạng được thiết kế như mạng học giám sát cho sự đối sánh giữa vector đầu vào và vector đầu ra. Kiến trúc mạng ARTMAP được xây dựng bao gồm hai mạng Art kết hợp với nhau thông quan một module điều khiển so khớp gọi là Mapfield (Hình 2-15 minh họa cấu trúc mạng noron Artmap)
Cấu trúc của Norron Artmap bao gồm các lớp:
- Lớp đầu vào (F0): Lớp này nhận giá trị của mẫu đầu vào, được biểu diễn dưới dạng vector nhị phân.
- Lớp so sánh (F1): So khớp mẫu nhận từ lớp F0 với các vector đại diện cho các phân nhóm trong lớp F2 nhằm tìm ra nơron chiến thắng. các bước thực hiện như sau:
(a) Nhận và sao chép mẫu từ lớp F0
(b) So sánh mẫu với các tập vector đại diện của các vector trong lớp F2. Từ đó kích hoạt noron chiến thắng trong F2.
- Lớp nhận dạng F2: Mỗi nơron của lớp này đại diện cho một phân nhóm trong khơng gian đặc tính. Nhiệm vụ của lớp này là cung cấp vector đại diện ứng với từng nơron trong nó để so khớp với mẫu đầu vào trong lớp F1.
- MapField (MF): Mạng nơron trong lớp này đại diện cho một lớp dữ liệu. nhiệm vụ của lớp này là đối chiếu giữa nơron chiến thắng trong lớp F2 với nơron đại diện trong lớp đầu ra (OL) để xác định lớp đầu ra cuối cùng cho mẫu nhận.
- Lớp đầu ra (OL): Mỗi nơron trong lớp này đại diện cho một lớp đã được định nghĩa trong tập dữ liệu.
2.2.4.2 Áp dụng mạng Artmap cho phân lớp minutiae [4] * Tập huấn luyện của mạng Artmap * Tập huấn luyện của mạng Artmap
Mỗi mẫu đưa vào mạng bao gồm một vector nhị phân đầu vào với N thành phần tương ứng với kích thước ma trận của minutiae (sử dụng mặt nạ 5 x 5 nên kích thước N=5x5 = 25). Mỗi thành phần trong vector đầu vào mang giá trị 0 hoặc 1 tương ứng với giá trị trên mỗi pixel ảnh. Trong hình 2-16, mơ tả một mẫu đầu vào của mạng có vector tương ứng (1000001000001000101001010).
Đầu ra của mạng được biểu diễn là vector có số thành phần tương ứng với số lớp cần phân lớp cho mẫu đầu vào. Mạng Artmap được dùng để phân chia minutiae thành 3 lớp: điểm kết thúc (ending), điểm rẽ nhánh (bifurcation), và minutiae sai. Do đó, mẫu đầu ra có vector tương ứng là (1 2 0) trong đó 1 là lớp ending, 2 là lớp bifurcation và 0 là lớp minutiae sai.
Trong quá trình xây dựng mẫu, mạng nơron Artmap cần biến đổi mẫu đầu vào thành vector bù (a,1 –a) do đó mẫu nhận vào mạng sẽ được biến đổi như sau:
Hình 2-15: Một số mẫu dạng rẽ nhánh trong tập huấn luyện mạng nơron Artmap * Cấu trúc và hoạt động của mạng Artmap cho phân lớp minutiae. * Cấu trúc và hoạt động của mạng Artmap cho phân lớp minutiae.
- Đầu vào: Mỗi nơron đầu vào tương ứng cho một minutiae có số thành phần là 25 + 25 nơron (25 thuộc tính của mặt nạ 5x5 và 25 thuộc tính cho phần bù của nó).
- Lớp so sánh: có số thành phần bằng với số thành phần của lớp đầu vào là 50 nơron.
- Lớp nhận dạng: Tổng số minutiae được huấn luyện cho mạng là 583 mẫu minutiae, tương ứng với số nơron trong mạng là: 583 x 50 = 29.150 nơron (50 là số thuộc tính của một minutiae).
- Mapfield: số lớp phân chia là 3 lớp tương ứng với số nơron trong lớp này 3 (thuộc tính của lớp này là 1 tương ứng với lớp điểm kết thúc của đường vân, 2 tương ứng với điểm rẽ nhánh, 0 tương ứng với lớp minutiae sai).
- Đầu ra: Gồm 3 nơron tương ứng với 3 lớp phân chia (1: ending; 2: bifurcation; 0: minutiae sai).
2.3 Phương pháp rút trích minutiae từ ảnh xám
2.3.1 Phương pháp rút trích đặc trưng từ ảnh xám bằng thuật tốn “dị theo đường vân” [2] vân” [2]
Ý tưởng của phương pháp này là dựa vào thuật tốn “Dị theo đường vân” (rigde line following) [7]. Từ ảnh vân tay đã được tăng cường, thuật toán sẽ dị các đường vân để tìm ra các đặc trưng rẽ nhánh và các đặc trưng kết thúc. Mặc dù độ phức tạp khái niệm của phương pháp này nhiều hơn, nhưng phương pháp này có độ tính tốn ít phức tạp hơn so với phương pháp rút trích các đặc trưng từ ảnh đã được nhị phân hóa.
* Dị theo đường vân
Giả sử I là một ảnh xám có kích thước là b, và z là giá trị mức xám tại điểm (i,j) thì bề mặt của ảnh vân tay I , với ảnh I có kích thước i=1, …a; j=1, ..b; có dạng như trong hình 2-16.
Hình 2-16: Các đường vân (ridge) và rãnh (ravine) trên bề mặt vân tay
Về mặt toán học, đường vân là tập hợp các điểm cực đại dọc theo cùng một hướng xác định. Việc rút trích các đặc trưng trực tiếp từ ảnh xám dựa vào thuật tốn “Dị theo đường vân”. Trong đó, thuật toán này dựa vào việc xác định các điểm cực đại trục giao với hướng của đường vân, bằng cách kết nối các điểm cực đại ta thu được đường vân trên ảnh vân tay.
Các bước chính rút trích đặc trưng bằng thuật tốn “Dị theo đường vân” được thực hiện như sau:
• Lấy một điểm bất kỳ (is,js) trên ảnh I. • Xác định hướng φs tại điểm (is,js).
• Tìm điểm cực đại (ic,jc) mà gần với (is,js) nhất (hình 2-19).
• Xác định hướng φc tại điểm (ic,jc).
• Dịch chuyển một đoạn μ theo hướng φc (hình 2.20). • Điều chỉnh lại điểm cực đại (ic,jc) và hướng φc.
• Tiếp tục dị theo đường vân cho đến khi khơng phát hiện được điểm cực đại (ic,jc) thì đó là điểm đặc trưng (có thể là điểm kết thúc hay điểm rẽ nhánh).
• Tiếp theo chọn một điểm (is,js) khác và thực hiện lại q trình trên cho
đến khi dị hết tất cả các đường vân.
Hình 2-17: Điểm cực đại (ic,jc) tương ứng với (is,,js)
Hình
2-18: Dịch chuyển một đoạn theo đường vân [7]
Thuật toán xác định điểm cực đại:
Giả sử (Ω (it,jt),φ, σ) là thiết diện của đường vân có điểm chính giữa là (it, jt), hướng của thiết diện φ = φt +π / 2 (φt là hướng của đường vân tại (it, jt) và
bề rộng của thiết diện m = 2σ +1 điểm ảnh (hình 3-4). Khi đó, Ω được xác định như sau:
={(i,j) | (i,j) I,(i,j) segment((istart, jstrart), (iend, jend))} (istart, jstrart)= (round(it - σ), round(jt - σsin))
(iend, jend)= (round(it + σ), round(jt + σsin))
Điểm cực đại được xác định bằng cách so sánh mức xám giữa các điểm trong Ω.
Hình 2-19: Thiết diện của đường vân [7]
2.3.2 Đánh giá hiệu quả rút trích minutiae bằng thuật tốn “dị theo đường vân”. Để thực hiện được phương pháp rút trích từ ảnh xám sử dụng “thuật tốn dị theo Để thực hiện được phương pháp rút trích từ ảnh xám sử dụng “thuật tốn dị theo đường vân” cần phải thực hiện bước nhằm nâng cao chất lượng ảnh vân tay như: chuẩn hóa, phân đoạn ảnh, ước lượng hướng, tính khoảng cách đường vân, nâng cao chất lượng ảnh như đã trình bày ở phần 2.2 đã nêu trên, sau đó mới thực hiện theo “thuật tốn dị theo đường vân”. Phương pháp này có ưu điểm là: thực hiện tính tốn khơng phức tạp so với phương pháp nhị phân, thời gian rút trích nhanh. Tuy nhiên nhược điểm của phương pháp này là hiệu quả rút trích khơng cao do chưa đánh giá độ tin cậy của đặc trưng sau khi rút trích (vì các đặc trưng rút trích được có các đặc trưng giả mạo mà phương pháp này chưa loại bỏ được). Đặc biệt là đối với ảnh vân tay có chất lượng thấp, phương pháp này chưa phát hiện được một số đặc trưng như: rẽ ba, dạng đảo, dạng cựa gà, dạng cầu ….
2.4 Kết luận
Trong chương 2, tác giả đã trình bày hai phương pháp nâng cao chất lượng ảnh vân tay và trích chọn minutiae thông dụng: phương pháp rút trích minutiae thơng qua giai đoạn làm mảnh và phương pháp phát hiện đặc trưng trực tiếp từ ảnh xám, song phải thực hiện nhiều công đoạn phức tạp và hiệu quả mang lại hiệu quả chưa cao. Cụ thể: nâng cao chất lượng ảnh vân tay bằng phương pháp lọc Gabor sau đó rút trích chọn minutiae thông qua giai đoạn nhị phân hóa và làm mảnh hay rút trích minutiae bằng cách dị theo đường vân đều làm xuất hiện một số minutiae giả, cần phải loại bỏ, mặt khác trải qua nhiều công đoạn phức tạp như: phân đoạn và chuẩn hóa ảnh, ước lượng hướng, tính khoảng cách đường vân sau đó mới nâng cao chất lượng ảnh, việc trích chọn minutiae phải thơng qua giai đoạn nhị phân hóa nên dễ phát sinh các minutiae giả mạo và cần phải loại bỏ chúng. Trong chương tiếp theo tác giả xin trình bày phương pháp trích chọn minutiae từ ảnh xám, cụ thể nâng cao chất lượng ảnh dựa vào tháp phân rã và trích chọn minutiae bằng phép lọc đối xứng xoay của nhóm Bigun - 2008. Phương pháp này đã khắc phục được những hạn chế của phương pháp trình bày ở trên.
CHƯƠNG 3: RÚT TRÍCH ĐẶC TRƯNG TỪ ẢNH XÁM
3.1 Mơ hình của nhóm Bigun
Trong luận văn, tác giả trình bày mơ hình nâng cao chất lượng ảnh vân tay và rút trích minutiae bỏ qua bước nhị phân hóa và làm mảnh ảnh vân tay. Mơ hình được trình bày trong hình 3.1.
Hình 3-1: Mơ hình nâng cao chất lượng ảnh vân tay và trích chọn minutiae.
Hình 3-1: Mơ hình rút trích điểm đặc trựng từ ảnh xám
Trong mơ hình này, việc trích chọn minutiae từ ảnh xám qua ba bước: Chuẩn hóa và phân đoạn ảnh; Nâng cao chất lượng ảnh vân tay dựa vào tháp lọc phân rã; Trích chọn minutiae bằng phương pháp lọc đối xứng xoay (2.2 Chuẩn hóa và phân đoạn ảnh đã được trình bày trong chương 2)
3.2 Nâng cao chất lượng ảnh dựa vào tháp phân rã [8]
Phương pháp này được nhóm Bigun đề xuất sử dụng tháp lọc Laplace – bộ lọc hướng không gian chỉ cho phép các tần số trong một khoảng nhất định đi qua và đề xuất phương pháp lọc có hướng của Gauss để nâng cao chất lượng ảnh vân tay. Các hướng lọc được khơi phục tại các mức tháp [hình 3-2]
Ảnh vân tay
Tập minutiae của ảnh vân tay
Chuẩn hóa và phân đoạn ảnh Nâng cao chất lượng ảnh bằng tháp lọc phân rã Rút trích minutiae bằng phép lọc đối xứng xoay
Hình 3-2 : Sơ đồ nâng cao chất lượng ảnh bằng tháp phân rã
Tháp phân rã:
Một tháp phân rã địi hỏi phải thay đổi kích thước (thay đổi tỉ lệ hình học). Để tạo ra tháp phân rã Laplacian, nhóm Bigun định nghĩa ảnh I được thay đổi theo hệ số k, thu nhỏ reduce(I,k) và mở rộng expand(I,k). Trong quá trình thu nhỏ ảnh theo hệ số k, ảnh ban đầu được lọc loại bỏ tần số thấp để ngăn chặn răng cưa bằng cách sử dụng hàm Gaussian. Độ lệch chuẩn của thao tác thu giảm phụ thuộc vào yếu tố thay đổi hệ số k, mà ở đây được tính theo xấp xỉ bên dưới của bộ lọc giải tần thấp lý tưởng tương ứng, σ=(0.75.k)/2. Khởi tạo quá trình thu giảm ảnh ban đầu bởi hệ số k0 ≥1.5 để loại trừ các tần số cao nhất. Trong bước kế tiếp, giảm kích thước hình ảnh bởi hệ số k ≤ 1.5 ba lần. (Bảng 3-1) Vân tay gốc Vân tay gốc Vân tay sau khi tăng cường ảnh l1 LS1 l 1 l2 l2 l3 l3 LS2 LS3 CE OE DF CE OE DF CE OE DF
Bảng 3-1. Tiến trình xây dựng tháp phân rã
Tiến trình xây dựng tháp phân rã a) Tháp phân rã Gaussian-like Laplacian-like g1= reduce(fp,k0) l1= g1 – expand(g2,k); g2= reduce(g1,k) l2= g2 – expand(g3,k); g3= reduce(g2,k) l3= g3 – expand(g4,k); g4= reduce(g3,k)
b) Quá trình xây dựng lại ảnh vân tay fp Fp=expand(..,k0)
↑ expand(..,k)+ l1
↑ expand(l3,k) + l2
Để tạo ra hình ảnh có chứa các tín hiệu tần số có giới hạn bởi hình ảnh gốc fp, mở rộng ba ảnh g2-4 bằng cách nhân với hệ số k và mỗi mức trong số chúng trừ đi mức thấp hơn, l1-3 có chứa đầy đủ tần số cao, trung bình và thấp (vân, rãnh) của dấu vân tay gốc. Đáng chú ý, chỉ có các mức tháp Laplacian l1-3 được tiếp tục sử dụng. Độ tương phản của các ảnh có giải tần nhất định được nâng cao, tiếp theo li=CE(li), trong đó CE(x) = dấu(x). x , giảm giá trị các vector nhỏ x khi so với các vector có cường độ lớn của x. Lưu ý, các điểm ảnh vân có giá trị âm trong khi điểm rãnh có giá trị dương. (hình 3-3).
Hình 3-3: Kết quả sử dụng tháp phân rã nâng cao chất xử lý ảnh chất lượng ảnh vân tay, ảnh chất lượng tốt (104_6- hàng trên), hàng dưới ảnh chất lượng thấp (1_1) của FVC2000- DB2; cột (a) Ảnh gốc, cột (b)-(c) sau khi ảnh được tăng cường ở mức l1-3 , Cột (d) ảnh được
nâng cao chất lượng bằng cách thực hiện các bước được liệt kê ở phần b, bảng 1.