Thuật toỏnmới xử lý phõn đoạn võn tay từ mẫu ảnh chỉ bản 10 ngún

Một phần của tài liệu luận văn một số giải pháp nâng cao hiệu quả hệ thống nhận dạng vân tay (Trang 51)

2.2.1. Thuật toỏn phõn đoạn thụ

í tƣởng chủ đạo của thuật toỏn này dựa trờn việc dựng kỹ thuật tiền xử lý phổ dụng nhƣ chuẩn húa, làm trơn ảnh và chuyển đổi ảnh chỉ bản về dạng nhị phõn sao cho cỏc điểm thuộc vựng võn quan tõm cú giỏ trị bằng 1 cũn cỏc điểm nền cũn lại cú giỏ trị bằng 0. Sau đú tiến hành dũ biờn để tỏch cỏc vựng võn tay ra khỏi phần nền chỉ bản.

Để thực thi ý tƣởng trờn, luận ỏn đề xuất thuật toỏn làm trơn và dũ biờn theo cỏc bƣớc sau:

Bước 1: Xử lý chuẩn hoỏ và làmtrơn ảnhđầu vào (ảnh chỉ bản mƣời ngún).

1.1. Xử lý chuẩn hoỏ mức xỏm ảnh: Do ảnh võn tay thu nhận ban đầu với nhiều loại scanner khỏc nhau với mức độ chiếu sỏng khỏc nhau nờn thƣờng cú mức xỏm phõn bố khụng thuần nhất, cú một số vựng trờn chỉ bản lăn mực quỏ đậm, quỏ đen, cú số khỏc lại quỏ nhạt, quỏ sỏng nờn cần phải dựng kỹ thuật chuẩn húa ảnh địa phƣơng [39], tức là thay đổi mức xỏm ban đầu I(x,y) trong từng cửa sổ ảnh bằng mức xỏm mới N(x,y) nhƣ sau:

            M y x I cho M M y x I cho M y x N ) , ( , V M) - y ) (I(x, * V ) , ( , V M) - y ) (I(x, * V ) , ( 2 0 0 2 0 0 (2.1)

Trong đú, I(x,y) là mức xỏm ban đầu tại điểm (x,y); M=(1/w2) ∑w (I), V=(1/w2) ∑w (I-M)2 lần lƣợt là mức xỏm trung bỡnh và phƣơng sai mức xỏm ƣớc lƣợng trờn cửa sổ kớch thƣớc wxw (phần thực nghiệm chọn w=32) ; M0, V0 lần lƣợt là mức xỏm trung bỡnh và phƣơng sai mức xỏm cần chuẩn hoỏ; N(x,y) là mức xỏm mới sau chuẩn hoỏ.(M0, V0 cú thể chọn tựy ý, nhƣng phần thực nghiệm chọn M0=V0=100). (Cần lƣu ý rằng: Nếu 1 cửa sổ võn tay bất kỳ cú M=M0, V=V0, tức là đó đạt giỏ trị chuẩn, thỡ N(x,y)=I(x,y)).

52

(a) (b) (c)

Hỡnh 2.6: Mẫu chỉ bản 10 ngún đƣợc phõn đoạn thụ bằng kỹ thuật chuẩn húa, làm trơn, chuyển đổi nhị phõn và dũ biờn, định vị hỡnh chữ nhật ngoại tiếp để cắt ảnh.

1.2. Dựng cửa sổ wxw điểm ảnh quột lần lƣợt từ trỏi qua phải từ trờn xuống dƣới để thay thế giỏ trị mức xỏm ảnh hiện tại bằng giỏ trị trung bỡnh của cỏc điểm ảnh trờn cửa sổ. Chuyển đổi ảnh về dạng nhị phõn, dựng ngƣỡng là giỏ trị mức xỏm trung bỡnh địa phƣơng, tớnh trờn cửa sổ wxw. Kết quả xử lý này đƣợc minh họa trờn Hỡnh 2.6(b).

1.3. Tiến hành dũ biờn bằng thuật toỏn dũ biờn 8-liờn thụng và xử lý xấp xỉ tuyến tớnh từng đoạn để biểu diễn cỏc đƣờng biờn thành những đa tuyến biờn khộp kớn dựng giải thuật [2,5]. Để tăng hiệu quả thuật toỏn dũ biờn phỏt hiện vựng võn, cần chọn bƣớc lƣới phự hợp để lọc lấy cỏc vựng võn, loại bớt cỏc vựng nhiễu nhỏ. Phần thực nghiệm ta sẽ giả định vựng võn bộ nhất cú kớch thƣớc 8x8mm và vựng võn lớn nhất cú kớch thƣớc 20x20mm nờn bƣớc lƣới thớch hợp đƣợc chọn là 8mm.

Bước 2: Xử lý kết quả dũ biờn, xỏc định vựng võn và đa giỏc ngoại tiếp vựng võn cần cắt.

2.1. Tớnh bao lồi của tập đỉnh đa tuyến biờn vựng đƣợc chọn bằng thuật toỏn Graham [34]. Sau đú tớnh khung hỡnh chữ nhật ngoại tiếp bao lồi (Xmin, Ymin, Xmax,Ymax) để xỏc định cửa sổ cắt ảnh.

2.2. Kiểm tra cửa sổ ảnh với cỏc điều kiện ràng buộc: diện tớch tối thiểu (>=1/3 diện tớch mỗi ụ chứa võn ngún tay), diện tớch tối đa (<= diện tớch mỗi ụ

53

chứa võn ngún tay), vị trớ tƣơng đối của khung hỡnh so với mẫu chỉ bản (thỏa món điều kiện cần: phải chứa tõm ụ chứa võn ngún tay).

2.3. Kiểm tra thứ tự ngún: Dựng thuật toỏn đối sỏnh võn tay đề xuất [16,60] để tiến hành đối sỏnh từng võn tay 10 ngún ấn vựng dƣới với từng võn tay 10 ngún lăn vựng giữa chỉ bản để đƣa ra kết luận vị trớ cỏc ngún đƣợc lăn cú đỳng thứ tự biểu mẫu qui định hay khụng dựa trờn thứ tự cỏc ngún võn tay ấn. Nếu thứ tự khụng đỳng thỡ hiển thị chỉ bản để thẩm định lại cả kết quả lăn tay và kết quả phõn đoạn. Nếu thứ ấn đỳng (trong đa số trƣờng hợp) thỡ cú thể kết luận chỉ bản võn tay đƣợc thu nhận và phõn đoạn đạt yờu cầu. 2.4. Trờn cơ sở cỏc giỏ trị gúc quay thu đƣợc qua đối sỏnh từng cặp võn tay lăn

với võn tay ấn, tiến hành quay ảnh cỏc võn tay ấn theo chiều thẳng đứng. Tớnh lại cỏc giỏ trị Xmin, Ymin, Xmax, Ymax của cỏc đỉnh bao lồi đƣờng biờn sau khi quay, tức là hỡnh chữ nhật ngoại tiếp để định vị toạ độ khung cắt lần 2 cho cỏc ngún võn tay.

2.5. Hiển thị và xử lý tƣơng tỏc cỏc trƣờng hợp đặc biệt nhƣ cỏc chỉ bản lăn thiếu ngún, lăn sai quy cỏch khụng thoả món điều kiện thẩm định.

Bước 3:Hiển thị kết quả định vị khung cắt để thẩm định bằng mắt thƣờng và chuyển sang đoạn tƣơng tỏc.Kết quả đầu ra của giải thuật phõn đoạn thụ đƣợc minh họa trong Hỡnh 2.6(c), bao gồm 20 khung hỡnhcho cỏc võn ngún tay (10 ảnh của 10 võn tay lăn, 10 ảnh của 10 võn tay ấn) và 1 khung hỡnh chứa mó vạch, 1 khung hỡnh chứa phần ảnh đầu chỉ bản.

2.2.2. Thuật toỏn phõn đoạn mịn

Phƣơng phỏp phõn đoạn mịn đƣợc đề xuất dựa trờn một số nhận xột dƣới đõy:

- Ảnh cỏc dũng đƣờng nột rừ ràng cú tớnh xen kẽ giữa võn và rónh nhƣ võn tay thƣờng tuõn thủ luật cõn bằng trắng đen, tức là nếu ta phõn ngƣỡng địa phƣơng thớch hợp thỡ tổng số điểm trờn rónh võn cũng gần xấp xỉ với số điểm trờn đƣờng võn. Ngƣợc lại, trờn cỏc vựng võn khụng rừ, cú nhiều vết bụi bẩn thỡ đƣờng võn thƣờng dớnh nhau và qui luật cõn bằng trờn khụng cũn đỳng

54

nữa. Điều này gợi ý cho ta tiến hành biến đổi ảnh võn tay đa cấp xỏm thành ảnh võn tay nhị phõn dựng ngƣỡng địa phƣơng.

- Nếu dựng thuật toỏn dũ biờn để vộc tơ húa đƣờng biờn của đƣờng võn ảnh nhị phõn và xấp xỉ tuyến tớnh từng đoạn cỏc đƣờng biờn dũ đƣợc ta sẽ thu đƣợc võn tay dƣới dạng vẽ thể hiện bằng tập đƣờng cong tham số dƣới dạng đa tuyến (polyline). Cỏc vựng nhiễu thƣờng thể hiện bằng cỏc đoạn đƣờng biờn phức tạp, cú nhiều đoạn ngắn chạy ngoằn ngoốo thay đổi hƣớng nhanh. Cũn cỏc vựng võn chất lƣợng tốt thƣờng cú cỏc đoạn biờn dài, thẳng hoặc nhiều đoạn kế tiếp nhau đổi hƣớng đồng đều và chậm. Vỡ vậy, nếu kết hợp vừa vộc tơ húa đƣờng biờn, vừa xấp xỉ tuyến tớnh từng đoạn rồi sau đú tớnh hƣớng, tớnh gúc đổi hƣớng cho từng đoạn đƣờng biờn chỳng ta vừa trớch chọn đƣợc cỏc điểm ĐTCT nhƣ đó thực hiện trong [2,5] vừa kết hợp đỏnh giỏ chất lƣợng tại cỏc vựng mà đƣờng biờn đi qua. Cỏc đoạn biờn trờn vựng võn tốt là đoạn đƣờng cong đủ dài (trờn một ngƣỡng xỏc định, 3 bƣớc võn chẳng hạn) hoặc nhiều đoạn kế tiếp nhau đổi hƣớng đều và chậm hoặc chuyển hƣớng đột ngột tại vị trớ cú ĐTCT. Ngƣợc lại, trờn cỏc vựng võn xấu, cỏc đoạn biờn chạy ngoằn ngoốo, chuyển hƣớng nhanh.

- Bằng kỹ thuật tớnh vựng đệm cho cỏc đoạn biờn tốt theo một bỏn kớnh chừng 1 bƣớc võn ta cú thể lần lƣợt phõn loại và gỏn nhón cho từng pixel hay cho từng khối (block) trờn ảnh võn tay thuộc vựng võn tốt hay khụng. Phƣơng phỏp này cũn giỳp cập nhật đƣợc hƣớng võn cho ma trận hƣớng. Nhƣ vậy, cựng lỳc thuật toỏn vừa cho ra tập cỏc ĐTCT ban đầu, vừa cho ra miền chất lƣợng và miền hƣớng võn. Đõy là những đầu ra rất hữu ớch cho cỏc bƣớc đỏnh giỏ ĐTCT và đối sỏnh về sau (xem Hỡnh 2.7).

Nhƣ đó núi ở trờn, kết quả xử lý do cụng đoạn thứ nhất xuất ra cỏc ảnh võn tay đƣợc cắt ra theo từng ngún dƣới dạng "vựng quan tõm". Vấn đề tiếp theo cần giải quyết là đề xuất thuật toỏn phõn đoạn mịn từng ảnh võn đầu ngún tay đƣợc cắt búc tỏch ra khỏi mẫu chỉ bản 10 ngún để xỏc định vựng chất lƣợng cao, cựng cỏc thụng tin liờn quan nhƣ đƣờng biờn của từng võn, ma trận hƣớng. í tƣởng chủ đạo

55

của thuật toỏn phõn đoạn mịn là phõn tớch, tỡm cỏc thuộc tớnh cú giỏ trị để nhận biết, đỏnh giỏ chất lƣợng cỏc vựng võn chất lƣợng cao để từ đú đƣa ra kết quả dƣới dạng một bản đồ chất lƣợng với giỏ trị 1 tại cỏc khối (block) wxw đạt chất lƣợng cao và giỏ trị 0 tại cỏc khối (block) wxw nền và nhiễu.

(a) Võn tay gốc (b) Võn tay sau khi phõn đoạn

Hỡnh 2.7: Một ảnh đƣợc phõn đoạn lý tƣởng, vựng võn chất lƣợng cao đƣợc tỏch chớnh xỏc.

Trƣớc hết ta cần làm rừ thế nào là vựng võn chất lƣợng cao. Một cỏch trực quan, đú là cỏc vựng võn trờn đú cú thể phõn biệt rừ cỏc dũng võn và dũng rónh xen kẽ chạy song song với nhau. Nhận biết khối (block) võn chất lƣợng cao là bài toỏn phõn loại hai lớp, nội dung chủ yếu của bài toỏn phõn đoạn mịn đó đƣợc nhiều tỏc giả quan tõm nghiờn cứu. Gần đõy nhất, Helfroush [37] đó khảo sỏt một loạt cỏc phƣơng phỏp nhƣ phƣơng phỏp nhận biết vựng võn quan tõm dựng hai thuộc tớnh giỏ trị mức xỏm trung bỡnh và phƣơng sai, phƣơng phỏp phõn đoạn theo bao lồi ảnh biờn, phƣơng phỏp dựng ngƣỡng động và phƣơng phỏp thớch nghi, sau đú đề xuất thuật toỏn trờn cơ sở cải biờn phƣơng phỏp kết hợp sử dụng cỏc thuộc tớnh nhƣ độ hợp hƣớng (coherence), giỏ trị mức xỏm trung bỡnh, phƣơng sai và cƣờng độ mức xỏm của Bazen [24] bằng cỏch thay thế thuộc tớnh hợp hƣớng (coherence) bằng một thuộc tớnh khỏc tƣơng tự là hƣớng chủ đạo của đƣờng võn trờn cửa sổ wxw. Cỏch tiếp cận này tuy đó cú cải tiến hơn trƣớc nhƣng vẫn dừng lại ở cỏch tiếp cận raster, chỉ tập trung xử lý từng điểm ảnh (pixel) mà khụng khai thỏc hết đặc trƣng hƣớng của cỏc dũng võn rónh xen nhau.

Một tớnh chất quan trọng của vựng võn chất lƣợng cao là sau khi xử lý vectơ hoỏ đƣờng biờn hoặc khung xƣơng của võn tay và xấp xỉ tuyến tớnh từng đoạn, kết quả thu đƣợc là cỏc đa tuyến gồm cỏc đoạn thẳng thành phần cú độ dài lớn hơn so với bƣớc võn, đổi hƣớng chậm và ổn định. Ngƣợc lại, cỏc vựng võn chất lƣợng thấp,

56

thƣờng cho ra kết quả là những đa tuyến gồm cỏc đoạn thẳng thành phần ngắn, thay đổi hƣớng nhanh. Từ kết quả phõn tớch trờn, ngoài cỏc thuộc tớnh truyền thống nhƣ giỏ trị trung bỡnh mức xỏm M, phƣơng sai mức xỏm V ta đề xuất bổ sung thờm ba chỉ tiờu mới để nhận dạng cỏc khối vựng võn chất lƣợng thấp. Chỉ tiờu mới thứ nhất là mật độ D, chỉ tiờu mới thứ hai là tổng độ cong C và chỉ tiờu thứ ba là năng lƣợng E thể hiện sự thay đổi độ cong của cỏc đỉnh điểm của cỏc đa tuyến trờn cửa sổ wxw. Mật độ D là mật độ cỏc đỉnh của cỏc đoạn ngắn của cỏc đa tuyến đƣờng võn đi qua khối wxw, đƣợc đặc trƣng bằng số lƣợng đỉnh trong khối đú.

Độ cong tại một đỉnh đa tuyến đƣợc đo bằng giỏ trị gúc đổi hƣớng của đa tuyến tại đỉnh đú. Độ cong C của khối bằng tổng độ cong của cỏc đỉnh trong khối đú.

Năng lƣợng tại một đỉnh đa tuyến đƣợc đo bằng giỏ trị chờnh lệch độ cong của đa tuyến tại đỉnh đú so với đỉnh ngay trƣớc nú. Năng lƣợng E của khối bằng tổng năng lƣợng của cỏc đỉnh trong khối đú.

Giả sử ta cú đa tuyến {P}1N = {(x1,y1,α1), (x2,y2,α2), ... (xn,yn,αN)}, khi đú độ cong tại đỉnh Pi vàđộcong của khối wxw đƣợc định nghĩa nhƣ sau:

C(Pi) = (αi - αi-1), i=2..N. (2.2)

Cwxw = ∑wxw C(Pi). (2.3)

Và năng lƣợng tại đỉnh Pi vànăng lƣợng của khối wxw đƣợc định nghĩa nhƣ sau: E(Pi) = C(Pi) - C(Pi-1) , i=2..N. (2.4)

Ewxw = ∑wxw E(Pi). (2.5)

Nhƣ vậy, mỗi khối wxw đƣợc biểu diễn bằng một vectơ gồm 5 thành phần nhƣ sau:

Xwxw = (M, V, D, C, E) (2.6)

Để phõn loại từng cửa sổ wxw thuộc lớp ω1 “vựng chất lƣợng cao” hay lớp ω2 “vựng chất lƣợng thấp và nền”, ta dựng Bộ phõn loại Bayes, dựng qui tắc quyết định tối ƣu với hàm phõn biệt sau: g(ωi) = P(ωi).P(X/ωi), i=1,2. (2.7)

Qui tắc phõn lớp cụ thể nhƣ sau:

57

Ở đõy, P(ω2) = 1- P(ω1); P(ω1) là tần suất xuất hiện cửa sổ võn tay chất lƣợng cao và P(ω2) là tần suất xuất hiện cửa sổ võn tay chất lƣợng thấp.

Cụng thức ƣớc lƣợng cỏc phõn bố xỏc suất này nhƣ sau:

P(ω1)=(Tổng cỏc wxw võn tay chất lƣợng cao)/(tổng cỏc wxw toàn võn tay) (2.9)

P(X/ωi) = (Tần suất xuất hiện vectơ thuộc tớnh X trờn lớp ωi, i = 1,2) đƣợc xỏc định qua giai đoạn ƣớc lƣợng thống kờ hay học trờn CSDL cỏc khối võn chất lƣợng khỏc nhau trớch chọn từ CSDL mẫu chỉ bản thử nghiệm. Cụng thức ƣớc lƣợng nhƣ sau:

P(X/ωi) = (Tổng cỏc wxw cú Xwxw = X) / tổng số wxw thuộc ωi, i = 1,2. (2.10) Từ đú ta cú thuật toỏn phõn đoạn mịn đƣợc đề xuất nhƣ sau:

Bước 1: Tiếp nhận ảnh võn tay đầu vào, là kết quả xuất ra từphõn đoạn thụ:

Tiếp nhận ảnh đầu vào là ảnh võn đầu ngún tay cựng cỏc thụng tin phụ trợ liờn quan nhƣ đƣờng bao, vựng trung tõm, chiều hƣớng (trờn/dƣới).

Bước 2: Chuẩn húa, làm trơn và chuyển đổi nhị phõn:

Dựng ngƣỡng địa phƣơng và chuyển đổiảnh về dạng nhị phõn.

Bước 3: Dũ biờn, vectơ hoỏ ảnh nhị phõn và xấp xỉ tuyến tớnh từng đoạn:

Xử lý dũ biờn đƣờng võn, xấp xỉ tuyến tớnh từng đoạn bằng thuật toỏn đó đề xuất ở [2,4-6]. Kết hợp tớnh độ cong, năng lƣợng trờn từng đỉnh đa tuyến, và tớnh cỏc thuộc tớnh D, C, E.

Bước 4: Phõn loạicỏc khối pixel wxw.

4.1. Dựng cửa sổ kớch thƣớc phự hợp wxw = 32x32 điểm ảnh để duyệt ảnh gốc và tớnh cỏc giỏ trị M, V để xõy dựng vectơ biểu diễn: Xwxw = ( M, V, D, C, E).

4.2. Dựng qui tắc quyết định tối ƣu Bayes để xếp Xwxw vào lớp tƣơng ứng. 4.3. Kết quả cho ra mặt nạ chất lƣợng, là dạng ảnh nhị phõn cú giỏ trị 1 tại khối

vựng võn chất lƣợng cao, giỏ trị 0 tại nền và vựng võn chất lƣợng thấp. Kết quả phõn đoạn mịn cho thấy nếu mật độ đoạn võn ngắn, phƣơng sai hƣớng cao, độ cong thay đổi đột ngột thỡ đõy là vựng võn chất lƣợng thấp (xem Hỡnh 2.8).

58 (a) Ảnh chỉ bản sau khi làm trơn

chuyển đổi về dạng nhị phõn

(b) Chỉ bản sau khi vectơ hoỏ chuyển về dạng đa tuyến.

Hỡnh 2.8: Mật độ đoạn võn ngắn, phƣơng sai hƣớng cao, độ cong thay đổi đột ngột là những đặc trƣng cú giỏ trị để nhận biết vựng võn chất lƣợng thấp

2.3. Kết quả thực nghiệm

Kịch bản:

 Chọn cỏc mẫu chỉ bản tiờu biểu từ tàng thƣ căn cƣớc can phạm và tàng thƣ căn cƣớc cụng dõn để lập thành CSDL C@FRIS DB gồm 1000 mẫu chỉ bản phục vụ thử nghiệm thuật toỏn phõn đoạn thụ.

 Chọn CSDL 500 kết quả phõn đoạn thụ từ CSDL C@FRIS DB để thử nghiệm thuật toỏn phõn đoạn mịn. Chọn CSDL FVC2004 DB2 bao gồm 500 ảnh võn tay để thử nghiệm thuật toỏn phõn đoạn mịn.

 So sỏnh kết quả phõn đoạn của thuật toỏn đề xuất với cỏc thuật toỏn truyền thống chỉ dựng cỏc thuộc tớnh M, V và Coherence, và với kết quả phõn đoạn của phần mềm thƣơng mại Verifinger của hóng Neurotechnology [87].

Kết quả thử nghiệm thuật toỏn phõn đoạn thụ:

 Số lƣợng chỉ bản phõn đoạn tốt, khụng cần sự can thiệp của con ngƣời: 973/1000.  Số chỉ bản đỳng qui cỏch nhƣng thuật toỏn trả lại khụng phõn đoạn đƣợc: 0/1000.  Số chỉ bản sai qui cỏch phải trả lại: 27/1000, trong đú 22 chỉ bản dựng

giấynền quỏ tối, 5 chỉ bản cú cỏc võn tay lăn chồng lờn nhau, chồng lờn khung.

Kết quả thử nghiệm thuật toỏn phõn đoạn mịn:

Thuật toỏn phõn đoạn mịn đƣợc đỏnh giỏ trờn 500 chỉ bản CSDL FVC2004 DB2 và 500 chỉ bản từ CSDL C@FRIS DB đƣợc cắt ra từ giai đoạn phõn đoạn thụ.

59

Để huấn luyện thuật toỏn phõn đoạn, từng võn tay trờn CSDL thử nghiệm đƣợc phõn chia thành cỏc khối điểm ảnh kớch thƣớc 32x32 để tớnh bộ 5 cỏc dấu hiệu đặc trƣng. Để đơn giản cho việc ƣớc lƣợng phõn bố xỏc suất, từng dấu hiệu đƣợc phõn khoảng giỏ trị nhƣ sau: Dấu hiệu M, V:100 khoảng; D: [0, 20]; Dấu hiệu C, E: [-60 khoảng, +60 khoảng], mỗi khoảng 3 độ.

(a) Ảnh gốc chất lƣợng thấp (b) Kết quả phõn đoạn theo M, V, Coherence (c) Kết quả phõn đoạn của thuật toỏn đề xuất dựng (M, V, D, C, E)

(d) Kết quả phõn đoạn của thuật toỏn

Verifinger

Hỡnh 2.9: Kết quả phõn đoạn một số ảnh chỉ bản chất lƣợng thấp, chọn từ CSDL FVC2004

Hỡnh 2.9 minh họa một số kết quả xử lý phõn đoạn mịn tiờu biểu cỏc mẫu

Một phần của tài liệu luận văn một số giải pháp nâng cao hiệu quả hệ thống nhận dạng vân tay (Trang 51)

Tải bản đầy đủ (PDF)

(127 trang)