Bài toỏn phõn đoạn ảnh võn tay tự động

Một phần của tài liệu luận văn một số giải pháp nâng cao hiệu quả hệ thống nhận dạng vân tay (Trang 44)

2.1.1. Khỏi niệm phõn đoạn ảnh

Phõn đoạn ảnh tổng quỏt:

Phõn đoạn ảnh (image segmentation) là một quỏ trỡnh thực hiện việc tỏch từ vựng ảnh thành một hay một số vựng cỏc điểm ảnh cựng thỏa món một số tớnh chất chung nào đấy nhƣ theo màu sắc, mức xỏm, kết cấu bề mặt, chiều hƣớng, .... Mỗi vựng thƣờng đƣợc biểu diễn bằng một tập cỏc điểm ảnh liờn thụng cựng thỏa món một tiờu chớ nhận biết. Tiờu chớ này phụ thuộc vào mục tiờu cụ thể của từng loại ứng dụng. Sau khi phõn đoạn mỗi điểm ảnh chỉ thuộc về một trong hai lớp: vựng quan tõm và vựng khụng quan tõm.

Một cỏch tổng quỏt, cú thể coi phõn đoạn là bài toỏn nhận dạng cỏc điểm (pixel) ảnh để phõn thành hai lớp: lớp quan tõm và lớp khụng quan tõm, trong đú cỏc tập mẫu học cú thể cho trƣớc (học cú thầy) hoặckhụng cho trƣớc (học khụng cú thầy hay họctự động).

45

Phõn đoạn ảnh võn tay:

Phõn đoạn ảnh là quyết định phần ảnh nào thuộc vựng cần quan tõm, vựng ảnh nào là vựng nền bao quanh và vựng nào là biờn hay nhiễu của ảnh. Việc xỏc định vựng võn chớnh xỏc khụng chỉ đơn thuần là thu nhỏ kớch thƣớc ảnh, giảm thiểu bộ nhớ mà cũn gúp phần vào việc đỏnh giỏ cỏc điểm ĐTCT trớch chọn đƣợc trờn ảnh. Hầu hết cỏc thuật toỏn trớch chọn cỏc điểm ĐTCT đều trớch chọn sai khi gặp vựng nhiễu và vựng biờn của ảnh. Bởi vậy, cỏc thuật toỏn phõn đoạn hoạt động tốt sẽ gúp phần loại bỏ đƣợc cỏc sai sút đú. Nhờ loại đƣợc cỏc ĐTCT trớch chọn sai, hiệu quả đối sỏnh sẽ đƣợc nõng lờn.

Phõn đoạn ảnh chỉ bản võn tay 10 ngún mà chƣơng này đề cập là một trƣờng hợp ứng dụng cụ thể phức tạp hơn của kỹ thuật phõn đoạn ảnh núi chung. Nhiệm vụ của nú là phỏt hiện và cắt ảnh cỏc đầu ngún tay ra khỏi vựng nền trờn cỏc ụ của chỉ bản 10 ngún (Hỡnh 2.1) gồm 10 ảnh võn tay lăn và 10 ảnh võn tay ấn. Sau đú tiến hành phõn đoạn ảnh võn tay từng ngún để xỏc định vựng võn quan tõm. Cụng việc này là rất cần thiết, một mặt nhằm thay thế thao tỏc thủ cụng trong khi quột ảnh, cắt ảnh để nõng cao cụng suất nhập liệu, mặt khỏc nhằm thu hẹp vựng xử lý trờn ảnh võn tay. Nhờ đú, vừa cú thể giảm thiểu đƣợc thời gian nộn, thời gian truyền ảnh cũng nhƣ dung lƣợng lƣu trữ trong cơ sở dữ liệu, vừa cú cơ sở để đỏnh giỏ và tuyển chọn cỏc ĐTCT trớch chọn trờn vựng ảnh quan tõm. Việc phõn đoạn ảnh tốt gúp phần nõng cao độ chớnh xỏc, tăng hiệu quả của thuật toỏn trớch chọn ĐTCT và đối sỏnh. Hơn nữa, kỹ thuật phõn đoạn khi đƣợc ỏp dụng để phõn vựng chỉ bản giấy cú thể dựng để phõn đoạn cỏc ảnh thu nhận võn tay sống theo phƣơng phỏp ấn đồng thời hai bộ 4 ngún tay trỏi và tay phải và một bộ 2 ngún cỏi, gúp phần nõng cao kỹ thuật tự động húa, tăng năng suất nhập liệuvà cuối cựng là đem lại hiệu quả chung cho toàn hệ thống.

2.1.2. Bài toỏn phõn đoạn tự động ảnh võn tay từ mẫu chỉ bản võn tay 10 ngún

Bài toỏn phõn đoạn tự động ảnh võn tay đƣợc phỏt biểu nhƣ sau: Cho một chỉ bản võn tay 10 ngún nhƣ trong Hỡnh 2.1. Cần xõy dựng thuật toỏn tự động định vị

46

và tỏch từ chỉ bản võn tay 10 ngún thành 20 vựng quan tõm riờng rẽ nhƣ sau: 10 vựng ảnh cho 10 võn tay lăn, 10 vựng cho 10 võn tay ấn.

Trờn thực tế cỏc chỉ bản đƣợc in ra chỉ dựa theo chuẩn nhƣng khụng tuõn thủ chớnh xỏc nờn xuất hiện với nhiều mẫu thiết kế sai khỏc nhau, kớch thƣớc sai khỏc nhau và chất lƣợng giấy cũng khỏc nhau. Cú nhiều loại giấy cũ, thậm chớ cú những chỉ bản dựng giấy nền màu tớm, màu xanh (xem Hỡnh 2.2), trờn đú cũn nhiều vết nhiễu nhƣ: cỏc số hiệu phõn loại, vết mực bẩn, cỏc vết linh tinh khỏc,...

Khụng những đối với chỉ bản giấy truyền thống, mà ngay cả với chỉ bản thu nhận bằng thiết bị võn tay sống, bài toỏn phõn đoạn cũng đang là một vấn đề thời sự đang đƣợc thế giới quan tõm (xem [38,67,77,79,81]). Nội dung của những bài toỏn phõn đoạn này nhằm tỏch phần 2 ngún cỏi và phần 4 ngún lăn đồng thời thành từng ngún riờng rẽ khi lập chỉ bản võn tay sống tại cỏc trạm đăng ký, kiểm tra thị thực nhập cảnh. Holdvà cỏc cộng sự [38] đó đề xuất giải phỏp cho bài toỏn phõn đoạn này nhằm tỏch phần 4 ngún võn tay ấn đồng thời thành từng ngún riờng rẽ để cài đặt phần mềm lập võn tay sống trang bị cho cỏc trạm đăng ký, kiểm tra thị thực nhập cảnh. Tuy nhiờn, so với bài toỏn phõn đoạn chỉ bản võn tay sống, bài toỏn phõn đoạn trờn chỉ bản giấy phức tạp hơn do sự đa dạng của cỏc loại mẫu mà chỉ bản giấy đƣa vào sử dụng, đặc biệt là cỏc loại mẫu chỉ bản giấy phi chuẩn, lệch chuẩn (Mẫu A7 và tựa A7) của thực tế nƣớc ta.

47

Cỏc tài liệu cụng bố liờn quan đến bài toỏn cắt thụ ảnh chỉ bản 10 ngún thành 20 ngún riờng rẽ hiện nay rất ớt. Trờn Internet cú thể tỡm đƣợc một số bằng sỏng chế của Mỹ đề cập đến chủ đề này (chẳng hạn:[35,54]), nhƣng những sỏng chế này chỉ trỡnh bày nguyờn lý hoạt động của thiết bị, khụng tỡm thấy tài liệu nào đƣa ra phƣơng phỏp và thuật toỏn xử lý cắt ảnh từ mẫu chỉ bản 10 ngún. Thực tế, hiện nay hầu hết cỏc hệ thống nhận dạng võn tay tự động trờn thế giới, trong đú cú một số hệ đó đƣợc thƣơng mại húa và nhập vào sử dụng ở nƣớc ta nhƣ hệ MORPHO AFIS, hệ AFIX TRACKER, NEC AFIS hay COGENT AFIS chủ yếu vẫn đang dựng phƣơng phỏp tƣơng tỏc trực tiếp trờn màn hỡnh để cắt ảnh chỉ bản võn tay thành cỏc ảnh riờng rẽ. Hệ MORPHO AFIS yờu cầu ngƣời sử dụng phải dựng chuột để định vị cỏc tõm võn tay cũn hệ AFIX TRACKER thỡ hiển thị mặc định 10 khung hỡnh cho 10 ngún để ngƣời sử dụng tiếp tục chỉnh sửa tƣơng tỏc thủ cụng. Do phải cắt ảnh chậm, tốc độ nhập liệu của cỏc hệ này cũn rất thấp (chỉ đạt cụng suất dƣới mức 200 chỉ bản/ngày/trạm).

Phõn đoạn võn tay là chủ đề cú tớnh thời sự núng hổi. Viện Tiờu chuẩn và Cụng nghệ Mỹ đó đƣa ra đặc tả kỹ thuật để kờu gọi cỏc nhà khoa học tham gia nghiờn cứu và thi đỏnh giỏ cỏc thuật toỏn phõn đoạn cỏc ngún võn tay chụm (4 ngún ấn đồng thời) [38]. Giải quyết đƣợc bài toỏn phõn đoạn 4 ngún chụm đồng nghĩa với việc rỳt ngắn đƣợc thời gian đăng ký võn tay vào hệ thống cũng nhƣ thời gian nhập liệu xỏc minh danh tớnh. Hiện nay hệ AFIS quản lý xuất nhập cảnh của Mỹ US-VISIT đang dựng phƣơng phỏp này để thu nhận võn tay những ngƣời xin nhập cảnh vào Mỹ với 3 lần nhập: Ấn đồng thời 4 ngún chụm tay phải, 4 ngún chụm tay trỏi và hai ngún cỏi với thời gian chỉ dƣới 1 phỳt/ngƣời, trong khi nếu dựng phƣơng phỏp lăn truyền thống phải mất ớt nhất 5 phỳt /ngƣời.

So với bài toỏn phõn đoạn chỉ bản 4 ngún chụm võn tay sống, bài toỏn phõn đoạn chỉ bản võn tay trờn giấy phức tạp hơn. Do đú, nếu giải quyết đƣợc vấn đề phõn đoạn tự động ảnh võn tay trờn giấy thỡ cũng sẽ giải quyết đƣợc vấn đề phõn đoạn cỏc ngún chụm võn tay sống.

48

Hỡnh 2.2: Mẫu chỉ bản võn tay 10 ngún bị nhiễu

Hiện thời, đa số phần mềm quột nhập chỉ bản thƣờng hoạt động theo cỏc bƣớc sau: - Dựng Scanner quột chỉ bản võn tay 10 ngún, kết quả thu đƣợc là một ảnh số 256 mức xỏm, độ phõn giải chuẩn 500 dpi (Hỡnh 2.1).

- Từ ảnh chỉ bản võn tay đú, nhõn viờn mó húa thƣờng phải xử lý định vị thủ cụng khung hỡnh chung để cắt tỏch ảnh 10 dấu võn tay lăn trờn chỉ bản võn tay.

Ảnh của phần mƣời ngún lăn trờn chỉ bản thƣờng đƣợc xử lý tỏch thủ cụng tƣơng tỏc một cỏch ƣớc lệ cả khung hỡnh phần 10 ngún lăn thành 10 ảnh từng ngún riờng biệt để lƣu trữ vào cơ sở dữ liệu. Nhƣng việc tỏch này vẫn đƣợc thực hiện bằng cỏch chia đều vựng 10 ngún trờn thành 2 hàng, mỗi hàng 5 ụ. Kết quả là cỏc võn tay lăn trờn chỉ bản đƣợc thể hiện sau khi cắt nhƣ Hỡnh 2.3.

49

Hầu hết cỏc hệ thống nhận dạng võn tay tự động trờn thế giới đều phõn tỏch ảnh chỉ bản võn tay theo cỏch thức trờn hoặc đặt sẵn 10 khung hỡnh cho 10 ngún để chỉnh thủ cụng (vớ dụ: hệ AFIX TRACKER, SAGEM MORPHO). Nhƣ ta thấy, cỏch cắt ảnh này vẫn cũn nhiều hạn chế, nú để lại nhiều vựng nền ảnh dƣ thừa, trờn đú thƣờng cú nhiều vết nhiễu tạp khụng mong muốn nhƣ: chữ, số in sẵn, viết thờm, vết bẩn, ... Nếu đƣa ra đƣợc cỏch cắt ảnh hợp lý hơn, chỉ bao gồm vựng võn quan tõmthỡkhụng chỉ gúp phần tiết kiệm đƣợc bộ nhớmà cũn trực tiếp nõng cao chất lƣợng bộ điểm ĐTCT trớch chọn đƣợc nhờ loại bỏ đƣợc nhiễu trờn vựng nền (xem Hỡnh 2.4).

(a) Ảnh võn tay chƣa phõn đoạn cú nhiều ĐTCT "rỏc" trờn nền ảnh

(b) Ảnh võn tay sau phõn đoạn với bộ ĐTCT mong muốn

Hỡnh 2.4: Minh họa bộ đặc điểm chi tiết của 2 võn tay trƣớc và sau phõn đoạn

(a) (b)

Hỡnh 2.5: (a) Ảnh võn tay ban đầu, (b) Ảnh võn tay sau phõn đoạn thụ

Do vậy, cần phải cải tiến cụng đoạn cắt ảnh theo hƣớng ứng dụng cỏc phƣơng phỏp phõn đoạn để tự động phõn vựng và tỏch cỏc ngún trờn chỉ bản 10 ngún sao cho với mỗi ảnh của một ngún tay riờng rẽ thỡ vựng ảnh quan tõm đƣợc tỏch khỏi vựng nền (xem Hỡnh 2.5).

50

2.1.3. Một số thuật toỏn phõn đoạn liờn quan

Do sự đa dạng của cỏc loại phƣơng tiện thu nhận võn tay cũng nhƣ cỏc loại hỡnh ứng dụng, chủ đề phõn đoạn vẫn đang thu hỳt sự quan tõm của nhiều nhúm nghiờn cứu [21,24,49,84]. Với mức độ cao hơn, phõn đoạn võn tay hiện nay khụng dừng lại ở việc chỉ tỡm vựng võn quan tõm mà tiến tới xỏc định vựng chất lƣợng cao hay bản đồ chất lƣợng cũng đang là một chủ đề đƣợc tập trung nghiờn cứu [27,28,53,72,78]. Trờn cơ sở vựng chất lƣợng võn tay đƣợc xỏc định, ngƣời ta cú thể tiến hành đỏnh giỏ độ tin cậy của cỏc điểm ĐTCT dựa trờn thực tế là cỏc điểm ĐTCT trớch chọn đƣợc trờn vựng võn rừ nột thƣờng cú độ tin cậy cao hơn so với trờn vựng võn tay nhiễu và trờn vựng nền. Việc lập bản đồ chất lƣợng cho mỗi võn tay cũn là thụng tin quan trọng giỳp cho quỏ trỡnh đối sỏnh hiệu quả hơn nhờ chỉ tập trung vào cỏc ĐTCT cú độ tin cậy cao trờn miền giao chung của hai võn tay.

Hiện nay đó cú rất nhiều bài bỏo quan tõm đến vấn đề phõn đoạn ảnh và cú nhiều thuật toỏn đƣợc đề xuất (xem [21,39,70,74,80]). Chẳng hạn, thuật toỏn phõn đoạn ảnh của Yang [80] dựa trờn năng lƣợng của cỏc ảnh sau khi lọc Gabor, thuật toỏn phõn đoạn của Tabassi [70] dựa trờn sự biến đổi của trƣờng hƣớng trong cỏc ụ vuụng, thuật toỏn phõn đoạn ảnh của Hong [39] dựa trờn độ chắc chắn của trƣờng hƣớng, Wang [74], dựa trờn moment Gaussian-Hermite… Trong cỏc thuật toỏn đó cú, mỗi thuật toỏnđều cú ƣu điểm riờng nhƣng nhƣợc điểm chung của chỳng là sử dụng cỏch tiếp cận raster, phải xử lý cả mảng pixel để trớch chọn đặc trƣng, nờn thời gian xử lý chậm.

Với tầm quan trọng núi trờn, cú nhiều cụng trỡnh nghiờn cứu với nhiều thuật toỏn phõn đoạn để tỏch vựng võn chất lƣợng cao đƣợc đề xuất (xem [53,72,78]). Cỏc thuật toỏn phõn đoạn nhỡn chung đều tập trung giải quyết bài toỏn nhận dạng hai lớp (lớp nền và lớp vựng võn quan tõm) theo hƣớng khai thỏc cỏc thuộc tớnh ở mức pixel nhƣ tớnh giỏ trị trung bỡnh, phƣơng sai mức xỏm và độ hợp hƣớng (coherence), sau đú dựng cỏc bộ phõn loại tuyến tớnh hai lớp để tỏch vựng [27]. Tuy nhiờn, cỏc đỏnh giỏ đƣa ra đều chủ yếu dựng cỏc kết quả phõn tớch cỏc điểm ảnh và vựng cửa sổ lõn cận dựa theo hƣớng tiếp cận raster. Nhƣợc điểm của hƣớng tiếp cận này là độ phức tạp tớnh toỏn lớn do phải truy cập và phõn tớch tất cả cỏc điểm ảnh trong từng cửa sổ ảnh (block), nhạy cảm với sự đa dạng của

51

nhiễu cục bộ và phần lớn mới chỉ tiến hành trờn cỏc mẫu võn tay đơn lẻ, thu nhận từ thiết bị thu nhận võn tay sống cú phần nền cú nhiều điểm khỏc với phần nền trờn chỉ bản giấy nờn khi đƣa vào cài đặt để phõn đoạn chỉ bản giấy của nƣớc ta thỡ xuất hiện nhiều lỗi, đặc biệt là đối với cỏc chỉ bản cú nền giấy chất lƣợng xấu (màu xanh, màu tớm, màu ghi sẫm).

2.2. Thuật toỏnmới xử lý phõn đoạn võn tay từ mẫu ảnh chỉ bản 10 ngún 2.2.1. Thuật toỏn phõn đoạn thụ 2.2.1. Thuật toỏn phõn đoạn thụ

í tƣởng chủ đạo của thuật toỏn này dựa trờn việc dựng kỹ thuật tiền xử lý phổ dụng nhƣ chuẩn húa, làm trơn ảnh và chuyển đổi ảnh chỉ bản về dạng nhị phõn sao cho cỏc điểm thuộc vựng võn quan tõm cú giỏ trị bằng 1 cũn cỏc điểm nền cũn lại cú giỏ trị bằng 0. Sau đú tiến hành dũ biờn để tỏch cỏc vựng võn tay ra khỏi phần nền chỉ bản.

Để thực thi ý tƣởng trờn, luận ỏn đề xuất thuật toỏn làm trơn và dũ biờn theo cỏc bƣớc sau:

Bước 1: Xử lý chuẩn hoỏ và làmtrơn ảnhđầu vào (ảnh chỉ bản mƣời ngún).

1.1. Xử lý chuẩn hoỏ mức xỏm ảnh: Do ảnh võn tay thu nhận ban đầu với nhiều loại scanner khỏc nhau với mức độ chiếu sỏng khỏc nhau nờn thƣờng cú mức xỏm phõn bố khụng thuần nhất, cú một số vựng trờn chỉ bản lăn mực quỏ đậm, quỏ đen, cú số khỏc lại quỏ nhạt, quỏ sỏng nờn cần phải dựng kỹ thuật chuẩn húa ảnh địa phƣơng [39], tức là thay đổi mức xỏm ban đầu I(x,y) trong từng cửa sổ ảnh bằng mức xỏm mới N(x,y) nhƣ sau:

            M y x I cho M M y x I cho M y x N ) , ( , V M) - y ) (I(x, * V ) , ( , V M) - y ) (I(x, * V ) , ( 2 0 0 2 0 0 (2.1)

Trong đú, I(x,y) là mức xỏm ban đầu tại điểm (x,y); M=(1/w2) ∑w (I), V=(1/w2) ∑w (I-M)2 lần lƣợt là mức xỏm trung bỡnh và phƣơng sai mức xỏm ƣớc lƣợng trờn cửa sổ kớch thƣớc wxw (phần thực nghiệm chọn w=32) ; M0, V0 lần lƣợt là mức xỏm trung bỡnh và phƣơng sai mức xỏm cần chuẩn hoỏ; N(x,y) là mức xỏm mới sau chuẩn hoỏ.(M0, V0 cú thể chọn tựy ý, nhƣng phần thực nghiệm chọn M0=V0=100). (Cần lƣu ý rằng: Nếu 1 cửa sổ võn tay bất kỳ cú M=M0, V=V0, tức là đó đạt giỏ trị chuẩn, thỡ N(x,y)=I(x,y)).

52

(a) (b) (c)

Hỡnh 2.6: Mẫu chỉ bản 10 ngún đƣợc phõn đoạn thụ bằng kỹ thuật chuẩn húa, làm trơn, chuyển đổi nhị phõn và dũ biờn, định vị hỡnh chữ nhật ngoại tiếp để cắt ảnh.

1.2. Dựng cửa sổ wxw điểm ảnh quột lần lƣợt từ trỏi qua phải từ trờn xuống dƣới để thay thế giỏ trị mức xỏm ảnh hiện tại bằng giỏ trị trung bỡnh của cỏc điểm ảnh trờn cửa sổ. Chuyển đổi ảnh về dạng nhị phõn, dựng ngƣỡng là giỏ trị mức xỏm trung bỡnh địa phƣơng, tớnh trờn cửa sổ wxw. Kết quả xử lý này đƣợc minh họa trờn Hỡnh 2.6(b).

1.3. Tiến hành dũ biờn bằng thuật toỏn dũ biờn 8-liờn thụng và xử lý xấp xỉ tuyến tớnh từng đoạn để biểu diễn cỏc đƣờng biờn thành những đa tuyến biờn khộp kớn dựng giải thuật [2,5]. Để tăng hiệu quả thuật toỏn dũ biờn phỏt hiện vựng võn, cần chọn bƣớc lƣới phự hợp để lọc lấy cỏc vựng võn, loại bớt cỏc vựng nhiễu nhỏ. Phần thực nghiệm ta sẽ giả định vựng võn bộ nhất cú kớch thƣớc 8x8mm và vựng võn lớn nhất cú kớch thƣớc 20x20mm nờn bƣớc lƣới thớch hợp đƣợc chọn là 8mm.

Bước 2: Xử lý kết quả dũ biờn, xỏc định vựng võn và đa giỏc ngoại tiếp vựng võn cần cắt.

2.1. Tớnh bao lồi của tập đỉnh đa tuyến biờn vựng đƣợc chọn bằng thuật toỏn Graham [34]. Sau đú tớnh khung hỡnh chữ nhật ngoại tiếp bao lồi (Xmin, Ymin, Xmax,Ymax) để xỏc định cửa sổ cắt ảnh.

2.2. Kiểm tra cửa sổ ảnh với cỏc điều kiện ràng buộc: diện tớch tối thiểu (>=1/3

Một phần của tài liệu luận văn một số giải pháp nâng cao hiệu quả hệ thống nhận dạng vân tay (Trang 44)

Tải bản đầy đủ (PDF)

(127 trang)