3.2. Phƣơng phỏp nắn chỉnh từng phần
3.2.3. Mụ tả thuật toỏn P-TPS
Với hai ảnh võn tay Iq, It, cỏc tập ĐTCT lần lƣợt là Mq, Mt, biến đổi affine ban đầu cho phộp tỡm đƣợc cỏc cặp điểm tƣơng ứng M1 và cặp cỏc điểm võn rónh liờn thuộc M1* đó đƣợc xỏc định, phƣơng phỏp đối sỏnh TPS từng phần ỏp dụng
thuật toỏn P-TPS đƣợc mụ tả trong Hỡnh 3.5.
Trong thuật toỏn này, dựa vào cỏc cặp điểm tƣơng ứng ban đầu, một tập cỏc cặp điểm ĐTCT phụ tƣơng ứng đƣợc tạo sinh từ cặp võn rónh liờn thuộc của chỳng để tăng cƣờng và sàng lọc, chọn ra tập điểm khống chế cho từng miền để nắn chỉnh TPS từng phần. Trờn cơ sở kết quả nắn chỉnh địa phƣơng, thuật toỏn phỏt hiện thờm cỏc cặp điểm ĐTCT tƣơng ứng mới trờn từng miền và sau đú tớnh lại điểm độ giống tổng thể giữa hai ảnh. Việc tớnh điểm độ giống ở cụng thức (3.3) xột nq, nt là số lƣợng cỏc ĐTCT thuộc vựng giao của hai võn tay đƣợc ƣớc lƣợng tại mỗi bƣớc từ bao lồi của tập điểm khống chế mở rộng. Thủ tục này đƣợc lặp cho đến khi đủ điều kiện quyết định hoặc tập cặp điểm tƣơng ứng khụng mở rộng đƣợc nữa.
Dữ liệu vào: Tập ĐTCT Mt, Mq; Số ĐTCT nt, nq; Tập cỏc cặp ĐTCT tƣơng ứng ban
đầu M1 với n cặp [7-11,87], tập n* cỏc cặp ĐTCT mở rộng tƣơng ứng M1* (trớch chọn từ cỏc cặp võn rónh liờn thuộc). Ngƣỡng nắn chỉnh smin , smax; Bƣớc lƣới: step;
Dữ liệu ra: Số điểm tƣơng ứng sau nắn chỉnh n’ và độ giống tổng thể của hai võn tay s.
1. Sàng lọc tập cỏc cặp điểm ĐTCT tƣơng ứng theo cặp võn rónh liờn thuộc:
(n là số cặp ĐTCT ban đầu, n' <= n là kết quả sàng lọc theo cặp võn rónh liờn thuộc). 2. Tớnh độ giống s = n'2/(nt*nq). Nếu s [smin , smax], chuyển sang 6;
3. Tăng dày tập cỏc cặp điểm tƣơng ứng bằng cỏch bổ sung thờm cỏc điểm lƣợng hoỏ trờn cặp võn-rónh liờn thuộc:
vào tập M1 , kết quả là tập M1*.
(n*>=n' là số lƣợng cỏc cặp ĐTCT mở rộng tƣơng ứng). 3.2. Dựng thuật toỏn [34] tớnh bao lồi của M1*.
4. Chọn lọc tập ĐTCT tƣơng ứng n* mở rộng:
4.1. Xõy dựng lƣới sàng tuyển vuụng với bƣớc lƣới step và chia lƣới từ gốc toạ độ đƣợc chọn là điểm giữa đƣờng kớnh lớn nhất nối hai đỉnh của bao lồi.
4.2. Chọn tập m điểm đại diện trờn m ụ lƣới// nếu khụng tƣơng thớch thỡ loại.
4.3. Phõn hoạch 9 vựng, gồm 1 vựng trung tõm với tõm là gốc toạ độ, giới hạn bởi bao lồi và 8 vựng phần tỏm chia bởi 8 tia quột từ tõm theo gúc 45o nằm ngoài bao lồi.
4.4. Nắn chỉnh từng phần trờn từng phõn hoạch và tớnh số cặp điểm tƣơng ứng n’ mới, M1 mới, độ giống mới: s = n’2/(nt*nq).
5. Nếu (n’ = n) hoặc (s>smax ) chuyển sang 6 nếu khụng: 5.1. n n’;
5.2. Quay lại 2; 6. Kết thỳc.
Hỡnh 3.5: Mụ tả thuật toỏn P-TPS.
Ƣu điểm nổi bật của thuật toỏn P-TPS thể hiện trờn cỏc điểm sau:
- Việc đề xuất dựng cặp võn rónh liờn thuộc để sinh cỏc giả ĐTCT dựng để sàng lọc cú ƣu thế hơn hẳn về độ phức tạp tớnh toỏn và độ phõn biệt so vớiG- TPS phải quay lại ảnh gốc để tớnh cỏc tƣơng quan mức xỏm lõn cận xung quanh ĐTCT và dọc cạnh đến 2 ĐTCT lỏng giềng gần nhất. Việc sàng lọc này giỳp phỏt hiện cỏc cặp tƣơng ứng "nhầm" trong trƣờng hợp giả danh và loại trƣớc khi nắn chỉnh nờn loại đƣợc rất nhiều phộp nắn chỉnh thừa.
- Việc khai thỏc thờm cỏc điểm giả ĐTCT để tăng dày tập điểm khống chế để từ đú chọn ra tập điểm khống chế phõn bố đồng đều hơn nờn cho phộp nắn chỉnh đạt độ chớnh xỏc hơn, hiệu quả hơn. (Về thực chất phƣơng phỏp P-TPS khụng chỉ dựng tập cỏc cặp ĐTCT tƣơng ứng để nắn chỉnh mà cũn mở rộng dựng thờm thụng tin đƣờng võn và đƣờng rónh nờn đạt hiệu quả nắn chỉnh cao hơn so với G-TPS).
- Việc đề xuất giải phỏp phõn hoạch khụng gian dựa trờn miền giao chung của 2 võn tay để tiến hành nắn chỉnh từng phần sử dụng tập điểm khống chế phõn bố đồng đều đem lại hiệu quả cao hơn, nhờ thay vỡ phải hệ phƣơng trỡnh tuyến tớnh nhiều biến ta chỉ giải một số ớt cỏc hệ phƣơng trỡnh ớt biến hơn, đồng thời cũng đạt độ chớnh xỏc nắn chỉnh cao hơn nhờ khử đƣợc sai số lũy tớch.
Kết quả thực nghiệm dƣới đõy sẽ phản ỏnh đƣợc phần nào cỏc nhận xột trờn.
3.3. Kết quả thực nghiệm
Để so sỏnh hiệu quả giữa hai phƣơng phỏp P-TPS và G-TPS, luận ỏn đề xuất kịch bản thử nghiệm cài đặt cả hai thuật toỏn và so sỏnh hiệu quả đối sỏnh. Với từng phộp đối sỏnh, cả hai thuật toỏn P-TPS và G-TPS đều sử dụng chung tập cỏc cặp ĐTCT ban đầu đƣợc xỏc định nhờ thuật toỏn VF(Verifinger 4.2) [87].
Mặc dự kết quả thực nghiệm của luận ỏn tiến hành trờn CSDL chỉ bản C@FRIS DB của Cụng an Hà Nội và hệ C@FRIS [10,11] cho thấy phƣơng phỏp mới tốt hơn so với phƣơng phỏp G-TPS [52], song để khỏch quan, mục này trỡnh bày kết quả thử nghiệm của hai thuật toỏn trờn CSDL FVC2004 (DB1, DB3) [86]. Hai CSDL này cú nhiều võn tay biến dạng rất đỏng kể, mỗi CSDL chứa 800 ảnh võn tay của 100 ngún khỏc nhau, mỗi ngún in 8 lần, DB1 bao gồm cỏc mẫu võn tay đƣợc thu nhận bằng bộ cảm biến quang học ôCrossMatch V300ằ, DB3 đƣợc thu nhận bằng thiết bị cảm ứng nhiệt ơFingerChip FCD4B14CBằ của hóng Amtel.
Trờn từng DB, quỏ trỡnh thực nghiệm đƣợc tiến hành nhƣ thể lệ của cuộc thi FVC2004 [86], đú là: Cho chạy kiểm tra (8*7/2)*100 = 2800 phộp đối sỏnh cỏc cặp võn tay do cựng một ngún in ra và chạy kiểm tra 100*99/2 = 4950 lần lặp để đối
sỏnh cỏc cặp võn tay khỏc ngún in ra để ƣớc lƣợng đƣờng phõn bố điểm số (score): Chớnh danh và giả danh, cỏc đƣờng phõn bố cỏc sai số theo ngƣỡng độ giống St, FAR(St), FRR(St) . Dựa trờn cỏc phõn bố ƣớc lƣợng đƣợc, ta xõy dựng đƣờng ROC (Receive Operating Curve) phản ỏnh mối quan hệ phụ thuộc lẫn nhau của hai loại sai số FAR và FRR. Từ đƣờng cong ROC cú thể dễ dàng đọc đƣợc cỏc tham số cơ bản phản ỏnh khỏch quan nhất độ chớnh xỏc của thuật toỏn, đú là: EER, FAR100,
FAR1000, zeroFAR, zeroFRR. Từ cỏc phõn bố trờn, ngƣỡng Smin là giỏ trị ngƣỡng lớn nhất mà FRR(S) = 0, và Smax là giỏ trị ngƣỡng nhỏ nhất mà FAR(S) =0.
Bảng 3.1: So sỏnh độ chớnh xỏc nắn chỉnh trờn CSDL FVC 2004 DB
FVC2004 DB
EER(%) FAR100(%) FAR1000(%) ZeroFAR(%)
VF G-TPS P-TPS VF G-TPS P-TPS VF G-TPS P-TPS VF G-TPS P-TPS DB1 3.91 3.24 2.48 7.11 5.89 4.68 12.43 11.47 7.76 17.96 14.70 12.13 DB3 4.03 1.97 1.25 7.43 3.16 2.22 12.64 7.59 5.47 14.32 9.18 7.19 Trung bỡnh 3.97 2.61 1.87 7.27 4.26 3.45 12.54 9.53 6.62 16.14 11.94 9.66
Ghi chỳ: FAR100 (phần trăm FRR nhỏ nhất khi FAR<=1%), FAR1000 (phần trăm
FRR nhỏ nhất khi FAR<=0.1%), ZeroFAR (phần trăm FRR nhỏ nhất khi FAR=0%).
(a) FVC2004 DB1 (b) FVC2004 DB3
Hỡnh 3.6: So sỏnh đƣờng ROC của phƣơng phỏp G-TPS và phƣơng phỏp P-TPS trờn CSDL FVC2004 DB1, DB3.
Bảng 3.2: So sỏnh thời gian và bộ nhớ của hai phƣơng phỏptrờn CSDL FVC 2004 DB
FVC2004 DB
Chớnh danh Giả danh
Thời gian (ms) Bộ nhớ (Kbytes) Thời gian (ms) Bộ nhớ (Kbytes) G-TPS P-TPS G-TPS P-TPS G-TPS P-TPS G-TPS P-TPS DB1 83.4 78.33 307.56 1.79 83.37 47.06 306.66 0.91 DB3 60.7 46.65 144.46 2.35 53.25 34.18 142.11 1.08 Trung bỡnh 72.05 62.49 226.02 2.07 68.31 40.62 224.39 0.95
Kết quả thử nghiệm hai phƣơng phỏp nắn chỉnh đƣợc thể hiện trong Bảng 3.1, kết quả so sỏnh hai đƣờng cong ROC trờn CSDL DB1 thể hiện trờn Hỡnh 3.6(a) cũn CSDL DB3 trờn Hỡnh 3.6(b).
Kết quả thử nghiệm so sỏnh thời gian đối sỏnh và bộ nhớ sử dụng của phƣơng phỏp đề xuất P-TPS với phƣơng phỏp G-TPS trờn CSDL DB1, DB3 FVC2004 đƣợc thể hiện trong Bảng 3.2
Kết quả thử nghiệm trờn cựng một CSDL cho thấy phƣơng phỏp nắn chỉnh P-TPS đạt độ chớnh xỏc cao hơn trờn tất cả cỏc tham đỏnh giỏ so với phƣơng phỏp nắn chỉnh G-TPS. Cụ thể về độ chớnh xỏc, trung bỡnh EER của P-TPS là 1.87% thấp hơn phƣơng phỏp G-TPS 2.61%. Về thời gian đối sỏnh trung bỡnh của phƣơng phỏp P-TPS là 62.49ms cho đối sỏnh chớnh danh và 40.62ms cho đối sỏnh giả danh giảm hơn so với phƣơng phỏp G-TPS là 72.05ms cho đối sỏnh chớnh danh và 68.31ms cho đối sỏnh giả danh. Về bộ nhớ sử dụng trong quỏ trỡnh thực hiện chƣơng trỡnh, phƣơng phỏp P-TPS chỉ sử dụng 2.07 Kbytes cho đối sỏnh chớnh danh và 0.95 Kbytes cho đối sỏnh giả danh ớt hơn rất nhiều hơn so với phƣơng phỏp G-TPS là 226.02 Kbytes cho đối sỏnh chớnh danh và 224.39 Kbytes cho đối sỏnh giả danh thực hiện trờn cựng một mỏy Intel Pentium 4, 2.8 GHz.
3.4. Kết luận
Trờn đõy luận ỏn đó đề xuất một phƣơng phỏp mới để đối sỏnh võn tay dựng mụ hỡnh nắn chỉnh TPS từng phần kết hợp sử dụng cấu trỳc thụng tin về võn rónh cục bộ là cặp võn rónh liờn thuộc. Ƣu điểm nổi trội của phƣơng phỏp đề xuất so với phƣơng phỏp G-TPS đƣợc thể hiện trờn nhiều mặt:
Thứ nhất, đƣa vào sử dụng cỏc điểm lƣợng húa trờn cặp võn rónh liờn thuộc gọi là giả ĐTCT vừa dựng nhƣ nguồn thụng tin cục bộ cú độ tin cậy cao để thẩm định lại tập cỏc cặp điểm ĐTCT tƣơng ứng tỡm đƣợc mà khụng đũi hũi tớnh toỏn phức tạp. So với phƣơng phỏp G-TPS phƣơng phỏp P-TPS giỳp giảm độ giống đối với cỏc cặp võn tay giả danh trƣớc khi nắn chỉnh nờn hạn chế đƣợc rất nhiều phộp nắn chỉnh thừa vừa cú giỏ trị tăng nhanh tốc độ đối sỏnh vừa cải thiện thờm phõn bố giả danh (Imposter).
Thứ hai, trong khi phƣơng phỏp G-TPS chọn tất cả cỏc cặp ĐTCT làm điểm khụng chế thỡ phƣơng phỏp P-TPS đề xuất vừa bổ sung thờm cỏc điểm giả ĐTCT để tăng khả năng lựa chọn, vừa đƣa ra phƣơng ỏn sàng lọc bớt cỏc điểm khống chế trựng thừa, giỳp xỏc đƣợc tập điểm khống chế phõn bố đồng đều hơn trờn mặt phẳng ảnh, giỳp mở rộng thờm vựng nắn chỉnh và nắn chỉnh hiệu quả hơn.
Thứ ba, việc đề xuất dựng kỹ thuật nắn chỉnh từng phần thay cho kỹ thuật nắn chỉnh toàn phần giỳp nắn chỉnh chớnh xỏc hơn nhờ phản ỏnh sỏt hơn cỏc thụng tin biến dạng địa phƣơng, khắc phục đƣợc hiện tƣợng sai số lũy tớch nờn cho lời giải chớnh xỏc hơn. Do đạt hiệu quả nắn chỉnh toàn cục cao, xỏc định đƣợc nhiều hơn số cặp điểm ĐTCT tƣơng ứng cho cỏc cặp võn tay chớnh danh, nờn phƣơng phỏp P-TPS cải thiện đƣợc đƣờng phõn bố Genuine tốt hơn.
Kết quả thực nghiệm trờn cỏc CSDL FVC 2004 (DB1, DB3) cho thấy cỏc khẳng định nờu trờn là cú căn cứ thực tế. So với phƣơng phỏp G-TPS, phƣơng phỏp mới P-TPS cải tiến đƣợc cả phõn bố chớnh danh và phõn bố giả danh, từ đú giảm thiểu đƣợc đồng thời cả hai loại sai số FAR và FRR, nõng cao rừ rệt hiệu quả đối sỏnh mà thời gian và bộ nhớ sử dụng cũng đồng thời đƣợc giảm xuống nhiều hơn.
Chƣơng 4. TỔ CHỨC DỮ LIỆU
VÀ BẢO VỆ AN NINH AN TOÀN HỆ THỐNG
Kỹ thuật phõn đoạn trong Chƣơng 2 giỳp ta xõy dựng CSDL ảnh võn tay lƣu trữ, phƣơng phỏp đối sỏnh võn tay trong Chƣơng 3 giỳp ta tổ chức và bảo vệ an ninh dữ liệu. Chƣơng này đề xuất một số giải phỏp tổ chức dữ liệu thuận tiện cho tra cứu và bảo vệ an ninh, ngăn ngừa cỏc phƣơng thức tấn cụng phỏ hoại hệ thống.
4.1. Tổ chức dữ liệu phục vụ phƣơng phỏp truy nguyờn võn tay tự động
Hiện nay ở nƣớc ta, Ngành Cụng an đó đƣa vào sử dụng cỏc hệ nhận dạng võn tay tự động AFIS. Thực tế hiện nay nhiều hệ thống AFIS trờn thế giới đó nhập và đƣa vào sử dụng ở nƣớc ta, chủ yếu vẫn đang xử lý tra tỡm bằng phƣơng phỏp đối sỏnh tuần tự nờn thời gian tỡm kiếm rất chậm chạp. Để truy nguyờn 1 dấu võn tay hiện trƣờng trờn CSDL 1,5 triệu chỉ bản 10 ngún hệ SAGEM MORPHO AFIS (Phỏp) thụng thƣờng phải mất hàng giờ mới cho ra kết quả. Hệ AFIX TRACKER (Mỹ) chỉ dựng để truy nguyờn dấu võn tay trờn CSDL nhỏ dƣới 10.000 chỉ bản, nhƣng tốc độ truy nguyờn cũng lờn đến 10 phỳt/1 yờu cầu.
Trong cỏchệ AFIS, cỏc yờu cầu về độ chớnh xỏc và tốc độ truy nguyờn,đối sỏnh là những tiờu chớ đỏnh giỏ quan trọng nhất. Để truy nguyờn, đối sỏnh võn tay với CSDL võn tay đăng ký, thƣờng cỏc hệ AFIS đều tiến hành theo hai cụng đoạn: Cụng đoạn đối sỏnh theo thụng tin thuộc tớnh ảnh cơ bản (dạng võn cơ bản, cỏc số đếm võn trớch chọn đƣợc trờn cơ sở định vị điểm dị thƣờng và mật độ đƣờng võn);Cụng đoạn đối sỏnh theo ĐTCT (cỏc điểm kết thỳc, điểm rẽ nhỏnh phõn bố ngẫu nhiờn trờn bề mặt ảnh võn tay) [56,63]. Nhờ kỹ thuật đỏnh chỉ số phõn cấp theo cỏc thuộc tớnh cơ bản của ảnh, một số lƣợng lớn chỉ bản thuộc nhúm phõn loại khỏc so với chỉ bản truy vấn bị loại từ đầu nờn cụng đoạn thứ nhất đƣợc thực hiện rất nhanh chúng và hiệu quả. Riờng cụng đoạn đối sỏnh theo ĐTCT, hệ thống khụng cú cỏch nào khỏc là phải đối sỏnh võn tay truy vấn với tất cả cỏc võn tay trờn danh sỏch đầu ra của cụng đoạn thứ nhất.
Đối với hệ AFIS qui mụ nhỏ, việc đối sỏnh theo ĐTCT bằng phƣơng phỏp xử lý tuần tự trong nhiều trƣờng hợp vẫn đạt đƣợc kết quả mong muốn trong
khoảng thời gian chấp nhận đƣợc. Tuy nhiờn, khi cơ sở dữ liệu ảnh lớn đến hàng triệu, thậm chớ hàng chục triệu chỉ bản, chỳng đũi hỏi khụng gian lƣu trữ rất lớn, hàng terabyte hay hàng chục terabyte, thỡ thời gian xử lý truy nguyờn, truyền dữ liệu trờn mạng bởi vậy cũng tăng lờn rất đỏng kể nờn giải phỏp đối sỏnh tuần tự khụng cũn tỏc dụng.
Để giải quyết vấn đề đặt ra, nhằm đạt đƣợc tốc độ đối sỏnh võn tay hiệu năng cao, cần phải thay thế giải phỏp đối sỏnh tuần tự bằng giải phỏp song song để đảm nhận cỏc nhiệm vụ trờn. Chƣơng này khụng đề cập lại thuật toỏn và độ chớnh xỏc đối sỏnh võn tay cụ thể đƣợc cài đặt trờn cỏc nỳt, vỡ vấn đề này đó trỡnh bày chi tiết trong Chƣơng 3 [16,60], mà chỉ tập trung vào thiết kế cấu hỡnh cụm mỏy tớnh kết nối mạng, phƣơng phỏp tổ chức CSDL ảnh, đỏnh chỉ số ảnh, giải phỏp tổ chức đối sỏnh song song húa dựa trờn việc phõn phối năng lực tớnh toỏn cho cỏc nỳt xử lý song song, cũng nhƣ giỏm sỏt quỏ trỡnh tớnh toỏn và tập hợp danh sỏch kết quả cuối cựng. Kết quả của giải phỏp này đó đƣợc cụng bố trong hội thảo khoa học quốc gia [18].
Để đỏnh giỏ, CSDL C@FRIS gồm 2,5 triệubản ghi lƣu ảnh võn ngún tay thu nhận từ tàng thƣ căn cƣớc can phạm đƣợc dựng để thử nghiệm giải phỏp đề xuất. Kết quả thử nghiệm cho thấy thuật toỏn đề xuất hoạt động hiệu quả, đạt độ chớnh xỏc cao và đƣợc đƣa vào ứng dụng thực tế để xõy dựng phƣơng phỏp truy nguyờn võn tay cao tốc nhằm nõng cấp phõn hệ phần mềm tỡm kiếm, đối sỏnh của hệ C@FRIS trƣớc đõy đó dựng phƣơng phỏp đối sỏnh tuần tự.Chi tiết về phƣơng phỏp truy nguyờn võn tay cao tốc sẽ đƣợc trỡnh bày trong Chƣơng 5.
Mục này sẽ trỡnh bàymụ hỡnh tổ chức dữ liệu phục vụ xử lý song song để truy nguyờn võn tay trờn CSDL dung lƣợng lớn.