Nghiên cứu và xây dựng hệ thống xác thực chữ ký viết tay trên thiết bị di động

Các thiết bị này thông thường sẽ được tích hợp trên nó một màn hình cảm ứng, và màn hình cảm ứng nó cũng giúp ta có thé lay thông tin về chữ ký của mình một cách trực tiếp theo thời gian

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

NGUYÊN QUÓC ANH

NGHIÊN CỨU VÀ XÂY DỰNG HỆ THÓNG XÁC THỰC

CHỮ KY VIET TAY TREN THIET BỊ DI ĐỘNG

HÀ NỘI - 2015

Trang 2

Luận văn được hoàn thành tại:

Người hướng dẫn khoa học: TS Nguyễn Đức Dũng

Luận văn sẽ được bảo vệ trước Hội đông châm luận văn thạc sĩ tại Học

viện Công nghệ Bưu chính Viễn thông

Có thê tìm hiêu luận văn tại:

- Thu viện của Học viện Công nghệ Bưu chính Viễn thong

HÀ NỘI - 2015

Trang 3

MO DAU

Trong nhiều năm nay, có một cách xác thực chữ ký viết tay đã được các nhà nghiêncứu bỏ rất nhiều công sức ra, và đã tạo ra một sỐ lượng khá nhiều các kĩ thuật để áp dụng

cho cách xác thực chữ ký này[3] Chữ ký của người cần kiểm tra sẽ không kí lên giấy như

cách thông thường mà sẽ kí lên một bề mặt của một thiết bị chuyên dụng, phương phápnày tỏ ra rất hiệu quả Tuy vậy, việc sử dụng phương pháp này không được sử dụng rộngrãi do nhược điểm của nó là cần một thiết bi chuyên dụng để thu thập dữ liệu Nhược điểmnói trên có vẻ như lại đang được giải quyết với việc các thiết bi di động ngày nay Các thiết

bị này thông thường sẽ được tích hợp trên nó một màn hình cảm ứng, và màn hình cảm

ứng nó cũng giúp ta có thé lay thông tin về chữ ký của mình một cách trực tiếp theo thời

gian thực, khi này nó có thé là một ứng cử viên dé thay thé cho thiết bị chuyên dụng trên.

Với mục đích đưa chữ ký viết tay dé xác thực người dùng trong các giao dich qua

các thiết bị di động, tôi xin lựa chon đề tài “Nghién cứu và xây dựng hệ thống xác thựcchữ ký viết tay trên thiết bị di động ”

Luận văn sẽ đi vào tìm hiểu tổng quan về việc xác thực chữ ký viết tay đã được công

bó Sau đó lựa chọn nghiên cứu cụ thể một số thuật toán xác thực chữ ký viết tay điển hình

dé áp dụng vào lập trình các hệ thống xác thực chữ ký viết tay trên thiết bị di động - dựa

hoàn toàn vào những thuật toán đó Cuối cùng là khảo sát hiệu quả xác thực và hiệu năngcủa các hệ thong này trên một bộ dữ liệu tự xây dung

Nội dung luận văn gồm 3 chương:

Chương 1: Tổng quan bài toán xác thực chữ ký viết tay và khả năng triển khai trên

thiết bị di động

Chương 2: Một số phương pháp xác thực chữ ký viết tay

Chương 3: Cài đặt hệ thống xác thực chữ ký viết tay và kết luận thống kê

Trang 4

CHƯƠNG 1 : TONG QUAN VE BÀI TOÁN XÁC THỰC CHỮ KÝ VIET

TAY VÀ KHẢ NĂNG TRIEN KHAI TREN THIẾT BỊ DI ĐỘNG

Luận văn này tập trung vào tự động xác thực người sử dụng chữ ký, coi chữ ký như

một đặc điềm sinh trắc học có thé dùng dé xác minh một người Việc xác thực chữ ký sẽ

được xem xét dé đưa lên các thiết bị di động cá nhân phô biến nhưng vẫn đảm bảo đượctính đáp ứng của các thiết bị này với maột hệ thống xác thực chữ ký viết tay

1.1 Các đặc điểm sinh trắc học:

Các đặc điểm sinh trắc học thường được sử dụng cho mục đích nhận dạng hoặc xác

minh một người nào đó Với mục đích nhận dạng, đặc điểm sinh trắc học của một cá nhân

sẽ được mô tả đến hệ thống, sau đó được sử dụng dé đối chiếu với tất cả những người đã

có dữ liệu đăng ký vào hệ thống, việc này là so sánh 1:N, với N là số người trong cơ sở đữliệu Còn với mục đích xác minh thì hơi khác, đặc điểm sinh trắc học được dùng để kiểmtra một người khang định mình chính là một ai đó da lưu trong cơ sở dữ liệu của hệ thống

có đúng hay không, việc này thực hiện phép so sánh 1:1 Trong chủ dé này, ta sẽ đi vào

vân đê xác thực hay cũng gọi là xác minh.

Trang 5

1.1.2 Xác thực chữ ký viết tay:

Hai loại hệ thống xác thực chữ ký viết tay chính đang ton tại, được phân loại dựavào cách trích xuất thông tin từ chữ ký Các hệ thông offline chỉ sử dụng các bức ảnh củachữ ký, trong khi các hệ thống động hay online thì sử dụng các hàm thời gian đã số hóa

của chữ ký.

1.1.3 Các ứng dụng của việc xác thực chữ ký viết tay trên thiết bị di động:

Thanh toán trong môi trường thương mại, các giao dịch pháp lý, đăng nhập người

dùng, xác minh khách hàng, mã hóa sinh trắc học

1.1.4 Những thách thức của việc xác thực trên các thiết bị di động:

Sự thay đôi của chữ ký đại diện cho hai vấn đề khó khăn chính là sự thay đổi chữ

ký của bản thân người ký và sự giả mạo của kẻ giả mạo.Các thiết bị đi động như smartphonehay PDA bị ảnh hưởng bởi kích thước và trọng lượng hạn chế do tính chất di động của cácthiết bị này Chất lượng màn hình cảm ứng số cũng phải được đưa vào xem xét

1.2 Xác thực chữ ký viết tay online

1.2.1 Kiên trúc của một hệ thông xác thực chữ ký viêt tay online:

[S| Identity

claim

Pre- Feature Similarity Score Accepted or

a Processing Extraction // Computation //Normalization/Aupo eae

Signature

Hình 1.3- Kiến trúc phố biến của một hệ thống xác thực chữ ky viết tay online.

Trang 6

2wnt se pues Structural Approaches | Statistical Approaches OthersApproaches

se Dynamic Time © = String/Tree/ « Hidden Discrete

Warping [1,3, Graph Markov Model Wavelet 12,17, 18,19] Matching [15] [10,26,24] Transform [6]

¢ Euclidean/ e Support Vector Discrete Cosine

Mahalanobis Machine Transform [23]

Hình 1.4- Các phương pháp xác minh chữ ký online.

1.2.3 So sánh và lựa chọn phương pháp tiếp cận:

Trong phần này, ta sẽ xem xét 4 phương pháp tiếp cận Dynamic Time Warping

(DTW), Hidden Markov Model (HMM), Neural Network (NN) và Support Vecto Machine

(SVM), vì day là các phương pháp được đánh giá là phô biến va có hiệu quả cao trong

Graph Edit Distance[15] 5.80, 2.46

Bang 1-2, đưa ra dan chứng về kết qua đạt được của các phương pháp, đây chi là ví

dụ về một sô kêt quả đạt được đã công bô, còn có rât nhiêu cải đặt khác nhau của từng thuật toán, và hiệu năng của các hệ thông còn phụ thuộc vào nhiêu các yêu tô, chứ không

Trang 7

phải chỉ ở một bước so khớp hay tính toán độ tương tự Nhưng nhìn chung thì hai phương

pháp phô biến hiện nay là Dynamic Time Warping va Hidden Markov Model vẫn tỏ ra có

ưu thế hơn các phương pháp khác với việc hai phương pháp được sử dụng dé cài đặt phố

các thông tin về tọa độ và thời gian, nhưng hiện tại, số lượng các đặc trưng có thể dẫn xuất

từ hai thông tin tọa độ và thời gian cũng đã được công bồ khá nhiều Ta sẽ tăng các tính

năng bằng các đặc trưng dẫn xuất này

Kèm theo với việc đây là hai phương pháp tiếp cận phô biến nhất trong các hệ thống

xác thực chữ ký viết tay, ta có đủ lí do dé chon lựa hai phương pháp này nghiên cứu và xây

dựng hệ thống xác thực chữ ký viết tay trên thiết bị di động

Trang 8

CHƯƠNG II: MOT SO PHƯƠNG PHÁP XÁC THỰC CHỮ KY VIET TAY

2.1 Xác thực chữ ký với Dynamic Time Warping

Dynamic Time Warping là một kĩ thuật nồi tiếng dé tìm ra sự tương ứng (alignment)

tối ưu giữa hai dãy (phụ thuộc vào thời gian) cho trước dưới các phạm vi nhất dinh[5]

2.1.1 Ý trởng của Dynamic Time Warping

Đối tượng của DTW là dé so sánh hai dãy (phụ thuộc vào thời gian) : X = (x1, x2, XN) có độ dai NEN và Y= (yi, y2, , ym) có độ dài M CN Các dãy này có thé là các

tín hiệu rời rac (các dãy theo thời gian) hay tổng quát hon, dãy các đặc trưng đã lay mau

tại các điểm cách đều nhau theo thời gian Trong các phần tiếp theo, ta sẽ biểu diễn khônggian tính năng bởi F Khi đó xa, ym € F với n € [1:N] và m € [1:M] Dé so sánh hai tínhnăng khác nhau x,y € F, ta cần một độ đo gọi là độ đo chi phi local, đôi khi người ta cũng

gọi nó là độ đo khoảng cách local, độ đo này được định nghĩa bởi một hàm:

c:F X F > Ryo (2.1)

Thông thường, c(x,y) là nhỏ (chi phí thấp) nếu x và y là tương tự với nhau, và trái

lại thì c(x,y) là lớn (chi phí cao) Việc ước lượng độ đo khoảng cách cho từng cặp của các

phan tử của dãy X và Y, thì ta thu được ma trận khoảng cách C € RNTM được định nghĩa

với C(n,m)=c(Xn,Ym) Sau đó mục tiêu sẽ là tim một sự tương ứng giữa các điểm của haidãy X và Y sao cho toàn bộ tổng khoảng cách phải là nhỏ nhất Định nghĩa sau đây định

dạng dạng thức của một dãy tương ứng.

Định nghĩa: một đường warp (N,M) là một dãy p=(p, , pr) với pi= (m,mị) €

[1:N]x[1:M] và IC[1:L] thỏa mãn ba điều kiện sau:

() Điều kiện biên: pi=(1,1) và pr=(N,M).

(ii) Điều kiện về tính đơn điệu: nị< nox < nụ và mị< mạ< < mM.

(iii)Diéu kiện về kích thước bước nháy: pisi-pi € {(1,0), (0,1), (1,1)} vớ 1 € [1:L-1].

Hình 2-1 mô tả 3 điều kiện này Với 2.3-(a) là minh họa thỏa mãn là một đường warp đảmbảo các điều kiện (i),(ii) va (11) trong định nghĩa; 2.3-(b)vi phạm điều kiện biên (i); 2.3-(c)

vi pham diéu kién tinh don diéu (ii); (d) vi phạm điều kiện kích thước bước nhảy (iii)

Trang 9

Khoảng cách tông hay chi phí tổng cp(X,Y) của một đường warp p giữa X và Y với

độ đo chi phí local c được định nghĩa như sau:

cu, Y)= T=1 C(Xn,› Vm) (2.2)

Hơn nữa, một đường warp tôi ưu giữa X và Y là một đường warp p* có tông chi phí

nhỏ nhất giữa tất cả các đường warp có thé xảy ra Khoảng cách DTW giữa X va Y được

định nghĩa theo chi phí tổng p* khi này như sau:

DTW(X,Y) = cp* (X,Y) = min {cp (X, Y) | với p là một đường warp giữa X và Y}

2.1.2 Tối wu sự tương quan hay đường dẫn toi ưu DTW

Sau đây là thuật toán tính đường warp tối ưu:

Thuật toán: OptimalWarpingPath

Input: ma trận chỉ phí tích lity D

Output: đường warp tối wu p”

Phương thức: đường warp tối ưu p*= (pi, , pr~1 pL) được tính theo thứ tự đảo ngược củachỗ bat đầu với pr = (N.,M) Giả sử p=(n,m) đã tính được

(17m—1) néun=1

Pi-1 = (n—1,1) néum=1 (2.3)

argmin{D(n — 1,m — 1), D(n,m— 1), D(n—1,m)}néun,m # 1

với trường hợp argmin có các giá trị bằng nhau thi ta sẽ lay theo thứ tự từ điền, vì argmin

có những lúc không phải là duy nhất

Trang 10

2.1.3 DTW và việc xác thực chữ ky viết tay

2.1.3.1 Chuan hóa độ tương tự - ER2

Với bất kỳ hai dãy X và Y, có độ dài bằng nhau, ER2 trả lời về độ tương tự nằmgiữa 0-100% Điều này sẽ giúp ta sau khi thực hiện DTW giữa hai dãy X và Y xong, cóthé trả lời đc về độ tương tự giữa chúng

Cho hai dãy X và Y, có cùng số n phan tử, mỗi phan tử lại là một vecto trong không

gian K chiều Để so sánh hai dãy n phần tử K chiều này ta sử dụng công thức định nghĩa

ER? như sau:

fi (a (ay — X2)(wại — YG)?

tương tự giữa hai dãy Do đó ta có thé kết nỗi DTW với ER? dé đồng hóa ưu điểm của

Trang 11

Hình 2.2- Mô hình markov 4 trạng thái.

Tại thời điểm t bất kỳ, hệ thống có thể chuyền từ trạng thái S¡ hiện hành sang mộttrong N-1 trang thái còn lại hoặc chuyên trở lại chính trang thái S; theo quy luật được tạo

ra bởi một tập các xác suất biến đôi của từng trang thái Ta sẽ biểu thị thời gian liên quan

đến việc thay đôi trạng thái là t=1, 2, 3, và ta biểu thị trạng thái đạt được tại thời điểm t

là qt Một mô tả đầy đủ xác suất của hệ thống nói chung sẽ đòi hỏi mô tả của trạng thái ởthời điểm hiện tại cũng như ở các trạng thái trước nó Cụ thể trường hợp của một dãy rờirạc, các thứ tự đầu tiên của dãy Markov, mô tả xác suất này được rút gọn dé chỉ đưa ratrạng thái hiện tại và trạng thái ngay liền trước:

Vì chúng phải luôn tuân thủ điều kiện ngẫu nhiên chuẩn.

Tiên trình ngẫu nhiên ở trên có thê được xem như Mô hình Markov hiện vì đâu ra của tiễn trình này thực chất ở mỗi thời điểm là một trạng thái, với mỗi trạng thái tương ứng chính là sự kiện mà ta có thể quan sát (nhìn thấy) được trực tiếp

Với 77; là xác suât khởi đâu của trạng thái Si — xác suât rơi vào trạng thái S; vào thời

dém t=l:

với z,=Plq =5,], 1<ij<N (2.8)

Trang 12

2.2.2 Mô hình Markov ẩn — Hidden Markov Model

Định nghĩa một cách hình thức, HMM gồm các thành phan sau đây:

1) N- sỐ lượng trạng thái của mô hình: mặc dù các trạng thái được xem là “An” nhung

trong một số ứng dụng cụ thé, các trạng thái cũng đóng vai trò nhất định nào đó;chang hạn như trong hệ thống binh-cau, các trạng thái ứng với các bình Ta ký hiệucác trạng thái là S = {S1, So, , Sn} và trạng thái ở thời điểm t là dt

2) M-số lượng tín hiệu có thể quan sát được trong mỗi trạng thái Các tín hiệu quan

sát này là thành phan trong chuỗi kết xuất của mô hình Trong hệ thống binh-cau,các tín hiệu quan sát chính là màu sắc phân biệt của các quả cầu Ta ký hiệu các tínhiệu quan sát này là V = {v, v2, , vm} và tín hiệu quan sát được ở thời điểm t là

Or.

3) Cac xác suất chuyền trạng thái A = { ai } với

aj=p(qui=Sjlq:=Si), 1<i1j<N (2.9)

thỏa mãn ràng buộc we aj = 1.

4) Cac hàm mật độ xác suất trong mỗi trạng thái B = { b(Œ) } với

bi(k) = p ( vx tại t | q=S¡ ), 1<j<N, I<k<M (2.10)

thỏa mãn ràng buộc YL, b;(k) = 1.

5) Xác suất khởi đầu của mỗi trạng thái n = { 7, } với

1; = p(qi = Si), I<<N (2.11)

thỏa mãn ràng buộc YL, 7; = 1.

Ta quy ước mỗi mô hình HMM sẽ được đại diện bởi bộ tham số A=(A, B, 2)

2.2.3 Ba bài toán cơ bản cia HMM

Đề có thể áp dụng được mô hình HMM vào các ứng dụng phức tạp trong thực tế,trước hết cần có lời giải thỏa đáng cho 3 bài toán cơ bản của HMM{[1]:

Bài toán 1: cho trước chuỗi tín hiệu quan sát O = O; Oa Or và mô hình HMM đại

diện bởi bộ tham số A=(A, B, ø) Làm sao dé tính toán một cách hiệu quả p(O| A) - xác suất

phát sinh O từ mô hình À?

Trang 13

Bài toán 2: cho trước chuỗi tín hiệu quan sát O = O¡ O> Or và mô hình HMM đại

diện bởi bộ tham số A=(A, B, 2) Cần tìm ra chuỗi trạng thái tối ưu nhất Q = qi q2 qr đã

phat sinh ra O?

Bài toán 3: cho trước chuỗi tín hiệu quan sát O = O¡ Op Or Lam thé nào dé xácđịnh các tham số mô hình A=(A, B, œ) sao cho cực đại hóa xác suất p(O| A)? Đây chính làbài toán học / huấn luyện mô hình Bài toán này đem lại một khả năng rất quan trọng của

HMM: khả năng mô hình hóa một đối tượng cụ thể trong thực tế, mô hình hóa dit liệu học.

2.2.3.1 Bài toán 1 — ước lượng van đề

Một giải pháp khả thi hơn dé tính p(O| A) là thông qua thủ tục forward-backward.

Trước tiên, ta định nghĩa biến forward œ() là xác suất ở trạng thái S¡ tại thời điểm t và đã

quan sát được đoạn Oj, Od, , O; từ mô hình A cho trước:

a,,(i) = P(O,O) 0,,4, =S,lÂ) — (2.13)

Các biến œ(1) có thé được tính theo qui nạp từng bước như sau:

1) Khởi tạo: a1(i)= mbi(Oj), 1<i<N (2.14)

2) Qui nạp: #,;¡Ú) = [EM ae ay] (Ory), 1S<T-1,1Xj£N — (215)

Như vậy, với qui nạp, ta hoàn toàn có thé tinh được ơr() Mà theo định nghĩa thì

ar(i) = p(O¡ Oa Or, qr = Si | A) Từ đây, dé dàng có được:

pola) = YL, az(i) (2.16)

về độ phức tạp tính toán, dé tính được tất cả các bién forward œ(), ta cần thực hiện N?Tphép tính, nhỏ hơn rất nhiều so với con số 2TNT của phương pháp tính trực tiếp

Tương tự như trong thủ tục forward, thủ tục backward trước hết định nghĩa biến

backward f,(i) là xác suất quan sát được đoạn Ot, Or2, , Or cho trước trang thái Si ởthời điểm t và mô hình 2:

B:Œ)= p(Ou1 Ovv2 Or | q=S¡, A) (2.17)

Các biến B,(i) cũng được tinh theo qui nạp từng bước như sau:

1) Khởi tạo: BrG)=1 với I<<N (2.18)

2) Qui nạp: B, (i) = DL, &¡jb/(O¿++),++(7) với t=T-1, T-2, ,1 và 1<i<N (2.19)

Trang 14

Cũng giống như các biến forward œ(i), việc tính tất cả các biến backward BG) can

thực hiện N’T phép tinh.

2.2.3.2 Bài toán 2 — giải mã vấn đề

Mục tiêu của bài toán 2 là tìm ra chuỗi trang thái “tối ưu” nhất Q = qi q2 qr đãphát sinh ra O Một điều đáng lưu ý là có rất nhiều các tiêu chí “tối ưu” khác nhau cho việc

xác định Q, nên lời giải cho bài toán này phụ thuộc vào tiêu chí “tối ưu” được chọn.

Một trong những tiêu chí đó là chọn ra từng qt có độ khả thi cao nhất ở từng thời

điểm t thông qua độ đo xác suất p(q: = S¡ | O, A) - xác suất ở trạng thái Si vào thời điểm t

cho trước chuỗi tín hiệu quan sát O và mô hình A Ta gọi độ do này là y():

Thông qua biến +:(), ta hoàn toàn có thé xác định được trạng thái có khả năng cao

nhất được đạt đến ở thời điểm t:

q,=argmax[7,()], (2.22)

1<i<N

Ta có thé thay đổi tiêu chí “tối ưu” cho việc chon Q Tùy theo từng ứng dung cụ thé

mà tiêu chí này sẽ được chọn sao cho phù hợp, tuy nhiên tiêu chí phổ biến nhất được sử

dụng là chọn cả chuỗi Q khả thi nhất, nghĩa là qui bài toán từ việc tìm Q dé cực đại hóa

p(Q|O, ^) sang việc tìm Q dé cực đại hóa p(Q.O| A) Giải pháp cho van đề này là thuật toán

Tiêu đề	Nghiên Cứu Và Xây Dựng Hệ Thống Xác Thực Chữ Ký Viết Tay Trên Thiết Bị Di Động
Tác giả	Nguyên Quốc Anh
Người hướng dẫn	TS. Nguyễn Đức Dũng
Trường học	Học viện Công nghệ Bưu chính Viễn thông
Thể loại	luận văn
Năm xuất bản	2015
Thành phố	Hà Nội

Định dạng
Số trang	26
Dung lượng	6,14 MB