Kiểm soát bằng sinh trắc học là những phương pháp tự động cho phép xác thực hay nhận dạng một cá nhân dựa vào các đặc trưng sinh lý học của người đó như đặc điểm vân tay, gương mặt, gen,
Trang 11 Phép biến đổi Karhunen-Loève 1
2 Thuật toán PCA 7
2.1 Giới thiệu chung về thuật toán 7
2.2 Nội dung thuật toán PCA 9
3 Áp dụng PCA trong bài toán nhận dạng khuôn mặt 11
3.1 Giới thiệu chung về các phương pháp nhận dạng mặt người 11
3.2 Nhận dạng khuôn mặt dựa trên PCA 12
3.3 Các hàm hiển thị ảnh trong Matlab 14
3.4 Các hàm khác được sử dụng trong đề tài 16
4 Chương trình Demo 17
Tài liệu tham khảo 23
Trang 2Bài Toán Nhận Dạng Mặt Người
-oOo -2.1 Giới thiệu
Trong thế giới ngày nay với sự phát triển mạnh mẽ của kỹ thuật số và mạngtoàn cầu, vấn đề đảm bảo an toàn về thông tin cũng như vật chất trở nên ngàycàng quan trọng và khó khăn Thỉnh thoảng chúng ta lại nghe nói đến những vụđánh cắp thẻ tín dụng, đột nhập trái phép vào các hệ thống máy tính hay toà nhàcủa cơ quan nhà nước, chính phủ Hơn 100 triệu đô la là con số đã bị thất thoát ở
Mỹ vào năm 1998 do các vụ gian lận và xâm nhập nói trên (theo Reuters, 1999)[5] Trong đa số các vụ phạm pháp này, bọn tội phạm đã lợi dụng những khe hở cơbản trong quá trình truy cập vào các hệ thống thông tin và kiểm soát Phần lớnnhững hệ thống này không thực hiện quyền truy cập của người sử dụng dựa vàothông tin “chúng ta là ai” mà chỉ dựa vào “chúng ta có gì” Nói cách khác, thôngtin mà người sử dụng cung cấp cho hệ thống không đặc trưng được cho bản thân
họ, mà chỉ là những gì họ hiện đang sở hữu như số chứng minh nhân dân, chìakhoá, mật mã, số thẻ tín dụng hoặc họ tên Rõ ràng những thông tin hay vật dụngnày không mang tính đặc trưng mà chỉ mang tính xác thực đối với người sử dụng,
và nếu chúng bị đánh cắp hay sao chép thì kẻ trộm hoàn toàn có quyền truynhập, sử dụng dữ liệu hay phương tiện của chúng ta bất cứ lúc nào họ muốn Hiệnnay, những công nghệ hiện đại đã cho phép việc xác thực dựa vào “bản chất” của
từng cá nhân Công nghệ này dựa trên lĩnh vực được gọi là sinh trắc học Kiểm
soát bằng sinh trắc học là những phương pháp tự động cho phép xác thực hay nhận
dạng một cá nhân dựa vào các đặc trưng sinh lý học của người đó như đặc điểm vân tay, gương mặt, gen,… hoặc dựa trên những đặc điểm liên quan đến đặc trưng hành vi như dạng chữ viết, cách gõ phím, giọng nói…Vì những hệ thống
nhận dạng bằng sinh trắc học sử dụng thông tin sinh học của con người nên kếtquả chính xác và đặc biệt là rất khó bị
giả mạo
Trang 3như căng thẳng, mệt mỏi hay bệnh tật Chính vì lý do này, các hệ thống nhậndạng dựa trên đặc trưng sinh lý tỏ ra ổn định hơn các hệ thống dựa vào đặctrưng hành vi Tuy nhiên, nhận dạng bằng các đặc trưng hành vi có ưu điểm là
dễ sử dụng và thuận tiện hơn : thay vì phải đặt mắt trước một máy quét điện tửhay lấy ra một giọt máu, người sử dụng sẽ cảm thấy thoải mái hơn khi được yêucầu ký tên hay nói vào một micro
Nhận dạng gương mặt là một trong số ít các phương pháp nhận dạng dựa vàođặc trưng sinh lý cho kết quả chính xác cao đồng thời rất thuận tiện khi sử dụng.Hơn nữa, trong số các đặc trưng sinh lý học, gương mặt của mỗi người là yếu tốđầu tiên và quan trọng nhất cho việc nhận biết lẫn nhau cũng như biểu đạt cảmxúc Khả năng nhận dạng nói chung và khả năng nhận biết gương mặt người nóiriêng của con người thật đáng kinh ngạc Chúng ta có khả năng nhận ra hàng ngàngương mặt của những người mình đã gặp, đã giao tiếp trong cuộc sống chỉ bằngmột cái nhìn thoáng qua, thậm chí sau nhiều năm không gặp cũng như những sựthay đổi trên gương mặt do tuổi tác, cảm xúc, trang phục, màu tóc,…Do đó, việcnghiên cứu các đặc tính của gương mặt người đã thu hút rất nhiều nhà triết học,nhà khoa học qua nhiều thế kỷ, trong đó có cả Aristotle và Darwin [1]
Chính vì những lý do trên, từ những năm 1970, nhận dạng mặt người đã thuhút sự quan tâm của nhiều nhà nghiên cứu trong các lĩnh vực như bảo mật, tâm lýhọc, xử lý ảnh và thị giác máy tính Ngày nay các chương trình máy tính về nhậndạng mặt người đã tìm được những ứng dụng thực tế như [3] :
Nhận dạng tội phạm
Các hệ thống nhận dạng mặt người đã được tích hợp vào trong các hệthống kiểm soát sân bay và được sử dụng để tìm kiếm và nhận diệnnhững tên khủng bố hay bọn buôn bán ma tuý
Kiểm soát truy cập vào các hệ thống máy tính trong môi trường cộng tácViệc kiểm tra đăng nhập vào các hệ thống máy PC được kết hợp giữathông tin mật mã và / hoặc nhận dạng mặt người Điều này giúp
Trang 4khách hàng và các bí mật trong kinh doanh.
Giải pháp bảo mật bổ sung cho các giao dịch rút tiền tự động (ATM)Việc truy cập vào các máy rút tiền tự động và các dịch vụ khác của
ngân hàng được kiểm soát bởi các thông tin như số tín dụng (PIN),
giọng nói, tròng mắt kết hợp với nhận dạng gương mặt
Đối sánh ảnh căn cước trong hoạt động của ngành luật pháp
Các cơ quan luật pháp có thể sử dụng các hệ thống nhận dạng mặtngười để đối sánh những mô tả của các nhân chứng với những tên tộiphạm được lưu trữ trong cơ sở dữ liệu
Ứng dụng trong các giao tiếp người – máy
Sau khi xác định được người sử dụng và cảm xúc của họ tại thời điểm
đó, các hệ thống máy tính có thể có các ứng xử thích hợp
Trong chương này trước tiên chúng ta sẽ điểm qua một số phương pháp đãđược sử dụng trong lĩnh vực nhận dạng mặt người Sau khi đưa ra một mô hìnhtiêu biểu cho một hệ thống nhận dạng mặt người và bàn luận về một số khókhăn cho toàn bộ quá trình nhận dạng, chúng ta sẽ tập trung vào hai giai đoạn rút
trích đặc trưng và phân lớp với hai phương pháp : phân tích thành phần chính (Principle Components Analysis –PCA) và mạng lượng hoá vector (Learning Vector Quantization Network – LVQ).
1 Phép biến đổi Karhunen-Loève :
Các phép biến đổi Karhunen-Loève (KL) có liên quan với các giải thích cấu trúc dữliệu thông qua một số tuyến tính kết hợp của các biến Giống như PCA, phép biếnđổi KL cũng là cách tối ưu cho dự án d - chiều điểm để giảm điểm chiều sao cho sai
số của dự án (tức là tổng của khoảng cách bình phương (SSD)) là tối thiểu(Fukunaga, 1990)
Cho D x 1 , x 2 , , x nlà một tập dữ liệu không gian d chiều, và X là đồng vị ma trậndxd, nghĩa là X= (xij)nxd với xij là giá trị j thành phân của xi
xi i 1,2,,n) là vector d chiều Chúng có thể hiển thị không lỗi bằng phép tính
tổng vector tuyến tính độc lập như
Trang 5Các ma trận d × d cơ sở và chúng ta biết thêm có thể cho rằng những hàng
hình thức một bộ trực giao, nghĩa là:
Vì vậy, Y chỉ đơn giản là một biến đổi trực giao của X j được gọi là vectơ thứ jtính năng và yij là thành phần thứ j của mẫu xi trong không gian tính năng này Đểgiảm bớt chiều, chúng ta chỉ chọn m(m<d) tính năng vectơ có thể gần đúng X tốt.Xấp xỉ có thể được thu được bằng cách thay thế các thành phần của yj với hằngchọn trước
Trang 6Y(1,m) là ma trận nxm có được bằng cột m đầu tiên của Y, có nghĩa là
Ym(yij)nxm và một ma trận n(md)với (i, j) nhập từ bi,m+j
Không mất tổng quát, chúng ta giả định rằng chỉ có các thành phần m đầu tiên của mỗi yj được tính toán Sau đó, các lỗi của các kết quả là xấp xỉ
Trang 82 Thuật toán PCA:
2.1 Giới thiệu chung về thuật toán :
PCA (Principle Components Analysic) là một thuật toán được sử dụng để tạo ra mộtảnh mới từ ảnh ban đầu Ảnh mới này có kích thước nhỏ hơn nhiều so với ảnh banđầu nhưng vẫn mang những đặc trưng cơ bản nhất của ảnh cần nhận dạng
PCA không cần quan tâm đến việc tìm ra các đặc điểm cụ thể của thực thể cần nhậndạng và mối quan hệ giữa các đặc điểm đó Tất cả các chi tiết đó đều được thể hiện
ở ảnh mới được tạo ra từ PCA
Về bản chất, PCA tìm ra một không gian mới theo hướng biến thiên mạnh nhất củamột tập hợp các vector trong không gian cho trước Trong không gian mới, người ta
hi vọng rằng việc phân loại sẽ mang lại kết quả tốt hơn so với không gian ban đầu
Trang 9Không gian mới (p1,p2) theo hướng phân bố mạnh nhất của các vector trong không gian
(x1, x2) tìm theo PCA
Ưu điểm của phương pháp PCA :
Tìm được các đặc tính tiêu biểu của đối tượng cần nhận dạng mà không cầnphải xác định các thành phần và mối quan hệ giữa các thành phần đó
Thuật toán có thể thực hiện tốt với các cảnh có độ phân giải cao, do PCA sẽ thugọn ảnh thành một ảnh có kích thước nhỏ hơn
PCA có thể kết hợp với các phương pháp khác như mạng Nơron, SupportVector Machinge… để mạng lại hiệu quả nhận dạng cao hơn
Nhược điểm của PCA :
PCA phân loại theo chiều lớn nhất của tập vector Tuy nhiên, chiều phân bố lớnnhất không phải lúc nào cũng mang lại hiệu quả tốt nhất cho bài toán nhận dạng.Đây là nhược điểm cơ bản của PCA
PCA rất nhạy với nhiễu
Trang 102.2 Nội dung thuật toán PCA:
Không gian mới được tạo bởi PCA được cấu thành từ k vector đơn vị có chiều là N.Mỗi vector được gọi là một Eigenface
Phép biến đổi :
A= W = với K<<N
W=T.AVới T là ma trận chuyển đổi, T có kích thước K x N
Gọi M là số ảnh đầu vào, mỗi ảnh được chuyển thành vector N chiều Ta có tậphợp đầu vào
X={x1, x2,…,xM} (xi € RN)Trung bình của các vector đầu vào :
Trang 11x-xtb = w1u1+ w2u2+…+ wNuN =
Chọn lấy K vector riêng u tương ứng với K giá trị riêng λ lớn nhất, ta có :
x-xtb = w1u1+ w2u2+…+ wNuN= với K<<N
Vector các hệ số khai triển [w1, w2,…, wk] chính là biểu diễn mới của ảnh được tạo
ra trong không gian PCA Ảnh mới vẫn giữ được các đặc điểm chính của ảnh đầuvào
Vector [w1, w2,…, wK] được tính theo công thức :
Vấn đề cần giải quyết ở đây là ma trận tương quan C=A.AT có kích thước N2
Với N=180x200=36000, khối lượng tính toán sẽ rất lớn Do đó, để tính được cáceigenface mà không cần tính cả ma trận C, người ta đưa ra phương pháp tính nhanhdựa vào vector riêng và giá trị riêng của ma trận L=AT.A có kích thước MxM với M
Trang 123 Áp dụng PCA trong bài toán nhận dạng khuôn mặt :
3.1 Giới thiệu chung về các phương pháp nhận dạng mặt người:
a Các phương pháp nhận dạng khuôn mặt người :
Các phương pháp nhận dạng hiện nay có 2 loại :
Nhận dạng dựa trên các đặc trưng phần tử trên khuôn mặt (Feature based facerecognition)
Nhận dạng dựa trên xét tổng thể khuôn mặt (Apppearance base face recognition)
b Nhận dạng dựa trên mối quan hệ giữa các phần tử :
Đây là phương pháp nhận dạng khuôn mặt dựa trên việc xác định các đặc trưnghình học của các chi tiết trên khuôn mặt ( như vị trí, diện tích, hình dạng của mắt,mũi, miệng ), và mối quan hệ giữa chúng (như khoảng cách 2 mắt, khoảng cách 2lông mày…)
Ưu điểm của phương pháp này là nó gần với cách mà con người sử dụng để nhậnbiết khuông mặt Hơn nữa, với việc xác định đặc tính và mối quan hệ, phương phápnày có thể cho kết quả tốt trong các trường hợp ảnh có nhiều nhiễu, bị nghiêng, bịxoay và ánh sáng thay đổi
Nhược điểm của phương pháp này là cài đặt thuật toán phức tạp do việc xác địnhmối quan hệ giữa các đặc tính đòi hỏi các thuật toán phức tạp Mặt khác với ảnhkích thước bé thì các đặc tính sẽ khó phân biệt
c Nhận dạng khuôn mặt dựa trên xét toàn diện khuôn mặt :
Nội dung chính của hướng tiếp cận này là xem mỗi ảnh có kích thước RxC là mộtvector trong không gian RxC chiều Ta sẽ xây dựng một không gian mới có chiềunhỏ hơn sao cho khi biểu diễn trong không gian đó các đặc điểm chính của mộtkhuôn mặt không bị mất đi Trong không gian đó, các ảnh của cùng một người sẽđược tập trung lại thành một nhóm gần nhau và cách xa các nhóm khác
Trang 13Kohonen đã đưa ra phương pháp dùng vector riêng để nhận dạng khuôn mặt,ông dùng một mạng neural đơn giản để chứng tỏ khả năng của phương pháp nàytrên các ảnh đã được chuẩn hóa Mạng neural tính một mô tả của khuôn mặt bằngcách xấp xỉ các vector riêng của ma trận tương quan của ảnh Các vector riêng saunày được biết đến với cái tên Eigenface Kirby và Sirovich chứng tỏ các ảnh có cáckhuôn mặt có thể được mã hóa tuyến tính bằng một số lượng vừa phải các ảnh cơ
sở Tính chất này dựa trên biến đổi Karhunen-Lòeve, mà còn được gọi dưới một cáitên khác là PCA và biến đổi Hotelling Ý tưởng này được xem là của Pearson trìnhbày đầu tiên vào năm 1901và sau đó là Hotelling vào năm 1933 Cho một tập cácảnh huấn luyện có kích thước n x m được mô tả bởi các vector có kích thước m x
m, các vector cở sở cho một không gian con tối ưu được xác định thông qua lỗibình phương trung bình khi chiếu các ảnh huấn luyện vào không gian con này Cáctác giả gọi tập các vector cơ sở tối ưu này là ảnh riêng sau đó gọi cho đơn giản làvector riêng của ma trận hiệp phương sai được tính từ các ảnh khuôn mặt đã vectorhóa trong tập huấn luyện Nếu cho 100 ảnh, mà mỗi khuôn mặt có kích thước91x50 thì có thể chỉ dùng 50 ảnh riêng, trong khi vẫn duy trì được một khả nănggiống nhau hợp lý (giữ được 95% tính chất) Turk và Pentland áp dụng PCA để xácđịnh và nhận dạng khuôn mặt Tương tự, dùng PCA trên tập huấn luyện ảnh cáckhuôn mặt để sinh các ảnh riêng (còn gọi là eigenface) để tìm một không gian con(không gian khuôn mặt) trong không gian ảnh Các ảnh khuôn mặt được chiếu vàokhông gian con này và được gom nhóm lại Tương tự các ảnh không có khuôn mặtdùng để huấn luyện cũng được chiếu vào cùng không gian con và gom nhóm lại.Các ảnh khi chiếu vào không gian khuôn mặt thì không bị thay đổi tính chất cơ bản,trong khi chiếu các ảnh không có khuôn mặt thì xuất hiện sự khác nhau cũng không
ít Xác định sự có mặt của một khuôn mặt trong ảnh thông qua tất cả khoảng cáchgiữa các vị trí trong ảnh và không gian ảnh Khoảng cách này dùng để xem xét cóhay không có khuôn mặt người, kết quả khi tính toán các khoảng cách sẽ cho ta mộtbản đồ về khuôn mặt Có thể xác định được từ cực tiểu địa phương của bản đồ
Trang 14tưởng vector riêng, phân rã, và gom nhóm Sau đó Kim phát triển cho ảnh màu,bằng cách phân đoạn ảnh để tìm ứng để không gian tìm kiếm bớt đi
Bước đầu tiên trong nhận dạng khuôn mặt dựa trên PCA là trích chọn vectorđặc tính Một bức ảnh về khuôn mặt được coi như một vector, nếu bức ảnh có kíchthước là w*h pixels thì không gian chứa vector này có số chiều là N=w*h Mỗipixel sẽ được mã hóa bởi một thành phần của vector
Khâu quan trọng nhất trong bài toán nhận dạng đó là trích chọn vector đặc tính Cácbước trích chọn bao gồm :
i Tạo một tập X gồm M ảnh (ảnh học), mỗi ảnh có kích thước N, các ảnh đượcchuyển thành vector N chiều
iv Tìm một tập M vector trực giao u biểu diễn phân bố mạnh nhất của tập dữ liệu
X Tập các vector u được gọi là eigenface của tập dữ liệu học
v Xây dựng các ảnh mới vi theo M vector u :
vi = uit Φi
Ω=[v1, v2,… ,vM]T
Trong đó, vi = uit Φi là vector đặc tính của ảnh thứ I trong không gian mới Ω ở đây
là tập các eigenface, các thành phần cơ bản cho bức ảnh cần nhận dạng
Trang 15liệu, từ đó đưa ra kết quả nhận dạng Trong bài toán, kết quả nhận dạng sẽ là nhậnbiết được hoặc chưa nhận biết được.
Để thực hiện phân loại có rất nhiều phương pháp như khoảng cách Euclid, mạngNoron… trong đó khoảng cách Euclid là phương pháp đơn giản nhất Nó cho kếtquả tốt đối với trường hợp đối tượng đã được tạo thành các nhóm cách xa nhau.Vector đặc tính của đối tượng được tạo thành các nhóm cách xa nhau
Vector đặc tính của đối tượng cần nhận dạng sẽ được so sánh lần lượt với vectorđặc tính của từng ảnh mẫu trong tập các ảnh học Các khoảng cách ngắn nhất sẽđược lưu lại:
εk= ||Ω- Ωk || với k=1, ,M
Ở đây Ωk là vector của khuôn mặt thứ k trong CSDL Nếu εk nhỏ hơn một số đượcxác định trước thì bức ảnh được nhận dạng là khuôn mặt thứ k trong CSDL
3.3 Các hàm hiển thị ảnh trong Matlab
Để hiển thị ảnh, Matlab cung cấp 2 hàm cơ bản là image và imagesc Ngoài ra,
trong Image Processing Toolbox cũng có hai hàm hiển thị khác là imview và imshow
- Hàm image(x,y,c) hiển thị hình ảnh biểu diễn bởi ma trận c kích thước mxn lên hệ
trục tọa độ x,y là các véctơ xác định vị trí của các điểm c(1,1) và c(m,n)
- Hàm imagesc có chức năng tương tự hàm image, ngoại trừ việc dữ liệu ảnh sẽ
được co giãn để sử dụng toàn bộ bản đồ màu hiện hành
- Hàm imview cho phép hiển thị ảnh trên của sổ riêng nền Java, gọi là Image
Viewer
- Hàm imshow cho phép hiển thị ảnh trên một Figure và tự động thiết lập giá trị các
đối tượng image, axes, figure để hiển thị hình ảnh